Safari, the world’s most comprehensive technology and business learning platform.

Find the exact information you need to solve a problem on the fly, or go deeper to master the technologies and skills you need to succeed

Start Free Trial

No credit card required

O'Reilly logo
Datenqualität erfolgreich steuern

Book Description

Immer mehr Unternehmen begreifen ein erfolgreiches Datenqualitätsmanagement als einen entscheidenden Wettbewerbsvorteil. Dieses Buch führt Sie in die Grundlagen des Datenqualitätsmanagements ein und zeigt die technische Realisierung mit passgenauen Werkzeugen sowie die praktische Umsetzung in einem kompletten Zyklus eines BI-Projekts. Behandelt werden Themen wie Data Profiling, Datenvalidierung und -filterung, Standardisierung, Metadaten und Data Quality Monitoring. Die 3. Auflage wurde komplett durchgesehen und um neue Themen wie Big Data und Datenqualität in agilen Projekten erweitert.

Table of Contents

  1. Cover
  2. Titel
  3. Impressum
  4. Geleitwort zur 3. Auflage
  5. Vorwort zur 3. Auflage
  6. Teil I
    1. 1 Datenqualität
      1. 1.1 Daten
      2. 1.2 Qualität
      3. 1.3 Datenqualität
      4. 1.4 Datenqualitätsmanagement
      5. 1.5 Zusammenfassung
    2. 2 Ausprägungen und Ursachen schlechter Datenqualität
      1. 2.1 Geschäftstreiber
      2. 2.2 Ausprägungen schlechter Datenqualität
      3. 2.3 Ursachen schlechter Datenqualität
      4. 2.4 Beispiel: Finanzdienstleister
      5. 2.5 Empfehlungen
    3. 3 Auswirkungen schlechter Datenqualität
      1. 3.1 Datenqualitätskosten
      2. 3.2 Gesetzliche Anforderungen
      3. 3.3 Business-Case-Betrachtungen
      4. 3.4 Empfehlungen
    4. 4 Organisation
      1. 4.1 Aufbauorganisation
      2. 4.2 Ablauforganisation
      3. 4.3 Empfehlungen
    5. 5 Referenzarchitektur für Business-Intelligence-Anwendungen
      1. 5.1 Referenzarchitektur
        1. 5.1.1 Datenquellen und Datenströme
        2. 5.1.2 Datenintegration
        3. 5.1.3 Datenhaltung
        4. 5.1.4 Informationsbereitstellung
        5. 5.1.5 Anwender und Rollen
        6. 5.1.6 Operative Anwendungen und Prozesse
        7. 5.1.7 Querschnittsprozesse
      2. 5.2 Problemstellen und Lösungsansätze hinsichtlich der Datenqualität
        1. 5.2.1 Datenquellen
        2. 5.2.2 Datenintegration
        3. 5.2.3 Datenhaltung
        4. 5.2.4 Informationsbereitstellung
      3. 5.3 Architektur für Datenqualitätsmanagement
      4. 5.4 Serviceorientierte Architektur
      5. 5.5 Master Data Management
        1. 5.5.1 Architektur
        2. 5.5.2 Umsetzung
      6. 5.6 Empfehlungen
    6. 6 Big Data
      1. 6.1 Definitionen von Big Data
        1. 6.1.1 Fachlich-datenbezogene Sicht
        2. 6.1.2 Gartner-Sicht
        3. 6.1.3 Technisch-infrastrukturelle Sicht
      2. 6.2 Bedeutung der Datenqualität bei Big Data
      3. 6.3 Herausforderung externe Daten
      4. 6.4 Herausforderung unstrukturierte Daten
      5. 6.5 Herausforderung Geschwindigkeit
      6. 6.6 Herausforderung Volumen
      7. 6.7 Empfehlungen
    7. 7 Kennzahlen zur Messung der Datenqualität
      1. 7.1 Anwendungsmöglichkeiten von Kennzahlen
      2. 7.2 Messpunkte für Datenqualität
      3. 7.3 DQ-Metriken
      4. 7.4 Kennzahlen für ausgewählte Datenqualitätskriterien
      5. 7.5 Kennzahlenbaum
      6. 7.6 Kennzahlenformular
      7. 7.7 Empfehlungen
  7. Teil II
    1. 8 Verbesserung der Datenqualität im Quellsystem
      1. 8.1 Vorbeugung vor neuen Datenqualitätsproblemen
      2. 8.2 Empfehlungen
    2. 9 Data Profiling
      1. 9.1 Data-Profiling-Prozess
        1. 9.1.1 Schritt 1: Integration der Daten
        2. 9.1.2 Schritt 2: Analyse der integrierten Daten
        3. 9.1.3 Schritt 3: Darstellung der Ergebnisse
        4. 9.1.4 Schritt 4: Fachliche Bewertung der Ergebnisse
      2. 9.2 Zusammensetzung des Data-Profiling-Teams
      3. 9.3 Vorgehensweise beim Data Profiling
      4. 9.4 Data-Profiling-Verfahren zur Analyse von Attributen
        1. 9.4.1 Standardanalysen auf Attributebene
        2. 9.4.2 Analyse der Attribute mit Geschäftsregeln
      5. 9.5 Data-Profiling-Verfahren zur Analyse von Datensätzen
        1. 9.5.1 Analyse auf Schlüsselattribute
        2. 9.5.2 Analyse auf abgeleitete Werte
        3. 9.5.3 Analyse von Datensätzen mit Geschäftsregeln
      6. 9.6 Data-Profiling-Verfahren zur Analyse von Tabellen
        1. 9.6.1 Analyse von Tabellen auf referenzielle Abhängigkeiten
        2. 9.6.2 Analyse von Tabellen mit Geschäftsregeln
      7. 9.7 Empfehlungen
    3. 10 Erfolgreiche Datenvalidierung und -filterung
      1. 10.1 Validierung auf vier Ebenen
      2. 10.2 Filterung fehlerhafter Daten
      3. 10.3 Validierung bei Extraktion oder Laden
      4. 10.4 Arten der Datenvalidierung
      5. 10.5 Erstellung der Validierungsregeln und Speicherung der Ergebnisse
      6. 10.6 Empfehlungen
    4. 11 Standardisierung und Bereinigung
      1. 11.1 Standardisierung
      2. 11.2 Datenbereinigung
      3. 11.3 Standardisierung und Bereinigung im ETL-Prozess
      4. 11.4 Verfahren für nicht zu bereinigende Daten
      5. 11.5 Empfehlungen
    5. 12 Datenanreicherung
      1. 12.1 Wirtschaftsinformationen
      2. 12.2 Geografische Informationen
      3. 12.3 Soziodemografische Informationen
      4. 12.4 Haushaltsbildung
      5. 12.5 Standards zur Klassifizierung von Waren und Dienstleistungen
      6. 12.6 Branchenklassifizierung
      7. 12.7 Empfehlungen
    6. 13 Verbesserung der Datenqualität in der Bereitstellung und Visualisierung
      1. 13.1 Bereitstellung der Daten
      2. 13.2 Visualisierung der Information
      3. 13.3 Empfehlungen
    7. 14 Wertschöpfung durch Metadaten
      1. 14.1 Metadaten: Begriff und Strukturierung
      2. 14.2 Metadatenarchitekturen
      3. 14.3 Metadatenmanagement
      4. 14.4 Metadatenkategorien
      5. 14.5 Probleme bei der Erstellung: Motivation und Aktualität
      6. 14.6 Nutzung von Metadaten
      7. 14.7 Empfehlungen
    8. 15 Data Quality Monitoring
      1. 15.1 DQ-Planung
      2. 15.2 DQ-Assessment
      3. 15.3 DQ-Phasenkonzepte
      4. 15.4 Methoden
      5. 15.5 Verantwortlichkeiten
      6. 15.6 Empfehlungen
    9. 16 Produktauswahl und -integration
      1. 16.1 Anbieter und Produkte
      2. 16.2 Auswahlkriterien im Überblick
      3. 16.3 Funktionale Kriterien
      4. 16.4 Integration
      5. 16.5 Einbeziehung der Fachbereiche
      6. 16.6 Sprachen und Länder
      7. 16.7 Einbindung in DQM-Prozesse
      8. 16.8 Empfehlungen
  8. Teil III
    1. 17 Datenqualitätsmanagement in einer Studie
      1. 17.1 Analyse des Istzustands
      2. 17.2 Entwurf des Sollkonzepts
      3. 17.3 Bewertung
      4. 17.4 Umsetzungsplanung
      5. 17.5 Empfehlungen
    2. 18 Datenqualitätsmanagement in der Spezifikation
      1. 18.1 Spezifikation der Schnittstellen
      2. 18.2 Definition der Rollen in der Datenorganisation
      3. 18.3 Festlegung der Datenqualitätsziele
      4. 18.4 Bezeichnung und Definition der Objekte
      5. 18.5 Festlegung der Geschäftsregeln
      6. 18.6 Messung der Qualität von Definitionen und Geschäftsregeln
      7. 18.7 Data Profiling in der Spezifikation
      8. 18.8 Entwurf des Systems
      9. 18.9 Empfehlungen
    3. 19 Datenqualitätsmaßnahmen in der Konstruktionsphase
      1. 19.1 Übertragung der Datenqualitätsziele
      2. 19.2 Konventionen und Richtlinien
      3. 19.3 Entwurf des Systems
      4. 19.4 Erstellung eines Prototypen
      5. 19.5 Empfehlungen
    4. 20 Steuerung der Datenqualität in der Realisierung
      1. 20.1 Einhaltung der Konventionen, Richtlinien und Konzepte
      2. 20.2 Data Profiling in der Realisierung
      3. 20.3 Einbindung der Datenverantwortlichen und Benutzer
      4. 20.4 Realisierung der Datenqualitätsmaßnahmen
      5. 20.5 Durchführung von Tests
      6. 20.6 Empfehlungen
    5. 21 Steuerung der Datenqualität im Betrieb
      1. 21.1 Monitoring und Berichtswesen
      2. 21.2 Ausbildung
      3. 21.3 Empfehlungen
  9. Anhang
    1. Abkürzungen
    2. Literatur
    3. Index
  10. Fußnoten