You are previewing Datenqualität erfolgreich steuern.
O'Reilly logo
Datenqualität erfolgreich steuern

Book Description

Immer mehr Unternehmen begreifen ein erfolgreiches Datenqualitätsmanagement als einen entscheidenden Wettbewerbsvorteil. Dieses Buch führt Sie in die Grundlagen des Datenqualitätsmanagements ein und zeigt die technische Realisierung mit passgenauen Werkzeugen sowie die praktische Umsetzung in einem kompletten Zyklus eines BI-Projekts. Behandelt werden Themen wie Data Profiling, Datenvalidierung und -filterung, Standardisierung, Metadaten und Data Quality Monitoring. Die 3. Auflage wurde komplett durchgesehen und um neue Themen wie Big Data und Datenqualität in agilen Projekten erweitert.

Table of Contents

      1. 1.1 Daten
      2. 1.2 Qualität
      3. 1.3 Datenqualität
      4. 1.4 Datenqualitätsmanagement
      5. 1.5 Zusammenfassung
      1. 2.1 Geschäftstreiber
      2. 2.2 Ausprägungen schlechter Datenqualität
      3. 2.3 Ursachen schlechter Datenqualität
      4. 2.4 Beispiel: Finanzdienstleister
      5. 2.5 Empfehlungen
      1. 3.1 Datenqualitätskosten
      2. 3.2 Gesetzliche Anforderungen
      3. 3.3 Business-Case-Betrachtungen
      4. 3.4 Empfehlungen
      1. 4.1 Aufbauorganisation
      2. 4.2 Ablauforganisation
      3. 4.3 Empfehlungen
      1. 5.1 Referenzarchitektur
        1. 5.1.1 Datenquellen und Datenströme
        2. 5.1.2 Datenintegration
        3. 5.1.3 Datenhaltung
        4. 5.1.4 Informationsbereitstellung
        5. 5.1.5 Anwender und Rollen
        6. 5.1.6 Operative Anwendungen und Prozesse
        7. 5.1.7 Querschnittsprozesse
      2. 5.2 Problemstellen und Lösungsansätze hinsichtlich der Datenqualität
        1. 5.2.1 Datenquellen
        2. 5.2.2 Datenintegration
        3. 5.2.3 Datenhaltung
        4. 5.2.4 Informationsbereitstellung
      3. 5.3 Architektur für Datenqualitätsmanagement
      4. 5.4 Serviceorientierte Architektur
      5. 5.5 Master Data Management
        1. 5.5.1 Architektur
        2. 5.5.2 Umsetzung
      6. 5.6 Empfehlungen
      1. 6.1 Definitionen von Big Data
        1. 6.1.1 Fachlich-datenbezogene Sicht
        2. 6.1.2 Gartner-Sicht
        3. 6.1.3 Technisch-infrastrukturelle Sicht
      2. 6.2 Bedeutung der Datenqualität bei Big Data
      3. 6.3 Herausforderung externe Daten
      4. 6.4 Herausforderung unstrukturierte Daten
      5. 6.5 Herausforderung Geschwindigkeit
      6. 6.6 Herausforderung Volumen
      7. 6.7 Empfehlungen
      1. 7.1 Anwendungsmöglichkeiten von Kennzahlen
      2. 7.2 Messpunkte für Datenqualität
      3. 7.3 DQ-Metriken
      4. 7.4 Kennzahlen für ausgewählte Datenqualitätskriterien
      5. 7.5 Kennzahlenbaum
      6. 7.6 Kennzahlenformular
      7. 7.7 Empfehlungen
      1. 8.1 Vorbeugung vor neuen Datenqualitätsproblemen
      2. 8.2 Empfehlungen
      1. 9.1 Data-Profiling-Prozess
        1. 9.1.1 Schritt 1: Integration der Daten
        2. 9.1.2 Schritt 2: Analyse der integrierten Daten
        3. 9.1.3 Schritt 3: Darstellung der Ergebnisse
        4. 9.1.4 Schritt 4: Fachliche Bewertung der Ergebnisse
      2. 9.2 Zusammensetzung des Data-Profiling-Teams
      3. 9.3 Vorgehensweise beim Data Profiling
      4. 9.4 Data-Profiling-Verfahren zur Analyse von Attributen
        1. 9.4.1 Standardanalysen auf Attributebene
        2. 9.4.2 Analyse der Attribute mit Geschäftsregeln
      5. 9.5 Data-Profiling-Verfahren zur Analyse von Datensätzen
        1. 9.5.1 Analyse auf Schlüsselattribute
        2. 9.5.2 Analyse auf abgeleitete Werte
        3. 9.5.3 Analyse von Datensätzen mit Geschäftsregeln
      6. 9.6 Data-Profiling-Verfahren zur Analyse von Tabellen
        1. 9.6.1 Analyse von Tabellen auf referenzielle Abhängigkeiten
        2. 9.6.2 Analyse von Tabellen mit Geschäftsregeln
      7. 9.7 Empfehlungen
      1. 10.1 Validierung auf vier Ebenen
      2. 10.2 Filterung fehlerhafter Daten
      3. 10.3 Validierung bei Extraktion oder Laden
      4. 10.4 Arten der Datenvalidierung
      5. 10.5 Erstellung der Validierungsregeln und Speicherung der Ergebnisse
      6. 10.6 Empfehlungen
      1. 11.1 Standardisierung
      2. 11.2 Datenbereinigung
      3. 11.3 Standardisierung und Bereinigung im ETL-Prozess
      4. 11.4 Verfahren für nicht zu bereinigende Daten
      5. 11.5 Empfehlungen
      1. 12.1 Wirtschaftsinformationen
      2. 12.2 Geografische Informationen
      3. 12.3 Soziodemografische Informationen
      4. 12.4 Haushaltsbildung
      5. 12.5 Standards zur Klassifizierung von Waren und Dienstleistungen
      6. 12.6 Branchenklassifizierung
      7. 12.7 Empfehlungen
      1. 13.1 Bereitstellung der Daten
      2. 13.2 Visualisierung der Information
      3. 13.3 Empfehlungen
      1. 14.1 Metadaten: Begriff und Strukturierung
      2. 14.2 Metadatenarchitekturen
      3. 14.3 Metadatenmanagement
      4. 14.4 Metadatenkategorien
      5. 14.5 Probleme bei der Erstellung: Motivation und Aktualität
      6. 14.6 Nutzung von Metadaten
      7. 14.7 Empfehlungen
      1. 15.1 DQ-Planung
      2. 15.2 DQ-Assessment
      3. 15.3 DQ-Phasenkonzepte
      4. 15.4 Methoden
      5. 15.5 Verantwortlichkeiten
      6. 15.6 Empfehlungen
      1. 16.1 Anbieter und Produkte
      2. 16.2 Auswahlkriterien im Überblick
      3. 16.3 Funktionale Kriterien
      4. 16.4 Integration
      5. 16.5 Einbeziehung der Fachbereiche
      6. 16.6 Sprachen und Länder
      7. 16.7 Einbindung in DQM-Prozesse
      8. 16.8 Empfehlungen
      1. 17.1 Analyse des Istzustands
      2. 17.2 Entwurf des Sollkonzepts
      3. 17.3 Bewertung
      4. 17.4 Umsetzungsplanung
      5. 17.5 Empfehlungen
      1. 18.1 Spezifikation der Schnittstellen
      2. 18.2 Definition der Rollen in der Datenorganisation
      3. 18.3 Festlegung der Datenqualitätsziele
      4. 18.4 Bezeichnung und Definition der Objekte
      5. 18.5 Festlegung der Geschäftsregeln
      6. 18.6 Messung der Qualität von Definitionen und Geschäftsregeln
      7. 18.7 Data Profiling in der Spezifikation
      8. 18.8 Entwurf des Systems
      9. 18.9 Empfehlungen
      1. 19.1 Übertragung der Datenqualitätsziele
      2. 19.2 Konventionen und Richtlinien
      3. 19.3 Entwurf des Systems
      4. 19.4 Erstellung eines Prototypen
      5. 19.5 Empfehlungen
      1. 20.1 Einhaltung der Konventionen, Richtlinien und Konzepte
      2. 20.2 Data Profiling in der Realisierung
      3. 20.3 Einbindung der Datenverantwortlichen und Benutzer
      4. 20.4 Realisierung der Datenqualitätsmaßnahmen
      5. 20.5 Durchführung von Tests
      6. 20.6 Empfehlungen
      1. 21.1 Monitoring und Berichtswesen
      2. 21.2 Ausbildung
      3. 21.3 Empfehlungen