O'Reilly logo

Stay ahead with the world's most comprehensive technology and business learning platform.

With Safari, you learn the way you learn best. Get unlimited access to videos, live online training, learning paths, books, tutorials, and more.

Start Free Trial

No credit card required

Data-Warehouse-Systeme , 4th Edition

Book Description

  • das Standardwerk zu Data Warehouse in 4. Auflage! eingeführtes Lehrbuch für Informatik- und WI-Studenten und in der Praxis namhafte Autoren aus Industrie und akad. Bereich Überarbeitet auf neue Technologien Neue oder grundlegend überarbeitete Praxisbeispiele

Table of Contents

  1. Cover
  2. Titel
  3. Impressum
  4. Vorwort
    1. Vorwort zu 3. Auflage
    2. Vorwort zur 2. Auflage
    3. Vorwort zur 1. Auflage
  5. Inhaltsverzeichnis
  6. Teil I Architektur
    1. 1 Abgrenzung und Einordnung
      1. 1.1 Begriffliche Einordnung
        1. 1.1.1 Definitionen
        2. 1.1.2 Abgrenzung von transaktionalen Systemen
          1. Anfragen
          2. Daten
          3. Anwender
      2. 1.2 Historie des Themenbereichs
      3. 1.3 Einordnung und Abgrenzung von Business Intelligence
      4. 1.4 Verwendung von Data-Warehouse-Systemen
        1. 1.4.1 Anwendungsfälle
          1. Informationsorientierte Anwendungsfälle
          2. Planungsorientierte Anwendungsfälle
          3. Auswertungsorientierte Anwendungsfälle
          4. Kampagnenbasierte Anwendungsfälle:
        2. 1.4.2 Wissenschaftliche Anwendungsbereiche
        3. 1.4.3 Technische Anwendungsbereiche
        4. 1.4.4 Betriebswirtschaftliche Anwendungsbereiche
          1. Übergreifende Anwendungsgebiete
          2. Managementprozesse
          3. Kernprozesse
          4. Unterstützungsprozesse
      5. 1.5 Überblick über das Buch
        1. 1.5.1 Star*Kauf
        2. 1.5.2 Kapitelübersicht
          1. Überblick über die Kapitel
    2. 2 Referenzarchitektur
      1. 2.1 Aspekte einer Referenzarchitektur
        1. 2.1.1 Referenzmodell für die Architektur von Data-Warehouse-Systemen
          1. Zweck der Referenzarchitektur
          2. Allgemeine Anforderungen an die Referenzarchitektur
          3. Anforderungen des Data Warehousing
        2. 2.1.2 Beschreibung der Referenzarchitektur
      2. 2.2 Data-Warehouse-Manager
      3. 2.3 Datenquelle
        1. 2.3.1 Bestimmung der Datenquellen
          1. Zweck des Data-Warehouse-Systems
          2. Qualität der Quelldaten
          3. Verfügbarkeit der Quelldaten
          4. Preis für den Erwerb der Quelldaten
        2. 2.3.2 Datenqualität
        3. 2.3.3 Klassifikation der Quelldaten
          1. Herkunft
          2. Zeit
          3. Nutzungsebene
          4. Inhalt/Datentyp nach inhaltlichen Aspekten
          5. Darstellung/Datentyp nach formalen Aspekten
          6. Sprache und Zeichensatz
          7. Technischer Zeichensatz
          8. Schreiborientierung
          9. Schutzwürdigkeit je nach Vertraulichkeitsgrad
      4. 2.4 Monitor
      5. 2.5 Arbeitsbereich
      6. 2.6 Extraktionskomponente
      7. 2.7 Transformationskomponente
      8. 2.8 Ladekomponente
      9. 2.9 Basisdatenbank
        1. 2.9.1 Charakterisierung, Aufgaben und Abgrenzung
          1. Abgrenzung zum Operational Data Store
        2. 2.9.2 Aktualisierungsalternativen der Basisdatenbank
        3. 2.9.3 Qualität der Daten in der Basisdatenbank
          1. Nachvollziehbarkeit anhand des Qualitätsmerkmals Verständlichkeit
          2. Verfügbarkeit anhand der Qualitätsmerkmale Vollständigkeit, Zeitnähe und Genauigkeit
      10. 2.10 Ableitungsdatenbank
        1. 2.10.1 Unterstützung des Ladeprozesses
        2. 2.10.2 Unterstützung des Auswertungsprozesses
        3. 2.10.3 Nabe-Speiche-Architektur
      11. 2.11 Auswertungsdatenbank
        1. Abhängige Auswertungsdatenbanken
        2. Unabhängige Auswertungsdatenbanken
      12. 2.12 Auswertung
        1. 2.12.1 Darstellungsformen
        2. 2.12.2 Funktionalität
        3. 2.12.3 Realisierung
        4. 2.12.4 Plattformen
      13. 2.13 Repositorium
      14. 2.14 Metadatenmanager
      15. 2.15 Zusammenfassung
    3. 3 Phasen des Data Warehousing
      1. 3.1 Monitoring
        1. 3.1.1 Realisierungen des Monitoring
        2. 3.1.2 Monitoring-Techniken
          1. Aktive Mechanismen
          2. Einsatz von Replikationsmechanismen
          3. Protokollbasierte Entdeckung
          4. Anwendungsunterstütztes Monitoring
      2. 3.2 Extraktionsphase
      3. 3.3 Transformationsphase
        1. 3.3.1 Datenintegration
          1. Transformation in (de-)normalisierte Datenstrukturen
          2. Schlüsselbehandlung
          3. Anpassung von Datentypen
          4. Konvertierung von Codierungen
          5. Vereinheitlichung von Zeichenketten
          6. Vereinheitlichung von Datumsangaben
          7. Umrechnung von Maßeinheiten/Skalierung
          8. Kombination/Separierung von Attributwerten
          9. Berechnung abgeleiteter Werte
          10. Aggregierung
        2. 3.3.2 Bereinigung
          1. Bereinigungsmaßnahmen nach Datenqualitätsmerkmalen
          2. Datenqualitätsmanagement in Data-Warehouse-Systemen
          3. Datenqualitätsmanagement bei der Data-Warehouse-Beladung
      4. 3.4 Ladephase
        1. Aktualisierung der materialisierten Sichten
      5. 3.5 Auswertungsphase
        1. 3.5.1 Data Access
        2. 3.5.2 Online Analytical Processing (OLAP)
          1. Codd’sche Regeln
          2. Erweiterte Codd’sche Regeln
          3. FASMI
          4. Multidimensionales Datenmodell
          5. Datenanalyse
          6. Anfragesprache MDX
          7. Beispiele zum MDX-Sprachumfang
          8. Aufbau einer MDX-Anweisung
        3. 3.5.3 Data Mining
          1. Visualisierungstechniken
          2. Fallbasierte Systeme
          3. Clusterverfahren
          4. Entscheidungsbaumverfahren
          5. Konnektionistische Systeme
          6. Text Mining
      6. 3.6 Zusammenfassung
    4. 4 Physische Architektur
      1. 4.1 Speicherarchitekturen für die Basis-, Ableitungs- oder Auswertungsdatenbank
        1. 4.1.1 Architektur eines Datenbankverwaltungssystems
        2. 4.1.2 Speichermodelle für Daten
          1. Relationales Speichermodell
          2. Multidimensionales Speichermodell
      2. 4.2 Schichtenarchitekturen
        1. Funktionale Überlegungen
        2. Physische Umsetzung
        3. 4.2.1 Einschichtenarchitektur
        4. 4.2.2 Zweischichtenarchitektur
        5. 4.2.3 Dreischichtenarchitektur
        6. 4.2.4 N-Schichtenarchitektur
        7. 4.2.5 Webbasierte Architektur
          1. Statische und dynamische Anwendungen
          2. Technische Grundlagen eines Web-Warehouse-Systems
          3. Optimierung und Caching
          4. Sicherheitsaspekte
          5. Individualisierungsaspekte
      3. 4.3 Realtime-Data-Warehouse-Systeme
        1. 4.3.1 Anforderungen
        2. 4.3.2 Architektur
        3. 4.3.3 Aktualisierung der Daten
        4. 4.3.4 Berichte
      4. 4.4 Architektur für unstrukturierte Daten
        1. 4.4.1 Anforderungen
        2. 4.4.2 Architekturansätze
        3. 4.4.3 Datenbeschaffung
          1. Extraktion der Daten
          2. Analyse zur Integration
          3. Datenbereinigung
          4. Laden der Daten in ein Datenbanksystem
      5. 4.5 Neue Architekturansätze
        1. 4.5.1 Column Store
        2. 4.5.2 InMemory
        3. 4.5.3 Appliance-Datenbanksystem
          1. Einführung in Appliances
          2. Merkmale von Appliances
          3. Einbindung von Appliance-Datenbanksystemen in bestehende Data-Warehouse-Architekturen
          4. Appliance als System zur Datenhaltung
          5. Exkurs: Gegenüberstellung Netezza, Exasol, Oracle Exadata
      6. 4.6 Zusammenfassung
  7. Teil II Entwicklung
    1. 5 Modellierung der Basisdatenbank
      1. 5.1 Begriffsbestimmungen: Vom Modell zum Schema
        1. 5.1.1 Modell
        2. 5.1.2 Datenmodell und Schema
      2. 5.2 Notwendigkeit eines übergreifenden Datenmodells
        1. 5.2.1 Probleme beim Verzicht einer übergreifenden Modellierung
        2. 5.2.2 Abgrenzung zur unternehmensweiten Modellierung
      3. 5.3 Konzeptuelle Modellierung der Basisdatenbank
        1. 5.3.1 Phasenmodell
        2. 5.3.2 Kerndatenmodell
        3. 5.3.3 Historisierung
        4. 5.3.4 Referenzmodelle
        5. 5.3.5 Langfristiger Lebenszyklus
      4. 5.4 Zusammenfassung
    2. 6 Das multidimensionale Datenmodell
      1. 6.1 Konzeptuelle Modellierung
        1. 6.1.1 Verschiedene Vorgehensweisen zur Definition einer Methodik
        2. 6.1.2 Vorstellung verschiedener Designnotationen
          1. ME/R-Modell
          2. Multidimensional UML (mUML)
          3. Ansatz von Totok
          4. Weitere Ansätze
      2. 6.2 Logische Modellierung
        1. 6.2.1 Notwendigkeit der Formalisierung des multidimensionalen Modells
        2. 6.2.2 Struktur des multidimensionalen Datenmodells
          1. Ein einführendes Beispiel
          2. Dimensionen
          3. Definition: Klassifikationsschema, Pfad
          4. Definition: Klassifikationshierarchie
          5. Würfel
          6. Definition: Würfelschema
          7. Definition: Würfel
        3. 6.2.3 Fehlende Werte in Würfelzellen (Nullwerte)
        4. 6.2.4 Operatoren des multidimensionalen Modells
          1. Definition: Restriktion
          2. Definition: Projektion
          3. Verbundoperationen auf Würfeln
          4. Aggregationen
          5. Definition: Aggregationsfunktion
          6. Definition: Vergleichsoperatoren für die Granularität
          7. Summierbarkeit
        5. 6.2.5 Weitere Ansätze zur Formalisierung
        6. 6.2.6 Grenzen und Erweiterungen des multidimensionalen Datenmodells
      3. 6.3 Unterstützung von Veränderungen
        1. 6.3.1 Zeitaspekte
          1. Temporale Datenbanken
          2. Zeitaspekte in der Ableitungs- oder Auswertungsdatenbank
        2. 6.3.2 Aspekte der Klassifikationsveränderungen
          1. Gültigkeitszeitmatrix
          2. Klassifikation der Anfragen
        3. 6.3.3 Aspekte der Schemaänderung
          1. Änderungsalternativen
          2. Operatoren von Schemaänderungen
          3. Vergleichbare Ansätze
      4. 6.4 Zusammenfassung
    3. 7 Umsetzung des multidimensionalen Datenmodells
      1. 7.1 Relationale Speicherung
        1. 7.1.1 Abbildungsmöglichkeiten auf Relationen
          1. Snowflake-Schema
          2. Star-Schema
          3. Mischformen von Star- und Snowflake-Schema
          4. Mehrere Würfel: Galaxie
          5. Vorberechnete Aggregate: Fact Constellation
          6. Weitere Darstellungsarten für Klassifikationshierarchien
          7. Semantikverluste
        2. 7.1.2 Relationale Umsetzung multidimensionaler Anfragen
          1. Das Star-Join-Anfragemuster
          2. Komplexe Gruppierungsbedingungen
        3. 7.1.3 Relationale Versionierungs- und Evolutionsaspekte
          1. Klassifikationshierarchieänderungen
          2. Schemaänderungen
      2. 7.2 Multidimensionale Speicherung
        1. 7.2.1 Datenstrukturen
          1. Dimension
          2. Würfel
          3. Alternativen zur Speicherung mehrerer Kenngrößen
          4. Klassifikationshierarchien und Aggregationen
          5. Attribute
          6. Virtuelle Würfel
          7. Teilwürfel
        2. 7.2.2 Speicherung multidimensionaler Daten
          1. Array-Speicherung multidimensionaler Daten
          2. Probleme bei der Array-Speicherung
          3. Speicherung von dicht besetzten multidimensionalen Datenräumen
          4. Speicherung von dünn besetzten multidimensionalen Datenräumen
        3. 7.2.3 Dateneingabe
        4. 7.2.4 Grenzen der multidimensionalen Datenhaltung
        5. 7.2.5 Hybride Speicherung: Hybrides OLAP (HOLAP)
      3. 7.3 Realisierung der Zugriffskontrolle
        1. 7.3.1 Zugriffskontrollanforderungen
          1. Autorisierungen auf Schemaebene
          2. Autorisierung auf Dimensionsebene
          3. Autorisierungen auf Zellebene
        2. 7.3.2 Relationale Realisierung
          1. Autorisierungen auf Schemaebene
          2. Autorisierungen auf Dimensionsebene
          3. Autorisierungen auf Zellebene
        3. 7.3.3 Multidimensionale Realisierung
          1. Autorisierungen auf Schemaebene
          2. Autorisierungen auf Dimensionsebene
          3. Autorisierungen auf Zellebene
        4. 7.3.4 Inferenzen und Trackerangriffe
        5. 7.3.5 Realisierungskonzepte
          1. Sichtenansatz
          2. Autorisierungsansatz
      4. 7.4 Zusammenfassung
    4. 8 Optimierung der Datenbank
      1. 8.1 Anfragen im multidimensionalen Modell
      2. 8.2 Indexstrukturen
        1. 8.2.1 Überblick über Indexstrukturen
        2. 8.2.2 Eindimensionale Baumindexstrukturen
          1. B-Baum
          2. B*-Baum
          3. Anwendung des B-Baums als Index
        3. 8.2.3 Mehrdimensionale Baumindexstrukturen
          1. R-Baum
          2. UB-Baum
          3. Mehrdimensionale Indexstrukturen in der Ableitungs- oder Auswertungsdatenbank
        4. 8.2.4 Bitmap-Indizes
          1. Standard-Bitmap-Indizes
          2. Mehrkomponenten-Bitmap-Indizes
          3. Bereichscodierte Bitmap-Indizes
          4. Einsatz von Bitmap-Indizes in Data-Warehouse-Systemen
        5. 8.2.5 Vergleich der Indizierungstechniken
      3. 8.3 Partitionierung
        1. 8.3.1 Horizontale Partitionierung
          1. Range-Partitionierung
          2. List-Partitionierung
          3. Hash-Partitionierung
          4. Einsatz im Data-Warehouse-System
        2. 8.3.2 Vertikale Partitionierung
          1. Mini-Dimensionen als Spezialfall vertikaler Partitionierung
        3. 8.3.3 Partitionierungssteuerung
      4. 8.4 Relationale Optimierung von Star-Joins
        1. Bildung des Kreuzproduktes der Dimensionstabellen
        2. Semiverbund von Dimensionstabellen mit einfachen Indizes
        3. Star Transformation
      5. 8.5 Einsatz materialisierter Sichten
        1. 8.5.1 Verwendung materialisierter Sichten
          1. Unterstützung von Monoblockanfragen
          2. Unterstützung von Multiblockanfragen
        2. 8.5.2 Bestimmung des Auswertekontextes für Aggregatanfragen
          1. Additivität von Aggregationsfunktionen
          2. Aggregationsgitter für allgemeine Gruppierungen
        3. 8.5.3 Statische Auswahl materialisierter Sichten
          1. Statisches Auswahlverfahren nach Harinarayan, Rajaraman und Ullman
        4. 8.5.4 Dynamische Auswahl materialisierter Sichten
          1. Semantisches Caching
        5. 8.5.5 Aktualisierung materialisierter Sichten
          1. Inkrementelle Aktualisierung
          2. Konsistenz in Data-Warehouse-Systemen
      6. 8.6 Optimierung eines multidimensionalen Datenbanksystems
        1. 8.6.1 Partitionierung
          1. Art der Partitionierung
          2. Steuerung
        2. 8.6.2 Speicherung der Zellen
        3. 8.6.3 Datenblockindizierung
      7. 8.7 Zusammenfassung
    5. 9 Metadaten
      1. 9.1 Metadaten und Metamodelle beim Data Warehousing
        1. Metadaten
        2. Metamodelle
        3. Semantische Informationsmodelle
      2. 9.2 Metadatenmanagement
      3. 9.3 Metadatenmanagementsystem
        1. 9.3.1 Anforderungen an ein Metadatenmanagementsystem
        2. 9.3.2 Architektur
          1. Metadatenmanager
          2. Metadaten-Repositorium
          3. Gesamtarchitektur
        3. 9.3.3 Repositorium- und Metadatenaustauschstandards
          1. Repositoriumstandards
          2. Austauschstandards
          3. Kommerzielle und prototypische Ansätze
      4. 9.4 Data-Warehouse-Metadatenschemata
        1. 9.4.1 Eine Klassifikation für Metadaten
          1. Kriterium »Typ«
          2. Kriterium »Abstraktion«
          3. Kriterium »Anwendersicht«
          4. Kriterium »Herkunft«
          5. Kriterium »Erstellungs-/Verwendungszeitpunkt«
        2. 9.4.2 Standards und Referenzmodelle
          1. CWM (Common Warehouse Metamodel)
          2. Das Zachman-Framework
      5. 9.5 Entwurf eines Schemas zur Verwaltung von Data-Warehouse-Metadaten
        1. 9.5.1 Funktionale Aspekte
          1. Transformationsprozesse
          2. Multidimensionale Datenbanken
        2. 9.5.2 Personen, Organisation und Aufgaben
        3. 9.5.3 Business-Metadaten
        4. 9.5.4 Abstraktionsstufen
      6. 9.6 Zusammenfassung
  8. Teil III Anwendung
    1. 10 Vorgehensweise beim Aufbau eines Data-Warehouse-Systems
      1. 10.1 Data-Warehouse-Strategie
        1. 10.1.1 IT-Strategie
        2. 10.1.2 Data-Warehouse-Strategie
        3. 10.1.3 Rolle des Data-Warehouse-Systems innerhalb der IT-Strategie
      2. 10.2 Reifegradmodell
        1. Betrachtungsperspektiven
        2. Reifegradstufen
        3. Reifegradstufe 1 – Einzelinformation
        4. Reifegradstufe 2 – Informationsinseln
        5. Reifegradstufe 3 – Informationsintegration
        6. Reifegradstufe 4 – Information Intelligence
        7. Reifegradstufe 5 – Enterprise Information Management
        8. Wechsel der Reifegradstufen
        9. Nutzengewinn durch ausbalancierte Perspektiven
      3. 10.3 Ableitung der Data-Warehouse-Architektur
        1. 10.3.1 Data-Warehouse-Rahmenwerk als gesamtheitliche Vorgabe
        2. 10.3.2 Umgang mit mehreren Data-Warehouse-Systemen
        3. 10.3.3 Data-Warehouse-Konsolidierung
          1. Treiber der Konsolidierung
          2. Problematik
          3. Vorgehen
          4. Konsolidierung der Basisdatenbank
        4. 10.3.4 Architekturüberlegungen in der Praxis
          1. Repositorium
          2. Arbeitsbereich
          3. Basis-, Ableitungs- und Auswertungsdatenbank
          4. Organisation
        5. 10.3.5 Umgebungen im Hinblick auf Entwicklung, Test, Produktion und Wartung
          1. Scheduling
          2. Accounting
          3. Qualitätssicherung
      4. 10.4 Data-Warehouse-Vorgehensweise
        1. 10.4.1 Grundsätzliche Überlegungen zum Projektvorgehen
          1. Klassische Vorgehensmodelle
          2. Agile Verfahren
          3. Einschätzung der Vorgehensmodelle
        2. 10.4.2 Vorgehensmodell
        3. 10.4.3 Machbarkeitsbetrachtung zum Data Warehousing
        4. 10.4.4 Analysephase
          1. Externes Know-how
          2. Istanalyse
          3. Sollkonzept
          4. Analyse der Datenquellen
          5. Erste Fokussierung
        5. 10.4.5 Designphase
          1. Modellierung der Datenquellen
          2. Design der Basisdatenbank
          3. Design der Ableitungs- und Auswertungsdatenbank
          4. Design des Datenflusses
          5. Design der Benutzeroberfläche
          6. Prototyping und Machbarkeitsnachweise
          7. Design eines Sicherheits- und Berechtigungskonzeptes
          8. Entscheidung über multidimensionale oder relationale Realisierung auf Basis fachlicher Anforderungen
          9. Kapazitätsplanung und Hardwareauswahl
        6. 10.4.6 Implementierungsphase
          1. Metadatenhaltung
          2. Implementierung des Sicherheits- und Berechtigungskonzeptes
          3. Aufbauen einer Entwicklungs-, Test-, Produktions- und Wartungsumgebung
          4. Prototyping
          5. Praktische Einführung im Unternehmen
        7. 10.4.7 Testmanagement
          1. Spezialtest: Datenvalidierung
        8. 10.4.8 Vorgehensweisen bei der Einführung
          1. Variante 1: Top-down-Vorgehen
          2. Variante 2: Bottom-up-Vorgehen
          3. Variante 3: Gemischtes Vorgehen nach »Think big – start small«
      5. 10.5 Zusammenfassung
    2. 11 Das Data-Warehouse-Projekt
      1. 11.1 Data-Warehouse-Projektmanagement
        1. 11.1.1 Projektmanagement im Data-Warehouse-Projekt
          1. Rollen
          2. Prozesse
        2. 11.1.2 Projektteam
        3. 11.1.3 Anforderungsmanagement
          1. Schritte des Anforderungsmanagements
          2. Methoden und Werkzeuge
          3. Ergebnisdokumente
        4. 11.1.4 Qualitätsmanagement
          1. Produkt- und Prozessqualität
          2. Qualitätsmodell
          3. Qualitätsmodell im Data-Warehouse-System
          4. Überprüfung der Qualität
        5. 11.1.5 Kommunikation
        6. 11.1.6 Konfliktmanagement
        7. 11.1.7 Dokumentation
        8. 11.1.8 Agiles Projektmanagement
          1. Rollen in Scrum
          2. Ablauf in Scrum
          3. Releaseplanung
          4. Softwarearchitektur, Softwaredesign
          5. Voraussetzung
          6. Multiprojekt-Scrum
      2. 11.2 Business Intelligence Competency Center (BICC)
        1. 11.2.1 Funktionen
        2. 11.2.2 Rollen und Kommunikation
        3. 11.2.3 Organisatorische Ausprägung und Verankerung
      3. 11.3 Softwareauswahl
        1. 11.3.1 Nutzen und Notwendigkeit der Produktauswahl
        2. 11.3.2 Klassifikation der Produkte anhand der Referenzarchitektur
        3. 11.3.3 Vorgehensweise zur Produktauswahl
          1. 1. Aufnahme der Anforderungen
          2. 2. Festlegung des Bewertungsschemas
          3. 3. Informationsbeschaffung
          4. 4. Vorauswahl
          5. 5. Feinevaluierung
          6. 6. Aufbau von Prototypen (optional)
          7. 7. Entscheidung
        4. 11.3.4 Allgemeine Kriterien für die Produktauswahl
        5. 11.3.5 Kriterien für Datenbeschaffungswerkzeuge
          1. Architektur
          2. Schnittstellen
          3. Scheduling
          4. Entwicklungsumgebung
          5. Prototyping
          6. Fachliche Funktionalität
          7. Metadaten
          8. Tuning
          9. Fehlerbehandlung
        6. 11.3.6 Kriterien für OLAP-Produkte
          1. Architektur
          2. Schnittstellen
          3. Definition des multidimensionalen Datenmodells
          4. Anfragedefinition
          5. Reporting
          6. Auswertungsfunktionalität
          7. Oberfläche
          8. Entwicklungsumgebung
          9. Berechtigungskonzept
          10. Change Management
          11. Metadaten
          12. Betrieb
          13. Webanbindung
        7. 11.3.7 Open-Source-Komponenten
          1. Open-Source-Komponenten als technische Lösungsalternativen
          2. Chancen und Risiken von Community-Versionen
          3. Chancen und Risiken von Enterprise-Versionen
      4. 11.4 Hardwareauswahl
        1. 11.4.1 Auswahlbestimmende Faktoren
        2. 11.4.2 Datenspeicherung
          1. RAID-Systeme
          2. Storage Area Networks
        3. 11.4.3 Archivspeichermedien
          1. Magnetbänder
          2. Optische und magnetooptische Speichermedien
        4. 11.4.4 Multiprozessorsysteme
          1. Symmetrische Multiprozessorsysteme
          2. Nichtuniformer Speicherzugriff
          3. Cluster
          4. Hybride Ansätze
        5. 11.4.5 Fehlertoleranz als Planungsziel
        6. 11.4.6 Flaschenhälse und Fallstricke
        7. 11.4.7 Backup-Strategien und Notfallpläne
      5. 11.5 Erfolgsfaktoren beim Aufbau eines Data-Warehouse-Systems
        1. 11.5.1 Institutionelle Aufgaben des Projektmanagements: Projektorganisation
        2. 11.5.2 Funktionale Aufgaben des Projektmanagements: Projektabwicklung
        3. 11.5.3 Empfehlungen für ein Data-Warehouse-Projekt
      6. 11.6 Datenschutz und Datensicherheit
        1. 11.6.1 Datenschutz
          1. Datenschutz im Data-Warehouse-System
          2. Datenschutzkonformer Einsatz
        2. 11.6.2 Netzwerksicherheit
          1. Vertraulichkeit durch Verschlüsselung
          2. Weitere Aspekte der Internetsicherheit
        3. 11.6.3 Benutzeridentifikation und Authentifizierung
        4. 11.6.4 Auditing
        5. 11.6.5 Autorisierung und Zugriffskontrolle
          1. Administrativer Zugriff im Extraktions-, Transformations- und Ladebereich
          2. Anwenderzugriff im Auswertungsbereich
      7. 11.7 Wirtschaftlichkeitsbetrachtungen
        1. 11.7.1 Kostenbetrachtung
        2. 11.7.2 Nutzenbetrachtung
          1. Prozesskriterien
          2. Produktivitätskriterien
          3. Wahrnehmungskriterien
          4. Produktkriterien
      8. 11.8 Zusammenfassung
    3. 12 Betrieb und Weiterentwicklung eines Data-Warehouse-Systems
      1. 12.1 Administration
        1. 12.1.1 Anforderungen und resultierende Aufgaben
          1. Systemtechnische Aspekte
          2. Performanzmanagement
          3. Qualitätsüberwachung und -sicherung
          4. Kapazitätsplanung
          5. Anwenderbetreuung
          6. Schutz- und Sicherheitsmanagement
          7. Evolutionskontrolle
          8. Data-Warehouse-Strategie und -Plattform
        2. 12.1.2 Organisationsformen für Entwicklung und Betrieb
          1. Rechenzentrum
          2. Data-Warehouse-Kompetenzzentrum
          3. Ausgliederung von Betriebseinheiten
        3. 12.1.3 Rolle des Repositoriums
      2. 12.2 Datenbeschaffungsprozess
        1. Administration der Datenbeschaffung
        2. Wartung und Optimierung des Datenbeschaffungsprozesses
        3. Evolution des Datenbeschaffungsprozesses
      3. 12.3 Performanz-Tuning von Data-Warehouse-Systemen
        1. 12.3.1 Der Performanz-Tuning-Prozess
        2. 12.3.2 Maßnahmen aus Sicht des Informationsmanagements
        3. 12.3.3 Maßnahmen aus Sicht des Datenbankdesigns
          1. Denormalisierung des Datenbankschemas
          2. Partitionierung umfangreicher Tabellen
          3. Indexdesign
          4. Clustering
          5. Konfiguration der Tabellenfüllung
        4. 12.3.4 Maßnahmen aus Sicht der Applikationsumgebung
          1. Verteilte Ausführung
          2. Locking-Strategien
          3. Recovery-System
        5. 12.3.5 Maßnahmen aus Sicht der Datenbankzugriffe
          1. Reduktion der Ergebnismengen
          2. Optimierung des Ausführungsplans
        6. 12.3.6 Maßnahmen aus Sicht der Datenbankkonfiguration
          1. Parallele Verarbeitung
          2. Speichermanagement
          3. Verteilungskonzepte
          4. Weitere Konfigurationen
        7. 12.3.7 Maßnahmen aus Sicht des Betriebssystems
          1. Verteilungskonzepte
          2. Anpassung der Blockeigenschaften
        8. 12.3.8 Maßnahmen aus Sicht des Netzwerks
        9. 12.3.9 Maßnahmen aus Sicht des Hardwaresystems
        10. 12.3.10 Multicore-Architekturen
          1. Netezza
          2. Exasol
          3. Bewertung
      4. 12.4 Auswertungsprozess
        1. 12.4.1 Schere zwischen Systemleistung und Anwendererwartungen
          1. Systembedingte Probleme
          2. Organisatorische Probleme
          3. Anwenderorientierte Probleme
        2. 12.4.2 Anwenderbetreuung
      5. 12.5 Sicherungsmanagement
        1. 12.5.1 Backup und Recovery
        2. 12.5.2 Entsorgung von Daten
          1. Archivierung
          2. Reaktivierung: Wiederverfügbarmachen archivierter Daten
        3. 12.5.3 Datenbank- und Systemverfügbarkeit
        4. 12.5.4 Phasen eines Recovery-Plans
      6. 12.6 Zusammenfassung
    4. 13 Praxisbeispiele
      1. 13.1 Öffentliche Verwaltung
        1. 13.1.1 Die Bundesagentur für Arbeit
        2. 13.1.2 Data Warehousing in der öffentlichen Arbeitsverwaltung
          1. Ziele und Motivation
          2. Architektur
          3. Aufbau
          4. Betrieb
        3. 13.1.3 Fazit
      2. 13.2 Versicherung
        1. Steckbrief
        2. 13.2.1 Risikomanagement auf Basis eines Data-Warehouse-Systems in einem Versicherungskonzern
          1. Ziele und Motivation
          2. Architektur
          3. Aufbau
        3. 13.2.2 Fazit
      3. 13.3 Panelorientierte Marktforschung
        1. Steckbrief
        2. 13.3.1 Die GfK-Gruppe und die GfK Retail and Technology GmbH
        3. 13.3.2 Data Warehousing in der panelorientierten Marktforschung
          1. Ziele und Motivation
          2. Architektur
          3. Aufbau
          4. Betrieb
        4. 13.3.3 Fazit
      4. 13.4 Online-Partnerbörse
        1. Steckbrief
        2. 13.4.1 Die FriendScout24 GmbH
        3. 13.4.2 Data Warehousing bei Online-Partnerbörsen
          1. Ziele und Motivation
          2. Architektur
          3. Aufbau
          4. Betrieb
        4. 13.4.3 Fazit
      5. 13.5 Zusammenfassung
  9. Anhang
    1. A Abkürzungen
    2. B Glossar
      1. Ableitungsdatenbank
      2. Arbeitsbereich (engl. staging area)
      3. Auswertebereich
      4. Auswertung
      5. Auswertungsdatenbank
      6. Basisdatenbank
      7. Business Intelligence
      8. Business Performance Management
      9. Data Mining
      10. Data-Warehouse-Manager
      11. Data-Warehouse-Prozess
      12. Data-Warehouse-System
      13. Data-Warehouse-Zusatzinformationen
      14. Data Warehousing
      15. Datenbeschaffungsprozess
      16. Datenquellen
      17. Detaildaten
      18. Dimension
      19. Dimensionalität des Würfels
      20. Dimensionselemente
      21. ETL
      22. Extraktion
      23. Föderiertes Datenbanksystem
      24. Granularität
      25. Information Lifecycle Management
      26. Integrationsbereich
      27. KDD (Knowledge Discovery in Databases)
      28. Kenngröße
      29. Klassifikationshierarchie
      30. Klassifikationsknoten
      31. Klassifikationsschema
      32. Klassifikationsstufe
      33. Koordinaten im Würfel
      34. Laden
      35. Metadaten
      36. Metadatenmanager
      37. Monitor
      38. Multidimensionales Datenmodell
      39. Multidimensionales Schema
      40. ODS (Operational Data Store)
      41. OLAP (Online Analytical Processing)
      42. Repositorium
      43. Repositorium-Manager
      44. Transformation
      45. Verwaltungsbereich
      46. Würfel
      47. Würfelschema
      48. Würfelzelle
    3. C Autorenverzeichnis
      1. Albrecht, Jens, Prof. Dr.-Ing.
      2. Bange, Carsten, Dr. rer. pol.
      3. Bauer, Andreas, Dr.-Ing.
      4. Behme, Wolfgang, Dr.
      5. Blaschka, Markus, Dr. rer. nat.
      6. Dinter, Barbara, Dr.
      7. Dittmar, Carsten, Dr., Dipl.-Oek.
      8. Düsing, Roland, Dr. rer. oec.
      9. Ehrenmann, Markus, Dr.
      10. Findeisen, Dirk, Dipl.-Betriebswirt (FH)
      11. Frietsch, Holger, Dipl.-Inf.
      12. Frisch, Martin, B. Sc.
      13. Gatziu Grivas, Stella, Prof. Dr.
      14. Görlich, Otto
      15. Gronwald, Heiko, Dipl.-Wirt.-Inf.
      16. Günzel, Holger, Prof. Dr.-Ing.
      17. Harren, Arne, Dr. rer. nat.
      18. Heidsieck, Claudia, Dipl.-Inf.
      19. Heinze, Holger
      20. Held, Marcus
      21. Herden, Olaf, Prof. Dr.-Ing.
      22. Hinrichs, Holger, Prof. Dr.-Ing.
      23. Hofmann, Stefan, Dipl.-Inf. (FH)
      24. Hümmer, Wolfgang, Dr.-Ing.
      25. Jossen, Claudio, Dipl.-Inform.
      26. Jürgens, Marcus, Dr. rer. nat.
      27. Jungheim, Horst, Dipl.-Soz.
      28. Keller, Stefan, Dr.
      29. Koncilia, Christian, Dr. techn.
      30. Kribbel, Johannes
      31. Langner, Achim, Dipl.-Ing.
      32. Lauser, Rolf, Prof. Dr.
      33. Lehner, Wolfgang, Prof. Dr.-Ing.
      34. Markl, Volker, Prof. Dr. rer. nat.
      35. Möller, Steffen, Dr.
      36. Mueck, Stefan, Dr.
      37. Oßendoth, Volker
      38. Paulzen, Oliver, Dr. Dipl.-Oec.
      39. Pieringer, Roland, Dr. rer. nat.
      40. Pohl, Christoph, M.Sc.
      41. Priebe, Torsten, Dr., Dipl.-Wirt.-Inf.
      42. Quix, Christoph, Dr.
      43. Ramsak, Frank, Dr. rer. nat.
      44. Ruf, Thomas, Prof. Dr.-Ing. habil.
      45. San-Bento Furtado, Paula, Dr.
      46. Sapia, Carsten, Dr. rer. nat.
      47. Schäfer, Marina, Dipl.-Wirtsch.-Inform.
      48. Schinzer, Heiko, Dr. rer. pol.
      49. Schirra, Joachim
      50. Scholz, André, Dr.
      51. Staudt, Martin, Prof. Dr. rer. nat.
      52. Stock, Steffen, Prof. Dr. rer. oec.
      53. Tako, Joachim, Prof. Dr.
      54. Teschke, Michael, Dr.-Ing.
      55. Tomsich, Philipp, Dr. tech.
      56. Totok, Andreas, Dr.
      57. Unterreitmeier, Andreas, Dr.
      58. Vaduva, Anca, Dr. Inform.
      59. Vavouras, Athanasios, lic. oec. publ.
      60. Vetterli, Thomas, lic. oec. publ.
      61. Völlinger, Hermann, Dr.
      62. Wedler, Mirjam
      63. Westermayer, Jörg, Dr.
      64. Wimösterer, Stephan
      65. Winter, Diana
      66. Witschnig, Jury, Dr.
      67. Zeh, Thomas, Dipl.-Math.
      68. Zimmermann, Kai, Dr.
    4. D Autorenzuordnung
      1. Teil I: Architektur
      2. Teil II: Entwicklung
      3. Teil III: Anwendung
    5. E Literatur und Webreferenzen
      1. Weitere Informationen
    6. Stichwortverzeichnis
  10. Fußnoten
    1. Kapitel 1
    2. Kapitel 2
    3. Kapitel 3
    4. Kapitel 6
    5. Kapitel 7
    6. Kapitel 8
    7. Kapitel 9
    8. Kapitel 10
    9. Kapitel 11
    10. Kapitel 12