Auch beim Befüllen können wieder die folgenden zwei Modi unterschieden
werden:
Online: Der Datenwürfel steht weiterhin zur Verfügung.
Offline: Der Datenwürfel steht während des Befüllens für Analysen nicht
zur Verfügung (in einem geeigneten Zeitfenster, etwa nachts oder am Wo-
chenende).
2.2.9 Der Datenwürfel
Die Grundlage effizienter Analysen ist eine Datenbank, die die Daten für Ana-
lysezwecke aufbereitet, also etwa Voraggregationen durchführt und Daten de-
normalisiert abspeichert, um Verbundoperationen zu sparen. Auch wenn un-
terschiedliche Analysedatenmodelle denkbar sind, hat sich als konzeptionelles
Modell für Analysedaten der Datenwürfel (engl. data cube) etabliert. In anderen
Werken zum Thema Data Warehouse wird diese Analysedatenbank oft selber
als das Data Warehouse bezeichnete, was zu Begriffsverwirrungen führt (gehö-
ren Data Marts und BDB zum Data Warehouse oder nicht?). Wir bezeichnen
die Analysedatenbank daher als Datenwürfel. Der Datenwürfel ist damit ein
Teil des Data Warehouse. Der Datenwürfel ist im Englischen doppelt belegt,
einerseits als multidimensionales Konzept und andererseits als Operator. Um
diese Zweideutigkeit zu vermeiden, verwenden wir für das multidimensionale
Konzept den Begriff Datenwürfel und für den Operator Cube.
Der Datenwürfel ist die zentrale Datenbank für Analysezwecke und orien-
tiert sich in der Struktur an den Analysebedürfnissen. Technisch ist besonders
die Unterstützung des Befüllens eine Herausforderung. Das schnelle Laden
großer Datenmengen wird mittels sogenannter Massenlader (engl. bulk loader)
unter Umgehung von Mehrbenutzerkoordination und Konsistenzprüfung reali-
siert.
Die Unterstützung des Analyseprozesses erfordert eine effiziente Anfra-
geverarbeitung (Indexstrukturen, Caching, verteilte Verarbeitung). Die Daten
werden abgestimmt auf das multidimensionale Datenmodell (z.B. über OLE DB
for OLAP) gespeichert.
2.2.10 Data Marts
Data Marts sind Ausschnitte des gesamten Analysedatenbestands. Der Aus-
schnitt kann sich auf Bereiche der Daten (Daten der letzten zwei Jahre, nur
deutsche Filialen) beziehen, aber auch auf die Granularität der aggregier-
ten Daten (Wochenumsatz statt Tagesumsatz). Technisch betrachtet sind Data
Marts daher dann materialisierte Sichten auf den Datenwürfel.
30 2 Architektur

Get Data Warehouse Technologien now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.