Nach der historischen Wahrheit dürfen nur die Produkte verglichen werden, die
auch in den Vergleichszeiträumen auftreten. So müssen, wie in Abbildung 3.22
dargestellt, die Produkte des jeweiligen Zeitraumes betrachtet werden. Dies be-
deutet, dass alle Informationen den jeweiligen Fakten zugeordnet werden und
daher in den Dimensionstabellen mit Zeitbezug vorliegen müssen.
Berichtsanforderung nach historischer Wahrheit
Wenn nur Weinprodukte in die Betrachtung einbezogen werden sollen, die in
beiden Zeiträumen auftreten, so handelt es sich um die Berichtsanforderung
von vergleichbaren Resultaten. Abbildung 3.23 zeigt das Ergebnis. Im Gegen-
satz zum vorhergehenden Bericht nach historischer Wahrheit ist die Ergebnis-
menge deutlich reduziert, obwohl ebenfalls alle Informationen der beiden Zeit-
punkte der Dimensionstabelle eingeflossen sind. Jedoch zählen die Pakete der
Weine nicht mit, die nur in einer der beiden Perioden auftreten.
vergleichbare Resultate
Produktgruppe Pakete 2010 Pakete 2011
Weißwein 2000 2000
Rotwein 1000 1000
Abbildung 3.23: Beispiel für Berichte mit vergleichbaren Resultaten
3.4.2 Typdefinitionen nach Kimball
Kimball unterscheidet acht Typenstufen [KR13]. Diese wollen wir im Folgen-
den kurz vorstellen und dabei sowohl auf die Klassifikation wie auch die Um-
setzungsmöglichkeiten eingehen.
Bei Typ 0 handelt es sich um kein Historisierungskonzept im eigentlichen
Sinn. Neue Dimensionselemente werden dabei den Tabellen hinzugefügt. Än-
derungen werden nicht berücksichtigt. Somit wird nur das erste Auftreten ei-
ner Dimension berücksichtigt. Dieser nachträglich eingeführte Historierungs-
typ wird nur selten in der Praxis eingesetzt. Häufiger treten die Typen 1 bis 3
auf. Typ 0 kann als Erhalt des Originalwertes betrachtet werden.
Im Typ 1 wird auf eine Historisierung der Dimension verzichtet. Dies be-
deutet, dass stets nur der aktuelle Stand für alle Dimensionen vorliegt. Tech-
nisch gesehen wird im ETL-Prozess, siehe Kapitel 4, überprüft, ob ein Dimen-
sionsattribut bereits in der zugehörigen Dimensionstabelle existiert. Für den
Fall, dass eine Änderung für das Attribut in den Quellsystemen erfolgt ist, wird
das Attribut im Data Warehouse überschrieben. Sollte das Attribut noch nicht
vorhanden sein, wird der Datensatz der Dimensionstabelle hinzugefügt. Für
diesen Typen ist die Historie der Strukturänderung nicht relevant und es wird
nur der jeweils aktuelle Zustand betrachtet.
72 3 Modellierung von Data Warehouses
Im Typ 2 werden Dimensionstabellen oder einzelne Dimensionsattribute
historisiert. Ziel ist es, die jederzeit gültige Ausprägung ermitteln zu können.
Hierbei kommen Zeitstempel zum Einsatz. Dabei wird sowohl für den Beginn
wie auch für das Ende der Gültigkeit ein Zeitstempel gesetzt. Damit die Be-
ziehung zur Faktentabelle weiterhin eindeutig gewährt ist, muss mindestens
einer der beiden Zeitstempel Teil des Primärschlüssels der Dimensionstabel-
le werden. Für den aktuell gültigen Schlüssel wird der Endgültigkeitsbereich
auf unendlich (zumeist in der Praxis auf das Datum 31.12.9999) gesetzt. So-
mit werden Änderungen in den Dimensionstabellen durch das Hinzufügen von
weiteren Tupeln erreicht.
Während des ETL-Prozesses wird hinsichtlich der Änderungen der Dimen-
sionsdatensätze überprüft, ob es sich um einen neu einzufügenden Dimensions-
datensatz handelt, ob der Datensatz in den operativen Systemen nicht mehr
vorhanden ist und somit seine Ende-Gültigkeit auf den Extraktionszeitpunkt
gesetzt wird oder der Datensatz geändert wurde und somit der bisher gülti-
ge Dimensionsdatensatz mit dem neuen Ende-Gültigkeitsdatum belegt sowie
ein neuer Dimensionsdatensatz hinzugefügt wird, der ab dem Extraktionszeit-
punkt seine Gültigkeit besitzt.
Ziel von Typ 3 ist die Historisierung der Dimensionsdaten hinsichtlich der
ersten und der aktuellen Ausprägung der Dimensionsattribute. Hierzu wird
das Dimensionsschema um eine Spalte pro Historisierungselement erweitert.
Somit werden der Originalzustand und der aktuelle Zustand festgehalten. In
der Praxis kommt der Dimensionstyp insbesondere bei Umschlüsselungen vor,
z.B. von Produktgruppen oder Vertriebsregionen. Der Einsatz dieser Realisie-
rung sollte nur unter besonderen Bedingungen bzw. Anforderungen erfolgen.
Den Einsatz von Mini-Dimensionen schlägt Kimball [KR13] sowohl für
Typ 4 wie auch für Typ 5 vor. Typ 4 behandelt sich häufig ändernde Dimensi-
onselemente, die in einer eigenen Tabelle abgespalten werden. Kimball bezeich-
net diesen Fall als rapidly changing monster dimension. Insbesondere häufig
angefragte Dimensionelemente in sehr großen Dimensionstabellen sollen aus-
gelagert werden. Die Mini-Dimension erhält dann einen eigenen Primärschlüs-
sel, der ebenfalls Bestandteil der Faktentabelle wird.
Eine Kombination aus Typ 1 und Typ 4 stellt die Slowly Changing Dimen-
sion vom Typ 5 dar. Hierbei wird ermöglicht, dass die alten Werte historisiert
werden und zugleich ein Reporting von alten und aktuellen Werten ermöglicht
wird. Die Mini-Dimension kann dadurch mit der Ursprungsdimension ohne
Einbezug der Faktentabelle verknüpft werden.
Zudem definiert Kimball den hybriden Typ 6 (zusammengesetzt aus Typ
1 + 2 + 3). Ausgangspunkt ist ein Dimensionsschema für historische und aktu-
elle Werte bei gleichzeitiger Kennzeichnung von Start- und Endgültigkeitsda-
ten. Zudem wird eine Spalte hinzugefügt, die den aktuellen Wert kennzeichnet
(bool’scher Ausdruck).
3.4 Slowly Changing Dimensions 73

Get Data Warehouse Technologien now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.