chie Tag Monat Jahr modelliert werden, die Dimension Verkaufsort als
Hierarchie Filiale Ort Bundesland Land.
Insgesamt lassen sich die verfügbaren Informationen in einem Datenwür-
fel in zwei Gruppen unterteilen:
quantifizierende Informationen (Kennzahlen, sowie durch arithmetische
Operationen daraus abgeleitete Informationen) bilden den Gegenstand der
Auswertung,
qualifizierende Informationen modellieren Begriffshierarchien im Rahmen
der Dimensionen und werden zur Navigation im Würfel genutzt.
In den folgenden Abschnitten werden wir diese Konzepte genauer einführen
und so das Schema eines Datenwürfels auch formal definieren.
3.1.2 Dimensionen
Dimensionen beschreiben mögliche Sichten auf assoziierte Kennzahlen und die-
nen der orthogonalen Strukturierung des Datenraums. Eine Dimension wird
definiert durch eine endliche Menge von n 2 Dimensionselementen, die eine
semantische Beziehung aufweisen. Ein Dimensionselement bildet eine Stufe in
einer Klassifikationshierarchie und legt damit gleichzeitig den Verdichtungs-
oder Aggregationsgrad der Kennzahlen fest. Jede Dimension besitzt einen
obersten Knoten T op, der eine Verdichtung der Daten auf einen einzelnen Wert
enthält.
Bei den Klassifikationshierarchien lassen sich einfache und parallele Hier-
archien unterscheiden. In einer einfachen Hierarchie enthält eine höhere Hier-
archiestufe die aggregierten Werte genau einer niedrigeren Stufe. Dagegen sind
in einer parallelen Hierarchie mehrere unabhängige Zweige (sogenannte Kon-
solidierungspfade) möglich, wobei zwischen den parallelen Zweigen keine hier-
archische Beziehung besteht. In Abbildung 3.2 sind diese beiden Formen ge-
genüber gestellt. Die Dimension „Ort“ stellt eine einfache Hierarchie aus den
Stufen Filiale, Stadt, Bundesland dar, während die Dimension „Zeit“ in einer
parallelen Hierarchie modelliert ist. Dies ergibt sich aus der Einbeziehung der
Kalenderwochen als Hierarchiestufe – Kalenderwochen sind bekanntlich nicht
an die Monatsgrenzen gebunden und sind daher unabhängig von den Monaten.
Das Schema DS einer Dimension wird durch eine partiell geordnete Menge
von Kategorienattributen DS = ({D
1
, . . . , D
n
, T op
D
}, ) definiert, die ein Klas-
sifikationsschema bilden. Hierbei stellt T op
D
das Element der höchsten Stufe
dar und die Elemente D
1
, . . . D
n
die Elemente der anderen Stufen, die T op
D
funktional bestimmen:
i, 1 i n : D
i
Top
D
3.1 Das multidimensionale Datenmodell 47

Get Data Warehouse Technologien now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.