3
Modellierung von Data
Warehouses
Dem Ziel der Analyseorientierung eines Data Warehouses wird durch ein spe-
zielles Datenmodell Rechnung getragen. Hierbei stehen Kennzahlen im Mittel-
punkt, die aus verschiedenen Blickwinkeln betrachtet werden. In den folgenden
Abschnitten werden wir zunächst die Grundkonzepte dieses multidimensio-
nalen Datenmodells einführen. Wie beim klassischen Datenbankentwurf wird
auch im Data-Warehouse-Bereich ein konzeptioneller Entwurf durchgeführt,
der durch entsprechende Modellierungssprachen unterstützt wird. Mit dem
ME/R-Modell werden wir eine Technik vorstellen, die die Besonderheiten des
multidimensionalen Datenmodells berücksichtigt. Der dritte Teil dieses Kapi-
tels ist schließlich der Abbildung dieses Modells auf das relationale Datenmo-
dell gewidmet, um die Implementierung eines Data Warehouses auf der Basis
von SQL-Datenbanksystemen zu ermöglichen.
3.1 Das multidimensionale Datenmodell
Die Grundlage für OLAP bildet ein Datenmodell, das als Weiterentwicklung
von Tabellenkalkulationsprogrammen aufgefasst werden kann. Die wesentli-
chen Elemente dieses Datenmodells werden im Folgenden vorgestellt.
3.1.1 Grundbegriffe
Das multidimensionale Datenmodell ist auf die Datenanalyse zur Unterstüt-
zung von Entscheidungsprozessen ausgerichtet. Daher stehen (betriebswirt-
45
schaftliche) Kennzahlen im Mittelpunkt der Betrachtung. Hierbei handelt es
sich numerische Messgrößen aus dem konkreten Anwendungsbereich wie et-
wa Gewinn, Umsatz oder Kosten. Diese Kennzahlen werden aus verschiedenen
Perspektiven analysiert. So kann es erforderlich sein, die Umsätze eines Unter-
nehmens aus verschiedenen Jahren oder in verschiedenen Bundesländern zu
vergleichen. Eine solche Perspektive wird als Dimension bezeichnet. Beispiele
hierfür sind Zeit, Verkaufsort, Produkt oder auch Kunden. Über die konkreten
Ausprägungen in den Dimensionen kann der Wert einer Kennzahl bestimmt
werden, etwa der Umsatz in den Monaten Mai bis August 2011 von Rotwein
in Thüringen. Die Dimensionswerte bilden somit die Koordinaten im mehrdi-
mensionalen Raum. Für zwei Dimensionen lässt sich dies einfach als Tabel-
le darstellen, für drei Dimensionen ergibt sich ein Würfel oder Quader wie in
Abbildung 3.1 dargestellt. Aufgrund dieser Würfeldarstellung wird das Daten-
modell oft auch Daten- oder OLAP-Würfel (engl. Data Cube) genannt, obwohl
es sich genau genommen im Fall von mehr als 3 Dimensionen um Hyperwür-
fel bzw. -quader handelt. Die Zellen dieses Würfels werden durch Kennzahlen
gebildet; die Kanten entsprechen den Dimensionen.
Produkt
Verkaufsort
Zeit
Kennzahl
Umsatz
Filiale
Stadt
Bundesland
Kategorie
Ar tikel
Jahr
Monat
Tag
Gruppe
Abbildung 3.1: Begriffe im Datenwürfel
Bei der Analyse der Kennzahlen ist es oft notwendig, diese zu verdichten
(zu „konsolidieren“) oder auch zu verfeinern. Werden beispielsweise die Um-
satzzahlen für das gesamte Geschäftsjahr 2011 benötigt, können diese aus den
Monatsumsatzzahlen berechnet werden. Soll dagegen festgestellt werden, wo in
Thüringen der meiste Umsatz mit Wein generiert wurde, so werden detaillier-
te Kennzahlen unterhalb der Bundeslandebene benötigt. Zur Unterstützung
derartiger Auswertungen werden die Dimensionen in Konsolidierungsebenen
unterteilt, die eine Hierarchie bilden. So kann die Zeitdimension als Hierar-
46 3 Modellierung von Data Warehouses

Get Data Warehouse Technologien now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.