Warehouses, die direkt Teile der im Kern-Data-Warehouse gespeicherten Da-
ten mit zusätzlichen Datenquellen verbinden, deren Integration ins Kern-Data-
Warehouse jedoch beispielsweise aus Kosten-Nutzen-Erwägungen nicht reali-
siert wurde.
Virtuelles
Data Warehouse
Kern-Data-Warehouse
Data Marts
Operative Quellen
Abbildung 2.11: Data-Warehouse-Architekturmix
Oft existieren kleinere Data Marts, die direkt aus einzelnen Datenquellen
erzeugt werden. Derartige Data Marts können aufgrund zeitkritischer Analy-
seanforderungen ad hoc entstehen oder historisch gewachsen sein. Oft ist es
schwierig, die Nutzer dieser kleinen Lösungen davon zu überzeugen, sich der
zentralen Lösung anzuschließen.
2.4.6 Ein Multi-Schichten-Architekturansatz
Die bisher vorgestellte Referenzarchitektur stellt die Prozessstruktur des Data-
Warehouse-Systems in den Vordergrund. In der Praxis existieren für die unter-
schiedlichen Data Warehouse-Lösungen detailliertere Architekturansätze, die
sich in Teilaspekten zur vorgestellten Referenzarchitektur unterscheiden. Da-
mit wird eine bessere Nähe zur Data Warehouse-Implementierung hergestellt.
Die bisherige Diskussion führt zu einer einfachen Schichtenarchitektur, die in
Abbildung 2.12 skizziert wird.
Diese Schichtenarchitektur ist eher Technologie-getrieben: Sie stellt die
tatsächlichen physischen Datenrepräsentationen zueinander in Bezug. Die
Daten der Basis-Datenbank werden aus den Rohdaten im Datenbeschaf-
fungsbereich durch Transformationen generiert, während die Daten des Da-
tenwürfels und der Data-Marts materialisierte Sichten der Daten aus der
40 2 Architektur
Data Warehouse
Basis Datenbank
Datenwürfel und Data Mart
Anwendung
Datenbeschaffungsbereich
Datenquellen
Abbildung 2.12: Drei Schichten-Architektur eines Data Warehouse
Basis-Datenbank darstellen. Im Umfeld der Business- und Enterprise-Data-
Warehouse-Lösungen von SAP wurde eine erweiterte Schichtenarchitektur vor-
gestellt, die als Layered, Scalable Architecture (LSA) bezeichnet wird und mehr
auf dem Zweck der zu repräsentierenden Daten basiert [WKLS12, WKS12].
Die Abbildung 2.13 skizziert eine LSA-Architektur
1
. Die Schichten des
Data-Warehouse-Systems basieren datentechnisch auch hier auf den Daten-
quellen und bilden die Grundlage der darauf aufbauenden Anwendungen oder
Analysen. Wir werden im Folgenden nur die Schichten des eigentlichen Data-
Warehouse-Systems genauer betrachten.
Von unten nach oben haben die fünf Schichten der LSA-Architektur, die der
klassischen Data Warehouse-Architektur entsprechen, die folgende Bedeutung:
Die Datenübernahmeschicht kann man sich als eine Art „Posteingang“ des
Data-Warehouse-Systems vorstellen. Die Daten werden dabei direkt über-
nommen oder minimal angereichert, zum Beispiel mit Zeitstempeln ver-
sehen. Die Daten werden hier nicht notwendigerweise langfristig gespei-
chert.
Die Qualitäts- und Harmonisierungsschicht übernimmt die Aufgaben der
Datenintegration, entspricht also im Wesentlichen den Transformationen
der ETL-Komponente aus der prozessorientierten DW-Architektur. Neben
der reinen Integrationsaufgabe werden auch Datenbereinigung, Qualitäts-
prüfungen und Validierungen durchgeführt.
1
In der Literatur und in Dokumenten von SAP werden verschiedene Varianten dieser Architektur
dargestellt, die sich in der Anzahl der einzelnen Schichten, Zusammenfassungen von Schichten
sowie in den Benennungen unterscheiden.
2.4 Architektur des Data Warehouse 41
Data Warehouse System
Geschäftslogik-Transformationsschicht
Datenbereitstellungsschicht
Qualitäts- & Harmonisierungsschicht
Berichts- & Analyseschicht
Unternehmens-
daten-
gedäc
htnis
Operationale
Daten
versorgung
Datenübernahmeschicht
Anwendung
Datenquellen
Abbildung 2.13: Multi-Schichten-Architekturansatz
Die Datenbereitstellungsschicht enthält nun die integrierten und harmoni-
sierten Rohdaten in feinerer Granularität. Oft wird hier von einer „Single
Version of Truth“ des Data Warehouse gesprochen; hier finden sich die auf-
bereiteten Gesamtdaten als Grundlage des gesamten Data Warehouse.
Die Geschäftslogik-Transformationsschicht transformiert die bisher an-
wendungsneutralen Daten mit Bezug auf ein konkretes Unternehmensmo-
dell. Geschäftsspezifisch können beispielsweise Logistik- und Finanzdaten
verknüpft, spezifische Kennzahlen berechnet oder Währungsumrechnun-
gen vorgenommen werden.
Die Berichts- und Analyseschicht beinhaltet Datentransformationen für
einen spezifischen Verwendungs- oder Analysezweck. Dies entspricht der
Definition von spezifischen Data Marts in der klassischen Architektur.
Neben diesen fünf Schichten einer LSA sind in 2.13 zwei weitere Säulen abge-
bildet, die schichtenübergreifend realisiert sind.
Parallel zur Qualitäts- und Harmonisierungsschicht und zur Datenbe-
reitstellungsschicht bildet das sogenannte Unternehmensdatengedächtnis
(engl. Corporate Data Memory), also das gemeinsame Gedächtnis als „Sin-
gle Version of Truth“ der operativen Unternehmensdaten, eine weitere
Säule. Ein derartiges Unternehmensdatengedächtnis ist dann sinnvoll,
wenn die feingranularen Originaldaten, die in der Datenempfangsschicht
gewonnen, aber nicht persistent gespeichert werden, langfristig aufbe-
wahrt und sozusagen als Beweissicherung für die Validität späterer Ana-
lysen explizit gespeichert werden sollen.
42 2 Architektur

Get Data Warehouse Technologien now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.