Entwicklungsumgebung Business Intelligence
Extract - Transform - LoadFile Copy
CRM SCM ERP
3rd
Party
Legacy
eMail
Doc
Sensor
Multimedia
Integrierte Datenbasis
Integrierte Datenbasis
Blog
Map
Map
Map
Map
Reduce
Reduce
Reduce
Abbildung 1.4: Anwendungsszenarien Big Data und Data Warehouse
Analyse von schwach oder wenig strukturierten Datenmengen ausgerich-
tet: Anstelle umfassender Datenmodellierung werden Datenextraktions- und
-transformationsschritte implementiert. So bieten sich derartige Techniken als
Ergänzung von Data Warehousing z.B. für die Implementierung von ETL-
Prozessen oder die Analyse nicht-integrierter Datenbestände an.
1.5 Aufbau des Buches
Im vorliegenden Buch wollen wir uns Techniken des Data Warehouse in acht
Kapiteln widmen. Hierzu können die Kapitel zwar einzeln gelesen werden, wir
empfehlen jedoch, der Struktur des Buches zu folgen.
Im Kapitel 2 widmen wir uns den Fragestellungen der Architektur eines
Data Warehouse. Hierbei wollen wir unter anderem die Anforderungen ana-
lytischer Informationssysteme betrachten und den damit einhergehenden Da-
tenfluss innerhalb des Data-Warehouse-Systems vorstellen. Dies führt uns zu
einer Referenzarchitektur. Darüber hinaus diskutieren wir auch noch weitere
Architekturen.
In Kapitel 3 stellen wir das dem Data Warehouse zugrunde liegende mul-
tidimensionale Datenmodell vor. Dabei gehen wir auf die wichtigsten Konzepte
ein, die den Datenwürfel repräsentieren. Zudem zeigen wir, wie eine Umset-
zung des multidimensionalen Datenmodells in relationalen Datenbanken mög-
lich ist.
1.5 Aufbau des Buches 11
Der Extraktions-, Transformations- und Ladeprozess (ETL) führt die he-
terogenen Quellen im Data Warehouse zusammen und steht im Mittelpunkt
von Kapitel 4. Da für die Entscheidungsgrundlage die Qualität der Daten ei-
ne wichtige Rolle spielt, gehen wir auf wichtige Daten- und Schemaaspekte
im Data-Warehouse-Kontext ein. Zudem gehen wir auf die typischen Aufgaben
hinsichtlich der Extraktion der Daten aus den Quellen ein. Die Transformation
stellt ein ganzheitliches Datenschema und vorbereitende Maßnahmen für die
Analysezwecke her. Um den Analyseprozess zu unterstützen, bieten sich für
Data Warehouse spezielle Techniken an, die Daten effizient zu laden.
Das Kapitel 5 zeigt typische Data-Warehouse-Anfragen. Dabei gehen wir
auf die typischen OLAP-Operationen (Online Analytical Processing) im Da-
tenwürfel ein. Bei den relationalen Umsetzungen und SQL-Unterstützungen
stellen wir den Star-Join vor. Auch die im SQL-Standard definierten Opera-
tionen CUBE und ROLLUP werden präsentiert. Neben weiteren SQL:2003 OLAP-
Funktionen gehen wir auf die multidimensionalen Ausdrücke von Microsoft
(MDX) ein.
Wie der Datenwürfel gespeichert werden kann, ist Gegenstand von Kapi-
tel 6. Dabei stellen wir sowohl die relationale Umsetzung wie auch die Speiche-
rung in multidimensionalen Datenbanken vor. Fragen der Partitionierung des
großen Data-Warehouse-Datenbestandes sowie Speicherungen für einen opti-
mierten Datenzugriff werden in diesem Kapitel ebenfalls beantwortet. Neuen
Trends im Bereich der Hauptspeicherbanken und ihren Einfluss auf das Data
Warehouse widmen wir uns ebenfalls.
Ein effizienter Datenzugriff kann ebenfalls über Indexstrukturen erfolgen.
Daher stehen diese im Mittelpunkt von Kapitel 7. Bereits in Datenbanken wer-
den Indexstrukturen häufig genutzt. Diese sind jedoch zumeist eindimensional
und somit für die analytischen Anfragen im Data Warehouse überwiegend un-
geeignet. Aufgrund ihrer weitgehenden und effizienten Implementierung sind
sie aber ein guter Ausgangspunkt, insbesondere der B-Baum. Für Daten mit
wenigen Attributausprägungen stellen Bitmap-Indexstrukturen eine geeigne-
te und effiziente Zugriffsstruktur dar. Außerdem stellen wir typische Vertreter
der mehrdimensionalen Indexstrukturen vor und gehen auf Hierarchien ein.
In Kapitel 8 gehen wir auf die Anfrageverarbeitung im Data Ware-
house ein. Hierzu gehört auch die Anfrageplanung inklusive der Star-Join-
Optimierung. Auch die Berechnung des CUBE-Operators wird in diesem Kapitel
adressiert. Außerdem stellen wir das Konzept der materialisierten Sichten im
Data Warehouse-Konzept vor.
Im letzten Kapitel widmen wir uns typischen Anwendungsfällen. Diese
werden unter dem Begriff Business Intelligence zusammengefasst. Die Haupt-
aufgabe im Data Warehousing ist die Erstellung von Berichten. Daher wid-
met sich Kapitel 9 auch dem Reporting. Häufig müssen aber auch Muster in
den Daten erkannt werden, die für die Entscheidungsfindung herangezogen
werden. Der Wissensentdeckungsprozess und insbesondere Data Mining sind
12 1 Einführung in Data-Warehouse-Systeme

Get Data Warehouse Technologien now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.