Kapitel 22
Ein Data Warehouse planen
548
Der Data Warehouse-Architekt muss sowohl die technische Seite als auch die
Anforderungen des Geschäftsmodells verstehen. Er ist verantwortlich für die Aus-
wahl der Werkzeuge, das Aufsetzen der Architektur und das Erstellen des Daten-
modells.
Der Datenbankadministrator spielt eine Schlüsselrolle im Team. Er unterstützt den
DWH-Architekten und ist verantwortlich für die Performance des Data
Warehouse. Zusätzlich gibt er den Entwicklern Unterstützung.
ETL-Prozesse können recht komplex werden. Der Grad der Komplexität ist abhän-
gig von der Zerklüftung der operativen Systeme. Es gibt eine Reihe von ETL-Werk-
zeugen, für deren Einsatz ein gewisses Maß an Erfahrung erforderlich ist. Deshalb
wird für diese Aufgabe ein Spezialist eingebunden.
r DSS-Abfragen und Reports gibt es eine Reihe von Anforderungen. So müssen
die Daten für die Anwender transparent gemacht werden. Ein wichtiger Punkt ist
auch die Zusammenstellung performanter Abfragen und Reports. Weiterhin
betreut der DSS-Spezialist die DSS-Software und unterstützt die Anwender in
deren Benutzung.
22.3 Die Rolle des Datenbankadministrators
Der Datenbankadministrator spielt eine Schlüsselrolle im Data Warehouse-Pro-
jekt. Performance ist ein wichtiger Faktor für die Akzeptanz des Projekts. Das
betrifft sowohl die DSS-Abfragen als auch den Ladeprozess.
Im Folgenden finden Sie die Hauptaufgaben des Datenbankadministrators kurz
dargestellt:
Unterstützung bei der Erstellung des logischen Designs sowie bei der Planung
und Implementierung des physikalischen Designs.
Optimierung der Datenbankkonfiguration.
Sicherstellung der Verfügbarkeit.
Entwurf und Implementierung einer Sicherheitsstrategie.
Erstellung und Umsetzung einer Strategie für Backup and Recovery.
Hinweis
Die Zusammenstellung eines kompetenten Teams ist eine wichtige Vorausset-
zung für die erfolgreiche Abwicklung eines Data Warehouse-Projekts. Nicht nur
die Tatsache, dass erfahrene Spezialisten benötigt werden, sondern auch der
Umstand, dass das Projekt nur mit einem Team, das kommuniziert und offen
mit Problemen umgeht, zum Erfolg geführt werden kann, unterstreicht die
Bedeutung der Teambildung.
22.3
Die Rolle des Datenbankadministrators
549
Prognose und Kontrolle des Wachstums der Datenbank.
Unterstützung der Entwickler.
Überwachung der Performance von DSS-Abfragen und des Ladeprozesses.
Als Datenbankadministrator in einem Data Warehouse-Projekt sollten Sie Ein-
fluss auf das logische Datenmodell ausüben. Betrachten Sie das Modell weniger
aus dem Blickwinkel der Geschäftsprozesse, sondern vielmehr aus Überlegungen
zur Optimierung der Performance heraus.
Für das physikalische Design trägt der Datenbankadministrator die Hauptverant-
wortung. Es beginnt mit der Auswahl von Hardware und Werkzeugen. So müssen
die Anforderungen an den Durchsatz des I/O-Subsystems sowie den Ausbau der
CPU definiert werden. Ebenso wichtig sind die Partitionierung der großen Tabel-
len, das Summary Management sowie die Parallelisierung der Sessions und
Batch-Jobs.
Die Optimierung der Datenbankkonfiguration hat viele Aspekte. Ein leider häufiger
Fehler wird bereits beim Design begangen und besteht darin, dass DSS-Abfragen
und ETL-Prozesse parallel laufen. Die optimale Konfiguration einer Oracle-Daten-
bank für das Laden von Daten, d.h. der Ausführung von vielen Transaktionen, ist
konträr zur optimalen Konfiguration für DSS-Abfragen. Im Endeffekt müssen Sie
eine Mischkonfiguration finden, die für beide Prozesse nicht optimal ist.
In der Praxis sollten zwei Datenbankkonfigurationen erstellt werden: eine für
DSS-Abfragen, die andere für ETL. Durch die wachsende Anzahl von dynami-
schen Parametern ist ein Neustart der Datenbank für den Konfigurationswechsel
nicht mehr erforderlich.
Die Sicherstellung der Verfügbarkeit einer Data Warehouse-Datenbank hat vielfäl-
tige Aspekte. Ein wichtiger Punkt ist, die Ladezeiten einzuhalten und gleichzeitig
einen Puffer vorzusehen, falls es zu Verzögerungen im Ladeprozess kommt. Die
Konsequenz wäre, dass die tagesfertigen Daten nicht bereitstehen und die Benutz-
barkeit für die Anwender eingeschränkt ist.
Ein Data Warehouse enthält wichtige Informationen eines Unternehmens, die
wesentlich zur Entscheidungsfindung beitragen. Es muss deshalb gegenüber
Sicherheitsverletzungen besonders geschützt werden. Auch gibt es rechtliche
Anforderungen an den Datenschutz, die beachtet werden müssen. So dürfen zum
Beispiel Personendaten nur von einem eingegrenzten Personenkreis eingesehen
werden.
Die Erstellung der Logik für den Ladeprozess sowie die technische Umsetzung der
ETL-Prozesse verschlingt erfahrungsgemäß den Hauptteil der Entwicklungsarbei-
ten. In jedem Fall sollten ETL-Werkzeuge eingesetzt werden. Sie tragen signifikant
zur Verkürzung der Entwicklungszeiten bei. Die Oracle-Datenbank selbst bietet
eine Reihe von Features zur Unterstützung der ETL-Prozesse.

Get Oracle 12c - Das umfassende Handbuch now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.