2.2.6 Ladekomponente
Unter dem Laden versteht man die Übertragung der bereinigten und aufberei-
teten (z.B. aggregierten) Daten in die Basisdatenbank.
Beim Laden werden in der Regel spezielle Ladewerkzeuge (z.B. der SQL-
Loader von Oracle) genutzt, um effizient große Datenmengen in kurzer Zeit
einspielen zu können. Dies wird auch als Bulk-Load (Massenladen) bezeichnet.
Beim Laden neuer Daten muss man die eventuell notwendige Historisierung
der Daten beachten: Änderung in den Quellen dürfen Data-Warehouse-Daten
nicht überschreiben, sondern erfordern ein zusätzliches Abspeichern mit expli-
zitem Zeitbezug.
Beim Ladevorgang können zwei Modi unterschieden werden:
Online: Die Basisdatenbank steht weiterhin zur Verfügung.
Offline: Die Basisdatenbank steht während des Ladens nicht zur Verfü-
gung (in einem geeigneten Zeitfenster, etwa nachts oder am Wochenende).
2.2.7 Basisdatenbank
Die Basisdatenbank, kurz BDB, enthält die gesamten Daten des Data Warehou-
se auf feingranularer Ebene als Basis der Analysen. Die BDB ist nach den Qua-
litätsregeln des Datenbankentwurfs konzipiert, nicht nach den Anforderungen
der Analysekomponenten. Insbesondere wird eine redundanzfreie Speicherung
angestrebt, d.h. zum Beispiel sollten sich Relationen in dritter Normalform be-
finden. Die Daten sind bereinigt und historisiert. Die BDB entspricht daher
dem aus der englischen Originalliteratur bekannten Operational Data Store
(ODS) nach Inmon [Inm99].
Die BDB stellt eine integrierte Datenbasis für verschiedene Analysen zur
Verfügung, aber unabhängig von konkreten Analysen, d.h. die BDB enthält
noch keine voraggregierten Daten, um Analysen zu beschleunigen. Hauptauf-
gabe ist die Versorgung des Data Warehouse mit bereinigten Daten.
Streng genommen ist eine physische Speicherung des BDB unnötig und
redundant, da die Daten komplett in den Datenwürfel geladen werden. Die
Vorteile (redundanzfreie Speicherung und neutrales Datenformat) stehen den
Nachteilen der redundanten Speicherung eines sehr großen Datenbestandes
entgegen. Daher wird die BDB in der Praxis oft nicht als physisch abgespei-
cherte Datenbank realisiert.
2.2.8 Befüllen
Das Befüllen ist das Pendant zur Ladekomponente für den Transfer der berei-
nigten und aufbereiteten Daten aus der Basisdatenbank in den Datenwürfel.
2.2 Datenfluss in einem Data-Warehouse-System 29

Get Data Warehouse Technologien now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.