4.6 Alternativer Ansatz: ELT
Während in der Referenzarchitektur, vergleiche hierzu den Abschnitt 2.3, das
Befüllen des Data Warehouseoftmals in den Phasen Extraktion, Transformati-
on im Datenbeschaffungsbereich und Laden in die Basisdatenbank bzw. das
Befüllen des Datenwürfels erfolgt, ist es aufgrund neuer Technologien, wie
In-Memory-Datenbanken und spaltenbasierten Ansätzen, auch möglich, die
Transformation erst im Data Warehouse durchzuführen. Dieser Vorgang wird
auch als ELT-Prozess ETL light bezeichnet. Eine schematische Darstellung des
ELT-Prozesses findet sich in Abbildung 4.19.
Quellen
Data Warehouse
E L T
Abbildung 4.19: Der ELT-Prozess
Während der ETL-Prozess häufig durch Werkzeuge unterstützt wird, gibt
es im Bereich des ELT keine speziellen ELT-Engines. Es handelt sich beim ELT-
Prozess um eine Variante, bei der die Daten erst nach dem Laden in das Data
Warehouse transformiert werden. Hierbei erfolgen die Transformationen zu-
meist mit SQL-Anweisungen in der Zieldatenbank. In der Extraktion werden
für die jeweiligen Quellsysteme optimierte Anfragen genutzt, z.B. durch den
Einsatz zusätzlich angebotener SQL-Funktionalität. Die Quellen werden da-
bei analog zum ETL-Prozess durch Monitore im Data-Warehouse-System über-
wacht. Aufgrund von Änderungen in den Datenstrukturen der Quellen gestal-
tet sich eine automatische Extraktion jedoch schwieriger.
Das Laden erfolgt beispielsweise durch die parallele Verarbeitung von
SQL-Statements. Auch der Einsatz eines Massenladers ist möglich. Hierbei
wird vorausgesetzt, dass keine Schreibzugriffe im Zielsystem während des La-
devorgangs erfolgen. Auch die satzbasierte Protokollierung wird aus Effizienz-
gründen ausgeschaltet.
Die Transformation im Data-Warehouse-System erfolgt dann in der Trans-
formationskomponente unter Ausnutzung von Mengenoperationen. Hierbei
bieten sich insbesondere Aggregationen für den Datenwürfel an. Zusätzlich
können komplexe Transformationen mittels prozeduraler Sprachen wie z.B.
PL/SQL definiert werden. Darüber hinaus existieren in den unterschiedlichen
Systemen spezifische Statements. In Oracle steht unter anderem das State-
118 4 Extraktions-, Transformations- und Ladeprozess

Get Data Warehouse Technologien now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.