das DSM-Modell [CK85] präsentiert wurde. [CY90] analysiert diesen Ansatz im
Detail. [SÇ05] diskutiert den Einsatz von spaltenorientierter Datenhaltung zur
Effizienzsteigerung.
[ABH09] diskutiert den Effizienzverlust beim Einfügen als Gegeneffekt
zur Effizienzsteigerung bei bestimmten Anfragen. Materialisierungsstrategien
werden in [DMAM07] analysiert. [AMH08] stellen drei Varianten der Realisie-
rung von Column Stores gegenüber.
Aspekte der Komprimierung in Column Stores werden in [MF04, GRS98,
Aba08] diskutiert.
Der Begriff spaltenorientierte DBMS wurde erst 20 Jahre nach dem
DSM durch das Papier von Stonebraker et al [SAB
+
05] populär. Das PAX-
Modell wird in [ADHS01, Ail01] beschrieben. Die Dissertation von ur Rah-
man beschreibt unterschiedliche relationale Kodierungen von Spaltenrelatio-
nen [uR11]. Relationale Repräsentation von Column Stores wird von Graefe
in [Gra07] diskutiert. Die Grundlagen und Realisierung von Delta-Relationen
wird in [HZN
+
10, OCGO96] behandelt.
Ein Beispiel für die aktuelle Diskussion von Hauptspeicherdatenbanktech-
nologie ist in den Büchern von Plattner und Zeier dokumentiert [PZ11, PZ12].
Weitere technische Herausforderungen (etwa die diskutierte Überwindung der
memory wall) und deren Lösung in MonetDB werden in [BKM08] diskutiert.
6.6 Übungen
Übung 6-1 Gegeben sei ein Datenwürfel mit fünf Dimensionen, jeweils 1000
Dimensionselemente, und zwei Kennzahlen. Überschlagen Sie den Speicher-
bedarf bei MOLAP und ROLAP-Speicherung bei einem Füllgrad von 50 %,
20% und 5%.
Übung 6-2 Geben Sie für die Relation Verkauf (Tabelle 6.2) eine Zerlegung im
DSM an.
Anzahl Ort Kunde Produkt
5 Magdeburg Meier Rotwein
3 Ilmenau Müller Rotwein
4 Magdeburg Meier Weißwein
11 Magdeburg Kunze Weißwein
10 Ilmenau Kunze Weißwein
7 Erfurt Müller Weißwein
Tabelle 6.2: Relation Verkauf
192 6 Speicherung
Übung 6-3 Diskutieren Sie mögliche Aufteilungen in Mini-Dimensionen für
Produktdaten bzw. Filialdaten.
Übung 6-4 Das Data-Warehouse beinhaltet Daten seit 1980. Geben Sie eine
Partitionierung der Faktentabelle in SQL in 10 Partitionen basierend auf den
Datumsangaben an.
Übung 6-5 Betrachten Sie die Jahresangaben der ersten zwei Seiten des Li-
teraturverzeichnis. Diskutieren Sie die Vor- und Nachteile der verschiedenen
vorgestellten Kompressionsverfahren.
Übung 6-6 Geben Sie einen Dwarf für die Tabelle 6.2 an!
Übung 6-7 Wie viel Platz benötigt der Dwarf aus Abbildung 6.7 von Seite 165
im Vergleich zur vollständigen Tabelle (inklusive Cube-Ergänzungen) aus Ab-
bildung 6.8 von Seite 166?
Übung 6-8 Geben Sie Tabellen für das Dictionary Encoding für Wein-Farben
und Wein-Regionen an. Wie groß dürfte im Mittel der Komprimierungsgewinn
sein?
6.6 Übungen 193

Get Data Warehouse Technologien now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.