Additiv: X
t
= G
t
+ S
t
+ e
t
,
Multiplikativ: X
t
= G
t
· S
t
· e
t
und
Gemischt: X
t
= G
t
· S
t
+ e
t
mit
X
t
: Ausprägung zum Zeitpunkt t
G
t
: Trend, Wachstum
S
t
: Saison, Konjunktur, Zyklen und
e
t
: Fehlerterm.
Dabei gilt für die Komponentenwirkung, dass sie konstant ist, d.h. dX
t
/dS
t
= 1.
Zudem existiert ein Niveau, von dem die Zeitreihe abhängig ist dX
t
/dS
t
= G
t
.
Für die Prognosemodelle ist es notwendig, Annahmen über die Verteilun-
gen der zu schätzenden Parameter zu treffen. Ein häufig genutztes Verfahren
ist hierbei die Methode der kleinsten Quadrate. Für einen Überblick über linea-
re Schätzer, autoregressive Prozesse und Filtertechniken empfehlen sich statis-
tische Werke wie z.B. Schlittgen [Sch01] und Schlittgen und Streitberg [SS01],
sowie für Prognosen im Unternehmensumfeld Götze [Göt00] und Mertens und
Rässler [MR12].
9.3.5 Data Mining Extensions
Microsoft hat seit 2000 zur Data-Mining-Analyse in den Analysis Services die
Data Mining Extensions (DMX) eingeführt. DMX unterscheidet dabei in die De-
finition der Modelle, den Data-Mining-Funktionen und den DMX-Operatoren.
DMX ist in der Spezifikation von Microsoft OLE DB für Data Mining defi-
niert [Mic00]. Die Syntax ist an SQL angelehnt, analog zur multidimensionalen
Abfragesprache MDX von Microsoft, vergleiche hierzu auch Kapitel 5.
Ein Mining-Modell besteht aus einem eindeutigen Namen und den Spal-
ten, die für die die jeweiligen Mining-Algorithmen benötigt werden. Es können
mehrere Mining-Modelle auf die gleichen Daten angewendet werden. Daher er-
möglicht eine Mining-Struktur die Definition der Mining-Spalten und legt diese
in den Analysis Services des SQL Servers ab. Für die Definition von Mining-
Strukturen kann die Anweisung CREATE MINING STRUCTURE genutzt werden.
Im folgenden wollen wir ein Mining-Modell für unser Beispiel der Klas-
sifikation erstellen. Wir nutzen dabei die gleichen Informationen wie in Ab-
schnitt 9.3.3.
CREATE MINING STRUCTURE [Weingeschmack] (
[TID] LONG KEY,
[Weinart] TEXT DISCRETE,
[Restsuesse] DOUBLE CONTINUOUS,
[Alkoholgehalt] DOUBLE CONTINUOUS,
9.3 Data Mining im BI-Umfeld 299
[Schmeckt] LONG DISCRETE )
WITH HOLDOUT (30 PERCENT or 1000 CASES)
Zu den definierten Mining-Strukturen können Modelle hinzu-
gefügt werden. Daher muss die angelegte Mining-Struktur mittels
ALTER MINING STRUCTURE verändert werden. Ein Modell besteht dabei aus
den zu verwendenden Spalten der Mining-Struktur. Hierbei müssen für ein
Modell nicht zwingend alle Spalten genutzt werden. Zudem muss angegeben
werden, welcher Algorithmus im Modell genutzt werden soll. Dies erfolgt über
die USING Anweisung.
Als Algorithmus wählen wir den von Microsoft bereitgestellten Entschei-
dungsbaumalgorithmus. Zudem wollen wir die Spalte Schmeckt voraussagen
und müssen daher diese Spalte als PREDICT angeben. Für die Auswertung ist
die letzte Zeile notwendig.
ALTER MINING STRUCTURE [Weingeschmack] (
ADD MINING MODEL [Entscheidungsbaum]
[TID],
[Weinart],
[Restsuesse],
[Alkoholgehalt],
[Schmeckt] PREDICT )
USING (Microsoft
_
Decision
_
Trees)
WITH DRILLTHROUGH
Das Trainieren der Mining-Struktur erfolgt über die Anweisung
INSERT INTO MINING STRUCTURE. Zusätzlich müssen die Daten, die zum Lernen
für die Mining-Struktur genutzt werden sollen, angegeben werden. Die Anwei-
sung OPENQUERY dient hierbei zur Selektion dieser Daten. Das Resultat wird
dann in der Datenbank der Mining-Struktur abgespeichert und muss in einem
nächsten Schritt abgefragt werden. Für unser Beispiel ist dabei insbesondere
die Vorhersage von Interesse. Hierzu kann die Anweisung PREDICTION JOIN
genutzt werden. Für die Abfrage eines neuen Weines bietet sich dabei die
Einzelvorhersage an. Dabei können die zur Vorhersage genutzten Werte direkt
in die SELECT-Anweisung geschrieben werden. Der NATURAL PREDICTION JOIN
gleicht dabei die Spalten in der Mining-Datenbank ab.
SELECT [Schmeckt],
PredictHistogram([Schmeckt]) AS Statistiken
FROM [Entscheidungsbaum]
NATURAL PREDICTION JOIN
(SELECT ’Rot’ AS [Weinart],
23 AS [Restsuesse],
10 AS [Alkoholgehalt]) AS t
300 9 Business-Intelligence-Anwendungen

Get Data Warehouse Technologien now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.