Kapitel 3. Überlegungen zur Datenvorbereitung

In diesem Kapitel:

Handhabung von Einträgen 48

Handhabung von Attributen 49

Fehlende und ungenaue Werte 50

Strukturelle Anpassungen 50

Zusammenfassung 51

Daten werden für gewöhnlich nicht direkt in den operativen Systemen, in denen sie anfallen, analysiert. Da Miningverfahren aufwändig sind, würde dies diese Systeme unnötig belasten. Stattdessen werden die zu analysierenden Daten in der Regel in ein Data Warehouse übergeführt. Unter Data Warehouse versteht man eine Datenbank, welche Daten in einer für Auswertungen geeigneten Form speichert. Es ist nicht selten der Fall, dass ein Data Warehouse Daten aus unterschiedlichen operativen Datenquellen enthält sowie dass die Daten im Zuge des Überführens ...

Get Data Mining mit Microsoft SQL Server now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.