Kapitel 3. Überlegungen zur Datenvorbereitung
In diesem Kapitel:
Handhabung von Einträgen 48
Handhabung von Attributen 49
Fehlende und ungenaue Werte 50
Strukturelle Anpassungen 50
Zusammenfassung 51
Daten werden für gewöhnlich nicht direkt in den operativen Systemen, in denen sie anfallen, analysiert. Da Miningverfahren aufwändig sind, würde dies diese Systeme unnötig belasten. Stattdessen werden die zu analysierenden Daten in der Regel in ein Data Warehouse übergeführt. Unter Data Warehouse versteht man eine Datenbank, welche Daten in einer für Auswertungen geeigneten Form speichert. Es ist nicht selten der Fall, dass ein Data Warehouse Daten aus unterschiedlichen operativen Datenquellen enthält sowie dass die Daten im Zuge des Überführens ...
Get Data Mining mit Microsoft SQL Server now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.