KAPITEL 4

Repräsentation von Daten und Merkmalsgenerierung

Bisher sind wir davon ausgegangen, dass unsere Daten als zweidimensionale Arrays von Fließkommazahlen vorliegen, wobei jede Spalte ein kontinuierliches Merkmal beschreibt. Bei vielen Anwendungen werden Daten aber nicht auf diese Weise gesammelt. Kategorische Merkmale kommen besonders häufig vor. Diese auch diskrete Merkmale genannten Eigenschaften sind für gewöhnlich keine Zahlen. Der Unterschied zwischen kategorischen und kontinuierlichen Merkmalen ist analog zum Unterschied zwischen Klassifikation und Regression, nur aufseiten der Eingabedaten und nicht bei der Ausgabe. Bereits betrachtete Beispiele für kontinuierliche Merkmale sind die Helligkeit von Pixeln und Messungen der Größe ...

Get Einführung in Machine Learning mit Python now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.