Kategoriale Eigenschaften

Die Vermittler-Datenmenge enthält sowohl numerische als auch kategoriale Daten. Manche Klassifizierer, wie zum Beispiel der Entscheidungsbaum, können mit beiden Arten umgehen, ohne die Daten aufbereiten zu müssen, aber die Klassifizierer im Rest dieses Kapitels funktionieren nur mit numerischen Daten. Um damit umgehen zu können, brauchen Sie eine Möglichkeit, Daten in Zahlen umzuwandeln, sodass sie zum Klassifizieren genutzt werden können.

Ja/Nein-Fragen

Am einfachsten lassen sich Ja/Nein-Fragen in Zahlen umwandeln, da Sie ein »Ja« in eine 1 und ein »Nein« in eine −1 konvertieren können. Damit haben Sie auch die Option, fehlende oder nicht eindeutige Daten (wie »Ich weiß nicht«) als 0 darzustellen. Fügen Sie die Funktion ...

Get Kollektive Intelligenz analysieren, programmieren und nutzen now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.