Umgang mit fehlenden Daten

Ein anderer Vorteil von Entscheidungsbäumen ist ihre Fähigkeit, mit fehlenden Daten umzugehen. Vielleicht fehlen in Ihrem Datenbestand bestimmte Informationen – im hier genutzten Beispiel kann beispielsweise der geografische Standort eines Benutzer nicht aus seiner IP-Adresse ermittelt werden, daher ist das Feld dann leer. Um den Entscheidungsbaum so anzupassen, dass er damit umgehen kann, müssen Sie eine andere Vorhersagefunktion implementieren.

Wenn Ihnen Daten fehlen, die benötigt werden, um zu entscheiden, welchem Zweig des Baums gefolgt werden soll, können Sie einfach beiden Zweigen folgen. Aber anstatt die Ergebnisse beider Seiten gleich zu werten, werden sie unterschiedlich gewichtet. Im einfachen Entscheidungsbaum ...

Get Kollektive Intelligenz analysieren, programmieren und nutzen now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.