Rekursiver Aufbau des Baums

Um herauszufinden, wie gut ein Attribut ist, berechnet der Algorithmus zunächst die Entropie der Gesamtgruppe. Dann teilt er die Gruppe an den möglichen Werten jedes Attributs auf und berechnet die Entropie der beiden neuen Gruppen. Um herauszufinden, welches Attribut das beste zur Unterteilung ist, wird der Informationsgewinn (Information Gain) berechnet. Der Informationsgewinn ist der Unterschied zwischen der aktuellen Entropie und dem gewichteten Durchschnitt der Entropiender beiden neuen Gruppen. Der Algorithmus berechnet den Informationsgewinnfür jedes Attribut und wählt das mit dem höchsten Gewinn aus.

Nachdem die Bedingung für den Wurzelknoten ausgewählt wurde, erstellt der Algorithmus zwei Zweige, die dem Ergebnis ...

Get Kollektive Intelligenz analysieren, programmieren und nutzen now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.