Rekursive Partitionierung

Einer der beliebtesten Algorithmen zur Anpassung von Baummodellen sind die Klassifikations- und Regressionsbäume (Classification And Regression Trees, kurz CART). CART verwendet für die Anpassung des Baums an die Trainingsdaten einen »gierigen« Algorithmus, der folgendermaßen vorgeht:

  1. Trainingsdaten nach der folgenden Vorschrift teilen und Baum rekursiv aufbauen:

    1. Zu Beginn alle Trainingsdaten als zusammenhängenden Datensatz übernehmen.

    2. Wenn die Anzahl der Beobachtungen die zulässige Untergrenze für eine (weitere) Aufteilung unterschreitet, mit der Teilung des Baums aufhören und den Mittelwert der y-Werte als vorhergesagten Wert des letzten Knotens übernehmen.

    3. Andernfalls die Variable xj und den Wert s suchen, durch die der ...

Get R in a Nutshell now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.