Random-Forest-Regression

Eine weitere Methode zur Formulierung prädiktiver Baummodelle sind die Random-Forests. Wie beim Bagging oder Boosting werden mit dem Random-Forest-Verfahren verschiedene Baummodelle kombiniert. Während allerdings beim Bagging oder Boosting eine Gruppe von Bäumen auf Basis eines Algorithmus wie CART entsteht, indem aus den Beobachtungen in den Trainingsdaten Zufallsstichproben gezogen werden, bestehen Random-Forests aus Bäumen, die aus zufällig ausgewählten Variablen der Trainingsdaten aufgebaut werden.

Es folgt eine Beschreibung des Algorithmus, nach dem Random-Forest-Bäume angelegt werden (unter Verwendung der Variablennamen der R-Implementierung):

  1. Stichprobe der Größe sampsize aus den Trainingsdaten ziehen.

  2. Zu Beginn gibt ...

Get R in a Nutshell now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.