k-Nächste-Nachbarn

Eins der einfachsten Verfahren zur Lösung von Klassifikationsproblemen ist die k-Nächste-Nachbarn-Methode (k nearest Neighbors). Der Algorithmus funktioniert folgendermaßen:

  1. Der Algorithmus benötigt neben den zu klassifizierenden Daten (»Testdaten«) einen Datensatz, in dem die Klassenzugehörigkeit jeder Beobachtung bereits bekannt ist (»Trainingsdaten«).

  2. Um jeden Punkt der Eingabedaten herum wird im Merkmalsraum ein Bereich aufgespannt, der so lange wächst, bis er k Nachbarpunkte umschließt.

  3. Unter diesen Nachbarpunkten werden sich möglicherweise Angehörige unterschiedlicher Klassen befinden. Der zu klassifizierende Punkt wird derjenigen Klasse zugewiesen, die am stärksten unter den k Nachbarpunkten vertreten ist.

In R wird die ...

Get R in a Nutshell now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.