Distanzmaße

Um Clusteranalysetechniken effektiv einsetzen zu können, müssen zu Beginn die Abstände zwischen den Beobachtungen gemessen werden. Das lässt sich in R bequem mit der Funktion dist() aus dem stats-Paket erledigen:

dist(x, method = "euclidean", diag = FALSE, upper = FALSE, p = 2)

Die dist()-Funktion berechnet die Distanz zwischen allen Beobachtungspaaren eines Objekts, das beispielsweise eine Matrix oder ein Datenrahmen sein kann. Für die Berechnung kann zwischen verschiedenen Algorithmen gewählt werden, zurückgegeben wird eine Distanzmatrix (präziser, ein Objekt der Klasse dist) mit den berechneten Abständen. Es folgt eine Beschreibung der dist()-Argumente:

Argument

Beschreibung

Standardwert

x

Objekt, über dessen Zeilen paarweise Distanzen ...

Get R in a Nutshell now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.