21 Der k-Mean-Clusteralgorithmus

Die Verarbeitung und Gewinnung von Informationen aus einer großen Datenmenge ist heutzutage ein wichtiger Produktionsfaktor. Als Anwendungsbeispiel einer parallelen Datenverarbeitung aus dem Bereich des Data Mining bzw. Machine Learning wird in dieser Fallstudie der k-Mean-Algorithmus besprochen, eines der populärsten Verfahren der Clusteranalyse. Für weitere Informationen siehe z. B. [13, 55].

21.1 Der k-Mean-Algorithmus

Der Algorithmus teilt eine Datenmenge in k Cluster ein, wobei ähnliche Datenelemente demselben Cluster zugeordnet werden. Hierzu wird ein geeignetes Abstandsmaß benötigt, über das die Eigenschaft »ähnlich« definiert wird.

Wir betrachten im Folgenden das Clustering der Punkte in der zweidimensionalen ...

Get Nebenläufige Programmierung mit Java now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.