Clusteranalyse

Die hierarchische und die K-Means-Clusteranalyse sind beides Techniken zum unüberwachten Lernen, sie erfordern also keine Trainingsdaten, da sie nicht versuchen, Vorhersagen zu treffen. Kapitel 3 hat gezeigt, wie man eine Liste mit Top-Blogs nehmen und sie automatisch so in Gruppen unterteilen kann, dass Sie sehen, welche zusammengehören, weil sie zum Beispiel die gleichen Themen behandeln oder gleiche Wörter verwenden.

Hierarchische Clusteranalyse

Die Clusteranalyse funktioniert mit jeder Sammlung von Elementen, die eine oder mehrere numerische Eigenschaften haben. Das Beispiel in Kapitel 3 hat die Wortfrequenzen der verschiedenen Blogs genutzt, aber man kann ein beliebiges Set von Zahlen zur Clusteranalyse verwenden. Um zu zeigen, ...

Get Kollektive Intelligenz analysieren, programmieren und nutzen now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.