Kapitel 11: Verwendung nicht gekennzeichneter Daten: Clusteranalyse

In den vorangegangenen Kapiteln haben wir Verfahren des überwachten Lernens angewendet, um Lernmodelle zu entwickeln, bei denen die Antworten bereits bekannt waren – die Klassenbezeichnungen waren in den Trainingsdaten schon verfügbar. In diesem Kapitel gehen wir einen Schritt weiter und erkunden die Clusteranalyse, ein Verfahren zum unüberwachten Lernen, das es ermöglicht, verborgene Strukturen in Daten aufzuspüren, auch wenn uns die richtigen Antworten nicht bereits vorab bekannt sind. Das Ziel des Clusterings ist es, neue natürliche Gruppen zu finden, sodass die Objekte im selben Cluster eine größere Ähnlichkeit miteinander aufweisen als mit den Objekten in anderen ...

Get Machine Learning mit Python - Das Praxis-Handbuch für Data Sience, Predictive Analytics und Deep Learning now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.