Andere Dinge in der Clusteranalyse

Dieses Kapitel hat sich mit zwei Datenbeständen befasst, aber es gibt vieles andere, womit man arbeiten kann. Die del.icio.us-Daten aus Kapitel 2 können auch geclustert werden, um Benutzer- oder Lesezeichen-Gruppen zu finden. Auf die gleiche Art und Weise, wie die Blog-Feeds in Wortvektoren umgewandelt wurden, lassen sich alle heruntergeladenen Seiten auf ihre Wörter reduzieren.

Diese Ideen können auf viele verschiedene Bereiche angewandt werden, um interessante Dinge herauszufinden – Foren basierend auf der Wortfrequenz, Firmen aus Yahoo! Finance basierend auf verschiedensten Statistiken oder die Topkritiker bei mazon aufgrund ihrer Vorlieben. Es wäre auch interessant, sich große Social Networks wie MySpace anzuschauen ...

Get Kollektive Intelligenz analysieren, programmieren und nutzen now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.