Übungen

  1. Erstellen Sie mithilfe der del.icio.us-API aus Kapitel 2 eine Datenmenge mit Lesezeichen, auf die man eine Clusteranalyse anwenden kann. Lassen Sie die hierarchische und die K-Means-Clusteranalyse dafür laufen.

  2. Passen Sie den Code zum Parsen der Blogs an, um einzelne Einträge statt ganzer Blogs zu clustern. Passen die Einträge eines Blogs in ein Cluster? Wie sieht es mit Einträgen eines Tages aus?

  3. Versuchen Sie, den echten (Pythagoras-)Abstand beim Clustern der Blogs zu nutzen. Wie wirkt sich das auf die Ergebnisse aus?

  4. Finden Sie heraus, was der Manhattan-Abstand ist. Erstellen Sie eine Funktion dafür und prüfen Sie, wie sich die Ergebnisse für die Zebo-Datenmenge damit ändern.

  5. Passen Sie die Funktion für die K-Means-Clusteranalyse an, damit ...

Get Kollektive Intelligenz analysieren, programmieren und nutzen now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.