Übungen

  1. Tanimoto Score. Finden Sie heraus, was der Tanimoto Similarity Score ist. In welchen Fällen kann dieser Score als Ähnlichkeitsmetrik anstatt des euklidischen Abstands oder des Pearson-Korrelationskoeffizienten genutzt werden? Erstellen Sie eine neue Ähnlichkeitsfunktion, die den Tanimoto Score nutzt.

  2. Tag-Ähnlichkeit. Erstellen Sie eine Datenmenge mit Tags und Elementen mithilfe der del.icio.us-API. Nutzen Sie diese, um die Ähnlichkeit zwischen Tags zu bestimmen, und versuchen Sie herauszufinden, ob es nahezu identische gibt. Finden Sie ein paar Elemente, die mit »programming« getaggt werden könnten, es aber nicht sind.

  3. Benutzerbasierte Effizienz. Der benutzerbasierte Filteralgorithmus ist ineffizient, weil er einen Benutzer jedes Mal mit ...

Get Kollektive Intelligenz analysieren, programmieren und nutzen now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.