Tanimoto-Koeffizient

Der Tanimoto-Koeffizient ist eine Kennzahl, die die Ähnlichkeit zweier Sets beschreibt. Sie wird in diesem Buch genutzt, um zu berechnen, wie ähnlich sich zwei Elemente sind – basierend auf ihren Eigenschaftslisten. Nehmen Sie zwei Sets A und B, die so aussehen:

A = [Shirt, Schuhe, Hosen, Socken]
B = [Shirt, Rock, Schuhe]

Dann ist die Schnittmenge, die ich hier als C bezeichnen will, [Shirt, Schuhe]. Der Tanimoto-Koeffizient ist in Abbildung B-4 beschrieben, wobei Na die Anzahl der Elemente in A und Nb die Anzahl der Elemente in B ist. Nc ist die Anzahl der Elemente in C, der Schnittmenge. In diesem Fall ist der Tanimoto-Koeffizient 2 / (4 + 3 – 2) = 2 / 5 = 0,4.

Hier eine einfache Funktion, die zwei Listen erwartet und den Tanimoto-Koeffizienten ...

Get Kollektive Intelligenz analysieren, programmieren und nutzen now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.