Rozdział 10. Reprezentacja i eksploracja tekstu

Podstawowe pojęcia: Znaczenie konstruowania przyjaznych eksploracji reprezentacji danych; Reprezentacja tekstu do celów eksploracji danych.

Przykładowe techniki: Reprezentacja worka słów (bag of words); Kalkulacja TFIDF; N-gramy; Sprowadzanie do formy podstawowej (stemming); Ekstrakcja wyrażeń nazwowych; Modele tematyczne.

Do tej pory ignorowaliśmy lub omijaliśmy istotny etap procesu eksploracji danych: przygotowanie danych. Świat nie zawsze obdarowuje nas danymi reprezentowanymi jako wektory cech, które większość metod eksploracji danych przyjmuje za dane wejściowe. Dane są przedstawiane w sposób naturalny dla problemów, z których się wywodzą. Jeśli chcemy zastosować wiele narzędzi eksploracji danych, ...

Get Analiza danych w biznesie. Sztuka podejmowania skutecznych decyzji now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.