Stephan Gillmeier, Urs Hengartner, Sandro Pedrazzini

Wie man mit der Wikipedia semantische Verfahren verbessern kann

Das automatische Zuweisen von Themengebieten zu beliebigen Dokumenten ist eine der anspruchsvollsten Aufgaben in der Computerlinguistik. Um dies technisch überhaupt bewerkstelligen zu können, setzt es ein gewisses »Verständnis« eines Textes voraus. Üblicherweise werden bei solchen Verfahren große – von Hand erstellte – thematisch vorsortierte Datenbanken benutzt. In dieser Arbeit wird zusammen mit statistischen Datenanalysen die »Datenbank« Wikipedia verwendet, um mit ihren semantischen Strukturen automatisch passende Themen von Dokumenten zu identifizieren und anschließend zuzuordnen. Darüber hinaus wird mit einem weiteren Verfahren ...

Get Web 3.0 & Semantic Web now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.