12Der Besuch von Web-Seiten

In diesem Abschnitt werden uns zunächst HTML-Seite genauer ansehen und analysieren. Wir wissen ja bereits aus unseren Überlegungen zu XML im Abschnitt 5.6.3, dass diese Seiten im Wesentlichen Bäume sind, sodass wir also Möglichkeiten finden müssen, in diesen Bäumen zu navigieren und die gewünschten Informationen zu extrahieren. Dazu wird in Abschnitt 12.2.2 ein geeigneter Formalismus benutzt, nämlich CSS, eine Auszeichnungssprache, die in erster Linie dazu dient, die Darstellung von HTML-Seiten zu spezifizieren. Bei der Dekoration dieser Seiten ergibt sich offensichtlich die Notwendigkeit, in solchen Seiten auch zu navigieren, um die darzustellenden Elemente zielsicher zu finden. Es geht uns jedoch hier weniger darum, ...

Get Python 3 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.