Kapitel 26
XML
720
Mit XML werden Dokumente, die gleichermaßen für Menschen und Maschinen lesbar
sind, in Form einer Baumstruktur dargestellt. XML ist eine vereinfachte Version der älteren
Metasprache SVGL (Standard Generalized Markup Language), die sich auf Grund ihrer Kom-
plexität und Unhandlichkeit nicht wirklich durchsetzen konnte.
26.2 XML-Dokumente
Wir beginnen mit einem einfachen XML-Dokument, das auf strukturierte Weise Namen
und E-Mail-Adressen einer Arbeitsgruppe darstellt.
Hier wird eine Gruppe modelliert, die als Projekt-Team bezeichnet wird. Sie besteht aus zwei
Personen, deren Name und E-Mail-Adressen angegeben sind. Beachten Sie die Flexibilität
des Formats! Für Sabrina werden zwei E-Mail-Adressen und für Tom nur eine aufgeführt.
Geben Sie diesen Text mit einem beliebigen Texteditor ein und speichern Sie die Datei unter
einem Namen mit der Erweiterung
.xml (z.B. gruppe.xml) ab. Damit Umlaute korrekt wie-
dergegeben werden, sollten Sie bei Ihrem Editor als Codierung utf-8 einstellen. Zum Bei-
spiel beim Editor, der zum Zubehör von Microsoft Windows gehört, können Sie in der
Dialogbox zum Abspeichern einer Datei unten die Codierung auswählen.
Das XML-Dokument kann nun z.B. mit einem Webbrowser dargestellt werden. Abbildung
26.1 zeigt die Ansicht im Firefox-Fenster. Klicken Sie versuchsweise auf einige der Tags. Sie
werden feststellen, dass sich das Dokument wie ein Windows-Verzeichnisbaum verhält.
Teile der Dokumentstruktur können geschlossen und wieder geöffnet werden.
Ein XML-Dokument besteht aus Elementen, die ihrerseits wieder Elemente oder Text enthal-
ten können. Jedes Element wird (wie bei HTML) durch ein Start-Tag und ein End-Tag mar-
kiert. Ein Start-Tag beginnt mit einer öffnenden spitzen Klammer
< gefolgt von dem Namen
des Elementes und endet mit einer schließenden spitzen Klammer
>, z.B. <person>. Das
zugehörige End-Tag ist genauso aufgebaut, beginnt jedoch mit
</, z.B. </person>.
Damit ein XML-Dokument wohlgeformt ist, müssen einige Bedingungen erfüllt sein:
<?xml version="1.0" ?>
<gruppe>
<bezeichnung>Projekt-Team 2010</bezeichnung>
<person>
<name>Sabrina Maier</name>
<email>sabrina@maier.de</email>
<email>sm@global-design.de</email>
</person>
<person>
<name>Tom Kahlenbaum</name>
<email>tk@global-design.de</email>
</person>
</gruppe>
721
26.2
XML-Dokumente
Abb. 26.1: Ansicht eines XML-Dokumentes im Browserfenster (Mozilla Firefox)
Es muss genau ein Element geben, das das gesamte Dokument repräsentiert. In diesem Fall
ist das das Element
<gruppe>. Zwischen den Tags <gruppe> und </gruppe> sind alle Daten
des XML-Dokumentes zusammengefasst.
Start- und End-Tags müssen sauber verschachtelt sein. Nicht erlaubt sind überlappende
Tags wie z.B.
Ein Webbrowser akzeptiert in der Regel diese Passage als gültigen HTML-Text. Es ist jedoch
kein wohlgeformter XML-Text. Stattdessen muss es heißen:
Für die Namen der XML-Elemente gibt es einige Syntax-Regeln. Ein Elementname muss
mit einem Buchstaben oder Unterstrich beginnen. Der Rest kann aus Buchstaben, Zahlen,
Unterstrichen, Bindestrichen und Punkten bestehen. Leerzeichen innerhalb des Namens
sind verboten. Im Unterschied zu HTML wird zwischen Groß- und Kleinschreibung unter-
schieden.
<center><h1>Willkommen</center></h1>
<center><h1>Willkommen</h1></center>

Get Python 3 - Lernen und professionell anwenden now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.