Kapitel 4
Standard-Datentypen
98
Abb. 4.3: Eine Sequenz
Sequenzen kennt man auch aus dem Alltag:
Ein Haus kann man als Sequenz von Stockwerken betrachten.
Im Periodensystem der Elemente (PSE) sind chemische Elemente nach ihrer Ordnungs-
zahl aufgeführt. Das erste Element im PSE ist Wasserstoff mit der Ordnungszahl 1.
Weiß man die Ordnungszahl, kann man im PSE eine Beschreibung des zugehörigen
Elements finden.
Das Gebiss eines Erwachsenen wird von Zahnärzten durch vier Sequenzen mit jeweils
acht Elementen beschrieben.
Die DNA (Träger der Erbinformation) wird als Sequenz von Basenpaaren modelliert.
Python unterscheidet mehrere Arten von Sequenzen: Strings, Bytestrings, Tupel und Listen.
4.10.1 Zeichenketten (Strings)
Zeichenketten sind Folgen von Zeichen aus einem Alphabet. Man bezeichnet sie auch als
Strings. Beispiele für Zeichenketten-Literale sind
Bei Python sind die Zeichen Unicode-Zeichen, das heißt, insbesondere Sonderzeichen des
deutschen Alphabets wie ä, ö, ü, ß sind erlaubt. Im Unicode-Standard (
http://www.unicode.
org/
) sind (in Version 5.1) inzwischen mehr als 100.000 verschiedene Zeichen erfasst.
Jedem Zeichen ist eine Nummer als vier- oder achtstellige Hexadezimalzahl (16 Bit bzw.
32 Bit) und ein Name eindeutig zugeordnet. Um für ein spezielles Zeichen die Unicode-
Nummer zu finden, kann man im WWW in den offiziellen Code-Charts des Unicode-Kon-
sortiums nachsehen (
http://www.unicode.org/charts/). Teil des Unicode-Standards ist
eine Datenbank mit allen Zeichen, die man über das Internet beziehen kann (
http://
www.unicode.org/ucd/
).
Zeichenketten sind nicht änderbar. Das heißt, man kann aus einem String-Objekt keine
Buchstaben einfügen, entfernen oder ändern.
Es gibt kurze und lange Zeichenketten.
Kurze Zeichenketten
Kurze Zeichenketten sind durch Hochkommata ' oder Anführungszeichen " eingerahmt.
Sie müssen sich in einer (logischen) Programmzeile befinden. Eine kurze Zeichenkette ent-
"Python" 'flying circus' "12345"
1 4 9 16 25 36 49 64
01234567
s
Index
Element mit Index 2
s[2 ]
letztes Element der Sequenz
s[-1]
99
4.10
Sequenzen
hält beliebig vielen Zeichen des ASCII-Zeichensatzes (Nummern bis 127) mit Ausnahme
des Backslashs (
\), des Newline-Zeichens und desjenigen Zeichens (Anführungszeichen
oder Hochkomma), das wir zur Bildung des Strings verwendet haben. Das heißt: Wenn ein
String in Hochkommata eingeschlossen ist, darf in ihm selbst kein Hochkomma, wohl aber
ein Anführungszeichen vorkommen, und umgekehrt. Gültig sind folgende Literale für
kurze Zeichenketten:
Ungültig dagegen ist
:
Lange Zeichenketten
Lange Zeichenketten können über mehrere Zeilen gehen. Sie werden durch drei hinter-
einandergestellte Anführungszeichen
""" oder Hochkommata ''' eingeschlossen. Beispiel:
Das Beispiel zeigt, dass lange Zeichenketten von Python intern durch kurze Zeichenketten
repräsentiert werden. Die Zeilenumbrüche werden durch die Zeichenkette
\n codiert.
Dabei handelt es sich um eine so genannte Escape-Sequenz. Escape-Sequenzen ermögli-
chen die Darstellung von Sonderzeichen und von Buchstaben, die man nicht auf der Tasta-
tur findet. Escape-Sequenzen beginnen immer mit einem Backslash (\). Häufig braucht
man die Unicode-Nummern für die Codierung spezieller Zeichen. Im Anhang A finden Sie
eine Tabelle mit den ersten 256 Unicode-Nummern.
'Ein Typ beschreibt das "Was" - eine Klasse das "Wie"'
"Gut Ding' will Weile haben."
'Gut Ding' will Weile haben.'
>>> """Die Ewigkeit dauert lange,
besonders gegen Ende. (Woody Allen)"""
'Die Ewigkeit dauert lange,\nbesonders gegen Ende. (Woody Allen)'
Escape-
Sequenz
Erklärung Beispiel
\\ Backslash in einem String "Backslash\\"
Backslash\
\'
Hochkomma in einem String "\'Hochkomma\'"
‘Hochkomma’
\"
Anführungszeichen in einem String "\"Zitat\""
"Zitat"
\n
Zeilenumbruch (line feed) "eins\nzwei"
eins
zwei
\N{Name}
Zeichen mit einem Namen aus der
Unicode-Datenbank
"\N{CYRILLIC CAPITAL LETTER ZHE}"
Tabelle 4.3: Wichtige Escape-Sequenzen

Get Python 3 - Lernen und professionell anwenden now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.