KAPITEL 7

Daten bereinigen und vorbereiten

Während der Datenanalyse und -modellierung ist ein bedeutender Teil der Zeit der Vorbereitung von Daten gewidmet: Laden, Bereinigen, Transformieren und Umordnen. Oft erfordern diese Aufgaben bis zu 80 % der Zeit eines Analytikers. Manchmal haben die Daten, die in Dateien oder Datenbanken gespeichert sind, nicht das passende Format für eine bestimmte Aufgabe. Viele Leute entscheiden sich dafür, die Daten ad hoc mit einer allgemeinen Programmiersprache wie Python, Perl, R bzw. Java oder mit Unix-Textverarbeitungswerkzeugen wie sed oder awk zu verarbeiten. Glücklicherweise bietet Ihnen pandas zusammen mit der Python-eigenen Funktionalität ein ausgefeiltes, flexibles und schnelles Arsenal an Werkzeugen, ...

Get Datenanalyse mit Python, 2nd Edition now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.