Verteilungen plotten

Im Lauf einer Datenanalyse ist es oft sehr wichtig, die Verteilungsform der Daten zu verstehen. Ein Blick auf die Verteilung kann Aufschluss darüber geben, ob die Daten Ausreißer enthalten, ob bestimmte Analysemethoden zulässig sind, oder einfach nur, wie die Häufigkeitsverteilung der Beobachtungen in bestimmten Bereichen ist.

Die bekannteste Technik zur grafischen Darstellung einer Datenverteilung ist das Histogramm. In R lassen sich Histogramme mit der Funktion hist() anlegen. Als Beispiel sehen wir uns die Verteilung der Plate-Appearances (PA, Anzahl der beendeten Schlagdurchgänge) für die Schlagmänner in der MLB-Saison 2008 an. Mit den Plate-Appearances wird gezählt, wie oft ein Spieler Gelegenheit zum Schlag hatte, der ...

Get R in a Nutshell now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.