Wie Du anhand dieses Beispiels ein Streudiagramm erstellen und anschließend die Korrelation ablesen und das Streudiagramm somit interpretieren kannst, erfährst Du in dieser Erklärung.
Streudiagramm – Erklärung & Statistik
Wie der Name schon verrät, handelt es sich bei Streudiagrammen um einen bestimmten Diagrammtyp, welcher besonders in der Statistik Anwendung findet.
Es müssen also zwei Variablen \(x\) und \(y\) gegeben sein, um ein solches Diagramm aufzustellen.
Ein Streudiagramm besteht aus einer Vielzahl von Punkten, welche in ein kartesisches Koordinatensystem eingetragen werden.
Diese Punkte repräsentieren Wertepaare zweier Größen.
Daten liegen für ein Streudiagramm also immer als Wertepaar vor.
Einem x-Wert wird ein y-Wert zugeordnet, sodass dieser als Punkt im Diagramm eingefügt werden kann: \(\text{P}(\text{x}|\text{y})\)
Im Beispiel aus der Einleitung lassen sich zwei Größen ablesen:
Das Alter kann also durch den x-Wert und die Körpergröße durch den y-Wert beschrieben werden.
- 13 Jahre alt und \(1{,}43\,\text{m}\) groß
- 16 Jahre alt und \(1{,}60\,\text{m}\) groß
- 18 Jahre alt und \(1{,}80\,\text{m}\) groß
Daraus ergeben sich die folgenden Wertepaare:
\begin{align}\text{P}_{1}&=(13|1{,}43)\\\text{P}_{2}&=(16|1{,}60)\\\text{P}_{3}&=(18|1{,}70)\\\end{align}
Damit ein Streudiagramm wirklich aussagekräftig ist, werden wie bei anderen Diagrammen auch größere Stichproben benötigt.
Betrachte also zusätzlich zu dem Alter und den Körpergrößen von Dir und Deinen Geschwistern das Alter und die Körpergrößen einiger zufällig ausgewählter Schülerinnen und Schüler aus Deiner Schule:
Alter \(x\) | Körpergröße \(y\) |
11 | \(1{,}38\,\text{m}\) |
11 | \(1{,}32\,\text{m}\) |
12 | \(1{,}48\,\text{m}\) |
12 | \(1{,}40\,\text{m}\) |
13 | \(1{,}50\,\text{m}\) |
14 | \(1{,}50\,\text{m}\) |
15 | \(1{,}55\,\text{m}\) |
16 | \(1{,}57\,\text{m}\) |
16 | \(1{,}68\,\text{m}\) |
17 | \(1{,}59\,\text{m}\) |
17 | \(1{,}62\,\text{m}\) |
18 | \(1{,}67\,\text{m}\) |
18 | \(1{,}78\,\text{m}\) |
Eingetragen in einem Streudiagramm sieht die Gesamtheit der Daten dann so aus:
Abb. 1 - Streudiagramm Größe und Alter.
Aber was genau kannst Du anhand von diesem Diagramm ablesen?
Streudiagramm interpretieren – Korrelation
In einem Streudiagramm sind also mehrere Punkte eingetragen. Das Bild, welches dadurch entsteht, wird auch als Punktewolke bezeichnet.
Anhand der Form und Dichte der Punktewolke kann abgelesen werden, ob die beiden Größen korrelieren, also ob und in welchem Maße die beiden Größen im Zusammenhang stehen.
Dass Alter und Größe im Zusammenhang stehen, kannst Du daran erkennen, dass mit dem Alter auch die Werte für die Größe gewachsen sind. Das zugehörige Streudiagramm würde also einen positiven Korrelationskoeffizient besitzen. Aber was bedeutet das?
Korrelationskoeffizient
Der Korrelationskoeffizient \(k\) gibt an, mit welchem Wert zwei Größen \(x\) und \(y\) korrelieren. Er kann Werte zwischen \(-1\) und \(1\) annehmen.
Die folgende Tabelle zeigt beispielhaft, wie die Punktewolke für verschiedene Korrelationskoeffizienten ausgerichtet ist.
Korrelationskoeffizient \(k\) | Abb. 2-4 |
\(k>0\) | |
\(k<0\) | |
\(k=0\) | |
Je mehr der Korrelationskoeffizient sich der \(1\) oder \(-1\) nähert, desto mehr richten sich die Punkte im Diagramm linear aus.
Die folgende Abbildung zeigt ein Streudiagramm mit einem Korrelationskoeffizient von ungefähr \(0{,}9\).
Abb. 5 - Streudiagramm mit positivem Korrelationskoeffizient.
Nachdem Du die wichtigsten Bestandteile für ein Streudiagramm kennst, geht es jetzt um die Erstellung eines Streudiagramms.
Streudiagramm – erstellen und zeichnen
Beim Erstellen eines Streudiagramms kannst Du Dich an die folgende Schrittfolge halten:
- Notiere Dir die Wertepaare geordnet, z.B. in einer Tabelle.
- Zeichne ein kartesisches Koordinatensystem.
- Trage die Wertepaare in das Koordinatensystem ein.
Durch das Eintragen der Punkte entsteht wieder die oben erwähnte Punktewolke.
Streudiagramm Beispiel
Im Eingangsbeispiel wurden bereits zwei positiv korrelierte Größen aufgeführt. In welcher Korrelation stehen die beiden Größen in folgendem Beispiel?
An Deiner Schule wurden die Fehltage in Abhängigkeit der Jahrgangsstufe anhand einiger Stichproben von Klasse 5 bis 9 beobachtet.
In folgender Tabelle wurden die Daten festgehalten.
Jahrgangsstufe der Schüler und Schülerinnen \(x\) | Fehltage \(y\) |
5 | 17 |
5 | 9 |
5 | 15 |
6 | 13 |
6 | 9 |
6 | 11 |
6 | 7 |
7 | 8 |
7 | 5 |
8 | 0 |
8 | 3 |
9 | 1 |
9 | 2 |
9 | 4 |
Die erste Größe ist also die Jahrgangsstufe der zufällig ausgewählten Schülerinnen und Schüler und die zweite Größe die Anzahl der Fehltage. Das Streudiagramm zu der Thematik sieht so aus:
Abb. 6 - Streudiagramm Beispiel.
Es lässt sich also erkennen, dass die Anzahl der Fehltage in den höheren Jahrgangsstufen weniger wird.
Der Korrelationskoeffizient müsste bei diesem Sachverhalt also negativ sein.
Streudiagramm – Übungen
Teste Dein Wissen gleich an ein paar Übungsaufgaben.
Aufgabe 1
Ist der Korrelationskoeffizient des folgenden Streudiagramms positiv oder negativ?
Abb. 7 - Streudiagramm Aufgabe 1.
Lösung
Der Korrelationskoeffizient für dieses Streudiagramm ist positiv.
Aufgabe 2
Erstelle ein Streudiagramm für die Daten aus der folgenden Tabelle.
Alter \(x\) | Taschengeld \(y\) |
7 | \(10 \,\text{€}\) |
8 | \(15 \,\text{€}\) |
8 | \(10 \,\text{€}\) |
9 | \(20 \,\text{€}\) |
10 | \(15 \,\text{€}\) |
10 | \(25 \,\text{€}\) |
10 | \(20 \,\text{€}\) |
11 | \(25 \,\text{€}\) |
11 | \(30 \,\text{€}\) |
12 | \(30 \,\text{€}\) |
12 | \(35 \,\text{€}\) |
Lösung
Das zugehörige Streudiagramm zu der Wertetabelle sieht so aus:
Abb. 8 - Streudiagramm Aufgabe 2.
Streudiagramm – Das Wichtigste
- Ein Streudiagramm besteht aus einer Vielzahl von Punkten, welche in ein kartesisches Koordinatensystem eingetragen werden.
Diese Punkte repräsentieren Wertepaare zweier Größen.
Damit ein Streudiagramm wirklich aussagekräftig ist, werden wie bei anderen Diagrammen auch größere Stichproben benötigt.
Anhand der Form und Dichte der Punktewolke kann abgelesen werden, ob die beiden Größen korrelieren, also ob und in welchem Maße die beiden Größen im Zusammenhang stehen.
Der Korrelationskoeffizient \(k\) gibt an, in welchem Maß und ob die Größen positiv oder negativ korreliert sind. Er kann Werte zwischen \(-1\) und \(1\) annehmen.
Wie stellen wir sicher, dass unser Content korrekt und vertrauenswürdig ist?
Bei StudySmarter haben wir eine Lernplattform geschaffen, die Millionen von Studierende unterstützt. Lerne die Menschen kennen, die hart daran arbeiten, Fakten basierten Content zu liefern und sicherzustellen, dass er überprüft wird.
Content-Erstellungsprozess:
Lily Hulatt ist Digital Content Specialist mit über drei Jahren Erfahrung in Content-Strategie und Curriculum-Design. Sie hat 2022 ihren Doktortitel in Englischer Literatur an der Durham University erhalten, dort auch im Fachbereich Englische Studien unterrichtet und an verschiedenen Veröffentlichungen mitgewirkt. Lily ist Expertin für Englische Literatur, Englische Sprache, Geschichte und Philosophie.
Lerne Lily
kennen
Inhaltliche Qualität geprüft von:
Gabriel Freitas ist AI Engineer mit solider Erfahrung in Softwareentwicklung, maschinellen Lernalgorithmen und generativer KI, einschließlich Anwendungen großer Sprachmodelle (LLMs). Er hat Elektrotechnik an der Universität von São Paulo studiert und macht aktuell seinen MSc in Computertechnik an der Universität von Campinas mit Schwerpunkt auf maschinellem Lernen. Gabriel hat einen starken Hintergrund in Software-Engineering und hat an Projekten zu Computer Vision, Embedded AI und LLM-Anwendungen gearbeitet.
Lerne Gabriel
kennen