Anhand dieses Beispiels kannst Du in dieser Erklärung den Unterschied zwischen der Grundgesamtheit und der Stichprobe lernen. Ebenso wirst Du erfahren, was Repräsentativität bedeutet und wie Du sie nutzt, um von der Stichprobe auf die Grundgesamtheit zu schließen.
Grundgesamtheit Stichprobe – einfach erklärt
Bei jeder Umfrage in der Statistik wird zwischen der Grundgesamtheit und der Stichprobe unterschieden.
Grundgesamtheit – Definition
Du führst eine statistische Untersuchung durch, um eine Erkenntnis zu gewinnen.
Die Grundgesamtheit ist die Menge aller Objekte, über die eine Aussage getroffen werden soll.
Bei der statistischen Untersuchung wird nicht jedes Objekt der Grundgesamtheit untersucht, sondern nur eine Teilmenge davon.
Elin möchte wissen, wie viel Prozent der Schülerinnen und Schüler ihrer Schule Mathe mögen.
Dann sind alle Schülerinnen und Schüler der Schule die Grundgesamtheit.
Stichprobe – Definition
Jede statistische Untersuchung besteht aus einer Stichprobe.
Die Stichprobe ist eine Teilmenge der Grundgesamtheit. Sie umfasst all die Objekte, die "untersucht" werden.
Die Größe der Stichprobe wird als Stichprobenumfang \(n\) bezeichnet.
Ziel ist es, dass die Stichprobe die Grundgesamtheit repräsentiert.
Elin befragt 100 Schülerinnen und Schüler ihrer Schule. Diese 100 Schülerinnen und Schüler sind die Stichprobe. Der Stichprobenumfang ist \(n=100\).
Unterschied Grundgesamtheit und Stichprobe
Die Stichprobe ist immer eine Teilmenge der Grundgesamtheit. Das heißt, dass die Grundgesamtheit die Stichprobe stets enthält. Die Grundgesamtheit enthält aber noch weitere Objekte außer der Stichprobe, die nicht untersucht werden.
Die Größe einer Stichprobe ist immer begrenzt. Im Unterschied dazu muss die Größe der Grundgesamtheit nicht begrenzt sein. Auch kann die Größe der Grundgesamtheit um ein Vielfaches höher sein als die Größe der Stichprobe.
Grundgesamtheit Stichprobe – Beispiel
Hier findest Du einige Beispiele für den Unterschied zwischen der Grundgesamtheit und der Stichprobe.
Grundgesamtheit | Stichprobe |
alle Schülerinnen und Schüler einer Schule | 100 Schülerinnen und Schüler, die befragt werden, ob sie Mathe mögen |
alle gepflückten Äpfel eines Landwirts | Äpfel, die bei der Qualitätskontrolle untersucht werden |
Zuschauerinnen und Zuschauer eines Theaterstücks | Personen, die nach dem Theaterstück befragt wurden, ob es ihnen gefallen hat |
Stichprobe repräsentativ für Grundgesamtheit
Bei jeder statistischen Erhebung muss darauf geachtet werden, dass die Stichprobe repräsentativ für die Grundgesamtheit ist. Für die Repräsentativität der Stichprobe sind verschiedene Faktoren von Bedeutung.
Zum einen spielt der Stichprobenumfang eine Rolle. Damit die Stichprobe repräsentativ ist, sollte der Stichprobenumfang ausreichend groß sein.
Grundgesamtheit Stichprobenumfang berechnen
Doch wann ist eine Stichprobe ausreichend groß?
Tatsächlich gibt es verschiedene Möglichkeiten, einen notwendigen Stichprobenumfang zu berechnen. Es gibt also nicht für jede Größe der Grundgesamtheit genau eine notwendige Stichprobengröße.
Meist brauchst Du in der Schule den Stichprobenumfang gar nicht berechnen, da Du dazu mehrere Parameter kennen müsstest. Falls doch, gibt es im Internet auch viele Rechner für den Stichprobenumfang.
Um den Stichprobenumfang für eine repräsentative Erhebung zu berechnen, legst Du ein Konfidenzniveau fest. Das Konfidenzniveau ist die Wahrscheinlichkeit, mit der die Ergebnisse der Stichprobe auch für die Grundgesamtheit gelten. Ein typisches Konfidenzniveau ist \(95\,\%\). Das bedeutet, dass die Ergebnisse der Stichprobe zu \(95\,\%\) mit der Grundgesamtheit übereinstimmen.
Den Stichprobenumfang kannst Du dann mit folgender Formel berechnen:
$$n=\frac{p(1-p)z^2}{m^2}$$
- \(p\) gibt die Verteilung des eigentlichen Merkmals an. Da diese aber meistens nicht bekannt ist, wird sie geschätzt oder pauschal mit \(p=0{,}5\) angenommen.
- \(m\) steht für die Fehlergrenze. Sie beschreibt die maximale Abweichung der Stichprobenergebnisse von der Grundgesamtheit. Eine typische Fehlergrenze ist \(m=0{,}05\). Das bedeutet, dass das Stichprobenergebnis um maximal \(5\,\%\) vom tatsächlichen Ergebnis abweicht.
Von Stichprobe auf Grundgesamtheit schließen
Damit Du von der Stichprobe auf die Grundgesamtheit schließen kannst, ist aber nicht nur der Stichprobenumfang von Bedeutung. Für die Repräsentativität der Stichprobe ist auch die Auswahl der befragten Personen bzw. untersuchten Objekte wichtig. Diese Auswahl muss zufällig geschehen. Bei der zufälligen Auswahl muss aber berücksichtigt werden, dass die ausgewählte Gruppe die Grundgesamtheit möglichst exakt widerspiegelt. Was bedeutet das?
Denk noch einmal an das Einstiegsbeispiel zurück. Elin möchte 100 Schülerinnen und Schüler ihrer Schule befragen, ob sie Mathe mögen. Hier ist es für die Repräsentativität von Bedeutung, wie die Schülerinnen und Schüler ausgewählt werden. Befragt Elin zum Beispiel einfach vier ganze Klassen, ist es gut möglich, dass diese Klassen nicht die Grundgesamtheit repräsentieren. Stell Dir vor, eine Klasse hat eine besonders gute Mathelehrerin und der Unterricht ist spannend. Dann werden vermutlich mehr Schülerinnen und Schüler angeben, dass sie Mathe mögen.
Damit Elin von ihrer Stichprobe auf die Grundgesamtheit schließen kann, ist es wichtig, dass die ausgewählten Personen aus möglichst vielen verschiedenen Klassen sind. Auch sollte Elin darauf achten, dass sie zum Beispiel nicht zur Schüler- und Schülerinnenkonferenz geht und dort alle Klassensprecher und Klassensprecherinnen befragt. Es ist möglich, dass es einen Zusammenhang zwischen "mag Mathe" und "ist Klassensprecher bzw. Klassensprecherin" gibt.
Beachte also für die Repräsentativität, dass Du wirklich zufällig auswählst. In Abbildung 1 kannst Du den Unterschied zwischen einer zufälligen Stichprobe, die die Grundgesamtheit repräsentiert und einer Stichprobe, die die Grundgesamtheit nicht repräsentiert, erkennen. Bei beiden Auswahlen ist der Stichprobenumfang identisch. Die Repräsentativität ist hier nicht abhängig vom Stichprobenumfang.
Abb. 1 - repräsentative und nicht-repräsentative Stichprobe.
Grundgesamtheit Stichprobe: Merkmal, Merkmalsausprägung, Häufigkeit
Neben Grundgesamtheit, Stichprobe und Repräsentativität gibt es einige weitere Grundbegriffe, die in der Statistik bei einer Datenerhebung von Bedeutung sind.
Eine Eigenschaft des untersuchten Objekts bzw. der befragten Person wird Merkmal genannt. Ein Merkmal kann einen bestimmten Wert annehmen. Dies wird Merkmalsausprägung genannt.
Merkmale und die Merkmalsausprägungen sind sowohl bei der Auswahl der Untersuchungsobjekte als auch bei der Untersuchung selbst wichtig.
Die Schülerinnen und Schüler von Elins Schule können nach ihren Klassenstufen eingeteilt werden. Die Klassenstufe ist ein Merkmal. Wird allen Schülerinnen und Schülern ihre Klassenstufe zugeordnet, so ist die zugeordnete Klassenstufe die Merkmalsausprägung.
Elin sollte bei der Auswahl der befragten Personen darauf achten, dass alle Merkmalsausprägungen vertreten sind.
Wenn Elin die Schülerinnen und Schüler befragt, ob sie Mathe mögen, ist auch dies ein Merkmal. "mag Mathe" und "mag nicht Mathe" sind die Merkmalsausprägungen.
Eine Stichprobe wird durchgeführt, um die Merkmalsausprägungen eines Merkmals zu untersuchen. Dabei ist meist die Häufigkeit einer Merkmalsausprägung von Interesse. Bei der statistischen Erhebung wird zuerst die absolute Häufigkeit einer Merkmalsausprägung gezählt. Bei der Auswertung wird meist die relative Häufigkeit verwendet.
Mehr über Häufigkeiten findest Du in den Erklärungen "absolute Häufigkeit" und "relative Häufigkeit".
Grundgesamtheit und Stichprobe – Aufgaben
Mit den folgenden Aufgaben kannst Du jetzt Dein erlerntes Wissen über den Zusammenhang zwischen der Grundgesamtheit und einer Stichprobe auf die Probe stellen.
Aufgabe 1
In einer Stadt werden 500 Einwohnerinnen und Einwohner nach ihrer Zufriedenheit mit dem Nahverkehr befragt. Dabei gibt es die Auswahlmöglichkeiten "gar nicht zufrieden", "weniger zufrieden", "zufrieden" und "sehr zufrieden".
Gib für diese Umfrage die Stichprobe, den Stichprobenumfang, die Grundgesamtheit, das Merkmal und die Merkmalsausprägungen an.
Lösung
Begriff | Beispiel |
Stichprobe | befragte Einwohner und Einwohnerinnen |
Stichprobenumfang | \(n=500\) |
Grundgesamtheit | alle Einwohner und Einwohnerinnen |
Merkmal | Zufriedenheit mit dem Nahverkehr |
Merkmalsausprägungen | "gar nicht zufrieden", "weniger zufrieden", "zufrieden" und "sehr zufrieden" |
Aufgabe 2
Eine Zeitschrift möchte gerne untersuchen, ob die Bürger Deutschlands gerne in Deutschland leben. Dazu befragt sie in einer Großstadt 500 Personen zufällig.
Erkläre, warum diese Umfrage für die Frage nicht repräsentativ ist.
Lösung
Die Stichprobe in einer einzigen Großstadt Deutschland kann nicht die Grundgesamtheit aller Einwohner und Einwohnerinnen Deutschland repräsentieren. Dazu werden zu viele Gruppen ausgeschlossen. In der Umfrage werden weder die anderen Großstädte noch die Personen, die nicht in Großstädten wohnen, repräsentiert.
Die Stichprobe müsste so durchgeführt werden, dass theoretisch jede Person in Deutschland ausgewählt werden könnte.
Grundgesamtheit Stichprobe – Das Wichtigste
- Die Grundgesamtheit ist die Menge aller Objekte, über die eine Aussage getroffen werden soll.
- Die Stichprobe umfasst alle Objekte, die untersucht werden sollen.
- Der Stichprobenumfang wird mit \(n\) bezeichnet.
- Um von der Stichprobe auf die Grundgesamtheit zu schließen, muss die Stichprobe repräsentativ sein.
- Für eine repräsentative Umfrage wird Folgendes benötigt:
- ausreichend großer Stichprobenumfang
- zufällige Auswahl der Stichprobe
Nachweise
- Eckey et al. (2005). Wahrscheinlichkeitsrechnung und Induktive Statistik. Grundlagen – Methoden – Beispiele. Gabler Verlag.
- Albers et al. (2009). Methodik der empirischen Forschung. Gabler Verlag.
Wie stellen wir sicher, dass unser Content korrekt und vertrauenswürdig ist?
Bei StudySmarter haben wir eine Lernplattform geschaffen, die Millionen von Studierende unterstützt. Lerne die Menschen kennen, die hart daran arbeiten, Fakten basierten Content zu liefern und sicherzustellen, dass er überprüft wird.
Content-Erstellungsprozess:
Lily Hulatt ist Digital Content Specialist mit über drei Jahren Erfahrung in Content-Strategie und Curriculum-Design. Sie hat 2022 ihren Doktortitel in Englischer Literatur an der Durham University erhalten, dort auch im Fachbereich Englische Studien unterrichtet und an verschiedenen Veröffentlichungen mitgewirkt. Lily ist Expertin für Englische Literatur, Englische Sprache, Geschichte und Philosophie.
Lerne Lily
kennen
Inhaltliche Qualität geprüft von:
Gabriel Freitas ist AI Engineer mit solider Erfahrung in Softwareentwicklung, maschinellen Lernalgorithmen und generativer KI, einschließlich Anwendungen großer Sprachmodelle (LLMs). Er hat Elektrotechnik an der Universität von São Paulo studiert und macht aktuell seinen MSc in Computertechnik an der Universität von Campinas mit Schwerpunkt auf maschinellem Lernen. Gabriel hat einen starken Hintergrund in Software-Engineering und hat an Projekten zu Computer Vision, Embedded AI und LLM-Anwendungen gearbeitet.
Lerne Gabriel
kennen