Springe zu einem wichtigen Kapitel
Inferenzstatistik – Definition
In der Inferenzstatistik – auch induktive, schließende oder beurteilende Statistik genannt – wird von den Daten, die von einer Stichprobe in Bezug auf bestimmte Variablen erhoben wurden, auf die Ausprägung dieser Variablen in der Grundgesamtheit geschlossen.
Dazu werden verschiedene Verfahren der Inferenzstatistik angewendet, zum Beispiel Hypothesentests.
Nur selten kann eine Grundgesamtheit, die für eine Forschungsfrage untersucht werden soll, vollständig untersucht werden. Deshalb bietet es häufig an, nur einige repräsentative Einheiten der Grundgesamtheit, also eine Stichprobe, zu untersuchen und mittels Verfahren der Inferenzstatistik auf die interessierenden Parameter in der Grundgesamtheit zu schließen.
Wenn man zum Beispiel untersuchen möchte, wie sich die Lernleistung von Schüler*innen in Deutschland während des Home-Schoolings verändert hat, ist es nahezu unmöglich alle Schüler*innen an deutschen Schulen zu befragen. Stattdessen bietet es sich an, die Befragung an einer repräsentativen Stichprobe durchzuführen.
Aus den Informationen, die aus der Befragung an der Stichprobe gewonnen werden können, lässt sich anschließend mithilfe der Verfahren der Inferenzstatistik auf die allgemeine Lernleistung von Schüler*innen an deutschen Schulen während des Home-Schoolings schließen.
Inferenzstatistik – Abgrenzung von anderen Teilbereichen der Statistik
Wie du gerade gelernt hast, wird in der Inferenzstatistik von Daten aus einer Stichprobe auf die Ausprägung der beobachteten Parameter in der Grundgesamtheit geschlossen. Damit unterscheidet sich die Inferenzstatistik maßgeblich von der deskriptiven und explorativen Statistik.
Inferenzstatistik – Unterschied zur deskriptiven Statistik
In der deskriptiven Statistik (auch: beschreibende Statistik) wird zunächst ein Datensatz von einer Stichprobe erhoben und im Anschluss im Detail beschrieben.
Dafür werden unter anderem verschiedenste Lagemaße, wie der Modus, Median und Mittelwert, Streuungsmaße, wie zum Beispiel Varianz und Standardabweichung und Korrelationen bestimmt.
Die deskriptive Statistik umfasst auch die grafische Darstellung der Informationen aus dem Datensatz, zum Beispiel in Form eines Diagramms.
Die deskriptive Statistik bezieht sich demnach nur auf die zugrundeliegende Stichprobe und die aus ihr gewonnenen Informationen. In der deskriptiven Statistik wird kein Rückschluss auf die Grundgesamtheit, aus der die Stichprobe stammt, gezogen. Die deskriptive Statistik dient als Vorarbeit für die Inferenzstatistik.
Inferenzstatistik – Unterschied zur explorativen Statistik
In der explorativen Statistik (auch: erkundende Statistik) wird zunächst ein Datensatz von einer Stichprobe erhoben. Dieser wird dahingehend analysiert, ob aus ihm bisher unbekannte Datenstrukturen oder Zusammenhänge geschlussfolgert werden können. In der explorativen Statistik werden also Hypothesen generiert.
Die aufgestellten Hypothesen können anschließend mit den Methoden der Inferenzstatistik überprüft werden.
Die explorative Statistik bezieht sich demnach nur auf die zugrundeliegende Stichprobe und die aus ihr gewonnenen Informationen. In der explorativen Statistik wird kein Rückschluss auf die Grundgesamtheit, aus der die Stichprobe stammt, gezogen. Sie dient als Vorarbeit für die Inferenzstatistik.
Grundlagen der Inferenzstatistik
Um die Methoden der Inferenzstatistik praktisch anwenden zu können, ist es wichtig, die Grundlagen, auf denen sie aufbaut, gut zu verstehen. Welche Begriffe du im Zusammenhang mit der Inferenzstatistik unbedingt kennen solltest, lernst du in diesem Abschnitt.
Inferenzstatistik – Grundgesamtheit und Stichprobe
Die Begriffe Grundgesamtheit und Stichprobe hast du sicher schon öfter gehört. Doch was genau hat es mit den beiden Begriffen nochmal auf sich und wie unterscheiden sie sich?
Inferenzstatistik – Grundgesamtheit
Die Grundgesamtheit umfasst alle Einheiten, die für die Untersuchung der Forschungsfrage relevant sind. Wer oder was zur Grundgesamtheit gehört, ist also davon abhängig, was genau untersucht werden soll.
Wenn die Forschungsfrage lautet: "Wie hat sich die Lernleistung von deutschen Schüler*innen durch die Corona-Pandemie verändert?", dann gehören alle deutschen Schüler*innen zur Grundgesamtheit.
Bei der Forschungsfrage "Wie hat sich die Lernleistung von Schüler*innen weltweit durch die Corona-Pandemie verändert?", dann gehören alle Schüler*innen auf der ganzen Welt zur Grundgesamtheit.
Inferenzstatistik – Stichprobe
Bei einer Stichprobe handelt es sich um einen Teil der Grundgesamtheit.
Für die meisten Verfahren der Inferenzstatistik ist es wichtig, dass es sich bei den Stichproben um Zufallsstichproben handelt. Bei einer Zufallsstichprobe werden die einzelnen Elemente der Stichprobe per Zufall und nicht willkürlich aus der Grundgesamtheit gewählt.
Wenn du die Forschungsfrage "Wie hat sich die Lernleistung von deutschen Schüler*innen durch die Corona-Pandemie verändert?" untersuchen möchtest, aber nicht die Grundgesamtheit befragen möchtest, kannst du zum Beispiel eine Liste aller deutschen Schulen anfertigen und aus dieser per Zufall 10 Schulen auswählen, an denen du alle Schüler*innen nach ihrer Lernleistung befragst.
Es gibt drei Gründe, warum man häufig Stichproben zur Untersuchung einer Forschungsfrage nutzt:
- Zeitersparnis: Jede einzelne Einheit einer Grundgesamtheit zu untersuchen nimmt sehr viel Zeit in Anspruch.
Angenommen, die Grundgesamtheit beinhaltet 1000 Einheiten und man befragt eine zufällig ausgewählte Stichprobe mit dem Stichprobenumfang n = 500, dann dauert die Datenerhebung nur etwa halb so lange.
- Kostenersparnis: Eine Einheit der Grundgesamtheit zu untersuchen, bringt auch immer gewisse Kosten mit sich.
Angenommen, die Grundgesamtheit beinhaltet 1000 Einheiten und man befragt eine zufällig ausgewählte Stichprobe mit dem Stichprobenumfang n = 500, dann kostet die Datenerhebung nur etwa halb so viel.
- Volle Erhebung praktisch unmöglich: In einigen Bereichen ist es aus praktischen Gründen nicht sinnvoll die Daten der ganzen Grundgesamtheit zu erheben.
Stell dir vor, du bist ein Produzent von Geschirr und du möchtest testen, wie stabil die 1000 neu produzierten Teller sind. In der vorherigen Produktion sind etwa 10% der Teller bei einem einmaligen Sturz aus einem Meter Höhe direkt zerbrochen.
Wenn du nun testen möchtest, ob die neuen Teller genauso stabil sind, ist es wenig sinnvoll, alle 1000 neu produzierten Teller dem Stabilitätstest zu unterziehen. In der Summe werden nämlich ziemlich viele Teller – angenommen die Stabilität der neuen Produktion in genauso wie bei der alten Produktion, sind das in etwa 100 Teller – zerbrechen.
Es ist deshalb sinnvoller, eine kleine Menge der neu produzierten Teller zufällig auszuwählen und den Stabilitätstest nur an diesen durchzuführen.
Inferenzstatistik – Repräsentationsschluss
Nachdem geklärt wurde, was die Grundgesamtheit und eine Stichprobe sind, wird es dir nun einfacher fallen, das Prinzip des Repräsentationsschlusses zu verstehen.
Inferenzstatistik – Ziel des Repräsentationsschlusses
Das Ziel des Repräsentationsschlusses ist es, aus den erhobenen Daten einer Stichprobe auf die tatsächlichen Verhältnisse in der Grundgesamtheit zu schließen.
Da der Schluss von der Stichprobe auf die Grundgesamtheit repräsentativ sein soll, wird er Repräsentationsschluss genannt.
Inferenzstatistik – Prinzip des Repräsentationsschlusses
Das Grundprinzip des Repräsentationsschlusses sieht folgendermaßen aus:
- Ein bisher unbekannter Parameter in einer Grundgesamtheit soll bestimmt werden.
- Dafür wird eine Zufallsstichprobe mit dem Stichprobenumfang n aus der Grundgesamtheit gezogen.
- Aus Basis der Stichprobendaten kann der interessierende Parameter für die Stichprobe berechnet werden.
- Der Parameter der Stichprobe kann anschließend genutzt werden, um den Parameter in der Grundgesamtheit zu schätzen.
Inferenzstatistik – Hypothesentests
Der Hypothesentest ist ein Verfahren der beurteilenden Statistik, mit dem sich die Gültigkeit von Hypothesen überprüfen lässt.
Wichtig ist hierbei jedoch, dass sich eine Hypothese niemals beweisen lässt. Eine Hypothese kann durch das Ergebnis im Rahmen eines Hypothesentests lediglich gestützt werden. Das liegt daran, dass die Hypothesen unter Berücksichtigung eines gewissen Signifikanzniveaus getestet werden.
Das Signifikanzniveau gibt dabei die Wahrscheinlichkeit dafür an, eine in der Realität zutreffende Hypothese fälschlicherweise zu verwerfen.
Daher lässt sich eine Hypothese nie zu 100% bestätigen.
Hypothesentests werden, wenn man eine generelle Veränderung von einem Parameter testen möchte, beidseitig durchgeführt. Bei Verdacht auf Anstieg oder Abfallen von dem Parameter kann der Test auch einseitig durchgeführt werden. Je nach Kontext wird der Hypothesentest dann links- oder rechtsseitig durchgeführt.
Wenn du mehr zum Hypothesentest wissen möchtest, schau doch gerne in unseren dazugehörigen Artikel. Für die Vorgehensweise beim einseitigen und zweiseitigen Hypothesentest gibt es auch jeweils einen Artikel, der dich Schritt für Schritt durch den Hypothesentest führt.
Hypothesentests – Hypothesenarten
Es gibt verschieden Arten eine Hypothese zu überprüfen.
Eine Hypothese ist eine Behauptung, deren Gültigkeit durch statistische Verfahren überprüft werden muss. Um einen Hypothesentest durchführen zu können, müssen zunächst zwei grundlegende Hypothesen formuliert werden:
Die Nullhypothese und die Alternativhypothese .
Nullhypothese
Die Nullhypothese ist das Gegenteil der Alternativhypothese. Sie behauptet, dass keine Veränderung des untersuchten Parameters vorliegt. Im Hypothesentest wird geprüft, ob die Nullhypothese mit den Daten der Stichprobe vereinbar ist.
Du möchtest mehr über die Nullhypothese wissen? Auch zur Nullhypothese haben wir einen eigenen Artikel, in dem du alles Wichtige zu diesem Thema erfährst.
Alternativhypothese
Die Forschungsfrage untersucht meistens, ob sich ein bestimmter Parameter verändert hat. Daraus ergibt sich die Alternativhypothese , die behauptet, dass eine Veränderung des untersuchten Parameters vorliegt.
Hypothesentests – Irrtumswahrscheinlichkeit
Das Signifikanzniveau wird von den Durchführenden des Hypothesentests zu Beginn der Berechnung festgelegt. Es gibt die Wahrscheinlichkeit dafür an, einen Fehler 1. Art zu begehen, also die Nullhypothese, obwohl sie zutrifft, fälschlicherweise zu verwerfen. Das Signifikanzniveau wird daher auch als Irrtumswahrscheinlichkeit bezeichnet.
Die Irrtumswahrscheinlichkeit ist wichtig, um den Grenzen der Ablehnungs- und Annahmebereiche der Hypothesen zu bestimmen.
Für die Irrtumswahrscheinlichkeit wird häufig oder gewählt.
Du möchtest mehr über die Irrtumswahrscheinlichkeit wissen? Kein Problem, auch zur Irrtumswahrscheinlichkeit haben wir einen eigenen Artikel, in dem die Irrtumswahrscheinlichkeit noch einmal im Detail erläutert wird.
Hypothesentests – Fehlerarten
Bei jedem Hypothesentest gibt es zwei richtige und zwei falsche Testentscheidungsmöglichkeiten. Diese sind in der folgenden Tabelle dargestellt:
In der Realität | ||
Testentscheidung | Nullhypothese trifft zu | Nullhypothese trifft nicht zu |
Nullhypothese wird beibehalten | richtige Entscheidung | Fehler 2. Art |
Nullhypothese wird verworfen | Fehler 1. Art | richtige Entscheidung |
Fehler 1. Art
Der Fehler 1. Art (auch genannt) wird begangen, wenn die Nullhypothese zwar in Wirklichkeit zutrifft, diese aber aufgrund der Informationen aus dem Datensatz fälschlicherweise verworfen wird.
Die Wahrscheinlichkeit einen Fehler 1. Art zu begehen ist gleich dem Signifikanzniveau .
Die Wahrscheinlichkeit einen Fehler 1. Art zu begehen kann demnach durch die Wahl des Signifikanzniveaus beeinflusst werden.
Fehler 2. Art
Der Fehler 2. Art (auch genannt) wird begangen, wenn die Nullhypothese in Wirklichkeit nicht zutrifft, diese aber aufgrund der Informationen aus dem Datensatz fälschlicherweise beibehalten wird.
Die Wahrscheinlichkeit einen Fehler 2. Art zu begehen ist gleich der Sensitivität des Tests .
Zusammenhang zwischen den Fehlerarten
Die Wahrscheinlichkeiten für einen Fehler 1. Art und einen Fehler 2. Art hängen miteinander zusammen.
Es gilt: Je größer der eine Fehler, desto kleiner der andere und umgekehrt.
Im Optimalfall ist sowohl die Wahrscheinlichkeit für den Fehler 1. Art als auch für den Fehler 2. Art möglichst gering.
Auch zu den Fehlern beim Testen von Hypothesen gibt es einen separaten Artikel auf unserer Plattform.
Inferenzstatistik - Das Wichtigste auf einen Blick
- Die Inferenzstatistik ist neben der deskriptiven und explorativen Statistik einer der drei Teilbereiche der Statistik.
- In der Inferenzstatistik wird von den Daten, die von einer Stichprobe in Bezug auf bestimmte Variablen erhoben wurden, auf die Ausprägung dieser Variablen in der Grundgesamtheit geschlossen.
- Eines der häufigsten Verfahren der Inferenzstatistik ist der Hypothesentest. Es gibt verschiedene Arten von Hypothesentests, in der Schule wird in der Regel der z-Test durchgeführt.
- Wichtige Begriffe, die du im Zusammenhang mit Hypothesentests unbedingt kennen solltest, sind die folgenden: Nullhypothese, Alternativhypothese, Fehler 1. und 2. Art und Irrtumswahrscheinlichkeit
Lerne schneller mit den 0 Karteikarten zu Inferenzstatistik
Melde dich kostenlos an, um Zugriff auf all unsere Karteikarten zu erhalten.
Häufig gestellte Fragen zum Thema Inferenzstatistik
Was ist eine Inferenzstatistik?
In der Inferenzstatistik – auch induktive, schließende oder beurteilende Statistik genannt – wird von den Daten, die von einer Stichprobe in Bezug auf bestimmte Variablen erhoben wurden, auf die Ausprägung dieser Variablen in der Grundgesamtheit geschlossen. Dazu werden verschiedene Verfahren der Inferenzstatistik angewendet, zum Beispiel Hypothesentests.
Sind Korrelationen deskriptiv?
Ja, Korrelationen gehören zur deskriptiven Statistik. In der deskriptiven Statistik wird zunächst ein Datensatz von einer Stichprobe erhoben und im Anschluss im Detail beschrieben.
Warum deskriptive Statistik?
In der deskriptiven Statistik wird zunächst ein Datensatz von einer Stichprobe erhoben und im Anschluss im Detail beschrieben. Die deskriptive Statistik bezieht sich demnach nur auf die zugrundeliegende Stichprobe und die aus ihr gewonnenen Informationen. In der deskriptiven Statistik wird kein Rückschluss auf die Grundgesamtheit, aus der die Stichprobe stammt, gezogen. Sie dient als Vorarbeit für die Inferenzstatistik.
Was ist der Unterschied zwischen deskriptiver Statistik und Inferenzstatistik?
Die deskriptive Statistik bezieht sich nur auf die zugrundeliegende Stichprobe und die aus ihr gewonnenen Informationen. In der deskriptiven Statistik wird kein Rückschluss auf die Grundgesamtheit, aus der die Stichprobe stammt, gezogen.
In der Inferenzstatistik hingegen wird von Daten aus einer Stichprobe auf die Ausprägung der beobachteten Parameter in der Grundgesamtheit geschlossen.
Über StudySmarter
StudySmarter ist ein weltweit anerkanntes Bildungstechnologie-Unternehmen, das eine ganzheitliche Lernplattform für Schüler und Studenten aller Altersstufen und Bildungsniveaus bietet. Unsere Plattform unterstützt das Lernen in einer breiten Palette von Fächern, einschließlich MINT, Sozialwissenschaften und Sprachen, und hilft den Schülern auch, weltweit verschiedene Tests und Prüfungen wie GCSE, A Level, SAT, ACT, Abitur und mehr erfolgreich zu meistern. Wir bieten eine umfangreiche Bibliothek von Lernmaterialien, einschließlich interaktiver Karteikarten, umfassender Lehrbuchlösungen und detaillierter Erklärungen. Die fortschrittliche Technologie und Werkzeuge, die wir zur Verfügung stellen, helfen Schülern, ihre eigenen Lernmaterialien zu erstellen. Die Inhalte von StudySmarter sind nicht nur von Experten geprüft, sondern werden auch regelmäßig aktualisiert, um Genauigkeit und Relevanz zu gewährleisten.
Erfahre mehr