Inferenzstatistik – Definition
In der Inferenzstatistik – auch induktive, schließende oder beurteilende Statistik genannt – wird von den Daten, die von einer Stichprobe in Bezug auf bestimmte Variablen erhoben wurden, auf die Ausprägung dieser Variablen in der Grundgesamtheit geschlossen.
Dazu werden verschiedene Verfahren der Inferenzstatistik angewendet, zum Beispiel Hypothesentests.
Nur selten kann eine Grundgesamtheit, die für eine Forschungsfrage untersucht werden soll, vollständig untersucht werden. Deshalb bietet es häufig an, nur einige repräsentative Einheiten der Grundgesamtheit, also eine Stichprobe, zu untersuchen und mittels Verfahren der Inferenzstatistik auf die interessierenden Parameter in der Grundgesamtheit zu schließen.
Wenn man zum Beispiel untersuchen möchte, wie sich die Lernleistung von Schüler*innen in Deutschland während des Home-Schoolings verändert hat, ist es nahezu unmöglich alle Schüler*innen an deutschen Schulen zu befragen. Stattdessen bietet es sich an, die Befragung an einer repräsentativen Stichprobe durchzuführen.
Aus den Informationen, die aus der Befragung an der Stichprobe gewonnen werden können, lässt sich anschließend mithilfe der Verfahren der Inferenzstatistik auf die allgemeine Lernleistung von Schüler*innen an deutschen Schulen während des Home-Schoolings schließen.
Inferenzstatistik – Abgrenzung von anderen Teilbereichen der Statistik
Wie du gerade gelernt hast, wird in der Inferenzstatistik von Daten aus einer Stichprobe auf die Ausprägung der beobachteten Parameter in der Grundgesamtheit geschlossen. Damit unterscheidet sich die Inferenzstatistik maßgeblich von der deskriptiven und explorativen Statistik.
Inferenzstatistik – Unterschied zur deskriptiven Statistik
In der deskriptiven Statistik (auch: beschreibende Statistik) wird zunächst ein Datensatz von einer Stichprobe erhoben und im Anschluss im Detail beschrieben.
Dafür werden unter anderem verschiedenste Lagemaße, wie der Modus, Median und Mittelwert, Streuungsmaße, wie zum Beispiel Varianz und Standardabweichung und Korrelationen bestimmt.
Die deskriptive Statistik umfasst auch die grafische Darstellung der Informationen aus dem Datensatz, zum Beispiel in Form eines Diagramms.
Die deskriptive Statistik bezieht sich demnach nur auf die zugrundeliegende Stichprobe und die aus ihr gewonnenen Informationen. In der deskriptiven Statistik wird kein Rückschluss auf die Grundgesamtheit, aus der die Stichprobe stammt, gezogen. Die deskriptive Statistik dient als Vorarbeit für die Inferenzstatistik.
Inferenzstatistik – Unterschied zur explorativen Statistik
In der explorativen Statistik (auch: erkundende Statistik) wird zunächst ein Datensatz von einer Stichprobe erhoben. Dieser wird dahingehend analysiert, ob aus ihm bisher unbekannte Datenstrukturen oder Zusammenhänge geschlussfolgert werden können. In der explorativen Statistik werden also Hypothesen generiert.
Die aufgestellten Hypothesen können anschließend mit den Methoden der Inferenzstatistik überprüft werden.
Die explorative Statistik bezieht sich demnach nur auf die zugrundeliegende Stichprobe und die aus ihr gewonnenen Informationen. In der explorativen Statistik wird kein Rückschluss auf die Grundgesamtheit, aus der die Stichprobe stammt, gezogen. Sie dient als Vorarbeit für die Inferenzstatistik.
Grundlagen der Inferenzstatistik
Um die Methoden der Inferenzstatistik praktisch anwenden zu können, ist es wichtig, die Grundlagen, auf denen sie aufbaut, gut zu verstehen. Welche Begriffe du im Zusammenhang mit der Inferenzstatistik unbedingt kennen solltest, lernst du in diesem Abschnitt.
Inferenzstatistik – Grundgesamtheit und Stichprobe
Die Begriffe Grundgesamtheit und Stichprobe hast du sicher schon öfter gehört. Doch was genau hat es mit den beiden Begriffen nochmal auf sich und wie unterscheiden sie sich?
Inferenzstatistik – Grundgesamtheit
Die Grundgesamtheit umfasst alle Einheiten, die für die Untersuchung der Forschungsfrage relevant sind. Wer oder was zur Grundgesamtheit gehört, ist also davon abhängig, was genau untersucht werden soll.
Wenn die Forschungsfrage lautet: "Wie hat sich die Lernleistung von deutschen Schüler*innen durch die Corona-Pandemie verändert?", dann gehören alle deutschen Schüler*innen zur Grundgesamtheit.
Bei der Forschungsfrage "Wie hat sich die Lernleistung von Schüler*innen weltweit durch die Corona-Pandemie verändert?", dann gehören alle Schüler*innen auf der ganzen Welt zur Grundgesamtheit.
Inferenzstatistik – Stichprobe
Bei einer Stichprobe handelt es sich um einen Teil der Grundgesamtheit.
Für die meisten Verfahren der Inferenzstatistik ist es wichtig, dass es sich bei den Stichproben um Zufallsstichproben handelt. Bei einer Zufallsstichprobe werden die einzelnen Elemente der Stichprobe per Zufall und nicht willkürlich aus der Grundgesamtheit gewählt.
Wenn du die Forschungsfrage "Wie hat sich die Lernleistung von deutschen Schüler*innen durch die Corona-Pandemie verändert?" untersuchen möchtest, aber nicht die Grundgesamtheit befragen möchtest, kannst du zum Beispiel eine Liste aller deutschen Schulen anfertigen und aus dieser per Zufall 10 Schulen auswählen, an denen du alle Schüler*innen nach ihrer Lernleistung befragst.
Es gibt drei Gründe, warum man häufig Stichproben zur Untersuchung einer Forschungsfrage nutzt:
- Zeitersparnis: Jede einzelne Einheit einer Grundgesamtheit zu untersuchen nimmt sehr viel Zeit in Anspruch.
Angenommen, die Grundgesamtheit beinhaltet 1000 Einheiten und man befragt eine zufällig ausgewählte Stichprobe mit dem Stichprobenumfang n = 500, dann dauert die Datenerhebung nur etwa halb so lange.
- Kostenersparnis: Eine Einheit der Grundgesamtheit zu untersuchen, bringt auch immer gewisse Kosten mit sich.
Angenommen, die Grundgesamtheit beinhaltet 1000 Einheiten und man befragt eine zufällig ausgewählte Stichprobe mit dem Stichprobenumfang n = 500, dann kostet die Datenerhebung nur etwa halb so viel.
- Volle Erhebung praktisch unmöglich: In einigen Bereichen ist es aus praktischen Gründen nicht sinnvoll die Daten der ganzen Grundgesamtheit zu erheben.
Stell dir vor, du bist ein Produzent von Geschirr und du möchtest testen, wie stabil die 1000 neu produzierten Teller sind. In der vorherigen Produktion sind etwa 10% der Teller bei einem einmaligen Sturz aus einem Meter Höhe direkt zerbrochen.
Wenn du nun testen möchtest, ob die neuen Teller genauso stabil sind, ist es wenig sinnvoll, alle 1000 neu produzierten Teller dem Stabilitätstest zu unterziehen. In der Summe werden nämlich ziemlich viele Teller – angenommen die Stabilität der neuen Produktion in genauso wie bei der alten Produktion, sind das in etwa 100 Teller – zerbrechen.
Es ist deshalb sinnvoller, eine kleine Menge der neu produzierten Teller zufällig auszuwählen und den Stabilitätstest nur an diesen durchzuführen.
Inferenzstatistik – Repräsentationsschluss
Nachdem geklärt wurde, was die Grundgesamtheit und eine Stichprobe sind, wird es dir nun einfacher fallen, das Prinzip des Repräsentationsschlusses zu verstehen.
Inferenzstatistik – Ziel des Repräsentationsschlusses
Das Ziel des Repräsentationsschlusses ist es, aus den erhobenen Daten einer Stichprobe auf die tatsächlichen Verhältnisse in der Grundgesamtheit zu schließen.
Da der Schluss von der Stichprobe auf die Grundgesamtheit repräsentativ sein soll, wird er Repräsentationsschluss genannt.
Inferenzstatistik – Prinzip des Repräsentationsschlusses
Das Grundprinzip des Repräsentationsschlusses sieht folgendermaßen aus:
- Ein bisher unbekannter Parameter in einer Grundgesamtheit soll bestimmt werden.
- Dafür wird eine Zufallsstichprobe mit dem Stichprobenumfang n aus der Grundgesamtheit gezogen.
- Aus Basis der Stichprobendaten kann der interessierende Parameter für die Stichprobe berechnet werden.
- Der Parameter der Stichprobe kann anschließend genutzt werden, um den Parameter in der Grundgesamtheit zu schätzen.
Inferenzstatistik – Hypothesentests
Der Hypothesentest ist ein Verfahren der beurteilenden Statistik, mit dem sich die Gültigkeit von Hypothesen überprüfen lässt.
Wichtig ist hierbei jedoch, dass sich eine Hypothese niemals beweisen lässt. Eine Hypothese kann durch das Ergebnis im Rahmen eines Hypothesentests lediglich gestützt werden. Das liegt daran, dass die Hypothesen unter Berücksichtigung eines gewissen Signifikanzniveaus getestet werden.
Daher lässt sich eine Hypothese nie zu 100% bestätigen.
Hypothesentests werden, wenn man eine generelle Veränderung von einem Parameter testen möchte, beidseitig durchgeführt. Bei Verdacht auf Anstieg oder Abfallen von dem Parameter kann der Test auch einseitig durchgeführt werden. Je nach Kontext wird der Hypothesentest dann links- oder rechtsseitig durchgeführt.
Wenn du mehr zum Hypothesentest wissen möchtest, schau doch gerne in unseren dazugehörigen Artikel. Für die Vorgehensweise beim einseitigen und zweiseitigen Hypothesentest gibt es auch jeweils einen Artikel, der dich Schritt für Schritt durch den Hypothesentest führt.
Hypothesentests – Hypothesenarten
Es gibt verschieden Arten eine Hypothese zu überprüfen.
Eine Hypothese ist eine Behauptung, deren Gültigkeit durch statistische Verfahren überprüft werden muss. Um einen Hypothesentest durchführen zu können, müssen zunächst zwei grundlegende Hypothesen formuliert werden:
Die Nullhypothese und die Alternativhypothese .
Nullhypothese
Die Nullhypothese ist das Gegenteil der Alternativhypothese. Sie behauptet, dass keine Veränderung des untersuchten Parameters vorliegt. Im Hypothesentest wird geprüft, ob die Nullhypothese mit den Daten der Stichprobe vereinbar ist.
Du möchtest mehr über die Nullhypothese wissen? Auch zur Nullhypothese haben wir einen eigenen Artikel, in dem du alles Wichtige zu diesem Thema erfährst.
Alternativhypothese
Die Forschungsfrage untersucht meistens, ob sich ein bestimmter Parameter verändert hat. Daraus ergibt sich die Alternativhypothese , die behauptet, dass eine Veränderung des untersuchten Parameters vorliegt.
Hypothesentests – Irrtumswahrscheinlichkeit
Das Signifikanzniveau wird von den Durchführenden des Hypothesentests zu Beginn der Berechnung festgelegt. Es gibt die Wahrscheinlichkeit dafür an, einen Fehler 1. Art zu begehen, also die Nullhypothese, obwohl sie zutrifft, fälschlicherweise zu verwerfen. Das Signifikanzniveau wird daher auch als Irrtumswahrscheinlichkeit bezeichnet.
Die Irrtumswahrscheinlichkeit ist wichtig, um den Grenzen der Ablehnungs- und Annahmebereiche der Hypothesen zu bestimmen.
Für die Irrtumswahrscheinlichkeit wird häufig oder gewählt.
Du möchtest mehr über die Irrtumswahrscheinlichkeit wissen? Kein Problem, auch zur Irrtumswahrscheinlichkeit haben wir einen eigenen Artikel, in dem die Irrtumswahrscheinlichkeit noch einmal im Detail erläutert wird.
Hypothesentests – Fehlerarten
Bei jedem Hypothesentest gibt es zwei richtige und zwei falsche Testentscheidungsmöglichkeiten. Diese sind in der folgenden Tabelle dargestellt:
| In der Realität |
Testentscheidung | Nullhypothese trifft zu | Nullhypothese trifft nicht zu |
Nullhypothese wird beibehalten | richtige Entscheidung | Fehler 2. Art |
Nullhypothese wird verworfen | Fehler 1. Art | richtige Entscheidung |
Fehler 1. Art
Der Fehler 1. Art (auch genannt) wird begangen, wenn die Nullhypothese zwar in Wirklichkeit zutrifft, diese aber aufgrund der Informationen aus dem Datensatz fälschlicherweise verworfen wird.
Die Wahrscheinlichkeit einen Fehler 1. Art zu begehen ist gleich dem Signifikanzniveau .
Die Wahrscheinlichkeit einen Fehler 1. Art zu begehen kann demnach durch die Wahl des Signifikanzniveaus beeinflusst werden.
Fehler 2. Art
Der Fehler 2. Art (auch genannt) wird begangen, wenn die Nullhypothese in Wirklichkeit nicht zutrifft, diese aber aufgrund der Informationen aus dem Datensatz fälschlicherweise beibehalten wird.
Die Wahrscheinlichkeit einen Fehler 2. Art zu begehen ist gleich der Sensitivität des Tests .
Zusammenhang zwischen den Fehlerarten
Die Wahrscheinlichkeiten für einen Fehler 1. Art und einen Fehler 2. Art hängen miteinander zusammen.
Es gilt: Je größer der eine Fehler, desto kleiner der andere und umgekehrt.
Im Optimalfall ist sowohl die Wahrscheinlichkeit für den Fehler 1. Art als auch für den Fehler 2. Art möglichst gering.
Auch zu den Fehlern beim Testen von Hypothesen gibt es einen separaten Artikel auf unserer Plattform.
Inferenzstatistik - Das Wichtigste auf einen Blick
- Die Inferenzstatistik ist neben der deskriptiven und explorativen Statistik einer der drei Teilbereiche der Statistik.
- In der Inferenzstatistik wird von den Daten, die von einer Stichprobe in Bezug auf bestimmte Variablen erhoben wurden, auf die Ausprägung dieser Variablen in der Grundgesamtheit geschlossen.
- Eines der häufigsten Verfahren der Inferenzstatistik ist der Hypothesentest. Es gibt verschiedene Arten von Hypothesentests, in der Schule wird in der Regel der z-Test durchgeführt.
- Wichtige Begriffe, die du im Zusammenhang mit Hypothesentests unbedingt kennen solltest, sind die folgenden: Nullhypothese, Alternativhypothese, Fehler 1. und 2. Art und Irrtumswahrscheinlichkeit
Wie stellen wir sicher, dass unser Content korrekt und vertrauenswürdig ist?
Bei StudySmarter haben wir eine Lernplattform geschaffen, die Millionen von Studierende unterstützt. Lerne die Menschen kennen, die hart daran arbeiten, Fakten basierten Content zu liefern und sicherzustellen, dass er überprüft wird.
Content-Erstellungsprozess:
Lily Hulatt ist Digital Content Specialist mit über drei Jahren Erfahrung in Content-Strategie und Curriculum-Design. Sie hat 2022 ihren Doktortitel in Englischer Literatur an der Durham University erhalten, dort auch im Fachbereich Englische Studien unterrichtet und an verschiedenen Veröffentlichungen mitgewirkt. Lily ist Expertin für Englische Literatur, Englische Sprache, Geschichte und Philosophie.
Lerne Lily
kennen
Inhaltliche Qualität geprüft von:
Gabriel Freitas ist AI Engineer mit solider Erfahrung in Softwareentwicklung, maschinellen Lernalgorithmen und generativer KI, einschließlich Anwendungen großer Sprachmodelle (LLMs). Er hat Elektrotechnik an der Universität von São Paulo studiert und macht aktuell seinen MSc in Computertechnik an der Universität von Campinas mit Schwerpunkt auf maschinellem Lernen. Gabriel hat einen starken Hintergrund in Software-Engineering und hat an Projekten zu Computer Vision, Embedded AI und LLM-Anwendungen gearbeitet.
Lerne Gabriel
kennen