Der Notenspiegel, den Deine Lehrer nach einer Probe aufschreiben, ist ein einfaches Beispiel für eine Statistik aus der Mathematik.
In dieser Erklärung geht es zunächst um die Grundlagen der Statistik, Formeln der Statistik und entsprechende Beispiele.
Statistik – Grundlagen
Da es sich bei der Statistik um ein großes Thema handelt, sind auch viele Begriffe und Formeln für das volle Verständnis nötig. In diesem Abschnitt findest Du deshalb zuerst eine Übersicht der wichtigsten Grundlagen.
Statistik Definition
Die Statistik kann folgendermaßen definiert werden.
Bei der Statistik handelt es sich um die Sammlung, Zusammenfassung, Analyse und Darstellung von Daten.
Dazu zählen auch die Methoden, die bei Ungewissheit vernünftige Entscheidungen ermöglichen.
Die Statistik kann etwa die Zahl der Angestellten eines Unternehmens innerhalb eines gewissen Zeitraumes darstellen.
Das Unternehmen A möchte einen Überblick darüber erhalten, wie sich Ihre Mitarbeiteranzahl seit der Gründung im Jahr 1990 entwickelt hat.
Dafür suchen sie alle Ihre Aufzeichnungen aus den letzten Jahren über die Mitarbeiterzahl raus (Sammlung) und fassen die Zahlen in Fünferschritten zusammen. (Zusammenfassung). Diese Ergebnisse schreiben sie anschließend in eine Tabelle (Darstellung):
Jahr | 1990 | 1995 | 2000 | 2005 | 2010 | 2015 | 2020 |
Anzahl an Mitarbeitern | \[10\] | \[200\] | \[2000\] | \[5 000\] | \[10 000\] | \[30 000\] | \[35 000\] |
Als sie betrachten, um wie viel Prozent die Anzahl pro Sprung wächst, kommen sie zu dem Schluss, dass Ihre Mitarbeiterzahl im Verhältnis zum Gründungsjahr weniger schnell wächst. (Analyse)
Statistik lernen
Ein paar
statistische Begriffe sollten Dir bekannt sein:
Begriff | Erklärung | Beispiel |
Grundgesamtheit | Die Grundgesamtheit umfasst alle Objekte, über die Informationen ermittelt werden sollen. | Bei einem Notenspiegel einer Klausur ist die Grundgesamtheit alle die gesamte Klasse. |
Stichprobe | Eine Stichprobe ist eine Teilmenge der Grundgesamtheit, die trotzdem die Eigenschaften der Grundgesamtheit widerspiegelt. | Nur die Hälfte aller Schüler schreiben die Klausur, aber deren Notenspiegel wird auf die gesamte Klasse bezogen, die Hälfte der Schüler, die an der Klausur teilgenommen haben, sind eine Stichprobe für die ganze Klasse. |
Merkmalsträger | Ein Merkmalsträger ist ein Objekt der Grundgesamtheit. | In dieser Klasse ist ein Schüler ein Merkmalsträger. |
Merkmal/ Variablen | Merkmale sind Eigenschaften, nach denen bei den Merkmalsträgern in der Statistik gefragt wird. | Die Note eines Schülers ist in diesem Fall ein Merkmal. |
Ausprägung | Eine mögliche Variante des Merkmals. | Welche Note ein Schüler erreicht hat, ist eine Ausprägung. |
Wertebereich | Menge aller möglichem Ausprägungen. | Wenn ein Schüler nach seiner Note gefragt wird, sind die Noten Eins bis sechs der Wertebereich. |
Statistik Formeln
In der folgenden Tabelle findest Du eine kleine Sammlung von Formeln, die Dir in der Statistik immer wieder begegnen werden.
Wert | Formel | Anmerkung |
Mittelwert | \[\mu=\frac{\text{Summe aller Werte}}{\text{Anzahl aller Werte}}\] | |
Median | ungerade Anzahl Messwerte | \[x_{\text{med}}=x_{\frac{n+1}{2}}\] | Kann nur bei ordinalen und kardinalen Skalenniveaus angewendet werden.\(n\) : Anzahl and Ausprägungen\(x_{med}\) : Median\(x\) : Ergebnis |
gerade Anzahl Messwerte | \[x_{\text{med}}=\frac{1}{2} \cdot (x_{\frac{n}{2}}+x_{\frac{n}{2}+1})\] |
Varianz | \[\sigma^2=\sum_{i=1}^n(x_i-\mu)^2\cdot p_i\] | \(p_i\) : Wahrscheinlichkeit, dass \(x_i\) eintritt |
Standardabweichung | \[\sigma=\sqrt{\text{Varianz}}=\sqrt{\sum_{i=1}^n(x_i-\mu)^2\cdot p_i} \] | |
Spannweite | \[R=x_{\text{max}}-x_{\text{min}}\] | \(x_{\text{max}}\) : Größter Wert\(x_{\text{min}}\) : kleinster Wert |
Variationskoeffizient | \[V=\frac{\sigma}{\mu}\] | |
Statistik – Mathematik
In der Mathematik wird die Statistik in zwei große Teilbereiche geteilt. Die deskriptive und die beurteilende Statistik.
Deskriptive Statistik – einfach erklärt
Die Deskriptive Statistik, auch beschreibende Statistik genannt, behandelt die Sammlung, Zusammenfassung, Analyse und Darstellung von Daten. Das Ziel der deskriptiven Statistik ist es, einen Überblick über den vorliegenden Datensatz zu geben.
Dabei werden die Daten geordnet und systematisch zusammengefasst. Zur Ordnung von Daten können Tabellen und Diagramme verwendet werden.
Die Analyse von Daten geschieht häufig auf Basis von berechneten Lagemaßen oder Streuungsmaßen.
Abbildung 1: Deskriptive Statistik
Neben den vielen möglichen Methoden der deskriptiven Statistik gibt es zwei weitere Formen Datensätze zu beschreiben.
Das Skalen- oder Messniveau einer Variablen klassifizieren ihren Aussagegehalt in etwa einer Studie. Unterschieden wird zwischen den drei Skalenniveaus Nominalskala, Ordinalskala und metrischer Skala.
Alle drei Skalenniveaus haben verschiedene Eigenschaften, mithilfe welcher Du die Variablen
in die verschiedenen Skalenniveaus einordnen kannst.
Mehr zu den Messniveaus findest Du in der Erklärung Skalenniveau oder Deskriptive Statistik.
Beurteilende Statistik – Zusammenfassung
Die beurteilende Statistik, auch induktive Statistik genannt, stellt die Methoden, die bei Ungewissheit vernünftige Entscheidungen ermöglichen, bereit.
Für diese Methoden wird vor allem die Wahrscheinlichkeitsrechnung verwendet. Wenn die verwendete Stichprobe repräsentativ für die Grundgesamtheit ist, können von der Stichprobe Rückschlüsse auf die Grundgesamtheit gezogen werden.
Abbildung 2: Beurteilende Statistik
Dieser Schluss von der Stichprobe auf die Grundgesamtheit wird Repräsentationsschluss genannt.
Das Ziel des Repräsentationsschlusses ist es, aus den erhobenen Daten einer Stichprobe auf die tatsächlichen Verhältnisse in der Grundgesamtheit zu schließen.
Da der Schluss von der Stichprobe auf die Grundgesamtheit repräsentativ sein soll, wird er Repräsentationsschluss genannt.
Ob dieser Repräsentationsschluss auch wirklich repräsentativ ist, lässt sich mit dem
Hypothesentest überprüfen.
Bei dem Hypothesentest werden die Schlussfolgerung aus der Stichprobe, Nullhypothese, und ihr Gegenereignis, die Alternativhypothese, untersucht. Die Frage, welcher der beiden Hypothesen am glaubwürdigsten ist, wird durch die Binomialverteilung beantwortet.
Wie hoch die Wahrscheinlichkeit ist, dass Du Dich bei diesem Hypothesentest irrst, wird mit den Fehlerarten beschreiben.
Der Fehler 1. Art wird begangen, wenn die Nullhypothese zwar in Wirklichkeit zutrifft, diese aber aufgrund der Informationen aus dem Datensatz fälschlicherweise verworfen wird.
Der Fehler 2. Art wird begangen, wenn die Nullhypothese in Wirklichkeit nicht zutrifft, diese aber aufgrund der Informationen aus dem Datensatz fälschlicherweise beibehalten wird.
Mehr zu diesem Thema findest Du in der Erklärung Inferenzstatistik.
Deskriptive und Beurteilende Statistik – Beispiele
Damit Du Dir den Unterschied zwischen der Beurteilenden und der Deskriptiven Statistik etwas besser vorstellen kannst, sind hier zwei Beispiele dargestellt.
Beispiel für die Deskriptive Statistik
Eine Englischlehrerin ist mit dem Wortschatz ihrer Klasse unzufrieden, also entscheidet sie, jede Woche aus der 30-köpfigen Klasse zehn zufällig ausgewählte Schüler einen Vokabeltest machen zu lassen.
Das Ergebnis der ersten Woche lautet:
Schüler | Schüler 1 | Schüler 2 | Schüler 3 | Schüler 4 | Schüler 5 | Schüler 6 | Schüler 7 | Schüler 8 | Schüler 9 | Schüler 10 |
Note | \[3\] | \[1\] | \[4\] | \[3\] | \[2\] | \[6\] | \[4\] | \[5\] | 4 | 3 |
Damit die Schüler Ihre aktuelle Leistung veranschaulicht bekommen, entwirft die Lehrerin einen Notenspiegel. Dafür zählt sie zusammen, wie oft welche Note erreicht wird.
Raus kommt folgender Notenspiegel:
Note | 1 | 2 | 3 | 4 | 5 | 6 |
Anzahl | \[1\] | \[1\] | \[3\] | \[3\] | \[1\] | \[1\] |
Um jetzt noch den Durchschnitt auszurechnen, addiert sie alle erreichten Noten und teilt diese Summe durch die Anzahl der teilnehmenden Schüler. Raus kommt der Durchschnitt \(3,4\). Das ist zwar lediglich befriedigend, doch die Lehrerin hatte bisher den Eindruck, dass es viel schlimmer um die Vokabelkenntnisse ihrer Schüler steht.
Mit diesem Notenspiegel hat die Englischlehrerin deskriptive Statistik durchgeführt. Mithilfe von Tabellen und Rechnungen hat sie die Daten aus der Stichprobe ausgewertet und interpretiert.
Dieses Beispiel kann dann wie folgt weitergeführt werden:
Beispiel für beurteilende Statistik
Jetzt hat die Englischlehrerin einen Durchschnitt ermittelt, dieser ist allerdings nur von zehn der insgesamt 30 Schüler. Da dieser Durchschnitt aber nicht so schlecht ausgefallen war, wie sie dachte, beschließt die Lehrerin erst mal keine weiteren Maßnahmen zur Verbesserung der Vokabelkenntnisse durchzuführen. Ihre Hypothese ist es, dass die Annahme, dass der Notenspiegel nicht repräsentativ ist, falsch ist.
Jetzt vergeht eine weitere Woche, in der die Lehrerin beschlossen hat, keine weiteren Vokabeltests durchzuführen. Doch wie vorher, hat die Lehrerin das Gefühl, dass die Schüler ihre Vokabeln nicht beherrschen. Also beschließt sie, einen weiteren Vokabeltest mit allen 30 Schülern durchzuführen. Diesmal sieht der Notenspiegel aber so aus:
Note | 1 | 2 | 3 | 4 | 5 | 6 |
Anzahl | \[1\] | \[2\] | \[6\] | \[9\] | \[7\] | \[5\] |
Der Durchschnitt liegt bei \(4,1\), also viel schlechter als zuvor.
Die Lehrerin hat nach dem ersten Vokabeltest einen Fehler 1. Art begangen. Das heißt, dass die Annahme, dass der erste Notenspiegel nicht repräsentativ ist, fälschlich abgetan worden war, obwohl sie richtig ist.
Dieser Repräsentationsschluss und der Fehler 1. Art sind Teile dessen, worum es sich in der beurteilenden Statistik handelt.
Statistik – Das Wichtigste
- Bei der Statistik handelt es sich um die Sammlung, Zusammenfassung, Analyse und Darstellung von Daten. Dazu auch die Methoden, die bei Ungewissheit vernünftige Entscheidungen ermöglichen.
- Wichtige Begriffe der Statistik, die Du Dir merken solltest, sind die Grundgesamtheit, Stichprobe, Merkmalsträger, Merkmal, Ausprägung und Wertebereich
- Die Deskriptive Statistik, auch beschreibende Statistik genannt, behandelt die Sammlung, Zusammenfassung, Analyse und Darstellung von Daten. Das Ziel der deskriptiven Statistik ist es, einen Überblick über den vorliegenden Datensatz zu geben.
- Das Skalen- oder Messniveau einer Variablen klassifizieren ihren Aussagegehalt in etwa einer Studie. Unterschieden wird zwischen den drei Skalenniveaus Nominalskala, Ordinalskala und metrischer Skala.
- Die beurteilende Statistik, auch induktive Statistik genannt, stellt die Methoden, die bei Ungewissheit vernünftige Entscheidungen ermöglichen, bereit.
- Wenn die verwendete Stichprobe repräsentativ für die Grundgesamtheit darstellt, kann die können von der Stichprobe Rückschlüsse auf die Grundgesamtheit gezogen werden.
- Bei dem Hypothesentest werden die Schlussfolgerung aus der Stichprobe, Nullhypothese, und ihr Gegenereignis, die Alternativhypothese, untersucht. Die Frage, welcher der beiden Hypothesen am glaubwürdigsten ist, wird durch die Binomialverteilung beantwortet.
- Der Fehler 1. Art wird begangen, wenn die Nullhypothese zwar in Wirklichkeit zutrifft, diese aber aufgrund der Informationen aus dem Datensatz fälschlicherweise verworfen wird.
- Der Fehler 2. Art wird begangen, wenn die Nullhypothese in Wirklichkeit nicht zutrifft, diese aber aufgrund der Informationen aus dem Datensatz fälschlicherweise beibehalten wird.
Wie stellen wir sicher, dass unser Content korrekt und vertrauenswürdig ist?
Bei StudySmarter haben wir eine Lernplattform geschaffen, die Millionen von Studierende unterstützt. Lerne die Menschen kennen, die hart daran arbeiten, Fakten basierten Content zu liefern und sicherzustellen, dass er überprüft wird.
Content-Erstellungsprozess:
Lily Hulatt ist Digital Content Specialist mit über drei Jahren Erfahrung in Content-Strategie und Curriculum-Design. Sie hat 2022 ihren Doktortitel in Englischer Literatur an der Durham University erhalten, dort auch im Fachbereich Englische Studien unterrichtet und an verschiedenen Veröffentlichungen mitgewirkt. Lily ist Expertin für Englische Literatur, Englische Sprache, Geschichte und Philosophie.
Lerne Lily
kennen
Inhaltliche Qualität geprüft von:
Gabriel Freitas ist AI Engineer mit solider Erfahrung in Softwareentwicklung, maschinellen Lernalgorithmen und generativer KI, einschließlich Anwendungen großer Sprachmodelle (LLMs). Er hat Elektrotechnik an der Universität von São Paulo studiert und macht aktuell seinen MSc in Computertechnik an der Universität von Campinas mit Schwerpunkt auf maschinellem Lernen. Gabriel hat einen starken Hintergrund in Software-Engineering und hat an Projekten zu Computer Vision, Embedded AI und LLM-Anwendungen gearbeitet.
Lerne Gabriel
kennen