Histogramm Definition
Wenn Dich jemand nach der Definition eines Histogramms fragt, kannst Du ihm folgendes sagen:
Ein Histogramm ist eine Form, eine in Klassen aufgeteilte, absolute oder relative Häufigkeitsverteilung in einem speziellen Säulendiagramm zu veranschaulichen.
Doch was kannst Du Dir darunter jetzt vorstellen?
Das Histogramm sieht einem klassischen Säulendiagramm sehr ähnlich, und zeichnet sich durch folgende Eigenschaften aus:
- Auf der x-Achse werden die in Klassen zusammengefassten Merkmalsausprägungen dargestellt und auf der y-Achse die Häufigkeit oder Häufigkeitsverteilung.
- Die Daten müssen vor Erstellen des Histogramms zuerst in entsprechende Klassen (Intervalle) unterteilt werden, diese Klassen stellen später die Breite der Säulen dar
- Die Fläche der Säulen gibt Dir bei relativen Häufigkeiten Auskunft über wie viele Messwerte in diese Klasse fallen
- Die Höhe der Säulen gibt die Häufigkeit einer Klasse wieder, bei einer relativen Häufigkeit kannst Du dort die Häufigkeitsdichte ablesen
Abbildung 1: Histogramm Ansicht
Ein Beispiel, mit dem Du vielleicht eher was anfangen kannst, ist die Darstellung eines Notenspiegels.
Nimm doch einmal an, dass Du in einer Klasse mit insgesamt 46 Schülern sitzt. Ihr habt letzte Woche eine Klausur geschrieben und jetzt schreibt Euer Lehrer folgenden Notenspiegel an:
Note | 15 | 14 | 13 | 12 | 11 | 10 | 9 | 8 | 7 | 6 | 5 | 4 | 3 | 2 | 1 | 0 |
Anzahl | 1 | 0 | 3 | 6 | 7 | 8 | 5 | 4 | 4 | 1 | 3 | 1 | 2 | 0 | 0 | 1 |
In der Klasse wird nun aber Protest laut, die Noten seien ja im 15-Punkte-System und einige Schüler könnten sich darunter nicht viel vorstellen. Also gibt Euer Lehrer nach und zeichnet folgendes Histogramm an die Tafel:
Abbildung 2: Histogramm Klassenspiegel
Auf der x-Achse wurden die Noten in 15-Punkte-System aufgetragen und auf der y-Achse die Häufigkeit. Um Euch den Notenspiegel in beiden Notensystemen zu zeigen, hat Euer Lehrer die Punkte in sechs Klassen aufgeteilt. Die Noten 1 bis 5 umfassen jeweils Intervalle von 3 Punkten, sie haben also eine Klassenbreite von 3. Die Note 6 entspricht jedoch nur einer Punktzahl und hat somit nur eine Klassenbreite von 1.
Jetzt kannst Du die Anzahl der Schüler, die eine bestimmte Note erreicht haben, dadurch ermitteln, dass Du den Flächeninhalt einer Säule berechnest. So multipliziert Ihr für die Note 2 die Klassenbreite 3 mit der Häufigkeit 7 und erhaltet die Zahl 21. Es haben also 21 Schüler die Note 2 erreicht.
Histogramm erstellen
Nun möchtest Du vielleicht selbst ein Histogramm erstellen. Im ersten Schritt ist erst einmal etwas rechnerische Vorarbeit nötig, danach kannst Du das Histogramm zeichnen.
Zur Veranschaulichung wirst Du auch sehen, wie die einzelnen Schritte dann auch für deinen Lehrer aus dem vorherigen Beispiel ausgesehen hätte.
Histogramm berechnen
Um später auch ein Histogramm zeichnen zu können, musst Du zuerst drei Werte berechnen oder festlegen.
Daten in Klassen einteilen
Als Erstes musst Du die Dir vorgegeben Merkmalsausprägungen in eine Anzahl \({\color{#1478c8}\text{i}}\) Klassen unterteilen. In wie viele Klassen Du die Merkmalsausprägungen unterteilst und wie breit Du sie wählst, ist Dir überlassen. Es ergibt daher Sinn, dass Du die Anzahl \({\color{#1478c8}\text{i}}\) und die Klassenbreite \({\color{#00dcb4}\text{b}_\text{i}}\) so wählst, dass sie sich zur Veranschaulichung Deiner Daten eignen.
Dein Lehrer teilt hier also die Anzahl der erreichten Noten im 15-Punkte-System in die jeweiligen Intervalle dem normalen Notensystem zu
15-Punkte-System | 15 | 14 | 13 | 12 | 11 | 10 | 9 | 8 | 7 | 6 | 5 | 4 | 3 | 2 | 1 | 0 |
Anzahl | 1 | 0 | 3 | 6 | 7 | 8 | 5 | 4 | 4 | 1 | 3 | 1 | 2 | 0 | 0 | 1 |
Klassisches System | 1 | 2 | 3 | 4 | 5 | 6 |
Die Klassenbreiten sind also wie folgt verteilt: \(\text{b}_{1,2,3,4,5}=3\) und \(\text{b}_6=1\).
Absolute oder relative Häufigkeit der Daten ermitteln
Die absolute Häufigkeit \({\color{#fa3273}\text{n}_\text{i}}\) der einzelnen Klassen zu ermitteln bedeutet, dass Du zählst, wie viele Messwerte in die Klasse fallen.
Für die relative Häufigkeit brauchst Du die absolute Häufigkeit nur durch die Anzahl der gesamten Messwerte zu teilen.
Um die absolute Häufigkeit zu berechnen, muss Dein Lehrer jetzt nur noch zählen, wie viele Schüler jeweils in eine Note fallen. Dafür addiert er die Anzahl an Schülern, die im klassischen System zusammenfallen:
15-Punkte-System | 15 | 14 | 13 | 12 | 11 | 10 | 9 | 8 | 7 | 6 | 5 | 4 | 3 | 2 | 1 | 0 |
Anzahl | 1 | 0 | 3 | 6 | 7 | 8 | 5 | 4 | 4 | 1 | 3 | 1 | 2 | 0 | 0 | 1 |
Klassisches System | 1 | 2 | 3 | 4 | 5 | 6 |
Absolute Häufigkeit | 4 | 21 | 13 | 5 | 2 | 1 |
Damit hat Dein Lehrer die absoluten Häufigkeiten des klassischen Notensystems berechnet.
Säulenhöhe berechnen
Jetzt benötigst Du noch, die jeweiligen Säulenhöhen zu berechnen. Dafür verwendest Du die Formel zur Berechnung des Flächeninhaltes von Rechtecken:
Zur Erinnerung, die Formel zur Berechnung des Flächeninhaltes eines Rechtecks lautet: \(\text{A}=\text{h} \cdot \text{b}\)
Wenn Du jetzt für den Flächeninhalt die absolute Häufigkeit \({\color{#fa3273}\text{n}_\text{i}}\) und für die Breite die Klassenbreite \({\color{#00dcb4}\text{b}_\text{i}}\) einsetzt, erhältst Du:
\[{\color{#fa3273}\text{n}_\text{i}}=\text{h}\cdot{\color{#00dcb4}\text{b}_\text{i}}\]
Die Höhe entspricht jetzt der jeweiligen Säulenhöhe \({\color{#8363e2}\text{h}_\text{i}}\). Stellst Du den Term danach um, erhältst Du:
\[{\color{#8363e2}\text{h}_\text{i}}=\frac{{\color{#fa3273}\text{n}_\text{i}}}{{\color{#00dcb4}\text{b}_\text{i}}}\]
Verwendest Du in Deinem Histogramm die relative Häufigkeit, musst Du diese Formel noch einmal durch die gesamte Anzahl aller Messwerte teilen.
Jetzt braucht Dein Lehrer nur noch die Säulenhöhe zu berechnen, dafür wendet er die oben gegebene Formel
\({\color{#8363e2}\text{h}_\text{i}}=\frac{{\color{#fa3273}\text{n}_\text{i}}}{{\color{#00dcb4}\text{b}_\text{i}}}\) für alle sechs Noten beziehungsweise Klassen an:
\begin{align}\text{h}_1&=\frac{4}{3}=1,33\\\text{h}_2&=\frac{21}{3}=7\\\text{h}_3&=\frac{13}{3}=4,33\\\text{h}_4&=\frac{5}{3}=1,66\\\text{h}_5&=\frac{2}{3}=0,66\\\text{h}_6&=\frac{1}{1}=1\end{align}
Und damit hat Dein Lehrer auch schon alle Werte, die er benötigt.
Histogramm zeichnen
Hast Du die nötigen Werte berechnet, dann fehlt Dir nur noch das Histogramm zu zeichnen. Dafür zeichnest Du eine y-Achse an der Du die Häufigkeitsdichten und eine x-Achse an der Du die Ausprägungen abträgst.
Dann zeichnest Du jeweils die von Dir berechneten Säulen ein, zwischen diesen Säulen befinden sich keine Abstände, Du zeichnest sie also immer direkt nebeneinander.
Achte beim Zeichnen auf eine maßstabgetreue Beschriftung.
Histogramm interpretieren
Nun musst Du nicht in jeder Aufgabe ein Histogramm selbst erstellen, ein möglicher Aufgabentyp wäre es, dass Du ein gegebenes Histogramm interpretieren musst.
In dem Abschnitt von zuvor hast Du die drei Eigenschaften Klassenbreite, absolute und relative Häufigkeit sowie die Häufigkeitsdichte bereits kennengelernt und weißt deshalb auch, was die Höhe, Breite und der Flächeninhalt der Säulen bedeuten. Doch was kannst Du sonst in einem Histogramm ablesen?
Merkmal | Bedeutung |
Große Streubreite (Merkmale weit entfernt vom höchsten Wert) | In Fällen, bei denen Diversität gewünscht ist´, ist das ein positives Merkmal, es bedeutet, dass es viele verschiedene Merkmalsausprägungen gab. In einem Beispiel, indem jedoch ein bestimmtes Ergebnis gewünscht ist, bedeutet eine große Streubreite, dass viele Merkmale von diesem Ideal abweichen. |
Kleiner Stichprobenumfang | Ein kleiner Stichprobenumfang, besonders einer unter 20, kann bedeuten, dass die Darstellung durch ein Histogramm nicht angemessen die Verteilung der Grundgesamtheit widerspiegelt. |
Weit abgelegene Säulen | Eine Säule allein in einem großen Abstand zu dem Rest steht, ist mit großer Wahrscheinlichkwir ein Ausreißer, das heißt, es handelt sich entweder um einen Messfehler oder eine „Ausnahme“, die im Normalfall verworfen wird. |
Histogramm Beispiel
In diesem Abschnitt findest Du ein paar Beispiele für Histogramme bestimmter Wahrscheinlichkeitsverteilung.
Histogramm Normalverteilung
Die Normalverteilung, auch Gaußsche Glockenkurve, ist eine der gängigsten Wahrscheinlichkeitsverteilungen in der Statistik.
Eine Normalverteilung wird in der Statistik häufig für große Grundgesamtheit, wie die Körpergröße, angewendet. Der Kurvenverlauf ist symmetrisch um den Mittelwert, der in diesem Fall auch die meisten Ausprägungen hat, verteilt und bildet somit die namensgebende Glockenkurve.
Abb. 3: Normalverteilung Histogramm
Wird also wie in diesem Beispiel ein Graph einer Normalverteilung über das Histogramm gelegt, so sollten die Säulen ungefähr die gleiche Form wie der Graph erzeugen, um von einer Normalverteilung des Histogramms sprechen zu können.
Mehr Informationen zur Normalverteilung findest Du in der Erklärung Normalverteilung.
Histogramm Binomialverteilung
Die Binomialverteilung gehört zu der wichtigsten diskreten Wahrscheinlichkeitsverteilungen.
In einer Binomialverteilung sind nur zwei Ergebnisse relevant, der Erfolg und der Misserfolg. Es handelt sich also um ein „Entweder oder“ Experiment, wie der Münzwurf.
Doch wie würde das in einem Histogramm umgesetzt werden?
Nimmst Du Dir wieder das Beispiel des Münzwurfes vor, und wirfst die Münze 40-mal, dann erhältst Du ungefähr das folgende Diagramm:
Abbildung 4: Histogramm Binomialverteilung
Wie Du siehst, liegt der höchste Wert ungefähr bei 20. Das kommt daher, dass sie Chance etwa Kopf zu werfen, bei 50 % liegt. Wiederholt man den Versuch immer öfter, so wird es auch immer wahrscheinlicher, dass die Hälfte aller Würfe auf Kopf landet.
Im Fall einer Binomialverteilung gilt, dass diese durch eine Normalverteilung angenähert werden kann, wenn die Bedingung \(\sigma>3\) erfüllt ist. Wie Du im oberen Beispiel siehst, ähnelt dieses Diagramm das einer Normalverteilung – der Mittelwert ist der höchste Punkt und die Säulen fallen rechts und links gleichmäßig ab.
Alles Weitere zum Thema Binomialverteilung findest Du in der Erklärung Binomialverteilung
Histogramm Standardabweichung
Das Zeichen \(\sigma\) steht in der Stochastik für die Standardabweichung, diese ist ein Maß für die durchschnittliche Abweichung aller Ausprägungen vom Durchschnitt.
Berechnet wird \(\sigma\) mit der Wahrscheinlichkeit p und der Größe der Stichprobe n mit der Formel \(\sigma=\sqrt{\text{n}\cdot \text{p} \cdot (1-\text{p})}\)
Sollte jetzt in einem Histogramm die Bedingung \(\sigma>3\) erfüllt sein, dann kann diese wie oben bereits erwähnt durch eine Normalverteilung angenähert werden. Für die Standardabweichung des Histogramms bedeutet das, dass innerhalb des Abstands einer Standardabweichung ca. 68 % der Ausprägungen, und im Umkreis von zwei Standardabweichungen 95 % der Ausprägungen liegen.
Histogramm – Das Wichtigste
- Ein Histogramm ist eine Form, eine in Klassen aufgeteilte, absolute oder relative Häufigkeitsverteilung in einem speziellen Säulendiagramm zu veranschaulichen.
- Das Histogramm sieht einem klassischen Säulendiagramm sehr ähnlich, und zeichnet sich durch folgende Eigenschaften aus:
- Auf der x-Achse werden die in Klassen zusammengefassten Merkmalsausprägungen dargestellt und auf der y-Achse die Häufigkeit oder Häufigkeitsverteilung.
- Die Daten müssen vor Erstellen des Histogramms zuerst in entsprechende Klassen (Intervalle) unterteilt werden, diese Klassen stellen später die Breite der Säulen dar
- Die Fläche der Säulen gibt Dir bei relativen Häufigkeiten Auskunft über wie viele Messwerte in diese Klasse fallen
- Die Höhe der Säulen gibt die Häufigkeit einer Klasse wieder, bei einer relativen Häufigkeit kannst Du dort die Häufigkeitsdichte ablesen
- Um später auch ein Histogramm zeichnen zu können, musst Du zuerst drei Schritte abarbeiten.
- Daten in Klassen einteilen
- absolute oder relative Häufigkeit berechnen
- Säulenhöhe berechnen
- Hast Du die nötigen Werte berechnet, dann fehlt Dir nur noch das Histogramm zu zeichnen. Dafür zeichnest Du eine y-Achse an der Du die Häufigkeitsdichten und eine x-Achse an der Du die Ausprägungen abträgst. Dann zeichnest Du die von Dir berechneten Säulen, ohne Abstand zueinander ein. Achte beim Zeichnen auf eine maßstabgetreue Beschriftung.
- Aus einem Histogramm kannst Du neben der Klassenbreite, absoluten und relativen Häufigkeit sowie der Häufigkeitsdichte auch die Streubreite, den Stichprobenumfang und „Ausreißer“ ablesen
- Wird ein Graph einer Normalverteilung über das Histogramm gelegt, so sollten die Säulen ungefähr die gleiche Form wie der Graph erzeugen, um von einer Normalverteilung des Histogramms sprechen zu können.
Nachweise
- Larry Wasserman (2005). All of Nonparametric Statistics. Springer
Wie stellen wir sicher, dass unser Content korrekt und vertrauenswürdig ist?
Bei StudySmarter haben wir eine Lernplattform geschaffen, die Millionen von Studierende unterstützt. Lerne die Menschen kennen, die hart daran arbeiten, Fakten basierten Content zu liefern und sicherzustellen, dass er überprüft wird.
Content-Erstellungsprozess:
Lily Hulatt ist Digital Content Specialist mit über drei Jahren Erfahrung in Content-Strategie und Curriculum-Design. Sie hat 2022 ihren Doktortitel in Englischer Literatur an der Durham University erhalten, dort auch im Fachbereich Englische Studien unterrichtet und an verschiedenen Veröffentlichungen mitgewirkt. Lily ist Expertin für Englische Literatur, Englische Sprache, Geschichte und Philosophie.
Lerne Lily
kennen
Inhaltliche Qualität geprüft von:
Gabriel Freitas ist AI Engineer mit solider Erfahrung in Softwareentwicklung, maschinellen Lernalgorithmen und generativer KI, einschließlich Anwendungen großer Sprachmodelle (LLMs). Er hat Elektrotechnik an der Universität von São Paulo studiert und macht aktuell seinen MSc in Computertechnik an der Universität von Campinas mit Schwerpunkt auf maschinellem Lernen. Gabriel hat einen starken Hintergrund in Software-Engineering und hat an Projekten zu Computer Vision, Embedded AI und LLM-Anwendungen gearbeitet.
Lerne Gabriel
kennen