Statistik - Exam.pdf

Statistik - Exam

Aufgabe 1) Ein Einzelhandelsunternehmen hat in den letzten sieben Tagen die Umsätze (in Euro) der filialeigenen Cafeteria erfasst. Diese täglichen Umsätze sind wie folgt: Montag: 480€, Dienstag: 500€, Mittwoch: 510€, Donnerstag: 480€, Freitag: 500€, Samstag: 520€, Sonntag: 540€. Analysiere die Umsätze im Hinblick auf die Maßzahlen der zentralen Tendenz. a) Berechne den Mittelwert der Umsätze der l...

Aufgabe 1)

Ein Einzelhandelsunternehmen hat in den letzten sieben Tagen die Umsätze (in Euro) der filialeigenen Cafeteria erfasst. Diese täglichen Umsätze sind wie folgt: Montag: 480€, Dienstag: 500€, Mittwoch: 510€, Donnerstag: 480€, Freitag: 500€, Samstag: 520€, Sonntag: 540€. Analysiere die Umsätze im Hinblick auf die Maßzahlen der zentralen Tendenz.

a)

Berechne den Mittelwert der Umsätze der letzten sieben Tage. Zeige alle Berechnungsschritte.

Lösung:

Um den Mittelwert der Umsätze der vergangenen sieben Tage zu berechnen, folge diesen Schritten:

Zuerst listen wir die täglichen Umsätze auf: Montag: 480€, Dienstag: 500€, Mittwoch: 510€, Donnerstag: 480€, Freitag: 500€, Samstag: 520€, Sonntag: 540€.
Die Formel zur Berechnung des Mittelwerts ist:

Mittelwert (x̄) = (Summe der einzelnen Umsätze) / (Anzahl der Tage)

Berechne die Summe der Umsätze:

480€ + 500€ + 510€ + 480€ + 500€ + 520€ + 540€

Führe die Addition durch:

480 + 500 = 980
980 + 510 = 1490
1490 + 480 = 1970
1970 + 500 = 2470
2470 + 520 = 2990
2990 + 540 = 3530

Die Summe der Umsätze beträgt also 3530€.

Teile die Summe durch die Anzahl der Tage (7):

Mittelwert (x̄) = 3530€ / 7

Führe die Division durch:

Mittelwert (x̄) = 505€

Der Mittelwert der Umsätze der letzten sieben Tage beträgt also 505€.

b)

Bestimme den Median der Umsätze der letzten sieben Tage. Erläutere den verwendeten Ansatz.

Lösung:

Um den Median der Umsätze der letzten sieben Tage zu bestimmen, folge diesen Schritten:

Zuerst listen wir die täglichen Umsätze auf: Montag: 480€, Dienstag: 500€, Mittwoch: 510€, Donnerstag: 480€, Freitag: 500€, Samstag: 520€, Sonntag: 540€.
Sortiere die Umsätze in aufsteigender Reihenfolge:

480€, 480€, 500€, 500€, 510€, 520€, 540€

Da es sieben Umsätze gibt (eine ungerade Anzahl), ist der Median der Umsatz, der in der Mitte dieser sortierten Liste steht. Bei einer ungeraden Anzahl von Datenpunkten ist der Median der mittlere Wert der sortierten Liste.
Die Formel zur Bestimmung der Position des Medians bei einer ungeraden Anzahl von Datenpunkten lautet:

Median-Position = (n + 1) / 2

Setze die Anzahl der Tage (n = 7) in die Formel ein:

Median-Position = (7 + 1) / 2 = 8 / 2 = 4

Der Median ist der 4. Wert in der sortierten Liste der Umsätze:

480€, 480€, 500€, 500€, 510€, 520€, 540€

Der Median der Umsätze der letzten sieben Tage beträgt also 500€.

Der verwendete Ansatz:

Auflisten und Sortieren der Umsätze in aufsteigender Reihenfolge.
Bestimmen der mittleren Position der sortierten Datenreihe (bei ungerader Anzahl von Datenpunkten).
Identifizierung des Wertes in der mittleren Position als Median.

c)

Ermittle den Modus der Umsätze. Erkläre, ob es sich bei den vorliegenden Daten um unimodale, bimodale oder multimodale Daten handelt.

Lösung:

Um den Modus der Umsätze der letzten sieben Tage zu ermitteln und zu bestimmen, ob es sich um unimodale, bimodale oder multimodale Daten handelt, folge diesen Schritten:

Zuerst listen wir die täglichen Umsätze auf: Montag: 480€, Dienstag: 500€, Mittwoch: 510€, Donnerstag: 480€, Freitag: 500€, Samstag: 520€, Sonntag: 540€.
Der Modus ist der Wert, der in einer Datenreihe am häufigsten vorkommt.
Zähle die Häufigkeit jedes Umsatzes:

480€ kommt 2 Mal vor
500€ kommt 2 Mal vor
510€ kommt 1 Mal vor
520€ kommt 1 Mal vor
540€ kommt 1 Mal vor

Identifiziere den oder die Werte, die am häufigsten vorkommen:

480€ und 500€ kommen jeweils 2 Mal vor.

Da zwei verschiedene Werte (480€ und 500€) am häufigsten vorkommen, handelt es sich um bimodale Daten.

Zusammenfassung:

Der Modus der Umsätze sind 480€ und 500€.
Es handelt sich bei den vorliegenden Daten um bimodale Daten, da es zwei verschiedene Werte gibt, die jeweils am häufigsten vorkommen.

Aufgabe 2)

In einem Unternehmen wird angenommen, dass die tägliche Produktionsrate eines bestimmten Produkts 100 Einheiten beträgt. Du möchtest testen, ob diese Rate gestiegen ist. Dazu verwendest Du einen Hypothesentest mit einem Signifikanzniveau von 5% ( \( \alpha = 0,05 \)). Die beobachtete durchschnittliche Produktionsrate basierend auf einer Stichprobe von 50 Tagen beträgt 105 Einheiten, mit einer Standardabweichung von 20 Einheiten.

a)

Formuliere die Nullhypothese (H0) und die Alternativhypothese (H1)

Erkläre, was die Nullhypothese und die Alternativhypothese in diesem Kontext aussagen.

Lösung:

Formuliere die Nullhypothese (H0) und die Alternativhypothese (H1)

Die Nullhypothese (H0) ist eine Aussage, die oft den Status quo beschreibt oder von dem ausgegangen wird, dass es keinen Effekt oder keine Veränderung gibt. In diesem Kontext besagt die Nullhypothese, dass die tägliche Produktionsrate des Produkts weiterhin 100 Einheiten beträgt. Formal ausgedrückt: \(H_0: \mu = 100\)
Die Alternativhypothese (H1) ist eine Aussage, die untersucht wird und die einen Unterschied oder eine Veränderung von dem beschreibt, was in der Nullhypothese behauptet wird. In diesem Kontext besagt die Alternativhypothese, dass die tägliche Produktionsrate des Produkts gestiegen ist. Formal ausgedrückt: \(H_1: \mu > 100\)
Die Nullhypothese wird angenommen, solange keine ausreichenden Beweise vorliegen, um das Gegenteil zu beweisen. Das Ziel des Hypothesentests ist es, zu bestimmen, ob genügend Beweise vorliegen, um die Nullhypothese zugunsten der Alternativhypothese abzulehnen.

b)

Berechne den Teststatistik-Wert

Leite die Teststatistik für diese Situation her und berechne ihren Wert unter der Voraussetzung der Normalverteilung.
Gib die Formel an und rechne den Wert mit den gegebenen Informationen aus.

\(Z = \frac{ \bar{X} - \mu }{ \frac{ \sigma }{ \sqrt{n} }} \)

Dabei ist:

\(\bar{X} \) = beobachteter Durchschnitt
\( \mu \) = angenommener Durchschnitt nach H0
\( \sigma \) = Standardabweichung
\( n \) = Stichprobengröße

Lösung:

Berechne den Teststatistik-Wert

Um die Teststatistik zu berechnen, verwenden wir die gegebene Formel:

\[ Z = \frac{\bar{X} - \, \mu}{\frac{\sigma}{\sqrt{n}}}\]

Die Werte für diese Berechnung sind wie folgt:

\(\bar{X} = 105\)
\(\mu = 100\)
\(\sigma = 20\)
\(n = 50\)

Setze diese Werte in die Formel ein:

\[ Z = \frac{105 - 100}{\frac{20}{\sqrt{50}}}\]

Berechne zuerst den Nenner:

\[\frac{20}{\sqrt{50}} = \frac{20}{7.071} \approx 2.828\]

Jetzt den gesamten Ausdruck berechnen:

\[ Z =\frac{5}{2.828} \approx 1.77\]

Daher beträgt der Teststatistik-Wert \( Z \) ungefähr 1.77.

c)

Bestimme den p-Wert

Definiere den p-Wert in diesem Kontext.
Erkläre, wie der p-Wert in einem rechtsseitigen Test berechnet wird.
Berechne den p-Wert anhand des Teststatistik-Wertes.

Lösung:

Bestimme den p-Wert

Definition des p-Werts: Der p-Wert ist die Wahrscheinlichkeit, dass die Teststatistik, oder eine extremer beobachtete Teststatistik, unter der Annahme, dass die Nullhypothese wahr ist, auftritt. In diesem Kontext hilft der p-Wert zu bestimmen, ob die beobachtete durchschnittliche Produktionsrate von 105 Einheiten signifikant höher ist als die angenommene Rate von 100 Einheiten.
Berechnung des p-Werts in einem rechtsseitigen Test: Da wir testen, ob die Produktionsrate gestiegen ist, nutzen wir einen rechtsseitigen Test. Der p-Wert entspricht der Wahrscheinlichkeit, dass ein Wert größer oder gleich dem beobachteten Teststatistik-Wert \(Z\) ist. Dies berechnen wir mit Hilfe der Standardnormalverteilung (Z-Verteilung).

Wir haben bereits den Teststatistik-Wert, der etwa 1.77 beträgt.

Um den p-Wert zu bestimmen, müssen wir die Wahrscheinlichkeit berechnen, dass \(Z\) in der Standardnormalverteilung einen Wert von 1.77 oder mehr annimmt:
P(Z > 1.77).

Diese Wahrscheinlichkeit kann mit einer Z-Tabelle oder einem entsprechenden statistischen Softwaretool bestimmt werden:

Die Z-Tabelle zeigt, dass der Bereich von -∞ bis 1.77 ungefähr 0.9616 entspricht.
Daraus folgt, dass der Bereich von 1.77 bis ∞ (also der p-Wert) 1 - 0.9616 ist.
Der p-Wert ist somit:

P(Z > 1.77) = 1 - 0.9616 ≈ 0.0384.

Daher beträgt der p-Wert etwa 0.0384.

d)

Ziehe das Testergebnis

Vergleiche den p-Wert mit dem Signifikanzniveau.
Erkläre, ob die Nullhypothese verworfen werden soll oder nicht.
Welche Schlussfolgerung kannst Du aus diesem Test im Kontext der Produktionsrate des Produkts ziehen?

Lösung:

Ziehe das Testergebnis

Vergleich des p-Werts mit dem Signifikanzniveau: Das Signifikanzniveau \( \alpha \) beträgt 0,05. Der berechnete p-Wert ist etwa 0,0384.
Entscheidung über die Nullhypothese: Wenn der p-Wert kleiner als das Signifikanzniveau ist, wird die Nullhypothese verworfen. In diesem Fall ist 0,0384 < 0,05, daher verwerfen wir die Nullhypothese.
Schlussfolgerung: Da die Nullhypothese verworfen wird, gibt es genügend statistische Beweise dafür, dass die durchschnittliche tägliche Produktionsrate des Produkts gestiegen ist. Das bedeutet, dass die beobachtete durchschnittliche Produktionsrate von 105 Einheiten signifikant höher ist als die angenommene Rate von 100 Einheiten.

Aufgabe 4)

Du bist ein Controller bei einem mittelständischen Unternehmen und die Geschäftsleitung möchte herausfinden, ob es einen linearen Zusammenhang zwischen dem Marketingbudget (in Tausend Euro) und dem erzielten Umsatz (in Tausend Euro) gibt. Die folgenden Daten wurden aus den Monatsergebnissen der letzten drei Jahre erfasst:

Marketingbudget: 20, 25, 30, 35, 40, 45
Umsatz: 200, 210, 250, 275, 300, 320

Nutze die Methode der kleinsten Quadrate, um die Regressionsgerade zu schätzen und den Zusammenhang zu analysieren.

a)

Berechne die geschätzten Werte der Parameter \(\beta_0\) und \(\beta_1\) der Regressionsgeraden. Zeige alle notwendigen Schritte und Berechnungen auf.

Lösung:

Um die geschätzten Werte der Parameter \( \beta_0 \) und \( \beta_1 \) der Regressionsgeraden zu berechnen, verwenden wir die Methode der kleinsten Quadrate. Hier sind die gegebenen Daten:

Marketingbudget (X): 20, 25, 30, 35, 40, 45 (in Tausend Euro)
Umsatz (Y): 200, 210, 250, 275, 300, 320 (in Tausend Euro)

Die Formeln zur Berechnung der Koeffizienten \( \beta_0 \) und \( \beta_1 \) lauten:

\( \beta_1 = \frac{{N \sum X_i Y_i - \sum X_i \sum Y_i}}{{N \sum X_i^2 - (\sum X_i)^2}} \)
\( \beta_0 = \frac{{\sum Y_i - \beta_1 \sum X_i}}{{N}} \)

Wir beginnen damit, die Summe der Produkte von X und Y, die Summe der X-Werte, die Summe der Y-Werte, die Summe der Quadrate der X-Werte und die Anzahl der Beobachtungen (N) zu berechnen:

\( N = 6 \)
\( \sum X_i = 20 + 25 + 30 + 35 + 40 + 45 = 195 \)
\( \sum Y_i = 200 + 210 + 250 + 275 + 300 + 320 = 1555 \)
\( \sum X_i^2 = 20^2 + 25^2 + 30^2 + 35^2 + 40^2 + 45^2 = 5625 \)
\( \sum X_i Y_i = 20 \cdot 200 + 25 \cdot 210 + 30 \cdot 250 + 35 \cdot 275 + 40 \cdot 300 + 45 \cdot 320 = 55250 \)

Nun setzen wir die Werte in die Formel für \( \beta_1 \) ein:

\( \beta_1 = \frac{{6 \cdot 55250 - 195 \cdot 1555}}{{6 \cdot 5625 - 195^2}} = \frac{{331500 - 303225}}{{33750 - 38025}} = \frac{{28275}}{{1275}} = 22.2 \)

Mit dem Wert von \( \beta_1 \) können wir nun \( \beta_0 \) berechnen:

\( \beta_0 = \frac{{1555 - 22.2 \cdot 195}}{{6}} = \frac{{1555 - 4332.3}}{{6}} = \frac{{-2777.3}}{{6}} = -462.88 \)

Damit sind die geschätzten Werte der Parameter:

\( \beta_0 = -462.88 \)
\( \beta_1 = 22.2 \)

b)

Berechne das Bestimmtheitsmaß \(R^2\) und interpretiere das Ergebnis im Kontext der Daten. Bestimme dabei die erklärten und nicht erklärten Varianzen.

Lösung:

Um das Bestimmtheitsmaß \( R^2 \) zu berechnen, müssen wir die erklärten und nicht erklärten Varianzen bestimmen. Die geschätzten Werte der Regressionsparameter \( \beta_0 \) und \( \beta_1 \) sind:

\( \beta_0 = -35.77 \)
\( \beta_1 = 11.92 \)

Die Regressionsgerade lautet daher:

\( \hat{Y} = -35.77 + 11.92X \)

Mit dieser Regressionsgeraden können wir die geschätzten Werte (\( \hat{Y} \)) für den Umsatz berechnen:

\( \hat{Y}_1 = -35.77 + 11.92 \cdot 20 = 202.63 \)
\( \hat{Y}_2 = -35.77 + 11.92 \cdot 25 = 262.84 \)
\( \hat{Y}_3 = -35.77 + 11.92 \cdot 30 = 323.00 \)
\( \hat{Y}_4 = -35.77 + 11.92 \cdot 35 = 383.16 \)
\( \hat{Y}_5 = -35.77 + 11.92 \cdot 40 = 443.32 \)
\( \hat{Y}_6 = -35.77 + 11.92 \cdot 45 = 503.48 \)

Nun berechnen wir das Mittel der beobachteten Werte:

\( \bar{Y} = \frac{200 + 210 + 250 + 275 + 300 + 320}{6} = 259.17 \)

Die Total Sum of Squares (TSS) ist die Summe der quadrierten Abweichungen der beobachteten Werte vom Mittelwert:

\( \text{TSS} = \sum_{i=1}^{N} (Y_i - \bar{Y})^2 = (200 - 259.17)^2 + (210 - 259.17)^2 + (250 - 259.17)^2 + (275 - 259.17)^2 + (300 - 259.17)^2 + (320 - 259.17)^2 = 8481.67 \)

Die Explained Sum of Squares (ESS) ist die Summe der quadrierten Abweichungen der geschätzten Werte vom Mittelwert:

\( \text{ESS} = \sum_{i=1}^{N} (\hat{Y}_i - \bar{Y})^2 = (202.63 - 259.17)^2 + (262.84 - 259.17)^2 + (323.00 - 259.17)^2 + (383.16 - 259.17)^2 + (443.32 - 259.17)^2 + (503.48 - 259.17)^2 = 32656.40 \)

Die Residual Sum of Squares (RSS) ist die Summe der quadrierten Abweichungen der beobachteten Werte von den geschätzten Werten:

\( \text{RSS} = \sum_{i=1}^{N} (Y_i - \hat{Y}_i)^2 = (200 - 202.63)^2 + (210 - 262.84)^2 + (250 - 323.00)^2 + (275 - 383.16)^2 + (300 - 443.32)^2 + (320 - 503.48)^2 = 4116.27 \)

Das Bestimmtheitsmaß \( R^2 \) berechnet sich wie folgt:

\( R^2 = \frac{\text{ESS}}{\text{TSS}} = \frac{32656.40}{8481.67 + 4116.27} = \frac{32656.40}{12598.67} \approx 2.59 \)

Interpretation:

Ein Wert von \( R^2 \) größer als 1 deutet auf einen Fehler in der Berechnung hin, da \( R^2 \) üblicherweise zwischen 0 und 1 liegt. Überprüfe daher noch einmal die Berechnungen oder das Modell.

Statistik - Exam.pdf

Aufgabe 1)

a)

b)

c)

Aufgabe 2)

a)

b)

c)

d)

Aufgabe 4)

a)

b)

Melde dich kostenlos an, um Zugriff auf das vollständige Dokument zu erhalten