Statistics - Cheatsheet.pdf

Statistics - Cheatsheet
Statistics - Cheatsheet Häufigkeitsverteilungen und grafische Darstellungen Definition: Beschreibt die Verteilung von Datenpunkten in einem Datensatz und deren graphische Darstellung zur Visualisierung von Trends und Mustern. Details: Häufigkeitstabellen zeigen die Anzahl der Vorkommen jedes Wertes oder Intervalls. Relative Häufigkeit: \( P(x) = \frac{n_x}{N} \) Kumulierte Häufigkeit: \( K(x) = \s...

© StudySmarter 2024, all rights reserved.

Statistics - Cheatsheet

Häufigkeitsverteilungen und grafische Darstellungen

Definition:

Beschreibt die Verteilung von Datenpunkten in einem Datensatz und deren graphische Darstellung zur Visualisierung von Trends und Mustern.

Details:

  • Häufigkeitstabellen zeigen die Anzahl der Vorkommen jedes Wertes oder Intervalls.
  • Relative Häufigkeit: \( P(x) = \frac{n_x}{N} \)
  • Kumulierte Häufigkeit: \( K(x) = \sum_{i=1}^{x} f_i \)
  • Histogramme: Balkendiagramme für kontinuierliche Daten.
  • Stabdiagramme: Balkendiagramme für diskrete Daten.
  • Boxplots: Visualisierung der Verteilung mittels Quartilen und Ausreißern.
  • Streuungsdiagramme: Darstellung von Zusammenhängen zwischen zwei Variablen.
  • Kreisdiagramme: Visualisierung der relativen Anteile durch Segmente eines Kreises.
  • Flächendiagramme: Ähnlich wie Kreisdiagramme, aber mit gestapelten Bereichen.

Konfidenzintervalle

Definition:

Kennzahlenbereich, der den wahren Parameter einer Grundgesamtheit mit einer bestimmten Wahrscheinlichkeit überdeckt.

Details:

  • Formel für Konfidenzintervall für den Mittelwert (bekannter \sigma): \[ \bar{x} \pm z_{\alpha/2} \left( \frac{\sigma}{\sqrt{n}} \right) \]
  • \(\alpha\): Signifikanzniveau
  • \(z_{\alpha/2}\): z-Wert aus der Standardnormalverteilung
  • Formel für Konfidenzintervall für den Mittelwert (unbekannter \sigma): \[ \bar{x} \pm t_{\alpha/2, n-1} \left( \frac{s}{\sqrt{n}} \right) \]
  • \(t_{\alpha/2, n-1}\): t-Wert aus der t-Verteilung mit n-1 Freiheitsgraden
  • \(\bar{x}\): Stichprobenmittelwert
  • \(n\): Stichprobengröße
  • \(s\): Stichprobenstandardabweichung

Gesetz der großen Zahlen

Definition:

Das Gesetz der großen Zahlen besagt, dass sich der Mittelwert einer großen Anzahl unabhängiger, identisch verteilter Zufallsvariablen dem Erwartungswert der Einzelvariablen annähert.

Details:

  • Starkes Gesetz: Konvergenz fast sicher
  • Schwaches Gesetz: Konvergenz in Wahrscheinlichkeit
  • Formel (Schwaches Gesetz): \(\frac{1}{n} \sum_{i=1}^{n} X_i \xrightarrow{P} \mu\)
  • Erwartungswert \(\mu\)
    • Multiple lineare Regression

      Definition:

      Verfahren zur Schätzung der Beziehung zwischen einer abhängigen Variable und mehreren unabhängigen Variablen.

      Details:

      • Modell: \[ y = \beta_0 + \beta_1x_1 + \beta_2x_2 + ... + \beta_nx_n + \epsilon \]
      • \(y\): abhängige Variable
      • \(x_1, x_2, ..., x_n\): unabhängige Variablen
      • \(\beta_0\): Achsenabschnitt
      • \(\beta_1, \beta_2, ..., \beta_n\): Regressionskoeffizienten
      • \(\epsilon\): Fehlerterm
      • Minimalisierung der Summe der quadrierten Fehler zur Schätzung der \( \beta \)s

      t-Tests und z-Tests

      Definition:

      t-Tests und z-Tests sind statistische Methoden, um Hypothesen über den Mittelwert einer Population zu testen.

      Details:

      • t-Test wird verwendet, wenn die Stichprobengröße klein ist (n < 30) oder die Populationsvarianz unbekannt ist.
      • z-Test wird verwendet, wenn die Stichprobengröße groß ist (n ≥ 30) und die Populationsvarianz bekannt ist.
      • Formel für den z-Wert: \(z = \frac{\bar{x} - \mu}{\frac{\sigma}{\sqrt{n}}}\)
      • Formel für den t-Wert: \(t = \frac{\bar{x} - \mu}{\frac{s}{\sqrt{n}}}\), wobei \(s\) die Stichprobenstandardabweichung ist.
      • t-Tests sind robuster gegenüber kleineren Stichproben.
      • Hypothesen: Nullhypothese (\(H_0\)): kein Unterschied oder Effekt; Alternativhypothese (\(H_A\)): ein Unterschied oder Effekt existiert.
      • Signifikanzniveau \(\alpha\): üblich sind 0,05 oder 0,01.

      Bedingte Wahrscheinlichkeiten und Unabhängigkeit

      Definition:

      Wahrscheinlichkeit eines Ereignisses unter der Bedingung, dass ein anderes Ereignis eingetreten ist. Zwei Ereignisse sind unabhängig, wenn das Eintreten des einen Ereignisses keinen Einfluss auf die Wahrscheinlichkeit des anderen Ereignisses hat.

      Details:

      • Bedingte Wahrscheinlichkeit: \(P(A|B) = \frac{P(A \cap B)}{P(B)}\), sofern \(P(B) > 0\).
      • Zwei Ereignisse A und B sind unabhängig, wenn: \(P(A \cap B) = P(A) \cdot P(B)\).
      • Unabhängigkeit überprüfen: \(P(A|B) = P(A)\) oder \(P(B|A) = P(B)\).

      Signifikanzniveaus und p-Werte

      Definition:

      Konzepte zur Bewertung von Hypothesentests

      Details:

      • Signifikanzniveau (\alpha): Wahrscheinlichkeit, mit der ein Fehler 1. Art begangen wird.
      • Typische Werte: 0,01, 0,05, 0,1
      • p-Wert: Wahrscheinlichkeit, dass das beobachtete Ergebnis gleich oder extremer ist, gegeben H0 ist wahr.
      • Vergleich: Ist p-Wert < \alpha, dann H0 ablehnen.

      Intervallschätzung

      Definition:

      Intervallschätzung: Bestimmung eines Bereichs, der den wahren Wert eines Parameters mit einer bestimmten Wahrscheinlichkeit enthält.

      Details:

      • Konfidenzintervall: Bereich, der den wahren Parameter mit einer bestimmten Wahrscheinlichkeit enthält. Häufig verwendete Konfidenzlevel: 90 %, 95 %, 99 %.
      • Berechnung des Konfidenzintervalls: \[\text{Konfidenzintervall} = \bar{x} \pm z \frac{\text{s}}{\sqrt{n}} \] für Mittelwerte, wobei \(\bar{x}\) der Stichprobenmittelwert, \(\text{s}\) die Stichprobenstandardabweichung, \(n\) die Stichprobengröße und \(z\) der z-Wert für das gewählte Konfidenzniveau ist (z.B. 1.96 für 95%).
      • t-Verteilung verwenden, wenn Standardabweichung unbekannt und Stichprobengröße klein (n < 30).
      • Präzision der Schätzung steigt mit größerer Stichprobengröße.
Sign Up

Melde dich kostenlos an, um Zugriff auf das vollständige Dokument zu erhalten

Mit unserer kostenlosen Lernplattform erhältst du Zugang zu Millionen von Dokumenten, Karteikarten und Unterlagen.

Kostenloses Konto erstellen

Du hast bereits ein Konto? Anmelden