Statistik und Verhaltensbiologie - Cheatsheet
Berechnung von Mittelwerten, Median und Modus
Definition:
Berechnung von Mittelwert, Median und Modus für die statistische Analyse von Daten.
Details:
- Mittelwert: \'Durchschnittswert einer Datenreihe\'. Berechnung: \(\bar{x} = \frac{1}{n} \sum_{i=1}^n x_i\).
- Median: \'Zentralwert einer geordneten Datenreihe\'. Für ungerade Anzahl: mittlerer Wert, für gerade Anzahl: Durchschnitt der beiden mittleren Werte.
- Modus: \'Häufigster Wert einer Datenreihe\'. Datensatz kann keinen, einen oder mehrere Modi haben.
Konfidenzintervalle und ihre Bedeutung
Definition:
Ein Konfidenzintervall (KI) gibt den Bereich an, in dem ein unbekannter Parameter einer Population mit einer bestimmten Wahrscheinlichkeit liegt, basierend auf einer Stichprobe.
Details:
- Gängige Konfidenzniveaus: 90%, 95%, 99%
- Berechnung: \[\bar{x} \pm z \cdot \frac{\sigma}{\sqrt{n}}\]
- \(\bar{x}\) = Stichprobenmittelwert
- \(z\) = z-Wert für gewünschtes Konfidenzniveau
- \(\sigma\) = Standardabweichung
- \(n\) = Stichprobengröße
- Größeres Konfidenzniveau -> breiteres KI
- Wichtige Rolle in Hypothesentests und Dateninterpretation
Fehlerarten in Hypothesentests (Fehler 1. Art und Fehler 2. Art)
Definition:
Fehlerarten in Hypothesentests beschreiben die möglichen Fehlentscheidungen beim Testen von Hypothesen.
Details:
- Fehler 1. Art (α-Fehler): Nullhypothese wird fälschlicherweise abgelehnt. Wahrscheinlichkeit: \(\text{P}(\text{Fehler 1. Art}) = \alpha\).
- Fehler 2. Art (β-Fehler): Nullhypothese wird fälschlicherweise nicht abgelehnt. Wahrscheinlichkeit: \(\text{P}(\text{Fehler 2. Art}) = \beta\).
- Signifikanzniveau: Typischerweise \(\alpha = 0.05\) oder \(\alpha = 0.01\).
- Teststärke: Wahrscheinlichkeit, die Nullhypothese korrekt abzulehnen: \(1 - \beta\).
Evolutionäre Erklärungen für Verhalten
Definition:
Erklärung von Verhaltensweise durch evolutionäre Prozesse wie natürliche Selektion und Anpassung.
Details:
- Verhalten trägt zur Fitness bei
- Adaptive Werte von Verhalten
- Überlebens- und Reproduktionsvorteile
- Kosten-Nutzen-Analyse
- Optimierung von Ressourcennutzung
Einführung in statistische Software (z.B. R, SPSS)
Definition:
Einführung in statistische Software (z.B. R, SPSS) - Grundlagen zur Nutzung von Software für statistische Analysen, speziell in der Verhaltensbiologie.
Details:
- R: freie Programmiersprache und Software-Umgebung für statistische Datenanalyse und Grafik
- SPSS: kommerzielle Software für statistische Analysen, weit verbreitet in Sozialwissenschaften
- Grundlagen: Datenimport, Datenmanipulation, Deskriptive Statistik, Visualisierung
- R: Nutzung von Paketen wie ggplot2 für Grafik, dplyr für Datenmanipulation
- SPSS: Nutzung von Menüs und Syntax für Analysen, einfache Deskriptive Statistiken mit Frequenztabellen und Kreuztabellen
- Wichtige Befehle in R: \texttt{summary()}, \texttt{plot()}, \texttt{lm()}
- Wichtige Funktionen in SPSS: Deskriptive Statistik, t-Tests, ANOVA, Regression
Einfache und multiple lineare Regression
Definition:
Einfache Regression: Modell zur Vorhersage einer abhängigen Variable durch eine unabhängige Variable. Multiple Regression: Erweiterung zur Vorhersage einer abhängigen Variable durch mehrere unabhängige Variablen.
Details:
- Einfache lineare Regression: Modell: \(Y = \beta_0 + \beta_1X + \epsilon\), wobei \(Y\) die abhängige Variable, \(X\) die unabhängige Variable, \(\beta_0\) der Achsenabschnitt, \(\beta_1\) die Steigung und \(\epsilon\) der Fehlerterm ist.
- Multiple lineare Regression: Modell: \(Y = \beta_0 + \beta_1X_1 + \beta_2X_2 + ... + \beta_pX_p + \epsilon\), wobei \(Y\) die abhängige Variable, \(X_1, X_2, ..., X_p\) die unabhängigen Variablen, \(\beta_0\) der Achsenabschnitt, \(\beta_1, \beta_2, ..., \beta_p\) die Regressionskoeffizienten und \(\epsilon\) der Fehlerterm sind.
- Voraussetzungen: Linearität, Unabhängigkeit, Homoskedastizität, Normalverteilung der Fehlerterme.
- Schätzmethoden: Kleinste-Quadrate-Methode (OLS).
- Güte des Modells: Bestimmtheitsmaß \(R^2\), Adjustiertes \(R^2\), F-Test.
Verständnis von Streuungsmaßen wie Varianz und Standardabweichung
Definition:
Verständnis von Streuungsmaßen (Varianz und Standardabweichung): Gibt an, wie stark die Werte einer Stichprobe um ihren Mittelwert streuen.
Details:
- Varianz (\text{Var}(X)): Durchschnitt der quadrierten Abweichungen vom Mittelwert. Formel: \ \text{Var}(X) = \frac{1}{N} \sum_{i=1}^N (X_i - \overline{X})^2
- Standardabweichung (\text{Std}(X)): Quadratwurzel der Varianz. Formel: \ \text{Std}(X) = \sqrt{\text{Var}(X)}
- Verwendung: Bestimmen der Datenverteilung.
- Je größer Varianz/Standardabweichung, desto größer die Streuung.
Modellanpassung und Diagnostik
Definition:
Verfahren zur Bewertung und Verbesserung der Leistung statistischer Modelle.
Details:
- Modellanpassung: Überprüfung der Güte des Modells. Formeln/Methoden: Residuenanalyse, R-Squared, AIC/BIC.
- Diagnostik: Identifikation von Problemen und Verbesserungsvorschlägen. Methoden: QQ-Plot, Cook-Distance, Einflussstatistiken.
- Wichtige Formeln:
- Residuen: \( e_i = y_i - \hat{y_i} \)
- R-Squared: \( R^2 = 1 - \frac{\sum (y_i - \hat{y_i})^2}{\sum (y_i - \overline{y})^2} \)
- AIC: \( AIC = 2k - 2 \ln(L) \)
- BIC: \( BIC = \ln (n)k - 2 \ln(L) \)