Introduction to Econometrics - Cheatsheet
Definition und Bedeutung der Ökonometrie
Definition:
Ökonometrie: Anwendung statistischer Methoden auf ökonomische Daten zur empirischen Prüfung ökonomischer Theorien und Modelle.
Details:
- Verknüpfung von Theorie, Daten und statistischen Techniken
- Ziel: Kausalitätsanalysen, Vorhersage ökonomischer Variablen
- Wichtige Konzepte: Regression, Hypothesentests, Zeitreihenanalyse
Deskriptive Statistik
Definition:
Beschreibt und analysiert Daten, um Muster zu erkennen. Grundlage für weiterführende statistische Analysen.
Details:
- Lagemaße: Mittelwert (\(\bar{x}\)), Median, Modus
- Streuungsmaße: Varianz (\(s^2\)), Standardabweichung (\(s\)), Spannweite
- Formmaße: Schiefe, Kurtosis
- Grafische Darstellungen: Histogramm, Boxplot, Streudiagramm
Regressionsanalyse
Definition:
Regressionsanalyse: Methode zur Untersuchung der Beziehung zwischen einer abhängigen Variable und einer oder mehreren unabhängigen Variablen.
Details:
- Ziel: Schätzung der Koeffizienten im Regressionsmodell.
- Allgemeines lineares Regressionsmodell: \(Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + ... + \beta_p X_p + \epsilon\)
- \(Y\): abhängige Variable
- \(X_1, X_2, ..., X_p\): unabhängige Variablen
- \(\beta_0, \beta_1, \beta_2, ..., \beta_p\): Regressionskoeffizienten
- \(\epsilon\): Fehlerterm
- Punktschätzer für die Koeffizienten: \( \hat{\beta} = (X^TX)^{-1}X^TY \)
- Annahmen: Linearität, Unabhängigkeit der Fehler, Homoskedastizität, Normalverteilung der Fehler.
Stationäre und nicht-stationäre Zeitreihen
Definition:
Stationäre Zeitreihen: konstante Mittelwerte, Varianzen und Autokovarianzen unabhängig von der Zeit.Nicht-stationäre Zeitreihen: statistische Eigenschaften ändern sich im Zeitverlauf.
Details:
- Stationarität: Mittelwert, Varianz, Autokovarianz sind zeitinvariant.
- Nicht-Stationarität: Trends, Saisonalität, strukturelle Brüche.
- Dickey-Fuller-Test: Test auf Nicht-Stationarität.
- IKS (inklusive deterministischer Trend), KDS (kointegrierte deterministische Serie): Konzepte zur Analyse und Transformation in stationäre Zeitreihen.
- ARIMA-Modelle: Werkzeug zur Modellierung und Vorhersage (Box-Jenkins Methode).
ARIMA-Modelle (AutoRegressive Integrated Moving Average)
Definition:
ARIMA-Modelle kombinieren autoregressive (AR), differenzierte (I) und gleitende Durchschnittskomponenten (MA), um Zeitreihen zu modellieren und zu prognostizieren.
Details:
- AR: Vergangene Werte werden zur Vorhersage zukünftiger Werte herangezogen.
- I: Daten werden durch Differenzierung stationär gemacht.
- MA: Fehlerterme (Rauschen) aus vergangenen Zeitpunkten integriert.
- Modellnotation: ARIMA(p,d,q) mit p = Anzahl der AR-Terme, d = Anzahl der Differenzierungen, q = Anzahl der MA-Terme.
Multikollinearität und Heteroskedastizität
Definition:
Multikollinearität: Hohe Korrelation zwischen unabhängigen Variablen.Heteroskedastizität: Varianz der Fehlerterme ist nicht konstant.
Details:
- Multikollinearität führt zu instabilen Schätzungen der Regressionskoeffizienten
- VIF (\textit{Variance Inflation Factor}) > 10 oft als Indikator
- Heteroskedastizität verletzt eine Annahme der Kleinste-Quadrate-Schätzung
- Breusch-Pagan-Test und White-Test zum Erkennen von Heteroskedastizität
- Robuste Standardfehler zur Korrektur verwenden bei Heteroskedastizität