Applied Econometrics - Cheatsheet
Grundlagen ökonometrischer Methoden
Definition:
Verwendung statistischer Methoden zur Schätzung ökonomischer Modelle und Analyse von ökonomischen Daten.
Details:
- Klassische lineare Regressionsmodell (KLRM): \[ Y = \beta_0 + \beta_1X_1 + \beta_2X_2 + ... + \beta_kX_k + u \]
- Schätzverfahren: Kleinste-Quadrate-Schätzung (OLS)
- Assumptions: Linearität, Unabhängigkeit der Fehler, Homoskedastizität, keine perfekte Multikollinearität, Normalverteilung der Fehler
- Gütekriterien: Bestimmtheitsmaß (\( R^2 \)), Standardfehler, t-tests, p-Werte
- Tests: F-Test, Durbin-Watson-Test, Breusch-Pagan-Test
- Weitere Methoden: Instrument Variable (IV) Schätzung, Paneldatenanalyse, Zeitreihenanalyse
Einführung in einfache und multiple lineare Regression
Definition:
Einfache und multiple lineare Regression: Verfahren zur Untersuchung des Zusammenhangs zwischen einer abhängigen Variable und einer oder mehreren unabhängigen Variablen.
Details:
- Einfache lineare Regression: Modell \( Y = \beta_0 + \beta_1 X + \epsilon \)
- Multiple lineare Regression: Modell \( Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + ... + \beta_p X_p + \epsilon \)
- \( \beta_i \): Regressionskoeffizienten, die den Einfluss der unabhängigen Variablen quantifizieren
- \( \epsilon \): Fehlerterm, der die Differenz zwischen den beobachteten und den geschätzten Werten darstellt
- Annahme: Lineare Beziehung zwischen den Variablen
- Ziel: Schätzung der Regressionskoeffizienten mittels kleinster Quadrate (OLS)
- Gütemaße: \( R^2 \) (Bestimmtheitsmaß), Adjustiertes \( R^2 \), F-Statistik, t-Tests
Schätzung von Regressionskoeffizienten
Definition:
Schätzung der Koeffizienten in einem Regressionsmodell; Ziel ist es, die Beziehung zwischen abhängiger und unabhängiger Variable zu bestimmen.
Details:
- Wichtigste Methode: Kleinste-Quadrate-Schätzung (OLS)
- OLS-Formel: \[\beta = (X'X)^{-1}X'y\]
- In Matrixform: \[y = X\beta + \boldsymbol{u}\]
- Voraussetzungen für BLUE (Gauss-Markov): Lineare Beziehung, Unabhängigkeit der Fehler, Homoskedastizität, Erwartungswert der Fehler term Null.
Autoregressive Modelle (AR) und gleitende Durchschnitte (MA)
Definition:
Autoregressive Modelle (AR) nutzen Lag-Werte der abhängigen Variable, um zukünftige Werte vorherzusagen. Gleitende Durchschnitte (MA) verwenden vergangene Störgrößen zur Modellierung aktueller Werte.
Details:
- AR-Modell der Ordnung p: \[ Y_t = c + \phi_1 Y_{t-1} + \phi_2 Y_{t-2} + ... + \phi_p Y_{t-p} + \epsilon_t \]
- MA-Modell der Ordnung q: \[ Y_t = \mu + \epsilon_t + \theta_1 \epsilon_{t-1} + \theta_2 \epsilon_{t-2} + ... + \theta_q \epsilon_{t-q} \]
- ARMA(p, q)-Modell kombiniert beide: \[ Y_t = c + \phi_1 Y_{t-1} + ... + \phi_p Y_{t-p} + \epsilon_t + \theta_1 \epsilon_{t-1} + ... + \theta_q \epsilon_{t-q} \]
- Stationarität prüfen vor Modellanwendung
- Schätzung über Methoden wie OLS oder Maximum-Likelihood
Fixed-Effects- und Random-Effects-Modelle
Definition:
Fixed-Effects- und Random-Effects-Modelle werden verwendet, um unobserved heterogeneity in Paneldatenmodellen zu kontrollieren.
Details:
- Fixed-Effects-Modell: Kontrolliert für zeitinvariante, unbeobachtete Heterogenität durch Aufnahme von individuellen Dummy-Variablen.
- Formel: y_{it} = \beta X_{it} + \theta_i + u_{it}
- Random-Effects-Modell: Kontrolliert für unbeobachtete Heterogenität durch Annahme, dass individuelle Effekte zufällig verteilt sind und ermöglicht Modellierung wie zufällige Fehlerterm.
- Formel: y_{it} = \beta X_{it} + \theta_i + u_{it}, \text{ where } \theta_i \text{ is random}
- Hausman-Test: Stellt fest, ob Fixed- oder Random-Effects-Modell verwendet werden soll, indem es die Konsistenz der Schätzungen vergleicht.
Instrumentalvariablen (IV)-Methode
Definition:
Methode zur Schätzung kausaler Effekte in Gegenwart endogener Regressoren durch Instrumente, die mit den erklärenden Variablen korrelieren, aber nicht mit dem Fehlerterm.
Details:
- Verwendung, wenn erklärende Variable korreliert mit dem Fehlerterm (Endogenität)
- Instrumentenvariable: Korreliert mit endogener erklärender Variable aber nicht mit Fehlerterm
- Zwei-Schritt-Verfahren: 1. Schätze die endogene Variable mit dem Instrument, 2. Verwende geschätzte Werte im Regressionsmodell
- Formel für Instrumente: Sei Z das Instrument, dann \[ \beta_{IV} = \frac{Cov(Z,Y)}{Cov(Z,X)} \]
- Beliebte Tests: Sargan-Test (Overidentifikation), Durbin-Wu-Hausman-Test (Endogenität)
Tests auf Validität der Instrumente
Definition:
Tests zur Überprüfung, ob verwendete Instrumente tatsächlich exogen sind und die Endogenität des Modells korrekt adressieren.
Details:
- Hansen-J-Test: Überprüft die Nullhypothese, dass alle Instrumente gültig sind. Chi-Quadrat-Verteilung.
- Sargan-Test: Spezifizierter als Hansen-J-Test und überprüft ebenfalls auf Überidentifikationsbeschränkungen.
- F-Wert-Test: Überprüft die Relevanz der Instrumente. F-Wert > 10 empfehlenswert.
- Durbin-Wu-Hausman-Test: Testet auf das Vorliegen von Endogenität.
- Umsetzung: Natürliche Experimente, Kontrollvariablen, Verwendung von Lag-Variablen.
Zeitreihenprognosemethoden
Definition:
Vorhersagemethoden für zeitlich geordnete Daten.
Details:
- ARIMA-Modell: Autoregressive Integrated Moving Average
- Stationarität: Daten um Mittelwert und Varianz konstant
- AIC/BIC: Modellwahlkriterien
- Exponentielle Glättung: Gewichtung jüngerer Beobachtungen höher
- Trend und Saisonalität