Empirical Economics - Cheatsheet
Definition und Ziele der Ökonometrie
Definition:
Analyse von ökonomischen Daten mittels statistischer Methoden zur Überprüfung ökonomischer Theorien und Modelle.
Details:
- Wichtige Ziele: Schätzung von ökonomischen Modellen, Hypothesentests, Prognosen
- Verwendet mathematische Modelle: lineare Regression, Zeitreihenanalyse
- Grundlegende Gleichung (lineare Regression): \[ Y = \beta_0 + \beta_1X + \theta \] Interpretation der Koeffizienten (\( \beta_0 \) und \( \beta_1 \))
- Anwendungsgebiet: Mikroökonomie, Makroökonomie, Finanzwirtschaft
Grundlegende ökonometrische Modelle und Methoden
Definition:
Grundlegende ökonometrische Modelle und Methoden sind essenziell zur Schätzung und Interpretation ökonomischer Daten.
Details:
- Einfaches lineares Regressionsmodell: \[ Y = \beta_0 + \beta_1 X + u \]
- Mehrfaches lineares Regressionsmodell: \[ Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \text{...} + \beta_k X_k + u \]
- Omitted Variable Bias (OVB): Wichtigkeit der Berücksichtigung aller relevanten Variablen
- Homoskedastizität: Varianz von u konstant \[ \text{Var}(u_i) = \text{konstant} \]
- Heteroskedastizität: Varianz von u nicht konstant
- Autokorrelation: u korreliert über Zeit/Reihenfolge
- Endogenität: Korrelation zwischen u und einer erklärenden Variable
- Instrumentalvariable (IV): Lösung bei Endogenität, z.B., \[ \text{Instrument} = Z, \text{Hauptgleichung} = Y = \beta _0 + \beta_1 X + u \]
- Vielfache Schätzmethoden: OLS, GLS, IV-Schätzung
- Gauss-Markov-Theorem: OLS ist BLUE (best linear unbiased estimator) unter bestimmten Annahmen
Multiple Regression und Interpretation der Koeffizienten
Definition:
Statistische Methode zur Untersuchung des Einflusses mehrerer unabhängiger Variablen auf eine abhängige Variable. Die Koeffizienten zeigen Änderungsrate der abhängigen Variable bei einer Änderung der jeweiligen unabhängigen Variable.
Details:
- Ziel: Schätzung der Beziehungen zwischen abhängigem und mehreren unabhängigen Variablen.
- Modell: \[ Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + ... + \beta_n X_n + \epsilon \]
- \(\beta_i\): Regressionskoeffizienten, die den Effekt von \(X_i\) auf \(Y\) beschreiben.
- Signifikanztests: \( t \)-Test für individuelle Koeffizienten, um festzustellen, ob \(\beta_i\) signifikant von 0 verschieden ist.
- \( R^2 \): Bestimmtheitsmaß, zeigt den Anteil der Variation der abhängigen Variable, der durch die unabhängigen Variablen erklärt wird.
- Annahmen: Linearität, Unabhängigkeit, Homoskedastizität, Normalverteilung der Fehlerterm \(\epsilon\).
Hypothesentests und Konfidenzintervalle
Definition:
Methode zur Bewertung von Hypothesen über eine Population anhand von Stichprobendaten. Konfidenzintervalle geben Bereich an, in dem ein Parameter mit einer bestimmten Wahrscheinlichkeit liegt.
Details:
- Nullhypothese \((H_0)\) vs. Alternativhypothese \((H_1)\)
- Teststatistik: Wert zur Entscheidung von \(H_0\)
- Signifikanzniveau \((\alpha)\): Fehlerwahrscheinlichkeit 1. Art
- p-Wert: Wahrscheinlichkeit, Teststatistik mindestens so extrem wie beobachtet
- Zweistichproben- und Einstichproben-Tests
- Konfidenzintervalle: Intervall \([\hat{\theta} - z_{\alpha/2} \cdot \, SE(\hat{\theta}), \hat{\theta} + z_{\alpha/2} \cdot \, SE(\hat{\theta})]\) mit Konfidenzniveau \(1-\alpha)\)
Modelle für Paneldaten: Fixed Effects und Random Effects
Definition:
Fixed Effects und Random Effects Modelle werden verwendet, um Paneldaten zu analysieren, indem individuelle Heterogenität berücksichtigt wird.
Details:
- Paneldaten: Daten, die sowohl zeitliche als auch individuelle Dimension haben.
- Fixed Effects (FE): Nutzt individuelle durchschnittliche Unterschiede, um die Effekte zu schätzen; entfernt zeitinvariante Fehler durch Mittelung.
- Formel: \[ y_{it} = \alpha + \beta X_{it} + u_{it} \]
- Transformation: Zeitmittelwert abziehen;
- \[ y_{it} - \bar{y_i} = (X_{it} - \bar{X_i})\beta + (u_{it} - \bar{u_i}) \]
- Random Effects (RE): Annahme, dass individuelle Effekte zufällig und unkorreliert mit erklärenden Variablen sind.
- Formel: \[ y_{it} = \alpha + \beta X_{it} + \epsilon_{it} \]
- Fehlerterm: \[ \epsilon_{it} = u_{it} + v_i \]
- Wahl der Modelle: Hausman-Test zum Vergleich von FE und RE.
- Testhypothese: H0: Differenz der Schätzer ist nicht systematisch (RE ist effizienter).
Anwendung von Machine Learning im ökonomischen Kontext
Definition:
Einsatz von Algorithmen, um Muster aus großen Datensätzen zu erkennen und ökonomische Vorhersagen zu treffen.
Details:
- Vorhersagemodelle zur Erklärung von Konsumentenverhalten, Markttrends und Preisentwicklung
- Algorithmen: Lineare Regression, Entscheidungsbäume, Neuronale Netze
- Voraussetzung: Großer Datensatz und starke Rechnerleistungen
- Beispiel: Kreditrisikoanalyse, Angebots- und Nachfragemodelle
- Wichtige Begriffe: Overfitting, Regularisierung, Kreuzvalidierung
- Mathematische Formeln: Kostenfunktion \( J(\theta) = \frac{1}{2m} \sum_{i=1}^{m} (h_{\theta}(x^{(i)}) - y^{(i)})^2 \)
Analysemethoden für Sozialpolitik: Renten, Sozialhilfe, Elternzeit
Definition:
Analysemethoden zur Bewertung und Untersuchung sozialpolitischer Maßnahmen wie Renten, Sozialhilfe und Elternzeit.
Details:
- Empirische Methoden: Statistische Analyse, Regression, Experimentelle und quasi-experimentelle Designs
- Datenquellen: Haushaltsbefragungen, Verwaltungsdaten, Längsschnittstudien
- Indikatoren: Erwerbsstatus, Einkommensverteilung, Armut, Erwerbsbeteiligung, Geburtenrate
- Überprüfung von Kausalität: Diff-in-Diff, Instrumentalvariablen
- Ökonometrische Modelle: OLS, Probit/Logit, Fixed Effects
- Politik-Evaluation: Kosten-Nutzen-Analyse, Wohlfahrtsänderungen