Panel and evaluation methods - Cheatsheet
Einführung in die Paneldatenanalyse
Definition:
Paneldatenanalyse kombiniert Zeitreihen- und Querschnittsdaten; untersucht Daten über mehrere Zeitperioden und Einheiten.
Details:
- Paneldaten: Daten, die von denselben Einheiten (z.B. Individuen, Unternehmen) über mehrere Zeitperioden gesammelt werden.
- Vorteile: Kontrolle für unbeobachtete Heterogenität, Erkenntnisse über Dynamik.
- Modelle: Fixed Effects (FE), Random Effects (RE), Difference-in-Differences (DiD).
- FE-Modell: \(y_{it} = \alpha_i + \beta X_{it} + \epsilon_{it}\)
- RE-Modell: \(y_{it} = \alpha + \beta X_{it} + u_i + \epsilon_{it}\)
- DiD-Ansatz: verwendet zur Schätzung von kausalen Effekten, vergleicht Behandlungseffekte vor und nach einer Intervention.
- Anwendungen: Wirtschaftswachstum, Arbeitsmarktanalysen, Gesundheitsökonomie.
Unterschiedliche Paneldatentypen
Definition:
Paneldaten enthalten Informationen zu mehreren Einheiten (Individuen, Unternehmen etc.) über mehrere Zeitperioden.
Details:
- Longitudinaldaten: Beobachtungen über dieselben Einheiten über die Zeit. Beispiel: dieselben Haushalte über mehrere Jahre.
- Balanierte Panels: Jede Einheit wird in jedem Zeitraum beobachtet.
- Unbalancierte Panels: Nicht jede Einheit wird in jedem Zeitraum beobachtet.
- Short Panels: Wenige Zeitperioden, viele Einheiten.
- Long Panels: Viele Zeitperioden, wenige Einheiten.
- Fixed Effects Modelle: Berücksichtigung von zeitinvarianten Charakteristika der Einheiten.
- Random Effects Modelle: Annahme, dass zeitinvariante Effekte zufällig sind und unkorreliert mit den Regressoren.
Fest- und Zufallseffekte
Definition:
Feste Effekte berücksichtigen unveränderliche individuelle Eigenschaften, Zufallseffekte berücksichtigen individuelle Unterschiede als Zufallsvariabilität.
Details:
- Feste Effekte: Annahme konstanter individueller Eigenschaften über die Zeit. Modell: \( y_{it} = \alpha_i + \beta x_{it} + \epsilon_{it} \)
- Zufallseffekte: Annahme, dass individuelle Unterschiede zufällig und unkorreliert mit den erklärenden Variablen sind. Modell: \( y_{it} = \alpha + \beta x_{it} + u_i + \epsilon_{it} \)
- Hausman-Test: Prüfung, ob die Differenz zwischen festen und Zufallseffekten signifikant ist.
- Vorteil fester Effekte: Kontrolle für unbeobachtete Heterogenität. Nachteil: Verlust von Freiheitsgraden.
- Vorteil Zufallseffekte: Effizientere Schätzungen, wenn Annahmen erfüllt sind.
Methoden der kausalen Inferenz
Definition:
Methoden zur Bestimmung kausaler Zusammenhänge zwischen Variablen.
Details:
- Unterscheidung von Korrelation und Kausalität.
- Verwendung von Instrumentvariablen (IV): Exogene Variation zur Identifikation von Kausalität.
- Quasi-experimentelle Ansätze: Difference-in-Differences (DiD), Regression Discontinuity Design (RDD).
- Matching-Methoden: Propensity Score Matching (PSM) zur Kontrolle von Kovariaten.
- Randomisierte Kontrollstudien (RCTs) als Goldstandard zur Identifikation kausaler Effekte.
- Formel für IV-Schätzung: \(\beta_{IV} = \frac{\text{Cov}(Z, Y)}{\text{Cov}(Z, X)}\)
Anwendungsbeispiele und Fallstudien
Definition:
Praktische Umsetzung und Analyse von Theorien und Methoden durch konkrete Beispiele aus der Praxis.
Details:
- Veranschaulichung theoretischer Konzepte
- Ermöglicht tiefere Einblicke und Verständnis für ökonomische Modelle
- Fördert kritisches Denken und Problemlösungsfähigkeiten
- Beispiele können reale Unternehmen, Märkte oder politische Maßnahmen umfassen
- Fallstudien oft in Gruppenarbeit und Diskussionen integriert
- Hilfreich für Anwendung von Paneldatenmethoden und Evaluationsmethoden
Fixed-Effects-Modelle
Definition:
Modell zur Kontrolle unbeobachteter Heterogenität in Paneldaten, indem individuelle Effekte entfernt werden.
Details:
- Nutze Differenzierung oder Within-Transformation, um fixe Effekte zu eliminieren.
- Ziel: Schätzung konsistenter Parameter trotz zeitinvarianter individueller Eigenschaften.
- Modell: \[ Y_{it} = \alpha_i + \beta X_{it} + \epsilon_{it} \]
- Annahme: \(\alpha_i\) (individueller Effekt) korreliert mit \(X_{it}\).
- Zeitraum- und Individueneffekte beachten.
- Für valide Resultate müssen die relevanten Hausman-Tests durchgeführt werden.
Random-Effects-Modelle
Definition:
Schätzung von Paneldatenmodellen, die individuelle Effekte als zufällige Abweichungen betrachten, anstatt sie als feste Parameter zu behandeln.
Details:
- Nutzung der Varianz innerhalb und zwischen den individuellen Einheiten, um Effekte zu identifizieren
- Effizienter als Fixed-Effects-Modell bei großen Datenmengen und wenn individuelle Effekte zufällig sind
- Erfordert Annahme, dass individuelle Effekte unkorreliert mit den Regressoren sind
- Hauptgleichung: \[ y_{it} = \beta x_{it} + u_i + u_{it} \]mit \[ u_i \sim N(0, \tau^2) \]
- Test auf Validität: Hausman-Test
Handling von zeitvariierenden Kovariaten
Definition:
Umgang mit Kovariaten, die über die Zeit variieren, in Paneldatenmodellen.
Details:
- Behandlung von zeitvariierenden Merkmalen in Längsschnittdaten
- Verwendung von Fixed-Effects (FE) oder Random-Effects (RE) Modellen zur Kontrolle unbeobachteter Heterogenität
- FE-Modelle eliminiert zeitinvariante Charakteristika durch Inkludierung von Individualdummies
- FE-Regressionsformel:
- RE-Modelle nutzen Streuung zwischen und innerhalb von Gruppen, Setzt Verteilungsannahmen voraus
- RE-Regressionsformel: i zu eliminieren
U.RG5a3- Definitionsannahmen von RE-Modellen: exogene Regression Variable per(n)17ten-kovichät re Prov