Applied empirical health economics - Cheatsheet
Endogenität und ihre Auswirkungen auf Schätzungen in ökonometrischen Modellen
Definition:
Endogenität: Situation, in der eine oder mehrere erklärende Variablen mit dem Fehlerterm korreliert sind; führt zu verzerrten und inkonsistenten Schätzungen.
Details:
- Hauptursachen: Umgekehrte Kausalität, ausgelassene Variablen, Messfehler
- Folgen: Verzerrte und inkonsistente Schätzungen der Koeffizienten
- Tests: Durbin-Wu-Hausman-Test für Endogenität
- Lösungen: Instrumentalvariablen-Schätzung (IV), Kontrollvariablen, Paneldatenmodelle
- Beispiel: Bei der Untersuchung des Zusammenhangs zwischen Einkommen und Gesundheitsausgaben; umgekehrte Kausalität möglich
Konstruktion und Auswahl von Instrumentalvariablen
Definition:
Bau und Auswahl relevanter Instrumentalvariablen (IVs) für Endogenitätsprobleme in empirischen Modellen.
Details:
- IV muss exogen sein: keine Korrelation mit Fehlerterm.
- IV muss relevant sein: stark korreliert mit der endogenen erklärenden Variable.
- Overidentifikationstest: Überprüfen, ob zusätzliche IVs valide sind (Sargan-Test).
- Hausman-Test: Vergleich von IV- und OLS-Schätzer, um Endogenität zu prüfen.
- Formel für IV-Schätzer: \ \ \[ \hat{\beta}_{IV} = \left( Z'X \right)^{-1} Z'y \]
Relevanz- und Exogenitätstests für Instrumentalvariablen
Definition:
Tests zur Überprüfung, ob Instrumente relevant und exogen sind.
Details:
- Relevanztest (F-Test): Überprüft, ob die Instrumente signifikant mit den endogenen Regressoren korreliert sind.
- Formel: \[ Y = X\beta + Z\theta + u \ H_0: \theta = 0\]
- Exogenitätstest (Hansen-J-Test): Prüft, ob die Instrumente unkorreliert mit dem Fehlerterm sind.
- Formel: \[ J = n \times R^2\]
Erkennung und Behebung von Heteroskedastizität mittels robuster Standardfehler
Definition:
Erkennung und Behebung von Heteroskedastizität durch die Verwendung robuster Standardfehler
Details:
- Heteroskedastizität: Varianz der Fehlerterme ist nicht konstant
- Führt zu ineffizienten Schätzungen und verfälschten Testergebnissen
- Breusch-Pagan-Test oder White-Test zur Erkennung verwenden
- Robuste Standardfehler korrigieren die Varianz-Kovarianz-Matrix
- Formel für robuste Standardfehler: \(V(\beta)= (X'X)^{-1}X'SX(X'X)^{-1}\)
Breusch-Pagan-Test zur Diagnose von Heteroskedastizität
Definition:
Test zur Überprüfung, ob die Varianz der Residuen eines Regressionsmodells konstant ist
Details:
- Formel für die OLS-Residuen: \(\tilde{u_i} = y_i - X_i'\tilde{\beta}\)
- Regressiere die quadrierten Residuen auf die erklärenden Variablen: \(\tilde{u_i}^2 = \alpha_0 + \alpha_1 X_{i1} + ... + \alpha_k X_{ik} + v_i\)
- Teste die Nullhypothese: \(H_0: \alpha_1 = ... = \alpha_k = 0\) (keine Heteroskedastizität)
- Berechne den BP-Teststatistik: \( BP = \frac{NR^2}{2}\), folgt einer \( \chi^2 \)-Verteilung mit \(k\) Freiheitsgraden
- Vergleiche BP-Wert mit kritischem Wert aus \( \chi^2 \)-Tabelle
Grundprinzipien und Implementierung der Maximum-Likelihood-Schätzung
Definition:
Methode zur Schätzung der Parameter eines statistischen Modells durch Maximierung der Likelihood-Funktion, die die Wahrscheinlichkeit der beobachteten Daten darstellt.
Details:
- Formuliere die Likelihood-Funktion: \( L(\theta) = P(X_1 = x_1, X_2 = x_2, \ldots, X_n = x_n | \theta) \)
- Maximierung der Likelihood durch Ableitung: \( \frac{\partial L(\theta)}{\partial \theta} = 0 \)
- Log-Likelihood verwenden: \( \ell(\theta) = \ln(L(\theta)) \)
- Berechne Maximum durch Lösung der Gleichung: \( \frac{\partial \ell(\theta)}{\partial \theta} = 0 \)
- Häufige Anwendung in der Regressionsanalyse und statistischen Inferenz
Anwendungen der Panel-Daten-Analyse auf Gesundheitsdaten
Definition:
Panel-Daten-Analyse verwendet, um Änderungen über die Zeit und zwischen Individuen in Gesundheitsdaten zu untersuchen. Hilfreich zur Identifikation kausaler Zusammenhänge und Behandlungseffekten.
Details:
- Paneldaten: Daten, die mehrere Zeitpunkte und Beobachtungen pro Individuum umfassen.
- Vorteile: Kontrolliert für unbeobachtete Heterogenität, ermöglicht dynamische Analysen.
- Modelle: Fixed Effects (FE), Random Effects (RE), Dynamic Panel Models.
- FE: \[ Y_{it} = \beta X_{it} + u_i + \theta_t + \tilde{u}_{it} \] - ideal für zeitinvariante Effekte.
- RE: \[ Y_{it} = \beta X_{it} + u_i + \theta_t + u_{it} \] - Annahme von unkorrelierten Effekten.
- Hausman-Test: Testet, ob FE oder RE Modell geeigneter ist.
- Anwendungen: Evaluation von Gesundheitspolitiken, Medikamentenwirksamkeit, Gesundheitsinterventionen.