Empirische Arbeitsmarktforschung - Cheatsheet
Datenerhebung und -aufbereitung
Definition:
Prozess zur Sammlung und Strukturierung von Daten, um sie für eine empirische Analyse vorzubereiten.
Details:
- Primär- vs. Sekundärdaten: Primärdaten durch eigene Erhebungen, Sekundärdaten bereits vorhandene Quellen.
- Quantitative vs. qualitative Daten: Quantitativ (numerisch, messbar), qualitativ (beschreibend, charakterisierend).
- Erhebungsmethoden: Surveys, Interviews, Beobachtungen, Experimente.
- Datenaufbereitung: Datenbereinigung (Fehlerkorrektur, Fehlwertbehandlung), Transformation (Skalierung, Normalisierung).
- Wichtige Schritte: Datenimport, Datenprüfung, Datenanonymisierung, Kodierung.
- Tools: R, Stata, SPSS, Excel.
- Datenbankmanagementsysteme (DBMS) zur Speicherung und Verwaltung großer Datenmengen.
Einfache und multiple lineare Regression
Definition:
Instrumente zur Analyse des Zusammenhangs zwischen abhängigen und unabhängigen Variablen.
Details:
- Einfach: \[Y = \beta_0 + \beta_1 X + \epsilon\] Y: abhängige Variable, X: unabhängige Variable, \(\beta_0\): Interzept, \(\beta_1\): Steigungskoeffizient, \(\epsilon\): Fehlerterm
- Multipel: \[Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + ... + \beta_n X_n + \epsilon\] Mehrere unabhängige Variablen (\(X_1, X_2, ..., X_n\))
- \(R^2\): Bestimmtheitsmaß, erklärt Anteil der Varianz in Y, die durch X erklärt wird.
- \(H_0\) und \(H_a\): Hypothesentests zur Signifikanz der Koeffizienten
- Multikollinearität: Problem, wenn unabhängige Variablen stark korreliert sind.
Paneldatenanalysen
Definition:
Ermöglicht die Analyse von Daten über mehrere Zeitpunkte und Einheiten hinweg, inklusive der Kontrolle für unbeobachtete Heterogenität.
Details:
- Formate: Balanced vs. unbalanced Panel
- Fixed Effects (FE): Kontrolle für zeitinvariante unbeobachtete Heterogenität
- Random Effects (RE): Effizienter als FE, benötigt Annahme der Orthogonalität zwischen Random Effects und erklärenden Variablen
- Hausman-Test: Test zur Entscheidung zwischen FE und RE-Modellen
- Segmente: Zeitreihendimension (t) und Querschnittsdimension (i)
- Lineares Modell: \[ y_{it} = \alpha + \beta X_{it} + \mu_i + \lambda_t + \epsilon_{it} \] wo \( \mu_i \) individuenspezifischer Effekt und \( \lambda_t \) zeitspezifischer Effekt
Theorien der Arbeitslosigkeit
Definition:
Verschiedene theoretische Ansätze zur Erklärung von Arbeitslosigkeit basierend auf makroökonomischen und mikroökonomischen Perspektiven.
Details:
- Keynesianische Theorie: Arbeitslosigkeit durch unzureichende Gesamtnachfrage verursacht. Staatliche Eingriffe empfohlen.
- Neoklassische Theorie: Arbeitslosigkeit als Folge von Lohnrigiditäten und Informationsproblemen. Flexibilisierung des Arbeitsmarktes empfohlen.
- Fiskalpolitische Theorie: Restriktive Fiskalpolitik kann zu erhöhter Arbeitslosigkeit führen.
- Frictional Unemployment: Temporäre Arbeitslosigkeit, während Arbeiter nach neuen Jobs suchen.
- Structural Unemployment: Mismatch zwischen Arbeitsangebot und -nachfrage, z.B. durch technologische Veränderungen.
- Formeln zur Berechnung: \(U = L - N\) (Arbeitslosenquote), \(NAIRU\) (nicht beschleunigende Inflationsrate der Arbeitslosigkeit)
- Indikatoren: Arbeitslosenquote, Beveridge-Kurve.
Lohndiskriminierung nach Geschlecht und Herkunft
Definition:
Unterschiede in der Entlohnung aufgrund des Geschlechts oder ethnischer Herkunft bei vergleichbarer Arbeit, oft gemessen durch den Gender Pay Gap bzw. Ethnic Pay Gap.
Details:
- Messung oft durch Differenz der logarithmierten Löhne: \( \text{ln}(Lohn_i) = \beta_0 + \beta_1 \text{Geschlecht}_i + \beta_2 \text{Herkunft}_i + \beta_3 X_i + u_i \)
- Methoden zur Ursacheanalyse: Oaxaca-Blinder-Zerlegung
- Kontrollvariablen: Berufserfahrung, Bildung, Branche
- Unterschied zwischen bereinigter und unbereinigter Lohnlücke
- Relevanz von gesetzlicher und betrieblicher Gleichstellungspolitik
Matching-Theorien
Definition:
Theorien zur Erklärung, wie Arbeitskräfte und Arbeitsplätze auf dem Arbeitsmarkt zusammenfinden.
Details:
- Kombinieren Such- und Anpassungsprozesse: Verbindung zwischen Arbeitsangebot und Arbeitsnachfrage.
- Matching-Funktion: Beschreibt die Anzahl der Matches (M) als Funktion der Arbeitslosen (U) und der offenen Stellen (V): M = m(U,V)
- Effizienz: Hohe Effizienz, wenn passende Arbeitsplätze schnell gefunden werden.
- Passungsgrad: Wichtig für die Nachhaltigkeit der Beschäftigung.
- Matching-Modelle: Diamond-Mortensen-Pissarides (DMP)-Modell ist bekanntestes Beispiel.
Zeitreihenanalysen
Definition:
Analyse von Daten, die in regelmäßigen Zeitintervallen erhoben wurden, um Muster, Trends und saisonale Schwankungen zu identifizieren.
Details:
- Wichtige Konzepte: Stochastische Prozesse, Stationarität, Autokorrelationsfunktion (ACF), Partiell-Autokorrelation (PACF), White Noise
- Modelle: AR (autoregressiv), MA (moving average), ARMA, ARIMA (integriert)
- Dekomposition: Trend, Saisonalität, Residualität
- Stationaritätsprüfung: Augmented-Dickey-Fuller-Test (ADF), KPSS-Test
- Prognosen: Rolling Forecast, Exponential Smoothing, SARIMA für saisonale Daten
- Parameterbestimmung: Akaike-Informationskriterium (AIC), Bayesianisches Informationskriterium (BIC)
Mikroökonomische Modelle der Lohnbildung
Definition:
Untersuchen, wie Löhne auf dem Arbeitsmarkt durch individuelles Verhalten von Unternehmen und Arbeitnehmern bestimmt werden.
Details:
- Gleichgewichtslöhne: Schnittpunkt von Arbeitsangebot und -nachfrage.
- Humankapitaltheorie: Löhne als Rendite für investiertes Wissen und Fähigkeiten.
- Such- und Matching-Modelle: Effizienz der Arbeitsmarkttransaktionen und -entscheidungen.
- Effizienzlohntheorie: Höhere Löhne zur Steigerung der Arbeitsproduktivität.