Grundlagen der Datenerhebung
Definition:
Methoden zur Sammlung relevanter Daten für biostatistische Analysen.
Details:
- Ziele der Datenerhebung: Hypothesenprüfung, Erkennung von Mustern
- Typen von Daten: quantitativ vs. qualitativ
- Stichprobengewinnung: Zufallsstichproben, Schichtstichproben
- Bias und Fehlerquellen: Auswahlbias, Messfehler
- Datenerhebungsmethoden: Umfragen, Interviews, Beobachtungen, Experimente
- Messskalen: nominal, ordinal, intervall, rationell
- Datenqualität: Validität, Reliabilität
- Beachtung ethischer Richtlinien: Datenschutz, Zustimmung
Darstellung und Visualisierung von Daten
Definition:
Darstellung und Visualisierung von Daten: Grafikdarstellungen verwenden, um statistische Daten leicht verständlich zu machen.
Details:
- Balkendiagramme: Vergleich von Kategorien
- Liniendiagramme: Zeitverläufe darstellen
- Kuchendiagramme: Anteile eines Ganzen zeigen
- Boxplots: Verteilung und Ausreißer visualisieren
- Heatmaps: Wertverteilung in Matrizenform
- Streudiagramme: Beziehungen zwischen zwei Variablen
- Wichtig: Achsenskalierung beachten
- Datentitel und Legenden einfügen
- Farbschema konsistent halten
Hypothesentests (z-Test, t-Test, Chi-Quadrat-Test)
Definition:
Hypothesentests prüfen, ob eine Hypothese über eine Population auf Basis von Stichprobendaten verworfen oder beibehalten werden sollte.
Details:
- z-Test: Verwendet bei großen Stichproben (>30) oder bekannter Populationsvarianz.
- t-Test: Verwendet bei kleinen Stichproben (<30) oder unbekannter Populationsvarianz.
- Chi-Quadrat-Test: Verwendet zur Prüfung von Zusammenhängen zwischen kategorialen Variablen.
Kaplan-Meier-Schätzer
Definition:
Der Kaplan-Meier-Schätzer ist eine Methode zur Schätzung der Überlebensfunktion aus Lebensdauerdaten.
Details:
- Wird verwendet bei zensierten Daten
- Kumulative Überlebenswahrscheinlichkeit mit \[ \hat{S}(t) = \prod_{t_i \le t} \left( 1 - \frac{d_i}{n_i} \right) \]
- \hat{S}(t) - Schätzer der Überlebensfunktion zum Zeitpunkt t, \ d_i - Anzahl der Ereignisse zum Zeitpunkt t_i, \ n_i - Anzahl der gefährdeten Personen zu t_i
- Grafische Darstellung als Überlebenskurve
Multiple lineare Regression
Definition:
Statistisches Verfahren zur Untersuchung des Zusammenhangs zwischen einer abhängigen Variablen und mehreren unabhängigen Variablen.
Details:
- Modell: \(Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + ... + \beta_k X_k + \epsilon\)
- \(Y\): Abhängige Variable
- \(X_1, X_2, ..., X_k\): Unabhängige Variablen
- \(\beta_0\): Achsenabschnitt
- \(\beta_1, \beta_2, ..., \beta_k\): Regressionskoeffizienten
- \(\epsilon\): Fehlerterm
- Annahmen: Linearität, Unabhängigkeit, Homoskedastizität, Normalverteilung der Fehler
- Bewertung: R², Adjusted R², p-Werte der Koeffizienten
Fehlerarten (Typ I und Typ II Fehler)
Definition:
Fehlerarten in Hypothesentests. Typ I Fehler (α-Fehler): Nullhypothese wird fälschlicherweise verworfen. Typ II Fehler (β-Fehler): Nullhypothese wird fälschlicherweise angenommen.
Details:
- Typ I Fehler (α): Wahrscheinlichkeit, dass Nullhypothese verworfen wird, obwohl sie wahr ist (Fehlalarm)
- Typ II Fehler (β): Wahrscheinlichkeit, dass Nullhypothese beibehalten wird, obwohl sie falsch ist (übersehener Unterschied)
- Formeln:
- P(Typ I Fehler) = α
- P(Typ II Fehler) = β
- Zusammenhang: Senkung von α erhöht β und umgekehrt
Analyse klinischer Studien
Definition:
Untersuchung der Daten aus klinischen Studien zur Bewertung der Wirksamkeit und Sicherheit von medizinischen Interventionen
Details:
- Studiendesign: Randomisiert, doppelblind, kontrolliert
- Endpunkte: Primäre und sekundäre, Surrogat-Endpunkte
- Statistische Methoden: t-Test, χ²-Test, ANOVA, Regressionsanalyse
- Verblindung: Doppelblind, Einfachblind, Offen
- Populationsanalyse: Intention-to-Treat (ITT), Per-Protocol (PP)
- Bias und Konfounder: Erkennung und Kontrolle
- p-Wert und Konfidenzintervalle: Interpretation
- Meta-Analyse: Kombination von Studienergebnissen
Epidemiologische Studien
Definition:
Untersuchung von Krankheiten in Bevölkerungsgruppen zur Identifikation von Verbreitung, Ursachen und Risikofaktoren
Details:
- Deskriptive Studien: beschreiben Krankheitshäufigkeit und -verteilung
- Analytische Studien: untersuchen Ursachen und Risikofaktoren
- Kohortenstudien: Vergleich von Gruppen mit/ohne Risikofaktoren über Zeit
- Fall-Kontroll-Studien: Vergleich von Fällen (Erkrankten) mit Kontrollen (Nicht-Erkrankten)
- Querschnittstudien: Momentaufnahme der Krankheitsverteilung in einer Population
- Interventionsstudien: bewerten Effekte spezifischer Behandlungen oder Präventionsmaßnahmen
- Bias und Confounding: systematische Fehler und Störfaktoren müssen berücksichtigt werden