Biometrie - Exam.pdf

Biometrie - Exam
Aufgabe 1) Du bist verantwortlich für die Planung einer biostatistischen Studie, die den Zusammenhang zwischen der täglichen Schlafdauer und der Häufigkeit von Migräne bei Erwachsenen untersucht. Die Daten sollen mittels einer Mischung aus Umfragen und Interviews gesammelt werden. Dabei sollen folgende Punkte berücksichtigt werden: Ziele der Datenerhebung: Hypothesenprüfung, Erkennung von Mustern ...

© StudySmarter 2024, all rights reserved.

Aufgabe 1)

Du bist verantwortlich für die Planung einer biostatistischen Studie, die den Zusammenhang zwischen der täglichen Schlafdauer und der Häufigkeit von Migräne bei Erwachsenen untersucht. Die Daten sollen mittels einer Mischung aus Umfragen und Interviews gesammelt werden. Dabei sollen folgende Punkte berücksichtigt werden:

  • Ziele der Datenerhebung: Hypothesenprüfung, Erkennung von Mustern
  • Typen von Daten: quantitativ vs. qualitativ
  • Stichprobengewinnung: Zufallsstichproben, Schichtstichproben
  • Bias und Fehlerquellen: Auswahlbias, Messfehler
  • Datenerhebungsmethoden: Umfragen, Interviews, Beobachtungen, Experimente
  • Messskalen: nominal, ordinal, intervall, rationell
  • Datenqualität: Validität, Reliabilität
  • Beachtung ethischer Richtlinien: Datenschutz, Zustimmung

a)

1. Bestimme die Ziele Deiner Datenerhebung.

  • Formuliere eine konkrete Hypothese, die Du mit Deiner Studie prüfen möchtest.
  • Erläutere, welche Muster du erwartest zu erkennen.

Lösung:

1. Bestimme die Ziele Deiner Datenerhebung.

  • Formuliere eine konkrete Hypothese, die Du mit Deiner Studie prüfen möchtest.
  • Erläutere, welche Muster du erwartest zu erkennen.

Hypothese:

  • Die tägliche Schlafdauer beeinflusst die Häufigkeit von Migräne bei Erwachsenen signifikant. Konkret: Erwachsene, die weniger als 6 Stunden pro Nacht schlafen, haben eine höhere Häufigkeit von Migräneanfällen im Vergleich zu denen, die 7-8 Stunden oder mehr als 8 Stunden schlafen.

Erwartete Muster:

  • Negative Korrelation: Es wird erwartet, dass Personen, die weniger Schlaf bekommen, häufiger an Migräne leiden. Je weniger Schlaf, desto häufiger die Migräneanfälle.
  • Schlafdauer-Kategorien: Die Häufigkeit von Migräne könnte in bestimmten Schlafdauer-Kategorien auffällige Unterschiede zeigen, z.B. <6 Stunden, 7-8 Stunden, >8 Stunden.
  • Qualitative Aspekte: Befragte könnten auch qualitative Daten liefern, die auf spezifische Schlafgewohnheiten oder Auslöser von Migräne hinweisen, wie z.B. unregelmäßige Schlafzeiten oder Schlafumgebung.
  • Geschlechtsunterschiede: Es könnten Unterschiede zwischen Männern und Frauen in Bezug auf die Schlafdauer und Migräneanfälle auftreten.
  • Altersunterschiede: Auch das Alter könnte eine Rolle spielen, sodass jüngere und ältere Erwachsene unterschiedliche Muster in Schlafdauer und Migränefrequenz aufweisen.

b)

2. Wähle geeignete Datentypen und Datenerhebungsmethoden.

  • Welche quantitativen und qualitativen Daten möchtest du sammeln?
  • Welche Mischung von Umfragen und Interviews planst Du zu verwenden? Begründe Deine Wahl.

Lösung:

2. Wähle geeignete Datentypen und Datenerhebungsmethoden.

  • Welche quantitativen und qualitativen Daten möchtest du sammeln?
  • Welche Mischung von Umfragen und Interviews planst Du zu verwenden? Begründe Deine Wahl.

Quantitative Daten:

  • Anzahl der Stunden Schlaf pro Nacht (Intervallskala).
  • Häufigkeit der Migräneanfälle pro Woche/Monat (Ratio-Skala).
  • Alter der Studienteilnehmer (Ratio-Skala).
  • Geschlecht der Studienteilnehmer (Nominalskala).
  • Andere medizinische Bedingungen, die Migräne beeinflussen könnten (Nominalskala).

Qualitative Daten:

  • Schlafqualität (z.B. subjektive Bewertung auf einer Skala von 1-10, verbale Beschreibungen).
  • Schlafumgebung (Informationen über das Schlafumfeld, z.B. Lärmpegel, Lichtverhältnisse).
  • Lebensstilfaktoren (z.B. Stresslevel, Ernährung, körperliche Aktivität).
  • Subjektive Beschreibungen der Migräneanfälle (z.B. Schweregrad, Art der Symptome).

Mischung von Umfragen und Interviews:

  • Umfragen: Standardisierte Fragebögen ermöglichen die Erfassung großer Datenmengen in einer strukturierten und quantifizierbaren Form. Umfragen sind effizient und ermöglichen die Sammlung sowohl quantitativer als auch qualitativer Daten durch geschlossene und offene Fragen. Sie eignen sich besonders für Fragen bzgl. der Schlafdauer, Häufigkeit der Migräneanfälle und anderen quantitativen Daten.
  • Interviews: Halbstrukturierte Interviews bieten die Möglichkeit, tiefer in die individuellen Erlebnisse und Meinungen der Teilnehmer einzutauchen. Diese Methode ermöglicht es, qualitative Daten zu Schlafqualität, Schlafumgebung und individuellen Erfahrungen mit Migräne zu sammeln. Interviews sind besonders nützlich, um offene Fragen zu klären und komplexere Zusammenhänge zu verstehen.

Begründung der Wahl:

  • Die Kombination aus Umfragen und Interviews ermöglicht eine umfassende Datenerhebung, die sowohl breite Trends als auch tiefere Einsichten bietet. Umfragen helfen, eine größere Anzahl von Teilnehmern effizient zu erreichen und quantitative Daten zu standardisieren. Interviews ergänzen die Umfragen, indem sie detailliertere qualitative Einblicke und Kontextinformationen liefern, die zur Interpretation der quantitativen Daten notwendig sind.

c)

3. Plane die Stichprobengewinnung.

  • Welche Stichprobenart (Zufallsstichproben, Schichtstichproben) wendest Du an, um repräsentative Daten zu sammeln? Begründe Deine Wahl.
  • Wie wirst Du mögliche Fehlerquellen und Bias minimieren?

Lösung:

3. Plane die Stichprobengewinnung.

  • Welche Stichprobenart (Zufallsstichproben, Schichtstichproben) wendest Du an, um repräsentative Daten zu sammeln? Begründe Deine Wahl.
  • Wie wirst Du mögliche Fehlerquellen und Bias minimieren?

Stichprobenart:

  • Schichtstichproben: Diese Methode teilt die Population in verschiedene Schichten (z.B. Altersgruppen, Geschlecht, Beruf, etc.) und zieht dann zufällige Stichproben aus jeder Schicht. Diese Methode wird gewählt, um sicherzustellen, dass alle relevanten Untergruppen der Population hinreichend in der Stichprobe vertreten sind. Da Schlafgewohnheiten und Migränehäufigkeit möglicherweise stark von Faktoren wie Alter und Geschlecht beeinflusst werden, ist es wichtig, dass diese Variablen in der Studie repräsentiert sind.

Begründung der Wahl:

  • Schichtstichproben stellen sicher, dass die Stichprobe die Gesamtpopulation besser repräsentiert, indem sie Variabilitäten innerhalb spezifischer Untergruppen berücksichtigen. Dies führt zu genaueren und aussagekräftigeren Ergebnissen, insbesondere wenn die Zielvariablen stark schichtabhängig sind.

Minimierung von Fehlerquellen und Bias:

  • Auswahlbias: Um Auswahlbias zu minimieren, wird die Stichprobe zufällig innerhalb jeder Schicht gezogen. Dies hilft sicherzustellen, dass jede Person innerhalb einer Schicht die gleiche Chance hat, ausgewählt zu werden.
  • Messfehler: Standardisierte Instrumente und Protokolle für Umfragen und Interviews werden verwendet, um Konsistenz und Genauigkeit der Messungen sicherzustellen. Die Interviewer werden geschult, um sicherzustellen, dass sie die Fragen konsistent und ohne Beeinflussung stellen.
  • Non-Response Bias: Maßnahmen wie mehrere Kontaktversuche und Anreize (z.B. kleine Belohnungen) werden ergriffen, um die Antwortrate zu erhöhen und Non-Response Bias zu minimieren.
  • Validität und Reliabilität: Validität wird untersucht, indem die Umfrage und Interviewfragen basierend auf bestehender Literatur und Expertenmeinungen entwickelt werden. Reliabilität wird durch Pre-Tests und Pilotstudien überprüft, um sicherzustellen, dass die Instrumente zuverlässige und konsistente Ergebnisse liefern.
  • Relativierung der sozialen Erwünschtheit: Anonymität und Vertraulichkeit der Antworten werden betont, um sicherzustellen, dass die Teilnehmer ehrlich antworten und nicht sozial erwünschte Antworten geben.

d)

4. Diskutiere die Messskalen und ethischen Richtlinien.

  • Welche Messskalen wirst du verwenden, um die Daten zu erfassen? Definiere, welche Variablen auf welcher Skala gemessen werden.
  • Wie stellst Du sicher, dass Deine Datensammlung ethischen Richtlinien entspricht, insbesondere hinsichtlich Datenschutz und Zustimmung?

Lösung:

4. Diskutiere die Messskalen und ethischen Richtlinien.

  • Welche Messskalen wirst du verwenden, um die Daten zu erfassen? Definiere, welche Variablen auf welcher Skala gemessen werden.
  • Wie stellst Du sicher, dass Deine Datensammlung ethischen Richtlinien entspricht, insbesondere hinsichtlich Datenschutz und Zustimmung?

Messskalen:

  • Nominalskala: Verwendung für kategoriale Daten ohne innere Ordnung. Beispiele: Geschlecht (männlich, weiblich, divers), Vorhandensein anderer medizinischer Bedingungen (ja, nein).
  • Ordinalskala: Verwendung für kategoriale Daten mit einer geordneten Reihenfolge, aber ohne feste Abstandsmaße. Beispiel: Schlafqualität (schlecht, mittel, gut).
  • Intervallskala: Verwendung für Daten mit gleichen Abständen zwischen den Werten, aber ohne echten Nullpunkt. Beispiel: Uhrzeit des Einschlafens (ermittelt durch Stunden und Minuten).
  • Rationalskala: Verwendung für Daten mit echten Nullpunkten und gleichen Abständen. Beispiele: Anzahl der Stunden Schlaf pro Nacht, Häufigkeit der Migräneanfälle pro Woche/Monat, Alter der Studienteilnehmer.

Ethische Richtlinien:

  • Datenschutz: Um den Datenschutz sicherzustellen, werden alle personenbezogenen Daten anonymisiert und nur anonymisierte Daten werden weiterverarbeitet. Zugriffsrechte auf die Daten werden strikt kontrolliert und nur autorisierten Personen gewährt. Die Daten werden verschlüsselt gespeichert.
  • Zustimmung: Vor Beginn der Datenerhebung wird eine informierte Einwilligung (Informed Consent) von allen Studienteilnehmern eingeholt. Dies umfasst die Aufklärung über den Zweck der Studie, die Art der zu erhebenden Daten, die Verwendung der Daten, sowie die Rechte der Teilnehmer (z.B. das Recht, die Teilnahme jederzeit ohne Angabe von Gründen zu beenden).
  • Anonymität und Vertraulichkeit: Alle erhobenen Daten werden vertraulich behandelt. Teilnehmeridentitäten werden durch Codes ersetzt, um direkte Identifizierung zu vermeiden. Ergebnisse werden in aggregierter Form berichtet, sodass keine Rückschlüsse auf einzelne Teilnehmer möglich sind.
  • Beachtung der ethischen Prinzipien: Respekt vor den Personen, Wohlwollen (maximaler Nutzen bei minimalem Schaden) und Gerechtigkeit (faire Behandlung aller Teilnehmer) sind zentrale ethische Prinzipien, die bei der Planung und Durchführung der Studie beachtet werden.
  • Ethische Prüfung: Die Studie wird vor Beginn einer ethischen Prüfung durch eine unabhängige Ethikkommission unterzogen, um sicherzustellen, dass alle ethischen Standards eingehalten werden.

Aufgabe 2)

Darstellung und Visualisierung von Daten: Angenommen, Du untersuchst die Ergebnisse einer klinischen Studie, bei der die Wirksamkeit einer neuen Behandlungsmethode für Bluthochdruck getestet wird. Die Studie umfasst 100 Patienten, die zufällig in zwei Gruppen eingeteilt wurden: eine Behandlungsgruppe (Gruppe A) und eine Kontrollgruppe (Gruppe B). Die Blutdruckwerte wurden in regelmäßigen Abständen über einen Zeitraum von 6 Monaten erfasst.

a)

Erstelle ein Liniendiagramm, das die durchschnittlichen Blutdruckwerte der beiden Gruppen (A und B) im Verlauf der 6 Monate zeigt. Achte darauf, dass die Achsen richtig skaliert sind und füge einen passenden Titel und eine Legende hinzu, um die beiden Gruppen zu unterscheiden.

Lösung:

Darstellung und Visualisierung von Daten:

Angenommen, du untersuchst die Ergebnisse einer klinischen Studie, bei der die Wirksamkeit einer neuen Behandlungsmethode für Bluthochdruck getestet wird. Die Studie umfasst 100 Patienten, die zufällig in zwei Gruppen eingeteilt wurden: eine Behandlungsgruppe (Gruppe A) und eine Kontrollgruppe (Gruppe B). Die Blutdruckwerte wurden in regelmäßigen Abständen über einen Zeitraum von 6 Monaten erfasst.

Visualisierung: Um die durchschnittlichen Blutdruckwerte der beiden Gruppen im Verlauf der 6 Monate zu visualisieren, kannst du ein Liniendiagramm erstellen. Hier ist ein Beispielcode in Python mit der Bibliothek Matplotlib, um das Diagramm zu erstellen:

import matplotlib.pyplot as plt# Angenommene Datenmonate = [0, 1, 2, 3, 4, 5, 6]mittelwerte_gruppe_a = [150, 145, 140, 135, 130, 125, 120]  # Beispieldatenmittelwerte_gruppe_b = [150, 148, 147, 146, 145, 144, 143]  # Beispieldaten# Erstellen des Liniendiagrammsplt.plot(monate, mittelwerte_gruppe_a, label='Gruppe A', marker='o')plt.plot(monate, mittelwerte_gruppe_b, label='Gruppe B', marker='x')# Achsen korrekt skalierenplt.xlabel('Monate')plt.ylabel('Durchschnittlicher Blutdruck (mmHg)')# Titel hinzufügenplt.title('Durchschnittliche Blutdruckwerte über 6 Monate')# Legende hinzufügenplt.legend()# Diagramm anzeigenplt.show()

Hier eine Erklärung der Schritte im Code:

  • Daten: Wir nehmen an, dass die durchschnittlichen Blutdruckwerte der Gruppen A und B wie oben angegeben sind.
  • Diagramm erstellen: Wir verwenden Matplotlib, um das Liniendiagramm zu erstellen. Die plot-Funktion wird verwendet, um die Datenpunkte mit Markierungen für jede Gruppe darzustellen.
  • Achsen skalieren und beschriften: Die x-Achse wird als 'Monate' und die y-Achse als 'Durchschnittlicher Blutdruck (mmHg)' beschriftet.
  • Titel und Legende: Ein Titel wird hinzugefügt, um das Diagramm zu beschreiben, und eine Legende, um die beiden Gruppen zu unterscheiden.

Das resultierende Diagramm zeigt die Entwicklung des durchschnittlichen Blutdrucks für beide Gruppen im Verlauf der 6 Monate.

b)

Die Ergebnisse zeigen, dass sich die Blutdruckwerte in Gruppe A nach 6 Monaten signifikant reduziert haben, während sie in Gruppe B nahezu unverändert blieben. Erstelle ein Boxplot für beide Gruppen (A und B) am Ende der Studie (nach 6 Monaten). Markiere eventuelle Ausreißer und beschreibe, was diese für die Datenanalyse bedeuten könnten.

Lösung:

Darstellung und Visualisierung von Daten:

Angenommen, du untersuchst die Ergebnisse einer klinischen Studie, bei der die Wirksamkeit einer neuen Behandlungsmethode für Bluthochdruck getestet wird. Die Studie umfasst 100 Patienten, die zufällig in zwei Gruppen eingeteilt wurden: eine Behandlungsgruppe (Gruppe A) und eine Kontrollgruppe (Gruppe B). Die Blutdruckwerte wurden in regelmäßigen Abständen über einen Zeitraum von 6 Monaten erfasst.

Analyse: Die Ergebnisse zeigen, dass sich die Blutdruckwerte in Gruppe A nach 6 Monaten signifikant reduziert haben, während sie in Gruppe B nahezu unverändert blieben. Um dies zu visualisieren, erstellen wir ein Boxplot für beide Gruppen am Ende der Studie (nach 6 Monaten). Ein Boxplot visualisiert die Verteilung der Daten und zeigt mögliche Ausreißer.

Hier ist ein Beispielcode in Python mit der Bibliothek Matplotlib und Seaborn, um das Boxplot zu erstellen:

import matplotlib.pyplot as pltimport seaborn as sns# Angenommene Datenblutdruck_gruppe_a = [120, 122, 118, 119, 117, 123, 118, 120, 121, 119]  # Beispieldaten für Gruppe A (nach 6 Monaten)blutdruck_gruppe_b = [145, 144, 146, 147, 145, 144, 143, 146, 145, 144]  # Beispieldaten für Gruppe B (nach 6 Monaten)# Daten in ein DataFrame umwandelndanach_6_monate = {'Gruppe A': blutdruck_gruppe_a, 'Gruppe B': blutdruck_gruppe_b}# Boxplot erstellenplt.figure(figsize=(10, 6))sns.boxplot(data=danach_6_monate, palette='Set3')plt.xlabel('Gruppen')plt.ylabel('Blutdruck (mmHg)')plt.title('Blutdruckwerte nach 6 Monaten')plt.show()

Hier eine Erklärung der Schritte im Code:

  • Daten: Wir nehmen hier an, dass die Blutdruckwerte der Gruppen A und B nach 6 Monaten wie oben angegeben sind.
  • Boxplot erstellen: Wir verwenden Seaborn und Matplotlib, um das Boxplot zu erstellen. Dies zeigt die Verteilung der Blutdruckwerte in den beiden Gruppen.
  • Labels und Titel: Achsenbeschriftungen und ein Titel werden hinzugefügt, um das Diagramm verständlich zu machen.

Ausreißer: Ausreißer sind Datenpunkte, die deutlich außerhalb des Bereichs der anderen Daten liegen. In einem Boxplot werden diese durch Punkte außerhalb der „Whiskers“ der Box angezeigt. Ausreißer können durch Variabilität im Messprozess oder durch experimentelle Fehler verursacht werden, und sie könnten eine neuartige Information über die untersuchte Population liefern. In der Datenanalyse ist es wichtig, Ausreißer zu identifizieren und zu verstehen, da sie signifikante Auswirkungen auf die statistischen Analysen und Schlussfolgerungen haben können.

c)

Erstelle ein Streudiagramm, das die Beziehung zwischen den Blutdruckwerten und dem Alter der Patienten für die gesamte Studienpopulation darstellt. Diskutiere, wie Du diese Visualisierung interpretieren würdest und welche zusätzlichen Variablen vielleicht noch berücksichtigt werden sollten, um ein vollständigeres Bild zu bekommen.

Lösung:

Darstellung und Visualisierung von Daten:

Angenommen, du untersuchst die Ergebnisse einer klinischen Studie, bei der die Wirksamkeit einer neuen Behandlungsmethode für Bluthochdruck getestet wird. Die Studie umfasst 100 Patienten, die zufällig in zwei Gruppen eingeteilt wurden: eine Behandlungsgruppe (Gruppe A) und eine Kontrollgruppe (Gruppe B). Die Blutdruckwerte wurden in regelmäßigen Abständen über einen Zeitraum von 6 Monaten erfasst.

Visualisierung: Um die Beziehung zwischen den Blutdruckwerten und dem Alter der Patienten für die gesamte Studienpopulation darzustellen, kannst du ein Streudiagramm erstellen. Hier ist ein Beispielcode in Python mit der Bibliothek Matplotlib und Seaborn, um das Streudiagramm zu erstellen:

import matplotlib.pyplot as pltimport seaborn as sns# Angenommene Datenalter = [25, 35, 45, 55, 65, 75, 85, 25, 35, 45, 55, 65, 75, 85, 50, 60, 70, 80, 90, 30, 40, 50, 60, 70, 80, 90, 45, 55, 65, 75]  # Beispieldatenblutdruck = [120, 122, 118, 140, 130, 135, 145, 155, 142, 150, 160, 148, 138, 128, 125, 130, 135, 140, 120, 142, 148, 135, 155, 160, 165, 158, 125, 130, 135, 145]  # Beispieldaten# Streudiagramm erstellenplt.figure(figsize=(10, 6))sns.scatterplot(x=alter, y=blutdruck, hue=alter, palette='coolwarm', s=100, edgecolor='w').set(title='Beziehung zwischen Blutdruck und Alter der Patienten')plt.xlabel('Alter')plt.ylabel('Blutdruck (mmHg)')plt.show()

Hier eine Erklärung der Schritte im Code:

  • Daten: Wir nehmen hier an, dass die Alters- und Blutdruckwerte der Patienten wie oben angegeben sind.
  • Streudiagramm erstellen: Wir verwenden Seaborn und Matplotlib, um das Streudiagramm zu erstellen. Dies zeigt die Beziehung zwischen dem Alter und den Blutdruckwerten der Patienten.
  • Labels und Titel: Achsenbeschriftungen und ein Titel werden hinzugefügt, um das Diagramm verständlich zu machen.

Interpretation der Visualisierung: Durch das Streudiagramm können wir mögliche Zusammenhänge zwischen dem Alter der Patienten und ihren Blutdruckwerten erkennen. Zum Beispiel könnte man untersuchen, ob es eine Tendenz gibt, dass der Blutdruck mit zunehmendem Alter steigt oder sinkt. Es könnten auch Cluster erkennbar sein, die auf unterschiedliche Gesundheitszustände oder Risikofaktoren hinweisen.

Zusätzliche Variablen: Um ein vollständigeres Bild zu bekommen, könnten folgende zusätzliche Variablen betrachtet werden:

  • Geschlecht: Unterschiede im Blutdruck könnten geschlechtsspezifisch sein.
  • Körpergewicht/BMI: Ein höheres Körpergewicht kann mit einem höheren Blutdruck verbunden sein.
  • Medikamenteneinnahme: Ob und welche Medikamente die Patienten einnehmen, könnte den Blutdruck beeinflussen.
  • Krankengeschichte: Vorerkrankungen (z.B. Diabetes, Herz-Kreislauf-Erkrankungen) könnten auch eine Rolle spielen.
  • Lebensstil: Faktoren wie Ernährung, Bewegung und Stressniveau könnten den Blutdruck beeinflussen.

Durch die Berücksichtigung dieser zusätzlichen Variablen kann eine umfassendere Analyse des Zusammenhangs zwischen Blutdruck und Alter sowie anderer Einflussfaktoren durchgeführt werden.

Aufgabe 3)

Du bist Arzt in einem Krankenhaus und möchtest die Effektivität eines neuen Medikaments zur Senkung des Blutdrucks untersuchen. Du verfügst über zwei Datensätze: Einen Datensatz mit den Blutdruckwerten vor und nach der Einnahme des Medikaments von 25 Patienten und einen zweiten Datensatz mit der Blutdruckkontrolle von 100 Patienten, die ein Placebo erhalten haben. Führe geeignete Hypothesentests durch, um zu beurteilen, ob das Medikament die Blutdruckwerte signifikant senkt.

c)

Prüfe mithilfe des Chi-Quadrat-Tests, ob ein Zusammenhang zwischen der Einnahme des Medikaments (neues Medikament oder Placebo) und der Senkung des Blutdrucks besteht. Formuliere die Null- und Alternativhypothese und berechne den Chi-Quadrat-Wert. Vergleiche diesen mit dem kritischen Wert bei einem Signifikanzniveau von 0,05, um die Hypothese zu testen.

Lösung:

Chi-Quadrat-Test zur Untersuchung des Zusammenhangs zwischen der Einnahme des Medikaments und der Senkung des Blutdrucks Um zu prüfen, ob ein Zusammenhang zwischen der Einnahme des Medikaments (neues Medikament oder Placebo) und der Senkung des Blutdrucks besteht, können wir einen Chi-Quadrat-Test verwenden.

  • Nullhypothese (\(H_0\)): Es besteht kein Zusammenhang zwischen der Einnahme des Medikaments (neues Medikament oder Placebo) und der Senkung des Blutdrucks. Die Variablen sind unabhängig. Formell: \(H_0\): Die Verteilung der Blutdrucksenkungen ist in beiden Gruppen gleich.
  • Alternativhypothese (\(H_A\)): Es besteht ein Zusammenhang zwischen der Einnahme des Medikaments (neues Medikament oder Placebo) und der Senkung des Blutdrucks. Die Variablen sind abhängig. Formell: \(H_A\): Die Verteilung der Blutdrucksenkungen ist in den beiden Gruppen unterschiedlich.
Schritte zur Durchführung des Chi-Quadrat-Tests:
  • Erstelle eine Kontingenztabelle, die die Frequenz der Blutdrucksenkungen in den Gruppen zeigt (z.B. Blutdruck gesenkt vs. nicht gesenkt).
  • Berechne die erwarteten Häufigkeiten für jede Zelle der Kontingenztabelle: \[ E_{ij} = \frac{( R_i \cdot C_j )}{T} \]wobei \(R_i\) die Summe der Zeile, \(C_j\) die Summe der Spalte und \(T\) die Gesamtsumme ist.
  • Berechne den Chi-Quadrat-Wert mit der Formel: \[ \chi^2 = \sum \frac{(O_{ij} - E_{ij})^2}{E_{ij}} \]wobei \(O_{ij}\) die beobachtete Häufigkeit und \(E_{ij}\) die erwartete Häufigkeit ist.
  • Vergleiche den berechneten Chi-Quadrat-Wert mit dem kritischen Wert aus der Chi-Quadrat-Verteilungstabelle bei einem Signifikanzniveau von 0,05 und den entsprechenden Freiheitsgraden.
Beispielhafte Berechnung:
  • Angenommen, wir haben die folgenden Daten gesammelt:
    Blutdruck gesenkt Blutdruck nicht gesenkt Gesamt
    Neues Medikament 20 5 25
    Placebo 30 70 100
    Gesamt 50 75 125
  • Berechne die erwarteten Häufigkeiten:
    Blutdruck gesenkt Blutdruck nicht gesenkt
    Neues Medikament \(E_{11} = \frac{(25 \cdot 50)}{125} = 10\) \(E_{12} = \frac{(25 \cdot 75)}{125} = 15\)
    Placebo \(E_{21} = \frac{(100 \cdot 50)}{125} = 40\) \(E_{22} = \frac{(100 \cdot 75)}{125} = 60\)
  • Berechne den Chi-Quadrat-Wert: \[ \chi^2 = \frac{(20 - 10)^2}{10} + \frac{(30 - 40)^2}{40} + \frac{(5 - 15)^2}{15} + \frac{(70 - 60)^2}{60} \]\[ \chi^2 = 10 + 2.5 + 6.67 + 1.67 = 20.84 \]
  • Ermittle den kritischen Wert für 1 Freiheitsgrad (\(df = (2-1) \cdot (2-1) = 1\)) und ein Signifikanzniveau von 0,05: \(\chi^2_{krit} = 3.841\).
Da der berechnete Chi-Quadrat-Wert von 20.84 größer als der kritische Wert von 3.841 ist, lehnen wir die Nullhypothese ab und folgern, dass es einen signifikanten Zusammenhang zwischen der Einnahme des Medikaments und der Senkung des Blutdrucks gibt.

Aufgabe 4)

In einer klinischen Studie wurden die Überlebenszeiten von Patienten nach einer neuen Therapie beobachtet. Die Studie umfasst eine Beobachtungsdauer von 12 Monaten, wobei einige Patienten während dieses Zeitraums zensiert wurden, d.h. sie schieden aus der Studie aus, ohne das Ereignis (Tod) erlebt zu haben. Die Anzahl der gefährdeten Personen und die Anzahl der Ereignisse zum jeweiligen Zeitpunkt sind bekannt und wurden wie folgt aufgezeichnet:

  • 1. Monat: 50 Patienten, 3 Ereignisse
  • 3. Monat: 45 Patienten, 5 Ereignisse
  • 6. Monat: 38 Patienten, 4 Ereignisse
  • 9. Monat: 30 Patienten, 7 Ereignisse
  • 12. Monat: 20 Patienten, 2 Ereignisse
  • Während des Beobachtungszeitraums wurden insgesamt 10 Patienten zensiert.

Auf Basis dieser Daten soll die Überlebensfunktion mit dem Kaplan-Meier-Schätzer bestimmt und eine Überlebenskurve erstellt werden.

a)

Berechne die kumulative Überlebenswahrscheinlichkeit für die gegebenen Zeitpunkte mit dem Kaplan-Meier-Schätzer. Gib detaillierte Berechnungen für die Überlebenswahrscheinlichkeiten zum 1., 3., 6., 9. und 12. Monat an.

Lösung:

Um die kumulative Überlebenswahrscheinlichkeit zu berechnen, verwenden wir den Kaplan-Meier-Schätzer. Der Kaplan-Meier-Schätzer ist eine nichtparametrische Methode, um die Überlebenswahrscheinlichkeit zu schätzen. Die Formel für den Kaplan-Meier-Schätzer lautet:

\[S(t) = \prod_{{i: t_i \leq t}} \left(1 - \frac{{d_i}}{{n_i}}\right)\]

wobei: d_i: Anzahl der Ereignisse (Tode) zum Zeitpunkt t_in_i: Anzahl der gefährdeten Personen zu Beginn des Zeitpunktes t_i

Betrachten wir die Zeitpunkte einzeln:

  • 1. Monat:\[n_1 = 50, \ d_1 = 3\]Überlebenswahrscheinlichkeit nach dem 1. Monat: \[S(1) = \left(1 - \frac{{d_1}}{{n_1}}\right)\]\[S(1) = \left(1 - \frac{{3}}{{50}}\right)\]\[S(1) = \left(1 - 0.06\right)\]\[S(1) = 0.94\]
  • 3. Monat:\[n_3 = 45, \ d_3 = 5\]Überlebenswahrscheinlichkeit nach dem 3. Monat: \[S(3) = S(1) \left(1 - \frac{{d_3}}{{n_3}}\right)\]\[S(3) = 0.94 \left(1 - \frac{{5}}{{45}}\right)\]\[S(3) = 0.94 \left(1 - 0.1111\right)\]\[S(3) = 0.94 \cdot 0.8889\]\[S(3) \approx 0.8356\]
  • 6. Monat:\[n_6 = 38, \ d_6 = 4\]Überlebenswahrscheinlichkeit nach dem 6. Monat: \[S(6) = S(3) \left(1 - \frac{{d_6}}{{n_6}}\right)\]\[S(6) = 0.8356 \left(1 - \frac{{4}}{{38}}\right)\]\[S(6) = 0.8356 \left(1 - 0.1053\right)\]\[S(6) = 0.8356 \cdot 0.8947\]\[S(6) \approx 0.7480\]
  • 9. Monat:\[n_9 = 30, \ d_9 = 7\]Überlebenswahrscheinlichkeit nach dem 9. Monat: \[S(9) = S(6) \left(1 - \frac{{d_9}}{{n_9}}\right)\]\[S(9) = 0.7480 \left(1 - \frac{{7}}{{30}}\right)\]\[S(9) = 0.7480 \left(1 - 0.2333\right)\]\[S(9) = 0.7480 \cdot 0.7667\]\[S(9) \approx 0.5736\]
  • 12. Monat:\[n_{12} = 20, \ d_{12} = 2\]Überlebenswahrscheinlichkeit nach dem 12. Monat: \[S(12) = S(9) \left(1 - \frac{{d_{12}}}{{n_{12}}}\right)\]\[S(12) = 0.5736 \left(1 - \frac{{2}}{{20}}\right)\]\[S(12) = 0.5736 \left(1 - 0.1\right)\]\[S(12) = 0.5736 \cdot 0.9\]\[S(12) \approx 0.5162\]

Daraus ergibt sich die kumulative Überlebenswahrscheinlichkeit für die Zeitpunkte:

  • 1. Monat: 0.94
  • 3. Monat: 0.8356
  • 6. Monat: 0.7480
  • 9. Monat: 0.5736
  • 12. Monat: 0.5162

b)

Erstelle eine grafische Darstellung der Überlebenskurve basierend auf den berechneten Werten. Beschreibe zusätzlich, wie die Überlebenskurve interpretiert wird und was sie über die Überlebenschancen der Patienten aussagt.

Lösung:

Um die Überlebenskurve grafisch darzustellen, nehmen wir die berechneten Überlebenswahrscheinlichkeiten zu den gegebenen Zeitpunkten und zeichnen diese in ein Diagramm ein. Wir verwenden typischerweise ein Liniendiagramm, bei dem die Zeit auf der horizontalen Achse (x-Achse) und die Überlebenswahrscheinlichkeit auf der vertikalen Achse (y-Achse) dargestellt wird.

Hier sind die Schritte für die Erstellung der Überlebenskurve:

  • Zeichen der Überlebenskurve
import matplotlib.pyplot as pltmonate = [0, 1, 3, 6, 9, 12]überlebenswahrscheinlichkeit = [1.0, 0.94, 0.8356, 0.7480, 0.5736, 0.5162]plt.step(monate, überlebenswahrscheinlichkeit, where='post')plt.xlabel('Zeit (Monate)')plt.ylabel('Überlebenswahrscheinlichkeit')plt.title('Kaplan-Meier Überlebenskurve')plt.ylim(0, 1.05)plt.grid(True)plt.show()

Kaplan-Meier Überlebenskurve

Interpretation der Überlebenskurve:

  • 1. Anfängliche Überlebenswahrscheinlichkeit: Zu Beginn der Studie (0 Monate) liegt die Überlebenswahrscheinlichkeit bei 100%. Beim 1. Monat beträgt sie noch 94%, was darauf hinweist, dass 6% der Patienten innerhalb des ersten Monats verstorben sind.
  • Verlauf der Kurve: Die Kurve zeigt zu jedem Zeitpunkt, wie viele Patienten bis zu diesem Zeitpunkt überlebt haben. Ein steiler Abfall in der Kurve bedeutet viele Todesfälle in einem kurzen Zeitraum.
  • Endgültige Überlebenswahrscheinlichkeit: Am Ende der Beobachtungsperiode (12 Monate) beträgt die Überlebenswahrscheinlichkeit etwa 51.6%. Das bedeutet, dass nach 12 Monaten ungefähr 51.6% der Patienten noch am Leben sind.
  • Allgemeiner Trend: Ein flacherer Verlauf der Kurve deutet darauf hin, dass die Überlebenschance in diesem Intervall höher ist im Vergleich zu Intervallen mit steileren Abfällen.

Zusammengefasst zeigt die Überlebenskurve, wie sich die Überlebenswahrscheinlichkeit der Patienten im Laufe der Zeit verändert. Sie gibt Aufschluss darüber, wie effektiv die neue Therapie ist und welche Überlebenschancen die Patienten im Durchschnitt haben.

Sign Up

Melde dich kostenlos an, um Zugriff auf das vollständige Dokument zu erhalten

Mit unserer kostenlosen Lernplattform erhältst du Zugang zu Millionen von Dokumenten, Karteikarten und Unterlagen.

Kostenloses Konto erstellen

Du hast bereits ein Konto? Anmelden