Bachelor's Thesis - Exam.pdf

Bachelor's Thesis - Exam

Aufgabe 1) In einer Studie zur Zellbiologie und Genetik untersuchst Du menschliche Zellen und ihre genetischen Prozesse, um zu verstehen, wie genetische Informationen auf molekularer Ebene reguliert und exprimiert werden. Du verwendest verschiedene Techniken der Molekularbiologie und beobachtest sowohl die Struktur der Zelle als auch die Dynamik ihres Zellzyklus. Im Verlauf der Untersuchung sind d...

Aufgabe 1)

In einer Studie zur Zellbiologie und Genetik untersuchst Du menschliche Zellen und ihre genetischen Prozesse, um zu verstehen, wie genetische Informationen auf molekularer Ebene reguliert und exprimiert werden. Du verwendest verschiedene Techniken der Molekularbiologie und beobachtest sowohl die Struktur der Zelle als auch die Dynamik ihres Zellzyklus. Im Verlauf der Untersuchung sind diverse genetische Mutationen und ihre Auswirkungen auf die Zellfunktion zu analysieren.

a)

Beschreibe den Aufbau einer typischen menschlichen Zelle und erläutere die Funktion der wichtigsten Zellorganellen wie Mitochondrien, Chloroplasten und Ribosomen.

Lösung:

Aufbau einer typischen menschlichen Zelle:

Zellmembran: Diese umgibt die Zelle und reguliert den Stoffaustausch mit der Umgebung. Sie ist halbdurchlässig und ermöglicht den Ein- und Ausfluss von Molekülen.
Zellkern: Der Zellkern enthält die DNA, das genetische Material der Zelle. Er steuert die Zellaktivitäten, indem er die Genexpression reguliert.
Cytoplasma: Ein gelartiges Medium, in dem die Organellen suspendiert sind und das verschiedene biochemische Reaktionen beherbergt.
Endoplasmatisches Retikulum (ER): Das ER ist in zwei Formen vorhanden: raues ER (mit Ribosomen bedeckt) und glattes ER. Das raue ER ist an der Proteinsynthese und -modifikation beteiligt, während das glatte ER Lipide synthetisiert und Kalzium speichert.
Golgi-Apparat: Er modifiziert, verpackt und verteilt Proteine und Lipide, die vom ER stammen.
Lysosomen: Diese enthalten Verdauungsenzyme, die Makromoleküle abbauen und Abfallprodukte recyceln.
Mitochondrien: Diese sind die Kraftwerke der Zelle und erzeugen ATP durch oxidative Phosphorylierung. Sie spielen eine Schlüsselrolle im Energiestoffwechsel.
Peroxisomen: Sie enthalten Enzyme, die Fettsäuren und andere Moleküle oxidieren sowie Wasserstoffperoxid abbauen.
Cytoskelett: Ein Netzwerk aus Proteinfilamenten, das der Zelle Struktur und Stabilität verleiht und an der Zellbewegung beteiligt ist.
Centriolen: Diese spielen eine wichtige Rolle bei der Zellteilung, indem sie die Chromosomentrennung organisieren.

Funktion der wichtigsten Zellorganellen:

Mitochondrien: Die Hauptfunktion der Mitochondrien ist die Produktion von Adenosintriphosphat (ATP), dem Energieträger der Zelle. Sie sind auch an anderen Prozessen wie dem Zitronensäurezyklus, dem Elektronentransport und der Apoptose beteiligt.
Chloroplasten (nicht in menschlichen Zellen, aber zur Vollständigkeit kurz erwähnt): Diese sind in Pflanzenzellen vorhanden und betreiben die Photosynthese, indem sie Lichtenergie in chemische Energie umwandeln. Dies ist in menschlichen Zellen nicht relevant, wird aber oft in biologischen Diskussionen über Zellfunktionen erwähnt.
Ribosomen: Ribosomen sind die zellulären Maschinen, die Proteine synthetisieren, indem sie die Informationen der mRNA in die Aminosäuresequenz eines Proteins übersetzen. Sie können frei im Cytoplasma oder an das raue endoplasmatische Retikulum gebunden sein.

b)

Erkläre die Phasen des Zellzyklus, beginnend mit der Interphase über die Mitose bis zur Cytokinese. Diskutiere die Unterschiede im Prozess der Mitose im Vergleich zur Meiose und die jeweiligen biologischen Bedeutung.

Lösung:

Phasen des Zellzyklus:

Interphase: Die Interphase ist die längste Phase des Zellzyklus und wird in drei Unterphasen unterteilt:

G1-Phase (Gap 1): Die Zelle wächst und die Organellen vervielfältigen sich. Gleichzeitig bereitet die Zelle sich auf die DNA-Replikation vor.
S-Phase (Synthese): Die DNA wird repliziert, wodurch die Chromosomen verdoppelt werden. Am Ende dieser Phase hat die Zelle doppelt so viel DNA wie zu Beginn.
G2-Phase (Gap 2): Die Zelle wächst weiter, und die Organellen vervielfältigen sich erneut. Sie bereitet sich auf die Mitose vor, wobei die nötigen Proteine und Enzyme produziert werden.

Mitose: Dies ist die Phase der Zellteilung, die in fünf Unterphasen unterteilt ist:

Prophase: Die Chromosomen kondensieren und werden sichtbar. Der Spindelapparat beginnt sich zu bilden, und die Kernhülle löst sich auf.
Prometaphase: Die Chromosomen binden sich an die Spindelfasern an ihren Kinetochoren.
Metaphase: Die Chromosomen reihen sich in der Mitte der Zelle entlang der Metaphaseplatte auf.
Anaphase: Die Schwesterchromatiden werden getrennt und zu den entgegengesetzten Polen der Zelle gezogen.
Telophase: Neue Kernhüllen bilden sich um die beiden Chromosomensätze, und die Chromosomen dekondensieren.

Cytokinese: Diese Phase schließt die Zellteilung ab, indem das Cytoplasma der Mutterzelle aufgeteilt wird und zwei Tochterzellen entstehen. Bei tierischen Zellen führt ein kontraktiler Ring zur Teilung der Zellmembran, während bei pflanzlichen Zellen eine Zellplatte gebildet wird.

Unterschiede zwischen Mitose und Meiose:

Mitose: Die Mitose ist ein Prozess der Zellteilung, bei dem eine diploide Zelle zwei identische diploide Tochterzellen erzeugt. Dieser Prozess ist essenziell für das Wachstum, die Erneuerung und die Reparatur von Geweben. Die Mitose umfasst einen einzigen Teilungszyklus und führt zu genetisch identischen Zellen.
Meiose: Die Meiose ist ein spezieller Prozess der Zellteilung, der zur Produktion von Gameten (Eizellen und Spermien) bei sexuellen Organismen führt. Hierbei durchläuft die Zelle zwei aufeinanderfolgende Teilungen, die Meiose I und Meiose II, und resultiert in vier haploiden Tochterzellen, die genetisch voneinander verschieden sind. In der Meiose I werden homologe Chromosomenpaare getrennt, und in der Meiose II werden die Schwesterchromatiden getrennt. Die Meiose erhöht die genetische Vielfalt durch Rekombination und zufällige Verteilung der Chromosomen.

Biologische Bedeutung:

Mitose: Die Mitose ist wichtig für das Wachstum und die Entwicklung von Organismen, die Wundheilung und das Ersetzen abgenutzter oder beschädigter Zellen. Sie gewährleistet, dass jede Tochterzelle die gleiche genetische Information wie die Mutterzelle besitzt.
Meiose: Die Meiose ist entscheidend für die sexuelle Fortpflanzung und die genetische Diversität von Populationen. Sie ermöglicht die Kombination von genetischem Material beider Eltern und erzeugt neue Allel-Kombinationen, die in der Evolution von Vorteil sein können.

c)

Gegeben ist die DNA-Sequenz: 5'-ATGCGTACGTTAG-3'. Transkribiere die Sequenz in die entsprechende mRNA-Sequenz und übersetze sie anschließend in die Aminosäuresequenz. Erkläre den Prozess der Transkription und Translation im Detail.

Lösung:

Transkription und Translation der gegebenen DNA-Sequenz:

Gegebene DNA-Sequenz: 5'-ATGCGTACGTTAG-3'
Transkription in mRNA-Sequenz: Während der Transkription wird die DNA-Sequenz in eine komplementäre mRNA-Sequenz umgeschrieben. Dabei wird das Thymin (T) durch Uracil (U) ersetzt. Die komplementäre mRNA-Sequenz zur gegebenen DNA-Sequenz lautet:

5'-AUGCGUACGUUAG-3'

Translation in Aminosäuresequenz: Die mRNA-Sequenz wird in Codons (Dreiergruppen von Nukleotiden) gelesen, und jedes Codon kodiert für eine spezifische Aminosäure. Die Codons der mRNA-Sequenz und die entsprechenden Aminosäuren sind:

Start-Codon: AUG - Methionin (Met)
CGU - Arginin (Arg)
ACG - Threonin (Thr)
UUA - Leucin (Leu)
Stop-Codon: UAG (Stop-Codon; keine Aminosäure)

Aminosäuresequenz: Die resultierende Aminosäuresequenz lautet:

Met-Arg-Thr-Leu

Details des Prozesses der Transkription und Translation:

Transkription:

Die Transkription ist der Prozess, durch den die genetische Information von der DNA in eine mRNA-Sequenz umgeschrieben wird. Dies geschieht in mehreren Schritten:

Initiation: Die RNA-Polymerase bindet an einen spezifischen Promotor auf der DNA, der den Startpunkt für die Transkription markiert.
Elongation: Die RNA-Polymerase liest den DNA-Strang in 3'-5'-Richtung und synthetisiert die mRNA in 5'-3'-Richtung. Währenddessen paaren sich die RNA-Nukleotide komplementär zu den DNA-Nukleotiden (A zu U, T zu A, C zu G, G zu C).
Termination: Die Transkription endet, wenn die RNA-Polymerase eine Terminationssequenz auf der DNA erreicht. Die neu synthetisierte mRNA-Sequenz wird freigegeben.

Translation:

Die Translation ist der Prozess, durch den die mRNA-Sequenz in eine Aminosäuresequenz umgewandelt wird. Dies geschieht in Ribosomen und umfasst mehrere Schritte:

Initiation: Die kleine ribosomale Untereinheit bindet an das Start-Codon (AUG) auf der mRNA. Eine Initiator-tRNA, die Methionin trägt, bindet komplementär an das Start-Codon. Die große ribosomale Untereinheit tritt bei.
Elongation: Das Ribosom liest die mRNA-Codons nacheinander. Jede tRNA, die eine spezifische Aminosäure trägt, bindet an das entsprechende Codon und fügt die Aminosäure zur wachsenden Polypeptidkette hinzu. Dies geschieht durch die Bildung von Peptidbindungen zwischen den Aminosäuren.
Termination: Die Translation endet, wenn das Ribosom ein Stop-Codon (UAA, UAG oder UGA) erreicht. Es gibt keine tRNA, die eine Aminosäure zum Stop-Codon bringt, daher wird die Polypeptidkette freigegeben und das Ribosom zerfällt.

d)

Mutationen können erhebliche Auswirkungen auf die Genfunktion haben. Definiere verschiedene Arten von Mutationen, wie Punkmutationen und Insertionen. Erläutere, wie eine Punktmutation in der gegebenen DNA-Sequenz (5'-ATGCGTACGTTAG-3') die resultierende Proteinproduktion beeinflussen könnte.

Lösung:

Verschiedene Arten von Mutationen:

Punktmutationen: Punktmutationen sind Veränderungen eines einzelnen Nukleotids in der DNA-Sequenz. Es gibt drei Hauptarten von Punktmutationen:

Stille Mutation: Eine Mutation, bei der das veränderte Nukleotid keine Auswirkung auf die resultierende Aminosäure hat. Dies geschieht aufgrund der Redundanz im genetischen Code.
Missense-Mutation: Eine Mutation, bei der das veränderte Nukleotid zur Kodierung einer anderen Aminosäure führt. Dies kann die Struktur und Funktion des resultierenden Proteins beeinflussen.
Nonsense-Mutation: Eine Mutation, bei der das veränderte Nukleotid ein Stop-Codon erzeugt. Dies führt zur vorzeitigen Beendigung der Proteinproduktion und resultiert in einem verkürzten und meist funktionsunfähigen Protein.

Insertionen: Eine Insertion ist die Hinzufügung eines oder mehrerer Nukleotiden in die DNA-Sequenz. Dies kann zu einer Verschiebung des Leserasters (Frameshift) führen, was die gesamte Proteinsequenz nach der Insertion verändert.
Deletionen: Eine Deletion ist das Entfernen eines oder mehrerer Nukleotiden aus der DNA-Sequenz. Auch dies kann eine Frameshift-Mutation verursachen.

Auswirkungen einer Punktmutation in der gegebenen DNA-Sequenz:

Gegebene DNA-Sequenz: 5'-ATGCGTACGTTAG-3'

Betrachten wir verschiedene Szenarien einer Punktmutation innerhalb dieser Sequenz:

Stille Mutation: Wenn das dritte Nukleotid (G) zu einem C mutiert:

Mutierte DNA-Sequenz: 5'-ATC CGTACGTTAG-3'
Transkribierte mRNA-Sequenz: 5'-AUC CGUACGUUAG-3'
Aminosäuresequenz: Isoleucin-Arginin-Threonin-Leucin

Da sich die dritte Position des Codons ATG nicht auf die resultierende Aminosäure auswirkt (weil Isoleucin ebenfalls durch AUC codiert wird), bleibt die Proteinproduktion unverändert.

Missense-Mutation: Wenn das dritte Nukleotid (G) zu einem T mutiert:

Mutierte DNA-Sequenz: 5'-ATT CGTACGTTAG-3'
Transkribierte mRNA-Sequenz: 5'-AUU CGUACGUUAG-3'
Aminosäuresequenz: Isoleucin-Arginin-Threonin-Leucin

Hier wird das Start-Methionin durch Isoleucin ersetzt. Dies kann die Funktion des Proteins erheblich verändern, da das Start-Codon Auswirkungen auf den gesamten Translationsprozess hat.

Nonsense-Mutation: Wenn das fünfte Nukleotid (C) zu einem A mutiert:

Mutierte DNA-Sequenz: 5'-ATG AGTACGTTAG-3'
Transkribierte mRNA-Sequenz: 5'-AUG AGUACGUUAG-3'
Aminosäuresequenz: Methionin-Serin-Threonin-Leucin

In diesem Fall würde das Methionin durch Methionin-Serin ersetzt, was das entstehende Protein erheblich verändern könnte.

Zusammenfassung: Unterschiedliche Typen von Mutationen können verschiedene Auswirkungen auf die Genfunktion und Proteinproduktion haben. Punktmutationen wie stille, Missense- und Nonsense-Mutationen haben unterschiedliche Risiken und Konsequenzen. Stille Mutationen haben normalerweise keine Auswirkung, während Missense- und Nonsense-Mutationen potenziell schwere Folgen für die Struktur und Funktion des Proteins haben können.

Aufgabe 2)

Du führst ein Experiment durch, um die Anwesenheit eines Gens in einer DNA-Probe zu bestätigen. Hierfür verwendest Du die PCR (Polymerase-Kettenreaktion), gefolgt von einer Gel-Elektrophorese zur Analyse der Amplifikationsprodukte. Zuerst wird die DNA extrahiert und dann durch die PCR verstärkt. Dabei durchläuft die Probe wiederholt Zyklen von Denaturierung (94–98°C), Annealing (50–65°C) und Extension (72°C). Zur Analyse der PCR-Produkte führst Du eine Gel-Elektrophorese durch, bei der die Nukleinsäuren nach Größe und Ladung in einem Agarose-Gel aufgetrennt werden. Die DNA-Fragmente werden durch Farbstoffe wie Ethidiumbromid oder SYBR Green sichtbar gemacht.

a)

Beschreibe detailliert den Ablauf eines PCR-Zyklus und erkläre die Bedeutung jeder Phase (Denaturierung, Annealing und Extension) in Bezug auf die DNA-Amplifikation.

Lösung:

Der PCR-Zyklus besteht aus drei Hauptphasen: Denaturierung, Annealing und Extension. Hier ist eine detaillierte Beschreibung jeder Phase und ihrer Bedeutung in Bezug auf die DNA-Amplifikation:

Denaturierung: In dieser Phase wird die DNA-Probe auf eine hohe Temperatur von 94-98°C erhitzt. Diese Hitze führt dazu, dass die doppelsträngige DNA in zwei Einzelstränge aufgetrennt wird, indem die Wasserstoffbrückenbindungen zwischen den komplementären Basenpaaren aufgebrochen werden. Die Denaturierung ist entscheidend, da sie die DNA-Vorlage in Einzelstränge teilt, die als Matrizen für die Synthese neuer DNA dienen.
Annealing: Nachdem die DNA denaturiert wurde, wird die Temperatur auf einen Bereich von 50-65°C gesenkt, um die Primer an die Einzelstränge binden zu lassen. Diese Temperatur ist spezifisch für die Primersequenzen, da sie so gewählt wird, dass die Primer an ihre komplementären Sequenzen auf den Einzelsträngen binden können. Die Annealing-Phase ist wichtig, weil die Primer die Startpunkte für die DNA-Polymerase sind und somit die DNA-Synthese initiieren.
Extension: In der letzten Phase wird die Temperatur auf 72°C erhöht, was die optimale Temperatur für das Enzym Taq-Polymerase ist. Die Taq-Polymerase fügt Nukleotide an die an die Primer gebundenen DNA-Stränge an und synthetisiert so neue DNA-Stränge, die komplementär zu den Vorlage-Strängen sind. Dies führt zur Verdopplung der DNA-Menge in der Probe. Die Extension-Phase ist essenziell, da in jedem Zyklus die DNA amplifiziert wird, wodurch eine exponentielle Vervielfältigung der Zielsequenz erreicht wird.

b)

Gegeben eine DNA-Sequenz von 300 Basenpaaren, die Du durch PCR amplifizieren möchtest. Du verwendest ein Paar spezifischer Primer, die an den Enden der Zielsequenz binden. Zeichne eine repräsentative Graphik des PCR-Produkts nach 30 Zyklen, und berechne die theoretische Anzahl an DNA-Molekülen, die Du nach diesen Zyklen erhalten würdest, unter der Annahme einer 100%igen Effizienz jeder PCR-Reaktion.

Lösung:

Hier ist eine detaillierte Antwort mit Berechnungen und einer repräsentativen Grafik für das PCR-Produkt nach 30 Zyklen:

Berechnung der theoretischen Anzahl an DNA-Molekülen:Die Anzahl der DNA-Moleküle nach einer bestimmten Anzahl von Zyklen kann durch die Formel 2^n berechnet werden, wobei n die Anzahl der Zyklen ist. Für 30 Zyklen ergibt sich also: \(\text{Anzahl der DNA-Moleküle} = 2^{30}\) \(\text{Das ergibt:} 2^{30} = 1,073,741,824 \text{DNA-Moleküle}.
Repräsentative Grafik des PCR-Produkts:Die folgende Grafik visualisiert die exponentielle Zunahme der Anzahl der DNA-Moleküle nach jedem PCR-Zyklus:

Graphik:Die x-Achse stellt die Anzahl der Zyklen dar (von 1 bis 30), und die y-Achse stellt die Anzahl der DNA-Moleküle dar. Die Kurve zeigt eine exponentielle Steigerung, die für eine PCR-Reaktion typisch ist.

Zusammenfassung: Nach 30 Zyklen hättest Du theoretisch 1.073.741.824 DNA-Moleküle, angenommen die PCR verläuft mit 100% Effizienz in jedem Zyklus.

c)

Nach der PCR führst Du eine Gel-Elektrophorese durch, um die Größe der amplifizierten DNA-Fragmente zu bestimmen. Erkläre, wie die DNA-Fragmente im Gel aufgetrennt werden und wie die Fragmentgröße mit Hilfe eines DNA-Leiters (Molekulargewichtsmarkers) bestimmt wird. Wie würde das Bandenmuster aussehen, wenn die PCR erfolgreich war und welche Methoden würdest Du verwenden, um die Banden im Gel zu visualisieren?

Lösung:

Nach der PCR führst Du eine Gel-Elektrophorese durch, um die Größe der amplifizierten DNA-Fragmente zu bestimmen. Hier ist eine detaillierte Erklärung, wie die DNA-Fragmente im Gel aufgetrennt werden, wie die Fragmentgröße bestimmt wird und wie die Banden visualisiert werden können:

Auftrennung der DNA-Fragmente im Gel:Die Gel-Elektrophorese ist eine Technik zur Trennung von DNA-Fragmenten basierend auf ihrer Größe und Ladung. Die DNA-Fragmente werden in die Taschen des Agarose-Gels geladen und ein elektrisches Feld wird angelegt. Da DNA negativ geladen ist, bewegen sich die Fragmente in Richtung des positiven Pols. Kleinere Fragmente bewegen sich schneller und weiter durch das Gel, während größere Fragmente langsamer wandern. Dadurch entsteht ein Muster, bei dem die DNA-Fragmente nach ihrer Größe getrennt sind.
Bestimmung der Fragmentgröße mit einem DNA-Leiter:Ein DNA-Leiter (Molekulargewichtsmarker) ist eine Mischung von DNA-Fragmenten bekannter Größen, die als Referenz verwendet wird. Der DNA-Leiter wird in eine der Taschen des Gels geladen. Nach der Elektrophorese können die Positionen der Banden des DNA-Leiters mit den Positionen der unbekannten Fragmente verglichen werden. Durch den Vergleich kann die Größe der amplifizierten DNA-Fragmente bestimmt werden.
Bandenmuster bei erfolgreicher PCR:Wenn die PCR erfolgreich war, solltest Du eine klare Bande auf dem Gel sehen, die der Größe des amplifizierten Fragments entspricht (in diesem Fall 300 Basenpaare). Eine klare, einzelne Bande zeigt an, dass die Zielsequenz erfolgreich amplifiziert wurde. Wenn mehrere Banden oder keine Banden sichtbar sind, könnte dies auf unspezifische Amplifikation oder einen Fehlschlag der PCR hinweisen.
Visualisierung der Banden im Gel:Um die DNA-Banden zu visualisieren, können verschiedene Farbstoffe verwendet werden. Zwei gängige Farbstoffe sind:

Ethidiumbromid: Dieser Farbstoff interkaliert mit der DNA und fluoresziert unter UV-Licht. Wenn das Gel nach der Elektrophorese unter UV-Licht betrachtet wird, erscheinen die DNA-Banden als leuchtende Streifen.
SYBR Green: Dieser Farbstoff funktioniert ähnlich wie Ethidiumbromid, ist jedoch weniger toxisch. SYBR Green bindet ebenfalls an DNA und fluoresziert unter UV-Licht, wodurch die Banden sichtbar werden.

Zusammenfassung: Während der Gel-Elektrophorese werden die DNA-Fragmente basierend auf ihrer Größe getrennt. Mit einem DNA-Leiter können die Größen der Fragmente bestimmt werden. Bei erfolgreicher PCR solltest Du eine klare Bande sehen. Um die Banden zu visualisieren, können Ethidiumbromid oder SYBR Green verwendet werden.

Aufgabe 3)

Kontext: Angenommen, Du arbeitest an einem Projekt, das die Sequenzanalyse eines bislang unbekannten Gens eines Mikroorganismus umfasst. Du hast die DNA-Sequenz des Gens bereits sequenziert und möchtest nun diese Sequenz in Bezug auf ihre Funktion und Struktur analysieren. Du wirst verschiedene Bioinformatik-Tools anwenden, um diese Aufgaben durchzuführen. Deine Aufgaben sind:

Datenbankrecherche und -management
Sequenzanalyse (DNA, RNA, Protein)
Strukturanalyse und Modellierung
Genom- und Proteomik-Studien
Bioinformatik-Plattformen: BLAST, ClustalW, PyMOL, etc.

a)

Teilaufgabe 1: Verwende das BLAST-Tool, um die Funktion des unbekannten Gens zu bestimmen. Beschreibe im Detail, wie BLAST funktioniert und welche Schritte du durchführst, um relevante Daten zu erhalten. Analysiere die erhaltenen BLAST-Ergebnisse und diskutiere, wie diese zur Funktionsbestimmung des Gens beitragen.

Hinweis: Achte darauf, die verschiedenen Arten von BLAST (z.B. BLASTn, BLASTp) sowie die Parametereinstellungen von BLAST zu erklären und zu begründen.

Lösung:

Hinweis: Achte darauf, die verschiedenen Arten von BLAST (z.B. BLASTn, BLASTp) sowie die Parametereinstellungen von BLAST zu erklären und zu begründen.

Beschreibung von BLAST:

BLAST (Basic Local Alignment Search Tool) ist ein leistungsstarkes Bioinformatik-Tool, das verwendet wird, um Ähnlichkeiten zwischen biologischen Sequenzen zu finden. BLAST ermöglicht es, eine unbekannte DNA-, RNA- oder Proteinsequenz mit einer Datenbank von bekannten Sequenzen zu vergleichen, um Homologien und damit mögliche Funktionen zu identifizieren. Die wichtigsten Schritte sind:

Das Tool zerteilt die Eingabesequenz in kleine Fragmente, sogenannte K-Wörter.
Diese K-Wörter werden dann verwendet, um ähnliche Sequenzen in der Datenbank zu finden (als potenzielle Treffer).
Die potenziellen Treffer werden weiter analysiert, um die besten Alignments zu identifizieren. Die Alignments zeigen, wie gut die Fragmente der Eingabesequenz mit den Datenbanksequenzen übereinstimmen.
Die Ergebnisse werden dann basierend auf verschiedenen Metriken (z.B. Bit-Score, E-Wert) bewertet und sortiert.

Schritte zur Nutzung von BLAST:

1. Art der Sequenz bestimmen:

BLASTn für den Vergleich von DNA-Sequenzen.
BLASTp für den Vergleich von Protein-Sequenzen.
BLASTx für den Vergleich von DNA-Sequenzen, die in alle sechs möglichen Protein-Sequenzen übersetzt werden.

2. Sequenz hochladen: Lade die unbekannte Gensequenz in das BLAST-Tool. 3. Datenbank auswählen: Wähle die geeignete Datenbank für den Vergleich (z.B. RefSeq, nr). 4. Parameter einstellen: Passe die Parametereinstellungen an, um die Genauigkeit und Geschwindigkeit der Suche zu optimieren. Dies umfasst beispielsweise die Wahl des E-Werts (um die Stringenz des Suchergebnisses festzulegen) und der Substitutionsmatrix (bei der Proteinsuche). 5. Suche ausführen: Starte die Suche und warte auf die Ergebnisse. 6. Ergebnisse analysieren: Analyse der Top-Treffer bezüglich ihrer Bit-Scores und E-Werte, sowie der Alignments. Ein niedriger E-Wert und ein hoher Bit-Score deuten auf eine hohe Wahrscheinlichkeit hin, dass die Treffer sequenzielle Homologie aufweisen. Ein Beispiel für einen typischen E-Wert könnte sein:

E-Wert < 0.01 deutet auf eine signifikante Übereinstimmung hin.

Diskussion der Ergebnisse:

Die BLAST-Ergebnisse helfen dabei, die Funktion des unbekannten Gens zu bestimmen, indem sie zeigen, welche bekannten Gene und Proteine ähnliche Sequenzen aufweisen. Je nach Homologie und Funktion dieser bekannten Gene kann auf die Funktion des unbekannten Gens geschlossen werden. Beispielsweise könnte eine hohe Ähnlichkeit mit einem bekannten Enzym auf eine ähnliche enzymatische Funktion des unbekannten Gens hinweisen.

Darüber hinaus bietet BLAST oft weiterführende Informationen zu den homologen Sequenzen, wie z.B. strukturelle oder funktionale Annotationen. Diese Annotationen können benutzt werden, um Hypothesen über die Funktion des unbekannten Gens zu entwickeln und weitere Experimente zu planen.

b)

Teilaufgabe 2: Nachdem du die Sequenzanalyse durchgeführt hast, stelle dir vor, du möchtest ein 3D-Modell des Proteinprodukts des Gens erstellen. Beschreibe den Prozess der Strukturanalyse und Modellierung, indem du das Tool PyMOL anwendest. Gehe auf folgende Punkte ein:

Wie importierst du die Proteinsequenz in PyMOL?
Welche Schritte unternimmst du, um ein dreidimensionales Modell der Proteinstruktur zu erzeugen?
Welche Art von Analysen könntest du mit dem erzeugten 3D-Modell durchführen, um weitere Einblicke in die Funktion des Proteins zu erhalten? Gehe insbesondere auf mögliche Domänen, aktive Stellen und potenzielle Bindungsstellen ein.

Lösung:

Teilaufgabe 2: Nachdem Du die Sequenzanalyse durchgeführt hast, stelle Dir vor, Du möchtest ein 3D-Modell des Proteinprodukts des Gens erstellen. Beschreibe den Prozess der Strukturanalyse und Modellierung, indem Du das Tool PyMOL anwendest. Gehe auf folgende Punkte ein:

Wie importierst Du die Proteinsequenz in PyMOL?
Welche Schritte unternimmst Du, um ein dreidimensionales Modell der Proteinstruktur zu erzeugen?
Welche Art von Analysen könntest Du mit dem erzeugten 3D-Modell durchführen, um weitere Einblicke in die Funktion des Proteins zu erhalten? Gehe insbesondere auf mögliche Domänen, aktive Stellen und potenzielle Bindungsstellen ein.

Beschreibung des Prozesses der Strukturanalyse und Modellierung mit PyMOL:

PyMOL ist ein molekulares Visualisierungswerkzeug, das es ermöglicht, dreidimensionale Strukturen von Proteinen zu betrachten und zu analysieren. Hier sind die Schritte zur Erstellung eines 3D-Modells der Proteinstruktur:

1. Import der Proteinsequenz in PyMOL:

Zunächst muss die Proteinstruktur in einer geeigneten Datei (z.B. im PDB-Format) vorliegen. Diese Struktur kann von Datenbanken wie der Protein Data Bank (PDB) heruntergeladen werden. Wenn ein entsprechendes Experiment (z.B. Röntgenkristallographie oder Kryo-EM) bereits durchgeführt wurde, sind die Daten dort verfügbar.
Um eine Theorie-basierte Proteinstruktur zu erhalten, kann man Tools wie SWISS-MODEL oder Phyre2 verwenden, um ein Modell basierend auf der Aminosäuresequenz zu erstellen. Diese Tools generieren eine PDB-Datei, die dann in PyMOL importiert werden kann.

2. Erzeugen eines dreidimensionalen Modells der Proteinstruktur:

Starte PyMOL und lade die PDB-Datei. Dies kann durch das Eingeben des Befehls
```
'load filename.pdb'
```
in die PyMOL-Konsole erfolgen.
Visualisiere die Proteinstruktur mit verschiedenen Ansichten (z.B. Cartoon, Stick, Surface). Die Art der Visualisierung kann durch Befehle wie
```
'as cartoon'
```
oder
```
'show surface'
```
angepasst werden.
Wenn Anpassungen oder Korrekturen notwendig sind, können diese mit Befehlen wie
```
'remove water'
```
(um Wassermoleküle zu entfernen) oder
```
'refine structure'
```
durchgeführt werden.

3. Analysen mit dem erzeugten 3D-Modell:

Mit dem erzeugten 3D-Modell können verschiedene Analysen durchgeführt werden, um Einblicke in die Funktion des Proteins zu erhalten:

Identifikation von Domänen: Durch die Analyse des Modells können unterschiedliche Domänen im Protein identifiziert werden. Domänen sind strukturierte Teile eines Proteins, die oft spezifische Funktionen haben. Diese können durch unterschiedliche Farbgebung oder das Hervorheben spezifischer Regionen visualisiert werden.
Untersuchung aktiver Stellen: Aktive Stellen sind Bereiche im Protein, die für seine biologische Aktivität verantwortlich sind. Durch Vergleich mit bekannten Strukturen oder anhand einer funktionellen Annotation können diese Regionen identifiziert und in PyMOL hervorgehoben werden.
Analyse potenzieller Bindungsstellen: Potenzielle Bindungsstellen für Substrate, Inhibitoren oder andere Proteine können identifiziert werden. Diese Analyse beinhaltet die Untersuchung von Oberflächenstrukturen und elektrostatischen Potenzialen, die in PyMOL visualisiert werden können.
Mutagenese-Studien: Durch Simulation von Mutationen und deren Auswirkungen auf die Proteinstruktur und -funktion können Hypothesen über die Rolle bestimmter Aminosäuren getestet werden.

PyMOL bietet zahlreiche Möglichkeiten zur detaillierten Analyse von Proteinstrukturen, die das Verständnis der biochemischen und funktionellen Eigenschaften des Proteins vertiefen können.

Aufgabe 4)

Du bist als Statistiker an einer groß angelegten Studie zur Untersuchung der Auswirkung eines neuen Medikaments zur Behandlung von Bluthochdruck beteiligt. Die Studie umfasst eine Population von 10.000 Patienten. Eine Stichprobe von 200 Patienten wurde zufällig aus der Population ausgewählt, um die Wirksamkeit des Medikaments zu beurteilen.

Dabei wurden die Daten vor und nach der Medikamentenverabreichung gesammelt und statistisch ausgewertet. Du sollst die Daten der Stichprobe analysieren und interpretieren, um Schlussfolgerungen über die gesamte Population zu ziehen.

b)

b) Wahrscheinlichkeitsverteilung: Untersuche, ob die Blutdruckwerte der Patienten vor und nach der Behandlung der Normalverteilung folgen. Nutze hierfür geeignete statistische Tests und visualisiere die Verteilung der Daten.

Welche Chancen könnte eine Normalverteilung der Daten vor und nach der Behandlung bieten? Berechne und interpretiere den Shapiro-Wilk-Test für Normalverteilung.

Lösung:

Wahrscheinlichkeitsverteilung der Blutdruckwerte

Um zu überprüfen, ob die Blutdruckwerte der Patienten vor und nach der Behandlung der Normalverteilung folgen, verwenden wir geeignete statistische Tests und Visualisierungen. Der Shapiro-Wilk-Test ist hierbei ein gängiger Test zur Überprüfung der Normalverteilung.

Schritte zur Durchführung:

Visualisierung: Erstelle Histogramme und QQ-Plots (Quantil-Quantil-Plots) für die Blutdruckwerte vor und nach der Behandlung, um eine erste visuelle Einschätzung der Verteilung zu erhalten.
Shapiro-Wilk-Test: Führe den Shapiro-Wilk-Test für die Blutdruckwerte vor und nach der Behandlung durch, um statistisch zu überprüfen, ob die Daten der Normalverteilung folgen.

1. Visualisierung:

Erstelle Histogramme und QQ-Plots der Blutdruckwerte vor und nach der Behandlung:

import matplotlib.pyplot as pltimport scipy.stats as stats# Angenommene Blutdruckwerte (Beispielwerte)bp_before = [150, 160, 165, 148, 170, ...]  # vor der Behandlungbp_after = [140, 145, 150, 138, 155, ...]   # nach der Behandlung# Histogrammeplt.figure(figsize=(12, 5))plt.subplot(1, 2, 1)plt.hist(bp_before, bins=20, alpha=0.7, color='blue', edgecolor='black')plt.title('Blutdruckwerte vor der Behandlung')plt.xlabel('Blutdruck')plt.ylabel('Häufigkeit')plt.subplot(1, 2, 2)plt.hist(bp_after, bins=20, alpha=0.7, color='green', edgecolor='black')plt.title('Blutdruckwerte nach der Behandlung')plt.xlabel('Blutdruck')plt.show()# QQ-Plotsplt.figure(figsize=(12, 5))plt.subplot(1, 2, 1)stats.probplot(bp_before, dist='norm', plot=plt)plt.title('QQ-Plot vor der Behandlung')plt.subplot(1, 2, 2)stats.probplot(bp_after, dist='norm', plot=plt)plt.title('QQ-Plot nach der Behandlung')plt.show()

2. Shapiro-Wilk-Test:

Führe den Shapiro-Wilk-Test durch, um die Normalverteilung zu testen:

from scipy.stats import shapiro# Shapiro-Wilk-Teststat_before, p_before = shapiro(bp_before)stat_after, p_after = shapiro(bp_after)# Ergebnisseprint('Shapiro-Wilk-Test vor der Behandlung: Statistik=%.3f, p=%.3f' % (stat_before, p_before))print('Shapiro-Wilk-Test nach der Behandlung: Statistik=%.3f, p=%.3f' % (stat_after, p_after))

Interpretation der Ergebnisse:

Der Shapiro-Wilk-Test gibt zwei Werte aus:

Statistik-Wert: Dieser gibt an, wie sehr die Daten von einer Normalverteilung abweichen.
p-Wert: Ein p-Wert größer als 0,05 (bei einem Signifikanzniveau von 5%) deutet darauf hin, dass die Daten der Normalverteilung folgen.

Vor der Behandlung:

Statistik-Wert: stat_before
p-Wert: p_before

Wenn der p-Wert größer als 0,05 ist, können wir die Nullhypothese nicht ablehnen, d.h., die Blutdruckwerte vor der Behandlung folgen der Normalverteilung.

Nach der Behandlung:

Statistik-Wert: stat_after
p-Wert: p_after

Wenn der p-Wert größer als 0,05 ist, können wir die Nullhypothese nicht ablehnen, d.h., die Blutdruckwerte nach der Behandlung folgen der Normalverteilung.

Chancen der Normalverteilung:

Erleichterte Analyse: Wenn die Daten der Normalverteilung folgen, können verschiedene statistische Methoden und Tests angewendet werden, die diese Verteilung voraussetzen.
Verständnis und Interpretation: Die Normalverteilung erlaubt es uns, die Wahrscheinlichkeiten und Varianzen der Daten besser zu verstehen und zu interpretieren, was hilfreich für die Entscheidungsfindung in klinischen Studien ist.

Indem Du die Blutdruckwerte vor und nach der Behandlung bezüglich ihrer Normalverteilung überprüfst, kannst Du sicherstellen, dass die Voraussetzungen für weitere statistische Analysen gegeben sind und somit eine fundierte Bewertung der Medikamentenwirkungen ermöglichen.

c)

c) Statistische Tests und Korrelation: Führe einen t-Test durch, um die statistische Signifikanz der Reduktion des Blutdrucks durch das Medikament nachzuweisen. Berechne dabei den t-Wert und den p-Wert. Formuliere die Nullhypothese und die Alternativhypothese.

Untersuche zudem die Pearson-Korrelation (\texttt{r}) zwischen den Ausgangsblutdruckwerten und der Reduktion der Blutdruckwerte nach der Behandlung. Interpretiere deine Ergebnisse im Hinblick auf die Wirksamkeit des Medikaments.

Lösung:

Statistische Tests und Korrelation

Wir führen einen t-Test durch, um die statistische Signifikanz der Reduktion des Blutdrucks durch das Medikament nachzuweisen, und berechnen die Pearson-Korrelation zwischen den Ausgangsblutdruckwerten und der Reduktion der Blutdruckwerte.

Schritte zur Durchführung:

t-Test: Der t-Test wird verwendet, um die Mittelwerte von zwei verbundenen Stichproben (Blutdruckwerte vor und nach der Behandlung) zu vergleichen. Wir berechnen den t-Wert und den p-Wert.
Pearson-Korrelation: Berechnung der Pearson-Korrelation zwischen den Ausgangsblutdruckwerten und der Reduktion der Blutdruckwerte, um die Beziehung zwischen diesen Variablen zu untersuchen.

1. t-Test:

Formuliere die Hypothesen:

Nullhypothese (H₀): Es gibt keine signifikante Reduktion des Blutdrucks durch das Medikament (die Mittelwerte vor und nach der Behandlung sind gleich).
Alternativhypothese (H₁): Es gibt eine signifikante Reduktion des Blutdrucks durch das Medikament (die Mittelwerte vor und nach der Behandlung sind unterschiedlich).

Python-Code zur Berechnung des t-Tests:

import numpy as npfrom scipy.stats import ttest_rel# Angenommene Blutdruckwerte (Beispielwerte)bp_before = np.array([150, 160, 165, 148, 170, ...])  # vor der Behandlungbp_after = np.array([140, 145, 150, 138, 155, ...])   # nach der Behandlung# Berechnung des t-Tests t-stat, p_value = ttest_rel(bp_before, bp_after)# Ergebnisseprint('t-test: t-Statistik=%.3f, p-Wert=%.3f' % (t_stat, p_value))

2. Pearson-Korrelation:

Berechnung der Differenzen (Reduktionen) der Blutdruckwerte und der Pearson-Korrelation:

# Berechnung der Reduktionen bp_reduction = bp_before - bp_after# Berechnung der Pearson-Korrelation r, p_corr = np.corrcoef(bp_before, bp_reduction)[0, 1], p_corr = stats.pearsonr(bp_before, bp_reduction)# Ergebnisseprint('Pearson-Korrelation: r=%.3f, p-Wert=%.3f' % (r, p_corr))

Interpretation der Ergebnisse:

t-Test: Der t-Wert gibt an, wie stark sich die Mittelwerte unterscheiden, relativ zur Variabilität in den Daten. Ein p-Wert kleiner als 0,05 (bei einem Signifikanzniveau von 5%) deutet darauf hin, dass die Nullhypothese abgelehnt werden kann und es eine signifikante Reduktion des Blutdrucks gibt.

t-Wert: t_stat
p-Wert: p_value

Wenn der p-Wert kleiner als 0,05 ist, können wir die Nullhypothese ablehnen und schlussfolgern, dass das Medikament eine signifikante Wirkung auf die Senkung des Blutdrucks hat.

Pearson-Korrelation: Der Pearson-Korrelationskoeffizient (r) misst die Stärke und Richtung der linearen Beziehung zwischen den Ausgangsblutdruckwerten und der Reduktion nach der Behandlung. Ein positiver r-Wert deutet auf eine positive Korrelation hin, während ein negativer r-Wert auf eine negative Korrelation hinweist.

Korrelationskoeffizient (r): r
p-Wert der Korrelation: p_corr

Wenn der p-Wert kleiner als 0,05 ist, ist die Korrelation statistisch signifikant. Ein hoher positiver r-Wert würde darauf hindeuten, dass Patienten mit höheren Ausgangsblutdruckwerten tendenziell eine stärkere Reduktion des Blutdrucks erfahren.

Beispielhafte Ausgabe:

t-test: t-Statistik=5.234, p-Wert=0.001Pearson-Korrelation: r=0.684, p-Wert=0.000

Bei diesen Ergebnissen könnte man schlussfolgern, dass das Medikament eine signifikante Wirkung auf die Senkung des Blutdrucks hat und dass es eine positive Korrelation zwischen den Ausgangswerten und der Reduktion gibt, was auf eine stärkere Wirkung des Medikaments bei Patienten mit höheren Blutdruckwerten hinweist.

Bachelor's Thesis - Exam.pdf

Aufgabe 1)

a)

b)

c)

d)

Aufgabe 2)

a)

b)

c)

Aufgabe 3)

a)

b)

Aufgabe 4)

b)

Wahrscheinlichkeitsverteilung der Blutdruckwerte

Schritte zur Durchführung:

1. Visualisierung:

2. Shapiro-Wilk-Test:

Interpretation der Ergebnisse:

Chancen der Normalverteilung:

c)

Statistische Tests und Korrelation

Schritte zur Durchführung:

1. t-Test:

2. Pearson-Korrelation:

Interpretation der Ergebnisse:

Melde dich kostenlos an, um Zugriff auf das vollständige Dokument zu erhalten