Einführung in die Bioinformatik für die Translationale Medizin - Cheatsheet
Definition und Geschichte der Bioinformatik
Definition:
Bioinformatik: Anwendung von Informatikmethoden zur Analyse biologischer Daten. Ursprünge in den 1960er Jahren aufgrund der Notwendigkeit, molekularbiologische Daten effizient zu verarbeiten.
Details:
- 1960er: Erste Auswertungen von DNA/RNA-Sequenzen.
- 1970er: Entwicklung von Algorithmen zur Sequenzanalyse.
- 1980er: Wachstum durch Human Genome Project und Datenbanken wie GenBank.
- 1990er+: Hochdurchsatzsequenzierung und -datenanalyse, integrative Ansätze in Genomics, Proteomics.
Alignments: Pairwise und Multiple Sequence Alignments
Definition:
Vergleich und Ausrichtung von zwei (Paarweiser) oder mehreren (Multiple) Sequenzen, um Ähnlichkeiten, Unterschiede und evolutionäre Beziehungen zu erkennen.
Details:
- Pairwise Alignment: Vergleich zweier Sequenzen zur Bestimmung ihrer Ähnlichkeit.
- Multiple Sequence Alignment (MSA): Gleichzeitiger Vergleich und Ausrichtung mehrerer Sequenzen.
- Verwendete Algorithmen: Needleman-Wunsch (global), Smith-Waterman (lokal) für Paarweiser Alignment; Clustal Omega, MUSCLE für MSA.
- Bewertung: Scoring-Matrizen wie PAM oder BLOSUM, Gap-Penalties.
- Anwendungen: Homologie- und Funktionsvorhersage, evolutionsbiologische Studien.
3D-Strukturbestimmung mittels Röntgenkristallographie und NMR
Definition:
Bestimmung der dreidimensionalen Struktur von Molekülen mittels Röntgenkristallographie und Kernspinresonanz (NMR).
Details:
- Röntgenkristallographie: Kristallisation notwendig, Röntgenstrahlen erzeugen Beugungsmuster, Elektronendichtekarte wird erstellt, 3D-Struktur durch Modellierung aus der Elektronendichte.
- NMR-Spektroskopie: Analysiert magnetische Eigenschaften von Atomkernen in einem Magnetfeld, Aufklärung der Struktur in Lösungen, multidimensionale NMR zur besseren Strukturaufklärung.
- Beide Methoden liefern atomare Auflösung, komplementäre Techniken: Röntgen für feste Kristalle, NMR für flexible, lösliche Proteine.
- Anwendung in der Medizin: Design von Medikamenten, Verständnis von Protein-Ligand-Interaktionen.
Machine Learning-Methoden in der Medizin
Definition:
Einsatz von Algorithmen und statistischen Modellen zur Analyse und Interpretation medizinischer Daten.
Details:
- Beispiele: Entscheidungsbäume, Neuronale Netze, SVMs
- Wichtige Anwendungen: Diagnostik, Prognose, personalisierte Medizin
- Training und Validierung: Kreuzvalidierung, ROC-Kurve, AUC
- Daten: EHRs, Genomdaten, Bilddaten
- Herausforderungen: Datenqualität, Interpretierbarkeit, Datenschutz
- Evaluation: Genauigkeit, Präzision, Reproduzierbarkeit
Personalisierte Medizin und Genomsequenzierung
Definition:
Individuell angepasste medizinische Behandlung basierend auf den genetischen Informationen des Patienten.
Details:
- Genomsequenzierung: Untersuchung der vollständigen DNA-Sequenz eines Organismus.
- Ziel: Optimierung der Diagnostik und Therapie.
- Anwendungen: Krebsbehandlung, Pharmakogenetik.
- Technologien: Next-Generation Sequencing (NGS), CRISPR.
- Herausforderungen: Datenschutz, ethische Fragen.
Algorithmen wie Needleman-Wunsch und Smith-Waterman
Definition:
Algorithmen für Sequenzalignment (global: Needleman-Wunsch, lokal: Smith-Waterman); zentrale Tools in Bioinformatik für die Identifikation von Sequenzähnlichkeiten.
Details:
- Needleman-Wunsch: globales Alignment
- Smith-Waterman: lokales Alignment
- Beide Algorithmen nutzen dynamische Programmierung
- Ziel: Maximierung des Alignment-Scores
- Scoring-Matrix: Belohnung für Übereinstimmungen, Bestrafung für Lücken und Fehlausrichtungen
- Komplexität: beide \textit{O}(n^2)
Homologie-Modellierung und Ab initio Methoden
Definition:
Homologie-Modellierung: Strukturvorhersage basierend auf ähnlichen Proteinstrukturen (Templates); Ab initio Methoden: Strukturvorhersage nur aus der Aminosäuresequenz ohne Templates
Details:
- Homologie-Modellierung: nutzt Sequenz-Homologie zu bekannten Strukturen.
- Schritte der Homologie-Modellierung: Template-Erkennung, Sequenz-Ausrichtung, Modellbau, Verfeinerung und Validierung.
- Ab initio Methoden: physikalisch-chemische Prinzipien und algorithmische Vorhersagen.
- Verwendet Methoden wie Monte-Carlo-Simulationen, Molekulardynamik.
- Vorteil Homologie-Modellierung: schnell und genau bei hohen Sequenzähnlichkeiten.
- Vorteil Ab initio: unabhängig von bekannten Strukturen, nützlich für neue Proteine.
Omics-Technologien und ihre klinischen Anwendungen
Definition:
Technologien zur umfassenden Analyse biologischer Moleküle (Genomics, Proteomics, Metabolomics) zur Gewinnung tiefgehender Erkenntnisse für die Medizin.
Details:
- Genomics: Analyse des gesamten Genoms, Sequenzierung
- Proteomics: Untersuchung des Proteoms, Protein-Protein-Interaktionen
- Metabolomics: Analyse von Metaboliten, Stoffwechselwege
- Klinische Anwendungen: Personalisierte Medizin, Diagnose, Behandlung maßgeschneidert auf molekularer Ebene
- Werkzeuge: NGS, Massenspektrometrie, Bioinformatik