Projekt Biomedical Network Science - Cheatsheet
Definition und Bedeutung von Netzwerken in der Biomedizin
Definition:
Netzwerke in der Biomedizin analysieren komplexe biologische Systeme durch mathematische Modelle und graphentheoretische Methoden zur Erkennung von Zusammenhängen und Interaktionen.
Details:
- Vernetzt biologische Daten (z.B. Gene, Proteine, Krankheiten).
- Verwendet Knoten (Entitäten) und Kanten (Interaktionen).
- Unterstützt beim Verständnis von Krankheitsmechanismen und der Entdeckung neuer therapeutischer Ziele.
- Beispiele: Protein-Protein-Interaktionsnetzwerke, genetische Netzwerke.
- Mathematische Modelle wie \textbf{Random-Walk}, \textbf{Shortest Path Analysis} und \textbf{Community Detection}.
Grundlegende Analysemetriken und Algorithmen der Netzwerkanalyse
Definition:
Grundlegende Metriken und Algorithmen, die zur Analyse von Netzwerken verwendet werden, um Struktur, Effizienz undverbindungen zu untersuchen.
Details:
- Degree: Anzahl der Verbindungen eines Knotens.
- Betweenness Centrality: Maß für die Häufigkeit, wie oft ein Knoten auf dem kürzesten Pfad zwischen zwei anderen Knoten liegt.
- Closeness Centrality: Maß für die durchschnittliche Kürze der Pfade von einem Knoten zu allen anderen Knoten.
- Eigenvector Centrality: Maß für die Bedeutung eines Knotens basierend auf der Bedeutung seiner Nachbarn.
- PageRank: Algorithmus zur Bestimmung der Relevanz eines Knotens, basierend auf der Anzahl und Qualität der Verbindungen.
- Clustering Coefficient: Maß für die Tendenz von Knoten, Cluster zu bilden.
- Dijkstra-Algorithmus: Finden der kürzesten Pfade von einem Startknoten zu allen anderen Knoten.
- Floyd-Warshall-Algorithmus: Berechnung der kürzesten Pfade zwischen allen Paaren von Knoten.
- Komponenten-Analyse: Identifikation der zusammenhängenden Teile im Netzwerk.
- Gemeinschaftserkennung: Aufdeckung von Gruppen von Knoten mit vielen internen Verbindungen und wenigen externen Verbindungen.
Modelle zur Darstellung metabolischer und regulatorischer Netzwerke
Definition:
Mathematische und computergestützte Methoden zur Analyse und Modellierung biochemischer Prozesse und Interaktionen in Zellen.
Details:
- Ordinary Differential Equations (ODEs): \[ \frac{dy}{dt} = f(y, t) \]
- Stoichiometrische Matrizen: Darstellen von Reaktionen in Matrixform
- Constraint-based Modelle: FBA (Flux Balance Analysis)
- Graphentheorie: Knoten und Kanten als Metaboliten und Reaktionen
- Petri-Netze: Modellierung diskreter Ereignisse in Netzwerken
- Topologische Analyse: Ermittlung struktureller Eigenschaften
Methoden zur Integration unterschiedlicher Datenquellen
Definition:
Techniken zur Kombination und Vereinheitlichung von Daten aus verschiedenen Quellen für eine einheitliche Analyse und Nutzung.
Details:
- ETL (Extract, Transform, Load): Daten aus verschiedenen Quellen extrahieren, transformieren und in ein Zielsystem laden.
- Data Warehousing: Strukturierte Speicherung und Verwaltung integrierter Daten aus unterschiedlichen Quellen.
- Data Federation: Virtuelle Vereinheitlichung von Datenquellen ohne physischen Datenimport.
- API-Integration: Nutzung von Schnittstellen, um auf Daten aus unterschiedlichen Systemen zuzugreifen und diese zu konsolidieren.
- Schema Matching und Harmonisierung: Identifikation und Anpassung von unterschiedlichen Datenschemata, um Konsistenz zu gewährleisten.
- Verwendung von Datenintegrations-Tools wie Talend, Apache Nifi oder Informatica.
Herausforderungen der biomedizinischen Datenintegration
Definition:
Integration von heterogenen biomedizinischen Datenquellen zur Erstellung kohärenter und nutzbarer Datenbanken.
Details:
- Heterogenität der Datenformate und -quellen (z.B. Genomik, Proteomik, klinische Daten)
- Datenqualität und -konsistenz
- Skalierbarkeit und Speicherung großer Datenmengen
- Sicherheits- und Datenschutzanforderungen
- Standardisierung und Interoperabilität von Datensätzen
- Effiziente Datenverarbeitung und -analyse
- Integration von strukturierten und unstrukturierten Daten
Simulation und Vorhersagemodellierung biologischer Netzwerke
Definition:
Simulation und Vorhersagemodellierung biologischer Netzwerke umfasst die Nutzung computergestützter Modelle zur Vorhersage und Analyse dynamischer Verhaltensmuster in biologischen Systemen.
Details:
- Modelle: Deterministisch (z.B. ODEs) und stochastisch
- Vanier-Stochastic Model für stochastische Prozesse
- Flux Balance Analysis (FBA) zur Analyse von Stoffwechselwegen
- Parameteridentifikation durch Optimierungsverfahren
- Evaluierung mittels experimenteller Daten
- Software: MATLAB, R, Python, Copasi
- Ziel: Verständnis und Vorhersage von Netzwerkdynamiken
Visualisierung biomedizinischer Netzwerke
Definition:
Verfahren zur Darstellung und Analyse von Netzwerken in der Biomedizin. Ziel: Mustererkennung und Einsicht in Wechselwirkungen.
Details:
- Wichtige Werkzeuge: Cytoscape, Gephi
- Netzwerkelemente: Knoten (Proteine, Gene), Kanten (Interaktionen)
- Wichtige Diagrammtypen: Adjazenzmatrizen, Netzwerkgraphen
- Kennzahlen: Zentralität, Gradverteilung
Cluster- und Community-Analysen in biomedizinischen Netzwerken
Definition:
Analyse von Gruppen ähnlicher Knoten in biomedizinischen Netzwerken.
Details:
- Ziele: Erkennung funktioneller Module, Krankheitseinheiten, Gen-Funktions-Beziehungen
- Algorithmen: k-Means, Hierarchisches Clustering, Louvain
- Modularität: Maß zur Bewertung der Güte der Cluster
- Gemeinsamkeiten vs. Unterschiede: Cluster = ähnliche Knoten, Community = stark intern verknüpfte Knoten
- Wichtige Maße: Modularity \textit{Q}, Silhouette-Koeffizient, Normalized Mutual Information (NMI)