Scientific Visualization - Cheatsheet
Grundlagen der wissenschaftlichen Visualisierung
Definition:
Grundlagen der wissenschaftlichen Visualisierung beinhalten Methoden und Techniken zur graphischen Darstellung wissenschaftlicher Daten zur besseren Analyse und Interpretation.
Details:
- Zielt auf bessere Verständlichkeit komplexer Daten
- Verwendet 2D- und 3D-Darstellungen
- Schlüsselkonzepte: Datenrepräsentation, Rendering, Farbmodelle
- Werkzeuge: VTK, ParaView, Matplotlib
- Oft gekoppelt mit großen Datenmengen und Simulationsdaten
- Methoden: Isosurfaces, Volume Rendering, Vector Plots
- Visualisierungspipeline: Daten, Mapping, Rendering
2D- und 3D-Visualisierungstechniken
Definition:
Darstellung und Interpretation wissenschaftlicher Daten in zwei- oder dreidimensionalen räumlichen Formaten.
Details:
- 2D-Visualisierung: Darstellung auf einer Ebene, z.B. Diagramme, Karten.
- 3D-Visualisierung: Darstellungen im dreidimensionalen Raum, z.B. Volumendaten, Oberflächen-Rendering.
- Wichtige Techniken: Isolinien (2D), Isosurfaces (3D), Slice-Darstellung, Voxel-basierte Methoden, Raytracing.
- Software: Matplotlib (2D), VTK, Paraview, Blender (3D).
- Anwendungsbeispiele: Medizinische Bildgebung, Strömungssimulation, Geowissenschaften.
- Datenvorbereitung: Wichtig für Genauigkeit und Effizienz, inkl. Datenfilterung und -Normalisierung.
- Interaktive vs. statische Visualisierung: Interaktive erlaubt Benutzerinteraktion (z.B. Zoom, Rotation).
Datenformate und -strukturen
Definition:
Datenformate und -strukturen: Grundlegende Mechanismen für die Organisation und Darstellung von Daten jeglicher Art.
Details:
- Primitive Datenformate: int, float, char
- Komplexe Datenformate: Arrays, Strukturen, Dateien
- Speicherorganisation: Stack vs. Heap
- Lineare Datenstrukturen: Arrays, Listen
- Nicht-lineare Datenstrukturen: Bäume, Graphen
- Binäre Formatierungen: XML, JSON, YAML
- Vis-Spezifische Formate: NIfTI, DICOM
- Datenkompression: verlustfrei (z.B. ZIP), verlustbehaftet (z.B. JPEG)
Volumenvisualisierung
Definition:
Visualisierung von 3D-Datensätzen mittels grafischer Techniken zur Darstellung innerer Strukturen.
Details:
- Direkte Verfahren: Raycasting, Splatting
- Indirekte Verfahren: Isosurface-Extraktion mit Marching Cubes
- Transfer-Funktionen: Zuordnung von Farbe und Opazität zu Skalardaten
- Datenquellen: CT, MRT, Simulationen
Techniken zur interaktiven Visualisierung
Definition:
Techniken zur interaktiven Visualisierung ermöglichen eine benutzerfreundliche und dynamische Darstellung von Daten zur Analyse und Exploration.
Details:
- Direkte Manipulation: Benutzereingaben beeinflussen direkt die Visualisierung.
- Fokus+Kontext-Techniken: Kombinieren Überblick und Detailansicht.
- Multimodale Interaktion: Nutzung verschiedener Eingabegeräte und -formen.
- Zooming und Panning: Ermöglicht Vergrößern/Verkleinern und Verschieben der Ansicht.
- Linking & Brushing: Selektion in einer Ansicht wirkt sich auf andere Ansichten aus.
- Animation: Zeigt Veränderungen im Zeitablauf oder durch Interaktionen.
Maßnahmen zur Datenbereinigung und -vorverarbeitung
Definition:
Prozess der Vorbereitung roher Daten für die Visualisierung, inklusive Entfernen von Fehlern und Inkonsistenzen.
Details:
- Entfernung von Duplikaten: Identifizierung und Entfernung redundanter Daten.
- Fehlende Werte behandeln: Ersetzen fehlender Werte durch Mittelwert, Median oder spezielle Marker.
- Ausreißerbehandlung: Erkennung und Korrektur oder Entfernung extremer Werte.
- Normalisierung: Skalierung der Daten auf einen einheitlichen Bereich.
- Datentransformation: Konvertierung von Datenformaten zur Vereinheitlichung.
- Filterung: Eliminieren irrelevanter oder überflüssiger Datenpunkte.
- Datenaggregation: Zusammenfassen mehrerer Datenpunkte zu statistischen Kennzahlen.
Algorithmen zur Datenreduktion
Definition:
Algorithmen zur Datenreduktion verringern die Datenmenge, ohne wesentliche Informationen zu verlieren.
Details:
- Datenkompression: Reduktion von Daten durch spezielle Kodierung (z.B. Huffman, LZW).
- Feature Selection: Auswahl der wichtigsten Datenattribute zur Analyse (z.B. PCA, LDA).
- Sampling: Auswahl einer Untermenge von Datenpunkten (z.B. Random Sampling, Stratified Sampling).
- Clustering: Gruppierung ähnlicher Datenpunkte (z.B. K-Means, DBSCAN).
- Sparsity: Verwendung von Techniken, die wenige, informative Datenpunkte identifizieren (z.B. Lasso-Regression).
- Approximation: Näherungsweise Darstellung der Daten (z.B. Fourier-Transformation).
Techniken zur multivariaten Datenrepräsentation
Definition:
Darstellung von Daten mit mehreren Variablen gleichzeitig.
Details:
- Parallel Coordinates: Daten als Linien durch parallele Achsen darstellen.
- Sternplott: Jeder Punkt hat Achsen für jede Variable, Längen der Linien sind Werte.
- Scatterplot Matrix: Matrix aus Scatterplots für paarweise Variablenbeziehungen.
- Principal Component Analysis (PCA): Daten auf Hauptkomponenten reduzieren.
- Glyphplots: Verwenden Symbole, um multivariate Daten abzubilden.
- Heatmap: Werte mit Farben in einer Matrix darstellen.