Visualization - Cheatsheet
Definition und Ziele der Informationsvisualisierung
Definition:
Informationsvisualisierung: Darstellung komplexer Daten in grafischer Form zur Unterstützung des Verständnisses und der Analyse.
Details:
- Daten verständlich und zugänglich präsentieren.
- Erkennen von Mustern und Trends erleichtern.
- Entscheidungsfindung unterstützen.
- Effektive Kommunikation von Informationen.
- Tools: Diagramme, Graphen, interaktive Dashboards.
Theorien und Modelle der visuellen Wahrnehmung
Definition:
Theorien und Modelle der visuellen Wahrnehmung zielen darauf ab, zu erklären, wie das Gehirn visuelle Informationen aus der Umwelt verarbeitet und interpretiert.
Details:
- Bottom-Up-Prozesse: Verarbeitung beginnt mit den Sinnesdaten. Beispiel: Merkmalsdetektion.
- Top-Down-Prozesse: Vorwissen und Erwartungen beeinflussen Wahrnehmung. Beispiel: Kontextabhängigkeit.
- Gestalttheorie: Prinzipien der Organisation und Gruppierung (z.B. Nähe, Ähnlichkeit, Fortsetzung).
- Konstanzphänomene: Wahrnehmung bleibt stabil trotz Änderungen der Umgebungsbedingungen. Beispiel: Farb-, Form-, Größenkonstanz.
- Marrs Computationstheorie: Drei Stufen der visuellen Verarbeitung: Primäre Rohskizze, 2.5D Skizze, 3D Modell.
Techniken zur Manipulation von Visualisierungen
Definition:
Details:
- Filterung: Selektion von Datenpunkten zur Anzeige.
- Aggregation: Zusammenfassen mehrerer Datenpunkte, z.B. Mittelwerte.
- Zooming und Panning: Vergrößern und Verschieben der Ansicht.
- Details-on-Demand: Zusätzliche Informationen bei Bedarf anzeigen.
- Brushing: Hervorheben bestimmter Datenpunkte in mehreren verknüpften Visualisierungen.
- Verzerrung (Distortion): Anpassung des Maßstabs zur Hervorhebung wichtiger Bereiche.
- Reichenfolge Manipulation: Ändern der Anzeigereihenfolge der Daten.
- Animation: Darstellung von Änderungen über die Zeit.
Dimensionale Reduktionstechniken
Definition:
Techniken zur Verringerung der Anzahl der Zufallsvariablen, um Daten einfacher analysierbar und visualisierbar zu machen.
Details:
- Hauptkomponentenanalyse (PCA): Unkorrelierte Hauptkomponenten finden
- t-SNE: Hochdimensionale Daten auf niedrigdimensionalen Raum abbilden
- UMAP: Beibehaltung der globalen Struktur
- Lineare Diskriminanzanalyse (LDA): Klassen trennen
- Wichtig für Datenvorverarbeitung und Visualisierung
Einführung in D3.js
Definition:
D3.js: JavaScript-Bibliothek zur Erstellung dynamischer, interaktiver Datenvisualisierungen, basierend auf Webstandards wie SVG, HTML5 und CSS.
Details:
- D3 = Data-Driven Documents
- Bindung von Daten an DOM-Elemente
- Erstellung von SVG-Grafiken
- Datenmanipulation und Transformationen
- Skalen und Achsen zur Normierung
- Animationen und Übergänge
- Zugriff auf umfangreiche Layouts und Diagramme
- Einbindung von Interaktivität (Mausereignisse, Zoom, etc.)
- Installation über CDN oder npm:
npm install d3
- Grundstruktur: Selektieren, Binden, Erstellen, Aktualisieren
Techniken zur Vermeidung von Informationsüberflutung
Definition:
Techniken zur Reduktion der Menge und Komplexität von Informationen, um Überforderung der Nutzer zu verhindern.
Details:
- Filterung: Unwichtige Informationen ausblenden.
- Zusammenfassung: Essenzielle Informationen verdichten.
- Visuelle Hierarchie: Wichtige Elemente hervorheben.
- Chunking: Informationen in kleinere, handhabbare Einheiten zerlegen.
- Interaktive Visualisierungen: Nutzer können benötigte Informationen gezielt abrufen.
- Dashboards: Zusammengefasste und relevante Informationen auf einen Blick darstellen.
Rauschen reduzieren und Anomalien erkennen
Definition:
Rauschen in Daten entfernen, um Anomalien / Abweichungen effizient zu erkennen
Details:
- Rauschen reduzieren: Filtern/Aggressiv glätten
- Anomalien erkennen: Statistische Methoden, maschinelles Lernen
- Grundlagen: Mittelwert, Median, Standardabweichung
- Werkzeuge: Moving Average, Medianfilter, PCA, SVM, Isolation Forest
- Formeln:
- - Mittelwert: \( \mu = \frac{1}{N} \sum_{i=1}^N x_i \)
- - Standardabweichung: \( \sigma = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \mu)^2} \)
- - Anomalieerkennung mit Z-Score: \( z = \frac{x - \mu}{\sigma} \)
Visualisierung wissenschaftlicher Daten
Definition:
Visuelle Darstellung komplexer wissenschaftlicher Daten zur Muster-, Trend- und Anomalieerkennung.
Details:
- Datenarten: quantitativ, qualitativ, Zeitserien
- Grafiktypen: Scatterplots, Heatmaps, 3D-Plots
- Software: Matplotlib, ggplot, d3.js
- Prinzipien: Klarheit, Präzision, Effizienz
- Datenvorverarbeitung: Bereinigung, Normalisierung