Business intelligence - Cheatsheet
Definition und strategische Bedeutung von Business Intelligence
Definition:
BI ist der Prozess der Gewinnung und Analyse von Daten, um fundierte Geschäftsentscheidungen zu treffen. Strategische Bedeutung: BI hilft Unternehmen, Wettbewerbsfähigkeit zu sichern und Geschäftsergebnisse zu optimieren.
Details:
- Datenquellen: interne und externe Daten
- Datenaufbereitung: ETL-Prozesse (Extraktion, Transformation, Laden)
- Analysewerkzeuge: OLAP, Data Mining, Reporting
- Ergebnisse: Dashboards, Berichte, KPIs
- Nutzung in: Entscheidungsfindung, Marktanalyse, Performance-Überwachung
- Vorteile: schnellere Entscheidungen, vorausschauende Analysen, bessere Ressourcennutzung
ETL-Prozesse (Extract, Transform, Load)
Definition:
ETL-Prozesse: Extraktion, Transformation und Laden von Daten aus verschiedenen Quellen in ein Data Warehouse.
Details:
- Extract: Daten aus verschiedenen Quellen sammeln und extrahieren.
- Transform: Datenbereinigung, -anreicherung und -transformation zur Anpassung an Zielformate.
- Load: Transformierte Daten in das Ziel-Datenbanksystem laden.
- Ziel: Konsolidierte und integrierte Daten für Analysen und Reporting bereitstellen.
Konzepte und Architektur von Data Warehouses
Definition:
Konzepte und Architektur von Data Warehouses beinhalten die strukturierte Sammlung und Verwaltung großer Datenmengen aus verschiedenen Quellen, um datengetriebene Entscheidungen zu unterstützen.
Details:
- Einteilung in Schichten: Datenquelle, Staging, Datenlager, Data Marts
- ETL-Prozess (\textbf{E}xtract, \textbf{T}ransform, \textbf{L}oad): Datenextraktion, -transformation und -ladung
- Datenspeicherung: Normalisierung, Denormalisierung, Stern- und Schneeflockenschema
- Online Analytical Processing (OLAP): Multidimensionale Abfragen für Datenanalyse
- Wichtig für Decision Support Systems (DSS)
- Metadata und Data Governance für Datenmanagement
OLAP (Online Analytical Processing) und seine Vorteile
Definition:
Methode zur schnellen Auswertung und Analyse großer Datenmengen in multidimensionalen Datenbanken.
Details:
- Bietet multidimensionale Sichten auf die Daten (Würfelstruktur)
- Unterstützt komplexe Abfragen (Slices, Dices, Drills)
- Ermöglicht schnelle Aggregationen und Berechnungen
- Vorteile: Zeitersparnis, bessere Entscheidungsgrundlage, höhere Datenqualität
- Anwendung: Finanzanalyse, Vertriebsprognosen, Marktforschung
Data Mining-Methoden: Klassifikation, Clusterbildung, Assoziationsanalyse
Definition:
Datenanalyse-Techniken für Mustererkennung und Wissensextraktion aus großen Datenmengen
Details:
- Klassifikation: Zuweisung von Daten zu vordefinierten Kategorien
- Vorhersagemodelle: z.B. Entscheidungsbäume, Neuronale Netze
- Clusterbildung: Gruppierung ähnlicher Datenpunkte
- Techniken: k-Means, hierarchisches Clustering
- Assoziationsanalyse: Identifizierung von Beziehungen und Mustern zwischen Variablen
- Regelbasierte Methoden: z.B. Apriori-Algorithmus, FP-Growth
Techniken zur Datenvisualisierung und Erstellung interaktiver Dashboards
Definition:
Techniken zur Erstellung von visuellen Darstellungen von Daten und zur Entwicklung interaktiver Dashboards.
Details:
- Datenvisualisierungstools: Tableau, Power BI, QlikView.
- Typen von Visualisierungen: Balkendiagramme, Liniendiagramme, Kreisdiagramme, Streudiagramme.
- Dashboard-Design-Prinzipien: Klarheit, Konsistenz, Benutzerfreundlichkeit.
- Datenintegration: Verbindung zu verschiedenen Datenquellen (SQL, Excel, Cloud-Datenbanken).
- Interaktive Features: Drill-Down, Filter, Echtzeit-Datenaktualisierung.
- Wichtige Metriken und KPIs festlegen.
Vergleich von BI mit verwandten Disziplinen (z.B. Data Science, Analytics)
Definition:
Vergleich von Business Intelligence (BI) mit verwandten Disziplinen wie Data Science und Analytics - knapp und prägnant, wie auf einem Spickzettel;
Details:
- Business Intelligence (BI): Sammlung, Aufbereitung und Analyse von Daten, um Geschäftsentscheidungen zu unterstützen.
- Data Science: Interdisziplinäres Feld, das statistische Methoden, Algorithmen und Technologie einsetzt, um Wissen aus Daten zu extrahieren.
- Analytics: Anwendung mathematischer und statistischer Methoden auf Daten, um Muster und Trends zu erkennen.
- Gemeinsamkeiten: Alle konzentrieren sich auf Datenanalyse und Entscheidungsunterstützung.
- Unterschiede: BI - Fokus auf vergangene und gegenwärtige Daten; Data Science - Fokus auf Prognosen und maschinelles Lernen; Analytics - Breitere Anwendung, oft spezialisierte Analysen.
Best Practices für Betrieb und Wartung von Data Warehouses
Definition:
Best Practices für Betrieb und Wartung von Data Warehouses: Set von Methoden und Techniken zur effizienten Verwaltung und Optimierung der Leistung eines Data Warehouses.
Details:
- Automatisierung von ETL-Prozessen: Reduziert manuelle Fehler und erhöht Effizienz.
- Regelmäßige Datenbereinigung: Verbessert Datenqualität und Zuverlässigkeit.
- Monitoring und Performance-Tuning: Überwachen der Systemleistung; Anpassung von Indizes und Abfragen bei Bedarf.
- Sicherheitsmaßnahmen: Implementierung von Zugangskontrollen und Verschlüsselung.
- Backup und Wiederherstellung: Regelmäßige Backups zur Datensicherung und Notfallwiederherstellung.
- Skalierbarkeit: Nutzung einer skalierbaren Infrastruktur zur Bewältigung von wachsender Datenmenge.
- Dokumentation und Schulung: Sicherstellung, dass alle Anpassungen dokumentiert werden und das Personal geschult ist.