Statistik I: Deskriptive Statistik - Exam.pdf

Statistik I: Deskriptive Statistik - Exam
Aufgabe 1) Ein Unternehmen möchte die Zufriedenheit seiner Mitarbeiter hinsichtlich ihrer aktuellen Arbeitsbedingungen untersuchen. Eine Stichprobe von 100 Mitarbeitern wurde befragt, wobei die Zufriedenheit auf einer Skala von 1 (sehr unzufrieden) bis 5 (sehr zufrieden) bewertet wurde. Die ermittelten Zufriedenheitswerte sind: 2, 3, 4, 2, 5, 3, 2, 1, 4, 3, 4, 5, 2, 3, 4, 2, 4, 1, 3, 4, 2, 3, 4, 5...

© StudySmarter 2024, all rights reserved.

Aufgabe 1)

Ein Unternehmen möchte die Zufriedenheit seiner Mitarbeiter hinsichtlich ihrer aktuellen Arbeitsbedingungen untersuchen. Eine Stichprobe von 100 Mitarbeitern wurde befragt, wobei die Zufriedenheit auf einer Skala von 1 (sehr unzufrieden) bis 5 (sehr zufrieden) bewertet wurde. Die ermittelten Zufriedenheitswerte sind: 2, 3, 4, 2, 5, 3, 2, 1, 4, 3, 4, 5, 2, 3, 4, 2, 4, 1, 3, 4, 2, 3, 4, 5, 2, 3, 4, 2, 4, 1, 3, 4, 5, 2, 3, 4, 2, 4, 1, 3, 4, 5, 2, 4, 3, 2, 4, 1, 5, 3, 2, 4, 3, 4, 2, 4, 1, 3, 4, 5, 2, 3, 4, 2, 4, 1, 3, 4, 5, 2, 3, 4, 2, 4, 1, 3, 4, 3, 3, 4, 2, 4, 1, 3, 4, 5, 2, 3, 4, 2, 4, 1, 3, 4, 5, 3, 4, 2.

a)

Sub-Exercise 1: Erstelle eine tabellarische Häufigkeitsverteilung für die Zufriedenheitswerte. Berechne dazu sowohl die absoluten als auch die relativen Häufigkeiten. Stelle Deine Ergebnisse anschließend in einem Stabdiagramm dar.

Lösung:

Um eine tabellarische Häufigkeitsverteilung für die Zufriedenheitswerte zu erstellen, beginnen wir mit der Berechnung der absoluten und relativen Häufigkeiten. Hier sind die Zufriedenheitswerte von 1 bis 5 und ihre Häufigkeiten:

  • Zufriedenheitswert 1: 10
  • Zufriedenheitswert 2: 18
  • Zufriedenheitswert 3: 21
  • Zufriedenheitswert 4: 36
  • Zufriedenheitswert 5: 15

Die relativen Häufigkeiten berechnen wir, indem wir die absoluten Häufigkeiten durch die Gesamtzahl der Befragten (100) teilen.

  • Relative Häufigkeit für Zufriedenheitswert 1: 0,10
  • Relative Häufigkeit für Zufriedenheitswert 2: 0,18
  • Relative Häufigkeit für Zufriedenheitswert 3: 0,21
  • Relative Häufigkeit für Zufriedenheitswert 4: 0,36
  • Relative Häufigkeit für Zufriedenheitswert 5: 0,15

Hier ist die tabellarische Darstellung:

Zufriedenheitswert Absolute Häufigkeit Relative Häufigkeit
1 10 0,10
2 18 0,18
3 21 0,21
4 36 0,36
5 15 0,15

Um die Ergebnisse in einem Stabdiagramm darzustellen, verwenden wir Python und die Bibliothek Matplotlib. Hier ist der entsprechende Code:

 import matplotlib.pyplot as plt Zufriedenheitswerte = [1, 2, 3, 4, 5] Absolute_Haeufigkeit = [10, 18, 21, 36, 15] plt.bar(Zufriedenheitswerte, Absolute_Haeufigkeit, color='blue') plt.xlabel('Zufriedenheitswert') plt.ylabel('Absolute Häufigkeit') plt.title('Stabdiagramm der Zufriedenheit bei den Mitarbeitern') plt.xticks([1, 2, 3, 4, 5]) plt.show() 

Dieser Code erstellt ein Stabdiagramm, das die absoluten Häufigkeiten der Zufriedenheitswerte darstellt.

b)

Sub-Exercise 2: Berechne die kumulativen Häufigkeiten für die Zufriedenheitswerte und interpretiere, was die kumulativen Häufigkeiten im Kontext dieser Umfrage aussagen.

Lösung:

Um die kumulativen Häufigkeiten der Zufriedenheitswerte zu berechnen, addieren wir die absoluten Häufigkeiten der Zufriedenheitswerte schrittweise. Wir beginnen mit der Anzahl der Antworten für den ersten Zufriedenheitswert und summieren dann die Anzahl der Antworten für jeden darauf folgenden Wert.

  • Zufriedenheitswert 1: 10
  • Zufriedenheitswert 2: 28 (10 + 18)
  • Zufriedenheitswert 3: 49 (28 + 21)
  • Zufriedenheitswert 4: 85 (49 + 36)
  • Zufriedenheitswert 5: 100 (85 + 15)

Hier sind die kumulativen Häufigkeiten in tabellarischer Form:

Zufriedenheitswert Absolute Häufigkeit Kumulative Häufigkeit
1 10 10
2 18 28
3 21 49
4 36 85
5 15 100

Die kumulativen Häufigkeiten geben uns an, wie viele Mitarbeiter eine bestimmte Zufriedenheit oder niedriger auf der Skala angegeben haben. Dies ist besonders nützlich, um zu sehen, wie sich die Zufriedenheit insgesamt verteilt:

  • Zufriedenheitswert 1: 10 Mitarbeiter sind sehr unzufrieden.
  • Zufriedenheitswert 2: 28 Mitarbeiter sind unzufrieden oder sehr unzufrieden.
  • Zufriedenheitswert 3: 49 Mitarbeiter sind neutral oder unzufrieden.
  • Zufriedenheitswert 4: 85 Mitarbeiter sind zufrieden, neutral oder unzufrieden.
  • Zufriedenheitswert 5: Alle 100 Mitarbeiter sind entweder sehr zufrieden, zufrieden, neutral oder unzufrieden. Das heißt, alle befragten Mitarbeiter sind in der kumulativen Häufigkeit von 5 einbezogen.

Die kumulativen Häufigkeiten helfen, ein besseres Verständnis davon zu bekommen, wie die Zufriedenheit insgesamt unter den befragten Mitarbeitern verteilt ist. Man sieht, dass ein großer Teil (85%) der Mitarbeiter mindestens neutral bis sehr zufrieden ist (Zufriedenheitswert 4 oder weniger). Dies kann verwendet werden, um Maßnahmen zur Verbesserung der Zufriedenheit zu identifizieren und zu priorisieren.

c)

Sub-Exercise 3: Zeichne ein Histogramm der Zufriedenheitswerte und diskutiere, welche Informationen und Erkenntnisse Du aus dem Histogramm ableiten kannst.

Lösung:

Um ein Histogramm der Zufriedenheitswerte zu zeichnen, verwenden wir die zufällig ermittelten Werte. Ein Histogramm stellt die Häufigkeitsverteilung der Daten graphisch dar.

Schrittweise Anleitung zur Erstellung eines Histogramms:
  • Ermittle die Häufigkeit jedes Zufriedenheitswertes (bereits in Sub-Exercise 1 gegeben).
  • Zeichne die x-Achse mit den Zufriedenheitswerten (1 bis 5).
  • Zeichne die y-Achse mit den entsprechenden Häufigkeiten.
  • Erstelle Balken für jede Häufigkeit.

Hier ist der Python-Code zur Erstellung eines Histogramms mit der Bibliothek Matplotlib:

 import matplotlib.pyplot as plt Zufriedenheitswerte = [2, 3, 4, 2, 5, 3, 2, 1, 4, 3, 4, 5, 2, 3, 4, 2, 4, 1, 3, 4, 2, 3, 4, 5, 2, 3, 4, 2, 4, 1, 3, 4, 5, 2, 3, 4, 2, 4, 1, 3, 4, 5, 2, 4, 3, 2, 4, 1, 5, 3, 2, 4, 3, 4, 2, 4, 1, 3, 4, 5, 2, 3, 4, 2, 4, 1, 3, 4, 5, 2, 3, 4, 2, 4, 1, 3, 4, 3, 3, 4, 2, 4, 1, 3, 4, 5, 2, 3, 4, 2, 4, 1, 3, 4, 5, 3, 4, 2] plt.hist(Zufriedenheitswerte, bins=[1, 2, 3, 4, 5], edgecolor='black', align='left') plt.xlabel('Zufriedenheitswert') plt.ylabel('Häufigkeit') plt.title('Histogramm der Zufriedenheitswerte bei den Mitarbeitern') plt.xticks([1, 2, 3, 4, 5]) plt.show() 

Dieser Code erzeugt ein Histogramm, das die Häufigkeit jedes Zufriedenheitswerts anzeigt.

Diskussion der Informationen und Erkenntnisse aus dem Histogramm:
  • Das Histogramm zeigt, dass die meisten Mitarbeiter Zufriedenheitswerte von 3 und 4 angegeben haben, was darauf hinweist, dass die Mehrheit der Mitarbeiter neutral bis zufrieden mit ihren Arbeitsbedingungen ist.
  • Ein signifikanter Anteil der Mitarbeiter hat Zufriedenheitswerte von 2 angegeben, was darauf hinweist, dass es eine bemerkenswerte Anzahl von Mitarbeitern gibt, die unzufrieden sind.
  • Nur wenige Mitarbeiter haben extreme Werte (1 für sehr unzufrieden und 5 für sehr zufrieden) angegeben. Dies deutet darauf hin, dass die meisten Mitarbeiter eine moderate bis mittlere Zufriedenheit empfinden.
  • Die Verteilung der Zufriedenheitswerte ist asymmetrisch, wobei eine Tendenz zu höheren Zufriedenheitsgraden (3 und 4) sichtbar ist.

Aus diesen Erkenntnissen lässt sich ableiten, dass das Unternehmen Maßnahmen ergreifen sollte, um die Zufriedenheit der unzufriedenen Mitarbeiter (Zufriedenheitswert 2) zu verbessern und gleichzeitig die Faktoren zu stärken, die zu den hohen Zufriedenheitswerten (3 und 4) beitragen.

d)

Sub-Exercise 4: Diskutiere kurz, warum es in der deskriptiven Statistik wichtig ist, diese unterschiedlichen Arten von Häufigkeitsverteilungen darzustellen. Gehe dabei besonders auf den Unterschied zwischen relativen und kumulativen Häufigkeiten ein.

Lösung:

In der deskriptiven Statistik ist es wichtig, verschiedene Arten von Häufigkeitsverteilungen darzustellen, da jede Form der Verteilung unterschiedliche Einblicke in die Datensätze bietet. Diese Verteilungen helfen, die Daten besser zu verstehen, Trends und Muster zu erkennen und fundierte Entscheidungen zu treffen.

  • Absolute Häufigkeiten: Die absolute Häufigkeit zeigt, wie oft ein bestimmter Wert in einem Datensatz vorkommt. Dies ist eine grundlegende Form der Häufigkeitsverteilung und bietet eine direkte und einfache Möglichkeit, die Rohdaten zu analysieren.
  • Relative Häufigkeiten: Die relative Häufigkeit wird berechnet, indem die absolute Häufigkeit eines Wertes durch die Gesamtanzahl der Datenpunkte geteilt wird. Dies gibt an, welcher Anteil des gesamten Datensatzes einen bestimmten Wert aufweist. Relative Häufigkeiten sind besonders nützlich, wenn man verschiedene Datensätze mit unterschiedlicher Stichprobengröße vergleichen möchte, da sie die Daten auf einer einheitlichen Skala darstellen:
    • \textbf{Beispiel:} Wenn wir wissen möchten, wie oft ein bestimmter Zufriedenheitswert innerhalb der befragten 100 Mitarbeiter auftritt, können wir dies leicht an der relativen Häufigkeit ablesen und daraus ableiten, wie repräsentativ ein bestimmter Wert innerhalb der Stichprobe ist.
  • Kumulative Häufigkeiten: Die kumulative Häufigkeit ist die Summe der absoluten (oder relativen) Häufigkeiten bis zu einem bestimmten Wert. Sie zeigt, wie viele Datenpunkte mindestens einen bestimmten Wert erreichen. Dies ist besonders hilfreich, wenn man verstehen möchte, wie sich die Daten über die Skala hinweg ansammeln:
    • \textbf{Beispiel:} Mit kumulativen Häufigkeiten kann man erkennen, wie viele Mitarbeiter mit einer Zufriedenheit von 3 oder weniger angegeben haben. Dies ist hilfreich, um eine Vorstellung davon zu bekommen, wie viele Mitarbeiter insgesamt weniger zufrieden sind.

Das Erstellen und Interpretieren dieser unterschiedlichen Häufigkeitsverteilungen hat mehrere Vorteile:

  • Identifikation von Trends und Mustern: Absolute und relative Häufigkeiten helfen, Trends und Muster innerhalb der Daten zu identifizieren.
  • Vergleichbarkeit: Relative Häufigkeiten ermöglichen es, verschiedene Datasets mit unterschiedlichen Größen zu vergleichen.
  • Kumulative Analyse: Kumulative Häufigkeiten bieten eine tiefere Einblicke in die akkumulierten Daten und können helfen, Schwellenwerte und Grenzen besser zu verstehen.

Insgesamt tragen die unterschiedlichen Häufigkeitsverteilungen dazu bei, die Daten umfassender und genauer zu analysieren, was wiederum zu besseren Erkenntnissen und Entscheidungen führen kann.

Aufgabe 2)

In einer Produktionsfirma werden die monatlichen Umsatzdaten von zehn verschiedenen Vertriebsmitarbeitern erfasst. Die Umsatzdaten (in Tausend Euro) für einen bestimmten Monat sind: 12, 15, 22, 21, 14, 20, 35, 25, 30, 18. Nutze diese Daten, um die Berechnungen durchzuführen und die Box-Plots zu interpretieren.

a)

Berechne das Minimum, das 1. Quartil, den Median, das 3. Quartil und das Maximum der Umsatzdaten. Stelle sicher, dass Du alle Schritte und Berechnungen ausführlich erklärst.

Lösung:

Um das Minimum, das 1. Quartil, den Median, das 3. Quartil und das Maximum der Umsatzdaten zu berechnen, befolge diese Schritte:

  • Schritt 1: Sortiere die Umsatzdaten in aufsteigender Reihenfolge.Die gegebenen Umsatzdaten sind: 12, 15, 22, 21, 14, 20, 35, 25, 30, 18.Sortierte Daten: 12, 14, 15, 18, 20, 21, 22, 25, 30, 35.
  • Schritt 2: Bestimme das Minimum.Das Minimum ist der kleinste Wert in den sortierten Daten.Minimum = 12.
  • Schritt 3: Bestimme das Maximum.Das Maximum ist der größte Wert in den sortierten Daten.Maximum = 35.
  • Schritt 4: Berechne den Median.Der Median ist der mittlere Wert in einer geordneten Liste von Zahlen. Da wir zehn Daten (gerade Anzahl) haben, ist der Median der Durchschnitt der fünften und sechsten Werte. \[ \text{Median} = \frac{20 + 21}{2} = \frac{41}{2} = 20.5 \text{ (Tausend Euro)} \]
  • Schritt 5: Berechne das 1. Quartil (Q1).Das 1. Quartil ist der Wert, unter dem 25 % der Daten liegen. Dies bedeutet, dass Q1 der Median der ersten Hälfte der sortierten Daten ist.Sortierte Daten der ersten Hälfte: 12, 14, 15, 18, 20.Der Median dieser Daten ist der dritte Wert (15).Q1 = 15 (Tausend Euro).
  • Schritt 6: Berechne das 3. Quartil (Q3).Das 3. Quartil ist der Wert, unter dem 75 % der Daten liegen. Dies bedeutet, dass Q3 der Median der zweiten Hälfte der sortierten Daten ist.Sortierte Daten der zweiten Hälfte: 21, 22, 25, 30, 35.Der Median dieser Daten ist der dritte Wert (25).Q3 = 25 (Tausend Euro).

Zusammenfassend sind die berechneten Werte:

  • Minimum = 12 (Tausend Euro)
  • 1. Quartil (Q1) = 15 (Tausend Euro)
  • Median = 20.5 (Tausend Euro)
  • 3. Quartil (Q3) = 25 (Tausend Euro)
  • Maximum = 35 (Tausend Euro)

b)

Bestimme den Interquartilsabstand (IQR) der Umsatzdaten und berechne die typischen Whiskers-Längen. Zeige deine Herleitung und Ergebnisse.

Lösung:

Um den Interquartilsabstand (IQR) der Umsatzdaten und die typischen Whiskers-Längen zu berechnen, befolge diese Schritte:

  • Schritt 1: Bestimme das 1. Quartil (Q1) und das 3. Quartil (Q3).Die Umsatzdaten sind bereits sortiert: 12, 14, 15, 18, 20, 21, 22, 25, 30, 35. Q1 (1. Quartil) = 15 (Tausend Euro) Q3 (3. Quartil) = 25 (Tausend Euro)
  • Schritt 2: Berechne den Interquartilsabstand (IQR). Der IQR ist die Differenz zwischen dem 3. Quartil und dem 1. Quartil. \[ \text{IQR} = Q3 - Q1 = 25 - 15 = 10 \text{ (Tausend Euro)} \]
  • Schritt 3: Berechne die typischen Whiskers-Längen. Die typischen Whiskers erstrecken sich vom ersten Quartil bis zu \(Q1 - 1.5 \times IQR\) und vom dritten Quartil bis zu \(Q3 + 1.5 \times IQR\).
    • Berechne die untere Grenze der Whiskers: \[ \text{Untere Grenze} = Q1 - 1.5 \times IQR = 15 - 1.5 \times 10 = 15 - 15 = 0 \text{ (Tausend Euro)} \]
    • Berechne die obere Grenze der Whiskers: \[ \text{Obere Grenze} = Q3 + 1.5 \times IQR = 25 + 1.5 \times 10 = 25 + 15 = 40 \text{ (Tausend Euro)} \]

Zusammenfassend sind die berechneten Werte:

  • Interquartilsabstand (IQR) = 10 (Tausend Euro)
  • Untere Grenze der Whiskers = 0 (Tausend Euro)
  • Obere Grenze der Whiskers = 40 (Tausend Euro)

Die tatsächlichen Umsatzdaten liegen innerhalb dieser Grenzen, was bedeutet, dass es keine Ausreißer gibt. Der Box-Plot wird alle Umsatzwerte innerhalb dieser Whiskers-Längen darstellen.

c)

Identifiziere die Ausreißer in den Umsatzdaten basierend auf der definition von 1,5 * IQR. Erläutere, ob es Ausreißer gibt, und wenn ja, welche Werte dies sind.

Lösung:

Um Ausreißer in den Umsatzdaten zu identifizieren, verwenden wir die 1,5 * IQR-Regel. Folgende Schritte sind notwendig:

  • Schritt 1: Berechne den Interquartilsabstand (IQR). Die Umsatzdaten sind sortiert: 12, 14, 15, 18, 20, 21, 22, 25, 30, 35. Wir haben bereits Q1 (15 Tausend Euro) und Q3 (25 Tausend Euro) berechnet. \[ \text{IQR} = Q3 - Q1 = 25 - 15 = 10 \text{ (Tausend Euro)} \]
  • Schritt 2: Bestimme die Grenzen für die Ausreißer. Ein Wert wird als Ausreißer betrachtet, wenn er unter \(Q1 - 1.5 \times IQR\) oder über \(Q3 + 1.5 \times IQR\) liegt.
    • Untere Grenze: \[ \text{Untere Grenze} = Q1 - 1.5 \times IQR = 15 - 1.5 \times 10 = 15 - 15 = 0 \text{ (Tausend Euro)} \]
    • Obere Grenze: \[ \text{Obere Grenze} = Q3 + 1.5 \times IQR = 25 + 1.5 \times 10 = 25 + 15 = 40 \text{ (Tausend Euro)} \]
  • Schritt 3: Identifiziere die Ausreißer. Wir prüfen die Umsatzdaten: 12, 15, 22, 21, 14, 20, 35, 25, 30, 18. Die untere Grenze ist 0, daher gibt es keine Werte unterhalb dieser Grenze. Die obere Grenze ist 40, daher gibt es keine Werte oberhalb dieser Grenze. In diesen Umsatzdaten gibt es keine Ausreißer, da alle Werte innerhalb der definierten Grenzen (0 bis 40 Tausend Euro) liegen.

Zusammenfassend sind alle Umsatzdaten innerhalb der definierten Grenzen und es gibt keine Ausreißer.

d)

Zeichne einen Box-Plot basierend auf den berechneten Werten. Zeige den Box-Plot und diskutiere kurz, welche Informationen und Eigenschaften die Umsatzverteilung der Vertriebsmitarbeiter zeigt.

Lösung:

Um einen Box-Plot basierend auf den berechneten Werten zu zeichnen, folgen wir diesen Schritten und diskutieren anschließend die Informationen und Eigenschaften des Box-Plots.

  • Berechnete Werte: Die berechneten Werte sind:
    • Minimum: 12
    • 1. Quartil (Q1): 15
    • Median: 20.5
    • 3. Quartil (Q3): 25
    • Maximum: 35
  • Box-Plot - Darstellung: Der Box-Plot sieht wie folgt aus:
    • Linie bei Minimum (12)
    • Box von Q1 (15) bis Q3 (25)
    • Linie im Inneren der Box bei Median (20.5)
    • Linie bei Maximum (35)
    • Whiskers von Minimum zu Q1 und von Q3 zu Maximum

    Hier ist eine schematische Darstellung:

 |-----|-------------------------|----------|--------------|-----| ---------------------------- 12      15                   20.5        25             35 

Die Box repräsentiert den Bereich zwischen dem 1. Quartil (Q1) und dem 3. Quartil (Q3), in dem die mittleren 50% der Daten liegen. Der Median teilt diese Box in zwei Hälften, was den mittleren Wert der Daten zeigt. Die Whiskers erstrecken sich von den Quartilen zum Minimum und Maximum der Daten (ohne Ausreißer).

Interpretation des Box-Plots:

  • Die Box (Q1 bis Q3) zeigt, dass die meisten Umsatzdaten zwischen 15 und 25 Tausend Euro liegen.
  • Der Medianwert von 20.5 Tausend Euro zeigt, dass die Hälfte der Vertriebsmitarbeiter Umsätze unterhalb von 20.5 Tausend Euro und die andere Hälfte darüber haben.
  • Es gibt keine Ausreißer in den Daten, da alle Werte innerhalb der Whiskers (12 bis 35 Tausend Euro) liegen.
  • Die Spannweite der Umsätze ist von 12 bis 35 Tausend Euro, was eine Breite von 23 Tausend Euro ergibt.
  • Die Daten scheinen relativ gleichmäßig verteilt zu sein, ohne extreme Abweichungen.

Insgesamt zeigt der Box-Plot eine relativ gleichmäßige Verteilung der monatlichen Umsätze unter den Vertriebsmitarbeitern ohne bemerkenswerte Ausreißer.

Aufgabe 3)

Bayes' Theorem in Marketing Das Marketing-Team eines Unternehmens möchte herausfinden, wie wahrscheinlich es ist, dass ein Kunde einen neuen Produkttyp kauft, basierend auf dem Wissen, dass der Kunde an einer vorherigen Werbekampagne für ein ähnliches Produkt teilgenommen hat. Die historischen Daten des Unternehmens zeigen Folgendes:

  • 20% der Kunden haben an der Werbekampagne für das ähnliche Produkt teilgenommen
  • 30% der Kunden haben den neuen Produkttyp gekauft
  • 25% der Kunden, die an der Werbekampagne teilgenommen haben, haben den neuen Produkttyp gekauft
Verwende den Satz von Bayes, um die folgenden Fragen zu beantworten:

a)

Berechne die Wahrscheinlichkeit, dass ein Kunde an der Kampagne teilgenommen hat, gegebenenfalls er den neuen Produkttyp gekauft hat.

Lösung:

Bayes' Theorem in MarketingDas Marketing-Team eines Unternehmens möchte herausfinden, wie wahrscheinlich es ist, dass ein Kunde einen neuen Produkttyp kauft, basierend auf dem Wissen, dass der Kunde an einer vorherigen Werbekampagne für ein ähnliches Produkt teilgenommen hat. Die historischen Daten des Unternehmens zeigen Folgendes:

  • 20% der Kunden haben an der Werbekampagne für das ähnliche Produkt teilgenommen
  • 30% der Kunden haben den neuen Produkttyp gekauft
  • 25% der Kunden, die an der Werbekampagne teilgenommen haben, haben den neuen Produkttyp gekauft

Verwende den Satz von Bayes, um die folgenden Fragen zu beantworten:

Subexercise: Berechne die Wahrscheinlichkeit, dass ein Kunde an der Kampagne teilgenommen hat, gegebenenfalls er den neuen Produkttyp gekauft hat.

Um die Wahrscheinlichkeit zu berechnen, dass ein Kunde an der Kampagne teilgenommen hat, wenn bekannt ist, dass er den neuen Produkttyp gekauft hat, verwenden wir den Satz von Bayes:

Der Satz von Bayes lautet:

  • \( P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)} \)

Wobei:

  • \(A\): Ein Kunde hat an der Kampagne teilgenommen.
  • \(B\): Ein Kunde hat den neuen Produkttyp gekauft.
  • \(P(A)\): Die Wahrscheinlichkeit, dass ein Kunde an der Kampagne teilgenommen hat (20% oder 0,20).
  • \(P(B)\): Die Wahrscheinlichkeit, dass ein Kunde den neuen Produkttyp gekauft hat (30% oder 0,30).
  • \(P(B|A)\): Die Wahrscheinlichkeit, dass ein Kunde den neuen Produkttyp gekauft hat, gegebenenfalls er an der Kampagne teilgenommen hat (25% oder 0,25).

Wir setzen nun die bekannten Werte in die Bayes-Formel ein:

  • \( P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)} \)
  • \( P(A|B) = \frac{0,25 \cdot 0,20}{0,30} \)
  • \( P(A|B) = \frac{0,05}{0,30} \)
  • \( P(A|B) = \frac{1}{6} \) oder ca. 0,1667 (16,67%)

Die Wahrscheinlichkeit, dass ein Kunde an der Kampagne teilgenommen hat, gegebenenfalls er den neuen Produkttyp gekauft hat, beträgt also ca. 16,67%.

b)

Beurteile, wie sinnvoll es für das Unternehmen ist, eine weitere Werbekampagne zu starten, basierend auf den Informationen, die Du in Teil (a) berechnet hast.

Lösung:

Bayes' Theorem in MarketingDas Marketing-Team eines Unternehmens möchte herausfinden, wie wahrscheinlich es ist, dass ein Kunde einen neuen Produkttyp kauft, basierend auf dem Wissen, dass der Kunde an einer vorherigen Werbekampagne für ein ähnliches Produkt teilgenommen hat. Die historischen Daten des Unternehmens zeigen Folgendes:

  • 20% der Kunden haben an der Werbekampagne für das ähnliche Produkt teilgenommen
  • 30% der Kunden haben den neuen Produkttyp gekauft
  • 25% der Kunden, die an der Werbekampagne teilgenommen haben, haben den neuen Produkttyp gekauft

Verwende den Satz von Bayes, um die folgenden Fragen zu beantworten:

Subexercise: Beurteile, wie sinnvoll es für das Unternehmen ist, eine weitere Werbekampagne zu starten, basierend auf den Informationen, die Du in Teil (a) berechnet hast.

In Teil (a) haben wir die Wahrscheinlichkeit berechnet, dass ein Kunde an der Kampagne teilgenommen hat, gegebenenfalls er den neuen Produkttyp gekauft hat. Dies war etwa 16,67%. Um zu beurteilen, wie sinnvoll es ist, eine weitere Werbekampagne zu starten, müssen wir mehrere Faktoren berücksichtigen:

  • Teilnahmewahrscheinlichkeit und Kaufverhalten: Die Analyse ergab, dass nur 16,67% der Käufer des neuen Produkts vorher an der Werbekampagne teilgenommen haben. Dies bedeutet, dass die Mehrheit der Käufer des neuen Produkts nicht durch die Kampagne beeinflusst wurde.
  • Kosten der Kampagne: Das Unternehmen sollte die Kosten der Werbekampagne gegen den erwarteten Nutzen abwägen. Wenn die Kampagne sehr teuer ist und nur einen kleinen Teil der Kunden beeinflusst, könnte es sein, dass die Kosten die Vorteile überwiegen.
  • Zielmarkt: Das Unternehmen sollte untersuchen, wer genau durch die Kampagne erreicht wird. Wenn die Kampagne effektiv ein bestimmtes Segment der Kunden anspricht, das eine hohe Kaufbereitschaft hat, könnte sie trotz der allgemeinen Zahlen sinnvoll sein.
  • Alternative Marketingstrategien: Das Unternehmen sollte auch andere Marketingstrategien in Betracht ziehen, möglicherweise personalisierte Werbung oder Rabatte für Kunden, die das neue Produkt kaufen könnten.

Fazit:Basierend auf den Informationen aus Teil (a) scheint es, dass die vorherige Werbekampagne nur einen begrenzten Einfluss auf den Kauf des neuen Produkts hatte. Bevor eine weitere Kampagne gestartet wird, sollte das Unternehmen eine detaillierte Kosten-Nutzen-Analyse durchführen und möglicherweise andere Marketingstrategien in Betracht ziehen. Eine weitere Kampagne könnte nur dann sinnvoll sein, wenn sie entweder kostengünstig ist oder gezielt auf eine Kundengruppe abzielt, die eine hohe Kaufwahrscheinlichkeit hat.

c)

Ein neuer Kunde wird per Zufall ausgewählt. Berechne die gemeinsame Wahrscheinlichkeit, dass der Kunde an der Werbekampagne teilgenommen hat und den neuen Produkttyp gekauft hat. Verwende hierzu die Multiplikationsregel der Wahrscheinlichkeit.

Lösung:

Bayes' Theorem in MarketingDas Marketing-Team eines Unternehmens möchte herausfinden, wie wahrscheinlich es ist, dass ein Kunde einen neuen Produkttyp kauft, basierend auf dem Wissen, dass der Kunde an einer vorherigen Werbekampagne für ein ähnliches Produkt teilgenommen hat. Die historischen Daten des Unternehmens zeigen Folgendes:

  • 20% der Kunden haben an der Werbekampagne für das ähnliche Produkt teilgenommen
  • 30% der Kunden haben den neuen Produkttyp gekauft
  • 25% der Kunden, die an der Werbekampagne teilgenommen haben, haben den neuen Produkttyp gekauft

Verwende den Satz von Bayes, um die folgenden Fragen zu beantworten:

Subexercise: Ein neuer Kunde wird per Zufall ausgewählt. Berechne die gemeinsame Wahrscheinlichkeit, dass der Kunde an der Werbekampagne teilgenommen hat und den neuen Produkttyp gekauft hat. Verwende hierzu die Multiplikationsregel der Wahrscheinlichkeit.

Um die gemeinsame Wahrscheinlichkeit zu berechnen, dass ein Kunde an der Kampagne teilgenommen hat und den neuen Produkttyp gekauft hat, können wir die Multiplikationsregel der Wahrscheinlichkeiten verwenden. Diese Regel besagt:

  • \( P(A \text{ und } B) = P(A) \times P(B|A) \)

Wobei:

  • \(A\): Ein Kunde hat an der Kampagne teilgenommen.
  • \(B\): Ein Kunde hat den neuen Produkttyp gekauft.
  • \(P(A)\): Die Wahrscheinlichkeit, dass ein Kunde an der Kampagne teilgenommen hat (20% oder 0,20).
  • \(P(B|A)\): Die Wahrscheinlichkeit, dass ein Kunde den neuen Produkttyp gekauft hat, gegebenenfalls er an der Kampagne teilgenommen hat (25% oder 0,25).

Wir setzen die bekannten Werte in die Multiplikationsregel ein:

  • \( P(A \text{ und } B) = P(A) \times P(B|A) \)
  • \( P(A \text{ und } B) = 0,20 \times 0,25 \)
  • \( P(A \text{ und } B) = 0,05 \)

Die gemeinsame Wahrscheinlichkeit, dass ein Kunde an der Kampagne teilgenommen hat und den neuen Produkttyp gekauft hat, beträgt also 0,05 oder 5%.

d)

Berechne die Gesamtwahrscheinlichkeit eines Kaufs des neuen Produkts entweder durch Teilnahme an der Kampagne oder Nichtteilnahme, und vergleiche diese mit der unbedingten Wahrscheinlichkeit des Kaufs des neuen Produkts. Ziehe Schlussfolgerungen über den Einfluss der Teilnahme an der Werbekampagne.

Lösung:

Bayes' Theorem in MarketingDas Marketing-Team eines Unternehmens möchte herausfinden, wie wahrscheinlich es ist, dass ein Kunde einen neuen Produkttyp kauft, basierend auf dem Wissen, dass der Kunde an einer vorherigen Werbekampagne für ein ähnliches Produkt teilgenommen hat. Die historischen Daten des Unternehmens zeigen Folgendes:

  • 20% der Kunden haben an der Werbekampagne für das ähnliche Produkt teilgenommen
  • 30% der Kunden haben den neuen Produkttyp gekauft
  • 25% der Kunden, die an der Werbekampagne teilgenommen haben, haben den neuen Produkttyp gekauft

Verwende den Satz von Bayes, um die folgenden Fragen zu beantworten:

Subexercise: Berechne die Gesamtwahrscheinlichkeit eines Kaufs des neuen Produkts entweder durch Teilnahme an der Kampagne oder Nichtteilnahme, und vergleiche diese mit der unbedingten Wahrscheinlichkeit des Kaufs des neuen Produkts. Ziehe Schlussfolgerungen über den Einfluss der Teilnahme an der Werbekampagne.

Um die Gesamtwahrscheinlichkeit eines Kaufs des neuen Produkts zu berechnen, können wir den Satz der totalen Wahrscheinlichkeit verwenden:

  • \( P(B) = P(B|A) \times P(A) + P(B|A^c) \times P(A^c) \)

Wobei:

  • \(A\): Ein Kunde hat an der Kampagne teilgenommen.
  • \(A^c\): Ein Kunde hat nicht an der Kampagne teilgenommen.
  • \(B\): Ein Kunde hat den neuen Produkttyp gekauft.
  • \(P(A)\): Die Wahrscheinlichkeit, dass ein Kunde an der Kampagne teilgenommen hat (20% oder 0,20).
  • \(P(A^c)\): Die Wahrscheinlichkeit, dass ein Kunde nicht an der Kampagne teilgenommen hat (80% oder 0,80).
  • \(P(B|A)\): Die Wahrscheinlichkeit, dass ein Kunde den neuen Produkttyp gekauft hat, gegebenenfalls er an der Kampagne teilgenommen hat (25% oder 0,25).
  • \(P(B|A^c)\): Die Wahrscheinlichkeit, dass ein Kunde den neuen Produkttyp gekauft hat, gegebenenfalls er nicht an der Kampagne teilgenommen hat.

Wir wissen, dass 30% der Kunden den neuen Produkttyp gekauft haben:

  • \( P(B) = 0,30 \)

Um \(P(B|A^c)\) zu finden, können wir den vorhandenen Daten entnehmen, dass entweder die Kunden an der Kampagne teilgenommen haben oder nicht (also 100%), und die Wahrscheinlichkeit des Kaufs verteilt sich auf beide Gruppen:

  • \( 0,30 = 0,25 \times 0,20 + P(B|A^c) \times 0,80 \)

Nun können wir die Gleichung lösen:

  • \( 0,30 = 0,05 + P(B|A^c) \times 0,80 \)
  • \( 0,30 - 0,05 = P(B|A^c) \times 0,80 \)
  • \( 0,25 = P(B|A^c) \times 0,80 \)
  • \( P(B|A^c) = \frac{0,25}{0,80} = 0,3125 \)

Nun vergleichen wir diese unbedingte Wahrscheinlichkeit mit dem erwarteten Wert, der uns den Einfluss der Kampagne anzeigt:

Die unbedingte Wahrscheinlichkeit \(P(B) = 30%, was höher ist als die Wahrscheinlichkeit von 25% für Kunden, die an der Kampagne teilgenommen haben. Daher scheint es, dass die Teilnahme an der Kampagne die Wahrscheinlichkeit eines Kaufs tatsächlich verringert, da Kunden, die nicht teilgenommen haben, eine höhere Kaufwahrscheinlichkeit von 31,25% aufweisen.

Aufgabe 4)

Ein Betrieb untersucht die Verteilung der monatlichen Gehälter seiner 15 Mitarbeiter in einer bestimmten Abteilung, um den Medianlohn zu berechnen. Die Gehälter (in €) lauten: 2900, 3100, 3300, 3000, 3200, 3500, 3600, 3800, 3900, 4000, 4100, 4200, 4300, 4500, 4700. Bestimme den Median und analysiere mögliche Eigenschaften und Einflüsse auf den Median.

a)

a) Sortiere die gegebenen Gehälter in aufsteigender Reihenfolge und berechne den Median.

Lösung:

  • Schritt 1: Sortiere die gegebenen Gehälter in aufsteigender Reihenfolge.
  • Die Gehälter in aufsteigender Reihenfolge sind: 2900, 3000, 3100, 3200, 3300, 3500, 3600, 3800, 3900, 4000, 4100, 4200, 4300, 4500, 4700
  • Schritt 2: Finde den Median. Der Median ist der mittlere Wert einer geordneten Liste.
  • Da es 15 Gehälter gibt (eine ungerade Zahl), ist der Median das 8. Element in der sortierten Liste. Zähle also von links die ersten 8 Gehälter: 2900, 3000, 3100, 3200, 3300, 3500, 3600, 3800, 3900, 4000, 4100, 4200, 4300, 4500, 4700
  • Der Median beträgt 3800 €.

b)

b) Erläutere, wie sich der Median ändern würde, wenn ein zusätzliches Gehalt von 4800€ hinzugefügt wird. Berechne den neuen Median und vergleiche ihn mit dem ursprünglich berechneten Median.

Lösung:

  • Schritt 1: Füge das neue Gehalt von 4800 € in die bestehende Liste ein.
  • Die Gehälter in aufsteigender Reihenfolge sind nun: 2900, 3000, 3100, 3200, 3300, 3500, 3600, 3800, 3900, 4000, 4100, 4200, 4300, 4500, 4700, 4800
  • Schritt 2: Bestimme den neuen Median. Da es jetzt 16 Gehälter gibt, ist die Anzahl gerade. Der Median wird daher der Durchschnitt der beiden mittleren Werte sein. Das sind das 8. und 9. Element in der sortierten Liste.
  • Die beiden mittleren Werte sind: 3800 und 3900
  • Schritt 3: Berechne den Durchschnitt dieser beiden Werte, um den Median zu erhalten: \(\frac{{3800 + 3900}}{2} = 3850\)
  • Der neue Median beträgt 3850 €.
  • Vergleich: Der ursprünglich berechnete Median betrug 3800 €. Der neue Median mit dem zusätzlichen Gehalt von 4800 € ist 3850 €. Dies zeigt, dass der Median um 50 € gestiegen ist, wenn ein höheres Gehalt hinzugefügt wurde.
  • Dieses Beispiel verdeutlicht, dass der Median durch Änderungen an Gehältern an den Extremen (sehr hoch oder sehr niedrig) beeinflusst werden kann, jedoch weniger empfindlich gegenüber solchen Änderungen ist als der Durchschnitt.

c)

c) Diskutiere die Aussage, dass der Median unempfindlich gegenüber Ausreißern ist, und veranschauliche dies anhand der gegebenen Gehälter. Wie würde sich der Median verändern, wenn der höchste Wert auf 6000€ steigt?

Lösung:

  • Diskussion der Unempfindlichkeit des Medians gegenüber Ausreißern:
  • Der Median ist ein Maß für die zentrale Tendenz, das unempfindlich gegenüber Ausreißern ist, da er lediglich der mittlere Wert einer geordneten Datenreihe ist. Im Gegensatz zum Durchschnitt (arithmetisches Mittel), der stark von extremen Werten beeinflusst wird, bleibt der Median stabil, solange die mittleren Werte sich nicht ändern.
  • Veranschaulichung an den gegebenen Gehältern:
  • Nehmen wir zunächst die bereits geordneten Gehälter:
  • 2900, 3000, 3100, 3200, 3300, 3500, 3600, 3800, 3900, 4000, 4100, 4200, 4300, 4500, 4700
  • Der vorher gefundene Median ist 3800 €.
  • Nun erhöhen wir den höchsten Wert auf 6000 € und sortieren die Gehälter erneut:
  • 2900, 3000, 3100, 3200, 3300, 3500, 3600, 3800, 3900, 4000, 4100, 4200, 4300, 4500, 6000
  • Da es 15 Gehälter gibt, bleibt der Median immer noch das 8. Element in der sortierten Liste.
  • Der Median bleibt also weiterhin 3800 €, selbst wenn der höchste Wert auf 6000 € ansteigt.
  • Schlussfolgerung: Dieses Beispiel zeigt deutlich, dass der Median unempfindlich gegenüber Ausreißern ist. Die signifikante Erhöhung des höchsten Gehalts von 4700 € auf 6000 € hatte keine Auswirkung auf den Median.
Sign Up

Melde dich kostenlos an, um Zugriff auf das vollständige Dokument zu erhalten

Mit unserer kostenlosen Lernplattform erhältst du Zugang zu Millionen von Dokumenten, Karteikarten und Unterlagen.

Kostenloses Konto erstellen

Du hast bereits ein Konto? Anmelden