Aufgabe 2)
Konvexität und Dualitätstheorie
- Eine Menge \(C\) ist konvex, wenn für alle \(x, y \in C\) und \(\theta \in [0,1]\) gilt: \(\theta x + (1-\theta) y \in C\)
- Eine Funktion \(f: \mathbb{R}^n \to \mathbb{R} \) ist konvex, wenn für alle \(x, y \in \text{dom}(f)\) und \(\theta \in [0,1]\) gilt: \(\theta f(x) + (1-\theta) f(y) \ge f(\theta x + (1-\theta) y)\)
- Beispiel: Lineare Funktionen sind konvex.
- Dualitätstheorie in der Optimierung: Jedes Optimierungsproblem (Primalproblem) \(P\) hat ein zugehöriges Dualproblem \(D\).
- Primalproblem (P): \( \min_{x \in X} f(x) \)
- Dualproblem (D): \(\text{max}_{y \in Y} g(y)\) wobei \(g(y)\) abhängig ist von den Constraints des Primalproblems.
- Schwache Dualität: \(f(x) \ge g(y)\) für alle zulässigen \(x\) und \(y\).
- Starke Dualität: Falls \(P\) konvex und unter bestimmten Voraussetzungen, gilt \(f(x^*) = g(y^*)\) für optimale Lösungen \(x^*\) und \(y^*\).
- Lagrange-Dualität: Lagrange-Funktion \(L(x, \lambda) = f(x) + \sum_{i} \lambda_i h_i(x)\).
a)
Zeige, dass die Menge \( C = \{ (x_1, x_2) \in \mathbb{R}^2 \mid x_1^2 + x_2^2 \le 1 \} \) konvex ist. Verifiziere die Definition der konvexen Menge für zwei beliebige Punkte \( (x_1, x_2) \in C \) und \( (y_1, y_2) \in C \) und \( \theta \in [0,1]\).
Lösung:
Beweis der Konvexität der Menge $C$
- Um zu zeigen, dass die Menge $C = \{ (x_1, x_2) \in \mathbb{R}^2 \mid x_1^2 + x_2^2 \leq 1 \}$ konvex ist, müssen wir verifizieren, dass für alle $x, y \in C$ und $\theta \in [0,1]$ gilt: \( \theta x + (1-\theta) y \in C \).
- Seien $\mathbf{x} = (x_1, x_2) \in C$ und $\mathbf{y} = (y_1, y_2) \in C$. Dann gilt nach Definition von $C$: \( x_1^2 + x_2^2 \leq 1 \) und \( y_1^2 + y_2^2 \leq 1 \).
- Um die Konvexität zu prüfen, betrachten wir den Punkt $\mathbf{z} = \theta \mathbf{x} + (1-\theta) \mathbf{y}$, wobei $\theta \in [0,1]$.
- Dieser Punkt $\mathbf{z}$ hat die Koordinaten:\\[ z_1 = \theta x_1 + (1-\theta) y_1 \]\[ z_2 = \theta x_2 + (1-\theta) y_2 \]
- Wir müssen jetzt zeigen, dass \( z_1^2 + z_2^2 \leq 1 \) gilt.
- Betrachten wir $z_1^2 + z_2^2$:\[ z_1^2 + z_2^2 = (\theta x_1 + (1-\theta) y_1)^2 + (\theta x_2 + (1-\theta) y_2)^2 \]
- Expandieren wir die Quadrate:\[ = \theta^2 x_1^2 + 2\theta (1-\theta) x_1 y_1 + (1-\theta)^2 y_1^2 + \theta^2 x_2^2 + 2\theta (1-\theta) x_2 y_2 + (1-\theta)^2 y_2^2 \]
- Fassen wir die Terme zusammen:\[ = \theta^2 (x_1^2 + x_2^2) + (1-\theta)^2 (y_1^2 + y_2^2) + 2\theta (1-\theta) (x_1 y_1 + x_2 y_2) \]
- Da $\mathbf{x}$ und $\mathbf{y}$ in $C$ liegen, haben wir $x_1^2 + x_2^2 \leq 1$ und $y_1^2 + y_2^2 \leq 1$, daher:\[ \theta^2 (x_1^2 + x_2^2) \leq \theta^2 \]
\[ (1-\theta)^2 (y_1^2 + y_2^2) \leq (1-\theta)^2 \]- Nebenbei ist $-1 \leq x_1 y_1 + x_2 y_2 \leq 1$ nach der Minkowski-Ungleichung, also:\[ 2\theta (1-\theta) (x_1 y_1 + x_2 y_2) \leq 2\theta (1-\theta) \]
- Summiere die obigen Ungleichungen:\[ z_1^2 + z_2^2 \leq \theta^2 + (1-\theta)^2 + 2\theta (1-\theta) \]
- Diese Summe ist gleich 1, da:\ \[ \theta^2 + (1-\theta)^2 + 2\theta(1-\theta) = \theta^2 + (1-\theta)^2 + 2\theta - 2\theta^2 = \theta^2 + 1 - 2\theta + \theta^2 + 2\theta - 2\theta^2 = 1\]
- Wir haben daher gezeigt, dass \( z_1^2 + z_2^2 \leq 1 \), also $\mathbf{z} \in C$.
Konklusion: Damit ist die Menge $C = \{ (x_1, x_2) \in \mathbb{R}^2 \mid x_1^2 + x_2^2 \leq 1 \}$ konvex gemäß der Definition einer konvexen Menge.
b)
Betrachte die Funktion \(f(x) = x^2\). Zeige, dass diese Funktion konvex ist. Überprüfe dies mit Hilfe der Definition der konvexen Funktion für zwei beliebige Punkte \( x, y \in \mathbb{R} \) und \( \theta \in [0,1]\).
Lösung:
Beweis der Konvexität der Funktion \( f(x) = x^2 \)
- Eine Funktion \( f: \mathbb{R}^n \to \mathbb{R} \) ist konvex, wenn für alle \( x, y \in \text{dom}(f) \) und \( \theta \in [0,1] \) gilt:
\( \theta f(x) + (1-\theta) f(y) \ge f(\theta x + (1-\theta) y) \)
- Betrachten wir die Funktion \( f(x) = x^2 \).
- Wir müssen zeigen, dass für alle \( x, y \in \mathbb{R} \) und \( \theta \in [0,1] \) gilt:
\( \theta x^2 + (1-\theta) y^2 \ge (\theta x + (1-\theta) y)^2 \)
- Fangen wir mit der rechten Seite der Gleichung an:
\( f(\theta x + (1-\theta) y) = (\theta x + (1-\theta) y)^2 \)
\( = \theta^2 x^2 + 2\theta (1-\theta) xy + (1-\theta)^2 y^2 \)
- Betrachten wir nun die linke Seite der Gleichung:
\( \theta x^2 + (1-\theta) y^2 \)
- Wir müssen nun zeigen, dass:
\( \theta x^2 + (1-\theta) y^2 \ge \theta^2 x^2 + 2\theta (1-\theta) xy + (1-\theta)^2 y^2 \)
- Ziehen wir die rechte Seite von der linken Seite ab:
\( \theta x^2 + (1-\theta) y^2 - (\theta^2 x^2 + 2\theta (1-\theta) xy + (1-\theta)^2 y^2) \ge 0 \)
- Fassen wir die Terme zusammen:
\( \theta x^2 + (1-\theta) y^2 - \theta^2 x^2 - 2\theta (1-\theta) xy - (1-\theta)^2 y^2 \)\( = \theta x^2 - \theta^2 x^2 + (1-\theta) y^2 - (1-\theta)^2 y^2 - 2\theta (1-\theta) xy \)
- Kombinieren wir ähnliche Terme:
\( = \theta (1-\theta) x^2 + (1-\theta) \theta y^2 - 2\theta (1-\theta) xy \)
- Fassen wir den gemeinsamen Faktor \( \theta (1-\theta) \) zusammen:
\( = \theta (1-\theta)(x^2 + y^2 - 2xy) \)
- Benutzen wir die Identität \( (x - y)^2 = x^2 + y^2 - 2xy \):
\( = \theta (1-\theta) (x - y)^2 \)
- Da \( \theta \in [0,1] \) und \( (x - y)^2 \ge 0 \) immer wahr sind:
\( \theta (1-\theta) (x - y)^2 \ge 0 \)
\( \theta x^2 + (1-\theta) y^2 \ge (\theta x + (1-\theta) y)^2 \)
- Also ist die Funktion \( f(x) = x^2 \) konvex.
c)
Gegeben sei das Optimierungsproblem (Primalproblem) \( (P): \min_{x \in \mathbb{R}} x^2 \) mit der Nebenbedingung \( x \ge 1 \). Formuliere das zugehörige Lagrange-Dualproblem (D) und bestimme die Lagrange-Funktion \( L(x, \lambda) \). Zeige, dass bei diesem Problem die starke Dualität gilt.
Lösung:
Lagrange-Dualproblem und starke Dualität für das gegebene Primalproblem
- Das gegebene Primalproblem (P) lautet:
\( \min_{x \in \mathbb{R}} x^2 \)mit der Nebenbedingung: \( x \geq 1 \)
- Um das zugehörige Lagrange-Dualproblem (D) zu formulieren, definieren wir die Lagrange-Funktion:
\( L(x, \lambda) = x^2 + \lambda (1 - x) \)Hier ist \( \lambda \geq 0 \) der Lagrange-Multiplikator.
- Bestimmen wir nun das Dualproblem (D):
- Betrachte die Lagrange-Funktion:
\( L(x, \lambda) = x^2 + \lambda (1 - x) \)Zur Bestimmung des Minimums der Lagrange-Funktion bezüglich $x$, setzen wir die Ableitung nach $x$ gleich null: \( \frac{\partial L(x, \lambda)}{\partial x} = 2x - \lambda = 0 \)Dies ergibt: \( x = \frac{\lambda}{2} \)Wir haben also eine kritische Bedingung gefunden.- Die Bedingung $x \geq 1$ muss eingehalten werden. Setzen wir den Wert aus der optimalen x-Bedingung ein:
\( \frac{\lambda}{2} \geq 1 \)Dies ergibt: \( \lambda \geq 2 \)- Um das Lagrange-Dualproblem zu formulieren, setzen wir den optimalen Wert von $x$ in die Lagrange-Funktion ein:
\( L\left(\frac{\lambda}{2}, \lambda\right) = \left(\frac{\lambda}{2}\right)^2 + \lambda \left(1 - \frac{\lambda}{2}\right) \)Dies ergibt: \( L\left(\frac{\lambda}{2}, \lambda\right) = \frac{\lambda^2}{4} + \lambda - \frac{\lambda^2}{2} \) \( = \frac{\lambda^2}{4} + \lambda - \frac{2\lambda^2}{4} \) \( = \lambda - \frac{\lambda^2}{4} \)- Das Dualproblem (D) lautet:
\( \max_{\lambda \geq 2} \left( \lambda - \frac{\lambda^2}{4} \right) \)- Um das Maximum zu finden, setzen wir die Ableitung der Zielfunktion nach \( \lambda \) gleich null:
\( \frac{d}{d\lambda} \left( \lambda - \frac{\lambda^2}{4} \right) = 1 - \frac{\lambda}{2} = 0 \)Dies ergibt: \( \lambda = 2 \)Prüfen wir nun den Wert der Zielfunktion bei \( \lambda = 2 \): \( \lambda - \frac{\lambda^2}{4} = 2 - \frac{2^2}{4} = 2 - 1 = 1 \)Zusammenfassend:- Das Dualproblem (D) ist:
\( \max_{\lambda \geq 2} \left( \lambda - \frac{\lambda^2}{4} \right) \)und der optimale Wert ist:
- Der optimale Wert des Primalproblems ist:
\( f(x^*) = f(1) = 1^2 = 1 \)- Da \( f(x^*) = g(\lambda^*) = 1 \), gilt bei diesem Problem die starke Dualität.
Aufgabe 3)
Ein Unternehmen möchte die Kundenfluktuation analysieren und verwendet dazu eine diskrete Markov-Kette. Es gibt drei Zustände: 1 (Neukunde), 2 (Bestandskunde) und 3 (verlorener Kunde). Die Übergangswahrscheinlichkeiten sind in der folgenden Matrix angegeben: \[ \textbf{P} = \begin{pmatrix} 0.7 & 0.2 & 0.1 \ 0.4 & 0.5 & 0.1 \ 0.1 & 0.3 & 0.6 \ \end{pmatrix} \] Das Unternehmen möchte verschiedene Eigenschaften dieser Markov-Kette untersuchen.
b)
Prüfe, ob die gegebene Markov-Kette ergodisch ist. Bestimme die periodischen Zustände und gib an, ob es eine eindeutige stationäre Verteilung gibt.
Lösung:
Um zu bestimmen, ob eine gegebene Markov-Kette ergodisch ist, müssen wir zunächst die Definitionen und Eigenschaften der Ergodizität verstehen. Eine Markov-Kette ist ergodisch, wenn sie irreduzibel und aperiodisch ist. Dies bedeutet:
- Irreduzibel: Jeder Zustand ist von jedem anderen Zustand erreichbar.
- Aperiodisch: Die Rückkehrzeiten zu einem Zustand haben keinen gemeinsamen Teiler größer als 1.
Die Übergangsmatrix \(\textbf{P}\), die gegeben ist, lautet:
- \(\textbf{P} = \begin{pmatrix} 0.7 & 0.2 & 0.1 \ 0.4 & 0.5 & 0.1 \ 0.1 & 0.3 & 0.6 \end{pmatrix}\)
Lass uns die beiden Bedingungen der Ergodizität prüfen:
1. Irreduzibilität:
Um die Irreduzibilität zu überprüfen, müssen wir sicherstellen, dass jeder Zustand von jedem anderen Zustand erreichbar ist. Wir schauen dafür auf die Übergangsmatrix und ihre Potenzen.
Die Matrix \(\textbf{P}^1\) ist:
\(\begin{pmatrix} 0.7 & 0.2 & 0.1 \ 0.4 & 0.5 & 0.1 \ 0.1 & 0.3 & 0.6 \end{pmatrix}\)
Analysieren wir die Matrix \(\textbf{P}\):
- Von Zustand 1 (Neukunde) kann man direkt Zustand 2 (Bestandskunde) und Zustand 3 (verlorener Kunde) erreichen.
- Von Zustand 2 kann man zurück zu Zustand 1 oder weiter zu Zustand 3 gelangen.
- Von Zustand 3 kann man sowohl zu Zustand 1 als auch zu Zustand 2 gelangen.
Um die Erreichbarkeit zu vertiefen, können wir weitere Potenzen der Übergangsmatrix berechnen, z.B. \( \textbf{P}^2\) . Wenn jede Zelle > 0 ist, ist es irreduzibel.
2. Aperiodizität:
Ein Zustand \( i \) ist aperiodisch, wenn der größte gemeinsame Teiler aller Rückkehrzeiten zu diesem Zustand gleich eins ist. Dies bedeutet, dass wir überprüfen müssen, ob es keinen periodischen Zyklus in der Matrix gibt.
Betrachten wir die Zustände:
- Zustand 1: Es gibt Selbstübergänge mit Wahrscheinlichkeit 0.7 (also regelmäßige Rückkehrzeiten)
- Zustand 2: Es gibt direkte Übergänge zu 1 und zu sich selbst (gleichzeitig Periodenabweichung)
- Zustand 3: Es gibt direkte Übergänge zu 1 und zu sich selbst (gleiche Analyse wie Zustand 2)
Da jeder Zustand die Möglichkeit hat, direkt zu sich selbst zu gelangen, gibt es keinen periodischen Zyklus in der Matrix \(\textbf{P}\): Es ist aperiodisch.
Da die gegebene Markov-Kette sowohl irreduzibel als auch aperiodisch ist, ist sie ergodisch. Wir haben somit:
- Periodizität: unperiodisch (aufgrund der Feststellung)
- Es existiert eine eindeutige stationäre Verteilung aufgrund der Ergodizität.
Zusammengefasst:
- Die gegebene Markov-Kette ist ergodisch.
- Alle Zustände sind aperiodisch.
- Es existiert eine eindeutige stationäre Verteilung.
Aufgabe 4)
Du hast einen Transportvorgang, der durch die mathematische Funktion f(x) beschrieben wird. Die Funktion modelliert den Fluss eines Gases durch eine Röhre und ist gegeben durch:
- f(x) = e^{-x^2} für x im Intervall [0, 1]
a)
Verwende die Trapezregel, um das Integral der Funktion f(x) = e^{-x^2} im Intervall [0, 1] zu berechnen. Teile das Intervall in 4 gleich große Abschnitte. Zeige alle Deine Berechnungen.
Lösung:
Um das Integral der Funktion f(x) = e^{-x^2} im Intervall [0, 1] mit Hilfe der Trapezregel zu berechnen und das Intervall in 4 gleich große Abschnitte zu teilen, befolge diese Schritte:
- Bestimme die Breite jedes Intervalls: Die gesamte Länge des Intervalls [0, 1] wird in 4 gleiche Abschnitte geteilt. Das bedeutet, dass die Breite \(\text{h}\) jedes Abschnitts durch \( \frac{1-0}{4} = \frac{1}{4} = 0.25\) gegeben ist.
- Berechne die x-Werte an den Teilungspunkten:
- \( x_0 = 0 \)
- \( x_1 = 0.25 \)
- \( x_2 = 0.5 \)
- \( x_3 = 0.75 \)
- \( x_4 = 1 \)
- Berechne die Funktionwerte \( f(x) = e^{-x^2} \) an diesen Punkten:
- \( f(x_0) = e^{-(0)^2} = e^0 = 1 \)
- \( f(x_1) = e^{-(0.25)^2} = e^{-0.0625} \)
- \( f(x_2) = e^{-(0.5)^2} = e^{-0.25} \)
- \( f(x_3) = e^{-(0.75)^2} = e^{-0.5625} \)
- \( f(x_4) = e^{-(1)^2} = e^{-1} \)
- Setze diese Werte in die Trapezregel ein:
Die Trapezregel lautet:
- \( \text{Integral-Approximation} ≈ \frac{h}{2} [f(x_0) + 2f(x_1) + 2f(x_2) + 2f(x_3) + f(x_4)] \)
- Setze die berechneten Werte ein: \( h = 0.25 \)
- \( f(x_0) = 1 \)
- \( f(x_1) = e^{-0.0625} \)
- \( f(x_2) = e^{-0.25} \)
- \( f(x_3) = e^{-0.5625} \)
- \( f(x_4) = e^{-1} \)
- \( \text{Integral-Approximation} ≈ 0.125 [1 + 2e^{-0.0625} + 2e^{-0.25} + 2e^{-0.5625} + e^{-1}] \) Berechne die einzelnen Werte numerisch:
- \(e^{-0.0625} ≈ 0.93941 \)
- \(e^{-0.25} ≈ 0.77880 \)
- \(e^{-0.5625} ≈ 0.56978 \)
- \(e^{-1} ≈ 0.36788 \)
- Setze diese Werte in die Gleichung ein:
- \( \text{Integral-Approximation} ≈ 0.125 [1 + 2(0.93941) + 2(0.77880) + 2(0.56978) + 0.36788] \)
- \( \text{Integral-Approximation} ≈ 0.125 [1 + 1.87882 + 1.55760 + 1.13956 + 0.36788] \)
- \( \text{Integral-Approximation} ≈ 0.125 [5.94386] \)
- \( \text{Integral-Approximation} ≈ 0.74298 \)
- Das Integral der Funktion f(x) = e^{-x^2} im Intervall [0, 1] beträgt approximativ 0.74298.
b)
Berechne das Integral erneut, diesmal mit der Simpson-Regel und 4 Intervallteilungen. Vergleiche das Ergebnis mit dem der Trapezregel und diskutiere mögliche Gründe für eventuelle Unterschiede.
Lösung:
Um das Integral der Funktion f(x) = e^{-x^2} im Intervall [0, 1] mit Hilfe der Simpson-Regel zu berechnen und das Intervall in 4 gleiche Abschnitte zu teilen, befolge diese Schritte:
- Bestimme die Breite jedes Intervalls: Die gesamte Länge des Intervalls [0, 1] wird in 4 gleiche Abschnitte geteilt. Das bedeutet, dass die Breite \(\text{h}\) jedes Abschnitts durch \( \frac{1-0}{4} = \frac{1}{4} = 0.25\) gegeben ist.
- Berechne die x-Werte an den Teilungspunkten:
- \( x_0 = 0 \)
- \( x_1 = 0.25 \)
- \( x_2 = 0.5 \)
- \( x_3 = 0.75 \)
- \( x_4 = 1 \)
- Berechne die Funktionswerte \( f(x) = e^{-x^2} \) an diesen Punkten:
- \( f(x_0) = e^{-(0)^2} = e^0 = 1 \)
- \( f(x_1) = e^{-(0.25)^2} = e^{-0.0625} \)
- \( f(x_2) = e^{-(0.5)^2} = e^{-0.25} \)
- \( f(x_3) = e^{-(0.75)^2} = e^{-0.5625} \)
- \( f(x_4) = e^{-(1)^2} = e^{-1} \)
- Setze diese Werte in die Simpson-Regel ein:
Die Simpson-Regel lautet:
- \( \text{Integral-Approximation} ≈ \frac{h}{3} [f(x_0) + 4f(x_1) + 2f(x_2) + 4f(x_3) + f(x_4)] \)
- Setze die berechneten Werte ein: \( h = 0.25 \)
- \( f(x_0) = 1 \)
- \( f(x_1) = e^{-0.0625} ≈ 0.93941 \)
- \( f(x_2) = e^{-0.25} ≈ 0.77880 \)
- \( f(x_3) = e^{-0.5625} ≈ 0.56978 \)
- \( f(x_4) = e^{-1} ≈ 0.36788 \)
- \(\text{Integral-Approximation} ≈ \frac{0.25}{3} [1 + 4(0.93941) + 2(0.77880) + 4(0.56978) + 0.36788] \)
- Berechne die einzelnen Werte:
- Setze diese in die Gleichung ein: \( 1 + 4(0.93941) + 2(0.77880) + 4(0.56978) + 0.36788 \)
- \(1 + 3.75764 + 1.55760 + 2.27912 + 0.36788 \)
- \(8.96224 \)
- \(\text{Integral-Approximation} ≈ \frac{0.25}{3} \times 8.96224 = 0.74768 \)
Das Integral der Funktion f(x) = e^{-x^2} im Intervall [0, 1] beträgt approximativ 0.74768 gemäß der Simpson-Regel.
Vergleich mit der Trapezregel:
- Das Ergebnis der Trapezregel war 0.74298.
- Das Ergebnis der Simpson-Regel ist genauer, nämlich 0.74768.
Mögliche Gründe für die Unterschiede:
- Die Trapezregel ist eine numerische Integrationsmethode erster Ordnung, was bedeutet, dass sie eine lineare Approximation der Funktion verwendet.
- Die Simpson-Regel ist eine numerische Integrationsmethode höherer Ordnung (zweite Ordnung), die eine quadratische Approximation verwendet und daher für viele Funktionen eine genauere Schätzung liefert.
- Die Genauigkeit der Simpson-Regel kann besonders bei glatten und kontinuierlichen Funktionen wie e^{-x^2} höher sein.
- Da die Simpson-Regel beide Ränder und zusätzliche Punkte innerhalb des Intervalls einbezieht, kann sie Kurven besser nachbilden als die lineare Approximation der Trapezregel.
c)
Berechne die erste Ableitung der Funktion f(x) = e^{-x^2} an der Stelle x = 0.5 unter Verwendung der vorwärts-, rückwärts- und zentrischen Differenzquotienten. Nutze dafür einen Schrittweitenparameter h = 0.1. Welche Methode liefert das genaueste Ergebnis und warum?
Lösung:
Um die erste Ableitung der Funktion f(x) = e^{-x^2} an der Stelle x = 0.5 zu berechnen, verwenden wir die vorwärts-, rückwärts- und zentrischen Differenzquotienten mit einem Schrittweitenparameter h = 0.1. Gegeben ist:
- Schrittweitenparameter: h = 0.1
- Stelle: x = 0.5
1. Vorwärtsdifferenzquotient:
Die Formel für den Vorwärtsdifferenzquotienten lautet:
\( f'(x) ≈ \frac{f(x + h) - f(x)}{h} \)
An der Stelle \(x = 0.5\):
- \(f(0.5 + 0.1) = f(0.6) = e^{-0.6^2} = e^{-0.36}\)
- \(f(0.5) = e^{-0.5^2} = e^{-0.25}\)
Damit:
- \(f'(0.5) ≈ \frac{e^{-0.36} - e^{-0.25}}{0.1}\)
Numerische Berechnungen:
- \(e^{-0.36} ≈ 0.69768\)
- \(e^{-0.25} ≈ 0.77880\)
- \(f'(0.5) ≈ \frac{0.69768 - 0.77880}{0.1} = \frac{-0.08112}{0.1} = -0.8112\)
2. Rückwärtsdifferenzquotient:
Die Formel für den Rückwärtsdifferenzquotienten lautet:
\( f'(x) ≈ \frac{f(x) - f(x - h)}{h} \)
An der Stelle \(x = 0.5\):
- \(f(0.5 - 0.1) = f(0.4) = e^{-0.4^2} = e^{-0.16}\)
- \(f(0.5) = e^{-0.25}\)
Damit:
- \(f'(0.5) ≈ \frac{e^{-0.25} - e^{-0.16}}{0.1}\)
Numerische Berechnungen:
- \(e^{-0.16} ≈ 0.85214\)
- \(e^{-0.25} ≈ 0.77880\)
- \(f'(0.5) ≈ \frac{0.77880 - 0.85214}{0.1} = \frac{-0.07334}{0.1} = -0.7334\)
3. Zentrischer Differenzquotient:
Die Formel für den Zentrischen Differenzquotienten lautet:
\( f'(x) ≈ \frac{f(x + h) - f(x - h)}{2h} \)
An der Stelle \(x = 0.5\):
- \(f(0.5 + 0.1) = f(0.6) = e^{-0.36}\)
- \(f(0.5 - 0.1) = f(0.4) = e^{-0.16}\)
Damit:
- \(f'(0.5) ≈ \frac{e^{-0.36} - e^{-0.16}}{2 \times 0.1}\)
Numerische Berechnungen:
- \(e^{-0.36} ≈ 0.69768\)
- \(e^{-0.16} ≈ 0.85214\)
- \(f'(0.5) ≈ \frac{0.69768 - 0.85214}{0.2} = \frac{-0.15446}{0.2} = -0.7723\)
Vergleich der Methoden:
- Vorwärtsdifferenz: \( -0.8112 \)
- Rückwärtsdifferenz: \( -0.7334 \)
- Zentrische Differenz: \( -0.7723 \)
Diskussion:
Die zentrische Differenzquotientenmethode hat im Allgemeinen die höchste Genauigkeit, weil sie von beiden Seiten des Punktes \(x\) eine mittlere Betrachtung verwendet. Diese Methode kompensiert die Fehler in beiden Richtungen (vorwärts und rückwärts), was zu geringeren systematischen Abweichungen führt. Der Fehler bei der zentrischen Methode ist zweiter Ordnung, was sie genauer macht als die Vorwärts- und Rückwärtsmethoden, die nur einen Fehler erster Ordnung haben.
d)
Führe eine Fehleranalyse der numerischen Differenzierungsverfahren (vorwärts, rückwärts und zentrisch) durch. Erkläre, wie sich der Fehler bei jedem Verfahren verhält und unter welchen Umständen eine Methode der anderen vorzuziehen ist.
Lösung:
Um eine Fehleranalyse der numerischen Differenzierungsverfahren (vorwärts, rückwärts und zentrisch) durchzuführen, betrachten wir den Fehler jeder Methode und erklären, wie sich der Fehler verhält und unter welchen Umständen eine Methode der anderen vorzuziehen ist.
1. Vorwärtsdifferenzquotient:
Die Formel lautet:
\( f'(x) ≈ \frac{f(x + h) - f(x)}{h} \)
Der Fehler dieses Verfahrens kann als Taylorsche Reihe beschrieben werden:
\[ f(x + h) = f(x) + f'(x)h + \frac{f''(x)h^2}{2!} + \frac{f'''(x)h^3}{3!} + \ldots \]
Setze das in die Vorwärtsdifferenz ein:
\[ \frac{f(x + h) - f(x)}{h} = f'(x) + \frac{f''(x)h}{2} + \mathcal{O}(h^2) \]
Der Fehlerterm \( \frac{f''(x)h}{2} \) zeigt, dass der Fehler der Vorwärtsdifferenz proportional zu \( h \) ist (Fehler erster Ordnung).
2. Rückwärtsdifferenzquotient:
Die Formel lautet:
\( f'(x) ≈ \frac{f(x) - f(x - h)}{h} \)
Der Fehler dieses Verfahrens kann ebenfalls als Taylorsche Reihe beschrieben werden:
\[ f(x - h) = f(x) - f'(x)h + \frac{f''(x)h^2}{2!} - \frac{f'''(x)h^3}{3!} + \ldots \]
Setze das in die Rückwärtsdifferenz ein:
\[ \frac{f(x) - f(x - h)}{h} = f'(x) - \frac{f''(x)h}{2} + \mathcal{O}(h^2) \]
Der Fehlerterm \( -\frac{f''(x)h}{2} \) zeigt, dass der Fehler der Rückwärtsdifferenz ebenfalls proportional zu \( h \) ist (Fehler erster Ordnung).
3. Zentrischer Differenzquotient:
Die Formel lautet:
\( f'(x) ≈ \frac{f(x + h) - f(x - h)}{2h} \)
Setzt man die Taylorsche Reihenentwicklung für \( f(x + h) \) und \( f(x - h) \) ein:
\[ f(x + h) = f(x) + f'(x)h + \frac{f''(x)h^2}{2!} + \ldots \]
\[ f(x - h) = f(x) - f'(x)h + \frac{f''(x)h^2}{2!} - \ldots \]
Subtrahiere die beiden Gleichungen und teile durch \(2h\):
\[ \frac{f(x + h) - f(x - h)}{2h} = f'(x) + \frac{\mathcal{O}(h^3)}{2h} = f'(x) + \mathcal{O}(h^2) \]
Der Fehlerterm \( \mathcal{O}(h^2) \) zeigt, dass der Fehler des zentrischen Differenzquotienten proportional zu \( h^2 \) ist (Fehler zweiter Ordnung).
Zusammenfassung und Anwendungen:
- Vorwärts- und Rückwärtsdifferenz: Diese Methoden sind einfacher anzuwenden und erfordern weniger Funktionsauswertungen als der zentrische Differenzquotient. Sie haben jedoch einen höheren Fehler (Fehler erster Ordnung) und sollten verwendet werden, wenn eine einfache Implementierung ausreicht oder wenn die Schrittweite \( h \) sehr klein gewählt werden kann.
- Zentrischer Differenzquotient: Diese Methode liefert eine höhere Genauigkeit (Fehler zweiter Ordnung) und gleicht die Fehler in beide Richtungen aus. Sie sollte verwendet werden, wenn eine höhere Genauigkeit erforderlich ist und die zusätzlichen Funktionsauswertungen vertretbar sind.
Insgesamt ist der zentrische Differenzquotient oft vorzuziehen, da er eine bessere Genauigkeit bietet, insbesondere bei polynomiellen Funktionen oder glatten Funktionen wie \( e^{-x^2} \), wo die höhere Genauigkeit ausschlaggebend sein kann.