4.4. Lineare Approximation und die Taylor-Formel

Die Taylorformel 2.6.1 haben wir in der eindimensionalen Analysis benutzt, um Funktionen durch affin lineare Funktionen oder Polynome von höherem Grad zu approximieren.

Wir wollen dies auch für Funktionen mehrerer Veränderlicher tun.

Zur Beschreibung der Approximationsqualität benutzen wir den folgenden Begriff:

4.4.1. Definition.

Es sei DRn und aD.

Außerdem sei kN.

Für Funktionen f und g von D nach R schreibt man

f(x)=g(x)+o(|xa|k),

wenn

limxa|f(x)g(x)||xa|k=0

gilt.

Das eben eingeführte Symbol klein o ist eines der Landau-Symbole.

Ist ⚽ mit k=1 erfüllt, so sagt man, die Funktion g approximiert f linear (an der Stelle a).

Im Fall k=2 spricht man von quadratischer Approximation.

Je höher k in ⚽ gewählt werden kann, desto besser ist die Approximation.
Für Details sei auch hier auf die Numerik verwiesen.

4.4.2. Beispiel.

Es sei DR ein offenes Intervall und f:DR eine Funktion (einer Veränderlicher).

Ist aD und f zweimal stetig differenzierbar an der Stelle a, so gilt

f(x) =f(a)+f(a)(xa)+o(|xa|1).

Nach dem Satz von Taylor 2.6.1 gilt

f(x)f(a)f(a)(xa)|xa| =f(x)T1(f,x,a)|xa| =R1(f,x,a)|xa| =f(a+ϑ(xa))(xa)22|xa| xa0.

Im eben betrachteten Beispiel dient die Annahme fC2(D) nur der Bequemlichkeit:

Die Aussage f(x) = T1(f,x,a)+o(|xa|) bleibt auch richtig, wenn wir nur einfache Differenzierbarkeit voraussetzen.

Wir drehen den Spieß um und erheben die lineare Approximierbarkeit zur allgemeinen Definition von Differenzierbarkeit:

4.4.3. Definition.

Sei DRn offen, und sei aD.

Eine Funktion f:DR heißt (total) differenzierbar an der Stelle a, wenn es einen Vektor v(a)Rn derart gibt, dass gilt:

f(x) =f(a)+v(a)(xa)+o(|xa|).

Der Vektor v(a) heißt dann die totale Ableitung von f an der Stelle a (oder kürzer in a).

4.4.4. Satz.

Es sei DRn offen, und es sei fC1(D).

Dann ist f an jeder Stelle aD total differenzierbar, wobei

v(a)=gradf(a):

f(x) =f(a)+gradf(a)(xa) +o(|xa|).

Umgekehrt gilt: Ist f an der Stelle a total differenzierbar, so existieren alle partiellen Ableitungen, und es gilt gradf(a)=v(a).

4.4.5. Bemerkungen.

In der eindimensionalen Analysis liefert die Taylorformel auch Approximationen höheren Grades.

Um die Taylorformel auch für Funktionen mehrerer Veränderlicher formulieren zu können, brauchen wir weitere Begriffe und Schreibweisen:

4.4.6. Definition.

Eine Teilmenge DRn heißt konvex, wenn zu je zwei Punkten a,bD die gesamte Verbindungsstrecke ab in D enthalten ist.

Die folgende Darstellung zeigt eine (vermutlich) konvexe Menge links und eine definitiv nicht konvexe Menge rechts.

4.4.7. Beispiele.

Zur Veranschaulichung des Problems bei der Vereinigung konvexer Mengen gibt es ein kleines kühles Video.

4.4.8. Bemerkung.

Es sei jN. Die Menge Cj(D) bildet (mit den üblichen, werteweisen Verknüpfungen) einen reellen Vektorraum.

Für fCj(D) und vRn{0} gehört vf:DR: xvf(x) zu Cj1(D).

Wir können also v auffassen als eine Abbildung von Cj(D) nach Cj1(D).

Diese Abbildung ist linear!

Wir schreiben vk für die k-fache Anwendung von v:

Das ist dann eine lineare Abbildung von Cj(D) nach Cjk(D).

4.4.9. Beispiel.

Wir wollen v2f(a) noch etwas expliziter bestimmen.

Wir schreiben für den Moment (vgl. 4.3.12)

g(x):=vf(x) =vgradf(x) =j=1nvjfxj(x):

Dann gilt

v2f(a) =vg(a) =(gx1(a)gxn(a))v =((j=1nvjfxj)fx1(a)(j=1nvjfxj)fxn(a))v =(j=1nvjfxjx1(a)j=1nvjfxjxn(a))v =k=1n(j=1nvjfxjxk(a))vk

Dies können wir interpretieren als Matrixprodukt:

v2f(a) =v(fx1x1(a)fx1xn(a)fxnx1(a)fxnxn(a))v.

Nachdem wir im Rahmen der Analysis bisher eher lax mit der Frage umgegangen sind, ob die Elemente des Rn als Zeilen oder Spalten aufzufassen sind, müssen wir jetzt Farbe bekennen:
Wie in den einschlägigen Teilen der Linearen Algebra wollen wir eigentlich mit Spalten rechnen, der linke Faktor im Matrixprodukt muss aber eine Zeile sein. Deswegen muss dort v transponiert werden.

4.4.10. Definition.

Es sei aD und DRn sowie fC2(D).

Die Matrix

Hf(a):= (fx1x1(a)fx1xn(a)fxnx1(a)fxnxn(a))

nennt man die Hesse-Matrix von f an der Stelle a.

4.4.11. Bemerkungen.

  1. Wir haben vorausgesetzt, dass f zweimal stetig partiell differenzierbar ist.

    Nach dem Satz von Schwarz 4.3.10 ist die Hesse-Matrix Hf(a) symmetrisch.

    Diese symmetrische Matrix ist die angemessene Beschreibung der quadratischen Form vv2f(a).

  2. Wenn man die Überlegungen aus 4.4.9 iteriert, erhält man

    v3f(a) ==1nk=1nj=1nfxjxkx(a)vjvkv

    v4f(a) =m=1n=1nk=1nj=1nfxjxkxxm(a)vjvkvvm

4.4.12. Satz von Taylor in mehreren Veränderlichen.

Es sei DRn konvex und offen. Weiter sei fCk+1(D) und aD.

Dann gilt für alle vRn, die a+vD erfüllen:

f(a+v) =f(a)+vf(a) +12!v2f(a) ++1k!vkf(a) +Rk(a,v)

wobei das Restglied sich schreiben lässt als Rk(a,v) =1(k+1)!vk+1f(a+ϑv)

mit geeignetem ϑ[0,1].

4.4.13. Definition.

Man nennt

Tk(f,x,a) :=f(x)Rk(a,xa) =f(a)+xaf(a)+ 12xa2f(a) ++1k!xakf(a)

das Taylorpolynom der Stufe k von f um a.

Es ist wahr, dass Tk(f,x,a) ein Polynom in den Veränderlichen x1a1, x2a2, ,xnan ist.

Für k=3 sieht man das, indem man 4.4.9 iteriert.

4.4.14. Bemerkungen.

  1. Das Taylorpolynom der Stufe k erfüllt f(x) =Tk(f,x,a)+o(|xa|k).
  2. Das Taylorpolynom der Stufe 1 ist gerade die lineare Approximation:

    T1(f,x,a) =f(a)+xaf(a) =f(a)+(xa)gradf(a).

  3. Das Taylorpolynom der Stufe 2 ergibt sich mit Hilfe der Hesse-Matrix Hf(a) als

    T2(f,x,a) =f(a)+xaf(a)+12xa2f(a)

    =f(a)+(xa)gradf(a) +12(xa)Hf(a)(xa).

Mit anderen Worten: Der Graph von T1(f,x,a) ist ein affiner Teilraum, der den Graphen von f an der Stelle a linear approximiert.

Bei einer Funktion in zwei Variablen ist der Graph von T1(f,(x1x2),(a1a2)) also die Tangentialebene im Punkt (a1,a2,f(a))=(a1a2f(a)) an den Graphen von f:

Diese Tangentialebene hat die Gleichung x3=T1(f,(x1x2),(a1a2)).

Das Taylorpolynom der Stufe 2 beschreibt eine Approximation des Graphen von f durch eine Quadrik:

4.4.15. Spezialfall.

Es sei DR2 und fC3(D).

Als Taylorpolynom der Stufe 2 an der Stelle a=(a1a2) ergibt sich

T2(f,x,a) =T2(f,(x1x2),(a1a2))

=f(a1a2) +(x1a1)fx1(a1a2)+(x2a2)fx2(a1a2)

+12(x1a1)2fx1x1(a1a2) +(x1a1)(x2a2)fx1x2(a1a2) +12(x2a2)2fx2x2(a1a2)

In R3 wird durch die Gleichung x3=T2(f,(x1x2),a) eine Quadrik beschrieben, die man die Schmiegquadrik an den Graph an der Stelle a (oder im Punkt (a1,a2,f(a)) auf dem Graph von f) nennt.

Beispiele von Schmiegquadriken:

Schmiegquadrik

f(xy)=xsinxcosy,
Schmiegquadrik an der Stelle (00): z=x2


Schmiegquadrik

f(xy)=cosxcosy,
Schmiegquadrik an der Stelle (00): z=112(x2+y2)


Weitere Beispiele

von Schmiegquadriken finden Sie in der Online-Version des 3D-Modells zum Thema.

Dieses 3D-Modell gibt es auch real: Wenn Sie mich wieder in meinem Büro besuchen dürfen, verschaffe ich Ihnen Zugang.

3D-Modell Schmiegquadrik 3D-Modell Schmiegquadrik 3D-Modell Schmiegquadrik

Das 3D-Modell zeigt die Schmiegquadriken an drei verschiedenen Punkten auf dem Graphen von f:R2R: (xy)cos(x)cos(y).

Die rote Quadrik ist ein elliptisches Paraboloid, die blaue und die grüne sind hyperbolische Paraboloide (also Sattelflächen).

4.4.16. Spezialfall.

Wir betrachten wieder fC3(D) für eine Funktion f in zwei Variablen (also DR2).

  1. Ist Hf(a)0, so ist die Schmiegquadrik ein Paraboloid oder ein parabolischer Zylinder.
  2. Ist Hf(a)=0 so ist die Schmiegquadrik zu einer Ebene ausgeartet.

4.4.17. Definition.

Man nennt den Punkt (a1,a2,f(a1a2)) auf dem Graphen Γf

  1. flach, wenn die Schmiegquadrik Q eine Ebene ist,
  2. elliptisch, wenn Q ein elliptisches Paraboloid ist,
  3. hyperbolisch, wenn Q ein hyperbolisches Paraboloid ist,
  4. parabolisch, wenn Q ein parabolischer Zylinder ist.

Als einen Spezialfall des Satzes von Taylor 4.4.12 (nämlich für k=0) erhalten wir ein wichtiges Ergebnis:

4.4.18. Mittelwertsatz der Differentialrechnung.

Es sei DRn konvex, aD und fC1(D).

Dann gibt es zu jedem xD ein ϑ(0,1) mit

f(x) =f(a)+gradf(x~)(xa)

für x~:=a+ϑ(xa).

4.4.19. Bemerkung.

Jede Approximation der Form

f(x) =c0+j=1ncj(xjaj) +j,=1ncj(xjaj)(xa) + + j1,,jk=1ncj1jk(xj1aj1)(xjkajk) +o(|xa|k)

stimmt mit der Approximation durch das Taylorpolynom der Stufe k überein.

Insbesondere kann man Taylorpolynome aus Reihenentwicklungen ablesen:

4.4.20. Beispiel.

Wir wollen die Funktion

f:R2R: (xy)ex+y

an der Stelle a=(00) quadratisch approximieren.

Mit f(00)=1 und gradf(00)=(11) sowie Hf(00)=(1111) erhalten wir:

f(xy) =1 +(1,1)(xy) +12(x,y)(Hf(00))(xy) +o(|(x,y)(0,0)|2)

=1+x+y +12(x2+2xy+y2) +o(|(x,y)|2).

Also ist das Taylorpolynom zweiter Stufe

T2(f,(xy),(00) =1+x+y+12(x2+2xy+y2).

Man erhält dies auch, indem man z=x+y in die Exponentialreihe expz=j=0zjj! einsetzt, und die niedrigen Potenzen von z ausmultipliziert:

exp(x+y) =j=0(x+y)jj!

liefert die Partialsumme

j=02(x+y)jj! =(x+y)0+(x+y)1+12(x+y)2 =1+(x+y)+12(x2+xy+y2).

Datenschutz  *  Impressum