4.5. Extrema

Wie im eindimensionalen Fall verstehen wir unter einer lokalen Extremalstelle einer Funktion f eine Stelle x0, an der f ein lokales Extremum hat:

Es muss also eine Umgebung U von x0 so geben, dass für xUD

stets f(x)f(x0) (lokales Minimum) oder aber

stets f(x)f(x0) gilt (lokales Maximum).

Kann man U=D wählen, so nennt man das Extremum wieder global (oder absolut).

Wir verallgemeinern zunächst das notwendige Kriterium der waagrechten Tangenten:

4.5.1. Satz.

Es sei DRn offen, und es sei fC1(D).

Wenn der Punkt x0D eine Extremalstelle von f ist, dann gilt jedenfalls gradf(x0)=0.

4.5.2. Definition.

Jede Stelle x0D mit gradf(x0)=0 heißt kritische Stelle von f, den Punkt (x0,f(x0)) auf dem Graphen von f nennt man dann kritischen Punkt von f.

Die waagrechte Tangential(hyper)ebene ist ein notwendiges, aber nicht hinreichendes Kriterium für die Existenz eines Extremums:

Nicht jede kritische Stelle ist Extremalstelle!

Mit Hilfe der Hesse-Matrix ergeben sich hinreichende Bedingungen für Extrema. Diese Bedingungen verallgemeinern die Betrachtung der zweiten Ableitung im eindimensionalen Fall.

Die Hesse-Matrix ist symmetrisch, und beschreibt eine quadratische Form. Die folgenden Begriffe werden benötigt:

4.5.3. Definition.

Es sei ARn×n eine symmetrische Matrix.

Die zugehörige quadratische Form ist qA:RnR: xxAx.

Die Form qA heißt

Man beachte, dass diese Fälle nicht alle Möglichkeiten abdecken:

Die Matrizen S:=(1000) bzw. T:=(1111) beschreiben Formen qS bzw. qT, die zwar nie negative Werte annehmen, aber trotzdem nicht positiv definit sind.

Konkret:
Wegen qS(xy)=(xy)(1000)(xy) =x2 wird qS(xy) zwar nie negativ (für x,yR),
aber es gilt z.B. qS(01)=0, obwohl (01)(00).

Analog gilt qT(xy)=(xy)(1111)(xy) =x2+xy+yx+y2=(x+y)20,
aber qT(11)=0.

Jede reelle symmetrische Matrix A lässt sich nach einem Resultat aus der linearen Algebra orthogonal diagonalisieren:

Es gibt also eine quadratische Matrix F so, dass FF die Einheitsmatrix und FAF eine Diagonalmatrix ist.

Die Diagonaleinträge λ1,,λn von FAF sind dann gerade die Eigenwerte von A.

Wegen qA(Fx)=qFAF(x) =λ1x12+λnxn2 erhalten wir:

4.5.4. Lemma.

Die Form qA ist

Noch einmal der Hinweis: diese drei Sonderfälle decken nicht alle denkbaren Möglichkeiten ab!
Die oben betrachteten Formen qS und qT fallen unter keinen der drei Fälle: Die Matrizen S und T haben die Eigenwerte 0 und 1 bzw. 0 und 2.

Die abgedeckten Fälle sind aber gerade die, in denen das folgende Kriterium hilft:

4.5.5. Definitheitskriterium für Extremalstellen.

Es sei DRn offen, es sei fC2(D) und es sei aD eine kritische Stelle.

Dann gilt:

  1. Die Funktion f besitzt in a ein lokales Maximum, wenn die Hesse-Matrix Hf(a) negativ definit ist.
  2. Die Funktion f besitzt in a ein lokales Minimum, wenn Hf(a) positiv definit ist.
  3. Die Funktion f besitzt in a kein Extremum, wenn Hf(a) indefinit ist.

4.5.6. Definition.

Kritische Punkte, an denen keine lokalen Extrema vorliegen, heißen Sattelpunkte.

Kritische Punkte mit indefiniter Hesse-Matrix sind jedenfalls Sattelpunkte.

In den Fällen, in denen die Hesse-Matrix weder positiv noch negativ definit und auch nicht indefinit ist, kann man mit 4.5.5 keine Entscheidung fällen.

4.5.7. Spezialfall.

Wir betrachten das Definitheitskriterium 4.5.5 speziell für den Fall einer Funktion fC2(D) in zwei Veränderlichen:

f:DR:(xy)f(xy) mit DR2.

Die Hesse-Matrix ist dann Hf(a)=(fxx(a)fxy(a)fxy(a)fyy(a)).

Es sei aD eine kritische Stelle, und es seien λ1 und λ2 die beiden Eigenwerte von Hf(a).

Wir wissen aus der linearen Algebra:

λ1+λ2=Sp(Hf(a)) und λ1λ2=det(Hf(a)).

Man kann diese beiden Relationen auch schnell durch Vergleich der Koeffizienten im charakterstischen Polynom det(Hf(a)λE2) =(λλ1)(λλ2) verifizieren.

Der Eigenwert 0 tritt genau dann auf, wenn die Determinante 0 ist:

0{λ1,λ2} det(Hf(a))=0.

In diesem Fall erlaubt die Hesse-Matrix keine Entscheidung über den Typ der kritischen Stelle a.

Im Fall det(Hf(a))<0 haben die beiden Eigenwerte verschiedenes Vorzeichen, damit beschreibt die Hesse-Matrix eine indefinite quadratische Form und es liegt bei a ein Sattelpunkt vor.

Es bleibt der Fall det(Hf(a))>0.

Jetzt haben die beiden Eigenwerte gleiches Vorzeichen, und dieses ist auch das Vorzeichen von Sp(Hf(a))=λ1+λ2.

Es liegt also im Fall positiver Determinante genau dann ein lokales Maximum vor, wenn die Spur von Hf(a) negativ ist;

ein lokales Minimum liegt genau dann vor, wenn diese Spur positiv ist.

4.5.8. Zusammenfassung.

Es sei DR2 offen, fC2(D), und es sei aD eine kritische Stelle (d. h. gradf(a)=0).

Dann gilt:

Im Fall det(Hf(a))=0 kann man mit der Hesse-Matrix allein keine Entscheidung fällen.

4.5.9. Bemerkung.

Es ist tatsächlich so, dass bei positiver Determinante der Hesse-Matrix Hf(a) auch die beiden Diagonaleinträge stets dasselbe Vorzeichen haben — man kann also das Vorzeichen der Spur (und damit der Eigenwerte) schon an einem einzigen Diagonaleintrag direkt ablesen:

Für fxx(a)>0 liegt ein lokales Minimum,für fxx(a)<0 liegt ein lokales Maximum vor.

Dies ist ein Spezialfall eines allgemeinen Satzes:
Man kann die positive Definitheit einer reellen symmetrischen Matrix beliebiger Größe allein an der Positivität der so genannten Hauptminoren ablesen.

4.5.10. Beispiel.

Die Funktion f:R2R: (xy)x2+y2+x ist beliebig oft stetig partiell differenzierbar.

Notwendiges Kriterium für ein lokales Extremum in a=(xy) ist

(00)=gradf(a) =(2x+12y),

dies ist genau für a=(1/20) erfüllt.

Mit fxx(a)=2=fyy(a) und fxy(a)=0 erhalten wir

Hf(1/20)=(2002).

Die Hesse-Matrix ist positiv definit, es liegt in (1/20) also ein lokales Minimum ((12,0),14) vor.

Dieses Minimum ist sogar global:

Wegen x2+x+14+y2 =(x+12)2+y2 0 gilt f(xy)= x2+y2+x s14 =f(1/20) für alle (xy)R2.

4.5.11. Beispiel.

Die Funktion

f:R2R: (xy)xy(1x2y2)

ist ebenfalls auf ganz R2 beliebig oft stetig partiell differenzierbar.

Die kritischen Stellen ergeben sich aus der Bedingung

(00) =gradf(xy) =(y3x2yy3xx33xy2) =(y(13x2y2)x(1x23y2)).

Mit Hilfe von Fallunterscheidungen (je nachdem, ob x oder y gleich Null sind oder nicht), findet man die neun kritischen Stellen

P1=(10), P2=(10), P3=(00),

P4=(01), P5=(01),

P6=(1/21/2), P7=(1/21/2), P8=(1/21/2), P9=(1/21/2).

Mit

fxx(uv)=6uv

fxy(uv)=13u23v2

fyy(uv)=6uv

ergibt sich als Hesse-Matrix

Hf(uv)= (6uv13(u2+v2)13(u2+v2)6uv),

mit Determinante d(uv)= 36u2v2(13u23v2)2.

Für P1,,P5 gilt d(Pj)<0.

Also liegen an diesen Stellen Sattelpunkte vor.

Für P6,,P9 gilt dagegen d(Pj)=2>0.

Wir berechnen

fxx(P6) =fxx(1/21/2) =64 =fxx(1/21/2) =fxx(P9)

und

fxx(P7) =fxx(1/21/2) =64 =fxx(1/21/2) =fxx(P8).

Demnach sind (P6,f(P6)) und (P9,f(P9)) lokale Maxima, dagegen liegen bei P7 und P8 lokale Minima vor.

4.5.12. Bemerkung.

Den Typ der kritischen Stellen in 4.5.11 hätte man auch durch eine Diskussion des Vorzeichens der Funktionswerte bestimmen können.

Die blauen Linien bilden die Niveaumenge zum Niveau 0; die beiden Ellipsen sind die Nullstellenmengen der „interessanten“ Faktoren in fx bzw fy.

Das Vorzeichen von f(xy)=xy(1x2y2) ergibt sich aus den Vorzeichen der drei Faktoren (in der Skizze angedeutet durch „ + + + “ etc.)

4.5.13. Beispiel.

Die Funktion f:R2R: (xy)sin(xy) hat den Gradienten gradf(xy) =(ycos(xy)xcos(xy)), als kritische Stellen erhalten wir neben dem Ursprung (00) alle Punkte der Form

(xy) mit cos(xy)=0:

also (xy) mit xyπ2+πZ.

Diese Punkte liegen auf Hyperbelästen, deren Asymptoten die Koordinatenachsen sind.

Die Hesse-Matrix Hf(xy)= (fxx(xy)fxy(xy)fyx(xy)fyy(xy)) hat die Einträge

fxx(xy)=y2sin(xy),

fxy(xy) =xysin(xy)+cos(xy) =fyx(xy),

fyy(xy)=x2sin(xy) und die Determinante

det(Hf(xy)) =x2y2sin(xy)2 (xysin(xy)+cos(xy))2

=x2y2sin(xy)2 x2y2sin(xy)2 +2xysin(xy)cos(xy) cos(xy)2 =(2xysin(xy)cos(xy))cos(xy).

Für den Ursprung ergibt sich det(Hf(00)) =cos(0)2 =1<0, dort liegt also ein Sattelpunkt vor.

An allen anderen kritischen Stellen b gilt det(Hf(b))=0, unser Kriterium 4.5.8 liefert also keine Aussage.

Man sieht in diesem Fall aber leicht:
Die Hyperbeläste, die von den kritischen Stellen gebildet werden, gehören jeweils zu Niveaulinien zu den Niveaus +1 bzw. 1.

Wenn Sie mit der Maus über das Bild fahren, wird das Niveau +1 angedeutet.

Die Funktion nimmt auf diesen Niveaus (globale) Maxima und Minima an!

Bei der Suche nach Extrema haben wir uns bisher beschränkt auf Stellen im Inneren des Definitionsbereichs (oft implizit durch die Annahme, dass der Definitionsbereich offen sei).

Nur unter dieser Annahme (neben der Differenzierbarkeit) ist es richtig, dass die Extrema an Stellen mit horizontaler Tangentialhyperebene (also bei kritischen Stellen) zu finden sind. Wenn der Definitionsbereich neben inneren Punkten auch Randpunkte enthält (oder gar nur aus solchen besteht) muss man diese gesondert untersuchen!

4.5.14. Beispiele.

Die Funktion f:[0,1]R: tcos(t) hat ein Maximum bei t=0 (mit zufällig horizontaler Tangente) und ein Minimum bei t=1 (an diesem Randpunkt ist die Tangente nicht horizontal).

Die Funktion g:D:=[1,1]2R: (xy)x2+y2 hat ein Minimum bei (00):

Das ist ein innerer Punkt von D; die Tangentialebene liegt horizontal.

Die Maxima liegen auf dem Rand; die Tangentialebenen sind dort nicht horizontal.

Wenn der Rand des Definitionsbereichs geeignet ist, kann man die Suche nach Extrema auf dem Rand mit den Methoden des nächsten Abschnitts betreiben.

Datenschutz  *  Impressum