Professional Documents
Culture Documents
Dezember 2010
Michael Kaltenbäck
Inhaltsverzeichnis
11 Wegintegrale 103
11.1 Wege . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
11.2 Wegintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
11.3 Homotopie, einfacher Zusammenhang . . . . . . . . . . . . . . . . . 121
11.4 Holomorphe Funktionen . . . . . . . . . . . . . . . . . . . . . . . . 126
i
ii INHALTSVERZEICHNIS
Literaturverzeichnis 181
Index 182
Kapitel 8
f (x) = x2 f (x) = x2
1 1
n=4 n=8
0 1 0 1
In unserem Fall erhält man auf dieser Art und Weise die folgende Näherung für die
Gesamtfläche A:
X
n
1 1 1
An = min{ f (x) : (k − 1) ≤ x≤k }· =
k=1
n n n
1
2 KAPITEL 8. DAS RIEMANNSCHE INTEGRAL
X !2
1 X 2
n n−1
k−1 1 1 (n − 1)n(2n − 1)
= · = 3 k = 3 .
k=1
n n n k=0
n 6
Lässt man in dieser Formel n immer größer werden, so erhält man A = limn→∞ An = 31 .
Genauso könnte man natürlich die Fläche des Streifens durch das Rechteck mit
der Breite △x und der Höhe max f (x) approximieren. Unserer Vorstellung von Fläche
folgend sollte bei dieser zweiten Methode zur Flächenbestimmung das selbe heraus-
kommen.
f (x) = x2 f (x) = x2
1 1
n=4 n=8
0 1 0 1
1 X 2
n
1 n(n + 1)(2n + 1)
= k = 3 ,
n3 k=1 n 6
8.1.2 Definition. Sei [a, b] ein endliches Intervall in R. Wir nennen eine endliche Teil-
menge Z von [a, b] eine Zerlegung des Intervalls [a, b], falls a, b ∈ Z.
Wir bezeichnen mit Z die Menge aller solcher Zerlegungen, versehen diese Menge
mit der Relation ⊆, und erhalten damit eine gerichtete Menge (vgl. Definition 5.3.1).
Wollen wir die Elemente einer Zerlegung Z aufzählen, so werden wir das immer
so tun, dass n(Z) + 1 die Mächtigkeit von Z bezeichnet, und dass
Z = {ξ j : j = 0, . . . , n(Z)}, wobei
X
n(Z)
U(Z) = (ξ j − ξ j−1 ) inf f (t). (8.1)
t∈[ξ j−1 ,ξ j ]
j=1
8.1. OBER- UND UNTERSUMMEN 3
f (x)
Z: a = ξ0 ξ1 ξ2 ξ3 ξ4 ξ5 ξ6 ξ7 ξ8 ξ9 = b
f (x)
Z: a = ξ0 ξ1 ξ2 ξ3 ξ4 ξ5 ξ6 ξ7 ξ8 ξ9 = b
Wir sehen also, dass alle Ober- und Untersummen gleichmäßig nach oben und nach
unten beschränkt sind. Somit ist folgende Definition sinnvoll.
8.1.3 Definition. Wir setzen
b
Z− Zb
f dx := inf Z∈Z O(Z), f dx := supZ∈Z U(Z),
a −
a
und bezeichnen die erste Zahl als das obere- und die zweite als das untere Integral von
f über [a, b].
Die Funktion f heißt integrierbar auf [a, b], falls das obere mit dem unteren Integral
übereinstimmt. In diesem Fall bezeichnen ihren gemeinsamen Wert als das Integral1
1 Man spricht auch vom Darbouxschen Integral.
4 KAPITEL 8. DAS RIEMANNSCHE INTEGRAL
8.1.4 Bemerkung. Da die Menge Z aller Zerlegungen von [a, b] bezüglich ⊆ eine ge-
richtete Menge ist, können wir von den Netzen U(Z) Z∈Z und O(Z) Z∈Z sprechen.
Sei nun Z1 ⊆ Z2 , wobei Z1 = {ξ j : j = 0, . . . , n(Z1 )} sowie
Z2 = {ηk : k = 0, . . . , n(Z2 )}. Ist j ∈ {1, . . . , n(Z1 )}, so gibt es Indizes k( j − 1) < k( j),
sodass
ξ j−1 = ηk( j−1) < ηk( j−1)+1 < · · · < ηk( j)−1 < ηk( j) = ξ j .
| {z }
k( j)−k( j−1)−1 viele
Pk( j)
Wegen (ξ j − ξ j−1 ) = k=k( j−1)+1 (ηk − ηk−1 ) folgt
k( j)
X
(ξ j − ξ j−1 ) inf f (t) = (ηk − ηk−1 ) inf f (t) ≤
t∈[ξ j−1 ,ξ j ]
k=k( j−1)+1 t∈[ξ j−1 , ξ j ]
| {z }
⊇[ηk−1 ,ηk ]
k( j)
X
(ηk − ηk−1 ) inf f (t).
t∈[ηk−1 ,ηk ]
k=k( j−1)+1
Summiert man über alle j ∈ {1, . . . , n(Z1 )} auf, so erhält man U(Z1 ) ≤ U(Z2 ). Wir
sehen also, dass U(Z) Z∈Z ein monoton wachsendes Netz ist. Nach (5.8) gilt daher
Zb
lim U(Z) = sup U(Z) = f dx.
Z∈Z Z∈Z
−
a
Entsprechend ist das Netz O(Z) Z∈Z der Obersummen monoton fallend, und
b
Z−
lim O(Z) = inf O(Z) = f dx.
Z∈Z Z∈Z
a
Klarerweise ist damit auch das Netz O(Z) − U(Z) Z∈Z monoton fallend, und besteht
aus nicht negativen reellen Zahlen. Also gilt auch (vgl. Nach (5.8))
und wegen der Rechenregeln für R-wertige Netze (siehe Anschnitt 5.3) gleicht dieser
Ausdruck
b
Z− Zb
lim O(Z) − lim U(Z) = f dx − f dx. (8.4)
Z∈Z Z∈Z
a −
a
Also ist die Integrierbarkeit einer Funktion f äquivalent dazu, dass der Ausdruck in
(8.3) verschwindet.
8.2. DAS RIEMANN-INTEGRAL 5
und nennen |R| := max{(ξ j − ξ j−1 ) : j = 1, . . . , n(R)} die Feinheit der Riemann-
Zerlegung. Die Punkte ξ j heißen Stützstellen und die Punkte α j Zwischenstellen.
Weiters sei R1 R2 :⇔ |R2 | ≤ |R1 |. Ist R die Menge aller solcher Riemann-
Zerlegungen, dann ist (R, ) eine gerichtete Menge2 .
Ist f eine beschränkte reell- bzw. komplexwertige Funktion, so betrachtet man das
Netz S (R) R∈R , wobei die Riemannsumme 3 zur Riemann-Zerlegung R durch
X
n(R)
S (R) = (ξ j − ξ j−1 ) f (α j ).
j=1
definiert ist. Konvergiert dieses Netz, so nennen wir die Funktion f Riemann-
integrierbar und bezeichnen
Zb
f dx := lim S (R)
R∈R
a
f (x)
a = ξ0 ξ1 ξ2 ξ3 ξ4 ξ5 ξ6 ξ7 ξ8 ξ9 =b
R: α1 α2 α3 α4 α5 α6 α7 α8 α9
Für limR∈R S (R) schreibt man auch lim|R|→0 S (R), um deutlich zu machen, dass R
durch die Feinheit der Riemann-Zerlegung gerichtet wird. Da es zu jedem δ > 0, δ ≤
2 ist sicher nicht antisymmetrisch und unterscheidet sich wesentlich von der Halbordnung ⊆ auf Z aus
Definition 8.1.2.
3 Bernhard Riemann, 17.9.1826-20.7.1866
6 KAPITEL 8. DAS RIEMANNSCHE INTEGRAL
b −a eine Riemann-Zerlegung R gibt mit |R| = δ, ist die Existenz von I = lim|R|→0 S (R)
äquivalent zu
∀ǫ > 0 ∃δ > 0 : |S (R) − I| < ǫ ∀R ∈ R, |R| ≤ δ.
X
n(R)
S M (R) = (ξ j − ξ j−1 ) f (α j ),
j=1
M∩[ξ j−1 ,ξ j ]=∅
so hat diese Summe höchstens 2m Summanden weniger als S (R). Somit folgt
X
n(R)
S M (R) − S (R) ≤ (ξ j − ξ j−1 )| f (α j )| ≤ 2m|R| · k f k∞ , (8.5)
j=1
M∩[ξ j−1 ,ξ j ],∅
wobei k f k∞ = sup{| f (t)| : t ∈ [a, b]}, und wir sehen, dass S M (R) genau dann
R∈R
konvergiert, wenn S (R) R∈R es tut. In diesem Fall gilt
Z b
f dx = lim S (R) = lim S M (R).
a |R|→0 |R|→0
Als Anwendung dieser Bemerkung sieht man, dass, wenn sich zwei Funktionen f und g
nur auf einer endlichen Menge M unterscheiden, aus der Riemann-Integrierbarkeit von
f auch die von g folgt. In der Tat ist dann S M ( f, R) = S M (g, R), wobei das Argument
f bzw. g andeutet, von welcher Funktion die entsprechende Riemann-Summe gebildet
wird.
Mit Hilfe dieser Bemerkung können wir einen ersten Zusammenhang zwischen
Riemann-Summen und Ober- bzw. Untersummen herstellen.
8.2.4 Lemma. Sei f : [a, b] → R eine beschränkte reellwertige Funktion, und sei
Z0 ∈ Z, ǫ > 0. Dann gibt es ein δ > 0, sodass
Beweis. Man überzeugt sich leicht, dass für eine relle Konstante c
n(R)
Für R = (ξ j )n(R)
j=0 ; (α j ) j=1 ∈ R, bedeutet M ∩ [ξ j−1 , ξ j ] = ∅, dass [ξ j−1 , ξ j ] sicher ganz
enthalten in einem gewissen Intervall [ηk( j)−1 , ηk( j) ] enthalten ist. Bezeichnen wir mit J
die Menge aller dieser Indizes, so folgt
X
n(R) X0 )
n(Z X
S M (R) = (ξ j − ξ j−1 ) f (α j ) = (ξ j − ξ j−1 ) f (α j ) ≤
j∈J k=1 j∈J,k( j)=k
X0 )
n(Z X X0 )
n(Z
(ξ j − ξ j−1 ) sup f (t) ≤ (ηk − ηk−1 ) sup f (t) = O(Z0 ).
k=1 j∈J,k( j)=k t∈[ηk−1 ,ηk ] k=1 t∈[ηk−1 ,ηk ]
Es folgt
S (R) ≤ S M (R) − S (R) + O(Z0 ) ≤ O(Z0 ) + |R| · 2(n(Z0 ) + 1) · k f k∞ .
Die erste Aussage des Lemmas folgt nun, wenn man |R| hinreichend klein macht. Die
zweite zeigt man analog.
❑
Wir werden nun zeigen, dass die beiden vorgestellten Zugänge zur Integration für
reellwertige beschränkte Funktionen f äquivalent sind.
8.2.5 Satz. Für eine beschränkte Funktion f : [a, b] → R sind folgende Aussagen
äquivalent:
(i) Das obere und das untere Integral von f stimmen überein.
X
n(R) X
n(R)
O(R) := (ξ j − ξ j−1 ) sup f (t), U(R) := (ξ j − ξ j−1 ) inf f (t),
t∈[ξ j−1 ,ξ j ] t∈[ξ j−1 ,ξ j ]
j=1 j=1
für jede beliebige Folge (Rn )n∈N von Riemann-Zerlegungen mit limn→∞ |Rn | = 0.
Beweis.
4 Klarerweise gilt O(R) = O(Z) und U(R) = U(Z), wobei Z = {ξ j : j = 0, . . . , n(R)} ∈ Z.
8 KAPITEL 8. DAS RIEMANNSCHE INTEGRAL
(iii) ⇒ (iv) : Setzen wir R := lim|R|→0 S (R), so wollen zeigen, dass R = lim|R|→0 O(R).
Zu jedem ǫ > 0 gibt es wegen der vorausgesetzten Konvergenz ein R0 , sodass
|R − S (R)| < ǫ für alle R R0 .
n(R)
Sei R = (ξ j )n(R) j=0 ; (α j ) j=1 R0 eine feste Riemann-Zerlegung. Wähle nun für
j = 1, . . . , n(R) und k ∈ N ein αkj ∈ [ξ j−1 , ξ j ], sodass
1
sup f (t) − < f (αkj ) ≤ sup f (t).
t∈[ξ j−1 ,ξ j ] k t∈[ξ j−1 ,ξ j ]
k n(R)
Setzt man Rk = (ξ j )n(R)
j=0 ; (α j ) j=1 , so folgt
X n(R)
1 1
O(R) − S (Rk ) ≤ |ξ j − ξ j−1 | = (b − a) .
j=1
k k
Schließlich sei noch bemerkt, dass es offensichtlich eine Folge von Riemann-
Zerlegungen mit limn→∞ |Rn | = 0 gibt. Man nehme etwa die Folge (Rn )n∈N , wo
Rn genau n +1 viele äquidistante Stützstellen hat, und wobei die Zwischenstellen
genau in der Mitte zwischen den angrenzenden Stützstellen liegt.
(v) ⇒ (ii) : Das ist klar, wenn man baechtet, dass O(R) = O(Z), U(R) = U(Z), wenn
Z = {ξ j : j = 0, . . . , n(R)} ∈ Z die Menge der Stützstellen einer gegebenen
n(R)
Riemann-Zerlegung R = (ξ j )n(R)j=0 ; (α j ) j=1 ∈ R ist.
(i) ⇔ (ii) : Das haben wir schon in Bemerkung 8.1.4 gesehen (vgl. (8.3) und (8.4)).
b
R− Rb
(i) ⇒ (iii) : Nun gelte also I := f dx = f dx. Zu einem beliebigen ǫ > 0 wähle Z0
a −
a
so, dass
I − ǫ < U(Z0 ) ≤ O(Z0 ) < I + ǫ.
Nach Lemma 8.2.4 folgt die Existenz eines δ > 0, sodass
I − 2ǫ < U(Z0 ) − ǫ ≤ S (R) ≤ O(Z0 ) + ǫ < I + 2ǫ
für |R| ≤ δ. Also lim|Z|→0 S (R) = I.
8.2. DAS RIEMANN-INTEGRAL 9
Dass limn→∞ O(Rn ) = lim|R|→0 O(R), limn→∞ U(Rn ) = lim|R|→0 U(R) und
limn→∞ S (Rn ) = lim|R|→0 S (R) für limn→∞ |Rn | = 0 gilt, sieht man genauso, wie im
zweiten Beweisschritt.
❑
8.2.6 Beispiel. Nehmen wir einmal an, dass wir schon wissen, dass die Funktion f (x) =
x2 aus Beispiel 8.1.1 Riemann-integrierbar ist. Dann können wir uns mit Satz 8.2.5
sicher sein, dass die Folgen An und Ân tatsächlich gegen das Integral von f über [0, 1]
konvergieren. Sie stimmen nämlich mit U(Rn ) bzw. mit O(Rn ) überein, wobei Rn eine
Riemann-Zerlegung ist, die genau n + 1 viele äquidistante Stützstellen hat.
Wir werden später sehen, dass alle stetigen Funktionen integrierbar sind, und wie
man mit Hilfe der Differenzialrechnung das Integral konkret ausrechnet. Dass bei wei-
tem nicht alle Funktionen integrierbar sind, sieht man am übernächsten Beispiel.
8.2.7 Beispiel. Betrachte die konstante Funktion f : [0, 1] → C, d.h. f (t) = c, t ∈
[a, b]. Ist R eine Riemann-Zerlegung, so rechnet man
X
n(R) X
n(R)
S (R) = (ξ j − ξ j−1 ) f (α j ) = c (ξ j − ξ j−1 ) = c(b − a),
j=1 j=1
Rb
und damit a c dx = lim|R|→0 S (R) = c(b − a).
Wegen Bemerkung 8.2.3 sehen wir auch, dass jede Funktion, die konstant gleich c
bis auf eine endliche Menge M ist, integrierbar ist und dass das Integral gleich c(b − a)
ist.
Diese Tatsache lässt sich aber nicht auf den Fall eines abzählbaren M ausdehnen.
8.2.8 Beispiel. Betrachte die Funktion f : [0, 1] → R definiert durch
0, x irrational
f (x) :=
.
1, x rational
Ist nun Z = {ξ j : j = 0, . . . , n(Z)} eine Zerlegung von [0, 1], so enthält jedes Intervall
[ξ j−1 , ξ j ] sowohl rationale als auch irrationale Zahlen. Somit folgt
U(Z) = 0, O(Z) = 1.
Also ist f nicht integrierbar.
Im Folgenden wollen wir einige Eigenschaften von Integralen auflisten, die unmit-
telbar aus der Tatsache folgen, dass wir Integrale als Grenzwerte von Netzen auffassen.
8.2.9 Lemma. (i) Seien f1 , f2 Riemann-integrierbar über [a, b] und c eine reelle
bzw. komplexe Konstante. Dann sind auch f1 + f2 und c f1 Riemann-integrierbar,
und es gilt
Zb Zb Zb Zb Zb
( f1 + f2 ) dx = f1 dx + f2 dx, (c f1 ) dx = c f1 dx.
a a a a a
f dx ≤ | f (x)| dx ≤ (b − a) · k f k∞ , (8.6)
a a
Beweis. Zunächst folgt unmittelbar aus der Definition der Riemannsummen und der
Obersummen S ( f1 + f2 , R) = S ( f1 , R) + S ( f2 , R), S (c f1 , R) = cS ( f1 , R) und S (g1 , R) ≤
S (g2 , R). Durch den Grenzübergang |R| → 0 erhalten wir (i) und (iii).
Nun sei ǫ > 0 und Z0 eine Zerlegung von [a, b]. Weiters sei δ > 0, sodass |R| ≤
δ ⇒ S (| f |, R) ≤ O(| f |, Z0 ) + ǫ (siehe Lemma 8.2.4).
Ist R eine Riemann-Zerlegung von [a, b] mit |R| ≤ δ, so folgt leicht aus der Defini-
tion der Riemannsummen und der Obersummen und der Dreiecksungleichung
(8.6) folgt durch die Grenzwertbildung, zuerst |R| → 0 und dann Z0 ∈ Z, sowie der
Tatsache, dass ǫ > 0 beliebig ist.
Schließlich folgt |S ( f, R)| ≤ (b − a) · k f k∞ für jede Riemann-Zerlegung R von [a, b]
unmittelbar aus der Dreiecksungleichung.
❑
Für Folgen ist (8.7) genau die Cauchy-Folgen Bedingung. Also liegt die Aussage
des nächsten Lemma nahe.
8.3.2 Lemma. In einem vollständigen metrischen Raum ist ein Netz genau dann kon-
vergent, wenn es ein Cauchy-Netz ist. .
Beweis. Ist nun (xi )i∈I ein Netz, und konvergiert dieses gegen x ∈ X, so gibt es zu
jedem ǫ > 0 ein i0 ∈ I, sodass d(xi , x) < 2ǫ für i i0 . Wegen der Dreiecksungleichung
folgt d(xi , x j ) < ǫ für i, j i0 . Also folgt (8.7).
Gilt umgekehrt (8.7), so definieren wir induktiv eine Folge von in ∈ I, n ∈ N, durch
die Forderung, dass
1
in+1 in und d(xi , x j ) < , i, j in ,
n
indem wir zuerst i1 ∈ I so wählen, dass d(xi , x j ) < 1 für i, j i1 . Zu gegebenem in ∈ I
1
wähle dann gemäß (8.7) jn+1 ∈ I so, dass d(xi , x j ) < n+1 für i, j jn+1 . Nun sei in+1 ∈ I
gemäß (5.1) so gewählt, dass in+1 in , jn+1 .
8.3. INTEGRALE VON STETIGEN FUNKTIONEN 11
Offensichtlich ist (xin )n∈N eine Cauchyfolge und damit konvergent gegen ein x ∈ X.
Ist n ≤ m, so folgt aus d(xim , xin ) < n1 durch Grenzübergang m → ∞ die Tatsache, dass
d(x, xin ) ≤ n1 , n ∈ N.
Ist nun ǫ > 0, so wähle n ∈ N, sodass n2 ≤ ǫ. Für i in folgt
2
d(x, xi ) ≤ d(x, xin ) + d(xin , xi ) < ≤ ǫ,
n
bzw. xi ∈ Uǫ (x), und somit konvergiert (xi )i∈I gegen x.
❑
8.3.3 Satz. Ist f eine stetige reell- oder komplexwertige Funktion auf einem reellen
Intervall [a, b], so ist f Riemann-integrierbar.
Beweis. Wir bemerken zuerst, dass wegen Satz 6.3.3 die Funktion f sogar gleichmäßig
stetig ist. Also gibt es zu ǫ > 0 ein δ > 0, sodass |x−y| ≤ δ ⇒ | f (x)− f (y)| < ǫ. Definiert
man für beliebiges γ > 0
Dazu sei R2 eine Riemann-Zerlegung, deren Stützstellen die von R1 und R umfasst.
Das bedeutet, dass mit
n(R1 ) n(R)
R1 = (ξ j )n(R 1) n(R)
j=0 ; (α j ) j=1 , R = (ζ j ) j=0 ; (γ j ) j=1 ,
n(R2 )
R2 = (η j )n(R 2)
j=0 ; (β j ) j=1 ,
die Beziehung
gilt. Ist j ∈ {1, . . . , n(R1 )}, so gibt es Indizes k( j − 1) < k( j), sodass
ξ j−1 = ηk( j−1) < ηk( j−1)+1 < · · · < ηk( j)−1 < ηk( j) = ξ j .
| {z }
k( j)−k( j−1)−1 viele
Es folgt
n(RX1 ) X
k( j)
S (R1 ) − S (R2 ) = (ξ j − ξ j−1 ) f (α j ) − (ηk − ηk−1 ) f (βk ) ≤
j=1 k=k( j−1)+1
X1 )
n(R X
k( j)
(ξ j − ξ j−1 ) f (α j ) − (ηk − ηk−1 ) f (βk ) ≤
j=1 k=k( j−1)+1
12 KAPITEL 8. DAS RIEMANNSCHE INTEGRAL
X1 )
n(R X
k( j)
(ηk − ηk−1 ) · | f (α j ) − f (βk )|.
j=1 k=k( j−1)+1
und wegen |R1 | ≤ δ ist dieser Ausdruck ≤ (b − a) · ρ(δ) ≤ 3ǫ . Genauso zeigt man
|S (R2 ) − S (R)| ≤ 3ǫ . (8.8) folgt nun sofort aus der Dreicksungleichung.
❑
Für einen späteren Gebrauch sei bemerkt, dass aus (8.9) für zwei Riemann-
Zerlegungen R1 , R mit Hilfe der Dreiecksungleichung unmittelbar
S (R) − S (R1 ) ≤ 2(b − a) · ρ(max(|R|, |R1 |)). (8.10)
folgt, wobei ρ(γ) := sup{| f (s) − f (t)| : s, t ∈ [a, b], |s − t| ≤ γ}. Da wir zur Herleitung
von (8.9) die Stetigkeit von f nicht benötigt haben, ist der Fall eines nicht stetigen f
nicht ausgeschlossen.
Somit ist S ( f |[c,d] , R′ ) R′ ∈R′ auch ein Cauchy-Netz und f |[c,d] daher auf [c, d]
Riemann-integrierbar.
Wegen (1[c,d] · f )|[c,d] = f |[c,d] folgt aus dem eben bewiesenen auch aus der
Riemann-Integrierbarkeit von 1[c,d] · f die von f |[c,d] .
Wir setzen M = {c, d}, und wissen aus Bemerkung 8.2.3, dass der Beweis vollendet
ist, wenn wir
I = lim
′
S M ( f |[c,d] , R′ ) ⇒ I = lim S M (1[c,d] · f, R),
|R |→0 |R|→0
beweisen können. Dazu sei ǫ > 0, und δ > 0, sodass |R′ | ≤ δ ⇒ |I − S M ( f |[c,d] , R′ )| < ǫ.
n(R)
Ist nun R = (ξ j )n(R) j=0 ; (α j ) j=1 eine Riemann-Zerlegung von [a, b] mit |R| ≤ δ, so sei
′
n(R′ )
R′ = (η j )n(R )
j=0 ; (β j ) j=1 die Riemann-Zerlegung von [c, d], für die {η1 , . . . , ηn(R′ )−1 } =
{ξ1 , . . . , ξn(R)−1 } ∩ (c, d), und für die {β2 , . . . , βn(R′ )−1 } = {α1 , . . . , αn(R) } ∩ [η1 , ηn(R′ )−1 ].
Es folgt
X
n(R)
S M (1[c,d] · f, R) = (ξ j − ξ j−1 )1[c,d] (α j ) f (α j ) =
j=1
c,d<[ξ j−1 ,ξ j ]
′
X
n(R) X
n(R )−1
(ξ j − ξ j−1 ) f (α j ) = (η j − η j−1 ) f (β j ) = S M ( f |[c,d] , R′ ).
j=1 j=2
c<ξ j−1 ,ξ j <d
8.4.3 Definition. Eine Abbildung f : [a, b] → R (C) heißt stückweise stetige Funktion
, falls es eine Zerlegung a = t0 < t1 < · · · < tn = b von [a, b] gibt, sodass sich die
Funktionen f |(t j−1 ,t j ) stetig auf [t j−1 , t j ] fortsetzen lassen.
8.4.4 Bemerkung. Aus Lemma 8.4.1 folgt nun, dass jede stückweise stetige Funktion
Riemann-integrierbar ist.
Ist nämlich f : [a, b] → R (C) und sind a = t0 < t1 < · · · < tn = b, sodass sich
für alle j = 1, . . . , n, die Funktion f |(t j−1 ,t j ) stetig auf [t j−1 , t j ] fortsetzen lässt, so sind
alle Funktionen 1(t j−1 ,t j ) · f und daher auch ihre Summe Riemann-integrierbar. Diese
Summe unterscheidet sich aber von f nur an endlich vielen Punkten und ist daher
selbst Riemann-integrierbar.
Im Folgenden stellt es sich als praktisch heraus, auch Integrale über Intervalle der
Länge Null bzw. Integrale zu definieren, die von der oberen zur unteren Grenze durch-
laufen werden. Ist also c > d, und f : [d, c] → R (C) Riemann-integrierbar, so setzen
wir Z Z Z
c d c
f (x) dx := 0, f (x) dx := − f (x) dx.
c c d
Mit dieser Konvention sei zunächst bemerkt:
14 KAPITEL 8. DAS RIEMANNSCHE INTEGRAL
8.4.5 Bemerkung. Sei nun f auf [a, b] reell- bzw. komplexwertig und Riemann-
integrierbar und sei a ≤ u ≤ v ≤ w ≤ b. Dann folgt aus Lemma 8.4.1, Lemma 8.2.9
und Bemerkung 8.4.2
Z w Z b Z b
f (t) dt = 1[u,v] (t) · f (t) dt = 1[u,v) (t) + 1[v,w] (t) · f (t) dt =
u a a
Z b Z b Z v Z w
1[u,v) (t) · f (t) dt + 1[v,w] (t) · f (t) dt = f (t) dt + f (t) dt.
a a u v
8.4.6 Satz (Hauptsatz der Diff.-Int.Rechnung). Sei f eine reell- oder komplexwertige
Funktion auf [a, b], die über [a, b] Riemann-integrierbar ist. Für x ∈ [a, b] definiere5
Zx
F(x) := f (t) dt.
a
Dann ist die Funktion F : [a, b] → R (C) stetig auf [a, b].
Ist f in einem Punkt x0 stetig, so ist F bei x0 differenzierbar, und es gilt6
F ′ (x0 ) = f (x0 ).
F(x)−F(x0 )
Also folgt F ′ (x0 )+ = lim x→x0 + x−x0 = f (x0 ). Entsprechend zeigt man
F ′ (x0 )− = f (x0 ), wenn x0 ∈ (a, b].
❑
8.4.7 Bemerkung. Mit den Voraussetzungen von Satz 8.4.6 betrachte man G(x) =
Rb Rb Rx
f (t) dt. Wegen G(x) = a f (t) dt − a f (t) dt gilt G′ (x) = − f (x).
x Rx
Somit folgt für ein festes c ∈ [a, b], dass ( c f (t) dt)′ = f (x) egal, ob x ≥ c oder
x ≤ c.
5 DieExistenz dieses Integrals für alle x ∈ [a, b] folgt aus Lemma 8.4.1.
6 Ist
x0 gleich a oder b, so meinen wir die links- bzw. rechtsseitige Differenzierbarkeit bzw. Ableitung.
7 Wir sehen, dass diese Funktion sogar Lipschitz stetig ist, d.h. dass |F(y) − F(x)| ≤ M · |y − x| für alle
Folgendes Korollar ist die Grundlage dafür, Integrale mit Hilfe der Stammfunktion
berechnen zu können.
8.4.8 Korollar. Ist f : [a, b] → R (C) stetig, und ist H : [a, b] → R (C) eine Stamm-
funktion von f , d.h. H ist auf [a, b] differenzierbar mit H ′ (x) = f (x) für alle x ∈ [a, b],
so gilt
Z b
f (t) dt = H(b) − H(a).
a
Rx
Beweis. Nach Satz 8.4.6 ist die Funktion F(x) = a f (t) dt ebenfalls eine Stamm-
funktion von f auf [a, b]. Somit unterscheiden sich H und F nur um eine Konstante,
F ≡ H +c auf [a, b] (vgl. Bemerkung 7.4.2). Wegen 0 = F(a) = H(a) +c ist H(a) = −c,
und somit Z b
f (t) dt = F(b) = H(b) + c = H(b) − H(a).
a
❑
8.4.9 Beispiel. Wir wollen das Integral der Funktion ln x über das Intervall [1, 3] be-
rechnen. Eine Stammfunktion von ln x auf (0, +∞) ist x(ln(x) − 1). Also folgt mit der
Konvention, dass g(x)|ba = g(b) − g(a),
Z 3
ln t dt = x(ln(x) − 1)|31 = 3(ln 3 − 1) − (−1) = 3 ln 3 − 2.
1
Rπ x 2ix
8.4.10 Beispiel. Um 0 te2it dt zu berechnen, nehmen wir die Stammfunktion 2i e −
1 2ix
(2i)2
e von xe2ix und erhalten
Z π !π
2it x 2ix 1 2ix π
te dt = e − e = .
0 2i (2i)2 0 2i
8.4.11 Bemerkung. Aus dem Hauptsatz sieht man insbesondere, dass für eine überall
auf [a, b] stetige Funktion f die Funktion F eine stetig differenzierbare Funktion ist,
die noch dazu F(a) = 0 erfüllt.
Ist umgekehrt F(x) eine stetig differenzierbare Funktion auf [a, b] mit F(a) = 0, so
Rx
ist ihre Ableitung f stetig und wegen Satz 8.3.3 integrierbar. Die Funktion f (t) dt hat
a
nach dem Hauptsatz die selbe Ableitung wie F. Außerdem verschwinden sie beide bei
Rx
a, und daher F(x) = f (t) dt, x ∈ [a, b] (vgl. Korollar 8.4.8).
a
Also wird C[a, b] durch den Integraloperator bijektiv auf {F ∈ C1 [a, b] : F(a) = 0}
abgebildet. Man sieht auch leicht, dass diese beiden Mengen Vektorräume sind, und
dass dieser Integraloperator linear ist.
Rb
8.4.12 Korollar. Ist f : [a, b] → R stetig und f (x) ≥ 0, x ∈ [a, b], wobei a f (x) dx =
0, so verschwindet f identisch auf [a, b].
Rx
Beweis. Die Funktion F(x) = f (t) dt, x ∈ [a, b] ist in C1 [a, b], erfüllt
a
F(a) = F(b) = 0 und hat für x ∈ (a, b) die Ableitung F ′ (x) = f (x) ≥ 0. Also
ist F(x) monoton wachsend, und somit 0 = F(a) ≤ F(x) ≤ F(b) = 0.
❑
16 KAPITEL 8. DAS RIEMANNSCHE INTEGRAL
Folgender Satz wird ebenfalls Hauptsatz der Differential-Integralrechnung genannt. Dieser ist dem Satz 8.4.6 zwar
sehr ähnlich, aber auf den zweiten Blick unterscheiden sie sich doch durch die Voraussetzungen wesentlich.
8.4.13 Satz. Sei f : [a, b] → R Riemann-integrierbar über [a, b], sodass es eine stetige Funktion F : [a, b] → R gibt, die
auf (a, b) differenzierbar ist und die dort F ′ (x) = f (x) erfüllt. Dann gilt
Zb
f (x) dx = F(b) − F(a).
a
Beweis. Sei {ξ j : j = 0, . . . , n} eine Zerlegung von [a, b]. Dann existieren nach dem Mittelwertsatz der Differentialrechnung
Satz 7.2.5 Zwischenstellen αi , ξi−1 ≤ αi ≤ ξi , sodass
Somit ist R = (ξ j )n(R)
j=0
; (α j )n(R)
j=1
eine Riemann-Zerlegung von [a, b]. Es folgt
X
n
X
n
F(b) − F(a) = F(ξi ) − F(ξi−1 ) = (ξi − ξi−1 ) f (αi ) = S (R).
i=1 i=1
Rb
Für |R| → 0 strebt die rechte Seite gegen f (x)dx.
a
❑
Man beachte, dass Satz 8.4.13 nur auf reellwertige Funktionen anwendbar ist, da im Beweis der Mittelwertsatz der
Differentialrechnung verwendet wird, der ja nur für reellwertige Funktionen gilt.
8.4.14 Lemma (Substitutionsregel). Sei f reell- oder komplexwertig und stetig auf
[a, b], sei und g ∈ C1 [α, β] und stetig auf [α, β]. Ist nun g([α, β]) ⊆ [a, b], so gilt
Z g(β) Z β
f (x) dx = f (g(t))g′ (t)dt.
g(α) α
R
Beweis. Nach Lemma 7.4.3 ist ( f ) ◦ g eine Stammfunktion von f (g(t))g′ (t). Aus
Korollar 8.4.8 folgt daher die behauptete Gleichheit.
❑
Genauso beweist man folgendes Lemma.
Zb Zb
′
f g dx = f (b)g(b) − f (a)g(a) − f g′ dx.
a a
8.5.1 Satz. Sind f, g reellwertig und über [a, b] Riemann-integrierbar, so sind es auch | f |, f 2 , f g und
Z Z
b b
f dx ≤ | f |dx.
a a
Beweis. Sei ǫ > 0 gegeben. Nach Satz 8.2.5 existiert eine Zerlegung
Z = {ξi : i = 0, . . . , n(Z)} von [a, b], sodass
O( f, Z) − U( f, Z) < ǫ.
Setze für i = 0, . . . , n(Z)
Mi = sup f (x), mi = inf f (x),
x∈[ξi−1 ,ξi ] x∈[ξi−1 ,ξi ]
Für x, y ∈ [ξi−1 , ξi ] folgt | f (x)| − | f (y)| ≤ | f (x) − f (y)| ≤ Mi − mi , und mit Hilfe von Lemma 2.7.10
Mi∗ − m∗i = sup | f (x)| + sup (−| f (x)|) = sup (| f (x)| − | f (y)|) ≤ Mi − mi .
x∈[ξi−1 ,ξi ] x∈[ξi−1 ,ξi ] x,y∈[ξi−1 ,ξi ]
Es folgt
X
n(Z)
O(| f |, Z) − U(| f |, Z) = (Mi∗ − m∗i )(ξi − ξi−1 ) ≤
i=1
X
n(Z)
≤ (Mi − mi )(ξi − ξi−1 ) = O( f, Z) − U( f, Z) < ǫ.
i=1
und nach (8.3) ist | f | integrierbar. Die behauptete Ungleichung folgt aus Lemma 8.2.9, (ii).
Ist Z wie oben, so folgt aus der Tatsache, dass x 7→ x2 monton wachsend auf R + ∪{0} ist,
X
n(Z)
≤ 2k f k∞ (Mi∗ − m∗i )(ξi − ξi−1 ) = 2k f k∞ O(| f |, Z) − U(| f |, Z) < 2k f k∞ · ǫ
i=1
wie oben, dass auch f 2 integrierbar ist. Die Behauptung für f g folgt aus der Beziehung
1
fg = ( f + g)2 − f 2 − g2 .
2
❑
8.5.2 Bemerkung. Sind die Funktionen in Satz 8.5.1 komplexwertig, so sind mit f, g auch Re f, Im f, Re g, Im g Riemannin-
tegrierbar. Da man | f |2 , Re f g, Im f g als Summe von Produkten von Re f, Im f, Re g, Im g darstellen kann, sind auch | f |2 , f g
Riemann-integrierbar. p
Man zeigt auch ähnlich wie im Beweis von Satz 8.5.1, dass mit | f |2 auch | f |2 = | f | Riemann-integrierbar ist.
Hat die Funktion f : [a, b) → R (C) nicht die Eigenschaft, dass sie sich auf [a, b]
zu einer Riemann-integrierbaren Funktion
R x fortsetzen lässt, so kann man immer noch
versuchen, für x ∈ [a, b) das Integral a f (t) dt zu berechnen, und dann x gegen b
streben zu lassen.
18 KAPITEL 8. DAS RIEMANNSCHE INTEGRAL
8.6.1 Definition. Sei f : [a, b) → R (C), wobei a < b ≤ +∞, und sei f |[a,x] für alle
x ∈ [a, b) Riemann-integrierbar. Dann heißt f uneigentlich integrierbar, falls
Z b Z β
f (t) dt := lim f (t)dt
a β→b− a
(ii) Mit der Regel von de l’Hospital erhält man für ein b > 0
Z b Z b
ln t dt = lim ln t dt = b(ln(b) − 1) − lim α(ln(α) − 1) = b(ln(b) − 1).
0 α→0+ α α→0+
X
[β]−1 Z n+1 Z β
| sin πt| sin πt
(−1)n dt + dt.
n=1 n t [β] t
R n+1
Man erkennt unschwer, dass n | sint πt| dt monoton gegen Null für n → ∞ kon-
vergiert. Mit Hilfe des Leibnizschen Kriteriums und wegen
Z β Z [β]+1
sin πt 1 2 β→+∞
dt ≤ | sin πt| dt = −→ 0,
[β] t [β] [β] π[β]
sieht man nun, dass unser Integral konvergiert, falls β → +∞.
Rβ
Das Integral ist aber nicht absolut konvergent in dem Sinne, dass auch 1 sint πt dt
existiert, da
Z β X Z n+1 | sin πt|
[β]−1 Z 1 X 1
[β]−1
sin t dt ≥ dt = | sin πt| dt ·
t n+1 n+1
1 n=1 n 0 n=1
für β → +∞ divergiert.
8.6. UNEIGENTLICHE INTEGRALE 19
Das wohl am meisten verwendete und ähnlich wie bei den Folgen zu beweisende
Kriterium für die absolute Konvergenz ist das folgende Resultat.
8.6.3 Lemma. Seien f, g : [a, b) → R (C), wobei a < b ≤ +∞, und sei f |[a,x] und g|[a,x]
sowie der Betrag dieser Funktionen für alle x ∈ [a, b) Riemann-integrierbar.
Rb
Ist a g(x) dx absolut konvergent, so ist es auch konvergent. Ist obendrein |g(x)| ≥
Rb
| f (x)| für alle x ab einem c ∈ [a, b), so ist auch a f (x) dx absolut konvergent.
Beweis. Wegen den Ungleichungen
Z x Z x Z x2 Z x2
2 2
a
g(t) dt bzw. a | f (t)| dt . Nun folgt die behauptete Konvergenz aus Lemma
x≥a x≥a
8.3.2.
❑
8.6.4 Bemerkung. Man kann Lemma 8.6.3 anwenden, um aus der Divergenz eines
Rb Rb
uneigentlichen Integrales a | f (x)| dx auf die Divergenz von a |g(x)| dx zu schließen,
wenn |g(x)| ≥ | f (x)| für alle x ∈ (a, b).
8.6.5 Beispiel. Man betrachte das uneigentliche Integral
Z +∞ Z 1 Z β
x ln x x ln x x ln x
2 + 1)3
dx := lim 2 + 1)3
dx + lim 2 + 1)3
dx.
0 (x α→0+ α (x β→+∞ 1 (x
Da die Funktion h(x) := x ln x nur für x ∈ (0, +∞) definiert ist, ist dieses Integral
uneigentlich an beiden Integrationsgrenzen. Die Funktion h(x) lässt sich aber stetig auf
[0, +∞) durch h(x) = 0 stetig fortsetzen. Somit bleibt nur die Uneigentlichkeit bei der
Stelle +∞ (vgl. (8.11)).
Für x ≥ 1 ist der Integrand nicht negativ. Daher ergeben dort sich folgende
Abschätzungen:
x ln x = x ln x ≤ x2
≤
x2 1
(x2 + 1)3 (x2 + 1)3 (x2 + 1)3 (x2 )3 = x4 .
Wegen Z
1 ∞
1 ∞ 1
4
dx = − 3 =
1 x 3x 0 3
folgt aus Lemma 8.6.3 die absolute Konvergenz unseres Integrals.
8.6.6 Beispiel. Man betrachte das uneigentliche Integral
Z 1
ln x
2x x
dx.
0 e −e
− ln x 1 1
≥ 1(0,1/e] (x) · ≥ 0, x ∈ (0, 1].
e2x − e x e ex − 1
Dabei ist 1(0,1/e] die Charakteristische Funktion des Intervalls (0, 1/e]. Für alle ǫ ∈
(0, 1/e) erhalten wir mit der Monotonie des Integrals
Z Z 1/e Z
ln x dx ≥ 1
1
1 1 1/e e−x
Iǫ := e2x − e x dx = dx .
ǫ e ǫ ex − 1 e ǫ 1 − e−x
Nun steht im Zähler die Ableitung des Nenners, d. h. eine Stammfunktion des Integran-
den ist ln(1 − e−x ). (Wegen x > 0 ist das Argument des Logarithmus positiv.) Daraus
ergibt sich
1 1/e 1 1 − e−1/e
Iǫ ≥ ln(1 − e−x ) = ln .
e ǫ e 1 − e−ǫ
Für ǫ → 0+ wird die rechte Seite jedoch beliebig groß, d. h. das uneigentliche Integral
Z
ln x dx
1
e2x − e x
0
8.7.1 Lemma. Seien (I, I ) und (J, J ) zwei gerichtete Mengen, und sei hY, di ein
vollständiger metrischer Raum.
Weiters seien H : I × J → Y und h : I → Y Funktionen, sodass für alle j ∈ J die
Funktion i 7→ H(i, j) beschränkt ist, und sodass
bzw. äquivalent dazu h = lim j∈J H(., j) in hB(I, Y), d∞i. Schließlich existiere für alle
j ∈ J der Limes A j := limi∈I H(i, j).
Unter diesen Voraussetzungen ist auch (h(i))i∈I konvergent, wobei
Beweis. Sei ǫ > 0 gegeben. Wegen der gleichmäßigen Konvergenz von H(i, j) j∈J ist
H(., j) j∈J in B(I, Y) ein Cauchy-Netz. Es existiert also ein j0 ∈ J, sodass für j, k j0
und alle i ∈ I gilt
dY (H(i, j), H(i, k)) ≤ ǫ.
Hält man j und k fest, so folgt dY (A j , Ak ) = limi∈I dY (H(i, j), H(i, k)) ≤ ǫ. Damit ist
(A j ) j∈J ein Cauchy-Netz, und wegen Lemma 8.3.2 konvergent. Setzen wir lim j∈J A j =:
A, so gilt
dY (h(i), A) ≤ dY (h(i), H(i, j)) + dY (H(i, j), A j) + dY (A j , A).
Wähle j nach der vorausgesetzten gleichmäßigen Konvergenz so, dass für alle i ∈ I gilt
dY (h(i), H(i, j)) < ǫ und so, dass dY (A j , A) < ǫ. Für dieses j existiert ein i0 ∈ I, sodass
aus i i0 , die Ungleichung dY (H(i, j), A j) < ǫ folgt. Insgesamt erhalten wir
❑
Aus diesem Lemma folgen nun eine Reihe von wichtigen Ergebnissen.
8.7.2 Satz. Sei ( fn )n∈N eine Folge von Riemann-integrierbaren Funktionen auf [a, b],
fn , n ∈ N. Gilt limn→∞ fn = f gleichmäßig auf [a, b], so ist auch f Riemann-
integrierbar, wobei
Zb Zb
lim fn dx = f dx.
n→∞
a a
Beweis. Um das letzte Lemma anwenden zu können, sei I = R die Menge aller
Riemann-Zerlegungen von [a, b] versehen mit der durch die Feinheit induzierte Ord-
nung und (J, J ) = (N, ≤). Weiters sei Y = R (C), versehen mit der Euklidischen
Metrik, je nachdem, wohin die Funktionen abbilden.
Wir setzen H(R, n) := S ( fn , R), h(R) = S ( f, R). Wegen Lemma 8.2.9, (ii), gilt
und daher konvergiert H(., n) gleichmäßig gegen h. Nach Lemma 8.7.1 folgt
Zb
lim fn dx = lim lim S ( fn , R)
n→∞ n→∞ |R|→0
a
Zb
= lim lim S ( fn , R) = lim S ( f, R) = f dx,
|R|→0 n→∞ |R|→0
a
wobei limn→∞ S ( fn , R) = S ( f, R) für ein festes R ∈ R leicht aus der Tatsache folgt,
dass diese Riemann-Summen endliche Summen sind.
Der Beweis für Netze verläuft fast identisch.
❑
22 KAPITEL 8. DAS RIEMANNSCHE INTEGRAL
P
8.7.3 Beispiel. Sei ∞ n
n=0 an x eine Potenzreihe mit positivem Konvergenzradius R.
Dann gilt für [a, b] ⊆ {x : |x| < R}
Zb X ∞
X
∞ Z b X∞
n an n+1 b
an x dx = an xn dx = x | x=a
n=0 n=0 a n=0
n+1
a
anschreiben.
Mit Hilfe des Hauptsatzes können wir auch Differentiation und Limes vertauschen
(siehe auch Satz 7.2.19).
8.7.4 Korollar. Sei ( fn )n∈N eine Folge von reell- bzw. komplexwertigen Funktionen, aus
C1 [a, b].
Es existiere ein Punkt x0 ∈ [a, b], sodass ( fn (x0 ))n∈N konvergiert. Ist dann die Folge
( fn′ )n∈N gleichmäßig konvergent auf [a, b], so ist auch die Folge ( fn )n∈N gleichmäßig
konvergent auf [a, b], und es gilt
d d
lim fn (x) = lim fn (x), x ∈ [a, b].
dx n→∞ n→∞ dx
womit ( fn )n∈N zumindest punktweise gegen f (x) konvergiert. Nach Satz 8.4.6 ist die
linke Seite ableitbar, und daher gilt f ′ (x) = g(x) = limn→∞ fn′ (x), x ∈ [a, b].
Die Gleichmäßigkeit der Konvergenz folgt aus
Z x
sup | fn (x) − f (x)| = sup ( fn (x) − g(t)) dt + fn (x0 ) − A ≤
′
x∈[a,b] x∈[a,b] x0
n→∞
(b − a) · k fn′ − gk∞ + | fn (x0 ) − A| −→ 0. (8.14)
❑
Wir können das nun auf Taylorreihen anwenden.
P
8.7.5 Proposition. Sei ∞ a zn eine Potenzreihe mit Konvergenzradius R > 0. Dann
P∞ n=0 n
hat die Potenzreihe n=0 (n + 1)an+1 zn hat denselben Konvergenzradius R.
8.7. VERTAUSCHUNG VON INTEGRALEN MIT GRENZWERTEN 23
Die Funktion
X
∞
f : (−R, R) → C, f (t) = an t n
n=0
ist auf (−R, R) differenzierbar und hat die Ableitung
X
∞
f ′ (x) = (n + 1)an+1 xn .
n=0
Als Vorspiel zum nächsten Ergebnis wollen wir uns kurz mit dem Produkt zweier
metrischer Räume beschäftigen.
8.7.7 Fakta.
1. Seien (X, dX ) und (Y, dY ) zwei metrische Räume. Ist X × Y die Menge aller ge-
ordneten Paare, und definiert man
d (a, b), (x, y) := max(dX (a, x), dY (b, y)), (8.16)
so sieht man unmittelbar, dass (X × Y, d) ein metrischer Raum ist, und dass
(xn , yn ) → (x, y) genau dann, wenn xn → x und yn → y.
24 KAPITEL 8. DAS RIEMANNSCHE INTEGRAL
3. Die offene Kugel Uǫ (a, b) um ein (a, b) ∈ X × Y ist nichts anderes als
Uǫ (a) × Uǫ (b), da d (a, b), (x, y) = max(dX (a, x), dY (b, y)) < ǫ ⇔ dX (a, x) <
ǫ ∧ dY (b, y) < ǫ.
5. Die Definition von d∞ auf R p passt genau in dieses Bild, denn haben wir p1 +
p2 = p, und sind sowohl R p1 als auch R p2 versehen mit d∞ , und versieht man
R p = R p1 × R p2 mit der Metrik aus (8.16), so erhält man genau wieder d∞ .
8.7.8 Korollar. Ist f : [a, b] × K → R (C) stetig, wobei K eine kompakte Teilmenge
eines metrischen Raumes (Y, dY ) ist, so ist auch die Funktion (Parameterintegral) R :
K → R (C), wobei Z b
R(t) = f (s, t) ds,
a
stetig.
Beweis. Zunächst ist [a, b] × K eine kompakte Teilmenge von R × Y. Somit ist die
Funktion f sogar gleichmäßig stetig (vgl. Satz 6.3.3). Zu gegebenen ǫ > 0 gibt es
somit ein δ > 0, sodass
d (s, t), (s′ , t′ ) < δ ⇒ | f (s, t) − f (s′ , t′ )| < ǫ.
Insbesondere dY (t, t′ ) < δ ⇒ | f (s, t) − f (s, t′ )| < ǫ und somit d∞ ( f (., t) − f (., t′ )) ≤ ǫ.
Somit folgt für t0 ∈ K, dass f (., t) → f (., t0 ) gleichmäßig, wenn t → t0 . Wegen Satz
8.7.2 gilt daher für das Netz ( f (s, t))t∈K\{t0 } von Funktionen auf [a, b], geordnet durch
t1 t2 ⇔ dY (t0 , t1 ) ≥ dY (t0 , t2 ),
Z b Z b Z b
lim R(t) = lim f (s, t) ds = lim f (s, t) ds = f (s, t0 ) ds = R(t0 ).
t→t0 t→t0 a a t→t0 a
8.7.9 Satz (Satz von Fubini). Ist f : [a, b] × [c, d] → R (C) stetig, so gilt
Z b Z d ! Z d Z b !
f (s, t)dt ds = f (s, t)ds dt.
a c c a
Beweis. Die Existenz der inneren und der äußeren Integrale wird durch Korollar 8.7.8
gewährleistet.
Sei I = R die Menge aller Riemann-Zerlegungen von [a, b] und sei J = P
die Menge aller Riemann-Zerlegungen von [c, d] beide gerichtet mit der durch die
8.7. VERTAUSCHUNG VON INTEGRALEN MIT GRENZWERTEN 25
n(R)
Feinheit induzierten Ordnung. Wir definieren für R = (ξ j )n(R)
j=0 ; (α j ) j=1 und P =
(η j )n(P) n(P)
j=0 ; (β j ) j=1
n(R) X
X n(P)
H(R, P) := (ξ j − ξ j−1 )(ηk − ηk−1 ) f (α j , βk ), (8.17)
j=1 k=1
wobei f1 die Funktion f mit festgehaltener zweiter Variablen ist, und S ( f1 , R) als
Funktion eben dieser Variable aus [c, d] betrachtet wird. Entsprechend gilt H(R, P) =
S (S ( f2 , P), R).
Wegen (8.10) gilt
Da unsere Funktion f gleichmäßig stetig ist, gibt es zu gegebenen ǫ > 0 ein δ > 0,
sodass k f (., t) − f (., t′ )k∞ ≤ ǫ. Aus (8.18) folgt dann
Z d
S ( lim S ( f2 , P), R) = S ( f (., t) dt, R).
|P|→0 c
Daraus folgt
Z d Z b Z d !
lim lim H(R, P) = lim S ( f (., t) dt, R) = f (s, t)dt ds.
|R|→0 |P|→0 |R|→0 c a c
Wegen der gleichmäßigen Konvergenz können wir nun Lemma 8.7.1 anwenden und
erhalten
lim lim H(R, P) = lim lim H(R, P),
|R|→0 |P|→0 |P|→0 |R|→0
R d R b
wobei letzterer Doppellimes aus Symmetriegründen c a
f (s, t)ds dt ist.
❑
9 Das ist der vollständig metrische Raum aller auf I beschränkten C-wertigen Funktionen versehen mit
8.7.10 Bemerkung. Ist eine stetige reell- oder komplexwertige Funktion auf einem
Q
Quader pj=1 [a j , b j ] = [a1 , b1 ] × · · · × [a p , b p ] ⊆ R p definiert, so ist wegen Korollar
R bp Q p−1
8.7.8 (t j ) p−1
j=1 7→ a p f (t1 , . . . , t p−1 , s) ds stetig auf j=1 [a j , b j ] ⊆ R
p−1
.
Nun kann man nach der vorletzten Variablen integrieren, dann nach der vorvorletz-
ten, usw. . Schließlich erhält man.
Z b1 Z bp
... f (t1 , . . . , t p ) dt p . . . dt1 . (8.19)
a1 ap
Wendet man Satz 8.7.9 mehrere male an, so sieht man, dass es hier nicht auf die Inte-
grationsreihenfolge ankommt.
Man kann das als Ausgangspunkt für die Integrationstheorie für Funktionen, die auf
Q
einem Rechteck oder allgemeiner über einem Quader Q = pj=1 [a j , b j ] ⊆ R p definiert
sind, nehmen, indem man Z
f (t)dt
Q
als (8.19) definiert. Dieser Ausdruck hängt zumindest für stetige f nicht von der Inte-
grationsreihenfolge ab, ist also in einem gewissen Sinne sinnvoll definiert.
Größere Probleme tauchen auf, wenn man etwa das Integral einer stetigen Funk-
tion über einen Kreis definieren will. Solche Integrale werden wir in der Analysis 3
Vorlesung behandeln.
Als Folgerung erhält man unmittelbar eine Aussage über die Differenzierbarkeit
von Parameterintegralen.
8.7.11 Korollar. Sei f : [a, b] × [c, d] → R(C) stetig und so, dass die Ableitung nach
der ersten Variablen für alle (s, t) ∈ [a, b] × [c, d] existiert, und dass
d
f (s, t)10 ,
f1 (s, t) =
ds
Rd
ebenfalls stetig ist. Dann ist die Funktion s 7→ c f (s, t) dt für s ∈ [a, b] stetig differen-
zierbar mit der Ableitung
Z d Z d
d
f (s, t) dt = f1 (s, t) dt. (8.20)
ds c c
Differenziert man diese Gleichung nach der Variablen x, so erhält man (8.20). Dass
(8.20) stetig von s ∈ [a, b] abhängt, folgt aus Korollar 8.7.8.
❑
8.7.12 Beispiel. Als Anwendung der Grenzwertvertauschungen wollen wir folgende
besonders in der Statistik und Wahrscheinlichkeitstheorie wichtige Tatsache zeigen:
Z +∞
2 √
e−t dt = π. (8.21)
−∞
10 Dafür ∂
werden wir später ∂s f (s, t) schreiben.
8.7. VERTAUSCHUNG VON INTEGRALEN MIT GRENZWERTEN 27
Außerdem gilt
Z 1
π 1 π
F(0) = − 2
dt = − arctan |10 = 0.
4 0 t +1 4
R x 2 2 2
Rx 2
Ist andererseits G(x) = 0 e−t dt , so gilt G′ (x) = 2e−x 0 e−t dt, und aus der Sub-
stitutionsregel folgt F ′ (x) = G′ (x). Wegen G(0) = 0 = F(0) folgt F(x) = G(x) und
zwar für alle x ≥ 0, da ja C > 0 beliebig war.
−x2 (t 2 +1) 2
Wegen e t2 +1 ≤ e−x konvergiert der Integrand in (8.22) für x → +∞ gleichmäßig
gegen die Nullfunktion, und mit Satz 8.7.2 erhält man
π
lim G(x) = lim F(x) = .
x→+∞ x→+∞ 4
Aus der Stetigkeit der Wurzelfunktion folgt
Z x √
2 π
lim e−t dt = ,
x→+∞ 0 2
und damit (8.21).
8.7.13 Beispiel. Wir betrachten die Funktion
Z +∞ Z 1 Z β
sin x −xt sin x −xt sin x −xt
F(t) = · e dx := lim · e dx + lim · e dx.
0 x γ→0+ γ x β→+∞ 1 x
Diese ist wohldefiniert für t ∈ [0, +∞), da obiges uneigentliches Integral für alle t ≥ 0
konvergiert, wobei es aber nur für t > 0 absolut konvergiert.
Man beachte dabei auch, dass 0 nicht wirklich eine Uneigentlichkeitsstelle obigen
Integrales ist, da sich die Funktion g(x) := sinx x , x ∈ (0, +∞) stetig auf [0, +∞) durch
g(0) := 1 = lim x→0+ sinx x fortsetzen lässt. Also gilt nach dem Hauptsatz der Differential-
und Integralrechnung
Z 1 Z 1
sin x −xt
lim · e dx = g(x) · e−xt dx.
δ→0+ δ x 0
Nun wollen wir F ′ (t) für t > 0 berechnen. Dazu halten wir wieder δ > 0 fest und
betrachten t ∈ [δ, +∞). Wir wissen schon, dass Fα → F und zwar gleichmäßig auf
dieser Menge. Betrachten wir nun für ein festes α > 1 die das Integral
Z α
sin x −xt
Fα (t) = · e dx,
1
α
x
so ist der Integrand stetig in (x, t) ∈ [ α1 , α] × [δ, +∞), und auch die Ableitung
∂ sin x −xt
· e = − sin x · e−xt
∂t x
des Integranden nach t (∈ [δ, +∞)) ist stetig in (x, t) ∈ [ α1 , α] × [δ, +∞). Also gilt nach
Korollar 8.7.11 Z α
Fα′ (t) = − sin x · e−xt dx.
1
α
Z 1 Z +∞ 1
α 1 − e− α + e−α
( + ) e−δx dx =
0 α δ
konvergiert Fα′ (t) für α → +∞ unabhängig von t, daher gleichmäßig in t ∈ [δ, +∞),
gegen
Z +∞
− sin x · e−xt dx.
0
Nach Korollar 8.7.4 ist daher das genau die Ableitung von F(t). Wegen (Stammfunkti-
on in x)
Z
1
− sin x · e−xt = (t sin x + cos x)e−xt + c
1 + t2
Das erste Integral ist gemäß Korollar 8.7.8 stetig auf [0, 1]. Für das zweite stimmt nach
einer partiallen Integraltion überein mit
" #β Z β
1 t sin x + cos x −xt 1 t sin x + cos x −xt
lim − 2
e − lim e dx. (8.23)
β→+∞ x 1+t β→+∞ 1 x2 1 + t2
1
t sin 1 + cos 1 −t
e
1 + t2
x+cos x −xt
ist, und somit auch stetig auf [0, +∞) ist. Wegen t sin1+t 2 e ≤ 1 gilt für t ≥ 0
Z +∞ Z β Z +∞
1 t sin x + cos x −xt 1 t sin x + cos x −xt 1
e dx − e dx ≤ dx.
1 x 2 1+t 2
1 x
2 1+t 2 β x2
von stetigen (siehe Korollar 8.7.6) Funktion in t ∈ [0, +∞) gleichmäßig gegen den
zweiten Grenzwert aus (8.23). Also ist auch dieser stetig (vgl. Korollar 6.6.11). Damit
haben wir die Stetigkeit von F(t) auf ganz [0, +∞) nachgewiesen.
Da aber F(t) = π2 − arctan t für t > 0 folgt für t → 0+ die Gleichung
Z +∞
sin x π
dx = F(0) = .
0 x 2
11 Man sin x
denke sich wieder x bei x = 0 zu eins fortgesetzt.
30 KAPITEL 8. DAS RIEMANNSCHE INTEGRAL
8.8 Mittelwertsätze
Folgende Tatsache liegt unmittelbar auf der Hand.
8.8.1 Satz (Mittelwertsatz der Integralrechnung). Sei f eine reelle und Riemann-
integrierbare Funktion auf [a, b]. Dann existiert ein µ ∈ [inf t∈[a,b] f (t), supt∈[a,b] f (t)]
mit
Zb
f (t) dt = µ(b − a). (8.24)
a
Beweis. Aus inf t∈[a,b] f (t) ≤ f (s) ≤ supt∈[a,b] f (t) folgt nach Lemma 8.2.9 durch Inte-
gration nach s
Zb
(b − a) · inf f (t) ≤ f (s) ds ≤ (b − a) · sup f (t),
t∈[a,b] t∈[a,b]
a
und damit unmittelbar (8.24). Für ein stetiges f ist nach dem Zwischenwertsatz
f (x) = µ für ein x ∈ [a, b].
❑
Dieser Beweis lässt sich leicht so umändern, dass man folgenden Satz erhält.
8.8.2 Satz (Erweiterter Mittelwertsatz der Integralrechnung). Seien f und g reelle und
Riemann-integrierbare Funktion auf [a, b], wobei g(t) ≥ 0, t ∈ [a, b]. Dann existiert
ein µ ∈ [inf t∈[a,b] f (t), supt∈[a,b] f (t)] mit
Zb Zb
f (t)g(t) dt = µ g(t) dt. (8.25)
a a
und integriere alle Funktionen nach s. Nach Lemma 8.2.9 erfüllen die Integrale die
selbe Ungleichungskette. Daraus folgt unmittelbar (8.25). Für ein stetiges f ist nach
dem Zwischenwertsatz f (x) = µ für ein x ∈ [a, b].
❑
Als eine Anwendung beweisen wir die Taylorsche Formel (vgl. Satz 7.3.6) mit
einem Restglied in Integralform. Dabei sind die Voraussetzungen etwas stärker.
8.8.3 Beispiel. Sei I ⊆ R ein Intervall mit den Randpunkten a, b, a < b, und sei
n ∈ N ∪ {0}. Weiters sei f : I → R mit f ∈ Cn+1 (I).
Seien x, y ∈ I, x , y. Dann gilt
Zx
(x − t)n
+ f (n+1) (t) dt.
n!
y
Zx
′ (x − y)2
′′ (x − t)2
= f (y)(x − y) + f (y) + f ′′′ (t) dt =
2 2
y
X
n Zx
(x − y)k (x − t)n
= ··· = f (k) (y) + f (n+1) (t) dt.
k=1
k! n!
y
n+1
Mit dem Satz 8.8.2 folgt, dass sich das Restglied in der Form f (n+1) (ξ) (x−y)
(n+1)! für ein
geeignetes ξ ∈ [min(x, y), max(x, y)] schreiben lässt (vgl. Satz 7.3.6).
32 KAPITEL 8. DAS RIEMANNSCHE INTEGRAL
Kapitel 9
33
34 KAPITEL 9. NORMEN, BANACHRÄUME UND FOURIERREIHEN
Zu ǫ > 0 mit oBdA. ǫ < 1 gibt es ein N ∈ N, sodass |λ − λn |, kxn − xk < ǫ für alle
n ≥ N. Es folgt kxn k ≤ kxn − xk + kxk < 1 + kxk und damit
kλn xn − λxk ≤ kλn xn − λxn k + kλxn − λxk = |λn − λ|kxn k + |λ|kxn − xk ≤ (1 + kxk + |λ|)ǫ.
9.1.3 Korollar. Sei (X, k · k) ein normierter und (Y, d) ein metrischer Raum, und seien
f, g : D → X und λ : D → R (C) stetig, wobei D ⊆ Y. Dann sind auch λ f und f + g
stetige Funktionen von D nach X.
Beweis. Aus yn → y in (Y, d) folgt wegen der Stetigkeit f (yn ) → f (y) und g(yn ) → g(y)
in (X, k·k). Aus Lemma 9.1.2 folgt ( f +g)(yn ) = f (yn ) +g(yn) → f (y) +g(y) = ( f +g)(y)
und mit Proposition 6.1.4 die Stetigkeit von f + g. Entsprechend zeigt man die Stetig-
keit von λ f .
❑
9.1.4 Definition. Ist die von (X, k·k) erzeugte Metrik vollständig, so heißt der normierte
Raum Banachraum.
9.1.5 Beispiel.
(i) Klarerweise ist (R, |.|) ein Banachraum über R. (C, |.|) ist auch ein Banachraum,
wobei man ihn als Vektorraum über C und als Vektorraum über R betrachten
kann.
p
qP Paradebeispiel eines normierten Raumes über R ist (R , k.k2 ), wobei kxk2 :=
(ii) Das
p 2 1 T
j=1 |x j | . Dabei ist x = (x1 , . . . , x p ) . Die erzeugte Metrik ist die wohlbe-
kannte Euklidische Metrik:
v
u
tX p
d2 (x, y) = kx − yk2 = |x j − y j |2 .
j=1
qP
p
(iii) Man kann auch den normierten Raum (C p , k.k2 ) über C mit kzk2 := j=1 |z j |
2
9.1.6 Bemerkung. Wir wissen schon aus dem ersten Semester, dass R p versehen mit
einer der Metriken d1 , d2 , d∞ vollständig ist. Somit sind obige Beispiele Banachräume.
Außerdem haben wir gesehen, dass die Konvergenz einer Folge in R p (bzgl. einer dieser
Metriken) äquivalent zur komponentenweisen Konvergenz ist:
xk → x ⇔ xk, j → x j , j = 1, . . . , p. (9.2)
Eine Konsequenz daraus ist, dass eine Funktion f : D → R p , wobei D Teilmenge eines
metrischen Raumes (X, d) ist, genau dann stetig ist, wenn alle Komponentenfunktionen
f j : D → R, j = 1, . . . , p stetig sind. Dabei ist
f1 (x)
f (x) = ... .
f p (x)
Diese Tatsache kann man auch etwas struktureller betrachten. Bezeichne mit π j , j =
1, . . . , p, die j-te Projektion
Rp → R
x1
πj :
x = .. 7→ x .
. j
xp
Aus (9.2) folgert man leicht, dass π j stetig ist. Das haben wir aber auch schon in Bei-
spiel 6.1.2
Mit obiger Notation gilt f j = π j ◦ f , und f ist genau dann stetig, wenn alle π j ◦ f
es sind.
9.1.7 Bemerkung. Für eine Funktionen g : D → X, wobei (X, d) ein metrischer Raum
und D ⊆ R p ist, ist wegen (9.2) die Stetigkeit g nicht abhängig von der auf R p gewähl-
ten Metrik d1 , d2 oder d∞ .
Setzen wir nun voraus, dass g stetig ist. Sei [a, b] ein reelles Intervall, x2 , . . . , x p
fest in R, sodass (t, x2 , . . . , x p )T ∈ D für t ∈ [a, b]. Dann ist auch Funktion h : t 7→
g(t, x2 , . . . , x p )T als Funktion [a, b] → X stetig.
Die gleiche Aussage gilt natürlich, wenn man nicht x1 , sondern eine der Variablen
x2 , x3 , . . . , x p durch t ersetzt.
Diese Tatsache lässt sich auch struktureller betrachten. Mit ιk , k = 1, . . . , p bezeich-
nen wir die Einbettung
(
R → Rp
ιk : .
x 7→ (a1 , . . . , ak−1 , x, ak+1 , . . . , a p )T
Man sieht unmittelbar, dass die ιk ’s alle stetige Funktionen sind. Mit obiger Notation
ist nun h(t) = g(ι1 (t)), falls wir a2 = x2 , . . . , a p = x p setzen. Also sieht man wieder,
dass h stetig ist.
Man könnte nun glauben, dass auch die Umkehrung gilt. Dem ist aber nicht so:
g ◦ ιk stetig für k = 1, . . . , n und alle (a1 , . . . , an )T ∈ D ; g stetig (vgl. Beispiel
9.1.8 oder Beispiel 9.1.9).
36 KAPITEL 9. NORMEN, BANACHRÄUME UND FOURIERREIHEN
x
1
f (x) → 2 sin 2ϕ
ϕ x
f (x) → 0
f (x) → 0
x
eine Gerade, z.B. die x-Achse, verdrehe sie und führe sie dabei auf und ab. Die Höhe
in Abhängigkeit des Drehwinkels ϕ ist dann gerade gegeben durch 12 sin 2ϕ.
d.h. f ist nicht einmal beschränkt in einer Umgebung von 0. Man bemerke, dass die
Beziehung r = sin ϑ gerade die Gleichung eines Kreises ist der die x-Achse bei 0
berührt. Nähert man sich in diesem Beispiel also radial an 0 an, so strebt f stets gegen
0. Kommt man jedoch längs der Kreislinie r = sin ϑ, so gilt sogar f (x) → +∞.
x r = sin ϑ
f (x) → 0 x
f (x) → +∞
f (x) → 0
Ehe wir uns mehr Beispiele normierter bzw. Banachräume anschauen, brauchen
wir ein kleines Lemma.
9.1.10 Lemma. Ist (X, d) ein vollständiger metrischer Raum und ist Y eine abgeschlos-
sene Teilmenge von X, so ist (Y, d|Y×Y ) auch ein vollständiger metrischer Raum.
Ist umgekehrt (Y, d|Y×Y ) vollständig, wobei Y Teilmenge eines metrischen Raumes
(X, d) ist, so ist Y abgeschlossen in X.
Beweis. Klarerweise ist Y versehen mit der eingeschränkten Metrik selber ein metri-
scher Raum.
Ist (xn )n∈N eine Cauchyfolge in Y, so konvergiert diese nach Voraussetzung gegen
ein x ∈ X. Ist nun Y abgeschlossen und enthält daher alle seine Häufungspunkte, so
folgt x ∈ Y.
Ist (xn )n∈N eine Folge in Y, die gegen ein x ∈ X konvergiert, so ist diese sicherlich
eine Cauchy-Folge bzgl. d und somit auch bzgl. d|Y×Y . Ist Y vollständig, so konvergiert
(xn ) bzgl. d|Y×Y und somit auch bzgl. d gegen ein y ∈ Y. Da aber Grenzwerte eindeutig
sind, folgt x = y ∈ Y. Also ist Y abgeschlossen.
❑
Folgende Situation tritt bei der Betrachtung konkreter Räume auf. Ist (X, k · k) ein
normierter Raum und Y ein linearer Unterraum (Untervektorraum), so kann man k.k
auf Y einschränken und erhält wieder einen Normierten Raum.
Ist (X, k · k) ein Banachraum und ist Y als Teilmenge von X abgeschlossen, so muss
nach Lemma 9.1.10 auch (Y, k · k) ein Banachraum sein.
9.1.11 Lemma. Ist (X, k · k) ein normierter Raum und Y ein linearer Unterraum, so ist
der Abschluss c(Y) von Y in X ebenfalls ein linearer Unterraum und somit der kleinste
abgeschlossene Teilraum von X, der Y enthält.
(i) Ist E eine nichtleere Menge und (Y, k.kY ) ein normierter Raum. Wir betrachten den
Raum B(E, Y) aller beschränkten Abbildungen von E nach Y. Diesen Raum ha-
ben wir schon im ersten Semester betrachtet (vgl. Definition 6.6.3), wobei aber Y
allgemeiner ein metrischer Raum war. In unserem Fall ist mit Y auch B(E, Y) ein
Vektorraum über dem selben Skalarkörper, wie Y, wobei die Operationen punkt-
weise definiert sind.
Setzen wir für f ∈ B(E, Y)
so prüft man leicht nach, dass k f k∞ eine Norm auf B(E, Y) ist. Die von dieser
Norm erzeugte Metrik ist genau die in Definition 6.6.3 eingeführte Metrik
Im Falle, dass (Y, k.kY ) ein Banachraum ist, folgt aus Satz 6.6.15, dass
(B(E, Y), d∞) vollständig und damit (B(E, Y), k.k∞) auch ein Banachraum ist.
(ii) Ist E = N und Y = R oder Y = C, so ist B(E, Y) die Menge aller beschränkten
reellen bzw. komplexen Folgen und wird auch als l∞ = l∞ (N) bezeichnet. Diese
sind Banachräume, da R und C vollständig sind.
(iii) Vom Teilraum c0 von l∞ , der aus allen Nullfolgen besteht, kann man leicht zeigen
(Lemma 8.7.1), dass er abgeschlossen ist. Also ist auch (c0 , k.k∞ ). ein Banach-
raum.
(iv) Mit der Notation aus (i) setzen wir noch zusätzlich voraus, dass E ⊆ X, wobei
(X, d) ein metrischer Raum ist, und dass (Y, k.kY ) ein Banachraum ist.
Dann kann man die Menge C(E, Y) aller f ∈ B(E, Y) betrachten, die stetig sind.
Diese Menge stellt einen linearen Unterraum von B(E, Y) dar (siehe Korollar
9.1.3). Somit ist auch (C(E, Y), d∞) ein normierter Raum.
Ist nun ( fn )n∈N eine Folge von Funktionen aus C(E, Y), die bzgl. d∞ gegen ein
f ∈ B(E, Y) konvergiert, so wissen wir aus Korollar 6.6.13, dass auch f stetig
ist, also f ∈ C(E, Y). Somit ist C(E, Y) sogar eine abgeschlossene Teilmenge von
B(E, Y).
Daher ist neben B(E, Y) auch C(E, Y) ein Banachraum, wenn nur (Y, k.kY ) ein
solcher ist.
(v) Ist Y = R oder Y = C, so schreiben wir für den Banachraum C(E, Y) auch C(E).
Ist E etwa [a, b] ⊆ R, so schreiben wir C[a, b].
Auf dem Raum C[a, b] können wir auch andere Normen betrachten. Beispiels-
weise
Z b
k f k1 := | f (t)| dt. (9.3)
a
Diese Norm unterscheidet sich von k.k∞ wesentlich, denn es gibt bzgl. k.k1
Cauchyfolgen, die bezgl. k.k∞ keine sind. Daraus kann man herleiten, dass
bezüglich k.k1 C[a, b] kein Banachraum ist.
9.2. LINEARE ABBILDUNGEN 39
(vi) Sind (X, k.kX ) und (Y, k.kY ) zwei normierte Räume über dem selben Körper R oder
C, so auch (X × Y, k.kmax ), wobei
In der Tat ist X × Y ein Vektorraum, und die Axiome, die für eine Norm erfüllt
sein müssen, lassen sich auch ganz leicht nachweisen.
Die Konstruktion ist analog der von R2 mit k.k∞ . Auch hier ist eine Folge
(xn , yn ) n∈N in X ×Y konvergent gegen (x, y) bzw. eine Cauchy-Folge genau dann,
wenn (xn )n∈N und (yn )n∈N gegen x und y konvergiert bzw. beide Cauchy-Folgen
sind.
Damit sieht man auch, dass (X × Y, k.kmax ) ein Banachraum ist, wenn X und Y es
sind.
(vii) Ist im vorigen Beispiel X = Y, so folgt aus Lemma 9.1.2, dass die Abbildung
+ : X × X → X stetig ist.
Betrachtet man die Definition der Konvergenz einer Folge, so sieht man, dass äqui-
valente Normen die gleichen konvergenten Folgen haben (die gleichen abgeschlosse-
nen und offenen Mengen, die gleichen Cauchy-Folgen, etc.).
9.2.2 Beispiel.
(i) Sei X = R p . Die Normen k.k∞ , k.k2 und k.k1 sind äquivalent, denn es gilt
((x1 , . . . , x p )T ∈ X = R p )
X
p
1
X
p
max |xi | ≤ ( |xi |2 ) 2 ≤ |xi | ≤ p · max |xi |.
i=1,...,p i=1,...,p
i=1 i=1
Man kann zeigen, dass auf R p alle Normen äquivalent sind. Insbesondere ist R p
mit jeder Norm vollständig.
(ii) Betrachte auf X = C([0, 1]) neben der Supremumsnorm k.k∞ noch die Norm aus
(9.3). Diese beiden Normen sind nicht äquivalent. Es gilt zwar k f k1 ≤ k f k∞ , aber
es gibt kein β > 0, sodass k f k∞ ≤ βk f k1 gleichzeitig für alle f ∈ C([0, 1]). Um
das einzusehen, betrachte
(
1 − n t , t ∈ [0, n1 ],
fn (t) = .
0 , t ∈ [ n1 , 1]
1
Dabei ist k fn k∞ = 1, aber k fn k1 ≤ 2n .
Thematisch verwandt mit der Äquivalenz von Normen ist der Begriff der Be-
schränktheit einer linearen Abbildung.
40 KAPITEL 9. NORMEN, BANACHRÄUME UND FOURIERREIHEN
9.2.3 Definition. Seien (X, k.kX ) und (Y, k.kY ) zwei normierte Räume, und sei A : X →
Y eine lineare Abbildung. Dann heißt A beschränkt , wenn es ein C ≥ 0 gibt, sodass
Ist A beschränkt, so sei kAk die kleinst mögliche aller dieser Konstanten C in (9.4), und
diese heißt Abbildungsnorm von A.
9.2.4 Bemerkung. Ist A beschränkt, so gibt es tatsächlich eine kleinste Konstante C ≥ 0,
sodass (9.4) gilt. In der Tat gilt (9.4) genau dann, wenn
kAxkY
C≥ , für alle x ∈ X \ {0},
kxkX
n o
also genau dann, wenn C obere Schranke von kAxk kxkX : x ∈ X \ {0} ist. Also ist kAk die
Y
x, y, x + y ∈ E ⇒ f (x + y) = f (x) + f (y).
In der Tat, mit einem solchen f sieht man leicht, dass die Abbildung A : X → Y
definiert durch A(x) := kxkX f ( kxk1 X x) eine beschränkte lineare Abbildung ist, sodass
A|E = f .
Die Menge L ⊆ C(E, Y) ist abgeschlossen, denn aus fn → f mit fn ∈ L und
f ∈ C(E, Y) folgt f (x + y) = lim fn (x + y) = lim fn (x) + lim fn (y) = f (x) + f (y), falls
x, y, x + y ∈ E und genauso f (λx) = λ f (x), falls x, λx ∈ E und somit f ∈ L. Wegen
Lemma 9.1.10 ist (L, k.k∞ ), und daher auch (L(X, Y), k.k), ein Banachraum.
❑
Ähnlich wie im vorhergehenden Beweis sieht man, dass für A ∈ L(X, Y) und B ∈
L(Y, Z)
kBAk = sup{kBAxkZ : x ∈ X, kxkX ≤ 1} ≤ (9.5)
sup{kBk · kAxkY : x ∈ X, kxkX ≤ 1} = kBk · kAk.
Für die Räume L(X, Y) gilt in Analogie zu Lemma 9.1.2 folgendes Lemma, welches
später hauptsächlich im Falle von endlichdimensionalen Räumen Anwendung findet.
9.2.7 Lemma. Seien X, Y, Z normierte Räume, und seien (An )n∈N , (Bn)n∈N , (xn )n∈N Fol-
gen in L(X, Y), L(Y, Z) bzw. X. Weiters seien A ∈ L(X, Y), B ∈ L(Y, Z) und x ∈ X. Gilt
An → A, Bn → B und xn → x für n → ∞, so folgt
wobei die erste Folge in L(X, Z) bzgl. der Abbildungsnorm und die zweite in Y bzgl.
der Norm auf Y konvergiert. Entsprechende Aussagen gelten auch für Netze.
Beweis. Wir zeigen die erste Grenzwerteigenschaft. Zu ǫ > 0 mit oBdA. ǫ < 1 gibt es
ein N ∈ N, sodass kAn −Ak, kBn −Bk < ǫ für alle n ≥ N. Es folgt kAn k ≤ kAn −Ak+kAk <
1 + kAk und damit
kBn An −BAk ≤ kBn An −BAn k+kBAn −BAk = kBn −BkkAn k+kBkkAn −Ak ≤ (1+kAk+kBk)ǫ.
9.2.8 Korollar. Seien X, Y, Z normierte Räume und (Y, d) ein metrischer Raum und
D ⊆ Y. Sind f : D → L(X, Y), g : D → L(Y, Z) und h : D → X stetig, so
auch g f : D → L(X, Z) und f h : D → Y. Dabei sind diese Funktionen definiert
durch g f (t) := g(t) f (t) (Hintereinanderausführung von zuerst f (t) und dann g(t)) so-
wie f h(t) := f (t)h(t) (Anwenden von f (t) auf h(t)).
9.2.9 Beispiel.
(i) Sei Y ein normierter Raum über R und y0 ∈ Y. Dann ist die Abbildung λ → λy0
von R nach Y linear und beschränkt durch ky0 k. Entsprechendes gilt für C.
(ii) Sei T : R p → Y linear, wobei Y ein normierter Raum ist. Ist R p mit k.k∞ oder
mit einer zu ihr äquivalenten Norm versehen, so ist T beschränkt und somit ste-
P
tig. Denn ist x = (x1 , . . . , x p )T = pj=1 x j e j ∈ R p , wobei e j der j-te kanonische
Basisvektor in R p ist, so folgt
X
p X
p X
p
kT (x)k = k x j T (e j )k ≤ |x j | · kT (e j )k ≤ kxk∞ kT (e j )k.
j=1 j=1 j=1
(iii) Sei X = R p und Y = Rq , beide versehen mit k.k∞ . Wegen des letzten Beispieles
ist jede lineare Abbildung A : R p → Rq beschränkt. Somit ist L(R p , Rq ) gleich
Rq×p .
(iv) Versieht man X = R p mit k.k∞ und auch Y = Rq mit k.k∞ , so hat man mit der
Abbildungsnorm k.k auf Rq×p R pq eine weitere Norm. Auch diese ist zu k.k∞
äquivalent. In der Tat ist für A = (ai j ) ∈ Rq×p und x ∈ R p
X
p
kAxk∞ = max | ai j x j | ≤
i=1,...,q
j=1
Also kAk ≤ pkAk∞ . Bezeichnet {e j } j=1,...,p die kanonische Basis von R p , so ist
sicherlich auch ( j = 1, . . . , p)
kAk ≥ kAe j k∞ = max |ai j |,
i=1,...,q
Man sieht sofort, dass A linear ist. Außerdem ist mit f ∈ C[0, 1]
kA( f )k∞ = sup |A( f )(x)| ≤ sup (x sup | f (t)|) ≤ k f k∞ .
x∈[0,1] x∈[0,1] t∈[0,x]
Also kAk ≤ 1.
X
N
S N := an
n=1
(ii) Manipulationsregeln wie in Fakta 3.7.4, (1) und (2), d.h. man darf endlich viele
Summanden umändern, ohne das Konvergenzverhalten zu ändern. Der Grenzwert
ändert sich im Allgemeinen. Außerdem kann man in einer Reihe Klammern set-
zen.
P
(iii) Ist ∞n=1 an konvergent, so folgt limn→∞ an = 0 in X (siehe Proposition 3.7.7).
Die Resultate für reel- bzw. komplexwertige Reihen, die die Vollständigkeit von
R (C) verwenden, lassen sich auf vollständige normierte Räume, d.h. Banachräume
verallgemeinern. Ist also (X, k.k) ein Banachraum, dann gelten folgende Verallgemei-
nerungen.
44 KAPITEL 9. NORMEN, BANACHRÄUME UND FOURIERREIHEN
P
(iv) Cauchysches Konvergenzkriterium (siehe Korollar 3.7.11): ∞ n=1 an konvergiert
genau dann, wenn
X m
∀ǫ > 0 ∃N ∈ N :
a j
< ǫ, ∀m > n ≥ N.
j=n+1
P
(v) Ist eine Reihe ∞n=1 an absolut konvergent, so folgt aus dem Cauchysches Kon-
P
vergenzkriterium und der Dreiecksungleichung sofort, dass ∞ n=1 an auch konver-
giert, wobei wegen der Stetigkeit von k.k : X → R
X ∞
X
N
X∞
an
= lim
an
≤ kan k.
n=1
N→∞
n=1
n=1
(vi) Majorantenkriterium (siehe Satz 3.7.8): Ist kan k ≤ αn ∈ R+ ∪ {0} und konvergiert
P∞ P∞
n=1 αn , so konvergiert n=1 an absolut, wobei
X ∞
X∞ X∞
an
≤ kan k ≤ αn . (9.7)
n=1
n=1 n=1
Beweis. Sei ǫ > 0 gegeben. Wegen der absoluten Konvergenz gibt es ein N ∈ N, sodass für n > m ≥ N
X
n
kak k < ǫ.
k=m+1
Setze M0 = {1, . . . , N}. Ist M eine endliche Teilmenge von N, die M0 enthält, so sind alle j ∈ M \ M0 größer als N.
Also gilt für beliebiges m > N
max(M)
X Xm
X Xm
X Xm
aj −
a j
=
aj − a j
≤ ka j k + ka j k < 2ǫ.
j=N+1
j∈M j=1
j∈M j=N+1
j=N+1
j>N
P
Strebt nun m gegen ∞, so folgt k j∈M a j − sk ≤ 2ǫ. Da ǫ > 0 beliebig war folgt (9.8).
❑
P∞
Schließlich folgt aus (9.8) sicherlich, dass j=1 a j = s (nicht notwendigerweise absolut), da die Folge der Partial-
P P P P
summen ( nj=1 a j )n∈N wegen nj=1 a j = j∈{1,...,n} a j ein Teilnetz von j∈M a j ist.
M⊆N, endlich
9.3. REIHEN, INTEGRALE, ETC. MIT WERTEN IN EINEM NORMIERTEN RAUM45
(ix) Mit dem gerade gezeigten lässt sich jetzt Satz 3.9.3 im Banachraumwertigen Fall wie im skalarwertiegen Fall zeigen:
P
Ist eine Reihe ∞ P an mit Werten in einem Banachraum X absolut konvergent, und ist σ : N → N bijektiv, so
n=1
konvergiert auch ∞ n=1 aσ(n) absolut, und zwar gegen den selben Grenzwert s, wie die ursprüngliche Reihe.
P∞ P∞
Beweis. Zunächst ist nach
P dem klassischen Satz 3.9.3 P∞ im skalaren Fall mit n=1 kan k auch n=1 kaσ(n) k konvergent;
also konvergiert auch ∞ n=1 a σ(n) absolut. Sei s̃ := n=1 aσ(n) (∈ X).
P P
Nach (9.8) konvergiert das Netz j∈M a j M⊆N, endlich gegen s und j∈M aσ( j) M⊆N, endlich gegen s̃.
Ist ǫ > 0 und M0 so, dass (9.8) gilt, und ist σ−1 (M0 ) ⊆ M, so folgt wegen M0 ⊆ σ(M)
X
X
X
aσ( j) − s
=
aσ( j) − s
=
ak − s
< ǫ.
j∈M σ( j)∈σ(M) k∈σ(M)
P
Somit konvergiert j∈M aσ( j) auch gegen s, dh. s = s̃.
M⊆N, endlich
❑
Schließlich gilt der Riemannsche Umordnungssatz, dh. die Umkehrung des gezeigten, im Banachraumfall im All-
gemeinen nicht.
(x) Da sich Satz 3.9.3 auf Banachraum-wertige Reihen verallgemeinern lässt, können wir auch Banachraum-wertige
Doppelreihen mit Hilfe von linearen Anordnungen betrachten. Insbesondere bleibt Satz 3.9.10 richtig. Man beachte,
dass in dessen Beweis nur die für Banachraum-wertige Reihen richtigen Teile von Lemma 3.9.2 verwendet werden.
9.3.2 Beispiel. Sei B ∈ R p×p (versehen z.B. mit der Abbildungsnorm) mit kBk < 1, und
definiere (B0 = I)
X∞
S := Bn .
n=0
P
Wegen (9.5) hat man kB k ≤ kBk , und daher ist ∞
n n n
n=0 kBk eine konvergente Majorante,
P∞ n
und somit konvergiert S = n=0 B absolut, wobei (vgl. (9.7))
X
∞ X
∞
1
kS k ≤ kBn k ≤ kBkn = .
n=0 n=0
1 − kBk
Die Tatsache, dass C 7→ BC eine beschränkte lineare Abbildungen von R p×p nach R p×p
ist, erlaubt uns die Vertauschung von Grenzübergängen (vgl. (9.6)):
X
N X
N X
N+1
BS = B lim Bn = lim Bn+1 = lim (−I + Bn ) = −I + S .
N→∞ N→∞ N→∞
n=0 n=0 n=0
Also I = (I − B)S . Genauso sieht man I = S (I − B). Also ist I − B invertierbar mit
S = (I − B)−1 .
9.3.3 Korollar. Ist T ∈ R p×p invertierbar, und ist S ∈ R p×p mit kT − S k < kT1−1 k , so ist
auch S invertierbar.
Insbesondere ist die Menge GL(p, R) aller invertierbaren p×p-Matrizen eine offene
Menge, und die Funktion S 7→ S −1 ist stetig auf GL(p, R) ⊆ R p×p .
Beweis. Nach Voraussetzung ist k(T − S )T −1 k < 1. Gemäß Beispiel 9.3.2 existiert
(I − (T − S )T −1 )−1 und
(I − (T − S )T −1 )(I − (T − S )T −1 )−1 = I.
Also hat S eine Rechtsinverse. Entsprechend ist (I − T −1 (T − S ))−1 T −1 eine Linksin-
verse. Aus der Linearen Algebra ist bekannt, dass diese dann übereinstimmen müssen.
46 KAPITEL 9. NORMEN, BANACHRÄUME UND FOURIERREIHEN
Auch die Differentialrechnung lässt sich auf Funktionen mit Werten in normierten
Räumen ausdehnen.
in X existiert, wobei dieser Grenzwert einseitig zu verstehen ist, wenn x ein Randpunkt
von I ist. Ist f bei allen x ∈ I differenzierbar, so heißt f differenzierbar. Die Funktion
x 7→ f ′ (x) (Ableitung von f ) ist dann eine Abbildung von I nach X. Ist diese stetig, so
heißt f stetig differenzierbar. Mit C 1 I, X wird die Menge aller stetig differenzierbaren
X-wertigen Funktionen auf I bezeichnet.
Analog zum skalaren Fall definiert man auch die höheren Ableitungen.
9.3.6 Bemerkung. Im Falle X = R p kann man sich f (I) als Kurve vorstellen. Die
Ableitung f ′ (x) ist dann der Anschauung nach nichts anderes, als der Tangentialvektor
an diese Kurve im Punkt f (x).
Wir wollen uns auch ein Beispiel einer Funktion von einem Intervall in einen un-
endlich dimensionalen Banachraum anschauen.
9.3.7 Beispiel. Sei X = C(0, 1) der Banachraum aller reellwertigen, beschränkten und
stetigen Funktionen auf dem Intervall (0, 1) versehen mit der Supremumsnorm k.k∞ .
Die Funktion f : R → X sei so definitert, dass f (t) die Funktion
s 7→ et s(1 − s)
(iii) ( f + g)′ (x) = f ′ (x) + g′ (x), (λ f )′ (x) = λ f ′ (x), (α f )′ (x) = α′ (x) f (x) + α(x) f ′ (x),
wobei λ ∈ R (C), f, g : I → X und α : I → R (C). Siehe Satz 7.1.7. Die
Gleichheitszeichen sind dabei so zu interpretieren, dass die linke Seite existiert,
wenn die rechte Seite existiert und dann die Gleichheit gilt.
Ähnlich wie bei den Reihen sieht man, dass T ( f ′ (x)) = (T f )′ (x), wenn T : X →
Y linear und beschränkt ist.
(iv) Kettenregel (Satz 7.1.9): Sei f : (c, d) → X und α : (a, b) → R mit α (a, b) ⊆
(c, d). Dann folgt ( f ◦ α)′ (x) = α′ (x) f ′ (α(x)).
48 KAPITEL 9. NORMEN, BANACHRÄUME UND FOURIERREIHEN
9.3.8 Beispiel. Sei X = C(0, 1) wieder der Banachraum aller reellwertigen, beschränk-
ten und stetigen Funktionen auf dem Intervall (0, 1) versehen mit der Supremumsnorm
k.k∞ . Die Funktion f : [0, 1] → X sei so definitert, dass f (t) die Funktion
√
t
s 7→
s+t
aus X = C(0, 1) ist. Klarerweise ist f (0) die Nullfunktion und somit (t > 0)
√ √
t t 1
k f (t) − f (0)k∞ = sup = lim = √ .
s∈(0,1) s + t s→0+ s + t t
Der Grenzwert dieses Ausdruckes für t → 0 ist aber sicherlich nicht 0. Also ist f bei
t = 0 nicht stetig und daher insbesondere nicht differenzierbar. √
Man beachte, dass für feste s ∈ (0, 1) die Funktion t 7→ s+tt bei t = 0 sehr wohl
stetig ist.
9.3.9 Bemerkung. Kann man Arten von Produkten von Funktionen bilden, so gelten
jeweils auch Formen von Produktregeln.
(i) Sei I ein reelles Intervall und f : I → L(X, Y), g : I → L(Y, Z). Für x ∈ I und
t ∈ I \ {x} gilt
1
k g(t) f (t) − g(x) f (x) − g′ (x) f (x) − g(x) f ′ (x)k =
t−x
1
kg(t) f (t) − f (x) − g(t) f ′ (x) + g(t) f ′ (x) − g(x) f ′ (x)+
t−x
1
g(t) − g(x) f (x) − g′ (x) f (x)k ≤
t−x
1
kg(t)k · k f (t) − f (x) − f ′ (x)k + kg(t) − g(x)k · k f ′ (x)k+
t−x
1
k g(t) − g(x) − g′ (x)k · k f (x)k.
t−x
Sind f und g bei x differenzierbar, so sind sie dort auch stetig und daher konver-
gieren für t → x alle Summanden gegen Null. Damit ist auch g f bei x differen-
zierbar mit der Produktregel
(ii) Entsprechend zeigt man ( f h)′ (x) = f ′ (x)h(x) + f (x)h′ (x), wenn f : I → L(X, Y)
und h : I → X.
(iii) Sind f, g : I → R p in einem Punkt x ∈ I differenzierbar, so zeigt man ähnlich wie
oben aber unter Zuhilfenahme der Cauchy-Schwarzschen Ungleichung, dass die
Funktion t 7→ ( f (t), g(t)) (Skalarprodukt) von I nach R auch in x differenzierbar
ist, wobei ( f, g)′ (x) = ( f (x), g′ (x)) + ( f ′ (x), g(x)).
9.3. REIHEN, INTEGRALE, ETC. MIT WERTEN IN EINEM NORMIERTEN RAUM49
Viele Resultate, die sich aus dem Mittelwertsatz (Satz 7.2.5) herleiten haben lassen,
können nicht unmittelbar auf Funktionen mit Werten in normierten Räumen verallge-
meinert werden. Manches lässt sich jedoch mit Hilfe des folgenden Lemmas retten.
9.3.10 Lemma. Ist f : [a, b] → X stetig, f |(a,b) differenzierbar und gilt f ′ (x) = 0 für
alle x ∈ (a, b), so ist f konstant.
Beweis. Subtrahieren wir von f (x) immer den Wert f (a), so können wir annehmen,
dass o.B.d.A. f (a) = 0.
Seien x, t ∈ (a, b), so folgt aus der Dreiecksungleichung k f (x)k ≤ k f (t) − f (x)k +
k f (t)k sowie k f (t)k ≤ k f (t) − f (x)k + k f (x)k. Also gilt −k f (t) − f (x)k ≤ k f (t)k − k f (x)k ≤
k f (t) − f (x)k, und daher
1
k f (t)k − k f (x)k
1
−
f (t) − f (x)
≤ ≤
f (t) − f (x)
.
t−x t−x t−x
Da k.k : X → R stetig ist, konvergieren für t → x die linke und die rechte Seite laut
Voraussetzung gegen 0 und nach dem Einschlusskriterium für Netze somit auch der
mittlere Ausdruck.
Also ist x 7→ k f (x)k auf (a, b) differenzierbar mit k f (x)k′ = 0 und klarerweise auf
[a, b] stetig. Da k f (a)k = 0, folgt aus dem Mittelwertsatz auf k f (x)k angewandt, dass
k f (x)k = 0, und somit f (x) = 0, für alle x ∈ [a, b].
❑
Als Folgerung erhält man z.B. dass zwei ableitbare X-wertige Funktionen überein-
stimmen, wenn sie es an einer Stelle tun, und wenn ihre Ableitungen gleich sind.
9.3.11 Definition. Sei f : [a, b] → X eine beschränkte Funktion. Konvergiert das Netz
(S ( f, R))R∈R in X, wobei (vgl. Definition 8.2.1)
X
n(R)
S ( f, R) = (ξ j − ξ j−1 ) f (α j ),
j=1
(ii) Ist T : X → Y beschränkt und linear, so folgt aus der Stetigkeit, dass
Z Z
T ( f (t) dt) = T ( lim S ( f, R)) = lim S (T f, R) = T f (t) dt. (9.12)
|R|→0 |R|→0
Rb
Insbesondere gilt für g : [a, b] → R (C) und x ∈ X, dass a
(g(t)x) dt =
Rb
( a g(t) dt)x.
Setzt man noch voraus, dass (X, k.k) ein Banachraum ist, so gelten auch folgende
Aussagen.
Dann ist F stetig auf [a, b]. Ist f in einem Punkt x0 stetig, so ist F bei x0 differen-
zierbar und es gilt F ′ (x0 ) = f (x0 ).
(vi) Ist f : [a, b] → X stetig, und ist G : [a, b] → X stetig und stetig differenzierbar auf
Rx
(a, b), sodass G′ (x) = f (x), x ∈ (a, b), so erfüllt G(x)− f (t) dt die Voraussetzung
a
von Lemma 9.3.10. Also ist diese Funktion konstant, und daraus folgt
Zb
f (t) dt = G(b) − G(a). (9.13)
a
Man erhält somit wie im skalaren Fall, dass der Integrationsoperator C([a, b], X)
bijektiv auf die Hyperebene aller bei a verschwindenden Funktionen in
C 1 ([a, b], X) abbildet.
(vii) Sei I ⊆ R ein Intervall mit endlicher linker Intervallgrenze a, die in I liege. Ist f : I → X eine Funktion, dann
gilt f ∈ C1 (I, X) genau dann, wenn f ∈ C(I, X), f |I\{a} ∈ C1 (I \ {a}, X) und der X-wertige Grenzwert limtցa f ′ (t)
existiert, vgl. Korollar 7.2.10. Eine entsprechende Aussage gilt für die rechte Intervallgrenze von I.
Um das einzusehen, sei f ∈ C(I, X), f |I\{a} ∈ C1 (I \ {a}, X) und existiere limtցa f ′ (t). Setzen wir g(t) = f ′ (t), t ∈
I \ {a}, und g(a) = limtցa f ′ (t), so gilt klarerweise g ∈ C(I, X), vgl. Bemerkung 6.4.4. Die X-wertige Funktion
Rx
F(x) = f (x) − a g(t) dt, x ∈ I, ist auf I stetig, hat auf I \ {a} eine verschwindende die Ableitung, und ist somit
Rx
wegen Lemma 9.3.10 auf jedem Intervall der Form [a, s] mit s ∈ I konstant. Also ist mit x 7→ a g(t) dt, x ∈ [a, s]
(vgl. (v)) auch f (x) auf [a, s] stetig differenzierbar. Die Umkehrung ist offensichtlich.
(viii) Es gilt auch die Substitutionsregel mit skalarer Funktion g und X-wertiger Funk-
tion f (vgl. Lemma 8.4.14) und die Regel der partiellen Integration (vgl. Lemma
8.4.15), wobei eine Funktion skalarwertig sein muss, damit das Produkt von zwei
Funktion erklärt ist.
9.3. REIHEN, INTEGRALE, ETC. MIT WERTEN IN EINEM NORMIERTEN RAUM51
(ix) Uneigentliche Riemann-Integrale lassen sich genauso wie im skalaren Fall defi-
nieren, siehe Definition 8.6.1.
Insbesondere zeigt man wie in Lemma 8.6.3, dass aus absoluten Konvergenz von
Rb Rb
a R
g(x) dx einer Funktion g : [a, b) → X, dh. a
kg(x)k dx < +∞, die Konvergenz
b Rβ
von a g(x) dx, dh. von limβրa a g(x) dx in X folgt. Ist obendrein |g(x)| ≥ | f (x)|
Rb
für alle x ab einem c ∈ [a, b), so ist auch a f (x) dx absolut konvergent, wobei
f : [a, b) → X.
Bei diesem Schluss von absoluter Konvergenz auf die Konvergenz muss man
voraussetzen, dass für alle β ∈ [a, b) die Funktionen g, f, kg(.)k, k f (.)k auf [a, β]
Riemann-integrierbar sind.
(x) Wie im skalaren Fall kann man auch Integral und Grenzübergang vertauschen
(siehe Satz 8.7.2)
Zb Zb
lim fn dx = f dx. (9.14)
n→∞
a a
(xi) Man kann auch genauso wie im skalaren Fall die Integrationsreihenfolge vertau-
schen, siehe Satz 8.7.9. Weiters kann man Integral und Ableitung vertauschen
(siehe Korollar 8.7.11):
Z d Z d
d d
f (s, t) dt = f (s, t) dt, (9.15)
ds c c ds
d
wenn f (s, t) und ds f (s, t) für alle (s, t) ∈ [a, b] × [c, d] stetig sind.
(xii) Man kann nun auch die Rechnung aus Beispiel 8.8.3 nochmals für f : I → X
durchführen, um für eine (n + 1)-mal stetig differenzierbare Funktion die Taylor-
sche Entwicklung
Xn Z x
f (k) (y) k (x − t)n
f (x) = (x − y) + f (n+1) (t) dt. (9.16)
k=0
k! n!
y
zu erhalten. Nur eine Abschätzung des Restgliedes wie im R-wertigen Fall hat
man nicht, da diese ja den Mittelwertsatz der Differentialrechnung bzw. Integral-
rechnung verwendet.
R b
Z f f1 (t) dt
b 1 a
.. ..
,
. (t) dt = .
a R b
fd fd (t) dt
a
in dem Sinne, dass die linken Seiten genau dann existieren, wenn die rechten es tun.
Als Anwendung für obige eher abstrakt wirkende Konzepte wollen wir die Expo-
nentialfunktion, die einer p × p-Matrix wieder eine p × p-Matrix. zuweist betrachten.
9.3.14 Beispiel. Sei A ∈ R p×p . Man betrachte die R p×p -wertige Potenzreihe (t ∈ R)
X
∞
1 n
etA := tn A .
n=0
n!
1 n (|t| kAk)n
ktn A k≤
n! n!
folgt nach dem Majorantenkriterium die absolute Konvergenz von etA für alle t ∈ R, da
ja
X∞
(|t| kAk)n
(= e|t| kAk )
n=0
n!
konvergiert. Somit ist der Konvergenzradius R = +∞. Als Grenzfunktion einer Potenz-
reihe ist t 7→ etA eine stetige Funktion von R nach R p×p .
Wegen der Beschränktheit der Abbildungen B 7→ AB, B 7→ BA als Abbildungen
von R p×p nach R p×p gilt wegen (9.6)
∞
X n 1 n X ∞
1
tA
Ae = A t A = tn An+1 = etA A. (9.17)
n=0
n! n=0
n!
Sei x ∈ R. Die Potenzreihe für auf [−|x|, |x|] gleichmäßig konvergiert, kann man im
Folgenden Integration und Grenzwert vertauschen (vgl. (9.14)):
Z x ∞ Z
X x X xn+1 ∞
1 n n
etA dt = t A dt = An .
0 n=0 0 n! n=0
(n + 1)!
Aus dem Hauptsatz der Differential und Integralrechnung folgt daher dtd etA = AetA =
etA A.
Übrigens konvergiert etA auch für alle t ∈ R, wenn man R p×p mit einer anderen
Norm versieht, da diese alle äquivalent sind. Wir haben oben aber die Tatsache kAn k ≤
kAkn verwendet, welche i.A. nur von der Abbildungsnorm erfüllt wird.
9.3. REIHEN, INTEGRALE, ETC. MIT WERTEN IN EINEM NORMIERTEN RAUM53
9.3.15 Proposition. Für jede p × p-Matrix A ∈ R p×p konvergiert die Reihe (A0 := I)
X∞
1 n
eA := A .
n=0
n!
absolut im Banchraum R p×p versehen mit der Abbildungsnorm, wobei keA k ≤ ekAk und zwar gleichmäßig auf jeder Menge
der Form
Er = {A ∈ R p×p : kAk ≤ r}
für jedes beliebige 0 < r < +∞.
Die Abbildung A 7→ eA als Abbildung von R p×p nach R p×p ist stetig.
P kAkn P∞ 1 n
Beweis. Wegen (9.5) gilt kAn k ≤ kAkn für alle n ∈ N. Somit ist ∞ n=0 n! eine konvergente Majorante und n=0 n! A
konvergiert absolut, wobei keA k ≤ ekAk (siehe (9.7)).
Wegen der Beschränktheit der Abbildungen B 7→ AB, B 7→ BA als Abbildungen von R p×p nach R p×p gilt wegen (9.6)
∞
X 1 n X ∞
1 n+1
AeA = A A = A = eA A.
n=0
n! n=0
n!
9.3.16 Bemerkung. Sei nun R eine weitere beliebige p × p-Matrix. Dann sieht man mit
Hilfe der Produktregel wie in (9.10), dass die Funktion f (t) = etA R eine Lösung des
Randwertproblems
f ′ (t) = A f (t), f (0) = R (9.18)
ist. Ist umgekehrt f : R → R p×p eine weitere auf ganz R differenzierbare Lösung die-
ses Problems, so folgt aus der Produktregel für R p×p L(R p , R p )-wertige Funktionen
(9.10)
d −tA
(e f (t)) = −e−tA A f (t) + e−tA f ′ (t) = −e−tA A f (t) + e−tA A f (t) = 0,
dt
und daher e−tA f (t) = e−0A f (0) = R. Da insbesondere etA eine Lösung von (9.18) mit
R = I ist, erhalten wir e−tA etA = I und somit e−tA = (etA )−1 .
Für unsere zunächst beliebige Lösung folgt daher auch f (t) = etA R. Also ist etA R
die einzige Lösung von (9.18).
Mit dieser Tatsache lässt sich nun auch die Frage behandeln, ob für die Exponenti-
alfunktion wie im skalaren Fall gilt, dass eA+B = eA eB . Im Allgemeinen ist das nämlich
nicht richtig. Sollten aber A und B kommutieren (AB = BA), so gilt (vgl. (9.6))
∞
X tn n X
∞ n
t X∞ n
t
e B =
tA
A B = (An B) = (BAn) = BetA ,
n! n=0
n! n=0
n! n=0
und daher
d tA tB
(e e ) = AetA etB + etA BetB = (A + B)etA etB .
dt
Somit ist etA etB eine Lösung von (9.18) mit A ersetzt durch A + B und R ersetzt durch
I, und wegen der Eindeutigkeit der Lösung folgt et(A+B) = etA etB .
9.3.17 Bemerkung. Ganz ähnlich wie in Bemerkung 9.3.4 gelten auch Beispiel 9.3.14
und die Aussagen von Proposition 9.3.15 und Bemerkung 9.3.16 für den Fall, dass
A ∈ L(X, X) mit einem beliebigen Banachraum X. Die Beweise sind im wesentlichen
die selben.
54 KAPITEL 9. NORMEN, BANACHRÄUME UND FOURIERREIHEN
9.4.1 Definition. Ist H ein Vektorraum über R oder C, und ist (., .) : H × H →
R bzw. (., .) : H × H → C ein Skalarprodukt, dh. eine hermitsche positiv definite
Sesqulinearform, so nennen wir (H, (., .)) einen Skalarproduktraum. Weiters setzen
wir für x ∈ H p
kxk := (x, x).
√
Nicht ganz zufällig wird für (x, x) das Symbol kxk gewählt. In der Tat ist k.k eine
Norm, denn es gilt offensichtlich wegen der positiven Definitheit (x, x) = 0 ⇔ x = 0
und (x, x) ≥ 0, es gilt kλxk2 = (λx, λx) = |λ|2 · kxk2 und schließlich liefert die aus der
Linearen Algebra bekannten Cauchy-Schwarzschen Ungleichung |( f, g)| ≤ k f k · kgk
und daher k( f + g)k ≤ k f k + kgk. Also ist (H, k.k) ein normierter Raum (siehe Definition
9.1.1).
9.4.2 Definition. Ein Skalarproduktraum (H, (., .)) heißt Hilbertraum, wenn (H, k.k)
sogar ein Banachraum ist.
9.4.3 Beispiel.
P
Versehen wir etwa C p mit dem natürlichen Skalarprodukt (x, y) := pj=1 x j ȳ j , so
ist die von (., .) erzeugte Norm gerade k.k2 und (C p , (., .)) ist ein Hilbertraum.
p
Für diese Norm gilt k f k2 = ( f, f ), wenn wir C[a, b] mit dem positiv definiten
Skalarprodukt ( f, g ∈ C[a, b])4
Z b
( f, g) = f (t)g(t) dt
a
versehen. Der normierte Raum (C[a, b], k.k2) ist nicht vollständig und damit
(C[a, b], (., .)) kein Hilbertraum.
Sei Q[a, b] die Menge aller auf [a, b] stückweise stetigen Funktionen mit Werten
in C (vgl. Definition 8.4.3).
Man überprüft in elementarer Weise, dass f ∈ Q[a, b] genau dann, wenn für
alle x ∈ [a, b) die Grenzwerte f (x+) = limt→x+ f (t) und für alle x ∈ (a, b] die
Grenzwerte f (x−) = limt→x− f (t) existieren und für alle bis auf endlich viele
x ∈ (a, b) gilt f (x−) = f (x) = f (x+).
3 In diesem Kapitel steht C[a, b] für alle komplexwertigen stetigen Funktionen auf [a, b]. Alle Ergebnisse
gelten sinngemäß auch für den Raum aller reellwertigen stetigen Funktionen auf [a, b].
4 Das Quer ist nicht nötig, wenn C[a, b] für alle stetigen und reellwertigen Funktionen steht.
9.4. SKALARPRODUKTRÄUME UND ORTHOGONALSYSTEME 55
versehen mit
X
∞
((zn )n∈N , (wn )n∈N ) := zn w̄n ,
n=1
wobei diese Reihe wegen
v
u
t N v
t∞
XN X X
N X X
∞
|zn w̄n | ≤ 2
|zn | · 2
|wn | ≤ |zn |2 · |wn |2
n=1 n=1 n=1 n=1 n=1
pP∞
2
sogar absolut konvergiert. Die von (., .) erzeugte Norm ist n=1 |zn | .
Um die Vollständigkeit nachzuweisen, sei (zkn )n∈N k∈N eine Cauchy-Folge in
l2 (N) bezüglich der von (., .) erzeugten Norm. Für ein festes m ∈ N gilt (k, l ∈ N)
|zkm − zlm | ≤ k(zkn )n∈N − (zln )n∈N k,
und man sieht, dass (zkm )k∈N eine Cauchy-Folge in C ist. Also zkm → zm , k → ∞
für ein zm ∈ C. Sei ǫ > 0 und K ∈ N so, dass k, l ≥ K ⇒ k(zkn )n∈N − (zln )n∈N k < ǫ.
Für ein festes N ∈ N und k ≥ K gilt dann
X
N X
∞
|zkn − zln |2 ≤ |zkn − zln |2 < ǫ 2 .
n=1 n=1
PN k
Lassen wir l → ∞ streben, so erhalten wir n=1 |zn − zn |2 ≤ ǫ 2 , und da N beliebig
P∞ k
war sogar n=1 |zn − zn | ≤ ǫ . Daraus folgt einerseits (zkn − zn )n∈N ∈ l2 (N) und
2 2
9.4.4 Definition. Sei (H, (., .)) ein Skalarproduktraum. Eine Familie (ei )i∈I von nicht-
verschwindenden Elementen aus H, d.h. 0 , ei ∈ H, i ∈ I, heißt Orthogonalsystem,
wenn (ei , e j ) = 0, i , j. Ein Orthogonalsystem heißt Orthonormalsystem, wenn zusätz-
lich kei k = 1, i ∈ I.
Klarerweise ist jedes Orthogonalsystem (ei )i∈I linear unabhängig und lässt sich
durch Normierung in ein Orthonormalsystem überführen: ( ke1i k ei )i∈I .
Aus der Linearen Analysis ist folgender Aussage bekannt (siehe Satz 11.5.5 und
die drei Zeilen unmittelbar nach dem Beweis von Satz 11.5.5 im Buch Lineare Algebra
von Hans Havlicek).
9.4.5 Proposition. Sei I = {1, . . . , n} endlich und (ei )i∈I ein Orthonormalsystem in ei-
nem Skalarproduktraum (H, (., .)). Weiters sei G der von (ei )i∈I aufgespannte Teilraum
in H.
Dann gilt H = G ⊕ G⊥ , und
X
P : H → G, P(x) := (x, ei )ei
i∈I
⊥
ist eine Projektion von H auf G mit Kern G .
9.4.6 Lemma. Mit der Notation aus Proposition 9.4.5 gilt
kxk2 = kPxk2 + k(I − P)xk2 .
P P
Sind c1 , . . . , cn ∈ C, so gilt k i∈I ci ei k2 = i∈I |ci |2 . Insbesondere gilt
X
kPxk2 = |(x, ei )|2 .
i∈I
P
Schließlich ist y = i∈I (x, ei )ei der Vektor in G mit minimalen Abstand zu x.
Beweis. Sind u, v ∈ H und u⊥v, so gilt (u + v, u + v) = (u, u) + (v, v). Wenden wir diese
Tatsache auf u = Px und v = (I − P)x an, so erhalten wir die erste Gleichung.
Wenden wir sie n-mal auf die Summe c1 e1 + · · · + cn en an, und beachten, dass
kc j e j k2 = |c j |2 , so folgt die zweite Gleichung.
Um die letzte Behauptung zu zeigen, sei y ∈ G beliebig. Der Abstand zum Quadrat
von y zu x ist wegen (x − Px)⊥(y − Px)
(x − y, x − y) = (x − Px + (Px − y), x − Px + (Px − y)) =
(x − Px, x − Px) + (Px − y, Px − y) = kx − Pxk2 + kPx − yk2 .
Also ist immer kx − yk > kx − Pxk außer kPx − yk2 = 0 bzw. y = Px.
❑
Ist nun (ek )k∈N ein abzählbares Orthonormalsystem, so kann man für jedes n ∈ N
die orthogonale Projektion Pn : H → Gn wie in Proposition 9.4.5 betrachten, wobei
Gn die lineare Hülle von e1 , . . . , en . Dabei ist
X
n
Pn x = (x, ek )ek .
k=1
P
9.4.7 Satz. Die Reihe ∞ 2 2
k=1 |(x, ek )| konvergiert, d.h. (x, ek ) k∈N ∈ l (N). Insbesondere
ist diese Folge von komplexen Zahlen eine Nullfolge.
P
Außerdem konvergiert die Reihe ∞ k=1 (x, ek )ek in H bzgl. k.k gegen x genau dann,
P∞ 2 2
wenn k=1 |(x, ek )| = kxk .
P
9.4.8 Definition. Man bezeichtnet ∞ k=1 (x, ek )ek als Fourierreihe von x bezüglich dem
Orthonormalsystem (en )n∈N , ob sie nun konvergiert, oder nicht. Konvergiert die Fou-
rierreihe von jedem x ∈ H und ist ihr Grenzwert x, so bezeichnet man (ek )k∈N als
Orthonormalbasis.
PN P
mit ck = (x, ek ) die Folge k=1 (x, ek )ek N∈N der Partialsummen der Reihe ∞ k=1 (x, ek )ek
zwar eine Cauchy-Folge, aber, da H nicht vollständig sein muss, nicht notwendiger-
weise konvergiert.
Ist jedoch H ein Hilbertraum, so konvergiert unsere Reihe immer. In der Tat kon-
P
vergiert in solchen Räumen wegen (9.19) jede Reihe der Form ∞ k=1 ck ek , wenn nur
(ck )k∈N ∈ l2 (N).
1 1 1 1 1 1 1
√ , √ cos t, √ sin t, √ cos 2t, √ sin 2t, √ cos 3t, √ sin 3t, . . .
2π π π π π π π
ein Orthonormalsystem in von Q[−π, π] ist. Traditionsgemäß wird die Fourierreihe ei-
ner Funktion f ∈ Q[−π, π] bzgl. dieses Orthonormalsystem geschrieben als
a0 X
∞
+ (an cos nt + bn sin nt),
2 n=1
Zπ
1
an = f (t) cos nt dt, n = 0, 1, 2, . . . , (9.20)
π
−π
Zπ
1
bn = f (t) sin nt dt, n = 1, 2, . . . . (9.21)
π
−π
Man beachte, dass für reellwertige Funktionen f offensichtlich auch die an und bn
reellwertig sind.
58 KAPITEL 9. NORMEN, BANACHRÄUME UND FOURIERREIHEN
Die Funktion ist ungerade, die Fourierreihe wird also eine reine Sinusreihe:
X
∞
sin(2k − 1)t
.
k=1
2k − 1
Wir können aber bis jetzt nichts über die Konvergenz dieser Fourierreihe also der Folge
der Partialsummen
XN
sin (2k − 1)t
gN (t) := , N = 1, 2, 3, . . .
k=1
2k − 1
π
4
t
−π 0 π
f (t)
− π4 g1 (t)
g2 (t)
g3 (t)
Wir wenden uns nun der Frage nach punktweiser Konvergenz der Fourierreihe zu.
Sei zunächst f (x) ein trigonometrisches Polynom vom Grad ≤ l.
a0 X
n
sn (x) = + (am cos mx + bm sin mx)
2 m=1
Zπ Zπ Zπ
1 X
n
1
sn (x) = f (t) dt + f (t) cos mt dt · cos mx + f (t) sin mt dt · sin mx =
2π π m=1
−π −π −π
9.5. FOURIERKOEFFIZIENTEN UND KONVERGENZ VON FOURIERREIHEN59
Zπ
1 1 Xn
=
f (t) · + (cos mt cos mx + sin mt sin mx) dt =
π 2 m=1
−π
Zπ
1 1 Xn
= f (t) + cos m(x − t) dt.
π 2 m=1
−π
Schreibt man
1 X
n
1
Dn (t) := + cos mt, D0 (t) := ,
2 m=1 2
so erhält man
Zπ
1
sn (x) = f (t)Dn (x − t) dt. (9.22)
π
−π
Die Funktion Dn (t) heißt Dirichlet-Kern und ist 2π periodisch. Man sieht leicht mit
Hilfe der Formel für die endliche geometrische Reihe, dass sich Dn schreiben lässt als
1 X ikt sin(n + 2 )t 1
n 1
t
Dn (t) = e = = cos nt + cot · sin nt . (9.23)
2 k=−n 2 sin 2t 2 2
D0 (t)
D1 (t)
D2 (t)
D3 (t)
1
2
t
−π 0 π
Nehmen wir uns eine Funktion f ∈ Q[−π, π] her, vernachlässigen den Funktions-
wert bei π, und setzen f |[−π,π) , 2π-periodisch auf ganz R zu einer Funktion f˜ fort, so
können wir (9.22) in der Form
Zπ
1
sn (x) = f˜(x + t)Dn (t) dt (9.24)
π
−π
schreiben. Man beachte, dass dieser Ausdruck für alle x ∈ R existiert und so wie f˜
auch 2π-periodisch ist. Wegen
Z π
Dn (t) dt = π,
−π
60 KAPITEL 9. NORMEN, BANACHRÄUME UND FOURIERREIHEN
konvergiert die Folge der Partialsummen sn in einem Punkt x gegen ein s(x) ∈ C genau
dann, wenn
Zπ
n→∞
f˜(x + t) − s(x) Dn (t) dt −→ 0. (9.25)
−π
9.5.3 Satz (Lokalisationsprinzip). Für jedes δ > 0 und für die 2π-periodische Fortsetzung g̃ von g ∈ Q[−π, π) auf R gilt
Z
lim g̃(x + t)Dn (t) dt = 0. (9.26)
n→∞
[−π,−δ]∪[δ,π]
Somit hängt das Verhalten der Partialsummen sn (x) einer Funktion f ∈ Q[−π, π) nur von den Werten von f˜ lokal bei x ab.
Genauer gesagt konvergiert sn (x) gegen einen Wert s(x) genau dann, wenn
Z
lim ( f˜(x + t) − s(x))Dn (t) dt = 0. (9.27)
n→∞
[−δ,δ]
Beweis. Setze
g̃(t + x) , δ < |t| ≤ π,
g̃(t + x) cot t
, δ < |t| ≤ π,
α(t) := β(t) := 2
0
0 , |t| ≤ δ, , |t| ≤ δ.
t
Beachte, dass cot 2 auf δ ≤ |t| ≤ π stetig ist und daher β ∈ Q[−π, π]. Es gilt (siehe (9.23))
Z Zπ Zπ
1 1
g̃(t + x)Dn (t) dt = α(t) cos nt dt + β(t) sin nt dt.
2 2
[−π,−δ]∪[δ,π] −π −π
Somit ist die rechte Seite die Summe von Fourierkoeffizienten von Q[−π, π]-Funktionen und somit nach Satz 9.4.7 gegen
Null konvergent
Schließlich folgt (9.27) aus (9.25) und (9.26), wobei wir g(t) = f (t) − s(x) setzen.
❑
9.5.4 Bemerkung. Das Lokalisationsprinzip zeigt einen grundlegenden Unterschied zwischen trigonometrischen Reihen
und Potenzreihen auf. Denn stimmen zwei Funktionen in einer Umgebung des Entwicklungspunktes überein, so haben sie
die selbe Taylorreihe. Dagegen folgt für die entsprechenden Fourierreihen nur, dass sie sich lokal bei diesem Punkt gleich
verhalten.
Folgender Satz liefert uns ein hinreichendes Kriterium für die Konvergenz der Fol-
ge (sn (x))n∈N , das einfach zu überprüfen ist.
9.5.5 Satz. Sei f ∈ Q[−π, π], und sei f˜ die 2π-periodisch Fortsetzung von f |[−π,π) auf
ganz R. Weiters sei x ∈ R. Existieren die einseitigen Limites
f˜(x+) := lim f˜(t), f˜(x−) := lim f˜(t),
t→x+ t→x−
Zπ
lim f˜(x + t) + f˜(x − t) − f˜(x+) − f˜(x−) Dn (t) dt = 0.
n→∞
0
Mit Hilfe von (9.23) sehen wir, dass dieses Integral übereinstimmt mit
Zπ
1
f˜(x + t) + f˜(x − t) − f˜(x+) − f˜(x−) · cos nt dt+
2
0
Zπ !
f˜(x + t) + f˜(x − t) − f˜(x+) − f˜(x−) t
+ cos · sin nt dt. (9.29)
2 sin 2t 2
0
Die Funktion in der Klammer im ersten Integral ist offenbar in Q[−π, π]. Das erste
Integral ist also der Fourierkoeffizient von cos nt in der Fourierreihe dieser Funktion
multipliziert mit 1(0,π) , und nach Satz 9.4.7 eine Nullfolge für n → ∞.
Die Funktion g in der Klammer des zweiten Integrals liegt ebenfalls ebenfalls in
Q[−π, π], denn es gilt
gilt.
9.5.7 Definition. Eine Abbildung f : [a, b] → R (C) heißt stückweise stetig differen-
zierbar , falls es eine Zerlegung a = t0 < · · · < tn = b von [a, b] gibt, sodass jede
Einschränkung f |(t j−1 ,t j ) eine stetig differenzierbare Fortsetzung auf [t j−1 , t j ] hat.
9.5.8 Bemerkung. Ist f stückweise stetig differenzierbar auf [−π, π], so sind die Vor-
aussetzungen von Satz 9.5.5 für alle x ∈ R erfüllt.
Also konvergiert die Fourierreihe bei Stetigkeitspunkten x von f˜ gegen f˜(x) und
˜ ˜
sonst gegen f (x+)+2 f (x−) .
9.5.9 Beispiel. Wir betrachten f (x) = |x|, x ∈ [−π, π]. Die 2π-periodische Fortsetzung
dieser Funktion6 ist stückweise stetig differenzierbar. Also konvergiert die Fourierreihe
punktweise gegen f . Die Fourierkoeffizienten berechnet man folgendermaßen (n > 0):
Z Z
1 π 2 π
an = |t| cos nt dt = t cos nt dt =
π −π π 0
6 Sägezahnfunktion.
62 KAPITEL 9. NORMEN, BANACHRÄUME UND FOURIERREIHEN
Z π
2 2 2
− sin nt dt = (cos nπ − cos 0) = 2 ((−1)n − 1),
nπ 0 n2 π n π
a0 = π und die bn = 0, da die Funktionen |t| sin nt ungerade sind. Also gilt (x ∈ [−π, π])
π 4X
∞
1
|x| = − cos(2n − 1)x.
2 π n=1 (2n − 1)2
π2 X
∞
1
= .
8 n=1
(2n − 1)2
9.5.10 Bemerkung. Hat man eine Funktion f gegeben mit Periode 2T , so kann man
diese mittels einer Umskalierung in eine Fourierreihe entwickeln. Diese schaut folgen-
dermaßen aus: !
a0 X
∞
πkx πkx
+ ak cos + bk sin
2 k=1 T T
mit
ZT
1 πkx
ak = f (x) cos dx, k = 0, 1, 2, . . . ,
T T
−T
ZT
1 πkx
bk = f (x) sin dx, k = 1, 2, . . . .
T T
−T
Hat man nun zum Beispiel eine Funktion y0 (x) am Intervall [0, 1] gegeben und
möchte diese in eine reine Sinusreihe entwickeln, so geht man vor wie folgt: Zunächst
definiert man eine Funktion f auf [−1, 1] indem man y0 ungerade fortsetzt. D.h. man
setzt
−y0 (−x) , −1 ≤ x < 0.
f (x) :=
0 ,x=0
y0 (x) ,0 < x ≤ 1
Diese Funktion entwickelt man auf [−1, 1] in eine Fourierreihe. Das ist eine reine Si-
nusreihe, da wir f ja als ungerade definiert haben. Eingeschränkt auf [0, 1] erhalten wir
die gewünschte Entwicklung von y0 .
P
können wir die Fourierreihe a20 + ∞ n=1 (an cos nt + bn sin nt) von f betrachten. Nun sei
g : [−π, π] → C definiert durch g(x) = f ′ (x), wenn f bei x differenzierbar ist, und
g(x) = 0 sonst.
Da f stetig und stückweise stetig differenzierbar ist, gibt es eine Zerlegung −π =
t0 < t1 < · · · < tn = π von [−π, π], sodass sich die Funktionen f |(t j−1 ,t j ) stetig differen-
zierbar auf [t j−1 , t j ] fortsetzen lassen. Wegen der Stetigkeit von f ist diese Fortsetzung
gerade f |[t j−1 ,t j ] .
Also gilt g(x) = f ′ (x) für alle x ∈ [−π, π] \ {t0 , . . . , tn }, und g|(t j−1 ,t j ) hat die stetige
Fortsetzung ( f |[t j−1 ,t j ] )′ auf [t j−1 , t j ], dh. g ∈ Q[−π, π].
Bezeichnet αn , n ∈ N ∪ {0}, und βn , n ∈ N, die Fourierkoeffizienten von g, so folgt
mittels partieller Integration
Zπ Zt j
1X
n
1
αn = g(t) cos nt dt = ( f |[t j−1 ,t j ] )′ (t) cos nt dt =
π π j=1
−π t j−1
Zt j
1X 1X
n n
( f (t j ) cos nt j − f (t j−1 ) cos nt j−1 ) − f |[t j−1 ,t j ] (t)(−n sin nt) dt =
π j=1 π j=1
t j−1
9.6.1 Satz. Ist f : [−π, π] → C stetig und stückweise stetig differenzierbar mit f (−π) =
P
f (π), so konvergiert ihre Fourierreihe a20 + ∞ n=1 (an cos nt +bn sin nt) gleichmäßig gegen
die 2π-periodisch Fortsetzung f˜ von f |[−π,π) .
Beweis. Wir verwenden obige Notation. Nach Satz 9.4.7 sind die Folgen der Fourier-
koeffizienten (αn )n∈N und (βn )n∈N von g quadratisch summierbar, dh. sie liegen in l2 (N).
Aus der Cauchy-Schwarzschen Ungleichung, Lemma 3.1.4, folgt
X X X X ! N ! 1 1
1 2 X 2 2
N N N N
|nan | |βn |
|an | = = ≤ |βn | ,
n=1 n=1
|n| n=1
|n| n=1
n2 n=1
P P 1 PN 1
und für N → ∞, dass n∈N |an | ≤ ( n∈N n12 ) 2 ( n=1 |βn |2 ) 2 < ∞. Genauso sieht man
P
n∈N |bn | < +∞. Nach
P
dem Kriterium von Weierstraß, Korollar 6.7.4, konvergiert die
Fourierreihe a20 + ∞n=1 n cos nt + bn sin nt) gleichmäßig auf R und zwar wegen Satz
(a
9.5.5 gegen f˜.
❑
Ist f : [−π, π] → C nur stetig mit f (−π) = f (π), so lässt sich f beliebig gut etwa
durch stetige und stückweise lineare Funktionen approximieren. In Kombination mit
Satz 9.6.1 folgt daraus, dass sich jede stetige Funktion auf [−π, π] mit den gleichen
Werten bei ±π beliebig gut gleichmäßig durch trigonometrische Funktionen approxi-
mieren lässt. Diese Tatsache lässt sich auch mit den Mitteln des Fejér Kerns zeigen,
vgl. Satz 9.7.2. Daraus leitet man wiederum her, dass für jedes stetige f : [−π, π] → C
mit f (−π) = f (π) die Fourierreihe von f bzgl. k.k2 in Q[−π, π] gegen f konvergiert.
Siehe diesbezüglich Korollar 9.7.3 samt Beweis.
64 KAPITEL 9. NORMEN, BANACHRÄUME UND FOURIERREIHEN
P
9.6.2 Bemerkung. Die Fourierreihe a20 + ∞ n=1 (an cos nt + bn sin nt) der Funktion f (x) =
|x|, x ∈ [−π, π], aus Beispiel 9.5.9 konvergiert nach Satz 9.6.1 sogar gleichmäßig gegen
die 2π-periodische Fortsetzung von f . Also gilt
a0 X
n
sn (t) = + (am cos mt + bm sin mt).
2 m=1
1 n→∞
kg − pn k∞ ≤ + kg − sn k∞ −→ 0.
n
Also gibt es eine Folge (pn )n∈N von Polynomen mit reellen Koeffizienten, die auf
[−π, π] gleichmäßig gegen f konvergiert.
Ist c > 0 bliebig, so konvergiert dann s 7→ πc pn ( πc s), n ∈ N, gleichmäßig auf [−c, c]
gegen s 7→ πc f ( πc s) = πc πc |s| = |s|. Also ist auch auf [−c, c] die Funktion s 7→ |s|
gleichmäßiger Grenzwert einer Folge von Polynomen mit reellen Koeffizienten.
Wenn man die Methoden aus Bemerkung 9.6.2 mit den davor erwähnten kombi-
niert, erhält man allgemeiner, dass man auf jedem Intervall [a, b] jede stetig Funktion
beliebig gut durch eine Folge von Polynomen gleichmäßig approximieren kann, vgl.
Satz 9.7.5 sowie Satz 12.10.4.
s0 + s1 + . . . + sn
σn := ,
n+1
konvergiert, und zwar gegen den gleichen Grenzwert. Die Umkehrung gilt jedoch nicht, wie man am Beispiel der Folge
1, 0, 1, 0, 1, 0, . . . sieht. P
a
Somit ist es einen Versuch wert, für eine Funktion f mit Fourierreihe 20 + ∞n=1 (an cos nx + bn sin nx), die Reihe in
diesem verallgemeinerten Sinne zu summieren. Man betrachtet also die sogenannten Cesaro-Mittel:
Zπ
1
σn (x) = f˜(x + t)Fn (t) dt, (9.30)
π
−π
9.7. FEJÉR KERN 65
schreiben, wobei f˜ die 2π-periodische Fortsetzung von f |[−π,π) auf R ist und wobei Fn (t) den Fejér-Kern7
1
Fn (t) = D0 (t) + . . . + Dn (t)
n+1
! 2
1 t sin(n + 1) 2t 1 sin (n+1)t
t Im exp i(n + 1) t = 2
. (9.31)
2(n + 1) sin 2
2 sin 2 2(n + 1) sin 2t
F0 (t)
F1 (t)
F2 (t)
F3 (t)
1
2
t
−π 0 π
Fn (t) ≥ 0,
1
Rπ
π Fn (t) dt = 1
−π
Für jedes δ > 0 gilt limk→∞ Fk (t) = 0 gleichmäßig auf [−π, −δ] ∪ [δ, π].
Beweis. Die Eigenschaft Fn (t) ≥ 0 ist klar wegen der Darstellung (9.31).
Rπ Rπ
Fn (t) dt = π folgt wegen Dn (t) dt = π und der Definition von Fn . Um die letzte Aussage zu zeigen, genügt es zu
−π −π
bemerken, dass auf Grund von (9.31)
1
Fn (t) ≤ , t ∈ [−π, π] \ {0}.
2(n + 1) sin2 t
2
❑
9.7.2 Satz (Fejér). Sei f : [−π, π] → C stetig, wobei f (π) = f (−π). Weiters sei f˜ die 2π-periodische Fortsetzung auf R.
Bezeichne σn die Folge der Cesaro-Mittel der Fourierreihe, dann gilt
n→∞
gleichmäßig für alle x ∈ R, d.h. σn −→ f˜ bzgl. k.k∞ . Für reellwertiges f sind die σn dabei auch reellwertig.
Beweis. Zuerst sei bemerkt, dass f auf [−π, π] wegen Satz 6.3.3 gleichmäßig stetig ist. Man sieht sofort, dass dann auch f˜
gleichmäßig stetig ist.
Wegen (9.30) und Lemma 9.7.1 ist die Behauptung äquivalent zu
Zπ
n→∞
π(σn (x) − f (x)) = f˜(x + t) − f˜(x) Fn (t) dt −→ 0,
−π
und zwar gleichmäßig in x. Sei also ǫ > 0 und wähle gemäß der gleichmäßigen Stetigkeit δ > 0 so, dass | f˜(x + t) − f˜(x)| < ǫ,
wenn nur |(x + t) − x| = |t| < δ.
Wegen Lemma 9.7.1 gibt es ein N ∈ N, sodass 0 ≤ Fn (t) < ǫ für alle t ∈ [−π, −δ] ∪ [δ, π] und n ≥ N. Wir erhalten
(durch mehrfache Verwendung von Lemma 9.7.1)
π
Z
˜f (x + t) − f˜(x)Fn (t) dt ≤
−π
Zδ Z Z π!
f˜(x + t) − f˜(x)F (t) dt + f˜(x + t) − f˜(x)F (t) dt ≤
−δ
n + n
−π δ
−δ
Zδ Z −δ Z π!
ǫ · Fn (t) dt + + 2 · k f˜k∞ · ǫ dt ≤ ǫ + 4π · k f˜k∞ · ǫ.
−π δ
−δ
Damit konvergiert σn gleichmäßig gegen f˜. Für reellwertiges f sind die Fourierkoeffizienten reell und daher auch die σn
reellwertig.
❑
√
9.7.3 Korollar. Für jedes stetige f : [−π, π] → C mit f (π) = f (−π) konvergiert seine Fourierreihe bezüglich k.k (= (., .))
gegen f .
Rπ
Beweis. Klarerweise ist kgk2 = −π |g(x)|2 dx ≤ 2πkgk2∞ , und somit kσn − f k → 0. Nach Lemma 9.4.6 ist die Partialsumme
sn der Fourierreihe von f das eindeutige Element in der linearen Hülle von 1, cos t, . . . , cos nt, sin t, . . . , sin nt mit kleinstem
Abstand zu f . Da auch σn in dieser Hülle liegt, gilt kσn − f k ≥ ksn − f k und somit sn → f bezüglich k.k.
❑
2
9.7.4 Bemerkung. Es gilt in der Tat, dass die Fourierreihe einer jeden Funktion f aus L [−π, π] und somit jeder Funktion
aus Q[−π, π] gegen f bezüglich k.k konvergiert. L2 [−π, π] ist dabei die Menge aller auf [−π, π] quadratisch Lebesgue-
integrierbaren Funktionen. Diese Art von Räumen wird in der Maßtheorie betrachtet.
Als weiteres Korollar erhalten wir folgenden wichtigen Satz.
9.7.5 Satz (Weierstraß). 8 Sei f eine stetige reellwertige (komplexwertige) Funktion auf dem Intervall [a, b]. Dann existiert
eine Folge (pn )n∈N von reellen (komplexen) Polynomen, sodass
lim pn = f
n→∞
gleichmäßig auf [a, b]. Anders ausgedrückt ist die Menge aller reellen (komplexen) Polynome auf [a, b] ist dicht im metri-
schen Raum C([a, b], R) bzw. C([a, b], C).
Beweis. Zunächst bearbeiten wir den komplexen Fall. Man überzeugt sich leicht mit Hilfe einer affinen Abbildung von
[−1, 1] auf [a, b], dass man oBdA. [a, b] = [−1, 1] annehmen kann. Nun sei g eine stetige Fortsetzung von f : [−1, 1] → C
auf [−π, π], sodass g(−π) = g(π).
Nach Satz 9.7.2 gibt es ein trigonometrisches Polynom
X
m
1
qn (t) = c + c j cos jt + d j sin jt mit kqn − gk∞ < .
j=1
2n
Da die Funktionen cos jt, sin jt und damit qn (t) in Potenzreihen mit Konvergenzradius +∞ entwickelbar sind, konvergiert
die Potenzreihe auf [−1, 1] sogar gleichmäßig (vgl. Satz 6.7.8). Nimmt man eine Partialsumme dieser Potenzreihe mit
1
hinreichend großem Index, so hat man ein Polynom pn (t), sodass kpn − qn k∞ < 2n . Mit der Dreiecksungleichung folgt
kpn − gk∞ < n1 und somit die Behauptung.
Den reellwertigen Fall zeigt man analog. Man muss nur beachten, dass man das reellwertige f zu einem stetigen
g : [−π, π] → R mit g(−π) = g(π) fortsetzen kann. Zu diesem sind dann auch die qn (t) reellwertig (vgl. Satz 9.7.2).
❑
Wir bringen hier einen Beweis des Satzes von Weierstraß ohne Mitteln der Fourieranalysis.
9.7.6 Satz (Weierstraß). Sei f eine stetige reellwertige Funktion auf dem Intervall [a, b]. Dann existiert eine Folge (Pn )n∈N
von reellen Polynomen, sodass
lim Pn = f
n→∞
gleichmäßig auf [a, b]. Anders ausgedrückt: Die Menge aller Polynome auf [a, b] ist dicht im metrischen Raum C([a, b], R).
Beweis. Wir können o.B.d.A. voraussetzen, dass [a, b] = [0, 1] ist, denn sonst betrachte f˜(x) := f (a + x(b − a)). Weiters sei
o.B.d.A. f (0) = f (1) = 0, denn sonst betrachte f˜(x) := f (x) − f (0) − x( f (1) − f (0)).
Sei also f : [0, 1] → R stetig mit f (0) = f (1) = 0. Setze f fort zu einer Funktion auf ganz R durch die Vorschrift
f (x) = 0, x < [0, 1], dann ist f sogar gleichmäßig stetig auf ganz R.
Betrachte die Funktion (n ∈ N)
(
cn (1 − x2 )n , x ∈ [−1, 1]
Qn (x) :=
0 , sonst
R1 1
R1
wobei cn so gewählt ist, dass Qn (x)dx = 1 gilt, also cn = (1 − x2 )n dx.
−1 −1
Wegen der Bernouillschen Ungleichung sieht man (1 − x2 )n ≥ 1 − nx2 für x ∈ [0, 1), und mittels Einsetzen auch für
x = 1. Aus
Z1 Z1
(1 − x2 )n dx = 2 (1 − x2 )n dx ≥
−1 0
√ √
Z n
1/ 1/
Z n
4 1
≥2 (1 − x2 )n dx ≥ 2 (1 − nx2 )dx = √ > √ ,
3 n n
0 0
√
erhalten wir cn < n. Es folgt für jedes δ > 0
√
Qn (x) = cn (1 − x2 )n ≤ n(1 − δ2 )n , δ ≤ |x|.
Z1
|Pn (x) − f (x)| = ( f (x + t) − f (x))Qn (t) dt ≤
−1
Z1
≤ | f (x + t) − f (x)|Qn (t) dt ≤
−1
Z−δ Zδ Z1
≤ 2M Qn (t) dt + ǫ Qn (t) dt + 2M Qn (t) dt ≤
−1 −δ δ
❑
9.7.7 Bemerkung. Die wesentlichen Eigenschaften von Qn sind
(i) Qn (x) ≥ 0,
R1
(ii) Qn (x)dx = 1,
−1
(iii) Für jedes δ > 0 gilt limn→∞ Qn (t) = 0 gleichmäßig auf 1 ≥ |t| ≥ δ,
68 KAPITEL 9. NORMEN, BANACHRÄUME UND FOURIERREIHEN
und natürlich, daß Qn Polynome sind, denn daher ist auch das Faltungsintegral Pn ein Polynom.
Man könnte glauben, dass diese Polynome nichts anderes sind, als Partialsummen einer Taylorreihe. Dem ist aber im
Allgemeinen nicht so, da sonst ja jede stetige Funktion gleichmäßiger Limes einer Potenzreihe wäre und somit unendlich
oft ableitbar.
Schließlich wollen wir noch bemerken, dass dieser Satz auch für komplexwertige stetige Funktionen auf einem kom-
pakten reellen Intervall und Polynome mit komplexen Koeffizienten gilt. Das sieht man unmittelbar ein, wenn man obigen
Satz auf den Realteil und auf den Imaginärteil der Funktion anwendet.
9.7.8 Beispiel. Sei f ∈ C([0, 1]) := C([0, 1], R) und gelte
Z1
f (t)tn dt = 0, n = 0, 1, 2, . . . . (9.32)
0
Dann folgt f = 0. Denn: Sei A die Menge aller aller reellen Polynome. Wegen (9.32) gilt
Z1
f h dt = 0, h ∈ A, (9.33)
0
R1
und nach dem Satz von Weierstraß gemeinsam mit Satz 8.7.2 folgt sogar f h dt = 0, h ∈ C([0, 1]). Insbesondere gilt
0
R1
f 2 dt = 0 und damit wegen der Stetigkeit von f auch f = 0.
0
R1
Man könnte ausgehend von (9.32) auch wie folgt argumentieren: Es gilt f (t)Qn (t − x) dt = 0, wobei die Qn so wie
0
im Beweis des Satzes von Weierstraß sind. Diese Ausdrücke konvergieren für n → ∞ gegen f (x), also folgt f = 0.
Kapitel 10
so heißt dieser die partielle Ableitung von f nach der Variablen xi an der Stelle x.
∂f
Anstatt ∂x i
(x) schreibt man auch Di f (x) oder f xi (x).
69
70 KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN
∂f
g′ (0) = (x).
∂v
Richtungsableitungen sind ihrer Natur nach also “eindimensional“. Denn man betrach-
tet ja f eingeschränkt auf die Strecke x + tv, t ∈ (−δ, δ). Insbesondere variiert bei
der Bildung der partiellen Ableitung nach xi wie in (10.1) beim Differenzenquotienten
f (x+tei )− f (x)
t im Vektor x + tei , t ∈ (−δ, δ) nur die i-te Koordinate.
e2 e2
v
x
x + te1 x
x + tv
e1 e1
Beweis. Sei t ∈ (−δ, δ), und setze y = x+tv, und wähle ρ > 0 so klein, dass2 Uρ·kvk∞ (y) ⊆
D. Betrachte die Vektoren
v0 := 0, vi := α1 e1 + . . . + αi ei , i = 1, . . . , n.
2 Wir versehen hier praktischerweise Rn mit k.k∞ .
10.1. PARTIELLE ABLEITUNGEN 71
X
n
g(t + s) − g(t) = f (y + sv) − f (y) = f (y + svi ) − f (y + svi−1 ) = (10.2)
i=1
n Z
X sαi
∂f
(y + svi−1 + τei ) dτ,
i=1 0 ∂xi
und daher
g(t + s) − g(t) X ∂ f
n
− αi (y) = (10.3)
s i=1
∂xi
X
n Z sαi !
1 ∂f ∂f
(y + svi−1 + τei ) − (y) dτ.
i=1
s 0 ∂xi ∂xi
Wegen (9.11) ist die Norm dieses Ausdruckes kleiner oder gleich
X
n
∂f ∂ f
|αi | sup
(y + svi−1 + τei ) − (y)
.
i=1 τ∈[0,sαi ] ∂xi ∂xi
∂f X ∂f n
(x) = αi (x). (10.4)
∂v i=1
∂xi
∂f
Insbesondere ist auch x 7→ ∂v (x) eine stetige Funktion von D nach X.
10.1.6 Bemerkung. Wir haben im Beweis von Lemma 10.1.4 die Stetigkeit der parti-
ellen Ableitungen (in allen Variablen gleichzeitig) benützt, um zu zeigen, dass (10.3)
gegen Null strebt, wenn s → 0.
Beachte, dass z.B. die Funktion aus Beispiel 9.1.8 stets Richtungsableitungen
in Richtung der Koordinatenachsen besitzt, die Richtungsableitung in Richtung v =
√1 (e1 + e2 ) jedoch bei 0 nicht existiert. Man kann also in Lemma 10.1.4 die Vorausset-
2
∂f
zung der Stetigkeit der ∂xi nicht weglassen.
∂f
Die Tatsache, dass für festes x die Richtungsableitung ∂v (x) in (10.4) linear von v
abhängt, legt folgende Begriffsbildung nahe.
72 KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN
Ist dabei m = 1, d.h. f ist R-wertig, so nennt man den Vektor d f (x)T auch den
Gradienten und schreibt auch grad f (x) dafür.
4. Ist f : D ⊆ Rn → X eine affine Abbildung, also von der Form x 7→ x0 + Ax mit
x0 ∈ X und einer linearen Abbildung A : Rn → X, so hat man
x0 + A(x + tei ) − x0 + A(x) A(tei )
d f (x)ei = lim = lim = A(ei ),
t→0 t t→0 t
und damit d f (x) = A für alle x ∈ D. Das ist eine Verallgemeinerung der Tatsache,
dass im eindimensionalen die Ableitung einer linearen Funktion kx + d konstant
gleich der Steigung k ist.
Diese Polarkoordinatenfunktion kennen wir schon aus dem ersten Semester (siehe De-
finition 6.8.12 und Bemerkung 6.8.13). Nun gilt offensichtlich
! ! ! !
∂T r cos t ∂T r −r sin t
= und = .
∂r t sin t ∂t t r cos t
10.1. PARTIELLE ABLEITUNGEN 73
Also sind ∂T ∂T
∂r und ∂t stetig, und damit T stetig partiell differenzierbar. Die Ableitung
T
dT (r, t) ∈ L(R , R2 ) ist damit
2
! !
r cos t −r sin t
dT = , (10.5)
t sin t r cos t
und die Richtungsableitung von T im Punkt (r, t)T in Richtung v = (α1 , α2 )T ist nach
Korollar 10.1.5
! ! ! !
∂T r r α1 α cos t − α2 r sin t
= dT = 1 .
∂v t t α2 α1 sin t + α2 r cos t
Versieht man L(Rn , X) mit der Abbildungsnorm (Rn versehen mit k.k∞ und X mit
k.k), so ist die Abbildung d f : D ⊆ Rn → L(Rn , X), x 7→ d f (x) stetig.
Beweis.
Für x, y ∈ gilt
Ist ρ > 0, sodass Uρ (x) = x + Uρ (0) ⊆ D und kzk < ρ, so ist ǫ(z) definiert, und
wir haben wegen (10.3) mit t = 0, s = kzk∞ , v = (α1 , . . . , αn )T := kzkz ∞ , wobei
offensichlich max j=1,...,n |α j | = kvk∞ = 1,
Z !
X n
1 sαi ∂ f ∂f
kǫ(z)k =
(x + svi−1 + τei ) − (x) dτ
≤
i=1 s 0 ∂xi ∂xi
X
n
∂f ∂f
|αi | sup
(x + svi−1 + τei ) − (x)
≤
i=1 τ∈[0,sαi ] ∂x i ∂x i
X
n
sup
∂ f (x + y) − ∂ f (x)
.
∂xi
i=1 kyk∞ ≤kzk∞ ∂xi
Dieser Ausdruck konvergiert wegen der Stetigkeit der partiellen Ableitungen für
z → 0 gegen 0.
❑
10.1.11 Bemerkung. Wir sehen also, dass sich f lokal bei x durch die affine Abbildung
x + z 7→ f (x) + d f (x)z approximieren lässt, wobei der Fehler mit kzk∞ ǫ(z) verhält-
nismäßig klein ist.
Ist X = Rm und stellt man sich f (D) als n-dimensionale Fläche im Rm vor, so ist
deshalb der affine Teilraum
{ f (x) + d f (x)z : z ∈ Rn }
10.1.12 Korollar. Ist f ∈ C 1 auf der offenen Menge D, so ist f stetig auf D.
∂f
10.1.13 Bemerkung. Man kann die Voraussetzung der Stetigkeit der ∂x i
in Korollar
10.1.12 zwar etwas abschwächen aber nicht gänzlich weglassen. Z.B. hat die Funktion
aus Beispiel 9.1.9 Richtungsableitungen bei 0 in allen Richtungen, ist aber selbst bei 0
unstetig.
Man kann auch umgekehrt folgendermaßen starten.
10.1.15 Fakta.
1. Wir haben oben gesehen, dass jede stetig partiell differenzierbaren Funktion ste-
tig differenzierbar ist.
10.1. PARTIELLE ABLEITUNGEN 75
Somit folgt aus stetig differenzierbar die Eigenschaft stetig partiell differenzier-
bar.
10.1.17 Bemerkung. Wenn X mit einer zweiten, zu k.k äquivalenten Norm versehen ist,
bleiben die partiellen Ableitungen und die Ableitung unverändert.
und
g(x + z) = g(x) + dg(x)z + kzk∞ ǫ̃(z).
❑
Wie im Eindimensionalen lassen sich auch im Mehrdimensionalen viele Funktio-
nen als Zusammenstzung von einfacheren Funktionen schreiben. Zur Berechnung der
Ableitung dient dann folgender Satz, der die bekannte Kettenregel verallgemeinert.
wobei die rechte Seite ein Hintereinanderausführen von linearen Abbildungen ist.
76 KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN
und falls x, x + z ∈ D, z , 0
Wegen limb→0 ǫ̃(b) = 0 und limz→0 ǫ(z) = 0 können wir durch ǫ(0) = 0 und ǫ̃(0) = 0
diese beiden Funktion so fortsetzen, dass sie bei z = 0 bzw. b = 0 stetig sind.
Ist nun a = g(x) und b so, dass a + b = g(x + z), so folgt aus der ersten Gleichung
und durch Einsetzen der zweiten
f g(x + z) =
f g(x) + d f g(x) g(x + z) − g(x) + kg(x + z) − g(x)k∞ ǫ̃(g(x + z) − g(x)) =
f g(x) + d f g(x) dg(x)z + kzk∞ ǫ(z) +
dg(x)z + kzk∞ ǫ(z)
∞ ǫ̃ g(x + z) − g(x) =
f g(x) + d f g(x) dg(x)z + kzk∞ γ(z),
wobei
1
γ(z) = d f g(x) (ǫ(z)) + kdg(x)( z) + ǫ(z)k∞ ǫ̃(g(x + z) − g(x)).
kzk∞
Wir haben
Wegen ǫ̃(0) = 0 und der Stetigkeit von ǫ̃ bei 0 folgt aus limz→0 (g(x+z) −g(x)) = 0, dass
limz→0 ǫ̃(g(x + z) − g(x)) = 0 (vgl. Proposition 6.1.4), und somit auch γ(z) → 0, z → 0.
Wir haben also d( f ◦ g)(x) = d f (g(x))dg(x) gezeigt. Um mit Hilfe von Satz
10.1.16 sicher zu gehen, dass f ◦ g ∈ C 1 , brauchen wir noch die Stetigkeit von
x 7→ d f (g(x))dg(x). Diese folgt aber aus Korollar 9.2.8.
❑
10.1.20 Bemerkung. Hat man n = 1 in Proposition 10.1.19, dh. D ⊆ R, so gilt dg(t) = g′ (t), wenn man g′ (t) mit der linearen
Abbildung ξ 7→ ξ · g′ (t) aus L(R, Rm ) identifiziert, siehe Fakta 10.1.8, 1. Entsprechendes gilt für ( f ◦ g)′ (t). Also liest sich
die Kettenregel in dem Fall als
( f ◦ g)′ (t) = d f g(t) g′ (t), t ∈ D. (10.7)
Wir nehmen im Fall n = 1 nun sogar an, dass g ∈ C1 (I) für irgendein Intervall I ⊆ R mit g(I) ⊆ D̃. Dann gilt (10.7) sogar
für in I enthaltene Randpunkte t von I.
Dazu setze man g auf ein etwas größeres Intervall J := I ∪ (t − ǫ, t + ǫ) durch g(s) := (s − t)g′ (t) + g(t) für s ∈ J \ I
fort. Man überprüft unmittelbar, dass g ∈ C1 (J), und dass für eine hinreichend kleine Wahl von ǫ > 0 auch g(J) ⊆ D̃. Die
Kettenregel angewandt auf g|(t−ǫ,t+ǫ) ergibt dann (10.7).
ebenfalls stetig ist. Weiters seien α, β : (a, b) → (c, d) zwei stetig differenzierbare
Funktionen. Wir wollen die Ableitung der Funktion
Z β(s)
I(s) := h(s, t) dt
α(s)
und
g : (a, b) ⊆ R → R3 , s 7→ (α(s), β(s), s)T
an. Die partiellen Ableitungen von f sind nach dem Hauptsatz und nach Korollar 8.7.11
stetig, und die Matrixdarstellung von d f (x) ist (x = (ξ, η, ζ)T )
∂f Z η
∂f ∂f ∂h
d f (x) = (x), (x), (x) = (−h(ζ, ξ), h(ζ, η), (ζ, t) dt).
∂ξ ∂η ∂ζ ξ ∂ζ
Auch dg(s) = (α′ (s), β′ (s), 1)T ist stetig, und die Kettenregel ergibt
d( f ◦ g)(s) = d f (g(s))dg(s) =
R β(s) α′ (s)
∂h
β′ (s) =
−h(s, α(s)) h(s, β(s)) α(s) ∂s (s, t) dt
1
Z β(s)
∂h
h(s, β(s))β′ (s) − h(s, α(s))α′ (s) + (s, t) dt = I ′ (s) .
α(s) ∂s
Siehe Fakta 10.1.8, 1.
Beweis. Wegen der Stetigkeit von t 7→ tx + (1 − t)y ist das Bild der kompakten Men-
ge [0, 1] ebenfalls kompakt. Somit hat die stetige Funktion z 7→ kd f (z)k darauf ein
Maximum.
Die Funktion g(t) := f (x + t(y − x)) ist nach Lemma 10.1.4 stetig differenzierbar
mit g′ (t) = d f (x + t(y − x))(y − x). Nach dem Hauptsatz (9.13) gilt
Z 1
k f (y) − f (x)k = kg(1) − g(0)k =
d f (x + t(y − x))(y − x) dt
≤
0
❑
78 KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN
Ist durch die implizite Gleichung g(ξ, η(ξ))T = 0 eine Funktion η(ξ) wohldefiniert?
Nein, denn stets erfüllt ja mit einer Zahl η(ξ) auch −η(ξ) diese Beziehung. Man sieht
ξ
0
η0 η(.)
ξ0
ξ
g η =0
Abbildung 10.2: Lokale Darstellbarkeit von g(ξ, η)T = 0 als Funktion η(ξ)
jedoch, dass, solange ξ0 , ±1 ist, zumindest lokal um ξ0 eine stetige (und differen-
zierbare) Funktion η(.) mit g(ξ, η(ξ)) = 0 definiert ist, wenn man sich nur im Punkt ξ0
selbst auf einen der beiden möglichen Werte η0 bzw. −η0 festlegt. Die Ableitung dieser
Funktion η lässt sich nun durch implizites Differenzieren ermitteln:
d ∂g ∂g
0= g(ξ, η(ξ)) = (ξ, η(ξ)) · 1 + (ξ, η(ξ)) · η′ (ξ) = 2ξ + 2η(ξ)η′ (ξ),
dξ ∂x1 ∂x2
ξ
also η′ (ξ) = − η(ξ) . Beachte, dass wegen ξ0 , ±1 die Funktion η(ξ) lokal bei ξ0 ungleich
0 ist.
Wie wir eben gesehen haben, ist es in keinster Weise klar, ob durch eine implizite
Gleichung g(ξ, η(ξ)) = 0 nun tatsächlich eine Funktion definiert ist. Man sieht in die-
∂g
sem Beispiel auch, dass die Bedingung ∂x 2
(ξ0 , η0 ) , 0 eine wesentliche Bedeutung für
die Auflösbarkeit der Gleichung g(ξ, η) = 0 nach η zu haben scheint. Der in diesem
Abschnitt bewiesene Hauptsatz über implizite Funktionen (Satz 10.2.4) gibt die exakte
und allgemein formulierte Bestätigung dieser Beobachtung.
Doch zunächst benötigen wir den Banachschen Fixpunktsatz. 4
10.2.3 Satz. Sei (M, d) ein vollständiger metrischer Raum. Weiters sei T : M → M
eine Abbildung, die
d(T x, T y) ≤ q · d(x, y), x, y ∈ M,
mit einem festen 0 ≤ q < 1 erfüllt.
4 Stefan Banach, geb. 30.3.1892 Krakow, gest.31.8.1945 Lwow (Lemberg)
80 KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN
qn
d(yn , z) ≤ d(y1 , y0 ).
1−q
denn für n = 0, ist sie klar, und der Induktionsschritt folgt aus d(yn+1 , yn+2 ) =
d(T yn , T yn+1 ) ≤ q d(yn , yn+1 ) ≤ qn+1 d(y0 , y1 ).
Sei nun n ≤ m gegeben. Dann folgt
qn
≤ (qn + . . . + qm−1 ) d(y0 , y1 ) ≤ d(y0 , y1 ),
1−q
P
da ja wegen 0 ≤ q < 1 die geometrische Reihe ∞ k
k=0 q konvergiert. Also ist die Folge
(yn )n∈N eine Cauchy-Folge, und es existiert der Grenzwert z := limn→∞ yn . Dass z ein
Fixpunkt ist, folgt wegen der Stetigkeit von T aus
❑
Neben dem nun folgenden Hauptsatz über implizite Funktionen findet der Banach-
sche Fixpunktsatz auch Anwendung in der Theorie der Differentialgleichungen.
Die Ausgangssituation beim Hauptsatz über implizite Funktionen ist die, dass man
eine stetig differenzierbare Funktion F : D → Rm mit einer offenen Menge D ⊆ Rn+m
hat. Wir schreiben die Elemente von Rn+m als (x, y), wobei x ∈ Rn , y ∈ Rm .
Für (x, y) ∈ D schreiben wir dF(x, y) ∈ L(Rn+m , Rm ) als m × (n + m) Matrix. Nun
nehmen wir die ersten n Spalten und fassen sie zur Matrix dF1 (x, y) zusammen. Ent-
sprechend seien dF2 (x, y) die letzten m Spalten. Man hat also dF(x, y) =
∂F1 ∂F1 ∂F1 ∂F1
∂x1 (x, y) ··· ∂xn (x, y) ∂xn+1 (x, y) ···
∂xn+m (x, y)
.. .. .. ..
. . . .
∂Fm ∂Fm ∂Fm ∂Fm
∂x1 (x, y) · · · ∂xn (x, y) (x, y) · · · (x, y)
| {z } | ∂xn+1 {z ∂xn+m }
=dF1 (x,y) =dF2 (x,y)
Mit dF(x, y) sind klarerweise auch dF1 (x, y) und dF2 (x, y) stetig in (x, y).
Ist y fest, so ist x 7→ dF1 (x, y) ∈ Rm×n nichts anderes, als die Ableitung der Funktion
x 7→ F(x, y) als Funktion von x. Entsprechendes gilt für y 7→ dF2 (x, y) ∈ Rm×m .
10.2. HAUPTSATZ ÜBER IMPLIZITE FUNKTIONEN 81
10.2.4 Satz (Hauptsatz über implizite Funktionen5). Sei D ⊆ Rn+m offen, und sei F :
D → Rm , F ∈ C 1 . Weiters sei (a, b) ∈ D, sodass F(a, b) = 0 und sodass dF2 (a, b)
invertierbar ist, d.h. !m
∂Fi
det (a, b) , 0.
∂xn+ j i, j=1
∂g ∂F
(a) = −dF2 a, g(a) −1 a, g(a) .
∂x j ∂x j
(iv) dF2 u, v für alle (u, v) ∈ U × V invertierbar ist; die Funktion g ist auf U stetig
differenzierbar und es gilt
−1
dg(x) = −dF2 x, g(x) dF1 x, g(x) .
Beweis.
(i) Sei B = dF2 (a, b). Die gesuchte Funktion soll (10.10) erfüllen. Man kann das als
Fixpunktgleichung anschreiben:
g(x) − B−1 F x, g(x) = g(x). (10.11)
Um die Existenz und die Eindeutigkeit herzuleiten, werden wir den Banachschen
Fixpunktsatz bemühen.
Dazu sei ρ > 0 so klein, dass Uρ (a, b) ⊆ D (bzgl. k.k∞ ) und dass
1
kB − dF2 (x, y)k ≤ , (x, y) ∈ Uρ (a, b). (10.12)
2kB−1 k
Das ist möglich wegen der Stetigkeit von (x, y) 7→ dF2 (x, y) bei (a, b)6. Nun
wählen wir δ > 0, δ ≤ ρ so, dass
ρ
kF(x, b)k∞ ≤ , x ∈ Uδ (a), (10.13)
4kB−1 k
und setzen U := Uδ (a), V := Uρ (b).
Sei h0 : U → Rm die identische Funktion x 7→ b. Nun betrachten wir die ab-
geschlossene Kugel K 2ρ (h0 ) =: M um h0 mit Radius ρ2 in dem Banachraum
C(U, Rm ) (versehen mit der Supremumsnorm k| f k| := sup x∈U k f (x)k∞ ), welche
5
Oft auch zitiert als “Implicit function theorem“
6 Wir wissen übrigens aus Korollar 9.3.3, dass für diese (x, y) auch die Matrix dF2 (x, y) invertierbar ist.
82 KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN
für sich selbst versehen mit d(h1 , h2 ) := k|h1 − h2 k| ein vollständig metrischer
Raum ist.
Für h ∈ M und x ∈ U gilt kh(x) − bk∞ ≤ k|h − h0 k| ≤ 2ρ und daher x, h(x) ∈
Uρ (a, b) ⊆ D. Also können wir definieren
T (h)(x) := h(x) − B−1 F x, h(x) .
Als Zusammensetzung von stetigen Funktionen ist T (h) stetig. Wir werden zei-
gen, dass T (h) wieder in M liegt, und dass k|T (h1 ) − T (h2 )k| ≤ 12 k|h1 − h2 k|.
Dazu betrachte für ein festes x ∈ Uδ (a) die Funktion
Wegen der Stetigkeit und weil B = dF2 (a, b), strebt ψ(η) gegen Null, wenn η → 0.
Da Kρη (b) eine konvexe Teilmenge von Rm ist, folgt aus Korollar 10.1.24, dass
(y, z ∈ Kρη (b), x ∈ Kδη (a))
Für kzk∞ < δ gilt wegen F(a, g(a)) = F(a + z, g(a + z)) = 0
1 1
ψ max( kzk∞ , kg(a + z) − g(a)k∞) kg(a + z) − g(a)k∞+
δ ρ
| {z }
=:β(z)
bzw.
kB−1 k(kdF1 (a, g(a))k + kǫ1 (z)k∞ )
kg(a + z) − g(a)k∞ ≤ kzk∞ ,
1 − β(z)
wobei limz→0 β(z) = 0. Addieren wir zu (10.16) den Ausdruck B−1 dF1 (a, g(a))z,
so folgt wieder aus (10.15)
kg(a + z) − g(a) + B−1dF1 (a, b)k∞ ≤ β(z)kg(a + z) − g(a)k∞ + kB−1 k kǫ1 (z)k∞ kzk∞ ≤
!
β(z)kB−1 k(kdF1 (a, g(a))k + kǫ1 (z)k∞ )
+ kB−1 k kǫ1 (z)k∞ kzk∞ .
1 − β(z)
Da für z → 0 der Klammerausdruck gegen Null strebt, erhalten wir die Dif-
ferenzierbarkeit von g bei a mit der Ableitung dg(a) = −B−1 dF1 (a, b) =
dF2 (a, b)−1dF1 (a, b).
(iv) Der letzte Punkt folgt ganz leicht, wenn man das schon Bewiesene nochmals
betrachtet. Ist a′ ∈ U, so sei b′ = g(a′ ).
Wir haben schon in einer Fußnote gesehen, dass dF2 (a′ , b′ ) invertierbar ist. Also
können wir das schon Bewiesene auf (a′ , b′ ) ∈ U × V anwenden, und erhalten
eine Kugel U ′ ⊆ U um a′ und eine Kugel V ′ ⊆ V um b′ , sowie eine Funktion
g′ : U ′ → V ′ mit g′ (a′ ) = b′ und F x, g′ (x) = 0, x ∈ U ′ .
Nach (ii) muss g′ (x) = g(x), x ∈ U ′ gelten, und nach (iii) ist
dg(a′ ) = dg′ (a′ ) = −dF2 a′ , g(a′ ) −1 dF1 a′ , g(a′ ) .
Die rechte Seite ist nach Korollar 9.3.3 aber stetig in a′ . Also ist g stetig differen-
zierbar und die Ableitung lässt sich wie behauptet berechnen.
84 KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN
wobei c1 , c2 , c3 > 0 vorgegeben sind, und untersuchen die Lösungen der Gleichung
f (ζ1 , ζ2 , ζ3 )T = 0. Die Nullstellenmenge F := {z ∈ R3 : f (z) = 0} von f bildet in
diesem Beispiel offenbar ein Ellipsoid. Sei α = (α1 , α2 , α3 )T eine Lösung von f (z) =
0. Wir wollen die Gleichung f (ζ1 , ζ2 , ζ3 )T = 0 lokal bei α nach ζ3 auflösen. Anders
ausgedrückt, wir fragen ob, man die durch die implizite Gleichung f (z) = 0 gegebene
Fläche F lokal um den Punkt α welcher auf ihr liegt, in der expliziten Form ζ3 =
g(ζ1 , ζ2 )T darstellen kann. Dazu wenden wir den Hauptsatz über implizite Funktionen
an, und zwar mit der folgenden Rollenvergabe: m = 1, n = 2, y = ζ3 , x = (ζ1 , ζ2 )T ,
b = α3 , a = (α1 , α2 )T . Die Voraussetzung f ∈ C 1 ist in unserem Fall klarerweise erfüllt,
f ist ja ein Polynom. ∂ f Die entscheidende Funktionaldeterminante ist die Determinante
der 1 × 1-Matrix ∂ζ 3
(α) , also
∂f
(α) = 2c3 α3 .
∂ζ3
Liegt der Punkt α nicht am Äquator des Ellipsoids, d.h. ist α3 , 0, so existiert ei-
ne offene Umgebung U ⊆ R2 von (α1 , α2 )T und eine C 1 -Funktion g : U → R mit
g(α1 , α2 )T = α3 und f (ζ1 , ζ2 , g(ζ1 , ζ2 )T )T = 0 für alle (ζ1 , ζ2 )T ∈ U. Liegt α dagegen
am Äquator, so können wir den Hauptsatz nicht anwenden. Tatsächlich ist in solchen
Punkten ein Auflösen nach ζ3 auch nicht möglich. Wir bemerken einen Unterschied
ξ3
α1
α2
U
ξ2
0
ξ1
Abbildung 10.3: Darstellung eines Teils von F als Graph einer Funktion g(ζ1 , ζ2 )T
zwischen der impliziten und expliziten Darstellung der Fläche F . Die implizite Glei-
chung f (z) = 0 definiert die Fläche global, d.h. in ihrer Gesamtheit. Eine explizite
Darstellung, z.B. in der Form ζ3 = g(ζ1 , ζ2 )T ist nur lokal, d.h. für gewisse Teilstücke
10.2. HAUPTSATZ ÜBER IMPLIZITE FUNKTIONEN 85
der Fläche möglich, und nicht einmal um beliebige Punkte der Fläche (beim Äquator
geht’s ja nicht). Eine explizite Darstellung hat also den Nachteil immer nur auf klei-
nen Teilen zu funktionieren und Punkten die geometrisch gar nicht ausgezeichnet sind
(Äquator) einen anderen Stellenwert zu verleihen als allen anderen. Natürlich hat sie
dem gegenüber den Vorteil, dass man mit einer expliziten Darstellung besser rechnen
kann.
In unserem Beispiel kann man für jeden Punkt α ∈ F lokal nach zumindestens
einer Variablen ζ1 , ζ2 oder ζ3 auflösen. In der Tat ist einer der Werte α1 , α2 , α3 si-
cher nicht Null. Löst man z.B. nach ζ2 auf, so erhält man eine Funktion ĝ, sodass
f (ζ1 , ĝ(ζ1 , ζ3 )T , ζ3 )T = 0 für (ζ1 , ζ3 ) lokal um (α1 , α3 ). Man hat also sicher lokal um
jeden Punkt α ∈ F eine Parameterdarstellung der Form: entweder ζ1 = t, ζ2 = u, ζ3 =
g(t, u)T oder ζ1 = t, ζ3 = u, ζ2 = ĝ(t, u)T oder auch ζ2 = t, ζ3 = u, ζ1 = g̃(t, u)T . Will
man F global erfassen, so hat man die Gesamtheit aller dieser lokalen Ausschnitte zu
betrachten (wie man in einem Weltatlas, um die gesamte Erde zu sehen, die Karten von
allen Ländern und Meeren anschauen muss).
ξ3
h U
ξ2
h̃ ĥ
Û
Ũ
ξ1
( (
U ⊆ R2 → R3 Û ⊆ R2 → R3
h: , ĥ : ,
(t, u)T 7→ (t, u, g(t, u)T )T (t, u)T 7→ (t, ĝ(t, u)T , u)T
(
Ũ ⊆ R2 → R3
h̃ : .
(t, u)T 7→ (g̃(t, u)T , t, u)T
In unserem Beispiel kann man das gesamte Ellipsoid F beschreiben durch die sechs
Teilstücke “obere Hälfte“, “untere Hälfte“, “rechte/linke/vordere/hintere Hälfte“. Auf
diesen hat man die expliziten Darstellungen
q
(ζ1 , ζ2 )T 7→ + 1 − aζ12 − bζ22 , obere Hälfte
q
(ζ1 , ζ2 )T 7→ − 1 − aζ12 − bζ22 , untere Hälfte
86 KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN
q
(ζ2 , ζ3 )T 7→ + 1 − bζ22 − cζ32 , rechte Hälfte
usw. . Solche Teilmengen, die lokal derart beschrieben werden können werden als zwei-
dimensionale Mannigfaltigkeiten im R3 bezeichnet. Diese werden in der Analysis 3
Vorlesung ausführlicher behandelt werden.
Die affine Abbildung f ist genau dann injektiv (und damit aus Dimensionsgründen
bijektiv), wenn det(ci j )ni, j=1 , 0. In diesem Fall existiert die Inverse f −1 von f oder,
anders ausgedrückt, die Gleichung f (u) = v lässt sich in eindeutiger Weise nach v
auflösen.
Die affine Abbildung f ist stetig differenzierbar mit d f (u) = (ci j )ni, j=1 . Ausschlagge-
bend für die Invertierbarkeit in unserer speziellen Situation ist also die Invertierbarkeit
von d f (u).
Es ist eine wesentliche Feststellung, dass im Allgemeinen zumindestens lokal das
gleiche Verhalten vorliegt.
10.3.1 Satz (Satz über die Inverse Funktion). Sei f : C → Rn stetig differenzierbar auf
der offenen Menge C ⊆ Rn . Weiters sei c ∈ C, sodass
det d f (c) , 0,
und sei E ⊆ Rn offen mit d := f (c) ∈ E. Dann existieren offene Mengen O ⊆ C und
R ⊆ E mit den folgenden Eigenschaften:
(i) c ∈ O und d ∈ R.
10.3.2 Bemerkung. Dieser Satz gibt ein lokales Analogon zu obiger Bemerkung über
affine Funktionen. Denn ist f affin, so kann man O = Rn und R = Rn wählen. Im allge-
meinen muss man sich jedoch wirklich auf gewisse offene Umgebungen O und R von
c bzw. d einschränken um Existenz und Differenzierbarkeit der Inversen zu erhalten.
Beweis. (von Satz 10.3.1) Wir wenden Satz 10.2.4 mit x = v, y = u, a = d, b = c
auf die Funktion F(x, y) = f (y) − x definiert auf der Menge D := E × C an. Diese
ist eine stetig differenzierbare Funktion von E × C ⊆ Rn × Rn = Rn+n nach Rn mit
dF(x, y) = − I|d f (y) .
Verwenden wir die Notation von Satz 10.2.4, so gilt
f
R
C
c f |O d = f (c)
O
g = ( f |O )−1
Bei (a, b) = (d, c) ist dF2 (a, b) = d f (c) voraussetzungsgemäß invertierbar. Nach Satz
10.2.4 gibt es offene Mengen U ∋ a und V ∋ b mit U × V ⊆ E × C, dh. U ⊆ E, V ⊆ C,
sowie eine C 1 -Funktion g : U → V mit
F x, g(x) = 0, dg(x) = −dF2 x, g(x) −1 dF1 x, g(x) , x ∈ U.
als Vereinigung offener Mengen wieder offen (vgl. Proposition 5.1.6). Der zweite Teil
des Korollars folgt unmittelbar aus Satz 10.3.1, (iii).
❑
mit C = R+ × R ⊆ R2 . In (10.5) aus Beispiel 10.1.9 haben wir dT (r, t)T berechnet.
Die Determinante davon ist r(cos t) + r(sin t) = r > 0 und somit für alle (r, t)T ∈ C
2 2
regulär.
Nach Korollar 10.3.3 ist T (C) offen in R2 . Aus dem ersten Semester (vgl. Definition
6.8.12 und Bemerkung 6.8.13) wissen wir, dass in der Tat
Sei nun (ρ, τ)T ∈ C fest, so gibt es nach Satz 10.3.1 offene Teilmengen O und R von R,
sodass (ρ, τ)T ∈ O, T (ρ, τ)T ∈ R und sodass T |O : O → R bijektiv und in beide Rich-
tungen stetig differenzierbar ist. Die Ableitung von T −1 im Punkt (ξ, η) = T (r, t)T ∈ R,
2 2 2
dh. r = ξ + η und r cos t = ξ, r sin t = η, ist dabei
!−1
−1 T T −1 cos t −r sin t
dT (ξ, η) = dT (r, t) = =
sin t r cos t
! √ ξ √ η2
1 r cos t r sin t 2 2 ξ +η2
= ξ η+η .
r − sin t cos t − ξ2 +η2 2
ξ
2
ξ +η
Mit O ist auch O ∩ (R+ × (τ − π, τ + π)) offen in R2 . Schränkt man T auf diese Menge
ein, so folgt aus Korollar 10.3.3, dass T (O′ ) =: R′ ⊆ R offen in R2 ist. Klarerweise
ist auch T |O′ : O′ → R′ bijektiv und in beide Richtungen stetig differenzierbar. Somit
können wir das ursprüngliche O und R schon so wählen, dass O ⊆ R+ × (τ − π, τ + π).
In diesem Fall wissen wir schon aus Bemerkung 6.8.13, dass T |O injektiv ist. In der
Tat bildet T die ganze Menge R+ × (τ − π, τ + π) bijektiv auf
( ! )
cos(τ + π)
R2 \ s : s ∈ [0, +∞)
sin(τ + π)
ab (siehe Proposition 6.8.14). T als Abbildung von C nach R2 ist dagegen nicht injektiv.
∂f
: D → X.
∂xi
Also macht es Sinn, von der Differenzierbarkeit o.ä. dieser Funktion zu sprechen. Exis-
tiert an einer Stelle x ∈ X die Ableitung
!
∂ ∂f
(x),
∂x j ∂xi
2
so spricht man von einer zweiten Ableitung von f und schreibt kürzer ∂x∂j ∂x
f
i
, d.h. f wird
zuerst nach xi differenziert und dann nach x j . Höhere partielle Ableitungen definiert
10.4. HÖHERE ABLEITUNGEN 89
man induktiv fortfahrend: Ist schon definiert, was partielle Ableitungen k-ter Ordnung
sind, und ist (i1 , i2 , . . . , ik+1 ) ein (k + 1)-Tupel von Indizes il ∈ {1, . . . , n}, so setzt man
!
∂k+1 f ∂ ∂k f
(x) := (x),
∂xik+1 ∂xik · · · ∂xi1 ∂xik+1 ∂xik · · · ∂xi1
falls diese Ableitungen existieren.
10.4.1 Definition. Sei f : D ⊆ Rn → X definiert auf der offenen Menge D und sei
k ∈ N. Wir sagen, f ist k-mal stetig differenzierbar auf D, und schreiben f ∈ C k oder
f ∈ C k (D), falls alle partiellen Ableitungen k-ter Ordnung von f auf ganz D existieren
und stetig sind.
Falls f ∈ C k (D) für alle k ∈ N, so schreibt man f ∈ C ∞ oder f ∈ C ∞ (D) für diesen
Sachverhalt.
10.4.2 Bemerkung. Bezeichnet man mit C(D) die Menge aller stetigen Funktionen auf
D, dann gilt
C(D) ⊇ C 1 (D) ⊇ . . . ⊇ C k (D) ⊇ C k+1 (D) ⊇ . . . .
Die erste Inklusion gilt wegen Korollar 10.1.12. Zu den anderen Inklusionen:
Ist f ∈ C k+1 (D), dann existieren alle partiellen Ableitungen (k + 1)-ter Ordnung.
Nach der induktiven Definition der (k + 1)-ten partiellen Ableitungen müssen auch alle
k
partiellen Ableitungen k-ter Ordnung existieren. Sei g = ∂xi ∂···∂x
f
i
eine solche. Dann
k 1
existieren alle partiellen Ableitungen von g und sind stetig, d.h. g ∈ C 1 . Wegen C 1 (D) ⊆
C(D) folgt, dass g selbst stetig ist, vgl. Korollar 10.1.12. D.h. f ∈ C k (D).
10.4.3 Satz (Satz von Schwarz7 ). Sei f ∈ C 2 (D), D ⊆ Rn , und seien i, j ∈ {1, . . . , n},
2 2
sodass ∂x∂i ∂xf j und ∂x∂j ∂xf j auf ganz D existieren und stetig sind. Dann gilt
∂2 f ∂2 f
= .
∂xi ∂x j ∂x j ∂xi
Mehrmalig angewandt besagt dieser Satz: Ist f ∈ C k (D), so kommt es bei der Bil-
dung einer partiellen Ableitung (höchstens k-ter Ordnung) nicht darauf an in welcher
Reihenfolge differenziert wird.
Beweis. (von Satz 10.4.3) Sei x ∈ D und δ > 0, so dass Uδ (x) ⊆ D (Rn ist mit k.k∞
versehen). Nach dem Hauptsatz der Differential- und Integralrechnung (siehe (9.13))
gilt (|ξ|, |η| < δ)
Z ξ
∂f
f (x + ξei + ηe j ) − f (x + ηe j ) = (x + ζei + ηe j ) dζ.
0 ∂x i
2
Die Ableitung des Integranden nach η ist gerade ∂x∂j ∂x f
i
(x + ζei + ηe j ), und daher stetig in
ζ und η. Somit können wir (9.15) (siehe auch Korollar 8.7.11) anwenden und erhalten
bei der Ableitung obiger Gleichung nach η
Z ξ 2
∂f ∂f ∂ f
(x + ξei + ηe j ) − (x + ηe j ) = (x + ζei + ηe j ) dζ.
∂x j ∂x j 0 ∂x j ∂xi
!
∂1+l r cos t + l π
T = i exp(it)
l 2 ,
∂r ∂tl t sin t + l π2
und !
∂k+l r
T = 0, k ≥ 2.
∂rk ∂tl t
∂f X n
∂f
(x) = α1,l (x).
∂v1 l=1
∂x l
∂ ∂ Xn
∂ ∂f X n X n
∂2 f
f (x) = α1,l (x) = α1,l1 α2,l2 (x).
∂v2 ∂v1 l=1
∂v2 ∂xl l =1 l =1
∂xl1 ∂xl2
1 2
Macht man das nun insgesamt k-mal, so sieht man, dass die k-malige Hintereinander-
ausführung der Richtungsableitungen nach v1 bis vk existiert und mit
∂ ∂ X n
∂k f
... f (x) = α1,l1 · · · · · αk,lk (x) (10.17)
∂vk ∂v1 l ,...,l =1
∂xl1 . . . ∂xlk
1 k
der Stelle x.
Im Fall n = 1, also D ⊆ R, gilt dk f (x)(v1 , . . . , vk ) = v1 · · · · · vk f (k) (x).
Für einen späteren Gebrauch stellen wir noch heraus, dass wenn y, h ∈ Rn mit
y + th ∈ D, t ∈ [0, 1], die k-te (einseitige) Ableitung der Funktion
10.4.6 Beispiel. Wir betrachten die Funktion T aus Beispiel 10.4.4. Lineare Abbildung
dT (r, t)T haben wir in (10.5) berechnet.
Für m ∈ N, m ≥ 2 folgt aus Beispiel 10.4.4 mit x1 = r, x2 = t, α j,1 = ρ j , α j,2 = τ j
! ! !! X
2 !
m r ρ1 ρm ∂m T r
d T ,..., = α1,l1 · · · · · αm,lm =
t τ1 τm ∂xl1 . . . ∂xlk t
l1 ,...,lm =1
! !
∂m r ∂m r
(ρ1 τ2 . . . τm + · · · + τ1 . . . τm−1 ρm ) T + τ1 · · · · · τm m T =
∂r ∂tm−1 t ∂t t
cos t + (m − 1) π r cos t + m π
(ρ1 τ2 . . . τm + · · · + τ1 . . . τm−1 ρm ) 2
+ τ1 · · · · · τm 2
.
sin t + (m − 1) 2π r sin t + m π2
Man sieht unmittelbar aus (10.5), dass diese Beziehung auch für m = 1 richtig ist.
Z1
1
Rq (x) = (1 − t)q−1 · dq f (1 − t)y + tx (x − y, . . . , x − y) dt. (10.18)
(q − 1)! | {z }
0 q−mal
X
q−1 (l) Z1
φ (0) (1 − t)q−1 (q)
φ(1) = φ(0) + + φ (t) dt.
l=1
l! (q − 1)!
0
Aus Bemerkung 10.4.5 wissen wir, dass φ(l) (t) = dk f (y + th)(h, . . . , h), woraus
unmittelbar die behauptete Entwicklung folgt.
❑
10.4.8 Bemerkung. Den Ausdruck
X
q−1
1 l
pq−1 (x) = f (y) + d f (y)(x − y, . . . , x − y)
l! | {z }
l=1
l−mal
(ii) Ist D konvex und f sogar in C ∞ (D) und gelte (10.19) für alle q und alle u ∈ D, so
konvergiert die Reihe
X∞
1 l
d f (y)(x − y, . . . , x − y)
l! | {z }
l=1
l−mal
Z1
nq nq q
C khkq (1 − t)q−1 dt = C khk .
(q − 1)! ∞ q! ∞
0
q
(ii) Bei fest gewähltem y konvergiert nq! kx − ykq und damit Rq (x) für jedes x gegen
0. In der Tat geht diese Konvergenz für x in beschränkten Teilmengen von D
gleichmäßig von statten.
10.4.10 Beispiel. Sei T : D → R2 wie in Beispiel 10.4.4, wobei aber jetzt D : (0, α)×R
für irgend ein festes α ∈ R+ , α > 1. Wendet man Satz 10.4.7 für den Punkt y = (r, t)T =
(1, 0) an, so erhalten wir mit x − y = (ρ, τ)T aus Beispiel 10.4.6
q−1
X 1 l
T (x) = T (y) + d T (y)(x − y, . . . , x − y) + Rq (x) =
l! | {z }
l=1
l−mal
! q−1 ! !!
1 X1 l−1 cos(l − 1) 2
π
l cos l 2
π
= + lρτ +τ + Rq (x). (10.20)
0 l! sin(l − 1) π2 sin l π2
l=1
In Beispiel 10.4.4 haben wir insbesondere gesehen, dass (10.19) für C = α und k.k =
k.k∞ erfüllt ist. Also konvergiert die entsprechende Reihe in (10.20) gegen T (x).
Am Ende dieses Kapitels wollen wir nochmals mit dem Hauptsatz über implizite Funktionen und den Umkehrsatz in
Zusammenhang mit höheren Ableitungen betrachten.
10.4.11 Lemma. Sei I ⊆ R ein Intervall, X und Y Banachräume und h : I → L(X, Y), sodass h(t) für alle t ∈ I invertierbar
ist, wobei (h(t))−1 ∈ L(Y, X). Ist dann h in einem Punkt x ∈ I differenzierbar, so auch t 7→ (h(t))−1 , wobei
′
(h(x))−1 = −h(x)−1 h′ (x)h(x)−1 .
1 1
(h(t))−1 − (h(x))−1 = −(h(t))−1 h(t) − h(x) (h(x))−1 .
t−x t−x
Da h bei x differenzierbar ist, ist sie dort auch stetig. Wegen Korollar 9.3.3 ist auch die Zusammensetzung t 7→ (h(t))−1 bei
x stetig. Aus Lemma 9.2.7 folgt, dass für t → x obiger Ausdruck gegen −h(x)−1 h′ (x)h(x)−1 konvergiert.
❑
10.4.12 Lemma. Sei X ein Banachraum und seien D ⊆ Rm , I ⊆ R offen. Weiters seien H : I × D → X - wir schreiben
H(x, y1 , . . . ym ) - sowie h : I → D (⊆ Rm ) stetig differenzierbar, so ist auch t 7→ H(t, h(t)) stetig differenzierbar auf I mit
Ableitung
d ∂H Xm
∂H
H(t, h(t)) = (t, h(t)) + hl (t)′ (t, h(t))
dt ∂x l=1
∂yl
wobei h = (h1 , . . . , hm )T .
Beweis. φ : t 7→ H(t, h(t)) ist die Hintereinanderausführung von t 7→ (t, h(t)) und H. Aus der Kettenregel folgt
! Xm
d 1 ∂H ∂H
H(t, h(t)) = dφ(t)1 = dH(t, h(t)) ′ = (t, h(t)) + hl (t)′ (t, h(t)).
dt h (t) ∂x ∂yl
l=1
❑
10.4.13 Proposition. Mit den selben Voraussetzungen und der selben Notation wie im Hauptsatz über implizite Funktionen,
Satz 10.2.4, sei F ∈ Ck (D) mit k ∈ N, k ≥ 2. Dann ist auch die Funktion g : U → V immer k-mal stetig differenzierbar.
94 KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN
Beweis. Wir wissen aus Satz 10.2.4, dass g zumindest einmal stetig differenzierbar ist, wobei (u ∈ U)
dg(u) = −dF2 u, g(u) −1 dF1 u, g(u) .
Nach Voraussetzung sind (x, y) 7→ dF1 (x, y) und (x, y) 7→ dF2 (x, y) stetig partiell differenzierbar. Wegen (9.10), Lemma
10.4.11 und Lemma 10.4.12 ist u 7→ dg(u) partiell differenzierbar mit
X ∂
m
∂ ∂ ∂
dg(u) = dF2 u, g(u) −1 dF2 u, g(u) + gl (u) dF2 u, g(u) dF2 u, g(u) −1 dF1 u, g(u)
∂u j ∂x j l=1
∂u j ∂yl
X ∂
m
∂ ∂
−dF2 u, g(u) −1 dF1 u, g(u) + gl (u) dF1 u, g(u) ,
∂x j l=1
∂u j ∂yl
wobei g = (g1 , . . . , gm )T . Nach Korollar 9.1.3 und Korollar 9.2.8 ist diese Funktion stetig in u, womit g ∈ C2 (U). Außerdem
ist ∂u∂ dg(u) endliche Summe von endlichen Produkten von dF2 u, g(u) −1 , dF1 u, g(u) und von gewissen ersten partiellen
j
Ableitungen
∂ ∂ ∂ ∂ ∂
dF1 u, g(u) , dF1 u, g(u) , dF2 u, g(u) , dF2 u, g(u) , gl (u), l = 1, . . . , m.
∂x j ∂yl ∂x j ∂yl ∂u j
∂ ∂
Ist nun k ≥ 3, so sind letztere Funktionen nochmals stetig partiell differenzierbar, und man zeigt wie oben, dass ∂ui ∂u j dg(u)
existiert und stetig ist. Außerdem ist diese Funktion wieder eine endliche Summe von endlichen Produkten von obigen
Funktionen (mit i statt j) und dazu von zweiten partiellen Ableitungen
∂2 ∂2 ∂2
dF1 u, g(u) , dF1 u, g(u) , dF1 u, g(u) ,
∂xi ∂x j ∂xi ∂yl ∂yr ∂yl
∂2 ∂2 ∂2 ∂2
dF2 u, g(u) , dF2 u, g(u) , dF2 u, g(u) , gl (u).
∂xi ∂x j ∂xi ∂yl ∂yr ∂yl ∂ui ∂u j
Damit ist g ∈ C3 (U). Man fährt induktiv fort und erhält schließlich g ∈ Ck (U).
❑
10.4.14 Korollar. Mit den selben Voraussetzungen und der selben Notation wie im Umkehrsatz, Satz 10.3.1, sei f ∈ Ck (D)
mit k ∈ N, k ≥ 2. Dann ist auch die Funktion g : R → O immer k-mal stetig differenzierbar.
Beweis. Im Beweis von Satz 10.3.1 haben wir Satz 10.2.4 auf F(x, y) = f (y) − x angewandt, um die Funktion g als Lösung
von F(x, f (x)) = 0 zu erhalten. Aus Proposition 10.4.13 folgt somit g ∈ Ck (D).
❑
10.5 Extremwerte
Wir haben im ersten Semester in Definition 7.2.1 definiert, was es bedeutet, dass eine
reellwertige Funktion f : D → R (D ist Teilmenge eines metrischen Raumes) in einem
Punkt x ∈ D ein lokales Maximum (lokales Minimum):
Ist D offene Teilmenge von R, und ist f differenzierbar in einem lokalen Maximum
(Minimum) x, so haben wir in Satz 7.2.2 gesehen, dass dann f ′ (x) = 0. Wir wollen
diese Tatsache nun für auf D ⊆ Rn definierte Funktionen herleiten.
10.5.1 Satz. Sei x0 ein lokales Extremum, d.h. Maximum oder Minimum, von
f : D ⊆ Rn → R, und existieren bei x0 alle Richtungsableitungen
∂f f (x0 + tv) − f (x0 )
(x0 ) = lim ,
∂v t→0 t
so sind diese alle gleich Null. Ist sogar f ∈ C 1 , so gilt d f (x0 ) = 0.
10.5. EXTREMWERTE 95
Beweis. Sei v ∈ Rn ein beliebiger Vektor. Betrachte die Funktion φ(t) = f (x0 + tv). Da
D offen ist, ist φ in einer Umgebung von 0 definiert, und wegen unserer Voraussetzung
ist auch φ bei 0 differenzierbar und hat die Ableitung φ′ (0) = ∂∂vf (x0 ). Da x0 ein relatives
Extremum von f ist, hat auch φ ein relatives Extremum bei 0. Somit gilt φ′ (0) = 0.
Für f ∈ C 1 ist d f (x0 ) derart definiert, dass d f (x0 )v = ∂∂vf (x0 ) für alle v ∈ Rn . Es
folgt also d f (x0 ) = 0.
❑
Also ist d f (x0 ) = 0 eine notwendige Bedingung für ein Extremum. Punkte mit
d f (x0 ) = 0 heißen stationäre Punke. Wie im eindimensionalen ist diese aber nicht
hinreichend. Um dieses Problem genauer studieren zu können, wollen wir folgende
sprechweise einführen.
10.5.2 Definition. Für gerades k heißt die k-te Ableitung dk f (x0 ) : Rk×n → R von f
im Punkt x0 positiv definit bzw. positiv semidefinit, wenn dk f (x0 )(h, . . . , h) > 0 bzw.
dk f (x0 )(h, . . . , h) ≥ 0 für alle 0 , h ∈ Rn .
Entsprechend definiert man negativ definit bzw. negativ semidefinit.
∂2 f
(x0 ) . . . ∂2 f v1
∂x1 ∂xn (x0 )
∂x1 ∂x.1 ..
.
u1 ... un .. . .
. .
∂2 f ∂2 f vn
∂xn ∂x1 (x0 ) . . . ∂xn ∂xn (x0 )
2
Diese symmetrische n × n-Matrix H f (x0 ) = ∂x∂i ∂xf j (x0 ) heißt auch Hesse-Matrix.
Aus der Linearen Algebra ist bekannt, dass die Bilinearform positiv definit (semi-
definit) ist, wenn alle Eigenwerte λ1 , . . . , λn (nicht notwendigerweise paarweise ver-
schieden) von H f (x0 ) größer (größer gleich) Null sind. Entsprechendes gilt für den
negativen Fall.
Weiters ist diese Bilinearform positiv definit genau dann, wenn alle Hauptmino-
ren10 von H f (x0 ) größer Null sind. Entsprechend ist sie genau dann negativ definit,
wenn die Hauptminoren nicht verschwinden und abwechselndes Vorzeichen beginnend
mit − haben.
Für den Beweis des folgenden Satzes benötigen wir ein Lemma.
Beweis. Für k = 1 ist nichts zu beweisen. Für größere k’s zeigen wir die Aussage durch vollständige Induktion nach k. Ist
k = 2, so gilt für beliebige v, w ∈ Rn
Also gilt ω(v, w) = −ω(w, v) und wegen der Symmetrie auch ω(v, w) = ω(w, v) und damit ω(v, w) = 0.
Ist k > 2, so seien wieder v, w ∈ Rn beliebig. Weiters sei λ ∈ R. Nun gilt wegen der Symmetrie
X
k−1 !
k
ω(v, . . . , v) + λj ω(v, . . . , v, w, . . . , w) + λk ω(w, . . . , w)
j=1
j | {z } | {z }
j−mal (k− j)−mal
n
Für feste v, w ∈ R und variablem λ steht links immer Null und rechts ein Polynom in λ, dessen Koeffizienten somit alle
verschwinden müssen. Für j = k − 1 gilt daher insbesondere
ω(v, . . . , v , w) = 0,
| {z }
(k−1)−mal
und zwar für alle v, w ∈ R . Somit erfüllt für festes w ∈ Rn die offensichtlich symmetrische und multilineare Abbildung
n
die Voraussetzungen unseres Lemmas für k − 1 anstatt für k. Nach Induktionsvoraussetzung verschwindet diese multilineare
Abbildung für alle v1 , . . . , vk−1 ∈ Rn . Da w zwar fest, aber beliebig war, verschwindet auch ω.
❑
10.5.6 Satz. Für ein offenes D ⊆ Rn sei f : D → R, f ∈ C r (D) mit r ∈ N, und sei
x0 ∈ D mit d f (x0 ) = 0, . . . , dq−1 f (x0 ) = 0, d q f (x0 ) , 0, wobei q ≤ r. Dann gilt
(i) Hat f ein lokales Maximum bei x0 , so ist q gerade und dq f (x0 ) ist negativ semi-
definit.
(ii) Ist q gerade und dq f (x0 ) negativ definit, so hat f ein lokales Maximum bei x0 .
(iii) Hat f ein lokales Minimum bei x0 , so ist q gerade und dq f (x0 ) ist positiv semide-
finit.
(iv) Ist q gerade und dq f (x0 ) positiv definit, so hat f ein lokales Minimum bei x0 .
Beweis.
(i) Sei x0 ein relatives Maximum von f . Dann existiert ein δ > 0, sodass
Für ein v ∈ Rn \ {0} definieren wir φv (t) = f (x0 + tv), |t| < kvk δ , und sehen
wie in Satz 10.5.1, dass φv bei Null ein lokales Maximum hat. Außerdem ist
(q−1)
φ(k) k ′
v (0) = d f (x0 )(v, . . . , v), k = 1, . . . , q. Also φv (0) = · · · = φv (0) = 0.
Nach Voraussetzung ist dq f (x0 ) , 0, und wegen Lemma 10.5.5 muss
dq f (x0 )(v, . . . , v) , 0 in zumindest eine Richtung v. Also folgt φ(q)
v (0) , 0. Wäre
q ungerade, so wäre nach Korollar 7.3.11 die Zahl 0 aber kein lokales Extremum
von φv .
(q)
Damit ist q gerade. Wäre nun dq f (x0 ) nicht negativ semidefinit, d.h. φv (0) =
dq f (x0 )(v, . . . , v) > 0 in zumindest eine Richtung v, so folgt wieder aus Korollar
7.3.11, dass 0 ein lokales Minimum von φv ist. Somit ist 0 lokales Minimum und
lokales Maximum. Also muss φv auf einem hinreichend kleinen Intervall um 0
konstant sein, was aber φ(q) v (0) = 0 implizieren würde.
10.5. EXTREMWERTE 97
(ii) Sei q gerade und dq f (x0 ) negativ definit. Nun gibt es ein δ > 0, sodass dq f (x)
ebenfalls negativ definit ist für alle x ∈ Uδ (x0 ).
Um das einzusehen, nehme man das Gegenteil an. Dann gibt es zu jedem n ∈ N
ein xn , kxn − x0 k∞ < n1 , sodass dq f (xn ) nicht negativ definit ist. Es gibt daher ein
0 , hn ∈ Rn mit dq f (xn )(hn , . . . , hn ) ≥ 0. Wegen
hn hn 1
dq f (xn ) ,..., = dq f (xn )(hn , . . . , hn ) ≥ 0
khn k∞ khn k∞ khn kq∞
können wir annehmen, dass die hn immer khn k∞ = 1 erfüllen, also in der abge-
schlossenen und beschränkten Teilmenge
liegen. Da diese Menge nach Korollar 5.2.13 kompakt ist, gilt hn( j) → h, j → ∞,
für eine Teilfolge und für ein h ∈ K1 (0) \ U1 (0).
Somit konvergieren die Komponenten von hn( j) gegen die entsprechenden
k
Komponenten von h und alle partiellen Ableitungen ∂xl ∂...∂x
f
l
(xn( j) ) gegen
1 k
∂k f
(x0 ). Wegen (10.17) konvergiert dann auch dq f (xn( j) )(hn( j) , . . . , hn( j) ) ge-
∂xl1 ...∂xlk
gen d f (x0 )(h, . . . , h), und wir erhielten d q f (x0 )(h, . . . , h) ≥ 0 im Widerspruch
q
zur Voraussetzung.
Nach Satz 10.4.7 hat man für x ∈ Uδ (x0 )
q−1
X 1 l
f (x) = f (x0 ) + d f (x0 )(x − x0 , . . . , x − x0 ) + Rq (x) = f (x0 ) + Rq (x),
l! | {z }
l=1 l−mal
Z1
1
Rq (x) = d f q ((1 − t)x0 + tx)(x − x0 , . . . , x − x0 )(1 − t)q−1 dt.
(q − 1)! | {z }
0 q−mal
Wegen der Wahl von δ ist aber der Integrand < 0. Also gilt f (x) = f (x0 )+Rq (x) <
f (x0 ) für x , x0 , und somit ist x0 ein lokales Maximum.
Die Aussagen (iii) und (iv) zeigt man genauso wie (i) und (ii).
❑
Sucht man ein lokales Extremum einer überall differenzierbaren Funktion, so
braucht man nur unter jenen Punkten x0 mit d f (x0 ) = 0 zu suchen. In der Praxis wird
man die Gleichung d f (x0 ) = 0 aber meistens nicht explizit nach x0 auflösen können.
10.5.7 Bemerkung. Ob ein lokales Maximum (Minimum) ein globales Maximum (Mi-
nimum) ist, bedarf einer weiteren Prüfung. Eine Möglichkeit ist, alle lokalen Extrema
zu suchen, und diese dann untereinander zu vergleichen.
Der Graph dieser Funktion, daher alle Punkte (ξ1 , ξ2 , ξ3 )T ∈ R3 mit ξ3 = f (ξ1 , ξ2 )T , ist
ein Paraboloid.
98 KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN
ξ3
ξ2
ξ1
ξ
Abbildung 10.6: Graph der Funktion ξ3 = f 1
ξ2 für ξ12 + ξ22 ≤ 1
und sie ist offenbar stets < 0, also negativ definit. Insbesondere ist (0, 0)T ein
lokales Maximum. Ist 0 nun auch ein globales Maximum? Das Bild, das man
von der Fläche hat, legt das sicherlich nahe. Aber wie lässt sich das zeigen?
Eine Möglichkeit ist, festzustellen, dass für (ξ1 , ξ2 )T , (0, 0)T sicherlich
f (ξ1 , ξ2 )T = 1 − (ξ12 + ξ22 ) < 1 = f (0, 0)T .
Man kann auch nach einem (globalen,lokalen) Minimum von f fragen. Ein
globales Minimum gibt es offensichtlich nicht, da z.B. für festes ξ2 und für
|ξ1 | → +∞ der Ausdruck f (ξ1 , ξ2 )T nach −∞ strebt.
Man kann aber z.B. fragen, ob f |D mit D = {(ξ1 , ξ2 )T ∈ R2 : k(ξ1 , ξ2 )T k2 < 1}
ein lokales oder globales Minimum y = (η1 , η2 )T hat. Das ist aber auch nicht der
Fall, denn dann wäre dort d f (y) = 0, was aber nur für y = 0 der Fall ist.
Nun kann man z.B. auch fragen, ob f |D mit D = {(ξ1 , ξ2 )T ∈ R2 : k(ξ1 , ξ2 )T k2 ≤
1} ein Minimum y = (η1 , η2 )T hat. Man beachte, dass man hier nicht unmittelbar
die Resultate dieses Abschnittes anwenden kann, da ja D nicht offen ist. In der
Tat ist D kompakt, und somit muss f auf D mindestens ein Minimum haben.
Ein solches kann aber nicht in D liegen, da es dann ein Minimum von f |D wäre,
von dem wir ja wissen, dass es diese nicht gibt.
10.6. LAGRANGE MULTIPLIKATOREN 99
(y, µ) ein stationärer Punkt ist, d.h. dH(y, µ) = 0. Es gelten also an dieser Stelle die
Gleichungen
∂f X m
∂g j
(y) + µj (y) = 0, i = 1, . . . , n,
∂xi j=1
∂xi
g j (y) = 0, j = 1, . . . , m.
Beweis. Laut Voraussetzung ist Matrix dg(y) mit n Spalten und m Zeilen vom Rang m.
Also gibt es m Spalten dieser Matrix, die linear unabhängig sind. Durch eine Umbe-
nennung der Variablen ξ1 , . . . , ξn , also eine Permutation der Koordinaten, kann man es
immer bewerkstelligen, dass die letzten m Spalten linear unabhängig sind.
Das heißt aber nun, dass, wenn wir Vektoren x ∈ Rn als (x1 , x2 ) ∈ R(n−m)+m und die
Matrix dg(y) entsprechend als dg1 (y)|dg2(y) mit dg1 (y) ∈ Rm×(n−m) , dg2 (y) ∈ Rm×m
schreiben, die Matrix dg2 (y) invertierbar ist.
Ist Uδ (y) ⊆ D wie in (10.21), so können wir den Hauptsatz über implizite Funktio-
nen, Satz 10.2.4, auf g|Uδ (y) anwenden und erhalten in einer offenen Menge der Form
U × V ⊆ Uδ (y) ⊆ R(n−m)+m mit y1 ∈ U, y2 ∈ V, wobei y = (y1 , y2 ), die eindeutige
Auflösbarkeit von g(x1 , x2 ) = 0. Also gibt es h : U ⊆ Rn−m → V ⊆ Rm in C 1 , sodass
(x1 , x2 ) ∈ U × V, g(x1 , x2 ) = 0 ⇔ x1 ∈ U, h(x1 ) = x2 .
Somit ist y1 eine Extremum von k(x1 ) := f (x1 , h(x1 )), x1 ∈ U. Wegen Satz 10.5.1 gilt
dk(y1 ) = 0. Nun ist wegen Satz 10.2.4 dh(y1 ) = −dg2 (y)−1 dg1 (y), und daher nach der
Kettenregel
! !
I I
0 = dk(y1 ) = d f (y) = (d f1 (y), d f2 (y)) =
dh(y1 ) −dg2 (y)−1 dg1 (y)
d f1 (y) + −d f2 (y)dg2 (y)−1 dg1 (y) .
|{z} | {z } |{z}
∈R1×(n−m) =:µT ∈R1×m Rm×(n−m)
∂f Xm
∂g j
(y) + µj (y) = 0, i = 1, . . . , n − m.
∂xi j=1
∂xi
∂f Xm
∂g j
(y) + µj (y) = 0, i = n − m + 1, . . . , n.
∂xi j=1
∂xi
Wir wollen alle Extrema dieser Funktion auf T = {x ∈ R2 : kxk2 = 1} finden. Offen-
sichtlich entspricht das dem Aufsuchen aller Extrema der Funktion f unter der Neben-
bedingung g(x) = 0, wobei !
ξ
g = ξ2 + η2 − 1.
η
Wegen dg ηξ = (2ξ 2η) , (0 0) für ηξ ∈ T, ist die Regularitätsbedingung von Satz
10.6.1 erfüllt. Setzen wir ( ηξ ∈ R2 , λ ∈ R)
so wissen wir aus Satz 10.6.1, dass alle Lösungen von dH(x, y, λ) = 0 Kandidaten für
lokale Extrema sind. Wir lösen also
∂H
(ξ, η, λ) = 2ξη2 + 2λξ = 2ξ(η2 + λ) = 0,
∂ξ
∂H
(ξ, η, λ) = 2ξ2 η + 2λη = 2η(ξ2 + λ) = 0,
∂η
!
∂H ξ
(ξ, η, λ) = g = ξ2 + η2 − 1 = 0.
∂λ η
(i) Ist ξ = 0, so muss η = ±1 und daher λ = 0.
(ii) Ist η = 0, so muss ξ = ±1 und daher λ = 0.
(iii) Sind beide ξ, η , 0, so folgt aus den ersten beiden Gleichungen ξ2 + η2 = −2λ
und aus der letzten ξ2 + η2 = 1. Also λ = − 21 sowie ξ = ± √12 , η = ± √12 .
Aus f ηξ = ξ2 η2 folgt sofort, dass überall f ηξ > 0 wenn beide ξ, η , 0. Somit sind die
vier Punkte (±1, 0)T , (0, ±1)T Minima auf T.
An jedem der vier Punkte (± √12 , ± √12 )T nimmt f den Wert 41 . Da T kompakt ist,
muss f darauf ein oder mehrere Maxima haben, welche in unserer Kandidatenmenge
enthalten sein muss. Also sind die vier Punkte (± √12 , ± √12 )T alle Maxima von f auf T.
10.6.3 Beispiel. Sei A = (ai, j )ni, j=1 ∈ Rn×n symmetrisch, d.h. AT = A. Wir suchen das
Maximum und das Minimum von f : Rn → R, x 7→ xT Ax auf der Kugeloberfläche
{x ∈ Rn : kxk2 = 1}. Also suchen wir Extrema von f unter der Nebenbedingung
P
g(x) = 1 − xT x = 1 − nj=1 ξ2j , wobei x = (ξ1 , . . . , ξn )T .
Zunächst ist dg(x) = −2xT vom Rang eins für alle x auf der Kugeloberfläche. Also
liefert uns Satz 10.6.1 ein notwendiges Kriterium für die gesuchten Extrema. Man hat
Mit der Produktregel für Skalarprodukte und wegen der Symmetrie von A folgt
∂H
(x, λ) = ((A − λI)ei , x) + ((A − λI)x, ei ) = 2(Ax − λx)T ei ,
∂xi
102 KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN
dH(x, λ) = 2(Ax − λx)T | 1 − xT x .
Die stationären Punkte müssen also (Ax − λx) = (A − λI)x = 0 und 1 − xT x = 0 erfüllen.
Somit kommen nur Eigenvektoren für die Extrema in Frage. Ist x ein Eigenvektor zum
Eigenwert λ, so folgt f (x) = xT Ax = xT λx = λ.
Da die Kugeloberfläche kompakt ist, existieren Minimum und Maximum. Wir er-
halten also für x ∈ Rn , kxk2 = 1
λmin ≤ xT Ax ≤ λmax ,
wobei λmin der kleinste und λmax der größte Eigenwert von A ist.
Mit den üblichen Überlegungen, wobei man komplexe n-Vektoren und n × n-
Matrizen mit reellen (2n)-Vektoren bzw. (2n) × (2n)-Matrizen identifiziert, ergibt sich
für komplexe, symmetrische n × n-Matrizen A, dass λmin ≤ z∗ Az ≤ λmax , z ∈ Cn , kzk22 =
Pn 2
j=1 |ζ j | = 1.
Kapitel 11
Wegintegrale
11.1 Wege
Wege im Rn sind der Anschauung nach etwas eindimensionales.
11.1.1 Definition. Ein Weg γ im Rn ist eine Abbildung von einem Intervall [a, b] nach
Rn . Ist γ stetig, so sprechen wir von einem stetigen Weg.
Dabei heißen zwei Wege γ : [a, b] → Rn und γ̃ : [ã, b̃] → Rn äquivalent, falls sie
Umparametrisierungen von einander sind, d.h. falls es eine streng monoton wachsende
Bijektion α : [a, b] → [ã, b̃] gibt, sodass γ̃ ◦ α = γ.1 Wir schreiben auch γ ∼ γ̃ dafür.
Ist γ ein Weg, so sei
γ− : [a, b] → Rn der Weg [a, b] → Rn , t 7→ γ(a + b − t), also der in der Gegenrichtung
durchlaufene Weg.
Sind γ1 : [a1 , b1 ] → Rn , γ2 : [a2 , b2 ] → Rn zwei (stetige) Wege mit b1 = a2 und
γ1 (b1 ) = γ2 (a2 ), so sei γ1 ⊕ γ2 : [a1 , b2 ] → Rn die (stetige) Funktion mit
11.1.2 Beispiel. Sind x0 , . . . , xm Punkte aus Rn , und definiert man die Wege x] j−1 x j :
[ j−1, j] → Rn , j = 1, . . . , m, durch x] j−1 x j (t) := x j−1 +(t−( j−1))(x j −x j−1 ), t ∈ [ j−1, j],
so sind offensichtlicherweise x] −−−−− →
j−1 x j und x j−1 x j äquivalent, und
xg ]xm = −
0 x1 ⊕ · · · ⊕ xm−1 x−0−→
x1 , −
x−1−→
x2 , . . . , −
x−m−1
−−−−x→
m.
11.1.3 Fakta.
1. Da mit α auch α−1 eine streng monoton wachsende Bijektion ist, ist ∼ eine Äqui-
valenzrelation. Man sieht auch unmittelbar, dass γ ∼ γ′ ⇔ γ− ∼ −γ′ −.
1 Wegen Korollar 6.5.3 ist eine solche Bijektionen α stetig. Umgekehrt ist eine stetige Bijektion α :
[a, b] → [ã, b̃] entweder streng monoton wachsend oder streng monoton fallend, vgl. Lemma 6.5.4.
103
104 KAPITEL 11. WEGINTEGRALE
2. Ist γ : [a, b] → Rn ein Weg und ist α(t) = a + t(b − a), so ist γ äquivalent zu
γ ◦ α : [0, 1] → Rn , also äquivalent zu einem Weg mit Parametermenge [0, 1].
3. Das Bild eines stetigen Weges ist als stetiges Bild einer kompakten und zusam-
menhängenden Menge wieder kompakt und zusammenhängend, siehe Proposi-
tion 6.1.11 und Proposition 6.2.4.
4. Man könnte glauben, dass das Bild zumindest eines stetigen Weges den Weg
schon bestimmt. Das ist aber nicht der Fall, wenn man nur an ein Geradenstück
denkt, das man zuerst in die Hin- und dann in die Rückrichtung durchläuft.
5. Das Bild eines stetigen Weges kann auch ganz unerwartet aussehen. Man kann
z.B. einen Weg in R2 konstruieren, der [0, 1] × [0, 1] als Bild hat.
Um einem Weg eine Länge ℓ(γ) zuzuordnen, liegt es nahe, das zuerst bei den ein-
fachsten Arten von Wegen, nämliche den geraden Strecken γ = → −
xy mit x, y ∈ Rn zu
tun:
ℓ(γ) := kx − yk2 .
Die Länge eines beliebigen Weges γ : [a, b] → Rn approximiert man dadurch, dass
man eine beliebige Zerlegung Z = {ξ j : j = 0, . . . , n(Z)} von [a, b] wie in Definition
8.1.2 hernimmt und die Länge des dazugehörigen Polygonzuges
−−−−−−−−→ −−−−−−−−−−−−−−−→
γ(ξ0 )γ(ξ1 ), . . . , γ(ξn(Z)−1 )γ(ξn(Z) ) (11.1)
nämlich
X
n(Z)
L(Z) := kγ(ξ j ) − γ(ξ j−1 )k2
j=1
a = ξ0 ξ1 ξ2 ξ3 ξ4 ξ5 ξ6 ξ7 = b :Z
γ(ξ7 )
γ
γ(ξ1 ) γ(ξ0 )
γ(ξ6 )
γ(ξ2 )
γ(ξ5 ) γ([a, b])
γ(ξ3 ) γ(ξ4 )
Der Fall ℓ(γ) = +∞ kann dabei auftreten. Ist jedoch ℓ(γ) < +∞, so spricht man von
einem rektifizierbaren Weg.
11.1.4 Fakta.
1. Ist γ : [0, 1] → Rn , γ(t) = ty + (1 − t)x eine gerade Strecke, so gilt für eine
beliebige Zerlegung Z
X
n(Z)
L(Z) = k(ξ j − ξ j−1 )(y − x)k2 = kx − yk2 .
j=1
3. Aus der Monotonie (vgl. 2) folgt unmittelbar für ein endliches A ⊆ [a, b], dass
7. Ist Z eine Zerlegung von [a, b], und betrachtet man den in (11.1) erwähnten
Polygonzug p : [0, n(Z)],
t − ξ j−1
p(t) = γ(ξ j−1 ) + γ(ξ j ) − γ(ξ j−1 ) . (11.3)
ξ j − ξ j−1
Da dieser Weg eine Zusammensetzung von geraden Strecken - genauer eine Zu-
sammensetzung von zu geraden Strecken äquivalenten Wegen - ist, folgt aus dem
letzten Punkt, dass ℓ(p) = L(Z).
106 KAPITEL 11. WEGINTEGRALE
11.1.5 Lemma. Ist γ : [a, b] → Rn ein rektifizierbarer Weg, so ist die Funktion ℓ(x) :=
ℓ(γ|[a,x] ), x ∈ [a, b] monoton wachsend. Ist γ bei x rechtsstetig (linksstetig, stetig), so
ist auch ℓ dort rechtsstetig (linksstetig, stetig)2 .
Beweis. x 7→ ℓ(γ|[a,x] ) ist offensichtlich monoton steigend (vgl. Fakta 11.1.4, 6). Sei γ
in einem Punkt x ∈ [a, b) rechtsstetig. Wegen ℓ(γ|[a,b] ) = ℓ(γ|[a,x] ) + ℓ(γ|[x,b] ) ist auch
ℓ(γ|[x,b] ) endlich und somit das Supremum aller L(Z), wenn Z alle Zerlegungen von
[x, b] durchläuft.
Somit gibt es zu gegebenen ǫ eine Zerlegung Z0 von [x, b], sodass
Wegen der Rechtsstetigkeit gibt es ein δ > 0, sodass kγ(x) − γ(s)k2 < ǫ, s ∈ [x, x +
δ). Da die L(Z) monoton von Z abhängen, können wir Z0 so wählen, dass die erste
Stützstelle ξ rechts von x einen Abstand kleiner als δ hat. Es folgt
ℓ(γ|[x,ξ] ) ≤ ℓ(γ|[x,ξ] ) + ℓ(γ|[ξ,b] ) − (L(Z0 ) − kγ(ξ) − γ(x)k2 ) .
Diese Ungleichung gilt, da die letzte Klammer nichtnegativ ist, denn L(Z0 ) − kγ(ξ) −
γ(x)k2 stimmt mit L(Z0 ∩ [ξ, b]) überein, und ist damit höchstens ℓ(γ|[ξ,b] ). Nun stimmt
der rechte Ausdruck in obiger Relation überein mit
Also ist ℓ(γ|[x,ξ] ) < 2ǫ. Wegen der Monotonie gilt auch ℓ(γ|[a,s] ) − ℓ(γ|[a,x] ) = ℓ(γ|[x,s] ) ≤
ℓ(γ|[x,ξ] ) < 2ǫ, wenn s ∈ [x, ξ].
Die Linksstetigkeit zeigt man analog.
❑
Konkret ausrechnen lässt sich die Weglänge für stetig differenzierbare Wege.
11.1.6 Satz. Falls γ ∈ C 1 [a, b], so ist γ rektifizierbar, und ℓ(x) ist differenzierbar mit
der Ableitung kγ′ (x)k2 . Dabei gilt
Z b
ℓ(γ) = kγ′ (x)k2 dx.
a
Beweis. Wegen dem Hauptsatz der Differential- und Integralrechnung sowie (9.11) gilt
Z ξ
Z ξj
j ′
kγ(ξ j ) − γ(ξ j−1 )k2 =
γ (t) dt
≤ kγ′ (t)k2 dt.
ξ j−1
ξ j−12
Rb
Also L(Z) ≤ a kγ′ (t)k2 dt für jede Zerlegung Z von [a, b], und damit ℓ(γ) ≤
Rb
a
kγ′ (t)k2 dt.
Für a ≤ x < y ≤ b gilt
Z y
kγ(y) − γ(x)k2 ≤ ℓ(γ|[x,y] ) ≤ kγ′ (t)k2 dt.
x
Mitte, und damit ℓ′ (y)− = kγ′ (y)k2 . Lässt man y → x streben, so sieht man genauso
ℓ′ (x)+ = kγ′ (x)k2 , und insgesamt ℓ′ (x) = kγ′ (x)k2 , x ∈ [a, b], wobei wir an den
Rändern die jeweiligen einseitigen Grenzwerte meinen.
❑
n
Die Funktion γ : [a, b] → R ist offensichtlicherweise stetig und stückweise stetig
differenzierbar (vgl. Definition 9.5.7), wenn es eine Zerlegung Z = {ξ j }n(Z) j=0 gibt, sodass
γ|[ξ j−1 ,ξ j ] ∈ C 1 [ξ j−1 , ξ j ] für j = 1, . . . , n(Z). Wendet man Satz 11.1.6 n(Z)-mal auf
γ|[ξ j−1 ,ξ j ] , j = 1, . . . , n(Z) an, so erhalten wir
11.1.7 Korollar. Ist γ : [a, b] → Rn ein stetiger und stückweise stetig differenzierbarer
Rb
Weg, so ist dieser rektifizierbar mit ℓ(γ) = a kγ′ (x)k2 dx.
11.1.8 Beispiel. Man betrachte den Weg (siehe Definition 6.8.12, Beispiel 10.1.9)
!
cos s
γ(s) = ∈ R2 , s ∈ [0, 2π].
sin s
γ(t) ≃ exp(it)
sin t
t
Also ist t genau die Weglänge
des Bogens γ|[0,t] .
−1 0 cos t 1
11.1.9 Bemerkung. Ist γ : [a, b] → Rn ein rektifizierbarer und stetiger Weg, so wissen
wir nun, dass ℓ das Intervall [a, b] monoton wachsend und surjektiv auf [0, ℓ(γ)] abbil-
det. Ist ℓ sogar bijektiv, so ist β = γ ◦ ℓ−1 ein zu γ äquivalenter Weg, sodass die Länge
des Weges β|[0,t] genau t ist.
Ist ℓ nicht injektiv, so kann man für t ∈ [0, ℓ(γ)], β(t) := γ(x) setzen, wobei x ∈
[a, b], sodass ℓ(x) = t. Im Fall, dass ℓ(x1 ) = t = ℓ(x2 ), hat γ|[x1 ,x2 ] Weglänge Null und
ist somit konstant. Also ist γ(x1 ) = γ(x2 ) und β daher wohldefiniert, sodass γ = β ◦ ℓ.
Aus der Kompaktheit von [0, ℓ(γ)] folgert man daraus leicht die Stetigkeit von β.
Also ist β auch in diesem Fall ein zu γ fast äquivalenter“ Weg, sodass die Länge
”
des Weges β|[0,t] genau t ist.
108 KAPITEL 11. WEGINTEGRALE
11.1.10 Bemerkung. Bisher haben wir bei der Behandlung von Wegen und Weglängen
nirgends verwendet, dass γ in den Rn mit der k.k2 -Norm hinein abbildet. Wir haben die
euklidische Norm nur verwendet, weil sie dem als natürlich empfundenen Längenbe-
griff entspricht.
In der Tat kann man genauso ℓ(γ) definieren, wenn γ eine beliebige Funktion von
[a, b] in einen Banachraum (X, k.k) ist.
Es gelten dann dieselben Eigenschaften, die wir eben aufgezählt haben, und ist
ℓ(γ) < +∞, so spricht man von γ als einer Funktion von beschränkter Variation.
Äquivalente Normen k.k und |k.k|, d.h. αk.k ≤ |k.k| ≤ βk.k, induzieren zwar verschie-
dene Längenbegriffe, aber diese sind dennoch vergleichbar:
αℓk.k (γ) ≤ ℓ|k.k| (γ) ≤ βℓk.k (γ).
Versieht man etwa Rn mit der Norm k.k∞ oder k.k1 , so erhält man für ein und dieselbe
Funktion verschiedene Längenbegriffe. Von besonderen Interesse ist der Fall X = R.
11.2 Wegintegrale
11.2.1 Beispiel. Wir betrachten ein Objekt im Gravitationsfeld einer Punktmasse, und
wollen die Arbeit berechnen, die verrichtet wird wenn man das Objekt von einer Positi-
on zu einer anderen verschiebt. Dabei denken wir uns diese Punktmasse im Nullvektor
des R3 .
Das Newtonsche Gravitations gesetz besagt, dass abgesehen von multiplikativen
Konstanten sich die Gravitationskraft umgekehrt proportional zum Quadrat ihres Ab-
standes r zur Punktmasse verhält, dh. r12 . Zerlegt man diese Kraft, die auf einen Punkt
x = (ξ, η, ζ)T ∈ R3 wirkt, in ihre Komponenten, so erhält man den Vektor
ξ
1
F(x) = − 3 η .
kxk2 ζ
Verschiebt man nun einen Punkt P von x zu einer sehr nahen Position x + h, so ist die
Arbeit, die verrichtet wird, wegen der Formel Arbeit = Kraft × Weg“ ungefähr gleich
”
− F(x), h = −F(x)T h.
Sei nun P ein Punkt in der Position x0 , und werde P längs einer Kurve γ in die Po-
sition x1 verschoben. Sei γ gegeben in Parameterdarstellung γ : [0, 1] → R3 , γ(0) =
x0 , γ(1) = x1 , und sei vorausgesetzt, dass γ hinreichend glatt ist (z.B. stetig und stück-
weise stetig differenzierbar). Wir zerlegen die Kurve in kleine Abschnitte. Sei also
0 = t0 < t1 < t2 < . . . < tn−1 < tn = 1. Wird γ durch den Polygonzug mit Ecken in γ(ti )
approximiert, dann berechnet sich die verrichtete Arbeit ungefähr durch
X
n
T
ω≈ −F(γ(ti ) γ(ti ) − γ(ti−1 ) .
i=1
Wir werden unten sehen, dass dieser Ausdruck konvergiert, wenn man die Approxima-
tion immer genauer macht. Für diesen Grenzwert werden wir
Z
−F(x)T dx,
γ
schreiben, und ihn das Wegintegral des Vektorfeldes φ = −F T längs des Weges γ
nennen.
11.2. WEGINTEGRALE 109
X
n(R)
W(R) := φ γ(α j ) γ(ξ j ) − γ(ξ j−1 ) . (11.4)
j=1
11.2.2 Definition. Konvergiert das Netz W(R) R∈R in X, so nennen wir seinen Grenz-
wert Z
φ(x) dx := lim W(R)
γ |R|→0
X
n(R)
P(R) := f (α j ) g(ξ j ) − g(ξ j−1 ) .
j=1
Rb
Das Riemann-Stieltjes Integral a
f dg ist definiert als limR∈R P(R), falls letzterer Li-
mes in X existiert.
Der Zusammenhang von Wegintegral und Riemann-Stieltjes Integral ist der, dass
Rb R
P(R) = W(R) und dass a f dg = γ f (x) dx, wenn g = γ und f = φ ◦ γ,.
11.2.3 Fakta.
1. Ist γ̃ : [ã, b̃] → D ⊆ Rn ein Weg und γ = γ̃ ◦ β : [a, b] → D ein zu γ̃ äquivalenter
Weg mit einer streng monoton wachsenden Bijektion
n(R)
β : [a, b] → [ã, b̃]. Ist R = (ξ j )n(R)
j=0 ; (α j ) j=1 eine Riemannzerlegung von [a, b],
n(R)
so ist β(R) := β(ξ j ) n(R)j=0 ; β(α j ) j=1 eine solche von [ã, b̃] und umgekehrt. Da-
bei bleibt die Ordnung erhalten, also |R1 | ≤ |R2 | ⇔ |β(R1 )| ≤ |β(R2 )|. Außerdem
gilt W(R) = W(β(R)). Man folgert daraus auf elementare Weise, dass
Z Z
φ(x) dx = φ(x) dx.
γ̃ γ
In dem Sinne, dass wenn eines dieser Integrale existiert, dann auch das andere
existiert und diese übereinstimmen.
Ist γ− der in die Gegenrichtung durchlaufene Weg, so entsprechen sich die Rie-
mannsummen auch bijektiv, wobei die korrespondierenden
R R Summen W(R) nur
im Vorzeichen unterscheiden, und somit γ− φ(x) dx = − γ φ(x) dx.
2. Ist unser Weg rektifizierbar und stetig, d.h. ℓ(γ) < +∞, und ist φ stetig, so exis-
tiert das Integral.
Rb
Das folgt aus der allgemeineren Tatsache, dass a f dg existiert, falls f stetig
auf [a, b] und g rektifizierbar ist. Der Beweis für diese Tatsache ist ähnlich, wie
3 Man spricht von Vektorfeldern.
110 KAPITEL 11. WEGINTEGRALE
der Beweis für die Riemannintegrierbarkeit stetiger Funktionen mit Hilfe des
Cauchy-Kriteriums.
n(R1 ) n(R2 )
Beweis. Sind R1 = (ξ j )n(R 1)
j=0 ; (α j ) j=1 und R2 = (η j )n(R 2)
j=0 ; (β j ) j=1 zwei Rie-
mann Zerlegungen von [a, b], sodass die Stützstellen von R2 die von R1 umfas-
sen.
Ist j ∈ {1, . . . , n(R1 )}, so gibt es Indizes k( j − 1) < k( j), sodass
ξ j−1 = ηk( j−1) < ηk( j−1)+1 < · · · < ηk( j)−1 < ηk( j) = ξ j .
| {z }
k( j)−k( j−1)−1 viele
Pk( j)
Es folgt mit g(ξ j ) − g(ξ j−1 ) = k=k( j−1)+1 g(ηk ) − g(ηk−1 )
kP(R2 ) − P(R1 )k ≤
X1 )
n(R
X
k( j)
f (α j ) g(ξ j ) − g(ξ j−1 ) − f (βk ) g(ηk ) − g(ηk−1 )
j=1 k=k( j−1)+1
X1 )
n(R X
k( j)
≤ k f (α j ) − f (βk )k · kg(ηk ) − g(ηk−1 )k2 .
j=1 k=k( j−1)+1
Dabei ist k f (α j ) − f (βk )k die Abbildungsnorm auf L(Rn , X), wenn Rn mit der
euklidischen Norm versehen ist.
Wegen |α j − βk | ≤ (ηk − ηk−1 ) ≤ |R1 |, k ∈ {k( j − 1) + 1, . . . , k( j)} folgt
X2 )
n(R
kP(R2 ) − P(R1 )k ≤ ρ(|R1 |) · kg(ηk ) − g(ηk−1 )k2 = ρ(|R1 |) · ℓ(g), (11.5)
k=1
Allgemeiner folgt für ein stetiges f : [a, c] → L(Rn , X), ein rektifizierbares
g : [a, c] → Rn und ein b ∈ (a, c), dass
Z c Z b Z c
f dg = f dg + f dg.
a a b
X
n(R)
max k f (t)k kg(ξ j ) − g(ξ j−1 )k2 ≤ max k f (t)k · ℓ(g).
t∈[a,b] t∈[a,b]
j=1
Daraus sieht man, dass für konstantes g das Riemann-Stieltjes Integral existiert
und verschindet. Entsprechend verschwindet das Wegintegral über einen kon-
stanten Weg.
Existiert das Riemann-Stieltjes Integral (Wegintegral), so ist seine Norm kleiner
oder gleich maxt∈[a,b] k f (t)k · ℓ(g) bzw. maxt∈[a,b] kφ ◦ γ(t)k · ℓ(γ).
6. Ist γ : [0, 1] → D ein gerade Strecke, also γ(t) = ty + (1 − t)x, und ist φ stetig, so
P
gilt W(R) = n(R) j=1 (ξ j − ξ j−1 )φ γ(α j ) (y − x) und daher
Z Z 1 Z 1 !
φ(x) dx = φ ty + (1 − t)x (y − x) dt = φ ty + (1 − t)x dt (y − x).
γ 0 0
Dasselbe gilt für stetige und stückweise stetig differenzierbare Wege g bzw. γ.
X
n(R)
P(R) = f (α j ) g(ξ j ) − g(ξ j−1 ) =
j=1
X
n(R) Z ξj Z b
f (α j ) g′ (t) dt = fR (t) g′ (t) dt,
j=1 ξ j−1 a
Man beachte, dass die Summanden in (11.7) Produkte zweier komplexer Zahlen
sind. Zum Vergleich sind die Summanden in (11.4) Elemente aus X, die man erhält,
wenn man γ(ξ j ) − γ(ξ j−1 ) ∈ Rn auf die lineare Abbildung φ γ(α j ) ∈ L(Rn , X) an-
wendet. Um dennoch komplexe Wegintegrale als Wegintegrale betrachten zu können
sei bemerkt, dass für z, w ∈ C
! ! !
Re(zw) Re w − Im w Re z
= . (11.8)
Im(zw) Im w Re w Im z
Identifizieren wir C mit R2 , so lässt sich also die komplexe Multiplikation als An-
wendung eins Zweivektors auf eine lineare Abbildung aus L(R2 , R2 ) realisieren. Somit
nimmt (11.7) die Form
Z X
n(R) Z
h(z) dz lim φ γ(α j ) γ(ξ j ) − γ(ξ j−1 ) = φ(x) dx (11.9)
γ |R|→0 γ
j=1
an, wenn wir γ(ξ j ) − γ(ξ j−1 ) als Zweivektor betrachten und
!
Re h(z) − Im h(z)
φ(z) :=
Im h(z) Re h(z)
setzen.
Insbesondere existiert dieses Wegintegral für stetiges h sowie stetiges und rektifi-
zierbares γ. Ist γ sogar C 1 , so folgt aus Satz 11.2.4
Z Z b
φ(x) dx = φ(γ(t)) γ′ (t) dt.
γ a
′ 2
Da φ(γ(t)) γ (t) (∈ R ) als komplexe Zahl aufgefasst nichts anderes als die komplexe
Multiplikation h(γ(t)) · γ′ (t) ist, lässt sich das komplexe Wegintegral in diesem Fall
durch Z Z b
h(z) dz = h(γ(t)) · γ′ (t) dt (11.10)
γ a
berechnen. Schließlich folgt aus Fakta 11.2.3, 5, zusammen mit Beispiel 9.2.9, (v), dass
Z
h(z) dz ≤ max |h ◦ γ(t)| · ℓ(γ). (11.11)
γ t∈[a,b]
11.2.7 Bemerkung. Wie im Abschnitt über Wege ist bisher auch nirgends eingegangen,
dass g bzw. γ in den (Rn , k.k2 ) hinein abbildet.
Die obigen Resultate samt Beweise bleiben gültig, wenn g bzw. γ das Intervall
[a, b] in eine Menge D ⊆ Y (Y ist Banachraum) abbilden, und f : [a, b] → L(Y, X) bzw.
φ : D → L(Y, X), also jedem t ∈ [a, b] bzw. y ∈ D eine beschränkte lineare Abbildung
von Y nach X zuordnet.
Mit Hilfe dieser Wegintegrale lässt sich nun ein mehrdimensionales Analogon der
Rb
Tatsache a f ′ (t) dt = f (b) − f (a) herleiten.
11.2.8 Satz. Sei f : D ⊆ Rn → X eine stetig differenzierbare Funktion mit der Ablei-
tung d f (x) ∈ L(Rn , X). Ist γ ein stetiger und stückweise stetig differenzierbarer Weg, so
gilt Z
d f (x) dx = f γ(b) − f γ(a) .
γ
114 KAPITEL 11. WEGINTEGRALE
Beweis. Ist a = t0 < t1 < · · · < tl = b so, dass γ|[t j−1 ,t j ] ∈ C 1 [t j−1 , t j ], so folgt aus der
Kettenregel und dem Hauptsatz
Z Z b Z b
d f (x) dx = d f γ(t) γ′ (t) dt = ( f ◦ γ)′ (t) dt =
γ a a
X
l
f γ(t j ) − f γ(t j−1 ) = f γ(b) − f γ(a) .
j=1
❑
11.2.9 Definition. Vektorfelder φ : D → L(Rn , X), die Ableitungen d f stetig differen-
zierbarer Funktionen f : D → X sind, heißen auch Gradientenfelder.
Stetige Vektorfelder φ : D → L(Rn , X) mit der Eigenschaft, dass Wegintegrale
von φ über stetige und stückweise stetig differenzierbare Wege nur von Anfangs- und
Endpunkt des Weges abhängen nennt man wegunabhängige Vektorfelder.
Satz 11.2.8 besagt also, dass Gradientenfelder wegunabhängig sind.
11.2.10 Beispiel. Wir betrachten nochmals Beispiel 11.2.1. Dort war das Vektorfeld
φ : R3 \ {0} → L(R3 , R) durch φ(x) = kxk1 3 (ξ, η, ζ) gegeben. Nun ist aber, φ(x) =
2
d f (x), wobei f (x) = − kxk1 2 . Insbesondere berechnet sich die Arbeit, die man verrichten
muss, um einen Punkt P von x0 nach x1 entlang eines stetigen und stückweise stetig
differenzierbaren Weges γ zu bewegen, durch
Z
1 1
φ(x) dx = − .
γ kx k
0 2 kx 1 k2
11.2.11 Lemma. Sei hY, di ein metrischer Raum und M ⊆ Y eine feste nichtleere Teilmenge. Wir definieren für x ∈ Y
d(x, M) = inf d(x, y) : y ∈ M , (11.12)
Die Funktion x 7→ d(x, M) eine stetige Funktion von Y nach [0, +∞).
Sind A und B disjunkt und A kompakt, so gibt es ein x ∈ A, sodass d(x, B) = d(A, B).
Sind A und B disjunkt und A kompakt und B abgeschlossen, so ist d(A, B) > 0
Beweis. Sind x1 , x2 ∈ Y, so folgt leicht aus (11.12), dass d(x1 , M) ≤ d(x1 , x2 ) + d(x2 , M) und aus Symmetriegründen
d(x2 , M) ≤ d(x1 , x2 ) + d(x1 , M). Also gilt |d(x1 , M) − d(x2 , M)| ≤ d(x1 , x2 ), und daraus folgt die Stetigkeit.
Aus y ∈ M folgt trivialerweise d(y, M) ≤ d(y, y) = 0. Andererseits folgt aus d(y, M), dass d(y, yn ) → 0 für eine Folge
(yn )n∈N aus M. Wegen der Abgeschlossenheit folgt y ∈ M.
Ist A kompakt, so hat gemäß Proposition 6.1.11 die stetige Funktion x 7→ d(x, B) auf der kompakten Menge
A ein Minimum bei einem Punkt x ∈ A. Also gilt d(x, B) ≤ d(z, B), z ∈ A. Wegen Lemma 2.7.10 gilt somit
d(A, B) = inf{d(z, B) : z ∈ A} = d(x, B). Ist noch dazu B abgeschlossen, so muss auch d(A, B) = d(x, B) > 0.
❑
n
11.2.12 Bemerkung. Eine einfache aber hilfreiche Tatsache ist folgende. Sei D ⊆ R eine offene Menge und γ : [a, b] → D
stetig. Nach Proposition 6.1.11 ist γ([a, b]) kompakte Teilmenge von Rn .
Ist D , Rn , so wissen wir aus Lemma 11.2.11, dass 0 < d γ([a, b]), Rn \ D . Im Fall D = Rn setzen wir einfach
d γ([a, b]), Rn \ D = +∞.
Ist nun x ∈ Rn mit d(x, γ([a, b])) < d γ([a, b]), Rn \ D , so folgt klarerweise x ∈ D.
11.2. WEGINTEGRALE 115
Ist γ : [a, b] → Rn ein Weg und ist R eine Riemannzerlegung von [a, b], so sei zunächst γ̃R : [0, n(R)] → Rn der
Polygonzug
−−−−−−−−→ −−−−−−−−−−−→
γ(ξ0 )γ(ξ1 ), . . . , γ(ξ p−1 )γ(ξ p ).
Nun bezeichne γR : [a, b] → Rn die Umparametrisierung γ̃R ◦ α von γ̃R , wobei α : [a, b] → [0, n(R)], sodass ( j =
1, . . . , n(R))
t − ξ j−1
α(t) = j − 1 + , t ∈ [ξ j−1 , ξ j ].
ξ j − ξ j−1
Offensichtlich gilt dann γR (ξ j ) = γ(ξ j ), j = 0, . . . , n(R).
11.2.13 Lemma. Sei D ⊆ Rn eine offene Menge und γ : [a, b] → D stetig. Zu jedem ǫ ∈ R, 0 < ǫ < d γ([a, b]), Rn \ D
gibt es ein δ > 0, sodass für jede Riemannzerlegungen R von [a, b] mit |R| ≤ δ gilt
kγ(s) − γR (t)k2 ≤ ǫ, s, t ∈ [ξ j−1 , ξ j ], j = 1, . . . , n(R), (11.14)
supt∈[a,b] kγ(t) − γR (t)k2 ≤ ǫ, also insbesondere d(γR (t), γ([a, b])) ≤ ǫ für alle t ∈ [a, b],
γα := α · γ + (1 − α) · γR
ǫ
kγ(s) − γ(t)k2 ≤ , wenn |s − t| ≤ δ. (11.15)
2
Sei R = (ξ j )n(R) j=0
; (α j )n(R)
j=1
eine Riemann-Zerlegung mit |R| ≤ δ, also |ξ j − ξ j−1 | ≤ δ. Für s, t ∈ [ξ j−1 , ξ j ] gilt wegen
γR (ξ j ) = γ(ξ j )
kγ(s) − γR (t)k2 ≤ kγ(s) − γ(ξ j )k2 + kγR (ξ j ) − γR (t)k2 ≤ ǫ.
Also gilt (11.14). Unmittelbar daraus folgt supt∈[a,b] kγ(t) − γR (t)k2 ≤ ǫ.
Aus d(γR (t), γ([a, b])) ≤ kγ(t) − γR (t)k2 ≤ ǫ < ρ folgt mit Bemerkung 11.2.12, dass γR (t) ∈ D. Schließlich folgt aus
wobei die Wegintegrale von φ über die Wege γR bzw. γ̃R für alle hinreichend kleinen |R| definiert sind.
Beweis. Nach
R Lemma 11.2.13
R verläuft γR bzw. γ̃R ganz in D für alle hinreichend kleinen |R|. Da γR und γ̃R äquivalent sind,
gilt immer γ φ(x) dx = γ̃ φ(x) dx.
R R
d γ([a,b]),Rn \D
Wir setzen ρ := min( 2 , 1) > 0. Die Menge
Kρ γ([a, b]) = {x ∈ Rn : d(x, γ([a, b])) ≤ ρ}
ist als Urbild der abgeschlossenen Menge (−∞, ρ] unter der stetigen Abbildung x 7→ d(x, γ([a, b])) abgeschlossen. Da
γ([a, b]) kompakt und daher beschränkt ist, hat auch Kρ γ([a, b]) die Eigenschaft. Wegen Korollar 5.2.13 ist diese Menge
sogar kompakt. Nach Bemerkung 11.2.12 ist sie in D enthalten.
Sei nun ǫ ∈ (0, d γ([a, b]), Rn \ D ). Wegen Satz 6.3.3 ist φ auf Kρ γ([a, b]) gleichmäßig stetig. Somit können wir ein
η > 0 finden, sodass
ǫ
kφ(x) − φ(y)k ≤ ℓ(γ) · , wenn x, y ∈ Kρ γ([a, b]) , kx − yk2 ≤ η. (11.17)
2 · ℓ(γ)
Das ǫ von Lemma 11.2.13 sei jetzt min(ǫ,
R η). Also erhalten wir ein δ > 0 mit alle den Eigenschaften in Lemma 11.2.13.
Gemäß Fakta 11.2.3, 2, existiert γ φ(x) dx. Somit gibt es ein θ ∈ (0, δ] > 0, sodass
Z
ǫ
W(R) − φ(x) dx
≤
γ 2
wenn nur |R| ≤ θ. Sei R = (ξ j )n(R)
j=0
; (α j )n(R)
j=1
eine Riemann-Zerlegung mit |R| ≤ θ (≤ δ).
116 KAPITEL 11. WEGINTEGRALE
R1
Mit Fakta 11.2.3, 4, 6, und wegen φ γ(α j ) = 0 φ γ(α j ) dt erhalten wir folgende Abschätzung
Z
n(R)
Z
X
1
W(R) − φ(x) dx
≤
φ γ(α j ) − φ tγ(ξ j ) + (1 − t)γ(ξ j−1 ) dt
· kγ(ξ j ) − γ(ξ j−1 )k2 . (11.18)
γR
j=1
0
ktγ(ξ j ) + (1 − t)γ(ξ j−1 ) − γ(α j )k2 ≤ tkγ(α j ) − γ(ξ j )k2 + (1 − t)kγ(α j ) − γ(ξ j−1 )k2 ≤ min(ǫ, η) ≤ η, (11.19)
ǫ
und wegen (11.17) auch kφ tγ(ξ j ) + (1 − t)γ(ξ j−1 ) − φ γ(α j ) k ≤ 2·ℓ(γ) für t ∈ [0, 1]. Somit lässt sich (11.18) nach oben
abschätzen durch (vgl. (9.11))
X
n(R)
ǫ ǫ
· kγ(ξ j ) − γ(ξ j−1 )k2 ≤ .
j=1
2 · ℓ(γ) 2
❑
11.2.15 Bemerkung. Aus Lemma 11.2.14 erkennen wir, dass ein stetiges Vektorfeld φ : D → L(Rn , X) bereits wegun-
abhängig ist, wenn Wegintegrale von φ nur über Polygonzüge jeweils nur von Anfangs- und Endpunkt abhängen.
In dem Fall sind Wegintegrale von φ sogar über alle stetigen und rektifizierbaren Wege wegunabhängig.
Als Umkehrung von Satz 11.2.8 gilt folgender Satz 11.2.16, wobei zwei Punkte
x, y in einer Menge D ⊆ Rn durch den Weg γ : [a, b] → D verbindbar heißen, wenn
γ(a) = x und γ(b) = y.
11.2.16 Satz. Sei D ⊆ Rn eine offene Menge, sodass sich je zwei Vektoren in D
durch einen stetigen und stückweise stetig differenzierbaren Weg verbinden lassen. Sei
φ : D → L(Rn , X) stetig und wegunabhängig. Dann gilt φ(x) = d f (x) für die stetig
differenzierbare Funktion f : D → X
Z
f (x) = φ(y) dy,
γ
wobei x0 ein fester Punkt ist, und γ irgend ein stetiger und stückweise stetig differen-
zierbarer Weg mit γ(a) = x0 , γ(b) = x ist.
Die Funktion f : D → X mit der Eigenschaft, dass φ(x) = d f (x), ist dabei eindeutig
bis auf eine additive Konstante aus X.
∂f
Beweis. Nach Voraussetzung ist f wohldefiniert. Wir zeigen ∂x i
(x) = φ(x)ei für alle
i = 1, . . . , n.
Seien x ∈ D und δ > 0 so, dass Uδ (x) ⊆ D. Sei γ : [a, b] → D ein Weg mit
γ(a) = x0 , γ(b) = x. Für t ∈ (−δ, δ) sei βt : [0, 1] → Rn die gerade Strecke βt (s) =
s(x+tei )+(1− s)x und γt : [b, b+1] → Rn der zu βt äquivalente Weg γt (τ) = βt (τ−b) =
x + t(τ − b)ei . Es folgt
Z Z Z
f (x + tei ) = φ(x) dx = φ(x) dx + φ(x) dx.
γ⊕γt γ γt
Also
Z Z Z 1
f (x + tei ) − f (x) 1 1
= φ(x) dx = φ(x) dx = φ(x + tsei ) ei ds.
t t γt t βt 0
4 Man beachte, dass γR (ξ j ) = γ(ξ j ).
11.2. WEGINTEGRALE 117
Wegen der Stetigkeit der Funktion φ konvergiert der Integrand für t → 0 gleichmäßig
∂f
in s ∈ [0, 1] gegen die Konstante φ(x)ei . Nach Satz 8.7.2 folgt ∂x i
(x) = φ(x)ei .
Die Eindeutigkeit folgt sofort aus Satz 11.2.8.
❑
11.2.17 Bemerkung. Die Bedingung an die Menge D in dem Satz wird insbesondere
von konvexen Mengen D erfüllt, da zwei Punkte durch eine gerade Strecke verbunden
werden können.
Wir wollen an den Begriff einer zusammenhängender Teilmenge E eines metrischen Raumes erinnern, siehe Definition
6.2.2: E heißt zusammenhängend, wenn man E nicht als Vereinigung zweier nichtleerer getrennter Mengen schreiben kann.
Dabei heißen A und B getrennt, wenn c(A) ∩ B = A ∩ c(B) = ∅.
11.2.18
T Lemma. Ist (Ei )i∈I eine
S Familie bestehend aus zusammenhängenden Teilmengen eines metrischen Raumes, sodass
i∈I Ei , ∅, so ist auch E := i∈I Ei zusammenhängend.
T
Beweis. Wir halten einen Punkt x ∈ i∈I Ei fest. Angenommen E = A∪B ˙ mit getrennten, nichtleereren Mengen A und B.
Wir wählen die Bezeichnung so, dass x ∈ A.
˙ ∩ Ei ) für jedes i ∈ I. Wegen c(A ∩ Ei ) ∩ (B ∩ Ei ) ⊆ c(A) ∩ B = ∅ und (A ∩ Ei ) ∩ c(B ∩ Ei ) ⊆
Es folgt Ei = (A ∩ Ei )∪(B
A ∩ c(B) = ∅ sind auch A ∩ Ei und B ∩ Ei getrennt.
Da Ei zusammenhängend
S ist, muss eine dieser Menge leer sein. Wegen x ∈ A ∩ Ei muss B ∩ Ei = ∅. Das gilt für alle
i ∈ I, und somit B ∩ E = i∈I (B ∩ Ei ) = ∅ im Widerspruch zur Wahl von A und B.
❑
11.2.19 Lemma. Ist D ⊆ Rn eine nichtleere, offene Menge, so sind je zwei Punkte aus D genau dann durch einen stetigen
Weg verbindbar, wenn D zusammenhängend ist (vgl. Definition 6.2.2). In diesem Fall sind je zwei Punkte aus D sogar durch
einen achsenparallelen Polygonzug5 verbindbar.
Beweis. Angenommen je zwei Punkte aus D sind durch einen stetigen Weg verbindbar. Dann sei x irgendein fester Punkt
aus D. Zu jedem y ∈ D gibt es einen stetigen Weg γy : [ay , by ] → D mit γy (ay ) = x und γy (ay ) = y. Es folgt
[ [
D= {y} ⊆ γy ([ay , by ]) ⊆ D.
y∈D y∈D
Also ist D die Vereinigung der nach Proposition 6.2.4 zusammenhängenden Mengen γy ([ay , by ]), y ∈ D. Nach unserer Wahl
von γy haben diese Mengen zumindest den Punkt x gemein. Nach Lemma 11.2.18 ist D zusammenhängend.
Sei nun umgekehrt D zusammenhängend und x ∈ D wieder fest. Wir bezeichnen mit A die Menge aller Punkte y ∈ D,
die mit x durch einen achsenparallelen Polygonzug verbindbar sind. Da − →
xx auch ein solcher ist, folgt x ∈ A, also A , ∅.
Klarerweise ist B := D \ A die Menge aller y ∈ D, die mit x nicht durch einen achsenparallelen Polygonzug verbindbar sind.
Sei y ∈ A und δ > 0 so klein, dass Uδ (y) - definiert bezüglich der k.k∞ -Norm auf Rn - ganz in D enthalten ist. Ist
nun −x−0−→
x1 , . . . , −
x−m−1
−−−−x→
m ein achsenparalleler Polygonzug von x nach y, daher x0 = x und xm = y, und z ∈ Uδ (y), so gilt
z = y + λ1 e1 + · · · + λn en mit |λ1 |, . . . , |λn | < δ und daher ist
− −−−−−−−−−−→ −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−→
x−0−→
x1 , . . . , −
x−m−1
−−−−x→
m , y (y + λ1 e1 ), . . . , (y + λ1 e1 + . . . λn−1 en−1 ) (y + λ1 e1 + . . . λn en )
ein achsenparalleler Polygonzug von x nach z. Also ist z ∈ A und daher Uδ (y) ⊆ A. Somit ist A offen, und kein Punkt y aus
A kann Häufungspunkt von B sein, da ja Uδ (y) keine Punkte aus B enthält. Also gilt A ∩ c(B) = ∅.
Sei nun y ∈ B und δ > 0 so klein, dass Uδ (y) ⊆ D. Ist z = y + λ1 e1 + · · · + λn en ∈ Uδ (y) und wäre z ∈ A mit einem
achsenparalleler Polygonzug −x−0−→
x1 , . . . , −
x−m−1
−−−−x→
m von x nach z, so wäre
− −−−−−−−−−−−−−−−−−−−−−−−−→ −−−−−−−−−−→
x−0−→
x1 , . . . , −
x−m−1
−−−−x→
m , z (y + λ1 e1 + . . . λn−1 en−1 ), . . . , (y + λ1 e1 ) y
ein achsenparalleler Polygonzug von x nach y, und daher y ∈ A. Dieser Widerspruch zeigt, dass z ∈ B und somit Uδ (y) ⊆ B.
Also ist auch B offen, und kein Punkt y aus B kann Häufungspunkt von A sein, da ja Uδ (y) keine Punkte aus A enthält. Somit
gilt auch c(A) ∩ B = ∅.
Da D zusammenhängend ist, und da A , ∅, muss B = ∅ bzw. D = A, was aber genau bedeutet, dass alle Punkte aus D
mit x durch einen achsenparalleler Polygonzug verbindbar sind. Klarerweise sind dann auch zwei beliebige Punkte aus D
durch einen achsenparalleler Polygonzug - zumindest via x - verbindbar.
❑
Offene zusammenhängende Teilmengen von Rn heißen Gebiete.
11.2.20 Bemerkung. Da Polygonzüge stetig und stückweise stetig differenzierbarer sind, treffen die in Satz 11.2.16 gemach-
ten Voraussetzungen an die Menge D genau auf Gebiete zu.
Man kann die Voraussetzungen für Satz 11.2.16 noch dahingehend abschwächen, dass nur Wegintegrale von φ über
achsenparalleler Polygonzüge wegunabhängig sind. Das ist möglich, da man die Wege γ in der Aussage und im Beweis von
Satz 11.2.16 wegen Lemma 11.2.19 als achsenparallele Polygonzüge wählen kann. Der im Beweis verwendete Weg βt ist
auch eine achsenparallele gerade Strecke, womit γ ⊕ γt ebenfalls ein achsenparalleler Polygonzug ist.
11.2.21 Lemma. Ist D ⊆ Rn eine nichtleere, offene Menge, so lässt sich D als Vereinigung von paarweise disjunkten
Gebieten schreiben: [
D= Di
i∈I
Ist γ : [a, b] → D ein stetiger Weg, so liegt das Bild von γ in genau einem dieser Gebiete.
Beweis. Wir definieren auf D eine Relation. x ∼ y gelte genau dann, wenn es ein Gebiet G ⊆ D gibt, sodass x, y ∈ G. Da
für ǫ > 0 hinreichend klein die offene Kugel Uǫ (x) ein in D enthaltenes Gebiet ist (siehe Lemma 11.2.19), ist ∼ reflexiv. Die
Symmetrieeigenschaft ist offensichtlich, und die Translativität folgt sofort aus Lemma 11.2.18.
Somit ist ∼ eine Äquivalenzrelation. Also zerfällt D in Äquivalenzklassen [x]∼ , x ∈ D. Klarerweise ist [x]∼ die
Vereinigung aller Gebiete, die x enthalten, und daher offen und zusammenhängend (vgl. Lemma 11.2.18) und daher ein
Gebiet.
Ist γ : [a, b] → D stetig, so ist
[
Di (11.20)
i∈I,γ([a,b])∩Di ,∅
als Vereinigung offener Mengen offen und enthält γ([a, b]). Für i ∈ I, γ([a, b]) ∩ Di , ∅ ist nach Lemma 11.2.18 jede der
Mengen γ([a, b]) ∪ Di zusammenhängend. Lemma 11.2.18 nochmals auf alle diese Mengen angewandt zeigt, dass (11.20)
zusammenhängend ist. Also ist diese Menge ein Gebiet und daher gleich einer der Di .
❑
11.2.22 Bemerkung. Wendet man Satz 11.2.16 auf jedes der disjunkten Gebiete in Lemma 11.2.21 an, so erhält man
gemeinsam mit Satz 11.2.8, dass ist ein Vektorfeld genau dann Gradientenfeld ist, wenn es wegunabhängig ist.
Die Bedingung aus Satz 11.2.16 ist zwar von theoretischer Bedeutung, aber sie zu
überprüfen ist bei den meisten Vektorfeldern praktisch unmöglich. Bei stetig differen-
zierbaren Vektorfeldern gibt es eine greifbarere Bedingung.
Sei also D ⊆ Rn offen, φ : D → L(Rn , X) stetig differenzierbar. Angenommen, φ ist
die Ableitung einer Funktion f : D → X, also φ = d f . Klarerweise ist dann f ∈ C 2 (D)
und wegen dem Satz von Schwarz (x ∈ D)
∂ ∂2 f ∂2 f ∂
φ(x)e j = (x) = (x) = φ(x)ei . (11.21)
∂xi ∂x j ∂xi ∂xi ∂x j ∂x j
mit einer C 2 Funktion c(y), die nur von y abhängt. Nun leiten wir das nach y ab, ver-
wenden die zweite Gleichung von oben und erhalten
!
1 2 ′ ∂f x 1
2
+ x + c (y) = = + x2 + y2 .
x cos y ∂y y x cos2 y
3
Also muss c(y) von der Gestalt c(y) = y3 + c sein. Wir sehen, dass tatsächlich φ = d f
ist, wobei !
x tan y x3 + y3
f = + x2 y + .
y x 3
Wir wollen nun zeigen, dass (11.22) für den einfachen Fall eines offenen Quaders
Q
D = ni=1 (ai , bi ) auch hinreichend ist. In der Tat gilt allgemein, dass sie sogar für so-
genannte einfach zusammenhängende Gebiete6 hinreichend ist. Die Methoden um die
allgemeinere Variante zu beweisen, bedürfen eines größeren Apparates von Mathema-
tischen Begriffen (siehe Definition 11.3.1).
Q
11.2.24 Satz. Sei D = ni=1 (ai , bi ) ⊆ Rn , und sei φ : D → L(Rn , X) stetig differenzier-
bar. Gilt dann (11.22), so ist φ ein Gradientenfeld.
Nun leiten wir diese Gleichung nach xi ab, und werten bei x aus. Da für j < i im j-ten
Summanden von (11.23) die Variable xi nicht vorkommt, ist seine Ableitung gleich
Null.
Beim i-ten Summanden tritt xi in der oberen Integralgrenze auf, weswegen seine
Ableitung nach xi wegen der Kettenregel gleich φ(vi−1 + (xi − c j )ei )ei = φ(vi )ei ist.
Für j > i tritt xi nur im Integranden auf. Wegen Korollar 8.7.11 ist seine Ableitung
gleich Z x j −c j
∂
φ(v j−1 + se j )e j ds
0 ∂xi
6 In der Ebene kann man sich das als Gebiet ohne Löcher vorstellen.
120 KAPITEL 11. WEGINTEGRALE
∂f Xn
(x) = φ(vi )ei + φ(v j )ei − φ(v j−1 )ei = φ(vn )ei = φ(x)ei .
∂xi j=i+1
11.2.25 Beispiel. Sei I ein reelles Intervall und x : I → Rn eine C 1 -Funktion mit x(I) ⊆
D für eine gewisse offene Teilmenge D von Rn . Nun genüge x der Differentialgleichung
X
n
f j x(t) · x′j (t) = 0, t ∈ I, (11.24)
j=1
wobei f1 , . . . , fn : D → R alle in C(D) sind. Ziel ist es, mehr über die Funktion x in
Erfahrung zu bringen.
Das geht sicher dann, wenn ( f1 , . . . , fn ) : D → L(Rn , R) ein Gradientenfeld ist,
dh. wenn ( f1 , . . . , fn ) = dF für ein F ∈ C 1 (D). Man nennt (11.24) dann eine exakte
Differentialgleichung. In der Tat liest sich in diesem Fall (11.24) wegen der Kettenregel
(siehe auch Bemerkung 10.1.20) als
(F ◦ x)′ (t) = 0, t ∈ I,
und daher F ◦ x ≡ c für eine gewisse reelle Konstante c.
Ist D ein offener Quader und sind die f j alle sogar C 1 , so ist gemäß Satz 11.2.24
∂ ∂
fj = fi , i, j ∈ {1, . . . , n},
∂xi ∂x j
eine hinreichende Bedingung dafür, dass (11.24) eine exakte Differentialgleichung ist.
Nun kann es sein, dass zwar (11.24) keine exakte Differentialgleichung ist, aber es
dennoch eine Funktion m : D → R gibt, sodass die aus (11.24) abgeleitete Differenti-
algleichung
X X
n n
m x(t) · f j x(t) · x′j (t) = (m · f j ) x(t) · x′j (t) = 0, t ∈ I,
j=1 j=1
eine solche ist. Dann folgt nämlich auch G ◦ x ≡ c für eine gewisse reelle Konstante c,
wobei G eine Stammfunktion des Gradientenfeldes (m · f1 , . . . , m · fn ) ist. Eine solche
Funktion m nennt man Integrierenden Faktor.
11.2.26 Beispiel. Sei b > 0 und y : (0, b) → R eine C 1 -Funktion, die der Differential-
gleichung
4x + 3y(x)2 + 2xy(x)y′ = 0 (11.25)
genügt. Um diese Gleichung mit der in Beispiel 11.2.25 vorgestellten Methode behan-
deln zu können, betrachten wir ! !
x(t) t
=
y(t) y(t)
11.3. HOMOTOPIE, EINFACHER ZUSAMMENHANG 121
als Abbildung von (0, b) nach (0, b) × R. Dann schreibt sich unsere Gleichung als
! !
x(t) ′ x(t)
f · x (t) + g · y′ (t) = 0, (11.26)
y(t) y(t)
wobei f (x, y)T = 4x + 3y2 und g (x, y)T = 2xy. Wegen
! !
∂ x ∂ x
f = 6y , 2y = g
∂y y ∂x y
ist (11.26) nicht exakt. Durch Multiplizieren mit m (x, y)T = x2 folgt aus (11.26) aber
! ! ! !
x(t) x(t) ′ x(t) x(t)
m ·f · x (t) + m ·g · y′ (t) = 0. (11.27)
y(t) y(t) y(t) y(t)
Wegen ! !
∂ x 2 2 ∂ x
(m · f ) = 6yx = 6x y = (m · g)
∂y y ∂x y
zusammen mit Satz 11.2.24 ist (11.27) exakt.
Man sieht leicht, dass G (x, y)T = x4 +x3 y2 eine Stammfunktion von (m· f, m·g) ist.
T
Also muss G (x(t), y(t)) = c, t ∈ (0, b) für eine Konstante c ∈ R sein. Das bedeutet
t4 + t3 y2 (t) = c bzw.
c
y2 (t) = 3 − t.
t
Da dieser Ausdruck für alle t ∈ (0, b) nichtnegativ ist, muss c ≥ b4 . Also muss
r
c
y(x) = ε · − x, x ∈ (0, b),
x3
für gewisse ε ∈ {+1, −1}, c ∈ [b, +∞). Man überprüft sofort, dass auch jede derartige
Funktion tatsächlich eine Lösung von (11.25) ist.
Ein Gebiet D ⊆ Rn heißt einfach zusammenhängend, wenn je zwei stetige Wege mit gleichem Anfangs- und gleichem
Endpunkt homotop sind.
Offensichtlich kann man durch affines Umskalieren immer [c, d] = [0, 1] oder dergleichen annehmen.
11.3.2 Fakta.
1. Betrachtet man statt der Homotopie Γ : [a, b]×[c, d] → D zwischen γ0 und γ1 die Homotopie (s, t) 7→ Γ(s, c+d −t),
so sieht man sofort, dass homotop zu sein eine symmetrische Eigenschaft ist.
2. Seien γ0 , γ1 : [a, b] → D stetig mit jeweils gleichem Anfangs- und gleichem Endpunkt, und sei α : [ã, b̃] → [a, b]
eine streng monoton wachsende Bijektion. Sind γ0 und γ1 homotop über die Homotopie Γ : [a, b] × [0, 1] → D, so
ist Γ̃ : [ã, b̃]×[0, 1] → D definiert durch Γ̃(s, t) = Γ(α(s), t) eine Homotopie. Also sind auch γ0 ◦α, γ1 ◦α : [ã, b̃] → D
homotop.
122 KAPITEL 11. WEGINTEGRALE
3. Sind γ0 , γ1 : [a, b] → D stetig und äquivalent, dh. γ1 = γ0 ◦ α für eine streng monoton wachsende Bijektion
α : [a, b] → [a, b], so ist
(t, r) 7→ γ0 ((1 − r)t + r · α(t))
eine Homotopie zwischen γ0 und γ1 . Wegen α(a) = a, α(b) = b sind γ0 und γ1 auch homotop.
4. Sind γ0 , γ1 , γ2 : [a, b] → D stetig mit jeweils gleichem Anfangs- und gleichem Endpunkt und sind γ0 und γ1
sowie γ1 und γ2 homotop über Homotopien Γ01 : [a, b] × [0, 1] → D und Γ12 : [a, b] × [1, 2] → D, so ist
Γ : [a, b] × [0, 2] → D definiert durch Γ(t, r) = Γ01 (t, r) falls r ∈ [0, 1] und Γ(t, r) = Γ12 (t, r) falls r ∈ [1, 2] wegen
Γ01 (t, 1) = γ1 (t) = Γ12 (t, 1) wohldefiniert.
Man zeigt leicht mit Hilfe der Charakterisierung der Stetigkeit durch Folgen, dass Γ stetig ist. Also sind auch γ0
und γ2 homotop.
5. Ist D ⊆ Rn ein Gebiet, und sind γ0 , γ1 : [a, b] → D zwei stetige Wege mit gleichem Anfangs- und gleichem
Endpunkt, sodass die Konvexkombinationen
γα (t) := α · γ1 + (1 − α) · γ0
für alle α ∈ [0, 1] und alle t ∈ [a, b] in D liegen, so ist Γ(t, α) := γα (t) stetig auf [a, b] × [0, 1] (vgl. Korollar 9.1.3).
Also sind γ0 und γ1 homotop.
Insbesondere sind konvexe Gebiete D einfach zusammenhängend.
6. Ist γ : [a, b] → D irgendein stetiger Weg, so folgt aus Lemma 11.2.13, dass für ein gewisses δ > 0 und alle
Riemannzerlegungen R von [a, b] mit |R| ≤ δ alle Konvexkombinationen
α · γR (t) + (1 − α) · γ(t)
für alle α ∈ [0, 1] und alle t ∈ [a, b] in D liegen. Also sind γ und der Polygonzug γR homotop.
7. Sei Γ : [a, b] × [c, d] → D ist stetig, und seien h0 , h1 : [a, b + d − c] → [a, b] × [c, d] definiert durch
t, c t ∈ [a, b]
h0 (t) :=
b, c + (t − b) t ∈ [b, b + d − c]
und durch
a, c + (t − a) t ∈ [a, a + d − c]
t − d + c, d
h1 (t) =
t ∈ [a + d − c, b + d − c]
.
Man sieht sofort, dass h0 , h1 beide stetig sind und somit auch χ0 , χ1 : [a, b+d −c] → D, wobei χ j = Γ◦h j , j = 0, 1.
Außerdem haben χ0 und χ1 den gleichen Anfangs- und den gleichen Endpunkt. Zudem ist Θ : [a, b+d−c]×[0, 1] →
D wegen der Konvexität von [a, b] × [c, d] wohldefiniert durch
wobei Θ(t, j) = χ j (t) für j = 0, 1 und t ∈ [a, b + d − c], sowie Θ(a, s) = χ0 (a) = χ1 (a) und Θ(b, s) = χ0 (b) = χ1 (b).
Als Zusammensetzung stetiger Funktionen ist Θ auch stetig. Somit sind χ0 und χ1 homotop.
11.3.3 Definition. Sei D ⊆ Rn eine offene Menge und sei φ : D → L(Rn , X) ein stetiges Vektorfeld. Dann heißt φ lokal
wegunabhängig, wenn es zu jedem x ∈ D ein offenes D(x) ⊆ D 7 gibt, sodass φ|D(x) wegunabhängig ist.
11.3.4 Bemerkung. Wegen Bemerkung 11.2.22 ist φ genau dann lokal wegunabhängig, wenn es ein lokales Gradientenfeld
ist, dh. es existiert ein offenes D(x) ⊆ D und eine f ∈ C1 (D(x)), sodass d f (y) = φ(y) für alle y ∈ D(x).
11.3.5 Bemerkung. Da mit x = (ξ j )nj=1 die Kugel Uǫ (x) (bzgl. k.k∞ gebildet) gerade der offene Quader
Q
D = nj=1 (ξ j − ǫ, ξ j + ǫ) ist, folgt aus Satz 11.2.24 und Bemerkung 11.3.4, dass für stetig differenzierbare Vektorfelder,
die Bedingung (11.22) hinreichend und wegen dem Satz von Schwarz, siehe (11.21), auch notwendig dafür ist, dass ein
Vektorfeld lokal wegunabhängig ist.
11.3.6 Satz. Sei D ⊆ Rn ein Gebiet, und sei φ : D → L(Rn , X) ein stetiges lokal wegunabhängiges Vektorfeld. Sind
γ0 , γ1 : [a, b] → D zwei stetige und rektifizierbare Wege mit gleichen Anfangs- und gleichen Endpunkten, die homotop sind,
so gilt Z Z
φ(x) dx = φ(x) dx.
γ0 γ1
7 Klarerweise kann man D(x) kleiner machen und daher immer als ǫ-Kugel vzgl. bezüglich der k.k -Norm
∞
annehmen.
11.3. HOMOTOPIE, EINFACHER ZUSAMMENHANG 123
Beweis. Sei ǫ > 0. Nach Lemma 11.2.14 angewandt auf γ0 bzw. γ1 ergibt ein θ > 0, sodass aus |R| ≤ θ für j = 0, 1 folgt,
dass (γ̃ j )R ganz in D verläuft und dass
Z
Z
φ(x) dx − φ(x) dx
≤ ǫ. (11.28)
γj (γ̃ j )R
Weiters sei Γ : [a, b] × [0, 1] → D wie in Definition 11.3.1. Voraussetzungsgemäß gibt es zu jedem x ∈ Γ([a, b] × [0, 1])
ein ρ x > 0 mit U2ρ x (x) ⊆ D, sodass φ|U2ρ x (x) wegunabhängig ist. Also ist (Uρ x (x))x∈Γ([a,b]×[0,1]) eine offene Überdeckung
der kompakten Menge Γ([a, b] × [0, 1]). Wir werden im letzten Kapitel sehen, dass dann schon endlich viele dieser offenen
Mengen genügen, um Γ([a, b] × [0, 1]) zu überdecken. Also gibt es x1 , . . . , xm ∈ Γ([a, b] × [0, 1]), sodass
[
m
Uρ x j (x j ) ⊇ Γ([a, b] × [0, 1]). (11.29)
j=1
Wir setzen ρ := min(ρ x1 , . . . , ρ xm ) > 0. Ist x ∈ Γ([a, b] × [0, 1]) und y ∈ Uρ (x), so gilt d∞ (x, x j ) < ρ ≤ ρ x j für ein
j ∈ {1, . . . , m}, und daher d∞ (y, x j ) < 2ρ. Es folgt Uρ (x) ⊆ U2ρ x j (x j ). Somit ist φ|Uρ (x) wegunabhängig.
Gemäß Satz 6.3.3 gibt es ein η ∈ (0, θ], sodass aus max(|s1 − s2 |, |t1 − t2 |) = d∞ (s1 , t1 ), (s2 , t2 ) < η folgt, dass
kΓ(s1 , t1 ) − Γ(s2 , t2 )k∞ < ρ. Seien a = s0 < s1 < · · · < s p = b, 0 = t0 < t1 · · · < t p = 1, sodass |s j − s j−1 |, |tk − tk−1 | < η für
alle j, k = 1, . . . , p. Also verlaufen die Polygonzüge
−−−−−−−−−−−−−−−−−−−−→ −−−−−−−−−−−−−−−−→ −−−−−−−−−−−−−−−−−−−−→ −−−−−−−−−−−−−−−−→
α jk := Γ(s j−1 , tk−1 ) Γ(s j−1 , tk ), Γ(s j−1 , tk ) Γ(s j , tk ) und β jk := Γ(s j−1 , tk−1 ) Γ(s j , tk−1 ), Γ(s j , tk−1 ) Γ(s j , tk )
p Z
X p Z
X p Z
X
0= φ(x) dx = −−−−−−−−−−−−−−−−−−−−−−−→
φ(x) dx + −−−−−−−−−−−−−−−−−−→
φ(x) dx
j,k=1 γ jk j,k=1 Γ(s j−1 ,tk−1 ) Γ(s j−1 ,tk ) j,k=1 Γ(s j−1 ,tk ) Γ(s j ,tk )
p Z
X p Z
X
− −−−−−−−−−−−−−−−−−−−−−−−→
φ(x) dx − −−−−−−−−−−−−−−−−−−→
φ(x) dx.
j,k=1 Γ(s j−1 ,tk−1 ) Γ(s j ,tk−1 ) j,k=1 Γ(s j ,tk−1 ) Γ(s j ,tk )
Nach Indexverschiebungen (k k + 1 bzw. j j − 1) in den letzten beiden Summen kürzen sich die meisten Summanden
der ersten (zweiten) Summe mit welchen aus der vierten (dritten) Summe. Übrig bleibt
p Z
X p Z
X
0= −−−−−−−−−−−−−−−−−−→
φ(x) dx + −−−−−−−−−−−−−−−−−−→
φ(x) dx
k=1 Γ(s0 ,tk−1 ) Γ(s0 ,tk ) j=1 Γ(s j−1 ,t p ) Γ(s j ,t p )
p Z
X p Z
X
− −−−−−−−−−−−−−−−−−−−→
φ(x) dx − −−−−−−−−−−−−−−−−−−→
φ(x) dx. (11.30)
k=1 Γ(s p ,tk−1 ) Γ(s p ,tk ) j=1 Γ(s j−1 ,t0 ) Γ(s j ,t0 )
Man beachte, dass Γ(s0 , t) = Γ(a, t) = γ0 (a) und Γ(s p , t) = Γ(b, t) = γ0 (b) für alle t ∈ [0, 1]. Also sind die gerade Strecken
−−−−−−−−−−−−−−−−→ −−−−−−−−−−−−−−−−−→
Γ(s0 , tk−1 ) Γ(s0 , tk ) und Γ(s p , tk−1 ) Γ(s p , tk ) konstant, und somit verschwinden alle Wegintegrale in der ersten und in der
dritten Summe in (11.30). Setzen wir
−−−−−−−−−−−−−−→ −−−−−−−−−−−−−−−−→ −−−−−−−−−−−→ −−−−−−−−−−−−−→
γ̃0 := Γ(s0 , 0) Γ(s1 , 0), . . . , Γ(s p−1 , 0) Γ(s p , 0) = γ0 (s0 ) γ0 (s1 ), . . . , γ0 (s p−1 ) γ0 (s p ),
Da ǫ > 0 beliebig war, folgt die erste Behauptung. Wenn D einfach zusammenhängend ist, dann sind zwei Wegen mit
gleichen Anfangs- und Endpunkt immer homotop.
❑
11.3.7 Definition. Ein stetiger Weg γ : [a, b] → D heißt geschlossen, wenn γ(a) = γ(b).
Seien γ0 , γ1 : [a, b] → D zwei geschlossene und stetige Wege. Wir sagen, dass diese beiden radial homotop in D sind,
falls für eine gewisse Homotopie Γ : [a, b] × [c, d] → D zwischen γ0 und γ1 gilt Γ(a, s) = Γ(b, s), s ∈ [c, d].
Ein geschlossener Weg γ : [a, b] → D heißt nullhomotop, wenn er zu irgendeinem konstanten Weg β : [a, b] → D, dh.
β ≡ c ∈ D, radial homotop ist.
124 KAPITEL 11. WEGINTEGRALE
Auch hier kann [c, d] durch eine affine Transformation immer durch andere kompakte Intervalle, etwa [0, 1], ersetzt
werden.
11.3.8 Fakta.
1. Ganz ähnlich wie in Fakta 11.3.2 sieht man, dass auch radial homotop zu sein symmetrische Eigenschaft ist.
2. Seien γ0 , γ1 : [a, b] → D stetig geschlosen, und sei α : [ã, b̃] → [a, b] eine streng monoton wachsende Bijektion.
Sind γ0 und γ1 radial homotop, so sieht man wie in Fakta 11.3.2, dass auch γ0 ◦ α, γ1 ◦ α : [ã, b̃] → D radial
homotop sind.
3. Ähnlich wie in Fakta 11.3.2 sieht man auch, dass zwei stetige, geschlossene und äquivalente Wege γ0 , γ1 : [a, b] →
D radial homotop im Sinne von Definition 11.3.7 sind.
4. Wie in Fakta 11.3.2 zeigt man auch für drei stetige, geschlossene Wege γ0 , γ1 , γ2 : [a, b] → D, sodass γ0 und γ1
sowie γ1 und γ2 radial homotop sind, dass dann auch γ0 und γ2 radial homotop sind.
5. Seien γ0 , γ1 : [a, b] → D zwei stetige Wege mit gleichen Anfangs- und gleichen Endpunkt, und sei γ : [a, 2b−a] →
D definiert duch
γ|[a,b] = γ0 und γ(b + t − a) = γ1 (a + b − t), t ∈ (a, b]. (11.31)
Dann ist γ offensichtlich stetig und geschlossen. Ist umgekehrt γ : [a, 2b − a] → D stetig und geschlossen, und
definiert man γ0 , γ1 : [a, b] → D durch (11.31), so sind das zwei stetige Wege mit gleichen Anfangs- und gleichen
Endpunkt.
für alle t ∈ [a, b], α ∈ [0, 1], so sind γ0 und γ1 radial homotop.
11.3.9 Bemerkung. Sei D ⊆ Rn offen und φ : D → L(Rn , X) ein stetiges Vektorfeld. Sind γ0 , γ1 , γ stetige Wege wie in Fakta
11.3.8, 5, sodass sie obendrein rektifizierbar sind, so folgt aus Fakta 11.2.3, 4 und 1, dass
Z Z Z Z Z
φ(x) dx = φ(x) dx + φ(x) dx = φ(x) dx − φ(x) dx.
γ γ|[a,b] γ|[b,2b−a] γ0 γ1
Daraus erkennt man, dass φ genau denn wegunabhängig ist (vgl. Definition 11.2.9), wenn Wegintegrale über stetige, rekti-
fizierbare und geschlossene Wege verschwinden.
Da oben γ genau dann ein Polygonzug ist, wenn γ0 und γ1 beide Polygonzüge sind, reicht gemäß Bemerkung 11.2.15
für die Wegunabhängigkeit schon, dass Wegintegrale über geschlossene Polygonzüge verschwinden.
Gemäß Bemerkung 11.2.22 ist das notwendig und hinreichend dafür, dass φ ein Gradientenfeld ist.
Ein stetiger, geschlossener Wege γ : [0, 2π] → D ist genau dann nullhomotop, wenn es eine stetige Abbildung
Λ : D → D8 gibt, sodass γ(t) = Λ(exp(it)).
Seien γ0 , γ1 : [a, b] → D und zwei stetige Wege mit gleichen Anfangs- und gleichen Endpunkt, und sei γ : [a, 2b −
a] → D stetig und geschlossen, sodass (11.31) gilt. γ0 und γ1 sind genau dann homotop, wenn γ nullhomotop ist.
D ist einfach zusammenhängend genau dann, wenn alle stetigen geschlossenen Wege nullhomotop sind.
Beweis.
Sei γ nullhomotop, und Γ : [0, 2π] × [0, 1] → D, sodass γ(t) = Γ(t, 1), t ∈ [0, 2π], Γ(t, 0) ≡ c ∈ D, und Γ(0, s) =
Γ(2π, s).
Wir definieren Λ : D → D durch Λ(r exp(it)) := Γ(t, r). Λ ist bei 0 wohldefiniert, da Γ(t, 0) = c für alle t ∈ [0, 2π],
und Λ ist bei allen Punkten der Form r exp(i0) = r exp(i2π) wohldefiniert, da Γ(0, s) = Γ(2π, s).
Nun gilt Γ = Λ ◦ ((t, r) 7→ r exp(it)). Um einzusehen, dass Λ stetig ist, zeigen wir, dass das Urbild jeder abgeschlos-
senen Menge wieder abgeschlossen in D. Ist A ⊆ Rn abgeschlossen, so auch Γ−1 (A) ⊆ [0, 2π] × [0, 1]. Da letztere
Menge kompakt ist, ist auch Γ−1 (A) kompakt und daher auch ihr Bild unter der stetigen Abbildung (t, r) 7→ r exp(it),
welches aber genau Λ−1 (A) ⊆ D ist. Insbesondere ist Λ−1 (A) abgeschlossen.
Die Umkehrung ist einfacher, da bei gegebenen Λ die Funktion Γ(t, r) := Λ(r exp(it)) zeigt, dass γ und der konstante
Weg t 7→ Λ(0) radial homotop sind.
Um einzusehen, dass Λ stetig ist, sei A ⊆ Rn abgeschlossen. Nun ist Γ−1 (A) ⊆ [−1, 1] × [−1, 1]. Da letztere Menge
kompakt
√ ist, ist auch Γ−1 (A) kompakt und daher auch ihr Bild unter der stetigen Abbildung (s, t) 7→ (−s − it ·
1 − s2 ), welches aber genau Λ−1 (A) ⊆ D ist. Insbesondere ist Λ−1 (A) abgeschlossen.
Nach dem letzten Punkt ist t 7→ Λ(exp(it)), t ∈ [0, 2π] ein ein nullhomotoper Weg. Nun gilt
γ0 (− cos t) = γ(− cos t) t ∈ [0, π]
Λ(exp(it)) = Γ(− cos t, − sgn(sin t)) =
γ (− cos t) = γ(2 + cos t) t ∈ [π, 2π]
1
Also Λ(exp(it)) = γ(φ(t)), wobei φ(t) = − cos t, t ∈ [0, π] und φ(t) = 2+cos t, t ∈ [π, 2π]. Wir definieren schließlich
Θ : [−1, 3] × [0, 2] → D durch
Λ(α exp(i(s + 1) π2 ))
α ∈ [0, 1]
Θ(s, α) =
γ((2 − α)φ((s + 1) π ) + (α − 1)s) α ∈ [1, 2]
2
Dann gilt Θ(s, 0) = Λ(0), Θ(s, 2) = γ(s) und Θ(−1, α) = Θ(3, α) = Λ(α), α ∈ [0, 1], Θ(−1, α) = Θ(3, α) = γ(−1) =
γ(3), α ∈ [1, 2]. Also ist γ nullhomotop.
Ist umgekehrt γ nullhomotop, so offensichtlich auch t 7→ γ( 2tπ − 1), t ∈ [0, 2π]. Also gibt es nach dem ersten Punkt
eine Abbildung Λ : D → D mit Λ(exp(it)) = γ( 2tπ − 1).
√
Wir definieren Γ : [−1, 1] × [−1, 1] → D stetig durch Γ(s, t) = Λ(−s − it · 1 − s2 ), und sehen Γ(−1, t) = Λ(1) =
γ(−1) = γ(3) = γ0 (−1) = γ1 (−1), Γ(1, t) = Λ(−1) = γ(1) = γ0 (1) = γ1 (1).
Außerdem gilt für s ∈ [−1, 1] mit cos t = −s, t ∈ [0, π]
p 2t 2t
Γ(s, −1) = Λ(−s + i 1 − s2 ) = γ( − 1) = γ0 ( − 1)
π π
p 2(2π − t) 2(2π − t) 2t
Γ(s, 1) = Λ(−s − i 1 − s2 ) = γ( − 1) = γ1 (3 − ) = γ1 ( − 1).
π π π
π(δ+1)
Also ist (δ, η) 7→ Γ(− cos 2 , η), (δ, η) ∈ [−1, 1] eine Homotopie zwischen γ0 und γ1 .
❑
11.3.11 Korollar. Sei D ⊆ Rn ein Gebiet, und sei φ : D → L(Rn , X) ein stetiges lokal wegunabhängiges Vektorfeld. Sind
γ0 , γ1 : [a, b] → D zwei stetige, geschlossene und rektifizierbare Wege, die radial homotop sind, so gilt
Z Z
φ(x) dx = φ(x) dx. (11.32)
γ0 γ1
Beweis. Sei Γ : [a, b] × [c, d] → D eine Homotopie zwischen γ0 und γ1 , sodass β(s) := Γ(a, s) = Γ(b, s), s ∈ [c, d]. Wegen
Fakta 11.3.2, 6, gibt einen zu β homotopen Polygonzug β̃ : [c, d] → D. Insbesondere ist β̃ rektifizierbar und stetig.
Wir setzen nun die Wegen γ j , j = 0, 1, fort zu Abbildungen γ̃ j : [a − 1, b + 1] → D, indem wir γ̃ j (s) = γ j (a) (= γ j (b))
für s ∈ [a − 1, a) ∪ (b, b + 1] setzen. Dadurch erhalten wir zwei offensichtlich stetige, geschlossene und vermöge der
Homotopie Γ̃ : [a − 1, b + 1] × [c, d] → D
Γ̃|[a,b]×[c,d] ≡ Γ, Γ̃(a − 1 + λ, s) = (1 − λ)β̃(s) + λβ(s), Γ̃(b + 1 − λ, s) = (1 − λ)β̃(s) + λβ(s), λ ∈ [0, 1), s ∈ [c, d],
126 KAPITEL 11. WEGINTEGRALE
homotope Wege. Die Stetigkeit von Γ̃ folgt leicht mit Hilfe der Charakterisierung der Stetigkeit durch Folgen. Man beachte,
dass Γ̃(a − 1, s) = β̃(s) = Γ(b + 1, s), s ∈ [c, d].
Da γ j |[a−1,a]∪[b,b+1] konstant ist, folgt aus (11.6), dass ( j = 0, 1)
Z Z Z Z Z
φ(x) dx = φ(x) dx + φ(x) dx + φ(x) dx = φ(x) dx.
γ̃ j γ̃ j |[a−1,a] γj γ̃ j |[b,b+1] γj
Um (11.32) zu zeigen, können wir daher zusätzlich annehmen, dass für die Homotopie Γ : [a, b] × [c, d] → D zwischen γ0
und γ1 der stetige Weg β(s) := Γ(a, s) = Γ(b, s), s ∈ [c, d] auch rektifizierbar ist.
Wegen Fakta 11.3.2, 7, haben die Wege χ0 , χ1 : [a, b + d − c] → D definiert duch
χ0 (t) = Γ(t, c) = γ0 (t), t ∈ [a, b], χ0 (t) = Γ(b, c + (t − b)) = β(c + (t − b)), t ∈ [b, b + d − c],
χ1 (t) = Γ(a, c + (t − a)) = β(c + (t − a)), t ∈ [a, a + d − c], χ1 (t) = Γ(t − d + c, d) = γ1 (t − d + c), t ∈ [a + d − c, b + d − c],
gleichen Anfangs- und den gleichen Endpunkt, und sind als solche homotop. Also folgt aus Satz 11.3.6
Z Z
φ(x) dx = φ(x) dx.
χ0 χ1
JX : X → X, u 7→ i · u,
offensichtlich linear. Ist X sogar ein Banachraum über C, so ist JX : X → X auch beschränkt mit Abbildungsnorm 1.
Im Fall X = C R2 hat J := JC ∈ L(R2 , R2 ) als Matrix die Gestalt,
!
0 −1
J= .
1 0
Sind X und Y zwei Vektorräume über C, so folgt leicht, dass eine R-lineare Abbildung A : Y → X genau dann C-linear ist,
wenn
JX A = AJY .
Insbesondere kann eine R-lineare Abbildung A : R2 → X genau dann als C-lineare Abbildung A : C → X gedeutet werden
- ist also von der Form
Aζ = ζ · v, ζ ∈ C, (11.35)
mit einem festen v ∈ X, wenn AJ = JX A, bzw. weil 10 , 01 eine Basis von R2 ist, wenn (Je1 = e2 , Je2 = −e1 , )
als Elemente von X. Nun ist aber die zweite Bedingung offensichtlich zur ersten äquivalent. Also ist A : R2 C → X genau
dann C-lineare, wenn Ae1 = −i · Ae2 . Der Vektor v in (11.35) ist offensichtlich Ae1 = −i · Ae2 .
Im Spezialfall X = C, dh. A : R2 → R2 C, ist bedeutet AJ = JA gerade, dass A von der Form
!
a −b
A= (11.36)
b a
mit a, b ∈ R ist.
11.4. HOLOMORPHE FUNKTIONEN 127
Ist f : D → X in einem Punkt z ∈ D differenzierbar und ist d f (z) ∈ L(R2 , X) die Ableitung wie in Definition 10.1.14
und damit d f (z)e1 = ∂∂xf (z) und d f (z)e2 = ∂∂yf (z), so so ist wegen Bemerkung 11.4.1 Bedingung (11.34) dazu äquivalent,
dass d f (z) : C → X sogar C-linear ist, dh. als
∂f ∂f
g(w) = d f (z)e1 = (z) = −i (z).
∂x ∂y
Definieren wir schließlich für eine gegebene Funktion f : D → X das Vektorfeld φ f : D → L(R2 , X) durch
∂ ∂
so ist im Falle der Differenzierbarkeit von f bei z Bedingung (11.34) äquivalent dazu, dass ∂y φ f (z)e1 = ∂x φ f (z)e2 .
11.4.2 Bemerkung. Im Fall X = C ist Bedingung (11.34) offensichtlich nichts anderes, als (Cauchy-Riemannschen Diffe-
rentielgleichungen)
∂u ∂v ∂v ∂u
(z) = (z), (z) = − (z), (11.39)
∂x ∂y ∂x ∂y
wobei u(z) := Re f (z) und v(z) := Im f (z), oder wegen (11.36) nichts anderes, als dass d f (z) von der Form
!
a(z) −b(z)
d f (z) = , (11.40)
b(z) a(z)
∂u ∂v ∂v
ist, wobei a(z) = ∂x
(z) = ∂y
(z) und b(z) = ∂x
(z) = − ∂u
∂y
(z).
11.4.3 Lemma. Sei D ⊆ C offen, X ein komplexer Banachraum, f : D → X eine Funktion und z ∈ D. Die Tatsache, dass
f in z differenzierbar ist zusammen mit der Bedingung (11.34) ist äquivalent zu der Tatsache, dass der Grenzwert - man
spricht von der komlpexen Ableitung -
df f (z + h) − f (z)
(z) := lim
dz h→0 h
in X existiert. In dem Fall gilt
df ∂f ∂f
(z) = (z) = −i · (z). (11.41)
dz ∂x ∂y
Beweis. Gemäß Definition 10.1.14 und wegen der Äquivalenz der Normen k.k2 = |.| und k.k∞ auf C ist f bei z genau dann
differenzierbar, wenn
f (z + h) = f (z) + d f (z)h + |h|ε(h), h , 0, (11.42)
für irgendeine Funktion ε : (D − z) \ {0} → X mit limh→0 ε(h) = 0. Der Ausdruck d f (z)h ist dabei die Anwendung von
h = h1 + ih2 , interpretiert als Element hh1 von R2 , auf lineare Abbildung d f (z) ∈ L(R2 , X)
2
∂f ∂f
Ist dabei (11.34) erfüllt, so wissen wir wegen (11.37), dass d f (z)h = h · g(z) für ein g(z) = ∂x (z) = −i · ∂y (z) ∈ X und
daher
f (z + h) − f (z) |h|
lim = g(z) + lim · ε(h) = 0,
h→0 h h→0 h
da k |h|
h · ε(h)k = kε(h)k → 0, h → 0.
f (z+h)− f (z)
Angenommen es existiert umgekehrt der komplexe Grenzwert g(z) := limh→0 , so folgt mit ε(h) :=
f (z+h)− f (z) h
h
|h| h − g(z) für h , 0 unmittelbar
mit ε(h) → 0 für h → 0. Da die Ableitung d f (z) eindeutig ist, folgt hier d f (z)h = h · g(z) und wegen der Ausführung nach
Bemerkung 11.4.1, dass (11.34) gilt.
❑
11.4.4 Bemerkung. Gilt die Aussage von Lemma 11.4.3 im Fall X = C, so folgt unmittelbar aus (11.40)
∂u 2 ∂v 2 d f 2
det d f (z) = (z) + (z) = (z) . (11.43)
∂x ∂x dz
Wie für komplexwertige Funktionen in Definition 11.2.6 wollen wir komplexen Wegintegrale für Banachraum-wertige
Funktionen definieren.
128 KAPITEL 11. WEGINTEGRALE
11.4.5 Definition. Ist D ⊆ C, X ein komplexer Banchraum, h : D → X und γ : [a, b] → D ein Weg, so ist das komplexe
Wegintegral definiert durch
Z X
n(R)
h(z) dz := lim γ(ξ j ) − γ(ξ j−1 ) · h γ(α j ) , (11.44)
γ |R|→0
j=1
11.4.6 Bemerkung. Ist für h : D → X die Abbildung φh : D → L(R2 , X) definiert durch (vgl. (11.38))
Z X
n(R) Z
h(z) dz = lim φh γ(α j ) γ(ξ j ) − γ(ξ j−1 ) = φh (x) dx (11.45)
γ |R|→0 γ
j=1
an, wenn wir γ(ξ j ) − γ(ξ j−1 ) als Zweivektor betrachten.
Insbesondere existiert dieses Wegintegral für stetiges h sowie stetiges und rektifizierbares γ. Ist γ sogar C1 , so folgt
aus Satz 11.2.4 Z Z b
φh (x) dx = φh (γ(t)) γ′ (t) dt.
γ a
Da φh (γ(t)) γ′ (t) (∈ X) mit den Überlegungen für (11.35) nichts anderes als γ′ (t) · h(γ(t)) ist, lässt sich das komplexe
Wegintegral in diesem Fall durch
Z Z b
h(z) dz = γ′ (t) · h(γ(t)) dt (11.46)
γ a
11.4.7 Definition. Sei D ⊆ C offen. Eine Funktion f : D → X heißt holomorph auf D, falls sie einmal stetig differenzierbar
ist, und falls (11.34) für alle z ∈ D gilt.
Ist f : C → X auf ganz C holomorph, so nennt man f ganz.
11.4.8 Korollar. Sei f : D → X eine Funktion mit offenen D ⊆ C. Folgende Aussagen sind äquiavlent.
1 2
(iii) f ∈ C (D) und das Vektorfeld φ f : D → L(R , X) definiert in (11.38) ist lokal wegunabhängig bzw. ein ein lokales
Gradientenfeld.
(iv) f ∈ C1 (D) und zu jedem w ∈ D existiert eine offenes D(w) ⊆ D, und eine holomorphe Funktion F : D(w) → X mit
F ∈ C2 (D(w)), sodass F ′ (z) = f (z) für alle z ∈ D(w).
Ist schließlich f : D → C holomorph, D ⊆ C ein Gebiet, und φ f : D → L(R2 , X) sogar auf ganz D wegunabhängig
- das ist insbesondere der Fall, wenn D einfach zusammenhängend ist, so gilt F ′ = f auf D für eine bis auf eine komplexe
Konstante eindeutige holomorphe Funktion F ∈ C1 (D), wobei
Z
F(z) − F(w) = f (ζ) dζ,
γ
für alle z, w ∈ D. Es gilt sogar F ∈ C2 (D). Dabei ist die rechte Seite ein komplexes Wegintegral und γ ist irgend ein stetiger,
rektifizierbarer und in D verlaufender Weg mit Anfangspunkt w und Endpunkt z.
df
Beweis. Aus Lemma 11.4.3 folgt, dass die Existenz von dz (z) für alle z ∈ D äquivalent zur Differenzierbarkeit von f für
alle z ∈ D zusammen mit (11.34) ist. Dabei gilt ddzf (z) = ∂∂xf (z) = −i · ∂∂yf (z), siehe (11.41). Somit ist zusätzlich f noch stetig
differenzierbar genau dann, wenn f ′ stetig ist.
Es bleiben die letzten beiden Punkte zu betrachten. Aus der Überlegung rund um (11.38) folgt sofort, dass die Holo-
∂ ∂
morphie von f äquvalent zu der Tatsache ist, dass φ f : D → L(R2 , X) stetig differenzierbar ist und ∂y φ f (z)e1 = ∂x φ f (z)e2
für alle z ∈ D erfüllt. In Bemerkung 11.3.5 haben wir gesehen, dass das äquivalent zur lokalen Wegunabhängigkeit ist.
11.4. HOLOMORPHE FUNKTIONEN 129
Aus Bemerkung 11.3.4 wiederum wissen wir, dass die lokale Wegunabhängigkeit nichts anderes besagt als, dass auf
einer hinreichend kleinen offenen Menge D(w) ⊆ D gilt, dass dF(z) = φ f (z) für ein F ∈ C1 (D(w)). Offensichtlich gilt dabei
F ∈ C2 (D(w)) geanu dann, wenn φ f stetig differenzierbar ist.
Schließlich bedeutet dF(z) = φ f (z) wegen (11.34) gerade, dass F holomorph auf D(w) ist, wobei
∂F
F ′ (z) = (z) = φ f (z)e1 = f (z),
∂x
siehe (11.41).
Ist schließlich D ein Gebiet, φ f wegunabhängig - wegen Satz 11.3.6 gilt das sicher für einfach zusammenhängende D,
so folgt aus Satz 11.2.16 bzw. Bemerkung 11.2.15, dass für z, w ∈ D
Z
φ f (x) dx = F(z) − F(w),
γ
für alle in D verlaufenden, stetigen und rektifizierbaren Wege γ : [a, b] → D mit γ(a) = w und γ(b) = z. Zudem besagt Satz
11.2.16, dass F mit dF = φ f , bzw. äquivalent dazu F ′ = f , bis auf eine Konstante in XReindeutig ist. Schließlich genügt ein
Verweis auf Bemerkung 11.4.6, um obiges Wegintegral als das komplexe Wegintegral γ f (ζ) dζ zu identifizieren.
❑
Ist X = C, so ist wegen Bemerkung 11.4.2 die Abbildung f : D → C genau dann holomorph ist, wenn f ∈ C1 (D) und
(11.39) für alle z ∈ D gilt, bzw. wenn f ∈ C1 (D) und (11.40) für alle z ∈ D gilt.
11.4.9 Bemerkung. In der Tat gilt sogar, dass f genau dann holomorph ist, wenn f auf ganz D nur differenzierbar ist und
dort (11.34) gilt, bzw. wenn der komplexe Limes limh→0 f (z+h)− h
f (z)
für alle z ∈ D existiert. Die Forderung, dass die Ableitung
stetig ist, ist also unnötig. Dieser Sachverhalt ist zwar interessant, aber für den weiteren Aufbau der Theorie holomorpher
Funktionen nicht von nöten.
f
f ′ f ′ (z)φ(z)− f (z)φ′ (z)
ist im Fall, dass nicht g ≡ 0, : {z ∈ D : φ(z) , 0} → X 9 holomorph mit (z) =
φ φ φ(z)2
(Quotientenregel).
ist im Fall, dass10 φ−1 (G) = {z ∈ D : φ(z) ∈ G} , ∅, h ◦ φ : φ−1 (G) → X holomorph mit (h ◦ φ)′ (z) = h′ (φ(z)) · φ′ (z)
(Kettenregel),
ist im Fall, dass φ injektiv ist und dass φ′ (z) , 0 für alle z ∈ D, das Bild φ(D) offen in C und ist die Umkehrfunktion
φ−1 : φ(D) → D ⊆ C holomorph mit (φ−1 )′ (φ(z)) = φ′1(z) .
Beweis. Mit Hilfe von Korollar 11.4.8 zusammen mit Korollar 6.1.8 zeigt man ganz ähnlich wie in Satz 7.1.7 bzw. Satz
7.1.9 alle bis auf die letzte Ableitungsregeln. Wir ersparen uns die Details dazu.
Zur letzten Regel sei bemerkt, dass zunächst wegen (11.43) die Matrix dφ(z) für alle z ∈ D invertierbar ist. Aus Korollar
10.3.3 folgt somit, dass φ(D) offen ist. Die Verifikation von (φ−1 )′ (φ(z)) = φ′1(z) geschieht wie im Beweis von Satz 7.1.12.
❑
11.4.11 Beispiel.
(i) Für jedes λ ∈ C ist die konstante Funktion f (z) = λ, z ∈ C, an jeder Stelle z ∈ C stetig differenzierbar, und ihre
Ableitung d f (z) ist immer die Nullmatrix, erfüllt somit (11.34) und ist daher holomorph.
(z + h) − z
lim = 1.
h→0 h
Da die konstante 1-Funktion stetig ist, folgt aus Korollar 11.4.8 die Holomorphie von idC .
(iii) Durch wiederholte Anwendung von Proposition 11.4.10 folgt, dass alle Polynome f (z) = a0 + a1 z + · · · + an zn mit
festen a0 , . . . , an ∈ C auf C holomorph sind. Dabei gilt f ′ (z) = a1 + a2 2z + · · · + an nzn−1
9 {z ∈ D : φ(z) , 0} ist als Urbild der offenen Menge C \ {0} unter der stetigen Funktion φ selber offen,
(iv) Aus Proposition 11.4.10 folgt auch, dass sogar alle Funktionen der Form
1 1
f (z) = a−m + · · · + a−1 + a0 + · · · + an zn
zm z
mit festen a−m , . . . , a−1 , a0 , . . . , an ∈ C holomorph und zwar nur auf C \ {0} sind.
(v) Mit der Kettenregel oder auch direkt folgt, dass für festes w ∈ C auch alle Funktionen der Form
1 1
f (z) = a−m + · · · + a−1 + a0 + · · · + an (z − w)n
(z − w)m z−w
mit festen a−m , . . . , a−1 , a0 , . . . , an ∈ C holomorph und zwar auf C \ {w} sind. Dabei gilt
1 1
f (z) = a−m (−m) + · · · + a−1 (−1) + a1 + a2 2(z − w) + · · · + an n(z − w)n−1 .
(z − w)m+1 (z − w)2
11.4.12 Lemma. Sei D ⊆ C offen und [a, b] ein kompaktes reelles Intervall. Weiters sei f : D × [a, b] (⊆ R3 ) → X stetig als
Funktion auf einer Teilmenge des R3 . Zudem sei für jedes feste t ∈ [a, b] die Funktion z 7→ f (z, t) auf D holomorph. Ist dann
d
Rb
auch die Funktion (z, t) 7→ dz f (z, t) auf D×[a, b] stetig als Funktion auf einer Teilmenge des R3 , so ist z 7→ a f (z, t) dt (∈ X)
holomorph auf D und es gilt
Z b Z b
d d
f (z, t) dt = f (z, t) dt. (11.48)
dz a a dz
∂ d ∂ d
f (z, t) = f (z, t), f (z, t) = i f (z, t). (11.49)
∂x dz ∂y dz
Sei nun w ∈ D fest. Da D offen ist, gibt es zu jedem w ∈ D eine abgeschlossene Kugel Kρ (w) ⊆ D, wobei wir praktischer-
weise die Kugel bzgl. der k.k∞ -Norm betrachten wollen, da dann Kρ (w) = w + [−ρ, ρ] × [−ρ, ρ].
d ∂
Für festes µ ∈ [Im w − ρ, Im w + ρ] sind die Funktionen (s, t) 7→ f (s + iµ, t) und (s, t) 7→ ds f (s + iµ, t) = ∂x f (s + iµ, t)
wegen (11.49) und gemäß Voraussetzung als Funktionen von [Re w − ρ, Re w + ρ] × [a, b] nach X stetig. Gemäß (9.15) - siehe
Rb
auch Korollar 8.7.11 - ist s 7→ a f (s + iµ, t) dt auf [Re w − ρ, Re w + ρ] stetig differenzierbar, wobei für z = s + iµ ∈ Uρ (w)
Z b Z b Z b Z b
∂ d d ∂
f (z, t) dt = f (s + iµ, t) dt = f (s + iµ, t) dt = f (z, t) dt.
∂x a ds a a ds a ∂x
Rb
Da µ ∈ [Im w − ρ, Im w + ρ] beliebig war, ist insbesondere z 7→ a f (z, t) dt auf Uρ (w) stetig nach x = Re z differenzierbar.
Genauso sieht man, dass diese Funktion auch stetig nach y = Im z differenzierbar ist, wobei
Z b Z b
∂ ∂
f (z, t) dt = f (z, t) dt.
∂y a a ∂y
Rb
Also ist z 7→ a
f (z, t) dt in C1 (D). Aus obigen Gleichungen folgt wegen der Holomorphie des Integranden
Z b Z b Z b Z b
∂ ∂ ∂ ∂
f (z, t) dt = f (z, t) dt = −i · f (z, t) dt = −i · f (z, t) dt,
∂x a a ∂x a ∂y ∂y a
Rb
und daher die Holomorphie von z 7→ a
f (z, t) dt. Wegen (11.41) folgt aus dieser Gleichung auch (11.48).
❑
11.4.13 Satz (Cauchyscher Integralsatz und Cauchysche Integralformel). Sei f : D → X holomorph.
t−a
Ist w ∈ C und ρ > 0 so klein, dass Kρ (w) ⊆ D, und ist γ : [a, b] → D \ {w} der Weg t 7→ w + ρ · exp(2πi b−a ) oder in
D \ {w} radial homotop zu diesem Weg, so gilt
I
1 f (ζ)
f (w) = dζ. (11.50)
2πi γ ζ−w
H
11 Komplexe Wegintegrale über einen geschlossenen Weg schreibt man mit einem -Zeichen an.
11.4. HOLOMORPHE FUNKTIONEN 131
Beweis. Nach Korollar 11.4.8 ist φ f lokal wegunabhängig. Die erste Aussage folgt damnach sofort aus Korollar 11.3.11,
wenn man Bemerkung 11.4.6 beachtet. Für die zweite betrachte man die Funktion
f (z) − f (w)
G(z) = , z ∈ D \ {w}.
z−w
t−a
für alle ǫ ∈ (0, ρ], wobei γǫ (t) = w + ǫ · exp(2πi b−a ), da γρ und γǫ offensichtlich radial homotop in D \ {w} sind. Andererseits
kann man den Betrag der rechten Seite mit Hilfe von (11.47) nach oben abschätzen durch
Z b
max kG ◦ γǫ (t)k · ℓ(γǫ ) ≤ max kG(z)k · |γǫ′ (t)| dt = max kG(z)k · 2πǫ.
t∈[a,b] z∈Kρ (w) a z∈Kρ (w)
Da G auf Kρ (w) stetig fortgesetzt wurde, geht obiger Ausdruck für ǫ ց 0 gegen Null. Also gilt, da komplexe Wegintegrale
linear im Integranden sind, I I I
f (ζ) 1
0= G(ζ) dζ = dζ − f (w) · dζ.
γρ γρ ζ − w γρ ζ − w
H 1
Mit Hilfe von (11.10) berechnet man leicht γ ζ−w dζ = 2πi. Somit folgt (11.50) für γ = γρ . Ist γ in D \ {w} radial homotop
ρ
zu γρ , so folgt (11.50) aus Korollar 11.3.11 unter Beachtung von Bemerkung 11.4.6.
❑
11.4.14 Bemerkung. Mit der Notation aus Satz 11.4.13 sei w ∈ D und ρ > 0 so klein, dass Kρ (w) ⊆ D. Wie man aus der
Dreiecksungleichung sofort erkennt, gilt für jedes z ∈ Uρ (w) die Relation Kr (z) ⊆ Kρ (w), wobei r = ρ − |z − w| (> 0).
Setzen wir (t ∈ [a, b])
t−a t−a
γρ (t) := w + ρ · exp(2πi ), und γ(t) := z + r · exp(2πi ),
b−a b−a
Damit liegt (11.51) sogar immer in D \ {z}. Aus Fakta 11.3.8, 6, folgt daher, dass die Wege γρ und γ radial homotop in D \ {z}
sind. Wegen (11.50) gilt daher für alle z ∈ Uρ (w)
I Z b t−a
1 f (ζ) 1 f (w + ρ exp(2πi b−a )) t−a
f (z) = dζ = t−a · ρ exp(2πi ) dt. (11.52)
2πi γρ ζ−z b−a a w + ρ exp(2πi b−a )−z b−a
11.4.15 Korollar. Ist f : D → X holomorph, so ist auch f ′ : D → C holomorph. Damit sind alle Funktionen f (n) : D → C,
n ∈ N rekursiv definiert durch f (n+1) = ( f (n) )′ , holomorph auf D. Dabei gilt für alle w ∈ D
I
n! f (ζ)
f (n) (w) = dζ. (11.53)
2πi γ (ζ − w)n+1
t−a
Hier ist γ : [a, b] → D \ {w} der Weg t 7→ w + ρ · exp(2πi b−a ) oder in D \ {w} radial homotop zu diesem Weg, wobei ρ > 0
so klein ist, dass Kρ (w) ⊆ D. Insbesondere ist f ∈ C∞ (D).
Beweis. Sei ρ > 0 so, dass Kρ (w) ⊆ D. Der Integrand von der rechten Seite von (11.52) ist offensichtlich stetig als Funktion
von (z, t) ∈ Uρ (w) × [a, b] nach C (vgl. Korollar 6.1.8).
Weiters beachte man, dass der Integrand bei festem t ∈ [a, b] als Funktion von z ∈ Uρ (w) holomorph ist, vgl. Beispiel
11.4.11. Die komplexe Ableitung des Integranden nach z ist dabei
t−a
f (w + ρ exp(2πi b−a )) t−a
t−a · ρ exp(2πi ).
(w + ρ exp(2πi b−a ) − z)2 b−a
132 KAPITEL 11. WEGINTEGRALE
Diese Funktion ist wieder offensichtlich stetig als Funktion von (z, t) ∈ Uρ (w) × [a, b] nach C (vgl. Korollar 6.1.8). Also
können wir Lemma 11.4.12 anwenden und erhalten für z ∈ Uρ (w)
Z b t−a I
1 f (w + ρ exp(2πi b−a )) t−a 1 f (ζ)
f ′ (z) = t−a · ρ exp(2πi ) dt = dζ.
b−a a (w + ρ exp(2πi b−a ) − z)2 b−a 2πi γρ (ζ − z)2
Wiederholt man obige Argumentation mit dem mittleren Riemann-Integral, so folgt aus Lemma 11.4.12, dass auch f ′ (z) auf
z ∈ Uρ (w) holomorph ist, wobei
Z b t−a I
2 f (w + ρ exp(2πi b−a )) t−a 2 f (ζ)
f ′′ (z) := ( f ′ )′ (z) = t−a · ρ exp(2πi ) dt = dζ.
b−a a (w + ρ exp(2πi b−a ) − z)3 b−a 2πi γρ (ζ − z)3
Aus (11.41) angewandt auf f ′ und f folgt f ∈ C2 (Uρ (w)). Da w ∈ D beliebig war, gilt f ∈ C2 (D), und - da Holomorphie
eine lokale Eigenschaft ist - ist f ′ holomorph auf D.
Verfährt man induktiv weiter, so folgt insbesondere (11.53) und f ∈ Cn (D) für alle n ∈ N, wobei γ = γρ in (11.53).
Für in D \ {w} zu γρ radial homotope γ folgt (11.53) aus Korollar 11.3.11 unter Beachtung von Bemerkung 11.4.6.
❑
11.4.16 Korollar (Satz von Liouville). Ist f : C → X holomorph auf C, also ganz, und ist f beschränkt, so ist f eine
konstante Funktion.
t−a
Beweis. Es gelte k f (z)k ≤ M, z ∈ C. Ist ρ > 0 und γ(t) = w + ρ · exp(2πi b−a ), so folgt wegen (11.53) und (11.11)
I
1
f (ζ)
1 1 M
k f ′ (z)k =
dζ
≤ M · ·2πρ = .
2π γ (ζ − z)
2
2π ρ2 ρ
Da wir ρ > 0 beliebig groß wählen können, folgt f ′ (w) = 0. Da auch 0′ = 0, folgt aus der Eindeutigkeitsaussage im letzten
Teil von Korollar 11.4.8, dass f konstant ist.
❑
11.4.17 Satz (Satz von Morera). Sei D ⊆ C offen. Dann ist eine Funktion f : D → X genau dann holomorph, wenn f stetig
ist, und es zu jedem w ∈ D ein offenes D(w) ⊆ D gibt, sodass
I
f (ζ) dζ = 0
γ
Beweis. Jedes holomorphe f ist offensichtlich stetig. Wählt man zu w ∈ DH die Zahl ρ > 0 so klein, dass D(w) := Uρ (w) ⊆ D,
so ist D(w) einfach zusammenhängend, vgl. Fakta 11.3.2, 5. Nun folgt γ f (ζ) dζ aus Satz 11.4.13 sogar für alle stetigen,
rektifizierbaren und geschlossenen Wegen γ in D(w).
Gelte nun umgekehrt die im Satz gemachte Voraussetzung, und sei zu w ∈ D das offene D(w) ⊆ C wie in der Voraus-
setzung. Gemäß Bemerkung 11.4.6 gilt I Z
0= f (ζ) dζ = φ f (x) dx
γ γ
für das stetige Vektorfeld φ f : D(w) → L(R2 , X) definiert in (11.38). Gemäß Bemerkung 11.3.9 ist dieses Vektorfeld auf
D(w) wegunabhängig und daher ein Gradientenfeld. Somit gilt φ f (z) = dF(z), z ∈ D(w) für ein X-wertiges F ∈ C1 (D).
Wegen (11.34) bedeutet dF(z) = φ f (z) gerade, dass F holomorph auf D(w) ist, wobei
∂F
F ′ (z) = (z) = φ f (z)e1 = f (z).
∂x
Gemäß Korollar 11.4.15 ist auch F ′ = f auf D(w) holomorph. Da w beliebig war, und da Holomorphie eine lokale
Eigenschaft ist, folgt die Behauptung.
❑
11.4.18 Korollar. Sei D ⊆ C offen, und fn : D → X, n ∈ N, eine Folge holomorpher Funktionen, die lokal gleichmäßig
gegen eine Funktion f : D → X konvergiert, dh. für jede kompakte Teilmenge K ⊆ D konvergiert ( fn |K )n∈N gleichmäßig auf
K gegen f |K . Dann ist auch f holomorph.
Beweis. Wähle zu w ∈ D die offene Menge D(w) wie Satz 11.4.17. Gemäß diesem Satz können wir sie sogar unabhängig
von n so wählen, dass für alle n ∈ N I
fn (ζ) dζ = 0,
γ
wenn nur γ : [0, m] → D(w) ein geschlossener Polygonzug ist. K := γ([0, m]) ist als stetiges Bild einer kompakten Menge
selber kompakt. Nun stimmt wegen (11.10) obiges Wegintegral überein mit
Z m
γ′ (t) · fn (γ(t)) dt = 0.
0
11.4. HOLOMORPHE FUNKTIONEN 133
Wegen kγ′ (t) · fn (γ(t)) − γ′ (t) · f (γ(t))k ≤ k fn − f k∞,K · kγ′ k∞,[0,m] , t ∈ [a, b], und da γ ein Polygonzug ist und daher
kγ′ k∞,[0,m] < +∞, konvergiert die Funktionenfolge γ′ · fn ◦ γ gleichmäßig gegen γ′ · f ◦ γ auf [a, b]. Aus Satz 8.7.2 folgt
somit I Z m Z m
f (ζ) dζ = γ′ (t) · f (γ(t)) dt = lim γ′ (t) · fn (γ(t)) dt = 0.
γ 0 n→∞ 0
Beweis. Sei K ⊆ UR (w) kompakt. Nun existiert r = maxz∈K |z|, da z 7→ |z| stetig auf der kompakten Menge K ist. Ist
z ∈ K ⊆ UR (w) mit |z| = r, so folgt λ z ∈ UR (w) für allePλ ∈ C mit |λ| ≤ 1. Daraus folgt unmittelbar K ⊆ Kr (0) ⊆ UR (w).
N
Nach Satz 6.7.8 konvergiert die Funktionenreihe n=0 a (z − w)n für N → ∞ gleichmäßig auf Kr (w) gegen f (z); somit
PN n
auch auf K. Da gemäß Beispiel 11.4.11 alle Polynome n=0 an (z − w)n holomorph sind, ist nach Korollar 11.4.18 auch f
auf UR (w) holomorph.
❑
11.4.20 Satz. Sei D ⊆ C offen. Dann ist eine Funktion f : D → X genau dann holomorph, wenn f analytisch ist, dh. es zu
P∞ w ∈ D eine
jedem
n
offene Kreisscheibe Uρw (w) ⊆ D bzgl. |.| gibt, sodass sich f darauf als Grenzfunktion einer Potenzreihe
n=0 an (z − w) mit Konvergenzradius ≥ ρw darstellen lässt, vgl. Bemerkung 6.7.12.
Dabei sind die Koeffizienten an eindeutig durch f auf folgende Weise
f (n) (w)
a0 = f (w), und an := , n ∈ N.
n!
Das größt mögliche ρw , sodass sich ein holomorphes f als Potenzreihe auf Uρw (w) darstellen lässt, ist ρw = d(w, Dc ), wobei
ρw = +∞, wenn D = C.
Beweis. Lässt sich f um jedes w auf einem Uρw (w) ⊆ D lokal als Grenzfunktion einer Potenzreihe darstellen, so ist f dort
gemäß Korollar 11.4.19 holomorph. Da Holomorphie eine lokale Eigenschaft ist, muss f auf ganz D holomorph sein.
Sei nun f : D → X holomorph, und setze ρw = d(w, Dc ). Offensichtlich ist das das größte ρw mit Uρw (w) ⊆ D. Für
ρ ∈ (0, ρw ), ζ ∈ C mit |ζ − w| = ρ und für z ∈ Uρ (w) gilt
X
∞ !
1 z−w n 1 1 1
· = · z−w = .
ζ − w n=0 ζ − w ζ − w 1 − ζ−w ζ−z
n
P P∞ |z−w| n
Wegen ∞
n=0
z−w
t−a ) = n=0 ρ < +∞ konvergiert die Reihe im obigen Riemann-Integral gleichmäßig, vgl.
ρ exp(2πi b−a
12
Korollar 6.7.4. Aus Satz 8.7.2 folgt daher
X
∞ Z b !n X
∞ I !
1 t−a z−w 1 f (ζ)
f (z) = f (w + ρ exp(2πi )) · t−a dt = n+1
dζ ·(z − w)n .
n=0
b−a a b−a ρ exp(2πi b−a ) n=0
2πi γ (ζ − w)
| {z }
=:an
P∞ n
Die letzte Gleichheit folgt aus (11.10). Also konvergiert n=0 an (z − w) und stimmt mit f (z) überein, wobei wegen (11.50)
(n)(w)
bzw. (11.53) a0 = f (w) und an := f n! , n ∈ N.
Aus (6.7) (vgl. auch Abschnitt 9.3) folgt schließlich, dass diese Potenzreihe einen Konvgenzradius R ≥ |z − w| hat, und
da z ∈ Uρ (w) beliebig war, gilt R ≥ ρ. Da auch ρ ∈ (0, ρw ) beliebig war, folgt R ≥ ρw .
❑
Wir wollen noch den Zusammenhang zu sogenannten harmonischen Funktionen herstellen.
11.4.21 Definition. Sei X ein Banachraum über R. Ist g : G → Rm mit offenem G ⊆ R2 C zweimal stetig differenzierbar,
so bezeichnet △g : G → X (Laplace g) die Abbildung
! ! !
x ∂2 g x ∂2 g x
△g := 2 + 2 .
y ∂x y ∂y y
11.4.22 Proposition. Ist G ⊆ C offen und f : G → C holomorph, so ist f auch harmonisch. Insbesondere sind dann Real-
und Imaginärteil von f harmonisch, dh. ∂u
∂x (z).
Ist umgekehrt u : G → R harmonisch für ein einfach zusammenhängendes Gebiet G ⊆ C, so gibt es ein bis auf eine
imaginäre Konstante eindeutiges holomorphes f : G → C, sodass u ≡ Re f .
∂f ∂f
(z) = −i · (z). (11.55)
∂x ∂y
Da holomorphe Funktionen beliebig oft differenzierbar sind, folgt aus dieser Gleichung abgeleitet nach x
∂2 f ∂2 f
(z) = −i · (z).
∂x2 ∂x∂y
Wegen dem Satz von Schwarz und wegen (11.55) abgeleitet nach y ist dieser Ausdruck gleich
∂2 f ∂2 f
−i · (z) = (−i)2 · 2 (z).
∂y∂x ∂y
∂F ∂α ∂β ∂2 u ∂2 u
(z) = (z) + i (z) = 2 (z) − i (z) =
∂x ∂x ∂x ∂x ∂x∂y
∂2 u ∂2 u ∂β ∂α ∂F
− (z) − i (z) = (z) − i (z) = −i · (z).
∂y2 ∂y∂x ∂y ∂y ∂y
Also ist F holomorph. Da G einfach zusammenhängend ist, gibt es eine Holomorphe Stammfunktion f , dh. f : G → C mit
f ′ = F. Wegen f ′ = ∂∂xf = −i ∂∂yf gilt
∂ Im f ∂ Re f ∂u
= = Re F = α =
∂y ∂x ∂x
und
∂ Re f ∂ Im f ∂u
− = = Im F = β = − .
∂y ∂x ∂y
Insbesondere ist d(Re f )(z) = du(z) (∈ L(R2 , R)) für alle z ∈ G. Da Gradientenfelder wegunabhängig sind, und da in G je
zwei Punkte durch einen Polygonzug verbindbar sind, folgt daraus Re f = u + c für ein c ∈ R. Nun ist f − c die gesuchte
holomorphe Funktion.
Falls g : G → C eine weitere holomorphe Funktion mit Re g = u ist, so ist f − c − g : G → C auch holomorph mit
einem verschwindenden Realteil. Aus den Cauchy-Riemannschen Differentialgleichungen folgt d( f − c − g)(z) = 0 und
daraus, dass f − c − g eine Konstante sein muss, vgl. Satz 11.2.8.
❑
Kapitel 12
Topologische Grundlagen
Sei nun O die Menge aller offenen Teilmengen von Y (siehe Definition 5.1.4), wobei
wir eine Teilmenge O von Y offen genannt haben, wenn sie die Eigenschaft hat, dass
es zu jedem x ∈ O ein ǫ > 0 gibt, sodass die ǫ-Kugel Uǫ (x) (= {y ∈ Y : d(y, x) < ǫ})
ganz in O enthalten ist.
Wir haben in Proposition 5.1.6 gesehen, dass O folgende Eigenschaften hat.
∅ ∈ O, X ∈ O.
Wir nehmen nun diese aufgezählten Eigenschaften als Ausgangspunkt unserer an-
gestrebten Verallgemeinerung.
12.1.2 Definition. Sei X eine nichtleere Menge und T ⊆ P(X) ein System von Teil-
mengen von X. Erfüllt T die Eigenschaften
(01) ∅ ∈ T , X ∈ T .
135
136 KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
so heißt T eine Topologie auf X. Die Elemente von T heißen offene Mengen, und man
spricht von (X, T ) als topologischem Raum.
12.1.3 Bemerkung. Mittels Vollständiger Induktion sieht man sofort, dass (O2) äqui-
valent ist zu
T
(02’) Ist n ∈ N und O1 , . . . , On ∈ T , so folgt ni=1 Oi ∈ T .
12.1.4 Beispiel.
Wir haben oben gesehen, dass die Menge O aller offenen Mengen eines metri-
schen Raumes (Y, d) (01)-(03) erfüllt. Damit ist (Y, O) ein topologischer Raum.
Man sagt, O ist die von der Metrik d induzierte Topologie und schreiben auch
T (d) für O.
Ist Y = R p versehen mit der Metrik d2 , so heißt die von d2 induzierte Topologie
T (d2 ) Euklidische Topologie. Die Metriken d1 und d∞ induzieren ebenfalls die
Euklidische Topologie.
Sei T := P(X). Klarerweise sind (01)-(03) erfüllt, also ist (X, P(X)) ein topolo-
gischer Raum. Man spricht von der diskreten Topologie. Die diskreten Topologie
wird übrigens von der diskreten Metrik induziert (siehe Beispiel 3.1.5).
Sei T := {∅, X}. Wieder sind (01)-(03) trivialerweise erfüllt. Man spricht von der
Klumpentopologie.
Eines unserer Ziele wird es sein, Konvergenz gegen einen Punkt oder Stetigkeit bei
einem Punkt für unsere Räume zu verallgemeinern. Dazu benötigen wir ein Analogon
zum Begriff der ’ǫ-Kugel’.
12.1.5 Definition. Sei (X, T ) ein topologischer Raum und x ∈ X. Eine Menge U ⊆ X
heißt Umgebung von x, wenn es eine offene Menge O ∈ T gibt mit x ∈ O ⊆ U. Wir
bezeichnen mit U(x) die Menge aller Umgebungen von x, den Umgebungsfilter von x.
Der Begriff Filter ist ein allgemeines mengentheoretisches Konzept.
12.1.6 Definition. Sei M eine nichtleere Menge. Dann heißt ein Mengensystem F ⊆
P(M) ein Filter, wenn
(F1) F , ∅ und ∅ < F,
(F2) F1 , F2 ∈ F ⇒ F1 ∩ F2 ∈ F,
(F3) F1 ∈ F, F1 ⊆ F2 ⊆ M ⇒ F2 ∈ F.
Ist (X, T ) ein topologischer Raum, so ist der Umgebungsfilter U(x) tatsächlich ein
Filter, da
offensichtlich X ∈ U(x) und jede Menge U ∈ U(x) den Punkt x enthält und damit
nicht leer ist,
aus U1 , U2 ∈ U(x) die Existenz von O1 , O2 ∈ T mit x ∈ O1 ⊆ U1 und x ∈
O2 ⊆ U2 folgt, und somit x ∈ O1 ∩ O2 ⊆ U1 ∩ U2 , wobei wegen (O2) sicherlich
O1 ∩ O2 ∈ T , und daher U1 ∩ U2 ∈ U(x),
aus U1 ∈ U(x) und U1 ⊆ U2 ⊆ X die Inklusion x ∈ O ⊆ U1 für ein gewisses
O ∈ T und somit x ∈ O ⊆ U2 bzw. U2 ∈ U(x) folgt.
12.1. TOPOLOGISCHE GRUNDBEGRIFFE 137
Die korrekte Verallgemeinerung des Systems aller ǫ-Kugeln um einen festen Punkt
in einem metrischen Raum ist nun der Begriff Filterbasis des Umgebungsfilter.
12.1.7 Definition. Sei M eine nichtleere Menge und F ein Filter. Dann heißt ein Men-
gensystem B ⊆ F eine Filterbasis von F, wenn man zu jeder Menge F ∈ F ein B ∈ B
findet, sodass B ⊆ F.
12.1.8 Bemerkung. Mit der Notation aus Definition 12.1.7 folgt, dass
(FB2) B1 , B2 ∈ B ⇒ ∃B3 ∈ B : B3 ⊆ B1 ∩ B2 .
Die erste Eigenschaft ist klar wegen (F1). Die zweite folgt aus (F2): B1 , B2 ∈ B ⇒
B1 ∩ B2 ∈ F. Aus der Definition von Filterbasis folgt ∃B3 ∈ B : B3 ⊆ B1 ∩ B2 .
Nun kann man auch mit einem Mengensystem B, das (FB1) und (FB2) erfüllt,
starten, um daraus ein Mengensystem F durch (12.1) zu definieren.
Klarerweise ist ∅ < F. Sind F1 , F2 ∈ F, so gilt B1 ⊆ F1 und B2 ⊆ F2 für gewisse
B1 , B2 ∈ B, und wegen (FB2) B3 ⊆ B1 ∩ B2 ⊆ F1 ∩F2 für ein B3 ∈ B. Also F1 ∩F2 ∈ F.
Schließlich ist mit F1 auch jedes F2 ⊇ F1 Obermenge eines gewissen B ∈ B. Somit ist
F ein Filter, der B als eine Filterbasis hat.
12.1.9 Definition. Man sagt ein topologischer Raum (X, T ) erfüllt das erste Abzähl-
barkeitsaxiom (ABI), wenn für jedes x ∈ X der Umgebungsfilter U(x) eine Filterbasis
bestehend aus abzählbar vielen Mengen hat.
12.1.10 Beispiel.
(i) Klarerweise ist ein Filter eine Filterbasis von sich selbt.
(ii) Ist (X, T ) ein topologischer Raum und x ∈ X, so ist z.B. {O ∈ T : x ∈ O} eine
Filterbasis von U(x).
(iii) Sei (Y, d) ein metrischer Raum und T (d) die von der Metrik erzeugte Topologie.
Ist x ∈ Y, so ist {Uǫ (x) : ǫ > 0} eine Filterbasis von U(x).
Dass Uǫ (x) eine Umgebung ist, folgt aus der Tatsache, dass Uǫ (x) sogar offen ist.
Nun sei U ∈ U(x). Dann gibt es eine offene Menge O ∈ T (d), sodass O ⊆ U. Aus
der Definition der offenen Mengen in metrischen Räumen folgt Uǫ (x) ⊆ O ⊆ U,
und damit ist obiges Mengensystem eine Filterbasis.
Auf ähnliche Weise sieht man, dass {Kǫ (x) : ǫ > 0} oder auch {Uǫn (x) : n ∈
N}, wenn (ǫn )n∈N eine Nullfolge aus positiven reellen Zahlen ist, eine Basis des
Umgebungsfilter U(x) ist. Insbesondere erfüllt jeder metrische Raum das erste
Abzählbarkeitsaxiom.
Folgendes Lemma passt nun zu der Konstruktion einer Topologie aus einer Metrik.
138 KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
12.1.11 Lemma. Sei (X, T ) ein topologischer Raum und sei für jeden Punkt x ∈ X
das System W(x) eine Filterbasis von U(x)1 . Dann ist eine Menge O ⊆ X genau dann
offen, d.h. O ∈ T , wenn
∀x ∈ O ⇒ O ∈ U(x), (12.2)
bzw. genau dann, wenn
∀x ∈ O ∃W ∈ W(x) : W ⊆ O. (12.3)
Beweis. Für ein festes x ∈ X bedeutet die Tatsache ∃W ∈ W(x) : W ⊆ O gemäß der
Definition einer Filterbasis nicht anderes als O ∈ U(x). Also sind (12.2) und (12.3)
äquivalent.
Ist O ∈ T und x ∈ O, so folgt daraus O ∈ U(x), vgl. Beispiel 12.1.10, (ii). Gilt
umgekehrt O ∈ U(x), ∀x ∈ O, so gibt es wegen der Definition von U(x) zu jedem
x ∈ O eine Menge O x ⊆ O, O x ∈ T , und daher
[ [
O= {x} ⊆ O x ⊆ O.
x∈X x∈X
Als Vereinigung der offenen Mengen O x muss O nach (O3) selber offen sein.
❑
Nun können wir den Grenzwert eines Netzes auch für topologische Räume definie-
ren.
12.1.12 Definition. Sei (I, ) eine gerichtete Menge und (xi )i∈I ein Netz in X, wobei
(X, T ) ein topologischer Raum ist. Man sagt, dass dieses Netz gegen einen Punkt x ∈ X
i∈I
konvergiert, in Zeichen xi −→ x, falls
∀U ∈ U(x) ∃i0 ∈ I : ∀i i0 ⇒ xi ∈ U,
d.h. falls in jeder beliebigen Umgebung ab einem Index alle Glieder xi des Netzes
enthalten sind.
12.1.13 Fakta.
Ist W(x) eine Filterbasis von U(x), so ist die Konvergenzbedingung aus Definition
12.1.12 äquivalent zu
∀W ∈ W(x) ∃i0 ∈ I : ∀i i0 ⇒ xi ∈ W,
∀i ∈ I∃ j0 ∈ J : ∀ j J j0 ⇒ i( j) I i,
und konvergiert (xi )i∈I gegen x, so auch (xi( j) ) j∈J . Um das zu sehen, sei U ∈ U(x)
und i0 ∈ I, sodass i I i0 ⇒ xi ∈ U. Ist nun j0 ∈ J so, dass j J j0 ⇒ i( j) I i0 ,
so folgt auch xi( j) ∈ U für alle j J j0 .
1 Es ist nicht ausgeschlossen, dass W(x) = U(x).
12.1. TOPOLOGISCHE GRUNDBEGRIFFE 139
12.1.14 Bemerkung. Wir sehen nun aus Fakta 12.1.13, dass diese Definition der Kon-
vergenz mit der in metrischen Räumen konform geht. In der Tat haben wir x = limi∈I xi
in einem metrischen Raum (Y, d) genau dann, wenn
Da {Uǫ (x) : ǫ > 0} eine Filterbasis von U(x) ist, stimmt diese Bedingung mit der aus
Fakta 12.1.13 überein.
Wir sehen insbesondere, dass die Konvergenz nicht von der konkreten Metrik, son-
dern nur von der von ihr erzeugten Topologie abhängt (vgl. Beispiel 12.3.10).
Wir haben in der Definition der Konvergenz absichtlich nicht die Schreibweise x =
limi∈I xi verwendet, denn es kann sein, dass x nicht der einzige Grenzwert ist.
12.1.15 Beispiel. Man betrachte eine Menge X mit mindestens zwei Elementen verse-
hen mit der Klumpentopologie. Dann ist U(x) = {X} für alle x ∈ X. Damit konvergiert
aber jedes Netz gegen jeden Punkt x ∈ X.
Man muss eine zusätzliche Eigenschaft vom gegebenen topologischen Raum for-
dern, damit Grenzwerte eindeutig sind.
12.1.16 Definition. Ein topologischer Raum (X, T ) heißt T 2 -Raum (oder Hausdorff-
Raum) 2 , wenn gilt:
Oy
y
Ox
x
Man sieht unmittelbar, dass diese Eigenschaft zu der Tatsache äquivalent ist, dass
es zu zwei verschiedenen Punkten x, y zwei Umgebungen U ∈ U(x), V ∈ U(y) gibt mit
U ∩ V = ∅.
12.1.17 Beispiel. Die von einer Metrik d auf einer Menge Y induzierte Topologie ist
Hausdorff. Sind nämlich x, y ∈ Y, x , y, so gilt d(x, y) > 0. Setze ǫ := 31 d(x, y) und
betrachte die Umgebungen
U := Uǫ (x), V := Uǫ (y) .
Der Beweis der Eindeutigkeit des Grenzwertes eines Netzes wird nun fast wörtlich
vom metrischen Fall übertragen.
12.1.18 Lemma. Sei (xi )i∈I ein konvergentes Netz in einem topologischen (T 2)-Raum.
Dann ist Grenzwert eindeutig.
Beweis. Wären x, y zwei verschiedene Grenzwerte, so wähle man disjunkte Umge-
bungen U ∈ U(x) und V ∈ U(y). Dann wähle man i1 ∈ I und i2 ∈ I mit i i1 ⇒ xi ∈ U
und i i2 ⇒ xi ∈ V. Da I gerichtet ist, gibt es ein i ∈ I, i i1 , i i2 , und somit
xi ∈ U ∩ V, was aber ein Widerspruch zu U ∩ V = ∅ ist.
❑
heißt der Abschluss von B. Wenn man explizit klarstellen will, bezüglich welcher To-
T
pologie der Abschluss zu bilden ist, dann schreibt man für B oft auch B .
Ist C ⊆ B ⊆ X und gilt B ⊆ C, so heißt C dicht in B. Ist C dicht in X, so sagt man,
C ist dicht.
Hat B ⊆ X eine in B dichte und abzählbare Teilmenge, so heißt B separabel.
12.2.4 Lemma. Sei (X, T ) topologischer Raum, B ⊆ X. Dann ist B die kleinste abge-
schlossene Menge, die B umfasst.
Beweis. Wegen (A1) ist die Menge, über die in (12.4) der Durchschnitt gebildet wird,
nicht leer. Wegen (A3) ist B abgeschlossen. Ist A abgeschlossen und A ⊇ B, so kommt
A auf der rechten Seite von (12.4) vor, also gilt A ⊇ B.
❑
12.2.5 Lemma. Sei (X, T ) topologischer Raum. Dann gilt:
(i) Für B ⊆ X gilt B ⊆ B.
(ii) Ist C ⊆ B ⊆ X, so folgt C ⊆ B.
12.2. ABGESCHLOSSENE MENGEN 141
❑
Wenn man sich an die Definition von Abschluss und abgeschlossener Menge in
metrischen Räumen zurückerinnert, so haben wir dort einen Zugang über Häufungs-
punkte gewählt. Im nächsten Lemma werden wir sehen, dass auch in allgemeinen to-
pologischen Räumen der Abschluss bzw. der Begriff der abgeschlossenen Menge so
charakterisiert werden kann. Um das einzusehen wollen wir zunächst ein kanonisches
Netz konstruieren, das gegen einen gegebenen Punkt konvergiert.
12.2.6 Lemma. Sei (X, T ) topologischer Raum, B ⊆ X und x ∈ X, sodass U ∩ B , ∅
für alle U ∈ U(x). Nun sei
Beweis. Laut Definition ist x < B zur Existenz einer abgeschlossenen Menge A mit
x < A, A ⊇ B äquivalent. Da die offenen Mengen genau die Komplemente der abge-
schlossenen sind, ist das äquivalent zu ∃O ∈ T : x ∈ O, O ∩ B = ∅. Da die offenen, x
enthaltenden Mengen eine Umgebungsbasis darstellen, ist das aber genau die Negation
von (ii), also (i) ⇔ (ii).
(ii) ⇔ (iii) folgt unmittelbar aus der Tatsache, dass W(x) eine Filterbasis von U(x)
ist. (ii) ⇒ (iv) ist eine unmittelbare Konsequenz aus Lemma 12.2.6.
Gilt schließlich (iv) und ist U ∈ U(x), so folgt xi ∈ U ∩ B für alle i i0 mit einem
gewissen i0 . Also ist sicher U ∩ B , ∅.
❑
In Analogie zum Begriff des Häufungspunktes einer Menge in metrischen Räumen in Definition 5.1.7 definieren wir:
12.2.8 Definition. Sei (X, T ) topologischer Raum und B ⊆ X. Ein x ∈ X heißt Häufungspunkt von B, wenn
∀U ∈ U(x) : (B \ {x}) ∩ U , ∅.
12.2.9 Bemerkung. Aus Proposition 12.2.7 erkennt man sofort, dass x genau dann Häufungspunkt von B ist, wenn x ∈
B \ {x}, bzw. wenn (xi )i∈I → x für ein Netz aus B \ {x} (vgl. Lemma 5.1.13).
Man erkennt auch leicht aus Proposition 12.2.7, dass B mit der Vereinigung von B und der Menge aller Häufungspunkt
von B übereinstimmt.
12.2.10 Bemerkung. Ist (X, d) ein metrischer Raum, B ⊆ X und nimmt man als W(x)
die Menge aller offenen ǫ-Kugeln um x, so sieht man durch einen Vergleich von Pro-
position 12.2.7 und Bemerkung 5.1.11, dass x ∈ B genau dann, wenn x ∈ c(B). Also
stimmt der Abschluss in metrischen Räumen mit dem topologischen Abschluss übe-
rein.
Der Grund, warum man in metrischen Räumen das Auslangen mit Folgen findet,
daher x ∈ B genau dann, wenn xn → x für eine Folge aus B, ist die Gültigkeit des
ersten Abzählbarkeitsaxioms. In der Tat, kann man unter der Voraussetzung (ABI) die
Konstruktion in Lemma 12.2.6 folgendermaßen abändern:
Sei W(x) = {Wn : n ∈ N} eine abzählbare Filterbasis von U(x), und wähle xn ∈
B ∩ W1 ∩ · · · ∩ Wn (∈ U(x)). Man erhält somit eine Folge (xn )n∈N in B, sodass zu
vorgegebenem U ∈ U(x) ein N ∈ N mit WN ⊆ U existiert, und daher
xn ∈ W1 ∩ · · · ∩ WN ∩ · · · ∩ Wn ⊆ U für alle n ≥ N.
definiert ist. Man sieht unmittelbar, dass x ∈ B◦ ⇔ B ∈ U(x). Ähnlich wie beim
Abschluss sieht man, dass B◦ die größte in B enthaltene offene Menge ist. Damit ist B
genau dann offen, wenn B = B◦.
Da die Komplemente von den offenen Mengen genau die abgeschlossenen Mengen
sind, besteht der folgende Zusammenhang zum Abschluss von Mengen.
c \ n oc
Bc = A ⊆ X : A abgeschlossen, A ⊇ Bc =
\ n oc
Oc ⊆ X : O offen, O ⊆ B = B◦ .
12.3. STETIGE ABBILDUNGEN 143
Begriffsbildung, die der des Häufungspunktes einer Folge entspricht, ist die des Häufungspunktes eines Netzes.
12.2.12 Definition. Sei (X, T ) ein topologischer Raum und (xi )i∈I ein Netz in X. Dann heißt x ∈ X Häufungspunkt von
(xi )i∈I , falls
∀U ∈ U(x)∀i ∈ I ∃ j ∈ I : i j ∧ x j ∈ U.
Vergleicht man das mit Proposition 12.2.7, so ist x Häufungspunkt von (xi )i∈I genau dann, wenn er im Schnitt aller
Mengen der Form
{x j : j ∈ I, i j},
also in \
{x j : j ∈ I, i j} (12.5)
i∈I
enthalten ist.
Unmittelbar aus der Definition des Grenzwertes eines Netzes sieht man, dass ein Limes eines Netzes auch Häufungs-
punkt ist. Die Umkehrung gilt im Allgemeinen nicht, wie man z. B. bei Folgen in R schon unschwer erkennen kann.
Eine weiter Charakterisierung von Häufungspunkten verwendet das Konzept von Teilnetzen.
12.2.13 Lemma. Der Punkt x ist Häufungspunkt von (xi )i∈I genau dann, wenn x Limes eines Teilnetzes (xi(k) )k∈K ist.
Beweis. Ist (xi(k) )k∈K ein Teilnetz, so gibt es zu i0 ∈ I ein k0 ∈ K, sodass i0 i(k), k0 k. Also gilt
und damit \ \
{xi : i ∈ I, i0 i} ⊇ {xi(k) : k ∈ K, k0 k}. (12.6)
i0 ∈I k0 ∈K
Ist nun x Limes von (xi(k) )k∈K , so ist er insbesondere Häufungspunkt dieses Teilnetzes, und wegen (12.6) ein Häufungspunkt
von (xi )i∈I .
Ist umgekehrt x Häufungspunkt von (xi )i∈I , so betrachte die Menge
K = {(i, U) : i ∈ I, U ∈ U(x), xi ∈ U}
∀i ∈ I∃ j ∈ I, i j : x j < U.
Betrachte die gerichtete Menge (K, |K×K ) mit K = {i ∈ I : xi < U}. Dann hat das Teilnetz (xi )i∈K den Punkt x sicherlich
nicht als Häufungspunkt.
❑
Sei (X, T ) topologischer Raum. Die Abbildung idX : (X, T ) → (X, T ) ist stetig.
Denn ist x ∈ X und V ∈ U(idX x) = U(x), so wähle U := V ∈ U(x), dann gilt
idX (U) = V ⊆ V.
Seien (X, T ), (Y, O) topologische Räume und sei a ∈ Y. Die Abbildung
(
(X, T ) → (Y, O)
fa :
x 7→ a
ist stetig. Denn ist x ∈ X und V ∈ U( fa (x)) = U(a), so wähle U := X ∈ U(x),
dann gilt fa (U) = {a} ⊆ V.
Sei X versehen mit der diskreten Topologie T = P(X), sei (Y, O) irgendein topo-
logischer Raum und sei f : (X, P(X)) → (Y, O) irgendeine Abbildung. Dann ist
f stetig. Denn sei x ∈ X, V ∈ U( f (x)). Da {x} offen in der diskreten Topologie
ist, ist {x} ∈ U(x). Wähle U := {x}, dann gilt f (U) = { f (x)} ⊆ V.
Zieht man in Betracht, dass in einem metrischen Raum die ǫ-Kugeln eine Umge-
bungsbasis um einen Punkt bilden, so ist das im folgenden Lemma auftretende Kriteri-
um (ii) für die Stetigkeit eine unmittelbare Verallgemeinerung des wohlbekannten ’ǫ’ -
’δ’ Kriteriums.
Bei Funktionen auf metrischen Räumen haben wir auch gesehen, dass die Stetigkeit
in einem Punkt x auch durch xn → x ⇒ limn→∞ f (xn ) = f (x), charakterisiert werden
kann. Man hat in allgemeienen topologischen Räumen eine ähnliche Charakterisierung,
wobei man jedoch nicht mehr mit Folgen das Auslangen findet, siehe (iii) im folgenden
Lemma.
12.3.3 Lemma. Seien (X, T ), (Y, O) topologische Räume, f : X → Y, x ∈ X, und seien
W(x) bzw. W( f (x)) beliebige Umgebungsbasen von x in (X, T ) bzw. von f (x) in (Y, O).
Dann sind folgende Aussagen äquivalent.
(i) f ist im Punkt x stetig.
(ii) Für jedes V ∈ W( f (x)) existiert ein U ∈ W(x) mit f (U) ⊆ V.
(iii) Für jedes gegen x konvergente Netz (xi )i∈I in X folgt, dass das Netz ( f (xi ))i∈I
gegen f (x) konvergiert.
Beweis.
(i) ⇒ (ii) : Sei V ∈ W( f (x)). Dann ist auch V ∈ U( f (x)) und daher gibt es Ũ ∈ U(x)
mit f (Ũ) ⊆ V (vgl. (C x )). Nun ist W(x) Umgebungsbasen von x. Also gibt es ein
U ∈ W(x) mit U ⊆ Ũ und daher f (U) ⊆ V.
(ii) ⇒ (i) : Sei V ∈ U( f (x)), und wähle W ∈ W( f (x)) mit W ⊆ V. Dann gibt es
U ∈ W(x) ⊆ U(x) mit f (U) ⊆ W ⊆ V, also gilt (C x ).
(i) ⇒ (iii) : Konvergiert (xi )i∈I gegen x, und ist V ∈ U( f (x)), so existiert wegen der
Stetigkeit ein U ∈ U(x) mit f (U) ⊆ V. Wegen der Konvergenz findet man ein
ein i0 ∈ I, sodass i i0 ⇒ xi ∈ U und damit auch f (xi ) ∈ V. Also konvergiert
( f (xi ))i∈I gegen f (x).
(iii) ⇒ (i) : Wäre f nicht bei x stetig, so gäbe es eine Umgebung V von f (x), sodass
f (U) ∩ V c , ∅, oder äquivalent U ∩ f −1 (V c ) , ∅, für alle U ∈ U(x). Nach
Lemma 12.2.6 gibt es ein Netz (xi )i∈I in f −1 (V c ), welches gegen x konvergiert.
Andererseits ist aber f (xi ) ∈ V c für alle i ∈ I, womit f (xi ) i∈I sicherlich nicht
gegen f (x) konvergieren kann.
12.3. STETIGE ABBILDUNGEN 145
❑
12.3.4 Bemerkung. Mit einer Konstruktion ähnlich wie in Bemerkung 12.2.10 sieht
man, dass, wenn X das erste Abzählbarkeitsaxiom erfüllt - daher insbesondere in me-
trischen Räumen, die Stetigkeit bei x mit Hilfe von Folgen dadurch charakterisiert wer-
den, dass xn → x ⇒ limn→∞ f (xn ) = f (x).
12.3.5 Satz. Seien (X, T ), (Y, O) topologische Räume, und sei f : X → Y. Dann sind
folgende Aussagen äquivalent:
(i) f ist stetig.
(ii) f −1 (O) ∈ T für jede offene Menge O ∈ O, d.h. die Urbilder von offenen Mengen
sind offen.
(iii) Die Urbilder von abgeschlossenen Mengen sind abgeschlossen.
(iv) Für jede Teilmenge B ⊆ X gilt f (B) ⊆ f (B).
Beweis.
(i) ⇒ (ii) : Sei O ∈ O. Ist x ∈ f −1 (O), so gilt f (x) ∈ O. Da O offen ist, gilt O ∈ U( f (x)),
und daher gibt es eine Umgebung U ∈ U(x) mit f (U) ⊆ O, d.h. U ⊆ f −1 (O).
Mit Lemma 12.1.11 folgt f −1 (O) ∈ T .
(ii) ⇒ (iii) : Sei A abgeschlossene Teilmenge von Y. Dann ist (A)c offen und wegen
(ii) gilt h ic
f −1 (A) = f −1 (Ac ) ∈ T .
❑
−1
Bedingung (ii) in Satz 12.3.5 lässt sich kurz durch f (O) ⊆ T beschreiben, wobei
wir für eine Abbildung f : X → Y die Schreibweise
n o
f −1 (C) := f −1 (C) : C ∈ C ⊆ P(X) ,
12.3.6 Lemma. Seien (X, T ) und (Y, O) topologische Räume, wobei (Y, O) Hausdorff
ist. Ist D eine dichte Teilmenge von X, und sind f, g zwei stetige Funktionen von X nach
Y, sodass f |D = g|D , dann folgt f = g.
Beweis. Angenommen f (x) , g(x) für ein x ∈ X \ D. Wegen der Hausdorff-
Voraussetzung gibt es O1 , O2 ∈ O mit O1 ∩ O2 = ∅ und f (x) ∈ O1 , g(x) ∈ O2 . Da
f und g stetig sind, gibt es U1 , U2 ∈ T , x ∈ U1 ∩ U2 , sodass f (U1 ) ⊆ O1 , g(U2 ) ⊆ O2 .
Insbesondere ist U1 ∩ U2 eine nichtleere offene Menge, und hat daher einen nichtleeren
Schnitt mit D. Wir erhalten den Widerspruch:
∅ , f (U1 ∩ U2 ∩ D) = g(U1 ∩ U2 ∩ D) ⊆ O1 ∩ O2 = ∅.
Alternativ kann man sich so argumentieren, dass es zu x ∈ X \ D wegen Proposition 12.2.7 ein gegen x konvergentes
Netz (xi )i∈I in D gibt. Die Netze f (xi ) i∈I und g(xi ) i∈I konvergieren wegen Lemma 12.3.3 gegen f (x) bzw. g(x).
Andererseits sind diese Netze f (xi ) i∈I und g(xi ) i∈I identisch und haben wegen Lemma 12.1.18 den selben Grenzwert;
also f (x) = g(x).
❑
12.3.7 Lemma. Seien (X, T ), (Y, O), (Z, R) drei topologische Räume und seinen f :
X → Y, g : Y → Z Funktionen. Weiters sei x ∈ X. Ist f stetig im Punkt x und ist g stetig
im Punkt f (x), so ist g ◦ f stetig im Punkt x. Insbesondere ist g ◦ f stetig, wenn f, g es
sind.
Beweis. Sei W ∈ U((g ◦ f )(x)). Da g stetig im Punkt f (x) ist, gibt es V ∈ U( f (x))
mit g(V) ⊆ W. Da f stetig im Punkt x ist, gibt es U ∈ U(x) mit f (U) ⊆ V. Insgesamt
erhalten wir
(g ◦ f )(U) = g( f (U)) ⊆ g(V) ⊆ W .
❑
12.3.8 Definition. Seien (X, T ) und (Y, O) topologische Räume, und sei f : X → Y.
Dann heißt f ein Homöomorphismus von (X, T ) nach (Y, O), wenn f bijektiv ist und
wenn gilt f (T ) = O. Zwei topologische Räume (X, T ) und (Y, O) heißen homöomorph,
wenn es einen Homöomorphismus von (X, T ) nach (Y, O) gibt.
12.3.9 Lemma.
(i) Sei f : (X, T ) → (Y, O) eine bijektive Abbildung. Dann ist f genau dann
Homöomorphismus, wenn sowohl f als auch f −1 stetig sind.
(ii) Sind f : (X, T ) → (Y, O), g : (Y, O) → (Z, R) Homöomorphismen, so ist auch
g ◦ f : (X, T ) → (Z, R) ein Homöomorphismus.
(iii) Die Abbildung idX : (X, T1 ) → (X, T2 ) ist ein Homöomorphismus genau dann
wenn T1 = T2 .
Beweis.
(i) Ist f bijektiv, so ist f (T ) = O genau dann wenn f −1 (O) ⊆ T und f (T ) ⊆ O.
(ii) Folgt unmittelbar aus (i) und Lemma 12.3.7.
(iii) Das folgt unmittelbar aus idX (T1 ) = T1 .
12.4. BASIS, SUBBASIS 147
❑
12.3.10 Beispiel.
Ist eine gegebene Menge Y mit zwei verschiedenen Metriken d1 und d2 versehen,
die aber äquivalent sind, dh. es gibt α, β > 0, sodass für alle x, y ∈ Y
so zeigt man leicht mit Hilfe der Charakterisierung der Stetigkeit in metrischen
Räumen durch Folgen (siehe Proposition 6.1.4), dass dann idY : (Y, d1 ) → (Y, d2 )
und idY : (Y, d2 ) → (Y, d1 ) beide stetig sind. Also induzieren diese Metriken die
selbe Topologie, dh. T (d1 ) = T (d2 ).
Sei X ein Vektorraum versehen mit zwei Normen k.k1 und k.k2 . Sind diese äqui-
valent (vgl. Definition 9.2.1), so sieht man sofort, dass die jeweils induzierten
Metriken ebenfalls äquivalent sind. Somit stimmen die Topologien, die von den
zu k.k1 und k.k2 gehörigen Metriken erzeugt werden, überein.
Man betrachte C versehen mit der euklidischen Metrik d2 und mit der chordalen
Metrik χ. Es ist wohlbekannt, dass zn → z in C bezüglich d2 genau dann, wenn
zn → z bezüglich χ. Also ist die Abbildung idC als Abbildung von (C, d2 ) nach
(C, χ) und auch als Abbildung von (C, χ) nach (C, d2 ) stetig. Somit gilt T (d2 ) =
T (χ).
Man betrachte einerseits C ∪ {∞} versehen mit der chordalen Metrik χ. Ande-
rerseits sei S die Oberfläche der Kugel mit Durchmesser 1 im R3 , die so auf
die Ebene R2 zum liegen kommt, dass Ihr Südpol den Nullpunkt berührt. Wir
versehen S mit d2 , dh.
q
d2 ((α, β, γ)T , (ξ, η, ζ)T ) = (α − ξ)2 + (β − η)2 + (γ − ζ)2 .
Beweis. Wir müssen nachweisen, dass ∩i∈I Ti die Axiome (O1) - (O3) erfüllt. Die
Mengen ∅, X sind in allen Ti enthalten, da diese ja Topologien sind. Also sind diese
Mengen auch im Schnitt enthalten. Es folgt (O1).
Aus O1 , O2 ∈ ∩i∈I Ti folgt O1 , O2 ∈ Ti , i ∈ I, und somit O1 ∩ O2 ∈ Ti , i ∈ I. Also
O1 ∩ O2 ∈ ∩i∈I Ti , und daher (O2).
Sind O j ∈ ∩i∈I Ti , j ∈ J, so folgt für jedes i ∈ I, dass O j ∈ Ti , j ∈ J, und weiter
S S
j∈J O j ∈ Ti . Nun gilt das wieder für alle i ∈ I, also j∈J O j ∈ ∩i∈I Ti , und somit (O3).
Klarerweise ist ∩i∈I Ti in allen Ti enthalten. Ist andererseits T ⊆ Ti , i ∈ I, so auch
T ⊆ ∩i∈I Ti . Also ist der Schnitt die feinste in allen Ti enthaltene Topologie.
Nun enthält der Schnitt T (C) von Mengensystemen, die alle C enthalten, ebenfalls
C. Ist andererseits T ⊇ C, so gehört T zur Menge auf der linken Seite von (12.7) und
daher T ⊇ T (C). Also ist T (C) die gröbste Topologie, die C enthält.
❑
12.4.2 Definition. Sei (X, T ) ein topologischer Raum. Ein Mengensystem B ⊆ P(X)
heißt Basis von T , wenn B ⊆ T und wenn es für alle O ∈ T und x ∈ O ein B ∈ B mit
x ∈ B ⊆ O gibt.
Man sagt ein topologischer Raum (X, T ) erfüllt das zweite Abzählbarkeitsaxiom (ABII), wenn T eine abzählbare Basis
besitzt.
Ein Mengensystem C ⊆ P(X) heißt Subbasis von T , wenn C ⊆ T und wenn es für
alle O ∈ T , O , X, und x ∈ O endlich viele C1 , . . . , Cn ∈ C mit x ∈ C1 ∩ · · · ∩ Cn ⊆ O
gibt.
schreiben.
12.4.4 Bemerkung. Offensichtlich ist C ⊆ P(X) genau dann eine Subbasis von T , wenn
das Mengensystem E aller endlichen Schnitte von C samt X, also
n\
n
E := {X} ∪ Ci : n ∈ N, C1 , . . . , Cn ∈ C}
i=1
Ist (Y, d) ein metrischer Raum, so folgt aus der Definition der von d induzierten
Topologie T (d) sofort, dass
Die Euklidische Topologie T (d2 ) auf R hat die Menge aller offenen Intervalle
{(a, b) ⊆ R : a, b ∈ R, a < b}
12.4. BASIS, SUBBASIS 149
als Basis. Da man zu a < x < b aus R wegen der Dichteeigenschaft von Q (siehe
Satz 2.6.3) sicherlich s, t ∈ Q findet, sodass a < s < x < t < b, ist auch
{(s, t) ⊆ R : s, t ∈ Q, s < t}
Uǫ (x) = (ξ1 − ǫ, ξ1 + ǫ) × · · · × (ξ p − ǫ, ξ p + ǫ)
gilt, wobei x = (ξ j ) pj=1 , folgt, dass die Menge aller p-dimensionalen Quader
{(a1 , b1 ) × · · · × (a p , b p ) : a j , b j ∈ R, a j < b j , j = 1, . . . , p}
eine Basis von T (d∞ ) abgibt. Wegen T (d∞ ) = T (d2 ) (siehe Beispiel 12.3.10)
sind diese trivialerweise auch Basis von T (d2 ).
Ähnlich wie für R sieht man, dass auch
{(s1 , t1 ) × · · · × (s p , t p ) : s j , t j ∈ Q, s j < t j , j = 1, . . . , p}
Wegen B ⊆ T (B) und wegen (O3) ist jede dieser Mengen auch in T (B), dh. T ⊆ T (B).
Aus (12.8) angewandt auf O = X sieht man unmittelbar, dass (B2) erfüllt ist.
S
Für B1 , B2 ∈ B ⊆ T gilt B1 ∩ B2 ∈ T . Aus B1 ∩ B2 = {B ∈ B : B ⊆ B1 ∩ B2} folgt
für jedes x ∈ B1 ∩ B2 die Existenz eines B3 ∈ B mit x ∈ B3 ⊆ B1 ∩ B2 . Also gilt auch
(B1).
Ist schließlich C ⊆ P(X) eine Subbasis von T , so folgt aus Bemerkung 12.4.4, dass
E eine Basis von T ist, und daher T = T (E). Wegen C ⊆ E gilt T (C) ⊆ T (E).
Ist andererseits E ∈ E, so gilt E = X oder E = C1 ∩ · · · ∩ Cn für
C1 , . . . , Cn ∈ C ⊆ T (C). Aus (O1) bzw. (O2) folgt dann E ∈ T (C), und daher
E ⊆ T (C). Somit gilt auch T (E) ⊆ T (C), und insgesamt T = T (E) = T (C).
❑
150 KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
12.4.7 Lemma. Seien (X, T ) und (Y, O) topologische Räume und f : X → Y eine
Abbildung. Ist C eine Subbasis von O, so ist f genau dann stetig, wenn f −1 (C) ⊆ T .
Beweis. Aus der Stetigkeit folgt unmittelbar f −1 (C) ⊆ f −1 (O) ⊆ T .
Ist umgekehrt f −1 (C) ⊆ T , so prüft man leicht nach, dass
O′ := {O′ ⊆ Y : f −1 (O′ ) ∈ T }
die Axiome (O1) - (O3) erfüllt, dh. eine Topologie ist. Da laut Voraussetzung C ⊆ O′ ,
muss auch O = T (C) ⊆ O′ , und daher f −1 (O) ∈ T für alle O ∈ O.
❑
Wir wollen nun den umgekehrten Weg wie in Satz 12.4.6 gehen.
12.4.8 Satz. Erfüllt B ⊆ P(X) die Axiome (B1) und (B2), so ist B eine Basis von T (B).
Außerdem stimmt T (B) mit dem System T aller Mengen O ⊆ X der Bauart
[
O= B
B∈V
Ist C ⊆ P(X), so ist C eine Subbasis von T (C). Außerdem stimmt T (C) mit dem
System [
{O ⊆ X : ∃V ⊆ E, O = B} (12.10)
B∈V
überein, wobei
n\
n
E := {X} ∪ Ci : n ∈ N, C1 , . . . , Cn ∈ C}.
i=1
die Axiome (B1) und (B2) erfüllt.
Beweis.
Wir zeigen zunächst, dass T definiert in (12.9) eine Topologie auf X ist. Zunächst
ist [
∅= B∈T,
B∈∅
und wegen (B2) [
X= B ∈ T.
B∈B
Also gilt (O1). Die Bedingung (O3) folgt aus
[ [ [
B = B.
S
i∈I B∈Vi B∈ i∈I Vi
S S
Es bleibt (O2) zu zeigen. Seien also O1 = B∈V1 B, O2 = B∈V2 B gegeben.
Jedes x ∈ O1 ∩ O2 liegt somit in einem B1 ∈ V1 und einem B2 ∈ V2 . Nach (B1)
gibt es ein B ∈ B mit x ∈ B ⊆ B1 ∩ B2 ⊆ O1 ∩ O2 . Wir erhalten (vgl. Bemerkung
12.4.3) [
O1 ∩ O2 = B,
B∈V
wobei V := {B ∈ B : B ⊆ O1 ∩ O2 }. Also O1 ∩ O2 ∈ T .
12.5. INITIALE TOPOLOGIE UND FINALE TOPOLOGIE 151
fi ◦ f : (Y, O) → (Yi , Ti ), i ∈ I ,
stetig sind.
Beweis.
Ist T ′ eine beliebige Topologie auf X, so ist fi : (X, T ′ ) → (Xi , Ti ) genau dann
stetig, wenn fi−1 (Ti ) ⊆ T ′ . Also sind alle fi genau dann stetig, wenn
[
fi−1 (Ti ) ⊆ T ′ . (12.11)
i∈I
S
Nach Lemma 12.4.1 gibt es eine gröbste Topologie T = T ( i∈I fi−1 (Ti )), die
(12.11) erfüllt. Damit ist aber auch T die gröbste Topologie, sodass alle fi stetig
sind. Also gilt (IN1 ).
S
Wegen Satz 12.4.8 ist i∈I fi−1 (Ti ) Subbasis von T , und es gilt auch (IN2 ).
Sei f : (Y, O) → (X, T ), wobei T die initiale Topologie der fi , i ∈ I, ist. Im Falle
der Stetigkeit von f sind auch alle fi ◦ f : (Y, O) → (Yi , Ti ) als Zusammensetzung
stetiger Abbildungen stetig.
152 KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
Seien umgekehrt alle fi ◦ f stetig, d.h. es gelte ( fi ◦ f )−1 (Ti ) ⊆ O. Dann folgt
f −1 ( fi−1 (Ti )) ⊆ O und damit
[
f −1 ( fi−1 (Ti )) ⊆ O.
i∈I
S
Da i∈I fi−1 (Ti ) eine Subbasis von T ist, folgt aus Lemma 12.4.7, dass f stetig
ist. Die initiale Topologie T hat also die Eigenschaft (IN3 ).
❑
′
12.5.2 Bemerkung. Die initiale Topologie T ist in der Tat die einzige Topologie T mit der Eigenschaft (IN3 ). Um das
einzusehen, sei T ′ eine weiters Topologie auf X mit der Eigenschaft (IN3 ).
Da die Abbildung idX : (X, T ′ ) → (X, T ′ ) trivialerweise stetig ist, folgt aus (IN3 ) angewandt auf T ′ , dass alle fi ◦ idX :
(X, T ′ ) → (Yi , Ti ) stetig sind. Aus (IN1 ) folgt T ⊆ T ′ .
Für idX : (X, T ) → (X, T ′ ) sind andererseits alle Abbildungen fi ◦ idX = fi : (X, T ) → (Yi , Ti ) stetig. Mit (IN3 )
angewandt auf T ′ folgt die Stetigkeit von id X : (X, T ) → (X, T ′ ), und daher T ′ ⊆ T . Insgesamt ist T ′ = T .
12.5.3 Lemma. Mit der Notation aus Satz 12.5.1 sei (x j ) j∈J ein Netz in X. Dieses
konvergiert bzgl. T gegen ein x ∈ X genau dann, wenn fi (x j ) j∈J für alle i ∈ I gegen
fi (x) konvergiert.
Beweis. Konvergiert (x j ) j∈J gegen x bzgl. T , so folgt aus der Stetigkeit der fi mit
Lemma 12.3.3, dass fi (x j ) j∈J gegen fi (x) konvergiert.
Gelte umgekehrt, dass fi (x j ) j∈J gegen fi (x) für alle i ∈ I konvergiert. Für ein
U ∈ U(x) mit oBdA. U , X und O ∈ T mit x ∈ O ⊆ U folgt aus der Tatsache,
S
dass i∈I fi−1 (Ti ) eine Subbasis von T ist (vgl. (IN2 ) aus Satz 12.5.1), und Definition
12.4.2, dass
x ∈ fi−1
1
(O1 ) ∩ · · · ∩ fi−1
m
(Om ) ⊆ O,
wobei i1 , . . . , im ∈ I, O1 ∈ Ti1 , . . . , Om ∈ Tim . Also folgt fik (x) ∈ Ok , k = 1, . . . , m, und
laut Voraussetzung gibt es Indizes j1 , . . . , jm , ∈ J, sodass j jk ⇒ fik (x j ) ∈ Ok , k =
1, . . . , m. Ist nun j0 ∈ J derart, dass j0 jk , k = 1, . . . , m, so folgt für j j0 jedenfalls
fik (x j ) ∈ Ok , k = 1, . . . , m, und daher
x j ∈ fi−1
1
(O1 ) ∩ · · · ∩ fi−1
m
(Om ) ⊆ O ⊆ U.
❑
Die Konstruktion der Initialen Topologie ist assoziativ.
Beweis. Wir versehen die Xi mit der initialen Topologie Ti bezüglich der Abbildungen
gi, j , j ∈ Ji . Ist T irgendeine Topologie auf X, so ist wegen (IN3 ) angewandt auf die
(Xi , Ti ) die Tatsache, dass alle Abbildungen fi : X → Yi , i ∈ I, stetig sind, dazu
äquivalent, dass alle Abbildungen gi, j ◦ fi : X → Zi, j , i ∈ I, j ∈ Ji , stetig sind.
12.5. INITIALE TOPOLOGIE UND FINALE TOPOLOGIE 153
Also stimmt die gröbste aller Topologien, die die erste Bedingung erfüllen, -
wegen (IN1 ) ist das T1 - mit der gröbsten aller Topologien, die die zweite Bedingung
erfüllen, - wegen (IN1 ) ist das T2 - überein.
❑
12.5.5 Beispiel. Sei (Y, T ) ein topologischer Raum und X ⊆ Y. Weiters sei ι : X →
Y die kanonische Einbettung, ι(x) = x. Die initiale Topologie auf X bezüglich der
Abbildung ι heißt die Spurtopologie von T auf X und wird bezeichnet als T |X . Man
spricht von (X, T |X ) als einem Teilraum von (Y, T ). Wegen Satz 12.5.1 ist
ι−1 (T ) = {O ∩ X : O ∈ T } ⊆ P(X)
eine Subbasis für T |X . Nun erfüllt diese Menge selbst schon (O1) − (O3), d.h. es gilt
T |X = {O ∩ X : O ∈ T } .
Damit erhält man auch, dass das System A|X der in (X, T |X ) abgeschlossenen Mengen
gegeben ist durch
A|X = {A ∩ X : A ∈ A} , (12.12)
und dass der Umgebungsfilter U|X (x) eines Elementes x ∈ X bezüglich T |X genau
ist. Erfüllt (Y, T ) das Axiom (T 2), so folgt somit, dass auch (X, T |X ) dieses Axiom
erfüllt.
Weiters folgt aus (12.12) für A ⊆ X
T |X T
A = A ∩X, (12.13)
und aus (IN3 ) folgt, dass eine Funktion f : (Y, O) → (X, T |X ) genau dann stetig ist,
wenn f : (Y, O) → (Y, T ) stetig ist.
Ist (x j ) j∈J ein Netz in X und x ∈ X, so erkennt man aus der letzten Behauptung von
Satz 12.5.1, dass (x j ) j∈J genau dann gegen x bzgl. T konvergiert, wenn (x j ) j∈J bzgl.
T |X gegen x konvergiert.
Ist schließlich X ⊆ Z ⊆ Y, so gilt wegen Korollar 12.5.4
T |X = (T |Z )|X . (12.14)
12.5.6 Beispiel. Sei (Y, d) ein metrischer Raum, und sei X ⊆ Y versehen mit der Ein-
schränkung von d|X×X . Klarerweise ist (X, d|X×X ) ein metrischer Raum.
Die von d|X×X auf X erzeugte Topologie ist genau die Spurtopologie, die von T (d)
auf X induziert wird:
Ist O ∈ T (d) und x ∈ O ∩ X, so gibt es ein ǫ > 0 mit Uǫ (x) ⊆ O. Daraus folgt, dass
die ǫ-Kugel Uǫ (x) ∩ X um x bezüglich d|X×X in O ∩ X enthalten ist. Also ist jede Menge
aus T (d)|X offen bezüglich d|X×X .
Ist umgekehrt P ∈ T (d|X×X ), so wähle man für jedes x ∈ P ein ǫ x > 0, sodass die
ǫ x -Kugel X ∩ Uǫx (x) in X in P enthalten ist. Es folgt
[ [
P= X ∩ Uǫx (x) = X ∩ Uǫx (x).
x∈P x∈P
Somit ist P der Schnitt einer in Y offenen Menge und X, also P ∈ T (d)|X .
154 KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
12.5.7 Lemma. Seien (X, T ), (Y, O) topologische Räume und A, B ⊆ X mit A ∪ B = X, wobei entweder A und B beide
abgeschlossen oder beide offen sind.
Sind f : A → Y und g : B → Y zwei stetige Funktionen, wobei A bzw. B beide mit der Spurtopologie (vgl. Beispiel
12.5.5) versehen sind, sodass f und g auf A ∩ B übereinstimmen, dann ist auch die Funktion f ∪ g : X → Y 3 stetig.
Beweis. Seien A, B beide abgeschlossen. Der offene Fall ist ähnlich zu beweisen. Ist F ⊆ Y abgeschlossen, so ist
Wegen der Stetigkeit von f : A → Y ist f −1 (F) abgeschlossen in der Spurtopologie T |A , und somit von der Bauart C ∩ A
für eine in X abgeschlossene Menge C. Als Schnitt zweier in X abgeschlossener Mengen ist f −1 (F) in X abgeschlossen.
Genauso zeigt man, dass g−1 (F) in X abgeschlossen ist. Als Vereinigung zweier abgeschlossener Mengen ist dann
auch ( f ∪ g)−1 (F) abgeschlossen. Da F beliebig war, ist damit f ∪ g stetig.
❑
Q
12.5.8 Definition. Seien (Xi , Ti ), i ∈ I, topologische Räume, und sei X := i∈I Xi . Die
initiale Topologie auf X bezüglich der Familie πi : X → Xi der kanonischen Projektio-
nen
πi (xk )k∈I = xi
Q
heißt die Produkttopologie der Ti auf X und wird bezeichnet mit i∈I Ti .
Für ein O ⊆ Xi gilt Y
π−1
i (O) = Ok
k∈I
wobei Ok = Xk , k , i, und Oi = O ist. Wieder mit (IN2 ) und Bemerkung 12.4.4 erhält
man daraus, dass die Mengen der Gestalt
Y
Ok ,
k∈I
wobei Ok ∈ Tk , k ∈ I, und für alle k ∈ I bis auf endlich viele Ok = Xk gilt, eine Basis
Q
für i∈I Ti bilden.
Q
Ist i ∈ I fest, so gilt klarerweise πi ( k∈I Ok ) = Oi . Also ist das Bild unter πi
Q
einer jeden Menge aus dieser Basis offen in (Xi , Ti ). Da jede offene Menge in k∈I Tk
Vereinigung von Basismengen ist, folgt
12.5.9 Proposition. Die kanonischen Projektionen πi : X → Xi bilden offene Menge
Q
in k∈I Tk auf offene Mengen in Ti ab, also sind sie offene Abbildungen.
Weiters sieht man leicht mit Hilfe obigen konstruierter Basis, dass für einen Punkt
(xi )i∈I ∈ X die Mengen Y
Ui ,
i∈I
wobei Ui ∈ U(xi ), i ∈ I, und Ui = Xi für alle bis auf endlich viele i, eine Umgebungs-
Q
basis bezüglich i∈I Ti bilden.
Q
Aus Lemma 12.5.3 folgt, dass für ein Netz (x j ) j∈J und einem Punkt x aus i∈I Xi ,
d.h. x j = (ξ j,i )i∈I und x = (ξi )i∈I mit ξ j,i , ξi ∈ Xi ,
j∈J j∈J
x j −→ x ⇔ ∀i ∈ I : ξ j,i −→ ξi . (12.15)
3 Das ist die Funktion, die auf A mit f und auf B mit g übereinstimmt.
12.5. INITIALE TOPOLOGIE UND FINALE TOPOLOGIE 155
als Durchschnitt von Urbildern abgeschlossener Mengen unter stetigen Funktionen sel-
ber wieder abgeschlossen ist.
12.5.10 Bemerkung. Wendet man diese Konstruktion der Produkttopologie etwa auf
zwei Räume (X1 , T1 ) und (X2 , T2 ) an, d.h. I = {1, 2}, so bilden insbesondere alle Men-
gen der Bauart O1 × O2 mit O1 ⊆ X1 , O2 ⊆ X2 eine Basis der Produkttopologie T1 × T2 .
Außerdem sind alle Mengen A1 × A2 für abgeschlossene A1 ⊆ X1 , A2 ⊆ X2 , ebenfalls
abgeschlossen.
12.5.11 Beispiel. Seien (Y1 , d1 ) un (Y2 , d2 ) zwei metrische Räume, und sei d : Y1 ×Y2 →
R definiert als d (x1 , x2 ), (y1 , y2 ) = max(d1 (x1 , y1 ), d2 (x2 , y2 )), vgl. Fakta 8.7.7.
Wir wissen schon, dass d eine Metrik auf Y1 × Y2 ist, und dass Uǫ (x1 , x2 ) =
Uǫ (x1 ) × Uǫ (x2 ).
Die von dieser Metrk erzeugte Topologie T (d) stimmt mit der Produkttopologie
von T (d1 ) und T (d2 ) überein. Um das einzusehen sei O ⊆ Y1 × Y2 . Diese Menge ist in
T (d), genau dann, wenn
∀(x1 , x2 ) ∈ O ⇒ ∃ǫ > 0 : Uǫ (x1 , x2 ) = Uǫ (x1 ) × Uǫ (x2 ) ⊆ O,
ist. Da die Mengen der Form O1 × O2 eine Basis von T (d1 ) × T (d2 ) darstellen, bedeutet
das genau O ∈ T (d1 ) × T (d2 ).
Folgendes Korollar samt Beweis funktioniert übrigens auch für Funktionen mit
Werten in einem normierten Raum.
12.5.12 Korollar. Sei (X, T ) ein topologischer Raum, und f, g : X → R (C), sowie
λ, µ ∈ R (C). Sind f und g stetig, so auch λ f +µg und f g. Ist zusätzlich f (x) , 0, x ∈ X,
so ist auch 1f stetig.
(FI1 ) T ist die feinste Topologie auf X, sodass alle Abbildungen fi : (Yi , Ti ) → (X, T ), i ∈ I, stetig sind.
Diese Topologie heißt finale Topologie bezüglich der fi . Sie ist gegeben durch
und erfüllt:
156 KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
(FI3 ) Ist (Y, O) ein topologischer Raum und f : X → Y, so ist f : (X, T ) → (Y, O) stetig genau dann, wenn alle
Abbildungen
f ◦ fi : (Yi , Ti ) → (Y, O), i ∈ I ,
stetig sind.
Beweis.
Wir betrachten die durch (FI2 ) definierte Menge T ⊆ P(X). Es gilt
und [ [
fi−1 Oj = fi−1 (O j ) .
j∈J j∈J
Definitionsgemäß gilt fi−1 (T ) ⊆ Ti , womit alle fi : (Yi , Ti ) → (X, T ) stetig sind. Ist T ′ eine Topologie auf X,
sodass alle fi stetig sind, so folgt fi−1 (O) ∈ Ti für alle O ∈ T ′ , also O ∈ T . Also gilt T ′ ⊆ T , und T erfüllt (FI1 ).
Klarerweise gibt es höchstens eine Topologie mit der Eigenschaft (FI1 ).
Sei T die finale Topologie bezüglich der fi , und sei f : X → Y. Ist f stetig, so ist auch f ◦ fi : (Yi , Ti ) → (X, T ) →
(Y, O) als Zusammensetzung stetiger Abbildungen stetig. Sei umgekehrt f ◦ fi stetig für alle i. Dann gilt
❑
′
12.5.14 Bemerkung. Die Finale Topologie ist einzige Topologie auf X, die (FI3 ) erfüllt. Um das einzusehen, sei T eine
weiters Topologie auf X mit der Eigenschaft (FI3 ).
Da die Abbildung idX : (X, T ′ ) → (X, T ′ ) trivialerweise stetig ist, folgt aus (FI3 ) angewandt auf T ′ , dass alle idX ◦ fi :
(Yi , Ti ) → (X, T ′ ) stetig sind. Aus (FI1 ) folgt T ′ ⊆ T .
Für idX : (X, T ′ ) → (X, T ) sind andererseits alle Abbildungen idX ◦ fi = fi : (Yi , Ti ) → (X, T ) stetig. Mit (FI3 )
angewandt auf T ′ folgt die Stetigkeit von id X : (X, T ′ ) → (X, T ), und daher T ⊆ T ′ . Insgesamt ist T ′ = T .
12.5.15 Bemerkung. Das Finale Topologie Bilden ist assoziativ; dh. es gilt ein Korollar 12.5.4 entsprechendes Resultat.
12.5.16 Beispiel. Sei (Y, T ) ein topologischer Raum und ∼ eine Äquivalenzrelation auf Y. Weiters sei π : Y → Y/∼ die
kanonische Projektion, π(x) = [x]∼ . Die finale Topologie auf Y/∼ bezüglich π heißt Quotiententopologie und wird bezeichnet
als T /∼ .
Ist A ⊆ Y, so heißt A gesättigt bezüglich ∼, wenn x ∈ A die Inklusion [x]∼ ⊆ A nach sich zieht. Offenbar sind alle
Mengen der Bauart π−1 (B) mit B ⊆ Y/∼ gesättigt, und A ist genau dann gesättigt, wenn π−1 (π(A)) = A. Somit stellt A 7→ π(A)
eine bijektive Abbildung von allen gesättigten Teilmengen von Y auf alle Teilmengen von Y/∼ dar, wobei B 7→ π−1 (B) ihre
Umkehrung ist.
Eine Menge P ⊆ Y/∼ ist per definitionem genau dann offen in (Y/∼ , T /∼ ), wenn π−1 (P) offen in (Y, T ) ist. Insbe-
sondere ist O 7→ π(O) eine Bijektion von allen gesättigten offenen Teilmengen von Y auf T /∼ . Entsprechendes gilt für
abgeschlossene Mengen.
12.5.17 Proposition. Sei f : (X, T ) → (Y, V) eine stetige Abbildung. Bezeichne mit ∼ die Äquivalenzrelation x ∼ y : ⇐⇒
f (x) = f (y), und seien π : X → X/∼ , ι : f (X) → Y, die kanonische Projektion bzw. Einbettung. Weiters sei g : X/∼ → f (X)
die Bijektion mit ι ◦ g ◦ π = f .
Dann ist g : (X/∼ , T /∼ ) → ( f (X), V| f (X) ) stetig. Außerdem sind folgende Aussagen äquivalent
(i) g ist ein Homöomorphismus von (X/∼ , T /∼ ) auf ( f (X), V| f (X) ).
(ii) Für jede bezüglich ∼ gesättigte offene Menge O ⊆ X ist f (O) offen in ( f (X), V| f (X) ).
(iii) Für jede bezüglich ∼ gesättigte abgeschlossene Menge A ⊆ X ist f (A) abgeschlossen in ( f (X), V| f (X) ).
Beweis. Nach Satz 12.5.1,(IN3 ), bzw. Beispiel 12.5.5 ist auch f : (X, T ) → ( f (X), V| f (X) ) stetig. Somit können wir oBdA.
Y = f (X) und damit auch ι = idY annehmen.
Jede Abbildung g : X/∼ → Y mit g ◦ π = f muss g([x]∼ ) = f (x) für x ∈ X erfüllen. Betrachten wir das als Definition, so
ist die Wohldefiniertheit davon zu zeigen. Diese folgt aber unmittelbar aus der Definition von von ∼, da [x]∼ = [y]∼ immer
x ∼ y und damit f (x) = f (y) nach sich zieht. Also gibt es ein solches g und dieses ist eindeutig. Außerdem ist g injektiv, da
aus f (x) = g([x]∼ ) = g([y]∼ ) = f (y) per definitionem x ∼ y bzw. [x]∼ = [y]∼ folgt. Wegen g(X/∼ ) = f (X) = Y ist g sogar
bijektiv.
Die Stetigkeit von g folgt unmittelbar aus Satz 12.5.13, (FI3 ), da X/∼ die finale Topologie T /∼ bzgl. π trägt und da
g ◦ π = f stetig ist.
Die Funktion g ist nun genau dann Homöomorphismus, wenn noch g−1 stetig ist, d.h. wenn g(P) ∈ V für alle P ∈ T /∼ .
Nach Beispiel 12.5.16 durchläuft π−1 (P) aber alle offenen und gesättigten Teilmengen von X. Zudem gilt
woraus man sofort die Äquivalenz von (i) und (ii) erkennt. Die Äquivalenz von (i) und (iii) zeigt man genauso.
❑
12.6. TRENNUNGSEIGENSCHAFTEN 157
12.6 Trennungseigenschaften
Wir wollen dieses Kapitel mit der einfachen Bemerkung starten, dass in (T 2) Räumen
einpunktige Mengen {x} abgeschlossen sind. Das folgt aus der Beobachtung, dass es
zu y ∈ {x}c wegen (T 2) eine Umgebung gibt, die x nicht enthält, bzw. ganz in {x}c
enthalten ist. Wegen Lemma 12.1.11 ist {x}c offen.
12.6.1 Definition. Man sagt, dass sich zwei disjunkte Mengen A und B in einem Topo-
logischen Raum trennen lassen, wenn es disjunkte offene Mengen OA , OB gibt, sodass
A ⊆ OA , B ⊆ O B .
Ein topologischer Raum (X, T ) heißt regulär, falls er neben dem Axiom (T 2) noch
das Trennungsaxiom (T 3) erfüllt:
(T 3 ) Abgeschlossene Mengen A und einpunktige Mengen {x} mit x < A lassen sich
trennen, d.h. ∃O x , OA ∈ T : x ∈ O x , A ⊆ OA , O x ∩ OA = ∅.
OA
A
Ox
x
Ein topologischer Raum (X, T ) heißt normal, falls er neben dem Axiom (T 2) noch
das Trennungsaxiom (T 4) erfüllt:
OB
B
OA
A
A ⊆ O ⊆ O ⊆ Bc . (12.16)
158 KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
12.6.3 Korollar. Das Axiom (T 3) ist äquivalent zur Tatsache, dass man zu einer belie-
bigen Umgebung U ∈ U(x) eines Punktes x eine Umgebung V ∈ U(x) mit V ⊆ U finden
kann.
12.6.5 Bemerkung.
Q Ähnlich
Q zeigt man, dass sich die Axiome (T 2) und (T 3) von topologischen Räumen (Xi , Ti ) auf den
Produktraum ( i∈I Xi , i∈I Ti ) vererben.
12.6.6 Beispiel. Metrische Räume sind nomal. Dazu seien A und B zwei disjunkte,
abgeschlossene Mengen.
Zu a ∈ A gibt es ein ǫa > 0 mit U2ǫa (a) ⊆ Bc . Entsprechend wählt man ǫb für b ∈ B.
Nun setze [ [
OA := Uǫa (a), OB := Uǫb (b).
a∈A b∈B
Zusammenhang
Eins zu eins kann man den Begriff einer Zusammenhängenden Menge auf topologische Räume verallgemeinern (vgl. Defi-
nition 6.2.2).
12.6.7 Definition. Eine Teilmenge E eines topologischen Raumes (X, T ) heißt zusammenhängend, wenn man E nicht als
Vereinigung zweier nichtleerer getrennter Mengen schreiben kann. Dabei heißen A und B getrennt, wenn A∩ B = A∩ B = ∅4 .
12.6.8 Lemma. Eine Teilmenge E eines topologischen Raumes (X, T ) ist genau dann zusammenhängend, wenn sich E
nicht als E = A ∪ B schreiben lässt, wobei A, B zwei disjunkte, nichtleere und bzgl. T |E abgeschlossene Teilmengen von E
sind.
Das ist auch dazu äquivalent, dass sich E nicht als E = A ∪ B schreiben lässt, wobei A, B zwei disjunkte, nichtleere
und bzgl. T |E offene Teilmengen von E sind.
4 Man beachte, dass zwei Mengen getrennt sind, wenn sie sich im Sinne von Definition 12.6.1 trennen
Beweis. Ist E = A ∪ B mit ∅ , A, ∅ , B, A ∩ B = ∅, so ist der Abschluss von A bzgl. T |E wegen (12.13) genau
A ∩ E = A ∪ (B ∩ A). Damit ist A bzgl. T |E genau dann abgeschlossen, wenn B ∩ A = ∅. Entsprechendes gilt für B.
Somit sind A und B genau dann getrennt, wenn A und B bzgl. T |E abgeschlossen sind. Durch Übergang zu den
Komplementen sieht man, dass das genau dann gilt, wenn A und B bzgl. T |E offen sind.
❑
Das wichtige Resultat Proposition 6.2.4 lässt sich unmittelbar auf topologische Räume übertragen, wobei man fast
den selben Beweis nehmen kann. Man muss nur Folgen durch Netze ersetzen. Wir wollen diesen Beweis aber etwas anders
führen.
12.6.9 Proposition. Seien (X, T ) und (Y, O) topologische Räume, und sei f : X → Y eine stetige Funktion. Ist E ⊆ X
zusammenhängend, so auch f (E).
Beweis. Angenommen f (E) wäre nicht zusammenhängend. Dann gilt f (E) = A ∪ B mit A, B , ∅ und A ∩ B = A ∩ B = ∅.
Für die nichtleeren Mengen E ∩ f −1 (A), E ∩ f −1 (B) folgt
E = E ∩ f −1 (A) ∪ E ∩ f −1 (B) , E ∩ f −1 (A) ∩ E ∩ f −1 (B) = ∅.
f E ∩ f −1 (A) ∩ E ∩ f −1 (B) ⊆ f E ∩ f −1 (A) ∩ f E ∩ f −1 (B) ⊆ A ∩ B = ∅.
Entsprechend gilt (E ∩ f −1 (B) ∩ E ∩ f −1 (A) = ∅, und E wäre somit nicht zusammenhängend, was unserer Annahme
widerspricht.
❑
Folgender recht trivialer Sachverhalt ist jedoch sehr nützlich.
12.6.10 Lemma. Sei E eine zusammenhängende Teilmenge eines topologischen Raumes (X, T ). Weiters seien A, B ⊆ X
getrennt und so, dass E ⊆ A ∪ B. Dann folgt entweder E ⊆ A oder E ⊆ B.
Beweis. Offensichtlich sind A∩E und B∩E als Teilmengen zweier getrennter Mengen getrennt. Wegen E = (A∩E)∪(B∩E)
und da E zusammenhängend ist, folgt A ∩ E = ∅ oder B ∩ E = ∅ bzw. E ⊆ B oder E ⊆ A. Beides kann nicht der Fall sein,
da getrennte Mengen immer disjunkt sind.
❑
Damit können wir auch das im letzten Kapitel bewiesene Resultat Lemma 11.2.18 über die Vereinigung von zusam-
mengängenden Mengen in allgemeinen topologischen Räumen mit einem etwas kürzeren Beweis versehen.
Beweis. Sei E = A ∪ B mit getrennten A und B. Nach Lemma 12.6.10 folgt für jedes i ∈ I immer entweder Ei ⊆ A oder
Ei ⊆ B. Ist es nicht der Fall, dass immer der erste Fall eintritt oder dass immer der zweite Fall eintritt, so hätten wir Ei ⊆ A
und E j ⊆ B für i, j ∈ I. Laut Voraussetzung sind aber Ei und E j nicht disjunkt, was aber der Getrenntheit von A und B
widerspricht. Somit muss E ganz in A bzw. ganz in B entahlten sein; dh. B = ∅ oder A = ∅.
❑
12.6.12 Korollar. Mit E ist auch jede Teilmenge C eines topologischen Raumes mit E ⊆ C ⊆ E abgeschlossen.
Beweis. Sei C = A ∪ B mit getrennten A und B. Nach Lemma 12.6.10 folgt E ⊆ A oder E ⊆ B. Im ersten Fall folgt aus
C ∩ B ⊆ E ∩ B ⊆ A ∩ B = ∅, dass E ⊆ A und daher B = ∅. Im zweite Fall schließt man entsprechend auf A = ∅.
❑
12.6.13 Korollar. Sei (X, T ) ein topologischer Raum. Ist ∼⊆ X × X die Relation auf X definiert durch
x ∼ y ⇔ ∃E ⊆ X : x, y ∈ E, E ist zusammenhängend,
so ist ∼ eine Äquivalenzrelation. Für ein x ∈ X ist die Äquivalenzklasse [x]∼ die größte zusammenhängende Menge, die x
enthält. Schließlich ist [x]∼ abgeschlossen.
Beweis. Da die einpunktige Menge {x} zusammenhängend ist, ist ∼ reflexiv. Die Symmetrie ist klar. Ist x ∼ y, y ∼ z, und sind
E und F zusammenhängende Mengen, sodass x, y ∈ E und y, z ∈ F, so ist nach Korollar 12.6.11 E ∪ F zusammenhängend,
wobei x, z ∈ E ∪ F. Also ist ∼ ein Äquivalenzrelation. Schließlich ist für x ∈ X die Menge
[
[x]∼ = E,
x∈E
E ist zusammenhängend
wegen Korollar 12.6.11 zusammenhängend. Klarerweise ist diese Menge dann auch die größte Zusammenhängende Menge,
die x enthält. Wegen Korollar 12.6.12 ist sie auch abgeschlossen.
❑
160 KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
12.7 Kompaktheit
Bei metrischen Räumen haben wir den Begriff der Kompaktheit mit Hilfe von Folgen
eingeführt. Für allgemeine topologische Räume wollen wir anders starten. Wir werden
weiter unten sehen, dass dieser Zugang zur Kompaktheit bei metrischen Räumen mit
dem schon bekannten äquivalent ist.
12.7.1 Definition. Eine Teilmenge K eines topologischer Raum (X, T ) heißt kompakt,
wenn jede offene Überdeckung eine endliche Teilüberdeckung besitzt. D.h., ist {Ui :
i ∈ I} ⊆ T eine Familie offener Mengen mit
[
Ui ⊇ K,
i∈I
Ui1 ∪ . . . ∪ Uin ⊇ K .
Eine Teilmenge A ⊆ X heißt relativ kompakt, wenn A ⊆ X kompakt ist. Der Raum
(X, T ) heißt lokalkompakt, wenn jeder Punkt x eine kompakte Umgebungen besitzt.
Sei (Ai )i∈I eine Familie von Mengen. Wir sagen, dass (Ai )i∈I die endliche Durch-
schnittseigenschaft hat, wenn für je endlich viele i1 , . . . , in ∈ I stets Ai1 ∩ . . . ∩ Ain , ∅
gilt.
12.7.2 Proposition. Sei (X, T ) ein topologischer Raum und K ⊆ X. Dann sind äqui-
valent:
(K3 ) Jede Familie bzgl. T |K abgeschlossener Teilmengen von K mit der endlichen
Durchschnittseigenschaft hat nichtleeren Durchschnitt.
(K4 ) Jedes Netz (xi )i∈I in K hat ein gegen ein x ∈ K konvergentes Teilnetz.
Beweis.
(K2 ) ⇒ (K1 ): Ist K als Teilmenge von (K, T |K ) kompakt, und ist U ⊆ T eine Überde-
ckung aus offenen Mengen in (X, T ), so ist
V := {U ∩ K : U ∈ U}
eine offene Überdeckung von (K, T |K ). Daher existiert eine endliche Teilüberde-
ckung {U1 ∩ K, . . . , Un ∩ K}, und daher U1 ∪ . . . ∪ Un ⊇ A.
12.7. KOMPAKTHEIT 161
(K2 ) ⇒ (K3 ): Sei F eine Familie in (K, T |K ) abgeschlossener Teilmengen von K mit
T
der endlichen Durchschnittseigenschaft. Angenommen F∈F F = ∅. Dann folgt
[
K \ F = K,
F∈F
wobei die K \ F in (K, T |K ) offen sind. Also gibt es eine endliche Teilüberde-
ckung, K \ F1 ∪ . . . ∪ K \ Fn = K, und wir erhalten F1 ∩ . . . ∩ Fn = ∅, was aber
der endlichen Durchschnittseigenschaft widerspricht.
(K3 ) ⇒ (K2 ): Sei V ⊇ T |K eine offene Überdeckung von K. Würde V keine endli-
che Teilüberdeckung besitzen, so wäre (K \ V1 ) ∩ . . . ∩ (K \ Vn ) , ∅ für jede
endliche Auswahl V1 , . . . , Vn ∈ V. Also hätte F = {K \ V : V ∈ V} die end-
liche Durchschnittseigenschaft, und nach Voraussetzung wäre der Schnitt aller
Mengen K \ V, V ∈ V nichtleer. Damit wäre V aber keine Überdeckung.
(K3 ) ⇒ (K4 ): Sei (xi )i∈I ein Netz in K. Für i ∈ I ist Ai = {xk : k i} ∩ K abgeschlossen
in (K, T |K ). Das System Ai , i ∈ I, hat die endliche Durchschnittseigenschaft,
denn sind i1 , . . . , in ∈ I und ist i ∈ I, i i1 , . . . , in , so gilt
( j, U) (k, V) :⇔ j k ∧ U ⊆ V.
(K4 ) ⇒ (K3 ): Hat (Ai )i∈I die endliche Durchschnitteseigenschaft, so sei T die Menge
aller endlichen Teilmengen von I gerichtet durch die Relation M1 M2 :⇔
M1 ⊆ M2 .
Für M ∈ T sei x M irgend ein Punkt aus ∩i∈M Ai . Man beachte, dass nach Voraus-
setzung dieser Schnitt nicht leer ist. Das Netz (x M ) M∈T hat wegen (K4) ein gegen
ein x ∈ X konvergentes Teilnetz (x M( j) ) j∈J .
Ist k ∈ I, so gibt es ein j0 ∈ J mit M( j) ⊇ {k} für alle j j0 , und somit x M( j) ∈
∩i∈M( j) Ai ⊆ Ak . Also liegt das ebenfalls gegen x konvergente Netz (x M( j) ) j∈J j0 in
der abgeschlossenen Menge Ak . Mit Proposition 12.2.7 folgt daraus x ∈ Ak , und,
da k ∈ I beliebig war, auch dass der Schnitt aller Ak ’s x enthält und damit nicht
leer ist.
❑
162 KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
12.7.3 Bemerkung. Wegen Lemma 12.2.13 ist die Bedingung (K4) zu der Tatsache äquivalent, dass jedes Netz einen
Häufungspunkt in K hat.
Wenden wir nun Lemma 12.2.14 an, und beachten, dass Häufungspunkte von Teilnetzen von (xi )i∈I auch Häufungs-
punkte von (xi )i∈I sind (vgl. Lemma 12.2.13), so erhalten wir aus Bemerkung 12.7.3
12.7.4 Satz. Ein Netz (xi )i∈I in einer kompakten Menge K ⊆ X konvergiert genau dann gegen ein x ∈ X, wenn x der einzige
Häufungspunkt von (xi )i∈I ist.
12.7.5 Definition. Eine Teilmenge A eines topologischer Raum (X, T ) heißt abzählbar kompakt, wenn jede unendliche
Teilmenge von A einen Häufungspunkt in A hat.
Eine Teilmenge A eines topologischer Raum (X, T ) heißt folgenkompakt, wenn jede Folge in A eine gegen ein x ∈ A
konvergente Teilfolge hat.
12.7.6 Bemerkung. Ist M ⊆ A unendlich, so gibt es sicher eine injektive Funktion x : N → M. Das ist aber nichts anderes
als eine Folge, daher x(n) = xn .
Ist A folgendkompakt, so folgt x = limk→∞ xn(k) für eine Teilfolge (xn(k) )k∈N und ein x ∈ A. Für jede Umgebung U von
x gibt es somit einen Index k0 ∈ N, sodass xn(k) ∈ U für alle k ≥ k0 . Da die Folgenglieder alle verschieden sind, enthält U
sicherlich einen Punkt y := xn(k) ∈ M, der ungleich x ist. Also hat M einen Häufungspunkt in A (vgl. Definition 12.2.8).
Somit folgt aus folgendkompakt abzählbar kompakt. Die Umkehrung gilt im Allgemeinen nicht.
Ist A kompakt, so folgt wegen Proposition 12.7.2 x = limi∈I xn(i) für ein Teilnetz (xn(i) )i∈I und ein x ∈ A. Für jede
Umgebung U von x gibt es somit einen Index i0 ∈ I, sodass xn(i) ∈ U für alle i i0 .
Da die Folgenglieder alle verschieden sind, gibt es höchstens ein n0 ∈ N, sodass xn0 = x. Die Teilnetzeigenschaft
bedingt die Existenz eines i1 ∈ I, sodass i i1 ⇒ n(i) ≥ n0 + 1 ∧ xn(i) ∈ U. Für solche i liegt der Punkt y := xn(i) ∈ M in U
und ist ungleich x. Also hat M einen Häufungspunkt in A (vgl. Definition 12.2.8). Somit folgt auch aus kompakt abzählbar
kompakt. Die Umkehrung gilt im Allgemeinen auch hier nicht.
Überraschenderweise gilt im Allgemeinen weder, dass kompakt folgendkompakt impliziert, noch, dass folgendkom-
pakt kompakt impliziert. In metrischen Räumen sind alle drei Begriffe äquivalent, siehe Satz 12.8.3.
U1 ∪ · · · ∪ Un = U1 ∪ . . . ∪ Un ∪ (O ∩ B) ⊇
| {z }
=∅
U1i ∪ . . . ∪ Uni i ⊇ Ai ,
und es folgt [
Uki ⊇ A1 ∪ . . . ∪ Am .
k,i
12.7. KOMPAKTHEIT 163
(iii) Sei A kompakt, und sei x < A. Da (X, T ) Hausdorff ist, gibt es zu jedem Punkt
y ∈ A offene Umgebungen Uy ∈ U(y), Vy ∈ U(x), mit Uy ∩ Vy = ∅. Klarerweise
ist {Uy : y ∈ A} eine offene Überdeckung von A. Daher gibt es y1 , . . . , yn ∈ A,
sodass bereits Uy1 ∪ . . . ∪ Uyn ⊇ A gilt. Die Menge Vy1 ∩ . . . ∩ Vyn ist als endlicher
Durchschnitt von Umgebungen von x ebenfalls eine Umgebung von x, und es gilt
Uy1 ∪ . . . ∪ Uyn ∩ Vy1 ∩ . . . ∩ Vyn = ∅.
Also ist x ein innerer Punkt von Ac . Nach Lemma 12.1.11 ist Ac offen und daher
A abgeschlossen.
(iv) Ist A relativ kompakt, so ist A kompakt und klarerweise gilt A ⊆ A. Sei umgekehrt
A ⊆ B mit B kompakt. Dann ist wegen (iii) die Menge B auch abgeschlossen, also
folgt A ⊆ B und (i) zeigt, dass A kompakt ist.
❑
12.7.8 Lemma. Sei f : (X, T ) → (Y, O) stetig. Ist A ⊆ X kompakt, so ist auch f (A) ⊆ Y
kompakt.
Beweis. Ist U ⊆ O eine Überdeckung von f (A), so ist f −1 (U) eine Überdeckung von A,
die wegen der Stetigkeit von f aus offenen Mengen besteht. Es gibt also U1 , . . . , Un ∈
U, sodass
f −1 (U1 ) ∪ . . . ∪ f −1 (Un ) ⊇ A .
Wendet man darauf f an, so folgt U1 ∪ . . . ∪ Un ⊇ f (A).
❑
Nimmt man die Charakterisierung (K4) aus Proposition 12.7.2 her, so kann man Lemma 12.7.8 auch ganz ähnlich
wie in Proposition 6.1.11 beweisen. Ist nämlich (yi )i∈I ein Netz in f (A), und wählt man zu jedem i ∈ I ein xi ∈ A, sodass
f (xi ) = yi , so hat nach (K4) das Netz (xi )i∈I ein gegen ein x ∈ A konvergentes Teilnetz (xi( j) ) j∈J . Aus Lemma 12.3.3
schließen wir, dass (yi( j) ) j∈J = f (xi( j) ) j∈J gegen f (x) =: y konvergiert. Also hat jedes Netz aus f (A) ein gegen ein y ∈ f (A)
konvergentes Teilnetz. Nach (K4) aus Proposition 12.7.2 ist f (A) somit kompakt.
(i) Ist X Hausdorffsch, und ist A ⊆ X kompakt und x ∈ X \ A, so lassen sich x und A
trennen, d.h. es gibt disjunkte offene Mengen O x ∋ x und OA ⊇ A.
(ii) Erfüllt X das Axiom (T 3), und sind A ⊆ X kompakt, B ⊆ X abgeschlossen und
A ∩ B = ∅, so lassen sich A und B trennen.
(iii) Ist (X, T ) kompakt und Hausdorffsch, so ist (X, T ) sogar normal.
Beweis.
(iii) Da jede abgeschlossene Teilmenge von X nach Lemma 12.7.7 kompakt ist, folgt
aus (i), dass X regulär ist, dh. es gilt (T 2) und (T 3). Nach (ii) ist X dann sogar
normal.
Dieser Satz ist einer der ganz wichtigen Sätze in der Topologie. Wir wollen bemerken, dass die interessante Implikation
jene ist, die von der Kompaktheit der einzelnen Räume auf die des Produktes schließt. Die Umkehrung ist ganz elementar.
Es gibt verschiedene Zugänge, um diesen Satz zu beweisen, wir wählen hier jenen über den Filterbegriff, vgl. Definition
12.1.6.
Sei X eine Menge. Betrachte die Menge aller Filter auf X. Dies ist eine gewisse Teilmenge von P(P(X)), und da die
Potenzmenge jeder Menge mit der mengentheoretischen Inklusion geordnet ist, ist auch die Menge aller Filter auf X in
dieser Weise eine geordnete Menge. Ist F1 ⊆ F2 , so sagt man, dass F2 feiner als F1 ist oder, dass F1 gröber als F2 ist.
12.7.12 Definition. Sei X eine Menge. Ein Filter F auf X heißt Ultrafilter, wenn er ein maximales Element in der Menge
aller Filter auf X, geordnet mit der mengentheoretischen Inklusion, ist.
12.7.13 Proposition. Sei X eine Menge, und F ein Filter auf X. Dann existiert ein Ultrafilter F1 mit F1 ⊇ F.
12.7. KOMPAKTHEIT 165
Beweis. Wir wollen das Lemma von Zorn anwenden, und zwar auf die Menge aller Filter auf X, die feiner als F sind. Diese
Menge ist nichtleer und als Teilmenge der Menge aller Filter bezüglich der mengentheoretischenS Inklusion geordnet.
Sei (Fi )i∈I , I , ∅ eine totalgeordnete Menge von Filtern Fi mit Fi ⊇ F. Definiere F̃ := i∈I Fi . Dann gilt F̃ ⊇ F, denn
I , ∅ und alle Fi enthalten F. Insbesondere ist F̃ nichtleer. Seien F1 , F2 ∈ F̃. Dann existiert i1 , i2 ∈ I mit F1 ∈ Fi1 und
F2 ∈ Fi2 . Nun gilt entweder Fi1 ⊆ Fi2 oder Fi2 ⊆ Fi1 . Im ersten Fall sind F1 , F2 beide Elemente des Filters Fi2 , und daher
ist auch F1 ∩ F2 ∈ Fi2 ⊆ F̃. Im zweiten Fall erhält man genauso F1 ∩ F2 ∈ Fi1 ⊆ F̃. Schließlich sei F1 ∈ F̃, und F2 ⊇ F1
gegeben. Sei i ∈ I, sodass F1 ∈ Fi , dann ist auch F2 ∈ Fi ⊆ F̃. Also ist F̃ ein Filter.
Nach dem Lemma von Zorn existiert in der Menge aller Filter auf X, die feiner als F sind, ein maximales Element. Es
verbleibt zu bemerken, dass ein maximales Element in der Menge aller Filter auf X, die feiner als F sind, auch maximal in
der Menge aller Filter ist.
❑
12.7.14 Lemma. Seien X und Y nichtleere Mengen und f : X → Y eine Abbildung.
Ist F ein Filter auf X, so ist
f (F) := {B ⊆ Y : f −1 (B) ∈ F}
ein Filter auf Y. f (F) hat { f (F) : F ∈ F} als Filterbasis. Ist B eine beliebige Filterbasis von F, so ist { f (F) : F ∈ B} ein
Filterbasis von f (F).
Ist F ein Ultrafilter, so auch f (F).
Beweis. Es gilt Y, ∅ ∈ f (F), da f −1 (Y) = X, f −1 (∅) = ∅ ∈ F. Sind B1 , B2 ∈ f (F), daher f −1 (B1 ), f −1 (B2 ) ∈ F, so
folgt f −1 (B1 ∩ B2 ) = f −1 (B1 ) ∩ f −1 (B2 ) ∈ F und somit B1 ∩ B2 ∈ f (F). Ist schließlich B2 ⊇ B1 ∈ f (F), so folgt
f −1 (B2 ) ⊇ f −1 (B1 ) ∈ F und somit f −1 (B2 ) ∈ F, bzw. B2 ∈ f (F). Also ist f (F) ein Filter.
Ist F ∈ F, so folgt wegen f −1 ( f (F)) ⊇ F, dass f (F) ∈ f (F). Ist B ∈ f (F), also f −1 (B) ∈ F, so folgt f ( f −1 (B)) ⊆ B.
Gemäß Definition 12.1.7 ist { f (F) : F ∈ F} eine Filterbasis von f (F).
Ist B eine Filterbasis von F, und F ∈ f (F), so folgt wie eben f −1 (F) ∈ F und somit B ⊆ f −1 (F) für ein B ∈ B. Wir
erhalten f (B) ⊆ f ( f −1 (F)) ⊆ F. Wieder nach Definition 12.1.7 ist { f (B) : B ∈ B} eine Filterbasis von f (F).
Ist F ein Ultrafilter und ist f (F) ⊆ G für einen Filter G, so folgt f (F) ∩ G , ∅ und damit auch F ∩ f −1 (G) , ∅ für alle
F ∈ F, G ∈ G. Also ist die Menge {F ∩ f −1 (G) : F ∈ F, G ∈ G} die Filterbasis eines Filters, der offenbar F und f −1 (G)
umfasst. Wegen der Maximalität muss dieser mit F übereinstimmen, und daher f −1 (G) ⊆ F bzw. G ⊆ f (F).
❑
Sei nun X versehen mit einer Topologie.
12.7.15 Definition. Sei (X, T ) ein topologischer Raum und x ∈ X. Ein Filter F auf X heißt konvergent gegen x, wenn F
feiner ist als der Umgebungsfilter U(x) von x. Wir schreiben F → x dafür.
∀U ∈ U(x)∃F ∈ F : F ⊆ U. (12.17)
12.7.16 Bemerkung. Sind X und Y zusätzlich mit Topologien versehen, so bedeutet die Tatsache, dass f bei x stetig ist (vgl.
Definition 12.3.1) gerade, dass jede Menge aus dem Filter U( f (x)) eine Menge aus f (U(x)) enthält, bzw. dass U( f (x)) ⊆
f (U(x)), oder dass f (U(x)) → f (x).
Ist nun F → x, so folgt F ⊇ U(x) und weiter f (F) ⊇ f (U(x)) ⊇ U( f (x)), also f (F) → f (x).
Gelte umgekehrt diese Eigenschaft. Wegen U(x) → x folgt f (U(x)) → x und damit die Stetigkeit von f bei x.
12.7.17 Bemerkung. Die Charakterisierung der Stetigkeit in Bemerkung 12.7.16 ähnlt nicht zufällig der Charakterisierung
der Stetigkeit mit Netzen. In der Tat gibt es einen engen Zusammenhang von Netzen und Filtern:
Sei (I, ) eine gerichtete Menge, so ist
{{i : i k} : k ∈ I}
{{xi : i k} : k ∈ I}
einen Filter F =: F (xi )i∈I auf X. Die Konvergenz von (xi )i∈I gegen ein x ∈ X bedeutet gerade
∀U ∈ U(x) : ∃k ∈ I : {xi : i k} ⊆ U,
I = {(y, F) ∈ X × F : y ∈ F}
mit der Relation (y1 , F1 ) (y2 , F2 ) :⇔ F1 ⊇ F2 eine gerichtete Menge. Die Richtungseigenschaft folgt dabei aus der
Filtereigenschaft (F2). Weiters sei (xi )i∈I definiert durch xi = y, wenn i = (y, F).
Die Tatsache, dass F → x, daher (12.17), bedeutet aber nun gerade, dass (xi )i∈I → x.
Schließlich ist der von diesem Netz erzeugte Filter gerade F, daher F (xi )i∈I = F.
In unserem Zusammenhang ist es entscheidend, dass sich Kompaktheit mit Hilfe des Begriffes der Filterkonvergenz
charakterisieren lässt.
166 KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
Beweis. Gelte (i), und sei F ein Filter auf X. Wegen der Filtereigenschaft hat das Mengensystem {F : F ∈ F} die endliche
T
Durchschnittseigenschaft. Gemäß Proposition 12.7.2 folgt F∈F F , ∅ und für ein x aus dieser Menge, dass U ∩ F , ∅ für
alle U ∈ U(x) und F ∈ F. Somit ist {U ∩ F : U ∈ U(x), F ∈ F} eine Filterbasis eines Filters G, der sicher G ⊇ F und
G ⊇ U(x) erfüllt; also G → x.
Gilt (ii), und ist F ein Ultrafilter auf X, so stimmt jede konvergente Verfeinerung von F mit F überein; also gilt (iii).
Gelte nun (iii), und sei M ein Mengensystem bestehend aus abgeschlossenen Mengen mit der endlichen Durch-
schnittseigenschaft. Insbesondere ist damit {M1 ∩ · · · ∩ Mn : n ∈ N; M1 , . . . , Mn ∈ M} die Filterbasis eines Filters G auf
X. Ist nun F ⊇ G ⊇ M gemäß Proposition 12.7.13 ein Ultrafilter, und ist x eine Grenzwert davon, dh. F ⊇ U(x), so folgt
T T
insbesondere U ∩ M , ∅ für alle U ∈ U(x) (⊆ F) und alle M ∈ M (⊆ F), bzw. x ∈ M∈M M = M∈M M.
❑
Wir haben jetzt alle Hilfsmittel für den Beweis des Satzes von Tychonoff zusammengetragen.
Beweis. (Satz 12.7.11) Wir setzten Y Y
X := Xi und T := Ti ,
i∈I i∈I
und bezeichnen mit πi : X → Xi die Projektion auf die i-te Komponente. Da T die Produkttopologie ist, ist πi : (X, T ) →
(Xi , Ti ) stets stetig.
Setzt man voraus, dass (X, T ) kompakt ist, so ist jeder Raum (Xi , Ti ) als stetiges Bild eines kompakten Raumes eben-
falls kompakt, vgl. Lemma 12.7.8.
Für die Umkehrung sei nun vorausgesetzt, dass (Xi , Ti ) für jedes i ∈ I kompakt ist. Sei F ein Ultrafilter auf X. Für
jedes i ∈ I folgt aus Lemma 12.7.14, dass πi (F) ein Ultrafilter auf Xi ist. Nach Proposition 12.7.18 konvergiert πi (F) gegen
einen Punkt xi ∈ Xi . Setze x := (xi )i∈I (∈ X), Q
so wollen wir zeigen, dass F gegen x konvergiert.
Betrachte eine Menge der Gestalt U = i∈I Ui wobei Ui ∈ U(xi ), i ∈ I, und Ui = Xi für alle bis auf endlich viele i ∈ I.
Da πi (F) gegen xi konvergiert, gilt Ui ∈ πi (F) für alle i ∈ I, und daher π−1 i (Ui ) ∈ F. Sind i1 , . . . , in ∈ I jene Indizes mit
T
Ui , Xi , dann folgt U = nk=1 π−1i (Uik ) ∈ F.
Da die Mengen U von dieser Gestalt eine Umgebungsbasis von x bezüglich der Produkttopologie bilden, folgt
U(x) ⊆ F.
❑
12.8.3 Satz. Sei K eine Teilmenge eines metrischen Raumes (X, d). Dann sind äquiva-
lent:
(iii) Jede Folge in K hat eine gegen einen Punkt in K konvergente Teilfolge.
(iv) K ist total beschränkt und (K, d|K×K ) ist ein vollständiger metrischer Raum.
Beweis.
(ii) ⇒ (iii): Habe jede unendliche Teilmenge von K einen Häufungspunkt in K, und
sei (xn )n∈N eine Folge aus K. Ist {xn : n ∈ N} endlich, so gilt sicherlich xn = x
für ein x ∈ K und für unendlich viele n ∈ N. Somit hat (xn )n∈N eine Teilfolge, die
konstant gleich x ist. Also ist x ein Häufungspunkt unserer Folge.
Anderenfalls ist {xn : n ∈ N} ⊆ K unendlich, und laut Voraussetzung hat sie
einen Häufungspunkt x in K. Da jede ǫ-Kugel um x unendlich viele Punkte aus
{xn : n ∈ N} enthält (vgl. Bemerkung 5.1.8), muss für N ∈ N jede ǫ-Kugel auch
unendlich viele Punkte aus {xn : n ∈ N, n ≥ N} enthalten. Insbesondere gilt
x ∈ {xn : n ∈ N, n ≥ N}. Nach Lemma 5.2.2 ist x Häufungspunkt von (xn )n∈N .
(iii) ⇒ (iv): Angenommen M wäre nicht total beschränkt. Dann gibt es ein ǫ > 0, so-
dass, wenn immer M1 , . . . , Mn endlich viele Teilmengen von K sind mit Durch-
messer < ǫ, niemals M1 ∪ · · · ∪ Mn = K ist. Aus dieser Tatsache werden wir nun
auf die Existenz einer Folge ohne Häufungspunkt schließen.
Sei x1 ∈ K beliebig. Angenommen wir haben x1 , . . . , xk ∈ K definiert, dann
hat für j ∈ {1, . . . , k} nach der Dreiecksungleichung die Kugel U 3ǫ (x j ) einen
168 KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
Diese induktiv definierte Folge (xk )k∈N hat offensichtlich die Eigenschaft, dass
für k ∈ N der Punkt xk nicht in U 3ǫ (x1 )∪· · ·∪U 3ǫ (xk−1 ) liegt, und somit d(xk , xl ) ≥
ǫ
3 für l < k.
Damit kann keine Teilfolge von (xk )k∈N eine Cauchyfolge sein und schon gar
nicht konvergieren. Das widerspricht aber der Voraussetzung (iii).
Es bleibt die Vollständigkeit von (K, d|K×K ) zu zeigen. Dazu sei (xk )k∈N eine
Cauchyfolge in K. Diese hat voraussetzungsgemäß eine konvergente Teilfolge.
Gemäß Lemma 3.4.9 ist (xk )k∈N konvergent.
(iv) ⇒ (i): Zunächst folgt wegen Lemma 9.1.10 aus der Vollständigkeit, dass K abge-
schlossen ist. Sei nun U eine offene Überdeckung von K, und sei angenommen,
dass U keine endliche Teilüberdeckung enthält.
Die Menge K ist gleich der Vereinigung von endlich vielen abgeschlossenen
Mengen mit Durchmesser kleiner als 1. Mindestens eine von diesen Mengen
kann nicht durch endlich viele Mengen aus U überdeckt werden. Diese sei K1 .
Die Menge K1 ist gleich der Vereinigung von endlich vielen abgeschlossenen
Mengen mit Durchmesser kleiner als 12 enthalten ist. Mindestens eine von diesen
kann nicht durch endlich viele Mengen aus U überdeckt werden. Diese sei K2 .
Verfährt man induktiv weiter, so erhält man eine Folge
K ⊇ K1 ⊇ K2 ⊇ K3 ⊇ . . .
1
von abgeschlossenen Mengen, sodass Kn einen Durchmesser kleiner als n hat,
und kein Kn durch endlich viele Mengen aus U überdeckt werden kann.
Wähle xn ∈ Kn . Dann ist (xn )n∈N eine Cauchy-Folge. Sei x ∈ K, sodass xn → x.
Also existiert V ∈ U mit x ∈ V. Da V offen ist, gibt es eine Kugel Uǫ (x) ⊆ V.
Sei n ∈ N, sodass 1n < 2ǫ und d(xn , x) < 2ǫ . Da der Durchmesser von Kn kleiner
als n1 ist, folgt für y ∈ Kn :
Also ist Kn ⊆ V, im Widerspruch zur Tatsache, dass Kn nicht durch endlich viele
Mengen aus U überdeckt werden kann.
❑
12.8.4 Bemerkung. Eine Situation, wo obiger Satz Anwendung findet, ist die, dass
(X, d) ein vollständig metrischer Raum ist, und dass G eine total beschränkte Teilmenge
von X ist. Der Abschluss K von G ist dann auch total beschränkt und vollständig, also
kompakt.
12.8.5 Bemerkung. Satz 12.8.3 besagt insbesondere, dass in metrischen Räumen die Begriffe kompakt, abzählbar kompakt
und folgenkompakt zusammenfallen, vgl. Definition 12.7.5.
12.8. KOMPAKTHEIT IN METRISCHEN RÄUMEN 169
12.8.6 Korollar. Sei (X, d) ein metrischer Raum. Ist K ⊆ X kompakt, dann ist K separabel, hat also eine dichte abzählbare
Teilmenge.
Beweis. Nach Satz 12.8.3 gibt es zu n ∈ N endlich viele Punkte xn1 , . . . , xnm(n) ∈ K, sodass
Beweis. Ist B eine abzählbare Basis von T (d), so sei xB irgendein Punkt aus B für jede nichtleere Teilmenge B ∈ B.
Klarerweise ist D := {xB : ∅ , B ∈ B} abzählbar. Ist y ∈ X und O ∋ y offen, so gilt sicher y ∈ B ⊆ O für ein B ∈ B. Somit
gilt O ∩ D ∋ xB und daher y ∈ D. Also ist X separabel.
Ist umgekehrt (X, d) separabel mit einer abzählbaren und dichten Teilmenge D ⊆ X, so besteht B := {U 1 (x) : n ∈
n
N, x ∈ D} sicherlich aus abzählbar vielen Mengen. Ist nun O ⊆ X offen, so sei für jedes y ∈ O die Zahl n(y) ∈ N so groß,
dass U 2 (y) ⊆ O. Wir zeigen nun, dass
n(y) [
O= U 1 (x), (12.19)
n
x∈D∪O
n∈N:U 1 (x)⊆O
n
und somit dass B eine Basis von T (d) ist. Klarerweise ist die rechte Seite in O enthalten. Ist y ∈ O, so gibt es wegen der
Dichtheit ein x ∈ D ∩ U 1 (y) ⊆ D ∩ O. Somit folgt y ∈ U 1 (x) und für jedes t ∈ U 1 (x)
n(y) n(y) n(y)
1 1 2
d(t, y) ≤ d(t, x) + d(x, y) < + = ,
n(y) n(y) n(y)
also t ∈ U 2 (y) und somit U 1 (x) ⊆ U 2 (y) ⊆ O. Also liegt jedes y ∈ O in der Vereinigung auf der rechten Seite von
n(y) n(y) n(y)
(12.19).
❑
12.8.8 Bemerkung. Da wir im ersten Beweisteil nicht verwendet haben, dass T (d) eine metrische Topologie ist, gilt allge-
mein in topologischen Räumen, dass aus (ABII) die Separabilität folgt.
übereinstimmt. Da das Netz beliebig war, ist f stetig, dh. f ∈ C(X, R) (C(X, C)).
❑
170 KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
12.8.10 Satz (Ascoli). Sei (X, T ) ein kompakter topologischer Raum und sei Sei Φ
eine punktweise beschränkte und gleichgradig stetige Teilmenge von C(X, C), d.h. sei
Φ ⊆ C(X, C), und es gelte:
(i) Für jedes x ∈ X ist sup{| f (x)| : f ∈ Φ} beschränkt.
(ii) Für jedes x ∈ X und ǫ > 0 gibt es eine Umgebung V ∈ U(x) mit | f (y) − f (x)| < ǫ
für alle y ∈ V, f ∈ Φ.
Dann ist Φ total beschränkt. Ist umgekehrt Φ total beschränkt, so gelten (i) und (ii).
Eine entsprechende Aussage gilt für C(X, R).
Beweis. Sei ǫ > 0 gegeben. Zu jedem x ∈ X können wir eine Umgebung V x von x
wählen, sodass (ii) für V = V x erfüllt ist. Da jede Umgebung von x eine x enthaltende
offene Menge enthält, können wir die V x offen wählen. Offensichtlich ist V x , x ∈ X,
eine offene Überdeckung von X.
S
Da X kompakt ist, existieren x1 , . . . , xn ∈ X, sodass schon X = ni=1 V xi und
| f (x) − f (xi )| < ǫ, x ∈ V xi , f ∈ Φ, i = 1, . . . , n.
Wegen (i) ist sicher
M := sup{ f (xi ) : i = 1, . . . , n, f ∈ Φ} < ∞.
Sei D die Kreisscheibe D := {λ ∈ C : |λ| ≤ M}. Dann haben wir eine Abbildung
p : Φ → Dn , definiert als
p( f ) := f (x1 ), . . . , f (xn ) .
Nun ist Dn ⊆ Cn kompakt und daher total beschränkt (vgl. Satz 12.8.3). Mit Dn ist auch
die Teilmenge p(Φ) von Dn total beschränkt, vgl. Fakta 12.8.2. Also existieren endlich
viele f1 , . . . , fm ∈ Φ, sodass für jedes f ∈ Φ immer |p( f ) − p( fk )| < ǫ, bzw. äquivalent
dazu
| f (xi ) − fk (xi )| < ǫ, i = 1, . . . , n .
für mindestens ein k ∈ {1, . . . , m}.
Jedes x ∈ X liegt in einer Menge V xi , und für dieses i gilt
| f (x) − f (xi )| < ǫ, | fk (x) − fk (xi )| < ǫ .
Es folgt
| f (x) − fk (x)| ≤ | f (x) − f (xi )| + | f (xi ) − fk (xi )| + | fk (x) − fk (xi )| < 3ǫ
für alle x ∈ X. Die Kugeln mit Radius 3ǫ und Mittelpunkt fk überdecken also ganz Φ,
und somit ist Φ total beschränkt.
Zur Umkehrung: Total beschränkte Mengen sind sicherlich beschränkt in
(C(X, C), k.k∞), und somit auch punktweise beschränkt, dh. es gilt (i).
Wegen der totalen Beschränktheit gibt es zu ǫ > 0 endlich viele f1 , . . . , fm ∈ Φ,
sodass es zu jedem f ∈ Φ ein fk mit k f − fk k∞ < ǫ gibt.
Zu einem x ∈ X gibt es wegen der Stetigkeit der fk ’s für k = 1, . . . , m Umgebungen
Vk ∈ U(x) mit | fk (y) − fk (x)| < ǫ für alle y ∈ Vk . Setzen wir V = V1 ∩ · · · ∩ Vm , so ist
V ∈ U(x) und für f ∈ Φ folgt für das richtige fk und y ∈ V
| f (y) − f (x)| < | f (y) − fk (y)| + | fk (y) − fk (x)| + | f (x) − fk (x)| < 3ǫ,
und somit (ii).
❑
12.9. ALEXANDROFF-KOMPAKTIFIZIERUNG LOKALKOMPAKTER RÄUME171
12.8.11 Korollar. Für Φ ⊆ C(X, C) ist Φ genau dann kompakt, wenn Φ punktweise
beschränkt und gleichgradig stetig ist. Insbesondere enthält in diesem Fall jede Folge
in Φ eine gleichmäßig konvergente Teilfolge.
Eine entsprechende Aussage gilt für C(X, R).
Eine wichtige Anwendung dieses Satzes gibt es in der Theorie der gewöhnlichen
Differentialgleichungen, wo dieser die Existenz von Lösungen von einer großen Klasse
von Differentialgleichungen liefert.
12.9.1 Satz. Ein topologischer Hausdorff Raum (X, T ) ist genau dann lokal kompakt,
wenn er offene Teilmenge eines kompakten Hausdorff Raumes ist, d.h. wenn es einen
topologischen Hausdorff Raum (Y, O) gibt, der kompakt ist, sodass X eine offene Teil-
menge von Y ist, und sodass T = O|X .
Eine mögliche Wahl von Y ist die, dass man ein Y := X ∪ {∞} mit einem Element
∞ < X und
O = T ∪ {{∞} ∪ (X \ K) : X ⊇ K kompakt}
setzt.5 .
Beweis. Sei X ein offene Teilmenge des kompakten Raumes Y. Nach Lemma 12.7.10
ist Y insbesondere regulär. Also gibt es zu der Umgebung X von x eine Umgebung V
von x in Y, sodass V ⊆ X. Aus Lemma 12.7.7 folgt die Kompaktheit von V in Y. Wegen
Proposition 12.7.2, (K2), und O|V = (O|X )|V ist V auch kompakt in X, und daher ist X
lokalkompakt.
Nun sei umgekehrt (X, T ) lokalkompakt, und sei Y und O definiert, wie im Satz.
Da für eine kompakte Menge K ⊆ X immer X \ K in X offen ist, überprüft man leicht,
dass O eine Topologie auf Y ist, und dass X offen in Y ist.
Um zu zeigen, dass diese Hausdorffsch ist, seien x, y ∈ Y zunächst so, dass x, y ∈ X.
Dann gibt es disjunkte O x , Oy ∈ T ⊆ O mit x ∈ O x , y ∈ Oy , da ja (X, T ) vorausset-
zungsgemäß Hausdorffsch ist. Ist x ∈ X und y = ∞, so gibt es wegen der Lokal-
kompaktheit eine kompakte Umgebung V von x in X. Ist O x eine x enthaltende offene
Teilmenge von V, und ist Oy := {∞} ∪ (X \ V), so gilt Oy ∈ O und O x ∩ Oy = ∅.
Wir müssen noch zeigen, dass Y kompakt ist. Dazu sei {Oi : i ∈ I} eine offene
Überdeckung von Y. Insbesondere gibt es mindestens ein j ∈ I mit ∞ ∈ O j .
Nach Konstruktion der Topologie gilt O j = {∞} ∪ X \ K für eine kompakte Teil-
menge K von X. Nun ist sicherlich {Oi \ {∞} : i ∈ I} eine offene Überdeckung von
K. Also gibt es i1 , . . . , in ∈ I mit Oi1 ∪· · ·∪Oin ⊇ K, und daher Y = Oi1 ∪· · ·∪Oin ∪O j .
❑
5 Dieser Topologische Raum wir als Alexandroff-Kompaktifizierung bezeichnet.
172 KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
Beweis. Wegen Satz 12.9.1 können wir X als offene Teilmenge eines kompakten Haus-
dorffraumes (Y, O) mit T = O|X betrachten. Nach Lemma 12.7.10 ist (Y, O) regulär und
wegen Bemerkung 12.6.4 somit auch (X, T ).
Ist U ∈ U(x), so ist U auch Umgebung von x betrachtet als Teilmenge von Y.
Wegen Korollar 12.6.3 gibt es ein offenes P ⊆ Y, sodass x ∈ P ⊆ P ⊆ U, wobei P ad
hoc der Abschluss von P in Y ist. Nach Lemma 12.7.7 ist P kompakt, wegen P ⊆ X ist
P auch offen in X, und wegen P ⊆ X zusammen mit (12.13) ist P auch der Abschluss
von P in (X, T ).
❑
12.9.3 Beispiel. Man betrachte C ∪ {∞} versehen mit der chordalen Metrik χ. Ist O die
Topologie, die von χ auf C∪{∞} erzeugt wird, so ist (C∪{∞}, O) genau die Alexandroff-
Kompaktifizierung von C versehen mit der euklidischen Topologie.
Wählt man etwa ǫ = 1 und K wie in der Definition, so ist t 7→ |g(t)| auf K wegen der
Kompaktheit beschränkt und auf X\K gilt ohnehin |g(x)| < 1. Also sind alle Funktionen
aus C0 (X, R) bzw. C0 (X, C) beschränkt.
Ist umgekehrt g ∈ C0 (X, R) (C0 (X, C)), und setzt man g zu einer Funktion f auf
Y durch f (∞) = 0 fort, so gilt f ∈ C(Y, R) (C(Y, C)).
Beweis.
Ist f ∈ C(Y, R) (C(Y, C)) mit f (∞) = 0, so ist klarerweise f |X stetig auf X bzgl.
O|X = T . Außerdem gibt es wegen der Stetigkeit von f bei ∞ zu jedem ǫ > 0
eine offene Umgebung von ∞, dh. eine kompakte Menge K in X, sodass | f (x) −
f (∞)| = | f (x)| < ǫ für alle x ∈ X \ K. Somit haben wir f |X ∈ C0 (X, R) (C0 (X, C)).
12.10. DER SATZ VON STONE WEIERSTRASS 173
Ist nun g ∈ C0 (X, R) (C0 (X, C)) und setzt man f (x) := g(x), x ∈ X und f (∞) := 0,
so ist f stetig auf Y, da die Bedingung ∀ǫ > 0 ∃K kompakt, sodass |g(x)| <
ǫ, x ∈ X \ K genau die Stetigkeit von f bei ∞ bedeutet, und da für x ∈ X wegen
der Tatsache, dass X offen in Y ist, die Stetigkeit von g bei x unmittelbar auf f
übertragen wird.
f 7→ f |X ist nun offensichtlich eine lineare Bijektion, wobei
A nach R2 linear.
Ist für jedes solche Paar x1 , x2 diese Abbildung surjektiv, dh. für alle c1 , c2 ∈ R gibt
es eine Funktion f ∈ A mit f (x1 ) = c1 , f (x2 ) = c2 , so ist A offensichtlich punktetren-
nend und nirgends verschwindend.
Ist A umgekehrt nirgends verschwindendund punktetrennend, so enthält φ x1 ,x2 (A)
wegen der Linearität einen Vektor der Form d1 , einen Vektor der Form 1c und einen
der Form ef mit e , f .
Ist cd , 1, so sind die ersten beiden Vektoren linear unabhängig. Ist c = d = 1, so
sind die ersten beiden gleich und der letzte dazu
linear
unabhängig. Fallscd =10 , c,
so ist - da A sogar eine Algebra ist - auch dc = d·1 1·c
∈ φ x1 ,x2 (A). Nun ist 00 , 1−d =
c c 1
1 − d ∈ φ x1 ,x2 (A) linear unabhängig von d . In jedem Fall ist der Teilraum φ x1 ,x2 (A)
von R2 mindestens zwei-dimensional, dh. φ x1 ,x2 (A) = R2 .
12.10.4 Satz (Stone-Weierstraß). 6 Sei (K, T ) ein kompakter topologischer Raum und
sei A ⊆ C(K, R) eine punktetrennende, nirgends verschwindende Algebra stetiger
Funktionen. Dann ist A dicht in der Algebra C(K) := C(K, R) aller stetigen Funk-
tionen auf K.
Beweis. Nach Lemma 12.10.1 ist der Abschluss B von A in B(K, R) ein Algebra. Da
C(K, R) abgeschlossen in B(K, R) ist, haben wir auch B ⊆ C(K, R). Der Beweis erfolgt
nun in vier Schritten:
Xm
a j y j − |y| ≤ 2ǫ, y ∈ [−k f k∞ , k f k∞ ].
j=1
Pm j
Da B eine Algebra ist, gilt j=1 a j f ∈ B und
X
m
k a j f j − | f | k∞ ≤ 2ǫ.
j=1
f1 + f2 | f1 − f2 |
min( f1 , f2 ) = − ,
2 2
und für n > 2 folgt die Behauptung durch vollständiger Induktion.
(iii) Ist f ∈ C(K), x ∈ K, ǫ > 0, dann existiert eine Funktion g x ∈ B mit g x (x) = f (x)
und g x (t) > f (t) − ǫ, t ∈ K.
Um das zu sehen, bemerken wir zunächst, dass mit A ist auch B (⊇ A) punk-
tetrennend und nirgends verschwindend ist. Wegen Bemerkung 12.10.3 existiert
für jedes y ∈ K eine Funktion hy ∈ B mit
Wegen der Stetigkeit von f − hy bei y existiert eine offene Umgebung Uy von y,
sodass insbesondere
hy (t) > f (t) − ǫ, t ∈ Uy .
Da K kompakt ist, existieren endlich viele Punkte y1 , . . . , yn ∈ K mit
K ⊆ U y1 ∪ . . . ∪ U yn .
Setzt man g x := max(hy1 , . . . , hyn ), dann ist g x ∈ B und hat die gewünschten
Eigenschaften.
(iv) Ist f ∈ C(K) und ǫ > 0, so existiert h ∈ B mit k h − f k∞ < ǫ.
Dazu betrachte die Funktionen g x , x ∈ K, aus (iii). Da g x − f bei x stetig ist,
existiert eine offene Umgebung V x von x mit
K ⊆ V x1 ∪ . . . ∪ V xm .
Setzt man nun h := min(g x1 , . . . , g xm ), dann ist h ∈ B und erfüllt h(t) < f (t) + ǫ, t ∈
K. Mit den g x hat aber auch h die Eigenschaft h(t) > f (t) − ǫ.
❑
12.10.5 Beispiel. Sei [a, b] ein kompaktes Intervall in R und sei A := R[x]|[a,b] der
Raum aller Polynome mit reellen Koeffizienten betrachtet als Funktionen auf [a, b]. Of-
fensichtlich ist A eine Algebra besthend auf stetigen Funktionen, die alle linearen Po-
lynome also alle Geraden enthält. A ist daher punktetrennend und nirgends verschwin-
dend. Nach dem Satz von Stone-Weierstraß ist A (bzgl.k.k∞) dicht in C([a, b], R), vgl.
auch Satz 9.7.5.
12.10.6 Beispiel. Betrachte die Funktionen f (x) = x − 21 , g(x) = x − x2 , auf [0, 1]. Da
g gerade und f ungerade bzgl. x = 12 ist, gilt
Z1
f (t)gn (t)dt = 0, n = 0, 1, 2, . . . . (12.20)
0
176 KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
Z1 Z1 Z1 Z1
n n n
0= f g dt = ag dt + bg dt = bgn dt. (12.21)
0 0 0 1
2
12.10.8 Beispiel. Man betrachte C(T, C) und die lineare Hülle A in C(T, C) von {(ζ 7→
ζ n ) : n ∈ Z}. A sind dann alle Trigonometrischen Polynome.
Da für ζ ∈ T die Beziehung ζ̄ = 1ζ gilt, ist A invariant unter der komplexen Konju-
gation.
Weiters ist A punktetrennend, da für ζ1 , ζ2 ∈ T und c1 , c2 ∈ C
ζ − ζ1 ζ − ζ2
p(ζ) = c2 + c1
ζ2 − ζ1 ζ1 − ζ2
eine Funktion in A mit p(ζ1 ) = c1 und p(ζ2 ) = c2 ist. Nach obigen Satz ist A dicht in
C(T, C).
Da C(T, C) isomorph zu den stetigen, 2π-periodischen Funktionen P auf R ist, folgt
daraus auch, dass die lineare Hülle der Funktionen t 7→ exp(itn), n ∈ Z dicht in P ist.
Da diese Hülle mit der der Funktionen t 7→ sin(nt), n ∈ N; t 7→ cos(nt), n ∈ N ∪ {0} übereinstimmt, kennen wir diese
Tatsache schon aus Satz 9.7.2.
Wir wollen nun eine Version des Satzes von Stone-Weierstraß für lokalkompakte
Hausdorff Räume (X, T ) herleiten.
12.10.9 Korollar. Sei (X, T ) ein lokalkompakter Hausdorff Raum, und sei A ⊆
C0 (X, R) (C0 (X, C)) eine punktetrennende, nirgends verschwindende Algebra, die im
komplexen Falle unter der komplexen Konjugation abgeschlossen ist.
Dann ist A dicht in C0 (X) := C0 (X, R) (C0 (X, C)).
Beweis. Aus Proposition 12.9.5 wissen wir, dass C0 (X) isometrisch isomorph zu N ⊆
C(Y) ist. Also können wir A auch als Algebra in C(Y) betrachten. Als solche ist sie
aber nicht mehr nirgends verschwindende, da ja f (∞) = 0, f ∈ A.
Um diesen Nachteil zu beheben, betrachten wir B := A + h1Y i, also die lineare
Hülle von A und der konstanten 1-Funktion auf Y. Nun überprüft man leicht, dass B
eine punktetrennende, nirgends verschwindende Algebra auf Y ist (siehe Bemerkung
12.10.3). Nach Satz 12.10.4 bzw. Korollar 12.10.7 ist B dicht in C(Y).
Ist jetzt f ∈ C0 (X), so gibt es daher eine Folge gn ∈ B mit gn → f bzgl. k.k∞ .
Insbesondere gilt gn (∞) → f (∞) = 0, und somit
n→∞
fn := gn − gn (∞) · 1Y −→ f − 0 · 1Y = f.
Nun ist aber fn (∞) = 0, also fn ∈ A, und wir sehen, dass A dicht in C0 (X) ist.
❑
12.10.10 Beispiel. Sei D eine offene Teilmenge von Rn . Als offene Teilmenge eines
lokalkompakten Raumes ist D auch lokalkompakt.
∞
Nun sei A die Menge C00 (D) aller auf D unendlich oft differenzierbaren reell-
bzw. komplexwertigen Funktionen f mit kompakten Träger, d.h. der Abschluss von
{x ∈ D : f (x) , 0} ist eine kompakte Teilmenge von D.
∞ ∞
Da das Produkt zweier Funktionen f, g ∈ C00 (D) wieder in C00 (D) liegt, überprüft
man leicht, dass A eine Algebra ist. Um Korollar 12.10.9 anwenden zu können, müssen
wir nur noch zeigen, dass A punktetrennend ist.
Dazu betrachte man zunächst die Grundfunktion ψ : R → R
( 1
exp(1 − 1−x 2) , falls |x| < 1
ψ(x) := .
0 , falls |x| ≥ 1
178 KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
Diese ist beliebig oft differenzierbar. Für ein x0 ∈ D und δ > 0, sodass Kδ (x0 ) ⊆ D, sei
kx − x0 k2
f x0 ,δ (x) := ψ( ).
δ
Man sieht unmittelbar, dass der Träger von f x0 ,δ in der kompakten Menge Kδ (x0 ) ent-
∞
halten ist, und dass f x0 ,δ auf D beliebig oft differenzierbar ist. Also f x0 ,δ ∈ C00 (D).
Sind nun x1 , x2 ∈ D, c1 , c2 ∈ R (C), und ist 3δ ≤ kx1 − x2 k2 , so hat die Funktion
c1 f x1 ,δ + c2 f x2 ,δ Werte c1 bei x1 und c2 bei x2 .
∞
Also können wir Korollar 12.10.9 anwenden, und erhalten, dass C00 (D) dicht in
C0 (D) ist.
Lemma von Zorn
In diesem Anhang wollen wir insbesondere einen Beweis des Lemmas von Zorn bringen, das im Beweis des Satzes von
Tychonoff, Satz 12.7.11, verwendet wurde.
Ordnungen
12.10.11 Definition. Sei M eine Menge, und eine Relation auf M, d.h. ist eine Teilmenge von M × M. Dann heißt
Halbordnung auf M, oder kurz (M, ) Halbordnung, falls folgende drei Axiome gelten:
Reflexiv: x ∈ M ⇒ x x.
Antisymmetrisch: x y ∧ y x ⇒ x = y.
Transitiv: x y ∧ y z ⇒ x z.
Eine Halbordnung (M, ) heißt Totalordnung, falls je zwei Elemente Elemente vergleichbar sind, d.h.
x, y ∈ M ⇒ x y ∨ y x.
12.10.13 Definition. Sei eine Halbordnung auf der Menge M. Dann heißt (M, ) Verband, wenn jede zweielementige
Teilmenge von M ein Supremum und ein Infimum hat.
Ein Verband (M, ) heißt vollständig, falls jede Teilmenge von M ein Supremum und ein Infimum hat.
Ist M eine Menge, so ist P(M) versehen mit der Mengeninklusion ein vollständiger Verband. Ein weiters Beispiel ist
die Menge aller Topologien auf einer Menge.
12.10.14 Definition (Auswahlaxiom). Gegeben sei eineS Indexmenge I und eine Familie von nichtleeren Mengen Ai , i ∈ I,
so existiert eine Funktion (Auswahlfunktion) f : I → i∈I Ai , sodass f (i) ∈ Ai .
Q
Man beachte, dass das Auswahlaxiom nichts anderes besagt als, dass i∈I Ai , ∅.
12.10.15 Definition. Sei (M, ≤) eine halbgeordnete Menge. Wenn für jede total geordnete Teilmenge von M eine obere
Schranke existiert, dann heißt M induktiv geordnet. Wenn sogar jeweils eine kleinste obere Schranke existiert, dann heißt M
strikt induktiv geordnet.
Folgendes Lemma ist der zentrale Hilfsatz zum Beweis des Lemma von Zorn.
12.10.16 Lemma. Es sei (M, ≤) eine nichtleere halbgeordnete Menge mit einem kleinsten Element o, sodass M strikt
induktiv ist. Schließlich sei F : M → M eine Abbildung mit der Eigenschaft (Monotonie)
m ≤ F(m), m ∈ M.
179
180 KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
Beweis. Wie nennen eine Teilmenge S von M zulässig, wenn die folgenden drei Bedingungen gelten: o ∈ S , F(S ) ⊆ S ,
und für jede total geordnete Teilmenge T ⊆ S liegt auch die kleinste obere Schranke sup T in S . Zum Beispiel ist M selbst
zulässig.
Nun sei S 0 der Durchschnitt aller zulässigen Teilmengen von M. Da in jeder zulässigen Teilmenge auch o liegt, enthält
der Durchschnitt zumindest das Element o . Außerdem gelten auch die beiden anderen Bedingungen für Zulässigkeit. Also
ist S 0 selbst zulässig und damit die kleinste aller zulässigen Teilmengen von M.
Wenn wir nun zeigen können, dass S 0 total geordnet ist, dann folgt daraus für die kleinste obere Schranke sup S 0 , dass
sup S 0 das größte Element von S 0 ist. Somit gilt wegen der Zulässigkeit F(sup S 0 ) ≤ sup S 0 . Wir bekommen insgesamt
sup S 0 ≤ F(sup S 0 ) ≤ sup S 0 ,
und damit die gewünschte Gleichheit. Noch zu zeigen ist also die Behauptung, dass S 0 total geordnet ist.
Für den Beweis nennen wir e ∈ S 0 ein extremales Element, wenn für alle s ∈ S 0 mit s ≤ e, s , e (s < e) gilt, dass
F(s) ≤ e. Zum Beispiel ist o extremal. Für ein extremales e setzen wir
S e := {s ∈ S 0 : s ≤ e ∨ F(e) ≤ s}.
Dann ist für jedes extremale e die Menge S e zulässig:
• o liegt in S e .
• Für jedes Element s ∈ S e folgt aus s < e schon F(s) ≤ e, aus s = e folgt F(s) = F(e), und aus s e folgt
F(e) ≤ s ≤ F(s). Also gilt insgesamt F(S e ) ⊆ S e .
• Es sei T eine total geordnete Teilmenge von S e . Wenn dann für alle t ≤ sup T die Ungleichung t ≤ e gilt, dann gilt
auch sup T ≤ e. Wenn es aber mindestens ein t gibt, sodass t e gilt, dann ist F(e) ≤ t ≤ sup T . Wir sehen also in
beiden Fällen, dass sup T ∈ S e .
Da aber S 0 die kleinste zulässige Teilmenge von M ist, muss also für alle extremalen e gelten:
S e = S 0.
Nun müssen wir noch zeigen, dass jedes e ∈ S 0 extremal ist. Dann folgt nämlich für s ∈ S 0 , dass s ∈ S e bzw.
s ≤ e ∨ e ≤ F(e) ≤ s,
also die Tatsache, dass S 0 total geordnet ist.
Um zu beweisen, dass jedes e ∈ S 0 extremal ist, betrachten wir
E := {e ∈ S 0 : e ist extremal}.
Wir weisen nach, dass E zulässig und damit gleich S 0 ist.
• o ∈ E ist klar.
• Wir müssen zeigen, dass mit e auch F(e) in E liegt. Ist s ∈ S 0 = S e und s < F(e), so müssen wir F(s) ≤ F(e)
folgern. Da s ∈ S e , gilt s ≤ e oder F(e) ≤ s, wobei wir letzteres wegen unserer Voraussetzung ausschließen können.
Aus s = e folgt trivialerweise F(s) ≤ F(e) und aus s < e folgt wegen e ∈ E, dass F(s) ≤ e ≤ F(e).
• Nun sei noch T ⊆ E total geordnet. Zu zeigen ist, dass sup T ∈ E. Sei dazu s ∈ S 0 , s < sup T . Wenn für jedes
t ∈ T die Relation F(t) ≤ s gelten würde, dann wäre wegen t ≤ F(t) auch sup T ≤ s. Das ist ein Widerspruch. Also
gibt es ein extremales e ∈ T mit F(e) s, und da S 0 = S e gilt, folgt daraus zwangsweise s ≤ e. Ist s , e, so folgt
wegen e ∈ E, dass F(s) ≤ e ≤ sup T . Da sup T ∈ S 0 = S e , s < sup T folgt aus s = e, dass F(s) = F(e) ≤ sup T .
Damit folgt insgesamt, dass sup T extremal ist.
❑
Nun können wir das Lemma von Zorn aus dem Auswahlaxiom herleiten.
12.10.17 Satz. Es sei (M, ≤) eine nichtleere induktiv geordnete Menge. Dann besitzt M ein maximales Element.
Beweis. Wir behandeln zuerst den Fall einer strikt induktiv geordneten Menge.
Sei x ∈ M fest. Ist m maximales Element von {y ∈ M : x ≤ y}, so ist m auch maximales Element von M. Also dürfen
wir uns auf den Fall beschränken, dass M ein kleinstes Element enthält. Wir nehmen an, es gebe kein maximales Element.
Dann finden wir für jedes m ∈ M ein größeres Element F(m) und definieren damit eine Funktion F : M → M, für die gilt:
∀m ∈ M : m < F(m).
Man beachte, dass man für die Existenz einer solchen Funktion F das Auswahlaxiom verwendet. In der Tat ist F eine
Auswahlfunktion der Familie (Am )m∈M , wobei Am = {x ∈ M : m ≤ x, m , x}. Da M strikt induktiv geordnet ist, folgt aus
Lemma 12.10.16 der Widerspruch F(m) = m für ein m ∈ M.
Nun sei M induktiv geordnet, und sei H die Menge aller total geordneten Teilmengen von M. Dann ist H bezüglich
der Inklusion eine Halbordnung, und zwar eine strikt induktive, denn ist T ⊆ H totalgeordnet (bzgl. ⊆), so auch ∪T (bzgl.
≤), und diese Teilmenge von M ist auch die kleinste obere Schranke von T (bzgl. ⊆).
Also besitzt H nach dem ersten Beweisteil ein maximales Element T . Es sei O eine obere Schranke von T . Dann muss
O zu T gehören, da sonst T ∪ {O} eine total geordnete Menge wäre, die T echt umfasste.
Dieses Element O ist dann ein maximales Element von M, denn für jedes m ∈ M folgt aus O ≤ m, dass m eine obere
Schranke von T ist, und somit ebenfalls zu T gehören muss. Insbesondere folgt m ≤ O und damit m = O.
❑
Literaturverzeichnis
181
Index
T 2 , 139 differenzierbar, 74
k-te Ableitung, 91 k-mal stetig, 89
C 1 , 70 partiell, 70
stetig, 74
Abbildung stetig partiell, 70
beschränkt, 40 Dirichlet-Kern, 59
Norm, 40 Dreiecksungleichung, 33
Abbildungsnorm, 40 Durchmesser einer Menge, 166
Ableitung, 72
partielle, 69 einfach zusammenhängend, 121
Richtungs-, 69 endliche Durchschnittseigenschaft, 160
Abzählbarkeitsaxiom Euklidische Topologie, 136
erstes, 137 Exponentialfunktion
zweites, 148 Matrix-wertig, 52
Alexandroff-Kompaktifizierung, 171 Extremum unter Nebenbedingung, 99
Algebra
nirgends verschwindend, 173 Feinheit
punktetrennend, 173 einer Riemann-Zerlegung, 5
Algebra von Funktionen, 173 Fejér-Kern, 65
analytisch, 133 Filter, 136
feiner, 164
Banachraum, 34 gröber, 164
Banachscher Fixpunktsatz, 79 konvergent, 165
Basis Filterbasis, 137
eines Filters, 137 folgenkompakt, 162
beschränkt, 40 Fourierkoeffizienten, 57
Bilinearform, 95 Fourierreihe, 57
Bogenlänge, 107 Fréchet-differenzierbar, 78
Funktion
Cauchy-Netz, 10 charakteristische, 12
Cauchy-Riemannschen Differentielglei- ganze, 128
chungen, 127, 134 harmonische, 133, 134
Cauchysche Integralformel, 130 Funktion von beschränkter Variation, 108
Cauchyscher Integralsatz, 130 Funktionen
Cesaro-Mittel, 64 stückweise stetig, 13
charakteristische Funktion, 12 stückweise stetig differenzierbar, 61
Darbouxsches Integral, 3 Gebiet, 117
dicht, 140 Gradient, 72
in B, 140 Gradientenfelder, 114
Differentialgleichung
exakte, 120 Häufungspunkt einer Menge, 142
182
INDEX 183
T 2 -, 139 mehrdimensionale, 92
Hausdorff, 139 Teilraum, 153
normierter, 33 Topologie, 136
topologischer, 136 Basis von, 148
Reihe diskrete, 136
Banachraum-wertig, 43 feinere, 147
Richtungsableitung, 69 finale, 155
Riemann-Stieltjes Integral, 109 gröbere, 147
Riemann-Zerlegung, 5 initiale, 151
Riemannsumme, 5 Klumpentopologie, 136
normal, 157
Satz Produkt-, 154
über die Inverse Funktion, 86, 94 Quotienten-, 156
Fejer, 65 regulär, 157
Hauptsatz über implizite Funktionen, Spur-, 153
81, 93 Subbasis von, 148
Hauptsatz der Differential- von einer Metrik, 136
Integralrechnung, 14 Träger
Stone-Weierstraß, 174 kompakt, 177
Taylorsche Formel, 91 trigonometrisches Polynom, 58
von Ascoli, 170
von Fubini, 24 Ultrafilter, 164
von Schwarz, 89 Umgebung, 136
von Tychonoff, 164 Umgebungsfilter, 136
Weierstraß, 66 Untersumme, 2
Satz von Liouville, 132
Satz von Morera, 132 Vektorfeld, 109
separabel, 140 wegunabhängig, 114
Skalarproduktraum, 54 Vertauschbarkeit
stückweise stetig, 13 Integrationsreihenfolge, 24
stückweise stetig differenzierbar, 61 Grenzwert und Ableitung, 22
Stützstellen, 5 Grenzwert und Integration, 21
Stammfunktion, 15
Weg, 103
stationärer Punkt, 95
geschlossener, 123
stetig, 143
nullhomotoper, 123
in einem Punkt, 143
rektifizierbar, 105
Lipschitz, 14
stetig, 103
stetig differenzierbar, 74
Wege
k-mal, 89
homotope, 121
Stetigkeit
Wegintegral, 109
gleichgradige, 170
komplexes, 112
Strecke
komplexes, Banachraum-wertiges,
gerade, 103
128
Subbasis einer Topologie, 148
Substitutionsregel, 16 zusammenhängend, 158
Zwischenstellen, 5
Tangentialebene, 74
Tangentialvektor, 47
Taylorsche Formel, 91
Taylorsche Polynom