Ana Ii

Analysis 2
für Technische Mathematik
Dezember 2010
Michael Kaltenbäck
Inhaltsverzeichnis
8 Das Riemannsche Integral 1

8.1 Ober- und Untersummen . . . . . . . . . . . . . . . . . . . . . . . . 1
8.2 Das Riemann-Integral . . . . . . . . . . . . . . . . . . . . . . . . . . 5
8.3 Integrale von stetigen Funktionen . . . . . . . . . . . . . . . . . . . . 10
8.4 Differential und Integralrechnung . . . . . . . . . . . . . . . . . . . . 12
8.5 Weitere Eigenschaften des Integrals . . . . . . . . . . . . . . . . . . 16
8.6 Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . 17
8.7 Vertauschung von Integralen mit Grenzwerten . . . . . . . . . . . . . 20
8.8 Mittelwertsätze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
9 Normen, Banachräume und Fourierreihen 33

9.1 Normierte Räume . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
9.2 Lineare Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . 39
9.3 Reihen, Integrale, etc. mit Werten in einem normierten Raum . . . . . 43
9.4 Skalarprodukträume und Orthogonalsysteme . . . . . . . . . . . . . . 54
9.5 Fourierkoeffizienten und Konvergenz von Fourierreihen . . . . . . . . 57
9.6 Gleichmäßige Konvergenz von Fourierreihen . . . . . . . . . . . . . 62
9.7 Fejér Kern . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
10 Ableitungen nach mehreren Variablen 69

10.1 Partielle Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . 69
10.2 Hauptsatz über implizite Funktionen . . . . . . . . . . . . . . . . . . 78
10.3 Der Umkehrsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
10.4 Höhere Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
10.5 Extremwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
10.6 Lagrange Multiplikatoren . . . . . . . . . . . . . . . . . . . . . . . . 99
11 Wegintegrale 103
11.1 Wege . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
11.2 Wegintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
11.3 Homotopie, einfacher Zusammenhang . . . . . . . . . . . . . . . . . 121
11.4 Holomorphe Funktionen . . . . . . . . . . . . . . . . . . . . . . . . 126
12 Topologische Grundlagen 135

12.1 Topologische Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . 135
12.2 Abgeschlossene Mengen . . . . . . . . . . . . . . . . . . . . . . . . 140
12.3 Stetige Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . 143
12.4 Basis, Subbasis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
i
ii INHALTSVERZEICHNIS
12.5 Initiale Topologie und Finale Topologie . . . . . . . . . . . . . . . . 151

12.6 Trennungseigenschaften . . . . . . . . . . . . . . . . . . . . . . . . 157
12.7 Kompaktheit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
12.8 Kompaktheit in metrischen Räumen . . . . . . . . . . . . . . . . . . 166
12.9 Alexandroff-Kompaktifizierung lokalkompakter Räume . . . . . . . . 171
12.10Der Satz von Stone Weierstraß . . . . . . . . . . . . . . . . . . . . . 173
Literaturverzeichnis 181
Index 182
Kapitel 8
Das Riemannsche Integral
8.1 Ober- und Untersummen

Schon die Mathematik der Antike beschäftigte man sich mit der Problemstellung, die
Fläche gewisser Figuren zu berechnen. Bei Polygonen ist dies durch Zerlegung in Drei-
ecke unmittelbar möglich, bei krummlinigen Figuren ist dagegen nicht einmal so klar,
wie Fläche überhaupt zu definieren ist.
8.1.1 Beispiel. Betrachte die Parabel gegeben durch f (x) = x2 .
Wir sind an der Fläche, die von der x-Achse, der Parabel und der Geraden x = 1
begrenzt wird, interessiert. Dazu könnte man, unserer intuitiven Vorstellung von Fläche
folgend, so vorgehen, dass man die Fläche in Streifen der Breite △x zerlegt, z.B.
△x = 1n , und die Fläche eines Streifens durch das Rechteck mit der Breite △x und
der Höhe min f (x) approximiert, wobei das Minimum über die im betrachteten Strei-
fen liegenden x-Koordinaten genommen wird. Ist △x sehr klein, so wird man hoffen,
dass die Summe der Flächen aller dieser Rechtecke fast gleich der zu bestimmenden
Fläche ist.
f (x) = x2 f (x) = x2
1 1
n=4 n=8
0 1 0 1
Abbildung 8.1: Approxiomation der Fläche von unten
In unserem Fall erhält man auf dieser Art und Weise die folgende Näherung für die
Gesamtfläche A:
X
n
1 1 1
An = min{ f (x) : (k − 1) ≤ x≤k }· =
k=1
n n n
1
2 KAPITEL 8. DAS RIEMANNSCHE INTEGRAL
X !2
1 X 2
n n−1
k−1 1 1 (n − 1)n(2n − 1)
= · = 3 k = 3 .
k=1
n n n k=0
n 6
Lässt man in dieser Formel n immer größer werden, so erhält man A = limn→∞ An = 31 .
Genauso könnte man natürlich die Fläche des Streifens durch das Rechteck mit
der Breite △x und der Höhe max f (x) approximieren. Unserer Vorstellung von Fläche
folgend sollte bei dieser zweiten Methode zur Flächenbestimmung das selbe heraus-
kommen.
f (x) = x2 f (x) = x2
1 1
n=4 n=8
0 1 0 1
Abbildung 8.2: Approxiomation der Fläche von oben
In der Tat gilt

X
n
1 1 1 X k2 1
n
Ân = max{ f (x) : (k − 1) ≤ x≤k }· = =
k=1
n n n k=1 n2 n
1 X 2
n
1 n(n + 1)(2n + 1)
= k = 3 ,
n3 k=1 n 6
und für n → ∞ erhält man wieder A = limn→∞ Ân = 31 .

Wir wollen den Zugang aus dem letzten Beispiel formalisieren.
8.1.2 Definition. Sei [a, b] ein endliches Intervall in R. Wir nennen eine endliche Teil-
menge Z von [a, b] eine Zerlegung des Intervalls [a, b], falls a, b ∈ Z.
Wir bezeichnen mit Z die Menge aller solcher Zerlegungen, versehen diese Menge
mit der Relation ⊆, und erhalten damit eine gerichtete Menge (vgl. Definition 5.3.1).
Wollen wir die Elemente einer Zerlegung Z aufzählen, so werden wir das immer
so tun, dass n(Z) + 1 die Mächtigkeit von Z bezeichnet, und dass
Z = {ξ j : j = 0, . . . , n(Z)}, wobei
a = ξ0 < ξ1 < · · · < ξn(Z) = b.
Sei nun f : [a, b] → R eine beschränkte Funktion. Zu einer gegebenen Zerlegung

Z = {ξ j : j = 0, . . . , n(Z)} ∈ Z bezeichnen wir mit U(Z) die zu Z gehörige Unter-
summe von f , also die Summe der Flächen der Rechtecke unter der Funktion f , die zur
gegebenen Zerlegung gehört:
X
n(Z)
U(Z) = (ξ j − ξ j−1 ) inf f (t). (8.1)
t∈[ξ j−1 ,ξ j ]
j=1
8.1. OBER- UND UNTERSUMMEN 3
Entsprechend definieren wir die Obersumme

X
n(Z)
O(Z) = (ξ j − ξ j−1 ) sup f (t). (8.2)
j=1 t∈[ξ j−1 ,ξ j ]
f (x)
Z: a = ξ0 ξ1 ξ2 ξ3 ξ4 ξ5 ξ6 ξ7 ξ8 ξ9 = b
f (x)
Z: a = ξ0 ξ1 ξ2 ξ3 ξ4 ξ5 ξ6 ξ7 ξ8 ξ9 = b
Abbildung 8.3: Veranschaulichung einer Unter- bzw. Obersumme
Da wir f als beschränkt voraussetzen, existieren diese Ober- und Untersummen.

P
Klarerweise gilt wegen b − a = n(Z)
j=1 (ξ j − ξ j−1 )
(b − a) inf f (t) ≤ U(Z) ≤ O(Z) ≤ (b − a) sup f (t).
t∈[a,b] t∈[a,b]
Wir sehen also, dass alle Ober- und Untersummen gleichmäßig nach oben und nach
unten beschränkt sind. Somit ist folgende Definition sinnvoll.
8.1.3 Definition. Wir setzen
b
Z− Zb
f dx := inf Z∈Z O(Z), f dx := supZ∈Z U(Z),
a −
a
und bezeichnen die erste Zahl als das obere- und die zweite als das untere Integral von
f über [a, b].
Die Funktion f heißt integrierbar auf [a, b], falls das obere mit dem unteren Integral
übereinstimmt. In diesem Fall bezeichnen ihren gemeinsamen Wert als das Integral1
1 Man spricht auch vom Darbouxschen Integral.
von f über [a, b]:

b
Z b Z− Zb
D− f dx = f dx = f dx.
a
a −
a
8.1.4 Bemerkung. Da die Menge Z aller Zerlegungen von [a, b] bezüglich ⊆ eine ge-

richtete Menge ist, können wir von den Netzen U(Z) Z∈Z und O(Z) Z∈Z sprechen.
Sei nun Z1 ⊆ Z2 , wobei Z1 = {ξ j : j = 0, . . . , n(Z1 )} sowie
Z2 = {ηk : k = 0, . . . , n(Z2 )}. Ist j ∈ {1, . . . , n(Z1 )}, so gibt es Indizes k( j − 1) < k( j),
sodass
ξ j−1 = ηk( j−1) < ηk( j−1)+1 < · · · < ηk( j)−1 < ηk( j) = ξ j .
| {z }
k( j)−k( j−1)−1 viele
Pk( j)
Wegen (ξ j − ξ j−1 ) = k=k( j−1)+1 (ηk − ηk−1 ) folgt
k( j)
X
(ξ j − ξ j−1 ) inf f (t) = (ηk − ηk−1 ) inf f (t) ≤
t∈[ξ j−1 ,ξ j ]
k=k( j−1)+1 t∈[ξ j−1 , ξ j ]
| {z }
⊇[ηk−1 ,ηk ]
k( j)
X
(ηk − ηk−1 ) inf f (t).
t∈[ηk−1 ,ηk ]
k=k( j−1)+1
Summiert man über alle j ∈ {1, . . . , n(Z1 )} auf, so erhält man U(Z1 ) ≤ U(Z2 ). Wir

sehen also, dass U(Z) Z∈Z ein monoton wachsendes Netz ist. Nach (5.8) gilt daher
Zb
lim U(Z) = sup U(Z) = f dx.
Z∈Z Z∈Z
−
a

Entsprechend ist das Netz O(Z) Z∈Z der Obersummen monoton fallend, und
b
Z−
lim O(Z) = inf O(Z) = f dx.
Z∈Z Z∈Z
a

Klarerweise ist damit auch das Netz O(Z) − U(Z) Z∈Z monoton fallend, und besteht
aus nicht negativen reellen Zahlen. Also gilt auch (vgl. Nach (5.8))
inf (O(Z) − U(Z)) = lim (O(Z) − U(Z)), (8.3)

Z∈Z Z∈Z
und wegen der Rechenregeln für R-wertige Netze (siehe Anschnitt 5.3) gleicht dieser
Ausdruck
b
Z− Zb
lim O(Z) − lim U(Z) = f dx − f dx. (8.4)
Z∈Z Z∈Z
a −
a
Also ist die Integrierbarkeit einer Funktion f äquivalent dazu, dass der Ausdruck in
(8.3) verschwindet.
8.2. DAS RIEMANN-INTEGRAL 5
8.2 Das Riemann-Integral

Der oben vorgestellte Zugang zur Definition eines Integrals ist zwar befriedigend um
dem Begriff Fläche unter einer Kurve einen Sinn zu geben, um aber etwa komplex-
oder vektorwertige Funktionen integrieren zu können, benötigen wir einen alternativen
Ansatz.
n(R)
8.2.1 Definition. Wir nennen das Paar R = (ξ j )n(R)
j=0 ; (α j ) j=1 eine Riemann-Zerlegung
eines Intervalls [a, b], falls n(R) ∈ N und (ξ j )n(R)
j=0 ∈ R
n(R)+1
, (α j )n(R)
j=1 ∈ R
n(R)
, wobei
a = ξ0 < ξ1 < · · · < ξn(R) = b; α j ∈ [ξ j−1 , ξ j ], j = 1, . . . , n(R),
und nennen |R| := max{(ξ j − ξ j−1 ) : j = 1, . . . , n(R)} die Feinheit der Riemann-
Zerlegung. Die Punkte ξ j heißen Stützstellen und die Punkte α j Zwischenstellen.
Weiters sei R1 R2 :⇔ |R2 | ≤ |R1 |. Ist R die Menge aller solcher Riemann-
Zerlegungen, dann ist (R, ) eine gerichtete Menge2 .
Ist f eine beschränkte reell- bzw. komplexwertige Funktion, so betrachtet man das

Netz S (R) R∈R , wobei die Riemannsumme 3 zur Riemann-Zerlegung R durch
X
n(R)
S (R) = (ξ j − ξ j−1 ) f (α j ).
j=1
definiert ist. Konvergiert dieses Netz, so nennen wir die Funktion f Riemann-
integrierbar und bezeichnen
Zb
f dx := lim S (R)
R∈R
a
als das Riemann Integral von f über [a, b].
f (x)
a = ξ0 ξ1 ξ2 ξ3 ξ4 ξ5 ξ6 ξ7 ξ8 ξ9 =b
R: α1 α2 α3 α4 α5 α6 α7 α8 α9
Abbildung 8.4: Veranschaulichung einer Riemannsumme
Für limR∈R S (R) schreibt man auch lim|R|→0 S (R), um deutlich zu machen, dass R
durch die Feinheit der Riemann-Zerlegung gerichtet wird. Da es zu jedem δ > 0, δ ≤
2 ist sicher nicht antisymmetrisch und unterscheidet sich wesentlich von der Halbordnung ⊆ auf Z aus
Definition 8.1.2.
3 Bernhard Riemann, 17.9.1826-20.7.1866
b −a eine Riemann-Zerlegung R gibt mit |R| = δ, ist die Existenz von I = lim|R|→0 S (R)
äquivalent zu
∀ǫ > 0 ∃δ > 0 : |S (R) − I| < ǫ ∀R ∈ R, |R| ≤ δ.
8.2.2 Bemerkung. Ist f : [a, b] → C, so folgt aus Re S ( f, R) =

S (Re f, R), Im S ( f, R) = S (Im f, R) und der Tatsache, dass ein komplexwertiges
Netz genau dann konvergiert, wenn Real- und Imaginärteil es tun, dass die Riemann-
Integrierbarkeit von f zu der von Re f und Im f äquivalent ist.
8.2.3 Bemerkung. Ist M eine endliche Teilmenge von [a, b] mit m Elementen, und setzt
man für eine Riemann-Zerlegung R
X
n(R)
S M (R) = (ξ j − ξ j−1 ) f (α j ),
j=1
M∩[ξ j−1 ,ξ j ]=∅
so hat diese Summe höchstens 2m Summanden weniger als S (R). Somit folgt
X
n(R)
S M (R) − S (R) ≤ (ξ j − ξ j−1 )| f (α j )| ≤ 2m|R| · k f k∞ , (8.5)
j=1
M∩[ξ j−1 ,ξ j ],∅

wobei k f k∞ = sup{| f (t)| : t ∈ [a, b]}, und wir sehen, dass S M (R) genau dann
R∈R
konvergiert, wenn S (R) R∈R es tut. In diesem Fall gilt
Z b
f dx = lim S (R) = lim S M (R).
a |R|→0 |R|→0
Als Anwendung dieser Bemerkung sieht man, dass, wenn sich zwei Funktionen f und g
nur auf einer endlichen Menge M unterscheiden, aus der Riemann-Integrierbarkeit von
f auch die von g folgt. In der Tat ist dann S M ( f, R) = S M (g, R), wobei das Argument
f bzw. g andeutet, von welcher Funktion die entsprechende Riemann-Summe gebildet
wird.
Mit Hilfe dieser Bemerkung können wir einen ersten Zusammenhang zwischen
Riemann-Summen und Ober- bzw. Untersummen herstellen.
8.2.4 Lemma. Sei f : [a, b] → R eine beschränkte reellwertige Funktion, und sei
Z0 ∈ Z, ǫ > 0. Dann gibt es ein δ > 0, sodass
∀R ∈ R, |R| ≤ δ ⇒ U(Z0 ) − ǫ ≤ S (R) ≤ O(Z0 ) + ǫ.
Beweis. Man überzeugt sich leicht, dass für eine relle Konstante c
U( f + c, Z0 ) = U( f, Z0 ) + c(b − a), O( f + c, Z0 ) = O( f, Z0 ) + c(b − a)
und S ( f + c, R) = S ( f, R) + c(b − a). Setzen wir c = k f k∞ , so erkennt man, dass es

genügt, das Lemma mit der zusätzlichen Annahme f (x) ≥ 0, x ∈ [a, b] zu beweisen.
Man schreibe Z0 = {ηk : k = 0, . . . , n(Z0 )} ∈ Z, und setze M = Z0 . Mit (8.5)
erhalten wir
S M (R) − S (R) ≤ |R| · 2(n(Z0) + 1) · k f k∞ .
n(R)
Für R = (ξ j )n(R)
j=0 ; (α j ) j=1 ∈ R, bedeutet M ∩ [ξ j−1 , ξ j ] = ∅, dass [ξ j−1 , ξ j ] sicher ganz
enthalten in einem gewissen Intervall [ηk( j)−1 , ηk( j) ] enthalten ist. Bezeichnen wir mit J
die Menge aller dieser Indizes, so folgt
X
n(R) X0 )
n(Z X
S M (R) = (ξ j − ξ j−1 ) f (α j ) = (ξ j − ξ j−1 ) f (α j ) ≤
j∈J k=1 j∈J,k( j)=k
X0 )
n(Z X X0 )
n(Z
(ξ j − ξ j−1 ) sup f (t) ≤ (ηk − ηk−1 ) sup f (t) = O(Z0 ).
k=1 j∈J,k( j)=k t∈[ηk−1 ,ηk ] k=1 t∈[ηk−1 ,ηk ]
Es folgt

S (R) ≤ S M (R) − S (R) + O(Z0 ) ≤ O(Z0 ) + |R| · 2(n(Z0 ) + 1) · k f k∞ .
Die erste Aussage des Lemmas folgt nun, wenn man |R| hinreichend klein macht. Die
zweite zeigt man analog.
❑
Wir werden nun zeigen, dass die beiden vorgestellten Zugänge zur Integration für
reellwertige beschränkte Funktionen f äquivalent sind.
8.2.5 Satz. Für eine beschränkte Funktion f : [a, b] → R sind folgende Aussagen
äquivalent:
(i) Das obere und das untere Integral von f stimmen überein.
(ii) inf Z∈Z (O(Z) − U(Z)) = 0.
(iii) f ist Riemann-integrierbar, d.h. lim|R|→0 S (R) existiert.

n(R)
(iv) Setzt man für eine beliebige Riemann-Zerlegung R = (ξ j )n(R)
j=0 ; (α j ) j=1 ∈ R
4
X
n(R) X
n(R)
O(R) := (ξ j − ξ j−1 ) sup f (t), U(R) := (ξ j − ξ j−1 ) inf f (t),
t∈[ξ j−1 ,ξ j ] t∈[ξ j−1 ,ξ j ]
j=1 j=1
so gilt lim|R|→0 (O(R) − U(R)) = 0.
(v) Es gibt eine Folge (Rn )n∈N von Riemann-Zerlegungen, sodass

limn→∞ (O(Rn ) − U(Rn )) = 0.
In einem dieser Fälle gilt

Z b Z b
D− f dx = f dx = lim O(R) = lim U(R) =
a a |R|→0 |R|→0
lim S (Rn ) = lim O(Rn ) = lim U(Rn ),

n→∞ n→∞ n→∞
für jede beliebige Folge (Rn )n∈N von Riemann-Zerlegungen mit limn→∞ |Rn | = 0.
Beweis.
4 Klarerweise gilt O(R) = O(Z) und U(R) = U(Z), wobei Z = {ξ j : j = 0, . . . , n(R)} ∈ Z.
(iii) ⇒ (iv) : Setzen wir R := lim|R|→0 S (R), so wollen zeigen, dass R = lim|R|→0 O(R).
Zu jedem ǫ > 0 gibt es wegen der vorausgesetzten Konvergenz ein R0 , sodass
|R − S (R)| < ǫ für alle R R0 .
n(R)
Sei R = (ξ j )n(R) j=0 ; (α j ) j=1 R0 eine feste Riemann-Zerlegung. Wähle nun für
j = 1, . . . , n(R) und k ∈ N ein αkj ∈ [ξ j−1 , ξ j ], sodass
1
sup f (t) − < f (αkj ) ≤ sup f (t).
t∈[ξ j−1 ,ξ j ] k t∈[ξ j−1 ,ξ j ]
k n(R)
Setzt man Rk = (ξ j )n(R)
j=0 ; (α j ) j=1 , so folgt
X n(R)
1 1
O(R) − S (Rk ) ≤ |ξ j − ξ j−1 | = (b − a) .
j=1
k k
Aus |Rk | = |R| ≤ |R0 | folgt Rk R0 , und somit

b−a
|R − O(R)| ≤ |R − S (Rk )| + |S (Rk ) − O(R)| < ǫ + .
k
Für k → ∞ folgt |R − O(R)| ≤ ǫ und zwar für alle R R0 . Also gilt
lim|R|→0 O(R) = R. Genauso sieht man, dass lim|R|→0 U(R) = R.
Aus den Rechenregeln für Grenzwerte folgt damit
0 = R − R = lim|R|→0 (O(R) − U(R)).
(iv) ⇒ (v) : Ist (Rn )n∈N eine Folge von Riemann-Zerlegungen mit limn→∞ |Rn | = 0, so

besagt dieses Grenzverhalten für die Feinheit gerade, dass O(Rn ) − U(Rn ) n∈N

eine Teilfolge des Netzes O(R) − U(R) R∈R im Sinne von Definition 5.3.5 ist.
Nach (5.4) folgt
lim (O(Rn ) − U(Rn )) = lim (O(R) − U(R)) = 0.
n→∞ |R|→0
Schließlich sei noch bemerkt, dass es offensichtlich eine Folge von Riemann-
Zerlegungen mit limn→∞ |Rn | = 0 gibt. Man nehme etwa die Folge (Rn )n∈N , wo
Rn genau n +1 viele äquidistante Stützstellen hat, und wobei die Zwischenstellen
genau in der Mitte zwischen den angrenzenden Stützstellen liegt.
(v) ⇒ (ii) : Das ist klar, wenn man baechtet, dass O(R) = O(Z), U(R) = U(Z), wenn
Z = {ξ j : j = 0, . . . , n(R)} ∈ Z die Menge der Stützstellen einer gegebenen
n(R)
Riemann-Zerlegung R = (ξ j )n(R)j=0 ; (α j ) j=1 ∈ R ist.
(i) ⇔ (ii) : Das haben wir schon in Bemerkung 8.1.4 gesehen (vgl. (8.3) und (8.4)).
b
R− Rb
(i) ⇒ (iii) : Nun gelte also I := f dx = f dx. Zu einem beliebigen ǫ > 0 wähle Z0
a −
a
so, dass
I − ǫ < U(Z0 ) ≤ O(Z0 ) < I + ǫ.
Nach Lemma 8.2.4 folgt die Existenz eines δ > 0, sodass
I − 2ǫ < U(Z0 ) − ǫ ≤ S (R) ≤ O(Z0 ) + ǫ < I + 2ǫ
für |R| ≤ δ. Also lim|Z|→0 S (R) = I.
Dass limn→∞ O(Rn ) = lim|R|→0 O(R), limn→∞ U(Rn ) = lim|R|→0 U(R) und
limn→∞ S (Rn ) = lim|R|→0 S (R) für limn→∞ |Rn | = 0 gilt, sieht man genauso, wie im
zweiten Beweisschritt.
❑
8.2.6 Beispiel. Nehmen wir einmal an, dass wir schon wissen, dass die Funktion f (x) =
x2 aus Beispiel 8.1.1 Riemann-integrierbar ist. Dann können wir uns mit Satz 8.2.5
sicher sein, dass die Folgen An und Ân tatsächlich gegen das Integral von f über [0, 1]
konvergieren. Sie stimmen nämlich mit U(Rn ) bzw. mit O(Rn ) überein, wobei Rn eine
Riemann-Zerlegung ist, die genau n + 1 viele äquidistante Stützstellen hat.
Wir werden später sehen, dass alle stetigen Funktionen integrierbar sind, und wie
man mit Hilfe der Differenzialrechnung das Integral konkret ausrechnet. Dass bei wei-
tem nicht alle Funktionen integrierbar sind, sieht man am übernächsten Beispiel.
8.2.7 Beispiel. Betrachte die konstante Funktion f : [0, 1] → C, d.h. f (t) = c, t ∈
[a, b]. Ist R eine Riemann-Zerlegung, so rechnet man
X
n(R) X
n(R)
S (R) = (ξ j − ξ j−1 ) f (α j ) = c (ξ j − ξ j−1 ) = c(b − a),
j=1 j=1
Rb
und damit a c dx = lim|R|→0 S (R) = c(b − a).
Wegen Bemerkung 8.2.3 sehen wir auch, dass jede Funktion, die konstant gleich c
bis auf eine endliche Menge M ist, integrierbar ist und dass das Integral gleich c(b − a)
ist.
Diese Tatsache lässt sich aber nicht auf den Fall eines abzählbaren M ausdehnen.
8.2.8 Beispiel. Betrachte die Funktion f : [0, 1] → R definiert durch



0, x irrational
f (x) := 
 .
1, x rational
Ist nun Z = {ξ j : j = 0, . . . , n(Z)} eine Zerlegung von [0, 1], so enthält jedes Intervall
[ξ j−1 , ξ j ] sowohl rationale als auch irrationale Zahlen. Somit folgt
U(Z) = 0, O(Z) = 1.
Also ist f nicht integrierbar.
Im Folgenden wollen wir einige Eigenschaften von Integralen auflisten, die unmit-
telbar aus der Tatsache folgen, dass wir Integrale als Grenzwerte von Netzen auffassen.
8.2.9 Lemma. (i) Seien f1 , f2 Riemann-integrierbar über [a, b] und c eine reelle
bzw. komplexe Konstante. Dann sind auch f1 + f2 und c f1 Riemann-integrierbar,
und es gilt
Zb Zb Zb Zb Zb
( f1 + f2 ) dx = f1 dx + f2 dx, (c f1 ) dx = c f1 dx.
a a a a a
(ii) Ist f Riemann-integrierbar über [a, b], so gilt

b
Z Z
b −
f dx ≤ | f (x)| dx ≤ (b − a) · k f k∞ , (8.6)
a a
wobei sogar |S ( f, R)| ≤ (b − a) · k f k∞ für jede Riemann-Zerlegung R von [a, b].

(iii) Sind g1 , g2 reellwertige Riemann-integrierbare Funktionen über [a, b] mit g1 (x) ≤

g2 (x) für alle x ∈ [a, b], so gilt
Zb Zb
g1 dx ≤ g2 dx.
a a
Beweis. Zunächst folgt unmittelbar aus der Definition der Riemannsummen und der
Obersummen S ( f1 + f2 , R) = S ( f1 , R) + S ( f2 , R), S (c f1 , R) = cS ( f1 , R) und S (g1 , R) ≤
S (g2 , R). Durch den Grenzübergang |R| → 0 erhalten wir (i) und (iii).
Nun sei ǫ > 0 und Z0 eine Zerlegung von [a, b]. Weiters sei δ > 0, sodass |R| ≤
δ ⇒ S (| f |, R) ≤ O(| f |, Z0 ) + ǫ (siehe Lemma 8.2.4).
Ist R eine Riemann-Zerlegung von [a, b] mit |R| ≤ δ, so folgt leicht aus der Defini-
tion der Riemannsummen und der Obersummen und der Dreiecksungleichung
|S ( f, R)| ≤ |S (| f |, R)| ≤ O(| f |, Z0 ) + ǫ ≤ k f k∞ (b − a) + ǫ.
(8.6) folgt durch die Grenzwertbildung, zuerst |R| → 0 und dann Z0 ∈ Z, sowie der
Tatsache, dass ǫ > 0 beliebig ist.
Schließlich folgt |S ( f, R)| ≤ (b − a) · k f k∞ für jede Riemann-Zerlegung R von [a, b]
unmittelbar aus der Dreiecksungleichung.
❑
8.3 Integrale von stetigen Funktionen

Ehe wir uns konkret dem Problem der Integrierbarkeit einer stetigen Funktion wid-
men, werden wir als Hilfsmittel ein Lemma herleiten, das besagt, dass in vollständigen
metrischen Räumen nicht nur jede Cauchy-Folge, sondern auch jedes Cauchy-Netz
konvergiert:
8.3.1 Definition. Sei hX, di ein metrischer Raum und (I, ) eine gerichtete Menge.
Dann heißt ein Netz (xi )i∈I in X Cauchy-Netz, wenn
∀ǫ > 0 ∃i0 ∈ I : d(xi , x j ) < ǫ ∀i, j i0 . (8.7)
Für Folgen ist (8.7) genau die Cauchy-Folgen Bedingung. Also liegt die Aussage
des nächsten Lemma nahe.
8.3.2 Lemma. In einem vollständigen metrischen Raum ist ein Netz genau dann kon-
vergent, wenn es ein Cauchy-Netz ist. .
Beweis. Ist nun (xi )i∈I ein Netz, und konvergiert dieses gegen x ∈ X, so gibt es zu
jedem ǫ > 0 ein i0 ∈ I, sodass d(xi , x) < 2ǫ für i i0 . Wegen der Dreiecksungleichung
folgt d(xi , x j ) < ǫ für i, j i0 . Also folgt (8.7).
Gilt umgekehrt (8.7), so definieren wir induktiv eine Folge von in ∈ I, n ∈ N, durch
die Forderung, dass
1
in+1 in und d(xi , x j ) < , i, j in ,
n
indem wir zuerst i1 ∈ I so wählen, dass d(xi , x j ) < 1 für i, j i1 . Zu gegebenem in ∈ I
1
wähle dann gemäß (8.7) jn+1 ∈ I so, dass d(xi , x j ) < n+1 für i, j jn+1 . Nun sei in+1 ∈ I
gemäß (5.1) so gewählt, dass in+1 in , jn+1 .
8.3. INTEGRALE VON STETIGEN FUNKTIONEN 11
Offensichtlich ist (xin )n∈N eine Cauchyfolge und damit konvergent gegen ein x ∈ X.
Ist n ≤ m, so folgt aus d(xim , xin ) < n1 durch Grenzübergang m → ∞ die Tatsache, dass
d(x, xin ) ≤ n1 , n ∈ N.
Ist nun ǫ > 0, so wähle n ∈ N, sodass n2 ≤ ǫ. Für i in folgt
2
d(x, xi ) ≤ d(x, xin ) + d(xin , xi ) < ≤ ǫ,
n
bzw. xi ∈ Uǫ (x), und somit konvergiert (xi )i∈I gegen x.
❑
8.3.3 Satz. Ist f eine stetige reell- oder komplexwertige Funktion auf einem reellen
Intervall [a, b], so ist f Riemann-integrierbar.
Beweis. Wir bemerken zuerst, dass wegen Satz 6.3.3 die Funktion f sogar gleichmäßig
stetig ist. Also gibt es zu ǫ > 0 ein δ > 0, sodass |x−y| ≤ δ ⇒ | f (x)− f (y)| < ǫ. Definiert
man für beliebiges γ > 0
ρ(γ) := sup{| f (s) − f (t)| : s, t ∈ [a, b], |s − t| ≤ γ},
so gilt daher ρ(δ) ≤ ǫ.

Gemäß Lemma 8.3.2 folgt die Konvergenz von S (R) R∈R , wenn wir zeigen

können, dass S (R) R∈R ein Cauchy-Netz ist.
ǫ
Dazu sei ǫ > 0, und sei δ > 0 so, dass ρ(δ) ≤ 3(b−a) . Dafür, dass S (R) R∈R ein
Cauchy-Netz ist, genügt es zu zeigen, dass für Riemann-Zerlegungen R und R1 von
[a, b] aus |R|, |R1 | ≤ δ folgt, dass
|S (R) − S (R1 )| < ǫ. (8.8)
Dazu sei R2 eine Riemann-Zerlegung, deren Stützstellen die von R1 und R umfasst.
Das bedeutet, dass mit
n(R1 ) n(R)
R1 = (ξ j )n(R 1) n(R)
j=0 ; (α j ) j=1 , R = (ζ j ) j=0 ; (γ j ) j=1 ,
n(R2 )
R2 = (η j )n(R 2)
j=0 ; (β j ) j=1 ,
die Beziehung
{ξ j : j = 0, . . . , n(R1 )} ∪ {ζ j : j = 0, . . . , n(R)} ⊆ {η j : j = 0, . . . , n(R2 )}
gilt. Ist j ∈ {1, . . . , n(R1 )}, so gibt es Indizes k( j − 1) < k( j), sodass
| {z }
Es folgt
 
n(RX1 )  X
k( j) 
S (R1 ) − S (R2 ) = (ξ j − ξ j−1 ) f (α j ) − (ηk − ηk−1 ) f (βk ) ≤

j=1 k=k( j−1)+1

X1 )
n(R X
k( j)
(ξ j − ξ j−1 ) f (α j ) − (ηk − ηk−1 ) f (βk ) ≤

j=1 k=k( j−1)+1
X1 )
n(R X
k( j)
(ηk − ηk−1 ) · | f (α j ) − f (βk )|.
j=1 k=k( j−1)+1
Bemerkt man, dass |α j − βk | ≤ (ξ j − ξ j−1 ) ≤ |R1 |, k ∈ {k( j − 1) + 1, . . . , k( j)}, so folgt

X2 )
n(R
|S (R2 ) − S (R1 )| ≤ (ηk − ηk−1 ) ρ(δ) = (b − a) · ρ(|R1 |), (8.9)
k=1
und wegen |R1 | ≤ δ ist dieser Ausdruck ≤ (b − a) · ρ(δ) ≤ 3ǫ . Genauso zeigt man
|S (R2 ) − S (R)| ≤ 3ǫ . (8.8) folgt nun sofort aus der Dreicksungleichung.
❑
Für einen späteren Gebrauch sei bemerkt, dass aus (8.9) für zwei Riemann-
Zerlegungen R1 , R mit Hilfe der Dreiecksungleichung unmittelbar

S (R) − S (R1 ) ≤ 2(b − a) · ρ(max(|R|, |R1 |)). (8.10)
folgt, wobei ρ(γ) := sup{| f (s) − f (t)| : s, t ∈ [a, b], |s − t| ≤ γ}. Da wir zur Herleitung
von (8.9) die Stetigkeit von f nicht benötigt haben, ist der Fall eines nicht stetigen f
nicht ausgeschlossen.
8.4 Differential und Integralrechnung

Um das Integral einer Funktion tatsächlich ausrechnen zu können, wollen wir einen
wichtigen Zusammenhang zur Differentialrechnung herstellen. Bevor wir das tun, brau-
chen wir folgendes Lemma.
8.4.1 Lemma. Sei f eine reell- oder komplexwertige Funktion auf einem reellen Inter-
vall [a, b], und sei c < d, [c, d] ⊆ [a, b]. Weiters bezeichne 1[c,d] die charakteristische
Funktion , d.h. (
1 , falls t ∈ [c, d]
1[c,d] (t) = .
0 , falls t < [c, d]
Dann ist f |[c,d] auf [c, d] genau dann Riemann-integrierbar, wenn es 1[c,d] · f auf [a, b]
ist, wobei Z Z
b d
1[c,d] · f dx = f |[c,d] dx.
a c
Das ist sicher der Fall, wenn f auf ganz [a, b] Riemann-integrierbar ist.
Beweis. Wir bezeichnen mit R ∈ R die Riemann-Zerlegungen von [a, b] und mit R′ ∈
R′ die Riemann-Zerlegungen von [c, d].
Sei zunächst f über [a, b] Riemann-integrierbar. Wir zeigen, dass dann

S ( f |[c,d] , R′ ) R′ ∈R′ ein Cauchy-Netz ist. Dazu sei ǫ > 0. Da S ( f, R) R∈R konvergent
und daher ein Cauchy-Netz ist, gibt es ein δ > 0, sodass |S ( f, R) − S ( f, R1 )| < ǫ, wenn
nur |R|, |R1 | ≤ δ.
Sind nun R′ , R′1 ∈ R′ mit |R′ |, |R′1 | ≤ δ, so wähle eine beliebige Fortsetzung R und
R1 von R′ bzw. R′1 zu Riemann-Zerlegungen von [a, b] mit einer Feinheit kleiner oder
gleich δ und so, dass die Stütz- und Zwischenstellen von R und R1 außerhalb von [c, d]
übereinstimmen.
Die Summanden (ξ j −ξ j−1 ) f (α j ) zu Intervallen [ξ j−1 , ξ j ] mit [ξ j−1 , ξ j ] * [c, d] treten
dann bei S ( f, R) und bei S ( f, R1 ) auf. Also folgt

S ( f, R) − S ( f, R ) = S ( f | , R′ ) − S ( f | , R′ ) ≤ δ.
1 [c,d] [c,d] 1
8.4. DIFFERENTIAL UND INTEGRALRECHNUNG 13

Somit ist S ( f |[c,d] , R′ ) R′ ∈R′ auch ein Cauchy-Netz und f |[c,d] daher auf [c, d]
Riemann-integrierbar.
Wegen (1[c,d] · f )|[c,d] = f |[c,d] folgt aus dem eben bewiesenen auch aus der
Riemann-Integrierbarkeit von 1[c,d] · f die von f |[c,d] .
Wir setzen M = {c, d}, und wissen aus Bemerkung 8.2.3, dass der Beweis vollendet
ist, wenn wir
I = lim
′
S M ( f |[c,d] , R′ ) ⇒ I = lim S M (1[c,d] · f, R),
|R |→0 |R|→0
beweisen können. Dazu sei ǫ > 0, und δ > 0, sodass |R′ | ≤ δ ⇒ |I − S M ( f |[c,d] , R′ )| < ǫ.
n(R)
Ist nun R = (ξ j )n(R) j=0 ; (α j ) j=1 eine Riemann-Zerlegung von [a, b] mit |R| ≤ δ, so sei
′
n(R′ )
R′ = (η j )n(R )
j=0 ; (β j ) j=1 die Riemann-Zerlegung von [c, d], für die {η1 , . . . , ηn(R′ )−1 } =
{ξ1 , . . . , ξn(R)−1 } ∩ (c, d), und für die {β2 , . . . , βn(R′ )−1 } = {α1 , . . . , αn(R) } ∩ [η1 , ηn(R′ )−1 ].
Es folgt
X
n(R)
S M (1[c,d] · f, R) = (ξ j − ξ j−1 )1[c,d] (α j ) f (α j ) =
j=1
c,d<[ξ j−1 ,ξ j ]
′
X
n(R) X
n(R )−1
(ξ j − ξ j−1 ) f (α j ) = (η j − η j−1 ) f (β j ) = S M ( f |[c,d] , R′ ).
j=1 j=2
c<ξ j−1 ,ξ j <d
Wegen |R′ | ≤ |R| ≤ δ folgt |I − S M (1[c,d] · f, R)| < ǫ. Daher gilt

I = lim|R|→0 S M (1[c,d] · f, R).
❑
8.4.2 Bemerkung. Mit Hilfe von Bemerkung 8.2.3 sieht man leicht, dass die Riemann-
Integrierbarkeit von 1[c,d] · f über [a, b] zu der von 1(c,d) · f bzw. 1(c,d] · f oder auch der
von 1[c,d) · f äquivalent ist. Die entsprechenden Integrale stimmen alle überein.
8.4.3 Definition. Eine Abbildung f : [a, b] → R (C) heißt stückweise stetige Funktion
, falls es eine Zerlegung a = t0 < t1 < · · · < tn = b von [a, b] gibt, sodass sich die
Funktionen f |(t j−1 ,t j ) stetig auf [t j−1 , t j ] fortsetzen lassen.
8.4.4 Bemerkung. Aus Lemma 8.4.1 folgt nun, dass jede stückweise stetige Funktion
Riemann-integrierbar ist.
Ist nämlich f : [a, b] → R (C) und sind a = t0 < t1 < · · · < tn = b, sodass sich
für alle j = 1, . . . , n, die Funktion f |(t j−1 ,t j ) stetig auf [t j−1 , t j ] fortsetzen lässt, so sind
alle Funktionen 1(t j−1 ,t j ) · f und daher auch ihre Summe Riemann-integrierbar. Diese
Summe unterscheidet sich aber von f nur an endlich vielen Punkten und ist daher
selbst Riemann-integrierbar.
Im Folgenden stellt es sich als praktisch heraus, auch Integrale über Intervalle der
Länge Null bzw. Integrale zu definieren, die von der oberen zur unteren Grenze durch-
laufen werden. Ist also c > d, und f : [d, c] → R (C) Riemann-integrierbar, so setzen
wir Z Z Z
c d c
f (x) dx := 0, f (x) dx := − f (x) dx.
c c d
Mit dieser Konvention sei zunächst bemerkt:
8.4.5 Bemerkung. Sei nun f auf [a, b] reell- bzw. komplexwertig und Riemann-
integrierbar und sei a ≤ u ≤ v ≤ w ≤ b. Dann folgt aus Lemma 8.4.1, Lemma 8.2.9
und Bemerkung 8.4.2
Z w Z b Z b

f (t) dt = 1[u,v] (t) · f (t) dt = 1[u,v) (t) + 1[v,w] (t) · f (t) dt =
u a a
Z b Z b Z v Z w
1[u,v) (t) · f (t) dt + 1[v,w] (t) · f (t) dt = f (t) dt + f (t) dt.
a a u v
8.4.6 Satz (Hauptsatz der Diff.-Int.Rechnung). Sei f eine reell- oder komplexwertige
Funktion auf [a, b], die über [a, b] Riemann-integrierbar ist. Für x ∈ [a, b] definiere5
Zx
F(x) := f (t) dt.
a
Dann ist die Funktion F : [a, b] → R (C) stetig auf [a, b].
Ist f in einem Punkt x0 stetig, so ist F bei x0 differenzierbar, und es gilt6
F ′ (x0 ) = f (x0 ).
Beweis. Per definitionem ist f als Riemann-integrierbare Funktion beschränkt. Ist a ≤

x < y ≤ b, so folgt (siehe Bemerkung 8.4.5)
y
Z
|F(y) − F(x)| = f (t) dt ≤ k f k∞ · (y − x).

x
Insbesondere ist F stetig7 .

Sei nun f stetig bei einem x0 ∈ [a, b). Ist ǫ > 0 gegeben, so existiert δ > 0, sodass
| f (t) − f (x0 )| < ǫ für |t − x0 | < δ.
Ist x0 < x < x0 + δ ≤ b, so gilt wegen (8.6) 8

Zx
F(x) − F(x0 ) − f (x ) = f (t) − f (x0 )
0 dt < ǫ.
x − x0 x − x 0
x0
F(x)−F(x0 )
Also folgt F ′ (x0 )+ = lim x→x0 + x−x0 = f (x0 ). Entsprechend zeigt man
F ′ (x0 )− = f (x0 ), wenn x0 ∈ (a, b].
❑
8.4.7 Bemerkung. Mit den Voraussetzungen von Satz 8.4.6 betrachte man G(x) =
Rb Rb Rx
f (t) dt. Wegen G(x) = a f (t) dt − a f (t) dt gilt G′ (x) = − f (x).
x Rx
Somit folgt für ein festes c ∈ [a, b], dass ( c f (t) dt)′ = f (x) egal, ob x ≥ c oder
x ≤ c.
5 DieExistenz dieses Integrals für alle x ∈ [a, b] folgt aus Lemma 8.4.1.
6 Ist
x0 gleich a oder b, so meinen wir die links- bzw. rechtsseitige Differenzierbarkeit bzw. Ableitung.
7 Wir sehen, dass diese Funktion sogar Lipschitz stetig ist, d.h. dass |F(y) − F(x)| ≤ M · |y − x| für alle
x, y ∈ [a, b] mit einer festen Konstante M ≥ 0 gilt.

8 Man beachte, dass die Länge das Integrationsintervalles gerade |x − x | ist.
0
8.4. DIFFERENTIAL UND INTEGRALRECHNUNG 15
Folgendes Korollar ist die Grundlage dafür, Integrale mit Hilfe der Stammfunktion
berechnen zu können.
8.4.8 Korollar. Ist f : [a, b] → R (C) stetig, und ist H : [a, b] → R (C) eine Stamm-
funktion von f , d.h. H ist auf [a, b] differenzierbar mit H ′ (x) = f (x) für alle x ∈ [a, b],
so gilt
Z b
f (t) dt = H(b) − H(a).
a
Rx
Beweis. Nach Satz 8.4.6 ist die Funktion F(x) = a f (t) dt ebenfalls eine Stamm-
funktion von f auf [a, b]. Somit unterscheiden sich H und F nur um eine Konstante,
F ≡ H +c auf [a, b] (vgl. Bemerkung 7.4.2). Wegen 0 = F(a) = H(a) +c ist H(a) = −c,
und somit Z b
f (t) dt = F(b) = H(b) + c = H(b) − H(a).
a
❑
8.4.9 Beispiel. Wir wollen das Integral der Funktion ln x über das Intervall [1, 3] be-
rechnen. Eine Stammfunktion von ln x auf (0, +∞) ist x(ln(x) − 1). Also folgt mit der
Konvention, dass g(x)|ba = g(b) − g(a),
Z 3
ln t dt = x(ln(x) − 1)|31 = 3(ln 3 − 1) − (−1) = 3 ln 3 − 2.
1
Rπ x 2ix
8.4.10 Beispiel. Um 0 te2it dt zu berechnen, nehmen wir die Stammfunktion 2i e −
1 2ix
(2i)2
e von xe2ix und erhalten
Z π !π
2it x 2ix 1 2ix π
te dt = e − e = .
0 2i (2i)2 0 2i
8.4.11 Bemerkung. Aus dem Hauptsatz sieht man insbesondere, dass für eine überall
auf [a, b] stetige Funktion f die Funktion F eine stetig differenzierbare Funktion ist,
die noch dazu F(a) = 0 erfüllt.
Ist umgekehrt F(x) eine stetig differenzierbare Funktion auf [a, b] mit F(a) = 0, so
Rx
ist ihre Ableitung f stetig und wegen Satz 8.3.3 integrierbar. Die Funktion f (t) dt hat
a
nach dem Hauptsatz die selbe Ableitung wie F. Außerdem verschwinden sie beide bei
Rx
a, und daher F(x) = f (t) dt, x ∈ [a, b] (vgl. Korollar 8.4.8).
a
Also wird C[a, b] durch den Integraloperator bijektiv auf {F ∈ C1 [a, b] : F(a) = 0}
abgebildet. Man sieht auch leicht, dass diese beiden Mengen Vektorräume sind, und
dass dieser Integraloperator linear ist.
Rb
8.4.12 Korollar. Ist f : [a, b] → R stetig und f (x) ≥ 0, x ∈ [a, b], wobei a f (x) dx =
0, so verschwindet f identisch auf [a, b].
Rx
Beweis. Die Funktion F(x) = f (t) dt, x ∈ [a, b] ist in C1 [a, b], erfüllt
a
F(a) = F(b) = 0 und hat für x ∈ (a, b) die Ableitung F ′ (x) = f (x) ≥ 0. Also
ist F(x) monoton wachsend, und somit 0 = F(a) ≤ F(x) ≤ F(b) = 0.
❑
Folgender Satz wird ebenfalls Hauptsatz der Differential-Integralrechnung genannt. Dieser ist dem Satz 8.4.6 zwar
sehr ähnlich, aber auf den zweiten Blick unterscheiden sie sich doch durch die Voraussetzungen wesentlich.
8.4.13 Satz. Sei f : [a, b] → R Riemann-integrierbar über [a, b], sodass es eine stetige Funktion F : [a, b] → R gibt, die
auf (a, b) differenzierbar ist und die dort F ′ (x) = f (x) erfüllt. Dann gilt
Zb
f (x) dx = F(b) − F(a).
a
Beweis. Sei {ξ j : j = 0, . . . , n} eine Zerlegung von [a, b]. Dann existieren nach dem Mittelwertsatz der Differentialrechnung
Satz 7.2.5 Zwischenstellen αi , ξi−1 ≤ αi ≤ ξi , sodass
F(ξi ) − F(ξi−1 ) = (ξi − ξi−1 ) f (αi ).

Somit ist R = (ξ j )n(R)
j=0
; (α j )n(R)
j=1
eine Riemann-Zerlegung von [a, b]. Es folgt
X
n
X
n
F(b) − F(a) = F(ξi ) − F(ξi−1 ) = (ξi − ξi−1 ) f (αi ) = S (R).
i=1 i=1
Rb
Für |R| → 0 strebt die rechte Seite gegen f (x)dx.
a
❑
Man beachte, dass Satz 8.4.13 nur auf reellwertige Funktionen anwendbar ist, da im Beweis der Mittelwertsatz der
Differentialrechnung verwendet wird, der ja nur für reellwertige Funktionen gilt.
Die in Lemma 7.4.3 kennengelernten Regeln zur Auffindung von Stammfunktionen

führen auf entsprechende Regeln zur Berechnung von Integralen.
8.4.14 Lemma (Substitutionsregel). Sei f reell- oder komplexwertig und stetig auf
[a, b], sei und g ∈ C1 [α, β] und stetig auf [α, β]. Ist nun g([α, β]) ⊆ [a, b], so gilt
Z g(β) Z β
f (x) dx = f (g(t))g′ (t)dt.
g(α) α
R
Beweis. Nach Lemma 7.4.3 ist ( f ) ◦ g eine Stammfunktion von f (g(t))g′ (t). Aus
Korollar 8.4.8 folgt daher die behauptete Gleichheit.
❑
Genauso beweist man folgendes Lemma.
8.4.15 Lemma (Partielle Integration). Seien f, g ∈ C1 [a, b]. Dann gilt
Zb Zb
′
f g dx = f (b)g(b) − f (a)g(a) − f g′ dx.
a a
Für f (b)g(b) − f (a)g(a) schreibt man auch f g|ba .
8.5 Weitere Eigenschaften des Integrals

Sind f und g im folgenden Satz stetig, so ist die Aussage des Satzes eine einfache Konsequenz aus der Tatsache, dass stetige
Funktionen integrierbar sind.
8.6. UNEIGENTLICHE INTEGRALE 17
8.5.1 Satz. Sind f, g reellwertig und über [a, b] Riemann-integrierbar, so sind es auch | f |, f 2 , f g und
Z Z
b b
f dx ≤ | f |dx.
a a
Beweis. Sei ǫ > 0 gegeben. Nach Satz 8.2.5 existiert eine Zerlegung
Z = {ξi : i = 0, . . . , n(Z)} von [a, b], sodass
O( f, Z) − U( f, Z) < ǫ.
Setze für i = 0, . . . , n(Z)
Mi = sup f (x), mi = inf f (x),
x∈[ξi−1 ,ξi ] x∈[ξi−1 ,ξi ]
Mi∗ = sup | f (x)|, m∗i = inf | f (x)|.

x∈[ξi−1 ,ξi ] x∈[ξi−1 ,ξi ]
Für x, y ∈ [ξi−1 , ξi ] folgt | f (x)| − | f (y)| ≤ | f (x) − f (y)| ≤ Mi − mi , und mit Hilfe von Lemma 2.7.10
Mi∗ − m∗i = sup | f (x)| + sup (−| f (x)|) = sup (| f (x)| − | f (y)|) ≤ Mi − mi .
x∈[ξi−1 ,ξi ] x∈[ξi−1 ,ξi ] x,y∈[ξi−1 ,ξi ]
Es folgt
X
n(Z)
O(| f |, Z) − U(| f |, Z) = (Mi∗ − m∗i )(ξi − ξi−1 ) ≤
i=1
X
n(Z)
≤ (Mi − mi )(ξi − ξi−1 ) = O( f, Z) − U( f, Z) < ǫ.
i=1
und nach (8.3) ist | f | integrierbar. Die behauptete Ungleichung folgt aus Lemma 8.2.9, (ii).
Ist Z wie oben, so folgt aus der Tatsache, dass x 7→ x2 monton wachsend auf R + ∪{0} ist,
sup f (x)2 − inf f (x)2 = (Mi∗ )2 − (m∗i )2

x∈[ξi−1 ,ξi ] x∈[ξi−1 ,ξi ]
= (Mi∗ + m∗i )(Mi∗ − m∗i ) ≤ 2k f k∞ · (Mi∗ − m∗i ).

Nun sehen wir wegen
 
X
n(Z)
 
O( f 2 , Z) − U( f 2 , Z) =  sup f (x)2 − inf f (x)2  (ξi − ξi−1 ) ≤
x∈[ξi−1 ,ξi ] x∈[ξi−1 ,ξi ]
i=1
X
n(Z)

≤ 2k f k∞ (Mi∗ − m∗i )(ξi − ξi−1 ) = 2k f k∞ O(| f |, Z) − U(| f |, Z) < 2k f k∞ · ǫ
i=1
wie oben, dass auch f 2 integrierbar ist. Die Behauptung für f g folgt aus der Beziehung
1
fg = ( f + g)2 − f 2 − g2 .
2
❑
8.5.2 Bemerkung. Sind die Funktionen in Satz 8.5.1 komplexwertig, so sind mit f, g auch Re f, Im f, Re g, Im g Riemannin-
tegrierbar. Da man | f |2 , Re f g, Im f g als Summe von Produkten von Re f, Im f, Re g, Im g darstellen kann, sind auch | f |2 , f g
Riemann-integrierbar. p
Man zeigt auch ähnlich wie im Beweis von Satz 8.5.1, dass mit | f |2 auch | f |2 = | f | Riemann-integrierbar ist.
8.6 Uneigentliche Integrale

Sei f : [a, b) → R (C), und angenommen f lässt sich zu einer Riemann-integrierbaren
Funktion f˜ : [a, b] → R (C) fortsetzen, dann folgt aus dem Hauptsatz
Z x Z b
lim f (t) dt = f˜(t) dt. (8.11)
x→b a a
Hat die Funktion f : [a, b) → R (C) nicht die Eigenschaft, dass sie sich auf [a, b]
zu einer Riemann-integrierbaren Funktion
R x fortsetzen lässt, so kann man immer noch
versuchen, für x ∈ [a, b) das Integral a f (t) dt zu berechnen, und dann x gegen b
streben zu lassen.
8.6.1 Definition. Sei f : [a, b) → R (C), wobei a < b ≤ +∞, und sei f |[a,x] für alle
x ∈ [a, b) Riemann-integrierbar. Dann heißt f uneigentlich integrierbar, falls
Z b Z β
f (t) dt := lim f (t)dt
a β→b− a
existiert. Entsprechend definiert man uneigentliche Integrale für Funktionen

f : (a, b] → R (C), wenn −∞ ≤ a < b.
Ist f : (a, b) → R (C), so definiert man mit einem beliebigen c ∈ (a, b)
Z b Z β Z c
f (t) dt := lim f (t)dt + lim f (t)dt, (8.12)
a β→b− c α→a+ α
falls die Grenzwerte existieren.

Man sieht leicht, dass (8.12) nicht von der Wahl von c ∈ (a, b) abhängt.
8.6.2 Beispiel.
(i) Für a ∈ R rechnet man
Z +∞ Z β
e−t dt = lim e−t dt = lim −(e−β − e−a ) = e−a .
a β→+∞ a β→+∞
(ii) Mit der Regel von de l’Hospital erhält man für ein b > 0
Z b Z b
ln t dt = lim ln t dt = b(ln(b) − 1) − lim α(ln(α) − 1) = b(ln(b) − 1).
0 α→0+ α α→0+
(iii) Bei der Berechnung von Z +∞

sin πt
dt
t 1
sieht man, dass bei uneigentlichen Intragralen ähnliche Phänomene auftreten, wie
bei Reihen. In der Tat existiert dieses Integral:
Z β Z [β] Z β
sin πt sin πt sin πt
dt = dt + dt =
1 t 1 t [β] t
X
[β]−1 Z n+1 Z β
| sin πt| sin πt
(−1)n dt + dt.
n=1 n t [β] t
R n+1
Man erkennt unschwer, dass n | sint πt| dt monoton gegen Null für n → ∞ kon-
vergiert. Mit Hilfe des Leibnizschen Kriteriums und wegen
Z β Z [β]+1
sin πt 1 2 β→+∞
dt ≤ | sin πt| dt = −→ 0,
[β] t [β] [β] π[β]
sieht man nun, dass unser Integral konvergiert, falls β → +∞.
Rβ
Das Integral ist aber nicht absolut konvergent in dem Sinne, dass auch 1 sint πt dt
existiert, da
Z β X Z n+1 | sin πt|
[β]−1 Z 1 X 1
[β]−1
sin t dt ≥ dt = | sin πt| dt ·
t n+1 n+1
1 n=1 n 0 n=1
für β → +∞ divergiert.
8.6. UNEIGENTLICHE INTEGRALE 19
Das wohl am meisten verwendete und ähnlich wie bei den Folgen zu beweisende
Kriterium für die absolute Konvergenz ist das folgende Resultat.
8.6.3 Lemma. Seien f, g : [a, b) → R (C), wobei a < b ≤ +∞, und sei f |[a,x] und g|[a,x]
sowie der Betrag dieser Funktionen für alle x ∈ [a, b) Riemann-integrierbar.
Rb
Ist a g(x) dx absolut konvergent, so ist es auch konvergent. Ist obendrein |g(x)| ≥
Rb
| f (x)| für alle x ab einem c ∈ [a, b), so ist auch a f (x) dx absolut konvergent.
Beweis. Wegen den Ungleichungen
Z x Z x Z x2 Z x2
2 2
g(t) dt ≤ |g(t)| dt, | f (t)| dt ≤ |g(t)| dt,

x1 x1 x1 x1
R x
vererbt sich die Eigenschaft, dass a |g(t)| dt ein Cauchy-Netz ist auch auf
R x R x x≥a
a
g(t) dt bzw. a | f (t)| dt . Nun folgt die behauptete Konvergenz aus Lemma
x≥a x≥a
8.3.2.
❑
8.6.4 Bemerkung. Man kann Lemma 8.6.3 anwenden, um aus der Divergenz eines
Rb Rb
uneigentlichen Integrales a | f (x)| dx auf die Divergenz von a |g(x)| dx zu schließen,
wenn |g(x)| ≥ | f (x)| für alle x ∈ (a, b).
8.6.5 Beispiel. Man betrachte das uneigentliche Integral
Z +∞ Z 1 Z β
x ln x x ln x x ln x
2 + 1)3
dx := lim 2 + 1)3
dx + lim 2 + 1)3
dx.
0 (x α→0+ α (x β→+∞ 1 (x
Da die Funktion h(x) := x ln x nur für x ∈ (0, +∞) definiert ist, ist dieses Integral
uneigentlich an beiden Integrationsgrenzen. Die Funktion h(x) lässt sich aber stetig auf
[0, +∞) durch h(x) = 0 stetig fortsetzen. Somit bleibt nur die Uneigentlichkeit bei der
Stelle +∞ (vgl. (8.11)).
Für x ≥ 1 ist der Integrand nicht negativ. Daher ergeben dort sich folgende
Abschätzungen:

x ln x = x ln x ≤ x2
≤
x2 1
(x2 + 1)3 (x2 + 1)3 (x2 + 1)3 (x2 )3 = x4 .
Wegen Z
1 ∞
1 ∞ 1
4
dx = − 3 =
1 x 3x 0 3
folgt aus Lemma 8.6.3 die absolute Konvergenz unseres Integrals.
8.6.6 Beispiel. Man betrachte das uneigentliche Integral
Z 1
ln x
2x x
dx.
0 e −e
Dieses ist nur uneigentlich bei 0. Für x ∈ (0, 1] gilt

ln x = − ln x .
e2x − e x e2x − e x
Wegen e−x ≥ 1/e für alle x ∈ [0, 1] folgt

− ln x − ln x 1 − ln x
= e−x x ≥ .
2x
e −e x e − 1 e ex − 1
Weiters gilt − ln x ≥ 1 für alle x ∈ (0, 1/e], d. h.
− ln x 1 1
≥ 1(0,1/e] (x) · ≥ 0, x ∈ (0, 1].
e2x − e x e ex − 1
Dabei ist 1(0,1/e] die Charakteristische Funktion des Intervalls (0, 1/e]. Für alle ǫ ∈
(0, 1/e) erhalten wir mit der Monotonie des Integrals
Z Z 1/e Z
ln x dx ≥ 1
1
1 1 1/e e−x
Iǫ := e2x − e x dx = dx .
ǫ e ǫ ex − 1 e ǫ 1 − e−x
Nun steht im Zähler die Ableitung des Nenners, d. h. eine Stammfunktion des Integran-
den ist ln(1 − e−x ). (Wegen x > 0 ist das Argument des Logarithmus positiv.) Daraus
ergibt sich
1 1/e 1 1 − e−1/e
Iǫ ≥ ln(1 − e−x ) = ln .
e ǫ e 1 − e−ǫ
Für ǫ → 0+ wird die rechte Seite jedoch beliebig groß, d. h. das uneigentliche Integral
Z
ln x dx
1
e2x − e x
0
ist divergent, und damit auch das im Beispiel angegebene.
8.7 Vertauschung von Integralen mit Grenzwerten

Das folgende Lemma ist eine unmittelbare Verallgemeinerung von Lemma 6.6.11.
Auch den Beweis kann man fast wörtlich übernehmen.
8.7.1 Lemma. Seien (I, I ) und (J, J ) zwei gerichtete Mengen, und sei hY, di ein
vollständiger metrischer Raum.
Weiters seien H : I × J → Y und h : I → Y Funktionen, sodass für alle j ∈ J die
Funktion i 7→ H(i, j) beschränkt ist, und sodass
h(i) = lim H(i, j)

j∈J
gleichmäßig auf I, d.h.
∀ǫ > 0 ∃ j0 ∈ J : ∀ j j0 , ∀i ∈ I : d(H(i, j), h(i)) ≤ ǫ,
bzw. äquivalent dazu h = lim j∈J H(., j) in hB(I, Y), d∞i. Schließlich existiere für alle
j ∈ J der Limes A j := limi∈I H(i, j).
Unter diesen Voraussetzungen ist auch (h(i))i∈I konvergent, wobei
lim A j = lim h(i), (8.13)

j∈J i∈I
oder einprägsamer geschrieben:
lim lim H(i, j) = lim lim H(i, j).

j∈J i∈I i∈I j∈J
8.7. VERTAUSCHUNG VON INTEGRALEN MIT GRENZWERTEN 21

Beweis. Sei ǫ > 0 gegeben. Wegen der gleichmäßigen Konvergenz von H(i, j) j∈J ist

H(., j) j∈J in B(I, Y) ein Cauchy-Netz. Es existiert also ein j0 ∈ J, sodass für j, k j0
und alle i ∈ I gilt
dY (H(i, j), H(i, k)) ≤ ǫ.
Hält man j und k fest, so folgt dY (A j , Ak ) = limi∈I dY (H(i, j), H(i, k)) ≤ ǫ. Damit ist
(A j ) j∈J ein Cauchy-Netz, und wegen Lemma 8.3.2 konvergent. Setzen wir lim j∈J A j =:
A, so gilt
dY (h(i), A) ≤ dY (h(i), H(i, j)) + dY (H(i, j), A j) + dY (A j , A).
Wähle j nach der vorausgesetzten gleichmäßigen Konvergenz so, dass für alle i ∈ I gilt
dY (h(i), H(i, j)) < ǫ und so, dass dY (A j , A) < ǫ. Für dieses j existiert ein i0 ∈ I, sodass
aus i i0 , die Ungleichung dY (H(i, j), A j) < ǫ folgt. Insgesamt erhalten wir
dY (h(i), A) < 3ǫ für i ∈ I und i i0 .
❑
Aus diesem Lemma folgen nun eine Reihe von wichtigen Ergebnissen.
8.7.2 Satz. Sei ( fn )n∈N eine Folge von Riemann-integrierbaren Funktionen auf [a, b],
fn , n ∈ N. Gilt limn→∞ fn = f gleichmäßig auf [a, b], so ist auch f Riemann-
integrierbar, wobei
Zb Zb
lim fn dx = f dx.
n→∞
a a
Entsprechendes gilt für gleichmäßig konvergente Netze von Funktionen.
Beweis. Um das letzte Lemma anwenden zu können, sei I = R die Menge aller
Riemann-Zerlegungen von [a, b] versehen mit der durch die Feinheit induzierte Ord-
nung und (J, J ) = (N, ≤). Weiters sei Y = R (C), versehen mit der Euklidischen
Metrik, je nachdem, wohin die Funktionen abbilden.
Wir setzen H(R, n) := S ( fn , R), h(R) = S ( f, R). Wegen Lemma 8.2.9, (ii), gilt
|H(R, n) − h(R)| = |S ( fn − f, R)| ≤ k fn − f k∞ · (b − a) = d∞ ( fn , f ) · (b − a),
und daher konvergiert H(., n) gleichmäßig gegen h. Nach Lemma 8.7.1 folgt
Zb
lim fn dx = lim lim S ( fn , R)
n→∞ n→∞ |R|→0
a
Zb
= lim lim S ( fn , R) = lim S ( f, R) = f dx,
|R|→0 n→∞ |R|→0
a
wobei limn→∞ S ( fn , R) = S ( f, R) für ein festes R ∈ R leicht aus der Tatsache folgt,
dass diese Riemann-Summen endliche Summen sind.
Der Beweis für Netze verläuft fast identisch.
❑
P
8.7.3 Beispiel. Sei ∞ n
n=0 an x eine Potenzreihe mit positivem Konvergenzradius R.
Dann gilt für [a, b] ⊆ {x : |x| < R}
Zb X ∞ 
 X
∞ Z b X∞
 n  an n+1 b
 an x  dx = an xn dx = x | x=a
n=0 n=0 a n=0
n+1
a
Somit haben wir eine weitere Möglichkeit, Stammfunktionen auszurechnen. So ist

2
etwa die Stammfunktion von e−x nicht als Summe von Produkten von Funktionen wie
Polynome, e hoch Polynomen, oder dergleichen darstellbar. Aber zumindest lässt sich
eine Stammfunktion F(x) als
Z x Z xX
∞ X ∞
2 (−1) j 2 j (−1) j
F(x) = e−t dt = t dt = x2 j+1 ,
0 0 j=0
j! j=0
( j!)(2 j + 1)
anschreiben.
Mit Hilfe des Hauptsatzes können wir auch Differentiation und Limes vertauschen
(siehe auch Satz 7.2.19).
8.7.4 Korollar. Sei ( fn )n∈N eine Folge von reell- bzw. komplexwertigen Funktionen, aus
C1 [a, b].
Es existiere ein Punkt x0 ∈ [a, b], sodass ( fn (x0 ))n∈N konvergiert. Ist dann die Folge
( fn′ )n∈N gleichmäßig konvergent auf [a, b], so ist auch die Folge ( fn )n∈N gleichmäßig
konvergent auf [a, b], und es gilt
d d
lim fn (x) = lim fn (x), x ∈ [a, b].
dx n→∞ n→∞ dx
Entsprechendes gilt für Netze von Funktionen.

Rx
Beweis. Nach Satz 8.4.6 gilt fn (x) = x fn′ (t) dt + fn (x0 ) für alle x ∈ [a, b]. Setzen
0
wir g := limn→∞ fn′ und A := limn→∞ fn (x0 ), so ist g wegen Korollar 6.6.13 stetig.
Außerdem folgt für x ∈ [a, b] aus Satz 8.7.2
Z x Z x !
′
g(t) dt + A = lim fn (t) dt + fn (x0 ) = lim fn (x) =: f (x),
x0 n→∞ x0 n→∞
womit ( fn )n∈N zumindest punktweise gegen f (x) konvergiert. Nach Satz 8.4.6 ist die
linke Seite ableitbar, und daher gilt f ′ (x) = g(x) = limn→∞ fn′ (x), x ∈ [a, b].
Die Gleichmäßigkeit der Konvergenz folgt aus
Z x

sup | fn (x) − f (x)| = sup ( fn (x) − g(t)) dt + fn (x0 ) − A ≤
′
x∈[a,b] x∈[a,b] x0
n→∞
(b − a) · k fn′ − gk∞ + | fn (x0 ) − A| −→ 0. (8.14)
❑
Wir können das nun auf Taylorreihen anwenden.
P
8.7.5 Proposition. Sei ∞ a zn eine Potenzreihe mit Konvergenzradius R > 0. Dann
P∞ n=0 n
hat die Potenzreihe n=0 (n + 1)an+1 zn hat denselben Konvergenzradius R.
Die Funktion
X
∞
f : (−R, R) → C, f (t) = an t n
n=0
ist auf (−R, R) differenzierbar und hat die Ableitung
X
∞
f ′ (x) = (n + 1)an+1 xn .
n=0
Sie ist sogar beliebig oft differenzierbar mit (l ∈ N)

X
∞
f (l) (x) = (n + l) · · · (n + 1)an+l xn , (8.15)
n=0
wobei auch diese Potenzreihe Konvergenzradius R hat. Insbesondere gilt
f (l) (0) = l!al .

P
Beweis. Dass der Konvergenzradius von ∞ n
n=0 (n + 1)an+1 z auch R ist, prüft man ent-
P
weder mit Hilfe des Majorantenkriteriums durch einen Vergleich mit ∞ n
n=0 |an z | nach,
oder man zeigt, dass
1 1
√n = lim sup n+1
√ = R,
lim supn→∞ |(n + 1)an+1 | n→∞ |an+1 |
vgl. Satz 6.7.8 und Lemma 7.3.1.
Für jedes feste r ∈ (0, R) konvergiert wegen Satz 6.7.8 die Funktionenfolge
PN
( n=0 an tn )N∈N auf [−r, r] gleichmäßig gegen f . Analog konvergiert die Funktionen-
PN
folge ( n=0 (n + 1)an+1 tn )N∈N auf [−r, r] gleichmäßig und zwar wegen Korollar 8.7.4
′
gegen f . Da r < R beliebig war, folgt die Behauptung.
Die Verallgemeinerung in (8.15) folgt nun leicht durch vollständige Induktion.
❑
8.7.6 Beispiel. Für x ∈ (−1, 1) ist die Funktion x 7→ ln(1 − x) beliebig oft differenzier-
P
bar. Da ln(1 − x)′ = − 1−x1
=− ∞ n
n=1 x nach Proposition 8.7.5 mit der Ableitung von
P∞ xn P xn
x 7→ − n=1 n , x ∈ (−1, 1) übereinstimmt, und da ln(1 − x) und − ∞ n=1 n für x = 0
beide den Wert Null annehmen, folgt aus Korollar 7.2.7, dass
X∞
xn
ln(1 − x) = − für alle x ∈ (−1, 1).
n=1
n
P∞ (−1)n
Da diese Reihe auch für x = −1 (bedingt) konvergiert, folgt aus Satz 6.7.13, dass − n=1 n = ln(2).
Als Vorspiel zum nächsten Ergebnis wollen wir uns kurz mit dem Produkt zweier
metrischer Räume beschäftigen.
8.7.7 Fakta.
1. Seien (X, dX ) und (Y, dY ) zwei metrische Räume. Ist X × Y die Menge aller ge-
ordneten Paare, und definiert man

d (a, b), (x, y) := max(dX (a, x), dY (b, y)), (8.16)
so sieht man unmittelbar, dass (X × Y, d) ein metrischer Raum ist, und dass
(xn , yn ) → (x, y) genau dann, wenn xn → x und yn → y.
2. Sind K1 ⊆ X und K2 ⊆ Y jeweils kompakt, so ist es auch K1 × K2 , denn ist

(xn , yn ) n∈N eine Folge in K1 × K2 , so gibt es eine Teilfolge (xn(k) )k∈N , sodass
xn(k) → x ∈ K1 und weiter eine Teilfolge (yn(k( j)) ) j∈N mit yn(k( j)) → y ∈ K2 , also
(xn(k( j)) , yn(k( j)) ) → (x, y).
3. Die offene Kugel Uǫ (a, b) um ein (a, b) ∈ X × Y ist nichts anderes als

Uǫ (a) × Uǫ (b), da d (a, b), (x, y) = max(dX (a, x), dY (b, y)) < ǫ ⇔ dX (a, x) <
ǫ ∧ dY (b, y) < ǫ.
4. Sind O1 ⊆ X, O2 ⊆ Y offen, so auch O1 × O2 ⊆ X × Y, da es zu (a, b) ∈ X × Y

sicherlich ein ǫ > 0 mit Uǫ (a) ⊆ O1 und Uǫ (b) ⊆ O2 gibt, und dann Uǫ (a, b) ⊆
O1 × O2 .
5. Die Definition von d∞ auf R p passt genau in dieses Bild, denn haben wir p1 +
p2 = p, und sind sowohl R p1 als auch R p2 versehen mit d∞ , und versieht man
R p = R p1 × R p2 mit der Metrik aus (8.16), so erhält man genau wieder d∞ .
8.7.8 Korollar. Ist f : [a, b] × K → R (C) stetig, wobei K eine kompakte Teilmenge
eines metrischen Raumes (Y, dY ) ist, so ist auch die Funktion (Parameterintegral) R :
K → R (C), wobei Z b
R(t) = f (s, t) ds,
a
stetig.
Beweis. Zunächst ist [a, b] × K eine kompakte Teilmenge von R × Y. Somit ist die
Funktion f sogar gleichmäßig stetig (vgl. Satz 6.3.3). Zu gegebenen ǫ > 0 gibt es
somit ein δ > 0, sodass

d (s, t), (s′ , t′ ) < δ ⇒ | f (s, t) − f (s′ , t′ )| < ǫ.
Insbesondere dY (t, t′ ) < δ ⇒ | f (s, t) − f (s, t′ )| < ǫ und somit d∞ ( f (., t) − f (., t′ )) ≤ ǫ.
Somit folgt für t0 ∈ K, dass f (., t) → f (., t0 ) gleichmäßig, wenn t → t0 . Wegen Satz
8.7.2 gilt daher für das Netz ( f (s, t))t∈K\{t0 } von Funktionen auf [a, b], geordnet durch
t1 t2 ⇔ dY (t0 , t1 ) ≥ dY (t0 , t2 ),
Z b Z b Z b
lim R(t) = lim f (s, t) ds = lim f (s, t) ds = f (s, t0 ) ds = R(t0 ).
t→t0 t→t0 a a t→t0 a
Also ist R stetig bei einem beliebigen Punkt t0 .

❑
Mit unserem Grenzwertvertauschungssatz lässt sich auch die Vertauschbarkeit der
Integrationsreihenfolge zeigen.
8.7.9 Satz (Satz von Fubini). Ist f : [a, b] × [c, d] → R (C) stetig, so gilt
Z b Z d ! Z d Z b !
f (s, t)dt ds = f (s, t)ds dt.
a c c a
Beweis. Die Existenz der inneren und der äußeren Integrale wird durch Korollar 8.7.8
gewährleistet.
Sei I = R die Menge aller Riemann-Zerlegungen von [a, b] und sei J = P
die Menge aller Riemann-Zerlegungen von [c, d] beide gerichtet mit der durch die
n(R)
Feinheit induzierten Ordnung. Wir definieren für R = (ξ j )n(R)
j=0 ; (α j ) j=1 und P =

(η j )n(P) n(P)
j=0 ; (β j ) j=1
n(R) X
X n(P)
H(R, P) := (ξ j − ξ j−1 )(ηk − ηk−1 ) f (α j , βk ), (8.17)
j=1 k=1
und bemerken, dass

n(R) 
X
n(P) X 
H(R, P) = (ηk − ηk−1 )  (ξ j − ξ j−1 ) f (α j , βk ) = S (S ( f1 , R), P),
k=1 j=1
wobei f1 die Funktion f mit festgehaltener zweiter Variablen ist, und S ( f1 , R) als
Funktion eben dieser Variable aus [c, d] betrachtet wird. Entsprechend gilt H(R, P) =
S (S ( f2 , P), R).
Wegen (8.10) gilt
|H(R, P) − H(R, P1 )| = |S (S ( f1 , R), P) − S (S ( f1 , R), P1 )| ≤ (8.18)
2(d − c) · sup{ |S ( f1 , R)(t) − S ( f1 , R)(t′ )| : t, t′ ∈ [c, d], |t − t′ | ≤ max(|P1 |, |P|) }.

Außerdem ist wegen Lemma 8.2.9, (ii),

|S ( f1 , R)(t) − S ( f1 , R)(t′ )| = S f (, t) − f (., t′ ) , R ≤ (b − a) · k f (., t) − f (., t′ )k∞ .
Da unsere Funktion f gleichmäßig stetig ist, gibt es zu gegebenen ǫ > 0 ein δ > 0,
sodass k f (., t) − f (., t′ )k∞ ≤ ǫ. Aus (8.18) folgt dann
|H(R, P) − H(R, P1 )| ≤ 2(d − c)(b − a)ǫ,

wenn nur |P1 |, |P| < δ. Somit ist H(., P) P∈J ein Cauchy-Netz in B(I, C)9 und kon-
vergiert daher wegen Lemma 8.3.2 in B(I, C) bzgl. d∞ , also gleichmäßig gegen eine
Funktion h : I → C, wobei
h(R) = lim H(R, P) = lim S (S ( f2 , P), R) =

|P|→0 |P|→0
Z d
S ( lim S ( f2 , P), R) = S ( f (., t) dt, R).
|P|→0 c
Daraus folgt
Z d Z b Z d !
lim lim H(R, P) = lim S ( f (., t) dt, R) = f (s, t)dt ds.
|R|→0 |P|→0 |R|→0 c a c
Wegen der gleichmäßigen Konvergenz können wir nun Lemma 8.7.1 anwenden und
erhalten
lim lim H(R, P) = lim lim H(R, P),
|R|→0 |P|→0 |P|→0 |R|→0
R d R b
wobei letzterer Doppellimes aus Symmetriegründen c a
f (s, t)ds dt ist.
❑
9 Das ist der vollständig metrische Raum aller auf I beschränkten C-wertigen Funktionen versehen mit
d∞ , vgl. Definition 6.6.3.

8.7.10 Bemerkung. Ist eine stetige reell- oder komplexwertige Funktion auf einem
Q
Quader pj=1 [a j , b j ] = [a1 , b1 ] × · · · × [a p , b p ] ⊆ R p definiert, so ist wegen Korollar
R bp Q p−1
8.7.8 (t j ) p−1
j=1 7→ a p f (t1 , . . . , t p−1 , s) ds stetig auf j=1 [a j , b j ] ⊆ R
p−1
.
Nun kann man nach der vorletzten Variablen integrieren, dann nach der vorvorletz-
ten, usw. . Schließlich erhält man.
Z b1 Z bp
... f (t1 , . . . , t p ) dt p . . . dt1 . (8.19)
a1 ap
Wendet man Satz 8.7.9 mehrere male an, so sieht man, dass es hier nicht auf die Inte-
grationsreihenfolge ankommt.
Man kann das als Ausgangspunkt für die Integrationstheorie für Funktionen, die auf
Q
einem Rechteck oder allgemeiner über einem Quader Q = pj=1 [a j , b j ] ⊆ R p definiert
sind, nehmen, indem man Z
f (t)dt
Q
als (8.19) definiert. Dieser Ausdruck hängt zumindest für stetige f nicht von der Inte-
grationsreihenfolge ab, ist also in einem gewissen Sinne sinnvoll definiert.
Größere Probleme tauchen auf, wenn man etwa das Integral einer stetigen Funk-
tion über einen Kreis definieren will. Solche Integrale werden wir in der Analysis 3
Vorlesung behandeln.
Als Folgerung erhält man unmittelbar eine Aussage über die Differenzierbarkeit
von Parameterintegralen.
8.7.11 Korollar. Sei f : [a, b] × [c, d] → R(C) stetig und so, dass die Ableitung nach
der ersten Variablen für alle (s, t) ∈ [a, b] × [c, d] existiert, und dass
d
f (s, t)10 ,
f1 (s, t) =
ds
Rd
ebenfalls stetig ist. Dann ist die Funktion s 7→ c f (s, t) dt für s ∈ [a, b] stetig differen-
zierbar mit der Ableitung
Z d Z d
d
f (s, t) dt = f1 (s, t) dt. (8.20)
ds c c
Beweis. Wegen Satz 8.7.9 und dem zweiten Hauptsatz gilt

Z xZ d Z dZ x Z d
f1 (s, t) dtds = f1 (s, t) dsdt = ( f (x, t) − f (a, t)) dt.
a c c a c
Differenziert man diese Gleichung nach der Variablen x, so erhält man (8.20). Dass
(8.20) stetig von s ∈ [a, b] abhängt, folgt aus Korollar 8.7.8.
❑
8.7.12 Beispiel. Als Anwendung der Grenzwertvertauschungen wollen wir folgende
besonders in der Statistik und Wahrscheinlichkeitstheorie wichtige Tatsache zeigen:
Z +∞
2 √
e−t dt = π. (8.21)
−∞
10 Dafür ∂
werden wir später ∂s f (s, t) schreiben.
Dazu betrachte man (x ∈ [0, C] mit C > 0 beliebig)

Z 1 2 2
π e−x (t +1)
F(x) = − dt. (8.22)
4 0 t2 + 1
2 2
Die Ableitung des Integranden nach x ist −2xe−x (t +1) . Somit ist diese und offensicht-
lich der Integrand selber auf [0, C] × [0, 1] stetig. Aus Korollar 8.7.11 schließen wir
Z 1
′ −x2 2 2
F (x) = 2xe e−x t dt.
0
Außerdem gilt
Z 1
π 1 π
F(0) = − 2
dt = − arctan |10 = 0.
4 0 t +1 4
R x 2 2 2
Rx 2
Ist andererseits G(x) = 0 e−t dt , so gilt G′ (x) = 2e−x 0 e−t dt, und aus der Sub-
stitutionsregel folgt F ′ (x) = G′ (x). Wegen G(0) = 0 = F(0) folgt F(x) = G(x) und
zwar für alle x ≥ 0, da ja C > 0 beliebig war.
−x2 (t 2 +1) 2
Wegen e t2 +1 ≤ e−x konvergiert der Integrand in (8.22) für x → +∞ gleichmäßig
gegen die Nullfunktion, und mit Satz 8.7.2 erhält man
π
lim G(x) = lim F(x) = .
x→+∞ x→+∞ 4
Aus der Stetigkeit der Wurzelfunktion folgt
Z x √
2 π
lim e−t dt = ,
x→+∞ 0 2
und damit (8.21).
8.7.13 Beispiel. Wir betrachten die Funktion
Z +∞ Z 1 Z β
sin x −xt sin x −xt sin x −xt
F(t) = · e dx := lim · e dx + lim · e dx.
0 x γ→0+ γ x β→+∞ 1 x
Diese ist wohldefiniert für t ∈ [0, +∞), da obiges uneigentliches Integral für alle t ≥ 0
konvergiert, wobei es aber nur für t > 0 absolut konvergiert.
Man beachte dabei auch, dass 0 nicht wirklich eine Uneigentlichkeitsstelle obigen
Integrales ist, da sich die Funktion g(x) := sinx x , x ∈ (0, +∞) stetig auf [0, +∞) durch
g(0) := 1 = lim x→0+ sinx x fortsetzen lässt. Also gilt nach dem Hauptsatz der Differential-
und Integralrechnung
Z 1 Z 1
sin x −xt
lim · e dx = g(x) · e−xt dx.
δ→0+ δ x 0
Man beachte, dass das Netz (α > 1)

Z α
sin x −xt
Fα (t) = · e dx
1
α
x
von Funktionen auf [0, +∞). Es konvergiert

punktweise
gegen F(t).
Weiters wollen wir bemerken, dass sinx x ≤ 1, x > 0, da die Funktion sin x − x
bei Null verschwindet, und auf [0, +∞) eine Ableitung kleiner gleich Null hat und

somit monoton fallend ist. Also gilt sin x − x ≤ 0, x ∈ [0, +∞) und daher sinx x ≤ 1
sicher für x ∈ (0, 1]. Für x > 1 ist diese Ungleichung
klarerweise auch richtig, da
| sin x| ≤ 1, x ∈ R, und für x < 0 gilt sinx x = sin(−x)
−x
.
Wir wollen nun limt→+∞ F(t) berechnen. Dazu betrachten wir F(t) für t ∈ [δ, +∞)
für ein festes δ > 0, und bemerken, dass für t ≥ δ
Z 1 Z β
α sin x
−xt sin x −xt
|F(t) − Fα (t)| = lim · e dx + lim · e dx ≤
γ→0+ γ x β→+∞ α x
Z 1 Z β
α
lim e−δx dx + lim e−δx dx =
γ→0+ γ β→+∞ α
Z 1 Z +∞ 1
α
−δx 1 − e− α + e−α
( + )e dx = .
0 α δ
Der Ausdruck rechts konvergiert für α → +∞ gegen 0 und zwar unabhängig von t ∈
[δ, +∞). Also konvergiert Fα gegen F gleichmäßig auf [δ, +∞).
Andererseits gilt nach Satz 8.7.2 für ein festes α > 1
Z α
sin x −xt
lim Fα (t) = lim · e dx =
t→+∞ t→+∞ 1
α
x
Z α Z α
sin x −xt
lim · e dx = 0 dx = 0,
1 t→+∞ x 1
α α

da wegen sinx x · e−xt ≤ e−t α das Netz von Funktionen x 7→ sinx x · e−xt , x ∈ [ α1 , α] für
1
t → +∞ gleichmäßig gegen 0 konvergiert.

Setzen wir also H(t, α) := Fα (t) für (t, α) ∈ [δ, +∞)×(1, +∞), wobei diese Intervalle
jeweils gegen +∞ gereichtet sind, so folgt aus Lemma 8.7.1
lim F(t) = lim lim Fα (t) = lim lim Fα (t) = lim 0 = 0.

t→+∞ t→+∞ α→+∞ α→+∞ t→+∞ α→+∞
Nun wollen wir F ′ (t) für t > 0 berechnen. Dazu halten wir wieder δ > 0 fest und
betrachten t ∈ [δ, +∞). Wir wissen schon, dass Fα → F und zwar gleichmäßig auf
dieser Menge. Betrachten wir nun für ein festes α > 1 die das Integral
Z α
sin x −xt
Fα (t) = · e dx,
1
α
x
so ist der Integrand stetig in (x, t) ∈ [ α1 , α] × [δ, +∞), und auch die Ableitung
∂ sin x −xt
· e = − sin x · e−xt
∂t x
des Integranden nach t (∈ [δ, +∞)) ist stetig in (x, t) ∈ [ α1 , α] × [δ, +∞). Also gilt nach
Korollar 8.7.11 Z α
Fα′ (t) = − sin x · e−xt dx.
1
α
Wegen (t ∈ [δ, +∞))

Z +∞ Z α

−xt
− sin x · e dx − − sin x · e dx ≤
−xt
0 1
α
Z 1 Z +∞ 1
α 1 − e− α + e−α
( + ) e−δx dx =
0 α δ
konvergiert Fα′ (t) für α → +∞ unabhängig von t, daher gleichmäßig in t ∈ [δ, +∞),
gegen
Z +∞
− sin x · e−xt dx.
0
Nach Korollar 8.7.4 ist daher das genau die Ableitung von F(t). Wegen (Stammfunkti-
on in x)
Z
1
− sin x · e−xt = (t sin x + cos x)e−xt + c
1 + t2
folgt F ′ (t) = − 1+t

1
2 , t > 0, und somit F(t) = C − arctan x, x ∈ (0, +∞) für ein festes
reelles C. Lässt man t gegen +∞ streben, so sieht man, dass C = π2 .

Schließlich gilt für t ≥ 011
Z 1 Z +∞
sin x −xt 1 −xt
F(t) = · e dx + · e sin x dx.
0 x 1 x
Das erste Integral ist gemäß Korollar 8.7.8 stetig auf [0, 1]. Für das zweite stimmt nach
einer partiallen Integraltion überein mit
" #β Z β
1 t sin x + cos x −xt 1 t sin x + cos x −xt
lim − 2
e − lim e dx. (8.23)
β→+∞ x 1+t β→+∞ 1 x2 1 + t2
1
Man beachte, dass der erste Grenzwert genau
t sin 1 + cos 1 −t
e
1 + t2

x+cos x −xt
ist, und somit auch stetig auf [0, +∞) ist. Wegen t sin1+t 2 e ≤ 1 gilt für t ≥ 0
Z +∞ Z β Z +∞
1 t sin x + cos x −xt 1 t sin x + cos x −xt 1
e dx − e dx ≤ dx.
1 x 2 1+t 2
1 x
2 1+t 2 β x2
Also konvergiert das Netz

Z β
1 t sin x + cos x −xt
e dx
1 x2 1 + t2
von stetigen (siehe Korollar 8.7.6) Funktion in t ∈ [0, +∞) gleichmäßig gegen den
zweiten Grenzwert aus (8.23). Also ist auch dieser stetig (vgl. Korollar 6.6.11). Damit
haben wir die Stetigkeit von F(t) auf ganz [0, +∞) nachgewiesen.
Da aber F(t) = π2 − arctan t für t > 0 folgt für t → 0+ die Gleichung
Z +∞
sin x π
dx = F(0) = .
0 x 2
11 Man sin x
denke sich wieder x bei x = 0 zu eins fortgesetzt.
8.8 Mittelwertsätze
Folgende Tatsache liegt unmittelbar auf der Hand.
8.8.1 Satz (Mittelwertsatz der Integralrechnung). Sei f eine reelle und Riemann-
integrierbare Funktion auf [a, b]. Dann existiert ein µ ∈ [inf t∈[a,b] f (t), supt∈[a,b] f (t)]
mit
Zb
f (t) dt = µ(b − a). (8.24)
a
Ist f stetig, so gibt es ein x ∈ [a, b], sodass µ = f (x).
Beweis. Aus inf t∈[a,b] f (t) ≤ f (s) ≤ supt∈[a,b] f (t) folgt nach Lemma 8.2.9 durch Inte-
gration nach s
Zb
(b − a) · inf f (t) ≤ f (s) ds ≤ (b − a) · sup f (t),
t∈[a,b] t∈[a,b]
a
und damit unmittelbar (8.24). Für ein stetiges f ist nach dem Zwischenwertsatz
f (x) = µ für ein x ∈ [a, b].
❑
Dieser Beweis lässt sich leicht so umändern, dass man folgenden Satz erhält.
8.8.2 Satz (Erweiterter Mittelwertsatz der Integralrechnung). Seien f und g reelle und
Riemann-integrierbare Funktion auf [a, b], wobei g(t) ≥ 0, t ∈ [a, b]. Dann existiert
ein µ ∈ [inf t∈[a,b] f (t), supt∈[a,b] f (t)] mit
Zb Zb
f (t)g(t) dt = µ g(t) dt. (8.25)
a a
Ist f stetig, so gibt es ein x ∈ [a, b], sodass µ = f (x).
Beweis. Man betrachte die Ungleichung
g(s) inf f (t) ≤ g(s) f (s) ≤ g(s) sup f (t),

t∈[a,b] t∈[a,b]
und integriere alle Funktionen nach s. Nach Lemma 8.2.9 erfüllen die Integrale die
selbe Ungleichungskette. Daraus folgt unmittelbar (8.25). Für ein stetiges f ist nach
dem Zwischenwertsatz f (x) = µ für ein x ∈ [a, b].
❑
Als eine Anwendung beweisen wir die Taylorsche Formel (vgl. Satz 7.3.6) mit
einem Restglied in Integralform. Dabei sind die Voraussetzungen etwas stärker.
8.8.3 Beispiel. Sei I ⊆ R ein Intervall mit den Randpunkten a, b, a < b, und sei
n ∈ N ∪ {0}. Weiters sei f : I → R mit f ∈ Cn+1 (I).
Seien x, y ∈ I, x , y. Dann gilt
f ′ (y) f ′′ (y) f (n) (y)

f (x) = f (y) + (x − y) + (x − y)2 + · · · + (x − y)n +
1! 2! n!
8.8. MITTELWERTSÄTZE 31
Zx
(x − t)n
+ f (n+1) (t) dt.
n!
y
Um diese Formel einzusehen, starten wir mit

Zx
f (x) − f (y) = f ′ (t) dt,
y
und integrieren partiell:

Zx Zx
′ ′
f (x) − f (y) = − f (t)(−1) dt = f (y)(x − y) + f ′′ (t)(x − t) dt =
y y
Zx
′ (x − y)2
′′ (x − t)2
= f (y)(x − y) + f (y) + f ′′′ (t) dt =
2 2
y
X
n Zx
(x − y)k (x − t)n
= ··· = f (k) (y) + f (n+1) (t) dt.
k=1
k! n!
y
n+1
Mit dem Satz 8.8.2 folgt, dass sich das Restglied in der Form f (n+1) (ξ) (x−y)
(n+1)! für ein
geeignetes ξ ∈ [min(x, y), max(x, y)] schreiben lässt (vgl. Satz 7.3.6).
Kapitel 9
Normen, Banachräume und

Fourierreihen
9.1 Normierte Räume

In diesem Kapitel wollen wir eine spezielle Klasse von metrischen Räumen betrachten.
Diese Räume stellen eine Schnittstelle zwischen Linearer Algebra und Analysis dar.
9.1.1 Definition. Sei X ein Vektorraum über R (C). Eine Abbildung k.k : X → [0, ∞)
heißt Norm, wenn gilt:
(i) Dreiecksungleichung: kx + yk ≤ kxk + kyk, x, y ∈ X.
(ii) kλxk = |λ| · kxk, x ∈ X, λ ∈ R (∈ C).
(iii) kxk > 0 für alle x , 0.
Ist auf dem Vektorraum X eine Norm gegeben, so spricht man von (X, k · k) als einem
normierten Raum.
Ist X ein normierter Raum, so folgt unmittelbar aus den Eigenschaften einer Norm,
dass
d(x, y) := kx − yk, x, y ∈ X , (9.1)

eine Metrik auf X ist. Diese Metrik hat ganz spezielle Eigenschaften.
9.1.2 Lemma. Sei (X, k · k) ein normierter Raum, und seien (xn )n∈N , (yn )n∈N Folgen in
X, x, y ∈ X, und (λn )n∈N eine Folge bzw. λ ein Element im Skalarkörper von X, also in
R bzw. C. Ist xn → x, yn → y, λn → λ für n → ∞, so folgt
lim kxn k = kxk, lim xn + yn = x + y, lim λn xn = λx.

n→∞ n→∞ n→∞
Entsprechende Aussagen gelten auch für Netze.

Beweis. Den Beweis führt man genauso, wie für Folgen von Zahlen. Die erste Glei-
chung folgt aus Lemma 3.2.12 wegen kxn k = d(xn , 0) → d(x, 0) = kxk.
Wir zeigen nur noch die dritte Grenzwertbeziehung. Die zweite ist noch einfacher
zu verifizieren.
33
34 KAPITEL 9. NORMEN, BANACHRÄUME UND FOURIERREIHEN
Zu ǫ > 0 mit oBdA. ǫ < 1 gibt es ein N ∈ N, sodass |λ − λn |, kxn − xk < ǫ für alle
n ≥ N. Es folgt kxn k ≤ kxn − xk + kxk < 1 + kxk und damit
kλn xn − λxk ≤ kλn xn − λxn k + kλxn − λxk = |λn − λ|kxn k + |λ|kxn − xk ≤ (1 + kxk + |λ|)ǫ.
Wir sehen also, dass λn xn → λx.

❑
9.1.3 Korollar. Sei (X, k · k) ein normierter und (Y, d) ein metrischer Raum, und seien
f, g : D → X und λ : D → R (C) stetig, wobei D ⊆ Y. Dann sind auch λ f und f + g
stetige Funktionen von D nach X.
Beweis. Aus yn → y in (Y, d) folgt wegen der Stetigkeit f (yn ) → f (y) und g(yn ) → g(y)
in (X, k·k). Aus Lemma 9.1.2 folgt ( f +g)(yn ) = f (yn ) +g(yn) → f (y) +g(y) = ( f +g)(y)
und mit Proposition 6.1.4 die Stetigkeit von f + g. Entsprechend zeigt man die Stetig-
keit von λ f .
❑
9.1.4 Definition. Ist die von (X, k·k) erzeugte Metrik vollständig, so heißt der normierte
Raum Banachraum.
9.1.5 Beispiel.
(i) Klarerweise ist (R, |.|) ein Banachraum über R. (C, |.|) ist auch ein Banachraum,
wobei man ihn als Vektorraum über C und als Vektorraum über R betrachten
kann.
p
qP Paradebeispiel eines normierten Raumes über R ist (R , k.k2 ), wobei kxk2 :=
(ii) Das
p 2 1 T
j=1 |x j | . Dabei ist x = (x1 , . . . , x p ) . Die erzeugte Metrik ist die wohlbe-
kannte Euklidische Metrik:
v
u
tX p
d2 (x, y) = kx − yk2 = |x j − y j |2 .
j=1
qP
p
(iii) Man kann auch den normierten Raum (C p , k.k2 ) über C mit kzk2 := j=1 |z j |
2
betrachten, wobei z = (z1 , . . . , z p ).

Identifiziert man dabei die j-te Komponente z j mit dem Paar (Re z j , Im z j ), so
sieht man leicht, dass sich C p mit R2p identifizieren lässt. Wegen
v
u
tX v
u
tX
p p X
p
|z j |2 = | Re z j |2 + | Im z j |2 ,
j=1 j=1 j=1
bleiben dabei auch die Normen erhalten.

P
(iv) Man kann auch R p mit anderen Normen versehen: kxk1 := pj=1 |x j |, kxk∞ :=
max pj=1 |x j |. Die dazugehörigen Metriken sind gerade die wohlbekannten Metri-
ken d1 und d∞ .
1 Ab hier wollen wir die Elemente von R p als stehende Vektoren betrachten.
9.1. NORMIERTE RÄUME 35
9.1.6 Bemerkung. Wir wissen schon aus dem ersten Semester, dass R p versehen mit
einer der Metriken d1 , d2 , d∞ vollständig ist. Somit sind obige Beispiele Banachräume.
Außerdem haben wir gesehen, dass die Konvergenz einer Folge in R p (bzgl. einer dieser
Metriken) äquivalent zur komponentenweisen Konvergenz ist:
xk → x ⇔ xk, j → x j , j = 1, . . . , p. (9.2)
Eine Konsequenz daraus ist, dass eine Funktion f : D → R p , wobei D Teilmenge eines
metrischen Raumes (X, d) ist, genau dann stetig ist, wenn alle Komponentenfunktionen
f j : D → R, j = 1, . . . , p stetig sind. Dabei ist
 
 f1 (x) 
 
f (x) =  ...  .
 
f p (x)
Diese Tatsache kann man auch etwas struktureller betrachten. Bezeichne mit π j , j =
1, . . . , p, die j-te Projektion



 Rp → R

  


  x1 
 
πj : 

 x =  ..  7→ x .


  .  j

 
xp
Aus (9.2) folgert man leicht, dass π j stetig ist. Das haben wir aber auch schon in Bei-
spiel 6.1.2
Mit obiger Notation gilt f j = π j ◦ f , und f ist genau dann stetig, wenn alle π j ◦ f
es sind.
9.1.7 Bemerkung. Für eine Funktionen g : D → X, wobei (X, d) ein metrischer Raum
und D ⊆ R p ist, ist wegen (9.2) die Stetigkeit g nicht abhängig von der auf R p gewähl-
ten Metrik d1 , d2 oder d∞ .
Setzen wir nun voraus, dass g stetig ist. Sei [a, b] ein reelles Intervall, x2 , . . . , x p
fest in R, sodass (t, x2 , . . . , x p )T ∈ D für t ∈ [a, b]. Dann ist auch Funktion h : t 7→
g(t, x2 , . . . , x p )T als Funktion [a, b] → X stetig.
Die gleiche Aussage gilt natürlich, wenn man nicht x1 , sondern eine der Variablen
x2 , x3 , . . . , x p durch t ersetzt.
Diese Tatsache lässt sich auch struktureller betrachten. Mit ιk , k = 1, . . . , p bezeich-
nen wir die Einbettung
(
R → Rp
ιk : .
x 7→ (a1 , . . . , ak−1 , x, ak+1 , . . . , a p )T
Man sieht unmittelbar, dass die ιk ’s alle stetige Funktionen sind. Mit obiger Notation
ist nun h(t) = g(ι1 (t)), falls wir a2 = x2 , . . . , a p = x p setzen. Also sieht man wieder,
dass h stetig ist.
Man könnte nun glauben, dass auch die Umkehrung gilt. Dem ist aber nicht so:
g ◦ ιk stetig für k = 1, . . . , n und alle (a1 , . . . , an )T ∈ D ; g stetig (vgl. Beispiel
9.1.8 oder Beispiel 9.1.9).
9.1.8 Beispiel. Betrachte die Funktion f : R2 → R definiert durch

!   ξη T T
ξ 
 ξ2 +η2 , (ξ, η) , (0, 0)
f := 

η 0 , (ξ, η)T = (0, 0)T

Ist η0 festgehalten, η0 , 0, so ist f ηξ0 offenbar eine stetige Funktion von ξ. Im Fall

η0 = 0 gilt immer f ηξ0 = 0, also ist f ηξ0 auch in diesem Fall stetig in ξ. Genauso

sieht man, dass f ξη0 für jedes feste ξ0 eine stetige Funktion von η ist. Die Funktion f
ist also in jeder der beiden Variablen ξ und η einzeln stetig. Trotzdem
ist f bei (0, 0)T
2 ξ 1
nicht stetig als Funktion f : R → R, denn es gilt offenbar f ξ = 2 für alle ξ , 0.
Man hat in diesem Beispiel also die folgende Situation: läuft der Punkt x gegen 0,
und zwar längs einer der beiden Koordinatenachsen, so strebt f (x) gegen 0. Kommt
x jedoch längs eines anderen Strahls, z.B. längs des Strahles mit 45◦ , so strebt f (x)
nicht gegen 0. Liegt allgemeiner x auf dem Strahl mit Winkel ϕ ∈ [0, 2π), also x =
(r cos ϕ, r sin ϕ)T , so gilt
1
f (x) = cos ϕ sin ϕ = sin 2ϕ.
2
Diese Funktion f kann man sich als folgendermaßen enstanden vorstellen. Man nehme
x
1
f (x) → 2 sin 2ϕ
ϕ x
f (x) → 0
f (x) → 0
x
Abbildung 9.1: Konvergenzverhalten bei geradliniger Annäherung
eine Gerade, z.B. die x-Achse, verdrehe sie und führe sie dabei auf und ab. Die Höhe
in Abhängigkeit des Drehwinkels ϕ ist dann gerade gegeben durch 12 sin 2ϕ.
9.1.9 Beispiel. Wir definieren die Funktion f : R2 → R durch in Polarkoordinaten

durch  2

 r sin ϑ
 r4 +sin4 ϑ , r > 0
f (x) := 
 ,
0 , r=0
wobei x = (r cos ϑ, r sin ϑ)T . Lässt man den Punkt x nun längs eines Strahls gegen 0
streben, d.h. hält man ϑ fest und strebt r → 0, so erhält man stets f (x) → 0.
Um das einzusehen, stellt man im Fall sin ϑ = 0 sofort f ((r cos ϑ, r sin ϑ)T ) = 0
für alle r fest. Im Fall sin ϑ , 0 ist sicher der Nenner r4 + sin4 ϑ ≥ sin4 ϑ > 0. Also
ist limr→0 f ((r cos ϑ, r sin ϑ)T ) = 0. Trotzdem ist f nicht stetig bei 0 als Funktion in
beiden Variablen gleichzeitig, denn strebt x so gegen Null, dass r = sin ϑ, so gilt
1
f (x) = → +∞,
2r
9.1. NORMIERTE RÄUME 37
d.h. f ist nicht einmal beschränkt in einer Umgebung von 0. Man bemerke, dass die
Beziehung r = sin ϑ gerade die Gleichung eines Kreises ist der die x-Achse bei 0
berührt. Nähert man sich in diesem Beispiel also radial an 0 an, so strebt f stets gegen
0. Kommt man jedoch längs der Kreislinie r = sin ϑ, so gilt sogar f (x) → +∞.
x r = sin ϑ
f (x) → 0 x
f (x) → +∞
f (x) → 0
Abbildung 9.2: Funktionsgraphen bei festem Winkel
Ehe wir uns mehr Beispiele normierter bzw. Banachräume anschauen, brauchen
wir ein kleines Lemma.
9.1.10 Lemma. Ist (X, d) ein vollständiger metrischer Raum und ist Y eine abgeschlos-
sene Teilmenge von X, so ist (Y, d|Y×Y ) auch ein vollständiger metrischer Raum.
Ist umgekehrt (Y, d|Y×Y ) vollständig, wobei Y Teilmenge eines metrischen Raumes
(X, d) ist, so ist Y abgeschlossen in X.
Beweis. Klarerweise ist Y versehen mit der eingeschränkten Metrik selber ein metri-
scher Raum.
Ist (xn )n∈N eine Cauchyfolge in Y, so konvergiert diese nach Voraussetzung gegen
ein x ∈ X. Ist nun Y abgeschlossen und enthält daher alle seine Häufungspunkte, so
folgt x ∈ Y.
Ist (xn )n∈N eine Folge in Y, die gegen ein x ∈ X konvergiert, so ist diese sicherlich
eine Cauchy-Folge bzgl. d und somit auch bzgl. d|Y×Y . Ist Y vollständig, so konvergiert
(xn ) bzgl. d|Y×Y und somit auch bzgl. d gegen ein y ∈ Y. Da aber Grenzwerte eindeutig
sind, folgt x = y ∈ Y. Also ist Y abgeschlossen.
❑
Folgende Situation tritt bei der Betrachtung konkreter Räume auf. Ist (X, k · k) ein
normierter Raum und Y ein linearer Unterraum (Untervektorraum), so kann man k.k
auf Y einschränken und erhält wieder einen Normierten Raum.
Ist (X, k · k) ein Banachraum und ist Y als Teilmenge von X abgeschlossen, so muss
nach Lemma 9.1.10 auch (Y, k · k) ein Banachraum sein.
9.1.11 Lemma. Ist (X, k · k) ein normierter Raum und Y ein linearer Unterraum, so ist
der Abschluss c(Y) von Y in X ebenfalls ein linearer Unterraum und somit der kleinste
abgeschlossene Teilraum von X, der Y enthält.
Beweis. Sind x, y ∈ c(Y) und λ, µ ∈ R (C), so gibt es Folgen xn , yn ∈ Y mit

limn→∞ xn = x und limn→∞ yn = y. Wir wissen, dass dann die Folge λxn + µyn ∈ Y
gegen λx + µy konvergiert und somit diese Linearkombination auch in c(Y) liegt.
❑
9.1.12 Beispiel. Wir wollen uns nun weitere Beispiele von normierten Räumen be-
trachten.
(i) Ist E eine nichtleere Menge und (Y, k.kY ) ein normierter Raum. Wir betrachten den
Raum B(E, Y) aller beschränkten Abbildungen von E nach Y. Diesen Raum ha-
ben wir schon im ersten Semester betrachtet (vgl. Definition 6.6.3), wobei aber Y
allgemeiner ein metrischer Raum war. In unserem Fall ist mit Y auch B(E, Y) ein
Vektorraum über dem selben Skalarkörper, wie Y, wobei die Operationen punkt-
weise definiert sind.
Setzen wir für f ∈ B(E, Y)
k f k∞ := sup{k f (x)kY : x ∈ E},
so prüft man leicht nach, dass k f k∞ eine Norm auf B(E, Y) ist. Die von dieser
Norm erzeugte Metrik ist genau die in Definition 6.6.3 eingeführte Metrik
k f − gk∞ = d∞ ( f, g) = sup k f (x) − g(x)kY .

x∈E
Im Falle, dass (Y, k.kY ) ein Banachraum ist, folgt aus Satz 6.6.15, dass
(B(E, Y), d∞) vollständig und damit (B(E, Y), k.k∞) auch ein Banachraum ist.
(ii) Ist E = N und Y = R oder Y = C, so ist B(E, Y) die Menge aller beschränkten
reellen bzw. komplexen Folgen und wird auch als l∞ = l∞ (N) bezeichnet. Diese
sind Banachräume, da R und C vollständig sind.
(iii) Vom Teilraum c0 von l∞ , der aus allen Nullfolgen besteht, kann man leicht zeigen
(Lemma 8.7.1), dass er abgeschlossen ist. Also ist auch (c0 , k.k∞ ). ein Banach-
raum.
(iv) Mit der Notation aus (i) setzen wir noch zusätzlich voraus, dass E ⊆ X, wobei
(X, d) ein metrischer Raum ist, und dass (Y, k.kY ) ein Banachraum ist.
Dann kann man die Menge C(E, Y) aller f ∈ B(E, Y) betrachten, die stetig sind.
Diese Menge stellt einen linearen Unterraum von B(E, Y) dar (siehe Korollar
9.1.3). Somit ist auch (C(E, Y), d∞) ein normierter Raum.
Ist nun ( fn )n∈N eine Folge von Funktionen aus C(E, Y), die bzgl. d∞ gegen ein
f ∈ B(E, Y) konvergiert, so wissen wir aus Korollar 6.6.13, dass auch f stetig
ist, also f ∈ C(E, Y). Somit ist C(E, Y) sogar eine abgeschlossene Teilmenge von
B(E, Y).
Daher ist neben B(E, Y) auch C(E, Y) ein Banachraum, wenn nur (Y, k.kY ) ein
solcher ist.
(v) Ist Y = R oder Y = C, so schreiben wir für den Banachraum C(E, Y) auch C(E).
Ist E etwa [a, b] ⊆ R, so schreiben wir C[a, b].
Auf dem Raum C[a, b] können wir auch andere Normen betrachten. Beispiels-
weise
Z b
k f k1 := | f (t)| dt. (9.3)
a
Diese Norm unterscheidet sich von k.k∞ wesentlich, denn es gibt bzgl. k.k1
Cauchyfolgen, die bezgl. k.k∞ keine sind. Daraus kann man herleiten, dass
bezüglich k.k1 C[a, b] kein Banachraum ist.
9.2. LINEARE ABBILDUNGEN 39
(vi) Sind (X, k.kX ) und (Y, k.kY ) zwei normierte Räume über dem selben Körper R oder
C, so auch (X × Y, k.kmax ), wobei
k(x, y)kmax = max{kxkX , kykY }.
In der Tat ist X × Y ein Vektorraum, und die Axiome, die für eine Norm erfüllt
sein müssen, lassen sich auch ganz leicht nachweisen.
Die Konstruktion ist analog der von R2 mit k.k∞ . Auch hier ist eine Folge

(xn , yn ) n∈N in X ×Y konvergent gegen (x, y) bzw. eine Cauchy-Folge genau dann,
wenn (xn )n∈N und (yn )n∈N gegen x und y konvergiert bzw. beide Cauchy-Folgen
sind.
Damit sieht man auch, dass (X × Y, k.kmax ) ein Banachraum ist, wenn X und Y es
sind.
(vii) Ist im vorigen Beispiel X = Y, so folgt aus Lemma 9.1.2, dass die Abbildung
+ : X × X → X stetig ist.
9.2 Lineare Abbildungen

9.2.1 Definition. Zwei Normen k.k1 und k.k2 auf einem linearen Raum X heißen äqui-
valent, falls es Konstanten α > 0, β > 0 gibt sodass
αkxk1 ≤ kxk2 ≤ βkxk1 , x ∈ X.
Betrachtet man die Definition der Konvergenz einer Folge, so sieht man, dass äqui-
valente Normen die gleichen konvergenten Folgen haben (die gleichen abgeschlosse-
nen und offenen Mengen, die gleichen Cauchy-Folgen, etc.).
9.2.2 Beispiel.
(i) Sei X = R p . Die Normen k.k∞ , k.k2 und k.k1 sind äquivalent, denn es gilt
((x1 , . . . , x p )T ∈ X = R p )
X
p
1
X
p
max |xi | ≤ ( |xi |2 ) 2 ≤ |xi | ≤ p · max |xi |.
i=1,...,p i=1,...,p
i=1 i=1
Man kann zeigen, dass auf R p alle Normen äquivalent sind. Insbesondere ist R p
mit jeder Norm vollständig.
(ii) Betrachte auf X = C([0, 1]) neben der Supremumsnorm k.k∞ noch die Norm aus
(9.3). Diese beiden Normen sind nicht äquivalent. Es gilt zwar k f k1 ≤ k f k∞ , aber
es gibt kein β > 0, sodass k f k∞ ≤ βk f k1 gleichzeitig für alle f ∈ C([0, 1]). Um
das einzusehen, betrachte
(
1 − n t , t ∈ [0, n1 ],
fn (t) = .
0 , t ∈ [ n1 , 1]
1
Dabei ist k fn k∞ = 1, aber k fn k1 ≤ 2n .
Thematisch verwandt mit der Äquivalenz von Normen ist der Begriff der Be-
schränktheit einer linearen Abbildung.
9.2.3 Definition. Seien (X, k.kX ) und (Y, k.kY ) zwei normierte Räume, und sei A : X →
Y eine lineare Abbildung. Dann heißt A beschränkt , wenn es ein C ≥ 0 gibt, sodass
kAxkY ≤ CkxkX , für alle x ∈ X. (9.4)
Ist A beschränkt, so sei kAk die kleinst mögliche aller dieser Konstanten C in (9.4), und
diese heißt Abbildungsnorm von A.
9.2.4 Bemerkung. Ist A beschränkt, so gibt es tatsächlich eine kleinste Konstante C ≥ 0,
sodass (9.4) gilt. In der Tat gilt (9.4) genau dann, wenn
kAxkY
C≥ , für alle x ∈ X \ {0},
kxkX
n o
also genau dann, wenn C obere Schranke von kAxk kxkX : x ∈ X \ {0} ist. Also ist kAk die
Y
kleinste obere Schranke dieser Menge. Wegen kAxk 1 1

kxkX = kA( kxkX x)kY und k kxkX xkX = 1
Y
sieht man unmittelbar, dass auch

( )
kAxkY
kAk = sup : x ∈ X \ {0} =
kxkX
sup{kAxkY : x ∈ X, kxkX = 1} = sup{kAxkY : x ∈ X, kxkX ≤ 1}.

Wegen dieser Gleichung folgt ganz leicht, dass A = 0 ⇔ kAk = 0.
Aus obiger Definition sieht man unmittelbar, dass zwei Normen k.k1 und k.k2 auf
einem Vektorraum genau dann äquivalent sind, wenn idX sowohl als Abbildung von
(X, k.k1 ) nach (X, k.k2 ) als auch als Abbildung von (X, k.k2 ) nach (X, k.k1 ) beschränkt ist.
9.2.5 Satz. Eine lineare Abbildung A : X → Y ist genau dann stetig, wenn sie be-
schränkt ist. Ist das der Fall, so ist sie sogar gleichmäßig stetig.
Beweis. Ist A die Nullabbildung, so folgt die Behauptung unmittelbar. Also sei A , 0.
ǫ
Sei A beschränkt. Ist ǫ > 0 und ist kx − yk < kAk , so folgt
kAx − Ayk = kA(x − y)k ≤ kAk · kx − yk < ǫ.
Also ist A gleichmäßig stetig und daher insbesondere stetig.

Ist umgekehrt A stetig, sodass kxk ≤ δ ⇒ kAxk ≤ 1.
so gibt es ein δ > 0 zu ǫ = 1,
Ist x ∈ X beliebig, so ist kxk x ≤ δ, und somit A( kxk x) ≤ 1 bzw. kAxk ≤ kxk
δ δ
δ .
❑
9.2.6 Satz. Die Menge L(X, Y) aller beschränkten linearen Abbildungen, wobei
(X, k.kX ) und (Y, k.kY ) zwei normierte Räume sind, versehen mit der Abbildungsnorm
k.k, ist selber ein normierter Raum.
Ist (Y, k.kY ) ein Banachraum, so auch (L(X, Y), k.k).
Beweis. Klarerweise ist L(X, Y) ein Vektorraum. Außerdem haben wir schon gesehen
(Bemerkung 9.2.4), dass kAk = 0 ⇔ A = 0. Die beiden anderen Norm-Eigenschaften
folgen aus (A, B ∈ L(X, Y), λ ∈ R (C))
kλAk = sup{kλAxkY : x ∈ X, kxkX ≤ 1} =
|λ| · sup{kAxkY : x ∈ X, kxkX ≤ 1} = |λ| · k Ak,

9.2. LINEARE ABBILDUNGEN 41
k(A + B)xkY ≤ kAx + BxkY ≤ kAxkY + kBxkY ≤

kAk · kxkX + kBk · kxkX = (kAk + kBk)kxkX .
Um die Vollständigkeit zu zeigen, könnten wir direkt vorgehen. Wir werden uns aber
der schon bekannten Tatsache bedienen, dass C(E, Y) vollständig ist, wenn E Teilmen-
ge eines metrischen Raumes ist.
Dazu setze E = {x ∈ X : kxk ≤ 1}. Für A ∈ L(X, Y) ist A|E sicherlich eine stetige
Funktion, wobei
kA|E k∞ = sup{kAxkY : kxkX ≤ 1} = kAk.
Also ist A 7→ A|E eine Isometrische Einbettung von L(X, Y) in C(E, Y). Das Bild dieser
Einbettung ist genau die Menge L aller f ∈ C(E, Y), sodass
x ∈ E, λ ∈ R (C), λx ∈ E ⇒ f (λx) = λ f (x), und
x, y, x + y ∈ E ⇒ f (x + y) = f (x) + f (y).
In der Tat, mit einem solchen f sieht man leicht, dass die Abbildung A : X → Y
definiert durch A(x) := kxkX f ( kxk1 X x) eine beschränkte lineare Abbildung ist, sodass
A|E = f .
Die Menge L ⊆ C(E, Y) ist abgeschlossen, denn aus fn → f mit fn ∈ L und
f ∈ C(E, Y) folgt f (x + y) = lim fn (x + y) = lim fn (x) + lim fn (y) = f (x) + f (y), falls
x, y, x + y ∈ E und genauso f (λx) = λ f (x), falls x, λx ∈ E und somit f ∈ L. Wegen
Lemma 9.1.10 ist (L, k.k∞ ), und daher auch (L(X, Y), k.k), ein Banachraum.
❑
Ähnlich wie im vorhergehenden Beweis sieht man, dass für A ∈ L(X, Y) und B ∈
L(Y, Z)
kBAk = sup{kBAxkZ : x ∈ X, kxkX ≤ 1} ≤ (9.5)
sup{kBk · kAxkY : x ∈ X, kxkX ≤ 1} = kBk · kAk.
Für die Räume L(X, Y) gilt in Analogie zu Lemma 9.1.2 folgendes Lemma, welches
später hauptsächlich im Falle von endlichdimensionalen Räumen Anwendung findet.
9.2.7 Lemma. Seien X, Y, Z normierte Räume, und seien (An )n∈N , (Bn)n∈N , (xn )n∈N Fol-
gen in L(X, Y), L(Y, Z) bzw. X. Weiters seien A ∈ L(X, Y), B ∈ L(Y, Z) und x ∈ X. Gilt
An → A, Bn → B und xn → x für n → ∞, so folgt
lim Bn An = BA und lim An xn = Ax,

n→∞ n→∞
wobei die erste Folge in L(X, Z) bzgl. der Abbildungsnorm und die zweite in Y bzgl.
der Norm auf Y konvergiert. Entsprechende Aussagen gelten auch für Netze.
Beweis. Wir zeigen die erste Grenzwerteigenschaft. Zu ǫ > 0 mit oBdA. ǫ < 1 gibt es
ein N ∈ N, sodass kAn −Ak, kBn −Bk < ǫ für alle n ≥ N. Es folgt kAn k ≤ kAn −Ak+kAk <
1 + kAk und damit
kBn An −BAk ≤ kBn An −BAn k+kBAn −BAk = kBn −BkkAn k+kBkkAn −Ak ≤ (1+kAk+kBk)ǫ.
Wir sehen also, dass Bn An → BA.

❑
Genauso wie in Korollar 9.1.3 folgt daraus
9.2.8 Korollar. Seien X, Y, Z normierte Räume und (Y, d) ein metrischer Raum und
D ⊆ Y. Sind f : D → L(X, Y), g : D → L(Y, Z) und h : D → X stetig, so
auch g f : D → L(X, Z) und f h : D → Y. Dabei sind diese Funktionen definiert
durch g f (t) := g(t) f (t) (Hintereinanderausführung von zuerst f (t) und dann g(t)) so-
wie f h(t) := f (t)h(t) (Anwenden von f (t) auf h(t)).
9.2.9 Beispiel.
(i) Sei Y ein normierter Raum über R und y0 ∈ Y. Dann ist die Abbildung λ → λy0
von R nach Y linear und beschränkt durch ky0 k. Entsprechendes gilt für C.
(ii) Sei T : R p → Y linear, wobei Y ein normierter Raum ist. Ist R p mit k.k∞ oder
mit einer zu ihr äquivalenten Norm versehen, so ist T beschränkt und somit ste-
P
tig. Denn ist x = (x1 , . . . , x p )T = pj=1 x j e j ∈ R p , wobei e j der j-te kanonische
Basisvektor in R p ist, so folgt
X
p X
p X
p
kT (x)k = k x j T (e j )k ≤ |x j | · kT (e j )k ≤ kxk∞ kT (e j )k.
j=1 j=1 j=1
(iii) Sei X = R p und Y = Rq , beide versehen mit k.k∞ . Wegen des letzten Beispieles
ist jede lineare Abbildung A : R p → Rq beschränkt. Somit ist L(R p , Rq ) gleich
Rq×p .
(iv) Versieht man X = R p mit k.k∞ und auch Y = Rq mit k.k∞ , so hat man mit der
Abbildungsnorm k.k auf Rq×p R pq eine weitere Norm. Auch diese ist zu k.k∞
äquivalent. In der Tat ist für A = (ai j ) ∈ Rq×p und x ∈ R p
X
p
kAxk∞ = max | ai j x j | ≤
i=1,...,q
j=1
max p max |ai j | · kxk∞ = p max |ai j | · kxk∞ .

i=1,...,q j=1,...,p i=1,...,q; j=1,...,p
Also kAk ≤ pkAk∞ . Bezeichnet {e j } j=1,...,p die kanonische Basis von R p , so ist
sicherlich auch ( j = 1, . . . , p)
kAk ≥ kAe j k∞ = max |ai j |,
i=1,...,q
und daher kAk ≥ kAk∞ .

Allgemeiner kann man X = R p und Y = Rq jeweils mit einer der Normen
k.k1 , k.k2 , k.k∞ versehen, wobei die Norm auf R p nicht dieselbe wie auf Rq sein
muss. Die daraus resultierenden Abbildungsnormen sind verschieden. Ähnlich
wie oben zeigt man aber, dass sie alle äquivalent sind.
2 2×2
(v) Sei X = Y = R mit k.k2 versehen und A ∈ R von der spetiellen Form
a −b
A = b a mit festen a, b ∈ R. Um die Abbildungsnorm von A zu berechnen,
bemerken wir, dass der erste und zweite Eintrag von
! ! !
a −b x xa − yb
=
b a y xb + ya

genau Real- bzw. Imaginärteil von (a + ib) · (x + iy) ist. Wegen k dc k2 = |c + id|

gilt kA yx k2 = |(a + ib) · (x + iy)| = |a + ib| · |x + iy| = |a + ib| · k yx k2 . Daraus

folgt unmittelbar, dass kAk = |a + ib| = k ab k2 .
9.3. REIHEN, INTEGRALE, ETC. MIT WERTEN IN EINEM NORMIERTEN RAUM43
(vi) Sei X = Y = C[0, 1], und A : X → Y definiert durch

Z x
A( f )(x) := f (t) dt.
0
Man sieht sofort, dass A linear ist. Außerdem ist mit f ∈ C[0, 1]
kA( f )k∞ = sup |A( f )(x)| ≤ sup (x sup | f (t)|) ≤ k f k∞ .
x∈[0,1] x∈[0,1] t∈[0,x]
Also kAk ≤ 1.
9.3 Reihen, Integrale, etc. mit Werten in einem nor-

mierten Raum
Zunächst verallgemeinern wir den Begriff von Zahlenreihen auf Reihen mit Summan-
den, die in einem normierten Raum liegen. Die Definition ist genau die gleiche.
9.3.1 Definition. Ist (an )n∈N eine Folge in einem normierten Raum (X, k.k), so heißt die
P
Reihe ∞ n=1 an konvergent, falls die Folge (S N )N∈N der Partialsummen
X
N
S N := an
n=1
in X, d.h. bzgl. der von k.k erzeugten Metrik, konvergiert.

P P∞
Die Reihe ∞ n=1 an heißt absolut konvergent, falls n=1 kan k in R konvergiert, dh.
P∞
falls n=1 kan k < +∞, vgl. Definition 3.7.12.
Nicht nur die Definition lässt sich unmittelbar auf Reihen mit Werten in normierten
Räumen übertragen, sondern auch viele der im ersten Semester hergeleiteten Ergeb-
nisse. Im Folgenden seien (X, k.k) und (Y, k.k) normierte Räume. Für die Beweise der
Verallgemeinerungen muss man in allen Fällen nur an geeigneten Stellen |.| durch k.k
ersetzen:
P P∞ P∞
(i) Rechenregeln (siehe Korollar 3.7.11): ∞ n=1 λan = λ n=1 an und n=1 (an + bn ) =
P∞ P∞
n=1 an + n=1 bn , wobei λ ∈ R bzw. λ ∈ C je nachdem was der Skalarkörper von
X ist.
Ist T : X → Y linear und stetig, so folgt
X
∞ X
N X
N X
∞
T( an ) = T ( lim an ) = lim T ( an ) = T (an ). (9.6)
N→∞ N→∞
n=1 n=1 n=1 n=1
(ii) Manipulationsregeln wie in Fakta 3.7.4, (1) und (2), d.h. man darf endlich viele
Summanden umändern, ohne das Konvergenzverhalten zu ändern. Der Grenzwert
ändert sich im Allgemeinen. Außerdem kann man in einer Reihe Klammern set-
zen.
P
(iii) Ist ∞n=1 an konvergent, so folgt limn→∞ an = 0 in X (siehe Proposition 3.7.7).
Die Resultate für reel- bzw. komplexwertige Reihen, die die Vollständigkeit von
R (C) verwenden, lassen sich auf vollständige normierte Räume, d.h. Banachräume
verallgemeinern. Ist also (X, k.k) ein Banachraum, dann gelten folgende Verallgemei-
nerungen.
P
(iv) Cauchysches Konvergenzkriterium (siehe Korollar 3.7.11): ∞ n=1 an konvergiert
genau dann, wenn

X m
∀ǫ > 0 ∃N ∈ N : a j < ǫ, ∀m > n ≥ N.

j=n+1
P
(v) Ist eine Reihe ∞n=1 an absolut konvergent, so folgt aus dem Cauchysches Kon-
P
vergenzkriterium und der Dreiecksungleichung sofort, dass ∞ n=1 an auch konver-
giert, wobei wegen der Stetigkeit von k.k : X → R

X ∞ X
N X∞
an = lim an ≤ kan k.
n=1 N→∞ n=1 n=1
(vi) Majorantenkriterium (siehe Satz 3.7.8): Ist kan k ≤ αn ∈ R+ ∪ {0} und konvergiert
P∞ P∞
n=1 αn , so konvergiert n=1 an absolut, wobei

X ∞ X∞ X∞
an ≤ kan k ≤ αn . (9.7)
n=1 n=1 n=1
(vii) Quotienten- und Wurzelkriterium wie in Satz 3.8.1.

(viii) Das Lemma 3.9.2 lässt sich nicht vollständig auf Banachraum-wertige Reihen übertragen, da der Beweisschritt
(iii) ⇒ (ii) nicht funktioniert. Also gilt eine abgeschwächte Version von Lemma 3.9.2, wobei (i) ⇔ (ii), (i) ⇒
(iv) ⇒ (iii). Wir wollen hier (i) ⇔ (ii) und (i) ⇒ (iv) ausführen:
P∞
P Banachraumwertige Reihe j=1 a j ist genau dann absolut konvergent, wenn es ein C > 0 gibt, sodass
Eine
j∈M ka j k ≤ C für alle endlichen Teilmengen M von N.
P P
Beweis. Für endliche Teilmengen M ⊆ N gilt klarerweise j∈M ka j k ≤ max(M)j=1 ka j k. Somit ist obige Bedingung
P
äquivalent zur Beschränktheit der Folge der Partialsummen der Reihe ∞ j=1 ka j k und damit äquivalent zur
P
Konvergenz von max(M) j=1 ka j k, vgl. Satz 3.7.8, (i).
❑
P∞
Aus der absoluten Konvergenz eine Banachraumwertige Reihe j=1 a j mit Grenzwert s folgt, dass es ein s in dem
betrefflichen Banachraum gibt, sodass

X
∀ǫ > 0 ∃M0 ⊆ N, M0 endlich : a j − s < ǫ, (9.8)

j∈M
für alle endlichen M, M0 ⊆ M ⊆ N.

P
Das bedeutet gerade, dass das Netz j∈M a j M⊆N, endlich im betrefflichen Banachraum gegen s konvergiert.
Beweis. Sei ǫ > 0 gegeben. Wegen der absoluten Konvergenz gibt es ein N ∈ N, sodass für n > m ≥ N
X
n
kak k < ǫ.
k=m+1
Setze M0 = {1, . . . , N}. Ist M eine endliche Teilmenge von N, die M0 enthält, so sind alle j ∈ M \ M0 größer als N.
Also gilt für beliebiges m > N

max(M)
X Xm X Xm X Xm
aj −
a j = aj − a j ≤ ka j k + ka j k < 2ǫ.
j=N+1
j∈M j=1 j∈M j=N+1
j=N+1
j>N
P
Strebt nun m gegen ∞, so folgt k j∈M a j − sk ≤ 2ǫ. Da ǫ > 0 beliebig war folgt (9.8).
❑
P∞
Schließlich folgt aus (9.8) sicherlich, dass j=1 a j = s (nicht notwendigerweise absolut), da die Folge der Partial-
P P P P
summen ( nj=1 a j )n∈N wegen nj=1 a j = j∈{1,...,n} a j ein Teilnetz von j∈M a j ist.
M⊆N, endlich
(ix) Mit dem gerade gezeigten lässt sich jetzt Satz 3.9.3 im Banachraumwertigen Fall wie im skalarwertiegen Fall zeigen:
P
Ist eine Reihe ∞ P an mit Werten in einem Banachraum X absolut konvergent, und ist σ : N → N bijektiv, so
n=1
konvergiert auch ∞ n=1 aσ(n) absolut, und zwar gegen den selben Grenzwert s, wie die ursprüngliche Reihe.
P∞ P∞
Beweis. Zunächst ist nach
P dem klassischen Satz 3.9.3 P∞ im skalaren Fall mit n=1 kan k auch n=1 kaσ(n) k konvergent;
also konvergiert auch ∞ n=1 a σ(n) absolut. Sei s̃ := n=1 aσ(n) (∈ X).
P P
Nach (9.8) konvergiert das Netz j∈M a j M⊆N, endlich gegen s und j∈M aσ( j) M⊆N, endlich gegen s̃.
Ist ǫ > 0 und M0 so, dass (9.8) gilt, und ist σ−1 (M0 ) ⊆ M, so folgt wegen M0 ⊆ σ(M)

X X X
aσ( j) − s = aσ( j) − s = ak − s < ǫ.

j∈M σ( j)∈σ(M) k∈σ(M)
P
Somit konvergiert j∈M aσ( j) auch gegen s, dh. s = s̃.
M⊆N, endlich
❑
Schließlich gilt der Riemannsche Umordnungssatz, dh. die Umkehrung des gezeigten, im Banachraumfall im All-
gemeinen nicht.
(x) Da sich Satz 3.9.3 auf Banachraum-wertige Reihen verallgemeinern lässt, können wir auch Banachraum-wertige
Doppelreihen mit Hilfe von linearen Anordnungen betrachten. Insbesondere bleibt Satz 3.9.10 richtig. Man beachte,
dass in dessen Beweis nur die für Banachraum-wertige Reihen richtigen Teile von Lemma 3.9.2 verwendet werden.
9.3.2 Beispiel. Sei B ∈ R p×p (versehen z.B. mit der Abbildungsnorm) mit kBk < 1, und
definiere (B0 = I)
X∞
S := Bn .
n=0
P
Wegen (9.5) hat man kB k ≤ kBk , und daher ist ∞
n n n
n=0 kBk eine konvergente Majorante,
P∞ n
und somit konvergiert S = n=0 B absolut, wobei (vgl. (9.7))
X
∞ X
∞
1
kS k ≤ kBn k ≤ kBkn = .
n=0 n=0
1 − kBk
Die Tatsache, dass C 7→ BC eine beschränkte lineare Abbildungen von R p×p nach R p×p
ist, erlaubt uns die Vertauschung von Grenzübergängen (vgl. (9.6)):
X
N X
N X
N+1
BS = B lim Bn = lim Bn+1 = lim (−I + Bn ) = −I + S .
N→∞ N→∞ N→∞
n=0 n=0 n=0
Also I = (I − B)S . Genauso sieht man I = S (I − B). Also ist I − B invertierbar mit
S = (I − B)−1 .
9.3.3 Korollar. Ist T ∈ R p×p invertierbar, und ist S ∈ R p×p mit kT − S k < kT1−1 k , so ist
auch S invertierbar.
Insbesondere ist die Menge GL(p, R) aller invertierbaren p×p-Matrizen eine offene
Menge, und die Funktion S 7→ S −1 ist stetig auf GL(p, R) ⊆ R p×p .
Beweis. Nach Voraussetzung ist k(T − S )T −1 k < 1. Gemäß Beispiel 9.3.2 existiert
(I − (T − S )T −1 )−1 und
S T −1 (I − (T − S )T −1 )−1 = (T − (T − S ))T −1 (I − (T − S )T −1 )−1 =
(I − (T − S )T −1 )(I − (T − S )T −1 )−1 = I.
Also hat S eine Rechtsinverse. Entsprechend ist (I − T −1 (T − S ))−1 T −1 eine Linksin-
verse. Aus der Linearen Algebra ist bekannt, dass diese dann übereinstimmen müssen.
Um die Stetigkeit von S 7→ S −1 einzusehen, sei S n → S , wobei alle Matrizen

invertierbar sind. Es folgt
kS n−1 − S −1 k = kS n−1 (S − S n )S −1 k ≤ kS n−1 k · kS − S n k · kS −1 k, (9.9)
und daher kS n−1 k ≤ kS −1 k + kS n−1 − S −1 k ≤ kS −1 k + kS −1 k · kS n−1 k · kS − S n k. Für
hinreichend großes n hat man somit
kS −1 k
kS n−1 k ≤ .
1 + kS −1 k · kS − S n k
Also ist kS n−1 k beschränkt, und aus (9.9) folgt S n−1 → S −1 .
❑
9.3.4 Bemerkung. Im vorangegangenen Beispiel und Korollar haben wir zwar von qua-
dratischen Matrizen gesprochen. Es gilt aber der selbe Sachverhalt, wenn die auftre-
tenden Objekte allgemeiner beschränkte lineare Abbildungen eines Banachraumes in
einen anderen, also Elemente von L(X, X) sind. Die Beweise sind so gewählt, dass sie
auch funktionieren für diesen allgemeineren Fall.
Man kann auch Funktionen mit Werten in normierten Räumen betrachten. Dabei
heißt eine Folge ( fn )n∈N von beschränkten Funktionen fn : E → X gleichmäßig kon-
vergent gegen f , falls limn→∞ fn = f in dem normierten Raum B(E, X)2.
Ist (X, k.k) sogar ein Banachraum, so gelten folgend Aussagen, die für X = R (C)
schon bekannt sind.
(i) Mit (X, k.k) ist auch B(E, X) ein Banachraum. Somit ist ( fn )n∈N in B(E, X) genau
dann konvergent, wenn diese Folge bzgl. k.k∞ eine Cauchyfolge ist.
(ii) Ist E Teilmenge eines metrischen Raumes, so wissen wir schon, dass C(E, X)
abgeschlossen in B(E, X) ist, was zur Folge hat, dass die Grenzfunktion f stetig
ist, wenn alle fn es sind, vgl. Korollar 6.6.13.
P
(iii) Weierstraßsche Konvergenzkriterium (siehe Korollar 6.7.4): Ist ∞ n=1 fn eine Rei-
he von X-wertigen beschränkten Funktionen, so folgt aus der absoluten Konver-
P P∞
genz ∞ n=1 k fn k∞ < +∞ die gleichmäßige Konvergenz der Reihe n=1 fn .
Die absolute Konvergenz gilt insbesondere, wenn es eine konvergente Reihe
P∞
n=1 αn von nichtnegativen reellen Zahlen mit k fn k∞ ≤ αn gibt.
Das Weierstraßsche Konvergenzkriterium ist nichts anderes, als das Majoranten-
kriterium angewandt auf den Banachraum B(E, X), siehe (9.7).
(iv) Für Potenzreihen zeigt man fast genauso wie in Satz 6.7.8 folgenden Sachverhalt.
Seien an ∈ X, n ≥ 0, und sei R das Supremum aller |z|, wobei je nach Skalarkörper
P
z ∈ R bzw. z ∈ C, sodass die Reihe ∞ n
n=0 z an konvergiert, so konvergiert die Reihe
P∞ n
n=0 z an in X absolut, wenn z ∈ R (C), |z| < R. Im Falle |z| > R divergiert sie.
Für |z| ≤ r < R konvergiert sie gleichmäßig. Also ist auf {z ∈ R (C) : |z| ≤ r} die
P
Funktion z 7→ ∞ n
n=0 z an (∈ X) stetig und beschränkt (d.h. sie liegt in C(rD, X)),
und auf {z : |z| < R} ist sie stetig.
kan+1 k −1 kan+1 k −1
Für R gilt auch (lim supn→∞ kan k ) ≤ R ≤ (lim inf n→∞ kan k ) und
√
R = (lim supn→∞ n kan k)−1 .
2 Dieses Konzept ist schon aus Definition 6.6.5 bekannt, wenn sogar X allgemeiner ein metrischer Raum
ist.
Auch die Differentialrechnung lässt sich auf Funktionen mit Werten in normierten
Räumen ausdehnen.
9.3.5 Definition. Ist I ein reelles Intervall und f : I → X, so heißt f im Punkt x ∈ I

differenzierbar, wenn der Grenzwert
d 1
f (x) = f ′ (x) := lim ( f (t) − f (x))
dx t→x t − x
in X existiert, wobei dieser Grenzwert einseitig zu verstehen ist, wenn x ein Randpunkt
von I ist. Ist f bei allen x ∈ I differenzierbar, so heißt f differenzierbar. Die Funktion
x 7→ f ′ (x) (Ableitung von f ) ist dann eine Abbildung von I nach X. Ist diese stetig, so

heißt f stetig differenzierbar. Mit C 1 I, X wird die Menge aller stetig differenzierbaren
X-wertigen Funktionen auf I bezeichnet.
Analog zum skalaren Fall definiert man auch die höheren Ableitungen.
9.3.6 Bemerkung. Im Falle X = R p kann man sich f (I) als Kurve vorstellen. Die
Ableitung f ′ (x) ist dann der Anschauung nach nichts anderes, als der Tangentialvektor
an diese Kurve im Punkt f (x).
Wir wollen uns auch ein Beispiel einer Funktion von einem Intervall in einen un-
endlich dimensionalen Banachraum anschauen.
9.3.7 Beispiel. Sei X = C(0, 1) der Banachraum aller reellwertigen, beschränkten und
stetigen Funktionen auf dem Intervall (0, 1) versehen mit der Supremumsnorm k.k∞ .
Die Funktion f : R → X sei so definitert, dass f (t) die Funktion
s 7→ et s(1 − s)
aus X = C(0, 1) ist. Für x ∈ R gilt

1 ( f (t) − f (x)) − f (t) = sup 1 et s(1 − s) − e x s(1 − s) − e x s(1 − s) =
t − x ∞ s∈(0,1) t − x

1 et − e x − e x · sup |s(1 − s)| = 1 et − e x − e x · 1
.
t − x s∈(0,1) t − x 2
1 1
Wegen limt→x t−x et − e x = e x konvergiert somit t−x ( f (t) − f (x)) in X für t → x
′
gegen f (x). Also gilt f (x) = f (x).
Es gelten u.a. folgende Regeln:
(i) Die Ableitung von konstanten Funktionen ist 0 ∈ X.
(ii) Ist f bei x ableitbar, so ist f bei x stetig.
(iii) ( f + g)′ (x) = f ′ (x) + g′ (x), (λ f )′ (x) = λ f ′ (x), (α f )′ (x) = α′ (x) f (x) + α(x) f ′ (x),
wobei λ ∈ R (C), f, g : I → X und α : I → R (C). Siehe Satz 7.1.7. Die
Gleichheitszeichen sind dabei so zu interpretieren, dass die linke Seite existiert,
wenn die rechte Seite existiert und dann die Gleichheit gilt.
Ähnlich wie bei den Reihen sieht man, dass T ( f ′ (x)) = (T f )′ (x), wenn T : X →
Y linear und beschränkt ist.

(iv) Kettenregel (Satz 7.1.9): Sei f : (c, d) → X und α : (a, b) → R mit α (a, b) ⊆
(c, d). Dann folgt ( f ◦ α)′ (x) = α′ (x) f ′ (α(x)).
9.3.8 Beispiel. Sei X = C(0, 1) wieder der Banachraum aller reellwertigen, beschränk-
ten und stetigen Funktionen auf dem Intervall (0, 1) versehen mit der Supremumsnorm
k.k∞ . Die Funktion f : [0, 1] → X sei so definitert, dass f (t) die Funktion
√
t
s 7→
s+t
aus X = C(0, 1) ist. Klarerweise ist f (0) die Nullfunktion und somit (t > 0)
√ √
t t 1
k f (t) − f (0)k∞ = sup = lim = √ .
s∈(0,1) s + t s→0+ s + t t
Der Grenzwert dieses Ausdruckes für t → 0 ist aber sicherlich nicht 0. Also ist f bei
t = 0 nicht stetig und daher insbesondere nicht differenzierbar. √
Man beachte, dass für feste s ∈ (0, 1) die Funktion t 7→ s+tt bei t = 0 sehr wohl
stetig ist.
9.3.9 Bemerkung. Kann man Arten von Produkten von Funktionen bilden, so gelten
jeweils auch Formen von Produktregeln.
(i) Sei I ein reelles Intervall und f : I → L(X, Y), g : I → L(Y, Z). Für x ∈ I und
t ∈ I \ {x} gilt
1
k g(t) f (t) − g(x) f (x) − g′ (x) f (x) − g(x) f ′ (x)k =
t−x
1
kg(t) f (t) − f (x) − g(t) f ′ (x) + g(t) f ′ (x) − g(x) f ′ (x)+
t−x
1
g(t) − g(x) f (x) − g′ (x) f (x)k ≤
t−x
1
kg(t)k · k f (t) − f (x) − f ′ (x)k + kg(t) − g(x)k · k f ′ (x)k+
t−x
1
k g(t) − g(x) − g′ (x)k · k f (x)k.
t−x
Sind f und g bei x differenzierbar, so sind sie dort auch stetig und daher konver-
gieren für t → x alle Summanden gegen Null. Damit ist auch g f bei x differen-
zierbar mit der Produktregel
(g f )′ (x) = g′ (x) f (x) + g(x) f ′ (x). (9.10)
(ii) Entsprechend zeigt man ( f h)′ (x) = f ′ (x)h(x) + f (x)h′ (x), wenn f : I → L(X, Y)
und h : I → X.
(iii) Sind f, g : I → R p in einem Punkt x ∈ I differenzierbar, so zeigt man ähnlich wie
oben aber unter Zuhilfenahme der Cauchy-Schwarzschen Ungleichung, dass die
Funktion t 7→ ( f (t), g(t)) (Skalarprodukt) von I nach R auch in x differenzierbar
ist, wobei ( f, g)′ (x) = ( f (x), g′ (x)) + ( f ′ (x), g(x)).
Viele Resultate, die sich aus dem Mittelwertsatz (Satz 7.2.5) herleiten haben lassen,
können nicht unmittelbar auf Funktionen mit Werten in normierten Räumen verallge-
meinert werden. Manches lässt sich jedoch mit Hilfe des folgenden Lemmas retten.
9.3.10 Lemma. Ist f : [a, b] → X stetig, f |(a,b) differenzierbar und gilt f ′ (x) = 0 für
alle x ∈ (a, b), so ist f konstant.
Beweis. Subtrahieren wir von f (x) immer den Wert f (a), so können wir annehmen,
dass o.B.d.A. f (a) = 0.
Seien x, t ∈ (a, b), so folgt aus der Dreiecksungleichung k f (x)k ≤ k f (t) − f (x)k +
k f (t)k sowie k f (t)k ≤ k f (t) − f (x)k + k f (x)k. Also gilt −k f (t) − f (x)k ≤ k f (t)k − k f (x)k ≤
k f (t) − f (x)k, und daher

1 k f (t)k − k f (x)k 1
− f (t) − f (x) ≤ ≤ f (t) − f (x) .
t−x t−x t−x
Da k.k : X → R stetig ist, konvergieren für t → x die linke und die rechte Seite laut
Voraussetzung gegen 0 und nach dem Einschlusskriterium für Netze somit auch der
mittlere Ausdruck.
Also ist x 7→ k f (x)k auf (a, b) differenzierbar mit k f (x)k′ = 0 und klarerweise auf
[a, b] stetig. Da k f (a)k = 0, folgt aus dem Mittelwertsatz auf k f (x)k angewandt, dass
k f (x)k = 0, und somit f (x) = 0, für alle x ∈ [a, b].
❑
Als Folgerung erhält man z.B. dass zwei ableitbare X-wertige Funktionen überein-
stimmen, wenn sie es an einer Stelle tun, und wenn ihre Ableitungen gleich sind.
9.3.11 Definition. Sei f : [a, b] → X eine beschränkte Funktion. Konvergiert das Netz
(S ( f, R))R∈R in X, wobei (vgl. Definition 8.2.1)
X
n(R)
S ( f, R) = (ξ j − ξ j−1 ) f (α j ),
j=1
so heißt f Riemann-integrierbar. Wir schreiben in diesem Fall

Z b
f (t) dt := lim S ( f, R).
a |R|→0
Der Zugang zu Integralen mit Ober- und Untersummen funktioniert offensichtlich

hier nicht. Man kann jedoch genauso wie im skalaren Fall folgendes unmittelbar auf
den Fall von normierten Räumen übertragen, indem man in den jeweiligen Beweisen
an den richtigen Stellen |.| durch k.k ersetzt.
(i) Rechenregeln (Lemma 8.2.9):
Zb Zb Zb
(λ f + µg) dx = λ f dx + µ g dx,
a a a
b
Zb Z−
f dx ≤ k f (x)k dx ≤ k f k∞ (b − a). (9.11)

a a
wobei f, g : [a, b] → X Riemann-integrierbar sind, und λ, µ ∈ R (C) je nachdem,
was der Skalarkörper von X ist. Zur Erinnerung: k f k∞ = supx∈[a,b] k f (x)k.
(ii) Ist T : X → Y beschränkt und linear, so folgt aus der Stetigkeit, dass
Z Z
T ( f (t) dt) = T ( lim S ( f, R)) = lim S (T f, R) = T f (t) dt. (9.12)
|R|→0 |R|→0
Rb
Insbesondere gilt für g : [a, b] → R (C) und x ∈ X, dass a
(g(t)x) dt =
Rb
( a g(t) dt)x.
Setzt man noch voraus, dass (X, k.k) ein Banachraum ist, so gelten auch folgende
Aussagen.
(iii) Ist f : [a, b] → X stetig, so ist f Riemann-integrierbar, vgl. Satz 8.3.3.

(iv) Sei f : [a, b] → X und c < d, [c, d] ⊆ [a, b]. Dann ist f |[c,d] über [c, d] Riemann-
integrierbar genau dann, wenn 1[c,d] f es über [a, b] ist. Das ist insbesondere der
Fall, wenn f über [a, b] Riemann-integrierbar ist. vgl. Lemma 8.4.1.
(v) Der Hauptsatz der Differential- und Integralrechnung (Satz 8.4.6) gilt auch für
Banachraum-wertige Funktionen:
Ist f : [a, b] → X Riemann-integrierbar, und setzt man für a ≤ x ≤ b
Zx
F(x) := f (t) dt.
a
Dann ist F stetig auf [a, b]. Ist f in einem Punkt x0 stetig, so ist F bei x0 differen-
zierbar und es gilt F ′ (x0 ) = f (x0 ).
(vi) Ist f : [a, b] → X stetig, und ist G : [a, b] → X stetig und stetig differenzierbar auf
Rx
(a, b), sodass G′ (x) = f (x), x ∈ (a, b), so erfüllt G(x)− f (t) dt die Voraussetzung
a
von Lemma 9.3.10. Also ist diese Funktion konstant, und daraus folgt
Zb
f (t) dt = G(b) − G(a). (9.13)
a
Man erhält somit wie im skalaren Fall, dass der Integrationsoperator C([a, b], X)
bijektiv auf die Hyperebene aller bei a verschwindenden Funktionen in
C 1 ([a, b], X) abbildet.
(vii) Sei I ⊆ R ein Intervall mit endlicher linker Intervallgrenze a, die in I liege. Ist f : I → X eine Funktion, dann
gilt f ∈ C1 (I, X) genau dann, wenn f ∈ C(I, X), f |I\{a} ∈ C1 (I \ {a}, X) und der X-wertige Grenzwert limtցa f ′ (t)
existiert, vgl. Korollar 7.2.10. Eine entsprechende Aussage gilt für die rechte Intervallgrenze von I.
Um das einzusehen, sei f ∈ C(I, X), f |I\{a} ∈ C1 (I \ {a}, X) und existiere limtցa f ′ (t). Setzen wir g(t) = f ′ (t), t ∈
I \ {a}, und g(a) = limtցa f ′ (t), so gilt klarerweise g ∈ C(I, X), vgl. Bemerkung 6.4.4. Die X-wertige Funktion
Rx
F(x) = f (x) − a g(t) dt, x ∈ I, ist auf I stetig, hat auf I \ {a} eine verschwindende die Ableitung, und ist somit
Rx
wegen Lemma 9.3.10 auf jedem Intervall der Form [a, s] mit s ∈ I konstant. Also ist mit x 7→ a g(t) dt, x ∈ [a, s]
(vgl. (v)) auch f (x) auf [a, s] stetig differenzierbar. Die Umkehrung ist offensichtlich.
(viii) Es gilt auch die Substitutionsregel mit skalarer Funktion g und X-wertiger Funk-
tion f (vgl. Lemma 8.4.14) und die Regel der partiellen Integration (vgl. Lemma
8.4.15), wobei eine Funktion skalarwertig sein muss, damit das Produkt von zwei
Funktion erklärt ist.
(ix) Uneigentliche Riemann-Integrale lassen sich genauso wie im skalaren Fall defi-
nieren, siehe Definition 8.6.1.
Insbesondere zeigt man wie in Lemma 8.6.3, dass aus absoluten Konvergenz von
Rb Rb
a R
g(x) dx einer Funktion g : [a, b) → X, dh. a
kg(x)k dx < +∞, die Konvergenz
b Rβ
von a g(x) dx, dh. von limβրa a g(x) dx in X folgt. Ist obendrein |g(x)| ≥ | f (x)|
Rb
für alle x ab einem c ∈ [a, b), so ist auch a f (x) dx absolut konvergent, wobei
f : [a, b) → X.
Bei diesem Schluss von absoluter Konvergenz auf die Konvergenz muss man
voraussetzen, dass für alle β ∈ [a, b) die Funktionen g, f, kg(.)k, k f (.)k auf [a, β]
Riemann-integrierbar sind.
(x) Wie im skalaren Fall kann man auch Integral und Grenzübergang vertauschen
(siehe Satz 8.7.2)
Zb Zb
lim fn dx = f dx. (9.14)
n→∞
a a
(xi) Man kann auch genauso wie im skalaren Fall die Integrationsreihenfolge vertau-
schen, siehe Satz 8.7.9. Weiters kann man Integral und Ableitung vertauschen
(siehe Korollar 8.7.11):
Z d Z d
d d
f (s, t) dt = f (s, t) dt, (9.15)
ds c c ds
d
wenn f (s, t) und ds f (s, t) für alle (s, t) ∈ [a, b] × [c, d] stetig sind.
(xii) Man kann nun auch die Rechnung aus Beispiel 8.8.3 nochmals für f : I → X
durchführen, um für eine (n + 1)-mal stetig differenzierbare Funktion die Taylor-
sche Entwicklung
Xn Z x
f (k) (y) k (x − t)n
f (x) = (x − y) + f (n+1) (t) dt. (9.16)
k=0
k! n!
y
zu erhalten. Nur eine Abschätzung des Restgliedes wie im R-wertigen Fall hat
man nicht, da diese ja den Mittelwertsatz der Differentialrechnung bzw. Integral-
rechnung verwendet.
9.3.12 Bemerkung. Alle oben erwähnten Konzepte (Reihen, gleichmäßig konvergente

Funktionen, Ableitung, Integral) hängen nicht von der Norm auf X ab, solange diese
zur ursprünglich auf X gegenen Norm äquivalent sind, denn Grenzwerte und deren
Existenz in X bleiben unverändert, wenn man zu einer äquivalenten Norm wechselt.
9.3.13 Bemerkung. Ist X = Rd , so wissen wir, dass die Konvergenz eines Netz zur kom-
ponentenweisen Konvergenz äquivalent ist, wobei die Komponenten des Grenzwertes
genau die Grenzwerte der Komponentennetze sind.
Somit erhalten wir
  P∞    d 
X∞ an,1   n=1 an,1   f1 
 
 dt f1 (t)

 ..   ..  d  ..   . 
 .  =  .  ,  .  (t) =  ..  ,
n=1   P∞  dt   d 
an,d n=1 an,d fd dt fd (t)
  R b 
Z  f   f1 (t) dt

b 1   a
 ..   .. 
 ,
 .  (t) dt =  . 
a   R b 
fd fd (t) dt
a
in dem Sinne, dass die linken Seiten genau dann existieren, wenn die rechten es tun.
Als Anwendung für obige eher abstrakt wirkende Konzepte wollen wir die Expo-
nentialfunktion, die einer p × p-Matrix wieder eine p × p-Matrix. zuweist betrachten.
9.3.14 Beispiel. Sei A ∈ R p×p . Man betrachte die R p×p -wertige Potenzreihe (t ∈ R)
X
∞
1 n
etA := tn A .
n=0
n!
Dabei sei R p×p mit einer Abbildungsnorm versehen. Wegen
1 n (|t| kAk)n
ktn A k≤
n! n!
folgt nach dem Majorantenkriterium die absolute Konvergenz von etA für alle t ∈ R, da
ja
X∞
(|t| kAk)n
(= e|t| kAk )
n=0
n!
konvergiert. Somit ist der Konvergenzradius R = +∞. Als Grenzfunktion einer Potenz-
reihe ist t 7→ etA eine stetige Funktion von R nach R p×p .
Wegen der Beschränktheit der Abbildungen B 7→ AB, B 7→ BA als Abbildungen
von R p×p nach R p×p gilt wegen (9.6)
∞ 
X n 1 n  X ∞
1
tA
Ae = A  t  A  = tn An+1 = etA A. (9.17)
n=0
n! n=0
n!
Sei x ∈ R. Die Potenzreihe für auf [−|x|, |x|] gleichmäßig konvergiert, kann man im
Folgenden Integration und Grenzwert vertauschen (vgl. (9.14)):
Z x ∞ Z
X x X xn+1 ∞
1 n n
etA dt = t A dt = An .
0 n=0 0 n! n=0
(n + 1)!
Wegen (9.12) und (9.6) gilt somit

Z x Z x X
∞ X 1 ∞
xn+1
AetA dt = A etA dt = An+1 = xn An = e xA − I.
0 0 n=0
(n + 1)! n=1
n!
Aus dem Hauptsatz der Differential und Integralrechnung folgt daher dtd etA = AetA =
etA A.
Übrigens konvergiert etA auch für alle t ∈ R, wenn man R p×p mit einer anderen
Norm versieht, da diese alle äquivalent sind. Wir haben oben aber die Tatsache kAn k ≤
kAkn verwendet, welche i.A. nur von der Abbildungsnorm erfüllt wird.
9.3.15 Proposition. Für jede p × p-Matrix A ∈ R p×p konvergiert die Reihe (A0 := I)
X∞
1 n
eA := A .
n=0
n!
absolut im Banchraum R p×p versehen mit der Abbildungsnorm, wobei keA k ≤ ekAk und zwar gleichmäßig auf jeder Menge
der Form
Er = {A ∈ R p×p : kAk ≤ r}
für jedes beliebige 0 < r < +∞.
Die Abbildung A 7→ eA als Abbildung von R p×p nach R p×p ist stetig.
P kAkn P∞ 1 n
Beweis. Wegen (9.5) gilt kAn k ≤ kAkn für alle n ∈ N. Somit ist ∞ n=0 n! eine konvergente Majorante und n=0 n! A
konvergiert absolut, wobei keA k ≤ ekAk (siehe (9.7)).
Wegen der Beschränktheit der Abbildungen B 7→ AB, B 7→ BA als Abbildungen von R p×p nach R p×p gilt wegen (9.6)
∞ 
X 1 n  X ∞
1 n+1
AeA = A  A  = A = eA A.
n=0
n! n=0
n!
Nun betrachte für ein r > 0 die Teilmenge

Er = {A ∈ R p×p : kAk ≤ r}
n
p×p 1 n r
von R . Für A ∈ Er gilt n! A ≤ n! , und daher können wir das Weierstraßsche Konvergenzkriterium anwenden. Insbe-
P
N 1 n A
sondere konvergiert dann n=0 n! A N∈N für N → ∞ gleichmäßig auf Er gegen die Funktion A 7→ e .
PN 1 n
Nach Korollar 9.2.8 ist A 7→ An stetig auf Er für alle n ∈ N, und nach Korollar 9.1.3 ist auch A 7→ n=0 n! A stetig auf
Er .
Da die Grenzfunktion von einer Folge stetiger Funktionen bei gleichmäßiger Konvergenz wieder stetig ist, folgt die
Stetigkeit von A 7→ eA auf Er . Weil die Stetigkeit eine lokale Eigenschaft ist, folgt diese damit auf ganz R p×p .
❑
9.3.16 Bemerkung. Sei nun R eine weitere beliebige p × p-Matrix. Dann sieht man mit
Hilfe der Produktregel wie in (9.10), dass die Funktion f (t) = etA R eine Lösung des
Randwertproblems
f ′ (t) = A f (t), f (0) = R (9.18)
ist. Ist umgekehrt f : R → R p×p eine weitere auf ganz R differenzierbare Lösung die-
ses Problems, so folgt aus der Produktregel für R p×p L(R p , R p )-wertige Funktionen
(9.10)
d −tA
(e f (t)) = −e−tA A f (t) + e−tA f ′ (t) = −e−tA A f (t) + e−tA A f (t) = 0,
dt
und daher e−tA f (t) = e−0A f (0) = R. Da insbesondere etA eine Lösung von (9.18) mit
R = I ist, erhalten wir e−tA etA = I und somit e−tA = (etA )−1 .
Für unsere zunächst beliebige Lösung folgt daher auch f (t) = etA R. Also ist etA R
die einzige Lösung von (9.18).
Mit dieser Tatsache lässt sich nun auch die Frage behandeln, ob für die Exponenti-
alfunktion wie im skalaren Fall gilt, dass eA+B = eA eB . Im Allgemeinen ist das nämlich
nicht richtig. Sollten aber A und B kommutieren (AB = BA), so gilt (vgl. (9.6))
∞ 
X tn n  X
∞ n
t X∞ n
t
e B = 
tA
A  B = (An B) = (BAn) = BetA ,
n! n=0
n! n=0
n! n=0
und daher
d tA tB
(e e ) = AetA etB + etA BetB = (A + B)etA etB .
dt
Somit ist etA etB eine Lösung von (9.18) mit A ersetzt durch A + B und R ersetzt durch
I, und wegen der Eindeutigkeit der Lösung folgt et(A+B) = etA etB .
9.3.17 Bemerkung. Ganz ähnlich wie in Bemerkung 9.3.4 gelten auch Beispiel 9.3.14
und die Aussagen von Proposition 9.3.15 und Bemerkung 9.3.16 für den Fall, dass
A ∈ L(X, X) mit einem beliebigen Banachraum X. Die Beweise sind im wesentlichen
die selben.
9.4 Skalarprodukträume und Orthogonalsysteme

Genauso wie im obigen Beispiel zeigt man, dass durch
√ jedes positiv definite Skalar-
produkt (., .) auf einem Vektorraum H durch kxk := (x, x) eine Norm definiert ist.
9.4.1 Definition. Ist H ein Vektorraum über R oder C, und ist (., .) : H × H →
R bzw. (., .) : H × H → C ein Skalarprodukt, dh. eine hermitsche positiv definite
Sesqulinearform, so nennen wir (H, (., .)) einen Skalarproduktraum. Weiters setzen
wir für x ∈ H p
kxk := (x, x).
√
Nicht ganz zufällig wird für (x, x) das Symbol kxk gewählt. In der Tat ist k.k eine
Norm, denn es gilt offensichtlich wegen der positiven Definitheit (x, x) = 0 ⇔ x = 0
und (x, x) ≥ 0, es gilt kλxk2 = (λx, λx) = |λ|2 · kxk2 und schließlich liefert die aus der
Linearen Algebra bekannten Cauchy-Schwarzschen Ungleichung |( f, g)| ≤ k f k · kgk
k( f + g)k2 = |( f, ( f + g)) + (g, ( f + g))| ≤ k f k · k f + gk + kgk · k f + gk,
und daher k( f + g)k ≤ k f k + kgk. Also ist (H, k.k) ein normierter Raum (siehe Definition
9.1.1).
9.4.2 Definition. Ein Skalarproduktraum (H, (., .)) heißt Hilbertraum, wenn (H, k.k)
sogar ein Banachraum ist.
9.4.3 Beispiel.
P
Versehen wir etwa C p mit dem natürlichen Skalarprodukt (x, y) := pj=1 x j ȳ j , so
ist die von (., .) erzeugte Norm gerade k.k2 und (C p , (., .)) ist ein Hilbertraum.
Betrachten wir C[a, b]3 aber jetzt versehen mit

s
Z b
k f k2 := | f (t)|2 dt.
a
p
Für diese Norm gilt k f k2 = ( f, f ), wenn wir C[a, b] mit dem positiv definiten
Skalarprodukt ( f, g ∈ C[a, b])4
Z b
( f, g) = f (t)g(t) dt
a
versehen. Der normierte Raum (C[a, b], k.k2) ist nicht vollständig und damit
(C[a, b], (., .)) kein Hilbertraum.
Sei Q[a, b] die Menge aller auf [a, b] stückweise stetigen Funktionen mit Werten
in C (vgl. Definition 8.4.3).
Man überprüft in elementarer Weise, dass f ∈ Q[a, b] genau dann, wenn für
alle x ∈ [a, b) die Grenzwerte f (x+) = limt→x+ f (t) und für alle x ∈ (a, b] die
Grenzwerte f (x−) = limt→x− f (t) existieren und für alle bis auf endlich viele
x ∈ (a, b) gilt f (x−) = f (x) = f (x+).
3 In diesem Kapitel steht C[a, b] für alle komplexwertigen stetigen Funktionen auf [a, b]. Alle Ergebnisse
gelten sinngemäß auch für den Raum aller reellwertigen stetigen Funktionen auf [a, b].
4 Das Quer ist nicht nötig, wenn C[a, b] für alle stetigen und reellwertigen Funktionen steht.
9.4. SKALARPRODUKTRÄUME UND ORTHOGONALSYSTEME 55
Daraus erkennt man leicht, dass mit f, g ∈ Q[a, b], α ∈ C auch α f, f + g, f · g ∈

Q[a, b], und dass für jedes Intervall I ⊆ [a, b] die charakteristische Funktion 1I
in Q[a, b] liegt.
Insbesondere ist Q[a, b] ein Vektorraum. Definieren wir für f, g ∈ Q[a, b] die
hermitsche Form Z b
( f, g) = f (x)g(x) dx,
a
p
so ist k f k := ( f, f ) fast eine Norm. In der Tat folgt aus Korollar 8.4.12 und
Bemerkung 8.4.4, dass wenn k f k = 0, immer f (x) = 0 für alle bis auf endlich
viele x ∈ [a, b]. Wenn wir zwei Funktionen in Q[a, b] identifizieren, wenn sie
sich nur an endlich vielen Stellen unterscheiden, dann wird (Q[a, b], (., .)) zu
einem Skalarproduktraum und k.k ist daher ein Norm.
Die Identifizierung von Funktionen, die sich nur auf einer endlichen Menge un-
terscheidet ist eigentlich ein Übergang von Q[a, b] zum Faktorraum

Q[a, b] / f ∈ Q[a, b] : f (x) = 0 für alle bis auf endlich viele x ∈ [a, b] .
Ein Beispiel eines unendlich dimensionalen Hilbertraumes ist

 


 X
∞ 


2 N 2
l (N) = 
(zn ) n∈N ∈ C : |zn | < +∞ 

 
n=1
versehen mit
X
∞
((zn )n∈N , (wn )n∈N ) := zn w̄n ,
n=1
wobei diese Reihe wegen
v
u
t N v
t∞
XN X X
N X X
∞
|zn w̄n | ≤ 2
|zn | · 2
|wn | ≤ |zn |2 · |wn |2
n=1 n=1 n=1 n=1 n=1
pP∞
2
sogar absolut konvergiert. Die von (., .) erzeugte Norm ist n=1 |zn | .

Um die Vollständigkeit nachzuweisen, sei (zkn )n∈N k∈N eine Cauchy-Folge in
l2 (N) bezüglich der von (., .) erzeugten Norm. Für ein festes m ∈ N gilt (k, l ∈ N)
|zkm − zlm | ≤ k(zkn )n∈N − (zln )n∈N k,
und man sieht, dass (zkm )k∈N eine Cauchy-Folge in C ist. Also zkm → zm , k → ∞
für ein zm ∈ C. Sei ǫ > 0 und K ∈ N so, dass k, l ≥ K ⇒ k(zkn )n∈N − (zln )n∈N k < ǫ.
Für ein festes N ∈ N und k ≥ K gilt dann
X
N X
∞
|zkn − zln |2 ≤ |zkn − zln |2 < ǫ 2 .
n=1 n=1
PN k
Lassen wir l → ∞ streben, so erhalten wir n=1 |zn − zn |2 ≤ ǫ 2 , und da N beliebig
P∞ k
war sogar n=1 |zn − zn | ≤ ǫ . Daraus folgt einerseits (zkn − zn )n∈N ∈ l2 (N) und
2 2
somit (zn )n∈N ∈ l2 (N) und andererseits

k(zkn )n∈N − (zn )n∈N k ≤ ǫ.

Also konvergiert (zkn )n∈N k∈N für k → ∞ bezüglich k.k gegen den Grenzwert
(zn )n∈N .
9.4.4 Definition. Sei (H, (., .)) ein Skalarproduktraum. Eine Familie (ei )i∈I von nicht-
verschwindenden Elementen aus H, d.h. 0 , ei ∈ H, i ∈ I, heißt Orthogonalsystem,
wenn (ei , e j ) = 0, i , j. Ein Orthogonalsystem heißt Orthonormalsystem, wenn zusätz-
lich kei k = 1, i ∈ I.
Klarerweise ist jedes Orthogonalsystem (ei )i∈I linear unabhängig und lässt sich
durch Normierung in ein Orthonormalsystem überführen: ( ke1i k ei )i∈I .
Aus der Linearen Analysis ist folgender Aussage bekannt (siehe Satz 11.5.5 und
die drei Zeilen unmittelbar nach dem Beweis von Satz 11.5.5 im Buch Lineare Algebra
von Hans Havlicek).
9.4.5 Proposition. Sei I = {1, . . . , n} endlich und (ei )i∈I ein Orthonormalsystem in ei-
nem Skalarproduktraum (H, (., .)). Weiters sei G der von (ei )i∈I aufgespannte Teilraum
in H.
Dann gilt H = G ⊕ G⊥ , und
X
P : H → G, P(x) := (x, ei )ei
i∈I
⊥
ist eine Projektion von H auf G mit Kern G .
9.4.6 Lemma. Mit der Notation aus Proposition 9.4.5 gilt
kxk2 = kPxk2 + k(I − P)xk2 .
P P
Sind c1 , . . . , cn ∈ C, so gilt k i∈I ci ei k2 = i∈I |ci |2 . Insbesondere gilt
X
kPxk2 = |(x, ei )|2 .
i∈I
P
Schließlich ist y = i∈I (x, ei )ei der Vektor in G mit minimalen Abstand zu x.
Beweis. Sind u, v ∈ H und u⊥v, so gilt (u + v, u + v) = (u, u) + (v, v). Wenden wir diese
Tatsache auf u = Px und v = (I − P)x an, so erhalten wir die erste Gleichung.
Wenden wir sie n-mal auf die Summe c1 e1 + · · · + cn en an, und beachten, dass
kc j e j k2 = |c j |2 , so folgt die zweite Gleichung.
Um die letzte Behauptung zu zeigen, sei y ∈ G beliebig. Der Abstand zum Quadrat
von y zu x ist wegen (x − Px)⊥(y − Px)
(x − y, x − y) = (x − Px + (Px − y), x − Px + (Px − y)) =
(x − Px, x − Px) + (Px − y, Px − y) = kx − Pxk2 + kPx − yk2 .
Also ist immer kx − yk > kx − Pxk außer kPx − yk2 = 0 bzw. y = Px.
❑
Ist nun (ek )k∈N ein abzählbares Orthonormalsystem, so kann man für jedes n ∈ N
die orthogonale Projektion Pn : H → Gn wie in Proposition 9.4.5 betrachten, wobei
Gn die lineare Hülle von e1 , . . . , en . Dabei ist
X
n
Pn x = (x, ek )ek .
k=1
Aus Lemma 9.4.6 wissen wir, dass

X
n
kxk2 = k(I − Pn )xk2 + |(x, ek )|2 .
k=1
Wir erhalten somit folgenden Satz.

9.5. FOURIERKOEFFIZIENTEN UND KONVERGENZ VON FOURIERREIHEN57
P
9.4.7 Satz. Die Reihe ∞ 2 2
k=1 |(x, ek )| konvergiert, d.h. (x, ek ) k∈N ∈ l (N). Insbesondere
ist diese Folge von komplexen Zahlen eine Nullfolge.
P
Außerdem konvergiert die Reihe ∞ k=1 (x, ek )ek in H bzgl. k.k gegen x genau dann,
P∞ 2 2
wenn k=1 |(x, ek )| = kxk .
P
9.4.8 Definition. Man bezeichtnet ∞ k=1 (x, ek )ek als Fourierreihe von x bezüglich dem
Orthonormalsystem (en )n∈N , ob sie nun konvergiert, oder nicht. Konvergiert die Fou-
rierreihe von jedem x ∈ H und ist ihr Grenzwert x, so bezeichnet man (ek )k∈N als
Orthonormalbasis.
9.4.9 Bemerkung. Man beachte, dass wegen

2
X n Xn
ck ek = |ck |2 (9.19)
k=l+1 k=l+1
PN P
mit ck = (x, ek ) die Folge k=1 (x, ek )ek N∈N der Partialsummen der Reihe ∞ k=1 (x, ek )ek
zwar eine Cauchy-Folge, aber, da H nicht vollständig sein muss, nicht notwendiger-
weise konvergiert.
Ist jedoch H ein Hilbertraum, so konvergiert unsere Reihe immer. In der Tat kon-
P
vergiert in solchen Räumen wegen (9.19) jede Reihe der Form ∞ k=1 ck ek , wenn nur
(ck )k∈N ∈ l2 (N).
9.5 Fourierkoeffizienten und Konvergenz von Fourier-

reihen
Betrachten wir den Skalarproduktraum Q[−π, π] so überprüft man leicht, dass
1 1 1 1 1 1 1
√ , √ cos t, √ sin t, √ cos 2t, √ sin 2t, √ cos 3t, √ sin 3t, . . .
2π π π π π π π
ein Orthonormalsystem in von Q[−π, π] ist. Traditionsgemäß wird die Fourierreihe ei-
ner Funktion f ∈ Q[−π, π] bzgl. dieses Orthonormalsystem geschrieben als
a0 X
∞
+ (an cos nt + bn sin nt),
2 n=1
wobei die Fourierkoeffizienten definiert sind durch
Zπ
1
an = f (t) cos nt dt, n = 0, 1, 2, . . . , (9.20)
π
−π
Zπ
1
bn = f (t) sin nt dt, n = 1, 2, . . . . (9.21)
π
−π
Man beachte, dass für reellwertige Funktionen f offensichtlich auch die an und bn
reellwertig sind.
9.5.1 Beispiel. Betrachte die Funktion

 π


 , 0 < x ≤ π,
 4
f := 
 0 , x = 0, ±π,

 −π
4 , −π ≤ x < 0.
Die Funktion ist ungerade, die Fourierreihe wird also eine reine Sinusreihe:
X
∞
sin(2k − 1)t
.
k=1
2k − 1
Wir können aber bis jetzt nichts über die Konvergenz dieser Fourierreihe also der Folge
der Partialsummen
XN
sin (2k − 1)t
gN (t) := , N = 1, 2, 3, . . .
k=1
2k − 1
bzgl. k.k bzw. über die punktweise Konvergenz aussagen.
π
4
t
−π 0 π
f (t)
− π4 g1 (t)
g2 (t)
g3 (t)
Wir wenden uns nun der Frage nach punktweiser Konvergenz der Fourierreihe zu.
Sei zunächst f (x) ein trigonometrisches Polynom vom Grad ≤ l.
9.5.2 Definition. Eine Abbildung f : R → C heißt trigonometrisches Polynom vom

Grad kleiner oder gleich l, falls f eine Linearkombination von Funktionen eint , |n| ≤ l,
bzw. äquivalent, eine Linearkombination von 1, cos t, . . . , cos lt, sin t, . . . , sin lt ist.
Da die n-te Partialsumme
a0 X
n
sn (x) = + (am cos mx + bm sin mx)
2 m=1
gerade die Projektion Pn ( f ) von f auf die lineare Hülle von

1, cos t, . . . , cos nt, sin t, . . . , sin nt ist, folgt sn (x) = f (x) für n ≥ l. Also konver-
giert (sn (x))n∈N trivialerweise gegen f (x) für alle x.
Allgemein lässt sich die n-te Partialsumme umschreiben
Zπ Zπ Zπ
1 X
n
1
sn (x) = f (t) dt + f (t) cos mt dt · cos mx + f (t) sin mt dt · sin mx =
2π π m=1
−π −π −π
Zπ  
1  1 Xn 
= 
f (t) ·  + (cos mt cos mx + sin mt sin mx) dt =
π 2 m=1
−π
Zπ  
1  1 Xn 
= f (t)  + cos m(x − t) dt.
π 2 m=1
−π
Schreibt man
1 X
n
1
Dn (t) := + cos mt, D0 (t) := ,
2 m=1 2
so erhält man
Zπ
1
sn (x) = f (t)Dn (x − t) dt. (9.22)
π
−π
Die Funktion Dn (t) heißt Dirichlet-Kern und ist 2π periodisch. Man sieht leicht mit
Hilfe der Formel für die endliche geometrische Reihe, dass sich Dn schreiben lässt als
1 X ikt sin(n + 2 )t 1
n 1
t
Dn (t) = e = = cos nt + cot · sin nt . (9.23)
2 k=−n 2 sin 2t 2 2
D0 (t)
D1 (t)
D2 (t)
D3 (t)
1
2
t
−π 0 π
Abbildung 9.3: Dirichlet-Kern
Nehmen wir uns eine Funktion f ∈ Q[−π, π] her, vernachlässigen den Funktions-
wert bei π, und setzen f |[−π,π) , 2π-periodisch auf ganz R zu einer Funktion f˜ fort, so
können wir (9.22) in der Form
Zπ
1
sn (x) = f˜(x + t)Dn (t) dt (9.24)
π
−π
schreiben. Man beachte, dass dieser Ausdruck für alle x ∈ R existiert und so wie f˜
auch 2π-periodisch ist. Wegen
Z π
Dn (t) dt = π,
−π
konvergiert die Folge der Partialsummen sn in einem Punkt x gegen ein s(x) ∈ C genau
dann, wenn
Zπ
n→∞
f˜(x + t) − s(x) Dn (t) dt −→ 0. (9.25)
−π
9.5.3 Satz (Lokalisationsprinzip). Für jedes δ > 0 und für die 2π-periodische Fortsetzung g̃ von g ∈ Q[−π, π) auf R gilt
Z
lim g̃(x + t)Dn (t) dt = 0. (9.26)
n→∞
[−π,−δ]∪[δ,π]
Somit hängt das Verhalten der Partialsummen sn (x) einer Funktion f ∈ Q[−π, π) nur von den Werten von f˜ lokal bei x ab.
Genauer gesagt konvergiert sn (x) gegen einen Wert s(x) genau dann, wenn
Z
lim ( f˜(x + t) − s(x))Dn (t) dt = 0. (9.27)
n→∞
[−δ,δ]
Beweis. Setze  


g̃(t + x) , δ < |t| ≤ π, 

g̃(t + x) cot t
, δ < |t| ≤ π,
α(t) :=  β(t) :=  2

 0

0 , |t| ≤ δ, , |t| ≤ δ.
t
Beachte, dass cot 2 auf δ ≤ |t| ≤ π stetig ist und daher β ∈ Q[−π, π]. Es gilt (siehe (9.23))
Z Zπ Zπ
1 1
g̃(t + x)Dn (t) dt = α(t) cos nt dt + β(t) sin nt dt.
2 2
[−π,−δ]∪[δ,π] −π −π
Somit ist die rechte Seite die Summe von Fourierkoeffizienten von Q[−π, π]-Funktionen und somit nach Satz 9.4.7 gegen
Null konvergent
Schließlich folgt (9.27) aus (9.25) und (9.26), wobei wir g(t) = f (t) − s(x) setzen.
❑
9.5.4 Bemerkung. Das Lokalisationsprinzip zeigt einen grundlegenden Unterschied zwischen trigonometrischen Reihen
und Potenzreihen auf. Denn stimmen zwei Funktionen in einer Umgebung des Entwicklungspunktes überein, so haben sie
die selbe Taylorreihe. Dagegen folgt für die entsprechenden Fourierreihen nur, dass sie sich lokal bei diesem Punkt gleich
verhalten.
Folgender Satz liefert uns ein hinreichendes Kriterium für die Konvergenz der Fol-
ge (sn (x))n∈N , das einfach zu überprüfen ist.
9.5.5 Satz. Sei f ∈ Q[−π, π], und sei f˜ die 2π-periodisch Fortsetzung von f |[−π,π) auf
ganz R. Weiters sei x ∈ R. Existieren die einseitigen Limites
f˜(x+) := lim f˜(t), f˜(x−) := lim f˜(t),
t→x+ t→x−
und die verallgemeinerten einseitigen Ableitungen

f˜(x + h) − f˜(x+) ˜′ f˜(x + h) − f˜(x−)
f˜′ (x+) := lim , f (x−) := lim ,
h→0+ h h→0− h
dann folgt
f˜(x+) + f˜(x−)
lim sn (x) = . (9.28)
n→∞ 2
Beweis. Wegen (9.25) lässt sich die gewünschte Beziehung (9.28) umformulieren zu5
Zπ !
f˜(x+) + f˜(x−)
lim f˜(x + t) − Dn (t) dt =
n→∞ 2
−π
5 Man beachte, dass Dn (t) eine gerade Funktion ist.
Zπ

lim f˜(x + t) + f˜(x − t) − f˜(x+) − f˜(x−) Dn (t) dt = 0.
n→∞
0
Mit Hilfe von (9.23) sehen wir, dass dieses Integral übereinstimmt mit
Zπ
1
f˜(x + t) + f˜(x − t) − f˜(x+) − f˜(x−) · cos nt dt+
2
0
Zπ !
f˜(x + t) + f˜(x − t) − f˜(x+) − f˜(x−) t
+ cos · sin nt dt. (9.29)
2 sin 2t 2
0
Die Funktion in der Klammer im ersten Integral ist offenbar in Q[−π, π]. Das erste
Integral ist also der Fourierkoeffizient von cos nt in der Fourierreihe dieser Funktion
multipliziert mit 1(0,π) , und nach Satz 9.4.7 eine Nullfolge für n → ∞.
Die Funktion g in der Klammer des zweiten Integrals liegt ebenfalls ebenfalls in
Q[−π, π], denn es gilt
f˜(x + t) − f˜(x+) + f˜(x − t) − f˜(x−) t

lim · cos =
t→0+ 2 sin 2t 2
!
f˜(x + t) − f˜(x+) f˜(x − t) − f˜(x−) t t
lim + · t · cos = f˜′ (x+) − f˜′ (x−),
t→0+ t t 2 sin 2 2
und weg von der Null überträgt sich die Tatsache, dass t 7→ f˜(x + t) + f˜(x − t)
stückweise stetig auf [−π, π] ist, auf g. Also ist das zweite Integral in (9.29) der
Fourierkoeffizient von sin nt in der Fourierreihe von g multipliziert mit 1(0,π) und nach
Satz 9.4.7 ebenfalls eine Nullfolge für n → ∞.
❑
9.5.6 Bemerkung. Mit einer nur etwas verfeinerten Argumentation sieht man, dass (9.28) gilt, wenn für ein hinreichend
kleines δ > 0 Z Z
| f (x + t) − f (x+)| | f (x − t) − f (x−)|
dt < +∞, dt < +∞,
(0,δ) t (0,δ) t
gilt.
9.5.7 Definition. Eine Abbildung f : [a, b] → R (C) heißt stückweise stetig differen-
zierbar , falls es eine Zerlegung a = t0 < · · · < tn = b von [a, b] gibt, sodass jede
Einschränkung f |(t j−1 ,t j ) eine stetig differenzierbare Fortsetzung auf [t j−1 , t j ] hat.
9.5.8 Bemerkung. Ist f stückweise stetig differenzierbar auf [−π, π], so sind die Vor-
aussetzungen von Satz 9.5.5 für alle x ∈ R erfüllt.
Also konvergiert die Fourierreihe bei Stetigkeitspunkten x von f˜ gegen f˜(x) und
˜ ˜
sonst gegen f (x+)+2 f (x−) .
9.5.9 Beispiel. Wir betrachten f (x) = |x|, x ∈ [−π, π]. Die 2π-periodische Fortsetzung
dieser Funktion6 ist stückweise stetig differenzierbar. Also konvergiert die Fourierreihe
punktweise gegen f . Die Fourierkoeffizienten berechnet man folgendermaßen (n > 0):
Z Z
1 π 2 π
an = |t| cos nt dt = t cos nt dt =
π −π π 0
6 Sägezahnfunktion.
Z π
2 2 2
− sin nt dt = (cos nπ − cos 0) = 2 ((−1)n − 1),
nπ 0 n2 π n π
a0 = π und die bn = 0, da die Funktionen |t| sin nt ungerade sind. Also gilt (x ∈ [−π, π])
π 4X
∞
1
|x| = − cos(2n − 1)x.
2 π n=1 (2n − 1)2
Setzen wir x = 0, so erhalten wir
π2 X
∞
1
= .
8 n=1
(2n − 1)2
9.5.10 Bemerkung. Hat man eine Funktion f gegeben mit Periode 2T , so kann man
diese mittels einer Umskalierung in eine Fourierreihe entwickeln. Diese schaut folgen-
dermaßen aus: !
a0 X
∞
πkx πkx
+ ak cos + bk sin
2 k=1 T T
mit
ZT
1 πkx
ak = f (x) cos dx, k = 0, 1, 2, . . . ,
T T
−T
ZT
1 πkx
bk = f (x) sin dx, k = 1, 2, . . . .
T T
−T
Hat man nun zum Beispiel eine Funktion y0 (x) am Intervall [0, 1] gegeben und
möchte diese in eine reine Sinusreihe entwickeln, so geht man vor wie folgt: Zunächst
definiert man eine Funktion f auf [−1, 1] indem man y0 ungerade fortsetzt. D.h. man
setzt 


 −y0 (−x) , −1 ≤ x < 0.



f (x) := 
 0 ,x=0



y0 (x) ,0 < x ≤ 1
Diese Funktion entwickelt man auf [−1, 1] in eine Fourierreihe. Das ist eine reine Si-
nusreihe, da wir f ja als ungerade definiert haben. Eingeschränkt auf [0, 1] erhalten wir
die gewünschte Entwicklung von y0 .
9.6 Gleichmäßige Konvergenz von Fourierreihen

Sei f ∈ Q[−π, π] und
a0 X
∞
+ (an cos nt + bn sin nt),
2 n=1
ihre Fourierreihe. Falls diese Reihe auf [−π, π] (und wegen der 2π-Periodizität damit
auf R) gleichmäßig konvergiert, so ist die Grenzfunktion als gleichmäßiger Grenzwert
stetiger Funktionen sicherlich stetig. Damit die Fourierreihe dann f als gleichmäßigen
Grenzwert hat, ist es notwendig, dass auch f stetig ist.
Für ein hinreichendes Kriterium betrachten wir ein stetiges und stückweise stetig
differenzierbares f : [−π, π] → C mit f (−π) = f (π). Da insbesondere f ∈ Q[−π, π],
9.6. GLEICHMÄSSIGE KONVERGENZ VON FOURIERREIHEN 63
P
können wir die Fourierreihe a20 + ∞ n=1 (an cos nt + bn sin nt) von f betrachten. Nun sei
g : [−π, π] → C definiert durch g(x) = f ′ (x), wenn f bei x differenzierbar ist, und
g(x) = 0 sonst.
Da f stetig und stückweise stetig differenzierbar ist, gibt es eine Zerlegung −π =
t0 < t1 < · · · < tn = π von [−π, π], sodass sich die Funktionen f |(t j−1 ,t j ) stetig differen-
zierbar auf [t j−1 , t j ] fortsetzen lassen. Wegen der Stetigkeit von f ist diese Fortsetzung
gerade f |[t j−1 ,t j ] .
Also gilt g(x) = f ′ (x) für alle x ∈ [−π, π] \ {t0 , . . . , tn }, und g|(t j−1 ,t j ) hat die stetige
Fortsetzung ( f |[t j−1 ,t j ] )′ auf [t j−1 , t j ], dh. g ∈ Q[−π, π].
Bezeichnet αn , n ∈ N ∪ {0}, und βn , n ∈ N, die Fourierkoeffizienten von g, so folgt
mittels partieller Integration
Zπ Zt j
1X
n
1
αn = g(t) cos nt dt = ( f |[t j−1 ,t j ] )′ (t) cos nt dt =
π π j=1
−π t j−1
Zt j
1X 1X
n n
( f (t j ) cos nt j − f (t j−1 ) cos nt j−1 ) − f |[t j−1 ,t j ] (t)(−n sin nt) dt =
π j=1 π j=1
t j−1
f (π) cos nπ − f (−π) cos(−nπ) + nbn = nbn .

Ganz ähnlich berechnet man βn = −nan , n ∈ N. Aus diesen Überlegungen ergibt sich
folgender Satz.
9.6.1 Satz. Ist f : [−π, π] → C stetig und stückweise stetig differenzierbar mit f (−π) =
P
f (π), so konvergiert ihre Fourierreihe a20 + ∞ n=1 (an cos nt +bn sin nt) gleichmäßig gegen
die 2π-periodisch Fortsetzung f˜ von f |[−π,π) .
Beweis. Wir verwenden obige Notation. Nach Satz 9.4.7 sind die Folgen der Fourier-
koeffizienten (αn )n∈N und (βn )n∈N von g quadratisch summierbar, dh. sie liegen in l2 (N).
Aus der Cauchy-Schwarzschen Ungleichung, Lemma 3.1.4, folgt
X X X X ! N ! 1 1
1 2 X 2 2
N N N N
|nan | |βn |
|an | = = ≤ |βn | ,
n=1 n=1
|n| n=1
|n| n=1
n2 n=1
P P 1 PN 1
und für N → ∞, dass n∈N |an | ≤ ( n∈N n12 ) 2 ( n=1 |βn |2 ) 2 < ∞. Genauso sieht man
P
n∈N |bn | < +∞. Nach
P
dem Kriterium von Weierstraß, Korollar 6.7.4, konvergiert die
Fourierreihe a20 + ∞n=1 n cos nt + bn sin nt) gleichmäßig auf R und zwar wegen Satz
(a
9.5.5 gegen f˜.
❑
Ist f : [−π, π] → C nur stetig mit f (−π) = f (π), so lässt sich f beliebig gut etwa
durch stetige und stückweise lineare Funktionen approximieren. In Kombination mit
Satz 9.6.1 folgt daraus, dass sich jede stetige Funktion auf [−π, π] mit den gleichen
Werten bei ±π beliebig gut gleichmäßig durch trigonometrische Funktionen approxi-
mieren lässt. Diese Tatsache lässt sich auch mit den Mitteln des Fejér Kerns zeigen,
vgl. Satz 9.7.2. Daraus leitet man wiederum her, dass für jedes stetige f : [−π, π] → C
mit f (−π) = f (π) die Fourierreihe von f bzgl. k.k2 in Q[−π, π] gegen f konvergiert.
Siehe diesbezüglich Korollar 9.7.3 samt Beweis.
P
9.6.2 Bemerkung. Die Fourierreihe a20 + ∞ n=1 (an cos nt + bn sin nt) der Funktion f (x) =
|x|, x ∈ [−π, π], aus Beispiel 9.5.9 konvergiert nach Satz 9.6.1 sogar gleichmäßig gegen
die 2π-periodische Fortsetzung von f . Also gilt
lim ksn − gk∞ = 0,

n→∞
wobei k.k∞ die Supremumsnorm [−π, π] ist, und
a0 X
n
sn (t) = + (am cos mt + bm sin mt).
2 m=1
Da f reellwertig ist, liegen die Koeffizienten an , bn in R.

Da die Funktionen cos mt, sin mt und damit sn (t) in Potenzreihen mit Konvergenzra-
dius +∞ entwickelbar sind, konvergiert die Potenzreihe auf [−π, π] sogar gleichmäßig
(vgl. Satz 6.7.8).
Nimmt man eine Partialsumme dieser Potenzreihe mit hinreichend großem Index,
so hat man ein Polynom pn (t) mit reellen Koeffizienten, sodass ksn − pn k∞ ≤ 1n . Mit der
Dreiecksungleichung folgt
1 n→∞
kg − pn k∞ ≤ + kg − sn k∞ −→ 0.
n
Also gibt es eine Folge (pn )n∈N von Polynomen mit reellen Koeffizienten, die auf
[−π, π] gleichmäßig gegen f konvergiert.
Ist c > 0 bliebig, so konvergiert dann s 7→ πc pn ( πc s), n ∈ N, gleichmäßig auf [−c, c]
gegen s 7→ πc f ( πc s) = πc πc |s| = |s|. Also ist auch auf [−c, c] die Funktion s 7→ |s|
gleichmäßiger Grenzwert einer Folge von Polynomen mit reellen Koeffizienten.
Wenn man die Methoden aus Bemerkung 9.6.2 mit den davor erwähnten kombi-
niert, erhält man allgemeiner, dass man auf jedem Intervall [a, b] jede stetig Funktion
beliebig gut durch eine Folge von Polynomen gleichmäßig approximieren kann, vgl.
Satz 9.7.5 sowie Satz 12.10.4.
9.7 Fejér Kern

Man überzeugt sich leicht, dass für eine
Nullfolge (an )n∈N∪{0} bestehend aus nichtnegativen reellen Zahlen auch die Folge
1 Pn
der arithmetischen Mittel n+1 j=0 a j n∈N∪{0} eine Nullfolge bildet. Daraus schließt man leicht, dass für eine konvergente
Folge (sn )n∈N0 auch die Folge (σn )n∈N0 der arithmetischen Mittel
s0 + s1 + . . . + sn
σn := ,
n+1
konvergiert, und zwar gegen den gleichen Grenzwert. Die Umkehrung gilt jedoch nicht, wie man am Beispiel der Folge
1, 0, 1, 0, 1, 0, . . . sieht. P
a
Somit ist es einen Versuch wert, für eine Funktion f mit Fourierreihe 20 + ∞n=1 (an cos nx + bn sin nx), die Reihe in
diesem verallgemeinerten Sinne zu summieren. Man betrachtet also die sogenannten Cesaro-Mittel:
s0 (x) + s1 (x) + . . . sn (x)

σn (x) :=
n+1
a P
wobei sn (x) = 20 + nm=1 (am cos mx + bm sin mx) ist. Man beachte, dass genauso wie die sn (x) auch die σn (x) trigonometri-
sche Polynome vom Grad ≤ n sind.
Die Vorgangsweise ist nun ähnlich wie vorher. Mit (9.24) können wir σn (x) für n ∈ N ∪ {0} als
Zπ
1
σn (x) = f˜(x + t)Fn (t) dt, (9.30)
π
−π
9.7. FEJÉR KERN 65
schreiben, wobei f˜ die 2π-periodische Fortsetzung von f |[−π,π) auf R ist und wobei Fn (t) den Fejér-Kern7
1
Fn (t) = D0 (t) + . . . + Dn (t)
n+1
bezeichnet. Aus (9.23) folgt

!
1 1 1
Fn (t) = t sin(0 + )t + . . . + sin(n + )t =
2(n + 1) sin 2
2 2
  !
1 Xn 1  1 exp i(n + 1)t − 1
t Im  exp ( j + )it  = t Im t t =
2(n + 1) sin 2 j=0
2 2(n + 1) sin 2 exp(i 2 ) − exp(−i 2 )
!  2
1 t sin(n + 1) 2t 1  sin (n+1)t 
t Im exp i(n + 1) t =  2
 . (9.31)
2(n + 1) sin 2
2 sin 2 2(n + 1) sin 2t
F0 (t)
F1 (t)
F2 (t)
F3 (t)
1
2
t
−π 0 π
Abbildung 9.4: Fejér-Kern

Der Fejér Kern hat folgende Eigenschaften.
9.7.1 Lemma. Für alle n ∈ N ∪ {0} gilt
Fn (t) ≥ 0,
1
Rπ
π Fn (t) dt = 1
−π
Für jedes δ > 0 gilt limk→∞ Fk (t) = 0 gleichmäßig auf [−π, −δ] ∪ [δ, π].
Beweis. Die Eigenschaft Fn (t) ≥ 0 ist klar wegen der Darstellung (9.31).
Rπ Rπ
Fn (t) dt = π folgt wegen Dn (t) dt = π und der Definition von Fn . Um die letzte Aussage zu zeigen, genügt es zu
−π −π
bemerken, dass auf Grund von (9.31)
1
Fn (t) ≤ , t ∈ [−π, π] \ {0}.
2(n + 1) sin2 t
2
❑
9.7.2 Satz (Fejér). Sei f : [−π, π] → C stetig, wobei f (π) = f (−π). Weiters sei f˜ die 2π-periodische Fortsetzung auf R.
Bezeichne σn die Folge der Cesaro-Mittel der Fourierreihe, dann gilt
lim σn (x) = f˜(x)

n→∞
n→∞
gleichmäßig für alle x ∈ R, d.h. σn −→ f˜ bzgl. k.k∞ . Für reellwertiges f sind die σn dabei auch reellwertig.
7 Leopold Fejér, geb.9.2.1880 Pecs, gest.15.10.1959 Budapest

Beweis. Zuerst sei bemerkt, dass f auf [−π, π] wegen Satz 6.3.3 gleichmäßig stetig ist. Man sieht sofort, dass dann auch f˜
gleichmäßig stetig ist.
Wegen (9.30) und Lemma 9.7.1 ist die Behauptung äquivalent zu
Zπ
n→∞
π(σn (x) − f (x)) = f˜(x + t) − f˜(x) Fn (t) dt −→ 0,
−π
und zwar gleichmäßig in x. Sei also ǫ > 0 und wähle gemäß der gleichmäßigen Stetigkeit δ > 0 so, dass | f˜(x + t) − f˜(x)| < ǫ,
wenn nur |(x + t) − x| = |t| < δ.
Wegen Lemma 9.7.1 gibt es ein N ∈ N, sodass 0 ≤ Fn (t) < ǫ für alle t ∈ [−π, −δ] ∪ [δ, π] und n ≥ N. Wir erhalten
(durch mehrfache Verwendung von Lemma 9.7.1)
π
Z
˜f (x + t) − f˜(x)Fn (t) dt ≤

−π
Zδ Z Z π!
f˜(x + t) − f˜(x)F (t) dt + f˜(x + t) − f˜(x)F (t) dt ≤
−δ
n + n
−π δ
−δ
Zδ Z −δ Z π!
ǫ · Fn (t) dt + + 2 · k f˜k∞ · ǫ dt ≤ ǫ + 4π · k f˜k∞ · ǫ.
−π δ
−δ
Damit konvergiert σn gleichmäßig gegen f˜. Für reellwertiges f sind die Fourierkoeffizienten reell und daher auch die σn
reellwertig.
❑
√
9.7.3 Korollar. Für jedes stetige f : [−π, π] → C mit f (π) = f (−π) konvergiert seine Fourierreihe bezüglich k.k (= (., .))
gegen f .
Rπ
Beweis. Klarerweise ist kgk2 = −π |g(x)|2 dx ≤ 2πkgk2∞ , und somit kσn − f k → 0. Nach Lemma 9.4.6 ist die Partialsumme
sn der Fourierreihe von f das eindeutige Element in der linearen Hülle von 1, cos t, . . . , cos nt, sin t, . . . , sin nt mit kleinstem
Abstand zu f . Da auch σn in dieser Hülle liegt, gilt kσn − f k ≥ ksn − f k und somit sn → f bezüglich k.k.
❑
2
9.7.4 Bemerkung. Es gilt in der Tat, dass die Fourierreihe einer jeden Funktion f aus L [−π, π] und somit jeder Funktion
aus Q[−π, π] gegen f bezüglich k.k konvergiert. L2 [−π, π] ist dabei die Menge aller auf [−π, π] quadratisch Lebesgue-
integrierbaren Funktionen. Diese Art von Räumen wird in der Maßtheorie betrachtet.
Als weiteres Korollar erhalten wir folgenden wichtigen Satz.
9.7.5 Satz (Weierstraß). 8 Sei f eine stetige reellwertige (komplexwertige) Funktion auf dem Intervall [a, b]. Dann existiert
eine Folge (pn )n∈N von reellen (komplexen) Polynomen, sodass
lim pn = f
n→∞
gleichmäßig auf [a, b]. Anders ausgedrückt ist die Menge aller reellen (komplexen) Polynome auf [a, b] ist dicht im metri-
schen Raum C([a, b], R) bzw. C([a, b], C).
Beweis. Zunächst bearbeiten wir den komplexen Fall. Man überzeugt sich leicht mit Hilfe einer affinen Abbildung von
[−1, 1] auf [a, b], dass man oBdA. [a, b] = [−1, 1] annehmen kann. Nun sei g eine stetige Fortsetzung von f : [−1, 1] → C
auf [−π, π], sodass g(−π) = g(π).
Nach Satz 9.7.2 gibt es ein trigonometrisches Polynom
X
m
1
qn (t) = c + c j cos jt + d j sin jt mit kqn − gk∞ < .
j=1
2n
Da die Funktionen cos jt, sin jt und damit qn (t) in Potenzreihen mit Konvergenzradius +∞ entwickelbar sind, konvergiert
die Potenzreihe auf [−1, 1] sogar gleichmäßig (vgl. Satz 6.7.8). Nimmt man eine Partialsumme dieser Potenzreihe mit
1
hinreichend großem Index, so hat man ein Polynom pn (t), sodass kpn − qn k∞ < 2n . Mit der Dreiecksungleichung folgt
kpn − gk∞ < n1 und somit die Behauptung.
Den reellwertigen Fall zeigt man analog. Man muss nur beachten, dass man das reellwertige f zu einem stetigen
g : [−π, π] → R mit g(−π) = g(π) fortsetzen kann. Zu diesem sind dann auch die qn (t) reellwertig (vgl. Satz 9.7.2).
❑
Wir bringen hier einen Beweis des Satzes von Weierstraß ohne Mitteln der Fourieranalysis.
8 Karl Theodor Wilhelm Weierstraß, geb.31.10.1815 Ostenfelde, gest.19.2.1897 Berlin

9.7. FEJÉR KERN 67
9.7.6 Satz (Weierstraß). Sei f eine stetige reellwertige Funktion auf dem Intervall [a, b]. Dann existiert eine Folge (Pn )n∈N
von reellen Polynomen, sodass
lim Pn = f
n→∞
gleichmäßig auf [a, b]. Anders ausgedrückt: Die Menge aller Polynome auf [a, b] ist dicht im metrischen Raum C([a, b], R).
Beweis. Wir können o.B.d.A. voraussetzen, dass [a, b] = [0, 1] ist, denn sonst betrachte f˜(x) := f (a + x(b − a)). Weiters sei
o.B.d.A. f (0) = f (1) = 0, denn sonst betrachte f˜(x) := f (x) − f (0) − x( f (1) − f (0)).
Sei also f : [0, 1] → R stetig mit f (0) = f (1) = 0. Setze f fort zu einer Funktion auf ganz R durch die Vorschrift
f (x) = 0, x < [0, 1], dann ist f sogar gleichmäßig stetig auf ganz R.
Betrachte die Funktion (n ∈ N)
(
cn (1 − x2 )n , x ∈ [−1, 1]
Qn (x) :=
0 , sonst
R1 1
R1
wobei cn so gewählt ist, dass Qn (x)dx = 1 gilt, also cn = (1 − x2 )n dx.
−1 −1
Wegen der Bernouillschen Ungleichung sieht man (1 − x2 )n ≥ 1 − nx2 für x ∈ [0, 1), und mittels Einsetzen auch für
x = 1. Aus
Z1 Z1
(1 − x2 )n dx = 2 (1 − x2 )n dx ≥
−1 0
√ √
Z n
1/ 1/
Z n
4 1
≥2 (1 − x2 )n dx ≥ 2 (1 − nx2 )dx = √ > √ ,
3 n n
0 0
√
erhalten wir cn < n. Es folgt für jedes δ > 0
√
Qn (x) = cn (1 − x2 )n ≤ n(1 − δ2 )n , δ ≤ |x|.
D.h. limn→∞ Qn (x) = 0 gleichmäßig auf [−1, 1] \ (−δ, δ).

R1
Setze Pn (x) := f (x + t)Qn (t) dt, x ∈ [0, 1]. Da f außerhalb von [0, 1] verschwindet, sieht man mit der Substitutions-
−1
regel
Z1−x Z1
Pn (x) = f (x + t)Qn (t) dt = f (t)Qn (t − x) dt,
−x 0
also ist Pn ein Polynom.

Sei ǫ > 0 gegeben. Wähle δ > 0 so, dass für |y − x| < δ stets | f (y) − f (x)| < ǫ gilt. Weiters sei n so groß, dass |Qn (t)| < ǫ
für t ∈ [−1, 1] \ (−δ, δ). Es gilt (M := sup | f (x)|)
Z1
|Pn (x) − f (x)| = ( f (x + t) − f (x))Qn (t) dt ≤
−1
Z1
≤ | f (x + t) − f (x)|Qn (t) dt ≤
−1
Z−δ Zδ Z1
≤ 2M Qn (t) dt + ǫ Qn (t) dt + 2M Qn (t) dt ≤
−1 −δ δ
≤ 4Mǫ + ǫ ≤ (4M + 1)ǫ.
❑
9.7.7 Bemerkung. Die wesentlichen Eigenschaften von Qn sind
(i) Qn (x) ≥ 0,
R1
(ii) Qn (x)dx = 1,
−1
(iii) Für jedes δ > 0 gilt limn→∞ Qn (t) = 0 gleichmäßig auf 1 ≥ |t| ≥ δ,
und natürlich, daß Qn Polynome sind, denn daher ist auch das Faltungsintegral Pn ein Polynom.
Man könnte glauben, dass diese Polynome nichts anderes sind, als Partialsummen einer Taylorreihe. Dem ist aber im
Allgemeinen nicht so, da sonst ja jede stetige Funktion gleichmäßiger Limes einer Potenzreihe wäre und somit unendlich
oft ableitbar.
Schließlich wollen wir noch bemerken, dass dieser Satz auch für komplexwertige stetige Funktionen auf einem kom-
pakten reellen Intervall und Polynome mit komplexen Koeffizienten gilt. Das sieht man unmittelbar ein, wenn man obigen
Satz auf den Realteil und auf den Imaginärteil der Funktion anwendet.
9.7.8 Beispiel. Sei f ∈ C([0, 1]) := C([0, 1], R) und gelte
Z1
f (t)tn dt = 0, n = 0, 1, 2, . . . . (9.32)
0
Dann folgt f = 0. Denn: Sei A die Menge aller aller reellen Polynome. Wegen (9.32) gilt
Z1
f h dt = 0, h ∈ A, (9.33)
0
R1
und nach dem Satz von Weierstraß gemeinsam mit Satz 8.7.2 folgt sogar f h dt = 0, h ∈ C([0, 1]). Insbesondere gilt
0
R1
f 2 dt = 0 und damit wegen der Stetigkeit von f auch f = 0.
0
R1
Man könnte ausgehend von (9.32) auch wie folgt argumentieren: Es gilt f (t)Qn (t − x) dt = 0, wobei die Qn so wie
0
im Beweis des Satzes von Weierstraß sind. Diese Ausdrücke konvergieren für n → ∞ gegen f (x), also folgt f = 0.
Kapitel 10
Ableitungen nach mehreren

Variablen
10.1 Partielle Ableitungen

Wir wollen in diesem Kapitel die Differentialrechnung für auf D ⊆ Rn definierte Funk-
tionen entwickeln. Dazu wollen wir im folgenden mit ei den i-ten kanonischen Basis-
vektor ei = (0, . . . , 0, 1, 0, . . . , 0)T mit der 1 an der i-ten Stelle bezeichnen.
10.1.1 Definition. Sei (X, k.k) ein Banachraum1. Sei f : D → X definiert auf einer
offenen Menge D ⊆ Rn . Existiert für ein x ∈ D der Limes
∂f 1
(x) := lim f (x + tei ) − f (x) , (10.1)
∂xi t→0 t
so heißt dieser die partielle Ableitung von f nach der Variablen xi an der Stelle x.
∂f
Anstatt ∂x i
(x) schreibt man auch Di f (x) oder f xi (x).
Ist allgemeiner v = (α1 , . . . , αn )T ∈ R p ein sogenannter Richtungsvektor, und exis-

tiert für x ∈ D der Limes
∂f 1
(x) := lim f (x + tv) − f (x)
∂v t→0 t
so heißt dieser die Richtungsableitung von f an der Stelle x in Richtung v.

Offensichtlich gilt für den Richtungsvektor ei
∂f ∂f
(x) = (x).
∂xi ∂ei
10.1.2 Bemerkung. Für x ∈ D und v ∈ R p ist die Abbildung t 7→ x + tv von R nach

Rn stetig, wobei 0 auf x abgebildet wird. Da D ⊆ Rn offen ist, gibt es daher ein reelles
Intervall (−δ, δ) mit δ > 0 um die Null, sodass x + tv ∈ D für alle t ∈ (−δ, δ). Setz man
g(t) := f (x + tv), t ∈ (−δ, δ),

1 Man sollte anfangs einfach an R oder Rm denken.
69
70 KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN
so bildet g das Intervall (−δ, δ) nach X hinein ab. Wegen

1 1
f (x + tv) − f (x) = g(t) − g(0)
t t
∂f
ist g genau dann bei Null differenzierbar, wenn ∂v (x) existiert. In dem Fall gilt dann
∂f
g′ (0) = (x).
∂v
Richtungsableitungen sind ihrer Natur nach also “eindimensional“. Denn man betrach-
tet ja f eingeschränkt auf die Strecke x + tv, t ∈ (−δ, δ). Insbesondere variiert bei
der Bildung der partiellen Ableitung nach xi wie in (10.1) beim Differenzenquotienten
f (x+tei )− f (x)
t im Vektor x + tei , t ∈ (−δ, δ) nur die i-te Koordinate.
e2 e2
v
x
x + te1 x
x + tv
e1 e1
Abbildung 10.1: Ableitung in Richtung der Koordinate x1 bzw. des Vektors v
10.1.3 Definition. Sei f : D ⊆ Rn → X definiert auf der offenen Menge D. Existieren

∂f ∂f
alle partiellen Ableitungen ∂x 1
(x), . . . , ∂x n
(x), x ∈ D, so heißt f partiell differenzierbar
auf.
∂f
Sind alle X-wertigen Funktionen x 7→ ∂x j
(x), j = 1, . . . , n, darüberhinaus stetig auf
D, so heißt f stetig partiell differenzierbar. Wir schreiben dafür f ∈C 1 oder f ∈ C 1 (D).
Wir wissen, dass Netze in Rm genau dann konvergieren, wenn sie komponen-
tenweise konvergieren. Ist also X = Rm , so ist die Tatsache, dass eine Funktion
f : D ⊆ Rn → Rm , f = ( f1 , . . . , fm )T , (stetig) partiell differenzierbar ist, äquivalent
dazu, dass jede ihrer Komponenten fk (stetig) partiell differenzierbar ist.
10.1.4 Lemma. Sei f : D ⊆ Rn → X, v = (α1 , . . . , αn )T ∈ R p ein Richtungsvektor und
sei x ∈ D. Wähle δ > 0 so, dass x + tv ∈ D für t ∈ (−δ, δ). Falls f ∈ C 1 (D), so ist die
Funktion g : (−δ, δ) → X definiert durch
g(t) := f (x + tv), t ∈ (−δ, δ),
stetig differenzierbar auf (−δ, δ), dh. g ∈ C 1 (−δ, δ), wobei

X
n
∂f
g′ (t) = αi (x + tv), t ∈ (−δ, δ).
i=1
∂xi
Beweis. Sei t ∈ (−δ, δ), und setze y = x+tv, und wähle ρ > 0 so klein, dass2 Uρ·kvk∞ (y) ⊆
D. Betrachte die Vektoren
v0 := 0, vi := α1 e1 + . . . + αi ei , i = 1, . . . , n.
2 Wir versehen hier praktischerweise Rn mit k.k∞ .
10.1. PARTIELLE ABLEITUNGEN 71
Offensichtlich ist vn = v. Da die ganze Kugel mit Radius ρ und Mittelpunkt y in D

liegt, sind alle Punkte y + svi in D für |s| < ρ, und damit auch alle Verbindungsstrecken
zwischen ihnen (Kugeln sind konvex, vgl. Bemerkung 10.1.23).
Für |s| < ρ gilt nach dem Hauptsatz der Differental- und Integralrechnung (vgl.
(9.13))
X
n

g(t + s) − g(t) = f (y + sv) − f (y) = f (y + svi ) − f (y + svi−1 ) = (10.2)
i=1
n Z
X sαi
∂f
(y + svi−1 + τei ) dτ,
i=1 0 ∂xi
und daher
g(t + s) − g(t) X ∂ f
n
− αi (y) = (10.3)
s i=1
∂xi
X
n Z sαi !
1 ∂f ∂f
(y + svi−1 + τei ) − (y) dτ.
i=1
s 0 ∂xi ∂xi
Wegen (9.11) ist die Norm dieses Ausdruckes kleiner oder gleich
X
n
∂f ∂ f
|αi | sup (y + svi−1 + τei ) − (y) .
i=1 τ∈[0,sαi ] ∂xi ∂xi
Wegen der Stetigkeit der partiellen Ableitungen in y konvergiert dieser Ausdruck

gegen 0, wenn s → 0.
❑
Zusammen mit Bemerkung 10.1.2 erhalten wir unmittelbar aus Lemma 10.1.4
10.1.5 Korollar. Für eine Funktion f : D ⊆ Rn → X mit f ∈ C 1 (D) existieren alle

Richtungsableitungen ∂∂vf (x) für x ∈ D und v ∈ Rn . Für v = (α1 , . . . , αn )T gilt dabei
∂f X ∂f n
(x) = αi (x). (10.4)
∂v i=1
∂xi
∂f
Insbesondere ist auch x 7→ ∂v (x) eine stetige Funktion von D nach X.
10.1.6 Bemerkung. Wir haben im Beweis von Lemma 10.1.4 die Stetigkeit der parti-
ellen Ableitungen (in allen Variablen gleichzeitig) benützt, um zu zeigen, dass (10.3)
gegen Null strebt, wenn s → 0.
Beachte, dass z.B. die Funktion aus Beispiel 9.1.8 stets Richtungsableitungen
in Richtung der Koordinatenachsen besitzt, die Richtungsableitung in Richtung v =
√1 (e1 + e2 ) jedoch bei 0 nicht existiert. Man kann also in Lemma 10.1.4 die Vorausset-
2
∂f
zung der Stetigkeit der ∂xi nicht weglassen.
∂f
Die Tatsache, dass für festes x die Richtungsableitung ∂v (x) in (10.4) linear von v
abhängt, legt folgende Begriffsbildung nahe.
10.1.7 Definition. Sei f : D ⊆ Rn → X stetig partiell differenzierbar, und x ∈ D. Dann

bezeichne d f (x) ∈ L(Rn , X) die lineare Abbildung
 
α1  Xn
 .  ∂f
 ..  7→ αi (x).
  i=1
∂x i
αn
Sie heißt die Ableitung von f im Punkt x.

Nach Korollar 10.1.5 ist d f (x)v gerade ∂∂vf (x), also die Richtungsableitung von f in
∂f
x in Richtung v. Insbesondere gilt d f (x)ei = ∂x i
(x).
10.1.8 Fakta.
1. Ist D ⊆ R, dh. n = 1, so ist d f (x) gerade jene lineare Abbildung R → X, die 1
auf f ′ (x) abbildet.
2. Wir wissen, dass Netze in Rm genau dann konvergieren, wenn sie komponenten-
weise konvergieren. Für X = Rm (versehen mit zB. k.k∞ ) ist somit die Tatsache,
dass eine Funktion f : D ⊆ Rn → Rm , f = ( f1 , . . . , fm )T , (stetig) partiell diffe-
renzierbar ist, äquivalent dazu, dass jede ihrer Komponenten fk (stetig) partiell
differenzierbar ist.
3. Ist f : D ⊆ Rn → Rm stetig differenzierbar, und x ∈ D, und zerlegen wir f (x)
in seine Komponenten, f (x) = ( f1 (x), . . . , fm (x))T , so hat d f (x) ∈ L(Rn , Rm )
Rm×n als Matrix die Darstellung
!
∂ fi
d f (x) = (x) .
∂x j i=1,...,m
j=1,...,n
Ist dabei m = 1, d.h. f ist R-wertig, so nennt man den Vektor d f (x)T auch den
Gradienten und schreibt auch grad f (x) dafür.
4. Ist f : D ⊆ Rn → X eine affine Abbildung, also von der Form x 7→ x0 + Ax mit
x0 ∈ X und einer linearen Abbildung A : Rn → X, so hat man

x0 + A(x + tei ) − x0 + A(x) A(tei )
d f (x)ei = lim = lim = A(ei ),
t→0 t t→0 t
und damit d f (x) = A für alle x ∈ D. Das ist eine Verallgemeinerung der Tatsache,
dass im eindimensionalen die Ableitung einer linearen Funktion kx + d konstant
gleich der Steigung k ist.
10.1.9 Beispiel. Sei D = R+ × R ⊆ R2 und T : D → R2 definiert durch

! !
r r cos t
T = .
t r sin t
Diese Polarkoordinatenfunktion kennen wir schon aus dem ersten Semester (siehe De-
finition 6.8.12 und Bemerkung 6.8.13). Nun gilt offensichtlich
! ! ! !
∂T r cos t ∂T r −r sin t
= und = .
∂r t sin t ∂t t r cos t
Also sind ∂T ∂T
∂r und ∂t stetig, und damit T stetig partiell differenzierbar. Die Ableitung
T
dT (r, t) ∈ L(R , R2 ) ist damit
2
! !
r cos t −r sin t
dT = , (10.5)
t sin t r cos t
und die Richtungsableitung von T im Punkt (r, t)T in Richtung v = (α1 , α2 )T ist nach
Korollar 10.1.5
! ! ! !
∂T r r α1 α cos t − α2 r sin t
= dT = 1 .
∂v t t α2 α1 sin t + α2 r cos t
Berechnen wir diese Richtungsableitung gemäß Bemerkung 10.1.2 direkt dadurch,

dass wir g′ (0) mit g(s) = T (r, t)T + s(α1 , α2 )T bestimmen, so erhalten wir auch
d !
(r + sα1 ) cos(t + sα2 ) | s=0
g′ (0) = dsd =
ds (r + sα1 ) sin(t + sα2 ) | s=0
! !
α1 cos(t + sα2 ) − (r + sα1 )α2 sin(t + sα2 ) | s=0 α cos t − α2 r sin t
= 1 .
α1 sin(t + sα2 ) + (r + sα1 )α2 cos(t + sα2 ) | s=0 α1 sin t + α2 r cos t
10.1.10 Proposition. Sei f : D ⊆ Rn → X mit f ∈ C 1 (D).
Versieht man L(Rn , X) mit der Abbildungsnorm (Rn versehen mit k.k∞ und X mit
k.k), so ist die Abbildung d f : D ⊆ Rn → L(Rn , X), x 7→ d f (x) stetig.
Für festes x ∈ D gilt
f (x + z) = f (x) + d f (x)z + kzk∞ ǫ(z), (10.6)
wenn x + z ∈ D \ {x}, mit einer Funktion3 ǫ : (D \ {x} − x) → X, sodass

limz→0 ǫ(z) = 0.
Beweis.
Für x, y ∈ gilt
kd f (x) − d f (y)k = sup kd f (x)v − d f (y)vk =

kvk∞ ≤1

Xn Xn ∂ f
∂f
sup α j (d f (x)e j − d f (y)e j ) ≤ (x) − (y) .

|α1 |,...,|αn |≤1 j=1
j=1 ∂x j ∂x j
Wegen der vorausgesetzten Stetigkeit der partiellen Ableitungen folgt

d f (y) → d f (x) für y → x.
Wir setzen (x ∈ D und z , 0, sodass x + z ∈ D)

1
ǫ(z) := ( f (x + z) − f (x) − d f (x)z) .
kzk∞
3 Man beachte, dass D \ {x} − x eine Menge der Bauart U δ (0) \ {0} enthält.
Ist ρ > 0, sodass Uρ (x) = x + Uρ (0) ⊆ D und kzk < ρ, so ist ǫ(z) definiert, und
wir haben wegen (10.3) mit t = 0, s = kzk∞ , v = (α1 , . . . , αn )T := kzkz ∞ , wobei
offensichlich max j=1,...,n |α j | = kvk∞ = 1,
Z !
X n
1 sαi ∂ f ∂f
kǫ(z)k = (x + svi−1 + τei ) − (x) dτ ≤
i=1 s 0 ∂xi ∂xi
X
n
∂f ∂f
|αi | sup (x + svi−1 + τei ) − (x) ≤
i=1 τ∈[0,sαi ] ∂x i ∂x i
X
n
sup ∂ f (x + y) − ∂ f (x) .
∂xi
i=1 kyk∞ ≤kzk∞ ∂xi
Dieser Ausdruck konvergiert wegen der Stetigkeit der partiellen Ableitungen für
z → 0 gegen 0.
❑
10.1.11 Bemerkung. Wir sehen also, dass sich f lokal bei x durch die affine Abbildung
x + z 7→ f (x) + d f (x)z approximieren lässt, wobei der Fehler mit kzk∞ ǫ(z) verhält-
nismäßig klein ist.
Ist X = Rm und stellt man sich f (D) als n-dimensionale Fläche im Rm vor, so ist
deshalb der affine Teilraum
{ f (x) + d f (x)z : z ∈ Rn }
der Anschauung nach gerade die Tangentialebene an f (D) im Punkt f (x).

Aus (10.6) erhält man sofort:
10.1.12 Korollar. Ist f ∈ C 1 auf der offenen Menge D, so ist f stetig auf D.
∂f
10.1.13 Bemerkung. Man kann die Voraussetzung der Stetigkeit der ∂x i
in Korollar
10.1.12 zwar etwas abschwächen aber nicht gänzlich weglassen. Z.B. hat die Funktion
aus Beispiel 9.1.9 Richtungsableitungen bei 0 in allen Richtungen, ist aber selbst bei 0
unstetig.
Man kann auch umgekehrt folgendermaßen starten.
10.1.14 Definition. Sei f : D ⊆ Rn → X und x ∈ D. Gibt es ein d f (x) ∈ L(Rn , X),

sodass (10.6) mit einer X-wertigen Funktion ǫ definiert auf Uρ (0) \ {0} für ein gewis-
ses ρ > 0, mit x + Uρ (0) ⊆ D, sodass limz→0 ǫ(z) = 0 erfüllt ist, so heißt f bei x
differenzierbar.
f heißt stetig differenzierbar, wenn f bei allen x ∈ D differenzierbar ist, und wenn
x 7→ d f (x) stetig auf D ist.
10.1.15 Fakta.
1. Wir haben oben gesehen, dass jede stetig partiell differenzierbaren Funktion ste-
tig differenzierbar ist.
2. Ist f bei x differenzierbar, so existieren wegen (0 , v ∈ R p , s ∈ R, sv ∈ Uρ (0))
f (x + sv) − f (x) s→0

= d f (x)v + sgn(s)kvk∞ ǫ(sv) −→ d f (x)v,
s
auch alle Richtungsableitungen, insbesondere alle partiellen Ableitungen, wobei
∂f
∂v (x) = d f (x)v.
Man sieht damit auch, dass d f (x) eindeutig durch f bestimmt ist, es also kein
weiters d̃ f (x) ∈ L(Rn , X) mit d̃ f (x) , d f (x) geben kann, das auch (10.6) erfüllt.
3. Ist f stetig differenzierbar, so sind auch die partiellen Ableitungen stetig, da ja

∂ f (x) − ∂ f (y) = kd f (x)e − d f (y)e k ≤ kd f (x) − d f (y)k · ke k .
∂xi ∂xi
i i i ∞
Somit folgt aus stetig differenzierbar die Eigenschaft stetig partiell differenzier-
bar.
Wir haben somit folgenden Satz bewiesen.
10.1.16 Satz. Eine Funktion f : D ⊆ Rn → X ist genau dann stetig differenzierbar,

wenn sie stetig partiell differenzierbar ist.
10.1.17 Bemerkung. Wenn X mit einer zweiten, zu k.k äquivalenten Norm versehen ist,
bleiben die partiellen Ableitungen und die Ableitung unverändert.
10.1.18 Proposition. Sei D ⊆ Rn offen. Sind f, g : D → X zwei stetig differenzierbare

Funktionen und λ, µ ∈ R, so ist es auch λ f + µg und es gilt für alle x ∈ D
d(λ f + µg)(x) = λd( f )(x) + µdg(x).
Beweis. Der Beweis folgt unmittelbar durch eine entsprechende Linearkombination

der Gleichungen
f (x + z) = f (x) + d f (x)z + kzk∞ ǫ(z)
und
g(x + z) = g(x) + dg(x)z + kzk∞ ǫ̃(z).
❑
Wie im Eindimensionalen lassen sich auch im Mehrdimensionalen viele Funktio-
nen als Zusammenstzung von einfacheren Funktionen schreiben. Zur Berechnung der
Ableitung dient dann folgender Satz, der die bekannte Kettenregel verallgemeinert.
10.1.19 Proposition (Kettenregel). Seien f : D̃ ⊆ Rm → X, und sei g : D ⊆ Rn → Rm

stetig differenzierbar, sodass g(D) ⊆ D̃. Hierbei seien Rm und Rn mit k.k∞ versehen.
Dann ist auch f ◦ g : D ⊆ Rn → X stetig differenzierbar, und es gilt für x ∈ D

d( f ◦ g)(x) = d f g(x) dg(x),
wobei die rechte Seite ein Hintereinanderausführen von linearen Abbildungen ist.
Beweis. Laut Voraussetzung haben wir für a, a + b ∈ D̃, b , 0 gemäß (10.6)
f (a + b) = f (a) + d f (a)b + kbk∞ ǫ̃(b),
und falls x, x + z ∈ D, z , 0
g(x + z) = g(x) + dg(x)z + kzk∞ ǫ(z).
Wegen limb→0 ǫ̃(b) = 0 und limz→0 ǫ(z) = 0 können wir durch ǫ(0) = 0 und ǫ̃(0) = 0
diese beiden Funktion so fortsetzen, dass sie bei z = 0 bzw. b = 0 stetig sind.
Ist nun a = g(x) und b so, dass a + b = g(x + z), so folgt aus der ersten Gleichung
und durch Einsetzen der zweiten

f g(x + z) =

f g(x) + d f g(x) g(x + z) − g(x) + kg(x + z) − g(x)k∞ ǫ̃(g(x + z) − g(x)) =

f g(x) + d f g(x) dg(x)z + kzk∞ ǫ(z) +

dg(x)z + kzk∞ ǫ(z) ∞ ǫ̃ g(x + z) − g(x) =

f g(x) + d f g(x) dg(x)z + kzk∞ γ(z),
wobei
1
γ(z) = d f g(x) (ǫ(z)) + kdg(x)( z) + ǫ(z)k∞ ǫ̃(g(x + z) − g(x)).
kzk∞
Wir haben
kγ(z)k ≤ kd f (g(x))k · kǫ(z)k∞ + (kdg(x)k + kǫ(z)k∞ ) kǫ̃(g(x + z) − g(x))k.
Wegen ǫ̃(0) = 0 und der Stetigkeit von ǫ̃ bei 0 folgt aus limz→0 (g(x+z) −g(x)) = 0, dass
limz→0 ǫ̃(g(x + z) − g(x)) = 0 (vgl. Proposition 6.1.4), und somit auch γ(z) → 0, z → 0.
Wir haben also d( f ◦ g)(x) = d f (g(x))dg(x) gezeigt. Um mit Hilfe von Satz
10.1.16 sicher zu gehen, dass f ◦ g ∈ C 1 , brauchen wir noch die Stetigkeit von
x 7→ d f (g(x))dg(x). Diese folgt aber aus Korollar 9.2.8.
❑
10.1.20 Bemerkung. Hat man n = 1 in Proposition 10.1.19, dh. D ⊆ R, so gilt dg(t) = g′ (t), wenn man g′ (t) mit der linearen
Abbildung ξ 7→ ξ · g′ (t) aus L(R, Rm ) identifiziert, siehe Fakta 10.1.8, 1. Entsprechendes gilt für ( f ◦ g)′ (t). Also liest sich
die Kettenregel in dem Fall als
( f ◦ g)′ (t) = d f g(t) g′ (t), t ∈ D. (10.7)
Wir nehmen im Fall n = 1 nun sogar an, dass g ∈ C1 (I) für irgendein Intervall I ⊆ R mit g(I) ⊆ D̃. Dann gilt (10.7) sogar
für in I enthaltene Randpunkte t von I.
Dazu setze man g auf ein etwas größeres Intervall J := I ∪ (t − ǫ, t + ǫ) durch g(s) := (s − t)g′ (t) + g(t) für s ∈ J \ I
fort. Man überprüft unmittelbar, dass g ∈ C1 (J), und dass für eine hinreichend kleine Wahl von ǫ > 0 auch g(J) ⊆ D̃. Die
Kettenregel angewandt auf g|(t−ǫ,t+ǫ) ergibt dann (10.7).
10.1.21 Beispiel. Als Beispiel wollen wir sogenannte Parameterintegrale betrachten.

Sei h : (a, b) × (c, d) → X stetig und so, dass die Ableitung nach der ersten Variablen
für alle (s, t) ∈ (a, b) × (c, d) existiert, und dass
∂
h1 (s, t) = h(s, t),
∂s
ebenfalls stetig ist. Weiters seien α, β : (a, b) → (c, d) zwei stetig differenzierbare
Funktionen. Wir wollen die Ableitung der Funktion
Z β(s)
I(s) := h(s, t) dt
α(s)
berechnen. Dazu wenden wir die eben gewonnene Kettenregel auf

Z η
f : (c, d) × (c, d) × (a, b) ⊆ R3 → X, (ξ, η, ζ)T 7→ h(ζ, t) dt
ξ
und
g : (a, b) ⊆ R → R3 , s 7→ (α(s), β(s), s)T
an. Die partiellen Ableitungen von f sind nach dem Hauptsatz und nach Korollar 8.7.11
stetig, und die Matrixdarstellung von d f (x) ist (x = (ξ, η, ζ)T )
∂f Z η
∂f ∂f ∂h
d f (x) = (x), (x), (x) = (−h(ζ, ξ), h(ζ, η), (ζ, t) dt).
∂ξ ∂η ∂ζ ξ ∂ζ
Auch dg(s) = (α′ (s), β′ (s), 1)T ist stetig, und die Kettenregel ergibt
d( f ◦ g)(s) = d f (g(s))dg(s) =
 
R β(s) α′ (s)
∂h 
 β′ (s)  =
−h(s, α(s)) h(s, β(s)) α(s) ∂s (s, t) dt   
1
Z β(s)
∂h
h(s, β(s))β′ (s) − h(s, α(s))α′ (s) + (s, t) dt = I ′ (s) .
α(s) ∂s
Siehe Fakta 10.1.8, 1.
10.1.22 Lemma. Sei D ⊆ Rn offen und f : D → X stetig differenzierbar. Sind mit x, y

auch alle Punkte auf ihrer Verbindungsgeraden in D, also tx + (1 − t)y ∈ D, t ∈ [0, 1],
so folgt
k f (x) − f (y)k ≤ max kd f (tx + (1 − t)y)k · kx − yk∞ .
t∈[0,1]
Beweis. Wegen der Stetigkeit von t 7→ tx + (1 − t)y ist das Bild der kompakten Men-
ge [0, 1] ebenfalls kompakt. Somit hat die stetige Funktion z 7→ kd f (z)k darauf ein
Maximum.
Die Funktion g(t) := f (x + t(y − x)) ist nach Lemma 10.1.4 stetig differenzierbar
mit g′ (t) = d f (x + t(y − x))(y − x). Nach dem Hauptsatz (9.13) gilt
Z 1

k f (y) − f (x)k = kg(1) − g(0)k = d f (x + t(y − x))(y − x) dt ≤
0
sup kd f (x + t(y − x))(y − x)k ≤ max kd f (x + t(y − x))k · ky − xk∞ .

t∈[0,1] t∈[0,1]
❑
10.1.23 Bemerkung. Teilmengen A von Vektorräumen Y (über R oder C) heißen kon-

vex, falls für alle x, y ∈ A folgt, dass auch alle Punkte auf ihrer Verbindungsgeraden in
D liegen, also tx + (1 − t)y ∈ D, t ∈ [0, 1].
Ist Y sogar mit einer Norm k.k versehen und ist A = Uǫ (z) oder A = Kǫ (z) die
offene bzw. abgeschlossene Kugel vom Radius ǫ, so ist A konvex, denn aus den aus
den Ungleichungen kz − xk, kz − yk < (≤)ǫ folgt
kz − (tx + (1 − t)y)k = kt(z − x) + (1 − t)(z − y)k ≤

tkz − xk + (1 − t)kz − yk < (≤) tǫ + (1 − t)ǫ = ǫ.
Aus Lemma 10.1.22 folgt unmittelbar

10.1.24 Korollar. Gilt mit der Notation aus Lemma 10.1.22 die Ungleichung
kd f (x)k ≤ C für alle x ∈ M, wobei M ⊆ D konvex ist, so gilt
k f (x) − f (y)k ≤ Ckx − yk∞ , x, y ∈ M.
Insbesondere ist dann f auf M gleichmäßig stetig.

10.1.25 Bemerkung. Man kann auch Funktionen f : D → X betrachten, wo D offene
Teilmenge eines allgemeinen Banachraumes Y ist, und sich fragen, ob und in welcher
Hinsicht f differenzierbar ist.
Es stellt sich heraus, dass der Zugang aus Definition 10.1.14 der zweckmäßigste
ist. Man spricht dann von der sogenannten Fréchet-Differenzierbarkeit. Mit fast den
selben Beweisen wie hier angegeben bleiben alle Behauptungen ab Definition 10.1.14
bis zum Ende dieses Abschnitt und darüber hinaus auch der Hauptsatz über implizite
Funktionen und der Umkehrsatz aus den beiden folgenden Kapiteln richtig.
Eine Ausnahme stellt Satz 10.1.16 dar. Es gilt nur, dass aus der Differenzierbarkeit
folgt, dass alle Richtungsableitungen existieren. Die Umkehreung gilt nicht, da es in
dieser allgemeinen Situation kein Analogon zu Lemma 10.1.4 gibt.
10.2 Hauptsatz über implizite Funktionen

In diesem Kapitel betrachten wir nur Banachräume X der Form Rn .
10.2.1 Bemerkung. Erfüllt eine stetig differenzierbare Funktion η(ξ) eine Beziehung
der Gestalt
g(ξ, η(ξ)) = 0, (10.8)
mit einer Funktion g : D ⊆ R2 → R, g ∈ C 1 , so kann man mittels der Kettenregel
die Ableitung von η(ξ) ausrechnen: Setzt man f1 (t) := t, f2 (t) := η(t) und f (t) :=
( f1 (t), f2 (t))T ∈ R2 , so besagt (10.8) h(t) := g( f (t)) = 0. Also ist auch die Ableitung
h′ (t) stets gleich Null. Nach der Kettenregel gilt daher
∂g ∂g
0 = h′ (t) = (ξ, η(ξ)) · 1 + (ξ, η(ξ)) · η′ (ξ).
∂x1 ∂x2
∂g
Im Fall ∂x 2
(ξ, η(ξ)) , 0 kann man aus dieser Gleichung η′ (ξ) ausrechnen. Wir werden
später sehen (vgl. Satz 10.2.4), dass diese Bedingung gerade bedeutet, dass die Funk-
tion η an der Stelle ξ durch die Beziehung (10.8), also durch die implizite Gleichung
g(ξ, η(ξ)) = 0 sicher wohldefiniert ist. Man spricht von der Ermittlung von η′ (ξ) durch
implizites Differenzieren.
10.2. HAUPTSATZ ÜBER IMPLIZITE FUNKTIONEN 79
10.2.2 Beispiel. Betrachte die Gleichung g(ξ1 , ξ2 )T = 0 wobei

(
R2 → R
g: .
x = (ξ1 , ξ2 )T 7→ ξ12 + ξ22 − 1
Ist durch die implizite Gleichung g(ξ, η(ξ))T = 0 eine Funktion η(ξ) wohldefiniert?
Nein, denn stets erfüllt ja mit einer Zahl η(ξ) auch −η(ξ) diese Beziehung. Man sieht
ξ
0
η0 η(.)
ξ0
ξ
g η =0
Abbildung 10.2: Lokale Darstellbarkeit von g(ξ, η)T = 0 als Funktion η(ξ)
jedoch, dass, solange ξ0 , ±1 ist, zumindest lokal um ξ0 eine stetige (und differen-
zierbare) Funktion η(.) mit g(ξ, η(ξ)) = 0 definiert ist, wenn man sich nur im Punkt ξ0
selbst auf einen der beiden möglichen Werte η0 bzw. −η0 festlegt. Die Ableitung dieser
Funktion η lässt sich nun durch implizites Differenzieren ermitteln:
d ∂g ∂g
0= g(ξ, η(ξ)) = (ξ, η(ξ)) · 1 + (ξ, η(ξ)) · η′ (ξ) = 2ξ + 2η(ξ)η′ (ξ),
dξ ∂x1 ∂x2
ξ
also η′ (ξ) = − η(ξ) . Beachte, dass wegen ξ0 , ±1 die Funktion η(ξ) lokal bei ξ0 ungleich
0 ist.
Wie wir eben gesehen haben, ist es in keinster Weise klar, ob durch eine implizite
Gleichung g(ξ, η(ξ)) = 0 nun tatsächlich eine Funktion definiert ist. Man sieht in die-
∂g
sem Beispiel auch, dass die Bedingung ∂x 2
(ξ0 , η0 ) , 0 eine wesentliche Bedeutung für
die Auflösbarkeit der Gleichung g(ξ, η) = 0 nach η zu haben scheint. Der in diesem
Abschnitt bewiesene Hauptsatz über implizite Funktionen (Satz 10.2.4) gibt die exakte
und allgemein formulierte Bestätigung dieser Beobachtung.
Doch zunächst benötigen wir den Banachschen Fixpunktsatz. 4
10.2.3 Satz. Sei (M, d) ein vollständiger metrischer Raum. Weiters sei T : M → M
eine Abbildung, die
d(T x, T y) ≤ q · d(x, y), x, y ∈ M,
mit einem festen 0 ≤ q < 1 erfüllt.
4 Stefan Banach, geb. 30.3.1892 Krakow, gest.31.8.1945 Lwow (Lemberg)
Dann hat die Fixpunktgleichung x = T x genau eine Lösung z in M. Ist y0 ∈ M, und

definiert man yn := T n y0 , so konvergiert yn gegen z mit
qn
d(yn , z) ≤ d(y1 , y0 ).
1−q
Beweis. Zunächst folgt aus der Voraussetzung unmittelbar, dass T : M → M

gleichmäßig stetig ist, denn aus d(x, y) < ǫ folgt d(T x, T y) ≤ qd(x, y) < qǫ < ǫ.
Sind z1 , z2 Fixpunkte von T , also T z1 = z1 , T z2 = z2 , so folgt d(z1 , z2 ) =
d(T z1 , T z2 ) ≤ qd(z1 , z2 ). Wegen 0 ≤ q < 1 ist das nur für d(z1 , z2 ) = 0 möglich.
Also kann es höchstens einen Fixpunkt geben.
Mittels Induktion zeigt man die Ungleichung
d(yn , yn+1 ) ≤ qn d(y0 , y1 ), (10.9)
denn für n = 0, ist sie klar, und der Induktionsschritt folgt aus d(yn+1 , yn+2 ) =
d(T yn , T yn+1 ) ≤ q d(yn , yn+1 ) ≤ qn+1 d(y0 , y1 ).
Sei nun n ≤ m gegeben. Dann folgt
d(yn , ym ) ≤ d(yn , yn+1 ) + . . . + d(ym−1 , ym ) ≤
qn
≤ (qn + . . . + qm−1 ) d(y0 , y1 ) ≤ d(y0 , y1 ),
1−q
P
da ja wegen 0 ≤ q < 1 die geometrische Reihe ∞ k
k=0 q konvergiert. Also ist die Folge
(yn )n∈N eine Cauchy-Folge, und es existiert der Grenzwert z := limn→∞ yn . Dass z ein
Fixpunkt ist, folgt wegen der Stetigkeit von T aus
T z = lim T yn = lim yn+1 = z.

n→∞ n→∞
❑
Neben dem nun folgenden Hauptsatz über implizite Funktionen findet der Banach-
sche Fixpunktsatz auch Anwendung in der Theorie der Differentialgleichungen.
Die Ausgangssituation beim Hauptsatz über implizite Funktionen ist die, dass man
eine stetig differenzierbare Funktion F : D → Rm mit einer offenen Menge D ⊆ Rn+m
hat. Wir schreiben die Elemente von Rn+m als (x, y), wobei x ∈ Rn , y ∈ Rm .
Für (x, y) ∈ D schreiben wir dF(x, y) ∈ L(Rn+m , Rm ) als m × (n + m) Matrix. Nun
nehmen wir die ersten n Spalten und fassen sie zur Matrix dF1 (x, y) zusammen. Ent-
sprechend seien dF2 (x, y) die letzten m Spalten. Man hat also dF(x, y) =
 ∂F1 ∂F1 ∂F1 ∂F1
 ∂x1 (x, y) ··· ∂xn (x, y) ∂xn+1 (x, y) ··· 
∂xn+m (x, y)
 
 .. .. .. .. 
 . . . . 
 ∂Fm ∂Fm ∂Fm ∂Fm 
∂x1 (x, y) · · · ∂xn (x, y) (x, y) · · · (x, y)
| {z } | ∂xn+1 {z ∂xn+m }
=dF1 (x,y) =dF2 (x,y)
Mit dF(x, y) sind klarerweise auch dF1 (x, y) und dF2 (x, y) stetig in (x, y).
Ist y fest, so ist x 7→ dF1 (x, y) ∈ Rm×n nichts anderes, als die Ableitung der Funktion
x 7→ F(x, y) als Funktion von x. Entsprechendes gilt für y 7→ dF2 (x, y) ∈ Rm×m .
10.2.4 Satz (Hauptsatz über implizite Funktionen5). Sei D ⊆ Rn+m offen, und sei F :
D → Rm , F ∈ C 1 . Weiters sei (a, b) ∈ D, sodass F(a, b) = 0 und sodass dF2 (a, b)
invertierbar ist, d.h. !m
∂Fi
det (a, b) , 0.
∂xn+ j i, j=1
(i) Dann existieren offene Kugeln U = Uδ (a) ⊆ Rn um a und V = Uρ (b) ⊆ Rm um b

mit U × V ⊆ D, sowie eine stetige Funktion g : U → V, sodass

F x, g(x) = 0, x ∈ U. (10.10)
(ii) Die Funktion g löst die Gleichung F(x, y) = 0, x ∈ U, y ∈ V, vollständig in dem

Sinn, dass, wenn (x, y) ∈ U × V mit F(x, y) = 0, immer y = g(x) gelten muss.
Insbesondere ist b = g(a).
(iii) Die Funktion g hat in a partielle Ableitungen ( j = 1, . . . , n)
∂g ∂F
(a) = −dF2 a, g(a) −1 a, g(a) .
∂x j ∂x j

(iv) dF2 u, v für alle (u, v) ∈ U × V invertierbar ist; die Funktion g ist auf U stetig
differenzierbar und es gilt
−1
dg(x) = −dF2 x, g(x) dF1 x, g(x) .
Beweis.
(i) Sei B = dF2 (a, b). Die gesuchte Funktion soll (10.10) erfüllen. Man kann das als
Fixpunktgleichung anschreiben:

g(x) − B−1 F x, g(x) = g(x). (10.11)
Um die Existenz und die Eindeutigkeit herzuleiten, werden wir den Banachschen
Fixpunktsatz bemühen.
Dazu sei ρ > 0 so klein, dass Uρ (a, b) ⊆ D (bzgl. k.k∞ ) und dass
1
kB − dF2 (x, y)k ≤ , (x, y) ∈ Uρ (a, b). (10.12)
2kB−1 k
Das ist möglich wegen der Stetigkeit von (x, y) 7→ dF2 (x, y) bei (a, b)6. Nun
wählen wir δ > 0, δ ≤ ρ so, dass
ρ
kF(x, b)k∞ ≤ , x ∈ Uδ (a), (10.13)
4kB−1 k
und setzen U := Uδ (a), V := Uρ (b).
Sei h0 : U → Rm die identische Funktion x 7→ b. Nun betrachten wir die ab-
geschlossene Kugel K 2ρ (h0 ) =: M um h0 mit Radius ρ2 in dem Banachraum
C(U, Rm ) (versehen mit der Supremumsnorm k| f k| := sup x∈U k f (x)k∞ ), welche
5
Oft auch zitiert als “Implicit function theorem“
6 Wir wissen übrigens aus Korollar 9.3.3, dass für diese (x, y) auch die Matrix dF2 (x, y) invertierbar ist.
für sich selbst versehen mit d(h1 , h2 ) := k|h1 − h2 k| ein vollständig metrischer
Raum ist.

Für h ∈ M und x ∈ U gilt kh(x) − bk∞ ≤ k|h − h0 k| ≤ 2ρ und daher x, h(x) ∈
Uρ (a, b) ⊆ D. Also können wir definieren

T (h)(x) := h(x) − B−1 F x, h(x) .
Als Zusammensetzung von stetigen Funktionen ist T (h) stetig. Wir werden zei-
gen, dass T (h) wieder in M liegt, und dass k|T (h1 ) − T (h2 )k| ≤ 12 k|h1 − h2 k|.
Dazu betrachte für ein festes x ∈ Uδ (a) die Funktion
Ψ x : Uρ (b) → Rm , y 7→ y − B−1 F(x, y).
Man beachte, dass Uδ (a) × Uρ (b) ⊆ Uρ (a, b) ⊆ Rn+m .

Also gilt dΨ x (y) = I − B−1 dF2 (x, y), und wegen (10.12)
1
kdΨ x (y)k ≤ kB−1 k · kB − dF2 (x, y)k ≤ .
2
Nach Korollar 10.1.24 ist daher (y, z ∈ Uρ (b))
1
kΨ x (y) − Ψ x (z)k∞ ≤ ky − zk∞ . (10.14)
2
Da x ∈ Uδ (a) beliebig war, folgt für solche Vektoren und h1 , h2 ∈ M
kh1 (x) − h2 (x)k∞
kT (h1 )(x) − T (h2 )(x)k∞ = kΨ x h1 (x) − Ψ x h2 (x) k∞ ≤ .
2
Daraus und aus (10.13) folgt insbesondere (h ∈ M)
kT (h)(x) − h0 (x)k∞ ≤ kT (h)(x) − T (h0 )(x)k∞ + kT (h0 )(x) − h0 (x)k∞ ≤

ρ ρ
≤ + kB−1 F(x, b)k∞ ≤ .
4 2
Wir sehen, dass T (h) beschränkt ist, und dass T (h) ∈ K 2ρ (h0 ) = M.
Nach dem Banachschen Fixpunktsatz gibt es eine eindeutige Funktion g ∈ M,

die (10.11) und damit F x, g(x) = 0 erfüllt.
(ii) Ist (x, y) ∈ U × V, und gilt F(x, y) = 0, so folgt Ψ x (y) = y − B−1 F(x, y) = y und

klarerweise auch Ψ x g(x) = g(x). Wegen (10.14) sieht man
1
kg(x) − yk∞ = kΨ x (y) − Ψ x g(x) k∞ ≤ kg(x) − yk∞ ,
2
also y = g(x). Insbesondere gilt g(a) = b.
(iii) Für x ∈ Uδ (a) wollen wir nochmals die Funktion Ψ x : Uρ (b) → Rm definiert
durch Ψ x (y) = y − B−1 F(x, y) bemühen. Ihre Ableitung

dΨ x (y) = I − B−1 dF2 (x, y) = B−1 B − dF2 (x, y)
ist stetig in (x, y). Für 0 < η < 1 setzen wir
ψ(η) = sup kdΨ x (y)k.

x∈Kδη (a),y∈Kρη (b)
Wegen der Stetigkeit und weil B = dF2 (a, b), strebt ψ(η) gegen Null, wenn η → 0.
Da Kρη (b) eine konvexe Teilmenge von Rm ist, folgt aus Korollar 10.1.24, dass
(y, z ∈ Kρη (b), x ∈ Kδη (a))
kΨ x (y) − Ψ x (z)k∞ ≤ ψ(η) ky − zk∞ . (10.15)
Für kzk∞ < δ gilt wegen F(a, g(a)) = F(a + z, g(a + z)) = 0
g(a + z) − g(a) = (10.16)

g(a + z) − B−1 F(a + z, g(a + z)) − g(a) − B−1 F(a + z, g(a)) −

B−1 F(a + z, g(a)) − F(a, g(a)) =

Ψa+z (g(a + z)) − Ψa+z (g(a)) − B−1 dF1 (a, g(a))z + kzk∞ ǫ1 (z)
mit einer Funktion ǫ1 : (U \ {a}) − a → Rm , sodass limz→0 ǫ1 (z) = 0, wobei hier
verwendet wurde, dass F in der ersten Variablen bei (a, b) differenzierbar ist, vgl.
(10.6). Aus (10.15) folgt
kg(a + z) − g(a)k∞ ≤
1 1
ψ max( kzk∞ , kg(a + z) − g(a)k∞) kg(a + z) − g(a)k∞+
δ ρ
| {z }
=:β(z)
kB−1 k(kdF1 (a, g(a))k + kǫ1 (z)k∞ )kzk∞
bzw.
kB−1 k(kdF1 (a, g(a))k + kǫ1 (z)k∞ )
kg(a + z) − g(a)k∞ ≤ kzk∞ ,
1 − β(z)
wobei limz→0 β(z) = 0. Addieren wir zu (10.16) den Ausdruck B−1 dF1 (a, g(a))z,
so folgt wieder aus (10.15)
kg(a + z) − g(a) + B−1dF1 (a, b)k∞ ≤ β(z)kg(a + z) − g(a)k∞ + kB−1 k kǫ1 (z)k∞ kzk∞ ≤
!
β(z)kB−1 k(kdF1 (a, g(a))k + kǫ1 (z)k∞ )
+ kB−1 k kǫ1 (z)k∞ kzk∞ .
1 − β(z)
Da für z → 0 der Klammerausdruck gegen Null strebt, erhalten wir die Dif-
ferenzierbarkeit von g bei a mit der Ableitung dg(a) = −B−1 dF1 (a, b) =
dF2 (a, b)−1dF1 (a, b).
(iv) Der letzte Punkt folgt ganz leicht, wenn man das schon Bewiesene nochmals
betrachtet. Ist a′ ∈ U, so sei b′ = g(a′ ).
Wir haben schon in einer Fußnote gesehen, dass dF2 (a′ , b′ ) invertierbar ist. Also
können wir das schon Bewiesene auf (a′ , b′ ) ∈ U × V anwenden, und erhalten
eine Kugel U ′ ⊆ U um a′ und eine Kugel V ′ ⊆ V um b′ , sowie eine Funktion

g′ : U ′ → V ′ mit g′ (a′ ) = b′ und F x, g′ (x) = 0, x ∈ U ′ .
Nach (ii) muss g′ (x) = g(x), x ∈ U ′ gelten, und nach (iii) ist

dg(a′ ) = dg′ (a′ ) = −dF2 a′ , g(a′ ) −1 dF1 a′ , g(a′ ) .
Die rechte Seite ist nach Korollar 9.3.3 aber stetig in a′ . Also ist g stetig differen-
zierbar und die Ableitung lässt sich wie behauptet berechnen.
10.2.5 Beispiel. Wir betrachten die Funktion f : R3 → R, definiert als
f (ζ1 , ζ2 , ζ3 )T := c1 ζ12 + c2 ζ22 + c3 ζ32 − 1,
wobei c1 , c2 , c3 > 0 vorgegeben sind, und untersuchen die Lösungen der Gleichung
f (ζ1 , ζ2 , ζ3 )T = 0. Die Nullstellenmenge F := {z ∈ R3 : f (z) = 0} von f bildet in
diesem Beispiel offenbar ein Ellipsoid. Sei α = (α1 , α2 , α3 )T eine Lösung von f (z) =
0. Wir wollen die Gleichung f (ζ1 , ζ2 , ζ3 )T = 0 lokal bei α nach ζ3 auflösen. Anders
ausgedrückt, wir fragen ob, man die durch die implizite Gleichung f (z) = 0 gegebene
Fläche F lokal um den Punkt α welcher auf ihr liegt, in der expliziten Form ζ3 =
g(ζ1 , ζ2 )T darstellen kann. Dazu wenden wir den Hauptsatz über implizite Funktionen
an, und zwar mit der folgenden Rollenvergabe: m = 1, n = 2, y = ζ3 , x = (ζ1 , ζ2 )T ,
b = α3 , a = (α1 , α2 )T . Die Voraussetzung f ∈ C 1 ist in unserem Fall klarerweise erfüllt,
f ist ja ein Polynom. ∂ f Die entscheidende Funktionaldeterminante ist die Determinante
der 1 × 1-Matrix ∂ζ 3
(α) , also
∂f
(α) = 2c3 α3 .
∂ζ3
Liegt der Punkt α nicht am Äquator des Ellipsoids, d.h. ist α3 , 0, so existiert ei-
ne offene Umgebung U ⊆ R2 von (α1 , α2 )T und eine C 1 -Funktion g : U → R mit
g(α1 , α2 )T = α3 und f (ζ1 , ζ2 , g(ζ1 , ζ2 )T )T = 0 für alle (ζ1 , ζ2 )T ∈ U. Liegt α dagegen
am Äquator, so können wir den Hauptsatz nicht anwenden. Tatsächlich ist in solchen
Punkten ein Auflösen nach ζ3 auch nicht möglich. Wir bemerken einen Unterschied
ξ3
 
α1 
 
α2 
U
ξ2
0
ξ1
Abbildung 10.3: Darstellung eines Teils von F als Graph einer Funktion g(ζ1 , ζ2 )T
zwischen der impliziten und expliziten Darstellung der Fläche F . Die implizite Glei-
chung f (z) = 0 definiert die Fläche global, d.h. in ihrer Gesamtheit. Eine explizite
Darstellung, z.B. in der Form ζ3 = g(ζ1 , ζ2 )T ist nur lokal, d.h. für gewisse Teilstücke
der Fläche möglich, und nicht einmal um beliebige Punkte der Fläche (beim Äquator
geht’s ja nicht). Eine explizite Darstellung hat also den Nachteil immer nur auf klei-
nen Teilen zu funktionieren und Punkten die geometrisch gar nicht ausgezeichnet sind
(Äquator) einen anderen Stellenwert zu verleihen als allen anderen. Natürlich hat sie
dem gegenüber den Vorteil, dass man mit einer expliziten Darstellung besser rechnen
kann.
In unserem Beispiel kann man für jeden Punkt α ∈ F lokal nach zumindestens
einer Variablen ζ1 , ζ2 oder ζ3 auflösen. In der Tat ist einer der Werte α1 , α2 , α3 si-
cher nicht Null. Löst man z.B. nach ζ2 auf, so erhält man eine Funktion ĝ, sodass
f (ζ1 , ĝ(ζ1 , ζ3 )T , ζ3 )T = 0 für (ζ1 , ζ3 ) lokal um (α1 , α3 ). Man hat also sicher lokal um
jeden Punkt α ∈ F eine Parameterdarstellung der Form: entweder ζ1 = t, ζ2 = u, ζ3 =
g(t, u)T oder ζ1 = t, ζ3 = u, ζ2 = ĝ(t, u)T oder auch ζ2 = t, ζ3 = u, ζ1 = g̃(t, u)T . Will
man F global erfassen, so hat man die Gesamtheit aller dieser lokalen Ausschnitte zu
betrachten (wie man in einem Weltatlas, um die gesamte Erde zu sehen, die Karten von
allen Ländern und Meeren anschauen muss).
ξ3
h U
ξ2
h̃ ĥ
Û
Ũ
ξ1
Abbildung 10.4: Darstellung von F durch verschiedene Karten
( (
U ⊆ R2 → R3 Û ⊆ R2 → R3
h: , ĥ : ,
(t, u)T 7→ (t, u, g(t, u)T )T (t, u)T 7→ (t, ĝ(t, u)T , u)T
(
Ũ ⊆ R2 → R3
h̃ : .
(t, u)T 7→ (g̃(t, u)T , t, u)T
In unserem Beispiel kann man das gesamte Ellipsoid F beschreiben durch die sechs
Teilstücke “obere Hälfte“, “untere Hälfte“, “rechte/linke/vordere/hintere Hälfte“. Auf
diesen hat man die expliziten Darstellungen
q
(ζ1 , ζ2 )T 7→ + 1 − aζ12 − bζ22 , obere Hälfte
q
(ζ1 , ζ2 )T 7→ − 1 − aζ12 − bζ22 , untere Hälfte
q
(ζ2 , ζ3 )T 7→ + 1 − bζ22 − cζ32 , rechte Hälfte
usw. . Solche Teilmengen, die lokal derart beschrieben werden können werden als zwei-
dimensionale Mannigfaltigkeiten im R3 bezeichnet. Diese werden in der Analysis 3
Vorlesung ausführlicher behandelt werden.
10.3 Der Umkehrsatz

Sei f : Rn → Rn eine affine Abbildung der Form
    
y1  c11 ··· c1n  u1 
    
f (u) =  ...  +  ... ..   ..  .
.   . 
    
yn cn1 ··· cnn un
Die affine Abbildung f ist genau dann injektiv (und damit aus Dimensionsgründen
bijektiv), wenn det(ci j )ni, j=1 , 0. In diesem Fall existiert die Inverse f −1 von f oder,
anders ausgedrückt, die Gleichung f (u) = v lässt sich in eindeutiger Weise nach v
auflösen.
Die affine Abbildung f ist stetig differenzierbar mit d f (u) = (ci j )ni, j=1 . Ausschlagge-
bend für die Invertierbarkeit in unserer speziellen Situation ist also die Invertierbarkeit
von d f (u).
Es ist eine wesentliche Feststellung, dass im Allgemeinen zumindestens lokal das
gleiche Verhalten vorliegt.
10.3.1 Satz (Satz über die Inverse Funktion). Sei f : C → Rn stetig differenzierbar auf
der offenen Menge C ⊆ Rn . Weiters sei c ∈ C, sodass
det d f (c) , 0,
und sei E ⊆ Rn offen mit d := f (c) ∈ E. Dann existieren offene Mengen O ⊆ C und
R ⊆ E mit den folgenden Eigenschaften:
(i) c ∈ O und d ∈ R.
(ii) f |O ist eine Bijektion von O auf R.
(iii) Die inverse Abbildung g : R → O von f |O : O → R ist stetig differenzierbar mit

dg f (u) = d f (u)−1 .
10.3.2 Bemerkung. Dieser Satz gibt ein lokales Analogon zu obiger Bemerkung über
affine Funktionen. Denn ist f affin, so kann man O = Rn und R = Rn wählen. Im allge-
meinen muss man sich jedoch wirklich auf gewisse offene Umgebungen O und R von
c bzw. d einschränken um Existenz und Differenzierbarkeit der Inversen zu erhalten.
Beweis. (von Satz 10.3.1) Wir wenden Satz 10.2.4 mit x = v, y = u, a = d, b = c
auf die Funktion F(x, y) = f (y) − x definiert auf der Menge D := E × C an. Diese
ist eine stetig differenzierbare Funktion von E × C ⊆ Rn × Rn = Rn+n nach Rn mit

dF(x, y) = − I|d f (y) .
Verwenden wir die Notation von Satz 10.2.4, so gilt
dF2 (x, y) = d f (y), dF1 (x, y) = −I.

10.3. DER UMKEHRSATZ 87
f
R
C
c f |O d = f (c)
O
g = ( f |O )−1
Abbildung 10.5: Umkehrfunktion g von f |O
Bei (a, b) = (d, c) ist dF2 (a, b) = d f (c) voraussetzungsgemäß invertierbar. Nach Satz
10.2.4 gibt es offene Mengen U ∋ a und V ∋ b mit U × V ⊆ E × C, dh. U ⊆ E, V ⊆ C,
sowie eine C 1 -Funktion g : U → V mit

F x, g(x) = 0, dg(x) = −dF2 x, g(x) −1 dF1 x, g(x) , x ∈ U.
Setzen wir nun R := U, so folgt aus der speziellen Form von F

v = f g(v) , dg(v) = d f g(v) −1 , v ∈ R.
Somit ist g : R → V injektiv. Nun ist O := V ∩ f −1 (U) = {u ∈ V : f (u) ∈ U} als Schnitt

zweier offen Mengen wieder offen; f −1 (U) ist ja als Urbild einer offenen Menge unter
einer stetigen Funktion offen.

Für v ∈ R ist g(v) ∈ V und f g(v) = v ∈ R = U, also g(v) ∈ O, und daher
g : R → O. Außerdem gilt klarerweise f |O : O → R.
Wir wissen schon f |O ◦ g = idR . Für u ∈ O ist f (u) ∈ R und F( f (u), u) = 0. Aus

Satz 10.2.4, (ii), folgt u = g f (u) und somit gilt auch g ◦ f |O = idO .
❑
10.3.3 Korollar. Sei f : C ⊆ Rn → Rn stetig differenzierbar auf der offenen Menge C.

Gilt det d f (c) , 0 für alle c ∈ C, so ist f (C) eine offene Teilmenge von Rn .
Ist zusätzlich f injektiv auf C, so ist auch f −1 : f (C) → C ⊆ Rn stetig differenzier-

bar, wobei d( f −1 )( f (u)) = d f (u) −1 .
Beweis. Nach Satz 10.3.1 gibt es um jedes c ∈ C offene Mengen Oc ⊆ C und Rc ⊆ Rn

mit c ∈ Oc , sodass f |Oc : Oc → Rc bijektiv ist. Somit ist
 
[  [ [
f (C) = f  Oc  = f (Oc ) = Rc
c∈C c∈C c∈C
als Vereinigung offener Mengen wieder offen (vgl. Proposition 5.1.6). Der zweite Teil
des Korollars folgt unmittelbar aus Satz 10.3.1, (iii).
❑
10.3.4 Beispiel. Wir betrachten abermals die Funktion T : C → R2 definiert durch

! !
r r cos t
T = .
t r sin t

mit C = R+ × R ⊆ R2 . In (10.5) aus Beispiel 10.1.9 haben wir dT (r, t)T berechnet.
Die Determinante davon ist r(cos t) + r(sin t) = r > 0 und somit für alle (r, t)T ∈ C
2 2
regulär.
Nach Korollar 10.3.3 ist T (C) offen in R2 . Aus dem ersten Semester (vgl. Definition
6.8.12 und Bemerkung 6.8.13) wissen wir, dass in der Tat
T (C) = R2 \ {(0, 0)T }.
Sei nun (ρ, τ)T ∈ C fest, so gibt es nach Satz 10.3.1 offene Teilmengen O und R von R,

sodass (ρ, τ)T ∈ O, T (ρ, τ)T ∈ R und sodass T |O : O → R bijektiv und in beide Rich-

tungen stetig differenzierbar ist. Die Ableitung von T −1 im Punkt (ξ, η) = T (r, t)T ∈ R,
2 2 2
dh. r = ξ + η und r cos t = ξ, r sin t = η, ist dabei
!−1
−1 T T −1 cos t −r sin t
dT (ξ, η) = dT (r, t) = =
sin t r cos t
!  √ ξ √ η2


1 r cos t r sin t  2 2 ξ +η2 
=  ξ η+η  .

r − sin t cos t − ξ2 +η2 2
ξ
2
ξ +η
Mit O ist auch O ∩ (R+ × (τ − π, τ + π)) offen in R2 . Schränkt man T auf diese Menge
ein, so folgt aus Korollar 10.3.3, dass T (O′ ) =: R′ ⊆ R offen in R2 ist. Klarerweise
ist auch T |O′ : O′ → R′ bijektiv und in beide Richtungen stetig differenzierbar. Somit
können wir das ursprüngliche O und R schon so wählen, dass O ⊆ R+ × (τ − π, τ + π).
In diesem Fall wissen wir schon aus Bemerkung 6.8.13, dass T |O injektiv ist. In der
Tat bildet T die ganze Menge R+ × (τ − π, τ + π) bijektiv auf
( ! )
cos(τ + π)
R2 \ s : s ∈ [0, +∞)
sin(τ + π)
ab (siehe Proposition 6.8.14). T als Abbildung von C nach R2 ist dagegen nicht injektiv.
10.4 Höhere Ableitungen

Sei f definiert auf einer offenen Menge D ⊆ Rn mit Werten in einem Banachraum X -
man stelle sich z.B. wieder R vor -, und existiere für alle x ∈ D die partielle Ableitung
∂f ∂f
∂xi (x). Dann ist ∂xi selbst eine Funktion
∂f
: D → X.
∂xi
Also macht es Sinn, von der Differenzierbarkeit o.ä. dieser Funktion zu sprechen. Exis-
tiert an einer Stelle x ∈ X die Ableitung
!
∂ ∂f
(x),
∂x j ∂xi
2
so spricht man von einer zweiten Ableitung von f und schreibt kürzer ∂x∂j ∂x
f
i
, d.h. f wird
zuerst nach xi differenziert und dann nach x j . Höhere partielle Ableitungen definiert
10.4. HÖHERE ABLEITUNGEN 89
man induktiv fortfahrend: Ist schon definiert, was partielle Ableitungen k-ter Ordnung
sind, und ist (i1 , i2 , . . . , ik+1 ) ein (k + 1)-Tupel von Indizes il ∈ {1, . . . , n}, so setzt man
!
∂k+1 f ∂ ∂k f
(x) := (x),
∂xik+1 ∂xik · · · ∂xi1 ∂xik+1 ∂xik · · · ∂xi1
falls diese Ableitungen existieren.
10.4.1 Definition. Sei f : D ⊆ Rn → X definiert auf der offenen Menge D und sei
k ∈ N. Wir sagen, f ist k-mal stetig differenzierbar auf D, und schreiben f ∈ C k oder
f ∈ C k (D), falls alle partiellen Ableitungen k-ter Ordnung von f auf ganz D existieren
und stetig sind.
Falls f ∈ C k (D) für alle k ∈ N, so schreibt man f ∈ C ∞ oder f ∈ C ∞ (D) für diesen
Sachverhalt.
10.4.2 Bemerkung. Bezeichnet man mit C(D) die Menge aller stetigen Funktionen auf
D, dann gilt
C(D) ⊇ C 1 (D) ⊇ . . . ⊇ C k (D) ⊇ C k+1 (D) ⊇ . . . .
Die erste Inklusion gilt wegen Korollar 10.1.12. Zu den anderen Inklusionen:
Ist f ∈ C k+1 (D), dann existieren alle partiellen Ableitungen (k + 1)-ter Ordnung.
Nach der induktiven Definition der (k + 1)-ten partiellen Ableitungen müssen auch alle
k
partiellen Ableitungen k-ter Ordnung existieren. Sei g = ∂xi ∂···∂x
f
i
eine solche. Dann
k 1
existieren alle partiellen Ableitungen von g und sind stetig, d.h. g ∈ C 1 . Wegen C 1 (D) ⊆
C(D) folgt, dass g selbst stetig ist, vgl. Korollar 10.1.12. D.h. f ∈ C k (D).
10.4.3 Satz (Satz von Schwarz7 ). Sei f ∈ C 2 (D), D ⊆ Rn , und seien i, j ∈ {1, . . . , n},
2 2
sodass ∂x∂i ∂xf j und ∂x∂j ∂xf j auf ganz D existieren und stetig sind. Dann gilt
∂2 f ∂2 f
= .
∂xi ∂x j ∂x j ∂xi
Mehrmalig angewandt besagt dieser Satz: Ist f ∈ C k (D), so kommt es bei der Bil-
dung einer partiellen Ableitung (höchstens k-ter Ordnung) nicht darauf an in welcher
Reihenfolge differenziert wird.
Beweis. (von Satz 10.4.3) Sei x ∈ D und δ > 0, so dass Uδ (x) ⊆ D (Rn ist mit k.k∞
versehen). Nach dem Hauptsatz der Differential- und Integralrechnung (siehe (9.13))
gilt (|ξ|, |η| < δ)
Z ξ
∂f
f (x + ξei + ηe j ) − f (x + ηe j ) = (x + ζei + ηe j ) dζ.
0 ∂x i
2
Die Ableitung des Integranden nach η ist gerade ∂x∂j ∂x f
i
(x + ζei + ηe j ), und daher stetig in
ζ und η. Somit können wir (9.15) (siehe auch Korollar 8.7.11) anwenden und erhalten
bei der Ableitung obiger Gleichung nach η
Z ξ 2
∂f ∂f ∂ f
(x + ξei + ηe j ) − (x + ηe j ) = (x + ζei + ηe j ) dζ.
∂x j ∂x j 0 ∂x j ∂xi
Leiten wir nun nach ξ ab, so folgt mit dem Hauptsatz

∂2 f ∂2 f
(x + ξei + ηe j ) = (x + ξei + ηe j ).
∂xi ∂x j ∂x j ∂xi
7 Hermann Schwarz 25.1.1843 - 30.11.1921
10.4.4 Beispiel. Wir betrachten abermals die Funktion T : D → R2 definiert durch

! !
r r cos t
T = .
t r sin t
mit D = R+ × R ⊆ R2 . Um die höheren Ableitungen dieser speziellen Funktion zu

studieren, bietet es sich an, die Bildmenge R2 als C zu betrachten, da man dann
!
r
T = r · exp(it)
t
schreiben kann. Die höheren partiellen Ableitungen sind dann

!  
∂l r l π r cos t + l π2 
T = r · i exp(it) = r · exp i(t + l )  ,
∂tl t 2 r sin t + l π2 
!  
∂1+l r cos t + l π 
T = i exp(it) 
l 2  ,
∂r ∂tl t sin t + l π2 
und !
∂k+l r
T = 0, k ≥ 2.
∂rk ∂tl t
10.4.5 Bemerkung. Für f ∈ C 1 (D) haben wir die Ableitung d f : D → L(Rn , X) so

definiert, dass d f (x)v genau die Richtungsableitung von f in Richtung v ist. Siehe
Lemma 10.1.4.
P P
Ist nun f ∈ C k (D) und sind v1 = nl=1 α1,l el , . . . , vk = nl=1 αk,l el Richtungsvektoren,
so erhält man mit Lemma 10.1.4
∂f X n
∂f
(x) = α1,l (x).
∂v1 l=1
∂x l
Wendet man Lemma 10.1.4 nochmals an, so folgt
∂ ∂ Xn
∂ ∂f X n X n
∂2 f
f (x) = α1,l (x) = α1,l1 α2,l2 (x).
∂v2 ∂v1 l=1
∂v2 ∂xl l =1 l =1
∂xl1 ∂xl2
1 2
Macht man das nun insgesamt k-mal, so sieht man, dass die k-malige Hintereinander-
ausführung der Richtungsableitungen nach v1 bis vk existiert und mit
∂ ∂ X n
∂k f
... f (x) = α1,l1 · · · · · αk,lk (x) (10.17)
∂vk ∂v1 l ,...,l =1
∂xl1 . . . ∂xlk
1 k
übereinstimmt. Diesen Ausdruck bezeichnen wir mit dk f (x)(v1 , . . . , vk ). Im Falle k = 1

stimmt dieser gerade mit der Ableitung d f (x)v1 übereinstimmt.
Für allgemeines k ∈ N ist d k f (x)(v1 , . . . , vk ) linear in jedem Argument, d.h.
dk f (x)(v1 , . . . , µvl + νv′l , . . . , vk ) =

µdk f (x)(v1 , . . . , vl , . . . , vk ) + νdk f (x)(v1 , . . . , v′l , . . . , vk ).
Außerdem ist dk f (x)(v1 , . . . , vk ) symmetrisch in v1 , . . . , vk , hängt daher nicht von der

Reihenfolge der Richtungsvektoren ab. Das folgt unmittelbar aus Satz 10.4.3 und
(10.17).
Somit ist dk f (x) : Rk×n → X eine symmetrische, multilineare Abbildung, sodass
d f (x)(v1 , . . . , vk ) gerade ∂v∂k . . . ∂v∂1 f (x) ist. Wir nennen sie die k-te Ableitung von f an
k
der Stelle x.
Im Fall n = 1, also D ⊆ R, gilt dk f (x)(v1 , . . . , vk ) = v1 · · · · · vk f (k) (x).
Für einen späteren Gebrauch stellen wir noch heraus, dass wenn y, h ∈ Rn mit
y + th ∈ D, t ∈ [0, 1], die k-te (einseitige) Ableitung der Funktion
φ(t) = f (y + th), t ∈ [0, 1],

∂ ∂
nichts anderes als ∂h . . . ∂h f (y + th) = dk f (y + th)(h, . . . , h) ist.
10.4.6 Beispiel. Wir betrachten die Funktion T aus Beispiel 10.4.4. Lineare Abbildung

dT (r, t)T haben wir in (10.5) berechnet.
Für m ∈ N, m ≥ 2 folgt aus Beispiel 10.4.4 mit x1 = r, x2 = t, α j,1 = ρ j , α j,2 = τ j
! ! !! X
2 !
m r ρ1 ρm ∂m T r
d T ,..., = α1,l1 · · · · · αm,lm =
t τ1 τm ∂xl1 . . . ∂xlk t
l1 ,...,lm =1
! !
∂m r ∂m r
(ρ1 τ2 . . . τm + · · · + τ1 . . . τm−1 ρm ) T + τ1 · · · · · τm m T =
∂r ∂tm−1 t ∂t t
   
cos t + (m − 1) π  r cos t + m π 
(ρ1 τ2 . . . τm + · · · + τ1 . . . τm−1 ρm )  2 
 + τ1 · · · · · τm  2 
.
sin t + (m − 1) 2π  r sin t + m π2 
Man sieht unmittelbar aus (10.5), dass diese Beziehung auch für m = 1 richtig ist.
Wir können nun die mehrdimensionale Taylorsche Formel herleiten.

10.4.7 Satz (Taylorsche Formel8 ). Sei f : D (⊆ Rn ) → X und q ∈ N, sodass f ∈ C q (D).
Weiters sei y ∈ D fest und x ∈ D so, dass die gesamte Strecke von y bis x in D liegt9 .
Dann gilt
X
q−1
1 l
f (x) = f (y) + d f (y)(x − y, . . . , x − y) + Rq (x),
l! | {z }
l=1
l−mal
wobei sich das Restglied Rq schreiben lässt als
Z1
1
Rq (x) = (1 − t)q−1 · dq f (1 − t)y + tx (x − y, . . . , x − y) dt. (10.18)
(q − 1)! | {z }
0 q−mal
8 Brook Taylor 18.8.1685 - 29.12.1731 London

9 Das stimmt immer, wenn D konvex ist.
Beweis. Wir entwickeln die Funktion (h = x − y)

φ(t) = f (y + th), t ∈ [0, 1]
nach Taylor, wie in (9.16). Also gilt
X
q−1 (l) Z1
φ (0) (1 − t)q−1 (q)
φ(1) = φ(0) + + φ (t) dt.
l=1
l! (q − 1)!
0
Aus Bemerkung 10.4.5 wissen wir, dass φ(l) (t) = dk f (y + th)(h, . . . , h), woraus
unmittelbar die behauptete Entwicklung folgt.
❑
10.4.8 Bemerkung. Den Ausdruck
X
q−1
1 l
pq−1 (x) = f (y) + d f (y)(x − y, . . . , x − y)
l! | {z }
l=1
l−mal
nennt man das (q − 1)-te mehrdimensionale Taylorsche Polynom der Funktion f an

der Anschlussstelle y. Schreibt man x = (ξ1 , . . . , ξn )T , so ist pq−1 (x) tatsächlich ein
Polynom in den n Variablen ξ1 , . . . , ξn mit Werten in X.
10.4.9 Proposition. Mit der Notation aus Satz 10.4.7 gilt:
(i) Ist C ≥ 0 so, dass sich die partiellen Ableitungen q-ter Ordnung abschätzen
lassen durch
∂q f
(u) ≤ C, (10.19)
∂xl1 · · · ∂xlq
für alle l1 , . . . , lq ∈ {1, . . . , n} und u auf der Strecke von y bis x, dann gilt
nq
kRq (x)k ≤ C kx − ykq .
q!
(ii) Ist D konvex und f sogar in C ∞ (D) und gelte (10.19) für alle q und alle u ∈ D, so
konvergiert die Reihe
X∞
1 l
d f (y)(x − y, . . . , x − y)
l! | {z }
l=1
l−mal
(gleichmäßig auf beschränkten Teilmengen von D) gegen f (x).

Beweis.
(i) Aus (10.19) folgt wegen (10.17) (u = (1 − t)y + tx und h = (h1 , . . . , hn )T )

X
n
∂q f
q
kd f (u)(h, . . . , h)k ≤ |hl1 | . . . |hlq | · (u) ≤ Cnq khkq∞ .
∂xl1 . . . ∂xlq
l1 ,...,lq =1
Nun folgt aus (10.18)

Z1
1
kRq (x)k ≤ (1 − t)q−1 · kd f q (1 − t)y + tx (x − y, . . . , x − y)k dt ≤
(q − 1)!
0
Z1
nq nq q
C khkq (1 − t)q−1 dt = C khk .
(q − 1)! ∞ q! ∞
0
q
(ii) Bei fest gewähltem y konvergiert nq! kx − ykq und damit Rq (x) für jedes x gegen
0. In der Tat geht diese Konvergenz für x in beschränkten Teilmengen von D
gleichmäßig von statten.
10.4.10 Beispiel. Sei T : D → R2 wie in Beispiel 10.4.4, wobei aber jetzt D : (0, α)×R
für irgend ein festes α ∈ R+ , α > 1. Wendet man Satz 10.4.7 für den Punkt y = (r, t)T =
(1, 0) an, so erhalten wir mit x − y = (ρ, τ)T aus Beispiel 10.4.6
q−1
X 1 l
T (x) = T (y) + d T (y)(x − y, . . . , x − y) + Rq (x) =
l! | {z }
l=1
l−mal
! q−1 ! !!
1 X1 l−1 cos(l − 1) 2
π
l cos l 2
π
= + lρτ +τ + Rq (x). (10.20)
0 l! sin(l − 1) π2 sin l π2
l=1
In Beispiel 10.4.4 haben wir insbesondere gesehen, dass (10.19) für C = α und k.k =
k.k∞ erfüllt ist. Also konvergiert die entsprechende Reihe in (10.20) gegen T (x).
Am Ende dieses Kapitels wollen wir nochmals mit dem Hauptsatz über implizite Funktionen und den Umkehrsatz in
Zusammenhang mit höheren Ableitungen betrachten.
10.4.11 Lemma. Sei I ⊆ R ein Intervall, X und Y Banachräume und h : I → L(X, Y), sodass h(t) für alle t ∈ I invertierbar
ist, wobei (h(t))−1 ∈ L(Y, X). Ist dann h in einem Punkt x ∈ I differenzierbar, so auch t 7→ (h(t))−1 , wobei
′
(h(x))−1 = −h(x)−1 h′ (x)h(x)−1 .
Beweis. Für t ∈ I \ {x} gilt
1 1
(h(t))−1 − (h(x))−1 = −(h(t))−1 h(t) − h(x) (h(x))−1 .
t−x t−x
Da h bei x differenzierbar ist, ist sie dort auch stetig. Wegen Korollar 9.3.3 ist auch die Zusammensetzung t 7→ (h(t))−1 bei
x stetig. Aus Lemma 9.2.7 folgt, dass für t → x obiger Ausdruck gegen −h(x)−1 h′ (x)h(x)−1 konvergiert.
❑
10.4.12 Lemma. Sei X ein Banachraum und seien D ⊆ Rm , I ⊆ R offen. Weiters seien H : I × D → X - wir schreiben
H(x, y1 , . . . ym ) - sowie h : I → D (⊆ Rm ) stetig differenzierbar, so ist auch t 7→ H(t, h(t)) stetig differenzierbar auf I mit
Ableitung
d ∂H Xm
∂H
H(t, h(t)) = (t, h(t)) + hl (t)′ (t, h(t))
dt ∂x l=1
∂yl
wobei h = (h1 , . . . , hm )T .
Beweis. φ : t 7→ H(t, h(t)) ist die Hintereinanderausführung von t 7→ (t, h(t)) und H. Aus der Kettenregel folgt
! Xm
d 1 ∂H ∂H
H(t, h(t)) = dφ(t)1 = dH(t, h(t)) ′ = (t, h(t)) + hl (t)′ (t, h(t)).
dt h (t) ∂x ∂yl
l=1
❑
10.4.13 Proposition. Mit den selben Voraussetzungen und der selben Notation wie im Hauptsatz über implizite Funktionen,
Satz 10.2.4, sei F ∈ Ck (D) mit k ∈ N, k ≥ 2. Dann ist auch die Funktion g : U → V immer k-mal stetig differenzierbar.
Beweis. Wir wissen aus Satz 10.2.4, dass g zumindest einmal stetig differenzierbar ist, wobei (u ∈ U)

dg(u) = −dF2 u, g(u) −1 dF1 u, g(u) .
Nach Voraussetzung sind (x, y) 7→ dF1 (x, y) und (x, y) 7→ dF2 (x, y) stetig partiell differenzierbar. Wegen (9.10), Lemma
10.4.11 und Lemma 10.4.12 ist u 7→ dg(u) partiell differenzierbar mit
 
X ∂
m
∂  ∂ ∂ 
dg(u) = dF2 u, g(u) −1  dF2 u, g(u) + gl (u) dF2 u, g(u)  dF2 u, g(u) −1 dF1 u, g(u)
∂u j ∂x j l=1
∂u j ∂yl
 
X ∂
m
 ∂ ∂ 
−dF2 u, g(u) −1  dF1 u, g(u) + gl (u) dF1 u, g(u)  ,
∂x j l=1
∂u j ∂yl
wobei g = (g1 , . . . , gm )T . Nach Korollar 9.1.3 und Korollar 9.2.8 ist diese Funktion stetig in u, womit g ∈ C2 (U). Außerdem

ist ∂u∂ dg(u) endliche Summe von endlichen Produkten von dF2 u, g(u) −1 , dF1 u, g(u) und von gewissen ersten partiellen
j
Ableitungen
∂ ∂ ∂ ∂ ∂
dF1 u, g(u) , dF1 u, g(u) , dF2 u, g(u) , dF2 u, g(u) , gl (u), l = 1, . . . , m.
∂x j ∂yl ∂x j ∂yl ∂u j
∂ ∂
Ist nun k ≥ 3, so sind letztere Funktionen nochmals stetig partiell differenzierbar, und man zeigt wie oben, dass ∂ui ∂u j dg(u)
existiert und stetig ist. Außerdem ist diese Funktion wieder eine endliche Summe von endlichen Produkten von obigen
Funktionen (mit i statt j) und dazu von zweiten partiellen Ableitungen
∂2 ∂2 ∂2
dF1 u, g(u) , dF1 u, g(u) , dF1 u, g(u) ,
∂xi ∂x j ∂xi ∂yl ∂yr ∂yl
∂2 ∂2 ∂2 ∂2
dF2 u, g(u) , dF2 u, g(u) , dF2 u, g(u) , gl (u).
∂xi ∂x j ∂xi ∂yl ∂yr ∂yl ∂ui ∂u j
Damit ist g ∈ C3 (U). Man fährt induktiv fort und erhält schließlich g ∈ Ck (U).
❑
10.4.14 Korollar. Mit den selben Voraussetzungen und der selben Notation wie im Umkehrsatz, Satz 10.3.1, sei f ∈ Ck (D)
mit k ∈ N, k ≥ 2. Dann ist auch die Funktion g : R → O immer k-mal stetig differenzierbar.
Beweis. Im Beweis von Satz 10.3.1 haben wir Satz 10.2.4 auf F(x, y) = f (y) − x angewandt, um die Funktion g als Lösung
von F(x, f (x)) = 0 zu erhalten. Aus Proposition 10.4.13 folgt somit g ∈ Ck (D).
❑
10.5 Extremwerte
Wir haben im ersten Semester in Definition 7.2.1 definiert, was es bedeutet, dass eine
reellwertige Funktion f : D → R (D ist Teilmenge eines metrischen Raumes) in einem
Punkt x ∈ D ein lokales Maximum (lokales Minimum):
∃δ > 0 : ∀t ∈ Uδ (x) : f (t) ≤ (≥) f (x).
Ist D offene Teilmenge von R, und ist f differenzierbar in einem lokalen Maximum
(Minimum) x, so haben wir in Satz 7.2.2 gesehen, dass dann f ′ (x) = 0. Wir wollen
diese Tatsache nun für auf D ⊆ Rn definierte Funktionen herleiten.
10.5.1 Satz. Sei x0 ein lokales Extremum, d.h. Maximum oder Minimum, von
f : D ⊆ Rn → R, und existieren bei x0 alle Richtungsableitungen
∂f f (x0 + tv) − f (x0 )
(x0 ) = lim ,
∂v t→0 t
so sind diese alle gleich Null. Ist sogar f ∈ C 1 , so gilt d f (x0 ) = 0.
10.5. EXTREMWERTE 95
Beweis. Sei v ∈ Rn ein beliebiger Vektor. Betrachte die Funktion φ(t) = f (x0 + tv). Da
D offen ist, ist φ in einer Umgebung von 0 definiert, und wegen unserer Voraussetzung
ist auch φ bei 0 differenzierbar und hat die Ableitung φ′ (0) = ∂∂vf (x0 ). Da x0 ein relatives
Extremum von f ist, hat auch φ ein relatives Extremum bei 0. Somit gilt φ′ (0) = 0.
Für f ∈ C 1 ist d f (x0 ) derart definiert, dass d f (x0 )v = ∂∂vf (x0 ) für alle v ∈ Rn . Es
folgt also d f (x0 ) = 0.
❑
Also ist d f (x0 ) = 0 eine notwendige Bedingung für ein Extremum. Punkte mit
d f (x0 ) = 0 heißen stationäre Punke. Wie im eindimensionalen ist diese aber nicht
hinreichend. Um dieses Problem genauer studieren zu können, wollen wir folgende
sprechweise einführen.
10.5.2 Definition. Für gerades k heißt die k-te Ableitung dk f (x0 ) : Rk×n → R von f
im Punkt x0 positiv definit bzw. positiv semidefinit, wenn dk f (x0 )(h, . . . , h) > 0 bzw.
dk f (x0 )(h, . . . , h) ≥ 0 für alle 0 , h ∈ Rn .
Entsprechend definiert man negativ definit bzw. negativ semidefinit.
10.5.3 Bemerkung. Ist n = 1, d.h. f : D ⊆ R → R, so gilt ja d k f (x0 )(h, . . . , h) =

hk · f (k) (x0 ), und man sieht, dass dk f (x0 ) genau dann positiv definit (semidefinit) ist,
wenn f (k) (x0 ) > (≥) 0. Entsprechendes gilt für den negativ definiten (semidefiniten)
Fall.
10.5.4 Bemerkung. Der für die meisten Anwendungen relevante Fall ist k = 2. Hier
lassen sich die Definitheitseigenschaften von d 2 f (x0 ) mit Mitteln der Linearen Algebra
betrachten. In diesem Fall ist d2 f (x0 ) : R2×n → R eine symmetrische Bilinearform:
X
n
∂2 f
d2 f (x0 )(u, v) = ul1 vl2 (x0 ) =
l1 ,l2 =1
∂xl1 ∂xl2
 ∂2 f 
 (x0 ) . . . ∂2 f  v1 
∂x1 ∂xn (x0 )
 ∂x1 ∂x.1 ..
  
  . 
u1 ... un   ..   .  .
 .   . 
 ∂2 f ∂2 f vn
∂xn ∂x1 (x0 ) . . . ∂xn ∂xn (x0 )
2
Diese symmetrische n × n-Matrix H f (x0 ) = ∂x∂i ∂xf j (x0 ) heißt auch Hesse-Matrix.
Aus der Linearen Algebra ist bekannt, dass die Bilinearform positiv definit (semi-
definit) ist, wenn alle Eigenwerte λ1 , . . . , λn (nicht notwendigerweise paarweise ver-
schieden) von H f (x0 ) größer (größer gleich) Null sind. Entsprechendes gilt für den
negativen Fall.
Weiters ist diese Bilinearform positiv definit genau dann, wenn alle Hauptmino-
ren10 von H f (x0 ) größer Null sind. Entsprechend ist sie genau dann negativ definit,
wenn die Hauptminoren nicht verschwinden und abwechselndes Vorzeichen beginnend
mit − haben.
Für den Beweis des folgenden Satzes benötigen wir ein Lemma.
10.5.5 Lemma. Für k, n ∈ N sei ω : Rk×n → R eine symmetrische, multilineare

Abbildung. Gilt ω(v, . . . , v) = 0 für alle v ∈ Rn , so verschwindet ω(v1 , . . . , vk ) für alle
v1 , . . . , vk ∈ Rn .
10 Hauptminoren einer quadratischen Matrix (α )
i j i, j=1,...,n sind die Determinanten aller Untermatrizen
(αi j )i, j=1,...,k für k = 1, . . . , n.
Beweis. Für k = 1 ist nichts zu beweisen. Für größere k’s zeigen wir die Aussage durch vollständige Induktion nach k. Ist
k = 2, so gilt für beliebige v, w ∈ Rn
0 = ω(v + w, v + w) = ω(v, v) + ω(v, w) + ω(w, v) + ω(w, w) = ω(v, w) + ω(w, v).
Also gilt ω(v, w) = −ω(w, v) und wegen der Symmetrie auch ω(v, w) = ω(w, v) und damit ω(v, w) = 0.
Ist k > 2, so seien wieder v, w ∈ Rn beliebig. Weiters sei λ ∈ R. Nun gilt wegen der Symmetrie
ω(v + λw, . . . , v + λw) =
X
k−1 !
k
ω(v, . . . , v) + λj ω(v, . . . , v, w, . . . , w) + λk ω(w, . . . , w)
j=1
j | {z } | {z }
j−mal (k− j)−mal
n
Für feste v, w ∈ R und variablem λ steht links immer Null und rechts ein Polynom in λ, dessen Koeffizienten somit alle
verschwinden müssen. Für j = k − 1 gilt daher insbesondere
ω(v, . . . , v , w) = 0,
| {z }
(k−1)−mal
und zwar für alle v, w ∈ R . Somit erfüllt für festes w ∈ Rn die offensichtlich symmetrische und multilineare Abbildung
n
(v1 , . . . , vk−1 ) 7→ ω(v1 , . . . , vk−1 , w)
die Voraussetzungen unseres Lemmas für k − 1 anstatt für k. Nach Induktionsvoraussetzung verschwindet diese multilineare
Abbildung für alle v1 , . . . , vk−1 ∈ Rn . Da w zwar fest, aber beliebig war, verschwindet auch ω.
❑
10.5.6 Satz. Für ein offenes D ⊆ Rn sei f : D → R, f ∈ C r (D) mit r ∈ N, und sei
x0 ∈ D mit d f (x0 ) = 0, . . . , dq−1 f (x0 ) = 0, d q f (x0 ) , 0, wobei q ≤ r. Dann gilt
(i) Hat f ein lokales Maximum bei x0 , so ist q gerade und dq f (x0 ) ist negativ semi-
definit.
(ii) Ist q gerade und dq f (x0 ) negativ definit, so hat f ein lokales Maximum bei x0 .
(iii) Hat f ein lokales Minimum bei x0 , so ist q gerade und dq f (x0 ) ist positiv semide-
finit.
(iv) Ist q gerade und dq f (x0 ) positiv definit, so hat f ein lokales Minimum bei x0 .
Beweis.
(i) Sei x0 ein relatives Maximum von f . Dann existiert ein δ > 0, sodass
f (x) ≤ f (x0 ) für alle x ∈ Uδ (x0 ).
Für ein v ∈ Rn \ {0} definieren wir φv (t) = f (x0 + tv), |t| < kvk δ , und sehen
wie in Satz 10.5.1, dass φv bei Null ein lokales Maximum hat. Außerdem ist
(q−1)
φ(k) k ′
v (0) = d f (x0 )(v, . . . , v), k = 1, . . . , q. Also φv (0) = · · · = φv (0) = 0.
Nach Voraussetzung ist dq f (x0 ) , 0, und wegen Lemma 10.5.5 muss
dq f (x0 )(v, . . . , v) , 0 in zumindest eine Richtung v. Also folgt φ(q)
v (0) , 0. Wäre
q ungerade, so wäre nach Korollar 7.3.11 die Zahl 0 aber kein lokales Extremum
von φv .
(q)
Damit ist q gerade. Wäre nun dq f (x0 ) nicht negativ semidefinit, d.h. φv (0) =
dq f (x0 )(v, . . . , v) > 0 in zumindest eine Richtung v, so folgt wieder aus Korollar
7.3.11, dass 0 ein lokales Minimum von φv ist. Somit ist 0 lokales Minimum und
lokales Maximum. Also muss φv auf einem hinreichend kleinen Intervall um 0
konstant sein, was aber φ(q) v (0) = 0 implizieren würde.
10.5. EXTREMWERTE 97
(ii) Sei q gerade und dq f (x0 ) negativ definit. Nun gibt es ein δ > 0, sodass dq f (x)
ebenfalls negativ definit ist für alle x ∈ Uδ (x0 ).
Um das einzusehen, nehme man das Gegenteil an. Dann gibt es zu jedem n ∈ N
ein xn , kxn − x0 k∞ < n1 , sodass dq f (xn ) nicht negativ definit ist. Es gibt daher ein
0 , hn ∈ Rn mit dq f (xn )(hn , . . . , hn ) ≥ 0. Wegen
hn hn 1
dq f (xn ) ,..., = dq f (xn )(hn , . . . , hn ) ≥ 0
khn k∞ khn k∞ khn kq∞
können wir annehmen, dass die hn immer khn k∞ = 1 erfüllen, also in der abge-
schlossenen und beschränkten Teilmenge
K1 (0) \ U1 (0) = {h : khk∞ = 1} ⊆ Rn
liegen. Da diese Menge nach Korollar 5.2.13 kompakt ist, gilt hn( j) → h, j → ∞,
für eine Teilfolge und für ein h ∈ K1 (0) \ U1 (0).
Somit konvergieren die Komponenten von hn( j) gegen die entsprechenden
k
Komponenten von h und alle partiellen Ableitungen ∂xl ∂...∂x
f
l
(xn( j) ) gegen
1 k
∂k f
(x0 ). Wegen (10.17) konvergiert dann auch dq f (xn( j) )(hn( j) , . . . , hn( j) ) ge-
∂xl1 ...∂xlk
gen d f (x0 )(h, . . . , h), und wir erhielten d q f (x0 )(h, . . . , h) ≥ 0 im Widerspruch
q
zur Voraussetzung.
Nach Satz 10.4.7 hat man für x ∈ Uδ (x0 )
q−1
X 1 l
f (x) = f (x0 ) + d f (x0 )(x − x0 , . . . , x − x0 ) + Rq (x) = f (x0 ) + Rq (x),
l! | {z }
l=1 l−mal
Z1
1
Rq (x) = d f q ((1 − t)x0 + tx)(x − x0 , . . . , x − x0 )(1 − t)q−1 dt.
(q − 1)! | {z }
0 q−mal
Wegen der Wahl von δ ist aber der Integrand < 0. Also gilt f (x) = f (x0 )+Rq (x) <
f (x0 ) für x , x0 , und somit ist x0 ein lokales Maximum.
Die Aussagen (iii) und (iv) zeigt man genauso wie (i) und (ii).
❑
Sucht man ein lokales Extremum einer überall differenzierbaren Funktion, so
braucht man nur unter jenen Punkten x0 mit d f (x0 ) = 0 zu suchen. In der Praxis wird
man die Gleichung d f (x0 ) = 0 aber meistens nicht explizit nach x0 auflösen können.
10.5.7 Bemerkung. Ob ein lokales Maximum (Minimum) ein globales Maximum (Mi-
nimum) ist, bedarf einer weiteren Prüfung. Eine Möglichkeit ist, alle lokalen Extrema
zu suchen, und diese dann untereinander zu vergleichen.
10.5.8 Beispiel. Wir betrachten die Funktion

(
R2 → R
f : .
(ξ1 , ξ2 )T 7→ 1 − ξ12 − ξ22
Der Graph dieser Funktion, daher alle Punkte (ξ1 , ξ2 , ξ3 )T ∈ R3 mit ξ3 = f (ξ1 , ξ2 )T , ist
ein Paraboloid.
ξ3
ξ2
ξ1
ξ
Abbildung 10.6: Graph der Funktion ξ3 = f 1
ξ2 für ξ12 + ξ22 ≤ 1
Die Ableitung von f berechnet sich als

∂f ∂f
d f (x) = (x), (x) = (−2ξ1 , −2ξ2 ).
∂x1 ∂x2
Schreibt man y ∈ R2 in Koordinaten (η1 , η2 )T bezüglich der kanonischen Basis,
so ergibt sich
d f (x)y = −2ξ1 η1 − 2ξ2 η2 .
Der einzige Punkt x mit d f (x) = (0, 0) ist offenbar x = (0, 0)T . Die zweiten
partiellen Ableitungen von f sind
∂2 f ∂2 f ∂2 f ∂2 f
2
= −2, = = 0, = −2.
∂x1 ∂x1 ∂x2 ∂x2 ∂x1 ∂x22
Die zweite Ableitung ist daher gleich
d2 f (x)(h, h) = −2h21 − 2h22 ,
und sie ist offenbar stets < 0, also negativ definit. Insbesondere ist (0, 0)T ein
lokales Maximum. Ist 0 nun auch ein globales Maximum? Das Bild, das man
von der Fläche hat, legt das sicherlich nahe. Aber wie lässt sich das zeigen?
Eine Möglichkeit ist, festzustellen, dass für (ξ1 , ξ2 )T , (0, 0)T sicherlich
f (ξ1 , ξ2 )T = 1 − (ξ12 + ξ22 ) < 1 = f (0, 0)T .
Man kann auch nach einem (globalen,lokalen) Minimum von f fragen. Ein
globales Minimum gibt es offensichtlich nicht, da z.B. für festes ξ2 und für
|ξ1 | → +∞ der Ausdruck f (ξ1 , ξ2 )T nach −∞ strebt.
Man kann aber z.B. fragen, ob f |D mit D = {(ξ1 , ξ2 )T ∈ R2 : k(ξ1 , ξ2 )T k2 < 1}
ein lokales oder globales Minimum y = (η1 , η2 )T hat. Das ist aber auch nicht der
Fall, denn dann wäre dort d f (y) = 0, was aber nur für y = 0 der Fall ist.
Nun kann man z.B. auch fragen, ob f |D mit D = {(ξ1 , ξ2 )T ∈ R2 : k(ξ1 , ξ2 )T k2 ≤
1} ein Minimum y = (η1 , η2 )T hat. Man beachte, dass man hier nicht unmittelbar
die Resultate dieses Abschnittes anwenden kann, da ja D nicht offen ist. In der
Tat ist D kompakt, und somit muss f auf D mindestens ein Minimum haben.
Ein solches kann aber nicht in D liegen, da es dann ein Minimum von f |D wäre,
von dem wir ja wissen, dass es diese nicht gibt.
10.6. LAGRANGE MULTIPLIKATOREN 99
Also muss y ∈ D \ D = T = {(ξ1 , ξ2 )T ∈ R2 : k(ξ1 , ξ2 )T k2 = 1}. Aber f ist auf T

konstant. Also sind alle y ∈ T Minima von f |D .
Wollen wir die Extrema von f auf dem abgeschlossenen Dreick ∆ mit den Eck-
punkten (0, 1)T , (2, 0)T , (2, 2)T finden, so gehen wir folgendermaßen vor.
Zunächst existieren zumindest ein Minimum und zumindest ein Maximum von
f auf ∆, da f stetig und ∆ abgeschlossen, beschränkt und somit kompakt ist.
Das Innere ∆o von ∆ ist eine offene Teilmenge von R2 , welche (0, 0)T nicht
enthält. Also kann ein Extremum von f nicht in ∆o liegen, da d f dort verschwin-
den müsste. Wir haben aber schon gesehen, dass (0, 0)T der einzige Punkt ist, wo
d f verschwindet.
Also müssen die Extrema am Rand ∂∆, dh. in der Vereinigung der drei Seiten
! ! !
2α 2α 2
a={ : α ∈ [0, 1]}, b = { : α ∈ [0, 1]}, c = { : α ∈ [0, 1]},
1−α 1+α 2α
suchen. Die Extrema von f auf a (b, c) sind aber die Extrema von
!
2α
fa (α) = f = 1 − 4α2 − 1 + 2α − α2 = −5α2 + 2α,
1−α
!
2α
fb (α) = f = 1 − 4α2 − 1 − 2α − α2 = −5α2 − 2α, bzw.
1+α
!
2
fc (α) = f = 1 − 4 − 4α2 = −3 − 4α2 ,
2α
jeweils auf [0, 1].
Für fa gilt fa′ (α) = −10α + 2 und fa′′ (α) = −10. Also ist α = 51 ein lokales
Maximum mit fa ( 15 ) = 51 . Für die Randpunkte von [0, 1] gilt fa (0) = 0, fa (1) =
−3. Insgesamt hat fa auf [0, 1] ein Maximum bei α = 15 und ein Minimum bei
α = 1.
Die Funktion fb ist auf [0, 1] offensichtlich monoton fallend. Also ist α = 0 ein
Maximum mit fb (0) = 0 und α = 1 ein Minimum mit fb (1) = −7.
Die Funktion fc ist auf [0, 1] auch monoton fallend. Also ist α = 0 ein Maximum
mit fc (0) = −3 und α = 1 ein Minimum mit fc (1) = −7.
Somit hat f auf ∂∆ das Minimum bei (2, 2)T mit Wert f (2, 2)T = −7 und das
2
Maximum bei 1−5 2 mit Wert 15 .
5
10.6 Lagrange Multiplikatoren

In diesem Abschnitt wollen wir die Suche nach lokalen Minima bzw. Maxima auf
folgende Situation ausdehen.
Sei f : D ⊆ Rn → R und sei g : D ⊆ Rn → Rm mit m < n. Nun wollen wir die
lokalen Maxima von f unter der Nebenbedingung g = 0 suchen, also alle y ∈ Rn mit
g(y) = 0, sodass für eine gewisse Kugel Uδ (y) ⊆ D gilt
x ∈ Uδ (y), g(x) = 0 ⇒ f (x) ≤ f (y). (10.21)
Entsprechend sind lokale Minima von f unter der Nebenbedingung g = 0 definiert.
Um diese lokalen Extrema mit Nebenbedingung zu finden, wendet man folgenden
Satz an.
10.6.1 Satz (Lagrangesche Multiplikatorenregel). Hat die Funktion f an der Stelle y

ein lokales Extremum unter der Nebenbedingung g = 0 und hat die Ableitung dg(y) ∈
Rm×n Rang m, so gibt es ein µ11 ∈ Rm derart, dass für die Funktion
H : D × Rm ⊆ Rn+m → R,
X
m
H(x, λ) := f (x) + (λ, g(x)) = f (x) + λ j g j (x)
j=1
(y, µ) ein stationärer Punkt ist, d.h. dH(y, µ) = 0. Es gelten also an dieser Stelle die
Gleichungen
∂f X m
∂g j
(y) + µj (y) = 0, i = 1, . . . , n,
∂xi j=1
∂xi
g j (y) = 0, j = 1, . . . , m.
Beweis. Laut Voraussetzung ist Matrix dg(y) mit n Spalten und m Zeilen vom Rang m.
Also gibt es m Spalten dieser Matrix, die linear unabhängig sind. Durch eine Umbe-
nennung der Variablen ξ1 , . . . , ξn , also eine Permutation der Koordinaten, kann man es
immer bewerkstelligen, dass die letzten m Spalten linear unabhängig sind.
Das heißt aber nun, dass, wenn wir Vektoren x ∈ Rn als (x1 , x2 ) ∈ R(n−m)+m und die

Matrix dg(y) entsprechend als dg1 (y)|dg2(y) mit dg1 (y) ∈ Rm×(n−m) , dg2 (y) ∈ Rm×m
schreiben, die Matrix dg2 (y) invertierbar ist.
Ist Uδ (y) ⊆ D wie in (10.21), so können wir den Hauptsatz über implizite Funktio-
nen, Satz 10.2.4, auf g|Uδ (y) anwenden und erhalten in einer offenen Menge der Form
U × V ⊆ Uδ (y) ⊆ R(n−m)+m mit y1 ∈ U, y2 ∈ V, wobei y = (y1 , y2 ), die eindeutige
Auflösbarkeit von g(x1 , x2 ) = 0. Also gibt es h : U ⊆ Rn−m → V ⊆ Rm in C 1 , sodass
(x1 , x2 ) ∈ U × V, g(x1 , x2 ) = 0 ⇔ x1 ∈ U, h(x1 ) = x2 .
Somit ist y1 eine Extremum von k(x1 ) := f (x1 , h(x1 )), x1 ∈ U. Wegen Satz 10.5.1 gilt
dk(y1 ) = 0. Nun ist wegen Satz 10.2.4 dh(y1 ) = −dg2 (y)−1 dg1 (y), und daher nach der
Kettenregel
! !
I I
0 = dk(y1 ) = d f (y) = (d f1 (y), d f2 (y)) =
dh(y1 ) −dg2 (y)−1 dg1 (y)

d f1 (y) + −d f2 (y)dg2 (y)−1 dg1 (y) .
|{z} | {z } |{z}
∈R1×(n−m) =:µT ∈R1×m Rm×(n−m)
Ausgeschrieben bedeutet das
∂f Xm
∂g j
(y) + µj (y) = 0, i = 1, . . . , n − m.
∂xi j=1
∂xi
Andererseits haben wir µ so definiert, dass µT dg2 (y) = −d f2 (y), also
∂f Xm
∂g j
(y) + µj (y) = 0, i = n − m + 1, . . . , n.
∂xi j=1
∂xi
Schließlich gilt g j (y) = 0, j = 1, . . . , m nach Voraussetzung.

❑
11 Man spricht von den Lagrangeschen Multiplikatoren.

10.6. LAGRANGE MULTIPLIKATOREN 101
10.6.2 Beispiel. Als einfaches Beispiel betrachte die Funktion f : R2 → R,

!
ξ
f = ξ2 η2 .
η
Wir wollen alle Extrema dieser Funktion auf T = {x ∈ R2 : kxk2 = 1} finden. Offen-
sichtlich entspricht das dem Aufsuchen aller Extrema der Funktion f unter der Neben-
bedingung g(x) = 0, wobei !
ξ
g = ξ2 + η2 − 1.
η

Wegen dg ηξ = (2ξ 2η) , (0 0) für ηξ ∈ T, ist die Regularitätsbedingung von Satz

10.6.1 erfüllt. Setzen wir ( ηξ ∈ R2 , λ ∈ R)
H(ξ, η, λ) = f (x) + λ · g(x) = ξ2 η2 + λξ2 + λη2 − λ,
so wissen wir aus Satz 10.6.1, dass alle Lösungen von dH(x, y, λ) = 0 Kandidaten für
lokale Extrema sind. Wir lösen also
∂H
(ξ, η, λ) = 2ξη2 + 2λξ = 2ξ(η2 + λ) = 0,
∂ξ
∂H
(ξ, η, λ) = 2ξ2 η + 2λη = 2η(ξ2 + λ) = 0,
∂η
!
∂H ξ
(ξ, η, λ) = g = ξ2 + η2 − 1 = 0.
∂λ η
(i) Ist ξ = 0, so muss η = ±1 und daher λ = 0.
(ii) Ist η = 0, so muss ξ = ±1 und daher λ = 0.
(iii) Sind beide ξ, η , 0, so folgt aus den ersten beiden Gleichungen ξ2 + η2 = −2λ
und aus der letzten ξ2 + η2 = 1. Also λ = − 21 sowie ξ = ± √12 , η = ± √12 .

Aus f ηξ = ξ2 η2 folgt sofort, dass überall f ηξ > 0 wenn beide ξ, η , 0. Somit sind die
vier Punkte (±1, 0)T , (0, ±1)T Minima auf T.
An jedem der vier Punkte (± √12 , ± √12 )T nimmt f den Wert 41 . Da T kompakt ist,
muss f darauf ein oder mehrere Maxima haben, welche in unserer Kandidatenmenge
enthalten sein muss. Also sind die vier Punkte (± √12 , ± √12 )T alle Maxima von f auf T.
10.6.3 Beispiel. Sei A = (ai, j )ni, j=1 ∈ Rn×n symmetrisch, d.h. AT = A. Wir suchen das
Maximum und das Minimum von f : Rn → R, x 7→ xT Ax auf der Kugeloberfläche
{x ∈ Rn : kxk2 = 1}. Also suchen wir Extrema von f unter der Nebenbedingung
P
g(x) = 1 − xT x = 1 − nj=1 ξ2j , wobei x = (ξ1 , . . . , ξn )T .
Zunächst ist dg(x) = −2xT vom Rang eins für alle x auf der Kugeloberfläche. Also
liefert uns Satz 10.6.1 ein notwendiges Kriterium für die gesuchten Extrema. Man hat
H(x, λ) = xT Ax + λ(1 − xT x) = xT (A − λI)x + λ = ((A − λI)x, x) + λ.
Mit der Produktregel für Skalarprodukte und wegen der Symmetrie von A folgt
∂H
(x, λ) = ((A − λI)ei , x) + ((A − λI)x, ei ) = 2(Ax − λx)T ei ,
∂xi

dH(x, λ) = 2(Ax − λx)T | 1 − xT x .
Die stationären Punkte müssen also (Ax − λx) = (A − λI)x = 0 und 1 − xT x = 0 erfüllen.
Somit kommen nur Eigenvektoren für die Extrema in Frage. Ist x ein Eigenvektor zum
Eigenwert λ, so folgt f (x) = xT Ax = xT λx = λ.
Da die Kugeloberfläche kompakt ist, existieren Minimum und Maximum. Wir er-
halten also für x ∈ Rn , kxk2 = 1
λmin ≤ xT Ax ≤ λmax ,
wobei λmin der kleinste und λmax der größte Eigenwert von A ist.
Mit den üblichen Überlegungen, wobei man komplexe n-Vektoren und n × n-
Matrizen mit reellen (2n)-Vektoren bzw. (2n) × (2n)-Matrizen identifiziert, ergibt sich
für komplexe, symmetrische n × n-Matrizen A, dass λmin ≤ z∗ Az ≤ λmax , z ∈ Cn , kzk22 =
Pn 2
j=1 |ζ j | = 1.
Kapitel 11
Wegintegrale
11.1 Wege
Wege im Rn sind der Anschauung nach etwas eindimensionales.
11.1.1 Definition. Ein Weg γ im Rn ist eine Abbildung von einem Intervall [a, b] nach
Rn . Ist γ stetig, so sprechen wir von einem stetigen Weg.
Dabei heißen zwei Wege γ : [a, b] → Rn und γ̃ : [ã, b̃] → Rn äquivalent, falls sie
Umparametrisierungen von einander sind, d.h. falls es eine streng monoton wachsende
Bijektion α : [a, b] → [ã, b̃] gibt, sodass γ̃ ◦ α = γ.1 Wir schreiben auch γ ∼ γ̃ dafür.
Ist γ ein Weg, so sei
γ− : [a, b] → Rn der Weg [a, b] → Rn , t 7→ γ(a + b − t), also der in der Gegenrichtung
durchlaufene Weg.
Sind γ1 : [a1 , b1 ] → Rn , γ2 : [a2 , b2 ] → Rn zwei (stetige) Wege mit b1 = a2 und
γ1 (b1 ) = γ2 (a2 ), so sei γ1 ⊕ γ2 : [a1 , b2 ] → Rn die (stetige) Funktion mit
(γ1 ⊕ γ2 )|[a1 ,b1 ] = γ1 , (γ1 ⊕ γ2 )|[a2 ,b2 ] = γ2 .
Sind x0 , . . . , xm Punkte aus Rn , so bezeichnet −

x−0−→
x1 , −
x−1−→
x2 , . . . , −
x−m−1
−−−−x→
m den stetigen
n
Weg γ : [0, m] → R definiert durch γ(t) = x j−1 + (t − ( j − 1))(x j − x j−1 ), wenn
t ∈ [ j − 1, j], j = 1, . . . , m. Solche Wege nennt man Polygonzüge. Ist m = 1, so nennt
man γ(t) = tx2 + (1 − t)x1 die gerade Strecke von x0 nach x1 und schreibt auch − x−0−→
x1
dafür.
11.1.2 Beispiel. Sind x0 , . . . , xm Punkte aus Rn , und definiert man die Wege x] j−1 x j :
[ j−1, j] → Rn , j = 1, . . . , m, durch x] j−1 x j (t) := x j−1 +(t−( j−1))(x j −x j−1 ), t ∈ [ j−1, j],
so sind offensichtlicherweise x] −−−−− →
j−1 x j und x j−1 x j äquivalent, und
xg ]xm = −
0 x1 ⊕ · · · ⊕ xm−1 x−0−→
x1 , −
x−1−→
x2 , . . . , −
x−m−1
−−−−x→
m.
11.1.3 Fakta.
1. Da mit α auch α−1 eine streng monoton wachsende Bijektion ist, ist ∼ eine Äqui-
valenzrelation. Man sieht auch unmittelbar, dass γ ∼ γ′ ⇔ γ− ∼ −γ′ −.
1 Wegen Korollar 6.5.3 ist eine solche Bijektionen α stetig. Umgekehrt ist eine stetige Bijektion α :
[a, b] → [ã, b̃] entweder streng monoton wachsend oder streng monoton fallend, vgl. Lemma 6.5.4.
103
104 KAPITEL 11. WEGINTEGRALE
2. Ist γ : [a, b] → Rn ein Weg und ist α(t) = a + t(b − a), so ist γ äquivalent zu
γ ◦ α : [0, 1] → Rn , also äquivalent zu einem Weg mit Parametermenge [0, 1].
3. Das Bild eines stetigen Weges ist als stetiges Bild einer kompakten und zusam-
menhängenden Menge wieder kompakt und zusammenhängend, siehe Proposi-
tion 6.1.11 und Proposition 6.2.4.
4. Man könnte glauben, dass das Bild zumindest eines stetigen Weges den Weg
schon bestimmt. Das ist aber nicht der Fall, wenn man nur an ein Geradenstück
denkt, das man zuerst in die Hin- und dann in die Rückrichtung durchläuft.
5. Das Bild eines stetigen Weges kann auch ganz unerwartet aussehen. Man kann
z.B. einen Weg in R2 konstruieren, der [0, 1] × [0, 1] als Bild hat.
Um einem Weg eine Länge ℓ(γ) zuzuordnen, liegt es nahe, das zuerst bei den ein-
fachsten Arten von Wegen, nämliche den geraden Strecken γ = → −
xy mit x, y ∈ Rn zu
tun:
ℓ(γ) := kx − yk2 .
Die Länge eines beliebigen Weges γ : [a, b] → Rn approximiert man dadurch, dass
man eine beliebige Zerlegung Z = {ξ j : j = 0, . . . , n(Z)} von [a, b] wie in Definition
8.1.2 hernimmt und die Länge des dazugehörigen Polygonzuges
−−−−−−−−→ −−−−−−−−−−−−−−−→
γ(ξ0 )γ(ξ1 ), . . . , γ(ξn(Z)−1 )γ(ξn(Z) ) (11.1)
nämlich
X
n(Z)
L(Z) := kγ(ξ j ) − γ(ξ j−1 )k2
j=1
a = ξ0 ξ1 ξ2 ξ3 ξ4 ξ5 ξ6 ξ7 = b :Z
γ(ξ7 )
γ
γ(ξ1 ) γ(ξ0 )
γ(ξ6 )
γ(ξ2 )
γ(ξ5 ) γ([a, b])
γ(ξ3 ) γ(ξ4 )
Abbildung 11.1: Polygonzüge zur Approximation der Weglänge
berechnet, und dann das Supremum über alle Zerlegungen nimmt:

ℓ(γ) := sup L(Z). (11.2)
Z∈Z
11.1. WEGE 105
Der Fall ℓ(γ) = +∞ kann dabei auftreten. Ist jedoch ℓ(γ) < +∞, so spricht man von
einem rektifizierbaren Weg.
11.1.4 Fakta.
1. Ist γ : [0, 1] → Rn , γ(t) = ty + (1 − t)x eine gerade Strecke, so gilt für eine
beliebige Zerlegung Z
X
n(Z)
L(Z) = k(ξ j − ξ j−1 )(y − x)k2 = kx − yk2 .
j=1
Also ist unser Zugang zur Weglänge in sich konsistent.
2. Da Z bezüglich ⊆ eine gerichtete Menge ist, und da wegen der Dreiecksunglei-

chung, kγ(w) − γ(u)k2 ≤ kγ(w) − γ(v)k2 + kγ(v) − γ(u)k2, aus Z1 ⊆ Z2 folgt, dass
L(Z1 ) ≤ L(Z2 ), kann man ℓ(γ) als Limes eines monoton wachsenden Netzes
über (Z, ⊆) schreiben.
3. Aus der Monotonie (vgl. 2) folgt unmittelbar für ein endliches A ⊆ [a, b], dass
ℓ(γ) = sup L(Z).

Z∈Z, Z⊇A
4. Ist γ nicht konstant, also ∃ t1 , t2 : γ(t1 ) , γ(t2 ), so folgt

L({a, b, t1 , t2 }) ≥ kγ(t1 ) − γ(t2 )k2 > 0, und damit ℓ(γ) > 0.
Ist γ konstant, so folgt sofort aus der Definition ℓ(γ) = 0.
5. Da sich die Zerlegungen der Definitionsbereiche von äquivalenten Wegen bi-

jektiv entsprechen, überzeugt man sich leicht, dass äquivalente Wege die selbe
Länge haben. Genauso leicht sieht man ℓ(γ) = ℓ(−γ).
6. Seien γ1 : [a1 , b1 ] → Rn , γ2 : [a2 , b2 ] → Rn zwei Wege mit b1 = a2 und

γ1 (b1 ) = γ2 (a2 ), und sei Z1 , Z2 bzw. Z die Menge aller Zerlegungen von [a1 , b1 ],
[a2 , b2 ] bzw. [a1 , b2 ].
Sind Z1 ∈ Z1 und Z2 ∈ Z2 , so folgt L(γ1 ⊕γ2 , Z1 ∪Z2 ) = L(γ1 , Z1 )+L(γ2 , Z2 ),
und daher (vgl. 3)
ℓ(γ1 ⊕ γ2 ) = sup L(γ1 ⊕ γ2 , Z) = sup L(γ1 , Z1 ) + L(γ2 , Z2 ) =

Z∈Z, Z⊇{a2 } (Z1 ,Z2 )∈Z1 ×Z2
sup sup L(γ1 , Z1 ) + L(γ2 , Z2 ) = sup L(γ1 , Z1 ) + ℓ(γ2 ) = ℓ(γ1 ) + ℓ(γ2 ).

Z1 ∈Z1 Z2 ∈Z2 Z1 ∈Z1
7. Ist Z eine Zerlegung von [a, b], und betrachtet man den in (11.1) erwähnten
Polygonzug p : [0, n(Z)],
t − ξ j−1
p(t) = γ(ξ j−1 ) + γ(ξ j ) − γ(ξ j−1 ) . (11.3)
ξ j − ξ j−1
Da dieser Weg eine Zusammensetzung von geraden Strecken - genauer eine Zu-
sammensetzung von zu geraden Strecken äquivalenten Wegen - ist, folgt aus dem
letzten Punkt, dass ℓ(p) = L(Z).
11.1.5 Lemma. Ist γ : [a, b] → Rn ein rektifizierbarer Weg, so ist die Funktion ℓ(x) :=
ℓ(γ|[a,x] ), x ∈ [a, b] monoton wachsend. Ist γ bei x rechtsstetig (linksstetig, stetig), so
ist auch ℓ dort rechtsstetig (linksstetig, stetig)2 .
Beweis. x 7→ ℓ(γ|[a,x] ) ist offensichtlich monoton steigend (vgl. Fakta 11.1.4, 6). Sei γ
in einem Punkt x ∈ [a, b) rechtsstetig. Wegen ℓ(γ|[a,b] ) = ℓ(γ|[a,x] ) + ℓ(γ|[x,b] ) ist auch
ℓ(γ|[x,b] ) endlich und somit das Supremum aller L(Z), wenn Z alle Zerlegungen von
[x, b] durchläuft.
Somit gibt es zu gegebenen ǫ eine Zerlegung Z0 von [x, b], sodass
ℓ(γ|[x,b] ) − ǫ < L(Z0 ) ≤ ℓ(γ|[x,b] ).
Wegen der Rechtsstetigkeit gibt es ein δ > 0, sodass kγ(x) − γ(s)k2 < ǫ, s ∈ [x, x +
δ). Da die L(Z) monoton von Z abhängen, können wir Z0 so wählen, dass die erste
Stützstelle ξ rechts von x einen Abstand kleiner als δ hat. Es folgt

ℓ(γ|[x,ξ] ) ≤ ℓ(γ|[x,ξ] ) + ℓ(γ|[ξ,b] ) − (L(Z0 ) − kγ(ξ) − γ(x)k2 ) .
Diese Ungleichung gilt, da die letzte Klammer nichtnegativ ist, denn L(Z0 ) − kγ(ξ) −
γ(x)k2 stimmt mit L(Z0 ∩ [ξ, b]) überein, und ist damit höchstens ℓ(γ|[ξ,b] ). Nun stimmt
der rechte Ausdruck in obiger Relation überein mit
kγ(ξ) − γ(x)k2 + ℓ(γ|[x,b] ) − L(Z0 ) < 2ǫ.
Also ist ℓ(γ|[x,ξ] ) < 2ǫ. Wegen der Monotonie gilt auch ℓ(γ|[a,s] ) − ℓ(γ|[a,x] ) = ℓ(γ|[x,s] ) ≤
ℓ(γ|[x,ξ] ) < 2ǫ, wenn s ∈ [x, ξ].
Die Linksstetigkeit zeigt man analog.
❑
Konkret ausrechnen lässt sich die Weglänge für stetig differenzierbare Wege.
11.1.6 Satz. Falls γ ∈ C 1 [a, b], so ist γ rektifizierbar, und ℓ(x) ist differenzierbar mit
der Ableitung kγ′ (x)k2 . Dabei gilt
Z b
ℓ(γ) = kγ′ (x)k2 dx.
a
Beweis. Wegen dem Hauptsatz der Differential- und Integralrechnung sowie (9.11) gilt
Z ξ Z ξj
j ′
kγ(ξ j ) − γ(ξ j−1 )k2 = γ (t) dt ≤ kγ′ (t)k2 dt.
ξ j−1 ξ j−12
Rb
Also L(Z) ≤ a kγ′ (t)k2 dt für jede Zerlegung Z von [a, b], und damit ℓ(γ) ≤
Rb
a
kγ′ (t)k2 dt.
Für a ≤ x < y ≤ b gilt
Z y
kγ(y) − γ(x)k2 ≤ ℓ(γ|[x,y] ) ≤ kγ′ (t)k2 dt.
x
Dividiert man diese Ungleichung durch (y − x) und lässt x → y streben, so konvergiert

die linke und die rechte Seite gegen kγ′ (y)k2 ; also auch der Ausdruck ℓ(y)−ℓ(x)
y−x in der
2 Rechtsstetig bedeutet lim s→x+ ℓ(s) = ℓ(x) und linksstetig lim s→x− ℓ(s) = ℓ(x)
11.1. WEGE 107
Mitte, und damit ℓ′ (y)− = kγ′ (y)k2 . Lässt man y → x streben, so sieht man genauso
ℓ′ (x)+ = kγ′ (x)k2 , und insgesamt ℓ′ (x) = kγ′ (x)k2 , x ∈ [a, b], wobei wir an den
Rändern die jeweiligen einseitigen Grenzwerte meinen.
❑
n
Die Funktion γ : [a, b] → R ist offensichtlicherweise stetig und stückweise stetig
differenzierbar (vgl. Definition 9.5.7), wenn es eine Zerlegung Z = {ξ j }n(Z) j=0 gibt, sodass
γ|[ξ j−1 ,ξ j ] ∈ C 1 [ξ j−1 , ξ j ] für j = 1, . . . , n(Z). Wendet man Satz 11.1.6 n(Z)-mal auf
γ|[ξ j−1 ,ξ j ] , j = 1, . . . , n(Z) an, so erhalten wir
11.1.7 Korollar. Ist γ : [a, b] → Rn ein stetiger und stückweise stetig differenzierbarer
Rb
Weg, so ist dieser rektifizierbar mit ℓ(γ) = a kγ′ (x)k2 dx.
11.1.8 Beispiel. Man betrachte den Weg (siehe Definition 6.8.12, Beispiel 10.1.9)
!
cos s
γ(s) = ∈ R2 , s ∈ [0, 2π].
sin s
Für ein t ∈ [0, 2π] gilt nach Satz 11.1.6

Z t ! Z tp
− sin s
ℓ(γ|[0,t] ) = ds = sin2 s + cos2 s ds = t.
0 cos s 2 0
γ(t) ≃ exp(it)
sin t
t
Also ist t genau die Weglänge
des Bogens γ|[0,t] .
−1 0 cos t 1
Das erklärt, warum man für ein w ∈ C ≃ R2 dargestellt in Polarkoordinaten (siehe

Definition 6.8.12), dh. w = r exp(it) = r(cos t + i sin t), die Zahl t auch als Bogenlänge
bezeichnet.
11.1.9 Bemerkung. Ist γ : [a, b] → Rn ein rektifizierbarer und stetiger Weg, so wissen
wir nun, dass ℓ das Intervall [a, b] monoton wachsend und surjektiv auf [0, ℓ(γ)] abbil-
det. Ist ℓ sogar bijektiv, so ist β = γ ◦ ℓ−1 ein zu γ äquivalenter Weg, sodass die Länge
des Weges β|[0,t] genau t ist.
Ist ℓ nicht injektiv, so kann man für t ∈ [0, ℓ(γ)], β(t) := γ(x) setzen, wobei x ∈
[a, b], sodass ℓ(x) = t. Im Fall, dass ℓ(x1 ) = t = ℓ(x2 ), hat γ|[x1 ,x2 ] Weglänge Null und
ist somit konstant. Also ist γ(x1 ) = γ(x2 ) und β daher wohldefiniert, sodass γ = β ◦ ℓ.
Aus der Kompaktheit von [0, ℓ(γ)] folgert man daraus leicht die Stetigkeit von β.
Also ist β auch in diesem Fall ein zu γ fast äquivalenter“ Weg, sodass die Länge
”
des Weges β|[0,t] genau t ist.
11.1.10 Bemerkung. Bisher haben wir bei der Behandlung von Wegen und Weglängen
nirgends verwendet, dass γ in den Rn mit der k.k2 -Norm hinein abbildet. Wir haben die
euklidische Norm nur verwendet, weil sie dem als natürlich empfundenen Längenbe-
griff entspricht.
In der Tat kann man genauso ℓ(γ) definieren, wenn γ eine beliebige Funktion von
[a, b] in einen Banachraum (X, k.k) ist.
Es gelten dann dieselben Eigenschaften, die wir eben aufgezählt haben, und ist
ℓ(γ) < +∞, so spricht man von γ als einer Funktion von beschränkter Variation.
Äquivalente Normen k.k und |k.k|, d.h. αk.k ≤ |k.k| ≤ βk.k, induzieren zwar verschie-
dene Längenbegriffe, aber diese sind dennoch vergleichbar:
αℓk.k (γ) ≤ ℓ|k.k| (γ) ≤ βℓk.k (γ).
Versieht man etwa Rn mit der Norm k.k∞ oder k.k1 , so erhält man für ein und dieselbe
Funktion verschiedene Längenbegriffe. Von besonderen Interesse ist der Fall X = R.
11.2 Wegintegrale
11.2.1 Beispiel. Wir betrachten ein Objekt im Gravitationsfeld einer Punktmasse, und
wollen die Arbeit berechnen, die verrichtet wird wenn man das Objekt von einer Positi-
on zu einer anderen verschiebt. Dabei denken wir uns diese Punktmasse im Nullvektor
des R3 .
Das Newtonsche Gravitations gesetz besagt, dass abgesehen von multiplikativen
Konstanten sich die Gravitationskraft umgekehrt proportional zum Quadrat ihres Ab-
standes r zur Punktmasse verhält, dh. r12 . Zerlegt man diese Kraft, die auf einen Punkt
x = (ξ, η, ζ)T ∈ R3 wirkt, in ihre Komponenten, so erhält man den Vektor
 
ξ 
1  
F(x) = − 3 η .
kxk2 ζ 
Verschiebt man nun einen Punkt P von x zu einer sehr nahen Position x + h, so ist die
Arbeit, die verrichtet wird, wegen der Formel Arbeit = Kraft × Weg“ ungefähr gleich
”

− F(x), h = −F(x)T h.
Sei nun P ein Punkt in der Position x0 , und werde P längs einer Kurve γ in die Po-
sition x1 verschoben. Sei γ gegeben in Parameterdarstellung γ : [0, 1] → R3 , γ(0) =
x0 , γ(1) = x1 , und sei vorausgesetzt, dass γ hinreichend glatt ist (z.B. stetig und stück-
weise stetig differenzierbar). Wir zerlegen die Kurve in kleine Abschnitte. Sei also
0 = t0 < t1 < t2 < . . . < tn−1 < tn = 1. Wird γ durch den Polygonzug mit Ecken in γ(ti )
approximiert, dann berechnet sich die verrichtete Arbeit ungefähr durch
X
n
T
ω≈ −F(γ(ti ) γ(ti ) − γ(ti−1 ) .
i=1
Wir werden unten sehen, dass dieser Ausdruck konvergiert, wenn man die Approxima-
tion immer genauer macht. Für diesen Grenzwert werden wir
Z
−F(x)T dx,
γ
schreiben, und ihn das Wegintegral des Vektorfeldes φ = −F T längs des Weges γ
nennen.
11.2. WEGINTEGRALE 109
Verallgemeinert haben wir folgende Ausgangssituation: Eine Menge D ⊆ Rn , eine

Funktion φ, die jedem Punkt x in D eine Abbildung von Rn nach R (oder allgemeiner in
einen Banachraum X) zuordnet, d.h. φ : D → L(Rn , X)3 , und einen Weg γ : [a, b] → D.
Die oben erwähnte Approximation der Arbeit entspricht bei gegebener Riemannscher
n(R)
Zerlegung R = (ξ j )n(R)
j=0 ; (α j ) j=1 der Summe
X
n(R)

W(R) := φ γ(α j ) γ(ξ j ) − γ(ξ j−1 ) . (11.4)
j=1

11.2.2 Definition. Konvergiert das Netz W(R) R∈R in X, so nennen wir seinen Grenz-
wert Z
φ(x) dx := lim W(R)
γ |R|→0
das Wegintegral von φ längs des Weges γ.

Wegintegrale sind spezielle Riemann-Stieltjes Integrale : Ist f : [a, b] → L(Rn , X)
und g : [a, b] → Rn ein Weg, so sei (R ∈ R)
X
n(R)

P(R) := f (α j ) g(ξ j ) − g(ξ j−1 ) .
j=1
Rb
Das Riemann-Stieltjes Integral a
f dg ist definiert als limR∈R P(R), falls letzterer Li-
mes in X existiert.
Der Zusammenhang von Wegintegral und Riemann-Stieltjes Integral ist der, dass
Rb R
P(R) = W(R) und dass a f dg = γ f (x) dx, wenn g = γ und f = φ ◦ γ,.
11.2.3 Fakta.
1. Ist γ̃ : [ã, b̃] → D ⊆ Rn ein Weg und γ = γ̃ ◦ β : [a, b] → D ein zu γ̃ äquivalenter
Weg mit einer streng monoton wachsenden Bijektion
n(R)
β : [a, b] → [ã, b̃]. Ist R = (ξ j )n(R)
j=0 ; (α j ) j=1 eine Riemannzerlegung von [a, b],
n(R)
so ist β(R) := β(ξ j ) n(R)j=0 ; β(α j ) j=1 eine solche von [ã, b̃] und umgekehrt. Da-
bei bleibt die Ordnung erhalten, also |R1 | ≤ |R2 | ⇔ |β(R1 )| ≤ |β(R2 )|. Außerdem
gilt W(R) = W(β(R)). Man folgert daraus auf elementare Weise, dass
Z Z
φ(x) dx = φ(x) dx.
γ̃ γ
In dem Sinne, dass wenn eines dieser Integrale existiert, dann auch das andere
existiert und diese übereinstimmen.
Ist γ− der in die Gegenrichtung durchlaufene Weg, so entsprechen sich die Rie-
mannsummen auch bijektiv, wobei die korrespondierenden
R R Summen W(R) nur
im Vorzeichen unterscheiden, und somit γ− φ(x) dx = − γ φ(x) dx.
2. Ist unser Weg rektifizierbar und stetig, d.h. ℓ(γ) < +∞, und ist φ stetig, so exis-
tiert das Integral.
Rb
Das folgt aus der allgemeineren Tatsache, dass a f dg existiert, falls f stetig
auf [a, b] und g rektifizierbar ist. Der Beweis für diese Tatsache ist ähnlich, wie
3 Man spricht von Vektorfeldern.
der Beweis für die Riemannintegrierbarkeit stetiger Funktionen mit Hilfe des
Cauchy-Kriteriums.
n(R1 ) n(R2 )
Beweis. Sind R1 = (ξ j )n(R 1)
j=0 ; (α j ) j=1 und R2 = (η j )n(R 2)
j=0 ; (β j ) j=1 zwei Rie-
mann Zerlegungen von [a, b], sodass die Stützstellen von R2 die von R1 umfas-
sen.
Ist j ∈ {1, . . . , n(R1 )}, so gibt es Indizes k( j − 1) < k( j), sodass
| {z }
Pk( j)
Es folgt mit g(ξ j ) − g(ξ j−1 ) = k=k( j−1)+1 g(ηk ) − g(ηk−1 )
kP(R2 ) − P(R1 )k ≤

X1 )
n(R
X
k( j)

f (α j ) g(ξ j ) − g(ξ j−1 ) − f (βk ) g(ηk ) − g(ηk−1 )

j=1 k=k( j−1)+1
X1 )
n(R X
k( j)
≤ k f (α j ) − f (βk )k · kg(ηk ) − g(ηk−1 )k2 .
j=1 k=k( j−1)+1
Dabei ist k f (α j ) − f (βk )k die Abbildungsnorm auf L(Rn , X), wenn Rn mit der
euklidischen Norm versehen ist.
Wegen |α j − βk | ≤ (ηk − ηk−1 ) ≤ |R1 |, k ∈ {k( j − 1) + 1, . . . , k( j)} folgt
X2 )
n(R
kP(R2 ) − P(R1 )k ≤ ρ(|R1 |) · kg(ηk ) − g(ηk−1 )k2 = ρ(|R1 |) · ℓ(g), (11.5)
k=1
wobei ρ(δ) := sups,t∈[a,b],|s−t|≤δ k f (s) − f (t)k. Wegen der gleichmäßigen Stetigkeit

von f gilt limδ→0 ρ(δ) = 0.
Seien nun R, R1 ∈ R beide mit einer Feinheit ≤ δ, wobei δ > 0 so ist, dass
ρ(δ) < ǫ. Wählt man eine gemeinsame Verfeinerung R2 von R und R1 , so
folgt aus (11.5), dass kP(R) − P(R1 )k < 2ℓ(g)ǫ. Also ist betreffliches Netz ein
Cauchy-Netz und daher konvergent.
❑
3. Als Grenzwert von Netzen mit Werten im Banachraum X erfüllen Wegintegrale

(µ, ν ∈ R (C)):
Z Z Z
(µφ(x) + νψ(x)) dx = µ φ(x) dx + ν ψ(x) dx
γ γ γ
Entsprechend sind Riemann-Stieltjes Integrale linear nicht nur in f , sondern auch

in g.
4. Sind γ1 : [a1 , b1 ] → D, γ2 : [a2 , b2 ] → D zwei stetige und rektifizierbare Wege

mit b1 = a2 und γ1 (b1 ) = γ2 (a2 ), und ist φ : D → L(Rn , X) stetig, dann gilt
Z Z Z
φ(x) dx = φ(x) dx + φ(x) dx. (11.6)
γ1 ⊕γ2 γ1 γ2
Allgemeiner folgt für ein stetiges f : [a, c] → L(Rn , X), ein rektifizierbares
g : [a, c] → Rn und ein b ∈ (a, c), dass
Z c Z b Z c
f dg = f dg + f dg.
a a b
Beweis. Die Voraussetzungen gewährleisten, dass alle Integrale existieren. Zu

Rb
gegebenem ǫ > 0 sei δ > 0 so klein, dass kP(R1 ) − a f dgk < ǫ,
Rc Rc
kP(R2 ) − b f dgk < ǫ und kP(R) − a f dgk < ǫ für jede Riemann-Zerlegung R1
von [a, b], jede Riemann-Zerlegung R2 von [b, c] und jede Riemann-Zerlegung
R von [a, c] mit |R1 |, |R2 |, |R| < δ.
Sind R1 und R2 zwei beliebige Riemann-Zerlegungen von [a, b] bzw. [b, c] mit
|R1 |, |R2 | < δ, so sei R jene Riemann-Zerlegungen von [a, c], deren Stütz- und
Zwischenstellen genau jene von R1 und R2 umfasst. Dann gilt |R| < δ und P(R) =
P(R1 ) + P(R2 ). Somit folgt aus der Dreiecksungleichung
Z b Z c Z c

f dg + f dg − f dg ≤
a b a
Z b Z c Z c
+ P(R) − < 3ǫ.
P(R1 ) − f dg + P(R2 ) − f dg f dg
a b a
Da ǫ > 0 beliebig war, gilt die behauptete Gleichheit.

❑
5. Es gilt
X
n(R)
kP(R)k ≤ k f (α j )k · kg(ξ j ) − g(ξ j−1 )k2 ≤
j=1
X
n(R)
max k f (t)k kg(ξ j ) − g(ξ j−1 )k2 ≤ max k f (t)k · ℓ(g).
t∈[a,b] t∈[a,b]
j=1
Daraus sieht man, dass für konstantes g das Riemann-Stieltjes Integral existiert
und verschindet. Entsprechend verschwindet das Wegintegral über einen kon-
stanten Weg.
Existiert das Riemann-Stieltjes Integral (Wegintegral), so ist seine Norm kleiner
oder gleich maxt∈[a,b] k f (t)k · ℓ(g) bzw. maxt∈[a,b] kφ ◦ γ(t)k · ℓ(γ).
6. Ist γ : [0, 1] → D ein gerade Strecke, also γ(t) = ty + (1 − t)x, und ist φ stetig, so
P
gilt W(R) = n(R) j=1 (ξ j − ξ j−1 )φ γ(α j ) (y − x) und daher
Z Z 1 Z 1 !

φ(x) dx = φ ty + (1 − t)x (y − x) dt = φ ty + (1 − t)x dt (y − x).
γ 0 0
Um konkret Riemann-Stieltjes Integrale bzw. in Folge Wegintegrale auszurechnen

dient am besten folgender Satz.
11.2.4 Satz. Ist g ∈ C 1 [a, b] und f stetig, so folgt
Z b Z b
f dg = f (t) g′ (t) dt.
a a
Ist γ ∈ C 1 [a, b] und φ stetig, so gilt

Z Z b

φ(x) dx = φ γ(t) γ′ (t) dt.
γ a
Dasselbe gilt für stetige und stückweise stetig differenzierbare Wege g bzw. γ.
Beweis. Nach dem Haupsatz der Differential- und Integralrechnung gilt (R ∈ R)
X
n(R)

P(R) = f (α j ) g(ξ j ) − g(ξ j−1 ) =
j=1
X
n(R) Z ξj Z b
f (α j ) g′ (t) dt = fR (t) g′ (t) dt,
j=1 ξ j−1 a
wobei fR (t) die stückweise konstante Funktion mit fR (t) = f (α j ), t ∈ [ξ j−1 , ξ j ), j =

1, . . . , n(R), und fR (b) = f (αn(R) ) ist. Für t ∈ [ξ j−1 , ξ j ), 1 ≤ j < n(R), bzw. für t ∈
[ξn(R)−1 , ξn(R) ] gilt
k fR (t) g′ (t) − f (t) g′ (t)k ≤ k fR (t) − f (t)k · kg′ (t)k2 =
k f (α j ) − f (t)k · kg′ (t)k2 ≤ ρ(|R|) · max kg′ (s)k2 .

s∈[a,b]
′ ′
Somit gilt limR∈R fR (t) γ (t) = f (t) γ (t) und zwar gleichmäßig in t ∈ [a, b]. Nach Satz
8.7.2 angewandt auf ein gleichmäßig konvergentes Netz von Funktionen erhalten wir
Z b
lim P(R) = lim fR (t) g′ (t) dt =
R∈R R∈R a
Z b Z b
′
lim fR (t) g (t) dt = f (t) g′ (t) dt.
a R∈R a
Für stetige und stückweise stetig differenzierbare Kurven folgt die Behauptung aus
dem gerade bewiesenen und Fakta 11.2.3, 4.
❑
11.2.5 Bemerkung. Ist X = Rm , so stellt man φ : D → L(Rn , X) meist als m × n-Matrix
dar. Sind γ j (t) die Komponenten unseres Weges, so berechnet man das Wegintegral
durch   ′ 
Z b  φ11 (γ(t)) · · · φ1n (γ(t))  γ1 (t)
 .. ..   .. 
 . .   .  dt.
a   
φm1 (γ(t)) · · · φmn (γ(t)) γn′ (t)
11.2.6 Definition. Ist D ⊆ C, h : D → C und γ : [a, b] → D ein Weg, so ist das

komplexe Wegintegral definiert durch
Z X
n(R)

h(z) dz := lim h γ(α j ) · γ(ξ j ) − γ(ξ j−1 ) , (11.7)
γ |R|→0
j=1
falls dieser Limes existiert.

Man beachte, dass die Summanden in (11.7) Produkte zweier komplexer Zahlen
sind. Zum Vergleich sind die Summanden in (11.4) Elemente aus X, die man erhält,

wenn man γ(ξ j ) − γ(ξ j−1 ) ∈ Rn auf die lineare Abbildung φ γ(α j ) ∈ L(Rn , X) an-
wendet. Um dennoch komplexe Wegintegrale als Wegintegrale betrachten zu können
sei bemerkt, dass für z, w ∈ C
! ! !
Re(zw) Re w − Im w Re z
= . (11.8)
Im(zw) Im w Re w Im z
Identifizieren wir C mit R2 , so lässt sich also die komplexe Multiplikation als An-
wendung eins Zweivektors auf eine lineare Abbildung aus L(R2 , R2 ) realisieren. Somit
nimmt (11.7) die Form
Z X
n(R) Z

h(z) dz lim φ γ(α j ) γ(ξ j ) − γ(ξ j−1 ) = φ(x) dx (11.9)
γ |R|→0 γ
j=1

an, wenn wir γ(ξ j ) − γ(ξ j−1 ) als Zweivektor betrachten und
!
Re h(z) − Im h(z)
φ(z) :=
Im h(z) Re h(z)
setzen.
Insbesondere existiert dieses Wegintegral für stetiges h sowie stetiges und rektifi-
zierbares γ. Ist γ sogar C 1 , so folgt aus Satz 11.2.4
Z Z b
φ(x) dx = φ(γ(t)) γ′ (t) dt.
γ a
′ 2
Da φ(γ(t)) γ (t) (∈ R ) als komplexe Zahl aufgefasst nichts anderes als die komplexe
Multiplikation h(γ(t)) · γ′ (t) ist, lässt sich das komplexe Wegintegral in diesem Fall
durch Z Z b
h(z) dz = h(γ(t)) · γ′ (t) dt (11.10)
γ a
berechnen. Schließlich folgt aus Fakta 11.2.3, 5, zusammen mit Beispiel 9.2.9, (v), dass
Z

h(z) dz ≤ max |h ◦ γ(t)| · ℓ(γ). (11.11)
γ t∈[a,b]
11.2.7 Bemerkung. Wie im Abschnitt über Wege ist bisher auch nirgends eingegangen,
dass g bzw. γ in den (Rn , k.k2 ) hinein abbildet.
Die obigen Resultate samt Beweise bleiben gültig, wenn g bzw. γ das Intervall
[a, b] in eine Menge D ⊆ Y (Y ist Banachraum) abbilden, und f : [a, b] → L(Y, X) bzw.
φ : D → L(Y, X), also jedem t ∈ [a, b] bzw. y ∈ D eine beschränkte lineare Abbildung
von Y nach X zuordnet.
Mit Hilfe dieser Wegintegrale lässt sich nun ein mehrdimensionales Analogon der
Rb
Tatsache a f ′ (t) dt = f (b) − f (a) herleiten.
11.2.8 Satz. Sei f : D ⊆ Rn → X eine stetig differenzierbare Funktion mit der Ablei-
tung d f (x) ∈ L(Rn , X). Ist γ ein stetiger und stückweise stetig differenzierbarer Weg, so
gilt Z

d f (x) dx = f γ(b) − f γ(a) .
γ
Beweis. Ist a = t0 < t1 < · · · < tl = b so, dass γ|[t j−1 ,t j ] ∈ C 1 [t j−1 , t j ], so folgt aus der
Kettenregel und dem Hauptsatz
Z Z b Z b

d f (x) dx = d f γ(t) γ′ (t) dt = ( f ◦ γ)′ (t) dt =
γ a a
X
l

f γ(t j ) − f γ(t j−1 ) = f γ(b) − f γ(a) .
j=1
❑
11.2.9 Definition. Vektorfelder φ : D → L(Rn , X), die Ableitungen d f stetig differen-
zierbarer Funktionen f : D → X sind, heißen auch Gradientenfelder.
Stetige Vektorfelder φ : D → L(Rn , X) mit der Eigenschaft, dass Wegintegrale
von φ über stetige und stückweise stetig differenzierbare Wege nur von Anfangs- und
Endpunkt des Weges abhängen nennt man wegunabhängige Vektorfelder.
Satz 11.2.8 besagt also, dass Gradientenfelder wegunabhängig sind.
11.2.10 Beispiel. Wir betrachten nochmals Beispiel 11.2.1. Dort war das Vektorfeld
φ : R3 \ {0} → L(R3 , R) durch φ(x) = kxk1 3 (ξ, η, ζ) gegeben. Nun ist aber, φ(x) =
2
d f (x), wobei f (x) = − kxk1 2 . Insbesondere berechnet sich die Arbeit, die man verrichten
muss, um einen Punkt P von x0 nach x1 entlang eines stetigen und stückweise stetig
differenzierbaren Weges γ zu bewegen, durch
Z
1 1
φ(x) dx = − .
γ kx k
0 2 kx 1 k2
11.2.11 Lemma. Sei hY, di ein metrischer Raum und M ⊆ Y eine feste nichtleere Teilmenge. Wir definieren für x ∈ Y

d(x, M) = inf d(x, y) : y ∈ M , (11.12)
und für Teilmengen A, B von Y

d(A, B) = inf d(x, y) : x ∈ A, y ∈ B . (11.13)
Dann gilt
Die Funktion x 7→ d(x, M) eine stetige Funktion von Y nach [0, +∞).
Es gilt y ∈ M ⇒ d(y, M) = 0. Ist M ⊆ Y abgeschlossen, so gilt auch d(y, M) = 0 ⇒ y ∈ M.
Sind A und B disjunkt und A kompakt, so gibt es ein x ∈ A, sodass d(x, B) = d(A, B).
Sind A und B disjunkt und A kompakt und B abgeschlossen, so ist d(A, B) > 0
Beweis. Sind x1 , x2 ∈ Y, so folgt leicht aus (11.12), dass d(x1 , M) ≤ d(x1 , x2 ) + d(x2 , M) und aus Symmetriegründen
d(x2 , M) ≤ d(x1 , x2 ) + d(x1 , M). Also gilt |d(x1 , M) − d(x2 , M)| ≤ d(x1 , x2 ), und daraus folgt die Stetigkeit.
Aus y ∈ M folgt trivialerweise d(y, M) ≤ d(y, y) = 0. Andererseits folgt aus d(y, M), dass d(y, yn ) → 0 für eine Folge
(yn )n∈N aus M. Wegen der Abgeschlossenheit folgt y ∈ M.
Ist A kompakt, so hat gemäß Proposition 6.1.11 die stetige Funktion x 7→ d(x, B) auf der kompakten Menge
A ein Minimum bei einem Punkt x ∈ A. Also gilt d(x, B) ≤ d(z, B), z ∈ A. Wegen Lemma 2.7.10 gilt somit
d(A, B) = inf{d(z, B) : z ∈ A} = d(x, B). Ist noch dazu B abgeschlossen, so muss auch d(A, B) = d(x, B) > 0.
❑
n
11.2.12 Bemerkung. Eine einfache aber hilfreiche Tatsache ist folgende. Sei D ⊆ R eine offene Menge und γ : [a, b] → D
stetig. Nach Proposition 6.1.11 ist γ([a, b]) kompakte Teilmenge von Rn .
Ist D , Rn , so wissen wir aus Lemma 11.2.11, dass 0 < d γ([a, b]), Rn \ D . Im Fall D = Rn setzen wir einfach
d γ([a, b]), Rn \ D = +∞.
Ist nun x ∈ Rn mit d(x, γ([a, b])) < d γ([a, b]), Rn \ D , so folgt klarerweise x ∈ D.
Ist γ : [a, b] → Rn ein Weg und ist R eine Riemannzerlegung von [a, b], so sei zunächst γ̃R : [0, n(R)] → Rn der
Polygonzug
−−−−−−−−→ −−−−−−−−−−−→
γ(ξ0 )γ(ξ1 ), . . . , γ(ξ p−1 )γ(ξ p ).
Nun bezeichne γR : [a, b] → Rn die Umparametrisierung γ̃R ◦ α von γ̃R , wobei α : [a, b] → [0, n(R)], sodass ( j =
1, . . . , n(R))
t − ξ j−1
α(t) = j − 1 + , t ∈ [ξ j−1 , ξ j ].
ξ j − ξ j−1
Offensichtlich gilt dann γR (ξ j ) = γ(ξ j ), j = 0, . . . , n(R).

11.2.13 Lemma. Sei D ⊆ Rn eine offene Menge und γ : [a, b] → D stetig. Zu jedem ǫ ∈ R, 0 < ǫ < d γ([a, b]), Rn \ D
gibt es ein δ > 0, sodass für jede Riemannzerlegungen R von [a, b] mit |R| ≤ δ gilt

kγ(s) − γR (t)k2 ≤ ǫ, s, t ∈ [ξ j−1 , ξ j ], j = 1, . . . , n(R), (11.14)
supt∈[a,b] kγ(t) − γR (t)k2 ≤ ǫ, also insbesondere d(γR (t), γ([a, b])) ≤ ǫ für alle t ∈ [a, b],
der stetige Weg γR und auch alle Konvexkombinationen (α ∈ [0, 1])
γα := α · γ + (1 − α) · γR
ganz in D verlaufen, dh. γα (t) ∈ D, t ∈ [a, b], α ∈ [0, 1],

Beweis. Wir setzen ρ := d γ([a, b]), Rn \ D . Nach Bemerkung 11.2.12 gilt ρ > 0. Wegen Satz 6.3.3 ist γ gleichmäßig stetig.
Also gibt es zu jedem ǫ ∈ (0, ρ) ein δ > 0, sodass
ǫ
kγ(s) − γ(t)k2 ≤ , wenn |s − t| ≤ δ. (11.15)
2

Sei R = (ξ j )n(R) j=0
; (α j )n(R)
j=1
eine Riemann-Zerlegung mit |R| ≤ δ, also |ξ j − ξ j−1 | ≤ δ. Für s, t ∈ [ξ j−1 , ξ j ] gilt wegen
γR (ξ j ) = γ(ξ j )
kγ(s) − γR (t)k2 ≤ kγ(s) − γ(ξ j )k2 + kγR (ξ j ) − γR (t)k2 ≤ ǫ.
Also gilt (11.14). Unmittelbar daraus folgt supt∈[a,b] kγ(t) − γR (t)k2 ≤ ǫ.
Aus d(γR (t), γ([a, b])) ≤ kγ(t) − γR (t)k2 ≤ ǫ < ρ folgt mit Bemerkung 11.2.12, dass γR (t) ∈ D. Schließlich folgt aus
kγ(t) − γα (t)k2 = kγ(t) − α · γ(t) − (1 − α) · γR (t)k2 = (1 − α) · kγ(t) − γR (t)k2 < ρ.
genauso, dass auch γα (t) ∈ D.

❑
11.2.14 Lemma. Sei D ⊆ Rn eine offene Menge und φ : D → L(Rn , X) stetig und γ : [a, b] → Rn rektifizierbar und stetig.
Dann gilt Z Z Z
lim φ(x) dx = lim φ(x) dx = φ(x) dx, (11.16)
|R|→0 γR |R|→0 γ̃R γ
wobei die Wegintegrale von φ über die Wege γR bzw. γ̃R für alle hinreichend kleinen |R| definiert sind.
Beweis. Nach
R Lemma 11.2.13
R verläuft γR bzw. γ̃R ganz in D für alle hinreichend kleinen |R|. Da γR und γ̃R äquivalent sind,
gilt immer γ φ(x) dx = γ̃ φ(x) dx.
R R
d γ([a,b]),Rn \D
Wir setzen ρ := min( 2 , 1) > 0. Die Menge

Kρ γ([a, b]) = {x ∈ Rn : d(x, γ([a, b])) ≤ ρ}
ist als Urbild der abgeschlossenen Menge (−∞, ρ] unter der stetigen Abbildung x 7→ d(x, γ([a, b])) abgeschlossen. Da
γ([a, b]) kompakt und daher beschränkt ist, hat auch Kρ γ([a, b]) die Eigenschaft. Wegen Korollar 5.2.13 ist diese Menge
sogar kompakt. Nach Bemerkung 11.2.12 ist sie in D enthalten.
Sei nun ǫ ∈ (0, d γ([a, b]), Rn \ D ). Wegen Satz 6.3.3 ist φ auf Kρ γ([a, b]) gleichmäßig stetig. Somit können wir ein
η > 0 finden, sodass
ǫ
kφ(x) − φ(y)k ≤ ℓ(γ) · , wenn x, y ∈ Kρ γ([a, b]) , kx − yk2 ≤ η. (11.17)
2 · ℓ(γ)
Das ǫ von Lemma 11.2.13 sei jetzt min(ǫ,
R η). Also erhalten wir ein δ > 0 mit alle den Eigenschaften in Lemma 11.2.13.
Gemäß Fakta 11.2.3, 2, existiert γ φ(x) dx. Somit gibt es ein θ ∈ (0, δ] > 0, sodass
Z
ǫ
W(R) − φ(x) dx ≤
γ 2

wenn nur |R| ≤ θ. Sei R = (ξ j )n(R)
j=0
; (α j )n(R)
j=1
eine Riemann-Zerlegung mit |R| ≤ θ (≤ δ).
R1
Mit Fakta 11.2.3, 4, 6, und wegen φ γ(α j ) = 0 φ γ(α j ) dt erhalten wir folgende Abschätzung
Z n(R) Z
X 1
W(R) − φ(x) dx ≤ φ γ(α j ) − φ tγ(ξ j ) + (1 − t)γ(ξ j−1 ) dt · kγ(ξ j ) − γ(ξ j−1 )k2 . (11.18)
γR j=1 0
Wegen |ξ j − α j |, |ξ j−1 − α j | ≤ δ und (11.14)4 folgt
ktγ(ξ j ) + (1 − t)γ(ξ j−1 ) − γ(α j )k2 ≤ tkγ(α j ) − γ(ξ j )k2 + (1 − t)kγ(α j ) − γ(ξ j−1 )k2 ≤ min(ǫ, η) ≤ η, (11.19)
ǫ
und wegen (11.17) auch kφ tγ(ξ j ) + (1 − t)γ(ξ j−1 ) − φ γ(α j ) k ≤ 2·ℓ(γ) für t ∈ [0, 1]. Somit lässt sich (11.18) nach oben
abschätzen durch (vgl. (9.11))
X
n(R)
ǫ ǫ
· kγ(ξ j ) − γ(ξ j−1 )k2 ≤ .
j=1
2 · ℓ(γ) 2
Aus der Dreiecksungleichung schließlich

Z Z

φ(x) dx − φ(x) dx ≤ ǫ.
γ γR
❑
11.2.15 Bemerkung. Aus Lemma 11.2.14 erkennen wir, dass ein stetiges Vektorfeld φ : D → L(Rn , X) bereits wegun-
abhängig ist, wenn Wegintegrale von φ nur über Polygonzüge jeweils nur von Anfangs- und Endpunkt abhängen.
In dem Fall sind Wegintegrale von φ sogar über alle stetigen und rektifizierbaren Wege wegunabhängig.
Als Umkehrung von Satz 11.2.8 gilt folgender Satz 11.2.16, wobei zwei Punkte
x, y in einer Menge D ⊆ Rn durch den Weg γ : [a, b] → D verbindbar heißen, wenn
γ(a) = x und γ(b) = y.
11.2.16 Satz. Sei D ⊆ Rn eine offene Menge, sodass sich je zwei Vektoren in D
durch einen stetigen und stückweise stetig differenzierbaren Weg verbinden lassen. Sei
φ : D → L(Rn , X) stetig und wegunabhängig. Dann gilt φ(x) = d f (x) für die stetig
differenzierbare Funktion f : D → X
Z
f (x) = φ(y) dy,
γ
wobei x0 ein fester Punkt ist, und γ irgend ein stetiger und stückweise stetig differen-
zierbarer Weg mit γ(a) = x0 , γ(b) = x ist.
Die Funktion f : D → X mit der Eigenschaft, dass φ(x) = d f (x), ist dabei eindeutig
bis auf eine additive Konstante aus X.
∂f
Beweis. Nach Voraussetzung ist f wohldefiniert. Wir zeigen ∂x i
(x) = φ(x)ei für alle
i = 1, . . . , n.
Seien x ∈ D und δ > 0 so, dass Uδ (x) ⊆ D. Sei γ : [a, b] → D ein Weg mit
γ(a) = x0 , γ(b) = x. Für t ∈ (−δ, δ) sei βt : [0, 1] → Rn die gerade Strecke βt (s) =
s(x+tei )+(1− s)x und γt : [b, b+1] → Rn der zu βt äquivalente Weg γt (τ) = βt (τ−b) =
x + t(τ − b)ei . Es folgt
Z Z Z
f (x + tei ) = φ(x) dx = φ(x) dx + φ(x) dx.
γ⊕γt γ γt
Also
Z Z Z 1
f (x + tei ) − f (x) 1 1
= φ(x) dx = φ(x) dx = φ(x + tsei ) ei ds.
t t γt t βt 0
4 Man beachte, dass γR (ξ j ) = γ(ξ j ).
Wegen der Stetigkeit der Funktion φ konvergiert der Integrand für t → 0 gleichmäßig
∂f
in s ∈ [0, 1] gegen die Konstante φ(x)ei . Nach Satz 8.7.2 folgt ∂x i
(x) = φ(x)ei .
Die Eindeutigkeit folgt sofort aus Satz 11.2.8.
❑
11.2.17 Bemerkung. Die Bedingung an die Menge D in dem Satz wird insbesondere
von konvexen Mengen D erfüllt, da zwei Punkte durch eine gerade Strecke verbunden
werden können.
Wir wollen an den Begriff einer zusammenhängender Teilmenge E eines metrischen Raumes erinnern, siehe Definition
6.2.2: E heißt zusammenhängend, wenn man E nicht als Vereinigung zweier nichtleerer getrennter Mengen schreiben kann.
Dabei heißen A und B getrennt, wenn c(A) ∩ B = A ∩ c(B) = ∅.
11.2.18
T Lemma. Ist (Ei )i∈I eine
S Familie bestehend aus zusammenhängenden Teilmengen eines metrischen Raumes, sodass
i∈I Ei , ∅, so ist auch E := i∈I Ei zusammenhängend.
T
Beweis. Wir halten einen Punkt x ∈ i∈I Ei fest. Angenommen E = A∪B ˙ mit getrennten, nichtleereren Mengen A und B.
Wir wählen die Bezeichnung so, dass x ∈ A.
˙ ∩ Ei ) für jedes i ∈ I. Wegen c(A ∩ Ei ) ∩ (B ∩ Ei ) ⊆ c(A) ∩ B = ∅ und (A ∩ Ei ) ∩ c(B ∩ Ei ) ⊆
Es folgt Ei = (A ∩ Ei )∪(B
A ∩ c(B) = ∅ sind auch A ∩ Ei und B ∩ Ei getrennt.
Da Ei zusammenhängend
S ist, muss eine dieser Menge leer sein. Wegen x ∈ A ∩ Ei muss B ∩ Ei = ∅. Das gilt für alle
i ∈ I, und somit B ∩ E = i∈I (B ∩ Ei ) = ∅ im Widerspruch zur Wahl von A und B.
❑
11.2.19 Lemma. Ist D ⊆ Rn eine nichtleere, offene Menge, so sind je zwei Punkte aus D genau dann durch einen stetigen
Weg verbindbar, wenn D zusammenhängend ist (vgl. Definition 6.2.2). In diesem Fall sind je zwei Punkte aus D sogar durch
einen achsenparallelen Polygonzug5 verbindbar.
Beweis. Angenommen je zwei Punkte aus D sind durch einen stetigen Weg verbindbar. Dann sei x irgendein fester Punkt
aus D. Zu jedem y ∈ D gibt es einen stetigen Weg γy : [ay , by ] → D mit γy (ay ) = x und γy (ay ) = y. Es folgt
[ [
D= {y} ⊆ γy ([ay , by ]) ⊆ D.
y∈D y∈D
Also ist D die Vereinigung der nach Proposition 6.2.4 zusammenhängenden Mengen γy ([ay , by ]), y ∈ D. Nach unserer Wahl
von γy haben diese Mengen zumindest den Punkt x gemein. Nach Lemma 11.2.18 ist D zusammenhängend.
Sei nun umgekehrt D zusammenhängend und x ∈ D wieder fest. Wir bezeichnen mit A die Menge aller Punkte y ∈ D,
die mit x durch einen achsenparallelen Polygonzug verbindbar sind. Da − →
xx auch ein solcher ist, folgt x ∈ A, also A , ∅.
Klarerweise ist B := D \ A die Menge aller y ∈ D, die mit x nicht durch einen achsenparallelen Polygonzug verbindbar sind.
Sei y ∈ A und δ > 0 so klein, dass Uδ (y) - definiert bezüglich der k.k∞ -Norm auf Rn - ganz in D enthalten ist. Ist
nun −x−0−→
x1 , . . . , −
x−m−1
−−−−x→
m ein achsenparalleler Polygonzug von x nach y, daher x0 = x und xm = y, und z ∈ Uδ (y), so gilt
z = y + λ1 e1 + · · · + λn en mit |λ1 |, . . . , |λn | < δ und daher ist
− −−−−−−−−−−→ −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−→
x−0−→
x1 , . . . , −
x−m−1
−−−−x→
m , y (y + λ1 e1 ), . . . , (y + λ1 e1 + . . . λn−1 en−1 ) (y + λ1 e1 + . . . λn en )
ein achsenparalleler Polygonzug von x nach z. Also ist z ∈ A und daher Uδ (y) ⊆ A. Somit ist A offen, und kein Punkt y aus
A kann Häufungspunkt von B sein, da ja Uδ (y) keine Punkte aus B enthält. Also gilt A ∩ c(B) = ∅.
Sei nun y ∈ B und δ > 0 so klein, dass Uδ (y) ⊆ D. Ist z = y + λ1 e1 + · · · + λn en ∈ Uδ (y) und wäre z ∈ A mit einem
achsenparalleler Polygonzug −x−0−→
x1 , . . . , −
x−m−1
−−−−x→
m von x nach z, so wäre
− −−−−−−−−−−−−−−−−−−−−−−−−→ −−−−−−−−−−→
x−0−→
x1 , . . . , −
x−m−1
−−−−x→
m , z (y + λ1 e1 + . . . λn−1 en−1 ), . . . , (y + λ1 e1 ) y
ein achsenparalleler Polygonzug von x nach y, und daher y ∈ A. Dieser Widerspruch zeigt, dass z ∈ B und somit Uδ (y) ⊆ B.
Also ist auch B offen, und kein Punkt y aus B kann Häufungspunkt von A sein, da ja Uδ (y) keine Punkte aus A enthält. Somit
gilt auch c(A) ∩ B = ∅.
Da D zusammenhängend ist, und da A , ∅, muss B = ∅ bzw. D = A, was aber genau bedeutet, dass alle Punkte aus D
mit x durch einen achsenparalleler Polygonzug verbindbar sind. Klarerweise sind dann auch zwei beliebige Punkte aus D
durch einen achsenparalleler Polygonzug - zumindest via x - verbindbar.
❑
Offene zusammenhängende Teilmengen von Rn heißen Gebiete.
11.2.20 Bemerkung. Da Polygonzüge stetig und stückweise stetig differenzierbarer sind, treffen die in Satz 11.2.16 gemach-
ten Voraussetzungen an die Menge D genau auf Gebiete zu.
Man kann die Voraussetzungen für Satz 11.2.16 noch dahingehend abschwächen, dass nur Wegintegrale von φ über
achsenparalleler Polygonzüge wegunabhängig sind. Das ist möglich, da man die Wege γ in der Aussage und im Beweis von
Satz 11.2.16 wegen Lemma 11.2.19 als achsenparallele Polygonzüge wählen kann. Der im Beweis verwendete Weg βt ist
auch eine achsenparallele gerade Strecke, womit γ ⊕ γt ebenfalls ein achsenparalleler Polygonzug ist.
ist ein Polygonzug −

5 Das x−0−→
x1 , −
x−1−→
x2 , . . . , −
x−m−1
−−−−x→
m , wo x j − x j−1 ein skalares Vielfaches eines gewissen
kanonischen Basisvektors ei( j) für j = 1, . . . , m ist.
11.2.21 Lemma. Ist D ⊆ Rn eine nichtleere, offene Menge, so lässt sich D als Vereinigung von paarweise disjunkten
Gebieten schreiben: [
D= Di
i∈I
Ist γ : [a, b] → D ein stetiger Weg, so liegt das Bild von γ in genau einem dieser Gebiete.
Beweis. Wir definieren auf D eine Relation. x ∼ y gelte genau dann, wenn es ein Gebiet G ⊆ D gibt, sodass x, y ∈ G. Da
für ǫ > 0 hinreichend klein die offene Kugel Uǫ (x) ein in D enthaltenes Gebiet ist (siehe Lemma 11.2.19), ist ∼ reflexiv. Die
Symmetrieeigenschaft ist offensichtlich, und die Translativität folgt sofort aus Lemma 11.2.18.
Somit ist ∼ eine Äquivalenzrelation. Also zerfällt D in Äquivalenzklassen [x]∼ , x ∈ D. Klarerweise ist [x]∼ die
Vereinigung aller Gebiete, die x enthalten, und daher offen und zusammenhängend (vgl. Lemma 11.2.18) und daher ein
Gebiet.
Ist γ : [a, b] → D stetig, so ist
[
Di (11.20)
i∈I,γ([a,b])∩Di ,∅
als Vereinigung offener Mengen offen und enthält γ([a, b]). Für i ∈ I, γ([a, b]) ∩ Di , ∅ ist nach Lemma 11.2.18 jede der
Mengen γ([a, b]) ∪ Di zusammenhängend. Lemma 11.2.18 nochmals auf alle diese Mengen angewandt zeigt, dass (11.20)
zusammenhängend ist. Also ist diese Menge ein Gebiet und daher gleich einer der Di .
❑
11.2.22 Bemerkung. Wendet man Satz 11.2.16 auf jedes der disjunkten Gebiete in Lemma 11.2.21 an, so erhält man
gemeinsam mit Satz 11.2.8, dass ist ein Vektorfeld genau dann Gradientenfeld ist, wenn es wegunabhängig ist.
Die Bedingung aus Satz 11.2.16 ist zwar von theoretischer Bedeutung, aber sie zu
überprüfen ist bei den meisten Vektorfeldern praktisch unmöglich. Bei stetig differen-
zierbaren Vektorfeldern gibt es eine greifbarere Bedingung.
Sei also D ⊆ Rn offen, φ : D → L(Rn , X) stetig differenzierbar. Angenommen, φ ist
die Ableitung einer Funktion f : D → X, also φ = d f . Klarerweise ist dann f ∈ C 2 (D)
und wegen dem Satz von Schwarz (x ∈ D)
∂ ∂2 f ∂2 f ∂
φ(x)e j = (x) = (x) = φ(x)ei . (11.21)
∂xi ∂x j ∂xi ∂xi ∂x j ∂x j
Wir sehen also, dass

∂ ∂
φ(.)e j = φ(.)ei , i, j ∈ {1, . . . , n}, (11.22)
∂xi ∂x j
eine notwendige Bedingung dafür ist, dass φ ein Gradientenfeld ist.

11.2.23 Beispiel. Sei D = {(x, y)T ∈ R2 : x , 0, y < π2 + πZ}, und
φ : D → L(R2 , R) R1×2 definiert durch
! !
x tan y 1
φ = − 2 + 2xy + x2 , + x 2
+ y 2
.
y x x cos2 y
Man rechnet nun ! !

∂ x 1 ∂ x
φ e1 = − 2 + 2x = φ e2 .
∂y y x cos2 y ∂x y
Wegen (11.22) ist φ ein Kandidat für ein Gradientenfeld. Wir sind aber zu diesem
Zeitpunkt weder sicher ob es sich um ein Gradientenfeld handelt, noch haben wir es
explizit in der Hand. Um jetzt konkret auf die Suche zu gehen, nehmen wir einmal
unbestimmt f : D → R so an, dass d f = φ. Also
! !
∂f x tan y 2 ∂f x 1
= − 2 + 2xy + x , = + x2 + y2 .
∂x y x ∂y y x cos2 y
Wegen der ersten Gleichung folgt

! Z
x tan y tan y x3
f = − 2 + 2xy + x2 dx + c(y) = + x2 y + + c(y),
y x x 3
mit einer C 2 Funktion c(y), die nur von y abhängt. Nun leiten wir das nach y ab, ver-
wenden die zweite Gleichung von oben und erhalten
!
1 2 ′ ∂f x 1
2
+ x + c (y) = = + x2 + y2 .
x cos y ∂y y x cos2 y
3
Also muss c(y) von der Gestalt c(y) = y3 + c sein. Wir sehen, dass tatsächlich φ = d f
ist, wobei !
x tan y x3 + y3
f = + x2 y + .
y x 3
Wir wollen nun zeigen, dass (11.22) für den einfachen Fall eines offenen Quaders
Q
D = ni=1 (ai , bi ) auch hinreichend ist. In der Tat gilt allgemein, dass sie sogar für so-
genannte einfach zusammenhängende Gebiete6 hinreichend ist. Die Methoden um die
allgemeinere Variante zu beweisen, bedürfen eines größeren Apparates von Mathema-
tischen Begriffen (siehe Definition 11.3.1).
Q
11.2.24 Satz. Sei D = ni=1 (ai , bi ) ⊆ Rn , und sei φ : D → L(Rn , X) stetig differenzier-
bar. Gilt dann (11.22), so ist φ ein Gradientenfeld.
Beweis. Sei c = (c j )nj=1 ∈ D fest. Für x = (x j )nj=1 ∈ D seien
v0 = c, vi := c + (x1 − c1 )e1 + . . . + (xi − ci )ei , i = 1, . . . , n.
Somit gilt insbesondere v0 = c, vn = x. Weiters sei γ der Polygonzug −

v−0−→
v1 , . . . , −
v−n−1
−−−→vn ,
und (siehe Beispiel 11.1.2 und (11.6))
Z n Z
X
f (x) := φ(y) dy = φ(y) dy.
γ −
v−j−1
−−→vj
j=1
Mit Satz 11.2.4 und mit der Substitution s = (x j − c j )t folgt

n Z
X 1 n Z
X x j −c j
f (x) = φ((1−t)v j−1 +tv j ) (v j −v j−1 ) dt = φ(v j−1 +se j ) e j ds. (11.23)
j=1 0 j=1 0
Nun leiten wir diese Gleichung nach xi ab, und werten bei x aus. Da für j < i im j-ten
Summanden von (11.23) die Variable xi nicht vorkommt, ist seine Ableitung gleich
Null.
Beim i-ten Summanden tritt xi in der oberen Integralgrenze auf, weswegen seine
Ableitung nach xi wegen der Kettenregel gleich φ(vi−1 + (xi − c j )ei )ei = φ(vi )ei ist.
Für j > i tritt xi nur im Integranden auf. Wegen Korollar 8.7.11 ist seine Ableitung
gleich Z x j −c j
∂
φ(v j−1 + se j )e j ds
0 ∂xi
6 In der Ebene kann man sich das als Gebiet ohne Löcher vorstellen.
und wegen (11.22) weiter gleich

Z x j −c j
∂
φ(v j−1 + se j )ei ds = φ(v j )ei − φ(v j−1 )ei .
0 ∂x j
Also ist die Ableitung von (11.23) nach xi gleich
∂f Xn

(x) = φ(vi )ei + φ(v j )ei − φ(v j−1 )ei = φ(vn )ei = φ(x)ei .
∂xi j=i+1
11.2.25 Beispiel. Sei I ein reelles Intervall und x : I → Rn eine C 1 -Funktion mit x(I) ⊆
D für eine gewisse offene Teilmenge D von Rn . Nun genüge x der Differentialgleichung
X
n

f j x(t) · x′j (t) = 0, t ∈ I, (11.24)
j=1
wobei f1 , . . . , fn : D → R alle in C(D) sind. Ziel ist es, mehr über die Funktion x in
Erfahrung zu bringen.
Das geht sicher dann, wenn ( f1 , . . . , fn ) : D → L(Rn , R) ein Gradientenfeld ist,
dh. wenn ( f1 , . . . , fn ) = dF für ein F ∈ C 1 (D). Man nennt (11.24) dann eine exakte
Differentialgleichung. In der Tat liest sich in diesem Fall (11.24) wegen der Kettenregel
(siehe auch Bemerkung 10.1.20) als
(F ◦ x)′ (t) = 0, t ∈ I,
und daher F ◦ x ≡ c für eine gewisse reelle Konstante c.
Ist D ein offener Quader und sind die f j alle sogar C 1 , so ist gemäß Satz 11.2.24
∂ ∂
fj = fi , i, j ∈ {1, . . . , n},
∂xi ∂x j
eine hinreichende Bedingung dafür, dass (11.24) eine exakte Differentialgleichung ist.
Nun kann es sein, dass zwar (11.24) keine exakte Differentialgleichung ist, aber es
dennoch eine Funktion m : D → R gibt, sodass die aus (11.24) abgeleitete Differenti-
algleichung
X X
n n

m x(t) · f j x(t) · x′j (t) = (m · f j ) x(t) · x′j (t) = 0, t ∈ I,
j=1 j=1
eine solche ist. Dann folgt nämlich auch G ◦ x ≡ c für eine gewisse reelle Konstante c,
wobei G eine Stammfunktion des Gradientenfeldes (m · f1 , . . . , m · fn ) ist. Eine solche
Funktion m nennt man Integrierenden Faktor.
11.2.26 Beispiel. Sei b > 0 und y : (0, b) → R eine C 1 -Funktion, die der Differential-
gleichung
4x + 3y(x)2 + 2xy(x)y′ = 0 (11.25)
genügt. Um diese Gleichung mit der in Beispiel 11.2.25 vorgestellten Methode behan-
deln zu können, betrachten wir ! !
x(t) t
=
y(t) y(t)
11.3. HOMOTOPIE, EINFACHER ZUSAMMENHANG 121
als Abbildung von (0, b) nach (0, b) × R. Dann schreibt sich unsere Gleichung als
! !
x(t) ′ x(t)
f · x (t) + g · y′ (t) = 0, (11.26)
y(t) y(t)

wobei f (x, y)T = 4x + 3y2 und g (x, y)T = 2xy. Wegen
! !
∂ x ∂ x
f = 6y , 2y = g
∂y y ∂x y

ist (11.26) nicht exakt. Durch Multiplizieren mit m (x, y)T = x2 folgt aus (11.26) aber
! ! ! !
x(t) x(t) ′ x(t) x(t)
m ·f · x (t) + m ·g · y′ (t) = 0. (11.27)
y(t) y(t) y(t) y(t)
Wegen ! !
∂ x 2 2 ∂ x
(m · f ) = 6yx = 6x y = (m · g)
∂y y ∂x y
zusammen mit Satz 11.2.24 ist (11.27) exakt.

Man sieht leicht, dass G (x, y)T = x4 +x3 y2 eine Stammfunktion von (m· f, m·g) ist.
T
Also muss G (x(t), y(t)) = c, t ∈ (0, b) für eine Konstante c ∈ R sein. Das bedeutet
t4 + t3 y2 (t) = c bzw.
c
y2 (t) = 3 − t.
t
Da dieser Ausdruck für alle t ∈ (0, b) nichtnegativ ist, muss c ≥ b4 . Also muss
r
c
y(x) = ε · − x, x ∈ (0, b),
x3
für gewisse ε ∈ {+1, −1}, c ∈ [b, +∞). Man überprüft sofort, dass auch jede derartige
Funktion tatsächlich eine Lösung von (11.25) ist.
11.3 Homotopie, einfacher Zusammenhang

11.3.1 Definition. Sei D ⊆ Rn ein Gebiet, und seien γ0 , γ1 : [a, b] → D zwei stetige Wege. Eine Abbildung Γ : [a, b] ×
[c, d] → D (c, d ∈ R, c < d) mit
Γ(t, c) = γ0 (t), Γ(t, d) = γ1 (t), t ∈ [a, b],
heißt Homotopie zwischen γ0 und γ1 .
Haben γ0 und γ1 gleichen Anfangs- und gleichen Endpunkt, dh. γ0 (a) = γ1 (a) und γ0 (b) = γ1 (b), so heißen diese
Wege homotop in D, wenn es eine Homotopie Γ : [a, b] × [c, d] → D zwischen γ0 und γ1 gibt, sodass
Γ|{a}×[c,d] ≡ γ0 (a), Γ|{b}×[c,d] ≡ γ0 (b).
Ein Gebiet D ⊆ Rn heißt einfach zusammenhängend, wenn je zwei stetige Wege mit gleichem Anfangs- und gleichem
Endpunkt homotop sind.
Offensichtlich kann man durch affines Umskalieren immer [c, d] = [0, 1] oder dergleichen annehmen.
11.3.2 Fakta.
1. Betrachtet man statt der Homotopie Γ : [a, b]×[c, d] → D zwischen γ0 und γ1 die Homotopie (s, t) 7→ Γ(s, c+d −t),
so sieht man sofort, dass homotop zu sein eine symmetrische Eigenschaft ist.
2. Seien γ0 , γ1 : [a, b] → D stetig mit jeweils gleichem Anfangs- und gleichem Endpunkt, und sei α : [ã, b̃] → [a, b]
eine streng monoton wachsende Bijektion. Sind γ0 und γ1 homotop über die Homotopie Γ : [a, b] × [0, 1] → D, so
ist Γ̃ : [ã, b̃]×[0, 1] → D definiert durch Γ̃(s, t) = Γ(α(s), t) eine Homotopie. Also sind auch γ0 ◦α, γ1 ◦α : [ã, b̃] → D
homotop.
3. Sind γ0 , γ1 : [a, b] → D stetig und äquivalent, dh. γ1 = γ0 ◦ α für eine streng monoton wachsende Bijektion
α : [a, b] → [a, b], so ist
(t, r) 7→ γ0 ((1 − r)t + r · α(t))
eine Homotopie zwischen γ0 und γ1 . Wegen α(a) = a, α(b) = b sind γ0 und γ1 auch homotop.
4. Sind γ0 , γ1 , γ2 : [a, b] → D stetig mit jeweils gleichem Anfangs- und gleichem Endpunkt und sind γ0 und γ1
sowie γ1 und γ2 homotop über Homotopien Γ01 : [a, b] × [0, 1] → D und Γ12 : [a, b] × [1, 2] → D, so ist
Γ : [a, b] × [0, 2] → D definiert durch Γ(t, r) = Γ01 (t, r) falls r ∈ [0, 1] und Γ(t, r) = Γ12 (t, r) falls r ∈ [1, 2] wegen
Γ01 (t, 1) = γ1 (t) = Γ12 (t, 1) wohldefiniert.
Man zeigt leicht mit Hilfe der Charakterisierung der Stetigkeit durch Folgen, dass Γ stetig ist. Also sind auch γ0
und γ2 homotop.
5. Ist D ⊆ Rn ein Gebiet, und sind γ0 , γ1 : [a, b] → D zwei stetige Wege mit gleichem Anfangs- und gleichem
Endpunkt, sodass die Konvexkombinationen
γα (t) := α · γ1 + (1 − α) · γ0
für alle α ∈ [0, 1] und alle t ∈ [a, b] in D liegen, so ist Γ(t, α) := γα (t) stetig auf [a, b] × [0, 1] (vgl. Korollar 9.1.3).
Also sind γ0 und γ1 homotop.
Insbesondere sind konvexe Gebiete D einfach zusammenhängend.
6. Ist γ : [a, b] → D irgendein stetiger Weg, so folgt aus Lemma 11.2.13, dass für ein gewisses δ > 0 und alle
Riemannzerlegungen R von [a, b] mit |R| ≤ δ alle Konvexkombinationen
α · γR (t) + (1 − α) · γ(t)
für alle α ∈ [0, 1] und alle t ∈ [a, b] in D liegen. Also sind γ und der Polygonzug γR homotop.
7. Sei Γ : [a, b] × [c, d] → D ist stetig, und seien h0 , h1 : [a, b + d − c] → [a, b] × [c, d] definiert durch



 t, c t ∈ [a, b]
h0 (t) := 

 b, c + (t − b) t ∈ [b, b + d − c]
und durch 


 a, c + (t − a) t ∈ [a, a + d − c]
 t − d + c, d
h1 (t) = 
 t ∈ [a + d − c, b + d − c]
.
Man sieht sofort, dass h0 , h1 beide stetig sind und somit auch χ0 , χ1 : [a, b+d −c] → D, wobei χ j = Γ◦h j , j = 0, 1.
Außerdem haben χ0 und χ1 den gleichen Anfangs- und den gleichen Endpunkt. Zudem ist Θ : [a, b+d−c]×[0, 1] →
D wegen der Konvexität von [a, b] × [c, d] wohldefiniert durch
Θ(t, α) = Γ(αh1 (t) + (1 − α)h0 (t)), (t, α) ∈ [a, b + d − c] × [0, 1],
wobei Θ(t, j) = χ j (t) für j = 0, 1 und t ∈ [a, b + d − c], sowie Θ(a, s) = χ0 (a) = χ1 (a) und Θ(b, s) = χ0 (b) = χ1 (b).
Als Zusammensetzung stetiger Funktionen ist Θ auch stetig. Somit sind χ0 und χ1 homotop.
11.3.3 Definition. Sei D ⊆ Rn eine offene Menge und sei φ : D → L(Rn , X) ein stetiges Vektorfeld. Dann heißt φ lokal
wegunabhängig, wenn es zu jedem x ∈ D ein offenes D(x) ⊆ D 7 gibt, sodass φ|D(x) wegunabhängig ist.
11.3.4 Bemerkung. Wegen Bemerkung 11.2.22 ist φ genau dann lokal wegunabhängig, wenn es ein lokales Gradientenfeld
ist, dh. es existiert ein offenes D(x) ⊆ D und eine f ∈ C1 (D(x)), sodass d f (y) = φ(y) für alle y ∈ D(x).
11.3.5 Bemerkung. Da mit x = (ξ j )nj=1 die Kugel Uǫ (x) (bzgl. k.k∞ gebildet) gerade der offene Quader
Q
D = nj=1 (ξ j − ǫ, ξ j + ǫ) ist, folgt aus Satz 11.2.24 und Bemerkung 11.3.4, dass für stetig differenzierbare Vektorfelder,
die Bedingung (11.22) hinreichend und wegen dem Satz von Schwarz, siehe (11.21), auch notwendig dafür ist, dass ein
Vektorfeld lokal wegunabhängig ist.
11.3.6 Satz. Sei D ⊆ Rn ein Gebiet, und sei φ : D → L(Rn , X) ein stetiges lokal wegunabhängiges Vektorfeld. Sind
γ0 , γ1 : [a, b] → D zwei stetige und rektifizierbare Wege mit gleichen Anfangs- und gleichen Endpunkten, die homotop sind,
so gilt Z Z
γ0 γ1
Ist D sogar einfach zusammenhängend, so ist φ sogar wegunabhängig auf ganz D.
7 Klarerweise kann man D(x) kleiner machen und daher immer als ǫ-Kugel vzgl. bezüglich der k.k -Norm
∞
annehmen.
Beweis. Sei ǫ > 0. Nach Lemma 11.2.14 angewandt auf γ0 bzw. γ1 ergibt ein θ > 0, sodass aus |R| ≤ θ für j = 0, 1 folgt,
dass (γ̃ j )R ganz in D verläuft und dass Z
Z
φ(x) dx − φ(x) dx ≤ ǫ. (11.28)
γj (γ̃ j )R
Weiters sei Γ : [a, b] × [0, 1] → D wie in Definition 11.3.1. Voraussetzungsgemäß gibt es zu jedem x ∈ Γ([a, b] × [0, 1])
ein ρ x > 0 mit U2ρ x (x) ⊆ D, sodass φ|U2ρ x (x) wegunabhängig ist. Also ist (Uρ x (x))x∈Γ([a,b]×[0,1]) eine offene Überdeckung
der kompakten Menge Γ([a, b] × [0, 1]). Wir werden im letzten Kapitel sehen, dass dann schon endlich viele dieser offenen
Mengen genügen, um Γ([a, b] × [0, 1]) zu überdecken. Also gibt es x1 , . . . , xm ∈ Γ([a, b] × [0, 1]), sodass
[
m
Uρ x j (x j ) ⊇ Γ([a, b] × [0, 1]). (11.29)
j=1
Wir setzen ρ := min(ρ x1 , . . . , ρ xm ) > 0. Ist x ∈ Γ([a, b] × [0, 1]) und y ∈ Uρ (x), so gilt d∞ (x, x j ) < ρ ≤ ρ x j für ein
j ∈ {1, . . . , m}, und daher d∞ (y, x j ) < 2ρ. Es folgt Uρ (x) ⊆ U2ρ x j (x j ). Somit ist φ|Uρ (x) wegunabhängig.

Gemäß Satz 6.3.3 gibt es ein η ∈ (0, θ], sodass aus max(|s1 − s2 |, |t1 − t2 |) = d∞ (s1 , t1 ), (s2 , t2 ) < η folgt, dass
kΓ(s1 , t1 ) − Γ(s2 , t2 )k∞ < ρ. Seien a = s0 < s1 < · · · < s p = b, 0 = t0 < t1 · · · < t p = 1, sodass |s j − s j−1 |, |tk − tk−1 | < η für
alle j, k = 1, . . . , p. Also verlaufen die Polygonzüge
−−−−−−−−−−−−−−−−−−−−→ −−−−−−−−−−−−−−−−→ −−−−−−−−−−−−−−−−−−−−→ −−−−−−−−−−−−−−−−→
α jk := Γ(s j−1 , tk−1 ) Γ(s j−1 , tk ), Γ(s j−1 , tk ) Γ(s j , tk ) und β jk := Γ(s j−1 , tk−1 ) Γ(s j , tk−1 ), Γ(s j , tk−1 ) Γ(s j , tk )
ganz in Uρ (Γ(s j , tk )) ⊆ D, und somit

Z Z Z
0= φ(x) dx − φ(x) dx = φ(x) dx,
α jk β jk γ jk
−−−−−−−−−−−−−−−−−−−−→ −−−−−−−−−−−−−−−−→ −−−−−−−−−−−−−−−−→ −−−−−−−−−−−−−−−−−−−−→

wobei γ jk : [0, 4] → D den Polygonzug Γ(s j−1 , tk−1 ) Γ(s j−1 , tk ), Γ(s j−1 , tk ) Γ(s j , tk ), Γ(s j , tk ) Γ(s j , tk−1 ), Γ(s j , tk−1 ) Γ(s j−1 , tk−1 )
bezeichnet. Aufsummieren über j und k ergibt
p Z
X p Z
X p Z
X
0= φ(x) dx = −−−−−−−−−−−−−−−−−−−−−−−→
φ(x) dx + −−−−−−−−−−−−−−−−−−→
φ(x) dx
j,k=1 γ jk j,k=1 Γ(s j−1 ,tk−1 ) Γ(s j−1 ,tk ) j,k=1 Γ(s j−1 ,tk ) Γ(s j ,tk )
p Z
X p Z
X
− −−−−−−−−−−−−−−−−−−−−−−−→
φ(x) dx − −−−−−−−−−−−−−−−−−−→
φ(x) dx.
j,k=1 Γ(s j−1 ,tk−1 ) Γ(s j ,tk−1 ) j,k=1 Γ(s j ,tk−1 ) Γ(s j ,tk )
Nach Indexverschiebungen (k k + 1 bzw. j j − 1) in den letzten beiden Summen kürzen sich die meisten Summanden
der ersten (zweiten) Summe mit welchen aus der vierten (dritten) Summe. Übrig bleibt
p Z
X p Z
X
0= −−−−−−−−−−−−−−−−−−→
φ(x) dx + −−−−−−−−−−−−−−−−−−→
φ(x) dx
k=1 Γ(s0 ,tk−1 ) Γ(s0 ,tk ) j=1 Γ(s j−1 ,t p ) Γ(s j ,t p )
p Z
X p Z
X
− −−−−−−−−−−−−−−−−−−−→
φ(x) dx − −−−−−−−−−−−−−−−−−−→
φ(x) dx. (11.30)
k=1 Γ(s p ,tk−1 ) Γ(s p ,tk ) j=1 Γ(s j−1 ,t0 ) Γ(s j ,t0 )
Man beachte, dass Γ(s0 , t) = Γ(a, t) = γ0 (a) und Γ(s p , t) = Γ(b, t) = γ0 (b) für alle t ∈ [0, 1]. Also sind die gerade Strecken
−−−−−−−−−−−−−−−−→ −−−−−−−−−−−−−−−−−→
Γ(s0 , tk−1 ) Γ(s0 , tk ) und Γ(s p , tk−1 ) Γ(s p , tk ) konstant, und somit verschwinden alle Wegintegrale in der ersten und in der
dritten Summe in (11.30). Setzen wir
−−−−−−−−−−−−−−→ −−−−−−−−−−−−−−−−→ −−−−−−−−−−−→ −−−−−−−−−−−−−→
γ̃0 := Γ(s0 , 0) Γ(s1 , 0), . . . , Γ(s p−1 , 0) Γ(s p , 0) = γ0 (s0 ) γ0 (s1 ), . . . , γ0 (s p−1 ) γ0 (s p ),
−−−−−−−−−−−−−−→ −−−−−−−−−−−−−−−−→ −−−−−−−−−−−→ −−−−−−−−−−−−−→

γ̃1 := Γ(s0 , 1) Γ(s1 , 1), . . . , Γ(s p−1 , 1) Γ(s p , 1) = γ1 (s0 ) γ1 (s1 ), . . . , γ1 (s p−1 ) γ1 (s p ),
R R
so gilt γ̃ φ(x) dx = γ̃ φ(x) dx. Außerdem gilt (γ̃ j )R = γ̃ j für j = 0, 1, wenn R eine Riemannzerlegung von [a, b] derart ist,
0 1
dass s0 , . . . , s p genau die Stützstellen von R sind. Wegen |R| < η ≤ θ folgt aus (11.28) und der Dreiecksungleichung, dass
Z Z

φ(x) dx − φ(x) dx < 2ǫ.
γ γ
0 1
Da ǫ > 0 beliebig war, folgt die erste Behauptung. Wenn D einfach zusammenhängend ist, dann sind zwei Wegen mit
gleichen Anfangs- und Endpunkt immer homotop.
❑
11.3.7 Definition. Ein stetiger Weg γ : [a, b] → D heißt geschlossen, wenn γ(a) = γ(b).
Seien γ0 , γ1 : [a, b] → D zwei geschlossene und stetige Wege. Wir sagen, dass diese beiden radial homotop in D sind,
falls für eine gewisse Homotopie Γ : [a, b] × [c, d] → D zwischen γ0 und γ1 gilt Γ(a, s) = Γ(b, s), s ∈ [c, d].
Ein geschlossener Weg γ : [a, b] → D heißt nullhomotop, wenn er zu irgendeinem konstanten Weg β : [a, b] → D, dh.
β ≡ c ∈ D, radial homotop ist.
Auch hier kann [c, d] durch eine affine Transformation immer durch andere kompakte Intervalle, etwa [0, 1], ersetzt
werden.
11.3.8 Fakta.
1. Ganz ähnlich wie in Fakta 11.3.2 sieht man, dass auch radial homotop zu sein symmetrische Eigenschaft ist.
2. Seien γ0 , γ1 : [a, b] → D stetig geschlosen, und sei α : [ã, b̃] → [a, b] eine streng monoton wachsende Bijektion.
Sind γ0 und γ1 radial homotop, so sieht man wie in Fakta 11.3.2, dass auch γ0 ◦ α, γ1 ◦ α : [ã, b̃] → D radial
homotop sind.
3. Ähnlich wie in Fakta 11.3.2 sieht man auch, dass zwei stetige, geschlossene und äquivalente Wege γ0 , γ1 : [a, b] →
D radial homotop im Sinne von Definition 11.3.7 sind.
4. Wie in Fakta 11.3.2 zeigt man auch für drei stetige, geschlossene Wege γ0 , γ1 , γ2 : [a, b] → D, sodass γ0 und γ1
sowie γ1 und γ2 radial homotop sind, dass dann auch γ0 und γ2 radial homotop sind.
5. Seien γ0 , γ1 : [a, b] → D zwei stetige Wege mit gleichen Anfangs- und gleichen Endpunkt, und sei γ : [a, 2b−a] →
D definiert duch
γ|[a,b] = γ0 und γ(b + t − a) = γ1 (a + b − t), t ∈ (a, b]. (11.31)
Dann ist γ offensichtlich stetig und geschlossen. Ist umgekehrt γ : [a, 2b − a] → D stetig und geschlossen, und
definiert man γ0 , γ1 : [a, b] → D durch (11.31), so sind das zwei stetige Wege mit gleichen Anfangs- und gleichen
Endpunkt.
6. Gilt für zwei geschlossene und stetige Wege γ0 , γ1 : [a, b] → D
Γ(t, α) := αγ0 (t) + (1 − α)γ1 (t) ∈ D,
für alle t ∈ [a, b], α ∈ [0, 1], so sind γ0 und γ1 radial homotop.
11.3.9 Bemerkung. Sei D ⊆ Rn offen und φ : D → L(Rn , X) ein stetiges Vektorfeld. Sind γ0 , γ1 , γ stetige Wege wie in Fakta
11.3.8, 5, sodass sie obendrein rektifizierbar sind, so folgt aus Fakta 11.2.3, 4 und 1, dass
Z Z Z Z Z
φ(x) dx = φ(x) dx + φ(x) dx = φ(x) dx − φ(x) dx.
γ γ|[a,b] γ|[b,2b−a] γ0 γ1
Daraus erkennt man, dass φ genau denn wegunabhängig ist (vgl. Definition 11.2.9), wenn Wegintegrale über stetige, rekti-
fizierbare und geschlossene Wege verschwinden.
Da oben γ genau dann ein Polygonzug ist, wenn γ0 und γ1 beide Polygonzüge sind, reicht gemäß Bemerkung 11.2.15
für die Wegunabhängigkeit schon, dass Wegintegrale über geschlossene Polygonzüge verschwinden.
Gemäß Bemerkung 11.2.22 ist das notwendig und hinreichend dafür, dass φ ein Gradientenfeld ist.
11.3.10 Lemma. Sei D ⊆ Rn ein Gebiet.
Ein stetiger, geschlossener Wege γ : [0, 2π] → D ist genau dann nullhomotop, wenn es eine stetige Abbildung
Λ : D → D8 gibt, sodass γ(t) = Λ(exp(it)).
Seien γ0 , γ1 : [a, b] → D und zwei stetige Wege mit gleichen Anfangs- und gleichen Endpunkt, und sei γ : [a, 2b −
a] → D stetig und geschlossen, sodass (11.31) gilt. γ0 und γ1 sind genau dann homotop, wenn γ nullhomotop ist.
D ist einfach zusammenhängend genau dann, wenn alle stetigen geschlossenen Wege nullhomotop sind.
Beweis.
Sei γ nullhomotop, und Γ : [0, 2π] × [0, 1] → D, sodass γ(t) = Γ(t, 1), t ∈ [0, 2π], Γ(t, 0) ≡ c ∈ D, und Γ(0, s) =
Γ(2π, s).
Wir definieren Λ : D → D durch Λ(r exp(it)) := Γ(t, r). Λ ist bei 0 wohldefiniert, da Γ(t, 0) = c für alle t ∈ [0, 2π],
und Λ ist bei allen Punkten der Form r exp(i0) = r exp(i2π) wohldefiniert, da Γ(0, s) = Γ(2π, s).
Nun gilt Γ = Λ ◦ ((t, r) 7→ r exp(it)). Um einzusehen, dass Λ stetig ist, zeigen wir, dass das Urbild jeder abgeschlos-
senen Menge wieder abgeschlossen in D. Ist A ⊆ Rn abgeschlossen, so auch Γ−1 (A) ⊆ [0, 2π] × [0, 1]. Da letztere
Menge kompakt ist, ist auch Γ−1 (A) kompakt und daher auch ihr Bild unter der stetigen Abbildung (t, r) 7→ r exp(it),
welches aber genau Λ−1 (A) ⊆ D ist. Insbesondere ist Λ−1 (A) abgeschlossen.
Die Umkehrung ist einfacher, da bei gegebenen Λ die Funktion Γ(t, r) := Λ(r exp(it)) zeigt, dass γ und der konstante
Weg t 7→ Λ(0) radial homotop sind.
8D ist der abgeschlossene Einheitskreis K1 (0) im R2 C.

Durch affine Variablentransformation können wir [a, b] = [−1, 1] annehmen.

Sind γ0 und γ1 homotop, so gibt es eine Homotopie Γ : [−1, 1] × [−1, 1] → D zwischen γ0 und γ1 mit γ j (t) =
Γ(t, 2 j − 1), j = 0, 1, t ∈ [−1, 1].
Wir definieren Λ : D → D durch Λ(x + iy) := Γ(−x, − √ y ) für |x + iy| ≤ 1, |x| < 1 und durch Λ( j) = γ0 (− j) für
1−x2
j = −1, 1. Wege Wegen Γ(−1, s) = γ0 (−1) = γ1 (−1) und Γ(1, s) = γ0 (1) = γ1 (1) gilt
p
Γ = Λ ◦ (s, t) 7→ (−s − it · 1 − s2 ) .
Um einzusehen, dass Λ stetig ist, sei A ⊆ Rn abgeschlossen. Nun ist Γ−1 (A) ⊆ [−1, 1] × [−1, 1]. Da letztere Menge
kompakt
√ ist, ist auch Γ−1 (A) kompakt und daher auch ihr Bild unter der stetigen Abbildung (s, t) 7→ (−s − it ·
1 − s2 ), welches aber genau Λ−1 (A) ⊆ D ist. Insbesondere ist Λ−1 (A) abgeschlossen.
Nach dem letzten Punkt ist t 7→ Λ(exp(it)), t ∈ [0, 2π] ein ein nullhomotoper Weg. Nun gilt



γ0 (− cos t) = γ(− cos t) t ∈ [0, π]
Λ(exp(it)) = Γ(− cos t, − sgn(sin t)) = 
γ (− cos t) = γ(2 + cos t) t ∈ [π, 2π]
 1
Also Λ(exp(it)) = γ(φ(t)), wobei φ(t) = − cos t, t ∈ [0, π] und φ(t) = 2+cos t, t ∈ [π, 2π]. Wir definieren schließlich
Θ : [−1, 3] × [0, 2] → D durch


Λ(α exp(i(s + 1) π2 ))
 α ∈ [0, 1]
Θ(s, α) = 
γ((2 − α)φ((s + 1) π ) + (α − 1)s) α ∈ [1, 2]
 2
Dann gilt Θ(s, 0) = Λ(0), Θ(s, 2) = γ(s) und Θ(−1, α) = Θ(3, α) = Λ(α), α ∈ [0, 1], Θ(−1, α) = Θ(3, α) = γ(−1) =
γ(3), α ∈ [1, 2]. Also ist γ nullhomotop.
Ist umgekehrt γ nullhomotop, so offensichtlich auch t 7→ γ( 2tπ − 1), t ∈ [0, 2π]. Also gibt es nach dem ersten Punkt
eine Abbildung Λ : D → D mit Λ(exp(it)) = γ( 2tπ − 1).
√
Wir definieren Γ : [−1, 1] × [−1, 1] → D stetig durch Γ(s, t) = Λ(−s − it · 1 − s2 ), und sehen Γ(−1, t) = Λ(1) =
γ(−1) = γ(3) = γ0 (−1) = γ1 (−1), Γ(1, t) = Λ(−1) = γ(1) = γ0 (1) = γ1 (1).
Außerdem gilt für s ∈ [−1, 1] mit cos t = −s, t ∈ [0, π]
p 2t 2t
Γ(s, −1) = Λ(−s + i 1 − s2 ) = γ( − 1) = γ0 ( − 1)
π π
und für s ∈ [−1, 1] mit cos t = cos(2π − t) = −s, t ∈ [0, π]
p 2(2π − t) 2(2π − t) 2t
Γ(s, 1) = Λ(−s − i 1 − s2 ) = γ( − 1) = γ1 (3 − ) = γ1 ( − 1).
π π π
π(δ+1)
Also ist (δ, η) 7→ Γ(− cos 2 , η), (δ, η) ∈ [−1, 1] eine Homotopie zwischen γ0 und γ1 .
Die letzte Aussage folgt sofort aus Fakta 11.3.8.
❑
11.3.11 Korollar. Sei D ⊆ Rn ein Gebiet, und sei φ : D → L(Rn , X) ein stetiges lokal wegunabhängiges Vektorfeld. Sind
γ0 , γ1 : [a, b] → D zwei stetige, geschlossene und rektifizierbare Wege, die radial homotop sind, so gilt
Z Z
φ(x) dx = φ(x) dx. (11.32)
γ0 γ1
Ist γ ein geschlossener, rektifizierbarer und nullhomotoper Weg, so gilt

Z
φ(x) dx = 0. (11.33)
γ
Ist D sogar einfach zusammenhängend, so verschwindet dieses Integral immer.
Beweis. Sei Γ : [a, b] × [c, d] → D eine Homotopie zwischen γ0 und γ1 , sodass β(s) := Γ(a, s) = Γ(b, s), s ∈ [c, d]. Wegen
Fakta 11.3.2, 6, gibt einen zu β homotopen Polygonzug β̃ : [c, d] → D. Insbesondere ist β̃ rektifizierbar und stetig.
Wir setzen nun die Wegen γ j , j = 0, 1, fort zu Abbildungen γ̃ j : [a − 1, b + 1] → D, indem wir γ̃ j (s) = γ j (a) (= γ j (b))
für s ∈ [a − 1, a) ∪ (b, b + 1] setzen. Dadurch erhalten wir zwei offensichtlich stetige, geschlossene und vermöge der
Homotopie Γ̃ : [a − 1, b + 1] × [c, d] → D
Γ̃|[a,b]×[c,d] ≡ Γ, Γ̃(a − 1 + λ, s) = (1 − λ)β̃(s) + λβ(s), Γ̃(b + 1 − λ, s) = (1 − λ)β̃(s) + λβ(s), λ ∈ [0, 1), s ∈ [c, d],
homotope Wege. Die Stetigkeit von Γ̃ folgt leicht mit Hilfe der Charakterisierung der Stetigkeit durch Folgen. Man beachte,
dass Γ̃(a − 1, s) = β̃(s) = Γ(b + 1, s), s ∈ [c, d].
Da γ j |[a−1,a]∪[b,b+1] konstant ist, folgt aus (11.6), dass ( j = 0, 1)
Z Z Z Z Z
φ(x) dx = φ(x) dx + φ(x) dx + φ(x) dx = φ(x) dx.
γ̃ j γ̃ j |[a−1,a] γj γ̃ j |[b,b+1] γj
Um (11.32) zu zeigen, können wir daher zusätzlich annehmen, dass für die Homotopie Γ : [a, b] × [c, d] → D zwischen γ0
und γ1 der stetige Weg β(s) := Γ(a, s) = Γ(b, s), s ∈ [c, d] auch rektifizierbar ist.
Wegen Fakta 11.3.2, 7, haben die Wege χ0 , χ1 : [a, b + d − c] → D definiert duch
χ0 (t) = Γ(t, c) = γ0 (t), t ∈ [a, b], χ0 (t) = Γ(b, c + (t − b)) = β(c + (t − b)), t ∈ [b, b + d − c],
χ1 (t) = Γ(a, c + (t − a)) = β(c + (t − a)), t ∈ [a, a + d − c], χ1 (t) = Γ(t − d + c, d) = γ1 (t − d + c), t ∈ [a + d − c, b + d − c],
gleichen Anfangs- und den gleichen Endpunkt, und sind als solche homotop. Also folgt aus Satz 11.3.6
Z Z
χ0 χ1
Nun gilt aber (siehe Fakta 11.2.3, 1, und (11.6))

Z Z Z Z Z Z
φ(x) dx = φ(x) dx + φ(x) dx, φ(x) dx = φ(x) dx + φ(x) dx,
χ0 γ0 β χ1 γ1 β
und somit folgt (11.32).

Ist γ nullhomotop, so ist er per definitionem radial homotop zu einem konstanten Weg. Da Wegintegrale über konstante
Wege verschwinden, folgt aus (11.32), dass das Wegintegral über γ verschwinden.
Ist D einfach zusammenhängend, so folgt aus Lemma 11.3.10, dass jeder stetige und geschlossene Weg nullhomotop
ist.
❑
11.4 Holomorphe Funktionen

Sei X ein Banachraum über dem Skalarkörper C. Wir wollen zunächst Funktionen f : D → X betrachten, wobei D ⊆ C offen
ist. Ist f in einem Punkt z ∈ D differenzierbar (siehe Definition 10.1.14), so existieren in z auch alle Richtungsableitungen.
Folgende Bedingung wird von zentraler Bedeutung sein:
∂f ∂f
(z) = −i · (z), (11.34)
∂x ∂y
wobei x die erste Koordinate, also den Realteil und y die zweite Koordinate, also den Imaginärteil von z ∈ D ⊆ C R2
bezeichnet.
11.4.1 Bemerkung. Sei X ein Vektorraum über C, wobei auch X = C nicht ausgeschlossen ist. Betrchtet man dann X als
Vektorraum über R, so ist die (R-lineare) Abbildung
JX : X → X, u 7→ i · u,
offensichtlich linear. Ist X sogar ein Banachraum über C, so ist JX : X → X auch beschränkt mit Abbildungsnorm 1.
Im Fall X = C R2 hat J := JC ∈ L(R2 , R2 ) als Matrix die Gestalt,
!
0 −1
J= .
1 0
Sind X und Y zwei Vektorräume über C, so folgt leicht, dass eine R-lineare Abbildung A : Y → X genau dann C-linear ist,
wenn
JX A = AJY .
Insbesondere kann eine R-lineare Abbildung A : R2 → X genau dann als C-lineare Abbildung A : C → X gedeutet werden
- ist also von der Form
Aζ = ζ · v, ζ ∈ C, (11.35)

mit einem festen v ∈ X, wenn AJ = JX A, bzw. weil 10 , 01 eine Basis von R2 ist, wenn (Je1 = e2 , Je2 = −e1 , )
Ae2 = i · Ae1 , − Ae1 = i · Ae2
als Elemente von X. Nun ist aber die zweite Bedingung offensichtlich zur ersten äquivalent. Also ist A : R2 C → X genau
dann C-lineare, wenn Ae1 = −i · Ae2 . Der Vektor v in (11.35) ist offensichtlich Ae1 = −i · Ae2 .
Im Spezialfall X = C, dh. A : R2 → R2 C, ist bedeutet AJ = JA gerade, dass A von der Form
!
a −b
A= (11.36)
b a
mit a, b ∈ R ist.
11.4. HOLOMORPHE FUNKTIONEN 127
Ist f : D → X in einem Punkt z ∈ D differenzierbar und ist d f (z) ∈ L(R2 , X) die Ableitung wie in Definition 10.1.14
und damit d f (z)e1 = ∂∂xf (z) und d f (z)e2 = ∂∂yf (z), so so ist wegen Bemerkung 11.4.1 Bedingung (11.34) dazu äquivalent,
dass d f (z) : C → X sogar C-linear ist, dh. als
d f (z)ζ = ζ · g(z), ζ ∈ C, (11.37)
für ein g(z) ∈ X geschrieben werden kann, wobei
∂f ∂f
g(w) = d f (z)e1 = (z) = −i (z).
∂x ∂y
Definieren wir schließlich für eine gegebene Funktion f : D → X das Vektorfeld φ f : D → L(R2 , X) durch
φ f (.)e1 = f (.), φ f (.)e2 = i f (.), (11.38)
∂ ∂
so ist im Falle der Differenzierbarkeit von f bei z Bedingung (11.34) äquivalent dazu, dass ∂y φ f (z)e1 = ∂x φ f (z)e2 .
11.4.2 Bemerkung. Im Fall X = C ist Bedingung (11.34) offensichtlich nichts anderes, als (Cauchy-Riemannschen Diffe-
rentielgleichungen)
∂u ∂v ∂v ∂u
(z) = (z), (z) = − (z), (11.39)
∂x ∂y ∂x ∂y
wobei u(z) := Re f (z) und v(z) := Im f (z), oder wegen (11.36) nichts anderes, als dass d f (z) von der Form
!
a(z) −b(z)
d f (z) = , (11.40)
b(z) a(z)
∂u ∂v ∂v
ist, wobei a(z) = ∂x
(z) = ∂y
(z) und b(z) = ∂x
(z) = − ∂u
∂y
(z).
11.4.3 Lemma. Sei D ⊆ C offen, X ein komplexer Banachraum, f : D → X eine Funktion und z ∈ D. Die Tatsache, dass
f in z differenzierbar ist zusammen mit der Bedingung (11.34) ist äquivalent zu der Tatsache, dass der Grenzwert - man
spricht von der komlpexen Ableitung -
df f (z + h) − f (z)
(z) := lim
dz h→0 h
in X existiert. In dem Fall gilt
df ∂f ∂f
(z) = (z) = −i · (z). (11.41)
dz ∂x ∂y
Beweis. Gemäß Definition 10.1.14 und wegen der Äquivalenz der Normen k.k2 = |.| und k.k∞ auf C ist f bei z genau dann
differenzierbar, wenn
f (z + h) = f (z) + d f (z)h + |h|ε(h), h , 0, (11.42)
für irgendeine Funktion ε : (D − z) \ {0} → X mit limh→0 ε(h) = 0. Der Ausdruck d f (z)h ist dabei die Anwendung von
h = h1 + ih2 , interpretiert als Element hh1 von R2 , auf lineare Abbildung d f (z) ∈ L(R2 , X)
2
∂f ∂f
Ist dabei (11.34) erfüllt, so wissen wir wegen (11.37), dass d f (z)h = h · g(z) für ein g(z) = ∂x (z) = −i · ∂y (z) ∈ X und
daher
f (z + h) − f (z) |h|
lim = g(z) + lim · ε(h) = 0,
h→0 h h→0 h
da k |h|
h · ε(h)k = kε(h)k → 0, h → 0.
f (z+h)− f (z)
Angenommen es existiert umgekehrt der komplexe Grenzwert g(z) := limh→0 , so folgt mit ε(h) :=
f (z+h)− f (z) h
h
|h| h − g(z) für h , 0 unmittelbar
f (z + h) = f (z) + h · g(z) + |h| ε(h), h , 0,
mit ε(h) → 0 für h → 0. Da die Ableitung d f (z) eindeutig ist, folgt hier d f (z)h = h · g(z) und wegen der Ausführung nach
Bemerkung 11.4.1, dass (11.34) gilt.
❑
11.4.4 Bemerkung. Gilt die Aussage von Lemma 11.4.3 im Fall X = C, so folgt unmittelbar aus (11.40)

∂u 2 ∂v 2 d f 2
det d f (z) = (z) + (z) = (z) . (11.43)
∂x ∂x dz
Wie für komplexwertige Funktionen in Definition 11.2.6 wollen wir komplexen Wegintegrale für Banachraum-wertige
Funktionen definieren.
11.4.5 Definition. Ist D ⊆ C, X ein komplexer Banchraum, h : D → X und γ : [a, b] → D ein Weg, so ist das komplexe
Wegintegral definiert durch
Z X
n(R)

h(z) dz := lim γ(ξ j ) − γ(ξ j−1 ) · h γ(α j ) , (11.44)
γ |R|→0
j=1
falls dieser Limes in X existiert.
11.4.6 Bemerkung. Ist für h : D → X die Abbildung φh : D → L(R2 , X) definiert durch (vgl. (11.38))
φh (.)e1 = h(.), φh (.)e2 = ih(.),
so nimmt (11.44) wegen der Überlegungen für (11.35) die Form
Z X
n(R) Z

h(z) dz = lim φh γ(α j ) γ(ξ j ) − γ(ξ j−1 ) = φh (x) dx (11.45)
γ |R|→0 γ
j=1

an, wenn wir γ(ξ j ) − γ(ξ j−1 ) als Zweivektor betrachten.
Insbesondere existiert dieses Wegintegral für stetiges h sowie stetiges und rektifizierbares γ. Ist γ sogar C1 , so folgt
aus Satz 11.2.4 Z Z b
φh (x) dx = φh (γ(t)) γ′ (t) dt.
γ a
Da φh (γ(t)) γ′ (t) (∈ X) mit den Überlegungen für (11.35) nichts anderes als γ′ (t) · h(γ(t)) ist, lässt sich das komplexe
Wegintegral in diesem Fall durch
Z Z b
h(z) dz = γ′ (t) · h(γ(t)) dt (11.46)
γ a
berechnen. Schließlich folgt aus Fakta 11.2.3, 5, dass

Z

h(z) dz ≤ max kh ◦ γ(t)k · ℓ(γ). (11.47)
γ t∈[a,b]
11.4.7 Definition. Sei D ⊆ C offen. Eine Funktion f : D → X heißt holomorph auf D, falls sie einmal stetig differenzierbar
ist, und falls (11.34) für alle z ∈ D gilt.
Ist f : C → X auf ganz C holomorph, so nennt man f ganz.
Als Folgerung aus Lemma 11.4.3 erhalten wir
11.4.8 Korollar. Sei f : D → X eine Funktion mit offenen D ⊆ C. Folgende Aussagen sind äquiavlent.
(i) f ist holomorph.
(ii) Für alle z ∈ D existiert der Grenzwert

df f (z + h) − f (z)
(z) = lim ,
dz h→0 h
df
in X und die Funktion f ′ : D → X, f ′ (z) := dz
(z) ist stetig.
1 2
(iii) f ∈ C (D) und das Vektorfeld φ f : D → L(R , X) definiert in (11.38) ist lokal wegunabhängig bzw. ein ein lokales
Gradientenfeld.
(iv) f ∈ C1 (D) und zu jedem w ∈ D existiert eine offenes D(w) ⊆ D, und eine holomorphe Funktion F : D(w) → X mit
F ∈ C2 (D(w)), sodass F ′ (z) = f (z) für alle z ∈ D(w).
Ist schließlich f : D → C holomorph, D ⊆ C ein Gebiet, und φ f : D → L(R2 , X) sogar auf ganz D wegunabhängig
- das ist insbesondere der Fall, wenn D einfach zusammenhängend ist, so gilt F ′ = f auf D für eine bis auf eine komplexe
Konstante eindeutige holomorphe Funktion F ∈ C1 (D), wobei
Z
F(z) − F(w) = f (ζ) dζ,
γ
für alle z, w ∈ D. Es gilt sogar F ∈ C2 (D). Dabei ist die rechte Seite ein komplexes Wegintegral und γ ist irgend ein stetiger,
rektifizierbarer und in D verlaufender Weg mit Anfangspunkt w und Endpunkt z.
df
Beweis. Aus Lemma 11.4.3 folgt, dass die Existenz von dz (z) für alle z ∈ D äquivalent zur Differenzierbarkeit von f für
alle z ∈ D zusammen mit (11.34) ist. Dabei gilt ddzf (z) = ∂∂xf (z) = −i · ∂∂yf (z), siehe (11.41). Somit ist zusätzlich f noch stetig
differenzierbar genau dann, wenn f ′ stetig ist.
Es bleiben die letzten beiden Punkte zu betrachten. Aus der Überlegung rund um (11.38) folgt sofort, dass die Holo-
∂ ∂
morphie von f äquvalent zu der Tatsache ist, dass φ f : D → L(R2 , X) stetig differenzierbar ist und ∂y φ f (z)e1 = ∂x φ f (z)e2
für alle z ∈ D erfüllt. In Bemerkung 11.3.5 haben wir gesehen, dass das äquivalent zur lokalen Wegunabhängigkeit ist.
Aus Bemerkung 11.3.4 wiederum wissen wir, dass die lokale Wegunabhängigkeit nichts anderes besagt als, dass auf
einer hinreichend kleinen offenen Menge D(w) ⊆ D gilt, dass dF(z) = φ f (z) für ein F ∈ C1 (D(w)). Offensichtlich gilt dabei
F ∈ C2 (D(w)) geanu dann, wenn φ f stetig differenzierbar ist.
Schließlich bedeutet dF(z) = φ f (z) wegen (11.34) gerade, dass F holomorph auf D(w) ist, wobei
∂F
F ′ (z) = (z) = φ f (z)e1 = f (z),
∂x
siehe (11.41).
Ist schließlich D ein Gebiet, φ f wegunabhängig - wegen Satz 11.3.6 gilt das sicher für einfach zusammenhängende D,
so folgt aus Satz 11.2.16 bzw. Bemerkung 11.2.15, dass für z, w ∈ D
Z
φ f (x) dx = F(z) − F(w),
γ
für alle in D verlaufenden, stetigen und rektifizierbaren Wege γ : [a, b] → D mit γ(a) = w und γ(b) = z. Zudem besagt Satz
11.2.16, dass F mit dF = φ f , bzw. äquivalent dazu F ′ = f , bis auf eine Konstante in XReindeutig ist. Schließlich genügt ein
Verweis auf Bemerkung 11.4.6, um obiges Wegintegral als das komplexe Wegintegral γ f (ζ) dζ zu identifizieren.
❑
Ist X = C, so ist wegen Bemerkung 11.4.2 die Abbildung f : D → C genau dann holomorph ist, wenn f ∈ C1 (D) und
(11.39) für alle z ∈ D gilt, bzw. wenn f ∈ C1 (D) und (11.40) für alle z ∈ D gilt.
11.4.9 Bemerkung. In der Tat gilt sogar, dass f genau dann holomorph ist, wenn f auf ganz D nur differenzierbar ist und
dort (11.34) gilt, bzw. wenn der komplexe Limes limh→0 f (z+h)− h
f (z)
für alle z ∈ D existiert. Die Forderung, dass die Ableitung
stetig ist, ist also unnötig. Dieser Sachverhalt ist zwar interessant, aber für den weiteren Aufbau der Theorie holomorpher
Funktionen nicht von nöten.
11.4.10 Proposition. Sei X ein komplexer Banachraum, D, G ⊆ C offen, α, β ∈ C und f, g : D → X, φ : D → C sowie

h : G → X holomorphe Funktionen, so
ist α f + βg : D → X holomorph mit (α f + βg)′ (z) = α f ′ (z) + βg′ (z) für z ∈ C,
ist φ · f : D → X holomorph mit (φ · f )′ (z) = φ′ (x) f (z) + φ(z) f ′ (z) (Produktregel),
f
f ′ f ′ (z)φ(z)− f (z)φ′ (z)
ist im Fall, dass nicht g ≡ 0, : {z ∈ D : φ(z) , 0} → X 9 holomorph mit (z) =
φ φ φ(z)2
(Quotientenregel).
ist im Fall, dass10 φ−1 (G) = {z ∈ D : φ(z) ∈ G} , ∅, h ◦ φ : φ−1 (G) → X holomorph mit (h ◦ φ)′ (z) = h′ (φ(z)) · φ′ (z)
(Kettenregel),
ist im Fall, dass φ injektiv ist und dass φ′ (z) , 0 für alle z ∈ D, das Bild φ(D) offen in C und ist die Umkehrfunktion
φ−1 : φ(D) → D ⊆ C holomorph mit (φ−1 )′ (φ(z)) = φ′1(z) .
Beweis. Mit Hilfe von Korollar 11.4.8 zusammen mit Korollar 6.1.8 zeigt man ganz ähnlich wie in Satz 7.1.7 bzw. Satz
7.1.9 alle bis auf die letzte Ableitungsregeln. Wir ersparen uns die Details dazu.
Zur letzten Regel sei bemerkt, dass zunächst wegen (11.43) die Matrix dφ(z) für alle z ∈ D invertierbar ist. Aus Korollar
10.3.3 folgt somit, dass φ(D) offen ist. Die Verifikation von (φ−1 )′ (φ(z)) = φ′1(z) geschieht wie im Beweis von Satz 7.1.12.
❑
11.4.11 Beispiel.
(i) Für jedes λ ∈ C ist die konstante Funktion f (z) = λ, z ∈ C, an jeder Stelle z ∈ C stetig differenzierbar, und ihre
Ableitung d f (z) ist immer die Nullmatrix, erfüllt somit (11.34) und ist daher holomorph.
(ii) Für die Funktion idC : z 7→ z gilt an jedem Punkt z ∈ C
(z + h) − z
lim = 1.
h→0 h
Da die konstante 1-Funktion stetig ist, folgt aus Korollar 11.4.8 die Holomorphie von idC .
(iii) Durch wiederholte Anwendung von Proposition 11.4.10 folgt, dass alle Polynome f (z) = a0 + a1 z + · · · + an zn mit
festen a0 , . . . , an ∈ C auf C holomorph sind. Dabei gilt f ′ (z) = a1 + a2 2z + · · · + an nzn−1
9 {z ∈ D : φ(z) , 0} ist als Urbild der offenen Menge C \ {0} unter der stetigen Funktion φ selber offen,
vgl. Proposition 6.1.10.

10 Man beachte, dass φ−1 (G) als Urbild einer offenen Menge unter der stetigen Funktion φ selber offen ist,
vgl. Proposition 6.1.10.

(iv) Aus Proposition 11.4.10 folgt auch, dass sogar alle Funktionen der Form
1 1
f (z) = a−m + · · · + a−1 + a0 + · · · + an zn
zm z
mit festen a−m , . . . , a−1 , a0 , . . . , an ∈ C holomorph und zwar nur auf C \ {0} sind.
(v) Mit der Kettenregel oder auch direkt folgt, dass für festes w ∈ C auch alle Funktionen der Form
1 1
f (z) = a−m + · · · + a−1 + a0 + · · · + an (z − w)n
(z − w)m z−w
mit festen a−m , . . . , a−1 , a0 , . . . , an ∈ C holomorph und zwar auf C \ {w} sind. Dabei gilt
1 1
f (z) = a−m (−m) + · · · + a−1 (−1) + a1 + a2 2(z − w) + · · · + an n(z − w)n−1 .
(z − w)m+1 (z − w)2
Weitere holomorphe Funktionen liefert das nächste Lemma.
11.4.12 Lemma. Sei D ⊆ C offen und [a, b] ein kompaktes reelles Intervall. Weiters sei f : D × [a, b] (⊆ R3 ) → X stetig als
Funktion auf einer Teilmenge des R3 . Zudem sei für jedes feste t ∈ [a, b] die Funktion z 7→ f (z, t) auf D holomorph. Ist dann
d
Rb
auch die Funktion (z, t) 7→ dz f (z, t) auf D×[a, b] stetig als Funktion auf einer Teilmenge des R3 , so ist z 7→ a f (z, t) dt (∈ X)
holomorph auf D und es gilt
Z b Z b
d d
f (z, t) dt = f (z, t) dt. (11.48)
dz a a dz
Beweis. Aus (11.41) folgt wegen der Holomorphie-Voraussetzung (z = x + iy ∈ D, t ∈ [a, b])
∂ d ∂ d
f (z, t) = f (z, t), f (z, t) = i f (z, t). (11.49)
∂x dz ∂y dz
Sei nun w ∈ D fest. Da D offen ist, gibt es zu jedem w ∈ D eine abgeschlossene Kugel Kρ (w) ⊆ D, wobei wir praktischer-
weise die Kugel bzgl. der k.k∞ -Norm betrachten wollen, da dann Kρ (w) = w + [−ρ, ρ] × [−ρ, ρ].
d ∂
Für festes µ ∈ [Im w − ρ, Im w + ρ] sind die Funktionen (s, t) 7→ f (s + iµ, t) und (s, t) 7→ ds f (s + iµ, t) = ∂x f (s + iµ, t)
wegen (11.49) und gemäß Voraussetzung als Funktionen von [Re w − ρ, Re w + ρ] × [a, b] nach X stetig. Gemäß (9.15) - siehe
Rb
auch Korollar 8.7.11 - ist s 7→ a f (s + iµ, t) dt auf [Re w − ρ, Re w + ρ] stetig differenzierbar, wobei für z = s + iµ ∈ Uρ (w)
Z b Z b Z b Z b
∂ d d ∂
f (z, t) dt = f (s + iµ, t) dt = f (s + iµ, t) dt = f (z, t) dt.
∂x a ds a a ds a ∂x
Rb
Da µ ∈ [Im w − ρ, Im w + ρ] beliebig war, ist insbesondere z 7→ a f (z, t) dt auf Uρ (w) stetig nach x = Re z differenzierbar.
Genauso sieht man, dass diese Funktion auch stetig nach y = Im z differenzierbar ist, wobei
Z b Z b
∂ ∂
f (z, t) dt = f (z, t) dt.
∂y a a ∂y
Rb
Also ist z 7→ a
f (z, t) dt in C1 (D). Aus obigen Gleichungen folgt wegen der Holomorphie des Integranden
Z b Z b Z b Z b
∂ ∂ ∂ ∂
f (z, t) dt = f (z, t) dt = −i · f (z, t) dt = −i · f (z, t) dt,
∂x a a ∂x a ∂y ∂y a
Rb
und daher die Holomorphie von z 7→ a
f (z, t) dt. Wegen (11.41) folgt aus dieser Gleichung auch (11.48).
❑
11.4.13 Satz (Cauchyscher Integralsatz und Cauchysche Integralformel). Sei f : D → X holomorph.
Ist γ : [a, b] → D stetig, rektifizierbar und nullhomotop, so gilt11

I
f (ζ) dζ = 0.
γ
t−a
Ist w ∈ C und ρ > 0 so klein, dass Kρ (w) ⊆ D, und ist γ : [a, b] → D \ {w} der Weg t 7→ w + ρ · exp(2πi b−a ) oder in
D \ {w} radial homotop zu diesem Weg, so gilt
I
1 f (ζ)
f (w) = dζ. (11.50)
2πi γ ζ−w
H
11 Komplexe Wegintegrale über einen geschlossenen Weg schreibt man mit einem -Zeichen an.
Beweis. Nach Korollar 11.4.8 ist φ f lokal wegunabhängig. Die erste Aussage folgt damnach sofort aus Korollar 11.3.11,
wenn man Bemerkung 11.4.6 beachtet. Für die zweite betrachte man die Funktion
f (z) − f (w)
G(z) = , z ∈ D \ {w}.
z−w
Nach Proposition 11.4.10 ist G : D \ {w} → X holomorph. Da limz→w f (z)−

z−w
f (w)
existiert, kann man G auf D durch G(w) :=
f ′ (w) stetig fortsetzen, vgl. Bemerkung 6.4.4.
Wieder wegen Korollar 11.3.11 zusammen mit Bemerkung 11.4.6 gilt
I I
G(ζ) dζ = G(ζ) dζ,
γρ γǫ
t−a
für alle ǫ ∈ (0, ρ], wobei γǫ (t) = w + ǫ · exp(2πi b−a ), da γρ und γǫ offensichtlich radial homotop in D \ {w} sind. Andererseits
kann man den Betrag der rechten Seite mit Hilfe von (11.47) nach oben abschätzen durch
Z b
max kG ◦ γǫ (t)k · ℓ(γǫ ) ≤ max kG(z)k · |γǫ′ (t)| dt = max kG(z)k · 2πǫ.
t∈[a,b] z∈Kρ (w) a z∈Kρ (w)
Da G auf Kρ (w) stetig fortgesetzt wurde, geht obiger Ausdruck für ǫ ց 0 gegen Null. Also gilt, da komplexe Wegintegrale
linear im Integranden sind, I I I
f (ζ) 1
0= G(ζ) dζ = dζ − f (w) · dζ.
γρ γρ ζ − w γρ ζ − w
H 1
Mit Hilfe von (11.10) berechnet man leicht γ ζ−w dζ = 2πi. Somit folgt (11.50) für γ = γρ . Ist γ in D \ {w} radial homotop
ρ
zu γρ , so folgt (11.50) aus Korollar 11.3.11 unter Beachtung von Bemerkung 11.4.6.
❑
11.4.14 Bemerkung. Mit der Notation aus Satz 11.4.13 sei w ∈ D und ρ > 0 so klein, dass Kρ (w) ⊆ D. Wie man aus der
Dreiecksungleichung sofort erkennt, gilt für jedes z ∈ Uρ (w) die Relation Kr (z) ⊆ Kρ (w), wobei r = ρ − |z − w| (> 0).
Setzen wir (t ∈ [a, b])
t−a t−a
γρ (t) := w + ρ · exp(2πi ), und γ(t) := z + r · exp(2πi ),
b−a b−a
so gilt für α ∈ [0, 1]

t−a
αγ(t) + (1 − α)γρ (t) = αz + (1 − α)w + (αr + (1 − α)ρ) · exp(2πi ), (11.51)
b−a
und daher
|αγ(t) + (1 − α)γρ (t) − w| ≤ α|z − w| + (ρ − α|z − w|) = ρ.
Also liegt (11.51) in D. Andererseits gilt wegen der umgekehrten Dreiecksungleichung

t−a
0 < ρ − |z − w| = (ρ − α|z − w|) − (1 − α)|z − w| ≥ (ρ − α|z − w|) · exp(2πi ) − (1 − α)(z − w) = αγ(t) + (1 − α)γρ (t) − z .
b−a
Damit liegt (11.51) sogar immer in D \ {z}. Aus Fakta 11.3.8, 6, folgt daher, dass die Wege γρ und γ radial homotop in D \ {z}
sind. Wegen (11.50) gilt daher für alle z ∈ Uρ (w)
I Z b t−a
1 f (ζ) 1 f (w + ρ exp(2πi b−a )) t−a
f (z) = dζ = t−a · ρ exp(2πi ) dt. (11.52)
2πi γρ ζ−z b−a a w + ρ exp(2πi b−a )−z b−a
Die letzte Gleichheit gilt wegen (11.10).
11.4.15 Korollar. Ist f : D → X holomorph, so ist auch f ′ : D → C holomorph. Damit sind alle Funktionen f (n) : D → C,
n ∈ N rekursiv definiert durch f (n+1) = ( f (n) )′ , holomorph auf D. Dabei gilt für alle w ∈ D
I
n! f (ζ)
f (n) (w) = dζ. (11.53)
2πi γ (ζ − w)n+1
t−a
Hier ist γ : [a, b] → D \ {w} der Weg t 7→ w + ρ · exp(2πi b−a ) oder in D \ {w} radial homotop zu diesem Weg, wobei ρ > 0
so klein ist, dass Kρ (w) ⊆ D. Insbesondere ist f ∈ C∞ (D).
Beweis. Sei ρ > 0 so, dass Kρ (w) ⊆ D. Der Integrand von der rechten Seite von (11.52) ist offensichtlich stetig als Funktion
von (z, t) ∈ Uρ (w) × [a, b] nach C (vgl. Korollar 6.1.8).
Weiters beachte man, dass der Integrand bei festem t ∈ [a, b] als Funktion von z ∈ Uρ (w) holomorph ist, vgl. Beispiel
11.4.11. Die komplexe Ableitung des Integranden nach z ist dabei
t−a
f (w + ρ exp(2πi b−a )) t−a
t−a · ρ exp(2πi ).
(w + ρ exp(2πi b−a ) − z)2 b−a
Diese Funktion ist wieder offensichtlich stetig als Funktion von (z, t) ∈ Uρ (w) × [a, b] nach C (vgl. Korollar 6.1.8). Also
können wir Lemma 11.4.12 anwenden und erhalten für z ∈ Uρ (w)
Z b t−a I
1 f (w + ρ exp(2πi b−a )) t−a 1 f (ζ)
f ′ (z) = t−a · ρ exp(2πi ) dt = dζ.
b−a a (w + ρ exp(2πi b−a ) − z)2 b−a 2πi γρ (ζ − z)2
Wiederholt man obige Argumentation mit dem mittleren Riemann-Integral, so folgt aus Lemma 11.4.12, dass auch f ′ (z) auf
z ∈ Uρ (w) holomorph ist, wobei
Z b t−a I
2 f (w + ρ exp(2πi b−a )) t−a 2 f (ζ)
f ′′ (z) := ( f ′ )′ (z) = t−a · ρ exp(2πi ) dt = dζ.
b−a a (w + ρ exp(2πi b−a ) − z)3 b−a 2πi γρ (ζ − z)3
Aus (11.41) angewandt auf f ′ und f folgt f ∈ C2 (Uρ (w)). Da w ∈ D beliebig war, gilt f ∈ C2 (D), und - da Holomorphie
eine lokale Eigenschaft ist - ist f ′ holomorph auf D.
Verfährt man induktiv weiter, so folgt insbesondere (11.53) und f ∈ Cn (D) für alle n ∈ N, wobei γ = γρ in (11.53).
Für in D \ {w} zu γρ radial homotope γ folgt (11.53) aus Korollar 11.3.11 unter Beachtung von Bemerkung 11.4.6.
❑
11.4.16 Korollar (Satz von Liouville). Ist f : C → X holomorph auf C, also ganz, und ist f beschränkt, so ist f eine
konstante Funktion.
t−a
Beweis. Es gelte k f (z)k ≤ M, z ∈ C. Ist ρ > 0 und γ(t) = w + ρ · exp(2πi b−a ), so folgt wegen (11.53) und (11.11)
I
1 f (ζ) 1 1 M
k f ′ (z)k = dζ ≤ M · ·2πρ = .
2π γ (ζ − z)
2 2π ρ2 ρ
Da wir ρ > 0 beliebig groß wählen können, folgt f ′ (w) = 0. Da auch 0′ = 0, folgt aus der Eindeutigkeitsaussage im letzten
Teil von Korollar 11.4.8, dass f konstant ist.
❑
11.4.17 Satz (Satz von Morera). Sei D ⊆ C offen. Dann ist eine Funktion f : D → X genau dann holomorph, wenn f stetig
ist, und es zu jedem w ∈ D ein offenes D(w) ⊆ D gibt, sodass
I
f (ζ) dζ = 0
γ
für alle geschlossenen Polygonzüge γ in D(w).

In dem Fall gilt obige Aussage für D(w) = Uρ (w), wenn nur Uρ (w) ⊆ D.
Beweis. Jedes holomorphe f ist offensichtlich stetig. Wählt man zu w ∈ DH die Zahl ρ > 0 so klein, dass D(w) := Uρ (w) ⊆ D,
so ist D(w) einfach zusammenhängend, vgl. Fakta 11.3.2, 5. Nun folgt γ f (ζ) dζ aus Satz 11.4.13 sogar für alle stetigen,
rektifizierbaren und geschlossenen Wegen γ in D(w).
Gelte nun umgekehrt die im Satz gemachte Voraussetzung, und sei zu w ∈ D das offene D(w) ⊆ C wie in der Voraus-
setzung. Gemäß Bemerkung 11.4.6 gilt I Z
0= f (ζ) dζ = φ f (x) dx
γ γ
für das stetige Vektorfeld φ f : D(w) → L(R2 , X) definiert in (11.38). Gemäß Bemerkung 11.3.9 ist dieses Vektorfeld auf
D(w) wegunabhängig und daher ein Gradientenfeld. Somit gilt φ f (z) = dF(z), z ∈ D(w) für ein X-wertiges F ∈ C1 (D).
Wegen (11.34) bedeutet dF(z) = φ f (z) gerade, dass F holomorph auf D(w) ist, wobei
∂F
F ′ (z) = (z) = φ f (z)e1 = f (z).
∂x
Gemäß Korollar 11.4.15 ist auch F ′ = f auf D(w) holomorph. Da w beliebig war, und da Holomorphie eine lokale
Eigenschaft ist, folgt die Behauptung.
❑
11.4.18 Korollar. Sei D ⊆ C offen, und fn : D → X, n ∈ N, eine Folge holomorpher Funktionen, die lokal gleichmäßig
gegen eine Funktion f : D → X konvergiert, dh. für jede kompakte Teilmenge K ⊆ D konvergiert ( fn |K )n∈N gleichmäßig auf
K gegen f |K . Dann ist auch f holomorph.
Beweis. Wähle zu w ∈ D die offene Menge D(w) wie Satz 11.4.17. Gemäß diesem Satz können wir sie sogar unabhängig
von n so wählen, dass für alle n ∈ N I
fn (ζ) dζ = 0,
γ
wenn nur γ : [0, m] → D(w) ein geschlossener Polygonzug ist. K := γ([0, m]) ist als stetiges Bild einer kompakten Menge
selber kompakt. Nun stimmt wegen (11.10) obiges Wegintegral überein mit
Z m
γ′ (t) · fn (γ(t)) dt = 0.
0
Wegen kγ′ (t) · fn (γ(t)) − γ′ (t) · f (γ(t))k ≤ k fn − f k∞,K · kγ′ k∞,[0,m] , t ∈ [a, b], und da γ ein Polygonzug ist und daher
kγ′ k∞,[0,m] < +∞, konvergiert die Funktionenfolge γ′ · fn ◦ γ gleichmäßig gegen γ′ · f ◦ γ auf [a, b]. Aus Satz 8.7.2 folgt
somit I Z m Z m
f (ζ) dζ = γ′ (t) · f (γ(t)) dt = lim γ′ (t) · fn (γ(t)) dt = 0.
γ 0 n→∞ 0
Nach Satz 11.4.17 ist daher f holomorph.

❑
P
11.4.19 Korollar. Seien an ∈ X, n ∈ N ∪ {0} derart, dass die Potenzreihe ∞ n
n=0 an z Peinen Konvergenzradius R > 0 hat, vgl.
Abschnitt 9.3 sowie (6.7) und Satz 6.7.8. Ist w ∈ C, so ist die Grenzfunktion f (z) = ∞ n
n=0 an (z − w) auf UR (w) holomorph.
Dabei ist UR (w) die offene Kugel bzgl. k.k2 = |.|, dh. UR (w) = {z ∈ C : |z − w| < R}.
Beweis. Sei K ⊆ UR (w) kompakt. Nun existiert r = maxz∈K |z|, da z 7→ |z| stetig auf der kompakten Menge K ist. Ist
z ∈ K ⊆ UR (w) mit |z| = r, so folgt λ z ∈ UR (w) für allePλ ∈ C mit |λ| ≤ 1. Daraus folgt unmittelbar K ⊆ Kr (0) ⊆ UR (w).
N
Nach Satz 6.7.8 konvergiert die Funktionenreihe n=0 a (z − w)n für N → ∞ gleichmäßig auf Kr (w) gegen f (z); somit
PN n
auch auf K. Da gemäß Beispiel 11.4.11 alle Polynome n=0 an (z − w)n holomorph sind, ist nach Korollar 11.4.18 auch f
auf UR (w) holomorph.
❑
11.4.20 Satz. Sei D ⊆ C offen. Dann ist eine Funktion f : D → X genau dann holomorph, wenn f analytisch ist, dh. es zu
P∞ w ∈ D eine
jedem
n
offene Kreisscheibe Uρw (w) ⊆ D bzgl. |.| gibt, sodass sich f darauf als Grenzfunktion einer Potenzreihe
n=0 an (z − w) mit Konvergenzradius ≥ ρw darstellen lässt, vgl. Bemerkung 6.7.12.
Dabei sind die Koeffizienten an eindeutig durch f auf folgende Weise
f (n) (w)
a0 = f (w), und an := , n ∈ N.
n!
Das größt mögliche ρw , sodass sich ein holomorphes f als Potenzreihe auf Uρw (w) darstellen lässt, ist ρw = d(w, Dc ), wobei
ρw = +∞, wenn D = C.
Beweis. Lässt sich f um jedes w auf einem Uρw (w) ⊆ D lokal als Grenzfunktion einer Potenzreihe darstellen, so ist f dort
gemäß Korollar 11.4.19 holomorph. Da Holomorphie eine lokale Eigenschaft ist, muss f auf ganz D holomorph sein.
Sei nun f : D → X holomorph, und setze ρw = d(w, Dc ). Offensichtlich ist das das größte ρw mit Uρw (w) ⊆ D. Für
ρ ∈ (0, ρw ), ζ ∈ C mit |ζ − w| = ρ und für z ∈ Uρ (w) gilt
X
∞ !
1 z−w n 1 1 1
· = · z−w = .
ζ − w n=0 ζ − w ζ − w 1 − ζ−w ζ−z
Aus (11.52) folgt

I !n Z b !n
f (ζ) X z − w X
∞ ∞
1 1 t−a z−w
f (z) = · dζ = f (w + ρ exp(2πi )) · t−a dt.
2πi γρ ζ − w n=0 ζ − w b−a a b−a n=0
ρ exp(2πi b−a )
n
P P∞ |z−w| n
Wegen ∞
n=0
z−w
t−a ) = n=0 ρ < +∞ konvergiert die Reihe im obigen Riemann-Integral gleichmäßig, vgl.
ρ exp(2πi b−a
12
Korollar 6.7.4. Aus Satz 8.7.2 folgt daher
X
∞ Z b !n X
∞ I !
1 t−a z−w 1 f (ζ)
f (z) = f (w + ρ exp(2πi )) · t−a dt = n+1
dζ ·(z − w)n .
n=0
b−a a b−a ρ exp(2πi b−a ) n=0
2πi γ (ζ − w)
| {z }
=:an
P∞ n
Die letzte Gleichheit folgt aus (11.10). Also konvergiert n=0 an (z − w) und stimmt mit f (z) überein, wobei wegen (11.50)
(n)(w)
bzw. (11.53) a0 = f (w) und an := f n! , n ∈ N.
Aus (6.7) (vgl. auch Abschnitt 9.3) folgt schließlich, dass diese Potenzreihe einen Konvgenzradius R ≥ |z − w| hat, und
da z ∈ Uρ (w) beliebig war, gilt R ≥ ρ. Da auch ρ ∈ (0, ρw ) beliebig war, folgt R ≥ ρw .
❑
Wir wollen noch den Zusammenhang zu sogenannten harmonischen Funktionen herstellen.
11.4.21 Definition. Sei X ein Banachraum über R. Ist g : G → Rm mit offenem G ⊆ R2 C zweimal stetig differenzierbar,
so bezeichnet △g : G → X (Laplace g) die Abbildung
! ! !
x ∂2 g x ∂2 g x
△g := 2 + 2 .
y ∂x y ∂y y
Funktionen g : G → X, g ∈ C2 (G) heißen harmonisch, falls △g ≡ 0.
12 Insbesondere konvergiert diese Reihe!

11.4.22 Proposition. Ist G ⊆ C offen und f : G → C holomorph, so ist f auch harmonisch. Insbesondere sind dann Real-
und Imaginärteil von f harmonisch, dh. ∂u
∂x (z).
Ist umgekehrt u : G → R harmonisch für ein einfach zusammenhängendes Gebiet G ⊆ C, so gibt es ein bis auf eine
imaginäre Konstante eindeutiges holomorphes f : G → C, sodass u ≡ Re f .
Beweis. Ist f : G → C analytisch, so gelten die Cauchy-Riemannschen Differentialgleichungen Cauchy-Riemannschen

Differentielgleichungen (z = x + iy)
∂u ∂v ∂v ∂u
(z) = (z), (z) = − (z), (11.54)
∂x ∂y ∂x ∂y
wobei u = Re f und v = Im f . Offensichtlich kann man (11.54) auch schreiben als
∂f ∂f
(z) = −i · (z). (11.55)
∂x ∂y
Da holomorphe Funktionen beliebig oft differenzierbar sind, folgt aus dieser Gleichung abgeleitet nach x
∂2 f ∂2 f
(z) = −i · (z).
∂x2 ∂x∂y
Wegen dem Satz von Schwarz und wegen (11.55) abgeleitet nach y ist dieser Ausdruck gleich
∂2 f ∂2 f
−i · (z) = (−i)2 · 2 (z).
∂y∂x ∂y
Daraus folgt sofort △ f = 0, womit offensichtlich auch u = Re f und v = Im f harmonisch sind.

Ist umgekehrt u : G → R harmonisch und G ⊆ C einfach zusammenhängendes Gebiet, so setzen wir α(z) := ∂u ∂x (z),
β(z) := − ∂u
∂y
(z) und F(z) := α + iβ. Dann sind α : G → R, β : G → R und F : G → C alle drei C1 -Funktionen, wobei wegen
△u = 0 und wegen dem Satz von Schwarz
∂F ∂α ∂β ∂2 u ∂2 u
(z) = (z) + i (z) = 2 (z) − i (z) =
∂x ∂x ∂x ∂x ∂x∂y
∂2 u ∂2 u ∂β ∂α ∂F
− (z) − i (z) = (z) − i (z) = −i · (z).
∂y2 ∂y∂x ∂y ∂y ∂y
Also ist F holomorph. Da G einfach zusammenhängend ist, gibt es eine Holomorphe Stammfunktion f , dh. f : G → C mit
f ′ = F. Wegen f ′ = ∂∂xf = −i ∂∂yf gilt
∂ Im f ∂ Re f ∂u
= = Re F = α =
∂y ∂x ∂x
und
∂ Re f ∂ Im f ∂u
− = = Im F = β = − .
∂y ∂x ∂y
Insbesondere ist d(Re f )(z) = du(z) (∈ L(R2 , R)) für alle z ∈ G. Da Gradientenfelder wegunabhängig sind, und da in G je
zwei Punkte durch einen Polygonzug verbindbar sind, folgt daraus Re f = u + c für ein c ∈ R. Nun ist f − c die gesuchte
holomorphe Funktion.
Falls g : G → C eine weitere holomorphe Funktion mit Re g = u ist, so ist f − c − g : G → C auch holomorph mit
einem verschwindenden Realteil. Aus den Cauchy-Riemannschen Differentialgleichungen folgt d( f − c − g)(z) = 0 und
daraus, dass f − c − g eine Konstante sein muss, vgl. Satz 11.2.8.
❑
Kapitel 12
Topologische Grundlagen
12.1 Topologische Grundbegriffe

Wir wollen in diesem und in den nächsten Abschnitten die Konvergenztheorie, wie wir
sie für metrische Räume entwickelt haben, verallgemeinern. Dabei werden wir Räume
betrachten, die gerade noch soviel Struktur tragen, dass wir von stetigen Funktionen,
Grenzwerten, Kompaktheit etc. sprechen können, nämlich die sogenannten topologi-
schen Räume.
12.1.1 Beispiel (Metrische Räume). Sei (Y, d) ein metrischer Raum. Es gilt also
d(x, y) ≥ 0 und d(x, y) = 0 genau dann, wenn x = y.
d(x, y) = d(y, x).
d(x, y) ≤ d(x, z) + d(z, y).
Sei nun O die Menge aller offenen Teilmengen von Y (siehe Definition 5.1.4), wobei
wir eine Teilmenge O von Y offen genannt haben, wenn sie die Eigenschaft hat, dass
es zu jedem x ∈ O ein ǫ > 0 gibt, sodass die ǫ-Kugel Uǫ (x) (= {y ∈ Y : d(y, x) < ǫ})
ganz in O enthalten ist.
Wir haben in Proposition 5.1.6 gesehen, dass O folgende Eigenschaften hat.
∅ ∈ O, X ∈ O.
Ist n ∈ N und O1 , O2 ∈ O, so folgt O1 ∩ O2 ∈ O.

S
Ist I eine Indexmenge und Oi ∈ O, i ∈ I, so folgt i∈I Oi ∈ O.
Wir nehmen nun diese aufgezählten Eigenschaften als Ausgangspunkt unserer an-
gestrebten Verallgemeinerung.
12.1.2 Definition. Sei X eine nichtleere Menge und T ⊆ P(X) ein System von Teil-
mengen von X. Erfüllt T die Eigenschaften
(01) ∅ ∈ T , X ∈ T .
(02) Sind O1 , O2 ∈ T , so folgt O1 ∩ O2 ∈ T .

S
(03) Ist I eine Indexmenge und Oi ∈ T , i ∈ I, so folgt i∈I Oi ∈ T .
135
136 KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
so heißt T eine Topologie auf X. Die Elemente von T heißen offene Mengen, und man
spricht von (X, T ) als topologischem Raum.
12.1.3 Bemerkung. Mittels Vollständiger Induktion sieht man sofort, dass (O2) äqui-
valent ist zu
T
(02’) Ist n ∈ N und O1 , . . . , On ∈ T , so folgt ni=1 Oi ∈ T .
12.1.4 Beispiel.
Wir haben oben gesehen, dass die Menge O aller offenen Mengen eines metri-
schen Raumes (Y, d) (01)-(03) erfüllt. Damit ist (Y, O) ein topologischer Raum.
Man sagt, O ist die von der Metrik d induzierte Topologie und schreiben auch
T (d) für O.
Ist Y = R p versehen mit der Metrik d2 , so heißt die von d2 induzierte Topologie
T (d2 ) Euklidische Topologie. Die Metriken d1 und d∞ induzieren ebenfalls die
Euklidische Topologie.
Sei T := P(X). Klarerweise sind (01)-(03) erfüllt, also ist (X, P(X)) ein topolo-
gischer Raum. Man spricht von der diskreten Topologie. Die diskreten Topologie
wird übrigens von der diskreten Metrik induziert (siehe Beispiel 3.1.5).
Sei T := {∅, X}. Wieder sind (01)-(03) trivialerweise erfüllt. Man spricht von der
Klumpentopologie.
Eines unserer Ziele wird es sein, Konvergenz gegen einen Punkt oder Stetigkeit bei
einem Punkt für unsere Räume zu verallgemeinern. Dazu benötigen wir ein Analogon
zum Begriff der ’ǫ-Kugel’.
12.1.5 Definition. Sei (X, T ) ein topologischer Raum und x ∈ X. Eine Menge U ⊆ X
heißt Umgebung von x, wenn es eine offene Menge O ∈ T gibt mit x ∈ O ⊆ U. Wir
bezeichnen mit U(x) die Menge aller Umgebungen von x, den Umgebungsfilter von x.
Der Begriff Filter ist ein allgemeines mengentheoretisches Konzept.
12.1.6 Definition. Sei M eine nichtleere Menge. Dann heißt ein Mengensystem F ⊆
P(M) ein Filter, wenn
(F1) F , ∅ und ∅ < F,
(F2) F1 , F2 ∈ F ⇒ F1 ∩ F2 ∈ F,
(F3) F1 ∈ F, F1 ⊆ F2 ⊆ M ⇒ F2 ∈ F.
Ist (X, T ) ein topologischer Raum, so ist der Umgebungsfilter U(x) tatsächlich ein
Filter, da
offensichtlich X ∈ U(x) und jede Menge U ∈ U(x) den Punkt x enthält und damit
nicht leer ist,
aus U1 , U2 ∈ U(x) die Existenz von O1 , O2 ∈ T mit x ∈ O1 ⊆ U1 und x ∈
O2 ⊆ U2 folgt, und somit x ∈ O1 ∩ O2 ⊆ U1 ∩ U2 , wobei wegen (O2) sicherlich
O1 ∩ O2 ∈ T , und daher U1 ∩ U2 ∈ U(x),
aus U1 ∈ U(x) und U1 ⊆ U2 ⊆ X die Inklusion x ∈ O ⊆ U1 für ein gewisses
O ∈ T und somit x ∈ O ⊆ U2 bzw. U2 ∈ U(x) folgt.
12.1. TOPOLOGISCHE GRUNDBEGRIFFE 137
Die korrekte Verallgemeinerung des Systems aller ǫ-Kugeln um einen festen Punkt
in einem metrischen Raum ist nun der Begriff Filterbasis des Umgebungsfilter.
12.1.7 Definition. Sei M eine nichtleere Menge und F ein Filter. Dann heißt ein Men-
gensystem B ⊆ F eine Filterbasis von F, wenn man zu jeder Menge F ∈ F ein B ∈ B
findet, sodass B ⊆ F.
12.1.8 Bemerkung. Mit der Notation aus Definition 12.1.7 folgt, dass
F = {F ∈ P(X) : ∃B ∈ B : B ⊆ F}. (12.1)
Also ist B Filterbasis von genau einem Filter.

Betrachtet man jetzt B losgelöst von F, so erfüllt B
(FB1) B , ∅ und ∅ < B,
(FB2) B1 , B2 ∈ B ⇒ ∃B3 ∈ B : B3 ⊆ B1 ∩ B2 .
Die erste Eigenschaft ist klar wegen (F1). Die zweite folgt aus (F2): B1 , B2 ∈ B ⇒
B1 ∩ B2 ∈ F. Aus der Definition von Filterbasis folgt ∃B3 ∈ B : B3 ⊆ B1 ∩ B2 .
Nun kann man auch mit einem Mengensystem B, das (FB1) und (FB2) erfüllt,
starten, um daraus ein Mengensystem F durch (12.1) zu definieren.
Klarerweise ist ∅ < F. Sind F1 , F2 ∈ F, so gilt B1 ⊆ F1 und B2 ⊆ F2 für gewisse
B1 , B2 ∈ B, und wegen (FB2) B3 ⊆ B1 ∩ B2 ⊆ F1 ∩F2 für ein B3 ∈ B. Also F1 ∩F2 ∈ F.
Schließlich ist mit F1 auch jedes F2 ⊇ F1 Obermenge eines gewissen B ∈ B. Somit ist
F ein Filter, der B als eine Filterbasis hat.
12.1.9 Definition. Man sagt ein topologischer Raum (X, T ) erfüllt das erste Abzähl-
barkeitsaxiom (ABI), wenn für jedes x ∈ X der Umgebungsfilter U(x) eine Filterbasis
bestehend aus abzählbar vielen Mengen hat.
12.1.10 Beispiel.
(i) Klarerweise ist ein Filter eine Filterbasis von sich selbt.
(ii) Ist (X, T ) ein topologischer Raum und x ∈ X, so ist z.B. {O ∈ T : x ∈ O} eine
Filterbasis von U(x).
(iii) Sei (Y, d) ein metrischer Raum und T (d) die von der Metrik erzeugte Topologie.
Ist x ∈ Y, so ist {Uǫ (x) : ǫ > 0} eine Filterbasis von U(x).
Dass Uǫ (x) eine Umgebung ist, folgt aus der Tatsache, dass Uǫ (x) sogar offen ist.
Nun sei U ∈ U(x). Dann gibt es eine offene Menge O ∈ T (d), sodass O ⊆ U. Aus
der Definition der offenen Mengen in metrischen Räumen folgt Uǫ (x) ⊆ O ⊆ U,
und damit ist obiges Mengensystem eine Filterbasis.
Auf ähnliche Weise sieht man, dass {Kǫ (x) : ǫ > 0} oder auch {Uǫn (x) : n ∈
N}, wenn (ǫn )n∈N eine Nullfolge aus positiven reellen Zahlen ist, eine Basis des
Umgebungsfilter U(x) ist. Insbesondere erfüllt jeder metrische Raum das erste
Abzählbarkeitsaxiom.
Folgendes Lemma passt nun zu der Konstruktion einer Topologie aus einer Metrik.
12.1.11 Lemma. Sei (X, T ) ein topologischer Raum und sei für jeden Punkt x ∈ X
das System W(x) eine Filterbasis von U(x)1 . Dann ist eine Menge O ⊆ X genau dann
offen, d.h. O ∈ T , wenn
∀x ∈ O ⇒ O ∈ U(x), (12.2)
bzw. genau dann, wenn
∀x ∈ O ∃W ∈ W(x) : W ⊆ O. (12.3)
Beweis. Für ein festes x ∈ X bedeutet die Tatsache ∃W ∈ W(x) : W ⊆ O gemäß der
Definition einer Filterbasis nicht anderes als O ∈ U(x). Also sind (12.2) und (12.3)
äquivalent.
Ist O ∈ T und x ∈ O, so folgt daraus O ∈ U(x), vgl. Beispiel 12.1.10, (ii). Gilt
umgekehrt O ∈ U(x), ∀x ∈ O, so gibt es wegen der Definition von U(x) zu jedem
x ∈ O eine Menge O x ⊆ O, O x ∈ T , und daher
[ [
O= {x} ⊆ O x ⊆ O.
x∈X x∈X
Als Vereinigung der offenen Mengen O x muss O nach (O3) selber offen sein.
❑
Nun können wir den Grenzwert eines Netzes auch für topologische Räume definie-
ren.
12.1.12 Definition. Sei (I, ) eine gerichtete Menge und (xi )i∈I ein Netz in X, wobei
(X, T ) ein topologischer Raum ist. Man sagt, dass dieses Netz gegen einen Punkt x ∈ X
i∈I
konvergiert, in Zeichen xi −→ x, falls
∀U ∈ U(x) ∃i0 ∈ I : ∀i i0 ⇒ xi ∈ U,
d.h. falls in jeder beliebigen Umgebung ab einem Index alle Glieder xi des Netzes
enthalten sind.
12.1.13 Fakta.
Ist W(x) eine Filterbasis von U(x), so ist die Konvergenzbedingung aus Definition
12.1.12 äquivalent zu
∀W ∈ W(x) ∃i0 ∈ I : ∀i i0 ⇒ xi ∈ W,
da einerseits wegen W(x) ⊆ U(x) diese Bedingung sicherlich eine Konsequenz

aus der in Definition 12.1.12 ist, und da andererseits aus U ∈ U(x) die Existenz
eines W ∈ W(x) mit W ⊆ U folgt, und dann mit der gegenwärtigen Bedingung,
dass xi ∈ W ⊆ U, ∀i i0 für ein gewisses i0 ∈ I.
Ist (xi( j) ) j∈J ein Teilnetz von (xi )i∈I , d.h.
∀i ∈ I∃ j0 ∈ J : ∀ j J j0 ⇒ i( j) I i,
und konvergiert (xi )i∈I gegen x, so auch (xi( j) ) j∈J . Um das zu sehen, sei U ∈ U(x)
und i0 ∈ I, sodass i I i0 ⇒ xi ∈ U. Ist nun j0 ∈ J so, dass j J j0 ⇒ i( j) I i0 ,
so folgt auch xi( j) ∈ U für alle j J j0 .
1 Es ist nicht ausgeschlossen, dass W(x) = U(x).
12.1. TOPOLOGISCHE GRUNDBEGRIFFE 139
12.1.14 Bemerkung. Wir sehen nun aus Fakta 12.1.13, dass diese Definition der Kon-
vergenz mit der in metrischen Räumen konform geht. In der Tat haben wir x = limi∈I xi
in einem metrischen Raum (Y, d) genau dann, wenn
∀ǫ > 0 ∃i0 ∈ I : xi ∈ Uǫ (x) ∀i i0 .
Da {Uǫ (x) : ǫ > 0} eine Filterbasis von U(x) ist, stimmt diese Bedingung mit der aus
Fakta 12.1.13 überein.
Wir sehen insbesondere, dass die Konvergenz nicht von der konkreten Metrik, son-
dern nur von der von ihr erzeugten Topologie abhängt (vgl. Beispiel 12.3.10).
Wir haben in der Definition der Konvergenz absichtlich nicht die Schreibweise x =
limi∈I xi verwendet, denn es kann sein, dass x nicht der einzige Grenzwert ist.
12.1.15 Beispiel. Man betrachte eine Menge X mit mindestens zwei Elementen verse-
hen mit der Klumpentopologie. Dann ist U(x) = {X} für alle x ∈ X. Damit konvergiert
aber jedes Netz gegen jeden Punkt x ∈ X.
Man muss eine zusätzliche Eigenschaft vom gegebenen topologischen Raum for-
dern, damit Grenzwerte eindeutig sind.
12.1.16 Definition. Ein topologischer Raum (X, T ) heißt T 2 -Raum (oder Hausdorff-
Raum) 2 , wenn gilt:
(T 2 ) Zu je zwei Punkten x, y ∈ X, x , y, gibt es disjunkte offene Mengen O x und Oy ,

sodass x ∈ O x , y ∈ Oy .
Oy
y
Ox
x
Abbildung 12.1: Zweites Trennungsaxiom (T 2 )
Man sieht unmittelbar, dass diese Eigenschaft zu der Tatsache äquivalent ist, dass
es zu zwei verschiedenen Punkten x, y zwei Umgebungen U ∈ U(x), V ∈ U(y) gibt mit
U ∩ V = ∅.
12.1.17 Beispiel. Die von einer Metrik d auf einer Menge Y induzierte Topologie ist
Hausdorff. Sind nämlich x, y ∈ Y, x , y, so gilt d(x, y) > 0. Setze ǫ := 31 d(x, y) und
betrachte die Umgebungen
U := Uǫ (x), V := Uǫ (y) .
Angenommen es wäre z ∈ U ∩ V, dann erhielten wir den Widerspruch

1 1 2
d(x, y) ≤ d(x, z) + d(z, y) < d(x, y) + d(x, y) = d(x, y) .
3 3 3
2 Felix Hausdorff, 8.11.1868 (Breslau) -26.1.1942 (Bonn)
Der Beweis der Eindeutigkeit des Grenzwertes eines Netzes wird nun fast wörtlich
vom metrischen Fall übertragen.
12.1.18 Lemma. Sei (xi )i∈I ein konvergentes Netz in einem topologischen (T 2)-Raum.
Dann ist Grenzwert eindeutig.
Beweis. Wären x, y zwei verschiedene Grenzwerte, so wähle man disjunkte Umge-
bungen U ∈ U(x) und V ∈ U(y). Dann wähle man i1 ∈ I und i2 ∈ I mit i i1 ⇒ xi ∈ U
und i i2 ⇒ xi ∈ V. Da I gerichtet ist, gibt es ein i ∈ I, i i1 , i i2 , und somit
xi ∈ U ∩ V, was aber ein Widerspruch zu U ∩ V = ∅ ist.
❑
12.2 Abgeschlossene Mengen

12.2.1 Definition. Sei (X, T ) ein topologischer Raum. Eine Menge A ⊆ X heißt abge-
schlossen, wenn Ac offen ist.
12.2.2 Lemma. Sei X eine Menge. Ist T eine Topologie auf X und bezeichnet A die
Menge aller abgeschlossenen Mengen in (X, T ), so gilt:
(A1) ∅, X ∈ A.
(A2) A1 , . . . , An ∈ A, n ∈ N, so folgt A1 ∪ . . . ∪ An ∈ A.
T
(A3) Ai ∈ A, i ∈ I, so folgt i∈I Ai ∈ A.
Beweis. Die Axiome (A1) - (A3) gehen bei Komplementbildung genau in die Axiome
(O1) - (O3) über.
❑
12.2.3 Definition. Sei (X, T ) ein topologischer Raum, und sei B ⊆ X. Die Menge
\n o
B := A ⊆ X : A abgeschlossen, A ⊇ B (12.4)
heißt der Abschluss von B. Wenn man explizit klarstellen will, bezüglich welcher To-
T
pologie der Abschluss zu bilden ist, dann schreibt man für B oft auch B .
Ist C ⊆ B ⊆ X und gilt B ⊆ C, so heißt C dicht in B. Ist C dicht in X, so sagt man,
C ist dicht.
Hat B ⊆ X eine in B dichte und abzählbare Teilmenge, so heißt B separabel.
12.2.4 Lemma. Sei (X, T ) topologischer Raum, B ⊆ X. Dann ist B die kleinste abge-
schlossene Menge, die B umfasst.
Beweis. Wegen (A1) ist die Menge, über die in (12.4) der Durchschnitt gebildet wird,
nicht leer. Wegen (A3) ist B abgeschlossen. Ist A abgeschlossen und A ⊇ B, so kommt
A auf der rechten Seite von (12.4) vor, also gilt A ⊇ B.
❑
12.2.5 Lemma. Sei (X, T ) topologischer Raum. Dann gilt:
(i) Für B ⊆ X gilt B ⊆ B.
(ii) Ist C ⊆ B ⊆ X, so folgt C ⊆ B.
12.2. ABGESCHLOSSENE MENGEN 141
(iii) Für C, B ⊆ X folgt C ∪ B = C ∪ B.

(iv) Eine Menge B ⊆ X ist genau dann abgeschlossen, wenn B = B.
Beweis.
(i) Folgt unmittelbar aus der Definition.
(ii) Wegen B ⊇ B ⊇ C ist B eine abgeschlossene Menge, die C umfasst, und da C die
kleinste derartige Menge ist, folgt B ⊇ C.
(iii) Die Menge C ∪ B ist eine abgeschlossene Menge, die C ∪ B umfasst. Also folgt
C ∪ B ⊆ C ∪ B.
Andererseits folgt aus C ⊆ C ∪ B, dass C ⊆ C ∪ B, und genauso B ⊆ C ∪ B.
Damit gilt auch C ∪ B ⊆ C ∪ B.
(iv) B = B gilt genau dann, wenn B die kleinste abgeschlossene Menge ist, die B
enthält. Somit ist das genau dann der Fall, wenn B abgeschlossen ist.
❑
Wenn man sich an die Definition von Abschluss und abgeschlossener Menge in
metrischen Räumen zurückerinnert, so haben wir dort einen Zugang über Häufungs-
punkte gewählt. Im nächsten Lemma werden wir sehen, dass auch in allgemeinen to-
pologischen Räumen der Abschluss bzw. der Begriff der abgeschlossenen Menge so
charakterisiert werden kann. Um das einzusehen wollen wir zunächst ein kanonisches
Netz konstruieren, das gegen einen gegebenen Punkt konvergiert.
12.2.6 Lemma. Sei (X, T ) topologischer Raum, B ⊆ X und x ∈ X, sodass U ∩ B , ∅
für alle U ∈ U(x). Nun sei
I = {(y, U) : U ∈ U(x), y ∈ U ∩ B},
versehen mit der Relation (y1 , U1 ) (y2 , U2 ) :⇔ U1 ⊇ U2 .

Ist (xi )i∈I das Netz definiert durch xi := y, wenn i = (y, U), so konvergiert es gegen x.
Beweis. Die Relation ist offensichtlich reflexiv und transitiv. Sind (z, V), (y, U) ∈ I,
so folgt U ∩ V ∈ U(x). Voraussetzungsgemäß gibt es ein b ∈ U ∩ V ∩ B, und daher
(z, V), (y, U) (b, U ∩ V). Daraus folgt, dass (I, ) gerichtet ist.
Definitionsgemäß ist immer xi ∈ B. Da zu U ∈ U(x) und beliebigen y ∈ U ∩ B
aus i = (z, V) (y, U) folgt, dass xi = z ∈ V ⊆ U, sehen wir, dass (xi )i∈I gegen x
konvergiert.
❑
12.2.7 Proposition. Sei (X, T ) topologischer Raum, B ⊆ X, x ∈ X und W(x) eine
Filterbasis von U(x). Dann sind folgende Aussagen äquivalent:
(i) x ∈ B.
(ii) ∀U ∈ U(x) : B ∩ U , ∅.
(iii) ∀W ∈ W(x) : B ∩ W , ∅.
(iv) Es gibt ein Netz (xi )i∈I mit xi ∈ B, sodass x ein Grenzwert davon ist.
Beweis. Laut Definition ist x < B zur Existenz einer abgeschlossenen Menge A mit
x < A, A ⊇ B äquivalent. Da die offenen Mengen genau die Komplemente der abge-
schlossenen sind, ist das äquivalent zu ∃O ∈ T : x ∈ O, O ∩ B = ∅. Da die offenen, x
enthaltenden Mengen eine Umgebungsbasis darstellen, ist das aber genau die Negation
von (ii), also (i) ⇔ (ii).
(ii) ⇔ (iii) folgt unmittelbar aus der Tatsache, dass W(x) eine Filterbasis von U(x)
ist. (ii) ⇒ (iv) ist eine unmittelbare Konsequenz aus Lemma 12.2.6.
Gilt schließlich (iv) und ist U ∈ U(x), so folgt xi ∈ U ∩ B für alle i i0 mit einem
gewissen i0 . Also ist sicher U ∩ B , ∅.
❑
In Analogie zum Begriff des Häufungspunktes einer Menge in metrischen Räumen in Definition 5.1.7 definieren wir:
12.2.8 Definition. Sei (X, T ) topologischer Raum und B ⊆ X. Ein x ∈ X heißt Häufungspunkt von B, wenn
∀U ∈ U(x) : (B \ {x}) ∩ U , ∅.
12.2.9 Bemerkung. Aus Proposition 12.2.7 erkennt man sofort, dass x genau dann Häufungspunkt von B ist, wenn x ∈
B \ {x}, bzw. wenn (xi )i∈I → x für ein Netz aus B \ {x} (vgl. Lemma 5.1.13).
Man erkennt auch leicht aus Proposition 12.2.7, dass B mit der Vereinigung von B und der Menge aller Häufungspunkt
von B übereinstimmt.
12.2.10 Bemerkung. Ist (X, d) ein metrischer Raum, B ⊆ X und nimmt man als W(x)
die Menge aller offenen ǫ-Kugeln um x, so sieht man durch einen Vergleich von Pro-
position 12.2.7 und Bemerkung 5.1.11, dass x ∈ B genau dann, wenn x ∈ c(B). Also
stimmt der Abschluss in metrischen Räumen mit dem topologischen Abschluss übe-
rein.
Der Grund, warum man in metrischen Räumen das Auslangen mit Folgen findet,
daher x ∈ B genau dann, wenn xn → x für eine Folge aus B, ist die Gültigkeit des
ersten Abzählbarkeitsaxioms. In der Tat, kann man unter der Voraussetzung (ABI) die
Konstruktion in Lemma 12.2.6 folgendermaßen abändern:
Sei W(x) = {Wn : n ∈ N} eine abzählbare Filterbasis von U(x), und wähle xn ∈
B ∩ W1 ∩ · · · ∩ Wn (∈ U(x)). Man erhält somit eine Folge (xn )n∈N in B, sodass zu
vorgegebenem U ∈ U(x) ein N ∈ N mit WN ⊆ U existiert, und daher
xn ∈ W1 ∩ · · · ∩ WN ∩ · · · ∩ Wn ⊆ U für alle n ≥ N.
Somit konvergiert (xn )n∈N für n → ∞ gegen x.

12.2.11 Bemerkung. Eng verbunden mit dem Abschluss ist das Innere B◦ einer Teil-
menge B eines topologischen Raumes (X, T ), welches durch
[
B◦ = {O ∈ T : O ⊆ B}
definiert ist. Man sieht unmittelbar, dass x ∈ B◦ ⇔ B ∈ U(x). Ähnlich wie beim
Abschluss sieht man, dass B◦ die größte in B enthaltene offene Menge ist. Damit ist B
genau dann offen, wenn B = B◦.
Da die Komplemente von den offenen Mengen genau die abgeschlossenen Mengen
sind, besteht der folgende Zusammenhang zum Abschluss von Mengen.
c \ n oc
Bc = A ⊆ X : A abgeschlossen, A ⊇ Bc =
\ n oc
Oc ⊆ X : O offen, O ⊆ B = B◦ .
12.3. STETIGE ABBILDUNGEN 143
Begriffsbildung, die der des Häufungspunktes einer Folge entspricht, ist die des Häufungspunktes eines Netzes.
12.2.12 Definition. Sei (X, T ) ein topologischer Raum und (xi )i∈I ein Netz in X. Dann heißt x ∈ X Häufungspunkt von
(xi )i∈I , falls
∀U ∈ U(x)∀i ∈ I ∃ j ∈ I : i j ∧ x j ∈ U.
Vergleicht man das mit Proposition 12.2.7, so ist x Häufungspunkt von (xi )i∈I genau dann, wenn er im Schnitt aller
Mengen der Form
{x j : j ∈ I, i j},
also in \
{x j : j ∈ I, i j} (12.5)
i∈I
enthalten ist.
Unmittelbar aus der Definition des Grenzwertes eines Netzes sieht man, dass ein Limes eines Netzes auch Häufungs-
punkt ist. Die Umkehrung gilt im Allgemeinen nicht, wie man z. B. bei Folgen in R schon unschwer erkennen kann.
Eine weiter Charakterisierung von Häufungspunkten verwendet das Konzept von Teilnetzen.
12.2.13 Lemma. Der Punkt x ist Häufungspunkt von (xi )i∈I genau dann, wenn x Limes eines Teilnetzes (xi(k) )k∈K ist.
Beweis. Ist (xi(k) )k∈K ein Teilnetz, so gibt es zu i0 ∈ I ein k0 ∈ K, sodass i0 i(k), k0 k. Also gilt
{xi : i ∈ I, i0 i} ⊇ {xi(k) : k ∈ K, k0 k},
und damit \ \
{xi : i ∈ I, i0 i} ⊇ {xi(k) : k ∈ K, k0 k}. (12.6)
i0 ∈I k0 ∈K
Ist nun x Limes von (xi(k) )k∈K , so ist er insbesondere Häufungspunkt dieses Teilnetzes, und wegen (12.6) ein Häufungspunkt
von (xi )i∈I .
Ist umgekehrt x Häufungspunkt von (xi )i∈I , so betrachte die Menge
K = {(i, U) : i ∈ I, U ∈ U(x), xi ∈ U}
versehen mit der Relation (i1 , U1 ) (i2 , U2 ) :⇔ i1 i2 ∧ U1 ⊇ U2 .

Ist (i1 , U1 ), (i2 , U2 ) ∈ K und ist i′ ∈ I, i1 , i2 i′ , so gibt es wegen der Voraussetzung zu der Umgebung U3 = U1 ∩ U2
von x ein i3 ∈ I mit i′ i3 und xi3 ∈ U3 . Also (i1 , U1 ), (i2 , U2 ) (i3 , U3 ), und wir sehen, dass (K, ) eine gerichtete Menge
ist.
Definieren wir i(i, U) = i, so ist x(i,U) = xi(i,U) , (i, U) ∈ K ein Teilnetz von (xi )i∈I , das gegen x konvergiert.
❑
12.2.14 Lemma. Ein Netz (xi )i∈I konvergiert genau dann gegen x, wenn x Häufungspunkt eines jeden Teilnetzes von (xi )i∈I
ist.
Beweis. Sei (I, ) eine gerichtete Menge.

Konvergiert (xi )i∈I gegen x, so auch jedes Teilnetz, und daher ist x Häufungspunkt dieses Teilnetzes.
Ist (xi )i∈I nicht gegen x konvergent, so gibt es eine Umgebung U von x, sodass
∀i ∈ I∃ j ∈ I, i j : x j < U.
Betrachte die gerichtete Menge (K, |K×K ) mit K = {i ∈ I : xi < U}. Dann hat das Teilnetz (xi )i∈K den Punkt x sicherlich
nicht als Häufungspunkt.
❑
12.3 Stetige Abbildungen

12.3.1 Definition. Seien (X, T ) und (Y, O) topologische Räume. Weiters sei f eine
Abbildung, f : X → Y. Ist x ∈ X, so heißt f stetig im Punkt x, wenn gilt:
(C x ) Für alle V ∈ U( f (x)) existiert ein U ∈ U(x) mit f (U) ⊆ V .
Die Abbildung f heißt stetig, wenn sie in jedem Punkt x ∈ X stetig ist.
12.3.2 Beispiel.
Sei (X, T ) topologischer Raum. Die Abbildung idX : (X, T ) → (X, T ) ist stetig.
Denn ist x ∈ X und V ∈ U(idX x) = U(x), so wähle U := V ∈ U(x), dann gilt
idX (U) = V ⊆ V.
Seien (X, T ), (Y, O) topologische Räume und sei a ∈ Y. Die Abbildung
(
(X, T ) → (Y, O)
fa :
x 7→ a
ist stetig. Denn ist x ∈ X und V ∈ U( fa (x)) = U(a), so wähle U := X ∈ U(x),
dann gilt fa (U) = {a} ⊆ V.
Sei X versehen mit der diskreten Topologie T = P(X), sei (Y, O) irgendein topo-
logischer Raum und sei f : (X, P(X)) → (Y, O) irgendeine Abbildung. Dann ist
f stetig. Denn sei x ∈ X, V ∈ U( f (x)). Da {x} offen in der diskreten Topologie
ist, ist {x} ∈ U(x). Wähle U := {x}, dann gilt f (U) = { f (x)} ⊆ V.
Zieht man in Betracht, dass in einem metrischen Raum die ǫ-Kugeln eine Umge-
bungsbasis um einen Punkt bilden, so ist das im folgenden Lemma auftretende Kriteri-
um (ii) für die Stetigkeit eine unmittelbare Verallgemeinerung des wohlbekannten ’ǫ’ -
’δ’ Kriteriums.
Bei Funktionen auf metrischen Räumen haben wir auch gesehen, dass die Stetigkeit
in einem Punkt x auch durch xn → x ⇒ limn→∞ f (xn ) = f (x), charakterisiert werden
kann. Man hat in allgemeienen topologischen Räumen eine ähnliche Charakterisierung,
wobei man jedoch nicht mehr mit Folgen das Auslangen findet, siehe (iii) im folgenden
Lemma.
12.3.3 Lemma. Seien (X, T ), (Y, O) topologische Räume, f : X → Y, x ∈ X, und seien
W(x) bzw. W( f (x)) beliebige Umgebungsbasen von x in (X, T ) bzw. von f (x) in (Y, O).
Dann sind folgende Aussagen äquivalent.
(i) f ist im Punkt x stetig.
(ii) Für jedes V ∈ W( f (x)) existiert ein U ∈ W(x) mit f (U) ⊆ V.
(iii) Für jedes gegen x konvergente Netz (xi )i∈I in X folgt, dass das Netz ( f (xi ))i∈I
gegen f (x) konvergiert.
Beweis.
(i) ⇒ (ii) : Sei V ∈ W( f (x)). Dann ist auch V ∈ U( f (x)) und daher gibt es Ũ ∈ U(x)
mit f (Ũ) ⊆ V (vgl. (C x )). Nun ist W(x) Umgebungsbasen von x. Also gibt es ein
U ∈ W(x) mit U ⊆ Ũ und daher f (U) ⊆ V.
(ii) ⇒ (i) : Sei V ∈ U( f (x)), und wähle W ∈ W( f (x)) mit W ⊆ V. Dann gibt es
U ∈ W(x) ⊆ U(x) mit f (U) ⊆ W ⊆ V, also gilt (C x ).
(i) ⇒ (iii) : Konvergiert (xi )i∈I gegen x, und ist V ∈ U( f (x)), so existiert wegen der
Stetigkeit ein U ∈ U(x) mit f (U) ⊆ V. Wegen der Konvergenz findet man ein
ein i0 ∈ I, sodass i i0 ⇒ xi ∈ U und damit auch f (xi ) ∈ V. Also konvergiert
( f (xi ))i∈I gegen f (x).
(iii) ⇒ (i) : Wäre f nicht bei x stetig, so gäbe es eine Umgebung V von f (x), sodass
f (U) ∩ V c , ∅, oder äquivalent U ∩ f −1 (V c ) , ∅, für alle U ∈ U(x). Nach
Lemma 12.2.6 gibt es ein Netz (xi )i∈I in f −1 (V c ), welches gegen x konvergiert.

Andererseits ist aber f (xi ) ∈ V c für alle i ∈ I, womit f (xi ) i∈I sicherlich nicht
gegen f (x) konvergieren kann.
12.3. STETIGE ABBILDUNGEN 145
❑
12.3.4 Bemerkung. Mit einer Konstruktion ähnlich wie in Bemerkung 12.2.10 sieht
man, dass, wenn X das erste Abzählbarkeitsaxiom erfüllt - daher insbesondere in me-
trischen Räumen, die Stetigkeit bei x mit Hilfe von Folgen dadurch charakterisiert wer-
den, dass xn → x ⇒ limn→∞ f (xn ) = f (x).
12.3.5 Satz. Seien (X, T ), (Y, O) topologische Räume, und sei f : X → Y. Dann sind
folgende Aussagen äquivalent:
(i) f ist stetig.
(ii) f −1 (O) ∈ T für jede offene Menge O ∈ O, d.h. die Urbilder von offenen Mengen
sind offen.
(iii) Die Urbilder von abgeschlossenen Mengen sind abgeschlossen.
(iv) Für jede Teilmenge B ⊆ X gilt f (B) ⊆ f (B).
Beweis.
(i) ⇒ (ii) : Sei O ∈ O. Ist x ∈ f −1 (O), so gilt f (x) ∈ O. Da O offen ist, gilt O ∈ U( f (x)),
und daher gibt es eine Umgebung U ∈ U(x) mit f (U) ⊆ O, d.h. U ⊆ f −1 (O).
Mit Lemma 12.1.11 folgt f −1 (O) ∈ T .
(ii) ⇒ (iii) : Sei A abgeschlossene Teilmenge von Y. Dann ist (A)c offen und wegen
(ii) gilt h ic
f −1 (A) = f −1 (Ac ) ∈ T .
Also ist f −1 (A) abgeschlossen.

(iii) ⇒ (iv) : Wegen f (B) ⊇ f (B) gilt gilt f −1 ( f (B)) ⊇ B. Da nach Voraussetzung
f −1 ( f (B)) abgeschlossen in (X, T ) ist, folgt f −1 ( f (B)) ⊇ B und daher f (B) ⊇
f (B).
(iv) ⇒ (i) : Sei x ∈ X und V ∈ U( f (x)) gegeben. Wir müssen ein U ∈ U(x) mit f (U) ⊆
V konstruieren. Dazu setze man W := f −1 (V). Dann gilt f (W c ) = f ( f −1 (V c )) ⊆
V c und daher f (W c ) ⊆ f (W c ) ⊆ V c .
Da V ∈ U( f (x)) und V ∩ V c = ∅ folgt aus Proposition 12.2.7, dass f (x) < V c und
wegen obiger Inklusion x < W c . Wir sehen, dass x ∈ (W c )c = W ◦ =: U ∈ U(x),
wobei U ⊆ W = f −1 (V), und somit f (U) ⊆ f (W) ⊆ V.
❑
−1
Bedingung (ii) in Satz 12.3.5 lässt sich kurz durch f (O) ⊆ T beschreiben, wobei
wir für eine Abbildung f : X → Y die Schreibweise
n o
f −1 (C) := f −1 (C) : C ∈ C ⊆ P(X) ,
und später auch n o

f (B) := f (B) : B ∈ B ⊆ P(Y) ,
für B ⊆ P(X) bzw. C ⊆ P(Y) verwenden.
12.3.6 Lemma. Seien (X, T ) und (Y, O) topologische Räume, wobei (Y, O) Hausdorff
ist. Ist D eine dichte Teilmenge von X, und sind f, g zwei stetige Funktionen von X nach
Y, sodass f |D = g|D , dann folgt f = g.
Beweis. Angenommen f (x) , g(x) für ein x ∈ X \ D. Wegen der Hausdorff-
Voraussetzung gibt es O1 , O2 ∈ O mit O1 ∩ O2 = ∅ und f (x) ∈ O1 , g(x) ∈ O2 . Da
f und g stetig sind, gibt es U1 , U2 ∈ T , x ∈ U1 ∩ U2 , sodass f (U1 ) ⊆ O1 , g(U2 ) ⊆ O2 .
Insbesondere ist U1 ∩ U2 eine nichtleere offene Menge, und hat daher einen nichtleeren
Schnitt mit D. Wir erhalten den Widerspruch:
∅ , f (U1 ∩ U2 ∩ D) = g(U1 ∩ U2 ∩ D) ⊆ O1 ∩ O2 = ∅.
Alternativ kann man sich so argumentieren, dass es zu x ∈ X \ D wegen Proposition 12.2.7 ein gegen x konvergentes

Netz (xi )i∈I in D gibt. Die Netze f (xi ) i∈I und g(xi ) i∈I konvergieren wegen Lemma 12.3.3 gegen f (x) bzw. g(x).

Andererseits sind diese Netze f (xi ) i∈I und g(xi ) i∈I identisch und haben wegen Lemma 12.1.18 den selben Grenzwert;
also f (x) = g(x).
❑
12.3.7 Lemma. Seien (X, T ), (Y, O), (Z, R) drei topologische Räume und seinen f :
X → Y, g : Y → Z Funktionen. Weiters sei x ∈ X. Ist f stetig im Punkt x und ist g stetig
im Punkt f (x), so ist g ◦ f stetig im Punkt x. Insbesondere ist g ◦ f stetig, wenn f, g es
sind.
Beweis. Sei W ∈ U((g ◦ f )(x)). Da g stetig im Punkt f (x) ist, gibt es V ∈ U( f (x))
mit g(V) ⊆ W. Da f stetig im Punkt x ist, gibt es U ∈ U(x) mit f (U) ⊆ V. Insgesamt
erhalten wir
(g ◦ f )(U) = g( f (U)) ⊆ g(V) ⊆ W .
❑
12.3.8 Definition. Seien (X, T ) und (Y, O) topologische Räume, und sei f : X → Y.
Dann heißt f ein Homöomorphismus von (X, T ) nach (Y, O), wenn f bijektiv ist und
wenn gilt f (T ) = O. Zwei topologische Räume (X, T ) und (Y, O) heißen homöomorph,
wenn es einen Homöomorphismus von (X, T ) nach (Y, O) gibt.
12.3.9 Lemma.
(i) Sei f : (X, T ) → (Y, O) eine bijektive Abbildung. Dann ist f genau dann
Homöomorphismus, wenn sowohl f als auch f −1 stetig sind.
(ii) Sind f : (X, T ) → (Y, O), g : (Y, O) → (Z, R) Homöomorphismen, so ist auch
g ◦ f : (X, T ) → (Z, R) ein Homöomorphismus.
(iii) Die Abbildung idX : (X, T1 ) → (X, T2 ) ist ein Homöomorphismus genau dann
wenn T1 = T2 .
Beweis.
(i) Ist f bijektiv, so ist f (T ) = O genau dann wenn f −1 (O) ⊆ T und f (T ) ⊆ O.
(ii) Folgt unmittelbar aus (i) und Lemma 12.3.7.
(iii) Das folgt unmittelbar aus idX (T1 ) = T1 .
12.4. BASIS, SUBBASIS 147
❑
12.3.10 Beispiel.
Ist eine gegebene Menge Y mit zwei verschiedenen Metriken d1 und d2 versehen,
die aber äquivalent sind, dh. es gibt α, β > 0, sodass für alle x, y ∈ Y
αd1 (x, y) ≤ d2 (x, y) ≤ d1 (x, y),
so zeigt man leicht mit Hilfe der Charakterisierung der Stetigkeit in metrischen
Räumen durch Folgen (siehe Proposition 6.1.4), dass dann idY : (Y, d1 ) → (Y, d2 )
und idY : (Y, d2 ) → (Y, d1 ) beide stetig sind. Also induzieren diese Metriken die
selbe Topologie, dh. T (d1 ) = T (d2 ).
Sei X ein Vektorraum versehen mit zwei Normen k.k1 und k.k2 . Sind diese äqui-
valent (vgl. Definition 9.2.1), so sieht man sofort, dass die jeweils induzierten
Metriken ebenfalls äquivalent sind. Somit stimmen die Topologien, die von den
zu k.k1 und k.k2 gehörigen Metriken erzeugt werden, überein.
Man betrachte C versehen mit der euklidischen Metrik d2 und mit der chordalen
Metrik χ. Es ist wohlbekannt, dass zn → z in C bezüglich d2 genau dann, wenn
zn → z bezüglich χ. Also ist die Abbildung idC als Abbildung von (C, d2 ) nach
(C, χ) und auch als Abbildung von (C, χ) nach (C, d2 ) stetig. Somit gilt T (d2 ) =
T (χ).
Man betrachte einerseits C ∪ {∞} versehen mit der chordalen Metrik χ. Ande-
rerseits sei S die Oberfläche der Kugel mit Durchmesser 1 im R3 , die so auf
die Ebene R2 zum liegen kommt, dass Ihr Südpol den Nullpunkt berührt. Wir
versehen S mit d2 , dh.
q
d2 ((α, β, γ)T , (ξ, η, ζ)T ) = (α − ξ)2 + (β − η)2 + (γ − ζ)2 .
Die Stereographische Projektion σ : S → C ∪ {∞} ist bekannterweise eine

Isometrie, dh. χ(σ(x), σ(y)) = d2 (x, y). Also sind σ und σ−1 stetig, und σ ist
somit ein Homöomorphismus.
12.4 Basis, Subbasis

Wir betrachten nun eine feste Menge X und die Menge x(X) aller möglichen Topo-
logien auf X. Die Elemente T von x(X) sind also Teilmengen von P(X), und daher
x(X) ⊆ P(P(X)).
Wir sagen eine Topologie T1 ist gröber als eine Topologie T2 bzw. T2 feiner als
T1 , wenn T1 ⊆ T2 . Aus Satz 12.3.5 erkennt man leicht, dass T1 genau dann gröber als
T2 ist, wenn id : (X, T2 ) → (X, T1 ) stetig ist.
12.4.1 Lemma. Ist Ti , i ∈ I, eine Familie von Topologien, so ist es auch ∩i∈I Ti . In der
Tat, ist dieser Schnitt die feinste Topologie, die gröber als alle Ti ist.
Für ein Mengensystem C ⊆ P(x) ist
\
T (C) = {T ∈ x(X) : C ⊆ T } (12.7)
die gröbste Topologie, die C enthält.

Beweis. Wir müssen nachweisen, dass ∩i∈I Ti die Axiome (O1) - (O3) erfüllt. Die
Mengen ∅, X sind in allen Ti enthalten, da diese ja Topologien sind. Also sind diese
Mengen auch im Schnitt enthalten. Es folgt (O1).
Aus O1 , O2 ∈ ∩i∈I Ti folgt O1 , O2 ∈ Ti , i ∈ I, und somit O1 ∩ O2 ∈ Ti , i ∈ I. Also
O1 ∩ O2 ∈ ∩i∈I Ti , und daher (O2).
Sind O j ∈ ∩i∈I Ti , j ∈ J, so folgt für jedes i ∈ I, dass O j ∈ Ti , j ∈ J, und weiter
S S
j∈J O j ∈ Ti . Nun gilt das wieder für alle i ∈ I, also j∈J O j ∈ ∩i∈I Ti , und somit (O3).
Klarerweise ist ∩i∈I Ti in allen Ti enthalten. Ist andererseits T ⊆ Ti , i ∈ I, so auch
T ⊆ ∩i∈I Ti . Also ist der Schnitt die feinste in allen Ti enthaltene Topologie.
Nun enthält der Schnitt T (C) von Mengensystemen, die alle C enthalten, ebenfalls
C. Ist andererseits T ⊇ C, so gehört T zur Menge auf der linken Seite von (12.7) und
daher T ⊇ T (C). Also ist T (C) die gröbste Topologie, die C enthält.
❑
12.4.2 Definition. Sei (X, T ) ein topologischer Raum. Ein Mengensystem B ⊆ P(X)
heißt Basis von T , wenn B ⊆ T und wenn es für alle O ∈ T und x ∈ O ein B ∈ B mit
x ∈ B ⊆ O gibt.
Man sagt ein topologischer Raum (X, T ) erfüllt das zweite Abzählbarkeitsaxiom (ABII), wenn T eine abzählbare Basis
besitzt.
Ein Mengensystem C ⊆ P(X) heißt Subbasis von T , wenn C ⊆ T und wenn es für
alle O ∈ T , O , X, und x ∈ O endlich viele C1 , . . . , Cn ∈ C mit x ∈ C1 ∩ · · · ∩ Cn ⊆ O
gibt.
12.4.3 Bemerkung. Sei O ⊆ X und B ⊆ P(X). Die Tatsache, dass es zu jedem x ∈ O

ein B ∈ B gibt mit x ∈ B ⊆ O, kann man kurz auch als
[
O= B
B∈B, B⊆O
schreiben.
12.4.4 Bemerkung. Offensichtlich ist C ⊆ P(X) genau dann eine Subbasis von T , wenn
das Mengensystem E aller endlichen Schnitte von C samt X, also
n\
n
E := {X} ∪ Ci : n ∈ N, C1 , . . . , Cn ∈ C}
i=1
eine Basis von T abgibt. Klarerweise enthält E das Mengensystem C.

12.4.5 Beispiel.
Ist (Y, d) ein metrischer Raum, so folgt aus der Definition der von d induzierten
Topologie T (d) sofort, dass
{Uǫ (x) : x ∈ Y, ǫ > 0}
eine Basis von T (d) ist.
Die Euklidische Topologie T (d2 ) auf R hat die Menge aller offenen Intervalle
{(a, b) ⊆ R : a, b ∈ R, a < b}
12.4. BASIS, SUBBASIS 149
als Basis. Da man zu a < x < b aus R wegen der Dichteeigenschaft von Q (siehe
Satz 2.6.3) sicherlich s, t ∈ Q findet, sodass a < s < x < t < b, ist auch
{(s, t) ⊆ R : s, t ∈ Q, s < t}
eine Basis von T (d2 ). Also ist (ABII) erfüllt.

Wegen (a, b) = (a, +∞) ∩ (−∞, b) folgt damit unmittelbar, dass
{(a, +∞) ⊆ R : a ∈ R} ∪ {(−∞, b) ⊆ R : b ∈ R}
eine Subbasis von T (d2 ) auf R ist.

Betrachte den R p versehen mit d∞ . Da dort für die ǫ-Kugeln
Uǫ (x) = (ξ1 − ǫ, ξ1 + ǫ) × · · · × (ξ p − ǫ, ξ p + ǫ)
gilt, wobei x = (ξ j ) pj=1 , folgt, dass die Menge aller p-dimensionalen Quader
{(a1 , b1 ) × · · · × (a p , b p ) : a j , b j ∈ R, a j < b j , j = 1, . . . , p}
eine Basis von T (d∞ ) abgibt. Wegen T (d∞ ) = T (d2 ) (siehe Beispiel 12.3.10)
sind diese trivialerweise auch Basis von T (d2 ).
Ähnlich wie für R sieht man, dass auch
{(s1 , t1 ) × · · · × (s p , t p ) : s j , t j ∈ Q, s j < t j , j = 1, . . . , p}
eine abzählbare Basis von T (d2 ) ist.

12.4.6 Satz. Ist B ⊆ P(X) Basis einer gegebenen Topologie T auf X, so erfüllt B
(B1) Ist B1 , B2 ∈ B, x ∈ B1 ∩ B2 , so existiert B3 ∈ B mit x ∈ B3 ⊆ B1 ∩ B2 .
S
(B2) B∈B B = X.
Außerdem ist T die gröbste Topologie, die B enthält, dh. T = T (B).
Ist C ⊆ P(X) Subbasis einer gegebenen Topologie T auf X, so ist T die gröbste
Topologie, die C enthält, dh. T = T (C).
Beweis. Wegen B ⊆ T muss T (B) ⊆ T . Ist andererseits O ∈ T , so folgt aus der
Tatsache, dass B eine Basis ist, zusammen mit Bemerkung 12.4.3
[
O= B. (12.8)
B∈B, B⊆O
Wegen B ⊆ T (B) und wegen (O3) ist jede dieser Mengen auch in T (B), dh. T ⊆ T (B).
Aus (12.8) angewandt auf O = X sieht man unmittelbar, dass (B2) erfüllt ist.
S
Für B1 , B2 ∈ B ⊆ T gilt B1 ∩ B2 ∈ T . Aus B1 ∩ B2 = {B ∈ B : B ⊆ B1 ∩ B2} folgt
für jedes x ∈ B1 ∩ B2 die Existenz eines B3 ∈ B mit x ∈ B3 ⊆ B1 ∩ B2 . Also gilt auch
(B1).
Ist schließlich C ⊆ P(X) eine Subbasis von T , so folgt aus Bemerkung 12.4.4, dass
E eine Basis von T ist, und daher T = T (E). Wegen C ⊆ E gilt T (C) ⊆ T (E).
Ist andererseits E ∈ E, so gilt E = X oder E = C1 ∩ · · · ∩ Cn für
C1 , . . . , Cn ∈ C ⊆ T (C). Aus (O1) bzw. (O2) folgt dann E ∈ T (C), und daher
E ⊆ T (C). Somit gilt auch T (E) ⊆ T (C), und insgesamt T = T (E) = T (C).
❑
12.4.7 Lemma. Seien (X, T ) und (Y, O) topologische Räume und f : X → Y eine
Abbildung. Ist C eine Subbasis von O, so ist f genau dann stetig, wenn f −1 (C) ⊆ T .
Beweis. Aus der Stetigkeit folgt unmittelbar f −1 (C) ⊆ f −1 (O) ⊆ T .
Ist umgekehrt f −1 (C) ⊆ T , so prüft man leicht nach, dass
O′ := {O′ ⊆ Y : f −1 (O′ ) ∈ T }
die Axiome (O1) - (O3) erfüllt, dh. eine Topologie ist. Da laut Voraussetzung C ⊆ O′ ,
muss auch O = T (C) ⊆ O′ , und daher f −1 (O) ∈ T für alle O ∈ O.
❑
Wir wollen nun den umgekehrten Weg wie in Satz 12.4.6 gehen.
12.4.8 Satz. Erfüllt B ⊆ P(X) die Axiome (B1) und (B2), so ist B eine Basis von T (B).
Außerdem stimmt T (B) mit dem System T aller Mengen O ⊆ X der Bauart
[
O= B
B∈V
mit einem (von O abhängigen) Teilsystem V ⊆ B überein; also T (B) = T , wobei

[
T = {O ⊆ X : ∃V ⊆ B, O = B}. (12.9)
B∈V
Ist C ⊆ P(X), so ist C eine Subbasis von T (C). Außerdem stimmt T (C) mit dem
System [
{O ⊆ X : ∃V ⊆ E, O = B} (12.10)
B∈V
überein, wobei
n\
n
E := {X} ∪ Ci : n ∈ N, C1 , . . . , Cn ∈ C}.
i=1
die Axiome (B1) und (B2) erfüllt.
Beweis.
Wir zeigen zunächst, dass T definiert in (12.9) eine Topologie auf X ist. Zunächst
ist [
∅= B∈T,
B∈∅
und wegen (B2) [
X= B ∈ T.
B∈B
Also gilt (O1). Die Bedingung (O3) folgt aus
[ [ [
B = B.
S
i∈I B∈Vi B∈ i∈I Vi
S S
Es bleibt (O2) zu zeigen. Seien also O1 = B∈V1 B, O2 = B∈V2 B gegeben.
Jedes x ∈ O1 ∩ O2 liegt somit in einem B1 ∈ V1 und einem B2 ∈ V2 . Nach (B1)
gibt es ein B ∈ B mit x ∈ B ⊆ B1 ∩ B2 ⊆ O1 ∩ O2 . Wir erhalten (vgl. Bemerkung
12.4.3) [
O1 ∩ O2 = B,
B∈V
wobei V := {B ∈ B : B ⊆ O1 ∩ O2 }. Also O1 ∩ O2 ∈ T .
12.5. INITIALE TOPOLOGIE UND FINALE TOPOLOGIE 151
Offensichtlich gilt B ⊆ T . Ist x ∈ O ∈ T , so folgt aus (12.9), dass x ∈ B ⊆ O für

ein gewisses B ∈ B. Also ist B Basis von T , und wegen Satz 12.4.6 ist damit T
die gröbste Topologie T (B), die B umfasst..
Ist C ⊆ P(X), so sieht man unmittelbar, dass X ∈ E und dass mit E1 , E2 ∈ E auch
E1 ∩ E2 ∈ E. Insbesondere erfüllt E (B1) und (B2). Nach dem oben gezeigten
ist E Basis von T (E), wobei T (E) mit der Topologie in (12.10) übereinstimmt.
Wegen Bemerkung 12.4.4 bedeutet das, dass C eine Subbasis von T (E) ist, und
aus Satz 12.4.6 folgt damit schließlich T (C) = T (E).
12.5 Initiale Topologie und Finale Topologie

Mit dem Konzept Basis und Subbasis können wir auf einer gegebenen Menge ausge-
zeichnete Topologien definieren, die gewisse Eigenschaften haben.
12.5.1 Satz. Seien X eine Menge, (Yi , Ti ), i ∈ I, topologische Räume und fi : X → Yi ,
i ∈ I, Abbildungen. Dann existiert genau eine Topologie T auf X mit der Eigenschaft
(IN1 ) T ist die gröbste Topologie auf X, sodass alle Abbildungen fi : (X, T ) →
(Yi , Ti ), i ∈ I, stetig sind.
Diese Topologie heißt initiale Topologie bezüglich der fi . Für sie gilt
S
(IN2 ) i∈I fi−1 (Ti ) ist eine Subbasis von T ,
und
(IN3 ) Ist (Y, O) ein beliebiger topologischer Raum und f : Y → X, so ist f : (Y, O) →
(X, T ) genau dann stetig, wenn alle Abbildungen
fi ◦ f : (Y, O) → (Yi , Ti ), i ∈ I ,
stetig sind.
Beweis.
Ist T ′ eine beliebige Topologie auf X, so ist fi : (X, T ′ ) → (Xi , Ti ) genau dann
stetig, wenn fi−1 (Ti ) ⊆ T ′ . Also sind alle fi genau dann stetig, wenn
[
fi−1 (Ti ) ⊆ T ′ . (12.11)
i∈I
S
Nach Lemma 12.4.1 gibt es eine gröbste Topologie T = T ( i∈I fi−1 (Ti )), die
(12.11) erfüllt. Damit ist aber auch T die gröbste Topologie, sodass alle fi stetig
sind. Also gilt (IN1 ).
S
Wegen Satz 12.4.8 ist i∈I fi−1 (Ti ) Subbasis von T , und es gilt auch (IN2 ).
Sei f : (Y, O) → (X, T ), wobei T die initiale Topologie der fi , i ∈ I, ist. Im Falle
der Stetigkeit von f sind auch alle fi ◦ f : (Y, O) → (Yi , Ti ) als Zusammensetzung
stetiger Abbildungen stetig.
Seien umgekehrt alle fi ◦ f stetig, d.h. es gelte ( fi ◦ f )−1 (Ti ) ⊆ O. Dann folgt
f −1 ( fi−1 (Ti )) ⊆ O und damit
[
f −1 ( fi−1 (Ti )) ⊆ O.
i∈I
S
Da i∈I fi−1 (Ti ) eine Subbasis von T ist, folgt aus Lemma 12.4.7, dass f stetig
ist. Die initiale Topologie T hat also die Eigenschaft (IN3 ).
❑
′
12.5.2 Bemerkung. Die initiale Topologie T ist in der Tat die einzige Topologie T mit der Eigenschaft (IN3 ). Um das
einzusehen, sei T ′ eine weiters Topologie auf X mit der Eigenschaft (IN3 ).
Da die Abbildung idX : (X, T ′ ) → (X, T ′ ) trivialerweise stetig ist, folgt aus (IN3 ) angewandt auf T ′ , dass alle fi ◦ idX :
(X, T ′ ) → (Yi , Ti ) stetig sind. Aus (IN1 ) folgt T ⊆ T ′ .
Für idX : (X, T ) → (X, T ′ ) sind andererseits alle Abbildungen fi ◦ idX = fi : (X, T ) → (Yi , Ti ) stetig. Mit (IN3 )
angewandt auf T ′ folgt die Stetigkeit von id X : (X, T ) → (X, T ′ ), und daher T ′ ⊆ T . Insgesamt ist T ′ = T .
12.5.3 Lemma. Mit der Notation aus Satz 12.5.1 sei (x j ) j∈J ein Netz in X. Dieses

konvergiert bzgl. T gegen ein x ∈ X genau dann, wenn fi (x j ) j∈J für alle i ∈ I gegen
fi (x) konvergiert.
Beweis. Konvergiert (x j ) j∈J gegen x bzgl. T , so folgt aus der Stetigkeit der fi mit

Lemma 12.3.3, dass fi (x j ) j∈J gegen fi (x) konvergiert.

Gelte umgekehrt, dass fi (x j ) j∈J gegen fi (x) für alle i ∈ I konvergiert. Für ein
U ∈ U(x) mit oBdA. U , X und O ∈ T mit x ∈ O ⊆ U folgt aus der Tatsache,
S
dass i∈I fi−1 (Ti ) eine Subbasis von T ist (vgl. (IN2 ) aus Satz 12.5.1), und Definition
12.4.2, dass
x ∈ fi−1
1
(O1 ) ∩ · · · ∩ fi−1
m
(Om ) ⊆ O,
wobei i1 , . . . , im ∈ I, O1 ∈ Ti1 , . . . , Om ∈ Tim . Also folgt fik (x) ∈ Ok , k = 1, . . . , m, und
laut Voraussetzung gibt es Indizes j1 , . . . , jm , ∈ J, sodass j jk ⇒ fik (x j ) ∈ Ok , k =
1, . . . , m. Ist nun j0 ∈ J derart, dass j0 jk , k = 1, . . . , m, so folgt für j j0 jedenfalls
fik (x j ) ∈ Ok , k = 1, . . . , m, und daher
x j ∈ fi−1
1
(O1 ) ∩ · · · ∩ fi−1
m
(Om ) ⊆ O ⊆ U.
❑
Die Konstruktion der Initialen Topologie ist assoziativ.
12.5.4 Korollar. Seien X, Yi , i ∈ I, topologische Räume und fi : X → Yi , i ∈ I, Ab-

bildungen. Weiters seien zu jedem i ∈ I eine Indexmenge Ji und topologische Räume
(Zi, j , Ti, j ) und Abbildungen gi, j : Yi → Zi, j gegeben. Versieht man Yi mit der initialen
Topologie Ti bezüglich der Abbildungen gi, j , j ∈ Ji , so stimmt die initiale Topologie
T1 auf X bezüglich der Abbildungen fi : X → Yi , i ∈ I, mit der initialen Topologie T2
auf X bezüglich der Abbildungen gi, j ◦ fi : X → Zi, j , i ∈ I, j ∈ Ji , überein.
Beweis. Wir versehen die Xi mit der initialen Topologie Ti bezüglich der Abbildungen
gi, j , j ∈ Ji . Ist T irgendeine Topologie auf X, so ist wegen (IN3 ) angewandt auf die
(Xi , Ti ) die Tatsache, dass alle Abbildungen fi : X → Yi , i ∈ I, stetig sind, dazu
äquivalent, dass alle Abbildungen gi, j ◦ fi : X → Zi, j , i ∈ I, j ∈ Ji , stetig sind.
Also stimmt die gröbste aller Topologien, die die erste Bedingung erfüllen, -
wegen (IN1 ) ist das T1 - mit der gröbsten aller Topologien, die die zweite Bedingung
erfüllen, - wegen (IN1 ) ist das T2 - überein.
❑
12.5.5 Beispiel. Sei (Y, T ) ein topologischer Raum und X ⊆ Y. Weiters sei ι : X →
Y die kanonische Einbettung, ι(x) = x. Die initiale Topologie auf X bezüglich der
Abbildung ι heißt die Spurtopologie von T auf X und wird bezeichnet als T |X . Man
spricht von (X, T |X ) als einem Teilraum von (Y, T ). Wegen Satz 12.5.1 ist
ι−1 (T ) = {O ∩ X : O ∈ T } ⊆ P(X)
eine Subbasis für T |X . Nun erfüllt diese Menge selbst schon (O1) − (O3), d.h. es gilt
T |X = {O ∩ X : O ∈ T } .
Damit erhält man auch, dass das System A|X der in (X, T |X ) abgeschlossenen Mengen
gegeben ist durch
A|X = {A ∩ X : A ∈ A} , (12.12)
und dass der Umgebungsfilter U|X (x) eines Elementes x ∈ X bezüglich T |X genau
U|X (x) = {U ∩ X : U ∈ U(x)}
ist. Erfüllt (Y, T ) das Axiom (T 2), so folgt somit, dass auch (X, T |X ) dieses Axiom
erfüllt.
Weiters folgt aus (12.12) für A ⊆ X
T |X T
A = A ∩X, (12.13)
und aus (IN3 ) folgt, dass eine Funktion f : (Y, O) → (X, T |X ) genau dann stetig ist,
wenn f : (Y, O) → (Y, T ) stetig ist.
Ist (x j ) j∈J ein Netz in X und x ∈ X, so erkennt man aus der letzten Behauptung von
Satz 12.5.1, dass (x j ) j∈J genau dann gegen x bzgl. T konvergiert, wenn (x j ) j∈J bzgl.
T |X gegen x konvergiert.
Ist schließlich X ⊆ Z ⊆ Y, so gilt wegen Korollar 12.5.4
T |X = (T |Z )|X . (12.14)
12.5.6 Beispiel. Sei (Y, d) ein metrischer Raum, und sei X ⊆ Y versehen mit der Ein-
schränkung von d|X×X . Klarerweise ist (X, d|X×X ) ein metrischer Raum.
Die von d|X×X auf X erzeugte Topologie ist genau die Spurtopologie, die von T (d)
auf X induziert wird:
Ist O ∈ T (d) und x ∈ O ∩ X, so gibt es ein ǫ > 0 mit Uǫ (x) ⊆ O. Daraus folgt, dass
die ǫ-Kugel Uǫ (x) ∩ X um x bezüglich d|X×X in O ∩ X enthalten ist. Also ist jede Menge
aus T (d)|X offen bezüglich d|X×X .
Ist umgekehrt P ∈ T (d|X×X ), so wähle man für jedes x ∈ P ein ǫ x > 0, sodass die
ǫ x -Kugel X ∩ Uǫx (x) in X in P enthalten ist. Es folgt
[ [
P= X ∩ Uǫx (x) = X ∩ Uǫx (x).
x∈P x∈P
Somit ist P der Schnitt einer in Y offenen Menge und X, also P ∈ T (d)|X .
Ein unscheinbares aber recht oft anwendbares Ergebnis ist folgendes.
12.5.7 Lemma. Seien (X, T ), (Y, O) topologische Räume und A, B ⊆ X mit A ∪ B = X, wobei entweder A und B beide
abgeschlossen oder beide offen sind.
Sind f : A → Y und g : B → Y zwei stetige Funktionen, wobei A bzw. B beide mit der Spurtopologie (vgl. Beispiel
12.5.5) versehen sind, sodass f und g auf A ∩ B übereinstimmen, dann ist auch die Funktion f ∪ g : X → Y 3 stetig.
Beweis. Seien A, B beide abgeschlossen. Der offene Fall ist ähnlich zu beweisen. Ist F ⊆ Y abgeschlossen, so ist
( f ∪ g)−1 (F) = f −1 (F) ∪ g−1 (F).
Wegen der Stetigkeit von f : A → Y ist f −1 (F) abgeschlossen in der Spurtopologie T |A , und somit von der Bauart C ∩ A
für eine in X abgeschlossene Menge C. Als Schnitt zweier in X abgeschlossener Mengen ist f −1 (F) in X abgeschlossen.
Genauso zeigt man, dass g−1 (F) in X abgeschlossen ist. Als Vereinigung zweier abgeschlossener Mengen ist dann
auch ( f ∪ g)−1 (F) abgeschlossen. Da F beliebig war, ist damit f ∪ g stetig.
❑
Q
12.5.8 Definition. Seien (Xi , Ti ), i ∈ I, topologische Räume, und sei X := i∈I Xi . Die
initiale Topologie auf X bezüglich der Familie πi : X → Xi der kanonischen Projektio-
nen

πi (xk )k∈I = xi
Q
heißt die Produkttopologie der Ti auf X und wird bezeichnet mit i∈I Ti .
Für ein O ⊆ Xi gilt Y
π−1
i (O) = Ok
k∈I
wobei Ok = Xk , k , i, und Oi = O ist. Wieder mit (IN2 ) und Bemerkung 12.4.4 erhält
man daraus, dass die Mengen der Gestalt
Y
Ok ,
k∈I
wobei Ok ∈ Tk , k ∈ I, und für alle k ∈ I bis auf endlich viele Ok = Xk gilt, eine Basis
Q
für i∈I Ti bilden.
Q
Ist i ∈ I fest, so gilt klarerweise πi ( k∈I Ok ) = Oi . Also ist das Bild unter πi
Q
einer jeden Menge aus dieser Basis offen in (Xi , Ti ). Da jede offene Menge in k∈I Tk
Vereinigung von Basismengen ist, folgt
12.5.9 Proposition. Die kanonischen Projektionen πi : X → Xi bilden offene Menge
Q
in k∈I Tk auf offene Mengen in Ti ab, also sind sie offene Abbildungen.
Weiters sieht man leicht mit Hilfe obigen konstruierter Basis, dass für einen Punkt
(xi )i∈I ∈ X die Mengen Y
Ui ,
i∈I
wobei Ui ∈ U(xi ), i ∈ I, und Ui = Xi für alle bis auf endlich viele i, eine Umgebungs-
Q
basis bezüglich i∈I Ti bilden.
Q
Aus Lemma 12.5.3 folgt, dass für ein Netz (x j ) j∈J und einem Punkt x aus i∈I Xi ,
d.h. x j = (ξ j,i )i∈I und x = (ξi )i∈I mit ξ j,i , ξi ∈ Xi ,
j∈J j∈J
x j −→ x ⇔ ∀i ∈ I : ξ j,i −→ ξi . (12.15)
3 Das ist die Funktion, die auf A mit f und auf B mit g übereinstimmt.
Zusammen mit Proposition 12.2.7 folgt daraus, dass für abgeschlossene Ai ⊆

Q Q
Xi , i ∈ I, das Produkt i∈I Ai ⊆ i∈I Xi ebenfalls abgeschlossen ist. Alternativ kann
man das auch daraus erkennen, dass
Y \
Ai = π−1
i (Ai )
i∈I i∈I
als Durchschnitt von Urbildern abgeschlossener Mengen unter stetigen Funktionen sel-
ber wieder abgeschlossen ist.
12.5.10 Bemerkung. Wendet man diese Konstruktion der Produkttopologie etwa auf
zwei Räume (X1 , T1 ) und (X2 , T2 ) an, d.h. I = {1, 2}, so bilden insbesondere alle Men-
gen der Bauart O1 × O2 mit O1 ⊆ X1 , O2 ⊆ X2 eine Basis der Produkttopologie T1 × T2 .
Außerdem sind alle Mengen A1 × A2 für abgeschlossene A1 ⊆ X1 , A2 ⊆ X2 , ebenfalls
abgeschlossen.
12.5.11 Beispiel. Seien (Y1 , d1 ) un (Y2 , d2 ) zwei metrische Räume, und sei d : Y1 ×Y2 →

R definiert als d (x1 , x2 ), (y1 , y2 ) = max(d1 (x1 , y1 ), d2 (x2 , y2 )), vgl. Fakta 8.7.7.

Wir wissen schon, dass d eine Metrik auf Y1 × Y2 ist, und dass Uǫ (x1 , x2 ) =
Uǫ (x1 ) × Uǫ (x2 ).
Die von dieser Metrk erzeugte Topologie T (d) stimmt mit der Produkttopologie
von T (d1 ) und T (d2 ) überein. Um das einzusehen sei O ⊆ Y1 × Y2 . Diese Menge ist in
T (d), genau dann, wenn

∀(x1 , x2 ) ∈ O ⇒ ∃ǫ > 0 : Uǫ (x1 , x2 ) = Uǫ (x1 ) × Uǫ (x2 ) ⊆ O,
was aber äquivalent zu
∀(x1 , x2 ) ∈ O ⇒ ∃O1 ∈ T (d1 ), O2 ∈ T (d2 ) : (x1 , x2 ) ∈ O1 × O2 ⊆ O
ist. Da die Mengen der Form O1 × O2 eine Basis von T (d1 ) × T (d2 ) darstellen, bedeutet
das genau O ∈ T (d1 ) × T (d2 ).
Folgendes Korollar samt Beweis funktioniert übrigens auch für Funktionen mit
Werten in einem normierten Raum.
12.5.12 Korollar. Sei (X, T ) ein topologischer Raum, und f, g : X → R (C), sowie
λ, µ ∈ R (C). Sind f und g stetig, so auch λ f +µg und f g. Ist zusätzlich f (x) , 0, x ∈ X,
so ist auch 1f stetig.
Beweis. Die Funktion (x, y) 7→ λx + µy, R × R → R ist bekannterweise stetig. Nach

(IN3 ) angewandt auf R × R ist a 7→ ( f (a), g(a)), X → R × R ebenfalls stetig. λ f + µg
ist nun als Zusammensetzung dieser Funktionen ebenfalls stetig.
Der Beweis für f g und 1f verläuft analog.
❑
12.5.13 Satz. Sei X eine Menge, seien (Yi , Ti ), i ∈ I, topologische Räume und fi : Yi → X, i ∈ I, Abbildungen. Dann
existiert genau eine Topologie T auf X mit der Eigenschaft:
(FI1 ) T ist die feinste Topologie auf X, sodass alle Abbildungen fi : (Yi , Ti ) → (X, T ), i ∈ I, stetig sind.
Diese Topologie heißt finale Topologie bezüglich der fi . Sie ist gegeben durch
(FI2 ) T = {O ⊆ X : fi−1 (O) ∈ Ti für alle i ∈ I},
und erfüllt:
(FI3 ) Ist (Y, O) ein topologischer Raum und f : X → Y, so ist f : (X, T ) → (Y, O) stetig genau dann, wenn alle
Abbildungen
f ◦ fi : (Yi , Ti ) → (Y, O), i ∈ I ,
stetig sind.
Beweis.
Wir betrachten die durch (FI2 ) definierte Menge T ⊆ P(X). Es gilt
fi−1 (O1 ∩ . . . ∩ On ) = fi−1 (O1 ) ∩ . . . ∩ fi−1 (On )
und [ [
fi−1 Oj = fi−1 (O j ) .
j∈J j∈J
S also O1 , . . . , On ∈ T bzw. O j ∈ T , j ∈ J,−1so folgt, da die

Sind
−1
Ti Topologien sind, O1 ∩ . . . ∩ On ∈ T und
j∈J O j ∈ T . D.h. T erfüllt (O2), (O3). Wegen fi (∅) = ∅ und fi (X) = Yi gilt auch (O1) für T .
Definitionsgemäß gilt fi−1 (T ) ⊆ Ti , womit alle fi : (Yi , Ti ) → (X, T ) stetig sind. Ist T ′ eine Topologie auf X,
sodass alle fi stetig sind, so folgt fi−1 (O) ∈ Ti für alle O ∈ T ′ , also O ∈ T . Also gilt T ′ ⊆ T , und T erfüllt (FI1 ).
Klarerweise gibt es höchstens eine Topologie mit der Eigenschaft (FI1 ).
Sei T die finale Topologie bezüglich der fi , und sei f : X → Y. Ist f stetig, so ist auch f ◦ fi : (Yi , Ti ) → (X, T ) →
(Y, O) als Zusammensetzung stetiger Abbildungen stetig. Sei umgekehrt f ◦ fi stetig für alle i. Dann gilt
fi−1 ( f −1 (O)) = ( f ◦ fi )−1 (O) ⊆ Ti , i ∈ I ,
und wir erhalten f −1 (O) ⊆ T , d.h. f stetig.
❑
′
12.5.14 Bemerkung. Die Finale Topologie ist einzige Topologie auf X, die (FI3 ) erfüllt. Um das einzusehen, sei T eine
weiters Topologie auf X mit der Eigenschaft (FI3 ).
Da die Abbildung idX : (X, T ′ ) → (X, T ′ ) trivialerweise stetig ist, folgt aus (FI3 ) angewandt auf T ′ , dass alle idX ◦ fi :
(Yi , Ti ) → (X, T ′ ) stetig sind. Aus (FI1 ) folgt T ′ ⊆ T .
Für idX : (X, T ′ ) → (X, T ) sind andererseits alle Abbildungen idX ◦ fi = fi : (Yi , Ti ) → (X, T ) stetig. Mit (FI3 )
angewandt auf T ′ folgt die Stetigkeit von id X : (X, T ′ ) → (X, T ), und daher T ⊆ T ′ . Insgesamt ist T ′ = T .
12.5.15 Bemerkung. Das Finale Topologie Bilden ist assoziativ; dh. es gilt ein Korollar 12.5.4 entsprechendes Resultat.
12.5.16 Beispiel. Sei (Y, T ) ein topologischer Raum und ∼ eine Äquivalenzrelation auf Y. Weiters sei π : Y → Y/∼ die
kanonische Projektion, π(x) = [x]∼ . Die finale Topologie auf Y/∼ bezüglich π heißt Quotiententopologie und wird bezeichnet
als T /∼ .
Ist A ⊆ Y, so heißt A gesättigt bezüglich ∼, wenn x ∈ A die Inklusion [x]∼ ⊆ A nach sich zieht. Offenbar sind alle
Mengen der Bauart π−1 (B) mit B ⊆ Y/∼ gesättigt, und A ist genau dann gesättigt, wenn π−1 (π(A)) = A. Somit stellt A 7→ π(A)
eine bijektive Abbildung von allen gesättigten Teilmengen von Y auf alle Teilmengen von Y/∼ dar, wobei B 7→ π−1 (B) ihre
Umkehrung ist.
Eine Menge P ⊆ Y/∼ ist per definitionem genau dann offen in (Y/∼ , T /∼ ), wenn π−1 (P) offen in (Y, T ) ist. Insbe-
sondere ist O 7→ π(O) eine Bijektion von allen gesättigten offenen Teilmengen von Y auf T /∼ . Entsprechendes gilt für
abgeschlossene Mengen.
12.5.17 Proposition. Sei f : (X, T ) → (Y, V) eine stetige Abbildung. Bezeichne mit ∼ die Äquivalenzrelation x ∼ y : ⇐⇒
f (x) = f (y), und seien π : X → X/∼ , ι : f (X) → Y, die kanonische Projektion bzw. Einbettung. Weiters sei g : X/∼ → f (X)
die Bijektion mit ι ◦ g ◦ π = f .
Dann ist g : (X/∼ , T /∼ ) → ( f (X), V| f (X) ) stetig. Außerdem sind folgende Aussagen äquivalent
(i) g ist ein Homöomorphismus von (X/∼ , T /∼ ) auf ( f (X), V| f (X) ).
(ii) Für jede bezüglich ∼ gesättigte offene Menge O ⊆ X ist f (O) offen in ( f (X), V| f (X) ).
(iii) Für jede bezüglich ∼ gesättigte abgeschlossene Menge A ⊆ X ist f (A) abgeschlossen in ( f (X), V| f (X) ).
Beweis. Nach Satz 12.5.1,(IN3 ), bzw. Beispiel 12.5.5 ist auch f : (X, T ) → ( f (X), V| f (X) ) stetig. Somit können wir oBdA.
Y = f (X) und damit auch ι = idY annehmen.
Jede Abbildung g : X/∼ → Y mit g ◦ π = f muss g([x]∼ ) = f (x) für x ∈ X erfüllen. Betrachten wir das als Definition, so
ist die Wohldefiniertheit davon zu zeigen. Diese folgt aber unmittelbar aus der Definition von von ∼, da [x]∼ = [y]∼ immer
x ∼ y und damit f (x) = f (y) nach sich zieht. Also gibt es ein solches g und dieses ist eindeutig. Außerdem ist g injektiv, da
aus f (x) = g([x]∼ ) = g([y]∼ ) = f (y) per definitionem x ∼ y bzw. [x]∼ = [y]∼ folgt. Wegen g(X/∼ ) = f (X) = Y ist g sogar
bijektiv.
Die Stetigkeit von g folgt unmittelbar aus Satz 12.5.13, (FI3 ), da X/∼ die finale Topologie T /∼ bzgl. π trägt und da
g ◦ π = f stetig ist.
Die Funktion g ist nun genau dann Homöomorphismus, wenn noch g−1 stetig ist, d.h. wenn g(P) ∈ V für alle P ∈ T /∼ .
Nach Beispiel 12.5.16 durchläuft π−1 (P) aber alle offenen und gesättigten Teilmengen von X. Zudem gilt
g(P) = g ◦ π(π−1 (P)) = f (π−1 (P)),
woraus man sofort die Äquivalenz von (i) und (ii) erkennt. Die Äquivalenz von (i) und (iii) zeigt man genauso.
❑
12.6. TRENNUNGSEIGENSCHAFTEN 157
12.6 Trennungseigenschaften
Wir wollen dieses Kapitel mit der einfachen Bemerkung starten, dass in (T 2) Räumen
einpunktige Mengen {x} abgeschlossen sind. Das folgt aus der Beobachtung, dass es
zu y ∈ {x}c wegen (T 2) eine Umgebung gibt, die x nicht enthält, bzw. ganz in {x}c
enthalten ist. Wegen Lemma 12.1.11 ist {x}c offen.
12.6.1 Definition. Man sagt, dass sich zwei disjunkte Mengen A und B in einem Topo-
logischen Raum trennen lassen, wenn es disjunkte offene Mengen OA , OB gibt, sodass
A ⊆ OA , B ⊆ O B .
Ein topologischer Raum (X, T ) heißt regulär, falls er neben dem Axiom (T 2) noch
das Trennungsaxiom (T 3) erfüllt:
(T 3 ) Abgeschlossene Mengen A und einpunktige Mengen {x} mit x < A lassen sich
trennen, d.h. ∃O x , OA ∈ T : x ∈ O x , A ⊆ OA , O x ∩ OA = ∅.
OA
A
Ox
x
Abbildung 12.2: Drittes Trennungsaxiom (T 3 )
Ein topologischer Raum (X, T ) heißt normal, falls er neben dem Axiom (T 2) noch
das Trennungsaxiom (T 4) erfüllt:
(T 4 ) Disjunkte abgeschlossene Mengen A und B lassen sich trennen, d.h. ∃OA , OB ∈

T : A ⊆ OA , B ⊆ OB , OA ∩ OB = ∅.
OB
B
OA
A
Abbildung 12.3: Viertes Trennungsaxiom (T 4 )
Da einpunktige Mengen abgeschlossen sind, folgt aus normal regulär. Im allgemei-

nen gilt aber nicht die Umkehrung.
12.6.2 Bemerkung. Zwei disjunkte Mengen A und B - die Disjunktheit ist äquivalent
zu A ⊆ Bc - lassen sich genau dann trennen, wenn es ein offenes O gibt, sodass
A ⊆ O ⊆ O ⊆ Bc . (12.16)
In der Tat folgt aus A ⊆ OA , B ⊆ OB , OA ∩ OB = ∅, dass A ⊆ OA ⊆ OcB ⊆ Bc und

daraus A ⊆ OA ⊆ OA ⊆ OcB ⊆ Bc .
c c
Andererseits folgt aus (12.16) unmittelbar A ⊆ O, B ⊆ O , O ∩ O = ∅.
12.6.3 Korollar. Das Axiom (T 3) ist äquivalent zur Tatsache, dass man zu einer belie-
bigen Umgebung U ∈ U(x) eines Punktes x eine Umgebung V ∈ U(x) mit V ⊆ U finden
kann.
12.6.4 Bemerkung. Im Gegensatz zu (T 4) vererben sich die Axiome (T 2) und (T 3)

auf Teilräume, d.h. ist Y ⊆ X und (X, T ) ein topologischer Raum, der (T 2) bzw. (T 3)
erfüllt, so erfüllt auch (Y, T |Y ) (T 2) bzw. (T 3).
Um das einzusehen, erfülle X zunächst das (T 2). Sind dann x , y ∈ Y und O x , Oy ∈
T disjunkt mit x ∈ O x bzw. y ∈ Oy , so folgt x ∈ O x ∩ Y ∈ T |Y , y ∈ Oy ∩ Y ∈ T |Y . Also
erfüllt Y auch das Axiom (T 2).
Gilt (T 3) auf X, und ist x ∈ Y und W eine Umgebung von x in Y, so haben wir
in Beispiel 12.5.5 gesehen, dass dass W = U ∩ Y für eine Umgebung U von x in X.
Wegen (T 3) gibt es eine Umgebung V von x in X mit V ⊆ U und somit ist V ∩ Y eine
Umgebung von x in Y mit
T |Y T
x∈V∩Y = V ∩ Y ∩ Y ⊆ V ∩ Y ⊆ U ∩ Y = W.
Also gilt (T 3) auch auf Y.
12.6.5 Bemerkung.
Q Ähnlich
Q zeigt man, dass sich die Axiome (T 2) und (T 3) von topologischen Räumen (Xi , Ti ) auf den
Produktraum ( i∈I Xi , i∈I Ti ) vererben.
12.6.6 Beispiel. Metrische Räume sind nomal. Dazu seien A und B zwei disjunkte,
abgeschlossene Mengen.
Zu a ∈ A gibt es ein ǫa > 0 mit U2ǫa (a) ⊆ Bc . Entsprechend wählt man ǫb für b ∈ B.
Nun setze [ [
OA := Uǫa (a), OB := Uǫb (b).
a∈A b∈B
Ist c ∈ OA ∩ OB , so gibt es a ∈ A, b ∈ B mit c ∈ Uǫa (a) ∩ Uǫb (b). O.B.d.A. sei ǫa ≥ ǫb .

Es folgt d(a, b) ≤ d(a, c) + d(c, b) < 2ǫa , was aber b ∈ U2ǫa (a) implizieren würde, im
Widerspruch zur Wahl von ǫa . Also gilt A ⊆ OA , B ⊆ OB , OA ∩ OB = ∅.
Zusammenhang
Eins zu eins kann man den Begriff einer Zusammenhängenden Menge auf topologische Räume verallgemeinern (vgl. Defi-
nition 6.2.2).
12.6.7 Definition. Eine Teilmenge E eines topologischen Raumes (X, T ) heißt zusammenhängend, wenn man E nicht als
Vereinigung zweier nichtleerer getrennter Mengen schreiben kann. Dabei heißen A und B getrennt, wenn A∩ B = A∩ B = ∅4 .
12.6.8 Lemma. Eine Teilmenge E eines topologischen Raumes (X, T ) ist genau dann zusammenhängend, wenn sich E
nicht als E = A ∪ B schreiben lässt, wobei A, B zwei disjunkte, nichtleere und bzgl. T |E abgeschlossene Teilmengen von E
sind.
Das ist auch dazu äquivalent, dass sich E nicht als E = A ∪ B schreiben lässt, wobei A, B zwei disjunkte, nichtleere
und bzgl. T |E offene Teilmengen von E sind.
4 Man beachte, dass zwei Mengen getrennt sind, wenn sie sich im Sinne von Definition 12.6.1 trennen
lassen, aber im Allgemeinen nicht umgekehrt.

12.6. TRENNUNGSEIGENSCHAFTEN 159
Beweis. Ist E = A ∪ B mit ∅ , A, ∅ , B, A ∩ B = ∅, so ist der Abschluss von A bzgl. T |E wegen (12.13) genau
A ∩ E = A ∪ (B ∩ A). Damit ist A bzgl. T |E genau dann abgeschlossen, wenn B ∩ A = ∅. Entsprechendes gilt für B.
Somit sind A und B genau dann getrennt, wenn A und B bzgl. T |E abgeschlossen sind. Durch Übergang zu den
Komplementen sieht man, dass das genau dann gilt, wenn A und B bzgl. T |E offen sind.
❑
Das wichtige Resultat Proposition 6.2.4 lässt sich unmittelbar auf topologische Räume übertragen, wobei man fast
den selben Beweis nehmen kann. Man muss nur Folgen durch Netze ersetzen. Wir wollen diesen Beweis aber etwas anders
führen.
12.6.9 Proposition. Seien (X, T ) und (Y, O) topologische Räume, und sei f : X → Y eine stetige Funktion. Ist E ⊆ X
zusammenhängend, so auch f (E).
Beweis. Angenommen f (E) wäre nicht zusammenhängend. Dann gilt f (E) = A ∪ B mit A, B , ∅ und A ∩ B = A ∩ B = ∅.
Für die nichtleeren Mengen E ∩ f −1 (A), E ∩ f −1 (B) folgt

E = E ∩ f −1 (A) ∪ E ∩ f −1 (B) , E ∩ f −1 (A) ∩ E ∩ f −1 (B) = ∅.
Nach Satz 12.3.5 gilt

f E ∩ f −1 (A) ∩ E ∩ f −1 (B) ⊆ f E ∩ f −1 (A) ∩ f E ∩ f −1 (B) ⊆ A ∩ B = ∅.

Entsprechend gilt (E ∩ f −1 (B) ∩ E ∩ f −1 (A) = ∅, und E wäre somit nicht zusammenhängend, was unserer Annahme
widerspricht.
❑
Folgender recht trivialer Sachverhalt ist jedoch sehr nützlich.
12.6.10 Lemma. Sei E eine zusammenhängende Teilmenge eines topologischen Raumes (X, T ). Weiters seien A, B ⊆ X
getrennt und so, dass E ⊆ A ∪ B. Dann folgt entweder E ⊆ A oder E ⊆ B.
Beweis. Offensichtlich sind A∩E und B∩E als Teilmengen zweier getrennter Mengen getrennt. Wegen E = (A∩E)∪(B∩E)
und da E zusammenhängend ist, folgt A ∩ E = ∅ oder B ∩ E = ∅ bzw. E ⊆ B oder E ⊆ A. Beides kann nicht der Fall sein,
da getrennte Mengen immer disjunkt sind.
❑
Damit können wir auch das im letzten Kapitel bewiesene Resultat Lemma 11.2.18 über die Vereinigung von zusam-
mengängenden Mengen in allgemeinen topologischen Räumen mit einem etwas kürzeren Beweis versehen.
12.6.11TKorollar. Ist (Ei )i∈I eine Familie

S bestehend aus zusammenhängenden Teilmengen eines topologischen Raumes,
sodass i∈I Ei , ∅, so ist auch E := i∈I Ei zusammenhängend.
Beweis. Sei E = A ∪ B mit getrennten A und B. Nach Lemma 12.6.10 folgt für jedes i ∈ I immer entweder Ei ⊆ A oder
Ei ⊆ B. Ist es nicht der Fall, dass immer der erste Fall eintritt oder dass immer der zweite Fall eintritt, so hätten wir Ei ⊆ A
und E j ⊆ B für i, j ∈ I. Laut Voraussetzung sind aber Ei und E j nicht disjunkt, was aber der Getrenntheit von A und B
widerspricht. Somit muss E ganz in A bzw. ganz in B entahlten sein; dh. B = ∅ oder A = ∅.
❑
12.6.12 Korollar. Mit E ist auch jede Teilmenge C eines topologischen Raumes mit E ⊆ C ⊆ E abgeschlossen.
Beweis. Sei C = A ∪ B mit getrennten A und B. Nach Lemma 12.6.10 folgt E ⊆ A oder E ⊆ B. Im ersten Fall folgt aus
C ∩ B ⊆ E ∩ B ⊆ A ∩ B = ∅, dass E ⊆ A und daher B = ∅. Im zweite Fall schließt man entsprechend auf A = ∅.
❑
12.6.13 Korollar. Sei (X, T ) ein topologischer Raum. Ist ∼⊆ X × X die Relation auf X definiert durch
x ∼ y ⇔ ∃E ⊆ X : x, y ∈ E, E ist zusammenhängend,
so ist ∼ eine Äquivalenzrelation. Für ein x ∈ X ist die Äquivalenzklasse [x]∼ die größte zusammenhängende Menge, die x
enthält. Schließlich ist [x]∼ abgeschlossen.
Beweis. Da die einpunktige Menge {x} zusammenhängend ist, ist ∼ reflexiv. Die Symmetrie ist klar. Ist x ∼ y, y ∼ z, und sind
E und F zusammenhängende Mengen, sodass x, y ∈ E und y, z ∈ F, so ist nach Korollar 12.6.11 E ∪ F zusammenhängend,
wobei x, z ∈ E ∪ F. Also ist ∼ ein Äquivalenzrelation. Schließlich ist für x ∈ X die Menge
[
[x]∼ = E,
x∈E
E ist zusammenhängend
wegen Korollar 12.6.11 zusammenhängend. Klarerweise ist diese Menge dann auch die größte Zusammenhängende Menge,
die x enthält. Wegen Korollar 12.6.12 ist sie auch abgeschlossen.
❑
12.7 Kompaktheit
Bei metrischen Räumen haben wir den Begriff der Kompaktheit mit Hilfe von Folgen
eingeführt. Für allgemeine topologische Räume wollen wir anders starten. Wir werden
weiter unten sehen, dass dieser Zugang zur Kompaktheit bei metrischen Räumen mit
dem schon bekannten äquivalent ist.
12.7.1 Definition. Eine Teilmenge K eines topologischer Raum (X, T ) heißt kompakt,
wenn jede offene Überdeckung eine endliche Teilüberdeckung besitzt. D.h., ist {Ui :
i ∈ I} ⊆ T eine Familie offener Mengen mit
[
Ui ⊇ K,
i∈I
so gibt es bereits endlich viele Ui1 , . . . , Uin mit
Ui1 ∪ . . . ∪ Uin ⊇ K .
Eine Teilmenge A ⊆ X heißt relativ kompakt, wenn A ⊆ X kompakt ist. Der Raum
(X, T ) heißt lokalkompakt, wenn jeder Punkt x eine kompakte Umgebungen besitzt.
Sei (Ai )i∈I eine Familie von Mengen. Wir sagen, dass (Ai )i∈I die endliche Durch-
schnittseigenschaft hat, wenn für je endlich viele i1 , . . . , in ∈ I stets Ai1 ∩ . . . ∩ Ain , ∅
gilt.
12.7.2 Proposition. Sei (X, T ) ein topologischer Raum und K ⊆ X. Dann sind äqui-
valent:
(K1 ) K ist kompakt.
(K2 ) K betrachtet als Teilmenge von (K, T |K ) ist kompakt.
(K3 ) Jede Familie bzgl. T |K abgeschlossener Teilmengen von K mit der endlichen
Durchschnittseigenschaft hat nichtleeren Durchschnitt.
(K4 ) Jedes Netz (xi )i∈I in K hat ein gegen ein x ∈ K konvergentes Teilnetz.
Beweis.
(K1 ) ⇒ (K2 ): Sei V ⊆ T |K eine offene Überdeckung von K in (K, T |K ). Zu V ∈ V

existiert ein UV ∈ T mit UV ∩ K = V. Also ist U := {UV : V ∈ V} eine
Familie offener Mengen in X, die K überdeckt. Es gibt also UV1 , . . . , UVn mit
UV1 ∪ . . . ∪ UVn ⊇ K. Damit ist auch
V1 ∪ . . . ∪ Vn = (UV1 ∩ K) ∪ . . . ∪ (UVn ∩ K) = (UV1 ∪ . . . ∪ UVn ) ∩ K = K .
(K2 ) ⇒ (K1 ): Ist K als Teilmenge von (K, T |K ) kompakt, und ist U ⊆ T eine Überde-
ckung aus offenen Mengen in (X, T ), so ist
V := {U ∩ K : U ∈ U}
eine offene Überdeckung von (K, T |K ). Daher existiert eine endliche Teilüberde-
ckung {U1 ∩ K, . . . , Un ∩ K}, und daher U1 ∪ . . . ∪ Un ⊇ A.
12.7. KOMPAKTHEIT 161
(K2 ) ⇒ (K3 ): Sei F eine Familie in (K, T |K ) abgeschlossener Teilmengen von K mit
T
der endlichen Durchschnittseigenschaft. Angenommen F∈F F = ∅. Dann folgt
[
K \ F = K,
F∈F
wobei die K \ F in (K, T |K ) offen sind. Also gibt es eine endliche Teilüberde-
ckung, K \ F1 ∪ . . . ∪ K \ Fn = K, und wir erhalten F1 ∩ . . . ∩ Fn = ∅, was aber
der endlichen Durchschnittseigenschaft widerspricht.
(K3 ) ⇒ (K2 ): Sei V ⊇ T |K eine offene Überdeckung von K. Würde V keine endli-
che Teilüberdeckung besitzen, so wäre (K \ V1 ) ∩ . . . ∩ (K \ Vn ) , ∅ für jede
endliche Auswahl V1 , . . . , Vn ∈ V. Also hätte F = {K \ V : V ∈ V} die end-
liche Durchschnittseigenschaft, und nach Voraussetzung wäre der Schnitt aller
Mengen K \ V, V ∈ V nichtleer. Damit wäre V aber keine Überdeckung.
(K3 ) ⇒ (K4 ): Sei (xi )i∈I ein Netz in K. Für i ∈ I ist Ai = {xk : k i} ∩ K abgeschlossen
in (K, T |K ). Das System Ai , i ∈ I, hat die endliche Durchschnittseigenschaft,
denn sind i1 , . . . , in ∈ I und ist i ∈ I, i i1 , . . . , in , so gilt
∅ , {xk : k i} ⊆ {xk : k i1 } ∩ · · · ∩ {xk : k in }.
Nach Voraussetzung gibt es ein x ∈ ∩i∈I Ai .

Jetzt sei J = {( j, U) : j ∈ I, U ∈ U(x), x j ∈ U} versehen mit der offensichtlich
reflexiven und transitiven Relation
( j, U) (k, V) :⇔ j k ∧ U ⊆ V.
Für ( j1 , U1 ), ( j2 , U2 ) ∈ J sei k ∈ I mit k j1 , j2 . Wegen x ∈ {x j : j k} gibt es

ein x j ∈ U1 ∩ U2 mit j k, und somit ( j, U1 ∩ U2 ) ( j1 , U1 ), ( j2 , U2 ). Also ist
J gerichtet.
Mit xi( j,U) := x j erhalten wir offensichtlich ein Teilnetz (xi( j,U) )( j,U)∈J von (xi )i∈I .
Zu V ∈ U(x) gibt es ein k ∈ I mit xk ∈ V. Für ( j, U) (k, V) folgt dann
xi( j,U) = x j ∈ U ⊆ V, und somit konvergiert dieses Teilnetz gegen x.
(K4 ) ⇒ (K3 ): Hat (Ai )i∈I die endliche Durchschnitteseigenschaft, so sei T die Menge
aller endlichen Teilmengen von I gerichtet durch die Relation M1 M2 :⇔
M1 ⊆ M2 .
Für M ∈ T sei x M irgend ein Punkt aus ∩i∈M Ai . Man beachte, dass nach Voraus-
setzung dieser Schnitt nicht leer ist. Das Netz (x M ) M∈T hat wegen (K4) ein gegen
ein x ∈ X konvergentes Teilnetz (x M( j) ) j∈J .
Ist k ∈ I, so gibt es ein j0 ∈ J mit M( j) ⊇ {k} für alle j j0 , und somit x M( j) ∈
∩i∈M( j) Ai ⊆ Ak . Also liegt das ebenfalls gegen x konvergente Netz (x M( j) ) j∈J j0 in
der abgeschlossenen Menge Ak . Mit Proposition 12.2.7 folgt daraus x ∈ Ak , und,
da k ∈ I beliebig war, auch dass der Schnitt aller Ak ’s x enthält und damit nicht
leer ist.
❑
12.7.3 Bemerkung. Wegen Lemma 12.2.13 ist die Bedingung (K4) zu der Tatsache äquivalent, dass jedes Netz einen
Häufungspunkt in K hat.
Wenden wir nun Lemma 12.2.14 an, und beachten, dass Häufungspunkte von Teilnetzen von (xi )i∈I auch Häufungs-
punkte von (xi )i∈I sind (vgl. Lemma 12.2.13), so erhalten wir aus Bemerkung 12.7.3
12.7.4 Satz. Ein Netz (xi )i∈I in einer kompakten Menge K ⊆ X konvergiert genau dann gegen ein x ∈ X, wenn x der einzige
Häufungspunkt von (xi )i∈I ist.
12.7.5 Definition. Eine Teilmenge A eines topologischer Raum (X, T ) heißt abzählbar kompakt, wenn jede unendliche
Teilmenge von A einen Häufungspunkt in A hat.
Eine Teilmenge A eines topologischer Raum (X, T ) heißt folgenkompakt, wenn jede Folge in A eine gegen ein x ∈ A
konvergente Teilfolge hat.
12.7.6 Bemerkung. Ist M ⊆ A unendlich, so gibt es sicher eine injektive Funktion x : N → M. Das ist aber nichts anderes
als eine Folge, daher x(n) = xn .
Ist A folgendkompakt, so folgt x = limk→∞ xn(k) für eine Teilfolge (xn(k) )k∈N und ein x ∈ A. Für jede Umgebung U von
x gibt es somit einen Index k0 ∈ N, sodass xn(k) ∈ U für alle k ≥ k0 . Da die Folgenglieder alle verschieden sind, enthält U
sicherlich einen Punkt y := xn(k) ∈ M, der ungleich x ist. Also hat M einen Häufungspunkt in A (vgl. Definition 12.2.8).
Somit folgt aus folgendkompakt abzählbar kompakt. Die Umkehrung gilt im Allgemeinen nicht.
Ist A kompakt, so folgt wegen Proposition 12.7.2 x = limi∈I xn(i) für ein Teilnetz (xn(i) )i∈I und ein x ∈ A. Für jede
Umgebung U von x gibt es somit einen Index i0 ∈ I, sodass xn(i) ∈ U für alle i i0 .
Da die Folgenglieder alle verschieden sind, gibt es höchstens ein n0 ∈ N, sodass xn0 = x. Die Teilnetzeigenschaft
bedingt die Existenz eines i1 ∈ I, sodass i i1 ⇒ n(i) ≥ n0 + 1 ∧ xn(i) ∈ U. Für solche i liegt der Punkt y := xn(i) ∈ M in U
und ist ungleich x. Also hat M einen Häufungspunkt in A (vgl. Definition 12.2.8). Somit folgt auch aus kompakt abzählbar
kompakt. Die Umkehrung gilt im Allgemeinen auch hier nicht.
Überraschenderweise gilt im Allgemeinen weder, dass kompakt folgendkompakt impliziert, noch, dass folgendkom-
pakt kompakt impliziert. In metrischen Räumen sind alle drei Begriffe äquivalent, siehe Satz 12.8.3.
12.7.7 Lemma. Sei (X, T ) ein topologischer Raum, A ⊆ X, sowie A1 , . . . , Am ⊆ X. Es

gilt:
(i) Sei A kompakt, B ⊆ A abgeschlossen in (A, T |A ). Dann ist B ⊆ X kompakt.
(ii) Sind A1 , . . . , Am kompakt, so auch A1 ∪ . . . ∪ Am .
Sei zusätzlich vorausgesetzt, dass (X, T ) Hausdorff ist. Dann gilt:
(iii) Ist A kompakt, so ist A abgeschlossen.
(iv) A ist relativ kompakt genau dann, wenn es eine kompakte Menge B ⊆ X gibt mit
A ⊆ B.
Beweis.
(i) Die Menge A \ B ist offen in (A, T |A ). Also existiert O ∈ T mit O ∩ A = A \ B. Sei
U eine Überdeckung von B aus in X offenen Mengen, dann überdeckt U ∪ {O}
ganz A. Daher gibt es U1 , . . . , Un ∈ U mit U1 ∪ . . . ∪ Un ∪ O ⊇ A. Es folgt
U1 ∪ · · · ∪ Un = U1 ∪ . . . ∪ Un ∪ (O ∩ B) ⊇
| {z }
=∅
⊇ (U1 ∩ B) ∪ . . . ∪ (Un ∩ B) ∪ (O ∩ B) = (U1 ∪ . . . ∪ Un ∪ O) ∩ B ⊇ B .
(ii) Sei U eine Überdeckung von A1 ∪ . . . ∪ Am aus in X offenen Mengen. Dann

überdeckt U jedes Ai , also existieren Uki , k = 1, . . . , ni , i = 1, . . . , m, mit
U1i ∪ . . . ∪ Uni i ⊇ Ai ,
und es folgt [
Uki ⊇ A1 ∪ . . . ∪ Am .
k,i
(iii) Sei A kompakt, und sei x < A. Da (X, T ) Hausdorff ist, gibt es zu jedem Punkt
y ∈ A offene Umgebungen Uy ∈ U(y), Vy ∈ U(x), mit Uy ∩ Vy = ∅. Klarerweise
ist {Uy : y ∈ A} eine offene Überdeckung von A. Daher gibt es y1 , . . . , yn ∈ A,
sodass bereits Uy1 ∪ . . . ∪ Uyn ⊇ A gilt. Die Menge Vy1 ∩ . . . ∩ Vyn ist als endlicher
Durchschnitt von Umgebungen von x ebenfalls eine Umgebung von x, und es gilt

Uy1 ∪ . . . ∪ Uyn ∩ Vy1 ∩ . . . ∩ Vyn = ∅.
Also ist x ein innerer Punkt von Ac . Nach Lemma 12.1.11 ist Ac offen und daher
A abgeschlossen.
(iv) Ist A relativ kompakt, so ist A kompakt und klarerweise gilt A ⊆ A. Sei umgekehrt
A ⊆ B mit B kompakt. Dann ist wegen (iii) die Menge B auch abgeschlossen, also
folgt A ⊆ B und (i) zeigt, dass A kompakt ist.
❑
12.7.8 Lemma. Sei f : (X, T ) → (Y, O) stetig. Ist A ⊆ X kompakt, so ist auch f (A) ⊆ Y
kompakt.
Beweis. Ist U ⊆ O eine Überdeckung von f (A), so ist f −1 (U) eine Überdeckung von A,
die wegen der Stetigkeit von f aus offenen Mengen besteht. Es gibt also U1 , . . . , Un ∈
U, sodass
f −1 (U1 ) ∪ . . . ∪ f −1 (Un ) ⊇ A .
Wendet man darauf f an, so folgt U1 ∪ . . . ∪ Un ⊇ f (A).
❑
Nimmt man die Charakterisierung (K4) aus Proposition 12.7.2 her, so kann man Lemma 12.7.8 auch ganz ähnlich
wie in Proposition 6.1.11 beweisen. Ist nämlich (yi )i∈I ein Netz in f (A), und wählt man zu jedem i ∈ I ein xi ∈ A, sodass
f (xi ) = yi , so hat nach (K4) das Netz (xi )i∈I ein gegen ein x ∈ A konvergentes Teilnetz (xi( j) ) j∈J . Aus Lemma 12.3.3

schließen wir, dass (yi( j) ) j∈J = f (xi( j) ) j∈J gegen f (x) =: y konvergiert. Also hat jedes Netz aus f (A) ein gegen ein y ∈ f (A)
konvergentes Teilnetz. Nach (K4) aus Proposition 12.7.2 ist f (A) somit kompakt.
12.7.9 Korollar. Es gilt:

(i) Sei (X, T ) kompakt und (Y, O) Hausdorff. Weiters sei f : (X, T ) → (Y, O) bijektiv
und stetig. Dann ist f ein Homöomorphismus.
(ii) Sei X eine Menge und T , O Topologien auf X, sodass T kompakt und O Hausdorff
ist, und sodass O ⊆ T . Dann gilt sogar O = T .
Beweis.
(i) Wir müssen nachweisen, dass f −1 stetig ist. Dazu zeigen wir, dass das Urbild
unter f −1 einer in (X, T ) abgeschlossenen Menge in (Y, O) abgeschlossen ist, siehe
Satz 12.3.5. Sei A ⊆ X abgeschlossen, dann ist A kompakt, und daher ist nach
Lemma 12.7.8 auch
( f −1 )−1 (A) = f (A) ⊆ Y
kompakt. Nach Lemma 12.7.7, (iii), ist ( f −1 )−1 (A) auch abgeschlossen.
(ii) Wegen O ⊆ T ist idX : (X, T ) → (X, O) stetig, und (i) zeigt, dass idX sogar ein
Homöomorphismus ist, d.h. T = O.
12.7.10 Lemma. Sei (X, T ) ein topologischer Raum.
(i) Ist X Hausdorffsch, und ist A ⊆ X kompakt und x ∈ X \ A, so lassen sich x und A
trennen, d.h. es gibt disjunkte offene Mengen O x ∋ x und OA ⊇ A.
(ii) Erfüllt X das Axiom (T 3), und sind A ⊆ X kompakt, B ⊆ X abgeschlossen und
A ∩ B = ∅, so lassen sich A und B trennen.
(iii) Ist (X, T ) kompakt und Hausdorffsch, so ist (X, T ) sogar normal.
Beweis.
(i) Zu jedem y ∈ A gibt es zwei disjunkte offene Mengen Qy ∋ y und Py ∋ x. Kla-

rerweise ist dann {Qy : y ∈ A} eine Überdeckung von A. Wegen der Kompaktheit
gibt es y1 , . . . , yn ∈ A, sodass A ⊆ Qy1 ∪ · · · ∪ Qyn := OA . Außerdem ist mit
O x := Py1 ∩ · · · ∩ Pyn
O x ∩ OA = O x ∩ (Qy1 ∪ · · · ∪ Qyn ) ⊆ (Py1 ∩ Qy1 ) ∪ · · · ∪ (Pyn ∩ Qyn ) = ∅.
(ii) Zu jedem y ∈ A gibt es wegen (T 3) zwei disjunkte offene Mengen Qy ∋ y und

Py ⊇ B. Dann ist {Qy : y ∈ A} eine Überdeckung von A. Wegen der Kompaktheit
gibt es y1 , . . . , yn ∈ A, sodass A ⊆ Qy1 ∪ · · · ∪ Qyn := OA . Außerdem gilt für
OB := Py1 ∩ · · · ∩ Pyn
OB ∩ (Qy1 ∪ · · · ∪ Qyn ) ⊆ (Py1 ∩ Qy1 ) ∪ · · · ∪ (Pyn ∩ Qyn ) = ∅.
Also lassen sich A und B trennen.
(iii) Da jede abgeschlossene Teilmenge von X nach Lemma 12.7.7 kompakt ist, folgt
aus (i), dass X regulär ist, dh. es gilt (T 2) und (T 3). Nach (ii) ist X dann sogar
normal.
Der Satz von Tychonoff

Q
12.7.11 Satz (Tychonoff).
Q Q Sei (Xi , Ti ), i ∈ I, eine Familie topologischer Räume, und sei i∈I Ti die Produkttopologie auf
Q
X
i∈I i . Dann ist ( X
i∈I i , T
i∈I i ) genau dann kompakt, wenn alle Räume (X i , Ti ), i ∈ I, kompakt sind.
Dieser Satz ist einer der ganz wichtigen Sätze in der Topologie. Wir wollen bemerken, dass die interessante Implikation
jene ist, die von der Kompaktheit der einzelnen Räume auf die des Produktes schließt. Die Umkehrung ist ganz elementar.
Es gibt verschiedene Zugänge, um diesen Satz zu beweisen, wir wählen hier jenen über den Filterbegriff, vgl. Definition
12.1.6.
Sei X eine Menge. Betrachte die Menge aller Filter auf X. Dies ist eine gewisse Teilmenge von P(P(X)), und da die
Potenzmenge jeder Menge mit der mengentheoretischen Inklusion geordnet ist, ist auch die Menge aller Filter auf X in
dieser Weise eine geordnete Menge. Ist F1 ⊆ F2 , so sagt man, dass F2 feiner als F1 ist oder, dass F1 gröber als F2 ist.
12.7.12 Definition. Sei X eine Menge. Ein Filter F auf X heißt Ultrafilter, wenn er ein maximales Element in der Menge
aller Filter auf X, geordnet mit der mengentheoretischen Inklusion, ist.
12.7.13 Proposition. Sei X eine Menge, und F ein Filter auf X. Dann existiert ein Ultrafilter F1 mit F1 ⊇ F.
Beweis. Wir wollen das Lemma von Zorn anwenden, und zwar auf die Menge aller Filter auf X, die feiner als F sind. Diese
Menge ist nichtleer und als Teilmenge der Menge aller Filter bezüglich der mengentheoretischenS Inklusion geordnet.
Sei (Fi )i∈I , I , ∅ eine totalgeordnete Menge von Filtern Fi mit Fi ⊇ F. Definiere F̃ := i∈I Fi . Dann gilt F̃ ⊇ F, denn
I , ∅ und alle Fi enthalten F. Insbesondere ist F̃ nichtleer. Seien F1 , F2 ∈ F̃. Dann existiert i1 , i2 ∈ I mit F1 ∈ Fi1 und
F2 ∈ Fi2 . Nun gilt entweder Fi1 ⊆ Fi2 oder Fi2 ⊆ Fi1 . Im ersten Fall sind F1 , F2 beide Elemente des Filters Fi2 , und daher
ist auch F1 ∩ F2 ∈ Fi2 ⊆ F̃. Im zweiten Fall erhält man genauso F1 ∩ F2 ∈ Fi1 ⊆ F̃. Schließlich sei F1 ∈ F̃, und F2 ⊇ F1
gegeben. Sei i ∈ I, sodass F1 ∈ Fi , dann ist auch F2 ∈ Fi ⊆ F̃. Also ist F̃ ein Filter.
Nach dem Lemma von Zorn existiert in der Menge aller Filter auf X, die feiner als F sind, ein maximales Element. Es
verbleibt zu bemerken, dass ein maximales Element in der Menge aller Filter auf X, die feiner als F sind, auch maximal in
der Menge aller Filter ist.
❑
12.7.14 Lemma. Seien X und Y nichtleere Mengen und f : X → Y eine Abbildung.
Ist F ein Filter auf X, so ist
f (F) := {B ⊆ Y : f −1 (B) ∈ F}
ein Filter auf Y. f (F) hat { f (F) : F ∈ F} als Filterbasis. Ist B eine beliebige Filterbasis von F, so ist { f (F) : F ∈ B} ein
Filterbasis von f (F).
Ist F ein Ultrafilter, so auch f (F).
Beweis. Es gilt Y, ∅ ∈ f (F), da f −1 (Y) = X, f −1 (∅) = ∅ ∈ F. Sind B1 , B2 ∈ f (F), daher f −1 (B1 ), f −1 (B2 ) ∈ F, so
folgt f −1 (B1 ∩ B2 ) = f −1 (B1 ) ∩ f −1 (B2 ) ∈ F und somit B1 ∩ B2 ∈ f (F). Ist schließlich B2 ⊇ B1 ∈ f (F), so folgt
f −1 (B2 ) ⊇ f −1 (B1 ) ∈ F und somit f −1 (B2 ) ∈ F, bzw. B2 ∈ f (F). Also ist f (F) ein Filter.
Ist F ∈ F, so folgt wegen f −1 ( f (F)) ⊇ F, dass f (F) ∈ f (F). Ist B ∈ f (F), also f −1 (B) ∈ F, so folgt f ( f −1 (B)) ⊆ B.
Gemäß Definition 12.1.7 ist { f (F) : F ∈ F} eine Filterbasis von f (F).
Ist B eine Filterbasis von F, und F ∈ f (F), so folgt wie eben f −1 (F) ∈ F und somit B ⊆ f −1 (F) für ein B ∈ B. Wir
erhalten f (B) ⊆ f ( f −1 (F)) ⊆ F. Wieder nach Definition 12.1.7 ist { f (B) : B ∈ B} eine Filterbasis von f (F).
Ist F ein Ultrafilter und ist f (F) ⊆ G für einen Filter G, so folgt f (F) ∩ G , ∅ und damit auch F ∩ f −1 (G) , ∅ für alle
F ∈ F, G ∈ G. Also ist die Menge {F ∩ f −1 (G) : F ∈ F, G ∈ G} die Filterbasis eines Filters, der offenbar F und f −1 (G)
umfasst. Wegen der Maximalität muss dieser mit F übereinstimmen, und daher f −1 (G) ⊆ F bzw. G ⊆ f (F).
❑
Sei nun X versehen mit einer Topologie.
12.7.15 Definition. Sei (X, T ) ein topologischer Raum und x ∈ X. Ein Filter F auf X heißt konvergent gegen x, wenn F
feiner ist als der Umgebungsfilter U(x) von x. Wir schreiben F → x dafür.
Die Tatsache F ⊇ U(x) ist wegen der Filtereigenschaft (F3) äquivalent zu
∀U ∈ U(x)∃F ∈ F : F ⊆ U. (12.17)
12.7.16 Bemerkung. Sind X und Y zusätzlich mit Topologien versehen, so bedeutet die Tatsache, dass f bei x stetig ist (vgl.
Definition 12.3.1) gerade, dass jede Menge aus dem Filter U( f (x)) eine Menge aus f (U(x)) enthält, bzw. dass U( f (x)) ⊆
f (U(x)), oder dass f (U(x)) → f (x).
Ist nun F → x, so folgt F ⊇ U(x) und weiter f (F) ⊇ f (U(x)) ⊇ U( f (x)), also f (F) → f (x).
Gelte umgekehrt diese Eigenschaft. Wegen U(x) → x folgt f (U(x)) → x und damit die Stetigkeit von f bei x.
12.7.17 Bemerkung. Die Charakterisierung der Stetigkeit in Bemerkung 12.7.16 ähnlt nicht zufällig der Charakterisierung
der Stetigkeit mit Netzen. In der Tat gibt es einen engen Zusammenhang von Netzen und Filtern:
Sei (I, ) eine gerichtete Menge, so ist
{{i : i k} : k ∈ I}
wegen {i : i j} ⊆ {i : i k} ∩ {i : i l} für ein j k, l eine Filterbasis (vgl. Bemerkung 12.1.8).

Ist nun (xi )i∈I ein Netz in einem topologischen Raum (X, T ), so erzeugt nach Lemma 12.7.14
{{xi : i k} : k ∈ I}

einen Filter F =: F (xi )i∈I auf X. Die Konvergenz von (xi )i∈I gegen ein x ∈ X bedeutet gerade
∀U ∈ U(x) : ∃k ∈ I : {xi : i k} ⊆ U,
was aber genau F ⊇ U(x) bzw. F → x bedeutet.

Ist umgekehrt F ein Filter, so definiert
I = {(y, F) ∈ X × F : y ∈ F}
mit der Relation (y1 , F1 ) (y2 , F2 ) :⇔ F1 ⊇ F2 eine gerichtete Menge. Die Richtungseigenschaft folgt dabei aus der
Filtereigenschaft (F2). Weiters sei (xi )i∈I definiert durch xi = y, wenn i = (y, F).
Die Tatsache, dass F → x, daher (12.17), bedeutet aber nun gerade, dass (xi )i∈I → x.
Schließlich ist der von diesem Netz erzeugte Filter gerade F, daher F (xi )i∈I = F.
In unserem Zusammenhang ist es entscheidend, dass sich Kompaktheit mit Hilfe des Begriffes der Filterkonvergenz
charakterisieren lässt.
12.7.18 Proposition. Für einen topologischer Raum (X, T ) sind äquivalent:
(i) (X, T ) ist kompakt.
(ii) Zu jedem Filter auf X gibt es einen in X konvergenten feineren Filter.
(iii) Jeder Ultrafilter auf X konvergiert.
Beweis. Gelte (i), und sei F ein Filter auf X. Wegen der Filtereigenschaft hat das Mengensystem {F : F ∈ F} die endliche
T
Durchschnittseigenschaft. Gemäß Proposition 12.7.2 folgt F∈F F , ∅ und für ein x aus dieser Menge, dass U ∩ F , ∅ für
alle U ∈ U(x) und F ∈ F. Somit ist {U ∩ F : U ∈ U(x), F ∈ F} eine Filterbasis eines Filters G, der sicher G ⊇ F und
G ⊇ U(x) erfüllt; also G → x.
Gilt (ii), und ist F ein Ultrafilter auf X, so stimmt jede konvergente Verfeinerung von F mit F überein; also gilt (iii).
Gelte nun (iii), und sei M ein Mengensystem bestehend aus abgeschlossenen Mengen mit der endlichen Durch-
schnittseigenschaft. Insbesondere ist damit {M1 ∩ · · · ∩ Mn : n ∈ N; M1 , . . . , Mn ∈ M} die Filterbasis eines Filters G auf
X. Ist nun F ⊇ G ⊇ M gemäß Proposition 12.7.13 ein Ultrafilter, und ist x eine Grenzwert davon, dh. F ⊇ U(x), so folgt
T T
insbesondere U ∩ M , ∅ für alle U ∈ U(x) (⊆ F) und alle M ∈ M (⊆ F), bzw. x ∈ M∈M M = M∈M M.
❑
Wir haben jetzt alle Hilfsmittel für den Beweis des Satzes von Tychonoff zusammengetragen.
Beweis. (Satz 12.7.11) Wir setzten Y Y
X := Xi und T := Ti ,
i∈I i∈I
und bezeichnen mit πi : X → Xi die Projektion auf die i-te Komponente. Da T die Produkttopologie ist, ist πi : (X, T ) →
(Xi , Ti ) stets stetig.
Setzt man voraus, dass (X, T ) kompakt ist, so ist jeder Raum (Xi , Ti ) als stetiges Bild eines kompakten Raumes eben-
falls kompakt, vgl. Lemma 12.7.8.
Für die Umkehrung sei nun vorausgesetzt, dass (Xi , Ti ) für jedes i ∈ I kompakt ist. Sei F ein Ultrafilter auf X. Für
jedes i ∈ I folgt aus Lemma 12.7.14, dass πi (F) ein Ultrafilter auf Xi ist. Nach Proposition 12.7.18 konvergiert πi (F) gegen
einen Punkt xi ∈ Xi . Setze x := (xi )i∈I (∈ X), Q
so wollen wir zeigen, dass F gegen x konvergiert.
Betrachte eine Menge der Gestalt U = i∈I Ui wobei Ui ∈ U(xi ), i ∈ I, und Ui = Xi für alle bis auf endlich viele i ∈ I.
Da πi (F) gegen xi konvergiert, gilt Ui ∈ πi (F) für alle i ∈ I, und daher π−1 i (Ui ) ∈ F. Sind i1 , . . . , in ∈ I jene Indizes mit
T
Ui , Xi , dann folgt U = nk=1 π−1i (Uik ) ∈ F.
Da die Mengen U von dieser Gestalt eine Umgebungsbasis von x bezüglich der Produkttopologie bilden, folgt
U(x) ⊆ F.
❑
12.8 Kompaktheit in metrischen Räumen

In diesem Abschnitt wollen wir uns speziell kompakte metrische Räume anschauen.
Im ersten Semester haben wir die Kompaktheit einer Teilmenge K eines metrischen
Raumes (X, d) so definiert, dass jede Folge eine gegen einen Punkt aus K konvergente
Teilfolge hat.
Wir werden hier unter anderem sehen, dass die Definition aus dem ersten Semester
mit der aus Definition 12.7.1 übereinstimmt. Außerdem werden wir die Kompaktheit
auch mit Hilfe des folgenden Begriffes charakterisieren.
12.8.1 Definition. Sei (X, d) ein metrischer Raum und sei M ⊆ X. Die Menge M heißt
total beschränkt, wenn es zu jedem ǫ > 0 endlich viele Teilmengen M1 , . . . , Mn ⊆ M
vom Durchmesser d(M j ) := sup x,y∈M j d(x, y) kleiner als ǫ gibt, sodass M = M1 ∪ · · · ∪
Mn .
12.8.2 Fakta.
1. Man sieht sofort, dass Teilmengen von total beschränkten Mengen wieder total
beschränkt sind.
2. Da einerseits Kugeln mit Radius ǫ einen Durchmesser kleiner oder gleich 2ǫ
haben und da andererseits jede Teilmenge M j ⊆ M mit d(M j ) < ǫ für ein be-
liebiges η j ∈ M j in Uǫ (η j ) enthalten ist, lässt sich totale Beschränktheit auch
folgendermaßen charakterisieren:
Zu jedem ǫ > 0 gibt es y1 , . . . , yn ∈ M, sodass M ⊆ Uǫ (y1 ) ∪ · · · ∪ Uǫ (yn ).
12.8. KOMPAKTHEIT IN METRISCHEN RÄUMEN 167
3. Ist M j ⊆ X und sind x, y ∈ M j , so gibt es wegen Lemma 5.1.13 gegen x

bzw. y konvergente Folgen (xn )n∈N und (yn )n∈N aus M j . Somit folgt d(x, y) =
limn→∞ d(xn , yn ) ≤ d(M j ), und daher d(M j ) = d(M j ).
Ist M total beschränkt und ǫ > 0, so gilt M = M1 ∪ · · · ∪ Mn mit d(M j ) < ǫ, j =
1, . . . , n. Es folgt nunmehr M = M1 ∪ · · · ∪ Mn mit d(M j ) < ǫ, j = 1, . . . , n,
womit auch M total beschränkt ist.
Ist M schon selbst abgeschlossen, so erkennt man daraus, dass man die Mengen
M j auch abgeschlossen wählen kann.
12.8.3 Satz. Sei K eine Teilmenge eines metrischen Raumes (X, d). Dann sind äquiva-
lent:
(i) K ist kompakt im Sinne von Definition 12.7.1.
(ii) Jede unendliche Teilmenge von K hat einen Häufungspunkt in K.
(iii) Jede Folge in K hat eine gegen einen Punkt in K konvergente Teilfolge.
(iv) K ist total beschränkt und (K, d|K×K ) ist ein vollständiger metrischer Raum.
Beweis.
(i) ⇒ (ii): Sei M ⊆ K unendlich. Hätte M keinen Häufungspunkt in K, so gibt es zu

jedem y ∈ K ein ǫ(y) > 0, sodass (vgl. Definition 5.1.7)
M ∩ Uǫ(y) (y) ⊆ {y}.
Da y ∈ K beliebig war, ist {Uǫ(y) (y) : y ∈ K} eine offene Überdeckung von

K, die voraussetzungsgemäß eine endliche Teilüberdeckung hat. Also gibt es
y1 , . . . , yk ∈ K, sodass K ⊆ Uǫ(y1 ) (y1 ) ∪ · · · ∪ Uǫ(yk ) (yk ). Somit erhalten wir
M = M ∩ K ⊆ M ∩ (Uǫ(y1 ) (y1 ) ∪ · · · ∪ Uǫ(yk ) (yk )) ⊆ {y1 , . . . , yn },
womit M aber endlich wäre.
(ii) ⇒ (iii): Habe jede unendliche Teilmenge von K einen Häufungspunkt in K, und
sei (xn )n∈N eine Folge aus K. Ist {xn : n ∈ N} endlich, so gilt sicherlich xn = x
für ein x ∈ K und für unendlich viele n ∈ N. Somit hat (xn )n∈N eine Teilfolge, die
konstant gleich x ist. Also ist x ein Häufungspunkt unserer Folge.
Anderenfalls ist {xn : n ∈ N} ⊆ K unendlich, und laut Voraussetzung hat sie
einen Häufungspunkt x in K. Da jede ǫ-Kugel um x unendlich viele Punkte aus
{xn : n ∈ N} enthält (vgl. Bemerkung 5.1.8), muss für N ∈ N jede ǫ-Kugel auch
unendlich viele Punkte aus {xn : n ∈ N, n ≥ N} enthalten. Insbesondere gilt
x ∈ {xn : n ∈ N, n ≥ N}. Nach Lemma 5.2.2 ist x Häufungspunkt von (xn )n∈N .
(iii) ⇒ (iv): Angenommen M wäre nicht total beschränkt. Dann gibt es ein ǫ > 0, so-
dass, wenn immer M1 , . . . , Mn endlich viele Teilmengen von K sind mit Durch-
messer < ǫ, niemals M1 ∪ · · · ∪ Mn = K ist. Aus dieser Tatsache werden wir nun
auf die Existenz einer Folge ohne Häufungspunkt schließen.
Sei x1 ∈ K beliebig. Angenommen wir haben x1 , . . . , xk ∈ K definiert, dann
hat für j ∈ {1, . . . , k} nach der Dreiecksungleichung die Kugel U 3ǫ (x j ) einen
Durchmesser ≤ 2ǫ3 . Wegen unserer Wahl von ǫ ist (U 3ǫ (x1 ) ∪ · · · ∪ U 3ǫ (xk )) ∩ K

eine echte Teilmenge von K. Wir wählen
xk+1 ∈ K \ (U 3ǫ (x1 ) ∪ · · · ∪ U 3ǫ (xk )).
Diese induktiv definierte Folge (xk )k∈N hat offensichtlich die Eigenschaft, dass
für k ∈ N der Punkt xk nicht in U 3ǫ (x1 )∪· · ·∪U 3ǫ (xk−1 ) liegt, und somit d(xk , xl ) ≥
ǫ
3 für l < k.
Damit kann keine Teilfolge von (xk )k∈N eine Cauchyfolge sein und schon gar
nicht konvergieren. Das widerspricht aber der Voraussetzung (iii).
Es bleibt die Vollständigkeit von (K, d|K×K ) zu zeigen. Dazu sei (xk )k∈N eine
Cauchyfolge in K. Diese hat voraussetzungsgemäß eine konvergente Teilfolge.
Gemäß Lemma 3.4.9 ist (xk )k∈N konvergent.
(iv) ⇒ (i): Zunächst folgt wegen Lemma 9.1.10 aus der Vollständigkeit, dass K abge-
schlossen ist. Sei nun U eine offene Überdeckung von K, und sei angenommen,
dass U keine endliche Teilüberdeckung enthält.
Die Menge K ist gleich der Vereinigung von endlich vielen abgeschlossenen
Mengen mit Durchmesser kleiner als 1. Mindestens eine von diesen Mengen
kann nicht durch endlich viele Mengen aus U überdeckt werden. Diese sei K1 .
Die Menge K1 ist gleich der Vereinigung von endlich vielen abgeschlossenen
Mengen mit Durchmesser kleiner als 12 enthalten ist. Mindestens eine von diesen
kann nicht durch endlich viele Mengen aus U überdeckt werden. Diese sei K2 .
Verfährt man induktiv weiter, so erhält man eine Folge
K ⊇ K1 ⊇ K2 ⊇ K3 ⊇ . . .
1
von abgeschlossenen Mengen, sodass Kn einen Durchmesser kleiner als n hat,
und kein Kn durch endlich viele Mengen aus U überdeckt werden kann.
Wähle xn ∈ Kn . Dann ist (xn )n∈N eine Cauchy-Folge. Sei x ∈ K, sodass xn → x.
Also existiert V ∈ U mit x ∈ V. Da V offen ist, gibt es eine Kugel Uǫ (x) ⊆ V.
Sei n ∈ N, sodass 1n < 2ǫ und d(xn , x) < 2ǫ . Da der Durchmesser von Kn kleiner
als n1 ist, folgt für y ∈ Kn :
d(x, y) ≤ d(x, xn ) + d(xn , y) < ǫ.
Also ist Kn ⊆ V, im Widerspruch zur Tatsache, dass Kn nicht durch endlich viele
Mengen aus U überdeckt werden kann.
❑
12.8.4 Bemerkung. Eine Situation, wo obiger Satz Anwendung findet, ist die, dass
(X, d) ein vollständig metrischer Raum ist, und dass G eine total beschränkte Teilmenge
von X ist. Der Abschluss K von G ist dann auch total beschränkt und vollständig, also
kompakt.
12.8.5 Bemerkung. Satz 12.8.3 besagt insbesondere, dass in metrischen Räumen die Begriffe kompakt, abzählbar kompakt
und folgenkompakt zusammenfallen, vgl. Definition 12.7.5.
12.8. KOMPAKTHEIT IN METRISCHEN RÄUMEN 169
12.8.6 Korollar. Sei (X, d) ein metrischer Raum. Ist K ⊆ X kompakt, dann ist K separabel, hat also eine dichte abzählbare
Teilmenge.
Beweis. Nach Satz 12.8.3 gibt es zu n ∈ N endlich viele Punkte xn1 , . . . , xnm(n) ∈ K, sodass
U 1 (xn1 ) ∪ · · · ∪ U 1 (xnm(n) ) ⊇ K. (12.18)

n n
S n n
Setzen wir D := n∈N {x1 , . . . , xm(n) }, so ist D sicher eine abzählbare Teilmenge von K. Ist y ∈ K und ǫ > 0, so sei n ∈ N so
1 1
groß, dass ǫ ≤ n. Wegen (12.18) gibt es ein j ∈ {1, . . . , m(n)} mit d(y, xnj ) < n ≤ ǫ und daher xnj ∈ Uǫ (y). Also ist y ∈ D.
❑
12.8.7 Proposition. Ein metrischer Raum (X, d) ist genau dann separabel, wenn er das zweite Abzählbarkeitsaxiom erfüllt,
also eine abzählbare Basis hat.
Beweis. Ist B eine abzählbare Basis von T (d), so sei xB irgendein Punkt aus B für jede nichtleere Teilmenge B ∈ B.
Klarerweise ist D := {xB : ∅ , B ∈ B} abzählbar. Ist y ∈ X und O ∋ y offen, so gilt sicher y ∈ B ⊆ O für ein B ∈ B. Somit
gilt O ∩ D ∋ xB und daher y ∈ D. Also ist X separabel.
Ist umgekehrt (X, d) separabel mit einer abzählbaren und dichten Teilmenge D ⊆ X, so besteht B := {U 1 (x) : n ∈
n
N, x ∈ D} sicherlich aus abzählbar vielen Mengen. Ist nun O ⊆ X offen, so sei für jedes y ∈ O die Zahl n(y) ∈ N so groß,
dass U 2 (y) ⊆ O. Wir zeigen nun, dass
n(y) [
O= U 1 (x), (12.19)
n
x∈D∪O
n∈N:U 1 (x)⊆O
n
und somit dass B eine Basis von T (d) ist. Klarerweise ist die rechte Seite in O enthalten. Ist y ∈ O, so gibt es wegen der
Dichtheit ein x ∈ D ∩ U 1 (y) ⊆ D ∩ O. Somit folgt y ∈ U 1 (x) und für jedes t ∈ U 1 (x)
n(y) n(y) n(y)
1 1 2
d(t, y) ≤ d(t, x) + d(x, y) < + = ,
n(y) n(y) n(y)
also t ∈ U 2 (y) und somit U 1 (x) ⊆ U 2 (y) ⊆ O. Also liegt jedes y ∈ O in der Vereinigung auf der rechten Seite von
n(y) n(y) n(y)
(12.19).
❑
12.8.8 Bemerkung. Da wir im ersten Beweisteil nicht verwendet haben, dass T (d) eine metrische Topologie ist, gilt allge-
mein in topologischen Räumen, dass aus (ABII) die Separabilität folgt.
Ein wichtiges Beispiel von kompakten Teilmengen eines vollständigen metrischen

Raumes liefert uns der Satz von Ascoli. Dabei betrachtet man den Raum C(X, R) bzw.
C(X, C) aller beschränkten, stetigen und reell- bzw. komplexwertigen Funktionen auf
einem topologischen Raum (X, T ). Wir haben solche Räume schon kennengelernt, aber
nur im Fall von metrischen Räume X.
Wir wollen zunächst bemerken, dass wenn X kompakt ist, jede stetige Funktion f
automatisch beschränkt ist, denn nach Lemma 12.7.8 ist dann f (X) kompakt und nach
Proposition 5.2.11 ist f (X) beschränkt.
12.8.9 Lemma. Die Räume C(X, R) und C(X, C) sind abgeschlossene Teilräume der
Banachräume B(X, R) und B(X, C) versehen mit k.k∞ und daher selbst Banachräume.
Beweis. Wir wissen aus Beispiel 9.1.12, dass B(X, R) und B(X, C) Banachräume sind.
Laut Definition sind C(X, R) und C(X, C) Teilmengen von B(X, R) bzw. B(X, C).
Wegen Korollar 12.5.12 sind sie sogar lineare Teilräume.
Sei nun fn ∈ C(X, R) (C(X, C)) mit fn → f in B(X, R) (B(X, C)) bezüglich k.k∞ ,
also gleichmäßig. Ist x ∈ X und (x j ) j∈J ein gegen x konvergentes Netz, so wissen wir
aus Lemma 8.7.1, dass lim j∈J limn→∞ fn (x j ) = lim j∈J f (x j ) existiert und mit
lim lim fn (x j ) = lim fn (x) = f (x)

n→∞ j∈J n→∞
übereinstimmt. Da das Netz beliebig war, ist f stetig, dh. f ∈ C(X, R) (C(X, C)).
❑
12.8.10 Satz (Ascoli). Sei (X, T ) ein kompakter topologischer Raum und sei Sei Φ
eine punktweise beschränkte und gleichgradig stetige Teilmenge von C(X, C), d.h. sei
Φ ⊆ C(X, C), und es gelte:
(i) Für jedes x ∈ X ist sup{| f (x)| : f ∈ Φ} beschränkt.
(ii) Für jedes x ∈ X und ǫ > 0 gibt es eine Umgebung V ∈ U(x) mit | f (y) − f (x)| < ǫ
für alle y ∈ V, f ∈ Φ.
Dann ist Φ total beschränkt. Ist umgekehrt Φ total beschränkt, so gelten (i) und (ii).
Eine entsprechende Aussage gilt für C(X, R).
Beweis. Sei ǫ > 0 gegeben. Zu jedem x ∈ X können wir eine Umgebung V x von x
wählen, sodass (ii) für V = V x erfüllt ist. Da jede Umgebung von x eine x enthaltende
offene Menge enthält, können wir die V x offen wählen. Offensichtlich ist V x , x ∈ X,
eine offene Überdeckung von X.
S
Da X kompakt ist, existieren x1 , . . . , xn ∈ X, sodass schon X = ni=1 V xi und
| f (x) − f (xi )| < ǫ, x ∈ V xi , f ∈ Φ, i = 1, . . . , n.
Wegen (i) ist sicher
M := sup{ f (xi ) : i = 1, . . . , n, f ∈ Φ} < ∞.
Sei D die Kreisscheibe D := {λ ∈ C : |λ| ≤ M}. Dann haben wir eine Abbildung
p : Φ → Dn , definiert als

p( f ) := f (x1 ), . . . , f (xn ) .
Nun ist Dn ⊆ Cn kompakt und daher total beschränkt (vgl. Satz 12.8.3). Mit Dn ist auch
die Teilmenge p(Φ) von Dn total beschränkt, vgl. Fakta 12.8.2. Also existieren endlich
viele f1 , . . . , fm ∈ Φ, sodass für jedes f ∈ Φ immer |p( f ) − p( fk )| < ǫ, bzw. äquivalent
dazu
| f (xi ) − fk (xi )| < ǫ, i = 1, . . . , n .
für mindestens ein k ∈ {1, . . . , m}.
Jedes x ∈ X liegt in einer Menge V xi , und für dieses i gilt
| f (x) − f (xi )| < ǫ, | fk (x) − fk (xi )| < ǫ .
Es folgt
| f (x) − fk (x)| ≤ | f (x) − f (xi )| + | f (xi ) − fk (xi )| + | fk (x) − fk (xi )| < 3ǫ
für alle x ∈ X. Die Kugeln mit Radius 3ǫ und Mittelpunkt fk überdecken also ganz Φ,
und somit ist Φ total beschränkt.
Zur Umkehrung: Total beschränkte Mengen sind sicherlich beschränkt in
(C(X, C), k.k∞), und somit auch punktweise beschränkt, dh. es gilt (i).
Wegen der totalen Beschränktheit gibt es zu ǫ > 0 endlich viele f1 , . . . , fm ∈ Φ,
sodass es zu jedem f ∈ Φ ein fk mit k f − fk k∞ < ǫ gibt.
Zu einem x ∈ X gibt es wegen der Stetigkeit der fk ’s für k = 1, . . . , m Umgebungen
Vk ∈ U(x) mit | fk (y) − fk (x)| < ǫ für alle y ∈ Vk . Setzen wir V = V1 ∩ · · · ∩ Vm , so ist
V ∈ U(x) und für f ∈ Φ folgt für das richtige fk und y ∈ V
| f (y) − f (x)| < | f (y) − fk (y)| + | fk (y) − fk (x)| + | f (x) − fk (x)| < 3ǫ,
und somit (ii).
❑
12.9. ALEXANDROFF-KOMPAKTIFIZIERUNG LOKALKOMPAKTER RÄUME171
12.8.11 Korollar. Für Φ ⊆ C(X, C) ist Φ genau dann kompakt, wenn Φ punktweise
beschränkt und gleichgradig stetig ist. Insbesondere enthält in diesem Fall jede Folge
in Φ eine gleichmäßig konvergente Teilfolge.
Eine entsprechende Aussage gilt für C(X, R).
Eine wichtige Anwendung dieses Satzes gibt es in der Theorie der gewöhnlichen
Differentialgleichungen, wo dieser die Existenz von Lösungen von einer großen Klasse
von Differentialgleichungen liefert.
12.9 Alexandroff-Kompaktifizierung lokalkompakter

Räume
Ein einfaches Beispiel von lokalkompakten Räumen liefert der Satz von Bolzano-
Weierstraß. Dieser besagt ja, dass im Rn jede Menge der Form Kr (0) = {y ∈ Rn :
kyk ≤ r} und daher (vgl. Lemma 12.7.8) auch jede Menge der Form x + Kr (0) = Kr (x)
kompakt ist. Da diese Mengen einen Umgebungsbasis von x darstellen, ist der Rn lo-
kalkompakt.
12.9.1 Satz. Ein topologischer Hausdorff Raum (X, T ) ist genau dann lokal kompakt,
wenn er offene Teilmenge eines kompakten Hausdorff Raumes ist, d.h. wenn es einen
topologischen Hausdorff Raum (Y, O) gibt, der kompakt ist, sodass X eine offene Teil-
menge von Y ist, und sodass T = O|X .
Eine mögliche Wahl von Y ist die, dass man ein Y := X ∪ {∞} mit einem Element
∞ < X und
O = T ∪ {{∞} ∪ (X \ K) : X ⊇ K kompakt}
setzt.5 .
Beweis. Sei X ein offene Teilmenge des kompakten Raumes Y. Nach Lemma 12.7.10
ist Y insbesondere regulär. Also gibt es zu der Umgebung X von x eine Umgebung V
von x in Y, sodass V ⊆ X. Aus Lemma 12.7.7 folgt die Kompaktheit von V in Y. Wegen
Proposition 12.7.2, (K2), und O|V = (O|X )|V ist V auch kompakt in X, und daher ist X
lokalkompakt.
Nun sei umgekehrt (X, T ) lokalkompakt, und sei Y und O definiert, wie im Satz.
Da für eine kompakte Menge K ⊆ X immer X \ K in X offen ist, überprüft man leicht,
dass O eine Topologie auf Y ist, und dass X offen in Y ist.
Um zu zeigen, dass diese Hausdorffsch ist, seien x, y ∈ Y zunächst so, dass x, y ∈ X.
Dann gibt es disjunkte O x , Oy ∈ T ⊆ O mit x ∈ O x , y ∈ Oy , da ja (X, T ) vorausset-
zungsgemäß Hausdorffsch ist. Ist x ∈ X und y = ∞, so gibt es wegen der Lokal-
kompaktheit eine kompakte Umgebung V von x in X. Ist O x eine x enthaltende offene
Teilmenge von V, und ist Oy := {∞} ∪ (X \ V), so gilt Oy ∈ O und O x ∩ Oy = ∅.
Wir müssen noch zeigen, dass Y kompakt ist. Dazu sei {Oi : i ∈ I} eine offene
Überdeckung von Y. Insbesondere gibt es mindestens ein j ∈ I mit ∞ ∈ O j .
Nach Konstruktion der Topologie gilt O j = {∞} ∪ X \ K für eine kompakte Teil-
menge K von X. Nun ist sicherlich {Oi \ {∞} : i ∈ I} eine offene Überdeckung von
K. Also gibt es i1 , . . . , in ∈ I mit Oi1 ∪· · ·∪Oin ⊇ K, und daher Y = Oi1 ∪· · ·∪Oin ∪O j .
❑
5 Dieser Topologische Raum wir als Alexandroff-Kompaktifizierung bezeichnet.
12.9.2 Korollar. Lokalkompakte Hausdorffräume (X, T ) sind regulär. Zudem gibt es

zu jedem x ∈ X und jeder Umgebung U ∈ U(x) ein offenes P ⊆ X mit x ∈ P ⊆ P ⊆ U,
sodass P kompakt ist.
Beweis. Wegen Satz 12.9.1 können wir X als offene Teilmenge eines kompakten Haus-
dorffraumes (Y, O) mit T = O|X betrachten. Nach Lemma 12.7.10 ist (Y, O) regulär und
wegen Bemerkung 12.6.4 somit auch (X, T ).
Ist U ∈ U(x), so ist U auch Umgebung von x betrachtet als Teilmenge von Y.
Wegen Korollar 12.6.3 gibt es ein offenes P ⊆ Y, sodass x ∈ P ⊆ P ⊆ U, wobei P ad
hoc der Abschluss von P in Y ist. Nach Lemma 12.7.7 ist P kompakt, wegen P ⊆ X ist
P auch offen in X, und wegen P ⊆ X zusammen mit (12.13) ist P auch der Abschluss
von P in (X, T ).
❑
12.9.3 Beispiel. Man betrachte C ∪ {∞} versehen mit der chordalen Metrik χ. Ist O die
Topologie, die von χ auf C∪{∞} erzeugt wird, so ist (C∪{∞}, O) genau die Alexandroff-
Kompaktifizierung von C versehen mit der euklidischen Topologie.
12.9.4 Definition. Sei (X, T ) ein lokalkompakter Hausdorffraum. Dann bezeihnet

C0 (X, R) die Menge aller stetigen g : X → R, sodass
∀ǫ > 0 ∃K kompakt : ∀x ∈ X \ K ⇒ |g(x)| < ǫ.
Entsprechend definiert man C0 (X, C).
Wählt man etwa ǫ = 1 und K wie in der Definition, so ist t 7→ |g(t)| auf K wegen der
Kompaktheit beschränkt und auf X\K gilt ohnehin |g(x)| < 1. Also sind alle Funktionen
aus C0 (X, R) bzw. C0 (X, C) beschränkt.
12.9.5 Proposition. Bezeichne (Y, O) die Alexandroff-Kompaktifizierung des lokalkom-

pakten Hausdorffraumes (X, T ) wie in Satz 12.9.1.
Für f ∈ C(Y, R) (C(Y, C)) mit f (∞) = 0 liegt die Einschränkung g := f |X in

C0 (X, R) (C0 (X, C)).
Ist umgekehrt g ∈ C0 (X, R) (C0 (X, C)), und setzt man g zu einer Funktion f auf
Y durch f (∞) = 0 fort, so gilt f ∈ C(Y, R) (C(Y, C)).
Dabei ist f 7→ f |X eine lineare Bijektion von
N := { f ∈ C(Y, R) (C(Y, C)) : f (∞) = 0}
auf C0 (X, R) (C0 (X, C)), wobei k f k∞ = k f |X k∞ .
Schließlich ist die Hyperebene N abgeschlossen in C(Y, R) (C(Y, C), und

C0 (X, R) (C0 (X, C)) versehen mit der Supremumsnorm ist ein Banachraum.
Beweis.
Ist f ∈ C(Y, R) (C(Y, C)) mit f (∞) = 0, so ist klarerweise f |X stetig auf X bzgl.
O|X = T . Außerdem gibt es wegen der Stetigkeit von f bei ∞ zu jedem ǫ > 0
eine offene Umgebung von ∞, dh. eine kompakte Menge K in X, sodass | f (x) −
f (∞)| = | f (x)| < ǫ für alle x ∈ X \ K. Somit haben wir f |X ∈ C0 (X, R) (C0 (X, C)).
12.10. DER SATZ VON STONE WEIERSTRASS 173
Ist nun g ∈ C0 (X, R) (C0 (X, C)) und setzt man f (x) := g(x), x ∈ X und f (∞) := 0,
so ist f stetig auf Y, da die Bedingung ∀ǫ > 0 ∃K kompakt, sodass |g(x)| <
ǫ, x ∈ X \ K genau die Stetigkeit von f bei ∞ bedeutet, und da für x ∈ X wegen
der Tatsache, dass X offen in Y ist, die Stetigkeit von g bei x unmittelbar auf f
übertragen wird.
f 7→ f |X ist nun offensichtlich eine lineare Bijektion, wobei
k f k∞ = sup | f (x)| = sup | f (x)| = k f |X k∞ ,

x∈Y x∈X
da ja Y = X ∪ {∞} und f (∞) = 0.

Da N gerade der Kern ϕ−1 ({0}) des linearen Punktauswertungsfunktionals ϕ :
f 7→ f (∞) ist, und da dieses beschränkt und daher stetig ist, ist N als stetiges
Urbild der abgeschlossenen Menge {0} ⊆ R(C) selbst abgeschlossen.
Somit ist (N, k.k∞ ) ein Banachraum (vgl. Lemma 9.1.10) und wegen k f k∞ =
k f |X k∞ auch C0 (X, R) (C0 (X, C)).
12.10 Der Satz von Stone Weierstraß

Sei E irgendeine Menge. Dann heißt eine Menge A ⊆ B(E, R) (B(E, C)) von Funktio-
nen f : E → R (C) eine Algebra von Funktionen, falls gilt
(i) A ist ein linearer Teilraum.
(ii) Mit f, g ∈ A ist auch f · g ∈ A.
Ist E mit einer Topologie versehen, so folgt aus der Tatsache, dass das Produkt von
zwei stetigen Funktion wieder stetig ist (vgl. Korollar 12.5.12), dass die Menge aller
beschränkten und stetigen Funktionen eine Algebra darstellt.
12.10.1 Lemma. Sei A eine Algebra auf einer Menge E und bezeichne B den Ab-
schluss von A in B(E, R) (B(E, C)) (bzgl. k.k∞ ). Dann ist B wieder eine Algebra.
Beweis. Nach Lemma 9.1.11 ist B ein linearer Teilraum von B(E, R) bzw. B(E, C).
Seien fn , gn ∈ A, fn → f, gn → g. Dann folgt
k fn gn − f gk∞ = k fn k∞ kgn − gk∞ + k fn − f k∞ kgk∞ → 0
da k fn k∞ beschränkt ist. Also ist mit f, g ∈ B auch f g ∈ B.

❑
12.10.2 Definition. Sei A eine Algebra auf E. Man sagt A ist punktetrennend, falls
es zu je zwei verschiedenen Punkten x1 , x2 ∈ E eine Funktion f ∈ A gibt mit f (x1 ) ,
f (x2 ). Man nennt die Algebra A ist nirgends verschwindend, falls es zu jedem x ∈ E
ein f ∈ A gibt, sodass f (x) , 0.
Enthält A eine konstante Funktion ungleich der Nullfunktion, so ist A offensicht-
lich nirgends verschwindend.
)
12.10.3 Bemerkung. Für x1 , x2 ∈ E, x1 , x2 , ist φ x1 ,x2 : f 7→ ff (x
(x2 ) als Abbildung von
1
A nach R2 linear.
Ist für jedes solche Paar x1 , x2 diese Abbildung surjektiv, dh. für alle c1 , c2 ∈ R gibt
es eine Funktion f ∈ A mit f (x1 ) = c1 , f (x2 ) = c2 , so ist A offensichtlich punktetren-
nend und nirgends verschwindend.
Ist A umgekehrt nirgends verschwindendund punktetrennend, so enthält φ x1 ,x2 (A)
wegen der Linearität einen Vektor der Form d1 , einen Vektor der Form 1c und einen

der Form ef mit e , f .
Ist cd , 1, so sind die ersten beiden Vektoren linear unabhängig. Ist c = d = 1, so
sind die ersten beiden gleich und der letzte dazu
linear
unabhängig. Fallscd =10 , c,
so ist - da A sogar eine Algebra ist - auch dc = d·1 1·c
∈ φ x1 ,x2 (A). Nun ist 00 , 1−d =
c c 1
1 − d ∈ φ x1 ,x2 (A) linear unabhängig von d . In jedem Fall ist der Teilraum φ x1 ,x2 (A)
von R2 mindestens zwei-dimensional, dh. φ x1 ,x2 (A) = R2 .
12.10.4 Satz (Stone-Weierstraß). 6 Sei (K, T ) ein kompakter topologischer Raum und
sei A ⊆ C(K, R) eine punktetrennende, nirgends verschwindende Algebra stetiger
Funktionen. Dann ist A dicht in der Algebra C(K) := C(K, R) aller stetigen Funk-
tionen auf K.
Beweis. Nach Lemma 12.10.1 ist der Abschluss B von A in B(K, R) ein Algebra. Da
C(K, R) abgeschlossen in B(K, R) ist, haben wir auch B ⊆ C(K, R). Der Beweis erfolgt
nun in vier Schritten:
(i) Ist f ∈ B, so zeigen wir, dass auch | f | ∈ B.

Nach Bemerkung 9.6.2 (bzw. nach dem Satz von Weierstraß, Satz 9.7.5) kann die
stetige Funktion y 7→ |y| auf dem Intervall [−k f k∞ , k f k∞ ] beliebig gut gleichmäßig
durch Polynome approximiert werden. Also gibt es zu ǫ > 0 ein reelles Polynom
pǫ (y), sodass
pǫ (y) − |y| ≤ ǫ, y ∈ [−k f k∞ , k f k∞ ].
P
Setzt man y = 0, so folgt |pǫ (0)| ≤ ǫ. Damit gilt für mj=1 a j y j := pǫ (y) − pǫ (0)
Xm
a j y j − |y| ≤ 2ǫ, y ∈ [−k f k∞ , k f k∞ ].
j=1
Pm j
Da B eine Algebra ist, gilt j=1 a j f ∈ B und
X
m
k a j f j − | f | k∞ ≤ 2ǫ.
j=1
Da ǫ > 0 beliebig war und da B abgeschlossen ist, folgt | f | ∈ B.
(ii) Sind f1 , . . . , fn ∈ B, so gilt auch max( f1 , . . . , fn ) und min( f1 , . . . , fn ) in B, dann

für n = 2 hat man
f1 + f2 | f1 − f2 |
max( f1 , f2 ) = + ,
2 2
6 Marshall Harvey Stone, geb.8.4.1903 New York, gest.9.1.1989 Madras (Indien)
f1 + f2 | f1 − f2 |
min( f1 , f2 ) = − ,
2 2
und für n > 2 folgt die Behauptung durch vollständiger Induktion.
(iii) Ist f ∈ C(K), x ∈ K, ǫ > 0, dann existiert eine Funktion g x ∈ B mit g x (x) = f (x)
und g x (t) > f (t) − ǫ, t ∈ K.
Um das zu sehen, bemerken wir zunächst, dass mit A ist auch B (⊇ A) punk-
tetrennend und nirgends verschwindend ist. Wegen Bemerkung 12.10.3 existiert
für jedes y ∈ K eine Funktion hy ∈ B mit
hy (x) = f (x), hy (y) = f (y).
Wegen der Stetigkeit von f − hy bei y existiert eine offene Umgebung Uy von y,
sodass insbesondere
hy (t) > f (t) − ǫ, t ∈ Uy .
Da K kompakt ist, existieren endlich viele Punkte y1 , . . . , yn ∈ K mit
K ⊆ U y1 ∪ . . . ∪ U yn .
Setzt man g x := max(hy1 , . . . , hyn ), dann ist g x ∈ B und hat die gewünschten
Eigenschaften.
(iv) Ist f ∈ C(K) und ǫ > 0, so existiert h ∈ B mit k h − f k∞ < ǫ.
Dazu betrachte die Funktionen g x , x ∈ K, aus (iii). Da g x − f bei x stetig ist,
existiert eine offene Umgebung V x von x mit
g x (t) < f (t) + ǫ, t ∈ V x .
Da K kompakt ist, existieren x1 , . . . , xm ∈ K mit
K ⊆ V x1 ∪ . . . ∪ V xm .
Setzt man nun h := min(g x1 , . . . , g xm ), dann ist h ∈ B und erfüllt h(t) < f (t) + ǫ, t ∈
K. Mit den g x hat aber auch h die Eigenschaft h(t) > f (t) − ǫ.
❑
12.10.5 Beispiel. Sei [a, b] ein kompaktes Intervall in R und sei A := R[x]|[a,b] der
Raum aller Polynome mit reellen Koeffizienten betrachtet als Funktionen auf [a, b]. Of-
fensichtlich ist A eine Algebra besthend auf stetigen Funktionen, die alle linearen Po-
lynome also alle Geraden enthält. A ist daher punktetrennend und nirgends verschwin-
dend. Nach dem Satz von Stone-Weierstraß ist A (bzgl.k.k∞) dicht in C([a, b], R), vgl.
auch Satz 9.7.5.
12.10.6 Beispiel. Betrachte die Funktionen f (x) = x − 21 , g(x) = x − x2 , auf [0, 1]. Da
g gerade und f ungerade bzgl. x = 12 ist, gilt
Z1
f (t)gn (t)dt = 0, n = 0, 1, 2, . . . . (12.20)
0
Für welche Funktionen f ∈ C[0, 1] impliziert (12.20) schon f = 0?

Ist f ungerade bzgl. 21 , so gilt (12.20) natürlich genauso wie für die Funktion x − 12 .
Sei also f nicht ungerade. Schreibe f = a + b mit a( 21 + t) = −a( 21 − t), t ∈ [0, 12 ), b(t) =
0, t ∈ [0, 21 ].
Es gilt
Z1 Z1 Z1 Z1
n n n
0= f g dt = ag dt + bg dt = bgn dt. (12.21)
0 0 0 1
2
Betrachte die Algebra aller Polynome in g auf der Menge [ 12 , 1]

nX
n o
A := ci gi (x) .
i=0
Die Beziehung (12.21) besagt

Z1
bh dt = 0, h ∈ A. (12.22)
1
2
Nun ist A punktetrennend und nirgends verschwindend. Dazu seien x1 , x2 ∈ [ 21 , 1].

Sei zunächst x2 , 1. Betrachte
g(x) . g(x1 )
h(x) := 1 − 1− ,
g(x2 ) g(x2 )
dann ist h ∈ A und es gilt h(x1 ) = 1, h(x2) = 0. Sei nun x2 = 1, dann ist x1 , 1.
Betrachte
g(x)
h(x) = ,
g(x1 )
dann ist wieder h(x1 ) = 1, h(x2) = 0.
Nach dem Satz von Stone-Weierstraß ist A (bzgl.k.k∞ ) dicht in C([ 21 , 1]) und daher
impliziert (12.22)
Z1
1
bh dt = 0, h ∈ C([ , 1]).
2
1
2
Es folgt b = 0, d.h. f ungerade.

12.10.7 Korollar. Sei A ⊆ C(K, C) eine punktetrennende und nirgends verschwin-
dende Algebra stetiger Funktionen auf einer kompakten Menge K, sodass mit f ∈ A
auch die komplex konjugierte Funktion f¯ ∈ A ist. Dann ist A dicht in der Algebra
C(K) := C(K, C) aller stetigen Funktionen auf K.
Beweis. Man betrachte die Menge AR aller f ∈ A, sodass f nur Werte in R hat.
¯ − f¯
Nach Voraussetzung ist mit f auch Re f = f +2 f und Im f = f 2i in A, und somit
Re f, Im f ∈ AR .
Daraus erkennt man leicht, dass AR auch punktetrennend ist. Nach Satz 12.10.4
folgt, dass AR dicht in C(K, R) ist.
Ist h ∈ C(K, C), so gibt es also zwei Folgen fn , gn ∈ AR mit fn → Re f, gn → Im f .
Daher fn + ign → f und A ist dicht C(K, C).
❑
12.10.8 Beispiel. Man betrachte C(T, C) und die lineare Hülle A in C(T, C) von {(ζ 7→
ζ n ) : n ∈ Z}. A sind dann alle Trigonometrischen Polynome.
Da für ζ ∈ T die Beziehung ζ̄ = 1ζ gilt, ist A invariant unter der komplexen Konju-
gation.
Weiters ist A punktetrennend, da für ζ1 , ζ2 ∈ T und c1 , c2 ∈ C
ζ − ζ1 ζ − ζ2
p(ζ) = c2 + c1
ζ2 − ζ1 ζ1 − ζ2
eine Funktion in A mit p(ζ1 ) = c1 und p(ζ2 ) = c2 ist. Nach obigen Satz ist A dicht in
C(T, C).
Da C(T, C) isomorph zu den stetigen, 2π-periodischen Funktionen P auf R ist, folgt
daraus auch, dass die lineare Hülle der Funktionen t 7→ exp(itn), n ∈ Z dicht in P ist.
Da diese Hülle mit der der Funktionen t 7→ sin(nt), n ∈ N; t 7→ cos(nt), n ∈ N ∪ {0} übereinstimmt, kennen wir diese
Tatsache schon aus Satz 9.7.2.
Wir wollen nun eine Version des Satzes von Stone-Weierstraß für lokalkompakte
Hausdorff Räume (X, T ) herleiten.
12.10.9 Korollar. Sei (X, T ) ein lokalkompakter Hausdorff Raum, und sei A ⊆
C0 (X, R) (C0 (X, C)) eine punktetrennende, nirgends verschwindende Algebra, die im
komplexen Falle unter der komplexen Konjugation abgeschlossen ist.
Dann ist A dicht in C0 (X) := C0 (X, R) (C0 (X, C)).
Beweis. Aus Proposition 12.9.5 wissen wir, dass C0 (X) isometrisch isomorph zu N ⊆
C(Y) ist. Also können wir A auch als Algebra in C(Y) betrachten. Als solche ist sie
aber nicht mehr nirgends verschwindende, da ja f (∞) = 0, f ∈ A.
Um diesen Nachteil zu beheben, betrachten wir B := A + h1Y i, also die lineare
Hülle von A und der konstanten 1-Funktion auf Y. Nun überprüft man leicht, dass B
eine punktetrennende, nirgends verschwindende Algebra auf Y ist (siehe Bemerkung
12.10.3). Nach Satz 12.10.4 bzw. Korollar 12.10.7 ist B dicht in C(Y).
Ist jetzt f ∈ C0 (X), so gibt es daher eine Folge gn ∈ B mit gn → f bzgl. k.k∞ .
Insbesondere gilt gn (∞) → f (∞) = 0, und somit
n→∞
fn := gn − gn (∞) · 1Y −→ f − 0 · 1Y = f.
Nun ist aber fn (∞) = 0, also fn ∈ A, und wir sehen, dass A dicht in C0 (X) ist.
❑
12.10.10 Beispiel. Sei D eine offene Teilmenge von Rn . Als offene Teilmenge eines
lokalkompakten Raumes ist D auch lokalkompakt.
∞
Nun sei A die Menge C00 (D) aller auf D unendlich oft differenzierbaren reell-
bzw. komplexwertigen Funktionen f mit kompakten Träger, d.h. der Abschluss von
{x ∈ D : f (x) , 0} ist eine kompakte Teilmenge von D.
∞ ∞
Da das Produkt zweier Funktionen f, g ∈ C00 (D) wieder in C00 (D) liegt, überprüft
man leicht, dass A eine Algebra ist. Um Korollar 12.10.9 anwenden zu können, müssen
wir nur noch zeigen, dass A punktetrennend ist.
Dazu betrachte man zunächst die Grundfunktion ψ : R → R
( 1
exp(1 − 1−x 2) , falls |x| < 1
ψ(x) := .
0 , falls |x| ≥ 1
Diese ist beliebig oft differenzierbar. Für ein x0 ∈ D und δ > 0, sodass Kδ (x0 ) ⊆ D, sei
kx − x0 k2
f x0 ,δ (x) := ψ( ).
δ
Man sieht unmittelbar, dass der Träger von f x0 ,δ in der kompakten Menge Kδ (x0 ) ent-
∞
halten ist, und dass f x0 ,δ auf D beliebig oft differenzierbar ist. Also f x0 ,δ ∈ C00 (D).
Sind nun x1 , x2 ∈ D, c1 , c2 ∈ R (C), und ist 3δ ≤ kx1 − x2 k2 , so hat die Funktion
c1 f x1 ,δ + c2 f x2 ,δ Werte c1 bei x1 und c2 bei x2 .
∞
Also können wir Korollar 12.10.9 anwenden, und erhalten, dass C00 (D) dicht in
C0 (D) ist.
Lemma von Zorn
In diesem Anhang wollen wir insbesondere einen Beweis des Lemmas von Zorn bringen, das im Beweis des Satzes von
Tychonoff, Satz 12.7.11, verwendet wurde.
Ordnungen
12.10.11 Definition. Sei M eine Menge, und eine Relation auf M, d.h. ist eine Teilmenge von M × M. Dann heißt
Halbordnung auf M, oder kurz (M, ) Halbordnung, falls folgende drei Axiome gelten:
Reflexiv: x ∈ M ⇒ x x.
Antisymmetrisch: x y ∧ y x ⇒ x = y.
Transitiv: x y ∧ y z ⇒ x z.
Eine Halbordnung (M, ) heißt Totalordnung, falls je zwei Elemente Elemente vergleichbar sind, d.h.
x, y ∈ M ⇒ x y ∨ y x.
12.10.12 Definition. Sei eine Halbordnung auf der Menge M.

Ist R ⊆ M, dann heißt y obere (untere) Schranke von R, falls x y (y x) für alle x ∈ R.
Ist R ⊆ M, dann heißt ein m ∈ R maximales (minimales) Element von R, falls aus x ∈ R ∧ m x (x ∈ R ∧ x m) folgt,
dass x = m. Ein maximales (minimales) Element m heißt größtes (kleinstes) Element von R, wenn x m (m x) für alle
x ∈ R.
Ist R ⊆ M, dann heißt y Supremum oder kleinste obere Schranke (Infimum oder größte unter Schranke) von R, falls y
eine obere (untere) Schranke von R ist, und gleichzeitig y x (x y) für alle oberen (unteren) Schranken x von R gilt.
12.10.13 Definition. Sei eine Halbordnung auf der Menge M. Dann heißt (M, ) Verband, wenn jede zweielementige
Teilmenge von M ein Supremum und ein Infimum hat.
Ein Verband (M, ) heißt vollständig, falls jede Teilmenge von M ein Supremum und ein Infimum hat.
Ist M eine Menge, so ist P(M) versehen mit der Mengeninklusion ein vollständiger Verband. Ein weiters Beispiel ist
die Menge aller Topologien auf einer Menge.
Das Lemma von Zorn

Das Lemma von Zorn ist ein fundamentales Hilfsmittel aus der Mengenlehre. Es ist äquivalent zum Auswahlaxiom und zum
Wohlordnungssatz und war von daher vor allem in der ersten Hälfte des 20. Jahrhunderts umstritten. Mittlerweile sind die
Mathematiker entspannter, auch wenn ein möglicher Verzicht auf das Auswahlaxiom immer noch in manchen Situationen
explizit hervorgehoben wird.
12.10.14 Definition (Auswahlaxiom). Gegeben sei eineS Indexmenge I und eine Familie von nichtleeren Mengen Ai , i ∈ I,
so existiert eine Funktion (Auswahlfunktion) f : I → i∈I Ai , sodass f (i) ∈ Ai .
Q
Man beachte, dass das Auswahlaxiom nichts anderes besagt als, dass i∈I Ai , ∅.
12.10.15 Definition. Sei (M, ≤) eine halbgeordnete Menge. Wenn für jede total geordnete Teilmenge von M eine obere
Schranke existiert, dann heißt M induktiv geordnet. Wenn sogar jeweils eine kleinste obere Schranke existiert, dann heißt M
strikt induktiv geordnet.
Folgendes Lemma ist der zentrale Hilfsatz zum Beweis des Lemma von Zorn.
12.10.16 Lemma. Es sei (M, ≤) eine nichtleere halbgeordnete Menge mit einem kleinsten Element o, sodass M strikt
induktiv ist. Schließlich sei F : M → M eine Abbildung mit der Eigenschaft (Monotonie)
m ≤ F(m), m ∈ M.
Dann gibt es ein m ∈ M mit F(m) = m.
179
Beweis. Wie nennen eine Teilmenge S von M zulässig, wenn die folgenden drei Bedingungen gelten: o ∈ S , F(S ) ⊆ S ,
und für jede total geordnete Teilmenge T ⊆ S liegt auch die kleinste obere Schranke sup T in S . Zum Beispiel ist M selbst
zulässig.
Nun sei S 0 der Durchschnitt aller zulässigen Teilmengen von M. Da in jeder zulässigen Teilmenge auch o liegt, enthält
der Durchschnitt zumindest das Element o . Außerdem gelten auch die beiden anderen Bedingungen für Zulässigkeit. Also
ist S 0 selbst zulässig und damit die kleinste aller zulässigen Teilmengen von M.
Wenn wir nun zeigen können, dass S 0 total geordnet ist, dann folgt daraus für die kleinste obere Schranke sup S 0 , dass
sup S 0 das größte Element von S 0 ist. Somit gilt wegen der Zulässigkeit F(sup S 0 ) ≤ sup S 0 . Wir bekommen insgesamt
sup S 0 ≤ F(sup S 0 ) ≤ sup S 0 ,
und damit die gewünschte Gleichheit. Noch zu zeigen ist also die Behauptung, dass S 0 total geordnet ist.
Für den Beweis nennen wir e ∈ S 0 ein extremales Element, wenn für alle s ∈ S 0 mit s ≤ e, s , e (s < e) gilt, dass
F(s) ≤ e. Zum Beispiel ist o extremal. Für ein extremales e setzen wir
S e := {s ∈ S 0 : s ≤ e ∨ F(e) ≤ s}.
Dann ist für jedes extremale e die Menge S e zulässig:
• o liegt in S e .
• Für jedes Element s ∈ S e folgt aus s < e schon F(s) ≤ e, aus s = e folgt F(s) = F(e), und aus s e folgt
F(e) ≤ s ≤ F(s). Also gilt insgesamt F(S e ) ⊆ S e .
• Es sei T eine total geordnete Teilmenge von S e . Wenn dann für alle t ≤ sup T die Ungleichung t ≤ e gilt, dann gilt
auch sup T ≤ e. Wenn es aber mindestens ein t gibt, sodass t e gilt, dann ist F(e) ≤ t ≤ sup T . Wir sehen also in
beiden Fällen, dass sup T ∈ S e .
Da aber S 0 die kleinste zulässige Teilmenge von M ist, muss also für alle extremalen e gelten:
S e = S 0.
Nun müssen wir noch zeigen, dass jedes e ∈ S 0 extremal ist. Dann folgt nämlich für s ∈ S 0 , dass s ∈ S e bzw.
s ≤ e ∨ e ≤ F(e) ≤ s,
also die Tatsache, dass S 0 total geordnet ist.
Um zu beweisen, dass jedes e ∈ S 0 extremal ist, betrachten wir
E := {e ∈ S 0 : e ist extremal}.
Wir weisen nach, dass E zulässig und damit gleich S 0 ist.
• o ∈ E ist klar.
• Wir müssen zeigen, dass mit e auch F(e) in E liegt. Ist s ∈ S 0 = S e und s < F(e), so müssen wir F(s) ≤ F(e)
folgern. Da s ∈ S e , gilt s ≤ e oder F(e) ≤ s, wobei wir letzteres wegen unserer Voraussetzung ausschließen können.
Aus s = e folgt trivialerweise F(s) ≤ F(e) und aus s < e folgt wegen e ∈ E, dass F(s) ≤ e ≤ F(e).
• Nun sei noch T ⊆ E total geordnet. Zu zeigen ist, dass sup T ∈ E. Sei dazu s ∈ S 0 , s < sup T . Wenn für jedes
t ∈ T die Relation F(t) ≤ s gelten würde, dann wäre wegen t ≤ F(t) auch sup T ≤ s. Das ist ein Widerspruch. Also
gibt es ein extremales e ∈ T mit F(e) s, und da S 0 = S e gilt, folgt daraus zwangsweise s ≤ e. Ist s , e, so folgt
wegen e ∈ E, dass F(s) ≤ e ≤ sup T . Da sup T ∈ S 0 = S e , s < sup T folgt aus s = e, dass F(s) = F(e) ≤ sup T .
Damit folgt insgesamt, dass sup T extremal ist.
❑
Nun können wir das Lemma von Zorn aus dem Auswahlaxiom herleiten.
12.10.17 Satz. Es sei (M, ≤) eine nichtleere induktiv geordnete Menge. Dann besitzt M ein maximales Element.
Beweis. Wir behandeln zuerst den Fall einer strikt induktiv geordneten Menge.
Sei x ∈ M fest. Ist m maximales Element von {y ∈ M : x ≤ y}, so ist m auch maximales Element von M. Also dürfen
wir uns auf den Fall beschränken, dass M ein kleinstes Element enthält. Wir nehmen an, es gebe kein maximales Element.
Dann finden wir für jedes m ∈ M ein größeres Element F(m) und definieren damit eine Funktion F : M → M, für die gilt:
∀m ∈ M : m < F(m).
Man beachte, dass man für die Existenz einer solchen Funktion F das Auswahlaxiom verwendet. In der Tat ist F eine
Auswahlfunktion der Familie (Am )m∈M , wobei Am = {x ∈ M : m ≤ x, m , x}. Da M strikt induktiv geordnet ist, folgt aus
Lemma 12.10.16 der Widerspruch F(m) = m für ein m ∈ M.
Nun sei M induktiv geordnet, und sei H die Menge aller total geordneten Teilmengen von M. Dann ist H bezüglich
der Inklusion eine Halbordnung, und zwar eine strikt induktive, denn ist T ⊆ H totalgeordnet (bzgl. ⊆), so auch ∪T (bzgl.
≤), und diese Teilmenge von M ist auch die kleinste obere Schranke von T (bzgl. ⊆).
Also besitzt H nach dem ersten Beweisteil ein maximales Element T . Es sei O eine obere Schranke von T . Dann muss
O zu T gehören, da sonst T ∪ {O} eine total geordnete Menge wäre, die T echt umfasste.
Dieses Element O ist dann ein maximales Element von M, denn für jedes m ∈ M folgt aus O ≤ m, dass m eine obere
Schranke von T ist, und somit ebenfalls zu T gehören muss. Insbesondere folgt m ≤ O und damit m = O.
❑
Literaturverzeichnis
[B] N.Bourbaki: Elements of Mathematics: General Topology. Part 1,2, Hermann,

Paris 1966.
[F] G.M.Fichtenholz: Differential- und Integralrechnung I-III, Deutscher Verlag der
Wissenschaften, Berlin 1964.
[H] H.Heuser: Lehrbuch der Analysis 1,2, Teubner Verlag, Stuttgart 1989.
[L] S.Lang: A first course in calculus, Springer Verlag, Heidelberg 1986.
[R] W.Rinow: Lehrbuch der Topologie, VEB Deutscher Verlag der Wissenschaften,
Berlin 1975.
[R1] W.Rudin: Principles of Mathematical Analysis, McGraw-Hill, New York 1953,
third edition 1976.
[R2] W.Rudin: Real and Complex Analysis, McGraw-Hill, New York 1966, third edi-
tion 1987.
[W] W.Walter: Analysis 1,2, Springer Verlag, Heidelberg, New York Tokoyo.
181
Index
T 2 , 139 differenzierbar, 74
k-te Ableitung, 91 k-mal stetig, 89
C 1 , 70 partiell, 70
stetig, 74
Abbildung stetig partiell, 70
beschränkt, 40 Dirichlet-Kern, 59
Norm, 40 Dreiecksungleichung, 33
Abbildungsnorm, 40 Durchmesser einer Menge, 166
Ableitung, 72
partielle, 69 einfach zusammenhängend, 121
Richtungs-, 69 endliche Durchschnittseigenschaft, 160
Abzählbarkeitsaxiom Euklidische Topologie, 136
erstes, 137 Exponentialfunktion
zweites, 148 Matrix-wertig, 52
Alexandroff-Kompaktifizierung, 171 Extremum unter Nebenbedingung, 99
Algebra
nirgends verschwindend, 173 Feinheit
punktetrennend, 173 einer Riemann-Zerlegung, 5
Algebra von Funktionen, 173 Fejér-Kern, 65
analytisch, 133 Filter, 136
feiner, 164
Banachraum, 34 gröber, 164
Banachscher Fixpunktsatz, 79 konvergent, 165
Basis Filterbasis, 137
eines Filters, 137 folgenkompakt, 162
beschränkt, 40 Fourierkoeffizienten, 57
Bilinearform, 95 Fourierreihe, 57
Bogenlänge, 107 Fréchet-differenzierbar, 78
Funktion
Cauchy-Netz, 10 charakteristische, 12
Cauchy-Riemannschen Differentielglei- ganze, 128
chungen, 127, 134 harmonische, 133, 134
Cauchysche Integralformel, 130 Funktion von beschränkter Variation, 108
Cauchyscher Integralsatz, 130 Funktionen
Cesaro-Mittel, 64 stückweise stetig, 13
charakteristische Funktion, 12 stückweise stetig differenzierbar, 61
Darbouxsches Integral, 3 Gebiet, 117
dicht, 140 Gradient, 72
in B, 140 Gradientenfelder, 114
Differentialgleichung
exakte, 120 Häufungspunkt einer Menge, 142
182
INDEX 183
Häufungspunkt eines Netzes, 143 lokales, 94

harmonisch, 133, 134 Menge
Hausdorff, 139 abgeschlossene, 140
Hesse-Matrix, 95 Abschluss einer, 140
Hilbertraum, 54 gesättigte, 156
holomorph, 128 Inneres einer, 142
homöomorph, 146 kompakte, 160
Homöomorphismus, 146 konvexe, 78
homotop offene, 136
radial, 123 relativ kompakte, 160
Homotopie, 121 total beschränkte, 166
zusammenhängende, 158
Implicit function theorem, 81 Mengen
implizites Differenzieren, 78 getrennte, 158
Integral, 3 Metriken
absolut konvergent, 18 äquivalente, 147
Darbouxsches, 3 Minimum
obere, 3 lokales, 94
Riemann, 5 Mittelwertsatz
Riemann-Stiltjes, 109 der Integralrechnung, 30
uneigentliches, 18 erweiterter der Integralrechnung, 30
von stetigen Funktionen, 11
Integration negativ definit, 95
Vertauschbarkeit der Reihenfolge, 24 negativ semidefinit, 95
von Funktionen in mehreren Varia- Netz
blen, 26 Cauchy-, 10
integrierbar, 3 Norm, 33
Riemann-, 5 äquivalente, 39
Integrierenden Faktor, 120
Obersumme, 3
offene Abbildung, 154
Kettenregel, 75, 129
Orthogonalsystem, 56
komlpexen Ableitung, 127
Orthonormalbasis, 57
kompakt, 160
Orthonormalsystem, 56
abzählbar, 162
folgen-, 162 Parameterintegral, 24
Konvergenz Parameterintegrale, 76
lokal gleichmäßige, 132 Differenzierbarkeit, 26
Konvergenz einer Reihe, 43 partielle Ableitung, 69
absolute, 43 Partielle Integration, 16
Polygonzug, 103
Lagrangesche Multiplikatorenregel, 100 Polynom
Lagrangeschen Multiplikatoren, 100 trigonometrisches, 58
Laplace, 133 positiv definit, 95
Lipschitz stetig, 14 positiv semidefinit, 95
lokales Gradientenfeld, 122 Produkt von metrischen Räumen, 23
Lokalisationsprinzip, 60 Produktregel, 129
lokalkompakt, 160
Quotientenregel, 129
Mannigfaltigkeiten, 86
Maximum Raum
184 INDEX
T 2 -, 139 mehrdimensionale, 92
Hausdorff, 139 Teilraum, 153
normierter, 33 Topologie, 136
topologischer, 136 Basis von, 148
Reihe diskrete, 136
Banachraum-wertig, 43 feinere, 147
Richtungsableitung, 69 finale, 155
Riemann-Stieltjes Integral, 109 gröbere, 147
Riemann-Zerlegung, 5 initiale, 151
Riemannsumme, 5 Klumpentopologie, 136
normal, 157
Satz Produkt-, 154
über die Inverse Funktion, 86, 94 Quotienten-, 156
Fejer, 65 regulär, 157
Hauptsatz über implizite Funktionen, Spur-, 153
81, 93 Subbasis von, 148
Hauptsatz der Differential- von einer Metrik, 136
Integralrechnung, 14 Träger
Stone-Weierstraß, 174 kompakt, 177
Taylorsche Formel, 91 trigonometrisches Polynom, 58
von Ascoli, 170
von Fubini, 24 Ultrafilter, 164
von Schwarz, 89 Umgebung, 136
von Tychonoff, 164 Umgebungsfilter, 136
Weierstraß, 66 Untersumme, 2
Satz von Liouville, 132
Satz von Morera, 132 Vektorfeld, 109
separabel, 140 wegunabhängig, 114
Skalarproduktraum, 54 Vertauschbarkeit
stückweise stetig, 13 Integrationsreihenfolge, 24
stückweise stetig differenzierbar, 61 Grenzwert und Ableitung, 22
Stützstellen, 5 Grenzwert und Integration, 21
Stammfunktion, 15
Weg, 103
stationärer Punkt, 95
geschlossener, 123
stetig, 143
nullhomotoper, 123
in einem Punkt, 143
rektifizierbar, 105
Lipschitz, 14
stetig, 103
stetig differenzierbar, 74
Wege
k-mal, 89
homotope, 121
Stetigkeit
Wegintegral, 109
gleichgradige, 170
komplexes, 112
Strecke
komplexes, Banachraum-wertiges,
gerade, 103
128
Subbasis einer Topologie, 148
Substitutionsregel, 16 zusammenhängend, 158
Zwischenstellen, 5
Tangentialebene, 74
Tangentialvektor, 47
Taylorsche Formel, 91
Taylorsche Polynom

Ana Ii

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Ana Ii

Uploaded by

Copyright:

Available Formats

Analysis 2

für Technische Mathematik

8 Das Riemannsche Integral 1

9 Normen, Banachräume und Fourierreihen 33

10 Ableitungen nach mehreren Variablen 69

12 Topologische Grundlagen 135

12.5 Initiale Topologie und Finale Topologie . . . . . . . . . . . . . . . . 151

Das Riemannsche Integral

8.1 Ober- und Untersummen

Abbildung 8.1: Approxiomation der Fläche von unten

Abbildung 8.2: Approxiomation der Fläche von oben

In der Tat gilt

und für n → ∞ erhält man wieder A = limn→∞ Ân = 31 .

a = ξ0 < ξ1 < · · · < ξn(Z) = b.

Sei nun f : [a, b] → R eine beschränkte Funktion. Zu einer gegebenen Zerlegung

Entsprechend definieren wir die Obersumme

Abbildung 8.3: Veranschaulichung einer Unter- bzw. Obersumme

Da wir f als beschränkt voraussetzen, existieren diese Ober- und Untersummen.

von f über [a, b]:

inf (O(Z) − U(Z)) = lim (O(Z) − U(Z)), (8.3)

8.2 Das Riemann-Integral

a = ξ0 < ξ1 < · · · < ξn(R) = b; α j ∈ [ξ j−1 , ξ j ], j = 1, . . . , n(R),

als das Riemann Integral von f über [a, b].

Abbildung 8.4: Veranschaulichung einer Riemannsumme

8.2.2 Bemerkung. Ist f : [a, b] → C, so folgt aus Re S ( f, R) =

∀R ∈ R, |R| ≤ δ ⇒ U(Z0 ) − ǫ ≤ S (R) ≤ O(Z0 ) + ǫ.

U( f + c, Z0 ) = U( f, Z0 ) + c(b − a), O( f + c, Z0 ) = O( f, Z0 ) + c(b − a)

und S ( f + c, R) = S ( f, R) + c(b − a). Setzen wir c = k f k∞ , so erkennt man, dass es

(ii) inf Z∈Z (O(Z) − U(Z)) = 0.

(iii) f ist Riemann-integrierbar, d.h. lim|R|→0 S (R) existiert.

so gilt lim|R|→0 (O(R) − U(R)) = 0.

(v) Es gibt eine Folge (Rn )n∈N von Riemann-Zerlegungen, sodass

In einem dieser Fälle gilt

lim S (Rn ) = lim O(Rn ) = lim U(Rn ),

Aus |Rk | = |R| ≤ |R0 | folgt Rk  R0 , und somit

(ii) Ist f Riemann-integrierbar über [a, b], so gilt

wobei sogar |S ( f, R)| ≤ (b − a) · k f k∞ für jede Riemann-Zerlegung R von [a, b].

(iii) Sind g1 , g2 reellwertige Riemann-integrierbare Funktionen über [a, b] mit g1 (x) ≤

|S ( f, R)| ≤ |S (| f |, R)| ≤ O(| f |, Z0 ) + ǫ ≤ k f k∞ (b − a) + ǫ.

8.3 Integrale von stetigen Funktionen

∀ǫ > 0 ∃i0 ∈ I : d(xi , x j ) < ǫ ∀i, j  i0 . (8.7)

ρ(γ) := sup{| f (s) − f (t)| : s, t ∈ [a, b], |s − t| ≤ γ},

so gilt daher ρ(δ) ≤ ǫ.

|S (R) − S (R1 )| < ǫ. (8.8)

{ξ j : j = 0, . . . , n(R1 )} ∪ {ζ j : j = 0, . . . , n(R)} ⊆ {η j : j = 0, . . . , n(R2 )}

Bemerkt man, dass |α j − βk | ≤ (ξ j − ξ j−1 ) ≤ |R1 |, k ∈ {k( j − 1) + 1, . . . , k( j)}, so folgt

8.4 Differential und Integralrechnung

Wegen |R′ | ≤ |R| ≤ δ folgt |I − S M (1[c,d] · f, R)| < ǫ. Daher gilt

Beweis. Per definitionem ist f als Riemann-integrierbare Funktion beschränkt. Ist a ≤

Insbesondere ist F stetig7 .

| f (t) − f (x0 )| < ǫ für |t − x0 | < δ.

Ist x0 < x < x0 + δ ≤ b, so gilt wegen (8.6) 8

x, y ∈ [a, b] mit einer festen Konstante M ≥ 0 gilt.

F(ξi ) − F(ξi−1 ) = (ξi − ξi−1 ) f (αi ).

Die in Lemma 7.4.3 kennengelernten Regeln zur Auffindung von Stammfunktionen

8.4.15 Lemma (Partielle Integration). Seien f, g ∈ C1 [a, b]. Dann gilt

Für f (b)g(b) − f (a)g(a) schreibt man auch f g|ba .

8.5 Weitere Eigenschaften des Integrals

Mi∗ = sup | f (x)|, m∗i = inf | f (x)|.

sup f (x)2 − inf f (x)2 = (Mi∗ )2 − (m∗i )2

= (Mi∗ + m∗i )(Mi∗ − m∗i ) ≤ 2k f k∞ · (Mi∗ − m∗i ).

8.6 Uneigentliche Integrale

existiert. Entsprechend definiert man uneigentliche Integrale für Funktionen

Aus |Rk | = |R| ≤ |R0 | folgt Rk R0 , und somit

∀ǫ > 0 ∃i0 ∈ I : d(xi , x j ) < ǫ ∀i, j i0 . (8.7)

∀ǫ > 0 ∃ j0 ∈ J : ∀ j j0 , ∀i ∈ I : d(H(i, j), h(i)) ≤ ǫ,

dY (h(i), A) < 3ǫ für i ∈ I und i i0 .