You are on page 1of 814

See

discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/266367922

Analyse. Fondements, techniques, évolution.


(Analysis. Foundations, techniques,
evolution).2ème éd. 2èm....

Article

CITATIONS READS

30 602

1 author:

Jean Mawhin
Université Catholique de Louvain
518 PUBLICATIONS 10,215 CITATIONS

SEE PROFILE

Some of the authors of this publication are also working on these related projects:

General theory of dynamical systems View project

All content following this page was uploaded by Jean Mawhin on 28 May 2015.

The user has requested enhancement of the downloaded file.


ANALYSE
Fondements, techniques, évolution

Jean Mawhin

Université Catholique de Louvain


Préface de la deuxième édition

Ce Cours d’analyse constitue la partie théorique du cours de calcul différentiel


et intégral dispensé aux étudiants de candidatures en sciences mathématiques et
physiques à l’Université Catholique de Louvain. En le publiant, nous ne faisons
que suivre une tradition illustrée à l’U.C.L. par Ph. Gilbert et Ch.J. de la Vallée
Poussin et, dans les autres universités belges, par A. Timmermans, A. Meyer, M.
Schaar, E. Catalan, P. Mansion, J. Neuberg, L. Godeaux et H.G. Garnir.
Le but de cet ouvrage est d’introduire les concepts et les résultats fondamentaux
du calcul différentiel et intégral, de développer les techniques correspondantes utiles
à tant de disciplines scientifiques, et d’ouvrir à quelques domaines importants de
l’analyse qui seront développés dans d’autres cours.
La notion de limite est le seul concept vraiment nouveau que l’analyse introduit.
Face à une opération impossible pour les opérations habituelles de l’arithmétique
ou de l’algèbre, mais pour lesquelles un procédé de résolution “approchée” existe,
on cherche à montrer que l’erreur commise peut être rendue arbitrairement petite
pour un choix approprié, et suffisamment vaste, de solutions approchées. C’est une
méthodologie proche de celle de l’expérimentateur ou du technicien, à cela près
qu’il n’y a pas de limitation a priori dans la précision.
Depuis la publication par L’Hospital, il y a exactement trois cents ans, du pre-
mier d’entre eux, la production de livres de calcul différentiel et intégral a été très
abondante. Chaque auteur doit donc se justifier en dégageant l’originalité de son
produit. Après un premier chapitre rappelant le minimum indispensable sur le lan-
gage des ensembles, les nombres et l’espace vectoriel à n dimensions, les suivants
abordent successivement les notions de limite, continuité etdérivabilité en un point
pour les fonctions d’une ou de plusieurs variables réelles, en se limitant rigoureuse-
ment aux propriétés locales. Le débutant peut ainsi se concentrer sur la définition
de limite et sur les techniques régissant son utilisation. L’ouvrage insiste plus que
d’autres sur la notion de fonction localement bornée en un point: le produit d’une
fonction ayant une limite nulle par une fonction localement bornée a une limite nulle,
et l’utilisation systématique de ce résultat simplifie la démonstration de nombreuses
propriétés. C’est en particulier le cas pour l’étude du délicat concept de dérivée
totale d’une fonction de plusieurs variables. Le passage des propriétés locales aux
propriétés globales fait appel à une variante de la compacité classique, le lemme de
Cousin, qui sera indispensable pour définir, plus loin, la notion d’intégrale. Les pro-
priétés globales des fonctions continues sont systématiquement démontrés à partir
de cette technique, qui privilégie la notion de partition ou découpage, plus concrète
peut-être que celle de recouvrement. Le théorèmes et inégalités de la moyenne pour
les fonctions dérivables sont d’autres résultats globaux importants dont découlent
de nouvelles techniques de calcul des limites. Le lemme de Cousin fournit aussi une
démonstration naturelle de l’indispensable critère de Cauchy permettant de prou-
ver l’existence d’une limite sans en connaı̂tre a priori la valeur, une caractéristique
précieuse en théorie de l’itération et dans ses applications aux fonctions implicites.
ii

Afin de minimiser, chez les débutants, les confusions trop fréquentes entre les
notions liées à l’ordre et celles liées à la distance, un chapitre regroupe les résultats
dépendant de la structure d’ordre de la droite réelle. C’est là qu’apparaissent les
fonctions monotones, les fonctions convexes et les premières fonctions transcen-
dantes élémentaires: l’exponentielle et le logarithme. La notion de dérivée d’ordre
supérieur et le développement de Taylor conduisent à l’étude des séries, permet-
tant l’introduction analytique des fonctions trigonométriques et des exponentielles
complexes. On dispose ainsi du matériel nécessaire pour aborder les équations
différentielles linéaires à coefficients constants. L’approche proposée ne fait appel
qu’à des techniques simples d’algèbre linéaire sur des espaces convenables d’ex-
ponentielles-polynômes. Le problème de Cauchy pour un système différentiel est
introduit, et l’unicité de sa solution prouvée par des considérations élémentaires.
La résolution de l’équation différentielle linéaire non homogène la plus simple
n’est rien d’autre que le problème de la primitivation d’une fonction, qu’on résoud
explicitement pour certaines classes de fonctions élémentaires, avant de se tourner,
dans le cas général, vers le concept de résolution approchée infiniment précise men-
tionné plus haut. Son interprétation géométrique conduit très naturellement à une
approche nouvelle de l’intégrale, due à Kurzweil et Henstock, que nous enseignons
depuis une vingtaine d’années. Formellement très proche de celle de Riemann,
dont elle conserve le support intuitif et la simplicité technique, cette définition
fournit une intégrale plus puissante que celle de Lebesgue capable, en particulier,
d’intégrer toutes les dérivées. Cette approche autorise une progression naturelle,
sans modification de définition, depuis le calcul intégral élémentaire jusqu’aux as-
pects avancés de l’intégrale de Lebesgue. Elle rend également inutile le concept
d’intégrale généralisée ou impropre: ce qui servait de définition à cette notion n’est
plus, ici, qu’un procédé de calcul d’une véritable intégrale. On lui rattache na-
turellement la convergence simple ou absolue des séries, ce qui permet un traite-
ment unifié des critères correspondants. On dispose alors des outils nécessaires pour
étudier la continuité, la dérivabilité et l’intégrabilité de limites de suites de fonc-
tions, les ensembles et les fonctions mesurables et les représentations intégrales des
fonctions. A cette occasion sont introduites non seulement des fonctions spéciales
classiques comme les fonctions de Bessel, les fonctions beta et gamma d’Euler, les
polynômes d’Hermite, la fonction hypergéométrique et la fonction zeta, mais aussi
des fonctions continues non dérivables, ces monstres mathématiques récemment
transformés en paradigmes scientifiques par la théorie des fractales. C’est aussi le
moment de faire les premiers pas en analyse harmonique en introduisant les séries
et intégrales de Fourier et le produit de convolution.
Après avoir défini les intégrales sur une courbe et sur une surface, les extensions
du théorème fondamental du calcul différentiel et intégral aux fonctions de plusieurs
variables (formules de Green-Riemann, Stokes-Ampère, Gauss-Ostrogradsky) sont
présentées d’une manière générale et unifiée à partir du concept de forme diffé-
rentielle, indispensable aujourd’hui aux mathématiciens et aux physiciens. Cette
élégante et féconde théorie trouve des applications directes en analyse vectorielle,
et dans l’étude globale des fonctions C-dérivables d’une variable complexe. Les
concepts fondamentaux de la théorie des fonctions holomorphes sont ainsi dégagés,
iii

pour aboutir à cette puissante technique de calcul que constitue le théorème des
résidus.
La notion d’espace métrique avec, comme cas particulier, les plus importants
espaces de Banach, est alors introduite. Elle unifie de nombreux types de passage à
la limite définis précédemment et fournit des théorèmes d’existence au problème de
Cauchy pour les systèmes différentiels. Elle mène au calcul des variations, illustra-
tion exemplaire de cette analyse fonctionnelle qui étudie les fonctions définies sur
des espaces de fonctions, et outil fondamental dans la formulation et l’étude des
lois de la mécanique et de la physique.
L’ouvrage se termine par un index historique, qui, en plus de son rôle pratique
usuel, montre que la mathématique est une oeuvre humaine en constante évolution,
esquisse quelques développements récents et formule plusieurs problèmes ouverts.
Des exemples variés illustrent les définitions, et des contre-exemples montrent la
nécessité des hypothèses de nombreux théorèmes. Ils serviront de modèles au lecteur
pour en construire lui-même de nombreux autres. A la fin de chaque chapitre sont
rassemblés des exercices, qui proposent une approche plus personnelle à quelques
compléments théoriques. Une petite anthologie rejoint les préoccupations de l’index
historique en montrant, par des citations appropriées de mathématiciens célèbres,
l’évolution de l’énoncé des grands concepts et des grands résultats du chapitre. Le
lecteur pourra juger par lui-même si, comme on peut l’espérer, cette évolution s’est
faite dans le sens d’une plus grande clarté et d’une plus grande précision.
Il reste à parler des figures, totalement absentes de cet ouvrage. Si elles ont cessé
d’être indispensables à la présentation rigoureuse de l’analyse, elles demeurent un
précieux outil de compréhension et de découverte. Absentes du support écrit, où ne
pourrait subsister que le résidu figé du processus dynamique de leur construction,
les figures sont omniprésentes dans l’exposé oral, avec la dimension temporelle, si
importante, de leur tracé. Le lecteur devra donc illustrer, par ses propres figures,
les notions et les théorèmes introduits.
Chacun sait qu’il est difficile d’apprendre une matière délicate en consultant un
seul ouvrage. Tout enseignant qui publie un livre espère susciter la lecture d’autres
traités. En se limitant à un choix restreint, mais issu d’horizons divers, on peut
citer, parmi de nombreux livres de niveau et d’esprit assez proches de celui-ci, les
références suivantes:

T. Apostol, Mathematical Analysis, Addison-Wesley, Reading, 1974,


G. Chilov, Analyse mathématique, 3 vol., Mir, Moscou, 1973,
H.G. Garnir, Fonctions de variables réelles, 2 vol., Vander, Leuven, 1970,
R. Remmert, Theory of Complex Functions, Springer, New York, 1991,
W. Rudin, Principles of Mathematical Analysis, Mc Graw-Hill, New York, 1975,
W. Walter, Analysis I und II, Springer, Berlin, 1990.

Le lecteur qui reste sur sa faim poursuivra son effort avec beaucoup de profit
en lisant l’incomparable livre
iv

L. Schwartz, Analyse, 4 vol., Hermann, Paris, 1991-1993.

Par ailleurs, les ouvrages suivants fournissent des développements, aussi diffé-
rents que remarquables, de l’analyse harmonique,

T.W. Körner, Fourier Analysis, Cambridge University Press, Cambridge, 1988,


M. Willem, Analyse harmonique réelle, Hermann, Paris, 1995,

tandis que la monographie

H. Brézis, Analyse fonctionnelle. Théorie et applications, Masson, Paris, 1983

est sans rivale pour approfondir l’analyse fonctionnelle et ses applications actuelles.
Enfin, le lecteur curieux d’histoire pourra compléter ses connaissances en con-
sultant

E. Hairer, G. Wanner, Analysis by its History, Springer, New York, 1996.

Cette deuxième édition conserve strictement la structure et le volume de la


première, qui était une version profondément transformée de l’Introduction à l’a-
nalyse publiée pour la première fois en 1979. Elle en diffère par de nombreuses
corrections de détail, des améliorations typographiques et surtout par des modi-
fications de présentation portant principalement sur la dérivée totale, le passage
du local au global, les formes différentielles et les chaı̂nes, les ensembles compacts.
Les gains d’espace qui en résultent ont permis d’enrichir cette nouvelle édition de
notions importantes comme celles de système dynamique discret, de produit de con-
volution, de fonction à variation bornée, de forme symplectique, et de résultats
utiles dans la théorie des équations différentielles comme le lemme de Gronwall,
l’équation fonctionnelle de Cauchy et le théorème de Peano.
Ce texte a bénéficié, aux différents stages de son élaboration, des critiques,
remarques et corrections de nombreux collègues, en particulier de M. Anciaux, M.
Brémond, C. Debiève, C. de Coster, Th. De Pauw, E. Giusti, P. Habets,
M. Henrard, H. Kalf, J.R. Roisin, J.P. Tignol, G. Vandenbossche (†) et
M. Willem, mais aussi, et surtout, des améliorations suggérées ou provoquées
par les étudiants de candidatures en sciences mathématiques et physiques. Les
générations futures de lecteurs et lectrices auront tout le loisir de s’illustrer à leur
tour sur la présente édition, et ils en sont remerciés d’avance.

Verviers et Louvain-la-Neuve, août 1996


Chapitre 1

Ensembles, graphes,
fonctions

1.1 Logique et ensembles : terminologie et nota-


tions
La mathématique actuelle est fondée sur la théorie des ensembles, et utilise le
langage de la logique formelle. Il n’entre pas dans notre propos de développer
ici la logique formelle et la théorie des ensembles : le point de vue naı̈f nous
suffira et nous le supposerons connu du lecteur. Rappelons simplement que,
P , Q . . . étant des propositions ou énoncés ou formules, la négation de P se
note ¬P ou non P, la disjonction de P et Q se note P ∨ Q ou P ou Q, la
conjonction de P et Q se note P ∧ Q ou P et Q, l’implication matérielle, qui
est l’abréviation de (¬P ) ∨ Q, se note P ⇒ Q et l’équivalence matérielle, qui
est l’abréviation de (P ⇒ Q) ∧ (Q ⇒ P ), se note P ⇔ Q. On a en particulier
l’équivalence suivante

(P ⇒ Q) ⇔ (¬Q ⇒ ¬P ),

qui permet parfois de simplifier la démonstration d’un théorème. La deuxi-


ème proposition dans cette équivalence s’appelle la contraposée de la premi-
ère.
Signalons également que, pour éviter des paradoxes très vite apparus dès
l’introduction, par Georg Cantor, de la notion d’ensemble à la fin du XIXe
siècle, la théorie des ensembles a dû se construire comme théorie formelle
partant des notions primitives d’ensemble et d’appartenance, représentée par
le prédicat binaire ∈ (qui se lit appartient à ou élément de) et d’une liste

1
2 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS

d’axiomes que nous n’énoncerons pas formellement et que l’on peut d’ailleurs
présenter sous plusieurs formes.
Dans l’axiomatique de Zermelo-Fraenkel, le premier axiome affirme l’e-
xistence d’un ensemble sans élément : c’est l’ensemble vide, noté ∅.
Le deuxième axiome affirme que deux ensembles sont égaux dès qu’ils
ont les mêmes éléments. Dans l’approche naı̈ve des ensembles, un ensemble
est défini en extension lorsqu’on donne la liste de ses éléments.
Le troisième axiome affirme l’existence d’un ensemble z = {x, y} dont
les éléments sont deux ensembles quelconques donnés x et y. Cet ensemble
s’appelle la paire d’éléments x et y et, si x = y, la paire {x, x} est notée plus
simplement {x} et s’appelle le singleton de x. La paire {x, {x, y}} est notée
(x, y) et s’appelle le couple (x, y).
Le quatrième axiome affirme l’existence de l’union des éléments t d’un
ensemble d’ensembles x constituée des éléments z qui appartiennent à l’un
!
des t de x; cet ensemble est noté t∈x t. Si x et y sont des ensembles, la
réunion x ∪ y des ensembles x et y est la réunion des éléments de la paire
{x, y}. De manière plus naı̈ve, on peut écrire

x ∪ y = {u : u ∈ x ou u ∈ y}.

Le cinquième axiome affirme l’existence de l’ensemble des parties de tout


ensemble x (y est une partie de x si tout élément de y est élément de x); cet
ensemble se note P(x) ou 2x et si z ∈ P(x), on écrit aussi y ⊂ x (ou parfois
y ⊆ x). Lorsque y est une partie de x différente de x, on dit que y est une
partie propre de x et l’on écrit alors y ! x (ou y ⊂ x dans le second choix de
notation). Nous adopterons la première notation dans cet ouvrage. Si a est
un ensemble non vide, on appelle intersection des éléments de a, l’ensemble,
noté ∩x∈ax ou ∩{x : x ∈ a}, formé par les éléments qui appartiennent à tous
les ensembles qui appartiennent à a. Etant donnés deux ensembles x et y,
on appelle intersection des ensembles x et y l’intersection des éléments de la
paire {x, y}; elle est notée x ∩ y. De manière plus naı̈ve, on peut écrire

x ∩ y = {u : u ∈ x et u ∈ y}.

Le sixième axiome affirme l’existence d’un ensemble x contenant ∅ et tel


que, s’il contient y il contient son “successeur” y ∪ {y}; cet axiome garantit
l’existence d’ensembles infinis .
Le septième axiome (qui est en fait une liste sans fin de formules con-
struites sur le même schéma) entraı̂ne en particulier que, pour tout ensemble
u et pour toute propriété “raisonnable” P (x) dépendant des éléments x de
1.1. LOGIQUE ET ENSEMBLES : TERMINOLOGIE ET NOTATIONS3

v et qui peut être exprimée dans le langage formel de la théorie, il existera


un sous-ensemble v formé des éléments x satisfaisant à P ; cet ensemble est
noté {x ∈ u : P (x)}. Dans l’approche naı̈ve des ensembles, on dit qu’un tel
ensemble est défini en compréhension.
Le huitième axiome, dit axiome du choix ou axiome de Zermelo, affirme
qu’il est possible de former un ensemble en choissant un élément dans chaque
ensemble d’un ensemble d’ensembles. Le neuvième axiome exclut des for-
mules comme x ∈ x.
On peut construire, à partir de ces axiomes, l’ensemble

N = {0, 1, 2, . . .}

des entiers naturels et démontrer l’important principe d’induction affirmant


que si une partie A de N contient 0 et est telle que, chaque fois que n ∈ A,
on a n + 1 ∈ A, alors A = N. On désignera également par N∗ l’ensemble
N \ {0} l’ensemble des entiers naturels strictement positifs. On rappellera
que, si x et y sont des ensembles, x \ y désigne l’ensemble des éléments de x
qui n’appartiennent pas à y. On démontre également que N est un ensemble
ordonné et que toute partie de N possède un plus petit élément.
Si une propriété P (x) (dépendant des éléments x d’un ensemble y) est
satisfaite par tous les éléments de y, on écrira

(∀x ∈ y) : P (x), (1.1)

ce qui se lit “pour tout élément x de y, la propriété P (x) est vraie” ou “quel
que soit l’élément x de y, la propriété P (x) est vraie”. Le symbole ∀ est
appelé le quantificateur universel .
Si un élément x (au moins) de y vérifie la propriété P (x), on écrira

(∃x ∈ y) : P (x), (1.2)

ce qui se lit “il existe (au moins) un élément x de y tel que la propriété P (x)
soit vraie”. Le symbole ∃ est le quantificateur existentiel .
La négation logique de la formule (1.1), ¬[(∀x ∈ y) : P (x)] est equivalente
à la formule
(∃x ∈ y) : ¬P (x),
et la négation logique de la formule (1.2), ¬[(∃x ∈ y) : P (x)] est équivalente
à la formule
(∀x ∈ y) : ¬P (x).
4 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS

On voit que, pour nier (1.1) (resp. (1.2)), on a remplacé le quantificateur uni-
versel, (resp. existentiel), par le quantificateur existentiel (resp. universel),
et remplacé P (x) par sa négation ¬P (x). La proposition suivante montre
que cette règle s’étend aux formules contenant un nombre fini d’expressions
de type (∀x ∈ y), (∃u ∈ v) suivi de l’énoncé d’une propriété P dépendant
des éléments des ensembles correspondants.
Proposition. La négation d’une proposition du type

(∀x1 ∈ y1 )(∃x2 ∈ y2 )(∃x3 ∈ y3 ) . . . (∃xm−1 ∈ ym−1 )(∀xm ∈ ym ) : (1.3)

P (x1 , x2 , x3 , . . . , xm−1 , xm ),
contenant un nombre fini d’expressions du type (∀x ∈ y) ou (∃x ∈ y) suivi de
l’énoncé d’une propriété P s’obtient en remplaçant chaque ∀ par ∃, chaque
∃ par ∀ et P par ¬P .
Démonstration. Elle se fait par récurrence sur le nombre d’expressions
du type (∀x ∈ y) ou (∃x ∈ y) qui précèdent P . Nous avons admis le résultat
pour une formule contenant une seule de ces expressions. Supposons donc la
proposition vraie pour une formule de type (1.3) contenant m−1 expressions
du type (∀x ∈ y) ou (∃x ∈ y) et montrons qu’elle est vraie pour une formule
en contenant m, par exemple, pour fixer les idées, la formule (1.3). Si nous
posons

Q(x1 , . . . , xm−1 ) = (∀xm ∈ ym ) : P (x1 , . . . , xm−1 , xm ),

la formule (1.3) peut s’écrire

(∀x1 ∈ y1 )(∃x2 ∈ y2 )(∃x3 ∈ y3 ) . . . (∃xm−1 ∈ ym−1 ) : Q(x1 , . . . , xm−1 ),

et, par l’hypothèse de récurrence, sa négation est équivalente à

(∃x1 ∈ y1 )(∀x2 ∈ y2 )(∀x3 ∈ y3 ) . . . (∀xm−1 ∈ ym−1 ) : ¬Q(x1 , . . . , xm−1 ),

et donc, en vertu de la définition de Q et de ce qui précède, à

(∃x1 ∈ y1 )(∀x2 ∈ y2 )(∀x3 ∈ y3 ) . . . (∀xm−1 ∈ ym−1 )(∃xm ∈ ym ) :

¬P (x1 , . . . , xm ).
1.2. GRAPHES, FONCTIONS, APPLICATIONS 5

Remarque. On a évidemment les équivalences

(∀x ∈ y)(∀u ∈ v) ⇔ (∀u ∈ v)(∀x ∈ y),

et
(∃x ∈ y)(∃u ∈ v) ⇔ (∃u ∈ v)(∃x ∈ y),
mais une permutation de quantificateurs consécutifs d’espèces différentes
modifie le sens de la formule.

1.2 Graphes, fonctions, applications


A partir d’ici nous utiliserons la convention usuelle consistant à désigner les
ensembles par des capitales et leurs éléments par des minuscules. Soient E et
F deux ensembles non vides. Rappelons que le produit cartésien ou produit
ensembliste de E par F , noté E × F , est l’ensemble des couples (a, b) tels
que a ∈ E et b ∈ F ; formellement,

E × F = {(a, b) : a ∈ E et b ∈ F }.

Définition. Un graphe ou relation de E vers F est une partie de E × F .


Si G ⊂ E × F est un graphe de E vers F , le domaine de G est l’ensemble
dom G défini par

dom G = {a ∈ E : (∃b ∈ F ) : (a, b) ∈ G},

et l’image de G est l’ensemble im G défini par

im G = {b ∈ F : (∃a ∈ E) : (a, b) ∈ G}.

Le graphe réciproque G−1 de G est le graphe de F dans E défini par

G−1 = {(b, a) ∈ F × E : (a, b) ∈ G}.

Exemples. Si b ∈ F , E × {b} est un graphe de E dans F appelé graphe


constant de E dans F , et si a ∈ E, alors {a} × F est un graphe de E dans
F que l’on peut appeler graphe vertical de E dans F . Le graphe réciproque
d’un graphe constant est un graphe vertical, et le graphe réciproque d’un
graphe vertical est un graphe constant.
On vérifie sans peine que

dom G−1 = im G, im G−1 = dom G.


6 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS

Si a ∈ dom G, on dit encore que G est défini en a, et si b ∈ im G, on dit que


b est une valeur prise par G. En particulier, on dira que le graphe G de E
dans F est partout défini si dom G = E. Donc G−1 est partout défini si et
seulement si dom G−1 = F , c’est-à-dire si et seulement si im G = F . On est
ainsi conduit à la définition suivante.
Définition. On dit que le graphe G de E dans F est surjectif si im G = F .
Ainsi donc, G (resp. G−1 ) est partout défini si et seulement si G−1 (resp.
G) est surjectif.
Si A ⊂ E, l’ensemble G|A défini par
G|A = G ∩ (A × F ),
est évidemment encore un graphe de E dans F qui s’appelle la restriction de
G à A. Son image im G|A s’appelle l’image (directe) de A par G et se note
G(A). Si B ⊂ F , on appelle image réciproque de B par G l’image G−1 (B)
de B par le graphe réciproque G−1 . Par conséquent,
G(A) = {b ∈ F : (∃a ∈ A) : (a, b) ∈ G},
G−1 (B) = {a ∈ E : (∃b ∈ B) : (b, a) ∈ G−1 }
= {a ∈ E : (∃b ∈ B) : (a, b) ∈ G}.
En particulier, si A = {a} où a ∈ E, G({a}) est appelée l’image de a par G.
On notera que G({a}) /= ∅ si et seulement si a ∈ dom G.
Si G et H sont deux graphes de E dans F tels que G ⊂ H, on dit que
H est un prolongement de G ou encore que G est une restriction de H.
Définissons aussi l’importante notion de composé de deux graphes.
Définition. Soient D, E, F des ensembles, G un graphe de D dans E et H
un graphe de E dans F . Le composé H ◦ G de H et G est le graphe de D
dans F défini par
H ◦ G = {(a, c) ∈ D × F : (∃b ∈ E) : (a, b) ∈ G et (b, c) ∈ H}.
Le lecteur vérifiera aisément les égalités suivantes :
dom (H ◦ G) = {a ∈ dom G : G({a}) ∩ dom H /= ∅},
im (H ◦ G) = H(im G).
Il vérifiera aussi sans peine que le composé de deux graphes partout définis
est partout défini et que le composé de deux graphes surjectifs est surjectif.
Introduisons maintenant un type particulier de graphe qui joue un rôle
essentiel en analyse mathématique.
1.2. GRAPHES, FONCTIONS, APPLICATIONS 7

Définition. Un graphe G de E dans F est dit fonctionnel ou est appelé une


fonction de E dans F si, pour chaque a ∈ E, il existe au plus un b ∈ F tel
que (a, b) ∈ G, c’est-à-dire si les relations (a, b) ∈ G et (a, b$) ∈ G entraı̂nent
que b = b$ .
En d’autres termes, G est une fonction de E dans F si et seulement si,
pour chaque a ∈ E, G({a}) est soit vide, soit un singleton, ou encore si et
seulement si, pour chaque a ∈ dom G, G({a}) est un singleton. Dans ce cas,
G({a}) est donc de la forme {b} pour un certain élément b de F que l’on
notera G(a) et qu’on appellera l’image de a par G ou encore la valeur de la
fonction G en a.
Exemples. Un graphe constant de E dans F est toujours une fonction de
E dans F ; un graphe vertical de E dans F est une fonction de E dans F si
et seulement si F est un singleton.
Pour désigner une fonction G de E dans F , on utilise souvent la notation
G : dom G ⊂ E → F, a 2→ G(a),
qui met en évidence la valeur G(a) de G en a ∈ dom G.
Le caractère fonctionnel d’un graphe se conserve par composition.
Proposition. Si G est une fonction de D dans E et H une fonction de E
dans F , alors H ◦ G est une fonction de D dans F .
Démonstration. Soit a ∈ dom (H ◦ G) et soient c ∈ F et c$ ∈ F tels
que (a, c) ∈ H ◦ G et (a, c$) ∈ H ◦ G. Par définition du composé, il existe
b ∈ E tel que (a, b) ∈ G et (b, c) ∈ H et il existe b$ ∈ E tel que (a, b$ ) ∈ G et
(b$ , c$) ∈ H. Comme G est une fonction, on a nécessairement b = b$ et dès
lors, comme H est une fonction, on a nécessairement c = c$ .
On pourra donc parler de la fonction composée de deux fonctions, et la
démonstration ci-dessus montre que, si a ∈ dom (H ◦ G), alors (H ◦ G)(a) =
H(G(a)).
Même si G est une fonction de E dans F , l’exemple du graphe constant
avec E différent d’un singleton montre que le graphe réciproque G−1 (qui
est un graphe vertical) n’est pas nécessairement une fonction. Si G est un
graphe de E dans F , G−1 sera une fonction si et seulement si
(b, a) ∈ G−1 et (b, a$ ) ∈ G−1 ⇒ a = a$ ,
c’est-à-dire si et seulement si
(a, b) ∈ G et (a$ , b) ∈ G ⇒ a = a$ . (1.4)
On est ainsi conduit à la définition suivante.
8 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS

Définition. Soit G un graphe de E dans F . On dit que G est injectif si la


condition (1.4) est satisfaite.
Ainsi donc, G−1 est un graphe fonctionnel si et seulement si G est un
graphe injectif.
On a la caractérisation suivante des graphes injectifs.
Proposition. Le graphe G de E dans F est injectif si et seulement si, pour
chaque a ∈ E et chaque a$ ∈ E tel que a$ =
/ a, on a G({a}) ∩ G({a$ }) = ∅.
Démonstration. La condition nécessaire et suffisante d’injectivité que
nous voulons démontrer est équivalente, par contraposition, à la condition

(∀a ∈ E)(∀a$ ∈ E) : G({a}) ∩ G({a$ }) /= ∅ ⇒ a = a$ ,

et donc à la condition

(∀a ∈ E)(∀a$ ∈ E) : (a, b) ∈ G et (a$ , b) ∈ G ⇒ a = a$ ,

c’est-à-dire à la définition d’injectivité.


On en déduit facilement que la composition de graphes préserve l’injecti-
vité.
Proposition. Si G est un graphe injectif de D dans E et H un graphe
injectif de E dans F , alors H ◦ G est un graphe injectif de D dans F .
Un graphe fonctionnel injectif est appelé une fonction injective ou une
injection. G est donc une injection si et seulement si

a ∈ dom G, a$ ∈ dom G et G(a) = G(a$ ) ⇒ a = a$ ,

ou encore, si et seulement si

(∀a ∈ dom G)(∀a$ ∈ dom G : a /= a$ ) : G(a) /= G(a$ ).

Les propositions qui précèdent montrent que G est une injection de E dans
F si et seulement si G−1 est une injection de F dans E et que le composé
de deux injections est une injection. Lorsque G est une injection de E dans
F , G−1 est appelée la fonction réciproque de G.
Un graphe fonctionnel G de E dans F partout défini est appelé une
application de E dans F , et noté

G : E → F, a 2→ G(a).
1.2. GRAPHES, FONCTIONS, APPLICATIONS 9

Bien entendu, si G est une fonction de E dans F , alors G|dom G est une
application de dom G dans F : toute fonction restreinte à son domaine de-
vient une application. D’autre part, si G est une application injective de E
dans F , on sait que G−1 est une fonction de F dans E et des exemples sim-
ples montrent que G−1 n’est pas nécessairement une application de F dans
E. Ainsi, si E = {a1 , a2, a3 }, F = {a1 , a2 , a3 , a4 } et si G est l’application
injective de E dans F définie par

G : E → F, ai 2→ ai (i = 1, 2, 3)

alors la fonction inverse G−1 n’est pas définie en a4 et n’est donc pas une
application de F dans E. Si G est une application injective de E dans F ,
G−1 sera une application de F dans E si et seulement im G = F , c’est-à-dire
si et seulement si G est surjectif. Un graphe fonctionnel surjectif G de E
dans F est appelé une fonction surjective ou une surjection de E sur F . En
combinant les propriétés des graphes déjà obtenues, on voit facilement que
G est une application injective et surjective de E sur F si et seulement si
G−1 est une application surjective de F sur E.
Une application injective et surjective G de E dans F est appelée une
application bijective ou bijection de E sur F . En combinant les propriétés
de conservation du caractère fonctionnel, du caractère partout défini, de
l’injectivité et de la surjectivité par passage au composé, on obtient immédia-
tement le résultat suivant.

Proposition. Si G est une bijection de D sur E et H une bijection de E


sur F , alors H ◦ G est une bijection de D sur F .

Il existe, pour les applications, une variante terminologique souvent utili-


sée en mathématiques. Si I est un ensemble, que l’on appellera ensemble des
indices, et E un ensemble, une application G de I dans E est parfois appelée
famille d’éléments de E indicée par I et, au lieu de la notation canonique

G : I → E, i 2→ G(i),

on utilise la notation
G : I → E, i 2→ Gi ,

ou encore la notation compacte (Gi)i∈I . En particulier, une famille d’élé-


ments de E indicée par N ou N∗ est appelée une suite dans E ou encore une
suite d’éléments de E, et notée en abrégé (Gk )k∈N ou (Gk )k∈N∗ selon le cas.
10 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS

1.3 Ensembles finis, infinis, dénombrables


La notion de bijection permet de “comparer” les ensembles. Soient E et F
des ensembles.
Définition. On dit que E est équipotent à F s’il existe une bijection B de
E sur F .
Il en résulte aussitôt que E est équipotent à E (prendre B définie par
B(a) = a pour chaque a ∈ E), que E est équipotent à F si et seulement si F
est équipotent à E (puisque B est une bijection de E sur F si et seulement
si B −1 est une bijection de F sur E) et que si E est équipotent à F et F
équipotent à l’ensemble G, alors E est équipotent à G (puisque le composé
de deux bijections est une bijection). La relation “est équipotent à” est donc
une relation d’équivalence.
Pour chaque n ∈ N∗ , posons Jn = {1, 2, . . . , n}, et, pour unifier les
notations dans ce qui suit, posons J0 = ∅. On vérifiera facilement que Jn est
équipotent à Jm si et seulement si m = n.
Définition. On dit que l’ensemble E est fini s’il existe n ∈ N tel que E soit
équipotent à Jn . Dans le cas contraire, E est dit infini.
Les éléments d’un ensemble fini non vide pourront donc être ”numérotés”
par les entiers 1, 2, . . ., n pour un certain entier n. La remarque précédant la
définition montre que l’entier n ainsi associé à un ensemble fini E est unique;
on l’appelle le nombre d’éléments ou le cardinal de E et on le note # E.
Proposition. Si E est fini et s’il existe une bijection C de E sur l’ensemble
F , alors F est fini et # E = # F .
Démonstration. Si # E = n, il existe une bijection B de E sur Jn , et
donc B ◦ C −1 est une bijection de F sur Jn .

Corollaire. Si E est infini et s’il existe une bijection B de E sur F , alors


F est infini.
Démonstration. Si F est fini, E l’est aussi par la proposition précédente,
ce qui contredit l’hypothèse.
La définition d’ensemble fini entraı̂ne qu’un ensemble fini ne peut être
équipotent à aucune de ses parties propres (cette propriété peut d’ailleurs
être prise comme définition d’un ensemble fini). L’existence de la bijection

B : N → 2N, n 2→ 2n,
1.3. ENSEMBLES FINIS, INFINIS, DÉNOMBRABLES 11

de l’ensemble des entiers naturels sur l’ensemble 2N des entiers naturels pairs,
partie propre de N, montre que N est infini.
Introduisons maintenant une importante classe d’ensembles infinis. In-
tuitivement, ce sont les ensembles infinis dont les éléments peuvent être
“numérotés” par tous les entiers naturels.
Définition. On dit que l’ensemble E est dénombrable s’il est équipotent à
N.
Comme N est infini, un ensemble dénombrable est évidemment infini. Si
B : N → E est la bijection donc l’existence est assurée par la définition, on
aura donc E = {B(n) : n ∈ N} = {B(0), B(1), . . .}.
Ainsi, les ensembles 2N et N∗ sont dénombrables (prendre respectivement
les applications B définies sur N par B(n) = 2n et B(n) = n + 1 pour chaque
n ∈ N). De même, l’ensemble N × N est dénombrable, puisque l’application

(m + n)(m + n + 1)
B : N × N → N, (m, n) 2→ +n
2
est bijective. Elle correspond en effet au schéma de numérotation suivant
l(l+1) l(l+1) l(l+1)
0 1 2 ... 2 +1 2 +2 ... 2 +l ...
(0, 0) (1, 0) (0, 1) . . . (l, 0) (l − 1, 1) . . . (0, l) ...

qui consiste, sur le tableau suivant suivant “représentant” N × N,

(0, 0) (0, 1) (0, 2) (0, 3) (0, 4) ...


(1, 0) (1, 1) (1, 2) (1, 3) (1, 4) ...
(2, 0) (2, 1) (2, 2) (2, 3) (2, 4) ...
(3, 0) (3, 1) (3, 2) (3, 3) (3, 4) ...
(4, 0) (4, 1) (4, 2) (4, 3) (4, 4) ...
.. .. .. .. .. ..
. . . . . .

à associer un élément de type (l, 0) à l’entier constitué du nombre d’éléments


du tableau situés au dessus de la diagonale passant par (l, 0) (c’est-à-dire
1 + 2 + . . . + l = l(l + 1)/2), à numéroter successivement les éléments de
cette diagonale en ajoutant 1 au numéro de l’élément qui précède jusqu’à ce
qu’on arrive à l’élément de la première ligne, à revenir à l’élément (l + 1, 0)
et répéter le même processus.
Remarquons qu’un raisonnement strictement analogue permet de mon-
trer que le produit cartésien de deux ensembles dénombrables est dénombra-
ble.
12 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS

Le résultat suivant permet de construire de nombreux ensembles dénom-


brables et montre qu’intuitivement, les ensembles dénombrables sont les
“plus petits” ensembles infinis que l’on puisse considérer.
Proposition. Toute partie infinie d’un ensemble dénombrable est dénom-
brable.
Démonstration. Soit E un ensemble dénombrable et A une partie infinie
de E. Il existe donc une bijection B : E → N. Comme A est infini, l’ensemble
B(A) est une partie infinie de N. Soit n0 le plus petit élément de B(A), n1 le
plus petit élément de B(A) \ {n0 }, et, de proche en proche, nk le plus petit
élément de B(A)\{n0 , n1 , . . . , nk−1 }. Comme B(A) est infini, on définit ainsi
une bijection C : N → B(A), k 2→ nk , qui fournit la bijection C ◦ B de A sur
N et montre que A est dénombrable.

Corollaire. Tout ensemble contenant une partie infinie non dénombrable


est infini non dénombrable.

Définition. On dira qu’un ensemble E est au plus dénombrable s’il est fini
ou dénombrable.
On vérifie aisément que E est au plus dénombrable s’il existe une surjec-
tion de N sur E.
Il est évident que toute partie d’un ensemble au plus dénombrable est
au plus dénombrable. Le résultat suivant montre qu’une union dénombrable
d’ensembles au plus dénombrables est encore au plus dénombrable.
Proposition. Soit (En )n∈N une suite d’ensembles En telle que chaque En
!
soit au plus dénombrable. Alors l’ensemble E = n∈N En est au plus
dénombrable.
Démonstration. Par hypothèse, pour chaque n ∈ N, il existe une surjec-
tion Bn : N → En . Il en résulte que l’application
B : N × N → E, (n, m) 2→ Bn (m)
est également surjective. Comme on a vu plus haut qu’il existe une bijection
C : N → N × N, on obtient une surjection B ◦ C de N sur E.

1.4 Nombres réels


Nous ne reviendrons pas ici sur les extensions de la notion de nombre obtenu-
es à partir de N et supposerons connus l’ensemble Z des entiers relatifs, l’en-
semble Q des nombres rationnels et leurs propriétés. On sait que N ! Z ! Q
1.4. NOMBRES RÉELS 13

et que l’on peut construire un ensemble R, l’ensemble des nombres réels, ou,
brièvement, des réels, qui contient strictement Q et possède les propriétés
suivantes. Nous n’aborderons pas ici le problème de la construction de R.
L’ensemble des réels ou corps des réels ou champ des réels est un ensem-
ble, noté R, pour lequel sont définies :
1) deux applications A et M de R × R dans R, respectivement appelées
l’addition et la multiplication sur R et pour lesquelles on peut utiliser respec-
tivement les notations A(x, y) = x + y et M (x, y) = x.y ou M (x, y) = xy ou
M (x, y) = x × y, qui se lisent respectivement x plus y et x fois y;
2) une relation G dite relation d’ordre de R dans R notée x ≤ y (ou
y ≥ x) si et seulement si (x, y) ∈ G, qui se lit x inférieur à y (ou y supérieur
à x);
qui vérifient les quatre groupes de propriétés suivantes.
(I) R est un corps commutatif ou champ.
En d’autres termes :
(i) pour tout x ∈ R, y ∈ R et z ∈ R, on a

x + y = y + x, x + (y + z) = (x + y) + z,

xy = yx, x(yz) = (xy)z, x(y + z) = xy + xz;


(ii) il existe un élément 0 ∈ R tel que, pour tout x ∈ R, on ait 0 + x = x;
(iii) pour chaque x ∈ R il existe un unique réel, noté −x tel que x+(−x) = 0;
(iv) il existe un élément 1 /= 0 dans R tel que, pour tout x ∈ R, on ait
1.x = x :
(v) pour chaque x /= 0 dans R, il existe un unique réel noté x−1 ou x1 tel que
x.x−1 = 1.
(II) R est un corps ordonné.
En d’autres termes :
(i) pour tout x ∈ R, y ∈ R et z ∈ R, les relations x ≤ y et y ≤ z impliquent
la relation x ≤ z;
(ii) pour tout x ∈ R et y ∈ R, ”x ≤ y et y ≤ x” équivaut à x = y;
(iii) pour chaque x ∈ R et chaque y ∈ R, on a x ≤ y ou y ≤ x;
(iv) pour tout x ∈ R, y ∈ R et z ∈ R, la relation x ≤ y implique la relation
x + z ≤ y + z;
(v) pour tout x ∈ R tel que x ≥ 0 et tout y ∈ R tel que y ≥ 0, on a xy ≥ 0.
La relation x ≤ y et x /= y s’écrira x < y ou y > x et se lira x strictement
inférieur à y ou y strictement supérieur à x. Si a < b sont deux réels,
l’ensemble
{x ∈ R : a < x < b}
14 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS

sera appelé intervalle ouvert d’origine a et d’extrémité b et sera désigné par


]a, b[; l’ensemble
{x ∈ R : a ≤ x ≤ b}
sera appelé intervalle fermé d’origine a et d’extrémité b et sera désigné par
[a, b]; l’ensemble

{x ∈ R : a < x ≤ b} (resp.{x ∈ R : a ≤ x < b})

sera appelé un intervalle semi-ouvert ou semi-fermé et désigné par ]a, b]


(resp. [a, b[).
(III) R est un corps ordonné archimédien,
c’est-à-dire qu’il satisfait au théorème d’Archimède: pour tout réel x > 0
et tout réel y ≥ 0, il existe un entier m tel que mx ≥ y.
(IV) R est un corps complet,
c’est-à-dire qu’il vérifie le théorème des intervalles fermés emboı̂tés:
si ([ak , bk ])k∈N est une suite d’intervalles fermés tels que, pour tout k ∈ N,
on ait [ak+1 , bk+1 ] ⊂ [ak , bk ], alors
"
[ak , bk ] /= ∅.
k∈N

En d’autres termes, si les suites dans R (ak )k∈N et (bk )k∈N sont telles
que, pour chaque k ∈ N, on ait ak ≤ ak+1 < bk+1 ≤ bk , alors il existe au
moins un réel c tel que, pour chaque k ∈ N, on ait c ∈ [ak , bk ].
Rappelons que Q est formé du sous-ensemble des éléments de R qui
peuvent s’écrire sous la forme ± m
n où m ∈ N et n ∈ N .

Proposition. L’ensemble Q des rationnels est dénombrable.


Démonstration. Comme Q ⊃ N, Q est infini et il suffit de montrer
qu’il est au plus dénombrable, ce qui sera le cas si l’on montre que Q+ =
{x ∈ Q : x ≥ 0} est au plus dénombrable, puisque Q = Q+ ∪ Q− avec
Q− = {x ∈ Q : x ≤ 0} et Q− est évidemment équipotent à Q+ . L’application
B : N × N∗ → Q+ est une surjection, et, comme N × N∗ est dénombrable, Q
est au plus dénombrable.
Donnons maintenant quelques conséquences importantes des propriétés
des réels. La première résulte des propriétés de l’ordre.
Proposition. Si b > c sont deux réels, il existe un réel ! > 0 tel que b > c+!.
Démonstration. Par hypothèse, b − c > 0 et dès lors b − c > b−c
2 > 0; il
suffit donc de prendre ! = b−c
2 .
1.4. NOMBRES RÉELS 15

Corollaire. Soient b et c des réels. Alors b ≤ c si et seulement si, pour tout


! > 0, on a b ≤ c + !.
Démonstration. Condition nécessaire. Si b ≤ c et ! > 0 est donné, on a
évidemment b ≤ c + !.
Condition suffisante. Elle est équivalente à sa contraposée, qui n’est rien
d’autre que la proposition précédente.
Démontrons maintenant une conséquence du théorème d’Archimède ex-
primant la propriété de densité des rationnels dans les réels.
Proposition. Tout invervalle ouvert de R contient un ensemble infini de
rationnels.
Démonstration. Montrons d’abord qu’il suffit de démontrer que tout
intervalle ouvert de R contient au moins un rationnel. En effet, s’il en est
ainsi et si c1 ∈ ]a, b[ est rationnel, alors ]a, c1[ contiendra un rationnel c2
et, en continuant de la sorte, on obtient un ensemble infini {ci : i ∈ N} de
rationnels contenus dans ]a, b[. Pour démontrer maintenant que ]a, b[ contient
au moins un rationnel, on peut supposer sans perte de généralité que b > 0,
car, dans le cas contraire, il suffit de considérer l’intervalle ] − b, −a[ dont
l’extrémité −a est strictement positive et de noter que si c ∈ ] − b, −a[, alors
−c ∈ ]a, b[. La démonstration consiste maintenant à déterminer un n ∈ N∗
et un m ∈ N tels que a < m n < b. Comme b − a > 0, le théorème d’Archimède
implique l’existence d’un entier n ≥ 1 tel que n(b − a) ≥ 2 et donc tel que
n(b − a) > 1, ou encore
1
b−a> . (1.5)
n
Comme b > 0, le même théorème d’Archimède entraı̂ne l’existence d’un
entier naturel k ≥ 1 tel que nk ≥ b. Désignons par h le plus petit entier
naturel ayant cette propriété. On a donc
h−1 h
< b, ≥ b. (1.6)
n n
En utilisant (1.5) et la deuxième inégalité de (1.6), on obtient

h 1
−a > ,
n n
c’est-à-dire a < h−1
n . En vertu de la première inégalité de (1.6), il suffit donc
de prendre m = h − 1.
16 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS

Donnons maintenant une conséquence importante du théorème des in-


tervalles fermés emboı̂tés : l’existence d’ensembles infinis non dénombrables.
Proposition. Si a < b sont des réels, l’intervalle fermé [a, b] n’est pas
dénombrable.
Démonstration. Supposons que [a, b] soit dénombrable et soit B : N →
[a, b] une bijection fournie par la définition. Pour simplifier les notations,
nous poserons, pour chaque n ∈ N, xn = B(n). Notons que si c ∈ [a, b]
et que l’on divise [a, b] en trois intervalles fermés de même longueur, l’un
d’entre eux au moins ne contiendra pas c.
Cela étant, divisons [a, b] en trois intervalles fermés de même longueur et
soit [a0 , b0] l’un d’eux tel que x0 /∈ [a0 , b0]. Si x1 /∈ [a0 , b0], prenons [a1 , b1] =
[a0 , b0 ], tandis que si x1 ∈ [a0 , b0], divisons [a0 , b0 ] en trois intervalles fermés
de même longueur et prenons pour [a1 , b1] l’un deux tel que x1 /∈ [a1 , b1 ].
Ayant ainsi construit

[ak−1 , bk−1] ⊂ [ak−2 , bk−2 ] ⊂ . . . ⊂ [a1 , b1] ⊂ [a0 , b0] ⊂ [a, b],

tels que,
xj /∈ [aj , bj ], (1 ≤ j ≤ k − 1),
prenons [ak , bk ] = [ak−1 , bk−1 ] si xk /∈ [ak−1 , bk−1] tandis que, si xk ∈
[ak−1 , bk−1], divisons [ak−1 , bk−1] en trois intervalles fermés de même lon-
gueur et prenons pour [ak , bk ] l’un d’entre eux qui ne contient pas xk . En
continuant de la sorte, on obtient une suite ([ak , bk ])k∈N d’intervalles fermés
emboı̂tés contenus dans [a, b] et tels que, pour chaque k ∈ N, xk /∈ [ak , bk ].
Le théorème des intervalles emboı̂tés implique l’existence d’un réel c appar-
tenant à chaque intervalle [ak , bk ], (k ∈ N). Dès lors, cet élément c de [a, b]
est différent de xk pour chaque k ∈ N, ce qui contredit la définition de B.

Corollaire. Tout intervalle de R et R lui-même sont des ensembles non


dénombrables.
Démonstration. Ces ensembles contiennent en effet un intervalle fermé.

Corollaire. Tout intervalle de R contient un nombre rationnel et un nombre


irrationnel.
Démonstration. Tout intervalle I de R contient un intervalle ouvert qui
contient lui-même un rationnel. Si I ne contient pas d’irrationnel, alors
I ⊂ Q est au plus dénombrable, ce qui contredit le Corollaire précédent.
1.4. NOMBRES RÉELS 17

Nous avons donc démontré l’existence, à côté des ensembles infinis dé-
nombrables, d’ensembles infinis non dénombrables équipotents à R. On dit
qu’ils ont la puissance du continu. Le créateur de la théorie des ensem-
bles, Georg Cantor, et ses successeurs ont cherché sans succès à montrer
l’existence de parties infinies de R non dénombrables et non équipotentes à R
et ont été amenés à formuler la célèbre hypothèse du continu : tout ensemble
infini non dénombrable possède une partie équipotente à R. Paul Cohen
a démontré en 1962 que l’hypothèse du continu était indécidable (c’est-à-
dire ni vraie ni fausse) dans le cadre de la théorie des ensembles : on peut
ajouter indifféremment aux axiomes de la théorie des ensembles l’hypothèse
du continu ou sa négation et obtenir des théories ayant la même cohérence.
Définissons maintenant l’importante notion de valeur absolue d’un réel.
Définition. La valeur absolue du réel x, notée |x|, est le réel positif défini
par |x| = x si x ≥ 0 et |x| = −x si x < 0.
Il résulte aussitôt de cette définition que, pour tout x ∈ R, on a |x| = |−x|
et que |x| = 0 si et seulement si x = 0. En outre, il est très facile de montrer
que, a > 0 et x ∈ R étant donnés, on a les équivalences

|x| ≤ a ⇔ −a ≤ x ≤ a ⇔ x ∈ [−a, a],

|x| < a ⇔ −a < x < a ⇔ x ∈ ] − a, a[.


Dans la représentation géométrique de R, qui consiste à associer à chaque
réel x le point d’abscisse x sur une droite orientée munie d’une origine, |x|
représente la longueur du segment de droite joignant 0 à x. Dès lors, si x ∈ R
et y ∈ R, |x − y| représente la distance entre les points correspondants à x
et à y sur la droite.
Les inégalités suivantes, qui expriment les relations entre l’addition, la
soustraction et la valeur absolue, sont fondamentales.
Proposition. Pour tout x ∈ R et tout y ∈ R, on a

|x + y| ≤ |x| + |y|, ||x| − |y|| ≤ |x − y|.

Démonstration. Démonstrons tout d’abord la première inégalité. Si x ≥


0 et y ≥ 0, alors, en utilisant les propriétés (II), on a x + y ≥ 0 + y = y ≥ 0,
et dès lors |x + y| = x + y = |x| + |y|. On procède de même si x ≤ 0 et y ≤ 0.
Si x ≤ 0 ≤ y, alors

x + y ≤ 0 + y = y = |y| = |y| + 0 ≤ |y| + |x| = |x| + |y|,


18 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS

x + y ≥ x + 0 = x = −(−x) = −|x| = −|x| + 0 ≥ −|x| − |y| = −(|x| + |y|).


Par conséquent, −(|x| + |y|) ≤ x + y ≤ |x| + |y|, c’est-à-dire la thèse. Si
y ≤ 0 ≤ x, il suffit d’intervertir x et y. Pour la seconde inégalité, en utilisant
la première et les égalités

x = (x − y) + y, y = (y − x) + x,

on obtient

|x| ≤ |x − y| + |y|, |y| ≤ |y − x| + |x| = |x − y| + |x|,

et dès lors
|x| − |y| ≤ |x − y|, |x| − |y| ≥ −|x − y|,
ce qui équivaut à la seconde inégalité.
Remarque. On déduit aussitôt, de proche en proche, de la Proposition
précédente, que si x1 , x2 , . . ., xn sont des réels, alors
# #
#$n # $ n
# #
# xi # ≤ |xi|.
# #
i=1 i=1

La propriété suivante exprime les relations entre valeur absolue et mul-


tiplication.
Proposition. Pour tout x ∈ R et tout y ∈ R, on a

|xy| = |x||y|.

Démonstration. Si x ≥ 0 et y ≥ 0, alors xy ≥ 0 et

|xy| = xy = |x||y|.

Si x ≤ 0 ≤ y, alors, en utilisant le premier cas,

|xy| = | − (xy)| = |(−x)y| = |(−x)||y| = |x||y|.

Le cas où y ≤ 0 ≤ x s’en déduit en intervertissant x et y. Enfin, si x ≤ 0 et


y ≤ 0, on a
|xy| = |(−x)(−y)| = |(−x)||(−y)| = |x||y|.
1.5. L’ESPACE VECTORIEL NORMÉ RN 19

Si nous posons R+ = {x ∈ R : x ≥ 0}, la notion de valeur absolue d’un


réel permet de définir comme suit sur R l’application valeur absolue

| · | : R → R+ , x 2→ |x|,

vérifiant les propriétés suivantes :


1) pour chaque réel x, |x| = 0 ⇔ x = 0;
2) pour chaque c ∈ R et chaque x ∈ R, on a |cx| = |c||x|;
3) pour chaque x ∈ R et chaque y ∈ R, on a |x + y| ≤ |x| + |y|.
Enfin, la condition d’annulation suivante est souvent utile.
Proposition. Soit a un réel. Alors a = 0 si et seulement si, pour tout ! > 0,
on a |a| ≤ !.
Démonstration. La condition nécessaire est évidente. La condition suf-
fisante résulte d’une condition nécessaire et suffisante pour que b ≤ c vue
plus haut; il suffit de prendre c = 0 et b = |a|.

1.5 L’espace vectoriel normé Rn


L’étude des fonctions de plusieurs variables et des fonctions à valeurs vecto-
rielles gagne en clarté et en concision par l’emploi du langage géométrique
lié à l’espace vectoriel Rn .
Si n ≥ 1 est un entier, nous désignerons par Rn le produit cartésien
R × R × . . . R de n copies de R. Rn est donc l’ensemble des n-uples ordonnés
(x1 , x2 , . . . , xn ) de nombres réels. Un élément x = (x1 , x2 , . . ., xn ) de Rn est
souvent appelé un point de Rn et, pour chaque 1 ≤ i ≤ n, xi s’appelle la ie
composante de x. En définissant les applications

Rn × Rn → Rn , (x, y) 2→ x + y = (x1 + y1 , . . . , xn + yn ),

R × Rn → Rn , (c, x) 2→ cx = (cx1 , . . . , cxn),


respectivement appelées somme de deux éléments de Rn et multiplication
d’un élément de Rn par un réel, on vérifie aisément qu’on munit Rn d’une
structure d’espace vectoriel sur le corps R. Lorsque n = 1, ces applica-
tions se réduisent respectivement à l’addition et à la multiplication usuelles.
L’élément (0, . . ., 0) de Rn sera noté 0. L’espace vectoriel Rn est de dimen-
sion n et les points

e1 = (1, 0, . . ., 0), e2 = (0, 1, 0, . . ., 0), . . ., en = (0, . . ., 0, 1)


20 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS

de Rn forment une base algébrique de cet espace vectoriel qui est appelée
base canonique. Tout élément x de Rn peut en effet s’écrire
n
$
x = x1 e1 + . . . + xn en = xi ei .
i=1

Pour chaque 1 ≤ i ≤ n, on appellera projection sur la ie composante


l’application
pi : Rn → R, x 2→ xi .
Comme, pour chaque x ∈ Rn , y ∈ Rn et c ∈ R, on a

pi (x + y) = (x + y)i = xi + yi = pi (x) + pi (y),

pi (cx) = (cx)i = cxi ,


on voit que pi est une application linéaire de Rn dans R. Nous n’insisterons
pas davantage ici sur la structure algébrique de Rn ni sur son interprétation
géométrique lorsque n = 1, 2 ou 3.
La définition suivante s’inspire des propriétés de l’application valeur ab-
solue sur R.
Définition. Si E est un espace vectoriel sur R, on appelle norme sur E
toute application
6 · 6 : E → R+ , x →
2 6x6,
vérifiant les conditions suivantes :
1) pour chaque x ∈ E, on a 6x6 = 0 ⇔ x = 0;
2) pour chaque c ∈ R et chaque x ∈ E, on a 6cx6 = |c|6x6;
3) pour chaque x ∈ E et chaque y ∈ E, on a 6x + y6 ≤ 6x6 + 6y6.
Un espace vectoriel E muni d’une telle norme est dit un espace vectoriel
normé . Il est clair que R muni de l’application valeur absolue est un espace
vectoriel normé. Nous allons voir que l’on peut, et de différentes manières,
définir, quel que soit n ∈ N∗ , une norme sur Rn qui se réduira à la valeur
absolue lorsque n = 1.
Définissons l’application | · |1 de Rn dans R+ par
n
$
| · |1 : Rn → R+ , x = (x1 , . . . , xn ) 2→ |x1 | + . . . + |xn | = |xi |.
i=1

Proposition. | · |1 est une norme sur Rn .


%
Démonstration. On a |0|1 = 0 et si |x|1 = 0, alors ni=1 |xi| = 0, et comme
chaque terme |xi| est positif, il faut nécessairement que |xi| = 0, (1 ≤ i ≤ n),
1.5. L’ESPACE VECTORIEL NORMÉ RN 21

et donc que xi = 0, (1 ≤ i ≤ n), c’est-à-dire que x = 0. Si c ∈ R et x ∈ Rn ,


on a & n '
n $ n $ $
|cx|1 = |cxi | = |c||xi| = |c| |xi | = |c||x|1.
i=1 i=1 i=1

Enfin, si x ∈ Rn et y ∈ Rn , on a
n
$ n
$
|x + y|1 = |xi + yi | ≤ (|xi| + |yi |) = |x|1 + |y|1 .
i=1 i=1

Définissons l’application | · |2 de Rn dans R+ par


& n
'1/2 & n '1/2
$ $
| · |2 : R → R+ , x 2→
n
(x21 + . . . + x2n )1/2 = x2i = |xi | 2
.
i=1 i=1

Pour vérifier que | · |2 est une norme sur Rn , nous aurons besoin des
deux résultats importants suivants. Le premier porte le nom d’identité de
Lagrange.
Proposition. Pour tout x ∈ Rn et tout y ∈ Rn , on a
& n
' n  ,
n
-2 n $
n
$ $ $ 1$
2 
xi 2
yj − (xiyi ) = (xi yj − xj yi )2 .
i=1 j=1 i=1
2 i=1 j=1

Démonstration. On a
n $ n
1$
(xiyj − xj yi )2 =
2 i=1 j=1

n $ n n $ n n $ n
1$ $ 1$
x2i yj2 − xi yj xj yi + x2j yi2 =
2 i=1 j=1 i=1 j=1
2 i=1 j=1
& n
' n  ,
n
- n 
$ $ $ $
x2 
i y2 − (xi yi )  (xj yj ) ,
j
i=1 j=1 i=1 j=1

et l’identité de Lagrange s’en déduit aussitôt.


L’identité de Lagrange a pour conséquence immédiate l’inégalité de Cau-
chy.
22 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS

Corollaire. Pour tout x ∈ Rn et tout y ∈ Rn , on a


, n -2 & n
' n 
$ $ $
(xi yi ) ≤ x2 
i y2  . j
i=1 i=1 j=1

Nous pouvons maintenant démontrer que | · |2 est une norme sur Rn .

Proposition. | · |2 est une norme sur Rn .

Démonstration. La vérification facile des propriétés 1 et 2 de la norme


est laissée au lecteur. La propriété 3 s’écrit explicitement
, n -1/2 & n
'1/2 & n
'1/2
$ $ $
(xi + yi ) 2
≤ x2i + yi2 ,
i=1 i=1 i=1

et les deux membres étant positifs, cette inégalité équivaut à l’inégalité


& '1/2 & '1/2 2
n
$ n
$ n
$
(xi + yi )2 ≤  x2i + y2 i
 ,
i=1 i=1 i=1

c’est-à-dire, en effectuant les calculs et en simplifiant les termes communs


aux deux membres, à l’inégalité

n
& n
'1/2 & n
'1/2
$ $ $
xi yi ≤ x2i yi2 .
i=1 i=1 i=1

%n
Cette inégalité est évidemment satisfaite si i=1 xi yi < 0 et elle résulte de
%
l’inégalité de Cauchy si ni=1 xi yi ≥ 0.

Remarque. La norme | · |2 est souvent appelée la norme euclidienne de Rn


parce que, si n = 2 ou 3 et si x ∈ Rn et y ∈ Rn , l’expression |x − y|2 n’est
rien d’autre que la distance euclidienne entre les points x et y.
Définissons l’application | · |∞ de Rn dans R+ par

| · |∞ : Rn → R+ , x = (x1 , . . ., xn ) 2→ max{|xi| : 1 ≤ i ≤ n},

où max{|xi | : 1 ≤ i ≤ n} désigne le plus grand élément de l’ensemble {|xi| :


1 ≤ i ≤ n}.
1.5. L’ESPACE VECTORIEL NORMÉ RN 23

Proposition. | · |∞ est une norme sur Rn .


Démonstration. La vérification des conditions 1 et 2 est laissée au lecteur.
Pour la propriété 3, soit x ∈ Rn , y ∈ Rn et k un indice tel que

|x + y|∞ = max{|xi + yi | : 1 ≤ i ≤ n} = |xk + yk |.

On a évidemment

|xk + yk | ≤ |xk | + |yk | ≤ max{|xi| : 1 ≤ i ≤ n} + max{|yi | : 1 ≤ i ≤ n}

= |x|∞ + |y|∞ .

On a les inégalités suivantes entre les trois normes que nous venons de
définir sur Rn .
Proposition. Pour tout x ∈ Rn et tout 1 ≤ i ≤ n, on a

|xi| ≤ |x|∞ ≤ |x|2 ≤ |x|1 ≤ n|x|∞ .

Démonstration. Soit x ∈ Rn et k un indice tel |x|∞ = |xk |. On a


évidemment, pour chaque 1 ≤ i ≤ n,
& n
'1/2
$
|xi| ≤ |xk | ≤ |xi | 2
= |x|2 .
i=1

En outre, on a
n
$
|x|1 = |xi | ≤ n|xk | = n|x|∞ .
i=1
Enfin, on a trivialement,
n
$ n $
$ n
|x|22 = |xi ||xi| ≤ |xi ||xj | = |x|21 ,
i=1 i=1 j=1

ce qui entraı̂ne |x|2 ≤ |x|1 , puisque ces nombres sont positifs.

Définition. Si E est un espace vectoriel, les deux normes 6 · 61 et 6 · 62 sur


E seront dites équivalentes s’il existe deux constantes a > 0 et b > 0 telles
que, pour tout x ∈ E, on ait

a6x61 ≤ 6x62 ≤ b6x61 .


24 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS

On vérifie sans peine qu’il s’agit bien d’une relation d’équivalence sur
les normes de E. La Proposition que nous venons de démontrer montre
que les trois normes | · |i , (i = 1, 2, ∞) que nous venons de définir sur Rn
sont équivalentes. On montrera plus loin que toutes les normes sur Rn sont
équivalentes.
La notion de norme permet de définir la notion de boule dans Rn .
Définition. Soit a ∈ Rn , r > 0 et i = 1, 2 ou ∞. La boule de centre a et
de rayon r pour la norme | · |i est la partie Bi [a; r] de Rn définie par

Bi [a; r] = {x ∈ Rn : |x − a|i ≤ r}.

Lorsque a = 0, on écrira en général Bi [r] au lieu de Bi [a; r]. La terminolo-


gie provient évidemment de ce que, pour n = 3 et pour la norme euclidienne,
l’ensemble B2 [a; r] correspond à la boule usuelle de centre a et de rayon r.
Pour n = 2 et la norme euclidienne, B2 [a; r] correspond au disque de centre
a et de rayon r. Enfin, pour n = 1, les trois normes se réduisent à la valeur
absolue et
Bi [a; r] = [a − r, a + r], (i = 1, 2, ∞),

et les boules sont donc des intervalles fermés. Réciproquement, tout inter-
valle fermé [a, b] de R corrrespond à la boule Bi [ a+b
2 ; 2 ].
b−a

Proposition. Pour tout a ∈ Rn et tout r > 0, on a


2 3
r
B∞ a; ⊂ B1 [a; r] ⊂ B2 [a; r] ⊂ B∞ [a; r].
n

Démonstration. C’est une conséquence facile des inégalités entre normes


qui entraı̂nent, pour tout x ∈ Rn , que

|x − a|∞ ≤ |x − a|2 ≤ |x − a|1 ≤ n|x − a|∞ .

La norme | · |2 sur Rn est associée à la notion de produit scalaire de deux


éléments de Rn .
Définition. L’application (·|·) de Rn × Rn dans R définie par
n
$
(x|y) = xi yi
i=1
1.6. NOMBRES COMPLEXES 25

s’appelle le produit scalaire sur Rn .


On vérifie facilement les propriétés suivantes du produit scalaire. Si
x ∈ Rn , y ∈ Rn , z ∈ Rn et c ∈ R, alors
1) (x|y) = (y|x) et (x|x) = |x|22 ;
2) (x + y|z) = (x|z) + (y|z);
3) (cx|y) = c(x|y).
On en déduit aussitôt que

(x|y + z) = (x|y) + (x|z), (x|cy) = c(x|y).

D’autre part, l’inégalité de Cauchy s’écrit, en termes de produit scalaire et


de norme | · |2
|(x|y)| ≤ |x|2 |y|2.
On notera que, si n = 1, le produit scalaire se ramène à la multiplication
ordinaire sur R mais que, pour n ≥ 2, il constitue une application bilinéaire
de Rn × Rn dans R et non pas l’éventuelle application de Rn × Rn dans Rn
qui étendrait à Rn la notion de multiplication définie sur R. Nous allons voir
qu’une telle extension est possible pour n = 2.

1.6 Nombres complexes


Introduisons dans R2 une multiplication à partir de l’application R2 × R2
dans R2
(x, y) 2→ xy = (x1 y1 − x2 y2 , x1 y2 + x2 y1 ).
On vérifie sans peine par des calculs très simples que l’addition usuelle dans
R2 et cette multiplication satisfont à tous les axiomes (I) vérifiés par les
nombres réels si l’on prend 0 = (0, 0) comme élément neutre pour l’addition,
e1 = (1, 0) comme élément neutre pour la multiplication, −x = (−x1 , −y1 )
et, pour x /= 0, 4 5
x1 −x2
x−1 = , .
x21 + x22 x21 + x22
Muni de cette addition et de cette multiplication, R2 possède donc la struc-
ture de champ, est appelé le corps ou le champ des nombres complexes, est
noté C et ses éléments sont appelés des nombres complexes.
L’application j de R dans C définie par x 2→ (x, 0) est une bijection de
R sur R × {0} et est telle que, pour tout x ∈ R et tout y ∈ R, on a

j(x) + j(y) = (x, 0) + (y, 0) = (x + y, 0) = j(x + y),


26 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS

j(x).j(y) = (xy, 0) = j(xy).

On peut donc identifier R au sous-corps R × {0} de C; par suite de cette


identification, l’élément e1 = (1, 0) de C sera encore simplement noté 1 et les
éléments de R×{0} notés indifféremment (x1 , 0) ou x1 . L’élément e2 = (0, 1)
de C sera noté i et la loi de multiplication et l’identification que nous venons
de faire entraı̂nent

i2 = i.i = (0, 1).(0, 1) = (−1, 0) = −1.

On retrouve ainsi l’origine historique des nombres complexes comme ex-


tension des nombres réels permettant de donner un sens à la racine carrée
d’un nombre négatif, problème qui s’était présenté dès le XVIe siècle dans
la résolution des équations algébriques. On a aussi, pour tout c ∈ R et tout
x ∈ C,
(c, 0).x = (c, 0).(x1, x2 ) = (cx1 , cx2 ) = c(x1 , x2 ) = cx,

ce qui montre la compatibilité, via l’identification faite plus haut, entre le


produit par un réel d’un élément de C et la multiplication de cet élément par
l’élément de C identifié à ce réel. On pourra donc écrire, pour tout x ∈ C,

x1 e1 = x1 .1 = x1 , x2 e2 = (x2 , 0).(0, 1) = (0, x2 ) = x2 (0, 1) = x2 i = ix2 ,

et dès lors
x = x1 e1 + x2 e2 = x1 + ix2 ,

qui est l’écriture complexe de x ∈ C. x1 est alors appelé la partie réelle de x


et noté aussi 8x et x2 est appelé la partie imaginaire de x et noté aussi 9x.
L’avantage de la notation complexe est que les opérations d’additions et de
multiplication peuvent se faire avec les règles habituelles de l’algèbre sur R,
à condition de remplacer i2 par −1.
Pour éviter l’emploi d’indices, on utilise souvent, pour un nombre com-
plexe, la notation z = (x, y) = x + iy. Le nombre complexe x − iy = (x, −y)
est appelé le conjugué du nombre complexe z = x + iy = (x, y) et est noté
z̄. On vérifie sans peine que, pour tout z ∈ C et tout v ∈ C, on a

¯
z̄ = z, z + v = z̄ + v̄, zv = z̄v̄,

et
z z̄ = x2 + y 2 = |z|22 .
1.7. INTÉRIEUR, ADHÉRENCE, FRONTIÈRE 27

Dans C, la norme |z|2 de z, qui est donc égale à (z z̄)1/2, se note simplement
|z| et est souvent appelée (comme dans R), la valeur absolue de z ou le
module de z. On a, pour tout z ∈ C et tout v ∈ C,

|zv|2 = zvzv = zvz̄v̄ = z z̄vv̄ = |z|2 |v|2 ,

et dès lors |zv| = |z||v|, comme pour la multiplication et la valeur absolue


dans R. Cette dernière relation n’est pas vraie pour les deux autres normes
sur R2 , comme on le vérifie aisément. On utilisera uniquement la norme | · |2
dans C.
Tant que la notion de multiplication de deux éléments n’est pas utilisée
dans C, ce dernier ensemble ne diffère donc de R2 muni de la norme | · |2 que
par les notations et la terminologie. D’autre part, de la même manière que
R est un espace vectoriel sur R, on peut considérer C non seulement comme
un espace vectoriel sur R (lorsqu’on l’identifie à R2 ), mais aussi comme un
espace vectoriel sur C, le produit par un scalaire (c’est-à-dire un élément de
C) étant défini à partir de la multiplication dans C.
On notera enfin qu’il n’a pas été question de relation d’ordre dans C. On
démontre en algèbre qu’il est impossible de munir C d’une relation d’ordre
vérifiant tous les axiomes II de la section sur les réels. En outre, Georg
Frobenius a démontré qu’il était impossible, pour n ≥ 3, de munir Rn
d’une multiplication (c’est-à-dire d’une application bilinéaire de Rn × Rn
dans Rn telle que tous les axiomes I de la section sur les réels soient vérifiés).

1.7 Intérieur, adhérence, frontière


La notion de norme dans Rn permet de renforcer et d’affaiblir la notion
d’appartenance à une partie de Rn . Soit a ∈ Rn et E une partie de Rn .
Définition. On dit que a est intérieur à E (ou que E est un voisinage de
a) s’il existe r > 0 tel que B2 [a; r] ⊂ E.
L’intérieur int E de E est l’ensemble

int E = {a ∈ Rn : a est intérieur à E} = {a ∈ Rn : E est voisinage de a}.

Le résultat suivant est une conséquence immédiate de la définition.


Proposition. Si a est intérieur à E, alors a ∈ E. En d’autres termes,
int E ⊂ E.
La réciproque de cette proposition est fausse : un point peut appartenir
à un ensemble sans être intérieur à cet ensemble. Par exemple, si a < b sont
28 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS

des réels, a ∈ [a, b] mais a n’est pas intérieur à [a, b]. En effet, pour chaque
r > 0, B2 [a; r] /⊂ [a, b] puisque B2 [a; r] = [a − r, a + r] et a − r /∈ [a, b].
Définition. On dit que a est adhérent à E si, pour tout r > 0, on a

B2 [a; r] ∩ E /= ∅.

L’adhérence adh E de E est l’ensemble

adh E = {a ∈ Rn : a est adhérent à E}.

On le note aussi E.
Le résultat suivant est une conséquence immédiate de la définition.
Proposition. Si a ∈ E, alors a est adhérent à E.
La réciproque de cette proposition est fausse : un point peut être adhé-
rent à un ensemble sans lui appartenir. Par exemple, si a < b sont des réels,
a /∈ ]a, b[ mais a est adhérent à ]a, b[. En effet, pour chaque r > 0, on a

B2 [a; r]∩ ]a, b[ = [a − r, a + r]∩ ]a, b[ /= ∅,

puisque a + r $ ∈ [a − r, a + r]∩ ]a, b[ si r $ = min{r, b−a


2 }.
Il résulte immédiatement des définitions que

int ∅ = adh ∅ = ∅,

et que
int Rn = adh Rn = Rn .

En outre, puisque tout intervalle de R contient à la fois un rationnel et un


irrationnel, on a nécessairement

int Q = int (R \ Q) = ∅,

et
adh Q = adh (R \ Q) = R.

La proposition suivante montre que le rôle privilégié joué par la norme


| · |2 dans la définition de point intérieur et de point adhérent à un ensemble
n’est qu’apparent.
1.7. INTÉRIEUR, ADHÉRENCE, FRONTIÈRE 29

Proposition. Si i = 1, 2 ou ∞, alors a est intérieur à E si et seulement s’il


existe r > 0 tel que Bi [a; r] ⊂ E. a est adhérent à E si et seulement si, pour
tout r > 0, on a Bi [a; r] ∩ E /= ∅.
Démonstration. Condition nécessaire. Si a est intérieur à E, il existe
r2 > 0 tel que B2 [a; r2] ⊂ E. Comme
2 3
r2
B∞ a; ⊂ B1 [a; r2] ⊂ B2 [a; r2],
n
il existe r1 = r2 tel que B1 [a; r1] ⊂ E et r∞ = rn2 tel que B∞ [a; r∞] ⊂ E. On
procède de même dans le cas de l’adhérence.
Condition suffisante. Soit a ∈ Rn tel que, pour i = 1 ou ∞, il existe
ri > 0 tel que Bi [a; ri] ⊂ E. Comme
2 3
r1
B2 [a; r∞] ⊂ B∞ [a; r∞] et B2 a; ⊂ B1 [a; r1],
n
on obtient, en prenant r = r∞ ou r = rn1 selon le cas considéré l’existence
d’un r > 0 tel que B2 [a; r] ⊂ E. On procède de même dans le cas de
l’adhérence.
Les notions de point intérieur et de point adhérent s’échangent par double
passage au complémentaire. On posera !E = Rn \ E.
Proposition. a est adhérent à E si et seulement si a n’est pas intérieur à
!E. a est intérieur à E si et seulement si a n’est pas adhérent à !E. En
d’autres termes, on a adh E = !int !E, int E = !adh !E, ou encore

Rn = E ∪ !E = int E ∪ adh !E = adh E ∪ int !E.

Démonstration. En utilisant les définitions et les règles de négation d’une


proposition contenant des quantificateurs, on a

a n’est pas intérieur à !E ⇔ (∀r > 0) : B2 [a; r] /⊂ !E

⇔ (∀r > 0) : B2 [a; r] ∩ !!E /= ∅ ⇔ (∀r > 0) : B2 [a; r] ∩ E /= ∅


⇔ a est adhérent à E.
L’autre proposition s’obtient en appliquant la première à !E.
Etudions maintenant les relations entre les notions d’intérieur et d’adhé-
rence et les relations et opérations usuelles entre ensembles. Soit F une
partie de Rn .
Le premier résultat est une conséquence immédiate des définitions.
30 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS

Proposition. Si E ⊂ F , alors int E ⊂ int F et adh E ⊂ adh F .

Proposition. On a

int (E ∪ F ) ⊃ int E ∪ int F, int (E ∩ F ) = int E ∩ int F,

adh (E ∪ F ) = adh E ∪ adh F, adh (E ∩ F ) ⊂ adh E ∩ adh F.

Démonstration. Comme E∪F ⊃ E et E∪F ⊃ F , on a, par la proposition


précédente,
int (E ∪ F ) ⊃ int E et int (E ∪ F ) ⊃ int F,
et donc int (E ∪ F ) ⊃ int E ∪ int F. Comme E ⊃ E ∩ F et F ⊃ E ∩ F , on
a, par la proposition précédente,

int E ⊃ int (E ∩ F ), int F ⊃ int (E ∩ F ),

et dès lors int E ∩ int F ⊃ int (E ∩ F ). Par ailleurs, si a ∈ int E, il existe


r1 > 0 tel que B2 [a; r1] ⊂ E et si a ∈ int F , il existe r2 > 0 tel que
B2 [a; r2] ⊂ F. Dès lors, r = min{r1 , r2} est tel que B2 [a; r] ⊂ E ∩ F, ce
qui montre que int E ∩ int F ⊂ int (E ∩ F ). Comme l’inclusion contraire
a été démontrée plus haut, on a bien l’égalité souhaitée. Pour obtenir les
propriétés de l’adhérence, on utilise les propriétés de l’intérieur, les lois de
De Morgan
!(A ∪ B) = !A ∩ !B, !(A ∩ B) = !A ∪ !B,

et les relations entre intérieur et adhérence. Cela donne

adh (E ∪ F ) = !int !(E ∪ F ) = !int (!E ∩ !F )

= ![(int !E) ∩ (int !F )] = !(int !E) ∪ !(int !F )

= adh E ∪ adh F,
et
adh (E ∩ F ) = !int !(E ∩ F ) = !int (!E ∪ !F )

⊂ ![(int !E) ∪ (int !F )] = (!int !E) ∩ (!int !F )

= adh E ∩ adh F.
1.7. INTÉRIEUR, ADHÉRENCE, FRONTIÈRE 31

Remarque. Traduits en termes de voisinages, les résultats ci-dessus expri-


ment que toute partie de Rn contenant un voisinage de a est un voisinage
de a et que l’intersection de deux voisinages de a est encore voisinage de a.
A titre d’exemple, déterminons l’intérieur et l’adhérence des différents
types d’intervalle de R muni de la norme valeur absolue.
Proposition. Si a < b sont deux réels, alors

]a, b[= int ]a, b[ = int [a, b[ = int ]a, b] = int [a, b],

[a, b] = adh ]a, b[ = adh [a, b[ = adh ]a, b] = adh [a, b].
Démonstration. Démontrons d’abord la première série d’égalités. Puis-
que
]a, b[ ⊂ [a, b[ ⊂ [a, b] et ]a, b[ ⊂ ]a, b] ⊂ [a, b],
et que ces inclusions se conservent par passage à l’intérieur, il suffit de
démontrer que
]a, b[ = int ]a, b[ = int [a, b].
La première égalité sera démontrée si l’on prouve que ]a, b[ ⊂ int ]a, b[. Soit
x ∈]a, b[, c’est-à-dire tel que a < x < b. Par une propriété des réels démontrée
plus haut, il existe donc r1 > 0 tel que a + r1 < x et r2 > 0 tel que x + r2 < b
et, en prenant r = min{r1 , r2 }, on voit que a < x − r < x + r < b ou encore
que B2 [x; r] = [x − r, x + r] ⊂ ]a, b[. Pour démontrer que ]a, b[ = int [a, b], on
sait déjà, puisque ]a, b[ ⊂ [a, b], que ]a, b[ = int ]a, b[ ⊂ int [a, b] et il suffit
donc de prouver que int [a, b] ⊂ ]a, b[. Si x ∈ int [a, b], il existe r > 0 tel que
B2 [x; r] = [x − r, x + r] ⊂ [a, b]. Par conséquent, on a

a < a + r ≤ x ≤ b − r < b,

et x ∈ ]a, b[.
Pour calculer les adhérences, il suffit, comme dans le cas des intérieurs,
de prouver que
[a, b] = adh [a, b] = adh ]a, b[.
Pour la première égalité, il suffit de nouveau de prouver que adh [a, b] ⊂ [a, b].
Si x ∈ adh [a, b], alors, pour chaque r > 0, on a

B2 [x; r] ∩ [a, b] = [x − r, x + r] ∩ [a, b] /= ∅.

En d’autres termes,

(∀r > 0)(∃y ∈ R) : x − r ≤ y ≤ b et a ≤ y ≤ x + r,


32 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS

ce qui entraı̂ne que

(∀r > 0) : a ≤ x + r et x ≤ b + r.
On a vu plus haut que cette propriété équivaut à a ≤ x ≤ b, et donc
x ∈ [a, b]. Pour démontrer que adh [a, b] = adh ]a, b[, on déduit tout d’abord
de l’inclusion ]a, b[ ⊂ [a, b] que

adh ]a, b[ ⊂ adh [a, b] = [a, b],

et il suffit de prouver que [a, b] ⊂ adh ]a, b[, ce qui se ramène à {a, b} ⊂
adh ]a, b[ et a été démontré plus haut.
Remarque. Les exemples suivants montrent qu’on ne peut pas améliorer
les conclusions de la proposition sur l’intérieur d’une union et l’adhérence
d’une intersection. Si a < b < c sont des réels, E = [a, b[ et F = [b, c[, alors
E ∪ F = [a, c[ et

int (E ∪ F ) = ]a, c[ /= ]a, b[ ∪ ]b, c[ = int E ∪ int F.


Si a < b < c < d sont des réels, et si E = [b, c[, F =]a, b] ∪ ]c, d[, alors

E ∩ F = {b} = {b} /= {b} ∪ {c} = [b, c] ∩ ([a, b] ∪ [c, d]) = E ∩ F .

Introduisons enfin la notion de frontière d’une partie de Rn .


Définition. Si E ⊂ Rn , la frontière fr E ou Ė ou ∂E est l’ensemble

fr E = adh E ∩ adh !E.

Il résulte aussitôt de cette définition que fr E = fr !E, et le lien entre


intérieur et adhérence entraı̂ne aussi la relation

fr E = adh E \ int E,

puisque
adh E \ int E = adh E ∩ !int E = adh E ∩ adh !E.

Il résulte de la définition et de résultats démontrés pour l’intérieur et


l’adhérence que l’on a
fr Q = R, fr Rn = ∅, fr ∅ = ∅,

et, si a < b sont des réels,

fr [a, b] = fr [a, b[ = fr ]a, b] = fr ]a, b[ = {a, b}.


1.8. EXERCICES 33

1.8 Exercices
1. Soient a1 , a2 , . . . , an et b1 , b2, . . . , bn des nombres réels. Vérifier l’identité
 & ' & '
n
$ n
$ n
$ $
 aj  bk −n ak bk = (aj − ak )(bk − bj ) =
j=1 k=1 k=1 1≤j<k≤n

n $ n
1$
(aj − ak )(bk − bj ).
2 j=1 k=1

En déduire que si aj ≤ ak et bj ≥ bk pour tout 1 ≤ j < k ≤ n, on a l’inégalité


de Tchebycheff
 & '
n n n

1$ 1$ 1$
aj  bk ≥ ak bk .
n j=1 n k=1 n k=1

2. Soient a1 , a2 , . . . an des nombres réels tels que aj ∈ ] − 1, 0] (1 ≤ j ≤ n)


ou aj ≥ 0, (1 ≤ j ≤ n). Démontrer, par récurrence, l’inégalité
n
6 n
$
(1 + aj ) ≥ 1 + aj ,
j=1 j=1

l’inégalité étant stricte dès que n ≥ 2. En déduire l’inégalité de Bernoulli :


si a > −1 et si n ≥ 1 est un entier, alors (1 + a)n ≥ 1 + na.
3. On dit qu’un nombre réel x est algébrique s’il est solution d’une équation
%
algébrique à coefficients aj entiers nj=0 aj xj = 0. On dit qu’un nombre réel
est transcendant s’il n’est pas algébrique. Démontrer que tout rationnel est
algébrique, que l’ensemble des nombres algébriques est dénombrable et que
l’ensemble des nombres transcendants est non-dénombrable.

1.9 Petite anthologie


Ensembles

Par ensemble, nous devons entendre toute collection M considérée com-


me un tout d’objets définis et séparés de notre intuition et de notre pensée.
Ces objets sont appelés les “éléments” de M.

Georg Cantor, 1895


34 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS

Si, d’autre part, la totalité des éléments d’une multiplicité peut être con-
sidérée sans contradiction “comme un tout”, alors ils peuvent être rassemblés
en “une seule chose”. Je l’appelle une multiplicité consistante ou un ensem-
ble.

Georg Cantor, 1899

Jusqu’à présent, personne n’a réussi à définir correctement la notion


d’ensemble. Il ne faut probablement pas espérer une définition, mais plutôt
un système d’axiomes. Les définitions usuelles d’ensemble ne permettent
aucune conclusion utile, et en outre elles tolèrent des ensembles parado-
xaux.... Mais, comme il semble exister des ensembles infinis consistants,
une définition convenable ou un système d’axiomes correct devraient exclure
les êtres paradoxaux.

Gerhard Hessenberg, 1906

Fonctions, applications

On appelle ici fonction d’une grandeur variable, une quantité composée


de quelque manière que ce soit de cette grandeur variable et de constantes.

Jean Bernoulli, 1718

Une fonction d’une quantité variable est une expression analytique com-
posée de quelque manière que ce soit de cette quantité variable et de nombres
ou quantités constantes.

Leonhard Euler, 1748

On appelle fonction d’une ou de plusieurs quantités toute expression de


calcul dans laquelle ces quantités entrent d’une manière quelconque, mêlées
ou non avec d’autres quantités qu’on regarde comme ayant des valeurs donné-
es et invariables, tandis que les quantités de la fonction peuvent recevoir
toutes les valeurs possibles. Ainsi, dans les fonctions, on ne considère que
les quantités qu’on suppose variables, sans aucun égard aux constantes qui
peuvent y être mêlées. Nous désignerons en général par la caractéristique f
ou F , placée devant une variable, toute fonction de cette variable, c’est-à-
dire toute quantité dépendante de cette variable et qui varie avec elle suivant
une loi donnée.

Joseph-Louis Lagrange, 1797


1.9. PETITE ANTHOLOGIE 35

Enfin de nouvelles idées, amenées par le progrès de l’analyse, ont donné


lieu à la définition suivante des fonctions : toute quantité dont la valeur
dépend d’une ou plusieurs autres quantités, est dite fonction de ces dernières,
soit qu’on sache ou qu’on ignore par quelles opérations il faut passer pour
remonter de celles-ci à la première.

Sylvestre François Lacroix, 1797

En général, la fonction f (x) représente une suite de valeurs, ou or-


données, dont chacune est arbitraire. L’abscisse x pouvant recevoir une
infinité de valeurs, il y a un pareil nombre d’ordonnées f (x). Toutes ont des
valeurs numériques actuelles, ou positives, ou négatives, ou nulles. On ne
suppose point que ces ordonnées soient assujetties à une loi commune; elles
se succèdent d’une manière quelconque, et chacune d’elles est donnée comme
le serait une seule quantité.

Jean-Baptiste Joseph Fourier, 1822

Lorsque des quantités variables sont tellement liées entre elles que, la
valeur de l’une d’elles étant donnée, on puisse en conclure les valeurs de
toutes les autres, on conçoit d’ordinaire ces diverses quantités exprimées au
moyen de l’une d’entre elles, qui prend alors le nom de variable indépendan-
te; et les autres quantités, exprimées au moyen de la variable indépendante,
sont ce qu’on appelle des fonctions de cette variable.

Augustin Cauchy, 1823

D’une manière générale, on doit appeler fonction de x un nombre qui est


donné pour chaque x et qui change progressivement avec x. La valeur de la
fonction pourrait être donnée ou bien par une expression analytique, ou par
une condition qui offre un moyen de tester tous les nombres et de sélectionner
l’un deux, ou, finalement, la dépendance peut exister mais rester inconnue.

Nicolas Lobatchevsky, 1834

Il n’est pas, en outre, du tout nécessaire que y dépende de x dans tout


l’intervalle suivant la même loi; en fait, il n’est pas nécessaire de penser
seulement à des relations qui puissent être exprimées par des opérations
mathématiques.

Gustave Lejeune Dirichlet, 1837


36 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS

Par le terme fonction, je considère une quantité dont les valeurs dépen-
dent d’une manière quelconque de la valeur de la variable, ou des valeurs de
plusieurs variables dont elle est composée. Ainsi, les fonctions considérées
n’ont pas besoin pour être admises d’être exprimées par une combinaison de
symboles algébriques, même entre des limites des variables arbitrairement
proches.

Georges Stokes, 1848

Une fonction de x est appelée f (x) si à chaque valeur de x à l’intérieur


d’un intervalle est associée une valeur univoquement déterminée de f (x). En
outre, la manière dont f (x) est déterminée n’a aucune importance, que ce
soit par une opération analytique sur les quantités ou une autre manière. La
valeur de f (x) doit seulement être déterminée univoquement partout.

Hermann Hankel, 1870

Quand deux multiplicités bien ordonnées M et N se laissent mettre en


correspondance, élément par élément, de façon univoque et complète (chose
qui, si elle est possible de quelque manière, peut toujours se faire de beau-
coup d’autres manières), nous nous autoriserons désormais à dire que ces
multiplicités one même puissance, ou encore qu’elles sont équivalentes. ...
La série des nombres entiers positifs offre, comme on peut le montrer facile-
ment, la plus petite de toutes les puissances qui se trouvent dans les mul-
tiplicités infinies. Néanmoins la classe des multiplicités qui ont cette plus
petite puissance est une classe extraordinairement riche et étendue.

Georg Cantor, 1878

Par une application d’une système S, on entend une loi par laquelle
à chaque élément déterminé s de S est associé un objet déterminé, qui est
appelé l’image de s et noté φ(s); on dit, aussi, que φ(s) correspond à l’élément
s, que φ(s) est déterminé ou engendré par l’application φ à partir de s, que
s est transformé par l’application φ en φ(s).

Richard Dedekind, 1887

Considérons un ensemble (X) de nombres distincts, et regardons ces


nombres comme des valeurs qui puissent être attribuées à une lettre x, laquel-
le sera désignée comme étant une variable. Supposons qu’à chaque valeur
de x, c’est-à-dire à chaque élément de l’ensemble (X) corresponde un nom-
bre que l’on regardera comme une valeur attribuée à une lettre y; on dira
1.9. PETITE ANTHOLOGIE 37

que y est une fonction de x déterminée dans cet ensemble (X): la fonction
sera définie dans cet ensemble si la correspondance est définie. L’ensemble
(Y ) des valeurs distinctes que prend y est déterminé par la correspondance
même : dire que b est un élément de (Y ) c’est dire qu’il y a un élément a
de (X) auquel correspond le nombre b. A chaque élément de (X) corres-
pond un élément de (Y ) et un seul; mais rien n’empêche, dans la définition
précédente, qu’à plusieurs éléments différents de (X) corresponde un même
élément de (Y ).

Jules Tannery, 1904

Une fonction est une relation u telle que, si deux paires y; x et z; x ayant
le même second élément, satisfont à la relation u, il en résulte nécessairement
que y = x quelles que soient les valeurs de x, y, z.

Giuseppe Peano, 1911

Soient E et F deux ensembles, distincts ou non. Une relation entre une


variable x de E et une variable y de F est dite relation fonctionnelle en y,
ou relation fonctionnelle de E vers F , si, quel que soit x ∈ E, il existe un
élément y de F , et un seul, qui soit dans la relation considérée avec x.

Nicolas Bourbaki, 1939

Nombres réels

On doit se rappeler cependant que les quantités infiniment petites, même


comprises dans le sens populaire, ne sont en aucun cas constantes et détermi-
nées. Car si un opposant dénie l’exactitude de nos théorèmes, nos calculs
montrent que l’erreur est plus petite que toute quantité donnée, puisqu’il
est en notre pouvoir de diminuer l’incomparablement petit, que l’on peut
toujours supposer aussi petit que l’on veut. Nul doute que là se trouve la
démonstration rigoureuse de notre calcul infinitésimal.

Gottfried W. Leibniz, 1702

Les nombres irrationnels se trouvent en une quantité sans comparaison


plus grande que les nombres rationnels.

Bernard le Bovier de Fontenelle, 1727


38 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS

Il n’y a pas de doute que toute quantité peut être diminuée de telle
manière qu’elle s’annule complètement et disparaisse. Mais une quantité
infiniment petite n’est rien d’autre qu’une quantité qui s’annule et dès lors
la chose elle-même est égale à zéro. C’est en harmonie aussi avec cette
définition des choses infiniment petites, par laquelle les choses sont dites
inférieures à toute quantité assignable; elles devraient certainement n’être
rien, car à moins qu’elle ne soit égale à zéro, une quantité égale peut lui être
assignée, ce qui est contraire à l’hypothèse.

Léonard Euler, 1755

Nombres complexes

Après les irrationnels sont nées les quantités impossibles ou imaginaires


dont la nature est très étrange mais dont l’utilité est indéniable.

Gottfried W. Leibniz

De la même manière qu’on peut imaginer le domaine entier des quantités


réelles comme étant représentées par une ligne droite infinie, le domaine
complet de toutes les grandeurs, nombres réels aussi bien qu’imaginaires,
peut être visualisé comme un plan infini, dans lequel le point défini par
l’abscisse a et l’ordonnée b représente la quantité a + bi.

Carl-Friedrich Gauss, 1811

On√ appelle expression imaginaire toute expression symbolique de la forme


a + b −1, a, b désignant deux quantités réelles.

Augustin Cauchy, 1821


Chapitre 2

Limites et continuité

2.1 Fonctions de plusieurs variables réelles


Soient n ≥ 1 et p ≥ 1 des entiers et soit f une fonction de Rn dans Rp. Pour
chaque x ∈ dom f, on a

f (x) = (p1 (f (x)), . . ., pp(f (x))) = ((p1 ◦ f ))(x), . . . , (pp ◦ f )(x))

où, pour chaque 1 ≤ j ≤ p, pj : Rp → R, y 2→ yj est l’application projection


sur la j e composante. On pose, pour chaque 1 ≤ j ≤ p, fj = pj ◦ f , ce qui
définit une fonction de Rn dans R, de domaine dom fj = dom f , appelée
fonction j e composante de f . Réciproquement, si l’on se donne p fonctions
f1 , . . . , fp de Rn dans R, de domaines respectifs dom f1 , . . . , dom fp , on peut
7p
leur associer la fonction f de Rn dans Rp , de domaine dom f = j=1 dom fj ,
définie, pour chaque x ∈ dom f , par f (x) = (f1 (x), . . . , fp(x)). La fonction
j e composante de f est alors la restriction de fj à dom f .
Lorsque n > 1 et p = 1, on dit que f est une fonction réelle de plusieurs
(ici n) variables réelles; si n > 1 et p > 1, on dit que f est une fonction
vectorielle de plusieurs variables réelles; si n = 1 et p > 1, on dit que f est
une fonction vectorielle d’une variable réelle et si n = p = 1, on dit que f
est une fonction réelle d’une variable réelle.
Exemples. 1. La fonction qui associe à chaque réel x son carré x2 est une
fonction réelle d’une variable réelle de domaine égal à R puisque l’opération
“élévation au carré” est définie pour chaque réel.
2. La fonction qui associe à chaque réel x différent de zéro le réel |x|
x
est une
fonction réelle de variable réelle de domaine égal à R = R \ {0}, puisque la

division n’est définie que pour des diviseurs non nuls.

39
40 CHAPITRE 2. LIMITES ET CONTINUITÉ

3. La fonction qui associe à chaque réel positif x sa racine carrée arithmétique


x1/2 est une fonction réelle d’une variable réelle de domaine égal à R+ = {x ∈
R : x ≥ 0}, puisque l’opération “racine carrée arithmétique” n’est définie que
pour les réels positifs.
4. La fonction de R2 dans R2 définie par
4 5
x1 + x 2 x 1 x2
f (x1 , x2 ) = ,
x1 − x2 (x1 − 1)1/2

a pour domaine

dom f = {(x1 , x2 ) ∈ R2 : x1 /= x2 et x1 > 1}

puisque l’expression xx11 +x


−x2 est définie lorsque x1 /= x2 et l’expression (x1 −1)1/2
2 x1 x2

est définie lorsque x1 > 1.


Une fonction f de Rn dans R2 peut évidemment être considérée comme
une fonction f de Rn dans C et s’appelle alors une fonction complexe de
plusieurs variables réelles si n > 1 et d’une variable réelle si n = 1. Ses
composantes au sens défini plus haut s’appellent alors respectivement la
fonction partie réelle et la fonction partie imaginaire de f . Une fonction
de R2 dans Rp peut également être considérée comme fonction de C dans
Rp et s’appelle alors une fonction vectorielle d’une variable complexe. En
particulier, une fonction de R2 dans R2 peut être considérée comme une
fonction de C dans C; on l’appelle alors une fonction complexe d’une variable
complexe. Tant que la structure de corps qui distingue C de R2 n’est pas
utilisée, il n’y a évidemment aucune nécessité de distinguer R2 de C comme
espace de départ ou d’arrivée d’une fonction. Il en sera ainsi pour les notions
de limite et de continuité. Par contre, la notion de dérivabilité sera différente
selon que l’on considère C ou R2 .
Rappelons enfin que, conformément aux notions générales introduites
sur les graphes, si f est une fonction de Rn dans Rp et E une partie de
Rn , la restriction f |E de f à E sera la fonction de Rn dans Rp de domaine
dom f |E = dom f ∩ E telle que, pour chaque x ∈ dom f |E , on a f |E (x) =
f (x).

2.2 Limite des valeurs d’une fonction


Introduisons maintenant le concept fondamental de limite, en un point de
Rn , des valeurs d’une fonction de Rn dans Rp . Si f est une fonction de Rn
dans Rp , l’opération “calculer f (a) en a ∈ Rn ” est possible si et seulement
2.2. LIMITE DES VALEURS D’UNE FONCTION 41

si a ∈ dom f . Si nous considérons à titre d’exemple la fonction f de R dans


R définie par
1 1
f (x) = − ,
x x + x2
nous voyons immédiatement que son domaine est égal à R \ {−1, 0}. Si
nous calculons numériquement des valeurs de f (x) pour des x différents
de −1 mais proches de −1, nous constatons que f (x) prend des valeurs
positives et des valeurs négatives dont la valeur absolue peut devenir très
grande. Si nous calculons numériquement f (x) pour des valeurs différentes
de 0 mais proches de 0, nous constatons que les valeurs obtenues pour f (x)
diffèrent peu de 1. La fonction f présente donc un comportement différent
au voisinage des points −1 et 0 du complémentaire de son domaine. Dans le
cas de 0, l’opération impossible “calculer f (0)” semble réalisable “de manière
approchée” dans le sens suivant : f (x) diffère d’aussi peu que l’on veut de
1 si on la calcule aux points de dom f \ {0} suffisamment proches de 0.
D’une manière plus précise, montrons que chaque fois qu’on se donne un
réel ! > 0, on pourra trouver un réel δ > 0 tel que |f (x) − 1| ≤ ! pour tous
les x ∈ dom f vérifiant l’inégalité |x| ≤ δ. Pour ce faire, notons tout d’abord
que, pour chaque x ∈ dom f, on a
# # # #
#1 1 # # −x #
|f (x) − 1| = ## − − 1## = ## # = |x| .
x x+x 2 1 + x # |1 + x|
|x|
! > 0 étant donné, nous devons donc trouver un δ > 0 tel que |1+x| ≤ !
lorsque x /∈ {−1, 0} et |x| ≤ δ. Rappelons qu’on majore une fraction en
majorant son numérateur et en minorant son dénominateur. Pour minorer
|1 + x|, notons que si |x| ≤ 12 , c’est-à-dire si − 12 ≤ x ≤ 12 , on a 12 ≤ 1 + x ≤ 32 ,
et dès lors
1
|1 + x| = 1 + x ≥ .
2
En conséquence, on a
|x|
≤ 2|x|
|1 + x|
dès que |x| ≤ 12 , ce qui entraı̂ne que

|x|
|f (x) − 1| = ≤ 2|x| ≤ !,
|1 + x|

si, outre les conditions x /∈ {−1, 0} et |x| ≤ 12 déjà imposées, on ajoute


|x| ≤ 2! . Nous avons donc montré que le réel strictement positif δ = min{ 12 , 2! }
42 CHAPITRE 2. LIMITES ET CONTINUITÉ

est tel que |f (x) − 1| ≤ ! pour tous les x ∈ dom f vérifiant l’inégalité
|x| ≤ δ. Dans ce sens précis, on peut dire que l’opération impossible “faire
prendre à f en 0 la valeur 1” est réalisée de manière approchée, et avec une
approximation aussi bonne que l’on veut. Dans ce processus, ! > 0 mesure
l’erreur maximale tolérée dans la réalisation de l’opération approchée et le
réel strictement positif δ qu’on lui associe délimite les valeurs de la variable x
pour lesquelles l’opération approchée est réalisée dans les limites de l’erreur
maximale tolérée. On voit tout de suite que si un δ1 > 0 convient, dans
ce qui précède, pour un !1 > 0 donné, il conviendra a fortiori pour chaque
! > !1 puisque |f (x) − 1| ≤ !1 entraı̂ne |f (x) − 1| ≤ !. Par contre, si ! < !1 ,
on constate facilement que le δ1 associé à !1 ne conviendra pas en général
pour !; il faudra prendre un δ < δ1 et être assuré de trouver des éléments x
dans dom f tels que |x| ≤ δ. Comme δ peut être arbitrairement petit, il est
important que dom f ∩ {x : |x| ≤ δ} /= ∅ pour tout δ > 0, c’est-à-dire que
0 ∈ adh dom f.
Nous pouvons maintenant formaliser ce qui précède et obtenir la définiti-
on suivante.
Définition. Soit f une fonction de Rn dans Rp, a ∈ Rn et b ∈ Rp . On dit
que f (x) tend vers b lorsque x tend vers a, ou encore que b est limite de f (x)
lorsque x tend vers a, et l’on écrit
f (x) → b si x → a,
si les deux conditions suivantes sont satisfaites :
1) a ∈ adh dom f ;
2) (∀! > 0)(∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ) : |f (x) − b|2 ≤ !.
Rappelons que la condition 2 se lit comme suit : pour tout ! > 0, il
existe un δ > 0 tel que pour tout x ∈ dom f vérifiant l’inégalité |x − a|2 ≤ δ,
on a l’inégalité |f (x) − b|2 ≤ !. Pour chaque ! > 0 donné, on devra donc
trouver un δ > 0 (pouvant dépendre d’!) tel que |f (x) − b|2 ≤ ! pour tous les
x ∈ dom f tels que |x − a|2 ≤ δ. Dans l’exemple considéré plus haut, toutes
les conditions de la définition sont satisfaites avec a = 0 et b = 1, et l’on
peut donc écrire
1 1
− → 1 si x → 0.
x x + x2
Donnons maintenant un exemple de vérification de la définition pour une
fonction de plusieurs variables.
Exemple. Soit f la fonction de R2 dans R définie par
x 1 x2 x 1 x2
f (x1 , x2 ) = = 2 .
|x|2 (x1 + x22 )1/2
2.2. LIMITE DES VALEURS D’UNE FONCTION 43

Comme |x|2 = 0 si et seulement si x = 0, on voit que dom f = R2 \ {0}. On


a 0 ∈ adh dom f puisque adh dom f = R2 . Montrons que

f (x) → 0 si x → 0.

Soit ! > 0; il faut donc trouver un δ > 0 tel que, pour tout x = (x1 , x2 ) /=
(0, 0) vérifiant l’inégalité |x|2 ≤ δ, on ait
# #
# x1 x2 #
# #
# |x| # ≤ !,
2

c’est-à-dire
|x1 ||x2|
≤ !.
|x|2
L’étude de cette inégalité est simplifiée si l’on rappelle que, pour tout x =
(x1 , x2 ) ∈ R2 , on a
|xi | ≤ |x|2 , (i = 1, 2),
et dès lors, pour tout x ∈ R2 \ {0}, on a

|x1 ||x2| |x|22


≤ = |x|2 .
|x|2 |x|2

Il suffit donc de prendre δ = ! pour que les conditions x ∈ dom f et |x|2 ≤ δ


entraı̂nent |x|2 ≤ ! et dès lors |f (x)| ≤ |x|2 ≤ !.
Dans les applications pratiques de la notion de limite, il est souvent
nécessaire de restreindre les valeurs de la variable x à une certaine partie
de Rn fixée d’avance et constituant un ensemble de contraintes. Par exem-
ple, dans le cas d’une fonction réelle d’une variable réelle, on peut n’être
intéressé que par les valeurs strictement positives de la variable. Il est donc
nécessaire, pour couvrir toutes les situations rencontrées dans les applica-
tions, d’étendre la définition de limite au cas où la variable x est astreinte
à rester dans un ensemble de contraintes E, c’est-à-dire de demander à la
définition précédente de s’appliquer seulement à la restriction f |E de f à E.
Définition. Soit f une fonction de Rn dans Rp , a ∈ Rn , b ∈ Rp et E ⊂ Rn
tel que dom f ∩ E /= ∅. On dit que f (x) tend vers b lorsque x tend vers a
dans E, ou encore que b est limite de f (x) lorsque x tend vers a dans E, et
l’on écrit

f (x) → b si x → a dans E, (2.1)


44 CHAPITRE 2. LIMITES ET CONTINUITÉ

si b est limite de f |E (x) pour x tendant vers a, c’est-à-dire si les deux con-
ditions suivantes sont satisfaites :
1) a ∈ adh (dom f ∩ E);
2) (∀! > 0)(∃δ > 0)(∀x ∈ dom f ∩ E : |x − a|2 ≤ δ) : |f (x) − b|2 ≤ !.
Exemple. Soit f la fonction de R dans R définie par f (x) = |x|
x
. On a
évidemment dom f = R \ {0}. Prenons E = R+ = {x ∈ R : x ≥ 0}, ce
qui entraı̂ne dom f ∩ E = R∗+ = {x ∈ R : x > 0}, et 0 ∈ adh R∗+ = R+ .
Montrons que
f (x) → 1 si x → 0 dans E.
On a, pour tout x > 0, f (x) = xx = 1 et donc |f (x) − 1| = 0. Si ! > 0 est
donné, on aura donc |f (x) − 1| = 0 ≤ ! quel que soit x > 0 et l’on peut donc
choisir n’importe quel δ > 0 dans la définition.
Il est évident que, pour chaque E ⊂ Rn tel que a ∈ adh (dom f ∩ E), on
a l’implication

f (x) → b si x → a ⇒ f (x) → b si x → a dans E.

Nous donnerons plus loin un exemple montrant que l’implication contraire


est fausse.
Donnons maintenant quelques remarques simples mais importantes sur
la structure et l’utilisation de la définition de limite.
Remarques. 1. La condition 2 est évidemment équivalente à la condition

(∀! > 0)(∃δ > 0)(∀x ∈ dom f ∩ B2 [a; δ]) : f (x) ∈ B2 [b; !],

elle-même équivalente à la condition

(∀! > 0)(∃δ > 0) : f (B2 [a; δ]) ⊂ B2 [b; !].

2. Si r > 0 est donné, la condition 2 de la définition est équivalente à la


condition

(∀! > 0)(∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ) : |f (x) − b|2 ≤ r!,

puisque l’application ! 2→ r! est une bijection de R∗+ = {x ∈ R : x > 0} sur


lui-même.
3. La condition 2 est équivalente à la condition

(∀! > 0)(∃δ $ > 0)(∀x ∈ dom f : |x − a|2 < δ $ ) : |f (x) − b|2 < !, (2.2)
2.2. LIMITE DES VALEURS D’UNE FONCTION 45

où les signes ≤ sont remplacés par < (le changement de δ en δ $ n’a évidem-
ment aucune signification profonde et ne sert que pour clarifier la démonstra-
tion). Montrons tout d’abord que la condition 2 de la définition implique
(2.2) : si ! > 0 est donné, il faut donc trouver un δ $ > 0 tel que (2.2) soit
satisfaite. Par la condition 2 de la définition et la remarque 2, il existe un
δ $$ > 0 tel que
!
(∀x ∈ dom f ∩ E : |x − a|2 ≤ δ $$ ) : |f (x) − b|2 ≤ ,
2
ce qui entraı̂ne évidemment que

(∀x ∈ dom f ∩ E : |x − a|2 < δ $$ ) : |f (x) − b|2 < !.

On peut donc prendre δ $ = δ $$ . Montrons maintenant que la condition (2.2)


implique la condition 2 de la définition. Si ! > 0 est donné, nous devons
trouver un δ > 0 tel que la condition 2 soit satisfaite. Par (2.2), il existe un
δ $ > 0 tel que
!
(∀x ∈ dom f ∩ E : |x − a|2 < δ $ ) : |f (x) − b|2 < ,
2
ce qui entraı̂ne aussitôt que
δ$
(∀x ∈ dom f ∩ E : |x − a|2 ≤ ) : |f (x) − b|2 ≤ !,
2
"
et montre que δ = δ2 convient.
4. La deuxième partie de la démonstration de la Remarque 3 a fait usage
du fait suivant, qui est aussi simple qu’utile : si, étant donné un ! > 0
on a trouvé un δ > 0 qui convient pour cet ! dans la condition 2 de la
définition, alors tout δ $ ∈ ]0, δ] conviendra a fortiori, puisqu’alors |x − a|2 ≤ δ
si |x − a|2 ≤ δ $ . En particulier, on peut toujours décider d’avance de se
restreindre à déterminer des δ inférieurs à un nombre strictement positif
donné.
5. Si, dans la condition 2 de la définition, on a trouvé un δ > 0 qui convient
pour un ! > 0 donné, ce δ conviendra également pour tous les !$ ≥ !. Il suffit
donc que la condition 2 puisse être vérifiée pour chaque ! strictement positif
inférieur à un !∗ fixé d’avance. L’exigence “pour chaque ! > 0” signifie donc
fondamentalement “pour chaque ! > 0 arbitrairement petit”.
6. Les exemples que nous avons déjà traités montrent l’intérêt qu’il y a,
pour vérifier les conditions de la définition de limite, à majorer l’expression
|f (x) − b|2 par une expression plus simple à estimer. On utilise pour ce faire
46 CHAPITRE 2. LIMITES ET CONTINUITÉ

un stock d’inégalités qui se constitue petit à petit par la pratique. Le choix


de l’inégalité est un art plus qu’une science puisqu’il faut veiller à ce qu’elle
simplifie suffisamment l’expression à majorer sans altérer la nature de cette
expression au point de rendre l’inégalité impossible.
Montrons maintenant qu’il ne peut pas exister plus d’un b vérifiant les
conditions de la définition de la limite.
Proposition. Etant donnés f et a, il existe au plus un b ∈ Rp vérifiant les
conditions de la définition de la limite des valeurs de f (x) lorsque x tend
vers a.
Démonstration. Supposons que b ∈ Rp et b$ ∈ Rp vérifient les conditions
de la définition de limite. Rappelons que
b = b$ ⇔ (∀! > 0) : |b − b$ |2 ≤ !,
et que, pour tout x ∈ dom f , on a évidemment
|b − b$ |2 = |b − f (x) + f (x) − b$ |2 ≤ |b − f (x)|2 + |f (x) − b$ |2 .
Soit ! > 0. Par hypothèse
!
(∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ) : |f (x) − b|2 ≤ ,
2
et
!
(∃δ $ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ $ ) : |f (x) − b$ |2 ≤ .
2
Dès lors, si l’on pose δ $$ = min{δ, δ $} et que l’on choisit x ∈ dom f tel que
|x − a|2 ≤ δ $$ (ce qui est toujours possible par la condition 1 de la définition),
on aura
! !
|b − b$ |2 ≤ + = !.
2 2

Ce résultat d’unicité entraı̂ne qu’on pourra appeler b la limite de f (x)


lorsque x tend vers a. On écrira alors
b = lim f (x).
x→a

En appliquant ce résultat à f |E , on obtient évidemment l’existence d’au plus


un b vérifiant les conditions de la définition de la limite des valeurs de f (x)
lorsque x tend vers a dans E. On l’appellera la limite de f (x) lorsque x tend
vers a dans E et l’on écrira
b= lim f (x).
x→a, x∈E
2.3. CONDITIONS NÉCESSAIRES D’EXISTENCE DE LA LIMITE 47

2.3 Conditions nécessaires d’existence de la limi-


te
La définition que nous avons donnée permet, étant donnés f, a et b, de
vérifier si b = limx→a f (x). Il est évidemment fastidieux de l’utiliser pour
montrer que f n’a pas de limite lorsque x tend vers a, puisqu’il faut alors
vérifier qu’elle n’est satisfaite pour aucun b ∈ Rp . Nous allons donner dans
cette section des conditions nécessaires d’existence d’une limite qui ne font
pas intervenir la valeur b de la limite. Par contraposition, ces conditions
nécessaires donneront alors des conditions de non-existence de la limite plus
facilement utilisables.
La première condition porte le nom de condition de Cauchy.

Proposition. Soit f une fonction de Rn dans Rp et a ∈ Rn . Si limx→a f (x)


existe alors la condition suivante est satisfaite:

(∀! > 0)(∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ)(∀x$ ∈ dom f : |x$ − a|2 ≤ δ) :

|f (x) − f (x$ )|2 ≤ !. (2.3)

Démonstration. Posons b = limx→a f (x) et notons tout d’abord que,


pour tout x ∈ dom f et tout x$ ∈ dom f , on a

|f (x) − f (x$ )|2 = |f (x) − b + b − f (x$ )|2 ≤ |f (x) − b|2 + |f (x$ ) − b|2 .

Si ! > 0 est donné, il existe δ > 0 tel que


!
(∀x ∈ dom f : |x − a|2 ≤ δ) : |f (x) − b|2 ≤ ,
2

et dès lors, en utilisant l’inégalité ci-dessus,

(∀x ∈ dom f : |x − a|2 ≤ δ)(∀x$ ∈ dom f : |x$ − a|2 ≤ δ) :

! !
|f (x) − f (x$ )|2 ≤ |f (x) − b|2 + |f (x$ ) − b|2 ≤ + = !.
2 2

Par contraposition, nous obtenons immédiatement le


48 CHAPITRE 2. LIMITES ET CONTINUITÉ

Corollaire. Soit f une fonction de Rn dans Rp et a ∈ Rn tels que a ∈


adh dom f. Si la condition de Cauchy (2.3) n’est pas satisfaite, c’est-à-dire
si sa négation

(∃! > 0)(∀δ > 0)(∃x ∈ dom f : |x − a|2 ≤ δ)(∃x$ ∈ dom f : |x$ − a|2 ≤ δ) :

|f (x) − f (x$ )|2 > !, (2.4)

est vérifiée, alors la limite de f (x) pour x tendant vers a n’existe pas.
On notera que, dans la condition (2.4), il suffit de trouver un ! > 0 tel
que (2.4) soit satisfaite pour tout δ ∈ ]0, δ ∗ [ pour un δ ∗ fixé a priori, puisque,
si x et x$ conviennent dans (2.4) pour un δ > 0, ils conviennent pour tous les
δ supérieurs. On obtient évidemment une condition nécessaire de Cauchy
pour la limite de f (x) lorsque x tend vers a dans E en appliquant le résultat
précédent à f |E .
Exemples. 1. Nous avons vu précédemment que
x
lim = 1.
x→0, x>0 |x|

Montrons que
x
lim
x→0 |x|
n’existe pas, ce qui justifiera le fait mentionné plus haut que, lorsque E ∩
dom f ! dom f , l’existence de la limite de f (x) lorsque x tend vers a dans
E n’entraı̂ne pas nécessairement celle de la limite de f (x) lorsque x tend
vers a . Pour vérifier (2.4), il faut donc trouver des réels x et des réels
x$ arbitrairement proches de 0 tels que |f (x) − f (x$ )| reste supérieur à un
nombre positif fixe. Comme f (x) = −x x
= −1 si x < 0 et f (x) = xx = 1 si
x > 0, on voit que, pour tout x > 0 et tout x$ < 0, on aura

|f (x) − f (x$ )| = |1 − (−1)| = 2,

et la condition (2.4) est vérifiée pour ! = 1 en prenant, pour chaque δ > 0,


x = δ et x$ = −δ.
2. Si f est la fonction de R dans R définie par f (x) = 0 si x /= 0 et f (0) = 1,
alors limx→0 f (x) n’existe pas. En effet, pour chaque δ > 0 fixé, en prenant
x = δ et x$ = 0 (qui sont bien tels que |x| ≤ δ et |x$ | ≤ δ), on trouve
|f (x) − f (x$ )| = |0 − 1| = 1, et la condition (2.4) est vérifiée avec ! = 12 .
2.3. CONDITIONS NÉCESSAIRES D’EXISTENCE DE LA LIMITE 49

Ce dernier exemple nous conduit à une remarque terminologique impor-


tante. Certains auteurs définissent le concept de limite

f (x) → b si x → a

par les conditions


1’) a ∈ adh (dom f \ {a})
et
2’) (∀! > 0)(∃δ > 0)(∀x ∈ dom f \ {a} : |x − a|2 ≤ δ) : |f (x) − b|2 ≤ !,
et ils écrivent dans ce cas b = limx→a f (x). Cette définition, dans les nota-
tions que nous avons adoptées ici, n’est pas équivalente à notre définition
de b = limx→a f (x), mais au choix de E = dom f \ {a} dans la définition
générale, c’est-à-dire à b = limx→a, x(=a f (x). Pour éviter des contradictions
apparentes dans l’énoncé de certains résultats dans différentes ouvrages d’a-
nalyse, il convient donc d’être attentif à la définition de limite choisie par
l’auteur.
Une autre condition nécessaire d’existence de la limite est fondée sur
l’utile notion de fonction localement bornée.
Définition. Soit f une fonction de Rn dans Rp et a ∈ Rn . On dit que f est
localement bornée en a si la condition suivante est vérifiée :

(∃r > 0)(∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ) : |f (x)|2 ≤ r. (2.5)

En d’autres termes, f est localement bornée en a s’il existe une boule


B2 [a; δ] dans Rn centrée en a et une boule B2 [r] dans Rp centrée en 0 telles
que f ([B2 [a; δ]) ⊂ B2 [r].
Ainsi, la fonction réelle d’une variable réelle f définie par f (x) = |x|
x
, qui,
en vertu de l’exemple 1 ci-dessus, n’a # #pas de limite pour x tendant vers 0,
#x#
est localement bornée en 0. En effet, # |x| # ≤ 1 pour tout x ∈ R ∗
. De même, la
fonction réelle d’une variable réelle f définie par f (x) = |x|
x
+x est localement
bornée en 0 puisque, pour tout x ∈ [−1, 1] \ {0}, on a |f (x)| ≤ 2.
L’existence d’une limite en un point entraı̂ne que la condition de borne
locale est satisfaite en ce point. C’est une conséquence de la Proposition
suivante, montrant que le caractère localement borné de f en a est une
condition nécessaire pour que f vérifie la condition de Cauchy en a.
Proposition. Soit f une fonction de Rn dans Rp et a ∈ Rn . Si f vérifie la
condition de Cauchy (2.3), alors f est localement bornée en a.
Démonstration. En prenant ! = 1 dans la condition (2.3), on voit qu’il
existe δ > 0 tel que, pour tout x ∈ dom f tel que |x − a|2 ≤ δ, et pour
50 CHAPITRE 2. LIMITES ET CONTINUITÉ

tout x$ ∈ dom f tel que |x$ − a|2 ≤ δ, on a |f (x) − f (x$ )|2 ≤ 1. Dès lors, si
l’on fixe un x$ ∈ dom f ∩ B2 [a; δ], on trouve, pour tout x ∈ dom f tel que
|x − a|2 ≤ δ,

|f (x)|2 = |f (x) − f (x$ ) + f (x$ )|2 ≤ |f (x) − f (x$ )|2 + |f (x$ )|2 ≤ 1 + |f (x$ )|2 ,

ce qui montre que la condition (2.5) est vérifiée pour ce δ et r = 1 + |f (x$)|2 .

La contraposée de cette proposition et le Corollaire précédent fournissent


immédiatement une condition suffisante de non-existence de la limite.
Corollaire. Soit f une fonction de Rn dans Rp et a ∈ Rn tels que a ∈
adh dom f. Si f n’est pas localement bornée en a (c’est-à-dire si la condition
suivante est vérifiée

(∀r > 0)(∀δ > 0)(∃x ∈ dom f : |x − a|2 ≤ δ) : |f (x)|2 > r),

alors la limite de f (x) pour x tendant vers a n’existe pas.


En appliquant les résultats précédents à f |E , on voit qu’une condition
nécessaire pour que f vérifie la condition de Cauchy lorsque x tend vers a
dans E est que f |E soit localement bornée en a.
Exemple. Utilisons ce corollaire pour montrer que la limite de x1 − x+x 1
2
lorsque x tend vers −1 n’existe pas. C’est la première fonction introduite
pour motiver l’introduction de la notion de limite, mais considérée cette
fois au deuxième point −1 du complémentaire de son domaine. Pour tout
x ∈ dom f , on a # #
# x + x2 − x # 1
# #
|f (x)| = # #= .
# x(x + x2 ) # |1 + x|
Dès lors, si r > 0 et δ > 0 sont donnés et si l’on prend x = −1+min{δ, 2r
1
}, on
voit que x−(−1) = x+1 = min{δ, 2r } > 0, donc |x+1| = x+1 = min{δ, 2r
1 1
},
ce qui entraı̂ne aussitôt que |x + 1| ≤ δ et |f (x)| = |1+x| ≥ 2r > r.
1

2.4 Règles de calcul des limites


Le recours systématique à la définition pour vérifier l’existence d’une limite
est long et fastidieux. Il est donc important de voir comment la notion
de limite se comporte vis-à-vis des opérations algébriques et ensemblistes
que l’on peut effectuer sur des fonctions, afin de déduire automatiquement
l’existence et la valeur de la limite de fonctions compliquées lorsqu’on connaı̂t
2.4. RÈGLES DE CALCUL DES LIMITES 51

celle de fonctions plus simples qui les composent. C’est l’objet des règles de
calcul des limites. La première exprime essentiellement que la limite d’une
somme est égale à la somme des limites. Rappelons que si f et g sont deux
fonctions de Rn dans Rp , la somme f + g de f et g est la fonction de Rn
dans Rp de domaine dom (f + g) = dom f ∩ dom g telle que, pour tout
x ∈ dom (f + g), on a (f + g)(x) = f (x) + g(x).
Proposition. Soient f et g deux fonctions de Rn dans Rp , a ∈ Rn , b ∈ Rp
et c ∈ Rp tels que a ∈ adh (dom f ∩ dom g). Si

lim f (x) = b et lim g(x) = c,


x→a x→a

alors
lim (f + g)(x) = b + c.
x→a

Démonstration. Notons tout d’abord que, pour tout x ∈ dom (f + g),


on a

|(f + g)(x) − (b + c)|2 = |f (x) − b + g(x) − c|2 ≤ |f (x) − b|2 + |g(x) − c|2 .

Si ! > 0 est donné, alors, par hypothèse,


!
(∃δ $ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ $ ) : |f (x) − b|2 ≤ ,
2
!
(∃δ $$ > 0)(∀x ∈ dom g : |x − a|2 ≤ δ $$ ) : |g(x) − c|2 ≤ .
2
Dès lors, si l’on pose δ = min{δ $ , δ $$ }, on aura, pour tout x ∈ dom f ∩dom g :
|x − a|2 ≤ δ,
! !
|(f + g)(x) − (b + c)|2 ≤ + = !.
2 2

Un raisonnement semblable, dont les détails sont laissés au lecteur, dé-


montre le résultat suivant.
Proposition. Si f et g sont des fonctions de Rn dans Rp localement bornées
en a ∈ Rn , alors f + g est localement bornée en a.
Le deuxième résultat affirme essentiellement que la limite d’un produit
de deux fonctions est égale au produit des limites. Encore faut-il que ce
produit soit bien défini, ce qui impose des restrictions aux espaces d’arrivée.
Rappelons que si f est une fonction de Rn dans Rp (resp. C) et g une
fonction de Rn dans R (resp. C), le produit gf de g par f est la fonction de
52 CHAPITRE 2. LIMITES ET CONTINUITÉ

Rn dans Rp (resp. C) de domaine dom gf = dom f ∩ dom g telle que, pour


chaque x ∈ dom gf , on a (gf )(x) = g(x).f (x), g(x).f (x) désignant selon
le cas le produit de f (x) ∈ Rp par le réel g(x) ou le produit des nombres
complexes g(x) et f (x).
Proposition. Soit f une fonction de Rn dans Rp (resp. C), g une fonction
de Rn dans R (resp. C), a ∈ Rn , b ∈ Rp (resp. C) et c ∈ R (resp. C) tels
que a ∈ adh (dom f ∩ dom g). Si

lim f (x) = b et lim g(x) = c,


x→a x→a

alors
lim (gf )(x) = cb.
x→a

Démonstration. Notons tout d’abord que, pour tout x ∈ dom f ∩ dom g,


on a
|(gf )(x) − cb|2 = |g(x)f (x) − g(x)b + g(x)b − cb|2

≤ |g(x)||f (x) − b|2 + |b|2|g(x) − c|.

D’autre part, l’existence de la limite de g lorsque x tend vers a entraı̂ne que


g est localement bornée en a, c’est-à-dire l’existence de r > 0 et δ $ > 0 tels
que
(∀x ∈ dom g : |x − a|2 ≤ δ $ ) : |g(x)| ≤ r.

Si ! > 0 est donné, alors, par hypothèse,


!
(∃δ $$ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ $$ ) : |f (x) − b|2 ≤ ,
2r
!
(∃δ $$$ > 0)(∀x ∈ dom g : |x − a|2 ≤ δ $$$) : |g(x) − c| ≤ .
2(1 + |b|2 )
Si l’on pose δ = min{δ $ , δ $$ , δ $$$}, on voit, en rassemblant les résultats ci-dessus
que, pour chaque x ∈ dom f ∩ dom g tel que |x − a|2 ≤ δ), on a
! !
|(gf )(x) − cb|2 ≤ r. + |b|2. ≤ !.
2r 2(1 + |b|2)

Un raisonnement semblable, dont les détails sont laissés au lecteur, dé-


montre le résultat suivant
2.4. RÈGLES DE CALCUL DES LIMITES 53

Proposition. Si g est une fonction de Rn dans R (resp. C) localement


bornée en a et f une fonction de Rn dans Rp (resp. C) localement bornée
en a, alors gf est localement bornée en a.
On peut obtenir une variante utile des deux propositions précédentes
dans laquelle l’hypothèse sur l’une des deux fonctions est renforcée et celle
sur l’autre affaiblie. Essentiellement, le résultat affirme que la limite du
produit d’une fonction ayant une limite nulle par une fonction localement
bornée est égale à zéro.
Proposition. Soit f une fonction de Rn dans Rp (resp. C), g une fonction
de Rn dans R (resp. C) et a ∈ adh (dom f ∩ dom g). Si limx→a f (x) = 0 et
si g est localement bornée en a, alors
lim (gf )(x) = 0.
x→a

Démonstration. Par hypothèse, il existe r > 0 et δ $ > 0 tels que, pour


tout x ∈ dom g tel que |x − a|2 ≤ δ $ , on a
|g(x)| ≤ r.
Si ! > 0 est donné, alors
!
(∃δ $$ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ $$ ) : |f (x)|2 ≤ .
r
Dès lors, en posant δ = min{δ $ , δ $$} et en rassemblant les résultats qui
précèdent, on aura
!
(∀x ∈ dom f ∩ dom g : |x − a|2 ≤ δ) : |(gf )(x)|2 = |g(x)||f (x)|2 ≤ r. = !.
r

On a évidemment un résultat semblable, avec la même démonstration, si


f est localement bornée en a et limx→a g(x) = 0.
Le résultat suivant affirme que la limite d’un quotient de deux fonc-
tions est égale au quotient des limites lorsque la limite du dénominateur est
différente de zéro. Rappelons que si f est une fonction de Rn dans Rp (resp.
C) et g une fonction de Rn dans R (resp. C), le quotient fg de f par g est la
f
fonction de Rn dans Rp (resp. C) de domaine dom g = {x ∈ dom f ∩dom g :
g(x) /= 0} telle que, pour chaque x ∈ dom on a ( fg )(x) = fg(x)
f
g,
(x)
, où fg(x)
(x)

désigne selon le cas le produit de f (x) ∈ R par le réel g(x)


p 1
ou le produit
des nombres complexes f (x) et g(x) . Bien entendu, si 1 désigne l’application
1

f
constante de R dans R partout égale à 1, on a g = 1g .f.
54 CHAPITRE 2. LIMITES ET CONTINUITÉ

Proposition. Soit f une fonction de Rn dans Rp (resp. C), g une fonction


de Rn dans R (resp. C), a ∈ Rn , b ∈ Rp (resp. C) et c ∈ R (resp. C) tels
que a ∈ adh (dom f ∩ dom g). Si
lim f (x) = b et lim g(x) = c,
x→a x→a

avec c /= 0, alors
f b
lim (x) = .
x→a g c
Démonstration. En vertu de l’égalité fg = 1g .f. et du résultat sur le
produit des limites, il suffit de démontrer que, avec les hypothèses faites sur
g, on a
1 1
lim (x) = .
x→a g c
Notons que dom 1g = {x ∈ dom g : g(x) /= 0}, et montrons tout d’abord que
a ∈ adh dom 1g . En prenant ! = |c|/2, l’hypothèse et une inégalité classique
entraı̂nent l’existence d’un δ $ > 0 tel que, pour tout x ∈ dom g vérifiant
|x − a|2 ≤ δ $ , on ait
|c|
||g(x)| − |c|| ≤ |g(x) − c| ≤ ,
2
et dès lors, pour les mêmes valeurs de x,
|c|
|g(x)| ≥ .
2
En conséquence, dom 1g ⊃ dom g ∩ B2 [a; δ $], ce qui entraı̂ne aussitôt que
dom 1g ∩ B2 [a; r] /= ∅ pour tout r > 0. Pour tout x ∈ dom 1g , on a
# # # #
#1
# (x) − 1 # = # 1 − 1 # = |c − g(x)| .
# # #
#g c # # g(x) c # |c||g(x)|
Soit maintenant ! > 0; par hypothèse,
!|c|2
(∃δ $$ > 0)(∀x ∈ dom g : |x − a|2 ≤ δ $$ ) : |g(x) − c| ≤ .
2
Dès lors, en posant δ = min{δ $ , δ $$ }, on aura, en rassemblant les résultats
qui précèdent, pour chaque x ∈ dom 1g tel que |x − a|2 ≤ δ,
# #
#1
# (x) − 1 # ≤ !|c| . 1 . 2 = !.
# 2
#g c # 2 |c| |c|
2.4. RÈGLES DE CALCUL DES LIMITES 55

Remarque. Le lecteur trouvera facilement des exemples montrant qu’on ne


peut tirer aucune conclusion générale sur la valeur de la limite d’un quotient
lorsque le dénominateur a une limite nulle. Nous analyserons plus tard
quelques situations particulières.
En appliquant les résultats qui précèdent à f |E et g|E , on obtient immédi-
atement les règles de calcul pour la limite lorsque x tend vers a dans E des
sommes, produits et quotients de fonctions.
Le résultat qui suit donne des conditions sous lesquelles la limite du
composé de deux fonctions existe.
Proposition. Soit f une fonction de Rn dans Rp, g une fonction de Rp dans
Rq , a ∈ Rn , b ∈ Rp et c ∈ Rq tels que a ∈ adh dom (g ◦ f ) et b ∈ adh dom g.
Si
lim f (x) = b et lim g(y) = c,
x→a y→b

alors
lim (g ◦ f )(x) = c.
x→a

Démonstration. Soit ! > 0; par hypothèse,

(∃η > 0)(∀y ∈ dom g : |y − b|2 ≤ η) : |g(y) − c|2 ≤ !,

et, pour cet η > 0,

(∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ) : |f (x) − b|2 ≤ η.

Dès lors, pour tout x ∈ dom (g◦f ) tel que |x−a|2 ≤ δ, on aura f (x) ∈ dom g
et |f (x) − b|2 ≤ η, et dès lors

|(g ◦ f )(x) − c|2 = |g(f (x)) − c|2 ≤ !.

Remarques. 1. En appliquant le résultat précédent à f |E , on obtient un


théorème sur la limite, lorsque x tend vers a dans E, du composé g ◦ f .
2. On peut démontrer que la proposition cesse d’être vraie si l’on remplace
l’hypothèse
lim g(y) = c
y→b
par
lim g(y) = c.
y→b, y(=b
56 CHAPITRE 2. LIMITES ET CONTINUITÉ

Dans ce dernier cas, la limite de g ◦ f lorsque x tend vers a peut cesser


d’exister, être égale à g(b) ou être égale à c.
Donnons quelques conséquences du théorème sur la limite des fonctions
composées. Pour i = 1, 2 ou ∞, désignons par |f |i la fonction de Rn dans
Rp de domaine égal à dom f définie pour chaque x ∈ dom f par |f |i(x) =
|f (x)|i.
Corollaire. Soit f une fonction de Rn dans Rp, a ∈ Rn et b ∈ Rp tels que
limx→a f (x) = b. Alors, pour i = 1, 2 ou ∞, on a

lim |f |i(x) = |b|i.


x→a

Démonstration. Soit i = 1, 2 ou ∞; si g désigne l’application de Rp dans


R définie par g(y) = |y|i, on a évidemment |f |i = g ◦f et dom g ◦f = dom f .
D’ailleurs, pour chaque y ∈ Rp et chaque z ∈ Rp , on a la relation

||y|i − |z|i| ≤ |y − z|i ,

qui se démontre exactement comme l’inégalité correspondante pour la valeur


absolue et entraı̂ne aussitôt que, pour chaque z ∈ Rp , on a

lim g(y) = g(z).


y→z

La thèse résulte alors du théorème sur la limite d’une fonction composée.


La réciproque de ce résultat est fausse : limx→a |f |i(x) peut exister sans
que limx→a f (x) n’existe (penser à f (x) = |x| x
avec a = 0). Toutefois, la
réciproque est vraie dans le cas d’une limite nulle.
Corollaire. Soit f une fonction de Rn dans Rp , a ∈ Rn et b ∈ Rp tels que,
pour i = 1, 2 ou ∞, on ait

lim |f |i(x) = 0.
x→a

Alors, limx→a f (x) = 0.


Démonstration. C’est une conséquence immédiate de la définition et du
fait que, pour chaque x ∈ dom f , on a

||f |i(x)| = |f (x)|i ≤ n|f (x)|2 .


2.4. RÈGLES DE CALCUL DES LIMITES 57

Une autre conséquence montre l’équivalence entre l’existence de la limite


des valeurs d’une fonction et de la limite des valeurs de chaque composante
de la fonction.
Corollaire. Soit f une fonction de Rn dans Rp , a ∈ Rn et b ∈ Rp . Alors,
limx→a f (x) = b si et seulement si, pour chaque 1 ≤ j ≤ p, on a

lim fj (x) = bj .
x→a

Démonstration. Pour chaque 1 ≤ j ≤ p, on a fj = pj ◦ f si pj désigne


l’application projection sur la j e composante de Rp dans R; en particulier,
dom fj = dom f.
Condition nécessaire. Pour chaque y ∈ Rp et chaque z ∈ Rp , on a

|pj (y) − pj (z)| = |yj − zj | ≤ |y − z|2 ,

on en déduit immédiatement que, pour chaque z ∈ Rp , on a limy→z pj (y) =


pj (z), et le résultat découle du théorème sur la limite d’une fonction com-
posée.
Condition suffisante. Soit ! et 1 ≤ j ≤ p; par hypothèse
!
(∃δj > 0)(∀x ∈ dom fj : |x − a|2 ≤ δj ) : |fj (x) − bj | ≤ .
p1/2
Dès lors, si l’on pose δ = min{δ1 , . . . , δp}, on voit que, pour chaque x ∈
dom f tel que |x − a|2 ≤ δ, on a
 1/2  1/2
p
$ p
$ !2
|f (x) − b|2 =  |fj (x) − bj |2  ≤  = !.
j=1 j=1
p

Ce résultat montre que l’étude de la limite des valeurs d’une fonction


de Rn dans Rp peut se ramener à l’étude de la limite des valeurs des p
fonctions composantes, qui sont chacune à valeurs réelles. Par contre, l’étude
de la limite des valeurs d’une fonction de Rn dans Rp ne peut pas se faire
“composante par composante” dans l’espace de départ Rn de la fonction, ainsi
que le montre l’exemple suivant.
Exemple. La fonction f de R2 dans R définie par f (x1 , x2 ) = xx21+x
x2
2 a pour
1 2
domaine R2 \ {0}. Si x1 = 0, alors, pour tout x2 /= 0, on a f (0, x2 ) = 0 et
dès lors
lim f (0, x2 ) = 0.
x2 →0
58 CHAPITRE 2. LIMITES ET CONTINUITÉ

Si x1 /= 0 est fixé, la fonction réelle d’une variable réelle f (x1 , ·) : x2 2→ xx21+x


x2
2
1 2
est définie pour chaque x2 ∈ R, et il est facile de montrer, en utilisant par
exemple le théorème sur la limite d’un quotient de fonctions, que, pour
chaque x1 /= 0 fixé,
lim f (x1 , x2 ) = 0.
x2 →0
Ces résultats entraı̂nent aussitôt que
2 3
lim lim f (x1 , x2 ) = 0.
x1 →0 x2 →0

Comme f est symétrique par rapport à x1 et x2 , on a évidemment aussi


2 3
lim lim f (x1 , x2 ) = 0.
x2 →0 x1 →0

Il ne faut pourtant pas en déduire que limx→0 f (x1 , x2 ) = 0, car cette limite
n’existe pas ! En effet, pour chaque point de la forme (x1 , x1 ) avec x1 /=
x2
0, on a f (x1 , x1 ) = 2x12 = 12 et l’on en déduit aussitôt que, pour chaque
1
δ > 0, si l’on choisit x = (δ, 0) et x$ = ( 21/2
δ δ
, 21/2 ), on a |x|2 = |x$ |2 = δ et
|f (x) − f (x$ )| = 12 , ce qui montre que la négation de la condition nécessaire
de Cauchy est satisfaite avec ! = 14 .
Montrons enfin que la limite respecte les inégalités non strictes entre
fonctions à valeurs réelles.
Proposition. Soient f et g des fonctions de Rn dans R, a ∈ Rn , b ∈ R et
c ∈ R. Si,
lim f (x) = b et lim g(x) = c,
x→a, x∈dom g x→a, x∈dom f

et si, pour tout x ∈ dom f ∩ dom g, on a f (x) ≤ g(x), alors b ≤ c.


Démonstration. On sait qu’il est équivalent de démontrer que, pour
chaque ! > 0, on a b ≤ c + !. Soit donc ! > 0; par hypothèse,
! !
(∃δ $ > 0)(∀x ∈ dom f ∩ dom g : |x − a|2 ≤ δ $ ) : − ≤ f (x) − b ≤ ,
2 2
et
! !
(∃δ $$ > 0)(∀x ∈ dom g ∩ dom f : |x − a|2 ≤ δ $$ ) : − ≤ g(x) − c ≤ .
2 2
Dès lors, si δ = min{δ $ , δ $$ } et si x ∈ dom f ∩ dom g est tel que |x − a|2 ≤ δ,
on aura
! ! ! !
b ≤ f (x) + ≤ g(x) + ≤ c + + = c + !.
2 2 2 2
2.5. FORMULATIONS ÉQUIVALENTES ET CARACTÈRE LOCAL 59

L’exemple de la fonction réelle d’une variable réelle f définie par f (x) =


x2
|x| qui est strictement positive sur son domaine R \ {0} et a pour limite 0
lorsque x tend vers zéro montre qu’une inégalité stricte n’est pas nécessaire-
ment conservée à la limite; seule l’inégalité non stricte correspondante est
satisfaite, en vertu de la proposition que nous venons de démontrer.
En considérant f |E et g|E , on voit immédiatement que tous ces résultats
restent valables pour les limites lorsque x tend vers a dans E.

2.5 Formulations équivalentes et caractère local


On va montrer que la notion de limite des valeurs de f lorsque x tend vers
a peut s’exprimer en termes de voisinages.
Soit f une fonction de Rn dans Rp , a ∈ Rn et b ∈ Rp.
Proposition. limx→a f (x) = b si et seulement si
1) a ∈ adh dom f ;
2’) (∀V : V est voisinage de b)(∃U : U est voisinage de a) : f (U ) ⊂ V.
Démonstration. Condition nécessaire. Il faut montrer que la condition 2
de la définition de limite entraı̂ne la condition 2’. Soit V un voisinage de b;
il existe donc ! > 0 tel que B2 [b; !] ⊂ V. Pour cet ! > 0, la condition 2 dans
la définition de la limite entraı̂ne l’existence d’un δ > 0 tel que, pour tout
x ∈ dom f ∩ B2 [a; δ], on ait f (x) ∈ B2 [b; !]. En d’autres termes, le voisinage
U = B2 [a; δ] est tel que f (U ) ⊂ B2 [b; !] ⊂ V.
Condition suffisante. Il faut montrer que si 2’ est satisfaite, il en est de
même de la condition 2 de la définition de la limite. Soit donc ! > 0; comme
V = B2 [b; !] est un voisinage de b, il existera par (2’) un voisinage U de a
tel que
f (U ) ⊂ V = B2 [b; !],
c’est-à-dire tel que, pour tout x ∈ dom f ∩ U , on ait |f (x) − b|2 ≤ !. D’autre
part, U étant un voisinage de a, il existe un δ > 0 tel que B2 [a; δ] ⊂ U, et on
aura donc aussi |f (x) − b|2 ≤ ! pour tout x ∈ dom f tel que |x − a|2 ≤ δ.
Rappelons que n’importe quelle boule Bi [a; r] est voisinage de a ∈ Rn ,
n’importe quelle boule Bi [b; r] est voisinage de b ∈ Rp (i = 1, 2, ∞) et que
tout voisinage d’un point contient une boule en chacune des normes centrée
en ce point. Une conséquence de ce fait et de la proposition précédente
est évidemment que, dans la condition 2 de définition de la limite, on peut
remplacer |x − a|2 par |x − a|i et |f (x) − b|2 par |f (x) − b|j pour n’importe
quel choix de i, j = 1, 2 ou ∞.
60 CHAPITRE 2. LIMITES ET CONTINUITÉ

Comme la notion de voisinage est liée à celle de point intérieur et que


cette notion peut s’exprimer en fonction de la notion de point adhérent, on
peut s’attendre à ce qu’il existe une formulation de la notion de limite en
termes de points adhérents. C’est bien le cas et l’on a la caractérisation
suivante, que nous n’utiliserons pas dans la suite et dont nous laissons la
démonstration au lecteur, en lui suggérant de démontrer la condition suf-
fisante par contraposition.
Proposition. limx→a f (x) = b si et seulement si
1) a ∈ adh dom f ;
2”) (∀A ⊂ Rn : a ∈ adh (dom f ∩ A)) : b ∈ adh f (A).
On obtient évidemment des caractérisations analogues pour la limite de
f (x) lorsque x tend vers a dans E en appliquant les résultats précédents à
f |E .
Etudions maintenant l’influence du choix de l’ensemble de contraintes E
sur l’existence de la limite. Soit f une fonction de Rn dans Rp, a ∈ Rn ,
b ∈ Rp et E ⊂ Rn .
Le premier résultat montre que l’existence de la limite se maintient si l’on
diminue E en respectant évidemment la première condition de la définition.
Proposition. Si F ⊂ E et si a ∈ adh (dom f ∩ F ) et limx→a, x∈E f (x) = b,
alors, limx→a, x∈F f (x) = b.
Démonstration. C’est une conséquence immédiate de la définition.
Un exemple antérieur a montré qu’on pouvait par contre perdre l’existen-
ce de la limite en agrandissant l’ensemble des contraintes E. On a toutefois
l’importante propriété suivante, qui montre le caractère local de la notion de
limite, en ce sens que l’existence et la valeur de la limite ne dépendent que
des valeurs de la fonction dans un voisinage arbitrairement petit du point
considéré.
Proposition. Soit W un voisinage de a. Alors

lim f (x) = b ⇔ lim f (x) = b.


x→a, x∈E x→a, x∈E∩W

Démonstration. Condition nécessaire. Puisque E ∩ W ⊂ E, il suf-


fit, pour pouvoir appliquer la proposition précédente, de montrer que a ∈
adh (dom f ∩ E ∩ W ). Pour ce faire, soit r > 0; puisque W et B2 [a; r] sont
voisinages de a, il en est de même de W ∩ B2 [a; r], et il existe donc r $ ∈ ]0, r]
tel que B2 [a; r $] ⊂ W ∩ B2 [a; r]; d’autre part, puisque a ∈ adh (dom f ∩ E),
on a dom f ∩ E ∩ B2 [a; r $] /= ∅ et dès lors dom f ∩ E ∩ W ∩ B2 [a; r] /= ∅.
2.5. FORMULATIONS ÉQUIVALENTES ET CARACTÈRE LOCAL 61

Condition suffisante. Bien entendu, l’hypothèse a ∈ adh (dom f ∩ E ∩ W )


entraı̂ne a ∈ adh (dom f ∩ E). Il suffit donc maintenant de démontrer la
condition 2’ de la caractérisation de la limite par les voisinages. Soit V
un voisinage de b; par hypothèse, il existe un voisinage U $ de a tel que
f (U $ ∩ E ∩ W ) ⊂ V et, comme U $ ∩ W est un voisinage de a, il existe donc
un voisinage U = U $ ∩ W de a tel que f (U ∩ E) ⊂ V .
Pour une fonction f d’une variable réelle, les choix particuliers suivants
pour E donnent lieu à une terminologie et à des notations particulières. Si
f est une fonction de R dans Rp , a ∈ R et si E = {x ∈ R : x < a}, alors,
lorsque b = limx→a, x∈E f (x), on dira que b est la limite à gauche de f (x)
lorsque x tend vers a, et l’on écrira

b= lim f (x) ou b = lim f (x).


x→a, x<a x→a−

D’une manière similaire, si E = {x ∈ R : x > a}, et b = limx→a, x∈E f (x), on


dira que b est la limite à droite de f (x) lorsque x tend vers a, et l’on écrira

b= lim f (x) ou b = lim f (x).


x→a, x>a x→a+

La propriété d’existence de la limite lorsqu’on diminue l’ensemble des


contraintes entraı̂ne aussitôt la proposition suivante.
Proposition. Soit f une fonction de R dans Rp et a ∈ R. Si

a ∈ adh (dom f ∩ {x ∈ R : x < a}) ∩ adh (dom f ∩ {x ∈ R : x > a}),

et si limx→a, x(=a f (x) = b, alors

lim f (x) = lim f (x) = b.


x→a− x→a+

La réciproque est vraie dans le sens suivant.


Proposition. Soit f une fonction de R dans Rp et a ∈ R. Si

lim f (x) = lim f (x) = b,


x→a− x→a+

alors limx→a, x(=a f (x) = b.


Démonstration. Comme, par hypothèse, on a

a ∈ adh (dom f ∩ {x ∈ R : x < a}) ∩ adh (dom f ∩ {x ∈ R : x > a}),


62 CHAPITRE 2. LIMITES ET CONTINUITÉ

on a évidemment que a ∈ adh [dom f ∩ (R \ {a})]. Soit ! > 0; par hypothèse,


(∃δ $ > 0)(∀x ∈ dom f : a − δ $ ≤ x < a) : |f (x) − b|2 ≤ !,
et
(∃δ $$ > 0)(∀x ∈ dom f : a < x ≤ a + δ $$ ) : |f (x) − b|2 ≤ !.
Dès lors, si δ = min{δ $ , δ $$}, et si x ∈ dom f \ {a} est tel que |x − a| ≤ δ, on
aura |f (x) − b|2 ≤ !.

2.6 Limites à l’infini et convergence des suites


Introduisons d’abord la notion de partie bornée de Rn .
Définition. On dit qu’une partie A de Rn est bornée s’il existe un r > 0
tel que A ⊂ B2 [r].
On montre sans peine que A est bornée si et seulement s’il existe un
r > 0 tel que A ⊂ Bi [r] pour i = 1, 2 ou ∞. L’ensemble vide est borné et
toute boule est bornée. En outre, il est évident que si A est bornée et si
B ⊂ A, alors B est bornée. La définition entraı̂ne aussi que A ⊂ Rn est non
bornée si et seulement si, pour tout r > 0, on a A /⊂ B2 [r], ou encore si et
seulement si,
(∀r > 0)(∃x ∈ A) : |x|2 > r.
En particulier, le théorème d’Archimède entraı̂ne que N∗ est non borné
puisque, si r > 0 est donné, il existe un m ∈ N∗ tel que m = m.1 ≥ r + 1, et
dès lors ce m /∈ B[r] = [−r, r]. D’autre part, si A est non borné et B ⊃ A,
B est non borné (par contraposition du résultat ci-dessus), et l’on en déduit
que Rn est une partie non bornée de Rn et que R, Q, Z et N sont des parties
non bornées de R.
L’exemple de la fonction f de Rn dans R définie par f (x) = |x|1 2 pour
chaque x /= 0 montre que la propriété “prendre la valeur zéro” est vérifiée
“approximativement” au sens donné dans l’introduction de la notion de lim-
ite non pas pour des valeurs suffisamment proches d’un point a de Rn mais
pour les points de Rn de norme suffisamment grande. En effet, si ! > 0 est
donné, on aura |f (x)| = |x|1 2 ≤ ! dès que |x|2 ≥ 1! . On est ainsi conduit à la
définition suivante de limite à l’infini pour une fonction.
Définition. Soit f une fonction de Rn dans Rp et b ∈ Rp. On dit que f (x)
tend vers b lorsque x tend vers l’infini, et l’on écrit
f (x) → b si x → ∞,
2.6. LIMITES À L’INFINI ET CONVERGENCE DES SUITES 63

si les conditions suivantes sont satisfaites :


1) dom f est non borné;
2) (∀! > 0)(∃ρ > 0)(∀x ∈ dom f : |x|2 ≥ ρ) : |f (x) − b|2 ≤ !.
Comme dans le cas classique, on démontre qu’il existe au plus un b
vérifiant cette définition (on écrit alors

b = lim f (x))
x→∞

et que la condition de Cauchy

(∀! > 0)(∃ρ > 0)(∀x ∈ dom f : |x|2 ≥ ρ)

(∀x$ ∈ dom f : |x$ |2 ≥ ρ) : |f (x) − f (x$ )|2 ≤ !,


est une condition nécessaire d’existence de la limite de f pour x tendant vers
l’infini. Une condition nécessaire pour la condition de Cauchy soit vérifiée,
et qui se démontre comme dans le cas classique, est que f soit bornée à
l’infini au sens de la définition suivante.
Définition. Soit f une fonction de Rn dans Rp . On dit que f est bornée à
l’infini si dom f est non borné et si la condition suivante est vérifiée:

(∃r > 0)(∃ρ > 0)(∀x ∈ dom f : |x|2 ≥ ρ) : |f (x)|2 ≤ r.

Enfin, les règles de calcul des limites s’étendent aussi, avec des démonstra-
tions analogues, à la limite à l’infini.
Si E est une partie de Rn , alors, en appliquant la définition ci-dessus
à f |E , on obtient immédiatement la notion de limite des valeurs de f (x)
lorsque x tend vers l’infini dans E.
Définition. Soit f une fonction de Rn dans Rp , b ∈ Rp et E ⊂ Rn . On dit
que f (x) tend vers b lorsque x tend vers l’infini dans E, et l’on écrit

f (x) → b si x → ∞ dans E,

si les conditions suivantes sont satisfaites :


1) dom f ∩ E est non borné;
2) (∀! > 0)(∃ρ > 0)(∀x ∈ dom f ∩ E : |x|2 ≥ ρ) : |f (x) − b|2 ≤ !.
Lorsque f est une fonction d’une variable réelle, des choix particuliers
de E bénéficient d’une terminologie et de notations spéciales. Ainsi, lorsque
E = R+ (resp. E = R− ) et que

lim f (x) = b, (resp. lim f (x) = b),


x→∞, x∈R+ x→∞, x∈R−
64 CHAPITRE 2. LIMITES ET CONTINUITÉ

on dit que f (x) tend vers b lorsque x tend vers plus l’infini (resp. moins
l’infini), et l’on écrit

lim f (x) = b, (resp. lim f (x) = b).


x→+∞ x→−∞

Ces notions correspondent donc respectivement aux conditions

(∀! > 0)(∃ρ > 0)(∀x ∈ dom f : x ≥ ρ) : |f (x) − b|2 ≤ !,

et
(∀! > 0)(∃ρ > 0)(∀x ∈ dom f : x ≤ −ρ) : |f (x) − b|2 ≤ !.
Exemple. Soit f l’application de R dans R définie par f (x) = 1+|x| x
. Si
! > 0 est donné, alors, pour x ≥ 0, |f (x) − 1| = | 1+x − 1| = 1+x ≤ ! dès que
x 1

x ≥ 1! − 1. On voit donc que limx→+∞ f (x) = 1. On montre de même que


limx→−∞ f (x) = −1. D’autre part, pour chaque ρ > 0, on a
# #
# ρ −ρ ## 2ρ
|f (ρ) − f (−ρ)| = #
# − # = >1
1+ρ 1+ρ 1+ρ
si ρ > 1. On en déduit aisément que la condition nécessaire de Cauchy
d’existence de limx→∞ f (x) n’est pas satisfaite et que cette dernière limite
n’existe pas.
Les notions que nous venons de développer s’appliquent évidemment dans
le cas particulier d’une suite (ak )k∈N dans Rp , c’est-à-dire d’une application
de N (ou de N∗ ) dans Rp. Si b ∈ Rp alors b = limk→∞ ak si et seulement si

(∀! > 0)(∃ρ > 0)(∀k ∈ N : k ≥ ρ) : |ak − b|2 ≤ !.

Etant donné que, pour chaque ρ > 0, le théorème d’Archimède affirme


l’existence d’un entier naturel m ≥ ρ, il est clair que la condition précédente
est équivalente à la condition

(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m) : |ak − b|2 ≤ !,

plus couramment utilisée pour caractériser la limite d’une suite. On vérifie


immédiatement à partir de cette définition que, si q ∈ N est fixé, alors

lim ak = b ⇔ lim aq+k = b,


k→∞ k→∞

ce qui traduit simplement le fait qu’on peut ignorer les q premiers termes
d’une suite sans modifier l’existence et la valeur de sa limite. Lorsque la
2.6. LIMITES À L’INFINI ET CONVERGENCE DES SUITES 65

limite de (ak )k∈N existe, on dit aussi que la suite (ak )k∈N converge ou est
une suite convergente; sinon on dit qu’elle diverge ou est une suite divergente.
Les points ak de Rp sont souvent appelés les termes de la suite.
Exemple. La suite ( k1 )k∈N∗ converge vers zéro et la suite ((−1)k )k∈N diverge.
On le vérifiera comme exercice.
La condition nécessaire de Cauchy peut s’écrire, dans le cas d’une suite
(ak )k∈N dans Rp sous la forme équivalence

(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q ≥ m) : |ak − aq |2 ≤ !.

Les règles de calcul des limites s’appliquent évidemment au cas particulier


des suites.
On peut caractériser la notion de point adhérent à une partie de Rn en
termes de la notion de convergence d’une suite.
Proposition. Soit a ∈ Rn et E une partie de Rn . Alors a est adhérent à E
si et seulement s’il existe une suite (xk )k∈N dans E qui converge vers a.
Démonstration. Condition nécessaire. Soit a adhérent à E; alors, pour
chaque k ∈ N, on a E ∩ B2 [a; k+1 1
] /= ∅; on d’autres termes, pour chaque
k ∈ N, il existe un xk ∈ E ∩ B2 [a; k+1 1
], c’est-à-dire un xk ∈ E tel que
|xk − a|2 ≤ k+1 . Cette dernière condition entraı̂ne aussitôt que la suite
1

(xk )k∈N converge vers a.


Condition suffisante. Soit (xk )k∈N une suite dans E qui converge vers a. En
conséquence, si r > 0 est donné,

(∃m ∈ N)(∀k ∈ N : k ≥ m) : |xk − a|2 ≤ r,

et dès lors, xm ∈ E ∩ B2 [a; r]. Donc a ∈ adh E.


On peut également caractériser en termes de suite la notion de limite en
un point des valeurs d’une fonction.
Proposition. Soit f une fonction de Rn dans Rp , a ∈ Rn et b ∈ Rp . Alors,
limx→a f (x) = b si et seulement si les deux conditions suivantes sont satis-
faites :
1) a ∈ adh dom f ;
2) toute suite (xk )k∈N dans dom f qui converge vers a, a pour image une
suite (f (xk ))k∈N qui converge vers b.
Démonstration. Condition nécessaire. Soit (xk )k∈N une suite dans
dom f qui converge vers a. Si l’on désigne par h : N → Rn , k 2→ xk ,
l’application correspondante, on voit que, pour chaque k ∈ N, f (xk ) =
66 CHAPITRE 2. LIMITES ET CONTINUITÉ

(f ◦ h)(k), dom (f ◦ h) = N, et il suffit d’appliquer le théorème de la limite


d’une fonction composée.
Condition suffisante. On démontre le contraposé. Si b n’est pas limite de
f (x) lorsque x tend vers a, alors
(∃! > 0)(∀δ > 0)(∃x ∈ dom f : |x − a|2 ≤ δ) : |f (x) − b|2 > !.
En choisissant successivement δ = k+1 1
pour chaque k ∈ N, on trouve ainsi
un xk ∈ dom f tel que |xk − a|2 ≤ k+1 et |f (xk ) − b|2 > !. En conséquence,
1

la suite (xk )k∈N ainsi obtenue est une suite dans dom f qui converge vers a
et est telle que f (xk )k∈N ne converge pas vers b.
La forme contraposée de cette caractérisation de la limite des valeurs
d’une fonction est souvent utile pour montrer que la limite n’est pas égale
à b : il suffira de trouver une suite (xk )k∈N dans dom f qui converge vers
a et soit telle que la suite f (xk )k∈N ne converge pas vers b. On en déduit
également un moyen utile pour prouver la non-existence de la limite : il
suffira de trouver une suite (xk )k∈N dans dom f qui converge vers a et soit
telle que la suite f (xk )k∈N converge vers b$ et une suite (x$k )k∈N dans dom f
qui converge vers a et soit telle que la suite f (x$k )k∈N converge vers b$$ /= b$ .
En appliquant le résultat précédent à f |E , on obtient une caractérisation
en termes de suites de la limite de f (x) lorsque x tend vers a dans E.

2.7 Limites infinies


Soit f une fonction de Rn dans R et a ∈ adh dom f. Nous allons analyser
la situation dans laquelle la limite de f (x) lorsque x tend vers a n’existe
pas parce que |f (x)|2 prend des valeurs arbitrairement grandes lorsque x est
suffisamment proche de a. Par abus de langage, on parle alors d’existence
d’une limite infinie pour f .
Définition. Soit f une fonction de Rn dans Rp et a ∈ Rn . On dit que f (x)
tend vers l’infini lorsque x tend vers a, et l’on écrit
lim f (x) = ∞,
x→a
si les conditions suivantes sont réalisées.
1. a ∈ adh dom f.
2. (∀r > 0)(∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ) : |f (x)|2 ≥ r.
Par exemple, la fonction f : x 2→ |x|−1 2 est telle que limx→0 f (x) = ∞,
puisque, si r > 0 est donné, on a |x|−1
2 ≥ r dès que 0 < |x|2 ≤ r −1 .
On a une notion semblable lorsque x tend vers l’infini.
2.7. LIMITES INFINIES 67

Définition. Soit f une fonction de Rn dans Rp . On dit que f (x) tend vers
l’infini lorsque x tend vers l’infini, et l’on écrit

lim f (x) = ∞,
x→∞

si les conditions suivantes sont réalisées.


1. dom f est non borné.
2. (∀r > 0)(∃ρ > 0)(∀x ∈ dom f : |x|2 ≥ ρ) : |f (x)|2 ≥ r.
Par exemple, la fonction identité sur Rn tend vers l’infini lorsque x tend
vers l’infini.
On montre facilement que les définitions ci-dessus ne dépendent pas du
choix de la norme |·|2 et qu’on peut utiliser n’importe quelle autre norme. Si
E est une partie de Rn , on obtient évidemment les situations correspondantes
lorsque x tend vers a dans E ou lorsque x tend vers l’infini dans E en
appliquant les définitions ci-dessus à la restriction f |E de f à E. Cela revient,
dans les définitions ci-dessus, à remplacer partout dom f par dom f ∩ E.
Dans le cas particulier où p = 1, on utilise la structure d’ordre sur R pour
introduire les situations suivantes.
Définition. Soit f une fonction de Rn dans R et a ∈ Rn . On dit que f (x)
tend vers +∞ (resp. −∞) lorsque x tend vers a, et l’on écrit

lim f (x) = +∞ (resp. lim f (x) = −∞),


x→a x→a

si les conditions suivantes sont vérifiées.


1. a ∈ adh dom f.
2. (∀r > 0)(∃δ > 0)(∀x ∈ dom f : |x−a|2 ≤ δ) : f (x) ≥ r (resp. f (x) ≤ −r).

Définition. Soit f une fonction de Rn dans R. On dit que f (x) tend vers
+∞ (resp. −∞) lorsque x tend vers l’infini, et l’on écrit

lim f (x) = +∞ (resp. lim f (x) = −∞),


x→∞ x→∞

si les conditions suivantes sont vérifiées.


1. dom f est non borné.
2. (∀r > 0)(∃ρ > 0)(∀x ∈ dom f : |x|2 ≥ ρ) : f (x) ≥ r (resp. f (x) ≤ −r).
On a bien entendu des définitions analogues pour x tendant vers a ou
vers l’infini dans E ⊂ Rn en appliquant ces définitions à f |E .
Insistons sur le fait que ces définitions couvrent des situations où la limite
n’existe pas. Les conditions nécessaires d’existence de la limite et les règles
68 CHAPITRE 2. LIMITES ET CONTINUITÉ

de calcul des limites n’ont donc aucune raison de s’appliquer, et il est facile
de le montrer par des exemples. D’ailleurs les énoncés correspondants n’ont
eux-mêmes souvent aucun sens. Il convient donc de traiter ces notions avec
prudence en retournant aux définitions.
La notion de limite infinie fournit toutefois des compléments d’informati-
on sur les limites de quotients de fonctions dans des situations où les règles
de calcul classiques ne s’appliquent pas. Nous les formulons dans le cas où
x tend vers a. On a des résultats entièrement analogues lorsque x tend vers
l’infini, dont les énoncés et les démonstrations sont laissés au lecteur.
Proposition. Soit f une fonction de Rn dans Rp (resp. C), g une fonction
de Rn dans R (resp. C) et a ∈ adh (dom f ∩ dom 1/g). Si

lim g(x) = 0
x→a

et s’il existe δ1 > 0 et η1 > 0 tels que |f (x)|2 ≥ η1 pour tout x ∈ dom f ∩
B2 [a; δ1 ], (ce qui est le cas si limx→a f (x) = b /= 0), alors

f
lim (x) = ∞.
x→a g
Démonstration. Soit r > 0; et soient δ1 et η1 donnés par les hypothèses.
Puisque g(x) tend vers 0 lorsque x tend vers a, il existera δ2 > 0 tel que,
pour tout x ∈ dom g ∩ B2 [a; δ2 ], on a |g(x)| ≤ ηr1 . Dès lors, si δ = min{δ1 , δ2 }
et si x ∈ dom f ∩ dom 1/g ∩ B2 [a; δ], on aura
# #
# (x)# = |f (x)|2 ≥ η1 r = r.
#f #
#g # |g(x)| η1
2

Proposition. Soit f une fonction de Rn dans Rp (resp. C), g une fonction


de Rn dans R (resp. C) et a ∈ adh dom f ∩ dom g. Si

lim g(x) = ∞
x→a

et si f est localement bornée en a, (ce qui est le cas si limx→a f (x) existe),
alors
f
lim (x) = 0.
x→a g

Démonstration. Notons tout d’abord qu’on montre facilement, comme


dans le cas classique de la limite d’un quotient, que a ∈ adh dom fg , en
2.8. CONTINUITÉ D’UNE FONCTION EN UN POINT 69

montrant que g ne s’annule pas suffisamment près de a. Par l’hypothèse sur


f , il existe δ1 > 0 et r1 > 0 tels que, pour tout x ∈ dom f ∩ B2 [a; δ1 ], on a
|f (x)|2 ≤ r1 . Soit ! > 0; l’hypothèse sur g entraı̂ne l’existence d’un δ2 > 0
tel que, pour tout x ∈ dom g ∩ B2 [a; δ2 ], on a |g(x)| ≥ r!1 . En conséquence,
si δ = min{δ1 , δ2 }, on aura, pour tout x ∈ dom fg tel que |x − a|2 ≤ δ, :
# #
# (x)# = |f (x)|2 ≤ r1 ! = !.
#f #
#g # |g(x)| r1
2

La notion de limite infinie fournit également, par une démonstration


entièrement analogue à celle du cas classique, une caractérisation en termes
de suites de l’existence de la limite limite de f (x) lorsque x tend vers l’infini.
Proposition. Soit f une fonction de Rn dans Rp telle que dom f soit non
borné et soit b ∈ Rp . Alors, limx→∞ f (x) = b si et seulement si, pour toute
suite (xk )k∈N dans dom f telle que xk → ∞ si k → ∞, la suite (f (xk ))k∈N
converge vers b.

2.8 Continuité d’une fonction en un point


Soit f une fonction de Rn dans Rp; nous allons maintenant étudier le pro-
blème de la limite de ses valeurs en un point a appartenant au domaine de
f . Dans ce cas, l’existence de la limite lorsque x tend vers a se ramène à
la vérification de la deuxième condition. Si cette deuxième condition est
vérifiée, on dira que f est continue en a; si elle ne l’est pas, on dira que f
est discontinue en a. En d’autres termes, on a la définition suivante.
Définition. Soit f une fonction de Rn dans Rp et a ∈ dom f . On dit que
f est continue au point a si limx→a f (x) existe et que f est discontinue au
point a si limx→a f (x) n’existe pas.
Bien entendu, dans l’expression d’existence de la limite, on pourra utiliser
n’importe laquelle des formulations équivalentes.
On a l’utile propriété suivante.
Proposition. Soit f une fonction de Rn dans Rp et a ∈ dom f . Alors f est
continue en a si et seulement si limx→a f (x) = f (a).
Démonstration. Condition nécessaire. Soit b = limx→a f (x). Par la ca-
ractérisation de la limite en termes de suites, si on prend la suite constante
70 CHAPITRE 2. LIMITES ET CONTINUITÉ

(xk )k∈N définie par xk = a pour chaque k ∈ N, on obtient une suite dans
dom f convergeant vers a et dès lors la suite (constante) (f (xk ))k∈N égale
pour tout k ∈ N à f (a) convergera vers b; mais sa limite est évidemment
f (a), ce qui entraı̂ne que f (a) = b.
Condition suffisante. Elle est évidente.
Cette proposition montre qu’en un point de continuité d’une fonction, il
suffit simplement, pour obtenir la limite, de calculer la valeur de la fonction
en ce point. On pourra donc gagner beaucoup de temps, dans le calcul des
limites, en identifiant rapidement les points de continuité d’une fonction.
Il existe une condition sur a et dom f qui assure toujours la continuité
de f en a.
Définition. Si E ⊂ Rn et si a ∈ E, on dit que a est un point isolé de E s’il
existe r > 0 tel que B2 [a; r] ∩ E = {a}.
En d’autres termes, a est isolé dans E si et seulement s’il existe un r > 0
tel que B2 [a; r] ∩ (E \ {a}) = ∅ c’est-à-dire si et seulement si a n’est pas
adhérent à E \ {a}.
Proposition. Si f est une fonction de Rn dans Rp et si a est isolé dans
dom f , alors f est continue en a.
Démonstration. Soit r > 0 tel que B2 [a; r] ∩ dom f = {a}. Si ! > 0 est
donné, alors,
{x ∈ dom f : x ∈ B2 [a; r]} = {a},
et évidemment, |f (a) − f (a)|2 = 0 ≤ !.
Considérons maintenant le cas d’un point non isolé du domaine.
Proposition. Soit f une fonction de Rn dans Rp et a un point non isolé de
dom f . Alors

lim f (x) = f (a) ⇔ lim f (x) = f (a).


x→a x→a, x(=a

Démonstration. Condition nécessaire. Elle est évidente puisque, par


hypothèse, a ∈ adh (dom f \ {a}).
Condition suffisante. Soit ! > 0; par hypothèse,

(∃δ > 0)(∀x ∈ dom f \ {a} : |x − a|2 ≤ δ) : |f (x) − f (a)|2 ≤ !.

Comme on a évidemment |f (a)−f (a)|2 = 0 ≤ !, la thèse s’en déduit aussitôt.


2.8. CONTINUITÉ D’UNE FONCTION EN UN POINT 71

Exemples. 1. Toute fonction constante de Rn dans Rp est continue en


chaque point de son domaine et l’application identité I de Rn dans Rn est
continue en chaque point de Rn (vérification immédiate).
2. Si i = 1, 2 ou ∞, l’application | · |i de Rn dans R est continue en chaque
point de Rn ; on effet, si a ∈ Rn on a, pour chaque x ∈ Rn ,

||x|i − |a|i| ≤ |x − a|i ,

et le résultat s’en déduit aussitôt en prenant δ = ! dans la définition.


3. La fonction de Dirichlet est l’application de R dans R définie par d(x) = 1
si x est rationnel et d(x) = 0 si x est irrationnel. Cette fonction n’est continue
en aucun point de R. On le montre en utilisant la condition de non existence
de la limite déduite de la condition nécessaire de Cauchy. Si a ∈ R et si δ > 0
est donné, on a vu que l’intervalle [a−δ, a+δ] contient au moins un rationnel
x et un irrationnel x$ ; on a donc |d(x) − d(x$ )| = 1 et il suffit de prendre
! = 12 dans la négation de la condition de Cauchy.
4. L’application f de R dans R définie par f (x) = x si x est rationnel
et f (x) = −x si x est irrationnel est continue en 0 (le vérifier) mais n’est
continue en aucun autre point de R. En effet, si, pour fixer les idées, a > 0,
alors, pour chaque δ > 0, l’intervalle [a, a + δ] contient un rationnel x et un
irrationnel x$ ; ils sont tels que

|f (x) − f (x$ )| = |x + x$ | = x + x$ ≥ 2a > a,

et la négation de la condition de Cauchy est vérifiée avec ! = a. Le cas où


a < 0 se traite de même et est laissé au lecteur.
5. La fonction racine carrée arithmétique qui à chaque réel positif associe sa
racine carrée arithmétique est continue en chaque point de R+ . En effet, si

! > 0 est donné, on a, en a = 0, x ≤ ! pour tout 0 ≤ x ≤ !2 , et, en a > 0,
on a, pour tout x ≥ 0,
# #
√ √ # x−a # |x − a|
| x − a| = ## √ √ ## ≤ √ ,
x+ a a

et la dernière expression sera inférieure à ! si |x − a| ≤ a!.
On peut maintenant utiliser les règles de calcul sur les limites pour en
déduire immédiatement des résultats de continuité.
Proposition. 1. Si f et g sont des fonctions de Rn dans Rp continues en
a, alors f + g est continue en a.
2. Si f est une fonction de Rn dans Rp (resp. C) continue en a et g une
72 CHAPITRE 2. LIMITES ET CONTINUITÉ

fonction de Rn dans R (resp. C) continue en a, alors gf est continue en a et


si, en outre, g(a) /= 0, fg est continue en a.
3. Si f est une fonction de Rn dans Rp continue en a et g une fonction de
Rp dans Rq continue en f (a), alors g ◦ f est continue en a.
Démonstration. Les propriétés 1 et 2 sont des conséquences immédiates
des définitions et des propriétés des limites. Pour la propriété 3, il suffit,
pour appliquer le théorème sur les limites, de noter que a ∈ dom (g ◦ f ).
En combinant cette proposition avec les exemples simples d’applications
continues déjà donnés, on voit que les applications polynômiales (et en par-
ticulier linéaires) de Rn dans Rp sont continues en chaque point de Rn et
que les fonctions rationnelles de Rn dans Rp (c’est-à-dire les fonctions qui
peuvent s’écrire comme quotient d’un polynôme de Rn dans Rp (resp. C)
par un polynôme de Rn dans R (resp. C)) sont continues en chaque point
de Rn où leur dénominateur est différent de zéro.

2.9 Applications linéaires


Approfondissons les propriétés de continuité des applications linéaires. Rap-
pelons qu’une application linéaire de Rn dans Rp est une application L de
Rn dans Rp telle que :
1. (∀x ∈ Rn )(∀y ∈ Rn ) : L(x + y) = L(x) + L(y).
2. (∀c ∈ R)(∀x ∈ Rn ) : L(cx) = cL(x).
On en déduit aussitôt que, pour tout x ∈ Rn , on a
n
$ n
$ n
$
L(x) = L( xj ej ) = L(xj ej ) = xj L(ej ). (2.6)
j=1 j=1 j=1

Réciproquement, si c1 , . . . , cn sont des éléments donnés de Rp , l’application


L de Rn dans Rp définie pour chaque x ∈ Rn par
n
$
L(x) = xj c j , (2.7)
j=1

sera telle que, pour tout x ∈ Rn , tout y ∈ Rn et tout c ∈ R, on ait


n
$ n
$ n
$ n
$
L(x + y) = (x + y)j cj = (xj + yj )cj = xj c j + yj cj = L(x) + L(y),
j=1 j=1 j=1 j=1
2.9. APPLICATIONS LINÉAIRES 73

n
$ n
$ n
$
L(cx) = (cx)j cj = cxj cj = c xj cj = cL(x),
j=1 j=1 j=1
et sera donc linéaire. En conséquence, toute application linéaire de Rn dans
Rp est de la forme (2.7) avec cj = L(ej ), (1 ≤ j ≤ n). Les éléments cj = L(ej )
s’appellent les coefficients de L dans la base canonique. Leurs composantes
Lk (ej ) = pk (L(ej )), (1 ≤ j ≤ n, 1 ≤ k ≤ p) définissent une matrice qui
représente l’application linéaire dans la base canonique. Ainsi, la donnée
d’une application linéaire de Rn dans Rp revient à la donnnée de n éléments
de Rp, c’est-à-dire de np réels. En particulier, la donnée d’une application
linéaire de Rn dans R revient à la donnée de n réels ou encore d’un élément de
Rn et celle d’une application linéaire de R dans Rp revient à la donnée d’un
élément de Rp . On notera aussi que L est l’application nulle si et seulement
si tous les cj sont nuls.
Exemple. Pour chaque 1 ≤ k ≤ n, l’application pk : x 2→ xk (projection sur
la ke composante) est une application linéaire de Rn dans R.
Le résultat suivant est la clef de l’étude des propriétés de continuité d’une
application linéaire.
Proposition. Soit k = 1, 2 ou ∞ et L une application linéaire de Rn dans
Rp . Pour tout x ∈ Rn et (i, j) = (1, ∞), (2, 2) ou (∞, 1), on a
|L(x)|k ≤ |L|k,i|x|j ,
# #
où |L|k,i = #(|L(e1 )|k , . . . , |L(en)|k )#i .
Démonstration. On a, pour chaque x ∈ Rn , en utilisant (2.6),
n
$ n
$
|L(x)|k ≤ |xj L(ej )|k = |xj ||L(ej )|k
j=1 j=1

et dès lors,
 
n
$
|L(x)|k ≤  |L(e )|k  max{|x1 |, . . . , |xn|} = |L|k,1 |x|∞ ,
j

j=1
n
$
|L(x)|k ≤ max{|L(e1 )|k , . . . , |L(en)|k } |xj | = |L|k,∞ |x|1 ,
j=1
et, en utilisant l’inégalité de Cauchy,
 1/2  1/2
n
$ n
$
|L(x)|k ≤  |L(ej )|2k   x2j  = |L|k,2 |x|2 .
j=1 j=1
74 CHAPITRE 2. LIMITES ET CONTINUITÉ

Corollaire. Si L est une application linéaire de Rn dans Rp, alors, pour


chaque i = 1, 2 ou ∞ et pour tout x ∈ Rn et tout y ∈ Rn , on a

|L(x) − L(y)|i ≤ |L|i,j |x − y|i , (2.8)

et en particulier L est continue en chaque point de Rn et les fonctions x 2→


L(x)
|x|i sont localement bornées en 0.
Démonstration. Le cas de l’application nulle est évident. Sinon, soit
i = 1, 2 ou ∞, x ∈ Rn et y ∈ Rn ; par la proposition précédente et la
linéarité de L, on a

|L(x) − L(y)|i = |L(x − y)|i ≤ |L|i,j |x − y|i ,

et la continuité en y s’en déduit aussitôt en prenant,


# # dans la définition, si
# L(x) #
! > 0 est donné, δ = |L|i,i . Enfin, si x /= 0, on a # |x|i # ≤ |L|i,i, ce qui montre
!
i
que la fonction x 2→ L(x)
|x|i est localement bornée en 0 (elle l’est évidemment
aux autres points puisqu’elle y est continue).
Terminons par quelques remarques sur les applications linéaires de C
dans C. Rappelons que C peut être considéré comme un espace vectoriel sur
R (c’est alors essentiellement R2 ) et comme un espace vectoriel sur C. Dès
lors, nous dirons qu’une application L de C dans C est R-linéaire (resp. C-
linéaire) si elle est linéaire comme application de C dans C où C est considéré
comme espace vectoriel sur R (resp. C.) Ainsi donc, L sera R-linéaire si et
seulement si, pour tout x ∈ C, tout y ∈ C et tout c ∈ R, on a

L(x + y) = L(x) + L(y), L(cx) = cL(x),

et L sera C-linéaire si et seulement si, pour tout x ∈ C, tout y ∈ C et tout


c ∈ C, on a
L(x + y) = L(x) + L(y), L(cx) = cL(x).
Comme R est canoniquement injecté dans C, on en déduit aussitôt que
toute application C-linéaire de C dans C est R-linéaire. La réciproque n’est
pas vraie. En effet, l’application de conjugaison C : C → C, z 2→ z̄ est
évidemment R-linéaire puisque, pour chaque z ∈ C et chaque v ∈ C, on a

C(z + v) = z + v = z̄ + v̄ = C(z) + C(v),

et, pour chaque c ∈ R et chaque z ∈ C, on a

C(cz) = cz = cz̄ = cC(z).


2.10. EXERCICES 75

Mais elle n’est pas C-linéaire puisque

C(i.1) = C(i) = ī = −i /= i.1.

En fait, si L est C-linéaire, alors, pour tout z = x1 + ix2 ∈ C, on a

L(z) = L(z.1) = z.L(1) = x1 L(1) + x2 (iL(1)) = x1 L(e1 ) + x2 L(e2 ),

ce qui montre que les coefficients L(ej ) de L vérifient la relation

L(e2 ) = iL(e1 ),

ou encore, en posant L(ej ) = L1 (ej ) + iL2 (ej ), si et seulement si les coeffi-


cients Lk (ej ) vérifient les relations

L2 (e2 ) = L1 (e1 ), L1 (e2 ) = −L2 (e1 ).

En d’autres termes, la matrice représentant L dans la base canonique doit


avoir ses éléments diagonaux égaux et ses éléments hors diagonale opposés.
On montre facilement que si une application R-linéaire de C dans C vérifie
ces conditions, elle est également C-linéaire.

2.10 Exercices
1. Pour chaque nombre rationnel x, il existe un et un seul couple d’entiers
(m, n) tels que n > 0, m et n soient premiers entre eux et x = m n (représen-
tation irréductible de x). Si l’on définit l’application f de R dans R par
f (x) = n si x est rationnel de représentation irréductible m
n , et f (x) = 0 si
x est irrationnel, montrer que f n’est localement bornée en aucun point de
R. (Raisonner par l’absurde).
2. On définit la suite de Fibonacci (uk )k∈N par u0 = u1 = 1 et

uk+2 = uk+1 + uk ,

pour k ≥ 0. Ainsi, u2 = 2, u3 = 3, u4 = 5, u5 = 8, . . . . On définit la suite


u
(vk )k∈N par vk = uk+1k
. Montrer que, pour tout k ≥ 1, on a vk > 1 et que,
pour tout k ≥ 0, on a
1
vk+1 = 1 + .
vk
En déduire que, si la suite (vk )k∈N converge vers v ∗ , alors v ∗ est la racine
positive de l’équation algébrique

v 2 − v − 1 = 0,
76 CHAPITRE 2. LIMITES ET CONTINUITÉ

c’est-à-dire √
∗ 1+ 5
v = = 1, 618 . . ..
2
Cette quantité est appelée le nombre d’or. Montrer que, pour tout k ≥ 1,
on a
|vk − v ∗ |
|vk+1 − v ∗ | ≤ ,
v∗
et dès lors
|v1 − v ∗ |
|vk+1 − v ∗ | ≤ .
(v ∗ )k
En déduire que (vk )k∈N converge vers v ∗ .
3. Si p ≥ 1 est un réel et si x ∈ Rn , on définit |x|p par
 1/p
p
$
|x|p =  |xj |p .
j=1

Montrer que
|x|∞ = lim |x|p,
p→∞

ce qui “justifie” la notation utilisée pour la norme |x|∞ . Pour ce faire, on


utilisera les inégalités suivantes, qui sont faciles à démontrer

|x|p ≤ n1/p |x|∞, |x|∞ ≤ |x|p.

4. Si d est la fonction de Dirichlet, montrer que, pour chaque a ∈ R, on a

lim d(x) = 1, lim d(x) = 0.


x→a; x∈Q x→a; x∈R\Q

En déduire que d n’est pas continue en a.


5. Soit f l’application de R dans R définie par f (x) = x si x est rationnel
et f (x) = −x si x est irrationnel. Montrer que f est continue en a si et
seulement si a = 0. La fonction f n’est donc continue qu’à l’origine. Par
contre, on a, pour tout x ∈ R, (f ◦ f )(x) = x, qui est continue en chaque
point de R.
6. Si l’on définit l’application g de R dans R par g(x) = n1 si x est rationnel de
représentation irréductible m n , et g(x) = 0 si x est irrationnel, montrer que
g est continue en chaque point irrationnel et discontinue en chaque point
rationnel. En utilisant le théorème de Baire démontré au chapitre 17, on
peut prouver qu’il n’existe pas de fonction de R dans R qui est discontinue
en chaque point irrationnel et continue en chaque point rationnel.
2.11. PETITE ANTHOLOGIE 77

7. Soit f l’application de R2 dans R définie par f (0, 0) = 0 et


xy
f (x, y) = si (x, y) /= (0, 0).
x2 + y2

Montrer que cette fonction n’est pas continue en (0, 0) mais que les fonctions
x 2→ f (x, 0) et y 2→ f (0, y) sont continues en 0.
8. Soit (ak )k∈N∗ une suite dans Rp. Montrer que si limk→∞ ak = a, alors
%n
k=1 ak
lim = a.
n→∞ n
Suggestion. Soit ! > 0; il existe m$ ∈ N∗ tel que, pour tout k ≥ m$ , on a
|ak − a|2 ≤ 2! . Si n ≥ m$ , alors
# %n # # # %m" −1 %n
# k=1 ak # #$n
ak − a ##
# k=1 |ak − a|2 " |ak − a|2
#
# − a# = #
# # ≤ + k=m
n 2 # n # n n
k=1 2

%m" −1 %m" −1
|ak − a|2 n − m$ + 1 ! |ak − a|2 !
≤ k=1
+ ≤ k=1
+ .
n n 2 n 2
%m" −1
|ak −a|2
Prendre alors m ≥ m tel que k=1 n
$
≤ 2! lorsque n ≥ m. La récipro-
que est fausse, comme le montre l’exemple de ak = (−1)k .

2.11 Petite anthologie


Limites

On dit qu’une grandeur est la limite d’une autre grandeur, quand la se-
conde peut approcher de la première plus près que d’une grandeur donnée,
si petite qu’on la puisse supposer, sans pourtant que la grandeur, qui ap-
proche, puisse jamais surpasser la grandeur dont elle approche; en sorte que
la différence d’une pareille quantité à sa limite est absolument inassignable.

Jean le Rond d’Alembert, 1752

Si une quantité variable susceptible de limite, jouit d’une certaine pro-


priété, sa limite jouit de la même propriété.

Simon Lhuilier, 1786


78 CHAPITRE 2. LIMITES ET CONTINUITÉ

Quand les valeurs successivement attribuées à une variable s’approchent


indéfiniment d’une valeur fixée, de manière à finir par en différer aussi peu
que l’on voudra, cette dernière est appelée la limite de toutes les autres.
Lorsque les valeurs numériques successives d’une même variable décroissent
indéfiniment, de manière à s’abaisser au-dessous de tout nombre donné, cette
variable devient ce qu’on nomme un infiniment petit ou une quantité infini-
ment petite.

Augustin Cauchy, 1821

Limites infinies

Lorsque les valeurs numériques successives d’une même variable croissent


de plus en plus, de manière à s’élever au-dessus de tout nombre donné, on
dit que cette variable a pour limite l’infini positif, indiqué par le signe ∞, s’il
s’agit d’une variable positive, et l’infini négatif, indiqué par la notation −∞,
s’il s’agit d’une variable négative. Les infinis positif et négatif sont désignés
conjointement sous le nom de quantités infinies.

Augustin Cauchy, 1821

Je proteste contre l’usage de la grandeur infinie comme quelque chose


d’achevé, ce qui n’est jamais admissible en mathématiques. L’infini est pure-
ment une manière de parler; son vrai sens est une limite de laquelle certains
rapports s’approchent indéfiniment, tandis que d’autres peuvent croı̂tre sans
restriction.

Carl-Friedrichs Gauss, 1831

Continuité

Les fonctions continues sont celles dont la nature est définie par une
relation précise entre les coordonnées exprimée par une équation; en sorte
que tous ses points soient déterminés par une même équation, comme par
une loi.

Leonhard Euler, 1767

La loi de continuité consiste en ce qu’une quantité ne peut pas passer


d’un état à un autre sans passer par tous les états intermédiaires qui sont
sujets à la même loi. Les fonctions algébriques sont considérées comme
continues parce que les différentes valeurs de ces fonctions dépendent de
2.11. PETITE ANTHOLOGIE 79

la même manière de celles de la variable; et supposant que la variable croı̂t


continûment, la fonction recevra des variations correspondantes; mais elle ne
passera pas d’une valeur à une autre sans passer aussi par toutes les valeurs
intermédiaires. La continuité peut être détruite de deux manières : (1) La
fonction peut changer de forme, c’est-à-dire la loi par laquelle la fonction
dépend de la variable peut changer tout d’un coup. (2) La loi de continuité
est aussi brisée quand les différentes parties d’une courbe ne tiennent pas les
unes aux autres.

Louis François Arbogast, 1791

En considérant la courbe dont i serait l’abscisse et l’une de ces fonc-


tions l’ordonnée, cette courbe coupera l’axe à l’origine des abscisses et ...
le cours de la courbe sera nécessairement continu depuis ce point; donc
elle s’approchera peu à peu de l’axe avant de le couper et s’en approchera,
par conséquent, d’une quantité moindre qu’aucune quantité donnée, de sorte
qu’on pourra toujours trouver une abscisse i correspondant à une ordonnée
moindre qu’une quantité donnée, et alors toute valeur plus petite de i répon-
dra aussi à des ordonnées moindres que la quantité donnée.

Joseph-Louis Lagrange, 1797

Une fonction f (x) qui varie selon la loi de continuité pour toutes les
valeurs de x situées à l’intérieur ou à l’extérieur de certaines limites n’est
rien d’autre que ce qui suit : si x est l’une quelconque de ces valeurs, la
différence f (x + w) − f (x) peut être rendue plus petite que n’importe quelle
quantité donnée si on fait w aussi petit qu’on le désire.

Bernard Bolzano, 1817

La fonction f (x) sera, entre les deux limites assignées à la variable x,


fonction continue de cette variable, si, pour chaque valeur de x intermédiaire
entre ces limites, la valeur numérique de la différence f (x + α) − f (x) décroı̂t
indéfiniment avec celle de α. En d’autres termes, la fonction f(x) restera con-
tinue par rapport à x entre les limites données, si, entre ces limites, un ac-
croissement infiniment petit de la variable produit toujours un accroissement
infiniment petit de la fonction elle-même.

Augustin Cauchy, 1821

S’il est possible de déterminer une borne δ telle que pour toute valeur de
h, plus petite en valeur absolue que δ, f (x + h) − f (x) soit plus petite qu’une
80 CHAPITRE 2. LIMITES ET CONTINUITÉ

quantité ! aussi petite que l’on veut, alors on dira qu’on a fait correspondre à
une variation infiniment petite de la variable une variation infiniment petite
de la fonction.

Karl Weierstrass, 1861


Chapitre 3

Dérivabilité

3.1 Fonctions d’une variable réelle


Soit f une fonction de R dans Rp et a ∈ dom f . Des questions de géométrie
et de mécanique (vitesse moyenne) suggèrent l’introduction de la fonction
suivante.
Définition. Le taux de variation de f en a ou l’accroissement relatif de f
en a ou le quotient différentiel de f en a est la fonction de R dans Rp de
domaine dom f \ {a} définie par

f (x) − f (a)
∆af (x) = .
x−a
On remarquera que cette fonction ∆a f ne peut pas être définie pour une
fonction f de Rn dans Rp lorsque n > 1, puisqu’il n’existe pas de division
d’un élément de Rp par un élément de Rn .
La notion géométrique de tangente à une courbe et la notion mécanique
de vitesse instantanée conduisent alors à la notion suivante.
Définition. On dit que la fonction f de R dans Rp est dérivable au point
a ∈ dom f si la limite

f (x) − f (a)
lim ∆a f (x) ≡ lim (3.1)
x→a x→a x−a
df
existe. Dans ce cas, cette limite est notée f $ (a), Df (a) ou dx (a) et appelée le
vecteur dérivé de f en a (nombre dérivé si p = 1), ou encore, plus simplement,
la dérivée de f en a.

81
82 CHAPITRE 3. DÉRIVABILITÉ

Rappelons que l’existence de (3.1) impose que a ∈ adh (dom f \ {a}),


c’est-à-dire que a ne soit pas un point isolé de dom f.
Remarques. 1. Si nous posons

dom f − a = {h ∈ R : a + h ∈ dom f },

alors, en posant x = a + h dans la définition de (3.1) exprimée en termes d’!


et δ
# #
# f (x) − f (a) #
(∀! > 0)(∃δ > 0)(∀x ∈ dom f \{a} : |x−a| ≤ δ) : #
# − f (a)## ≤ !,
$
x−a 2

nous voyons immédiatement que la dérivabilité de f en a équivaut à la con-


dition
(∀! > 0)(∃δ > 0)(∀h ∈ (dom f − a) \ {0} : |h| ≤ δ) :
# #
# f (a + h) − f (a) $
#
#
# − f (a) # ≤ !.
#
h 2
2. En ajoutant dans (3.1) la contrainte “x < a” (resp. “x > a”), on définit
le concept de dérivabilité à gauche (resp. à droite) de f au point a, et les
propriétés de la limite impliquent aussitôt que si f est dérivable à gauche et
à droite en a et que ses dérivées à gauche et à droite sont égales, alors f est
dérivable en a.
Exemples. 1. Toute application constante de R dans Rp est dérivable en
chaque point de R et sa dérivée y est nulle.
2. Toute application linéaire f : R → Rp , x 2→ xc, où c ∈ Rp , est dérivable
en chaque point a ∈ R, et f $ (a) = c.
3. Pour chaque n ≥ 2, l’application de R dans R définie par f (x) = xn est
telle que, pour chaque a ∈ R, on a
xn − an
lim = lim (xn−1 + xn−2 a + . . . + xan−2 + an−1 ) = nan−1 ,
x→a x − a x→a, x(=a

ce qui montre que f est dérivable en a et f $ (a) = nan−1 .


4. Considérons maintenant l’application valeur absolue de R dans R. Si
a > 0, alors, pour tout x appartenant au voisinage U = [ a2 , 3a
2 ] de a, on a
|x| = x et dès lors, par le caractère local de la limite,
|x| − |a| |x| − |a| x−a
lim = lim = lim = 1,
x→a x−a x→a, x∈U x−a x→a, x∈U x−a
ce qui montre que l’application valeur absolue est dérivable en a > 0 et y
a pour dérivée 1. On montre de même que l’application valeur absolue est
3.1. FONCTIONS D’UNE VARIABLE RÉELLE 83

dérivable en chaque a < 0 et y a pour dérivée −1. Par contre, l’application


valeur absolue n’est pas dérivable en 0, puisque
|x| −x
lim = lim = −1,
x→0− x x→0− x

et
|x| x
lim = lim = 1.
x→0+ x x→0+ x

La dérivabilité en un point d’une fonction d’une variable réelle à valeurs


dans Rp se ramène à celle de ses p fonctions composantes.
Proposition. Si f est une fonction de R dans Rp et a ∈ dom f , alors f
est dérivable en a si et seulement si, pour chaque 1 ≤ k ≤ p, les fonctions
composantes fk sont dérivables en a, auquel cas l’on a

f $ (a) = ((f1 )$ (a), . . ., (fp)$ (a)),

c’est-à-dire (f $ (a))k = (fk )$ (a), (1 ≤ k ≤ p).


Démonstration. Comme, pour chaque 1 ≤ k ≤ p, fk = pk ◦ f et que pk
est linéaire, on a, pour tout a ∈ dom f et tout x ∈ dom f \ {a},
(pk ◦ f )(x) − (pk ◦ f )(a) fk (x) − fk (a)
(pk ◦ ∆a f )(x) = = = ∆afk (x).(3.2)
x−a x−a
Par ailleurs, en vertu des propriétés des limites,

lim ∆a f (x) = b ⇔ lim (pk ◦ ∆af )(x) = bk , (1 ≤ k ≤ p),


x→a x→a

et la thèse se déduit aussitôt de ce résultat et de (3.2).


Introduisons maintenant une formulation équivalente de la notion de
dérivabilité qui constitue une étape importante vers la généralisation de cette
notion aux fonctions de plusieurs variables.
Proposition. Soit f une fonction de R dans Rp et a ∈ dom f . Alors f est
dérivable en a si et seulement s’il existe b ∈ Rp et une fonction r de R dans
Rp définie au moins sur (dom f − a) \ {0} tels que

lim r(h) = 0,
h→0

et, tels que, pour tout h ∈ (dom f − a) \ {0}, on ait

f (a + h) = f (a) + hb + |h|r(h). (3.3)


84 CHAPITRE 3. DÉRIVABILITÉ

S’il en est ainsi, b = f $ (a).


Démonstration. Condition nécessaire. Si f est dérivable en a, alors, en
prenant b = f $ (a), on a

f (a + h) − f (a)
lim = b,
h→0 h
c’est-à-dire
f (a + h) − f (a) − hb
lim = 0.
h→0 h
Dès lors si l’on pose

f (a + h) − f (a) − hb
r(h) = ,
|h|

on voit que dom r = (dom f − a) \ {0}, (3.3) est satisfaite, et


2 3
h f (a + h) − f (a) − hb
lim r(h) = lim . = 0,
h→0 h→0 |h| h

puisque la fonction h 2→ h/|h| est localement bornée en 0.


Condition suffisante. Si f vérifie (3.3), alors, pour tout h ∈ (dom f −a)\{0},
on a
f (a + h) − f (a) |h|
=b+ r(h),
h h
et dès lors
f (a + h) − f (a)
lim = b,
h→0 h
ce qui montre que la limite (3.1) existe et est égale à b.
Remarque. La caractérisation que nous venons d’obtenir peut évidemment
s’énoncer sous la forme équivalente de l’existence d’un b ∈ Rp tel que

f (a + h) − f (a) − hb
lim = 0,
h→0 |h|

ou encore tel que


f (x) − f (a) − (x − a)b
lim = 0.
x→a |x − a|
Quant à (3.3), elle peut bien sûr également s’écrire

f (x) = f (a) + (x − a)b + |x − a|r(x − a),


3.2. FONCTIONS DE PLUSIEURS VARIABLES RÉELLES 85

pour tout x ∈ dom f \ {a}.


La condition (3.3) peut être interprétée comme suit : une fonction f est
dérivable en a ∈ dom f si et seulement si f (a + h) peut être approchée pour
|h| suffisamment petit par une fonction affine g : h 2→ f (a) + hb, en ce sens
que l’erreur commise f (a+h)−g(h) est de la forme |h|r(h) avec r(h) tendant
vers 0 si h tend vers 0, c’est-à-dire tend vers zéro plus rapidement que |h|
lorsque |h| → 0.
En résumé, la dérivabilité en un point d’une fonction de R dans Rp peut
se concevoir comme l’existence d’un taux de variation “instantané” de la
fonction en ce point, ou comme la possibilité d’approcher cette fonction,
au voisinage de ce point, par une fonction affine. Géométriquement, parmi
toutes les droites de R × Rp passant par (a, f (a)), le graphe de g constitue la
meilleure approximation de celui de f au voisinage de (a, f (a)). On pourra
visualiser la situation lorsque p = 1 et p = 2.

3.2 Fonctions de plusieurs variables réelles


Si l’on rappelle que toute application linéaire de R dans Rp est de la forme
x 2→ xb pour un certain b ∈ Rp, on voit que la caractérisation de la notion de
dérivabilité en a ∈ dom f d’une fonction f de R dans Rp revient à demander
l’existence d’une application linéaire L de R dans Rp et d’une fonction r de
R dans Rp définie au moins sur (dom f − a) \ {0}, telle que limh→0 r(h) = 0
et telle que, pour tout h ∈ (dom f − a) \ {0}, on ait

f (a + h) = f (a) + L(h) + |h|r(h).

Les deux membres de cette égalité gardent un sens pour une fonction f
de Rn dans Rp à condition de prendre pour L une application linéaire de Rn
dans Rp , pour r une fonction de Rn dans Rp et de remplacer |h| par |h|2 .
Nous sommes ainsi conduits à la définition suivante.
Définition. Soit f une fonction de Rn dans Rp et a ∈ dom f . On dit que f
est dérivable (ou différentiable) au point a s’il existe une application linéaire
L de Rn dans Rp et une fonction r de Rn dans Rp définie au moins sur
(dom f − a) \ {0}, telles que

lim r(h) = 0
h→0

et telles que, pour tout h ∈ (dom f − a) \ {0}, on ait

f (a + h) = f (a) + L(h) + |h|2 r(h), (3.4)


86 CHAPITRE 3. DÉRIVABILITÉ

ou encore, d’une manière équivalente,

f (x) = f (a) + L(x − a) + |x − a|2 r(x − a), (3.5)

pour tout x ∈ dom f \ {a}.


Dans cette définition, on a posé, par analogie avec le cas n = 1,

dom f − a = {h ∈ Rn : a + h ∈ dom f }.

Remarques. 1. La condition limh→0 r(h) = 0 implique évidemment que 0


ne soit pas isolé dans (dom f − a), c’est-à-dire que a ne soit pas isolé dans
dom f.
2. Si j = 1, 2 ou ∞, les inégalités entre les différentes normes entraı̂nent que
les relations (3.4) et (3.5) sont évidemment équivalentes respectivement à

f (a + h) = f (a) + L(h) + |h|j rj (h),

et
f (x) = f (a) + L(x − a) + |x − a|j rj (x − a),

pour une certaine function rj de Rn dans Rp définie au moins sur (dom f −


a) \ {a} et telle que limh→0 rj (h) = 0. En particulier, la définition ne dépend
pas du choix de la norme | · |2 .
3. La caractérisation de la dérivabilité d’une fonction de R dans Rp donnée
dans la section précédente et la structure générale des applications linéaires
de R dans Rp entraı̂nent évidemment que la définition de dérivabilité que
nous venons de donner dans le cas général d’une fonction de Rn dans Rp est
compatible avec celle donnée pour n = 1.
4. En vertu de la propriété correspondante pour la limite, la dérivabilité de f
en a est une notion locale, c’est-à-dire qu’elle ne dépend que de la restriction
de f à un voisinage arbitraire de a.
Comme pour n = 1, et avec une démonstration semblable, on a la car-
actérisation suivante de la dérivabilité de f en a.
Proposition. Soit f une fonction de Rn dans Rp et a ∈ dom f . Alors f
est dérivable en a si et seulement s’il existe une application linéaire L de Rn
dans Rp telle que

f (a + h) − f (a) − L(h)
lim = 0,
h→0 |h|2
3.2. FONCTIONS DE PLUSIEURS VARIABLES RÉELLES 87

c’est-à-dire telle que

f (x) − f (a) − L(x − a)


lim = 0.
x→a |x − a|2

Exemples. 1. Toute application constante de Rn dans Rp est dérivable en


chaque point a ∈ Rn . Il suffit de prendre L = 0 et r = 0 dans la définition.
2. Toute application linéaire f de Rn dans Rp est dérivable en chaque point
a ∈ Rn . Comme, par linéarité, on a, pour tout h ∈ Rn , f (a+h) = f (a)+f (h),
il suffit de prendre L = f et r = 0 dans la définition.
3. Soit f : R2 → R, (x1, x2 ) 2→ x21 + x2 . Si a = (a1 , a2 ) ∈ R2 et h = (h1 , h2 ) ∈
R2 , on a
f (a + h) = (a1 + h1 )2 + (a2 + h2 ) =
a21 + a2 + 2a1 h1 + h2 + h21 = f (a) + L(h) + |h|2 r(h),
si l’on définit l’application linéaire L : R2 → R par L(h) = 2a1 h1 + h2 et
h21
la fonction r de R2 dans R par r(h) = |h|2 . On voit que dom r = R2 \ {0}.
Comme, pour tout h /= 0, on a

h21 + h22
|r(h)| ≤ = |h|2 ,
|h|2

on voit que limh→0 r(h) = 0 et f est dérivable en chaque point a ∈ R2 .


Lorsque n ≥ 2, il peut exister plus d’une application linéaire L vérifiant
les conditions de la définition de dérivabilité. Pour le voir, soit f la fonction
de R2 dans R définie par f (x1 , x2 ) = x1 (x21 − |x2 |)1/2. On a

dom f = {(x1 , x2 ) ∈ R2 : |x2 | ≤ x21 }.

Si c ∈ R, si l’on considère l’application linéaire

Lc : R2 → R, (h1 , h2 ) 2→ ch2 ,

et si l’on définit la fonction rc de R2 dans R par

h1 8 2 91/2 h2
rc (h1 , h2 ) = h1 − |h2 | −c ,
|h|2 |h|2

on a, pour chaque (h1 , h2 ) ∈ dom f \ {(0, 0)},

f (h1 , h2 ) = f (0, 0) + Lc (h1 , h2 ) + |h|2 rc (h1 , h2 ).


88 CHAPITRE 3. DÉRIVABILITÉ

Comme, pour tout (h1 , h2 ) ∈ dom f, on a


# # 2
# h2 #
#c # ≤ |c| |h1| ≤ |c||h|2,
# |h| # |h|2
2

on voit que limh→0 rc (h) = 0 et donc que, pour chaque c ∈ R, l’application


linéaire Lc vérifie la définition de la dérivabilité de f en 0.
Un dessin convaincra aisément le lecteur de la forme particulière du do-
maine de f dans l’exemple ci-dessus. On retrouve l’unicité en faisant des
hypothèses plus fortes sur les relations entre a et dom f .
Proposition. Soit f une fonction de Rn dans Rp . Si a ∈ int dom f, il existe
au plus une application linéaire L vérifiant les conditions de la définition de
dérivabilité de f en a.
Démonstration. Supposons qu’il existe deux applications linéaires L et
M de Rn dans Rp vérifiant les conditions de la définition de dérivabilité de
f en a. Alors, il existera deux fonctions r et s de Rn dans Rp définies au
moins sur (dom f − a) \ {0} et telles que, pour chaque h ∈ (dom f − a) \ {0},
on ait

f (a) + L(h) + |h|2 r(h) = f (a + h) = f (a) + M (h) + |h|2 s(h).

En conséquence, on a, pour chaque h ∈ (dom f − a) \ {0},

(L − M )(h) = |h|2 [s(h) − r(h)].

Soit ρ > 0 tel que B2 [a; ρ] ⊂ dom f. Comme B2 [ρ] ⊂ dom f − a, on aura,
pour chaque 1 ≤ k ≤ n, et chaque t ∈ ]0, ρ],

t(L − M )(ek ) = (L − M )(tek ) = |t|[s(tek ) − r(tek )] = t[s(tek ) − r(tek )],

et dès lors
(L − M )(ek ) = [s(tek ) − r(tek )].
En faisant tendre t vers 0 dans cette égalité, et en utilisant les propriétés de
r et s et le théorème sur la limite d’une fonction composée, on obtient, pour
chaque 1 ≤ k ≤ n,
(L − M )(ek ) = 0,
et dès lors L = M , puisqu’une application linéaire de Rn dans Rp est nulle
si et seulement si elle s’annulle sur chaque élément de la base canonique de
Rn .
3.2. FONCTIONS DE PLUSIEURS VARIABLES RÉELLES 89

Définition. Si f est une fonction de Rn dans Rp dérivable en a ∈ int dom f


si n ≥ 2 et en a ∈ dom f si n = 1, l’unique application linéaire L de Rn dans
Rp vérifiant les conditions de la définition est appelée la dérivée totale ou la
différentielle de f au point a et notée fa$ ou dfa .
fa$ est donc, dans ce cas, l’unique application linéaire de Rn dans Rp telle
que l’on puisse écrire, pour chaque h ∈ (dom f − a) \ {0},

f (a + h) = f (a) + fa$ (h) + |h|2 r(h),

avec r une fonction de Rn dans Rp définie au moins sur (dom f − a) \ {0}


et telle que limh→0 r(h) = 0, ou encore l’unique application linéaire de Rn
dans Rp telle que l’on ait

f (a + h) − f (a) − fa$ (h)


lim = 0.
h→0 |h|2

Lorsque n = 1 et que f est dérivable en a au sens de la première section


de de chapitre, il existe un élément unique f $ (a) ∈ Rp tel que, pour chaque
h ∈ (dom f − a) \ {0}, on ait

f (a + h) = f (a) + hf $ (a) + |h|r(h).

Dès lors, on a nécessairement, pour chaque h ∈ R,

fa$ (h) = hf $ (a),

et en particulier
f $ (a) = fa$ (1).
La connaissance de la dérivée f $ (a) de f en a entraı̂ne donc, pour n = 1, la
connaissance de sa dérivée totale fa$ , et réciproquement.
Géométriquement, lorsque n ≥ 2 et que f est une fonction de Rn dans
R dérivable en a ∈ int dom f, le graphe de la fonction affine h 2→ f (a) +
fa$ (h) est le plan de Rn × R passant par (a, f (a)) qui fournit la meilleure
approximation du graphe de f au voisinage de (a, f (a)). On l’appelle le plan
tangent au graphe de f en (a, f (a)). On pourra visualiser la situation lorsque
n = 2.
La dérivabilité de f en a entraı̂ne sa continuité en ce point.
Proposition. Soit f une fonction de Rn dans Rp et a ∈ dom f . Si f est
dérivable en a, alors, pour chaque j = 1, 2 ou ∞, la fonction g de Rn dans Rp
90 CHAPITRE 3. DÉRIVABILITÉ

f (a+h)−f (a)
définie par g(h) = |h|j est localement bornée en 0 et f est continue
en a.
Démonstration. Soit j = 1, 2 ou ∞. Par hypothèse, il existe une appli-
cation linéaire L de Rn dans Rp et une fonction r de Rn dans Rp définie au
moins sur (dom f − a) \ {0} telle que limh→0 r(h) = 0 et
f (a + h) = f (a) + L(h) + |h|2 r(h)
pour chaque h ∈ (dom f − a) \ {0}. En conséquence, pour ces mêmes h, on
a
& '
f (a + h) − f (a) L(h) + |h|2 r(h) h |h|2
g(h) = = =L + r(h).
|h|j |h|j |h|j |h|j
On sait que le premier terme est une fonction localement bornée en 0 et, en
utilisant les inégalités entre normes, on voit aisément que le deuxième terme
est le produit par r d’une fonction localement bornée en 0; il tend donc vers
0 lorsque h tend vers 0, et est donc également localement borné en 0. Enfin,
pour tout x ∈ dom f \ {a}, on a
f (x) = f (a) + L(x − a) + |x − a|2 r(x − a),
et dès lors
lim f (x) = f (a),
x→a, x(=a

ce qui équivaut à la continuité de f en a, puisque a est non isolé dans dom f .

Remarque. La réciproque de cette proposition est fausse : une fonction


peut être continue en un point sans y être dérivable. Ainsi, l’application
valeur absolue de R dans R est continue en 0 et n’y est pas dérivable. Comme
on le verra plus loin, il existe même des fonctions de R dans R continues en
chaque point de R qui ne sont dérivables en aucun point de R !

3.3 Dérivées directionnelles et dérivées partielles


La définition de dérivabilité d’une fonction de Rn dans Rp requiert la dé-
termination de l’application linéaire L intervenant dans la définition. Cette
détermination est facilitée par l’introduction des dérivées d’une fonction de
Rn dans Rp dans une direction fixée. On appellera direction dans Rn tout
élément u ∈ Rn tel que |u|2 = 1. Un tel élément fixe en effet la direction de
la droite qui le joint à l’origine.
3.3. DÉRIVÉES DIRECTIONNELLES ET DÉRIVÉES PARTIELLES 91

Définition. Soit f une fonction de Rn dans Rp , a ∈ dom f et u ∈ Rn tel


que |u|2 = 1. On dit que f est dérivable au point a dans la direction u si la
fonction de R dans Rp t 2→ f (a + tu) est dérivable en 0, c’est-à-dire si
f (a + tu) − f (a)
lim (3.6)
t→0 t
existe. Dans ce cas, cette limite est notée f $ (a; u) ou Du f (a) et appelée la
dérivée de f au point a dans la direction u. Dans le cas particulier où u = ek
pour un certain 1 ≤ k ≤ n, f $ (a; ek ) est appelée la dérivée partielle de f en
a par rapport à la ke -composante (brièvement par rapport à xk ) et notée
∂f
Dk f (a) ou Dxk f (a) ou ∂x k
(a) ou ∂k f (a).
Notons que l’existence de la limite (3.6) requiert que a soit adhérent à
l’ensemble
{x ∈ dom f \ {a} : x = a + tu, t ∈ R}.
Si a ∈ int dom f, ce sera évidemment le cas, pour n’importe quel u ∈ Rn tel
que |u|2 = 1. Notons aussi que, si l’on introduit l’application affine g : R →
Rn , t 2→ a + tu, la dérivabilité de f en a dans la direction u équivaut à la
dérivabilité en 0 de la fonction de R dans Rp f ◦ g, auquel cas

f $ (a; u) = (f ◦ g)$(0).

D’autre part, lorsque n = 1, on a u = 1 ou u = −1 et l’on voit tout de suite


que l’existence de f $ (a; 1) et f $ (a; −1) équivalent toutes deux à la dérivabilité
(ordinaire) de f en a, avec les relations f $ (a; 1) = −f $ (a; −1) = f $ (a).
Remarquons enfin que, dans le cas de la dérivée partielle par rapport à
xk , on a, explicitement, par (3.6),
f (a1 , . . ., ak−1 , ak + t, ak+1 , . . . , an ) − f (a1 , . . ., an )
Dk f (a) = lim ,
t→0 t
ou encore, d’une manière équivalente,
f (a1 , . . . , ak−1, xk , ak+1 , . . . , an ) − f (a1 , . . ., an )
Dk f (a) = lim .
xk →ak xk − ak
L’existence et le calcul de Dk f (a) revient donc à la dérivabilité et au calcul
de la dérivée de la fonction de R dans Rp

xk 2→ f (a1 , . . . , ak−1 , xk , ak+1 , . . ., an ).

Il suffit donc de “geler” à leur valeur aj les composantes xj telles que j /= k


et de considérer la seule dépendance en xk .
92 CHAPITRE 3. DÉRIVABILITÉ

Notons que, contrairement à la notion de dérivabilité introduite dans la


section précédente, la dérivabilité d’une fonction en un point dans toutes
les directions n’entraı̂ne pas la continuité de la fonction en ce point. Par
exemple, si f est la fonction de R2 dans R définie par
x1 x22
f (x) = si x /= 0
x21 + x42
et f (0) = 0, on voit que, pour chaque u = (u1 , u2 ) tel que |u|2 = 1, on a,
pour chaque réel t /= 0,
f (tu) − f (0) f (tu) u1 u22
= = 2 ,
t t u1 + t2 u42
et dès lors
f (tu) − f (0) u2
lim = 2 si u1 /= 0,
t→0 t u1
et
f (tu) − f (0)
lim = 0 si u1 = 0.
t→0 t
En conséquence, f $ (0; u) existe pour toute direction u de R2 . D’autre part,
pour tout réel h /= 0, on a
h4 1
f (h2 , h) = = ,
h4 + h4 2
ce qui montre que |f (h2 , h) − f (0, 0)| = 12 quel que soit h /= 0 et dès lors f
n’est pas continue en 0 puisque limx→0 f n’est pas égale à f (0).
Nous allons voir maintenant qu’en un point intérieur au domaine d’une
fonction de Rn dans Rp, l’existence de la dérivée totale entraı̂ne celle de
la dérivée dans n’importe quelle direction (et en particulier des n dérivées
partielles) et que la dérivée totale peut s’exprimer en termes des dérivées
directionnelles ou des dérivées partielles.
Proposition. Soit f une fonction de Rn dans Rp, a ∈ int dom f . Si f est
dérivable en a, alors, pour chaque u ∈ Rn tel que |u|2 = 1, f est dérivable
en a dans la direction u et l’on a
f $ (a; u) = fa$ (u).
En particulier, pour chaque 1 ≤ k ≤ n, f possède une dérivée partielle
Dk f (a) en a par rapport à xk et, pour tout h ∈ Rn , on a
n
$
fa$ (h) = hk Dk f (a). (3.7)
k=1
3.3. DÉRIVÉES DIRECTIONNELLES ET DÉRIVÉES PARTIELLES 93

Démonstration. Par la définition de la dérivabilité totale de f en a, il


existe une fonction r de Rn dans Rp définie au moins sur (dom f − a) \ {0},
telle que limh→0 r(h) = 0 et telle que, pour tout h ∈ (dom f − a) \ {0}, on
ait
f (a + h) = f (a) + fa$ (h) + |h|2 r(h).
Dès lors, pour tout réel t /= 0 tel que a + tu ∈ dom f , on a

f (a + tu) = f (a) + fa$ (tu) + |tu|2 r(tu) = f (a) + tfa$ (u) + |t|r(tu),

et, en utilisant le théorème sur la limite des fonctions composées et le fait


que la fonction t 2→ |t|
t est localement bornée en 0,
2 3
f (a + tu) − f (a) |t|
lim = lim fa$ (u) + r(tu) = fa$ (u).
t→0 t t→0 t

En particulier, en prenant u = ek , (1 ≤ k ≤ n), on obtient

Dk f (a) = fa$ (ek ), (1 ≤ k ≤ n),

et, pour tout h ∈ Rn , on aura


& n
' n n
$ $ $
fa$ (h) = fa$ k
hk e = hk fa$ (ek ) = hk Dk f (a).
k=1 k=1 k=1

L’exemple donné d’une fonction dérivable dans chaque direction sans


être continue, et donc sans être dérivable, montre que la réciproque de cette
proposition est fausse. Nous donnerons plus loin des conditions supplémen-
taires à imposer à l’existence des dérivées partielles en un point pour en
déduire la dérivabilité en ce point.
La proposition que nous venons de démontrer fournit un procédé systé-
matique pour étudier la dérivabilité d’une fonction f de Rn dans Rp en un
point a ∈ dom f :
1. On étudie l’existence des dérivées partielles de f en a par rapport à xk
(1 ≤ k ≤ n). Si l’une d’entre elles n’existe pas, f ne sera pas dérivable en a.
2. Si toutes les dérivées partielles D1 f (a), . . . , Dnf (a) existent, on définit
l’application linéaire L de Rn dans Rp par la relation
n
$
L(h) = hk Dk f (a).
k=1
94 CHAPITRE 3. DÉRIVABILITÉ

Si f (a + h) − f (a) − L(h) = |h|2 r(h) avec limh→0 r(h) = 0, ou encore si

f (a + h) − f (a) − L(h)
lim = 0, (3.8)
h→0 |h|2

alors f est dérivable en a. Si la limite du premier membre de (3.8) est


différente de zéro ou n’existe pas, alors f n’est pas dérivable en a.
Exemple. Reprenons l’exemple de la fonction f de R2 dans R définie par
f (x) = x21 + x2 . Si a = (a1 , a2 ) ∈ R2 est donné, alors la fonction x1 2→ x21 + a2
est dérivable en a1 et y a pour dérivée 2a1 et la fonction x2 2→ a21 + x2 est
dérivable en a2 et y a pour dérivée 1. En conséquence,

D1 f (a) = 2a1 , D2 f (a) = 1.

Soit L l’application linéaire de R2 dans R définie par


2
$
L(h) = hk Dk f (a) = 2a1 h1 + h2 .
k=1

On a

f (a + h) − f (a) − L(h) = (a1 + h1 )2 + a2 − a21 − a2 − 2a1 h1 − h2 = h21 ,

et dès lors
f (a + h) − f (a) − L(h) h2
lim = lim 1 = 0.
h→0 |h|2 h→0 |h|2

Remarque. Dans le cas particulier d’une fonction f de Rn dans R dérivable


en a ∈ int dom f , chaque dérivée partielle Dk f (a) est un nombre réel et
l’élément (D1 f (a), . . ., Dnf (a)) de Rn est appelé le gradient de f en a et
noté ∇f (a) ou grad f (a). En utilisant le produit scalaire, la relation (3.7)
s’écrit
f $ (a; h) = fa$ (h) = (∇f (a)|h).
En vertu de l’inégalité de Cauchy, on aura alors, pour tout u ∈ Rn , tel que
|u|2 = 1,
fa$ (u) ≤ |fa$ (u)| ≤ |∇f (a)|2 |u|2 = |∇f (a)|2 ,
∇f (a)
et si ∇f (a) /= 0, on obtient, en prenant u = |∇f (a)|2 ,
4 5 4 5
∇f (a) ∇f (a) (∇f (a)|∇f (a))
f $ a; = ∇f (a)| = = |∇f (a)|2,
|∇f (a)|2 |∇f (a)|2 |∇f (a)|2
3.4. RÈGLES DE CALCUL DES DÉRIVÉES 95

∇f (a)
ce qui montre que f $ (a; u) prend sa plus grande valeur lorsque u = |∇f (a)|2 .
Comme
f (a + tu) = f (a) + t(∇f (a)|u) + |t|r(tu),
∇f (a)
avec r(h) → 0 si h → 0, le résultat qui précède montre que u = |∇f (a)|2
est
la direction suivant laquelle f croı̂t le plus vite à partir de a. L’opposée −u
est la direction de plus grande pente.

3.4 Règles de calcul des dérivées


Pour éviter de devoir retourner systématiquement à la définition pour étudier
la dérivabilité et calculer la dérivée, il est important de savoir comment
la dérivabilité se comporte par rapport aux opérations algébriques et en-
semblistes faites sur des fonctions dérivables. On pourra alors obtenir la
dérivabilité et la dérivée de fonctions compliquées lorsqu’on connaı̂t celle de
fonctions plus simples. On se contentera de traiter le cas important de la
dérivabilité en un point intérieur au domaine.
Montrons tout d’abord que la dérivée d’une somme est la somme des
dérivées.
Proposition. Soient f et g deux fonctions de Rn dans Rp et a ∈ int (dom f
∩dom g). Si f et g sont dérivables en a, alors f + g est dérivable en a et l’on
a
(f + g)$a = fa$ + ga$ .

En particulier, pour n = 1,

(f + g)$(a) = f $ (a) + g $ (a).

Démonstration. Par hypothèse, il existe des fonctions r et s de Rn dans


Rp définies au moins sur (dom f −a)\{0} et (dom g−a)\{0} respectivement,
telles que
lim r(h) = 0, lim s(h) = 0,
h→0 h→0

et
f (a + h) = f (a) + fa$ (h) + |h|2 r(h),

pour tout h ∈ (dom f − a) \ {0} et

g(a + h) = g(a) + ga$ (h) + |h|2 s(h),


96 CHAPITRE 3. DÉRIVABILITÉ

pour tout h ∈ (dom g − a) \ {0}. Dès lors, pour tout h ∈ [(dom f − a) ∩


(dom g − a)] \ {0}, on a

(f + g)(a + h) = f (a + h) + g(a + h)

= f (a) + fa$ (h) + |h|2 r(h) + g(a) + ga$ (h) + |h|2 s(h)
= (f + g)(a) + (fa$ + ga$ )(h) + |h|2 [r(h) + s(h)],
avec
lim [r(h) + s(h)] = 0.
h→0
Le cas n = 1 s’en déduit aussitôt puisque

(f + g)$ (a) = (f + g)$a(1) = fa$ (1) + ga$ (1) = f $ (a) + g $ (a).

Etudions maintenant la dérivabilité d’un produit de fonctions dérivables.


Proposition. Soit f une fonction de Rn dans Rp (resp. C), g une fonction
de Rn dans R (resp. C), et a ∈ int (dom f ∩dom g). Si f et g sont dérivables
en a, alors gf est dérivable en a et l’on a

(gf )$a = ga$ (·)f (a) + g(a)fa$ .

En particulier, si n = 1, on a aussi

(gf )$ (a) = g $ (a)f (a) + g(a)f $ (a).

Démonstration. Par hypothèse, il existe une fonction r de Rn dans Rp


(resp. C) définie au moins sur (dom f − a) \ {0} et une fonction s de Rn
dans R (resp. C) définie au moins sur (dom g − a) \ {0}, telles que

lim r(h) = 0, lim s(h) = 0,


h→0 h→0

et
f (a + h) = f (a) + fa$ (h) + |h|2 r(h),
pour tout h ∈ (dom f − a) \ {0} et

g(a + h) = g(a) + ga$ (h) + |h|2 s(h),

pour tout h ∈ (dom g − a) \ {0}. Dès lors, pour tout h ∈ [(dom f − a) ∩


(dom g − a)] \ {0}, on a

(gf )(a + h) = g(a + h)f (a + h)


3.4. RÈGLES DE CALCUL DES DÉRIVÉES 97

= [g(a) + ga$ (h) + |h|2 s(h)][f (a) + fa$ (h) + |h|2 r(h)]
2
ga$ (h)fa$ (h)
= (gf )(a) + ga$ (h)f (a) + g(a)fa$ (h) + |h|2 g(a)r(h) +
|h|2
:
+ ga$ (h)r(h) + s(h)f (a) + s(h)fa$ (h) + |h|2 s(h)r(h)
= (gf )(a) + ga$ (h)f (a) + g(a)fa$ (h) + |h|2 q(h),
si l’on pose
ga$ (h)fa$ (h)
q(h) = g(a)r(h) +
|h|2
+ga$ (h)r(h) + s(h)f (a) + s(h)fa$ (h) + |h|2 s(h)r(h).
Comme la fonction h 2→ |h|−1
2 ga (h) = ga ( |h|2 ) est localement bornée en 0, on
$ $ h

voit que chaque terme de q est formé du produit d’une fonction localement
bornée en 0 par une fonction ayant une limite nulle en 0, et donc que

lim q(h) = 0.
h→0

La formule particulière pour n = 1 s’en déduit aisément.


Remarque. On démontre de la même manière le théorème de dérivabilité
du produit scalaire de deux fonctions f et g de Rn dans Rp dérivables en
a ∈ int dom f ∩ int dom g et la formule pour la dérivée

(f |g)$a = (fa$ (·)|g(a)) + (f (a)|ga$ (·)).

Etudions la dérivabilité d’un quotient de fonctions dérivables.


Proposition. Soit f une fonction de Rn dans Rp (resp. C), g une fonction
de Rn dans R (resp. C), et a ∈ int (dom f ∩dom g). Si f et g sont dérivables
en a et si g(a) /= 0, alors fg est dérivable en a et l’on a
4 5$
f g(a)fa$ (·) − ga$ (·)f (a)
= .
g a (g(a))2
En particulier, si n = 1, on a aussi
4 5$
f g(a)f $(a) − g $ (a)f (a)
(a) = .
g (g(a))2

Démonstration. Puisque fg = f. 1g , il suffit de montrer que 1


g est dérivable
en a, avec 4 5$
1 1
=− g$ ,
g a (g(a))2 a
98 CHAPITRE 3. DÉRIVABILITÉ

et d’utiliser le résultat précédent sur le produit. Montrons tout d’abord que


a ∈ int dom fg . On a

f
dom = {x ∈ dom f ∩ dom g : g(x) /= 0}.
g

Puisque g(a) /= 0 et que g, dérivable en a, y est continue, il existera δ > 0


tel que, pour tout x ∈ dom g tel que |x − a|2 ≤ δ, on ait

|g(a)|
|g(x) − g(a)| ≤ ,
2
et dès lors
|g(a)|
||g(x)| − |g(a)|| ≤ ,
2
ce qui entraı̂ne en particulier que, pour tout x ∈ dom g tel que |x − a|2 ≤ δ,
on aura |g(x)| ≥ |g(a)|
2 > 0. Donc dom f ∩ dom g ∩ B2 [a; δ] ⊂ dom fg et
a ∈ int dom 1g . D’autre part, g étant dérivable en a, il existe une fonction
r de Rn dans R définie au moins sur (dom g − a) \ {0} telle que, pour tout
h ∈ (dom g − a) \ {0}, on ait

g(a + h) = g(a) + ga$ (h) + |h|2 r(h),

et dès lors, pour tout h ∈ [(dom g − a) ∩ B2 [δ]] \ {0}, on aura


2 3
1 1 1
− − − g $ (h)
g(a + h) g(a) (g(a))2 a

ga$ ( |h|h 2 )ga$ (h) + [ga$ (h) − g(a)]r(h)


= |h|2 = |h|2 s(h),
(g(a))2g(a + h)
et l’on vérifie sans peine que s(h) → 0 lorsque h → 0. La formule particulière
pour n = 1 s’en déduit aisément.
Donnons maintenant l’importante règle de dérivation d’une fonction
composée.
Proposition. Soif f une fonction de Rn dans Rp , g une fonction de Rp dans
Rq , a ∈ int dom f tel que f (a) ∈ int dom g. Si f est dérivable en a et si g
est dérivable en f (a), alors a ∈ int dom (g ◦ f ), g ◦ f est dérivable en a et

(g ◦ f )$a = gf$ (a) ◦ fa$ .


3.4. RÈGLES DE CALCUL DES DÉRIVÉES 99

Si n = p = 1, on a aussi la formule particulière

(g ◦ f )$ (a) = g $ (f (a)).f $(a).

Démonstration. Par hypothèse, f , dérivable en a, y est continue. Si r > 0


est tel que B2 [f (a); r] ⊂ int dom g, il existera δ > 0 tel que f (B2 [a; δ]) ⊂
B2 [f (a); r] et donc tel que B2 [a; r] ⊂ dom (g ◦ f ). Donc a ∈ int dom (g ◦ f ).
D’autre part, il existe une fonction r de Rn dans Rp définie au moins sur
(dom f − a) \ {0} telle que, pour tout h ∈ (dom f − a) \ {0}, on ait

f (a + h) = f (a) + fa$ (h) + |h|2 r(h),

et une fonction s de Rp dans Rq définie au moins sur (dom g − f (a)) \ {0}


telle que, pour tout t ∈ (dom g − f (a)) \ {0}, on ait

g[f (a) + t] = g[f (a)] + gf$ (a)(t) + |t|2 s(t).

Dès lors, si h ∈ [(dom f − a) ∩ B2 [δ]] \ {0}, alors f (a + h) − f (a) ∈ (dom g −


f (a)) \ {0}, et

g(f (a + h)) = g[f (a) + f (a + h) − f (a)]

= g[f (a)] + gf$ (a)(f (a + h) − f (a)) + |f (a + h) − f (a)|2s[f (a + h) − f (a)]


= g[f (a)]+gf$ (a)(fa$ (h))+gf$ (a)(|h|2r(h))+|fa$ (h)+|h|2r(h)|2 s[f (a+h)−f (a)]
= g[f (a)] + (gf$ (a) ◦ fa$ )(h)
; # 4 5 # <
# $ h #
+|h|2 gf$ (a)(r(h)) + #f
# a |h| + r(h)## s[f (a + h) − f (a)]
2 2

= g[f (a)] + (gf$ (a) ◦ fa$ )(h) + |h|2 b(h),


et l’on vérifie sans peine que b(h) → 0 lorsque h → 0. La formule pour n = 1
s’en déduit facilement.
Remarque. En appliquant le théorème précédent aux fonctions composées
pk ◦ f (1 ≤ k ≤ p) lorsque f est une fonction de Rn dans Rp dérivable en
a ∈ int dom f , on trouve immédiatement que chaque composante fk de f
est dérivable en a et que

(fk )$a = (pk )$f (a) ◦ fa$ = pk ◦ fa$ = (fa$ )k ,

ce qui montre que la dérivée totale en a de la ke -composante de f est la


ke -composante de la dérivée totale de f en a. Réciproquement, si chaque
100 CHAPITRE 3. DÉRIVABILITÉ

composante fk de f est dérivable en a ∈ int dom f , il existera des fonctions


rk de Rn dans R définies au moins sur (dom f − a) \ {0} telles que

fk (a + h) = f (a) + (fk )$a(h) + |h|2 rk (h), (1 ≤ k ≤ p),

pour tout h ∈ (dom f − a) \ {0}; dès lors, en définissant l’application linéaire


L de Rn dans Rp par

L(h) = ((f1 )$a(h), . . ., (fp)$a (h)),

et la fonction r de Rn dans Rp par

r(h) = (r1 (h), . . ., rp(h)),

on voit que f est dérivable en a et que fa$ = L.


Cette remarque combinée avec la formule (3.7) reliant la dérivée totale
aux dérivées partielles entraı̂ne aussitôt que, si f est une fonction de Rn
dans Rp dérivable en a ∈ int dom f , on a, pour chaque h ∈ Rn et chaque
1 ≤ j ≤ p,
n
$
(fa$ (h))j = (fj )$a(h) = hk Dk fj (a),
k=1

et dès lors, si l’on considère h comme un vecteur-colonne dans Rn , l’applicati-


on linéaire fa$ de Rn dans Rp est représentée par la matrice

(Dk fj (a))(1≤k≤n; 1≤j≤p)

à n colonnes et p lignes formée par les dérivées partielles des composantes


de f . Cette matrice appelée la matrice jacobienne de f en a constitue donc
la représentation de l’application linéaire fa$ dans les bases canoniques de Rn
et Rp .

3.5 Règles de calcul des dérivées partielles


Les règles de calcul des dérivées totales que nous venons d’établir se combi-
nent aux formules liant la dérivée totale aux dérivées directionnelles et aux
dérivées partielles pour fournir immédiatement les règles de calcul de ces
dernières dérivées dans le cas de la somme, du produit et du quotient de
deux fonctions.
3.5. RÈGLES DE CALCUL DES DÉRIVÉES PARTIELLES 101

Proposition. Soient f et g deux fonctions de Rn dans Rp et a ∈ int (dom f


∩dom g). Si f et g sont dérivables en a, alors, pour chaque u ∈ Rn tel que
|u|2 = 1, f + g est dérivable en a dans la direction u et l’on a

(f + g)$ (a; u) = f $ (a; u) + g $ (a; u).

En particulier, pour chaque 1 ≤ k ≤ n, on a

Dk (f + g)(a) = Dk f (a) + Dk g(a).

Proposition. Soit f une fonction de Rn dans Rp (resp. C), g une fonction


de Rn dans R (resp. C), et a ∈ int (dom f ∩dom g). Si f et g sont dérivables
en a, alors, pour chaque u ∈ Rn tel que |u|2 = 1, gf est dérivable en a dans
la direction u et l’on a

(gf )$(a; u) = g $ (a; u)f (a) + g(a)f $ (a; u).

En particulier, pour chaque 1 ≤ k ≤ n, on a

Dk (gf )(a) = Dk g(a)f (a) + g(a)Dk f (a).

Proposition. Soit f une fonction de Rn dans Rp (resp. C), g une fonction


de Rn dans R (resp. C), et a ∈ int (dom f ∩dom g). Si f et g sont dérivables
en a et si g(a) /= 0, alors, pour chaque u ∈ Rn tel que |u|2 = 1, fg est dérivable
en a dans la direction u et l’on a
4 5$
f g(a)f $(a; u) − g $ (a; u)f (a)
(a; u) = .
g (g(a))2
En particulier, pour chaque 1 ≤ k ≤ n, on a
4 5
f g(a)Dk f (a) − Dk g(a)f (a)
Dk (a) = .
g (g(a))2
Le cas du composé de deux fonctions est un peu moins direct. On ne
manquera pas de noter le contraste entre la simplicité de la règle de calcul
pour les dérivées totales et le caractère plus compliqué de la règle pour les
dérivées partielles.
Proposition. Soif f une fonction de Rn dans Rp , g une fonction de Rp dans
Rq , a ∈ int dom f tel que f (a) ∈ int dom g. Si f est dérivable en a et si g
est dérivable en f (a), alors, a ∈ int dom (g ◦ f ), et, pour chaque u ∈ Rn tel
que |u|2 = 1, g ◦ f est dérivable en a dans la direction de u, et

(g ◦ f )$ (a; u) = g $ [f (a); f $(a; u)].


102 CHAPITRE 3. DÉRIVABILITÉ

En particulier, pour chaque 1 ≤ k ≤ n, on a


p
$
Dk (g ◦ f )(a) = Dk fj (a)Dj g(f (a)), (3.9)
j=1

et, pour chaque 1 ≤ l ≤ q, on a


p
$
Dk (g ◦ f )l (a) = Dj gl (f (a))Dk fj (a). (3.10)
j=1

Démonstration. On a, en utilisant le lien entre dérivée totale et dérivée


directionnelle et la règle de la dérivée totale d’une fonction composée,

(g ◦ f )$ (a; u) = (g ◦ f )$a(u) = (gf$ (a) ◦ fa$ )(u)

= gf$ (a)(fa$ (u)) = gf$ (a)[f $ (a; u)] = g $ [f (a); f $(a; u)].
Dès lors, pour chaque 1 ≤ k ≤ n, il vient

Dk (g ◦ f )(a) = (g ◦ f )$ (a; ek ) = g $ [f (a); f $(a; ek )] = g $ [f (a); fa$ (ek )]


p
$ p
$ p
$
= (fa$ (ek ))j Dj g(f (a)) = (fj )$a(ek )Dj g(f (a)) = Dk fj (a)Dj g(f (a)).
j=1 j=1 j=1

La formule (3.10) s’obtient en passant aux composantes dans la formule


(3.9).
Remarque. La formule (3.10) montre que la matrice jacobienne de g ◦ f en
a est égale au produit matriciel de la matrice jacobienne de g en f (a) par la
matrice jacobienne de f en a.
Exemples. 1. Considérons le passage des coordonnées cartésiennes (x1 , x2 )
aux coordonnées polaires (r, θ) dans R2 pour une fonction g de R2 dans R
dérivable en chaque point de R2 \ {0}. Rappelons que ce changement de
variables est donné par l’application f de R+ × R dans R2 définie par

f (r, θ) = (r cos θ, r sin θ),

et que cette fonction f est dérivable en chaque point de R+ × R. En utilisant


la formule (3.10), on voit, que pour chaque (r, θ) ∈ R+ × R, on a

Dr (g ◦ f )(r, θ)

= D1 g(r cos θ, r sin θ)Dr f1 (r, θ) + D2 g(r cos θ, r sin θ)Dr f2 (r, θ)
3.6. C-DÉRIVABILITÉ 103

= D1 g(r cos θ, r sin θ) cos θ + D2 g(r cos θ, r sin θ) sin θ,


Dθ (g ◦ f )(r, θ)
= D1 g(r cos θ, r sin θ)Dθ f1 (r, θ) + D2 g(r cos θ, r sin θ)Dθ f2 (r, θ)
= −D1 g(r cos θ, r sin θ)r sin θ + D2 g(r cos θ, r sin θ)r cos θ.
En notations matricielles, ces relations s’écrivent
& ' & '& '
Dr (g ◦ f )(r, θ) cos θ sin θ D1 g(r cos θ, r sin θ)
= ,
Dθ (g ◦ f )(r, θ) −r sin θ r cos θ D2 g(r cos θ, r sin θ)
ce qui donne également, si r /= 0, en inversant la matrice,
& ' & '& '
D1 g(r cos θ, r sin θ) cos θ −r −1 sin θ Dr (g ◦ f )(r, θ)
= .
D2 g(r cos θ, r sin θ) sin θ r −1 cos θ Dθ (g ◦ f )(r, θ)
2. Un cas particulier important, pour la mécanique par exemple, est celui
où f est une fonction de R dans Rp+1 de la forme
f (x) = (x, h(x)),
avec h une fonction de R dans Rp dérivable en a ∈ int dom h et g une
fonction de Rp+1 dans R dérivable en f (a) = (a, h(a)) ∈ int dom g. On
numérotera les variables dans Rp+1 par les indices 0, 1, . . ., p. Dans ce cas,
g ◦ f = g(·, h(·)) est une fonction de R dans R dérivable en a et
(g ◦ f )$ (a) = (g ◦ f )$a (1) = [gf$ (a) ◦ fa$ ](1) = gf$ (a)(fa$ (1)) = gf$ (a)(f $ (a))
p
$
= D0 g(a, h(a))f0$ (a) + Dk g(a, h(a))fk$ (a)
k=1
p
$
= D0 g(a, h(a)) + Dk g(a, h(a))h$k(a).
k=1

3.6 C-dérivabilité
Soit f une fonction de C dans C et a ∈ dom f . On peut évidemment la con-
sidérer simplement comme une fonction de R2 dans R2 (en oubliant la struc-
ture supplémentaire de champ de R2 ), et considérer sa dérivabilité en a au
sens de l’existence de la dérivée totale en a. Mais la structure supplémentaire
de C nous permet également de généraliser à une telle fonction la notion de
fonction taux d’accroissement en a (puisqu’on peut diviser un élément de C
par un élément non nul de C) et la notion de dérivée correspondante.
104 CHAPITRE 3. DÉRIVABILITÉ

Définition. Soit f une fonction de C dans C et a ∈ dom f . On dit que f


est C-dérivable en a si
f (z) − f (a)
lim
z→a z −a
existe. Dans ce cas, cette limite est appelée la C-dérivée de f en a et elle est
df
notée f $ (a) ou dz (a).
L’existence de la limite implique évidemment que a ne soit pas isolé dans
dom f.
Exemples. 1. Toute application constante de C dans C est évidemment
C-dérivable en chaque point a de C et f $ (a) = 0.
2. Toute application C-linéaire de C dans C est C-dérivable en chaque point
a de C puisqu’alors f est de la forme f (z) = cz pour un certain c ∈ C, et

cz − ca c(z − a)
lim = lim = c.
z→a z−a z→a z − a

On a, dans ce cas, f $ (a) = c.


3. L’application f : z 2→ z̄, qui est R-linéaire mais n’est pas C-linéaire, n’est
C-dérivable en aucun point a de C puisque
z̄ − ā
lim ,
z→a z−a
n’existe pas. En effet, si (hk )k∈N est une suite de nombres réels non nuls
tendant vers zéro, alors, en prenant zk = a + hk , on obtient
zk − ā hk
lim = lim = 1,
k→∞ zk − a k→∞ hk
et en prenant zk = a + ihk , on obtient
zk − ā −ihk
lim = lim = −1.
k→∞ zk − a k→∞ ihk
En procédant exactement comme dans le cas d’une fonction d’une vari-
able réelle, et en se rappelant la structure des applications C-linéaires de C
dans C, on démontre aisément le résultat suivant.
Proposition. Soit f une fonction de C dans C et a ∈ dom f . Alors f est
C-dérivable en a si et seulement s’il existe b ∈ C et une fonction r de C dans
C définie au moins sur (dom f − a) \ {0} tels que limh→0 r(h) = 0 et

f (a + h) = f (a) + hb + |h|r(h),
3.6. C-DÉRIVABILITÉ 105

pour tout h ∈ (dom f − a) \ {0}, ou encore si et seulement s’il existe une


application C-linéaire L de C dans C et une fonction r de C dans C définie
au moins sur (dom f − a) \ {0} tels que limh→0 r(h) = 0 et

f (a + h) = f (a) + L(h) + |h|r(h),

auquel cas L(1) = f $ (a).


On en déduit aisément une condition nécessaire et suffisante de
C-dérivabilité due à Maurice Fréchet et Grace Young.
Proposition. Soit f une fonction de C dans C et a ∈ int dom f. Alors f
est C-dérivable en a si et seulement si les deux conditions suivantes sont
réalisées
a. f , considérée comme fonction de R2 dans R2 , est dérivable en a;
b. D1 f (a) = 1i D2 f (a),
auquel cas on a f $ (a) = D1 f (a) = 1i D2 f (a).
Démonstration. Par la proposition précédente, on voit que f est C-
dérivable en a si et seulement si f , considérée comme fonction de R2 dans
R2 est dérivable en a et sa dérivée totale en a est une application C-linéaire
de C dans C. Il existera donc un b ∈ C tel que l’on ait, pour tout h ∈ C,

fa$ (h) = bh = b(h1 + ih2 ) = bh1 + (ib)h2,

ce qui entraı̂ne aussitôt, puisque

fa$ (h) = h1 D1 f (a) + h2 D2 f (a),

que
1
D1 f (a) = b = D2 f (a),
i
et
f $ (a) = fa$ (1) = D1 f (a).

La condition b du théorème de Fréchet-Young porte le nom de condition


de Cauchy-Riemann. Comme

Dk f (a) = (Dk f1 (a), Dkf2 (a)) (k = 1, 2)

et que le deuxième membre s’écrit encore, en notations complexes,

Dk f (a) = Dk f1 (a) + iDk f2 (a) (k = 1, 2),


106 CHAPITRE 3. DÉRIVABILITÉ

ou
Dk f (a) = Dk 8f (a) + iDk 9f (a), (k = 1, 2),
les conditions de Cauchy-Riemann s’écrivent également, en égalant les par-
ties réelles et imaginaires des deux membres de la condition b,

D1 f1 (a) = D2 f2 (a), D2 f1 (a) = −D1 f2 (a),

ou
D1 8f (a) = D2 9f (a), D2 8f (a) = −D1 9f (a).
La matrice jacobienne en a d’une fonction C-dérivable en a a donc ses termes
diagonaux égaux et ses termes hors-diagonale opposés.
Exemple. L’application f de C dans C définie par f (z) = |z|2 n’est C-
dérivable qu’en z = 0. En effet, si z = x + iy, on a

f1 (z) = 8f (z) = x2 + y 2 , f2 (z) = 9f (z) = 0,

et f , considérée comme fonction de R2 dans R2 possède évidemment une


dérivée totale en chaque point a = (a1 , a2 ) = a1 + ia2 . En un tel point, on a

D1 f1 (a) = 2a1 , D2 f1 (a) = 2a2 , D1 f2 (a) = 0, D2 f2 (a) = 0,

et les conditions de Cauchy-Riemann

2a1 = 0, 2a2 = 0,

sont donc satisfaites si et seulement si a = 0.


Enfin, on obtient aisément les règles de calcul suivantes, en utilisant la
définition de la C-dérivabilité en terme de limite du taux d’accroissement
et les propriétés des limites par rapport aux opérations algébriques sur les
fonctions.
Proposition. Soient f et g deux fonctions de C dans C qui sont C-dériva-
bles en a non isolé dans dom f ∩ dom g. Alors :
1. f + g est C-dérivable en a et (f + g)$ (a) = f $ (a) + g $(a).
2. f g est C-dérivable en a et (f g)$ (a) = f $ (a)g(a) + f (a)g $ (a).
3. Si g(a) /= 0, fg est C-dérivable en a et
4 5$
f f $ (a)g(a) − f (a)g $ (a)
(a) = .
g (g(a))2
3.7. EXERCICES 107

Enfin, si f est C-dérivable en a et g est C-dérivable en f (a), alors g ◦ f est


C-dérivable en a et
(g ◦ f )$ (a) = g $ (f (a))f $ (a).
Une conséquence immédiate de cette proposition et des exemples donnés
plus haut est que tout polynôme de C dans C est C-dérivable en chaque
point de C et que toute fonction rationnelle de C dans C est C-dérivable en
chaque point où son dénominateur ne s’annule pas.

3.7 Exercices
1. Soit f une fonction de R dans R∗+ dérivable en a ∈ R. On appelle dérivée
logarithmique de f en a le nombre réel

f $ (a)
Dlog f (a) = = (log f )$ (a).
f (a)
Montrer que si f et g sont deux fonctions de R dans R∗+ dérivables en a ∈ R,
alors on a
Dlog (f g)(a) = Dlog f (a) + Dlog g(a),
f
Dlog (a) = Dlog f (a) − Dlog g(a).
g
2. Soit E une partie non vide de Rn , a ∈ E et b ∈ Rn tel que |b|2 = 1. On
dit que b est tangent à E en a s’il existe une suite (xk )k∈N dans E \ {a} qui
−a
converge vers a et est telle que la suite ( |xxkk−a| 2
)k∈N converge vers b. Montrer
que si a ∈ int E, alors tout b ∈ R tel que |b|2 = 1 est tangent à E en a.
n

Montrer que si E = {(r, r 2) ∈ R2 : r ∈ R}, alors b est tangent à E en 0 si et


seulement si b = e1 ou b = −e1 .
3. Soit f une fonction de Rn dans Rp dérivable en a ∈ dom f. Montrer qu’il
existe au plus une application linéaire L de Rn dans Rp telle que

f (a + h) = f (a) + L(h) + |h|2 r(h),

avec r définie au moins sur (dom f − a) \ {0} et

lim r(h) = 0,
h→0

si et seulement s’il existe une base {b1 , b2, . . . , bn} formée d’éléments bj tan-
gents à dom f en a.
108 CHAPITRE 3. DÉRIVABILITÉ

4. Si m > 0 est un réel, on dit qu’une application f de Rn dans Rp est


homogène de degré m si, pour tout a ∈ Rn et tout t ∈ R, on a

f (ta) = tm f (a).

En dérivant les deux membres de cette expression par rapport à t en t = 1,


montrer que si f est dérivable en a, on a la formule d’Euler
n
$
aj Dj f (a) = mf (a).
j=1

5. Si f est une application de Rn dans Rn et k ≥ 1 un entier, posons


f k = f ◦ f ◦ . . . ◦ f (k fois). Montrer par récurrence sur k que si f est
dérivable en chaque point a ∈ Rn , alors, pour chaque k ≥ 2, f k est dérivable
en chaque point a ∈ Rn et

(f k )$a = ff$ k−1 (a) ◦ . . . ◦ ff$ (a) ◦ fa$ .

6. Soit v une fonction de R dans Rp dérivable en chaque point de R, aj ∈ R,


bj ∈ R, (1 ≤ j ≤ n). Montrer que la fonction u de Rn dans Rp définie par
& n
'
$
u(x) = v ak xk
k=1

est telle que, pour chaque x ∈ Rn ,


n
& n
'
$ $ $
bj Dj u(x) = aj bj v $
ak xk .
j=1 j=1 k=1

7. Soit f une fonction de Rn dans R dérivable en a, g et h des fonctions de


Rn dans Rn définies en a. On appelle dérivée de Lie en a de f par rapport
à g le réel
n
$
Lg f (a) = fa$ (g(a)) = gj (a)Dj f (a) = (g(a)|∇f (a)),
j=1

et on appelle dérivée de Lie en a de h par rapport à g l’élément de Rn


n
$
Lg h(a) = h$a (g(a)) = gj (a)Dj h(a).
j=1
3.8. PETITE ANTHOLOGIE 109

Montrer que si ϕ est une fonction de Rn dans R et κ une fonction de Rn


dans Rn dérivables en a et si c ∈ Rn , alors

Lg (f + ϕ)(a) = Lg f (a) + Lg ϕ(a), Lg (h + κ)(a) = Lg h(a) + Lg κ(a),

Lg (cf )(a) = cLg f (a), Lg (ch)(a) = cLg h(a),


Lg (f ϕ)(a) = ϕ(a)Lg f (a) + f (a)Lg ϕ(a).
8. Soit f une fonction de R dans Rp et a non isolé dans dom f. Montrer que
f est dérivable en a si et seulement s’il existe une fonction ϕ de R dans Rp,
continue en a et telle que

f (x) = f (a) + (x − a)ϕ(x),

pour tout x ∈ dom f (caractérisation de Carathéodory). (Suggestion: pren-


dre pour ϕ le prolongement continu en a de ∆a f ). Soit f une fonction de
Rn dans R et a non isolé dans dom f. Montrer que f est dérivable en a si
et seulement s’il existe une fonction ϕ de Rn dans Rn continue en a et telle
que
f (x) = f (a) + (x − a|ϕ(x)),
pour tout x ∈ dom f. (Suggestion: si f (a + h) = f (a) + (∇f (a)|h) + |h|2r(h),
noter que |h|2 r(h) = r(h)
|h|2 (h|h)).

3.8 Petite anthologie


Dérivée

Les rapports ultimes dans lequels les quantités disparaissent ne sont pas
réellement les rapports de quantités ultimes, mais les limites vers lesquelles
les rapports de quantités, décroissant sans limite, s’en approchent toujours;
et vers lesquelles ils peuvent s’en approcher aussi près que toute différence
donnée, mais dont ils ne peuvent jamais les dépasser ou atteindre avant que
les quantités soient diminuées indéfiniment.

Isaac Newton, 1687

Le calcul différentiel en fait consiste seulement en la détermination algé-


brique de la limite d’un quotient.

Jean Le Rond d’Alembert, 1754


110 CHAPITRE 3. DÉRIVABILITÉ

Si l’on pose alors ∆x = i, les deux termes du rapport aux différences

∆y f (x + i) − f (x)
= ,
∆x i
seront des quantités infiniment petites. Mais, tandis que ces deux termes
s’approcheront indéfiniment et simultanément de la limite zéro, le rapport
lui-même pourra converger vers une autre limite, soit positive, soit négative.
Cette limite, lorsqu’elle existe, a une valeur déterminée pour chaque valeur
particulière de x. Pour indiquer cette dépendance, on donne à la nouvelle
fonction le nom de fonction dérivée, et on la désigne, à l’aide d’un accent,
par la notation y $ ou f $ (x).

Augustin Cauchy, 1823

f (x0 + h) = f (x0 ) + c.h + h.h1 (h) où h1 tend vers zéro avec h et c est
une constante : là-dedans se trouve la véritable notion de dérivée.

Karl Weierstrass, 1874

Dérivées partielles et dérivée totale

Juste comme une fonction de y et z ne peut pas être appelée continue en


un point quand elle y est continue comme une fonction de y seulement, z
étant constante, et comme une fonction de z seulement, y étant constant, on
ne peut pas appeler la fonction dérivable simplement parce que les dérivées
partielles existent.

Karl Thomae, 1873

f a une différentielle première en (x, y), donnée par

∂f (x, y) ∂f (x, y)
df (x, y) = ξ+ η,
∂x ∂y

si, pour tous les points (x + ξ, y + η) proches de (x, y) on peut écrire

f (x + ξ, y + η) = f (x, y) + df (x, y) + ξρ(ξ, η) + ησ(ξ, η),

où ρ(ξ, η) et σ(ξ, η) sont des fonctions de ξ, η qui tendent vers zéro lorsque
ξ et η tendent vers zéro.

Otto Stolz, 1893


3.8. PETITE ANTHOLOGIE 111

Dès que nous quittons le domaine d’une seule variable dans les appli-
cations des définitions fondamentales du calcul différentiel, nous sentons
presqu’immédiatement que nous nous trouvons sur un sol moins sûr. Il
ne peut pas, par la nature des choses, exister une théorie applicable aux
fonctions de deux ou plus variables aussi élégante et simple que celle du co-
efficient différentiel. Une connaissance des coefficients dérivées partielles
dans le cas le plus général n’est en aucune manière équivalent à celui du
seul coefficient différentiel d’une fonction d’une variable. En fait, gardant
à l’esprit l’interprétation géométrique usuelle, et, fixant notre pensée sur le
plan comme image géométrique de la région de variation de deux variables,
nous ne pouvons même pas affirmer qu’une connaissance des coefficients
différentiels dans toutes les directions issues du point constitue l’équivalent
de la connaissance du coefficient différentiel dans le cas d’une seule vari-
able. Pour comprendre et pour caractériser le comportement d’une fonc-
tion au voisinage d’un point, nous devons recourir à ce qui a été appelé la
différentielle.

William H. Young, 1909

C-dérivée

Supposons d’ailleurs que Z reste fonction continue de z, du moins pour


des valeurs de z comprises entre certaines limites. Pour de telles valeurs de
z, à des accroissements infiniment petits ∆x, ∆y de x, y correspondront des
accroissements infiniment petits ∆z, ∆Z de z, Z; et la dérivée de la variable
Z considérée comme fonction de z ne sera autre chose que la limite dont
s’approchera indéfiniment le rapport ∆Z ∆z tandis que ∆x, ∆y s’approcheront
indéfiniment de zéro. Cette dérivée sera désignée par la notation Dz Z. Cela
posé, la dérivée de Z, relative à z, se confondra évidemment avec le rapport
différentiel de Z à z, c’est-à-dire avec le rapport dZ
dz . Si, dans cette formule,
on substitue à la différentielle dz, sa valeur dz = dx+idy, et à la différentielle
dZ sa valeur dZ = Dx Z dx + Dy Z dy, on trouvera

DxZ dx + Dy Z dy
Dz Z = .
dx + idy
dy
Si, d’ailleurs, on pose dx = tg-, cette dernière équation donnera

Dx Z cos - + Dy Z sin -
Dz Z = .
cos - + i sin -
112 CHAPITRE 3. DÉRIVABILITÉ

... Il suit immédiatement de cette formule que la dérivée de Z, considérée


comme fonction de z, dépend en général, non seulement de la position du
point A de coordonnées rectangulaires x, y sur la ligne qu’il décrit, mais
encore de la direction de cette ligne. Cette dérivée deviendra indépendante
de l’angle - si ...
Dy Z = iDxZ.

Augustin Cauchy, 1853

Lorsqu’une fonction u d’une variable imaginaire z est continue, à un


accroissement infiniment petit de la variable correspond un accroissement
infiniment petit de la fonction, et la limite du rapport de l’accroissement de
la fonction à l’accroissement de la variable est la dérivée de la fonction. On
a donc

du dX + idY
dX
dx dx + dX
dy dy + ( dX
dx dx +
dY
dy dy)i
= = ,
dz dx + idy dx + idy
ou
dY dy
du
dX
dx + i dY
dx + ( dy + i dy ) dx
dX
= dy
.
dz 1 + i dx
En général, la dérivée dépend de la quantité dy
dx , et par conséquent de la di-
rection du déplacement infiniment petit donné au point z. A chaque direction
de déplacement correspond une dérivée particulière, et la fonction a ainsi,
pour une même valeur de z, une infinité de dérivées. Lorsque la valeur de la
dérivée est indépendante de la direction du déplacement, en d’autres termes,
lorsque la fonction admet une dérivée unique en chaque point, M. Cauchy
dit que la fonction est monogène.

Charles Briot et Jean-Claude Bouquet, 1856


Chapitre 4

Fonctions continues ou
dérivables

4.1 Propriétés locales et propriétés globales


Il est important en mathématiques de distinguer les propriétés locales des
propriétés globales et d’étudier leurs relations. Si E est une partie non vide
de Rn , et P est une propriété, on dira que P est localement vérifiée sur E si,
pour chaque a ∈ E, il existe un nombre δ = δ(a) > 0 tel que P soit vérifiée
sur E ∩ B∞ [a; δ(a)]. Bien entendu, une telle définition est indépendante du
choix de la norme dans Rn et nous avons choisi | · |∞ pour des raisons de
commodité qui apparaı̂tront plus tard. Il est clair que si P est vérifiée sur
E, alors P est vérifiée localement sur E, mais la réciproque est fausse.
Ainsi, prenant pour P la propriété “être fini”, on voit que E sera locale-
ment fini si, pour chaque a ∈ E, il existe δ = δ(a) > 0 tel que E ∩B∞ [a; δ(a)]
soit fini. Z n’est pas fini mais est localement fini (prendre par exemple
δ(k) = 1/2 pour k ∈ Z), et E = {1/k : k ∈ N∗ }, également infini, est
localement fini (prendre δ(1/k) = 1/2k(k + 1)).
On a dit au Chapitre 2 qu’une fonction f de Rn dans Rp est localement
bornée en a ∈ Rn si la condition
(∃δ > 0)(∃r > 0)(∀x ∈ dom f ∩ B∞ [a; δ]) : |f (x)|2 ≤ r
est satisfaite. Cette propriété suggère la définition suivante. Soit f une
fonction de Rn dans Rp et E une partie de Rn telle que dom f ∩ E /= ∅.
Définition. On dit que f est bornée sur E si la condition
(∃r > 0)(∀x ∈ dom f ∩ E) : |f (x)|2 ≤ r

113
114 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES

est satisfaite.
Il est clair que f est localement bornée en a si et seulement s’il existe
δ > 0 tel que f soit bornée sur B∞ [a; δ].
La propriété pour f d’être bornée sur E est évidemment une propriété
globale de E. Elle implique évidemment la propriété locale correspondante.
Définition. On dit que f est localement bornée sur E si

(∀a ∈ E)(∃δ(a) > 0)(∃r(a) > 0)(∀x ∈ dom f ∩ E ∩ B∞ [a; δ(a)]) :

|f (x)|2 ≤ r(a).
Il est clair que si f est bornée sur E, elle est localement bornée sur E, et
que f est localement bornée sur E si et seulement si f est localement bornée
en chaque a ∈ E, au sens de la définition du Chapitre 2. Par exemple, la
fonction f de R dans R définie par f (x) = x1 est localement bornée sur R∗+ .
En effet, étant donné a > 0, si l’on prend# δ(a) # = a/2, on voit que pour
#1#
x ∈ ] 2 , 2 ], on aura x ∈ [ 3a , a [, et donc # x # < a2 . La valeur r(a) = 2/a
a 3a 1 2 2

convient donc dans la définition. Par contre, cette fonction n’est pas bornée
sur R∗+ puisque, pour chaque r > 0, on aura 1/2r 1
= 2r > r. Ainsi donc, la
propriété: la fonction f est localement bornée sur l’ensemble E n’implique
pas nécessairement que f soit bornée sur E.
Comme autre exemple, considérons la propriété, pour une fonction f
de Rn dans R, d’être de signe constant sur E ⊂ Rn , c’est-à-dire d’être
strictement positive sur E ou strictement négative sur E. C’est une pro-
priété globale sur E qu’on peut localiser en disant que f est localement de
signe constant sur E si, pour chaque a ∈ E, il existe δ(a) > 0 tel que f soit
de signe constant sur E ∩B∞ [a; δ(a)]. Toute fonction de signe constant sur E
est évidemment localement de signe constant sur E, mais la réciproque est
fausse. Ainsi, l’identité de R dans R n’est pas de signe constant sur R \ {0},
mais elle y est localement de signe constant. En effet, si a > 0, on voit que f
est strictement positive sur [a/2, 2a/2] et si a < 0, f est strictement négative
sur [3a/2, a/2]. On voit donc que δ(a) = |a|/2 convient dans la définition.
Une propriété vérifiée localement sur E introduit donc une application
δ : E → R∗+ , a 2→ δ(a), dont la valeur en a fixe sur le rayon d’une boule
centrée en a telle que la propriété P ait lieu sur E ∩ B∞ [a; δ(a)]. Une telle
application sera appelée une jauge sur E. Nous allons développer une tech-
nique permettant de montrer que, pour certaines classes d’ensembles E de
Rn , une propriété localement satisfaite sur E y sera globalement vérifiée.
En utilisant le théorème des intervalles fermés emboı̂tés, nous montrerons
4.2. P-PARTITIONS D’UN PAVÉ ET LEMME DE COUSIN 115

d’abord que c’est le cas pour les intervalles fermés (bornés) de R et les pro-
duits cartésiens de tels intervalles dans Rn . C’est le fait qu’une boule en
norme | · |∞ soit un produit d’intervalles fermés bornés qui suggère, par com-
modité, le choix de cette norme. Nous étendrons ensuite le résultat à une
classe plus vaste de parties de Rn .

4.2 P-partitions d’un pavé et lemme de Cousin


Généralisons à Rn la notion d’intervalle.
Définition. On appelle pavé de Rn toute partie K ⊂ Rn de la forme
n
6
K = K1 × K2 × . . . × Kn = Ki ,
i=1

où, pour chaque 1 ≤ i ≤ n, Ki = [ai , bi] est un intervalle fermé de R. On


appelle pavé ouvert de Rn toute partie J ⊂ Rn de la forme
n
6
J = J1 × J2 × . . . × Jn = Ji ,
i=1

où, pour chaque 1 ≤ i ≤ n, Ji = ]ai , bi[ est un intervalle ouvert de R. Enfin,


on appelle semi-pavé de Rn toute partie I ⊂ Rn de la forme
n
6
I = I1 × I2 × . . . × In = Ii ,
i=1

où, pour chaque 1 ≤ i ≤ n, Ii = ]ai , bi] est un intervalle ouvert à gauche


et fermé à droite. Lorsque b1 − a1 = b2 − a2 = . . . = bn − an , on parlera
respectivement d’un n-cube, d’un n-cube ouvert ou d’un n-semi-cube.
Ainsi donc, avec les notations de la définition,

K = {x ∈ Rn : ai ≤ xi ≤ bi , (1 ≤ i ≤ n)},

J = {x ∈ Rn : ai < xi < bi , (1 ≤ i ≤ n)},


I = {x ∈ Rn : ai < xi ≤ bi , (1 ≤ i ≤ n)}.
Exemple. Pour chaque a ∈ Rn et chaque r > 0, B∞ [a; r] est le n-cube

[a1 − r, a1 + r] × [a2 − r, a2 + r] × . . . × [an − r, an + r].


116 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES

Définition. On dit que (K (i))i∈N est une suite de pavés emboı̂tés de Rn si


chaque K (i) est un pavé de Rn et si, pour chaque i ∈ N, on a

K (i+1) ⊂ K (i).

Si, pour chaque i ∈ N,


(i) (i)
K (i) = K1 × K2 × . . . × Kn(i) ,

l’hypothèse que (K (i))i∈N soit une suite de pavés emboı̂tés équivaut évidem-
(i)
ment à ce que, pour chaque 1 ≤ j ≤ n, la suite (Kj )i∈N soit une suite
d’intervalles fermés emboı̂tés de R.
Le résultat suivant, appelé théorème des pavés emboı̂tés, est une
conséquence facile du théorème des intervalles fermés emboı̂tés.
Proposition. Si (K (i))i∈N est une suite de pavés emboı̂tés de Rn , alors
7
i∈N K
(i)
/= ∅.
Démonstration. Soit (K (i))i∈N une suite de pavés emboı̂tés de Rn . Si,
pour chaque i ∈ N, on écrit
(i) (i)
K (i) = K1 × K2 × . . . × Kn(i) ,
(i)
alors, pour chaque 1 ≤ j ≤ n, la suite (Kj )i∈N est une suite d’intervalles
fermés emboı̂tés de R, et il existe donc un réel cj tel que, pour chaque i ∈ N,
on ait
(i)
cj ∈ K j .
Dès lors, c = (c1 , c2 , . . . , cn) ∈ Rn est tel que, pour chaque i ∈ N, on a
(i) (i)
c ∈ K1 × K2 × . . . × Kn(i) = K (i),
7
c’est-à-dire c ∈ i∈N K
(i)
.
Pour étudier les relations entre les pavés, pavés ouverts et semi-pavés, on
a besoin des compléments suivants sur l’intérieur et l’adhérence d’une partie
de Rn .
Proposition. Si m ≥ 1, p ≥ 1 sont des entiers et si A ⊂ Rm et B ⊂ Rp,
alors
int (A × B) = int A × int B,
adh (A × B) = adh A × adh B.
4.2. P-PARTITIONS D’UN PAVÉ ET LEMME DE COUSIN 117

Démonstration. Soit x = (y, z) ∈ int (A × B), avec y ∈ A et z ∈ B. Il


existe donc r > 0 tel que
n
B∞ [x; r] ⊂ A × B,

où B∞
n [x; r] désigne la boule de centre x et de rayon r dans Rn avec n = m+p.

Comme
B∞n
[x; r] = B∞
m
[y; r] × B∞
p
[z; r],
on aura évidemment
m
B∞ [y; r] ⊂ A et B∞
p
[z; r] ⊂ B,

ce qui montre que y ∈ int A et z ∈ int B, et donc que

x = (y, z) ∈ int A × int B.

Réciproquement, si x = (y, z) ∈ int A × int B, alors y ∈ int A et z ∈ int B,


et il existera r1 > 0 et r2 > 0 tels que
m
B∞ [y; r1] ⊂ A et B∞
p
[z; r2] ⊂ B.

En conséquence, si r = min{r1 , r2 }, on aura


n
B∞ [x; r] = B∞
m
[y; r] × B∞
p
[z; r] ⊂ A × B,

ce qui montre que x ∈ int (A × B). On a donc démontré la première égalité.


Pour la seconde, notons que x = (y, z) ∈ adh (A × B) si et seulement si,
pour chaque r > 0, on a B∞ n [x; r] ∩ (A × B) /= ∅, c’est-à-dire si et seulement

si, pour chaque r > 0, on a


m
B∞ [y, r] ∩ A /= ∅ et B∞
p
[z; r] ∩ B /= ∅,

c’est-à-dire si et seulement si

y ∈ adh A et z ∈ adh B,

ou encore si et seulement si x = (y, z) ∈ adh A × adh B.


En appliquant ce résultat de proche en proche et en le combinant avec
les calculs d’intérieur et d’adhérence des différents types d’intervalles de R,
on obtient aussitôt le corollaire suivant.
118 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES

Corollaire. Soient ai < bi , (1 ≤ i ≤ n), des réels, et soient


n
6 n
6 n
6
K= [ai, bi], J = ]ai , bi[, I = ]ai , bi].
i=1 i=1 i=1

Alors,
int K = int J = int I = J,
K = J = I = K.
Rappelons que si E est un ensemble quelconque et (Eα)α∈A une famille
de parties Eα de E, on dit que (Eα)α∈A partitionne E ou est une partition
de E si les deux conditions suivantes sont vérifiées :
1) (∀α ∈ A)(∀β ∈ A : α /= β) : Eα ∩ Eβ = ∅.
!
2) E = α∈A Eα.
En d’autres termes, les Eα doivent être des parties mutuellement disjointes
de E dont l’union redonne E. Comme on travaillera en général avec des parti-
tions en un nombre fini d’ensembles, on utilisera l’abus de notation commode
consistant à désigner, lorsque A = {α1 , . . . , αm }, la famille (Eα)α∈A par

{Eα1 , Eα2 , . . . , Eαm }.

Bien entendu, (E) est une partition de E, que l’on qualifiera de triviale.
On se convaincra aisément que, à l’exception de la partition triviale, il
n’est pas possible de partitionner un pavé en un nombre fini de pavés et
qu’il n’est pas possible de partitionner un pavé ouvert en un nombre fini de
pavés ouverts. Ainsi, {[a, c], [c, b]} avec a < c < b n’est pas une partition
de [a, b] puisque [a, c] ∩ [c, b] = {c}, et {]a, c[, ]c, b[} n’est pas une partition
de ]a, b[ puisque ]a, c[ ∪ ]c, b[ /= [a, b[. Par contre, il est toujours possible
de partitionner un semi-pavé en un nombre fini de semi-pavés, puisque, si
=
a < c < b, {]a, c], ]c, b]} est une partition de ]a, b], et que si I = ni=1 Ii est
un semi-pavé de Rn et si, pour chaque 1 ≤ i ≤ n, les intervalles semi-ouverts
Ii1 , Ii2 , . . . , Iiki partitionnent l’intervalle semi-ouvert Ii , alors la famille finie

{I1j1 × I2j2 × . . . × Injn : 1 ≤ j1 ≤ k1 , 1 ≤ j2 ≤ k2 , . . . , 1 ≤ jn ≤ kn }

est une partition de I en un nombre fini de semi-pavés. Notons aussi que


si (I j )1≤j≤m est une partition du semi-pavé I en semi-pavés, alors, de la
!
relation I = m j=1 I , on déduit aussitôt
j

m
> m
>
I¯ = Ij = Ij.
j=1 j=1
4.2. P-PARTITIONS D’UN PAVÉ ET LEMME DE COUSIN 119

Dans l’étude du passage d’une propriété locale à une propriété globale,


il est utile de considérer des partitions d’un semi-pavé de Rn en un nombre
fini de semi-pavés à chacun desquels est attaché un point de son adhérence.
Ce concept se formalise comme suit.
Définition. Soit I ⊂ Rn un semi-pavé. Une P-partition de I est une famille
finie 8 9 ? @
Π = (xj , I j ) = (x1 , I 1), (x2, I 2 ), . . ., (xm, I m )
1≤j≤m

telle que :
1) (I j )1≤j≤m = {I 1 , I 2 , . . . , I m} est une partition de I en semi-pavés.
2) xj ∈ I j pour chaque 1 ≤ j ≤ m.
Ainsi, quel que soit c ∈ I, ¯ {(c, I)} est une P-partition du semi-pavé I
de R et {(0, ]0, 1]), (2, ]1, 3])} est une P-partition de ]0, 3]. Bien entendu,
n

si les semi-pavés I 1 , . . . I q partitionnent le semi-pavé I et si, pour chaque


1 ≤ l ≤ q, 8 9
Πl = (xl,jl , I l,jl )
1≤jl ≤ml

est une P-partition de I l , alors


8 9
Π = (xl,jl , I l,jl )
1≤jl ≤ml , 1≤l≤q

sera une P-partition de I que l’on désignera souvent d’une manière impropre
mais commode par la notation {Π1 , Π2 , . . . , Πq }.
On a vu qu’une propriété locale P sur un ensemble E de Rn s’obtient
en associant à chaque point x ∈ Rn un nombre strictement positif (pouvant
dépendre de x) δ(x) tel que P soit satisfaite sur E ∩ B∞ [x; δ(x)], c’est-à-dire
en donnant une jauge δ sur E. La donnée d’une jauge sur l’adhérence I¯ d’un
semi-pavé permet de mesurer la “finesse” d’une P-partition de I.
A B
Définition. Si I ⊂ Rn est un semi-pavé, Π = (xj , I j ) 1≤j≤m une P-
¯ on dit que Π est δ-fine si, pour chaque
partition de I et δ une jauge sur I,
1 ≤ j ≤ m, on a

I j ⊂ B∞ [xj ; δ(xj )]. (4.1)

Comme, pour chaque 1 ≤ j ≤ m, on a

adh B∞ [xj ; δ(xj )] = B∞ [xj ; δ(xj )],


120 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES

on voit que la condition (4.1) équivaut à ce que, pour chaque 1 ≤ j ≤ m, on


ait
I j ⊂ B∞ [xj ; δ(xj )].
Lorsque δ est une jauge constante sur I, ¯ dont la valeur constante est
également notée δ, il est facile de construire une P-partition δ-fine de I.
Si I = I1 × . . . × In , avec, pour chaque 1 ≤ k ≤ n, Ik = ]ak , bk ], il suffit
en effet de partitionner Ik en q semi-intervalles Ikl = ]clk , cl+1
k ] de longueur
cl+1 − c l ≤ δ (1 ≤ l ≤ q − 1), de considérer la partition produit
k k

(I1l1 × I2l2 × . . . × Inln )(1≤lk ≤q; 1≤k≤n) ,

et d’associer à chacun des semi-pavés I j de cette partition un élément quel-


conque xj appartenant à son adhérence (1 ≤ j ≤ m). Ici, m = q n . En effet,
=
si I j = nk=1 ]ajk , bjk ], alors on a, par construction, pour chaque 1 ≤ k ≤ n,
bjk − ajk ≤ δ, et dès lors

xjk − δ ≤ bjk − δ ≤ ajk < bjk ≤ ajk + δ ≤ xjk + δ,

ce qui entraı̂ne aussitôt que

I j ⊂ B∞ [xj ; δ] = B∞ [xj ; δ(xj )].

On ne dispose pas d’un tel procédé de construction dans le cas d’une


jauge quelconque δ sur I,¯ et l’existence d’une P-partition δ-fine résulte alors
de l’important résultat suivant, qu’on appelle le lemme de Cousin.
Théorème. Si I un semi-pavé de Rn et δ une jauge sur I, ¯ alors il existe
une P-partition δ-fine de I.
Démonstration. Supposons le résultat faux et soit δ une jauge sur I¯ telle
=
que I n’admette pas de P-partition δ-fine. Partitionnons I = ni=1 ]ai , bi]
en 2n semi-pavés congruents par bissection des côtés. En d’autres termes,
=
partitionnons I en 2n semi-pavés congruents du type ni=1 ]ci , di] avec
ai + bi ai + bi
ci = ai , di = , ou ci = , di = bi , (1 ≤ i ≤ n).
2 2
L’un de ces semi-pavés au moins, disons I (1), n’admet pas de P-partition
δ-fine car, autrement, la réunion des P-partitions δ-fines de chaque semi-
pavé de la division fournirait une P-partition δ-fine de I, ce qui a été ex-
clu. Partitionnons alors I (1) en 2n semi-pavés congruents par bissection des
côtés, comme on l’a fait pour I. L’un de ces semi-pavés au moins, disons
4.3. PROPRIÉTÉ DE VALEUR INTERMÉDIAIRE 121

I (2) n’admettra pas de P-partition δ-fine. En continuant indéfiniment cette


construction, on obtient une suite (I (k))k∈N de semi-pavés, avec I (0) = I,
vérifiant les propriétés suivantes :
(i) chaque I (k) n’admet pas de P-partition δ-fine;
(ii) I (k+1) ⊂ I (k), (k ∈ N);
(iii) si d = max{bi − ai : 1 ≤ i ≤ n} désigne la longueur du plus grand côté
de I, alors, pour tout x ∈ I (k) et tout y ∈ I (k), on a |x − y|∞ ≤ 2dk , (k ∈ N).
Cette dernière propriété résulte du fait que la longueur de chacun des côtés
d’un semi-pavé I (k) est deux fois plus petite que celle du côté correspondant
du semi-pavé qui le précède dans la suite.
En conséquence, la suite (I (k))k∈N constitue une suite de pavés emboı̂tés
7
et, par le théorème des pavés emboı̂tés, il existe c ∈ k∈N I (k) . Choisissons
p ∈ N suffisamment grand pour que 2dp ≤ δ(c). Comme c ∈ I (p), on aura,
pour tout x ∈ I (p),
d
|x − c|∞ ≤ p ≤ δ(c),
2
8 9
c’est-à-dire I (p) ⊂ B∞ [c; δ(c)], et (c, I (p)) sera une P-partition δ-fine de
I (p), ce qui contredit la propriété (i) ci-dessus.
Remarque. La démonstration que nous venons de faire prouve en fait que
pour tout ¯ il existe une P-partition
semi-pavé I de Rn et toute jauge δ sur I,
A j j B
δ-fine (x , I ) 1≤j≤m telle que chaque I soit semblable à I, c’est-à-dire telle
j
=n =n j j
que, si I = i=1 ]ai , bi] et I j = i=1 ]ai , bi ], (1 ≤ j ≤ m), on ait

bj1 − aj1 bj − aj2 bj − ajn


= 2 = ... = n .
b1 − a1 b2 − a2 bn − an
Une telle P-partition est appelée une P-partition régulière de I.

4.3 Propriété de valeur intermédiaire


Montrons tout d’abord qu’une fonction réelle, non nulle et continue en un
point garde son signe sur un voisinage du point: la propriété ponctuelle
devient une propriété locale.
Lemme. Soit f une fonction de Rn dans R continue en a ∈ dom f . Si
f (a) > 0 (resp. f (a) < 0), il existe δ = δ(a) > 0 tel que, pour tout
x ∈ dom f ∩ B∞ [a; δ(a)], on ait

f (x) > 0 (resp. f (x) < 0).


122 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES

Démonstration. Faisons-la dans le cas où f (a) > 0, l’autre cas s’y ra-
menant en remplaçant f par −f. En prenant ! = f (a) 2 dans la définition de
continuité de f en a, on obtient l’existence d’un δ = δ(a) > 0 tel que, pour
tout x ∈ dom f ∩ B∞ [a; δ(a)], on aura
f (a) f (a)
− ≤ f (x) − f (a) ≤ ,
2 2
f (a)
et donc f (x) ≥ 2 > 0.
Remarque. La conclusion de la proposition précédente peut encore s’expri-
mer en disant que, pour tout x ∈ dom f ∩B∞ [a; δ(a)], on aura f (x)f (a) > 0.
Le théorème de Cousin permet, sous certaines conditions, de passer de
ce résultat local à un résultat global. Si f est une fonction de Rn dans Rp
et E ⊂ dom f , on dira que f est continue sur E si f est continue en chaque
point de E. Montrons tout d’abord qu’une fonction réelle d’une variable
réelle continue et non nulle sur un intervalle fermé garde un signe constant
sur cet intervalle.
Proposition. Soit f une fonction de R dans R continue sur l’intervalle
fermé [a, b]. Si, pour chaque x ∈ [a, b], on a f (x) /= 0, alors f (a)f (b) > 0.
Démonstration. Par la proposition précédente appliquée à chaque point
de [a, b], on trouve que
(∀x ∈ [a, b])(∃δ(x) > 0)(∀y ∈ [a, b] ∩ [x − δ(x), x + δ(x)]) : f (y)f (x) > 0.
On obtient ainsi une jauge δ : x 2→ δ(x) sur [a, b], et leAlemme Bde Cousin
garantit alors l’existence d’une P-partition δ-fine Π = (xj , I j ) 1≤j≤m de
I = ]a, b], que l’on peut évidemment toujours numéroter de telle sorte que,
si I j = ]aj−1 , aj ], on ait
a = a0 < a1 < a2 < . . . < am−1 < am = b.
Comme Π est δ-fine, on a, pour chaque 1 ≤ j ≤ m,
[aj−1 , aj ] ⊂ [xj − δ(xj ), xj + δ(xj )],
et dès lors
f (aj−1 )f (xj ) > 0, f (aj )f (xj ) > 0,
ce qui entraı̂ne aussitôt que
f (aj−1 )f (aj ) > 0,
et la thèse s’en déduit.
4.3. PROPRIÉTÉ DE VALEUR INTERMÉDIAIRE 123

Remarque. Le résultat est faux si f cesse d’être continue en un point de


[a, b] (considérer par exemple la fonction f définie sur [0, 1] par f (x) = −1
si x ∈ [0, 12 ] et f (x) = 1 si x ∈ ] 12 , 1]) ou si elle est continue sur un ensemble
qui n’est pas un intervalle (considérer par exemple la fonction f définie sur
[0, 1] ∪ [2, 3] par f (x) = −1 si x ∈ [0, 1] et f (x) = 1 si x ∈ [2, 3]).
La forme contraposée de cette proposition fournit, pour une fonction
réelle d’une variable réelle, une utile condition suffisante d’existence d’un
zéro, appellée le théorème de Bolzano. C’est Bernard Bolzano qui le
premier, en 1817, sentit la nécessité de donner une démonstration analytique
de ce résultat, considéré jusqu’alors comme “géométriquement” évident.
Corollaire. Soit f une fonction de R dans R continue sur [a, b]. Si
f (a)f (b) ≤ 0,
alors il existe au moins un c ∈ [a, b] tel que f (c) = 0.
Une conséquence utile du théorème de Bolzano est l’existence d’un zéro
réel pour tout polynôme réel de degré impair.
Corollaire. Tout polynôme à coefficients réels de degré impair possède au
moins un zéro réel.
Démonstration. Soit
m
$
p : R → R, x 2→ aj xj ,
j=0

un polynôme à coefficients réels aj de degré impair m (am /= 0). Sans perte


de généralité, on peut supposer que am > 0, puisque, dans le cas contraire,
il suffit de considérer −p. On sait que p est continue sur R et, pour tout
x /= 0, on a  
m−1
$
p(x) = xm am + aj xj−m  .
j=0
%m−1
Comme j=0 aj xj−m → 0 si x → ∞, il existera ρ > 0 tel que, pour tout
|x| ≥ ρ, on ait # #
#m−1 #
#$ # am
# j−m #
# aj x #≤ 2 .
# j=0 #
Cela entraı̂ne en particulier que
 
m−1
$ am
p(ρ) = ρm am + aj ρj−m  ≥ ρm > 0,
j=0
2
124 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES

et  
m−1
$ am
p(−ρ) = −ρ m
am + aj (−ρ) j−m 
≤ −ρm < 0.
j=0
2

La thèse résulte alors du théorème de Bolzano.


Il résulte immédiatement de ce résultat que tout nombre réel possède
une racine ne réelle lorsque n est impair. On va l’utiliser pour démontrer
l’existence de la racine ne complexe d’un nombre complexe quelconque pour
tout entier n strictement positif.
Proposition. Pour chaque entier n ≥ 1, et chaque c ∈ C, il existe au moins
un z ∈ C tel que z n = c.
Démonstration. Le résultat est trivial pour n = 1. Si n = 2 et c =
a + ib, z = x + iy, l’équation z 2 = c équivaut au système d’équations

x2 − y 2 = a, 2xy = b.

Comme x2 + y 2 = |z|2 = |c|, on en déduit que

2x2 = |c| + a, 2y 2 = |c| − a,

ce qui fournit les solutions


C C
1 1
z= (|c| + a) + i sign b (|c| − a),
2 2
et C C
1 1
z=− (|c| + a) − i sign b (|c| − a).
2 2
Supposons maintenant que n > 2 et démontrons le résultat par récurrence
sur n. Si n est pair, disons n = 2m, il existe, par ce qui précède, au moins
un η ∈ C tel que η 2 = c. Comme m < n, l’hypothèse de récurrence entraı̂ne
l’existence d’un z ∈ C tel que z m = η, et dès lors tel que z n = z 2m = η 2 = c.
Si n est impair, alors, puisqu’on sait déjà que tout réel possède une racine
ne réelle, on peut supposer sans perte de généralité que c n’est pas réel et
que |c| = 1. Soit d ∈ C tel que d2 = c, de telle sorte que dd¯ = 1. Définissons
le polynôme p sur R par

p(x) = i[d̄(x + i)n − d(x − i)n].

Son terme de degré n en x, i(d̄ − d)xn , est différent de zéro et, comme
p(x) = p(x) pour tout x ∈ R, p est donc un polynôme réel de degré impair
4.3. PROPRIÉTÉ DE VALEUR INTERMÉDIAIRE 125

n. Par le Corollaire précédent, il existe donc un λ ∈ R tel que p(λ) = 0, ce


qui entraı̂ne
d(λ + i)n = d(λ − i)n ,
et dès lors 4 5n
λ+i d
= = d2 = c.
λ−i d

La propriété suivante a longtemps été confondue avec la propriété de


continuité sur E. Nous verrons qu’elle est seulement une condition nécessaire
de continuité sur E.
Définition. Soit f une fonction de Rn dans R définie sur E ⊂ Rn . On
dit que f possède la propriété de valeur intermédiaire ou la propriété de
Darboux sur E ou encore que f est continue au sens de Darboux sur E si,
pour chaque x ∈ E, chaque y ∈ E et chaque v compris entre f (x) et f (y), il
existe au moins un z ∈ E tel que f (z) = v.
En d’autres termes, une telle fonction prend sur E toutes les valeurs
intermédiaires entre deux quelconques de ses valeurs. Nous allons voir que
cette propriété est satisfaite par une fonction réelle continue sur une partie
“d’un seul tenant” de Rn .
Définition. Soit E ⊂ Rn . On dit que E est connexe par arcs si, pour tout
x ∈ E et tout y ∈ E, il existe une application continue γ : [0, 1] → E telle
que γ(0) = x et γ(1) = y.
Intuitivement, E est connexe par arcs si deux quelconques de ses points
peuvent être joints par un arc de courbe continu entièrement contenu dans
E. Par exemple, tout intervalle I de R est connexe par arcs puisque, si
x < y appartiennent à I, alors [x, y] ⊂ I et l’application continue γ : [0, 1] →
R, t 2→ (1 − t)x + ty, satisfait bien aux conditions de la définition puisque
γ([0, 1]) = [x, y] ⊂ I. Par contre, N, Z et Q ne sont pas connexes par arcs
mais R l’est. De même, toute boule de Rn est connexe par arcs, de même
que toute partie du type {x ∈ Rn : r ≤ |x|j ≤ R}, avec j = 1, 2 ou ∞. Mais
l’union de deux boules disjointes de Rn n’est pas connexe par arcs.
Proposition. Soit f une fonction de Rn dans R continue sur une partie
connexe par arcs E de Rn . Alors f possède sur E la propriété de valeur
intermédiaire.
Démonstration. Soit x ∈ E, y ∈ E et γ : [0, 1] → E une application
continue telle que γ(0) = x, γ(1) = y. Soit v compris entre f (x) et f (y)
126 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES

(c’est-à-dire v ∈ [f (x), f (y)] si f (x) < f (y), v ∈ [f (y), f (x)] si f (y) < f (x) et
v = f (x) = f (y) si f (x) = f (y)). Par le théorème de continuité des fonctions
composées, la fonction g = f ◦ γ − v est une fonction de R dans R continue
sur [0, 1], et, par construction, elle est telle que

g(0)g(1) = (f (x) − v)(f (y) − v) ≤ 0.

Le théorème de Bolzano entraı̂ne donc l’existence d’au moins un τ ∈ [0, 1]


tel que g(τ ) = 0, c’est-à-dire de z = γ(τ ) ∈ E tel que f (z) = v.

4.4 Ouverts, fermés et bornés


Introduisons des familles importantes de parties de Rn qui jouent un rôle
important en analyse et qui conduiront à une extension du lemme de Cousin.
Définition. On dit que E ⊂ Rn est une partie ouverte ou un ouvert de Rn
si chaque élément de E est intérieur à E.
En d’autres termes, E est un ouvert s’il est voisinage de chacun de
ses points ou encore si int E ⊃ E, ce qui équivaut à int E = E, puisque
l’inclusion inverse est toujours satisfaite.
Par exemple, ∅ et Rn sont des ouverts de Rn , et ]a, b[ est un ouvert de
R. De même, si a ∈ R et b ∈ R, les ensembles

]a, +∞[ = {x ∈ R : x > a} et ] − ∞, b[ = {x ∈ R : x < b}

sont des ouverts de R (le vérifier). On les appelle respectivement des inter-
valles ouverts non bornés d’origine a et d’extrémité b.
Définition. On dit que F ⊂ Rn est une partie fermée ou un fermé de Rn si
tout point adhérent à F appartient à F .
En d’autres termes, F est un fermé si adh F ⊂ F , ce qui équivaut à
adh F = F , puisque l’inclusion inverse est toujours satisfaite.
Par exemple, ∅ et Rn sont des fermés de Rn , et [a, b] est un fermé de R.
D’autre part, ]a, b] et [a, b[ ne sont ni ouverts ni fermés dans R.
Les notions d’ouvert et de fermé s’échangent par passage au complémen-
taire.
Proposition. E ⊂ Rn est ouvert si et seulement si !E est fermé.
Démonstration. On a

!E est fermé ⇔ adh !E = !E ⇔ !int E = !E


4.4. OUVERTS, FERMÉS ET BORNÉS 127

⇔ int E = E ⇔ E est ouvert.

Par conséquent, si a ∈ R et b ∈ R, les ensembles

[a, +∞[ = {x ∈ R : x ≥ a} et ] − ∞, b] = {x ∈ R : x ≤ b}

sont des fermés de R puisqu’ils sont respectivement les complémentaires dans


R des ensembles ouverts ] − ∞, a[ et ]b, +∞[. On les appelle respectivement
des intervalles fermés non bornés d’origine a ou d’extrémité b.
Etudions maintenant comment se comportent les ouverts et les fermés
vis-à-vis des opérations d’union et d’intersection.
Le premier résultat affirme qu’une union quelconque d’ouverts est un
ouvert.
Proposition. Si A est un ensemble non vide quelconque et (Eα)α∈A une
!
famille d’ouverts Eα de Rn , alors α∈A Eα est un ouvert de Rn .
!
Démonstration. Si x ∈ α∈A Eα, il existe α̃ ∈ A tel que x ∈ Eα̃ . Comme
!
Eα̃ est ouvert, il est voisinage de x et il en sera donc de même de α∈A Eα.
Donc ce dernier ensemble, voisinage de chacun de ses points, est ouvert.
Le deuxième résultat affirme qu’une intersection d’un nombre fini d’ou-
verts est un ouvert.
Proposition. Si (Ej )1≤j≤m est une famille finie d’ouverts Ej de Rn , alors
7m
j=1 Ej est un ouvert de R .
n

Démonstration. Par une propriété de l’intérieur vis-à-vis de l’intersecti-


on, on a  
m
" m
" m
"
int  Ej  = int Ej = Ej .
j=1 j=1 j=1

Remarque. Ce résultat est faux si la famille n’est pas finie. Ainsi, pour
7
chaque k ∈ N∗ , ] − 1k , k1 [ est un ouvert de R, mais {0} = k∈N∗ ] − k1 , 1k [ ne
l’est pas.
En utilisant les lois de De Morgan et les trois propositions, on obtient
aisément les résultats suivants sur le comportement des fermés : une in-
tersection quelconque de fermés est fermée; une union finie de fermés est
fermée.
128 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES

Proposition. Si A est un ensemble non vide quelconque et (Fα )α∈A une


7
famille de fermés Fα de Rn , alors α∈A Fα est un fermé de Rn .

Proposition. Si (Fj )1≤j≤m est une famille finie de fermés Fj de Rn , alors


!m
j=1 Fj est un fermé de R .
n

Remarque. La dernière proposition ne s’étend pas au cas d’une famille non


finie de fermés. Ainsi, pour chaque k ∈ N∗ , [0, k+1
k
] est un fermé de R, mais
!
k∈N∗ [0, k+1 ] = [0, 1[ n’est pas un fermé de R.
k

Exemples. 1. Si a ∈ Rn , r > 0 et j = 1, 2 ou ∞, alors Bj [a; r] est un fermé


de Rn . Cela équivaut à montrer que

!Bj [a; r] = {x ∈ Rn : |x − a|j > r}

est ouvert. Soit x ∈ !Bj [a; r]. Alors, |x − a|j > r et il existe donc ! > 0 tel
que |x − a|j > r + !. Si y ∈ Bj [x; !], on a

|y − a|j = |(x − a) − (x − y)|j ≥ |x − a|j − |x − y|j > r + ! − ! = r,

c’est-à-dire Bj [x; !] ⊂ !Bj [a; r]; ce dernier ensemble est donc voisinage de
chacun de ses points.
2. Si a ∈ Rn , r > 0 et j = 1, 2 ou ∞, posons

Bj (a; r) = {x ∈ Rn : |x − a|j < r}.

Alors Bj (a; r) est un ouvert de Rn . En effet, si x ∈ Bj (a; r), alors |x−a|j < r
et il existera un ! > 0 tel que |x − a|j < r − !. Dès lors, si y ∈ Bj [x; !], on a

|y − a|j = |(y − x) + (x − a)|j ≤ |y − x|j + |x − a|j < ! + r − ! = r,

c’est-à-dire Bj [x; !] ⊂ Bj (a; r). Donc Bj (a; r) est voisinage de chacun de ses
points.
Il est naturel d’appeler Bj (a; r) la boule ouverte de centre a et de rayon
r en norme j dans Rn . Pour n = 1 et j = 1, 2 ou ∞, Bj (a; r) = ]a − r, a + r[.
On a les relations suivantes entre Bj [a; r] et Bj (a; r).
Proposition. Si a ∈ Rn , r > 0 et j = 1, 2 ou ∞, alors

int Bj [a; r] = Bj (a; r), adh Bj (a; r) = Bj [a; r].

Démonstration. Comme Bj (a; r) ⊂ Bj [a; r] et que Bj (a; r) est un ouvert,


on a immédiatement

Bj (a; r) = int Bj (a; r) ⊂ int Bj [a; r],


4.4. OUVERTS, FERMÉS ET BORNÉS 129

et, pour démontrer la première égalité, il suffit de prouver que


int Bj [a; r] ⊂ Bj (a; r).
Si x ∈ int Bj [a; r], il existe ρ > 0 tel que Bj [x; ρ] ⊂ Bj [a; r]. Bien sûr,
|a − a|j = 0 < r. Si x /= a, x + ρ |x−a|
x−a
j
∈ Bj [a; r], et dès lors
# # & '
# x−a # ρ
# #
#x + ρ − a# = 1 + |x − a|j ≤ r,
# |x − a|j # |x − a|j
j

ce qui entraı̂ne
r
|x − a|j ≤ ρ < r.
1+ |x−a|j

La démonstration de la deuxième égalité est similaire et laissée au lecteur.

On peut caractériser l’intérieur et l’adhérence d’une partie de Rn en


termes d’ouverts et de fermés.
Proposition. Soit G une partie de Rn . Alors int G est le plus grand ouvert
contenu dans G et adh G est le plus petit fermé contenant G.
Démonstration. Il faut démontrer que int G est un ouvert et que tout
ouvert contenu dans G est contenu dans int G, et que adh G est un fermé
contenu dans tout fermé qui contient G. C’est évident si G = ∅. Sinon,
démontrons le résultat sur l’intérieur, l’autre en résultant par les relations
entre intérieur et adhérence, ouvert et fermé et les lois de De Morgan. Soit
H l’union de tous les ouverts de Rn contenus dans G; on a vu que c’était
un ouvert et, par construction, c’est le plus grand ouvert contenu dans G. Il
reste à montrer que H = int G. Comme H ⊂ G, on aura H = int H ⊂ int G
et il reste à montrer que int G ⊂ H. Si x ∈ int G, alors il existe r > 0 tel
que B2 [x; r] ⊂ G et donc tel que B2 (x; r) ⊂ G. Comme B2 (x; r) est ouvert,
on voit que x appartient à un ouvert contenu dans G, et donc x appartient
à H.
Enfin, la caractérisation des points adhérents par les suites fournit une
caractérisation semblable pour les fermés : une partie de Rn est fermée si et
seulement si elle contient les limites de toutes ses suites convergentes.
Proposition. F ⊂ Rn est fermé si et seulement si, pour toute suite (ak )k∈N
dans F qui converge vers a ∈ Rn , on a a ∈ F .
Démonstration. Condition nécessaire. Par hypothèse, F = adh F . Soit
(ak )k∈N une suite dans F qui converge vers a ∈ Rn . Alors, a ∈ adh F = F.
130 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES

Condition suffisante. Soit a ∈ adh F ; alors il existe une suite (ak )k∈N dans
F qui converge vers a. Mais alors, a ∈ F , et donc adh F ⊂ F et F est fermé.

Rappelons la notion de partie bornée déjà introduite précédemment.


Définition. On dit que B ⊂ Rn est une partie bornée ou un borné de Rn
s’il existe ρ > 0 tel que B ⊂ B2 [ρ].
On peut évidemment remplacer B2 [ρ] par B1 [ρ] ou par B∞ [ρ] dans la
définition. Ainsi, pour a ∈ Rn , r > 0 et j = 1, 2 ou ∞, Bj [a; r] est une partie
bornée de Rn puisque, pour tout x ∈ Bj [a; r], on a

|x|j = |(x − a) + a|j ≤ |x − a|j + |a|j ≤ r + |a|j ,

et donc Bj [a; r] ⊂ Bj [r + |a|j ]. Il est clair aussi que toute partie d’un borné
de Rn est un borné de Rn . En particulier, Bj (a; r) est un borné de Rn .
Les propriétés des bornés par rapport à l’union et l’intersection sont
analogues à celles des fermés. Leur démonstration est très facile et laissée
au lecteur.
Proposition. Si A est un ensemble quelconque non vide et (Bα )α∈A est
7
une famille de bornés Bα de Rn , alors α∈A Bα est un borné de Rn .

Proposition. Si (Bj )1≤j≤m est une famille finie de bornés Bj de Rn , alors


!m
j=1 Bj est un borné de R .
n

Le lemme de Cousin s’étend aux ensembles fermés et bornés.


Théorème. Soit F un fermé borné non vide de Rn . Alors, pour chaque
A j j B
jauge δ sur F , il existe une famille finie (x , F ) 1≤j≤m telle que
m
>
F = Fj
j=1

et telle que, pour chaque 1 ≤ j ≤ m, on ait

xj ∈ F j ⊂ B∞ [xj ; δ(xj )].

Démonstration. Puisque F est borné, il existe ρ > 0 tel que F ⊂ B∞ [ρ].


Soit I = ] − ρ, ρ] × . . . × ] − ρ, ρ] le semi-pavé de Rn tel que I¯ = B∞ [ρ].
Définissons comme suit la jauge δ̃ sur Rn . Si x ∈ F, posons δ̃(x) = δ(x). Si
x ∈ !F, il existe, puisque !F est ouvert, un r(x) > 0 tel que B∞ [x; r(x)] ⊂
!F ; posons alors δ̃(x) = r(x). Comme la restriction de δ̃ à I¯ est une jauge
4.4. OUVERTS, FERMÉS ET BORNÉS 131

sur ¯
8 I, le9 lemme de Cousin implique l’existence d’une P-partition δ̃-fine
(y , J k )
k de I. Si k est tel que y k ∈ !F, on a donc δ̃(y k ) = r(y k ),
1≤k≤q
et
J k ⊂ B∞ [y k ; δ̃(y k )] = B∞ [y k ; r(y k )] ⊂ !F.
Dès lors, & '
q
> q
>
F = F ∩ I¯ = F ∩ Jk = (F ∩ J k )
k=1 k=1
>
= (F ∩ J k ).
{1≤k≤q : yk ∈F }

Si 1 ≤ k1 < k2 < . . . < km ≤ q sont les valeurs de k telles que y k ∈ F , et si


l’on pose 8 9 8 9
(xj , F j ) = (y kj , F ∩ J kj ) ,
1≤j≤m 1≤j≤m

(c’est-à-dire si l’on renumérote les (y k , F ∩ J k ) correspondant aux k tels que


y k ∈ F ), on voit que
m
> m
> >
Fj = (F ∩ J kj ) = (F ∩ J k ) = F,
j=1 j=1 {1≤k≤q : yk ∈F }

et, pour chaque 1 ≤ j ≤ m, on a

xj = y kj ∈ F ∩ J kj = F j ⊂ J kj ⊂ B∞ [y kj ; δ̃(y kj )] = B∞ [xj ; δ(xj )].

Remarque. La démonstration du lemme de Cousin fournit en fait des F j


fermés (1 ≤ j ≤ n).
Définition. Soit E une partie de Rn et δ une jauge sur E. Une division
A j j B !
δ-fine de E est une famille finie (x , E ) 1≤j≤m telle que E = m j
j=1 E et
telle que, pour chaque 1 ≤ j ≤ m, on ait

xj ∈ E j ⊂ B∞ [xj ; δ(xj )].

Le lemme de Cousin affirme donc que, si F ⊂ Rn est un fermé borné,


alors, pour toute jauge δ sur F , il existe une division δ-fine de F . Montrons
que cette propriété, parfois appelée propriété de Cousin, caractérise les
fermés bornés.
132 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES

Proposition. Une partie E de Rn est fermée et bornée si et seulement si,


pour toute jauge δ sur E, il existe une division δ-fine de E.
Démonstration. La condition nécessaire résulte du lemme de Cousin pour
les fermés bornés que nous venons de démontrer. Supposons maintenant que
E ait la propriété de Cousin. Montrons tout d’abord que E est borné. En
prenant
A j j B
sur E la jauge constante de valeur 1, on obtient une division 1-fine
(x , E ) 1≤j≤m . Comme chaque E j , contenu dans le borné B∞ [xj ; 1] est
borné, E, union finie de bornés, est borné. Montrons maintenant que E
est fermé ou, ce qui est équivalent, que !E est ouvert, c’est-à-dire voisinage
de chacun de ses points. Soit a ∈ !E; définissons la jauge δ sur E par
δ(x) = 12 |x − a|∞ pour chaque x ∈ E. Par construction, pour chaque x ∈ E,
a ∈ !B [x; δ(x)]. Par la propriété de Cousin, il existe une division δ-fine
A j j∞B
(x , E ) 1≤j≤m et
m
> m
>
E= Ej ⊂ B∞ [xj ; δ(xj )] = F.
j=1 j=1

Par construction, F ⊃ E est fermé et a /∈ F , c’est-à-dire !F ⊂ !E est un


ouvert contenant a.

4.5 Continuité uniforme


Si une fonction est continue en un point a, ses valeurs seront arbitrairement
proches de f (a) si l’on se restreint à des points suffisamment proches de a.
On peut en déduire la propriété locale un peu plus forte suivante.
Lemme. Soit f une fonction de Rn dans Rp continue en a ∈ dom f . Alors,
pour chaque ! > 0, il existe un δ = δ(a; !) > 0 tel que, pour tout x ∈
dom f ∩ B∞ [a; δ] et tout y ∈ dom f tel que |y − x|∞ ≤ δ, on a
|f (x) − f (y)|∞ ≤ !.
Démonstration. Soit ! > 0; puisque f est continue en a, il existe δ̃ =
δ̃(a; !) > 0 tel que, pour tout x ∈ dom f vérifiant |x − a|∞ ≤ δ̃, on ait
!
|f (x) − f (a)|∞ ≤ .
2
Posons δ = 2δ̃ , et soient x ∈ dom f ∩B∞ [a; δ] et y ∈ dom f tel que |y −x|∞ ≤
δ. Alors,
|y − a|∞ = |(y − x) + (x − a)|∞ ≤ |y − x|∞ + |x − a|∞ ≤ δ + δ = δ̃,
4.5. CONTINUITÉ UNIFORME 133

et dès lors,
! !
|f (y) − f (x)|∞ ≤ |f (y) − f (a)|∞ + |f (a) − f (x)|∞ ≤ + = !.
2 2

Remarque. La conclusion du lemme n’implique pas que f soit continue


en x ∈ (dom f ∩ B∞ [a; δ]) \ {a} ! En effet, l’ensemble dom f ∩ B∞ [a; δ]
des x autorisés pour que l’inégalité soit satisfaite dépend de δ, et donc d’!.
Rappelons à cet effet l’exemple donné précédemment d’une fonction de R
dans R qui n’est continue qu’en 0.
Lorsque f est continue sur un fermé borné de Rn , on peut utiliser le
lemme de Cousin pour obtenir une version globale du lemme : c’est le
théorème de Heine.
Théorème. Soit f une fonction de Rn dans Rp continue sur le fermé borné
E de Rn . Alors, pour chaque ! > 0, il existe un δE > 0 tel que, pour tout
x ∈ E et tout y ∈ dom f tel que |y − x|∞ ≤ δE , on a |f (y) − f (x)|∞ ≤ !.
Démonstration. Si ! > 0 est fixé, alors, par l’hypothèse de continuité de
f sur E et le lemme ci-dessus, on sait que,

(∀a ∈ E)(∃δ = δ(a) > 0)(∀x ∈ dom f ∩ B∞ [a; δ])(∀y ∈ dom f ∩ B∞ [x; δ]) :

|f (y) − f (x)|∞ ≤ !. (4.2)

Soit δ : a 2→ δ(a) la jauge


A
ainsi définie
B
sur E. Par le lemme de Cousin, il
existe une division δ-fine (aj , E j ) 1≤j≤m de E. Posons

δE = min{δ(aj ) : 1 ≤ j ≤ m},

et soit x ∈ E et y ∈ dom f tel que |y − x|∞ ≤ δE . Il existe donc un entier


1 ≤ l ≤ m tel que x ∈ E l , et donc tel que |x − al |∞ ≤ δ(al ); comme en outre
|y − x|∞ ≤ δE ≤ δ(al ), (4.2) implique que |f (y) − f (x)|∞ ≤ !.
Rappelons que la continuité de f en chaque point x de E équivaut à la
propriété suivante :

(∀x ∈ E)(∀! > 0)(∃δ > 0)(∀y ∈ dom f : |y − x|∞ ≤ δ) : (4.3)

|f (y) − f (x)|∞ ≤ !,
134 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES

montrant clairement que le δ peut dépendre à la fois d’! et de x. La propriété


que nous venons démontrer dans le théorème de Heine est la suivante :

(∀! > 0)(∃δ > 0)(∀x ∈ E)(∀y ∈ dom f : |y − x|∞ ≤ δ) : (4.4)

|f (y) − f (x)|∞ ≤ !.
Dans (4.4), on a la propriété plus forte que δ ne dépend que d’! et convient
pour chaque x ∈ E. On est ainsi conduit à la définition suivante.
Définition. Soit f une fonction de Rn dans Rp et E ⊂ Rn . On dit que f
est uniformément continue sur E si f est définie sur E et vérifie la propriété
(4.4).
Bien entendu, toute fonction uniformément continue sur un ensemble E
est continue sur E, et le théorème de Heine montre que la réciproque est
vraie lorsque E est fermé et borné. Une fonction continue sur un ensemble
E peut ne pas y être uniformément continue si E n’est pas fermé ou n’est
pas borné. C’est ce que montrent les exemples suivants. On notera que,
dans (4.4), on peut toujours demander que le δ cherché soit inférieur à une
quantité fixe donnée.
Exemples. 1. La fonction f de R dans R définie par f (x) = x1 est continue
sur le borné (non fermé) ]0, 1] mais n’y est pas uniformément continue. En
effet, pour chaque δ ∈ ]0, 1], si l’on prend x = δ et y = 2δ, on a |y − x| = δ,
# #
#1 1 ## 1 1 1
|f (x) − f (y)| = # − # =
# ≥ > ,
δ 2δ 2δ 2 4

et la négation de (4.4) est satisfaite.


2. La fonction f de R dans R définie par f (x) = x2 est continue sur le fermé
(non borné) [0, +∞[ mais n’y est pas uniformément continue. En effet, pour
chaque δ > 0, si l’on prend x = 1δ et y = 1δ + δ, on a |y − x| = δ,

|f (x) − f (y)| = 2 + δ 2 > 2,

et la négation de (4.4) est satisfaite.


Remarque. Le lecteur se convaincra sans peine de l’équivalence de la con-
dition (4.3) de continuité de f sur E ⊂ dom f avec la propriété :

(∀! > 0)(∃δ, jauge sur E)(∀x ∈ E)(∀y ∈ dom f : |y − x|∞ ≤ δ(x)) :

|f (y) − f (x)|∞ ≤ !,
4.6. IMAGES PAR UNE FONCTION CONTINUE 135

et de l’équivalence de la condition (4.4) de continuité uniforme de f sur


E ⊂ dom f avec la propriété :

(∀! > 0)(∃δ, jauge constante sur E)(∀x ∈ E)(∀y ∈ dom f : |y − x|∞ ≤ δ) :

|f (y) − f (x)|∞ ≤ !.

4.6 Images par une fonction continue


Nous allons étudier, dans cette section la préservation des propriétés des
ensembles lorsqu’on prend leur image directe ou réciproque par une fonction
continue. Les propriétés que nous aurons en vue sont celles rencontrées dans
ce chapitre, c’est-à-dire la connexité par arcs, le caractère ouvert, le caractère
fermé et le caractère borné.
Notons tout d’abord que la fonction f identiquement nulle sur l’ensemble
R \ {0} y est évidemment continue et que l’image réciproque f −1 ({0}) de
l’ensemble connexe par arcs {0} est égale à R \ {0} qui n’est pas connexe
par arcs puisque, si x < 0 < y sont deux points de R \ {0}, toute application
continue γ : [0, 1] → R telle que γ(0) = x et γ(1) = y s’annule, par le
théorème de Bolzano, en un τ ∈ [0, 1] au moins, et son image n’appartient
donc pas à R \ {0}. Par contre, les images directes par une fonction continue
d’ensembles connexes par arcs sont connexes par arcs.
Proposition. Soit f une fonction de Rn dans Rp continue sur une partie
connexe par arcs E de Rn . Alors f (E) est connexe par arcs.
Démonstration. Soient u ∈ f (E) et v ∈ f (E). Il existe donc x ∈ E et
y ∈ E tels que u = f (x) et v = f (y). Comme E est connexe par arcs, il
existe une application continue γ : [0, 1] → E telle que γ(0) = x et γ(1) = y.
En conséquence, f ◦ γ est une application continue de [0, 1] dans f (E) telle
que (f ◦ γ)(0) = u et (f ◦ γ)(1) = v.
Si f est une application constante de l’ouvert E de Rn , alors f (E) est
un singleton et n’est donc pas un ouvert. Par contre, les images réciproques
d’ouverts par des fonctions continues sont des ouverts, et cette propriété
caractérise d’ailleurs les fonctions continues.
Proposition. Soit f une fonction de Rn dans Rp et E une partie de dom f .
Alors f est continue sur E si et seulement si, pour tout ouvert B de Rp, il
existe un ouvert A de Rn tel que

f −1 (B) ∩ E = A ∩ E.
136 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES

Démonstration. Condition nécessaire. Soit B un ouvert de Rp ; si


f −1 (B) ∩ E = ∅,
il suffit de prendre A = ∅. Sinon, soit a ∈ f −1 (B) ∩ E. B est donc un
voisinage de f (a) et, f étant continue en a, il existera un voisinage Ua de
a, que l’on peut toujours prendre ouvert (puisque, par exemple, il contient
toujours une boule ouverte centrée en a) tel que f (Ua ∩ E) ⊂ B, c’est-à-dire
tel que
Ua ∩ E ⊂ f −1 (B) ∩ E.
Si nous posons >
A= Ua ,
a∈f −1(B)∩E
alors A est un ouvert de Rn tel que
f −1 (B) ∩ E ⊂ A ∩ E ⊂ f −1 (B) ∩ E.

Condition suffisante. Soit a ∈ E et montrons que f est continue en a. Si V


est un voisinage de f (a), il existe un ouvert B de Rp tel que f (a) ∈ B ⊂ V
(par exemple un boule ouverte centrée en f (a) de rayon suffisamment petit).
Par hypothèse, on peut donc trouver un ouvert A de Rn tel que f −1 (B)∩E =
A ∩ E. Comme a ∈ f −1 (B) ∩ E, a ∈ A et A est un voisinage de a tel que
f (A ∩ E) = f (f −1 (B) ∩ E) ⊂ B ⊂ V.
Donc f est continue en a.
L’image directe d’un fermé E de Rn par une fonction continue sur E
n’est pas nécessairement fermée, ainsi que le montre la fonction f de R dans
R définie par f (x) = 1+|x|
x
, qui est continue sur R et telle que le fermé R a
pour image ] − 1, 1[ qui n’est pas fermé. Comme pour les ouverts, les fermés
de conservent par image réciproque, et cette propriété caractérise également
les fonctions continues.
Proposition. Soit f une fonction de Rn dans Rp et E ⊂ dom f . Alors f
est continue sur E si et seulement si, pour tout fermé B de Rp , il existe un
fermé A de Rn tel que
f −1 (B) ∩ E = A ∩ E.
Démonstration. Elle se fonde sur le résultat correspondant pour les ou-
verts, le fait que le complémentaire d’un fermé est un ouvert et les propriétés
élémentaires des fonctions et des graphes. Ses détails sont laissés au lecteur.
4.7. THÉORÈME DES BORNES ATTEINTES ET EXTRÉMANTS 137

En particulier, on a la propriété suivante de l’ensemble des zéros d’une


fonction continue.
Corollaire. Soit f une fonction de Rn dans Rp continue sur E ⊂ Rn . Il
existe un fermé A de Rn tel que
f −1 ({0}) ∩ E = A ∩ E.
L’image directe d’un borné par une fonction continue n’est pas nécessaire-
ment bornée, ainsi que le montre l’exemple de la fonction f de R dans R
définie par f (x) = x1 . Elle est continue sur le borné ]0, 1] et f (]0, 1]) =]0, +∞[
n’est pas borné. L’image réciproque d’un borné par une fonction continue
n’est pas non plus nécessairement bornée comme le montre l’exemple de
l’application nulle sur R : l’image réciproque de tout borné contenant {0}
est R tout entier. Nous avons vu toutefois qu’une fonction f continue en
un point a est localement bornée en ce point, ce qui signifie qu’il existe une
boule B∞ [a; δ] centrée en a et de rayon δ = δ(a) telle que f (B∞ [a; δ]) soit
bornée. La caractérisation des fermés bornés par la propriété de Cousin va
nous permettre de globaliser ce résultat local.
Proposition. Si E ⊂ Rn est fermé et borné et si f est une fonction de Rn
dans Rp continue sur E, alors f (E) est fermé et borné.
Démonstration. On va montrer que f (E) possède la propriété de Cousin.
Soit ! une jauge sur f (E). Comme, pour chaque x ∈ E, f est continue en x,
si l’on prend !(f (x)) dans la définition correspondante, il existera δ(x) > 0
tel que
f (E ∩ B∞ [x; δ(x)]) ⊂ B∞ [f (x); !(f (x))].
On définit ainsi sur E une jauge δA : x 2→ δ(x),
B
et le lemme de Cousin entraı̂ne
l’existence d’une division δ-fine (xj , E j ) 1≤j≤m de E. En conséquence, si,
pour chaque 1 ≤ j ≤ m, on pose y j = f (xj ), on a
f (E j ) ⊂ f (B∞ [xj ; δ(xj )] ∩ E) ⊂ B∞ [y j ; !(y j )],
! !
y j ∈ f (E j ), et f (E) = f ( m
j=1 E ) =
j
j=1 f (E ). AEn posant,
m j
B
pour chaque
1 ≤ j ≤ m, F = f (E ), on obtient une division (y j , F j ) 1≤j≤m !-fine de
j j

f (E).

4.7 Théorème des bornes atteintes et extrémants


La proposition que nous venons de démontrer peut être précisée dans le cas
d’une fonction à valeurs réelles : c’est le théorème des bornes atteintes
138 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES

ou théorème de Weierstrass et l’on peut en donner une démonstration


directe indépendante des résultats de la section précédente.
Théorème. Soit E un fermé borné de Rn et f une fonction de Rn dans R
continue sur E. Alors, il existe u ∈ E et v ∈ E tels que, pour tout x ∈ E,
on ait

f (u) ≤ f (x) ≤ f (v). (4.5)

Démonstration. Notons tout d’abord qu’il suffit de démontrer l’existence


d’un v ∈ E pour lequel l’inégalité de droite dans (4.5) est vérifiée car celle
de u se déduit alors de ce résultat appliqué à −f . Supposons qu’un tel v
n’existe pas; alors,

(∀v ∈ E)(∃xv ∈ E) : f (xv ) > f (v).

Choissons ! = 12 (f (xv ) − f (v)) dans la définition de la continuité de f en v;


on obtient ainsi un δ = δ(v) > 0 tel que

1
(∀y ∈ dom f ∩ B∞ [v; δ(v)]) : f (y) − f (v) ≤ (f (xv ) − f (v)),
2
et dès lors
1
(∀y ∈ dom f ∩ B∞ [v; δ(v)]) : f (y) ≤ (f (xv ) + f (v)) < f (xv ). (4.6)
2
En appliquant le lemme de Cousin à AE pour Bla jauge δ : v 2→ δ(v) ainsi
obtenue, on obtient une division δ-fine (v j , E j ) 1≤j≤m de E. Soit 1 ≤ l ≤ m
tel que
f (xvl ) = max{f (xvj ) : 1 ≤ j ≤ m}.
Si y ∈ E, il existe un 1 ≤ i ≤ m tel que y ∈ E i ⊂ E ∩ B∞ [v i ; δ(v i)], et donc
tel que
f (y) < f (xvi ) ≤ f (xvl ).
En prenant y = xvl dans cette inégalité, on obtient une contradiction.
Remarque. Le théorème de Weierstrass est faux si E n’est pas fermé ou
n’est pas borné. Ainsi, l’identité sur R est continue sur ]0, 1[ mais il n’existe
ni u ∈ ]0, 1[ ni v ∈ ]0, 1[ tels que, pour tout x ∈ ]0, 1[, on ait u ≤ x ≤ v (le
montrer par l’absurde). De même il n’existe ni u ∈ R ni v ∈ R tels que, pour
tout x ∈ R, on ait u ≤ x ≤ v.
Donnons quelques conséquences utiles du théorème de Weierstrass.
4.7. THÉORÈME DES BORNES ATTEINTES ET EXTRÉMANTS 139

Corollaire. Soit E un fermé borné de Rn et f une fonction de Rn dans R


continue sur E et strictement positive en chaque point de E. Alors il existe
r > 0 tel que, pour tout x ∈ E, on a f (x) ≥ r.
Démonstration. Par le théorème de Weierstrass, il existe u ∈ E tel que,
pour tout x ∈ R, on ait
f (x) ≥ f (u) (> 0).
Il suffit donc de prendre r = f (u).
Remarque. Le premier exemple de la remarque précédente montre que le
Corollaire est faux si E n’est pas fermé. D’ailleurs, le Corollaire est faux si E
n’est pas borné car la fonction x 2→ x1 est continue sur [1, +∞[ et il n’existe
pas de r > 0 tel que x1 ≥ r pour tout x ≥ 1 (le vérifier).
Corollaire. Soit f une fonction de R dans R continue et non constante sur
[a, b]. Alors il existe u ∈ [a, b] et v ∈ [a, b] tels que

f ([a, b]) = [f (u), f (v)].

Démonstration. Par le théorème de Weierstrass et le fait que f n’est pas


constante, il existe u ∈ [a, b] et v ∈ [a, b] tels que f (u) < f (v) et

f ([a, b]) ⊂ [f (u), f (v)].

D’autre part, si d ∈ [f (u), f (v)], le théorème des valeurs intermédiaires en-


traı̂ne l’existence d’un c ∈ [a, b] tel que f (c) = d, et dès lors [f (u), f (v)] ⊂
f ([a, b]).
Remarque. Le Corollaire que nous venons de démontrer montre que l’image
d’un intervalle fermé par une fonction continue non constante est un inter-
valle fermé. L’exemple de la fonction x 2→ 1−x
1
2 continue sur ] − 1, 1[ montre
que l’image d’un intervalle ouvert n’est pas nécessairement un intervalle ou-
vert.
Corollaire. Soit E un fermé non borné de Rn et f une fonction de Rn dans
R continue sur E et telle que

f (x) → +∞ si x → ∞.

Alors il existe un y ∈ E tel que, pour tout x ∈ E, on ait

f (y) ≤ f (x).
140 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES

Démonstration. Soit a ∈ E fixé; par hypothèse, il existe ρ > 0 tel que,


pour tout x ∈ E vérifiant |x|2 > ρ, on a f (x) > f (a). En particulier, |a|2 ≤ ρ.
Comme E ∩ B2 [ρ] est un fermé borné, le théorème de Weierstrass entraı̂ne
l’existence d’un y ∈ E ∩ B2 [ρ] tel que, pour tout x ∈ E ∩ B2 [ρ], on ait

f (y) ≤ f (x).

En particulier, f (y) ≤ f (a), et dès lors, pour tout x ∈ E tel que |x|2 > ρ, on
aura
f (y) ≤ f (a) < f (x).

Ce corollaire fournit une intéressante démonstration du théorème de


d’Alembert ou théorème fondamental de l’algèbre qui généralise le
résultat que nous avons déjà obtenu pour un polynôme de la forme z n − c.
Corollaire. Tout polynôme sur C de degré supérieur ou égal à un possède
au moins un zéro.
%
Démonstration. Soit p : C → C, z 2→ m k=0 ak z un polynôme de degré
k

m ≥ 1. On a donc, pour chaque 0 ≤ k ≤ m, ak ∈ C et am /= 0. Montrons


d’abord l’existence d’un u ∈ C tel que, pour tout z ∈ C, on a

|p(z)| ≥ |p(u)|. (4.7)

Pour ce faire, on note que l’application |p| : C 2→ R est continue et que, pour
tout z /= 0, on a
# & '# & '
# m−1
$ ak # m−1
$ |ak |
# k−m #
|p(z)| = #am z m
1+ z # ≥ |am ||z| m
1− |z| k−m
.
# am # |am |
k=0 k=0

Puisque
m−1
$ |ak | k−m
|z| → 0 si z → ∞,
k=0
|am |
il existera ρ > 0 tel que
m−1
$ |ak | k−m 1
|z| ≤
k=0
|am | 2

pour tout z ∈ C tel que |z| ≥ ρ. On a donc, si |z| ≥ ρ,


|am | m
|p(z)| ≥ |z| ,
2
4.7. THÉORÈME DES BORNES ATTEINTES ET EXTRÉMANTS 141

et dès lors
|p(z)| → +∞ si z → ∞,
L’existence d’un u ∈ C vérifiant (4.7) résulte du corollaire précédent.
La deuxième partie de la démonstration consiste à montrer que p(u) = 0.
Si p(u) /= 0, la fonction q définie par q(z) = p(u+z)
p(u) est un polynôme sur C
de degré m tel que q(0) = 1 et |q(z)| ≥ 1 pour tout z ∈ C. En conséquence,
q est de la forme
m
$
q(z) = 1 + bk z k ,
k=j

avec 1 ≤ j ≤ m, bj /= 0, bm /= 0. Soit r > 0 tel que r j |bj | < 1. Pour



tout z ∈ C tel que z j = −r j |bjj | , (et l’existence d’un tel z a été démontrée
précédemment), on a

|z| = r, 1 + bj z j = 1 − r j |bj | > 0,

et dès lors
m
$ m
$
|q(z)| ≤ |1 + bj z j | + |bk ||z|k = 1 − r j |bj | + |bk |r k
k=j+1 k=j+1

 
m−j
$
= 1 − r j |bj | − |bj+k |r k  .
k=1

On en déduit aussitôt que |q(z)| < 1 si l’on diminue éventuellement r > 0


de telle sorte que
m−j
$
|bj+k |r k < |bj |,
k=1

ce qui est contradictoire.


Le résultat du théorème de Weierstrass conduit à la terminologie suivante
pour les fonctions à valeurs réelles.
Définition. Soit f une fonction de Rn dans R et E ⊂ dom f . On dit que
a ∈ E est un maximant (resp. minimant) de f sur E, ou encore que f
possède en a un maximum (resp. minimum) sur E, si, pour tout x ∈ E, on
a
f (x) ≤ f (a) (resp. f (x) ≥ f (a)).
142 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES

On écrit dans ce cas


f (a) = max f (resp. f (a) = min f ),
E E
ou
f (a) = max f (x) (resp. f (a) = min f (x)),
x∈E x∈E
ou encore
f (a) = max{f (x) : x ∈ E} (resp. f (a) = min{f (x) : x ∈ E}).
On dit également que a ∈ E est un extrémant de f sur E (ou que f possède
un extrémum sur E) si a est un minimant ou est un maximant de f sur E.
Le théorème de Weierstrass montre donc que toute fonction réelle con-
tinue sur un fermé borné E possède un maximum et un minimum sur E. Il
ne fournit malheureusement aucune information quant à la localisation du
minimant et du maximant correspondant. De telles informations peuvent
se déduire de conditions nécessaires pour qu’un point de Rn soit extrémant
sur E d’une fonction de Rn dans R. De telles conditions nécessaires peu-
vent s’obtenir plus généralement dans le cas d’extrémants locaux, ce qui nous
conduit à localiser les notions de maximant et de minimant.
Définition. Soit f une fonction de Rn dans R et E ⊂ dom f . On dit que
a ∈ E est un maximant (resp. minimant) local de f sur E s’il existe un δ > 0
tel que a soit un maximant (resp. minimant) de f sur E ∩ B2 [a; δ]. Cette
propriété s’exprime également en disant que f possède en a un maximum
(resp. minimum) local sur E. On appellera généralement extrémant local
de f sur E un point de E qui est maximant local ou minimant local de f
sur E.
Tout maximant (resp. minimant) de f sur E est évidemment un maxi-
mant (resp. minimant) local de f sur E. Par contre, l’application f : x 2→
x3
3 − x de R dans R a un maximant local sur R en −1 et un minimant local
sur R en 1, mais n’a ni maximant ni minimant sur R.
Les extrémants locaux les plus simples à étudier sont ceux qui sont
intérieurs au domaine de la fonction. Ils ont droit à une terminologie propre.
Définition. Soit f une fonction de Rn dans R. On dit que a ∈ Rn est un
maximant (resp. minimant) local libre de f si a ∈ int dom f et si a est un
maximant (resp. minimant) local de f sur Rn . Un extrémant local libre de
f est un point qui est maximant ou minimant local libre de f .
x3
Par exemple, les extrémants locaux de l’application x 2→ 3 −x considérée
plus haut sont libres.
4.8. THÉORÈMES DE FERMAT ET DE ROLLE 143

Les deux notions locales que nous venons d’introduire sont liées par la
Proposition suivante.
Proposition. Soit f une fonction de Rn dans R, E ⊂ dom f et a ∈ E. Si a
est maximant (resp. minimant) local libre de f , alors a est maximant (resp.
minimant) local de f sur E. Si a est maximant (resp. minimant) local de f
sur E et si a ∈ int E, alors a est maximant (resp. minimant) local libre de
f.
Démonstration. La première assertion est immédiate. La seconde résulte
aisément du fait que, puisque E est voisinage de a, E ∩B2 [a; δ] sera voisinage
de a quel que soit δ > 0.

Définition. Soit f une fonction de Rn dans R, E ⊂ dom f et a ∈ E. On


dira que a est maximant (resp. minimant) local lié de f sur E si a n’est
pas intérieur à E et est maximant (resp. minimant) local de f sur E. Un
extrémant local lié de f sur E sera un maximant ou un minimant local lié
de f sur E.
3
Ainsi, pour l’application f : x 2→ x3 − x de R dans R considérée plus
haut, 0 est un extrémant local lié de f sur E = [0, +∞[ et sur E = ] − ∞, 0].

4.8 Théorèmes de Fermat et de Rolle


On peut obtenir d’intéressantes conditions nécessaires d’existence d’un ex-
trémant local libre d’une fonction de Rn dans R lorsque f possède en ce
point une dérivée directionnelle. C’est ce qu’exprime le résultat suivant,
appelé théorème de Fermat pour rappeler une condition similaire trouvée,
dans le cas d’un polynôme réel, par Pierre de Fermat, en 1629, c’est-à-dire
environ cinquante ans avant l’invention du calcul différentiel, et que Johannes
Kepler avait déjà exprimée d’une manière qualitative en 1615, en observant
qu’une fonction réelle varie très peu au voisinage d’un extrémum.
Théorème. Soit f une fonction de Rn dans R et a un extrémant local libre
de f . Si f possède en a une dérivée dans la direction u, alors f $ (a; u) = 0.
Démonstration. Supposons pour fixer les idées que a soit un maximant
local libre de f (sinon, il suffit de considérer −f .) Par hypothèse, on peut
donc trouver r > 0 tel que B2 [a; r] ⊂ dom f et tel que, pour tout x ∈ B2 [a; r],
on ait
f (x) ≤ f (a).
144 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES

En particulier, pour tout réel t tel que 0 < |t| ≤ r, on aura a + tu ∈ B2 [a; r],
et dès lors
f (a + tu) − f (a) ≤ 0.
En conséquence, pour 0 < t ≤ r, on aura
f (a + tu) − f (a)
≤ 0,
t
d’où, en faisant tendre t vers 0,
f (a + tu) − f (a)
f $ (a; u) = lim ≤ 0.
t→0; t>0 t
De même, pour −r ≤ t < 0, on aura
f (a + tu) − f (a)
≥ 0,
t
d’où, en faisant tendre t vers 0,
f (a + tu) − f (a)
f $ (a; u) = lim ≥ 0.
t→0; t<0 t
Par conséquent, f $ (a; u) = 0.
Remarques. 1. La condition de Fermat n’est nullement suffisante pour que
a soit extrémant local libre de f ; ainsi, pour l’application f de R définie par
f (x) = x3 , on a f $ (0) = 0, et pourtant 0 n’est ni maximant, ni minimant
local libre de f , puisque x3 < 0 si x < 0 et x3 > 0 si x > 0.
2. La condition de Fermat n’est nullement nécessaire si a est un extrémant
local lié de f ; ainsi l’application identité sur R possède en 0 un minimant
local sur E = [0, +∞[ et f $ (0) = 1.
Corollaire. Si f est une fonction de Rn dans R qui possède en a ∈ Rn
un extrémant local libre et des dérivées partielles par rapport à toutes les
variables, alors on a

D1 f (a) = D2 f (a) = . . . = Dn f (a) = 0.

En particulier, si f est dérivable en un extrémant local libre a, on a fa$ = 0.


Démonstration. C’est une conséquence immédiate du théorème de Fer-
mat et du lien entre dérivée totale et dérivées partielles.
Ce corollaire conduit à la définition suivante.
4.8. THÉORÈMES DE FERMAT ET DE ROLLE 145

Définition. Soit f une fonction de Rn dans R et a ∈ dom f tel que, pour


chaque 1 ≤ k ≤ n, Dk f (a) existe. On dit que a est un point critique ou un
point stationnaire de f si, pour chaque 1 ≤ k ≤ n, on a Dk f (a) = 0. f (a)
est alors appelée une valeur critique de f .
Le Corollaire du théorème de Fermat affirme donc que tout extrémant
local libre de f en lequel f possède des dérivées partielles par rapport à chaque
variable est un point critique de f . L’exemple ci-dessus montre qu’un point
critique n’est pas nécessairement extrémant local libre. Lorsque n = 1,
un point critique qui n’est pas extrémant local libre est appelé un point
d’inflexion. Lorsque n ≥ 2, un point critique qui n’est pas extrémant local
libre est appelé un col ou un point de selle. Un exemple est donné par 0 pour
l’application f de R2 dans R définie par f (x1 , x2 ) = x1 x2 . On a en effet

D1 f (0, 0) = 0 = D2 f (0, 0),

ce qui montre que 0 est un point critique de f , mais, pour tout r > 0,

f (r, r) = r 2 > 0 = f (0, 0) > f (r, −r) = −r 2 ,

ce qui montre que 0 ne peut être ni maximant local libre, ni minimant local
libre.
Une conséquence très utile des théorèmes de Weierstrass et de Fermat est
une condition suffisante d’existence d’un point critique, appelé théorème
généralisé de Rolle, en référence à un cas particulier pour des polynômes
réels énoncé en 1691 par Michel Rolle (qui fut pourtant un farouche ad-
versaire du calcul différentiel naissant).
Théorème. Soit f une fonction de Rn dans R et E une partie de Rn vérifiant
les conditions suivantes.
1. E est fermé, borné et d’intérieur non vide.
2. f est continue sur E.
3. Pour chaque 1 ≤ k ≤ n, Dk f (x) existe en chaque x ∈ int E.
4. f est constante sur fr E.
Alors, f possède au moins un point critique c ∈ int E.
Démonstration. Si f est constante sur E, alors pour chaque a ∈ int E,
on a fa$ = 0 et le théorème est démontré. Si f n’est pas constante sur E, le
théorème des bornes atteintes de Weierstrass entraı̂ne l’existence d’un u ∈ E
et d’un v ∈ E tels que, pour tout x ∈ E, on ait f (u) ≤ f (x) ≤ f (v), et,
comme f n’est pas constante sur E, on a nécessairement f (u) < f (v), et
donc u /= v. Comme f est constante sur fr E, u et v ne peuvent tous les
146 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES

deux appartenir à fr E = adh E \ int E = E \ int E. L’un d’entre eux au


moins, appelons-le c, appartient à int E et est donc un extrémant local libre
de f . Par le théorème de Fermat, Dk f (c) = 0 pour chaque 1 ≤ k ≤ n et c
est un point critique de f .
Le cas particulier suivant lorsque n = 1 et E = [a, b] est généralement
appelé théorème de Rolle.
Corollaire. Soit f une fonction de R dans R et [a, b] un intervalle fermé
vérifiant les conditions suivantes.
1. f est continue sur [a, b].
2. f est dérivable en chaque point de ]a, b[.
3. f (a) = f (b).
Alors il existe au moins un c ∈ ]a, b[ tel que f $ (c) = 0.
Le graphe de toute fonction vérifiant les conditions du théorème de Rolle
possède donc, en un point au moins, une tangente parallèle au segment
de droite joignant l’origine et l’extrémité du graphe. Chaque hypothèse
est essentielle dans le théorème de Rolle comme le montrent les exemples
suivants sur [−1, 1] pour lesquels la dérivée ne s’annule en aucun point de
] − 1, 1[ : f (x) = x (f (−1) /= f (1)), f (x) = |x| (f n’est pas dérivable en 0)
et f (x) = x si x ∈ [−1, 1[, f (1) = 0 (f n’est pas continue en 1.)

4.9 Théorème de Cauchy et règle de l’Hospital


On peut généraliser le théorème de Rolle à un couple de fonctions réelles
d’une variable réelle. C’est le théorème de la moyenne de Cauchy.
Proposition. Soient f et g deux fonctions de R dans R continues sur [a, b]
et dérivables en chaque point de ]a, b[. Alors il existe au moins un c ∈ ]a, b[
tel que
[f (b) − f (a)]g $(c) = [g(b) − g(a)]f $(c).
Démonstration. Il est clair que la fonction h de R dans R définie par

h(x) = [f (b) − f (a)]g(x) − [g(b) − g(a)]f (x)

est continue sur [a, b], dérivable sur ]a, b[ et, pour tout x ∈ ]a, b[, on a

h$ (x) = [f (b) − f (a)]g $(x) − [g(b) − g(a)]f $(x).

En outre,
h(a) = f (b)g(a) − g(b)f (a) = h(b).
4.9. THÉORÈME DE CAUCHY ET RÈGLE DE L’HOSPITAL 147

Le théorème de Rolle appliqué à h entraı̂ne donc l’existence d’un c ∈ ]a, b[


tel que h$ (c) = 0.
L’interprétation géométrique du théorème de Cauchy est la suivante. Si
l’on considère (f, g) : [a, b] → R2 comme la représentation paramétrique
d’une courbe du plan, le théorème de Cauchy affirme, dans le cas non trivial
où (f (a), g(a)) /= (f (b), g(b)), l’existence d’un point de la courbe, différent
de (f (a), g(a)) et (f (b), g(b)) en lequel la tangente à la courbe est parallèle
au segment de droite joignant (f (a), g(a)) à (f (b), g(b)).
En renforçant les hypothèses, on peut écrire la conclusion du théorème
de Cauchy sous forme d’une égalité entre quotients.
Corollaire. Soient f et g deux fonctions de R dans R continues sur [a, b]
et dérivables en chaque point de ]a, b[. Si l’une des conditions suivantes est
satisfaite :
1. g(a) /= g(b) et |f $ (x)| + |g $ (x)| =
/ 0 pour chaque x ∈ ]a, b[.
2. g $ (x) /= 0 pour tout x ∈ ]a, b[.
Alors g(b) /= g(a) et il existe au moins un c ∈ ]a, b[ tel que g $ (c) /= 0 et
f (b) − f (a) f $ (c)
= $ .
g(b) − g(a) g (c)
Démonstration. Le résultat se déduit immédiatement du théorème de
Cauchy si l’on peut montrer que les quantités apparaissant aux dénomina-
teurs sont différentes de zéro. Dans le cas de l’hypothèse 1, si c ∈ ]a, b[ est
tel que
[f (b) − f (a)]g $(c) = [g(b) − g(a)]f $(c),
et si g $ (c) = 0, alors, comme g(b) /= g(a), on a nécessairement f $ (c) = 0,
ce qui est exclus par hypothèse. Dans le cas de l’hypothèse 2, il suffit de
montrer que g(b) /= g(a). Si g(b) = g(a), le théorème de Rolle appliqué
à g entraı̂ne l’existence d’un c$ ∈ ]a, b[ tel que g $ (c$ ) = 0, ce qui contredit
l’hypothèse.
La version “quotient” du théorème de Cauchy conduit à une règle per-
mettant, dans certains cas, de prouver l’existence et de calculer la limite d’un
quotient de deux fonctions réelles d’une variable réelle lorsque la limite du
numérateur et du dénominateur sont toutes deux nulles. C’est une première
forme de la règle de l’Hospital, l’un des plus anciens théorèmes du calcul
différentiel puisque, quoique dû à Jean Bernoulli, il figure dans le premier
traité de calcul différentiel jamais publié, l’Analyse des infiniments petits
pour l’intelligence des lignes courbes du Marquis Guillaume de l’Hospital
(1696).
148 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES

Proposition. Soit I un intervalle ouvert de R, a son origine ou son extrémi-


té, f et g des fonctions réelles d’une variable réelles dérivables en chaque
point de I. Supposons satisfaites les conditions suivantes.
1. limx→a, x∈I f (x) = 0 = limx→a, x∈I g(x).
2. g $ (x) /= 0 pour chaque x ∈ I.
"
3. limx→a, x∈I fg" (x) = b.
Alors,
f
lim (x) = b.
x→a, x∈I g

Démonstration. Supposons pour fixer les idées que a soit l’extrémité


de I, l’autre cas se traitant de même. Soient respectivement F et G les
prolongements de f et g à I ∪ {a} définis par F (a) = 0 = G(a). Il résulte de
l’hypothèse 1 que F et G sont continus sur I ∪ {a} et dérivables en chaque
point de I puisqu’ils coı̈cident respectivement avec f et g sur I. Soit ! > 0;
par l’hypothèse 3, il existe δ > 0, que l’on peut toujours choisir suffisamment
petit pour que a − δ ∈ I, tel que
# $ # # $ #
# f (y) # # F (y) #
(∀y ∈ I : a − δ ≤ y < a) : # $
# − b## = # #
# G$ (y) − b# ≤ !.
g (y)

D’autre part, pour chaque x ∈ [a − δ, a[, la version quotient du théorème


de Cauchy appliqué à F et G sur l’intervalle [x, a] entraı̂ne l’existence d’un
c ∈ ]x, a[ ⊂ ]a − δ, a[ tel que

f (x) F (a) − F (x) F $ (c) f $ (c)


= = $ = $ ,
g(x) G(a) − G(x) G (c) g (c)

et dès lors tel que # # # $ #


# f (x) # # f (c) #
# − b #= # − b # ≤ !,
# g(x) # # g $(c) #

ce qui démontre la thèse.


En utilisant l’équivalence entre l’existence de la limite à gauche et de
la limite à droite de a d’une fonction de R dans R avec l’existence de la
limite de cette fonction pour x tendant vers a par valeurs différentes de a,
on obtient aussitôt la version suivante de la règle de l’Hospital.
Corollaire. Soit I un intervalle ouvert de R, a ∈ I, f et g des fonctions
réelles d’une variable réelles dérivables en chaque point de I \{a}. Supposons
satisfaites les conditions suivantes.
1. limx→a, x(=a f (x) = 0 = limx→a, x(=a g(x).
4.9. THÉORÈME DE CAUCHY ET RÈGLE DE L’HOSPITAL 149

2. g $ (x) /= 0 pour chaque x ∈ I \ {a}.


"
3. limx→a, x(=a fg" (x) = b.
Alors,
f
lim (x) = b.
x→a, x(=a g
1/3
Exemple. La fonction de R dans R définie par x 2→ (x+1)x −1 est de la
forme fg avec f (x) = (x + 1)1/3 − 1 et g(x) = x. Ces fonctions vérifient les
conditions du Corollaire ci-dessus avec f $ (x) = 3(x+1)
1
2/3 et g (x) = 1, et dès
$

lors
(x + 1)1/3 − 1 1 1
lim = lim = .
x→0, x(=0 x x→0, x(=0 3(x + 1)2/3 3
On a également une version correspondante de la règle de l’Hospital
lorsque x tend vers +∞ ou vers −∞. Sa démonstration, tout à fait semblable
à celle de la Proposition ci-dessus, est laissée comme exercice au lecteur.
Proposition. Soit I = ]a, +∞[ (resp. I = ] − ∞, b[) un intervalle ouvert
non borné de R, f et g des fonctions réelles d’une variable réelles dérivables
en chaque point de I. Supposons satisfaites les conditions suivantes.
1. limx→+∞ f (x) = 0 = limx→+∞ g(x)
(resp. limx→−∞ f (x) = 0 = limx→−∞ g(x)).
2. g $ (x) /= 0 pour chaque x ∈ I.
"
3. limx→+∞ fg" (x) = b
f"
(resp. limx→−∞ g " (x) = b).
Alors,
f
lim (x) = b
x→+∞ g
(resp. limx→−∞ fg (x) = b).
On dispose également d’une règle de l’Hospital pour couvrir certaines
situations où g tend vers l’infini et f n’est pas nécessairement localement
bornée. Nous la traitons dans le cas d’une limite lorsque x tend vers a, le
cas où x tend vers +∞ ou −∞ étant laissé au lecteur.
Proposition. Soit I un intervalle ouvert de R, a son origine ou son extrémi-
té, f et g des fonctions de R dans R dérivables en chaque point de I. Sup-
posons satisfaites les conditions suivantes.
1. limx→a, x∈I g(x) = +∞.
2. Pour tout x ∈ I, on a g $(x) /= 0.
150 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES

f"
3. limx→a, x∈I g " (x) = b.
Alors, limx→a, x∈I fg (x) = b.
Démonstration. Supposons pour fixer les idées que a soit l’extrémité de
I, l’autre cas étant semblable. Si ! > 0 est donné, alors, par l’hypothèse 3,
il existe δ $ > 0 tel que a − δ $ ∈ I et tel que, pour tout y ∈ [a − δ $ , a[, on a
# $ #
#f #
# (y) − b# ≤ ! .
# g$ # 2
D’autre part, en vertu de l’hypothèse 1, il existe δ $$ > 0 tel que a − δ $$ ∈ I
et tel que, pour tout y ∈ [a − δ $$ , a[, on a g(y) > 0. Posons δ $$$ = min{δ $ , δ $$}
et soient
a − δ $$$ ≤ y < x < a.
Le théorème de Cauchy sous forme quotient appliqué à l’intervalle [y, x]
entraı̂ne l’existence d’un c ∈ ]y, x[, et donc appartenant à [a − δ $$$ , c[, tel que
f (x) − f (y) f $ (c)
= $ ,
g(x) − g(y) g (c)
ce qui donne # # # $ #
# f (x) − f (y) # # f (c) #
# − b #= # − b # ≤ !.
# g(x) − g(y) # # g $ (c) # 2
Dès lors, pour ces mêmes x,
# # #4 54 5 #
# f (x) # # f (x) − f (y) f (y) ##
# − b #= # 1 − g(y) − b −
g(y)
b +
# g(x) # # g(x) g(x) − g(y) g(x) g(x) #
4 5
|g(y)| ! |g(y)| |f (y)|
≤ 1+ + |b| +
|g(x)| 2 |g(x)| |g(x)|
4 5
! ! |g(y)| |f (y)|
= + + |b| + .
2 2 |g(x)| |g(x)|
Le point y étant maintenant fixé, il résulte de l’hypothèse 1 qu’on peut
trouver un δ ∈ ]0, δ $$$] tel que, si x ∈ [a − δ, a[, on a
24 5 3
2 !
|g(x)| ≥ + |b| |g(y)| + |f (y)| ,
! 2
et dès lors # #
#f #
# (x) − b# ≤ ! + ! = !.
#g # 2 2
4.10. THÉORÈMES DE LAGRANGE ET DE LA MOYENNE 151

Remarque. Le lecteur pourra également vérifier que, toutes autres hy-


pothèses étant égales,

f
lim (x) = +∞ (resp. − ∞)
x→a g
lorsque
f$
lim (x) = +∞ (resp. − ∞),
x→a g $

a pouvant lui-même être remplacé par +∞ ou par −∞.

4.10 Théorèmes de Lagrange et de la moyenne


Un cas particulier immédiat mais important du théorème de Cauchy est
le résultat suivant, qui porte le nom de théorème de la moyenne de
Lagrange ou de formule des accroissements finis.
Théorème. Soit f une fonction de R dans R continue sur [a, b] et dérivable
en chaque point de ]a, b[. Alors, il existe c ∈ ]a, b[ tel que

f (b) − f (a) = (b − a)f $ (c).

Démonstration. Il suffit de prendre pour g l’identité dans le théorème de


Cauchy.
Géométriquement, le théorème de Lagrange assure l’existence d’un point
c ∈ ]a, b[ tel que la tangente en (c, f (c)) au graphe de f est parallèle au
segment de droite joignant les points (a, f (a)) et (b, f (b)). Comme tout
c ∈ ]a, b[ est de la forme a + θ(b − a) pour un certain θ ∈ ]0, 1[, le théorème
de Lagrange affirme l’existence d’un θ ∈ ]0, 1[ tel que

f (b) − f (a) = (b − a)f $ (a + θ(b − a)).

On a des théorèmes de Lagrange pour les fonctions de Rn dans


R. Donnons d’abord une version faisant intervenir la dérivée directionnelle.
Théorème. Soit f une fonction de Rn dans R, a ∈ Rn , u ∈ Rn tel que
|u|2 = 1 et T > 0 tels que f soit continue sur S = {a + tu : t ∈ [0, T ]} et
dérivable dans la direction u en chaque point de S0 = {a + tu : t ∈ ]0, T [}.
Alors il existe θ ∈ ]0, 1[ tel que

f (a + T u) − f (a) = T f $ (a + θT u; u).
152 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES

Démonstration. Par hypothèse, la fonction g : t 2→ f (a + tu) est une


fonction de R dans R qui vérifie les conditions du théorème de Lagrange sur
[0, T ], et, par définition de la dérivée directionnelle, on a g $ (t) = f $ (a + tu; u)
pour chaque t ∈ ]0, T [. En conséquence, il existe θ ∈ ]0, 1[ tel que

f (a + T u) − f (a) = g(T ) − g(0) = T g $ (θT ) = T f $ (a + θT u; u).

Donnons maintenant une version faisant intervenir la dérivée totale.


Théorème. Soit f une fonction de Rn dans R, a ∈ Rn , b ∈ Rn , S =
{a + t(b − a) : t ∈ [0, 1]} et S0 = {a + t(b − a) : t ∈ ]0, 1[} vérifiant les
conditions suivantes.
1. f est continue sur S.
2. Chaque point de S0 est intérieur à dom f .
3. f est dérivable en chaque point de S0 .
Alors il existe θ ∈ ]0, 1[ tel que
$
f (b) − f (a) = fa+θ(b−a) (b − a),

ou encore il existe c ∈ S0 tel que

f (b) − f (a) = fc$ (b − a).

Démonstration. Soit h l’application affine de R dans Rn définie par


h(t) = a + t(b − a). Elle est dérivable en chaque point de R. Par le théorème
de continuité et de dérivabilité des fonctions composées, la fonction f ◦ h
sera continue sur [0, 1] et dérivable en chaque point de ]0, 1[. En outre, pour
chaque t ∈ ]0, 1[, on a

(f ◦ h)$ (t) = (f ◦ h)$t (1) = (fh(t)


$
◦ h$t )(1) = fh(t)
$
(h$ (t)) = fh(t)
$
(b − a).

Le théorème de Lagrange entraı̂ne donc l’existence d’un θ ∈ ]0, 1[ tel que

f [h(1)] − f [h(0)] = (f ◦ h)$ (θ),

et dès lors tel que


f (b) − f (a) = fh(θ)
$
(b − a),
et il suffit de poser c = h(θ) = a + θ(b − a).
4.10. THÉORÈMES DE LAGRANGE ET DE LA MOYENNE 153

Corollaire. Soit f une fonction de Rn dans R, a ∈ Rn et r > 0 tel que f


soit dérivable en chaque point de B2 (a; r). Alors, pour chaque 1 ≤ k ≤ n et
chaque h ∈ R tel que 0 < |h| < r, il existe θ ∈ ]0, 1[ tel que

f (a + hek ) − f (a) = hDk f (a + θhek ).

Démonstration. Les conditions du théorème de Lagrange sont satisfaites


pour b = a + hek . Dès lors, il existe θ ∈ ]0, 1[ tel que
$ $
f (a + hek ) − f (a) = fa+θhek (he ) = hfa+θhek (e ) = hDk f (a + θhe ).
k k k

Le théorème de Lagrange est faux pour les fonctions à valeurs dans


Rp lorsque p ≥ 2. Ainsi, la fonction f de R dans R2 définie par f (x) =
(cos x, sin x) est dérivable (et donc continue) en chaque point x de R et
telle que f (2π) − f (0) = 0. D’autre part, pour tout x ∈ R, on a f $ (x) =
(− sin x, cos x), et donc |f $ (x)|2 = 1. Il ne peut donc exister de c ∈ ]0, 2π[ tel
que f (2π) − f (0) = 2πf $ (c).
Toutefois, une version affaiblie, s’exprimant en termes d’inégalité ou
lieu d’égalité, mais tout aussi utile pour les applications, subsiste pour les
fonctions à valeurs vectorielles. Donnons tout d’abord l’inégalité de la
moyenne pour les fonctions de R dans Rp.
Théorème. Soit f une fonction de R dans Rp continue sur [a, b] et dérivable
en chaque point de ]a, b[. Alors il existe c ∈ ]a, b[ tel que

|f (b) − f (a)|2 ≤ (b − a)|f $ (c)|2.

Démonstration. Le théorème est évident si f (b) − f (a) = 0. Si f (b) −


f (a) /= 0, définissons la fonction g de R dans R par
n
$
g(x) = (f (b) − f (a)|f (x)) = [fk (b) − fk (a)]fk (x)
k=1

pour chaque x ∈ dom f. On montre sans peine qu’elle est continue sur [a, b]
et dérivable en chaque point x ∈ ]a, b[, avec

g $ (x) = (f (b) − f (a)|f $ (x)).

En lui appliquant le théorème de Lagrange, on obtient l’existence d’un c ∈


]a, b[ tel que
g(b) − g(a) = (b − a)g $(c),
154 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES

c’est-à-dire tel que

|f (b) − f (a)|22 = (b − a)(f (b) − f (a)|f $ (c)).

La thèse s’en déduit en utilisant l’inégalité de Cauchy

|(f (b) − f (a)|f $ (c))| ≤ |f (b) − f (a)|2 |f $ (c)|2,

et en simplifiant les deux membres de l’inégalité obtenue par |f (b) − f (a)|2.

Remarque. Le théorème précédent peut encore s’exprimer en disant qu’il


existe θ ∈ ]0, 1[ tel que

|f (b) − f (a)|2 ≤ (b − a)|f $ (a + θ(b − a))|2 .

Une conséquence utile de cette inégalité de la moyenne pour les fonctions


vectorielles est une caractérisation des fonctions constantes en termes
de dérivabilité.
Corollaire. Soit I ⊂ R un intervalle borné ou non et f une fonction de R
dans Rp dérivable en chaque point de I. Alors f est constante sur I si et
seulement si, pour chaque x ∈ I, on a f $ (x) = 0.
Démonstration. La condition nécessaire a déjà été obtenue dans le chapi-
tre sur la dérivabilité. Pour la condition suffisante, si a < b sont deux
points de I, alors f est dérivable sur [a, b] et le théorème de la moyenne et
l’hypothèse sur f $ (x) entraı̂nent l’existence d’un c ∈ ]a, b[ (et donc contenu
dans I) tel que

0 ≤ |f (b) − f (a)|2 ≤ (b − a)|f $ (c)|2 = 0,

et dès lors tel que f (b) = f (a). Comme a et b sont arbitraires dans I, f est
constante sur I.
Nous pouvons maintenant énoncer et démontrer des inégalités de la
moyenne pour les fonctions de Rn dans Rp. La première s’exprime en
termes de dérivée directionnelle.
Théorème. Soit f une fonction de Rn dans Rp , a ∈ Rn , u ∈ Rn tel que
|u|2 = 1 et T > 0 tels que f soit continue sur S = {a + tu : t ∈ [0, T ]} et
dérivable dans la direction u en chaque point de S0 = {a + tu : t ∈ ]0, T [}.
Alors il existe θ ∈ ]0, 1[ tel que

|f (a + T u) − f (a)|2 ≤ T |f $ [a + θT u; u]|2 .
4.10. THÉORÈMES DE LAGRANGE ET DE LA MOYENNE 155

Démonstration. Par hypothèse, la fonction g : t 2→ f (a + tu) est une


fonction de R dans Rp qui vérifie les conditions du théorème de la moyenne
sur [0, T ], et, par définition de la dérivée directionnelle, on a g $ (t) = f $ (a +
tu; u) pour chaque t ∈ ]0, T [. En conséquence, il existe θ ∈ ]0, 1[ tel que

|f (a + T u) − f (a)|2 = |g(T ) − g(0)|2 ≤ T |g $ (θT )|2 = T |f $ (a + θT u; u)|2 .

On a aussi la version suivante en termes de dérivée totale.


Théorème. Soit f une fonction de Rn dans Rp , a ∈ Rn , b ∈ Rn , S =
{a + t(b − a) : t ∈ [0, 1]} et S0 = {a + t(b − a) : t ∈ ]0, 1[} vérifiant les
conditions suivantes.
1. f est continue sur S.
2. Chaque point de S0 est intérieur à dom f .
3. f est dérivable en chaque point de S0 .
Alors il existe θ ∈ ]0, 1[ tel que
$
|f (b) − f (a)|2 ≤ |fa+θ(b−a) (b − a)|2 ,

ou encore il existe c ∈ S0 tel que

|f (b) − f (a)|2 ≤ |fc$ (b − a)|2 .

Démonstration. Soit h l’application affine de R dans Rn définie par


h(t) = a + t(b − a). Elle est dérivable en chaque point de R. Par le théorème
de continuité et de dérivabilité des fonctions composées, la fonction f ◦ h
sera continue sur [0, 1] et dérivable en chaque point de ]0, 1[. En outre, pour
chaque t ∈ ]0, 1[, on a

(f ◦ h)$ (t) = (f ◦ h)$t (1) = (fh(t)


$
◦ h$t )(1) = fh(t)
$
(h$ (t)) = fh(t)
$
(b − a).

Le théorème de la moyenne pour une fonction de R dans Rp entraı̂ne donc


l’existence d’un θ ∈ ]0, 1[ tel que

|f [h(1)] − f [h(0)]|2 ≤ |(f ◦ h)$ (θ)|2 ,

et dès lors tel que


$
|f (b) − f (a)|2 ≤ |fh(θ) (b − a)|2 ,
et il suffit de poser c = h(θ) = a + θ(b − a).
156 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES

Corollaire. Soit f une fonction de Rn dans Rp, a ∈ Rn et r > 0 tel que f


soit dérivable en chaque point de B2 (a; r). Alors, pour chaque 1 ≤ k ≤ n et
chaque h ∈ R tel que 0 < |h| < r, il existe θ ∈ ]0, 1[ tel que

|f (a + hek ) − f (a)|2 ≤ |h||Dk f (a + θhek )|2 .

Démonstration. Les conditions du théorème de la moyenne pour une


fonction de Rn dans Rp sont satisfaites pour b = a + hek . Dès lors, il existe
θ ∈ ]0, 1[ tel que
$
|f (a + hek ) − f (a)|2 ≤ |fa+θhek (he )|2
k

$
= |h||fa+θhek (e )|2 = |h||Dk f (a + θhe )|2 .
k k

4.11 Condition suffisante de dérivabilité


On a vu que l’existence des dérivées partielles en un point n’entraı̂nait pas
la dérivabilité (totale) en ce point. Les résultats globaux que nous venons
d’obtenir permettent de démontrer une intéressante condition suffisante (lo-
cale) de dérivabilité en un point en termes de propriétés des dérivées par-
tielles. Elle repose sur la conséquence suivante du théorème de la moyenne.
Lemme. Soit f une fonction de Rn dans Rp , a ∈ Rn , h ∈ R et 1 ≤ k ≤ n
tels que f soit continue en chaque point de S = {a + thek : t ∈ [0, 1]} et
Dk f (x) existe pour chaque x ∈ S0 = {a + thek : t ∈ ]0, 1[}. Alors il existe
θ ∈ ]0, 1[ tel que

|f (a + hek ) − f (a) − hDk f (a)|2 ≤ |h||Dk f (a + θhek ) − Dk f (a)|2.

Démonstration. Soit g la fonction de R dans Rp définie par g(t) = f (a +


thek ) − f (a) − thDk f (a). Par hypothèse g est dérivable en chaque point de
]0, 1[ et

g(τ ) − g(t) f (a + τ hek ) − f (a + thek ) − (τ − t)hDk f (a)


g $ (t) = lim = lim
τ →t τ −t τ →t τ −t
D E
= h Dk f (a + thek ) − Dk f (a) .
4.11. CONDITION SUFFISANTE DE DÉRIVABILITÉ 157

Le théorème de la moyenne pour une fonction de R dans Rp appliqué à g sur


[0, 1] entraı̂ne l’existence d’un θ ∈ ]0, 1[ tel que

|f (a + hek ) − f (a) − hDk f (a)|2 = |g(1) − g(0)|2 ≤ |g $(θ)|2

= |h||Dk f (a + θhek ) − Dk f (a)|2 .

Proposition. Soit f une fonction de Rn dans Rp, a ∈ dom f. Supposons


qu’il existe un entier 1 ≤ k ≤ n tel que Dk f (a) existe et un r > 0 tel que,
pour chaque entier j /= k compris entre 1 et n, Dj f (x) existe pour chaque
x ∈ B2 [a; r]. Si les fonctions de Rn dans Rp Dj f : x 2→ Dj f (x), (1 ≤ j /=
k ≤ n) sont continues en a, alors f est dérivable en a.
Démonstration. En modifiant éventuellement le nom des variables, on
peut, sans perte de généralité, supposer que k = n. Si h ∈ B2 [r], on a
n
$
f (a + h) − f (a) − hj Dj f (a)
j=1
, & n
' -
$
= f (a + h) − f a+ hk e k
− h1 D1 f (a)
k=2
, & n
' & n
' -
$ $
+ f a+ k
hk e −f a+ hk e k
− h2 D2 f (a)
k=2 k=3
+...
     
n
$ n
$
+ f  a + hk ek  − f a + hk ek  − hj Dj f (a)
k=j k=j+1

+...
   
n
$
+ f a + hk ek  − f (a + hn en ) − hn−1 Dn−1 f (a)
k=n−1

+[f (a + hn en ) − f (a) − hn Dn f (a)]


     
n−1
$ n
$ n
$
= f a + hk ek  − f a + hk ek  − hj Dj f (a)
j=1 k=j k=j+1

+[f (a + hn e ) − f (a) − hn Dn f (a)].


n
158 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES

Dès lors, en appliquant le Lemme aux n − 1 premiers termes de la somme,


on obtient θj ∈ ]0, 1[, (1 ≤ j ≤ n − 1) tels que
#     #
# n n #
# $ $ #
#f a + h ek
− f  a + h ek
− h D f (a) #
# k k j j #
# k=j k=j+1 #
2
#   #
# n #
# $ #
≤ |hj | ##Dj f a + θj hj ej + hk ek  − Dj f (a)## .
# k=j+1 #
2
Si maintenant ! > 0 est donné, alors, pour chaque 1 ≤ j ≤ n−1, la continuité
de Dj f en a entraı̂ne l’existence d’un δj ∈ ]0, r] tel que, si |x − a|2 ≤ δj , on a
!
|Dj f (x) − Dj f (a)|2 ≤ ,
n
et l’existence de Dn f (a) entraı̂ne l’existence d’un δn ∈]0, r] tel que, si |t| ≤ δn ,
on a
!
|f (a + ten ) − f (a) − tDn f (a)|2 ≤ |t|.
n
En rassemblant tous ces résultats, on voit que si |h|2 ≤ δ = min{δj : 1 ≤ j ≤
n}, on a # #
# $n #
# #
#f (a + h) − f (a) − hj Dj f (a)## ≤
#
# j=1 #
2
#     #
n−1 # n n #
$ # $ $ #
#f a + hk e − f a +
k   hk e − hj Dj f (a)##
k 
#
j=1 # k=j k=j+1 #
2
!
+|f (a + hn e ) − f (a) − hn Dn f (a)|2 ≤ n |h|∞ ≤ !|h|2 ,
n
n
ce qui montre que f est dérivable en a.

Corollaire. Soit f une fonction de Rn dans Rp , a ∈ dom f. Supposons


qu’il existe un r > 0 tel que, pour chaque entier j compris entre 1 et n,
Dj f (x) existe pour chaque x ∈ B2 [a; r]. Si les fonctions de Rn dans Rp
Dj f : x 2→ Dj f (x), (1 ≤ j ≤ n) sont continues en a, alors f est dérivable en
a.
Remarque. La Proposition que nous venons de démontrer est une condition
suffisante mais nullement nécessaire de dérivabilité. Ainsi, la fonction f de
R2 dans R définie par f (0) = 0 et
4 5
1
f (x) = |x|22 sin
|x|22
4.12. EXERCICES 159

si x /= 0 est dérivable en 0 avec f0$ = 0 puisque, pour h /= 0, f (h) = |h|2 r(h)


avec 4 5
1
r(h) = |h|2 sin →0
|h|22
lorsque h → 0 comme produit d’une fonction tendant vers zéro par une
fonction localement bornée en 0. D’autre part, un calcul facile laissé au
lecteur montre que D1 f (0) = D2 f (0) = 0, et que, pour x /= 0,
4 5 4 5
1 2x1 1
D1 f (x) = 2x1 sin − 2 cos ,
|x|22 |x|2 |x|22
4 5 4 5
1 2x2 1
D2 f (x) = 2x2 sin − cos .
|x|22 |x|22 |x|22
Comme limx→0 Dj f (x) n’existe pas (j = 1, 2) (le vérifier), on voit que les
fonctions Dj f ne sont pas continues en 0.

4.12 Exercices
1. Soit ]a, b] un intervalle semi-ouvert et c ∈ [a,Ab]. Construire
B
une jauge δ
sur [a, b] telle que, pour toute P-partition δ-fine (xj , I j ) 1≤j≤m de ]a, b], on
ait nécessairement xj = c pour l’un des 1 ≤ j ≤ m.
2. Montrer que la fonction f de R dans R définie par
1
f (0) = 0, f (x) = sin si x /= 0,
x
est continue au sens de Darboux sur [0, 1] mais n’est pas continue sur [0, 1].
3. Soit g : [a, b] → R une application continue telle que g(a) ∈ [a, b] et
g(b) ∈ [a, b]. Montrer que le théorème de Bolzano appliqué à I − g entraı̂ne
l’existence d’au moins un c ∈ [a, b] tel que c = g(c). (Théorème du point fixe
de Rothe en dimension un). Le cas particulier où g([a, b]) ⊂ [a, b] s’appelle
le théorème du point fixe de Brouwer .
4. Soit f une application de R dans R continue sur R et telle que

f (x) → −∞ si x → −∞ et f (x) → +∞ si x → +∞.

Utiliser le théorème des valeurs intermédiaires pour montrer que f est sur-
jective. Il en est évidemment de même si

f (x) → +∞ si x → −∞ et f (x) → −∞ si x → +∞.


160 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES

5. Montrer que E ⊂ Rn est un ouvert si et seulement si E est une union de


boules ouvertes.
6. Si E ⊂ R est une union finie d’intervalles fermés mutuellement dis-
joints, appelons C(E) l’union finie d’intervalles fermés mutuellement dis-
joints obtenue en retirant de chaque intervalle (disons [a, b]) constituant E
l’intervalle ouvert “central” ]a + b−a
3 , b − 3 [ de la division de [a, b] en trois
b−a

intervalles de longueurs égales. Si E0 = [0, 1], posons

E1 = C(E0 ), E2 = C(E1 ), . . . , Ek = C(Ek−1 ), . . ., .


7
Montrer que l’ensemble C = k∈N Ek est un fermé borné non vide. On
l’appelle l’ensemble de Cantor. Montrer (c’est plus difficile) que C est
d’intérieur vide et n’a aucun point isolé.
7. Montrer que si 6 · 6 : x 2→ 6x6 est une norme sur Rn , il existe des réels
0 < a ≤ b tels que, pour tout x ∈ Rn , on a

a|x|2 ≤ 6x6 ≤ b|x|2 .

En d’autres termes, toutes les normes sont équivalentes sur Rn . (Il suffit de
noter que, pour x /= 0, ces inégalités se réduisent à
F F
F x F
a≤F
F |x|
F ≤ b,
F
2

et d’appliquer le théorème de Weierstrass à la fonction x 2→ 6x6 sur le fermé


borné {x ∈ Rn : |x|2 = 1}).
8. Soit f une fonction de Rn dans R et a ∈ dom f. On dit que f est semi-
continue inférieurement (resp. semi-continue supérieurement) en a si

(∀! > 0)(∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ) :

f (a) − ! ≤ f (x) (resp. f (x) ≤ f (a) + !).


f est évidemment continue en a si elle est semi-continue inférieurement et
supérieurement en a. Montrer que la conclusion

f (y) ≤ f (x) (resp. f (x) ≤ f (z)),

du théorème de Weierstrass subsiste si f est semi-continue inférieurement


(resp. semi-continue supérieurement) sur le fermé borné E ⊂ Rn .
9. Soit f une application de Rn dans R+ dérivable en chaque point de Rn .
Montrer que, pour tout ! > 0, il existe au moins un point c! ∈ Rn tel que
4.12. EXERCICES 161

|∇f (c!)|2 ≤ !. Suggestion : dans le cas non trivial où il existe a ∈ Rn tel que
f (a) > 0, appliquer un Corollaire du théorème de Weierstrass à la fonction
g : x 2→ f (x) + δ2 |x − a|22 , où δ > 0 est à déterminer. Cette fonction atteint
un minimum en un point yδ pour lequel
∇f (yδ ) + δ(yδ − a) = 0.
Dès lors,
δ
f (yδ ) + |yδ − a|22 ≤ f (a),
2
ce qui entraı̂ne
4 51/2
2f (a)
|yδ − a|2 ≤ ,
δ
et dès lors
|∇f (yδ )|2 ≤ (2f (a)δ)1/2 ≤ !,
!2
si l’on prend δ = 2f (a) . Il suffit alors de prendre c! = y !2 . La fonction
2f (a)
exponentielle fournit un exemple vérifiant ce résultat sans que sa dérivée ne
s’annule jamais.
10. Soit f une fonction de R dans R dérivable en chaque point d’un voisinage
d’un point a ∈ R. Utiliser le théorème de Lagrange pour démontrer que si
limx→a, x(=a f $ (x) = b, alors b = f $ (a).
11. Soit f une fonction de Rn dans Rp et a ∈ adh (dom f \ {a}). On dit
que f est fortement dérivable en a s’il existe une application linéaire L de
Rn dans Rp telle que
f (x) − f (y) − L(x − y)
lim = 0.
(x,y)→(a,a) |x − y|2
Montrer que :
a. Si f est fortement dérivable en a, alors f est dérivable en a.
b. Si f est fortement dérivable en a ∈ int dom f, alors nécessairement
L = fa$ .
c. S’il existe r > 0 tel que f soit dérivable en chaque point de B2 (a; r), et si
les fonctions dérivées partielles correspondantes x 2→ Dj f (x), (1 ≤ j ≤ n),
sont continues en a, alors f est fortement dérivable en a. (Utiliser le théorème
de la moyenne).
12. Soient f et g des fonctions de R dans R et a ∈ dom f ∩ dom g tel que
g(a) = 0. On dit que f est dérivable par rapport à g en a si
f (x) − f (a)
lim
x→a g(x) − g(a)
162 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES

df
existe, auquel cas cette limite est notée Dg f (a) ou dg (a). Utiliser le théorème
de l’Hospital pour montrer que si f et g sont dérivables sur un voisinage de
a et si g $ (a) /= 0, alors
f $ (a)
Dg f (a) = $ .
g (a)
Si h est une fonction de R dans R∗+ et a ∈ dom h, tel que a > 0, on appelle
(en économie mathématique) élasticité de h en a la dérivée en a de ln h par
rapport à ln x, et on la note Eh(a). Montrer que, si h est dérivable en a,
" (a)
alors Eh(a) = ah h(a) .

4.13 Petite anthologie


Soit, sur le plan Y OX, une aire connexe S limitée par un contour fermé
simple ou complexe; on suppose qu’à chaque point de S ou de son périmètre
correspond un cercle, de rayon non nul, ayant ce point pour centre : il est
alors toujours possible de subdiviser S en régions, en nombre fini et assez
petites pour que chacune d’elles soit complètement intérieure au cercle cor-
respondant à un point convenablement choisi dans S ou sur son périmètre.

Pierre Cousin, 1895

Dans la théorie des équations, il y a deux théorèmes dont on pouvait dire


récemment encore que la démonstration entièrement correcte est inconnue.
L’un est le suivant : il faut qu’il y ait toujours, entre deux valeurs quelcon-
ques de la grandeur inconnue qui donnent deux résultats de signes opposés,
au moins une racine réelle de l’équation.

Bernard Bolzano, 1817

On dit qu’une fonction f (x) est continue de x = a jusqu’à x = b quand


elle est continue pour chaque valeur particulière x = X entre x = a et x = b,
les valeurs a et b comprises; on dit qu’elle est uniformément continue de
x = a à x = b quand, pour une grandeur ! donnée aussi petite que l’on veut,
il existe une grandeur positive η0 telle que pour toutes les valeurs positives η
qui sont plus petites que η0 , f (x ± η) − f (x) reste inférieur à !. Quelles que
soient les valeurs qu’on a pu donner à x et seulement telles que x et x ± η
appartiennent au domaine entre a et b, la condition doit être réalisée avec
le même η0 .

Heinrich Heine, 1872


4.13. PETITE ANTHOLOGIE 163

Cette démonstration s’appuie, pour l’essentiel, sur le théorème exposé


fréquemment et démontré dans les cours de Monsieur Weierstrass : “Une
fonction réelle continue ϕ(x), définie dans un intervalle (a . . . b) (les extré-
mités comprises), atteint le maximum g des valeurs qu’elle peut prendre au
moins pour une valeur x0 de la variable de façon que ϕ(x0 ) = g.”

Georg Cantor, 1870

Soit à chercher le maximum de b2 a − a3 . D’après les règles de la méthode


précitée, on aura de la sorte :

b2 a + b2 e − a3 − e3 − 3a2 e − 3e2 a = b2 a − a3 .

Il est clair que, si l’on supprime les termes semblables, tous ceux qui resteront
seront affectés de l’inconnue e; ceux en a seul se trouvent en effet les mêmes
de part et d’autre. On a ainsi : b2 e = e3 + 3a2 e + 3ae2 , et, en divisant
tous les termes par e, b2 = e2 + 3a2 + 3ae, ce qui donne la constitution des
deux équations corrélatives sous cette forme. Pour trouver le maximum, il
s’agit d’égaler les racines des deux équations, afin de satisfaire aux règles
de la première méthode, dont notre nouveau procédé tire sa raison et sa
façon d’opérer. Ainsi, il faut égaler a à a + e, d’où e = 0. Mais, d’après
la constitution que nous avons trouvée pour les équations corrélatives, b2 =
e2 +3a2 +3ae, nous devons donc supprimer, dans cette égalité, tous les termes
affectés de e, comme se réduisant à zéro; il restera b2 = 3a2 , équation qui
donnera le maximum cherché pour le produit dont il s’agit.

Pierre de Fermat, 1629

Si l’on substitue deux nombres au lieu de l’inconnue, chacun séparément,


et si l’un de ces nombres donne un résultat positif, et l’autre un résultat
négatif, il y a toujours une racine qui surpasse le plus petit des nombres,
et qui est surpassée par le plus grand. Ces deux nombres s’appelleront Hy-
pothèses. Si une égalité a pu être formée comme il a esté dit dans le premier
Article, ses racines sont les hypothèses des racines de la Cascade immédiate.
Cette Cascade se forme en multipliant par la progression 0.1.2. etc.

Michel Rolle, 1691

Depuis l’impression de cet ouvrage, j’ai reconnu qu’à l’aide d’une formule
très simple on pouvait ramener au Calcul différentiel la solution de plusieurs
problèmes que j’avais renvoyés au Calcul intégral. D’après ce qui a été dit
dans la septième Leçon, si l’on désigne par x0 , X deux valeurs de x entre
164 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES

lesquelles les fonctions f (x) et f $ (x) restent continues, et par θ un nombre


inférieur à l’unité, on aura

f (X) − f (x0 )
= f $ [x0 + θ(X − x0 )].
X − x0
Or il est aisé de voir que des raisonnements entièrement semblables à ceux
dont nous avons fait usage pour démontrer l’équation précédente suffiront
pour établir la formule

f (X) − f (x0 ) f $ [x0 + θ(X − x0 )]


= $ ,
F (X) − F (x0 ) F [x0 + θ(X − x0 )]

θ désignant encore un nombre inférieur à l’unité, et F (x) une fonction nou-


velle qui, toujours croissante ou décroissante depuis la limite x = x0 jusqu’à
la limite x = X, reste continue, avec sa dérivée F $ (x), entre ces mêmes
limites.

Augustin Cauchy, 1823

Soit une ligne courbe AM D (AP = x, P M = y, AB = a) telle que la


valeur de l’appliquée y soit exprimée par une fraction, dont le numérateur et
le dénominateur deviennent chacun zéro lorsque x = a, c’est-à-dire lorsque
le point P tombe sur le point donné B. On demande quelle doit être alors
la valeur de l’appliquée BD. ... Et partant que si l’on prend la différence
du numérateur, et qu’on la divise par la différence du dénominateur, après
avoir fait x = a = Ab ou AB, l’on aura la valeur cherchée de l’appliquée bd
ou BD.

Guillaume-François de L’Hospital, 1696

n’a eu aucune signification jusqu’à présent, et nous n’allons pas lui en


0
0
donner une.

Edmund Landau , 1934


Chapitre 5

Fonctions implicites

5.1 Limites infinies et point d’accumulation


Le lemme de Cousin fournit une intéressante caractérisation des limites
infinies. Commençons par une remarque très simple.
Lemme. Soit f une fonction de Rn dans Rp et a ∈ adh dom f. Alors,
limx→a f (x) = ∞ si et seulement si

(∀b ∈ Rp )(∀! > 0)(∃δ > 0)(∀x ∈ dom f ∩ B2 [a; δ]) : |f (x) − b|∞ > !. (5.1)

Démonstration. La condition suffisante s’obtient immédiatement en pre-


nant b = 0 dans (5.1). Pour démontrer la condition nécessaire, soit b ∈ Rp
et ! > 0. Par hypothèse,

(∃δ > 0)(∀x ∈ dom f ∩ B2 [a; δ]) : |f (x)|∞ > |b|∞ + !,

et dès lors, pour ces mêmes x, on aura

|f (x) − b|∞ ≥ |f (x)|∞ − |b|∞ > !.

Le résultat suivant, plus profond, donne la caractérisation en question.


Proposition. Soit f une fonction de Rn dans Rp et a ∈ adh dom f. Alors,
limx→a f (x) = ∞ si et seulement si

(∀b ∈ Rp )(∃! > 0)(∃δ > 0)(∀x ∈ dom f ∩ B2 [a; δ]) : |f (x) − b|∞ > !. (5.2)

165
166 CHAPITRE 5. FONCTIONS IMPLICITES

Démonstration. Condition nécessaire. Il suffit d’utiliser la condition


nécessaire du lemme et de prendre, par exemple, ! = 1 dans (5.1).
Condition suffisante. Pour chaque b ∈ Rp, choisissons !(b) > 0 et δ(b) > 0
tels que (5.2) soit satisfaite, c’est-à-dire tels que

(∀x ∈ dom f ∩ B2 [a; δ(b)]) : f (x) /∈ B∞ [b, !(b)]. (5.3)

Nous définissons ainsi une jauge ! : b 2→ !(b) sur Rp. Soit r > 0; par le
lemme de Cousin appliqué
A
au pavé
B
B∞ [r] et à la jauge ! sur B∞ [r], il existe
une P-partition !-fine (bj , E j ) 1≤j≤m de (] − r, r])n. Posons δ = min{δ(bj ) :
1 ≤ j ≤ m}. Si x ∈ dom f ∩ B2 [a; δ], alors, pour chaque 1 ≤ j ≤ m, on a
x ∈ dom f ∩ B2 [a; δ(bj )], et dès lors, par (5.3) et la définition de !-finesse,

f (x) /∈ B∞ [bj , !(bj )], (1 ≤ j ≤ m).

En conséquence, pour ces mêmes x, f (x) /∈ B∞ [r], c’est-à-dire |f (x)|∞ > r.


Donc, limx→a f (x) = ∞.
On démontre exactement de la même manière une caractérisation des
limites infinies lorsque x tend vers l’infini.
Proposition. Soit f une fonction de Rn dans Rp telle que dom f ne soit
pas borné. Alors, limx→∞ f (x) = ∞ si et seulement si

(∀b ∈ Rp )(∃! > 0)(∃ρ > 0)(∀x ∈ dom f : |x|2 ≥ ρ) : |f (x) − b|∞ > !.

On obtient les résultats correspondants lorsque x tend vers a ou vers


l’infini dans E ⊂ Rn en appliquant les propositions qui précèdent à f |E .
Le choix des normes est évidemment indifférent dans les caractérisations.
Leur négation conduit aux définitions suivantes.
Définition. Soit f une fonction de Rn dans Rp et a ∈ adh dom f . On dit
que b ∈ Rp est un point d’accumulation ou une valeur d’adhérence de f (x)
lorsque x tend vers a si

(∀! > 0)(∀δ > 0)(∃x ∈ dom f : |x − a|2 ≤ δ) : |f (x) − b|2 ≤ !. (5.4)

Définition. Soit f une fonction de Rn dans Rp telle que dom f ne soit


pas borné. On dit que b ∈ Rp est un point d’accumulation ou une valeur
d’adhérence de f (x) lorsque x tend vers l’infini si

(∀! > 0)(∀ρ > 0)(∃x ∈ dom f : |x|2 ≥ ρ) : |f (x) − b|2 ≤ !. (5.5)
5.1. LIMITES INFINIES ET POINT D’ACCUMULATION 167

On obtient évidemment les définitions correspondantes de point d’accu-


mulation de f lorsque x tend vers a ou vers l’infini dans E ⊂ Rn en appli-
quant les définitions précédentes à f |E .
Enfin, dans le cas d’une suite, la définition obtenue à partir du cas général
est équivalente à la suivante.
Définition. Soit (ak )k∈N une suite dans Rp . b ∈ Rp est un point d’accumu-
lation ou une valeur d’adhérence de (ak )k∈N si

(∀! > 0)(∀m ∈ N)(∃k ≥ m) : |ak − b|2 ≤ !.

Bien entendu, dans ces définitions, le choix des normes est indifférent. Il
est immédiat que si b = limx→a f (x) (resp. b = limx→∞ f (x)), alors b est un
point d’accumulation de f (x) lorsque x tend vers a (resp. tend vers l’infini),
et c’est le seul. Mais f peut avoir des points d’accumulation lorsque x tend
vers a (ou vers l’infini) sans que la limite existe. Par exemple, -1 et 1 sont
des points d’accumulation de la fonction f : x 2→ x + |x| x
lorsque x tend vers
0 (le vérifier), alors que la limite correspondante n’existe pas.
En s’inspirant du résultat correspondant pour la limite, il est facile
d’obtenir les caractérisations suivantes d’un point d’accumulation en termes
de suites.
Proposition. Soit f une fonction de Rn dans Rp et a ∈ adh dom f (resp.
dom f non borné). Alors b est un point d’accumulation de f lorsque x tend
vers a (resp. x tend vers l’infini) si et seulement s’il existe une suite (xk )k∈N
dans dom f telle que xk → a (resp. xk → ∞) et f (xk ) → b lorsque k → ∞.
b est un point d’accumulation de la suite (ak )k∈N si et seulement s’il existe
une suite (kn )n∈N tendant vers l’infini telle que akn → b si m → ∞.
Par exemple, chaque réel b ∈ [−1, 1] est un point d’accumulation de la
fonction x 2→ sin x1 , puisque, si a ∈ [0, 2π] est tel que sin a = b, alors la suite
(xk )k∈N∗ = ( a+2kπ
1
)k∈N∗ converge vers 0 et est telle que sin x1k = b quel que
soit k ∈ N .

Le contraposé de la caractérisation d’existence d’une limite infinie fournit


évidemment une condition nécessaire et suffisante d’existence d’un
point d’accumulation de f lorsque x tend vers a ou tend vers l’infini.
Proposition. Soit f une fonction de Rn dans Rp , a ∈ adh dom f (resp.
dom f non borné). Alors f possède un point d’accumulation lorsque x tend
vers a (resp. tend vers l’infini) si et seulement si f (x) ne tend pas vers l’infini
lorsque x tend vers a (resp. lorsque x tend vers l’infini).
168 CHAPITRE 5. FONCTIONS IMPLICITES

Corollaire. Soit f une fonction de Rn dans Rp , a ∈ adh dom f (resp.dom f


non borné). Si f est localement bornée lorsque x tend vers a (resp. bornée
à l’infini), alors f possède un point d’accumulation lorsque x tend vers a
(resp. tend vers l’infini).
Démonstration. C’est une conséquence immédiate de la Proposition
précédente et du fait que si f est localement bornée en a (resp. bornée
à l’infini), elle ne tend pas vers l’infini lorsque x tend vers a (resp. tend vers
l’infini). Dans le premier cas par exemple,

(∃r > 0)(∃δ > 0)(∀x ∈ dom f ∩ B2 [a; δ]) : |f (x)|2 ≤ r,

ce qui implique la négation de la condition de limite infinie

(∃r $ > 0)(∀δ $ > 0)(∃x ∈ dom f ∩ B2 [a; δ $]) : |f (x)|2 < r $ ,

si l’on prend par exemple r $ = 2r et, pour chaque δ $ > 0, n’importe quel
x ∈ dom f tel que |x − a|2 ≤ min{δ, δ $ }.
Dans le cas des suites, le Corollaire ci-dessus a une formulation encore
plus simple due au résultat suivant.
Définition. On dit qu’une suite (ak )k∈N dans Rp est bornée si l’ensemble
{ak : k ∈ N} est borné.

Lemme. Soit (ak )k∈N une suite dans Rp. Alors (ak )k∈N est bornée si et
seulement si elle est bornée à l’infini.
Démonstration. La condition nécessaire est suffisante. Pour la condition
suffisante, (ak )k∈N est bornée à l’infini si et seulement s’il existe r > 0 et
m ∈ N tels que, pour tout entier k ≥ m, on a |ak |2 ≤ r, ce qui entraı̂ne
aussitôt que, pour tout k ∈ N, on aura

|ak |2 ≤ max{|a0 |2 , |a1 |2 , . . . , |am−1 |2 , r}.

En combinant ce résultat avec la Proposition précédente appliquée au


cas particulier d’une suite, on obtient le résultat important suivant, appelé
théorème de Bolzano-Weierstrass.
Corollaire. Toute suite bornée dans Rp possède au moins un point d’accu-
mulation.
La notion de point d’accumulation d’une suite peut s’exprimer en termes
de l’important concept de sous-suite.
5.2. CRITÈRE DE CAUCHY 169

Définition. Soit (ak )k∈N une suite dans Rp. On appelle sous-suite de
(ak )k∈N ou suite extraite de (ak )k∈N toute suite de la forme (akn )n∈N où
(kn )n∈N est une suite dans N telle que kn < kn+1 pour tout k ∈ N.
En d’autres termes, une sous-suite de (ak )k∈N est une suite obtenue en
composant (ak )k∈N avec une suite (kn )n∈N vérifiant kn < kn+1 pour chaque
n ∈ N. Par exemple, (2n)n∈N et (2n + 1)n∈N sont des sous-suites de (k)k∈N
(prendre respectivement kn = 2n et kn = 2n + 1). Notons que la condition
kn < kn+1 entraı̂ne évidemment que, pour chaque n ∈ N, kn+1 ≥ kn + 1, et
dès lors, par récurrence, que kn ≥ n.
La proposition suivante est une conséquence facile de la définition de
limite.
Proposition. Toute sous-suite d’une suite convergente converge vers la
même limite.
On a une autre caractérisation d’un point d’accumulation d’une
suite.
Proposition. b ∈ Rp est un point d’accumulation de la suite (ak )k∈N si et
seulement s’il existe une sous-suite (akn )n∈N de (ak )k∈N qui converge vers b.
Démonstration. Condition nécessaire. Soit b un point d’accumulation de
(ak )k∈N . En prenant ! = 1 et m = 1 dans la définition, on obtient un entier
k0 ≥ 1 tel que |ak0 − b|2 ≤ 1. En prenant ! = 12 et m = k0 + 1, on obtient un
entier k1 ≥ k0 + 1 tel que |ak1 − b|2 ≤ 12 . En continuant de la sorte, on trouve
pour chaque entier n ≥ 1 un entier kn ≥ kn−1 + 1 tel que |akn − b|2 ≤ n+1 1
.
En conséquence, (akn )n∈N est une sous-suite de (ak )k∈N qui converge vers b.
Condition suffisante. Soit (akn )n∈N une sous-suite de (ak )k∈N qui converge
vers b, et soient ! > 0 et m ∈ N. Par hypothèse, (∃q ∈ N)(∀j ≥ q) :
|akj − b|2 ≤ !. Dès lors, si n = kmax{m,q}, on a n ≥ km ≥ m et |an − b|2 ≤ !.

5.2 Critère de Cauchy


Nous sommes maintenant en mesure de démontrer que la condition nécessaire
de Cauchy d’existence de la limite est également suffisante. Cela fournira
le critère de Cauchy, dont l’intérêt est d’être une condition nécessaire et
suffisante d’existence de la limite, qui, au contraire de la définition, ne fait
pas intervenir la valeur de la limite.
170 CHAPITRE 5. FONCTIONS IMPLICITES

Soit f une fonction de Rn dans Rp et a ∈ adh dom f . Rappelons tout


d’abord que la condition de Cauchy pour f lorsque x tend vers a est la
suivante :
(∀! > 0)(∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ)
(∀y ∈ dom f : |y − a|2 ≤ δ) : |f (x) − f (y)|2 ≤ !.
Complétons maintenant la démonstration du critère de Cauchy pour
la limite de f (x) lorsque x tend vers a en montrant que la condition de
Cauchy est une condition suffisante d’existence de la limite.
Théorème. Soit f une fonction de Rn dans Rp et a ∈ adh dom f . Si
f vérifie la condition de Cauchy lorsque x tend vers a, alors limx→a f (x)
existe.
Démonstration. Puisqu’elle vérifie la condition de Cauchy, f est locale-
ment bornée en a et dès lors f possède un point d’accumulation b lorsque
x tend vers a. Montrons maintenant que b = limx→a f (x). Soit ! > 0; par
hypothèse,
(∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ)
!
(∀y ∈ dom f : |y − a|2 ≤ δ) : |f (y) − f (x)|2 ≤ ,
2
et, puisque b est un point d’accumulation, pour cet 2! et ce δ > 0, il existe
un z ∈ dom f ∩ B2 [a; δ] tel que
!
|f (z) − b|2 ≤ .
2
En conséquence, pour tout x ∈ dom f tel que |x − a|2 ≤ δ, on a
! !
|f (x) − b|2 ≤ |f (x) − f (z)|2 + |f (z) − b|2 ≤ + = !.
2 2

On démontre d’une manière complètement analogue les résultats cor-


respondants lorsque x tend vers l’infini. Rappelons que, dans ce cas, la
condition de Cauchy s’énonce comme suit :

(∀! > 0)(∃ρ > 0)(∀x ∈ dom f : |x|2 ≥ ρ)

(∀y ∈ dom f : |y|2 ≥ ρ) : |f (x) − f (y)|2 ≤ !.


Lemme. Soit f une fonction de Rn dans Rp telle que dom f soit non borné.
Si f vérifie la condition de Cauchy lorsque x tend vers l’infini, alors f est
bornée à l’infini.
5.3. ITÉRÉES D’UNE APPLICATION 171

Théorème. Soit f une fonction de Rn dans Rp telle que dom f soit non
borné. Si f vérifie la condition de Cauchy lorsque x tend vers l’infini, alors
limx→∞ f (x) existe.
En appliquant ces résultats à la restriction f |E de f à E ⊂ Rn , le lecteur
obtiendra aisément les assertions correspondantes pour la limite de f (x)
lorsque x tend vers a ou vers l’infini dans E.
Enfin, le cas particulier d’une suite conduit aux formulations suivantes.
Appelons suite de Cauchy toute suite vérifiant la condition de Cauchy :

(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q ≥ m) :

|ak − aq |2 ≤ !.
Lemme. Toute suite de Cauchy dans Rp est bornée.

Théorème. Toute suite de Cauchy dans Rp est convergente.

5.3 Itérées d’une application


Soit h une application de Rp dans Rp dont nous nous proposons de trouver
les zéros, c’est-à-dire les éléments a ∈ Rp tels que h(a) = 0. En d’autres
termes, nous voulons résoudre l’équation en l’inconnue y

h(y) = 0, (5.6)

ou encore déterminer ses racines. En dehors de cas très particuliers (h


est une application affine, un polynôme de R dans R ou de C dans C
de degré inférieur ou égal à quatre,...), il n’est pas possible en général
de trouver une formule exacte fournissant les zéros de h et l’on est ra-
mené à leur détermination approchée, avec une erreur arbitrairement petite.
Une stratégie possible pour cette détermination approchée consiste à écrire
l’équation (5.6) sous la forme équivalente

y = y + h(y),

c’est-à-dire, en posant g = I + h, sous la forme

y = g(y). (5.7)

Les zéros a de h correspondent donc aux points fixes de g, c’est-à-dire aux


éléments a ∈ Rp tels que g(a) = a. Pour tenter de déterminer les points fixes
172 CHAPITRE 5. FONCTIONS IMPLICITES

de g, on peut utiliser la méthode des approximations successives qui


consiste à partir d’un élément y0 arbitraire de Rp et de calculer g(y0 ). Si
g(y0 ) = y0 , alors y0 est un point fixe de g (et donc un zéro de h). Sinon, on
pose y1 = g(y0 ) et l’on calcule

g(y1) = g[g(y0)] = (g ◦ g)(y0) = g 2 (y0 ).

Si g(y1 ) = y1 , alors y1 est un point fixe de g; sinon, on pose y2 = g(y1 ) et


l’on calcule g(y2 ) = (g ◦ g ◦ g)(y0) = g 3 (y0 ). En continuant de la sorte, ou
bien l’on trouve un entier positif k et un yk ∈ Rp tel que g(yk ) = yk , ou bien
l’on détermine, de proche en proche, une suite (yk )k∈N par les relations

y0 ∈ Rp , yk = g(yk−1) = (g ◦ g ◦ . . . ◦ g)(y0) = g k (y0 ), (k ∈ N∗ ). (5.8)

Pour chaque entier k ≥ 1, l’application g k = g ◦ g ◦ . . . ◦ g (k fois) s’appelle


la ke -itérée de g (on pose aussi g 0 = I). Par exemple, si g est l’application
de R dans R définie par g(y) = y 2 , alors g k (y) = y 2k . Supposons maintenant
que la suite (yk )k∈N définie par les relations (5.8) converge vers y ∗ et que
l’application g soit continue. Alors, en faisant tendre k vers l’infini dans
(5.8), on obtient

y ∗ = lim yk = lim g(yk−1 ) = g( lim yk−1 ) = g(y ∗),


k→∞ k→∞ k→∞

et y∗ est un point fixe de g, c’est-à-dire un zéro de h. On dit que ce point


fixe y ∗ est obtenu par la méthode d’approximations successives définie par
(5.8). On voit donc que la convergence de (yk )k∈N et la continuité de g
suffisent pour obtenir un point fixe de g par la méthode des approximations
successives. Bien entendu, la limite y ∗ de la suite (yk )k∈N n’est pas, en
pratique, connue a priori puisque, dans ce cas, le point fixe correspondant
de g serait connu et le problème posé serait résolu. Il est donc important de
pouvoir déterminer la convergence de (yk )k∈N, sans connaı̂tre explicitement
y ∗ , et l’on fera naturellement appel au critère de Cauchy. La suite (yk )k∈N
dépend de g et de y0 , et il en est donc de même de sa convergence. Par
exemple, si g est l’application de R dans R définie par g(y) = y + 1, alors,
pour n’importe quel y0 ∈ R, on aura, pour k ∈ N∗ ,

yk = g k (y0 ) = y0 + k,

et la suite correspondante (yk )k∈N est divergente. D’autre part, si g est


l’application de R dans R définie par g(y) = y 2 , on a, pour chaque entier
k ≥ 1, g k (y) = y 2k ; dès lors, si l’on prend y0 = 2, la suite correspondante
5.4. THÉORÈME DES APPLICATIONS CONTRACTANTES 173

(yk )k∈N = (22k )k∈N est divergente tandis que si l’on prend y0 = 12 , la suite
correspondante (yk )k∈N = (2−2k )k∈N converge vers 0. Remarquons aussi
que (yk )k∈N convergera vers 1 si et seulement si y0 = 1. Notons enfin que,
étant donnée une application h dont on veut déterminer les zéros, on peut
construire différentes applications g dont les points fixes fournissent les zéros
de h : par exemple, si L est une application linéaire inversible de Rp dans
Rp , on aura évidemment

h(y) = 0 ⇔ y = y + L[h(y)],

et l’on peut donc prendre g = I + L ◦ h. On est donc amené à déterminer


des conditions sur g et sur y0 qui assurent la convergence de la suite des
itérées (g k (y0 ))k∈N. Nous donnerons, au paragraphe suivant, des condi-
tions sur g assurant cette convergence quel que soit le choix de y0 . Lorsque
de telles conditions sur g ne sont pas satisfaites, le comportement de la
suite des itérées (g k (y0 ))k∈N peut être extrêmement varié et extraordinaire-
ment compliqué même pour une fonction g de R dans R aussi simple que
g(y) = ay(1 − y). Une telle suite d’itérées d’une application constitue
l’exemple le plus simple d’un système dynamique discret, et (g k (y0 ))k∈N
s’appelle l’orbite issue de y0 . L’ensemble limite ω(y0 ) de cette orbite est
l’ensemble des points d’accumulation de (g k (y0 ))k∈N . L’étude du comporte-
ment asymptotique (pour k → ∞) des orbites conduit en particulier à la
théorie du chaos, qui fait actuellement l’objet de nombreuses recherches.

5.4 Théorème des applications contractantes


Le but de cette section est d’énoncer et démontrer un résultat qui, pour
une application g d’une partie E de Rp en elle-même, assure la convergence
de la suite des itérée (g k (y0 ))k∈N quel que soit le choix de y0 ∈ E. Nous
aurons besoin pour ce faire d’un type de continuité introduit par Rudolph
Lipschitz en 1868.

Définition. Soit E ⊂ Rn et f une application de E dans Rp . On dit que f


est lipschitzienne sur E s’il existe un α ≥ 0 tel que, pour tout u ∈ E et tout
v ∈ E, on ait
|f (u) − f (v)|2 ≤ α|u − v|2 .

Ainsi, toute application linéaire L de Rn dans Rp est lipschitzienne sur


Rn . Si f est une fonction de Rn dans Rp dérivable en chaque point d’une
174 CHAPITRE 5. FONCTIONS IMPLICITES

boule ouverte B2 (a; r) de Rn et s’il existe une constante α telle que, pour
tout x ∈ B2 (a; r), et tout h ∈ Rn , on ait

|fx$ (h)|2 ≤ α|h|2 ,

alors f sera lipschitzienne sur Bj (a; r) puisque, par le théorème de la moyen-


ne, si u ∈ B2 (a; r) et v ∈ B2 (a; r), il existera θ ∈ ]0, 1[ tel que
$
|f (u) − f (v)|2 ≤ |fv+θ(u−v) (u − v)|2 ≤ α|u − v|2 ,

puisque u + θ(v − u) ∈ B2 (a; r). D’autre part, toute application f de E dans


Rp lipschitzienne sur E est évidemment uniformément continue sur E. En
outre, si f est lipschitzienne sur E, alors pour chaque a ∈ E, l’application
x 2→ f (x)−f (a)
|x−a|2 est localement bornée en a. On peut évidemment, dans la
définition, remplacer les normes | · |2 par d’autres normes.
Définition. Soit E ⊂ Rp et g une application de E dans Rp . On dit que
g est une application contractante ou une contraction sur E pour la norme
| · |j (j = 1, 2, ∞), s’il existe un α ∈ [0, 1[ tel que, pour tout u ∈ E et tout
v ∈ E, on ait
|g(u) − g(v)|j ≤ α|u − v|j .
α est appelée une constante de contraction de f .
Une application f de E dans Rp contractante sur E est évidemment
lipschitzienne sur E. La propriété suivante est utile.
Lemme. Soit E ⊂ Rp et g une application contractante de E dans E de
constante α pour la norme | · |j . Alors, pour chaque entier k ≥ 1, g k =
g ◦ g ◦ . . . ◦ g est contractante sur E de constante αk pour la norme | · |j .
Démonstration. Elle se fait par récurrence sur k. Le résultat est évident
pour k = 1. Si maintenant k ≥ 2 et g k−1 est contractante sur E de constante
αk−1 , alors, pour tout u ∈ E et tout v ∈ E, on a
# #
# #
|g k (u)−g k (v)|j = #g k−1 [g(u)] − g k−1 [g(v)]# ≤ αk−1 |g(u)−g(v)|j ≤ αk |u−v|j .
j

Quoiqu’énoncé et démontré dans Rp par Edouard Goursat en 1903, le


résultat suivant, appelé théorème des applications contractantes, est
aussi connu comme théorème du point fixe de Banach suite à l’extension
à des espaces plus généraux donnée par Stefan Banach en 1922.
5.4. THÉORÈME DES APPLICATIONS CONTRACTANTES 175

Théorème. Soit E un fermé non vide de Rp, j = 1, 2 ou ∞ et g une


application contractante de E dans E pour la norme | · |j , de constante
α ∈ [0, 1[. Alors, g possède dans E un point fixe unique y ∗ . En outre, pour
chaque y0 ∈ E, la suite (yk )k∈N des itérées de y0 définie par

yk = g(yk−1) = g k (y0 ), k ∈ N∗ ,

converge vers y ∗ . Enfin, pour chaque k ∈ N∗ , on a

αk
|yk − y ∗ |j ≤ |g(y0 ) − y0 |j .
1−α
Démonstration. Soit
8 y0 ∈9E. Notons tout d’abord que, puisque g(E) ⊂
E, la suite (yk )k∈N = g k (y0 ) des itérées de y0 est bien définie et est une
k∈N
suite dans E. Montrons que c’est une suite de Cauchy. Pour chaque k ∈ N∗ ,
on a # #
# #
|yk+1 − yk |j = #g k [g(y0)] − g k (y0 )# ≤ αk |g(y0 ) − y0 |j ,
j
et dès lors, si k ∈ N et q ∈ N, on a

|yk − yq |j = |yk − yk+1 + yk+1 − yq+1 + yq+1 − yq |j

≤ |yk − yk+1 |j + |yk+1 − yq+1 |j + |yq+1 − yq |j


≤ αk |g(y0 ) − y0 |j + |g(yk ) − g(yq )|j + αq |g(y0) − y0 |j
≤ (αk + αq )|g(y0) − y0 |j + α|yk − yq |j ,
ce qui entraı̂ne

αk + αq
|yk − yq |j ≤ |g(y0) − y0 |j . (5.9)
1−α
k
Comme α ∈ [0, 1[, la suite ( 1−α α
|g(y0 ) − y0 |j )k∈N converge vers zéro et dès
lors, si ! > 0 est donné, il existera m ∈ N tel que, pour tout entier k ≥ m ,
on a
αk !
|g(y0 ) − y0 |j ≤ ;
1−α 2
cela entraı̂ne que, pour k ≥ m et q ≥ m, on a |yk − yq |j ≤ !, et (yk )k∈N est
une suite de Cauchy dans E. Elle converge donc vers un élément y ∗ ∈ Rp
et, puisque E est fermé, on a y ∗ ∈ E. Montrons que y ∗ est un point fixe de
g; pour tout k ∈ N, on a

0 ≤ |y ∗ − g(y ∗ )|j = |y ∗ − yk+1 + g(yk ) − g(y ∗ )|j ≤ |y ∗ − yk+1 |j + α|yk − y ∗ |j ,


176 CHAPITRE 5. FONCTIONS IMPLICITES

et dès lors, en faisant tendre k vers l’infini, on en déduit que |y ∗ −g(y ∗ )|j = 0.
On peut aussi obtenir le même résultat comme dans la section précédente
en utilisant la continuité de g. D’ailleurs, g possède un seul point fixe dans
E puisque, si y ∗ et y ∗∗ sont des points fixes de g dans E, on a

0 ≤ |y ∗ − y ∗∗ |j = |g(y ∗) − g(y ∗∗)|j ≤ α|y ∗ − y ∗∗ |j ,

et dès lors
0 ≤ (1 − α)|y ∗ − y ∗∗ |j ≤ 0,
ce qui implique y ∗ = y ∗∗ . Enfin, pour chaque k ∈ N∗ , si l’on fait tendre q
vers l’infini dans (5.9), on obtient

αk
|yk − y ∗ |j ≤ |g(y0 ) − y0 |j .
1−α

Par exemple, pour chaque a ∈ ] − 1, 1[ et chaque b ∈ R, l’équation de


Kepler
y = a sin y + b,
possède une solution unique y ∗ = limk→∞ yk où y0 ∈ R est arbitraire et,
pour chaque k ∈ N∗ ,
yk = a sin yk−1 + b,
puisque l’application g de R dans R définie par g(y) = a sin y + b est telle
que, pour tout u ∈ R et tout v ∈ R, il existe, par le théorème de Lagrange,
θ ∈ ]0, 1[ tel que

|g(u) − g(v)| = |a||(sin u − sin v)| = |a|| cos(u + θ(v − u))(u − v)| ≤ |a||u − v|,

et g est donc une contraction sur R de constante |a| ∈ [0, 1[.


Sous les hypothèses du théorème des applications contractantes, le point
fixe unique y ∗ de g est un attracteur global pour le système dynamique défini
par les itérées de g.

5.5 Fonctions implicites : existence


Soit F une fonction de Rn × Rp dans Rq . L’ensemble de ses zéros

F −1 ({0}) = {(x, y) ∈ dom F : F (x, y) = 0} (5.10)


5.5. FONCTIONS IMPLICITES : EXISTENCE 177

constitue donc un graphe de Rn dans Rp . L’objet de la théorie des fonctions


implicites est de déterminer des conditions sur F sous lesquelles le graphe
F −1 ({0}) est une fonction de Rn dans Rp (problème global) ou sous lesquelles
la restriction de F −1 ({0}) à un voisinage d’un de ses points est une fonction
de Rn dans Rp (problème local). Pour situer la difficulté du problème et
motiver les hypothèses du théorème qui donnera la solution du problème
local (le problème global est beaucoup plus difficile et ne sera pas abordé
ici), considérons tout d’abord le cas où F est une application affine de R × R
dans R. Elle peut donc s’écrire

F (x, y) = ax + by + c,

où a, b et c sont des réels. Pour que le graphe F −1 ({0}) correspondant soit
une fonction de R dans R, il faut qu’à chaque x ∈ R corresponde au plus un
élément y ∈ R tel que
ax + by + c = 0,
c’est-à-dire il faut que l’équation linéaire en y

by = −ax − c

ait au plus une solution; ce sera le cas si et seulement si b /= 0. On notera que


pour chaque x ∈ R et chaque y ∈ R, b = D2 F (x, y) est la dérivée partielle
de F par rapport à y en (x, y).
Considérons maintenant une situation simple où F est non linéaire. Soit
F l’application de R × R dans R définie par F (x, y) = x2 + y 2 − 1. Le graphe
F −1 ({0}) correspondant est la partie de R2 formée des points du cercle de
centre 0 et de rayon 1 et ce n’est pas un graphe fonctionnel, puisque, pour
chaque x ∈]−1, 1[⊂ [−1, 1] = dom F −1 ({0}), il existe deux éléments distincts
(x, (1 − x2 )1/2) et (x, −(1 − x2 )1/2) appartenant à F −1 ({0}). Pour la même
raison, la restriction de F −1 ({0}) à n’importe quel voisinage du point (−1, 0)
et du point (1, 0) de F −1 ({0}) ne sera pas une fonction de R dans R. Ces
points sont les seuls points du graphe de la forme (x, 0). Si (x, y) ∈ F −1 ({0})
avec y > 0 (resp. y < 0), on vérifie sans peine que la restriction de F −1 ({0})
au voisinage {(x, y) ∈ R2 : y ≥ 0} (resp. {(x, y) ∈ R2 : y ≤ 0}) de (x, y)
est une fonction f de R dans R de domaine [−1, 1] donnée explicitement
par f (x) = (1 − x2 )1/2 (resp. f (x) = −(1 − x2 )1/2). Notons que, pour
chaque (x, y) ∈ R × R, D2 F (x, y) = 2y et dès lors que la restriction de
F −1 ({0}) est une fonction sur un voisinage convenable des points (x, y) tels
que D2 F (x, y) /= 0 et n’est une fonction sur aucun voisinage des points (x, y)
tels que D2 F (x, y) = 0. Il ne faudrait toutefois pas en conclure trop vite que
178 CHAPITRE 5. FONCTIONS IMPLICITES

la condition D2 F (x, y) /= 0 est nécessaire et suffisante pour que la restriction


de F −1 ({0}) à un voisinage d’un de ses points (x, y) soit une fonction de R
dans R puisque l’exemple de F (x, y) = y 3 − x, dont le graphe correspondant

F −1 ({0}) = {(x, y) ∈ R × R : y 3 − x = 0}

est celui de l’application f de R dans R définie par f (x) = x1/3, est tel que
D2 F (x, y) = 3y 2 et donc D2 F (0, 0) = 0 au point (0, 0) de F −1 ({0}). La
condition D2 F (x, y) /= 0 n’est donc pas nécessaire. Toutefois, l’important
théorème des fonctions implicites, que nous allons démontrer, montre
que, sous certaines conditions de régularité sur F , la condition D2 F (x, y) /= 0
est suffisante pour que la restriction de F −1 ({0}) à un voisinage suffisamment
petit du point (x, y) de F −1 ({0}) soit une fonction. Nous donnerons d’abord
le théorème dans le cas particulier où p = 1 avant de l’étendre au cas où p
est quelconque.
Théorème. Soit F une fonction de Rn ×R dans R, (x0 , y0 ) ∈ dom F, r0 > 0,
R0 > 0 tels que

B2 (x0 ; r0 )× ]y0 − R0 , y0 + R0 [ ⊂ dom F

et tels que les conditions suivantes soient satisfaites.


1. F (x0 , y0 ) = 0 (c’est-à-dire (x0 , y0 ) ∈ F −1 ({0})).
2. La fonction F (·, y0 ) : x 2→ F (x, y0 ) est continue en x0 .
3. Pour chaque x ∈ B2 (x0 ; r0) et chaque y ∈ ]y0 − R0 , y0 + R0 [, D2 F (x, y)
existe et la fonction correspondante D2 F : (x, y) 2→ D2 F (x, y) de Rn × R
dans R est continue en (x0 , y0 ).
4. D2 F (x0 , y0 ) /= 0.
Alors il existe r ∈ ]0, r0[ et R ∈ ]0, R0[ tels que la restriction f du graphe
F −1 ({0}) à B2 [x0 ; r] × [y0 − R, y0 + R] est une application de B2 [x0 ; r] dans
[y0 − R, y0 + R] continue en x0 .
Démonstration. La première partie de la thèse revient à démontrer l’exis-
tence de r ∈]0, r0[ et R ∈]0, R0[ tels que, pour chaque x ∈ B2 [x0 ; r], l’équation

F (x, y) = 0 (5.11)

en l’inconnue y possède dans [y0 − R, y0 + R] une solution unique, que l’on


notera alors f (x). La deuxième partie de la thèse revient à prouver que f
est continue en x0 . Nous allons construire, pour chaque x ∈ B2 (x0 ; r0) une
fonction de R dans R dont les points fixes y correspondent aux solutions
de (5.11) et pour laquelle le théorème des applications contractantes sera
5.5. FONCTIONS IMPLICITES : EXISTENCE 179

applicable. Si nous posons L = D2 F (x0 , y0 ), alors pour chaque (x, y) ∈


B2 (x0 ; r0)× ]y0 − R0 , y0 + R0 [, nous avons

F (x, y) = 0 ⇔ Ly + F (x, y) − Ly = 0 ⇔ y = G(x, y),

si G est la fonction de Rn × R de domaine égal à dom F définie par

G(x, y) = −L−1 [F (x, y) − Ly].

Pour chaque x ∈ B2 (x0 ; r0), si u ∈ ]y0 − R0 , y0 + R0 [ et v ∈ ]y0 − R0 , y0 + R0 [,


le théorème de Lagrange appliqué à la fonction G(x, ·) : y 2→ G(x, y) entraı̂ne
l’existence d’un θ ∈ ]0, 1[ tel que

G(x, u) − G(x, v) = (u − v)D2G(x, v + θ(u − v))

= −(u − v)L−1 [D2 F (x, v + θ(u − v)) − L]


= −(u − v)L−1 [D2 F (x, v + θ(u − v)) − D2 F (x0 , y0 )].
Par l’hypothèse 3, il existe r1 ∈ ]0, r0[ et R ∈ ]0, R0[ tels que, pour tout
(x, y) ∈ B2 [x0 ; r1] × [y0 − R, y0 + R] on a

L
|D2 F (x, y) − D2 F (x0 , y0 )| ≤ ,
2
et dès lors, si x ∈ B2 [x0 ; r1], u ∈ [y0 −R, y0 +R], v ∈ [y0 −R, y0 +R], on aura,
pour le θ donné par le théorème de Lagrange, v + θ(u − v) ∈ [y0 − R, y0 + R],
et dès lors,

L 1
|G(x, u) − G(x, v)| ≤ |u − v|L−1 = |u − v|,
2 2
ce qui montre que, pour chaque x ∈ B2 [x0 ; r1], l’application G(x, ·) est lip-
schitzienne de constante 12 sur [y0 − R, y0 + R]. Pour pouvoir appliquer le
théorème du point fixe de Banach, il faut encore que G(x, ·) soit une applica-
tion de [y0 − R, y0 + R] dans [y0 − R, y0 + R]. On a, pour tout x ∈ B2 [x0 ; r1]
et tout y ∈ [y0 − R, y0 + R],

|G(x, y) − y0 | ≤ |G(x, y) − G(x, y0 )| + |G(x, y0) − y0 |

= |G(x, y) − G(x, y0)| + |L−1 F (x, y0 )|


1 R
≤ |y − y0 | + |L−1 F (x, y0 )| ≤ + |L−1 F (x, y0 )|.
2 2
180 CHAPITRE 5. FONCTIONS IMPLICITES

Par l’hypothèse 1 et l’hypothèse 2, il existe r ∈ ]0, r1] tel que, pour tout
x ∈ B2 [x0 ; r], on a
R
|L−1 F (x, y0 )| = |L−1 [F (x, y0 ) − F (x0 , y0 )]| ≤ ,
2
et dès lors, pour chaque x ∈ B2 [x0 ; r] et chaque y ∈ [y0 − R, y0 + R], on aura

|G(x, y) − y0 | ≤ R,

ce qui montre que G(x, ·) est une application du fermé [y0 − R, y0 + R] en


lui-même. Le théorème de Banach entraı̂ne donc, pour chaque x ∈ B2 [x0 ; r],
l’existence d’un point fixe unique y ∈ [y0 − R, y0 + R] de G(x, ·), c’est-à-dire
l’existence d’un unique y = f (x) ∈ [y0 − R, y0 + R] tel que F [x, f (x)] = 0.
Pour x = x0 , l’unicité entraı̂ne en particulier que f (x0 ) = y0 . Il reste à
montrer que f est continue en x0 . Si x ∈ B2 [x0 ; r], on a

|f (x) − f (x0 )| = |G[x, f (x)] − G[x0 , f (x0 )]|

= |G[x, f (x)] − G[x, f (x0)] + G(x, y0 ) − G(x0 , y0 )|


1
≤ |f (x) − f (x0 )| + |L−1 [F (x, y0 ) − F (x0 , y0 )]|.
2
Dès lors,
|f (x) − f (x0 )| ≤ 2|L−1 [F (x, y0 ) − F (x0 , y0 )]|,
et comme le second membre tend vers 0 lorsque x tend vers x0 en vertu de
l’hypothèse 2, on voit que f est continue en x0 .
Enonçons et démontrons maintenant le théorème dans le cas général.
Pour motiver l’énoncé dans ce cas (la démonstration sera très semblable à
celle du cas particulier précédent), considérons le cas où F est une application
linéaire de Rn × Rp dans Rq . Elle peut donc s’écrire

F (x, y) = Ax + By,

où A est une application linéaire de Rn dans Rq et B une application linéaire


de Rp dans Rq . Pour que le graphe F −1 ({0}) correspondant soit une fonction
de Rn dans Rp , il faut qu’à chaque x ∈ Rn corresponde au plus un élément
y ∈ Rp tel que
Ax + By = 0,
c’est-à-dire il faut que le système linéaire en y

By = −Ax
5.5. FONCTIONS IMPLICITES : EXISTENCE 181

ait au plus une solution. La théorie des équations linéaires nous apprend que
ce sera le cas si et seulement si B est injective. Cela entraı̂ne en particulier
que p ≤ q et nous nous restreindrons au cas le plus simple où q = p. Dans ce
cas, la condition pour que F −1 ({0}) soit une fonction (en fait une application
de Rn dans Rp) est que B soit inversible, ou encore que det B /= 0. On notera
que si, pour chaque x ∈ Rn fixé, F (x, ·) désigne l’application (affine) de Rp
dans Rp définie par F (x, ·) = Ax + B(·), alors, pour chaque y ∈ Rp, B est
la dérivée totale de F (x, ·) en y, c’est-à-dire B = (F (x, ·))$y . On doit donc
s’attendre, dans le cas non linéaire, à trouver une hypothèse d’inversibilité
pour (F (x0 , ·))$y0 .
Théorème. Soit F une fonction de Rn × Rp dans Rp , (x0 , y0 ) ∈ dom F,
r0 > 0, R0 > 0 tels que

B2 (x0 ; r0 ) × B2 (y0 ; R0) ⊂ dom F

et tels que les conditions suivantes soient satisfaites.


1. F (x0 , y0 ) = 0 (c’est-à-dire (x0 , y0 ) ∈ F −1 ({0})).
2. La fonction F (., y0 ) : x 2→ F (x, y0 ) est continue en x0 .
3. Pour chaque x ∈ B2 (x0 ; r0 ) la fonction F (x, ·) : y 2→ F (x, y) de Rp dans
Rp est dérivable en chaque y ∈ B2 (y0 ; R0), et, pour chaque 1 ≤ j ≤ p, la
fonction correspondante Dyj F : (x, y) 2→ Dyj F (x, y) de Rn × Rp dans Rp est
continue en (x0 , y0 ).
4. L’application linéaire (F (x0 , ·))$y0 de Rp dans Rp est inversible (c’est-à-dire
le déterminant de la matrice jacobienne correspondante

(Dyj Fk (x0 , y0 ))(1≤j≤p; 1≤k≤p)

est différent de zéro).


Alors il existe r ∈ ]0, r0[ et R ∈ ]0, R0[ tels que la restriction f du graphe
F −1 ({0}) à B2 [x0 ; r]×B2 [y0 ; R] est une application de B2 [x0 ; r] dans B2 [y0 ; R]
continue en x0 .
Démonstration. La première partie de la thèse revient à démontrer l’exis-
tence de r ∈]0, r0[ et R ∈]0, R0[ tels que, pour chaque x ∈ B2 [x0 ; r], l’équation

F (x, y) = 0 (5.12)

en l’inconnue y possède dans B2 [y0 ; R] une solution unique, que l’on notera
alors f (x). La deuxième partie de la thèse revient à prouver que f est
continue en x0 . Nous allons construire, pour chaque x ∈ B2 (x0 , r0) une
fonction de R dans R dont les points fixes y correspondent aux solutions
182 CHAPITRE 5. FONCTIONS IMPLICITES

de (5.12) et pour laquelle le théorème des applications contractantes sera


applicable. Si nous posons L = (F (x0 , ·))$y0 , (L est donc une application
linéaire inversible de Rp dans Rp ), alors pour chaque (x, y) ∈ B2 (x0 ; r0) ×
B2 (y0 ; R0), nous avons

F (x, y) = 0 ⇔ Ly + F (x, y) − Ly = 0 ⇔ y = G(x, y),

si G est la fonction de Rn × Rp de domaine égal à dom F définie par

G(x, y) = −L−1 [F (x, y) − Ly].

Pour chaque x ∈ B2 (x0 ; r0 ), si u ∈ B2 (y0 ; R0) et v ∈ B2 (y0 ; R0 ), l’inégalité de


la moyenne appliqué à la fonction G(x, ·) : y 2→ G(x, y) entraı̂ne l’existence
d’un θ ∈ ]0, 1[ tel que

|G(x, u) − G(x, v)|2 ≤ |(G(x, ·))$v+θ(u−v)(u − v)|2

= |L−1 [(F (x, ·))$v+θ(u−v) − L](u − v)|2


≤ |L−1 |2,2 |[(F (x, ·))$v+θ(u−v) − L](u − v)|2
≤ |L−1 |2,2 |(F (x, ·))$v+θ(u−v) − L|2,2 |u − v|2
 1/2
p
$
−1
= |L |2,2  |Dyj F (x, v + θ(u − v)) − Dyj F (x0 , y0 )|22  |u − v|2 .
j=1

Par l’hypothèse 3, il existe r1 ∈ ]0, r0[ et R ∈ ]0, R0[ tels que, pour tout
(x, y) ∈ B2 [x0 ; r1] × B2 [y0 ; R] et chaque 1 ≤ j ≤ p, on a
1
|Dyj F (x, y) − Dyj F (x0 , y0 )|2 ≤ ,
2p1/2|L−1 | 2,2

et dès lors, si x ∈ B2 [x0 ; r1], u ∈ B2 [y0 ; R], v ∈ B2 [y0 ; R], on aura, pour le θ
donné par le théorème de la moyenne, v + θ(u − v) ∈ B2 [y0 ; R], et dès lors,
1
|G(x, u) − G(x, v)|2 ≤ |u − v|2 ,
2
ce qui montre que, pour chaque x ∈ B2 [x0 ; r1 ], l’application G(x, ·) est lips-
chitzienne de constante 12 sur B2 [y0 ; R]. Pour pouvoir appliquer le théorème
du point fixe de Banach, il faut encore que G(x, ·) soit une application de
B2 [y0 ; R] dans B2 [y0 ; R]. On a, pour tout x ∈ B2 [x0 ; r1 ] et tout y ∈ B2 [y0 ; R],

|G(x, y) − y0 |2 ≤ |G(x, y) − G(x, y0 )|2 + |G(x, y0) − y0 |2


5.6. FONCTIONS IMPLICITES : RÉGULARITÉ 183

= |G(x, y) − G(x, y0 )|2 + |L−1 F (x, y0 )|2

1 R
≤ |y − y0 |2 + |L−1 F (x, y0 )|2 ≤ + |L−1 F (x, y0 )|2 .
2 2
Par l’hypothèse 1, l’hypothèse 2 et la continuité des applications linéaires, il
existe r ∈ ]0, r1] tel que, pour tout x ∈ B2 [x0 ; r], on a

R
|L−1 F (x, y0 )|2 = |L−1 [F (x, y0 ) − F (x0 , y0 )]|2 ≤ ,
2

et dès lors, pour chaque x ∈ B2 [x0 ; r] et chaque y ∈ B2 [y0 ; R], on aura

|G(x, y) − y0 |2 ≤ R,

ce qui montre que G(x, ·) est une application du fermé B2 [y0 ; R] en elle-
même. Le théorème de Banach entraı̂ne donc, pour chaque x ∈ B2 [x0 ; r],
l’existence d’un point fixe unique y ∈ B2 [y0 ; R] de G(x, ·), c’est-à-dire l’exis-
tence d’un unique y = f (x) ∈ B2 [y0 ; R] tel que F [x, f (x)] = 0. Pour x = x0 ,
l’unicité entraı̂ne en particulier que f (x0 ) = y0 . Il reste à montrer que f est
continue en x0 . Si x ∈ B2 [x0 ; r], on a

|f (x) − f (x0 )|2 = |G[x, f (x)] − G[x0 , f (x0 )]|2

= |G[x, f (x)] − G[x, f (x0)] + G(x, y0 ) − G(x0 , y0 )|2

1
≤ |f (x) − f (x0 )|2 + |L−1 [F (x, y0 ) − F (x0 , y0 )]|2.
2
Dès lors,
|f (x) − f (x0 )|2 ≤ 2|L−1 [F (x, y0 ) − F (x0 , y0 )]|2 ,

et comme le second membre tend vers 0 lorsque x tend vers x0 en vertu de


l’hypothèse 2, on voit que f est continue en x0 .

5.6 Fonctions implicites : régularité


Si l’on impose à F des conditions de continuité ou de dérivabilité plus fortes,
on obtient des conditions de continuité ou de dérivabilité plus fortes pour f .
184 CHAPITRE 5. FONCTIONS IMPLICITES

Proposition. Dans les conditions du théorème des fonctions implicites, si


l’on suppose en outre que, pour chaque y ∈ B2 (y0 ; R0 ), la fonction F (·, y) :
x 2→ F (x, y) est continue sur B2 (x0 ; r0 ), alors f est continue sur B2 [x0 ; r].
Démonstration. Il suffit d’imiter la fin de la démonstration du théorème
des fonctions implicites. Si a ∈ B2 [x0 ; r] et x ∈ B2 [x0 ; r], on a

|f (x) − f (a)|2 = |G[x, f (x)] − G[a, f (a)]|2

= |G[x, f (x)] − G[x, f (a)] + G(x, f (a)) − G(a, f (a))|2


1
≤ |f (x) − f (a)|2 + |L−1 [F (x, f (a)) − F (a, f (a))]|2.
2
Dès lors,

|f (x) − f (a)|2 ≤ 2|L−1 [F (x, f (a)) − F (a, f (a))]|2,

et comme le second membre tend vers 0 lorsque x tend vers a en vertu de


l’hypothèse de continuité sur F (·, f (a)), on voit que f est continue en a.

Proposition. Dans les conditions du théorème des fonctions implicites, si


l’on suppose en outre que F est dérivable en (x0 , y0 ), alors f sera dérivable
en x0 et
fx$ 0 = −[(F (x0 , ·))$y0 ]−1 (F (·, y0 ))$x0 .
Démonstration. La dérivabilité de F en (x0 , y0 ) entraı̂ne l’existence d’une
fonction α de Rn ×Rp dans Rp de domaine au moins égal à (dom F −(x0 , y0 ))\
{(0, 0)}, tendant vers zéro lorsque son argument tend vers zéro et telle que
$
F (x0 + h, y0 + l) = F (x0 , y0 ) + F(x 0 ,y0 )
(h, l) + |(h, l)|2α(h, l)

= F (x0 , y0 ) + (F (., y0 ))$x0 (h) + (F (x0 , .))$y0 (l) + |(h, l)|2α(h, l),
pour tout (h, l) ∈ (dom F − (x0 , y0 )) \ {(0, 0)}. Dès lors, si h ∈ Rp est tel que
|h|2 ≤ r $ avec r $ ∈ ]0, r] tel que |f (x0 + h) − f (x0 )|2 ≤ R lorsque |h|2 ≤ r $ (un
tel r $ existe toujours puisque f est continue en x0 ), il résulte de la définition
de f et de l’égalité précédente avec l = f (x0 + h) − f (x0 ) que

0 = (F (·, y0))$x0 (h) + (F (x0 , ·))$y0 (f (x0 + h) − f (x0 ))

+|(h, f (x0 + h) − f (x0 ))|2α[h, f (x0 + h) − f (x0 )];


dès lors, puisque (F (x0 , ·))$y0 est inversible,

f (x0 + h) − f (x0 )
5.6. FONCTIONS IMPLICITES : RÉGULARITÉ 185

= −[(F (x0 , ·))$y0 ]−1 (F (·, y0 ))$x0 (h) + |(h, f (x0 + h) − f (x0 ))|2 β(h)], (5.13)

où β est définie par

β(h) = −[(F (x0 , ·))$y0 ]−1 α (h, f (x0 + h) − f (x0 )) ,

et tend donc vers 0 lorsque h tend vers zéro. En particulier, on peut trouver
un r $$ ∈ ]0, r $] tel que, pour tout 0 < |h|2 ≤ r $$ , on ait
1
|β(h)|2 ≤ ,
2
et dès lors, pour ces mêmes valeurs de h, on déduit de (5.13) que
# #
# #
|f (x0 + h) − f (x0 )|2 ≤ #[(F (x0 , ·))$y0 ]−1 (F (·, y0 ))$x0 (h)#
2

1 1
+ |h|2 + |f (x0 + h) − f (x0 )|2 ,
2 2
c’est-à-dire,

|f (x0 + h) − f (x0 )|2 ≤ 2|[(F (x0, ·))$y0 ]−1 [(F (·, y0 ))$x0 (h)|2 + |h|2 .
f (x0 +h)−f (x0 )
Il en résulte aussitôt que la fonction h 2→ |h|2 est localement bornée
en 0. Dès lors (5.13) peut s’écrire

f (x0 + h) − f (x0 )
#4 5#
# h f (x0 + h) − f (x0 ) ##
= −[(F (x0 , ·))$y0 ]−1 (F (·, y0 ))$x0 (h) + |h|2 ## , # β(h)
|h|2 |h|2 2

= −[(F (x0 , ·))$y0 ]−1 (F (·, y0 ))$x0 (h) + |h|2 γ(h),


où la fonction γ définie par
#4 5#
# h f (x0 + h) − f (x0 ) ##
γ(h) = ## , # β(h),
|h|2 |h|2 2

tend vers 0 lorsque h tend vers 0 comme produit d’une fonction localement
bornée en 0 par une fonction tendant vers zéro. Par la caractérisation de la
dérivabilité totale, f est dérivable en x0 et

fx$ 0 = −[(F (x0 , ·))$y0 ]−1 (F (·, y0 ))$x0 .


186 CHAPITRE 5. FONCTIONS IMPLICITES

Remarque. Lorsque n = p = 1, la formule donnant la dérivée d’une fonc-


tion implicite peut évidemment s’écrire, en termes de dérivées ordinaires
D1 F (x0 , y0 )
f $ (x0 ) = − .
D2 F (x0 , y0 )
En faisant des hypothèses de dérivabilité plus fortes sur F , on obtient
des propriétés correspondantes de dérivabilité pour f .
Proposition. Supposons que, outre les conditions du théorème des fonc-
tions implicites, F soit dérivable en chaque point de B2 (0; r0) × B2 (y0 ; R0)
et que les fonctions (x, y) 2→ Dxi F (x, y), (1 ≤ i ≤ n) et (x, y) 2→ Dyj F (x, y),
(1 ≤ j ≤ p) soient continues sur B2 (0; r0)×B2 (y0 ; R0). Alors il existe r̃ ∈]0, r]
tel que f soit dérivable en chaque point x de B2 (0; r̃) et tel que les fonctions
x 2→ Dif (x), (1 ≤ i ≤ n), soient continues sur B2 (0; r̃).
Démonstration. Par hypothèse, la fonction (x, y) 2→ det(F (x, ·))$y est
continue sur B2 (0; r0) × B2 (y0 ; R0 ) et telle que det(F (x0 , ·)$y0 /= 0. Comme,
en outre, f est continue sur B2 (0; r0), la fonction x 2→ det(F (x, ·))$f (x) est
continue sur B2 (0; r0) et telle que
det(F (x0 , ·))$f (x0) = det(F (x0 , ·))$y0 /= 0.
En conséquence, il existe r̃ ∈ ]0, r0] tel que det(F (x, ·))$f (x) /= 0 pour tout x ∈
B2 (x0 ; r̃) et la Proposition précédente est applicable en un tel x, entraı̂nant
la dérivabilité de f en x et la formule
fx$ = −[(F (x, ·))$f (x)]−1 (F (·, f (x)))$x.
Dès lors, en utilisant les formules reliant dérivée totale et dérivées partielles,
la continuité des dérivées partielles de F et les formules donnant l’inverse et
le produit de deux matrices, on en déduit la continuité des dérivées partielles
Di f, (1 ≤ i ≤ n) en chaque point de B2 (x0 ; r̃).
Remarque. Dans le cas où n = p = 1 et où f est dérivable sur un voisinage
de x0 , la formule donnant la dérivée de f en x peut se retrouver à partir de
l’identité
F (x, f (x)) = 0,
en utilisant le théorème de dérivation d’une fonction composée, qui entraı̂ne
ici
d
0= [F (x, f (x))] = D1 F (x, f (x)) + D2 F (x, f (x))f $(x),
dx
dont on déduit aussitôt
D1 F (x, f (x))
f $ (x) = − .
D2 F (x, f (x))
5.7. FONCTION RÉCIPROQUE 187

5.7 Fonction réciproque


Le théorème des fonctions implicites permet d’étudier l’existence locale et
la régularité de la fonction réciproque d’une fonction de Rp dans Rp. Soit g
une fonction de Rp dans Rp , y0 ∈ dom g, et posons x0 = g(y0 ). Le graphe
de g est l’ensemble

G = {(y, x) ∈ Rp × Rp : y ∈ dom g et x = g(y)}

et le graphe réciproque G−1 est l’ensemble

G−1 = {(x, y) ∈ Rp × Rp : y ∈ dom g et x = g(y)}.

Le problème de l’existence locale de la fonction réciproque de g consiste à


trouver des conditions sous lesquelles la restriction de G−1 à un voisinage de
(x0 , y0 ) est une fonction, qui sera alors la fonction réciproque g −1 de g au
voisinage du point considéré. Si l’on remarque que

G−1 = {(x, y) ∈ Rp × Rp : y ∈ dom g et g(y) − x = 0},

on voit que l’existence de la fonction réciproque de g au voisinage de (x0 , y0 )


n’est rien d’autre que l’existence locale de la fonction implicite correspondant
à F (x, y) = g(y) − x.
Proposition. Soit g une fonction de Rp dans Rp , y0 ∈ dom g, x0 = g(y0 ).
S’il existe R0 > 0 tel que g soit dérivable en chaque point de B2 (y0 ; R0 ) et
tel que, pour chaque 1 ≤ j ≤ p, la fonction y 2→ Dj g(y) soit continue en
y0 , et si gy$ 0 est inversible (c’est-à-dire si det gy$ 0 /= 0), alors il existe r̃ > 0
et R̃ ∈ ]0, R0[ tels que la restriction du graphe G−1 à B2 (x0 ; r̃) × B2 (y0 ; R̃)
soit une application g −1 de B2 (x0 ; r̃) dans B2 (y0 ; R̃) continue sur B2 (x0 ; r̃),
dérivable en y0 et telle que

(g −1 )$x0 = [gg$ −1(x0 ) ]−1 .

Si, en outre, pour chaque 1 ≤ j ≤ p,la fonction y 2→ Dj g(y) est continue sur
B2 (y0 ; R0), alors g −1 est dérivable en chaque point de B2 (x0 ; r̃), telle que

(g −1 )$x = [gg$ −1(x)]−1 ,

et telle que, pour chaque 1 ≤ j ≤ p, la fonction x 2→ Dj g −1 (x) est continue


en chaque point x ∈ B2 (x0 ; r̃).
Démonstration. Il suffit de vérifier que la fonction F définie par F (x, y)
= g(y) − x sur dom F = Rp × dom g vérifie les conditions de régularité
188 CHAPITRE 5. FONCTIONS IMPLICITES

requises par la version du théorème des fonctions implicites correspondant


aux hypothèses de régularité faites et de noter que

(F (x, ·))$y = gy$ , (F (·, y))$x = −I.

Remarque. Lorsque p = 1, la formule donnant la dérivée de la fonction


réciproque de g peut encore s’écrire
1
(g −1 )$ (x0 ) = .
g $ [g(x0)]

Par exemple, si g(y) = y 2 , y0 /= 0 et x0 = y02 , on retrouve la formule bien


connue
1
(g −1 )$ (x0 ) = 1/2 .
2x0

5.8 Théorème de l’application intérieure


Une autre application intéressante du théorème des fonctions implicites est
une version non linéaire de la propriété suivante des applications linéaires. Si
L : Rm → Rp est linéaire et surjective, c’est-à-dire si rang L = p, alors, pour
chaque a ∈ Rm , L(a) est évidemment intérieur à L(Rm ) = Rp; si L n’est
pas surjective, c’est-à-dire si rang L < p, L(Rm ) est un sous-espace vectoriel
propre de Rp et, quel que soit a ∈ Rm , L(a) n’est pas intérieur à L(Rm ),
puisque int L(Rm ) est vide. En d’autres termes, la condition nécessaire et
suffisante pour que L(a) soit intérieur à L(Rm ) est que rang L = p. C’est
la partie suffisante de ce résultat que le théorème des fonctions implicites
permet d’étendre, localement, sous le nom de théorème de l’application
intérieure, à certaines fonctions de Rm dans Rp . Ce théorème donne donc
des conditions sur g pour que l’image par g d’un voisinage de a soit un
voisinage de g(a).
Proposition. Soit a ∈ Rm , r0 > 0 et g une fonction de Rm dans Rp
dérivable en chaque point x ∈ B2 (a; r0) et telle que, pour chaque 1 ≤ j ≤ m,
la fonction x 2→ Dj g(x) soit continue en a. Si m ≥ p et rang ga$ = p, alors
g(a) est intérieur à g[B2 (a; r0)].
Démonstration. Il faut donc trouver un r ∈ ]0, r0[ tel que B2 [g(a); r] ⊂
g[B2 (a; r0)], c’est-à-dire trouver un r ∈ ]0, r0[ tel que, pour chaque v ∈
B2 [g(a); r], il existe un u ∈ B2 (a; r0) tel que g(u) = v. Puisque rang ga$ = p,
5.9. EXTRÉMANTS LIÉS 189

on peut trouver dans {D1 g(a), . . ., Dmg(a)} p éléments formant une famille
libre et, en permutant si nécessaire les indices des variables, on peut, sans
perte de généralité, supposer que les p premiers éléments forment une telle
famille, c’est-à-dire supposer que

det col [D1 g(a), . . ., Dpg(a)] /= 0.

En vertu des hypothèses, si l’on pose

y0 = (a1 , . . . , ap), x0 = (g1 (a), . . ., gp(a), ap+1, . . . , am ),

l’application F définie sur B2 (x0 ; r0 ) × B2 (y0 ; 0) par

F (x, y) = g(y1 , . . . , yp , xp+1 , . . . , xm) − (x1 , . . ., xp)

est telle que,


F (x0 , y0 ) = g(a) − g(a) = 0,
det(F (x0 , ·)$y0 = det col[D1 g(a), . . ., Dpg(a)] /= 0.
Le théorème des fonctions implicites implique donc l’existence d’un r ∈]0, r0[,
d’un R ∈ ]0, r0[ et d’une application f : B2 [x0 ; r] → B2 [y0 ; R] continue en x0
et telle que, pour tout x ∈ B2 [x0 ; r], on ait F (x, f (x)) = 0. En particulier, si
v ∈ B2 [g(a); r] ⊂ Rp , alors (v, ap+1 , . . . , am) ∈ B2 [x0 ; r], et on a donc

F [v, ap+1 , . . . , am , v, f (v, ap+1, . . . , am )] = 0,

c’est-à-dire
v − g[f (v, ap+1, . . . , am ), ap+1 , . . ., am ] = 0,
avec [f (v, ap+1, . . . , am), ap+1 , . . . , am] ∈ B2 (a; r0).
Remarque. Par définition du rang, on a rang ga$ ≤ min{m, p} = p. Dès
lors, le théorème de l’application intérieure implique que si g(a) n’est pas
intérieur à g(B2 (a; r0 )), alors rang ga$ < p.

5.9 Extrémants liés


Le théorème de Fermat a fourni une condition nécessaire pour l’existence
d’un extrémant local libre d’une fonction réelle f . Nous allons montrer que le
théorème des fonctions implicites ou ses conséquences permettent de donner
des conditions nécessaires d’existence pour certains extrémants liés , c’est-à-
dire non intérieurs au domaine de la fonction f . Pour motiver ces conditions,
190 CHAPITRE 5. FONCTIONS IMPLICITES

soient f et g des fonctions de R2 dans R définies sur B2 (a; r0) pour un


certain a ∈ R2 et un certain r0 > 0, et soit E = {(x, y) ∈ R × R : g(x, y) =
0}. On supposera que a ∈ E, c’est-à-dire que g(a) = 0. On veut trouver
une condition nécessaire pour que a soit un extrémant local de f sur E.
Pour fixer les idées, supposons que a soit un maximant local de f sur E,
c’est-à-dire qu’il existe r $ ∈ ]0, r0[ tel que, pour tout (x, y) ∈ B2 (a; r $) ∩ E,
on ait f (x, y) ≤ f (a1 , a2 ). Supposons en outre que f soit dérivable en a,
que g soit dérivable en chaque point x ∈ B2 (a; r0), que D2 g(a1 , a2 ) /= 0 et
que les fonctions (x, y) 2→ D1 g(x, y) et (x, y) 2→ D2 g(x, y) soient continues
en a. Dans ce cas, le théorème des fonctions implicites appliqué à g en a
entraı̂ne l’existence d’un r ∈ ]0, r0[, d’un R ∈ ]0, r0[ et d’une application
e : [a1 − r, a1 + r] → [a2 − R, a2 + R] dérivable en a1 et telle que e soit la
restriction du graphe E sur [a1 − r, a1 + r] × [a2 − R, a2 + R]. En d’autres
termes, si l’on prend r ≤ r $ , on a (x, y) ∈ E ∩ B2 (a; r) si et seulement si
y = e(x) et dès lors

f (x, y) ≤ f (a1 , a2 ), x ∈ E ∩ B2 (a; r),

si et seulement si

f (x, e(x)) ≤ f (a1 , a2 ), x ∈ ]a1 − r, a1 + r[.

Par conséquent, a1 est un maximant local libre de la fonction (de R dans


R) x 2→ f (x, e(x)), qui est dérivable en a1 , et le théorème de Fermat et les
théorèmes de dérivation des fonctions composées et des fonctions implicites
entraı̂nent que
d
0= [f (a1 , e(a1))] = D1 f (a1 , e(a1 )) + D2 f (a1 , e(a1 ))e$ (a1 )
dx
D1 g(a1 , a2 )
= D1 f (a1 , a2 ) − D2 f (a1 , a2) ,
D2 g(a1 , a2 )
c’est-à-dire & '
D1 f (a1 , a2 ) D1 g(a1 , a2 )
det = 0.
D2 f (a1 , a2 ) D2 g(a1 , a2 )
Par conséquent, la famille {fa$ , ga$ } n’est pas libre et il existe donc (µ0 , µ1 )
/= (0, 0) tel que
µ0 fa$ + µ1 ga$ = 0.
On a nécessairement µ0 /= 0 car, si µ0 = 0, alors µ1 ga$ = 0 et donc, puisque
ga$ /= 0, µ1 = 0 ce qui est contradictoire. En divisant les deux membres par
5.9. EXTRÉMANTS LIÉS 191

µ0 , la relation précédente s’écrit

fa$ + λ1 ga$ = 0.

Si l’on se souvient que la condition a ∈ E équivaut à g(a) = 0, on voit que


si a est un extrémant local de f sur

E = {(x, y) : g(x, y) = 0},

alors il existe λ1 ∈ R tel que

(Lf,g )$a,λ1 = 0,

où Lf,g est la fonction de Lagrange associée à f et g, c’est-à-dire la fonction


de R3 dans R définie par

Lf,g (x, λ) = f (x) + λg(x).

On constate en effet que

D1 Lf,g (x, λ) = D1 f (x) + λD1 g(x),

D2 Lf,g (x, λ) = D2 f (x) + λD2 g(x),


D3 Lf,g (x, λ) = g(x).
Le nombre λ1 est appelé le multiplicateur de Lagrange relatif à l’extrémant
lié a de f . Si, au lieu de supposer que D2 g(a1, a2 ) /= 0, on suppose que
D1 g(a1 , a2 ) /= 0, on arrive au même résultat en intervertissant le rôle de x
et y dans l’application du théorème des fonctions implicites à g. On obtient
donc la conclusion sous la seule hypothèse que rang ga$ = 1.
On peut généraliser ce résultat à une fonction f de Rn dans R et à une
fonction g de Rn dans Rq . Dans ce cas, il est plus simple d’utiliser, au lieu
du théorème des fonctions implicites, le théorème de l’application intérieure.
Le premier résultat s’appelle la règle des multiplicateurs de Cara-
théodory.
Proposition. Soit f une fonction de Rn dans R, g une fonction de Rn dans
Rq , a ∈ Rn et r > 0 tels que f et g soient définies sur B2 (a; r) et g(a) = 0.
Supposons que f et g soient dérivables en x pour chaque x ∈ B2 (a; r) et
que, pour chaque 1 ≤ j ≤ n, les fonctions x 2→ Dj f (x) et x 2→ Dj g(x) soient
continues en a. Si a est un extrémant local de f sur l’ensemble

E = {x ∈ Rn : g(x) = 0},
192 CHAPITRE 5. FONCTIONS IMPLICITES

alors il existe γ = (γ0 , γ1, . . . , γq ) ∈ Rq+1 \ {0} tel que γ0 ≥ 0 et tel que
q
$
γ0 fa$ + γj (gj )$a = 0,
j=1

c’est-à-dire tel que (a, γ1, . . . , γq) soit un point critique de la fonction Cf,g
de Rn × Rq définie par
q
$
Cf,g (x, γ1, . . . , γq ) = γ0 f (x) + γj gj (x).
j=1

Démonstration. Supposons, pour fixer les idées, que a soit un minimant


local de f sur E, et soit r $ ∈ ]0, r[ tel que

f (a) ≤ f (x) (5.14)

pour tout x ∈ B2 [a; r $] ∩ E. Soit h la fonction de Rn dans Rq+1 définie par


h = (f, g1 , . . . , gq), et soit

W = {(y0 , 0, . . ., 0) ∈ Rq+1 : y0 < f (a)}.

Notons que h(a) = (f (a), 0, . . ., 0). En vertu de (5.14), on a

h(B2 [a; r $ ]) ∩ W = ∅. (5.15)

En conséquence,

h(a) /∈ int h(B2 [a; r $]), (5.16)

car, dans le cas contraire, il existerait r0 > 0 tel que

B2 [h(a); r0] ⊂ h(B2 [a; r $])

et l’on aurait donc, pour k ≥ r10 , (f (a) − k1 , 0, . . ., 0) ∈ h(B2 [a; r $]) ∩ W, ce


qui est impossible par (5.15). Il résulte alors de (5.16) et de la remarque qui
suit le théorème de l’application ouverte que rang h$a < q + 1, c’est-à-dire
qu’il existe γ = (γ0 , γ1, . . . , γq ) ∈ Rq+1 \ {0} tel que
q
$
γ0 fa$ + γj (gj )$a = 0,
j=1

et l’on peut, sans perte de généralité, supposer que γ0 ≥ 0 dans cette égalité
en multipliant, le cas échéant, les deux membres par −1.
5.9. EXTRÉMANTS LIÉS 193

Remarque. Les nombres (γ0, γ1 , . . . , γq) s’appellent les multiplicateurs de


Carathéodory et Cf,g la fonction de Carathéodory associés à f et g.
Un cas particulier important de la proposition précédente porte le nom
de règle des multiplicateurs de Lagrange.
Corollaire. Dans les conditions de la proposition précédente, si l’on sup-
pose en outre que
rang ga$ = q,
il existe λ = (λ1 , . . . , λq ) ∈ Rq tel que
q
$
fa$ + λj (gj )$a = 0,
j=1

c’est-à-dire un λ tel que (a, λ) soit un point critique de la fonction Lf,g de


Rn × Rq dans R définie par
q
$
Lf,g (x, λ) = f (x) + λj gj (x) = f (x) + (λ|g(x)).
j=1

Démonstration. Soit γ = (γ0 , γ1 , . . . , γq) ∈ Rq+1 \ {0} donné par la règle


de Caratheodory. Si γ0 = 0, alors (γ1 , . . . , γq) /= 0 et
q
$
γj (gj )$a = 0,
j=1

ce qui contredit l’hypothèse rang ga$ = q. Donc, γ0 /= 0 et la thèse s’en déduit


γ
en posant λj = γj0 , (1 ≤ j ≤ q).
Remarque. Les nombres (λ1 , . . . , λq ) fournis par la proposition précédente
s’appellent les multiplicateurs de Lagrange et Lf,g la fonction de Lagrange
associés à f et g.
Exemple. Cherchons à déterminer les extrémants locaux de la fonction f
de R2 dans R définie par f (x) = |x|2 sur l’ensemble

E = {(x1 , x2 ) ∈ R2 : g(x1, x2 ) = 0},

lorsque, a > 0 et b > 0 étant donnés,


4 52 4 52
x1 x2
g(x1 , x2) = + − 1,
a b
194 CHAPITRE 5. FONCTIONS IMPLICITES

c’est-à-dire les extrémants locaux de la distance entre l’origine et les points


de l’ellipse E. On a
x1 x2
D1 g(x1 , x2 ) = 2 2
, D2 g(x1 , x2 ) = 2 2 ,
a b
et dès lors rang gx$ = 1 pour tout x ∈ E puisque (0, 0) /∈ E. La fonction de
Lagrange est la fonction L = Lf,g définie par
,4 52 4 52 -
x1 x2
L(x, λ) = |x|2 + λ + −1 ,
a b

et ses points critiques sont les solutions du système d’équations


x1 x1
D1 L(x, λ) = + 2λ 2 = 0,
|x|2 a
x2 x2
D2 L(x, λ) = + 2λ 2 = 0,
|x|2 b
4 52 4 52
x1 x2
D3 L(x, λ) = + − 1 = 0.
a b
La résolution de ce système fournit les solutions
4 5 4 5 4 5 4 5
b b a a
0, b, − , 0, −b, − , a, 0, − , −a, 0, − ,
2 2 2 2

dont les deux premières composantes correspondent aux sommets de l’ellipse


E.

5.10 Exercices
1. Montrer que la suite (ak )k∈N dans Rp converge vers a si et seulement
toute sous-suite de (ak )k∈N contient une sous-suite convergeant vers a.
2. Montrer que si la suite (ak )k∈N dans Rp converge vers a, alors a est le
seul point d’accumulation de (ak )k∈N .
3. Utiliser le théorème de Bolzano-Weierstrass pour démontrer le théorème
de Cantor : Si (Bk )k∈N est une suite de fermés bornés emboı̂tés (Bk+1 ⊂ Bk
7
pour tout k ∈ N), alors k∈N Bk est un fermé borné non vide.
4. Utiliser le théorème de Bolzano-Weierstrass pour démontrer le théorème
de Heine (suggestion : procéder par l’absurde).
5.10. EXERCICES 195

5. Soit A : Rn → Rn une application linéaire inversible. Montrer que, pour


toute application linéaire B : Rn → Rn telle que

1
|B|2,2 < ,
|A−1 |2,2

l’application linéaire A + B est inversible. Suggestion : il suffit de montrer


que, pour tout x ∈ Rn , l’équation (A+B)y = x possède une solution unique.
Cette équation est équivalente au problème de point fixe

y = −A−1 By + A−1 x ≡ gx(y),

et l’on a, pour tout y ∈ Rn et tout z ∈ Rn ,

|gx (y) − gx(z)|2 ≤ |A−1 |2,2 |B(y − z)|2 ≤ |A−1 |2,2 |B|2,2 |y − z|2 ,

ce qui montre que gx est contractante sur Rn .


6. Soit f une contraction de Rn dans Rp , de constante de contraction α. On
définit g : Rn → R par
g(x) = |x − f (x)|2 .
Montrer que, pour tout x ∈ Rn , on a

g(x) ≥ (1 − α)|x|2 − |f (0)|2.

En conséquence, il existe y ∈ Rn tel que g(y) ≤ g(x) pour tout x ∈ Rn . En


particulier,

g(y) ≤ g(f (y)) = |f (y) − f (f (y))|2 ≤ α|y − f (y)|2 = αg(y),

ce qui entraı̂ne que g(y) = 0 et donc que y est un point fixe de f . Montrer que
cette nouvelle démonstration du théorème du point fixe de Banach fournit
l’existence d’un point fixe unique de f sous les hypothèses plus générales :
a. |x − f (x)|2 → +∞ si x → ∞.
b. |f (x) − f (y)|2 < |x − y|2 pour tout x /= y dans Rn .
7. Soit
n
$
F : R × Rn+1 → R, (x, a0, a1 , . . . , an ) 2→ ak xk .
k=0

Une racine simple de l’équation (en l’inconnue x)

F (x, a) = 0
196 CHAPITRE 5. FONCTIONS IMPLICITES

est un x ∈ R vérifiant cette équation et tel que F1$ (x, a) /= 0. Utiliser le


théorème des fonctions implicites pour montrer que si x∗ est une racine
simple de l’équation
F (x, a∗ ) = 0,
alors il existe r > 0 et R > 0 et une application continue f : [−r, r] ×
B2 [−R, R] unique tels que, pour chaque a ∈ B2 [−R, R], l’équation

F (x, a)

possède dans [−r, r] la solution unique f (a). (Dépendance continue des so-
lutions d’une équation algébrique par rapport aux coefficients au voisinage
d’une racine simple). Généraliser le résultat aux équations complexes en
utilisant la notion de C-dérivabilité.
8. Montrer que l’application

g : R2 → R2 , (y1 , y2 ) 2→ (exp y1 cos y2 , exp y1 sin y2 ),

vérifie en chaque point (y1 , y2 ) ∈ R2 les conditions du théorème de la fonction


réciproque, mais n’est pas une bijection de R2 sur R2 (noter que g(y1 , y2 +
2kπ) = g(y1 , y2 )) (Caractère local du théorème de la fonction réciproque).
9. Soit a : Rn → R l’application définie par
n $
$ n
a(x) = ajk xj xk ,
j=1 k=1

où les ajk sont des nombres réels tels que

ajk = akj , (1 ≤ j, k ≤ n).

On dit que a est la forme quadratique associée à la matrice symétrique A


d’éléments ajk . En fait, on a, pour tout x ∈ Rn ,

a(x) = (Ax|x).

Comme a est continue sur Rn , elle admet, par le théorème de Weierstrass, un


minimant y et un maximant z sur le fermé borné S = {x ∈ Rn : |x|22 = 1}.
Utiliser la règle des multiplicateurs de Lagrange pour montrer que si l’on
pose
λ1 = a(y), λn = a(z),
alors λ1 et λn sont respectivement la plus petite et la plus grande valeur
propre de A.
5.11. PETITE ANTHOLOGIE 197

5.11 Petite anthologie


Si l’on a à l’intérieur d’une partie bornée du plan une infinité de points
possédant une certaine propriété, alors il existe dans son intérieur ou sur sa
frontière au moins un point tel que dans tout voisinage de ce point il y a une
infinité de points ayant cette propriété.

Karl Weierstrass, 1866

Si dans une suite de grandeurs

F1 (x), F2(x), F3 (x), . . ., Fn (x), . . ., Fn+r (x),

la différence entre son ne terme Fn (x) et tout terme ultérieur Fn+r (x), aussi
éloigné soit-il du ne , reste plus petite que toute grandeur donnée, si l’on a
pris n suffisamment grand, alors il existe toujours une certaine grandeur
constante, et une seule, dont s’approchent toujours davantage les termes
de cette suite et dont ils peuvent s’approcher d’aussi près que l’on voudra,
lorsqu’on prolonge la suite suffisamment loin.

Bernard Bolzano, 1817

Soit un système de n équations entre m + n variables

f1 (x1 , . . . , xm, y1 , . . ., yn ) = 0, . . ., fn (x1 , . . . , xm , y1 , . . . , yn ) = 0,

qui sont satisfaites pour la valeur

a1 , . . ., am , b1, . . . , bn,

des variables; supposons que les fonctions f1 , . . . , fn et leurs dérivées par-


tielles du premier ordre soient continues dans un voisinage du point

(a1 , . . ., am , b1, . . . , bn);

finalement supposons que le déterminant :


# #
# ∂f1 ∂f1
... ∂f1 #
# ∂y1 ∂y2 ∂yn #
# ∂f2 ∂f2 ∂f2 #
# ... #
J = ## ∂y1 ∂y2 ∂yn #
# ... ... ... . . . ##
# ∂fn ∂fn ∂fn ##
# ∂y ∂y2 ... ∂y
1 n
198 CHAPITRE 5. FONCTIONS IMPLICITES

ne soit pas nul en ce point. Alors il existe un et un seul système de fonctions


y des variables x:

y1 = ψ1 (x1 , . . . , xm ), . . ., yn = ψn (x1 , . . . , xn ),

définies sur un voisinage du point a1 , . . . , am et qui vérifient identiquement


les équations f1 = 0, . . ., fn = 0 pour les valeurs correspondantes de la
variable x; y1 , . . . , yn sont des fonctions continues, qui prennent au point
a1 , . . . , am les valeurs b1 , . . . , bn et qui possèdent des dérivées partielles pre-
mières.

Giuseppe Peano, 1884

On connaı̂t les beaux résultats obtenus par M. E. Picard dans l’étude des
équations différentielles et des équations aux dérivées partielles, grâce à sa
méthode des approximations successives. Cette méthode s’applique également
avec une grande facilité à la théorie des fonctions implicites. ... Soit f (x, y)
une fonction de deux variables indépendantes réelles x et y, continue dans le
voisinage d’un système de valeurs x0 , y0 , tel que f (x0 , y0 ) = 0. Pour préciser,
nous supposerons que cette fonction est continue dans un domaine D défini
par les inégalités

x0 − a ≤ x ≤ x0 + a, y0 − b ≤ y ≤ y0 + b,

a et b étant deux nombres positifs. Nous admettrons de plus que l’on peut
choisir les nombres a et b assez petits pour que l’on ait

|f (x, y $) − f (x, y $$)| < K|y $ − y $$ |,

x étant une valeur quelconque comprise entre x0 − a et x0 + a, y $ , y $$ étant


de même deux valeurs quelconques de y comprises entre y0 − b et y0 + b, et
K un nombre positif constant plus petit que l’unité. Ces conditions étant
supposées satisfaites, nous allons démontrer que l’équation

y − y0 = f (x, y),

où l’on regarde x comme une variable indépendante et y comme l’inconnue


admet une racine, et une seule, qui tend vers y0 lorsque x tend vers x0 .

Edouard Goursat, 1903


Chapitre 6

Fonctions monotones

6.1 Parties majorées ou minorées


Ce chapitre est consacré à l’étude de propriétés particulières de parties de R
et de fonctions réelles liées à l’existence d’une structure d’ordre sur R.
Définition. Soit E une partie de R et a ∈ R.
On dit que a majore E, ou que a est un majorant de E, ou encore que E est
majoré par a si, pour tout x ∈ E, on a x ≤ a.
On dit que a minore E, ou que a est un minorant de E, ou encore que E est
minoré par a si, pour tout x ∈ E, on a x ≥ a.
Ainsi, n’importe quel réel majore ∅ et n’importe quel réel minore ∅. Il
résulte immédiatement des définitions que si a majore E et si b ≥ a, alors b
majore E et que si a minore E et si b ≤ a, alors b minore E. On désignera par
M (E) l’ensemble des majorants de E et par m(E) l’ensemble des minorants
de E. Chacun de ces ensembles peut être vide : on vérifie aisément que
M ([0, +∞[) = ∅ et m(] − ∞, 0]) = ∅. Lorsque M (E) /= ∅, on dit que E est
majoré, et lorsque m(E) /= ∅, on dit que E est minoré. Ces notions sont
liées à celle d’ensemble borné par le résultat élémentaire suivant.
Proposition. E ⊂ R est borné si et seulement si E est majoré et minoré.
Démonstration. Condition nécessaire. Si r > 0 est tel que E ⊂ B[r] =
[−r, r], alors r majore E et −r minore E.
Condition suffisante. Si a minore E et b majore E, alors, pour tout x ∈ E,
on a |x| ≤ r = max{|a|, |b|}, et E est borné.
Il peut arriver qu’aucun majorant ou aucun minorant d’une partie E de
R n’appartienne à E. C’est le cas par exemple pour E = ]0, 1[. En effet,

199
200 CHAPITRE 6. FONCTIONS MONOTONES

si a ∈ ]0, 1[, c’est-à-dire si 0 < a < 1, alors a ne majore pas ]0, 1[ puisque
a + 1−a
2 > a et appartient à ]0, 1[. On montre de même qu’aucun minorant
de ]0, 1[ n’appartient à ]0, 1[. Il peut aussi arriver qu’un majorant ou un
minorant d’une partie E de R appartienne à E. C’est le cas par exemple
pour E = [0, 1] qui est majoré par 1 et minoré par 0. E ne contiendra pas
d’autre majorant ou d’autre minorant, ainsi que cela résulte de la proposition
suivante.
Proposition. Soit E une partie de R. Il existe au plus un majorant de E
appartenant à E et au plus un minorant de E appartenant à E.
Démonstration. Faisons-la, pour fixer les idées, dans le cas d’un majo-
rant. Si a et b majorent E et appartiennent à E, alors on a b ≤ a et a ≤ b,
et donc a = b.
Cette proposition justifie la définition suivante.
Définition. Soit E une partie de R et a ∈ R. On dit que a est le maximum
ou le plus grand élément de E, et on le note max E, si a ∈ E et a majore
E. On dit que a est le minimum ou le plus petit élément de E, et on le note
min E, si a ∈ E et a minore E.
Notons que, si max E existe, alors, puisque max E ∈ E, on a max E ≤ a
pour tout a ∈ M (E), et max E est donc le plus petit majorant de E. En
d’autres termes,
max E = min M (E).
On montre de même que si min E existe, alors

min E = max m(E).

L’important résultat suivant, qui porte le nom de théorème du supre-


mum montre que si E et M (E) sont non vides, M (E) possède toujours un
minimum. Ainsi, bien qu’une partie non vide et majorée E de R n’ait pas
nécessairement de plus grand élément, l’ensemble de ses majorants possédera
toujours un plus petit élément.
Théorème. Si E est une partie non vide et majorée de R, alors M (E)
possède un minimum.
Démonstration. Soit a ∈ E et b ∈ M (E) tel que b > a. Si M (E) possède
un minimum, ce minimum appartiendra nécessairement à [a, b]. Il faut donc
démontrer que

(∃x ∈ [a, b] ∩ M (E))(∀y ∈ M (E)) : x ≤ y.


6.1. PARTIES MAJORÉES OU MINORÉES 201

Nous procédons par l’absurde et supposons que cette proposition est fausse.
Alors,

(∀x ∈ [a, b] ∩ M (E))(∃yx ∈ M (E)) : x > yx . (6.1)

Définissons dès lors comme suit une jauge δ sur [a, b]. Si x ∈ [a, b] ∩ M (E),
prenons δ(x) = x−y 2 , où yx est donné par (6.1); si x ∈ [a, b] \ M (E), alors
x

il existera z ∈ E tel que zx > x et nous prendrons δ(x) = zx2−x . Soit


A j j xB
Π = (x , I ) 1≤j≤m une P-partition δ-fine de ]a, b], numérotée de telle sorte
que si I j = ]aj−1 , aj ], alors

a = a0 < a1 < . . . < am−1 < am = b.


zxj −xj
Par le choix de la jauge, si xj /∈ M (E), alors δ(xj ) = 2 pour un certain
zxj > xj appartenant à E et dès lors

zxj + xj
aj ≤ xj + δ(xj ) = < zxj ∈ E,
2

ce qui entraı̂ne que [aj−1 , aj ] ∩ M (E) = ∅. D’autre part, si xj ∈ M (E), alors


yxj −xj
δ(xj ) = 2 pour un certain yxj < xj appartenant à M (E) et dès lors

yxj + xj
aj−1 ≥ xj − δ(xj ) = > yxj ∈ M (E),
2

c’est-à-dire [aj−1 , aj ] ⊂ M (E) \ E. Comme b ∈ [am−1 , am ] ∩ M (E), on a


nécessairement, xm ∈ M (E) et donc [am−1 , am ] ⊂ M (E) \ E. Mais alors
xm−1 ∈ M (E) et le même raisonnement entraı̂ne que [am−2 , am−1 ] ⊂ M (E)\
E. En continuant de proche en proche, on en conclut finalement que [a0 , a1 ] ⊂
M (E) \ E, ce qui est contradictoire, puisque a0 = a ∈ E.

On est ainsi conduit à la définition suivante.

Définition. Soit E une partie non vide de R. Si E est non vide et majorée,
on appelle supremum de E, et l’on note sup E, le minimum de M (E), c’est-
à-dire le plus petit majorant de E. Si E est non vide et non majoré, on
pose, par extension, sup E = +∞. Si E est vide, on pose, par extension,
sup E = −∞.

Le résultat suivant fournit trois caractérisations du supremum.


202 CHAPITRE 6. FONCTIONS MONOTONES

Proposition. Soit E une partie non vide et majorée de R. Les quatre


propriétés suivantes sont équivalentes.
1. x = sup E.
2. (∀y ∈ E) : y ≤ x et (∀! > 0)(∃z ∈ E) : x − ! < z.
3. x ∈ adh E ∩ M (E).
4. x ∈ M (E) et il existe une suite (zk )k∈N dans E qui converge vers x.
Démonstration. a. 1 ⇔ 2. x = sup E équivaut à x ∈ M (E) et x =
min M (E), c’est-à-dire

(∀y ∈ E) : y ≤ x et (∀! > 0) : x − ! /∈ M (E),

ce qui équivaut à

(∀y ∈ E) : y ≤ x et (∀! > 0)(∃z ∈ E) : z > x − !.

2 ⇔ 3. Conséquence immédiate de la définition de l’adhérence.


3 ⇔ 4. Résulte de la caractérisation de l’adhérence par les suites.
Si E et F sont deux parties de R et si c ∈ R, on posera

E + F = {x + y : x ∈ E et y ∈ F },

et
cE = {cx : x ∈ E}.
Lorsque E = {a}, on écrira a + F au lieu de {a} + F et si c = −1, on
écrira −E au lieu de (−1)E. On a évidemment E + F = F + E et l’on se
gardera de confondre E + F avec E ∪ F . Ainsi [0, 1] + [0, 1] = [0, 2] alors que
[0, 1] ∪ [0, 1] = [0, 1].
Les propositions suivantes sont des conséquences faciles des propriétés
élémentaires des inégalités et des définitions.
Proposition. Si E ⊂ R et a ∈ R, alors a majore E si et seulement si −a
minore −E. En d’autres termes, M (E) = −m(−E).

Proposition. Si E ⊂ R possède un maximum (resp. un minimum), alors,


pour tout c ≥ 0, cE possède un maximum (resp. un minimum) et

max(cE) = c max E, (resp. min(cE) = c min E).

Démonstration. c max E (resp. c min E) appartient à cE et majore (resp.


minore) cE.
6.1. PARTIES MAJORÉES OU MINORÉES 203

Proposition. Si E ⊂ R possède un maximum (resp. un minimum), alors


−E possède un minimum (resp. un maximum) et

min(−E) = − max E, (resp. max(−E) = − min E.

Démonstration. − max E (resp. − min E) appartient à −E et minore


(resp. majore) −E.
Ces résultats permettent de déduire aisément du théorème du supremum
le théorème de l’infimum.
Théorème. Si E est une partie non vide et minorée de R, alors m(E)
possède un maximum et max m(E) = − sup(−E).
Démonstration. E étant non vide et minoré, −E est non vide et majoré,
et dès lors min M (−E) existe. Comme M (−E) = −m(E), on en déduit que
m(E) possède un maximum et que

max m(E) = − min[−m(E)] = − min[M (−E)] = − sup(−E).

Ce résultat et l’unicité du maximum conduisent à la définition suivante.


Définition. Soit E une partie non vide de R. Si E est non vide et minorée,
on appelle infimum de E, et l’on note inf E, le maximum de m(E), c’est-
à-dire le plus grand minorant de E. Si E est non vide et non minoré, on
pose, par extension, inf E = −∞. Si E est vide, on pose, par extension,
inf E = +∞.
Le théorème de l’infimum affirme donc que si E est une partie non vide
et minorée de R, alors
inf E = − sup(−E).
On en déduit aussitôt que si E est une partie non vide et majorée de R,
alors
sup E = − inf(−E).
En combinant le théorème de l’infimum avec les caractérisations du supre-
mum, on obtient trois caractérisations de l’infimum.
Proposition. Soit E une partie non vide et minorée de R. Les quatre
propriétés suivantes sont équivalentes.
1. x = inf E.
2. (∀y ∈ E) : y ≥ x et (∀! > 0)(∃z ∈ E) : z < x + !.
204 CHAPITRE 6. FONCTIONS MONOTONES

3. x ∈ adh E ∩ m(E).
4. x ∈ m(E) et il existe une suite (zk )k∈N dans E qui converge vers x.
Une conséquence immédiate mais très utile des définitions de supremum
et d’infimum est la règle de passage au supremum ou à l’infimum
dans une inégalité.
Proposition. Soit E une partie non vide de R et c ∈ R. Si, pour tout
x ∈ E, on a x ≤ c, alors sup E existe et sup E ≤ c. Si, pour tout x ∈ E, on
a x ≥ c, alors inf E existe et inf E ≥ c.
Démonstration. Faisons-la, pour fixer les idées, dans le cas du supremum.
Par hypothèse, c majore E et dès lors sup E existe. Comme il est le plus
petit des majorants de E, on a nécessairement sup E ≤ c.
Etudions maintenant le comportement du supremum et de l’infimum par
rapport aux opérations d’inclusion, d’homothétie et d’addition introduites
sur les ensembles.
Proposition. Soient E et F deux parties non vides et majorées de R et
soit c ≥ 0. On a les propriétés suivantes.
1. Si E ⊂ F , alors sup E ≤ sup F .
2. sup(cE) = c sup E.
3. sup(E + F ) = sup E + sup F.
Démonstration. 1. Si x ∈ E, alors x ∈ F et donc x ≤ sup F ; on déduit
de la proposition précédente que sup E existe et que sup E ≤ sup F.
2. Si c = 0, cE = {0} et le résultat est évident; si c > 0, alors M (cE) =
cM (E) et
sup(cE) = min M (cE) = min[cM (E)] = c min M (E) = c sup E.
3. Soit x ∈ E + F ; alors x = y + z avec y ∈ E et z ∈ F et dès lors
x ≤ sup E + sup F ; en conséquence,
sup(E + F ) ≤ sup E + sup F.
Soient maintenant x ∈ E et y ∈ F ; alors x + y ∈ E + F , et dès lors
y + z ≤ sup(E + F ). En particulier, z étant fixé dans F , on a, pour chaque
y ∈ E, y ≤ sup(E + F ) − z, et dès lors sup E ≤ sup(E + F ) − z. Par
conséquent, pour chaque z ∈ F , on a z ≤ sup(E + F ) − sup E, ce qui
entraı̂ne que sup F ≤ sup(E + F ) − sup E, c’est-à-dire
sup E + sup F ≤ sup(E + F ).
6.2. INTERVALLES 205

Proposition. Soient E et F deux parties non vides et minorées de R et


soit c ≥ 0. On a les propriétés suivantes.
1. Si E ⊂ F , alors inf E ≥ inf F .
2. inf(cE) = c inf E.
3. inf(E + F ) = inf E + inf F.
Démonstration. Elle est analogue à celle de la proposition précédente.
On peut aussi utiliser les relations entre infimum et supremum.

6.2 Intervalles
Les résultats des sections précédentes nous permettent de déterminer la
structure des intervalles de la droite réelle.
Définition. On dit qu’une partie non vide I de R est un intervalle si I n’est
pas un singleton et si

(∀x ∈ I)(∀y ∈ I : y > x)(∀z ∈ R : x ≤ z ≤ y) : z ∈ I.

En d’autres termes, un intervalle est une partie de R différente du vide


et d’un singleton qui, dès qu’elle contient deux réels distincts, contient tous
les réels compris entre ces deux nombres.
Proposition. Si I ⊂ R est un intervalle et est minoré et majoré, alors

] inf I, sup I[ ⊂ I ⊂ [inf I, sup I].

Démonstration. Pour chaque x ∈ I, on a évidemment x ≥ inf I et


x ≤ sup I, et l’inclusion de droite s’en déduit aussitôt. Soit maintenant x ∈
] inf I, sup I[. Comme x > inf I, il existe, par la caractérisation de l’infimum,
y ∈ I tel que inf I < y < x, et, comme x < sup I, il existe, par la ca-
ractérisation du supremum, z ∈ I tel que x < z < sup I. Comme I est un
invervalle, on en déduit que x ∈ I.

Corollaire. Si I ⊂ R est un intervalle et est minoré et majoré, alors int I =


] inf I, sup I[ et adh I = [inf I, sup I].
Démonstration. Passer à l’intérieur et à l’adhérence dans les inclusions
précédentes.
Les intervalles minorés et majorés sont donc les intervalles ouverts, semi-
ouverts ou fermés I = ]a, b[, I = ]a, b], I = [a, b[, I = [a, b] de R, et a =
inf I, b = sup I.
206 CHAPITRE 6. FONCTIONS MONOTONES

Proposition. Si I ⊂ R est un intervalle majoré et non minoré, alors


] − ∞, sup I[ ⊂ I ⊂ ] − ∞, sup I].
Démonstration. Pour tout x ∈ I, on a x ≤ sup I, et l’inclusion de droite
s’en déduit. Si x ∈ ] − ∞, sup I[, alors x < sup I et, par la caractérisation
du supremum, il existe z ∈ I tel que x < z < sup I. D’autre part, comme I
n’est pas minoré, x ne minore pas I et il existe donc y ∈ I tel que y < x.
Comme I est un intervalle, x ∈ I et l’inclusion de gauche est démontrée.
Une démonstration tout à fait analogue fournit le résultat suivant.
Proposition. Si I ⊂ R est un intervalle minoré et non majoré, alors
] inf I, +∞[ ⊂ I ⊂ [inf I, +∞[.
On en déduit évidemment l’analogue du Corollaire ci-dessus.
Corollaire. Si I ⊂ R est un intervalle majoré et non minoré, alors
int I = ] − ∞, sup I[, adh I = ] − ∞, sup I].
Si I ⊂ R est un intervalle minoré et non majoré, alors
int I = ] inf I, +∞[, adh I = [inf I, +∞[.
Les intervalles de I minorés et non majorés sont donc les intervalles non
majorés ouverts ou fermés ]a, +∞[, [a, +∞[, avec a = inf I, et les intervalles
de I majorés et non minorés sont donc les intervalles non minorés ouverts
ou fermés ] − ∞, a[, ] − ∞, a] avec a = sup I.
Enfin, il n’existe qu’un intervalle de R non minoré et non majoré.
Proposition. Si I est un intervalle non minoré et non majoré de R, alors
I = R.
Démonstration. Soit x ∈ R; comme I n’est pas minoré, il existe y ∈ I
tel que y < x, et comme I n’est pas majoré, il existe z ∈ I tel que x < z. I
étant un intervalle, on en déduit que x ∈ I.
Cette proposition conduit à la notation alternative ] − ∞, +∞[ pour R.
La définition de majorant d’une partie E de R entraı̂ne immédiatement
que, si E est non vide et majoré, alors M (E) est un intervalle non majoré
de R. Le théorème du supremum précise ce résultat en affirmant que M (E)
est l’intervalle fermé [sup E, +∞[. De même, la définition de minorant d’une
partie E de R entraı̂ne que, si E est non vide et minorée, alors m(E) est un
intervalle non minoré de R. Le théorème de l’infimum précise ce résultat en
affirmant que m(E) est l’intervalle fermé ] − ∞, inf E].
6.3. APPLICATIONS RÉELLES 207

6.3 Applications réelles


Soit A un ensemble quelconque (n’appartenant pas nécessairement à Rn ) et
f une application de A dans R. On dit alors que f est une application réelle.
Rappelons qu’on désigne par f (A) la partie de R définie par

f (A) = {f (x) : x ∈ A}.

L’application à f (A) des notions que nous venons d’introduire pour les par-
ties de R conduit à la terminologie suivante.
Définition. On dit que f est majorée (resp. minorée) sur A si f (A) est ma-
jorée (resp. minorée). Si f est majorée (resp. minorée) sur A, le supremum
(resp. l’infimum) de f sur A est le nombre réel noté

sup f ou sup f (x) (resp. inf f ou inf f (x)),


A x∈A A x∈A

et défini par
sup f = sup f (A) = sup{f (x) : x ∈ A}
A
(resp. inf f = inf f (A) = inf{f (x) : x ∈ A}).
A
Si f n’est pas majorée sur A, on écrira supA f = +∞ et si f n’est pas
minorée sur A, on écrire inf A f = −∞.
Lorsque supA f ∈ f (A), c’est-à-dire lorsqu’il existe x ∈ A tel que f (x) =
supA f , ou encore lorsque sup f (A) = max f (A), on dit qu’il est le maximum
de f sur A, et l’on écrit

max f ou max f (x).


A x∈A

Le point x ∈ A tel que f (x) = maxA f est alors appelé un maximant de f


sur A. De même, lorsque inf A f ∈ f (A), c’est-à-dire lorsqu’il existe x ∈ A
tel que f (x) = inf A f , ou encore lorsque inf f (A) = min f (A), on dit qu’il
est le minimum de f sur A, et l’on écrit

min f ou min f (x).


A x∈A

Le point x ∈ A tel que f (x) = minA f est alors appelé un minimant de


f sur A. Cette terminologie et ces notations sont compatibles avec celles
introduites précédemment pour une fonction de Rn dans R.
Si f et g sont deux applications de A dans R, si c ∈ R, et si l’on définit
l’application f +g de A dans R par (f +g)(x) = f (x)+g(x) pour chaque x ∈ A
208 CHAPITRE 6. FONCTIONS MONOTONES

et l’application cf de A dans R par (cf )(x) = c[f (x)] pour chaque x ∈ A,


avec la notation −f au lieu de (−1)f lorsque c = −1, on déduit aisément
des définition ci-dessus et des propriétés de l’infimum et du supremum d’une
partie de R les résultats suivants.
Proposition. Soit f une application majorée (resp. minorée) de A dans R.
On a les propriétés suivantes.
1. −f est minorée (resp. majorée) sur A et supA f = − inf A (−f ). (resp.
supA (−f ) = − inf A f ).
2. Si B ⊂ A, alors supB f ≤ supA f (resp. inf B f ≥ inf A f ).
3. Si g est une application de A dans R telle que, pour tout x ∈ A, on a
g(x) ≤ f (x) (resp. g(x) ≥ f (x)), alors g est majorée (resp. minorée) sur A
et
sup g ≤ sup f (resp. inf g ≥ inf f ).
A A A A

4. Si g est une application majorée (resp. minorée) sur A, alors f + g est


majorée (resp. minorée) et
sup(f + g) ≤ sup f + sup g (resp. inf f + inf g ≤ inf (f + g)).
A A A A

Si, en outre, g est minorée (resp. majorée) sur A, alors


sup f + inf f ≤ sup(f + g) (resp. inf (f + g) ≤ inf f + sup g).
A A A A A A
Remarque. On notera que les inégalités dans la partie 4 de la proposition
précédente sont les meilleures possibles et qu’on n’a pas en général les égalités
correspondantes (c’est essentiellement dû au fait que
(f + g)(A) = {f (x) + g(x) : x ∈ A}
est en général strictement inclus dans
f (A) + g(A) = {f (x) + g(y) : x ∈ A et y ∈ A}).
Par exemple, si A = [0, 1], f = I, g = −I, alors f + g = 0 et dès lors
inf (f + g) = 0 = sup(f + g),
[0,1] [0,1]

et
sup f = 1, inf f = 0, inf g = −1, sup g = 0.
[0,1] [0,1] [0,1] [0,1]
On déduit facilement des caractérisations du supremum et de l’infimum
d’une partie de R des caractérisations du supremum et de l’infimum
d’une application réelle.
6.4. FONCTIONS MONOTONES 209

Proposition. Soit A un ensemble non vide et f une application de A dans


R. Alors a = supA f si et seulement si l’une des deux conditions suivantes
est réalisée.
1. (∀x ∈ A : f (x) ≤ a) et (∀! > 0)(∃y ∈ A) : f (y) > a − !.
2. (∀x ∈ A : f (x) ≤ a) et il existe une suite (yk )k∈N dans A telle que
(f (yk ))k∈N converge vers a.
Une suite (yk )k∈N telle que (f (yk ))k∈N converge vers supA f est appelée
une suite maximisante pour f sur A.
Proposition. Soit A un ensemble non vide et f une application de A dans
R. Alors a = inf A f si et seulement si l’une des deux conditions suivantes
est réalisée.
1. (∀x ∈ A : f (x) ≥ a) et (∀! > 0)(∃y ∈ A) : f (y) < a + !.
2. (∀x ∈ A : f (x) ≥ a) et il existe une suite (yk )k∈N dans A telle que
(f (yk ))k∈N converge vers a.
Une suite (yk )k∈N telle que (f (yk ))k∈N converge vers inf A f est appelée
une suite minimisante pour f sur A.

6.4 Fonctions monotones


Nous allons étudier dans cette section les fonctions de R dans R qui préser-
vent (ou qui renversent) l’ordre sur R.
Définition. Soit f une fonction de R dans R et E ⊂ dom f . On dit que f
est croissante sur E si

(∀x ∈ E)(∀y ∈ E) : (x − y)[f (x) − f (y)] ≥ 0.

On dit que f est décroissante sur E si

(∀x ∈ E)(∀y ∈ E) : (x − y)[f (x) − f (y)] ≤ 0.

On dit que f est monotone sur E si f est croissante sur E ou est décroissante
sur E. On dit que f est strictement croissante sur E si

(∀x ∈ E)(∀y ∈ E : y /= x) : (x − y)[f (x) − f (y)] > 0.

On dit que f est strictement décroissante sur E si

(∀x ∈ E)(∀y ∈ E : y /= x) : (x − y)[f (x) − f (y)] < 0.


210 CHAPITRE 6. FONCTIONS MONOTONES

On dit que f est strictement monotone sur E si f est strictement croissante


sur E ou est strictement décroissante sur E.
Remarques. 1. On vérifiera aisément que les définitions ci-dessus sont
équivalentes aux suivantes :
f est croissante (resp. décroissante) sur E si et seulement si

(∀x ∈ E)(∀y ∈ E : y ≥ x) : f (y) ≥ f (x) (resp. f (y) ≤ f (x)).

f est strictement croissante (resp. strictement décroissante) sur E si et


seulement si

(∀x ∈ E)(∀y ∈ E : y > x) : f (y) > f (x) (resp. f (y) < f (x)).

Une fonction croissante (resp. strictement croissante) sur E préserve donc


l’ordre (resp. l’ordre strict) sur E.
2. Il résulte aussitôt des définitions que f est croissante (resp. strictement
croissante) sur E si et seulement si −f est décroissante (resp. strictement
décroissante) sur E. En outre, si f est croissante (resp. décroissante, stricte-
ment croissante, strictement décroissante) sur E et si F ⊂ E, alors f est
croissante (resp. décroissante, strictement croissante, strictement décrois-
sante) sur F .
Exemples. 1. Toute application constante de R dans R est à la fois crois-
sante et décroissante sur R.
2. L’identité sur R est strictement croissante sur R.
3. L’application partie entière définie sur R par

E(x) = [x] = le plus grand entier inférieur ou égal à x

est croissante sur R.


Ce dernier exemple, qui est discontinu en chaque entier, montre qu’une
fonction croissante n’est pas nécessairement continue. Toutefois, elle possède
en chaque point une limite à gauche et une limite à droite dans E.
Proposition. Soit E ⊂ R, f une fonction de R dans R telle que E ⊂ dom f ,
a ∈ E ∩ adh Ea− ∩ adh Ea+ , où

Ea− = {x ∈ E : x < a}, Ea+ = {x ∈ E : x > a}.

Si f est croissante sur E, alors

lim f (x) = sup f ≤ f (a) ≤ lim f (x) = inf f.


x→a, x∈Ea− Ea− x→a, x∈Ea+ Ea+
6.4. FONCTIONS MONOTONES 211

Si f est décroissante sur E, alors

lim f (x) = inf f ≥ f (a) ≥ lim f (x) = sup f.


x→a, x∈Ea− Ea− x→a, x∈Ea+ Ea+

Démonstration. Il suffit de démontrer le résultat pour une fonction crois-


sante et de l’appliquer à −f si f est décroissante. Nous ne considérerons que
le cas de la limite limx→a, x∈Ea− f (x), l’autre étant similaire. Puisque f est
croissante sur E, on a, pour tout x ∈ Ea− , f (x) ≤ f (a); donc f est majorée
sur Ea− , supEa− f existe et supEa− f ≤ f (a). Posons b = supEa− f et soit ! > 0;
en vertu de la caractérisation du supremum, on a

(∀x ∈ Ea− : f (x) ≤ b) et (∃y ∈ Ea− ) : b − ! < f (y).

En posant δ = a − y > 0 et en utilisant, dans ces inégalités, la croissance de


f , on trouve que

(∀x ∈ Ea− : x ≥ a − δ) : b − ! < f (a − δ) ≤ f (x) ≤ b,

et dès lors
(∀x ∈ Ea− : |x − a| ≤ δ) : |f (x) − b| ≤ !.

On a des résultats analogues si x tend vers le supremum ou l’infimum de


E. Lorsque, le cas échéant, f n’est pas majorée ou n’est pas minorée sur E,
les limites correspondantes sont évidemment des limites infinies.
Proposition. Soit E une partie non vide de R et f une fonction de R dans
R définie sur E.
1. Si E est majoré, a = sup E /∈ E et f croissante sur E, alors

lim f (x) = sup f.


x→a, x∈E E

2. Si E est majoré, a = sup E /∈ E et f décroissante sur E, alors

lim f (x) = inf f.


x→a, x∈E E

3. Si E est minoré, a = inf E /∈ E et f croissante sur E, alors

lim f (x) = inf f.


x→a, x∈E E
212 CHAPITRE 6. FONCTIONS MONOTONES

4. Si E est minoré, a = inf E /∈ E et f est décroissante sur E, alors


lim f (x) = sup f.
x→a, x∈E E
Démonstration. Nous la ferons pour le premier cas, le troisième étant
semblable et les deux autres s’en déduisant en appliquant les résultats à
−f. Nous supposerons également que f est majorée sur E, l’autre cas étant
semblable. Notons tout d’abord que a = sup E entraı̂ne que a ∈ adh E.
Comme f est majorée sur E, supE f existe et l’on posera b = supE f . Si
! > 0 est donné, alors la caractérisation du supremum entraı̂ne que
(∀x ∈ E : f (x) ≤ b) et (∃y ∈ E) : b − ! < f (y).
Comme a /∈ E, on a y < a et, en posant δ = a − y > 0, on déduit des
inégalités précédentes et de la croissance de f que
(∀x ∈ E : x ≥ a − δ) : b − ! < f (a − δ) ≤ f (x) ≤ b,
et dès lors
(∀x ∈ E : |x − a| ≤ δ) : |f (x) − b| ≤ !.

On a des résultats analogues pour les limites vers +∞ ou −∞ lorsque


E est non majoré ou non minoré. Les démonstrations sont laissées comme
exercice au lecteur.
Proposition. Soit E une partie non vide de R et f une fonction de R dans
R définie sur E.
1. Si E est non majoré et f croissante sur E, alors
lim f (x) = sup f.
x→+∞, x∈E E
2. Si E est non majoré et f décroissante sur E, alors
lim f (x) = inf f.
x→+∞, x∈E E

3. Si E est non minoré et f croissante sur E, alors


lim f (x) = inf f.
x→−∞, x∈E E

4. Si E est non minoré et f est décroissante sur E, alors


lim f (x) = sup f.
x→−∞, x∈E E
On peut évidemment considérer le cas particulier où f est une suite
réelle (ak )k∈N. Notons tout d’abord la caractérisation simple suivante des
suites croissantes ou décroissantes.
6.4. FONCTIONS MONOTONES 213

Proposition. Soit (ak )k∈N une suite réelle. Alors (ak )k∈N est croissante
(resp. décroissante) si et seulement si, pour tout k ∈ N, on a

ak+1 ≥ ak (resp. ak+1 ≤ ak ).

En outre, (ak )k∈N est strictement croissante (resp. strictement décroissante)


si et seulement si, pour tout k ∈ N, on a

ak+1 > ak (resp. ak+1 < ak ).

Démonstration. Nous la ferons dans le cas où (ak )k∈N est croissante,
l’autre s’y ramenant par changement de signe.
Condition nécessaire. Soit k ∈ N; en prenant x = k + 1 et y = k dans la
définition, on trouve ak+1 − ak ≥ 0 dans le cas croissant et ak+1 − ak > 0
dans le cas strictement croissant.
Condition suffisante. Soient r ≥ q des entiers naturels; alors

ar − aq = ar − ar−1 + ar−1 − ar−2 + . . . + aq+1 − aq ≥ 0,

l’inégalité étant stricte si ak+1 > ak pour chaque k ∈ N. Donc (ak )k∈N est
croissante ou strictement croissante selon le cas.

Exemples. 1. La suite ( k+1 1


)k∈N est strictement décroissante.
2. Si a > 0, la suite (a )k∈N est strictement croissante si a > 1, strictement
k

décroissante si a ∈ ]0, 1[ et à la fois croissante et décroissante si a = 0 et


a = 1.
L’application des propositions précédentes au cas d’une suite fournit le
résultat suivant, où les limites peuvent être des limites infinies.

Corollaire. Soit (ak )k∈N une suite réelle. Si (ak )k∈N est croissante, alors

lim ak = sup ak .
k→∞ k∈N

Si (ak )k∈N est décroissante, alors

lim ak = inf ak .
k→∞ k∈N

On en déduit une caractérisation de la convergence des suites


monotones.
214 CHAPITRE 6. FONCTIONS MONOTONES

Corollaire. Une suite réelle croissante converge si et seulement si elle est


majorée, auquel cas
lim ak = sup ak .
k→∞ k∈N
Une suite réelle décroissante converge si et seulement si elle est minorée,
auquel cas
lim ak = inf ak .
k→∞ k∈N
Démonstration. La condition suffisante résulte du Corollaire précédent.
Pour la condition nécessaire, en considérant le cas d’une suite croissante
convergente et en appelant a sa limite, on a, en prenant par exemple ! = 1
dans la définition de convergence :

(∃m ∈ N)(∀k ≥ m) : ak ≤ a + 1.

Dès lors, pour tout k ∈ N, on aura

ak ≤ max{a1 , a2 , . . . , am−1 , a + 1},

et (ak )k∈N est majorée.

6.5 Fonction exponentielle


Nous allons introduire dans cette section l’une des plus importantes des
fonctions élémentaires, la fonction exponentielle. Nous aurons besoin plusi-
eurs fois des inégalités élémentaires suivantes.
Lemme. Si α ≥ β ≥ 0, on a, pour tout entier k ≥ 1,

(α − β)(k + 1)β k ≤ αk+1 − β k+1 ≤ (α − β)(k + 1)αk ,

avec des inégalités strictes si α > β > 0.


Démonstration. En effet, on a l’identité
k
$
αk+1 − β k+1 = (α − β) αk−j β j ,
j=0

et les inégalités s’en déduisent aussitôt puisque, pour chaque 0 ≤ j ≤ k, on


a
β k ≤ αk−j β j ≤ αk ,
avec des inégalités strictes si α > 0, β > 0 et j > 0.
6.5. FONCTION EXPONENTIELLE 215

Pour chaque x ∈ R et chaque k ∈ N∗ , posons


4 5k
x
fk (x) = 1 + .
k
En particulier, fk (0) = 1 pour tout k ∈ N∗ et dès lors

lim fk (0) = 1.
k→∞

Proposition. Pour chaque x > 0 fixé, la suite réelle (fk (x))k∈N∗ est stricte-
ment croissante et majorée.
Démonstration. En appliquant l’inégalité de droite du lemme à α = 1+ xk
et β = 1 + k+1
x
, on trouve
4 5k+1 4 5k+1
x x
fk+1 (x) = 1 + > 1+
k+1 k
4 5k 4 5 4 5k
x x x x
−(k + 1) 1 + 1+ −1− = 1+ = fk (x),
k k k+1 k
et (fk (x))k∈N∗ est strictement croissante. D’autre part, en appliquant la
même inégalité à α = 1 + mk
x
, β = 1, où m ≥ 1 est un entier, on obtient
4 5k+1 4 5k 4 5k 4 5
x x x x x
1> 1+ − (k + 1) 1+ = 1+ 1− .
mk mk mk mk m
Dès lors, si m ≥ 2x, est fixé, (par exemple m = [2x] + 1, avec [2x] la partie
entière de 2x), on trouve
4 5k
1 x
1> 1+ ,
2 mk
c’est-à-dire 4 5k
x
1+ < 2.
mk
Par conséquent, pour tout k ∈ N∗ , on a
4 5mk
x
fmk (x) = 1 + < 2m .
mk
Pour chaque j ∈ N∗ , il existe k ∈ N∗ tel que

(k − 1)m ≤ j ≤ km,
216 CHAPITRE 6. FONCTIONS MONOTONES

et, en utilisant la croissance de (fk (x))k∈N∗ , on en déduit que, pour tout


j ∈ N∗ , on a
fj (x) ≤ fkm (x) < 2m .
Donc (fk (x))k∈N∗ est majorée et, en particulier, pour tout k ≥ 1 et tout
x > 0, on a fk (x) ≤ 2[2x]+1 .
Le critère de convergence d’une suite monotone donné dans la section
précédente entraı̂ne que, pour chaque x > 0, la suite (fk (x))k∈N∗ converge
et l’on posera (lire exponentielle de x)
4 5k
x
exp x = lim fk (x) = lim 1+ .
k→∞ k→∞ k

On a évidemment exp x > 1 pour tout x > 0. On posera e = exp 1.


Proposition. Si x < 0, alors (fk (x))k∈N∗ converge vers 1
exp(−x) .

Démonstration. Si x < 0, alors x = −|x| et, pour tout k ∈ N∗ , on a


8 9
4 5k 4 5k |x|2 k
x |x| 1− k2
1+ = 1− = 8 9 .
k k |x| k
1+ k

|x|2
En prenant α = 1, β = 1 − (k+1)2 , dans l’inégalité de droite du lemme et
k + 1 ≥ |x|, on obtient
& 'k+1
|x|2 |x|2 |x|2
1> 1− > 1 − (k + 1) =1− ,
(k + 1)2 (k + 1) 2 k+1

ce qui entraı̂ne aussitôt que


& 'k
|x|2
lim 1− 2 = 1,
k→∞ k

et dès lors, par l’égalité ci-dessus et la proposition précédente, que


4 5k
x 1 1
lim 1+ = = .
k→∞ k exp |x| exp(−x)
6.5. FONCTION EXPONENTIELLE 217

Cette proposition nous conduit à poser, pour chaque x < 0,


1
exp x = .
exp(−x)
Définition. La fonction exponentielle est l’application de R dans R définie
par
4 5
x k
exp : R → R, x 2→ lim 1 + .
k→∞ k
Corollaire. Pour tout x > 0 et tout k ∈ N∗ , on a
4 5k
x
exp x ≥ 1 + ,
k
pour tout x < 0 et tout k ∈ N∗ , on a
4 5−k
x
exp x ≤ 1 −
k
et, pour tout x ∈ R, on a

(exp x).[exp(−x)] = exp 0 = 1.

Démonstration. La première partie est une conséquence immédiate de la


définition. Si x < 0, la proposition précédente montre que
1
(exp x).[exp(−x)] = .[exp(−x)] = 1 = exp 0.
exp(−x)
Si x > 0, alors

(exp x).[exp(−x)] = [exp(−x)].[exp[−(−x)]] = exp 0,

et le cas de x = 0 est trivial.


Remarque. Le Corollaire montre en particulier que e = exp 1 > 2. Cette
quantité joue un rôle fondamental en mathématiques. Une approximation
numérique est donnée par

e = 2, 71828182845904523536028747135266249775724709366995 . . ..

En 1737, Leonard Euler a donné les grandes lignes de la démonstration de


l’irrationnalité de e et e2 , un résultat précisé et généralisé à ec pour tout ra-
tionnel positif c par Johann Lambert en 1761. Charles Hermite a montré
218 CHAPITRE 6. FONCTIONS MONOTONES

en 1873 que e est transcendant et ce résultat a conduit Ferdinand Linde-


mann à prouver en 1882 que π est également transcendant. Aujourd’hui
encore, on ignore si e + π et e.π sont ou non transcendants.
Enonçons et démontrons maintenant la propriété essentielle de la fonction
exponentielle, à savoir qu’elle fournit un homomorphisme du groupe additif
(R, +) sur le groupe multiplicatif (]0, +∞[, ·).
Proposition. Pour tout x ∈ R et tout y ∈ R, on a

exp(x + y) = (exp x).(exp y).

Démonstration. Si x = 0 ou y = 0, le résultat est évident. Considérons


tout d’abord le cas où x + y > 0 et xy > 0. En prenant
4 54 5
x+y xy x y x+y
α = 1+ + = 1+ 1+ , β =1+ ,
k + 1 (k + 1) 2 k+1 k+1 k+1

dans le lemme ci-dessus, on trouve


4 5k 4 5k+1 4 5k+1 4 5k+1
xy x+y x y x+y
1+ ≤ 1+ 1+ − 1+
k+1 k+1 k+1 k+1 k+1
4 5k 4 5k
xy x y
≤ 1+ 1+ .
k+1 k+1 k+1
On en déduit aussitôt, en faisant tendre k vers l’infini, que

0 = [exp x].[exp y] − exp(x + y).

Si x + y > 0 et xy < 0, on posera


4 54 5
x+y xy x y x+y
β =1+ + = 1+ 1+ , α=1+ ,
k + 1 (k + 1) 2 k+1 k+1 k+1

et l’on raisonnera
# # comme dans le cas précédent avec k suffisamment grand
# xy #
pour que # (k+1)2 # ≤ 1 + x+y
k+1 . Enfin, si x + y < 0, alors, par la Proposition
précédente et la première partie de la démonstration, on a

1 1
exp(x + y) = = = [exp x].[exp y].
exp(−x − y) [exp(−x)].[exp(−y)]
6.5. FONCTION EXPONENTIELLE 219

Corollaire. La fonction exponentielle est strictement croissante sur R. En


outre, on a
lim exp x = 0, lim exp x = +∞.
x→−∞ x→+∞

Démonstration. Si y > x ≥ 0, on a y − x > 0, donc exp(y − x) > 1 et


dès lors,

exp y = exp[x + (y − x)] = [exp x].[exp(y − x)] > exp x.

Si y > 0 > x, alors, par ce qui précède,

exp y > exp 0 = 1,

et
1
exp x = < 1 < exp y.
exp(−x)
Si x < y ≤ 0, on a 0 ≤ −y < −x et dès lors
1 1
exp x = < = exp y.
exp(−x) exp(−y)
D’autre part, exp n’est pas majorée sur R puisque, pour tout k ∈ N∗ , on a

exp k = exp(k.1) = (exp 1)k = ek > 2k .

Comme exp est croissante, on en déduit que exp x → +∞ si x → +∞ et que


dès lors exp x = exp(−x)
1
→ 0 si x → −∞.
Etudions maintenant les propriétés de dérivabilité de la fonction expo-
nentielle.
Proposition. La fonction exponentielle est dérivable en 0 et (exp)$ (0) = 1.
Démonstration. Soit h > 0; en utilisant le lemme avec α = 1 + h
k+1 et
β = 1, on trouve
4 5k+1 4 5k 4 5k+1
h h h h
k ≤ 1+ −1 ≤ h 1+ ≤ h 1+ ,
k+1 k+1 k+1 k+1
et dès lors 4 5
k+1
h
h≤ 1+ − 1 ≤ h exp h.
k+1
En faisant tendre k vers l’infini, on en déduit aussitôt que

h ≤ exp h − 1 ≤ h exp h.
220 CHAPITRE 6. FONCTIONS MONOTONES

En particulier, si 0 < h ≤ 1, on a

h ≤ exp h − 1 ≤ eh,

ce qui entraı̂ne que exp h → 1 si h → 0 par valeurs positives, et dès lors

exp h − 1
lim = 1.
h→0, h>0 h

Si h < 0, on a
2 3
exp h − 1 exp h[1 − exp(−h)] 1 1 − exp(−h)
= = ,
h h exp(−h) −h

et dès lors
exp h − 1
lim = 1.
h→0, h<0 h
Comme les limites du quotient différentiel pour h tendant vers zéro par
valeurs positives et par valeurs négatives existent et sont égales à un, la
fonction exponentielle est dérivable en 0 et sa dérivée y vaut un.

Corollaire. La fonction exponentielle est dérivable (et donc continue) en


chaque point x de R et
(exp)$ (x) = exp x.

Démonstration. Si x ∈ R et h /= 0, on a

exp(x + h) − exp x exp h − 1


= exp x ,
h h
et dès lors
2 3
exp(x + h) − exp x exp h − 1
lim = lim exp x = exp x.
h→0 h h→0 h

6.6 Fonctions monotones continues


On a une caractérisation des fonctions continues strictement mono-
tones sur un intervalle.
6.6. FONCTIONS MONOTONES CONTINUES 221

Proposition. Soit I ⊂ R un intervalle et f une fonction de R dans R


continue sur I. Alors f est strictement monotone sur I si et seulement si f
est injective sur I.
Démonstration. Condition nécessaire. Elle résulte immédiatement du
fait que toute fonction (continue ou non) strictement monotone sur I est
injective sur I.
Condition suffisante. Si f , continue et injective sur I, n’est pas strictement
monotone sur I, il existera x < y < z dans I tels que f (x) < f (y) et
f (y) > f (z) ou f (x) > f (y) et f (y) < f (z). Considérons, pour fixer les idées,
le premier cas, l’autre se traitant de même. Si d ∈ ] max{f (x), f (z)}, f (y)[,
alors, par le théorème des valeurs intermédiaires, il existera u ∈ ]x, y[ et
v ∈ ]y, z[ tels que f (u) = d = f (v), ce qui contredit l’injectivité.
Le résultat suivant montre qu’une fonction strictement croissante sur un
intervalle a pour image un intervalle de même nature.
Proposition. Soit I = ]a, b[ (resp. ]a, b], [a, b[, [a, b]), avec éventuellement
a = −∞ (resp. b = +∞) si I est ouvert à gauche (resp. à droite). Si f est
strictement croissante sur I, et si l’on pose

f (a+) = lim f (x), f (b−) = lim f (x),


x→a, x∈I x→b, x∈I

on a

f (I) = ]f (a+), f (b−)[ (resp. ]f (a+), f (b)], [f (a), f (b−)[, [f (a), f (b)]).

Si f est strictement décroissante sur I, on a

f (I) = ]f (b−), f (a+)[ (resp. [f (b), f (a+)[, ]f (b−), f (a)], [f (b), f (a)]).

Démonstration. Considérons, pour fixer les idées, le cas de I = ]a, b],


et f strictement croissante, les autres se traitant de même. Puisque f est
continue sur I, il résulte du théorème des valeurs intermédiaires que f (I) est
un intervalle. D’ailleurs, pour tout x ∈ ]a, b], on a f (x) ≤ f (b) et f (b) est le
maximum de f (I). D’autre part, on a vu que

f (a+) = lim f (x) = inf f = inf f (I).


x→a, x∈I I

S’il existe u ∈ ]a, b] tel que f (u) = inf f (I), alors, pour tout v ∈ ]a, u[, on
aura f (v) < f (u) = inf f (I), ce qui est contradictoire. Donc f (u) > inf f (I)
pour tout u ∈ I, et f (I) = ]f (a+), f (b)].
222 CHAPITRE 6. FONCTIONS MONOTONES

La fonction réciproque d’une fonction continue et strictement monotone


sur un intervalle est continue et strictement monotone.

Proposition. Soit I ⊂ R un intervalle et f une fonction continue et stricte-


ment monotone sur I. Alors f −1 est strictement monotone et continue sur
f (I).

Démonstration. f , strictement monotone et continue sur I, est injective


sur I et dès lors sa fonction réciproque f −1 est bien définie sur f (I). Sup-
posons, pour fixer les idées, que f soit strictement croissante sur I = ]a, b[,
les autres cas se traitant de même. La relation

(x − y)[f (x) − f (y)] > 0 si x /= y dans I,

entraı̂ne, en posant u = f (x), v = f (y),

(u − v)[f −1 (u) − f −1 (v)] > 0 si u /= v dans f (I),

et f −1 est strictement croissante sur f (I). Soit d ∈ f (I) et c ∈ I l’unique


élément tel que f (c) = d. Soit ! > 0 tel que [c − !, c + !] ⊂ ]a, b[. De la
relation
c − ! < c < c + !,

on tire
f (c − !) < d < f (c + !),

et il existe dès lors δ > 0 tel que

f (c − !) < f (c) − δ < d < f (c) + δ < f (c + !).

Comme f −1 est strictement croissante, on en déduit aussitôt que

f −1 (d) − ! = c − ! < f −1 (d − δ) < f −1 (d) < f −1 (d + δ) < c + ! = f −1 (d) + !.

En conséquence, pour tout x ∈ [d − δ, d + δ] ∩ I, on aura

f −1 (d) − ! < f −1 (d − δ) ≤ f −1 (x) ≤ f −1 (d + δ) < f −1 (d) + !.


6.7. FONCTIONS MONOTONES DÉRIVABLES 223

6.7 Fonctions monotones dérivables


Le théorème de Lagrange fournit une caractérisation des fonctions mo-
notones et dérivables sur un intervalle.
Proposition. Soit I ⊂ R un intervalle ouvert et f une fonction de R dans
R dérivable sur I. Alors f est croissante (resp. décroissante) sur I si et
seulement si, pour tout x ∈ I, on a f $ (x) ≥ 0 (resp. f $ (x) ≤ 0).
Démonstration. Il suffit de considérer le cas de f croissante, l’autre s’en
déduisant par application à −f.
Condition nécessaire. Si f est croissante et dérivable sur I, on a, pour chaque
x ∈ I et chaque y /= x dans I,

(y − x)[f (y) − f (x)] ≥ 0,

et dès lors
f (y) − f (x)
f $ (x) = lim ≥ 0.
y→x, y∈I y−x
Condition suffisante. Si x ∈ I, y ∈ I et y > x, alors, par le théorème de
Lagrange, il existe z ∈ ]x, y[ tel que

f (y) − f (x) = (y − x)f $ (z),

et dès lors
(y − x)[f (y) − f (x)] = (y − x)2 f $ (z) ≥ 0.

On a également une caractérisation des fonctions dérivables et


strictement monotones sur un intervalle.
Proposition. Soit I un intervalle ouvert de R et f une fonction de R dans
R dérivable sur I. Alors f est strictement croissante (resp. strictement
décroissante) sur I si et seulement si f $ (x) ≥ 0 (resp. f $ (x) ≤ 0) pour tout
x ∈ I et f $ ne s’annule sur aucun intervalle J ⊂ I.
Démonstration. Il suffit de nouveau de considérer le cas où f est stricte-
ment croissante.
Condition nécessaire. Si f est strictement croissante et dérivable sur I, alors,
par la proposition précédente, f $ (x) ≥ 0 pour tout x ∈ I, et s’il existe un
intervalle J ⊂ I tel que f $ (x) = 0 pour tout x ∈ J, f sera constante sur J,
ce qui contredit son caractère strictement croissant.
Condition suffisante. Soient x < y dans I; par le théorème de Lagrange,
224 CHAPITRE 6. FONCTIONS MONOTONES

il existe z ∈ ]x, y[ tel que f (y) − f (x) = (y − x)f $ (z). Si f $ (z) = 0, alors,
f (y) = f (x) et puisque f est croissante sur I, on aura, pour tout u ∈ [x, y],
f (u) = f (x) = f (y), et dès lors f $ (u) = 0, ce qui contredit l’hypothèse sur
les zéros de f $ . Donc, f $ (z) > 0 et f (y) > f (x).
Le résultat suivant donne des conditions pour que la fonction réciproque
d’une fonction dérivable et injective soit dérivable.
Proposition. Soit I un intervalle de R et f une fonction de R dans R
dérivable et injective sur I. Pour tout a ∈ I tel que f $ (a) /= 0, f −1 est
dérivable en f (a) et
1
(f −1 )$ (f (a)) = $ .
f (a)
Démonstration. Par hypothèse f est continue et injective sur I, et donc
strictement monotone. Il existe donc certainement des a ∈ I tels que f $ (a) /=
0. Soit a l’un d’entre eux. Notons que f (x) /= f (a) si x /= a et f −1 (y) /=
f −1 (f (a)) si y /= f (a). Comme

f (x) − f (a)
lim = f $ (a) /= 0,
x→a, x∈I\{a} x−a

On aura
x−a 1 1
lim = lim = .
x→a, x∈I\{a} f (x) − f (a) x→a, x∈I\{a} f (x)−f (a) f $ (a)
x−a

Dès lors, si ! > 0 est donné,


# #
# x−a 1 #
(∃η > 0)(∀x ∈ I : 0 < |x − a| ≤ η) : ## − $ ## ≤ !.
f (x) − f (a) f (a)

Par un résultat ci-dessus, f −1 est continue en f (a) et dès lors

(∃δ > 0)(∀y ∈ f (I) : |y − f (a)| ≤ δ) : |f −1 (y) − f −1 (f (a)| = |f −1 (y) − a| ≤ η.

En conséquence,
# #
# f −1 (y) − f −1 (f (a)) 1 ##
#
(∃δ > 0)(∀y ∈ f (I) : 0 < |y − f (a)| ≤ δ) : # − $ # ≤ !.
# y − f (a) f (a) #
6.8. FONCTIONS CONVEXES OU CONCAVES 225

On a vu que la fonction exponentielle était une application strictement


croissante de R dans R, ayant une limite nulle lorsque x tend vers −∞ et
tendant vers +∞ lorsque x tend vers +∞. Elle est en outre dérivable en
chaque point x de R, sa dérivée étant égale à elle-même. En conséquence,
les résultats de cette section et de la précédente entraı̂nent que exp est une
bijection de R sur ]0, +∞[ et possède donc une fonction réciproque, définie
sur ]0, +∞[, strictement croissante et continue sur cet intervalle, et dérivable
en chaque point de cet intervalle. Cette fonction est appelée la fonction
logarithme et notée ln ou log. En vertu du théorème que nous venons de
démontrer, on aura, pour tout x ∈ ]0, +∞[,
1 1 1
(ln)$ (x) = (ln)$ [exp(ln x)] = = = .
exp$ (ln x) exp(ln x) x
D’autre part, pour tout x ∈ ]0, +∞[ et tout y ∈ ]0, +∞[, on a
exp(ln x + ln y) = [exp(ln x)].[exp(ln y)] = xy,
et dès lors
ln(xy) = ln x + ln y.
Donc la fonction logarithme fournit un homomorphisme du groupe multipli-
catif (]0, +∞[, ·) sur le groupe additif (R, +) et cette propriété remarquable
de la fonction logarithme est à la base de son utilisation comme outil de
calcul numérique. Si a > 0, on définit la fonction exponentielle de base a
x 2→ ax sur R par ax = exp(x ln a). On voit facilement que cette fonction est
positive et dérivable en chaque point x de R et que
(ax )$ = ax ln a.
En particulier, cette fonction sera strictement décroissante sur R si a ∈ ]0, 1[,
constante si a = 1 et strictement croissante si a > 1. On a évidemment
ex = exp x pour tout x ∈ R. Lorsque a > 0 est différent de un, la fonction
réciproque de l’exponentielle de base a est définie sur ]0, +∞[, appelée la
fonction logarithme de base a et notée loga . On vérifie aisément que, pour
tout x ∈ ]0, +∞[, on a
ln x
loga x = .
ln a

6.8 Fonctions convexes ou concaves


Soit f une fonction de R dans R définie sur un intervalle I ⊂ R. Il est
intéressant d’étudier les fonctions telles que, pour chaque a ∈ I, le taux de
226 CHAPITRE 6. FONCTIONS MONOTONES

variation
f (x) − f (a)
∆af : x 2→
x−a
de f en a est une fonction croissante sur I \ {a} ou une fonction décroissante
sur I \ {a}.
La caractérisation suivante est bien utile.
Proposition. Soit f une fonction de R dans R définie sur un intervalle
I ⊂ R. Alors la fonction ∆a f est, pour chaque a ∈ I, une fonction croissante
sur I \ {a} si et seulement si, pour chaque x ∈ I, chaque y ∈ I et chaque
λ ∈ [0, 1], on a

f [(1 − λ)x + λy] ≤ (1 − λ)f (x) + λf (y).

Démonstration. Condition nécessaire. Il suffit évidemment de démontrer


le résultat lorsque x /= y et λ ∈ ]0, 1[, les autres cas étant triviaux. Si x < y
et λ ∈ ]0, 1[, on a x + λ(y − x) < y, et dès lors, par hypothèse,

∆x f (x + λ(y − x)) ≤ ∆x f (y)

pour tout y ∈ I tel que y > x, c’est-à-dire


f [(1 − λ)x + λy] − f (x) f (y) − f (x)
≤ ,
λ(y − x) y−x
ce qui entraı̂ne facilement que

f [(1 − λ)x + λy] ≤ (1 − λ)f (x) + λf (y).

Si x > y et λ ∈ ]0, 1[, alors, en posant µ = 1 − λ, on a aussi µ ∈ ]0, 1[, et, par
la première partie de la démonstration,

f [(1−λ)x+λy] = f [(1−µ)y+µx] ≤ (1−µ)f (y)+µf (x) = (1−λ)f (x)+λf (y).

Condition suffisante. Si x < y < a appartiennent à I, alors


a−y y−x
λ= ∈ ]0, 1[, 1 − λ = ,
a−x a−x
et

f (y) = f (a+y −a) = f [a+λ(x−a)] = f [(1−λ)a+λx] ≤ (1−λ)f (a)+λf (x);

dès lors
f (y) − f (a) ≤ λ[f (x) − f (a)],
6.8. FONCTIONS CONVEXES OU CONCAVES 227

c’est-à-dire
f (y) − f (a) f (x) − f (a)
≥ .
y−a x−a
Le cas où a < x < y se traite d’une manière semblable. Si x < a < y
appartiennent à I, alors, par la première partie de la démonstration de la
condition suffisante, on a

f (a) − f (x) f (y) − f (x)


≤ ,
a−x y−x

et dès lors
(y − x)[f (a) − f (x)] ≤ (a − x)[f (y) − f (x)]

= (a − x)[f (y) − f (a)] + (a − x)[f (a) − f (x)].


On en déduit aussitôt que

(y − a)[f (a) − f (x)] ≤ (a − x)[f (y) − f (a)],

et donc que
f (x) − f (a) f (y) − f (a)
≤ .
x−a y−a

Remarque. L’examen de la démonstration de la proposition précédente


montre que, pour chaque a ∈ I, ∆a f est strictement croissante sur I \ {a}
si et seulement si, pour tout x /= y dans I et pour tout λ ∈ ]0, 1[, on a

f [(1 − λ)x + λy] < (1 − λ)f (x) + λf (y).

On est ainsi conduit à la définition suivante.


Définition. Soit f une fonction de R dans R définie sur un intervalle I de
R. On dit que f est convexe sur I si, pour tout x ∈ I, tout y ∈ I et tout
λ ∈ [0, 1], on a

f [(1 − λ)x + λy] ≤ (1 − λ)f (x) + λf (y).

Elle sera dite strictement convexe sur I si, pour tout x /= y dans I et tout
λ ∈ ]0, 1[, on a

f [(1 − λ)x + λy] < (1 − λ)f (x) + λf (y).


228 CHAPITRE 6. FONCTIONS MONOTONES

Géométriquement, cette définition exprime que, pout tout x ∈ I et pour


tout y ∈ I, le graphe de f situé entre (x, f (x)) et (y, f (y) est située “en-
dessous” du segment de droite joignant ces deux points. Par la proposition
qui précède, f est convexe (resp. strictement convexe) sur I si et seulement
si, pour chaque a ∈ I, la fonction ∆af est croissante (resp. strictement
croissante) sur I \ {a}.
On a évidemment la situation correspondant au cas où ∆a f est décrois-
sante.
Définition. Soit f une fonction de R dans R définie sur un intervalle I de
R. On dit que f est concave sur I si, pour tout x ∈ I, tout y ∈ I et tout
λ ∈ [0, 1], on a
f [(1 − λ)x + λy] ≥ (1 − λ)f (x) + λf (y).
Elle sera dite strictement concave sur I si, pour tout x /= y dans I et tout
λ ∈ ]0, 1[, on a
f [(1 − λ)x + λy] > (1 − λ)f (x) + λf (y).
Il est clair que f est concave (resp. strictement concave) sur I si et
seulement si −f est convexe (resp. strictement convexe) sur I, et dès lors si
et seulement si, pour chaque a ∈ I, ∆af est décroissante sur I \ {a}. Il suffit
donc d’étudier les fonctions convexes ou strictement convexes.
Exemples. 1. Toute fonction constante sur I est concave et convexe sur I.
2. Toute fonction affine sur R est concave et convexe sur R.
3. Pour tout entier n ≥ 2, la fonction x 2→ xn est strictement convexe sur
%
R; en effet, pour chaque a ∈ R, ∆a f (x) = n−1 k n−1−k
k=0 a x est strictement
croissante sur R.
Une fonction convexe sur I est continue en tout point intérieur à I.
Proposition. Si f est une fonction de R dans R convexe sur l’intervalle I,
alors, f est continue en tout point a ∈ int I et les limites
fg$ (a) = lim ∆af (x) et fd$ (a) = lim ∆af (x)
x→a, x<a x→a, x>a

existent et vérifient l’inégalité fg$ (a) ≤ fd$ (a).


Démonstration. Soit a ∈ int I. L’existence des limites en question et
l’inégalité fg$ (a) ≤ fd$ (a) sont une conséquence de la croissance de ∆a f et
des propriétés des fonctions croissantes. D’autre part,
f (x) − f (a)
lim [f (x) − f (a)] = lim (x − a) = 0.fg$ (a) = 0,
x→a, x<a x→a, x<a x−a
6.8. FONCTIONS CONVEXES OU CONCAVES 229

et de même
lim [f (x) − f (a)] = 0.
x→a, x>a

On en déduit aussitôt la continuité de f en a.


Remarque. Le résultat ci-dessus n’est pas vrai en une extrémité de I comme
le montre l’exemple de la fonction f égale à 1 en 0 et à 0 ailleurs qui est
convexe sur [0, 1] et n’est pas continue en 0.
Les fonctions convexes vérifient une inégalité de la moyenne en termes
des dérivées à gauche fg$ et à droite fd$ .
Proposition. Soit f une fonction de R dans R convexe sur un intervalle I.
Si a < b sont des points de I tels que fd$ (a) et fg$ (b) existent (en particulier
s’ils sont intérieurs à I), alors

f (b) − f (a)
fd$ (a) ≤ ≤ fg$ (b).
b−a

Démonstration. Si a < x < b sont intérieurs à I, on a

f (a) − f (x) f (b) − f (x)


≤ ,
a−x b−x
et dès lors, en faisant tendre x respectivement vers a et vers b, on obtient

f (b) − f (a)
fd$ (a) ≤ ≤ fg$ (b).
b−a

On a une caractérisation intéressante des fonctions convexes dérivables.


Proposition. Soit f une fonction de R dans R dérivable en chaque point
d’un intervalle I. Les énoncés suivants sont équivalents.
1. f est convexe sur I.
2. Pour tout x ∈ I et tout y ∈ I, on a

f (y) ≥ f (x) + f $ (x)(y − x).

3. f $ est croissante sur I.


Démonstration. Notons tout d’abord que, f étant dérivable en chaque
point de I, on a fg$ (x) = fd$ (x) = f $ (x) pour chaque x ∈ I. Dès lors, la
proposition précédente entraı̂ne que 1 ⇒ 2 et la caractérisation de la con-
vexité en termes de ∆a f et de la croissance d’une fonction dérivable entraı̂ne
230 CHAPITRE 6. FONCTIONS MONOTONES

que 3 ⇒ 1. Il reste à montrer que 2 ⇒ 3. L’hypothèse 2 entraı̂ne que, pour


tout x ∈ I et tout y ∈ I, on a

f (y) ≥ f (x) + f $ (x)(y − x) et f (x) ≥ f (y) + f $ (y)(x − y),

c’est-à-dire
f $ (x)(y − x) ≤ f (y) − f (x) ≤ f $ (y)(y − x),
et donc (y − x)[f $ (y) − f $ (x)] ≥ 0.
Remarques. 1. On démontre d’une manière analogue l’équivalence, pour
une fonction dérivable sur I, entre les énoncés
1. f est strictement convexe sur I.
2. Pour chaque x /= y dans I, on a

f (y) > f (x) + f $ (x)(y − x).

3. f $ est strictement croissante sur I.


On déduit aisément de cette remarque que la fonction exponentielle est une
fonction strictement convexe sur R et la fonction logarithme une fonction
strictement concave sur ]0, +∞[.
2. La propriété 2 de la Proposition précédente montre que, si f est
convexe sur I, tout point critique de f sur I est un minimant de f sur I.
3. La définition de fonction convexe peut s’étendre aux fonctions de Rn
dans R. Si E ⊂ Rn , on dira que E est convexe s’il contient le segment
de droite joignant deux quelconques de ses points, c’est-à-dire si, pour tout
x ∈ E, tout y ∈ E et tout λ ∈ [0, 1], on a (1 − λ)x + λy ∈ E. Les parties
convexes de R sont les intervalles. Une fonction f de Rn dans R sera dite
convexe sur E si elle est définie sur E et si, pour tout x ∈ E, tout y ∈ E et
tout λ ∈ [0, 1], on a f [(1 − λ)x + λy] ≤ (1 − λ)f (x) + λf (y).

6.9 Exercices
1. Si f est une fonction de Rn dans R et si a ∈ dom f, on appelle oscillation
de f en a la quantité
& '
o(f, a) = lim sup f − inf f .
r→0+ B2 [a;r] B2[a;r]

Montrer que o(f, a) existe au sens large et que f est continue en a si et


seulement si o(f, a) = 0.
6.9. EXERCICES 231

2. Utiliser le lemme de Cousin pour démontrer directement que si f est une


fonction de R dans R dérivable en chaque point d’un intervalle I et telle que
f $ (x) > 0 pour tout x ∈ I, alors f est strictement croissante sur I.
3. Soit a > 0 et (uk )k∈N la suite réelle définie par u0 > 0 arbitraire et
4 5
1 a
uk+1 = uk + , (k ∈ N).
2 uk

Montrer que cette suite est positive, décroissante et donc convergente. Mon-

trer que sa limite est égale à a. (Algorithme de Héron pour l’extraction
d’une racine carrée).
4. Soit (ak )k∈N une suite réelle. Pour chaque k ∈ N, posons (au sens large)

ak = inf{aj : j ≥ k}, ak = sup{aj : j ≥ k}.

a. Montrer que (ak )k∈N est une suite croissante dans R si et seulement si
(ak )k∈N est minorée. Si (ak )k∈N n’est pas minorée, on pose

lim inf ak = −∞.


k→∞

Si (ak )k∈N est minorée, on pose (au sens large)

lim inf ak = lim ak = lim inf aj .


k→∞ k→∞ k→∞ j≥k

b. Montrer que (ak )k∈N est une suite décroissante dans R si et seulement si
(ak )k∈N est majorée. Si (ak )k∈N n’est pas majorée, on pose

lim sup ak = +∞.


k→∞

Si (ak )k∈N est majorée, on pose (au sens large)

lim sup ak = lim ak = lim sup aj .


k→∞ k→∞ k→∞ j≥k

c. On a ainsi attaché à toute suite réelle deux éléments lim inf k→∞ ak
et lim supk→∞ ak de R ∪ {−∞} ∪ {+∞} respectivement appelés la limite
inférieure et la limite supérieure de la suite (ak )k∈N . Montrer (avec la con-
vention −∞ < a < +∞ pour tout a ∈ R) que l’on a toujours

lim inf ak ≤ lim sup ak ,


k→∞ k→∞
232 CHAPITRE 6. FONCTIONS MONOTONES

et que l’égalité a lieu si et seulement si la suite (ak )k∈N est convergente (au
sens large), auquel cas sa limite (au sens large) est égale à la valeur commune
de sa limite inférieure et de sa limite supérieure.
5. Soit f une fonction de Rn dans R semi-continue inférieurement en chaque
point du fermé E ⊂ Rn . Montrer que f possède un minimum sur E si et
seulement si f possède une suite minimisante convergente.
6. Soient A et B deux ensembles non vides et

f : A × B → R, (x, y) 2→ f (x, y)

une application réelle majorée et minorée. Montrer que

sup inf f (x, y) ≤ inf sup f (x, y).


x∈A y∈B y∈B x∈A

6.10 Petite anthologie


Si la propriété M n’appartient pas à toutes les valeurs d’une grandeur x,
mais appartient à toutes celles qui sont plus petites qu’un certain u, alors il
existe toujours une grandeur U qui est la plus grande de celles dont on peut
affirmer que toutes les valeurs inférieures x possèdent la propriété M.

Bernard Bolzano, 1817

Il ne faut pas trop s’étonner que la distinction entre minimum et borne


inférieure, ou maximum et borne supérieure, ait été faite si tardivement.
C’est qu’elle n’a aucune signification concrète. Qui oserait décider s’il existe
une charge maxima que peut supporter un pont, plutôt qu’une charge minima
qui le fasse s’écrouler ?

Henri Lebesgue

Il me semble que la notion de fonction convexe est à peu près aussi fon-
damentale que celles-ci : fonction positive, fonction croissante. Si je ne
me trompe pas en ceci, la notion devra trouver sa place dans les expositions
élémentaires de la théorie des fonctions réelles.

Johann L.W.V. Jensen, 1906


Chapitre 7

Développement de Taylor et
séries

7.1 Dérivées d’ordre supérieur


Soit f une fonction de R dans Rp dérivable en au moins un point de R. A
chaque point x ∈ R tel que f soit dérivable en x, nous pouvons associer
l’élément f $ (x) de Rp et définir ainsi une nouvelle fonction f $ de R dans Rp
de domaine
dom f $ = {x ∈ R : f est dérivable en x}.
Cette fonction s’appelle la fonction dérivée première de f ou, brièvement, la
dérivée première de f ou la dérivée de f . On la désigne également par Df
df
ou par dx .
Définition. Soit f une fonction de R dans Rp et a ∈ dom f $ . On dit que
f est deux fois dérivable en a si f $ est dérivable en a, auquel cas (f $ )$ (a) est
2
noté f $$ (a), D 2 f (a) ou ddxf2 (a) et appelé le vecteur dérivé deuxième de f en
a ou, plus simplement la dérivée deuxième de f en a.
On rappellera que l’existence de f $$ (a) requiert que a soit non isolé dans
dom f $ et que
f $ (x) − f $ (a)
lim
x→a x−a
existe. On sait que, n ≥ 1 étant un entier, l’application f : x 2→ xn est
dérivable en chaque x ∈ R et f $ (x) = nxn−1 . En conséquence la dérivée
deuxième f $$ (x) existe en chaque x ∈ R et est égale à zéro si n = 1 et à
n(n − 1)xn−2 si n ≥ 2.

233
234 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES

On peut alors procéder comme avec f $ et définir la fonction dérivée


deuxième de f ou, plus brièvement, la dérivée deuxième de f , notée f $$ ou
2
D2 f ou ddxf2 , comme la fonction de R dans Rp de domaine
dom f $$ = {x ∈ R : f $ est dérivable en x},
qui, à chaque x ∈ dom f $$ associe f $$ (x). On dira alors que f est trois fois
dérivable en a si f $$ est dérivable en a, auquel cas (f $$ )$ (a) est noté f $$$ (a),
3
f (3)(a), D3 f (a) ou ddxf3 (a) et appelé le vecteur dérivée troisième de f en a ou,
plus simplement la dérivée troisième de f en a. En continuant de la sorte,
si k ≥ 2 est un entier et si f k−1 désigne la fonction dérivée (k − 1)e de f ,
on dira que f est k fois dérivable en a si la fonction f (k−1) est dérivable en
a, auquel cas (f (k−1) )$ (a) est appelé le vecteur dérivée ke de f en a ou plus
k
simplement la dérivée ke de f en a, et noté f (k) (a) ou D k f (a) ou ddxfk (a). La
fonction dérivée ke de f est alors la fonction de R dans Rp de domaine
dom f (k) = {x ∈ R : f est k-fois dérivable en x}
qui, à chaque x ∈ dom f (k) associe f (k) (x). Ainsi, dans l’exemple ci-dessus
où f (x) = xn , un raisonnement par récurrence aisé montre que, pour chaque
x ∈ R,
f (k) (x) = n(n − 1) . . . (n − k + 1)xn−k si k ≤ n,
et
f (k) (x) = 0 si k > n.
On a bien entendu en général les inclusions
dom f (k) ⊂ dom f (k−1) ⊂ dom f,
et ces inclusions peuvent être strictes. Ainsi, pour la fonction f de Dirichlet
qui associe 1 à chaque x rationnel et 0 à chaque x irrationnel, on a dom f $ = ∅
(et dès lors dom f (k) = ∅ pour tout k ≥ 2), puisque f n’est continue en aucun
point de R et donc dérivable en aucun point de R. Karl Weierstrass a
donné en 1872 un exemple plus surprenant de fonction continue sur R qui
n’est dérivable en aucun point de R. Nous y reviendrons plus loin.
On déduit aisément des règles de calcul des dérivées (premières) certaines
règles de calcul pour les dérivées d’ordre supérieur. Par exemple, si f et g
sont des fonctions de R dans Rp k-fois dérivables en a ∈ R, et si c ∈ R, alors
f + g et cf sont k-fois dérivables en a et
(f + g)(k)(a) = f (k) (a) + g (k)(a), (cf )(k)(a) = cf (k) (a).
Le cas du produit (et dès lors du quotient) de deux fonctions est plus com-
pliqué et porte le nom de formule de Leibniz.
7.1. DÉRIVÉES D’ORDRE SUPÉRIEUR 235

Proposition. Soit k ≥ 1 un entier, f une fonction de R dans R (resp. C)


et g une fonction de R dans Rp (resp. C) k-fois dérivables en a. Alors, f g
est k-fois dérivable en a et
k
$
(f g)(k)(a) = Ckj f (j) (a)g (k−j)(a),
j=0

j
où Ck = k!
j!(k−j)! .

Démonstration. Elle se fait par récurrence sur k. Le résultat a déjà été


démontré pour k = 1. S’il est vrai jusqu’à l’ordre k − 1, alors

k−1
$ j
(f g)(k−1)(a) = Ck−1 f (j) (a)g (k−1−j)(a),
j=0

et (f g)(k−1) est dérivable en a puisqu’il en est ainsi de chacune des fonctions


f (j) g (k−1−j) (0 ≤ j ≤ k − 1) en vertu de l’hypothèse de récurrence. En outre,
par les règles de calcul d’une dérivée première, on a

k−1
$ j
(f g)(k)(a) = [(f g)(k−1)]$ (a) = Ck−1 [f (j)g (k−1−j) ]$ (a)
j=0

k−1
$ j
= Ck−1 [f (j+1)(a)g (k−1−j)(a) + f (j) (a)g (k−j)(a)]
j=0

k
$ k−1
$
j−1 (j) j
= Ck−1 f (a)g (k−j)(a) + Ck−1 f (j) (a)g (k−j)(a)
j=1 j=0

k−1
$ j−1 j
= f (k) (a)g(a) + (Ck−1 + Ck−1 )f (j) (a)g (k−j)(a) + f (a)g (k)(a)
j=1

k
$
= Ckj f (k) (a)g (k−j)(a),
j=0

puisque Ckj = Ck−1


j−1 j
+ Ck−1 .
236 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES

7.2 Développement de Taylor


Soit f une fonction de R dans Rp et a ∈ dom f . Si f est dérivable en a,
alors, pour tout h ∈ (dom f − a) \ {0}, on a

f (a + h) = f (a) + hf $ (a) + |h|r(h),

où r est une fonction de R dans Rp de domaine au moins égal à (dom f −


a) \ {0} telle que r(h) → 0 si h → 0. En d’autres termes, on peut écrire,
pour tout h ∈ (dom f − a) \ {0},

f (a + h) = P 1 (h) + |h|r(h),

où P 1 (h) est un polynôme de degré un en h dont les coefficients s’expriment


en fonction de f (a) et f $ (a) et où r(h) → 0 si h → 0.
Lorsque f est une fonction de R dans Rp m-fois dérivable en a, (m ≥ 2),
il est naturel de se demander s’il existe un polynôme P m de degré m, dont
les coefficients s’expriment en fonction de f (a), f $ (a), . . ., f (m)(a) tel que,
pour tout h ∈ (dom f − a) \ {0}, on ait

f (a + h) = P m (h) + |h|m r(h) (7.1)

où r est une fonction de R dans Rp de domaine au moins égal à (dom f −a)\
{0} telle que r(h) → 0 si h → 0. Avant de donner des conditions suffisantes
pour l’existence d’un tel polynôme, montrons qu’il en existe au plus un.
Proposition. Soit f une fonction de R dans Rp et a non isolé dans dom f .
Il existe au plus un polynôme P m de degré m vérifiant (7.1).
%
Démonstration. Supposons que P m (h) = m k=0 ck h vérifie (7.1) et que
k
%m
Q (h) = k=0 dk h soit tel que, pour tout h ∈ (dom f − a) \ {0}, on ait
m k

f (a + h) = Qm (h) + |h|m s(h),

où s est une fonction de R dans Rp de domaine au moins égal à (dom f −


a) \ {0} telle que s(h) → 0 si h → 0. On en déduit aussitôt, par soustraction,
que, pour tout h ∈ (dom f − a) \ {0}, on a

Qm (h) − P m (h) = |h|m[r(h) − s(h)] = |h|m q(h), (7.2)

avec q(h) → 0 si h → 0. On déduit aussitôt de (7.2) que

d0 − c0 = lim [Qm (h) − P m (h)] = lim |h|mq(h) = 0,


h→0 h→0
7.2. DÉVELOPPEMENT DE TAYLOR 237

et, pour prouver par récurrence que P m = Qm , il suffit de montrer que si


cj = dj pour 0 ≤ j ≤ k − 1 ≤ m − 1, alors ck = dk . Si cj = dj pour
0 ≤ j ≤ k − 1 ≤ m − 1, la condition (7.2) entraı̂ne
m
$
(dj − cj )hj = |h|m q(h),
j=k

et dès lors m
$ |h|m
(dj − cj )hj−k = q(h),
j=k
hk

pour tout h ∈ (dom f − a) \ {0}. En conséquence,


m
$ |h|m
dk − ck = lim (dj − cj )hj−k = lim q(h) = 0,
h→0 h→0 hk
j=k

|h|m
puisque la fonction h 2→ hk
est localement bornée en 0 pour chaque 1 ≤
k ≤ m.
Cherchons maintenant à déterminer la forme de cet unique polynôme
de degré m qui vérifie éventuellement la condition (7.1). Pour ce faire,
%
considérons le cas particulier trivial où f (x) = m k=0 bk x est elle-même
k

un polynôme de degré m. Dans ce cas, si a ∈ R est donné, la fonction


%
h 2→ f (a + h) = m k=0 bk (a + h) est aussi un polynôme de degré m, comme
k

le montre le développement de chaque monôme (a + h)k par la formule


du binôme de Newton. Donc f (a + h) est dans ce cas l’unique polynôme
%
P m (h) = m k=0 ck h de degré m vérifiant la condition (7.1). De l’identité
k

m
$
f (a + h) = ck hk ,
k=0

on déduit aussitôt, par dérivations des deux membres, que, pour chaque
1 ≤ j ≤ m, on a
m
$
[f (a + ·)](j)(h) = f (j) (a + h) = ck k(k − 1) . . .(k − j + 1)hk−j ,
k=j

et dès lors, en prenant h = 0, on trouve

f (a) = c0 ,

f (j) (a) = j!cj , (1 ≤ j ≤ m).


238 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES

Le polynôme de degré m vérifiant les conditions voulues est donc de la forme


m
$ hj
f (j) (a),
j=0
j!

(avec les conventions habituelles 0! = 1 et f (0) = f ) et s’exprime bien en


fonction de f (a), f $ (a), . . ., f (m)(a). Ce résultat suggère l’introduction de la
définition suivante.
Définition. Soit m ≥ 1 un entier et f une fonction de R dans Rp m fois
dérivable en a ∈ R. Le développement de Taylor d’ordre m de f en a est le
m
polynôme Tf,a de degré m défini par

m
$ f (j) (a)
m
Tf,a (h) = hj .
j=0
j!

Le reste du développement de Taylor d’ordre m de f en a est la fonction


f,a de R dans R de domaine dom f − a définie par
Rm p

f,a (h) = f (a + h) − Tf,a (h).


Rm m

Lorsque a = 0, Tf,0
m est aussi appelé le développement de Maclaurin d’ordre

m de f .
Un lemme sera utile pour donner des conditions suffisantes pour que le
développement de Taylor d’ordre m de f vérifie la relation (7.1).
Lemme. Soit m ≥ 1 un entier et g une fonction de R dans Rp (m − 1)-fois
dérivable en chaque point d’un voisinage V de 0 et m fois dérivable en 0
(cette hypothèse se réduisant à la dérivabilité de g en 0 si m = 1). Si

g(0) = g $ (0) = . . . = g (m)(0) = 0,

alors
g(h)
lim = 0.
h→0 |h|m
Démonstration. Elle se fait par récurrence sur m. Le résultat est évidem-
ment vrai pour m = 1 puisque, si g(0) = g $ (0) = 0, alors,

g(h) g(h) − g(0) − hg $ (0)


lim = lim = 0,
h→0 |h| h→0 |h|
7.2. DÉVELOPPEMENT DE TAYLOR 239

puisque g est dérivable en 0. Supposons donc le résultat vrai pour k − 1,


où 2 ≤ k ≤ m est un entier, et montrons qu’il est vrai pour k. On a, par
hypothèse
g(0) = g $ (0) = . . . = g (k)(0) = 0,
et la fonction g $ est donc telle que

g $ (0) = (g $)$ (0) = . . . = (g $)(k−1) (0) = 0.

En conséquence, l’hypothèse de récurrence entraı̂ne que

g $ (h)
lim = 0. (7.3)
h→0 |h|k−1

Si r > 0 est suffisamment petit pour que le voisinage V de 0 contienne


B2 [0; r], alors, pour chaque h ∈ [−r, r], le théorème de la moyenne entraı̂ne
l’existence d’un θ ∈ ]0, 1[ tel que

|g(h)|2 = |g(h) − g(0)|2 ≤ |h||g $(θh)|2 . (7.4)

Soit ! > 0; la condition (7.3) entraı̂ne l’existence d’un δ ∈ ]0, r] tel que, pour
tout h$ ∈ [−δ, δ], on ait
|g $(h$ )|2 ≤ !|h$ |k−1 .
Dès lors, pour tout h ∈ [−δ, δ], on aura |θh| ≤ δ, et, par (7.4),

|g(h)|2 ≤ |h|!|θh|k−1 ≤ !|h|k .

Le résultat suivant, dû à William H. Young, montre qu’il suffit d’ajouter


la dérivabilité jusqu’à l’ordre m − 1 sur un voisinage du point a à l’existence
de la dérivée me en ce point pour que le développement de Taylor d’ordre
m de f en a vérifie la condition (7.1).
Proposition. Soit m ≥ 1 un entier, f une fonction de R dans Rp (m − 1)-
fois dérivable en chaque point d’un voisinage V de a et m-fois dérivable en
a (si m = 1 cette hypothèse se réduit à la dérivabilité de f en a). Si Rm
f,a est
le reste du développement de Taylor d’ordre m de f en a, alors

f,a (h)
Rm
lim = 0.
h→0 |h|m
240 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES

Démonstration. Pour tout h ∈ dom f − a, on a, par définition,


m
$ f (j) (a)
f,a (h) = f (a + h) − Tf,a (h) = f (a + h) −
Rm m
hj ,
j=0
j!

et dès lors, pour chaque 1 ≤ k ≤ m,


m
$ f (j) (a)
(Rm
f,a ) (h) = f
(k) (k)
(a + h) − j(j − 1) . . . (j − k + 1)hj−k ,
j=k
j!

ce qui entraı̂ne immédiatement que

f,a (0) = f (a)−f (a) = 0, (Rf,a) (0) = f


Rm (a)−f (k) (a) = 0, (1 ≤ k ≤ m).
m (k) (k)

Il suffit donc d’appliquer le lemme à Rm


f,a .

Exemples. 1. On a vu que, pour tout x ∈ R, (exp)$ (x) = exp x. En


conséquence, pour tout x ∈ R et tout k ∈ N∗ , on a (exp)(k)(x) = exp x. En
particulier, (exp)(k) (0) = exp 0 = 1 pour tout k ≥ 1 et dès lors, pour chaque
entier m ≥ 1 et chaque x ∈ R, on a
m
$ xj
exp x = exp,0 (x),
+ Rm
j=0
j!

Rm (x)
avec limx→0 exp,0
xm = 0.
2. On a vu que, pour tout x ∈ ]0, +∞[, (ln)$ (x) = x1 . Dès lors, pour chaque
k ≥ 2, on a (ln)(k)(x) = (−1)k−1 (k−1)!xk
(le montrer par récurrence). En
conséquence, pour chaque h ∈ ] − 1, +∞[, et chaque m ≥ 1, on aura (puisque
ln 1 = 0),
m
$ (−1)j−1
ln(1 + h) = hj ln,1 (h),
+ Rm
j=1
j
Rm (h)
avec limh→0 ln,1
hm = 0.

7.3 Calcul de limites et de dérivées


Le théorème de Young fournit un résultat pour le calcul de la limite du
quotient de deux fonctions d’une variable dans certains cas où la règle de
calcul de la limite d’un quotient et la règle de l’Hospital ne s’appliquent pas.
7.3. CALCUL DE LIMITES ET DE DÉRIVÉES 241

Proposition. Soit m ≥ 2 un entier, f une fonction de Rn dans Rp (resp. C)


et g une fonction de Rn dans R (resp. C) (m − 1)-fois dérivables en chaque
point d’un voisinage V de a ∈ R et m-fois dérivables en a. Si

f (a) = f $ (a) = . . . = f (m−1) (a) = 0,

g(a) = g $ (a) = . . . = g (m−1)(a) = 0,


et si
g (m)(a) /= 0,
alors
f f (m) (a)
lim (x) = (m) .
x→a, x(=a g g (a)
Démonstration. Par le théorème de Young, on a, pour tout h ∈ (dom f ∩
dom g) − a,
f (m) (a)
f (a + h) = hm f,a(h),
+ Rm
m!
g (m)(a)
g(a + h) = hm g,a (h),
+ Rm
m!
et
f,a (h)
Rm g,a (h)
Rm
lim m
= 0, lim = 0.
h→0 h h→0 hm
Dès lors, pour tout h ∈ [(dom f ∩ dom g) − a] \ {0}, il vient
hm f (m) (a)
f m! + Rm
f,a (h)
(a + h) =
g hm g (m) (a)
m! + Rm
g,a (h)

f (m) (a) Rm
f,a (h)
+ hm
= m!
Rm
.
g (m) (a) g,a (h)
m! + hm
Par conséquent, la règle usuelle de passage à la limite dans un quotient
appliquée au second membre entraı̂ne que
f f (a + h)
lim (x) = lim
x→a, x(=a g h→0, h(=0 g(a + h)

f (m) (a) Rm
f,a (h)
+ hm f (m)(a)
= lim m!
= .
h→0, h(=0 g (m) (a)
+
Rm
g,a (h) g (m)(a)
m! hm
242 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES

Exemple. On a
(exp x − 1)3
lim = 1,
x→0 x3
puisque, si f (x) = (exp x − 1)3 et g(x) = x3 , alors,

f $ (x) = 3(exp x − 1)2 , f $$ (x) = 6(exp x − 1), f $$$ (x) = 6 exp x,

g $ (x) = 3x2 , g $$ (x) = 6x, g $$$(x) = 6,


et dès lors

f (0) = f $ (0) = f $$ (0) = g(0) = g $ (0) = g $$(0) = 0,

f $$$ (0) = 6, g $$$(0) = 6.


Le théorème de Young fournit aussi un moyen rapide de calculer les
dérivées d’ordre supérieur de certaines fonctions. Pour chaque entier q ≥ 1
et chaque h /= 1, on a l’identité algébrique
q
1 1 − hq+1 hq+1 $ hq+1
= + = hk + .
1−h 1−h 1 − h k=0 1−h

Comme
hq+1 h
lim = lim = 0,
h→0 (1 − h)hq h→0 1 − h
%
on voit que qk=0 hk est le développement de Taylor d’ordre q de la fonction
f : x 2→ 1−x
1
en 0, et dès lors, puisque q est arbitraire, on a, pour chaque
entier j ∈ N∗ ,
f (j) (0) = j!.
D’ailleurs, l’identité ci-dessus entraı̂ne que, pour tout entier p ≥ 2 et tout
h /= 1, on a
q
1 $ hp(q+1)
= hkp
+ ,
1 − hp k=0
1 − hp
et
q
1 $ (−1)q+1 hp(q+1)
= (−1) k kp
h + .
1 + hp k=0
1 + hp
Comme
hp(q+1)
lim = 0,
h→0 (1 ± hp )hqp
7.4. RESTE DE TAYLOR DE FONCTIONS RÉELLES 243

q %
on voit que, si f (x) = 1−x
1
p et g(x) = 1+xp ,
1
k=0 h
kp
est le développement
%q
de Taylor d’ordre qp de f en 0 et k=0 (−1) h est le développement de
k kp

Taylor d’ordre qp de g en 0. On en déduit aussitôt que

f (j) (0) = 0 si j n’est pas un multiple de p,

f (kp)(0) = (kp)!,
et
g (j)(0) = 0 si j n’est pas un multiple de p,
g (kp)(0) = (−1)k (kp)!.

7.4 Reste de Taylor de fonctions réelles


Le théorème de Cauchy permet de préciser l’expression du reste du déve-
loppement de Taylor d’ordre m en a d’une fonction de R dans R m + 1-fois
dérivable sur un voisinage de a.
Le résultat le plus général dans cette direction est l’expression de
Schlömilch du reste du développement de Taylor.
Proposition. Soit m ≥ 1 un entier et f une fonction de R dans R (m + 1)-
fois dérivable en chaque point d’un intervalle I de R. Soient a ∈ I, h /= 0
tel que a + h ∈ I et g une fonction de R dans R continue sur I, dérivable
en chaque point intérieur à I et telle que g $ ne s’annule pas sur l’intervalle
ouvert joignant a et a + h. Alors il existe θ ∈ ]0, 1[ tel que
2 3, -
g(a + h) − g(a) [(1 − θ)h]m f (m+1) (a + θh)
f,a (h)
Rm = .
g $ (a + θh) m!
Démonstration. Définissons la fonction F de R dans R par

F (y) = f (a + h) − Tf,y
m
(a + h − y).

F est définie sur I et, par construction,

F (a + h) = f (a + h) − Tf,a+h
m
(0) = f (a + h) − f (a + h) = 0,

F (a) = f (a + h) − Tf,a
m
(h) = Rm
f,a(h).

En outre, pour chaque y ∈ I, on a


 $
m
$ f (j) (y) 
F $ (y) = −  (a + h − y)j
j=0
j!
244 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES

m m
$ f (j) (y) $ f (j+1) (y)
= (a + h − y)j−1 − (a + h − y)j
j=1
(j − 1)! j=0 j!

m−1 m
$ f (j+1)(y) $ f (j+1) (y)
= (a + h − y)j − (a + h − y)j
j=0
j! j=0
j!

f (m+1) (y)
= −(a + h − y)m .
m!
Si nous appliquons le théorème de la moyenne Cauchy à F et g sur l’intervalle
d’extrémités a et a + h, nous obtenons un θ ∈ ]0, 1[ tel que

[F (a + h) − F (a)]g $ (a + θh) = [g(a + h) − g(a)]F $(a + θh),

et dès lors tel que


2 3, -
g(a + h) − g(a) [(1 − θ)h]m f (m+1) (a + θh)
f,a (h)
Rm = .
g $ (a + θh) m!

En choisissant convenablement la fonction g dans l’expression de Schlö-


milch, on obtient des expressions intéressantes du reste. La première, ap-
pelée expression de Lagrange du reste du développement de Taylor,
constitue une généralisation du théorème de Lagrange.
Corollaire. Soit m ≥ 1 un entier et f une fonction de R dans R (m+1)-fois
dérivable en chaque point d’un intervalle I de R. Soient a ∈ I, h /= a tel que
a + h ∈ I. Alors il existe un θ ∈ ]0, 1[ tel que

f (m+1) (a + θh)
f,a (h) = h
Rm m+1
.
(m + 1)!

Démonstration. Il suffit de prendre g définie par g(y) = (a + h − y)m+1


dans l’expression de Schlömilch, ce qui donne

g(a + h) − g(a) = −hm+1 , g $ (a + θh) = −(m + 1)[(1 − θ)h)]m .

Le deuxième cas particulier s’appelle l’expression de Cauchy du reste


du développement de Taylor.
7.5. EXTRÉMANTS LOCAUX LIBRES 245

Corollaire. Soit m ≥ 1 un entier et f une fonction de R dans R (m+1)-fois


dérivable en chaque point d’un intervalle I de R. Soient a ∈ I, h /= a tel que
a + h ∈ I. Alors il existe un θ ∈ ]0, 1[ tel que

(1 − θ)m hm+1 f (m+1) (a + θh)


f,a (h) =
Rm .
m!

Démonstration. Il suffit de prendre g définie par g(y) = a + h − y dans


l’expression de Schlömilch.

7.5 Extrémants locaux libres


L’expression de Lagrange du reste du développement de Taylor permet de
donner des conditions nécessaires et des conditions suffisantes pour qu’un
point soit maximant local libre ou minimant local libre d’une fonction de R
dans R.
Proposition. Soit m ≥ 2 un entier, f une fonction de R dans R m-fois
dérivable en chaque point d’un voisinage V d’un point a ∈ R, telle que f (m)
soit continue et différente de zéro en a et que

f $ (a) = f $$ (a) = . . . = f (m−1) (a) = 0.

Si m est impair, a n’est pas un extrémant local libre de f . Si m est pair et


si f (m)(a) > 0, alors a est un minimant local libre de f et si m est pair et
f (m) (a) < 0, alors a est un maximant local libre de f .
Démonstration. Soit r > 0 tel que [a − r, a + r] ⊂ V et tel que, pour tout
x ∈ [a−r, a+r], f (m) (x)f (m)(a) > 0 (c’est possible puisque f (m) est continue
en a et f (m) (a) /= 0). Soit h ∈ R tel que |h| ≤ r. En vertu des hypothèses
et de l’expression de Lagrange du reste du développement de Taylor d’ordre
m − 1 en a, il existe θ ∈ ]0, 1[ tel que

f (m) (a + θh)
f (a + h) − f (a) = hm .
m!
Dès lors, si m est impair, f (a + h) − f (a) a un signe différent pour h < 0
et h > 0 et a n’est pas un extrémant local libre de f . Si m est pair, alors
pour tout h ∈ [−r, r], f (a + h) − f (a) a le signe de f (m) (a) et le résultat s’en
déduit aussitôt.
246 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES

Considérons maintenant le cas d’une fonction f de R dans R qui est m-


fois dérivable sur un voisinage V d’un point a quel que soit l’entier m ≥ 1.
Une telle fonction est appelée indéfiniment dérivable ou de classe C ∞ sur
V . Si a est un point critique de f et si toutes ses dérivées en a ne sont pas
nulles, la proposition précédente montre que l’examen de la première dérivée
non nulle en a permet de discuter complètement la nature du point critique.
Il n’en est pas de même si toutes les dérivées sont nulles en a. C’est ce que
montre l’étude de la fonction de Cauchy définie par
4 5
1
c(x) = exp − si x > 0, c(x) = 0 si x ≤ 0.
x
Les propriétés de cette fonction résultent des lemmes suivants.
Lemme. Pour tout entier m ≥ 0, on a
4 5
1 1
lim exp − = 0.
x→0+ xm x
Démonstration. On a
4 5
1 1
lim exp − =0
x→0+ xm x
# 4 5#
# 1 1 #
⇔ (∀! > 0)(∃δ > 0)(∀x ∈ ]0, δ]) : ## m exp − ## ≤ !
x x
# #
# ym # ym
⇔ (∀! > 0)(∃ρ > 0)(∀y ≥ ρ) : ## # ≤ ! ⇔ lim = 0.
exp(y) # y→+∞ exp(y)

En appliquant m fois de suite la règle de L’Hospital, on trouve


ym my m−1 m!
lim = lim = . . . = lim = 0.
y→+∞ exp y y→+∞ exp y y→+∞ exp y

Lemme. Pour chaque x > 0 et chaque entier m ≥ 1, c est m-fois dérivable


en x et 4 5 4 5
1 1
c (x) = P
(m)
exp − ,
x x
où P est un polynôme tel que P (0) = 0.
Démonstration. Le résultat est vrai pour m = 1 puisque
4 5
1 1
c$ (x) = 2
exp − .
x x
7.5. EXTRÉMANTS LOCAUX LIBRES 247

Si, pour un entier 2 ≤ k ≤ m, on a


4 5 4 5
1 1
c (k−1)
(x) = P exp − ,
x x

avec P un polynôme tel que P (0) = 0, alors


2 4 5 4 53 4 5 4 5 4 5
1 $ 1 1 1 1 1 1
c(k) (x) = − P + 2P exp − =Q exp − ,
x2 x x x x x x

avec Q(y) = y 2 [P (y) − P $ (y)] un polynôme tel que Q(0) = 0.

Lemme. Pour chaque m ∈ N∗ , c est m-fois dérivable en 0 et c(m)(0) = 0.


Démonstration. Procédons par récurrence sur m. On a évidemment

c(x) − c(0)
lim = 0,
x→0− x

et, par le premier lemme,


4 5
c(x) − c(0) 1 1
lim = lim exp − = 0,
x→0+ x x→0+ x x

ce qui montre que c$ (0) = 0. Supposons que, pour un entier k ≥ 2, on


ait c(k−1) (0) = 0. Comme c est identiquement nulle sur ] − ∞, 0], on aura
c(k−1) (x) = 0 pour tout x < 0, et dès lors

c(k−1)(x) − c(k−1) (0)


lim = 0.
x→0− x

D’ailleurs, par le lemme ci-dessus, on a, pour x > 0,


4 5 4 5
1 1
c (k−1)
(x) = P exp −
x x

pour un certain polynôme P tel que P (0) = 0, et dès lors,


4 5 4 5
c(k−1) (x) − c(k−1)(0) 1 1 1
lim = lim P exp − = 0,
x→0+ x x→0+ x x x

en vertu du premier lemme. Donc c(k)(0) = 0, et le résultat s’en déduit.


248 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES

En rassemblant les résultats des lemmes que nous venons de démontrer,


on voit que la fonction de Cauchy c est une fonction indéfiniment dérivable
sur R (ce qui entraı̂ne que chacune de ses dérivées est continue sur R) telle
que, pour tout entier k ≥ 0, on a c(k)(0) = 0. Comme par ailleurs c(x) ≥ 0
pour tout x ∈ R, 0 est un minimant de cette fonction. Par ailleurs, 0 est
un maximant pour la fonction −c, qui a aussi toutes ses dérivées nulles à
l’origine. Enfin, il est facile de vérifier que la fonction d définie par d(x) =
c(x) si x > 0, d(0) = 0 et d(x) = −c(x) si x < 0 a aussi toutes ses dérivées
nulles en 0 mais 0 n’est pas un extrémant local libre de d.

7.6 Séries
Soit f une fonction de R dans Rp et a ∈ dom f tel que f (k) (a) existe pour
chaque entier k ≥ 1. Pour chaque h ∈ R fixé et chaque entier q ≥ 0, on peut
q
considérer la valeur en h Tf,a (h) du développement de Taylor d’ordre q de f
8 9
q
en a. On obtient ainsi une suite Tf,a (h) dans Rp et, a priori, les cinq
q∈N
possibilités
8 9suivantes peuvent se présenter :
q
1. Tf,a(h) est divergente et a + h /∈ dom f − {a}.
8 9q∈N
q
2. Tf,a(h) est divergente et a + h ∈ dom f − {a}.
8 9q∈N
q
3. Tf,a (h) est convergente, a + h ∈ dom f − {a} et
q∈N

q
lim Tf,a (h) = f (a + h).
q→∞

8 9
q
4. Tf,a (h) est convergente, a + h ∈ dom f − {a} et
q∈N

q
lim Tf,a (h) /= f (a + h).
q→∞

8 9
q
5. Tf,a (h) est convergente et a + h /∈ dom f − {a}.
q∈N
La situation 1 se présente pour la fonction f de R dans R définie par f (x) =
q
1−x pour laquelle on a vu plus haut que, pour chaque q ∈ N, Tf,0 (h) =
1
% q q
k=0 h . Dans ce cas, 1 /∈ dom f et Tf,0 (1) = q + 1. La situation 2 se
k

présente pour la même fonction f au point −1 ∈ dom f puisque, pour chaque


q %
q ∈ N, on a Tf,0 (−1) = qk=0 (−1)k = 1 si q est pair et 0 si q est impair,
8 9
q
ce qui entraı̂ne la divergence de la suite Tf,0 (−1) . La situation 3 se
q∈N
7.6. SÉRIES 249

présente pour la même fonction f en chaque h ∈ ] − 1, 1[, puisque, en un tel


point, on a, pour chaque q ∈ N,
q
1 $ hq+1
f (h) = = hk +
1 − h k=0 1−h

q hq+1
= Tf,0(h) + ,
1−h
ainsi qu’on l’a vu plus haut, et dès lors

q hq+1
lim [f (h) − Tf,0 (h)] = lim = 0.
q→∞ q→0 1 − h

La situation 4 se présente pour la fonction de Cauchy c en a = 0 et h > 0.


q
En effet, on a vu que Tc,0 (h) = 0 pour tout h ∈ R, alors que c(h) /= 0 pour
tout h > 0. La situation 5 se présente pour la fonction f de R dans R définie
q
par f (x) = |x−1|
x−1
pour laquelle Tf,0 (h) = −1 pour tout q ∈ N et dès lors
8 9
q
Tf,0 (1) converge alors que 1 /∈ dom f.
q∈N
Pour trouver des conditions sur f sous lesquelles la situation83 se présente,
9
q
il convient donc au prélable d’étudier la convergence de la suite Tf,a (h) .
q∈N
On voit que chaque élément de cette suite s’obtient à partir du précédent
en ajoutant un terme : il s’agit donc d’une suite de sommes dont le nombre
de terme augmente indéfiniment. De telles suites se sont présentées très tôt
dans l’histoire des mathématiques en tant que détermination de la “somme
d’une infinité de nombres réels”. Il s’agit là d’une opération impossible pour
l’arithmétique ou l’algèbre, mais on peut, conformément à la philosophie de
l’analyse, chercher à la réaliser de manière approchée avec une erreur aussi
petite que l’on veut.
Définition. Soit (ak )k∈N une suite dans Rp. Pour chaque q ∈ N, définissons
%
la q e somme partielle de (ak )k∈N par Aq = qk=0 ak . On appelle série de
termes ak la suite (Aq )q∈N des sommes partielles de (ak )k∈N; on la note
%
k∈N ak pour rappeler son mode de construction en fonctions des données
ak .
%
Exemples. 1. k∈N 1 est la suite (q + 1)q∈N, puisque, pour chaque q ∈ N,
%q
k=0 1 = q + 1. 8 9
% (−1)q +1
2. k∈N (−1) k
est la suite 2 , puisque, pour chaque q ∈ N,
q∈N
%q
k=0 (−1) = 1 si q est pair et 0 si q est impair.
k
250 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES

% 8 9 %q
q(q+1)
3. k∈N k est la suite 2 puisque, pour chaque q ∈ N, k=0 k =
q∈N
q(q+1)
2 . 8 9
% 1−aq+1
4. Pour chaque a ∈ C \ {1}, k∈N ak est la suite 1−a , puisque, pour
q∈N
%q q+1
chaque q ∈ N, k=0 ak = 1−a 1−a . On l’appelle la série géométrique de raison
a. 8 9
%
5. k∈N (k+1)(k+2)
1
est la suite q+1
q+2 puisque, pour chaque q ∈ N,
q∈N

q q 4 5 q q+1
$ 1 $ 1 1 $ 1 $ 1
= − = −
k=0
(k + 1)(k + 2) k=0
k + 1 k + 2 k=0
k + 1 k=1 k + 1

1 q+1
=1− = .
q+2 q+2

Définition. Si la suite (Aq )q∈N converge vers A ∈ Rp , dit que la série


%
k∈N ak converge
%∞
ou est convergente et a pour somme A. Dans ce cas, on
%
pose A = k=0 ak . Si la suite (Aq )q∈N diverge, on dit que la série k∈N ak
diverge ou est divergente.

Le mot “somme” n’a évidemment plus ici l’acception courante; c’est tout
simplement, si elle existe, la limite des sommes partielles Aq lorsque q tend
vers l’infini.
% % %
Exemples. Les séries k∈N 1, k∈N (−1)k et k∈N k des exemples 1 à 3 sont
%
divergentes. La série géométrique k∈N ak de l’exemple 4 converge et a pour
somme 1−a 1
lorsque |a| < 1, puisque, dans ce cas, aq → 0 lorsque q → ∞.
%
Nous verrons plus loin qu’elle diverge si |a| ≥ 1. La série k∈N (k+1)(k+2)1
de
l’exemple 5 converge et a pour somme 1.
Les remarques suivantes sont des conséquences immédiates de la définiti-
on.
%
Remarques. 1. Soit k∈N ak une série dans Rp et, pour m ≥ 1 entier fixé,
%
soit k∈N am+k la série obtenue à partir de la précédente en laissant tomber
ses m premiers termes a0 , a1 , . . . , am−1 . Comme les sommes partielles de
même indice de ces deux séries diffèrent toutes de la quantité constante
%
Am−1 = m−1 k=0 ak , il est clair que les deux séries convergent ou divergent
% %
simultanément. Pour m = 1, la série k∈N a1+k est souvent notée k∈N∗ ak .
% %
Ainsi, la série k∈N (k+1)(k+2)
1
s’écrit également k∈N∗ k(k+1)
1
.
%
2. Par définition, la série k∈N ak est la suite (Aq )q∈N. Réciproquement, à
%
toute suite (bk )k∈N dans Rp on peut associer la série télescopique k∈N (bk −
7.6. SÉRIES 251

bk−1 ) (avec la convention b−1 = 0) dont les sommes partielles


q
$ q
$ q−1
$
(bk − bk−1 ) = bk − bk = bq
k=0 k=0 k=0

redonnent les termes de la suite de départ.


Les règles de calcul des limites et les règles de l’algèbre élémentaire four-
nissent immédiatement les règles de calcul suivantes des séries dans Rp .
% %
Proposition. Soient k∈N ak et k∈N bk des séries dans Rp et soit c ∈ R.
% %
1. Si k∈N ak converge et a pour somme A et k∈N bk converge et a pour
%
somme B, alors k∈N (ak + bk ) converge et a pour somme A + B.
% %
2. Si k∈N ak converge et a pour somme A, alors k∈N cak converge et a
pour somme cA.
%
3. a converge et a pour somme A si et seulement si les p séries réelles
% k∈N k
k∈N k )j convergent%
(a et ont pour sommes respectives Aj (1 ≤ j ≤ p).
%
4. Si les séries réelles k∈N ak et k∈N bk convergent respectivement vers A
et B et sont telles que, pour chaque k ∈ N, on a ak ≤ bk , alors A ≤ B.
Ces règles de calcul généralisent aux séries des règles de calcul élémentai-
res pour les sommes finies. Certaines règles de calcul des sommes finies,
comme l’associativité ou la commutativité, ne s’étendent pas aux séries.
%
Ainsi, la série k∈N (−1)k est divergente (on l’a vu plus haut), alors que la
série qui s’en déduit en groupant deux à deux les termes consécutifs est la
série de termes nuls, qui est évidemment convergente. Nous donnerons plus
loin une classe de séries que l’on peut faire converger vers n’importe quel
réel en permutant les termes.
On dispose d’une condition nécessaire de convergence d’une série
facile à vérifier.
%
Proposition. Si la série k∈N ak converge, alors la suite de ses termes
(ak )k∈N a pour limite zéro.
%
Démonstration. Soit A la somme de la série k∈N ak . Pour chaque
q ∈ N∗ , on a
q
$ q−1
$
aq = ak − ak = Aq − Aq−1 ,
k=0 k=0

et dès lors
lim aq = lim Aq − lim Aq−1 = A − A = 0.
q→∞ q→∞ q→∞
252 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES

Cette condition n’est pas suffisante pour la convergence d’une série. Ain-
si, la suite des termes de la série
$ 1
1
k∈N (k + 1) 2
tend vers zéro mais, pour chaque q ∈ N, on a
q q
$ 1 $ 1 1
1 ≥ 1 = (q + 1) 2 ,
k=0 (k + 1) 2
k=0 (q + 1) 2

et la suite des sommes partielles diverge. La forme contraposée de cette


condition nécessaire fournit un moyen aisé de vérification de la divergence
de certaines séries. Ainsi, lorsque |a| ≥ 1, la série géométrique de raison a
diverge puisque la suite de ses termes (ak )k∈N ne converge pas vers zéro en
vertu du fait que (|ak |)k∈N = (|a|k )k∈N ne converge pas vers zéro.
Le critère de Cauchy de convergence d’une suite fournit immédiatement
le critère de Cauchy de convergence d’une série.
%
Proposition. La série dans Rp k∈N ak converge si et seulement si
# #
# $ #
# r #
(∀! > 0)(∃m ∈ N)(∀q ∈ N : q ≥ m)(∀r ∈ N : r > q ≥ m) : ## ak ## ≤ !.
#k=q+1 #
2
%
Démonstration. La convergence de la série k∈N ak équivaut, par défini-
tion, à la convergence de la suite (Aq )k∈N de ses sommes partielles. En
appliquant le critère de Cauchy à cette suite et en notant qu’on peut toujours,
sans perte de généralité, y supposer que r > q, on trouve que (Aq )k∈N
converge si et seulement si
(∀! > 0)(∃m ∈ N)(∀q ∈ N : q ≥ m)(∀r ∈ N : r > q ≥ m) : |Ar − Aq |2 ≤ !,
ce qui fournit la thèse puisque
r
$ q
$ r
$
Ar − Aq = ak − ak = ak .
k=0 k=0 k=q+1

% %
Exemples. 1. La série harmonique k∈N k+1 1
= k∈N∗ 1
k est divergente.
En effet, par le critère de Cauchy, il suffit de montrer que
r
$ 1
(∃! > 0)(∀m ∈ N)(∃q ∈ N : q ≥ m)(∃r ∈ N : r > q ≥ m) : > !.
k=q+1
k
7.7. SÉRIES ABSOLUMENT CONVERGENTES 253

En prenant, pour chaque m ∈ N∗ , q = m et r = 2m, on a


2m 2m
$ 1 $ 1 m 1 1
≥ = = > ,
k=m+1
k k=m+1 2m 2m 2 4

et la négation du critère de Cauchy est satisfaite pour ! = 14 .


% k % (−1)k−1
2. La série harmonique alternée k∈N (−1) k+1 = k∈N∗ k est conver-
gente. En effet, pour tout entier q > r, on a
# #
# $ #
# r (−1)k #
# #
# #
#k=q+1 k + 1 #
# #
#r−q−1 j ## r−q−1
# $ (−1) $ (−1)j
= ## #=
# .
# j=0 q + 1 + j # j=0
q+1+j

Dès lors, si r − q est impair, on a


# #
# r # (r−q−1)/2 4 5
# $ (−1)k #
#= 1 − 1 1 1
$
# − ≤ ,
# #
#k=q+1 k + 1 # q+1 l=0
q + 2l q + 2l + 1 q + 1

et, si r − q est pair, on a


# #
# r # (r−q−2)/2 4 5
# $ (−1)k #
#= 1 − 1 1 1 1
$
# − − ≤ .
# k + 1 # q + 1 q + 2l q + 2l + 1 r q + 1
#k=q+1 # l=0

Dès lors, si ! > 0 est donné, il suffit de prendre m ≥ 1


! − 1 pour que la
condition de Cauchy soit satisfaite.

7.7 Séries absolument convergentes


Le critère de Cauchy fournit une importante condition suffisante de con-
vergence d’une série dans Rp .
%
Proposition. Soit k∈N ak une série dans Rp . Si, pour j = 1, 2 ou ∞, la
% %
série à termes positifs k∈N |ak |j converge, alors k∈N ak converge et
#∞ #
#$ # ∞
$
# #
# ak # ≤ |ak |j .
# #
k=0 j k=0
254 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES

%
Démonstration. Il suffit de vérifier que k∈N ak vérifie le critère de
Cauchy. Pour tout r > q dans N, on a, si j = 1, 2 ou ∞, en vertu de
l’inégalité triangulaire,
# #
# r # r
# $ # $
# ak ## ≤ |aj |j .
#
#k=q+1 # k=q+1
j
%
D’autre part, en vertu du critère de Cauchy de convergence de k∈N |ak |j ,
si ! > 0 est donné, il existe m ∈ N tel que
r
$
(∀q ∈ N : q ≥ m)(∀r ∈ N : r > q ≥ m) : |ak |j ≤ !,
k=q+1

ce qui entraı̂ne aussitôt, par l’inégalité précédente, que


# #
# r #
# $ #
#
(∀q ∈ N : q ≥ m)(∀r ∈ N : r > q ≥ m) : # ak ## ≤ !.
#k=q+1 #
j
%
Donc k∈N ak converge et, en faisant tendre r vers l’infini dans l’inégalité
ci-dessus, on trouve facilement
#∞ #
#$ # ∞
$
# #
# ak # ≤ |ak |j .
# #
k=0 j k=0

%
Remarque. Nous montrerons plus loin que la série k∈N ak peut converger
%
sans que k∈N |ak |j converge. La condition ci-dessus n’est donc pas une
condition nécessaire de convergence. On est ainsi conduit à séparer les séries
%
convergentes en deux classes, selon que k∈N |ak |j converge ou diverge.
% %
Définition. Soit k∈N ak une série dans Rp. On dit que k∈N ak con-
%
verge absolument ou est absolument convergente si k∈N |ak |2 converge. Si
% % %
k∈N ak converge et que k∈N |ak |2 diverge, on dit que k∈N ak converge
non absolument ou converge simplement.
Remarque. En utilisant les inégalités entre normes et le critère de Cauchy,
on vérifie sans peine que la définition de convergence absolue est indépendan-
te du choix particulier de la norme | · |2 .
Exemples. 1. Toute série convergente à termes positifs est évidemment
absolument convergente.
7.7. SÉRIES ABSOLUMENT CONVERGENTES 255

% k
2. La série harmonique alternée k∈N (−1) k+1 est convergente mais la série de
%
ses valeurs absolues k∈N k+1 1
est la série harmonique qui est divergente. La
série harmonique alternée converge donc non absolument.
La convergence d’une série absolument convergente et la valeur de sa
somme ne dépendent pas de l’ordre dans lequel on prend les termes.
%
Proposition. Soit k∈N ak une série dans Rp absolument convergente et
%
soit b : N → N une bijection. Alors la série k∈N ab(k) converge vers la même
somme.
Démonstration. Soit ! > 0; par le critère de Cauchy appliqué à la série
%
k∈N |ak |2 , il existe m ∈ N tel que

r
$ !
(∀q ∈ N : q ≥ m)(∀r ∈ N : r > q ≥ m) : |ak |2 ≤ .
k=q+1
2

Choissons M ∈ N tel que

{0, 1, . . ., m} ⊂ {b(0), b(1), . . ., b(M )}

(par exemple M = max{b−1 (j) : 1 ≤ j ≤ m}). Pour tout entier q ≥ M,


l’expression
q
$ q
$
ak − ab(k)
k=0 k=0

ne contiendra pas les termes a0 , a1 , . . . , am (puisqu’ils sont communs aux


deux sommes), et dès lors, si q ≥ M ,
# q #
#$ q
$ # q
$ $ ! !
# #
# ak − ab(k) # ≤ |ak |2 + |ab(k) |2 ≤ + = !.
#
k=0 k=0
#
k=m+1 {1≤k≤q : b(k)>m}
2 2
2

On en déduit que & '


q
$
lim Aq − ab(k) = 0,
q→∞
k=0
% %∞
et donc que k∈N ab(k) converge vers k=0 ak .
La convergence absolue d’une série dans Rp revient à l’étude de la conver-
gence d’une série à termes positifs. On possède une intéressante condition
nécessaire et suffisante de convergence d’une série à termes posi-
tifs.
256 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES

% %
Proposition. Soit k∈N ak une série à termes positifs. Alors k∈N ak con-
verge si et seulement si la suite (Aq )q∈N de ses sommes partielles est majorée,
auquel cas

$
ak = sup Aq .
k=0 q∈N

Démonstration. Pour chaque q ∈ N, on a


Aq+1 = Aq + aq+1 ≥ Aq ,
ce qui montre que (Aq )q∈N est croissante. La thèse résulte alors de la con-
dition nécessaire et suffisante de convergence d’une suite croissante vue au
chapitre précédent.
Remarque. La Proposition précédente montre que si l’on regroupe d’une
façon arbitraire les termes d’une série absolument convergente, on obtient
encore une série absolument convergente.
% %
Exemple. La série k∈N (k+1) 1
2 = k∈N∗ k2 est convergente. En effet, pour
1

chaque q ∈ N, on a
q q q 4 5
$ 1 $ 1 $ 1 1 1
≤ 1 + = 1 + − = 1+1− ≤2
k=0
(k + 1) 2
k=1
k(k + 1) k=1
k k + 1 q +1
et la suite des sommes partielles est majorée par 2.
La condition précédente fournit une utile condition suffisante de con-
vergence absolue.
%
Proposition. Soit k∈N ak une série dans Rp . S’il existe un entier m ≥ 0
tel que, pour tout k ≥ m, on ait
1
|ak+1 |2 ≤ |ak |2 ,
2
%
alors k∈N ak converge absolument.
Démonstration. Si k ≥ 0, on a
4 5k
1 1
|am+k |2 ≤ |am+k−1 |2 ≤ . . . ≤ |am |2 ,
2 2
et dès lors, pour tout q ∈ N, on a
8 9q+1
q q 4 5k 1− 1
$ $ 1 2
|am+k |2 ≤ |am |2 = |am |2 ≤ 2|am |2 ,
k=0 k=0
2 1− 1
2
%
ce qui montre que la suite des sommes partielles de la série k∈N |am+k |2
%
est majorée. Donc k∈N am+k converge absolument et il en est de même de
%
k∈N ak .
7.8. SÉRIES NON ABSOLUMENT CONVERGENTES 257

% k
Exemple. Pour chaque z ∈ C, la série exponentielle de z k∈N zk! (ainsi
appelée parce que, pour z réel, ses sommes partielles sont les valeurs en z
des développements de Taylor en 0 d’ordres successifs de la fonction expo-
nentielle) converge absolument. En effet, pour tout k ∈ N, on a
# # # #
# z k+1 # |z|k+1 |z| |z|k 1 # zk #
# # # #
# #= = ≤ # #
# (k + 1)! # (k + 1)! k + 1 k! 2 # k! #

dès que k ≥ 2|z| − 1.

7.8 Séries non absolument convergentes


%
Soit k∈N ak une série réelle. Pour chaque k ∈ N, posons

|ak | + ak
k = max{ak , 0} =
a+ ,
2
|ak | − ak
a−
k = max{−ak , 0} = − min{ak , 0} = .
2

Il en résulte aussitôt que, pour chaque k ∈ N, on a ak = a+ k − ak et |ak | =

a+k + ak . La suite (ak )k∈N constitue donc la suite des termes positifs de
+

(ak )k∈N et la suite formée des a−


k non nuls constitue la suite des opposés des
termes strictement négatifs de (ak )k∈N . On a une intéressante condition
nécessaire de convergence non absolue d’une série réelle.
%
Proposition. Si la série réelle k∈N ak converge non absolument, alors
% + % −
k∈N ak et k∈N ak divergent.
%
Démonstration. Si, par exemple, k∈N a+ k converge (l’autre cas se trai-
%
tant de même), alors, comme ak = ak − ak , la série k∈N a−
− +
k converge et,
− %
puisque |ak | = a+
k + ak , il en sera de même de k∈N |ak |, en contradiction
avec l’hypothèse.
La propriété précédente permet de montrer qu’on peut faire diverger une
série réelle non absolument convergente en permutant l’ordre de ses termes.
%
Proposition. Si la série réelle k∈N ak converge non absolument, alors il
%
existe une permutation b : N → N telle que k∈N ab(k) diverge.
Démonstration. Par la Proposition précédente, les séries à termes posi-
% % −
tifs k∈N a+ k et k∈N ak divergent et dès lors, par la caractérisation donnée
% %q
avant, les suites de sommes partielles ( qk=0 a+ −
k )q∈N et ( k=0 ak )q∈N ne sont
258 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES

pas majorées. Effectuons la permutation suivante des termes ak de la série;


retenons d’abord, dans l’ordre des indices, les termes positifs jusqu’à ce que
leur somme soit supérieure ou égale à 1; prenons alors le premier terme
strictement négatif; retenons alors, toujours dans l’ordre des indices, suff-
isamment de termes positifs non encore utilisés pour que leur somme soit
supérieure ou égale à 2; prenons alors le deuxième termes strictement négatif,
et continuons de la sorte. On obtient ainsi une permutation b : N → N telle
%
que la suite des sommes partielles ( qk=0 ab(k) )q∈N contient une sous-suite
dont le ke terme est supérieur à k, ce qui entraı̂ne sa divergence.
Remarques. 1. Un raffinement du raisonnement précédent a été utilisé
dans un travail de Bernhard Riemann publié en 1868 pour montrer que, si
%
k∈N ak est une suite réelle qui converge non absolument,
%
alors, pour chaque
A ∈ R, il existe une permutation b : N → N telle que k∈N ab(k) converge
vers A. Il suffit de remplacer, dans la démonstration précédente, 1, 2, . . . par
A et de tenir compte du fait que la suite des ak converge vers zéro.
2. En rapprochant le résultat précédent de la propriété de conservation de
convergence d’une série absolument convergente après permutation de ses
termes, on voit qu’une série réelle est absolument convergente si et seulement
si toute série obtenue en permutant ses termes est convergente.

7.9 Série de Taylor


Soit f une fonction de R dans Rp et a ∈ dom f tel que f (k) (a) existe pour
chaque k ∈ N, et soit h ∈ R.
Définition. On appelle valeur en h de la série de Taylor de f en a, la série
dans Rp
$ f (k) (a)
hk ,
k∈N
k!
c’est-à-dire la série dont les sommes partielles sont les valeurs en h des
q
développements de Taylor Tf,a .
On a vu précédemment que cette série pouvait être convergente ou di-
vergente, et, dans le cas de la convergence, sa somme pouvait être égale
à f (a + h) ou différente de f (a + h). La formule du reste de Lagrange va
nous permettre de donner une condition suffisante de convergence de
la série de Taylor d’une fonction réelle vers cette fonction.
Proposition. Soit f une fonction de R dans R, a ∈ dom f et r > 0, C ≥
0, M ≥ 0 tels que f (k) (x) existe pour chaque k ∈ N et chaque x ∈ ]a − r, a + r[
7.9. SÉRIE DE TAYLOR 259

et y vérifie l’inégalité
|f (k) (x)| ≤ CM k .
Alors, pour chaque h ∈ ] − r, r[, la valeur en h de la série de Taylor de f en a
$ f (k) (a)
hk
k∈N
k!
% (k) (a)
converge vers f (a + h). En outre, k∈N hk f k! converge absolument.
Démonstration. Par la formule de Lagrange du reste du développement
de Taylor de f en a, on a, pour chaque q ∈ N et chaque h ∈ ] − r, r[,
q
$ f (k) (a) hq+1 f (q+1) (a + θq h)
f (a + h) − hk = ,
k=0
k! (q + 1)!
pour un certain θq ∈ ]0, 1[. En conséquence, on a
# #
# $q (k)
(a) ## (M |h|)q+1 (M r)q+1
# kf
#f (a + h) − h #≤C ≤C ,
#
k=0
k! # (q + 1)! (q + 1)!
% (M r)k
et, puisque la série exponentielle k∈N k! converge, la suite de ses termes
% kf
(k) (a)
tend vers zéro et k∈N h k! converge vers f (a + h). Pour montrer que
% (k) (a)
k∈N hk f k! converge absolument, il suffit de noter que, pour tout entier
r > q, on a
r r
$ |f (k) (a)| $ (M r)k
|h|k ≤C ,
k=q+1
k! k=q+1
k!
et que, si ! > 0 est donné, la convergence absolue de la série exponentielle en-
traı̂ne l’existence d’un entier positif m tel que le second membre soit inférieur
à ! si r > q ≥ m.
Exemple. Puisque, r > 0 étant donné, on a, pour tout x ∈ ] − r, r[ et tout
entier k ≥ 0,
(exp)(k) (x) = exp x ≤ exp r,
on peut prendre C = exp r et M = 0 dans la Proposition précédente et en
conclure que, pour tout h ∈ ] − r, r[,

$ hk
exp h = .
k=0
k!
Comme r est arbitraire, cette égalité entre la valeur en h de la fonction
exponentielle et la somme de la série exponentielle de h est valable pour
tout h ∈ R.
260 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES

Définition. Soit f une fonction de R dans R, a ∈ int dom f , tels que, pour
chaque k ∈ N, f (k) (a) existe. On dit que f est analytique en a s’il existe
r > 0 tel que ]a − r, a + r[ ⊂ dom f et tel que, pour tout h ∈ ] − r, r[, on ait

$ f (k) (a)
f (a + h) = hk .
k=0
k!

Ainsi, la fonction exponentielle est analytique en chaque point de R, mais


la fonction de Cauchy n’est pas analytique en 0.

7.10 Fonctions trigonométriques


Pour chaque x ∈ R, considérons les séries

$ (−1)k x2k+1

k∈N
(2k + 1)!

et
$ (−1)k x2k
.
k∈N
(2k)!

Puisque, pour tout k ∈ N, on a


# # # #
# (−1)k+1 x2(k+1)+1 # |x|2 # (−1)k x2k+1 #
# # # #
# #= # #,
# (2(k + 1) + 1)! # (2k + 2)(2k + 3) (2k + 1)! #
#

et # # # #
# (−1)k+1 x2(k+1) # |x|2 # (−1)k x2k #
# # # #
# #= # #,
# (2(k + 1)! # (2k + 1)(2k + 2) # (2k)! #
et qu’il existe un entier positif m tel que

|x|2 |x|2 1
≤ ≤
(2k + 2)(2k + 3) (2k + 1)(2k + 2) 2

pour tout entier k ≥ m, on peut appliquer une condition suffisante donnée


plus haut pour conclure à la convergence absolue de ses deux séries. On pose
alors

$ (−1)k x2k+1
sin x = ,
k=0
(2k + 1)!
7.10. FONCTIONS TRIGONOMÉTRIQUES 261

et

$ (−1)k x2k
cos x = ,
k=0
(2k)!
ce qui définit respectivement sur R l’application sinus et l’application cosi-
nus, qui sont les fonctions trigonométriques fondamentales. En particulier,
on a sin 0 = 0 et cos 0 = 1, et, pour chaque x ∈ R,

sin(−x) = − sin x, cos(−x) = cos x.

Proposition. Pour chaque x ∈ R, sin et cos sont dérivables en x et

(sin)$ (x) = cos x, (cos)$ (x) = − sin x.

Démonstration. Soit x ∈ R et q ∈ N; considérons, pour fixer les idées,


le cas de sin, l’autre se traitant de manière similaire. Posons, pour chaque
x ∈ R et chaque q ∈ N∗ ,
q
$ (−1)k x2k+1
Sq (x) = ,
k=0
(2k + 1)!

et
q
$ (−1)k x2k
Cq (x) = .
k=0
(2k)!
Un calcul simple montre que

Sq$ (x) = Cq (x), Sq$$(x) = −Sq−1 (x).

Par la formule de Lagrange du reste du développement de Taylor, il existe,


pour chaque h ∈ R, et chaque q ∈ N∗ , un θq ∈ ]0, 1[ tel que

h2 $$
Sq (x + h) − Sq (x) = hSq$ (x) + S (x + θq h),
2! q
et dès lors tel que, si h /= 0,

Sq (x + h) − Sq (x) h
= Cq (x) − Sq−1 (x + θq h).
h 2
On a
Sq (x + h) − Sq (x) sin(x + h) − sin x
lim = ,
q→∞ h h
262 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES

et
lim Cq (x) = cos x,
q→∞

ce qui entraı̂ne que, pour chaque h /= 0,


4 5
1 sin(x + h) − sin x cos x
L(x, h) = lim − Sq−1 (x + θq h) = − .
q→∞ 2 h2 h

D’autre part, pour chaque q ∈ N∗ et chaque h tel que |h| ≤ 1, on a

q−1 2q−1
$ (|x| + |h|)|2k+1 $ (|x| + 1)j
|Sq−1 (x + θq h)| ≤ ≤ ≤ exp(|x| + 1),
k=0
(2k + 1)! j=0
j!

et dès lors, pour ces mêmes valeurs de h, on a

|L(x, h)| ≤ exp(|x| + 1).

En conséquence, pour tout 0 < |h| ≤ 1, on a


# #
# sin(x + h) − sin x #
#
# − cos x # = |hL(x, h)| ≤ |h| exp(|x| + 1),
#
h

ce qui montre que


sin(x + h) − sin x
lim = cos x.
h→0 h

Les résultats suivants sont des conséquences de la proposition précédente.


Les deux premiers sont immédiats.
Corollaire. sin et cos sont continues en chaque x ∈ R.

Corollaire. Pour chaque x ∈ R et chaque entier k ≥ 1, sin(k) (x) et cos(k) (x)


existent et, si l ∈ N∗ ,

(sin)(2l)(x) = (−1)l sin x, (sin)(2l−1)(x) = (−1)l−1 cos x,

(cos)(2l)(x) = (−1)l cos x, (cos)(2l−1)(x) = (−1)l sin x,

et les fonctions sin et cos sont analytiques en chaque point de R.


7.10. FONCTIONS TRIGONOMÉTRIQUES 263

Corollaire. Pour tout x ∈ R, on a

sin2 x + cos2 x = 1.

Démonstration. Définissons l’application f de R dans R par f (x) =


sin x + cos2 x (avec sin2 x = (sin x)2 , cos2 x = (cos x)2 ). f est évidemment
2

dérivable en chaque point x ∈ R et

f $ (x) = 2 sin x cos x − 2 cos x sin x = 0.

En conséquence, f est constante sur R et, en particulier, pour tout x ∈ R,


on a
f (x) = f (0) = 1.

Ce Corollaire entraı̂ne en particulier que, pour tout x ∈ R, on a

| sin x| ≤ 1, | cos x| ≤ 1.

Corollaire. Pour tout x ∈ R et tout y ∈ R, on a

sin(x + y) = sin x cos y + cos x sin y,

cos(x + y) = cos x cos y − sin x sin y.


Démonstration. y ∈ R étant fixé, définissons l’application f de R dans
R par
f (x)
= [sin(x+y)−sin x cos y −cos x sin y]2 +[cos(x+y)−cos x cos y +sin x sin y]2 .
Cette fonction est évidemment dérivable en tout x ∈ R, et l’on a

f $ (x)

= 2[sin(x + y) − sin x cos y − cos x sin y][cos(x + y) − cos x cos y + sin x sin y]
+2[cos(x + y) − cos x cos y + sin x sin y][− sin(x + y) + sin x cos y + cos x sin y]
= 0.
Donc f est constante sur R, et en particulier, pour tout x ∈ R, on a

f (x) = f (−y) = (0 + sin y cos y − cos y sin y)2 + (1 − cos2 y − sin2 y) = 0,

ce qui entraı̂ne aussitôt la thèse.


264 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES

Ce dernier résultat est appelé la formule d’addition pour les fonc-


tions trigonométriques.
Etudions maintenant les zéros des fonctions trigonométriques.
Proposition. Il existe un réel π > 0 tel que
π
cos x = 0 ⇔ x = + kπ, (k ∈ Z),
2
sin x = 0 ⇔ x = kπ, (k ∈ Z),
sin(x + π) = − sin x, cos(x + π) = − cos x, (x ∈ R).
Démonstration. On sait que cos 0 = 1 > 0. D’autre part, en utilisant
la formule du reste de Lagrange du développement de Taylor, pour chaque
x ∈ R, il existe θ ∈ ]0, 1[ tel que

x 2 x4
cos x = 1 − + cos θx,
2! 4!
et dès lors
2 1
cos 2 = 1 − 2 + cos 2θ ≤ − < 0.
3 3
Le théorème de Bolzano entraı̂ne alors l’existence d’au moins un zéro dans
]0, 2[. L’ensemble Z de ces zéros est fermé, car si (ak )k∈N est une suite dans
Z convergeant vers a∗ ∈ R, alors a∗ ∈ [0, 2], et les relations

cos ak = 0, (k ∈ N),

et la continuité de cos entraı̂nent que cos a∗ = 0, et donc a∗ ∈ Z. Par


ailleurs, si a ∈ [0, 2] est un zéro de cos, alors (cos)$ (a) = − sin a = ±1,
et, par continuité, il existe δ(a) > 0 tel que (cos)$ (x) /= 0 pour tout x ∈
[a − δ(a), a + δ(a)]. En conséquence, cos est injective sur [a − δ(a), a + δ(a)]
et a est donc le seul zéro de cos dans [a − δ(a), a + δ(a)]. Le lemme de
Cousin
A j j B
appliqué à Z et à la jauge δ entraı̂ne l’existence d’une famille finie
(a , Z ) 1≤j≤m telle que

m
>
Z= Z j , aj ∈ Z j ⊂ [aj − δ(aj ), aj + δ(aj )], (1 ≤ j ≤ m).
j=1

Il en résulte que cos possède m zéros sur [0, 2]. Désignons par π2 le plus
petit zéro de cos appartenant à ]0, 2[. Comme cos 0 = 1 > 0, on a, par
le théorème de Bolzano, cos x > 0 pour tout x ∈ [0, π2 [, et donc pour tout
7.10. FONCTIONS TRIGONOMÉTRIQUES 265

x ∈ ] − π2 , π2 [ puisque cos(−x) = cos x. Il en résulte que la fonction sin est


strictement croissante sur ] − π2 , π2 [, et donc strictement négative sur ] − π2 , 0[
et strictement positive sur ]0, π2 [, puisque sin 0 = 0. En conséquence, comme
sin2 π2 = 1, on doit avoir
4 5
π π
− sin − = sin = 1.
2 2
La formule d’addition entraı̂ne alors que, pour tout x ∈ R, on a
4 5 4 5
π π
cos x + = − sin x, sin x + = cos x, (x ∈ R)
2 2

ce qui montre que cos x < 0 pour tout x ∈ ] π2 , 3π2 [, cos 2 = 0, sin x > 0 pour

tout x ∈ ] 2 , π[ et que sin π = 0. On déduit alors de la formule ci-dessus que,


π

pour tout x ∈ R, on a
4 5 4 5
π π π
sin(x + π) = sin x + + = cos x + = − sin x,
2 2 2
4 5 4 5
π π π
cos(x + π) = cos x + + = − sin x + = − cos x,
2 2 2
ce qui, combiné avec les propriétés de sin sur [−π, π] et de cos sur [− π2 , π2 ],
achève la démonstration.
Remarques. 1. Le résultat précédent entraı̂ne évidemment que, pour tout
x ∈ R, on a
sin(x + 2π) = sin x, cos(x + 2π) = cos x,
c’est-à-dire que les fonctions trigonométriques sont périodiques de période
2π.
2. Le réel π ainsi introduit se rencontre dans de très nombreuses questions de
mathématique. Johann Lambert a montré en 1767 que π était irrationnel,
Adrien-Marie Legendre a montré en 1794 que π 2 l’était aussi. Il a fallu at-
tendre 1882 pour que Ferdinand Lindemann prouve que π était un nombre
transcendant, c’est-à-dire qu’il n’était pas racine d’une équation algébrique à
coefficients entiers, prouvant ainsi l’impossibilité de la quadrature du cercle.
3. Le calcul des décimales de π peut servir de mesure du progrès des
mathématiques et de la science du calcul. Le Livre des Rois de l’Ancien
Testament fournit π = 3, Archimède, au 3e siècle avant J.C. fournit 3
décimales exactes
π = 3, 141 . . ..
266 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES

En 1593, le record était détenu par un professeur de l’Université de Louvain,


Adriaen van Roomen ou Romain, avec 15 décimales exactes. En 1873-74,
William Shanks calcula 707 décimales de π et il fallut attendre 1945 pour
que D.F. Ferguson montre que le calcul de Shanks était faux à partir de
la 528e décimale. On entre alors dans l’ère du calcul des décimales de π à
l’aide des ordinateurs. On en connaı̂t actuellement plus d’un milliard (la
milliardième décimale de π est un 9). Nous nous contenterons ici de donner
l’approximation plus modeste

π = 3, 14159265358979323846264338327950288419716939937510 . . ..

Comme sin est strictement croissante sur l’intervalle ] − π2 , π2 [, avec pour


limites respectives −1 et 1 lorsque x tend vers − π2 et vers π2 , elle possède une
fonction réciproque, appelée l’arc sinus, notée arcsin et définie sur ] − 1, 1[.
Par les résultats sur les fonctions monotones, arc sin sera dérivable en chaque
point x ∈ ] − 1, 1[, et
1 1
(arcsin)$ (x) = =
(sin)$ (arcsin x) cos(arcsin x)
1 1
= = .
(1 − sin (arcsin x))
2 1/2 (1 − x2 )1/2
De même, cos étant strictement décroissante sur l’intervalle ]0, π[, avec pour
limites respectives 1 et −1 lorsque x tend vers 0 et vers π, elle possède une
fonction réciproque, appelée l’arc cosinus, notée arcos et définie sur ] − 1, 1[.
Elle est dérivable en chaque x ∈ ] − 1, 1[, et
1 1
(arcos)$ (x) = =−
(cos)$ (arcos x) sin(arcos x)
1 1
=− =− .
(1 − cos2 (arcos x))1/2 (1 − x2 )1/2
Comme, pour tout x ∈ ] − 1, 1[, on a

(arcsin)$ (x) + (arcos)$ (x) = 0,

et que
π
arcsin 0 + arcos 0 = ,
2
on aura, pour tout x ∈ ] − 1, 1[,
π
arcsin x + arcos x = .
2
7.11. EXPONENTIELLES IMAGINAIRES ET COMPLEXES 267

A partir des fonctions sinus et cosinus, on définit la fonction tangente par


sin x
tg x = .
cos x
En conséquence,
π
dom tg = {x ∈ R : x /= + kπ, (k ∈ Z)},
2
et, pour chaque x ∈ dom tg, on a
1
tg (x + π) = tg x, (tg)$ (x) = ,
cos2 x
Il en résulte en particulier que tg est strictement croissante sur ] − π2 , π2 [,
avec comme limites respectives −∞ et +∞ lorsque x tend vers − π2 et vers π2 .
On peut donc définir sa fonction réciproque, appelée l’arc tangente et notée
arctg, sur R, et l’on aura
1
(arctg)$ (x) = = cos2 (arctg x)
(tg)$ (arctg x)
1
,=
1 + x2
puisque, pour tout x ∈ dom tg, on a
cos2 x 1
cos2 x = = .
sin x + cos x
2 2 1 + tg 2 x

7.11 Exponentielles imaginaires et complexes


Il existe une relation remarquable entre les fonctions trigonométriques et la
série exponentielle.
Proposition. Pour tout x ∈ R, on a

$ (ix)k
= cos x + i sin x.
k=0
k!

Démonstration. On a, en effet, pour tout x ∈ R, puisque i2k = (−1)k


et que l’on peut permuter l’ordre des termes dans les séries absolument
convergentes,
∞ ∞ ∞
$ (ix)2j $ (ix)2j+1 $ (ix)k
cos x + i sin x = + = .
j=0
(2j)! j=0
(2j + 1)! k=0
k!
268 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES

On est ainsi conduit à définir l’application exponentielle imaginaire de R


dans C par

$ (ix)k
exp ix = .
k=0
k!
Elle vérifie donc la relation

exp ix = cos x + i sin x,

pour tout x ∈ R. En particulier, on a, pour tout x ∈ R,

| exp ix| = (cos2 x + sin2 x)1/2 = 1.

La fonction exponentielle imaginaire vérifie une formule d’addition sem-


blable à celle de l’exponentielle réelle.
Proposition. Pour tout x ∈ R et tout y ∈ R, on a

exp i(x + y) = (exp ix).(exp iy).

Démonstration. On a, en utilisant la relation précédente et la formule


d’addition des fonctions trigonométriques,

(exp ix).(exp iy) = (cos x + i sin x)(cos y + i sin y)

= cos x cos y − sin x sin y + i(sin x cos y + cos x sin y)


= cos(x + y) + i sin(x + y) = exp i(x + y).

En particulier, on a, pour tout entier n ≥ 1 et tout x ∈ R,

exp(inx) = (exp ix)n ,

c’est-à-dire
cos nx + i sin nx = (cos x + i sin x)n ,
C’est la formule de Moivre qui permet, en calculant le second membre
par la formule du binôme de Newton et en égalant les parties réelles et
imaginaires des deux membres, d’exprimer cos nx et sin nx en termes des
puissances de sin x et cos x de degré inférieur ou égal à n.
L’exponentielle imaginaire possède des propriétés de dérivation intéres-
santes.
7.11. EXPONENTIELLES IMAGINAIRES ET COMPLEXES 269

Proposition. exp(i·) est dérivable en chaque x ∈ R et

D(exp ix) = i exp ix.

Démonstration. On a

D(exp ix) = D(cos x+i sin x) = − sin x+i cos x = i(cos x+i sin x) = i exp ix.

On peut unifier la théorie des fonctions exponentielles et trigonométri-


ques en introduisant de nouvelles fonctions élémentaires de R dans C, les
exponentielles complexes.
Définition. Soit a = b + ic ∈ C. L’exponentielle complexe exp(a·) est la
fonction de R dans C définie, pour chaque x ∈ R par la formule

exp ax = (exp bx).(exp icx) = (exp bx).(cos cx + i sin cx).

Si a = b est réel, on retrouve l’exponentielle réelle exp(b·) et si a = ic


est imaginaire pur, on retrouve le composé de la fonction réelle x 2→ cx avec
la fonction exponentielle imaginaire. Nous allons voir que l’exponentielle
complexe conserve les propriétés essentielles de l’exponentielle réelle.
Proposition. Pour chaque x ∈ R et chaque entier k ≥ 1, exp(a·) est k-fois
dérivable en x et l’on a

D k [exp(ax)] = ak exp ax.

En outre, pour tout x ∈ R, on a

| exp ax| = exp bx,

et en particulier exp ax /= 0 quel que soit x ∈ R. De plus, pour chaque x ∈ R


et chaque y ∈ R, on a

exp a(x + y) = (exp ax).(exp ay),

ce qui entraı̂ne en particulier que, pour chaque x ∈ R, on a

exp(−ax) = (exp ax)−1 .

Enfin, pour chaque x ∈ R, on a

exp ax = exp āx.


270 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES

Démonstration. Le fait que exp(a·) soit k fois dérivable en chaque x ∈


R résulte de ce que les fonctions élémentaires réelles exp, cos et sin sont
indéfiniment dérivables et des règles de dérivabilité de la somme, du produit
et du composé de deux fonctions. D’ailleurs, on a, pour chaque x ∈ R,

D[exp(ax)] =

(b exp bx). exp icx + (exp bx).(ic) exp icx =


(b + ic)(exp bx)(exp icx) = a exp ax,
et la formule pour les dérivées d’ordre supérieur s’en déduit aussitôt de
proche en proche. En outre, on a

| exp ax| = | exp bx|| exp icx| = exp bx,

exp a(x + y) = [exp b(x + y)].[exp ic(x + y)] =


(exp bx).(exp by).[(exp(icx)).(exp(icy))]
= (exp bx).(exp(icx))(exp by).(exp(icy)) = (exp ax).(exp ay),
(exp ax).[exp(−ax)] = exp a(x − x) = exp 0 = 1.
Enfin,

exp ax = (exp bx).(cos cx + i sin cx) = (exp bx).(cos cx − i sin cx) = exp āx.

7.12 Dérivées partielles d’ordre supérieur


Soit f une fonction de Rn dans Rp dérivable en au moins un point intérieur
à dom f. On peut alors lui associer la fonction df de Rn dans l’ensemble
L(Rn , Rp) des applications linéaires de Rn dans Rp de domaine

dom df = {x ∈ int dom f : f est dérivable en x},

définie par df (x) = fx$ . Cette fonction s’appelle la fonction différentielle ou la


fonction dérivée totale de f et l’on voit que ce n’est plus une fonction de Rn
dans Rp mais bien une fonction de Rn dans L(Rn , Rp). Nous ne considérerons
pas ici le problème de la continuité et de la dérivabilité d’une telle fonction.
Par contre, si j est un entier compris entre 1 et n et si la fonction f de
Rn dans Rp est telle que la dérivée partielle Dj f (x) existe en au moins un
7.12. DÉRIVÉES PARTIELLES D’ORDRE SUPÉRIEUR 271

point x ∈ Rn , on peut lui associer, comme nous l’avons déjà fait à plusieurs
reprises, la fonction

Dj f : Rn → Rp, x 2→ Dj f (x),

de domaine
dom Dj f = {x ∈ dom f : Dj f (x) existe}.
∂f
On la note également fj$ ou ∂x j
ou ∂j f. Si k est un entier compris entre 1
et n et si la fonction Dj f possède elle-même en x ∈ dom Dj f une dérivée
partielle Dk (Dj f )(x) par rapport à la ke variable, on peut définir la fonction
dérivée partielle seconde de f par rapport à la j e et puis la ke variable par
2
Djk f : x 2→ Djk
2
f (x) = Dk (Dj f )(x).

Son domaine est donc l’ensemble des points du domaine de Dj f en lesquels


cette fonction possède une dérivée partielle par rapport à la ke variable.
Comme Djk 2 f , que l’on note aussi f $$ ou ∂ 2 f
∂xk ∂xj ou ∂jk f est elle-même une
2
jk
fonction de Rn dans Rp , on peut évidemment continuer le processus et con-
sidérer, lorsqu’elle existe, la fonction dérivée troisième Dlkj3 f de f par rap-

port à la j , puis la k , et puis la l variable, et ainsi de suite, et arriver ainsi,


e e e

si m est un entier strictement positif et si j1 , j2 , . . ., jm sont des entiers com-


pris entre 1 et n à la fonction dérivée me de f par rapport successivement
aux j1e , j2e , . . . , jm
e
variables.
Exemples. 1. Soit f l’application de R2 dans R définie par

f (x) = f (x1 , x2 ) = x21 x2 .

On a évidemment, pour chaque x = (x1 , x2 ) ∈ R2 ,

D1 f (x) = 2x1 x2 , D2 f (x) = x21 ,

et dès lors
2
D11 f (x) = 2x2 , D12
2
f (x) = 2x1 , D21
2
f (x) = 2x1 , D22
2
f (x) = 0,
3
D111 f (x) = 0, D112
3
f (x) = 2, D121
3
f (x) = 2, D122
3
f (x) = 0,
3
D211 f (x) = 2, D212
3
f (x) = 0, D221
3
f (x) = 0, D222
3
f (x) = 0,
et dès lors toutes les fonctions dérivées partielles d’ordre supérieur ou égal à
quatre seront nulles. On constate sur cet exemple que
2
D12 f = D21
2 3
f, D112 f = D121
3
f = D211
3
f,
272 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES

3
D122 f = D212
3
f = D221
3
f.
2. Soit f l’application de R2 dans R définie par f (0, 0) = 0 et

x21 − x22
f (x1 , x2 ) = x1 x2 si (x1 , x2 ) /= (0, 0).
x21 + x22

On calcule aisément que

D1 f (0, x2 ) = −x2 si x2 /= 0, D1 f (0, 0) = 0,

D2 f (x1 , 0) = x1 si x1 /= 0, D2 f (0, 0) = 0,
et dès lors
D1 f (0, h) − D1 f (0, 0) −h
2
D12 f (0, 0) = lim = lim = −1,
h→0 h h→0 h

D2 f (h, 0) − D2 f (0, 0) h
2
D21 f (0, 0) = lim = lim = 1.
h→0 h h→0 h

On constate dans ce cas que D12 2 f (0, 0) /= D 2 f (0, 0).


21
Ce dernier exemple montre que l’existence de D12 2
f (a) et D21
2
f (a) n’en-
traı̂ne pas leur égalité. Notons que

D1 f (a1 , a2 + h2 ) − D1 f (a1 , a2 )
2
D12 f (a) = lim
h2 →0 h2
2
1 f (a1 + h1 , a2 + h2 ) − f (a1 , a2 + h2 )
= lim lim
h2 →0 h2 h1 →0 h1
3
f (a1 + h1 , a2 ) − f (a1 , a2 )
− lim =
h1 →0 h1
2 3
f (a1 + h1 , a2 + h2 ) − f (a1 , a2 + h2 ) − f (a1 + h1 , a2 ) + f (a1 , a2 )
lim lim
h2 →0 h1 →0 h1 h2
et que, de même,
2
D21 f (a) =
2 3
f (a1 + h1 , a2 + h2 ) − f (a1 + h1 , a2 ) − f (a1 , a2 + h2 ) + f (a1 , a2 )
lim lim
h1 →0 h2 →0 h1 h2
L’égalité des deux expressions revient donc à la possibilité de permuter
l’ordre des limites d’une même fonction de deux variables, et cette permuta-
tion n’est assurée que si certaines conditions supplémentaires sont remplies.
Un premier résultat dans cette direction est le théorème de Schwarz.
7.12. DÉRIVÉES PARTIELLES D’ORDRE SUPÉRIEUR 273

Théorème. Soit f une fonction de Rn dans Rp , 1 ≤ i /= j ≤ n des entiers,


et V un voisinage de a ∈ Rn tels que les fonctions Di f, Dj f, Dij 2 f et D 2 f
ji
2 2
soient définies sur V . Si Dij f et Dji f sont continues en a, alors
2
Dij f (a) = Dji
2
f (a).

Démonstration. En passant si nécessaire aux composantes de f, il suffit


de démontrer le résultat lorsque p = 1. La thèse revient à démontrer que,
pour tout ! > 0, on a
2
|Dij f (a) − Dji
2
f (a)| ≤ !.

Soit donc ! > 0; par hypothèse, il existe δ > 0 tel que B2 [a; δ] ⊂ V et tel
que, pour tout h ∈ R2 vérifiant |h|2 ≤ δ, on ait
! !
2
|Dij f (a + h) − Dij
2
f (a)| ≤ , |Dji
2
f (a + h) − Dji
2
f (a)| ≤ .
2 2
Si h = hi ei + hj ej ∈ B2 [δ], avec h1 /= 0 et h2 /= 0, on a, en appliquant deux
fois le théorème de Lagrange,

f (a + hi ei + hj ej ) − f (a + hi ei ) − f (a + hj ej ) + f (a)

= [f (a + hi ei + hj ej ) − f (a + hi ei )] − [f (a + hj ej ) − f (a)]
= hi Di [f (a + θi hi ei + hj ej ) − f (a + θi hi ei )]
= hi [Di f (a + θi hi ei + hj ej ) − Dif (a + θi hi ei )]
= hi hj Dij
2
f (a + θi hi ei + θj hj ej ),
pour un certain θi ∈ ]0, 1[ et un certain θj ∈ ]0, 1[. De même, en groupant les
termes différemment,

f (a + hi ei + hj ej ) − f (a + hi ei ) − f (a + hj ej ) + f (a)

= [f (a + hi ei + hj ej ) − f (a + hj ej )] − [f (a + hi ei ) − f (a)]
= hj Dj [f (a + hi ei + θj$ hj ej ) − f (a + θj$ hj ej )]
= hj [Dj f (a + hi ei + θj$ hj ej ) − Dj f (a + θj$ hj ej )]
= hj hi Dji
2
f (a + θi$ hi ei + θj$ hj ej ),
pour un certain θi$ ∈ ]0, 1[ et un certain θj$ ∈ ]0, 1[. Dès lors,
2
Dij f (a + θi hi ei + θj hj ej )
274 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES

f (a + hi ei + hj ej ) − f (a + hi ei ) − f (a + hj ej ) + f (a)
=
hi hj
= Dji
2
f (a + θi$ hi ei + θj$ hj ej ),
avec
θi hi ei + θj hj ej ∈ B2 [δ], θi$ hi ei + θj$ hj ej ∈ B2 [δ].
En conséquence, on a
2
|Dij f (a) − Dji
2
f (a)|

= |Dij
2
f (a) − Dij
2
f (a + θi hi ei + θj hj ej )

+Dji
2
f (a + θi$ hi ei + θj$ hj ej ) − Dji
2
f (a)|
2
≤ |Dij f (a) − Dij
2
f (a + θi hi ei + θj hj ej )|

+|Dji
2
f (a + θi$ hi ei + θj$ hj ej ) − Dji
2
f (a)|
! !
≤ + = !.
2 2

Une autre condition suffisante pour que Dij


2
f (a) = Dji
2
f (a) est donnée
par le théorème de Young.
Théorème. Soit f une fonction de Rn dans Rp , 1 ≤ i /= j ≤ n des entiers
et V un voisinage de a ∈ Rn tels que les fonctions Di f et Dj f soient définies
sur V et (totalement) dérivables en a. Alors
2
Dij f (a) = Dji
2
f (a).

Démonstration. Comme dans la démonstration du théorème de Schwarz,


on introduit la fonction F de R2 dans Rp par

F (hi , hj ) = f (a + hi ei + hj ej ) − f (a + hi ei ) − f (a + hj ej ) + f (a).

L’idée consiste ici à montrer que

F (h, h)
2
Dij f (a) = lim = Dji
2
f (a).
h→0 h2
Soit ! > 0; par hypothèse, il existe δ > 0 tel que B2 [a; δ] ⊂ V et tel que

|Dif (a + hi ei + hj ej ) − Di f (a) − hi Dii


2
f (a) − hj Dij
2
f (a)|2
7.12. DÉRIVÉES PARTIELLES D’ORDRE SUPÉRIEUR 275

!
≤ |(hi , hj )|2 ,
2
|Dj f (a + hi ei + hj ej ) − Dj f (a) − hi Dji
2
f (a) − hj Djj
2
f (a)|2
!
≤ |(hi , hj )|2 ,
2
lorsque |(hi, hj )|2 ≤ δ. Si nous définissons la fonction G de R dans Rp par
G(u) = f (a + uei + hj ej ) − f (a + uej ) − uhj Dij
2
f (a),
nous pouvons lui appliquer l’inégalité de la moyenne entre 0 et h1 , qui fournit
l’existence d’un θi ∈ ]0, 1[ tel que
|G(hi) − G(0)|2 ≤ |hi ||G$ (θi hi )|2 ,
c’est-à-dire, en explicitant et en utilisant la première inégalité ci-dessus,
|F (hi , hj ) − hi hj Dij
2
f (a)|2
≤ |hi ||Dif (a + θi hi ei + hj ej ) − Di f (a + θi hi ei ) − hj Dij
2
f (a)|2
≤ |hi ||Dif (a + θi hi + hj ej ) − Di f (a) − θi hi Dii
2
f (a) − hj Dij
2
f (a)|2
+|hi ||Dif (a + θi hi ei ) − Di f (a) − θi hi Dii
2
f (a)|2
! !
≤ |hi ||(θihi , hj )|2 + |hi ||(θi hi , 0)|2
2 2
≤ !|(hi , hj )|22 .
De même, en définissant la fonction H de R dans Rp par
H(v) = f (a + hi ei + vej ) − f (a + vej ) − hi vDji
2
f (a),
en lui appliquant l’inégalité de la moyenne entre 0 et hj , en explicitant et en
utilisant la deuxième inégalité ci-dessus, on obtient
|F (hi , hj ) − hj hi Dji
2
f (a)|2 ≤ !|(hi , hj )|22 ,
lorsque |(hi , hj )|2 ≤ δ. Dès lors, si h ∈ R est tel que 0 < |h| ≤ δ
21/2
, on aura
0 < |(h, h)|2 ≤ δ, et dès lors
# #
# F (h, h) #
#
# h2 − D 2
ij f (a) # ≤ !,
#
2
# #
# F (h, h) #
# 2
− Dji f (a)## ≤ !,
# h2
2
c’est-à-dire
F (h, h)
2
Dij f (a) = lim = Dji
2
f (a).
h→0 h2
276 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES

Introduisons maintenant une classe importante de fonctions de Rn dans


Rp .
Définition. Soit f une fonction de Rn dans Rp , E un ouvert non vide de
Rn et k ≥ 1 un entier. On dira que f est de classe C k sur E, et l’on écrira
f ∈ C k (E; Rp), si f est continue sur E et si toutes les fonctions dérivées
partielles de f jusqu’à l’ordre k

Di1 f, Di21 i2 f, . . . , Dik1i2 ...ik f, (1 ≤ i1 , . . . , ik ≤ n)

sont définies et continues sur E.


On notera que si f ∈ C k (E; Rp), alors, pour chaque 1 ≤ j ≤ k, on a
évidemment f ∈ C j (E; Rp); en outre, par la condition suffisante de dérivabi-
lité en termes de la continuité des dérivées partielles, la fonction f et toutes
les dérivées partielles de f jusqu’à l’ordre k − 1 seront dérivables en chaque
point de E; enfin, pour chaque 1 ≤ j ≤ k, chaque dérivée partielle d’ordre j
de f sera de classe C k−j sur E.
On étend comme suit cette notion au cas où E n’est pas nécessairement
ouvert.
Définition. Soit f une fonction de Rn dans Rp, E une partie non vide de
Rn et k ≥ 1 un entier. On dira que f est de classe C k sur E, et l’on écrira
f ∈ C k (E; Rp), s’il existe un ouvert Ẽ ⊃ E et une fonction f˜ ∈ C k (Ẽ; Rp)
telle que f˜|E = f.
Lorsque f ∈ C k (E; Rp) pour tout entier k ≥ 1, on dit que f est indéfini-
ment continûment dérivable sur E, et l’on écrit f ∈ C ∞ (E; Rp). Par exten-
sion, si f est continue sur E, on dira qu’elle est de classe C 0 sur E, on écrira
f ∈ C 0 (E; Rp), et on posera Dj0 f (a) = f (a).
Le théorème de Schwarz ou le théorème de Young entraı̂nent, pour une
fonction de classe C k (k ≥ 2), l’important théorème d’interversion des
dérivées partielles.
Théorème. Soit k ≥ 2 un entier et f une fonction de Rn dans Rp de classe
C k sur un voisinage ouvert V de a ∈ Rn . Alors, pour tout 1 ≤ i1 , i2 , . . . , ik ≤
n et tout entier 1 ≤ j ≤ k − 1, on a

Dik1 i2 ...ij ij+1 ...ik f (a) = Dik1 i2 ...ij+1 ij ...ik f (a).

Démonstration. Elle se fait par récurrence sur l’ordre de dérivation. Le


résultat est vrai pour k = 2 en vertu du théorème de Schwarz (ou de Young).
Supposons maintenant le résultat vrai pour les fonctions de classe l − 1 sur
7.13. DÉVELOPPEMENT DE TAYLOR 277

V , avec 3 ≤ l ≤ k − 1, et montrons qu’il est vrai pour celles de classe l sur


V . On a, si 1 ≤ j ≤ l − 2,

Dil1 ...ij ij+1 ...il f (a) = Dil (Dil−1


1 ...ij ij+1 ...il−1
f )(a)

= Dil (Dil−1
1 ...ij+1 ij ...il−1
f )(a)

= Dil1 ...ij+1 ij ...il f (a),


et, si j = l − 1,

Dil1 ...il−1 il f (a) = Di2l−1 il (Dil−2


1 ...il−2
f )(a)

= Di2l il−1 (Dil−2


1 ...il−2
f )(a) = Dil1...il−2 il il−1 f (a).

En vertu de ce résultat, si k ≥ 1 est un entier, f est une fonction de


classe C k sur l’ouvert E ⊂ Rn , a ∈ E, et si α = (α1 , α2 , . . . , αn ) ∈ Nn est tel
que
|α|1 = α1 + α2 + . . . + αn ≤ k,
on posera, sans ambiguı̈té,

Dα f (a) = ∂ αf (a) = D1α1 D2α2 . . . Dnαn f (a).

Cette notation exprime que l’on dérive f α1 fois par rapport à x1 , α2 fois
par rapport à x2 , . . . αn fois par rapport à xn .

7.13 Développement de Taylor


On peut étendre la notion de développement de Taylor aux fonctions de Rn
dans Rp . En passant si nécessaire aux composantes de la fonction, on peut
toujours, sans perte de généralité, supposer que p = 1, ce que nous ferons.
Nous aurons besoin de la conséquence élémentaire suivante du théorème
de dérivation des fonctions composées.
Lemme. Soit r > 0, a ∈ Rn et ϕ une fonction de Rn dans R dérivable en
chaque point de B2 (a; r). Si, pour chaque h ∈ Rn tel que 0 < |h|2 < r, on
définit l’application g par g : R → Rn , t 2→ a + th, alors ϕ ◦ g est dérivable
en chaque t ∈ [0, 1], et
n
$
(ϕ ◦ g)$ (t) = hj (Dj ϕ ◦ g)(t).
j=1
278 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES

Démonstration. Par le théorème de dérivation des fonctions composées


et le lien entre dérivées partielles et dérivée totale ϕ ◦ g est dérivable en
t ∈ [0, 1], et
(ϕ ◦ g)$ (t) = (ϕ ◦ g)$t(1) = [ϕ$g(t) ◦ gt$ ](1)
n
$
= ϕg(t)(g $ (t)) = ϕg(t)(h) = hj (Dj ϕ ◦ g)(t).
j=1

Nous pouvons maintenant énoncer et démontrer le théorème du déve-


loppement de Taylor d’ordre m pour une fonction de classe C m .
Théorème. Soit m ≥ 1 un entier et f une fonction de Rn dans R de classe
C m+1 sur un voisinage ouvert V de a ∈ Rn et soit h ∈ Rn tel que, pour tout
t ∈ [0, 1], a + th ∈ V. Alors il existe θ ∈ ]0, 1[ tel que
n n $ n
$ 1 $
f (a + h) = f (a) + hj1 Dj1 f (a) + hj hj D 2 f (a)
j1 =1
2! j =1 j =1 1 2 j1 j2
1 2

n n n
1 $ $ $
+...+ ... hj1 hj2 . . . hjm Djm1 j2 ...jm f (a)
m! j =1 j =1 j =1
1 2 m

n n n
1 $ $ $
+ ... hj1 hj2 . . . hjm+1 Djm+1 f (a + θh).
(m + 1)! j 1 j2 ...jm+1
1 =1 j2 =1 jm+1 =1

Démonstration. Si l’on définit l’application g de R dans Rn par g(t) =


a + th, alors f (a + th) = (f ◦ g)(t) est dérivable en chaque point de [0, 1], et,
par le lemme,
n
$
(f ◦ g)$ (t) = hj1 (Dj1 f ◦ g)(t).
j1 =1

Comme les fonctions Dj1 f sont dérivables en chaque point de V , on peut


aussi leur appliquer le lemme, et dès lors (f ◦ g)$ est dérivable en chaque
point de [0, 1], et
n
$
(f ◦ g)$$(t) = hj1 (Dj1 f ◦ g)$(t)
j1 =1

n
$ n
$ n $
$ n
= hj1 hj2 (Dj21 j2 f ◦ g)(t) = hj1 hj2 (Dj21 j2 f ◦ g)(t).
j1 =1 j2 =1 j1 =1 j2 =1
7.13. DÉVELOPPEMENT DE TAYLOR 279

En continuant de la sorte, on trouve que, pour chaque 1 ≤ k ≤ m + 1, f ◦ g


est k-fois dérivable sur [0, 1] et
n $
$ n n
$
(f ◦ g)(k)(t) = ... hj1 hj2 . . . hjk (Djk1 j2 ...jk f ◦ g)(t)
j1 =1 j2 =1 jk =1

n $
$ n n
$
= ... hj1 hj2 . . . hjk Djk1 j2 ...jk f (a + th).
j1 =1 j2 =1 jk =1

En conséquence, on peut appliquer à f ◦ g la formule de Lagrange du reste


du développement de Taylor d’ordre m d’une fonction d’une variable, ce qui
donne
f (a + h) = (f ◦ g)(1)
m
$ 1 1
= (f ◦ g)(0) + (f ◦ g)k (0) + (f ◦ g)(m+1)(θ),
k=1
m! (m + 1)!

pour un certain θ ∈ ]0, 1[, et le résultat se déduit du calcul des (f ◦ g)(k)(t).

Ce résultat conduit naturellement à la définition suivante.


Définition. Soit f une fonction de Rn dans R , a ∈ int dom f et m ≥ 1 un
entier tel que toutes les dérivées partielles de f jusqu’à l’ordre m existent
en a. On appelle développement de Taylor d’ordre m de f au point a le
m défini par
polynôme de degré m Tf,a
n n $ n
$ 1 $
m
Tf,a (h) = f (a) + hj1 Dj1 f (a) + hj hj D 2 f (a)
j1 =1
2! j =1 j =1 1 2 j1 j2
1 2

n n n
1 $ $ $
+...+ ... hj1 hj2 . . . hjm Djm1 j2 ...jm f (a)
m! j =1 j =1 j =1
1 2 m
 
m n n
$ 1 $ $
= f (a) +  ... hj1 . . . hjk Djk1 ...jk f (a) .
k=1
k! j =1 j =1
1 k

La fonction Rm
f,a
n
de R dans R définie par

f,a (h) = f (a + h) − Tf,a (h),


Rm m

s’appelle le reste du développement de Taylor d’ordre m de f en a et elle a


pour domaine dom f − a.
280 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES

7.14 Conditions d’existence d’extrémants


Le développement de Taylor d’une fonction de plusieurs variables permet de
donner d’intéressantes conditions nécessaires ou suffisantes d’existence d’un
extrémant local libre pour une fonction de classe C 2 au moins au voisinage
de l’extrémant.
Soit f une fonction de Rn dans R de classe C 2 sur un voisinage ouvert
V d’un point a ∈ Rn . Par le théorème de développement de Taylor de f en
a, si h ∈ Rn est tel que a + th ∈ V pour tout t ∈ [0, 1], il existera θ ∈ ]0, 1[
tel que
n n $ n
$ 1$
f (a + h) = f (a) + hj Dj f (a) + 2
hj hk Djk f (a + θh)
j=1
2 j=1 k=1
n
$
= f (a) + hj Dj f (a) + g(a + θh; h),
j=1

si nous définissons, sur V × Rn , la fonction g par


n $ n
1$
g(x; h) = 2
hj hk Djk f (x).
2 j=1 k=1

On l’appelle la forme hessienne de f en x; la matrice correspondante


8 9
2
Djk f (x)
1≤j,k≤n

est appelée la matrice hessienne de f en x. On voit que, pour x ∈ V fixé,


g(x; ·) est une forme quadratique. Rappelons qu’une telle forme g(x; ·) est
dite définie positive (resp. définie négative) si, pour tout h /= 0, on a
g(x; h) > 0 (resp. g(x; h) < 0),
et qu’elle est dite semi-définie positive (resp. semi-définie négative) si, pour
tout h ∈ Rn , on a
g(x; h) ≥ 0 (resp. g(x; h) ≤ 0).
Enfin, g(x; ·) est dite indéfinie si elle n’est pas semi-définie. Notons que g
est définie négative (resp. semi-définie négative) si et seulement si −g est
définie positive (resp. semi-définie positive.) L’algèbre fournit des conditions
nécessaires et suffisantes pour qu’une forme quadratique soit de l’un des types
que nous venons de définir. Nous aurons besoin de la conséquence suivante
du théorème des bornes atteintes de Weierstrass.
7.14. CONDITIONS D’EXISTENCE D’EXTRÉMANTS 281

Lemme. Si g(x; ·) définie ci-dessus est définie positive, alors il existe γ > 0
tel que, pour tout h ∈ Rn tel que |h|2 = 1, on ait

g(x; h) ≥ γ.

Démonstration. On vérifie sans peine que l’ensemble E = {h ∈ Rn :


|h|2 = 1} est un fermé borné de Rn et que l’application h → g(x; h) est
continue sur Rn . Le théorème de Weierstrass entraı̂ne l’existence d’un point
y ∈ E tel que, pour tout h ∈ E, on ait

g(x; h) ≥ g(x; y).

Comme y /= 0, on a g(x; y) > 0 et il suffit de poser γ = g(x; y).


Donnons maintenant une condition nécessaire pour que a soit un extré-
mant local libre de f .
Proposition. Si a est un minimant local libre de f , alors g(a; ·) est semi-
définie positive.
Démonstration. Par hypothèse, il existe r > 0 tel que B2 [a; r] ⊂ V et tel
que, pour tout x ∈ B2 [a; r], on ait

f (x) ≥ f (a).

En outre, par le théorème de Fermat, on aura

Dj f (a) = 0, (1 ≤ j ≤ n).

Dès lors, si h ∈ Rn est tel que |h|2 = r, ces relations et le théorème du


développement de Taylor entraı̂nent que, pour chaque entier k ≥ 1, il existera
θk ∈ ]0, 1[ tel que
4 5 4 5
h θk h h
f (a) ≤ f a + = f (a) + g a + ;
k k k
c’est-à-dire tel que
n $ n 4 5
1 $ θk h
0≤ D 2
f a + hi hj .
2k2 i=1 j=1 ij k

On a donc, pour chaque entier k ≥ 1,


n n 4 5
1 $$ 2 θk h
0≤ Dij f a + hi hj ,
2 i=1 j=1 k
282 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES
# # 8 9
# #
et, comme 0 ≤ # θkkh # ≤ kr , on voit que θk h
k k∈N∗ converge vers zéro. Comme
2
les fonctions 2f
Dij sont continues en a, on en déduit que
n n
1 $$
0≤ 2
hi hj Dij f (a) = g(a; h).
2 i=1 j=1

Si maintenant h /= 0 est quelconque dans Rn , alors h$ = rh


|h|2 est tel que
|h$ |2 = r, et dès lors
r2
0 ≤ g(a; h$) = g(a; h),
|h|22
ce qui entraı̂ne aussitôt que g(a; h) ≥ 0, et achève la démonstration, puisque
le résultat est trivial pour h = 0.

Proposition. Si a est un maximant local libre de f , alors g(a; ·) est semi-


définie négative.
Démonstration. Il suffit d’appliquer le résultat précédent à −f .
Ces résultats fournissent immédiatement une condition suffisante pour
que le point critique a soit un col.
Proposition. Si a est un point critique de f tel que g(a; ·) soit indéfinie,
alors a est un col de f .
Donnons maintenant des conditions suffisantes d’existence d’un extré-
mant local libre de f .
Proposition. Si a est un point critique de f tel que g(a; ·) soit définie
positive, alors a est un minimant local libre de f .
Démonstration. Soit γ > 0 donné par le Lemme ci-dessus. Puisque f est
de classe C 2 sur V , il existe δ > 0 tel que B2 [a; δ] ⊂ V et tel que, pour tout
h ∈ B2 [δ], on a
n $
$ n
2
|Djk f (a + h) − Djk
2
f (a)| ≤ γ.
j=1 k=1

Si h ∈ B2 [δ] \ {0}, le théorème de Taylor entraı̂ne l’existence d’un θ ∈ ]0, 1[


tel que
4 5
h
f (a + h) − f (a) = g(a + θh; h) = |h|22 g a; + [g(a + θh; h) − g(a; h)].
|h|2
7.15. EXERCICES 283

En conséquence,

f (a + h) − f (a) ≥ γ|h|22 − |g(a + θh; h) − g(a; h)|


n $ n
1$
≥ γ|h|22 − 2
|hj ||hk ||Djk f (a + θh) − Djk
2
f (a)|
2 j=1 k=1
1 γ
≥ γ|h|22 − |h|2∞ γ ≥ |h|22 > 0.
2 2

Proposition. Si a est un point critique de f tel que g(a; ·) soit définie


négative, alors a est un maximant local libre de f .
Démonstration. Il suffit d’appliquer le résultat précédent à −f.

7.15 Exercices
1. Soit f une fonction de R dans R deux fois dérivable sur un intervalle I
de R. Montrer que f est convexe sur I si et seulement si, pour tout x ∈ I,
on a f $$ (x) ≥ 0.
2. Soit f une fonction de Rn dans R dont les dérivées partielles du premier
et du second ordre existent et sont continues en a, et soient α, β et γ des
fonctions de Rn dans Rn dérivables en a. Montrer que les dérivées de Lie
vérifient les propriétés suivantes :

Lβ (Lαf )(a) − Lα (Lβ f )(a) = Lδ f (a),

L[[α,β],γ]f (a) = Lγ L[α,β]f (a) − L[α,β]Lγ f (a).


où δ = [α, β] est le crochet de Poisson de α et β défini par
n
$
[α, β] = (βj Dj α − αj Dj β),
j=1

En déduire l’identité de Jacobi


? @
L[[α,β],γ] + L[[β,γ],α] + L[[γ,α],β] f (a) = 0.

3. Considérons l’équation des ondes


2
Dtt u(t, x) − c2 Dxx
2
u(t, x) = 0,
284 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES

où c est un nombre réel différent de zéro. Montrer que, si f : R → R et


g : R → R sont deux fonctions deux fois dérivables sur R, alors la fonction u
de R2 dans R définie par

u(t, x) = f (x − ct) + g(x + ct)

est solution de l’équation des ondes.


4. Si n ≥ 2 est un entier et u est une application de Rn dans R deux
fois dérivable en chaque point de Rn , on définit le laplacien ∆u de u par la
relation n $
∆u(x) = 2
Djj u(x).
j=1

Montrer que si u(x) = v(|x|2) (fonction radiale), où v est une application de
]0, +∞[ dans R deux fois dérivable en chaque point de ]0, +∞[, alors, pour
tout x ∈ Rn \ {0}, on a
n−1 $
∆[v(|x|2)] = v $$(|x|2 ) + v (|x|2 ).
|x|2
Comme, pour tout r > 0, on a
n−1 $
v $$ (r) + v (r) = 0 ⇔ r n−1 v $$ (r) + (n − 1)r n−2 v $ (r) = 0
r
⇔ [r n−1 v $ (r)]$ = 0 ⇔ v $ (r) = Ar 1−n ,
où A est une constante réelle arbitraire, en déduire que u(x) = v(|x|2 ) est
une solution radiale sur Rn \ {0} de l’équation de Laplace

∆u(x) = 0,

si et seulement si
u(x) = A log |x|2 + B si n = 2,
et
u(x) = A|x|2−n
2 + B si n ≥ 3,
où B est une constante réelle arbitraire.
%
5. Soit k∈N ck hk une série, où ck ∈ Rp et h ∈ R, et f une fonction de R
%
dans Rp définie sur ]a − r, a + r[. On dit que k∈N ck hk est un développement
asymptotique de f au voisinage de a si, pour chaque entier q ∈ N, on a
%q
f (a + h) − k=0 ck h
k
lim = 0.
h→0 |h|q
7.16. PETITE ANTHOLOGIE 285

Montrer que si f est une fonction de classe C ∞ sur ]a − r, a + r[, alors la série
% (k)
de Taylor de f en a k∈N hk f k!(a) est un développement asymptotique de
f au voisinage de a.

7.16 Petite anthologie


Si, pour des accroissements tendant vers zéro, les fluxions qui leur sont pro-
portionnelles sont écrites, les quantités v, v $, v $$ , . . . étant maintenant toutes
prises égales à v, alors lorsque z, variant uniformément, devient z + v, la
v2
variable x deviendra x + ẋ 1.vż + ẍ 1.2. ż2 + etc.

Brook Taylor, 1715


Ce qu’on appelle la somme d’une suite, c’est la limite de la somme de
ses différents termes, c’est-à-dire une quantité dont on approche aussi près
qu’on veut, en prenant toujours dans la suite un nombre de termes de plus
en plus grand. Nous croyons devoir faire cette remarque en passant, pour
fixer l’idée nette du mot somme d’une suite.

Jean Le Rond d’Alembert, 1789

Mais, pour notre objet, il importe moins de connaı̂tre les restes exacts de
la série développée jusqu’à un terme quelconque que d’avoir des limites de
ces restes pour pouvoir apprécier l’erreur qu’on peut commettre en ne tenant
compte que de quelques-uns des premiers termes.

Joseph-Louis Lagrange, 1808


On appelle série une suite indéfinie de quantités u0 , u1 , u2 , u3 , etc. . . .
qui dérivent les uns des autres suivant une loi déterminée. Ces quantités
elles-mêmes sont les différents termes de la série que l’on considère. Soit

sn = u0 + u1 + u2 + . . . + un−1

la somme des n premiers termes, n désignant un nombre entier quelconque.


Si, pour des valeurs de n toujours croissantes, la somme sn s’approche
indéfiniment d’une certaine limite s, la série sera dite convergente, et la
limite en question s’appellera la somme de la série. Au contraire, si, tandis
que n croı̂t indéfiniment, la somme sn ne s’approche d’aucune limite fixe, la
série sera dite divergente, et n’aura plus de somme.

Augustin Cauchy, 1821


286 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES

Nous sommes donc conduits à envisager une relation d’une nature nou-
velle qui peut exister entre une fonction de x et de µ que nous appellerons
ϕ(x, µ) et une série divergente ordonnée suivant les puissances de µ

f0 + µf1 + µ2 f2 + . . . + µp fp + . . . ,

où les coefficients f0 , f1 , . . . peuvent être des fonctions de x seulement indé-


pendantes de µ, ou bien dépendre à la fois de x et de µ. Posons

ϕp = f0 + µf1 + µ2 f2 + . . . + µp fp .

Si l’on a
ϕ − ϕp
lim = 0 pour µ = 0,
µp
je dirai que la série ci-dessus représente asymptotiquement la fonction ϕ. . . .
Il est clair que, si µ est très petit, la différence ϕ − ϕp sera ausi très petite et,
bien que la série ci-dessus soit divergente, la somme de ses p + 1 premiers
termes représente très approximativement la fonction ϕ.

Henri Poincaré, 1893

Pour rien au monde je ne consacrerai de longues heures à établir que


∂ 2u ∂ 2u
∂x∂y = ∂y∂x et autres belles et grandes choses de même genre.

Charles Hermite, 1884


Chapitre 8

Equations différentielles
linéaires

8.1 Opérateurs différentiels linéaires


Dans un bouillon de culture en quantité suffisante, la vitesse de reproduction
des bactéries est proportionnelle à leur nombre. Si r désigne le coefficient
de proportionnalité et que l’on interpole la fonction décrivant le nombre de
bactéries en fonction du temps par une fonction n dérivable de R dans R+ ,
la loi de reproduction se traduit par l’équation

n$ (t) = rn(t),

où n(t) désigne le nombre de bactéries à l’instant t.


La hauteur h(t) à l’instant t d’un point matériel de masse m en chute
libre et soumis à une résistance de frottement proportionnelle à sa vitesse
vérifie, en vertu de la loi fondamentale de la mécanique, l’équation

mh$$ (t) + rh$ (t) = −mg,

où g désigne l’accélération de la pesanteur et r le coefficient de la force de


frottement.
Dans un circuit électrique oscillant de résistance R, de capacité C et
d’inductance L, l’intensité I(t) à l’instant t du courant électrique vérifie
l’équation
LI $$ (t) + RI $ (t) + (1/C)I(t) = 0.
Ces différents problèmes conduisent donc à la question suivante. Si l’on
se donne un entier n ≥ 1, des éléments aj , (0 ≤ j ≤ n) de K tels que an /= 0,

287
288 CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES

avec K = R ou C, et une fonction f de R dans K, il s’agit de déterminer les


applications y dans K n fois dérivables sur R telles que, pour tout x ∈ R, on
ait
n
$
aj y (j)(x) = f (x).
j=0

(on utilise la convention y (0) = y). Une telle équation dont l’inconnue est
une application y de R dans K est appelée une équation différentielle linéaire
d’ordre n à coefficients constants dans K et toute fonction y vérifiant l’équa-
tion sur R une solution sur R de l’équation. Lorsque les coefficients aj sont
réels, une solution réelle de l’équation sera une solution y à valeurs dans R.
Lorsque f = 0 l’équation différentielle correspondante
n
$
aj y (j)(x) = 0. (8.1)
j=0

est appelée une équation différentielle linéaire homogène d’ordre n à coef-


ficients constants. Sinon, elle est dite non homogène. Nous commencerons
par l’étude de l’équation homogène. Montrons d’abord que toute solution
éventuelle de l’équation (8.1) est indéfiniment dérivable sur R.
Proposition. Toute solution de l’équation (8.1) est indéfiniment dérivable
sur R.
Démonstration. On va le démontrer par récurrence sur l’ordre de dériva-
bilité. Soit y une solution de (8.1); on a donc
n−1
$
y (n) = −a−1
n aj y (j) , (8.2)
j=0

ce qui montre que y (n) est égale à une fonction dérivable sur R, c’est-à-dire
que y est n + 1 fois dérivable sur R. Si l’on suppose maintenant y n + k fois
dérivable sur R et que l’on égale les dérivées ke des deux membres de (8.2),
on obtient
n−1
$
y (n+k) = −a−1
n aj y (j+k) , (8.3)
j=0

et, en raisonnant sur (8.3) comme on l’a fait sur (8.2), on déduit que y (n+k)
est dérivable sur R, donc que y est n + k + 1 fois dérivable sur R. En
conséquence, y possède des dérivées de tous les ordres en chaque point de R
et la démonstration est complète.
8.1. OPÉRATEURS DIFFÉRENTIELS LINÉAIRES 289

Nous allons montrer que la résolution de l’équation (8.1) se ramène à


un problème essentiellement algébrique par l’introduction des opérateurs
différentiels à coefficients constants. Désignons par C ∞ = C ∞ (R, K) l’en-
semble des fonctions à valeurs dans K indéfiniment dérivables sur R. C’est
évidemment un espace vectoriel sur K. Pour chaque y ∈ C ∞ , la fonc-
tion dérivée y $ appartient aussi à C ∞ et nous pouvons donc introduire
l’application D : C ∞ → C ∞ , y 2→ y $ . Les propriétés de la dérivée entraı̂nent
que, si y et z appartiennent à C ∞ et si c ∈ K, alors on a
D(y + z) = (y + z)$ = y $ + z $ = Dy + Dz, D(cy) = (cy)$ = cy $ = c(Dy),
ce qui montre que D est une application linéaire de C ∞ dans C ∞ , c’est-à-dire
un endomorphisme de C ∞ . On peut dès lors définir de proche en proche,
pour tout entier m ≥ 1, l’endomorphisme Dm de C ∞ par D 0 = I (identité
sur C ∞ ) et
D m y = D[D m−1 y]
pour tout y ∈ C ∞ , c’est-à-dire D composé m fois avec lui-même, et l’on a
évidemment
D m y = y (m).
Si L est le polynôme à coefficients dans K défini par
n
$
L(z) = aj z j ,
j=0

où chaque aj ∈ K et an /= 0, nous pouvons lui associer l’endomorphisme


L(D) de C ∞ défini par
n
$ n
$
L(D)y = aj D j y = aj y (j),
j=0 j=0

pour tout y ∈ C∞. Un tel L(D) est appelé un opérateur différentiel linéaire
d’ordre n à coefficients dans K. On voit que la résolution de l’équation
différentielle homogène (8.1) revient à la détermination du noyau de l’endo-
morphisme L(D) de C ∞ . Cette détermination repose sur l’étude des pro-
priétés algébriques de L(D).
%
Si M (D) = m j=0 bj D est un autre opérateur différentiel linéaire à coef-
j

ficients dans K, la somme L(D) + M (D) de L(D) et M (D) sera l’endomor-


phisme défini, pour tout y ∈ C ∞ , par
n
$ m
$
[L(D) + M (D)]y = L(D)y + M (D)y = aj D j y + bj D j y,
j=0 j=0
290 CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES

tandis que le produit cL(D) de L(D) par c ∈ K sera l’endomorphisme de C ∞


défini, pour tout y ∈ C ∞ par
 
n
$
[cL(D)]y = c[L(D)y] = c  j
aj D y  .
j=0

On constate aussitôt que


p
$ n
$
[L(D) + M (D)]y = (aj + bj )D j y, [cL(D)]y = (caj )D j y, (8.4)
j=0 j=0

avec p = max(n, m) et aj = 0 pour j > n, bj = 0 pour j > m, c’est-à-dire


que

L(D) + M (D) = (L + M )(D), cL(D) = (cL)(D). (8.5)

Le composé de M (D) et L(D) est l’endomorphisme de C ∞ défini, pour tout


élément y ∈ C ∞ par
& m
' n

$ $
[M (D) ◦ L(D)]y = M (D)[L(D)y] = bk D k  aj D j y 
k=0 j=0
 
n $
$ m n+m
$ m
$
= bk aj D k+j y =  bl−j aj  D l y.
k=0 j=0 l=0 j=0

On le notera simplement M (D)L(D) et l’on voit immédiatement que

M (D) ◦ L(D) = (M L)(D), (8.6)

où M L désigne le produit usuel du polynôme L par le polynôme M . Par


exemple, si L(D) = D − r1 I et M (D) = D − r2 I avec r1 , r2 ∈ C, on a, pour
tout y ∈ C ∞ ,

M (D)L(D)y = (D − r2 I)(Dy − r1 y) = D 2 y − r1 Dy − r2 Dy + r1 r2 y
8 9
= D 2 − (r1 + r2 )D + r1 r2 I y.
Les relations (8.5) et (8.6) montrent que la somme et le produit de deux
opérateurs différentiels à coefficients dans K, ainsi que le produit d’un tel
opérateur par un élément de K sont encore des opérateurs différentiels liné-
aires à coefficients dans K, ce qui permet de définir, de proche en proche, la
8.1. OPÉRATEURS DIFFÉRENTIELS LINÉAIRES 291

somme et le produit d’un nombre quelconque de tels opérateurs. En outre,


les relations (8.5) et (8.6) et les propriétés des polynômes montrent que

L(D) + M (D) = M (D) + L(D), M (D)L(D) = L(D)M (D),

si l’on définit l’égalité L(D) = M (D) entre deux opérateurs différentiels


linéaires à coefficients dans K par la relation

L(D)y = M (D)y

pour tout y ∈ C ∞ , c’est-à-dire

[L(D)y](x) = [M (D)y](x),

pour tout y ∈ C ∞ et tout x ∈ R. Cette égalité équivaut à l’identité, au sens


algébrique, des polynômes L et M , ainsi que cela résulte de la proposition
suivante.
Proposition. Si 0 désigne l’endomorphisme nul dans C ∞ , alors

L(D) = 0
%n
si et seulement si le polynôme L(z) = j=0 aj z j est tel que aj = 0, (0 ≤ j ≤
n).
Démonstration. La condition suffisante est évidente. Pour démontrer la
condition nécessaire, notons que si L(D)y = 0 pour tout y ∈ C ∞ , alors, en
prenant y = 1, on trouve a0 = 0. Raisonnant par récurrence et supposant
que a0 = a1 = . . . = ak−1 = 0, on trouve, en prenant y(x) = xk , k!ak = 0, et
la démonstration est complète.
Tous ces résultats montrent que l’ensemble des opérateurs différentiels
à coefficients dans K est isomorphe à l’ensemble des polynômes sur K. En
particulier à toute identité L = M entre deux polynômes algébriques L
et M correspond l’égalité L(D) = M (D) pour les opérateurs différentiels
à coefficients constants correspondants. En guise d’application, rappelons
que le théorème fondamental de l’algèbre appliqué au polynôme L(z) nous
apprend que si r1 , r2, . . . , rq désignent les zéros complexes distincts de L et
m1 , m2, . . . , mq leurs multiplicités respectives, de telle sorte que 1 ≤ q ≤ n
et m1 + . . . + mq = n, on a l’identité

L(z) = an (z − r1 )m1 (z − r2 )m2 . . . (z − rq )mq ,


292 CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES

l’ordre des facteurs étant évidemment indifférent dans le second membre.


Cela entraı̂ne aussitôt, pour les opérateurs différentiels correspondants, l’éga-
lité
L(D) = an (D − r1 I)m1 (D − r2 I)m2 . . . (D − rq I)mq ,
l’ordre des facteurs étant de nouveau indifférent dans le second membre, et
(D − rI)m désignant le composé des m opérateurs (D − rI) . . .(D − rI).

8.2 Equation homogène complexe


Nous allons déterminer la structure de l’ensemble des solutions de l’équation
différentielle linéaire homogène à coefficients constants dans K

an y (n) + an−1 y (n−1) + . . . + a1 y $ + a0 y = 0, (8.7)

où n ∈ N∗ , aj ∈ K, (0 ≤ j ≤ n), an /= 0. Si L(D) est l’opérateur différentiel


à coefficients constants correspondant défini par
n
$
L(D) = aj D j ,
j=0

le problème revient donc à déterminer la structure du noyau ker L(D) de


l’endomorphisme L(D) de C ∞ .
Définition. On appelle polynôme caractéristique de l’équation différentielle
(8.7) le polynôme L sur C défini par
n
$
L(z) = aj z j ,
j=0

qui s’obtient à partir de (8.7) en remplaçant y (j) par z j . Les zéros dis-
tincts r1 , r2 , . . . , rq du polynôme caractéristique P (z) sont appelés les racines
caractéristiques de l’équation différentielle (8.7) et nous désignerons par
m1 , . . ., mq leurs multiplicités respectives.
La discussion de la section 1 montre que l’opérateur différentiel L(D)
peut s’écrire

L(D) = an (D − r1 I)m1 (D − r2 I)m2 . . . (D − rq I)mq ,

l’ordre des facteurs du second membre étant indifférent. Il est évident que
tout élément du noyau de (D − rj I)mj appartiendra au noyau de L(D). On
8.2. EQUATION HOMOGÈNE COMPLEXE 293

est donc amené à étudier d’abord la structure du noyau de (D − rI)m,


où r ∈ K et m ≥ 1 est un entier.
La détermination du noyau de D −rI équivaut à la résolution de l’équati-
on différentielle élémentaire
y $ (x) = ry(x). (8.8)
Si nous définissons la nouvelle fonction inconnue z par
y(x) = z(x) exp rx,
c’est-à-dire
z(x) = y(x) exp(−rx),
nous voyons que y est solution de l’équation différentielle (8.8) si et seulement
si
z $ (x) exp rx = 0,
c’est-à-dire, puisque exp rx /= 0 pour tout x ∈ R, si et seulement si
z $ (x) = 0.
Les solutions de cette équation sont les fonctions constantes z(x) = c, x ∈ R.
Par conséquent, les solutions de (8.8) sont les fonctions
y(x) = c exp rx
où c ∈ K est arbitraire.
Supposons maintenant que m soit un entier positif quelconque et con-
sidérons d’abord le cas particulier où r = 0.
Lemme. y ∈ C ∞ appartient à ker Dm si et seulement si
y(x) = P (x), x ∈ R,
où P est un polynôme arbitraire sur K de degré inférieur ou égal à m − 1.
Démonstration. On vérifie immédiatement que tout polynôme sur K de
degré inférieur ou égal à m−1 appartient au noyau de Dm . Réciproquement,
si y est réel et Dm y = 0, alors, le reste de Lagrange du développement de
Taylor d’ordre m − 1 de y autour de 0 est identiquement nul et l’on a donc
m−1
$ D k y(0) k
y(x) = x ,
k=0
k!

ce qui montre que y est un polynôme sur K de degré inférieur ou égal à


m − 1. Le cas de y complexe s’en déduit en passant aux composantes.
294 CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES

Le résultat suivant permet de ramener la recherche de la structure du


noyau de (D − rI)m à celle du noyau de Dm .
Lemme. Si r ∈ C et m ∈ N∗ alors, pour toute fonction g à valeurs dans K
m-fois dérivable sur R, on a

(D − rI)m g(x) = (exp rx). Dm [g(x) exp(−rx)], (8.9)

c’est-à-dire

[exp(−rx)].(D − rI)mg(x) = D m [g(x) exp(−rx)].

Démonstration. Notons que la fonction g. exp(−r.) est m fois dérivable


sur R puisqu’il en est ainsi de g et de exp(−r.). La formule à démontrer est
vraie pour m = 1 puisque

(exp rx).D[g(x). exp(−rx)] = Dg(x) − rg(x) = (D − rI)g(x).

Montrons par récurrence que si elle est vraie jusqu’à l’ordre k − 1 ≤ m − 1,


elle est vraie à l’ordre k. En fait, on a

(D − rI)k g(x) = (D − rI)[(D − rI)k−1 g(x)]

= (D − rI){(exp rx).Dk−1 [g(x). exp(−rx)]}


= (exp rx).D{[exp(−rx)].(exp rx).Dk−1 [g(x). exp(−rx)]}
= (exp rx).Dk [g(x). exp(−rx)].

Proposition. Si r ∈ C et m ∈ N∗ , alors y : R → C appartient au noyau de


(D − rI)m si et seulement si y est de la forme

y(x) = P (x) exp rx,

où P est un polynôme arbitraire sur C de degré inférieur ou égal à m − 1.


Démonstration. Comme exp(−rx) /= 0 et exp rx /= 0 quel que soit x ∈ R,
la formule (8.9) et le lemme qui précède entraı̂nent que

y ∈ ker(D − rI)m ⇔ (exp rx).Dm[y(x) exp(−rx)] = 0

⇔ D m [y(x) exp(−rx)] = 0
⇔ y(x) exp(−rx) = P (x) ⇔ y(x) = P (x) exp rx,
où P est un polynôme sur C de degré inférieur ou égal à m − 1.
8.2. EQUATION HOMOGÈNE COMPLEXE 295

Remarque. Lorsque r ∈ R, le raisonnement du lemme précédent montre


que les éléments de ker(D − rI)m à valeurs réelles s’obtiennent en prenant
pour P les polynômes sur R de degré inférieur ou égal à m − 1. Lorsque r
est complexe non réel, disons r = b + ic avec c /= 0, alors P (x) exp rx est réel
si et seulement si
P (x) exp rx = P (x) exp r̄x,
c’est-à-dire si et seulement si
[P (x) − P (x)] cos cx = −i[P (x) + P (x)] sin cx,
ou encore
[9P (x)] cos cx = [8P (x)] sin cx,
pour tout x ∈ R, ce qui n’est possible que si P = 0. Ainsi donc, pour r
non réel, les éléments du noyau de (D − rI)m sont nécessairement à valeurs
complexes non réelles.
Pour chaque q ∈ N et chaque s ∈ C, désignons par E q,s l’ensemble
E q,s = {y : R → C : y(x) = P (x) exp sx et P est un
polynôme sur C de degré inférieur ou égal à q}.
Des fonctions de ce type s’appellent des exponentielles-polynômes et comme
la bijection
B : P 2→ P (·) exp(s·)
définit un isomorphisme entre E q,s et l’espace vectoriel sur C des polynômes
sur C de degré inférieur ou égal à q, qui est de dimension q + 1, on voit
que E q,s est un espace vectoriel sur C de dimension q + 1 contenu dans C ∞ .
L’étude du comportement de l’opérateur linéaire D − rI sur E q,s va nous
fournir la structure des éléments de ker L(D). Comme, pour tout polynôme
P de degré inférieur ou égal à q, tout r ∈ C et tout s ∈ C, on a
(D − rI)[P (x) exp sx] = [P $ (x) + (s − r)P (x)] exp sx,
on voit que D − rI est un endomorphisme de E q,s. On a un résultat plus
précis si r /= s.
Lemme. Si r /= s sont des nombres complexes, alors, pour chaque q ∈ N,
D − rI est un automorphisme de E q,s .
Démonstration. Puisque E q,s est de dimension finie, il suffit de vérifier
que D − rI est injectif, c’est-à-dire que ker(D − rI) ∩ E q,s = {0}. Si
(D − rI)[P (x) exp sx] = 0,
296 CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES

%
pour tout x ∈ R, où P (x) = qk=0 ck xk , alors, en vertu de la formule (8.9),
on a
0 = (exp rx).D[P (x) exp(s − r)x],
ou encore
P $ (x) + (s − r)P (x) = 0,
c’est-à-dire
q−1
$
(s − r)cq xq + [(s − r)ck + (k + 1)ck+1 ]xk = 0,
k=0

quel que soit x ∈ R. Le polynôme du premier membre doit donc avoir ses
coefficients nuls, c’est-à-dire
k+1
cq = 0, ck = − ck+1 , (0 ≤ k ≤ q − 1),
s−r
ce qui entraı̂ne, de proche en proche ck = 0, (0 ≤ k ≤ q) et achève la
démonstration.
Nous pouvons maintenant énoncer et démontrer le théorème de struc-
ture de l’ensemble des solutions complexes d’une équation différen-
tielle linéaire homogène à coefficients dans K.
Théorème. Si r1 , . . . , rq désignent les racines distinctes de l’équation ca-
ractéristique
n
$
L(z) ≡ aj z j = 0
j=0

et m1 , . . . , mq leurs multiplicités respectives, alors y est solution de l’équation


différentielle n
$
aj y (j) ≡ L(D)y = 0
j=0

si et seulement si
q
$
y(x) = Pj (x) exp rj x, x ∈ R, (8.10)
j=1

où Pj est un polynôme arbitraire de degré inférieur ou égal à mj − 1 à


coefficients dans C (1 ≤ j ≤ q).
Démonstration. La Proposition ci-dessus entraı̂ne que le résultat est
vrai si q = 1. Pour démontrer le résultat par récurrence, supposons le
8.2. EQUATION HOMOGÈNE COMPLEXE 297

vrai pour k − 1 racines caractéristiques distinctes et montrons qu’il est vrai


pour k racines caractéristiques distinctes. On a, en vertu de l’hypothèse de
récurrence,
 
k
6 k−1
6
(D − rj I)mj y = 0 ⇔  (D − rj I)mj  (D − rk I)mk y = 0
j=1 j=1

k−1
$
⇔ (D − rk I)mk y(x) = Qj (x) exp rj x, x ∈ R, (8.11)
j=1

où Qj est un polynôme sur C de degré inférieur ou égal à mj − 1, (1 ≤ j ≤


k − 1). Le dernier Lemme montre que (D − rk I)mk est un automorphisme
de E mj −1,rj pour chaque 1 ≤ j ≤ k − 1, et il existe donc pour chaque
1 ≤ j ≤ k − 1, un polynôme Pj sur C de degré inférieur ou égal à mj − 1 tel
que
Qj (x) exp rj x = (D − rk I)mk [Pj (x) exp rj x].
Dès lors, par la formule (8.11) et la linéarité de l’opérateur (D − rk I)mk , on
a  
k−1
$
(D − rk I)mk y(x) − Pj (x) exp rj x = 0,
j=1

ce qui équivaut, par la Proposition ci-dessus, à


k−1
$
y(x) − Pj (x) exp rj x = Pk (x) exp rk x,
j=1

où Pk est un polynôme sur C de degré inférieur ou égal à mk − 1. Le résultat


est donc vrai pour un nombre quelconque q de racines distinctes du polynôme
caractéristique.
Remarque. Si nous explicitons les polynômes Pj dans (8.10) en écrivant
mj −1
$
Pj (x) = pjk xk ,
k=0

nous voyons que la forme générale des solutions complexes de l’équation


différentielle (8.7) est donnée par
j −1
q m$
$
y(x) = pjk xk exp rj x, x ∈ R,
j=1 k=0
298 CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES

%
et elle contient les n = qj=1 mj constantes complexes arbitraires pjk . Cette
formule exprime aussi que la famille de fonctions

F = {x 2→ xk exp rj x : 0 ≤ k ≤ mj − 1, 1 ≤ j ≤ q}

constitue une famille génératrice du sous-espace vectoriel ker L(D) ⊂ C ∞


des solutions de l’équation différentielle (8.7).
Le lemme qui suit permet de montrer que cette famille est libre et con-
stitue donc une base de ker L(D).

Lemme. Si p1 , . . ., pl sont des entiers naturels et r1 , . . . , rl des nombres


complexes tels que ri /= rj pour 1 ≤ i /= j ≤ l, alors

(E p1,r1 + . . . + E pl−1,rl−1 ) ∩ E pl,rl = {0}.

Démonstration. Si

y ∈ (E p1,r1 + . . . + E pl−1 ,rl−1 ) ∩ E pl,rl ,

alors, pour chaque x ∈ R, on a

l−1
$
y(x) = P j (x) exp rj x = P l (x) exp rl x,
j=1

où chaque polynôme P j est de degré inférieur ou égal à pj (1 ≤ j ≤ l). Dès


lors, par le lemme de structure du noyau de (D − rI)p+1 , on a
 
l−1
6 l−1
$ l−1
6
0= (D − rk I)pk +1  P j (x) exp rj x = (D − rk I)pk +1 [P l (x) exp rl x].
k=1 j=1 k=1

=
Comme l−1 k=1 (D − rk I)
pk +1
est un automorphisme de E pl,rl , on en déduit
que P l exp(rl ·) = 0 et donc que y = 0.

Ce lemme et le théorème de structure montrent que ker L(D) est la


somme directe des sous-espaces vectoriels de dimension mj E mj −1,rj , (1 ≤
j ≤ q). Donc ker L(D) est de dimension n et comme la famille de fonctions
{x 2→ xk exp rj x : 0 ≤ k ≤ mj − 1} constitue une base de E mj −1,rj , (1 ≤
j ≤ q), la famille F ci-dessus constituera une base de ker L(D). On a donc
prouvé le résultat suivant.
8.3. EQUATIONS NON HOMOGÈNES 299

Corollaire. L’ensemble des solutions complexes de l’équation différentielle


(8.7) est le sous-espace vectoriel de C ∞ de dimension n engendré par la
famille de fonctions

F = {x 2→ xk exp rj x : 0 ≤ k ≤ mj − 1, 1 ≤ j ≤ q},

où les rj sont les racines caractéristiques et mj leurs multiplicités.


Exemple. Considérons l’équation différentielle linéaire homogène du second
ordre

a2 y $$ (x) + a1 y $ (x) + a0 y(x) = 0, (8.12)

où les aj ∈ C, (0 ≤ j ≤ 2). L’équation caractéristique correspondante est

a2 z 2 + a1 z + a0 = 0.

Dès lors, si a21 − 4a2 a0 /= 0, les racines caractéristiques


G G
−a1 − a21 − 4a2 a0 −a1 + a21 − 4a2 a0
r1 = , r2 = ,
2a2 2a2
sont simples (m1 = m2 = 1), et les solutions de (8.12) sont donc les fonctions
de la forme
y(x) = c1 exp r1 x + c2 exp r2 x,
où c1 et c2 sont des nombres complexes arbitraires.
Si a21 − 4a2 a0 = 0, l’équation caractéristique possède la racine double
a1
r1 = −
2a2
(m1 = 2) et les solutions de (8.12) sont les fonctions de la forme

y(x) = (c1 + c2 x) exp r1 x,

où c1 et c2 sont des nombres complexes arbitraires.

8.3 Equations non homogènes


Si les aj ∈ K, (0 ≤ j ≤ n) avec an /= 0 et si f est une application de R dans
K, considérons maintenant l’équation différentielle non homogène
n
$
L(D)y ≡ aj y (j)(x) = f (x). (8.13)
j=0
300 CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES

L’équation (8.7)
n
$
L(D)y ≡ aj y (j) (x) = 0
j=0

est appelée l’équation homogène associée à (8.13).


Le résultat suivant montre que la détermination de toutes les solutions de
(8.13) revient à celle de toutes les solutions de l’équation homogène associée
et d’une solution de l’équation (8.13).
Proposition. Soit v une solution de l’équation (8.13). Alors toute solution
y de l’équation (8.13) est de la forme y = u+v où u est solution de l’équation
homogène associée à (8.13).
Démonstration. Soient v et y deux solutions de (8.13); on a donc
n
$ n
$
aj v (j)(x) = f (x), aj y (j)(x) = f (x),
j=0 j=0

pour tout x ∈ R, et dès lors, par soustraction membre à membre,


n
$
aj (y − v)(j)(x) = 0,
j=0

pour tout x ∈ R, ce qui montre que y − v est une solution u de l’équation


homogène associée.
Il résulte de cette proposition que la détermination de la forme générale
de la solution de l’équation (8.13) revient à la détermination de la forme
générale de l’équation homogène associée à (8.13), problème résolu au para-
graphe précédent, et à celle d’une solution particulière de l’équation (8.13).
Le raisonnement fait dans le cas homogène pour démontrer la régularité
des solutions s’étend immédiatement au cas non homogène. Les détails sont
laissés au lecteur.
Proposition. Si la fonction f est indéfiniment dérivable sur R, alors toute
solution de l’équation (8.13) est indéfiniment dérivable sur R.
Enfin, l’obtention d’une solution de (8.13) est souvent facilitée par le
résultat suivant.
%s
Proposition. Si les applications fj de R dans K sont telles que f = j=1 fj ,
et si yj est solution de l’équation différentielle

L(D)(y) = fj ,
8.3. EQUATIONS NON HOMOGÈNES 301

%s
(1 ≤ j ≤ s), alors y = j=1 yj est solution de (8.13).
Démonstration. On a, par linéarité de l’opérateur L(D),
 
s
$ s
$ s
$
L(D)y = L(D)  yj  = L(D)yj = fj = f.
j=1 j=1 j=1

La recherche d’une solution particulière de (8.13) lorsque f est donné est


un problème difficile sur lequel nous reviendrons par la suite. Nous allons le
résoudre dans cette section dans le cas particulier où f est une exponentielle-
polynôme, c’est-à-dire lorsque

f (x) = Qp(x) exp(rx),

où Qp est un polynôme à coefficients dans C de degré inférieur ou égal à p et


r ∈ C. Nous aurons besoin pour ce faire de quelques résultats préliminaires
de nature algébrique.
Soit s ∈ C, q ∈ N, m ∈ N et soit E m,q,s ⊂ E m+q,s l’ensemble défini par

E m,q,s = {y : R → C : y(x) = xm P (x) exp sx où P est un polynôme

sur C de degré inférieur ou égal à q}.


On vérifie sans peine que E m,q,s est un espace vectoriel sur C de dimension
q + 1 et que E 0,q,s = E q,s .
Lemme. Pour chaque m ≥ 1, D − sI est un isomorphisme de E m,q,s sur
E m−1,q,s.
Démonstration. Comme dim E m,q,s = dim E m−1,q,s, il suffit de démon-
trer que D − sI applique E m,q,s dans E m−1,q,s et est injectif. Si y(x) =
xm P (x) exp sx, avec P un polynôme sur C de degré inférieur ou égal à q,
alors, par la formule (8.9), on a

(D − sI)[xmP (x) exp sx] = (exp sx)D[xm P (x)]

= (exp sx)[mxm−1 P (x) + xm P $ (x)],


ce qui entraı̂ne que (D − sI)y ∈ E m−1,q,s et, si (D − sI)y = 0, que

xm P (x) = c, x ∈ R,

où c est une constante complexe; en faisant x = 0, on trouve c = 0 et donc


y = 0.
302 CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES

On en déduit aussitôt le résultat suivant.


Corollaire. Pour chaque m ≥ 1, (D − sI)m est un isomorphisme de E m,q,s
sur E q,s.
Considérons maintenant l’équation différentielle

L(D)y(x) = Qp (x) exp rx, (8.14)

où r ∈ C et Qp est un polynôme à coefficients dans C de degré p. Convenons


aussi de dire que r ∈ C est racine caractéristique de multiplicité zéro de
l’équation algébrique L(z) = 0 si r n’est pas racine de cette équation.
Théorème. L’équation différentielle non homogène (8.14) possède toujours
une solution particulière de la forme

y(x) = xm Rp (x) exp rx,

où m est la multiplicité de r comme racine de l’équation caractéristique


L(z) = 0 de l’équation homogène associée à (8.13) et Rp (x) est un cer-
tain polynôme complexe de degré inférieur ou égal à p dont les coefficients
dépendent linéairement de ceux de Qp.
Démonstration. L’équation (8.14) peut évidemment s’écrire sous la forme
équivalente
q
6
(D − rj I)mj y(x) = a−1
n Qp (x) exp rx,
j=1

où les rj sont les racines caractéristiques, de multiplicités respectives mj , de


l’équation homogène associée (1 ≤ j ≤ q). Supposons tout d’abord que r ne
soit pas racine de l’équation caractéristique L(z) = 0. Alors, on a vu plus
=
haut que l’opérateur qj=1 (D − rj I)mj est un automorphisme de E p,r et il
existera donc un unique élément Rp (·) exp(r·) ∈ E p,r tel que
q
6
(D − rj I)mj [Rp(x) exp rx] = a−1
n Qp (x) exp rx.
j=1

En conséquence, y = Rp (·) exp(r·) est une solution de (1.14) et l’on déter-


minera les coefficients de Rp par la méthode des coefficients indéterminés en
insérant cette solution dans l’équation (8.14), en identifiant les coefficients
de même puissance des polynômes après simplification des deux membres
par exp(r.), et en résolvant le système linéaire en les coefficients de Rp ainsi
obtenu.
8.3. EQUATIONS NON HOMOGÈNES 303

Si r est racine de l’équation caractéristique L(z) = 0, on peut toujours


renuméroter les racines caractéristiques pour que r = rq . L’équation (8.14)
peut s’écrire
q−1
6
(D − rj I)mj (D − rq I)mq y(x) = a−1
n Qp (x) exp rx.
j=1

=q−1
Comme (D − rq I)mq est un isomorphisme de E mq ,p,rq sur E p,rq et j=1 (D −
rj I)mj un automorphisme de E p,rq ,
q−1
6
(D − rj I)mj (D − rq I)mq
j=1

sera un isomorphisme de E mq ,p,rq sur E p,rq et il existera un élément unique


(·)mq Rp (·) exp(rq ·) ∈ E mq ,p,rq tel que
q−1
6
(D − rj I)mj (D − rq I)mq [xmq Rp (x) exp(rq x)] = a−1
n Qp (x) exp rq x.
j=1

Donc, y(x) = xmq Rp(x) exp(rq x) est une solution particulière de (8.14) et
l’on pourra également déterminer les coefficients de Rp par la méthode des
coefficients indéterminés.
Exemple. Considérons l’équation différentielle non homogène du second
ordre
a2 y $$ (x) + a1 y $ (x) + a0 y(x) = (b0 + b1 x) exp rx,
où les aj , bk et r sont des nombres complexes. Utilisons les notations in-
troduites dans l’étude du cas homogène. Si r /∈ {r1 , r2 }, nous savons qu’il
existera une solution de la forme

y(x) = (c0 + c1 x) exp rx.

Introduisons cette expression dans l’équation différentielle, nous trouvons,


après simplification des deux membres par exp rx,

(2a2 r + a1 )c1 + (a2 r 2 + a1 r + a0 )c0 + (a2 r 2 + a1 r + a0 )c1 x = b0 + b1 x,

et dès lors, puisque a2 r 2 + a1 r + a0 = L(r) /= 0,

b1 b0 L(r) − b1 L$ (r)
c1 = , c0 = .
L(r) [L(r)]2
304 CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES

Si r = r1 /= r2 , alors r est racine de L(z) = 0 de multiplicité un et nous


savons qu’il existera une solution de la forme

y(x) = x(c0 + c1 x) exp rx.

Introduisant cette expression dans l’équation différentielle, nous obtenons,


après simplification, et en notant que L(r) = 0,

2a2 c1 + (a1 + r1 )c0 + 2L$ (r)c1 x = b0 + b1 x,

et dès lors, r étant racine simple, on a L$ (r) /= 0 et

b1 b0 L$ (r) − a2 b1
c1 = , c0 = .
2L (r)
$ [L$ (r)]2

Il reste à discuter le cas où r = r1 = r2 est racine double de l’équation


caractéristique. Nous savons alors qu’il existera une solution de la forme

y(x) = x2 (c0 + c1 x) exp rx.

Procédant encore de même et tenant compte du fait que L(r) = L$ (r) = 0,


car r est racine double de L(z) = 0, on trouve

2a2 c0 + 6a2 c1 x = b0 + b1 x,

et dès lors
1 b1
c0 = , c1 = .
2a2 6a2

8.4 Solutions réelles


Considérons tout d’abord le cas de l’équation linéaire homogène (8.7) et
supposons les aj réels (0 ≤ j ≤ n). C’est évidemment un cas particulier de
celui traité et les solutions complexes de (8.7) sont données par les fonctions
complexes y définies par
q
$
y(x) = Pj (x) exp rj x,
j=1

où les rj sont les racines caractéristiques de (8.7) et les Pj des polynômes
arbitraires à coefficients complexes de degré inférieur ou égal à mj − 1, mj
étant la multiplicité de rj . On sait que le caractère réel des aj n’implique
8.4. SOLUTIONS RÉELLES 305

pas le caractère réel des racines caractéristiques rj et l’on a vu que si rj est


non réelle, il ne suffit donc pas de choisir tous les Pj réels pour obtenir une
solution réelle de (8.7).
Si r est une racine non réelle de l’équation caractéristique L(z) = 0, alors,
en prenant le conjugué des deux membres de cette équation, on voit que le
conjugué r̄ de r est également racine de l’équation caractéristique L(z) = 0,
avec la même multiplicité que r. En conséquence, les racines distinctes de
l’équation caractéristique pourront toujours être numérotées comme suit

r1 , r2 , . . . , rp, s1 , s2 , . . ., st , s1 , s2 , . . . , st,

avec les multiplicités respectives

m1 , m2 , . . ., mp, n1 , n2 , . . ., nt , n1 , n2 , . . . , nt,

où les rj , (1 ≤ j ≤ p) sont des nombres réels, sk , (1 ≤ k ≤ t) sont des nombres


complexes non réels et où les entiers 0 ≤ p ≤ q, 0 ≤ t = (q − p)/2, mj (1 ≤
j ≤ p) et nk (1 ≤ k ≤ t) sont tels que

m1 + . . . + mp + 2(n1 + . . . + nt ) = n.

Si nous posons sk = bk + ick , alors sk = bk − ick , (1 ≤ k ≤ t). La solution


générale complexe de (8.7) peut donc s’écrire
p
$ t
$ t
$
y(x) = Pj (x) exp rj x + Qk (x) exp sk x + Rk (x) exp sk x,
j=1 k=1 k=1

où les Pj , Qk , Rk sont des polynômes sur C de degrés inférieurs ou égaux à


mj − 1, nk − 1 et nk − 1 respectivement. Dès lors,
p
$
y(x) = Pj (x) exp rj x
j=1

t
$
+ {[Qk (x) + Rk (x)] cos ck x + i[Qk (x) − Rk (x)] sin ck x} exp bk x.
k=1
Cette solution sera réelle si nous choisissons les polynômes Pj , Qk + Rk et
i(Qk − Rk ) réels, c’est-à-dire tels que

Pj = Pj , (1 ≤ j ≤ p), Qk + Rk = Qk + Rk ,

i(Qk − Rk ) = i(Qk − Rk ), (1 ≤ k ≤ t),


306 CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES

ce qui équivaut à prendre Pj réel (1 ≤ j ≤ p) et Qk et Rk complexes


conjugués (1 ≤ k ≤ t). Réciproquement, si la solution y est réelle, alors on a
y(x) = y(x) pour tout x ∈ R, et dès lors, en utilisant son expression donnée
ci-dessus, et le fait que exp ax = exp āx, on obtient
p
$ t
$
[Pj (x) − Pj (x)] exp rj x + [Qk (x) − Rk (x)] exp sk x
j=1 k=1

t
$
+ [Rk (x) − Qk (x)] exp sk x = 0, x ∈ R.
k=1
Puisque la famille

F = {x 2→ xl exp rj x : 0 ≤ l ≤ mj − 1, 1 ≤ j ≤ p;

x 2→ xl exp sk x : 0 ≤ l ≤ nk − 1, 1 ≤ k ≤ t;
x 2→ xl exp sk x : 0 ≤ l ≤ nk − 1, 1 ≤ k ≤ t},
est libre, on déduit aussitôt de l’identité précédente que, pour toute solution
réelle y de (8.7), on a

Pj = Pj , (1 ≤ j ≤ p), Qk = Rk , (1 ≤ k ≤ t),

qui est par conséquent une condition nécessaire et suffisante pour que y soit
réelle. Si cette condition est vérifiée, alors on a
p
$ t
$
y(x) = Pj (x) exp rj x + 28[ Qk (x) exp sk x],
j=1 k=1

où les Pj sont des polynômes réels arbitraires de degré inférieur ou égal à
mj − 1 (1 ≤ j ≤ p) et les Qk sont des polynômes complexes arbitraires de
degré inférieur ou égal à nk − 1 (1 ≤ k ≤ t). Les Qk peuvent donc toujours
s’écrire sous la forme

Qk (x) = (1/2)[Bk (x) − iCk (x)]

où les Bk et Ck sont des polynômes réels arbitraires de degré inférieur ou


égal à nk − 1 (1 ≤ k ≤ t), ce qui donne finalement la formule générale
p
$ t
$
y(x) = Pj (x) exp rj x + [Bk (x) cos ck x + Ck (x) sin ck x] exp bk x,
j=1 k=1

et achève la démonstration du résultat suivant.


8.4. SOLUTIONS RÉELLES 307

Proposition. Si tous les coefficients aj sont réels dans l’équation (8.7), alors
y est une solution réelle de (8.7) si et seulement si elle est de la forme
p
$ t
$
y(x) = Pj (x) exp rj x + [Bk (x) cos ck x + Ck (x) sin ck x] exp bk x,
j=1 k=1

où les rj sont les racines réelles, de multiplicités respectives mj , de l’équati-


on caractéristique (1 ≤ j ≤ p), bk et ck sont respectivement les parties
réelles et imaginaires des racines non réelles, de multiplicités respectives nk ,
de l’équation caractéristique (1 ≤ k ≤ t) et où les Pj , Bk et Ck sont des
polynômes arbitraires à coefficients réels de degrés respectivement inférieurs
ou égaux à mj − 1, nk − 1 et nk − 1, (1 ≤ j ≤ p, 1 ≤ k ≤ t).
Remarque. On vérifie sans peine que si y est solution d’une équation
différentielle linéaire homogène à coefficients réels, alors ȳ l’est aussi. Dès
lors, puisque l’ensemble des solutions complexes de (8.7) est un espace vec-
toriel sur C et que

8y = (1/2)(y + ȳ), 9y = (1/2i)(y − ȳ),

on voit que 8y et 9y seront aussi solutions de (8.9) et seront des solutions


réelles. Cette remarque peut faciliter la détermination des solutions réelles
d’une équation différentielle homogène à coefficients réels.
Exemple. Revenons à l’équation différentielle linéaire homogène du second
ordre (8.12)
a2 y $$ (x) + a1 y $ (x) + a0 y(x) = 0,
mais supposons maintenant que les coefficients aj (0 ≤ j ≤ 2) sont réels.
L’équation caractéristique correspondante est

a2 z 2 + a1 z + a0 = 0.

Dès lors, si a21 − 4a2 a0 > 0, les racines caractéristiques


G G
−a1 − a21 − 4a2 a0 −a1 + a21 − 4a2 a0
r1 = , r2 = ,
2a2 2a2

sont toutes deux réelles et simples (m1 = m2 = 1), et les solutions réelles de
(8.12) sont donc les fonctions de la forme

y(x) = c1 exp r1 x + c2 exp r2 x,


308 CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES

où c1 et c2 sont des nombres réels arbitraires. Si a21 − 4a2 a0 < 0, les racines
caractéristiques
G G
−a1 − i 4a2 a0 − a21 −a1 + i 4a2 a0 − a21
r1 = , r2 = = r1 ,
2a2 2a2
sont complexes conjuguées non réelles et simples (m1 = m2 = 1), et en
posant r1 = b − ic, r2 = b + ic, les solutions réelles de (8.12) sont les fonctions
de la forme
y(x) = [c1 cos cx + c2 sin cx] exp bx,
où c1 et c2 sont des nombres réels arbitraires. Si a21 − 4a2 a0 = 0, l’équation
caractéristique possède la racine réelle double
a1
r1 = −
2a2
(m1 = 2) et les solutions réelles de (8.12) sont les fonctions de la forme

y(x) = (c1 + c2 x) exp r1 x,

où c1 et c2 sont des nombres réels arbitraires.


Passons maintenant au cas d’une équation différentielle linéaire non ho-
mogène
n
$
L(D)y ≡ aj y (j) (x) = f (x),
j=0

dont nous supposons les coefficients aj réels. Si y est solution de cette


équation, alors, en conjugant les deux membres, on trouve

L(D)ȳ = f¯,

ce qui entraı̂ne aussitôt, par combinaison linéaire de ces deux équations, que

L(D)(8y) = 8f, L(D)(9y) = 9f.

En d’autres termes, si y est solution de l’équation différentielle non homogène


L(D)y = f et si les coefficients de L(D) sont réels, alors 8y et 9y seront
respectivement des solutions réelles des équations non homogènes réelles

L(D)y = 8f, L(D)y = 9f.

En conséquence, si une équation différentielle non homogène

L(D)y = g
8.4. SOLUTIONS RÉELLES 309

dont les coefficients et le second membre sont réels, est telle que g puisse
s’écrire g = 8f ou g = 9f pour une certaine exponentielle-polynôme com-
plexe f , et si l’on a déterminé une solution v de l’équation L(D)y = f , alors
8v ou 9v sera une solution de L(D)y = g. Cette remarque peut faciliter
l’obtention d’une solution particulière réelle lorsque g est le produit d’un
polynôme par une fonction trigonométrique.
Exemple. Considérons par exemple l’équation différentielle

y $$ (x) + γy(x) = cos ωx,

où γ est un réel et ω > 0. Comme cos ωx = 8 exp iωx, une solution parti-
culière réelle de cette équation s’obtiendra en prenant la partie réelle d’une
solution particulière complexe de l’équation

y $$ (x) + γy(x) = exp iωx.

Les racines caractéristiques de l’équation caractéristique de l’équation ho-


mogène associée sont données par

r1 = − −γ = −r2

si γ < 0, par
r1 = r2 = 0
si γ = 0 et par

r1 = −i γ = −r2
si γ > 0. La méthode des exponentielles-polynômes développée dans la
section précédente fournit donc la solution particulière complexe suivante :
1
y(x) = exp iωx
γ − ω2
si γ /= ω 2 et
x
y(x) = exp iωx
2iω
si γ = ω 2 , ce qui donne, en prenant la partie réelle, les solutions particulières
réelles de l’équation de départ
1
y(x) = cos ωx,
γ − ω2
si γ /= ω 2 et
x
y(x) = sin ωx

310 CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES

si γ = ω 2 . Ce dernier cas illustre le phénomène bien connu de résonance en


mécanique et en physique : lorsque γ = ω 2 , la fréquence ω de l’excitation

extérieure cos ωx est égale à la fréquence propre γ de l’oscillateur régi par
l’équation différentielle homogène associée

y $$ + γy = 0,

et, puisque la solution réelle générale est donnée par


x
y(x) = c1 cos ωx + c2 sin ωx + sin ωx,

la présence du facteur x montre que l’amplitude des oscillations augmentera
indéfiniment lorsque x tend vers +∞.

8.5 Problème de Cauchy


Soit maintenant A une application linéaire de Kn dans Kn , f une application
continue de R dans Kn .
Définition. On appelle système différentiel linéaire sous forme normale
toute équation différentielle de la forme

z $ (x) = Az(x) + f (x), x ∈ R. (8.15)

dont l’inconnue est une fonction z de R dans Kn . Une solution sur R de (8.15)
est une application z de R dans Kn dérivable sur R et vérifiant l’équation en
chaque x ∈ R.
Si
n
$
aj y (j)(x) = h(x) (8.16)
j=0

est une équation différentielle linéaire d’ordre n à coefficients dans K, on peut


la ramener à un système différentiel linéaire sous forme normale en posant

y(x) = z1 (x), y $ (x) = z2 (x), y $$ (x) = z3 (x), . . . , y (n−1) (x) = zn (x),

ce qui entraı̂ne les relations

z1$ = z2 , z2$ = z3 , . . . , zn−1


$
= zn ,
8.5. PROBLÈME DE CAUCHY 311

et, en utilisant l’équation, la relation


n−1
$
aj zj+1 (x) + an zn$ (x) = h(x).
j=0

Dès lors, si y est solution de (8.16), la fonction z(x) = (z1 (x), . . ., zn (x))
vérifie le système différentiel (8.15) avec
 
n
$ aj−1
Az = z2 , z3 , . . . , zn, − zj 
j=1
an

et 4 5
h(x)
f (x) = 0, . . . , 0, .
an
Réciproquement, on vérifie sans peine que si z est solution de (8.15) pour
l’application A et l’application f ci-dessus, sa première composante z1 sera
solution de (8.16).
Définition. Etant donné le système (8.15), x0 ∈ R et z0 ∈ Kn , on appelle
problème de Cauchy de condition initiale z0 en x0 la recherche d’une solution
z sur R de (8.15) telle que
z(x0 ) = z0 .
Dans le cas de l’équation différentielle linéaire à coefficients constants
d’ordre n (8.13), le problème de Cauchy revient, comme on le vérifie immé-
diatement, à rechercher une solution de l’équation telle que

y(x0 ) = y0 , y $ (x0 ) = y1 , . . . , y (n−1)(x0 ) = yn−1 ,

où les yj , (0 ≤ j ≤ n − 1) sont donnés dans K.


Montrons que le problème de Cauchy a au plus une solution.
Proposition. Pour chaque x0 ∈ R et chaque z0 ∈ Kn , il existe au plus une
solution du problème de Cauchy pour l’équation (8.15).
Démonstration. En passant aux parties réelles et imaginaires des com-
posantes de z, le cas où K = C se ramène au cas où K = R avec n remplacé
par 2n. Il suffit donc de considérer le cas où K = R. Si z et w sont solutions
du problème de Cauchy pour (8.15) de condition initiale z0 en x0 , alors, par
soustraction, la fonction u = z − w sera solution du problème de Cauchy

u$ (x) = Au(x), (x ∈ R), u(x0 ) = 0.


312 CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES

Dès lors, par les propriétés élémentaires de la dérivée , on aura


(|u(x)|22)$ = 2(u(x)|u$(x)) = 2(Au(x)|u(x)), x ∈ R.

L’inégalité de Cauchy et les propriétés des applications linéaires entraı̂nent


que
|(Au(x)|u(x))| ≤ |Au(x)|2|u(x)|2 ≤ K|u(x)|22, x ∈ R,
pour une certaine constante positive K, et dès lors, en posant v(x) =
|u(x)|22, x ∈ R, on aura
−2Kv(x) ≤ v $ (x) ≤ 2Kv(x), x ∈ R.
L’inégalité de droite entraı̂ne

v $ (x) exp(−2Kx) − 2Kv(x) exp(−2Kx) ≤ 0,


c’est-à-dire
[v(x) exp(−2Kx)]$ ≤ 0.
En conséquence, v(·) exp(−2K·) est décroissante et, par construction, posi-
tive. Comme elle s’annule en x = x0 , elle doit être nulle pour tout x ≥ x0 et
dès lors v(x) et u(x) sont nuls pour x ≥ x0 . De même, l’inégalité de gauche
entraı̂ne
v $ (x) exp(2Kx) + 2Kv(x) exp(2Kx) ≥ 0,
c’est-à-dire
[v(x) exp(2Kx)]$ ≥ 0.
En conséquence, v(·) exp(2K·) est croissante et, par construction, positive.
Comme elle s’annule en x = x0 , elle doit être nulle pour tout x ≤ x0 et dès
lors v(x) et u(x) sont nuls pour x ≤ x0 . Donc z(x) = w(x) pour tout x ∈ R
et la démonstration est complète.

Corollaire. Si h est une application continue de R dans K, a ∈ R et yj ∈


K, (0 ≤ j ≤ n − 1), le problème de Cauchy
n
$
aj y (j) (x) = h(x), x ∈ R,
j=0

y(x0 ) = y0 , y $ (x0 ) = y1 , . . . , y (n−1)(x0 ) = yn−1


possède au plus une solution sur R.
En combinant ce corollaire avec les théorèmes d’existence obtenus plus
haut, on obtient le théorème d’existence et d’unicité suivant.
8.5. PROBLÈME DE CAUCHY 313

Corollaire. Si h est une combinaison linéaire d’exponentielles-polynômes


de R dans K, x0 ∈ R et yj ∈ K, (0 ≤ j ≤ n − 1), le problème de Cauchy
n
$
aj y (j) (x) = h(x), x ∈ R,
j=0

y(x0 ) = y0 , y $ (x0 ) = y1 , . . . , y (n−1)(x0 ) = yn−1


possède une solution unique sur R.
Remarque. Si I est un intervalle de R, x0 ∈ I, y0 ∈ Rn et f une application
continue de I × Rn dans Rn , le problème de Cauchy (local) de condition
initiale y0 en x0 pour le système différentiel sous forme normale
y $ (x) = f (x, y(x)),
est la détermination d’un sous-intervalle J ⊂ I contenant x0 et d’une solution
y du système différentiel définie sur J et telle que
y(x0 ) = y0 .
Dans le cas d’une équation différentielle du second ordre décrivant le mou-
vement d’un point matériel,
u$$ (x) = g(x, u(x), u$(x)),
et qui peut évidemment s’écrire sous la forme normale équivalente
y1$ (x) = y2 (x), y2$ (x) = g(x, y1(x), y2 (x)),
en posant y1 = u, y2 = u$ , la donnée des conditions de Cauchy revient à la
donnée de la position et de la vitesse à l’instant initial. Le raisonnement fait
plus haut dans le cas d’un système linéaire à coefficients constants montre
que le problème de Cauchy
y $ (x) = f (x, y(x)), y(x0 ) = y0 ,
possède au plus une solution sur tout sous-intervalle J de I contenant x0
lorsque f vérifie sur chaque ensemble du type I × B, où B est un borné de
Rn , la condition de Lipschitz
|f (x, y) − f (x, z)|2 ≤ LB |y − z|2 ,
où LB ≥ 0 est une constante ne dépendant que de B. Le théorème de
la moyenne montre que cette condition de Lipschitz sera satisfaite lorsque
f possède sur I × Rn des dérivées partielles par rapport aux yj qui sont
bornées sur les ensembles I × B. Les méthodes du Chapitre 18 permettront
de démontrer l’existence de cette solution.
314 CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES

8.6 Exercices
1. Montrer que si l’on introduit les fonctions sinus hyperbolique sinh et
cosinus hyperbolique cosh par

exp x − exp(−x) exp x + exp(−x)


sinh x = , cosh x = ,
2 2
alors, si a > 0, les solutions réelles de l’équation différentielle

y (4)(x) − a4 y(x) = 0,

(qui intervient en théorie de l’élasticité) sont données par

y(x) = A sin ax + B cos ax + C sinh ax + D cosh ax,

où A, B, C, D sont des nombres réels arbitraires.


2. Montrer que, si a ∈ R et T > 0, l’équation différentielle

y $$ (x) + ay(x) = 0

possède une solution non nulle vérifiant les conditions aux limites de Dirichlet

y(0) = y(T ) = 0,
si et seulement si
aT 2 = k2 π 2 , (k ∈ N∗ ),
et qu’elle possède une solution non nulle vérifiant les conditions aux limites
de Neumann
y $ (0) = y $ (T ) = 0,
si et seulement si
aT 2 = k2 π 2 , (k ∈ N).
3. Montrer que si a ∈ R et T > 0, l’équation différentielle

y $$ (x) + ay(x) = 0

possède une solution non nulle telle que y(x) = y(x + T ) pour tout x ∈ R
(solution T-périodique) si et seulement si

aT 2 = 4k2 π 2 , (k ∈ N).
8.6. EXERCICES 315

4. On appelle équation différentielle d’Euler toute équation différentielle de


la forme

an xn y (n) (x) + an−1 xn−1 y (n−1) (x) + . . . + a1 xy $ (x) + a0 y(x) = 0,

où n ≥ 1 est un entier et aj ∈ C, (0 ≤ j ≤ n). Une solution sur ]0, +∞[ de


l’équation d’Euler est une fonction y n-fois dérivable sur ]0, +∞[ vérifiant
cette équation sur cet intervalle. Montrer que le changement de variable
défini par
t = log x (et donc x = exp t)
transforme l’équation d’Euler en une équation différentielle linéaire homogè-
ne d’ordre n à coefficients constants pour la nouvelle fonction inconnue z
définie par z(t) = y(exp t).
5. Utiliser les résultats de l’exercice précédent pour montrer que, si n ≥ 2
est un nombre réel, les solutions sur ]0, +∞[ de l’équation différentielle

n−1 $
y $$ (x) + y (x) = 0,
x
sont données par
B
y(x) = A + si n > 2,
xn−2
et
y(x) = A + B log x si n = 2.
6. On dit que l’équation différentielle linéaire à coefficients constants dans
C
n
$
aj y (j) (x) = 0
j=0

est stable si toutes ses solutions sont bornées sur [0, +∞[. Montrer que
l’équation différentielle est stable si et seulement si les deux conditions sui-
vantes sont remplies :
a) toutes les racines caractéristiques de l’équation ont une partie réelle
négative;
b) les racines caractéristiques purement imaginaires sont simples.
On dit que l’équation différentielle ci-dessus est asymptotiquement stable
si toutes ses solutions tendent vers zéro lorsque x tend vers +∞. Montrer
que l’équation différentielle est asymptotiquement stable si et seulement si
toutes ses racines caractéristiques ont une partie réelle strictement négative.
316 CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES

7. On considère l’équation de la chaleur


2
Dtu(t, s) − Dss u(t, s) = 0,

dont les solutions sont des fonction u de R2 dans R de classe C 2 sur R2 .


Cette équation décrit la propagation de la chaleur dans un fil. Déterminer
les solutions de l’équation de la chaleur qui sont de la forme u(t, s) = y(at +
s), avec a un réel non nul et y une fonction de classe C 2 sur R (ondes
progressives). (La fonction y est solution de l’équation différentielle linéaire
à coefficients constants −y $$ (x) + ay $ (x) = 0, ce qui donne

u(t, s) = A + B exp(a2 t + as)).

8. On considère l’équation des télégraphistes


2
Dtt 2
u(t, s) − Dss u(t, s) + cDtu(t, s) = 0,

(c > 0), dont les solutions sont des fonction u de R2 dans R de classe C 2 sur
R2 . Cette équation décrit la propagation des ondes électromagnétiques dans
un fil conducteur. Déterminer les solutions de l’équation des télégraphistes
qui sont de la forme u(t, s) = y(at + s), avec a un réel non nul et y une
fonction de classe C 2 sur R (ondes progressives). (La fonction y est solution
de l’équation différentielle linéaire à coefficients constants (a2 − 1)y $$ (x) +
cay $ (x) = 0, ce qui donne u(t, s) = A si a = ±1 et
4 5
ca
u(t, s) = A + B exp − (at + s)
a −1
2

si a /= ±1).
9. On considère l’équation différentielle

mh$$ (x) + rh$ (x) = −mg,

introduite au premier paragraphe, où m > 0, r > 0 et g > 0. Déterminer les


solutions et montrer que, pour toute solution h de cette équation, on a
mg
lim h$ (x) = − .
x→+∞ r
(Vitesse limite de chute en présence d’un frottement sous l’action de la pe-
santeur).
10. On considère l’équation différentielle

y $$ (x) + by $ (x) + ay(x) = A sin ωx,


8.7. PETITE ANTHOLOGIE 317

où a > 0, b > 0, ω > 0 et A ∈ R. Déterminer les solutions réelles de cette


équation et montrer que si θ est déterminé par la relation


tg θ = ,
a − ω2
et si y est une solution quelconque de l’équation différentielle, alors
2 3
A
lim y(x) − sin(ωx − θ) = 0.
x→∞ [(a − ω ) + ω 2 b2 ]1/2
2 2

On dit que les solutions de cette équation s’approchent du régime station-


naire donné par ys (x) = [(a−ω2 )2A+ω2 b2 ]1/2 sin(ωx − θ).
11. Montrer que, si ω et Ω sont des nombres réels, les systèmes d’équations
différentielles réelles

u$$ (x) + ωv $ (x) = 0, v $$(x) − ωu$ (x) = 0,

et

u$$ (x) + 2ωv $ (x) + Ω2 u(x) = 0, v $$ (x) − 2ωu$ (x) + Ω2 v(x) = 0,

peuvent se résoudre par la méthode introduite dans ce chapitre.


Suggestion. En posant y = u + iv, les ramener respectivement aux équations
différentielles linéaires complexes

y $$ (x) − iωy $ (x) = 0, y $$ (x) − 2iωy $ (x) + Ω2 y(x) = 0.

Discuter la nature géométrique de la solution dans le plan complexe. Ces


systèmes interviennent dans différents problèmes de mécanique et de physi-
que mathématique (pendule de Foucault, précession de Larmor).

8.7 Petite anthologie


Monsieur Euler est même parvenu à . . . résoudre l’équation générale

dn y dn−1 y
a + b + . . . + X = 0.
dxn dxn−1
Il se sert à cet effet de la substitution adroite de la quantité exponentielle
Acf x (où c est la quantité dont le logarithme est égal à 1), et de ses différen-
tielles successives, au lieu de y, dy, ddy, etc.; cette substitution transforme
318 CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES

l’équation proposée en une autre, qui devient une simple équation finie, telle
que
(1 + bf + af 2 ) = 0, lorsque n = 2, ou

(1 + cf + bf 2 + af 3 ) = 0, si n = 3, etc.

Ayant donc trouvé les différentes valeurs de f suivant le degré de l’équation,


et mettant ces différentes valeurs au lieu de f, dans Acf x , on aura autant de
valeurs de y, puisque y = Acf x ; et ces différentes valeurs jointes ensemble
donneront l’intégrale complète de l’équation proposée. Il y a, à la vérité,
ici quelques cas qui pourroient embarrasser, savoir quand quelques-unes des
valeurs de f sont, ou égales, ou imaginaires; mais Euler résout ces difficultés.
Euler avoit d’abord été arrêté par la limitation que X fut égal à zéro; mais
dans la suite, il surmonta cette difficulté; en perfectionnant sa méthode, il
montra comment on pouvoit résoudre complètement l’équation ci-dessus, X
étant une fonction quelconque de x; mais la méthode est trop compliquée,
quoique sûre et complète, pour en pouvoir donner ici même une esquisse.

Jean-Etienne de Montucla, 1802

L’oscillateur harmonique que nous allons étudier possède des équivalents


très proches dans beaucoup de domaines; bien que partant de l’exemple mé-
canique d’un poids au bout d’un ressort, ou de petites oscillations d’un pen-
dule, ou encore d’autres appareils mécaniques, nous ne faisons en réalité
qu’étudier une certaine équation différentielle. Cette équation apparaı̂t très
souvent en physique comme dans d’autres sciences, et de fait, elle est sous-
jacente à tant de phénomènes que cela vaut bien la peine de l’étudier. Parmi
ces phénomènes, il y a les oscillations d’une masse accrochée à un ressort;
les oscillations des charges allant et venant dans un circuit électrique; les
vibrations d’un diapason créant des ondes sonores, les vibrations analogues
des électrons dans un atome engendrant des ondes lumineuses; les équations
de fonctionnement d’un servo-mécanisme comme un thermostat régulant la
température; des interactions compliquées au sein de réactions chimiques;
la croissance d’une population de bactéries en interaction avec l’apport de
nourriture et les poisons produits par ces bactéries; des renards mangeant des
lapins mangeant de l’herbe, etc. Tous ces phénomènes suivent des équations
qui sont très semblables les unes aux autres. Ces équations sont appelées
équations différentielles linéaires à coefficients constants.

Richard P. Feynman, 1963


8.7. PETITE ANTHOLOGIE 319

Les équations linéaires [à coefficients constants] constituent pratiquement


l’unique importante classe d’équations différentielles dont la théorie est re-
lativement complète. Cette théorie qui en fait est une branche de l’algèbre
linéaire permet de résoudre totalement les équations linéaires autonomes.
La théorie des équations linéaires est par ailleurs utile comme première ap-
proximation dans la résolution de problèmes non linéaires. Elle permet entre
autres d’étudier la stabilité de l’équilibre dans les cas génériques.

Vladimir I. Arnold, 1974

Une intelligence qui, pour un instant donné, connaı̂trait toutes les forces
dont la nature est animée et la situation respective des êtres qui la composent,
si d’ailleurs elle était assez vaste pour soumettre ces données à l’Analyse,
embrasserait dans la même formule les mouvements des plus grands corps
de l’univers et ceux du plus léger atome; rien ne serait incertain pour elle,
et l’avenir, comme le passé, serait présent à ses yeux.

Simon de Laplace, 1795

Dans mes leçons données à l’Ecole Polytechnique, comme dans la plu-


part des Ouvrages ou Mémoires que j’ai publié sur le Calcul intégral, j’ai
cru devoir renverser cet ordre et placer en premier lieu la recherche, non pas
des intégrales générales, mais des intégrales particulières; en sorte que la
détermination des constantes ou des fonctions arbitraires ne fut plus séparée
de la recherche des intégrales. ... Les constantes arbitraires, que doivent
renfermer les intégrales générales d’un système d’équations différentielles du
premier ordre, se trouvent remplacées par des valeurs particulières des incon-
nues, correspondant à une valeur particulière de la variable indépendante, et
par conséquent le problème de l’intégration se trouve réduit à un problème
complètement déterminé.

Augustin Cauchy, 1842

Une cause très petite, qui nous échappe, détermine un effet considérable
que nous ne pouvons pas ne pas voir, et alors nous disons que cet effet est
dû au hasard. Si nous connaissions exactement les lois de la nature et la
situation de l’univers à l’instant initial, nous pourrions prédire exactement
la situation de ce même univers à un instant ultérieur. Mais, lors même
que les lois naturelles n’auraient plus de secret pour nous, nous ne pourrons
connaı̂tre la situation initiale qu’approximativement. Si cela nous permet
de prévoir la situation ultérieure avec la même approximation, c’est tout ce
320 CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES

qu’il nous faut, nous disons que le phénomène a été prévu, qu’il est régi par
des lois; mais il n’en est pas toujours ainsi, il peut arriver que de petites
différences dans les conditions initiales en engendrent de très grandes dans
les phénomènes finaux; une petite erreur sur les premières produirait une
erreur énorme sur les derniers. La prédiction devient impossible et nous
avons le phénomène fortuit.

Henri Poincaré, 1907

Le problème de Cauchy apparaı̂t en mécanique : le mouvement d’un


système mécanique doit être calculé à partir des lois du mouvement, qui for-
ment un système différentiel, et des positions et vitesses initiales, qui sont
les données définissant une solution particulière de ce système. Le problème
de Cauchy pour les systèmes différentiels ordinaires a été, bien entendu, le
plus important problème mathématique tant que l’artillerie a régi le monde,
tant que la mécanique céleste a été la théorie scientifique principale et tri-
omphante.

Jean Leray, 1963


Chapitre 9

Fonctions primitivables

9.1 Fonctions primitivables et primitives


Le chapitre précédent a montré comment déterminer les solutions d’équa-
tions différentielles linéaires de la forme
n
$
L(D)y(x) ≡ aj y j (x) = f (x),
j=0

lorsque les aj sont des nombres complexes et f une exponentielle-polynôme.


Le problème de la détermination des solutions de telles équations pour des
classes plus générales de seconds membres f est un problème difficile (et
parfois impossible), même dans le cas le plus simple où l’équation se réduit

y $ (x) = f (x),
c’est-à-dire lorsqu’il s’agit de déterminer les fonctions qui sont les dérivées
d’une fonction donnée (problème inverse de la dérivation).
Soit I un intervalle et f une fonction de R dans Rp définie sur I.
Définition. On dit que f est primitivable sur I s’il existe une fonction F
de R dans Rp dérivable sur I et telle que

F $ (x) = f (x)

pour chaque x ∈ I. Une telle fonction s’appelle une primitive de f sur I.


Pour rappeler la contribution fondamentale d’Isaac Newton à l’élabora-
tion et à l’étude de cette notion, on désignera par N (I, Rp) l’ensemble des

321
322 CHAPITRE 9. FONCTIONS PRIMITIVABLES

fonctions f de R dans Rp qui sont primitivables sur I. Comme la fonction


nulle sur I admet toute fonction constante sur I comme primitive sur I, on
voit que N (I, Rp) n’est pas vide. On voit aussi que, si la primitive de f sur
I existe, elle n’est pas nécessairement unique. En traduisant, en termes de
primitives, le fait qu’une fonction a une dérivée nulle sur un intervalle si et
seulement si elle y est constante, on obtient le résultat suivant.

Proposition. Soit f une fonction de R dans Rp primitivable sur l’intervalle


I. Si F est une primitive de f sur I, alors la fonction G de R dans Rp est
une primitive de f sur I si et seulement si la fonction F − G est constante
sur I.

Démonstration. La condition suffisante est facile puisque, pour tout x ∈


I, on a, si F − G est constante sur I,

G$ (x) = F $ (x) + (G − F )$ (x) = F $ (x) = f (x).

En ce qui concerne la condition nécessaire, on a, par hypothèse, pour tout


x ∈ I,
(F − G)$ (x) = F $ (x) − G$ (x) = f (x) − f (x) = 0,

et dès lors F − G est constante sur I.

Corollaire. Soit f une fonction de R dans Rp primitivable sur l’intervalle


I. Pour chaque a ∈ I et chaque c ∈ Rp il existe une primitive unique F de
f telle que
F (a) = c.

Démonstration. Si G est une primitive de f sur I vérifiant la même


condition, alors, par la proposition précédente, F − G est constante sur I
et, par hypothèse, F (a) − G(a) = 0. Donc F = G sur I et l’unicité est
démontrée.

En particulier, l’unique
H
primitive F de f sur I telle que F (a) = 0 sera
désignée par Fa ou a· f . Les primitives de f sur I seront donc toutes de la
forme Fa + c où c ∈ Rp est arbitraire et, si G est une primitive quelconque
de f sur I, on a évidemment Fa = G − G(a).
La proposition ci-dessus nous conduit à introduire sur l’ensemble des
fonctions de R dans Rp définies sur l’intervalle I la relation = définie comme
suit.
9.1. FONCTIONS PRIMITIVABLES ET PRIMITIVES 323

Définition. Si g et h sont deux fonctions de R dans Rp définies sur l’inter-


valle I, on écrira
g=h
si g − h est constante sur I.
On vérifie sans peine que = est une relation d’équivalence sur l’ensemble
des fonctions de R dans Rp définies sur I. Si fI et gI sont deux classes
d’équivalence pour = contenant respectivement les fonctions f et g, on
pourra définir la somme fI+ gI par la classe d’équivalence contenant f + g (on
voit sans peine que cette définition ne dépend pas du choix des représentants
f et g), et l’on définira, pour c ∈ R, cfI comme étant la classe d’équivalence
de cf .
La proposition ci-dessus exprime donc qu’à toute fonction f primitivable
sur I correspond une et une seule classe d’équivalence pour = de l’ensemble
des fonctions de RHdans Rp définies sur I. On désigne en général cette classe
d’équivalence par f ou D −1 f et il faut signaler l’abus de notation, consacré
par l’usage, consistant parfois à désigner par le même symbole un élément
choisi dans cette classe d’équivalence, c’est-à-dire une primitive de f sur I.
De nombreuses fonctions élémentaires sont désignées en pratique par
leur valeur en un point x de leur domaine de définition (ainsi l’on parle de
la fonction x2 pour la fonction qui à x associe x2 ) et la notation ci-dessus
est mal adaptée pour de telles fonctions; on utilise alors la notation
J J J
f (x) dx ou f (t) dt ou f (u) du.

Avec l’abus de notation signalé plus haut, chacune de ces expressions désigne
aussi une primitive de f sur I et non sa valeur en un point x (ou t ou u) !
C’est le rôle du symbole dx ou dt ou du d’annuler l’apparente dépendance
des expressions ci-dessus par rapport à x, t ou u. Les symboles x, t ou u
jouent dans ces formules un rôle “muet” analogue à celui de l’indice dans
une formule sommatoire. Par exemple, on vérifie sans peine que la fonctionH
x 2→ x3 /3 est une primitive sur R de la fonction x 2→ x2 . Dès lors, x2 dx
représente la classe d’équivalence des fonctions f + c où f (x) = x3 /3 et c est
une constante réelle.
Signalons également que deux primitives d’une fonctions donnée sur un
intervalle donné, qui diffèrent entre elles par une constante additive, peuvent
avoir des expressions qui dissimulent sournoisement cette relation simple.
Ainsi, pour chaque c ∈ R, les fonctions x 2→ sin x et x 2→ 2 sin x+c 2 cos 2
x−c

sont deux primitives sur R de la fonction x 2→ cos x, puisque la seconde


324 CHAPITRE 9. FONCTIONS PRIMITIVABLES

fonction n’est rien d’autre que la fonction x 2→ sin x + sin c et celle-ci diffère
de la fonction x 2→ sin x par la constante sin c.
Les fonctions primitivables et leurs primitives possèdent les propriétés
élémentaires suivantes.
Proposition. Si f ∈ N (I, Rp) et g ∈ N (I, Rp), on a les propriétés suivantes.
1. f ∈ N (J, Rp) pour tout intervalle J ⊂ I et la restriction à J de toute
primitive sur I de f est une primitive sur J de f .
2. f + g ∈ N (I, Rp) et
J J J
(f + g) = f+ g.

H H
3. cf ∈ N (I, Rp) pour tout c ∈ R et cf = c f. H
4. Chaque composante fj de f appartient à N (I, R), 1 ≤ j ≤ p et fj est la
classe d’équivalence de la jème composante d’une primitive quelconque de f
sur I.
5. Si f ∈ N (I, C), c’est-à-dire si f ∈ N (I, R2) avec R2 muni de la structure
de corps, alors, cf ∈ N (I, C) pour tout c ∈ C et
J J
cf = c f.

Démonstration. Les propriétés 1 à 5 sont des conséquences immédiates


des définitions et des propriétés élémentaires des dérivées.
Cette proposition montre que N (I, Rp) (resp. N (I, C)) est un espace
vectoriel sur R (resp. C). Elle nous permet de trouver des classes de fonc-
tions primitivables sur I par combinaison linéaire de fonctions élémentaires
primitivables sur I. De telles fonctions s’obtiennent facilement en lisant “de
droite à gauche” un tableau donnant les dérivées de fonctions élémentaires.
On obtient ainsi le tableau suivant de fonctions appartenant à N (R, R).

Fonctions Primitives
m+1
x 2→ xm , m ∈ N x 2→ xm+1 + c
x 2→ exp x x 2→ exp x + c
x 2→ sin x x 2→ − cos x + c
x 2→ cos x x 2→ sin x + c
1
x 2→ 1+x 2 x 2→ arctg x + c
1
x 2→ √1+x 2 x 2→ arcsinh x + c
x 2→ sinh x x 2→ cosh x + c
x 2→ cosh x x 2→ sinh x + c
9.1. FONCTIONS PRIMITIVABLES ET PRIMITIVES 325

On déduit aussitôt de ce tableau et de la proposition précédente que si


K désigne R ou C, les fonctions polynômiales de R dans K appartiennent à
N (R, K).
Les fonctions élémentaires suivantes appartiennent à N (R∗+ , R) et à
N (R∗− , R) :
Fonctions Primitives
−m+1
x 2→ x , m /= 1 x 2→ x−m+1 + c
−m

x 2→ x−1 x 2→ ln |x| + c
Enfin, les fonctions x 2→ xa , a /∈ Z sont dans N (R∗+ , R) et ont pour primitives
a+1
les fonctions x 2→ xa+1 + c, (c ∈ R), les fonctions x 2→ exp ax, où a ∈ K, sont
dans N (R, K) et ont pour primitives les fonctions x 2→ a−1 exp ax+c, (c ∈ K)
et la fonction x 2→ √1−x
1
2 appartient à N (] − 1, 1[, R) et a pour primitives les

fonctions x 2→ arcsin x + c(c ∈ R).


On trouvera de nombreux autres exemples dans les tables de primi-
tives, également appelées, pour des raisons que nous verrons plus loin, tables
d’intégrales.
Nous reviendrons plus tard sur l’obtention de classes de fonctions ap-
partenant à N (I, Rp) pour un certain intervalle I. En particulier, nous
montrerons que toute fonction de R dans Rp continue sur I appartient à
N (I, Rp). Par ailleurs, N (I, Rp) contient des fonctions non continues sur I.
Ainsi, la fonction F de R dans R définie par
1
F (x) = x2 sin si x /= 0, F (0) = 0,
x2
possède en chaque point x /= 0 la dérivée
1 2 1
F $ (x) = 2x sin − cos 2
x2 x x
et en 0 la dérivée F $ (0) = 0, ainsi qu’on le vérifie aisément. Mais la fonction
f = F $ , primitivable sur R, n’est pas continue en 0 puisque limx→0 f (x)
n’existe pas. On notera en outre que la fonction f n’est bornée sur aucun
intervalle contenant l’origine. Donc N (I, Rp) contient des fonctions non
bornées.
On peut se demander s’il existe des fonctions réelles définies sur R et qui
n’appartiennent pas à N (R, R). La réponse affirmative résultera aisément
de la propriété de valeur intermédiaire ou propriété de continuité
de Darboux qui est une condition nécessaire pour qu’une fonction soit
primitivable sur un intervalle.
326 CHAPITRE 9. FONCTIONS PRIMITIVABLES

Proposition. Soit I ⊂ R un intervalle et f ∈ N (I, R). Alors f vérifie la


propriété de valeur intermédiaire sur I. En d’autres termes, pour chaque
x ∈ I, chaque y ∈ I tel que x < y et chaque v compris entre f (x) et f (y), il
existe un z ∈ [x, y] tel que f (z) = v.
Démonstration. Comme dans la démonstration du théorème de Bolzano,
on peut, sans perte de généralité, supposer que f (x) < v < f (y). Soit F une
primitive de f sur I et soit G la fonction de R dans R définie par

G(t) = F (t) − vt.

G est évidemment dérivable sur I et

G$ (t) = f (t) − v,

pour chaque t ∈ I, ce qui entraı̂ne en particulier que

G$ (x) < 0 < G$ (y).


"
En prenant ! = − G 2(x) dans la définition de la dérivée de G en x, on trouve
un δ ∈ ]0, y − x] tel que, pour tout t ∈ ]x, x + δ], on a

G$ (x) G(t) − G(x) G$ (x)


≤ − G$ (x) ≤ − ,
2 t−x 2
et dès lors
G(t) − G(x) G$ (x)
≤ < 0,
t−x 2
ce qui implique, pour chaque t ∈ ]x, x + δ], l’inégalité

G(t) < G(x).

En procédant d’une manière similaire en y, on trouve un δ $ ∈ ]0, y − x] tel


que
G(t) < G(y)
pour tout t ∈ [y − δ $ , y[. Comme G, dérivable sur [x, y], y est continue,
le théorème des bornes atteintes de Weierstrass entraı̂ne l’existence d’un
minimant z de G sur [x, y] et les deux inégalités que nous venons d’obtenir
montrent que, nécessairement, z ∈ ]x, y[, et est donc intérieur au domaine
de G. Le théorème de Fermat entraı̂ne alors que G$ (z) = 0, c’est-à-dire que
f (z) = v.
9.2. RÈGLES DE PRIMITIVATION 327

Remarque. Le résultat que nous venons de démontrer montre que la pro-


priété de valeur intermédiaire, vérifiée par les fonctions réelles continues sur
un intervalle, peut également l’être par des fonctions non continues sur cet
intervalle, et ne peut donc être prise, ainsi qu’on l’a fait parfois dans le
passé, comme définition de fonction continue sur un intervalle. En fait, on
sait maintenant qu’une fonction ayant la propriété de valeur intermédiaire
sur R peut être discontinue en chaque point de R !
Il résulte de la proposition précédente que toute fonction qui, sur un
intervalle I de R, prend un nombre fini strictement supérieur à un de valeurs
réelles ne peut appartenir à N (I, R) puisqu’elle ne peut vérifier la propriété
de valeur intermédiaire. Ainsi, la fonction sgn x (signe de x) définie par
sgn x = −1 pour x < 0, sgn 0 = 0 et sgn x = +1 pour x > 0 n’est primiti-
vable sur aucun intervalle contenant l’origine.

9.2 Règles de primitivation


Les règles de dérivation des fonctions composées et du produit de deux fonc-
tions se traduisent, dans le langage des primitives, en conditions suffisantes
de primitivabilité et en règles de calcul des primitives. Le premier résultat
s’appelle la règle de primitivation par substitution.
Proposition. Soit g une fonction réelle dérivable sur l’intervalle I ⊂ R et f
une fonction de R dans Rp primitivable sur g(I). Alors (f ◦ g)g $ ∈ N (I, Rp)
et J J
(f ◦ g)g $ = ( f ) ◦ g.

Démonstration. Si F désigne une primitive de f sur g(I), le théorème


de dérivation des fonctions composées entraı̂ne la dérivabilité sur I de la
fonction F ◦ g et la relation

(F ◦ g)$ = (F $ ◦ g)g $ = (f ◦ g)g $,

ce qui montre que (f ◦ g)g $ ∈ N (I, Rp) et que la formule de l’énoncé est
satisfaite.

Exemple. Si f ∈ N ([−1, 1], Rp), alors les fonctions x 2→ f (sin x) cos x et


x 2→ f (cos x) sin x appartiennent à N (R, Rp) et leurs primitives sont données
respectivement par F ◦ sin +c et F ◦ cos +c où F est une primitive de f sur
[−1, 1].
328 CHAPITRE 9. FONCTIONS PRIMITIVABLES

Corollaire. Si f ∈ N (I, Rp), alors pour tout réel a /= 0, la fonction f (a·) :


x 2→ f (ax) est primitivable sur a−1 I et l’on a
J 4J 5
f (a·) = a−1 f (a·).

Démonstration. Il suffit d’appliquer la proposition précédente avec g


définie par g(x) = ax et le fait que N (a−1 I, Rp) est un espace vectoriel.
Une autre conséquence du théorème de dérivation des fonctions com-
posées est la règle de primitivation par changement de variable.
Proposition. Soient I et J deux intervalles de R et h une bijection de J
sur I telle que h et h−1 soient dérivables sur J et I respectivement. Si f est
une fonction de R dans Rp définie sur I et si (f ◦ h)h$ est primitivable sur
J, alors f est primitivable sur I et
J 4J 5
f= (f ◦ h)h$ ◦ h−1 .

Démonstration. Par hypothèse, si G désigne une primitive de (f ◦ h)h$


sur J, le théorème de dérivation des fonctions composées appliqué à G ◦ h−1
entraı̂ne sa dérivabilité sur I et la formule

[G ◦ h−1 ]$ = (G$ ◦ h−1 )(h−1 )$ = f.(h$ ◦ h−1 ).(h−1 )$ = f,

puisque, de l’identité h ◦ h−1 = I sur I, on déduit, par le théorème de


dérivation des fonctions composées,

1 = (h ◦ h−1 )$ = (h$ ◦ h−1 )(h−1 )$ .

Donc f est primitivable sur I et la formule de l’énoncé est satisfaite.


Remarque. Avec les notations de la Proposition ci-dessus, on vérifie aisé-
ment que la formule
J 4J 5
f= (f ◦ h)h$ ◦ h−1

reste valable si h−1 n’est plus supposé dérivable sur I à condition de supposer
que f est primitivable sur I.
Exemple. Si P est un polynôme de R dans C et si f est définie par f (x) =

P ( x), alors f ∈ N (R∗+ ) et
J

f = Q( ·),
9.2. RÈGLES DE PRIMITIVATION 329

pour toute primitive Q du polynôme P̃ : y 2→ 2yP (y). En effet, l’application


h : R∗+ → R∗+ , y 2→ y 2 est une bijection dérivable ainsi que sa réciproque, et
h$ (y) = 2y. Dès lors,

f (h(y))h$ (y) = 2yf (y 2 ) = 2yP (y) = P̃ (y)


pour tout y strictement positif, ce qui entraı̂ne que (f ◦h)h$ , égal sur R∗+ à un
polynôme de R dans C, y est primitivable. Par la proposition ci-dessus, f est
primitivable sur R∗+ et ses primitives sont données par la formule annoncée.
Le résultat suivant, qui s’appelle la règle de primitivation par par-
ties, découle du théorème de dérivation d’un produit de fonctions.
Proposition. Soient f et g deux fonctions à valeurs dans K dérivables sur
un intervalle I ⊂ R. Alors f $ g ∈ N (I, K) si et seulement si f g $ ∈ N (I, K),
auquel cas l’on a J J
f $g = f g − f g $.

Démonstration. Le théorème de dérivation d’un produit de fonctions


entraı̂ne la dérivabilité de f g sur I et la formule

(f g)$ = f $ g + f g $ .
Comme (f g)$ est évidemment primitivable sur I, avec f g comme primitive,
il suffit d’utiliser le caractère d’espace vectoriel de N (I, K) pour achever la
démonstration.
Exemples. 1. La fonction ln est primitivable sur tout intervalle I ⊂ R∗+ et
ses primitives sont données par les fonctions x 2→ x ln x − x + c. En effet,
en prenant f (x) = x, g(x) = ln x, on voit que, pour tout x ∈ R∗+ , on a
ln x = f $ (x)g(x), f (x)g(x) = x ln x et f (x)g $ (x) = 1; donc f g $ est primi-
tivable sur I et ses primitives sont données par la formule ci-dessus.
2. Si P est un polynôme de R dans K et a ∈ K \ {0}, toute exponentielle-
polynôme f : x 2→ P (x). exp ax est primitivable sur R. Pour le montrer, on
procède par récurrence sur le degré du polynôme P . C’est évidemment vrai,
par les résultats qui précèdent, si P est un polynôme de degré zéro. Sup-
posons le résultat vrai pour un polynôme de degré n−1 et soit P un polynôme
de degré n. Alors P $ est un polynôme de degré n−1 et P $ (·). exp(a·) est prim-
itivable sur R par l’hypothèse de récurrence. Il en sera de même, par la règle
de primitivation par parties, pour la fonction P (·).(exp(a·))$ = aP (·). exp(a·)
et dès lors pour P (·). exp(a·). En outre, on a
J J
P (·). exp(a·) = a−1 P (·). exp(a·) − a−1 P $ (·). exp(a·),
330 CHAPITRE 9. FONCTIONS PRIMITIVABLES

et en appliquant cette formule successivement à P $ (·). exp(a·), P $$(·). exp(a·),


. . . et en recombinant les résultats, on obtient la formule
J
P (·). exp(a·) =

[a−1 P (·)−a−2 P $ (·)+. . .+(−1)n−1 a−n P (n−1) (·)+(−1)na−n−1 P (n) (·)] exp(a·).
Montrons enfin que la théorie des primitives fournit une expression du
reste du développement de Taylor d’une fonction réelle d’une variable.
Proposition. Si m ≥ 0 est un entier et si f est une fonction réelle (m + 1)-
fois dérivable sur un intervalle I, alors, pour chaque a ∈ I, et chaque h ∈ I −a
différent de 0, l’application

f (m+1) (y)
φh : I → R, y 2→ (a + h − y)m
m!
est primitivable sur I et sa primitive Φh,a qui s’annule en a est égale à la
f,a (h) en h du reste du développement de Taylor Tf,a d’ordre m de
valeur Rm m

f autour de a.
Démonstration. Définissons l’application g de I dans R par
m
$ f (j) (y)
g(y) = (a + h − y)j .
j=0
j!

Par hypothèse, g est dérivable sur I, g(a) = Tf,a


m
(h), g(a + h) = f (a + h) et,
pour chaque y ∈ I, on a
m m
$ f (j+1)(y) $ f (j) (y)
g $ (y) = (a + h − y)j − (a + h − y)j−1
j=0
j! j=1
(j − 1)!

f (m+1) (y)
= (a + h − y)m = φh (y).
m!
Donc φh est primitivable et la valeur en a + h de sa primitive s’annulant en
a est donnée par

g(a + h) − g(a) = f (a + h) − Tf,a


m
(h) = Rm
f,a(h).
9.3. PRIMITIVATION DES FONCTIONS RATIONNELLES 331

9.3 Primitivation des fonctions rationnelles


Soit f une fonction rationnelle de R dans K, où K = R ou C, c’est-à-
dire une fonction de la forme f = PQ où P et Q sont des polynômes d’une
variable réelle à coefficients dans K. Si le degré de P est supérieur ou égal
au degré de Q, on peut toujours écrire, en utilisant l’algorithme de division
des polynômes,
P R
=S+
Q Q
où S et R sont des polynômes d’une variable réelle à valeurs dans K tels
que le degré de R est strictement inférieur à celui de Q. Comme S est
primitivable et que l’on possède une formule pour calculer sa primitive, Q P

sera primitivable si et seulement s’il en est de même de R Q ; il suffit donc


d’étudier la primitivabilité de f sous l’hypothèse que le degré de P est
strictement inférieur à celui de Q. Rappelons aussi que Q P
est définie sur
le complémentaire dom Q dans R de l’ensemble des zéros réels de Q et qu’il
P

faut donc entendre par primitivabilité de PQ sa primitivabilité sur chacun des


intervalles ouverts qui forment dom PQ . Enfin, si m désigne le degré de Q,
c’est-à-dire si l’on peut écrire
m
$
Q(x) = aj xj
j=0

avec am /= 0, alors, comme on l’a déjà signalé, le théorème fondamental de


l’algèbre affirme l’existence de q ≤ m nombres complexes distincts s1 , . . ., sq
les racines de l’équation Q(x) = 0, et de q entiers m1 , . . . , mq supérieurs ou
égaux à un, leurs multiplicités, tels que, pour tout x ∈ R, on a

Q(x) = am (x − s1 )m1 (x − s2 )m2 . . . (x − sq )mq .

Enfin, rappelons que l’ensemble des polynômes de R dans K de degré infé-


rieur ou égal à m, muni des lois habituelles d’addition des polynômes et de
multiplication d’un polynôme par un élément de K, forme un espace vectoriel
sur K de dimension m+1 dont une base évidente est donnée par les monômes
1, x, . . ., xm. Une autre base très utile est donnée par le résultat d’algèbre
suivant, qui se démontre par récurrence.
Lemme. Si Q est le polynôme de R dans C de degré effectif m donné par

Q(x) = am (x − s1 )m1 (x − s2 )m2 . . . (x − sq )mq ,


332 CHAPITRE 9. FONCTIONS PRIMITIVABLES

alors les polynômes Qj,k de R dans C donnés par

Qj,k (x) = am (x − s1 )m1 . . . (x − sj )mj −k . . . (x − sq )mq ,

(1 ≤ k ≤ mj , 1 ≤ j ≤ m),
et obtenus en divisant Q respectivement par (x − sj )k , 1 ≤ k ≤ mj , 1 ≤
j ≤ m, forment une base de l’espace vectoriel des polynômes de R dans C
de degré inférieur ou égal à m − 1.
Une conséquence facile de ce lemme est le résultat suivant.
Corollaire. Si Q est donné par le lemme précédent et si P est un polynôme
de R dans C de degré inférieur ou égal à m − 1, il existe une famille unique
de nombres complexes cj,k , (1 ≤ k ≤ mj , 1 ≤ j ≤ m) telle que, pour tout
x ∈ dom PQ , on a

q mj , -
P (x) $ $
= cj,k (x − sj )−k .
Q(x) j=1 k=1

Ce corollaire entraı̂ne que la primitivabilité de PQ , et le calcul de ses


primitives, revient à celle des fonctions rationnelles particulières du type

g(x) = (x − s)−k

où s ∈ C et k ∈ N∗ . On vérifie sans peine que, pour k ≥ 2, on a, sur chaque


intervalle de R \ {s}, g(x) = G$ (x) pour

G(x) = c + (1 − k)−1 (x − s)−k+1 ,

c étant un nombre complexe arbitraire. Par conséquent, une telle fonction


rationnelle f est primitivable sur chaque intervalle en question et ses primi-
tives sont données par la formule ci-dessus. Si nous posons s = u + iv avec
u la partie réelle de s et v la partie imaginaire de s, les primitives G de g
peuvent encore s’écrire, avec s̄ = u − iv,

(x − s̄)k−1
F (x) = c + (1 − k)−1 .
[(x − u)2 + v 2 ]k−1
Si k = 1 et s = 0, g est primitivable sur R∗− et sur R∗+ et ses primitives G y
sont données par la formule

G(x) = c + ln |x|,
9.3. PRIMITIVATION DES FONCTIONS RATIONNELLES 333

où c est une constante complexe arbitraire. Si k = 1 et s = u est réel, g


est primitivable sur R∗− et sur R∗+ et ses primitives G y sont données par la
formule
G(x) = c + ln |x − u|.
Enfin, si k = 1 et v /= 0, alors, pour tout x ∈ R, on a
x−u iv
g(x) = +
(x − u) + v
2 2 (x − u)2 + v 2
2 3
d ? @ d x−u
= (1/2) ln[(x − u)2 + v 2 ] + i arctg
dx dx v
en utilisant les règles de dérivation des fonctions élémentaires et le théorème
de dérivation des fonctions composées. En conséquence, les primitives G de
g sont données par la formule
x−u
G(x) = c + (1/2) ln[(x − u)2 + v 2 ] + i arctan .
v
En conclusion, quels que soient s ∈ C et k ∈ N∗ , la fonction g est pri-
mitivable sur chaque intervalle contenu dans son domaine et les formules
ci-dessus fournissent les primitives dans les différents cas. Ces résultats,
joints au corollaire ci-dessus et au caractère d’espace vectoriel de N (I, K),
impliquent la primitivabilité de PQ sur tout intervalle I contenu dans son
domaine et fournissent explicitement ses primitives.
La méthode que nous venons de développer s’applique bien entendu au
cas particulier des fonctions rationnelles de R dans R mais l’on sait que les
zéros sj d’un polynôme Q réel peuvent être complexes non réels ainsi que
les coefficients cj,k donnés par le corollaire ci-dessus. Si PQ est une fonction
rationnelle de R dans R, il est intéressant d’exprimer ses primitives en termes
purement réels. Pour ce faire, rappelons que si Q est réel et si sj est un zéro
non réel de Q de multiplicité mj , alors sj sera également un zéro de Q de
même multiplicité mj . En conséquence, les zéros de Q pourront être rangés
comme suit
r1 , . . . , rl , t1 , . . . , tn , t1 , . . . , tn ,
avec les multiplicités respectives
m1 , . . . , ml , m$1 , . . . , m$n, m$1 , . . . , m$n ,
%l
où les rj sont réels, les tj sont complexes non réels, l + 2n = q et j=1 mj +
%
2 nj=1 m$j = m. On a donc, par le corollaire ci-dessus
l mj n m"j
P (x) $ $ $$
= cj,k (x − rj )−k + [c$j,k (x − tj )−k + c$$j,k (x − tj )−k ],
Q(x) j=1 k=1 j=1 k=1
334 CHAPITRE 9. FONCTIONS PRIMITIVABLES

les constantes complexes cj,k , c$j,k et c$$j,k étant univoquement déterminées.


En égalant le complexe conjugué des deux membres de cette égalité et en
utilisant le caractère réel de x, P (x), Q(x) et rj , on obtient

mj n $D m"j
P (x) $l $ $ E
= cj,k (x − rj )−k + c$j,k (x − tj )−k + c$$j,k (x − tj )−k ,
Q(x) j=1 k=1 j=1 k=1

et dès lors l’unicité des constantes cj,k , c$j,k et c$$j,k entraı̂ne que

cj,k = cj,k , (1 ≤ k ≤ mj ; 1 ≤ j ≤ l),

c$j,k = c$$j,k , (1 ≤ k ≤ m$j ; 1 ≤ j ≤ l).


Les fonctions cj,k (x − rj )−k sont réelles et primitivables sur ] − ∞, rj [ et
]rj , +∞[, et y ont comme primitives les fonctions

x 2→ c + cj,k (1 − k)−1 (x − rj )−k+1 ,

si k /= 1, et
x 2→ c + cj,k ln |x − rj |,
si k = 1, où c est une constante réelle arbitraire. Par ailleurs, les fonctions

x 2→ c$j,k (x − tj )−k + c$$j,k (x − tj )−k = c$j,k (x − tj )−k + c$j,k (x − tj )−k

c$j,k (x − tj )k + c$j,k (x − tj )k Pk (x)


= = ,
[(x − uj )2 + vj2 ]k [(x − uj )2 + vj2 ]k
où l’on a posé tj = uj + ivj et où Pk désigne un polynôme réel de degré
inférieur ou égal à k, se ramènent, après division du polynôme Pk par le
polynôme [(x − uj )2 + vj2 ]p où p est le plus grand entier tel que 2p ≤ k, à des
fonctions hr du type
a + bx
hr (x) = ,
[(x − uj )2 + vj2 ]r

où r est un entier compris entre 1 et k, vj /= 0 et a, b ∈ R. Si b = 0, la


primitivation de hr se ramène, par changement de variable y = x − uj , à
la primitivation de fonctions du type gr (y) = (y2 +v
1
2 )r . Pour r = 1, g1 est

primitivable sur R et ses primitives sont les fonctions G1 données par


1 y
G1 (y) = arctg .
v v
9.3. PRIMITIVATION DES FONCTIONS RATIONNELLES 335

Pour r > 1, comme

(y 2 + v 2 ) − y 2 y2
v 2 gr (y) = = gr−1 (y) − 2 ,
(y + v )
2 2 r (y + v 2 )r

on aura
J J J
y2
gr = v −2 gr−1 − v −2 dy.
(y 2 + v 2 )r
Mais,
2 3
y2 1 d 1
=− y ,
(y + v 2 )r
2 2r − 2 dy (y 2 + v 2 )r−1
et la formule de primitivation par parties entraı̂ne la relation
J J
y2 1 1
dy = −H + dy
(y + v )
2 2 r 2r − 2 (y 2 + v 2 )r−1

J
1
= −H + gr−1 ,
2r − 2
où H est définie par

1 y
H(y) = .
2r − 2 (y + v 2 )r−1
2

Dès lors,
J 2 J 3
−2 2r − 3
gr = v gr−1 + H ,
2r − 2
H
ce qui permet,
H
de proche en proche, de ramener le calcul de gr à celui,
connu, de g1 . Lorsque b /= 0, la primitivation de la fonction hr se ramène
à la primitivation d’une fonction de type précédent et d’une fonction fr de
la forme
x
fr (x) = .
[(x − uj )2 + vj2 ]r

Le changement de variable y = (x − uj )2 + vj2 ramène le calcul de cette


primitive à celui de la fonction y 2→ y −r , considéré plus haut.
En rassemblant ces résultats, on obtient une primitive réelle de PQ sur
tout intervalle contenu dans le domaine de la fonction.
336 CHAPITRE 9. FONCTIONS PRIMITIVABLES

9.4 Fonctions irrationnelles, transcendantes


Nous allons indiquer dans ce paragraphe quelques types de fonctions irra-
tionnelles ou transcendantes élémentaires dont la primitivation se ramène,
par un changement de variable adéquat à celle de fonctions rationnelles. La
liste donnée est loin d’être exhaustive et l’on pourra consulter à ce sujet les
tables de primitives.
Soit P un polynôme irréductible de R2 dans R et C la courbe algébrique
d’équation
P (x, y) = 0.
On appelle intégrale abélienne attachée à la courbe C (on devrait plutôt
dire primitive abélienne mais l’usage a consacré la terminologie précédente)
toute primitive d’une fonction (de x) du type R(x, y) où R est une fonction
rationnelle de R2 dans R et où y est remplacé par une des racines y(x) de
l’équation ci-dessus. Si l’on peut trouver deux fonctions rationnelles M et
N et un intervalle I tels que cette équation soit satisfaite si et seulement si

x = M (t), y = N (t), (t ∈ I),

on dit que la courbe C est unicursale et l’intégrale abélienne attachée à C


se ramène à la primitive de la fonction rationnelle t 2→ R[M (t), N (t)]M $(t).
L’obtention des fonctions M et N (c’est-à-dire l’uniformisation de C par des
fonctions rationnelles) est un problème difficile. Nous nous contenterons de
donner quelques exemples simples.
8 G 9
a. f (x) = R x, m ax+b
cx+d où R est une fonction rationnelle de R dans
2

K, m ∈ N∗ , a, b, c, , d ∈ R.
Si m est pair, on doit bien entendu se limiter aux valeurs de x pour
lesquelles ax+b
cx+d ≥ 0. Il s’agit d’une intégrale abélienne avec

P (x, y) ≡ (cx + b)y m − (ax + b).

Introduisons le changement de variable x = h(t) défini par la relation


K
−1 ax + b
t=h (x) =
m
,
cx + d

ce qui donne

b − dtm $ mtm−1 (ad − bc)


x = h(t) = − , h (t) = ,
a − ctm (ctm − a)2
9.4. FONCTIONS IRRATIONNELLES, TRANSCENDANTES 337
K
ah(t) + b
y= m
= t.
ch(t) + d
En conséquence, (f ◦ h)h$ est une fonction rationnelle de R dans K, donc
primitivable; dès lors, par le théorème de changement de variable, f sera
primitivable sur tout intervalle I = h(J) tel que h soit injective sur J et l’on
pourra calculer les primitives par les méthodes de la section précédente.
8 √ 9
b. f (x) = R x, ax2 + bx + c où R est une fonction rationnelle de
R2 dans K, a, b, c ∈ R, a /= 0.
Il s’agit d’une intégrale abélienne avec

P (x, y) ≡ y 2 − ax2 − bx − c.

On se limitera aux valeurs de x pour lesquelles ax2 + bx + c ≥ 0 et l’on peut


exclure le cas où la fonction x 2→ ax2 + bx + c a un zéro double puisqu’alors
f est une fonction rationnelle.
1. Si a > 0 et b2 − 4ac /= 0, on introduit le changement de variable x = h(t)
par la relation √ L
t = h−1 (x) = ax + ax2 + bx + c,
ce qui donne
√ √
t2 − c $ 2( at2 + bt + ac)
x = h(t) = √ , h (t) = √ ,
2 at + b (2 at + b)2
G √ √
y= a[h(t)]2 + bh(t) + c = t − (2 at + b)−1 a(t2 − c).
En conséquence, (f ◦ h)h$ est une application rationnelle de R dans K et elle
est donc primitivable sur R. Par le théorème de changement de variable,
f sera primitivable sur tout intervalle I = h(J) tel que h soit injective sur
J, et les primitives F de f seront obtenues
√ en composant les primitives de

(f ◦ h)h$ avec la fonction x 2→ ax + ax2 + bx + c.
2. Si a < 0, il faut que b2 − 4ac > 0 et que x ∈ ]p, q[ où p < q sont les zéros
distincts du polynôme ax2 + bx + c. On a, pour tout x ∈ ]p, q[,
K
L G a(x − q)
ax2 + bx + c = a(x − p)(x − q) = (x − p) .
x−p
Le changement de variables x = h(t) défini par la relation
K
a(x − q)
t = h−1 (x) = ,
x−p
338 CHAPITRE 9. FONCTIONS PRIMITIVABLES

et qui donne
pt2 − aq $ 2at(q − p)
x = h(t) = , h (t) = 2 ,
2
t −a (t − a)2
G
a(p − q)t
y= a[h(t)]2 + bh(t) + c = ,
t2 − a
est tel que (f ◦h)h$ est une fonction rationnelle de R dans K. Par le théorème
du changement de variable, f sera primitivable sur tout intervalle I = h(J)
tel que h soit injective sur J et les primitives F de f seront G obtenues en
composant les primitives de (f ◦ h)h avec la fonction x 2→ a(x−q)
$
x−p . 8 L 9
Remarque. Les primitives des fonctions de type f (x) = R x, P (x)
lorsque P est un polynôme de degré p ≥ 3 et R une fonction rationnelle
ne peuvent pas en général s’exprimer au moyen des fonctions élémentaires
et conduisent à des fonctions transcendantes nouvelles appelées intégrales
elliptiques si p = 3, 4 et intégrales hyperelliptiques lorsque p ≥ 5. L’étude
de ces intégrales et des fonctions réciproques correspondantes (en particulier
des fonctions elliptiques) doit se faire dans le cadre de la théorie des fonctions
complexes d’une variable complexe.
c. f (x) = R(cos x, sin x, cos 2x, sin 2x, . . ., cos mx, sin mx), m ∈ N∗ , où R
est une fonction rationnelle de R2m dans K.
En utilisant les formules trigonométriques classiques exprimant cos kx et
sin kx comme polynôme en cos x et sin x, on peut exprimer f sous la forme

f (x) = S(cos x, sin x),

où S est une fonction rationnelle de R2 dans K. En utilisant les relations


trigonométriques connues
1 − tg 2 (x/2) 2tg (x/2)
cos x = , sin x = ,
1 + tg 2 (x/2) 1 + tg 2 (x/2)
on obtient
S(cos x, sin x) = T [tg (x/2)],
où T est une fonction rationnelle de R dans K. Le changement de variable
x = h(t) défini par la relation

t = h−1 (x) = tg (x/2),

et donc tel que


2
x = h(t) = 2arctg t, h$ (t) = ,
1 + t2
9.5. CALCUL APPROCHÉ DES PRIMITIVES 339

montre que (f ◦ h)h$ = T h$ est une fonction rationnelle de R dans K. Le


théorème de changement de variable assure donc la primitivabilité de f sur
tout intervalle I = h(J) tel que h est injective sur J et les primitives de
f s’obtiennent en composant les primitives de la fonction t 2→ 2T (t)
1+t2
avec la
fonction t = tg (x/2).
Les quelques exemples que nous venons de donner montrent que, pour
une fonction primitivable sur un intervalle I, le calcul effectif peut être
extrêmement compliqué et aucune méthode générale n’existe. Il faudrait
d’ailleurs d’abord s’entendre sur ce que l’on appelle “calcul effectif”. Au
XIXe siècle, Joseph Liouville donna à cette question la forme classique
suivante : étant donné un ensemble de fonctions réelles d’une variable réelle
appelées fonctions élémentaires, et formé des fonctions qui peuvent s’écrire
en itérant, à partir de la variable x et de constantes, les quatre opérations
d’addition, soustraction, multiplication, division ainsi que la prise de loga-
rithmes, d’exponentielles ou l’extraction de racines de polynômes, calculer
sa primitive ou démontrer qu’elle n’est pas une fonction élémentaire. Liou-
ville donna, entre 1833 et 1841, plusieurs contributions fondamentales à ce
problème qui est encore ouvert. Il a fallu attendre les travaux de Maxwell
Rosenlicht en 1968 pour obtenir une formulation algébrique précise du
problème et des généralisations des résultats de Liouville. Robert Risch en
1969 a prouvé l’existence d’un algorithme répondant à la question ci-dessus
pour le sous-ensemble des fonctions élémentaires dites “purement transcen-
dantes” et J.H. Davenport en 1979 a fait de même pour la sous-classe des
fonctions élémentaires algébriques. En outre, pour des sous-ensembles im-
portants de fonctions, ces algorithmes ont été respectivement programmés
dans le cadre des méthodes de calcul symbolique sur ordinateur MACSYMA
et REDUCE, mais le problème général correspondant reste ouvert.

9.5 Calcul approché des primitives


L’impossibilité de la détermination explicite des primitives d’une fonction
primitivable nous suggère de retourner à l’idée fondamentale de “résolution
approchée indéfiniment précise d’un problème dont la solution exacte est
impossible” qui sous-tend de nombreux concepts fondamentaux de l’analyse
mathématique. Nous allons démontrer qu’étant donné une fonction f pri-
mitivable sur un intervalle I, un point a de I, un point x > a de I et un
nombre ! > 0, il est possible d’obtenir (au moins théoriquement) une valeur
approchée de Fa (x) avec une erreur inférieure ou égale à !. C’est l’importante
340 CHAPITRE 9. FONCTIONS PRIMITIVABLES

propriété d’approximation des primitives.


Proposition. Soit f une fonction de R dans Rp primitivable sur l’intervalle
I, a ∈ I et Fa la primitive de f qui s’annule en a. Pour chaque x ∈ I tel que
x > a et chaque ! > 0, ilA
existe une jauge
B
δ sur [a, x] telle que, pour toute
P-partition δ-fine Π = (xj , ]aj−1 , aj ]) 1≤j≤m avec a = a0 < a1 < . . . <
am−1 < am = x, on a
# #
# m #
# $ #
#Fa (x) − f (x )(a − a )# ≤ !.
j j j−1 #
#
# j=1 #
2

Démonstration. Soit ! > 0; pour chaque y ∈ I, Fa$ (y) = f (y) et il existe


donc un δ(y) > 0 tel que, pour chaque u ∈ I ∩ [y − δ(y), y + δ(y)], on a
!
|Fa (u) − Fa (y) − f (y)(u − y)|2 ≤ |u − y|;
x−a
dès lors, si u et v appartiennent à I et sont tels que

y − δ(y) ≤ u ≤ y ≤ v ≤ y + δ(y),

on aura
|Fa (v) − Fa (u) − f (y)(v − u)|2
= |Fa (v) − Fa (y) − f (y)(v − y) − [Fa (u) − Fa (y) − f (y)(u − y)]|2
≤ |Fa (v) − Fa (y) − f (y)(v − y)|2 + |Fa (u) − Fa (y) − f (y)(u − y)|2
! ! !
≤ (|v − y| + |u − y|) = (v − y + y − u) = (v − u).
x−a x−a x−a
Soit δ : y 2→ δ(y)
A j B
la jauge ainsi définie sur I, et donc sur [a, x]. Si Π =
(x , ]aj−1 , aj ]) 1≤j≤m avec a = a0 < a1 < . . . < am−1 < am = x, est une
P-partition δ-fine de ]a, x], alors on a

xj − δ(xj ) ≤ aj−1 ≤ xj ≤ aj ≤ xj + δ(xj ), (1 ≤ j ≤ m),

et dès lors, en utilisant l’inégalité ci-dessus,


# # !
# #
#Fa (aj ) − F (aj−1 ) − f (xj )(aj − aj−1 )# ≤ (aj − aj−1 ), (1 ≤ j ≤ m).
2 x−a
Comme on a évidemment
m D
$ E
Fa (x) = F (aj ) − F (aj−1 ) ,
j=1
9.5. CALCUL APPROCHÉ DES PRIMITIVES 341

on en déduit # #
# m #
# $ #
#Fa (x) − f (x )(a − a )#
j j j−1 #
#
# j=1 #
2
# #
#m D E##
#$
= ## Fa (a ) − Fa (a ) − f (x )(a − a ) ##
j j−1 j j j−1
#j=1 #
2
m #
$ # m
$
# # !
≤ #Fa (aj ) − Fa (aj−1 ) − f (xj )(aj − aj−1 )# ≤ (aj − aj−1 ) = !.
j=1
2
j=1
x − a

Lorsque f est à valeurs positives sur [a, x], les expressions


m
$
f (xj )(aj − aj−1 )
j=1

associées à la P-partition Π par le résultat précédent représentent la somme


des aires de rectangles de base [aj−1 , aj ] et de hauteur f (xj ) et peuvent donc
être considérées comme une approximation de l’aire de la figure plane E(f )
définie par

E(f ) = {(x1 , x2 ) ∈ R2 : 0 ≤ x2 ≤ f (x1 ), x1 ∈ [a, x]},

c’est-à-dire du polygone curviligne délimité par l’intervalle [a, x] de l’axe des


x1 , par les parallèles à l’axe des x2 menées par les points (a, 0) et (x, 0) et par
le graphe de f . Cette approximation consiste à remplacer l’aire de chaque
figure curviligne constituante

Ej (f ) = {(x1 , x2 ) ∈ R2 : 0 ≤ x2 ≤ f (x1 ), x1 ∈ [aj−1 , aj ]}

(1 ≤ j ≤ m) par celle du rectangle de même base et de hauteur f (xj ). Par


conséquent, la quantité Fa (x) approchée indéfiniment par ces expressions
sera un candidat naturel pour la valeur de l’aire de la figure curviligne E(f ).
On obtient ainsi un lien étonnant entre le concept de primitive, directement
issu du concept de dérivée, c’est-à-dire, géométriquement, et la notion de
tangente au graphe de f , de celui d’aire de la figure plane curviligne E(f )
associée à f . C’est la découverte de ce lien par Isaac Newton et par Got-
tfried Leibniz, il y a plus de trois cents ans, qui a donné naissance au calcul
différentiel et intégral.
342 CHAPITRE 9. FONCTIONS PRIMITIVABLES

9.6 Exercices
1. Montrer que si f et g sont deux fonctions réelles primitivables sur
l’intervalle I et telles que, pour tout x ∈ I, on Hait f (x)H ≤ g(x), alors, pour
tout a ∈ I et tout x ≥ a appartenant à I, on a ax f ≤ ax g.
2. Soient I ⊂ R un intervalle, a ∈ I, f une fonction réelle d’une variable
réelle, g une fonction positive d’une variable réelle et C ≥ 0. Si f g et g sont
primitivables sur I et si, pour tout x ≥ a appartenant à I, on a
J x
f (x) ≤ C + f g,
a

alors, pour les mêmes valeurs de x, on a


4J x 5
f (x) ≤ C exp g .
a

(Lemme de Gronwall). Ce lemme, qui transforme une inéquation sur f


en une inégalité sur f, joue un rôle important dans l’étude des équations
différentielles.
Suggestion. Utiliser l’hypothèse pour montrer que
2 4 J x 5J x 3 4 J x 5
D exp − g f g ≤ Cg(x) exp − g .
a a a

En déduire par l’exercice 1 que


4 J x 5J x J x 4 J · 5
exp − g fg ≤ C g exp − g .
a a a a

Noter que
J x 4 J · 5 J x 2 4 4 J · 553 2 4 J x 53
g exp − g = −D exp − g = C 1 − exp − g .
a a a a a

En déduire J 2 4J 5 3
x x
f g ≤ C exp g −1 ,
a a

et introduire cette dernière inégalité dans l’hypothèse.


3. Montrer que si a ∈ R∗ , alors, sur tout intervalle de R ne contenant pas
±a, on a J # #
dx 1 #x − a#
= log # #
#x + a# .
x2 − a2 2a
9.7. PETITE ANTHOLOGIE 343

4. Utiliser la formule de primitivation par parties pour montrer que, si n ≥ 2


est un entier, alors
J J
cos x sinn−1 x n − 1
sinn x dx = − − sinn−2 x dx,
n n
J J
sin x cosn−1 x n − 1
cos x dx =
n
+ cosn−2 x dx.
n n
5. Utiliser les identités trigonométriques (qui se déduisent facilement de la
formule de Moivre)

1
cos mx cos nx = [cos(m + n)x + cos(m − n)x],
2
1
sin mx sin nx = [cos(m − n)x − cos(m + n)x],
2
1
sin mx cos nx = [sin(m + n)x + sin(m − n)x],
2
où m et n sont des entiers positifs, pour calculer les primitives des premiers
membres.

9.7 Petite anthologie


Dans des lettres échangées il y a une dizaine d’années avec le très habile
géomètre G.W. Leibniz, je lui ai fait savoir que j’étais en possession d’une
méthode pour déterminer les maxima et les minima, mener les tangentes et
traiter les autres questions semblables, méthode qui servait aussi bien dans
le cas des racines que dans celui des expressions rationnelles; je lui cachais
cette méthode dans la phrase suivante écrite en lettres transposées : Etant
donnée une équation contenant un nombre quelconque de quantités variables
ou fluentes, trouver leurs fluxions et inversement. Cet homme illustre me
répondit qu’il était aussi tombé sur une méthode analogue et il me commu-
niqua cette méthode qui s’écarte à peine de la mienne, sauf dans les termes
et les notations.

Isaac Newton, 1687

Considérant que les grandeurs qui croissent dans des temps égaux sont
plus grandes ou moindres suivant qu’elles croissent avec une vitesse plus
grande ou plus petite, je cherchai une méthode pour déterminer les grandeurs
344 CHAPITRE 9. FONCTIONS PRIMITIVABLES

d’après les vitesses des mouvements ou accroissements qui les engendrent; en


nommant fluxions les vitesses de ces mouvements ou accroissement, tandis
que les grandeurs engendrées prendraient le nom de fluentes, je suis tombé,
vers les années 1665 et 1666, sur la méthode des fluxions, dont je ferai
usage dans la quadrature des courbes. Les fluxions sont, d’aussi près que
possible, proportionnelles aux accroissements des fluentes, engendrés dans
des intervalles de temps égaux et aussi petits que possible; elles sont dans
la raison première des accroissements naissants et peuvent être représentées
par des lignes qui leur soient proportionnelles.

Isaac Newton, 1704

Mais d’après ce que j’ai montré dans ma méthode


H
des tangentes, on voit
que d( 12 xx) = x dx, et donc inversement 12 xx = x dx (car à l’exemple des
puissances et des racines dansH
le calcul ordinaire, dans mon calcul, sommes
et différences, c’est-à-dire et d, sont réciproques).

Gottfried W. Leibniz, 1686

Les intégrales des différentielles sont ces quantités dont ces différentielles
proviennent par différentiation.

Jean Bernoulli, 1691

Le calcul intégral est la méthode par laquelle, à partir d’une relation entre
les différentielles, on retrouve la relation entre les quantités elles-mêmes.

Leonard Euler, 1768


Chapitre 10

Fonctions intégrables

10.1 Intégrabilité sur un pavé


On a vu au chapitre précédent que si f est une fonction de R dans Rp
primitivable sur un intervalle I et si a < b appartiennent à I, les expressions
m
$
f (xj )(aj − aj−1 )
j=1
A B
associées à la P-partition Π = (xj , ]aj−1 , aj ]) 1≤j≤m de ]a, b] deviennent
arbitrairement proche d’un élément de Rp (à savoir F (b)−F (a) où F désigne
une primitive de f sur I), lorsque Π est “suffisamment fine”. Nous avons
également vu l’interprétation de ce résultat en termes d’aire de la figure
plane E(f ) définie par

E(f ) = {(x1 , x2 ) ∈ R2 : 0 ≤ x2 ≤ f (x1 ), x1 ∈ [a, b]},

lorsque f est une fonction positive. Par ailleurs, cette propriété de “conver-
gence” des expressions
m
$
f (xj )(aj − aj−1 )
j=1

est également vérifiée pour des fonctions qui ne sont pas primitivables sur I.
Ainsi, on sait que la fonction f définie sur R par

f (x) = 1 si x < 0, f (x) = 2 si x ≥ 0,

n’est primitivable sur aucun


A
intervalle Bcontenant l’origine. Pourtant, si ! > 0
est donné et si Π = (xj , ]aj−1 , aj ]) 1≤j≤m est une P-partition δ-fine de

345
346 CHAPITRE 10. FONCTIONS INTÉGRABLES

] − 1, 1] pour la jauge constante δ, on aura, si k est le plus grand entier entre


1 et m tel que ak < 0,
m
$
f (xj )(aj − aj−1 )
j=1

k
$ m
$
= (aj − aj−1 ) + f (xk+1 )(ak+1 − ak ) + 2 (aj − aj−1 )
j=1 j=k+2

= ak + 1 + f (xk+1 )(ak+1 − ak ) + 2(1 − ak+1 ).


Dès lors,
m
$
3 − ak+1 = ak + 1 + (ak+1 − ak ) ≤ f (xj )(aj − aj−1 )
j=1

≤ ak + 1 + 2(ak+1 − ak ) = 3 − ak ,
ce qui entraı̂ne aussitôt que
# #
#m #
#$ #
# f (x j
)(aj
− aj−1
) − 3 # ≤ max{−ak , ak+1 } ≤ 2δ ≤ !,
# #
#j=1 #

si l’on choisit δ = !/2. On notera que 3 mesure l’aire de la figure plane


(formée de deux rectangles) comprise entre le graphe de f , l’axe des x et les
parallèles à l’axe des y menées par les points (−1, 0) et (1, 0).
Dans le cas d’une fonction de R2 dans R positive sur l’adhérence I¯ d’un
semi-pavé de R2 (pour laquelle aucune notion de primitive n’a été définie !),
on peut encore considérer le problème de la définition et de la détermination
du volume du solide correspondant

¯
G(f ) = {(x1 , x2 , x3 ) ∈ R3 : 0 ≤ x3 ≤ f (x1 , x2 ), (x1 , x2 ) ∈ I}.

Le volume sera cette fois approché par des sommes de volumes de pa-
rallélépipèdes rectangles de base I j et de hauteur f (xj ), où {I 1 , . . . , I m}
est une partition de I en semi-pavés I j = ]aj1 , bj1]× ]aj2 , bj2] et où xj ∈ I¯j ,
(1 ≤ j ≤ m), c’est-à-dire par des expressions du type
m
$
f (xj )(bj1 − aj1 )(bj2 − aj2 ).
j=1
10.1. INTÉGRABILITÉ SUR UN PAVÉ 347

Plus généralement encore, on pourra chercher à définir et à déterminer


l’hypervolume d’un ensemble de Rn+1 du type

¯
H(f ) = {x ∈ Rn+1 : 0 ≤ xn+1 ≤ f (x1 , . . . , xn ), (x1 , . . . , xn ) ∈ I},

¯
lorsque I est un semi-pavé de Rn et f une fonction définie et positive sur I.
Les expressions approchées seront de la forme
m
$ n
6
f (xj ) (bji − aji ),
j=1 i=1

où {I 1 , . . . , I m} est une partition de I en semi-pavés

I j = ]aj1 , bj1] × . . . × ]ajn , bjn],

et xj = (xj1 , . . . , xjn ) ∈ I¯j , (1 ≤ j ≤ m).


Ces exemples suggèrent qu’il peut être intéressant d’étudier en toute
généralité la classe des fonctions de Rn dans Rp pour lesquelles les sommes
%m j =n j j
j=1 f (x ) i=1 (bi − ai ) associées aux P-partitions d’un semi-pavé I ⊂ R
n

convergent, au sens de la propriété d’approximation des primitives, vers un


élément de Rp.
Soit I = I1 × . . . × In , avec Ik = ]ak , bk ], (1 ≤ k ≤ n) un semi-pavé et
I = I1 × . . . × In le pavé correspondant.
Définition. On appelle mesure de I (longueur si n = 1, aire si n = 2,
volume si n = 3), et l’on note µ(I), le réel strictement positif défini par
n
6
µ(I) = (b1 − a1 )(b2 − a2 ) . . . (bn − an ) = (bi − ai ).
i=1

Une conséquence immédiate de cette définition est que, si K et I sont


des semi-pavés de Rn tels que K ⊂ I, alors

µ(K) ≤ µ(I),

l’égalité ayant lieu si et seulement si K = I.


On vérifie sans peine que si I et K sont deux semi-pavés de Rn , alors
I ∩ K est vide ou est un semi-pavé. Dans ce dernier cas, on pourra donc
parler de la mesure µ(I ∩ K) du semi-pavé I ∩ K. On notera que, par contre,
I ∪ K n’est pas en général un semi-pavé. Toutefois, si I 1 , . . . , I l sont des
348 CHAPITRE 10. FONCTIONS INTÉGRABLES

semi-pavés mutuellement disjoints de Rn , on pourra définir, conformément


!
à l’idée intuitive de mesure, la mesure de lj=1 I j par
 
l
> l
$
µ I j = µ(I j ).
j=1 j=1

Soit enfin I0 ! I deux semi-pavés. Si


I 0 = I10 × . . . In0 , I = I1 × . . . × In ,
avec
Ii0 = ]ci , di], Ii = ]ai, bi], ai ≤ ci ≤ di ≤ bi , (1 ≤ i ≤ n),
l’une des inégalités entre ai et ci ou di et bi au moins étant stricte, et si l’on
pose, pour chaque 1 ≤ i ≤ n,
Ii1 = ]ai, ci] ou ∅ selon que ai < ci ou ai = ci ,
Ii2 = ]di , ci] ou ∅ selon que di < bi ou di = bi,
alors on a
Ii = Ii0 ∪ Ii1 ∪ Ii2 , (1 ≤ i ≤ n).
En conséquence, la famille finie
{I i1 ,i2 ,...,in = I1i1 × I2i2 × . . . × Inin : I i1 ,i2 ,...,in /= ∅, 0 ≤ i1 ≤ 2, . . . , 0 ≤ in ≤ 2},
constitue une partition de I en semi-pavés et I 0 = I 0,0,...,0. Il en résulte que
>
I \ I0 = I i1 ,...,in ,
{0≤i1 ,...,in ≤2 : i1 +...+in >0}

et l’on posera
$
µ(I \ I 0 ) = µ(I i1 ,...,in )
{0≤i1 ,...,in ≤2 : i1 +...+in >0, I i1 ,...,in (=∅}

= µ(I) − µ(I 0 ).
On montre de même que si I 1 , . . . , I l sont des semi-pavés disjoints contenus
dans I, alors I \ (I 1 ∪ . . . ∪ I l ) est une union de semi-pavés mutuellement
disjoints et l’on posera
l
$
µ[I \ (I 1 ∪ . . . ∪ I l )] = µ(I) − µ(I j ).
j=1

Etendons maintenant aux fonctions de dans Rp les expressions qui


Rn
interviennent à la fois dans l’approximation de la valeur d’une primitive et
l’approximation de l’aire d’une figure plane ou du volume d’un solide.
10.1. INTÉGRABILITÉ SUR UN PAVÉ 349

Définition. Soit I un semi-pavé de Rn , f une fonction de Rn dans Rp définie


A j j B
sur I¯ et Π = (x , I ) 1≤j≤m une P-partition de I. On appelle somme de
Riemann associée à I, f et Π l’élément S(I, f, Π) de Rp défini par
m
$
S(I, f, Π) = µ(I j )f (xj ).
j=1

On vérifiera sans peine que si f et g sont deux fonctions de Rn dans Rp


¯ si c ∈ R et si Π est une P-partition de I, alors on a
définies sur I,
S(I, f + g, Π) = S(I, f, Π) + S(I, g, Π), S(I, cf, Π) = cS(I, f, Π),
(S(I, f, Π))k = S(I, fk , Π), (1 ≤ k ≤ p),
|S(I, f, Π)|j ≤ S(I, |f |j , Π), (j = 1, 2, ∞),
tandis que si p = 1 et f (x) ≥ g(x) pour tout x ∈ I, ¯ on a

S(I, f, Π) ≥ S(I, g, Π).


Nous pouvons maintenant introduire l’importante classe de fonctions qui
vérifient la propriété introduite au début de la section.
Définition. Soit I un semi-pavé de Rn et f une fonction de Rn dans Rp
¯ On dit que f est intégrable au sens de Denjoy-Perron sur
définie sur I.
¯ ou DP-intégrable sur I¯ ou plus simplement intégrable sur I¯ s’il existe un
I,
J ∈ Rp ayant la propriété suivante: pour chaque ! > 0, il existe une jauge δ
sur I¯ telle que, pour toute P-partition δ-fine Π de I, on ait
|S(I, f, Π) − J|2 ≤ !.
Cette définition a un sens puisque, par le théorème de Cousin, l’existence
d’une P-partition δ-fine est garantie pour toute jauge δ sur I. ¯ On notera aussi
que sa structure est semblable à celle de la définition de limite des valeurs
d’une fonction, et que la définition ne dépend pas du choix de la norme
| · |2 pour l’estimation de S(I, f, Π) − J. Enfin la terminologie “intégrable au
sens de Denjoy-Perron” vient de ce que, pour n = 1, cette classe de fonctions
fut introduite pour la première fois indépendamment par Arnaud Denjoy
en 1912 et par Oskar Perron en 1914. Leurs définitions sont différentes
et distinctes de celle donnée ici, découverte indépendamment, en 1957 par
Jaroslav Kurzweil et en 1960 par Ralph Henstock.
On désignera par P (I,¯ Rp) l’ensemble des fonctions de Rn dans Rp inté-
¯
grables sur l’adhérence I d’un semi-pavé I de Rn .
Montrons qu’il ne peut exister plus d’un J vérifiant les conditions de la
définition.
350 CHAPITRE 10. FONCTIONS INTÉGRABLES

Proposition. Il existe au plus un J ∈ Rp vérifiant les conditions de la


¯
définition d’intégrabilité sur I.
Démonstration. Soit J donné par la définition et soit J $ ∈ Rp tel que,
pour chaque ! > 0, il existe une jauge δ $ sur I¯ telle que, pour chaque P-
partition δ $ -fine Π$ de I, on ait

|S(I, f, Π$) − J $ |2 ≤ !.

On va prouver que J = J $ en montrant que |J − J $ |2 ≤ ! pour chaque ! > 0.


Soient en effet δ et δ $ les jauges associées à !/2 par les définitions de J et J $ ;
alors l’application δ $$ définie sur I¯ par

δ $$ (x) = min[δ(x), δ $(x)]

est une jauge sur I¯ et si Π$$ est une P-partition δ $$ -fine de I, elle sera à la
fois δ-fine et δ $ -fine. En conséquence, on aura

|J − J $ |2 ≤ |J − S(I, f, Π$$)|2 + |S(I, f, Π$$) − J $ |2 ≤ !,

et la démonstration est complète.


La définition suivante est donc justifiée.
Définition. Si f est une fonction de Rn dans Rp intégrable sur I, ¯ l’unique
élément J vérifiant la définition ci-dessus est appelé l’intégrale de f sur I¯ et
noté J J J J
f, f (x) µ(dx), f (x) dx ou f dµ,
I¯ I¯ I¯ I¯
pour rappeler son mode de construction par les sommes de Riemann.
Une telle intégrale est dite simple si n = 1 et multiple si n ≥ 2 (double
pour n = 2 et triple pour n = 3). Dans le cas de l’intégrale simple de f sur
[a, b], on utilise aussi les notations
J b J b
f ou f (x) dx.
a a

Enfin, il est commode de poser également


J a J b J a
f =− f et f = 0.
b a a

La propriété d’approximation de la primitive s’annulant en un point


d’une fonction primitivable fournit directement une classe importante de
fonctions intégrables sur un intervalle fermé et borné de R.
10.1. INTÉGRABILITÉ SUR UN PAVÉ 351

Théorème. Si f est une fonction de R dans Rp primitivable sur un intervalle


fermé et borné [a, b], alors f est intégrable sur [a, x] pour chaque a < x ≤ b
et, F désignant une primitive quelconque de f sur [a, b], on a, pour chaque
x ∈ ]a, b], J x
f = F (x) − F (a),
a
et en particulier
J b
f = F (b) − F (a).
a

Démonstration. Il suffit de noter que si f est primitivable sur [a, b], elle
l’est aussi sur [a, x] quel que soit a < x < b et la propriété d’approximation
de la primitive Fa de f s’annulant en a équivaut à l’intégrabilité de f sur
[a, x]. On sait enfin que si F est une primitive quelconque de f sur [a, b], on
a Fa = F (·) − F (a).
Le théorème que nous venons de démontrer s’appelle le théorème fon-
damental du calcul différentiel et intégral. Il fournit un moyen éton-
namment simple pour calculer l’intégrale sur intervalle fermé [a, b] (donc en
particulier de l’aire de E(f )) de toute fonction f dont une primitive est
connue: il suffit de faire la différence entre la valeur d’une primitive entre
l’extrémité et l’origine de l’intervalle considéré. Le théorème fondamental
du calcul différentiel et intégral montre que

N ([a, b], Rp) ⊂ P ([a, b], Rp).

On peut encore l’énoncer sous la forme équivalente suivante, qui fait inter-
venir f $ et f au lieu de f et F .
Corollaire. Si f est une fonction de R dans Rp dérivable sur [a, b], alors f $
est intégrable sur [a, b] et
J b
f $ = f (b) − f (a).
a

¯
Il existe une condition nécessaire de Cauchy d’intégrabilité sur I.
Proposition. Si f est une fonction de Rn dans Rp intégrable sur l’adhéren-
ce I¯ d’un semi-pavé I de Rn , alors, pour chaque ! > 0, il existe une jauge δ
sur I¯ telle que, pour chaque P-partition δ-fine Π et chaque P-partition δ-fine
Π̃ de I, on a
|S(I, f, Π) − S(I, f, Π̃)|2 ≤ !.
352 CHAPITRE 10. FONCTIONS INTÉGRABLES

Démonstration. Soit ! > 0 et δ une jauge sur I¯ associée par la définition


d’intégrabilité
H
à !/2. Alors, si Π et Π̃ sont des P-partitions δ-fines, on a,
avec J = I¯ f,
|S(I, f, Π) − S(I, f, Π̃)|2 ≤ |S(I, f, Π) − J|2 + |J − S(I, f, Π̃)|2 ≤ !.

Le cas particulier consistant à imposer pour chaque ! > 0, dans la


définition d’intégrabilité, l’existence d’une jauge constante est historique-
ment et numériquement important, même si son rôle dans l’analyse moderne
s’est singulièrement réduit.
Définition. Soit I un semi-pavé de Rn et f une fonction de Rn dans Rp
¯ On dit que f est intégrable au sens de Riemann sur I,
définie sur I. ¯ ou
R-intégrable sur I ou plus explicitement uniformément intégrable sur I¯ s’il
¯
existe un J ∈ Rp ayant la propriété suivante: pour chaque ! > 0, on peut
trouver une jauge constante δ sur I¯ telle que, pour toute P-partition δ-fine
Π de I, on ait
|S(I, f, Π) − J|2 ≤ !.
La caractérisation suivante des fonctions R-intégrables, dont on établira
sans peine l’équivalence avec la définition donnée ici, est souvent prise comme
définition des fonctions R-intégrables dans la littérature mathématique.
Proposition. Soit I un semi-pavé de Rn et f une fonction de Rn dans Rp
¯ Alors f est R-intégrable sur I¯ si et seulement s’il existe un
définie sur I.
J ∈ R ayant la propriété suivante: pour chaque ! > 0, il existe une constante
p

η > 0 telle que, pour chaque partition {I 1 , . . . , I m} de I en semi-pavés tels


que
max (bji − aji ) ≤ η,
1≤j≤m; 1≤i≤n

et toute famille {x , . . . , xm} de points tels que xj ∈ I¯j , (1 ≤ j ≤ m), on a


1

|S(I, f, Π) − J|2 ≤ !.
Le résultat suivant est une conséquence facile de la définition et de
l’unicité de l’intégrale.
Proposition. Toute fonction f R-intégrable sur I¯ est intégrable
H
sur I¯ et le
J donné dans la définition de R-intégrabilité est égal à I¯ f.
Exemple. Si I est un semi-pavé de Rn , toute application constante c de Rn
dans Rp est R-intégrable sur I¯ et
J
c = µ(I)c.

10.1. INTÉGRABILITÉ SUR UN PAVÉ 353

En effet, pour toute P-partition Π = {(x1 , I 1 ), . . ., (xm, I m)} de I, on a


m
$
S(I, f, Π) = µ(I j )c = µ(I)c,
j=1

et ! > 0 étant donné, n’importe quelle jauge constante convient dans la


définition de R-intégrabilité.
En procédant comme pour l’intégrabilité, on obtient évidemment une
condition nécessaire de Cauchy de R-intégrabilité.
Proposition. Si f est une fonction de Rn dans Rp R-intégrable sur l’adhé-
rence I¯ d’un semi-pavé I de Rn , alors, pour chaque ! > 0, il existe une
jauge constante δ sur I¯ telle que, pour chaque P-partition δ-fine Π et chaque
P-partition δ-fine Π̃ de I, on a

|S(I, f, Π) − S(I, f, Π̃)|2 ≤ !.

Montrons que les fonctions R-intégrables sur I¯ y sont nécessairement


bornées.
Proposition. Toute fonction f de Rn dans Rp R-intégrable sur l’adhérence
I¯ d’un semi-pavé I de Rn est bornée sur I.
¯
H
Démonstration. Soit J = I¯ f et ! = 1. Il existe donc une jauge constante
δ sur I¯ telle que # #
#m #
#$ #
#
# µ(I )f (x )# ≤ |J|2 + 1,
j j #
#j=1 #
2

pour toute P-partition δ-fine Π = {(x1 , I 1 ), . . ., (xm, I m)} de I. Soit {K 1 , . . . , K m}


une partition de I en semi-pavés

K j = ]cj1 , dj1 ] × . . . × ]cjn , djn]

tels que
dji − cji ≤ δ, (1 ≤ i ≤ n, 1 ≤ j ≤ m).
A B
Alors, pour chaque xj ∈ K j , (1 ≤ k ≤ m), Π̃ = (xj , K j ) 1≤j≤m est une P-
partition δ-fine de I. Supposons que f ne soit pas bornée sur I. ¯ Il existera au
moins un K tel que f ne soit pas bornée sur K̄ , et donc tel que pour chaque
l l

r > 0, il existe un y r ∈ K̄ l tel que |f (y r )|2 > r. En prenant successivement


r = k, (k ∈ N∗ ), on obtient une suite (y k )k∈N∗ dans K̄ l telle que

|f (y k )|2 > k, (k ∈ N∗ ).
354 CHAPITRE 10. FONCTIONS INTÉGRABLES

Si dès lors nous fixons xj ∈ K̄ j pour chaque 1 ≤ j ≤ m tel que j /= l, et que


nous prenons les P-partitions δ-fines

{(x1 , K 1 ), . . ., (xl−1, K l−1), (y k , K l ), (xl+1 , K l+1 ) . . . , (xm, K m)}, k ∈ N∗ ,

nous obtenons les inégalités


# #
# #
# $ #
#µ(K )f (y ) +
l k
µ(K j
)f (x j
) # ≤ |J|2 + 1, (k ∈ N∗ ),
# #
# {1≤j≤m : j(=l} #
2

et dès lors
# #
# #
# $ #
kµ(K l ) < µ(K l )|f (y k )|2 ≤ |J|2 + 1 + ## µ(K j )f (xj )## , (k ∈ N∗ ),
#{1≤j≤m : j(=l} #
2

ce qui est contradictoire dès que


 # # 
# $ #
−1 
# #
k ≥ [µ(K )]
l
|J|2 + 1 + #
# µ(K )f (x )##  .
j j
#{1≤j≤m : j(=l} #
2

La fonction
1 2 1
f : x 2→ 2x sin 2
− cos 2 , x /= 0, f (0) = 0,
x x x
donnée au Chapitre 9, qui est primitivable sur tout intervalle contenant
l’origine sans y être bornée, est donc un exemple de fonction qui n’est pas
R-intégrable sur un tel intervalle, alors qu’elle y est intégrable en vertu du
théorème fondamental du calcul différentiel et intégral.
L’exemple suivant montre qu’il existe même des fonctions bornées et
intégrables sur un intervalle fermé et qui n’y sont pas R-intégrables.
Exemple. La fonction de Dirichlet d, définie au chapitre 2 par d(x) = 1 si x
est rationnel et d(x) = 0 si x est irrationnel, est bornée sur R et donc sur tout
intervalle fermé. Montrons que d n’est pas R-intégrable sur [0, 1]. Il suffit
de montrer qu’elle ne vérifie pas la condition de Cauchy de R-intégrabilité.
Soit δ > 0 et {I 1 , . . ., I m} une partition de ]0, 1] en semi-intervalles telle
que µ(I j ) ≤ δ, (1 ≤ j ≤ m). On sait que chaque I j contient au moins un
rationnel xj et au moins un irrationnel x̃j . Dès lors, les P-partitions de ]0, 1]
A j j B
Π = {(x , I ), . . . , (x , I )}, Π̃ = (x̃ , I ) 1≤j≤m sont δ-fines et, puisque
1 1 m m

d(xj ) = 1, d(x̃j ) = 0, (1 ≤ j ≤ m),


10.1. INTÉGRABILITÉ SUR UN PAVÉ 355

ces P-partitions sont telles que


$
|S(]0, 1], d, Π) − S(]0, 1], d, Π̃)| = µ(I j ) = µ(]0, 1]) = 1.
j=1

La négation de la condition de Cauchy de R-intégrabilité est donc satisfaite.


Montrons maintenant que la fonction de Dirichlet est intégrable sur [0, 1]
et que son intégrale y est nulle. Notons tout d’abord que Q ∩ [0, 1] est
dénombrable et peut donc s’écrire sous la forme {rk : k ∈ N}, où l’application
k 2→ rk est une bijection de N sur Q ∩ [0, 1]. Soit ! > 0; associons-lui la jauge
δ sur [0, 1] définie comme suit. Si x ∈ [0, 1] \ Q, on prend δ(x) = 1; si
x ∈ Q ∩ [0, 1], il existe un unique rk tel que x = rk et l’on prend δ(x) = 2k+2
!
.
Soit Π = {(x , I ), . . ., (x , I )} une P-partition δ-fine de ]0, 1]. Comme
1 1 m m

d(x) = 0 si x est irrationnel, on a


m
$ $
S(]0, 1], d, Π) = d(xj )µ(I j ) = µ(I j ).
j=1 {1≤j≤m : xj ∈Q}

Soit q ∈ N tel que {xj ∈ Q : 1 ≤ j ≤ m} ⊂ {r0 , . . . , rq }. Alors,


 
$ q
$ $
µ(I j ) =  µ(I j )
{1≤j≤m : xj ∈Q} k=0 {1≤j≤m : xj =r k}

q
$ ! ! 1 − (1/2)q+1
≤ = ≤ !,
k=0
2k+1 2 1 − (1/2)

puisque, pour tous les j tels que xj = rk , les I j correspondants forment


une famille formée d’un ou deux intervalles disjoints de ]0, 1] contenus dans
[rk − 2k+2
!
, rk + 2k+2
!
], ce qui entraı̂ne
$ 42 35
! ! !
µ(I ) ≤ µ
j
rk − , rk + = .
2k+2 2k+2 2k+1
{1≤j≤m : xj =rk }

En conséquence, et en notant que S(I, f, Π) est positive et donc égale à sa


valeur absolue, on a |S(I, f, Π)| ≤ ! pour toutes les P-partitions δ-fines de
]0, 1] et le résultat est démontré.
On a vu qu’une fonction primitivable sur un intervalle fermé n’y est pas
nécessairement R-intégrable. L’exemple de la fonction

f (x) = −1 si x < 0, f (x) = 1 si x ≥ 0,


356 CHAPITRE 10. FONCTIONS INTÉGRABLES

considéré au début de la section, qui est R-intégrable sur [−1, 1], sans vérifier
la propriété de Darboux, montre l’existence de fonctions R-intégrables sur
un intervalle fermé qui n’y sont pas primitivables.
¯ Rp) l’ensemble des fonctions de Rn dans Rp R-
Si l’on désigne par R(I,
intégrables sur l’adhérence I¯ du semi-pavé I de Rn on a donc les inclusions
(strictes)

¯ Rp) ! P (I,
R(I, ¯ Rp), N ([a, b], Rp) ! P ([a, b], Rp)

alors que R([a, b], Rp) \ N ([a, b], Rp) et N ([a, b], Rp) \ R([a, b], Rp) sont non
vides. L’ensemble des fonctions intégrables contient donc différentes classes
de fonctions intéressantes.
La discussion qui précède montre que le concept d’intégrabilité que Ber-
nard Riemann a introduit en 1854 est trop faible pour intégrer, sur un pavé,
les fonctions non bornées (en particulier certaines fonctions primitivables)
ainsi que des fonctions très discontinues comme la fonction de Dirichlet.
Vito Volterra a même donné en 1881 un exemple de fonction bornée,
primitivable mais non R-intégrable sur un intervalle. On peut chercher la
raison de ces limitations de l’intégrale de Riemann dans le fait que, ! > 0
étant donné, la condition imposée aux P-partitions pour lesquelles la somme
de Riemann doit approcher la valeur de l’intégrale à ! près, est d’être δ-fine
pour une jauge constante δ, c’est-à-dire pour une jauge qui ne force aucune-
ment la P-partition à être particulièrement “fine” au voisinage des points de
I¯ où la fonction a un comportement peu régulier (discontinuités, limites à
gauche ou à droite infinies, oscillations non bornées...). Une définition mieux
adaptée à des fonctions présentant ces caractéristiques doit “forcer” les P-
partitions acceptables pour un ! > 0 donné à être plus “fines” aux endroits
pathologiques, afin de permettre aux sommes de Riemann d’épouser mieux
la quantité qu’elles sont censées approcher. C’est une idée que Leonard Eu-
ler avait déjà exprimée, sans l’exploiter, en 1768. Près de deux siècles plus
tard, Jaroslav Kurzweil et Ralph Henstock ont refait, indépendamment,
cette observation. Ils ont proposé une modification formelle simple mais
fondamentale de la définition de Riemann, qui conduit à une intégrale con-
servant, pour la partie élémentaire de la théorie, le support intuitif et la
simplicité conceptuelle de l’approche de Riemann, mais qui s’avère suf-
fisamment puissante pour intégrer à la fois les fonctions primitivables et les
fonctions R-intégrables (et, comme on le verra, bien d’autres encore!).
10.2. PROPRIÉTÉS ÉLÉMENTAIRES DE L’INTÉGRALE 357

10.2 Propriétés élémentaires de l’intégrale


Soit I un semi-pavé de Rn , f et g des fonctions de Rn dans Rp définies sur
¯
I.
¯ alors f + g est intégrable sur
Proposition. Si f et g sont intégrables sur I,
¯
I et J J J
(f + g) = f + g.
I¯ I¯ I¯
H H
Démonstration. Posons J1 = I¯ f et J2 = I¯ g et soit ! > 0. Il existe une
jauge δ1 sur I¯ telle que

|S(I, f, Π1) − J1 |2 ≤ !/2

pour toute P-partition δ1 -fine Π1 de I et une jauge δ2 sur I¯ telle que

|S(I, g, Π2) − J2 |2 ≤ !/2

pour toute P-partition δ2 -fine Π2 de I. Définissant sur I¯ la jauge δ par


δ(x) = min[δ1 (x), δ2(x)], et notant que toute P-partition δ-fine Π de I sera
à la fois δ1 -fine et δ2 -fine, on aura, pour une telle P-partition,

|S(I, f + g, Π) − (J1 + J2 )|2 = |S(I, f, Π) + S(I, g, Π) − J1 − J2 |2

≤ |S(I, f, Π) − J1 |2 + |S(I, g, Π) − J2 |2 ≤ !/2 + !/2 = !,


et la démonstration est complète.

Proposition. Si f est intégrable sur I¯ et c ∈ R, alors cf est intégrable sur


I¯ et J 4J 5
(cf ) = c f .
I¯ I¯
Démonstration.
H
Le résultat est évident si c = 0. Pour c /= 0, posons
J = I¯ f et soit ! > 0. Il existe donc une jauge δ sur I¯ telle que

|S(I, f, Π) − J|2 ≤ !/|c|,

pour toute P-partition δ-fine Π de I. En consequence, pour une telle P-


partition, on a

|S(I, cf, Π) − cJ|2 = |c[S(I, f, Π) − J]|2 ≤ |c|(!/|c|) = !,

et la démonstration est complète.


358 CHAPITRE 10. FONCTIONS INTÉGRABLES

Ces deux résultats montrent ¯ Rp) est un espace vectoriel sur R


que P (I,
H
et que l’application f 2→ I¯ f est une application linéaire de P (I, ¯ Rp) dans
R (et en particulier une fonctionnelle linéaire si p = 1). On démontre d’une
p

manière tout à fait identique que R(I, ¯ Rp) est un sous-espace vectoriel de
¯
P (I, R ).
p

La propriété suivante généralise aux intégrales le fait que la norme d’une


somme est inférieure ou égale à la somme des normes.
Proposition. Soit I un semi-pavé de Rn , f une fonction de Rn dans Rp et
g une fonction de Rn dans R+ définies sur I¯ et telles que

|f (x)|i ≤ g(x),
¯ (i = 1, 2 ou ∞). Si f et g sont intégrables sur I,
pour tout x ∈ I, ¯ alors on a
#J # J
# #
# f# ≤
# ¯ # g, (i = 1, 2 ou ∞),
I ¯ i I

¯ on a
En particulier, si f et |f |i sont intégrables sur I,
#J # J
# #
# f# ≤ |f |i , (i = 1, 2 ou ∞).
# ¯ # ¯
I i I

Démonstration. On va montrer que


#J # J
# #
# f# ≤
# ¯ # g+!
I ¯ i I

pour chaque ! > 0. Pour un tel ! > 0, il existe une jauge δ $ et une jauge δ $$
sur I¯ telles que
# J # # J #
# # # #
#S(I, f, Π$) − f # ≤ !/2, #S(I, g, Π$$) − g # ≤ !/2.
# ¯ # # ¯ #
I i I

Définissant la jauge δ sur I¯ par δ(x) = min{δ $ (x), δ $$(x)},


et choisissant une
P-partition δ-fine Π de I, on a, en utilisant les propriétés des sommes de
Riemann et le fait que Π est à la fois δ $ -fine et δ $$ -fine,
#J # #J #
# # # #
# f # ≤ # f − S(I, f, Π)# + |S(I, f, Π)|i
# ¯ # # ¯ #
I i I i

≤ !/2 + |S(I, f, Π)|i ≤ !/2 + S(I, |f |i, Π) ≤ !/2 + S(I, g, Π)


J # J # J J
# #
≤ !/2 + g + #S(I, g, Π) − g ## ≤ !/2 + g + !/2 = g + !.
#
¯ I ¯ ¯ ¯ I I I
Pour obtenir la deuxième inégalité, il suffit de prendre g = |f |i.
10.2. PROPRIÉTÉS ÉLÉMENTAIRES DE L’INTÉGRALE 359

Une conséquence aisée de la proposition précédente est le fait que l’inté-


grale préserve les relations d’ordre entre deux fonctions réelles.
Corollaire. Si I est un semi-pavé de Rn et f une fonction réelle intégrable
sur I¯ et telle que f (x) ≥ 0 pour tout x ∈ I,
¯ alors
J
f ≥ 0.

Démonstration. Il suffit de prendre f = 0 et g = f dans la Proposition


précédente.

Corollaire. Si I est un semi-pavé de Rn et si f et g sont deux fonctions


réelles intégrables sur I¯ et telles que f (x) ≤ g(x) pour tout x ∈ I,
¯ alors on a
J J
f≤ g.
I¯ I¯

Démonstration. Il suffit d’appliquer le corollaire précédent à la fonction


g − f et d’utiliser la linéarité de l’intégrale.
Le résultat suivant montre que la théorie et le calcul de l’intégrale d’une
fonction de Rn dans Rp peuvent toujours se ramener au cas d’une fonction
à valeur réelle.
Proposition. Soit I un semi-pavé de Rn et f une fonction de Rn dans
Rp définie sur ¯ Alors f est intégrable sur I¯ si et seulement si chaque
I.
composante fk de f est intégrable sur I¯ (1 ≤ k ≤ p), auquel cas on a
4J 5 J
f = fk , (1 ≤ k ≤ p).
I¯ k I¯

Démonstration. La condition nécessaire résulte aisément des définitions


et du fait que, pour toute P-partition Π de I, et tout 1 ≤ k ≤ p, on a
# 4J 5 # #2 J 3 # # J #
# # # # # #
#S(I, fk, Π) − f #= # S(I, f, Π) − f # ≤ #S(I, f, Π) − f # .
# ¯ # # ¯ # # ¯ #
I k I k I 2
H
Pour la condition suffisante, si nous posons Jk = I¯ fk , (1 ≤ k ≤ p) et si ! > 0
étant donné, nous désignons par δk une jauge sur I¯ telle que la définition
d’intégrabilité de fk sur I¯ soit vérifiée pour p1/2
!
, il est facile de voir que la
définition d’intégrabilité de f sur I¯ relative à ! sera vérifiée pour le choix de
la jauge δ définie sur I¯ par δ(x) = min1≤k≤p δk (x).
360 CHAPITRE 10. FONCTIONS INTÉGRABLES

Les propriétés qui suivent montrent le comportement de l’intégrale par


rapport à une translation ou une homothétie du domaine d’intégration.
Proposition. Soit I un semi-pavé de Rn et f une fonction de Rn dans
¯ Alors, pour tout a ∈ Rn , f (· − a) est intégrable sur
Rp intégrable sur I.
a + I¯ = {a + x : x ∈ I}
¯ et
J J
f (x − a) dx = f.
a+I¯ I¯

Démonstration. Soit ! > 0 et δ une jauge sur I¯ telle que


# J #
# #
#S(I, f, Π) − f # ≤ !
# ¯ #I 2

pour toute P-partition δ-fine Π de I. On définit la jauge η sur a + I¯ par


A j j B
η = δ(· − a). Soit Πa = (x , I ) 1≤j≤m une P-partition η-fine de a + I =
A B
{a + x : x ∈ I}. Alors Π = (xj − a, −a + I j ) 1≤j≤m , où −a + I j = {−a + x :
x ∈ I j }, est une P-partition δ-fine de I puisque les relations

I j ⊂ B∞ [xj ; η(xj )], (1 ≤ j ≤ m),

entraı̂nent évidemment

−a + I j ⊂ B∞ [xj − a; δ(xj − a)], (1 ≤ j ≤ m).

En conséquence, puisque µ(−a + I j ) = µ(I j ), (1 ≤ j ≤ m), on a


# #
# J # #$ J #
# # #m #
#S(a + I, f (. − a), Πa ) − f # = # µ(I j )f (xj − a) − f ##
# # #
I¯ 2 #j=1 I¯ #
2
# #
#m J # # J #
#$ # # #
= ## µ(−a + I j )f (xj − a) − f ## = ##S(I, f, Π) − f ## ≤ !,
#j=1 I¯ # I¯ 2
2
et la démonstration est complète.

Proposition. Soit I un semi-pavé de Rn et f une fonction de Rn dans


¯ Alors, pour chaque r > 0, f (r·) est intégrable sur
Rp intégrable sur I.
¯
r I = {r x : x ∈ I}
−1 −1 ¯ et
J J
f (rx) dx = r −n f.
r −1 I¯ I¯
10.2. PROPRIÉTÉS ÉLÉMENTAIRES DE L’INTÉGRALE 361

Démonstration. Soit ! > 0 et δ une jauge sur I¯ telle que


# J #
# #
#S(I, f, Π) − f # ≤ !r n
# ¯ #
I 2
A B
pour toute P-partition δ-fine Π de I. Soit Πr = (xj , I j ) 1≤j≤m une P-
A B
partition (δ/r)-fine de r −1 I = {r −1 x : x ∈ I}. Alors Π = (rxj , rI j ) 1≤j≤m
est une P-partition δ-fine de I puisque les relations

xj ∈ I¯j , I j ⊂ B∞ [xj ; δ(xj )/r], (1 ≤ j ≤ m),

entraı̂nent évidemment

rxj ∈ r I¯j , rI j ⊂ B∞ [rxj ; δ(xj )], (1 ≤ j ≤ m).

Dès lors, puisque µ(rI j ) = r n µ(I j ), on aura


# #
# J # #m J #
# # # $ #
#S(r −1 I, f (r·), Πr) − r −n f # = r −n # µ(rI j )f (rxj ) − f ##
# ¯ # # ¯
I 2 #j=1 I #
2
# J #
# #
= r −n ##S(I, f, Π) − f ## ≤ !,
¯ I 2
et la démonstration est complète.
Donnons maintenant deux propriétés utiles de l’intégrale simple. La
première s’appelle la formule d’intégration par parties.
Proposition. Soient f et g deux fonctions de R dans K dérivables sur [a, b].
Alors f $ g est intégrable sur [a, b] si et seulement si f g $ est intégrable sur [a, b],
auquel cas on a
J b J b
f $ g = f (b)g(b) − f (a)g(a) − f g $.
a a

Démonstration. Par la formule de dérivation d’un produit de fonctions,


on a
f $ g = (f g)$ − f g $ ,
et, par le théorème fondamental du calcul différentiel et intégral, la fonction
(f g)$ est intégrable sur [a, b] et
J b
(f g)$ = f (b)g(b) − f (a)g(a).
a

La thèse résulte alors de la linéarité de l’intégrale.


362 CHAPITRE 10. FONCTIONS INTÉGRABLES

La deuxième propriété s’appelle la formule d’intégration par substi-


tution.
Proposition. Soit g une fonction de R dans R non constante et dérivable
sur [a, b] et h une fonction de g([a, b]) dans Rp primitivable sur g([a, b]). Alors
(h ◦ g)g $ est primitivable sur [a, b] et
J b J g(b)
(h ◦ g)g $ = h.
a g(a)

Démonstration. Soit H une primitive de h sur g([a, b]); par le théorème de


primitivation par substitution, (h◦g)g $ = (H $ ◦g)g $ = (H ◦g)$ est primitivable
sur [a, b] et H ◦g en est une primitive. Par le théorème fondamental du calcul
différentiel et intégral, (h ◦ g)g $ est donc intégrable sur [a, b] et
J b
(h ◦ g)g $ = H[g(b)] − H[g(a)].
a

Le même théorème appliqué à h montre que cette fonction est intégrable


sur tout intervalle fermé de g([a, b]), et en particulier à l’intervalle fermé
d’extrémités g(a) et g(b), et que
J g(b)
h = H[g(b)] − H[g(a)],
g(a)

ce qui achève la démonstration.

10.3 Additivité de l’intégrale


Le but de cette section est de montrer que l’intégrale d’une fonction sur
l’adhérence d’un semi-pavé pavé I est égale à la somme des intégrales de
cette fonction sur les adhérences de semi-pavés formant une partition finie
de I. Pour démontrer cette propriété, nous aurons besoin d’un résultat
technique qui nous servira souvent par la suite, et que nous nommerons le
lemme des P-partitions subordonnées.
Lemme. Soit I un semi-pavé de Rn , {K 1 , . . . , K l } une partition de I en
¯ Il existe une jauge δ sur I¯ vérifiant la rela-
semi-pavés et δ0 une jauge sur I.
¯ et telle que, si Π = {(x1 , I 1 ), . . ., (xm, I m)}
tion δ(x) ≤ δ0 (x) pour tout x ∈ I,
est une P-partition δ-fine de I, chaque famille

Π̃i = {(xj , I j ∩ K i ) : I j ∩ K i /= ∅, 1 ≤ j ≤ m}
10.3. ADDITIVITÉ DE L’INTÉGRALE 363

est une P-partition δ-fine de K i , (1 ≤ i ≤ l), la famille

Π̃ = {(xj , I j ∩ K i ) : I j ∩ K i /= ∅, 1 ≤ j ≤ m, 1 ≤ i ≤ l, }

est une P-partition δ-fine de I et l’on a


l
$
S(I, f, Π) = S(I, f, Π̃) = S(K i, f, Π̃i )
i=1

¯
pour toute fonction f de Rn dans Rp définie sur I.
Démonstration. Construisons la jauge δ comme suit. Soit x ∈ I. ¯ Ap-
7
pelons J(x) l’ensemble {1 ≤ i ≤ l : x /∈ K }. Soit E(x) = i∈J(x) !K i si
i

J(x) /= ∅ et E(x) = Rn si J(x) = ∅. Comme E(x) est ouvert et x ∈ E(x),


il existe r(x) > 0 tel que B∞ [x; r(x)] ⊂ E(x). Ce choix de r(x) assure
que B∞ [x; r(x)] ne rencontre que des K i dont l’adhérence contient x. En
d’autres termes, si i est tel que B∞ [x : r(x)] ∩ K i /= ∅, alors x ∈ K i (car
B∞ [x; r(x)] ∩ K i /= ∅, et donc i /∈ J(x)).
Soit δ la jauge définie sur I¯ par δ(x) = min{δ0 (x), r(x)} et soit Π =
{(x , I 1 ), . . ., (xm, I m)} une P-partition δ-fine de I. Alors, pour chaque 1 ≤
1

i ≤ l, la famille

Π̃i = {(xj , I j ∩ K i ) : I j ∩ K i /= ∅, 1 ≤ j ≤ m}

est une P-partition de K i . En effet,

I j ∩ K i /= ∅ ⇒ B∞ [xj ; δ(xj )] ∩ K i /= ∅ ⇒ B∞ [xj ; r(xj )] ∩ K i /= ∅

⇒ xj ∈ K i ⇒ xj ∈ K i ∩ I j ,
et dès lors xj ∈ K i ∩ I j puisque K i ∩ I j = K i ∩ I j lorsque I j ∩ K i /= ∅ (le
vérifier). En outre, chaque P-partition Π Mi est évidemment δ-fine puisque Π
l’est. Bien entendu, la famille

N = {(xj , I j ∩ K i ) : I j ∩ K i /= ∅, 1 ≤ j ≤ m, 1 ≤ i ≤ l}
Π

Mi est une P-partition δ-fine de I.


formée de la réunion des éléments des Π
¯ alors
Enfin, si f est une fonction de Rn dans Rp définie sur I,
m
$
S(I, f, Π) = µ(I j )f (xj )
j=1
364 CHAPITRE 10. FONCTIONS INTÉGRABLES

m
$ l
> m
$ $ 8 9
= µ(I j ∩ K i )f (xj ) = µ I j ∩ K i f (xj )
j=1 i=1 j=1 {1≤i≤l : I j ∩K i(=∅}

l
$ $
N =
= S(I, f, Π) µ(I j ∩ K i )f (xj )
i=1 {1≤j≤m : I j ∩K i (=∅}

l
$
= Mi ).
S(K i, f, Π
i=1

Le nom de ce lemme vient de ce que toute P-partition δ-fine pour la jauge


ainsi construite peut être remplacée, sans changer la somme de Riemann
correspondante, par une P-partition δ-fine que l’on dit subordonnée à la
partition {K 1 , . . . , K l }, puisque chacun de ses semi-pavés est contenu dans
l’un des semi-pavés K i .
Enonçons et démontrons maintenant la propriété d’additivité de l’in-
tégrale.
Proposition. Soit I un semi-pavé de Rn , {K 1 , . . . , K l } une partition de I
en semi-pavés K i , (1 ≤ i ≤ l) et soit f une fonction de Rn dans Rp définie
¯ Si f est intégrable sur chaque K̄ i , (1 ≤ i ≤ l), alors f est intégrable
sur I.
¯
sur I et
J l J
$
f= f.
I¯ i=1 K̄
i

Démonstration. Si ! > 0 est donné, il existe une jauge δi sur K̄ i telle que
# J #
# #
#S(K i, f, Πi) − f ## ≤ !/l,
#
K̄ i 2

pour toute P-partition δi -fine Πi de K i (1 ≤ i ≤ l). Soit δ0 la jauge définie


sur I¯ par
δ0 (x) = min{δi (x) : x ∈ K̄ i , 1 ≤ i ≤ l},
et soit δ la jauge donnée par le lemme des P-partitions subordonnées à partir
de δ0 et {K 1 , . . . , K l }. Si Π = {(x1 , I 1), . . . , (xm, I m)} est une P-partition
δ-fine de I et Π̃i (1 ≤ i ≤ l) et Π̃ sont les P-partitions qui lui sont associées
par le lemme des P-partitions subordonnées, on a
# # # #
# l J
$ # # l J
$ #
# # # #
#S(I, f, Π) − f # = #S(I, f, Π̃) − f#
# K̄ i # # K̄ i #
i=1 2 i=1 2
10.4. CRITÈRE DE CAUCHY D’INTÉGRABILITÉ 365
# 3##
#$l 2 J
# #
=# S(K i, f, Π̃i ) − f # ≤ l(!/l) = !,
# K̄ i #
i=1 2

puisque par construction chaque Π̃i est δ i -fine (1 ≤ i ≤ l).

Remarques. 1. La propriété d’additivité est également vraie pour l’inté-


grabilité au sens de Riemann mais la démonstration est différente et plus
longue, car le lemme qui précède n’a pas d’équivalent pour l’intégration au
sens de Riemann. Nous ne la donnerons pas ici car nous n’aurons pas à
l’utiliser explicitement.
2. La propriété d’additivité possède une réciproque, dont la démonstration
nécessite la démonstration du caractère suffisant de la condition de Cauchy
d’intégrabilité.

10.4 Critère de Cauchy d’intégrabilité


Montrons que la condition d’intégrabilité de Cauchy est également suf-
fisante, ce qui permettra de prouver l’intégrabilité de fonctions sans connaı̂tre
la valeur de leur intégrale.
Théorème. Soit I un semi-pavé de Rn et f une fonction de Rn dans Rp
¯ Si, pour chaque ! > 0, il existe une jauge δ sur I¯ telle que,
définie sur I.
pour toute P-partition δ-fine Π de I et toute P-partition δ-fine Π$ de I, on a

|S(I, f, Π) − S(I, f, Π$)|2 ≤ !,

¯
alors f est intégrable sur I.

Démonstration. Construisons tout d’abord un candidat pour la valeur


¯ En prenant ! = 1 dans la condition de Cauchy, on
de l’intégrale de f sur I.
peut trouver une jauge δ1 sur I¯ telle que

|S(I, f, Π) − S(I, f, Π$)|2 ≤ 1

lorsque Π et Π$ sont des P-partitions δ1 -fines de I. En prenant ! = 1/2, on


¯ que l’on peut toujours choisir telle
peut trouver de même une jauge δ2 sur I,
¯ pour laquelle
que δ2 (x) ≤ δ1 (x) pour tout x ∈ I,

1
|S(I, f, Π) − S(I, f, Π$)|2 ≤ ,
2
366 CHAPITRE 10. FONCTIONS INTÉGRABLES

lorsque Π et Π$ sont des P-partitions δ2 -fines de I. En continuant de la sorte


avec ! = 1/k, k ≥ 2 entier, on trouve une suite (δk )k∈N∗ de jauges sur I¯ telles
que, pour chaque x ∈ I,¯ et chaque k ∈ N∗ , on ait

δk+1 (x) ≤ δk (x),


et pour lesquelles
1
|S(I, f, Π) − S(I, f, Π$)|2 ≤
,
k
lorsque Π et Π$ sont des P-partitions δk -fines de I. Fixons, pour chaque
k ∈ N∗ une P-partition δk -fine Πk de I et montrons que la suite
(S(I, f, Πk))k∈N∗
est une suite de Cauchy dans Rp. Par la propriété de décroissance de la suite
(δk (x))k∈N∗ , toute P-partition δq -fine sera δk -fine lorsque k ≤ q. Dès lors, si
q ≥ k sont des entiers supérieurs ou égaux à un, Πk et Πq seront δk -fines et
l’on a, par construction,
1
|S(I, f, Πk) − S(I, f, Πq)|2 ≤ .
k
En conséquence, si ! > 0 est donné, et si m ∈ N∗ est tel que 1/m ≤ !, il
suffira de prendre q ≥ k ≥ m pour que
1 1
|S(I, f, Πk) − S(I, f, Πq)|2 ≤ ≤ ≤ !.
k m
Donc (S(I, f, Πk))k∈N∗ , suite de Cauchy dans Rp , est convergente et nous
désignerons sa limite par J. En faisant tendre q vers l’infini dans l’inégalité
ci-dessus, on obtient
1
|S(I, f, Πk) − J|2 ≤ , (k ∈ N∗ ).
k
Pour montrer que f est intégrable sur I¯ et que son intégrale y vaut J, soit
! > 0 et soit m ∈ N∗ tel que m 1
≤ !. Si Π est une P-partition δm -fine de I, et
si, pour tout q ≥ m, Πq est définie dans la première partie de la définition,
on a
1
|S(I, f, Π) − S(I, f, Πq)|2 ≤ ≤ !.
m
Dès lors, si l’on fait tendre q vers l’infini, on obtient
|S(I, f, Π) − J|2 ≤ !,
et la démonstration est complète.
10.4. CRITÈRE DE CAUCHY D’INTÉGRABILITÉ 367

Remarque. En remplaçant partout, dans l’énoncé et la démonstration,


jauge par jauge constante, on obtient une condition suffisante de Cauchy
pour la R-intégrabilité.
Une conséquence importante de la condition suffisante d’intégrabilité
de Cauchy est la propriété de restriction de l’intégrale qui assure
l’intégrabilité sur les sous-pavés de I¯ lorsqu’on a l’intégrabilité sur I.
¯
Proposition. Soit I un semi-pavé de Rn et f une fonction de Rn dans Rp
¯ Alors f est intégrable sur K̄ pour chaque semi-pavé K ⊂ I.
intégrable sur I.
Démonstration. On peut évidemment supposer que K ! I. On sait que
I \ K peut alors s’écrire sous la forme
q
>
I \K = K i,
i=1

où les K i sont des semi-pavés mutuellement disjoints contenus dans I. Soit
! > 0; on va montrer que f vérifie la condition de Cauchy d’intégrabilité
sur K̄. Comme f est intégrable sur I, ¯ elle y vérifie la condition de Cauchy
d’intégrabilité, et il existe donc une jauge δ sur I¯ telle que
|S(I, f, Π) − S(I, f, Π$)|2 ≤ !,

lorsque Π et Π$ sont des P-partitions δ-fines de I. Bien entendu, la restriction


de δ à K̄ et aux K̄ i définit une jauge sur ces ensembles. Pour chaque 1 ≤
i ≤ q, fixons une P-partition δ-fine Πi de K i , et soient ΠK et Π$K deux P-
partitions δ-fines de K. Alors la famille Π formée par la réunion des éléments
de ΠK et de ceux des Πi , (1 ≤ i ≤ q) et la famille Π$ formée par la réunion
des éléments de Π$K et de ceux des Πi , (1 ≤ i ≤ q) sont des P-partitions
δ-fines de I telles que
S(I, f, Π) − S(I, f, Π$) = S(K, f, ΠK ) − S(K, f, Π$K ),

puisque les autres termes sont communs à S(I, f, Π) et à S(I, f, Π$). En


conséquence,

|S(K, f, ΠK) − S(K, f, Π$K )|2 = |S(I, f, Π) − S(I, f, Π$)|2 ≤ !,


et la démonstration est complète.
Remarque. La même démonstration montre évidemment que la propriété
de restriction est vraie pour la R-intégrabilité.
Nous pouvons maintenant énoncer et démontrer la réciproque de la
propriété d’additivité de l’intégrale.
368 CHAPITRE 10. FONCTIONS INTÉGRABLES

Corollaire. Soit I un semi-pavé de Rn , {K 1 , . . . , K q } une partition de I


en semi-pavés et f une fonction de Rn dans Rp intégrable sur I. ¯ Alors f est
i
intégrable sur chaque K et
J q J
$
f= f.
I¯ i=1 K
i

¯ l’est sur chaque K i par la propriété


Démonstration. f , intégrable sur I,
de restriction, et la formule se déduit alors de la propriété d’additivité de la
section précédente.

10.5 Fonctions continues ou monotones


Le critère de Cauchy permet de démontrer la R-intégrabilité sur I¯ d’une
¯
fonction continue sur I.
Proposition. Toute fonction f de Rn dans Rp continue sur l’adhérence I¯
¯
d’un semi-pavé I de Rn est R-intégrable sur I.
Démonstration. On va montrer que f vérifie la condition de Cauchy de R-
intégrabilité ¯ Pour ce faire, notons d’abord que si Π = {(x1 , I 1 ), . . ., (xm, I m)}
sur I.
8 9
et Π̃ = (x̃k , Ĩ k ) sont deux P-partitions de I et si l’on pose I j,k =
1≤k≤m̃
! !m̃
I j ∩ I˜k , (1 ≤ j ≤ m; 1 ≤ k ≤ m̃), alors, comme I = m ˜k
j=1 I = k=1 I , on a
j

évidemment
& m̃
' m̃
> >
I =I ∩
j j
I˜k = I j,k , (1 ≤ j ≤ m),
k=1 k=1
 
m
> m
>
I˜k = I˜k ∩  Ij = I j,k , (1 ≤ k ≤ m̃),
j=1 j=1

et, puisque les I j sont mutuellement disjoints et les I˜k sont mutuellement
disjoints, on aura
$
µ(I j ) = µ(I j,k ), (1 ≤ j ≤ m);
{1≤k≤m̃ : I j,k (=∅}

$
µ(I˜k ) = µ(I j,k ), (1 ≤ k ≤ m̃).
{1≤j≤m : I j,k (=∅}
10.5. FONCTIONS CONTINUES OU MONOTONES 369

Dès lors, en désignant par y j,k , pour chaque (j, k) tel que I j,k /= ∅, un élément
arbitrairement fixé de I j,k , on a

|S(I, f, Π) − S(I, f, Π̃)|2


# #
#m m̃ #
#$ $ $ $ #
= ## µ(I )f (x ) −
j,k j
µ(I )f (x̃ )##
j,k k
#j=1 {1≤k≤m̃ : I j,k (=∅} k=1 {1≤j≤m : I j,k (=∅} #
2
# #
# #
# $ #
= ## µ(I j,k )[f (xj ) − f (x̃k )]##
#{1≤j≤m; 1≤k≤m̃ : I j,k (=∅} #
2
$
≤ µ(I j,k
)[|f (x ) − f (y
j j,k
)|2 + |f (y j,k
) − f (x̃k )|2 ].
{1≤j≤m; 1≤k≤m̃ : I j,k (=∅}

La continuité de f sur le fermé borné I¯ entraı̂ne sa continuité uniforme sur


¯ Dès lors, si ! > 0 est donné, il existe un δ > 0 tel que, pour chaque x ∈ I¯
I.
et chaque y ∈ I¯ ∩ B∞ [x; δ], on ait
!
|f (y) − f (x)|2 ≤ .
2µ(I)

Prenant ce δ comme jauge constante sur I, ¯ on voit, en utilisant les inégalités


ci-dessus, que si Π et Π̃ sont des P-partitions δ-fines de I, on aura évidem-
ment
y j,k ∈ I j ⊂ B∞ [xj ; δ], y j,k ∈ I˜k ⊂ B∞ [x̃k ; δ],
et dès lors
$ 2 3
! !
|S(I, f, Π)−S(I, f, Π̃)|2 ≤ µ(I j,k ) + =!
2µ(I) 2µ(I)
{1≤j≤m; 1≤k≤m̃ : I j,k (=∅}

et la démonstration est complète.


Le même critère de Cauchy permet de montrer qu’une fonction de R dans
R monotone sur [a, b] y est R-intégrable.
Proposition. Toute fonction f de R dans R monotone sur [a, b] y est R-
intégrable.
Démonstration. Il suffit évidemment de prouver le résultat pour une
fonction croissante, puisque f et −f sont simultanément R-intégrables sur
[a, b]. Si f (a) = f (b), alors f est constante sur [a, b]A et le résultat Best déjà
connu. Supposons donc f (b) − f (a) > 0. Soient Π = (xj , ]aj−1 , aj ]) 1≤j≤m ,
370 CHAPITRE 10. FONCTIONS INTÉGRABLES
8 9
et Π̃ = (x̃k , ]ãk−1 , ãk ]) , avec a0 = ã0 = a, am = ãm̃ = b, deux
1≤k≤m̃
P-partitions de ]a, b] telles que

S(I, f, Π) − S(I, f, Π̃) ≥ 0.

En vertu de la croissance de f , on a

|S(I, f, Π) − S(I, f, Π̃)| = S(I, f, Π) − S(I, f, Π̃)

m
$ m̃
$
= f (xj )(aj − aj−1 ) − f (x̃k )(ãk − ãk−1 )
j=1 k=1

m
$ m̃
$
≤ f (aj )(aj − aj−1 ) − f (ãk−1 )(ãk − ãk−1 ).
j=1 k=1

Si l’on pose

a0 , . . . , a
{I ImI } = {a0 , . . . , am } ∪ {ã0 , . . . , ãm̃ },

avec
a=a
I0 < a
I1 < . . . < a
ImI = b,

et
I j = ]aj−1 , aj ], (1 ≤ j ≤ m), I˜k = ]ãk−1 , ãk ], (1 ≤ k ≤ m̃),
IIl = ]I al ], (1 ≤ l ≤ m),
al−1, I I

alors la croissance de f entraı̂ne les inégalités



$ $
f (ãk )(ãk − ãk−1 ) = f (ãk )(I al−1 )
al − I
k=1 I : IIl ⊂I˜k }
{1≤k≤m̃; 1≤l≤m

$ I
m
$
≥ f (I
al )(I Il−1 ) =
al − a f (I
al )(I al−1 )
al − I
I : IIl ⊂I˜k }
{1≤k≤m̃; 1≤l≤m l=1
$
= f (I
al )(I Il−1 )
al − a
I : IIl ⊂I j }
{1≤j≤m; 1≤l≤m
$ $
≥ f (aj−1 )(I al−1 ) =
al − I f (aj−1 )(aj − aj−1 ).
I : IIl ⊂I j }
{1≤j≤m; 1≤l≤m j=1
10.5. FONCTIONS CONTINUES OU MONOTONES 371

Par conséquent,
|S(I, f, Π) − S(I, f, Π̃)|

$ m̃
$
≤ f (aj )(aj − aj−1 ) − f (ãk−1 )(ãk − ãk−1 )
j=1 k=1


$ m
$
+ f (ãk )(ãk − ãk−1 ) − f (aj−1 )(aj − aj−1 )
k=1 j=1

m
$ m̃
$
= [f (aj ) − f (aj−1 )](aj − aj−1 ) + [f (ãk ) − f (ãk−1 )](ãk − ãk−1 ).
j=1 k=1

! > 0 étant donné, choisissons la jauge constante δ = !


4[f (b)−f (a)] . Si les P-
partitions Π et Π̃ sont δ-fines et (sans perte de généralité) choisies de telle
sorte que S(I, f, Π) − S(I, f, Π̃) ≥ 0, on aura, en utilisant l’inégalité qui
précède et le fait que
!
aj − aj−1 ≤ , (1 ≤ j ≤ m),
2[f (b) − f (a)]

!
ãk − ãk−1 ≤ , (1 ≤ k ≤ m̃),
2[f (b) − f (a)]
l’inégalité
|S(I, f, Π) − S(I, f, Π̃)|
 
! $m $m̃ 
≤ [f (aj ) − f (aj−1 )] + [f (ãk ) − f (ãk−1 )]
2[f (b) − f (a)] j=1 k=1

!
= [f (b) − f (a) + f (b) − f (a)] = !,
2[f (b) − f (a)]
et la démonstration est complète.

Remarque. En désignant par C(I, ¯ Rp) l’ensemble des fonctions de Rn dans


R continues sur I¯ et par M ([a, b], R) l’ensemble des fonctions de R dans R
p

définies et monotones sur [a, b], on a donc démontré les inclusions

¯ Rp) ⊂ R(I,
C(I, ¯ Rp) et M ([a, b], R) ⊂ R([a, b], R).
372 CHAPITRE 10. FONCTIONS INTÉGRABLES

10.6 Intégrale indéfinie


Soit f une fonction de R dans
Ha
Rp intégrable sur [a, b]. Par la propriété de
restriction et la convention a f = 0, f sera intégrable sur [a, x] quel que soit
x ∈ [a, b], ce qui permet de définir une application de [a, b] dans Rp par
J x
x 2→ f.
a

Cette application est appelée l’intégrale indéfinie de f sur I¯ et est notée


J · J ·
f ou f (t) dt
a a

pour rappeler son mode de construction. Dans la seconde notation, la vari-


able t peut évidemment être remplacée par n’importe quelle autre lettre. On
évitera cependant d’utiliser x car alors, dans la valeur en x
J x
f (x) dx
a

de l’intégrale indéfinie, la lettre x aurait ou n’aurait pas de signification selon


sa position !
Lorsque f est une fonction de R dans Rp intégrable sur tout intervalle
fermé et borné contenu dans un intervalle quelconque I, on peut fixer un
élément a ∈ I et utiliser la convention de notation des intégrales simples pour
définir l’intégrale indéfinie de f correspondante comme étant l’application
de I dans Rp J · J x
f : x 2→ f.
a a

L’additivité
H· H·
de l’intégrale entraı̂ne aussitôt que deux intégrales indéfinies
a f et a " f de f sur I associées à des choix différents de a diffèrent par une
constante.
Montrons maintenant que, pour une fonction f primitivable sur I, les
intégrales indéfinies de f ne sont rien d’autre que ses primitives.
Proposition. Si f est une Hfonction de R dans Rp primitivable
H
sur un in-
tervalle I et si a ∈ I, alors a· f = Fa . En particulier, a· f est dérivable en
chaque point x de I et l’on a
4J · 5$
f (x) = f (x).
a
10.6. INTÉGRALE INDÉFINIE 373

Démonstration. Notons tout d’abord que, par le théorème fondamental


du calcul différentiel et intégral, f est intégrable sur tout intervalle fermé
borné contenu dans I, et si a ∈ I, x ∈ I avec x /= a, F désigne une primitive
quelconque de f sur I et Fa désigne la primitive de f sur I qui s’annule en
a, on a J x
f = F (x) − F (a) = Fa (x), (x ∈ I).
a
Comme la fonction définie par le second membre de cette égalité est dérivable
sur I et a pour dérivée f , la démonstration est complète.
Remarque. Ce résultat explique l’abus (regrettable) de langage qui consiste
à utiliser parfois le terme “intégrale indéfinie” et même le terme “intégrale”
H
au lieu du terme “primitive”. Il explique la similitude du symbole (un S
allongé) utilisé pour les deux concepts.
Lorsque f ∈ P ([a, b], Rp) \ N ([a, b], Rp), son intégrale indéfinie n’est plus
nécessairement dérivable en chaque point de [a, b] et, lorsqu’elle est dérivable
en x, sa dérivée n’est plus nécessairement égale à f (x). C’est ce que montrent
les exemples suivants.
Exemples. 1. En utilisant l’analogue d’un exemple antérieur et l’additivité
de l’intégrale, on sait que la fonction f définie par f (x) = 0 si x ≤ 0 et
f (x) = 1 si x > 0 est intégrable sur [−1, 1] sans y être primitivable et son
intégrale indéfinie se calcule aisément :
J x J x
f = 0 si x ∈ [−1, 0], f = x si x ∈ ]0, 1].
−1 −1
Elle n’est pas dérivable en 0.
2. La fonction de Dirichlet est intégrable, sans être primitivable, sur [0, x]
quel que soit x > 0 et son intégrale indéfinie est l’application nulle, dont la
dérivée, qui est l’application nulle, n’est pas égale à la fonction de Dirichlet.
Montrons maintenant qu’en chaque point de continuité d’une fonction
intégrable, la dérivée de l’intégrale indéfinie existe et est égale à la valeur de
la fonction en ce point.
Proposition. Soit f une fonction de R dans Rp intégrable sur [a, b], et soit
c ∈ [a, b] tel que f soit continue en c. Alors l’intégrale indéfinie de f est
dérivable en c et 4J 5$ ·
f (c) = f (c).
a
Démonstration. Il faut donc démontrer que
&J J '
c+h c
−1
lim h f− f = f (c),
h→0, c+h∈[a,b] a a
374 CHAPITRE 10. FONCTIONS INTÉGRABLES

ou encore que
,J J -
c+h c
−1
lim h f− f − hf (c) = 0.
h→0, c+h∈[a,b] a a

Pour tout h ∈ R tel que c + h ∈ [a, b], on a, en vertu de l’additivité de


l’intégrale
J c+h J c J c+h J a J c+h
f− f − hf (c) = f (x) dx + f (x) dx − f (c) dx
a a a c c
J c+h
= [f (x) − f (c)] dx.
c
Soit ! > 0; f étant continue en c, il existe un δ > 0 tel que, pour tout
x ∈ [a, b] vérifiant |x − c| ≤ δ, on a |f (x) − f (c)|2 ≤ !. Dès lors, si h est
tel que c + h ∈ [a, b] et |h| ≤ δ, on a, pour tout x compris entre c et c + h,
|x − c| ≤ |h| ≤ δ et donc

|f (x) − f (c)|2 ≤ !.

Comme f (·) − f (c) et la fonction constante ! sont intégrables sur l’intervalle


fermé d’extrémités c et c + h, on en déduit que
#J # #J #
# c+h # # c+h #
# # # #
# [f (x) − f (c)] dx# ≤ # ! dx# = !|h|,
# c # # c #
2

et dès lors, si 0 < |h| ≤ δ et c + h ∈ [a, b], on a


# ;J <#
# c+h #
# −1 #
#h [f (x) − f (c)] dx # ≤ !,
# c #
2

et la démonstration est complète.

Corollaire. Si f est une fonction de R dans Rp continue sur un intervalle


I, chaque intégrale indéfinie de f est dérivable sur I et, pour chaque a ∈ I,
on a 4J 5 · $
f (x) = f (x), (x ∈ I).
a
Démonstration. Il suffit de noter que toute fonction continue sur I est R-
intégrable sur tout intervalle fermé et borné de I et d’appliquer la proposition
précédente en chaque point de I.
10.7. EQUATIONS DIFFÉRENTIELLES SIMPLES 375

Une conséquence importante de ce corollaire est la primitivabilité sur un


intervalle I des fonctions continues sur I.
Corollaire. Toute fonction f de R dans Rp continue sur un intervalle I est
primitivable sur I.
Démonstration. L’intégrale indéfinie de f est, en vertu du corollaire
précédent, une primitive de f sur I.
On a donc, pour les fonctions d’une variable, les inclusions strictes

C([a, b], Rp) ! N ([a, b], Rp) ! P ([a, b], Rp),

C([a, b], Rp) ! R([a, b], Rp) ! P ([a, b], Rp),


M ([a, b], Rp) ! R([a, b], Rp) ! P ([a, b], Rp).

10.7 Equations différentielles simples


La résolution de certaines équations différentielles simples se ramène à des
intégrations indéfinies.
Définition. Soit I un intervalle, f et g des fonctions réelles continues sur I.
On appelle équation différentielle linéaire du premier ordre toute équation
différentielle de la forme

y $ (x) = f (x)y(x) + g(x), (10.1)

dont l’inconnue y est une fonction réelle dérivable sur I. Une solution sur I
de cette équation différentielle sera toute application réelle y dérivable sur I
et vérifiant l’équation en chaque point de I. L’équation est dite homogène
si g = 0 et non homogène sinon.
Puisque f est continue sur I, elle y est primitivable et chaque intégrale
indéfinie de f est dérivable, et donc continue sur I. Si a ∈ I est fixé, la
fonction 4 J x 5
x 2→ exp − f
a

est donc strictement positive et dérivable sur I. L’équation (10.1) est donc
équivalente à l’équation
4 J x 5 4 J x 5 4 J x 5
y $ (x) exp − f = f (x)y(x) exp − f + g(x) exp − f ,
a a a
376 CHAPITRE 10. FONCTIONS INTÉGRABLES

c’est-à-dire à l’équation
2 4 J x 53$ 4 J x 5
y(x) exp − f = g(x) exp − f .
a a
Le second membre étant continu, dont primitivable sur I, les solutions de
cette équation seront données par
4 J x 5 J x 2 4 J y 53
y(x) exp − f = c+ g(y) exp − f dy,
a a a
où c est une constante réelle arbitraire, et dès lors les solutions de l’équation
linéaire (10.1) seront les fonctions y données par
U J x 2 4 J y 53 V 4J x 5
y(x) = c + g(y) exp − f dy exp f
a a a
4J x 5 J x2 4J x 5 3
= c exp f + exp f g(y) dy.
a a y
Exemple. Considérons l’équation différentielle
1
y $ (x) = y(x) + x
x
sur l’intervalle I = ]0, +∞[. Prenant par exemple a = 1, on a
J x
1
dy = ln x, exp(ln x) = x,
1 y
et dès lors les solutions sont données par les fonctions y définies par
2 J x 3
y(x) = c + dy x = [c + (x − 1)]x,
1
où c est un réel arbitraire.
Définition. Soit I un intervalle, f une fonction réelle continue sur I et h
une application continue de R dans R. On appelle équation différentielle du
premier ordre à variables séparées toute équation différentielle de la forme
y $ (x) = f (x)h(y(x)), (10.2)
où l’inconnue y est une fonction réelle. Si J ⊂ I est un intervalle, on ap-
pelle solution sur J de cette équation différentielle toute application réelle y
dérivable sur J et vérifiant l’équation pour chaque x ∈ J.
La terminologie “variables séparées” vient de ce que le second membre
de l’équation est le produit d’une fonction de x seulement par une fonction
de y seulement. Ainsi, une équation différentielle linéaire du premier ordre
est à variables séparées si elle est homogène ou si f et g sont constantes.
Notons tout d’abord le résultat simple suivant.
10.7. EQUATIONS DIFFÉRENTIELLES SIMPLES 377

Proposition. Pour tout y ∗ tel que h(y ∗ ) = 0, l’application constante y ∗ sur


I est une solution sur I de (10.2).
Démonstration. On a en effet, pour tout x ∈ I, (y ∗ )$ = 0 = f (x)h(y ∗ ).
Supposons maintenant que h vérifie une condition de Lipschitz sur chaque
borné de R. Ce sera en particulier le cas si h est de classe C 1 sur R. On
sait alors que, pour chaque x0 ⊂ I et chaque y0 ∈ R, le problème de Cauchy
correspondant
y $ (x) = f (x)h(y(x)), y(x0) = y0
possède au plus une solution. Dès lors, si y ∗ est un zéro de h et y une solution
de l’équation différentielle (10.2) telle que y(x0 ) = y ∗ pour un certain x0 ,
l’unicité de la solution du problème de Cauchy entraı̂ne que y(x) = y ∗ pour
chaque x ∈ I. Par conséquent, chaque solution de (10.2) différente d’un
zéro de h prendra ses valeurs dans un et un seul des intervalles ouverts de
R déterminés par les zéros de h. Soit K un tel intervalle. La fonction h1 est
donc continue sur K et y : I → K est solution de l’équation différentielle
(10.2) si et seulement si elle vérifie l’équation
y $ (x)
= f (x),
h(y(x))
ou encore, fixant a ∈ I et utilisant le théorème de dérivation des fonctions
composées et les propriétés de l’intégrale indéfinie, si et seulement si elle
vérifie l’équation &J '$
y(x) dt
= f (x).
a h(t)
Comme le second membre est continu, donc primitivable sur I, cette dernière
équation équivaut à
J y(x) J x
dt
=c+ f (t) dt,
a h(t) a

où c est une constante réelle arbitraire. Pour chaque valeur fixée de c, la
solution y s’obtiendra donc explicitement en résolvant alors le problème de
fonction implicite G(y, x) − c = 0, où G est définie par
J y J x
dt
G(x, y) = − f (t) dt.
a h(t) a

Comme G est de la forme G(y, x) = M (y)−F (x) où M est une fonction con-
tinue et strictement monotone, puisque M $ (y) = h(y)
1
est de signe constant
378 CHAPITRE 10. FONCTIONS INTÉGRABLES

sur K, cette équation aura une solution unique y(x) pour chaque x ∈ I
tel que F (x) appartienne à M (K). On notera que la fonction G(x, y(x))
conserve une valeur constante c si y est solution de l’équation différentielle
(10.2). On dit que G est une intégrale première de l’équation différentielle
(10.2).
Exemples. 1. Considérons l’équation différentielle à variables séparées

y $ (x) = 2x[y(x)]2.

Notons tout d’abord que y = 0 est une solution sur R et recherchons main-
tenant les solutions à valeurs strictement positives ou à valeurs strictement
négatives. Les solutions sous forme implicite sont données, en prenant par
exemple a = 1, par
J y(x) J x
dt
=c+ 2t dt,
1 t2 1
c’est-à-dire par
1
1− = c + x2 − 1,
y(x)
ce qui peut encore s’écrire, puisque c est une constante arbitraire,
1
y(x) = .
c − x2
Dès lors, pour c < 0, cette solution est strictement négative et définie sur R.
Pour c = 0, cette formule fournit une solution strictement négative définie sur
] − ∞, 0[ et une solution strictement négative définie sur ]0, +∞[. Pour c > 0,

la formule fournit une solution strictement négative définie sur ] − ∞, − c[,
√ √
une solution strictement positive définie sur ] − c, + c[ et une solution

strictement négative définie sur ] c, +∞[. On voit que, contrairement au cas
de l’équation linéaire, les intervalles de définition des solutions peuvent être
strictement compris dans l’intervalle de définition de l’équation différentielle
(ici R) et peuvent dépendre de la solution elle-même.
2. L’équation différentielle
2 3
$ y(x)
y (x) = ay(x) 1 −
b
où a > 0 et b > 0, fut proposée en 1838 par le mathématicien belge Pierre-
François Verhulst pour remplacer la loi

y $ (x) = ay(x)
10.8. LEMME DE SAKS-HENSTOCK 379

donnée en 1798 par Thomas R. Malthus pour décrire l’évolution d’une


population. La loi de Malthus n’a évidemment, à côté de la solution cons-
tante y(x) = 0, que des solutions exponentielles y(x) = c exp ax, c ∈ R∗ .
L’équation de Verhulst possède les deux solutions constantes y(x) = 0 et
y(x) = b données par les zéros de la fonction h(y) = y(1 − yb ). On vérifie
aisément, en utilisant la méthode exposée plus haut, que les autres solutions
sont les fonctions y définies par
bc
y(x) = , c ∈ R \ {0, b}.
c + (b − c) exp(−ax)
Si c > b, la solution correspondante est strictement décroissante sur
]a−1 ln(1 − bc ), +∞[ tend vers +∞ si x tend vers a−1 ln(1 − bc ) et tend vers b
lorsque x tend vers +∞. Si c ∈ ]0, b[ , la solution est strictement croissante
sur R, avec limx→−∞ y(x) = 0, limx→+∞ y(x) = b. Enfin, si c < 0, la solu-
tion (négative et donc sans intérêt pour la démographie !) est strictement
décroissante sur ] − ∞, a−1 ln(1 − bc )[ et elle tend vers 0 si x tend vers −∞
et vers −∞ si x tend vers a−1 ln(1 − bc ). La courbe décrite par cette solution
lorsque 0 < c < b est appelée la courbe logistique et joue un grand rôle dans
la description des phénomènes biologiques et sociologiques. Contrairement
au modèle de Malthus, qui mène à une croissance exponentielle, le modèle
de Verhulst conduit à une saturation de la population.

10.8 Lemme de Saks-Henstock


Le résultat technique suivant, qui porte le nom de lemme de Saks-Hens-
tock, joue un rôle essentiel dans la démonstration de plusieurs résultats
importants en théorie de l’intégration. Il exprime essentiellement que, pour
une fonction f intégrable sur l’adhérence I¯ d’un semi-pavé I, la somme de
Riemann associée àH un “morceau” d’une P-partition Π dont la somme de
Riemann approche I¯ f à ! près est elle-même une approximation à ! près de
la somme des intégrales sur les adhérences des pavés constituant le morceau.
Lemme. Soit I un semi-pavé de Rn , f une fonction de Rn dans Rp intégra-
ble sur I¯ et J son intégrale sur I.
¯ Soit ! > 0 et δ une jauge sur I¯ telle que
l’on ait
|S(I, f, Π) − J|2 ≤ !,
pour toute P-partition δ-fine Π de I. Alors, pour toute famille

{(x1 , K 1 ), . . ., (xq , K q )}
380 CHAPITRE 10. FONCTIONS INTÉGRABLES

formée de semi-pavés K j mutuellement disjoints contenus dans I et de points


xj ∈ K̄ j tels que
K j ⊂ B∞ [xj , δ(xj )], (1 ≤ j ≤ q),
on a # #
# q 2 J 3#
#$ #
# µ(K )f (x ) −
j j
f ## ≤ !.
#
#j=1 K̄ j #
2
Démonstration. On va montrer que
# #
# q 2 J 3#
#$ #
#
# µ(K )f (x ) −
j j
f ## ≤ ! + η,
#j=1 K̄ j #
2
!q
quel que soit η > 0. On sait que I \ j=1 K j peut s’écrire sous la forme
!r
k=1 L , où les L (1 ≤ k ≤ r) sont des semi-pavés contenus dans I et
k k
¯ l’est aussi sur
mutuellement disjoints. Bien entendu, f , intégrable sur I,
chaque L , et
k
J q J
$ r J
$
f= f+ f.
I¯ j=1 K̄
j
k=1 L̄
k

En conséquence, si η > 0 est donné, il existera une jauge δk sur L̄k , que l’on
peut toujours choisir telle que δk (x) ≤ δ(x), (x ∈ L̄k , 1 ≤ k ≤ r), ayant la
propriété que # J #
# # η
#S(Lk , f, Πk ) − f ## ≤ ,
# k r
L̄ 2

pour toute P-partition δk -fine Πk de Lk , (1 ≤ k ≤ r). Par conséquent, la


famille finie Π formée des (xj , K j ), (1 ≤ j ≤ k), et des éléments des familles
Πk , (1 ≤ k ≤ r) constitue une P-partition δ-fine de I telle que
q
$ r
$
S(I, f, Π) = µ(K j )f (xj ) + S(Lk , f, Πk ).
j=1 k=1

On aura donc, par hypothèse,


# #
# q 2 J 3#
#$ #
#
# µ(K )f (x ) −
j j
f ##
#j=1 K̄ j #
2
# J #
# r
$ r J
$ #
# #
= #S(I, f, Π) − S(Lk , f, Πk ) − f + f#
# I¯ L̄k #
k=1 k=1 2
10.8. LEMME DE SAKS-HENSTOCK 381

# J # r ## J #
# # $ #
≤ ##S(I, f, Π) − f ## + #S(Lk , f, Πk ) −
# f ##
I¯ 2 k=1 L̄k 2
η
≤ !+r = ! + η,
r
et la démonstration est complète.

Corollaire. Dans les conditions du lemme de Saks-Henstock, si f est réelle,


on a q # J #
$# #
#µ(K j )f (xj ) − f ## ≤ 2!.
#
j=1 K̄ j

Démonstration. Soient K j1 , . . . , K jl (resp. K jl+1 , . . ., K jq ) les K j tels


que J J
µ(K )f (x ) −
j j
f ≥ 0, (resp. µ(K )f (x ) − j j
f < 0).
K̄ j K̄ j

Le théorème précédent s’applique à chaque famille {(xji , K ji ) : 1 ≤ i ≤ l} et


{(xji , K ji ) : l + 1 ≤ i ≤ q} et fournit les inégalités
l ##
$ J #
# l 2
$ J 3
#µ(K ji )f (xji ) − f ## = µ(K ji )f (xji ) − f ≤ !,
#
i=1 K̄ ji i=1 K̄ ji

et
q #
$ J # q 2
$ J 3
# #
#µ(K ji )f (xji ) − f ## = − µ(K ji )f (xji ) − f ≤ !.
#
i=l+1 K̄ ji i=l+1 K̄ ji

La thèse résulte de l’addition membre à membre de ces inégalités.


Le résultat correspondant pour une fonction à valeurs dans Rp s’en déduit
aisément.
Corollaire. Dans les conditions du lemme de Saks-Henstock, on a, avec
i = 1, 2 ou ∞,
q #
$ J #
# #
#µ(K j )f (xj ) − f ## ≤ 2p!.
#
j=1 K̄ j i

Démonstration. En appliquant le corollaire précédent à chaque com-


posante fk de f , qui vérifie aussi les conditions du lemme de Saks-Henstock,
on obtient # J #
q
$ # #
#µ(K j )fk (xj ) − fk ## ≤ 2!, (1 ≤ k ≤ p).
#
j=1 K̄ j
382 CHAPITRE 10. FONCTIONS INTÉGRABLES

Dès lors, si i = 1, 2 ou ∞, on a
q #
$ J # q #
$ J #
# # # #
#µ(K j )f (xj ) − #
f# ≤ #µ(K j )f (xj ) − f ##
# #
j=1 K̄ j i j=1 K̄ j 1

p #
q $
$ J #
# #
= #µ(K j )fk (xj ) −
# fk ## ≤ 2p!.
j=1 k=1 K̄ j

Enfin, la conséquence suivante du lemme de Saks-Henstock va nous con-


duire à la notion d’intégrabilité absolue.
Corollaire. Soit I un semi-pavé de Rn , f une fonction de Rn dans Rp
intégrable sur I¯ et J son intégrale sur I.
¯ Soit ! > 0 et δ une jauge sur I¯ telle
que l’on ait
|S(I, f, Π) − J|2 ≤ !,
pour toute P-partition δ-fine Π de I. Alors, pour ces mêmes P-partitions
Π = {(x1 , I 1), . . . , (xm, I m)}, on a, si i = 1, 2 ou ∞,
# #
# m #J # #
# $ # # #
#S(I, |f |i, Π) − # f ## # ≤ 2p!.
# # ¯j #
# j=1 I i#

Démonstration. En appliquant les inégalités classiques sur les normes et


le corollaire précédent à la famille Π = {(x1 , I 1 ), . . ., (xm, I m)}, on obtient
# # # #
# m #J # # #m 2 #J # 3#
# $ # # # #$ # # #
#S(I, |f |i, Π) − # f ## #= # µ(I )|f (x )|i − ##
j j
f ## #
# # ¯j # # #
# j=1 I i# #j=1 I¯j i #

m #
$ #J ## m #
$ J #
# # ## # #
≤ #µ(I j )|f (xj )|i − # f ## ## ≤ #µ(I j )f (xj ) − f ## ≤ 2p!.
# # ¯j # ¯j
j=1 I i j=1 I i

10.9 L-intégrabilité sur un pavé


L’intégrabilité d’une fonction f sur un pavé I¯ de Rn n’entraı̂ne pas nécessai-
rement l’intégrabilité de |f |i sur I¯ et l’intégrabilité de |f |i sur I¯ n’entraı̂ne
pas nécessairement celle de f sur I¯ (i = 1, 2 ou ∞). Nous donnerons plus loin
10.9. L-INTÉGRABILITÉ SUR UN PAVÉ 383

des exemples justifiant cette assertion. On va voir que la classe des fonctions
f telles que f et |f |i sont toutes deux intégrables sur I¯ est un sous-ensemble
particulièrement important de l’ensemble des fonctions intégrables sur I, ¯ de
la même manière que le sous-ensemble des séries absolument convergentes
constitue un sous-ensemble particulièrement intéressant de l’ensemble des
séries convergentes. Le dernier corollaire du lemme de Saks-Henstock montre
que, ! > 0 étant donné et δ étant une jauge associée à cet ! par l’intégrabilité
de f sur I,¯ les sommes de Riemann S(I, |f |i, Π) relatives à |f |i et aux P-
partitions δ-finesHΠ = {(x1 , I 1 ), . . ., (xm, I m)} diffèreront de moins de 2p! des
%
quantités m j=1 | I¯j f |i . Cette observation suggère la condition nécessaire et
suffisante suivante pour qu’une fonction f ∈ P (I, ¯ Rp) soit telle que |f |i ∈
¯ R ).
P (I, p

Proposition. Soit I un semi-pavé de Rn , f une fonction de Rn dans Rp


intégrable sur I¯ et i = 1, 2 ou ∞. Alors, |f |i est intégrable sur I¯ si et
seulement si le sous-ensemble de R+
; q #J # <
$# #
Si = #
# f # : {K , . . ., K } ∈ P(I) ,
# 1 q
K̄ l
l=1 i

est majoré, où P(I) désigne l’ensemble de toutes les partitions {K 1 , . . .,


K q } de I en un nombre fini de semi-pavés. En outre, si Si est majoré, alors
J & q #J #'
$ # #
|f |i = sup Si = sup #
# f ## .
I¯ {K 1 ,...,K q }∈P (I) l=1 K̄ l
i

Démonstration. Condition nécessaire. Soit i = 1, 2 ou ∞. Si f et


¯ et si {K 1 , . . . , K q } ∈ P(I), alors f et |f |i sont
|f |i sont intégrables sur I,
intégrables sur chaque K etl
#J # J
# #
#
# f ## ≤ |f |i, (1 ≤ l ≤ q).
K̄ l i K̄ l

Dès lors, en vertu de l’additivité de l’intégrale, on a


q #J
$
# q J
$ J
# #
# f ## ≤ |f |i = |f |i ,
#
l=1 K̄ l i l=1 K̄ l I¯
H
ce qui montre que Si est majoré par I¯ |f |i .
Condition suffisante. i = 1, 2 ou ∞ étant fixé, posons
& q #J #'
$ # #
Ai = sup Si = sup #
# f ## .
K̄ l
{K 1 ,...,K q }∈P (I) l=1 i
384 CHAPITRE 10. FONCTIONS INTÉGRABLES

Soit ! > 0 donné. Par la caractérisation du supremum, il existe {K 1 , . . . ,


K q } ∈ P(I) tel que
q #J #
! $ ## #
Ai − ≤ f # ≤ Ai .
2 l=1 # K̄ l #i

Par l’intégrabilité de f sur I¯ et le lemme des P-partitions subordonnées, il


existe une jauge δ sur I¯ telle que
# J #
# #
#S(I, f, Π) − f # ≤ !
# # 4p
I¯ 2

pour toute P-partition δ-fine Π de I et telle que, pour chacune de ces P-


partitions Π = {(x1 , I 1 ), . . ., (xm, I m)}, la famille

Π̃ = {(xj , I j ∩ K l ) : I j ∩ K l /= ∅, 1 ≤ l ≤ q, 1 ≤ j ≤ m}

est une P-partition δ-fine de I pour laquelle S(I, |f |i, Π) = S(I, |f |i, Π̃). En
conséquence, on a
# #
q #J # q # J #
! $ ## # $ # $ #
Ai − ≤ f ## = # f ##
2 l=1 # K̄ l i
#
l=1 #{1≤j≤m : I j ∩K l (=∅} K ∩I
l j #
i
q #J #
$ $ # #
≤ # f ## ≤ Ai ,
#
l=1 {1≤j≤m : I j ∩K l (=∅} K l ∩I j
i

et, en vertu du dernier corollaire du lemme de Saks-Henstock,


# #
# $ #J ##
# # ## !
#S(I, |f |i, Π̃) − # ##
# # l j f# # ≤ 2.
# {1≤j≤m, 1≤l≤q : I j ∩K l (=∅}
K ∩I i#

En conséquence, si Π est une P-partition δ-fine de I, on a

|S(I, |f |i, Π) − Ai | = |S(I, |f |i, Π̃) − Ai |


# #
# #J ##
# $ # ##
≤ ##S(I, |f |i, Π̃) − # ##
# l j f# #
# {1≤j≤m, 1≤l≤q : I j ∩K l (=∅}
K ∩I i#
# #
# #J # #
# $ # # # ! !
+#
#
# l j f # − Ai # ≤ 2 + 2 = !.
# # #
#{1≤j≤m, 1≤l≤q : I j ∩K l (=∅} K ∩I i #
10.9. L-INTÉGRABILITÉ SUR UN PAVÉ 385

Remarque. Les inégalités bien connues entre les trois types de normes
d’un élément de Rp montrent que si Si est majorée pour une des normes, il
l’est pour les deux autres. En conséquence, lorsque f est intégrable sur I, ¯
l’intégrabilité de l’une des fonctions |f |i entraı̂nera celle des deux autres, ce
qui justifie l’indépendance de la définition qui suit par rapport au choix de
la norme | · |2 .
Définition. Soit I un semi-pavé de Rn et f une fonction de Rn dans Rp
¯ On dit que f est absolument intégrable sur I¯ ou intégrable
définie sur I.
au sens de Lebesgue sur I¯ ou encore L-intégrable sur I¯ si f et |f |2 sont
¯
intégrables sur I.
L’appellation “intégrable au sens de Lebesgue” vient de ce que cette
classe de fonctions fut introduite pour la première fois en 1902 par Henri
Lebesgue à partir d’une définition différente de celle utilisée ici. Toute
fonction L-intégrable sur I¯ y est donc évidemment intégrable. En d’autres
¯ Rp) l’ensemble des fonctions de Rn dans Rp
termes, si l’on désigne par L(I,
¯ on a l’inclusion
L-intégrables sur I,
¯ Rp) ⊂ P (I,
L(I, ¯ Rp).

On montrera plus loin que l’inclusion est stricte. Bien entendu, par définiti-
on, l’intégrabilité et la L-intégrabilité coı̈ncident pour des fonctions positives
¯
sur I.
Une conséquence simple mais importante de la proposition que nous
venons de démontrer est le test de comparaison de L-intégrabilité sui-
vant.
Corollaire. Soit I un semi-pavé de Rn et g une fonction positive intégrable
¯ Alors, toute fonction f de Rn dans Rp intégrable sur I¯ et telle que,
sur I.
¯ on ait
pour i = 1, 2 ou ∞ et chaque x ∈ I,

|f (x)|i ≤ g(x),
¯ et l’on a
est L-intégrable sur I,
J J
|f |i ≤ g.
I¯ I¯

Démonstration. Par hypothèse et par la propriété de restriction, f et g


sont intégrables sur K̄ pour tout semi-pavé K ⊂ I, on a,
#J # J
# #
# f ## ≤ g.
#
K̄ i K̄
386 CHAPITRE 10. FONCTIONS INTÉGRABLES

Dès lors, si {K 1 , . . . , K q } ∈ P(I), on aura, en utilisant l’additivité de l’inté-


grale,
q #J
$ # q J
$ J
# #
# f ## ≤ g= g.
#
l=1 K̄ l i l=1 K̄
l I¯
H
Donc I¯ g majore l’ensemble Si et la proposition ci-dessus entraı̂ne l’intégra-
bilité de |f |i sur I¯ et l’inégalité
J J
|f |i ≤ g.
I¯ I¯

Ce test de comparaison a plusieurs conséquences intéressantes. La premi-


¯ entre l’intégrabilité et
ère est l’équivalence, pour les fonctions bornées sur I,
la L-intégrabilité.

Corollaire. Soit I un semi-pavé de Rn et f une fonction de Rn dans Rp


¯ Alors f est L-intégrable sur I¯ si et seulement si f
définie et bornée sur I.
¯
est intégrable sur I.

Démonstration. La condition nécessaire est évidente. Pour la condition


suffisante, il existe par hypothèse une constante M ≥ 0 telle que

|f (x)|2 ≤ M

pour tout x ∈ I. ¯ Comme la fonction constante M est intégrable sur I,


¯ la
thèse résulte du test de comparaison.

Comme toute fonction R-intégrable sur I¯ est bornée sur I, ¯ on déduit de


ce corollaire la L-intégrabilité sur I¯ de toute fonction R-intégrable sur I.
¯ En
d’autres termes, on a l’inclusion

¯ Rp) ⊂ L(I,
R(I, ¯ Rp),

et l’inclusion est stricte puisque la fonction de Dirichlet, positive et intégra-


ble sur [0, 1], y est évidemment L-intégrable. Le corollaire montre aussi que
c’est parmi les fonctions non bornées sur I¯ qu’il faudra chercher les éléments
¯ Rp) \ L(I,
de P (I, ¯ Rp).
Une autre conséquence du test de comparaison est le caractère d’espace
vectoriel de L(I,¯ Rp).
10.9. L-INTÉGRABILITÉ SUR UN PAVÉ 387

Corollaire. Si I est un semi-pavé de Rn , si f et g sont des fonctions de Rn


dans Rp L-intégrables sur I¯ et si c ∈ R, alors f + g et cf sont L-intégrables
¯
sur I.
Démonstration. Par hypothèse, f , g, |f |2 et |g|2 sont intégrables sur I, ¯ et
¯ Rp )
il en est dès lors de même de f + g, |f |2 + |g|2 , cf et |c||f |2, puisque P (I,
est un espace vectoriel. D’ailleurs, pour chaque x ∈ I, ¯ on a

|(f + g)(x)|2 ≤ |f (x)|2 + |g(x)|2 = |f |2 (x) + |g|2(x),


|cf (x)|2 ≤ |c||f (x)|2 = |c||f |2(x).
La thèse résulte alors du test de comparaison.
Le test de comparaison montre aussi que les composantes d’une fonction
L-intégrable sur I¯ y sont L-intégrables.
Corollaire. Si I est un semi-pavé de Rn et f une fonction de Rn dans Rp
¯ Alors f est L-intégrable si et seulement si chaque composante
définie sur I.
fk de f est L-intégrable sur I¯ (1 ≤ k ≤ p).
Démonstration. Condition nécessaire. Par hypothèse et par les pro-
priétés de l’intégrale, f , fk , (1 ≤ k ≤ p) et |f |2 sont intégrables sur I.¯
Comme on a
|fk (x)| ≤ |f (x)|2 ,
pour chaque entier k compris entre 1 et p et tout x ∈ I, ¯ la thèse résulte du
test de comparaison.
Condition suffisante. Par hypothèse, chaque fk et chaque |fk | est inté-
¯ (1 ≤ k ≤ p), et dès lors, par les propriétés de l’intégrabilité, il
grable sur I,
%
en est de même de f et de |f |1 = pk=1 |fk |, et donc de f et de |f |2 .
On peut donc ramener l’étude de la L-intégrabilité sur I¯ des fonctions
de Rn dans Rp à celle de fonctions réelles. Pour celles-ci, on possède une
version raffinée du test de comparaison.
Proposition. Soit f une fonction réelle intégrable sur l’adhérence I¯ d’un
semi-pavé I de Rn . Alors f est L-intégrable sur I¯ si et seulement s’il e-
xiste une fonction réelle g L-intégrable sur I¯ et telle que l’une des conditions
suivantes
f (x) ≤ g(x) ou f (x) ≥ g(x)
soit satisfaite pour tout x ∈ I.¯
Démonstration. Condition nécessaire. Il suffit évidemment de prendre
g = f.
388 CHAPITRE 10. FONCTIONS INTÉGRABLES

Condition suffisante. Le deuxième cas se ramène au premier en con-


sidérant −f au lieu de f . On a f = g − (g − f ) avec g L-intégrable sur I¯ et
¯ donc L-intégrable sur I.
g − f positive et intégrable sur I, ¯ Comme L(I, ¯ R)
est un espace vectoriel, le résultat est démontré.

Enfin, une application directe de la définition et de la propriété d’additi-


vité des fonctions intégrables fournit la propriété d’additivité pour les
fonctions L-intégrables.

Proposition. Soit I un semi-pavé de Rn et f une fonction de Rn dans Rp


¯ Etant donné {K 1 , . . ., K q } ∈ P(I), f est L-intégrable sur I¯ si
définie sur I.
et seulement si f est L-intégrable sur chaque K̄ l (1 ≤ l ≤ q).

10.10 Exercices
1. Montrer que si f est une fonction de R dans Rp R-intégrable sur [a, b], on
a
J b m 4 5
b−a $ (j − 1)(b − a)
f = lim f a+ .
a m→∞ m m
j=1

2. Si f et g sont deux fonctions de R dans R telles que f soit continue sur


[a, b], g intégrable et positive sur [a, b] et f g intégrable sur [a, b], montrer
qu’il existe c ∈ [a, b] tel que
J b J b
f g = f (c) g.
a a

(Premier théorème de la moyenne du calcul intégral). Suggestion : par le


théorème de Weierstrass, il existera y et z dans [a, b] tels que
J b J b J b
f (y) g≤ f g ≤ f (z) g,
a a a

et la thèse résulte
H
du théorème des valeurs intermédiaires appliqué à la fonc-
tion continue ( ab g)f. Le cas particulier où g = 1 est intéressant.
3. Montrer que si f est uneH fonction réelle définie et croissante sur [a, b],
alors son intégrale indéfinie a· f est convexe sur [a, b].
4. Soit I un semi-pavé de Rn et ϕ une application positive définie sur
l’ensemble des semi-pavés contenus dans I et étendue à toute union finie
10.10. EXERCICES 389

I 1 ∪ . . . ∪ I r de semi-pavés contenus dans I et mutuellement disjoints par la


relation  
r
> r
$
ϕ I j = ϕ(I j ).
j=1 j=1

Montrer que la mesure µ d’un semi-pavé de Rn vérifie cette condition. Si


f est une fonction de Rn dans Rp définie sur I, on dit que f est intégrable
sur I au sens de Perron-Stieltjes par rapport à ϕ s’il existe J ∈ Rp tel que,
pour chaque ! >A0, on puisse
B
trouver une jauge δ sur I tel que, pour toute
P-partition Π = (xj , I j ) 1≤j≤m δ-fine de I, on ait
# #
#m #
#$ #
# ϕ(I j
)f (x j
) − J # ≤ !.
# #
#j=1 #
2
%m
L’expression S(I, ϕ, f, Π) = j=1 ϕ(I j )f (xj ) s’appelle la somme de Rie-
mann-Stieltjes relative à I, ϕ, f et Π. Montrer qu’il existe au plus un J
vérifiant la définition ci-dessus. On l’appelle l’intégrale de Perron-Stieltjes
de f sur I par rapport à ϕ, et on le note
J J J
f dϕ ou f (x) dϕ(x) ou f (x)ϕ(dx).
I¯ I¯ I¯

Si l’on peut prendre la jauge δ constante dans la définition précédente, on


parle d’intégrale de Riemann-Stieltjes. Etudier les propriétés de l’intégrale
qui restent valables dans ce cadre plus général. Un cas particulier important
est celui où n = 1 et où, si I j = ]aj , bj ], on prend

ϕ(I j ) = g(bj ) − g(aj ),

où g est une fonction réelle définieH et croissante sur [a, b]. L’intégrale corres-
pondante est alors souvent notée ab f dg.
5. Si f est une fonction de Rn dans Rp continue sur l’adhérence I¯ du semi-
pavé I de Rn , et si J
|f |2 = 0,

montrer que f = 0 sur I. ¯ On procédera par l’absurde en notant que l’existen-


¯
ce d’un y ∈ I tel que |f (y)|2 > 0 et la continuité de f entraı̂nent l’existence
d’un semi-pavé J ⊂ I tel que |f (x)|2 ≥ 12 |f (y)|2 pour tout x ∈ J. ¯ On a donc,
si I = J ∪ I 1 ∪ I 2 ∪ . . . ∪ I r , où les I j sont des semi-pavés mutuellement
390 CHAPITRE 10. FONCTIONS INTÉGRABLES

¯
disjoints de I \ J,
J r J
$ J
0= |f |2 = |f |2 + |f |2
I¯ ¯j
j=1 I J¯

J J
1 µ(J)
≥ |f |2 ≥ |f (y)|2 = |f (y)|2 > 0,
¯
J 2 J¯ 2
ce qui est contradictoire.
6. Soient a > 0 et b > 0 des nombres réels. Démontrer la formule de Gauss
∞ J
$ (−1)k 1 xa−1
= dx.
k=0
a + bk 0 1 + xb

Suggestion : on part de l’identité, valable pour tout x ≥ 0 et tout entier


n ≥ 1,
n−1
xa−1 $ (−1)n xa−1+bn
= x a−1
(−xb )k + ,
1+x b
k=0
1 + xb
et l’on intègre les deux membres sur [0, 1], ce qui donne
J n−1
$ (−1)k
1 xa−1
dx = + Rn ,
0 1 + xb k=0
a + bk

où # J 1 nb+a−1 # #J #
# x # # 1 # 1
# #
|Rn | = #(−1) n
dx #≤ #
# x nb+a−1
dx## = .
# 0 1+x b # 0 a + bn
Donc Rn → 0 lorsque n → ∞. On en déduit en particulier la formule de
Mercator
1 1 (−1)k
log 2 = 1 − + − . . . + + . . ..
2 3 k+1
7. Si c /= 1 est un réel et si a et b sont deux applications de l’intervalle I ⊂ R
dans R, montrer que l’application y : I → R∗+ est solution de l’équation
différentielle de Bernoulli

y $ (x) = a(x)y(x) + b(x)y(x)c,

si et seulement si l’application z = y 1−c est solution sur I de l’équation


différentielle linéaire

z $ (x) = (1 − c)a(x)z(x) + (1 − c)b(x).


10.11. PETITE ANTHOLOGIE 391

8. Soit I ⊂ R un intervalle et g une application continue de I dans R.


Montrer que toute solution y sur I de l’équation différentielle
y $$ (x) = g[y(x)],
(c’est-à-dire toute application y de I dans R deux fois dérivable sur I vérifiant
cette relation sur I) vérifie l’équation différentielle du premier ordre
[y $ (x)]2 = 2[G(y(x)) + C],
où G est une primitive de g sur I et C une constante réelle arbitraire.
9. Montrer que l’équation fonctionnelle de Cauchy
f (x + y) = f (x) + f (y), (x ∈ R, y ∈ R),
où l’inconnue f est une fonction continue, a pour solutions les fonctions
f (x) = cx, (c ∈ R). Suggestion. En prenant x = y = 0, on voit que
f (0) = 0. En intégrant les deux membres de l’égalité par rapport à y, x
étant fixé, on trouve
J 1 J 1
f (x + y) dy = f (x) + f (y) dy,
0 0
et donc, par l’invariance de l’intégrale pour une translation,
J x+1 J 1 J x+1 J x J 1
f (x) = f (u) du− f (y) dy = f (u) du− f (u) du− f (y) dy.
x 0 0 0 0

Donc f est dérivable et, pour tout x ∈ R,


f $ (x) = f (x + 1) − f (x) = f (1),
ce qui entraı̂ne f (x) = f (1)x.

10.11 Petite anthologie


Je ne ferai d’aucune difficulté d’user de cette expression la somme des or-
données qui semble ne pas être géométrique à ceux qui n’entendent pas la doc-
trine des indivisibles, et qui s’imaginent que c’est pécher contre la géométrie
que d’exprimer un plan par un nombre infini de lignes; ce qui ne vient que
de leur manque d’intelligence puisqu’on n’entend autre chose par là sinon
la somme d’un nombre indéfini de rectangles faits de chaque ordonnée avec
de petites portions égales du diamètre, dont la somme est certainement un
plan, qui ne diffère de l’espace du demi-cercle que d’une quantité moindre
qu’aucune donnée.
392 CHAPITRE 10. FONCTIONS INTÉGRABLES

Blaise Pascal, 1660


Nous avons déjà noté que les distances aj − aj−1 , par lesquelles x est
supposé croı̂tre successivement, doivent être prises très petites pour que les
valeurs correspondantes f (aj−1 ), f (aj ) ne diffèrent à leur tour guère l’une
de l’autre; à partir de cela, il faut juger si les intervalles a1 − a, a2 − a1 , . . .
doivent être pris égaux ou inégaux. En fait, là où la valeur de f (x) ne change
guère lorsque x varie, l’intervalle par lequel x croı̂t peut être pris grand sans
danger. D’autre part, là où des changements peu importants de x conduisent
à des variations violentes de f (x), on devra prendre l’intervalle très petit.
Leonhard Euler, 1768
Je considère chaque intégrale comme étant juste la somme des valeurs
infiniment petites de l’expression différentielle placée sous le signe intégrale,
qui correspond aux différentes valeurs de la variable incluses entre les limites
en question. Quand on adopte cette manière de regarder l’intégrale définie,
on prouve aisément qu’une telle intégrale a une valeur unique et finie lorsque,
les deux limites de la variable étant finie, les intégrands restent finis et con-
tinus entre ces limites. Il me semble que cette manière de regarder une
intégrale définie devrait être adoptée de préférence, comme je l’ai fait, parce
qu’elle vaut également pour tous les cas, même ceux dans lesquels nous ne
pouvons pas passer généralement de la fonction sous le signe intégral à la
fonction primitive.
Augustin Cauchy, 1823
L’incertitude qui règne encore sur quelques points fondamentaux de la
théorie des intégrales définies nous oblige à placer ici quelques remarques
sur la notion de l’intégrale définie, et sur Hla généralité dont elle est suscep-
tible. Et d’abord que doit-on entendre par ab f (x) dx? Pour répondre à cette
question, prenons entre a et b une série de valeurs x1 , x2 , . . . , xn−1 rangées
par ordre de grandeur, depuis a jusqu’à b, et désignons pour abréger x1 − a
par δ1 , x2 − x1 par δ2 , . . ., b − xn−1 par δn ; soient en outre !i des nombres
positifs plus petits que l’unité. Il est clair que la valeur de la somme

S = δ1 f (a + !1 δ1 ) + δ2 f (x1 + !2 δ2 ) + . . . + δn f (xn−1 + !n δn )

dépendra du choix des intervalles δ et des fractions !. Si elle a la propriété,


de quelque manière que les δ et les ! puissent être choisis, de s’approcher
indéfiniment d’une limite fixe A, quand les δ Htendent tous vers zéro, cette
limite s’appelle la valeur de l’intégrale définie ab f (x) dx.
10.11. PETITE ANTHOLOGIE 393

Bernard Riemann, 1854

Dans le cas des fonctions continues, il y a identité entre les notions


d’intégrale et de fonction primitive. Riemann a défini l’intégrale de cer-
taines fonctions discontinues, mais toutes les fonctions dérivées ne sont
pas intégrables au sens de Riemann. Le problème des fonctions primitives
n’est donc pas résolu par l’intégration, et l’on peut désirer une définition de
l’intégrale comprenant comme cas particulier celle de Riemann et permettant
de résoudre le problème des fonctions primitives.

Henri Lebesgue, 1901

Un caractère important de la définition de Riemann est le suivant: la di-


vision en intervalles est entièrement indépendante des propriétés de la fonc-
tion; si l’on considère deux fonctions différentes, on prendra pour ces fonc-
tions les mêmes intervalles, c’est-à-dire qu’on leur appliquera un procédé
de calcul uniforme. C’est évidemment là un grand avantage pour le calcul;
mais c’est en même temps un inconvénient : un tel procédé qui ne tient pas
compte des propriétés particulières de la fonction à laquelle il s’applique peut
être comparé à ces vêtements confectionnés, qui ne sauraient être exactement
ajustés, surtout s’il s’agit d’habiller un individu difforme : certaines fonc-
tions singulières ont pu être justement comparées aux types monstrueux de
la biologie.

Emile Borel, 1909

Intégrer, c’est pousser à l’infini les deux règles conjointes de Descartes :


d’abord diviser la difficulté pour la mieux résoudre, ensuite recomposer cette
désagrégation préliminaire. Dans une masse étendue, une cause s’exerce, un
effet s’accomplit. Si l’intensité des phénomènes était constante aux divers
points, les résultats se manifesteraient proportionnels à cette intensité et à
cette masse à la fois. Un simple produit des facteurs les livrerait. Mais si
ces intensités sont fluctuantes, comment évaluer leur concours total ? Par la
pensée, on partage le corps en éléments tellement réduits et ainsi disposés que
sur chacun d’entre eux l’action et sa conséquence, rapportées l’une et l’autre
à la mesure de la parcelle, ne présentent plus de variation appréciable. Les
évaluer est donc immédiat. Additionner ensemble des infiniment petits, pour
calculer le phénomène total, c’est procéder à une intégration. Le tout est de
prendre la partition préalable par le bon biais.

Arnaud Denjoy, 1920


394 CHAPITRE 10. FONCTIONS INTÉGRABLES

Presque tout étudiant de premier cycle en mathématique, physique ou sci-


ences de l’ingénieur étudie assez d’analyse pour rencontrer les intégrales de
Riemann, les intégrales “impropres”, les intégrales de lignes et de surfaces,
bref, tous les types d’intégration du dix-neuvième siècle. Mais le vingtième
siècle a produit des progrès en théorie de l’intégration qui furent indispen-
sables pour l’analyse et se révélèrent plus tard magnifiquement adaptés à la
théorie des probabilités et à des applications comme la théorie quantique, la
théorie de la communication et le contrôle optimal de systèmes perturbés de
manière aléatoire. Pour toutes ces applications et pour beaucoup d’autres,
il convient de connaı̂tre les idées associées à la théorie de l’intégrale de
Lebesgue. Une solution logiquement fondée mais pédagogiquement inaccep-
table consiste à écarter l’intégrale de Riemann et enseigner l’intégrale de
Lebesgue dès le début du cours d’analyse. Mais ce choix ignore l’évidence
expérimentale que les différentes manières usuelles d’introduire l’intégrale
de Riemann sont toutes considérées par les étudiants comme plus naturelles
et plus facilement comprises que n’importe laquelle des manières usuelles
d’introduire l’intégrale de Lebesgue. Une voie pour sortir de cette impasse
apparente fut ouverte en 1957, lorsque J. Kurzweil publia pour l’intégrale
d’une fonction d’une variable une définition qui ressemblait fortement à celle
de Riemann, et était pourtant plus générale; en fait, l’intégrale de Kurzweil
est plus générale que celle de Lebesgue.

Edward J. McShane, 1983


Chapitre 11

Intégrale sur un intervalle et


séries

11.1 Théorème de Hake


Soit I = ]a, b] un semi-intervalle de R et f une fonction de R dans Rp
¯ Montrons d’abord que son intégrale indéfinie est continue
intégrable sur I.
¯
sur I.

Proposition. Si f est intégrable sur [a, b], alors af est continue sur [a, b].
Démonstration. Soit c ∈ [a, b] et ! > 0; il faut montrer l’existence d’un
η > 0 tel que #J x J c #
# #
# f− f ## ≤ !
#
a a 2
lorsque x ∈ [a, b] et |x−c| ≤ η, c’est-à-dire, en vertu des propriétés d’additivi-
té de l’intégrale, tel que #J #
# x #
# f ## ≤ !,
#
c 2
pour ces mêmes x. Pour cet ! > 0, il existe une jauge δ sur [a, b] telle que
# J b ##
#
# #
#S(I, f, Π) − f # ≤ !/2
# a #
2

pour toute P-partition δ-fine Π de I. Prenons


U V
!
η = min δ(c), ,
2[1 + |f (c)|2 ]

395
396 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES

et soit x ∈ [a, b] tel que |x − c| ≤ η. Alors, si x < c, on a

[x, c] ⊂ [c − η, c] ⊂ [c − δ(c), c + δ(c)],

et, pour x > c, on a de même

[c, x] ⊂ [c, c + η] ⊂ [c − δ(c), c + δ(c)].

Le lemme de Saks-Henstock appliqué, selon le cas, à {(c, ]x, c])} ou à


{(c, ]c, x])} entraı̂ne que
#J c #
# #
# f − f (c)(c − x)## ≤ !/2,
#
x 2

ou #J #
# x #
#
# f − f (c)(x − c)## ≤ !/2,
c 2

d’où l’on déduit aussitôt


#J #
#
#
x # !|f (c)|2
# f ## ≤ !/2 + |f (c)|2 |x − c| ≤ !/2 + < !,
c 2 2[1 + |f (c)|2]

et la démonstration est complète.

Cette proposition et la propriété de restriction de l’intégrale impliquent


aussitôt que si f est intégrable sur [a, b], alors f est intégrable sur [a, c] pour
chaque c ∈ ]a, b[ et l’on a
J c J b
lim f= f.
c→b− a a

Nous allons montrer que cette condition nécessaire d’intégrabilité sur [a, b]
est également suffisante. Ce résultat, qui est très utile pour l’obtention de
tests pratiques d’intégrabilité sur un intervalle, porte le nom de théorème
de Hake. Il n’est pas valable pour la R-intégrabilité ou la L-intégrabilité
car l’existence de la limite du membre de gauche dans l’égalité ci-dessus
n’entraı̂ne pas nécessairement la R- ou la L-intégrabilité sur [a, b] de f ,
c’est-à-dire l’existence du membre de droite. Dans le cadre de ces types
d’intégration, cette limite doit être et est appelée intégrale impropre ou
intégrale généralisée.
11.1. THÉORÈME DE HAKE 397

Théorème. Soit f une fonction de R dans Rp définie sur [a, b]. Si f est
intégrable sur [a, c] pour chaque c ∈ ]a, b[ et si
J c
lim f = J,
c→b− a

alors f est intégrable sur [a, b] et


J b
f = J.
a

Démonstration. Soit ! > 0; nous allons construire une jauge δ sur [a, b]
telle que
|S(]a, b], f, Π) − J|2 ≤ !
dès que Π est une P-partition δ-fine de ]a, b]. Si nous posons aj = b − 2−j (b −
a), (j ∈ N), alors a0 = a, a < aj < aj+1 < b pour chaque j ∈ N∗ et
>
[a, b[ = [aj , aj+1 [.
j∈N

Dès lors, la fonction f est intégrable sur [aj , aj+1 ] pour chaque j ∈ N et il
existe donc une jauge δj sur [aj , aj+1 ] telle que
# J aj+1 ##
# !
# #
#S(]aj , aj+1 ], f, Πj ) − f # ≤ j+2 ,
# aj # 2 2

pour toute P-partition δj -fine Πj de ]aj , aj+1 ], (j ∈ N). D’ailleurs, puisque

f (b)(b − c) → 0 si c → b, c < b,

il existe, par hypothèse, un η > 0 tel que


#J c
#
# #
# f − J + f (b)(b − c)## ≤ !/2,
#
a 2

pour tout c ∈ [b − η, b[. Définissons comme suit la jauge δ sur [a, b] :

δ(a) = min[δ0 (a), a1 − a],

δ(x) = min[δj (x), x − aj , aj+1 − x] si x ∈ ]aj , aj+1 [, (j ∈ N),


δ(aj ) = min[δj−1 (aj ), δj (aj ), aj − aj−1 ], (j ∈ N∗ ),
δ(b) = η.
398 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES

Par un raisonnement strictement analogue à celuiA utilisé Bdans le lemme des


P-partitions subordonnées, on voit que si Π = (xj , I j ) 1≤j≤m est une P-
partition δ-fine de ]a, b] telle que xj ≤ xj+1 , (1 ≤ j ≤ m − 1), alors, pour
chaque k ∈ N,

Πk = {(xj , I j ∩ ]ak , ak+1 ]) : I j ∩ ]ak , ak+1 ] /= ∅, 1 ≤ j ≤ m}

est une P-partition δk -fine de ]ak , ak+1 ] et


$
S(]ak , ak+1 ], f, Πk ) = µ(I j ∩ ]ak , ak+1 ])f (xj ).
{1≤j≤m:I j ∩ ]ak ,ak+1 ](=∅}

D’autre part, pour toute P-partition δ-fine Π de ]a, b] comme ci-dessus, on


a nécessairement xm = b puisque, si xm < b il existera r ∈ N tel que
xm ∈ [ar , ar+1 [, et donc, par construction de la jauge δ, tel que I m = ]d, b] ⊂
[ar−1 , ar+1 ] ⊂ [ar−1 , b[, ce qui est contradictoire. Désignons par q le plus
petit entier naturel tel que
m−1
>
I j ⊂ ]a, aq+1 ].
j=1

On a donc # #
#m #
#$ #
|S(I, f, Π) − J|2 = ## µ(I j )f (xj ) − J ##
#j=1 #
2
#
#q−1
#$ $
= ## µ(I j ∩ ]ak , ak+1 ])f (xj )
#k=0 {1≤j≤m:I j ∩ ]a
k ,ak+1 ](=∅}
$
+ µ(I j ∩ ]aq , d])f (xj ) + (b − d)f (b)
{1≤j≤m:I j ∩ ]aq ,d](=∅}
#
#
$ J ak+1
q−1 J d J d #
− f− f+ f − J ##
k=0 ak aq a #
2
# #
#q−1 2 J ak+1 3#
#$ #
≤ ## S(]ak , ak+1 ], f, Πk ) − f ##
#k=0 ak #
2
# #
# $ J d #
# #
+ ## µ(I ∩ ]aq , d])f (x ) −
j j
f ##
#{1≤j≤m:I j ∩ ]aq ,d](=∅} aq #
2
11.2. INTÉGRALE SUR UN INTERVALLE BORNÉ 399
#J #
# d #
# #
+# f − J + (b − d)f (b)# .
# a #
2
Le premier et le dernier terme de cette expression ont déjà été estimés. Pour
celui du milieu, il suffit de remarquer que la famille

{(xj , I j ∩ ]aq , d]) : I j ∩ ]aq , d] /= ∅, 1 ≤ j ≤ m}

vérifie les conditions du lemme de Saks-Henstock pour f et δq sur ]aq , aq+1 ].


En conséquence, on aura
q−1
$ ! ! !
|S(I, f, Π) − J|2 ≤ + + < !,
k=0
2k+2 2q+2 2

et la démonstration est complète.


On démontre d’une manière strictement analogue le théorème de Hake
correspondant à l’autre extrémité de l’intervalle.
Théorème. Soit f une fonction de R dans Rp définie sur [a, b]. Si f est
intégrable sur [c, b] pour chaque c ∈ ]a, b[ et si
J b
lim f = J,
c→a+ c

alors f est intégrable sur [a, b] et


J b
f = J.
a

11.2 Intégrale sur un intervalle borné


Il est important de noter que les hypothèses du théorème de Hake ne font
pas intervenir, dans le premier cas, la valeur de la fonction f en b et, dans
le second cas, la valeur de f en a. Par conséquent, si f est une fonction de
R dans Rp définie sur I = [a, b[ ou sur I = ]a, b], chaque prolongement de f
à [a, b] sera intégrable sur [a, b] si un seul d’entre eux l’est, et tous auront la
même intégrale. Cette remarque justifie la définition suivante d’intégrabilité
sur un semi-intervalle borné [a, b[ ou ]a, b].
Définition. Soit f une fonction de R dans Rp définie sur [a, b[ (resp. ]a, b]).
On dira que f est intégrable sur [a, b[ (resp. ]a, b]) s’il existe un prolongement
400 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES

f˜ de f à [a, b] qui est intégrable


H
sur [a, b], auquel
H
cas l’intégrale
H
de f sur
Hb
[a, b[
˜
(resp. ]a, b]) sera définie par [a,b] f et notée [a,b[ f (resp. ]a,b] f ) ou a f .
H
Il n’y a pas d’ambiguité dans la notation ab f puisque, lorsque f est
définie et intégrable sur [a, b], les trois notions coı̈ncident.
Exemples. 1. Soit b ∈ R et f la fonction définie par

f (x) = (b − x)−p ,

où p > 0. La fonction f est primitivable sur ]−∞, b[ et l’une de ses primitives
est donnée par la fonction F définie par F (x) = (p − 1)−1 (b − x)1−p si p /= 1
et F (x) = − ln(b − x) si p = 1. En conséquence, si a < b est donné, f est
intégrable sur [a, c] quel que soit c ∈ ]a, b[ et
J c
f = (p − 1)−1 [(b − c)1−p − (b − a)1−p ]
a

si p /= 1 et J c
f = ln(b − a) − ln(b − c)
a

si p = 1. Le théorème de Hake montre alors que f est intégrable sur [a, b[ si


et seulement si p < 1, auquel cas
J b
(b − x)−p dx = (1 − p)−1 (b − a)1−p.
a

2. Soit a ∈ R et f la fonction définie par

f (x) = (x − a)−p ,

où p > 0. La fonction f est primitivable sur ]a, +∞[ et l’une de ses primitives
est donnée par la fonction F définie par F (x) = (1 − p)−1 (x − a)1−p si p /= 1
et F (x) = ln(x − a) si p = 1. En conséquence, si b > a est donné, f est
intégrable sur [c, b] quel que soit c ∈ ]a, b[ et
J b
f = (1 − p)−1 [(b − a)1−p − (c − a)1−p ]
c

si p /= 1 et
J b
f = ln(b − a) − ln(c − a)
c
11.2. INTÉGRALE SUR UN INTERVALLE BORNÉ 401

si p = 1. Le théorème de Hake montre alors que f est intégrable sur ]a, b] si


et seulement si p < 1, auquel cas
J b
(x − a)−p dx = (1 − p)−1 (b − a)1−p .
a
On peut également définir l’intégrabilité d’une fonction définie sur un
intervalle ouvert borné ]a, b[.
Définition. Soit f une fonction de R dans Rp définie sur un intervalle ouvert
borné ]a, b[. On dit que f est intégrable sur ]a, b[ s’il existe un c ∈]a, b[ tel que
f soit intégrable sur ]a, c]
H
et intégrable
H
sur [c, b[. S’il en est ainsi, l’intégrale
de f sur ]a, b[ est notée ]a,b[ f ou ab f et définie par
J b J c J b
f= f+ f.
a a c

L’additivité de l’intégrale usuelle entraı̂ne aisément que si un c ∈ ]a, b[


existe pour lequel la condition de la définition est vérifiée, alors elle le sera
pour tout autre c$ ∈ ]a, b[, avec la même valeur de l’intégrale. On peut
aussi vérifier aisément que f est intégrable sur ]a, b[ si et seulement si f est
intégrable sur [c, d] quels que soient c < d contenus dans ]a, b[ et
J d
lim f
(c,d)→(a,b),c>a,d<b c

existe.
Les propriétés élémentaires de l’intégrale (linéarité, propriétés d’or-
dre, passage aux composantes, comportement par rapport à une translation
ou une homothétie) et les propriétés d’additivité et de restriction s’é-
tendent immédiatement, à partir des définitions et des propriétés correspon-
dantes de l’intégrale ordinaire, aux intégrales sur un semi-intervalle ou sur
un intervalle ouvert bornés.
Le théorème fondamental du calcul différentiel et intégral peut
être étendu à l’intégration sur un intervalle borné quelconque.
Proposition. Soit f une fonction de R dans Rp primitivable sur ]a, b[ et F
une primitive de f sur ]a, b[. Si
lim F (c) et lim F (c)
c→a+ c→b−

existent, alors f est intégrable sur ]a, b[ et


J b
f = lim F (c) − lim F (c).
a c→b− c→a+
402 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES

Démonstration. La fonction f , primitivable sur ]a, b[, l’est sur [c, c$] quels
que soient c < c$ dans ]a, b[ et dès lors, par le théorème fondamental du calcul
différentiel et intégral et l’additivité de l’intégrale, si d ∈ ]a, b[ est fixé et si
c < d < c$ , f est intégrable sur [c, d] et sur [d, c$] et l’on a
J d J c"
f = F (d) − F (c), f = F (c$ ) − F (d).
c d

Comme, par hypothèse,


J d
lim f = lim [F (d) − F (c)] = F (d) − lim F (c),
c→a+ c c→a+ c→a+

et J c"
"
lim f = "lim [F (c$ ) − F (d)] = "lim F (c$ ) − F (d),
c →b− d c →b− c →b−

le théorème de Hake entraı̂ne l’intégrabilité de f sur ]a, d] et sur [d, b[, avec
J d J b
f = F (d) − lim F (c), f = "lim F (c$ ) − F (d),
a c→a+ d c →b−

et la thèse résulte de la définition de l’intégrabilité de f sur ]a, b[ et de celle


de son intégrale sur cette intervalle.
Exemple. Les considérations que nous venons de développer permettent
de donner un exemple de fonction intégrable sur un intervalle sans y être
L-intégrable. Soit f la fonction de R dans R définie par
1 2 1
f (x) = 2x sin − cos 2 si x /= 0, f (0) = 0.
x2 x x
On a vu précédemment que f était la dérivée de la fonction F définie par
1
F (x) = x2 sin si x /= 0, F (0) = 0.
x2
En particulier, f est intégrable sur [0, b] quel que soit b > 0 et
J b 1
f = b2 sin .
0 b2
Si nous définissons les fonctions g et h sur R par
2 1
g(x) = cos 2 si x /= 0, g(0) = 0,
x x
11.2. INTÉGRALE SUR UN INTERVALLE BORNÉ 403

1
h(x) = 2x sin si x /= 0, h(0) = 0,
x2
nous constatons immédiatement que h, continue sur R, sera intégrable sur
[0, b] quel que soit b > 0, et il en sera dès lors de même de g = h − f.
En particulier, g est intégrable sur [0, 1]. Nous allons montrer que |g| n’est
pas intégrable sur [0, 1], ce qui entraı̂nera que g ∈ P ([0, 1], R) \ L([0, 1], R).
Notons tout d’abord que |g|, continue sur [c, 1] quel que soit c ∈ ]0, 1[, est
primitivable sur [c, 1]. Le théorème d’intégration par substitution s’applique
donc à |g| sur chaque intervalle [((k + 1)π)−1/2, (kπ)−1/2], (k ∈ N∗ ), et
fournit, en effectuant la substitution x2 2→ y1 ,

J (kπ)−1/2
# # J
2 ## 1# (k+1)π | cos y|
cos 2 ## dx = dy.
((k+1)π)−1/2 x# x kπ y

D’autre part,
J J
(k+1)π | cos y| 1 (k+1)π 2
dy ≥ | cos y| dy =
kπ y (k + 1)π kπ (k + 1)π

J J
2 k+2 dy 2 k+2 dy
= ≥ .
π k+1 k+1 π k+1 y
Dès lors, pour tout entier n ≥ 0, on a
J 1 J 1 n J
$ (kπ)−1/2
|g| = |g| + |g|
((n+1)π)−1/2 π−1/2 k=1 ((k+1)π)
−1/2

J n J k+2 J 1 J
1 2$ dy 2 n+2 dy
≥ |g| + = |g| +
π−1/2 π k=1 k+1 y π−1/2 π 2 y

J 4 5
1 2 n+2
= |g| + ln .
π−1/2 π 2
H
Il en résulte aussitôt que limc→0+ c1 |g| n’existe pas et |g| n’est pas intégrable
sur [0, 1].
On peut aussi étendre à l’intégrabilité sur un intervalle borné quel-
conque la formule d’intégration par parties. Nous traiterons le cas
de l’intégration sur ]a, b[, l’adaptation à ]a, b] ou à [a, b[ étant aisée.
404 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES

Proposition. Soient f et g deux fonctions de R dans K dérivables sur ]a, b[.


Si f $ g est intégrable sur ]a, b[ et si limx→a+ f (x)g(x) et limx→b− f (x)g(x)
existent, alors f g $ est intégrable sur ]a, b[ et l’on a
J b J b
f g $ = lim f (c)g(c) − lim f (c)g(c) − f $ g.
a c→b− c→a+ a

Démonstration. Soit d ∈ ]a, b[ fixé et soient c et c$ tels que a < c < d <
c < b. Par hypothèse, f $ g est intégrable sur [c, d] et sur [d, c$] et la formule
$

d’intégration par parties entraı̂ne l’intégrabilité de f g $ sur ces intervalles et


les formules J J
d d
f g $ = f (d)g(d) − f (c)g(c) − f $ g,
c c
J c" J c"
f g $ = f (c$ )g(c$) − f (d)g(d) − f $ g.
d d

Par hypothèse, on a alors


J d J d
lim f g $ = f (d)g(d) − lim f (c)g(c) − f $ g,
c→a+ c c→a+ a

J c" J b
"
lim f g $ = "lim f (c$ )g(c$) − f (d)g(d) − f $ g.
c →b− d c →b− d

L’intégrabilité de f g $ sur ]a, b[ et la formule correspondante d’intégration par


parties résulte alors d’une double application du théorème de Hake et de la
définition d’intégrabilité sur ]a, b[.
Exemple. La fonction h définie sur R∗+ par h(x) = ln x est intégrable sur
]0, b] quel que soit b > 0. En effet, ln x = (x)$ ln x et dès lors si l’on pose
f (x) = ln x et g(x) = x, on a h = f g $ et (f $ g)(x) = 1, (f g)(x) = x ln x pour
tout x. Donc f $ g est intégrable sur [0, b] et, par le théorème de l’Hospital,

lim (f g)(x) = 0,
x→0+

tandis que f g est continue en b. Par conséquent, ln est intégrable sur [0, b]
et J b
ln x dx = b ln b − b.
0

On peut évidemment définir une notion de L-intégrabilité sur des inter-


valles bornés quelconques.
11.2. INTÉGRALE SUR UN INTERVALLE BORNÉ 405

Définition. Soit I = [a, b[, ]a, b], ou ]a, b[ et f une fonction de R dans
Rp définie sur I. On dira que f est intégrable au sens de Lebesgue ou L-
intégrable ou absolument intégrable sur I si f et |f |2 sont intégrables sur
I.
Les propriétés élémentaires de la L-intégrale, ainsi que les propriétés
d’additivité et de restriction s’étendent immédiatement à ce nouveau type
d’intégrale. Bien que le théorème de Hake ne soit pas vrai, comme on l’a
déjà remarqué plus haut, pour la L-intégrabilité, c’est-à-dire si l’on remplace
partout “intégrable” par “L-intégrable”, il en existe une version plus restric-
tive qui fait intervenir l’intégrale indéfinie de |f |2 . Donnons ce théorème
de Hake pour la L-intégrabilité, pour fixer les idées, dans le cas d’un
intervalle de type [a, b[, les autres cas étant analogues.
Proposition. Soit f une fonction de R dans Rp définie sur [a, b[. Alors f
est L-intégrable sur [a, b[ si et seulement si f est L-intégrable sur [a, c] quel
que soit c ∈ ]a, b[ et si
J c
lim |f |2
c→b− a

existe.
Démonstration. Condition nécessaire. Si f est L-intégrable sur [a, b[,
alors, par définition, il existe un prolongement f˜ de f à [a, b] tel que f˜
˜ 2 soient intégrables sur [a, b]. En conséquence, par la continuité de
et |f|
H H
l’intégrale indéfinie, limc→b− ac |f |2 = limc→b− ac |f˜|2 existe.
Condition
Hc
suffisante. Par le théorème de Hake, il suffit de montrer que
limc→b− a f existe, ce qui sera le cas si la condition de Cauchy correspondant
à cette limite est vérifiée. Or, si a < c < c$ < b, on a
#J " # J c"
# c #
# #
# f# ≤ |f |2 ,
# c # c
2

et la thèse résulte de ce que l’intégrale indéfinie de |f |2 vérifie la condition


de Cauchy pour la limite en b.
On a un test de comparaison pour la L-intégrabilité sur [a, b[.
Proposition. Soit g une fonction de R dans R+ intégrable sur [a, b[ et f
une fonction de R dans Rp définie sur [a, b[ et intégrable sur [a, c] quel que
soit c ∈ ]a, b[. Si
|f (x)|2 ≤ g(x)
406 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES

pour tout x ∈ [a, b[, alors f est L-intégrable sur [a, b[.

Démonstration. La dernière hypothèse et le test de comparaison classique


entraı̂nent la L-intégrabilité de f sur [a, c] quel que soit c ∈ ]a, b[. En outre,
quels que soient c < c$ dans ]a, b[, on a
J c" J c"
|f |2 ≤ g.
c c
H
Comme g est intégrable sur [a, b[, limc→b− ac g existe et la condition de
Cauchy correspondante est donc satisfaite. En conséquence, elle l’est aussi
pour l’intégrale indéfinie de |f |2 et la thèse résulte de la proposition précé-
dente.

On démontre d’une manière strictement analogue le résultat pour ]a, b]


et le cas de ]a, b[ s’en déduit alors aisément.

Proposition. Soit g une fonction de R dans R+ intégrable sur ]a, b] et f


une fonction de R dans Rp définie sur ]a, b], intégrable sur [c, b] quel que soit
c ∈ ]a, b[. Si
|f (x)|2 ≤ g(x)

pour tout x ∈ ]a, b], alors f est L-intégrable sur ]a, b].

Proposition. Soit g une fonction de R dans R+ intégrable sur ]a, b[ et f


une fonction de R dans Rp définie sur ]a, b[, intégrable sur [a, c] quel que soit
c ∈ ]a, b[. Si
|f (x)|2 ≤ g(x)

pour tout x ∈ ]a, b[, alors f est L-intégrable sur ]a, b[.

Une première conséquence du test de comparaison est le résultat suivant.

Corollaire. Soit I = [a, b[ (resp. ]a, b]) et f une fonction de R dans Rp


définie sur I et intégrable sur [a, c] (resp. [c, b]) quel que soit c ∈ ]a, b[. Si,
pour i = 1, 2 ou ∞, |f |i est intégrable sur I, alors f est L-intégrable sur I.

Démonstration. Il suffit de prendre g = |f |i dans le test de comparaison.

Une deuxième conséquence du test de comparaison est le test de la


limite pour l’intégrabilité de fonctions positives.
11.2. INTÉGRALE SUR UN INTERVALLE BORNÉ 407

Corollaire. Soit I = [a, b[ (resp. ]a, b]) et f et g deux fonctions de R dans


R+ définies sur I et intégrables sur [a, c] (resp. [c, b]) quel que soit c ∈ ]a, b[.
Supposons que, pour tout x ∈ I, on ait g(x) > 0 et que

f (x) f (x)
lim (resp. lim )
x→b− g(x) x→a+ g(x)

existe au sens large et soit notée d.


1. Si d = 0 et si g est intégrable sur I, alors f est intégrable sur I.
2. Si d > 0 est fini, alors f est intégrable sur I si et seulement si g est
intégrable sur I.
3. Si d = +∞ et si f est intégrable sur I, alors g est intégrable sur I.
Démonstration. Considérons, pour fixer les idées, le cas où I = [a, b[,
l’autre se traitant de même. Dans le cas de l’hypothèse 1, il existe c ∈ ]a, b[
tel que, pour tout x ∈ [c, b[, on ait fg(x)
(x)
≤ 1 et dès lors 0 ≤ f (x) ≤ g(x). Par
hypothèse et par le test de comparaison, f est alors intégrable sur [c, b[, et
donc sur [a, b[ puisqu’elle l’est déjà sur [a, c]. Dans le cas de l’hypothèse 2,
en prenant ! = d/2 dans la définition de la limite, il existe c ∈ ]a, b[ tel que,
pour tout x ∈ [c, b[, on ait

d f (x) d
− ≤ −d≤ ,
2 g(x) 2

et dès lors 4 5 4 5
d 3d
0≤ g(x) ≤ f (x) ≤ g(x).
2 2
Comme les fonctions ( d2 )g, ( 3d
2 )g et g sont simultanément intégrables sur I,
la thèse en résulte en appliquant deux fois le test de comparaison. Enfin,
dans le cas de l’hypothèse 3, il existe c ∈ ]a, b[ tel que, pour tout x ∈ [c, b[,
on ait f (x) > 0. En outre, l’hypothèse équivaut à

g(x)
lim = 0,
x→b− f (x)

et il suffit d’appliquer la première partie du résultat en permutant le rôle de


f et g.
Exemple. Si a > 0 et b > 0, la fonction f donnée par

f (x) = xa−1 (1 − x)b−1


408 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES

est définie sur ]0, 1[ et telle que


f (x) f (x)
lim = 1, lim = 1.
x→0+ x a−1 x→1− (1 − x)b−1

On a vu précédemment que la fonction x 2→ xa−1 est intégrable sur ]0, 1] et


que la fonction x 2→ (1 − x)b−1 est intégrable sur [0, 1[. Le test de la limite
entraı̂ne alors l’intégrabilité de f sur ]0, d] et sur [d, 1[ quel que soit d ∈ ]0, 1[,
et donc l’intégrabilité de f sur ]0, 1[. L’intégrale correspondante
J 1
xa−1 (1 − x)b−1 dx
0

s’appelle l’intégrale d’Euler de première espèce et se note B(a, b) (lire “bêta


majuscule” de (a, b)). On notera que, quels que soient c < d dans ]0, 1[, le
changement de variable x = 1 − y sur [c, d] entraı̂ne l’égalité
J d J 1−c
xa−1 (1 − x)b−1 dx = (1 − y)a−1y b−1 dy,
c 1−d

et dès lors, si c → 0+ et d → 1−, on obtient l’égalité

B(a, b) = B(b, a)

quels que soient a > 0 et b > 0.


On peut combiner le test de comparaison que nous venons d’obtenir avec
la formule d’intégration par parties pour obtenir d’utiles tests d’intégrabi-
lité pour des produits de fonctions. Ils se fondent sur le lemme suivant.
Lemme. Soit I = [a, b[ (resp. ]a, b]), f et g des fonctions de R dans K
définies sur I et vérifiant les conditions suivantes.
1. f g est intégrable sur [a, c] (resp. [c, b]) quel que soit c ∈ H]a, b[. H
2. f est primitivable sur I et son intégrale indéfinie F = a· f (resp. ·b f )
est bornée sur I.
3. g est dérivable sur I.
4. g $ est L-intégrable sur I.
Alors f g est intégrable sur I si et seulement si
5. limc→b− F (c)g(c) (resp. limc→a+ F (c)g(c)) existe.
Démonstration. Considérons, pour fixer les idées, le cas où I = [a, b[.
Par la formule d’intégration par parties sur [a, c], avec c ∈ ]a, b[, on a
J c J c
f g = F (c)g(c) − F (a)g(a) − F g$.
a a
11.2. INTÉGRALE SUR UN INTERVALLE BORNÉ 409

L’hypothèse 2 entraı̂ne l’existence d’un M ≥ 0 tel que |F (x)| ≤ M pour


tout x ∈ I, et dès lors, pour les mêmes x, |F (x)g $(x)| ≤ M |g $ (x)|. Comme
M |g $ | est intégrable sur I par l’hypothèse 4, le test de comparaison entraı̂ne
la L-intégrabilité de F g $ sur I, et dès lors l’existence de la limite du dernier
terme du membre de droite lorsque c tend vers b dans ]a, b[. L’hypothèse 1,
la continuité de l’intégrale indéfinie et le théorème de Hake permettent alors
de conclure.
On déduit de ce lemme quatre tests pratiques d’intégrabilité. Les deux
premiers requièrent l’intégrabilité de f sur I. Le premier s’appelle le test
d’intégrabilité de Du Bois-Reymond.
Corollaire. Soit I = [a, b[ (resp. ]a, b]), f et g des fonctions de R dans K
définies sur I et vérifiant les conditions suivantes.
a. f g est intégrable sur [a, c] (resp. [c, b]) quel que soit c ∈ H]a, b[. H
b. f est primitivable sur I et son intégrale indéfinie F = a· f (resp. ·b f )
est telle que
lim F (c) (resp. lim F (c))
c→a+ c→b−

existe.
c. g est dérivable sur I.
d. g $ est L-intégrable sur I.
Alors f g est intégrable sur I.
Démonstration. Par l’hypothèse b, |F | est majorée sur [c, b[ (resp. ]a, c])
pour un certain c ∈ ]a, b[. Comme F est continue sur [a, c] (resp. [c, b]),
|F | y est également majorée. Enfin, par le théorème fondamental du calcul
différentiel et intégral et la continuité de l’intégrale indéfinie, on a
2 J c 3 J b
lim g(c) = lim g(a) + g $ = g(a) + g $,
c→b− c→b− a a

2 J c 3 J b
(resp. lim g(c) = lim g(b) + g $ = g(b) − g $ ),
c→a+ c→a+ b a

ce qui assure l’existence de la limite correspondante pour F g.


Le deuxième test s’appelle le test d’intégrabilité d’Abel.
Corollaire. Soit I = [a, b[ ou ]a, b], f une fonction de R dans K et g une
fonction de R dans R vérifiant les hypothèses (a), (b), (c) du test de du
Bois-Reymond. Si en outre
410 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES

d$ . g est monotone et bornée sur I,


alors f g est intégrable sur I.
Démonstration. Comme g est monotone sur I, g $ y est de signe constant
et la L-intégrabilité de g $ sur I équivaut à son intégrabilité. Celle-ci résulte
de la forme généralisée du théorème fondamental du calcul différentiel et
intégral puisque g, bornée et monotone sur I, possède une limite pour x
tendant vers b ou a selon que I = [a, b[ ou ]a, b]. Il suffit alors d’appliquer le
test de Du Bois-Reymond.
Exemple. Comme la fonction f définie par f (x) = x2 cos x12 est intégrable
sur ]0, 1] et la fonction g définie
D parE g(x) = ln(x + 1) est croissante et bornée
sur ]0, 1], la fonction x 2→ 2 ln(x+1)
x cos x12 est également intégrable sur ]0, 1].
Les deux derniers tests ne requièrent plus l’intégrabilité de f sur I. Le
premier s’appelle le test d’intégrabilité de Dedekind.
Corollaire. Soit I = [a, b[ (resp. ]a, b]), f , g des fonctions de R dans K
définies sur I et telles que les conditions suivantes soient vérifiées.
A. f g est intégrable sur [a, c] (resp. [c, b]) quel que soit c ∈ H]a, b[. H
B. f est primitivable sur I et son intégrale indéfinie F = a· f (resp. ·b f )
est bornée sur I.
C. g est dérivable sur I.
D. g $ est L-intégrable sur I.
E. limx→b− g(x) = 0 (resp. limx→a+ g(x) = 0).
Alors f g est intégrable sur I.
Démonstration. Elle résulte directement du lemme si l’on note que, par
les hypothèses B et E, on a

lim F (x)g(x) = 0 (resp. lim F (x)g(x) = 0).


x→b− x→a+

Le deuxième test s’appelle le test d’intégrabilité de Dirichlet.


Corollaire. Soit I = [a, b[ ou ]a, b], f une fonction de R dans K et g une
fonction de R dans R vérifiant les hypothèses A, B, C, E du test de Dedekind.
Si en outre
D $ . g est monotone sur I,
alors f g est intégrable sur I.
Démonstration. On montre, comme dans le test d’Abel, que les hy-
pothèses D $ et E entraı̂nent l’hypothèse D.
11.3. INTÉGRALE SUR UN INTERVALLE NON BORNÉ 411

Exemple. Pour tout α ∈ [0, 2[, la fonction h : x 2→ x−α cos x1 est intégrable
sur ]0, 1]. En effet, elle peut s’écrire h = f g avec
4 5$
1 1
f (x) = x−2 cos = − sin , g(x) = x2−α,
x x
qui vérifient les conditions du test de Dirichlet.

11.3 Intégrale sur un intervalle non borné


Soient a et b des nombres réels, I = [a, +∞[ (resp. ]a, +∞[, ] − ∞, b],
] − ∞, b[) un intervalle non borné. Soit f une fonction de R dans Rp définie
sur I. La condition nécessaire et suffisante d’intégrabilité sur un intervalle
borné donnée par le théorème de Hake et sa réciproque suggère la définition
suivante d’intégrabilité de f sur I.
Définition. On dit que f est intégrable sur I si f est intégrable sur I ∩ [a, b]
quel que soit b > a et si
J b
lim f
b→+∞ a
ou J b
lim f
a→−∞ a

existe selon que I est non majoré ou non H


minoré, auquel cas cette limite est
appelée l’intégrale de f sur I et notée I f ou, plus explicitement, pour les
quatre choix de I,
J J +∞ J J +∞
f ou f, f ou f,
[a,+∞[ a ]a,+∞[ a
J J b J J b
f ou f, f ou f,
]−∞,b] −∞ ]−∞,b[ −∞

ou encore par les variantes faisant intervenir f (x) dx.


On peut également définir la notion d’intégrale sur R =] − ∞, +∞[.
Définition. Soit f une application de R dans Rp. On dit que f est inté-
grable sur R s’il existe c ∈ R tel queHc
f soit Hintégrable sur ] − ∞, c] et sur
[c, +∞[, auquel cas l’élément de R −∞ f + c+∞ f est appelé l’intégrale de
p

f sur R et noté
J J +∞ J J +∞
f ou f ou f (x) dx ou f (x) dx.
R −∞ R −∞
412 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES

On vérifiera sans peine que si la condition de la définition ci-dessus est


satisfaite pour un élément c de R, elle le sera pour n’importe quel d ∈ R avec
la même valeur de l’intégrale. Il est également facile de montrer que f est
intégrable sur R si et seulement si f est intégrable sur [a, b] quels que soient
a < b dans R et si J b
lim f
(a,b)→(−∞,+∞) a

existe, auquel cas cette limite est l’intégrale de f sur R. On peut également
vérifier sans peine que si f est une fonction de R dans Rp définie sur [a, b] et
si l’on définit l’application f[a,b] de R dans Rp par f[a,b](x) = f (x) si x ∈ [a, b]
et f[a,b] (x) = 0 si x ∈ R \ [a, b], alors f est intégrable sur [a, b] si et seulement
si f[a,b] est intégrable sur R.
Définition. Soit I l’un des intervalles non bornés considérés dans les défi-
nitions précédentes et soit f une fonction de R dans Rp définie sur I. On
dit que f est intégrable au sens de Lebesgue ou L-intégrable ou absolument
intégrable sur I si f et |f |2 sont intégrables sur I.
Exemples. 1. Si a > 0, la fonction f : x 2→ x−c est L-intégrable sur
I = [a, +∞[ si et seulement si c > 1. En effet, f étant positive sur l’intervalle
considéré, elle y est L-intégrable si et seulement si elle y est intégrable. En
outre, f est primitivable sur I, une primitive étant donnée par F (x) =
(1 − c)−1 x1−c si c /= 1 et par F (x) = ln x si c = 1. Dès lors, si b > a, on a
J b b
f = (1 − c)−1 (b1−c − a1−c ) ou ln ,
a a
H
selon que c /= 1 ou c = 1, et par conséquent limb→+∞ ab f existe si et
seulement si 1 − c < 0. On énoncera et démontrera aisément le résultat
correspondant pour le cas de ] − ∞, a] lorsque a < 0.
2. Aucune fonction constante non nulle n’est intégrable sur ] − ∞, a] ou
[a, +∞[. De même, la fonction cos n’est H
pas intégrable sur ces intervalles
puisque, par exemple, la fonction b 2→ ab cos x dx = sin b − sin a n’a pas de
limite lorsque b → +∞.
3. La fonction f : x 2→ exp(−|x|) est L-intégrable sur R. En effet, f
positive et continue, et donc primitivable sur R, est L-intégrable sur [a, 0] et
sur [0, b] quels que soient a < 0 < b et l’on a
J 0 J 0 J b J b
f= exp x dx = 1 − exp a, f= exp(−x) dx = 1 − exp(−b),
a a 0 0
11.3. INTÉGRALE SUR UN INTERVALLE NON BORNÉ 413

ce qui entraı̂ne la L-intégrabilité de f sur ] − ∞, 0] et sur [0, +∞] avec


J 0 J +∞
exp(−|x|) dx = 1, exp(−|x|) dx = 1,
−∞ 0

et dès lors J
exp(−|x|) dx = 2.
R
Les propriétés élémentaires de l’intégrale et de la L-intégrale,
ainsi que les propriétés d’additivité et de restriction de ces intégrales
s’étendent immédiatement au cas d’un intervalle non borné. Il en est de
même, avec des démonstrations strictement analogues, pour l’extension
du théorème du calcul différentiel et intégral, de la formule d’inté-
gration par parties, du test de comparaison de L-intégrabilité, du
test de la limite et des tests de Du Bois-Reymond, Abel, Dedekind
et Dirichlet pour l’intégrabilité d’un produit.
Exemples. 1. Si c > 0, la fonction f définie sur ]0, +∞[ par f (x) =
xc−1 exp(−x) est continue (donc primitivable) et telle que

f (x) f (x)
lim = 1, lim = 0,
x→0+ xc−1 x→+∞ exp(−x/2)

puisque
2 3
f (x) x
lim = lim exp − + (c − 1) ln x =
x→+∞ exp(−x/2) x→+∞ 2
4 5 2 3
x ln x
lim exp − . 1 − 2(c − 1) = 0.
x→+∞ 2 x
Dès lors, par le test de la limite et l’intégrabilité de la fonction x 2→ xc−1 sur
]0, 1] et de la fonction x 2→ exp(− x2 ) sur [1, +∞[, on voit que l’intégrale
J +∞
xc−1 exp(−x) dx
0

existe pour chaque c > 0. Elle s’appelle l’intégrale d’Euler de deuxième


espèce et sa valeur est notée Γ(c). En intégrant par parties, on trouve
aisément, pour c > 1,
Γ(c) = (c − 1)Γ(c − 1),
et, comme Γ(1) = 1, on en déduit aussitôt que, pour chaque n ∈ N∗ , on a
Γ(n) = (n − 1)!.
414 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES

2. On appelle intégrales trigonométriques les intégrales de la forme


J +∞ J +∞
g(x) cos λx dx ou g(x) sin λx dx,
0 0

où λ > 0 et g est une fonction définie au moins sur ]0, +∞[. Si f désigne
l’une des fonctions cos(λ·) ou sin(λ·), alors f est continue sur R et
#J # J # #
# x # | sin λx| # x # |1 − cos λx|
#
# cos λt dt## = ≤ λ−1 , ## sin λt dt## = ≤ 2λ−1 .
0 λ 0 λ

Dès lors, en appliquant le test de Dirichlet, l’existence des intégrales trigono-


métriques sera assurée si l’on suppose que g est dérivable et décroissante sur
[0, +∞[, et telle que limx→+∞ g(x) = 0. Ce sera en particulier le cas pour
les intégrales
J +∞ J +∞
cos λx sin λx
p
dx et dx,
0 x 0 xp
lorsque 0 < p < 1, et pour l’intégrale
J +∞ sin λx
dx.
0 x

En effet, le test de Dirichlet s’applique à l’intégrale de ces fonctions sur


[c, +∞[ lorsque c > 0 et, sur ]0, c],
# #
# cos λx # −p
# #
# xp # ≤ x ,

et, comme on l’a vu au paragraphe précédent, le second membre est intégra-


ble sur ]0, c], tandis que la fonction x 2→ sinxpλx , qui peut être prolongée
continûment en 0 en lui donnant la valeur 0 si p < 1 et λ si p = 1, est
alors R-intégrable sur [0, c]. Lorsque p = 1/2, ces intégrales portent le nom
d’intégrales de Fresnel et elles jouent un rôle important en optique. Notons

que la substitution y = x transforme, pour chaque a < b strictement
positifs,
J b J b
sin λx cos λx
√ dx et √ dx
a x a x
respectivement en
J b2 J b2
2 sin λy 2 dy et 2 cos λy 2 dy,
a2 a2
11.3. INTÉGRALE SUR UN INTERVALLE NON BORNÉ 415

et dès lors, en faisant tendre a vers 0 et b vers +∞ et en utilisant les


définitions, on trouve
J J
+∞ sin λx +∞
√ dx = 2 sin λy 2 dy
0 x 0

et
J J
+∞ cos λx +∞
√ dx = 2 cos λy 2 dy.
0 x 0

On notera finalement qu’un raisonnement analogue à celui utilisé dans l’e-


xemple de fonction intégrable et non L-intégrable sur un intervalle borné
montre que chaque intégrand des intégrales trigonométriques ci-dessus est
intégrable sur ]0, +∞[ sans y être L-intégrable.
Remarque. Le lecteur peut s’être posé la question de savoir si l’intégrabilité
d’une fonction f sur un intervalle non borné pouvait être définie en termes de
sommes de Riemann. La réponse est positive et, pour [a, +∞[ par exemple,
la définition est la suivante.

Définition. Soit f une fonction de R dans Rp définie sur I = [a, +∞[. On


dit que f est intégrable sur I s’il existe J ∈ Rp ayant la propriété suivante:
pour chaque ! > 0, il existe une jauge δ sur I et il existe B > a tels que,
pour chaque b ≥ B et chaque P-partition δ-fine Π de ]a, b], on ait

|S(]a, b], f, Π) − J|2 ≤ !.

On peut alors démontrer, à partir de cette définition, l’analogue du


théorème de Hake sur [a, +∞[ et montrer ainsi que cette définition est
équivalente à celle que nous avons adoptée ici pour court-circuiter cette
démonstration. Le cas de I = ] − ∞, b] est évidemment analogue et celui
des intervalles ouverts se traite par la technique de prolongement. Enfin,
la définition d’intégrabilité sur R en termes de sommes de Riemann est la
suivante.

Définition. Soit f une fonction de R dans Rp définie sur R. On dit que


f est intégrable sur R s’il existe J ∈ Rp ayant la propriété suivante : pour
chaque ! > 0, il existe une jauge δ sur I et il existe ρ > 0 tels que, pour
chaque a ≤ −ρ, chaque b ≥ ρ et chaque P-partition δ-fine Π de ]a, b], on ait

|S(]a, b], f, Π) − J|2 ≤ !.


416 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES

11.4 Tests de convergence des séries


Montrons tout d’abord que l’étude de la convergence d’une série dans Rp
équivaut à l’étude de l’intégrabilité sur [0, +∞[ d’une certaine fonction de R
dans Rp construite à partir des termes de la série.
%
Soit k∈N ak une série dans Rp . Associons à la suite (ak )k∈N de ses
termes l’application
a[·] : R+ → Rp , x 2→ a[x],
où [x] désigne le plus grand entier inférieur ou égal à x. C’est donc l’applica-
tion définie pour chaque x ∈ R+ par a[x] = ak si x ∈ [k, k + 1[, (k ∈ N).
Proposition. Pour chaque b ≥ 1, la fonction a[·] est intégrable sur [0, b] et
l’on a
J b [b]−1
$
a[x] dx = ak + (b − [b])a[b].
0 k=0

Démonstration. En vertu de l’additivité de l’intégrale, il suffit de montrer


que a[.] est intégrable sur [0, 1], [1, 2], . . ., [[b]−1, [b]] et sur [[b], b] (si ce dernier
intervalle n’est pas réduit à un point) et que
J k+1 J b
a[x] dx = ak , (0 ≤ k ≤ [b] − 1), a[x] dx = (b − [b])a[b].
k [b]

C’est évident pour la dernière intégrale puisque a[·] a sur [[b], b] la valeur
constante a[b] . Pour l’intervalle [k, k + 1], la fonction a[·] a, sur [k, k + 1[ la
valeur constante ak et dès lors
J c
a[x] dx = (c − k)ak ,
k

pour tout c ∈ ]k, k + 1[, ce qui entraı̂ne que


J c
lim a[x] dx = ak .
c→(k+1)− k

L’intégrabilité de a[·] sur [k, k + 1] et la valeur de l’intégrale correspondante


résultent alors du théorème de Hake.
Remarque. On notera que a[·] , bornée sur chaque sous-intervalle borné de
[0, +∞[, y est en fait L-intégrable.
Nous pouvons maintenant démontrer les deux résultats fondamentaux
ramenant la convergence d’une série à l’intégrabilité de la fonction associée.
11.4. TESTS DE CONVERGENCE DES SÉRIES 417

%
Proposition. La série k∈N ak converge si et seulement si la fonction as-
sociée a[·] est intégrable sur [0, +∞[, auquel cas l’on a

$ J ∞
ak = a[x] dx.
k=0 0

Démonstration. Condition nécessaire. Soit A la somme de la série con-


%
vergente k∈N ak . Par la proposition précédente, il suffit de montrer que
H %
limb→+∞ 0b a[x] dx = A. Si Aq = qk=0 ak , (q ∈ N), on a, pour chaque b ≥ 1,
#J #
# b #
# #
# a[x] dx − A# = |A[b]−1 − A + (b − [b])a[b]|2 ≤ |A[b]−1 − A|2 + |a[b]|2 ,
# 0 #
2

puisque 0 ≤ b − [b] < 1. Si ! > 0 est donné, il existe m ∈ N tel que

|A − Ak |2 ≤ !/2, |ak |2 ≤ !/2,

pour chaque k ≥ m, et dès lors, si b ≥ m + 1, on aura [b] − 1 ≥ m et


#J #
# b #
# #
# a[x] − A# ≤ !/2 + !/2 = !.
# 0 #
2
Hb
Condition suffisante. Puisque limb→+∞ 0 a[x] dx existe,
J b
lim a[x] dx
b→+∞,b∈N 0

existe aussi, avec la même valeur, et comme, pour tout q ∈ N, on a


J q+1
Aq = a[x] dx,
0

on voit que
J b
lim Aq = lim a[x] dx,
q→∞ b→+∞ 0

et la démonstration est complète.


%
Proposition. La série k∈N ak converge absolument si et seulement si la
fonction associée a[·] est L-intégrable sur [0, +∞[.
Démonstration. On vérifie immédiatement que |a[·]|2 est la fonction as-
%
sociée à la série k∈N |ak |2 . La thèse résulte alors de la proposition précé-
dente appliquée à a[·] et à |a[·] |2 .
418 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES

Il est maintenant facile de traduire dans le langage des séries, via les
propositions précédentes et la fonction associée, un certain nombre de résul-
tats d’intégrabilité obtenus dans la section précédente. Le premier fournit
un test de comparaison pour la convergence absolue d’une série.
% %
Proposition. Si la série k∈N ak dans Rp et la série k∈N bk dans R+ sont
telles que, pour un certain entier q ≥ 0 et chaque entier k ≥ q, on ait
|ak |2 ≤ bk ,
% %
et si la série k∈N bk converge, alors la série k∈N ak converge absolument.
Le deuxième est le test de la limite pour la convergence des séries
à termes positifs.
% %
Corollaire. Soit k∈N ak et k∈N bk deux séries réelles pour lesquelles il
existe un entier q ≥ 1 tel que ak ≥ 0 et bk > 0 si k ≥ q. Supposons en outre
que limk→+∞ abkk existe au sens large, et notons la d.
% %
1. Si d = 0 et si k∈N bk converge, alors k∈N ak converge.
% %
2. Si d > 0 est fini, k∈N ak et k∈N bk convergent et divergent simul-
tanément.
% %
3. Si d = +∞ et si k∈N ak converge, alors k∈N bk converge.
Le test de comparaison permet de démontrer le test intégral de Mac-
laurin-Cauchy pour la convergence de séries positives dont les termes sont
donnés par la restriction à N d’une fonction positive et décroissante sur
[0, +∞[.
Proposition. Soit f une fonction réelle définie, positive et décroissante sur
%
[0, +∞[. Alors la série k∈N f (k) converge si et seulement si f est intégrable
sur [0, +∞[.
Démonstration. Notons tout d’abord que f , décroissante sur [0, +∞[,
est R-intégrable sur [0, b] quel que soit b > 0, et dès lors
H
l’intégrabilité de f
sur [0, +∞[ équivaut à l’existence de la limite limb→+∞ 0b f. Par ailleurs, les
% %
séries k∈N f (k) et k∈N f (k + 1) convergent et divergent simultanément.
%
Soit fˆ : x 2→ f ([x]) la fonction associée à la série k∈N f (k) et fˇ : x 2→
%
f ([x] + 1) la fonction associée à la série k∈N f (k + 1). Par la décroissance
de f , on a évidemment
0 ≤ fˇ(x) = f ([x] + 1) ≤ f (x) ≤ f ([x]) = fˆ(x),
pour tout x ∈ [0, +∞[, et le test de comparaison montre alors que f, fˆ et
%
fˇ sont simultanément intégrables sur [0, +∞[. En conséquence, k∈N f (k)
converge si et seulement si f est intégrable sur [0, +∞[.
11.4. TESTS DE CONVERGENCE DES SÉRIES 419

Remarques. 1. L’inégalité entre f, fˆ et fˇ montre que



$ J +∞ ∞
$
f (k) ≤ f≤ f (k),
k=1 0 k=0

dès que l’un des trois termes existe.


%
2. La convergence de k∈N∗ f (k) équivaut évidemment à l’intégrabilité
de f sur [1, +∞[.
%
Exemples. 1. La série de Riemann k∈N∗ k−c , où c ≥ 0, converge si c > 1
et diverge si c ∈ [0, 1]. En effet, les termes de cette série sont les valeurs
de la restriction à N∗ de la fonction f définie sur [1, +∞[ par f (x) = x−c ,
qui est positive et décroissante sur cet intervalle. On a vu au paragraphe
précédent que cette fonction était intégrable sur [1, +∞[ si et seulement si
c > 1. On en déduit en particulier une nouvelle preuve de la divergence de
%
la série harmonique k∈N∗ k1 . Cette série “diverge très lentement”, puisque
l’inégalité, déduite des considérations qui précèdent,
q J
$ 1 q dx
≥ = ln q,
k=1
k 1 x

montre qu’il faudra plus de exp 10 = 22.026 termes pour que les sommes
partielles dépassent 10 ! La différence
q
$ 1
− ln q
k=1
k
Hq
entre la q e somme partielle de la série harmonique et ln q = dx
1 x est égale,
puisque
$q $q
k
ln q = [ln k − ln(k − 1)] = ln ,
k=2 k=2
k−1

q 4 5
$ 1 k
1+ − ln .
k=2
k k−1
D’autre part, en utilisant l’expression de Lagrange du reste du développe-
ment de Taylor, il existera, pour chaque entier k ≥ 2, un θk ∈ ]0, 1[ tel
que
 
4 5 4 54 5
k 1 1 1 1  1 
− ln = ln 1 − = ln 1 − − 8 9 .
k−1 k k 2 k 2 θk 2
1− k
420 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES

Par conséquent,
 
q q 4 54 5
$ 1 1$ 1  1 
− ln q = 1 + 8 9 .
k=1
k k=2
2 k 2
1− kθk 2

Comme
1
2
lim k
4 5 = 2,
k→∞
( 12 )( k12 ) 1
θ
(1− kk )2
%
le test de la limite et la convergence de la série de Riemann k∈N∗ k12 entraı̂ne
%
la convergence de la série 1+ k≥2 ( k1 −ln k−1k
), et donc l’existence de la limite
, q
-
$ 1
lim − ln q .
q→∞
k=1
k

Cette limite est appelée la constante d’Euler, désignée par C et joue un


grand rôle dans différentes questions d’analyse et de théorie analytique des
nombres. Sa valeur approximative est

C = 0, 577215664901532860606512090082....

On ignore toujours si la constante d’Euler est un nombre rationnel ou un


nombre irrationnel, un nombre algébrique ou un nombre transcendant. Pour
s > 1, la somme de la série de Riemann, que l’on désigne par ζ(s), peut se
calculer, par des moyens qui sortent du cadre de ce chapitre, lorsque s est
2 4 π6
pair. Ainsi, ζ(2) = π6 , ζ(4) = π90 , ζ(6) = 945 . Plus généralement, Leonard
Euler a montré que, pour chaque entier positif k, ζ(2k) = ak π 2k pour un
certain nombre rationnel ak . On peut en déduire que ζ(2k) est toujours
irrationnel, et même transcendant. Par contre on ignore si ζ(2k + 1) est
ou non irrationnel lorsque k ≥ 2. Ce n’est qu’en 1978 que Roger Apery a
démontré que ζ(3) était irrationnel.
%
2. La série d’Abel k≥2 k ln 1
k est telle que

1
lim k
1 = +∞
k→∞
k ln k

tandis que, pour chaque c > 1,


1
kc
lim 1 = 0.
k→∞
k ln k
11.5. TESTS DE LA RACINE ET DU QUOTIENT 421

Le test de la limite combiné aux résultats sur la convergence de la série de


Riemann ne permettent donc pas de décider de sa convergence. Mais, pour
tout x ≥ 2, on a
J x J ln x
dy dt
= = ln(ln x) − ln(ln 2),
2 y ln y ln 2 t

et la fonction décroissante x 2→ x ln
1
x n’est pas intégrable sur [2, +∞[. Le
test de Maclaurin-Cauchy montre aussitôt que la série d’Abel est divergente.
%
Par contre, le même test montre que, pour tout a > 1, la série k≥2 k(ln1k)a
est convergente.

11.5 Tests de la racine et du quotient


Des combinaisons judicieuses du test de comparaison et des résultats sur la
convergence de la série géométrique fournissent d’utiles tests de convergence
absolue. Le premier s’appelle le test de la racine de Cauchy.
%
Proposition. Soit k∈N ak une série dans Rp . Posons L = +∞ si la suite
1/k
(|ak |2 )k∈N n’est pas majorée et
& '
1/k
L = lim sup |ak |2 ,
q→∞ {k∈N:k≥q}

sinon.
%
1. Si L < 1, la série k∈N ak converge absolument.
%
2. Si L > 1, la série k∈N ak diverge.
%
3. Si L = 1, on ne peut pas conclure, c’est-à-dire la série k∈N ak peut
converger ou diverger.

8 Démonstration. 9Notons tout d’abord que, si elle est définie, la suite


1/k
sup{k∈N:k≥q} |ak |2 est décroissante et positive, et sa limite L existe
q∈N
bien. Si l’hypothèse 1 est satisfaite, choisissons ! > 0 tel que L + ! < 1 (par
exemple ! = 1−L2 ). Il existera dès lors un m ∈ N tel que

1/k
L−! ≤ sup |ak |2 ≤ L + !,
{k∈N:k≥q}

1/k
pour tout q ≥ m, et dès lors, pour tout k ≥ m, on aura |ak |2 ≤ L + !,
%
c’est-à-dire |ak |2 ≤ (L + !)k . Comme la série géométrique k∈N (L + !)k est
convergente, la thèse résulte du test de comparaison.
422 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES

Supposons maintenant que L > 1 et considérons le cas où L est fini (on
procède de même pour L = +∞). La décroissance de la suite
& '
1/k
sup |ak |2
{k∈N:k≥q} q∈N
entraı̂ne que, pour tout q ∈ N, on a
1/k
sup |ak |2 ≥ L > 1.
{k∈N:k≥q}

Choisissons ! > 0 tel que L−! > 1 (par exemple ! = L−1 2 ). La caractérisation
du supremum appliquée à l’inégalité ci-dessus entraı̂ne alors l’existence, pour
chaque q ∈ N, d’un entier kq ≥ q tel que
1/kq 1/k
|akq |2 ≥ sup |ak |2 − ! ≥ L − ! > 1,
{k∈N:k≥q}

et donc tel que |akq |2 > 1. Par conséquent, la suite (ak )k∈N des termes de
%
la série ne tend pas vers zéro et la série k∈N ak diverge. Enfin, la série de
%
Riemann k∈N∗ k1c , avec c > 0 est telle que (k−c )1/k = [k1/k ]−c . Par ailleurs,
l’étude élémentaire du comportement de la fonction x 2→ x1/x montre que
cette fonction décroı̂t pour x ≥ e et tend vers 1 lorsque x tend vers l’infini
(calculer la dérivée et utiliser la règle de l’Hospital). En conséquence, la
suite ([k1/k ]−c )k≥3 est croissante et a pour limite 1, ce qui entraı̂ne, puisque
sup ([k1/k ]−c ) = 1,
{k∈N:k≥q}

dès que q ≥ 3, que L = 1. Or la série de Riemann diverge pour c ≤ 1 et


converge pour c > 1.
Le résultat qui suit simplifie fortement, lorsqu’il s’applique, le calcul de
L.
Proposition. Avec les notations du test de la racine de Cauchy, si
1/k
limk→∞ |ak |2 existe, alors L est égal à cette limite.
1/k
Démonstration. Soit a = limk→∞ |ak |2 et soit ! > 0. Il existe donc
m ∈ N tel que, pour tout entier k ≥ m, on ait
1/k
a − ! ≤ |ak |2 ≤ a + !,
et dès lors, pour tout q ≥ m, on a
1/q 1/k
a − ! ≤ |aq |2 ≤ sup |ak |2 ≤ a + !,
{k∈N:k≥q}

ce qui implique L = a.
11.5. TESTS DE LA RACINE ET DU QUOTIENT 423

Le deuxième test s’appelle le test du quotient de d’Alembert.


%
Proposition. Soit k∈N ak une série dans Rp telle que ak /= 0 pour tout
|a |2
k ∈ N. Si la suite ( |ak+1
k |2
)k∈N n’est pas majorée, posons Q2 = +∞. Sinon,
posons & '
|ak+1 |2
Q2 = lim sup ,
q→∞ {k∈N:k≥q} |ak |2
& '
|ak+1 |2
Q1 = lim inf .
q→∞ {k∈N:k≥q} |ak |2
%
1. Si Q2 < 1, la série k∈N ak converge absolument.
%
2. si Q1 > 1, la série k∈N ak diverge.
%
3. Si Q1 ≤ 1 ≤ Q2 , le test ne peut conclure, c’est-à-dire la série k∈N ak
peut converger ou diverger.
Démonstration. Notons tout d’abord que, lorsqu’elle est définie, la suite
& '
|ak+1 |2
sup
{k∈N:k≥q} |ak |2 q∈N

est décroissante et positive, donc convergente, et chacun de ses termes majore


le terme correspondant de la suite croissante et positive
& '
|ak+1 |2
inf ,
{k∈N:k≥q} |ak |2
q∈N

qui convergera donc également. En conséquence, Q2 et Q1 existent et Q1 ≤


Q2 . Dans le cas de l’hypothèse 1, soit ! > 0 tel que Q2 + ! < 1. Il existera
un entier naturel m tel que
|ak+1 |2
sup ≤ Q2 + !,
{k∈N:k≥q} |ak |2

pour tout q ≥ m et donc tel que

|ak+1 |2 (Q2 + !)k+1


≤ Q2 + ! = ,
|ak |2 (Q2 + !)k
pour tout k ≥ m. Pour ces mêmes k, on a donc
|ak+1 |2 |ak |2
≤ ,
(Q2 + !) k+1 (Q2 + !)k
424 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES
8 9
|ak |2
et la suite (Q2+!)k
est donc décroissante. Par conséquent, pour tout
k≥m
k ≥ m, on a
|ak |2 ≤ Cm (Q2 + !)k ,
%
avec Cm = (Q|a2m |2
+!)m . Comme la série géométrique k∈N (Q2 + !) converge,
k

le test de comparaison et l’inégalité ci-dessus entraı̂nent aussitôt la conver-


%
gence absolue de k∈N ak . Si Q1 > 1, (et nous nous contenterons de traiter
explicitement le cas où Q1 est fini, l’autre étant semblable), il existe ! > 0
tel que Q1 − ! > 1. Pour cet !, il existe un entier naturel m tel que
|ak+1 |2
Q1 − ! ≤ inf ≤ Q1 + !,
{k∈N:k≥q} |ak |2

si q ≥ m, et donc tel que, pour tout k ≥ m,


|ak+1 |2
1< .
|ak |2

En conséquence, on a, pour tout k ≥ m, |ak+1 |2 ≥ |ak |2 ≥ |am |2 > 0,


et la suite (ak )k∈N ne tend pas vers zéro, ce qui entraı̂ne la divergence de
%
k∈N ak . Enfin, on montre aisément que la série de Riemann fournit, quel
que soit c > 0, les valeurs Q1 = Q2 = 1 et l’on sait qu’elle diverge pour c ≤ 1
et converge pour c > 1.
Le résultat suivant facilite, lorsqu’il s’applique, le calcul des expressions
Q1 et Q2 . Sa démonstration, semblable au résultat analogue pour le critère
de Cauchy, est laissée au lecteur.
Proposition. Avec les notations du test du quotient de d’Alembert, si
|a |2
limk→∞ |ak+1k |2
existe, alors Q1 = Q2 et leur valeur commune est égale à
cette limite.
Remarque. Le test du quotient est en général plus facile à appliquer que le
test de la racine, car il est en général plus facile de calculer des quotients que
des racines. Cependant, le test de la racine est plus général que le test du
quotient dans le sens suivant : si le test du quotient entraı̂ne la convergence
ou la divergence, il en est de même du test de la racine; si le test de la racine
ne peut conclure, il en est du même du test du quotient. Ce fait résulte des
inégalités ci-dessous, dont le lecteur vérifiera aisément la validité pour toute
suite strictement positive (ck )k∈N :
4 5 4 5
ck+1 1/k
lim inf ≤ lim inf ck ,
q→∞ k≥q ck q→∞ k≥q
11.6. SÉRIES POTENTIELLES 425
& ' & '
1/k ck+1
lim sup ck ≤ lim sup .
q→∞ k≥q q→∞ k≥q ck

11.6 Séries potentielles


Une application importante des tests de la racine et du quotient est fournie
par l’étude des séries potentielles, qui constituent la généralisation naturelle
des polynômes sur C.
Définition. Etant donnés une suite (ck )k∈N dans C et deux nombres com-
plexes a et z, on appelle série potentielle ou série de puissances ou série
%
entière une série de la forme k∈N ck (z − a)k .
%
Les sommes partielles de la série potentielle k∈N ck (z − a)k sont les
%
polynômes qk=0 ck (z − a)k . Ces expressions ont un sens quel que soit z ∈
%
C. L’exemple de la série géométrique k∈N z k de raison z ∈ C qui ne
converge que pour |z| < 1 montre que la somme d’une série potentielle n’est
pas nécessairement définie pour tout z ∈ C. On a dans cette direction
l’important théorème de convergence d’une série potentielle.
%
Théorème. Considérons la série potentielle k∈N ck (z − a)k . Si la suite
(|ck |1/k )k∈N n’est pas majorée, posons C = +∞. Sinon, posons
& '
C = lim sup |ck | 1/k
.
q→∞ {k∈N:k≥q}

%
1. Si C > 0 est fini, et si l’on pose R = 1/C, la série k∈N ck (z −a)k converge
absolument si |z − a| < R et diverge si |z − a| > R.
%
2. Si C = 0, la série k∈N ck (z − a)k converge absolument pour tout z ∈ C.
%
3. si C = +∞, la série k∈N ck (z − a)k converge absolument pour z = a et
diverge pour tout z /= a.
Démonstration. Appliquons le test de la racine de Cauchy à la série
$
ck (z − a)k .
k∈N

Comme |ck (z − a)k | = |ck ||z − a|k pour chaque k ∈ N, on a


# #1/k
# #
#ck (z − a)k # = |ck |1/k |z − a|,
426 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES
8 9
et, pour z /= a, la suite |ck (z − a)k |1/k est majorée si et seulement si
k∈N∗
la suite (|ck | 1/k
)k∈N∗ l’est. Dans ce cas, on a, pour chaque q ∈ N,
# #1/k
# #
sup #ck (z − a)k # = sup |ck |1/k |z − a|
{k∈N:k≥q} {k∈N:k≥q}

= |z − a| sup |ck |1/k ,


{k∈N:k≥q}

et dès lors L = |z − a|C. Dès lors, si C > 0 est fini, L < 1 si et seulement si
|z − a| < 1/C = R et L > 1 si et seulement si |z − a| > 1/C = R, et la thèse
résulte du critère de la racine de Cauchy. Si C = 0, L = 0 quel que soit z ∈ C
et le critère de la racine de Cauchy permet encore de conclure. Si C = +∞,
alors, pour chaque z /= a, L = +∞ et la série diverge. Sa convergence pour
z = a est triviale puisque ses termes sont nuls dès que k ≥ 1.
Lorsque C > 0 est fini, le nombre R = 1/C s’appelle le rayon de con-
%
vergence de la série k∈N ck (z − a)k et le disque ouvert de centre a et de
rayon R s’appelle son disque de convergence. Lorsque limk→∞ |ck |1/k existe
et est strictement positive, les résultats de la section précédente entraı̂nent
évidemment que le rayon de convergence est égal à l’inverse de cette limite.
En utilisant un cas particulier du critère du quotient de d’Alembert, on
peut obtenir un théorème de convergence moins général, mais souvent plus
facile à appliquer que le précédent.
%
Proposition. Soit k∈N ck (z − a)k une série potentielle telle que ck /= 0
|c |
pour chaque k ∈ N. Si la limite limk→∞ |ck+1 k|
existe et est strictement
positive, elle est égale à l’inverse du rayon de convergence de la série. Si elle
est nulle, la série converge absolument pour tout z ∈ C. Si elle est égale à
+∞, la série diverge pour tout z /= a.
Démonstration. Etudions la convergence absolue de la série
$
ck (z − a)k
k∈N

par le test du quotient de d’Alembert. On a


|ck+1 ||z − a|k+1 |ck+1 |
= |z − a| ,
|ck ||z − a|k |ck |
et dès lors
|ck+1 ||z − a|k+1
lim = |z − a|r,
k→∞ |ck ||z − a|k
11.6. SÉRIES POTENTIELLES 427

|c |
si r = limk→∞ |ck+1
k|
. La thèse se déduit alors du cas particulier du test de
d’Alembert où Q1 = Q2 .
Exemples. 1. Rappelons que si z ∈ C, la série exponentielle de z est la
% k
série potentielle k∈N zk! . Puisque
1
(k+1)! 1
lim = lim = 0,
k→∞ 1
k!
k→∞ k+1

la proposition précédente montre que cette série converge absolument pour


tout z ∈ C. On montre de même que les séries potentielles
$ z 2k $ z 2k+1
(−1)k et (−1)k
k∈N
(2k)! k∈N
(2k + 1)!

convergent pour chaque z ∈ C. On les appelle respectivement la série poten-


tielle cosinus de z et la série potentielle sinus de z et leurs sommes respectives
sont désignées par cos z et sin z.
%
2. La série potentielle k∈N∗ kk z k est telle que
8 91/k
lim kk = lim k = +∞,
k→∞ k→∞

et dès lors elle converge pour z = 0 et diverge pour z /= 0.


% k
3. La série potentielle k∈N∗ zkc où c ∈ R est telle que
1 4 5c
(k+1)c k
lim = lim = 1,
k→∞ 1
kc
k→∞ k+1

et dès lors elle converge absolument pour |z| < 1 et diverge pour |z| > 1. Le
théorème fondamental de convergence d’une série entière ne fournit aucune
information sur sa convergence lorsque |z| = 1 et il faut étudier chaque
série cas
# k #par cas. Si nous remarquons que, pour |z| = 1 et chaque k ∈ N ,

#z #
on a # kc # = kc , le test de comparaison et la convergence de la série de
1

Riemann pour c > 1 entraı̂nent dans ce cas la convergence absolue de la


% k
série potentielle k∈N∗ zkc pour chaque z tel que |z| = 1. Lorsque c ∈ ]0, 1],
et z = 1, la série potentielle se réduit à la série de Riemann divergente
%
k∈N∗ kc , et l’on montrera plus loin qu’elle converge pour les autres valeurs
1

#dek #z telles que |z| = 1. Enfin, si c ≤ 0, on a, pour |z| = 1 et k ∈ N ,



#z #
# kc # = k |c| et la série diverge puisque la suite de ses termes ne tend pas vers
zéro. On voit donc qu’une série potentielle peut converger en tous les points
428 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES

tels que |z − a| soit égal au rayon de convergence, diverger en tous ces points,
ou encore converger en certains de ces points et diverger en d’autres. Nous
reviendrons sur cette question dans la section suivante.
On peut associer à une série potentielle une famille d’autres séries po-
tentielles ayant le même rayon de convergence.
%
Définition. On appelle série dérivée de la série potentielle k∈N ck (z − a)
k

la série potentielle
$ $
kck (z − a)k−1 = (k + 1)ck+1 (z − a)k ,
k∈N∗ k∈N

dont chaque terme est la valeur en z de la C-dérivée par rapport à z du


terme correspondant de la série originelle.
%
Ainsi, la série dérivée de la série géométrique k∈N z
k est la série
$ $
kz k−1 = (k + 1)z k .
k∈N∗ k∈N
% zk
La série dérivée de la série exponentielle de z k∈N k! est la série
$ z k−1 $ zk $ zk
k = (k + 1) = ,
k∈N∗
k! k∈N
(k + 1)! k∈N k!

c’est-à-dire la série exponentielle de z elle-même. La série dérivée de la série


cosinus de z est égale à moins la série sinus de z et la série dérivée de la série
sinus de z est égale à la série cosinus de z.
Proposition. Une série potentielle et sa série dérivée ont le même rayon de
convergence.
Démonstration. Notons tout d’abord que, pour z /= a, les termes de
% %
la série dérivée k∈N∗ kck (z − a)k−1 et ceux de la série k∈N∗ kck (z − a)k
ne diffèrent que par un facteur constant z − a et les deux séries convergent
ou divergent donc simultanément. Pour étudier la convergence de la série
%
k∈N∗ kck (z − a) , il faut étudier les quantités supk≥q (k|ck |)
k 1/k pour q ≥ 1.

On a vu précédemment que la fonction x 2→ x1/x décroı̂t monotonément vers


1 dès que x ≥ e. En conséquence, on aura, pour tout k ≥ q ≥ 3,
|ck |1/k ≤ (k|ck |)1/k = k1/k |ck |1/k ≤ q 1/q |ck |1/k ,
et dès lors
sup |ck |1/k ≤ sup (k|ck |)1/k ≤ sup q 1/q |ck |1/k = q 1/q sup |ck |1/k .
k≥q≥3 k≥q≥3 k≥q≥3 k≥q≥3
11.7. SÉRIES TRIGONOMÉTRIQUES 429

On en déduit aussitôt que les suites correspondantes sont simultanément


majorées, et que, s’il en est ainsi,
& ' , -
C = lim sup |ck | 1/k
≤ lim sup (k|ck |) 1/k
= C$
q→∞ k≥q≥3 q→∞ k≥q≥3
& ' & '
≤ lim q 1/q
sup |ck | 1/k
= lim q 1/q
. lim sup |ck | 1/k
q→∞ k≥q≥3 q→∞ q→∞ k≥q
& '
= lim sup |ck |1/k = C,
q→∞ k≥q

et dès lors C = C $ .
On peut évidemment itérer le processus de passage à la série dérivée et
considérer la série dérivée de la série dérivée
$ $
(k − 1)kck (z − a)k−2 = (k + 1)(k + 2)ck+2 (z − a)k ,
k≥2 k∈N

que l’on appellera la série dérivée seconde de la série potentielle


$
ck (z − a)k .
k∈N

En continuant de la sorte, on définira, pour chaque entier m ≥ 1, la série


%
dérivée me de k∈N ck (z − a)k comme étant la série
$
(k − m + 1) . . . (k − 1)kck (z − a)k−m
k≥m
$
= (k + 1)(k + 2) . . .(k + m)ck+m (z − a)k .
k∈N
Toutes ces séries dérivées ont évidemment le même rayon de convergence
%
que la série k∈N ck (z − a)k .

11.7 Séries trigonométriques


%
Soit k∈N ck (z −a)k une série potentielle et R > 0 son rayon de convergence.
Les points z tels que |z − a| = R, peuvent s’écrire z = a + R exp it, t ∈ R, et,
%
en ces points, la série potentielle prend la forme k∈N ck Rk exp ikt, avec
& ' & '
lim sup (|ck |R ) k 1/k
= R lim sup |ck | 1/k
= 1.
q→∞ k≥q≥1 q→∞ k≥q≥1
430 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES

%
Il s’agit d’un cas particulier de séries de la forme k∈N dk exp ikt où t ∈ R
et (dk )k∈N est une suite de nombres complexes. Ces séries s’appellent des
%
séries trigonométriques et elles sont du type k∈N ak bk avec bk = dk et
ak = exp ikt. Pour de tels ak , on a pour chaque q ∈ N,
q
$ 1 − exp[i(q + 1)t]
Aq = exp ikt = si t /= 2πm, m ∈ Z
k=0
1 − exp it

et Aq = q + 1 si t = 2πm, m ∈ Z. En conséquence, pour chaque t /=


2πm, m ∈ Z et chaque q ∈ N, on a |Aq | ≤ |1−exp 2
. Nous allons voir qu’il
% it|
est possible d’obtenir pour les séries de type k∈N ak bk pour lesquelles la
suite (|Aq |)q∈N est majorée d’intéressants résultats de convergence qui sont
l’analogue de tests d’intégrabilité obtenus précédemment pour des produits
de fonctions. Ces résultats reposent sur la proposition suivante, appelée le
lemme d’Abel.
Lemme. Soient (ak )k∈N et (bk )k∈N deux suites dans K vérifiant les condi-
tions suivantes.
%q
1. La suite (Aq )q∈N des sommes partielles Aq = k=0 ak est bornée.
%
2. La série k∈N(bk − bk+1 ) converge absolument.
%
Alors la série k∈N ak bk converge si et seulement si limq→∞ Aq bq existe.
Démonstration. La démonstration utilise la transformation d’Abel qui
est l’analogue, pour les séries, de l’intégration par parties :
q
$ q
$ q
$ q−1
$
ak bk = a0 b0 + (Ak − Ak−1 )bk = A0 b0 + Ak bk − Ak bk+1
k=0 k=1 k=1 k=0

q−1
$
= Aq bq + Ak (bk − bk+1 ) (q ∈ N).
k=0
Si M > 0 est tel que |Ak | ≤ M pour chaque k ∈ N, alors

|Ak (bk − bk+1 )| ≤ M |bk − bk+1 |


%
pour chaque k ∈ N et, comme la série k∈N M |bk − bk+1 | converge par
l’hypothèse 2, le test de comparaison entraı̂ne la convergence absolue de la
%
série k∈N Ak (bk − bk+1 ). La thèse résulte alors facilement de la formule
d’Abel.
On déduit de ce lemme des tests de convergence utiles. Les deux premiers
%
requièrent la convergence de k∈N ak . On a d’abord le test de convergence
de Du Bois-Reymond.
11.7. SÉRIES TRIGONOMÉTRIQUES 431

Corollaire. Soit (ak )k∈N et (bk )k∈N deux suites dans K vérifiant les condi-
tions suivantes.
%
a. La série k∈N ak converge.
%
b. La série k∈N (bk − bk+1 ) converge absolument.
%
Alors la série k∈N ak bk converge.
Démonstration. Par l’hypothèse a, la suite des sommes partielles
(Aq )q∈N est convergente, et donc bornée. Les sommes partielles de la série
%
k∈N (bk − bk+1 ) sont données par

q
$ q
$ q+1
$
(bk − bk+1 ) = bk − bk = b0 − bq+1 .
k=0 k=0 k=1

Par l’hypothèse b, la suite (b0 − bq+1 )q∈N converge, et il en est donc de même
de (Aq bq )q∈N. Le lemme d’Abel permet de conclure.
Le deuxième résultat s’appelle le test de convergence d’Abel.
Corollaire. Soit (ak )k∈N une suite dans K et (bk )k∈N une suite dans R
vérifiant les conditions suivantes.
%
a. La série k∈N ak converge.
b$ . La suite (bk )k∈N est monotone et convergente.
%
Alors la série k∈N ak bk converge.
Démonstration. Comme (bk )k∈N est monotone, les expressions bk − bk+1
%
ont toutes le même signe et la série k∈N (bk − bk+1 ) converge absolument si
et seulement si elle converge, ce qui est le cas puisque, comme on l’a montré
plus haut, la suite de ses sommes partielles est la suite (b0 − bq+1 )q∈N qui
converge par l’hypothèse b’.
%
Les test suivants ne requièrent plus la convergence de k∈N ak . On a
d’abord le test de convergence de Dedekind.
Corollaire. Soit (ak )k∈N et (bk )k∈N deux suites dans K vérifiant les condi-
tions suivantes.
A. La suite (Aq )q∈N est bornée.
%
B. La série k∈N (bk − bk+1 ) converge absolument.
C. La suite (bk )k∈N converge vers zéro.
%
Alors la série k∈N ak bk converge.
Démonstration. Si M majore tous les |Aq |, on a |Aq bq | ≤ M |bq | pour
tout q ∈ N, et dès lors limq→∞ Aq bq = 0. La thèse résulte du lemme d’Abel.
432 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES

On a enfin le test de convergence de Dirichlet.


Corollaire. Soit (ak )k∈N une suite dans K et (bk )k∈N une suite dans R
vérifiant les conditions suivantes.
A. La suite (Aq )q∈N est bornée.
B $ . La suite (bk )k∈N est monotone et converge vers zéro.
%
Alors la série k∈N ak bk converge.
Démonstration. On montre, comme dans le test d’Abel, que la condition
B’ entraı̂ne l’hypothèse B du test de Dedekind.
Exemples. 1. Le test de Dirichlet s’applique aux séries trigonométriques
%
k∈N dk exp ikt pour t /= 2πm, m ∈ Z, lorsque la suite (dk )k∈N est décrois-
sante et a une limite nulle. Ce sera en particulier le cas pour les séries
$
k−c exp(ikt)
k∈N

quel que soit c > 0 et t /= 2πm, m ∈ Z. On en déduit en particulier la


%
convergence de la série potentielle k∈N k−c z k considérée plus haut pour
tout z /= 1 tel que |z| = 1 et tout c ∈ ]0, 1]. Rappelons qu’on avait déjà
démontré la convergence absolue de cette série pour tout z tel que |z| = 1
et tout c > 1.
2. Une autre classe intéressante de séries auxquelles le test de Dirichlet
%
s’applique est celle des séries alternées k∈N (−1)k bk où les bk sont réels et
positifs. En posant ak = (−1)k , on trouve aussitôt que A2q = 1, A2q+1 =
0, et donc |Aq | ≤ 1 quel que soit q ∈ N. Le test de Dirichlet entraı̂ne
alors que la série alternée converge dès que la suite (bk )k∈N décroit vers
zéro. Ce sera en particulier le cas pour les séries de Riemann alternées
% (−1)k
k∈N∗ kc qui convergent quel que soit c > 0. On savait déjà qu’elles
convergeaient absolument si et seulement si c > 1. Elles sont donc non
absolument convergente pour c ∈ ]0, 1]. C’est en particulier le cas pour la
% k
série harmonique alternée k∈N∗ (−1) k .
Remarque. On appellera plus généralement série trigonométrique toute
série de la forme $
[d−k exp(−ikt) + dk exp(ikt)]
k∈N

où les d−k et dk sont des nombres complexes et t ∈ R. Lorsque d−k = dk


pour chaque k ∈ N, la série est réelle et peut encore s’écrire
$
a0 + (ak cos kt + bk sin kt)
k∈N
11.8. EXERCICES 433

avec ak = dk + d−k , bk = i(dk − d−k ), (k ∈ N). Si l’on pose Ak = (a2k + b2k )1/2
et θk = arctan abkk , cette dernière série prend la forme équivalente
$
Ak sin(kt + θk ).
k∈N

L’étude de la convergence des séries trigonométriques est l’un des chapitres


les plus importants et les plus délicats de l’analyse.

11.8 Exercices
1. Utiliser le théorème de Hake, la convergence de la série harmonique
alternée et la divergence de la série harmonique pour montrer que la fonction
f de R dans R définie par f (0) = 0 et
2 3
1
f (x) = (−1)[ x ]
1
,
x

pour x ∈ ]0, 1] (où [u] désigne la partie entière de u) est intégrable sur [0, 1]
mais n’y est pas L-intégrable.
2. Soit g une fonction de R dans R de classe C 1 sur R et a− , a+ deux zéros
consécutifs de g entre lesquels g est strictement positive. Utiliser le théorème
de Lagrange et le test de la limite d’intégrabilité pour montrer que, si a− et
a+ sont des zéros simples de g (c’est-à-dire des zéros tels que g $ (a− ) /= 0 et
g $ (a+ ) /= 0) alors la fonction x 2→ √ 1 est intégrable sur ]a− , a+ [. Ce type
g(x)
d’intégrale intervient dans la discussion, à partir de l’intégrale d’énergie, du
mouvement d’un système mécanique conservatif à un degré de liberté.
3. Montrer que la fonction f de R dans R définie par f (0) = 0 et f (x) = x1
si x /= 0 n’est pas intégrable sur ]a, b[ lorsque a < 0 < b. Montrer toutefois
que ,J -
−c dx J b
dx b
lim + = log .
c→0+ a x c x |a|
Cette limite s’appelle la valeur principale de Cauchy de l’“intégrale” de f
sur ]a, b[ et s’écrit
J b
dx b
vp = log .
a x |a|
4. Soit p ≥ 1 un entier, f une fonction de R dans R de classe C p sur [0, 1],
et α ∈ ]0, 1[. En utilisant le reste de Lagrange du développement de Taylor
434 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES

et le test d’intégrabilité de la limite, montrer que la fonction


p−1
f (x) − Tf,0 (x)
x 2→
xp+α
est intégrable sur [0, 1]. Son intégrale est appellée la partie finie de l’“inté-
grale” de la fonction x 2→ xfp+α
(x)
, et notée
J 1 f (x)
Pf dx.
0 xp+α
En particulier, montrer que
J 1 1+x 1
Pf dx = .
0 x1+α 1−α
5. Démontrer le théorème de Kummer : la série à termes strictement positifs
%
k∈N ak converge si et seulement s’il
8 existe une suite
9 (bk )k∈N de nombres
strictement positifs tels que limk→∞ bk ak+1 − bk+1 > 0. Suggestion: pour
ak
% %q
la condition nécessaire, si A = ∞k=0 ak , et Aq = k=0 ak , il suffit de prendre
bk = ak ; pour la condition suffisante, il existe h > 0 et m ∈ N tels que
A−Ak

ak
bk − bk+1 > h,
ak+1
pour tout k ≥ m. on en déduit aisément que, pour tout k ≥ m, on a

h(Ak − Am ) < bmam − bk ak < bm am ,

et dès lors la suite (Ak )k≥m est majorée par Am + bmham . En déduire le test
de Raabe : si limk→∞ k( aak+1 k
− 1) > 1, alors la série à termes strictement
%
positifs k∈N ak converge.
% m(m−1)...(m−k+1) k
6. Montrer que, si m ∈ R, la série binomiale k∈N k! z a un
rayon de convergence égal à un. Cette série se réduit au développement de
(1 + z)m par le binôme de Newton si m ≥ 1 est un entier.

11.9 Petite anthologie


Si on élève 1 + µ à la puissance m, le terme ne de la série sera
m(m − 1) . . .(m − n + 2)
µn−1 ,
2.3.4. . . ..(n − 1)
11.9. PETITE ANTHOLOGIE 435

et le suivant, c’est-à-dire le (n + 1)e , sera

m(m − 1) . . . (m − n + 2)(m − n + 1)
µn ;
2.3.4. . . .(n − 1).n

donc le rapport du (n + 1)e terme au ne sera µ (m−n+1)


n ; or pour que la série
soit convergente, il faut que ce rapport (abstraction faite du signe qu’il doit
avoir) soit plus petit que l’unité.
Jean Le Rond d’Alembert, 1768
Lorsque la série
u0 , u1 , u2 , . . . , un , etc, . . .
a tous ses termes positifs, on peut ordinairement décider si elle est conver-
gente ou divergente, à l’aide du théorème suivant. Théorème. Cherchez la
limite ou les limites vers lesquelles converge, tandis que n croı̂t indéfiniment,
l’expression (un )1/n ; et désignez par k la plus grande de ces limites, ou, en
d’autres termes, la limite des plus grandes valeurs de l’expression dont il
s’agit. La série sera convergente, si l’on a k < 1, et divergente, si l’on a
k > 1.
Augustin Cauchy, 1821

Soit
a0 , a1 x, a2 x2 , . . . , an xn , etc . . . ,
une série ordonnée suivant les puissances entières et ascendantes de la vari-
able x. Théorème. Soit A la limite vers laquelle converge, pour des valeurs
croissantes de n, la racine ne des plus grandes valeurs numériques de an .
La série sera convergente pour toutes les valeurs de x comprises entre les
limites
1 1
x=− , x=+ ,
A A
et divergentes pour toutes les valeurs de x situées hors des mêmes limites.
Augustin Cauchy, 1821

Etant donné une série

a0 + a1 x + . . . + am xm + . . . ,

on peut se proposer de déterminer, s’il y a lieu, son cercle de convergence.


Cette question a été traitée par M. Lecornu (Comptes rendus, 7 février 1887)
436 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES

1/m
dans le cas où le module de am+1
am ou celui de am a une limite. Cette limite
est alors l’inverse du rayon de convergence. L’objet de la présente note est
de résoudre le problème dans tous les cas. Pour cela, je rappellerai quelques
principes relatifs aux suites infinies.
Soit une suite infinie de nombres positifs
u0 , u1 , . . . , um, . . . .
Il peut arriver, comme premier cas, que cette suite contienne des termes
supérieures à tout nombre donné A.
S’il n’en est pas ainsi, il y a lieu de distinguer deux classes de nombres.
Dans la première, on mettra tout nombre A tel qu’il existe dans la suite des
termes d’un rang aussi élevé qu’on le veut supérieurs à A; dans la seconde,
tout nombre B, tel que tous les termes de la suite, à partir d’un certain
rang, soient moindres que B. Il est clair que si un nombre A appartient à la
première classe, il en est de même de tous les nombres inférieurs, et que si
un nombre B est de la seconde classe, il en est de même de tous les nombres
supérieurs. La supposition que nous avons faite au commencement de cet
alinée consiste dans l’existence des nombres de la seconde classe.
Il est alors facile de définir, par des procédés bien connus, un nombre
α, tel que la première classe soit composée des nombres plus petits que α,
et la seconde, des nombres plus grands que α; en sorte que α − !(! > 0)
appartiendra à la première classe, et α + ! à la seconde. Pour abréger, nous
appellerons ce nombre α la limite supérieure de la suite.
Cette limite est nulle dans le cas où la suite tend vers 0, et dans ce cas
seulement.
Cela posé, pour rechercher le cercle de convergence de la série donnée, il
suffira de considérer la suite
|a1 |, |a2|1/2, . . . , |am|1/m, . . . .
1. Si cette suite contient des termes supérieurs à toute quantité donnée, la
série n’est jamais convergente;
2. Si cette suite ne renferme pas de termes augmentant indéfiniment, elle
admet une limite supérieure α. Le rayon de convergence de la série est alors
ρ = α1 .
3. La condition nécessaire et suffisante pour que la série soit convergente
dans tout le plan et représente une fonction entière est que |am |1/m tende
vers zéro.
Jacques Hadamard, 1888
Chapitre 12

Suites et séries de fonctions

12.1 Convergence ponctuelle


De nombreuses fonctions intervenant en analyse s’obtiennent comme limites
de suites de fonctions plus simples. Le but de ce chapitre est d’étudier la
conservation éventuelle, après passage à la limite, de différentes propriétés
des fonctions de la suite. Nous allons voir que cette conservation dépend du
mode de passage à la limite.
Soit (fk )k∈N une suite de fonctions de Rn dans Rp, c’est-à-dire une appli-
cation de N dans l’ensemble des fonctions de Rn dans Rp , soit E une partie
de Rn contenue dans dom fk pour chaque k ∈ N et soit f une application
de E dans Rp .
Définition. On dit que la suite (fk )k∈N converge simplement ou ponctuel-
lement sur E vers f si, pour chaque x ∈ E, la suite (dans Rp) (fk (x))k∈N
converge vers f (x).
Cette définition et l’unicité de la limite d’une suite dans Rp entraı̂nent
aussitôt qu’il existe au plus une application f de E dans Rp vérifiant les
conditions de cette définition. Lorsqu’elle existe, cette application s’appelle
la limite ponctuelle sur E de la suite (fk )k∈N.
En explicitant la définition de convergence d’une suite dans Rp, on trouve
immédiatement que (fk )k∈N converge ponctuellement sur E vers f si et seule-
ment si

(∀x ∈ E)(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m) : |fk (x) − f (x)|2 ≤ !, (12.1)

la norme | · |2 pouvant évidemment être remplacée par une autre. On voit


que le m donné dans (12.1) dépendra en général d’ ! et de x. Il est évident

437
438 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS

que, si G ⊂ E, la convergence ponctuelle sur E vers f de la suite (fk )k∈N


entraı̂ne la convergence ponctuelle de cette suite sur G vers la restriction de
f à G.
Exemples. 1. Si E = [0, 1], la suite de fonctions réelles (fk )k∈N définies par
fk (x) = xk converge ponctuellement sur E vers l’application réelle f définie
par f (x) = 0 si x ∈ [0, 1[ et f (1) = 1. Pour chaque 0 < ! < 1 et chaque
x ∈ [0, 1], le plus petit entier m = m(!, x) pour lequel (12.1) est satisfaite est
donné par m(!, 0) = 0, m(!, 1) =D 0 et,
E
pour 0 < x < 1, m(!, x) = ln x si ce
ln !

dernier nombre est entier et par ln x + 1, s’il ne l’est pas, où [y] désigne la
ln !

partie entière du réel y. On voit donc que m(!, x) tend vers l’infini lorsque
x tend vers 1 par valeurs strictement inférieures à un.
2. Considérons la suite (fk )k∈N de fonctions réelles d’une variable réelle
définies par fk (x) = 1+(x−k)
1
2 . Pour chaque k ∈ N, on vérifie facilement que

1
lim = 0.
k→∞ 1 + (x − k)2
Par conséquent, cette suite converge ponctuellement sur R vers l’application
nulle. Le lecteur vérifiera facilement que la quantité m(!, x) introduite dans
l’exemple précédent tend vers +∞ lorsque x tend vers l’infini.
3. Si E = R, la suite de fonctions réelles (fk )k∈N définies par f0 (x) = 0
et fk (x) = k−1/2 sin kx pour k ≥ 1 converge ponctuellement sur R vers
l’application nulle sur R.
La conséquence immédiate suivante de la définition et des propriétés des
suites dans Rp montre qu’on peut se ramener à l’étude de la convergence
ponctuelle des suites de fonctions réelles.
Proposition. La suite (fk )k∈N converge ponctuellement sur E vers f si et
seulement si chaque suite de fonctions réelles (pq ◦fk )k∈N converge ponctuelle-
ment sur E vers pq ◦ f .
Le critère de Cauchy de convergence d’une suite dans Rp appliqué à
chaque suite (fk (x))k∈N fournit évidemment un critère de Cauchy de
convergence ponctuelle sur E.
Proposition. La suite (fk )k∈N converge ponctuellement sur E si et seule-
ment si

(∀x ∈ E)(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q ≥ m) :

|fk (x) − fq (x)|2 ≤ !.


On peut évidemment considérer aussi des séries de fonctions.
12.1. CONVERGENCE PONCTUELLE 439

Définition. On appelle série de fonctions de termes fk , k ∈ N, et l’on note


%
k∈N fk , la suite de fonctions (Fq )q∈N , où chaque fonction somme partielle
Fq est définie par
q
$
Fq = fk .
k=0

Définition. Soit F une application de E dans Rp . On dit que la série


%
k∈N fk converge simplement ou ponctuellement sur E vers F si la suite
(Fq )q∈N converge ponctuellement sur E vers F .
Si elle existe, l’unique application F vérifiant cette définition s’appelle
% %
alors la somme de la série de fonctions k∈N fk et se note ∞ k=0 fk . Il résulte
%
immédiatement de la définition que k∈N fk converge ponctuellement sur E
%
vers F si et seulement si, pour chaque x ∈ E, la série (dans Rp ) k∈N fk (x)
converge vers F (x).
Exemple. Si, pour chaque k ∈ N, la fonction réelle d’une variable réelle fk
est définie par fk (x) = xk /k, on a vu en étudiant les séries entières que la
%
série k∈N fk converge ponctuellement sur [−1, 1[.
La notion de convergence absolue d’une série dans Rp conduit à un second
type de convergence pour une série de fonctions.
%
Définition. On dit que la série de fonctions k∈N fk converge absolument
%
sur E si, pour chaque x ∈ E, la série numérique k∈N |fk (x)|2 converge,
%
c’est-à-dire si, pour chaque x ∈ E, la série (dans Rp) k∈N fk (x) converge
absolument.
La propriété suivante est une conséquence immédiate de la définition et
d’une propriété connue des séries dans Rp .
%
Proposition. Si la série de fonctions k∈N fk converge absolument sur E,
elle converge ponctuellement sur E.
Exemples. 1. Soit fk les fonctions réelles d’une variable réelle définies par
%
fk (x) = k−x et soit E =]1, +∞[. La série k∈N fk converge absolument sur E
et sa somme est la restriction à ]1, +∞[ d’une fonction complexe d’une vari-
able complexe appelée la fonction zeta (ζ). Cette fonction joue un grand rôle
en théorie analytique des nombres. Bernhard Riemann a conjecturé en 1859
que les zéros non triviaux de cette fonction ont tous une partie réelle égale
à 1/2. Vérifiée pour les quelques premiers millions de zéros de la fonction,
cette hypothèse de Riemann attend encore sa démonstration. Celle-ci perme-
ttrait de préciser le théorème des nombres premiers, conjecturé en 1792 par
Karl-Friedrich Gauss et seulement démontré en 1896 (indépendamment) par
440 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS

Jacques Hadamard et Charles-Jean de La Vallée Poussin . Ce théorème


affirme que le nombre π(k) de nombre premiers inférieurs ou égaux à un en-
tier positif k est tel que
π(k)
lim = 1.
k→∞ k/ ln k

2. Soit fk les fonctions complexes d’une variable complexe définies par


fk (z) = z k et considérée comme fonction de R2 dans R2 . En vertu des
%
résultats sur la convergence de la série géométrique, la série k∈N fk converge
absolument sur B2 (0; 1) vers l’application F définie par F (z) = 1−z 1
.
3. Si les fonctions réelles d’une variable réelle fk sont définies par fk (x) =
x(1 − x)k , alors, pour chaque q ∈ N, on a Fq (0) = 0 et Fq (x) = 1 − (1 − x)q+1
si x /= 0. Par conséquent, puisque fk (x) = |fk (x)| pour chaque x ∈ [0, 1], la
% %
série k∈N fk converge absolument sur [0, 1] et ∞ k=1 x(1 − x) = 0 si x = 0
k

et est égale à 1 si x ∈]0, 1].


Enfin, on traduit aisément dans le langage des séries les critères de
Cauchy de convergence ponctuelle et de convergence absolue.
%
Proposition. La série de fonctions k∈N fk converge ponctuellement (resp.
absolument) sur E si et seulement si

(∀x ∈ E)(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q > k ≥ m) :


# #
# q # q
# $ # $
#
# fj (x) # ≤ !. (resp.
# |fj (x)|2 ≤ !.)
#j=k+1 # j=k+1
2

L’exemple 1 de suite de fonctions et l’exemple 3 de série de fonctions


montrent que la limite ponctuelle d’une suite de fonctions continues ou la
somme d’une série absolument convergente de fonctions continues n’est pas
nécessairement continue sur l’ensemble de convergence. D’ailleurs, dans ces
exemples, les fonctions sont indéfiniment dérivables et la limite ou la somme
ne l’est évidemment pas. La limite ponctuelle sur un ensemble d’une suite de
fonctions bornées sur cet ensemble n’y est pas nécessairement bornée. Ainsi,
pour chaque k ∈ N, la fonction réelle d’une variable réelle fk définie sur R∗+
par
k
fk (x) = ,
kx + 1
est bornée sur R+ par k et la suite converge ponctuellement sur R∗+ vers
l’application f définie par f (x) = 1/x qui n’est pas bornée sur R∗+ . Enfin,
la convergence ponctuelle ne préserve pas non plus l’intégrabilité. Dans
12.2. CONVERGENCE UNIFORME 441

l’exemple précédent, chaque fk est intégrable sur ]0, 1] alors que f ne l’est
pas, ainsi que cela se vérifie en utilisant le théorème de Hake.
Si l’on note que les propriétés des fonctions que nous venons d’analyser
expriment une certaine “solidarité” entre les valeurs de la fonction et que la
convergence ponctuelle (c’est-à-dire “point par point”) est un concept tout
à fait “individualiste”, on ne doit pas s’étonner trop que ces propriétés ne
subsistent pas nécessairement après passage à la limite. Il convient donc
d’introduire une notion de convergence plus globale si l’on veut que la fonc-
tion limite conserve de telles propriétés.

12.2 Convergence uniforme


Soit (fk )k∈N une suite de fonctions de Rn dans Rp , soit E une partie de Rn
contenue dans dom fk pour chaque k ∈ N et soit f une application de E
dans Rp . Nous allons introduire un type de convergence plus restrictif que
la convergence ponctuelle en imposant que la quantité m figurant dans la
définition (12.1) puisse être choisie indépendamment de x dans E.
Définition. On dit que la suite (fk )k∈N converge uniformément sur E vers
f si
(∀! > 0)(∃m ∈ N)(∀x ∈ E)(∀k ∈ N : k ≥ m) : |fk (x) − f (x)|2 ≤ !. (12.2)
Bien entendu, si G ⊂ E, la convergence uniforme vers f de (fk )k∈N sur
E entraı̂ne la convergence uniforme sur G de (fk )k∈N vers la restriction de
f à G.
Les propriétés du supremum entraı̂nent aussitôt le résultat suivant.
Proposition. Les propositions suivantes sont équivalentes :
1. (fk )k∈N converge uniformément sur E vers f .
2.
(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m) : sup |fk (x) − f (x)|2 ≤ !. (12.3)
x∈E

3. La suite réelle (supx∈E |fk (x) − f (x)|2 )k∈N converge vers zéro.
Exemple. Dans l’exemple 3 de suite de fonctions donné dans la section
précédente, il y a converge uniforme sur R vers l’application nulle puisque
la suite 4 5
−1/2
sup |k sin kx| = (k−1/2)k∈N∗
R k∈N∗
converge vers zéro.
Signalons une autre conséquence immédiate de la définition.
442 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS

Proposition. Si (fk )k∈N converge uniformément sur E vers f , alors


(fk )k∈N converge ponctuellement sur E vers f .
L’unicité de la limite ponctuelle entraı̂ne alors qu’il existe au plus un f
vérifiant (12.2). On l’appelle souvent la limite uniforme de (fk )k∈N sur E et
elle est nécessairement égale à sa limite ponctuelle.
L’exemple 2 de suite de fonctions donné dans la section précédente mon-
tre que la convergence ponctuelle sur un ensemble n’entraı̂ne pas nécessaire-
ment la convergence uniforme sur cet ensemble. En effet, la suite de fonctions
donnée dans cet exemple converge ponctuellement sur R vers l’application
nulle alors que la suite
& # #'
# 1 #
#
sup # # ,
x∈R 1 + (x − k)2 # k∈N

qui est la suite constante 1, ne converge évidemment pas vers zéro.


On dispose d’un critère de Cauchy de convergence uniforme.
Théorème. La suite de fonctions (fk )k∈N converge uniformément sur E si
et seulement si

(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q ≥ m)(∀x ∈ E) : (12.4)

|fk (x) − fq (x)|2 ≤ !,


ou encore si et seulement si,

(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q ≥ m) :

sup |fk (x) − fq (x)|2 ≤ !.


x∈E

Démonstration. Condition nécessaire. Si ! > 0 est donné, alors, par


définition,

(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀x ∈ E) : |fk (x) − f (x)|2 ≤ !/2.

Dès lors, pour tout k ≥ m, tout q ≥ m et tout x ∈ E, on a

|fk (x) − fq (x)|2 ≤ |fk (x) − f (x)|2 + |f (x) − fq (x)|2 ≤ !/2 + !/2 = !.

Condition suffisante. Construisons tout d’abord un candidat pour l’ap-


plication limite f . Si la suite (fk )k∈N vérifie la condition de Cauchy (12.4),
alors, pour chaque x ∈ E, la suite (fk (x))k∈N est une suite de Cauchy dans
12.2. CONVERGENCE UNIFORME 443

Rp et elle converge dès lors vers un élément de Rp que nous désignerons par
f (x). On obtient ainsi une application f de E dans Rp .
Montrons maintenant que (fk )k∈N converge uniformément sur E vers f .
Si ! > 0 est donné, la condition (12.4) implique que

(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀x ∈ E)(∀q ∈ N : q ≥ m) : |fk (x) − fq (x)|2 ≤ !.

En faisant tendre q vers l’infini, on obtient alors, par continuité de l’appli-


cation norme et conservation des inégalités par passage à la limite

(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀x ∈ E) : |fk (x) − f (x)|2 ≤ !,

et la démonstration est complète.


Le critère de Cauchy permet de prouver la convergence uniforme sur
adh E de certaines suites de fonctions convergeant uniformément sur E.
Proposition. Soit (fk )k∈N une suite de fonctions de Rn dans Rp continues
sur adh E \ E qui converge uniformément sur E. Alors (fk )k∈N converge
uniformément sur adh E.
Démonstration. On peut évidemment supposer que adh E /= E. Si ! > 0
est donné, le critère de Cauchy de convergence uniforme sur E entraı̂ne
l’existence d’un m ∈ N tel que

(∀y ∈ E)(∀k ∈ N : k ≥ m)(∀q ∈ N : q ≥ m) : |fk (y) − fq (y)|2 ≤ !/3.

D’autre part, pour chaque x ∈ adh E \ E, la continuité de chaque fonction


fk au point x entraı̂ne l’existence d’un δ = δ(k, x) > 0 tel que

(∀y ∈ E : |y − x|2 ≤ δ(k, x)) : |fk (y) − fk (x)|2 ≤ !/3.

Dès lors, pour chaque x ∈ adh E \ E, k ≥ m et chaque q ≥ m, si nous


choisissons (ce qui est toujours possible puisque x ∈ adh E \ E) un y ∈ E
tel que
|y − x|2 ≤ min[δ(k, x), δ(q, x)],
nous obtenons

|fk (x) − fq (x)|2 ≤ |fk (x) − fk (y)|2 + |fk (y) − fq (y)|2 + |fq (y) − fq (x)|2

≤ !/3 + !/3 + !/3 = !,


ce qui entraı̂ne la convergence uniforme de (fk )k∈N sur adh E puisque la
condition de Cauchy était déjà satisfaite, avec le même m, pour chaque
x ∈ E.
444 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS

Une forme contraposée et affaiblie de cette proposition est souvent utile.

Corollaire. Soit (fk )k∈N une suite de fonctions de Rn dans Rp continues


sur adh E. Si cette suite ne converge pas uniformément sur adh E, alors elle
ne converge pas uniformément sur E.

Passons maintenant à la convergence uniforme des séries de fonctions.


%
Soit k∈N fk une série dont les termes sont des fonctions définies sur E ⊂ Rn
et F une application de E dans Rp.
%
Définition. On dit que la série de fonctions k∈N fk converge uniformé-
ment sur E vers F si la suite (Fq )q∈N des sommes partielles converge unifor-
mément sur E vers F .

%
Définition. On dit que la série de fonctions k∈N fk converge absolument
%
uniformément sur E si la série de fonctions positives k∈N |fk |2 converge
uniformément sur E.

On notera que cette notion est plus forte que celle de convergence absolue
%
et uniforme de k∈N fk sur E.
%
Exemple. Considérons la série k∈N fk de fonctions complexes d’une vari-
able complexe fk définies par fk (z) = z k . On a vu que cette série converge
ponctuellement sur B2 (0; 1) vers l’application F : z 2→ 1−z
1
. Elle ne converge
pas uniformément sur B2 (0; 1) vers F car, pour chaque q ∈ N, on a

|z|q+1
sup |Fq (z) − F (z)| = sup = +∞.
z∈B2 (0;1) z∈B2 (0;1) |1 − z|

%
Toutefois, pour chaque r < 1, k∈N fk converge uniformément sur B2 [0; r]
vers F puisque

|z|q+1 r q+1
sup |Fq (z) − F (z)| = sup = ,
z∈B2 [0;r] z∈B2 [0;r] |1 − z| 1−r

et que le dernier terme peut être rendu inférieur ou égal à ! > 0 donné
en prenant q ≥ m pour m tel que r m+1 ≤ !(1 − r). Le même raisonnement
% %
appliqué à la série k∈N |z|k montre que k∈N fk converge en fait absolument
et uniformément sur B2 [0; r].
On traduit sans peine, dans le langage des séries, le critère de Cauchy
de convergence uniforme (resp. de convergence absolue uniforme).
12.2. CONVERGENCE UNIFORME 445

%
Corollaire. La série de fonctions k∈N fk converge uniformément (resp.
absolument uniformément) sur E si et seulement si
(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q > k ≥ m)(∀x ∈ E) :
# #
# q # q
# $ # $
# fj (x)## ≤ !, (resp. |fj (x)|2 ≤ !),
#
#j=k+1 # j=k+1
2
ou, d’une manière équivalente, si et seulement si
(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q > k ≥ m) :
# #  
# q # q
# $ # $
sup ## fj (x)## ≤ !. (resp. sup  |fj (x)|2  ≤ !).
x∈E #j=k+1 # x∈E j=k+1
2
En particulier, puisqu’on a toujours l’inégalité
 
q
$ q
$
sup  |fj (x)|2 ≤ sup |fj (x)|2 ,
x∈E j=k+1 j=k+1 x∈E

on voit qu’il y aura toujours convergence absolue uniforme sur E pour la série
% %
de fonctions k∈N fk si la série à termes positifs k∈N supx∈E |fk (x)|2 est de
Cauchy, c’est-à-dire est convergente. Cette remarque suggère l’introduction
d’un nouveau type de convergence pour une série de fonctions.
%
Définition. On dit que la série k∈N fk de fonctions de Rn dans Rp con-
%
verge normalement sur E si la série à termes positifs k∈N supx∈E |fk (x)|2
converge.
Par la remarque que nous venons de faire, la convergence normale sur E
entraı̂ne évidemment la convergence absolue uniforme sur E.
On a l’intéressant test de comparaison de Weierstrass pour la
convergence normale.
%
Théorème. Considérons la série k∈N fk de fonctions de Rn dans Rp . S’il
%
existe une série convergente à termes positifs k∈N Mk telle que, pour chaque
k ∈ N et chaque x ∈ E on ait
|fk (x)|2 ≤ Mk ,
%
alors la série k∈N fk est normalement convergente sur E.
Démonstration. Pour chaque k ∈ N, on a, par hypothèse,
sup |fk (x)|2 ≤ Mk ,
x∈E
446 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS

et la thèse résulte de la définition et du test de comparaison pour les séries


numériques.
Exemple. Soit s > 1 et fk la fonction complexe d’une variable réelle définie
par fk (x) = (k + 1)−s exp i(k + 1)x. Pour chaque k ∈ N et chaque x ∈ R, on
a
|fk (x)| ≤ (k + 1)−s
% %
et la série numérique k∈N (k + 1)−s est convergente. Donc la série k∈N fk
est normalement convergente sur R.

12.3 Régularité de la limite uniforme


Le résultat suivant est fondamental pour étudier la continuité et la dériva-
bilité de la limite uniforme d’une suite de fonctions continues ou dérivables.
Théorème. Soit (fk )k∈N une suite de fonctions de Rn dans Rp définies sur
E, f une application de E dans Rp et a ∈ adh E. Si les conditions suivantes
sont réalisées
1. La suite (fk )k∈N converge uniformément sur E vers f .
2. Pour chaque k ∈ N, limx→a, x∈E fk (x) = bk .
Alors la suite (bk )k∈N converge et

lim f (x) = lim bk .


x→a, x∈E k→∞

En d’autres termes,
2 3 2 3
lim lim fk (x) = lim lim fk (x) .
x→a, x∈E k→∞ k→∞ x→a, x∈E

Démonstration. Pour montrer que la suite (bk )k∈N converge, il suffit de


montrer qu’elle est une suite de Cauchy. Si ! > 0 est donné, la condition de
Cauchy de convergence uniforme de (fk )k∈N sur E entraı̂ne l’existence d’un
m ∈ N tel que

(∀k ≥ m)(∀q ≥ m)(∀x ∈ E) : |fk (x) − fq (x)|2 ≤ !.

Dès lors, en faisant tendre x vers a et en utilisant la conservation d’une


inégalité par passage à la limite et la continuité de la fonction | · |2 , on
obtient
|bk − bq |2 ≤ !,
12.3. RÉGULARITÉ DE LA LIMITE UNIFORME 447

pour tout k ≥ m et tout q ≥ m, et (bk )k∈N est une suite de Cauchy dans Rp.
Si nous désignons sa limite par b, il reste à montrer que

lim f (x) = b.
x→a, x∈E

Etant donné un ! > 0, la convergence de (bk )k∈N vers b et la convergence


uniforme de (fk )k∈N vers f entraı̂nent respectivement l’existence d’un m$ ∈ N
et d’un m$$ ∈ N tels que, si m = max(m$ , m$$), on a

|bm − b|2 ≤ !/3

et
|fm (x) − f (x)|2 ≤ !/3
quel que soit x ∈ E. D’autre part, puisque limx→a, x∈E fm (x) = bm , il existe
un δ > 0 tel que
|fm (x) − bm|2 ≤ !/3
pour tout x ∈ E tel que |x − a|2 ≤ δ. Pour ces mêmes x, on aura donc

|f (x) − b|2 ≤ |f (x) − fm (x)|2 + |fm (x) − bm |2 + |bm − b|2

≤ !/3 + !/3 + !/3 = !,


et la démonstration est complète.
On a un résultat similaire pour les séries de fonctions.
%
Corollaire. Soit k∈N fk une série de fonctions de Rn dans Rp définies sur
E, F une application de E dans Rp et a ∈ adh E. Si les conditions suivantes
sont satisfaites :
%
1. La série k∈N fk converge uniformément sur E vers F .
2. Pour chaque k ∈ N, limx→a, x∈E fk (x) = bk .
%
Alors la série k∈N bk converge et

$
lim F (x) = bk .
x→a, x∈E
k=0

En d’autres termes,
, ∞
- ∞ 2 3
$ $
lim fk (x) = lim fk (x) .
x→a, x∈E x→a, x∈E
k=0 k=0
448 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS

Démonstration. En vertu des définitions, il suffit d’appliquer le théorè-


me ci-dessus à la suite des sommes partielles (Fq )q∈N et de noter que, par
suite des propriétés des limites des valeurs d’une fonction, on a, pour chaque
q ∈ N,
, q - q 2 3 q
$ $ $
lim Fq (x) = lim fk (x) = lim fk (x) = bk .
x→a, x∈E x→a, x∈E x→a, x∈E
k=0 k=0 k=0

%
Remarque. La convergence uniforme de la série k∈N fk sur E autorise
%
donc la permutation des symboles limx→a, x∈E et ∞ k=0 .
Les résultats suivants sont des conséquences immédiates du théorème et
du corollaire précédents et de la définition de continuité.
Corollaire. Si (fk )k∈N converge uniformément sur E vers f et si chaque
fonction fk est continue sur E, alors f est continue sur E.
%
Corollaire. Si k∈N fk converge uniformément sur E vers F et si chaque
fonction fk est continue sur E, alors F est continue sur E.
Considérons maintenant le problème de la conservation de la dérivabilité
par passage à la limite. La convergence uniforme d’une suite de fonctions
dérivables ne suffit pas à assurer la dérivabilité de la limite. Ainsi, la suite
k+2
(fk )k∈N de fonctions réelles d’une variable réelle définies par fk (x) = |x| k+1
et dérivables en chaque point de R converge uniformément sur [−1, 1] vers
la fonction valeur absolue qui n’est pas dérivable à l’origine. Il peut arriver
aussi que la limite soit dérivable mais ne soit pas égale à la limite des dérivées
des fonctions de la suite. Le résultat suivant fournit des conditions sous
lesquelles de telles conclusions sont exclues.
Théorème. Soit (fk )k∈N une suite de fonctions de Rn dans Rp définies sur
un ouvert E et soit f une application de E dans Rp . Supposons satisfaites
les conditions suivantes.
1. La suite (fk )k∈N converge ponctuellement sur E vers f .
2. Il existe 1 ≤ j ≤ n tel que, pour chaque k ∈ N, la dérivée partielle
Dj fk (x) existe pour chaque x ∈ E.
3. La suite de fonctions (Dj fk )k∈N converge uniformément sur E.
Alors Dj f (x) existe pour chaque x ∈ E et est égale à limk→∞ Dj fk (x). En
d’autres termes, on a
4 5
Dj lim fk (x) = lim Dj fk (x).
k→∞ k→∞
12.3. RÉGULARITÉ DE LA LIMITE UNIFORME 449

Démonstration. Soit x ∈ E fixé, r > 0 tel que Ix = [−r, r] ⊂ Ex = {h ∈


R : x + hej ∈ E}, et φ, φk les fonctions définies pour chaque k ∈ N par les
quotients différentiels
f (x + hej ) − f (x) fk (x + hej ) − fk (x)
φ(h) = , φk (h) = .
h h
Par construction, les fonctions φ et φk sont définies sur Ix \ {0} et sont telles
que
lim φk (h) = Dj fk (x), k ∈ N,
h→0, h∈Ix
et
lim φk (h) = φ(h), h ∈ Ix \ {0}.
k→∞
D’autre part, en appliquant l’inégalité de la moyenne à fk − fq , on trouve,
pour chaque h ∈ Ix \ {0}, chaque k ∈ N et chaque q ∈ N,

|φk (h) − φq (h)|2 = |h|−1 |fk (x + hej ) − fq (x + hej ) − [fk (x) − fq (x)]|2

≤ |Dj fk (x + h$ ej ) − Dj fq (x + h$ ej )|2 ,
pour un certain h$ tel que 0 < |h$ | < |h|.
Si ! > 0 est donné, la condition de Cauchy de convergence uniforme sur
E de (Dj fk )k∈N entraı̂ne l’existence d’un m ∈ N tel que, pour chaque k ≥ m,
chaque q ≥ m et chaque y ∈ E, on ait

|Dj fk (y) − Dj fq (y)|2 ≤ !.

Dès lors, puisque x + h$ ej ∈ E si h ∈ Ix \ {0}, on aura, pour chaque k ≥ m,


chaque q ≥ m et chaque h ∈ Ix \ {0},

|φk (h) − φq (h)|2 ≤ !.

En conséquence, la suite de fonctions (φk )k∈N converge uniformément sur


Ix \ {0} vers φ et, en lui appliquant le premier théorème de cette section, on
en déduit que
2 3 2 3
lim lim φk (h) = lim lim φk (h) ,
h→0, h∈Ix k→∞ k→∞ h→0, h∈Ix

c’est-à-dire, par des calculs faits plus haut, que

lim φ(h) = lim Dj fk (x).


h→0, h∈Ix k→∞

Donc Dj f (x) existe et est égal à limk→∞ Dj fk (x).


450 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS

On a évidemment un résultat analogue pour les séries.


%
Corollaire. Soit k∈N fk une série de fonctions de Rn dans Rp dont les
termes sont définis sur un ouvert E et soit F une application de E dans Rp.
Supposons satisfaites les conditions suivantes.
%
1. La série k∈N fk converge ponctuellement sur E vers F .
2. Il existe 1 ≤ j ≤ n tel que, pour chaque k ∈ N, la dérivée partielle
Dj fk (x) existe pour chaque x ∈ E.
%
3. La série de fonctions k∈N Dj fk converge uniformément sur E.
%
Alors Dj F (x) existe pour chaque x ∈ E et est égale à ∞ k=0 Dj fk (x). En
d’autres termes, on a
& ∞
' ∞
$ $
Dj fk (x) = Dj fk (x).
k=0 k=0

Démonstration. Elle consiste à appliquer le théorème précédent à la suite


des sommes partielles. Les détails sont laissés au lecteur.
Montrons maintenant que la limite uniforme d’une suite de fonctions
bornées est bornée.
Proposition. Soit (fk )k∈N une suite de fonctions de Rn dans Rp définies
sur E et soit f une application de E dans Rp . Supposons satisfaites les
conditions suivantes.
1. La suite (fk )k∈N converge uniformément sur E vers f .
2. Pour chaque k ∈ N, il existe Mk ≥ 0 tel que |fk (x)|2 ≤ Mk , pour tout
x ∈ E.
Alors il existe M ≥ 0 tel que |f (x)|2 ≤ M pour tout x ∈ E.
Démonstration. En prenant ! = 1 dans la définition de convergence
uniforme de (fk )k∈N sur E, on obtient un entier positif m tel que, pour
chaque x ∈ E, on a
|fm (x) − f (x)|2 ≤ 1,
ce qui entraı̂ne

|f (x)|2 = |f (x) − fm (x) + fm (x)|2 ≤ 1 + |fm (x)|2 ≤ 1 + Mm

pour tout x ∈ E et achève la démonstration.


Remarque. On pourrait démontrer maintenant que la limite uniforme
sur un pavé d’une suite de fonctions intégrables (resp. L-intégrables, R-
intégrables) sur ce pavé y est également intégrable (resp. L-intégrable,
12.4. UNE FONCTION CONTINUE SANS DÉRIVÉE 451

R-intégrable). Mais on trouvera plus loin des résultats plus généraux sur
l’intégrabilité ou la L-intégrabilité de la limite d’une suite de fonctions inté-
grables.

12.4 Une fonction continue sans dérivée


Les résultats que nous venons de développer permettent de construire un
exemple, donné par Henri Lebesgue en 1940, de fonction réelle d’une vari-
able réelle continue partout et dérivable nulle part. Considérons la série de
%
fonctions k∈N∗ fk où, pour chaque k ∈ N∗ , fk est l’application de R dans
R définie par
2
sin 2k x
fk (x) = .
2k
Chaque fk est évidemment continue sur R et telle que

1
sup |fk (x)| ≤ .
x∈R 2k
%
Le test de Weierstrass assure donc la convergence normale de k∈N∗ fk sur
R et la somme F de cette série sera une application continue de R dans R.
D’autre part, on aura, pour tout x ∈ R et tout h /= 0,
∞ 2 2 ∞
F (x + h) − F (x) $ sin 2k (x + h) − sin 2k x $
= = gk (x, h),
h k=1
2k h k=1

et dès lors, par le théorème de Lagrange, on aura, pour tout k ∈ N∗ , tout


x ∈ R et tout h /= 0,
2
|gk (x, h)| ≤ 2k −k = ak .

Comme ak < 12 ak+1 , on a, pour tout entier m ≥ 2,

m−1
$ 1 − (1/2)m−1 2 2
ak < am−1 < 2am−1 = 2(m−1) −(m−1)+1 = 2m −3m+3 .
k=1
1 − (1/2)

Donnons à h les quatre suites suivantes de valeurs tendant vers zéro lorsque
m tend vers l’infini
π π 3π 3π
h1,m = , h2,m = − m2 +1 , h3,m = m2 +1 , h4,m = − m2 +1 .
2m +1 2 2 2
2
452 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS

2
Pour chaque m ∈ N∗ fixé, et chaque 1 ≤ j ≤ 4, 2k hj,m sera un multiple de
2π lorsque k > m, et dès lors gk (x, hj,m ) = 0. Pour k = m, on a, en posant
2
xk = 2k x,
4 5
π
gm (x, h1,m) = sin xm + − sin xm = cos xm − sin xm ,
2
4 5
π
gm (x, h2,m) = sin xm − − sin xm = − cos xm − sin xm ,
2
4 5

gm (x, h3,m) = sin xm + − sin xm = − cos xm − sin xm ,
2
4 5

gm (x, h4,m) = sin xm − − sin xm = cos xm − sin xm .
2
Comme
(cos xm − sin xm )2 + (cos xm + sin xm )2 = 2,
la valeur absolue d’un des termes au moins est supérieure ou égale à un, et
dès lors, pour les deux termes correspondants gm (x, hj,m), (avec j = 1, 4 ou
j = 2, 3), on aura
2 −m+1
1 2m
|gm(x, hj,m )| ≥ = .
2m 3π
2 3π
2m +1

En outre les termes correspondants seront de signe contraire. En résumé, on


aura donc
# #
# F (x + h ) − F (x) # 2
2m −m+1
# j,m # 2
# #> − 2m −3m+3 .
# hj,m # 3π

Comme le membre de droite tend vers l’infini avec m, on pourra donc tou-
jours trouver une suite (hjm ,m )m∈N∗ tendant vers zéro telle que la suite cor-
respondante &# #'
# F (x + h #
# jm ,m ) − F (x) #
# # ,
# hjm ,m #
m∈N∗
tende vers l’infini, et de telle sorte que pour chaque m le quotient différentiel
ait un signe choisi d’avance. En conséquence, la fonction F ainsi construite
n’a de dérivée (ni même de dérivée au sens large) en aucun point de R. On
notera que chaque somme partielle de la suite dont F est la limite est de
classe C ∞ !
12.5. SOMME D’UNE SÉRIE ENTIÈRE 453

Jusqu’à la moitié du XIXe siècle, les mathématiciens pensaient qu’une


fonction continue admet une dérivée sauf en quelques point exceptionnels.
Après un exemple partiellement discuté par Bernard Bolzano en 1830, et
un travail non publié de Charles Cellérier, le premier traitement rigoureux
d’un exemple de fonction continue non dérivable fut publié par Karl Weier-
strass en 1872; il s’agit de la somme de la série trigonométrique

$
F (x) = ak cos(bk πx),
k=0

où b est un entier impair et a un réel tel que 0 < a < 1 et ab > 1 + (3/2)π.
Godefrey Harold Hardy a d’ailleurs montré en 1916 que la dernière con-
dition pouvait être remplacée par ab ≥ 1. De nombreux autres exemples
ont alors été proposés. Le graphe de telles fonctions constitue un ensem-
ble fractal dans la terminologie de Benoı̂t Mandelbrot. Après n’avoir été
pendant de nombreuses années que des “monstres mathématiques”, ces en-
sembles, souvent caractérisés par des propriétés d’auto-similarité quelle que
soit l’échelle à laquelle on les examine, sont depuis quelques années l’objet
d’un intérêt croissant et leur champ d’application aux sciences de la nature
ne cesse d’augmenter. Felix Hausdorff a introduit en 1919 une notion
de dimension qui redonne respectivement, pour les courbes, surfaces ou vol-
umes “réguliers”, les valeurs usuelles un, deux ou trois mais attribue, aux
ensembles fractals, des valeurs non entières! On sait que la dimension de
Hausdorff du graphe de la fonction de Weierstrass est strictement comprise
entre un et deux, mais on ignore toujours sa valeur exacte.

12.5 Somme d’une série entière


%
Soit k∈N ck (z − a)k une série entière, avec z ∈ C, a ∈ C, , ck ∈ C pour
chaque k ∈ N. Si R = 1/C avec
, -
8 9
C = lim sup |ck | 1/k
,
q→∞ k≥q

désigne le rayon de convergence de cette série entière, elle convergera absolu-


ment sur son disque de convergence B2 (a; R), avec la convention B2 (a; R) =
{a} si R = 0 et B2 (a; R) = C si R = +∞. On peut évidemment con-
%
sidérer aussi cette série comme une série k∈N fk de fonctions complexes
d’une variable complexe fk définies par fk (z) = ck (z − a)k . On la notera
454 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS

% %
alors k∈N ck (· − a)k . L’exemple de la série géométrique k∈N z k considérée
plus haut montre qu’une série entière peut ne pas converger uniformément
sur son disque de convergence. On va montrer qu’elle converge normalement
sur tout disque fermé centré en a et de rayon strictement inférieur au rayon
de convergence.
Proposition. Soit R le rayon de convergence de la série entière
$
ck (z − a)k .
k∈N

Alors la série de fonctions correspondante converge absolument sur B2 (a; R)


et normalement sur B2 [a; r] pour tout r ∈]0, R[.
Démonstration. La convergence absolue sur B2 (a; R) n’est qu’une refor-
mulation du théorème fondamental de convergence d’une série entière. Soit
r ∈]0, R[; pour chaque k ∈ N, on a

sup |ck (z − a)k | = |ck |r k .


z∈B2 [a;r]

%
D’autre part, la série numérique k∈N |ck |r k est convergente en vertu du
critère de la racine de Cauchy, puisque
, - , -
8 91/k 8 9 r
lim sup |ck |r k
= r lim sup |ck | 1/k
= < 1.
q→∞ k≥q q→∞ k≥q R

La thèse résulte alors du test de comparaison de Weierstrass.


Etudions maintenant les propriétés de la somme d’une série entière sur
son disque de convergence, c’est-à-dire les propriétés de l’application F :
B2 (a; R) → C définie par

$
F (z) = ck (z − a)k .
k=0

Proposition. F est continue sur B2 (a; R).


Démonstration. Notons tout d’abord que chaque terme fk de la série
entière est un polynôme de C dans C et est donc continu sur C. Soit main-
tenant z ∈ B2 (a; R) fixé et r > 0 tel que |z − a| < r < R. Evidemment,
z ∈ int B2 [a; r] et, puisque la série converge uniformément sur B2 [a; r], sa
somme est continue sur cette boule et en particulier au point z.
12.5. SOMME D’UNE SÉRIE ENTIÈRE 455

Considérant maintenant la série entière comme une série de fonctions de


R2 dans R2 , nous pouvons étudier l’existence des dérivées partielles de sa
somme. Notons tout d’abord que chaque terme fk étant un polynôme sur
C, il sera C-dérivable en chaque point de C et vérifiera les conditions de
Cauchy-Riemann

D1 fk (z) = (1/i)D2fk (z) = fk$ (z) = kck (z − a)k−1 (12.5)

pour chaque z ∈ C et chaque k ∈ N∗ . On notera que le dernier terme de ces


égalités est le terme général de la série dérivée de la série entière de départ.
Proposition. En chaque point z ∈ B2 (a; R), la somme F de la série entière
%
k∈N ck (z − a) possède des dérivées partielles premières qui vérifient les
k

égalités

$
D1 F (z) = (1/i)D2F (z) = kck (z − a)k−1 .
k=1

Démonstration. Pour appliquer le théorème de dérivabilité de la somme


d’une série de fonctions, il suffit de remarquer que la série entière considé-
rée converge ponctuellement sur B2 (a; R), que chaque terme fk possède en
chaque point z ∈ C des dérivées partielles premières par rapport à toutes les
variables vérifiant les conditions (12.5) et que les séries des dérivées partielles
%
qui sont respectivement égales à la série dérivée de k∈N ck (z − a)k et au
produit de cette série par 1/i ont le même rayon de convergence R que la série
%
k∈N ck (z − a) et convergent donc normalement sur B2 [a; r] quel que soit
k

r ∈]0, R[. Dès lors, pour obtenir la dérivabilité partielle de F en z ∈ B2 (a; R),
%
il suffit d’appliquer le théorème général à la série k∈N ck (z −a)k sur l’ouvert
B2 (a, r) où r ∈]0, R[ est tel que |z − a| < r. On a aussitôt

$ ∞
$
D1 F (z) = D1 fk (z) = kck (z − a)k−1
k=1 k=1


, ∞
-
$ $
= (1/i)D2fk (z) = (1/i)D2 fk (z) = (1/i)D2F (z),
k=1 k=1

et la démonstration est complète.

Corollaire. En chaque point z ∈ B2 (a; R), la somme F de la série entière


%
k∈N ck (z−a) est% C-dérivable et sa C-dérivée F $ (z) est égale à la valeur en z
k

de la série dérivée ∞k=1 kck (z−a)


k−1 . La fonction F est dès lors indéfiniment
456 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS

C-dérivable et, pour chaque j ∈ N∗ , on a



$
F (j) (z) = k(k − 1) . . .(k − j + 1)ck (z − a)k−j .
k=j

Démonstration. C’est une conséquence immédiate de la Proposition


précédente, de la condition nécessaire et suffisante de C-dérivabilité de Fré-
chet-Young et du fait que le rayon de convergence reste le même quand on
passe d’une série entière à sa série dérivée.
Ainsi, la fonction exponentielle exp de C dans C définie pour chaque
z ∈ C comme somme de la série exponentielle de z est C-dérivable en chaque
point z de C et (exp)$ (z) = exp z. De même, la fonction sinus (resp. cosinus)
sin (resp. cos) de C dans C définie en chaque z ∈ C par la somme de la série
sinus (resp. cosinus) est C-dérivable en chaque z ∈ C et (sin)$ (z) = cos z
(resp. (cos)$ (z) = − sin z). Si α, β et γ sont des nombres complexes et si γ
n’est pas un entier strictement négatif, la somme de la série hypergéométrique
$ α(α + 1) . . . (α + k − 1)β(β + 1) . . .(β + k − 1)
1+ zk ,
k∈N∗
k!γ(γ + 1) . . .(γ + k − 1)
définit sur son disque de convergence B2 (0; 1) une fonction indéfiniment C-
dérivable que l’on appelle la fonction hypergéométrique et dont la valeur en
z ∈ B2 (0; 1) est notée F (α, β; γ; z).
Désignons par C(a; R) la frontière du disque B2 (a; R), c’est-à-dire l’en-
semble {z ∈ C : |z − a| = R}. Le résultat suivant, qui porte le nom de
théorème d’Abel, fournit des compléments d’information sur la conver-
gence d’une série entière et sur la régularité de sa somme lorsqu’il y a con-
vergence en un point de C(a; R).
%
Proposition. Si la série entière k∈N ck (z − a)k possède un rayon de con-
%
vergence R > 0 et s’il existe u ∈ C(a; R) tel que la série k∈N ck (u − a)k
%
converge, alors la série k∈N ck (.−a)k converge uniformément sur l’ensemble

[a, u] = {a + t(u − a) : t ∈ [0, 1]}

et, si F désigne sa somme sur B2 (a; R), alors



$
lim F (z) = ck (u − a)k .
z→u,z∈[a,u]\{u}
k=0

Démonstration. Pour démontrer la convergence uniforme de la série sur


[a, u], on utilise le critère de Cauchy et la transformation d’Abel. Si nous
12.5. SOMME D’UNE SÉRIE ENTIÈRE 457

%
posons, pour chaque q ∈ N, Sq = qk=0 ck (u − a)k , alors, en notant que
ck (u − a)k = Sk − Sk−1 pour k ≥ 1, nous obtenons, pour tout r > q ≥ 0,
r
$ r
$
ck [a + t(u − a) − a]k = ck tk (u − a)k
k=q+1 k=q+1

r
$ r
$ r
$
= tk (Sk − Sk−1 ) = tk Sk − tk Sk−1
k=q+1 k=q+1 k=q+1

r
$ r−1
$ r−1
$
= tk Sk − tk+1 Sk = Sk (tk − tk+1 ) + Sr tr − Sq tq+1
k=q+1 k=q k=q+1

r−1
$ r−1
$
= (Sk − Sq )(tk − tk+1 ) + Sq (tk − tk+1 ) + Sr tr − Sq tq+1
k=q+1 k=q+1

r−1
$ r−1
$ r−1
$
= (Sk − Sq )(tk − tk+1 ) + Sq tk − Sq tk+1 + Sr tr − Sq tq+1
k=q+1 k=q+1 k=q+1

r−1
$
= (Sk − Sq )(tk − tk+1 ) + (Sr − Sq )tr .
k=q+1
%
Par hypothèse, la suite (Sq )q∈N des sommes partielles de k∈N ck (u − a)k
converge et est donc de Cauchy; pour ! > 0 donné, il existe donc m ∈ N ne
dépendant que d’! tel que

|Sk − Sq | ≤ !/2

si k ≥ q ≥ m. Dès lors, en introduisant cette inégalité dans l’égalité ci-dessus


et en notant que 0 ≤ tk − tk+1 = tk (1 − t) ≤ 1 et 0 ≤ tr ≤ 1, on obtient
# #
# r # r−1
# $ # $
# ck [a + t(u − a) − a] # ≤
k#
|Sk − Sq |(tk − tk+1 ) + |Sr − Sq |tr
#
#k=q+1 # k=q+1

r−1
$
≤ (!/2) (tk − tk+1 ) + (!/2) = (!/2)(tq+1 − tr ) + (!/2)
k=q+1

= (!/2)[tq+1 (1 − tr−q−1 ) + 1] ≤ !.
458 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS

En conséquence, il existe m ∈ N tel que, pour tout r > q ≥ m et tout


z ∈ [a, u], on ait # #
# $ #
# r #
#
# c k (z − a) k#
# ≤ !,
#k=q+1 #

ce qui implique la convergence uniforme de la série entière sur [a, u]. La


restriction à [a, u] de chaque terme de la série y étant continue, l’application
%
G définie sur [a, u] par G(z) = k∈N ck (z − a)k sera continue sur [a, u]. Mais
comme [a, u] \ {u} ⊂ B2 (a; R), on a nécessairement G(z) = F (z) pour tout
z ∈ [a, u] \ {u}, et dès lors

$
ck (u − a)k = G(u) = lim G(z) =
z→u,z∈[a,u]
k=0

lim G(z) = lim F (z),


z→u,z∈[a,u]\{u} z→u,z∈[a,u]\{u}

et la démonstration est complète.

12.6 Equations différentielles linéaires


Les propriétés des séries entières permettent de rechercher des solutions de
certaines équations différentielles linéaires à coefficients variables. A titre
d’exemple, considérons l’équation différentielle d’Hermite

y $$ (z) − 2zy $ (z) + 2νy(z) = 0,

où ν est un nombre réel, et voyons si elle possède des solutions qui peuvent
s’écrire comme somme d’une série entière dont le disque de convergence n’est
pas réduit à un point. Si

$
y(z) = ck z k
k=0
est une telle solution, alors on aura, par les résultats de la section précédente,

$ ∞
$
y $ (z) = kck z k−1 , y $$ (z) = (k − 1)kck z k−2 ,
k=1 k=2

et, en introduisant ces expressions dans l’équation on obtient



$ ∞
$ ∞
$
(k − 1)kck z k−2 − 2 kck z k + 2ν ck z k = 0,
k=2 k=1 k=0
12.6. EQUATIONS DIFFÉRENTIELLES LINÉAIRES 459

c’est-à-dire, en regroupant les coefficients des termes de même puissance de


z,

$
2(c2 + νc0 ) + [(k + 1)(k + 2)ck+2 − 2(k − ν)ck ]z k = 0.
k=1

Cette relation sera évidemment satisfaite si les ck sont tels que

(k + 1)(k + 2)ck+2 = 2(k − ν)ck , (k ∈ N).

Partant d’un c0 arbitraire et résolvant de proche en proche, on obtient

2k (−ν)(2 − ν)(4 − ν) . . . (2k − 2 − ν)


c2k = c0 , (k ∈ N∗ )
(2k)!
et
2k (1 − ν)(3 − ν) . . . (2k − 1 − ν)
c2k+1 = c1 , (k ∈ N∗ ).
(2k + 1)!
Posant u = z 2 , il est facile de voir que ces deux séries convergent pour tout
z ∈ C. Par conséquent, les calculs précédents sont justifiés pour ces séries et
chaque fonction de la forme cj yj où cj ∈ C est arbitraire et, j = 1, 2, y1 est
la somme de la série entière
∞ k
$ 2 (−ν)(2 − ν)(4 − ν) . . . (2k − 2 − ν)
y1 (z) = 1 + z 2k
k=1
(2k)!

et y2 est la somme de la série entière


∞ k
$ 2 (1 − ν)(3 − ν) . . . (2k − 1 − ν)
y2 (z) = 1 + z 2k+1 ,
k=1
(2k + 1)!

est une solution de l’équation différentielle donnée définie sur C. Il en est


dès lors de même pour c1 y1 + c2 y2 . Lorsque ν est un entier positif, il est
immédiat que l’une des fonctions yj se réduit à un polynôme en z, que l’on
appelle polynôme d’Hermite et qui joue un grand rôle en analyse.
La méthode peut encore fournir des solutions de ce type pour des équa-
tions différentielles linéaires singulières en 0, c’est-à-dire dont le coefficient
de la dérivée d’ordre le plus élevé s’annule en z = 0. Par exemple, si a et b
sont des nombres complexes tels que a ne soit pas nul et b ne soit pas égal à
un entier négatif, considérons l’équation différentielle

zy $$ (z) + (b − z)y $ (z) − ay(z) = 0


460 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS

et recherchons ses solutions pouvant s’écrire sous la forme de la somme d’une


série entière

$
y(z) = ck z k .
k=0
Procédant comme ci-dessus, on trouve, en introduisant cette expression dans
l’équation différentielle et en regroupant les coefficients des mêmes puissances
de z que l’on doit avoir

$
[(k + 1)(k + b)ck+1 − (k + a)ck ]z k = 0,
k=0

ce qui sera le cas si les coefficients ck vérifient les relations


a+k
ck+1 = ck , k ∈ N,
(b + k)(k + 1)
qui fournissent aisément l’expression
(a + k − 1)(a + k − 2) . . .a
ck = c 0 , k ∈ N∗ .
k!(b + k − 1)(b + k − 2) . . . b
On vérifie aisément que la série entière
$ (a + k − 1)(a + k − 2) . . .a
zk
k∈N
k!(b + k − 1)(b + k − 2) . . . b

a un disque de convergence égal à C et dès lors sa somme, que l’on appelle


la fonction hypergéométrique confluente de Kummer et que l’on désigne par
M (a, b; z) est telle que, pour chaque c ∈ C, cM (a, b; ·) est une solution sur
C de l’équation différentielle donnée.
On peut montrer de la même manière que, pour chaque n ∈ N fixé,
l’équation différentielle de Bessel
z 2 y $$ (z) + zy $ (z) + (z 2 − n2 )y(z) = 0
possède les solutions cy où c ∈ C est arbitraire et y est la somme de la série
entière
$ (−1)k
z n+2k ,
k∈N
2 n+2k k!(n + k)!

dont le disque de convergence est égal à C. La fonction définie par la somme


de cette série entière s’appelle la fonction de Bessel d’ordre n et se note Jn .
On vérifiera aisément qu’on a la relation
J0$ (z) = −J1 (z).
12.7. SOMME D’UNE SÉRIE TRIGONOMÉTRIQUE 461

Les fonctions de Bessel jouent un grand rôle en analyse et dans ses applica-
tions à la physique.
Une équation différentielle linéaire importante est l’équation hypergéo-
métrique de Gauss

z(1 − z)y $$ (z) + [γ − (α + β + 1)z]y $ (z) − αβy(z) = 0

où α, β et γ sont des nombres complexes. La méthode que nous venons de


développer permet de montrer que si γ n’est pas un entier négatif, la somme
F (α, β; γ; z) de la série hypergéométrique
$ α(α + 1) . . . (α + k − 1)β(β + 1) . . .(β + k − 1)
1+ zk ,
k∈N∗
k!γ(γ + 1) . . .(γ + k − 1)

est solution, sur son disque de convergence B2 (0, 1), de l’équation hypergéo-
métrique de Gauss. En fait, pour des valeurs particulières de α, β et γ, la
série hypergéométrique fournit comme cas particulier ou comme cas limite
la plupart des fonctions élémentaires et de nombreuses fonctions transcen-
dantes comme par exemple les fonctions de Bessel et les fonctions de Kum-
mer considérées plus haut. Carl-Friedrich Gauss a démontré l’importante
formule
Γ(γ)Γ(γ − α − β)
F (α, β, γ; 1) = , si 8(γ − α − β) > 0,
Γ(γ − α)Γ(γ − β)
reliant la valeur de la somme de la série hypergéométrique au point 1 de la
frontière de son disque de convergence à la fonction Γ.

12.7 Somme d’une série trigonométrique


On a vu précédemment qu’une série trigonométrique est une série de la forme
$
(ak cos kx + bk sin kx)
k∈N

où x ∈ R et les ak et bk sont des nombres réels. Bien entendu, une série
trigonométrique peut également s’écrire sous la forme complexe
$
[c−k exp(−ikx) + ck exp ikx]
k∈N

avec
c−k = (1/2)(ak + ibk ) = ck , k ∈ N,
462 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS

ce qui conduit aussi à considérer les séries trigonométriques complexes quel-


conques $
[c−k exp(−ikx) + ck exp ikx]
k∈N
où les c−k et ck sont des nombres complexes arbitraires. On a vu que
de telles séries trigonométriques apparaissaient lorsqu’on étudiait la con-
vergence d’une série entière sur la frontière de son disque de convergence.
Une série trigonométrique peut évidemment être considérée comme une série
%
de fonctions k∈N fk où les fonctions fk définies par
fk (x) = c−k exp(−ikx) + ck exp ikx
sont indéfiniment dérivables et 2π-périodiques sur R, c’est-à-dire telles que
fk (x + 2π) = fk (x)
pour tout x ∈ R. On ne dispose pas, comme pour les séries entières, de
résultat général pour la convergence uniforme des séries trigonométriques.
Toutefois, les résultats généraux sur la continuité et la dérivabilité des som-
mes de séries de fonctions fournissent les conditions suffisantes suivantes.
% %
Proposition. Si la série numérique k∈N(|ak | + |bk |) (resp. k∈N (|c−k | +
|ck |) converge, alors la série de fonctions
$
[ak cos(k·) + bk sin(k·)]
k∈N

(resp. $
[c−k exp(−ik·) + ck exp(ik·)])
k∈N
converge normalement sur R et sa somme est une fonction continue et 2π-
périodique sur R.
Démonstration. Si nous considérons, pour fixer les idées, le premier cas,
l’autre se traitant de même, nous voyons que, pour chaque k ∈ N et chaque
x ∈ R, on a
|fk (x)| = |ak cos kx + bk sin kx| ≤ |ak | + |bk |,
et la convergence normale sur R découle de l’hypothèse et du test de com-
paraison de Weierstrass. Comme la convergence normale entraı̂ne la con-
vergence uniforme sur R de la série et que chaque fk est continue sur R, sa
somme sera également continue sur R. Enfin, la convergence ponctuelle sur
R et les égalités Fq (x + 2π) = Fq (x) valables pour chaque x ∈ R et chaque
somme partielle Fq entrainent la propriété de 2π-périodicité pour la somme
de la série.
12.7. SOMME D’UNE SÉRIE TRIGONOMÉTRIQUE 463

Exemple. Pour chaque réel s > 1, la série trigonométrique


$
k−s [cos(k·) + sin(k·)]
k∈N∗

converge normalement sur R vers une fonction continue et 2π-périodique.


On a la condition suffisante suivante de dérivabilité de la somme d’une
série trigonométrique.
Proposition. S’il existe un entier m ≥ 1 tel que la série numérique
$
km (|ak | + |bk |)
k∈N

(resp. $
km (|c−k | + |ck |))
k∈N
converge, alors la somme F de la série trigonométrique
$
[ak cos(k·) + bk sin(k·)]
k∈N

(resp. $
[c−k exp(−ik·) + ck exp(ik·)])
k∈N
est m-fois continûment dérivable sur R et, pour chaque x ∈ R, et chaque
1 ≤ j ≤ m, la dérivée j-ème s’obtient en dérivant j fois sous le signe somme.
Démonstration. Il est aisé de voir que le résultat pour m ≥ 2 découle
aisément, par récurrence, du résultat pour m = 1 et il suffit de démontrer ce
dernier. Nous le ferons dans le cas d’une série trigonométrique réelle. Pour
chaque k ∈ N, et chaque x ∈ R, on a
|fk$ (x)| = | − kak sin kx + kbk cos kx| ≤ k(|ak | + |bk |),
et un argument semblable à celui de la Proposition précédente montre que la
%
série k∈N fk$ converge normalement sur R et que sa somme est une fonction
continue. D’ailleurs, comme
|ak | + |bk | ≤ k(|ak | + |bk |)
%
pour tout k ∈ N , la Proposition précédente montre que la série k∈N fk

converge aussi normalement sur R. Les conditions du théorème de dérivabi-


lité de la somme d’une série de fonctions sont donc satisfaites. Donc F est
dérivable sur R et

$
F $ (x) = fk$ (x),
k=0
464 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS

ce qui montre que F est continûment dérivable et achève la démonstration.

Exemple. Si s > 2, la somme de la série trigonométrique


$
k−s [cos(k·) + sin(k·)]
k∈N∗

est m-fois continûment dérivable sur R, où m désigne la partie entière de


s − 1.

12.8 Convergence monotone


Soit (fk )k∈N une suite de fonctions réelles définies sur E ⊂ Rn .
Définition. On dit que (fk )k∈N est une suite croissante (resp. décroissante)
sur E de fonctions réelles si, pour chaque x ∈ E, la suite réelle (fk (x))k∈N est
croissante (resp. décroissante), c’est-à-dire si, pour chaque x ∈ E et chaque
k ∈ N, on a
fk+1 (x) ≥ fk (x). (resp. fk+1 (x) ≤ fk (x)).
Une suite de fonctions réelles sur E qui est croissante ou qui est dé-
croissante est appelée une suite monotone sur E de fonctions réelles. Bien
entendu, (fk )k∈N est croissante si et seulement si (−fk )k∈N est décroissante.
Définition. On dit que (fk )k∈N est une suite majorée (resp. minorée) sur
E de fonctions réelles s’il existe une application g de E dans R telle que,
pour chaque k ∈ N et chaque x ∈ E, on ait

fk (x) ≤ g(x). (resp. fk (x) ≥ g(x)).

Il est clair que (fk )k∈N est minorée sur E si et seulement si (−fk )k∈N est
majorée sur E et que (fk )k∈N est majorée (resp. minorée) sur E si et seule-
ment si la suite réelle (fk (x))k∈N est majorée (resp. minorée) pour chaque
x ∈ E. En combinant cette remarque à la condition nécessaire et suffisante
de convergence d’une suite réelle monotone, on obtient immédiatement un
critère de convergence ponctuelle d’une suite monotone de fonctions réelles.
Proposition. Une suite croissante (resp. décroissante) sur E de fonctions
réelles converge ponctuellement sur E si et seulement si elle est majorée
(resp. minorée) sur E.
On a vu plus haut que la convergence uniforme sur un ensemble était
une condition suffisante pour que la continuité des fonctions de la suite se
12.8. CONVERGENCE MONOTONE 465

transmette à la fonction limite. L’exemple de la suite (fk )k∈N de fonctions


continues définies par
1
fk (x) =
1 + (x − k)2
qui converge ponctuellement (mais non uniformément) sur R vers la fonction
continue zéro montre que la convergence uniforme n’est pas nécessaire pour
que la limite soit continue. Le théorème de Dini ou théorème de con-
vergence monotone pour les fonctions continues montre que lorsque
E est fermé borné et que la suite est monotone, la convergence uniforme
est une condition nécessaire et suffisante pour que la limite d’une suite de
fonctions continues sur E soit continue sur E.
Théorème. Soit E ⊂ Rn un fermé borné, (fk )k∈N une suite de fonctions
réelles définies sur E et f une application de E dans R vérifiant les conditions
suivantes.
1. La suite (fk )k∈N converge ponctuellement sur E vers f .
2. Chaque fonction fk est continue sur E.
3. La suite (fk )k∈N est monotone sur E.
Alors f est continue sur E si et seulement si (fk )k∈N converge uniformément
sur E vers f .
Démonstration. Condition suffisante. C’est une conséquence immédiate
de la préservation de la continuité par la convergence uniforme.
Condition nécessaire. On peut, sans perte de généralité, supposer que
(fk )k∈N est croissante. On a donc fq (x) ≥ fk (x), pour chaque entier q ≥
k et chaque x ∈ E, ce qui entraı̂ne, en faisant tendre q vers l’infini, que
f (x) ≥ fk (x) pour chaque entier k ∈ N et chaque x ∈ E. Si ! > 0 est donné,
l’hypothèse 1 entraı̂ne que
(∀x ∈ E)(∃m ∈ N)(∀k ∈ N : k ≥ m) : 0 ≤ f (x) − fk (x) ≤ !/2. (12.6)
Pour chaque x ∈ E, désignons par m(x) le plus petit entier positif m pour
lequel la condition (12.6) est satisfaite.
L’hypothèse 2, la continuité de f sur E, le caractère fermé borné de E et
le théorème de Heine entraı̂nent la continuité uniforme de chaque fonction
f − fk sur E. En conséquence,
(∀k ∈ N)(∃δk > 0)(∀x ∈ E)(∀y ∈ E : |y − x|∞ ≤ δk ) :
0 ≤ f (y) − fk (y) ≤ f (x) − fk (x) + !/2. (12.7)
Si nous définissons la jauge δ sur E par la relation
δ(x) = δm(x) , x ∈ E,
466 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS
A B
le théorème de Cousin entraı̂ne l’existence d’une division (xj , E j ) (1≤j≤q)
telle que
q
>
E j = E, xj ∈ E j ⊂ B∞ [xj ; δ(xj )] = B∞ [xj ; δm(xj ) ], 1 ≤ j ≤ q.
j=1

Posons
m = max m(xj ),
1≤j≤q

et soit y ∈ E. Il existe donc un entier j compris entre 1 et q tel que y ∈ E j et


donc tel que y ∈ B∞ [xj ; δm(xj ) ]. En conséquence, en utilisant (12.6), (12.7)
et la croissance de (fk )k∈N , on trouve, pour tout k ≥ m,

0 ≤ f (y) − fk (y) ≤ f (y) − fm(xj ) (y) ≤ f (xj ) − fm(xj ) (xj ) + !/2

≤ !/2 + !/2 = !,
et la démonstration est complète.
%
En se rappelant que la suite des sommes partielles d’une série k∈N fk de
fonctions fk positives sur un ensemble E dès que k ≥ 1 est nécessairement
croissante sur E, on a évidemment une formulation du théorème de Dini
pour ce type de séries.
%
Corollaire. Soit E ⊂ Rn un fermé borné, k∈N fk une série de fonctions
définies sur E et F une application de E dans R vérifiant les conditions
suivantes.
%
1. La série k∈N fk converge ponctuellement sur E vers F .
2. Chaque fonction fk est continue sur E.
3. fk est positive sur E pour chaque k ≥ 1.
%
Alors F est continue sur E si et seulement si k∈N fk converge uniformément
sur E vers F .
On possède, pour une suite monotone de fonctions intégrables, un théorè-
me dont la forme est analogue à celle du théorème de Dini. C’est l’important
théorème de Levi ou théorème de convergence monotone pour les
fonctions intégrables.
Théorème. Soit I ⊂ Rn un semi-pavé, (fk )k∈N une suite de fonctions réelles
définies sur I¯ et f une application de I¯ dans R vérifiant les conditions sui-
vantes.
1. La suite (fk )k∈N converge ponctuellement sur I¯ vers f .
2. Chaque fonction fk est intégrable sur I. ¯
12.8. CONVERGENCE MONOTONE 467

3. La suite (fk )k∈N est monotone sur I. ¯


H
¯
Alors f est intégrable sur I si et seulement si la suite réelle ( I¯ fk )k∈N con-
verge, auquel cas l’on a
J J
f = lim fk ,
I¯ k→∞ I¯

c’est-à-dire J J
lim fk = lim fk .
I¯ k→∞ k→∞ I¯

Démonstration. Sans perte de généralité, on peut supposer que la suite


¯ auquel cas on a évidemment
(fk )k∈N est croissante sur I,

fk (x) ≤ fk+1 (x) ≤ f (x)

pour chaque k ∈ N et chaque x ∈ I. ¯


¯ l’inégalité ci-dessus en-
Condition nécessaire. Si f est intégrable sur I,
traı̂ne aussitôt que
J J J
fk ≤ fk+1 ≤ f.
I¯ I¯ I¯
H
Dès lors, la suite réelle ( I¯ fk )k∈N , croissante et majorée, est convergente.
H
Condition suffisante. Par hypothèse, la suite réelle ( I¯ fk )k∈N est crois-
sante et convergente, et nous poserons
J
J = lim fk .
k→∞ I¯

Il faut donc démontrer que f est intégrable sur I¯ et que son intégrale vaut
J. En d’autres termes, ! > 0 étant donné, il faut construire une jauge δ sur
I¯ pour laquelle la définition d’intégrabilité sur I¯ est satisfaite pour f .
Soit donc ! > 0 donné. Il existera un entier naturel q1 tel que, pour tout
entier k ≥ q1 , on ait
J
0≤J− fk ≤ !/3.

D’autre part, puisque la suite (fk )k∈N converge ponctuellement sur I¯ vers f ,
on aura

¯
(∀x ∈ I)(∃q(x) ∈ N, q(x) ≥ q1 )(∀k ∈ N : k ≥ q(x)) :
!
|fk (x) − f (x)| ≤ . (12.8)
3µ(I)
468 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS

Si maintenant Π = {(x1 , I 1), . . . , (xm, I m)} est une P-partition quelconque


de I, on aura
# #
#m #
#$ #
|S(I, f, Π) − J| ≤ ## [f (x ) − fq(xj ) (x )]µ(I )##
j j j
#j=1 #
# # # #
#m 2 J 3# # $ m J #
#$ # # #
+ ## fq(xj ) (xj )µ(I j ) − fq(xj ) ## + ## fq(xj ) − J ## .
#j=1 I¯j # #j=1 I¯j #

Comme
# #
#$ # $
#m # m
# [f (x ) − f j (x )]µ(I )# ≤
j j j
|f (xj ) − fq(xj ) (xj )|µ(I j )
# q(x ) #
#j=1 # j=1

m
! $
≤ µ(I j ) = !/3
3µ(I) j=1
et que, si
r = min q(xj ), s = max q(xj ),
1≤j≤m 1≤j≤m

on a q1 ≤ r ≤ s et donc, en utilisant la croissance de (fk )k∈N,


J m J
$
0≤J− fs = J − fs
I¯ ¯j
j=1 I

m J
$ m J
$ J
≤J− fq(xj ) ≤ J − fr = J − fr ≤ !/3,
¯j ¯j I¯
j=1 I j=1 I

on obtient
# #
#m 2 J 3#
#$ #
|S(I, f, Π) − J| ≤ 2!/3 + ## fq(xj ) (xj )µ(I j ) − fq(xj ) ## .
#j=1 I¯j #

Il nous reste maintenant à construire une jauge δ sur I¯ telle que le dernier
terme de l’inégalité soit majoré par !/3 lorsque la P-partition Π est δ-fine.
Pour ce faire, notons que si nous groupons dans la somme ci-dessus les termes
pour lesquels les q(xj ) sont égaux à une même valeur k, nous obtenons,
# #
#m 2 J 3#
#$ #
#
# fq(xj ) (xj )µ(I j ) − fq(xj ) ##
#j=1 I¯j #
12.8. CONVERGENCE MONOTONE 469
#  #
# s  2 J 3#
#$ $ #
= ## fk (xj )µ(I j ) − fk ##

#k=r {1≤j≤m : q(xj )=k} I¯j  #
# #
$s ## $ 2 J 3#
#
≤ #
# fk (xj )µ(I j ) − fk ## .
¯
k=r #{1≤j≤m : q(xj )=k} #
I j

Puisque chaque somme partielle regroupe tous les indices q(xj ) ayant la
même valeur k, on peut lui appliquer le lemme de Saks-Henstock relatif à la
¯ il existera
fonction fk . Comme, pour chaque k ∈ N, fk est intégrable sur I,
une jauge ηk sur I¯ telle que
# J #
#S(I, fk , Πk ) − fk # ≤ 1
# #
# ¯ # 2k
I

pour toute P-partition ηk -fine Πk de I. Choisissons un entier positif q2 tel


que
l
$ 1
≤ !/3
j=k
2j

dès que l ≥ k ≥ q2 . C’est toujours possible en vertu du critère de Cauchy


%
appliqué à la série géométrique convergente k∈N (1/2)k. Choisissons main-
tenant, pour chaque x ∈ I, ¯ le plus petit entier q(x) ≥ max(q1 , q2 ) qui vérifie
la relation (12.8) et définissons la jauge δ sur I¯ par la relation

¯
δ(x) = ηq(x)(x), x ∈ I.

Si la P-partition Π = {(x1 , I 1), . . . , (xm, I m)} est δ-fine, alors chaque famille
{(xj , I j ) : q(xj ) = k, 1 ≤ j ≤ m} sera telle que

I j ⊂ B∞ [xj ; δ(xj )] = B∞ [xj ; ηq(xj ) (xj )] = B∞ [xj ; ηk (xj )],

et, par le lemme de Saks-Henstock, on aura


# #
# 2 J 3#
# $ #
# fq(xj )(x )µ(I ) −
j j
fq(xj ) ##
#
#{1≤j≤m : q(xj )=k} I¯j #

# #
# 2 J 3#
# $ # 1
= ## fk (x )µ(I ) −
j j
fk ## ≤ k ,
#{1≤j≤m : q(xj )=k} I¯j # 2
470 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS

et par conséquent,
# #
$s # $ 2 J 3#
# #
#
# fq(xj ) (xj )µ(I j ) − fq(xj ) ##
k=r #{1≤j≤m : q(xj )=k} I¯j #
s
$ 1
≤ ≤ !/3.
k=r
2k
On aura donc
|S(I, f, Π) − J| ≤ 2!/3 + !/3 = !,
dès que Π est δ-fine.
Le théorème de Levi est vrai pour la L-intégrabilité.
Corollaire. Soit I ⊂ Rn un semi-pavé, (fk )k∈N une suite de fonctions réelles
définies sur I¯ et f une application de I¯ dans R vérifiant les conditions sui-
vantes.
1. La suite (fk )k∈N converge ponctuellement sur I¯ vers f .
2. Chaque fonction fk est L-intégrable sur I.¯
3. La suite (fk )k∈N est monotone sur I.¯
H
Alors f est L-intégrable sur I¯ si et seulement si la suite réelle ( I¯ fk )k∈N
converge, auquel cas l’on a
J J
f = lim fk ,
I¯ k→∞ I¯
c’est-à-dire J J
lim fk = lim fk .
I¯ k→∞ k→∞ I¯
Démonstration. Supposons pour fixer les idées que (fk )k∈N soit croissante
sur I.¯ La condition nécessaire se démontre exactement de la même manière.
Pour la condition suffisante, notons tout d’abord que la croissance de la suite
(fk )k∈N entraı̂ne la positivité des fonctions fk − f0 . D’autre part, la suite
(fH k − f0 )k∈N vérifie les conditions 1 àH3 du théorème de Levi et la suite réelle
( I¯(fk − f0 ))k∈N converge vers J − I¯ f0 . Le théorème de Levi appliqué à
cette suite entraı̂ne l’intégrabilité de sa limite f − f0 qui est une fonction
positive sur I. ¯ Donc f − f0 est L-intégrable sur I¯ et comme f0 l’est aussi
par hypothèse, il en est de même de f = (f − f0 ) + f0 .
En remarquant que les sommes partielles d’une série de fonctions fk
intégrables sur I¯ forment une suite croissante de fonctions intégrables sur I¯ si
elles sont positives pour k ≥ 1, on déduit facilement des résultats précédents
un théorème de convergence monotone de Levi pour les séries de
fonctions intégrables positives.
12.8. CONVERGENCE MONOTONE 471

%
Corollaire. Soit I ⊂ Rn un semi-pavé, k∈N fk une série de fonctions
réelles définies sur I¯ et F une application de I¯ dans R vérifiant les con-
ditions suivantes.
%
1. La série k∈N fk converge ponctuellement sur I¯ vers F .
2. Chaque fonction fk est intégrable (resp. L-intégrable) sur I.¯
3. fk est positive sur I¯ pour chaque k ≥ 1.
Alors F est Hintégrable (resp. L-intégrable) sur I¯ si et seulement si la série
%
réelle k∈N I¯ fk converge, auquel cas l’on a
J ∞ J
$
F = fk ,
I¯ ¯
k=0 I

c’est-à-dire J $
∞ ∞ J
$
fk = fk .
I¯ k=0 ¯
k=0 I

On a également un théorème de convergence monotone de Levi


pour l’intégrabilité sur un intervalle non borné de R.
Corollaire. Soit U un intervalle non borné de R, (fk )k∈N une suite de fonc-
tions réelles définies sur U et f une application de U dans R vérifiant les
conditions suivantes.
1. La suite (fk )k∈N converge ponctuellement sur U vers f .
2. Chaque fonction fk est intégrable sur U .
3. La suite (fk )k∈N est monotone sur U . H
Alors f est intégrable sur U si et seulement si la suite réelle ( U fk )k∈N
converge, auquel cas l’on a
J J
f = lim fk ,
U k→∞ U

c’est-à-dire J J
lim fk = lim fk .
U k→∞ k→∞ U

Démonstration. Sans perte de généralité, on peut supposer que la suite


(fk )k∈N est croissante sur U et, en considérant (fk −f0 )k∈N au lieu de (fk )k∈N,
on peut supposer que chaque fonction fk est positive sur U . Enfin, on se
limitera au cas où U = [a, +∞[, les autres se traitant de même. La condi-
tion nécessaire se démontre comme dans le cas classique. Pour la condition
suffisante, il faut donc prouver que f Hest intégrable sur [a,H b] pour chaque
b > a et que, si l’on pose J = limk→∞ U fk , alors limb→+∞ ab f = J.
472 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS

H
Soit donc b > a;Hla suite réelle ( ab fk )k∈N est croissante et majorée par la
suite convergente ( U fk )k∈N, donc est convergente, et le théorème de Levi
appliqué à la restriction à [a, b] de la suite (fk )k∈N entraı̂ne son intégrabilité
sur [a, b] et la relation
J b J b
f = lim fk . (12.9)
a k→∞ a

Pour chaque k ∈ N, l’intégrale indéfinie de fk est croissante sur U , puisque


fk est positive sur U , et dès lors, pour tout b > a, on a
J b J b J
fk ≤ lim fk = fk ,
a b→+∞ a U

ce qui implique, par (12.9), que, pour tout b > a, on a


J b J
f ≤ lim fk = J. (12.10)
a k→∞ U

Par conséquent, l’intégrale indéfinie de f , croissante sur U puisque f y est


positive, est majorée, et possède donc une limite inférieure ou égale à J.
Donc f est intégrable sur U et, pour tout b > a, on a
J b J
f≤ f ≤ J. (12.11)
a U

Il reste à montrer qu’on a en fait l’égalité. Soit ! > 0; comme


J & J '
b
J = lim fk = lim lim fk ,
k→∞ U k→∞ b→+∞ a

il existera r ∈ N tel que


J b
J − (!/2) ≤ lim fk ≤ J
b→+∞ a

dès que k ≥ r. En particulier, il existera c ∈ U tel que, pour tout b ≥ c, on


a J b
J −! ≤ fr ≤ J.
a
H
Comme la suite ( ab fk )k∈N est croissante et majorée par J, on aura donc,
pour tout k ≥ r et tout b ≥ c,
J b
J −! ≤ fk ≤ J,
a
12.9. CONVERGENCE MAJORÉE ET MINORÉE 473

ce qui implique, en faisant tendre k vers l’infini, et en utilisant (12.9), que


J b
J −! ≤ f ≤J
a

dès que b ≥ c, et la démonstration est complète.


Nous laisserons au lecteur le soin de formuler le résultat correspondant
pour une série de fonctions.

12.9 Convergence majorée et minorée


On a vu dans la section précédente que la convergence ponctuelle sur E d’une
suite monotone sur E de fonctions réelles pouvait se caractériser en termes
de majoration ou de minoration sur E. Nous allons démontrer dans cette
section un important résultat sur la conservation de l’intégrabilité (ou de
la L-intégrabilité) de la limite d’une suite de fonctions intégrables qui n’est
plus nécessairement monotone mais est maintenant minorée et majorée sur
E.
La démonstration de ce résultat repose sur le théorème de Levi et sur
une étude préliminaire de la conservation de l’intégrabilité par passage au
maximum ou au minimum de deux fonctions réelles intégrables. Rappelons
que si f et g sont deux fonctions réelles, les fonctions max(f, g) et min(f, g)
sont les fonctions réelles de domaine dom f ∩ dom g définies respectivement
par

max(f, g)(x) = max(f (x), g(x)), min(f, g)(x) = min(f (x), g(x)),

et que l’extension se fait facilement, de proche en proche, à un nombre fini


quelconque de fonctions. On vérifie facilement qu’on a aussi

max(f, g) = (1/2)(f + g + |f − g|), min(f, g) = (1/2)(f + g − |f − g|).

En particulier,
min(f, g) = − max(−f, −g),
et dès lors, si f et g sont intégrables sur un pavé fermé,

min(f, g)

le sera si et seulement si
max(f, g)
474 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS

l’est. On ne peut pas espérer que le maximum et le minimum de deux fonc-


tions intégrables mais non L-intégrables sur un pavé fermé soient toujours
intégrables sur ce pavé fermé, puisqu’un tel resultat appliqué à une fonc-
tion f intégrable mais non L-intégrable et à la fonction g = 0 entraı̂nerait
l’intégrabilité de |f | = max(f, 0) − min(f, 0). Par contre, ces opérations
préservent toujours la L-intégrabilité.

Proposition. Si I est un semi-pavé de Rn et f et g des fonctions réelles


¯ alors max(f, g) et min(f, g) sont L-intégrables sur I.
L-intégrables sur I, ¯

Démonstration. Par hypothèse, f + g et f − g sont L-intégrables sur I¯


et donc |f − g| l’est aussi. La thèse résulte alors des formules ci-dessus.

On en déduit aisément une condition suffisante pour que l’intégrabilité


soit préservée.

Proposition. Si I est un semi-pavé de Rn et f, g et h sont des fonctions


réelles intégrables sur I¯ telles que f et g soient toutes deux minorées ou
majorées par h sur I, ¯ alors max(f, g) et min(f, g) sont intégrables sur I¯ et
J 4J J 5 J 4J J 5
max(f, g) ≥ max f, g , min(f, g) ≤ min f, g .
I¯ I¯ I¯ I¯ I¯ I¯

Démonstration. Par hypothèse, f − h et g − h sont de signe constant et


intégrables sur I¯ et y sont donc L-intégrables. Il en est dès lors de même,
par la proposition précédente, pour max(f − h, g − h) = max(f, g) − h et
min(f − h, g − h) = min(f, g) − h, ce qui entraı̂ne aussitôt l’intégrabilité sur
I¯ de max(f, g) et min(f, g).

Les deux propositions ci-dessus s’étendent immédiatement à un nombre


fini de fonctions et au cas de l’intégrale sur un intervalle non borné.

Définition. Si f est une fonction réelle, on définit la partie positive f + de


f par f + = max(f, 0) et la partie négative f − de f par f − = max(−f, 0) =
− min(f, 0).

En conséquence, f + et f − sont deux fonctions positives telles que

f = f + − f − , |f | = f + + f − , f + = (1/2)(|f | + f ), f − = (1/2)(|f | − f ).

Ces formules fournissent une intéressante caractérisation de la L-intégra-


bilité pour les fonctions réelles.
12.9. CONVERGENCE MAJORÉE ET MINORÉE 475

Proposition. Soit I un semi-pavé de Rn et f une fonction réelle définie sur


¯ Alors f est L-intégrable sur I¯ si et seulement si f + et f − sont intégrables
I.
¯
sur I.
Démonstration. Cela résulte des égalités |f | = f + 2f − = 2f + − f et de
la définition de L-intégrabilité.

Corollaire. Soit I un semi-pavé de Rn et f une fonction réelle définie sur


¯ Si f est intégrable sur I¯ et n’est pas L-intégrable sur I,
I. ¯ alors f + et f −
¯
ne sont pas intégrables sur I.
Nous pouvons maintenant énoncer et démontrer l’important théorème
de Lebesgue ou théorème de convergence majorée et minorée pour
les suites de fonctions réelles intégrables.
Théorème. Soit I un semi-pavé de Rn , (fk )k∈N une suite de fonctions
réelles définies sur I¯ et f une application de I¯ dans R. Supposons satis-
faites les conditions suivantes.
1. La suite (fk )k∈N converge ponctuellement sur I¯ vers f .
2. Chaque fonction fk est intégrable sur I. ¯
3. Il existe des fonctions réelles g et h intégrables sur I¯ et telles que

g(x) ≤ fk (x) ≤ h(x)

pour chaque k ∈ N et chaque x ∈ I. ¯


Alors f est intégrable sur I¯ et l’on a
J J
f = lim fk ,
I¯ k→∞ I¯

c’est-à-dire J J
lim fk = lim fk .
I¯ k→∞ k→∞ I¯

Démonstration. k et q étant des entiers naturels, posons

φk,q = min(fk , fk+1 , . . ., fk+q ), Φk,q = max(fk , fk+1 , . . . , fk+q ).

En vertu des hypothèses 2 et 3 et de la discussion qui précède, φk,q et Φk,q


sont intégrables sur I¯ pour chaque entier naturel k et q et, par construction,
on a, pour tout k, tout q ≥ 1 et tout x ∈ I, ¯

g(x) ≤ φk,q+1 (x) ≤ φk,q (x) ≤ φk+1,q−1 (x) ≤ fk+1 (x)


≤ Φk+1,q−1 (x) ≤ Φk,q (x) ≤ Φk,q+1 (x) ≤ h(x). (12.12)
476 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS

Dès lors, pour chaque k ∈ N fixé, la suite de fonctions réelles (φk,q )q∈N (resp.
(Φk,q )q∈N) est décroissante et minorée (resp. croissante et majorée) sur I, ¯ et
¯
elle converge donc ponctuellement sur I vers une application φk (resp. Φk )
de I¯ dans R. On déduit de (12.12), en faisant tendre q vers l’infini, que l’on
a

g(x) ≤ φk (x) ≤ φk+1 (x) ≤ fk+1 (x) ≤ Φk+1 (x) ≤ Φk (x) ≤ h(x), (12.13)

pour chaque x ∈ I¯ et chaque k ∈ N. D’ailleurs, par intégration sur I¯


des
H
inégalités (12.12),
H
on voit que, pour chaque k ∈ N fixé, la suite
H
réelle
( I¯ φk,q )q∈N (resp. ( I¯ Φk,q )Hq∈N) est décroissante et minorée par I¯ g (resp.
croissante et majorée par I¯ h), et est donc convergente. On peut donc
appliquer le théorème de convergence monotone de Levi aux deux suites
(φk,q )q∈N et (Φk,q )q∈N et en déduire, pour chaque k ∈ N, l’intégrabilité sur I¯
de φk et Φk et les relations
J J J J
lim φk,q = φk , lim Φk,q = Φk . (12.14)
q→∞ I¯ I¯ q→∞ I¯ I¯

D’autre part, la relation (12.13) montre que la suite de fonctions (φk )k∈N
(resp. (Φk )k∈N) est croissante et majorée par h (resp. décroissante et minorée
par g), et donc ponctuellement convergente, sur I. ¯ En fait, on a, pour chaque
¯
x ∈ I,

lim φk (x) = lim Φk (x) = lim fk (x) = f (x), (12.15)


k→∞ k→∞ k→∞

¯ l’hypothèse 1 entraı̂ne l’existence


puisque, si ! > 0 est donné et si x ∈ I,
d’un entier naturel m tel que

f (x) − ! ≤ fk (x) ≤ f (x) + !

si k ≥ m. Par conséquent, pour tout k ≥ m et tout q ∈ N, on a aussi

f (x) − ! ≤ φk,q (x) ≤ fk (x) ≤ Φk,q (x) ≤ f (x) + !,

et dès lors, en faisant tendre q vers l’infini, on a, pour chaque k ≥ m,

f (x) − ! ≤ φk (x) ≤ fk (x) ≤ Φk (x) ≤ f (x) + !,

ce qui prouve (12.15).


H
Par intégration
H
sur I¯ des inégalités (12.13), on voit que
la suite réelle ( I¯ φk )k∈N (resp. ( I¯ Φk )k∈N ) est croissante et majorée (resp.
décroissante et minorée), et donc convergente. En appliquant le théorème
12.9. CONVERGENCE MAJORÉE ET MINORÉE 477

de convergence monotone de Levi aux suites (φk )k∈N et (Φk )k∈N, on voit que
f est intégrable sur I¯ et que, par suite de (12.15),
J J J
f = lim φk = lim Φk .
I¯ k→∞ I¯ k→∞ I¯

Mais, en intégrant (12.13) sur I¯ et en passant à la limite, on trouve que


J J J J J
f = lim φk ≤ lim fk ≤ Φk = f,
I¯ k→∞ I¯ k→∞ I¯ I¯ I¯

ce qui achève la démonstration.


Remarque. Le théorème de convergence majorée et minorée de
Lebesgue et sa démonstration restent valables pour l’intégration sur un
intervalle non borné.
Le théorème de convergence majorée et minorée de Lebesgue
est vrai pour la L-intégrabilité, avec une conclusion un peu plus forte.
Corollaire. Soit I un semi-pavé de Rn , (fk )k∈N une suite de fonctions réelles
définies sur I¯ et f une application de I¯ dans R. Supposons satisfaites les
conditions suivantes.
1. La suite (fk )k∈N converge ponctuellement sur I¯ vers f .
2. Chaque fonction fk est L-intégrable sur I. ¯
¯ telles que
3. Il existe deux fonctions réelles g et h L-intégrables sur I,

g(x) ≤ fk (x) ≤ h(x)

pour chaque k ∈ N et chaque x ∈ I. ¯


¯
Alors f est L-intégrable sur I et l’on a
J J
f = lim fk ,
I¯ k→∞ I¯

c’est-à-dire J J
lim fk = lim fk ,
I¯ k→∞ k→∞ I¯
et J
lim |f − fk | = 0.
k→∞ I¯
¯ En
Démonstration. Par le théorème précédent, f est intégrable sur I.
outre, l’hypothèse 3 entraı̂ne que

g(x) ≤ f (x) ≤ h(x)


478 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS

pour tout x ∈ I¯ et dès lors, f − g, positive et intégrable sur I¯ y est L-


intégrable. Par conséquent, f = (f − g) + g est également L-intégrable sur
¯ Dès lors, la suite de fonctions (|f − fk |)k∈Nconverge ponctuellement sur I¯
I.
vers zéro et est formée de fonctions L-intégrables sur I¯ telles que

min(g − f, f − h)(x) ≤ |f (x) − fk (x)| ≤ max(h − f, f − g)

pour tout x ∈ I,¯ avec min(g − f, f − h) et max(h − f, f − g) L-intégrables sur


¯
I. Il suffit de lui appliquer le théorème de convergence majorée et minorée
de Lebesgue pour obtenir la conclusion finale.
Une conséquence de cette version du théorème de Lebesgue est ce que
l’on appelle parfois le théorème de convergence dominée de Lebesgue
pour des suites de fonctions pouvant avoir des valeurs vectorielles.
Corollaire. Soit I un semi-pavé de Rn , (fk )k∈N une suite de fonctions de
Rn dans Rp définies sur I¯ et f une application de I¯ dans Rp . Supposons
satisfaites les conditions suivantes.
1. La suite (fk )k∈N converge ponctuellement sur I¯ vers f .
2. Chaque fonction fk est L-intégrable sur I. ¯
¯ telle que
3. Il existe une fonction réelle g L-intégrable sur I,

|fk (x)|2 ≤ g(x)

pour chaque k ∈ N et chaque x ∈ I. ¯


¯
Alors f est L-intégrable sur I et l’on a
J J
f = lim fk ,
I¯ k→∞ I¯

c’est-à-dire J J
lim fk = lim fk .
I¯ k→∞ k→∞ I¯

Démonstration. Il suffit de passer aux composantes des fk et de f et de


noter que, pour chaque 1 ≤ j ≤ p, la suite des composantes (pj ◦ fk )k∈N et
fj vérifient les conditions du Corollaire précédent, puisqu’on a

|pj ◦ fk (x)| ≤ |fk (x)|2 ≤ g(x),

et dès lors
−g(x) ≤ pj ◦ fk (x) ≤ g(x),
¯ chaque k ∈ N et chaque 1 ≤ j ≤ p.
pour chaque x ∈ I,
12.9. CONVERGENCE MAJORÉE ET MINORÉE 479

Remarque. Un cas particulier important du corollaire précédent est celui


où, dans les hypothèse 3, g est une constante. On l’appelle parfois le
théorème de convergence bornée de Lebesgue.
Le théorème de Lebesgue permet de démontrer que la convergence uni-
forme préserve l’intégrabilité et la L-intégrabilité.
Corollaire. Soit I un semi-pavé de Rn , (fk )k∈N une suite de fonctions réelles
définies sur I¯ et f une application de I¯ dans R. Supposons satisfaites les
conditions suivantes.
1. La suite (fk )k∈N converge uniformément sur I¯ vers f .
¯
2. Chaque fonction fk est intégrable (resp. L-intégrable) sur I.
¯
Alors f est intégrable (resp. L-intégrable) sur I et l’on a
J J
f = lim fk ,
I¯ k→∞ I¯

c’est-à-dire J J
lim fk = lim fk .
I¯ k→∞ k→∞ I¯

Démonstration. Par hypothèse, la suite (fk )k∈N vérifie la condition de


Cauchy de convergence uniforme sur I¯ et il existe donc un entier naturel m
tel que, pour tout entier k ≥ m, on ait

fm (x) − 1 ≤ fk (x) ≤ fm (x) + 1.

Il suffit donc d’appliquer la version correspondante du théorème de con-


vergence minorée et majorée de Lebesgue à la suite (fk )k≥m avec le choix
g = fm − 1 et h = fm + 1.
Enfin, il est facile de déduire des résultats précédents les versions du
théorème de convergence majorée et minorée de Lebesgue pour
une série de fonctions. On obtient en particulier le résultat suivant.
%
Corollaire. Soit I un semi-pavé de Rn , k∈N fk une série de fonctions
réelles définies sur I¯ et F une application de I¯ dans R. Supposons satisfaites
les conditions suivantes.
%
1. La série k∈N fk converge ponctuellement sur I¯ vers F .
2. Chaque fonction fk est intégrable sur I. ¯
3. Il existe des fonctions réelles g et h intégrables sur I¯ et telles que
q
$
g(x) ≤ fk (x) ≤ h(x)
k=0
480 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS

pour chaque q ∈ N et chaque x ∈ I. ¯


¯
Alors F est intégrable sur I et l’on a
J ∞ J
$
F = fk ,
I¯ ¯
k=0 I
c’est-à-dire J $
∞ ∞ J
$
fk = fk .
I¯ k=0 ¯
k=0 I

12.10 Exercices
1. Soit (fk )k∈N la suite d’applications de R dans R définies par
fk (x) = lim [cos(k!πx)]2j .
j→∞

Montrer que fk (x) = 1 si (k!x) ∈ Z et 0 si (k!x) /∈ Z.


Montrer que (fk )k∈N converge ponctuellement sur R vers la fonction de
Dirichlet. On notera que, si x /∈ Q, k!x /∈ Z, et fk (x) = 0 pour tout k ∈ N;
si x ∈ Q, avec pq comme représentation irréductible, alors k! pq ∈ Z, ce qui
entraı̂ne fk (x) = 1 dès que k ≥ q.
% z2k+1
2. Montrer que la série entière k∈N∗ (2k+1)(2k−1) admet 1 comme rayon de
convergence et converge uniformément sur la boule fermée B2 [1].
3. Montrer que l’équation différentielle linéaire
zy $$ (z) − y(z) = 0
admet des solutions sur C de la forme
, ∞
-
$ zk
y(z) = c ,
k=1
[(k − 1)!]2 k
où c est une constante complexe arbitraire.

12.11 Petite anthologie


Convergence ponctuelle et uniforme
%
Lorsque les différents termes de la série un sont des fonctions d’une
même variable x, continues par rapport à cette variable dans le voisinage
d’une valeur particulière pour laquelle la série est convergente, la somme s
de la série est aussi, dans le voisinage de cette valeur particulière, fonction
continue de x.
12.11. PETITE ANTHOLOGIE 481

Augustin Cauchy, 1821


Où cela est-t-il prouvé que l’on obtient la dérivée d’une série infinie en
prenant la dérivée de chaque terme ?
Niels Henrik Abel, 1839
Si une série convergente de fonctions continues est discontinue au point
x0 , alors, dans le voisinage immédiat de x0 , il y a des valeurs de x pour
lesquelles la série converge aussi lentement que l’on veut.
Philipp Ludwig von Seidel, 1847
On dit ici que la convergence devient infiniment lente si, n étant le
nombre de termes qu’on doit prendre de façon que la somme des termes
négligés soit en valeur absolue plus petite qu’une quantité e donnée, qu’on
peut prendre aussi petite que l’on veut, n croı̂t indéfiniment lorsque x décroı̂t
indéfiniment.
Georges Stokes, 1847
Fonctions continues non dérivables
On peut même dire que le rapport de deux choses homogènes ne dépendant
ni de leur nature, ni de leurs grandeurs absolues, par la définition même du
rapport, la quantité (Dy/Dx) a toujours une limite; et c’est ce que la con-
sidération d’une courbe et de sa tangente, dont l’existence n’est pas douteuse,
fait voir d’ailleurs avec la dernière évidence.
Louis Poinsot, 1815
On peut demander si une fonction continue quelconque a une dérivée.
Nous répondrons d’abord qu’en fait nous allons trouver, dans les paragraphes
suivants, les dérivées des principales fonctions; ce qui démontrera leur e-
xistence a posteriori. Comme en chaque point une courbe continue a une
tangente bien déterminée, la fonction admet une dérivée.
Joseph Bertrand, 1878
Considérons la fonction donnée par la série suivante
sin ax sin a2 x sin a3 x $ sin an x
f (x) = + + + . . . = ,
a a2 a3 an
dans laquelle a est un entier constant que nous supposerons positif et très
grand. Cette série nous fournira un exemple soit d’une fonction qui n’a ja-
mais de dérivée, soit d’une fonction qui n’a jamais aucune période de crois-
sance ou de décroissance.
482 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS

Charles Cellerier, s.d.

Je me détourne avec effroi et horreur de cette plaie lamentable des fonc-


tions continues qui n’ont point de dérivée.

Charles Hermite, 1893

Suites de fonctions intégrables

Si une suite de fonctions sommables, ayant des intégrales, f1 , f2 , f3 , . . .


a une limite f et si |f − fn | reste, quel que soit n, inférieure à un nombre
fixe M , f a une intégrale qui est la limite des intégrales des fonctions fn . Le
cas particulier le plus intéressant de ce théorème, celui où f et les fi sont
des fonctions continues, a déjà été obtenu, à l’aide de considérations toutes
différentes, par Mr. Osgood.

Henri Lebesgue, 1902


Chapitre 13

Fonctions et ensembles
mesurables

13.1 Intégrale sur un borné


Le but de cette section est d’étendre la notion d’intégrale au cas d’un borné
quelconque de Rn . Pour ce faire, nous aurons besoin d’une conséquence du
théorème de Levi, montrant que l’intégrabilité d’une fonction sur un pavé
fermé et la valeur de l’intégrale ne dépendent pas des valeurs prises par la
fonction sur la frontière du pavé.
Lemme. Soit Q =]c1 , d1 ]×. . . ×]cn , dn] un semi-pavé de Rn et g une fonction
de Rn dans Rp définie sur Q̄. Si g(x) = 0 pour tout x ∈ int Q, alors g est
L-intégrable sur Q̄ et J J
g = 0, |g|2 = 0.
Q̄ Q̄
Démonstration. Comme on a
|S(Q, g, Π)|2 ≤ S(Q, |g|2, Π),
A B
pour toute P-partition Π = (xj , Qj ) 1≤j≤m de Q, il suffit évidemment de
H
montrer que |g|2 est intégrable sur Q̄ et que Q̄ |g|2 = 0.
Démontrons d’abord le résultat sous l’hypothèse supplémentaire que g
soit bornée sur Q̄ et soit M > 0 tel que
|g(x)|2 ≤ M, x ∈ Q̄.
Soit ! > 0 et cherchons à déterminer une jauge constante δ, telle que
S(Q, |g|2, Π) ≤ !,

483
484 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES
A B
si Π = (xj , Qj ) 1≤j≤m est δ-fine. On a, puisque g(x) = 0 pour x ∈ int Q,
$ $
S(Q, |g|2, Π) = |g(xj )|2 µ(Qj ) ≤ M µ(Qj ).
{1≤j≤m : xj ∈f r Q} {1≤j≤m : xj ∈f r Q}

Mais, comme Π est δ-fine, on a


>
Qj ⊂ Q̄ \ Qδ ,
{1≤j≤m : xj ∈f r Q}

où
Qδ = ]c1 + δ, d1 − δ[ × . . . × ]cn + δ, dn − δ[,
avec la convention ]cj + δ, dj − δ[ = ∅ si cj + δ ≥ dj − δ. Dès lors, les Qj étant
mutuellement disjoints, on a
$ n
$ 6
µ(Qj ) ≤ 2 δ (di − ci ) = δS,
{1≤j≤m : xj ∈f r Q} k=1 {1≤i≤n : i(=k}

où n n
$ 6 $ µ(Q)
S=2 (di − ci ) = 2
k=1 {1≤i≤n : i(=k} k=1
dk − ck

est la somme des (n-1)-mesures des faces de Q̄ qui constituent fr Q. En


conséquence,
S(Q, |g|2, Π) ≤ δM S ≤ !,
à condition de prendre δ = !/M S.
Soit maintenant g une fonction quelconque de Rn dans Rp telle que Q̄ ⊂
dom g et g(x) = 0 si x ∈ int Q. Pour chaque k ∈ N, définissons gk par

gk (x) = min(|g(x)|2, k), x ∈ Q̄.

Par construction, la suite de fonctions de Rn dans R+ est croissante sur Q̄,


0 ≤ gk (x) ≤ k pour chaque k ∈ N et chaque x ∈ Q̄, et, si x ∈ int Q, gk (x) =
min{0, k} = 0, k ∈ N. En vertu du résultat de la première partie de la
démonstration appliqué à gk , on voit donc que gk est L-intégrable sur Q̄ et
J
gk = 0, k ∈ N.

D’autre part, pour chaque x ∈ Q̄, on a gk (x) = |g(x)|2 dès que k ≥ |g(x)|2,
ce qui montre la convergence ponctuelle de la suite (gk )k∈N vers |g(x)|2 sur
13.1. INTÉGRALE SUR UN BORNÉ 485

Q̄. Le théorème de convergence monotone de Levi entraı̂ne alors que |g|2 est
L-intégrable sur Q̄ et que
J J
|g|2 = lim gk = 0,
Q̄ k→∞ Q̄

et la démonstration est complète.


Si f est une fonction de Rn dans Rp et si A ⊂ dom f , nous désignerons
par fA l’application de Rn dans Rp définie par

fA (x) = f (x) si x ∈ A,

fA (x) = 0 si x ∈ Rn \ A.
En particulier, nous appellerons fonction caractéristique de A ⊂ Rn , et nous
désignerons par 1A , l’application de Rn dans R définie par

1A (x) = 1 si x ∈ A,

1A (x) = 0 si x ∈ Rn \ A.
Lemme. Soit I ⊂ Rn un semi-pavé et h une fonction de Rn dans Rp définie
¯ Alors h est intégrable (resp. L-intégrable) sur I¯ si et seulement si h ¯
sur I. I
est intégrable (resp. L-intégrable) sur J¯ pour tout semi-pavé J ⊂ Rn tel que
I¯ ⊂ J, auquel cas on a J J
hI¯ = h.
J¯ I¯

Démonstration. Soit J ⊂ Rn un semi-pavé tel que I¯ ⊂ J. Alors I ⊂ J et


l’on a & r '
>
J =I∪ Ii ,
i=1

où est une partition de J en semi-pavés. Comme I¯ ∩ int I i = ∅


{I, I 1, . . ., I r }
pour chaque 1 ≤ i ≤ r, on a hI¯(x) = 0 pour tout x ∈ int I i, 1 ≤ i ≤ r, et le
lemme précédent entraı̂ne la L-intégrabilité de hI¯ sur chaque I¯i avec
J
hI¯ = 0, 1 ≤ i ≤ r.
I¯i

Combinant ces résultats avec la propriété d’additivité de l’intégrale, on voit


que hI¯ sera intégrable (resp. L-intégrable) sur J¯ si et seulement si hI¯ est
¯ c’est-à-dire (puisque h ¯ = h sur I)
intégrable (resp. L-intégrable) sur I, ¯ si et
I
486 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES

¯ auquel cas on aura,


seulement si h est intégrable (resp. L-intégrable) sur I,
en outre,
J J r J
$ J
hI¯ = hI¯ + hI¯ = h,
J¯ I¯ ¯i
i=1 I I¯

et la démonstration est complète.


Soit A une partie bornée de Rn et f une fonction de Rn dans Rp définie
sur A. La définition suivante est naturelle.
Définition. On dit que f est intégrable sur A (resp. L-intégrable sur A) s’il
existe un semi-pavé I ⊂ Rn tel que
H
A ⊂ I¯ et telHque fA soit intégrable (resp.
¯
L-intégrable) sur I, auquel cas I¯ fA est notée A f et appelée l’intégrale de
f sur A.
Cette définition et la terminologie seront justifiées si l’intégrabilité (resp.
H
la L-intégrabilité) de fA sur I¯ et la valeur de I¯ fA ne dépendent pas du
choix de I. Cette indépendance résulte de la proposition suivante.
Proposition. Si I ⊂ Rn est un semi-pavé tel que A ⊂ I¯ et tel que fA soit
¯ alors, pour tout semi-pavé K ⊂ Rn tel
intégrable (resp. L-intégrable) sur I,
H H
que A ⊂ K̄, fA est intégrable (resp. L-intégrable) sur K̄ et K̄ fA = I¯ fA .
Démonstration. Soit J ⊂ Rn un semi-pavé tel que I¯ ⊂ J et K̄ ⊂ J.
Notons tout d’abord que (fA )I¯ = (fA )K̄ = fA puisque A ⊂ I¯ ∩ K̄. Par le
second lemme ci-dessus et l’intégrabilité (resp. L-intégrabilité) de fA sur
¯ (fA ) ¯ = fA est intégrable (resp. L-intégrable) sur J¯ et H ¯ fA = H ¯ fA . Par
I, I I J
ce même lemme, l’intégrabilité (resp. la L-intégrabilité) de (fA )K̄ = fA sur
J¯ entraı̂ne
H H
l’intégrabilité (resp. la L-intégrabilité) de fA sur K̄ et l’égalité
K̄ fA = J A.
¯ f
Remarques. 1. La proposition ci-dessus montre encore que la définition
et la notation que nous venons d’introduire sont compatibles, lorsque A
est l’adhérence I¯ d’un semi-pavé I de Rn , avec la définition et la notation
originales d’intégrabilité (resp. de L-intégrabilité) sur I,¯ puisque f ¯ = f
I
sur I,¯ et avec les notions d’intégrabilité (resp. de L-intégrabilité) sur des
intervalles non fermés. En outre, la même proposition montre que si B ⊂ A,
alors f est intégrable (resp. L-intégrable) sur B si et seulement si fB est
intégrable (resp. L-intégrable) sur A.
2. Il résulte aisément de la définition ci-dessus que les propriétés élé-
mentaires de l’intégrale (sauf celles de restriction et d’additivité),
le test de comparaison de L-intégrabilité, l’identité entre les fonc-
tions intégrables et L-intégrables lorsqu’elles sont bornées ou positives, le
13.2. BORNÉS INTÉGRABLES ET LEUR MESURE 487

théorème de Levi et le théorème de Lebesgue s’étendent à l’intégrabi-


lité (resp. L-intégrabilité) sur un borné A de Rn en remplaçant simplement
I¯ par A. En particulier, l’ensemble P (A; Rp) (resp. L(A; Rp)) des fonctions
de Rn dans Rp intégrables (resp. L-intégrables) sur A forme un espace vec-
toriel sur R. On verra plus loin que l’extension des propriétés de restriction
et d’additivité est plus délicate. Elle nécessite l’introduction de la notion de
partie n-intégrable de Rn .

13.2 Bornés intégrables et leur mesure


Soit A une partie bornée de Rn .

Définition. On dit que A est n-intégrable si la fonction


H
constante 1 est
intégrable sur A, auquel cas le nombre positif ou nul A 1 est appelé la n-
mesure (de Lebesgue) de A et noté µ(A). On dit aussi longueur de A pour
n = 1, aire d’un ensemble plan de A pour n = 2 et volume de A pour n = 3.
H
On a donc, par définition, µ(A) = I¯ 1A pour tout semi-pavé I ⊂ Rn tel
que A ⊂ I. ¯ En particulier, l’adhérence I¯ de tout semi-pavé I = ]a1 , b1 ] ×
. . . × ]an , bn] de Rn est n-intégrable et a pour n-mesure de Lebesgue
J J n
6
¯ =
µ(I) 1I¯ = 1= (bi − ai ).
I¯ I¯ i=1

En utilisant le premier lemme de cette section, on voit aussi que fr I =


I¯ \ int I et I¯ \ I sont n-intégrables et que

µ(fr I) = µ(I¯ \ I) = 0,

puisque 1fr I (x) = 1I\I


¯ (x) = 0 si x ∈ int I. Comme 1int I = 1I¯ − 1fr I et
1I = 1I¯ − 1I\I
¯ , on en déduit aussitôt la n-intégrabilité de int I et de I et les
relations
n
6
¯ =
µ(int I) = µ(I) = µ(I) (bi − ai ),
i=1

qui montrent la compatibilité de la nouvelle notation avec la notation µ(I)


introduite précédemment pour désigner le dernier terme de l’égalité.
Les propriétés élémentaires de la n-mesure résultent aisément de
la définition et des propriétés élémentaires de l’intégrale.
488 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES

Proposition. Si A, B, A1 , . . . , Aq sont des parties bornées n-intégrables de


Rn , on a les propriétés suivantes.
1. Si B ⊂ A, alors µ(B) ≤ µ(A) (monotonie).
! 7
2. qk=1 Ak et qk=1 Ak sont n-intégrables,
& q ' q
> $
µ Ak ≤ µ(Ak ) (sous-additivité),
k=1 k=1
et si les Ak sont mutuellement disjoints (Aj ∩ Ak = ∅ si j /= k),
& q
' q
> $
µ Ak = µ(Ak ) (additivité).
k=1 k=1

3. µ(A ∪ B) = µ(A) + µ(B) − µ(A ∩ B),


4. A \ B est n-intégrable et, si B ⊂ A, µ(A \ B) = µ(A) − µ(B).
Démonstration. Il suffit d’appliquer à la définition les propriétés élémen-
taires de l’intégrale en tenant compte des propriétés suivantes des fonctions
caractéristiques, que l’on démontre aisément:
1) B ⊂ A si et seulement si 1B (x) ≤ 1A (x) pour tout x ∈ Rn .
2) 1!q Ak = max1≤k≤q 1Ak , 17q Ak = min1≤k≤q 1Ak , et 1!q Ak =
%q k=1 k=1 k=1

k=1 1Ak si les Ak sont mutuellement disjoints.


3) 1A∪B = 1A + 1B − 1A∩B .
4) A \ B = A ∩ (Rn \ B) et, si B ⊂ A, 1A\B = 1A − 1B . En particulier,
1Rn \B = 1 − 1B .
Le théorème de Levi permet de généraliser la propriété 2 de la proposition
ci-dessus aux familles dénombrables d’ensembles. Un résultat préliminaire est
nécessaire.
Lemme. Si (Ak )k∈N est une suite croissante (resp. décroissante) de parties
de Rn , alors la suite de fonctions (1Ak )k∈N converge ponctuellement sur Rn
vers 1! Ak (resp. 17 Ak ).
k∈N k∈N

Démonstration. Si, pour fixer les idées, on suppose (Ak )k∈N croissante,
!
et si x /∈ A = k∈N Ak , x n’appartient à aucun Ak et on a donc
lim 1Ak (x) = 0 = 1A (x).
k→∞

Si x ∈ A, il existe un m ∈ N tel que x ∈ Am . Comme (Ak )k∈N est croissante,


on aura donc x ∈ Ak pour tout k ≥ m, et dès lors
lim 1Ak (x) = 1 = 1A (x).
k→∞
Le cas d’une suite décroissante se démontre de la même manière.
13.2. BORNÉS INTÉGRABLES ET LEUR MESURE 489

Proposition. Soit (Ak )k∈N une suite croissante de parties bornées et n-


!
intégrables de Rn telles que A = k∈N Ak soit bornée. Alors A est n-
intégrable et
µ(A) = lim µ(Ak ) = sup µ(Ak ).
k→∞ k∈N

Démonstration. Soit I un semi-pavé de Rn tel que A ⊂ I. ¯ Par hypothèse,


(1Ak )k∈N est une suite croissante de fonctions intégrables sur I¯ qui, en vertu
du lemme précédent,
H
converge ponctuellement vers 1A . En outre, la suite
(µ(Ak ))k∈N = ( I¯ 1Ak )k∈N est croissante et majorée par µ(I), donc conver-
gente. On déduit aussitôt du théorème de Levi que 1A = limk→∞ 1Ak est
intégrable sur I¯ (donc que A est n-intégrable) et que
J J
µ(A) = 1A = lim 1Ak = lim µ(Ak ) = sup µ(Ak ).
I¯ k→∞ I¯ k→∞ k∈N

Proposition. Soit (Ak )k∈N une suite décroissante de parties bornées et n-


7
intégrables de Rn . Alors A = k∈N Ak est n-intégrable et

µ(A) = lim µ(Ak ) = inf µ(Ak ).


k→∞ k∈N

Démonstration. Soit I un semi-pavé de Rn tel que A0 ⊂ I. ¯ Par hypothèse,


(1Ak )k∈N est une suite décroissante de fonctions intégrables sur I¯ qui, en
vertu du lemme précédent,
H
converge ponctuellement vers 1A . En outre, la
suite (µ(Ak ))k∈N = ( I¯ 1Ak )k∈N est décroissante et minorée par 0, donc con-
vergente. On déduit aussitôt du théorème de Levi que 1A = limk→∞ 1Ak est
intégrable sur I¯ (donc que A est n-intégrable) et que
J J
µ(A) = 1A = lim 1Ak = lim µ(Ak ) = inf µ(Ak ).
I¯ k→∞ I¯ k→∞ k∈N

Un lemme est nécessaire pour démontrer l’importante propriété d’addi-


tivité complète de la mesure.
Lemme. Si (Ak )k∈N est une suite de parties de Rn mutuellement disjointes,
%
alors la série de fonctions k∈N 1Ak converge ponctuellement vers 1! Ak .
k∈N

Démonstration. Comme les Ak sont mutuellement disjoints, on a, pour


tout q ∈ N,
q
$
1!q Ak = 1Ak .
k=0
k=0
490 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES

! %q
Si x /∈ A = k∈N Ak , alors x /∈ Ak pour tout k ∈ N et k=0 1Ak (x) = 0 pour
tout q ∈ N. En conséquence,
q
$
lim 1Ak (x) = 0 = 1A (x).
q→∞
k=0

Si x ∈ A, il existe un (et un seul) entier m tel que x ∈ Am . Dès lors, pour


tout q ≥ m, on a
q
$
1Ak (x) = 1Am (x) = 1,
k=0
et
q
$
lim 1Ak (x) = 1 = 1A (x).
q→∞
k=0

Nous pouvons maintenant démontrer la propriété d’additivité complè-


te de la mesure.
Proposition. Si (Ak )k∈N est une suite de parties de Rn bornées, n-intégra-
!
bles, mutuellement disjointes et telles que A = k∈N Ak soit bornée, alors A
%
est n-intégrable, la série k∈N µ(Ak ) converge et

$
µ(A) = µ(Ak ).
k=0

Démonstration. Soit I un semi-pavé de Rn tel que A ⊂ I. ¯ Par hypothèse,


%
¯
k∈N 1Ak est une série de fonctions positives et intégrables sur I et, par le
lemme, cette série converge ponctuellement sur Rn vers 1A . En outre, la
série à termes positifs J
$ $
1Ak = µ(Ak )
¯
k∈N I k∈N
est convergente, puisque, pour tout q ∈ N, on a
q & q '
$ >
µ(Ak ) = µ Ak ≤ µ(I).
k=0 k=0

Par le théorème de Levi pour les séries de fonctions, la fonction 1A est


intégrable sur I¯ et
J ∞ J
$ ∞
$
µ(A) = 1A = 1Ak = µ(Ak ).
I¯ ¯
k=0 I k=0
13.3. ADDITIVITÉ COMPLÈTE DE LA L-INTÉGRALE 491

13.3 Additivité complète de la L-intégrale


On sait que l’intégrabilité (resp. la L-intégrabilité) d’une fonction sur un
pavé fermé I¯ entraı̂ne son intégrabilité (resp. sa L-intégrabilité) sur tout
pavé fermé contenu dans I. ¯ On pourrait penser que l’intégrabilité d’une
fonction sur une partie bornée A entraı̂ne son intégrabilité sur toute partie
de A. Qu’il n’en soit rien résulte de l’existence de parties bornées de Rn qui
ne sont pas n-intégrables, un résultat fondé sur l’axiome du choix et qui est
esquissé dans les exercices. En effet, si B est un tel ensemble borné et non
n-intégrable, et I un semi-pavé tel que B ⊂ I, ¯ la fonction constante 1 est
intégrable sur I¯ et ne l’est pas sur B.
On peut alors penser que l’intégrabilité d’une fonction sur une partie
bornée A entraı̂ne son intégrabilité sur toute partie n-intégrable de A. Ce
résultat est faux pour les fonctions intégrables mais non L-intégrables sur A.
En effet, si f ∈ P (A; R) \ L(A; R), on a vu précédemment que f + et f − ne
sont pas intégrables sur A. Dès lors, si

A+ = {x ∈ A : f (x) ≥ 0},

on a f + (x) = fA+ (x) pour tout x ∈ A et f n’est pas intégrable sur A+ .


Dans le cas de f (x) = (2/x) cos(1/x2) si x /= 0 et f (0) = 0, qui est un
élément de P ([0, 1], R) \ L([0, 1], R), il est facile de voir que A+ est une
union dénombrable d’intervalles fermés bornés mutuellement disjoints con-
tenus dans [0, 1], donc que A+ est 1-intégrable. On ne connaı̂t pas de classe
intéressante, autre que l’union finie de pavés, pour laquelle l’intégrabilité
d’une fonction intégrable mais non L-intégrable sur un borné A se trans-
mette à une partie de A appartenant à cette classe. C’est évidemment un
handicap important de l’extension de la notion d’intégrabilité à une partie
bornée quelconque.
La situation est meilleure pour la L-intégrabilité sur une partie bornée
qui se transmet à tout sous-ensemble n-intégrable. C’est la propriété de
restriction de la L-intégrale sur un borné.
Proposition. Soit A un borné de Rn et f une fonction de Rn dans Rp
définie et L-intégrable sur A. Alors, pour toute partie n-intégrable B de A,
f est L-intégrable sur B.
Démonstration. En passant aux composantes fj de f et puis en notant
que fj = fj+ − fj− , on voit qu’il suffit de démontrer le résultat pour une
fonction f de Rn dans R+ , ce que nous supposerons. Soit B ⊂ A n-intégrable
et I un semi-pavé de Rn tel que A ⊂ I. ¯ Définissons sur A la suite (fk )k∈N
492 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES

de fonctions de Rn dans R+ par

fk (x) = min[f (x), k.1B (x)], k ∈ N.

Chaque fk est telle que


0 ≤ fk (x) ≤ f (x),
pour x ∈ A, et est L-intégrable sur A puisqu’il en est ainsi de f et de k.1B .
En outre, (fk )k∈N converge ponctuellement sur A vers fB . En effet, si x ∈ B,
k.1B (x) = k et dès lors fk (x) = f (x) = fB (x) dès que k ≥ fB (x), tandis que,
si x ∈ A\B, k.1B (x) = 0 pour tout k ∈ N, et dès lors fk (x) = 0 = fB (x) pour
tout k ∈ N. Le théorème de convergence majorée et minorée de Lebesgue
entraı̂ne alors la L-intégrabilité de fB sur A, c’est-à-dire la L-intégrabilité
de f sur B.
On en déduit aisément la propriété d’additivité finie pour la L-
intégrale sur un borné.
Proposition. Soit A un borné de Rn , {A1 , . . . , Aq } une partition de A en un
nombre fini de parties n-intégrables, et f une fonction de Rn dans Rp définie
sur A. Alors f est L-intégrable sur A si et seulement si f est L-intégrable
sur chaque Ak , 1 ≤ k ≤ q, auquel cas on a
J q J
$
f= f.
A k=1 Ak

Démonstration. Si f est L-intégrable sur A, la propriété de restriction


que nous venons de démontrer entraı̂ne sa L-intégrabilité sur chaque Ak , 1 ≤
k ≤ q, et donc l’intégrabilité de chaque fAk sur A. Comme en outre
q
$
f= fAk ,
k=1

la formule cherchée s’en déduit par intégration sur A. Réciproquement, si f


est L-intégrable sur chaque Ak , 1 ≤ k ≤ q, fAk est L-intégrable sur A, et la
formule ci-dessus entraı̂ne que f est L-intégrable sur A.
Le théorème de Levi pour les séries de fonctions positives fournit la pro-
priété d’additivité complète pour la L-intégrale sur un borné.
Proposition. Soit A un borné de Rn , (Ak )k∈N une suite de parties n-
intégrables de A telle que {A0 , A1 , . . .} forme une partition de A et f une
fonction de Rn dans Rp définie sur A. Alors, f est L-intégrable sur A si
13.4. EXEMPLES DE BORNÉS INTÉGRABLES 493

% H
et seulement si f est L-intégrable sur chaque Ak , k ∈ N et k∈N Ak |f |2
converge, auquel cas
J ∞ J
$
f= f.
A k=0 Ak

Démonstration. Comme ci-dessus, on peut se ramener au cas où f est à


valeurs positives. Comme, pour chaque x ∈ A, on a

fAk (x) = f (x).1Ak (x) ≥ 0,


% %
on voit que la série k∈N fAk = f.( k∈N 1Ak ) converge ponctuellement sur
A vers f.1A = fA . On peut donc appliquer le théorème de convergence de
Levi pour les séries de fonctions positives,
H
qui assure Hl’intégrabilité de f sur
% %
A si et seulement si la série k∈N A f.1Ak = k∈N Ak f converge, auquel
cas on a J J

$
f= f.
A k=0 Ak

Enfin, le théorème de Levi pour une suite croissante de fonctions fournit


à son tour une condition nécessaire et suffisante du type de Hake
pour la L-intégrabilité sur une partie bornée.
Proposition. Soit (Ak )k∈N une suite croissante de parties bornées et n-
!
intégrables telle que A = k∈N Ak soit bornée, et soit f une fonction de Rn
dans Rp définie sur A. Alors f est L-intégrable sur
H
A si et seulement si f est
L-intégrable sur chaque Ak , k ∈ N et la suite ( Ak |f |2 )k∈N est convergente,
auquel cas on a J J
f = lim f.
A k→∞ Ak

Démonstration. On peut de nouveau, sans perte de généralité, se ramener


au cas d’une fonction f positive et l’on procède comme dans la démonstration
précédente.

13.4 Exemples de bornés intégrables


Le premier résultat, qui porte le nom d’inégalité de Tchebycheff, associe
à une fonction positive intégrable sur un borné A une intéressante classe de
parties intégrables de A.
494 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES

Proposition. Soit A un borné de Rn et f une fonction de Rn dans R+


intégrable sur A. Alors, pour chaque r > 0, l’ensemble

Ar = {x ∈ A : f (x) > r}

est n-intégrable et J
−1
µ(Ar ) ≤ r f.
A
¯
Démonstration. Soit r > 0 et I un semi-pavé de Rn tel que A ⊂ I;
définissons sur R la suite d’applications (fk )k∈N par
n

fk (x) = min[1, k. max(fA (x) − r, 0)], k ∈ N, x ∈ Rn .

Chaque fk est intégrable sur I¯ et telle que

0 ≤ fk (x) ≤ 1, k ∈ N, x ∈ Rn .

En outre, la suite (fk )k∈N converge ponctuellement sur Rn vers 1Ar . En


effet, si x ∈ Rn \ Ar , alors fA (x) − r ≤ 0 et fk (x) = 0 pour tout k ∈ N,
ce qui entraı̂ne que fk (x) → 0 = 1Ar (x) si k → ∞. Si x ∈ Ar , fk (x) =
min[1, k(f (x) − r)] et dès lors fk (x) = 1 dès que k ≥ 1/(f (x) − r); donc
fk (x) → 1 = 1Ar (x) si k → ∞.
On peut donc appliquer le théorème de convergence majorée et mi-
norée de Lebesgue pour obtenir l’intégrabilité de 1Ar sur I, ¯ c’est-à-dire la
n-intégrabilité de Ar . Par la propriété de restriction (puisque, f étant po-
sitive, son intégrabilité équivaut à sa L-intégrabilité), f sera alors intégrable
sur Ar et comme

r.1Ar (x) ≤ fAr (x) ≤ f (x), x ∈ A,

on en déduit, par intégration sur A que


J J
rµ(Ar ) ≤ f≤ f,
Ar A

et la démonstration est complète.


Remarque. La fonction

df : R∗+ → R+ , r 2→ µ(Ar )

définie par la Proposition précédente s’appelle la fonction de distribution de


f et joue un grand rôle en analyse.
13.4. EXEMPLES DE BORNÉS INTÉGRABLES 495

Corollaire. Dans les conditions de la proposition précédente, l’ensemble


A∗r = {x ∈ A : f (x) ≥ r} est n-intégrable et
J
µ(A∗r ) ≤r −1
f.
A

Démonstration. Avec les notations de la Proposition précédente, on a


"
A∗r = Ar−(1/k).
{k∈N:k>r −1 }

Comme Ar−(1/k) ⊃ Ar−(1/k+1) pour k ≥ 1 et comme, par la proposition


précédente, chaque Ar−(1/k) est n-intégrable, on en déduit que A∗r est n-
intégrable et que
4 5−1 J J
1
µ(A∗r ) = lim µ(Ar−(1/k)) ≤ lim r− f = r −1 f.
k→∞ k→∞ k A A

Corollaire. Si A est un borné de Rn et si f est une fonction de Rn dans


Rp L-intégrable sur A, alors l’ensemble
S(f ) = {x ∈ A : f (x) /= 0}
est n-intégrable.
Démonstration. On a
>
S(f ) = {x ∈ A : |f (x)|2 > 0} = Sk ,
k∈N∗

où Sk = {x ∈ A : |f (x)|2 > 1/k}. Par le théorème de Tchebycheff, chaque


Sk est n-intégrable et, par construction, Sk ⊂ Sk+1 ⊂ A pour tout k ∈ N∗ .
La n-intégrabilité de S(f ) en découle aussitôt.
L’obtention de classes concrètes d’ensembles n-intégrables repose sur le
lemme de recouvrement suivant.
Proposition. Soit I un semi-pavé de Rn , E une partie non vide
8 de I et9δ une
jauge sur E. Alors il existe une famille au plus dénombrable (xk , J k ) ,
k∈M
avec M = {0, 1, . . . , s} ou N, telle que chaque J k est un semi-pavé contenu
dans I et semblable à I, J k ∩J l = ∅ si j /= l, xk ∈ E ∩J k , J k ⊂ B∞ [xk ; δ(xk )]
pour chaque k ∈ M, l ∈ M, et
>
E⊂ J k ⊂ I.
k∈M
496 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES

Démonstration. Effectuons des divisions successives de I en 2n , 22n , . . .,


2kn , . . . semi-pavés congruents par bissection des intervalles dont I est le pro-
duit cartésien, et appelons respectivement D1 , D2 , . . ., Dk , . . . les collections
finies de semi-pavés ainsi obtenues. Chaque Dk constitue évidemment une
partition de I en semi-pavés congruents semblables à I. Posons
E1 = {J ∈ D1 : il existe x ∈ E ∩ J tel que J ⊂ B∞ [x; δ(x)]},
E2 = {J ∈ D2 : J n’est pas contenu dans un semi-pavé de E1 et il existe
x ∈ E ∩ J tel que J ⊂ B∞ [x; δ(x)]},
et, d’une manière générale, pour chaque k ∈ N∗ ,
!
Ek = {J ∈ Dk : J n’est pas contenu dans un semi-pavé de k−1 j=1 Ej et il
existe x ∈ E ∩ J tel que J ⊂ B∞ [x; δ(x)]}.
!
Posons E = k∈N∗ Ek . C’est une famille au plus dénombrable de semi-pavés
contenus dans I et mutuellement disjoints. Montrons que tout point de E ap-
partient à l’un au moins de ces semi-pavés. Soit x ∈ E et δ(x) la valeur corre-
spondante de la jauge. Il existe un entier k1 ≥ 1 tel que, pour tout k ≥ k1 , le
semi-pavé Jk,x de Dk qui contient x soit contenu dans B∞ [x; δ(x)], et dès lors
Jk1 ,x vérifie la deuxième condition de définition de Ek1 . Par conséquent, ou
! 1 −1
bien Jk1 ,x ∈ Ek1 , ou bien Jk1 ,x est contenu dans un semi-pavé de kj=1 Ej . Par
conséquent, x appartient à un semi-pavé de la famille E. Si nous désignons
les semi-pavés de cette famille par (Jk )k∈M , avec M = {0, 1, . . ., s} un en-
semble fini ou M = N, nous avons par construction, pour 8 chaque 9 k ∈ M,
un x ∈ E ∩ J tel que J ⊂ B∞ [x ; δ(x )]. La famille (x , J )
k k k k k k k a les
k∈M
propriétés voulues.
Le lemme de recouvrement fournit un intéressant résultat sur la struc-
ture des ouverts bornés de Rn .
Proposition. Soit E un ouvert borné non vide de Rn et I un semi-pavé
tel que E ⊂ I. Il existe une suite (J k )k∈N de semi-pavés contenus dans I et
semblables à I qui partitionne E.
Démonstration. Puisque E est ouvert, il existe, pour chaque x ∈ E,
un δ(x) > 0 tel que B∞ [x; δ(x)] ⊂ E, ce qui nous définit une jauge δ sur
E. Par le lemme
8 de 9recouvrement, on peut trouver une famille au plus
dénombrable (x , J k )
k où chaque J k est un semi-pavé contenu dans I
k∈M
et semblable à I, les J k sont mutuellement disjoints, xk ∈ E ∩ J k , J k ⊂
!
B∞ [xk ; δ(xk )], k ∈ M, et E ⊂ k∈M J k . Comme, pour chaque k ∈ M , on
!
a J k ⊂ B∞ [xk ; δ(xk )] ⊂ E, on en déduit que k∈M J k ⊂ E, et donc que
!
k∈M J = E. Comme une union finie de semi-pavés J ne peut donner un
k k

ouvert, on a nécessairement M = N et la démonstration est complète.


13.4. EXEMPLES DE BORNÉS INTÉGRABLES 497

On en déduit aussitôt l’intégrabilité de tout ouvert borné.


Proposition. Tout ouvert borné de Rn est n-intégrable.
Démonstration. C’est trivial si l’ouvert est vide. Si E est un ouvert
non vide de Rn , et I un semi-pavé qui le contient, E peut s’écrire, par la
Proposition précédente, comme une union dénombrable de semi-pavés J k
mutuellement disjoints et contenus dans I. E est donc n-intégrable par la
propriété d’additivité complète, puisque chaque J k l’est.
On ne s’étonnera pas que la propriété s’étende aux fermés bornés.
Proposition. Tout fermé borné de Rn est n-intégrable.
Démonstration. Soit F un fermé borné de Rn et I un semi-pavé tel que
F ⊂ int I. Alors E = (Rn \ F ) ∩ int I est un ouvert borné de Rn et est donc
n-intégrable. Comme F = int I \ E, F est également n-intégrable.
Terminons par une intéressante propriété d’approximation des bor-
nés n-intégrables par une union au plus dénombrable de semi-pavés mu-
tuellement disjoints.
Proposition. Soit A une partie bornée et n-intégrable de Rn et I un semi-
pavé contenant A. Pour chaque ! > 0, il existe une famille au plus dénombra-
ble (J k )k∈M de semi-pavés mutuellement disjoints contenus dans I et tels
!
que A ⊂ k∈M J k et $
µ(J k ) ≤ µ(A) + !.
k∈M

Démonstration. Si ! > 0 est donné, il existe une jauge δ sur I¯ telle que,
pour toute P-partition δ-fine Π de I, on ait

|S(I, 1A, Π) − µ(A)| ≤ !.


8 9
Pour cette jauge δ et l’ensemble A, soit (xk , J k ) la famille au plus
k∈M
dénombrable donnée par le lemme de recouvrement. En vertu du lemme de
Saks-Henstock, on aura, pour chaque q ∈ M ,
# q 2 J 3##
#$
# #
# 1A (x )µ(J ) −
k k
1A # ≤ !,
# J¯k #
k=1

c’est-à-dire, puisque xk ∈ A, k ∈ M ,
# q 2 J 3##
#$
# #
# µ(J ) −
k
1A # ≤ !.
# J¯k #
k=1
498 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES

En conséquence, on a, pour tout q ∈ M ,


q
$ q J
$ J
µ(J ) ≤
k
1A + ! ≤ 1A + ! = µ(A) + !,
¯k I¯
k=1 k=1 J

et le résultat s’en déduit en faisant tendre q vers l’infini dans le cas où M = N.

13.5 Ensembles négligeables


On a vu plus haut qu’une fonction de Rn dans Rp définie sur l’adhérence
I¯ d’un semi-pavé I de Rn et nulle sur int I est L-intégrable sur I¯ et son
intégrale est nulle. Toutes ces fonctions ont donc la même intégrale sur I. ¯
On avait vu également que l’intégrale d’une fonction sur un intervalle ne
dépendait pas de sa valeur aux extrémités de l’intervalle. Ce sont là des ma-
nifestations particulières d’un phénomène général en théorie de l’intégration:
l’indépendance de la propriété d’intégrabilité et de la valeur de l’intégrale
sur un ensemble par rapport aux valeurs prises par la fonction sur des par-
ties suffisamment “petites” de l’ensemble d’intégration. Dans cette sec-
tion, ces parties suffisamment “petites” pour pouvoir être négligées dans
l’opération d’intégration vont être caractérisées d’une manière indépendan-
te de la théorie de l’intégrale et de la mesure. Nous en déduirons alors
une extension des notions d’intégrabilité et de L-intégrabilité facilitant la
démonstration de l’intégrabilité d’une fonction ou d’un ensemble, et une
généralisation des théorèmes de convergence monotone et dominée.
La propriété d’approximation des parties bornées n-intégrables donnée
dans la section précédente suggère la définition suivante.
Définition. On dit que E ⊂ Rn est n-négligeable si, pour chaque ! > 0, il
existe une famille au plus dénombrable (Ek )k∈M de semi-pavés de Rn , avec
M = {0, 1, . . ., s} ou N, telle que les propriétés suivantes soient satisfaites :
!
1. E ⊂ k∈M Ek .
%
2. k∈M µ(Ek ) ≤ !.
Exemples. 1. ∅ est n-négligeable.
2. Tout singleton {a} de Rn est n-négligeable.
En effet, si ! > 0 est donné, il suffit de prendre M = {0} et
n
6
E0 = ]ai − (1/2)!1/n, ai + (1/2)!1/n].
i=1
13.5. ENSEMBLES NÉGLIGEABLES 499

3. Toute partie dénombrable de Rn est n-négligeable.


En effet, une telle partie peut s’écrire E = {ak : k ∈ N} et, si ! > 0 est
donné, il suffit de prendre M = N et

n
6
Ek = ]aki − (1/2)(!/2k+1 )1/n, aki + (1/2)(!/2k+1 )1/n], k ∈ N,
i=1

!
ce qui donne E ⊂ k∈N Ek et


$ ∞
$
µ(Ek ) = (!/2k+1 ) = !.
k=0 k=0

En particulier, N, Z et Q sont 1-négligeables, ce qui montre qu’une partie


n-négligeable n’est pas nécessairement bornée.
4. Tout hyperplan de Rn de la forme E = R × . . . × {ci} × . . . × R est
n-négligeable.
En effet, si ! > 0 est donné, il suffit de prendre M = N et, pour k ∈ N,
3 3
! !
Ek =]−(k +1), k +1]×. . .× ci − , ci + n+k+1
2 n+k+1 (k + 1) n−1 2 (k + 1)n−1

× . . . × ] − (k + 1), k + 1],
!
ce qui entraı̂ne aussitôt que E ⊂ k∈N Ek et


& ∞
'
$ $
µ(Ek ) = 2! 2 −k−2
= !.
k=0 k=0

Les propriétés suivantes des ensembles n-négligeables permettent d’en


construire d’autres.

Proposition. Si E est une partie n-négligeable de Rn et si F ⊂ E, alors F


est n-négligeable.

Démonstration. Immédiat.

Ainsi, toute partie du type [a1 , b1 ] × . . . × {ci } × . . . × [an , bn] sera n-


négligeable. En particulier, les faces et la frontière d’un pavé de Rn sont
n-négligeables.
500 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES

Proposition. Si (Fj )j∈N est une suite de parties n-négligeables de Rn , alors


!
j∈N Fj est n-négligeable.

Démonstration. Soit ! > 0. Pour chaque j ∈ N, il existe une famille


(Ekj )k∈Mj de semi-pavés de Rn , avec Mj = {0, 1, . . ., sj } ou N, telle que
> $
Fj ⊂ Ekj , µ(Ekj ) ≤ !/2j+1 .
k∈Mj k∈Mj

Dès lors, (Ekj )k∈Mj ;j∈N est une famille dénombrable de semi-pavés de Rn telle
que > > >
Fj ⊂ Ekj ,
j∈N j∈N k∈Mj

et, dès lors,


 
$ ∞
$ $ ∞
$
µ(Ekj ) =  µ(Ekj ) ≤ (!/2j+1 ) = !,
k∈Mj ;j∈N j=0 k∈Mj j=0

puisque tout réarrangement d’une série convergente à termes positifs con-


verge vers la même somme.
Ainsi, Qn est n-négligeable.
La Proposition suivante établit l’identité, parmi les ensembles bornés,
entre les parties n-négligeables et les parties n-intégrables de n-mesure nulle.
Proposition. Toute partie bornée de Rn est n-négligeable si et seulement
si elle est n-intégrable et de n-mesure nulle.
Démonstration. Condition nécessaire. Soit E un borné n-négligeable de
Rn et I un semi-pavé telH que E ⊂ I.¯ Il faut montrer que la fonction 1E est
intégrable sur I¯ et que I¯ 1E = 0. Soit ! > 0; par hypothèse, il existe une
famille au plus dénombrable (Ek )k∈M de semi-pavés de Rn telle que
> $
E⊂ Ek , µ(Ek ) ≤ !/2.
k∈M k∈M

Soit (Fk )k∈M une famille de semi-pavés tels que


$
Ek ⊂ int Fk , k ∈ M, µ(Fk ) ≤ !.
k∈M

Une telle famille est facile à construire en agrandissant légèrement les Ek .


Définissons comme suit une jauge δ sur I. ¯ Si x ∈ I¯ \ E, prenons δ(x) = 1. Si
13.5. ENSEMBLES NÉGLIGEABLES 501

x ∈ E, il existe un Ek tel que x ∈ Ek et donc tel que x ∈ int Fk . Désignons


par k(x) le plus petit entier appartenant à M tel que x ∈ int Fk , et soit
δ(x) > 0 tel que B∞ [x; δ(x)] ⊂ Fk(x) ; ce δ(x) fournit la valeur de la jauge
pour un tel x. Soit Π = {(x1 , I 1), . . . , (xm, I m)} une P-partition δ-fine de I;
alors,
m
$ $
S(I, 1E, Π) = 1E (xj )µ(I j ) = µ(I j ).
j=1 {1≤j≤m : xj ∈E}

Mais, si xj ∈ E, on a I j ⊂ B∞ [xj ; δ(xj )] ⊂ Fk(xj ), et dès lors, en posant


r = max{k(xj ) : xj ∈ E, 1 ≤ j ≤ m} et en regroupant, dans la dernière
somme, les termes pour lesquels k(xj ) prend la valeur i, on obtient
 
r
$ $
S(I, 1E , Π) =  µ(I j )
i=1 {1≤j≤m : k(xj )=i}

r
$ $
≤ µ(Fi ) ≤ µ(Fi ) ≤ !,
i=1 i∈M

et la démonstration est complète.


Condition suffisante. Soit E un borné de Rn n-intégrable et de n-mesure
nulle et soit ! > 0. Par la propriété d’approximation des parties bornées et n-
intégrables, il existe une famille au plus dénombrable (J k )k∈M de semi-pavés
mutuellement disjoints et tels que
> $
E⊂ Jk, µ(J k ) ≤ !,
k∈M k∈M

et le résultat s’en déduit aussitôt.


Terminons par une condition nécessaire utile pour qu’une partie bornée
soit de n-mesure nulle.
Proposition. Soit E une partie bornée et n-intégrable de Rn . Si E est de
n-mesure nulle, alors int E = ∅.
Démonstration. On démontre le contraposé. Si int E /= ∅, il existe a ∈ E
et r > 0 tels que B∞ [a; r] ⊂ E, et dès lors

0 < (2r)n ≤ µ(E).


502 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES

Etudions maintenant l’intégrabilité d’une fonction sur une partie bornée


n-négligeable.
Proposition. Soit A un borné de Rn et f une fonction de Rn dans Rp
définie sur A. Alors f est L-intégrable sur A et
J
|f |2 = 0
A

si et seulement si l’ensemble

S(f ) = {x ∈ A : f (x) /= 0}
H
est n-négligeable, auquel cas on a Af = 0.
Démonstration. Notons tout d’abord que
>
S(f ) = {x ∈ A : |f (x)|2 > 0} = Sk ,
k∈N∗

où
Sk = {x ∈ A : |f (x)|2 > k−1 } ⊂ Sk+1 , k ∈ N∗ .
En conséquence, S(f ) sera n-intégrable et de n-mesure nulle si et seulement
s’il en est ainsi de chaque Sk . H
Condition nécessaire. Si f est L-intégrable sur A et A |f |2 = 0, alors,
en appliquant l’inégalité de Tchebycheff à |f |2 , on voit que chaque Sk est
n-intégrable et que J
0 ≤ µ(Sk ) ≤ k |f |2 = 0,
A
ce qui montre que chaque Sk est de n-mesure nulle.
Condition suffisante. Démontrons-la tout d’abord sous l’hypothèse sup-
plémentaire que f soit bornée sur A, et soit r > 0 tel que |f (x)|2 ≤ r pour
tout x ∈ A. Soit I un semi-pavé de Rn tel que A ⊂ I, ¯ et montrons que
H
fA est L-intégrable sur I¯ et que I¯ |fA |2 = 0. Soit ! > 0; puisque S(f ) est
n-intégrable et de n-mesure nulle, il existe une jauge δ sur I¯ telle que
m
$ $
S(I, 1S(f ), Π) = 1S(f )(xj )µ(I j ) = µ(I j ) ≤ !/r,
j=1 {1≤j≤m : xj ∈S(f )}

pour toute P-partition δ-fine Π = {(x1 , I 1 ), . . ., (xm , I m)} de I, et dès lors


$
|S(I, fA, Π)|2 ≤ S(I, |fA|2 , Π) = |f (xj )|2 µ(I j )
{1≤j≤m : xj ∈S(f )}
13.5. ENSEMBLES NÉGLIGEABLES 503
$
≤ rµ(I j ) ≤ !.
{1≤j≤m : xj ∈S(f )}
H
On voit donc que fA et |fA |2 sont L-intégrables sur I¯ et que I¯ |f |2 = 0.
Passons maintenant au cas d’une fonction f quelconque. Pour chaque
k ∈ N, posons
gk = min(|f |2 , k).
Chaque fonction gk est bornée sur A, et la suite (gk )k∈N est croissante sur
A. On vérifie comme d’habitude que (gk )k∈N converge ponctuellement sur
A vers |f |2 . En outre, gk (x) = |f (x)|2 dès que k ≥ |f (x)|2, ce qui entraı̂ne
aussitôt que, pour chaque k ∈ N, S(gk ) = S(f ) est de n-mesure nulle. Le
résultat de la première partie de la démonstration
H
entraı̂ne la L-intégrabilité
de chaque gk sur A et les relations A gk = 0, k ∈ N. Une application du
théorème de Levi entraı̂ne alors l’intégrabilité de |f |2 sur A et l’égalité
J J
|f |2 = lim gk = 0.
A k→∞ A

Comme on l’a vu précédemment, cela implique l’intégrabilité de f sur A et


la démonstration est complète.

Corollaire. Si A est une partie bornée et n-négligeable de Rn , toute fonction


f de Rn dans Rp définie sur A est L-intégrable sur A et
J J
f = 0, |f |2 = 0.
A A

Démonstration. On a

S(f ) = {x ∈ A : f (x) /= 0} ⊂ A,

et S(f ) est donc n-négligeable.


Introduisons maintenant une terminologie utile.
Définition. Soit A une partie non vide de Rn . On dit qu’une propriété est
vraie presque partout sur A (en abrégé p.p. sur A) ou pour presque tout
point de A, s’il existe un ensemble E ⊂ A n-négligeable tel que la propriété
soit vraie sur A \ E.
Exemples. Soit f une fonction de Rn dans Rp.
1. f est définie p.p. sur A si A \ dom f est n-négligeable.
2. f est continue p.p. sur A s’il existe E ⊂ A n-négligeable tel que f
soit continue en chaque point de A \ E.
504 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES

3. Si g est une fonction de Rn dans Rp , f = g p.p. sur A si l’ensemble


des points x de A pour lesquels f (x) /= g(x) est n-négligeable.
On vérifie aisément que l’égalité p.p. de deux fonctions sur un ensemble
est une relation d’équivalence. On notera la différence entre une fonction
continue p.p. sur A et une fonction égale p.p. sur A à une fonction continue.
Ainsi, 1Q n’est continue en aucun point de R, alors qu’elle est égale p.p. sur
R à la fonction continue zéro.
4. Considérons une suite (fk )k∈N de fonctions de Rn dans Rp définies p.p.
sur A ⊂ Rn . Pour chaque k ∈ N, il existe Ek ⊂ A n-négligeable tel que fk soit
!
définie sur A \ Ek , et comme E = k∈N Ek est encore n-négligeable, chaque
fonction fk est définie sur A\E. On dira que (fk )k∈N converge ponctuellement
p.p. sur A vers une fonction f de Rn dans Rp s’il existe une partie n-
négligeable F de A telle que la suite converge ponctuellement vers f sur
A \ (E ∪ F ).
L’intégrabilité des fonctions sur un ensemble borné n-négligeable donnée
plus haut se formule de manière très suggestive dans la terminologie “presque
partout”.
Proposition. Soit A un borné de Rn et f uneH fonction de Rn dans Rp
définie sur A. Alors f est L-intégrable sur A et A |f |2 = 0 si et seulement
si f est égale à zéro presque partout sur A.
On en déduit aussitôt le résultat suivant.
Proposition. Soit A un borné de Rn et f une fonction de Rn dans Rp
intégrable (resp. L-intégrable) sur A. Alors toute fonction g de Rn dans Rp
définie sur A et égale p.p. sur A à f est intégrable (resp. L-intégrable) sur
A et J J
f= g.
A A

Démonstration. Par hypothèse, la fonction h = g − f est définie sur A


et égale à zéro p.p. sur A. Elle est donc L-intégrable sur A et
J
h = 0.
A

En conséquence, g = f + h est intégrable (resp. L-intégrable) sur A et


J J J J
g= f+ h= f.
A A A A
13.5. ENSEMBLES NÉGLIGEABLES 505

Notons en passant que, I¯ \ I étant n-négligeable pour tout semi-pavé I


de Rn , une fonction de Rn dans Rp sera définie p.p. sur I si et seulement si
¯ On pourra donc utiliser indifféremment l’une ou
elle est définie p.p. sur I.
l’autre terminologie.
Nous pouvons maintenant étendre les notions d’intégrabilité et de L-
intégrabilité sur un borné A de Rn aux fonctions définie p.p. sur A. Cette
extension utile se fonde sur le résultat suivant.

Proposition. Soit A un borné de Rn et f une fonction de Rn dans Rp


définie p.p. sur A. Si f possède un prolongement f˜ à A qui est intégrable
(resp. L-intégrable) sur A, alors tout autre prolongement fˆ de f à A sera
intégrable (resp. L-intégrable) sur A et l’on aura
J J
fˆ = f˜.
A A

Démonstration. Comme f est définie p.p. sur A, il existe E ⊂ A n-


négligeable tel que A \ E ⊂ dom f. Par conséquent, pour tout x ∈ A \ E, on
a
fˆ(x) − f˜(x) = f (x) − f (x) = 0,

ce qui montre que fˆ = f˜ p.p. sur A. La thèse résulte alors de la Proposition


précédente.

La définition suivante est donc justifiée.

Définition. Soit A un borné de Rn et f une fonction de Rn dans Rp définie


p.p. sur A. On dit que f est intégrable (resp. L-intégrable) sur A s’il existe
un prolongement
H
f˜ de f à A qui soit intégrable (resp. L-intégrable) surH A,
auquel cas A f , qui ne dépend pas du prolongement f˜ choisi, est noté A f
˜
et appelé l’intégrale de f sur A.

On en déduit aussitôt que deux fonctions de Rn dans Rp définies p.p.


et égales p.p. sur un borné A de Rn sont simultanément intégrables (resp.
L-intégrables) sur A, auquel cas leurs intégrales sur A sont égales.
Les propriétés élémentaires de l’intégrale, le test de comparai-
son, les théorèmes de Levi et Lebesgue, les propriétés de restriction
et d’additivité et les inégalités de Tchebycheff s’étendent à la nouvelle
définition avec des affaiblissements évidents des hypothèses. A titre indicatif,
donnons la forme généralisée du théorème de convergence majorée et
minorée de Lebesgue.
506 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES

Théorème. Soit A un borné de Rn , (fk )k∈N une suite de fonctions de Rn


dans R et f une fonction de Rn dans R. Supposons satisfaites les conditions
suivantes.
1. Chaque fk est définie p.p. et intégrable sur A.
2. La suite (fk )k∈N converge ponctuellement p.p. sur A vers f .
3. La suite (fk )k∈N est minorée p.p. sur A par une fonction h de Rn dans R
définie p.p. et intégrable sur A, et majorée p.p. sur A par une fonction H
de Rn dans R définie p.p. et intégrable sur A.
Alors f est intégrable sur A et
J J
f = lim fk .
A k→∞ A

La convergence de la suite des intégrales sur un ensemble d’une suite de


fonctions n’entraı̂ne évidemment pas la convergence ponctuelle des fonctions
sur cet ensemble. On construira facilement des contre-exemples. Pour une
suite monotone, elle entraı̂ne toutefois la convergence ponctuelle presque
partout.
Proposition. Soit A un borné de Rn et (fk )k∈N une suite de fonctions de
Rn dans R. Supposons satisfaites les conditions suivantes.
1. Chaque fk est définie p.p. et intégrable sur A.
2. La suite (fk )k∈NH est monotone p.p. sur A.
3. La suite réelle ( A fk )k∈N converge.
Alors la suite de fonctions (fk )k∈N converge ponctuellement p.p. sur A.
Démonstration. Supposons, pour fixer les idées, que (fk )k∈N soit crois-
sante p.p. sur A; en considérant si nécessaire la suite (fk − f0 )k∈N au lieu
de (fk )k∈N , on peut, sans perte de généralité, supposer que
H
fk (x) ≥ 0 pour
chaque k ∈ N et presque tout x ∈ A. Puisque la suite ( A fk )k∈N est crois-
sante et convergente, elle est majorée et nous désignerons par M un de ses
majorants. D’ailleurs, la suite réelle (fk (x))k∈N est croissante pour presque
tout x ∈ A, ce qui implique, pour presque tout x ∈ A, l’existence au sens
7
large de sa limite. Posons F = k∈N dom fk et
E = {x ∈ A ∩ F : lim fk (x) = +∞}.
k→∞

La Proposition revient à montrer que E est de n-mesure nulle. Comme


E = {x ∈ A ∩ F : (∀j ∈ N∗ )(∃m ∈ N∗ )(∀k ≥ m) : fk (x) ≥ j},
on a " > "
E= Fkj ,
j∈N∗ m∈N∗ k≥m
13.5. ENSEMBLES NÉGLIGEABLES 507

où l’on a posé


Fkj = {x ∈ A ∩ F : fk (x) ≥ j},
pour tous les j et k dans N∗ . Par l’hypothèse 1 et l’inégalité de Tchebycheff,
chaque Fkj est n-intégrable et
J
µ(Fkj ) ≤ j −1 fk ≤ j −1 M.
A
D’autre part, on a
Fkj+1 ⊂ Fkj ⊂ Fk+1
j
,
ce qui entraı̂ne " j
Fk = Fm
j
,
k≥m
pour tous les j et k dans N∗ . Pour chaque j ∈ N∗ fixé, la suite
 
"
 Fkj  = (Fm
j
)m∈N∗
k≥m m∈N∗
est donc une suite croissante de parties n-intégrables de A. Il en résulte que
> " >
Fkj = j
Fm
m∈N∗ k≥m m∈N∗

est également n-intégrable et, pour chaque j ∈ N∗ ,


 
> "
µ Fkj  = lim µ(Fm
j
) ≤ j −1 M.
m→∞
m∈N∗ k≥m
!
Si nous posons maintenant F j = m∈N∗
j , alors
Fm
"
E= Fj,
j∈N∗

avec chaque F n-intégrable et tel que


j

µ(F j ) ≤ j −1 M.
Enfin, les propriétés des Fm
j entraı̂nent les relations
> >
F j+1 = j+1
Fm ⊂ j
Fm = Fj,
m∈N∗ m∈N∗

pour chaque j ∈ N∗ ,
c’est-à-dire la décroissance de la suite (F j )j∈N∗ . Par
7
conséquent, E = j∈N∗ F j est n-intégrable et
0 ≤ µ(E) = lim µ(F j ) ≤ lim j −1 M = 0;
j→∞ j→∞

la démonstration est complète.


508 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES

En combinant ce résultat à l’extension de la notion d’intégrale que nous


venons de donner et au théorème de Levi, nous obtenons l’intéressante
généralisation du théorème de convergence monotone de Levi.
Théorème. Soit A un borné de Rn et (fk )k∈N une suite de fonctions de Rn
dans R. Supposons satisfaites les conditions suivantes.
1. Chaque fk est définie p.p. et intégrable (resp. L-intégrable) sur A.
2. La suite (fH k )k∈N est monotone p.p. sur A.
3. La suite ( A fk )k∈N converge.
Alors la suite (fk )k∈N converge ponctuellement p.p. sur A vers une fonction
f définie p.p. et intégrable (resp. L-intégrable) sur A et l’on a
J J
f = lim fk .
A k→∞ A

Le lecteur formulera aisément la version correspondante pour une série


de fonctions.

13.6 Intégrabilité sur une partie non bornée


L’extension de la notion d’intégrale de Denjoy-Perron à des parties non bor-
nées de Rn lorsque n ≥ 2 est un problème délicat qui attend encore sa
solution définitive. Nous nous contenterons dès lors de développer cette
extension dans l’important cas particulier de la L-intégrabilité, en modelant
la définition sur une condition nécessaire et suffisante de L-intégrabilité sur
un borné obtenue dans l’étude de l’additivité complète.
Définition. Soit A une partie non bornée de Rn et f une fonction de Rn
dans Rp définie p.p. sur A. On dit que f est L-intégrable sur A si les con-
ditions suivantes sont satisfaites.
1. f est L-intégrable sur Ak = A ∩ B∞ [0; k] pour chaque k ∈ N∗ .
H
2. limk→∞ Ak |f |2 existe.
La définition de l’intégrale de f sur A requiert le résultat suivant.
Proposition.
H
Si f est L-intégrable sur l’ensemble non borné A de Rn , alors
limk→∞ Ak f existe.
Démonstration. Pour chaque 1 ≤ j ≤ p et chaque x ∈ dom f, on a

0 ≤ fj+ (x) ≤ |fj (x)| ≤ |f (x)|2 , 0 ≤ fj− (x) ≤ |fj (x)| ≤ |f (x)|2 ,
13.6. INTÉGRABILITÉ SUR UNE PARTIE NON BORNÉE 509

et, puisque chacune de ces fonctions est L-intégrable sur Ak quel que soit
k ∈ N∗ , on a
J J J J
0≤ fj+ ≤ |f |2 , 0 ≤ fj− ≤ |f |2 ,
Ak Ak Ak Ak

quels que soient k ∈ N∗ et 1 ≤ j ≤ p. Comme Ak ⊂ Ak+1 pour tout k ∈ N∗ ,


les suites 4J 5 4J 5 4J 5
fj+ , fj− , |f |2 ,
Ak k∈N∗ Ak k∈N∗ Ak k∈N∗
sont croissantes pour chaque 1 ≤ j ≤ p et la dernière est convergente par
hypothèse. La convergence des autres découle
H
alors du test de comparaison
et entraı̂ne la convergence de chaque suite ( Ak fj )k∈N∗ , (1 ≤ j ≤ p), puisque
J J
fj = (fj+ − fj− ), 1 ≤ j ≤ p.
Ak Ak

Définition. Si f est L-intégrable


H
sur l’ensemble non borné A de RnH , l’inté-
grale de f sur A, notée A f est l’élément de Rp défini par limk→∞ Ak f.
Exemples. 1. La fonction
H
constante 1 n’est pas L-intégrable sur Rn . Pour
chaque k ∈ N , on a B∞ [0;k] 1 = (2k)n, et (2k)n → ∞ si k → ∞.

2. La fonction f de Rn dans R définie par

f (x) = 1, x ∈ B∞ [0; 1],


1
f (x) = , x ∈ B∞ [0; k] \ B∞ [0; k − 1], k ≥ 2,
kn
est L-intégrable sur Rn . En effet, on a
J
f = 2n ,
B∞ [0;1]

J J k J
$
f= f+ f
B∞ [0;k] B∞ [0;1] j=2 B∞ [0;j]\B∞[0;j−1]
 
k
$ k
$
−n
= 2 +k
n  (2j) −
n
(2(j − 1)) n
= 2n+1 − 2n k−n ,
j=2 j=2

et dès lors J
lim f = 2n+1 .
k→∞ B∞ [0;k]
510 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES

Les propriétés élémentaires de la L-intégrale sur un borné, ainsi


que le test de comparaison s’étendent aussitôt, via la définition ci-dessus,
à l’intégrale sur une partie non bornée. Montrons qu’il en est de même pour
le théorème de convergence monotone de Levi.
Théorème. Soit A une partie non bornée de Rn et (fk )k∈N une suite de
fonctions de Rn dans R. Supposons satisfaites les conditions suivantes.
1. Chaque fk est définie p.p. et L-intégrable sur A.
2. La suite de fonctions
H
(fk )k∈N est monotone p.p. sur A.
3. La suite réelle ( A fk )k∈N converge.
Alors la suite de fonctions (fk )k∈N converge ponctuellement p.p. sur A vers
une fonction f définie p.p. et L-intégrable sur A, et l’on a
J J
f = lim fk .
A k→∞ A

Démonstration. Supposons pour fixer les idées que (fk )k∈N soit crois-
sante. En considérant la suite (fk − f0 )k∈N au lieu de (fk )k∈N , on peut
toujours, sans perte de généralité, supposer que fk (x)H ≥ 0 pour presque tout
x ∈ A et chaque k ∈ N. Si nous posons J = limk→∞ A fk , alors
& J '
J = lim lim fk .
k→∞ q→∞ Aq
H
Pour chaque q ∈ N∗ fixé, la convergence de la suite croissante ( Aq fk )k∈N
résulte des inégalités J J
fk ≤ fk , k ∈ N,
Aq A
et de l’hypothèse 3. On peut donc appliquer le théorème de Levi sur un borné
à la suite (fk )k∈N restreinte à Aq et en déduire l’existence d’une fonction f q
définie p.p. et L-intégrable sur Aq , telle que (fk )k∈N converge ponctuellement
p.p. sur Aq vers f q et telle que
J J J
f q = lim fk ≤ lim fk = J.
Aq k→∞ Aq k→∞ A

Notons aussi qu’on a nécessairement f q+1 = f q p.p. sur Aq pour chaque


q ∈ N∗ et que l’on peut ainsi définir p.p. sur A une fonction f par la relation
f = f q p.p. sur Aq , q ∈ N∗ . Cette fonction fH est évidemment H
supérieure
ou égale à zéro p.p. sur A et, comme la suite ( Aq f )q∈N∗ = ( Aq f q )q∈N∗ est
croissante et majorée par J, elle converge et l’on a
J
lim f ≤ J.
q→∞ Aq
13.6. INTÉGRABILITÉ SUR UNE PARTIE NON BORNÉE 511

Il reste à démontrer que J


lim f = J.
q→∞ Aq

Soit ! > 0; par l’expression de J comme double limite donnée plus haut, il
existe m ∈ N∗ tel que
J
J − (!/2) ≤ lim fk ≤ J,
q→∞ Aq

lorsque k ≥ m. En conséquence, il existe r ∈ N∗ tel que


J
J −! ≤ fm ≤ J,
Aq

dès que q ≥ r. La croissance de la suite (fk )k∈N entraı̂ne alors que pour tout
q ≥ r et tout k ≥ m, on a
J
J−!≤ fk ≤ J;
Aq

dès lors, pour tout q ≥ r, on aura


J
J − ! ≤ lim fk ≤ J,
k→∞ Aq

et la démonstration est complète.


Comme la définition et les propriétés correspondantes de l’intégration sur
un borné impliquent aisément que max(f, g) et min(f, g) sont L-intégrables
sur un non-borné de Rn lorsque les fonctions réelles f et g le sont, on peut
étendre à l’intégrale sur une partie non bornée la méthode utilisée dans le
cas d’un pavé fermé pour déduire le théorème de convergence majorée et
minorée de Lebesgue du théorème de Levi. Le théorème de convergence
majorée et minorée de Lebesgue tel qu’il est énoncé dans la section
précédente reste donc valable lorsque A est non borné.
Etendons maintenant la notion d’ensemble n-intégrable au cas non borné.
Définition. Soit A une partie non bornée de Rn . On dit que A est n-
intégrable si sa fonction
H
caractéristique 1A est L-intégrable sur Rn , auquel
cas le nombre positif Rn 1A est noté µ(A) et appelé sa n-mesure (sa longueur
si n = 1, son aire d’un ensemble plan si n = 2, son volume si n = 3).
Exemple. Soit A la partie non bornée de R2 définie par

A = ({0} × [0, 1]) ∪ {(x, y) : 0 ≤ y ≤ 1/k2 si x ∈]k − 1, k], k ∈ N∗ }.


512 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES

Pour chaque k ∈ N∗ , on a

Ak = ({0} × [0, 1]) ∪ {(x, y) : 0 ≤ y ≤ 1/j 2 si x ∈]j − 1, j], 1 ≤ j ≤ k},


%
et dès lors Ak est 2-intégrable avec µ(Ak ) = kj=1 (1/j 2). Comme la série
%
j∈N∗ (1/j ) converge, A est 2-intégrable.
2

Les propriétés élémentaires des parties n-intégrables bornées ainsi


que les propriétés d’intégrabilité de l’intersection d’une suite dé-
croissante de parties bornées n-intégrables s’étendent aussitôt, avec le mê-
me énoncé, au cas non borné. Dans le cas d’une suite croissante (Ak )k∈N de
!
parties non bornées, il faut remplacer l’hypothèse que k∈N Ak soit bornée
par la condition que (µ(Ak ))k∈N soit majorée et utiliser dans la démons-
tration la version que nous venons de donner du théorème de Levi. On
en déduit la sous-additivité complète de la mesure: si (Ak )k∈N est une
% !
suite de parties n-intégrables et si n∈N µ(Ak ) converge, alors k∈N Ak est
! %
n-intégrable et µ( k∈N Ak ) ≤ k∈N µ(Ak ). On vérifie également que les pro-
priétés de L-intégrabilité pour la restriction à une partie n-intégrable
bornée ou non d’une fonction L-intégrable sur un ensemble non
borné, l’additivité finie ou complète de la L-intégrale et l’inégalité de
Tchebycheff s’étendent sans peine au cas non borné. Il en est de même
des propriétés des ensembles de n-mesure nulle et de l’équivalence
entre une partie n-négligeable et une partie de n-mesure nulle.

13.7 Ensembles et fonctions mesurables


L’extension suivante de la classe des parties n-intégrables de Rn joue un
grand rôle en analyse.
Définition. On dit qu’une partie A de Rn est n-mesurable si Ak = A ∩
B∞ [0; k] est n-intégrable pour chaque k ∈ N∗ .
A est donc n-mesurable si et seulement si la fonction 1A est intégrable
sur B∞ [0; k] pour chaque k ∈ N∗ . Toute partie n-intégrable de Rn est
évidemment n-mesurable, mais Rn , qui est évidemment n-mesurable puisque
chaque fermé borné B∞ [0; k] est n-intégrable, n’est pas n-intégrable puisque
µ(B∞ [0; k]) = (2k)n tend vers l’infini si k tend vers l’infini. Pour les par-
ties bornées, il y a évidemment identité entre les parties n-intégrables et les
parties n-mesurables.
Proposition. Tout ouvert de Rn est n-mesurable.
13.7. ENSEMBLES ET FONCTIONS MESURABLES 513

Démonstration. Si E ⊂ Rn est ouvert et si k ∈ N∗ , alors


Ek = E ∩ B∞ [0; k] = (E ∩ B∞ (0; k)) ∪ (E ∩ fr B∞ [0; k])
est l’union d’un ouvert borné et d’une partie n-négligeable et est par consé-
quent n-intégrable.

Proposition. Tout fermé de Rn est n-mesurable.


Démonstration. Si F ⊂ Rn est fermé et si k ∈ N∗ , alors F ∩ B∞ [0; k] est
fermé et borné, et donc n-intégrable.

Corollaire. L’intérieur, l’adhérence et la frontière d’une partie quelconque


de Rn sont n-mesurables.
Donnons quelques propriétés élémentaires des ensembles n-mesurables.
Proposition. Si A, B et Ak , k ∈ N sont des parties n-mesurables de Rn ,
! 7
alors A \ B, k∈N Ak et k∈N Ak sont n-mesurables.
Démonstration. Conséquence immédiate de la définition et des propriétés
des parties n-intégrables.

Proposition. Toute partie n-mesurable contenue dans une partie n-inté-


grable est n-intégrable.
Démonstration. Soit A n-mesurable contenue dans B n-intégrable. Si
Ak = A ∩ B∞ [0; k], on a 1Ak (x) ≤ 1B (x) pour chaque x ∈ Rn , la suite
(1Ak )k∈N converge ponctuellement sur Rn vers 1A et 1B est L-intégrable sur
Rn . La thèse résulte du théorème de convergence majorée et minorée de
Lebesgue.
L’inégalité de Tchebycheff suggère l’introduction d’une classe de fonc-
tions réelles qui sera aux fonctions réelles L-intégrables ce que les parties
n-mesurables sont aux parties n-intégrables.
Définition. Soit f une fonction de Rn dans R définie p.p. sur A ⊂ Rn . On
dit que f est n-mesurable sur A si, pour chaque r ∈ R l’ensemble
A[f > r] = {x ∈ A : f (x) > r}
est n-mesurable.

Proposition. Si f est n-mesurable sur A, alors A est n-mesurable.


!
Démonstration. On a A = k∈N A[f > −k] et chaque ensemble A[f >
−k] est n-mesurable.
514 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES

On étend la définition aux fonctions à valeurs dans Rp en passant aux


composantes.
Définition. Soit f une fonction de Rn dans Rp définie p.p. sur A ⊂ Rn . On
dit que f est n-mesurable sur A si chaque composante fj de f est n-mesurable
sur A.
Il suffit donc d’étudier la n-mesurabilité des fonctions réelles. La termi-
nologie est justifiée par le résultat suivant.
Proposition. Une partie A de Rn est n-mesurable si et seulement si la
fonction constante 1 est n-mesurable sur A.
Démonstration. La condition suffisante résulte de la Proposition qui
précède. Pour la condition nécessaire, A[1 > r], égal à A si r < 1 et vide si
r ≥ 1 est n-mesurable pour tout r ∈ R.
Les caractérisations suivantes des fonctions n-mesurables sont souvent
utiles.
Proposition. Soit f une fonction réelle définie p.p. sur une partie n-
mesurable A de Rn . Les quatre conditions suivantes sont équivalentes.
1. A[f > r] = {x ∈ A : f (x) > r} est n-mesurable pour chaque r ∈ R.
2. A[f ≥ r] = {x ∈ A : f (x) ≥ r} est n-mesurable pour chaque r ∈ R.
3. A[f < r] = {x ∈ A : f (x) < r} est n-mesurable pour chaque r ∈ R.
4. A[f ≤ r] = {x ∈ A : f (x) ≤ r} est n-mesurable pour chaque r ∈ R.
Démonstration. C’est une conséquence facile des relations, aisément
vérifiées,
"
A[f ≥ r] = A[f > r − (1/k)], A[f < r] = A \ A[f ≥ r],
k∈N∗
"
A[f ≤ r] = A[f > r + (1/k)], A[f > r] = A \ A[f ≤ r],
k∈N∗

et des propriétés élémentaires des parties n-mesurables.


Le résultat suivant montre que l’ensemble des fonctions n-mesurables est
stable pour de très nombreuses opérations d’algèbre et d’analyse.
Proposition. Si f et g sont des fonctions réelles n-mesurables sur A ⊂ Rn ,
et si (fk )k∈S est une famille finie ou une suite de telles fonctions, on a les
propriétés suivantes.
1. cf + b est n-mesurable sur A pour chaque b, c ∈ R.
2. f + g est n-mesurable sur A.
13.7. ENSEMBLES ET FONCTIONS MESURABLES 515

3. f 2 est n-mesurable sur A.


4. f g est n-mesurable sur A.
5. f est n-mesurable sur B pour toute partie n-mesurable B de A.
6. 1/f est n-mesurable sur A si f (x) /= 0 p.p. sur A.
7. La fonction supk∈S fk donnée par [supk∈S fk ](x) = supk∈S [fk (x)] est n-
mesurable sur A lorsqu’elle y est définie p.p..
8. La fonction inf k∈S fk donnée par [inf k∈S fk ](x) = inf k∈S [fk (x)] est n-
mesurable sur A lorsqu’elle y est définie p.p..
9. Si (fk )k∈N converge ponctuellement p.p. sur A vers f , alors f est n-
mesurable sur A.
10. f + , f − et |f |s sont n-mesurables sur A pour tout s > 0.
Démonstration. 1. Si c = 0, A[b > r] = A si r < b et est vide si r ≥ b; il
est donc n-mesurable. Si c > 0, on a A[cf + b > r] = A[f + (b/c) > r/c] =
A[f > (r − b)/c] qui est n-mesurable quel que soit r ∈ R. Si c < 0 on a
A[cf + b > r] = A[f + (b/c) < r/c] = A[f < (r − b)/c] et l’on conclut de
même.
2. Pour tout r ∈ R, on a A[f + g > r] = A[f > r − g]. Si f (x) > r − g(x),
il existe un rationnel q tel que f (x) > q > r − g(x), et réciproquement, s’il
existe un rationnel q tel que f (x) > q et r − g(x) < q, alors f (x) > r − g(x).
Par conséquent,
>
A[f > r − g] = (A[f > q] ∩ A[r − g < q]),
q∈Q

et le résultat découle des propriétés des parties n-mesurables puisque Q est


dénombrable et les ensembles A[f > q] et A[r − g < q] sont n-mesurables.
3. Résulte de ce que A[f 2 > r] = A si r < 0 et

A[f 2 > r] = A[f > r 1/2] ∪ A[f < −r 1/2]

si r ≥ 0.
4. On a f g = (1/2)[(f +g)2 −f 2 −g 2 ] et le résultat découle des propriétés
1, 2 et 3.
5. Pour tout r ∈ R, B[f > r] = B ∩ A[f > r] est n-mesurable.
6. Notons tout d’abord que A[f = 0] = {x ∈ A : f (x) = 0} est n-
négligeable et donc de n-mesure nulle, et dès lors A[f /= 0] = {x ∈ A :
f (x) /= 0} = A\A[f = 0] est n-mesurable. En outre, si r > 0, A[(1/f ) > r] =
A[f /= 0] ∩ A[f < (1/r)] est n-mesurable tandis que si r < 0, A[(1/f ) > r] =
A[(1/f ) > 0] ∪ A[f < (1/r)] est également n-mesurable. Enfin, A[(1/f ) >
0] = A[f > 0] est n-mesurable et le résultat s’ensuit.
516 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES

!
7. Montrons que A[supk∈S fk > r] = k∈S A[fk > r] pour tout r ∈ R.
Si [supk∈S fk ](x) > r, il existe, par la caractérisation du supremum (ou
trivialement si S est fini) un k0 ∈ S tel que fk0 (x) − r > 0 et dès lors
x ∈ A[fk0 > r]. Réciproquement, si fk (x) > r pour un certain k ∈ S, alors
[supk∈S fk ](x) > r. La thèse en résulte aisément.
8. Soit r ∈ R. On montre comme ci-dessus que A[inf k∈S fk < r] =
!
k∈S A[fk < r] et l’on conclut de la même manière.
9. Un argument utilisé dans l’étude des tests de la racine ou du quotient
montre que, pour presque tout x ∈ A, on a

f (x) = inf ∗ sup fk (x) = sup inf fk (x),


m∈N k≥m m∈N∗ k≥m

et la thèse résulte alors des propriétés 7 et 8.


10. On a f + = max(f, 0), f − = max(−f, 0), |f | = f + + f − , et la thèse
résulte des propriétés 7 et 2 et du raisonnement fait en 3 pour le cas de |f |s.

Donnons maintenant deux classes importantes de fonctions n-mesurables.


Proposition. Toute fonction réelle continue p.p. sur une partie n-mesura-
ble A de Rn est n-mesurable sur A.
Démonstration. Si f est une telle fonction, sa continuité sur A \ B avec
B de n-mesure nulle entraı̂ne que pour chaque r ∈ R, (A \ B)[f > r] =
(A \ B) ∩ E pour un certain ouvert E de Rn . Comme tout ouvert est n-
mesurable, le résultat s’ensuit.

Proposition. Toute fonction réelle définie p.p. et L-intégrable sur une


partie n-mesurable A de Rn est n-mesurable sur A.
Démonstration. Si f est une telle fonction, on peut toujours, en passant
à f et f − , supposer sans perte de généralité que f (x) ≥ 0 pour presque
+

tout x ∈ A. Par hypothèse, f est L-intégrable sur l’ensemble n-mesurable


Ak = A ∩ B∞ [0; k] pour chaque k ∈ N∗ . Dès lors, si r > 0, l’inégalité de
Tchebycheff entraı̂ne la n-intégrabilité, et donc la n-mesurabilité de Ak [f >
r]; d’autre part, si r ≤ 0, Ak [f ≥ r] = Ak est également n-mesurable. Il en
!
résulte aussitôt que A[f ≥ r] = k∈N∗ Ak [f ≥ r] est n-mesurable quel que
soit r ∈ R.
La réciproque de cette proposition est fausse : la fonction constante 1
est n-mesurable sur Rn sans y être L-intégrable. Même si A est n-intégrable,
une fonction peut-être n-mesurable sur A sans y être L-intégrable. Ainsi, la
13.7. ENSEMBLES ET FONCTIONS MESURABLES 517

fonction f définie sur ]0, 1] par f (x) = 1/x est 1-mesurable sur ]0, 1] puisque
qu’elle y est continue alors qu’une application facile du théorème de Hake
montre qu’elle n’est pas intégrable sur ]0, 1]. Nous allons toutefois établir un
important test de comparaison de L-intégrabilité sur A pour les fonctions
n-mesurables sur A. Sa démonstration nécessite l’introduction de quelques
concepts et résultats préliminaires.
Définition. Soit E une partie de Rn et s une fonction de Rn dans Rp . On
dit que s est simple sur E si s est définie sur E et si s(E) est une partie finie
de Rp.
Si s est simple sur E, si s(E) = {y 1 , . . . , y r } et si Ej = s−1 ({y j }) = {x ∈
E : s(x) = y j }, 1 ≤ j ≤ r, on aura, pour tout x ∈ E,
r
$
s(x) = 1Ej (x).y j .
j=1

Par conséquent, toute fonction simple sur E peut s’écrire comme une somme
finie de produits, par des éléments de Rp , de fonctions caractéristiques de
parties de E qui partitionnent cet ensemble. Nous allons montrer que toute
fonction réelle définie sur un ensemble est la limite ponctuelle sur cet ensem-
ble d’une suite de fonctions simples.
Proposition. Soit f une fonction réelle définie sur une partie E de Rn .
Alors il existe une suite (sk )k∈N∗ de fonctions simples sur E qui converge
ponctuellement sur E vers f et une suite (tk )k∈N∗ croissante sur E de fonc-
tions simples et positives sur E convergeant ponctuellement sur E vers |f |.
Si f est bornée sur E, la suite ainsi obtenue converge uniformément sur E
vers f .
Démonstration. Supposons tout d’abord que f (x) ≥ 0 pour tout x ∈ E.
Définissons Ekj et Fk pour 1 ≤ j ≤ k.2k , k ∈ N∗ par

Ekj = {x ∈ E : 2−k (j − 1) ≤ f (x) < 2−k j}, Fk = {x ∈ E : f (x) ≥ k},

et sk : Rn → R par
k.2 k
$
sk (x) = 2−k (j − 1).1E j (x) + k.1Fk (x).
k
j=1

Etant donnés x ∈ E et ! > 0, choisissons m ∈ N∗ tel que m > f (x) et


2−m ≤ !; on aura donc f (x) < k pour tout k ≥ m et il existera donc un
518 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES

1 ≤ j ≤ k.2k tel que x ∈ Ekj . En conséquence,


sk (x) = 2−k (j − 1), 2−k (j − 1) ≤ f (x) < 2−k j,
et donc
0 ≤ f (x) − sk (x) < 2−k ≤ 2−m ≤ !.
On voit ainsi que la suite (sk )k∈N∗ converge ponctuellement sur E vers f .
Notons en outre que si f est majorée par M sur E, la convergence sera
uniforme sur E puisqu’on pourra toujours prendre m > M et 2−m ≤ ! dans
le raisonnement ci-dessus. Montrons maintenant que la suite (sk )k∈N∗ est
croissante sur E. Soient x ∈ E et k ∈ N∗ ; si f (x) ≥ k + 1, alors, puisque
f (x) > k, on a
sk+1 (x) = k + 1 > k = sk (x);
si k ≤ f (x) < k + 1, il existe 2k+1 k ≤ j ≤ 2k+1 (k + 1) tel que
k ≤ 2−k−1 (j − 1) ≤ f (x) < 2−k−1 j,
et dès lors
sk+1 (x) = 2−k−1 (j − 1) ≥ k = sk (x);
enfin, si f (x) < k, il existera 1 ≤ j < k.2k+1 tel que
2−k−1 (j − 1) ≤ f (x) < 2−k−1 j,
et il existera 1 ≤ l < k.2k tel que
2−k (l − 1) ≤ f (x) < 2−k l,
ce qui entraı̂ne
sk+1 (x) = 2−k−1 (j − 1), sk (x) = 2−k (l − 1).
Comme
2(l − 1)2−k−1 ≤ f (x) < (2l)2−k ,
on a
2l − 2 = 2(l − 1) ≤ j − 1 < j ≤ 2l,
et par conséquent,
sk+1 (x) = 2−k−1 (j − 1) ≥ 2−k−1 2(l − 1) = 2−k (l − 1) = sk (x);
la croissance est démontrée.
Lorsque f (x) n’est pas positive pour tout x ∈ E, on applique séparément
la construction ci-dessus à f + et à f − et comme les suites associées res-
pectivement à f + et à f − sont croissantes, leur somme sera croissante et
convergera ponctuellement sur E vers |f |.
13.7. ENSEMBLES ET FONCTIONS MESURABLES 519

Corollaire. Si f est une fonction réelle n-mesurable sur E ⊂ Rn , alors les


suites de fonctions simples construites dans la proposition précédente sont
formées de combinaisons linéaires de fonctions caractéristiques de parties
n-mesurables de E et sont donc n-mesurables sur E.
Démonstration. Supposons tout d’abord que f (x) ≥ 0 pour tout x ∈ E
et reprenons les notations de la démonstration de la proposition précédente.
Pour chaque r ≥ 0, posons Fr = {x ∈ E : f (x) ≥ r}, ce qui entraı̂ne aussitôt
que Fs ⊂ Fr si s > r, et Ekj = F2−k (j−1) \ F2−k j . On en déduit aussitôt que,
pour chaque k ∈ N∗ et chaque x ∈ Rn , on a
k
2 k
$
sk (x) = 2−k (j − 1)[1F2−k (j−1) − 1F2−k j (x)] =
j=1

k
2 k
$
2−k (j − 1)[1F2−k (j−1) − 1F2−k j (x)].
j=2

En vertu de la n-mesurabilité de f sur E, chaque fonction 1F2−k j et 1Fk est


n-mesurable, et le résultat s’en déduit. Si f n’est pas positive sur E, il suffit
de considérer séparément f + et f − .
Nous pouvons maintenant énoncer et démontrer un très utile test de
comparaison pour la L-intégrabilité des fonctions n-mesurables.
Théorème. Soit f une fonction réelle définie p.p. et n-mesurable sur A ⊂
Rn . S’il existe une fonction positive g L-intégrable sur A et telle que, pour
presque tout x ∈ A, on ait

|f (x)| ≤ g(x),

alors f est L-intégrable sur A.


Démonstration. Supposons tout d’abord que f soit positive p.p. sur A.
Par le corollaire ci-dessus, il existe une suite croissante (sk )k∈N∗ de fonctions
positives p.p. et n-mesurables sur A, explicitement donnée dans le corollaire,
qui converge ponctuellement p.p. sur A vers f . En outre, si l’on pose
Fr = {x ∈ A : f (x) ≥ r} et Gr = {x ∈ A : g(x) ≥ r}, on aura évidemment
Fr ⊂ Gr pour chaque r ∈ R. Comme l’inégalité de Tchebycheff entraı̂ne la n-
intégrabilité de Gr pour chaque r > 0, chaque ensemble Fr sera également n-
intégrable pour chaque r > 0. Dès lors, chaque fonction sk sera L-intégrable
sur A et telle que, pour presque tout x ∈ A, on a

0 ≤ sk (x) ≤ f (x) ≤ g(x), k ∈ N∗ ,


520 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES

Le théorème de convergence majorée et minorée de Lebesgue entraı̂ne alors


la L-intégrabilité de f sur A. Si f n’est pas positive p.p. sur A, on ap-
plique le résultat que nous venons de démontrer séparément à f + et f − et
la démonstration est complète.

Corollaire. Toute fonction réelle n-mesurable sur A ⊂ Rn dont la valeur


absolue est L-intégrable sur A, est elle-même L-intégrable sur A.
Démonstration. Prendre g = |f | dans le test de comparaison.
On a aussi un intéressant résultat sur la L-intégrabilité d’un produit de
fonctions.
Corollaire. Si f est une fonction réelle L-intégrable sur A ⊂ Rn et g une
fonction réelle n-mesurable et bornée p.p. sur A, alors f g est L-intégrable
sur A.
Démonstration. On sait que f g est n-mesurable sur A et si M est un
majorant p.p. de |g| sur A, on aura, pour presque tout x ∈ A,

|f (x)g(x)| ≤ M |f (x)|,

et le test de comparaison permet de conclure puisque M |f | est L-intégrable


sur A.
Exemple. Soit f une fonction réelle L-intégrable sur I = [0, 2π]. Le dernier
corollaire implique que, pour chaque k ∈ N, les fonctions x 2→ f (x) cos kx
et x 2→ f (x) sin kx sont également L-intégrables sur I. Les nombres réels
a0 , ak , bk , k ∈ N∗ définis par les formules
J 2π J 2π
a0 = (2π)−1 f (x) dx, ak = π −1 f (x) cos kx dx,
0 0
J 2π
bk = π −1 f (x) sin kx dx, k ∈ N∗ ,
0
sont appelés les coefficients de Fourier de f , et la série trigonométrique
correspondante $
a0 + (ak cos kx + bk sin kx)
k∈N∗

s’appelle la série de Fourier de f . L’étude de la convergence de cette


série est un problème délicat qui ne sera pas abordé ici. Ainsi, Andrej
N. Kolmogorov a donné en 1926 un exemple de fonction L-intégrable
sur I dont la série de Fourier diverge partout sur I ! Il a fallu attendre
13.7. ENSEMBLES ET FONCTIONS MESURABLES 521

1966 pour que Lennart Carleson démontre que la série de Fourier de


f converge ponctuellement p.p. sur I vers f sous l’hypothèse plus forte
que f soit 1-mesurable sur I et f 2 soit L-intégrable sur I (ce qui entraı̂ne
la L-intégrabilité de f sur I par le test de comparaison ci-dessus puisque
|f (x)| ≤ (1/2)(1 + |f (x)|2 )). Ce résultat avait été conjecturé par Nicolas
N.Lusin en 1913 ! Même pour le cas encore plus particulier d’une fonction
f continue sur I, on n’a pas nécessairement convergence ponctuelle partout
sur I de la série de Fourier de f vers f . Par contre, si f est de classe C 1 sur I
et si f (0) = f (2π), on peut démontrer que la série de Fourier de f converge
uniformément sur I vers f . La théorie des séries de Fourier et ses diverses
extensions ont joué et jouent encore un rôle absolument fondamental dans
le développement des mathématiques pures et appliquées.
Une autre conséquence utile du test de comparaison est le résultat sui-
vant.
Corollaire. Si f est une fonction réelle continue sur un fermé borné A de
Rn , alors f est L-intégrable sur A.
Démonstration. A, fermé et borné, est n-intégrable et f , continue sur A,
y est n-mesurable. D’autre part, le théorème de Weierstrass entraı̂ne que f
est bornée sur A et la thèse résulte du test de comparaison ci-dessus et du
fait que toute fonction constante sur A y est L-intégrable.
Les notions de fonctions L-intégrables et n-mesurables permettent d’in-
troduire de nouvelles notions de convergence pour les suites de fonctions: la
convergence en moyenne et la convergence en moyenne quadratique.
Définition. Si (fk )k∈N est une suite de fonctions de Rn dans Rp L-inté-
grables sur A (resp. n-mesurables sur A et telles que chaque |fk |22 soit L-
intégrable sur A), et si f est une fonction de Rn dans Rp L-intégrable sur A
(resp. n-mesurable sur A et telle que |f |22 soit L-intégrable sur A), on dit que
(fk )k∈N converge en moyenne sur A (resp. converge en moyenne quadratique
sur A) vers f si la suite
4J 5 4J 5
|fk − f |2 (resp. |fk − f |22 )
A k∈N A k∈N

converge vers zéro.


On a également une notion importante de convergence pour les suites de
fonctions n-mesurables: la convergence en mesure.
Définition. Si (fk )k∈N est une suite de fonctions de Rn dans R n-mesu-
rables sur A, on dit que (fk )k∈N converge en mesure sur A vers f si, pour
522 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES

chaque k ∈ N suffisamment grand et chaque ! > 0, l’ensemble {x ∈ A :


|fk (x) − f (x)| ≥ !} est n-intégrable et si

lim µ ({x ∈ A : |fk (x) − f (x)| ≥ !}) = 0.


k→∞

Cette notion joue un rôle important en calcul des probabilités.


Le lien entre ces types de convergence et ceux déjà introduits sera étudié
au Chapitre 17.

13.8 Exercices
1. Montrer que tout borné n-intégrable de mesure non nulle contient un
ensemble qui n’est pas n-intégrable. Suggestion : soit E ⊂ B∞ [ρ] ⊂ Rn un
tel borné et définissons-y la relation d’équivalence x = y si et seulement
si x − y ∈ Qn ; soit (Eα)α∈A la partition correspondante de E en classes
d’équivalence; si x ∈ Eα, alors Eα = (x + Qn ) ∩ E est dénombrable et donc
n-négligeable; en déduire que A est non dénombrable (puisque µ(E) > 0);
par l’axiome du choix, on choisit, pour chaque α ∈ A, un xα ∈ Eα et l’on
définit F par F = {xα : α ∈ A}; F n’est pas dénombrable et, pour r ∈ Qn ,
on pose Fr = r + F (noter que Fr ∩ Fr" = ∅ si r /= r $ ) et
> > >
G= Fr = (xα + r) ⊃ E;
r∈Qn ; |r|∞ ≤2ρ r∈Qn ; |r|∞ ≤2ρ α∈A

si F est n-intégrable, G l’est aussi et dès lors, si µ(F ) = 0, alors


$
µ(E) = µ(Fr ) = 0,
r∈Qn , |r|∞ ≤2ρ

(contradiction), tandis que si µ(F ) > 0, alors


$
µ(G) ≤ µ(Fr ) = +∞,
r∈Qn , |r|∞ ≤2ρ

(contradiction); donc F n’est pas n-intégrable.


2. Soit f une fonction de Rn dans R et A ∈ Rn . Montrer que si |f | (resp.
f 2 ) est n-mesurable sur A, f ne l’est pas nécessairement.
Suggestion. Si E ⊂ Rn est une partie non n-intégrable (voir exercice précé-
dent), alors f = 1E − 1Rn \E n’est pas n-mesurable sur Rn alors que |f | = 1
et f 2 = 1 le sont.
13.8. EXERCICES 523

3. Montrer que l’ensemble de Cantor défini aux Exercices du Chapitre 4


est 1-négligeable. Cela fournit un exemple d’ensemble 1-négligeable et non
dénombrable.
4. Montrer que si (fk )k∈N est une suite de fonctions de Rn dans R intégrables
sur A ⊂ Rn et telles que, pour presque tout x ∈ A, on ait, pour une certaine
fonction g de Rn dans R intégrable sur A,

fk (x) ≥ g(x) (resp. fk (x) ≤ g(x)), (k ∈ N),

alors, si J J
lim inf fk (resp. lim sup fk ),
k→∞ A k→∞ A

existe et si la fonction lim inf k→∞ fk (resp. lim supk→∞ fk ) existe, cette
fonction est intégrable sur A et l’on a
J J
lim inf fk ≤ lim inf fk ,
A k→∞ k→∞ A
J J
(resp. lim sup fk ≥ lim sup fk ).
A k→∞ k→∞ A

Ce résultat s’appelle le lemme de Fatou. Considérant, pour fixer les idées, le


cas de lim inf et travaillant sur fk − g au lieu de fk , on peut supposer les fk
positives p.p. sur A. On notera que l’on a, p.p. sur A,
4 5 2 4 53
lim inf fk = lim inf fj = lim lim min fj ,
k→∞ k→∞ j≥k k→∞ l→∞ k≤j≤l

et le lemme de Fatou se déduit de deux applications successives du théorème


de convergence monotone de Levi.
5. Montrer que si f est une fonction de Rn dans R et A une partie de Rn
telles que f soit mesurable sur A et |f |2 soit intégrable sur A, alors, pour
tout r > 0, on a, si Ar = {x ∈ A : |f (x)| > r},
J
1
µ(Ar ) ≤ |f |2 .
r2 A

(Inégalité de Tchebycheff pour les fonctions de carré intégrable). Cette


inégalité joue un grand rôle en calcul des probabilités: en appliquant ce
H 8 H 91/2
résultat à f − f , où f = µ(A)
1
A f, et en posant σ(f ) = µ(A)
1
A |f − f |2 ,
on trouve
µ{x ∈ A : |f (x) − f | > tσ(f )} 1
≤ 2,
µ(A) t
524 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES

ce qui donne une limite à la dispersion, autour de sa moyenne f , d’une


variable aléatoire f admettant un écart quadratique moyen σ(f ), et permet
de prouver la loi faible des grands nombres.
6. Montrer que si f est une fonction de Rn dans Rp L-intégrable sur Rn , alors
f n’a pas nécessairement de limite à l’infini, et n’est même pas nécessairement
bornée au voisinage de l’infini.
Suggestion. Utiliser le théorème de Hake pour montrer que la fonction de R
dans R définie par

$
f (x) = 2k 1Yk− 1
,k+ 1
:
2k 2k
k=1

est L-intégrable sur R alors qu’elle n’est pas bornée au voisinage de l’infini.
7. Montrer que si f est une fonction de Rn dans Rp L-intégrable sur Rp et
si limx→∞ f (x) existe, alors cette limite est nulle.
Suggestion. Si L = limx→∞ f (x) /= 0, il existe m ∈ N tel que |f (x)|2 ≥ |L|2 2
pour tout x ∈ Rn tel que |x|∞ ≥ m. En conséquence, pour tout k ≥ m,
J J J
|f |2 = |f |2 + |f |2
B∞ [k] B∞ [m] B∞ [k]\B∞[m]

J
|L|2
≥ |f |2 + [(2k)n − (2m)n ] ,
B∞ [m] 2
H
ce qui montre que limk→∞ B∞ [k] |f |2 = ∞.
On comparera utilement les résultats des exercices 6 et 7 à ceux corre-
spondants pour une série.

13.9 Petite anthologie


Tous les ensembles que nous considérerons seront formés de points compris
entre 0 et 1. Lorsqu’un ensemble sera formé de tous les points compris
dans une infinité dénombrable d’intervalles n’empiétant pas les uns sur les
autres et ayant une longueur totale s, nous dirons que l’ensemble a pour
mesure s. Lorsque deux ensembles n’ont pas de points communs, et que
leurs mesures sont s et s$ , l’ensemble obtenu en les réunissant, c’est-à-dire
leur somme, a pour mesure s + s$ . D’ailleurs il importe peu que dans la
définition de la mesure d’un ensemble, ou dans celle de la somme de deux en-
sembles, qu’on néglige ou qu’on tienne tel compte qu’on veut des extrémités
des intervalles, en infinité dénombrable. Plus généralement, si l’on a une
infinité dénombrable d’ensembles n’ayant deux à deux aucun point commun
13.9. PETITE ANTHOLOGIE 525

et ayant respectivement pour mesures s1 , s2 , . . ., sn , . . . , leur somme (ou en-


semble formé par leur réunion) a pour mesure

s1 + s2 + . . . + sn + . . . .

Tout cela est une conséquence de la définition de la mesure. Voici main-


tenant des définitions nouvelles : si un ensemble E a pour mesure s, et
contient tous les points d’un ensemble E $ dont la mesure est s$ , l’ensemble
E − E $ , formé des points de E qui n’appartiennent pas à E $ , sera dit avoir
pour mesure s − s$ ; de plus, si un ensemble est la somme d’une infinité
dénombrable d’ensembles sans partie commune, sa mesure sera la somme
des mesures de ses parties et enfin les ensembles E et E $ ayant, en vertu de
ces définitions, s et s$ comme mesures, et E renfermant tous les points de
E $ , l’ensemble E − E $ aura pour mesure s − s$ .

Emile Borel, 1898

Nous nous proposons d’attacher à chaque ensemble borné un nombre posi-


tif ou nul que nous appellerons sa mesure et satisfaisant aux conditions sui-
vantes :
1. Il existe des ensembles dont la mesure n’est pas nulle.
2. Deux ensembles égaux ont même mesure.
3. La mesure de la somme d’un nombre fini ou d’une infinité dénombrable
d’ensembles, sans points communs deux à deux, est la somme des mesures
de ces ensembles.
Nous ne résoudrons ce problème de la mesure que pour les ensembles que
nous appellerons mesurables.

Henri Lebesgue, 1902

Une fonction sera dite sommable si, quels que soient a et b, l’ensemble
des valeurs de x pour lesquelles on a a < f (x) < b est mesurable. Les
fonctions continues par rapport à l’ensemble des variables sont sommables.
La somme, le produit de deux fonctions sommables, la limite d’une suite
de fonctions sommables sont des fonctions sommables. Donc les fonctions
discontinues que Mr. Baire appelle fonctions de première classe, de seconde
classe, etc. sont sommables. Les fonctions de n variables continues par
rapport à chacune d’elles sont de n − 1e classe au plus, donc elles sont
sommables.

Henri Lebesgue, 1902


526 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES

La question de l’existence des classes d’ensembles se ramène à celle des


classes de fonctions et réciproquement. ... Commençons par montrer la
dépendance des deux classifications. Soit E un ensemble mesurable (B).
Définissons une fonction φ(x) égale à 1 dans E et à 0 dans !E. Nous
l’appellerons la fonction caractéristique de E.

Charles-Jean de La Vallée Poussin, 1915

Chaque progrès avait consisté à estimer la mesure d’un ensemble E au


moyen de la longueur totale d’un ensemble d’intervalles couvrant E. Mais
on avait toujours pris ces intervalles parmi des intervalles choisis d’avance.
Borel a écrit lui-même que son point de départ a été de prendre, pour chaque
ensemble, des intervalles non seulement couvrant l’ensemble, mais dépendant
directement de cet ensemble. En prenant comme intervalles ceux qu’on ob-
tient en divisant un segment en parties égales, Jordan arrivait à la conclu-
sion que l’ensemble R des points d’abscisse rationnelle entre 0 et 1 avait
pour mesure l’unité. En attachant, avec Borel, à chaque point d’abcisse ra-
tionnelle rn un segment de longueur !/n2 , on constate que R est couvert
%
par un ensemble d’intervalles dont la longueur totale est ! n12 ; sa mesure
devant intuitivement être inférieure à ce total est aussi petite que l’on veut
avec !. Borel arrivait ainsi à cette conclusion, qui, à l’époque, a paru sur-
prenante, que l’ensemble des nombres rationnels, pourtant dense partout,
était de mesure nulle. C’est par cet exemple que Borel a été conduit à la
notion générale de mesure.

Maurice Fréchet, 1965


Chapitre 14

Représentations et
transformations

14.1 Limites et continuité


Si f est une fonction de R dans R intégrable sur [a, b],H on sait que son
intégrale indéfinie est l’application F : [a, b] → R, x 2→ ax f (t) dt. Si nous
définissons g : [a, b] × [a, b] → R, (x, t) 2→ 1[a,x]f (t), l’intégrale indéfinie de f
peut encore se définir par la formule
J b
F (x) = g(x, t) dt.
a

On a vu précédemment que la fonction Gamma d’Euler était définie pour


chaque x ∈ ]0, ∞[ par la formule
J +∞
Γ(x) = tx−1 exp(−t) dt.
0

Si f est une fonction de Rn dans C L-intégrable sur Rn , la transformée de


Fourier de f est la fonction de Rn dans C définie par la formule
J
fˆ(x) = exp[−2iπ(x|y)]f (y) dy.
Rn

Plus généralement, si, pour

p = (ξ1 + iη1 , . . . , ξn + iηn ) ∈ Cn ,

527
528 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS

%
et y ∈ Rn , on pose (p|y) = nj=1 pj yj , et si f est une fonction de Rn dans C,
la transformée de Laplace de f est la fonction de Cn dans C définie sur

Γf = {p ∈ Cn : exp[−(p|·)]f est intégrable sur Rn }

par J
Lf (p) = exp[−(p|y)]f (y) dy.
Rn

Le potentiel du champ de gravitation créé par un corps matériel M de densité


variable ρ en un point x ∈ R3 extérieur à M est donné par la formule
J
ρ(y)
V (x) = −G dy,
M |x − y|2

où G désigne la constante de gravitation.


Les fonctions données dans tous ces exemples ont en commun d’être définies
à partir d’une fonction de plusieurs variables que l’on intègre, sur un ensem-
ble fixe, par rapport à une partie des variables seulement. On les appelle
des représentations intégrales, des intégrales paramétriques ou des fonctions
définies par une intégrale. Dans toute ce chapitre, sauf mention contraire,
l’expression “intégrable sur B” devra se lire “L-intégrable sur B” lorsque B
est une partie non bornée contenue dans un espace vectoriel de dimension
supérieure ou égale à 2.
Si q ≥ 1 et s ≥ 1 sont des entiers tels que q + s = n, nous écrirons Rn
sous la forme Rq × Rs avec l’écriture correspondante x = (y, z) pour chaque
élément x de Rn .

Définition. Soit f une fonction de Rn dans Rp , A une partie de Rq et B


une partie de Rs . Si, pour chaque y ∈ A (resp. pour presque tout y ∈ A), la
fonction f (y, ·) de Rs dans Rp est intégrable sur B, alors l’application F de
A dans Rp définie (resp. définie p.p.) par
J
F (y) = f (y, z) dz
B

est appelée une intégrale paramétrique ou une application définie par une
intégrale. On dit aussi que le membre de droite est une représentation
intégrale de F. Dans le cas particulier important où h est une fonction de Rs
dans C et K une fonction de Rn dans C telles que, pour chaque y ∈ A (resp.
pour presque tout y ∈ A), la fonction f (y, ·), avec f définie (resp. définie
14.1. LIMITES ET CONTINUITÉ 529

p.p.) sur A par f (y, z) = K(y, z)h(z), soit intégrable sur B, l’application
correspondante H définie (resp. définie p.p.) sur A par
J
H(y) = K(y, z)h(z)dz
B

est appellée la transformée intégrale de h de noyau K. Lorsque g et h


sont des fonctions de Rq dans C telles que, pour presque tout y ∈ Rq , la
fonction f (y, ·), avec f définie par f (y, z) = g(y − z)h(z), est L-intégrable
sur
H
Rq , l’application correspondante g ∗ h définie p.p. sur Rq par (g ∗ h)(y) =
Rq g(y − z)h(z) dz s’appelle le produit de convolution de g et h.

Comme pour les fonctions définies par la limite d’une suite de fonctions
ou la somme d’une série de fonctions, il est intéressant de savoir sous quelles
conditions certaines propriétés de la fonction f sont conservées par F . En
passant, si nécessaire, aux composantes de F et f , on peut, sans perte de
généralité, supposer que p = 1.
Considérons tout d’abord le problème fondamental de l’existence d’une
limite pour F (y) lorsque y tend vers a ∈ adh A ou tend vers l’infini.
Proposition. Soit a ∈ adh A (resp. A non borné) et supposons satisfaites
les conditions suivantes.
1. f (y, ·) est intégrable sur B pour chaque y ∈ A.
2. limy→a, y∈A f (y, z) (resp. limy→∞, y∈A f (y, z)) existe pour presque tout
z ∈ B.
3. Il existe r > 0 et des fonctions réelles g et h intégrables sur B telles que,
pour tout y ∈ A ∩ B∞ [a; r] (resp. y ∈ !B∞ [0; r] ∩ A) et presque tout z ∈ B,
on a
g(z) ≤ f (y, z) ≤ h(z).
Alors la fonction ϕ définie presque partout sur B par

ϕ(z) = lim f (y, z) (resp. lim f (y, z))


y→a, y∈A y→∞, y∈A

est intégrable sur B et


J J
lim F (y) = ϕ(z) dz (resp. lim F (y) = ϕ(z) dz).
y→a, y∈A B y→∞, y∈A B

En d’autres termes, on a
2J 3 J 2 3
lim f (y, z) dz = lim f (y, z) dz
y→a, y∈A B B y→a, y∈A
530 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS
2J 3 J 2 3
(resp. lim f (y, z) dz = lim f (y, z) dz.
y→∞, y∈A B B y→∞, y∈A

Démonstration. Considérons, pour fixer les idées, le cas où y → a. Soit


(yk )k∈N une suite dans A∩B∞ [a; r] qui converge vers a. La suite (f (yk , ·))k∈N
de fonctions intégrables sur B converge ponctuellement p.p. sur B vers ϕ et
est telle que
g(z) ≤ f (yk , z) ≤ h(z)
pour tout k ∈ N et presque tout z ∈ B. Le théorème de convergence ma-
jorée et minorée de Lebesgue entraı̂ne alors l’intégrabilité de ϕ sur B et les
relations J J
lim F (yk ) = lim f (yk , z) dz = ϕ(z) dz.
k→∞ k→∞ B B
La proposition résulte du caractère local de la notion de limite et de sa
caractérisation par les suites.
Une conséquence facile de cette proposition est la continuité de F en a
lorsque f (·, z) est continue en a pour presque tout z ∈ B et que les hypothèses
1 et 3 sont vérifiées.
Corollaire. Supposons satisfaites les conditions suivantes.
1. f (y, ·) est intégrable sur B pour chaque y ∈ A.
2. f (·, z) est continue en a ∈ A pour presque tout z ∈ B.
3. Il existe r > 0 et des fonctions réelles g et h intégrables sur B tels que,
pour tout y ∈ B∞ [a; r] ∩ A et presque tout z ∈ B, on ait

g(z) ≤ f (y, z) ≤ h(z).

Alors F est continue en a.

Corollaire. Si f est continue sur A × B, A est ouvert et B est fermé et


borné, alors F est continue sur A.
Démonstration. Par hypothèse, f (y, ·) est continue sur B, et donc inté-
grable sur B pour chaque y ∈ A, et f (·, z) est continue sur A pour chaque
z ∈ B. D’autre part, si a ∈ A, il existe r > 0 tel que B∞ [a; r] ⊂ A et dès
lors, f étant continue sur le fermé borné B∞ [a; r] × B, il existe C > 0 tel
que
−C ≤ f (y, z) ≤ C
pour tout (y, z) ∈ B∞ [a; r] × B. Il suffit donc de prendre g = −C = −h dans
la Proposition précédente.
14.2. RÈGLE DE LEIBNIZ 531

14.2 Règle de Leibniz


Passons maintenant à la dérivabilité d’une fonction définie par une intégrale.
Le résultat suivant s’appelle la règle de Leibniz de dérivation sous le
signe d’intégration.
Proposition. Supposons que int A /= ∅ et que les conditions suivantes
soient satisfaites.
1. f (y, ·) est intégrable sur B pour chaque y ∈ A.
2. Il existe un entier 1 ≤ i ≤ q, un point a ∈ int A et un réel r > 0 tels que
B∞ [a; r] ⊂ A et tels que f (·, z) possède pour presque tout z ∈ B une dérivée
partielle par rapport à yi en chaque point y ∈ B∞ [a; r].
3. Il existe deux fonctions réelles g et h intégrables sur B telles que, pour
tout y ∈ B∞ [a; r] et presque tout z ∈ B, on ait

g(z) ≤ Dyi f (y, z) ≤ h(z).

Alors F possède en a une dérivée partielle par rapport à yi , Dyi f (a, ·) est
intégrable sur B et J
Di F (a) = Dyi f (a, z) dz.
B
En d’autres termes,
2J 3 J
Di f (a, z) dz = Dyi f (a, z) dz.
B B

Démonstration. Soit ψ la fonction définie sur ([−r, r] \ {0}) × B par le


quotient différentiel

ψ(h, z) = h−1 [f (a + hei , z) − f (a, z)].

Par construction, ψ(h, ·) est intégrable sur B pour chaque h ∈ [−r, r] \ {0}
et
lim ψ(h, z) = Dyi f (a, z)
h→0, h(=0

pour presque tout z ∈ B. En outre, en appliquant le théorème de Lagrange


à la fonction h → f (a + hei , z), on obtient, pour chaque h ∈ [−r, r] et pour
presque tout z ∈ B un h$ ∈ R tel que 0 < |h$ | < |h| et

f (a + hei , z) − f (a, z) = hDyi (a + h$ ei , z).

En conséquence, par l’hypothèse 3, on a

g(z) ≤ ψ(h, z) ≤ h(z)


532 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS

pour tout h ∈ [−r, r]\{0} et presque tout z ∈ B. On peut donc appliquer à ψ


la Proposition relative à la limite d’une intégrale paramétrique, qui implique
l’intégrabilité de Dyi f (a, ·) sur B et l’égalité
J J
lim ψ(h, z) dz = Dyi f (a, z) dz.
h→0, h(=0 B B

Comme on a évidemment
J J
1
lim ψ(h, z) dz = lim [f (a + hei , z) − f (a, z)] dz
h→0, h(=0 B h→0, h(=0 h B

= lim h−1 [F (a + hei ) − F (a)],


h→0, h(=0
H
on voit que DiF (a) existe et vaut B Dyi f (a, z) dz.

Corollaire. Si A est ouvert, B est fermé borné et s’il existe 1 ≤ i ≤ q


tel que, pour chaque (y, z) ∈ A × B, f possède une dérivée partielle par
rapport à yi en (y, z) et si la fonction dérivée partielle Dyi f est continue sur
A × B, alors F possède en chaque y ∈ A une dérivée partielle par rapport yi ,
la fonction dérivée partielle Di F est continue sur A et l’on a, pour chaque
y ∈ A, J
Di F (y) = Dyi f (y, z) dz.
B
Démonstration. Soit a ∈ A et r > 0 tels que B∞ [a; r] ⊂ A. Pour chaque
y ∈ B∞ [a; r], la fonction Dyi f (y, ·) est continue, et donc intégrable, sur B
et, Dyi f étant continue sur le fermé borné B∞ [a; r] × B, il existera C > 0
tel que
−C ≤ Dyi f (y, z) ≤ C
pour tout (y, z) ∈ B∞ [a; r] × B. Les conditions de la Proposition précédente
sont donc satisfaites. Le seul point qui n’en découle pas, à savoir la continuité
de DiF , est une conséquence de la formule de Leibniz et du Corollaire ci-
dessus sur la continuité d’une intégrale paramétrique.
La règle de Leibniz peut être utilisée pour calculer certaines intégrales.
Pour montrer, par exemple que, si a et b sont strictement positifs, on a
J +∞ exp(−ax) − exp(−bx) b
dx = ln
0 x a
il suffit de noter tout d’abord que les deux membres, considérés comme
fonctions de b, sont tous deux égaux (à zéro) si b = a. Ces fonctions seront
14.2. RÈGLE DE LEIBNIZ 533

donc égales pour tout b > 0 si leurs dérivées sont égales pour tout b > 0. Celle
du deuxième membre est égale à 1/b. En utilisant la règle H
de Leibniz (vérifier
les hypothèses!), celle du premier membre est égale à 0+∞ exp(−bx) dx, et
donc à 1/b.
Comme autre exemple, montrons que cette règle jointe aux résultats
sur la limite d’une intégrale paramétrique permet de calculer l’intégrale de
Poisson J ∞
exp(−x2 ) dx,
0
qui joue un rôle important en analyse et en calcul des probabilités. Cette
intégrale existe évidemment puisque l’intégrand est continu et tel que, pour
tout x ≥ 1, on a
exp(−x2 ) ≤ exp(−x),
le second membre de l’inégalité étant évidemment intégrable. Posons
4J 52 J
y 1 exp[−y 2 (z 2 + 1)]
f (y) = exp(−z ) dz
2
, g(y) = dz.
0 0 z2 + 1
Il est facile de voir que ces fonctions sont définies et continues pour tout
y ≥ 0, et que
J 1 dz π
f (0) = 0, g(0) = = arctg 1 = .
0 z2 + 1 4
On a, par les propriétés de dérivabilité d’une intégrale indéfinie et par la
règle de Leibniz (vérifier que les hypothèses sont satisfaites)
J y J 1
f $ (y) = 2 exp[−(y 2 + z 2 )] dz, g $ (y) = −2 y exp[−y 2 (z 2 + 1)] dz.
0 0

En particulier, si y > 0, on trouve, en posant t = zy, que


J y
g $ (y) = −2 exp[−(y 2 + t2 )] dt = −f $ (y).
0

Donc la fonction f + g est constante sur ]0, +∞[, et comme elle est continue
en 0, on aura, pour tout y ≥ 0,
π
f (y) + g(y) = f (0) + g(0) = ,
4
ce qui entraı̂ne particulier que (justifier le passage à la limite sous le signe
intégral)
π
= lim [f (y) + g(y)]
4 y→+∞
534 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS

4J 52 J
∞ 1 exp[−y 2 (z 2 + 1)]
= exp(−z 2 ) dz + lim dz
0 y→+∞ 0 z2 + 1
4J 52 J
∞ 1 exp[−y 2 (z 2 + 1)]
= exp(−z 2 ) dz + lim [ ] dz
0 0 y→+∞ z2 + 1
4J ∞ 52
= exp(−z 2 ) dz .
0

On en déduit aussitôt la valeur de l’intégrale de Poisson


J ∞

π
exp(−x ) dx =2
.
0 2

14.3 Théorème de Fubini


Passons maintenant au problème de l’intégrabilité d’une fonction définie par
une intégrale. Les “hypothèses naturelles” pour la validité de l’intégrabili-
té (c’est-à-dire l’analogue des “hypothèses naturelles” 1 et 2 des résultats
sur l’existence de la limite ou des dérivées pour F ) sont évidemment les
suivantes:
1. f (y, ·) est intégrable sur B pour presque tout y ∈ A.
2. f (·, z) est intégrable sur A pour presque tout z ∈ B.
En tenant compte de la symétrie de ces hypothèses par rapport aux deux
groupes de variables, la conclusion souhaitée,H qui doit évidemment respecter
cette symétrie, est que la fonction
H
F : y 2→ B f (y, z) dz soit intégrable sur
A, que la fonction G : z 2→ A f (y, z) dy soit intégrable sur B et que l’on ait
l’égalité
J J
F (y) dy = G(z) dz,
A B

c’est-à-dire J 2J 3 J 2J 3
f (y, z) dz dy = f (y, z) dy dz.
A B B A

Comme pour la limite et la dérivabilité, ces “hypothèses naturelles” ne suf-


fisent pas à assurer la validité du résultat, ainsi que le montre l’exemple
suivant.
Exemple. Soit f la fonction réelle définie comme suit sur [0, 1] × [0, 1] :

f (y, z) = z −2 si 0 < y < z < 1, f (y, z) = −y −2 si 0 < z < y < 1


14.3. THÉORÈME DE FUBINI 535

et f (y, z) = 0 ailleurs dans [0, 1] × [0, 1]. On vérifie facilement que, pour
chaque 0 < z < 1, on a
J 1 J z J 1
dy dy
f (y, z) dy = − = 1,
0 0 z2 z y2

et dès lors J 1 2J 1 3 J 1
f (y, z) dy dz = 1 dz = 1.
0 0 0

De même, on a, pour chaque 0 < y < 1,


J 1 J y J 1
dz dz
f (y, z) dz = − + = −1,
0 0 y2 y z2

et dès lors, 2J 3
J 1 1 J 1
f (y, z) dz dy = (−1) dy = −1.
0 0 0

Il faut donc remplacer l’hypothèse “naturelle” par une hypothèse plus forte.
Celle-ci s’exprime dans le théorème de Fubini que nous commencerons par
énoncer et démontrer dans le cas où A et B sont des pavés fermés. L’impor-
tance de ce théorème proviendra également de ce qu’il nous permettra de
ramener le calcul d’une intégrale sur un pavé de Rn à une succession de n
intégrales sur des intervalles de R.
Soit I = J × K un semi-pavé de Rn , avec J ⊂ Rq et K ⊂ Rs des semi-
pavés, q + s = n, et soit f une fonction de Rn dans R. Notons tout d’abord
que {y} × K̄ étant de n-mesure nulle pour chaque y ∈ J¯, toute fonction f
intégrable sur I¯ le reste, avec la même intégrale, si, pour un nombre fini et
même une infinité dénombrable de y, on remplace f (y, ·) par une fonction
quelconque de z, et en particulier une fonction non intégrable sur K̄. Par
conséquent, cette fonction modifiée montre que l’intégrabilité de f sur I¯
n’entraı̂ne pas celle de f (y, ·) sur K̄ pour tout y ∈ J¯. Le résultat qui suit
montre cependant que cette conclusion est valide pour presque tout y ∈ J¯.
Théorème. Si f est intégrable sur I¯ et si l’on pose

T = {y ∈ J¯ : f (y, ·) n’est pas intégrable sur K̄},

alors T est de q-mesure nulle.


Démonstration. Par la condition nécessaire et suffisante de Cauchy pour
l’intégrabilité de f (y, ·) sur K̄, on a
536 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS

T = {y ∈ J¯ : il existe ! > 0 tel que, pour toute jauge δK sur K̄,


il existe deux P-partitions δK -fines ΠK et Π̃K de K telles que
S(K, f (y, ·), ΠK) − S(K, f (y, ·), Π̃K) > !}.
Si dès lors, pour chaque i ∈ N∗ , on pose
Ti = {y ∈ J¯ : pour toute jauge δK sur K̄,
il existe deux P-partitions δK -fines ΠK et Π̃K de K telles que
S(K, f (y, ·), ΠK ) − S(K, f (y, ·), Π̃K) > 1i },
!
alors Ti ⊂ Ti+1 ⊂ J¯, (i ∈ N∗ ), et T = i∈N∗ Ti . Par les propriétés de la
mesure, il suffit donc de prouver que chaque ensemble Ti est de q-mesure
nulle. Soit i ∈ N∗ et ! > 0 fixés. Nous allons montrer qu’il existe une jauge
δJ¯ sur J¯ telle que, pour toute P-partition δJ¯-fine Π de J, on a S(J, 1Ti , Π) ≤ !.
Pour cet !, la condition nécessaire et suffisante de Cauchy d’intégrabilité de
f sur I¯ entraı̂ne l’existence d’une jauge δ sur I¯ telle que
!
|S(I, f, Π) − S(I, f, Π̃)| ≤ ,
i
lorsque Π et Π̃ sont des P-partitions δ-fines de I. Pour chaque y ∈ J¯, δ(y, ·)
est une jauge sur K̄. Si y ∈ Ti , la définition de Ti implique l’existence de
deux P-partitions δ(y, ·)-fines de K
ΠyK = {(zyj , Kyj ) : 1 ≤ j ≤ my }, Π̃yK = {(z̃yl , K̃yl ) : 1 ≤ l ≤ m̃y },
telles que
1
S(K, f (y, ·), ΠyK ) − S(K, f (y, ·), Π̃yK) ≥ .
i
Posons
δJ (y) = min[ min δ(y, zyj ), min δ(y, z̃yl )].
1≤j≤my 1≤l≤m̃y

Si y ∈ J¯ \ Ti , prenons
y y
ΠK = Π̃K = {(zyj , Kyj ) : 1 ≤ j ≤ my },
avec ΠyK une P-partition δ(y, ·)-fine quelconque de K, et posons
δJ (y) = min δ(y, zyj ).
1≤j≤my
8 9
Nous avons ainsi défini une jauge δJ sur J¯. Soit ΠJ = (y h , J h ) une
1≤h≤m
P-partition δJ -fine de J. Par construction et choix de la jauge,
?8 9 @
Π= (y h , zyj h ), J h × Kyjh : 1 ≤ j ≤ myh , 1 ≤ h ≤ m
14.3. THÉORÈME DE FUBINI 537

et ?8 9 @
Π̃ = (y h , z̃yj h ), J h × K̃yjh : 1 ≤ j ≤ m̃yh , 1 ≤ h ≤ m

sont des P-partitions δ-fines de I = J × K. Dès lors, on trouve


!
≥ |S(I, f, Π) − S(I, f, Π̃)|
i
# m #
# m yh
m̃y h #
#$ $ j j
$ #
=#
# µ(J )
h 
f (y , zyh )µ(Kyh ) −
h
f (y , z̃yh )µ(K̃yh ) #
h l l #
#h=1 j=1 l=1 #
# m #
# yh
m̃y h #
# $ $ j j
$ #
= ## µ(J ) 
h
f (y , zyh )µ(Kyh ) −
h
f (y , z̃yh )µ(K̃yh )##
h l l
#{1≤h≤m : yh ∈T } j=1 l=1 #
i
# #
# #
# $ h h #
= ## µ(J h )[S(K, f (y h, ·), ΠyK ) − S(K, f (y h, ·), Π̃yK )]##
#{1≤h≤m : yh ∈T } #
i

$ h h
= µ(J h )[S(K, f (y h, ·), ΠyK ) − S(K, f (y h, ·), Π̃yK )]
{1≤h≤m : yh ∈Ti}
m
1 $ 1$ 1
≥ µ(J h ) = 1Ti (y h )µ(J h ) = S(J, 1Ti , ΠJ ).
i i j=1 i
{1≤h≤m : yh ∈Ti }

On a donc, 0 ≤ S(J, 1Ti , ΠJ ) ≤ !, et la démonstration est complète.


Le théorème queH nous venons de démontrer montre que la fonction F
donnée par F (y) = K̄ f (y, z) dz est définie p.p. sur J. ¯ La deuxième partie
du
H
théorème
H
de Fubini consiste à prouver l’intégrabilité de F sur J¯ et l’égalité
J¯ F = I¯ f.
¯ alors la fonction F définie p.p. sur J¯
Théorème. Si f est intégrable sur I,
par J
F (y) = f (y, z) dz

est intégrable sur J¯ et J J


F = f,
J¯ I¯
ce qui s’écrit encore
J 2J 3 J
f (y, z) dz dy = f.
J¯ K̄ ¯ K̄

538 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS

Démonstration. Soit ! > 0. L’intégrabilité de f sur I¯ entraı̂ne l’existence


d’une jauge δ sur I¯ telle que, si Π et Π̃ sont des P-partitions δ-fines de I, on
a # J #
# #
#S(I, f, Π) − f # ≤ !/4,
# #

et
|S(I, f, Π) − S(I, f, Π̃)| ≤ !/4.
Avec les notations du théorème précédent, et en désignant encore par F une
extension quelconque de F à J¯, soit y ∈ T et soit

Π̄yK = {(z̄yj , K̄yj ) : 1 ≤ j ≤ my }

une P-partition fixée δ(y, ·)-fine de K. Posons

δ̃J (y) = min δ(y, z̄yj ),


1≤j≤my

Q1 = {y ∈ T : |F (y)| + |S(K, f (y, ·), Π̄yK)| ≤ 1},


Qk = {y ∈ T : k − 1 < |F (y)| + |S(K, f (y, ·), Π̄yK)| ≤ k}, k = 2, 3, . . .,
ce qui implique >
T = Qk , Qk ∩ Ql = ∅ si k /= l.
k∈N∗

On a donc, pour tout k ∈ N∗ et tout y ∈ Rq ,

1Qk (y) ≤ 1T (y),

et dès lors, pour toute P-partition ΠJ de J, on a

0 ≤ S(J, 1Qk , ΠJ ) ≤ S(J, 1T , ΠJ ).

Par le théorème précédent,


A i i B
il existe une jauge δJk sur J¯ telle que, pour toute
P-partition ΠJ = (y , J ) 1≤i≤m δJk -fine de J, on ait,

!
S(J, 1T , ΠJ ) ≤ ,
k.2k+2
et dès lors
$ !
0≤ µ(J i ) = S(J, 1Qk , ΠJ ) ≤ .
{1≤i≤m : y∈Qk }
k.2k+2
14.3. THÉORÈME DE FUBINI 539

Si y ∈ T , il existe un et un seul Qk tel que y ∈ Qk ; on posera

δJ (y) = min{δ̃J (y), δJk (y)}.

Soit maintenant y ∈ J¯ \ T et soit

Π̃yK = {(z̃yj , K̃yj ) : 1 ≤ j ≤ m̃y }

une P-partition δ(y, ·)-fine de K; puisque f (y, ·) est intégrable sur K̄ et a


F (y) comme intégrale, on peut choisir une P-partition

Π̂ = {(ẑyl , K̂yl ) : 1 ≤ l ≤ m̂y }

δ(y, ·)-fine de K telle que

|S(K, f (y, ·), Π̂yK) − F (y)| ≤ (1/2)|S(K, f (y, ·), Π̃yK) − F (y)|.

Posons U V
δJ (y) = min min δ(y, z̃yj ), min δ(y, ẑyl ) ,
1≤j≤m̃y 1≤l≤m̂y

¯
ce qui achève de définir uneA jauge δBJ sur J.
Soit maintenant ΠJ = (y , J ) 1≤i≤m une P-partition δJ -fine de J. Si
i i

y ∈ T , posons
i

i i
ΠyK = {(zyj i , Kyji ) : 1 ≤ j ≤ myi } = Π̄yK

et
i i
Π̆yK = {(z̆yj i , K̆yji ) : 1 ≤ j ≤ m̆yi } = Π̄yK .

Si y i ∈ J¯ \ T et
i
S(K, f (y i, ·), Π̃yK ) − F (y i ) > 0,
posons
i i
ΠyK = {(zyj i , Kyji ) : 1 ≤ j ≤ myi } = Π̃yK ,
yi j j yi
Π̆K = {(z̆yi , K̆yi ) : 1 ≤ j ≤ m̆yi } = Π̂K ,
tandis que si y i ∈ J¯ \ T et
i
S(K, f (y i, ·), Π̃yK ) − F (y i ) ≤ 0,

posons
i i
ΠyK = {(zyj i , Kyji ) : 1 ≤ j ≤ myi } = Π̂yK ,
540 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS

i i
Π̆yK = {(z̆yj i , K̆yji ) : 1 ≤ j ≤ m̆yi } = Π̃yK .
Par construction,
j
Π = {((y i, zyi ), J i × Kyi ) : 1 ≤ j ≤ myi , 1 ≤ i ≤ m}

et
Π̆ = {((y i, z̆yi ), J i × K̆yji ) : 1 ≤ j ≤ m̆yi , 1 ≤ i ≤ m}
sont des P-partitions δ-fines de I, ainsi qu’on le vérifie aisément, et dès lors

|S(I, f, Π) − S(I, f, Π̆)| ≤ !/4.

D’ailleurs, par construction on a aussi


m
$ i
S(I, f, Π) = S(K, f (y i, ·), ΠyK )µ(J i )
i=1

et m
$ i
S(I, f, Π̆) = S(K, f (y i, ·), Π̆yK )µ(J i ).
i=1
D’autre part, on a
|S(I, f, Π) − S(J, F, ΠJ )|
= |S(I, 1T f, Π) + S(I, 1J̄\T f, Π) − S(J, 1T F, ΠJ ) − S(J, 1J\T
¯ F, ΠJ )|

≤ |S(I, 1T f, Π) − S(J, 1T F, ΠJ )| + |S(I, 1J̄\T f, Π) − S(J, 1J\T


¯ F, ΠJ )|.

Mais,
|S(I, 1T f, Π) − S(J, 1T F, ΠJ )|
# #
# #
# $ i #
= ## [S(K, f (y i, ·), ΠyK ) − F (y i )]µ(J i )##
#{1≤i≤m : yi ∈T } #
 
∞ 
$ $ D E 
i
≤ |S(K, f (y , ·), ΠyK )|
i
+ |F (y )| µ(J )
i i
 
k=1 {1≤i≤m : yi ∈Qk }
 
∞ ∞
$ $ $ 1
≤  kµ(J i ) ≤ ! = !/4.
k=1 k=1
2k+2
{1≤i≤m : yi ∈Qk }

D’ailleurs, si y i ∈ J¯ \ T et si
i
S(K, f (y i, ·), Π̃yK ) − F (y i ) > 0,
14.3. THÉORÈME DE FUBINI 541

alors
i i
S(K, f (y i, ·), Π̂yK ) − F (y i ) ≤ (1/2)[S(K, f (y i, ·), Π̃yK ) − F (y i )],

et donc
i i
0 < S(K, f (y i, ·), ΠyK ) − F (y i ) = S(K, f (y i, ·), Π̃yK ) − F (y i )
i i
≤ 2[S(K, f (y i, ·), ΠyK ) − S(K, f (y i, ·), Π̆yK )],
tandis que si y i ∈ J¯ \ T et si
i
S(K, f (y i, ·), Π̃yK ) − F (y i ) ≤ 0,

alors
i i
−S(K, f (y i, ·), Π̂yK ) + F (y i ) ≤ (1/2)[F (y i) − S(K, f (y i, ·), Π̃yK )];

cela entraı̂ne en particulier que


i i
(−1/2)[F (y i) − S(K, f (y i, ·), Π̃yK )] ≤ S(K, f (y i, ·), Π̂yK ) − F (y i ),

et dès lors,
i i
|S(K, f (y i, ·), ΠyK ) − F (y i )| = |S(K, f (y i, ·), Π̂yK ) − F (y i )|
i
≤ (1/2)[F (y i) − S(K, f (y i, ·), Π̃yK )]
i i
≤ S(K, f (y i, ·), Π̂yK ) − S(K, f (y i, ·), Π̃yK )
i i
= S(K, f (y i, ·), ΠyK ) − S(K, f (y i, ·), Π̆yK ).
En résumé, si y i ∈ J¯ \ T, on a
i i i
|S(K, f (y i, ·), ΠyK ) − F (y i )| ≤ 2[S(K, f (y i, ·), ΠyK ) − S(K, f (y i, ·), Π̆yK )].
i i
Comme, pour y i ∈ T, on a par construction Π̆yK = ΠyK , on a

S(I, f, Π) − S(I, f, Π̆) = S(I, 1J̄\T f, Π) − S(I, 1J̄\T f, Π̆)


$ i i
= [S(K, f (y i, ·), ΠyK ) − S(K, f (y i, ·), Π̆yK )]µ(J i ).
¯ }
{1≤i≤m : yi ∈J\T
542 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS

D’autre part,
|S(I, 1J̄\T f, Π) − S(J, 1J\T
¯ F, ΠJ )|
# #
# #
# $ i #
= ## [S(K, f (y i, ·), ΠyK ) − F (y i )]µ(J i )##
#{1≤i≤m : yi ∈J\T
¯ } #
$ i i
≤2 [S(K, f (y i, ·), ΠyK ) − S(K, f (y i, ·), Π̆yK )]µ(J i )
¯ }
{1≤i≤m : yi ∈J\T

= 2[S(I, f, Π) − S(I, f, Π̆)] ≤ !/2.


Dès lors,
|S(I, f, Π) − S(J, F, ΠJ )| ≤ !/4 + !/2 = 3!/4,
et par conséquent,
#J # #J #
# # # #
# f − S(J, F, ΠJ )# ≤ # f − S(I, f, Π)# + |S(I, f, Π) − S(J, F, ΠJ )|
# ¯ # # ¯ #
I I

≤ !/4 + 3!/4 = !.

En inversant le rôle des variables y et z, on obtient évidemment la version


duale du théorème de Fubini.
Théorème. Si f est intégrable sur I¯ et si l’on pose

S = {z ∈ K̄ : f (·, z) n’est pas intégrable sur J¯},

alors S est de s-mesure nulle, la fonction G définie p.p. sur K̄ par


J J
G(z) = f (·, z) = f (y, z) dy
J¯ J¯

est intégrable sur K̄ et J J


G= f,
K̄ I¯
ce qui s’écrit encore
J 2J 3 J
f (y, z) dy dz = f.
K̄ J¯ I¯

Le résultat suivant montre que le calcul d’un intégrale sur un pavé de Rn


se ramène au calcul de n intégrales successives sur un intervalle fermé.
14.3. THÉORÈME DE FUBINI 543

Corollaire. Si f est une fonction de Rn dans Rp intégrable sur I¯ = I¯1 ×


. . . × I¯n , alors, pour toute permutation {i1 , . . . , in} de {1, . . ., n}, on a
J J ,J , ,J - - -
f= ... f (x1 , . . ., xn )dxi1 . . . dxin−1 dxin .
I¯ I¯in I¯in−1 I¯i1

Démonstration. Elle consiste en des applications successives du théorème


de Fubini pour différentes décompositions de I¯ :
J J
f= f
I¯ (I¯1 ×...×I¯i1 )×(I¯i1 +1 ×...×I¯n )

J ,J -
= f (x) dx1 . . . dxi1 dxi1 +1 . . . dxn
I¯i1 +1 ×...×I¯n I¯1 ×...×I¯i1
J ,J ,J - -
= f (x) dxi1 dx1 . . . dxi1 −1 dxi1 +1 . . . dxn
I¯i1 +1 ×...×I¯n I¯1 ×...×I¯i1 −1 I¯i1
J ,J -
= Zi . . . dxn ,
f (x) dxi1 dx1 . . . dx 1
I¯1 ×...×I¯i1 −1 ×I¯i1 +1 ×...×I¯n I¯i1

Z signifie que l’expression dx manque. En écrivant


où dx i1 i1

I¯1 × . . . × I¯i1 −1 × I¯i1 +1 × . . . × I¯n

sous la forme
(I¯1 × . . . × I¯i2 ) × (I¯i2 +1 × . . . × I¯n )
avec le terme I¯i1 omis dans celui des deux facteurs où il se trouve, on obtient,
en procédant exactement comme ci-dessus pour i1 ,
J J ,J ,J - -
f= f (x) dxi1 dxi2 dx1 . . . dx" "
min(i1 ,i2 ) . . . dxmax(i1 ,i2 ) . . . dxn ,
I¯ J¯ I¯i2 I¯i1

avec
",i ) × . . . × Imax(i
J = I1 × . . . × Imin(i ",i ) × . . . × In .
1 2 1 2

En continuant de la sorte jusqu’à in , on obtient le résultat.


Remarque. Le théorème de Fubini est valable si l’on remplace partout
intégrable par L-intégrable. Pour le démontrer, il suffit d’appliquer les théorè-
mes ci-dessus à f et à |f |.
Nous allons maintenant étendre le théorème de Fubini au cas de l’inté-
grale sur une partie quelconque de Rn . Comme plus haut, dans le cas d’une
544 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS

partie non bornée de Rn , intégrable signifiera L-intégrable. Fixons tout


d’abord les notations. Si C ⊂ Rn = Rq × Rs , posons

A = {y ∈ Rq : ∃z ∈ Rs : (y, z) ∈ C}, B = {z ∈ Rs : ∃y ∈ Rq : (y, z) ∈ C}.

Ce sont respectivement les projections orthogonales de C sur Rq et sur Rs .


Pour chaque y ∈ A, posons

B(y) = {z ∈ Rs : (y, z) ∈ C},

et pour chaque z ∈ B, posons

A(z) = {y ∈ Rq : (y, z) ∈ C}.

On notera que

C = {(y, z) : y ∈ A et z ∈ B(y)} = {(y, z) : z ∈ B et y ∈ A(z)},

et dès lors, pour tout x = (y, z) ∈ Rn = Rq × Rs , on a

1C (x) = 1C (y, z) = 1A (y)1B(y)(z) = 1A (z)(y)1B (z).

Nous pouvons maintenant énoncer et démontrer le théorème de Fubini


pour l’intégration sur une partie quelconque de Rn .
Théorème. Si f est intégrable (resp. L-intégrable) sur C ⊂ Rn , et si, avec
les notations ci-dessus, on pose

à = {y ∈ A : f (y, ·) n’est pas intégrable (resp. L-intégrable) sur B(y)},

B̃ = {z ∈ B : f (·, z) n’est pas intégrable (resp. L-intégrable) sur A(z)},


alors à est de q-mesure nulle, B̃ est de s-mesure nulle, la fonction F définie
p.p. sur A par J
F (y) = f (y, z) dz
B(y)

est intégrable (resp. L-intégrable) sur A, la fonction G définie p.p. sur B


par J
G(z) = f (y, z) dy
A(z)

est intégrable (resp. L-intégrable) sur B, et l’on a


J J J
F = G= f,
A B C
14.3. THÉORÈME DE FUBINI 545

ce qui s’écrit encore


J ,J - J ,J - J
f (y, z) dz dy = f (y, z) dy dz = f.
A B(y) B A(z) C

Démonstration. Supposons tout d’abord que C soit borné et soit I =


J × K un semi-pavé de Rn = Rq × Rs tel que C ⊂ I. ¯ Démontrons le résultat
sous l’hypothèse d’intégrabilité, le cas de la L-intégrabilité s’obtenant en
remplaçant partout “intégrable” par “L-intégrable” dans l’argument. Si f˜
est un prolongement arbitraire de f à I, ¯ on a, pour presque tout x ∈ I, ¯
˜
fC (x) = 1C (x)f(x),
et dès lors 1C .f˜ est intégrable sur I.
¯ Par ailleurs,

T = {y ∈ J¯ : 1C (y, ·)f(y,
˜ ·) n’est pas intégrable sur K̄}

= {y ∈ J¯ : 1A (y).1B(y)(·).f(y,
˜ ·) n’est pas intégrable sur K̄}
˜ ·) n’est pas intégrable sur B(y)}
= {y ∈ J¯ : 1A (y).f(y,
= {y ∈ A : f (y, ·) n’est pas intégrable sur B(y)} = Ã.
Par le théorème de Fubini pour un pavé fermé, T est de q-mesure nulle et il
en est donc de même pour Ã. L’autre cas se traite de manière analogue. En
appliquant la seconde partie du théorème de Fubini pour un pavé fermé, on
trouve que la fonction F̃ définie par
J J
F̃ (y) = ˜ z) dz = 1A (y)
1C (y, z)f(y, ˜ z) dz
1B(y)(z)f(y,
K̄ K̄
J J
= 1A (y) f˜(y, z) dz = 1A (y) f (y, z) dz = 1A (y)F (y)
B(y) B(y)

est intégrable sur J¯ et que


J , J - J
1A (y) f (y, z) dz dy = fC .
J¯ B(y) I¯

En d’autres termes, F est intégrable sur A et l’on a


J ,J - J
f (y, z) dz dy = f.
A B(y) C

L’autre cas se traite d’une manière strictement analogue. Enfin, le cas de f


L-intégrable sur un ensemble C non borné se déduit aisément de la définition
de l’intégrale et du résultat pour le cas d’un ensemble borné.
546 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS

L’application du théorème de Fubini à la fonction caractéristique d’un


ensemble fournit immédiatement le résultat suivant, où l’on conserve les
mêmes notations que ci-dessus.
Corollaire. Si C est une partie n-intégrable de Rn , et si l’on pose

à = {y ∈ A : B(y) n’est pas n-intégrable},

B̃ = {z ∈ B : A(z) n’est pas n-intégrable},


alors à est de q-mesure nulle, B̃ est de s-mesure nulle, la fonction définie
p.p. sur A par y 2→ µ(B(y)) est intégrable sur A, la fonction définie p.p. sur
B par z 2→ µ(A(z)) est intégrable sur B et l’on a
J J
µ(B(y)) dy = µ(A(z)) dz = µ(C).
A B

Exemple. Si C = B2 (0; r) ⊂ R2 , alors


3 G G 2
A = ] − r, r[, B(y) = − r2 − y2 , r2 − y2 ,
L
et dès lors µ(B(y)) = 2 r 2 − y 2 et l’aire de B2 (0, r) vaut
J r G J π/2 G
µ(B2 (0, r)) = 2 r 2 − y 2 dy = 2r 2 1 − sin2 t cos t dt = πr 2 .
−r −π/2

Montrons enfin que l’emploi simultané du théorème de Fubini et du test


de comparaison pour les fonctions n-mesurables conduit à un critère utile de
L-intégrabilité sur un ensemble pour des fonctions réelles n-mesurables sur
cet ensemble. C’est le critère de L-intégrabilité de Tonelli.
Théorème. Si f est une fonction réelle n-mesurable sur A ⊂ Rn et s’il
existe un groupement (y1 , y2 , . . . , yr ) de (x1 , x2, . . . , xn ) tel que l’expression
J ,J ,J ,J - - -
... |f | dyr dyr−1 . . . dy2 dy1
A1 A2 (y1 ) Ar−1 (y1 ,...,yr−2 ) Ar (y1 ,...,yr−1 )

ait un sens (c’est-à-dire telle que chacune des intégrales successives à partir
du centre existe), où, pour chaque 1 ≤ k ≤ r,

Ak (y1 , . . . , yk−1 )

= {yk : (y1 , . . . , yk , yk+1 , . . ., yr ) ∈ A pour un (yk+1 , . . . , yr ) au moins},


14.3. THÉORÈME DE FUBINI 547

alors f est L-intégrable sur A.


Démonstration. Soit (fk )k∈N la suite de fonctions réelles définies p.p. sur
A par
fk = min(|f |, k)1Ak , k ∈ N,
où Ak = A ∩ B∞ [k]. Cette suite converge ponctuellement p.p. sur A vers |f |
et l’on a
0 ≤ fk (x) ≤ fk+1 (x) ≤ |f (x)|
pour presque tout x ∈ A et tout k ∈ N. En outre, chaque fonction fk est
n-mesurable et bornée p.p. sur Ak par k. Elle est donc L-intégrable sur
Ak en vertu du test de comparaison pour les fonctions mesurables, et donc
L-intégrable sur A puisqu’elle est nulle sur l’ensemble n-mesurable A \ Ak . .
Enfin, par le théorème de Fubini, on a
J
fk
A
J ,J ,J ,J - - -
= ... fk dyr dyr−1 . . . dy2 dy1
A1 A2 (y1 ) Ar−1 (y1 ,...,yr−2 ) Ar (y1 ,...,yr−1 )
J ,J ,J ,J - - -
≤ ... |f | dyr dyr−1 . . . dy2 dy1 ,
A1 A2 (y1 ) Ar−1 (y1 ,...,yr−2 ) Ar (y1 ,...,yr−1 )
H
pour chaque k ∈ N, ce qui montre que la suite croissante ( A fk )k∈N est
majorée, et donc convergente. Le théorème de convergence monotone de
Levi entraı̂ne donc l’intégrabilité sur A de |f | et, comme f est n-mesurable
sur A, un Corollaire du test de comparaison pour les fonctions mesurables
entraı̂ne sa L-intégrabilité.
Exemple. En guise d’application du critère de Tonelli, montrons que si
g et h sont des fonctions de Rn dans C L-intégrables sur Rn , alors leur
produit de convolution g ∗ h est défini p.p. sur Rn et est L-intégrable sur
Rn . Par hypothèse, g et h sont n-mesurables sur Rn et il en résulte que la
fonction f : (y, z) 2→ g(y − z)h(z) est 2n-mesurable sur R2n . D’autre part, en
utilisant l’invariance de l’intégrale pour une translation, on a, pour presque
tout z ∈ Rn , J J
|g(y − z)| dy = |g|,
Rn Rn
et dès lors
J 4J 5 J 4J 5
|h(z)| |g(y − z)| dy dz = h(z) |g| dz
Rn Rn Rn Rn
548 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS
4J 5 4J 5
= |h| |g| .
Rn Rn
Par le critère de Tonelli, f est L-intégrable sur R2n et, par le théorème
de Fubini, pour presque tout y ∈ Rn , la Hfonction z 2→ f (y − z)g(z) est L-
intégrable sur Rn et la fonction g∗h : y 2→ Rn g(y−z)h(z) dz est L-intégrable
sur Rn , avec J 4J 5 4J 5
g∗h= g h .
Rn Rn Rn

14.4 Transformations affines


Nous avons étudié précédemment l’effet d’un changement de variables sur
l’existence et le calcul des primitives d’une fonction de R dans Rp et nous en
avons déduit une formule donnant l’effet d’un changement de variable sur
le calcul de l’intégrale sur un intervalle fermé d’une fonction primitivable.
Nous allons étudier l’extension de ce résultat aux intégrales multiples.
Nous commencerons par le cas d’une transformation affine et considére-
rons tout d’abord une translation dans Rn , c’est-à-dire une application du
type
ta : Rn → Rn , x 2→ x + a,
pour un certain a ∈ Rn fixé. On notera que, pour tout x ∈ Rn , on a

det(ta )$x = det I = 1,

et l’on désignera par Jta (jacobien de ta ) l’application de Rn dans R définie


par Jta (x) = det(ta )$x.
Soit I un semi-pavé de Rn et f une H
fonction de Rn dans Rp définie et
¯ Nous poserons J = ¯ f et nous désignerons par I − a le
intégrable sur I. I
translaté
I − a = {x − a ∈ Rn : x ∈ I} = t−1 a (I)

de I par a. C’est évidemment un semi-pavé de Rn . Le résultat suivant a été


démontré parmi les propriétés élémentaires de l’intégrale.
Proposition. Si f est définie et intégrable sur I, ¯ alors f ◦ ta = (f ◦ ta )|Jta |
−1 ¯ ¯
est intégrable sur ta (I) = I − a et
J J
f (· + a) = f ◦ ta =
¯
I−a t−1 ¯
a (I)
J J
(f ◦ ta )|Jta | = f.
t−1 ¯
a (I) I¯
14.4. TRANSFORMATIONS AFFINES 549

Passons maintenant au cas d’un automorphisme de Rn . Nous aurons


besoin des résultats suivants d’algèbre linéaire.
Lemme. Tout automorphisme de Rn peut s’obtenir comme composé d’un
nombre fini d’automorphismes élémentaires appartenant aux types suivants:
a. hr : x 2→ (rx1 , x2 , . . . , xn ), (r > 0);
b. s : x 2→ (−x1 , x2 , . . ., xn );
c. pkl : x = (x1 , . . . , xk , . . . , xl , . . . , xn ) 2→ (x1 , . . ., xl , . . ., xk , . . . , xn);
d. r : x 2→ (x1 + x2 , x2 , . . . , xn).

Lemme. Si L1 , . . . , Lm sont des endomorphismes de Rn ,, alors

det(L1 ◦ . . . ◦ Lm ) = (det L1 ). . . ..(det Lm ).

On notera que, pour tout x ∈ Rn , on a

Jhr (x) = det(hr )$x = det hr = r,

Js (x) = det s$x = det s = −1,


Jpkl (x) = det(pkl )$x = det pkl = −1,
Jr (x) = det rx$ = det r = 1.
La démonstration des formules de changement de variables pour les trans-
formations hr , s et pkl est similaire. Considérons tout d’abord le cas de hr .
¯ alors r.(f ◦hr) = (f ◦hr )|Jr |
Proposition. Si f est définie et intégrable sur I,
est intégrable sur h−1
r ( ¯
I) et on a
J J J
r.(f ◦ hr ) = (f ◦ hr )|Jhr | = f.
h−1 ¯
r (I) h−1 ¯
r (I) I¯

Démonstration. On notera tout d’abord que puisque

h−1 −1
r : x 2→ (r x1 , x2 , . . ., xn ),

h−1 n ¯
r (I) est un semi-pavé de R . Soit ! > 0; il existe une jauge δ sur I telle
que
|S(I, f, Π) − J|2 ≤ !.
−1 −1 ¯
Soit δ̃ la jauge définie sur
8 hr (I)9 = hr (I) par δ̃ = c.(δ ◦ hr ) où c =
j ˜j
min(1, r ), et soit Π̃ = (x̃ , I )
−1
une P-partition δ̃-fine de h−1
r (I).
1≤j≤m
Posons
xj = hr (x̃j ), I j = hr (I˜j ), (1 ≤ j ≤ m).
550 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS

Par construction, xj ∈ I¯j , (1 ≤ j ≤ m) et hr (I˜j ) est un semi-pavé contenu


dans I. En outre, puisque hr est une bijection de Rn sur Rn et que les
I˜j , (1 ≤ j ≤ m) partitionnent h−1
r (I), les I , (1 ≤ j ≤ m) partitionnent I.
j

Enfin, les relations

I˜j ⊂ B∞ [x̃j ; δ̃(x̃j )], (1 ≤ j ≤ m),

entraı̂nent, si I˜j = I˜1j × . . . × I˜nj et I j = I1j × . . . × Inj , les inclusions

I˜kj ⊂ [x̃jk − δ(x̃j ), x̃jk + δ(x̃j )], (1 ≤ k ≤ n, 1 ≤ j ≤ m).

Dès lors, si 2 ≤ k ≤ n, on a

Ikj = I˜kj ⊂ [x̃jk − δ̃(x̃j ), x̃jk + δ̃(x̃j )] = [xjk − cδ(hr (x̃j )), xjk + cδ(hr (x̃j ))]
j j j j
= [xk − cδ(xj ), xk + cδ(xj ))] ⊂ [xk − δ(xj ), xk + δ(xj )],
tandis que, si k = 1, on a

I1j = r I˜1j ⊂ [rx̃j − r δ̃(x̃j ), rx̃j + r δ̃(x̃j )] = [xj1 − δ(xj ), xj1 + δ(xj )].

Dès lors I j ⊂ B∞ [xj ; δ(xj )] pour chaque 1 ≤ j ≤ m et Π = {(x1 , I 1), . . . , (xm, I m)}
est une P-partition δ-fine de I. En conséquence, si l’on note en outre que
µ(I j ) = rµ(I˜j ) pour chaque 1 ≤ j ≤ m, on obtient
# #
#$m #
# #
−1
|S(hr (I), r.(f ◦ hr ), Π̃) − J|2 = #
# ˜
rf (hr (x̃ ))µ(I ) − J ##
j j
#j=1 #
2
# #
#m #
#$ #
= ## f (x )µ(I ) − J ## = |S(I, f, Π) − J|2 ≤ !,
j j
#j=1 #
2
et la démonstration est complète.
Considérons maintenant le cas des transformations de type s.
¯ alors f ◦ s = (f ◦ s)|Js |
Proposition. Si f est définie et P-intégrable sur I,
−1 ¯
est P-intégrable sur s (I) et l’on a
J J J
f ◦s= (f ◦ s)|Js | = f.
¯
s−1 (I) ¯
s−1 (I) I¯

Démonstration. Notons tout d’abord que si I = I1 × . . . × In avec Ii =


]ai , bi], 1 ≤ i ≤ n, alors, puisque s−1 = s, on a

s−1 (I) = s(I) = (−I1 ) × I2 × . . . × In = [−b1 , −a1 [ ×I2 × . . . × In ,


14.4. TRANSFORMATIONS AFFINES 551

n’est pas un semi-pavé, mais

¯ = s−1 (I) = K̄,


s−1 (I)

si K = K 1 × . . . × K n désigne le semi-pavé ] − b1 , −a1 ] × I2 × . . . × In . Il


¯ remplacé par K̄. Si ! > 0
suffit donc de démontrer le théorème avec s−1 (I)
est donné, il existe une jauge δ sur I¯ telle que

|S(I, f, Π) − J|2 ≤ !

pour toute P-partition A


δ-fine BΠ de I. Définissons la jauge δ̃ sur K̄ par
δ̃ = δ ◦ s, et soit Π̃ = (x̃j , K j ) 1≤j≤m une P-partition δ̃-fine de K̄. On peut,
sans perte de généralité, supposer les K j = K1j × . . .× Knj numérotés de telle
sorte que K1j =]cj , cj+1 ], avec c1 = −b1 , cm+1 = −a1 , cj < cj+1 , (1 ≤ j ≤ m).
Posons, pour chaque 1 ≤ j ≤ m,
j j
xj = s(x̃j ), I j = I1 × . . . × Inj = ] − cj+1 , −cj ] × I2 × . . . × Inj .

De la relation

−b1 = c1 < c2 < . . . < cm < cm+1 = −a1 ,

on tire aussitôt

a1 = −cm+1 < −cm < . . . < −c2 < −c1 = b1 ,

et les I j , (1 ≤ j ≤ m) partitionnent I. D’ailleurs, par construction, xj ∈ I¯j


pour chaque 1 ≤ j ≤ m et, des relations

K j ⊂ B∞ [x̃j ; δ̃(x̃j )], 1 ≤ j ≤ m,

on déduit aisément, pour 2 ≤ k ≤ n,

Ikj = Kkj ⊂ [x̃jk − δ̃(x̃j ), x̃jk + δ̃(x̃j )] = [xjk − δ(s(x̃j )), xjk + δ(s(x̃j ))]

= [xjk − δ(xj ), xjk + δ(xj )],


et, pour k = 1,

I1j =] − cj+1 , −cj ] ⊂ [−cj+1 , −cj ] = −K1j

= −K1j ⊂ [−x̃j1 − δ̃(x̃j ), −x̃j1 + δ̃(x̃j )]


552 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS

= [xj1 − δ(s(x̃j )), xj1 + δ(s(x̃j ))] = [xj1 − δ(xj ), xj1 + δ(xj )].
Donc Π = {(x1 , I 1), . . . , (xm, I m)} est une P-partition δ-fine de I telle que,
pour chaque 1 ≤ j ≤ m, on a µ(I j ) = µ(I˜j ). En conséquence,
# #
#m #
#$ #
|S(K, f ◦ s, Π̃) − J|2 = ## f (s(x̃j ))µ(I j ) − J ##
#j=1 #
2
# #
#$ #
#m #
= ## f (x )µ(I ) − J ## = |(S(I, f, Π) − J|2 ≤ !,
j j
#j=1 #
2
et la démonstration est complète.
Considérons pour suivre le cas de la transformation pkl avec 1 ≤ k < l ≤
n.
¯ alors f ◦pkl = (f ◦pkl )|Jp |
Proposition. Si f est définie et intégrable sur I, kl
−1 ¯
est intégrable sur pkl (I) et l’on a
J J J
f ◦ pkl = f ◦ pkl |Jpkl | = f.
p−1
kl
¯
(I) p−1
kl
¯
(I) I¯

Démonstration. Notons tout d’abord que p−1


kl = pkl et dès lors, si I =
I1 × . . . × In , alors

p−1
kl (I) = I1 × . . . × Il × . . . × Ik × . . . × In

est un semi-pavé de Rn . Soit ! > 0 et δ une jauge sur I¯ telle que |S(I, f, Π)−
J|2 ≤ ! pour toute P-partition δ-fine Π de I. Définissons 8 la 9jauge δ̃ sur
−1 −1 ¯ j ˜j
pkl (I) = pkl (I) par la relation δ̃ = δ ◦ pkl , et soit Π̃ = (x̃ , I ) une
1≤j≤m
P-partition δ̃-fine de p−1
kl (I). Posons, pour chaque 1 ≤ j ≤ m,

xj = pkl (x̃j ), I j = pkl (I j ) = I˜1 × . . . × I˜l × . . . × I˜k × . . . × I˜nj ,


j j j

ce qui implique aussitôt µ(I j ) = µ(I˜j ) et xj ∈ I¯j , 1 ≤ j ≤ m. D’ailleurs,


puisque pkl est une bijection de Rn sur Rn et que les I˜j partitionnent p−1 kl (I),
les I j partitionnent I. Enfin, puisque I˜j ⊂ B∞ [x̃j ; δ̃(x̃j )], 1 ≤ j ≤ m, on a,
pour chaque i /= k et /= l compris entre 1 et n,

Iij = I˜ij ⊂ [x̃ji − δ̃(x̃j ), x̃ji + δ̃(x̃j )] = [xji − δ(pkl (x̃j )), xji + δ(pkl (x̃j ))]

= [xji − δ(xj ), xji + δ(xj )],


14.4. TRANSFORMATIONS AFFINES 553

tandis que, si i = k,

Ik = I˜l ⊂ [x̃l − δ̃(x̃j ), x̃l + δ̃(x̃j )] = [xK − δ(xj ), xk + δ(xj )],


j j j j j j

et de même,
Ilj ⊂ [xjl − δ(xj ), xjl + δ(xj )].
Donc Π = {(x1 , I 1 ), . . ., (xm, I m)} est une P-partition δ-fine de I, ce qui
entraı̂ne
# #
#m #
# $ #
−1
|S(pkl (I), f ◦ pkl , Π̃) − J|2 = #
# ˜
f (pkl (x̃ ))µ(I ) − J ##
j j
#j=1 #
2
# #
#m #
#$ #
=#
# f (x )µ(I ) − J ## = |S(I, f, Π) − J|2 ≤ !,
j j
#j=1 #
2
et achève la démonstration.
Le cas de la transformation r diffère substantiellement des précédents
par le fait que, si I = I1 × . . . × In , l’adhérence de

r −1 (I) = {x ∈ Rn : x1 + x2 ∈ I1 , x2 ∈ I2 , . . . , xn ∈ In }

n’est pas un pavé fermé de Rn , ce qui exclut un traitement direct à partir de


la définition d’intégrabilité sur un pavé fermé. En fait, on peut construire
un exemple de fonction f de R2 dans R qui est intégrable (mais non L-
intégrable) sur l’adhérence I¯ d’un semi-pavé I de R2 et telle que f ◦ r ne
soit pas intégrable sur r −1 (I)¯ (c’est-à-dire telle que f ◦ r ne soit intégrable
sur aucun pavé fermé contenant r −1 (I)). ¯ On a toutefois une formule de
changement de variable pour une transformation de type r lorsque f est
¯
L-intégrable sur I.
Proposition. Si f est L-intégrable sur I, ¯ alors f ◦ r = (f ◦ r)|Jr | est L-
−1 ¯
intégrable sur r (I) et l’on a
J J J
f ◦r = (f ◦ r)|Jr | = f.
¯
r −1 (I) ¯
r −1 (I) I¯

Démonstration. Les fonctions f et |f |2 , L-intégrables sur I,¯ sont n-


¯ ¯
mesurables sur I et dès lors f ◦ r et |f ◦ r|2 sont n-mesurables sur r −1 (I).
En vertu du théorème de Fubini, on a
J J 2J 3
f= f (x1 , x2 , . . . , xn ) dx1 dx2 . . . dxn ,
I¯ I¯2 ×...×I¯n I¯1
554 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS

et pour les (x2 , . . ., xn ) pour lesquels f (·, x2 , . . ., xn ) est L-intégrable sur I¯1 ,
la première proposition de cette section entraı̂ne la L-intégrabilité sur I¯1 −x2
de la fonction f (· + x2 , x2 , . . . , xn ) et les égalités
J J
f (x1 , x2 , . . ., xn ) dx1 = f (x1 + x2 , x2 , . . . , xn) dx1
I¯1 I¯1 −x2
J
= (f ◦ r)(x1 , . . ., xn ) dx1 .
I¯1 −x2
Par conséquent, (f ◦r)(·, x2, . . . , xn ) est L-intégrable sur I¯1 −x2 pour presque
tout (x2 , . . . , xn) ∈ I¯2 × . . . × I¯n et l’on a l’égalité
J J 2J 3
f= (f ◦ r)(x1 , . . . , xn) dx1 dx2 . . . dxn .
I¯ I¯2 ×...×I¯n I¯1 −x2

On montre de la même manière que |f ◦ r|2 (·, x2, . . . , xn ) est L-intégrable sur
I¯1 − x2 pour presque tout (x2 , . . . , xn ) ∈ I¯2 × . . . × I¯n et que
J J 2J 3
|f |2 = |f ◦ r|2 (x1 , . . . , xn) dx1 dx2 . . . dxn .
I¯ I¯2 ×...×I¯n I¯1 −x2

Le critère de Tonelli implique alors que f ◦ r est L-intégrable sur l’ensemble


{x ∈ Rn : x1 ∈ I¯1 − x2 , x2 ∈ I¯2 , . . . , xn ∈ I¯n } = r −1 (I),
¯
H
et la dernière formule obtenue pour I¯ f avec une nouvelle application du
¯ fournit l’égalité
théorème de Fubini à la fonction f ◦ r sur r −1 (I)
J J
f ◦r = f;
¯
r −1 (I) I¯

la démonstration est complète.


En combinant les résultats d’algèbre linéaire rappelés plus haut et les
propositions que nous venons de démontrer, nous obtenons aussitôt le thé-
orème du changement de variable affine dans une intégrale suivant.
Théorème. Si f est L-intégrable sur I¯ et si
g : Rn → Rn , x 2→ g(x) = a + A(x)
avec a ∈ Rn et A est un automorphisme de Rn , alors (f ◦g)|Jg | = (f ◦g)| det A|
¯ et l’on a
est L-intégrable sur g −1 (I)
J J
(f ◦ g)|Jg | = f.
¯
g −1 (I) I¯

Une conséquence utile de ce théorème fournit une expression pour la


mesure du transformé d’un pavé fermé par une application affine.
14.5. DIFFÉOMORPHISMES 555

Corollaire. Si I est un semi-pavé de Rn et h : Rn → Rn , x 2→ a + A(x) est


¯ est n-intégrable et l’on
une application affine telle que det A /= 0, alors h(I)
a
¯ = | det A|µ(I)
µ(h(I)) ¯ = |Jh |µ(I).
¯

Démonstration. Appliquons le théorème précédent à f = 1 et g = h−1 .


On a donc, pour tout x ∈ Rn ,

g(x) = −A−1 a + A−1 (x),

et dès lors

Jg (x) = det A−1 = (det A)−1 , f ◦ g = 1 ◦ g = 1.

Par le théorème précédent, (f ◦ g)|Jg | = | det A|−1 (et donc toute fonction
¯ = h(I)
constante) est L-intégrable sur g −1 (I) ¯ et l’on a
J J
−1
| det A| = 1.
¯
h(I) I¯

¯ est n-intégrable et
Par conséquent, h(I)

¯ = | det A|µ(I).
µ(h(I)) ¯

14.5 Difféomorphismes
L’extension du théorème de changement de variables à certaines transforma-
tions non affines requiert quelques résultats préliminaires.

Définition. Soit E un ouvert non vide de Rn et g une application de E


dans Rn . On dit que g est un difféomorphisme de E sur g(E) si g est une
bijection de E sur l’ouvert g(E) telle que g et g −1 soient de classe C 1 sur E
et g(E) respectivement.

Soit E un ouvert non vide de Rn , g un difféomorphisme de E sur g(E).


Comme g −1 ◦ g = I entraı̂ne Jg−1 (x).Jg (x) = 1, on aura Jg (x) /= 0 pour tout
x ∈ E.
556 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS

Lemme. Soit η > 0 donné. Pour chaque a ∈ E, il existe δ(a) > 0 tel que,
pour tout semi-cube I de côté c pour lequel
a ∈ I¯ ⊂ B∞ [a; δ(a)],
on a
g(I) ⊂ h(I $ ),
où h est l’application affine de Rn dans Rn définie par
h(x) = g(a) + ga$ (x − a),
et I $ est le semi-cube de Rn concentrique à I et de côté (1 + η)c.
Démonstration. Puisque (ga$ )−1 existe et est linéaire, il existe une cons-
tante b = b(a) > 0 telle que
|(ga$ )−1 (x)|∞ ≤ b|x|∞
pour tout x ∈ Rn . Soit σ ∈ ]0, η/2b[ ; comme g est dérivable en a, il ex-
iste δ(a) > 0 (que l’on peut toujours supposer suffisamment petit pour que
B∞ [a; δ(a)] ⊂ E puisque E est ouvert) tel que
|g(x) − h(x)|∞ = |g(x) − g(a) − ga$ (x − a)|∞ ≤ σ|x − a|∞
pour tout x ∈ B∞ [a; δ(a)]. Soit I un semi-cube tel que
a ∈ I¯ ⊂ B∞ [a; δ(a)],
et soit y ∈ g(I). Il existe un et un seul x ∈ I ⊂ B∞ [a; δ(a)] tel que y = g(x)
et, h étant une bijection de Rn sur Rn , il existe un et un seul u ∈ Rn tel que
y = h(u). Si nous posons v = h(x), nous obtenons
y − v = h(u) − h(x) = ga$ (u − x),
et dès lors
|u − x|∞ = |(ga$ )−1 (y − v)|∞ ≤ b|y − v|∞ = b|g(x) − h(x)|∞ ≤ bσ|x − a|∞ .
¯ on a |x − a|∞ ≤ c, et dès lors
Mais, puisque x ∈ I et a ∈ I,
|u − x|∞ ≤ bσc < (η/2)c,
ce qui implique, si w désigne le centre de I, que
|u − w|∞ ≤ |u − x|∞ + |x − w|∞ < (η/2)c + c/2 = (c/2)(1 + η).
Donc u appartient au semi-cube I $ de centre w et de côté (1 + η)c et y =
h(u) ∈ h(I $ ).
14.5. DIFFÉOMORPHISMES 557

Lemme. Soit f une fonction de Rn dans R+ continue sur g(E) et soit ! > 0.
Pour chaque a ∈ E, il existe δ(a) > 0 tel que B∞ [a; δ(a)] ⊂ E et tel que,
pour tout semi-cube I vérifiant les relations

a ∈ I¯ ⊂ B∞ [a; δ(a)],

la fonction f est L-intégrable sur g(I) et l’on a


J J
f≤ (f ◦ g)|Jg | + !µ(I).
g(I) I¯

Démonstration. Notons tout d’abord que la fonction (f ◦ g)|Jg | continue


sur E, est L-intégrable sur tout pavé fermé I¯ contenu dans E et dès lors
l’intégrale du membre de droite dans l’inégalité ci-dessus existe. D’autre
part, pour tout semi-pavé I = ]a1 , b1] × . . . × ]an , bn] contenu dans E, on a
n
>
I = I¯ \ (K i ∪ Li ),
i=1

où
K i = [a1 , b1 ] × . . . × {ai } × . . . × [an , bn],
Li = [a1 , b1] × . . . × {bi } × . . . × [an , bn].
Dès lors, g étant injective, on a
, n
-
>
¯ \g
g(I) = g(I) (K ∪ L ) ,
i i

i=1

¯ et g[!n (K i ∪Li )] ⊂ g(I)


et g étant continue, g(I) ¯ sont des fermés bornés et
i=1
la fonction continue f y est L-intégrable. Comme 1g(I) = 1g(I) !
¯ −1 n (K i ∪Li)
i=1
on en déduit aussitôt la L-intégrabilité de f sur g(I). Soit maintenant a ∈
E, b = g(a), et posons

A = f (b) = (f ◦ g)(a) ≥ 0, B = |Jg (a)| > 0.

Définissons la fonction réelle ψ sur R2 par

ψ(ξ, η) = (A − ξ)(B − ξ) − (A + ξ)B(1 + η)n;

elle est continue sur R2 et telle que ψ(0, 0) = 0; en conséquence, pour l’!
donné dans l’énoncé, on pourra trouver un δ $ > 0 tel que pour tout ξ vérifiant
|ξ| ≤ δ $ et tout η vérifiant |η| ≤ δ $ , on aura |ψ(ξ, η)| ≤ !.
558 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS

En particulier, si ξ ∈ ]0, b[ ∩ ]0, δ $ [ et si η ∈ ]0, δ $[ sont fixés, on a

(A + ξ)B(1 + η)n ≤ (A − ξ)(B − ξ) + !.

D’autre part, f étant continue en b, il existera un δ $$ > 0 (que l’on peut


toujours choisir suffisamment petit pour que B∞ [b; δ $$] ⊂ g(E)) tel que

A − ξ ≤ f (y) ≤ A + ξ

pour tout y ∈ B∞ [b; δ $$]. Enfin, g et |Jg | étant continues en a, il existera


δ(a) > 0 (que l’on peut toujours choisir inférieur ou égal au δ(a) associé à η
par le lemme précédent et suffisamment petit pour que B∞ [a; δ(a)] ⊂ E) tel
que
|g(x) − g(a)|∞ = |g(x) − b|∞ ≤ δ $$
et
|Jg (x)| ≥ B − ξ,
pour tout x ∈ B∞ [a; δ(a)]. En conséquence, si I est un semi-cube tel que
a ∈ I¯ ⊂ B∞ [a; δ(a)], on obtient, en vertu du lemme précédent et du corollaire
du théorème de changement de variables affine,
J
f ≤ (A + ξ)µ(g(I)) ≤ (A + ξ)µ(h(I $)) = (A + ξ)|Jg (a)|µ(I $)
g(I)

= (A + ξ)B(1 + η)n cn = (A + ξ)B(1 + η)nµ(I).


D’autre part, pour tout x ∈ B∞ [a; δ(a)], on a, par les inégalités qui précè-
dent,
f (g(x))|Jg(x)| ≥ (A − ξ)(B − ξ),
et dès lors J
(f ◦ g)|Jg | ≥ (A − ξ)(B − ξ)µ(I)

J
≥ (A + ξ)B(1 + η)nµ(I) − !µ(I) ≥ f − !µ(I),
g(I)

ce qui achève la démonstration.

Lemme. Soit f une fonction de Rn dans R+ continue sur g(E). Pour tout
semi-cube I tel que I¯ ⊂ E, on a
J J
f≤ (f ◦ g)|Jg |.
g(I) I¯
14.5. DIFFÉOMORPHISMES 559

Démonstration. L’existence des deux intégrales a déjà été prouvée dans


la première partie de la démonstration du lemme précédent. Si ! > 0 est
donné, l’application strictement positive δ définie pour chaque a ∈ E par le
δ(a) fournit par le lemme précédent est évidemment une jauge sur E. Soit
I un semi-cube tel que I¯ ⊂ E. Par le théorème de Cousin, il existe une
P-partition régulière et δ-fine Π = {(x1 , I 1 ), . . ., (xm, I m)} de I; les I j sont
donc des semi-cubes partitionnant I et tels que

xj ∈ I¯j ⊂ B∞ [xj ; δ(xj )], 1 ≤ j ≤ m.

Dès lors, par le lemme précédent, on a


J J
f≤ (f ◦ g)|Jg | + !µ(I j ), 1 ≤ j ≤ m.
g(I j ) I¯j

D’autre part, g étant injective, les g(I j ) partitionnent g(I); dès lors, si K
est un semi-pavé tel que g(I) ⊂ K̄, on a
 
J J J m
$ m 4J
$ 5
f= 1g(I)f =  1g(I j ) f  = 1g(I j ) f =
g(I) K̄ K̄ j=1 j=1 K̄

 
m J
$ m J
$ m
$ J
f≤ (f ◦ g)|Jg| + !  µ(I j ) = (f ◦ g)|Jg | + !µ(I).
j
j=1 g(I ) j=1 I
j
j=1 I¯

Comme ! > 0 est arbitraire, la thèse en résulte.


Nous pouvons maintenant énoncer et démontrer le théorème du chan-
gement de variables dans l’intégrale sur un fermé borné d’une fonc-
tion réelle continue.
Théorème. Soit f une fonction réelle continue sur g(E) et F ⊂ g(E) un
fermé borné. Alors on a
J J
f= (f ◦ g)|Jg |.
F g −1 (F )

Démonstration. Notons tout d’abord que les deux membres de la formule


ont un sens puisque, F et g −1 (F ) étant des fermés bornés et f et (f ◦ g)|Jg |
des fonctions continues sur ces ensembles, elles y seront L-intégrables. Soit
I un semi-cube tel que G = g −1 (F ) ⊂ int I, ce qui implique en outre
que F ⊂ g(I). Le théorème de structure des ouverts bornés qui suit le
lemme de recouvrement et le fait que int I \ G soit un ouvert borné en-
traı̂nent l’existence d’une suite (gk )k∈N de fonctions réelles et d’une suite
560 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS

({I1k , . . . , Im
k
k
})k∈N de partitions de I en semi-cubes telles que chaque gk soit
constante p.p. sur Ijk , 1 ≤ j ≤ mk , et telle que, pour tout x ∈ I, on ait

0 ≤ gk (x) ≤ gk+1 (x) ≤ 1, lim gk (x) = 1G (x).


k→∞

Dès lors, en utilisant le théorème de Levi, le lemme qui précède et le ca-


ractère injectif de g, on trouve, en désignant par xk,l un élément arbitraire
de Ilk et en supposant provisoirement que f est une fonction de Rn dans R+ ,
J J
(f ◦ g)|Jg | = 1G .(f ◦ g)|Jg |
g −1 (F ) I¯

J 4 5 J
= lim gk .(f ◦ g)|Jg| = lim gk .(f ◦ g)|Jg |
I¯ k→∞ k→∞ I¯
   
mk J
$ mk
$ J
= lim  gk .(f ◦ g)|Jg | = lim  gk (xk,j ) (f ◦ g)|Jg |
k→∞ ¯k k→∞ I¯jk
j=1 Ij j=1
   
mk
$ J mk J
$
≥ lim  gk (xk,j ) f  = lim  gk (xk,j )f 
k→∞ g(Ijk ) k→∞ k
j=1 j=1 g(Ij )
   
mk J
$ mk J
$
−1 −1
= lim  gk (g (g(x k,j
)))f  = lim  (gk ◦ g )f 
k→∞ k k→∞ k
j=1 g(Ij ) j=1 g(Ij )
J J J J
= lim (gk ◦ g −1 )f = lim [(gk ◦ g −1 )f ] = 1F f = f.
k→∞ g(I) g(I) k→∞ g(I) F

On a donc J J
(f ◦ g)|Jg | ≥ f.
g −1 (F ) F

En appliquant cette inégalité avec g, F, f respectivement remplacés par


g −1 , g −1 (F ), (f ◦ g)|Jg |, on obtient
J
(f ◦ g)|Jg |
g −1 (F )
J
≤ ((f ◦ g) ◦ g −1 ).|Jg | ◦ g −1 .|Jg−1 |
(g −1 )−1 (g −1 (F ))
J J
= f.|(Jg ◦ g −1 ).Jg−1 | = f,
F F
14.5. DIFFÉOMORPHISMES 561

puisque, de l’identité sur g(E),

g ◦ g −1 = I,

on déduit, par le théorème de dérivation des fonctions composées, pour tout


y ∈ g(E),
I = (g ◦ g −1 )$y = gg$ −1 (y) ◦ (g −1 )$y ,
et dès lors, en prenant les déterminants,
8 9 D ED E
1 = det gg$ −1 (y) ◦ (g −1 )$y = det gg$ −1 (y) det(g −1 )$y )
D E
= Jg (g −1 (y)).Jg−1 (y) = (Jg ◦ g −1 ).Jg−1 (y).

En conséquence, on a, pour une fonction continue et positive sur g(E),


J J
f= (f ◦ g)|Jg |.
F g −1 (F )

Si maintenant f est une fonction réelle continue sur g(E), alors f = f + − f −


avec f + et f − des fonctions réelles positives L-intégrables sur g(E) et,
puisque |Jg | est une fonction à valeurs strictement positives, on trouve
aisément que

[(f ◦ g)|Jg|]+ = (f + ◦ g)|Jg |, [(f ◦ g)|Jg |]− = (f − ◦ g)|Jg |.

Dès lors, en appliquant le résultat à f + et f − et en recombinant, on obtient


le résultat désiré.
Remarque. La formule que nous venons de démontrer s’étend facilement au
cas d’une fonction continue sur un fermé non borné en utilisant la définition
de L-intégrabilité sur un ensemble non borné et le théorème précédent.
Terminons cette section en énonçant, sans démonstration, le théorème
général de changement de variables dans une intégrale multiple.
Théorème. Soit g un difféomorphisme de l’ouvert E de Rn sur l’ouvert
g(E) de Rn et soit f une fonction de Rn dans Rp définie p.p. sur une partie
A de g(E). Alors f est L-intégrable sur A si et seulement si (f ◦ g)|Jg | est
L-intégrable sur g −1 (A), auquel cas on a la formule
J J
f= (f ◦ g)|Jg |.
A g −1 (A)
562 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS

Ce théorème peut se démontrer à partir du cas particulier traité ici en


utilisant un théorème d’approximation, pour la convergence en moyenne,
des fonctions L-intégrables par des fonctions continues, que nous n’avons
pas démontré ici.
Dans le cas particulier où n = 1 et où A = [a, b], l’hypothèse faite sur g
entraı̂ne que g est strictement croissante ou strictement décroissante. Dans
le premier cas, g $ est strictement positive,

g −1 ([a, b]) = [g −1 (a), g −1 (b)]

et la formule devient
J b J g −1 (b)
f= (f ◦ g)g $.
a g −1 (a)

Dans le deuxième cas, g $ est strictement négative,

g −1 ([a, b]) = [g −1 (b), g −1(a)]

et la formule devient
J b J g −1 (a) J g −1 (b)
f =− (f ◦ g)g $ = (f ◦ g)g $.
a g −1 (b) g −1 (a)

On retrouve donc bien la formule démontrée dans le cas des fonctions pri-
mitivables.
Les théorèmes de Fubini, Tonelli et du changement de variable fournissent
une autre méthode pour calculer l’intégrale de Poisson
J ∞
I= exp(−x2 ) dx.
0

On a, par les théorèmes de Tonelli et Fubini,


4J ∞ 5 4J ∞ 5
I =2
exp(−x ) dx 2
exp(−y ) dy 2
0 0

J ∞ 2J ∞ 3 J
= exp[−(x + y )] dx dy =
2 2
exp[−(x2 + y 2 )] dx dy.
0 0 ]0,∞ × ]0,∞[

La transformation g (passage aux coordonnées polaires) définie par

g(ρ, θ) = (ρ cos θ, ρ sin θ)


14.6. EXERCICES 563

est un difféomorphisme de ]0, ∞[ × ]0, π2 [ sur ]0, ∞[ × ]0, ∞[ et l’on calcule


aisément que Jg (ρ, θ) = ρ. En conséquence, le théorème du changement de
variables et le théorème de Fubini entraı̂nent
J
exp[−(x2 + y 2 )] dx dy
]0,∞[ × ]0,∞[
J
= exp(−ρ2 )ρ dρ dθ
]0,∞[ × ]0, π
2
[
J J ∞
π π π
= exp(−ρ2 )ρ dρ = exp(−t) dt = ,
2 ]0,∞[ 4 0 4

π
d’où l’on déduit aussitôt la valeur 2 de l’intégrale de Poisson.

14.6 Exercices
1. Soit f une fonction continue de R2 dans R possédant une dérivée partielle
par rapport à la première variable continue sur R et soient a et b deux
fonctions dérivables de R dans R. Si F est l’application de R dans R définie
par
J b(y)
F (y) = f (y, z) dz,
a(y)

montrer que F est dérivable en tout point de R et que


J b(y)
$ $ $
F (y) = f (y, b(y))b (y) − f (y, a(y))a (y) + D1 f (y, z) dz.
a(y)

Pour ce faire, on définira l’application H de R3 dans R par


J v
H(u, v, y) = f (y, z) dz,
u

qui est donc telle que F (y) = H(a(y), b(y), y), et on calculera F $ (y) en
utilisant le théorème de dérivation des fonctions composées et la règle de
Leibniz.
2. Utiliser la règle de Leibniz pour montrer que le potentiel V du champ de
gravitation créé par un corps matériel M de densité continue ρ vérifie, en
tout point x n’appartenant pas à M , l’équation de Laplace
3
$
∆V (x) ≡ 2
Djj V (x) = 0.
j=1
564 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS

3. Pour chaque n ∈ N, soit Jn la fonction définie par l’intégrale


J
1 π
Jn (x) = cos(nt − x sin t) dt.
π 0

En utilisant la règle de Leibniz, montrer que Jn vérifie l’équation différentielle


de Bessel. On notera que

Dt[cos(nt − x sin t)] = −[sin(nt − x sin t)](n − x cos t)

= −n sin(nt − x sin t) + xDx[cos(nt − x sin t)].


En déduire que le membre de droite de cette expression constitue une repré-
sentation intégrale de la fonction de Bessel Jn .
4. Soit v : R → R une fonction L-intégrable. Montrer que la fonction u
donnée par
J , - , -
1 ∞ (x − y)2 1 (·)2
u(t, x) = √ exp − v(y) dy = √ exp − ∗ v,
2 πt −∞ 4t 2 πt 4t

est bien définie sur ]0, ∞[ ×R. Montrer que, pour chaque x ∈ R, on a

lim u(t, x) = v(x),


t→0+

et, en utilisant la règle de Leibniz, montrer que u vérifie sur ]0, ∞[ ×R,
l’équation de la chaleur
2
Dt u(t, x) − Dxx u(t, x) = 0.

5. Soit E ⊂ Rn un ensemble n-intégrable et f et g des fonctions de Rn dans


R intégrables sur E et telles que la fonction de Rn × Rn dans R définie par

(x, y) 2→ [f (x) − f (y)][g(x) − g(y)]

soit intégrable sur E × E. Utiliser le théorème de Fubini pour montrer que


f g est intégrable sur E et que l’on a l’identité de Tchebycheff
J J 4J 5 4J 5
1
[f (x) − f (y)][g(x) − g(y)] dx dy = µ(E) fg − f g .
2 E×E E E E

Si n = 1, E est un intervalle et si f et g sont toutes deux croissantes sur E


ou décroissantes sur E, en déduite l’inégalité de Tchebycheff
J 4J 5 4J 5
1
fg ≥ f g .
E µ(E) E E
14.6. EXERCICES 565

6. Soit E ⊂ Rn et f et g des fonctions de Rn dans R telles que f 2 et g 2


soient intégrables sur E et telles que la fonction de Rn × Rn dans R définie
par
(x, y) 2→ [f (x)g(y) − f (y)g(x)]2
soit intégrable sur E × E. Utiliser le théorème de Fubini pour montrer que
f g est intégrable sur E et que l’on a l’identité de Lagrange
J 4J 5 4J 5 4J 52
1
[f (x)g(y) − f (y)g(x)] dx dy = 2
f 2
g 2
− fg .
2 E×E E E E

En déduire l’inégalité de Cauchy-Schwarz-Bouniakowsky


4J 52 4J 5 4J 5
fg ≤ f2 g2 .
E E E

7. Soit I = ]0, b]× ]0, d] un semi-pavé de R2 et P une partition de I en un


nombre fini de semi-pavés. Montrer que si chaque semi-pavé de P possède
un côté de longueur entière, alors I possède un côté de longueur entière. On
notera que
J β 1
sin 2πx dx = [sin π(β + α). sin π(β − α)],
α π
et que dès lors cette intégrale est nulle si et seulement si β + α ou β − α
est entier. D’autre part, le théorème de Fubini entraı̂ne que si f (x, y) =
sin 2πx. sin 2πy, et si K = ]α, β]× ]γ, δ], alors
J
1
f (x, y) dx dy = [sin π(β + α). sin π(β − α)][sin π(δ + γ). sin π(δ − γ)].
K̄ π2
Cette intégrale est donc nulle si l’un des côtés de K a une longueur entière.
D’ailleurs, si P = {I 1 , . . . , I m}, on a, par le calcul ci-dessus, l’additivité de
l’intégrale et l’hypothèse sur les I j ,
J m J
1 $
sin2 πb sin2 πd = f= f = 0,
π2 I¯ ¯j
j=1 I

ce qui entraı̂ne que b ou d est entier.


8. Les coordonnées polaires dans Rn (qui généralisent les coordonnées po-
laires dans R2 et les coordonnées sphériques dans R3 ) sont définies par les
relations
x1 = r cos ϕ1 ,
566 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS

x2 = r sin ϕ1 cos ϕ2 ,
...
xn−1 = r sin ϕ1 sin ϕ2 . . . sin ϕn−2 cos ϕn−1 ,
xn = r sin ϕ1 sin ϕ2 . . . sin ϕn−2 sin ϕn−1 .
Montrer que si g est l’application de E =]0, ∞[ × ]0, π[n−2 × ]0, 2π[ dans Rn
définie par le second membre de ces relations, alors g est un difféomorphisme
de E sur g(E) et

Jg (r, ϕ1, . . . , ϕn−1 ) = r n−1 sinn−2 ϕ1 sinn−3 ϕ2 . . . sin ϕn−2 .

En déduire que si f est une fonction de ]0, ∞[ dans R, alors la fonction


radiale x 2→ f (|x|2 ) est L-intégrable sur Rn si et seulement si la fonction
r 2→ r n−1 f (r) est L-intégrable sur ]0, ∞[, auquel cas l’on a
J J ∞
f (|x|2) dx = ωn f (r)r n−1 dr,
Rn 0

2πn/2
où ωn est une constante positive ne dépendant que de n (en fait, ωn = Γ( n )
).
2

14.7 Petite anthologie


Si la fonction donnée est telle que tous les ensembles e$p soient mesurables
(B), auquel cas on pourra dire que la fonction est sommable (B), la formule
se simplifie et devient
J J &J '
A B
ϕ(x, y) dx dy = ϕ(x, y) dy dx.
0ACB 0 0

C’est la formule classique. On sait que cette formule doit être remplacée par
une formule plus compliquée, analogue à celle que nous avons obtenue, quand
on s’occupe de l’intégration, au sens de Riemann, appliquée dans toute sa
généralité.

Henri Lebesgue, 1902

M. Lebesgue a traité le problème de la réduction des intégrales doubles


dans son mémoire des Annali di Matematica de 1902. Pour faire cette
réduction, M. Lebesgue définit ce qu’il appelle les intégrales supérieure et
14.7. PETITE ANTHOLOGIE 567

inférieure d’une fonction. Quand la fonction est mesurable, les deux inté-
grales coı̈ncident et réciproquement. M. Lebesgue étend, sans nouvelle dé-
monstration, cette formule aux intégrales de fonctions non bornées, pourvu
que celles-ci existent. M. Fubini a montré que l’introduction des intégrales
supérieures et inférieures est inutile et que la réduction peut toujours se faire
à l’aide des intégrales ordinaires. De plus, il a donné la démonstration de la
formule pour le cas où f est sommable dans Γ sans être bornée. Si on laisse
de côté cette dernière démonstration, on peut observer que le théorème de
M. Fubini peut se déduire, sans autre examen, de la formule de M. Lebesgue.
... La formule de M. Lebesgue prend donc la forme définitive
J J J J
f dx dy = dx f dy.

Mais il faut négliger au second membre l’ensemble (de mesure nulle) des
valeurs de x pour lesquelles l’intégrale intérieure n’existerait pas. C’est le
résultat indiqué par M. Fubini. A cause de son importance, nous allons
démontrer à nouveau cette formule de réduction par la voie qui nous paraı̂t
la plus naturelle. Cette démonstration détaillée, où nous ne ferons appel à
aucun théorème étranger, aura peut-être l’avantage de préciser sur certains
points les conditions de validité de la formule.
Charles-Jean de La Vallée Poussin, 1910
L’approximation par des sommes intégrales (qui est analogue à l’approche
usuelle de l’intégrale de Riemann) est utilisée pour obtenir le théorème de
Fubini pour l’intégrale de Perron dans une forme générale; on trouve des
conditions nécessaires et suffisantes pour l’existence de l’intégrale itérée.
Jaroslav Kurzweil, 1973
Parlons d’abord du changement de variables dans les intégrales multi-
ples. La véritable origine de la formule obtenue est dans le fait que le ja-
cobien d’une transformation ponctuelle, pris en valeur absolue, représente
le rapport de deux aires infiniment petites correspondantes, ou, s’il s’agit
d’intégrales triples, de deux volumes infiniment petits correspondants. ... Ce
résultat conduit évidemment à écrire
H H
la formule classique pour le change-
ment de variables sous le signe . Il n’en constitue pas cependant une
démonstration satisfaisante, au moins au premier abord, et l’on a, jusqu’ici,
présenté la démonstration autrement. Deux méthodes sont connues : l’une
consistant à faire successivement un changement de variable sur x seul et un
changement de variable sur y seul; l’autre dans laquelle on obtient l’aire S
568 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS

de l’image d’une portion s du premier plan en la ramenant à une intégrale


étendue à la frontière de s et établissant ainsi la formule S = sj $ , où j $
est compris entre le minimum et le maximum du jacobien j dans l’aire s :
formule qui entraı̂ne, sans nouvelle difficulté, celle du changement de vari-
ables. Ne peut-on obtenir une démonstration rigoureuse de la formule du
changement de variables en partant de ce fait fondamental ?

Jacques Hadamard, 1938

L’idée la plus naı̈ve (pour démontrer le théorème de changement de vari-


ables dans un intégrale multiple) serait de diviser D1 en parallélipipèdes
rectangles “infinitésimaux”, d’observer que l’image par h d’un tel parallé-
lipipède rectangle est un parallélipipède rectangle infinitésimal, de calculer
le volume de ce parallélipipède, de sommer tous les infinitésimaux produits
de cette manière, et ainsi d’arriver à la formule. ... Transformer cette ap-
proche heuristique en une démonstration rigoureuse n’est pas entièrement
trivial. Cela est seulement fait, à ma connaissance, en deux places : le
Cours d’Analyse de Jordan et le Differential-und Integralrechnung unter
besondere Berucksichtigung neuere Ergebnisse de Haupt. Dans chacune de
ces démonstrations, un petit rectangle C est considéré et, par une construc-
tion soignée, deux parallélipipèdes, le premier contenant h(C) et le second
entièrement contenu dans h(C) sont obtenus. De cette manière, on trouve
pour le volume de h(C) des bornes suffisamment exactes pour que la for-
mule puisse s’obtenir par passage à la limite. La principale difficulté de
cette démonstration est l’obtention du parallélipipède intérieur à h(C), car
le parallélipipède extérieur peut s’obtenir sans difficulté.

Jacob T. Schwartz, 1954


Chapitre 15

Analyse vectorielle et
extérieure

15.1 Intégrale sur une courbe

Soit C ⊂ Rn non vide et image d’une application Γ : [a, b] → Rn continue sur


[a, b], injective sur [a, b[ et telle que Γ(a) = Γ(b), ou injective sur [a, b]. En
géométrie différentielle, C s’appelle le support ou la trace d’un arc de courbe
simple (fermée dans le premier cas), et Γ est une représentation paramétrique
de C.
Un exemple extrêmement simple est celui du segment de droite [c, d]
joignant c ∈ Rn à d ∈ Rn , défini par [c, d] = {c + t(d − c) : t ∈ [0, 1]}, et muni
de sa représentation paramétrique canonique

Σ : [0, 1] → Rn , t 2→ c + t(d − c).

Il est alors naturel d’appeler longueur de [c, d] (pour la représentation para-


métrique Σ) le nombre positif L([c, d]) = |d−c|2 = |T ([c, d])|2, où T ([c, d]) =
d − c est le vecteur tangent à [c, d].
Si nous voulons donner un sens à la notion de longueur de C (dans
la représentation paramétrique Γ), il est naturel, comme nous l’avons fait
dans la discussion de la notion d’aire d’une figure plane servant à motiver la
notion d’intégrale, de considérer une partition {I 1 , . . . , I m} de I = ]a, b] en
semi-intervalles consécutifs I j = ]aj−1 , aj ], 1 ≤ j ≤ m, et de considérer les
“valeurs approchées” de la longueur données par les “sommes de Riemann”

569
570 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE

du type
m
$ m
$
|T ([Γ(aj−1 ), Γ(aj )])|2 = |Γ(aj ) − Γ(aj−1 )|2 (15.1)
j=1 j=1

m
$
= L([Γ(aj−1 ), Γ(aj )]),
j=1

où L([Γ(aj−1 ), Γ(aj )]) = |Γ(aj ) − Γ(aj−1 )|2 est la longueur, au sens con-
sidéré plus haut, du segment de droite [Γ(aj−1 ), Γ(aj )]. On est alors amené
à dire que le nombre positif L est la longueur de C (dans la représentation
paramétrique Γ) si toutes les expressions (15.1) peuvent être rendues arbi-
trairement proches de L en prenant des partitions de pas

max (aj − aj−1 )


1≤j≤m

suffisamment petit.
Plus généralement, soit f une fonction de Rn dans Rp définie sur C et Γ
une représentation paramétrique de C. Certains problèmes de mathémati-
que, de science ou de technique, et en particulier celui de la détermination de
la masse d’un fil dont on connaı̂t la densité linéaire, conduisent à considérer
des “sommes de Riemann” du type
m
$
SL (Γ, f, Π) = f (Γ(tj ))|Γ(aj ) − Γ(aj−1 )|2 (15.2)
j=1

m
$ m
$
= f (Γ(tj ))L([Γ(aj−1 ), Γ(aj )]) = f (Γ(tj ))|T ([Γ(aj−1 ), Γ(aj )])|2,
j=1 j=1
A B
où Π = (tj , I j ) 1≤j≤m est une P-partition de I, avec I j = ]aj−1 , aj ]. Le cas
particulier f = 1 correspond évidemment au problème de la longueur analysé
plus haut et celui de la détermination de la masse d’un fil dont on connaı̂t
la densité linéaire correspond à p = 1. La somme de Riemann revient à
approcher l’arc de courbe par une ligne brisée et à supposer que, sur chaque
segment, la densité est constante et égale à sa valeur en un point de la partie
de la courbe approchée par le segment de droite. Il est alors assez naturel
d’obtenir la masse du fil par un processus de passage à la limite sur ces
sommes de Riemann analogue à celui introduit pour le concept d’intégrale.
Cela conduit à la définition suivante.
15.1. INTÉGRALE SUR UNE COURBE 571

Définition. On dit que f est L−intégrable sur l’arc de courbe simple C


de représentation paramétrique Γ s’il existe J ∈ Rp tel que, pour chaque
! > 0, il existe une jauge δ sur I¯ telle que, pour chaque P-partition δ−fine
A j j B
Π = (t , I ) 1≤j≤m de I, on ait |SL (Γ, f, Π) − J|2 ≤ !.
Comme précédemment, on montre facilement l’unicité d’un tel J, on
l’appelle l’intégrale de f sur l’arc de courbe simple C de représentation
paramétrique Γ, et on le note
J J J J
f L(dΓ) ou f dL(Γ) ou f dL ou f |dT |2 ,
C C CΓ CΓ
H
pour rappeler son mode de construction. En particulier, si C dL(Γ) exis-
te, on l’appelle la longueur de l’arc de courbe simple C de représentation
paramétrique Γ, et on la note L(CΓ ).
On peut bien entendu, à partir de cette définition, construire une théorie
de l’intégration sur un arc de courbe analogue à celle que nous avons dévelop-
pée pour l’intégrale ordinaire. Dans ce cours, nous nous contenterons de
montrer qu’en se limitant aux fonctions f bornées sur C et aux arcs de
courbe C dont la représentation paramétrique Γ est de classe C 1 sur [a, b],
l’intégrale que nous venons d’introduire se ramène à une intégrale ordinaire
sur I¯ d’une expression faisant intervenir f, Γ et Γ$ , et à laquelle nous pourrons
donc appliquer tous les résultats obtenus pour l’intégrale d’une fonction sur
un intervalle fermé. La Proposition suivante est à la base de ce résultat.
Pour la motiver, notons que si Γ est dérivable sur ]a, b[, on a, en utilisant le
théorème de Lagrange,
m
; n <1/2
$ $
SL (Γ, f, Π) = f (Γ(t ))
j
[Γi (a ) − Γi (a
j j−1
)] 2

j=1 i=1

m
, n -1/2
$ $
= f (Γ(t )) j
(Γ$i (tji ))2 (aj −a )
j−1 2

j=1 i=1

m
, n -1/2
$ $
= f (Γ(t )) j
(Γ$i (tji ))2 (aj − aj−1 ),
j=1 i=1
j j
oùti ∈ ]a , a [, 1 ≤ j ≤ m, 1 ≤ i ≤ n. Si on remplace ti par tj dans la
j−1 j

dernière expression, elle devient


m
, n -1/2
$ $
f (Γ(t )) j
(Γ$i (tj ))2 (aj − aj−1 )
j=1 i=1
572 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE

m
$
= f (Γ(tj ))|Γ$ (tj )|2 (aj − aj−1 ) = S(I, (f ◦ Γ)|Γ$ |2 , Π),
j=1

où le second membre est une somme de Riemann usuelle. Le problème est
donc de voir sous quelles conditions sur f et sur Γ ce remplacement est licite.
Proposition. Si f est bornée sur C et si Γ est de classe C 1 sur [a, b], alors,
¯ telle que pour toute
pour chaque ! > 0, il existe une jauge constante η sur I,
P-partition η-fine Π de I, on ait

|SL (Γ, f, Π) − S(I, (f ◦ Γ)|Γ$ |2 , Π)|2 ≤ !.

Démonstration.
A
En B
vertu du calcul effectué ci-dessus, on a, pour la P-
partition Π = (tj , I j ) 1≤j≤m de I, avec I j = ]aj−1 , aj ],

SL (Γ, f, Π) − S(I, (f ◦ Γ)|Γ$ |2 , Π)


, -1/2 , -1/2 
m
$  $n n
$ 
= f (Γ(tj )) (Γ$i (tji ))2 − (Γ$i (tj ))2 (aj − aj−1 )
 
j=1 i=1 i=1
m
$
= f (Γ(tj ))[h(tj1 , . . . , tjn ) − h(tj , . . . , tj )](aj − aj−1 ),
j=1

tji
avec ∈ ]aj−1 , aj [, 1 ≤ j ≤ m, 1 ≤ i ≤ n, si l’on définit l’application h de
[a, b] × . . . × [a, b] dans R par
, n -1/2
$
h(t1 , . . . , tn ) = (Γ$i (ti ))2 .
i=1

Puisque Γ est de classe C 1 sur [a, b], h est uniformément continue sur [a, b] ×
. . . × [a, b]. Par conséquent, si M > 0 désigne un majorant de |f (x)|2 sur
C et si ! > 0 est donné, il existe une constante η > 0 telle que pour tout
(t1 , . . . , tn ) ∈ [a, b]×. . .×[a, b] et tout (t$1 , . . . , t$n ) ∈ [a, b]×. . .×[a, b] vérifiant
l’inégalité
|(t1 , . . . , tn ) − (t$1 , . . . , t$n )|∞ ≤ η,
on ait
|h(t1 , . . . , tn ) − h(t$1 , . . . , t$n )| ≤ !/M (b − a).
Si l’on prend cet η comme jauge constante sur [a, b] et si Π est une P-partition
η-fine de I, on aura

tji ∈ ]aj−1 , aj [ ⊂ [tj − η, tj + η], 1 ≤ i ≤ n, 1 ≤ j ≤ m,


15.1. INTÉGRALE SUR UNE COURBE 573

donc,
|(tj1 , . . ., tjn ) − (tj , . . . , tj )|∞ ≤ η,

et dès lors
|SL (Γ, f, Π) − S(I, (f ◦ Γ)|Γ$ |2 , Π)|2
m
$
≤ M (!/M (b − a))(aj − aj−1 ) = !,
j=1

et la démonstration est complète.


L’équivalence annoncée résulte aisément de cette Proposition.

Proposition. Dans les conditions de la Proposition qui précède, les inté-


grales J J
f dL(Γ) et (f ◦ Γ)|Γ$ |2
C I¯

existent simultanément et sont égales.

Démonstration. Nous démontrerons le résultat dans un sens, l’autre


cas étant strictement analogue. Supposons donc f L-intégrable sur C (de
représentation paramétrique Γ) et montrons H
que (f ◦ Γ)|Γ$ |2 est P-intégrable
¯ ¯
sur I et a pour intégrale sur I la quantité C f dL(Γ). Si ! > 0 est donné, on
peut trouver une jauge δ1 sur I¯ telle que, pour toute P-partition δ1 -fine Π
de I, on ait
# J #
# #
#SL (Γ, f, Π) − f dL(Γ)## ≤ !/2,
#
C 2

Si maintenant η est la constante associée par la Proposition précédente à


!/2, si δ est la jauge sur I¯ définie par δ(t) = min(δ1 (t), η), et si Π est une
P-partition δ-fine de I, on aura alors
# J #
# #
#S(I, (f ◦ Γ)|Γ$ |2 , Π) − f dL(Γ)##
#
C 2

# J #
# #
≤ |S(I, (f ◦ Γ)|Γ$ |2 , Π) − SL (Γ, f, Π)|2 + ##SL (Γ, f, Π) − f dL(Γ)##
C 2

≤ !/2 + !/2 = !.
574 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE

Corollaire. Si Γ est de classe C 1 sur [a, b], alors la longueur de l’arc de


courbe simple C de représentation paramétrique Γ est donnée par
J J J , n -1/2
b b $
$
L(CΓ ) = dL(Γ) = |Γ |2 = (Γ$i )2 .
C a a i=1

Soit maintenant Γ̃ : [c, d] → Rn une représentation paramétrique de


classe C 1 équivalente à Γ, c’est-à-dire telle que Γ = Γ̃ ◦ h pour un difféomor-
phisme h : [a, b] → [c, d]. Alors, on a
J b J b J b
L(CΓ ) = |Γ$ |2 = |(Γ̃$ ◦ h)h$ |2 = |Γ̃$ ◦ h|2 |h$ |.
a a a
Comme h est bijective sur [a, b], elle y est monotone et h$ y a un signe
constant. Par le théorème de changement de variable dans une intégrale
simple, on obtient alors
J b J h(b) J d
L(CΓ ) = sign h$ |Γ̃ ◦ h|2 h$ = sign h$ |Γ̃$ |2 = |Γ̃$ |2 = L(CΓ̃ ),
a h(a) c

puisque, si h$ ≥ 0 (resp. ≤ 0) sur [a, b], h est croissante (resp. décroissante)


et h(a) = c, h(b) = d (resp. h(a) = d, h(b) = c). Donc, la longueur de l’arc de
courbe simple ne dépend pas de la représentation paramétrique à l’intérieur
de la classe définie par la relation d’équivalence ci-dessus.
Considérons par exemple la représentation paramétrique usuelle du cercle
C(r) de centre 0 et de rayon r > 0, à savoir
Γr : [0, 2π] → R2 , t 2→ (r cos t, r sin t).
On trouve la formule familière
J 2π J 2π
L(CΓr )) = (r 2 sin2 t + r 2 cos2 t)1/2 dt = r dt = 2πr.
0 0
Dans le cas particulier d’un arc de courbe simple dont la trace dans R2
est le graphe F = {(x, f (x)) : x ∈ [a, b]} d’une fonction f de R dans R
de classe C 1 sur [a, b], on a évidemment la représentation paramétrique de
classe C 1 correspondante
Φ : [a, b] → R2 , x 2→ (x, f (x)),
et, puisque
Φ$ (x) = (1, f $ (x)), x ∈ [a, b],
on obtient immédiatement la formule
J b
L(FΦ ) = [1 + (f $ )2 ]1/2.
a
15.2. INTÉGRALE SUR UNE SURFACE 575

15.2 Intégrale sur une surface


Soit S une partie non vide de R3 qui est l’image d’une application

Σ : K = [a1 , b1] × [a2 , b2] ⊂ R2 → R3

continue sur K et injective sur int K. En géométrie différentielle, S est ap-


pelé le support ou la trace d’un arc ou d’un élément de surface simple, et Σ
s’appelle une représentation paramétrique de S. Un exemple extrêmement
simple est celui du parallélogramme [c, d, e] construit sur les points non
colinéaires c, d, e (dans l’ordre) de R3 ,

[c, d, e] = {c + u1 (d − c) + u2 (e − c) : (u1 , u2 ) = u ∈ K = [0, 1] × [0, 1]},

et muni de sa représentation paramétrique canonique

Π : K → R3 , u 2→ c + u1 (d − c) + u2 (e − c).

En accord avec la géométrie élémentaire, il est naturel d’appeler aire de


[c, d, e] (pour la représentation paramétrique Π) le nombre positif

A([c, d, e]) = |(d − c) ∧ (e − c)|2 = |N ([c, d, e])|2,

où N ([c, d, e]) = (d − c) ∧ (e − c) désigne le produit vectoriel de d − c par


e − c, c’est-à-dire l’élément de R3 (normal à P ) défini par

(d − c) ∧ (e − c) = ((d2 − c2 )(e3 − c3 ) − (e2 − c2 )(d3 − c3 ),

(d3 − c3 )(e1 − c1 ) − (e3 − c3 )(d1 − c1 ), (d1 − c1 )(e2 − c2 ) − (e1 − c1 )(d2 − c2 ))


& & ' & '
d2 − c2 d3 − c3 d3 − c3 d1 − c1
= det , det ,
e2 − c2 e3 − c3 e3 − c3 e1 − c1
& ''
d1 − c1 d2 − c2
det .
e1 − c1 e2 − c2
Pour donner un sens à la notion d’aire de S (pour la représentation para-
métrique Σ), il est naturel de considérer une partition {I 1 , . . . , I m} de I =
]a1 , b1 ]× ]a2 , b2 ] en semi-pavés I j = ]aj1 , bj1 ]× ]aj2 , bj2 ], 1 ≤ j ≤ m, et de con-
sidérer les “valeurs approchées” de l’aire données par les “sommes de Rie-
mann”
m
$ m
$ m
$
A([cj , dj , ej ]) = |(dj − cj ) ∧ (ej − cj )|2 = |N ([cj , dj , ej ])|2 (15.3)
j=1 j=1 j=1
576 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE

où cj = Σ(aj1 , aj2 ), dj = Σ(bj1 , aj2 ), ej = Σ(aj1 , bj2 ), où l’on a assimilé l’élément
de surface correspondant à la restriction de Σ à I j au parallélogramme
[cj , dj , ej ] et où l’on a sommé les aires correspondantes. On est alors amené
à dire que le réel positif A est l’aire de S (pour la représentation paramétri-
que Σ) si les expressions (15.3) deviennent arbitrairement proches de A en
prenant des partitions de I suffisamment fines.
Plus généralement, et pour pouvoir donner un sens par exemple à la
notion de masse d’une plaque dont on connaı̂t la densité superficielle, on est
conduit, si f est une fonction de R3 dans Rp définie sur l’élément de surface
S de représentation paramétrique Σ, à considérer des “sommes de Riemann”
du type
m
$
SA (Σ, f, Π) = f (Σ(uj ))A([cj , dj , ej ])
j=1

m
$
= f (Σ(uj ))|N ([cj , dj , ej ])|2 , (15.4)
j=1
A B
relatives à la P-partition Π = (uj , I j ) 1≤j≤m de I, où, de nouveau, on a
posé c =
j
Σ(aj1 , aj2 ), dj
= Σ(bj1, aj2 ), ej = Σ(aj1 , bj2 ), 1 ≤ j ≤ m. On arrive
ainsi à la définition suivante.
Définition. On dit que f est A-intégrable sur l’élément de surface S de
représentation paramétrique Σ s’il existe J ∈ Rp tel que pour tout ! > 0,
il existe une jauge δ sur I¯ telle que, pour toute P-partition δ-fine Π =
A j j B
(u , I ) 1≤j≤m de I, on ait

|SA (Σ, f, Π) − J|2 ≤ !.

On montre comme précédemment, qu’il existe au plus un tel J, on


l’appelle l’intégrale de f sur l’élément de surface simple S de représentation
paramétrique Σ, et on le note
J J J J
f A(dΣ)) ou f dA(Σ) ou f dA ou f |dN |2,
S S SΣ SΣ
H
pour rappeler son mode de construction. En particulier, si S dA(Σ) existe,
on l’appelle l’aire de l’élément de surface S de représentation paramétrique
Σ et on la note A(SΣ ).
On peut de nouveau, à partir de cette définition, construire une théorie
de l’intégrale sur un élément de surface analogue à celle développée pour
15.2. INTÉGRALE SUR UNE SURFACE 577

l’intégrale sur un pavé fermé. Comme dans le cas de l’intégrale sur un


arc de courbe, nous nous contenterons ici de montrer qu’en se limitant aux
fonctions bornées et aux éléments de surface de classe C 1 , l’intégrale que
nous venons d’introduire se ramène à l’intégrale ordinaire sur I¯ = K d’une
expression faisant intervenir la fonction, la représentation paramétrique et
ses dérivées partielles. On pourra donc appliquer à cette dernière intégrale
tous les résultats précédemment obtenus. Pour motiver la forme de cette
¯ on obtient,
expression, notons que, si Σ possède des dérivées partielles sur I,
en utilisant le théorème de Lagrange,

A([cj , dj , ej ]) =
#8 9
# j,1 j j j j,2 j j j j,3 j j j
# D1 Σ1 (u1 , a2 )(b1 − a1 ), D1Σ2 (u1 , a2 )(b1 − a1 ), D1Σ3 (u1 , a2 )(b1 − a1 ) ∧
8 9#
#
D2 Σ1 (aj1 , uj,1 j j j j,2 j j j j,3 j j
2 )(b2 − a2 ), D2 Σ2 (a1 , u2 )(b2 − a2 ), D2 Σ3 (a1 , u2 )(b2 − a2 ) # 2
# & '
# D1 Σ2 (uj,2 j
D1 Σ3 (uj,3 j
#
= #det 1 , a2) 1 , a2 ) ,
# D2 Σ2 (aj1 , uj,2
2 ) D2 Σ3 (aj1 , uj,3
2 )
& '
D1 Σ3 (uj,3 j j,1 j
1 , a2 ) D1 Σ1 (u1 , a2 )
det ,
D2 Σ3 (a1 , u2 ) D2 Σ1 (a1 , uj,1
j j,3 j
2 )
& '#
D1 Σ1 (uj,1 j j,2 j #
det 1 , a2 ) D1 Σ2 (u1 , a2 ) #
# µ(I j ),
D2 Σ1 (aj1 , uj,1 j j,2
2 ) D2 Σ2 (a1 , u2 )
#
2

où les uj,k


l appartiennent à ]ajl , bjl [ , (1 ≤ j ≤ m, 1 ≤ k ≤ 3, 1 ≤ l ≤ 2).
Si, dans cette expression, on remplace les arguments des Dl Σk par uj
(1 ≤ j ≤ m, 1 ≤ k ≤ 3, 1 ≤ l ≤ 2), on trouve, au lieu de A([cj , dj , ej ]),
l’expression
|D1 Σ(uj ) ∧ D2 Σ(uj )|2 µ(Ij )

= |(JΣ2 ,Σ3 (uj ), JΣ3 ,Σ1 (uj ), JΣ1 ,Σ2 (uj ))|2 µ(Ij ),
où JΣi ,Σj désigne comme d’habitude le jacobien de l’application

u 2→ (Σi(u), Σj (u)), 1 ≤ i, j ≤ 3.

On notera que la direction de l’élément NΣ (u) défini par

NΣ (u) = D1 Σ(u) ∧ D2 Σ(u)


578 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE

est orthogonale à celle des éléments D1 Σ(u) et D2 Σ(u) parallèles au plan


tangent à la surface S en Σ(u), et est donc normale à S en Σ(u). Les sommes
de Riemann après ce remplacement deviennent les expressions
m
$
f (Σ(uj ))|NΣ (uj )|2 µ(I j ), (15.5)
j=1

c’est-à-dire les sommes de Riemann usuelles pour l’intégration sur I¯ de la


fonction (f ◦ Σ)|NΣ |2 . Le problème consiste de nouveau à voir sous quelles
conditions on peut remplacer, sans changer les conclusions, les sommes de
Riemann SA (Σ, f, Π) par les sommes de Riemann usuelles

S(I, (f ◦ Σ)|NΣ |2 , Π).

Dans cette direction, on a le résultat suivant, qui se démontre d’une manière


strictement analogue au résultat correspondant pour l’intégration sur un arc
de courbe, et dont les détails de la démonstration seront laissés au lecteur.
Proposition. Si f est bornée sur S et si Σ est de classe C 1 sur K, alors
J
f dA(Σ)
S

et J J
(f ◦ Σ)|NΣ |2 = (f ◦ Σ)[JΣ2 2 ,Σ3 + JΣ2 3 ,Σ1 + JΣ2 1 ,Σ2 ]1/2
K K
existent simultanément et sont égales.

Corollaire. Si Σ est de classe C 1 sur K, alors l’aire de l’élément de surface


simple S de représentation paramétrique Σ est donnée par
J J
A(SΣ ) = |NΣ |2 = [JΣ2 2 ,Σ3 + JΣ2 3 ,Σ1 + JΣ2 1 ,Σ2 ]1/2.
K K

En utilisant le théorème de changement de variables dans une intégrale


multiple, on peut montrer, comme dans le cas d’un arc de courbe, que
l’aire d’un élément de surface simple ne dépend pas de la représentation
paramétrique à l’intérieur de la classe d’équivalence des représentations para-
métriques au sens de la géométrie différentielle.
Si nous considérons, à titre d’exemple, la représentation paramétrique
usuelle de la sphère S(r) de centre 0 et de rayon r > 0, c’est-à-dire l’appli-
cation
Σr : [0, π] × [0, 2π] → R3 ,
15.3. CIRCULATION D’UN CHAMP VECTORIEL 579

(u1 , u2 ) 2→ (r sin u1 cos u2 , r sin u1 sin u2 , r cos u1 ),


nous obtenons aisément, en utilisant le théorème de Fubini, le résultat fa-
milier J 2π J π
A(SΣr ) = (r 4 sin4 u1 cos2 u2 + r 4 sin4 u1 sin2 u2
0 0

+r sin2 u1 cos2 u2 )1/2 du1 du2


4

J 2π J π J 2π
= r2 sin u1 du1 du2 = 2r 2 du2 = 4πr 2 .
0 0 0
Dans le cas particulier d’un élément de surface simple dont la trace dans
R3 est le graphe F = {(x1 , x2, f (x1 , x2 )) : (x1 , x2 ) ∈ K} d’une fonction f de
R2 dans R de classe C 1 sur le pavé fermé K, on considère la représentation
paramétrique naturellement associée

Σ : K → R3 , (x1 , x2 ) 2→ (x1 , x2 , f (x1 , x2 )).

Comme
JΣ2 ,Σ3 = −D1 f, JΣ3 ,Σ1 = −D2 f, JΣ1 ,Σ2 = 1,
on trouve immédiatement la formule importante
J
A(F ) = [1 + (D1 f )2 + (D2 f )2 ]1/2.
K

15.3 Circulation d’un champ vectoriel


Si n ≥ 2 est un entier, convenons d’appeler champ vectoriel dans Rn toute
fonction de Rn dans Rn , et rappelons la notation (x|y) du produit scalaire
%n
i=1 xi yi des éléments x et y de R .
n

Si [c, d] est le segment de droite joignant c ∈ Rn et d ∈ Rn introduit


précédemment, et si f est un champ vectoriel constant sur [c, d], dont nous
désignerons également par f la valeur constante, différentes questions de
physique conduisent à considérer l’expression
n
$
(f |d − c) = (f |T ([c, d])) = fi (di − ci ).
i=1

Ainsi, lorsque n = 3 et que f représente une force constante, (f |d − c)


fournit le travail de cette force le long du segment orienté [c, d]. L’extension
nécessaire de ces notions au cas où f n’est plus nécessairement constant
et où [c, d] est remplacé par un arc de courbe simple C de représentation
580 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE

paramétrique Γ : [a, b] ⊂ R → Rn conduit à la considération de “sommes de


Riemann” du type
m
$
SC (Γ, f, Π) = (f (Γ(tj ))|Γ(aj ) − Γ(aj−1 ))
j=1

m
$
= (f (Γ(tj ))|T ([Γ(aj−1 ), Γ(aj )])),
j=1
A B
si Π = (tj , ]aj−1 , aj ])
1≤j≤m est une P-partition de I =]a, b]. De telles
sommes apparaissent lorsqu’on remplace la restriction de Γ à [aj−1 , aj ] par
le segment de droite [Γ(aj−1 ), Γ(aj )] et que l’on suppose que, sur ce segment,
le champ vectoriel garde la valeur constante f (Γ(tj )).
On est ainsi conduit à la définition suivante.
Définition. On dit que J ∈ R est la circulation du champ vectoriel f le
long de l’arc de courbe C de représentation paramétrique Γ si pour chaque
! > 0 il existe une jauge δ sur I¯ telle que pour toute P-partition δ-fine Π de
I, on a
|SC (Γ, f, Π) − J| ≤ !.
On montre comme d’habitude l’unicité d’un tel J, ce qui justifie la ter-
minologie, et on le désigne par
J J J
(f |T (dΓ)) ou (f |dT (Γ)) ou (f |dT )
C C CΓ

pour rappeler son mode de construction. Comme pour les autres extensions
de l’intégrale introduites précédemment, on peut déduire de cette définition
un certain nombre de propriétés. Nous nous contenterons de montrer que si
f est borné sur C et si Γ est de classe C 1 , la circulation de f le long de Γ se
ramène à l’intégrale usuelle sur [a, b] d’une fonction de R dans R construite
à partir de f, Γ et Γ$ . Pour déterminer heuristiquement la forme de cette
fonction, il suffit encore, lorsque Γ est dérivable, d’appliquer le théorème de
Lagrange aux composantes Γi dans l’expression de la somme de Riemann.
On trouve ainsi
, n -
m $
$ 8 9
SC (Γ, f, Π) = fi (Γ(t )) Γi (a ) − Γi (a
j j j−1
)
j=1 i=1
, n
m $
-
$
= fi (Γ(t j
))Γ$i (tji )(aj −a j−1
) ,
j=1 i=1
15.3. CIRCULATION D’UN CHAMP VECTORIEL 581

pour des tji ∈]aj−1 , aj [, 1 ≤ i ≤ n, 1 ≤ j ≤ m. Si, dans la dernière expression,


j
on remplace les ti par tj , 1 ≤ i ≤ n, 1 ≤ j ≤ m, on obtient
, n
m $
-
$
fi (Γ(t j
))Γ$i (tj )(aj −a j−1
)
j=1 i=1

m
$
= (f (Γ(tj ))|Γ$ (tj ))(aj − aj−1 ) = S(I, (f ◦ Γ|Γ$ ), Π),
j=1

c’est-à-dire la somme de Riemann usuelle pour la fonction (f ◦ Γ|Γ$ ) et la P-


partition Π de I = ]a, b]. D’une manière strictement analogue à celle utilisée
dans le cas de l’intégration sur un arc de courbe, on peut démontrer la condi-
tion suffisante suivante pour que SC (Γ, f, Π) et S(I, (f ◦ Γ|Γ$ ), Π) fournissent
la même intégrale.
Proposition. Si f est bornée sur C et si Γ est de classe C 1 sur [a, b], alors
J
(f |dT (Φ))
C

et J J
b n
b$
$
(f ◦ Γ|Γ ) = (fi ◦ Γ)Γ$i
a a i=1

existent simultanément et sont égales.


Si Γ̃ : [c, d] → Rn est une représentation paramétrique de C équivalente à
Γ, c’est-à-dire si Γ = Γ̃ ◦ h pour un certain difféomorphisme h : [a, b] → [c, d],
le théorème du changement de variable dans une intégrale entraı̂ne que
J J b J b
$
(f |dT (Γ)) = (f ◦ Γ|Γ ) = (f ◦ Γ̃ ◦ h|Γ̃$ ◦ h)h$
C a a
J d J
=± (f ◦ Γ̃|Γ̃$ ) = ± (f |dT (Γ̃)),
c C
avec le signe + ou le signe − selon que h est croissante ou décroissante. Donc,
dans
H
la classe des représentations paramétriques considérées, seul le signe de
C (f |dT (Φ)) dépend du choix de la représentation. On dit en géométrie
différentielle que Γ et Γ̃, liés par la relation ci-dessus, correspondent à une
même orientation de C si h$ est positive sur [a, b] et correspondent à des
orientations opposées si h$ est négative sur [a, b]. Dans le cas du segment de
droite, on vérifie aisément que les orientations différentes correspondent aux
deux sens de parcours possibles sur le segment.
582 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE

Si nous supposons maintenant que Γ, bijective et de classe C 1 , est en


outre telle que, pour tout t ∈ [a, b], on ait |Γ$ (t)|2 /= 0, nous pouvons définir
la tangente unitaire à C dans la représentation paramétrique Γ par
Γ$ ◦ Γ−1
τΓ = ,
|Γ$ ◦ Γ−1 |2
ce qui implique immédiatement que

Γ$ = (τΓ ◦ Γ)|Γ$ |2 .

Dès lors, par les propriétés de l’intégrale sur un arc de courbe, on obtient
J J b
(f |dT (Γ)) = (f ◦ Γ|Γ$ )
C a
J b J
= (f ◦ Γ|τΓ ◦ Γ)|Γ$ |2 = (f |τΓ )dL(Γ),
a C
ce qui montre que, dans ces conditions, la circulation de f le long de l’arc
de courbe C de représentation paramétrique Γ est égale à l’intégrale sur C
de la fonction (f |τΓ ).

15.4 Flux d’un champ vectoriel


Soit maintenant S un élément de surface dans R3 de représentation para-
métrique Σ et soit f un champ vectoriel dans R3 . Si [c, d, e] représente
de nouveau le parallélogramme construit sur les points c, d, e de R3 avec
sa représentation paramétrique canonique, et si f est un champ vectoriel
constant sur [c, d, e], différentes questions de mécanique ou de physique con-
duisent à considérer l’expression

(f |(d − c) ∧ (e − c)) = (f |N ([c, d, e])),

qui représente le flux de f à travers l’élément de surface [c, d, e] dans le sens


de la normale N ([c, d, e]). La terminologie provient de l’hydrodynamique
lorsque f représente le champ des vitesses d’un fluide en mouvement. Pour
étendre cette notion au cas où f n’est plus nécessairement constant et où S
est un élément de surface de représentation paramétrique Σ, on est conduit
à des “sommes de Riemann” du type
m
$
SF (Σ, f, Π) = (f (Σ(uj ))|N ([cj , dj , ej ]))
j=1
15.4. FLUX D’UN CHAMP VECTORIEL 583

m 8
$ 9
= f (Σ(uj ))|(Σ(dj ) − Σ(cj )) ∧ (Σ(ej ) − Σ(cj )) ,
j=1

où les notations sont celles utilisées pour les intégrales de surface. De telles
sommes correspondent à l’approximation qui consiste à remplacer la restric-
tion de Σ à I j par le parallélogramme [cj , dj , ej ] et de supposer que le champ
f y a la valeur constante f (Σ(uj )). On est ainsi conduit à la définition
suivante.
Définition. On dit que J ∈ R est le flux du champ vectoriel f : S → R3
à travers l’élément de surface S de représentation paramétrique Σ si pour
chaque ! > 0, il existe une jauge δ sur I¯ telle que, pour toute P-partition
δ-fine Π de I, on a
|SF (Σ, f, Π) − J|2 ≤ !.
On montre comme d’habitude qu’il existe au plus un tel J et on le note
J J J
(f |N (dΣ)) ou (f |dN (Σ)) ou (f |dN ),
S S SΣ

pour rappeler son mode de construction.


De nouveau, plutôt que de reconstruire une théorie de l’intégration basée
sur la définition ci-dessus, nous nous contenterons de montrer que, sous
certaines hypothèses supplémentaires relatives à f et Σ, cette intégrale se
ramène à une intégrale habituelle sur I.¯ Pour motiver la forme de cette
intégrale, il suffit encore de supposer Σ dérivable et d’appliquer le théorème
de Lagrange à chaque composante Σi . On obtient ainsi
m
, & '
$ D1 Σ2 (uj,2 j j,3 j
1 , a2 ) D1 Σ3 (u1 , a2 )
SF (Σ, f, Π) = f1 (Σ(u )) det
j

j=1
D2 Σ2 (aj1 , uj,2 j j,3
2 ) D2 Σ3 (a1 , u2 )
& '
D1 Σ3 (uj,3 j j,1 j
1 , a2 ) D1 Σ1 (u1 , a2 )
+f2 (Σ(u )) detj
D2 Σ3 (aj1 , uj,3 j j,1
2 ) D2 Σ1 (a1 , u2 )
& '-
j,1 j j,2 j
D1 Σ1 (u1 , a2 ) D1 Σ2 (u1 , a2 )
+ f3 (Σ(u )) det
j
j j,1 j j,2 µ(I j ),
D2 Σ1 (a1 , u2 ) D2 Σ2 (a1 , u2 )
où les uj,k
l appartiennent à ]ajl , bjl [, (1 ≤ j ≤ m; 1 ≤ k ≤ 3; 1 ≤ l ≤ 2).
Si, dans cette expression, on remplace les arguments des Dl Σk par uj , on
obtient la somme de Riemann usuelle
m
$
[f1 (Σ(uj ))JΣ2 ,Σ3 (uj ) + f2 (Σ(uj ))JΣ3 ,Σ1 (uj )
j=1
584 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE

+f3 (Σ(uj ))JΣ1 ,Σ2 (uj )]µ(I j ) = S(I, (f ◦ Σ|NΣ ), Π),


où l’application “normale” NΣ a été introduite précédemment. D’une maniè-
re similaire à celle utilisée dans l’intégration sur un arc de surface, on
démontre la condition suffisante suivante pour que les sommes de Riemann
SF (Σ, f, Π) et S(I, (f ◦ Σ|NΣ ), Π) conduisent à la même intégrale.
¯
Proposition. Si fH est bornée sur S et si Σ est de classe C 1 sur K = I,
alors les intégrales S (f |dN (Σ)) et
J J
(f ◦ Σ|NΣ ) = [(f1 ◦ Σ)JΣ2 ,Σ3 + (f2 ◦ Σ)JΣ3 ,Σ1 + (f3 ◦ Σ)JΣ1 ,Σ2 ]
K K

existent simultanément et sont égales.


En utilisant encore le théorème de changement de variables dans une
intégrale on peut encore montrer, comme dans le cas de la circulation, que
si Σ̃ est une représentation paramétrique de S régulièrement C 1 -équivalente
à Σ, c’est-à-dire si Σ = Σ̃ ◦ h pour un difféomorphisme h de K sur K̃, on
trouve que J J
(f |dN (Σ̃)) = sign Jh (f |dN (Σ)).
S S
Dans le langage de la géométrie différentielle, on voit donc que les intégrales
sont donc égales ou opposées selon que les représentations ont même orien-
tation ou des orientations opposées.
Si l’on suppose maintenant que Σ est injective sur K et que |NΣ (u)|2 /= 0
pour tout u ∈ K, on peut définir l’application normale unitaire à S dans la
représentation Σ par
NΣ ◦ Σ−1
νΣ = ,
|NΣ ◦ Σ−1 |2
ce qui entraı̂ne
NΣ = (νΣ ◦ Σ)|NΣ |2 ,
et, dès lors, J J
(f |dN (Σ)) = (f ◦ Σ|NΣ )
S K
J J
= (f ◦ Σ|νΣ ◦ Σ)|NΣ |2 = (f |νΣ )dA(Σ).
K S
Donc, dans les conditions mentionnées ci-dessus, le flux du champ vectoriel
f à travers l’élément de surface S de représentation paramétrique Σ est égal
à l’intégrale sur S de la fonction (f |νΣ ).
15.4. FLUX D’UN CHAMP VECTORIEL 585

En conclusion, les intégrales de circulation et de flux conduisent à des


intégrales ordinaires d’expressions du type

(f1 ◦ Γ)Γ$1 + . . . + (fn ◦ Γ)Γ$n ,

sur un intervalle fermé de R, et du type

(f1 ◦ Σ)JΣ2 ,Σ3 + (f2 ◦ Σ)JΣ3 ,Σ1 + (f3 ◦ Σ)JΣ1 ,Σ2

sur un pavé fermé de R2 . D’autre part, le théorème du changement de vari-


ables dans les intégrales a conduit à la considération d’intégrales du type
(f ◦ Ψ)JΨ où Ψ applique Rn en lui-même. Si l’on remarque que, dans la
première expression, on a évidemment Γ$i = JΓi , (1 ≤ i ≤ n), on voit que
toutes ces expressions possèdent une structure semblable et sont des cas
particuliers d’expressions de la forme
n
$ n
$
... (fi1 ,...,ik ◦ Φ)JΦi1 ,...,ik ,
i1 =1 ik =1

où k est un entier compris entre 1 et n, les fi1 ,...,ik sont des fonctions de Rn
dans R, Φ : K ⊂ Rk → Rn est une application de classe C 1 sur le pavé
fermé K et JΦi1 ,...,ik : K → R, u 2→ det[(Φi1 , . . . , Φik )$u ] est le jacobien de
l’application (Φi1 , . . . , Φik ) de K dans Rk . Le premier exemple correspond à
k = 1 et n quelconque, le deuxième à k = 2 et n = 3 et le troisième à k = n.
Des expressions du type général se présentent lorsqu’on cherche à étendre
les notions des deux dernières sections du cas particulier des courbes et des
surfaces dans R2 ou R3 au cas général des “variétés de dimension k dans
Rn ”. Elles possèdent par ailleurs des propriétés algébriques et différentielles
remarquables qui unifient les opérateurs différentiels de l’analyse vectorielle
et fournissent le langage naturel pour la généralisation aux intégrales mul-
tiples du théorème fondamental du calcul différentiel et intégral. Cette
généralisation s’appelle le théorème de Stokes-Cartan et fournit en outre un
traitement unifié et rigoureux des résultats d’analyse vectorielle, rencontrés
en physique et en mécanique, sur la réduction d’intégrales de volume à des
intégrales de surface, et d’intégrales de surface à des intégrales curvilignes.
C’est à ces questions et à des applications à l’analyse complexe que nous
consacrerons les sections et le chapitre suivants. Sans perte de généralité, on
pourra toujours supposer, en faisant si nécessaire une reparamétrisation, que
K est le produit cartésien d’intervalles unitaires [0, 1]. Pour des raisons de
simplicité, on se limitera au cas où les fonctions fi1 ,...,ik sont au moins con-
tinues sur K, ce qui suffit pour bon nombre d’applications. Enfin, l’élément
586 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE

primordial dans une théorie analytique étant la représentation paramétrique


plutôt que l’être géométrique, on abandonnera les hypothèses d’injectivité
faites sur Φ.

15.5 Algèbre des formes extérieures


Soient n ≥ 1 et k ≥ 1 des entiers.
Définition. Si J = (j1 , j2 , . . . , jk ) est un k-uple d’entiers (1 ≤ ji ≤ n), la
k-forme (extérieure ou alternée ou antisymétrique) élémentaire pJ sur Rn
est l’application de Rn × . . . × Rn = Rnk dans R définie par
# #  
# h1 h1j2 . . . h1jk # (h1 )J
# j1 #
# h2 #  
# j1 h2j2 . . . h2jk #  (h2 )J 
pJ (h1 , h2 , . . ., hk ) = ## . .. .. .. # = det 
#  .. ,

# .. . . . #  . 
# k #
# hj
1
hkj2 . . . hkjk # (hk )J

où, si hi = (hi1 , hi2 , . . . , hin ), on pose (hi )J = (hij1 , hij2 , . . ., hijk ).


Si k = 1, les 1-formes élémentaires pj sont simplement les applications
projection sur la j e composante pj : Rn → R, h 2→ hj (1 ≤ j ≤ n). Si n = 4 et
k = 2, les 2-formes élémentaires sur R4 sont les applications pi,j de R4 × R4
dans R définies par

p1,1 (h1 , h2 ) = h11 h21 − h21 h11 , p1,2 (h1 , h2 ) = h11 h22 − h21 h12 ,

p1,3 (h1 , h2 ) = h11 h23 − h21 h13 , p1,4 (h1 , h2 ) = h11 h24 − h21 h14 ,
p2,1 (h1 , h2 ) = h12 h21 − h11 h22 , p2,2 (h1 , h2 ) = h12 h22 − h22 h12 ,
p2,3 (h1 , h2 ) = h12 h23 − h22 h13 , p2,4 (h1 , h2 ) = h12 h24 − h22 h14 ,
et ainsi de suite pour p3,1 , p3,2 , p3,3, p3,4 , p4,1, p4,2, p4,3 et p4,4 .
Par les propriétés des déterminants, on a

pj1 ,...,ji ,...,jl ,...,jk = −pj1 ,...,jl ,...,ji ,...,jk ,

et dès lors,
pj1 ,...,ji ,...,jl ,...,jk = 0
s’il existe i =
/ l tel que ji = jl . En particulier, si k > n, un tel couple existe
toujours et donc pJ = 0 quel que soit J.
15.5. ALGÈBRE DES FORMES EXTÉRIEURES 587

Posons

B(n, k) = {J = (j1 , . . . , jk ) : 1 ≤ j1 ≤ n, . . . , 1 ≤ jk ≤ n},

A(n, k) = {J = (j1 , . . . , jk ) ∈ B(n, k) : jr /= js si r /= s, 1 ≤ r, s ≤ k},


C(n, k) = {J = (j1 , . . . , jk ) ∈ B(n, k) : j1 < j2 < . . . < jk },
de telle sorte que B(n, k) ⊃ A(n, k) ⊃ C(n, k), et que B(n, k), A(n, k) et
C(n, k) contiennent respectivement nk , (n−k)!n!
et k!(n−k)!
n!
éléments. Il résulte
de la discussion précédente que pJ /= 0 si et seulement si J ∈ A(n, k) et que si
J ∈ A(n, k), il existe un élément unique I ∈ C(n, k) et une permutation π(I)
de I telle que J = π(I), et donc, en vertu des propriétés des déterminants,
telle que
pJ = pπ(I) = (sign π(I))pI,
où sign π(I) = 1 si π(I) s’obtient par un nombre pair de permutations de
deux éléments seulement et sign π(I) = −1 si π(I) s’obtient par un nombre
impair de telles opérations.
Dès lors, toutes les k-formes élémentaires non nulles pJ s’expriment
en fonction des k-formes pI , I ∈ C(n, k), qui sont appelées les k-formes
(extérieures, alternées ou antisymétriques) fondamentales et sont en nombre
k!(n−k)! . Ainsi, pour k = 1, les n 1-formes élémentaires pi (1 ≤ i ≤ n) sont
n!

fondamentales, pour k = n−1, il y a également n (n-1)-formes fondamentales

p2,3,...,n , p1,3,...,n , . . . , p1,2,...,n−1 ,

et pour k = n, il y a une seule n-forme fondamentale p1,2,...,n . Les 2-formes


fondamentales dans R3 sont p1,2 , p1,3, p2,3 , et les 2-formes fondamentales
dans R4 sont p1,2 , p1,3, p1,4, p2,3 , p2,4, p3,4 .
Définition. Une k-forme extérieure (ou alternée ou antisymétrique) réelle
(resp. complexe) sur Rn est une application u de Rn × . . . × Rn = Rnk dans
R (resp. C) de la forme $
u= uJ pJ ,
J∈B(n,k)

où les uJ ∈ R (resp. C).


Les 1-formes extérieures réelles (resp. complexes) sont donc les formes
linéaires réelles (resp. complexes) sur Rn , c’est-à-dire les éléments de

L(Rn , R) (resp. L(Rn , C)).


588 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE

L’application 5p1,2 + 12 p2,1 + 8p4,3 est une 2-forme extérieure réelle sur Rn .
[
Si K = R ou C, l’ensemble k (Rn , K) des k-formes extérieures à valeurs
dans K est donc l’espace vectoriel sur K engendré par les k-formes élémentai-
res pI. C’est évidemment un sous-espace vectoriel de l’ensemble Lk (Rn , K)
des applications k-linéaires de Rn dans K.
Il est utile également de donner un sens à la notion de 0-forme extérieure.
Toute application u : {0} → K est caractérisée par son unique valeur u =
u(0), et l’on peut ainsi associer une 0-forme à chaque élément de K.
% [
Si u = J∈B(n,k) uJ pJ ∈ k (Rn , K), alors, on a
 
$ $  $ 
u= uJ pJ =  uπ(I) pπ(I)
J∈A(n,k) I∈C(n,k) permutations π(I) de I
 
$  $  $
=  uπ(I) sign π(I) pI = ũI pI,
I∈C(n,k) permutations π(I) de I I∈C(n,k)

si l’on pose
$
ũI = uπ(I) sign π(I).
permutations π(I) de I
[k
On voit donc que tout u ∈ (Rn , K) peut s’exprimer comme combinai-
son linéaire à coefficients dans K des k-formes fondamentales. Que cette
expression soit unique résulte du lemme suivant.
%
Lemme. I∈C(n,k) uI pI = 0 si et seulement si uI = 0, (I ∈ C(n, k)).
Démonstration. La condition suffisante est évidente. Pour la condition
nécessaire, si I = (i1 , . . . , ik ) ∈ C(n, k), de telle sorte que 1 ≤ i1 < i2 < . . . <
ik ≤ n, alors, en prenant h = (h1 , . . . , hk ) ∈ Rnk défini par

il = δl,m (symbole de Kronecker) , 1 ≤ m ≤ k, 1 ≤ l ≤ k,


hm

i = 0, i ∈ {1, 2, . . ., n} \ {i1 , . . ., ik },
hm

on trouve
$
0= uJ pJ (h1 , . . . , hk ) = uI ,
J∈C(n,k)

et la démonstration est complète.


15.5. ALGÈBRE DES FORMES EXTÉRIEURES 589

[k
Dès lors, si u ∈ (Rn , K) et si
$ $
u= uIpI = u$I pI ,
I∈C(n,k) I∈C(n,k)

on en déduit
$
(uI − u$I)pI = 0,
I∈C(n,k)

et donc, par le Lemme, uI = u$I , (I ∈ C(n, k)).


En résumé, toute k-forme extérieure u sur Rn s’exprime d’une manière
unique comme combinaison linéaire des k-formes fondamentales pI
$
u= uI pI,
I∈C(n,k)

et cette expression s’appelle l’écriture canonique de u. Il en résulte que


[k
(Rn , K) est un espace vectoriel sur K de dimension k!(n−k)!
n!
, et que si
% %
u = I∈C(n,k) uI pI , v = I∈C(n,k) vI pI sont deux k-formes extérieures en
% %
écriture canonique, et si c ∈ K, alors I∈C(n,k) (uI +vI )pI et I∈C(n,k) cuIpI
sont les écritures canoniques de u + v et de cu respectivement.
Soient n ≥ 1, k ≥ 1 et l ≥ 1 des entiers. Nous allons d’abord définir le
produit extérieur d’une k-forme fondamentale pI et d’une l-forme fondamen-
tale pJ .

Définition. Le produit extérieur pI ∧ pJ de pI = pi1 ,...,ik par pJ = pj1 ,...,jl


est la (k+l)-forme élémentaire dans Rn

pI ∧ pJ = p(I,J),

où (I, J) désigne le (k+l)-uple (i1 , . . . , ik , j1 , . . . , jl ). Si α, β ∈ {−1, 1}, on


définit (αpI ) ∧ (βpJ ) par

(αpI ) ∧ (βpJ ) = (αβ)p(I,J).

En d’autres termes, pi1 ,...,ik ∧pj1 ,...,jl = pi1 ,...,ik ,j1 ,...,jl . Si (I, J) /∈ A(n, k +
l) (c’est-à-dire si I et J ont un élément en commun), alors, par ce qui précède,
pI ∧ pJ = 0. Si (I, J) ∈ A(n, k + l), désignons par [I, J] ∈ C(n, k + l) le (k+l)-
uple obtenu en réordonnant les éléments de I∪J dans l’ordre croissant: p[I,J]
est donc une (k+l)-forme fondamentale.
590 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE

Proposition. Si I ∈ C(n, k), J ∈ C(n, l) et (I, J) ∈ A(n, k + l), on a

pI ∧ pJ = (−1)α(I,J)p[I,J],

où α(I, J) désigne le nombre de différences jr − is strictement négatives


(1 ≤ r ≤ l, 1 ≤ s ≤ k).
Démonstration. Partant de (I, J) = (i1 , . . ., ik , j1, . . . , jl ), on arrivera pas
à pas à [I, J] en permutant successivement ik avec tous les jr tels que jr < ik ,
puis en permutant successivement ik−1 avec tous les jr tels que jr < ik−1 , et
ainsi de suite jusqu’à i1 . Comme, à chaque opération pI ∧ pJ est multiplié
par (−1), la formule est prouvée.

Proposition. Si I ∈ C(n, k), J ∈ C(n, l) et K ∈ C(n, m), on a

(pI ∧ pJ ) ∧ pK = pI ∧ (pJ ∧ pK ),

dont on désigne la valeur commune par pI ∧ pJ ∧ pK .


Démonstration. Si (I, J, K) /∈ A(n, k + l + m), les deux membres de
l’égalité à prouver sont nuls et donc égaux. On peut donc supposer que
(I, J, K) ∈ A(n, k + l + m). Par la définition et la proposition précédentes,
on a
(pI ∧ pJ ) ∧ pK = p(I,J) ∧ pK = (−1)α(I,J)p[I,J] ∧ pK
= (−1)α(I,J)p([I,J],K) = (−1)α(I,J)(−1)α([I,J],K)p[I,J,K]

= (−1)α(I,J)+α(I,K)+α(J,K)p[I,J,K].
On montre de la même manière que pI ∧ (pJ ∧ pK ) est égal à cette dernière
expression.
Passons maintenant à la définition du produit extérieur de deux formes
quelconques.
Définition. Si
% [k % [l
u= I∈C(n,k) uI pI ∈ (Rn , K), v = J∈C(n,l) vJ pJ ∈ (Rn , K),
sont respectivement une k-forme extérieure et une l-forme extérieure sur Rn ,
[
le produit extérieur u ∧ v de u par v est l’élément de k+l (Rn , K) défini par
$ $
u∧v = uI vJ p(I,J).
I∈C(n,k) J∈C(n,l)

Le produit extérieur possède les propriétés suivantes.


15.5. ALGÈBRE DES FORMES EXTÉRIEURES 591

[k [l
Proposition. 1. Si u ∈ (Rn , K), v ∈ (Rn , K) et k + l > n, alors

u ∧ v = 0.

[k [k [l
2. Si u ∈ (Rn , K), v ∈ (Rn , K) et w ∈ (Rn , K), c ∈ K, alors

(u + v) ∧ w = (u ∧ w) + (v ∧ w),
w ∧ (u + v) = (w ∧ u) + (w ∧ v),
(cu) ∧ w = u ∧ (cw) = c(u ∧ w).

[k [l [m
3. Si u ∈ (Rn , K), v ∈ (Rn , K) et w ∈ (Rn , K), alors

(u ∧ v) ∧ w = u ∧ (v ∧ w),
et la valeur commune s’écrit u ∧ v ∧ w.
[ [
4. Si u ∈ k (Rn , K) et v ∈ l (Rn , K), alors
u ∧ v = (−1)kl (v ∧ u).

5. Si I = (i1 , . . . , ik ) ∈ B(n, k), alors


pi1 ∧ pi2 ∧ . . . ∧ pik = pi1 ,...,ik = pI .
Démonstration. Les propriétés 1, 2 et 5 sont des conséquences immédi-
ates de la définition. Par la propriété 2, il suffit de démontrer la propriété
3 pour des formes fondamentales, ce qui a été fait plus haut. Quant à la
propriété 4, elle découle de la propriété 2 et du fait que, si I = (i1 , . . . , ik ) ∈
C(n, k) et J = (j1 , . . . , jl ) ∈ C(n, l), alors les deux membres sont nuls si
(I, J) /∈ A(n, k + l) tandis que, dans le cas contraire, on a

p(I,J) = pi1 ,...,ik ,j1 ,...,jl = (−1)kl pj1 ,...,jl ,i1 ,...,ik = (−1)kl p(J,I).

%3 %3 %3
Exemple. Si u = i=1 ui pi et v = j=1 k=1 vj,k pj,k , on a

u ∧ v = u1 v2,3 p1,2,3 + u1 v3,2 p1,3,2 + u2 v1,3 p2,1,3


+u2 v3,1 p2,3,1 + u3 v1,2 p3,1,2 + u3 v2,1 p3,2,1
= [u1 (v2,3 − v3,2 ) + u2 (v3,1 − v1,3 ) + u3 (v1,2 − v2,1 )]p1,2,3.
Soient n ≥ 1 et k ≥ 0 des entiers.
592 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE

% %
Définition. Si u = I∈C(n,k) uIpI et v = I∈C(n,k) vI pI sont deux élé-
[
ments de k (Rn , K), le produit scalaire (u|v) de u par v est l’élément de K
défini par $
(u|v) = uI vI ,
I∈C(n,k)

où vI est le conjugué de vI .


%
En particulier, si u = ni=1 ui pi est une 1-forme, on peut lui associer
%
biunivoquement l’élément u = (u1 , . . . , un) de Kn . Si alors v = ni=1 vi pi
est aussi une 1-forme, on voit que le produit scalaire (u|v) n’est rien d’autre
que le produit scalaire usuel (u|v) des éléments de Kn qui leur sont respec-
tivement associés. On vérifie sans peine les propriétés suivantes du produit
scalaire.
[
Proposition. Si u, v, w ∈ k (Rn , K), on a
1. (u|v) = (v|u)
2. (u + v|w) = (u|w) + (v|w)
3. Si c ∈ K, (cu|v) = c(u|v).
Soient n ≥ 1 et 0 ≤ k ≤ n des entiers.
% [
Définition. Si u = I∈C(n,k) uI pI ∈ k (Rn , K), l’adjointe (de Hodge) 7u
[
de u est l’élément de n−k (Rn , K) défini par
$
7u = !(I)uI pI∗ ,
I∈C(n,k)

où, pour chaque I = (i1 , . . . , ik ) ∈ C(n, k), on pose I∗ = (i∗1 , . . . , i∗n−k ),


où les 1 ≤ i∗1 < i∗2 < . . . < i∗n−k ≤ n sont tels que {i∗1 , . . . , i∗n−k } =
{1, 2, . . ., n} \ {i1 , . . . , ik }, tandis que !(I) est la signature de la permuta-
tion (i1 , . . . , ik , i∗1 , . . . , i∗n−k ) 2→ (1, 2, . . ., n).
Bien entendu, si u est une 0-forme de valeur constante u ∈ K cette
définition signifie que
7u = ūp1,...,n ,
et si u = u1,...,n p1,...,n est une n-forme, cette définition signifie que 7u est la
0-forme associée à l’élément u1,...,n de K.
On notera que (I∗ )∗ = I et que !(I∗ ) = (−1)k(n−k) !(I).
%
Exemple. Si u = 3i=1 ui pi , alors 7u = u1 p2,3 − u2 p1,3 + u3 p1,2 .
L’adjointe de Hodge est caractérisée par la propriété importante suivante,
qui relie les produits extérieur et scalaire.
15.5. ALGÈBRE DES FORMES EXTÉRIEURES 593

[k
Proposition. Soient n ≥ 1 et 0 ≤ k ≤ n des entiers et soit u ∈ (Rn , K).
[
Alors 7u est l’unique élément de n−k (Rn, K) tel que l’on ait

v ∧ 7u = (v|u)p1,...,n (= 7(v|u) = 7(u|v)),


[k
pour tout v ∈ (Rn , K),

Démonstration. En vertu des propriétés des produits extérieur et scalai-


re, il suffit de démontrer le résultat pour des k-formes fondamentales u =
pI , I = (i1 , . . . , ik ) ∈ C(n, k) (u = 1 si k = 0) et v = pL , L = (l1 , . . ., lk ) ∈
C(n, k) (v = 1 si k = 0). Alors, laissant les cas particuliers k = 0 et k = n
au lecteur, on a 7u = !(I)pI∗ , et dès lors

v ∧ 7u = !(I)p(L,I∗)

et le second membre est égal à !(I)p(I,I∗) = p1,...,n si L = I, et est égal à zéro


si L /= I. D’autre part, (pI |pL ) est égal à zéro si L /= I, et à un si L = I, et
la formule s’en déduit aussitôt.Pour montrer l’unicité de l’élément vérifiant
la propriété de la proposition, on remarque que si w et z sont des éléments
[
de n−k (Rn , K) tels que l’on ait

v ∧ w = v ∧ z = (v|u)p1,...,n ,
[k
pour tout v ∈ (Rn , K), alors, pour ces v, on aura

v ∧ (w − z) = 0.

En posant
$
w−z= cIpI ,
I∈C(n,n−k)

et en prenant v = 7(w − z), on trouve alors

0 = 7(w − z) ∧ (w − z) = (−1)k(n−k) (w − z) ∧ [7(w − z)]


$
= (−1)k(n−k) (w − z|w − z)p1,...,n = (−1)k(n−k) |cI|2 p1,...,n ,
I∈C(n,k)

et donc w − z = 0.
L’adjointe d’une forme a les propriétés suivantes.
594 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE

[k
Proposition. Si u, v ∈ (Rn , K) et si c ∈ K, on a
1. 7(cu) = c̄(7u)
2. 7(u + v) = 7u + 7v
3. 77u = (−1)k(n−k) u.
Démonstration. Les propriétés 1 et 2 sont évidentes. Pour la propriété
% %
3, si u = I∈C(n,k) uI pI, alors 7u = I∈C(n,k) !(I)uIpI∗ et
$ $
7(7u) = !(I∗ )!(I)uIpI∗∗ = (−1)k(n−k) uI pI = (−1)k(n−k) u.
I∈C(n,k) I∈C(n,k)

%3 %3
Exemples. 1. Si u = i=1 ui pi et v = i=1 vi pi sont des éléments de
[1 3
(R , R), alors
u ∧ v = (u1 v2 − u2 v1 )p1,2 + (u1 v3 − u3 v1 )p1,3 + (u2 v3 − u3 v2 )p2,3 ,
et
7(u ∧ v) = (u1 v2 − u2 v1 )p3 − (u1 v3 − u3 v1 )p2 + (u2 v3 − u3 v2 )p1
= (u2 v3 − u3 v2 )p1 + (u3 v1 − u1 v3 )p2 + (u1 v2 − u2 v1 )p3 ,
qui est la 1-forme dans R3 associée au produit vectoriel u ∧ v des éléments u
et v de R3 naturellement associés à u et v.
2. Avec les mêmes notations que dans l’exemple 1, on a aussi
(7u) ∧ v = (u|v)p1,2,3 = u ∧ (7v)
ou encore
7[(7u) ∧ v] = 7[u ∧ (7v)] = (u|v).

15.6 Formes différentielles


Soit E ⊂ Rn un ouvert et f ∈ C 1 (E, K). En chaque point x ∈ E, la dérivée
totale fx$ de f est l’application linéaire de Rn dans K telle que
n
$ n
$
fx$ (h) = Di f (x) hi = Di f (x) pi(h).
i=1 i=1
%
En d’autres termes, pour chaque x ∈ E, fx$ = ni=1 Dif (x) pi ∈ L(Rn , K)
[
= 1 (Rn , K). En conséquence, l’application x 2→ fx$ peut être considérée
[
comme une application de E dans 1 (Rn , K). Il est utile de considérer, plus
[
généralement, des applications de E dans k (Rn , K).
Soit E ⊂ Rn non vide et k ≥ 1 un entier.
15.6. FORMES DIFFÉRENTIELLES 595

Définition. On appelle k-forme différentielle (extérieure) sur E toute ap-


[
plication ω de E dans k (Rn , K) de la forme
$
ω : x 2→ wI pI,
I∈B(n,k)

où, pour chaque I ∈ B(n, k), wI est une application de E dans K.


D’une manière équivalente, une k-forme différentielle sur E peut être
considérée comme une application de E × Rn × . . . × Rn = E × Rnk dans K
de la forme
$
ω(x; h1 , . . . , hk ) = wI(x)pI(h1 , . . . , hk ).
I∈B(n,k)

Ainsi, l’application ω définie par


ω(x1 , x2 , x3 ; h1 , h2 )) = x2 p1,2 (h1 , h2 ) + sin(x1 x2 x3 )p3,2 (h1 , h2 )
est une 2-forme dans R3 .
%
Si ω = I∈B(n,k) wI pI est une k-forme différentielle sur E, alors, pour
%
chaque x ∈ E, la k-forme extérieure ω(x) = I∈B(n,k) wI (x)pI possède
%
une écriture canonique unique I∈C(n,k) w̃I (x)pI. La k-forme différentielle
%
I∈C(n,k) w̃I pI est appelée l’écriture canonique de ω. Notons en particulier
qu’une 0-forme différentielle sur E sera identifiée à une application de E
dans K.
%
La k-forme différentielle ω = I∈C(n,k) wI pI sera dite réelle (resp. com-
plexe) si K = R (resp. C). Elle sera dite de classe C l (l ≥ 0, entier)
si, pour chaque I ∈ C(n, k), wI est de classe C l sur E. On désignera par
[
C l (E, k (Rn , K)) l’ensemble des k-formes différentielles (réelles pour K = R,
complexes pour K = C) de classe C l sur E.
On définit de façon naturelle les opérations d’addition, de multiplication
extérieure, de produit scalaire et d’adjointe de la manière suivante :
(ω + λ)(x) = ω(x) + λ(x), (gω)(x) = g(x)ω(x),
(ω ∧ µ)(x) = ω(x) ∧ µ(x), (ω|λ)(x) = (ω(x)|λ(x)), (7ω)(x) = 7(ω(x)),
pour tout x ∈ E, où ω et λ sont des k-formes différentielles sur E, µ une
l-forme différentielle sur E et g est une application de E dans K.
Exemples. 1. Une 1-forme différentielle réelle dans E ⊂ Rn s’écrit d’une
manière unique
n
$
ω= wipi ,
i=1
596 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE

où les wi : E ⊂ Rn → R. Sa donnée correspond donc à celle d’un champ w


sur E, c’est-à-dire d’une application w : E ⊂ Rn → Rn . Réciproquement, à
un champ w sur E, on peut associer la 1-forme différentielle
n
$
1
ωw = wi pi .
i=1

Mais on peut également lui associer la (n-1)-forme différentielle


n
$
n−1
ωw = wip1,...,Ii,...,n ,
i=1

où (1, . . . , Ii, . . . , n) = (1, . . . , i − 1, i + 1, . . ., n), puisque chaque élément I ∈


C(n, n − 1) peut-être caractérisé par l’élément i de {1, 2, . . ., n} qu’il ne
contient pas.
%
2. La 1-forme différentielle ni=1 Dif pi introduite au début de ce para-
graphe est la 1-forme ωgrad 1
f
ou ω∇f
1
associée au champ gradient de f défini
par grad f = ∇f = (D1 f, . . . , Dn f ).
3. A une application f : E → K on peut non seulement associer la
0-forme différentielle correspondante, mais aussi la n-forme différentielle

ωfn = f p1,...,n .

Supposons maintenant que E ⊂ Rn soit un ouvert et que f ∈ C 1 (E, K).


On a vu que la notion de dérivée totale permet d’associer à f (ou à la 0-forme
différentielle correspondante) la 1-forme différentielle
n
$
Dif pi
i=1

que nous noterons df et appellerons la différentielle extérieure de f . Nous


étendrons comme suit cette notion aux k-formes différentielles de classe C 1
sur E.
%
Définition. Soit E ⊂ Rn un ouvert et ω = I∈C(n,k) wIpI une k-forme
différentielle de classe C 1 sur E. On appelle différentielle extérieure dω de ω
la (k+1)-forme différentielle de classe C 0 sur E définie par
$
dω = dwI ∧ pI ,
I∈C(n,k)
15.6. FORMES DIFFÉRENTIELLES 597

où les dwI sont donnés, conformément à ce qui précède, par


n
$
dwI = Di wIpi .
i=1

Explicitement, on a donc,
$ n
$
dω = Di wIp(i,I).
I∈C(n,k) i=1

En particulier, les dérivées partielles d’une fonction constante étant nulles,


on a
dpI = 0,
pour tout I ∈ C(n, k). D’autre part, en appliquant la définition de différen-
tielle extérieure à la projection sur la j e composante pj : Rn → R, considérée
ici comme une 0-forme dans Rn (ce que l’on traduit par l’emploi d’un symbole
en caractère non gras), on voit que
dpj = pj , (1 ≤ j ≤ n),
et, comme il est d’usage de commettre l’abus d’écriture qui consiste à rem-
placer pj par sa valeur xj en x, on écrit traditionnellement dxj au lieu de
dpj . Comme, par ailleurs, on sait que
pI = pi1 ,...,ik = pi1 ∧ . . . ∧ pik ,
on écrira, pour suivre la tradition,
pI = dxi1 ∧ . . . ∧ dxik = dxI ,
%
ce qui fournit, pour la k-forme différentielle ω = I∈B(n,k) wI pI , les nota-
tions usuelles $
wI dxI,
I∈B(n,k)
ou
n $
$ n n
$
... wi1,i2 ,...,ik dxi1 ∧ dxi2 ∧ . . . ∧ dxik .
i1 =1 i2 =1 ik =1
En particulier, on écrira
n
$ $
dwI = Di wI dxi , dω = dwI ∧ dxI.
i=1 I∈C(n,k)

La différentielle extérieure d’une forme possède les propriétés suivantes.


598 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE

[
Proposition. Soit E ⊂ Rn un ouvert, k ≥ 0, l ≥ 0, ω ∈ C 1 (E, k (Rn , K)),
[ [ [
λ ∈ C 1 (E, k (Rn , K)), µ ∈ C 1 (E, l (Rn , K)), ν ∈ C 2 (E, k (Rn , K)), c ∈ K
et f ∈ C 1 (E, K). Alors, on a
[ [
1. ω + λ ∈ C 1 (E, k (Rn , K)), cω ∈ C 1 (E, k (Rn , K)) et

d(ω + λ) = dω + dλ, d(cω) = cdω.

[k
2. f ω ∈ C 1 (E, (Rn , K)) et

d(f ω) = df ∧ ω + f dω.

[k+l
3. ω ∧ µ ∈ C 1 (E, (Rn , K)) et

d(ω ∧ µ) = dω ∧ µ + (−1)k (ω ∧ dµ).

4. d2 ν = d(dν) = 0 (Théorème de Poincaré).


Démonstration. La propriété 1 est immédiate et il suffit dès lors de
démontrer la propriété 2 dans le cas où ω = wI dxI. Alors, f ω = f wI dxI ∈
[
C 1 (E, k (Rn , K)) et
n
$
d(f wIdxI) = d(f wI) ∧ dxI = Di (f wI)dxi ∧ dxI
i=1
n
$
= [(Dif )wI + f DiwI ]dxi ∧ dxI
i=1
n
$ n
$
= [Dif dxi ∧ wIdxI] + f Di wI dxi ∧ dxI = df ∧ ω + f dω.
i=1 i=1

Il suffit également de démontrer la propriété 3 lorsque ω = wI dxI et µ =


mJ dxJ. On a, par la propriété 2,

d(ω ∧ µ) = d(wImJ dx(I,J)) = d(wImJ ) ∧ dx(I,J) + wI mJd(dx(I,J))


n
$ n
$
= Di (wImJ)dxi ∧ dx(I,J) = (Di wI)mJ dxi ∧ dxI ∧ dxJ
i=1 i=1
n
& n
'
$ $
I J I
+ wI (DimJ )dxi ∧ dx ∧ dx = (DiwI)dxi ∧ dx ∧ mJ dxJ
i=1 i=1
15.6. FORMES DIFFÉRENTIELLES 599
& n
'
$
I J
+(−1) wIdx ∧
k
Di mJ dxi ∧ dx = dω ∧ µ + (−1)k ω ∧ dµ.
i=1

Enfin, il suffit de prouver la propriété 4 lorsque ν = wI dxI avec wI ∈


C 2 (E, K). On a, en utilisant les propriétés 1 et 3,
& n '
$
d ν = d(dwI
2
∧ dxI) = d(dwI ) ∧ dxI − dw I ∧ d(dxI) =d Di wI dxi ∧ dxI
i=1
 
n
$ n
$ n
$
I
= d(Di wI) ∧ dxi ∧ dx =  2
Dij wI dxj  ∧ dxi ∧ dxI
i=1 i=1 j=1
   
$ $
= 2
Dij wI dxj ∧ dxi  ∧ dxI +  2
Dij wI dxj ∧ dxi  ∧ dxI =
1≤i<j≤n 1≤j<i≤n
 
$
 (Dij
2 2
wI − Dji wI )dxj ∧ dxi  ∧ dxI = 0,
1≤i<j≤n

puisque Dij2 w = D 2 w . Dans l’avant-dernière ligne du calcul, on a remplacé


I ji I
i par j et j par i dans la deuxième somme et utilisé le fait que dxi ∧ dxj =
−dxj ∧ dxi.
Exemples. 1. Soit E ⊂ Rn un ouvert et f ∈ C 2 (E, R). On a vu plus haut
que
n
$
df = ωgrad
1
f = Di f dxi .
i=1

Dès lors,
n
$ n
$
7df = !(i) Dif dxi∗ = Z ∧ . . . ∧ dx ,
(−1)i−1 Dif dx1 ∧ . . . ∧ dx i n
i=1 i=1

Zi indique que le terme correspondant est absent. Par conséquent,


où dx
n
$
d 7 df = Z ∧ . . . ∧ dx
(−1)i−1d(Dif ) ∧ dx1 ∧ . . . ∧ dx i n
i=1

n
$ n
$
= (−1)i−1 2
Dij Zi ∧ . . . ∧ dxn
f dxj ∧ dx1 ∧ . . . ∧ dx
i=1 j=1
600 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE

n
$
= (−1)i−1 Dii
2 Z ∧ . . . ∧ dx
f dxi ∧ dx1 ∧ . . . ∧ dx i n
i=1
& n
'
$
= 2
Dii f dx1 ∧ . . . ∧ dxn = ?f dx1 ∧ . . . ∧ dxn ,
i=1
%n
où ?f = i=1
2 f s’appelle le laplacien de f . On a donc aussi
Dii

7d 7 df = ?f.
%n [1
2. Soit ωw
1
= i=1 wi dxi ∈ C 1 (E, (Rn , R)), où E ⊂ Rn est ouvert.
Alors,
n
$ n $
$ n $
1
dωw = dwi ∧ dxi = Dj wi dxj ∧ dxi = Dj wi dxj ∧ dxi
i=1 i=1 j=1 1≤i<j≤n
$ $
+ Dj wi dxj ∧ dxi = (Diwj − Dj wi)dxi ∧ dxj .
1≤j<i≤n 1≤i<j≤n

En particulier, si n = 2,
1
dωw = (D1 w2 − D2 w1 )dx1 ∧ dx2 , 7dωw
1
= D1 w2 − D2 w1 .

Si n = 3,
1
7dωw = (D1 w2 − D2 w1 )dx3 − (D1 w3 − D3 w1 )dx2 + (D2 w3 − D3 w2 )dx1

= (D2 w3 − D3 w2 )dx1 + (D3 w1 − D1 w3 )dx2 + (D1 w2 − D2 w1 )dx3 = ωrot


1
w,

où l’opérateur différentiel rotationnel est défini par

rot w = (D2 w3 − D3 w2 , D3 w1 − D1 w3 , D1w2 − D2 w1 ),

et parfois noté symboliquement ∇ ∧ w. D’autre part,


n
$
1
7ωw = Z ∧ . . . ∧ dx ,
wi(−1)i−1 dx1 ∧ . . . ∧ dx i n
i=1

et n
$
1
d 7 ωw = Z ∧ . . . ∧ dx
(−1)i−1 dwi ∧ dx1 ∧ . . . ∧ dx i n
i=1
n
$ n
$
= (−1)i−1 Zi ∧ . . . ∧ dxn
Dj wi dxj ∧ dx1 ∧ . . . ∧ dx
i=1 j=1
15.6. FORMES DIFFÉRENTIELLES 601

n
$
= Z ∧ . . . ∧ dx
(−1)i−1 Di wi dxi ∧ dx1 ∧ . . . ∧ dx i n
i=1
& n
'
$
= Di wi dx1 ∧ . . . ∧ dxn = ωdiv
n
w,
i=1

où l’opérateur différentiel divergence est défini par


n
$
div w = Di wi ,
i=1

et parfois noté symboliquement (∇|w). La formule peut encore s’écrire


1
7d 7 ωw = div w.

L’opérateur 7d7 est appelé l’opérateur de codifférentiation extérieure et est


noté δ.
3. Si f ∈ C 2 (E, R) et w ∈ C 2 (E, R3), avec E ⊂ R3 ouvert, on aura, par
ce qui précède,
0 = 7d2 f = 7dωgrad
1
f = ωrot grad f ,
1

et donc
rot grad f = 0,
tandis que

0 = d2 ωw
1
= d(7 7 dωw
1
) = d(7ωrot
1
w ) = ωdiv rot w ,
3

et donc
div rot w = 0.
L’étude des propriétés des opérateurs différentiels gradient, divergence,
rotationnel et de leurs dérivés s’appelle l’analyse vectorielle. La théorie des
formes différentielles lui fournit un cadre général et systématique.
Si F ⊂ Rm et E ⊂ Rn sont des ouverts, si f ∈ C 1 (E, K) et g ∈ C 1 (F, E),
on sait, par le théorème de dérivation des fonctions composées, que f ◦ g ∈
C 1 (F, K) et que

d(f ◦ g)(y, h) = (f ◦ g)$y (h) = (fg(y)


$
◦ gy$ )(h)
   
m
$ n
$ m
$
= fg(y)
$
(gy$ (h)) = fg(y)
$  hj Dj g(y) = Di f (g(y))  Dj gi (y)hj 
j=1 i=1 j=1
602 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE

n
$
= Di f (g(y))dgi(y, h),
i=1
pour tout y ∈ F et tout h ∈ R . On a donc
m

n
$
d(f ◦ g) = [(Dif ) ◦ g]dgi, (15.6)
i=1

et l’on voit qu’en définissant le changement de variables x = g(y) dans la


1-forme différentielle df par le membre de droite de (15.6), cette opération
commutera avec l’opération de différentiation extérieure. On est ainsi con-
duit à la définition suivante, dans le cas général.
[
Définition. Soient E ⊂ Rn , ω ∈ C 0 (E, k (Rn , K)), où n, k ≥ 1 sont des
entiers, F ⊂ Rm et g ∈ C 1 (F, E). La transformée par g de
$
ω= wIdxI
I∈C(n,k)
[k
est l’élément g ∗ ω de C 0 (F, (Rm, K)) défini par
$
g ∗ω = (wI ◦ g)dgI,
I∈C(n,k)

où, si dxI = dxi1 ∧ . . . ∧ dxik , on a posé


   
m
$ m
$
dgI = dgi1 ∧ . . . ∧ dgik =  Dj1 gi1 dyj1  ∧ . . . ∧  Djk gik dyjk  ,
j1 =1 jk =1

les dyj désignant les 1-formes fondamentales dans Rm . Si f ∈ C 0 (E, K), la


transformée par g de f (considérée comme 0-forme) est définie par

g ∗ f = f ◦ g,

c’est-à-dire par le composé de f avec g.


La transformée possède les propriétés suivantes.
[
Proposition. Soient E ⊂ Rn , F ⊂ Rm des ouverts, ω ∈ C 0 (E, k (Rn , K)),
[ [
λ ∈ C 0 (E, k (Rn, K)), µ ∈ C 0 (E, l (Rn , K)), f ∈ C 0 (E, K) et g ∈ C 1 (F, E).
Alors, on a
1. g ∗ (ω + λ) = g ∗ ω + g ∗ λ
2. g ∗ (f ω) = (f ◦ g)g ∗ω
15.6. FORMES DIFFÉRENTIELLES 603

3. g ∗ (ω ∧ µ) = g ∗ ω ∧ g ∗ µ
4. Si f ∈ C 1 (E, K), d(g ∗f ) = g ∗ (df )
[
5. Si ω ∈ C 1 (E, k (Rn , K)), k ≥ 1 et g ∈ C 2 (F, E),

d(g ∗ω) = g ∗ dω.

6. Si G ⊂ Rl est un ouvert et h ∈ C 1 (G, F ),

(g ◦ h)∗ ω = h∗ (g ∗ω).

Démonstration. Les propriétés 1 à 3 sont des conséquences immédiates


de la définition et la propriété 4 est une écriture différente de (15.6). Elles
impliquent qu’il suffit de démontrer les propriétés 5 et 6 pour ω = wIdxI où
I ∈ C(n, k). Pour la propriété 5, on a

d(g ∗ (wIdxI )) = d[(wI ◦ g)dgi1 ∧ . . . ∧ dgik ]

= d(wI ◦ g) ∧ dgi1 ∧ . . . ∧ dgik + (wI ◦ g)d2 gi1 ∧ dgi2 ∧ . . . ∧ dgik

−(wI ◦ g)dgi1 ∧ d2 gi2 ∧ . . .∧ dgik + . . .+ (−1)k−1(wI ◦ g)dgi1 ∧ dgi2 ∧ . . .∧ d2 gik .


Du théorème de Poincaré et de la propriété 4, on déduit

d(g ∗(wIdxI )) = d(g ∗wI) ∧ dgI = g ∗ dwI ∧ g ∗ (dxI) = g ∗ (dwI ∧ dxI) = g ∗ (dω).

Pour la propriété 6, on a

(g ◦ h)∗ ω = (wI ◦ g ◦ h)d(g ◦ h)I

et
h∗ (g ∗ ω) = h∗ ((wI ◦ g)dgI) = (wI ◦ g ◦ h)h∗ dgI .
Comme

d(g ◦ h)I = d(g ◦ h)i1 ∧ . . . ∧ d(g ◦ h)ik = d(gi1 ◦ h) ∧ . . . ∧ d(gik ◦ h),

et
h∗ dgI = h∗ (dgi1 ∧ . . . ∧ dgik ) = h∗ dgi1 ∧ . . . ∧ h∗ dgik ,
la thèse découle de la propriété 4.
Le résultat qui suit montre le lien entre les formes différentielles et les
intégrands liés à la circulation et au flux d’un champ de vecteurs.
604 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE

Proposition. Si E ⊂ Rn ,
% I [k
ω= I∈C(n,k) wI dx ∈ C 0 (E, (Rn , K)),

k ≥ 1, F ⊂ Rk et g ∈ C 1 (F, E), alors


 
$

g ω= (wI ◦ g)J(g)  dy1 ∧ . . . ∧ dyk ,
I
I∈C(n,k)

où J(g) désigne le Jacobien de (g)I = (gi1 , . . . , gik ), c’est-à-dire


I
 # #
D1 (g)I # D g . . . D1 gik #
# 1 i1 #
  # #
 D2 (g)I  # D2 gi1 . . . D2 gik #
J(g) = det 
 .. =#
 # .. .. .. #.
#
I  .  # . . . #
# #
Dk (g)I # Dk gi1 . . . Dk gik #

En particulier, si n = k et ω = dx1 ∧ . . . ∧ dxn , alors

dg1 ∧ . . . ∧ dgn = Jg dy1 ∧ . . . dyn .

Démonstration. Comme
$
g ∗ω = (wI ◦ g)dgI,
I∈C(n,k)

il suffit de prouver que

dgI = J(g) dy1 ∧ . . . ∧ dyk .


I
On a
dgI = dgi1 ∧ . . . ∧ dgik
   
k
$ k
$
= Dj1 gi1 dyj1  ∧ . . . ∧  Djk gik dyjk 
j1 =1 jk =1
$
= (Dj1 gi1 ) . . . (Djk gik ) dyj1 ∧ . . . ∧ dyjk
J=(j1 ,...,jk )∈B(k,k)
$
= (Dj1 gi1 ) . . . (Djk gik ) dyj1 ∧ . . . ∧ dyjk
J∈A(k,k)
 
$
= sign J (Dj1 gi1 ) . . .(Djk gik ) dy1 ∧ . . . ∧ dyk ,
J∈A(k,k)
15.7. INTÉGRALE D’UNE FORME SUR UNE CHAı̂NE 605

où sign J est la signature de la permutation J = (j1 , . . . , jk ) de (1, . . ., k).


Comme A(k, k) constitue l’ensemble des permutations de {1, 2, . . ., k}, on
déduit de la théorie des déterminants que

dgI = J(g) dy1 ∧ . . . ∧ dyk ,


I

et la démonstration est complète.


Remarque. Dans les conditions de la Proposition ci-dessus, on a donc
$
7(g ∗ω) = (wI ◦ g)J(g) ,
I
I∈C(n,k)

si l’on pose
$
ω= wIdxI .
I∈C(n,k)

15.7 Intégrale d’une forme sur une chaı̂ne


Soit k ≥ 1 un entier, U = [0, 1], U k = U × . . . × U (k fois), E ⊂ Rn et r ≥ 1
un entier.
Définition. Un k-simplexe dans E de classe C r est une application Φ :
U k → E de classe C r sur U k .
Un 1-simplexe dans E de classe C r est également appelé un chemin
dans E de classe C r . Lorsque n = 3, l’image Φ(U ) d’un 1-simplexe dans
E correspond à la notion géométrique intuitive d’un arc de courbe contenu
dans E et l’image Φ(U 2 ) d’un 2-simplexe dans E correspond à la notion
géométrique intuitive d’un élément de surface contenu dans E. Bien entendu,
puisque nous n’imposons pas de propriété d’injectivité à Φ, l’arc de courbe
peut “dégénérer” en un point, et l’élément de surface “dégénérer” en un arc
de courbe ou en un point.
Définition. Un 0-simplexe dans E est une application Φ : {0} → E.
On peut donc identifier un 0-simplexe dans E à sa valeur unique a =
Φ(0) ∈ E, c’est-à-dire à un élément de E.
On désignera par Skr (E) l’ensemble des k-simplexes dans E de classe
C . Pour k = 0, cela n’a de sens que pour r = 0 et l’ensemble S0 (E) des
r

0-simplexes dans E peut être identifié à E.


606 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE

Définition. Si k ≥ 1, Φ ∈ Sk1 (E) et


% I [k
ω= I∈C(n,k) wI dx ∈ C 0 (E, (Rn , K)),
on appelle intégrale de ω sur Φ l’élément de K défini par
J J $ $ J
7(Φ∗ ω̄) = (wI ◦ Φ)J(Φ) = (wI ◦ Φ)J(Φ) .
Uk Uk I k I
I∈C(n,k) I∈C(n,k) U

Si k = 0, Φ ∈ S0 (E), avec Φ(0) = a ∈ E, et f ∈ C 0 (E, K) est considérée


comme 0-forme sur E, on appelle intégrale de f sur Φ l’élément de K défini
par
Φ∗ f (0) = f (Φ(0)) = f (a).
Les intégrales ainsi définies généralisent évidemment celles de circulation
le long d’un arc de courbe et de flux à travers un élément de surface, qui
correspondent respectivement à k = 1, ω = ωw 1 , w ∈ C 0 (E, Rn) et à k =

2, n = 3, ω = 7ωw , w ∈ C (E, R ). Si a < b, Φ : [0, 1] → R, u 2→ a + u(b − a)


1 0 3
[
est le 1-simplexe affine d’image [a, b], et si ω = w dx ∈ C 0 ([a, b], 1 (R1 , K)),
alors, en utilisant le théorème de changement de variable dans une intégrale
simple, on trouve
J J 1 J b
∗ $
7(Φ ω) = (w ◦ Φ) Φ = w,
[0,1] 0 a

et la notion se réduit donc au concept classique d’intégrale de w sur [a, b].


Notons que si Φ a au plus (k − 1) composantes non constantes ou ne
dépend pas effectivement d’une des variables (donc en particulier si Φ est
[
constante), l’intégrale de ω sur Φ est nulle pour tout ω ∈ C 0 (E, k (Rn , K)).
Cela résulte immédiatement de l’annulation, dans ces conditions, de tous les
jacobiens qui apparaissent dans l’intégrale.
On déduit aussitôt de la définition et de la linéarité de l’intégrale d’une
fonction, que si
[k [k
Φ ∈ Sk1 (E), ω ∈ C 0 (E, (Rn , K)), c ∈ K et λ ∈ C 0 (E, (Rn , K)),
on a J J J
∗ ∗
7[Φ (ω + λ)] = 7(Φ ω) + 7(Φ∗ λ),
Uk Uk Uk
J 4J 5
7(Φ∗ (cω)) = c 7(Φ∗ω) .
Uk Uk
En conséquence, à chaque Φ ∈ Sk1 (E), on peut associer la forme linéaire Φ
[k n
sur l’espace vectoriel C 0 (E, (R , K)) des k-formes différentielles dans E,
définie par
15.7. INTÉGRALE D’UNE FORME SUR UNE CHAı̂NE 607

[k H
Φ : C 0 (E, (Rn , K)) → K, ω 2→ Φ(ω) = Uk 7(Φ∗ ω).

Pour rappeler sa construction, on écrira


J
ω
Φ

au lieu de Φ(ω), ce qui fournit une notation concise pour l’intégrale de ω sur
Φ. Par extension, on appellera également Φ un k-simplexe et l’on parlera de
l’intégrale de ω sur Φ. On peut combiner linéairement ces formes linéaires:
%
si cj ∈ R et Φj ∈ Sk1 (E), (1 ≤ j ≤ m), la forme linéaire m j=1 cj Φ sur
j
[k n
C (E, (R , K)) est définie de manière usuelle par
0

%m [k %m %m H
j=1 cj Φ
j : C 0 (E, (Rn , K) → K, ω 2→ j=1 cj Φ
j (ω) = j=1 Φj ω.

On notera qu’une même forme linéaire peut correspondre à des k-sim-


[
plexes différents. Ainsi, si O désigne la forme nulle sur C 0 (E, k (Rn , K)),
[
(c’est-à-dire la forme telle que O(ω) = 0 pour tout ω ∈ C 0 (E, k (Rn , K)),
on a vu plus haut que Φ = 0 pour n’importe quel Φ ∈ Sk1 (E) ayant au plus
k − 1 composantes non constantes ou ne dépendant que de k − 1 variables.
Un autre exemple important est le suivant, qui permet aussi de donner une
interprétation géométrique à la forme linéaire −Φ.
Définition. Si Φ ∈ Sk1 (E), k ≥ 1, on appelle reparamétrisation de Φ tout
Ψ ∈ Sk1 (E) qui peut s’écrire Ψ = Φ ◦ t où, V étant un ouvert contenant U k ,
t : V → t(V ) ⊂ Rk est un difféomorphisme tel que t(U k ) = U k .
Donc, si Ψ est une reparamétrisation de Φ, on a Ψ(U k ) = Φ(U k ). Nous
poserons sign Jt = +1 si Jt > 0 sur V et sign Jt = −1 si Jt < 0 sur V.
[k
Proposition. Si Φ ∈ Sk1 (E), ω ∈ C 0 (E, (Rn , K)) et si Ψ est une repara-
métrisation de Φ, avec Ψ = Φ ◦ t, on a
J J
ω = sign Jt ω.
Ψ Φ

Démonstration. Par la linéarité de l’intégrale, il suffit de démontrer le


résultat pour ω = wIdxI . On a
J J J
wIdxI = wIdxI = (wI ◦ Φ ◦ t)J(Φ◦t)
Ψ Φ◦ t Uk I
J J
= (wI ◦ Φ ◦ t)J(Φ) = (wI ◦ Φ ◦ t)(J(Φ) ◦ t)Jt
Uk I ◦t Uk I
608 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE
J
= sign Jt (wI ◦ Φ ◦ t)(J(Φ) ◦ t)|Jt |
t−1 (U k ) I
J J
= signJt (wI ◦ Φ)J(Φ) = sign Jt wIdxI ,
Uk I Φ
où l’on a utilisé le fait que

J(Φ) (s) = det((Φ)I ◦ t)$s = det[((Φ)$I)t(s) ◦ t$s ] =


I ◦t

[det((Φ)$I)t(s)][det t$s ] = (J(Φ) (t(s))).(Jt(s)),


I
et le théorème de changement de variables dans les intégrales.
Cette proposition permet de partitionner l’ensemble des reparamétrisa-
tions de Φ en deux classes correspondant à sign Jt = +1 (c’est la classe
contenant Φ) et à sign Jt = −1. L’intégrale d’une k-forme différentielle sur
deux éléments d’une même classe donnera le même résultat, tandis que les
intégrales sur des représentants de classes différentes ne différeront que par
le signe. Si Φ et Ψ appartiennent à la même classe, on dira qu’ils ont même
orientation; sinon, on dira qu’ils ont des orientations opposées. Dès lors, la
forme linéaire −Φ peut s’interpréter comme correspondant à Φ muni d’une
orientation opposée.
La terminologie “orientation” est motivée par les exemples suivants. Si
Φ ∈ S11 (E) et si t : U → U, u 2→ 1 − u, alors t$ (u) = Jt (u) = −1, et
Φ ◦ t = Φ; d’autre part, lorsque u “parcourt [0, 1] de 0 à 1”, Φ(u) et Φ(1 − u)
“parcourent Φ(U ) dans des sens opposés”. Si Φ ∈ S21 (E), avec E ⊂ R3 , et si
t : U 2 → U 2 , (u1 , u2 ) 2→ (u2 , u1 ), alors Jt (u1 , u2 ) = −1 et Φ ◦ t = −Φ. On a
d’autre part
D1 (Φ ◦ t)(u1 , u2 ) = D2 Φ(u2 , u1 ),
D2 (Φ ◦ t)(u1 , u2 ) = D1 Φ(u2 , u1 ),
et dès lors, en tout point x = (Φ◦t)(u1, u2 ) = Φ(u2 , u1 ) de Φ(U 2 ) = Φ◦t(U 2 ),
les normales respectives

D1 (Φ ◦ t)(u1 , u2 ) ∧ D2 (Φ ◦ t)(u1 , u2)

et
D1 Φ(u2 , u1 ) ∧ D2 Φ(u2 , u1 )
(où ∧ désigne ici le produit vectoriel dans R3 ) seront de sens opposés, ce qui
rejoint la notion intuitive d’orientation opposée pour deux surfaces dans R3
ayant la même image.
15.7. INTÉGRALE D’UNE FORME SUR UNE CHAı̂NE 609

Dans le cas du 0-simplexe Φ tel que Φ(0) = a, on a évidemment


J J
f = −Φ(f ) = − f = −f (a).
−Φ Φ

Nous aurons besoin dans la suite de la généralisation suivante de la notion


de k-simplexe.
Définition. Une k-chaı̂ne dans E de classe C r est une forme linéaire sur
[
C(E, k (Rn , K)) du type
m
$
ni Φi ,
i=1

où les ni ∈ Z et où les Φ ∈ Skr (E), (1 ≤ i ≤ m).


i
% !m
L’image de la k-chaine m i=1 ni Φ sera par définition
i
i=1 Φi (U k ), et
l’ensemble des k-chaı̂nes dans E de classe C r sera noté Crk (E).
Un exemple important de 1-chaı̂ne dans E ⊂ R est le suivant. Soit
n

r ≥ 1 un entier.
Définition. On appelle chemin dans E de classe C r par morceaux toute
%
1-chaı̂ne mi=1 Φ dans E de classe C telle que
i r

Φi (1) = Φi+1 (0), 1 ≤ i ≤ m − 1.

Un chemin sera dit fermé ou sera appelé un cycle dans E de classe C r par
morceaux si, en outre,
Φm (1) = Φ1 (0).
La terminologie s’explique aisément si l’on traduit géométriquement les
conditions de la définition sur l’image du chemin.
La définition d’intégrale d’une k-forme différentielle sur une k-chaı̂ne est
un cas particulier de la combinaison linéaire des formes linéaires associées à
des k-simplexes.
% [k
Définition. Si mi=1 ni Φ ∈ Ck (E) et ω ∈ C (E, (Rn , K)), l’intégrale de
i r 0
%m
ω sur i=1 ni Φ est définie par
i

J m
$ J
%m ω= ni ω.
i=1
ni Φi i=1 Φi

La notion de chaı̂ne permet d’introduire l’important concept de bord d’un


k-simplexe (et ensuite d’une k-chaı̂ne), qui fournit un support analytique, et
sans restriction sur la dimension, à la notion intuitive de frontière orientée
de figures simples de R2 ou R3 .
610 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE

Définition. Si k ≥ 2 est un entier, 1 ≤ j ≤ k et α ∈ {0, 1}, l’application


face (j, α) est définie par

F j,α : U k−1 → U k , (u1, . . . , uk−1 ) 2→ (u1 , . . . , uj−1 , α, uj , . . . , uk−1).

Pour k = 1, l’application face (1, α) est définie par

F 1,α : U 0 = {0} → U 1 , 0 2→ α.

Ainsi, pour k = 2, les images des applications “faces (j, α)” (j = 1, 2; α =


0, 1) fournissent les quatre côtés du carré U 2 .
Définition. Si Φ ∈ Skr (E), avec E ⊂ Rn et r ≥ 1 entier, on appelle bord de
Φ, et l’on note ∂Φ la (k-1)-chaı̂ne dans E de classe C r définie par
k $
$ 1
∂Φ = (−1)j+α Φj,α ,
j=1 α=0

où Φj,α est la forme linéaire associée au (k-1)-simplexe Φ ◦ F j,α .


Exemples. 1. Soit k = 1 et Φ ∈ S1r (E). Alors,
1
$
∂Φ = (−1)1+αΦ1,α = Φ(1) − Φ(0)
α=0

si l’on identifie un 0-simplexe à son image.


2. Soit n = 2, k = 2 et I : U 2 → R2 , u 2→ u l’injection canonique. Alors,
2 $
$ 1
∂I = (−1)j+α Fj,α.
j=1 α=0

On a F 1,0 (u) = (0, u), F 1,1(u) = (1, u), F 2,0(u) = (u, 0), F 2,1(u) = (u, 1),
et dès lors, en vertu des remarques faites sur l’orientation, on peut prendre
respectivement pour −F1,0 , −F2,1 , F1,1 et F2,0 les formes linéaires associées
aux 1-simplexes définis par u 2→ (0, 1 − u), u 2→ (1 − u, 1), u 2→ (1, u) et
u 2→ (u, 0). Lorsque le paramètre u décrit U = [0, 1] monotonément de 0 à
1, l’image de la première application décrit le segment orienté joignant e2 à
0 dans R2 , l’image de la deuxième décrit le segment orienté joignant 0 à e1 ,
l’image de la troisième décrit le segment orienté joignant e1 à (1, 1) et l’image
de la quatrième décrit le segment orienté joignant (1, 1) à e2 . La frontière
fr U 2 de l’image U 2 de I est donc parcourue en laissant l’intérieur de U 2 à
gauche. On voit que ∂I munit la frontière fr I(U ) d’une orientation.
15.7. INTÉGRALE D’UNE FORME SUR UNE CHAı̂NE 611

3. Il résulte aussitôt de calculs analogues à ceux de l’exemple 2 que si Φ


est un 2-simplexe dans E ⊂ Rn , son bord ∂Φ écrit dans l’ordre suivant

∂Φ = Φ2,0 + Φ1,1 − Φ2,1 − Φ1,0

est un cycle dans E de classe C 1 par morceaux.


4. Soit n = 3, k = 3 et Σ : U 3 → R3 ,

(u, v, w) 2→ (ur cos 2πv sin πw, ur sin 2πv sin πw, ur cos πw)

un k-simplexe dont l’image est la boule fermée dans R3 de centre 0 et de


rayon r. On trouve sans peine que

Σ1,0 (v, w) = (0, 0, 0),

Σ1,1 (v, w) = (r cos 2πv sin πw, r sin 2πv sin πw, r cos πw),
Σ2,0 (u, w) = (ur sin πw, 0, ur cos πw), Σ2,1 = Σ2,0,
Σ3,0 (u, v) = (0, 0, ur), Σ3,1 = Σ3,0 .
Dès lors, ∂Σ = Σ1,1 , et Σ1,1 est une 2-chaı̂ne dans R3 dont l’image est la
sphère de centre 0 et de rayon r.
La définition du bord s’étend sans peine à une k-chaı̂ne.
% %m
Définition. Si m i=1 ni Φ ∈ Ck (E), avec E ⊂ R , le bord ∂( ni Φi ) de
i r n
%m i=1
i=1 ni Φ est la (k-1)-chaı̂ne dans E de classe C définie par
i r

& m
' m m $
k $
1
$ $ $
∂ ni Φ i
= ni ∂Φi = (−1)j+αni Φi,j,α ,
i=1 i=1 i=1 j=1 α=0

[k
où Φi,j,α est la forme linéaire sur C 0 (E, (Rn , K) associée à Φi ◦ F j,α .
%m
Exemple. Soit i=1 Φi un chemin dans E de classe C 1 par morceaux.
Alors, & '
m
$ m
$ m
$
∂ Φ i
= ∂Φi = [Φi(1) − Φi (0)] =
i=1 i=1 i=1
m−1
$ m
$
= Φi+1 (0) + Φm (1) − Φi(0) = Φm (1) − Φ1 (0),
i=1 i=1

si l’on identifie de nouveau un 0-simplexe à son image.


Une propriété importante du bord est la suivante.
612 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE

Proposition. Si Φ ∈ Sk1 (E), où k ≥ 2 et E ⊂ Rn , alors ∂(∂Φ) = O.


Démonstration. Soient

F j,α : U k−1 → U k , α = 0, 1, 1 ≤ j ≤ k,

et
Gl,β : U k−2 → U k−1 , β = 0, 1, 1 ≤ l ≤ k − 1,
les applications faces (avec des notations distinctes puisque les dimensions
sont distinctes). On vérifie aisément, à partir des définitions, que

F j,α ◦ Gl,β = F l,β ◦ Gj−1,α

si k ≥ j > l ≥ 1, 0 ≤ α, β ≤ 1. Dès lors,


 
1 $
$ k 1 $
$ k
∂(∂Φ) = ∂  (−1)α+j Φ ◦ Fj,α = (−1)α+j ∂(Φ ◦ Fj,α)
α=0 j=1 α=0 j=1

1 $
$ k 1 k−1
$ $
= (−1)α+j (−1)β+l Φ ◦ Fj,α ◦ Gl,β
α=0 j=1 β=0 l=1

$ k j−1
1 $ $
= (−1)α+β+j+l Φ ◦ Fj,α ◦ Gl,β
α,β=0 j=2 l=1

1 $
$ k k−1
$
+ (−1)α+β+j+l Φ ◦ Fj,α ◦ Gl,β
α,β=0 j=1 l=j

$ k j−1
1 $ $
= (−1)α+β+j+l Φ ◦ Fl,β ◦ Gj−1,α
α,β=0 j=2 l=1

1 $
$ k k−1
$
+ (−1)α+β+j+l Φ ◦ Fj,α ◦ Gl,β
α,β=0 j=1 l=j

1
$ k−1
$$ j
=  (−1)α+β+j+l+1 Φ ◦ Fl,β ◦ Gj,α
α,β=0 j=1 l=1

k−1
$ k−1
$
+ (−1)α+β+j+l Φ ◦ Fj,α ◦ Gl,β 
j=1 l=j
15.8. THÉORÈME DE STOKES-CARTAN 613

1
$ k−1
$ k−1
$
=  (−1)α+β+j+l+1 Φ ◦ Fj,α ◦ Gl,β
α,β=0 j=1 l=j

k−1
$ k−1
$
+ (−1)α+β+j+l Φ ◦ Fj,α ◦ Gl,β 
j=1 l=j

1 k−1
$ $ k−1
$
= (−1)α+β+j+l [Φ ◦ Fj,α ◦ Gl,β − Φ ◦ Fj,α ◦ Gl,β ],
α,β=0 j=1 l=j

et la Proposition s’en déduit aussitôt.


Le résultat s’étend trivialement aux k-chaı̂nes.
Proposition. Si Φ ∈ C1k (E), k ≥ 2 et E ⊂ Rn , alors ∂(∂Φ) = O.

15.8 Théorème de Stokes-Cartan


Le résultat central de la théorie des formes différentielles est le théorème de
Stokes-Cartan, qui étend aux intégrales multiples le théorème fondamental
du calcul différentiel et intégral.
Nous énoncerons et démontrerons d’abord le théorème de Stokes-
Cartan pour les 0-formes et les 1-chaı̂nes.
Théorème. Soit E ⊂ Rn une partie non vide, f ∈ C 1 (E, K) (considérée
%
comme 0-forme) et Φ = mi=1 ni Φ ∈ C1 (E). Alors,
i 1

J J
df = f.
Φ ∂Φ

Démonstration. On a
J m J & n
'
$ $
df = ni Dk f dxk
Φ i=1 Φi k=1

m J , n
- m J
$ 1 $ $ 1
= ni (Dk f ◦ Φ i
)(Φik )$ = ni (f ◦ Φi )$
i=1 0 k=1 i=1 0

m
$ J J
= ni [f (Φi(1)) − f (Φi(0))] = %m f= f.
i=1 i=1
ni ∂ Φi ∂Φ
614 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE

Donnons maintenant le théorème de Stokes-Cartan pour les (k-1)-


formes et les k-chaı̂nes lorsque k ≥ 2.
Théorème. Soit E ⊂ Rn une partie non vide, k ≥ 2 un entier,
[k−1
ω ∈ C 1 (E, (Rn , K))
%m
et Φ = i=1 ni Φi ∈ C2k (E). Alors, on a
J J
dω = ω.
Φ ∂Φ

Démonstration. En vertu des définitions de bord et d’intégrale d’une


forme différentielle sur une chaı̂ne, il suffit de prouver le théorème pour un
k-simplexe Φ ∈ Sk2 (E). Comme Φ est de classe C 2 , on a
J J J
dω = 7Φ∗ (dω) = 7d(Φ∗ω),
Φ Uk Uk
[k−1
où Φ∗ ω ∈ C 1 (U k , (Rk , K)). D’autre part, on a
J J
ω = %k %1 ω
∂Φ j=1 α=0
(−1)j+α Φj,α

k $
$ 1 J
= (−1)j+α 7(Φ ◦ F j,α )∗ ω
j=1 α=0 U k−1

k $
$ 1 J
= (−1) j+α
7(F j,α )∗ (Φ∗ ω).
j=1 α=0 U k−1
[k−1
Il suffit donc de prouver que, pour tout λ ∈ C 1 (U k , (Rk , K)), on a
J k $
$ 1 J
7dλ = (−1)j+α 7(F j,α )∗ λ,
Uk j=1 α=0 U k−1

et comme un tel λ peut s’écrire


k
$
Zi ∧ . . . ∧ dxk ,
li dx1 ∧ . . . ∧ dx
i=1

il suffit, par linéarité, de considérer le cas particulier où λ est de la forme


Z ∧ . . . ∧ dx ,
λ = li dx1 ∧ . . . ∧ dx i k
15.8. THÉORÈME DE STOKES-CARTAN 615

avec li ∈ C 1 (U k , R).
Dans ce cas, on a
& k
'
$
dλ = Z ∧ . . . ∧ dx
Dm li dxm ∧ dx1 ∧ . . . ∧ dx i k
m=1

Zi ∧ . . . ∧ dxk = (−1)i−1 Di li dx1 ∧ . . . ∧ dxk ,


= Dili dxi ∧ dx1 ∧ . . . ∧ dx
et
7dλ = (−1)i−1 Di li.
Par conséquent, par le théorème de Fubini et le théorème fondamental du
calcul différentiel et intégral, on trouve
J J
7dλ = (−1)i−1 Di li
Uk Uk

J 2J 1 3
= (−1)i−1 Z . . . du
Di li(u1 , . . . , ui, . . . , uk ) dui du1 . . . du i k
U k−1 0
J
= (−1)i−1 Z . . . du .
[li(u1 , . . ., 1, . . ., uk )−li(u1 , . . . , 0, . . ., uk )]du1 . . . du i k
U k−1

D’autre part,
k $
$ 1 J
(−1)j+α 7(F j,α )∗ λ
j=1 α=0 U k−1

k $
$ 1 J
= (−1)j+α (li ◦ F j,α )J .
,...,FZ
j,α j,α j,α
U k−1 (F1 i ,...,Fk )
j=1 α=0

Or, comme Fjj,α (u1 , . . . , uk−1 ) = α pour tout u ∈ U k−1 , on a

J = 0,
,...,FZ
j,α j,α j,α
(F1 i ,...,Fk )

si j /= i, tandis que, si j = i, on a

Z
(F1i,α , . . . , Fii,α , . . . , Fki,α)(u) = (u1 , . . . , uk−1 ) = u,

et
J Z = 1.
(F1i,α ,...,F i,α i,α
i ,...,Fk )
616 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE

Dès lors,
k $
$ 1 J 1
$ J

(−1)j+α 7(F j,α) λ = (−1)i+α (li ◦ F i,α )
j=1 α=0 U k−1 α=0 U k−1
J
= (−1)i−1 [li(u1 , . . . , uj−1 , 1, uj , . . ., uk−1 )
U k−1
−li (u1 , . . ., uj−1 , 0, uj , . . . , uk−1 )] du1 . . . duk−1 ,
et le théorème est démontré.
Remarque. Les deux membres de l’égalité exprimant le théorème de Stokes-
Cartan ont un sens sous la seule hypothèse que la forme et la k-chaı̂ne soient
de classe C 1 . On peut donc se poser la question de la nécessité de l’hypothèse
que la chaı̂ne soit de classe C 2 (lorsque k ≥ 2) que notre démonstration
impose. Un procédé d’approximations que nous ne développerons pas ici,
montre que le théorème de Stokes-Cartan est valide pour des chaı̂nes de
classe C 1 .
Donnons maintenant quelques cas particuliers importants du théorème
de Stokes-Cartan.
1. k = 1 : circulation d’un champ gradient.
%
Soit Φ = m i=1 Φ un chemin dans E ⊂ R de classe C par morceaux et
i n 1

f ∈ C 1 (E, K) une 0-forme différentielle sur E. On a donc, par le théorème


de Stokes-Cartan,
J J
df = f = f (Φm (1)) − f (Φ1 (0)),
Φ ∂Φ

en utilisant un résultat antérieur sur le calcul de ∂Φ. D’autre part, df =


1
ωgrad f
, et dès lors, si C est la courbe formée des arcs de courbe images du
chemin Φ dans E , le résultat peut s’écrire, en langage vectoriel
J
(grad f |dT (Φ)) = f (Φm (1)) − f (Φ1 (0)),
C

ce qui montre que l’intégrale d’un champ gradient sur E le long d’un chemin
dans E ne dépend que des extrémités Φ1 (0) et Φm (1) du chemin, et non du
chemin lui-même.
2. n = 2, k = 2 : formule de Green-Riemann
Soit A ⊂ R2 telle que A = Φ(U 2 ), où Φ : F → Φ(F ) est un difféomor-
phisme de classe C 2 de l’ouvert F ⊂ R2 sur l’ouvert E = Φ(F ), tel que
15.8. THÉORÈME DE STOKES-CARTAN 617

JΦ > 0 sur F , et soit w un champ dans R2 de classe C 1 sur E. On peut lui


associer la 1-forme différentielle sur E
1
ωw = w1 dx1 + w2 dx2 ,

telle que
1
dωw = (D1 w2 − D2 w1 ) dx1 ∧ dx2 .
Les conditions du théorème de Stokes-Cartan sont satisfaites pour ωw 1
et
pour le 2-simplexe dans E constitué par la restriction de Φ à U , que nous
2

noterons encore Φ. On obtient


J J
1
dωw = 1
ωw .
Φ ∂Φ

Mais, en vertu de la définition de l’intégrale d’une forme et du théorème de


changement de variables dans une intégrale double, on trouve
J J
1
dωw = [(D1w2 − D2 w1 ) ◦ Φ]JΦ
Φ U2
J J
= [(D1w2 − D2 w1 ) ◦ Φ]|JΦ | = (D1 w2 − D2 w1 )
U2 Φ(U 2 )
J
= (D1 w2 − D2 w1 ).
A
D’autre part, on a vu plus haut que le bord ∂Φ de Φ est un cycle dans E
de classe C 2 par morceaux, et dès lors
J
1
ωw
∂Φ

représente la circulation du champ w le long de l’union des arcs de courbe


formés par l’image du cycle. En langage vectoriel, on obtient donc la for-
mule de Green-Riemann
J J
(D1 w2 − D2 w1 ) = (w|dT (∂Φ)),
A C

où C désigne l’image du cycle ∂Φ.


3. n = 3, k = 2 : formule de Stokes-Ampère ou de la circulation
Soit S un élément de surface simple dans R3 dont la représentation
paramétrique est la restriction à U 2 d’un difféomorphisme Σ : F → Σ(F ) ⊂
R3 de classe C 2 de l’ouvert F tel que U 2 ⊂ F ⊂ R2 sur l’ouvert E = Σ(F ).
618 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE

Soit w un champ dans R3 , de classe C 1 sur E. On peut associer à w la


1-forme différentielle sur E
1
ωw = w1 dx1 + w2 dx2 + w3 dx3 ,

et l’on sait que


1
7dωw = ωrot
1
w,

et donc
1
dωw = 7ωrot
1
w

= (rot w)1 dx2 ∧ dx3 + (rot w)2 dx3 ∧ dx1 + (rot w)3 dx1 ∧ dx2 .
D’ailleurs, le théorème de Stokes-Cartan entraı̂ne l’égalité
J J
1
dωw = 1
ωw .
Σ ∂Σ

D’une part, on a J
1
dωw =
Σ
J
[((rot w)1 ◦ Σ)J(Σ2 ,Σ3 ) + ((rot w)2 ◦ Σ)J(Σ3 ,Σ1 ) + ((rot w)3 ◦ Σ)J(Σ1 ,Σ2 ) ]
U2
J
= (rot w|dN (Σ)).
S

D’autre part, ∂Σ est un cycle dans E de classe C 2 par morceaux et dès lors
J
1
ωw
∂Σ

est égale à la circulation du champ w le long de la courbe formée des arcs


images de ce chemin, c’est-à-dire à
J
(w|dT (∂Σ)),
C

si C désigne l’image de ∂Σ. On obtient ainsi la formule de Stokes-Ampère


ou de la circulation
J J
(rot w|dN (Σ)) = (w|dT (∂Σ)),
S C

qui exprime que le flux du champ rot w à travers une surface S bordée par
un chemin fermé C est égal à la circulation du champ w le long de C.
15.9. BORDS, CYCLES, COBORDS ET COCYCLES 619

4. n = 3, k = 3 : formule de Gauss-Ostrogradski ou du flux ou de


la divergence.
Soit V ⊂ R3 une partie telle que V = Ψ(U 3 ) où Ψ : F → Ψ(F ) est un
difféomorphisme de classe C 2 de l’ouvert F ⊂ R3 sur l’ouvert E = Ψ(F ), tel
que JΨ > 0 sur F . Soit w un champ vectoriel dans R3 de classe C 1 sur E.
On peut associer à w la 1-forme différentielle sur E

1
ωw = w1 dx1 + w2 dx2 + w3 dx3 ,

à laquelle correspond la 2-forme différentielle 7ωw


1 telle que

1
d 7 ωw = div w dx1 ∧ dx2 ∧ dx3 .

Par le théorème de Stokes-Cartan, on a


J J
d 1
7 ωw = 1
7ωw .
Ψ ∂Ψ

En utilisant le théorème de changement de variables dans une intégrale triple,


on obtient
J J J J
1
d 7 ωw = [(div w) ◦ Ψ]JΨ = div w = div w.
Ψ U3 Ψ(U 3 ) V

En utilisant un argument analogue à celui du cas précédent, on voit que


H
∂ Ψ 7ωw représente une somme d’intégrales de (w|dN (∂Ψ)) sur des éléments
1

de surface dont l’union redonne la surface qui borde V . On obtient donc la


formule de Gauss-Ostrogradski, ou du flux, ou de la divergence
J J
div w = (w|dN (∂Ψ)),
V S

qui exprime que le flux du champ vectoriel w à travers la surface S bordant


V est égal à l’intégrale sur V de la divergence de w.

15.9 Bords, cycles, cobords et cocycles


La formulation du théorème de Stokes-Cartan suggère l’introduction des
classes suivantes de k-chaı̂nes et de k-formes. Soit E ⊂ Rn un ouvert et
k ≥ 0, l ≥ 0 des entiers.
620 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE

Définition. On dit que la k-chaı̂ne Φ dans E est un k-bord dans E de classe


C l s’il existe une (k+1)-chaı̂ne Ψ dans E de classe C l telle que

Φ = ∂Ψ.

Un k-bord est donc une k-chaı̂ne égale au bord d’une (k+1)-chaı̂ne. Bien
entendu, le bord d’une (k+1)-chaı̂ne est un k-bord.
Définition. Si k ≥ 1, on dit que la k-chaı̂ne Φ dans E est un k-cycle dans
E si
∂Φ = O.
Un k-cycle est donc une k-chaı̂ne dont le bord est une forme linéaire
nulle. Ainsi, pour k ≥ 2, le bord ∂Φ d’une k-chaı̂ne est nécessairement un
(k-1)-cycle puisque ∂(∂Φ) = O. D’autre part, on verra plus loin que tout
cycle (c’est-à-dire tout chemin fermé) dans E est un 1-cycle, ce qui explique
la terminologie.
Soit en outre l ≥ 0 un entier.
Définition. Si k ≥ 1, on dit que la k-forme différentielle ω est un k-cobord
de classe C l sur E s’il existe une (k-1)-forme λ de classe C l+1 sur E telle que

ω = dλ.

On dit aussi dans ce cas que ω est exacte sur E.


Ainsi, toute 1-forme différentielle ω = w dx de classe C l sur un intervalle
E ⊂ R est un 1-cobord de classe C l sur E puisque, en désignant par W une
primitive de w sur E, on a nécessairement

dW = W $ dx = w dx = ω.

Lorsque n ≥ 2, les cobords sont des formes différentielles particulières, ainsi


que le montre la condition nécessaire suivante.
Proposition. Si k ≥ 1, l ≥ 1 et si ω est un k-cobord de classe C l sur E,
alors
dω = 0.
Démonstration. Par hypothèse, il existe une (k-1)-forme λ de classe C l+1
sur E telle que ω = dλ. Dès lors, par le théorème de Poincaré,

dω = d2 λ = 0.
15.9. BORDS, CYCLES, COBORDS ET COCYCLES 621

Cette propriété des k-cobords suggère la définition suivante.


Définition. On dit que la k-forme ω de classe C 1 sur E est un k-cocycle
sur E si
dω = 0.
On dit aussi dans ce cas que ω est fermée sur E.
Ainsi, tout k-cobord de classe C 1 au moins est un k-cocycle. Si k ≥ n,
toute k-forme différentielle de classe C 1 est un k-cocycle.
Appliqué aux bords, cycles, cobords et cocycles, le théorème de Stokes-
Cartan conduit à des propriétés intéressantes.
Proposition. Si k ≥ 1, ω est un k-cobord de classe C 1 sur E ⊂ Rn et Φ
un k-cycle sur E de classe C 2 (C 1 si k = 1), alors on a
J
ω = 0.
Φ
Démonstration. Par hypothèse, on a ω = dλ pour une (k-1)-forme
différentielle λ sur E, et dès lors, en utilisant le théorème de Stokes-Cartan,
on obtient J J J
ω= dλ = λ = 0,
Φ Φ ∂Φ
puisque Φ est un k-cycle.

Proposition. Si k ≥ 0, ω est un k-cocycle sur E ⊂ Rn et Φ un k-bord dans


E de classe C 2 (C 1 si k = 0), alors on a
J
ω = 0.
Φ
Démonstration. Par hypothèse, on a Φ = ∂Ψ pour une certaine (k+1)-
chaı̂ne Ψ dans E de classe C 2 (C 1 si k = 0). Dès lors, par le théorème de
Stokes-Cartan, il vient
J J J
ω= ω= dω = 0.
Φ ∂Ψ Ψ

Remarque. Comme tout k-bord est un k-cycle, on voit que l’intégrale


d’un k-cobord sur un k-bord sera également nulle. Il n’en est pas de même
de l’intégrale d’un k-cocycle sur un k-cycle, ainsi que le montre l’exemple
suivant. La 1-forme différentielle
x2 x1
ω= 2 dx1 − 2 dx2
x1 + x 2
2 x1 + x22
622 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE

est de classe C ∞ sur R2 \ {0} et on vérifie sans peine que dω = 0. ω est donc
un 1-cocycle sur R2 \ {0}. Mais, sur le 1-simplexe Φ dans R2 \ {0} défini par
Φ(u) = (cos 2πu, sin 2πu), est un 1-cycle dans R2 \ {0} (le vérifier) et l’on a
J J 1
ω= [(sin 2πu)(−2π sin 2πu) − (cos 2πu)(2π cos 2πu)]du = −2π /= 0.
Φ 0

Pour appliquer les deux propositions que nous venons de démontrer,


il faut disposer de caractérisations simples des objets que nous venons de
définir. Nous commencerons par donner une caractérisation des 1-cycles.
%
Proposition. Soit Φ = m i=1 Φ un chemin dans E ⊂ R de classe C par
i n l

morceaux (l ≥ 1.) Alors Φ est un 1-cycle de classe C dans E si et seulement


l

si
Φm (1) = Φ1 (0),
c’est-à-dire si et seulement si Φ est un cycle.
Démonstration. Soit f ∈ C(E, K) une 0-forme différentielle sur E. Alors,
par le résultat de l’exemple 1 qui suit le théorème de Stokes-Cartan, on a
J
f = f (Φm (1)) − f (Φ1 (0)).
∂Φ

Dès lors, si Φ est un cycle, on aura


J
f = 0,
∂Φ

quelle que soit la 0-forme différentielle f et Φ est un 1-cycle. Réciproque-


ment, si Φ est un 1-cycle, alors

f (Φm (1)) − f (Φ1 (0)) = 0,

pour tout f ∈ C(E, K), et en prenant successivement f = pk , 1 ≤ k ≤ n, on


obtient
Φmk (1) = Φk (0), 1 ≤ k ≤ n,
1

et Φ est un cycle.
La notion suivante aide à vérifier si certaines 1-chaı̂nes sont des 1-bords.
% %
Définition. Soient Φ = m k=1 Φ et Ψ =
k m
k=1 Ψ des cycles dans E ⊂ R
k n

de classe C par morceaux (l ≥ 1). On dit que Φ est homotope à Ψ dans E


l

s’il existe une 2-chaı̂ne


m
$
Θ= Θk
k=1
15.9. BORDS, CYCLES, COBORDS ET COCYCLES 623

dans E de classe C l telle que les conditions suivantes soient satisfaites :

Θk (·, 0) = Φk , Θk (·, 1) = Ψk , (1 ≤ k ≤ m),

Θk (1, ·) = Θk+1 (0, ·), (1 ≤ k ≤ m − 1),


Θm (1, ·) = Θ1 (0, ·).
En d’autres termes, pour chaque v ∈ [0, 1], Θ(·, v) est un cycle dans E
qui se réduit à Φ lorsque v = 0 et à Ψ lorsque v = 1. On peut donc visualiser
Θ comme une déformation continue de Φ en Ψ qui, à chaque étape de la
déformation, reste un cycle dans E. En changeant v en 1 − v, on vérifie sans
peine que si Φ est homotope dans E à Ψ, alors Ψ est homotope dans E à
Φ. La relation d’homotopie ainsi définie est donc une relation d’équivalence
entre cycles dans E formés d’un même nombre de 1-simplexes (ce qui peut
toujours être réalisé en rajoutant si nécessaire des 1-simplexes constants).
Proposition. Si Φ et Ψ sont des cycles de classe C l par morceaux homo-
topes dans E, alors
m
$
Φ−Ψ = [Φk − Ψk ] = ∂Θ
k=1

et Φ − Ψ est donc un 1-bord de classe C l dans E.


Démonstration. Soit ω une 1-forme différentielle dans E. On a
J m J
$ m $
$ 1
2 $ J
ω= ω= (−1) j+α
ω
∂Θ k=1 ∂ Θ
k
k=1 j=1 α=0 Θk,j,α

m $
$ 2 4J J 5
= (−1)j ω− ω .
k=1 j=1 Θk,j,0 Θk,j,1

Le fait que Φ et Ψ soient homotopes dans E peut s’écrire

Θk,1,1 = Θk+1,1,0 , (1 ≤ k ≤ m − 1),

Θm,1,1 = Θ1,1,0 ,
Θk,2,0 = Φk , Θk,2,1 = Ψk , (1 ≤ k ≤ m).
Dès lors,
J m 4J
$ J 5 m 4J
$ J 5
ω=− ω− ω + ω− ω
∂Θ k=1 Θk,1,0 Θk,1,1 k=1 Θk,2,0 Θk,2,1
624 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE
&m−1 J m J
' m 4J J 5
$ $ $
=− ω− ω + ω− ω
k=0 Θk+1,1,0 k=1 Θ
k,1,1
k=1 Φk Ψk
4J J 5 J
=− ω− ω + %m ω
Θ1,1,0 Θm,1,1 k=1
Φk −Ψk
J J
= %m ω= ω.
k=1
Φk −Ψk Φ−Ψ
Donc, ∂Θ = Φ − Ψ.
Dans les conditions de la Proposition précédente, on a donc, pour toute
1-forme différentielle ω dans E,
J J J
ω− ω= ω.
Φ Ψ ∂Θ

On en déduit aussitôt les résultats suivants.


Corollaire. Si Φ et Ψ sont des cycles dans E ⊂ Rn de classe C 2 homotopes
dans E, alors, pour tout 1-cocycle ω dans E, on a
J J
ω= ω.
Φ Ψ
En d’autres termes, l’intégrale de ω ne change pas pendant la déforma-
tion.
Corollaire. Si Φ est un cycle dans E de classe C 2 homotope à O et si ω
est un 1-cocycle dans E, alors
J
ω = 0.
Φ
Caractérisons maintenant quelques cas particuliers importants de co-
bords.
Proposition. Si E ⊂ Rn est un ouvert, la 1-forme différentielle
n
$
ω= wi dxi
i=1

est un 1-cobord sur E si et seulement s’il existe f ∈ C 1 (E, K) telle que

Di f = wi, 1 ≤ i ≤ n.

Démonstration. Il suffit d’expliciter la définition qui requiert l’existence


d’une 0-forme différentielle f sur E telle que ω = df.
15.9. BORDS, CYCLES, COBORDS ET COCYCLES 625

La caractérisation donnée par cette proposition s’exprime en langage


vectoriel en disant que le champ w (associé à ω) dérive sur E d’un potentiel
scalaire f . Les 1-cobords sur E sont donc les 1-formes différentielles sur E
associées aux champs sur E dérivant d’un potentiel scalaire. Dans le langage
%
des équations différentielles, le fait que ω = ni=1 wi dxi soit un 1-cobord sur
E équivaut à l’existence d’une solution de classe C 1 au système d’équations
aux dérivées partielles en l’inconnue f :
Dif (x) = wi(x), x ∈ E, 1 ≤ i ≤ n.
On sait que, pour n = 1, ce système, qui se réduit à l’équation différentielle
élémentaire
f $ (x) = w(x),
a toujours une solution. Il n’en est plus de même lorsque n ≥ 2.
Proposition. Si E ⊂ R3 est un ouvert et si w : E → R3 est un champ de
classe C m sur E, alors la 2-forme différentielle 7ωw
1
est un 2-cobord de classe
C sur E si et seulement s’il existe un champ l : E → R3 de classe C m+1
m

tel que
w = rot l.
Démonstration. 7ωw
1
est un 2-cobord de classe C m sur E si et seulement
%
s’il existe une 1-forme différentielle λ = 3i=1 li dxi de classe C m+1 sur E
telle que
7ωw 1
= dλ.
Comme
7dλ = ωrot
1
l,
notre résultat équivaut à
1
ωw = 7(7ωw
1
) = 7dλ = ωrot
1
l,

c’est-à-dire à
w = rot l
sur E.
La caractérisation donnée par cette proposition s’exprime en langage
vectoriel en disant que le champ w dérive sur E d’un potentiel vectoriel l.
En termes d’équations différentielles, le fait que 7ωw
1 est un 2-cobord sur E

correspond à l’existence d’une solution au système d’équations aux dérivées


partielles d’inconnue l
rot l(x) = w(x), x ∈ E.
Caractérisons quelques cas particuliers importants de cocycles.
626 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE

Proposition. Si E ⊂ Rn est ouvert, alors la 1-forme différentielle de classe


C 1 sur E
n
$
ω= wi dxi
i=1

est un 1-cocycle sur E si et seulement si, pour chaque 1 ≤ i < j ≤ n, on a

Di wj = Dj wi .

Démonstration. Il suffit évidemment de démontrer que la thèse équivaut


à dω = 0. On notera que les relations ci-dessus sont trivialement satisfaites
lorsque i = j et que, si elles sont satisfaites, elles le sont aussi pour 1 ≤ j <
i ≤ n. Il suffit en effet de permuter les indices i et j. Par ailleurs, on a
$
dω = (Diwj − Dj wi ) dxi ∧ dxj ,
1≤i<j≤n

et le second membre est l’écriture canonique de dω. La thèse en résulte


aussitôt.
%3
Proposition. Si E ⊂ R3 est ouvert, alors la 1-forme ωw 1
= i=1 wi dxi de
1
classe C sur E est un 1-cocycle sur E si et seulement si

rot w = 0.

Démonstration. On a en effet dω = 7ωrot


1
w et la thèse en résulte aussitôt.

En langage vectoriel, un champ w : E → R3 de classe C 1 tel que rot w =


0 est appelé un champ irrotationnel. Les 1-cocycles correspondent donc
naturellement aux champs irrotationnels.
Proposition. Si E ⊂ R3 est ouvert, alors la 2-forme 7ωw
1 de classe C 1 sur

E est un 2-cocycle sur E si et seulement si

div w = 0.

Démonstration. On a en effet d 7 ωw
1
= 7div w, et la thèse en résulte
aussitôt.
En langage vectoriel, un champ w : E → R3 de classe C 1 tel que
div w = 0 est appelé un champ indivergentiel ou solénoı̈dal. Les 1-cocycles
correspondent donc naturellement aux champs indivergentiels.
15.9. BORDS, CYCLES, COBORDS ET COCYCLES 627

On a vu plus haut que tout k-cobord de classe C 1 sur un ouvert E de Rn


était un k-cocycle sur E. L’exemple donné précédemment d’un 1-cocycle ω
dont l’intégrale sur un 1-cycle n’est pas nulle monte que la réciproque n’est
pas vraie puisque, si ω était un 1-cobord sur E, cette intégrale serait nulle.
On va voir cependant que si la géométrie de E est suffisamment simple
(en particulier si E = Rn ), tout k-cocycle sur E sera un k-cobord sur E.
Définition. On dit que E ⊂ Rn est étoilé s’il existe a ∈ E tel que pour tout
x ∈ E et pour tout t ∈ [0, 1], on a a + t(x − a) ∈ E.
Géométriquement, E est donc étoilé s’il contient un point a tel que, pour
tout point x de E, le segment de droite joignant a à x est contenu dans E.
Ainsi, Rn est étoilé mais, quel que soit b ∈ Rn , Rn \ {b} ne l’est pas puisque,
pour chaque a ∈ Rn \ {b}, le segment joignant a au symétrique de a par
rapport à b n’est pas contenu dans Rn \ {b}. Dans R, les ensembles étoilés
sont les intervalles et les singletons. Une classe importante d’ensembles étoi-
lés est fournie par les ensembles convexes.
Définition. On dit que E ⊂ Rn est convexe si, pour tout a ∈ E, tout x ∈ E
et tout t ∈ [0, 1], on a a + t(x − a) ∈ E.
Géométriquement, un ensemble est convexe s’il contient le segment de
droite joignant deux quelconques de ses points. Ainsi, les boules dans Rn
sont convexes.
Le résultat suivant, qui s’appelle la réciproque du théorème de Poin-
caré, montre que si E est étoilé, tout k-cocycle sur E est un k-cobord sur
E. Nous le démontrerons séparément pour les 1-formes et pour les k-formes
(k ≥ 2).
Théorème. Si E ⊂ Rn est un ouvert étoilé, tout 1-cocycle ω sur E est un
1-cobord de classe C 1 sur E.
Démonstration. Il faut donc prouver l’existence d’une 0-forme différen-
%
tielle f ∈ C 2 (E, K) telle que ω = df , ou encore, si ω = ni=1 wi dxi, telle
que
Dif = wi , 1 ≤ i ≤ n. (15.7)
Pour motiver la construction de f notons tout d’abord que, pour tout f ∈
C 1 (E, K), si a est l’élément intervenant dans la définition de l’ensemble étoilé
E, on a, par le théorème fondamental du calcul différentiel et intégral et le
théorème de dérivation des fonctions composées
J 1 d
f (x) = f (a) + [f (a + t(x − a))] dt
0 dt
628 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE
 
J 1 n
$
= f (a) +  Dj f (a + t(x − a))(xj − aj ) dt,
0 j=1

quel que soit x ∈ E. Dès lors, si l’on note en outre qu’une fonction f vérifiant
les conditions (15.7) n’est évidemment définie qu’à une constante additive
près, il est naturel de prendre pour candidat la fonction f définie en chaque
x ∈ E par l’intégrale
 
J 1 n
$
f (x) =  wj (a + t(x − a))(xj − aj ) dt.
0 j=1

Comme l’intégrand est une fonction de classe C 1 en tous ses arguments, il


est facile de vérifier que les conditions de la formule de Leibniz de dérivation
sous le signe intégral sont satisfaites. Dès lors, f est de classe C 1 sur E et,
pour chaque x ∈ E et chaque 1 ≤ i ≤ n, on a, en utilisant successivement
la règle de Leibniz, le théorème de dérivation d’un produit, le théorème
de dérivation des fonctions composées, la caractérisation des 1-cocycles en
termes des dérivées croisées et le théorème fondamental du calcul différentiel
et intégral
 
J 1 n
$
Di f (x) = D xi  wj (a + t(x − a))(xj − aj ) dt
0 j=1

J n
1$
= {(xj − aj )Dxi [wj (a + t(x − a))] + wj (a + t(x − a))δij } dt
0 j=1
 
J 1 $
n 
= [(xj − aj )tDi wj (a + t(x − a))] + wi (a + t(x − a)) dt
0  
j=1
 
J 1  $
n 
= t [(xj − aj )Dj wi (a + t(x − a))] + wi (a + t(x − a)) dt
0  
j=1
J 1U d
V
= t [wi(a + t(x − a))] + wi (a + t(x − a)) dt
0 dt
J 1 d
= [twi(a + t(x − a))] dt = wi(x).
0 dt
Comme les wi sont de classe C 1 sur E, on en déduit également que f est de
classe C 2 sur E et la démonstration est complète.
15.9. BORDS, CYCLES, COBORDS ET COCYCLES 629

Exemple. Si n = 3, le théorème précédent exprime, en langage vectoriel,


que si w est un champ de classe C 1 et irrotationnel sur l’ensemble étoilé
E ⊂ R3 , alors w dérive d’un potentiel scalaire f de classe C 2 sur E. Ainsi,
tout champ de classe C 1 et irrotationnel sur R3 dérive d’un potentiel scalaire.
Une conséquence immédiate du théorème de Stokes-Cartan et de la réci-
proque du théorème de Poincaré est la suivante.
Corollaire. Si E ⊂ Rn est un ouvert étoilé, alors, pour tout k-cocycle ω
sur E et tout k-cycle Φ de classe C 2 (C 1 si k = 1) dans E, on a
J
ω = 0.
Φ

Une autre conséquence immédiate est la suivante: si E est étoilé, l’inté-


grale d’un 1-cocycle sur E sur un chemin dans E de classe C 1 par morceaux
ne dépend que des extrémités du chemin, et non du chemin lui-même. Ce
résultat possède une intéressante réciproque.
Proposition. Soit E ⊂ Rn un ouvert étoilé et ω une 1-forme différentielle
sur E telle que J J
ω= ω
Φ Ψ
%m %r
pour tous les chemins Φ = k=1 Φk et Ψ = j=1 Ψj dans E de classe C 1
par morceaux vérifiant les conditions

Φ1 (0) = Ψ1 (0), Φm (1) = Ψr (1).

Alors, ω est un 1-cobord sur E.


Démonstration. Pour chaque x ∈ E et chaque y ∈ E tel que le segment
de droite
[x, y] = {x + u(y − x) : u ∈ [0, 1]}
soit contenu dans E, définissons le 1-simplexe ∆[x,y] dans E par

∆[x,y](u) = x + u(y − x).

Soit a ∈ E le point intervenant dans la définition d’ensemble étoilé. Si


%
ω = ni=1 wi dxi , définissons la fonction W : E → K par
J J n
1$
W (x) = ω= wi (a + u(x − a))(xi − ai ) du.
∆[a,x] 0 i=1
630 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE

Soit x ∈ E, r > 0 tel que B2 [x; r] ⊂ E, 1 ≤ j ≤ n et h ∈ [−r, r] \ {0} fixés.


Considérons la 1-chaı̂ne Φ dans E de classe C 1 par morceaux définie par

Φ = ∆[a,x] + ∆[x,x+hej ] .

C’est un chemin dans E de classe C 1 par morceaux qui a la même origine a


et la même extrémité x + hej que ∆[a,x+hej ] . Dès lors, par l’hypothèse,
J J J J
W (x + hej ) = ω= ω= ω+ ω
∆[a,x+hej ] Φ ∆[a,x] ∆[x,x+hej ]

J n
1$ J 1
= W (x) + wi (x + uhej )heji du = W (x) + h wj (x + uhej ) du.
0 i=1 0

Dès lors, par les propriétés des fonctions définies par une intégrale, on trouve
aussitôt
J 1
−1
lim h [W (x + he ) − W (x)] = lim
j
wj (x + uhej ) du
h→0 h→0 0
J 1
= wj (x) du = wj (x).
0
Par conséquent, la 0-forme W est de classe C 1 sur E et telle que dW = ω,
ce qui montre que ω est un 1-cobord sur E.
La démonstration de la réciproque du théorème de Poincaré pour
les k-formes différentielles avec k ≥ 2, procède d’une idée semblable à
celle utilisée pour k = 1, mais les détails techniques sont nettement plus
compliqués; en outre, sa conclusion est un peu plus faible en ce qui concerne
la régularité de la (k-1)-forme différentielle obtenue.
Théorème. Soit E ⊂ Rn un ouvert étoilé et ω un k-cocycle de classe C r
sur E (r ≥ 1, k ≥ 2). Alors ω est un k-cobord de classe C r sur E.
Démonstration. Pour alléger les notations, nous supposerons que a = 0
dans la définition d’ensemble étoilé. Soit
[l [l−1
I : C r (E, (Rn , K)) → C r (E, (Rn , K))
définie par
I(η) =
$ l
$ 4J 1 5
(−1)m−1 #
tl−1 ei1 ,...,il (t·) dt pim dxi1 ∧. . .∧ dx im ∧. . . dxil ,
1≤i1 <...<il ≤n m=1 0
15.9. BORDS, CYCLES, COBORDS ET COCYCLES 631

si $
η= ei1 ,...,il dxi1 ∧ . . . ∧ dxil ,
1≤i1 <...<il ≤n

#
où dx im signifie comme d’habitude que le terme correspondant manque dans
le produit extérieur, où, pour chaque t ∈ [0, 1], ei1,...,il (t·) est l’application
de E dans K donnée par x → ei1 ,...,il (tx), et où pim désigne l’application
projection sur la ieme
m coordonnée. Nous allons montrer que, pour toute
k-forme différentielle ω de classe C 1 sur E, on a

ω = I(dω) + d(I(ω)).

Dès lors, si ω est un k-cocycle de classe C r sur E, cela impliquera, puisque


par construction I(0) = 0, que ω = d(I(ω)), c’est-à-dire que ω est un k-
cobord de classe C r sur E.
%
Soit donc ω = I∈C(n,k) wIdxI une k-forme différentielle de classe C r
% %
sur E. Alors, dω = ni=1 I∈C(n,k) Di wI dxi ∧ dxI, et

n
$ $ 2J 1
I(dω) = tk Di wI(t·) dt)pidxI
i=1 1≤i1 <...<ik ≤n 0

k 4J 5 -
$ 1
+ (−1) m #
t DiwI (t·) dt pim dxi ∧ dxi1 ∧ . . . ∧ dx
k
im ∧ . . . ∧ dxik
m=1 0

$ n 4J
$ 1 5
= t Di wI(t·) dt pi dxI
k
0
I∈C(n,k) i=1

$ n $
$ k 4J 1 5
− (−1)m−1 tk Di wI(t·) dt pim
1≤i1 <...<ik ≤n i=1 m=1 0

#
dxi ∧ dxi1 ∧ . . . ∧ dx im ∧ . . . ∧ dxik .

Par ailleurs, en utilisant la règle de Leibniz de dérivation sous le signe intégral


et la règle de dérivation des fonctions composées, il vient

d(I(ω))

$ k
$ 24J 1 5 3
= (−1) m−1
d k−1
t #
wI(t·) dt pim ∧dxi1 ∧. . . dx im ∧. . .∧dxik
0
I∈C(n,k) m=1
632 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE

$ k
$ n 24J
$ 1 5
= (−1) m−1 k−1
t Di wI(t·)t dt pim
0
I∈C(n,k) m=1 i=1

4J 1 5 3
+ k−1
t #
wI(t.)dt δim i dxi ∧ dxi1 ∧ . . . dx im ∧ . . . dxik =
0

$ n $
$ k 4J 1 5
(−1)m−1 #
tk DiwI (t·) dt pim dxi ∧dxi1 ∧. . . dx im ∧. . . dxik
0
I∈C(n,k) i=1 m=1

$ k
$ 4J 1 5
+ (−1)m−1 #
tk−1 wI(t·)dt dxim ∧ dxi1 ∧ . . . dx im ∧ . . . dxik =
0
I∈C(n,k) m=1

$ n $
$ k 4J 1 5
(−1)m−1 #
tk DiwI (t·) dt pim dxi ∧dxi1 ∧. . . dx im ∧. . . dxik
0
I∈C(n,k) i=1 m=1

$ 4J 1 5
+k wI(t·) dt dxI.
0
I∈C(n,k)

En conséquence,
I(dω) + d(I(ω))

$ n 4J
$ 1 5 $ 4J 1 5
tk DiwI (t·) dt pi dxI + ktk−1 wI (t·) dt dxI
0 0
I∈C(n,k) i=1 I∈C(n,k)

$ 4J 1 5 $
d k
= (t wI(t·)) dt dxI = wI dxI = ω.
0 dt
I∈C(n,k) I∈C(n,k)

Exemple. En langage vectoriel, le théorème précédent entraı̂ne que si E est


un ouvert étoilé de R3 et w un champ indivergentiel sur E, alors w dérive
sur E d’un potentiel vectoriel.
Remarque. Si ω est un k-cobord sur E ⊂ Rn , toute (k-1)-forme diffé-
rentielle λ de classe C 1 sur E telle que ω = dλ est appelée une primitive
extérieure de ω sur E. Il n’y a bien entendu pas unicité de la primitive
extérieure puisque, si η est un k-cocycle sur E, λ + η est également une
primitive extérieure de ω sur E. On a là une situation analogue à celle qui
se présente pour la primitivation des fonctions de R dans R.
15.10. EXERCICES 633

15.10 Exercices
H
1. Soit Γ : [a, b] → Rn une fonction dérivable. Montrer que $
[a,b] |Γ |2 existe
si et seulement si l’ensemble
; m
<
$
VΓ = |Γ(ak ) − Γ(ak−1 )|2 : a = a0 < a1 < . . . < am = b
k=1

est majoré, auquel cas J


|Γ$ |2 = sup VΓ.
[a,b]

Suggestion. Comme Γ$ est intégrable sur [a, b], l’hypothèse équivaut à la


L-intégrabilité de Γ sur [a, b]. Il suffit alors d’utiliser la condition nécessaire
et suffisante de L-intégrabilité du Chapitre 10 et le théorème fondamental
du calcul différentiel et intégral. Une fonction Γ telle que VΓ soit majoré est
appelée une fonction à variation bornée sur [a, b] et sup VΓ est sa variation
sur [a, b].
2. Soient f et ϕ des champs scalaires et g et γ des champs vectoriels de
classe C 1 sur un ouvert E de R3 . En utilisant la formule de différentiation
extérieure d’un produit extérieur de deux formes différentielles et la notion
de forme différentielle associée à un champ scalaire ou à un champ vectoriel
dans R3 , démontrer les formules suivantes de l’analyse vectorielle

grad (f ϕ) = ϕgrad f + f grad ϕ,

rot (f g) = grad f ∧ g + f rot g,

div (f g) = (grad f |g) + f div g,

div (g ∧ γ) = (rot g|γ) − (g|rot γ).


3. Soit u une k-forme extérieure dans Rn et A ∈ Rn . La (k − 1)-forme
extérieure iA u est définie par

iA u(h1 , . . . , hk−1 ) = u(A, h1 , . . . , hk−1).

Soit ω une k-forme différentielle dans un ouvert E ⊂ Rn et g un champ de


vecteurs sur E. Si ω et g sont de classe C 1 sur E, on définit la dérivée de
Lie de ω relativement à g comme étant la k-forme différentielle dans E

Lg ω = ig dω + d(ig ω).
634 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE

Montrer que, dans le cas d’une 0-forme et celui d’une 1-forme associée à un
champ vectoriel, cette notion généralise la dérivée de Lie d’un champ scalaire
et d’un champ vectoriel. Montrer aussi que les ω et g sont de classe C 2 , alors
dLg ω = Lg dω.
4. Soit g un difféomorphisme de Rn (dont les éléments sont notés x) sur Rn
(dont les éléments sont notés y), h = g −1 , γ une 1-forme dans Rn et λ la
1-forme dans Rn définie par

λ = d(y|h) − h∗ γ.

Montrer que si γ est exacte sur Rn , avec γ = df, où f : Rn → R, est de


classe C 2 , alors λ = df ∗ , où f ∗ : Rn → R est la transformée de Legendre de
f définie par
f ∗ (y) = (y|h(y)) − f (h(y)).
Comme
ω = df ⇔ y = g(x) = grad f (x), (x ∈ Rn ),
γ = df ∗ ⇔ x = h(y) = grad f ∗ (y), (y ∈ Rn ),
on voit que grad f ∗ ◦ grad f = I. La transformée de Legendre joue un grand
rôle en mécanique et en thermodynamique.
5. Etant donné un gaz, p sa pression et v son volume, on appelle, en ther-
modynamique, état du gaz tout point (v, p) ∈ R2 , transformation réversible
tout chemin dans R2 de classe C 1 par morceaux et cycle tout cycle dans R2
de classe C 1 par morceaux. On introduit la 1-forme travail τ = −p dv et
la 1-forme quantité de chaleur κ = M dv + N dp. Le premier principe de la
thermodynamique affirme que, pour tout cycle Γ dans R2 , on a
J
(τ + κ) = 0.
Γ

Montrer que ce premier principe est équivalent à l’une des assertions suivan-
tes :
1. τ + κ est fermée sur R2 .
2. τ + κ est exacte sur R2 .
En particulier, il existera une fonction E : R2 → R de classe C 1 telle
que τ + κ = dE. E est appelée l’énergie interne du gaz. Montrer qu’on
a nécessairement
Dp M − Dv N = 1.
Le deuxième principe de la thermodynamique des phénomènes réversibles
affirme l’existence d’une fonction continue T : R2 → R telle que la 1-forme
15.10. EXERCICES 635

1
Tκ soit exacte. Il existera donc une fonction S : R2 → R de classe C 1 telle
que
κ = T dS.
S est appelée l’entropie du gaz. Montrer qu’on a nécessairement

T = M Dp T − N Dv T.

Si l’on suppose que la relation t = T (v, p) peut s’écrire sous les formes
équivalentes v = V (t, p) ou p = P (v, t), on peut utiliser la notion de trans-
formée d’une forme différentielle pour exprimer les 1-formes τ, κ et T1 κ en
terme des variables (v, t) ou (t, p).
6. Soit
r : Rn → R, x 2→ |x|2 ,
ω = dx1 ∧ . . . ∧ dxn ,
n
$
ω$ = Z ∧ . . . ∧ dx .
(−1)j−1 xj dx1 ∧ . . . dx j n
j=1

Montrer que dω $ = nω et que, sur Rn \ {0}, on a dr ∧ ω $ = rω. Si λ = r −n ω $ ,


montrer que λ est fermée sur Rn \ {0}.
7. Soit
 
3
$
ω= Ej dxj  ∧ dx4 + B1 dx2 ∧ dx3 + B2 dx3 ∧ dx1 + B3 dx1 ∧ dx2 ,
j=1

une 2-forme de classe C 1 dans R4 . Montrer que 7dω = 0 si et seulement si

rot E + D4 B = 0, div B = 0,

et que d 7 ω = 0 si et seulement si

rot B + D4 E = 0, div E = 0,

où E et B sont considérés comme les champs vectoriels sur R3 de com-


posantes respectives (E1 , E2 , E3), (B1 , B2 , B3 ) considérés comme fonctions
de (x1 , x2 , x3 ) et dépendant du paramètre x4 . On reconnaı̂t la structure
des équations de Maxwell de l’électrodynamique. L’expression la plus satis-
faisante des équations de Maxwell dans le langage des formes différentielles
s’obtient à partir d’une notion d’adjointe de Hodge construite sur la métrique
de Lorentz de l’espace-temps au lieu de la métrique euclidienne considérée
ici.
636 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE

8. Soient u et v des fonctions de Rn dans R. Montrer que si u et v sont de


classe C 1 sur un ouvert E ⊂ Rn , alors
du ∧ 7dv = 7du ∧ dv = (grad u|grad v)dx1 ∧ . . . ∧ dxn .
Si Φ est un n-simplexe dans E de classe C 2 , on définit l’intégrale de Dirichlet
de u et v sur Φ par J
D(u, v) = du ∧ 7dv.
Φ
On a donc J
D(u, v) = (grad u|grad v).
Φ(U n )

Montrer que si v est de classe C 2 sur E, alors


J J J
u 7 dv = D(u, v) + u∆vdx1 ∧ . . . ∧ dxn = D(u, v) + u∆v,
∂Φ Φ Φ(U n )
%
où ∆u = nj=1 Djj
2 v est le laplacien de v. En déduire que, si u et v sont de

classe C sur E, on a la formule de Green


2
J J
(u 7 dv − v 7 du) = (u∆v − v∆u).
∂Φ Φ(U n )

Cette formule joue un rôle important en théorie du potentiel.


9. Un ouvert E de Rn est dit contractile s’il existe a ∈ E et une application
γ : E × [0, 1] → E,
de classe telle que γ(., 0) = a et γ(., 1) soit l’identité sur E. Montrer
C2
qu’un ouvert étoilé est contractile. Généraliser la réciproque du théorème de
Poincaré pour les 1-formes au cas d’un ouvert contractile.
10. Désignons les coordonnées de R2n par (p1 , . . . , pn , q1 , . . . , qn ). Soit la
%
1-forme γ = nj=1 pj dqj dans R2n et
n
$
σ = dγ = dpj ∧ dqj
j=1

sa différentielle extérieure. σ est donc un 2-cocycle dans R2n , appelé forme


symplectique. Montrer que (pour n facteurs)
n(n−1)
σ ∧ σ ∧ . . . ∧ σ = n!(−1) 2 dp1 ∧ . . . dpn ∧ dq1 ∧ . . . ∧ dqn .
Une transformation g : R2n → R2n est dite canonique si g ∗ σ = σ. En utilisant
la relation précédente, montrer que si g est canonique, alors la forme volume
ω = dp1 ∧ . . . ∧ dpn ∧ dq1 ∧ . . . ∧ dqn de R2n est invariante sous l’action de g,
c’est-à-dire que g ∗ ω = ω.
15.11. PETITE ANTHOLOGIE 637

15.11 Petite anthologie


Si X, Y, Z sont des fonctions des coordonnées rectangulaires x, y, z, dS un
élément d’une surface limitée, l, m, n les cosinus des inclinaisons de la norme
en dS sur les axes, ds un élément de la courbe bordant la surface, montrer
que J J U V
dZ dY dX dY dY dX
l( − ) + m( − ) + n( − ) dS
dy dz dz dx dx dy
J 4 5
dx dy dz
= X +Y +Z ds,
ds ds ds
les coefficients différentiels de X, Y, Z étaient partiels, et l’intégrale simple
étant prise sur le périmètre de la surface.
Georges Stokes, 1854
Soient x1 , x2 , . . . , xn n variables indépendantes et soient X1 , X2 , . . . , Xn
n fonctions de ces n variables; il est aisé de définir l’intégrale simple
J
(X1 dx1 + X2 dx2 + . . . Xn dxn ).

En effet, introduisons une variable auxiliaire et posons


x1 = ϕ1 (u), x2 = ϕ2 (u), . . ., xn = ϕn (u).
Ces équations définiront le chemin d’intégration. Nous ferons varier u depuis
u0 jusqu’à u1 . Nous poserons
x01 = ϕ1 (u0 ), . . . , x0n = ϕn (u0 ), x11 = ϕ1 (u1 ), . . . , x1n = ϕn (u1 ).
Les deux systèmes de valeurs (x01 , x02 , . . . , x0n ) et (x11 , x12 , . . . , x1n) définiront
les deux points extrêmes de ce chemin d’intégration. Alors l’intégrale ci-
dessus prise le long du chemin d’intégration ainsi défini depuis le point
(x01 , x02 , . . . , x0n ) jusqu’au point (x11 , x12 , . . . , x1n ) ne sera autre chose que l’in-
tégrale définie
J u1 4 5
dx1 dx1 dxn
X1 + X2 + . . . Xn du.
u0 du du du
Nous chercherons les conditions d’intégrabilité, c’est-à-dire les conditions
pour que cette intégrale soit indépendante du chemin d’intégration, c’est-à-
dire ne dépende que des deux points extrêmes de ce chemin (x01 , x02 , . . . , x0n) et
n(n−1)
(x11 , x12 , . . . , x1n ). Ces conditions sont au nombre de 2 et elles s’écrivent
dXi dXk
= .
dxk dxi
638 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE

Passons maintenant au cas général. Désignons par la notation (Xi, Xk )


diverses fonctions données de ces n variables. Nous supposerons que l’on a
(Xi, Xi) = 0, (Xk , Xi) = −(Xi , Xk ). Nous allons envisager l’intégrale double
J J $
J= (Xi, Xk ) dxidxk

% n(n−1)
où l’on fait entrer sous le signe les 2 combinaisons des deux indices
i et k. . . . Les conditions d’intégrabilité sont

d(Xi, Xk ) d(Xk , Xh) d(Xh , Xi)


+ + = 0.
dxh dxi dxk

Il faut prendre pour le système des trois nombres (i, h, k) toutes les combi-
naisons possibles, en excluant celles où deux des lettres seraient identiques et
en ne regardant pas comme distinctes celles qui ne diffèrent que par l’ordre
des lettres.. . . Qu’arrive-t-il si l’on passe aux intégrales d’ordre supérieur ?
On trouvera des conditions tout à fait analogues aux conditions ci-dessus
et l’on rencontrera encore le fait suivant. Pour les conditions relatives aux
intégrales d’ordre pair, tous les termes seront précédés du signe +; pour les
conditions relatives aux intégrales d’ordre impair, les termes seront alterna-
tivement précédés des signes + et -.

Henri Poincaré, 1887

Soient Li1 i2 ...ir des fonctions de points dans un hyperespace Sn définies


et continues avec leurs derivées premières et telles que toute transposition
des indices change seulement le signe. Considérons les formes
r+1
$ ∂Li1 i2 ...is−1 is+1 ...ir+1
Mi1 i2 ...ir = (−1)s−1 .
s=1
∂xis

Nous désignons par Sr la frontière d’un hyperespace Sr+1 de dimension r + 1


ouvert et immergé dans Sr ; par αi1 i2 ...ir+1 les cosinus directeurs de Sr+1 et
par βi1 i2 ...ir ceux de Sr . L’extension du théorème de Stokes consiste en la
formule suivante :
J $ J $
Mi1 i2 ...ir+1 dSr+1 = Li1 i2 ...ir βi1 i2 ...ir dSr .
Sr+1 i Sr i

Vito Volterra, 1889


15.11. PETITE ANTHOLOGIE 639

Cela posé, je vais définir l’intégrale suivante


J $
Xα1 ,α2 ,...,αm dxα1 dxα2 . . . dxαm .

Les différentielles dxα1 , dxα2 , . . . , dxαn sont m quelconques des n différenti-


elles dx1 , dx2, . . . , dxn . Les fonctions Xα1,α2 ,...,αm sont des fonctions données
de x1 , x2 , . . . , xn et il y en a autant qu’il y a de combinaisons possibles des
indices α1 , α2 , . . . , αm , c’est-à-dire qu’il y a de combinaisons de n lettres m
à m. Il faut convenir que la fonction X est nulle si deux de ses indices sont
égaux et qu’elle change de signe quand on permute deux de ses indices. Cela
posé, l’intégrale ci-dessus sera, par définition, égale à l’intégrale d’ordre m
J $
∂(xα1 , xα2 , . . . , xαm )
Xα1 ,α2 ,...,αm dy1 , dy2 , . . . , dym .
∂(y1 , y2 , . . ., ym )
Cette définition laisse toutefois subsister encore une ambiguı̈té. En effet, si
l’on permute deux des lettres y1 et y2 , l’intégrale change de signe; il importe
donc de se donner l’ordre de ces lettres et la permutation de deux de ces
lettres équivaudrait à un changement du sens de l’intégration dans l’étude
des intégrales simples. Je dirai donc le sens de l’intégration pour parler
de l’ordre dans lequel on convient de ranger les lettres y1 , y2 , . . . , ym . J’ai
recherché en 1887 dans quels cas les conditions d’intégrabilité sont remplies,
c’est-à-dire dans quels cas l’intégrale ci-dessus est nulle toutes les fois qu’elle
s’applique à une variété fermée. Voici ce que j’ai trouvé; écrivons pour
abréger l’écriture (α1 , α2 , . . . , αm) au lieu de Xα1 ,α2 ,...,αm et [αp ] au lieu de
xαp . Nos conditions d’intégrabilité s’écriront

d(α1 , α2 , . . . , αm ) d(α2 , α3 , . . . , αm−1 ) d(α3 , α4 , . . . , αm−2 )


± ±
d[αm+1 ] d[α1 ] d[α2 ]
d(αm+1 , α1 , α2 , . . . , αm−1 )
±...± = 0.
d[αm ]
Voici la loi suivant laquelle doivent être choisis les signes ±. On prendra
toujours le signe + si m est pair, et alternativement le signe + et le signe -
si m est impair.
Henri Poincaré, 1895
De même et plus généralement soit
J $
A dω
640 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE

une expression intégrale d’ordre p; . . . nous supposons cette intégrale étendue


à une variété fermée quelconque d’ordre p; un théorème analogue à celui de
Stokes nous apprendra alors qu’elle peut être transformée en une intégrale
d’ordre p + 1 étendue à une variété quelconque, fermée ou non, d’ordre p + 1.
L’intégrale transformée s’écrit
J $$
dA
± dxk dω.
k
dxk

On prend toujours le signe + si p est pair et alternativement le signe + et


le signe - si p est impair.

Henri Poincaré, 1899

Etant données n variables x1 , x2 , . . . , xn, considérons des expressions ω,


purement symboliques, se déduisant, au moyen d’un nombre fini de signes
d’addition ou de multiplication, des n différentielles dx1 , dx2 , . . . , dxn et de
certains coefficients fonctions de x1 , x2 , . . . , xn ; ces expressions étant, dans
le sens ordinaire du mot, homogènes en dx1 , dx2 , . . . , dxn. Comme elles sont
purement symboliques, nous nous astreindrons, toutes les fois qu’il y aura un
signe d’addition ou de multiplication, à ne pas changer l’ordre des termes
ou des facteurs réunis par ce signe. . . . Les expressions différentielles du
premier degré s’appellent encore expressions de Pfaff; elles sont de la forme
analogue à la suivante :

A2 dx2 + A1 dx1 + . . . .

Comme exemples d’expressions de degrés supérieurs, on peut avoir les sui-


vantes :
A1 dx2 dx1 + A2 dx3 dx2 ,
(A1 dx1 + A2 dx2 )(B1 dx1 dx2 + B2 dx2 dx1 ) + Cdx1 dx2 dx1 . . . .
Pour définir, par convention, la valeur d’une expression différentielle ω,
de degré h par exemple, nous considérerons x1 , x2 , . . ., xn comme des fonc-
tions de h paramètres indéterminés α1 , α2 , . . . , αh supposés rangés dans un
certain ordre que nous appellerons l’ordre naturel. Cela étant, on considère
toutes les h! permutations des lettres α1 , α2 , . . . , αh . Soit (β1 , β2, . . . , βh)
une de ces permutations. A cette permutation, on fait correspondre la valeur
que prend, d’après les règles ordinaires du calcul, l’expression ω, lorsqu’on y
remplace les différentielles qui occupent le 1er , 2e , . . . , he rang respectivement
par les dérivées correspondantes prises par rapport à β1 , β2, . . . , βh. On fait
15.11. PETITE ANTHOLOGIE 641

précéder la quantité ainsi déterminée du signe + ou du signe -, suivant que


la permutation (β1 , β2, . . . , βh) présente un nombre pair ou un nombre im-
pair d’inversions. La somme algébrique des h! quantités ainsi obtenues est,
par définition, la valeur de l’expression différentielle donnée.. . .
De ce qui précède, il résulte que l’on peut toujours mettre une expression
différentielle quelconque sous la forme d’une expression polynôme, chaque
monôme de cette dernière expression ne contenant pas de différentielles iden-
tiques et les différentielles qu’il contient étant rangées par ordre d’indices
croissantes. Nous disons que dans ces conditions l’expression est réduite à
sa forme la plus simple. . . .
Considérons un produit (symbolique) ω d’expressions différentielles

ω1 , ω2 , . . ., ωm .

Soit ω = ω1 ω2 . . . ωm . Imaginons que nous intervertissions deux des facteurs


de ce produit, ωµ , ων , supposés d’ordre h et k, et supposons que ces deux fac-
teurs soient séparés par un ou plusieurs autres facteurs megaρ de degré total
p. . . . L’expression différentielle ω est alors multipliée par (−1)hk+(h+k)p . . . .
Imaginons qu’on fasse sur x1 , x2 , . . . , xn un changement de variables
en prenant pour nouvelles variables n fonctions indépendantes y1 , y2 , . . . , yn
de x1 , x2 , . . . , xn . Alors réciproquement x1 , x2 , . . ., xn sont des fonctions in-
dépendantes de y1 , y2 , . . . , yn . Cela étant, remplaçons dans une expression
différentielle ω en x1 , x2 , . . ., xn les anciennes variables par les nouvelles et
les différentielles dx1 , dx2 , . . . , dxn par

∂x1 ∂x1 ∂x1


dy1 + dy2 + . . . + dyn ,
∂y1 ∂y2 ∂yn
...
∂xn ∂xn ∂xn
dy1 + dy2 + . . . + dyn .
∂y1 ∂y2 ∂yn
Nous obtiendrons ainsi une certaines expression différentielle - de même
degré en y1 , y2 , . . . , yn et dans laquelle chaque différentielle dy aura le même
rang que la différentielle dx qui l’a fournie avait dans ω. . . . Il résulte
immédiatement de là que, si les expressions ω1 , ω2 , . . . , ωm se transforment,
par le changement de variables, en -1 , -2 , . . . , -m, l’expression

ω = ω1 ω2 . . . ωm

se transforme en - = -1 -2 . . . -m . . . .
642 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE

Etant donnée une expression de Pfaff à n variables

ω = A1 dx1 + A2 dx2 + . . . + An dxn ,

on appelle expression dérivée l’expression différentielle du deuxième degré


définie par l’égalité

ω $ = dA1 dx1 + dA2 dx2 + . . . + dAn dxn .

La propriété fondamentale de cette dérivée est la suivante :


Théorème.- Si un changement de variables transforme l’expression de
Pfaff ω en une expression -, ce même changement de variables transforme
l’expression dérivée ω $ dans l’expression dérivée -$ . . . .
Supposons que l’expression de Pfaff ω soit une différentielle exacte. Il
est clair alors que, par un changement de variables, elle peut se mettre sous
la forme - = dy1 . Or la dérivée de - est ici identiquement nulle, puisque
les coefficients des différentielles sont des constantes; il en résulte donc que
ω $ est également nulle. La dérivée d’une expression de Pfaff différentielle
exacte est donc identiquement nulle.

Elie Cartan, 1899


H
Prenons une variété quelconque Mp−1 ; l’intégrale ω $ étendue à cette
variété Mp−1 est égale, d’après la formule de Stokes généralisée, à l’intégrale
H
ω, étendue à la variété fermée à p dimensions Mp$ qui limite Mp .

Edouard Goursat, 1917


Chapitre 16

Analyse complexe

16.1 Intégrale sur une courbe


Soit C un arc de courbe simple dans C, c’est-à-dire l’image Γ(U ) d’une
application
Γ : U = [0, 1] → C, t 2→ Γ(t) = Γ1 (t) + iΓ2 (t)
continue sur U, injective sur [0, 1[ et telle que Γ(0) = Γ(1), ou injective sur
U . Soit f une fonction de C dans C définie sur C. Dans le cas particulier où
C est le segment de droite [c, d] joignant c ∈ C à d ∈ C avec sa représentation
canonique Σ : U → C, t 2→ c + t(d − c), l’introduction d’une intégrale de f
sur [c, d] analogue à l’intégrale d’une fonction réelle sur un intervalle fermé
conduit à la considération de “sommes de Riemann” du type
m
$
f (z j )(cj − cj−1 )
j=1

où l’on a découpé [c, d] en m sous-segments adjacents [cj−1 , cj ], avec c0 =


c, cm = d, et où chaque z j appartient à [cj−1 , cj ]. En termes de la représen-
tation paramétrique Σ, on a donc
z j = Σ(tj ), cj = Σ(aj ), 1 ≤ j ≤ m,
A B
pour une P-partition Π = (tj , ]aj−1 , aj ]) 1≤j≤m de ]0, 1] telle que a0 =
0, am = 1. L’extension au cas d’un arc de courbe quelconque C de représen-
tation paramétrique Γ conduit à la considération de “sommes de Riemann”
du type
m
$ 8 9
SC (Γ, f, Π) = f (Γ(tj )) Γ(aj ) − Γ(aj−1 )
j=1

643
644 CHAPITRE 16. ANALYSE COMPLEXE
A B
où Π = (tj , ]aj−1 , aj ]) 1≤j≤m est une P-partition de ]0, 1] telle que a0 =
0, am = 1, et à la définition suivante d’intégrabilité.
Définition. On dit que f est C−intégrable sur l’arc de courbe C de repré-
sentation paramétrique Γ s’il existe J ∈ C ayant la propriété suivante: pour
tout ! > 0, il existe une jauge δ sur U telle que pour toute P-partition δ-fine
Π de ]0, 1], on ait
|SC(Γ, f, Π) − J| ≤ !.

On montre aussitôt qu’il peut exister au plus un tel J, on le note


J J
f dΓ ou f (z) dz
C CΓ

pour rappeler son mode de construction, et on l’appelle l’intégrale de f sur


l’arc de courbe C de représentation paramétrique Γ. Une fois encore, on
peut construire à partir de cette définition une théorie de l’intégration ana-
logue à celle développée pour une fonction réelle d’une variable réelle. Nous
nous contenterons ici de montrer que, sous des hypothèses de régularité con-
venables pour f et Γ, cette intégrale se ramène à l’intégrale usuelle sur U
d’une fonction à valeurs complexes faisant intervenir f, Γ et Γ$ . Pour mo-
tiver l’introduction de cette fonction, il suffit, une fois encore, de supposer
Γ dérivable et d’appliquer, dans l’expression de la somme de Riemann, le
théorème de Lagrange à ses composantes Γk , k = 1, 2. On obtient ainsi
m
$ 8 9
SC (Γ, f, Π) = f (Γ(tj )) Γ(aj ) − Γ(aj−1 )
j=1

m
$ D E
= f (Γ(tj )) Γ1 (aj ) − Γ1 (aj−1 ) + i(Γ2 (aj ) − Γ2 (aj−1 ))
j=1

m
$ D E
= f (Γ(tj )) Γ$1 (tj1 ) + iΓ$2 (tj2 ) (aj − aj−1 ),
j=1

j j
pour des t1 et t2 appartenant à ]aj−1 , aj [, 1 ≤ j ≤ m. Si, dans cette dernière
expression, on remplace les tjk par tj , 1 ≤ j ≤ m, 1 ≤ k ≤ 2, on obtient la
somme de Riemann usuelle
m
$ D E
f (Γ(tj )) Γ$1 (tj ) + iΓ$2 (tj ) (aj − aj−1 )
j=1
16.2. FONCTIONS HOLOMORPHES, THÉORÈME DE CAUCHY 645

m
$
= f (Γ(tj ))Γ$ (tj )(aj − aj−1 ) = S(]0, 1], (f ◦ Γ)Γ$ , Π)
j=1

associée à l’application (f ◦ Γ)Γ$ de U dans C et à la P-partition Π de ]0, 1].


On peut alors démontrer, comme dans le cas de l’intégrale sur un arc de
courbe, le résultat suivant.
Proposition. Si f est bornée sur C et si Γ est de classe C 1 , les intégrales
J J 1
f (z)dz et (f ◦ Γ)Γ$
CΓ 0

existent simultanément et sont égales.


Notons maintenant que la dernière intégrale peut encore s’écrire
J 1 J 1
(f ◦ Γ)(Γ$1 + iΓ$2 ) = (f ◦ Γ)Γ$1 + (if ◦ Γ)Γ$2 ,
0 0
H
et est donc égale, si l’on suppose f continue sur C, à l’intégrale Γ ωf sur le
1-simplexe Γ dans R2 ≈ C de la 1-forme différentielle complexe ωf définie
par
ωf = f dx1 + if dx2 .
Si l’on définit alors la 1-forme différentielle dz par

dz = dx1 + idx2 ,

(différentielle extérieure de l’application


H
(x1 , x2 ) → x1 + ix2 de R2 dans C),
on voit que l’étude de l’intégrale CΓ f (z)dz d’une fonction complexe continue
f sur l’arc de courbe C dans C de représentation
H
paramétrique Γ de classe
C 1 se ramène à l’étude de l’intégrale Γ f dz de la 1-forme différentielle dans
R2 ≈ C, f dz = f dx1 + if dx2 = ωf sur le 1-simplexe HΓ dans R2 ≈ C.
Lorsque
H
cela simplifiera l’écriture, on se permettra d’écrire Γ f (z) dz au lieu
de Γ f dz.

16.2 Fonctions holomorphes, théorème de Cauchy


Soit E ⊂ C un ouvert et f = f1 + if2 une fonction de C dans C de classe
C 1 sur E (c’est-à-dire, rappelons-le, telle que D1 f et D2 f existent et soient
continues sur E). Alors, la 1-forme ωf = f dz associée à f est de classe C 1
sur E.
646 CHAPITRE 16. ANALYSE COMPLEXE

Proposition. Soit E ⊂ C ouvert et f : E → C de classe C 1 . Alors ωf =


f dz est un 1-cocycle sur E si et seulement si les relations de Cauchy-Riemann
1
D1 f = D2 f
i
sont satisfaites.
Démonstration. On a

d(f dz) = d(f dx1 + if dx2 ) = df ∧ dx1 + d(if ) ∧ dx2 =


4 5
1
D2 f dx2 ∧ dx1 + iD1 f dx1 ∧ dx2 = i D1 f − D2 f dx1 ∧ dx2 ,
i
et la thèse en résulte aussitôt.
Cette Proposition suggère l’introduction d’une classe importante de fonc-
tions de C dans C.
Définition. Si E ⊂ C est un ouvert non vide et f une fonction de C dans
C, on dit que f est continûment C-dérivable ou holomorphe sur E si f est
C-dérivable en chaque point de E et si la fonction C-dérivée f $ est continue
sur E.
Ainsi, tout polynôme de C dans C est holomorphe sur C, toute fonction
rationnelle de C dans C est holomorphe sur le complémentaire des zéros de
son dénominateur et la somme d’une série entière est holomorphe sur son
disque de convergence.
Donnons une caractérisation des fonctions holomorphes.
Proposition. Si E ⊂ C est un ouvert non vide et f une fonction de C dans
C, alors f est holomorphe sur E si et seulement si la 1-forme différentielle
ωf = f dz est un 1-cocycle de classe C 1 sur E.
Démonstration. Si f est holomorphe sur E, alors, par la caractérisation
de Fréchet-Young des fonctions C-dérivables et la Proposition qui précède,
on voit que ωf est un 1-cocycle de classe C 1 sur E. Réciproquement, si ωf est
un 1-cocycle de classe C 1 sur E, alors f est de classe C 1 sur E et vérifie, en
vertu de la Proposition précédente, les conditions de Cauchy-Riemann. La
caractérisation de Fréchet-Young des fonctions C-dérivables entraı̂ne qu’elle
est C-dérivable en chaque point de E et que

f $ = D1 f

sur E. Donc f $ est continue sur E et f y est holomorphe.


16.2. FONCTIONS HOLOMORPHES, THÉORÈME DE CAUCHY 647

Il est intéressant de caractériser les fonctions f pour lesquelles ωf est un


1-cobord sur E.
Proposition. Soit E ⊂ C un ouvert non vide et f une fonction de C dans
C continue sur E. Alors f dz est un 1-cobord sur E si et seulement s’il existe
une fonction g de C dans C holomorphe sur E et telle que

f = g $.

Démonstration. Par définition, f dz est un 1-cobord sur E si et seulement


s’il existe une 0-forme sur E, c’est-à-dire une application g : E → C de classe
C 1 telle que

f dx1 + if dx2 = f dz = dg = D1 g dx1 + D2 g dx2 .

Les écritures étant canoniques, cela équivaut à


1
D1 g = f = D2 g,
i
c’est-à-dire à l’holomorphie de g sur E.
Cette Proposition conduit naturellement à la définition suivante.
Définition. Soit E ⊂ C un ouvert non vide et f une fonction de C dans
C continue sur E. On dit que f est C-primitivable sur E s’il existe une
fonction g de C dans C holomorphe sur E et telle que f = g $ sur E. Une
telle fonction g est appelée une C-primitive de f sur E.
Les fonctions f pour lesquelles les 1-formes différentielles f dz sont des
1-cobords sur E sont donc les fonctions C-primitivables sur E.
Ainsi, pour tout entier n ≥ 2, la fonction f : z 2→ z −n est C-primitivable
sur C\{0} puisque z −n = (1−n)−1 (z 1−n )$ . Par contre, la fonction f : z 2→ 1z ,
holomorphe sur C \ {0}, n’y est pas C-primitivable. En effet, sur le 1-cycle
Γ : [0, 1] → C, t 2→ exp 2iπt (dont l’image est le cercle unité), on a
J J
dz 1 2iπ exp 2iπt
= dt = 2iπ /= 0,
Γ z 0 exp 2iπt

alors que cette intégrale serait nulle si 1/z était C-primitivable sur C \ {0},
puisqu’alors ω1/z serait un 1-cobord sur C \ {0}.
La réciproque du théorème de Poincaré appliqué à f dz et les résultats
qui précèdent fournit une condition géométrique sur E pour qu’une fonction
holomorphe sur E y soit C-primitivable.
648 CHAPITRE 16. ANALYSE COMPLEXE

Corollaire. Si E ⊂ C est un ouvert étoilé non vide, toute fonction f de C


dans C holomorphe sur E y est C-primitivable.
Une conséquence importante des résultats du chapitre précédent sur
l’annulation de l’intégrale d’un cobord sur un cycle ou d’un cocycle sur un
bord fournissent deux versions légèrement différentes d’une propriété impor-
tante des fonctions holomorphes portant le nom de théorème de Cauchy.
Théorème. Si E ⊂ C est un ouvert étoilé non vide et f une fonction de C
dans C holomorphe sur E, alors pour tout 1-cycle Γ dans E de classe C 1 on
a J
f dz = 0.
Γ
Démonstration. Par la réciproque du théorème de Poincaré et le fait que
f dz soit un 1-cocycle, f dz est un 1-cobord sur E et le résultat s’ensuit.

Théorème. Si E ⊂ C est un ouvert non vide et f une fonction de C dans


C holomorphe sur E, alors pour tout 1-bord Γ dans E de classe C 2 on a
J
f dz = 0.
Γ

Démonstration. Immédiat puisque l’holomorphie de f entraı̂ne que f dz


est un 1-cocycle sur E.
Dans le même ordre d’idées, on a le résultat suivant pour les fonctions
C-primitivables.
Théorème. Si E ⊂ C est un ouvert non vide et f une fonction de C dans
C C-primitivable sur E, alors pour tout 1-cycle Γ dans E de classe C 1 on a
J
f dz = 0.
Γ

Démonstration. Immédiat puisque la C-primitivabilité de f entraı̂ne que


f dz est un 1-cobord sur E.

16.3 Résidus
Soit a ∈ C, V un voisinage ouvert de a et f une fonction de C dans C
holomorphe sur V \ {a}.
16.3. RÉSIDUS 649

Définition. On appelle résidu de f en a, et on note Rés(f ; a), le nombre


complexe J
1
Rés (f ; a) = f dz,
2iπ Σa,r
où r > 0 est tel que B2 [a; r] ⊂ V et où

Σa,r : [0, 1] → C, t 2→ a + r exp 2iπt

est le 1-simplexe représentation canonique du cercle de centre a et de rayon


r dans C.
Pour justifier cette définition, il faut encore montrer que l’intégrale du
membre de droite ne dépend pas du choix de r > 0 dès que la condition
B2 [a; r] ⊂ V est réalisée. Cela résulte aussitôt de la Proposition suivante.
Proposition. Dans les conditions de la définition ci-dessus, si 0 < r1 < r2
sont tels que B2 [a; r2] ⊂ V, on a
J J
f dz = f dz.
Σa,r1 Σa,r2

Démonstration. Soit

A[a; r1 , r2] = {z ∈ C : r1 ≤ |z − a| ≤ r2 }

l’anneau de centre a et de rayons r1 et r2 dans C ≈ R2 . Si l’on définit le


2-simplexe Θa,r1 ,r2 : U 2 → C par

Θa,r1 ,r2 (u1 , u2 ) = a + [r1 + u2 (r2 − r1 )] exp 2iπu1 ,

on voit facilement que

Θ(·, 0) = Σa,r1 , Θ(·, 1) = Σa,r2 ,

et dès lors Σa,r1 et Σa,r2 sont homotopes dans V \ {a} ⊃ A[a; r1, r2 ]. Comme
f dz est un 1-cocycle dans A[a; r1, r2 ], la thèse découle d’un résultat connu.
Une conséquence immédiate de la définition est que, pour tout c ∈ C, on
a Rés(cf ; a) = cRés(f ; a).
Nous aurons besoin dans ce qui suit d’un résultat de nature purement
technique. Si m ≥ 2 est un entier, nous désignerons par Σm a,r une 1-chaı̂ne
formée de m 1-simplexes dont l’image est le cercle dans C de centre a et de
rayon r et telle que
Σma,r = Σa,r
650 CHAPITRE 16. ANALYSE COMPLEXE

On pourra prendre par exemple

a,r = Σa,r + {a + r} + . . . + {a + r}
Σm

où {a + r} désigne le 1-simplexe constant t 2→ a + r, ou bien


m
$
a,r =
Σm Σj,a,r
j=1

où
Σj,a,r : U → C, t 2→ a + r exp[2iπ(j − 1 + t)/m], 1 ≤ j ≤ m.
Le résidu de f en a peut donc se calculer en remplaçant Σa,r par Σm a,r . Il
peut aussi se calculer en remplaçant Σa,r par un cycle Φ dans V \ {a} de
classe C 2 par morceaux homotope dans V \ {a} à Σm a,r . On dit qu’un tel Φ
entoure une fois le point a.
Donnons quelques exemples de calcul de résidu.
Proposition. Si V est un voisinage ouvert de a ∈ C et f une fonction de
C dans C holomorphe sur V \ {a} et telle que

lim (z − a)f (z) = b,


z→a,z(=a

alors
Rés(f ; a) = b.
Démonstration. Pour tout r > 0 tel que B2 [a; r] ⊂ V, on a
J J
1 1
Rés(f ; a) = f dz = f (a + r exp(2iπt))r exp(2iπt) dt =
2iπ Σa,r 0

2J 1 3
lim f (a + r exp(2iπt))r exp(2iπt) dt ,
r→0, r>0 0

puisque le premier membre ne dépend pas du r > 0 suffisamment petit choisi.


En utilisant le théorème sur la limite des valeurs d’une fonction définie par
une intégrale, dont il est facile de vérifier les hypothèse, on obtient
J 1 2 3 J 1
Rés(f ; a) = lim f (a + r exp(2iπt))r exp(2iπt) dt = b dt = b.
0 r→0, r>0 0
16.4. REPRÉSENTATION INTÉGRALE 651

Corollaire. Si V est un voisinage ouvert de a ∈ C et f une fonction de C


dans C holomorphe sur V \ {a} et localement bornée en a, alors

Rés(f ; a) = 0.

C’est en particulier le cas si limz→a,z(=a f (z) existe ou si f est holomorphe


sur V .
Démonstration. On a en effet dans ce cas

lim (z − a)f (z) = 0.


z→a, z(=a

En particulier, on a 4 5
1
Rés ; a = 1.
z−a
Proposition. Si V est un voisinage ouvert de a ∈ C et f une fonction de
C dans C holomorphe et C-primitivable sur V \ {a}, alors

Rés(f ; a) = 0.

Démonstration. Les hypothèses entraı̂nent que f dz est un 1-cobord sur


V \ {a}.
En particulier, pour tout entier k ≥ 2, on a

1 d 1
= ,
(z − a)k dz (1 − k)(z − a)k−1

et la fonction z 2→ 1
(1−k)(z−a)k−1
est holomorphe sur C \ {a}. Donc,
4 5
1
Rés ; a = 0, k ≥ 2.
(z − a)k

16.4 Représentation intégrale


Une conséquence importante de la notion de résidu est la formule de
représentation intégrale d’une fonction holomorphe due à Augustin
Cauchy.
652 CHAPITRE 16. ANALYSE COMPLEXE

Théorème. Soit E ⊂ C un ouvert non vide et f une fonction de C dans C


holomorphe sur E. Alors, pour tout a ∈ E, tout r > 0 tel que B2 [a; r] ⊂ E
%
et tout cycle Φ = m l=1 Φ dans E \{a} de classe C par morceaux homotope
l 2

dans E \ {a} à Σa,r , on a


m

J
1 f (z)
f (a) = dz.
2iπ Φ z − a
Démonstration. Soit g la fonction de C dans C définie par
f (z)
g(z) = .
z−a
Par les propriétés élémentaires de la C−dérivabilité, g est holomorphe sur
E \ {a} et telle que
lim (z − a)g(z) = f (a).
z→a
En conséquence, en vertu des propriétés et des résultats de calcul du résidu,
on a
J J J
1 f (z) 1 1
dz = g dz = g dz = Rés(g; a) = f (a).
2iπ Φ z − a 2iπ Φ 2iπ Σm a,r

La formule de Cauchy fournit une représentation d’une fonction holomor-


phe par une fonction définie par une intégrale. Elle montre que les valeurs
d’une fonction holomorphe à l’intérieur d’un contour fermé sont entièrement
déterminées par les valeurs de la fonction sur le seul contour.
Le résultat suivant fournit une classe intéressante de cycles auxquels le
résultat précédent peut être appliqué.
Lemme. Soient a ∈ C, r > 0, b ∈ B2 (a; r) et ρ > 0 tel que B2 [b; ρ] ⊂
B2 [a; r]. Alors, Σb,ρ et Σa,r sont homotopes dans B2 [a; r] \ {b}.
Démonstration. Soit Θ : U 2 → C le 2-simplexe défini par
Θ(u1 , u2 ) = (1 − u2 )[b + ρ exp(2iπu1 )] + u2 [a + r exp(2iπu1)].
C’est un cycle de classe C ∞ tel que
Θ(·, 0) = Σb,ρ , Θ(·, 1) = Σa,r .
D’autre part, Θ(u) /= b pour tout u ∈ U 2 et
|Θ(u) − a|2 ≤ (1 − u2 )|b + ρ exp(2iπu1) − a|2 + u2 r
≤ (1 − u2 )r + u2 r = r,
ce qui montre que Θ(U 2 ) ⊂ B2 [a; r] et achève la démonstration.
16.4. REPRÉSENTATION INTÉGRALE 653

Corollaire. Dans les conditions de la formule de représentation intégrale


de Cauchy, on a, pour tout w ∈ B2 (a; r),
J
1 f (z)
f (w) = dz.
2iπ Σa,r z − w
Démonstration. Soit w ∈ B2 (a; r); il existe donc ρ > 0 tel que B2 [w; ρ] ⊂
B2 [a; r] ⊂ E. En appliquant la formule de représentation intégrale à w, ρ et
Σw,ρ , on obtient
J
1 f (z)
f (w) = dz.
2iπ Σw,ρ z − w
Mais, par le Lemme ci-dessus, Σw,ρ et Σa,r sont homotopes dans B2 [a; r] \
{w}, ce qui entraı̂ne
J J
f (z) f (z)
dz = dz,
Σw,ρ z − w Σa,r z − w
et achève la démonstration.
Nous allons voir que la formule de représentation intégrale de Cauchy
a comme conséquence surprenante que l’holomorphie d’une fonction sur un
ouvert, c’est-à-dire essentiellement sa C-dérivabilité première, entraı̂ne son
indéfinie C-dérivabilité sur cet ouvert, phénomène qui n’a évidemment pas
d’équivalent pour la dérivabilité ordinaire. Nous aurons besoin pour ce faire
d’un résultat préliminaire.
Lemme. Soit f une fonction de C dans C C-dérivable sur un ouvert non
vide E ⊂ C et de classe C ∞ (comme fonction de R2 dans R2 ) sur E. Alors
f est indéfiniment (continûment) C-dérivable sur E.
Démonstration. Par hypothèse, on a, pour tout z ∈ E, en vertu des
conditions de Cauchy-Riemann,
1
D1 f (z) = D2 f (z) = f $ (z).
i
Dès lors f est de classe C sur E et, en vertu des identités qui précèdent
$ ∞

et du théorème de Schwarz, on a
1 1 1
D1 f $ (z) = D1 D2 f (z) = D2 D1 f (z) = D2 f $ (z).
i i i
Les conditions de Cauchy-Riemann sont donc satisfaites pour f $ et les dé-
rivées partielles correspondantes sont continues. Donc f $ est totalement
dérivable sur E et y vérifie les conditions de Cauchy-Riemann, ce qui entraı̂ne
sa C-dérivabilité sur E. En appliquant le même raisonnement à partir de f $ ,
on obtient la C-dérivabilité de f $$ , et ainsi de suite.
654 CHAPITRE 16. ANALYSE COMPLEXE

Proposition. Soit f une fonction de C dans C holomorphe sur l’ouvert non


vide E ⊂ C. Alors, pour chaque a ∈ E et chaque entier k ≥ 0, la C-dérivée
ke
dk f
f (k) (a) = k (a)
dz
existe et, pour tout r > 0 tel que B2 [a; r] ⊂ E, on a
J
k! f (z)
f (k) (a) = dz.
2iπ Σa,r (z − a)k+1
Démonstration. Soit a ∈ E et r > 0 tel que B2 [a; r] ⊂ E,. En vertu
du Corollaire de la formule de représentation de Cauchy, on a, pour tout
w = w1 + iw2 ∈ B2 (a; r),
J
1 f (z)
f (w) = dz
2iπ Σa,r z − w
J J
1 f (a + r exp(2iπt)) r exp(2iπt) 1
= dt = h(w1 , w2, t) dt.
0 a + r exp(2iπt) − (w1 + iw2 ) 0
Considérée comme fonction de w1 et w2 , f est donc égale sur B2 (a; r) à une
fonction définie par l’intégrale d’une fonction h qui est indéfiniment dérivable
par rapport à w1 et w2 et continue sur B2 (a; r) × R. On en déduit aisément
que les conditions du théorème de Leibniz de dérivation sous le signe intégral
sont satisfaites pour tous les ordres de dérivation par rapport à w1 et w2 ; on
en déduit que f est de classe C ∞ sur B2 (a; r), et donc sur E puisque a ∈ E
est arbitraire. Dès lors, par le Lemme qui précède, f sera indéfiniment C-
dérivable sur E et, en appliquant la règle de Leibniz, on trouvera pour tout
w ∈ B2 (a; r),
2J 1 3 J 1
f (k) (w) = D1k h(w1 , w2, t) dt = D1k h(w1 , w2, t) dt
0 0
J J
1k!f (a + r exp(2iπt))r exp(2iπt) k! f (z)
= dt = dz;
0 [a + r exp(2iπt) − (w 1 + iw 2 )] k+1 2iπ Σa,r (z − w)k+1
le résultat s’en déduit aussitôt en prenant w = a.
On obtient ainsi, pour les C-dérivées successives d’une fonction holomor-
phe, des formules de représentation intégrale ne faisant intervenir que la
valeur de la fonction.
Donnons deux conséquences simples mais intéressantes de la formule
de représentation des C-dérivées. La première fournit les inégalités de
Cauchy.
16.5. THÉORÈME DE TAYLOR ET FONCTIONS ANALYTIQUES 655

Corollaire. Si f est une fonction de C dans C holomorphe sur un ouvert


non vide E ⊂ C, alors, pour tout a ∈ E, tout entier k ≥ 0 et tout r > 0 tel
que B2 [a; r] ⊂ E, on a
k! Mf (r; a)
|f (k) (a)| ≤ ,
rk
où
Mf (r; a) = max |f (z)|.
|z−a|=r
Démonstration. En vertu de la formule de représentation ci-dessus, on a
# #
# k! J f (z) #
# #
|f (k)
(a)| = # dz #
# 2iπ Σa,r (z − a)k+1 #
J 1 |f (a + r exp(2iπt)|r k! Mf (r; a)
≤ k! k+1
dt ≤ .
0 r rk

La deuxième conséquence porte le nom de théorème de Liouville.


Corollaire. Si f est une fonction de C dans C holomorphe et bornée sur
C, alors f est constante sur C.
Démonstration. Soit M > 0 tel que |f (z)| ≤ M pour tout z ∈ C, et soit
a ∈ C. Alors, quel que soit r > 0, on a, en vertu du Corollaire précédent et
des relations de Cauchy-Riemann,
Mf (r; a) M
|D1 f (a)| = |D2 f (a)| = |f $ (a)| ≤ ≤ ,
r r
ce qui entraı̂ne l’annulation des dérivées en faisant tendre r vers l’infini.
L’inégalité de la moyenne entraı̂ne aussitôt que f est constante sur C.

16.5 Théorème de Taylor et fonctions analytiques


On a vu au Chapitre 12 que la somme d’une série entière est une fonction
indéfiniment C-dérivable à l’intérieur de son disque de convergence. Nous al-
lons démontrer une réciproque partielle de ce résultat: une fonction complexe
holomorphe sur un ouvert E ⊂ C peut s’écrire, au voisinage de chaque point
de E, comme somme d’une série entière convergeant dans un certain disque
ouvert centré au point considéré. Ce résultat porte le nom de théorème
de Taylor pour rappeler que le mode de construction des coefficients de
cette série entière est identique à celui apparaissant dans le développement
de Taylor d’une fonction réelle d’une variable réelle.
656 CHAPITRE 16. ANALYSE COMPLEXE

Théorème. Soit f une fonction de C dans C holomorphe sur un ouvert non


vide E ⊂ C. Soit a ∈ E et
ra = sup{r > 0 : B2 (a; r) ⊂ E}.
Alors, pour tout z ∈ B2 (a; ra) (z ∈ C si ra = +∞), on a

$ f (k) (a)
f (z) = (z − a)k ,
k=0
k!

la série entière du second membre convergeant absolument dans B2 (a; ra) et


uniformément dans B2 [a; r] pour tout r ∈ ]0, ra[.
Démonstration. Soit w ∈ B2 (a; ra) et soit r ∈ ]0, ra[ tel que w ∈
B2 [a; r] (r = (1/2)(|w − a| + ra) par exemple). Par le Corollaire du théorème
de représentation intégrale des fonctions holomorphes, on a,
J
1 f (z)
f (w) = dz.
2iπ Σa,r z − w
Comme, pour tout z ∈ fr B2 (a; r) = Σa,r (U ), on a
# #
#w − a# |w − a| |w − a|
#
# z − a # = |z − a| =
# < 1,
r
on obtient, en utilisant la formule de la somme d’une série géométrique
convergente,
4 5−1 ,
∞ 4 5-
f (z) f (z) f (z) w−a f (z) $ w−a k
= = 1− = .
z−w z − a − (w − a) z−a z−a z − a k=0 z − a

Introduisant cette expression dans la représentation intégrale de f (w) donnée


plus haut, on obtient
J ∞ 4
, 5 -
1 f (z) $ w−a k
f (w) = dz
2iπ Σa,r z − a k=0 z − a
J ∞
1$ (w − a)k
= f (a + r exp(2iπt)) dt.
0 k=0 r k exp(2iπkt)
Pour pouvoir permuter les signes intégrale et série dans cette expression, il
suffit de montrer que la série (de fonctions de t) converge uniformément sur
[0, 1]. On a
# #
# (w − a)k ## |w − a|k
#
#f (a + r exp(2iπt)) k # ≤ Mf (r; a) .
# r exp(2iπkt) # rk
16.5. THÉORÈME DE TAYLOR ET FONCTIONS ANALYTIQUES 657

%
Comme |w − a|/r < 1, la série numérique k∈N(|w − a|/r)k converge et le
test de Weierstrass entraı̂ne la convergence normale sur [0, 1] de la série

$ (w − a)k
f (a + r exp(2iπt)) .
k=0
r k exp(2iπkt)

Par conséquent,
∞ J
$ 1 (w − a)k
f (w) = f (a + r exp(2iπt)) dt
k=0 0
r k exp(2iπkt)
∞ 2J 3
$ 1 r exp(2iπt)
= (w − a)k f (a + r exp(2iπt)) dt
k=0 0 r k+1 exp(2iπ(k + 1)t)
∞ J ∞
$ 1 f (z) $ f (k) (a)
= (w − a)k dz = (w − a)k ,
k=0
2iπ Σa,r (z − a)k+1 k=0
k!
où, pour obtenir le dernier terme, on a utilisé la formule de représentation
intégrale des C-dérivées successives d’une fonction holomorphe. La série
entière du membre de droite étant convergente (puisqu’égale à f (w)) pour
tout w ∈ B2 (a; ra), son rayon de convergence sera supérieur ou égal à ra . Les
propriétés de convergence absolue et uniforme d’une série entière fournissent
alors les résultats de convergence annoncés.
L’unicité de la représentation de f comme série entière résulte de la
Proposition suivante.
Proposition. Soit f une fonction de C dans C holomorphe dans un ouvert
non vide E ⊂ C, soit a ∈ E et ra donné par le théorème de Taylor. S’il
%
existe une série entière k∈N ak (z − a)k de rayon de convergence au moins
égal à ra et telle que, pour tout z ∈ B2 (a; ra), on ait

$
f (z) = ak (z − a)k ,
k=0

alors, pour chaque k ∈ N, on a


f (k) (a)
. ak =
k!
Démonstration. Par le théorème de Taylor et l’hypothèse, on a, pour
tout z ∈ B2 (a; ra),

& '
$ f (k) (a)
0= ak − (z − a)k ,
k=0
k!
658 CHAPITRE 16. ANALYSE COMPLEXE

ce qui montre que la série entière du membre de droite converge au moins


dans B2 (a; ra) et y représente la fonction holomorphe nulle. En particulier,
en faisant z = a, on trouve a0 = f (a). En outre, les séries dérivées successives
de la série du membre de droite représentent dans le même disque les C-
dérivées successives de la fonction nulle, c’est-à-dire la fonction nulle. On a
donc, pour chaque entier m ≥ 1,

& '
$ f (k) (a)
0= (k − m + 1)(k − m + 2) . . .(k − 1)k ak − (z − a)k−m ,
k=m
k!

ce qui entraı̂ne, en y faisant z = a,


& '
f (m) (a)
0 = m! am − ,
m!

et achève la démonstration.
Le développement de f (z) en série entière s’appelle la série de Taylor de
f au voisinage de a ou autour de a.
Cette propriété suggère la définition suivante.
Définition. Soit K = R ou C, E ⊂ K un ouvert non vide et f une fonction
de K dans K. On dit que f est analytique sur E si, pour chaque a ∈ E,
il existe un voisinage V de a contenu dans E et une série entière (réelle si
%
K = R) k∈N ak (z − a)k telle que, pour tout z ∈ V , on ait

$
f (z) = ak (z − a)k .
k=0

Le résultat suivant montre, pour les fonctions complexes d’une variable


complexe, l’identité entre les fonctions holomorphes et les fonctions analy-
tiques.
Proposition. Si E ⊂ C est un ouvert non vide, alors f est analytique sur
E si et seulement si f est holomorphe sur E.
Démonstration. Condition nécessaire. Si f est analytique sur E et si
a ∈ E, il existe un voisinage Va de a tel que, sur ce voisinage, f soit égale
à la somme d’une série entière. Par les propriétés des séries entières, f sera
donc continûment C-dérivable, et donc holomorphe sur Va. En conséquence,
f est holomorphe sur E = ∪a∈E Va.
Condition suffisante. C’est une conséquence immédiate du théorème de
Taylor.
16.6. POINTS SINGULIERS ISOLÉS ET THÉORÈME DE LAURENT659

16.6 Points singuliers isolés et théorème de Lau-


rent
Si a ∈ C et si 0 < r1 < r2 sont donnés, appelons anneau ouvert de centre a
et de rayons r1 et r2 l’ensemble

A(a; r1, r2 ) = {z ∈ C : r1 < |z − a| < r2 }.

On vérifie sans peine que A(a; r1, r2) = int A[a; r1, r2].
Nous commencerons par donner, pour une fonction holomorphe sur un
anneau, une extension du théorème de Taylor, appelée théorème de Laurent.
Sa démonstration requiert le lemme suivant.
Lemme. Soit A(a; r1 , r2) un anneau ouvert, b ∈ A(a; r1, r2) et f une fonc-
tion de C dans C holomorphe sur A(a; r1, r2 ) \ {b} et continue en b. Pour
tout 0 < r1 < ρ1 ≤ ρ2 < r2 , on a
J J
f dz = f dz.
Σa,ρ1 Σa,ρ2

Démonstration. Définissons la fonction g sur ]r1 , r2[ par


J J 1
g(r) = f dz = 2iπr f (a + r exp(2iπt)) exp(2iπt) dt.
Σa,r 0

Puisque f est continue sur A(a; r1, r2 ), il résulte du théorème sur la continuité
des fonctions définies par une intégrale que g est une fonction de R dans C
continue sur ]r1 , r2 [. D’autre part, si l’on pose r3 = |b − a|, f est, par
hypothèse, holomorphe sur A(a; r1, r3 ) et sur A(a; r3, r2). Dès lors g doit
être constante sur ]r1 , r3 [ et constante sur ]r3 , r2[. Comme elle est continue
sur ]r1 , r2[, elle doit y être constante, et la démonstration est complète.
Remarque. Le Lemme ci-dessus s’étend sans peine au cas où f est holomor-
phe sur A(a; r1, r2 ) à l’exception d’un nombre fini de points de A(a; r1, r2).
Nous pouvons maintenant énoncer et démontrer le théorème de Lau-
rent.
Théorème. Soit A(a; r1 , r2) un anneau ouvert de C et f une fonction de C
dans C holomorphe sur A(a; r1, r2 ). Alors, pour tout z ∈ A(a; r1, r2), on a

f (z) = fr (z) + fp (z),


660 CHAPITRE 16. ANALYSE COMPLEXE

où ∞ ∞
$ $
fr (z) = ck (z − a)k , fp (z) = c−k (z − a)−k ,
k=0 k=1
J
1 f (z)
ck = dz, k ∈ Z, ρ ∈ ]r1 , r2[.
2iπ Σa,ρ (z − a)k+1
En outre, fr est holomorphe sur B2 (a; r2) et fp est holomorphe sur C \
B2 [a; r1].
Démonstration. On notera tout d’abord que, suite à l’holomorphie sur
A(a; r1, r2 ) des fonctions
f (z)
z 2→ , k ∈ Z,
(z − a)k+1
la valeur des ck donnée par la formule ci-dessus ne dépend pas du choix de
ρ dans ]r1 , r2[, puisque deux Σa,ρ correspondant à des valeurs différentes de
ρ dans ]r1 , r2[ sont homotopes dans A(a; r1, r2). Soit w ∈ A(a; r1, r2 ) et g la
fonction de C dans C définie sur A(a; r1 , r2) par
f (z) − f (w)
g(z) = si z /= w, g(w) = f $ (w).
z−w
Il est clair que g est holomorphe sur A(a; r1, r2) \ {w} et continue au point
w. Dès lors, par le lemme précédent, on a
J 2 3 J 2 3
f (z) f (w) f (z) f (w)
− dz = − dz,
Σa,ρ1 z−w z−w Σa,ρ2 z − w z −w
c’est-à-dire,
&J J ' J J
dz dz f (z) f (z)
f (w) − = dz − dz.
Σa,ρ2 z −w Σa,ρ1 z − w Σa,ρ2 z−w Σa,ρ1 z − w

Mais, puisque la fonction z 2→ 1/(z − w) est holomorphe sur B2 (a; |w − a|) ⊃


B2 [a; ρ1], on a, par le théorème de Cauchy,
J
dz
= 0,
Σa,ρ1 z−w
tandis que, puisque w ∈ B2 (a; ρ2), on a, par le Corollaire de la formule de
représentation intégrale appliqué à la fonction constante 1,
J
1 dz
1= .
2iπ Σa,ρ2 z − w
16.6. POINTS SINGULIERS ISOLÉS ET THÉORÈME DE LAURENT661

Introduisant ces deux résultats dans la formule qui les précède, on obtient
une formule de représentation intégrale pour f
J J
1 f (z) 1 f (z)
f (w) = dz − dz.
2iπ Σa,ρ2 z − w 2iπ Σa,ρ1 z − w

Pour la première intégrale du membre de droite, on peut procéder exacte-


ment comme dans la démonstration du théorème de Taylor en écrivant

f (z) f (z) $ f (z)(w − a)k
= = ,
z−w z − a − (w − a) k=0 (z − a)k+1

ce qui entraı̂ne, avec les mêmes justifications,


J ∞
& J '
1 f (z) $ 1 f (z)
dz = dz (w − a)k
2iπ Σa,ρ2 z − w k=0
2iπ Σ a,ρ 2
(z − a) k+1


$
= ck (w − a)k ,
k=0

puisque la valeur des ck ne dépend pas du choix de ρ dans ]r1 , r2[. En ce qui
concerne la deuxième intégrale de la représentation, on a, puisque
# #
#z−a#
#
# w − a # < 1 pour tout z ∈ Σa,ρ1 (U ),
#

f (z) f (z) f (z)


− = =
z−w w − a − (z − a) (w − a)(1 − w−a )
z−a

∞ ∞
$ f (z)(z − a)k $ f (z)(z − a)k−1
= = .
k=0
(w − a)k+1 k=1
(w − a)k
0n a, en outre, pour z ∈ fr B2 [a; ρ1] et k ∈ N∗ ,
# # 4 5k−1
# f (z)(z − a)k−1 # |f (z)|ρk−1 Mf (ρ1 ; a) ρ1
# #
# # = 1
≤ .
# (w − a)k # |w − a|k |w − a| |w − a|

Comme |w − a| > ρ1 , le test de Weierstrass entraı̂ne que la série de fonctions


(de t)
$ f (a + ρ1 exp(2iπt))(ρ1 exp(2iπt))k−1(2iπρ1 exp(2iπt))

k∈N∗
(w − a)k
662 CHAPITRE 16. ANALYSE COMPLEXE

converge uniformément sur U et l’on peut permuter les signes série et inté-
grale. On obtient ainsi
J J ∞
1 f (z) 1 $ f (z)(z − a)k−1
− dz = dz
2iπ Σa,ρ1 z − w 2iπ Σa,ρ1 k=1 (w − a)k
J ∞
1$ f (a + ρ1 exp(2iπt))(ρ1 exp(2iπt))k−1(ρ1 exp(2iπt))
= dt
0 k=1
(w − a)k
∞ J 1
$ f (a + ρ1 exp(2iπt))(ρ1 exp(2iπt))k−1(ρ1 exp(2iπt))
= dt
k=1 0
(w − a)k
∞ J
$ 1 f (z)(z − a)k−1
= dz
k=1
2iπ Σa,ρ1 (w − a)k

& J ' ∞
$ 1 f (z) −k
$
= dz (w − a) = c−k (w − a)−k ,
k=1
2iπ Σa,ρ1 (z − a)1−k k=1
puisque la valeur de ck ne dépend pas du choix de ρ dans ]r1 , r2[. Enfin, la
série entière égale au premier terme de la représentation intégrale de f con-
verge pour tout w ∈ B2 (a; ρ2) quel que soit ρ2 < r2 , et dès lors converge dans
B2 (a; r2) où sa somme est holomorphe. De même, en remplaçant (w − a)−1
par v dans la série entière associée au deuxième membre de la représentation
%
intégrale de f , on voit que la série entière k∈N∗ c−k v k converge pour tout
v tel que |v| < ρ1 quel que soit ρ1 > r1 , et donc pour tout v ∈ B2 (0, r1),
sa somme y étant holomorphe. En composant cette fonction holomorphe
avec la fonction w 2→ (w − a)−1 holomorphe sur C \ {a}, on voit que fp sera
holomorphe sur C \ B2 [a; r1], ce qui achève la démonstration.
Remarques. 1. Un raisonnement semblable à celui donné pour le dévelop-
pement de Taylor montre que, dans les conditions du théorème de Laurent,
la décomposition de f en fr et fp est unique. En conséquence, fr +fp avec fr
et fp donnés par l’énoncé du théorème de Laurent, s’appelle le développement
de Laurent de f dans la couronne A(a; r1, r2 ). Au lieu de

$ ∞
$
ck (z − a)k + c−k (z − a)−k ,
k=0 k=1

on écrit souvent, pour abréger,


+∞
$
ck (z − a)k .
k=−∞
16.6. POINTS SINGULIERS ISOLÉS ET THÉORÈME DE LAURENT663

La fonction

$
fr : z 2→ ck (z − a)k
k=0

s’appelle la partie régulière de f sur A(a; r1, r2) et la fonction



$
fp : z 2→ c−k (z − a)−k
k=1

s’appelle la partie principale de f sur A(a; r1 , r2).


2. On notera que, sous les hypothèses du théorème de Laurent, les co-
(k)
efficients ck pour k ∈ N∗ ne peuvent pas s’écrire f k!(a) puisque f n’est
pas supposée holomorphe sur un voisinage de a. Bien entendu, si f est
holomorphe sur un voisinage de a contenant B2 [a; r1], les coefficients de fp
f (k) (a)
s’annulent en vertu du théorème de Cauchy, ceux de fr sont égaux à k!
et le développement de Laurent se ramène au développement de Taylor.
Le théorème de Laurent fournit une classification des points singuliers
isolés d’une fonction f de C dans C.
Définition. On dit que a est un point singulier isolé de f si f n’est holo-
morphe sur aucun voisinage de a et s’il existe un voisinage V de a tel que f
soit holomorphe sur V \ {a}.
Par exemple, 0 est un point singulier isolé de la fonction f : z 2→ 0 si z /= 0
et f (0) = 1, de la fonction f : z 2→ 1/z et de la fonction f : z 2→ exp(1/z).
Si a est un point singulier de f , si V est un voisinage de a tel que f
soit holomorphe sur V \ {a} et si r2 > 0 est tel que B2 (a; r2) ⊂ V , alors f
sera holomorphe sur A(a; r1, r2) pour tout 0 < r1 < r2 . Par le théorème de
Laurent, f pourra s’écrire, pour tout z ∈ B2 (a; r2) \ {a},

$ ∞
$
f (z) = fr,a (z) + fp,a (z) = ck (z − a)k + c−k (z − a)−k ,
k=0 k=1

où J
1 f (z)
ck = dz, k ∈ Z,
2iπ Σa,ρ (z − a)k+1
et ρ est quelconque dans ]0, r2[. En outre, la série représentant fr,a converge
absolument dans B2 (a; r2) et la série représentant fp,a converge absolument
dans C\{a}. L’expression fr,a +fp,a s’appelle le développement de Laurent de
f au point a, ou au voisinage de a, ou autour de a, la fonction fr,a s’appelle
664 CHAPITRE 16. ANALYSE COMPLEXE

la partie régulière de f en a et la fonction fp,a s’appelle la partie principale


de f en a.
Trois cas peuvent se présenter.
1. fp,a = 0, c’est-à-dire c−k = 0 pour tout k ∈ N∗ .
On dit que a est un point singulier apparent ou un point singulier régulier
de f . Ainsi, 0 est un point singulier régulier pour le premier exemple de point
singulier isolé donné plus haut.
2. Un nombre fini non nul de c−k , k ∈ N∗ sont différents de zéro.
Dans ce cas, si p ≥ 1 désigne le plus grand entier positif k tel que c−k /= 0,
alors fp,a peut s’écrire
p
$
fp,a (z) = c−k (z − a)−k ,
k=1

avec c−p /= 0. On dit que a est un pôle d’ordre p de f . Ainsi, 0 est un


pôle d’ordre un dans le deuxième exemple de point singulier isolé donné plus
haut.
3. Il existe une infinité de c−k , k ∈ N∗ différents de zéro.
Dans ce cas, on dit que a est un point singulier essentiel de f . Ainsi, 0
est un point singulier essentiel dans le troisième exemple de point singulier
isolé donné plus haut.
L’étude du comportement d’une fonction de C dans C au voisinage d’un
point singulier essentiel est une partie difficile et importante de la théorie
des fonctions d’une variable complexe que nous n’aborderons pas ici. Par
contre, nous allons caractériser les points singuliers réguliers et les pôles et
donner des moyens concrets d’y calculer le résidu de f.

16.7 Le théorème des résidus


Notons tout d’abord une conséquence immédiate de la définition du résidu
et de la définition du développement de Laurent.
Proposition. Si f est une fonction de C dans C, a un point singulier isolé
de f et si les ck , k ∈ Z sont les coefficients de son développement de Laurent
en a, alors
Rés(f ; a) = Rés(fp,a; a) = c−1 .
On voit pourquoi le résidu de f en a ne fournit qu’une mesure très par-
tielle de sa “non-holomorphie” au point a. Celle-ci est en fait déterminée
par tous les coefficients c−k de sa partie principale.
16.7. LE THÉORÈME DES RÉSIDUS 665

Donnons maintenant des caractérisations simples d’un point singulier


régulier et la valeur du résidu en en tel point.
Proposition. Soit f une fonction de C dans C et a un point singulier isolé
de f . Alors les quatre assertions suivantes sont équivalentes.
1. a est un point singulier régulier de f .
2. limz→a, z(=a f (z) existe.
3. Il existe une fonction g holomorphe sur un voisinage V de a et telle que
f (z) = g(z) pour tout z ∈ V \ {a}.
4. f est localement bornée en a.
En outre, Rés(f ; a) = 0.
Démonstration. Si a est un point singulier régulier de f , alors f = fr,a
sur B2 (a, r2) pour r2 suffisamment petit, et dès lors

lim f (z) = lim fr,a (z) = c0 .


z→a, z(=a z→a, z(=a

L’assertion 2 entraı̂ne trivialement l’assertion 4. Si l’assertion 4 est vérifiée,


alors, pour tout k ∈ N∗ , on a,

f (z)
lim (z − a) = lim (z − a)k f (z) = 0,
z→a, z(=a (z − a)−k+1 z→a, z(=a

et dès lors, par un résultat antérieur sur le calcul du résidu,


4 5
f (z)
c−k = Rés ; a = 0.
(z − a)−k+1

Donc fp,a = 0 et l’assertion 1 est vérifiée. En outre, la fonction g = fr,a,


somme sur B2 (a; r2) d’une série entière convergente, est holomorphe sur
B2 (a; r2) et égale à f sur B2 (a; r2) \ {a}. Donc, l’assertion 1 entraı̂ne
l’assertion 3. L’assertion 3 entraı̂ne trivialement l’assertion 4 puisque g est
nécessairement localement bornée en a. Comme, enfin, l’assertion 3 entraı̂ne
trivialement l’assertion 2, la Proposition est démontrée, puisque la valeur
du résidu résulte aisément de l’assertion 2 et d’un résultat antérieur sur le
calcul du résidu.
On a une caractérisation semblable et une formule de calcul de résidu
dans le cas d’un pôle d’ordre p.
Proposition. Soit f une fonction de C dans C et a un point singulier isolé
de f . Alors les quatre assertions suivantes sont équivalentes.
1. a est un pôle d’ordre p de f .
666 CHAPITRE 16. ANALYSE COMPLEXE

2. limz→a, z(=a (z − a)p f (z) existe et limz→a, z(=a (z − a)p−1 f (z) = ∞. En


particulier, limz→a, z(=a f (z) = ∞.
3. Il existe une fonction g de C dans C holomorphe sur un voisinage V de a
telle que g(a) /= 0 et
g(z)
f (z) =
(z − a)p
pour tout z ∈ V \ {a}.
4. La fonction z 2→ (z − a)pf (z) est localement bornée en a, et la fonction
z 2→ (z − a)p−1 f (z) n’est pas localement bornée en a.
En outre,
g (p−1)(a)
Rés(f ; a) = .
(p − 1)!
Démonstration. Si a est un pôle d’ordre p de f , alors

lim (z − a)pf (z) = lim (z − a)p (fr,a + fp,a )


z→a, z(=a z→a, z(=a
, p -
$
−k
= lim (z − a) p
c−k (z − a) = c−p ,
z→a, z(=a
k=1
et

lim (z − a)p−1 f (z) = lim (z − a)p−1 c0 + lim (z − a)p−1 fp,a =


z→a, z(=a z→a, z(=a z→a, z(=a

c−p
lim (z − a)p−1 c0 + c−p+1 + lim= ∞,
z→a, z(=a z→a, z(=a z − a

puisque la première limite existe et la deuxième est infinie. Donc l’assertion


2 est satisfaite. D’autre part, si a est un pôle d’ordre p de f , alors la fonction
g définie par
p
$
g(z) = (z − a)p fr,a (z) + c−k (z − a)p−k
k=1

est holomorphe sur une boule centrée en a, telle que g(a) = c−p /= 0 et telle
g(z)
que f (z) = fr,a(z) + fp,a (z) = (z−a)p pour tout z /= a contenu dans cette
boule. Donc l’assertion 3 est vérifiée. D’ailleurs, l’assertion 3 implique tri-
vialement l’assertion 2. Si l’assertion 3 est vérifiée, alors, en appliquant le
théorème de Taylor à g, on trouve une boule B2 (a; r) telle que

$ g (k) (a)
g(z) = (z − a)k ,
k=0
k!
16.7. LE THÉORÈME DES RÉSIDUS 667

pour tout z ∈ B2 (a; r), et donc, pour z ∈ B2 (a; r) \ {a}, on a


p−1 ∞
$ g (k)(a) $ g (k) (a)
f (z) = (z − a)k−p + (z − a)k−p , (16.1)
k=0
k! k=p
k!

qui est le développement de Laurent de f en a et montre, puisque g(a) /=


0, que a est un pôle d’ordre p de f . L’assertion 2 entraı̂ne trivialement
l’assertion 4. Si cette dernière est vérifiée, alors, pour k ≥ p + 1, on a

f (z)
lim (z − a) = lim (z − a)(z − a)k−1 f (z) = 0,
z→a (z − a)−k+1 z→a

et dès lors 4 5
f (z)
c−k = Rés = 0,
(z − a)−k+1
pour k ≥ p + 1. En outre, c−p = 0, car si c−p = 0, alors pour z /= a et
suffisamment proche de a, on a

$
f (z) = ck (z − a)k ,
k=1−p

et ∞ ∞
$ $
(z − a)p−1f (z) = ck (z − a)k+p−1 = cj+1−p (z − a)j
k=1−p j=0

serait localement bornée en a. Donc l’assertion 4 entraı̂ne l’assertion 1. Enfin,


le calcul du résidu résulte aisément de la valeur du coefficient c−1 tirée de
(16.1).
On voit donc qu’en un point singulier isolé a, f est localement bornée en
a (et y a même une limite) si a est singulier régulier et f tend vers l’infini
lorsque z tend vers a si a est un pôle. Lorsque a est un point singulier es-
sentiel, il n’est pas trop difficile de prouver que, pour tout b ∈ C, il existe
une suite (zk )k∈N tendant vers a et telle que (f (zk ))k∈N converge vers b
(théorème de Casorati-Weierstrass). Un résultat beaucoup plus pro-
fond et beaucoup plus difficile, appelé le second théorème de Picard,
montre qu’au voisinage d’un point singulier essentiel, f prend une infinité
de fois toute valeur b ∈ C, sauf une au plus.
Si E ⊂ C est un ouvert non vide et que les seuls points de E en lesquels f
ne soit pas holomorphe sont des pôles, on dit que f est méromorphe sur E. En
particulier, une fonction rationnelle de C dans C est toujours méromorphe
668 CHAPITRE 16. ANALYSE COMPLEXE

sur C. Une fonction f de C dans C holomorphe sur C est appelée une


fonction entière. Tout polynôme de C dans C, et toute fonction définie
par la somme d’une série entière convergeant partout sur C (par exemple la
fonction exponentielle complexe) sont des fonctions entières. Le théorème
fondamental de l’algèbre entraı̂ne que si f est un polynôme non constant
de C dans C, alors f (C) = C. L’exemple de la fonction exponentielle de z,
différente de zéro pour tout z ∈ C, montre que ce résultat ne s’étend pas
aux fonctions entières. Il n’est pas trop difficile de prouver que, si f est
entière, adh [f (C)] = C. Un profond résultat, appelé le premier théorème
de Picard, affirme que pour toute fonction entière non constante, il existe
au plus un b ∈ C tel que b /∈ f (C), et, pour toute fonction méromorphe sur
C, il existe au plus deux telles valeurs.
Nous allons maintenant énoncer et démontrer le fameux théorème des
résidus qui étend le théorème de Cauchy au cas où le cycle entoure un
nombre fini de points singuliers isolés de la fonction.

Théorème. Soit E ⊂ C un ouvert non vide, aj ∈ E, 1 ≤ j ≤ q, et f


une fonction de C dans C holomorphe sur E \ ∪qk=1 {ak }. Alors, pour tout
r > 0 suffisamment petit pour que les boules B2 [ak , r], (1 ≤ k ≤ q) soient
%
contenues dans E et mutuellement disjointes et pour tout cycle Φ = m j=1 Φj
q
dans E \ ∪k=1 {a } de classe C par morceaux homotope dans E \ {ak } à
k 2

Σmak ,r
, (1 ≤ k ≤ q), on a

J q
$
f dz = 2iπ Rés(f ; ak ).
Φ k=1

Démonstration. Soient fr,ak et fp,ak respectivement la partie régulière et


la partie principale de f en ak , 1 ≤ k ≤ q. On sait que fp,ak est holomorphe
sur C \ {ak } et que fr,ak est holomorphe sur B2 (ak , R) pour tout R > r
%
tel que B2 (ak , R) ⊂ E. Par conséquent, la fonction g = f − qk=1 fp,ak est
holomorphe sur E \ ∪qk=1 {ak } et, pour chaque 1 ≤ k ≤ q, limz→ak , z(=ak g(z)
existe. Donc, les ak sont des points singuliers réguliers pour g, (1 ≤ k ≤ q),
ce qui entraı̂ne
Rés(g; ak ) = 0, 1 ≤ k ≤ q.

Soit g̃ le prolongement holomorphe de g à E obtenu en posant


$
g̃(al ) = fr,al (al ) − fp,ak (al ), 1 ≤ l ≤ q.
1≤k(=l≤q
16.7. LE THÉORÈME DES RÉSIDUS 669

Puisque Φ est un cycle dans E \ ∪qk=1 {ak } homotope dans chaque E \ {ak }
à Σak ,r , on a
J & q
$
' J J
f− fp,ak dz = g dz = g̃ dz
Φ k=1 Φ Φ
J J
= g̃ dz = g dz = 2iπRés(g; ak ) = 0.
Σmk Σmk
a ,r a ,r

Dès lors,
J q J
$ q J
$
f dz = fp,ak dz = fp,ak dz
Φ m
k=1 Φ k=1 Σak ,r
q
$ q
$
= 2iπ Rés(fp,ak ; ak ) = 2iπ Rés(f ; ak ).
k=1 k=1

On remarquera que si tous les ak sont des pôles, le théorème des résidus
permet de calculer l’intégrale du membre de gauche en n’effectuant que des
opérations de C-dérivation, puisque le résidu d’un pôle peut s’obtenir par de
telles opérations.
Le théorème des résidus permet de calculer de nombreuses intégrales
définies de fonctions de R dans C ainsi que certaines sommes finies. Par
exemple, si h : R2 → R est une fonction rationnelle définie sur le cercle de
C centré à l’origine et de rayon un, alors, si z = exp(2iπt), on a, puisque
|z| = 1,
cos 2πt = (1/2)(z + z̄) = (1/2z)(z 2 + 1),
sin 2πt = (1/2i)(z − z̄) = (1/2iz)(z 2 − 1),
et dès lors, en vertu de la définition de l’intégrale d’une 1-forme sur Σ0,1 , on
a J 1
h(cos 2πt, sin 2πt) dt
0
J 1
= h(cos 2πt, sin 2πt)[2iπ exp(2iπt)]−1 [2iπ exp(2iπt)] dt
0
J & '
z2 + 1 z2 − 1 1
= h , dz
Σ0,1 2z 2iz 2iπz
& & ' '
$ 1 z2 + 1 z2 − 1
= 2iπ Rés h , ;a
2iπz 2z 2iz
670 CHAPITRE 16. ANALYSE COMPLEXE
& & ' '
$ 1 z2 + 1 z2 − 1
= Rés h , ;a ,
z 2z 2iz
8 2 2
9
où la somme est étendue aux pôles a de la fonction z 2→ 1z h z 2z+1 , z2iz−1

situés dans le disque ouvert centré à l’origine et de rayon 1.


D’autres artifices permettent de ramener au théorème des résidus le calcul
d’intégrales définies de différentes classes de fonctions.

16.8 Exercices
1. Montrer que si f est une fonction de C dans C holomorphe sur un
ouvert E ⊂ C, alors ∆f = 0 sur E, où ∆f = D11 2
f + D22
2
f. (Utiliser
l’indéfinie dérivabilité de f , les conditions de Cauchy-Riemann et le théorème
de Schwarz).
2. Soit T : C → C une application R-linéaire injective. On dit que T préserve
les angles si, pour tout w et tout z dans C, on a

|w||z|(T w|T z) = |T w||T z|(w|z).

Si f est une application continûment dérivable d’un ouvert E ⊂ C dans C,


on dit que f préserve les angles si, pour chaque a ∈ E, la dérivée totale fa$
préserve les angles. Montrer que si f est holomorphe sur E et si f $ (z) /= 0
pour tout z ∈ E , alors f préserve les angles sur E. On dit que f est une
représentation conforme de E sur f (E).
3. Démontrer le théorème fondamental de l’algèbre à partir du théorème
de Liouville. (Si f est un polynôme de C dans C non constant de degré n
n’ayant pas de zéro, alors f1 est une fonction entière bornée sur C, et donc
constante, ce qui est contradictoire.)
4. Montrer que si E est un ouvert borné et f une fonction C dans C con-
tinue sur adh E et non constante et holomorphe sur E. Alors |f | atteint son
maximum et son minimum sur fr E (Principe du maximum pour les fonc-
tions holomorphes). (Sinon, par exemple, le maximant a de |f | sur adh E
appartient à E et, par continuité de f , il existe b ∈ E et ρ > 0 tels que
B2 [b; ρ] ⊂ E et |f (z)| < |f (a)| pour tout z ∈ B2 [b; ρ]. Si r = |b − a|, la
formule de représentation de Cauchy
J
1
f (a) = f (z) dz,
2iπ Σa,r

conduit à une contradiction.)


16.9. PETITE ANTHOLOGIE 671

5. Montrer que si f est une fonction de C dans C holomorphe dans un ouvert


E ⊂ C, et si a ∈ E est un zéro de f , alors ou bien f est identiquement
nulle sur une boule centrée en a, ou bien il existe un entier k ≥ 1 tel que
f (k) (a) /= 0. (Utiliser le théorème de Taylor). En déduire que, dans ce cas,
a est isolé; le plus petit entier tel que f (m) (a) /= 0 est appelé la multiplicité
du zéro a de f .
6. Montrer que si f est une fonction méromorphe de C dans C ayant comme
zéros les nombres aj ∈ C, (1 ≤ j ≤ q) avec les multiplicités respectives
mj , (1 ≤ j ≤ q), et admettant comme pôles les nombres bk ∈ C, (1 ≤ k ≤ r),
avec les ordres respectifs pj , (1 ≤ j ≤ r), alors si R > 0 est suffisamment
grand pour que B2 (R) contienne ces zéros et ces pôles, on a
J q r
1 f $ (z) $ $
dz = mj − pk .
2iπ Σ0,R f (z) j=1 k=1

En particulier, si f est entière, cette intégrale fournit le nombre de zéros de


f (comptés avec leur multiplicité). (Utiliser le théorème des résidus).

16.9 Petite anthologie


H
Que devrions nous faire de ϕx.dx pour x = a + bi? Evidemment, si nous
voulons procéder à partir de concepts clairs, nous devons supposer que x
passe, par des accroissements infiniment petits (chacun de la forme α + iβ)
de cette valeur à laquelle l’intégrale est supposée être 0 à x = a + bi et
qu’alors tous les ϕx.dx soient sommés. De cette manière, la signification
est rendue précise. Mais la progression des valeurs de x peut se faire d’une
infinité de manières différentes : De la même manière que nous pouvons
concevoir la totalité de toutes les grandeurs réelles comme une ligne droite
infinie, nous pouvons visualiser la totalité de toutes les grandeurs, réelles
et imaginaires, comme un plan infini où chaque point qui est déterminé par
une abscisse a et une ordonnée b représente aussi bien la quantité a + bi. Le
passage continu d’une valeur de x à une autre a + bi se fait par conséquent
le long d’une courbe et est dèsH lors possible d’une infinité de manières. Mais
je maintiens que l’intégrale ϕx.dx calculée le long de deux tels passages
différents donne toujours la même valeur tant que ϕx = ∞ n’arrive jamais
dans la région du plan entourée par les courbes décrivant ces deux passages.
C’est un très beau théorème, dont je donnerai la démonstration, qui n’est
pas si difficile, quand l’occasion se présentera. Il est relié intimement à
d’autres belles vérités relatives aux développements de fonctions en séries.
672 CHAPITRE 16. ANALYSE COMPLEXE

Le passage d’un point à un autre peut toujours être effectué sans toucher
l’un des points où ϕx = ∞. Cependant, je demande que Hces points soient
évités sous peine de voir le concept fondamental original de ϕx.dx perdre sa
clarté et conduire à des contradictions.
H
En outre, il est clair aussi à partir de
là qu’une fonction engendrée par ϕx.dx pourrait avoir différentes valeurs
pour la même valeur de x, qui dépendent du nombre de tours effectuésH autour
d’un point où ϕx = ∞. Si par exemple nous définissons log x via x1 dx à
partir de x = 1, et que nous arrivons à log x en ayant tourné autour du point
x = 0 une ou plusieurs fois ou pas du tout, tout circuit ajoute la constante
+2πi ou −2πi; donc le fait que tout nombre ait des logarithems multiples
devient tout à fait clair.

Carl Friedrich Gauss, 1811 (lettre à Friedrich Bessel)

Les équations
∂u ∂v ∂u ∂v
= , =−
∂x ∂y ∂y ∂x
renferment toute la théorie du passage du réel à l’imaginaire, et il ne nous
reste plus qu’à indiquer la manière de s’en servir.

Augustin Cauchy, 1814

Pour embrasser dans la même définition les intégrales prises entre des
limites réelles et les intégrales prises entre des limites imaginaires, il convient
de représenter par la notation
J √
X+Y −1
√ f (z) dz
x0 +y0 −1

la limite ou l’une des limites vers lesquelles converge la somme des produits
de la forme
D √ E √
(x1 − x0 ) + (y1 − y0 ) −1 f (x0 + y0 −1),
D √ E √
(x2 − x1 ) + (y2 − y1 ) −1 f (x1 + y1 −1),
...
D √ E √
(X − xn−1 ) + (Y − yn−1 ) −1 f (xn−1 + yn−1 −1),
lorsque chacune des deux suites

x0 , x1 , x2 , . . . , xn−1 , X,
16.9. PETITE ANTHOLOGIE 673

y0 , y1 , y2 , . . . , yn−1 , Y,
étant composée de termes qui aillent toujours en croissant ou en décroissant
depuis le premier jusqu’au dernier, ces mêmes termes se rapprochent indé-
finiment les uns des autres, et que leur nombre croı̂t de plus en plus. Pour
obtenir deux suites de cette espèce, il suffit de supposer

x = ϕ(t), y = χ(t),

puis de représenter par

x0 , x1 , x2 , . . . , xn−1 , X,

y0 , y1 , y2 , . . . , yn−1 , Y,
les valeurs de x et de y correspondant à des valeurs de t, qui composent une
série croissante ou décroissante de la forme

t0 , t1 , t2 , . . . , tn−1 , T.

Augustin Cauchy, 1825

Si, après avoir cherché les valeurs de z où la fonction f (z) est infinie,
on ajoute à l’une de ces valeurs, désignée par z1 , la quantité infinitésimale
! et que l’on développe alors f (z1 + !) en séries de puissances croissantes
de !, les premiers termes contiendront des puissances négatives de !, et l’un
d’entre eux sera le produit de 1/! par un coefficient fini, que nous appellerons
le résidu de la fonction f (z) relatif à la valeur particulière z1 de la variable
z. . . . L’étude des résidus d’une fonction f (z) est habituellement facile. En
fait, soit encore z1 une valeur de z où f (z) devient infinie, c’est-à-dire une
racine de l’équation
1
= 0.
f (z)
La valeur du produit (z − z1 )f (z), correspondant à z = z1 , apparaı̂t comme
une forme indéterminé. Mais en réalité elle est très souvent bornée. Adop-
tons cette hypothèse et posons

(z − z1 )f (z) = g(z).

De cette équation, on obtient alors


g(z)
f (z) = ,
z − z1
674 CHAPITRE 16. ANALYSE COMPLEXE

et dès lors
g(z1 + !) 1
f (z1 + !) = = g(z1) + g $ (z1 + θ!),
! !
θ désignant un nombre inférieur à l’unité. Par conséquent, le résidu de la
fonction f (z) en z = z1 sera la quantité finie g(z1 ), ou, en d’autres termes,
la valeur du produit !f (z1 + !) correspondant à ! = 0.

Augustin Cauchy, 1826

La fonction f (x) sera développable par la formule de Maclaurin en une


série convergente ordonnée suivant les puissances ascendantes de x, si le
module de la variable réelle ou imaginaire conserve une valeur inférieure à
celle pour laquelle la fonction (ou sa dérivée du premier ordre) cesse d’être
finie et continue.

Augustin Cauchy, 1841

Le calcul intégral ne vaudrait pas grand’chose si, au lieu d’être cherchée


sous forme finie, la primitive demandait toujours un passage à la limite; il n’y
aurait alors aucun progrès. Le mérite immense de Newton et Leibniz est de
rendre possible la représentation explicite du résultat d’une opération qui est
en fait irréalisable. 250 années passèrent depuis, et pas mal d’hommes forts
refirent le chemin de Newton et Leibniz. Personne ne put continuer l’oeuvre
des fondateurs de l’analyse infinitésimale, ni indiquer une autre méthode
pour mettre sous forme finie le résultat de la sommation d’infiniment petits.
Seul Cauchy eut l’honneur de donner un procédé original, qu’il nomma calcul
des résidus, dont on peut se servir pour mettre sous forme finie le résultat
de la sommation d’un nombre infiniment grand de termes infiniment petits,
et cela dans une quantité de cas où la méthode éprouvée des primitives de
Newton est en défaut.

Nicolas Lusin, 1943


Chapitre 17

Analyse fonctionnelle

17.1 Espaces métriques


Un examen attentif des définitions de limite, continuité, convergence et
des démonstrations de leurs propriétés fondamentales montre qu’elles ne
dépendent pas de la nature particulière des ensembles sur lesquels les fonc-
tions sont considérées (parties de Rn ) mais de l’existence sur ces ensembles
d’une notion de distance entre deux éléments vérifiant un petit nombre de
propriétés caractéristiques. D’autre part, le développement de questions
classiques d’analyse nous a conduit progressivement à considérer, à côté des
ensembles de points de Rn des ensembles de fonctions (C(A; Rp), N (I, Rp),
¯ Rp), L(I;
P (I; ¯ Rp), . . .) et à définir sur ces ensembles différents types de con-
vergence. Pour unifier et généraliser ces notions, on est conduit à la définition
suivante.
Définition. Soit M un ensemble non vide quelconque. Une distance sur M
est une application d : M × M → R+ vérifiant les conditions suivantes :
(i) Pour chaque x ∈ M et chaque y ∈ M , d(x, y) = 0 si et seulement si
x = y.
(ii) Pour chaque x ∈ M et chaque y ∈ M , d(x, y) = d(y, x) (propriété de
symétrie).
(iii) Pour chaque x ∈ M , chaque y ∈ M et chaque z ∈ M ,
d(x, y) ≤ d(x, z) + d(z, y)
(inégalité triangulaire).

Définition. On appelle espace métrique un ensemble non vide M muni


d’une distance d. On le note (M, d) ou, plus brièvement, M , lorsque le choix

675
676 CHAPITRE 17. ANALYSE FONCTIONNELLE

de d ressort clairement du contexte. On dit aussi qu’on a muni M d’une


structure métrique ou d’une métrique.
Les éléments x ∈ M d’un espace métrique (M, d) seront en général ap-
pelés des points. Un même ensemble non vide peut évidemment être muni
de plusieurs distances; ainsi, si d est une distance sur M , cd est une dis-
tance sur M quel que soit c > 0. Si d1 et d2 sont deux distances différentes
sur un même ensemble M , (M, d1) et (M, d2 ) sont évidemment des espaces
métriques différents.
Exemples. 1. Si M est un ensemble non vide, on peut toujours définir
l’application d0 : M × M → R+ par

d0 (x, x) = 0, d0 (x, y) = 1 si x /= y.

On vérifie sans peine qu’elle satisfait aux conditions (i) à (iii) de la définition
ci-dessus. La structure métrique que d0 définit sur M s’appelle la métrique
discrète.
2. L’application d1 : R × R → R+ , (x, y) 2→ |x − y| satisfait aux conditions
(i) à (iii) de la définition de distance. Cette distance définit la métrique
naturelle sur R. L’application

d2 : R × R → R+ , (x, y) 2→ |arctg x − arctg y|,

est également une métrique sur R, ainsi qu’on le vérifie sans peine. On
obtient d’autres métriques en remplaçant arctg par n’importe quelle appli-
cation injective de R dans R.
3. Soit S = {0, 1} et Σ l’ensemble des suites dans S, c’est-à-dire l’ensemble
des applications de N dans S. Ainsi donc, s ∈ Σ si et seulement si s =
(sk )k∈N , avec sk = 0 ou 1. Définissons l’application d : Σ × Σ → R+ par

$ |sk − tk |
d(s, t) = .
k=0
2k

Comme, pour chaque k ∈ N, |sk − tk | ≤ 1, il résulte du test de comparaison


que la série qui définit d(s, t) est convergente pour chaque s ∈ Σ et chaque
t ∈ Σ. En outre, la série étant à termes positifs, sa somme est nulle si et
seulement si chaque terme est nul, c’est-à-dire si et seulement si sk = tk
pour chaque k ∈ N, ou encore si et seulement si s = t. Il est clair que
d(s, t) = d(t, s), et, enfin, si r ∈ Σ, on a

$ |sk − rk + rk − tk |
d(s, t) =
k=0
2k
17.2. ESPACES VECTORIELS NORMÉS 677

∞ 4
$ 5
|sk − rk | |rk − tk |
≤ + ≤ d(s, r) + d(r, t).
k=0
2k 2k

Si s et t sont des éléments de Σ tels que sk = tk pour chaque 0 ≤ k ≤ n pour


un certain n ∈ N, alors
∞ ∞
$ |sk − tk | $ 1 1
d(s, t) = ≤ = n.
k=n+1
2k k=n+1
2 k 2

Réciproquement, s’il existe 0 ≤ k ≤ n tel que sk /= tk , alors |sk − tk | = 1


et d(s, t) ≥ 21k ≥ 21n . Cette distance est utile dans l’étude des schémas de
Bernoulli en théorie des probabilités et en théorie ergodique.
Soit (M, d) est un espace métrique et A une partie non vide de M . La
restriction dA de d à A×A est évidemment une distance sur A, ce qui justifie
la définition suivante.
Définition. Si (M, d) est un espace métrique et A une partie non vide de
M , la restriction dA de d à A × A est appelée distance induite sur A par d et
(A, dA) (que l’on notera plus simplement (A, d)) est appelé un sous-espace
métrique de (M, d).
Exemple. Si d est une distance sur R, alors (Q, d) est un sous-espace
métrique de (R, d).

17.2 Espaces vectoriels normés


Soit K = R ou C et E un espace vectoriel sur K. La notion suivante, qui a
été introduite au chapitre 1 lorsque K = R, est liée à la notion de distance.
Définition. Une norme sur E est une application 6 · 6 : E → R+ vérifiant
les conditions suivantes :
1. Pour chaque x ∈ E, 6x6 = 0 si et seulement si x = 0.
2. Pour chaque c ∈ K et chaque x ∈ E, on a 6cx6 = |c|6x6.
3. Pour chaque x ∈ E et chaque y ∈ E, on a

6x + y6 ≤ 6x6 + 6y6.

Le couple (E, 6 · 6) est appelé un espace vectoriel normé.


Les exemples suivants d’espaces vectoriels normés sont bien connus.
678 CHAPITRE 17. ANALYSE FONCTIONNELLE

Exemples. 1. L’application valeur absolue | · | est évidemment une norme


sur R.
2. L’application

| · | : C → R+ , z = x + iy 2→ |z| = (x2 + y 2 )1/2,

est une norme sur C considéré comme espace vectoriel sur R ou sur C.
3. Si j = 1, 2 ou ∞, l’application | · |j est une norme sur Rn .
On a vu que tout ensemble non vide pouvait être muni d’une distance,
par exemple celle de la métrique discrète. On peut démontrer, mais c’est
plus difficile et nécessite le recours à l’axiome du choix, qu’il est possible de
définir une norme sur tout espace vectoriel sur K.
Proposition. Si (E, 6 · 6) est un espace vectoriel normé, l’application

d2·2 : E × E → R+ , (x, y) 2→ 6x − y6,

est une distance sur E.


Démonstration. En effet, si x, y et z appartiennent à E, on a, en utilisant
la définition et les propriétés d’une norme,

d2·2(x, y) = 0 ⇔ x − y = 0 ⇔ x = y,

d2·2 (y, x) = 6y − x6 = 6 − (x − y)6 = 6x − y6 = d2·2 (x, y),

d2·2 (x, y) = 6x−y6 = 6x−z+z−y6 ≤ 6x−z6+6z−y6 = d2·2 (x, z)+d2·2(z, y).

La distance d2·2 ainsi définie s’appelle la distance sur E induite par la


norme 6 · 6 et munit tout espace vectoriel normé d’une structure d’espace
métrique.
Si F est un sous-espace vectoriel de E, il est clair que la restriction 6 · 6F
de 6 · 6 à F définit une norme sur F , ce qui justifie la définition suivante.
Définition. Si (E, 6 · 6) est un espace vectoriel normé sur K et F un sous-
espace vectoriel de E, la norme induite par 6 · 6 sur F est la restriction
6 · 6F de 6 · 6 à F , et (F, 6 · 6F ) ou, plus simplement, (F, 6 · 6) est appelé un
sous-espace vectoriel normé de (E, 6 · 6).
Exemples. 1. Espace l 1 . L’espace (Rn , | · |1 ) possède la généralisation na-
turelle suivante. Soit l 1 l’ensemble des suites réelles x = (xk )k∈N∗ telles que
17.2. ESPACES VECTORIELS NORMÉS 679

%
la série k∈N∗ xk converge absolument. On montre sans peine que c’est un
espace vectoriel sur R et, par définition, l’application

$
| · |1 : l 1 → R+ , x = (xk )k∈N∗ 2→ |xk |,
k=1

est bien définie. Les deux premières propriétés d’une norme sont trivialement
satisfaites par | · |1 et la troisième résulte de l’inégalité triangulaire dans R,
q
$ q
$ q
$
|xk + yk | ≤ |xk | + |yk |,
k=1 k=1 k=1

qui entraı̂ne, successivement,


q
$ ∞
$ ∞
$
|xk + yk | ≤ |xk | + |yk |,
k=1 k=1 k=1

et

$ ∞
$ ∞
$
|xk + yk | ≤ |xk | + |yk |.
k=1 k=1 k=1

(l 1 , | · |1 ) est donc un espace vectoriel normé sur R.


2. Espace l ∞. L’espace (Rn , |·|∞) possède la généralisation naturelle suivante.
Soit l ∞ l’ensemble des suites réelles x = (xk )k∈N∗ bornées. On montre sans
peine que c’est un espace vectoriel sur R et, par définition, l’application

| · |∞ : l ∞ → R+ , x = (xk )k∈N∗ 2→ sup{|xk | : k ∈ N∗ }

est bien définie. Les trois propriétés d’une norme sont trivialement satisfaites
par | · |∞ . (l ∞ , | · |∞ ) est donc un espace vectoriel normé sur R.
3. Espace des applications bornées d’un ensemble dans un espace vectoriel
normé. Soit A un ensemble non vide quelconque, (E, 6·6) un espace vectoriel
normé sur K. Par analogie avec le cas d’une application de Rn dans Rp, nous
dirons qu’une application f de A dans E est bornée sur A s’il existe M ≥ 0
tel que, pour tout x ∈ A, on ait

6f (x)6 ≤ M,

c’est-à-dire si l’application norme de f définie par 6f 6(x) = 6f (x)6 est ma-


jorée sur A, ce qui assure aussitôt l’existence de supx∈A 6f (x)6. Désignons
par B(A; E) l’ensemble des applications bornées de A dans E. Il est facile
680 CHAPITRE 17. ANALYSE FONCTIONNELLE

de munir B(A; E) d’une structure d’espace vectoriel en définissant, pour


f ∈ B(A; E), g ∈ B(A; E) et c ∈ K, f + g et cf respectivement par

(f + g)(x) = f (x) + g(x), (cf )(x) = cf (x),

pour chaque x ∈ A. Si nous définissons maintenant sur B(A; E) l’application


6 · 6∞ par
6f 6∞ = sup 6f (x)6,
x∈A

alors, si f, g ∈ B(A; E) et c ∈ K, on a

6f 6∞ = 0 ⇔ 6f (x)6 = 0 pour tout x ∈ A ⇔ f = 0,

6cf 6∞ = sup 6cf (x)6 = |c| sup 6f (x)6 = |c|6f 6∞,


x∈A x∈A

et, pour chaque x ∈ A, on a

6f (x) + g(x)6 ≤ 6f (x)6 + 6g(x)6,

et dès lors

6f (x) + g(x)6 ≤ sup 6f (x)6 + sup 6g(x)6 = 6f 6∞ + 6g6∞,


x∈A x∈A

ce qui entraı̂ne aussitôt que

6f + g6∞ = sup(6f (x) + g(x)6) ≤ 6f 6∞ + 6g6∞.


x∈A

En conséquence, 6 · 6∞ est une norme sur B(A; E) appelée, pour des raisons
qui apparaı̂tront plus loin, la norme de la convergence uniforme sur A. La
distance induite par 6 · 6∞ définit sur B(A; E) la métrique de la convergence
uniforme sur A.
4. Espace des applications continues d’un fermé borné de Rn dans Rp . Soit A
un fermé borné non vide de Rn et C(A; Rp) l’ensemble des applications f de
A dans Rp continues sur A. C’est un espace vectoriel sur R. Le théorème de
Weierstrass entraı̂ne qu’une application continue sur A y est nécessairement
bornée, et dès lors C(A; Rp) est un sous-espace vectoriel de B(A; Rp). En
le munissant de la norme de la convergence uniforme sur A, on en fait un
espace vectoriel normé sur R.
5. Espace des applications linéaires de Rn dans Rp. L’ensemble L(Rn , Rp)
des applications linéaires de Rn dans Rp est un espace vectoriel sur R. Si
l’on munit Rn de la norme | · |j et Rp de la norme | · |k (j, k = 1, 2 ou ∞),
17.2. ESPACES VECTORIELS NORMÉS 681

on sait que si L ∈ L(Rn , Rp), la fonction x 2→ L(x)


|x|j est bornée sur R \ {0}
n

et dès lors ; <


|L(x)|k
|L|j,k = sup : x ∈ R \ {0}
n
|x|j

= sup{|L(y)|k : y ∈ Rn , |y|j = 1}

existe. L’application

| · |j,k : L(Rn , Rp) → R+ , L 2→ |L|j,k

est une norme sur L(Rn , Rp); on le montre par un raisonnement analogue à
celui de l’exemple 3.
6. Espace des (classes d’équivalence) de fonctions L-intégrables sur A ⊂ Rp.
Si A est une partie non vide de Rn , on désigne par L(A; Rp) l’ensemble des
fonctions de Rn dans Rp L-intégrables sur A; elles sont donc définies presque
partout sur A, et cet ensemble constitue un espace vectoriel sur R pour les
définitions usuelles d’addition de deux fonctions et de multiplication d’une
fonction par un réel. L’application
J
6 · 6L : L(A; Rp) → R+ , f 2→ |f |2 ,
A

est bien définie et telle que 606L = 0. En outre, si f, g ∈ L(A; Rp) et si c ∈ R,


on a J J J
6cf 6L = |cf |2 = |c||f |2 = |c| |f |2 = |c|6f 6L,
A A A

et J J
6f + g6L = |f + g|2 ≤ (|f |2 + |g|2)
A A
J J
= |f |2 + |g|2 = 6f 6L + 6g6L.
A A

Mais, on a vu précédemment que

6f 6L = 0 ⇔ f = 0 p.p. sur A,

et par conséquent la première propriété de la norme n’est pas satisfaite. Pour


surmonter cette difficulté, notons que

E = {f ∈ L(A; Rp) : f = 0 p.p. sur A}


682 CHAPITRE 17. ANALYSE FONCTIONNELLE

est un sous-espace vectoriel de L(A; Rp), ce qui nous permet de définir


l’espace vectoriel quotient L1 (A; Rp) = L(A; Rp)/E des classes d’équivalence
d’éléments de L(A; Rp) pour l’égalité presque partout sur A. Comme

E = {f ∈ L(A; Rp) : 6f 6L = 0},

on voit que, si f et g sont des éléments de L(A; Rp) tels que f = g p.p. sur
A, alors

6f 6L = 6g + (f − g)6L ≤ 6g6L + 6f − g6L = 6g6L,

et, symétriquement, 6g6L ≤ 6f 6L, c’est-à-dire 6f 6L = 6g6L. En conséquen-


ce, si fˆ désigne la classe d’équivalence de l’élément f ∈ L(A; Rp), l’applica-
tion
6 · 61 : L1 (A; Rp) → R+ , fˆ 2→ 6f 6L ,
est bien définie et vérifie les trois conditions d’une norme. Cette norme
est appelée la norme de la convergence en moyenne sur A et l’ensemble
(L1 (A; Rp), 6 · 61 ) est l’espace des (classes d’équivalence) des fonctions de
Rn dans Rp L-intégrables sur A. En pratique, on laisse souvent tomber la
terminologie “classe d’équivalence” et la notation fˆ.
7. Espaces préhilbertiens. Soit H un espace vectoriel sur K. On appelle
produit scalaire sur H une application (·|·) de H × H dans K vérifiant les
propriétés suivantes : pour tout x ∈ H, y ∈ H, z ∈ H et a, b ∈ K, on a
a. (x|y) = (y|x).
b. (ax + by|z) = a(x|z) + b(y|z).
c. (x|x) > 0 si x /= 0.
Notons que a et b entraı̂nent que

(z|ax + by) = (ax + by|z) = a(x|z) + b(y|z) = a(z|x) + b(z|y).

Montrons que l’application

6 · 6 : H → R+ , x 2→ [(x|x)]1/2,

est une norme sur H, que l’on appellera la norme induite par le produit
scalaire (·|·). On a 6x6 = 0 si et seulement si x = 0 en vertu de b et c,
puisque, si x = 0, x = 0x et

(x|x) = (0x|x) = 0(x|x) = 0,

et l’on a
6cx6 = [(cx|cx)]1/2 = [c(x|cx)]1/2 = [c(cx|x)]1/2
17.2. ESPACES VECTORIELS NORMÉS 683

= [cc(x|x)]1/2 = [|c|2(x|x)]1/2 = |c|6x6,


en vertu de a, b. Enfin,

6x + y6 = [(x + y|x + y)]1/2 = [(x|x + y) + (y|x + y)]1/2


D E1/2
= [(x + y|x) + (x + y|y)]1/2 = (x|x) + (y|x) + (x|y) + (y|y)

= [6x62 + 28(x|y) + 6y62 ]1/2 ≤ 6x6 + 6y6,


en utilisant a, b et l’inégalité de Cauchy-Schwarz

|(x|y)| ≤ 6x66y6,

qui est triviale pour y = 0 et, si y /= 0, résulte de a, b et c puisque, en posant


y
z = 2y2 , on a

0 ≤ ([x − (x|z)z]|[x − (x|z)z]) = (x|[x − (x|z)z]) − (x|z)(z|[x − (x|z)z])

= (x|x) − (z|x)(x|z) − (x|z)(z|x) + (x|z)(z|x)(z|z) = (x|x) − |(x|z)|2,


et dès lors
|(x|y)|2 ≤ 6x62 6y62 .
Le couple (H, (·|·)) est appelé un espace préhilbertien; c’est un espace vecto-
riel normé pour la norme 6 · 6 induite par le produit scalaire.
8.Espace l 2 . (Rn , (·|·)) muni du produit scalaire introduit au chapitre 1 est
un espace préhilbertien sur R. On peut le généraliser comme suit. Soit l 2
%
l’ensemble des suites réelles x = (xk )k∈N∗ telles que la série k∈N∗ |xk |2 soit
convergente. Comme, pour chaque k ∈ N∗ , on a

|xk + yk |2 ≤ |xk |2 + 2|xk ||yk | + |yk |2 ≤ 2(|xk |2 + |yk |2 ),

le test de comparaison entraı̂ne aisément que l 2 est un espace vectoriel sur


R. Comme, d’autre part, si x = (xk )k∈N∗ et y = (yk )k∈N∗ appartiennent à
l 2 , on a, pour chaque q ∈ N∗
q & q q '
$ 1 $ $
|xk ||yk | ≤ |xk | +
2
|yk | 2
,
k=1
2 k=1 k=1
%
on voit que la série k∈N∗ xk yk converge absolument et dès lors l’application

$
(·|·) : l 2 → R, (x, y) = ((xk )k∈N∗ , (yk )k∈N∗ ) 2→ xk yk
k=1
684 CHAPITRE 17. ANALYSE FONCTIONNELLE

est bien définie. On vérifie sans peine qu’elle vérifie les conditions pour
être un produit scalaire sur l 2 . En conséquence, (l 2, (·|·)) est un espace
préhilbertien sur R.
9. Espace L2 (A; Rp). Si A est une partie non vide de Rn , on désigne par
L2 (A; Rp) l’ensemble des classes d’équivalences au sens de l’exemple 6 de
fonctions f de Rn dans Rp n-mesurables sur A et telles que |f |22 soit L-
intégrable sur A. L’inégalité

1D E
(f (x)|g(x)) ≤ |f (x)|2 + |g(x)|2
2
et le test de comparaison pour la L-intégrabilité des fonctions n-mesurables
montre queH
si f et g appartiennent à L2 (A; Rp), alors (f |g) est L-intégrable
sur A et A (f |g) ne dépend que de la classe d’équivalence de f et de celle de
g. Si l’on définit l’application Afˆ|ĝB par
J
Afˆ|ĝB = (f |g),
A

on montre facilement que A·|·B est un produit scalaire sur L2 (A; Rp) qui en fait
un espace préhilbertien, et donc normé. La norme correspondante s’appelle
la norme de la convergence en moyenne quadratique.

17.3 Intérieur, adhérence, frontière


La notion de boule dans Rn ne dépend que de l’existence d’une distance sur
Rn . Elle se généralise aisément à un espace métrique quelconque.
Définition. Soit (M, d) un espace métrique, a ∈ M et r > 0. On appelle
boule de centre a et de rayon r l’ensemble

B[a; r] = {x ∈ M : d(x, a) ≤ r},

et boule ouverte de centre a et de rayon r l’ensemble

B(a; r) = {x ∈ M : d(x, a) < r}.

Ainsi, pour M est muni de la métrique discrète, B[a; r] = {a} si r < 1 et


B[a; r] = M si r ≥ 1.
Les notions introduites dans Rn et qui ne dépendent que du concept de
boule s’étendent donc aussitôt à un espace métrique quelconque.
17.3. INTÉRIEUR, ADHÉRENCE, FRONTIÈRE 685

Définition. Soit (M, d) un espace métrique, a ∈ M et E ⊂ M. On dit que


a est intérieur à E ou que E est un voisinage de a s’il existe r > 0 tel que
B[a; r] ⊂ E. L’intérieur de E, noté int E, est l’ensemble des points de M
intérieurs à E.
On a évidemment, par définition, int E ⊂ E, int ∅ = ∅ et int M = M.
Exemple. Si (M, d0 ) est un espace métrique avec la métrique discrète d0
et si E est une partie de M , alors int E = E. C’est évident si E est vide;
sinon, pour tout a ∈ E, on a B[a; 12 ] = {a} ⊂ E, et donc E ⊂ int E.
Définition. On dit que a est adhérent à E si, pour tout r > 0, E ∩B[a; r] /=
∅. L’adhérence de E, notée adh E ou E est l’ensemble des points de M
adhérents à E.
On a évidemment, par définition, E ⊂ adh E, adh ∅ = ∅ et adh M = M.
Exemple. Si (M, d0 ) est un espace métrique avec la métrique discrète et si
E est une partie de M , alors adh E = E. C’est évident si E est vide; sinon,
pour tout a ∈ adh E, on a E ∩ {a} = E ∩ B[a; 12 ] /= ∅, et donc a ∈ E, ce qui
montre que adh E ⊂ E.
Les propriétés suivantes se démontrent exactement comme leur équiva-
lent dans Rn . Bien entendu, !E = M \ E.
Proposition. Soit (M, d) un espace métrique et E, F des parties de M .
Alors, on a
1. adh E = !int !E, int E = !adh !E.
2. Si E ⊂ F , alors int E ⊂ int F et adh E ⊂ adh F .
3. int (E ∪ F ) ⊃ int E ∪ int F, int (E ∩ F ) = int E ∩ int F.
4. adh (E ∪ F ) = adh E ∪ adh F, adh (E ∩ F ) ⊂ adh E ∩ adh F.

Définition. Soit (M, d) un espace métrique et E ⊂ M. La frontière de E,


notée fr E, Ė ou ∂E est l’ensemble

fr E = adh E ∩ adh !E.

Il en résulte aussitôt que

fr E = fr !E = adh E \ int E.

Exemple. Si (M, d0) est un espace métrique avec la métrique discrète et


si E est une partie de M , alors fr E = ∅. En effet, fr E = adh E \ int E =
E \ E = ∅.
686 CHAPITRE 17. ANALYSE FONCTIONNELLE

17.4 Limites et continuité


Il est facile d’étendre la notion de limite des valeurs d’une fonction au cas
d’une fonction d’un espace métrique dans un autre.
Définition. Soient (M, d) et (M $ , d$ ) deux espaces métriques, f une fonc-
tion de M dans M $ , a ∈ M et b ∈ M $ . On dit que f (x) tend vers b lorsque x
tend vers a ou encore que b est limite de f (x) lorsque x tend vers a, et l’on
écrit
f (x) → b si x → a,
si les deux conditions suivantes sont satisfaites :
1. a ∈ adh dom f.
2.(∀! > 0)(∃δ > 0)(∀x ∈ dom f : d(x, a) ≤ δ) : d$ (f (x), b) ≤ !.
La condition 2 de cette définition équivaut évidemment à
2’.(∀! > 0)(∃δ > 0)(∀x ∈ dom f ∩ B[a; δ]) : b ∈ B[b; !],
et les remarques faites à la suite de la définition de la limite pour les fonctions
de Rn dans Rp s’étendent trivialement à cette situation générale.
Exemples. 1. Dans les conditions de la définition, supposons M muni de
la métrique discrète. Alors la condition 1 implique a ∈ dom f et, si ! > 0
est donné, la condition 2 sera trivialement satisfaite en prenant b = f (a) et
δ = 12 . En conséquence, si M est muni de la métrique discrète, toute fonction
de M dans M $ a une limite en a ∈ adh dom f si et seulement si a ∈ dom f ,
auquel cas cette limite est égale à f (a).
2. Dans les conditions de la définition, supposons maintenant que M $ soit
muni de la métrique discrète. Alors, dès que ! < 1, B[b; !] = {b} et, si
b est limite de f (x) pour x tendant vers a, il existera un δ > 0 tel que
f (x) = b pour tout x ∈ dom f ∩ B[a; δ]. Réciproquement, si un tel b et
un tel δ existent, b sera évidemment limite de f (x) lorsque x tend vers a.
En conséquence, si M $ est muni de la métrique discrète, les fonctions de
M dans M $ qui ont une limite lorsque x tend vers a ∈ adh dom f sont les
fonctions localement constantes en a, c’est-à-dire les fonctions constantes sur
l’intersection de dom f avec un voisinage de a.
Ces deux exemples montrent que l’emploi de la métrique discrète ne conduit
pas à une analyse mathématique très subtile.
Les propriétés suivantes de la limite se démontrent exactement comme
dans le cas des fonctions de Rn dans Rp.
Proposition. Soient (M, d) et (M $ , d$) deux espaces métriques, f une fonc-
tion de M dans M $ , a ∈ adh dom f. On a les propriétés suivantes.
17.4. LIMITES ET CONTINUITÉ 687

1. (Unicité). Il existe au plus un b ∈ M $ vérifiant les conditions de la


définition de limite. On écrit alors

b = lim f (x).
x→a

2. (Condition nécessaire de Cauchy). Si limx→a f (x) existe, alors f vérifie


la condition de Cauchy :

(∀! > 0)(∃δ > 0)(∀x ∈ dom f : d(x, a) ≤ δ)


(∀y ∈ dom f : d(y, a) ≤ δ) : d$ (f (x), f (y)) ≤ !.
3. (Condition nécessaire de borne locale). Si f vérifie en a la condition de
Cauchy, alors
(∃r > 0)(∃δ > 0)(∃y ∈ dom f )
(∀x ∈ dom f : d(x, a) ≤ δ) : d$ (f (x), f (y)) ≤ r.
4. (Caractérisation de la limite par les voisinages). b = limx→a f (x) si et
seulement si pour tout voisinage V de b, il existe un voisinage U de a tel que
f (U ) ⊂ V.
5. (Caractère local de la notion de limite). Si W est un voisinage de a, et
f |W désigne la restriction de f à W, alors

lim f (x) = b ⇔ lim f |W (x) = b.


x→a x→a

On notera la légère variante dans la formulation du caractère localement


borné; elle est due au fait qu’il n’existe pas d’élément “origine” dans un
espace métrique quelconque. La seule règle de calcul des limites qui garde
un sens dans le cas de fonctions entre espaces métriques quelconques est celle
sur la limite d’une fonction composée. Elle se démontre exactement comme
dans le cas d’une fonction de Rn dans Rp .
Proposition. Soient (M, d), (M $ , d$ ) et (M $$ , d$$) des espaces métriques, f
une fonction de M dans M $ , g une fonction de M $ dans M $$ , a ∈ adh dom
(g ◦ f ), b ∈ adh dom g et c ∈ M $$ . Si

lim f (x) = b et lim g(y) = c,


x→a y→b

alors
lim (g ◦ f )(x) = c.
x→a
Comme pour les fonctions de Rn dans Rp , il est intéressant de considérer
la situation où a ∈ dom f.
688 CHAPITRE 17. ANALYSE FONCTIONNELLE

Définition. Soient (M, d) et (M $ , d$) des espaces métriques, f une fonction


de M dans M $ et a ∈ dom f. On dit que f est continue au point a si
limx→a f (x) existe.
On démontre, comme dans le cas des fonctions de Rn dans Rp , que f est
continue en a si et seulement si limx→a f (x) = f (a), et que f est toujours
continue en un point isolé a du domaine de f , c’est-à-dire un point qui n’est
pas adhérent à dom f \ {a}. Les exemples précédents montrent que, si M est
muni de la métrique discrète, toute fonction de M dans M $ est continue en
chaque point de son domaine et que, si M $ est muni de la métrique discrète,
les fonctions continues en a sont les fonctions constantes sur un voisinage de
a. Si l’un des deux espaces est muni de la métrique discrète, on voit donc
que les fonctions continues entre ces espaces sont trop nombreuses ou trop
rares.
Exemples. 1. Le décalage de Bernoulli est l’application

σ : Σ → Σ, s = (sk )k∈N 2→ σ(s) = (sk+1 )k∈N ,

où (Σ, d) est l’espace métrique des suites dans S = {0, 1} défini dans la
Section 1. Montrons que l’application σ est continue en chaque s ∈ Σ. Si
! > 0 est donné, il existe un entier naturel n tel que 21n ≤ !. Si nous prenons
δ = 2n+2
1
et si t ∈ Σ est tel que d(t, s) ≤ δ, alors d(t, s) < 2n+1 1
et, par
une propriété démontrée dans la Section 1, on aura tk = sk pour chaque
0 ≤ k ≤ n + 1, et dès lors d(σ(t), σ(s)) ≤ 21n ≤ !. Le décalage de Bernoulli
joue un grand rôle en théorie ergodique et dans l’étude du chaos.
2. Si (M, d) et (M $ , d$) sont des espaces métriques, on dira qu’une application
f dans M dans M $ est lipschitzienne de constante α si, pour tout x ∈ M et
tout y ∈ M , on a
d$ (f (x), f (y)) ≤ αd(x, y).
Il est clair qu’une application lipschitzienne de M dans M $ est continue en
chaque point de M . En particulier, si M = M $ , d = d$ et f est lipschitzienne
de constante α < 1, on dit que f est une contraction ou une application
contractante sur M .
3. Si (M, d) est un espace métrique, alors, pour chaque a ∈ M, l’application

d(·, a) : (M, d) → (R, | · |), x 2→ d(x, a)

est lipschitzienne de constante 1 sur M . En effet, en vertu de l’inégalité


triangulaire, on a, pour chaque y ∈ M ,

d(x, a) − d(y, a) ≤ d(x, y), d(y, a) − d(x, a) ≤ d(y, x),


17.4. LIMITES ET CONTINUITÉ 689

et dès lors
|d(x, a) − d(y, a)| ≤ d(x, y).
4. Si (E, 6 · 6) est un espace vectoriel normé, alors l’application norme
6 · 6 : (E, 6 · 6) → (R, | · |), x 2→ 6x6 est lipschitzienne de constante 1. En
effet, pour tout x ∈ E et tout y ∈ E, on a, par l’inégalité triangulaire,

6x6 − 6y6 ≤ 6x − y6, 6y6 − 6x6 ≤ 6y − x6,

et dès lors
|6y6 − 6x6| ≤ 6y − x6.
La notion de convergence d’une suite dans Rp s’étend sans peine au cas
d’une suite dans un espace métrique.
Définition. Soit (M, d) un espace métrique, (ak )k∈N une suite dans M
(c’est-à-dire une application de N dans M ) et soit b ∈ M. On dit que b
est limite de la suite (ak )k∈N ou que (ak )k∈N converge vers b si

(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m) : d(ak , b) ≤ !,

c’est-à-dire si la suite réelle (d(ak , b))k∈N converge vers zéro.


On démontre, comme dans le cas où M = Rp , qu’il existe au plus un
b ∈ M vérifiant cette condition; on l’appelle alors la limite de la suite (ak )k∈N,
et on le note limk→∞ ak .
Exemples. 1. Soit A une partie non vide de Rn et soit Rp muni de la norme
| · |2 . Soit (fk )k∈N une suite dans l’espace B(A; Rp ) des applications bornées
de A dans R muni de la norme de la convergence uniforme 6 · 6∞ et soit
f ∈ B(A; Rp ). Alors, en vertu de la définition précédente, (fk )k∈N converge
vers f si et seulement si

(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m) : sup |fk (x) − f (x)|2 ≤ !,


x∈A

c’est-à-dire si et seulement si la suite (fk )k∈N d’applications bornées de A


dans Rp converge uniformément sur A vers l’application bornée f de A dans
Rp . C’est la raison pour laquelle la norme correspondante de B(A; Rp ) est
appelée la norme de la convergence uniforme sur A.
2. Soit A une partie non vide de Rn et soit Rp muni de la norme | · |2 .
Soit (fˆk )k∈N une suite dans l’espace L1 (A; Rp) des classes d’équivalence de
fonctions de Rn dans Rp L-intégrables sur A muni de la norme 6·61 de la con-
vergence en moyenne. Si (fˆk )k∈N converge vers fˆ ∈ L1 (A; Rp), l’application
690 CHAPITRE 17. ANALYSE FONCTIONNELLE

de la définition de convergence et de la définition de la norme entraı̂nent que


pour chaque fk ∈ fˆk et chaque f ∈ fˆ, on a
J
(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m) : |fk − f |2 ≤ !,
A

ce qui équivaut à dire que la suite (fk )k∈N converge en moyenne sur A vers
f . C’est la raison pour laquelle la norme 6 · 61 est appelée la norme de la
convergence en moyenne sur A.
Comme dans le cas de Rn , et avec des démonstrations entièrement ana-
logues, on peut formuler en termes de suites plusieurs notions fondamentales
d’analyse.
Proposition. Soit (M, d) un espace métrique, a ∈ M et E ⊂ M. Alors
a ∈ adh E si et seulement il existe une suite (ak )k∈N dans E qui converge
vers a.

Proposition. Soient (M, d) et (M $ , d$ ) des espaces métriques, f une fonc-


tion de M dans M $ , a ∈ M et b ∈ M $ . Alors, limx→a f (x) = b si et seulement
les deux conditions suivantes sont satisfaites.
1. a ∈ adh dom f.
2. Pour toute suite (xk )k∈N dans dom f qui converge vers a, (f (xk ))k∈N
converge vers b.

17.5 Espaces métriques complets


Soit (M, d) un espace métrique et (ak )k∈N une suite dans M . En procédant
exactement comme pour M = Rp , on démontre la condition nécessaire
de convergence de Cauchy.
Proposition. Si (ak )k∈N converge, elle vérifie la condition de Cauchy :

(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q ≥ m) : d(ak , aq ) ≤ !.

Une suite vérifiant cette condition est appellée une suite de Cauchy dans
M . On a vu que, si M = Rp muni de l’une des normes | · |j (j = 1, 2, ∞),
toute suite de Cauchy est convergente. Il n’en est pas de même dans tout
espace métrique, ainsi que le montrent les exemples suivants.
Exemples. 1. (Q, | · |), où | · | désigne la valeur absolue usuelle, est un sous-
espace vectoriel normé de (R, | · |). Soit a ∈ R \ Q un nombre irrationnel.
17.5. ESPACES MÉTRIQUES COMPLETS 691
D E
Comme tout intervalle a − k+1 1
, a + k+1
1
(k ∈ N) contient un nombre ra-
tionnel ak , la suite (ak )k∈N est une suite dans Q qui converge dans (R, | · |)
vers a. Elle est donc une suite de Cauchy dans (R, | · |) et, puisqu’elle prend
ses valeurs dans Q, elle est une suite de Cauchy dans (Q, | · |). Elle n’est
pas convergente dans (Q, | · |) puisque sa limite au sens de la norme | · | est
a ∈ R \ Q.
2. Soit f l’application de R dans R définie par f (x) = 1+|x| x
. On montre
sans peine que f est strictement croissante sur R, que f (−x) = −f (x) et
|f (x)| < 1 pour tout x ∈ R, et que

lim f (x) = −1, lim f (x) = 1.


x→−∞ x→+∞

En vertu d’une remarque faite dans la Section 1, l’application

df : R × R → R, (x, y) 2→ |f (x) − f (y)|,

définit une distance sur R. Si (ak )k∈N est une suite dans R et b ∈ R, alors
(ak )k∈N converge vers b au sens de la distance df si et seulement si

(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m) : |f (ak ) − f (b)| ≤ !,

c’est-à-dire si et seulement si la suite (f (ak ))k∈N converge vers f (b) au sens


de la distance usuelle dans R, et (ak )k∈N sera une suite de Cauchy dans
(R, df ) si et seulement si (f (ak ))k∈N est une suite de Cauchy dans (R, | · |).
Considérons dès lors la suite (k)k∈N. Puisque

lim f (k) = +1,


k→+∞

la suite (f (k))k∈N vérifie la condition de Cauchy dans (R, | · |) et la suite


(k)k∈N est donc une suite de Cauchy dans (R, df ). Mais cette suite n’est
pas convergente dans (R, df ) car, si (k)k∈N converge vers b ∈ R dans (R, df ),
alors (f (k))k∈N converge vers f (b) dans (R, | · |). En conséquence, f (b) = 1
ce qui contredit le fait que |f (b)| < 1 pour tout b ∈ R.
3. Soit I = [−1, 1] et C 1 (I, R) l’ensemble des applications f de I dans R de
classe C 1 sur I. C 1 (I; R) est un sous-espace vectoriel de C(I, R) et on peut
donc le munir de la norme induite par la norme 6 · 6∞ de la convergence
uniforme sur I, c’est-à-dire la norme

6f 6∞ = sup |f (x)|.
x∈I
692 CHAPITRE 17. ANALYSE FONCTIONNELLE

1
Si, pour chaque k ∈ N, on définit fk par fk (x) = |x|1+ k , alors (fk )k∈N est
une suite dans C 1 (I, R) et elle converge uniformément sur I vers la fonction
f définie par f (x) = |x|. En effet, pour tout x ∈ [−1, 1], et tout k ∈ N, on a,

fk (0) − f (0) = fk (−1) − f (−1) = fk (1) − f (1) = 0,

fk (−x) − f (−x) = fk (x) − f (x),


et dès lors
& '
8 9 1 1 1
1+ k1
sup |fk (x) − f (x)| = sup x−x = ≤ .
x∈I x∈ ]0,1[ k (1 + k)
1 k+1 k

En conséquence, (fk )k∈N vérifie la condition de Cauchy de convergence uni-


forme, c’est-à-dire

(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)

(∀q ∈ N : q ≥ m) : sup |fk (x) − fq (x)| ≤ !,


x∈I

et est donc une suite de Cauchy dans (C 1 (I, R), 6 · 6∞ ). Pourtant, elle ne
converge pas vers un élément de cet espace puisque sa limite (unique) au sens
de cette convergence, qui est la fonction valeur absolue, n’est pas dérivable
en 0 et n’appartient donc pas à C 1 (I, R).
Si l’on se souvient de l’importance jouée par la condition suffisante de
Cauchy dans Rn pour l’analyse des fonctions de Rn dans Rp , il est important
de déterminer les espaces métriques (M, d) dans lesquels les suites de Cauchy
convergent vers un élément de l’espace.
Définition. On dit qu’un espace métrique (M, d) est complet si toute suite
de Cauchy dans M converge vers un élément de M .
On a une terminologie particulière dans le cas d’un espace vectoriel nor-
mé et dans le cas d’un espace préhilbertien.
Définition. On dit qu’un espace vectoriel normé (E, 6 · 6) est un espace de
Banach s’il est complet pour la distance induite par la norme.

Définition. On dit qu’un espace préhilbertien (H, (·|·)) est un espace de


Hilbert s’il est complet pour la norme induite par le produit scalaire.
Bien entendu, tout espace de Hilbert est un espace de Banach.
On peut caractériser un espace de Banach par une propriété des séries
dans cet espace. D’une manière entièrement analogue au cas de Rp , si (E, 6 ·
17.5. ESPACES MÉTRIQUES COMPLETS 693

6) est un espace vectoriel normé sur K et si (ak )k∈N est une suite dans E, la
%
série k∈N ak de termes ak dans E est la suite (Aq )q∈N des sommes partielles
%
Aq = qk=0 ak de (ak )k∈N . On dira qu’elle converge vers A ∈ E si (Aq )q∈N
converge vers A dans (E, 6 · 6). Dans ce cas, A sera appelé la somme de la
% %
série k∈N ak et noté ∞ k=0 ak .

Proposition. Soit (E, 6 · 6) un espace vectoriel normé. Alors (E, 6 · 6) est


%
un espace de Banach si et seulement si toute série k∈N ak dans E, dont la
%
série des normes k∈N 6ak 6 converge, converge elle-même vers un élément
de E.
%
Démonstration. Condition nécessaire. Soit k∈N ak une série dans
% %
E telle que k∈N 6ak 6 converge. Alors k∈N 6ak 6 vérifie la condition de
Cauchy et dès lors
q
$
(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q > k) : 6aj 6 ≤ !.
j=k+1

Comme, pour tous les entiers q > k, on a


F F
F $ F
F q F q
$
F aj F
F F≤ 6aj 6,
Fj=k+1 F j=k+1
%
on en déduit aussitôt que k∈N ak vérifie la condition de Cauchy dans E et,
E étant complet, cette série converge donc vers un élément de E.
Condition suffisante. Soit (ak )k∈N une suite de Cauchy dans (E, 6 · 6). Pour
chaque entier naturel j ≥ 0, Il existe donc un entier naturel mj , avec mj >
mj−1 si j ≥ 1, tel que, pour tous les entiers k ≥ mj et q ≥ mj , on ait
1
6ak − aq 6 ≤ .
2j
Posons b0 = am0 , bj = amj − amj−1 si j ≥ 1, de telle sorte que, pour tout
j ≥ 0, on ait
1
6bj 6 = 6amj − amj−1 6 ≤ j .
2
%
Dès lors, la série j∈N 6bj 6 converge, et l’hypothèse entraı̂ne que la série
%
j∈N bj converge vers un élément b de E, ce qui équivaut évidemment à la
convergence vers b de la suite (amj )j∈N. Pour montrer que b = limk→∞ ak ,
soit ! > 0, m ∈ N tel que, pour tous entiers k, q ≥ m, on ait

6ak − aq 6 ≤ !.
694 CHAPITRE 17. ANALYSE FONCTIONNELLE

Comme mj > mj−1 pour tout j ≥ 1, on a mj ≥ j pour tout j ≥ 0, et dès


lors pour tout k ≥ m et tout q ≥ m, on aura aussi

6ak − amq 6 ≤ !.

En faisant tendre q vers l’infini dans ces inégalités, on en déduit que

(∀k ∈ N : k ≥ m) : 6ak − b6 ≤ !,

puisque la norme est une application continue de (E, 6 · 6) dans (R, | · |).
Exemples. 1. Si j = 1 ou ∞, alors (Rn , | · |j ) est un espace de Banach.
(Rn , (·|·)) est un espace de Hilbert.
2. Si A est un ensemble non vide quelconque et si (E, 6 · 6) est un espace de
Banach, alors (B(A; E), 6 · 6∞) est un espace de Banach. En effet, si (fk )k∈N
est une suite de Cauchy dans (B(A; E), 6 · 6∞ ), alors

(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)

(∀q ∈ N : q ≥ m)(∀x ∈ A) : 6fk (x) − fq (x)6 ≤ !.


Il en résulte aussitôt que, pour chaque x ∈ A fixé, la suite (fk (x))k∈N est
une suite de Cauchy dans (E, 6 · 6). Comme ce dernier espace est de Banach,
(fk (x))k∈N converge, et nous désignerons sa limite par f (x). On définit
ainsi une application f de A dans E. En faisant tendre q vers l’infini dans
l’expression ci-dessus, on trouve

(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀x ∈ A) : 6fk (x) − f (x)6 ≤ !,

ce qui équivaut à

(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m) : sup 6fk (x) − f (x)6 ≤ !.


x∈A

En prenant par exemple ! = 1 et appelant m1 un m qui convient, on trouve


que
sup 6fm1 (x) − f (x)6 ≤ 1,
x∈A

et dès lors

sup 6f (x)6 ≤ 1 + sup 6fm1 (x)6 = 1 + 6fm1 6∞ .


x∈A x∈A

Donc f ∈ B(A; E) et (fk )k∈N converge vers f dans (B(A; E), 6 · 6∞ ).


3. Si A ∈ Rn est un fermé borné non vide, alors (C(A; Rp), 6 · 6∞ ) est un
17.6. CONVERGENCE EN MOYENNE 695

espace de Banach. On sait que (C(A; Rp), 6 · 6∞) est un sous-espace vectoriel
normé de (B(A; Rp), 6 · 6∞ ) et dès lors toute suite de Cauchy (fk )k∈N dans
(C(A; Rp), 6 · 6∞ ) convergera vers un élément f ∈ B(A; Rp). Cela revient à
dire que la suite de fonctions (fk )k∈N converge uniformément sur A vers f
et, comme chaque fk est continue sur A, on sait que f sera continue sur A,
et donc appartient à C(A; Rp).
4. Les résultats de la section suivante consacrée à l’étude de la convergence
en moyenne vont nous permettre de montrer que, si A ⊂ Rn , alors L1 (A; Rp)
est un espace de Banach. C’est le théorème de Fischer-Riesz.

17.6 Convergence en moyenne


Nous consacrerons cette section à l’étude des relations entre la convergence
en moyenne d’une suite de fonctions intégrables et les autres types de con-
vergence. Rappelons tout d’abord la définition.
Définition. Soit A une partie de Rn , (fk )k∈N une suite de fonctions de Rn
dans Rp L-intégrables sur A et f une fonction de Rn dans Rp L-intégrable
sur A. On dit que (fk )k∈N converge en moyenne sur A vers f si
J
lim |fk − f |2 = 0.
k→∞ A

Les propriétés de l’intégrale fournissent aisément les propriétés élémentai-


res suivantes de la convergence en moyenne.
Proposition. Soit A une partie de Rn et (fk )k∈N une suite de fonctions de
Rn dans Rp L-intégrables sur A.
a) Si (fk )k∈N converge en moyenne sur A vers f et g, alors f = g p.p. sur A.
b) Si (fk )k∈N converge en moyenne sur A, alors (fk )k∈N vérifie la condition
de Cauchy de convergence en moyenne sur A :
J
(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q ≥ m) : |fk − fq |2 ≤ !.
A
H
c) Si (fk )k∈N converge
H
en moyenne sur A vers f , alors la suite ( A fk )k∈N
converge vers A f.
Montrons maintenant que la condition de Cauchy de convergence en
moyenne sur A est une condition suffisante pour la convergence en moyenne
sur A (théorème de Fischer-Riesz).
696 CHAPITRE 17. ANALYSE FONCTIONNELLE

Théorème. Soit (fk )k∈N une suite de fonctions de Rn dans Rp L-intégrables


sur A ∈ Rn qui vérifie la condition de Cauchy de convergence en moyenne
sur A. Alors (fk )k∈N converge en moyenne sur A vers une fonction f de Rn
dans Rp L-intégrable sur A.
Démonstration. Le théorème équivaut évidemment à démontrer que
l’espace L1 (A; Rp) des (classes d’équivalence de) fonctions L-intégrables sur
A est complet. Par une caractérisation du caractère complet d’un espace vec-
%
toriel normé, il suffit donc de prouver que toute série k∈N fk de fonctions
H
% %
fk de Rn dans Rp L-intégrables sur A telle que k∈N 6fk 61 = k∈N A |fk |2
soit convergente converge en moyenne sur A vers une fonction L-intégrable
sur A (on conviendra, dans cette démonstration, deH confondre les éléments
%
de L1 (A; Rp) et leurs représentants). Puisque k∈N A |fk |2 converge, la ver-
sion généralisée du théorème de convergence de Levi entraı̂ne la convergence
%
p.p. sur A de la série k∈N |fk |2 vers une fonction L-intégrable G de Rn
%
dans R. En conséquence, la série k∈N fk convergera p.p. sur A vers une
fonction F de Rn dans Rp . Comme, pour tout entier q ≥ 0 et pour presque
tout x ∈ A, on a
# q #
#$ # q
$
# #
# fk (x)# ≤ |fk (x)|2 ≤ G(x),
# #
k=0 2 k=0

le théorème de convergence dominée de Lebesgue entraı̂ne que F est L-


intégrable sur A. D’autre part, pout tout entier q ≥ 0 et presque tout
x ∈ A, on a
# q #
#$ # q
$
# #
# fk (x) − F (x)# ≤ |fk (x)|2 + |F (x)|2 ≤ G(x) + |F (x)|2,
# #
k=0 2 k=0

et dès lors, puisque G + |F |2 est L-intégrable sur A, le théorème de conver-


%
gence majorée et minorée de Lebesgue appliqué à la suite (| qk=0 fk −F |2 )q∈N
entraı̂ne # # # #
J #$ q # J #$q #
# # # #
lim # fk − F # = lim # fk − F # = 0,
k→∞ A # # A k→∞ # #
k=0 2 k=0 2
%
et k∈N fk converge dans L1 (A; Rp) vers F .
Examinons maintenant les relations entre la convergence en moyenne et
les autres types de convergence. La convergence uniforme sur une partie
n-intégrable entraı̂ne la convergence en moyenne sur cette partie.
17.6. CONVERGENCE EN MOYENNE 697

Proposition. Soit A une partie n-intégrable de Rn et (fk )k∈N une suite


de fonctions de Rn dans Rp L-intégrables sur A. Si (fk )k∈N converge uni-
formément sur A \ E vers une fonction f et si E est n-négligeable, alors
(fk )k∈N converge en moyenne sur A vers f .
Démonstration. Il résulte d’un corollaire du théorème de convergence
majorée et minorée de Lebesgue que f est L-intégrable sur A. Si ! > 0 est
donné, il existe un entier positif m tel que, pour tout entier k ≥ m et tout
x ∈ A \ E, on ait
!
|fk (x) − f (x)|2 ≤ .
µ(A)
En conséquence, pour tout entier k ≥ m, on aura
J J
!
|fk − f |2 ≤ = !.
A A µ(A)

La relation entre la convergence en moyenne et la convergence ponctuelle,


même p.p., sur A est plus compliquée. Tout d’abord, la convergence ponctu-
elle p.p. sur A d’une suite (fk )k∈N de fonctions L-intégrables sur A vers une
fonction f L-intégrable sur A n’entraı̂ne pas la convergence en moyenne sur
A de (fk )k∈N vers f . En effet, la suite (fk )k∈N∗ de fonctions de R dans R
définies par
k
fk (x) = 1]− 1 , 1 ] ,
2 k k

est formée de fonctions fk L-intégrables sur [−1, 1], et converge ponctuelle-


ment vers zéro sur R\{0}. Elle converge donc ponctuellement p.p. sur [−1, 1]
vers zéro. Mais, pour tout k ∈ N∗ , on a
J 1
|fk − 0| = 1,
−1

ce qui montre que (fk )k∈N∗ ne converge pas en moyenne sur [−1, 1] vers la
fonction nulle.
D’autre part, la convergence en moyenne sur A d’une suite (fk )k∈N
de fonctions L-intégrables sur A vers une fonction f L-intégrable sur A
n’entraı̂ne pas la convergence ponctuelle p.p. sur A de cette suite vers f .
Par exemple, définissons, pour chaque k ∈ N∗ , les k fonctions fkj (1 ≤ j ≤ k)
par fkj = 1[ j−1 , j ] . Chaque fonction fkj est évidemment L-intégrable sur [0, 1]
k k
et J 1
1
|fkj | = , (1 ≤ j ≤ k; k ∈ N∗ ).
0 k
698 CHAPITRE 17. ANALYSE FONCTIONNELLE

Soit (fk )k∈N∗ la suite de fonctions de R dans R définies par

f1 = f11 , f2 = f21 , f3 = f22 , . . ..


H
Par la calcul précédent, la suite ( 01 |fk |)k∈N∗ converge vers zéro et dès lors
(fk )k∈N converge en moyenne sur [0, 1] vers la fonction nulle. Par ailleurs,
pour chaque x ∈ ]0, 1], il existe des valeurs arbitrairement grandes de k pour
lesquelles fk (x) prend la valeur 0 et des valeurs arbitrairement grandes de
k pour lesquelles fk (x) prend la valeur 1, ce qui montre que (fk )k∈N∗ ne
converge pas ponctuellement p.p. sur [0, 1] vers la fonction nulle.
Le théorème de convergence dominée de Lebesgue fournit des conditions
supplémentaires sous lesquelles la convergence ponctuelle p.p. implique la
convergence en moyenne.

Proposition. Soit A une partie de Rn et (fk )k∈N une suite de fonctions


de Rn dans Rp L-intégrables sur A qui converge ponctuellement sur A vers
une fonction f de Rn dans Rp . S’il existe une fonction g de Rn dans R+
L-intégrable sur A et telle que, pour presque tout x ∈ A et tout k ∈ N, on
ait
|fk (x)|2 ≤ g(x),

alors (fk )k∈N converge en moyenne sur A vers f .

Démonstration. Le théorème de convergence dominée de Lebesgue en-


traı̂ne que f est L-intégrable sur A. En conséquence, chaque fonction f − fk
est L-intégrable sur A. D’ailleurs, la suite (|fk − f |2 )k∈N converge p.p. sur
A vers la fonction zéro et, pour presque tout x ∈ A et tout entier positif k,
on a
|fk (x) − f (x)|2 ≤ |fk (x)|2 + |f (x)|2 ≤ g(x) + |f (x)|2 ,

avec g + |f |2 L-intégrable sur A. En appliquant à cette suite le théorème de


convergence majorée et minorée de Lebesgue, on obtient
J J
lim |fk − f |2 = 0 = 0.
k→∞ A A

Montrons maintenant que la convergence en moyenne sur A de la suite


de fonctions (fk )k∈N vers la fonction f entraı̂ne l’existence d’une sous-suite
de (fk )k∈N qui converge ponctuellement p.p. sur A vers f .
17.6. CONVERGENCE EN MOYENNE 699

Proposition. Soit A une partie de Rn , (fk )k∈N une suite de fonctions de


Rn dans Rp L-intégrables sur A qui converge en moyenne sur A vers une
fonction f de Rn dans Rp L-intégrable sur A. Alors il existe une sous-suite
de (fk )k∈N qui converge ponctuellement p.p. sur A vers f .
Démonstration. En passant si nécessaire aux composantes, on peut sup-
poser que p = 1 et en considérant la suite (fHk − f )k∈N au lieu de (fk )k∈N, on
peut supposer que f = 0. Puisque Hlimk→∞ A |fk | = 0, il existe m0 ∈ N tel
que, pour tout entier k ≥ m0 , on a A |fk | ≤ 1 = 2−0 , et, en continuant de la
sorte, il existe, pour chaque
H
entier j ≥ 1, un entier mj > mj−1 tel que, pour
tout entier k ≥ mj , on a A |fk | ≤ 2−2j . Montrons que la sous-suite (fmk )k∈N
de (fk )k∈N converge ponctuellement p.p. sur A vers f . Posons, pour chaque
k ∈ N et chaque j ∈ N,
>
Gk = {x ∈ A : |fmk (x)| ≥ 2−k }, Hj = Gk .
k≥j

Pour presque tout x ∈ A \ Hj , on a |fmk (x)| < 2−k dès que k ≥ j, et dès
lors (fmk )k∈N converge vers zéro presque partout sur A \ Hj pour chaque
j ∈ N. En conséquence, (fmk )k∈N converge vers zéro presque partout sur
7
A \ H, où H = j∈N Hj . Il reste à démontrer que H est de n-mesure nulle.
Par l’inégalité de Tchebycheff, chaque Gk est n-intégrable et
J
µ(Gk ) ≤ 2k |fmk | ≤ 2k .2−2k = 2−k , (k ∈ N).
A
!q
Dès lors, pour chaque q ≥ k, j=k Gj est n-intégrable et
 
q
> q
$ q
$
µ Gj  ≤ µ(Gj ) ≤ 2−j < 2−k+1 .
j=k j=k j=k
!
Comme la suite ( qj=k Gj )q∈N est croissante et que la suite de ses n-mesures
!
est majorée, Hk = j≥k Gj sera n-intégrable et, pour chaque k ∈ N, on aura
 
q
>
µ(Hk ) = lim µ  Gj  ≤ 2−k+1 .
q→∞
j=k

Comme, par construction, (Hk )k∈N est une suite décroissante, H sera n-
intégrable et
0 ≤ µ(H) = lim µ(Hk ) ≤ lim 2−k+1 = 0;
k→∞ k→∞

donc H est de n-mesure nulle.


700 CHAPITRE 17. ANALYSE FONCTIONNELLE

17.7 Théorème du point fixe de Banach


On peut généraliser aux espaces métriques complets le théorème des ap-
plications contractantes ou théorème du point fixe de Banach. Il
suffit de reprendre la démonstration donnée dans le cas où M = Rp . Rap-
pelons que, si M est un ensemble, f une application de M dans M et k ∈ N,
on pose f 0 = I et f k = f ◦ f ◦ . . . ◦ f (k fois) si k ≥ 1. On dit que y est un
point fixe de M si y = f (y).
Théorème. Soit (M, d) un espace métrique complet et f : M → M une ap-
plication contractante de constante α. Alors f possède un point fixe unique
y ∗ . En outre, pour chaque y0 ∈ M , la suite (yk )k∈N définie récursivement
par
yk+1 = f (yk ) = f k (y0 )
converge vers y ∗ et, pour tout entier k ≥ 0, on a

αk
d(yk , y ∗ ) ≤ d(f (y ∗ ), y ∗ ).
1−α
Le lemme simple suivant nous permet d’ailleurs de démontrer une géné-
ralisation utile de ce théorème.
Lemme. Soit (M, d) un espace métrique et f : M → M une application.
Alors, pour chaque entier k ≥ 1, tout point fixe de f est un point fixe de f k ,
et, s’il existe un entier q ≥ 1 tel que f q ait un point fixe unique y ∗ , alors f
possède l’unique point fixe y ∗ .
Démonstration. Soit y un point fixe de f ; alors y = f (y), et dès lors

f (y) = f 2 (y), f 2 (y) = f 3 (y), . . . , f k−1 (y) = f k (y).

D’autre part, si y ∗ = f q (y ∗ ), alors f (y ∗ ) = f q+1 (y ∗ ) = f q (f (y ∗ )), et f (y ∗ )


est un point fixe de f q . Par l’unicité, y ∗ = f (y ∗ ) ce qui montre que y ∗ est
un point fixe de f ; il est unique, puisque, par la première partie, tout point
fixe de f est un point fixe de f q .

Corollaire. Soit (M, d) un espace métrique complet, f : M → M et q ≥ 1


un entier tel que f q soit une application contractante de constante α sur M .
Alors f possède un point fixe unique y ∗ . En outre, pour chaque y0 ∈ M , la
suite (yk )k∈N définie récursivement par

yk+1 = f (yk ) = f k (y0 )


17.7. THÉORÈME DU POINT FIXE DE BANACH 701

converge vers y ∗ .
Démonstration. L’existence et l’unicité du point fixe y ∗ de f résultent
du théorème du point fixe de Banach appliqué à f q et du lemme précédent.
En outre, en prenant respectivement y0 , f (y0 ), . . ., f q−1 (y0 ) comme points
de départ des itérations dans le théorème du point fixe de Banach appliqué
à f q , on voit que les suites
8 9 8 9 8 9
f kq (y0 ) , f kq+1 (y0 ) = f kq (f (y0 )) , . . .,
k∈N k∈N k∈N
8 9 8 9
f kq+q−1 (y0 ) = f kq (f q−1 (y0 )) ,
k∈N k∈N
8 9
convergent toutes vers y ∗ . On en déduit aussitôt que la suite f k (y0 )
k∈N
converge aussi vers y ∗ .
Ce théorème est très utile pour démontrer l’existence et l’unicité de la
solution de nombreux types d’équations apparaissant en analyse. Par exem-
ple, soit I ⊂ R un intervalle non vide et f : I × Rp → Rp une application
continue. Supposons en outre qu’il existe une constante λ ≥ 0 telle que,
pour tout x ∈ I, y ∈ Rp, z ∈ Rp , on ait

|f (x, y) − f (x, z)|2 ≤ λ|y − z|2 ,

(condition de Lipschitz par rapport à la deuxième variable). Comme on l’a vu


au chapitre 8, le problème de Cauchy de conditions initiales x0 ∈ I, y0 ∈ Rp
consiste à déterminer une application y : I → Rp dérivable sur I et telle que

y $ (x) = f (x, y(x)), (x ∈ I), y(x0 ) = y0 .

Les propriétés de l’intégrale indéfinie d’une fonction continue et le théorème


fondamental du calcul différentiel et intégral montrent immédiatement que
ce problème est équivalent à la recherche d’une application y : I → Rp
continue sur I et telle que
J x
y(x) = y0 + f (s, y(s)) ds, (x ∈ I).
x0

Si I = [a, b] est un intervalle fermé borné, alors le second membre de cette


équation définit une application
J ·
ϕ : C(I; Rp) → C(I; Rp), y 2→ y0 + f (s, y(s)) ds.
x0
702 CHAPITRE 17. ANALYSE FONCTIONNELLE

On munit évidemment C(I; Rp) de la norme 6 · 6∞ de la convergence uni-


forme, qui en fait un espace de Banach. Pour tout x ∈ I, y ∈ C(I; Rp) et
z ∈ C(I; Rp), on a
#J x
#
# #
|[ϕ(y)](x) − [ϕ(z)](x)|2 = ## [f (s, y(s)) − f (s, z(s)] ds##
x0 2
#J x
#
# #
≤ λ ## |y(s) − z(s)|2 ds## ≤ λ|x − x0 |6y − z6∞ .
x0
Si l’on suppose que, pour k ≥ 2, on a
# # (λ|x − x0 |)k−1
# k−1 #
#[ϕ (y)](x) − [ϕk−1(z)](x)# ≤ 6y − z6∞ ,
2 (k − 1)!
alors,
# # # #
# k # # #
#[ϕ (y)](x) − [ϕk (z)](x)# = #[ϕ(ϕk−1 (y)](x) − [ϕ(ϕk−1 (z)](x)#
2 2
#J x ? @ ##
#
= ## f (s, [ϕk−1(y)](s)) − f (s, [ϕk−1(z)](s)) ds##
x0 2
#J #
# x ## k−1 #
# #
≤ λ ## #[ϕ (y)](s) − [ϕk−1 (z)](s)# ds##
x0 2
#J #
λk # x # (λ|x − x0 |)k
≤ 6y − z6∞ ## |s − x0 |k−1 ds## = 6y − z6∞ .
(k − 1)! x0 k!
Par récurrence, on a donc, pour tout entier k ≥ 1,
# # (λ|x − x0 |)k
# k #
#[ϕ (y)](x) − [ϕk (z)](x)# ≤ 6y − z6∞ ,
k!
2

et dès lors, pour chaque entier k ≥ 1, chaque y ∈ C(I; Rp) et chaque z ∈


C(I; Rp), on a
(λ(b − a))k
6ϕk (y) − ϕk (z)6∞ ≤ 6y − z6∞ .
k!
(λ(b−a))k
Comme k! est le (k + 1)e terme de la série exponentielle de λ(b − a), il
tend vers zéro lorsque k tend vers l’infini, et il existera donc un entier q ≥ 1
tel que
(λ(b − a))q
< 1,
q!
c’est-à-dire tel que ϕq soit une contraction sur C(I; Rp). Le Corollaire du
théorème du point fixe de Banach entraı̂ne alors l’existence d’un point fixe
unique y ∗ de ϕ sur C(I; Rp). Nous avons donc démontré le résultat suivant,
souvent appelé théorème de Cauchy-Picard.
17.8. OUVERTS ET FERMÉS 703

Théorème. Soit I = [a, b] ⊂ R un intervalle fermé non vide et f : I × Rp →


Rp une application continue. Supposons en outre qu’il existe une constante
λ ≥ 0 telle que, pour tout x ∈ I, y ∈ Rp , z ∈ Rp , on ait

|f (x, y) − f (x, z)|2 ≤ λ|y − z|2 .

Alors, pour chaque x0 ∈ I et chaque y0 ∈ Rp , le problème de Cauchy

y $ (x) = f (x, y(x)), (x ∈ I), y(x0 ) = y0 ,

possède une solution unique.


En particulier, le théorème de Cauchy-Picard s’applique au problème de
Cauchy linéaire

y $ (x) = A(x)y(x) + h(x), (x ∈ I), y(x0 ) = y0 ,

lorsque I = [a, b], h : I → Rp est continue et lorsque la matrice A(x) =


(aij (x))1≤i,j≤p est telle que chaque fonction aij est continue sur I.

17.8 Ouverts et fermés


Soit (M, d) un espace métrique. Les notions suivantes correspondent exacte-
ment à celles données précédemment dans Rn .
Définition. On dit que E ⊂ M est une partie ouverte de M ou encore
un ouvert de M si tout élément de E est intérieur à E (ou encore si E est
voisinage de chacun de ses points), c’est-à-dire si E ⊂ int E.
Cette définition équivaut évidemment à la condition E = int E. En
particulier, ∅ et M sont des ouverts de M . Dans l’espace métrique (M, d0)
muni de la métrique discrète, toutes les parties de M sont ouvertes.
Définition. On dit que F ⊂ M est une partie fermée de M ou encore
un fermé de M si tout élément de adh F appartient à F , c’est-à-dire si
adh F ⊂ F .
Cette définition équivaut évidemment à la condition f = adh F . En
particulier, ∅ and M sont des fermés de M . Dans l’espace métrique (M, d0)
muni de la métrique discrète, toutes les parties de M sont fermées. Les
liens entre intérieur et adhérence fournissent immédiatement la proposition
suivante.
704 CHAPITRE 17. ANALYSE FONCTIONNELLE

Proposition. E est une partie ouverte de M si et seulement si M \ E est


une partie fermée de M .
Une adaptation immédiate des raisonnement faits dans Rn montre immé-
diatement que si a ∈ M et r > 0, alors B(a; r) est un ouvert de M et B[a; r]
est un fermé de M. Les propriétés suivantes des ouverts et des fermés se
démontrent également comme dans Rn .
Proposition. 1. Si A est un ensemble non vide quelconque et (Eα)α∈A
une famille d’ouverts (resp. fermés) Eα de l’espace métrique (M, d), alors
! 7
α∈A Eα est un ouvert de (M, d) (resp. α∈A Eα est un fermé de (M, d)).
2. Si (Ej )1≤j≤m est une famille finie d’ouverts (resp. fermés) Ej de l’espace
7 !m
métrique (M, d), alors m j=1 Ej est un ouvert de (M, d) (resp. j=1 Ej est
un fermé de (M, d)).
3. Si E est une partie non vide de l’espace métrique (M, d), alors int E est le
plus grand ouvert contenu dans E et adh E est le plus petit fermé contenant
E.
En particulier, pour toute partie E de M , fr E = adh E ∩ adh !E est un
fermé de M .
Corollaire. Si (M, d) est un espace métrique, alors E ⊂ M est ouvert si et
seulement si E est une union de boules ouvertes de M .
Démonstration. Condition nécessaire. Si E est ouvert, alors, pour cha-
que a ∈ E, il existe ra > 0 tel que B[a; ra] ⊂ E et donc tel que B(a; ra) ⊂ E.
En conséquence,
>
E⊂ B(a; ra) ⊂ E,
a∈E
!
et dès lors E = a∈E B(a; ra).
Condition suffisante. Résulte immédiatement de la propriété 1 dans la Pro-
position précédente.
On a, comme dans Rn une intéressante caractérisation des fermés par les
suites.
Proposition. Soit F une partie non vide de M . Alors F est fermé dans M
si et seulement si, pour toute suite (ak )k∈N dans F convergeant vers b, on a
b ∈ F.
On en déduit une caractérisation utile des parties fermées d’un espace
métrique complet.
17.8. OUVERTS ET FERMÉS 705

Proposition. Soit (M, d) un espace métrique complet et F une partie non


vide de M . Alors F est fermé si et seulement si le sous-espace métrique
(F, d) de (M, d) est complet.
Démonstration. Condition nécessaire. Soit (ak )k∈N une suite de Cauchy
dans (F, d). C’est donc une suite de Cauchy dans (M, d), qui est complet;
elle converge donc vers b ∈ M. Comme F est fermé, la caractérisation par
les suites entraı̂ne que b ∈ F . Donc (F, d) est complet.
Condition suffisante. Soit (ak )k∈N une suite dans F qui converge vers b ∈ M .
Alors (ak )k∈N est une suite de Cauchy dans l’espace métrique complet (F, d).
En conséquence, b ∈ F, et F est fermé.

Corollaire. Soit (E, 6·6) un espace de Banach (resp. (H, (·|·))) un espace de
Hilbert) et F un sous-espace vectoriel de E (resp. H). Alors le sous-espace
vectoriel normé (F, 6 · 6) de E (resp. le sous-espace vectoriel préhilbertien
(F, (·|·)) de H) est un espace de Banach (resp. de Hilbert) si et seulement
si F est fermé dans E (resp. H).
Le résultat suivant donne la structure des ouverts et des fermés d’un
sous-espace métrique M $ de M .
Proposition. Soit (M, d) un espace métrique et M $ un sous-espace métri-
que de M . Alors E $ ⊂ M $ est un ouvert (resp. fermé) de M $ si et seulement
s’il existe un ouvert (resp. fermé) E de M tel que E $ = E ∩ M $ .
Démonstration. Faisons-la dans le cas d’un ouvert; celui d’un fermé s’en
déduit par passage au complémentaire. Condition nécessaire. Si E $ ⊂ M $
!
est un ouvert, alors, par la Proposition précédente, E $ = a∈E " B $ (a; ra), où
B $ (a; r) désigne une boule ouverte dans M $ . Comme, pour chaque a ∈ E $,
on a B $ (a; ra) = B(a; ra) ∩ M $ (où B(a; r) désigne une boule ouverte dans
M ), on voit que
 
>
$
E = B(a; ra) ∩ M $ = E ∩ M $ ,
a∈E "

!
avec E = a∈E " B(a; ra) ouvert dans M .
Condition suffisante. Si E $ = E ∩ M $ , avec E ouvert dans M , et si a ∈ E $,
alors a ∈ E et il existe donc r > 0 tel que B(a; r) ⊂ E; en conséquence,
B $ (a; r) = B(a; r) ∩ M $ ⊂ E ∩ M $ = E $ , ce qui montre que E $ est ouvert
dans M $ .
706 CHAPITRE 17. ANALYSE FONCTIONNELLE

17.9 Parties denses et espaces séparables


Il est intéressant de pouvoir approcher les éléments d’un espace métrique
par certains de ses éléments “plus simples”.
Définition. Soit (M, d) un espace métrique et A une partie de M . On dit
que A est dense dans M si adh A = M.
Donc, A est dense dans M si et seulement si, pour chaque x ∈ M et
chaque r > 0, on a B[x; r] ∩ A /= ∅ (ou B(a; r) ∩ A /= ∅), ou encore si et
seulement si, pour chaque x ∈ M , il existe une suite (ak )k∈N dans A qui
converge vers x, ou encore si int !A = ∅, puisque cette dernière condition
équivaut à M = !∅ = !int !A = adh A.
Exemples. 1. Comme adh Q = adh (R \ Q) = R, on voit que l’ensemble
des nombres rationnels et l’ensemble des nombres irrationnels sont tous deux
denses dans R (muni de la distance ordinaire).
2. Qn est dense dans (Rn , | · |j ) pour j = 1, 2 ou ∞.
On peut “relativiser” la notion de densité de la manière suivante.
Définition. Soient A et B deux parties d’un espace métrique (M, d). On
dit que A est dense par rapport à B si adh A ⊃ B.
Il en résulte que si A est dense par rapport à B et B dense par rapport à
C, alors A est dense par rapport à C, puisque adh A ⊃ B entraı̂ne adh A ⊃
adh B ⊃ C. Si B ⊃ A, alors la densité de A par rapport à B équivaut à la
densité de A dans adh B considéré comme sous-espace métrique de M .
Exemple. Q est dense par rapport à R \ Q et R \ Q est dense par rapport
à Q.
Il résulte de la définition que si B ⊃ A et A est dense dans M , alors B
est dense dans M. En particulier, toute union de parties denses dans M est
dense dans M . Par contre l’intersection de deux parties denses dans M peut
être vide : c’est le cas de Q et R \ Q dans R. Toutefois, l’intersection d’une
famille finie d’ouverts denses dans M sera dense dans M .
Proposition. Soit (M, d) un espace métrique et (Ej )1≤j≤m une famille finie
7
d’ouverts denses Ej dans M . Alors m
j=1 Ej est un ouvert dense dans M .
7
Démonstration. Il est évident que m j=1 Ej est ouvert. Pour montrer sa
densité dans M , il faut prouver que si x ∈ M et r > 0, alors B(x; r) ∩
7
( m
j=1 Ej ) /= ∅. Comme l’ouvert E1 est dense dans M , B(x; r) ∩ E1 est un
ouvert non vide, et il existe a1 ∈ E1 et r1 > 0 tels que B[a1 ; r1 ] ⊂ B(x; r)∩E1 .
Comme l’ouvert E2 est dense dans M , B(a1 ; r1 ) ∩ E2 est un ouvert non vide,
17.9. PARTIES DENSES ET ESPACES SÉPARABLES 707

et il existe a2 ∈ E2 et r2 > 0 tels que

B[a2 ; r2 ] ⊂ B(a1 ; r1 ) ∩ E2 ⊂ B(x; r) ∩ E1 ∩ E2 .

En continuant de la sorte, on trouve donc finalement am ∈ Em et rm > 0


tels que

B[am ; rm] ⊂ B(am−1 ; rm−1 ) ∩ Em ⊂ B(x; r) ∩ E1 ∩ . . . ∩ Em ,

ce qui achève la démonstration.


Lorsque (M, d) est un espace métrique complet, la construction de la
démonstration précédente peut être adaptée au cas d’une famille dénombra-
ble d’ouverts denses dans M . C’est le théorème de Baire qui joue un
grand rôle dans de nombreuses questions d’analyse et de topologie.
Théorème. Soit (Ej )j∈N une famille dénombrable d’ouverts Ej denses dans
7
un espace métrique complet (M, d). Alors j∈N Ej est dense dans M .
Démonstration. Soit x ∈ M et r > 0; il faut montrer que B(x; r) ∩
7
( j∈N Ej ) /= ∅. Comme E0 est ouvert et dense dans M , B(x; r) ∩ E0 est
ouvert et non vide et il existe donc a0 ∈ M et r0 ∈ ]0, 1] tels que

B[a0 ; r0] ⊂ B(x; r) ∩ E0 .

Comme E1 est ouvert et dense dans M , B(a0 ; r0) ∩ E1 est ouvert et non vide
et il existe donc a1 ∈ M et r1 ∈ ]0, 12 ] tels que

B[a1 ; r1 ] ⊂ B(a0 ; r0 ) ∩ E1 ⊂ B(x; r) ∩ E0 ∩ E1 .

En continuant de la sorte, on obtient


E uneE suite (ak )k∈N dans M et une suite
(rk )k∈N dans R∗+ telles que rk ∈ 0, k+1
1
et

B[ak+1 ; rk+1 ] ⊂ B(ak ; rk ) ∩ Ek+1 ⊂ B(x; r) ∩ E0 ∩ E1 ∩ . . . ∩ Ek+1 .

En conséquence, on a B[aq ; rq ] ⊂ B[ak ; rk ] pour tous les entiers q ≥ k ≥ 0,


et dès lors
1
d(aq , ak ) ≤ rk ≤ ,
k+1
si q ≥ k ≥ 0. On en déduit aisément que (ak )k∈N est une suite de Cauchy,
et elle converge donc vers un élément a ∈ M . Comme, pour chaque entier
k fixé, on a aq ∈ B[ak ; rk ] pour tout q ≥ k, on obtient, en faisant tendre
7
q vers l’infini, a ∈ B[ak ; rk ], et donc a ∈ k∈N B[ak ; rk ]. Dès lors, a ∈
7
B(x; r) ∩ ( k∈N Ek ) .
708 CHAPITRE 17. ANALYSE FONCTIONNELLE

En passant aux complémentaires, le théorème de Baire affirme que si


(Fj )j∈N est une famille dénombrable de fermés Fj d’intérieur vide dans un
!
espace métrique complet (M, d), alors j∈N Fj a un intérieur vide dans M .
Si l’on se souvient que, dans Rn , les ensembles de n-mesure nulle (ou n-
négligeables) sont d’intérieur vide, et que la propriété d’être de mesure nulle
se conserve par union dénombrable, le théorème de Baire suggère l’introduc-
tion, dans un espace métrique (M, d), d’une notion “métrique” de petitesse
d’une partie de M .
Définition. Soit (M, d) un espace métrique et A une partie de M . On dit
que A est rare si int adh A = ∅. On dit que A est maigre s’il existe une suite
!
(Ak )k∈N de parties rares Ak de M telle que A ⊂ k∈N Ak , c’est-à-dire s’il
!
existe une suite (Fk )k∈N de fermés d’intérieur vide telle que A ⊂ k∈N Fk .
On dit qu’une partie B de M est résiduelle si M \ B est maigre.
Toute partie dénombrable A d’un espace métrique (M, d) dans lequel
les singletons sont d’intérieur vide est évidemment maigre puisqu’elle peut
!
s’écrire sous la forme A = k∈N {ak } avec ak ∈ M, et que chaque {ak } est
rare. Par exemple, Q est maigre dans (R, |·|) et R\Q est résiduel dans (R, |·|).
On démontre facilement toute partie d’un ensemble maigre est maigre et que
l’union d’une famille au plus dénombrable de parties maigres d’un espace
métrique est maigre et le théorème de Baire exprime que toute partie maigre
d’un espace métrique complet est d’intérieur vide. D’autre part, B ⊂ M est
résiduel si et seulement s’il existe une suite (Ek )k∈N d’ouverts denses Ek de
7
M tels que B ⊃ k∈N Ek , et le théorème de Baire exprime encore que toute
partie résiduelle d’un espace métrique complet est dense dans cet espace. En
1931, les mathématiciens polonais Stefan Banach et Stefan Mazurkiewicz
ont utilisé le théorème de Baire pour démontrer que l’ensemble des fonctions
qui ont une dérivée à droite en au moins un point est maigre dans le sous-
espace BC(R, R) ⊂ B(R, R) des fonctions réelles bornées et continues sur
R!
On dit qu’une propriété P des points d’un espace métrique M est géné-
rique sur M si elle est vérifiée sur une partie résiduelle de M . L’étude des
propriétés génériques constitue une partie très active des mathématiques
actuelles.
Il est important de déterminer concrètement des parties denses d’un
espace métrique donné. Pour l’espace de Banach C(A; Rp), avec A un
fermé borné de Rn , on a l’important résultat suivant, qui porte le nom
de théorème d’approximation de Weierstrass, et montre que les re-
strictions à A des polynômes de Rn dans Rp forment une partie dense de
17.9. PARTIES DENSES ET ESPACES SÉPARABLES 709

C(A; Rp).
Théorème. Si A est un fermé borné de Rn et si f est une fonction de Rn
dans Rp continue sur A, alors, pour chaque ! > 0, il existe un polynôme P
de Rn dans Rp tel que

sup |f (x) − P (x)|2 ≤ !.


x∈A

Démonstration. En passant si nécessaire aux composantes de f et de P ,


on peut supposer, sans perte de généralité, que p = 1. Désignons par P(A)
l’ensemble des restrictions à A des polynômes de Rn dans R, et soit P(A)
son adhérence dans C(A; R). La démonstration se fait en plusieurs étapes.
a. Si g ∈ P(A) et si 0 ≤ g(x) ≤ 1 pour tout x ∈ A, alors g 1/2 ∈ P(A).
Soit g une telle fonction et (fk )k∈N la suite de fonctions de Rn dans R
définie par récurrence par
1
f0 = 0, fk+1 = fk + (g − fk2 ), (k ∈ N).
2
Par construction, si fk ∈ P(A), il en est de même de fk+1 , et dès lors (fk )k∈N
est une suite dans P(A). D’ailleurs, si 0 ≤ fk (x) ≤ g 1/2(x) pour tout x ∈ A,
on aura aussi
1
0 ≤ fk+1 (x) = fk (x) + [g 1/2(x) + fk (x)][g 1/2(x) − fk (x)]
2
≤ fk (x) + [g 1/2(x) − fk (x)] = g 1/2(x),
ce qui montre, puisque g0 = 0, que (fk )k∈N est une suite croissante de fonc-
tions positives et majorées par g 1/2 sur A. En conséquence, (fk )k∈N converge
ponctuellement sur A vers une fonction h qui vérifie l’égalité
1
h = h + (g − h2 ),
2
c’est-à-dire h = g 1/2. Comme g est continue sur A, il en est de même de h et
le théorème de Dini implique alors que la convergence de (fk )k∈N vers g 1/2
est uniforme sur A. Donc, si ! > 0 est donné, il existe un entier m ≥ 0 tel
que
!
sup |g 1/2(x) − fm (x)| ≤ ,
x∈A 2
et, comme fm ∈ P(A), il existe un Pm ∈ P(A) tel que
!
sup |fm (x) − Pm (x)| ≤ .
x∈A 2
710 CHAPITRE 17. ANALYSE FONCTIONNELLE

On en déduit aussitôt que

sup |g 1/2(x) − Pm (x)| ≤ !,


x∈A

et donc que g 1/2 ∈ P(A).


b. Si h ∈ P(A), alors |h| ∈ P(A).
Le résultat est trivial si h = 0. Si h /= 0, alors g = ( suph |h| )2 ∈ P(A) et
A
vérifie 0 ≤ g(x) ≤ 1 pour tout x ∈ A. Par la partie (a) de la démonstration,
g 1/2 = sup|h| |h| ∈ P(A), et il en est dès lors de même de |h|.
A
c. Si f 1 , . . . , f q appartiennent à P(A), alors

max(f 1 , . . ., f q ) et min(f 1 , . . ., f q )

appartiennent à P(A).
Il suffit de noter que
1 1
max(f 1 , f 2 ) = (f 1 + f 2 + |f 1 − f 2 |), min(f 1 , f 2 ) = (f 1 + f 2 − |f 1 − f 2 |),
2 2
et d’appliquer, de proche en proche, les résultats de (b).
d. Si ! > 0 est donné, il existe g ∈ P(A) tel que, pour tout x ∈ A, on a
! !
f (x) − ≤ g(x) ≤ f (x) + .
2 2
Si f ∈ C(A; R) et si u ∈ A et y ∈ A sont donnés, associons leur un
polynôme Pu,y de Rn dans R égal à f (y) en y et à f (u) en u, ce qui est
toujours possible. Comme la fonction Pu,y − f est continue et égale à 0 au
point y, il existe δ(y) > 0 tel que, pour tout x ∈ B2 [y; δ(y)], on ait
!
Pu,y (x) ≥ f (x) − .
2
On définit ainsi une jaugeA δ : y 2→Bδ(y) sur A et le lemme de Cousin entraı̂ne
l’existence d’une famille (y j , Aj ) 1≤j≤m telle que
m
>
A= Aj , y j ∈ Aj ⊂ B2 [y j ; δ(y j )], (1 ≤ j ≤ m).
j=1

Par la partie (c) de la démonstration, la fonction

gu = max(Pu,y1 , . . . , Pu,ym )
17.9. PARTIES DENSES ET ESPACES SÉPARABLES 711

appartient à P(A) et, par construction, est telle que gu (u) = 0, et, pour tout
x ∈ A,
!
gu (x) ≥ f (x) − .
2
Comme gu − f est continue et nulle au point u, il existe η(u) > 0 tel que,
pour tout x ∈ B2 [u; η(u)], on a
!
gu (x) ≤ f (x) + .
2
On définit ainsi une jaugeA η : u 2→Bη(u) sur A et le lemme de Cousin entraı̂ne
l’existence d’une famille (uj , B j ) 1≤j≤r telle que

r
>
A= B j , uj ∈ B j ⊂ B2 [uj ; η(uj )], (1 ≤ j ≤ r).
j=1

Par la partie (c) de la démonstration, la fonction

g = min(gu1 , . . . , gur ),

appartient à P(A) et, par construction, est telle que, pour tout x ∈ A, on a
! !
f (x) − ≤ g(x) ≤ f (x) + .
2 2
e. Si ! > 0 est donné, il existe P ∈ P(A) tel que, pour tout x ∈ A, on ait

f (x) − ! ≤ P (x) ≤ f (x) + !.

Par la partie d de la démonstration, il existe g ∈ P(A) tel que, pour tout


x ∈ A, on a
! !
f (x) − ≤ g(x) ≤ f (x) + ,
2 2
et, puisque g ∈ P(A), il existe P ∈ P(A) tel que, pour tout x ∈ A, on a
! !
g(x) − ≤ P (x) ≤ g(x) + .
2 2
On en déduit, que, pour tout x ∈ A, on a

f (x) − ! ≤ P (x) ≤ f (x) + !.


712 CHAPITRE 17. ANALYSE FONCTIONNELLE

Pour obtenir une classe de fonctions simples qui sera dense dans l’espace
¯ Rp),
L1 (I; où I est un un semi-pavé de Rn , on a besoin d’un second théo-
rème d’approximation des parties bornées et n-intégrables de Rn .

Proposition. Soit I ⊂ Rn un semi-pavé et A ⊂ I n-intégrable. Pour chaque


! > 0, il existe une famille finie (J k )1≤k≤q de semi-pavés mutuellement dis-
!
joints contenus dans I et tels que, si B = qk=1 J k , on a
J
|1A − 1B | ≤ !.
I

Démonstration. Si ! > 0 est donné, il existe, par le premier théorème


d’approximation des parties bornées n-intégrables, une suite (J k )k∈N de
semi-pavés mutuellement disjoints, contenus dans I tels que
> ∞
$ !
A⊂ J k et µ(J k ) ≤ µ(A) + .
k∈N k=0
2
!
C = k∈N J k est évidemment n-intégrable comme union d’une infinité dé-
nombrable de semi-pavés mutuellement disjoints contenus dans I, et
 
> ∞
$ !
µ(A) ≤ µ(C) = µ  J k
= µ(J k ) ≤ µ(A) + .
k∈N j=0
2

Soit q ∈ N tel que


q
$ !
µ(C) ≤ µ(J k ) + ,
k=0
2
!q
et soit B = k=0 J k ⊂ C. On a
J J J J J
|1A − 1B | ≤ |1A − 1C | + |1C − 1B | = (1C − 1A ) + (1C − 1B )
I I I I I
! !
= µ(C) − µ(A) + µ(C) − µ(B) ≤ + = !.
2 2

En procédant maintenant comme dans le corollaire du théorème d’appro-


ximation des fonctions de Rn dans R par des fonctions simples donné au
chapitre 13, si ce n’est qu’on remplace, dans la démonstration, l’emploi
de la définition de fonction n-mesurable par l’inégalité de Tchebycheff, on
démontre un second corollaire de ce théorème d’approximation, dont nous
conservons ici la terminologie.
17.9. PARTIES DENSES ET ESPACES SÉPARABLES 713

Corollaire. Soit I ⊂ Rn un semi-pavé et f une fonction de Rn dans R


définie et L-intégrable sur I. Alors, pour chaque k ∈ N, la fonction simple
construite dans le théorème d’approximation est combinaison linéaire de
fonctions caractéristiques de parties n-intégrables de I.
Introduisons maintenant la notion de fonction en escalier sur I.
Définition. Soit I un semi-pavé de Rn . On dit que la fonction f de Rn
dans Rp est en escalier sur I s’il existe une partition {I 1 , I 2 , . . ., I m } de I en
semi-pavés I j telle que f soit constante sur chaque int I j , (1 ≤ j ≤ m).
Il résulte aussitôt de cette définition qu’une fonction en escalier sur I est
définie p.p. sur I et son intégrale est particulièrement facile à calculer.
Proposition. Si I ⊂ Rn est un semi-pavé, si f est une fonction de Rn dans
Rp en escalier sur I et si, avec les notations de la définition, f j désigne la
valeur constante de f sur int I j , (1 ≤ j ≤ m), alors f est L-intégrable sur I
et J m
$
f= µ(I j )f j .
I j=1

Démonstration. Pour chaque 1 ≤ j ≤ m, la fonction fH, égale p.p. sur


I j à la fonction constante f j , est L-intégrable sur I j et I j f = µ(I j )f j .
L’intégrabilité de f sur I découle alors de l’additivité de l’intégrale, et l’on
procède de même pour |f |2 .
La densité des (classes d’équivalence) des fonctions en escalier sur I¯ dans
¯ Rp) découle du résultat suivant, appelé théorème d’approxi-
l’espace L1 (I;
mation des fonctions L-intégrables par les fonctions en escalier.
Théorème. Soit I un semi-pavé de Rn et f une fonction de Rn dans Rp
L-intégrable sur I. Alors, pour tout ! > 0, il existe une fonction g en escalier
sur I telle que J
|f − g|2 ≤ !.
I
Démonstration. En passant éventuellement aux composantes de f , on
peut supposer que p = 1. Par le corollaire ci-dessus et la remarque qui
termine la démonstration du théorème d’approximation par les fonctions
simples, il existe une suite (sk )k∈N de combinaisons linéaires de fonctions
caractéristiques de parties n-intégrables de I qui converge ponctuellement
p.p. sur I vers f et est telle que, pour presque tout x ∈ I, on a

|sk (x)| ≤ |s1k (x) − s2k (x)| ≤ s1k (x) + s2k (x) ≤ |f (x)|,
714 CHAPITRE 17. ANALYSE FONCTIONNELLE

(les notations sont celles du théorème d’approximation par les fonctions sim-
ples). Pour chaque k ∈ N, |sk − f | est L-intégrable sur I,

(sk − f )(x)| ≤ |sk (x)| + |f (x)| ≤ 2|f (x)|,

pour presque tout x ∈ I, et la suite (sk − f |)k∈N converge ponctuellement


p.p. sur I vers zéro. Le théorème de convergence dominée de Lebesgue
entraı̂ne alors que
J J
lim |sk − f | = lim |sk − f | = 0.
k→∞ I I k→∞

Soit ! > 0; il existe un entier m ≥ 0 tel que


J
!
|sm − f | ≤ .
I 2
D’autre part, sm peut s’écrire
r
$
sm (x) = ck 1Ak (x), (x ∈ Rn ),
k=1

où les ck sont des réels non nuls et les Ak des parties n-intégrables de I. Par
le second théorème d’approximation des parties bornées et n-intégrables, on
peut, pour chaque 1 ≤ k ≤ r, trouver une famille finie (J k,l )1≤l≤qk de semi-
!qk
pavés mutuellement disjoints contenus dans I et tels que, si Bk = s=1 J k,s ,
on ait J
!
|1Ak − 1Bk | ≤ .
I 2|ck |r
Dès lors, si nous posons
r
$
g= ck 1B k ,
k=1

la fonction g est en escalier sur I, et


J J J
|f − g| ≤ |f − sm | + |sm − g|
I I I
r J r J
! $ ! $
≤ + |ck (1Ak − 1Bk )| ≤ + |ck | |1Ak − 1Bk |
2 k=1 I 2 k=1 I

! !
≤ + = !.
2 2
17.9. PARTIES DENSES ET ESPACES SÉPARABLES 715

Une conséquence intéressante du théorème d’approximation des fonctions


L-intégrables et des propriétés de la convergence en moyenne est le résultat
suivant.
Corollaire. Soit I un semi-pavé de Rn et f une fonction de Rn dans Rp
L-intégrable sur I. Alors, il existe une suite (fk )k∈N de fonctions de Rn dans
Rp en escalier sur I qui converge vers f ponctuellement p.p. et en moyenne
sur I.
Démonstration. En prenant successivement ! = k+1 1
, (k ∈ N) dans
le théorème d’approximation, on obtient une suite (gk )k∈N de fonctions en
escalier sur I (et donc L-intégrables sur I) qui converge en moyenne sur I
vers f . Par une propriété de la convergence en moyenne, cette suite (gk )k∈N
possède une sous-suite (fk )k∈N = (gjk )k∈N qui converge ponctuellement p.p.
sur I vers f .
Une autre conséquence intéressante du théorème d’approximation des
fonctions intégrables est une caractérisation des fonctions n-mesura-
bles sur I.
Proposition. Soit I ⊂ Rn un semi-pavé et f une fonction de Rn dans R
définie p.p. sur I. Alors f est n-mesurable sur I si et seulement s’il existe
une suite (fk )k∈N de fonctions en escalier sur I qui converge ponctuellement
p.p. sur I vers f .
Démonstration. Condition suffisante. Comme chaque fk est L-intégrable
sur I, et donc n-mesurable sur I, f sera n-mesurable sur I.
Condition nécessaire. Comme f est n-mesurable sur I, il existe une suite
(gk )k∈N de fonctions simples sur I, formées de combinaisons linéaires de
fonctions caractéristiques de parties n-mesurables (et donc n-intégrables) de
I, et qui converge ponctuellement p.p. sur I vers f . Comme chaque gk est L-
intégrable sur I, le théorème d’approximation que nous venons de démontrer
entraı̂ne l’existence d’une fonction réelle hk en escalier sur I telle que
J
1
|hk − gk | ≤ .
I k
Donc la suite (hk − gk )k∈N converge en moyenne sur I vers zéro et contient
par conséquent une sous-suite (hjk − gjk )k∈N qui converge ponctuellement
p.p. sur I vers zéro. Alors, la suite (fk )k∈N = (hjk )k∈N de fonctions en
escalier sur I converge ponctuellement p.p. sur I vers f .
La notion de partie dense permet d’introduire une classe intéressante
d’espaces métriques.
716 CHAPITRE 17. ANALYSE FONCTIONNELLE

Définition. On dit qu’un espace métrique (M, d) est séparable si M est fini
ou s’il existe une partie A de M dénombrable et dense dans M .
Bien entendu, tout sous-espace métrique d’un espace métrique séparable
est séparable.
Exemples. 1. (Rn , | · |j ) (j = 1, 2, ∞) est séparable puisque Qn est dénom-
brable et dense dans Rn .
2. Si A ⊂ Rn est un fermé borné, alors C(A; Rp ) est séparable car il est facile
de montrer que l’ensemble des polynômes de Rn dans Rp à coefficients dans
Qp est dénombrable. D’autre part, cet ensemble est dense dans C(A; Rp) en
vertu du théorème d’approximation de Weierstrass et de la densité de Qp
dans Rp .
¯ Rp) est séparable car il est facile de montrer que le sous-ensemble
3. L1 (I;
des (classes d’équivalence) de fonctions en escalier sur I¯ à valeurs dans Qp
est dénombrable. D’autre part, cet ensemble est dense dans L1 (I; ¯ Rp) en
vertu du théorème d’approximation ci-dessus et de la densité de Qp dans
Rp .

17.10 Bornés et compacts


On peut introduire la notion de partie bornée d’un espace métrique.
Définition. Soit (M, d) un espace métrique et E ⊂ M . On dit que E est
une partie bornée ou un borné de M s’il existe a ∈ M et r > 0 tels que
E ⊂ B[a; r].
On montre sans peine que cette définition est équivalente, pour (Rn , |·|j ),
(j = 1, 2, ∞), à celle donnée précédemment. On démontre, comme dans le
cas de Rn , les propriétés suivantes.
Proposition. Si A est un ensemble quelconque non vide et (Eα)α∈A une
7
famille de bornés Eα de M , alors α∈A Eα est un borné de M . Si (Ej )1≤j≤m
!
est une famille finie de bornés Ej de M , alors 1≤j≤m Ej est un borné de
M. Enfin, si E ⊂ M est borné, alors int E, adh E et fr E sont bornés.
On a vu précédemment que les parties fermées et bornées de Rn jouissent
de propriétés particulièrement intéressantes dues au fait que ces parties ont
la propriété de Cousin. Celle-ci se généralise facilement à un espace métrique
quelconque, mais une partie fermée et bornée d’un tel espace ne possède plus
nécessairement la propriété de Cousin. C’est donc par cette propriété ou par
une propriété équivalente qu’il faudra caractériser, dans un espace métrique
quelconque, les parties qui y joueront le rôle des fermés bornés de Rn .
17.10. BORNÉS ET COMPACTS 717

Si (M, d) est un espace métrique et E ⊂ M , on appellera jauge sur E


toute application de E dans R∗+ .
Définition. Soit (M, d) un espace métrique et E une partie non vide de M .
On dit que E vérifie la propriété de Cousin si, pour chaque jauge
A
δ surB
E, il
existe une division δ-fine de E, c’est-à-dire une famille finie (xj , E j ) 1≤j≤m
telle que
m
>
E= E j , xj ∈ E j ⊂ B[xj ; δ(xj )], (1 ≤ j ≤ m).
j=1
Nous allons voir que cette propriété peut se formuler, d’une manière
équivalente, en termes d’ouverts. Une définition préliminaire est nécessaire.
Définition. Soit (M, d) un espace métrique et E une partie de M . Un
recouvrement de E est une famille F = (Fα )α∈A de parties Fα de M telle
que >
E⊂ Fα .
α∈A
On dit aussi que F recouvre E. Le recouvrement F = (Fα)α∈A de E est
dit fini si A est fini et ouvert si, pour chaque α ∈ A, Fα est ouvert. Si
F = (Fα)α∈A est un recouvrement de E et si à ⊂ A est tel que F̃ = (Fα )α∈Ã
recouvre E, on dit que F̃ est un sous-recouvrement de E extrait de F ou
que le recouvrement F̃ de E contient le sous-recouvrement F̃ de E.

Définition. Soit (M, d) un espace métrique et E une partie de M . On dit


que E possède la propriété de Borel-Lebesgue si tout recouvrement ouvert
F de E contient un sous-recouvrement fini de E.
Nous allons montrer que les propriétés de Cousin et de Borel-Lebesgue
sont équivalentes.
Proposition. Soit (M, d) un espace métrique et E une partie non vide de
M . Alors E a la propriété de Cousin si et seulement si E a la propriété de
Borel-Lebesgue.
Démonstration. Condition nécessaire. Soit F = (Fα )α∈A un recouvre-
ment ouvert de E. Alors, pour chaque x ∈ E, il existe un α(x) ∈ A tel
que x ∈ Fα(x) , et comme Fα(x) est ouvert, il existe un δ(x) > 0 tel que
B[x; δ(x)] ⊂ Fα(x). On définit ainsi une jauge δ : x 2→ δ(x)
A
sur E B
et la pro-
priété de Cousin entraı̂ne l’existence d’une famille finie (xj , E j ) 1≤j≤m telle
que
m
>
E= E j , xj ∈ E j ⊂ B[xj ; δ(xj )], (1 ≤ j ≤ m),
j=1
718 CHAPITRE 17. ANALYSE FONCTIONNELLE

et donc telle que


m
> m
>
E⊂ B[xj ; δ(xj )] ⊂ Fα(xj ) .
j=1 j=1

En conséquence, (Fα(xj ) )1≤j≤m est un sous-recouvrement fini de E extrait


de F .
Condition suffisante. Soit δ une jauge sur E. Alors (B(x; δ(x)))x∈E est un re-
couvrement
A
ouvertB
de E, et, par hypothèse, il contient un sous-recouvrement
fini B(x ; δ(x )) 1≤j≤m de E. En posant, pour chaque 1 ≤ j ≤ m, E j =
j j

E ∩ B(xj ; δ(xj )), on voit que


m
> m
>
E=E∩ B(xj ; δ(xj )) = Ej,
j=1 j=1

et, pour chaque 1 ≤ j ≤ m,

xj ∈ E ∩ B(xj ; δ(xj )) = E j ⊂ B[xj ; δ(xj )].

On est ainsi conduit à la définition suivante.


Définition. Soit (M, d) un espace métrique et E une partie de M . On dit
que E est une partie compacte de M ou est un compact de M s’il possède
la propriété de Borel-Lebesgue. En particulier, si M possède la propriété de
Borel-Lebesgue, on dit que M est un espace métrique compact.
La propriété de compacité est intrinsèque dans le sens suivant.
Proposition. Soit (M, d) un espace métrique et E une partie de M . Alors
E est une partie compacte de M si et seulement si le sous-espace métrique
(E, d) est un espace métrique compact.
Démonstration. Condition nécessaire. Soit F = (Fα )α∈A un recouvre-
ment de E par des ouverts Fα de E; on sait alors que, pour chaque α ∈ A, il
existe un ouvert F̃α de M tel que Fα = F̃α ∩E. En conséquence, F̃ = (F̃α )α∈A
est un recouvrement de E par des ouverts de M et il contient donc, par hy-
pothèse, un sous-recouvrement fini (F̃αj )1≤j≤m de E. En conséquence,
m
> m
>
E=E∩ F̃αj = Fαj ,
j=1 j=1

et (E, d) est un espace métrique compact.


Condition suffisante. Soit F = (Fα)α∈A un recouvrement de E par des
17.10. BORNÉS ET COMPACTS 719

ouverts Fα de M ; on sait alors que, pour chaque α ∈ A, F̂α = Fα ∩ E est


un ouvert de (E, d). En conséquence, F̂ = (F̂α)α∈A est un recouvrement
de E par des ouverts de (E, d) et il contient donc, par hypothèse, un sous-
recouvrement fini (F̂αj )1≤j≤m de E. En conséquence,
m
> m
>
E⊂ F̂αj ⊂ Fαj ,
j=1 j=1

et (Fαj )1≤j≤m est donc un sous-recouvrement fini de E extrait de F .


Exemples. 1. ∅ est compact.
2. Toute partie finie d’un espace métrique (M, d) est compacte. En effet, si
E = {x1 , . . . , xm} est une partie finie de M et si F = (Fα )α∈A est un recou-
vrement ouvert de E, alors, pour chaque 1 ≤ j ≤ m, il existe un αj ∈ A tel
que xj ∈ Fαj , et (Fαj )1≤j≤m est donc un sous-recouvrement de E extrait de
F.
3. Si (ak )k∈N est une suite dans M qui converge vers b ∈ M , alors l’ensemble
!
E = {b} ∪ k∈N {ak } est compact. En effet, soit F = (Fα)α∈A un recouvre-
ment ouvert de E. Il existe donc un α−1 ∈ A tel que b ∈ Fα−1 et comme
Fα−1 est ouvert, il existe r > 0 tel que B[b; r] ⊂ Fα−1 . Comme b est limite
de la suite, il existera alors un entier m ≥ 0 tel que, pour tout entier k ≥ m,
on ait
ak ∈ B[b; r] ⊂ Fα−1 .
D’ailleurs, pour chaque 0 ≤ k ≤ m − 1, il existe un αk ∈ A tel que ak ∈ Fαk ;
en conséquence, (Fαk )−1≤k≤m−1 est un sous-recouvrement de E extrait de
F.
4. Dans (Rn , | · |j ) (j = 1, 2 ou ∞, les compacts sont les fermés bornés. C’est
une conséquence de l’équivalence entre la propriété d’être fermé et borné, la
propriété de Cousin et la propriété de Borel-Lebesgue.
Donnons maintenant quelques conditions nécessaires pour qu’un ensem-
ble soit compact. Les deux premières ont déjà été démontrées dans Rn à
partir de la propriété de Cousin. Nous utiliserons ici la propriété de Borel-
Lebesgue pour nous familiariser avec sa formulation.
Proposition. Tout compact d’un espace métrique est borné.
Démonstration. Soit E un compact dans l’espace métrique (M, d). La
famille (B(x; 1))x∈E estA un recouvrement
B
ouvert de E qui contient donc un
!
sous-recouvrement fini B(xj ; 1) 1≤j≤m . En conséquence, E ⊂ mj=1 B(x ; 1)
j

est contenu dans un borné et est donc borné.


720 CHAPITRE 17. ANALYSE FONCTIONNELLE

Proposition. Tout compact d’un espace métrique est fermé.


Démonstration. Soit E un compact dans l’espace métrique (M, d). Il faut
démontrer que M \E est ouvert
8 dans M9. Soit a ∈ M \E; Comme d(x, a) > 0
pour chaque x ∈ E, F = B(x; d(x,a) 2 ) est un recouvrement ouvert de
x∈E 8 9
j
E, et F contient donc un sous-recouvrement fini B(xj ; d(x2,a)) de
1≤j≤m
E. En conséquence, , -
m
>
d(xj , a)
E⊂ B x; , j

j=1
2

et, par construction,


, -
d(xj , a)
a /∈ B x ; j
, (1 ≤ j ≤ m).
2

En conséquence,
m
, -
>
d(xj , a)
a∈M \ B x; j
⊂ M \ E,
j=1
2

! D E
d(xj ,a)
Comme m j=1 B x ;
j
2 est fermé, a appartient à un ouvert contenu dans
M \ E, c’est-à-dire M \ E ⊂ int (M \ E).

Proposition. Tout fermé contenu dans un compact d’un espace métrique


(M, d) est un compact de (M, d).
Démonstration. Soit E un compact de (M, d) et F ⊂ E un fermé de
M . Soit F = (Fα )α∈A un recouvrement ouvert de F . Comme F est fermé,
M \ F est ouvert et, si l’on pose à = {a} ∪ A, Fa = M \ F , où a /∈ A, alors
F̃ = (Fα)α∈Ã est évidemment un recouvrement ouvert de E. Il contient donc
un sous-recouvrement fini (Fαj )1≤j≤m de E, et la famille (Fαj )αj (=a;1≤j≤m
sera un sous-recouvrement fini de F extrait de F .
La propriété de compacité peut également s’exprimer en termes de suites.
La définition suivante est l’extension triviale de la notion correspondante
dans Rn .
Définition. Soit (M, d) un espace métrique et (ak )k∈N une suite dans M .
On dit que b ∈ M est un point d’accumulation de la suite (ak )k∈N si

(∀! > 0)(∀m ∈ N)(∃k ∈ N : k ≥ m) : d(ak , b) ≤ !.


17.10. BORNÉS ET COMPACTS 721

Le théorème de Bolzano-Weierstrass affirme que toute suite bornée dans


Rp possède un point d’accumulation. Si l’on prend l’adhérence de l’image
d’une telle suite, celle-ci prend ses valeurs dans un fermé borné, donc un
compact, et il est facile de montrer que le point d’accumulation appartient
au compact. Sous cette forme, ce résultat est vrai dans un espace métrique
quelconque. C’est la propriété de Bolzano-Weierstrass.
Proposition. Soit (M, d) un espace métrique et E un compact non vide
de M . Toute suite (ak )k∈N dans E possède un point d’accumulation appar-
tenant à E.
Démonstration. Il faut donc démontrer que

(∃b ∈ E)(∀! > 0)(∀m ∈ N)(∃k ∈ N : k ≥ m) : d(ak , b) ≤ !.

Si ce n’est pas le cas, alors

(∀b ∈ E)(∃!b > 0)(∃mb ∈ N)(∀k ∈ N : k ≥ mb ) : d(ak , b) > !b .

Comme (B(b; !b))b∈E


8
est un 9recouvrement ouvert de E, il contient un sous-
recouvrement fini B(bj ; !bj ) de E. Dès lors, pour chaque 1 ≤ j ≤ m,
1≤j≤m
on a, pour tout entier k ≥ mbj , d(ak , bj ) > !bj , c’est-à-dire ak /∈ B[bj ; !bj ].
En conséquence, pour tout entier k ≥ q = max{mbj : 1 ≤ j ≤ m}, on aura
!
ak /∈ mj=1 B[bj ; !bj ], et donc ak /∈ E, ce qui est contradictoire.

Remarques. 1. On peut démontrer, mais nous ne le ferons pas ici, que


la propriété de Bolzano-Weierstrass caractérise également les compacts d’un
espace métrique.
2. On étend sans peine la notion de sous-suite au cas d’une suite dans
un espace métrique et l’on démontre, comme dans Rn , que b est un point
d’accumulation d’une suite (ak )k∈N dans un espace métrique si et seulement
si (ak )k∈N contient une sous-suite qui converge vers b.
On a la relation suivante entre espace métrique compact et espace métri-
que complet.
Corollaire. Tout espace métrique compact est complet.
Démonstration. Soit (M, d) un espace métrique compact et soit (ak )k∈N
une suite de Cauchy dans M . Comme M est compact, (ak )k∈N possède un
point d’acculumation b ∈ M et il suffit de montrer que b = limk→∞ ak . Soit
! > 0; comme (ak )k∈N est une suite de Cauchy, il existe un entier m tel que,
pour tout entier j ≥ m et tout entier q ≥ m, on ait d(aj , aq ) ≤ 2! . D’ailleurs,
722 CHAPITRE 17. ANALYSE FONCTIONNELLE

comme b est un point d’accumulation de (ak )k∈N , il existe k ≥ m tel que


d(ak , b) ≤ 2! . Dès lors, en prenant q = k, on voit que
! !
(∀j ≥ m) : d(aj , b) ≤ d(aj , ak ) + d(ak , b) ≤ + = !.
2 2

Il est utile de donner des conditions explicites pour qu’un fermé borné
d’un espace métrique soit compact. Dans le cas de C(A; Rp) avec A un
fermé borné (c’est-à-dire un compact) de Rn , ces conditions reposent sur la
notion de partie équi-uniformément continue de l’ensemble C(M, M $ ) des
applications continues d’un espace métrique (M, d) dans un espace métrique
(M $ , d$ ).
Donnons d’abord l’extension immédiate aux fonctions entre espaces mé-
triques de la notion de continuité uniforme.
Définition. Soient (M, d) et (M $ , d$ ) des espaces métriques et f une fonc-
tion de M dans M $ définie au moins sur M . On dit que f est uniformément
continue sur M si
(∀! > 0)(∃δ > 0)(∀x ∈ M )(∀y ∈ dom f : d(y, x) ≤ δ) : d$ (f (y), f (x)) ≤ !.
Par exemple, toute application de M dans M $ lipschitzienne sur M est
uniformément continue sur M .
Définition. Soient (M, d) et (M $ , d$) des espaces métriques et E une partie
de C(M, M $ ). On dit que E est équi-uniformément continu ou également
continu si
(∀! > 0)(∃δ > 0)(∀f ∈ E)(∀x ∈ M )(∀y ∈ M : d(y, x) ≤ δ) :
d$ (f (y), f (x)) ≤ !.
Les éléments d’un tel ensemble E sont donc des applications de M dans
M $ uniformément continues sur M et telles que, pour chaque ! > 0 donné,
le δ correspondant puisse convenir pour tous les f ∈ E. Par exemple, si tous
les éléments de A sont des applications lipschitziennes de même constante
sur M , alors A est équi-uniformément continu.
Le théorème d’Ascoli-Arzela affirme que les compacts de C(A; Rp)
sont les parties fermées, bornées et équi-uniformément continues de cet es-
pace. Nous nous contenterons de démontrer ici que les parties fermées,
bornées et équi-uniformément continues de C(A; Rp) ont la propriété de
Bolzano-Weierstrass. Nous aurons besoin pour ce faire d’une intéressante
condition suffisante de convergence uniforme d’une suite contenue dans une
partie équi-uniformément continue de C(A; Rp).
17.10. BORNÉS ET COMPACTS 723

Proposition. Soit E une partie bornée de Rn , D ⊂ E dense par rapport à


E et (fk )k∈N une suite de fonctions de Rn dans Rp définies sur E et telles
que l’ensemble {fk |E : k ∈ N} soit équi-uniformément continu. Si (fk )k∈N
converge ponctuellement sur D, alors (fk )k∈N converge uniformément sur E.
Démonstration. Soit ! > 0. Comme {fk |E : k ∈ N} est équi-uniformé-
ment continu,

(∃δ > 0)(∀k ∈ N)(∀x ∈ E)(∀y ∈ E : |x − y|2 ≤ δ) :

!
|fk (x) − fk (y)|2 ≤ .
3
Puisque E est borné, on peut trouver une famille finie (Bj )1≤j≤q de boules
!
ouvertes de rayon inférieur ou égal à δ2 telles que E ⊂ qj=1 Bj et E ∩ Bj /= ∅,
(1 ≤ j ≤ q). D étant dense par rapport à E, il existe, pour chaque 1 ≤ j ≤ q,
un yj ∈ D ∩ Bj . Par la convergence ponctuelle sur D de (fk )k∈N , il existe un
entier m ≥ 0 tel que, pour tous les entiers 1 ≤ j ≤ q, k ≥ m et l ≥ m, on a
!
|fk (yj ) − fl (yj )|2 ≤ .
3

Soit x ∈ E; il existe i = i(x) ∈ {1, 2, . . ., q} tel que x ∈ Bi . Par conséquent,


|x − yi |2 ≤ δ et |fk (x) − fk (yi )|2 ≤ 3! pour tout k ∈ N. Dès lors, pour tout
k ≥ m et l ≥ m, on aura

|fk (x) − fl (x)|2 ≤ |fk (x) − fk (yi ))|2 + |fk (yi ) − fl (yi )|2

! ! !
+|fl (yi ) − fl (x)|2 ≤ + + = !.
3 3 3

Démontrons maintenant la partie suffisante du théorème d’Ascoli-Arzela.


Théorème. Soit A un fermé borné de Rn et B une partie bornée, fermée
et équi-uniformément continue de l’espace de Banach C(A; Rp). Alors, toute
suite dans B contient une sous-suite qui converge dans C(A; Rp) vers un
élément de B.
Démonstration. Soit (fk )k∈N une suite dans B. Puisque Rn est séparable,
A contient un sous-ensemble dénombrable et dense D = {xj : j ∈ N}. En
vertu de la Proposition précédente, il suffit de trouver une sous-suite
A B
de
(fk )k∈N qui converge ponctuellement sur D. Comme la suite fk (x0 ) k∈N
724 CHAPITRE 17. ANALYSE FONCTIONNELLE

est bornée dans Rp (B étant borné), il résulte du théorème


8 9de Bolzano-
Weierstrass qu’elle possède une sous-suite convergente fj 0 (x )
0 . De mê-
8 9 k k∈N
me, la suite fj 0 (x )
1 , bornée dans Rp , possède une sous-suite conver-
8 9k k∈N
gente fj 1 (x1 ) . En continuant de la sorte, pour chaque entier l ≥ 1, on
k k∈N 8 9
obtient à partir de la suite bornée fj l−1 (xl ) , une sous-suite convergente
8 9 k k∈N
8 9
fj l (xl ) . Mais alors la suite “diagonale” fj k est une sous-suite de
k k∈N k k∈N
(fk )k∈N qui converge ponctuellement
8 sur
9 D puisque, si x ∈ D est donné,
i

alors, par construction, la suite fj k (xi ) est une sous-suite de la suite


k k∈N,k≥i
convergente (fj i (xi ))k∈N, et est donc convergente.
k

Une belle application du théorème d’Ascoli-Arzela est fournie par la


démonstration de Leonida Tonelli du théorème d’existence de Peano
pour les équations différentielles.
Théorème. Soit I = [a, b] ⊂ R un intervalle fermé non vide et f : I × Rn →
Rn une application continue. Si, en outre, f est bornée sur I × Rn , alors,
pour chaque y0 ∈ Rp, le problème de Cauchy

y $ (x) = f (x, y(x)), (x ∈ I), y(a) = y0

possède au moins une solution.


Démonstration. Pour chaque entier n ≥ 1, définissons l’application yn :
[a, b] → Rp comme suit :
2 3
b−a
yn (x) = y0 si x ∈ a, a + ,
n
J x− b−a 3 3
n b−a
yn (x) = y0 + f (s, yn (s)) ds si x ∈ a + ,b .
a n
Le changement de variable s = t − b−a
n permet d’écrire la seconde formule
sous la forme
J x 4 5
b−a b−a
yn (x) = y0 + f t− , yn (t − ) dt,
a+ b−a
n
n n

et montre que yn est explicitement définie puisque, sur


2 3
j(b − a) (j + 1)(b − a)
a+ ,a+ ,
n n
17.10. BORNÉS ET COMPACTS 725
D E
l’intégrale ne fait intervenir que les valeurs de yn sur a, a + j(b−a)
n . Soit
M > 0 tel que |f (x, y)|2 ≤ M pour tout x ∈ [a, b] et y ∈ Rp . On a
2 3
$ b−a $
|yn (x) − yn (x )|2 = 0 si x, x ∈ a, a + ,
n
#J # # #
# x− b−a # # b − a ##
$ # n #
|yn (x)−yn (x )|2 = # f (s, yn (s)) ds# ≤ M ##x − a − ≤ M |x−x$ |
# a # n # 2

si a ≤ x$ ≤a+ b−a
n ≤ x ≤ b, et
#J #
# x− b−a #
# $ n #
|yn (x) − yn (x )|2 = # f (s, yn (s)) ds# ≤ M |x − x$ |
# x" − b−a #
n 2
D E
si x, x$ ∈ a + b−a
n ,b . En particulier, pour x$ = a, on a

|yn (x) − y0 |2 ≤ M (b − a)

pour tout x ∈ [a, b], et dès lors la suite (yn )n∈N appartient à la partie bornée
et équi-uniformément continue

B = {y ∈ C([a, b], Rp) : |y(x) − y0 |2 ≤ M (b − a),

|y(x) − y(x$ )|2 ≤ M |x − x$ |, (x, x$ ∈ [a, b])}


de C([a, b], Rp). Elle contient donc une sous-suite (ynk )k∈N qui converge uni-
formément sur [a, b] vers une fonction y ∈ C([a, b], Rp). Comme
J x J x
ynk (x) = y0 + f (s, ynk (s)) ds − f (s, ynk (s)) ds, (k ∈ N),
a x− b−a
n k

on trouve, en faisant tendre k vers l’infini, que


J x
y(x) = y0 + f (s, y(s)) ds, (x ∈ [a, b]),
0

puisque J J
x x
lim f (s, ynk (s)) ds = f (s, y(s)) ds,
k→∞ a a
# #
#J x #
# ≤ M (b − a) ,
# #
#
# f (s, ynk
(s)) ds# (k ∈ N).
b−a
# x− nk # nk

Donc y est de classe C 1 sur [a, b] et solution du problème de Cauchy de


condition initiale y(a) = y0 .
726 CHAPITRE 17. ANALYSE FONCTIONNELLE

Remarque. On comparera utilement les hypothèses et les conclusions des


théorèmes de Cauchy-Picard et de Peano. Les conditions du théorème de
Peano n’assurent pas l’unicité de la solution comme le montre l’exemple
y $ (x) = f (y(x)), y(0) = 0,

avec f (y) = 0 si y < 0, f (y) = y si y ∈ [0, 1] et f (y) = 1 si y > 1, qui
2
admet sur [0, 1] les deux solutions y(x) = 0 et y(x) = x4 , ainsi qu’on le
vérifie aisément.
Comme dans Rn , la continuité d’une fonction sur un ensemble compact
entraı̂ne sa continuité uniforme : c’est l’extension du théorème de Heine.
On peut la démontrer en adaptant la démonstration basée sur la propriété
de Cousin. Faisons-le en utilisant la propriété de Borel-Lebesgue.
Proposition. Soient (M, d) et (M $ , d$ ) des espaces métriques, E ⊂ M un
compact non vide et f une fonction de M dans M $ continue sur E. Alors f
est uniformément continue sur E.
Démonstration. Soit ! > 0; par la continuité de f sur E,
!
(∀x ∈ E)(∃δ(x) > 0)(∀y ∈ dom f : d(y, x) ≤ δ(x)) : d$ (f (y), f (x)) ≤ .
2
8 9
F = B(x; δ(x)
2 ) est un recouvrement ouvert de E et il contient donc
x∈E 8 9
j j)
un sous-recouvrement fini B(xj ; δ(x2 ) ) de E. Posons δ = min{ δ(x2 :
1≤j≤m 8 9
j
1 ≤ j ≤ m}. Si x ∈ E, il existe un 1 ≤ j ≤ m tel que x ∈ B xj ; δ(x2 )
, et
dès lors tel que d (f (x), f (x )) ≤ 2 . Si y ∈ dom f est tel que d(y, x) ≤ δ,
$ j !

alors,
δ(xj )
d(y, xj ) ≤ d(y, x) + d(x, xj ) ≤ δ + ≤ δ(xj ),
2
et dès lors
!
d$ (f (y), f (xj )) ≤ .
2
En conséquence,
! !
d$ (f (y), f (x)) ≤ d$ (f (y), f (xj )) + d$ (f (xj ), f (x)) ≤ + = !.
2 2

On peut également généraliser le théorème des bornes atteintes de


Weierstrass. La démonstration repose sur une généralisation aux espaces
métriques d’une caractérisation en termes d’ouverts des fonctions continues
de Rn dans Rp .
17.10. BORNÉS ET COMPACTS 727

Lemme. Soient (M, d) et (M $ , d$ ) des espaces métriques, et f une applica-


tion de M dans M $ . Alors f est continue sur M si et seulement si, pour tout
ouvert V de M $ , f −1 (V ) est un ouvert de M.

Démonstration. Condition nécessaire. Soit V un ouvert de M $ ; si f −1 (V )


= ∅, le théorème est démontré. Sinon, si a ∈ f −1 (V ), l’ouvert V contient f (a)
et est donc un voisinage de f (a); par la caractérisation de la continuité en a
en termes de voisinages, il existera un voisinage Ua de a tel que f (Ua) ⊂ V,
et, puisque Ua contient toujours un voisinage ouvert de A (par exemple
B(a; r) pour r > 0 suffisamment petit), on peut supposer, sans perte de
généralité, que Ua est ouvert dans M . On a donc, pour chaque a ∈ f −1 (V ),
Ua ⊂ f −1 (V ), et dès lors
>
f −1 (V ) ⊂ Ua ⊂ f −1 (V ),
a∈f −1(V )

!
c’est-à-dire f −1 (V ) = U si U désigne l’ouvert a∈f −1(V ) Ua de M .
Condition suffisante. Soit a ∈ M , V un voisinage de f (a) et W ⊂ V un voisi-
nage ouvert de f (a). Par hypothèse, U = f −1 (W ) est un ouvert contenant
a, et donc un voisinage de a tel que

f (U ) = f [f −1 (W )] = W ⊂ V,

ce qui entraı̂ne la continuité de f en a.

Proposition. Soient (M, d) et (M $ , d$) des espaces métriques. Si f est une


application de M dans M $ continue sur M et si M est compact, alors f (M )
est un compact de M $ .

Démonstration. Soit F = (Fα )α∈A un recouvrement ouvert de f (M ).


Comme f est continue sur M , le lemme précédent entraı̂ne que, pour chaque
α ∈ A, il existe un ouvert Vα de M tel que f −1 (Fα ) = Vα. Dès lors (Vα)α∈A
est un recouvrement ouvert de l’espace métrique compact M et il contient
un sous-recouvrement fini (Vαj )1≤j≤m . On en déduit aussitôt que
8 9
(Fαj )1≤j≤m = f (Vαj )
1≤j≤m

recouvre f (M ).
728 CHAPITRE 17. ANALYSE FONCTIONNELLE

Corollaire. Soit (M, d) un espace métrique compact et f une application


de M dans R continue sur M . Alors f possède un maximum et un minimum
sur M .
Démonstration. Par la proposition précédente, f (M ) est un compact de
(R, | · |) et donc un fermé borné; il est donc majoré et minoré et, puisque
f (M ) est fermé,

sup f (M ) ∈ adh f (M ) = f (M ), inf f (M ) ∈ adh f (M ) = f (M ).

Ce Corollaire fournit une condition suffisante pour qu’une fonction réelle


définie sur un espace métrique possède un maximant et un minimant sur cet
ensemble. Pour pouvoir localiser ce maximant ou ce minimant, il est utile de
trouver des conditions nécessaires d’existence d’un tel extrémant, et de telles
conditions peuvent se déduire, comme pour les fonctions réelles définies sur
une partie de Rn , de conditions nécessaires d’extrémants locaux. C’est ce
problème qui sera abordé dans la section suivante.

17.11 Calcul des variations


Si a < b et c, d sont des réels fixés, un cas particulier du problème des
géodésiques consiste à déterminer, parmi les applications y : [a, b] → R de
classe C 1 sur I = [a, b] et telles que y(a) = c, y(b) = d, celles pour lesquelles
la longueur de l’arc de courbe correspondant γ : I → R2 , x 2→ (x, y(x))
est minimale. Géométriquement, cela revient à rechercher, parmi les arcs
de courbe ayant une représentation paramétrique de type γ et joignant les
points (a, c) et (b, d) de R2 , celui ou ceux qui minimisent la distance. On a
vu précédemment que la longueur de l’arc de courbe de représentation γ est
donnée par
J b
λ(y) = (1 + y $2 )1/2.
a

Si nous désignons par C 1 (I; R) l’espace vectoriel des applications y de I


dans R qui sont de classe C 1 sur R, alors la formule qui précède définit une
application λ de C 1 (I; R) dans R dont il faut déterminer les minimants sur
le sous-ensemble

H = {y ∈ C 1 (I; R) : y(a) = c, y(b) = d}.


17.11. CALCUL DES VARIATIONS 729

Notons que H n’est pas un sous-espace vectoriel de C 1 (I; R) mais que si y


et z appartiennent à H, alors y − z ∈ C01 (I; R) où C01 (I; R) est le sous-espace
vectoriel
C01 (I; R) = {u ∈ C 1 (I; R) : u(a) = u(b) = 0}
de C 1 (I; R). Tout élément de H peut donc s’écrire sous la forme

H = y0 + C01 (I; R) = {y0 + u : u ∈ C01 (I; R)},

où y0 (x) = c + x−a


b−a (d − c). C’est donc un sous-espace affine de C (I; R). Si
1

l’on veut considérer, ce qui est utile, la notion d’extrémant local de λ sur
H, il faut pouvoir définir la notion de voisinage d’un point dans H. C’est
possible en munissant H d’une métrique et l’on choisira une métrique d de
la forme d(y, z) = 6y − z6, où 6 · 6 est une norme sur C01 (I; R).
D’une manière générale, si (E, 6 · 6) est un espace vectoriel normé sur R,
y0 ∈ E, (E0 , 6 · 6) un sous-espace vectoriel normé de E et ϕ une application
de E dans R, on est conduit à étudier les extrémants de ϕ sur H = y0 + E0
muni de la distance d(y, z) = 6y − z6.
Définition. Dans les conditions ci-dessus, on dit que y ∈ H est un maxi-
mant (resp. minimant) local de ϕ sur H s’il existe un voisinage V de y dans
H tel que, pour tout z ∈ V , on ait

ϕ(z) ≤ ϕ(y) (resp. ϕ(z) ≥ ϕ(y)).

On dira que y ∈ H est un extrémant local de ϕ sur H s’il est un maximant


local ou un minimant local de ϕ sur H.
Sous des hypothèses adéquates de dérivabilité, on peut donner, dans
cette situation, une condition nécessaire du type de Fermat d’existence d’un
extrémant local sur H. On l’appelle souvent la condition nécessaire d’Eu-
ler.
Proposition. Soit (E, 6 · 6) est un espace vectoriel normé sur R, y0 ∈ E,
(E0 , 6 · 6) un sous-espace vectoriel de E, ϕ une application de E dans R. Si
y ∈ H est un extrémant local de ϕ sur H et si, pour u ∈ E0 , l’application
de R dans R ϕy,u : s 2→ ϕ(y + su) est dérivable en s = 0, alors

ϕ$y,u (0) = 0.

Démonstration. Elle est tout à fait identique à celle du théorème de


Fermat pour une fonction de Rn dans R. Si, pour fixer les idées, y est un
minimant local de ϕ sur H, si V est le voisinage de y donné par la définition
730 CHAPITRE 17. ANALYSE FONCTIONNELLE

et siDr > 0 est Etel que B[y; r] ⊂ V , alors, pour chaque u ∈ E0 \ {0} et chaque
s ∈ − 2u2r r
, 2u2 , on a 6su6 ≤ r et donc y + su ∈ V, et dès lors

ϕ(y + su) ≥ ϕ(y).


E E D D
En particulier, pour s ∈ 0, 2u2
r
(resp. s ∈ − 2u2
r
, 0 ), on aura

ϕ(y + su) − ϕ(y) ϕ(y + su) − ϕ(y)


≥ 0, (resp. ≤ 0).
s s
En faisant tendre s vers 0 dans ces inégalités, on trouve 0 ≤ ϕ$y,u (0) ≤ 0.
Un élément y ∈ H pour lequel ϕ$y,u (0) = 0 pour tout u ∈ E0 est appelé
un point critique ou un point stationnaire de ϕ sur H.
L’exemple des géodésiques qui nous a servi d’introduction suggère la
considération du cas particulier important suivant qui constitue le problème
fondamental du calcul des variations. Soit I = [a, b], p ≥ 1 un entier et

f : I × Rp × Rp → R, (x, y, z) 2→ f (x, y, z)

une application continue sur I × Rp × Rp et telle que les fonctions dérivées


partielles Dyj f et Dzj f existent et soient continues sur I × Rp × Rp . En
désignant par C 1 (I; Rp) l’espace vectoriel sur R des applications y : I → Rp
de classe C 1 sur I, on
Hb
peut associer à f l’application ϕ de C 1 (I, Rp) dans R
définie par ϕ(y) = a f [x, y(x), y $(x)] dx. Cette application est bien définie
puisque l’intégrand est une fonction continue sur I. Le cas particulier des
géodésiques du plan correspond à p = 1 et f (x, y, z) = (1 + z 2 )1/2. Si c ∈ Rp
et d ∈ Rp sont fixés, désignons par H le sous-ensemble de C 1 (I; Rp) défini
par
H = {y ∈ C 1 (I; Rp) : y(a) = c, y(b) = d}.
On a évidemment

H = y0 + C01 (I; Rp) = {y0 + u : u ∈ C01 (I; Rp)},

où y0 ∈ C 1 (I; Rp) est définie par


x−a
y0 (x) = c + (d − c).
b−a
Pour considérer la notion d’extrémant local de ϕ sur H, il nous reste à définir
une distance sur H, c’est-à-dire, en vertu des considérations qui précèdent,
une norme sur C 1 (I; Rp), ce qui peut se faire de différentes manières. Ainsi,
17.11. CALCUL DES VARIATIONS 731

puisque C 1 (I; Rp) ⊂ C(I; Rp), on peut munir C 1 (I; Rp) de la norme de
la convergence uniforme 6y6∞ = supx∈I |y(x)|2. Cette norme “ignore” é-
videmment la propriété de dérivabilité des éléments de C 1 (I; Rp). Pour
tenir compte de cette dérivabilité, on peut définir l’application 6 · 6∞,1 :
C 1 (I; Rp) → R+ par

6y6∞,1 = 6y6∞ + 6y $ 6∞ = sup |y(x)|2 + sup |y $ (x)|2 .


x∈I x∈I

On a évidemment, pour tout y ∈ C 1 (I; Rp), 6y6∞ ≤ 6y6∞,1 . On est ainsi


conduit à considérer deux types d’extrémants locaux pour ϕ sur H. On
désignera par d∞ (resp. d∞,1 ) la distance définie sur H par la norme 6 · 6∞
(resp. 6 · 6∞,1 ).
Définition. Soit f : I × Rp × Rp → R vérifiant les conditions de régularité
ci-dessus et
J b
ϕ : C 1 (I; Rp) → R, y 2→ f [x, y(x), y $(x)] dx,
a

l’application correspondante. On dit que y ∈ H est un minimant local fort


(resp. faible) de ϕ sur H si y est un minimant local de ϕ sur (H, d∞) (resp.
sur (H, d∞,1)). On définit de même la notion de maximant local fort et de
maximant local faible de ϕ sur H, et dès lors celle d’extrémant local fort et
d’extrémant local faible de ϕ sur H.
Il est clair que tout extrémant local fort de ϕ dans H est un extrémant
local faible de ϕ dans H. Pour l’obtention de conditions nécessaires, il suf-
fit donc de considérer la notion d’extrémant local faible. La situation est
évidemment différente dans l’étude des conditions suffisantes que nous n’a-
borderons pas ici.
Pour expliciter, dans la cas particulier de la fonction ϕ associée à f , la
condition nécessaire d’Euler d’existence d’un extremum sur H, on a besoin
de quelques résultats préliminaires.
Proposition. Pour chaque y ∈ C 1 (I; Rp) et chaque u ∈ C01 (I; Rp) fixés, la
fonction ϕy,u : R → R, s 2→ ϕ(y + su) est dérivable en s = 0 et
J b
ϕ$y,u (0) = {(∇y f [x, y(x), y $(x)]|u(x)) + (∇z f [x, y(x), y $(x)]|u$(x))} dx,
a

où
∇y f = (Dy1 f, . . . , Dyp f ), ∇z f = (Dz1 f, . . . , Dzp f ),
732 CHAPITRE 17. ANALYSE FONCTIONNELLE

et (·|·) désigne le produit scalaire usuel dans Rp .


Démonstration. Il est facile de vérifier que les conditions de la règle de
Leibniz de dérivation sous le signe intégral sont vérifiées, ainsi que celles de
la dérivation d’une fonction composée, ce qui donne
d
ϕ$y,u (0) = [ϕ(y + su)]s=0
ds
J b d
= [f (x, y(x) + su(x), y $(x) + su$ (x)]s=0 ds
a ds
J p
b$
= {[Dyj f [x, y(x), y $(x)]uj (x) + Dzj f [x, y(x), y $(x)]u$j (x)} dx
a j=1
J b
= {(∇y f [x, y(x), y $(x)]|u(x)) + (∇z f [x, y(x), y $(x)]|u$(x))} dx.
a

Proposition. Si y ∈ H est un extrémant local faible de ϕ dans H, alors,


pour tout u ∈ C01 (I; Rp), on a
J b4 J x 5
∇z f [x, y(x), y $(x)] − ∇y f [t, y(t), y $(t)] dt | u$(x) dx = 0.
a a

Démonstration. Si y est un extrémant local faible de ϕ sur H, la propo-


sition précédente et la condition nécessaire d’Euler entraı̂nent que, pour tout
u ∈ C01 (I; Rp), on a
0 = ϕ$y,u (0)
J b
= {(∇y f [x, y(x), y $(x)]|u(x)) + (∇z f [x, y(x), y $(x)]|u$(x))} dx.
a
En utilisant la formule d’intégration par parties et le fait que u(a) = u(b) = 0,
on obtient
J b p J
$ b
(∇y f [x, y(x), y $(x)]|u(x)) dx = Dyj f [x, y(x), y $(x)]uj (x) dx
a j=1 a

p J
$ b UJ x V
d
= uj (x) Dyj f [t, y(t), y (t)] dt dx
$

j=1 a
dx a

p J
$ bU J x V
=− u$j (x) Dyj f [t, y(t), y $(t)] dt dx
j=1 a a
17.11. CALCUL DES VARIATIONS 733

J b 4J x 5
=− ∇y f [t, y(t), y $(t)] dt | u$(x) dx,
a a
et la thèse en résulte en introduisant ce résultat dans l’égalité précédente.
Pour éliminer u dans la proposition précédente, on utilise le lemme de
Du Bois-Reymond.
Lemme. Si w ∈ C(I; Rp), alors w est constante sur I si et seulement si,
pour tout u ∈ C01 (I; Rp), on a
J b
(w(x)|u$(x)) dx = 0.
a

Démonstration. Condition nécessaire. Si w est constante sur I, et qu’on


désigne sa valeur par w, alors, pour tout x ∈ I, on a

(w(x)|u$(x)) = (w|u$ (x)) = (w|u)$ (x),

et dès lors, en utilisant le théorème fondamental du calcul différentiel et


intégral, on obtient
J b J b
(w(x)|u$(x)) dx = (w|u)$(x) dx
a a

= (w|u(b)) − (w|u(a)) = 0.
Condition suffisante. Définissons la valeur moyenne sur I de w par
J
1 b
w= w.
b−a a

Alors, pour tout u ∈ C01 (I; Rp), on a, en utilisant l’hypothèse et le théorème


fondamental du calcul différentiel et intégral,
J b J b J b
(w − w|u$ ) = (w|u$ ) − (w|u$ )
a a a

J b
=− (w|u)$ = −(w|u(b)) + (w|u(a)) = 0. (17.1)
a

Définissons v ∈ C 1 (I; Rp) par la formule


J x
v(x) = [w(s) − w] ds, (x ∈ I).
a
734 CHAPITRE 17. ANALYSE FONCTIONNELLE

Alors,
J b
v(a) = 0, v(b) = w − (b − a)w = (b − a)w − (b − a)w = 0,
a

ce qui montre que v ∈ C01 (I; Rp). On peut donc prendre u = v dans (17.1),
ce qui entraı̂ne
J b J b
0= (w − w|v $ ) = |w − w|22 .
a a

Par conséquent, w − w est nulle presque partout sur I, et dès lors E =


{x ∈ I : w(x) − w /= 0} est d’intérieur vide. Si x ∈ E, il existe donc une
suite (xk )k∈N dans I \ E qui converge vers x, et dès lors, puisque w − w est
continue,
w(x) − w = lim [w(xk ) − w] = 0,
k→∞

ce qui montre que w(x) = w pour tout x ∈ I, et donc que w est constante
sur I.
Nous pouvons maintenant énoncer et démontrer l’importante condition
nécessaire d’Euler-Lagrange d’existence d’un extrémant local faible de
ϕ sur H.
Théorème. Si y est un extrémant local faible de ϕ dans H, alors l’applica-
tion x 2→ ∇z f [x, y(x), y $(x)] est de classe C 1 sur I, et, pour tout x ∈ I, on
a
d
{∇z f [x, y(x), y $(x)]} − ∇y f [x, y(x), y $(x)] = 0, (17.2)
dx
c’est-à-dire,

d
{Dzj f [x, y(x), y $(x)]} − Dyj f [x, y(x), y $(x)] = 0, (1 ≤ j ≤ p). (17.3)
dx
Démonstration. Soit y un extrémant local faible de ϕ dans H. En vertu
du lemme de Du Bois-Reymond et de la proposition qui précède, l’application
J x
x 2→ ∇z f [x, y(x), y $(x)] − ∇y f [s, y(s), y $(s)] ds,
a

est constante sur HI et donc dérivable et de dérivée nulle sur I; comme


l’application x 2→ ax ∇y f [s, y(s), y $(s)] ds est de classe C 1 comme intégrale
17.11. CALCUL DES VARIATIONS 735

indéfinie d’une fonction continue, il en est de même de l’application x 2→


∇z f [x, y(x), y $(x)], et, pour tout x ∈ I,
U J x V
d
0= ∇z f [x, y(x), y $(x)] − $
∇y f [s, y(s), y (s)] ds
dx a

d
= {∇z f [x, y(x), y $(x)]} − ∇y f [x, y(x), y $(x)].
dx

Les relations (17.3) forment un système de p équations dans lesquelles


l’inconnue y ∈ C 1 (I; Rp) apparaı̂t avec ses dérivées. C’est donc un système
d’équations différentielles qui sont appelées les équations d’Euler-Lagrange
du problème d’extrémum considéré. Etant donné que, dans (17.3), la vari-
able zj de f est remplacée par yj$ (x), on utilise souvent, pour (17.3), la
notation un peu ambiguë

d
{D " f [x, y(x), y $(x)]} − Dyj f [x, y(x), y $(x)] = 0, (1 ≤ j ≤ p).
dx yj
Remarques. 1. Le théorème ci-dessus fournit une information sur la
dérivabilité sur I de l’application ∇z f [., y(.), y $(.)] mais n’assure nullement
que y $ soit dérivable sur I. Lorsque l’extrémant local y de ϕ sur H est de
classe C 2 sur I, le théorème de dérivation d’une fonction composée appliqué
au premier terme des équations d’Euler-Lagrange fournit pour ces équations
la forme plus explicite
p
$ p
$
Dz2j ,zk f [x, y(x), y $(x)]yk$$(x) + Dz2j ,yk f [x, y(x), y $(x)]yk$ (x)
k=1 k=1

+Dz2j ,x f [x, y(x), y $(x)] − Dyj f [x, y(x), y $(x)] = 0, (1 ≤ j ≤ p).


2. Dans le cas particulier où f = f (y, z) ne dépend pas explicitement de x,
les équations d’Euler-Lagrange sont de la forme

d
{∇z f [y(x), y $(x)]} − ∇y f [y(x), y $(x)] = 0,
dx
et dès lors, pour tout x ∈ I,
4 5
d
y $ (x) | {∇z f [y(x), y $(x)]} − (y $ (x)|∇y f [y(x), y $(x)]) = 0.
dx
736 CHAPITRE 17. ANALYSE FONCTIONNELLE

Si l’on suppose en outre que y est de classe C 2 sur I, cette relation peut
s’écrire
d
{(y $ (x)|∇z f [y(x), y $(x)])}
dx
−(y $$ (x)|∇z f [y(x), y $(x)]) − (y $ (x)|∇y f [y(x), y $(x)]) = 0,
c’est-à-dire, en utilisant le théorème de dérivation d’une fonction composée,
d
{(y $ (x)|∇z f [y(x), y $(x)]) − f [y(x), y $(x)]} = 0.
dx
En conséquence, la fonction x 2→ (y $ (x)|∇z f [y(x), y $(x)]) − f [y(x), y $(x)]
est constante sur I. On dit que c’est une intégrale première des équations
d’Euler-Lagrange et on l’appelle l’intégrale première de Painlevé.
3. Dans le cas particulier où f = f (x, z) ne dépend pas explicitement de y,
on a ∇y f = 0 et les équations d’Euler-Lagrange deviennent

d
{∇z f [x, y $(x)]} = 0.
dx
En conséquence, elles sont équivalentes aux p intégrales premières

Dzj f [x, y $ (x)] = cj , (x ∈ I), (1 ≤ j ≤ p),

où les cj sont des constantes réelles.


Exemples. 1. Le problème des géodésiques qui a motivé cette section
correspond à une situation où la Remarque 3 s’applique. Soit donc y un
extrémant faible local de
J b
λ : C (I; R) → R, y 2→
1
[1 + y $ (x)2 ]1/2 dx,
a

sur H = {y ∈ C 1 (I; R) : y(a) = c, y(b) = d}. Comme Dz (1 + z 2 )1/2 =


z
(1+z2 )1/2
, l’équation d’Euler-Lagrange correpondant à y est équivalente à
l’intégrale première

y $ (x)
= A, x ∈ I,
[1 + (y $ (x))2 ]1/2

où A ∈ R est nécessairement telle que |A| < 1. En résolvant cette équation
A2
par rapport à y $ (x), on obtient (y $ (x))2 = 1−A 2 , ce qui, pour une fonction

de classe C 1 , équivaut à y $ (x) = D, et dès lors à y(x) = Dx + C, x ∈ I,


où D et C appartiennent à R. Comme, en outre, y ∈ H, on a Da + C = c,
17.11. CALCUL DES VARIATIONS 737

Db + C = d, et la résolution de ce système linéaire en (C, D) fournit pour y


l’expression
x−a
y(x) = c + (d − c).
b−a
On reconnaı̂t l’équation de la droite dans R2 joignant (a, c) à (b, d). Nous
avons ainsi démontré que si la fonction y ∈ C 1 (I; R) joignant (a, c) et (b, d)
est un extrémant local faible, parmi les autres fonctions joignant ces points,
de la fonction λ donnant la longueur de la courbe correspondante, alors y
correspond au segment de droite joignant ces points. Il resterait évidemment
encore à montrer, ce qui est possible, que cette droite fournit effectivement
un minimum de λ.
2. On a vu en mécanique analytique que si l’on considère un système
mécanique à p degrés de liberté dont les coordonnées généralisées sont q1 , . . .,
qp , d’énergie cinétique de la forme T (t, q, q̇) (avec q̇(t) la dérivée de q par rap-
port à t) et soumis à des forces extérieurs dérivant d’un potentiel V = V (t, q),
les équations différentielles du mouvement de ce système sont données par
les équations de Lagrange
d
{∇q̇ T [t, q(t), q̇(t)]} − ∇q T [t, q(t), q̇(t)] = −∇q V [t, q(t)].
dt
En définissant le lagrangien L du système par
L(t, q, z) = T (t, q, z) − V (t, q),
on voit que les équations de Lagrange peuvent encore s’écrire
d
{∇q̇ L[t, q(t), q̇(t)]} − ∇q L[t, q(t), q̇(t)] = 0,
dt
et, sur un intervalle [a, b], leur solution q correspond donc à un extrémant
local, parmi les fonctions de classe C 1 prenant les mêmes valeurs que y en a
et b, de la fonction
J b
ϕ : q 2→ L[t, q(t), q̇(t)] dt.
a
C’est ce qu’on appelle le principe de Hamilton en mécanique analytique. On
a un résultat semblable si les forces extérieures sont de la forme −∇q U +
dt [∇q̇ U ] pour une certaine fonction U = U (t, q, q̇) que l’on appelle le potentiel
d

généralisé des forces extérieures.


3. Supposons maintenant que p = 2q soit pair et que f soit de la forme
q
$
f (t, z, v) = zi vq+i − H(t, z),
j=1
738 CHAPITRE 17. ANALYSE FONCTIONNELLE

pour une certaine fonction H : I × R2q → R continue et telle que ∇z H existe


et soit continu. Les équations d’Euler-Lagrange
d
{∇v f [t, z(t), ż(t)]} − ∇z f [t, z(t), ż(t)] = 0,
dt
s’écrivent dans ce cas, en séparant les q premières des q dernières com-
posantes,

−żq+j + Dzj H[t, z(t)] = 0, żj + Dzq+j H[t, z(t)] = 0, (1 ≤ j ≤ q).

En introduisant la matrice symplectique dans R2q définie par


& '
0 −Iq
Iq 0

où Iq est la matrice identité sur Rq , on peut écrire ce système sous la forme

J ż(t) + ∇z H[t, z(t)].

On reconnaı̂t la structure des équations de Hamilton en mécanique analy-


tique. La solution de ces équations sur un intervalle I = [a, b] est donc un
extrémant local de l’expression
 
J b $
q 
ϕ(z) = zi (t)żq+i (t) − H[t, z(t)] dt,
a  
j=1

parmi les fonctions de C 1 (I, R2q) qui prennent les mêmes valeurs que z en a
et b. C’est une autre forme du principe de Hamilton.

17.12 Exercices
1. Soit A ⊂ Rn un fermé borné et soit C 1 (A; Rp) l’ensemble des applications
y : A → Rp de classe C 1 sur A. Montrer que, muni de la norme

6y6∞,1 = max |y(x)| + max |y $ (x)|,


x∈A x∈A

C 1 (A; Rp) est un espace de Banach.


2. Soit M un espace métrique, H un espace de Hilbert et

F : M × H → H, (x, y) 2→ F (x, y),


17.12. EXERCICES 739

une application. On dit que F est fortement monotone en y uniformément


en x ∈ M s’il existe a > 0 tel que, pour tout x ∈ M, tout y ∈ H et tout
z ∈ H, on ait
(F (x, y) − F (x, z)|y − z) ≥ a6y − z62 .
On dit que F est lipschitzienne en y uniformément en x ∈ M s’il existe b > 0
telle que, pour tout x ∈ M, tout y ∈ H et tout z ∈ H, on ait

6F (x, y) − F (x, z)6 ≤ b6y − z6.

Démontrer le théorème des fonctions implicites global de Zarantonello : il


existe une application f : M → H telle que, pour chaque x ∈ M, on ait

F (x, y) = 0 ⇔ y = f (x).

Suggestion : Si c > 0, on a

F (x, y) = 0 ⇔ y = y − cF (x, y) ≡ Gc (x, y);

d’ailleurs,
6Gc (x, y) − Gc (x, z)62
= 6y − z62 − 2c(y − z|F (x, y) − F (x, z)) + c2 6F (x, y) − F (x, z)62
≤ (1 − 2ac + c2 b2 )6y − z62 .
Gc (x, .) sera donc une application contractante sur H si et seulement si l’on
choisit 0 < c < 2a
b2
, ce qui est toujours possible. Le minimum de la constante
de Lipschitz est donné par c = ba2 et fournit la constante de Lipschitz (1 −
a2 1/2
b2
) . Le point fixe unique f (x) de Gc (x, .) fournit la solution du problème.
3. Soit (M, d) un espace métrique et A une partie non vide de M . On définit
l’application d(·, A) : M → R+ par d(x, A) = inf y∈A d(x, y). Montrer que
d(·, A) est continue sur M (utiliser la caractérisation de l’infimum). Montrer
que si A et B sont deux parties fermées et disjointes de M , alors l’application
d(x,A)
f de M dans [0, 1] définie par f (x) = d(x,A)+d(x,B) est continue, telle que
f (x) = 0 pour tout x ∈ A, f (x) = 1 pour tout x ∈ B, et 0 < f (x) < 1 en
dehors de A et B. (Théorème d’Urysohn).
4. Soit M un espace métrique compact et T : M → M une applica-
tion telle que d(T x, T y) < d(x, y) pour tout x /= y dans M. Alors T
possède un point fixe unique dans M . L’unicité se montre facilement. Pour
l’existence, le théorème de Weierstrass appliqué à la fonction réelle con-
tinue x 2→ d(x, T (x)), entraı̂ne l’existence d’un y ∈ M tel que d(y, T (y)) =
740 CHAPITRE 17. ANALYSE FONCTIONNELLE

minx∈M d(x, T (x)). Si α = d(y, T (y)) = 0, alors y est un point fixe de T ; si


α > 0, alors
0 < α ≤ d(T (y), T 2(y)) < d(y, T (y)) = α,
ce qui est contradictoire.
5. Montrer qu’il n’existe pas de

z ∈ H = {y ∈ C 1 ([−1, 1]; R) : y(−1) = −1, y(1) = 1}


1 H
tel que, ϕ(z) = inf y∈H ϕ(y), si ϕ est définie par ϕ(y) = −1 x2 [y $ (x)]2 dx.
Suggestion : pour tout y ∈ H, on a ϕ(y) > 0 et, pour chaque a > 0, la
arctg x
fonction ya définie sur [−1, 1] par ya (x) = arctg a1 appartient à H et est telle
a
que ϕ(ya ) → 0 as a → 0. (Contre-exemple de Weierstrass à l’existence d’une
solution à un problème de calcul des variations).
6. Ecrire et résoudre les équations d’Euler-Lagrange pour les fonctions ϕ
définies par
J b
ϕ(y) = x[1 + (y $ (x))2 ]1/2 dx,
a
(surface de révolution autour de l’axe des x d’aire minimum),
J b
ϕ(y) = y(x)[1 + (y $ (x))2]1/2 dx,
a

(surface de révolution autour de l’axe des y d’aire minimum),


J L
b 1 + (y $ (x))2
ϕ(y) = L dx,
a 2gy(x)

(problème du brachystochrone, c’est-à-dire du temps de parcours minimum


le long d’une courbe sous l’action de la gravitation),
J L
b 1 + (y $ (x))2
ϕ(y) = dx,
a y
(minimum du temps de propagation de la lumière dans un milieu où la vitesse
de propagation est proportionnelle à l’altitude).

17.13 Petite anthologie


Mais on voit que ces remarques conduisent tout naturellement à étudier les
propriétés d’un ensemble linéaire P satisfaisant à la condition suivante: Il
17.13. PETITE ANTHOLOGIE 741

existe une infinité dénombrable d’ensemble P1 , P2 , . . ., Pn , . . . , dont chacun


est non dense, et tels que tout point de P fait partie de l’un au moins des
ensembles P1 , P2 , . . ., Pn , . . . . Je dirai qu’un ensemble de cette nature est
de première catégorie. Tout ensemble qui ne possède pas cette propriété
sera dit de deuxième catégorie. Je commence par démontrer la proposi-
tion suivante: Si P est un ensemble de première catégorie, il existe, dans
toute portion αβ du segment sur lequel il est défini, au moins un point (et
par suite une infinité) n’appartenant pas à P. . . . Il résulte immédiatement
de là que le continu constitue un ensemble de deuxième catégorie; nous
venons en effet de démontrer qu’on ne peut pas obtenir tous les points
d’un intervalle continu au moyen d’une infinité dénombrable d’ensembles
non denses. L’ensemble formé par la réunion d’un nombre fini ou d’une in-
finité dénombrable d’ensembles de première catégorie est encore un ensemble
de première catégorie; cela résulte de la définition même. Le continu, dont
on a retranché un ensemble de première catégorie est de second catégorie.
. . . On voit la différence profonde qui existe entre les ensembles des deux
catégories; cette différence ne réside, ni dans la dénombrabilité, ni dans la
condensation dans un intervalle continu, puisqu’un ensemble de première
catégorie peut avoir la puissance du continu, et peut aussi être dense dans
toute l’étendue du segment qu’on considère; mais elle est en quelque sorte
une combinaison des deux notions précédentes.

René Baire, 1899

J’ai eu l’occasion, dans l’introduction à mes leçons sur les fonctions de


lignes, de parler avec beaucoup de détail de l’évolution d’idées laquelle m’a
conduit aux fonctions d’un nombre infini et continu de variables que j’ai ap-
pelées quantités qui dépendent de toutes les valeurs d’une ou de plusieurs
fonctions, et que j’ai aussi désignées - pour employer une locution plus ex-
pressive - par le nom de fonctions de lignes. . . . J’étais saisi de la nécessité
de considérer les fonctions de lignes, car une grande partie des phénomènes
naturels conduit à des quantités qui dépendent d’un nombre infini de vari-
ables. Beaucoup de problèmes d’analyse mènent aussi aux mêmes quantités.
Leur conception et leur définition se présentaient donc naturellement. J’ai
pensé qu’il aurait été utile de les envisager comme des éléments qu’on pour-
rait étudier par eux-mêmes. Ils devaient aussi constituer une catégorie à part
d’entités dont on pourrait obtenir des propriétés communes et qu’on pourrait
considérer dans leur ensemble. . . . Ce qui s’imposait à mon esprit du pre-
mier abord était donc de créer une analyse propre à embrasser les propriétés
des fonctions de lignes et leurs représentations et de constituer un calcul qui
742 CHAPITRE 17. ANALYSE FONCTIONNELLE

donnât le moyen de poser d’une manière exacte les problèmes qui les concer-
nent et d’en obtenir des solutions rigoureuses. Il y avait un exemple dans le
calcul des variations, car ce célèbre calcul étudie les problèmes des maxima
et des minima de certaines intégrales définies, et les intégrales définies peu-
vent justement être envisagées comme des quantités qui dépendent de toutes
les valeurs des fonctions qui paraissent sous le signe d’intégration.

Vito Volterra, 1914

L’opération c’est une relation univoque yRx c’est-à-dire telle que yRx
et zRx entraı̂ne y = z pour tout x, y, z. Chaque relation yRx comporte un
contre-domaine (c’est la réserve des y) et un domaine (la réserve des x) ou
champ. L’opération fonctionnelle ou la fonction de ligne c’est une opération
dont le domaine et le contre-domaine sont des ensembles de fonctions. La
notion de fonction de ligne fut introduite par M. Volterra. L’ouvrage présent
a pour but d’établir quelques théorèmes valables pour différents champs fonc-
tionnels, que je spécifie dans la suite. Toutefois, afin de ne pas être obligé
à les démontrer isolément pour chaque champ particulier, ce qui serait bien
pénible, j’ai choisi une voie différente que voici : je considère d’une façon
générale les ensembles d’éléments dont je postule certaines propriétés, j’en
déduis des théorèmes et je démontre ensuite de chaque champ fonctionnel
particulier que les postulats adoptés sont vrais pour lui.

Stefan Banach, 1922

Admettons ensuite qu’il existe une opération appelée norme (nous la


désignerons par le symbole 6X6), définie dans le champ E, ayant pour
contre-domaine l’ensemble des nombres réels et satisfaisant aux conditions
suivantes :
1. 6X6 ≥ 0,
2. 6X6 = 0 équivaut à X = 0,
3. 6a.X6 = |a|.6X6,
4. 6X + Y 6 ≤ 6X6 + 6Y 6,
5. Si {Xn } est une suite d’éléments de E et limr→∞,p→∞ 6Xr − Xp 6 = 0, il
existe un élément X tel que limn→∞ 6X − Xn 6 = 0.

Stefan Banach, 1922


Chapitre 18

Index historique

Abel (lemme et transformation d’) (430). Abel (1826).

Abel (série d’) (420).

Abel (test d’intégrabilité d’) (409).

Abel (test de convergence d’une série d’) (431). Abel (1826).

Abel (théorème d’) (456). Enoncé et démontré par Abel (1826).

Abel, Niels (1802-1829) (409, 420, 430, 431, 456, 480). Mathématicien
norvégien célèbre pour sa démonstration de l’impossibilité de la résolution
par radicaux de l’équation algébrique du cinquième degré (1824), publiée à
compte d’auteur et que Gauss ignora, et pour sa découverte des fonctions
elliptiques. Il fut emporté par la tuberculose deux jours avant l’annonce de
sa nomination à l’Université de Berlin.

abélienne (intégrale) (336). Etudiées par Abel (1826), qui démontra un théo-
rème généralisant largement le théorème d’addition des intégrales elliptiques.
Riemann apportera à leur théorie des contributions essentielles en 1857. Ces
intégrales sont un outil important en géométrie algébrique, discipline née de
l’étude des racines communes à une famille de polynômes sur un corps. Elle
s’occupe de la classification des variétés algébriques et de l’étude de leurs
invariants. Les fonctions réciproques des intégrales abéliennes sont appelées
les fonctions abéliennes.

absolue uniforme (convergence) (444).

absolument convergente (série) (254, 439). Notion introduite par Cauchy


(1821), qui démontre, de manière inexacte, qu’elle entraı̂ne la convergence. Il
donne une preuve correcte en 1833.

743
744 CHAPITRE 18. INDEX HISTORIQUE

accroissement relatif (81). Dès 1629, Fermat connaissait la méthode suivant


laquelle le coefficient angulaire de la tangente à la courbe d’équation y = f(x)
s’obtient en prenant h = 0 dans la fraction f(a+h)−f(a)h après simplification
par h. La méthode de Fermat fut appliquée par Torricelli (1644), Sluse
(1652) et Wallis (1652).

accroissements finis (formule des) (151). Voir “Lagrange (théorème de)” et


“moyenne (théorème de la)”.

accumulation (point d’) (166, 167, 720). La notion est due à Cantor (1870).
La terminologie est due à Fréchet (1906) et F. Riesz (1908).

additivité complète de la L-intégrale (492). Due à Lebesgue (1902).

additivité complète de la mesure (490). Démontrée pour la première fois par


Borel (1898).

additivité de l’intégrale (364, 367, 387, 492).

adhérence, adhérent (28, 65, 129, 685). Notion due à Hausdorff (1914).

adjointe de Hodge d’une forme (592). Introduite par Hodge (1932).

aire (d’un élément de surface) (576). Formule connue d’Euler (1770) pour
une représentation paramétrique dérivable. Schwarz (1862) montra par un
exemple qu’une telle aire ne peut être définie en général comme limite de
l’aire de polyèdres inscrits. La définition de l’aire d’une surface dans des
conditions générales est un problème délicat qui fait partie de ce que l’on ap-
pelle aujourd’hui la théorie géométrique de la mesure. Celle-ci est étroitement
liée au célèbre problème de Plateau qui consiste à trouver la surface d’aire
minimum s’appuyant sur une courbe gauche fermée donnée, que l’on peut
représenter physiquement par un film d’eau savonneuse. L’existence d’une
solution à ce problème fut démontrée par Rado et Douglas (1931).

aire (d’un parallélogramme) (575), (d’un rectangle) (347).

aire (d’une figure plane) (487, 511). Le calcul de l’aire de figures planes fut
étudié dès l’Antiquité : Démocrite (rectangle et triangle), Archimède
(cercle, segment parabolique, secteur de spirale). Il faut attendre les XVIe
et XVIIe siècles pour le calcul de l’aire d’autres domaines par des méthodes
délicates et fastidieuses de passage à la limite, qui seront spectaculairement
simplifiées et unifiées par l’invention du calcul intégral.

algèbre (théorème fondamental de l’) (140). Enoncé par Girard (1629), ce


théorème a reçu des démonstrations incomplètes de d’Alembert (1746), Eu-
ler (1749) et Lagrange (1749). Gauss en donnera quatre démonstrations
distinctes (1799, 1815, 1816, 1847). L’idée de la démonstration donnée ici est
745

due à Argand (1806), qui suppose que l’infimum du module du polynôme


est atteint, ce que Servois critique (1815) et Weierstrass démontre. On
trouve une démonstration semblable chez Cauchy (1821).

algébrique (nombre) (33). La distinction entre nombres algébriques et nombres


transcendants était déjà reconnue par Euler dès 1744. La théorie moderne
des nombres algébriques est l’oeuvre de Dedekind.

alternée (série) (432). La série harmonique alternée fut considérée pour la pre-
mière fois par Mengoli (1648), Gregory (1671) et Leibniz (1682). Le test
de convergence des séries alternées est dû à Leibniz (1705).

Ampère, André-Marie, (1775-1836) (618). Célèbre pour ses contributions à


l’électromagnétisme, ce savant français autodidacte a aussi contribué à
l’histoire naturelle, la chimie, la philosophie des sciences et aux mathéma-
tiques (calcul des probabilités et équations aux dérivées partielles (équation
de Monge-Ampère)).

analyse vectorielle (601). Dans sa théorie des quaternions (1844), Hamilton


introduisit un opérateur différentiel, qu’il nota ∇ et appela nabla, et qui, ap-
pliqué à un champ scalaire fournit (en termes actuels) le gradient, et appliqué
à un champ vectoriel fournit un quaternion dont la partie scalaire est égale à
moins la divergence et la partie vectorielle au rotationnel. C’est Maxwell
(1873) qui sépara la partie scalaire et la partie vectorielle d’un quaternion,
et dans le cas du nabla d’un champ vectoriel, il les appela respectivement la
convergence et le rotationnel; Maxwell remarqua aussi que la répétition de
∇ appliqué à un champ scalaire fournit le laplacien changé de signe. C’est
aussi Maxwell (1871) qui remarqua que le rotationnel d’un gradient et la
divergence d’un rotationnel sont toujours nuls. Les ouvrages de Gibbs (1901)
et de l’excentrique Heaviside (1893-1912) édifièrent l’analyse vectorielle en
tant que discipline autonome.

analytique (fonction) (260, 658). Terme dû à Lagrange (1772) qui essaya en
vain de fonder la théorie générale des fonctions sur le développement en série
de Taylor. La définition donnée ici est due à Weierstrass (1859). S. Bern-
stein (1914) a démontré que si f est de classe C ∞ au voisinage de 0 et telle
que (−1)k f (k) (0) ≥ 0 pour tout k ≥ 0, alors f est analytique en 0.

Apéry, Roger (1919-1994) (420). Mathématicien français, professeur à l’uni-


versité de Caen.

apparent ou régulier (point singulier) (664).

application (8). Dedekind (1888) a défini la notion d’application d’un ensemble


dans un autre et en a développé les propriétés élémentaires.
746 CHAPITRE 18. INDEX HISTORIQUE

approximation d’un ensemble intégrable (théorème d’) (497, 712). On a


un résultat proche chez Denjoy (1910).

approximation d’une fonction intégrable (théorème d’) (713).

approximation d’une primitive (théorème d’) (340). Un énoncé proche é-


merge dans une lettre de Peano (1884) au mathématicien louvaniste Gil-
bert, contestant sa justification d’une démonstration du théorème des ac-
croissements finis parue dans la première édition du Cours d’analyse de Jor-
dan et critiquée par Peano. Peano en laisse la démonstration comme ex-
ercice à Gilbert !

approximations successives (172). Utilisée depuis l’Antiquité pour la résoluti-


on d’équations numériques, la méthode des approximations successives fut
utilisée par Liouville (1831), Schwarz (1885), Peano (1888) et Picard
(1890) dans l’étude des équations différentielles et aux dérivées partielles.
C’est Goursat (1903) qui l’a introduite dans l’étude des fonctions implicites.

Arbogast, Louis, (1739-1803) (79). Mathématicien alsacien, professeur à l’E-


cole d’Artillerie de Strasbourg et recteur du Collège catholique de la même
ville. Il a contribué à l’étude des fondements du calcul différentiel et intégral
et à l’étude des équations aux dérivées partielles.

Archimède (théorème d’) (14). Mentionné par Archimède, qui l’attribue à


Eudoxe, dans ses études sur la quadrature des courbes. On le trouve aussi
dans les Eléments d’Euclide.

Archimède (287-212) (14). Le plus grand mathématicien de l’Antiquité, il fut


aussi le créateur de la statique, de l’hydrostatique et de la théorie des corps
flottants, ainsi que le créateur d’étonnantes machines de guerre. Tué par un
soldat romain lors de la prise de Syracuse.

Arnold, Vladimir I. (né en 1937) (319). Mathématicien russe contemporain.


Travaux importants sur la théorie des équations différentielles, la mécanique
céleste, la théorie des singularités et les systèmes dynamiques.

Arzela, Cesare (1847-1912) (722). Elève de Betti et de Dini, ce mathémati-


cien italien a contribué à la théorie des fonctions de variables réelles et à la
naissance de l’analyse fonctionnelle. On lui doit une condition nécessaire et
suffisante de continuité de la limite d’une suite de fonctions continues.

Ascoli-Arzela (théorème d’) (722). Ascoli (1883) et Arzela (1889).

Ascoli, Giulio (1843-1896) (722). Mathématicien italien. Importantes contri-


butions au calcul des variations et à la théorie des ensembles de fonctions
continues.
747

asymptotique (développement) (284). Notion due simultanément à Poinca-


ré (1886) et Stieltjes (1886).
attracteur (176). Etant donné un système dynamique défini par f : R → R, un
attracteur est un ensemble fermé A invariant par f (f(A) ⊂ A) pour lequel il
existe un ouvert U ⊃ A tel que, pour tout x ∈ U et tout entier k ≥ 1, f k (x) ∈
U et dist(f k (x), A) → 0 si k → +∞. L’exemple le plus simple est un point fixe
asymptotiquement stable considéré il y a une centaine d’année par Poincaré,
Liapounov et Levi-Civita. Les travaux de Levinson (1949), Lorenz
(1963), Smale (1967) ont révélé l’existence d’attracteurs ayant une structure
fractale, auxquels Ruelle, Takens (1971) ont donné le nom d’attracteurs
étranges. Leur existence entraı̂ne un comportement chaotique du système
dynamique.

au plus dénombrable (ensemble) (12).


axiomatique de Zermelo-Fraenkel (2). Due à Zermelo (1908), à Fraenkel
(1922) et à Skolem (1922). On la note (ZFC). Une autre axiomatique fut in-
troduite par von Neumann (1925), Bernays (1937-1954) et Gödel (1940).
E. Nelson (1977) a introduit une extension conservative de la théorie de
Zermelo-Fraenkel faisant intervenir le prédicat unaire supplémentaire stan-
dard et trois axiomes supplémentaires régissant son emploi. C’est la théorie
des ensembles internes (IST) dans laquelle toute formule n’impliquant pas
le nouveau prédicat est appelée standard, ainsi que tout ensemble construit
à partir des seuls axiomes de (ZFC). L’un des nouveaux axiomes entraı̂ne
que tout ensemble infini contient au moins un élément non standard. Ainsi,
dans N, les éléments non standards sont les entiers infiniment grands, c’est-
à-dire les entiers supérieurs à tous les entiers standards. On obtient alors
des réels infiniment petits en prenant leurs inverses. Cette structure permet
de présenter rigoureusement l’analyse mathématique en termes d’infiniment
petits et d’infiniment grands, un programme pratiquement abandonné depuis
l’approche weierstrassienne, et de réhabiliter ainsi, d’une certaine manière,
le langage et une certaine intuitition des créateurs du calcul infinitésimal.
C’est ce que l’on appelle l’analyse non standard, introduite par A. Robinson
(1961) par une approche différente fondée sur des résultats délicats de logique
mathématique, et qui constitue un point de vue alternatif et une technique
nouvelle en analyse mathématique.

Baire (théorème de) (76, 707). Dû, indépendamment, à Osgood (1897) dans
R, et à Baire (1899) dans Rn . C’est Banach et Steinhaus (1927), utilisant
une idée de Saks, qui montreront le rôle de l’extension du théorème de Baire
aux espaces métriques complets dans des questions fondamentales d’analyse
fonctionnelle.
Baire, René (1874-1932) (76, 707, 741). Mathématicien français; un des cré-
ateurs de la théorie des fonctions de variables réelles. Auteur d’intéressantes
748 CHAPITRE 18. INDEX HISTORIQUE

Leçons sur les théories générales de l’analyse. Il se suicida après avoir souffert
longuement de troubles nerveux.

Banach (espaces de) (692). Introduits et étudiés par Banach à partir de 1922.

Banach (théorème du point fixe de) (174, 700). Voir “Applications contrac-
tantes (théorème des)”.

Banach, Stefan (1892-1945) (174, 692, 700, 708, 742). Mathématicien po-
lonais; ses contributions à l’analyse fonctionnelle, la théorie de la mesure et
à la théorie des fonctions d’une variable réelle sont capitales. Sa Théorie des
opérations linéaires est aujourd’hui classique.

Bernoulli (décalage de) (688). Introduit par Jacques Bernoulli (1685).

Bernoulli (équation différentielle de) (390). Jacques Bernoulli l’introduit


(1695), Leibniz (1696) et Jean Bernoulli (1697) la résolvent.

Bernoulli (inégalité de) (33). Due indépendamment à Barrow (1670) et Jac-


ques Bernoulli (1670).

Bernoulli, Jacques (1654-1705) (33, 390, 688). Mathématicien suisse, d’une


famille protestante anversoise qui émigra à Bâle pour échapper aux persécu-
tions du duc d’Albe. Contributions fondamentales au calcul différentiel et
intégral, à la théorie des courbes, aux équations différentielles, au calcul des
probabilités et à la mécanique. Un des créateurs du calcul des variations.

Bernoulli, Jean (1667-1748) (34, 147, 344). Mathématicien suisse, frère de


Jacques Bernoulli. D’un caractère très querelleur, qui n’épargna ni son frère
ni ses enfants, il a apporté des contributions essentielles au calcul différentiel
et intégral, au calcul exponentiel, à la théorie des équations différentielles, au
calcul des variations et à la mécanique.

Bertrand, Joseph (1822-1900) (481). Enfant prodige (il entre à l’Ecole Poly-
technique à seize ans), ce mathématicien français n’a peut-être pas réalisé les
espérances mises en lui mais son influence sur la vie académique française a
été énorme. Il conjectura que, pour tout entier n > 3, il existe un nombre
premier compris entre n et 2n − 2, un résultat que Tchebycheff démontra
en 1851.

Bessel (équation différentielle et fonctions de) (460, 564). Introduites par


Bessel (1817). Des cas particuliers avaient déjà été rencontrés par Jacques
Bernoulli (1703), Daniel Bernoulli (1724, 1738, 1748), Euler (1764,
1784), Lagrange (1770) et Fourier (1812). Elles constituent un exemple
important des fonctions spéciales qui jouent un grand rôle en physique et dont
la théorie constitue une partie importante des mathématiques appliquées.
749

Bessel, Friedrich W. (1784-1846) (460, 564, 672). Astronome et mathéma-


ticien allemand, ami de Gauss.

bijection (9). Déjà utilisée par Cantor, cette notion sera définie en général par
Dedekind (1888).

binomiale (série) (434). Enoncée par Newton (1665; publié dans des lettres
en 1776 et dans un ouvrage de Wallis (1685)) et Gregory (1668-1670) et
étudiée dans le cas d’un exposant rationnel par Euler (1774). La première
démonstration convenable et complète de sa convergence est due à Abel
(1826).

Bolzano (théorème de) (123). Enoncé déjà par le mathématicien belge Stevin
(1594), qui l’utilisa pour la résolution d’équations numériques, ce théorème fut
longtemps considéré comme “géométriquement” évident. Bolzano (1817) et
Cauchy (1821) sentirent la nécessité d’une démonstration analytique et en
proposèrent; leur procédé fut rendu complètement rigoureux par la construc-
tion analytique de l’ensemble des nombres réels. Extension aux fonctions de
Rn dans R due à Darboux (1872).

Bolzano-Weierstrass (propriété de) (721). C’est Fréchet (1906) qui mon-


tra son importance dans l’étude des espaces métriques.

Bolzano-Weierstrass (théorème de) (168). Prouvé par Weierstrass (1860)


qui attribue le crédit de la méthode de démonstration à Bolzano (1817).

Bolzano, Bernard (1781-1848) (79, 123, 162, 168, 197, 232, 453, 721).
Mathématicien, logicien, théologien, sociologue et philosophe, ce prêtre tchè-
que a dû affronter l’hostilité des autorités politiques et religieuses en place.
Il est un pionnier de l’étude des fondements de l’analyse mathématique et de
la théorie des ensembles.

bord (620). Si Bq (E) désigne l’ensemble des q-bords dans E et Zq (E) l’ensemble
des q-cycles dans E, munis d’une structure de A-module sur un anneau A,
on sait que Bq (E) ⊂ Zq (E) et le quotient Zq (E)/Bq (E) constitue le q e A-
module d’homologie de E, noté Hq (E). L’homologie constitue une partie im-
portante de la topologie algébrique, c’est-à-dire de l’étude, par des méthodes
algébriques, de la topologie (c’est-à-dire des propriétés géométriques des en-
sembles invariantes par transformations continues).

bord d’un simplexe (610), d’une chaı̂ne (611). Notions introduites par
Poincaré (1899) et précisées par Alexander (1926), Alexandroff
(1926), Newmann (1926) et Lefschetz (1933).

Borel-Lebesgue (propriété de) (717). Enoncée et démontrée pour un interval-


le fermé borné de R par Borel (1895) dans le cas d’un recouvrement dénom-
brable, et par Lebesgue (1904) dans le cas d’un recouvrement quelconque.
750 CHAPITRE 18. INDEX HISTORIQUE

Borel, Emile (1871-1956) (393, 525, 717). Mathématicien français; à côté de


la mesure qui porte son nom, il a apporté des contributions essentielles à la
théorie des fonctions de variables réelles et de variables complexes, au calcul
des probabilités et à la théorie des jeux. Il anima les mathématiques françaises
de la première moitié du sièce et fut ministre de la marine en 1925. Ses Leçons
sur la théorie des fonctions sont célèbres.

borné (ensemble) (62, 130, 199, 716).

bornée (fonction) (113, 679), (suite) (168). La terminologie et la notion pré-


cises furent introduites pour les suites par Pasch (1882).

bornée à l’infini (fonction) (63).

bornes atteintes (théorème des) (137). Enoncé et prouvé dans R par Weier-
strass aux environs de 1860. Extension à R2 par Darboux (1872) et à Rn
par Riquier (1890) et Peano (1884).

boule, boule ouverte (24, 684, 128). Notion introduite dans Rn par Dede-
kind (1871) et Baire (1899). Dedekind démontra qu’une boule ouverte
est un ouvert.

Bouquet, Jean-Claude (1819-1885) (112). Mathématicien français, élève de


Cauchy. Avec Briot, il est l’auteur du premier traité présentant de manière
systématique la théorie des fonctions d’une variable complexe élaborée par
Cauchy (Théorie des fonctions elliptiques).

Bourbaki, Nicolas (37). Pseudonyme d’un groupe fondé par de jeunes mathé-
maticiens français (comprenant en particulier H. Cartan, Chevalley, Di-
eudonné et Weil) qui, dans les années trente, se proposèrent d’écrire un
traité de mathématiques fondé principalement sur la notion de structure. Ce
sont les célèbres Eléments de mathématique.

Briot, Charles (1817-1882) (112). Mathématicien et physicien français (voir


Bouquet).

Brouwer (théorème du point fixe de) (159). Le cas général affirme que toute
application continue d’une boule fermée de Rn en elle-même possède un
point fixe. Sa démonstration, beaucoup plus difficile que pour n = 1, est
due à Brouwer (1912), et peut se faire à partir de techniques de topologie
algébrique ou du théorème de Stokes-Cartan.

Brouwer, Luitzen E.J. (1881-1966) (159). Mathématicien hollandais, il a ap-


porté des contributions fondamentales à la topologie algébrique et la théorie
de la dimension. Il est aussi le créateur de l’école intuitioniste, qui refuse
l’emploi du principe du tiers exclus en mathématique.
751

C-dérivée, C-dérivable (fonction) (104). Notion due, sous le nom de monogè-


ne, à Cauchy (1846).

C-linéaire (application) (74).

C-primitivable (fonction) (647). Notion introduite par Cauchy (1825).

canonique (transformation) (636). Dans le cadre de la mécanique analytique,


des cas particuliers furent considérés par Lagrange (1808), Poisson (1809)
et Hamilton (1834-35). Le cas général fut considéré par Jacobi (1842-
43), Mathieu (1874) et Lie (1877). On les appelle aussi transformations de
contact.

Cantor (ensemble de) (160, 523). Des ensembles de ce type furent introduits
par Smith (1875), Du Bois-Reymond (1880), Volterra (1881) et Cantor
(1883). C’est aujourd’hui un exemple célèbre d’ensemble fractal omniprésent
en théorie du chaos.

Cantor (théorème de) (194).

Cantor, Georg (1845-1918) (1, 17, 33, 34, 36, 159, 163, 194, 523). Ma-
thématicien allemand, créateur de la théorie des ensembles. Il souffrit de
nombreuses crises de dépression nerveuse.

caractéristique (fonction) (485). Notion introduite par de La Vallée Pous-


sin (1915).

Carathéodory (dérivée au sens de) (109). Carathéodory (1918).

Carathéodory (fonction et multiplicateur de) (191, 193). Introduits par


Carathéodory (1935) et Bliss (1938).

Carathéodory, Constantin (1873-1950) (109, 191, 193). Mathématicien


grec, ancien élève de l’Ecole Royale Militaire de Belgique. Contributions
importantes en théorie des fonctions de variables réelles et complexes et en
calcul des variations. Ses Vorlesungen über reelle Funktionen sont classiques.

cardinal (d’un ensemble) (10). Notion due à Cantor (1895).

Carleson, Lennart (né en 1928) (521). Mathématicien suédois, spécialiste de


l’analyse harmonique.

Cartan, Elie (1869-1951) (613, 642). Mathématicien français; plusieurs con-


tributions fondamentales en géométrie différentielle et en théorie des groupes.

Casorati, Felice (1835-1890) (667). Analyste et géomètre italien. Auteur d’un


des premiers traités sur les fonctions holomorphes (1868).
752 CHAPITRE 18. INDEX HISTORIQUE

Cauchy (condition d’intégrabilité de) (351, 353, 365, 366).

Cauchy (critère de) (47, 63, 65, 169, 170, 171, 252, 438, 440, 442, 444,
687, 690). Introduit, pour les suites numériques, par Bolzano (1816) et
par Cauchy (1821). Une démonstration rigoureuse fut donnée par Cantor
(1872). Dû à Cauchy (1853) et Weierstrass (1861) pour la convergence
uniforme.

Cauchy (équation fonctionnelle de) (391). Résolue par Cauchy (1821).

Cauchy (fonction de) (246). Introduite comme contre-exemple par Cauchy


(1821), elle joue un grand rôle en analyse moderne, et en particulier dans la
théorie des distributions qui généralise la notion de fonction et l’opération de
dérivation et qui est due à Sobolev (1936) et L. Schwartz (1945). Ainsi,
si f et g sont des fonctions de R dans R L-intégrables sur tout intervalle
borné de R, on dira que g est la dérivée de f au sens des distributions si,
pour toute fonction
H ϕ de R dans R de H classe C

et nulle en dehors d’un com-
pact de R, on a R g(x)ϕ(x) dx = − R f(x)ϕ (x) dx. La formule d’intégration
#

par parties montre que, si f est deH classe C 1 sur R, on a nécessairement


g = f # . L’application < g, . >: ϕ 2→ R g(x)ϕ(x) dx est une forme linéaire sur
l’ensemble D ⊂ C ∞ des fonctions de classe C ∞ nulles en dehors d’un com-
pact. On l’appelle la distribution associée à la fonction g. On peut définir
plus généralement une distribution comme une forme linéaire sur D vérifiant
certaines conditions de continuité que nous ne préciserons pas ici. Ainsi, la
fonction de Dirac δ “définie” comme fonction nulle sauf en zéro et dont
l’intégrale sur R est égale à un (une telle fonction n’existe évidemment pas
en vertu des propriétés de l’intégrale), est en fait la distribution δ définie
par < δ, ϕ >= ϕ(0) pour tout ϕ ∈ D. Si H désigne l’application d’Heaviside
définie par H(x) = 0 si x < 0 et H(x) = 1 si x ≥ 0, alors, sa dérivée au sens
des distributions est la distribution H # définie par
J J +∞
< H # , ϕ >= − H(x)ϕ# (x) dx = − ϕ# (x) dx = ϕ(0) =< δ, ϕ >,
R 0

pour tout ϕ ∈ D, c’est-à-dire (au sens de l’égalité des distributions), h# = δ.


La théorie des distributions joue un grand rôle en analyse moderne.

Cauchy (inégalité de) (21). On la trouve chez Cauchy (1821).

Cauchy (inégalité pour une fonction holomorphe) (654). Cauchy (1831).

Cauchy (problème de) (311, 313, 701, 724). Considéré pour la première fois
par Cauchy (1823).

Cauchy (reste du développement de Taylor de) (244). Cauchy (1823).

Cauchy (suite de) (171, 690).


753

Cauchy (théorème de la moyenne de) (146). Cauchy (1823).

Cauchy (théorème intégral de) (648). Résultat dû indépendamment à Cau-


chy (1825, 1846) et Weierstrass (1842). On le trouve en outre dans des
papiers non publiés de Gauss révélés par une lettre de ce dernier à Bessel
(1811). Goursat (1900) a démontré le théorème intégral de Cauchy sous la
seule hypothèse que f soit C-dérivable (sans hypothèse de continuité sur f # ).
Cette démonstration repose essentiellement sur le lemme de Cousin.

Cauchy-Picard (théorème de) (702). Découvert par Cauchy (1824). La dé-


monstration donnée est essentiellement celle de Picard (1890).

Cauchy-Riemann (conditions de) (105). Obtenues par d’Alembert (1752)


et Euler (1755) pour les composantes u et v de la vitesse d’écoulement d’un
fluide parfait, elles expriment que les formes u dy − v dx et u dx + v dy sont
exactes. En 1776, Euler montre qu’elles expriment le fait que l’expression
(u + iv)(dx + idy) est une différentielle exacte. Elles apparaissent alors chez
Cauchy (1814) dans le cas général et sont à la base de l’approche de Rie-
mann (1851) en analyse complexe.

Cauchy-Schwarz (inégalité de) (683). Elle apparaı̂t chez Cauchy (1821).

Cauchy-Schwarz-Bouniakowsky (inégalité de) (565). Enoncée pour la pre-


mière fois par Bouniakowsky (1859) et retrouvée par Schwarz (1885).

Cauchy, Augustin (1789-1857) (22, 35, 38, 47, 63, 65, 78, 80, 105, 110,
112, 146, 164, 169, 170, 171, 244, 246, 251, 286, 311, 313, 319, 391,
392, 421, 433, 435, 438, 440, 442, 444, 480, 648, 651, 654, 672, 677,
683, 687, 690, 701, 702, 724). Mathématicien français très prolifique et
catholique militant, il a apporté des contributions fondamentales dans toutes
les parties des mathématiques et de la physique mathématique. Par fidélité à
Charles X, il le suivit en exil et sera, à Prague, le tuteur de l’impertinent duc
de Bordeaux, héritier des Bourbons. Son Cours d’analyse et son Résumé sur
le calcul infinitésimal, aujourd’hui célèbres et universellement admirés, repro-
duisent des leçons à l’Ecole polytechnique qui furent unanimement critiquées
à l’époque.

Cellérier, Charles (mort en 1889) (453, 481). Les travaux de ce mathémati-


cien suisse sur les fonctions continues sans dérivées ont été découverts après
sa mort.

chaı̂ne (609). Notion due à Poincaré (1899) et et précisée par Alexander


(1926), Alexandroff (1926), Newmann (1926) et Lefschetz (1933).

chaleur (équation de la) (316, 564). Introduite par Fourier (1812).

champ vectoriel (579). Notion introduite par Thomson (1851).


754 CHAPITRE 18. INDEX HISTORIQUE

changement de variable dans une intégrale (554, 559, 561). Des cas parti-
culiers apparaissent chez Euler (1759), Lagrange (1773), Laplace (1776),
Legendre (1788) et Gauss (1813). Le cas général pour des fonctions con-
tinues fut traité par Ostrogradsky (1836), Catalan (1841) et Jacobi
(1833, 1841) et, pour les fonctions L-intégrables, par Hobson (1910). La
démonstration donnée ici s’inspire de celle de Hadamard (1937) et de J.T.
Schwartz (1954).

chaos (173). La théorie du chaos, c’est-à-dire l’étude de la dépendance sensitive


aux conditions initiales dans les systèmes dynamiques, trouve ses racines dans
les travaux de Poincaré (1889, 1899) et Hadamard (1898). Leur impor-
tance en physique fut déjà remarquée par Duhem (1906).

chemin (605, 609).

choix (axiome du) (3). Enoncé par Zermelo (1908), il suscita de nombreuses
controverses parmi les mathématiciens.

circulation (580, 618). Première apparition du concept chez Clairaut (1743).

classe C ∞ , C k (fonction de) (246, 276).

cobord (620), cocycle (621). Si B q (E) désigne l’ensemble des q-cobords dans
E et Z q (E) l’ensemble des q-cocycles dans E, alors B q (E) ⊂ Z q (E) et
H q (E) = Z q (E)/B q (E) est le q e espace vectoriel de cohomologie de E (de
Rham (1950)). Le théorème de Stokes-Cartan établit une dualité entre
l’homologie et la cohomologie de E.

codifférentielle extérieure (601). Notion introduite par de Rham (1950).

coefficients indéterminés (méthode des) (302). Utilisés par Newton (1671;


publ. 1736) dans sa résolution formelle des équations différentielles par des
séries.

Cohen, Paul (né en 1934) (17). Mathématicien américain, médaille Fields en


1966. A côté de travaux importants sur l’analyse réelle, l’analyse harmo-
nique et les équations aux dérivées partielles, il est connu surtout pour sa
démonstration de l’indépendance de l’hypothèse du continu et de l’axiome du
choix en théorie des ensembles de Zermelo-Fraenkel (1963).

col (145). Voir “selle (point de)”.

compact (718). Notion introduite par Fréchet (1906) dans les espaces métri-
ques à partir de la propriété de Bolzano-Weierstrass. La définition donnée
ici, fondée sur la propriété de Borel-Lebesgue, est celle d’Alexandroff et
Urysohn (1924).

complet (espace métrique) (692). Notion introduite par Fréchet (1906).


755

complexes (nombres) (25). Introduits heuristiquement par Cardan (1545) et


utilisés par Bombelli (1572) pour résoudre les équations du troisième degré,
on les rencontre pour la première fois hors d’Italie chez Stevin (1585).
Leibniz (1702) les considère comme un “remarquable et merveilleux refuge
de l’esprit humain, une sorte d’amphibie de l’être et du non-être”. Leur
représentation trigonométrique est due à Euler (1748) et leur représentation
géométrique à Gauss (1796), Wessel (1797) et Argand (1806). Leur
présentation algébrique comme couples de réels soumis à certaines opérations
est due à Hamilton (1833). L’expression nombre complexe est due à Gauss.

composé (graphe) (6). Notion due à Dedekind (1888).

concave (fonction) (228).

conditions aux limites (314). Des conditions aux limites particulières pour des
équations différentielles ordinaires apparaissent au XVIIIe siècle, en partic-
ulier chez Taylor (1715). Une théorie générale pour les équations linéaires
du second ordre sera édifiée par Sturm et Liouville (1836) et jouera un
grand rôle dans la genèse de l’analyse fonctionnelle. Le cas de conditions
aux limites ou d’équations différentielles non linéaires requiert l’emploi de
méthodes itératives, topologiques ou variationnelles.

conforme (représentation) (670). Les transformations conservant les angles


sont importantes en cartographie. C’est le cas de la célèbre projection de Mer-
cator (1569), due à Gerhard Kremer, dit Mercator, qui fut, à l’Université
de Louvain, l’élève de Gemma Frisius. Euler (1768, 1777) les étudie par
les fonctions complexes et les appelle “infinitésimalement semblables”. Le
terme “application conforme” est dû à Schubert (1789). Gauss (1825)
résoud le problème de la représentation conforme d’un plan sur lui-même. Le
problème de la représentation conforme d’un domaine simplement connexe
sur un disque, considéré par Riemann (1851), sera traité rigoureusement par
Neumann et Schwarz.

conjugué (d’un nombre complexe) (26). Notion déjà familière à Newton


(1673) et Leibniz (1675); la dénomination semble due à Cauchy (1841).

connexe par arcs (125). La définition générale d’ensemble connexe (qui équi-
vaut, pour un ouvert, à celle donnée ici), est due à Hausdorff (1914).

continue (fonction) (69, 122, 159, 688). La notion intuitive de fonction con-
tinue est présente dès le XVIIIe siècle, avec des acceptions diverses, mais il
faut attendre Bolzano (1817) et Cauchy (1821) pour une formulation plus
précise, qui conduit à la définition de Weierstrass (1861) adoptée ici. La
formulation en termes de voisinages est due à Hausdorff (1914). La carac-
térisation de la continuité par les suites est due à Cantor (1871). Pour les
fonctions de plusieurs variables, Cauchy (1821) pensait avoir démontré que
756 CHAPITRE 18. INDEX HISTORIQUE

la continuité résulte de la continuité séparée par rapport à chaque variable.


Des contre-exemples furent donnés par Thomae (1870), Schwarz (1872) et
Baire (1896).

contractante (application) ou contraction (174, 688, 700).

contractantes (théorème des applications) (174, 700). Enoncé et démontré


par Goursat (1903) pour des applications de Rn dans Rn , par Banach
(1922) pour des espaces normés complets et par Caccioppoli (1930) pour
des espaces métriques complets.

contractile (ensemble) (636).

contraction (constante de) (174).

contraposée (1).

convergence absolue (condition suffisante de) (256).

convergence bornée (théorème de) (478). Dû à Lebesgue (1902). Version


plus faible pour l’intégrale de Riemann chez Arzela (1875) et Osgood
(1897).

convergence d’une série (condition nécessaire de) (251). Longtemps con-


sidérée comme suffisante. Bolzano (1817) a remarqué que la divergence
de la série harmonique est un exemple de son caractère non suffisant.

convergence d’une série (condition suffisante de) (253).

convergence d’une série à termes positifs (CNS) (255).

convergence de la série de Taylor (condition suffisante de) (258). Cas


particuliers chez Laplace (1812), Cauchy (1823), Schlömilch (1852).

convergence des suites monotones (CNS) (213). Dedekind (1872) prouve


l’existence d’une limite pour une suite croissante et majorée, longtemps con-
sidérée comme géométriquement évidente.

convergence dominée ou majorée et minorée (théorème de) (474, 478).


Dû, pour son intégrale, à Lebesgue (1910).

convergence monotone pour les fonctions continues (théorème de)


(465). Dû à Dini (1878).

convergence non absolue d’une série (condition nécessaire de) (257).


757

convergente (série) (250). L’expression est due à Gregory (1667) et la premi-


ère définition rigoureuse à Bolzano (1817) et Cauchy (1821). Les premiers
cas particuliers d’étude rigoureuse de convergence d’une série remontent à
Gauss (1813) et Bolzano (1816).

convergente (suite) (65, 689).

convexe (ensemble) (230, 627). Définition due à Minkowski (1903).

convexe (fonction) (227, 230, 283). L’étude de la convexité d’une fonction à


l’aide du signe de sa dérivée seconde apparaı̂t chez Leibniz (1677; publ.
1684) et Newton (1671; publ. 1736). La définition et l’étude systématique
des fonctions convexes est due à Jensen (1905), après que certains résultats
aient été obtenus par Stolz (1893).

convolution (produit de) (529). Des produits de convolution particuliers ap-


paraissent chez Poisson (1815), Cauchy (1815) et Dirichlet (1829) dans
l’obtention de solutions d’équations différentielles et dans l’étude des séries
de Fourier, et chez Weierstrass (1885) dans sa démonstration du théorème
d’approximation d’une fonction continue. Tchebychev (1890) étudie le pro-
duit de convolution de deux transformées de Fourier et Volterra (1913) met
l’accent sur les aspects algébriques de cette “composition” de deux fonctions.

couple (2).

courbe simple (569). Notion due à Jordan (1893). Si l’on abandonne la condi-
tion d’injectivité, on peut construire une application continue de [0, 1] dans
R2 dont l’image est [0, 1] × [0, 1] ! (Peano (1890)).

Cousin (lemme de) (120, 130). Un résultat de ce type, pour une “région régu-
lière” de R2 , est énoncé et démontré par Cousin (1895). Pour un intervalle
de R, un résultat analogue est dû à Lusin (1911) et Henstock (1963) l’étend
à un pavé de R2 .

Cousin (propriété de) (131, 717).

Cousin, Pierre (1867-1933) (120, 130, 131, 162, 717). Mathématicien fran-
çais, élève de Poincaré et Appell. Importantes contributions à la théorie
des fonctions de plusieurs variables complexes.

critique (point) (145, 730). La théorie des points critiques, qui étudie l’exis-
tence et le nombre des points critiques de fonctions réelles définies sur des
espaces de dimension finie ou infinie, a des connections importantes avec la
topologie, l’analyse fonctionnelle, l’analyse convexe, la théorie des équations
différentielles et aux dérivées partielles, la mécanique, la physique théorique
et l’économie mathématique.
758 CHAPITRE 18. INDEX HISTORIQUE

croissante (fonction) (209).

cube (115).

cycle (609, 620). Voir “bord”.

d’Alembert (théorème de) (140). Voir “algèbre (théorème fondamental de


l’)”.

d’Alembert, Jean le Rond (1717-1783) (77, 109, 140, 285, 423, 435). Ma-
thématicien, physicien et philosophe français. Fils naturel de la marquise
de Tencin, il a apporté des contributions de premier ordre à l’analyse et la
mécanique. Il dirigea, avec Diderot, la publication de l’Encyclopédie.

Darboux (continuité au sens de ou propriété de) (125, 159, 325). Notion


étudiée rigoureusement par Darboux (1875). On sait aujourd’hui qu’une
fonction continue au sens de Darboux sur un intervalle peut être discontinue
en chaque point et non-mesurable sur chaque partie de mesure positive. La
somme et le produit de deux fonctions continues au sens de Darboux ne le
sont pas nécessairement.

Darboux, Gaston (1842-1917) (125, 159, 325). Mathématicien français. A-


près des travaux sur les fonctions réelles et leur intégration, il se consacra
à la géométrie différentielle. Sa correspondance est émaillée de remarques
impertinentes sur ses contemporains.

décroissante (fonction) (209).

Dedekind (test de convergence d’une série de) (431). On le trouve dans la


deuxième édition (1871) des leçons de Dirichlet éditées par Dedekind.
Démontré indépendamment par du Bois-Reymond (1870). On trouve un
cas particulier chez Catalan (1860).

Dedekind (test d’intégrabilité de) (410).

Dedekind, Richard (1831-1916) (36, 410, 431). Mathématicien


allemand, auteur d’une théorie des nombres réels, il a introduit et étudié
de nombreux concepts fondamentaux en algèbre et en théorie des ensembles.
Sa soeur Julie fut romancière.

défini (6).

de La Vallée Poussin, Charles-Jean (1866-1962) (440, 526, 567). Mathé-


maticien belge, professeur à l’Université de Louvain pendant soixante ans,
il démontra le théorème des nombres premiers et contribua à la théorie des
fonctions de variables réelles, de la représentation conforme et du potentiel.
Son Cours d’analyse infinitésimale est resté célèbre.
759

De Moivre (formule de) (268). Introduite par De Moivre (1707).

De Moivre, Abraham (1667-1754) (268). Mathématicien d’origine française


réfugié en Angleterre pour ses opinions protestantes. On lui doit un im-
portant traité sur le calcul des probabilités.

Denjoy, Arnaud (1884-1974) (349, 393). Mathématicien français. On lui doit


la première intégrale capable d’intégrer toutes les dérivées (il l’appela la
totale). Contributions importantes en analyse harmonique et en équations
différentielles.

dénombrable (ensemble) (11). Notion due à Cantor (1873), qui démontra que
Q est dénombrable et que R ne l’est pas.

dense (partie) (706). Introduite pour R par Cantor (1879).

dérivabilité à gauche ou à droite (82).

dérivabilité par rapport à une fonction (161).

dérivable (fonction indéfiniment) (246).

dérivable (fonction k fois) (234).

dérivable dans une direction (fonction) (91). Parfois appelée dérivable au


sens de Gateaux (1919)

dérivable (fonction) (81, 85). Pour une fonction de R dans Rp , la première


définition donnée ici, en germe chez Newton et d’Alembert, se trouve
chez L’Huilier (1786), Bolzano (1817) et Cauchy (1821). La formulation
équivalente est due à Weierstrass (1861); on la trouve déjà en germe chez
da Cunha (1790). Quoiqu’on trouve déjà chez Euler (1734) des formes
linéaires dont les coefficients sont les dérivées partielles d’une fonction, la
notion de dérivabilité d’une fonction de Rn dans Rp introduite ici est due à
Stolz (1893). Elle fut développée par Pierpont (1905), William H. Young
(1910), Fréchet (1912) et de La Vallée Poussin (1913), qui l’introduisit
dès 1914 dans son cours d’analyse à l’Université de Louvain.

dérivation d’une fonction composée (règle de) (98). La forme donnée ici est
due à Stolz (1893).

dérivé (nombre ou vecteur) (81). Bien qu’on trouve des traces de la notion de
dérivée dans les recherches géométriques sur la détermination des tangentes
aux courbes, spécialement chez Fermat, Torricelli et Barrow au XVIIe
siècle, il faut attendre Newton (1687) et Leibniz (1676) pour en dégager la
notion analytique correspondante et en donner les premières règles de calcul.
La terminologie et la notation df/dx sont dues à Leibniz (1676), tandis que
760 CHAPITRE 18. INDEX HISTORIQUE

la notation f # (x), due à Foncenex (1759), fut systématiquement popularisée


par Lagrange.

dérivé d’ordre supérieur (vecteur) (234).

dérivée (fonction) (233).

dérivée d’ordre supérieur (fonction) (234).

dérivée dans une direction (91).

dérivée logarithmique (107).

dérivée partielle (91). Utilisée dans des situations particulières par Leibniz
(1694), Newton, Jacques Bernoulli, Nicolas Bernoulli (1720), cette
notion fut introduite plus systématiquement par Fontaine, Euler (1734),
Clairaut (1739) et d’Alembert (1744). La notation fi# est due à La-
grange et la notation ∂f/∂xi à Legendre (1786).

dérivée partielle d’ordre supérieur (fonction) (271).

dérivée totale (89), dérivée totale (fonction) (270).

difféomorphisme (555). Un des buts de la topologie différentielle est de décider


si deux variétés différentiables sont difféomorphes.

différentiable (fonction) (85).

différentielle (89), différentielle (fonction) (270).

différentielle extérieure d’une forme (596). Notion introduite par Frobeni-


us (1877) et, dans le cas général, par Elie Cartan (1899). La notation dω,
déjà utilisée par le physicien mathématicien belge De Donder en 1902, ne
se généralisera qu’après son adoption par Kähler en 1934.

Dini (théorème de) (465). Dû à Dini (1878).

Dini, Ulisse (1845-1918) (465). Mathématicien italien, le créateur de l’école


italienne de théorie des fonctions de variables réelles. Son traité Fondamenti
per la teoria delle funzioni di variabili reali est célèbre et sa statue se trouve
à Pise.

direction (90).

Dirichlet (fonction de) (71, 76, 354). Introduite par Dirichlet (1829).

Dirichlet (intégrale de) (636). On la trouve déjà chez Gauss (1839).

Dirichlet (test d’intégrabilité de) (410). dû en réalité à Chartier (1853).


761

Dirichlet (test de convergence d’une série de) (432). On le trouve dans les
leçons de Dirichlet publiées par Dedekind (1863).

Dirichlet, Peter G. Lejeune (1805-1859) (35, 71, 76, 314, 354, 410, 432,
636). Mathématicien allemand dont la famille est d’origine belge (le nom
vient de “de Richelette”, village de la province de Liège et le grand-père
de Dirichlet était verviétois). Dirichlet épousa la soeur du musicien
Mendelsohn. Contributions essentielles en analyse et en théorie des nombres.

discontinue (fonction) (69, 687).

discrète (métrique) (676).

disque de convergence d’une série entière (426). Le terme cercle de conver-


gence fut introduit par Méray (1872).

distance (675). Les axiomes de la distance, sous une forme équivalente à celle
donnée ici, furent introduits par Fréchet (1906). Leur forme actuelle est
due à Hausdorff (1914).

distribution (fonction de) (494).

divergence (d’un champ vectoriel) (601, 619). Notion déjà connue au temps
d’Euler mais systématisée (avec le signe opposé) par Maxwell (1873), qui
l’appelle la convergence du champ. C’est Clifford (1878) qui change le
signe et l’appelle divergence.

divergente (série) (250). Expression due à Nicolas Bernoulli (1713). On peut


parfois donner un sens généralisé à la notion de “somme” dans le cas d’une sé-
rie divergente, par exemple en remplaçant l’existence de la limite des sommes
partielles des termes de la série par celle de la limite de la suite des moyen-
nes arithmétiques des termes de la série, ou des moyennes arithmétiques de
ces moyennes, etc. Cette méthode, en germe chez d’Alembert (1768), D.
Bernoulli (1771) et Lagrange (1799), a été développée par Kronecker
(1876), Frobenius (1880), Hölder (1882) et Cesaro (1890). D’autres
méthodes de sommations de séries divergentes, trouvant leurs germes dans des
travaux d’Euler (1745), Poisson (1820) et Abel (1826), ont été développées
par Borel (1899).

divergente (suite) (65).

division (131, 717).

domaine (5).

Du Bois-Reymond (lemme de) (733). Dû à Du Bois-Reymond, à l’occasion


d’une critique pénétrante des traitements antérieurs du calcul des variations.
762 CHAPITRE 18. INDEX HISTORIQUE

Du Bois-Reymond (test d’intégrabilité de) (409).


Du Bois-Reymond (test de convergence d’une série de) (430). du Bois-
Reymond (1870).
Du Bois-Reymond, Paul (1831-1889) (409, 430, 733). On doit à ce frère du
célèbre physiologiste Emile Du Bois-Reymond des contributions au calcul
intégral, au calcul des variations et à la théorie des séries de Fourier.
écriture canonique d’une forme (589, 595).
élasticité d’une fonction (161).
élément de surface simple (575). Cette notion peut se généraliser comme suit
à des dimensions quelconques. Soit W ⊂ Rn non vide. On appelle représen-
tation paramétrique vraie de W de classe C m , de dimension k, une application
Φ d’un ouvert O de Rk dans Rn de classe C m qui est un homéomorphisme de
O sur W (c’est-à-dire une bijection continue et d’inverse continu de O sur W )
tel que, pour chaque u ∈ O, le rang de Φ#u est égal à k. Cela étant, une partie
non vide V de Rn est appelée une sous-variété de classe C m et de dimension
k de Rn si, pour chaque a ∈ V , il existe un voisinage ouvert Ua de a dans Rn
tel que l’intersection Ua ∩ V admette une représentation paramétrique vraie,
de dimension k et de classe C m . Le théorème des fonctions implicites permet
alors de démontrer que pour que V ⊂ Rn soit une sous-variété de classe C m
et de dimension k de Rn , il faut et il suffit que, pour tout a ∈ V , il existe
un voisinage ouvert Ua de a dans Rn et une application F : Ua → Rn−k
de classe C m telle que le rang de Fx# soit égal à n − k pour tout x ∈ Ua ,
et telle que V ∩ Ua = F −1 (0). Dans ce cas, on dit que la sous-variété est
définie par des équations implicites. Par exemple, si f est une application
de classe C m d’un ouvert G ⊂ Rk dans Rn−k , alors le graphe de f est une
sous-variété de Rn de dimension k et de classe C m . Le théorème des fonctions
implicites permet de prouver que toute sous-variété de Rn de classe C m et de
dimension k est, localement, le graphe d’une telle fonction f. La notion de
variété différentiable de dimension k peut se définir d’une manière abstraite
sans qu’elle soit contenue dans Rn . Un important théorème démontré en 1936
par H. Whitney montre en fait que toute variété abstraite de dimension k
et de classe C m peut être considérée comme une sous-variété de dimension k
et de classe C m dans R2k+1 . L’étude locale et globale des variétés fait l’objet
de la géométrie différentielle et de la topologie différentielle.

H (intégrales et fonctions) (338). Les intégrales indéfinies de la for-


elliptiques
me √dx , où P est un polynôme de degré quatre (intégrales elliptiques),
P (x)
ne se ramènent pas en général à des fonctions algébriques ou transcendantes
élémentaires et Legendre (1825-26) réduit leur étude à celle de trois formes
normales. Un an plus tard, Jacobi et Abel ont l’idée de considérer les fonc-
tions réciproques (dites fonctions elliptiques) des intégrales elliptiques comme
763

fonctions d’une variable complexe, et ils montrent leur double périodicité. Des
cas particuliers avaient été obtenus (mais non publiés) par Gauss en 1796.
L’analogie avec les fonctions circulaires se révèle ainsi et les intégrales el-
liptiques sont aux fonctions elliptiques ce que les fonctions trigonométriques
inverses sont aux fonctions trigonométriques. Le développement de la théorie
des fonctions elliptiques occupera les mathématiciens jusqu’à la fin du XIXe
siècle, et de nouvelles applications voient continuellement le jour.

ensemble (1). Anticipée par Bolzano (1851), la première étude systématique


des ensembles est due à Cantor (1873-1897), motivée par de délicats
problèmes relatifs aux séries trigonométriques. Dedekind (1871) et Du
Bois-Reymond (1882) ont également contribué de manière significative à
la naissance de la théorie.

entier (naturel), (relatif ) (3, 12). Abordé par Grassmann, qui employa ex-
plicitement le principe d’induction, le problème de la définition axiomatique
des entiers naturels fut résolu par Frege (1884), Dedekind (1888) et Peano
(1891).

entière (fonction) (668). Les fonctions entières constituent une généralisation


des fonctions polynômiales sur C. Elles jouissent de propriétés remarquables,
analogues à celles des polynômes (par exemple leur expression comme pro-
duits infinis de monômes) mais aussi de propriétés différentes (comme le
théorème de la valeur lacunaire de Picard.) La théorie des fonctions entières
est une partie importante et développée de la théorie des fonctions d’une vari-
able complexe.

entière (série) (425). Voir “potentielle (série)”.

équation (171).

équation différentielle à variables séparées (376). La méthode pour leur in-


tégration fut communiquée par Leibniz à Huygens en 1691. Le nom et la
méthode générale sont dus à Jean Bernoulli (1694).

équation différentielle linéaire (288, 375). L’équation linéaire du premier or-


dre fut intégrée par Leibniz (1684) et Jean Bernoulli (1692). Des cas
particuliers d’équations différentielles linéaires à coefficients constants furent
résolus par Jean Bernoulli (1698), Euler (1739) et Daniel Bernoulli
(1739). Le premier traitement systématique du cas homogène est dû à Eu-
ler (1743). La réduction du cas non homogène au cas homogène et à la
connaissance d’une solution particulière est due à d’Alembert (1762-1765).
La notation symbolique L(D) est due à Lagrange (1766), Arbogast (1800)
et Cauchy (1827).
764 CHAPITRE 18. INDEX HISTORIQUE

équipotent (10). La notion d’équipotence entre ensembles est due à Cantor


(1878), qui montra que R et Rn sont équipotents. Cantor (1877) af-
firma aussi que deux ensembles sont équipotents si chacun d’entre eux est
équipotent à une partie de l’autre, un résultat démontré par Dedekind
(1887), Schröder (1896) et F. Bernstein (1898).

équi-uniforme (continuité) (722). Notion introduite par Ascoli (1883).

équivalentes (normes) (23, 160).

escalier (fonction en) (713).

espace métrique (675). Voir “distance.”

essentiel (point singulier) (664). Casorati (1868), Sohotsky (1868) et Wei-


erstrass (1876) démontrèrent indépendamment que si f possède un point
singulier essentiel en a, alors, pour tout voisinage U de a, f(U \ {a}) est dense
dans C. Picard (1879) démontrera le résultat beaucoup plus précis suivant :
f(U \ {a}) est égal à C privé au plus d’un point (valeur lacunaire de Picard).

étoilé (ensemble) (627).

euclidienne (norme) (22).

Euler (condition nécessaire) (729). De nombreuses équations de toutes na-


tures peuvent s’écrire sous forme de la condition nécessaire d’Euler d’existence
d’un point critique d’une fonction réelle ϕ définie sur un certain espace
métrique. L’existence d’une solution de ces équations est donc équivalente
à celle d’un point critique de ϕ et, dans le cas le plus simple, à l’existence
d’un minimum (ou d’un maximum) absolu de ϕ. C’est ce que l’on appelle la
méthode directe du calcul des variations qui, après avoir été utilisée heuris-
tiquement par Dirichlet (1848) et Riemann (1857) en théorie du potentiel
et en théorie des fonctions d’une variable complexe, a été mise sur des bases
sûres par Hilbert (1900) (après des tentatives incomplètes mais intéressantes
d’Arzela (1889)) et systématisée par Tonelli (1922).

Euler (constante d’) (420). Découverte par Euler (1734), qui en calcule 16
décimales. Elle reste l’une des plus mystérieuses constantes de l’analyse.

Euler (équation différentielle d’) (315). Le travail d’Euler date de 1743,


mais la solution était déjà connue de Jean Bernoulli (1700).

Euler (formule d’) (108). Donnée par Euler (1755).

Euler (intégrales d’) (408, 413). La fonction Gamma fut introduite par Euler
(1729), la terminologie et la notation étant dues à Legendre (1814). La
fonction Beta fut déjà considérée par Wallis, Newton (1676) et Stirling
765

(1770). Les travaux d’Euler datent de 1770 et la notation B(p, q) est due à
Binet (1839).

Euler-Lagrange (équations d’) (734, 735). Obtenues par Euler (1744) par
une méthode d’approximation polygonale de la courbe cherchée et un passage
à la limite, ces équations seront obtenues plus simplement par Lagrange
(1762) par une méthode analytique.

Euler, Leonhard (1707-1783) (34, 38, 78, 108, 217, 315, 344, 356, 392,
408, 413, 420, 729, 734, 735). Mathématicien suisse, le plus prolifique de
l’histoire des mathématiques (la publication de ses oeuvres n’est pas encore
achevée !), malgré la cécité qui l’affligea à la fin de sa vie. Il fut au service de
Frédéric II de Prusse et de la Grande Catherine de Russie. Prodigieux algo-
riste, il a contribué à toutes les parties des mathématiques pures et appliquées.
Ses traités Introduction à l’analyse infinitésimale, Guide de calcul différentiel
et Guide de calcul intégral ont eu une importance fondamentale. Auteur du
premier ouvrage systématique de calcul des variations et de mécanique ra-
tionnelle et des Lettres à une princesse allemande, ouvrage de vulgarisation
scientifique où l’on trouve une surprenante anticipation des diagrammes de
Venn de la théorie naı̈ve des ensembles.

exacte (forme) (620). La notion apparaı̂t, pour les 1-formes, chez Euler (1739)
et Clairaut (1740) et puis, au XIXe siècle, chez Jacobi, Clebsch et
Frobenius.

exponentielle (fonction) (216, 217, 225). Pour un argument rationnel, elle est
connue depuis longtemps (Stifel (1544)). Newton (1669) et Leibniz (1676)
trouvent son développement en série. Jean Bernoulli (1694, 1697) est le
premier qui ait cherché à créer un calcul particulier pour ces puissances que
Leibniz proposa d’appeler exponentielles. Glaisher (1883) en donne la
première table. La dérivée de l’exponentielle est calculée par Leibniz (1694).
La formule adoptée ici pour définir l’exponentielle remonte sûrement à Eu-
ler (1748), mais Daniel Bernoulli (1728) la connaissait pour x = 1 et
probablement pour x quelconque.

exponentielle (série) (257, 427). On la trouve pour la première fois chez New-
ton (1669) et Leibniz (1674).

exponentielle complexe (fonction) (269). La formule exp ix = cos x + i sin x


est due à Euler (1743). Le mathématicien belge Mansion insista sur
l’intérêt méthodologique de la définition de l’exponentielle complexe adoptée
ici.

exponentielle imaginaire (fonction) (268).

exponentielle-polynôme (295).
766 CHAPITRE 18. INDEX HISTORIQUE

extrémant, extrémum (142). Voir aussi “libre”, “lié”.

face d’un simplexe (610).

faible (extrémant local) (731). La notion d’extrémant local faible ou fort fut
introduite par Weierstrass (1879). La terminologie est due à Kneser
(1900).

famille (9).

Fatou (lemme de) (523). Il est dû à Fatou (1906).

Fatou, Pierre (1878-1929) (523). Mathématicien français. Ses travaux ont


rapproché la théorie des fonctions d’une variable réelle et d’une variable com-
plexe.

Fermat (théorème de) (143). Kepler (1615), qui établit des tables donnant le
volume de tonneaux en fonction de leur dimension, observa qu’à l’approche
du volume maximum, le changement de volume pour un changement donné
de dimension diminuait, un fait déjà observé précédemment par Oresme
au XIVe siècle pour l’ordonnée maximum d’un demi-cercle. En 1636, Fer-
mat détermina les extrema de polynômes par une méthode équivalente à la
recherche des zéros de la dérivée (non encore définie à l’époque !). L’emploi
explicite de la dérivée dans ces problèmes est dû à Leibniz (1684) et une
définie claire d’extrémant apparaı̂t chez Cauchy (1821). La généralisation
du résultat de Fermat au cas de fonctions de deux variables est due à Euler
(1755).

Fermat, Pierre de (1601-1665) (143, 163). Juriste français, conseiller du roi


au Parlement de Toulouse, on l’a justement appelé le prince des amateurs
en mathématiques. Il a créé, indépendamment de Descartes, la géométrie
analytique, anticipé le calcul différentiel et intégral et enrichi l’optique et la
théorie des nombres. Sa conjecture (il n’existe pas de solutions en nombres
entiers de l’équation xn + yn = z n lorsque l’entier n ≥ 3) n’est toujours pas
démontrée pour toutes les valeurs de n, même si l’on sait aujourd’hui, grâce
à Faltings, que, pour chaque n ≥ 3, l’ensemble des solutions est fini.

fermé (ensemble) (126, 129, 703). Notion due à Cantor (1879).

fermée (forme différentielle) (621). Notion déjà utilisée par Clairaut (1739-
1740) pour les 1-formes. Dès 1768, d’Alembert donna l’exemple (x dy −
y dx)/(x2 + y2 ) pour distinguer une forme exacte d’une forme fermée. Poin-
caré (1887) et Volterra (1889) obtinrent les conditions pour d’une 2-
forme, et plus généralement une k-forme soit fermée sans utiliser explicitement
la différentielle extérieure (non encore définie), qui devra attendre les travaux
d’Elie Cartan (1899). La terminologie est due à de Rham.
767

Feynman Richard P. (1918-1988) (318). Physicien américain, spécialiste de


la théorique quantique des champs et auteur d’un remarquable Cours de
Physique.
Fibonacci (suite de) (75). Introduite par Fibonacci (1202) pour déterminer le
nombre de couples de lapins produits par un couple

de lapins

en une année.
(1+ 5)n+1 −(1− 5)n+1
Binet a obtenu la formule explicite un = √
2n+1 5
pour les ter-
mes de la suite.
Fibonacci, Leonardo da Pisa, dit (1170?-1250?) (75). Après s’être impré-
gné, au cours de ses voyages, des mathématiques byzantines et arabes, ce
Pisan écrit son ouvrage principal, le Liber Abaci, traitant d’arithmétique et
d’algèbre.
fine (P-partition) (119). Notion due à Kurzweil (1957) et Henstock (1960).
La terminologie est due à McShane (1973).
fini (ensemble, ensemble localement) (10, 113).
Fischer-Riesz (théorème de) (694, 695). Dû, indépendamment, à Fischer
(1907) et F. Riesz (1907, 1910).
Fischer, Ernst (1875-1954) (695). Mathématicien d’origine autrichienne. Un
des pionniers de l’analyse fonctionnelle.
flux (582, 583, 619).
fonction (7). Le mot fonction apparaı̂t chez Leibniz (1692). Le concept général
s’est progressivement développé, grâce surtout à Jean Bernoulli (1698),
Euler (1748) (qui introduit la notation f(x)), Condorcet (1778), Lacroix
(1797), Fourier (1821), Lobatchevsky (1834) et Dirichlet (1837).
fonction composée (7).
fonction définie par une intégrale (528). Leurs propriétés ont été étudiées par
Lebesgue (1909) et Tonelli (1910)
fonction réciproque (8).
fonctionnel (graphe) (7). La définition d’une fonction en terme de graphe ou
relation est due à Peano (1911).
fonctions implicites (théorème des) (178, 181). Le mathématicien liégeois
Sluse (1672) donna le premier la formule de la dérivée d’une fonction im-
plicite lorsque la relation qui la définit est polynômiale. Pour une relation
de classe C 1 , l’existence locale de la fonction implicite fut démontrée par
Cauchy (1839). Les conditions d’existence dans les cas plus généraux furent
précisées par Genocchi (1884) et Jordan (1893). La démonstration donnée
ici est due à Goursat (1903).
768 CHAPITRE 18. INDEX HISTORIQUE

Fontenelle, Bernard le Bouvier de (1657-1757) (37). Homme de sciences et


philosophe français, surtout connu par ses Eloges académiques.

forme différentielle (595). Notion introduite par Poincaré (1887, 1892, 1895)
dans ses recherches sur les fonctions de deux variables complexes, les invari-
ants intégraux et la topologie algébrique, comme expression figurant sous le
signe intégrale, et, plus formellement, par Elie Cartan (1899) qui observe
que la structure algébrique sous-jacente à ces expressions est celle de l’algèbre
extérieure de Grassmann (1844, 1861). D’où le nom de formes différentielles
extérieures qu’il leur donne (1922). La définition actuelle semble publiée pour
la première fois chez Chevalley (1946).

forme extérieure (587). Notion introduite par Grassmann (1844, 1861). Elle
équivaut à celle de tenseur antisymétrique.

forme extérieure élémentaire (586), fondamentale (587).

forme normale (d’un système différentiel) (310, 313).

fort (extrémant local) (731). Notion introduite par Weierstrass (1879). La


terminologie et due à Kneser (1900).

fortement dérivable (fonction) (161). Notions introduite pour une variable


par Peano (1892) et pour plusieurs variables par Leach (1961).

fortement monotone (application) (739).

Fourier (coefficients de) (520). Des cas particuliers des formules donnant ces
coefficients sont obtenus par d’Alembert (1749), Clairaut (1757), Euler
(1748), Gauss (1810). Le cas général est obtenu par Fourier (1807, 1811).

Fourier (série de) (520). Le problème de la représentation d’une fonction par


une série trigonométrique fut posé par Euler (1730) et traité systémati-
quement, pour la première fois, par Fourier (1807). Ce problème et les
difficultés qu’il souleva sont à la base de théories mathématiques fondamen-
tales (intégrales de Riemann et de Lebesgue, théorie des ensembles, analyse
fonctionnelle). Sa généralisation constitue l’analyse harmonique qui étend
les notions de séries et d’intégrales de Fourier à des groupes commutatifs
localement compacts.

Fourier (transformée de) (527). Introduite par Fourier (1822) et développée


par Cauchy (1827). Elle joue un grand rôle dans l’étude des équations aux
dérivées partielles et dans la théorie du signal.

Fourier, Jean-Baptiste-Joseph (1768-1830) (35, 520, 527). Mathématicien


et physicien mathématicien français. Après des travaux sur les équations
algébriques, il prit part, avec Napoléon, à la campagne d’Egypte, où il fut
769

secrétaire perpétuel de l’Institut d’Egypte. Persuadé que la chaleur du désert


était idéale pour la santé, il vécut en permanence, après son retour en France,
dans une atmosphère surchauffée. Faut-il s’étonner qu’il se consacra alors à
la théorie mathématique de la chaleur. Sa Théorie analytique de la chaleur
est un classique de la physique mathématique.

fractal (ensemble) (453). Terminologie inventée par B. Mandelbrot pour dé-


signer les ensembles de dimension de Hausdorff non entière.

Fraenkel, Abraham (1891-1965) (2). Mathématicien allemand. L’un des au-


teurs d’une axiomatique de la théorie des ensembles.

Fréchet-Young (théorème de) (105). Obtenu indépendamment par Fréchet


(1919) et Grace C. Young. La partie nécessaire était connue de Cauchy.

Fréchet, Maurice (1878-1973) (105, 526). Mathématicien français. L’un des


fondateurs de l’analyse fonctionnelle et de la théorie des espaces abstraits.

Fresnel (intégrales de) (414). Etudiées en 1743 et 1781 par Euler et utilisées
par Fresnel (1818) dans ses études sur la diffraction de la lumière.

Fresnel, Augustin (1788-1827) (414). Physicien mathématicien français qui a


développé la théorie ondulatoire de la lumière.

Frobenius, Georg (1849-1917) (27). Mathématicien allemand, spécialiste de la


théorie des groupes et de leurs représentations.

frontière (32, 685). Notion introduite par Weierstrass (1861), Dedekind


(1871), Peano (1887) et Jordan (1893).

Fubini (théorème de) (535, 543, 544). Des premiers résultats de ce type sont
dus à Euler (1770), Cauchy (1827), Thomae (1878), Du Bois-Reymond
(1883) et Arzela (1891). Jordan (1892) en donne la formulation définitive
pour l’intégrale de Riemann. Le cas des intégrales de Riemann généralisées est
traité par de La Vallée Poussin (1892, 1899) et Hobson (1906). En 1902,
Lebesgue obtient un théorème de ce type pour son intégrale. B. Levi (1906)
énonce un résultat meilleur qui est, indépendamment, énoncé et démontré
(quoique non correctement) par Fubini (1907). de La Vallée Poussin
(1910) montre que, pour les fonctions bornées, le résultat de Fubini peut se
déduire de celui de Lebesgue, ce qui fournit une démonstration correcte. Pour
les fonctions intégrables, le résultat donné ici et sa démonstration sont dus à
Kurzweil (1973).

Fubini, Guido (1879-1943) (535, 543, 544). Mathématicien italien, qui


émigra aux USA en 1939. Outre ses contributions au calcul intégral, on
lui doit d’importants résultats en géométrie différentielle et en théorie des
fonctions automorphes.
770 CHAPITRE 18. INDEX HISTORIQUE

Gauss (formule de) (390).

Gauss-Ostrogradsky (formule de) (619). Etablie dans un cas particulier par


Gauss (1813) et dans le cas général par Ostrogradsky (1828, 1834).

Gauss, Carl-Friedrich (1777-1855) (38, 78, 390, 439, 461, 619, 672). Ma-
thématicien, physicien et astronome allemand, l’un des géants de l’histoire
des mathématiques. Ses contributions vont de la théorie des nombres au
télégraphe électrique, en passant par l’algèbre, l’analyse, la géométrie, la
statistique, l’optique, l’électromagnétisme, la géodésie et la mécanique céleste.
Son journal scientifique couvrant la période de 1796 à 1814 montre qu’il fut
loin de publier l’entièreté de ses découvertes.

générique (propriété) (708). L’étude des propriétés génériques a pris, ces derni-
ères années, un grande importance, en particulier dans la théorie des systèmes
dynamiques.

géodésiques (problème des) (728). Le problème des géodésiques sur une sur-
face fut posé par Jacques Bernoulli (1697), à qui l’on doit la terminologie.

géométrique (série) (250). De telles séries, en langage géométrique, apparais-


sent déjà chez Archimède dans son calcul de l’aire de la parabole. Leur
somme est déterminée par Viète (1593), le mathématicien brugeois de
Saint-Vincent (1622) et le mathématicien anversois Tacquet (1656).

globale (propriété) (113). Le passage d’une propriété locale à une propriété


globale, et l’étude des obstructions correspondantes, est à la base de pro-
fondes théories mathématiques, comme, par exemple, la théorie des faisceaux
de Leray (1950).

Goursat, Edouard (1858-1936) (174, 198, 642). On doit à ce mathématicien


français un Cours d’analyse mathématique très populaire pendant plus d’un
demi-siècle.

gradient (94, 596). Notion introduite par Hamilton (1847). Le nom est dû à
Riemann (1851).

graphe, graphe réciproque (5).

Green (formule de) (636). Etablie par Green (1828) dans un ouvrage publié à
compte d’auteur, elle est fondamentale en théorie du potentiel.

Green-Riemann (formule de) (617). Etablie par Lagrange (1760), Euler


(1771-72), Gauss (1813) et Green (1828), elle fut mise par Riemann (1851)
à la base de sa théorie des fonctions complexes.
771

Green, George (1793-1841) (617, 636). Cet anglais autodidacte (il était meu-
nier) a apporté des contributions fondamentales à la théorie mathématique
de l’électromagnétisme.

Gronwall (lemme de) (342). Isolé comme résultat indépendant par Bellman
(1943), il remonte à Peano (1892) et Gronwall (1918).

Gronwall, Thomas-Hakon (1877-1932) (342). Né en Suède, mort aux U.S.A.


Travaux en analyse classique, fonctions complexes et physique mathématique.

Hadamard, Jacques (1865-1963) (436, 440, 568). Mathématicien français à


qui l’on doit la démonstration du théorème des nombres premiers et des con-
tributions importantes à la théorie des fonctions, des équations différentielles
(en particulier à la théorie du chaos), des équations aux dérivées partielles
(problèmes bien posés, solutions fondamentales) et à la naissance de l’analyse
fonctionnelle. Son Cours d’analyse a un contenu très riche.

Hake (théorème de) (396, 399, 405, 493). Enoncé et démontré par Hake
(1921) à partir de la définition de Perron, il constitue un pas décisif dans
la démonstration de l’équivalence entre la définition de Denjoy et celle de
Perron. Ce théorème n’est pas valable pour l’intégrale de Riemann ou de
Lebesgue et, depuis Cauchy (1823), la limite apparaissant dans le théorème
est prise comme définition de l’intégrale généralisée, impropre ou fléchée, qui,
au sens de Denjoy-Perron, sont de vraies intégrales.

Hake, Heinrich (396, 399, 405, 493). Mathématicien allemand, élève de Hahn.

Hamilton (équations de) (738). Introduites, à des degrés de généralité divers,


par Poisson (1809), Lagrange (1809), Pfaff (1814-15), Cauchy (1819)
et Hamilton (1835).

Hamilton (principe de) (737). Introduit par Hamilton (1834, 1835), il con-
stitue l’une des formes du principe de moindre action en mécanique.

Hamilton, William (1788-1856) (737, 738). Mathématicien irlandais. Enfant


prodige, il est l’auteur d’une importante généralisation des nombres complexes
(les quaternions) et il grava, lors de leur découverte, les formules fondamen-
tales i2 = j 2 = k 2 = ijk = −1 sur le parapet du Brougham Bridge de
Dublin. Ses contributions essentielles à la mécanique analytique et à l’optique
mathématique seront cruciales pour la genèse de la mécanique ondulatoire.
Il eut un goût prononcé pour la versification et pour l’alcool.

Hankel, Hermann (1839-1873) (36). Mathématicien et historien des mathé-


matiques allemand. A côté de travaux sur les fondements de l’analyse, il
a introduit une classe de fonctions spéciales qui portent son nom.
772 CHAPITRE 18. INDEX HISTORIQUE

Hardy, Godefrey Harold (1877-1947) (453). Mathématicien anglais, passi-


onné de cricket. On lui doit une série d’ouvrages remarquables (en particulier
un Course in pure mathematics) et la “découverte” du mathématicien indien
Ramanujan.
harmonique (série) (252, 419, 432). Sa divergence fut démontrée par Oresme
(1350) et puis par Mengoli (1650). Jacques Bernoulli (1689) en donna
deux démonstrations, dont l’une attribuée à son frère Jean.
harmonique alternée (série) (253). Elle fut étudiée pour la première fois par
Mengoli (1648) qui en calcula la somme.
Hausdorff, Felix (1868-1942) (453). Mathématicien allemand. L’un des fon-
dateurs de la topologie générale qui étend l’étude des applications continues
à des espaces plus généraux que les espaces métriques. On lui doit aussi une
notion de mesure et de dimension qui joue un grand rôle dans l’étude des en-
sembles fractals. A publié, dans sa jeunesse, des poèmes sous le pseudonyme
de Paul Mongré. Il se suicida pour échapper aux Nazis.
Heine (théorème de) (133, 726). Enoncé et démontré, pour un intervalle de
R, par Dirichlet (1854) et Heine (1872), il fut étendu aux fonctions d’un
compact de Rn dans R par Lüroth (1873).
Heine, Heinrich (1821-1881) (133, 162, 726). Mathématicien allemand, au-
teur d’un important traité sur les fonctions sphériques.
Henstock, Ralph (né en 1923) (349, 356, 379). Mathématicien britannique,
spécialiste de la théorie de l’intégration et de l’analyse fonctionnelle.
Hermite (équation différentielle et polynôme d’) (458, 459). Introduits
par Hermite (1864).
Hermite, Charles (1822-1901) (217, 286, 458, 459, 482). Mathématicien
français, beau-frère de Bertrand et beau-père de Picard. On lui doit des
contributions importantes en théorie des fonctions elliptiques, en théorie ana-
lytique des nombres et en algèbre. Il prouva en particulier la transcendance
de e et la possibilité de résoudre l’équation algébrique du cinquième degré
par les fonctions elliptiques.
Héron (algorithme de) (231). Dû à Héron d’Alexandrie (vers 75).

Héron d’Alexandrie (231). Mathématicien et mécanicien grec de l’Antiquité,


dont on sait seulement qu’il a vécu dans la période allant de 150 ans av. J.C.
à l’an 250 de notre ère ! On lui doit la formule de l’aire d’un triangle en
fonction de la longueur des côtés et du demi-périmètre.
Hessenberg, Gerhard (1874-1925) (34). Mathématicien allemand, spécialiste
des fondements de la géométrie.
773

Hilbert (espace de) (692). Après l’introduction des exemples “concrets” l2


(Hilbert (1906)) et L2 (Fischer, F. Riesz (1907)), les espaces de Hilbert
généraux furent définis par von Neumann (1929).

Hilbert, David (1862-1943) (692). Mathématicien allemand, défenseur de la


méthode axiomatique en mathématique, il a contribué de manière es-
sentielle à presque toutes les branches des mathématiques. Il dirigea à
Göttingen une brillante école mathématique. Les vingt-trois problèmes de
mathématiques qu’il énonça à Paris en 1900 lors du 2e Congrès international
des mathématiciens ne sont pas tous résolus à ce jour.

Hodge, William V.D. (1903-1975) (592). Mathématicien écossais. Créa la


théorie des formes harmoniques, qu’il appliqua avec bonheur à la géométrie
algébrique. Son ouvrage The theory and applications of harmonic integrals
est l’un des classiques de ce siècle.

holomorphe (fonction) (646). Elles furent définies par Cauchy (1851) qui les
appela synectiques. La terminologie actuelle est due à Briot et Bouquet
(1875). Goursat (1900) a démontré que toute fonction complexe C-dérivable
sur un ouvert y est holomorphe. La théorie des fonctions holomorphes de
plusieurs variables complexes est loin d’être une extension facile du cas d’une
variable. Elle requiert l’emploi de techniques délicates d’algèbre, de topologie,
d’analyse et de géométrie algébrique. En particulier, elle fait un usage abon-
dant de la théorie des formes différentielles. Elle a d’importantes applications
à la théorie quantique des champs.

homogène (équation différentielle linéaire) (288). Lagrange (1765) mon-


tra que la solution peut s’écrire comme combinaison linéaire d’un nombre
fini de solutions particulières.

homogène (fonction) (108).

homotopes (cycles) (622). Notion introduite par Jordan (1866) et développée


par Poincaré (1895). Le concept d’homotopie remonte certainement à la no-
tion de “déformation de courbes” dans le calcul des variations de Lagrange
et sera utilisé intuitivement durant tout le XIXe siècle. C’est Brouwer
(1911) qui donnera la première définition générale et précise d’homotopie en-
tre deux applications continues f : X → Y, g : X → Y, comme application
continue F : X × [0, 1] → Y telle que F (., 0) = f et F (., 1) = g. La théorie de
l’homotopie est une partie importante de la topologie algébrique.

hyperboliques (fonctions) (314). Introduites par Riccati (1757). Les abré-


viations sh, ch, th (ou sinh, cosh, tgh) sont dues à Lambert (1761). Les
premières tables de ces fonctions furent dressées par Ligovsky (1890). Le
graphe de ch x s’appelle la chaı̂nette (Huygens (1646), Leibniz (1691)), à qui
l’on doit le terme. Cette courbe fut étudiée par Jacques et Jean Bernoulli.
774 CHAPITRE 18. INDEX HISTORIQUE

hyperelliptiques (intégrales) (338). Abordé par Abel, le problème de leur in-


version fut considéré par Jacobi (1832-1835).

hypergéométrique (équation) (461). On la trouve chez Euler (1778) et elle


est étudiée en détail par Gauss (1813).

hypergéométrique (série) (456, 461), (fonction) (456). Le mot “hypergéo-


métrique” apparaı̂t chez Wallis (1655) pour désigner une classe de séries
non géométriques. La série hypergéométrique elle-même fut mentionnée pour
la première fois par Euler (1778). Sa convergence ne fut étudiée qu’en 1812
par Gauss dans le cas d’une variable réelle et par Weierstrass (1842-43)
dans le cas d’une variable complexe. C’est Riemann (1856) qui commença
l’étude globale de la fonction hypergéométrique.

hypergeométrique confluente (fonction) (460). Introduite et étudiée par


Kummer (1836).

hypothèse du continu (17). Formulée par Cantor (1884). On sait depuis Co-
hen (1962) qu’elle est indédicable dans ZFC.

image et image réciproque (d’un graphe ou d’une fonction) (5, 6, 7).


Notions dues à Dedekind (1888).

implicite (fonction) (177).

indéfinie (intégrale) (371, 372). Les résultats donnés sont dus, lorsque f est
continue, à Cauchy (1823) qui, le premier, démontra l’existence de la prim-
itive d’une fonction continue. La notion même d’intégrale indéfinie remonte
à Newton (1669) et Leibniz (1675).

indivergentiel ou solénoı̈dal (champ) (626).

induction (3). Le plus ancien emploi de l’induction mathématique semble dû à


Maurolycus dans son étude des nombres polygonaux (1575). Pascal con-
naissait ce travail et utilisa la méthode d’induction dans son étude des co-
efficients du binôme vers 1657. Le terme d’induction mathématique distinct
de l’induction scientifique est dû à De Morgan (1838). Poincaré a beau-
coup insisté sur le rôle de l’induction mathématique dans ses écrits sur la
philosophie de la science publiés au début du siècle.

induite (distance, norme) (677, 678).

infimum (d’un ensemble) (203). Notion introduite par Gauss (1800).

infimum (d’une application) (207, 208).

infimum (théorème de l’) (203).


775

infini (ensemble) (2, 10). C’est Bolzano (1851) qui attira l’attention sur la
propriété d’un ensemble infini d’être équipotent à l’une de ses parties pro-
pres. Cantor (1878) refit la même observation et Dedekind (1888) l’utilisa
comme définition d’un ensemble infini.

infinie (limite) (66,165). Le symbole ∞ est dû à Wallis (1655). La définition


est due à Cauchy (1821).

inflexion (point d’) (145).

injectif (graphe), injection (8, 221). Notion due à Dedekind (1888).

intégrable (ensemble) (487, 511). Voir “mesurable (ensemble)”.

intégrale au sens de Denjoy-Perron ou intégrale (349, 350, 400,H 401). Le


mot intégrale apparaı̂t chez Jacques Bernoulli (1690), le signe apparaı̂t
Hb
chez Leibniz (1675) et la notation a f(x) dx chez Fourier (1822). Denjoy
(1912) a introduit son intégrale à partir de celle de Lebesgue par un délicat
procédé de passage à la limite. Perron (1914) a introduit son intégrale
par une méthode basée sur le concept de fonction majorante et de fonction
minorante introduites par de La Vallée-Poussin (1909) dans le cadre de
la théorie de Lebesgue, et qui généralisent la notion de primitive. Il fau-
dra attendre les travaux de Hake (1921), Alexandrov (1924) et Looman
(1925) pour montrer l’équivalence des intégrales de Denjoy et de Perron. La
définition adoptée ici est due à Kurzweil (1957), qui montra son équivalence
avec l’intégrale de Perron, et, indépendamment, à Henstock (1961, 1963),
qui l’étendit aux fonctions de plusieurs variables.

intégrale au sens de Lebesgue ou L-intégrale (385). Lebesgue (1902) a in-


troduit ce type de fonctions intégrables (qu’il appelle sommables) par une
méthode différente de celle adoptée ici, basée sur une définition préalable de
la mesure des ensembles de R et sur une partition de l’ensemble des ordonnées
de la fonction intégrée. D’autres approches furent proposées indépendamment
(Vitali (1904), W.H. Young (1904)) et par la suite (W.H. Young (1910,
1912), F. Riesz (1912), Pierpont (1912), Radon (1913), Daniell (1919),
Denjoy (1919), etc.). de La Vallée Poussin l’introduit en 1909 dans son
cours d’analyse de l’Université de Louvain. Lebesgue (1909) observa qu’une
fonction L-intégrable pouvait s’obtenir comme limite d’une certaine suite de
sommes de Riemann, mais n’étudia pas le problème inverse. La définition
donnée ici est due à Henstock (1963) qui prouva son équivalence avec celle
de Lebesgue.

intégrale au sens de Perron-Stieltjes (388). Introduite, dans un cas particu-


lier, par Stieltjes (1894). Le cas général fut considéré par Jeffery (1932),
Ridder (1935) et Ward (1936) en utilisant l’approche de Perron, et, par
la méthode utilisée ici, par Kurzweil (1957).
776 CHAPITRE 18. INDEX HISTORIQUE

intégrale au sens de Riemann ou R-intégrale (352). Riemann (1854) in-


troduit essentiellement la définition donnée ici, en s’inspirant de la tenta-
tive de Cauchy (1823) pour donner un fondement rigoureux à la notion
d’intégrale d’une fonction continue. C’est Darboux (1875) qui donnera
la première démonstration vraiment complète de la R-intégrabilité de ces
fonctions. Cauchy aurait été précédé par Gregory, qui aurait donné
une démonstration équivalant à la R-intégrabilité d’une fonction monotone.
L’extension aux fonctions de deux variables est due à Thomae (1876).

intégrale au sens de Riemann-Stieltjes (389). Considérée pour la première


fois par Stieltjes (1894) dans le cas particulier où n = 1, f est continue
et la mesure s’obtient par différence des valeurs d’une fonction croissante aux
extrémités de l’intervalle.

intégrale d’une fonction définie p.p. (505).

intégrale d’une forme sur un simplexe (606) ou une chaı̂ne (609). On la


trouve chez Poincaré (1887, 1895, 1899).

intégrale généralisée ou impropre (396). Introduites par Cauchy (1823).

intégrale paramétrique (528). Voir “Fonction définie par une intégrale”.

intégrale première (377, 736).

intégrale sur un arc de courbe (571, 644).

intégrale sur un borné (486).

intégrale sur un élément de surface (576).

intégrale sur un intervalle (399, 400, 401, 405, 411, 412, 415).

intégrale sur un ensemble non borné (508).

intérieur (27, 129, 685). Notion introduite par Peano (1887) et Jordan (1893)
dans Rn et par Hausdorff (1914) en général.

intérieure (théorème de l’application) (188). Ce théorème entraı̂ne que l’i-


mage d’un ouvert de Rn par une application de Rn dans Rn classe C 1 dont la
dérivée totale est partout inversible est un ouvert. Brouwer (1911) a étendu
ce résultat aux applications continues injectives et en a déduit l’invariance
topologique de la dimension.

intervalle (14, 126, 127, 205).

intervalles fermés emboı̂tés (théorème des) (14). L’argument apparaı̂t déjà


chez Bolzano (1817).
777

interversion des dérivées partielles (théorème d’) (276). D’abord “démon-


trée” par Nicolas II Bernoulli (1721) et envisagée comme évidente par Nico-
las Bernoulli (1743). Pour Euler (1734) et Cauchy (1829), elle résulte
∆( ∆u ) 2 ∆( ∆u )
de la symétrie en ∆x et ∆y de l’expression ∆x ∆y
= ∆x∆y
∆ u
= ∆y ∆x
. C’est
probablement Blanchet (1841) qui, le premier, s’est rendu compte de la
difficulté, suivi par L. Lindelöf (1867) et Genocchi (1869). Sous la forme
donnée ici, le résultat et dû à Weierstrass (1861).

irrationnel (nombre) (217). L’irrationnalité de 2 fut découverte par Pytha-
gore vers 500 avant J.C.

irrotationnel (champ) (626).

isolé (point) (70, 688).

itération (172). La possibilité de calculer par itération une racine d’une équation
fut vraisemblablement aperçue et utilisée par les Arabes aux alentours de
l’an 900, à l’occasion de la résolution de l’équation du troisième degré qui a
pour racine sin 1◦ . On cite à ce sujet Kusta Ibn Luka. Vers l’an 1000, la
méthode par itération fut employée par Al Biruni pour résoudre l’équation
de la trisection de l’angle, qui est du troisième degré. Fibonacci appprit
cette méthode des Arabes et sut en 1225, dans un tournoi mathématique,
déterminer avec 9 décimales exactes la racine de l’équation x3 +2x2 +10x = 20.
En 1303, le chinois Chu Chi Ki résolut l’équation x3 + x = 1 par itération.
Les méthodes utilisées par Viète (1600) et Newton (1685) sont des mé-
thodes d’itération. Fourier (1822) utilise l’itération pour étudier l’équation
x = λ tg x.

Jacobi (identité de) (283). Analogue à l’identité de Jacobi (1842) en mécani-


que.

Jacobi, Carl Gustav (1804-1851) (100, 283). Mathématicien allemand, l’un


des créateurs de la théorie des fonctions elliptiques, qu’il appliqua à la théorie
des nombres. Il était également philologue et habile musicien. Son frère est
l’inventeur de la galvanoplastie.

jacobien (déterminant), jacobienne (matrice) (100). Introduits par Jacobi


(1833) dans ses études sur la formule de changement de variables dans une
intégrale multiple. Le mot jacobien est dû à Sylvester.

jauge (114, 717). Terminologie due à McShane (1973).

Jensen, Johann L.W.V. (1859-1925) (232). Mathématicien danois autodi-


dacte, spécialiste des fonctions holomorphes et des fonctions convexes.
778 CHAPITRE 18. INDEX HISTORIQUE

Kepler (équation de) (176). Sa résolution numérique fut déjà considérée au X e


siècle par al-Khwarizmi. Etudiée par Lagrange (1771), Carlini (1817)
et Bessel.

Kepler, Johannes (1571-1630) (143, 176). Astronome et mathématicien alle-


mand. A côté de ses découvertes des lois du mouvement des planètes, on
lui doit des contributions mathématiques à la détermination des volumes de
solides curvilignes (à l’occasion du problème de jaugeage des tonneaux de
vin) et à la théorie des logarithmes.

Kolmogorov, Andrej N. (1903-1987) (520). Mathématicien russe. Il a con-


tribué à de nombreux aspects des mathématiques; en particulier, il a créé
la théorie axiomatique du calcul des probabilités et développé une méthode
nouvelle d’étude de la stabilité des mouvements de systèmes hamiltoniens.

Kummer (critère de convergence de) (434). Dû à Kummer (1835).

Kummer, Ernst Eduard (1810-1893) (434, 460). Mathématicien allemand.


A démontré la conjecture de Fermat pour une grande classe d’exposants et,
ce faisant, créé la théorie des idéaux. Il s’occupa aussi de la théorie de la
réfraction et de balistique.

Kurzweil, Jaroslav (né en 1926) (349, 356, 567).


Mathématicien tchèque, spécialiste de la théorie des équations différentielles
ordinaires qui l’ont conduit à sa définition de l’intégrale de Perron par les
sommes de Riemann.

Lacroix, Sylvestre (1765-1843) (35). Mathématicien français, surtout connu


pour ses ouvrages didactiques de mathématiques et en particulier par son
influent Traité du calcul différentiel et du calcul intégral en trois volumes.

Lagrange (équations de) (737). Dues à Lagrange, qui les mit à la base de sa
Mécanique analytique (1788).

Lagrange (fonction et multiplicateurs de) (191, 193). Introduits par Eu-


ler (1744) et développés par Lagrange (1797).

Lagrange (identité de) (21, 565).

Lagrange (reste du développement de Taylor de) (244). On le trouve chez


Lagrange (1797) avec la formule intégrale de ce reste.

Lagrange (théorème de la moyenne de) (151). On le trouve chez Lagran-


ge (1772) et, sous sa forme actuelle, chez Cauchy (1821). Première
démonstration rigoureuse par Schwarz (1870), probablement inspirée par
le cours de Weierstrass (1861) et reprise par Dini (1878).
779

Lagrange, Joseph Louis (1736-1813) (21, 34, 79, 151, 191, 193, 244, 285,
565, 734, 735, 737). Mathématicien français d’origine italienne. Célèbre
pour son approche analytique du calcul des variations et sa Mécanique ana-
lytique, que Hamilton qualifiera de poème scientifique, il a contribué à la
théorie des nombres, l’algèbre, l’analyse et à la mécanique céleste. Pendant
la révolution française, il contribua au perfectionnement du système métrique
des poids et mesures et fut le premier professeur de mathématiques à l’Ecole
polytechnique.

lagrangien (737). Lagrange (1773).

Lambert, Johann H. (1728-1777) (217). Mathématicien et astronome alle-


mand. Il a prouvé l’irrationnalité de e et de π et a créé la photométrie.

Landau, Edmund (1877-1938) (164). Mathématicien allemand, spécialiste en


théorie analytique des nombres et en théorie des fonctions d’une variable
complexe.

Laplace (équation de) (284, 563). Elle apparaı̂t pour la première fois chez Eu-
ler (1752) dans ses travaux d’hydrodynamique. On la retrouve chez La-
grange (1762), chez Laplace en coordonnées polaires (1785) et puis en
coordonnées cartésiennes (1789).

Laplace (transformée de) (528). Déjà utilisée par Euler (1737), pour trouver
les solutions d’équations différentielles, et systématisée par Laplace (1812).

Laplace, Pierre Simon de (1749-1827) (283, 284, 319, 528, 563, 600,
636). Mathématicien et astronome français, auteur de l’immortel Traité
de Mécanique céleste et de travaux de calcul des probabilités. Membre
de l’Académie royale sous Louis XVI, professeur à l’Ecole Normale sous la
république, ministre de l’intérieur et comte sous Napoléon, il sera marquis et
Pair de France sous Louis XVIII.

laplacien (284, 600, 636). Il se rencontre déjà chez Euler (1752) mais a été
systématiquement étudié par Laplace. Le nom est dû à Maxwell (1873)
et la notation ∆ à Murphy (1833).

Laurent (développement et théorème de) (659, 662, 663). Dû à Laurent,


présenté à l’académie par Cauchy en 1843, et publié de manière posthume
en 1863. Connu de Weierstrass (1841) mais non publié.

Laurent, Pierre Alphonse (1813-1854) (659, 662, 663). Officier français. Il


a contribué à la théorie des fonctions d’une variable complexe et au calcul
des variations, mais aussi à la construction du port du Havre.

Lebesgue (théorèmes de convergence de) (474, 477, 479, 505, 511).


780 CHAPITRE 18. INDEX HISTORIQUE

Lebesgue, Henri (1875-1941) (232, 385, 393, 451, 474, 477, 479, 482, 505,
511, 525, 566, 717). Mathématicien français. Outre l’intégrale qui porte
son nom, Lebesgue a contribué au calcul des variations et à la théorie des
séries de Fourier.

Legendre (transformée de) (634). Introduite par Legendre (1787). Généra-


lisée aux fonctions convexes par Fenchel (1949), elle joue un grand rôle en
analyse convexe moderne.

Legendre, Adrien-Marie (1752-1833) (634). Mathématicien français. Spéci-


aliste de la théorie des nombres, de la théorie des intégrales elliptiques et de
la théorie du potentiel. Auteur d’Eléments de géométrie très populaires.

Leibniz (formule de) (234). Donnée par Leibniz (1678).

Leibniz (règle de) (531). Enoncée formellement par Leibniz (1697). Sa jus-
tification fera l’objet de nombreux travaux dans les différentes théories de
l’intégration.

Leibniz, Gottfried Wilhelm (1646-1716) (37, 38, 234, 341, 344, 531). Ma-
thématicien, philosophe, historien, théologien, juriste et diplomate allemand.
Il rêva d’une caractéristique universelle et d’une fusion des églises protestantes
et catholique. Un des créateurs du calcul différentiel et intégral. La querelle
de priorité correspondante avec Newton est célèbre.

Leray, Jean (1906-1998) (320). Mathématicien français. Auteur de travaux


fondamentaux en analyse non linéaire, hydrodynamique, équations aux
dérivées partielles, topologie algébrique, fonctions de plusieurs variables com-
plexes.

Levi (théorème de convergence monotone de) (466, 470, 471, 508, 510).
Enoncé et démontré, pour l’intégrale de Lebesgue, par B. Levi (1906). La
démonstration donnée ici, valable pour l’intégrale de Denjoy-Perron, est due
à Henstock (1968).

Levi, Beppo (1875-1961) (466, 470, 471, 508, 510). Mathématicien italien,
il émigra en Argentine. Il a contribué à l’analyse et à la géométrie algébrique.

L’Hospital (règle de) (147, 149). Publiée en 1696 par L’Hospital qui l’avait
apprise de son précepteur Jean Bernoulli, tenu, par un contrat annuel de
300 livres, de lui réserver la primeur de ses découvertes scientifiques.

L’Hospital, Guillaume de (1661-1704) (147, 149, 164). Mathématicien


français, auteur du premier traité de calcul différentiel, l’Analyse des infini-
ment petits pour l’intelligence des lignes courbes (1696).
781

L’Huillier, Simon (1750-1840) (77). Mathématicien français qui a contribué


aux fondements de l’analyse.

libre (extrémant local) (142, 280, 729). Des problèmes géométriques d’extre-
mum sont étudiés par les Grecs dans l’Antiquité. Une définition claire
d’extrémant apparaı̂t chez Cauchy (1821). Les conditions suffisantes
d’existence d’un minimum ou d’un maximum pour une fonction de plusieurs
variables sont dues à Lagrange (1759). La démonstration rigoureuse est
due à Peano (1884).

Lie (dérivée de) (108, 633).

Lie, Sophus (1842-1899) (108, 633). Mathématicien norvégien. Créateur de


la théorie des groupes continus. La théorie des groupes de Lie constitue une
partie importante des mathématiques contemporaines.

lié (extrémant local) (143, 189).

limite (42, 43, 65, 69, 686, 689). Il en est question, plus ou moins clairement,
dans les travaux de Stevin (1586), Valerio (1604), Kepler (1615), Snel-
lius (1624), Cavalieri (1635), Fermat (1643), de Saint-Vincent (1647),
Tacquet (1656), Wallis (1656), Gregory (1667), Leibniz (1664), New-
ton (1687), d’Alembert (1765), L’Huilier (1786). Cauchy (1821) précise
le concept et le met à la base du calcul différentiel et intégral. La formula-
tion donnée ici est due dans Rn à Weierstrass (1861) et, dans un espace
métrique, à Fréchet (1906). L’abréviation lim fut utilisée pour la première
fois par L’Huilier (1786) et la mention x → a en dessous par Riemann
(1856) et Leathem (1905). On peut généraliser comme suite la notion de
limite à un ensemble quelconque. Soit E un ensemble quelconque. Une
partie D de l’ensemble P(E) s’appelle une direction si elle ne contient pas
l’ensemble
7 vide, si, pour tout A ∈ D et tout B ∈ D, on a A ⊂ B ou B ⊂ A et
si S∈D S = ∅. Soit f une application de E dans un espace métrique (M, d).
On dit que b ∈ M est limite des valeurs de f suivant la direction D si, pour
tout ! > 0, il existe A ∈ D tel que, pour tout x ∈ A on a d(f(x), b) ≤ !. Cette
notion, introduite par Chatounovski (1923) et Moore et Smith (1923),
est un cas particulier de la notion de filtre due à H. Cartan (1937). Un
filtre F sur E est une partie de P(E) ne contenant pas la partie vide, telle
que toute partie de E contenant un élément de F appartient à F et toute
intersection d’un nombre fini d’éléments de F appartient à F . Le lecteur
pourra déterminer les directions qui correspondent aux différentes définitions
de limite et d’intégrale données dans ce cours.

limite à droite, à gauche (61). Les notations f(a + 0) = limx→a+ f(x) et f(a −
0) = limx→a− f(x) sont dues à Dirichlet (1837).

limite à l’infini (62).


782 CHAPITRE 18. INDEX HISTORIQUE

limite inférieure, supérieure (231). On trouve ces notions chez Gauss (1800)
et Abel (non publiées) et chez Cauchy (1821). La notation est due à Pasch
(1887).

Lindemann, Ferdinand (1852-1939) (218). Mathématicien allemand. Il a dé-


montré la transcendance de π. Par contre, ses tentatives pour démontrer la
conjecture de Fermat ont échoué.

linéaire (application) (72).

Liouville (théorème de) (655). Il est dû en fait à Cauchy (1844) qui l’établit
au moyen de la théorie des résidus; la démonstration proposée est due à Jor-
dan (1893). Borchardt en entendit parler dans le cours de Liouville
(1847) et lui attribua. Liouville avait démontré un cas particulier inter-
venant dans la théorie des fonctions elliptiques.

Liouville, Joseph (1809-1882) (339, 655). Mathématicien français qui a con-


tribué à la théorie des nombres, la théorie des fonctions elliptiques et la
théorie des problèmes aux limites et des équations intégrales. Il a donné
les premiers exemples de nombres transcendants et créé le célèbre Journal de
Mathématiques Pures et Appliquées.

Lipschitz (condition de) (313). Introduite par Lipschitz (1864) dans l’étude
des séries de Fourier; il l’appliqua ensuite au problème de Cauchy (1868).

Lipschitz, Rudolf (1832-1903) (173, 313, 688, 739). Mathématicien alle-


mand, auteur de travaux d’analyse et de géométrie différentielle.

lipschitzienne (application) (173, 688, 739).

Lobatchevsky, Nikolai I. (1792-1856) (35). Mathématicien russe. L’un des


créateurs de la géométrie non-euclidienne. Il fut longtemps recteur de l’u-
niversité de Kazan.

local (extrémant) (142). Voir aussi “libre”, “lié.”

locale (propriété) (113, 119, 121, 132).

localement bornée (fonction) (49, 114).

logarithme (fonction) (225). Les logarithmes furent introduits, ainsi que les
premières tables correspondantes, par Neper (1617) et Bürgi (1620). La
fonction logarithme et sa représentation graphique furent connues avant celle
de l’exponentielle (Descartes (1639), Torricelli (1646)). Les travaux de
Wallis, Newton, Leibniz et Jean Bernoulli sur la fonction exponentielle
montrèrent que la fonction logarithme est sa réciproque. Jones (1742) en
donna une introduction systématique de cette manière, ce que fera aussi Eu-
ler (1748), à qui l’on doit également la formule log x = limn→∞ n(n1/n − 1).
783

Le développement en série potentielle de ln(1 + x) fut mentionné par de


Saint-Vincent (1647), Hudde (1656), Brouncker (1657), Mercator
(1668), Newton (1669) et Leibniz (1694). La dérivée de log x fut calculée
par Leibniz (1694).

logistique (courbe) (379). Etudiée par le mathématicien belge Verhulst


(1838).

longueur (d’un arc de courbe) (571). Du Bois-Reymond (1879) fut le pre-


mier à considérer le problème de l’existence de la longueur d’un arc de courbe,
et Jordan (1881, 1887) le résolut en introduisant la notion de fonction à
variation bornée. Pour le graphe d’une fonction continûment dérivable, la
formule était connue de Wallis (1658) et Van Heuraet (1659), et des cas
particuliers avaient été considérés auparavant par Neil, Fermat et Wren.

longueur (d’un ensemble linéaire) (487, 511).

longueur (d’un intervalle, d’un segment) (347, 569).

Lusin, Nikolai (1883-1950) (521, 674). Mathématicien russe, spécialiste de la


théorie des fonctions de variables réelles et créateur de l’Ecole de Moscou. On
lui doit le théorème, qui porte son nom, affirmant que si une fonction réelle
f est n-mesurable sur E ⊂ Rn , alors, pour tout ! > 0, il existe F ⊂ E tel que
µ(F ) ≤ ! et une fonction réelle g continue sur E telle que f = g sur E \ F.

Maclaurin (développement de) (238). Le cas particulier des fonctions algébri-


ques fut donné par Stirling (1717) qui l’étendit au cas général en 1730.
Maclaurin (1742) le mentionne comme cas particulier du résultat de Tay-
lor.
%
Maclaurin-Cauchy (test intégral de) (418). L’idée de comparer k∈N∗ f(k)
H∞
à 1 f apparaı̂t déjà dans certains cas particuliers chez Jacques Bernoulli.
Le test apparaı̂t chez Euler (1736), Maclaurin (1742) et il est précisé par
Cauchy (1827) et Raabe (1832).

Maclaurin, Colin (1698-1746) (238, 418). Mathématicien écossais. Enfant


prodige, il entra à onze ans à l’Université de Glasgow. Il a cherché à mettre
le calcul des fluxions de Newton sous forme géométrique.

maigre (ensemble) (707). Notion introduite par Baire (1899) sous le nom d’en-
semble de première catégorie.

majorant (199). Notion déjà claire chez Gauss (1800).

majorée (application, suite) (207, 464).


784 CHAPITRE 18. INDEX HISTORIQUE

Malthus, Thomas (1766-1834) (378). Démographe anglais. Sa théorie de la


lutte pour la vie inspira à Darwin sa théorie de l’évolution par sélection
naturelle.

Mandelbrot, Benoı̂t (né en 1924) (453). Mathématicien né à Varsovie. Il a


montré l’importance des ensembles fractals et leur a donné leur nom.

maximant, maximum (141, 142, 200, 207).

maximant local libre (245).

maximisante (suite) (209).

maximum (principe du) (670). Enoncé et démontré par Riemann (1851) pour
les fonctions harmoniques, il joue un grand rôle en analyse complexe et en
théorie des équations différentiel les.

Maxwell (équations de) (635). Introduites par Maxwell (1873) pour unifier
l’électricité et le magnétisme. Leur structure a inspiré d’importantes théories
récentes en mathématique et en physique théorique (théories de jauge).

Maxwell, James C. (1831-1879) (635). Mathématicien et physicien écossais.


Ses contributions à l’électromagnétisme et à la théorie cinétique des gaz sont
essentielles.

Mazurkiewicz, Stefan (1888-1945) (708). Mathématicien polonais, auteur de


remarquables travaux en topologie, en analyse réelle et en calcul des proba-
bilités.

McShane, Edward (1904-1989) (394). Mathématicien américain. Spécialiste


de la théorie de l’intégration et du calcul des variations.

Mercator (formule de) (390). Mercator (1651).

Mercator, Nicolas Kauffman, dit (1620-1687) (390). Mathématicien et as-


tronome allemand. Il vécut en Angleterre et en France, où il dessina les
fontaines de Versaille.

méromorphe (fonction) (667). Ces fonctions furent étudiées par Weierstrass


(1876). Le terme est dû à Briot et Bouquet (1859).

mesurable (ensemble) (512). Notion introduite dans R (par une définition dif-
férente) par Borel (1898).

mesurable (fonction) (514). Notion introduite par Lebesgue (1902).

mesurables (caractérisation des fonctions) (715).

mesure (convergence en) (521).


785

mesure d’un ensemble (487, 511). Après les travaux de Harnack (1881),
Hankel (1882), Du Bois-Reymond (1882), Stolz (1884), Cantor (1884),
Peano (1887) et Jordan (1892), le concept actuel apparut chez Borel
(1898) pour n = 1 et chez Lebesgue (1902) pour n quelconque, qui le mit
à la base de sa théorie de l’intégration. Différentes applications, et en par-
ticulier la théorie des probabilités, ont conduit à généraliser la notion de
mesure à des espaces abstraits. On appelle espace mesurable tout couple
(E, B) où E est un ensemble et B une tribu de parties de E, c’est-à-dire une
partie non vide de l’ensemble P(E) des parties de E telle que si A ∈ B,
alors !A ∈ B et si chaque élément de la suite (An )n∈N appartient à B, alors
!
n∈N An ∈ B. On appelle espace mesuré tout triplet (E, B, µ) où (E, B) est
un espace mesurable et µ une mesure positive sur B, c’est-à-dire une applica-
tion µ : B → [0, +∞[∪{+∞}, non identiquement égale à +∞ telle que, pour
%∞suite (An )n∈N !
toute dans B, dont les éléments sont deux à deux disjoints, on
a n=0 µ(An ) = µ( n∈N An ), et telle que E peut s’écrire comme la réunion
d’une suite (Bn )n∈N d’éléments de B tels que µ(Bn ) soit fini.

mesure (d’un pavé) (347).

métrique (structure) (676).

minimant, minimum (141, 142, 200, 207).

minimant local libre (245).

minimisante (suite) (209).

minorant (199).

minorée (application, suite) (207, 464).

module (d’un nombre complexe) (27). Terminologie due à Argand (1806).

monotone (fonction, suite) (209, 464). Cauchy (1821) admet encore qu’une
suite monotone bornée est convergente.

Montucla, Jean Etienne (1725-1799) (318). Auteur d’une monumentale His-


toire des mathématiques.

moyenne (convergence en) (521, 695). Notion due à F. Riesz (1910).

moyenne (norme de la convergence en) (682).

moyenne (théorème et inégalité de la) (150, 153, 154, 229, 388).


Enoncé en langage géométrique par Cavalieri (1635). Cauchy (1829) le
démontra pour une fonction de R dans R continûment dérivable et Bon-
net le démontra sous les hypothèses actuelles. Voir aussi l’article “Lagrange
(formule de)”.
786 CHAPITRE 18. INDEX HISTORIQUE

moyenne quadratique (convergence en) (521, 684).

multiple (intégrale) (350).

multiplicité d’un zéro (671).

naturelle (métrique) (676).

négligeable (ensemble) (498). Introduit implicitement par Borel (1894) qui


montra que tout ensemble dénombrable est négligeable. Il explicitera le con-
cept en 1897.

Neumann, Carl Gottfried (1832-1925) (314). Mathématicien et fils de ma-


thématicien allemand. Travaux en théorie du potentiel. Créa le journal
Mathematische Annalen (1868).

Newton, Isaac (1642-1727) (109, 321, 341, 343, 344). Mathématicien, as-
tronome et physicien anglais. Co-inventeur du calcul différentiel et intégral
et auteur de la théorie de la gravitation, on lui doit aussi des contributions
essentielles à l’algèbre et à l’optique. Ses Principes mathématiques de philoso-
phie naturelle sont à l’origine de la science moderne. Il devint Gouverneur de
la Monnaie et s’intéressa activement à la théologie et à l’alchimie.

non intégrable (ensemble borné) (522). Exemple dû à Vitali (1904).

normale (convergence) (445). Notion introduite par Baire (1908) en s’excu-


sant d’ajouter un nouveau concept aux mathématiques.

normale unitaire à une surface (584).

norme (20, 677).

normé (espace vectoriel, sous-espace vectoriel) (20, 677, 678). Pressentie


par F. Riesz (1910), la définition abstraite des espaces vectoriels normés
apparaı̂t, entre 1920 et 1922, dans les travaux de Helly, Hahn, Banach et
Wiener.

ondes (équation des) (283). Appelée également équation des cordes vibrantes,
elle fut étudiée par Taylor (1713) et résolue pour la première fois par
d’Alembert (1747) et puis par Daniel Bernoulli (1747) et Euler (1748).
La discussion de sa solution fut essentielle dans l’évolution du concept de
fonction. La résolution de sa généralisation utt − ∆u = 0 est plus délicate.

opérateur différentiel linéaire (289). L’étude des opérateurs différentiels liné-


aires dans les espaces de fonctions de plusieurs variables est beaucoup plus
délicate et a fait l’objet de nombreuses recherches contemporaines. La théorie
des distributions y joue un rôle important.
787

orbite (173). Pour le système dynamique défini par l’application rélle d’une vari-
able réelle f, l’ensemble des points d’accumulation de la suite (f k (x0 ))k∈N est
appelé son ensemble ω-limite. Si f possède une application inverse, l’ensemble
des points d’accumulation de la suite (f −k (x0 ))k∈N est appelé son ensemble
α-limite. Ces ensembles, introduits en 1927 par G.D. Birkhoff, jouent
un rôle important dans l’analyse du comportement asymptotique du système
dynamique.

orientation (581, 608).

oscillation d’une fonction (230). Notion définie (indépendamment) par Rie-


mann et Volterra (1881).

Ostrogradsky, Michel (1801-1862) (619). Mathématicien russe qui a contri-


bué à la théorie des équations aux dérivées partielles et des intégrales multi-
ples.

ouvert (126, 160, 496, 703). Notion introduite par Weierstrass (1860), De-
dekind (1871), Cantor (1879) et Baire (1899).

P-partition (119). Quoiqu’elle apparaisse, dès l’Antiquité, dans des cas particu-
liers, cette notion se trouve précisée par Cauchy (1823) et Riemann (1854)
pour les fonctions d’une variable et par Thomae (1876) pour les fonctions de
deux variables.

Painlevé (intégrale première de) (736). Obtenue par Painlevé (1895)

Painlevé, Paul (1863-1933) (736). Mathématicien, mécanicien et homme poli-


tique français, il fut ministre de la guerre et premier ministre. Ses contribu-
tions aux équations différentielles à points critiques fixes, qui sont au coeur de
théories mathématiques récentes, font autorité. Passionné d’aviation, il fut le
premier passager de Wright lors des démonstrations en France de l’aviateur
américain.

paire (2).

parallélogramme (575).

partie entière (210). Le symbole [x] pour la partie entière de x fut employé dans
des cas particuliers par Dirichlet (1849) et, dans le cas général, par F.
Mertens (1874). Peano utilisa la notation Ex (1899).

partie finie (434). Notion introduite par d’Adhémar et Hadamard (1904) dans
l’étude des équations aux dérivées partielles hyperboliques.

partie réelle, imaginaire (26).


788 CHAPITRE 18. INDEX HISTORIQUE

parties (intégration par) (361, 403). Elle apparaı̂t, en langage géométrique,


chez Torricelli (1644), Fermat (1657), Pascal et, en langage analytique,
chez Leibniz (1675).

partition (118).

Pascal, Blaise (1623-1662) (391). Mathématicien, physicien, philosophe polé-


miste et écrivain français. Inventeur du calcul des probabilités, d’une machine
à calculer et d’un service d’omnibus à Paris, il a également étudié la variation
de la pression atmosphérique.

pavé (115).

pavés emboı̂tés (théorème des) (116).

Peano (théorème de) (724). Démontré par Peano (1892), et, indépendam-
ment, par de La Vallée Poussin (1892).

Peano, Giuseppe (1858-1939) (37, 198, 724). Mathématicien et logicien ital-


ien. Il s’est occupé des fondements de l’arithmétique, de l’algèbre linéaire,
de l’analyse, et de la théorie des équations différentielles. Son Calcolo dif-
ferenziale e principii di calcolo integrale reste une excellente introduction
à l’analyse. Certains de ses articles sont écrits en pasigraphie, un système
de signes quasi illisible qu’il inventa pour écrire les propositions logiques et
mathématiques.

périodique (solution) (314). A cause de leur importance en mécanique céleste,


en mécanique et en électricité et électronique, l’étude des solutions périodi-
ques, systématisée par Poincaré (1883, 1892), constitue une partie impor-
tante de la théorie des équations différentielles.

Perron, Oskar (1880-1975) (349, 388). Mathématicien allemand, à qui l’on


doit de nombreuses contributions aux équations différentielles et aux dérivées
partielles.

π (264). C’est dans un ouvrage de Jones (1706), que le symbole π est utilisé pour
la première fois pour exprimer le rapport de la circonférence au diamètre.
Depuis que Gregory (1670) trouva un moyen pour calculer arctg x, on a
cherché des formules avantageuses exprimant le nombre π par un ou plusieurs
arctg, afin de calculer le plus grand nombre possible de décimales dans le
temps le plus court. Le nombre π apparaı̂t dans de nombreuses formules
d’analyse.

Picard, Emile (1856-1941) (667, 702). Gendre d’Hermite, ce mathématicien


français a apporté des contributions fondamentales à la théorie des fonc-
tions de variables complexes, aux équations différentielles et à la géométrie
algébrique. Son Traité d’analyse a fait autorité.
789

Poincaré (théorème de) (598, 627, 628, 630, 631). Avant l’introduction de
la notion de différentielle extérieure, Poincaré (1887, 1892, 1895) et
Volterra (1889) obtinrent les conditions équivalant à ce qu’une forme
différentielle soit fermée (cocycle). Le théorème de Poincaré est énoncé
et démontré pour la première fois par Volterra (1889). On trouve le
théorème de Poincaré et sa réciproque pour Rn , dans le langage des formes
différentielles, chez E. Cartan et Goursat en 1922, et, pour un ensemble
étoilé, chez Szucs (1928).

Poincaré, Henri (1854-1912) (286, 320, 598, 627, 630, 638, 639, 640). Ma-
thématicien, astronome, physicien et philosophe français. Considéré comme
l’un des derniers savants universels, il est le véritable créateur de la topolo-
gie algébrique, de la théorie qualitative des équations différentielles (premiers
travaux sur la bifurcation et le chaos) et de la mécanique céleste moderne. Il
créa aussi la théorie des fonctions fuchsiennes, qui généralisent les fonctions
elliptiques, étudia la télégraphie et développa, indépendamment d’Einstein,
la mathématique de la relativité restreinte. Ses ouvrages de philosophie scien-
tifique La science et l’hypothèse, La valeur de la science, Science et méthode
et Dernières pensées méritent encore le détour.

Poinsot, Louis (1777-1859) (481). Mathématicien français, spécialiste de la


mécanique du solide.

point fixe (171, 700).

Poisson (crochet de) (283). Ainsi appelé par suite de son analogie avec la par-
enthèse introduite par Poisson en mécanique (1809).

Poisson (intégrale de) (533, 562). Elle apparaı̂t dans la Doctrine des chances
de De Moivre (1718). Gauss l’attribue à Laplace en 1809 et plus tard
à Euler. Poisson la calcule par double intégration. On l’appelle aussi
intégrale de Laplace ou intégrale de Gauss.

Poisson, Simeon-Denis (1781-1840) (283, 533, 562). Physicien mathémati-


cien français. Ses parenthèses, son intégrale, son noyau et sa distribution
sont célèbres.

polaires (coordonnées) (102, 565). Apparaissent chez Gregory (1666) et,


plus systématiquement, chez Jacques Bernoulli (1691-1694).

pôle (664).

polynôme caractéristique (292). Introduit par Euler (1743).

ponctuelle (convergence) (437, 439).

ponctuelle presque partout (convergence) (504).


790 CHAPITRE 18. INDEX HISTORIQUE

potentiel scalaire (625, 737). Terminologie due à Daniel Bernoulli (1738).

potentiel généralisé (737).

potentiel vectoriel (625). Notion due à Maxwell (1873).

potentielle (série) (425). Dénomination


% k due à Weierstrass (1859). La plus
ancienne étude est celle de ax par Tacquet (1656). Le théorème de
convergence des séries potentielles est dû à Cauchy (1821). Tombé dans
l’oubli, il fut redécouvert indépendamment par Hadamard (1892).

préhilbertien (espace) (683).

premiers (théorème des nombres) (439). Conjecturé par Gauss (1792-93),


qui ne publia pas, et par Legendre (1798), il fut démontré indépendamment
par Hadamard et de La Vallée Poussin en 1896, en se fondant sur des
résultats partiels antérieures de Dirichlet (1837), Tchebycheff (1851-52)
et Riemann (1860).

presque partout (propriété vraie) (503). Concept introduit et utilisé par Le-
besgue (1903).

primitivable (fonction) (321).

primitivation par changement de variable (328).

primitivation par parties (329). Utilisée déjà, en langage géométrique, chez


Torricelli (1644) et Fermat (1657).

primitivation par substitution (327). Utilisée déjà, en langage géométrique,


chez Roberval (1645) et Fermat (1657).

primitive (321). Barrow (1663) et Torricelli (1647), dans un langage pure-


ment géométrique, ont soupçonné l’importance de l’étude de l’opération in-
verse de la dérivation et leurs conceptions furent reprises, amplifiées et ex-
primées en langage analytique par Newton (1676), qui attira déjà l’attention
sur le rôle de la constante arbitraire. Chez Newton, la dérivée s’appelait
fluxion et la primitive fluente, et il fut le premier à dresser des tables de
primitives (1676). Auparavant, des procédés géométriques équivalant à la
primitivation de xn pour certaines valeurs de n avaient été introduits par
Archimède, Stévin (1596), Valerio (1604), Cavalieri (1635), Fermat
(1636), Roberval (1636), Huygens (1644), Torricelli (1644), Wallis
(1650). Le cas difficile où n = −1 apparaı̂t chez de Saint-Vincent (1622).
Le cas de xa, a /= 1 rationnel, fut traité par Fermat (1657). On trouve chez
Roberval et Wallis l’équivalent de la primitivation de polynômes. New-
ton (1676) et Leibniz (1684) dégagèrent la structure analytique commune de
ces résultats et les règles simples de calcul. On leur doit aussi la détermination
791

de la primitive de l’exponentielle et des fonctions trigonométriques, qui était


déjà apparue, sous forme géométrique, chez Kepler (1609) et Pascal (1659).
Des cas particuliers de primitivation des fonctions rationnelles sont intro-
duits indépendamment par Jean Bernoulli (1702) et Leibniz (1702). Ils
seront développés par Euler (1702), Cotes (1716) et de Moivre (1718).
La démonstration de la décomposition d’une fonction rationnelle propre est
due à Jacobi (1835). Stirling (1717) introduisit la locution courbe ra-
tionnelle et Euler (1748) la terminologie fonction rationnelle. La première
démonstration rigoureuse du fait qu’une fonction dérivable de dérivée nulle est
constante est due à Schwarz (1870), inspiré par le cours de Weierstrass.
La démonstration de la propriété de valeur intermédiaire des fonctions prim-
itivables est due à Darboux (1875).

primitive extérieure d’une forme différentielle (632). Notion déjà connue


d’Euler (1770) dans le cas particulier d’une 1-forme dans R2 .

principale (partie) (664).

produit cartésien ou ensembliste (5).

produit extérieur de formes (589, 590). Introduit pour les formes extérieures
par Grassmann (1861) et pour les formes différentielles par E. Cartan
(1899).

produit scalaire (25, 682). Introduit par Grassmann (1844) sous le nom de
produit intérieur et par Hamilton (1844).

produit scalaire de formes (592).

produit vectoriel (594). Introduit par Grassmann (1844), sous le nom de pro-
duit extérieur, et Hamilton (1844). Heaviside (1892) l’appelle produit vec-
toriel.

projection (20).

prolongement (6).

puissances (série de) (425). Voir potentielle (série).

quantificateurs existentiel et universel (3). Leur étude a été faite par Frege
(1879). Le symbole ∃ fut introduit par Peano (1900) et le symbole ∀ par
Gentzen (1934).

quotient (test du) (423). Un cas particulier est dû à d’Alembert (1768) et le
cas général à Waring (1776) et Cauchy (1821).

quotient différentiel (81).


792 CHAPITRE 18. INDEX HISTORIQUE

R-linéaire (application) (74).

Raabe (test de convergence de) (434). Raabe (1832) et Duhamel (1839).

Raabe, Josef Ludwig (1801-1859) (434). Mathématicien né en Ukraine, spé-


cialiste des séries.

racine (test de la) (421). Il est dû à Cauchy (1821)

racine caractéristique (292).

racine d’une équation (171).

radiale (fonction) (284).

rare (ensemble) (708). Egalement appelé clairsemé.

rationnels (nombres) (12). La construction des nombres rationnels à partir des


nombres entiers, commencée par Ohm, fut faite indépendamment par Weier-
strass (1860) et Peano (1899). C’est Heine (1872) qui utilisa le premier
des paires de nombres entiers pour construire les rationnels.

rayon de convergence d’une série (426). Terminologie due à Méray (1872).

réciproque (fonction) (187). La notion f −1 , utilisée par Herschel (1820), fut


popularisée seulement au XXe siècle.

recouvrement (717).

recouvrement (lemme de) (495). Dû à R.M. McLeod (1980).

réelle (application) (207).

réels (nombres) (13). L’expression nombre réel est due à Descartes (1637). A-
près d’intéressantes ébauches dues à Bombelli (1550), Stévin (1594), Bar-
row (1665), Gauss (1812), Bolzano (1817), Cauchy (1821) et Catalan
(1835), différentes constructions rigoureuses des nombres réels à partir des ra-
tionnels furent données par Méray (1869), Weierstrass (1872), Dedekind
(1872) et Cantor (1872). La première construction axiomatique directe des
réels, non basée sur Q, est due à Hilbert (1900).

régulier (point singulier) (664).

régulière (P-partition) (121).

régulière (partie) (663, 664).

relation (5).
793

reparamétrisation d’un simplexe (607).

représentation intégrale (528). Voir “Fonction définie par une intégrale”.

représentation intégrale d’une fonction holomorphe (651). On la doit à


Cauchy (1831, 1841).

représentation irréductible d’un rationnel (75).

représentation paramétrique d’une courbe, d’une surface (569, 575).

résidu (649). Notion et terme introduits et étudiés par Cauchy (1826, 1830,
1841).

résiduelle (partie) (708). Notion introduite par Baire (1899) sous le nom
d’ensemble de deuxième catégorie.

résidus (théorème des) 668. Il est dû à Cauchy (1846).

restriction (d’un graphe ou d’une fonction) (6, 40).

restriction à un sous-pavé, à une partie intégrable (propriété de) (366,


491).

Riemann (hypothèse de) (439). Conjecturée par Riemann (1859), elle reste
indémontré aujourd’hui, malgré des résultats partiels théoriques et numéri-
ques.

Riemann (série de) (419). Sa convergence fut discutée par Waring (1762). Le
nom vient du rôle que lui a fait jouer Riemann en théorie analytique des
nombres.

Riemann (somme de) (349). Dans R et pour les fonctions continues, elles furent
introduites par Cauchy (1823) pour donner une définition analytique de
l’intégrale sur un intervalle d’une fonction continue. Riemann (1854) les
prit comme base de sa définition d’intégrabilité sur un intervalle, et Thomae
(1876) les définit pour les fonctions de deux variables. Kurzweil (1957)
et Henstock (1961) les mirent à la base de leur définition de l’intégrale de
Denjoy-Perron.

Riemann-Stieltjes (somme de) (389).

Riemann, Bernard (1826-1866) (105, 258, 349, 352, 356, 389, 392, 419,
439, 617). Mathématicien allemand, auteur de travaux fondamentaux en
analyse, en géométrie, en théorie analytique des nombres et en physique
mathématique. Il succéda, à Göttingen, à Dirichlet, lui-même successeur
de Gauss. Phtisique, il mourut prématurément en Italie du Nord, où il se
soignait.
794 CHAPITRE 18. INDEX HISTORIQUE

Riesz, Frédéric (1880-1956) (695). Mathématicien hongrois, l’un des pères de


l’analyse fonctionnelle.

Rolle (théorème de) (146). Enoncé et démontré, pour un polynôme, par Rolle
(1691), qui qualifiait cependant le calcul différentiel de “collection de men-
songes bien trouvés”. L’énoncé moderne apparaı̂t chez Cauchy (1821).
Pour des démonstrations rigoureuses, il faut attendre Dini (1878), Harnack
(1881), Pasch (1882), Mansion (1887) (démonstration basée sur le théorème
de Weierstrass), Tannery (1886), Demoulin (1902).

Rolle (théorème généralisé de) (145).

Rolle, Michel (1652-1719) (145, 146, 163). Mathématicien français, spécia-


liste de l’algèbre et farouche opposant au nouveau calcul différentiel.

rotationnel (600). Notion introduite par Maxwell (1873).

Rothe (théorème du point fixe de) (159). Dû, dans Rn , à Knaster, Kura-
towski et Mazurkiewicz (1929), et dans un espace de Banach, à Rothe
(1936).

Rothe, Erik (1895-1988) (159). Mathématicien américain d’origine allemande.


Spécialiste de l’analyse fonctionnelle non linéaire.

Saks-Henstock (lemme de) (379). Introduit, pour un autre type d’intégrales,


par Saks (1927) et Henstock (1946) et, dans le présent contexte, par Hen-
stock (1968).

Saks, Stanislaw (1897-1942) (379). Mathématicien polonais, auteur d’une


intéressante Théorie de l’intégrale. Assassiné par les nazis.

Schlömilch (reste du développement de Taylor de) (243). Obtenu par


Schlömilch (1847).

Schlömilch, Oscar (1823-1901) (243). Mathématicien allemand. Auteur de


nombreux ouvrages didactiques.

Schwartz, Jacob T. (né en 1930) (568). Mathématicien américain contempo-


rain.

Schwarz (théorème de) (272). Dû à Schwarz (1873) qui donna le premier
contre-exemple à l’égalité des dérivées partielles secondes. Son résultat fut
généralisé par Thomae (1875), Peano (1890) et Dini (1877).

Schwarz, Hermann Amandus (1843-1921) (272, 683). Mathématicien alle-


mand, spécialiste de la théorie des surfaces minimales et de la théorie du
potentiel.
795

segment de droite (569).

Seidel, Philippe von (1821-1896) (481). Mathématicien, physicien et astrono-


me allemand. Importantes contributions en analyse numérique.

selle (point de) (145). Ils jouent un grand rôle en théorie des jeux.

semi-continuité (160). Notion introduite par Baire (1899).

semi-cube, semi-pavé (115).

séparable (espace métrique) (716).

série (249). Cette notion, d’une manière plus ou moins% explicite, apparaı̂t très tôt
en mathématiques (Archim ède somme
% 3 k % 1 k la série ( 14 )k et, au XIVe siècle,
Oresme somme les séries ( 4 ) et k( 2 ) ). Leur emploi systématique com-
mence avec Newton (1669). On trouve la définition précise chez Cauchy
(1821). de Saint-Vincent (1647) donna le premier énoncé explicite du fait
qu’une série numérique peut représenter un nombre (sa somme) qu’il appelle
terminus de la série.

série dérivée (428).

simple (convergence) (437, 439). Terminologie due à Dini (1878).

simple (fonction) (517).

simple (intégrale) (350).

simplement convergente (série) (254). Cauchy % (1833) montra qu’une mod-


ification de l’ordre des termes dans la série k∈N (−1)k /(k + 1) pouvait la
rendre divergente. Dirichlet (1837) montra qu’une telle modification pou-
vait changer la somme (contrairement au cas d’une série absolument con-
vergente). Riemann (1868) montra que l’ordre d’une série semi-convergente
pouvait toujours être modifié pour donner une somme fixée a priori.

simplexe (605). Notion introduite par Poincaré (1899) et précisée par Lef-
schetz (1933).

singleton (2).

singulier (point) (663).

singulières (équations différentielles linéaires) (459). Leur théorie générale


est due à Fuchs (1866-1868).

somme (d’une série) (249).

somme partielle (d’une série) (249).


796 CHAPITRE 18. INDEX HISTORIQUE

sous-additivité d’une mesure (488, 512).

sous-espace métrique (677).

sous-recouvrement (717).

sous-suite (169, 721).

stable (équation différentielle linéaire) (315). La théorie de la stabilité cons-


titue une partie importante de la théorie des équations différentielles ordi-
naires. Elle doit ses concepts et méthodes fondamentaux à Lyapounoff
(1893).

stationnaire (point) (145, 730).

Stieltjes, Thomas (1856-1894) (388, 389). Mathématicien hollandais, profes-


seur à Toulouse. Travaux sur les fractions continues. Sa correspondance avec
Hermite est célèbre.

Stokes-Ampère (formule de) (618). Etablie par Thomson (1850) dans le


post-scriptum d’une lettre à Stokes, qui l’inclut dans l’examen à Cambridge
à partir de 1854 et l’utilise dans ses travaux, ce qui explique comment son
nom y est attaché. Démonstrations par Hankel (1861), Thompson, Tait
(1879) et Maxwell (1873). Un cas particulier est dû à Ampère (1825).

Stokes-Cartan (théorème de) (613, 614). Dû à Volterra (1889), Poinca-


ré (1895, 1899), Goursat (1916) et, dans une version plus proche de celle
donnée ici, par E. Cartan (1945). Par analogie avec le cas particulier où
n = 1 (théorème fondamental du calcul différentiel et intégral), on peut se
demander si le théorème de Stokes-Cartan pour le k-simplexe identité I et
%k
une (k − 1)-forme ω = j=1 (−1)j fj dx1 ∧ . . . ∧ dx Zj ∧ . . . ∧ dxk dans Rk reste
vrai si les coefficients fj de ω sont seulement supposés (totalement) dérivables
%k ∂f
au lieu de classe C 1 . Il n’en est rien car la fonction div f = j=1 ∂xjj , telle
que dω = div f dx1 ∧ . . . ∧ dxk n’est même pas nécessairement intégrable sur
[0, 1]k. Les intégrales plus générales qui intègrent div f sur [0, 1]k lorsque f y
est totalement dérivable et qui fournissent, pour l’intégrale correspondante,
la valeur fournie par le théorème de Stokes-Cartan font actuellement l’objet
de recherches soutenues.

Stokes, George (1819-1903) (36, 481, 613, 618, 637). Mathématicien et


physicien mathématicien irlandais. Importantes contributions à l’hydrodyna-
mique. Il découvrit aussi que l’hémoglobine peut se lier de façon réversible à
l’oxygène.

Stolz, Otto (1842-1905) (110). Mathématicien autrichien. Il publia les pre-


miers ouvrages dans le style weierstrassien, et en particulier les Grundzüge
797

der Differential und Integralrechnung, où l’on trouve pour la première fois la
notion de dérivée totale d’une fonction de plusieurs variables.

strictement concave, convexe (fonction) (227, 228).

strictement croissante, décroissante, monotone (fonction) (209, 210).

subordonnées (lemme des P-partitions) (362).

substitution (intégration par) (362). Méthode introduite, en langage géomé-


trique, par Pascal, Gregory (1667), Roberval (1645), Fermat (1657),
Barrow (1670).

suite (9). Des suites infinies apparaissent déjà chez les mathématiciens grecs de
l’Antiquité. La définition d’une suite réelle comme fonction réelle de domaine
N, approchée par Gauss (1800), est due à Peano (1895).

supremum (d’un ensemble) (201). Notion introduite par Gauss (1800), qui
en donne la caractérisation, et par Bolzano (1817).

supremum (d’une application) (207, 208).

supremum (théorème du) (200). Démontré par Bolzano (1817).

surjectif (graphe) ou surjection (6, 9).

symplectique (forme) (636), (matrice) (738). Une structure symplectique sur


une variété différentiable de dimension 2n est la donnée d’un 2-cocycle non
dégénéré. Un
%nthéorème de Darboux montre qu’une telle forme peut s’écrire
localement j=1 dpj ∧ dqj , c’est-à-dire que toutes les variétés symplectiques
sont localement les mêmes. L’étude de la géométrie symplectique, dont
l’origine remonte aux travaux de mécanique analytique de Lagrange (1788),
est un domaine très vivant des mathématiques actuelles, trouvant de nom-
breuses applications en analyse, en mécanique et en physique. Le mot sym-
plectique fut inventé en 1946 par Weyl.

système dynamique (173). Issue de la mécanique analytique et des propriétés


des solutions du problème de Cauchy, la théorie des systèmes dynamiques
trouve son origine dans les travaux de Poincaré, Liapounov et Hadamard
à la fin du XIXe siècle et de G.D. Birkhoff dans le premier tiers du XXe.
Elle touche à de nombreuses parties des mathématiques (analyse, topologie,
théorie ergodique) et connaît actuellement un prodigieux développement avec
l’étude des phénomènes chaotiques.

tangent (107).

tangente unitaire à une courbe (582).


798 CHAPITRE 18. INDEX HISTORIQUE

Tannery, Jules (1848-1910) (37). Mathématicien français, auteur d’une éton-


namment moderne Théorie des fonctions d’une variable et de spirituels apho-
rismes.

taux de variation d’une fonction (81).

Taylor (développement de) (238, 279, 284). La forme donnée ici est due à
Lagrange (1772), ainsi que l’extension aux fonctions de plusieurs variables
(1794).

Taylor (reste du développement de) (238, 330). Lagrange (1797) posa le


problème de leur obtention.

Taylor (série de) (258, 658). Elle apparaı̂t chez Gregory (1670), Newton
(1676), Leibniz, Jean Bernoulli (1697) avant d’être publiée par Taylor
(1715).

Taylor (théorème de) (655). Sa démonstration est due à Cauchy qui la publia
d’abord sous forme lithographique en Italie (1831) et sous forme imprimée en
France (1841).

Taylor, Brook (1685-1731) (238, 258, 279, 285, 330, 655, 658).
Mathématicien anglais. Peintre et musicien, il est l’auteur de travaux im-
portants sur la perspective et sur les cordes vibrantes. Il prit les eaux à Spa
pour soigner ses rhumatismes et sa fille se prénommait Elisabeth.

Tchebycheff (identité et inégalité de) (33, 564). Communiquée par Tche-


bycheff à Hermite, qui l’insère dans son Cours d’analyse de 1882.

Tchebycheff (inégalité de) (493, 523). Due à Tchebycheff (1874). Elle cor-
respond, en probabilité, à l’inégalité (parfois appelée aussi inégalité de
Markov) affirmant que, pour tout réel k, la probabilité pour qu’une variable
aléatoire X prenne une valeur supérieure à k fois l’espérance mathématique
E[X] est inférieure à 1/k.

Tchebycheff, Pafnuti L. (1821-1894). (33, 493, 523, 564). Mathématicien


russe. Importantes contributions au calcul des probabilités, à l’analyse et à
la théorie des nombres.

télégraphistes (équation des) (316). Cette équation apparaı̂t dans les travaux
de Kirchoff et a été déduite des équations de Maxwell par Thomson
(Lord Kelvin) et Heaviside (1876). Elle a été étudiée ensuite par du Bois-
Reymond, Poincaré et Picard. Son importance à l’époque était liée à la
construction et la pose des premiers cables télégraphiques transatlantiques.

télescopique (série) (250).


799

test de comparaison de convergence d’une série (418). La preuve de la


convergence d’une série par comparaison avec une série géométrique se trouve
déjà chez d’Alembert (1768), Gauss (1812), Bolzano (1816) et le test
général est dû à Cauchy (1821).

test de comparaison de L-intégrabilité (385, 387, 405, 519).

test de la limite d’intégrabilité (406).

test de la limite de convergence d’une série (418). Dû à Cauchy (1821).

théorème fondamental du calcul différentiel et intégral (351, 401). Il ap-


paraı̂t déjà, en langage géométrique, chez Barrow (1670) et sous forme
analytique chez Newton (1669) et Leibniz (1675), révélant ainsi ce lien
surprenant entre la recherche des tangentes et des aires liées à une courbe.
Pour une fonction continue, le théorème est énoncé et démontré par Cauchy
(1823), et, pour une fonction primitivable et R-intégrable, par Darboux
(1875) et Du Bois-Reymond (1875). Volterra (1881) et Smith (1875)
donnèrent des exemples de fonction bornée et primitivable non R-intégrable.
Le théorème est alors démontré, dans le cadre de son intégrale, par
Lebesgue (1902), pour une fonction primitivable et bornée et par Den-
joy (1912) et Perron (1914) dans le cadre de leurs intégrales respectives.
La démonstration donnée ici pour une fonction primitivable quelconque est
due à Henstock (1963, 1968).

Thomae, Johannes Karl (1840-1921) (110). Mathématicien allemand, au-


teur de fines critiques sur les fondements de l’analyse.

Tonelli (critère de L-intégrabilité de) (546). Dû indépendamment à Tonel-


li (1909) et Hobson (1909).

Tonelli, Leonida (1885-1946) (546, 724). Mathématicien italien, qui a déve-


loppé la méthode directe du calcul des variations, donnant des conditions sur
l’intégrand de la fonctionnelle à minimiser qui assurent l’existence d’un mi-
nimum, et donc l’existence d’une solution aux équations d’Euler-Lagrange.

transcendant (nombre) (33, 218, 265). C’est Liouville (1844) qui donna le
premier
% exemple de nombre transcendant, à savoir tout nombre de la forme
k /10 où les ak sont des entiers arbitraires entre 0 et 9.
k!
k∈N ∗ a

transformée d’une forme (602).

transformée intégrale (529). La théorie des transformées intégrales (trans-


formées de Laplace, Mellin, Hankel, Weber, Watson, Stieltjes, Hilbert,...)
est l’un des chapitres les plus développés de l’analyse.

trigonométrique (intégrale) (414).


800 CHAPITRE 18. INDEX HISTORIQUE

trigonométrique (série) (430, 432, 461). De telles séries apparaissent chez


Euler (1730), Clairaut (1757) et Daniel Bernoulli (1772). Malmsten
(1844) et Holmgren (1851) ont prouvé la convergence pour x /= 2kπ de ces
séries lorsque les coefficients décroissent vers zéro.

trigonométriques (fonctions) (261). Connues dès l’antiquité, les séries utilisées


pour les définir se trouvent déjà chez Newton (1711) et leur théorie analy-
tique date d’Euler (1748).

unicursale (courbe) (336). Définies déjà par Maclaurin (1720).

uniforme (continuité) (134, 722). Bien que Dirichlet (1854) ait énoncé un
théorème sur la continuité uniforme, la notion sera introduite explicitement
et indépendamment par Heine (1872).

uniforme (convergence) (441, 444). L’expression fut mentionnée pour la pre-


mière fois par Guderman (1838), le professeur de Weierstrass à Münster,
et la notion précise fut introduite par Weierstrass (1841; publ. 1894).
Indépendamment, Seidel (1847) et Stokes (1847), ainsi que Cauchy
(1853), introduisirent des notions correspondant à celle de convergence uni-
forme. C’est Weierstrass (1861) qui prouva la continuité de la limite uni-
forme de fonctions continues et la dérivabilité de la limite uniforme lorsque
la suite des dérivées converge uniformément.

uniforme (norme de la convergence) (680).

uniformisation d’une courbe (336).

Urysohn (théorème d’) (739). Démontré par Urysohn (1925).

Urysohn, Pawel (1898-1924) (739). Mathématicien russe. Il mourut noyé en


France.

valeur (6, 7).

valeur absolue (17, 19, 27). La notation |x| est due à Weierstrass (1859).

valeur d’adhérence (166, 167).

valeur intermédiaire (propriété de) (125, 325). Longtemps considérée com-


me traduisant la continuité d’une fonction, alors qu’elle n’en est qu’une con-
dition nécessaire (Darboux (1875)).

valeur principale de Cauchy (433). Introduite par Cauchy (1823).

variation bornée (fonction à) (633). Notion introduite par Jordan (1881)
dans une étude des séries de Fourier. Une fonction réelle est à variation
bornée si et seulement si elle est la différence de deux fonctions croissantes.
801

Lebesgue (1904) a montré que toute fonction continue et à variation bornée


est dérivable p.p..

variations (calcul des) (730). Les premiers problèmes de calcul des variations
furent traités heuristiquement par Newton (1687), Jean Bernoulli (1696)
et Jacques Bernoulli (1697). Il faut attendre Euler (1744) et surtout La-
grange (1760) pour en dégager un corps de doctrine. Des contributions im-
portantes sont apportées par Legendre, Jacobi, Weierstrass, Kneser
et Hilbert. Le nom est dû à Euler (1766).

Verhulst Pierre-François (1804-1849) (378). Mathématicien belge, élève de


Quételet et professeur à l’Ecole militaire. Il fut expulsé de Rome en 1831
pour avoir proposé au pape de donner aux Etats pontificaux un régime par-
lementaire. Travaux en démographie mathématique.

voisinage (27, 685). Le mot (sans définition) apparaı̂t chez Cauchy (1821) et
le concept, dans Rn , apparaı̂t chez Weierstrass (1861) et Cantor (1870).
Weyl (1913) fut le premier à saisir l’importance du concept dégagé de la
notion de distance et Hausdorff (1914) l’introduisit axiomatiquement.

Volterra, Vito (1860-1940) (356, 638). Mathématicien italien. Travaux en


analyse réelle et complexe. Créateur de l’analyse fonctionnelle (fonctions de
lignes) et de la biologie mathématique. Il s’opposa courageusement au régime
fasciste.

volume (d’un parallélipipède) (347).

volume (d’un solide) (487, 511).

Weierstrass (contre-exemple de) (740).

Weierstrass (test de convergence normale de) (445). Dû à Weierstrass


(1880).

Weierstrass (théorème d’approximation de) (708). Découvert par Weier-


strass (1885). La démonstration, due à Stone (1936), s’inspire d’une idée
de Lebesgue (1898).

Weierstrass (théorème des bornes atteintes de) (138, 726). Enoncé et dé-
montré par Weierstrass aux environs de 1860.

Weierstrass, Karl (1815-1897) (80, 110, 138, 168, 197, 445, 453, 667,
708, 721, 726, 740). Mathématicien allemand, dont les travaux en analyse
marquent profondément la pensée moderne. Spécialiste de la théorie des
fonctions de variables complexes et de la théorie des fonctions elliptiques.
Après des années d’études à Bonn placées sous le signe des duels et de la bière,
Weierstrass travailla pendant treize ans dans des gymnases de province où il
802 CHAPITRE 18. INDEX HISTORIQUE

enseigna la botanique, la géographie, la calligraphie et même la gymnastique,


avant de devenir, à l’université de Berlin, un professeur vénéré.

Young (reste du développement de Taylor de) (239). Dû à W.H. Young


(1910).

Young (théorème de) (274). W.H. Young (1910).

Young, Grace (1868-1944) (105). Mathématicienne anglaise, épouse de Willi-


am Young. Première femme à obtenir, en Allemagne, le doctorat en suivant
un cycle régulier d’étude.

Young, William (1863-1942) (111, 239, 274). Mathématicien anglais. Nom-


breux travaux en théorie des fonctions de variables réelles.

Zarantonello (théorème des fonctions implicites global de) (739).

Zermelo, Ernst (1871-1953) (2, 3). Mathématicien allemand, auteur de tra-


vaux importants sur les fondements de la théorie des ensembles et le calcul
des variations.

zéro d’une application (171).

zeta (fonction) (420, 439). Euler l’étudia dès 1731 pour des valeurs réelles de
la variable et remarqua le lien avec la théorie des nombres premiers. Le cas
d’une variable complexe a été considéré par Riemann (1859).
Table des matières

1 Ensembles, graphes, fonctions 1


1.1 Logique et ensembles : terminologie et notations . . . . . . . 1
1.2 Graphes, fonctions, applications . . . . . . . . . . . . . . . . . 5
1.3 Ensembles finis, infinis, dénombrables . . . . . . . . . . . . . 10
1.4 Nombres réels . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.5 L’espace vectoriel normé Rn . . . . . . . . . . . . . . . . . . . 19
1.6 Nombres complexes . . . . . . . . . . . . . . . . . . . . . . . . 25
1.7 Intérieur, adhérence, frontière . . . . . . . . . . . . . . . . . . 27
1.8 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
1.9 Petite anthologie . . . . . . . . . . . . . . . . . . . . . . . . . 33

2 Limites et continuité 39
2.1 Fonctions de plusieurs variables réelles . . . . . . . . . . . . . 39
2.2 Limite des valeurs d’une fonction . . . . . . . . . . . . . . . . 40
2.3 Conditions nécessaires d’existence de la limite . . . . . . . . . 47
2.4 Règles de calcul des limites . . . . . . . . . . . . . . . . . . . 50
2.5 Formulations équivalentes et caractère local . . . . . . . . . . 59
2.6 Limites à l’infini et convergence des suites . . . . . . . . . . . 62
2.7 Limites infinies . . . . . . . . . . . . . . . . . . . . . . . . . . 66
2.8 Continuité d’une fonction en un point . . . . . . . . . . . . . 69
2.9 Applications linéaires . . . . . . . . . . . . . . . . . . . . . . . 72
2.10 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
2.11 Petite anthologie . . . . . . . . . . . . . . . . . . . . . . . . . 77

3 Dérivabilité 81
3.1 Fonctions d’une variable réelle . . . . . . . . . . . . . . . . . . 81
3.2 Fonctions de plusieurs variables réelles . . . . . . . . . . . . . 85
3.3 Dérivées directionnelles et dérivées partielles . . . . . . . . . . 90
3.4 Règles de calcul des dérivées . . . . . . . . . . . . . . . . . . . 95

803
804 TABLE DES MATIÈRES

3.5 Règles de calcul des dérivées partielles . . . . . . . . . . . . . 100


3.6 C-dérivabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
3.7 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
3.8 Petite anthologie . . . . . . . . . . . . . . . . . . . . . . . . . 109

4 Fonctions continues ou dérivables 113


4.1 Propriétés locales et propriétés globales . . . . . . . . . . . . 113
4.2 P-partitions d’un pavé et lemme de Cousin . . . . . . . . . . 115
4.3 Propriété de valeur intermédiaire . . . . . . . . . . . . . . . . 121
4.4 Ouverts, fermés et bornés . . . . . . . . . . . . . . . . . . . . 126
4.5 Continuité uniforme . . . . . . . . . . . . . . . . . . . . . . . 132
4.6 Images par une fonction continue . . . . . . . . . . . . . . . . 135
4.7 Théorème des bornes atteintes et extrémants . . . . . . . . . 137
4.8 Théorèmes de Fermat et de Rolle . . . . . . . . . . . . . . . . 143
4.9 Théorème de Cauchy et règle de l’Hospital . . . . . . . . . . . 146
4.10 Théorèmes de Lagrange et de la moyenne . . . . . . . . . . . 151
4.11 Condition suffisante de dérivabilité . . . . . . . . . . . . . . . 156
4.12 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
4.13 Petite anthologie . . . . . . . . . . . . . . . . . . . . . . . . . 162

5 Fonctions implicites 165


5.1 Limites infinies et point d’accumulation . . . . . . . . . . . . 165
5.2 Critère de Cauchy . . . . . . . . . . . . . . . . . . . . . . . . 169
5.3 Itérées d’une application . . . . . . . . . . . . . . . . . . . . . 171
5.4 Théorème des applications contractantes . . . . . . . . . . . . 173
5.5 Fonctions implicites : existence . . . . . . . . . . . . . . . . . 177
5.6 Fonctions implicites : régularité . . . . . . . . . . . . . . . . . 184
5.7 Fonction réciproque . . . . . . . . . . . . . . . . . . . . . . . 187
5.8 Théorème de l’application intérieure . . . . . . . . . . . . . . 188
5.9 Extrémants liés . . . . . . . . . . . . . . . . . . . . . . . . . . 189
5.10 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194
5.11 Petite anthologie . . . . . . . . . . . . . . . . . . . . . . . . . 197

6 Fonctions monotones 199


6.1 Parties majorées ou minorées . . . . . . . . . . . . . . . . . . 199
6.2 Intervalles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205
6.3 Applications réelles . . . . . . . . . . . . . . . . . . . . . . . . 207
6.4 Fonctions monotones . . . . . . . . . . . . . . . . . . . . . . . 209
6.5 Fonction exponentielle . . . . . . . . . . . . . . . . . . . . . . 214
TABLE DES MATIÈRES 805

6.6 Fonctions monotones continues . . . . . . . . . . . . . . . . . 220


6.7 Fonctions monotones dérivables . . . . . . . . . . . . . . . . . 223
6.8 Fonctions convexes ou concaves . . . . . . . . . . . . . . . . . 225
6.9 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230
6.10 Petite anthologie . . . . . . . . . . . . . . . . . . . . . . . . . 232

7 Développement de Taylor et séries 233


7.1 Dérivées d’ordre supérieur . . . . . . . . . . . . . . . . . . . . 233
7.2 Développement de Taylor . . . . . . . . . . . . . . . . . . . . 236
7.3 Calcul de limites et de dérivées . . . . . . . . . . . . . . . . . 240
7.4 Reste de Taylor de fonctions réelles . . . . . . . . . . . . . . . 243
7.5 Extrémants locaux libres . . . . . . . . . . . . . . . . . . . . . 245
7.6 Séries . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248
7.7 Séries absolument convergentes . . . . . . . . . . . . . . . . . 253
7.8 Séries non absolument convergentes . . . . . . . . . . . . . . . 257
7.9 Série de Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . 258
7.10 Fonctions trigonométriques . . . . . . . . . . . . . . . . . . . 260
7.11 Exponentielles imaginaires et complexes . . . . . . . . . . . . 267
7.12 Dérivées partielles d’ordre supérieur . . . . . . . . . . . . . . 270
7.13 Développement de Taylor . . . . . . . . . . . . . . . . . . . . 277
7.14 Conditions d’existence d’extrémants . . . . . . . . . . . . . . 280
7.15 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283
7.16 Petite anthologie . . . . . . . . . . . . . . . . . . . . . . . . . 285

8 Equations différentielles linéaires 287


8.1 Opérateurs différentiels linéaires . . . . . . . . . . . . . . . . . 287
8.2 Equation homogène complexe . . . . . . . . . . . . . . . . . . 292
8.3 Equations non homogènes . . . . . . . . . . . . . . . . . . . . 299
8.4 Solutions réelles . . . . . . . . . . . . . . . . . . . . . . . . . . 304
8.5 Problème de Cauchy . . . . . . . . . . . . . . . . . . . . . . . 310
8.6 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 314
8.7 Petite anthologie . . . . . . . . . . . . . . . . . . . . . . . . . 317

9 Fonctions primitivables 321


9.1 Fonctions primitivables et primitives . . . . . . . . . . . . . . 321
9.2 Règles de primitivation . . . . . . . . . . . . . . . . . . . . . . 327
9.3 Primitivation des fonctions rationnelles . . . . . . . . . . . . . 331
9.4 Fonctions irrationnelles, transcendantes . . . . . . . . . . . . 336
9.5 Calcul approché des primitives . . . . . . . . . . . . . . . . . 339
806 TABLE DES MATIÈRES

9.6 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342


9.7 Petite anthologie . . . . . . . . . . . . . . . . . . . . . . . . . 343

10 Fonctions intégrables 345


10.1 Intégrabilité sur un pavé . . . . . . . . . . . . . . . . . . . . . 345
10.2 Propriétés élémentaires de l’intégrale . . . . . . . . . . . . . . 357
10.3 Additivité de l’intégrale . . . . . . . . . . . . . . . . . . . . . 362
10.4 Critère de Cauchy d’intégrabilité . . . . . . . . . . . . . . . . 365
10.5 Fonctions continues ou monotones . . . . . . . . . . . . . . . 368
10.6 Intégrale indéfinie . . . . . . . . . . . . . . . . . . . . . . . . . 372
10.7 Equations différentielles simples . . . . . . . . . . . . . . . . . 375
10.8 Lemme de Saks-Henstock . . . . . . . . . . . . . . . . . . . . 379
10.9 L-intégrabilité sur un pavé . . . . . . . . . . . . . . . . . . . . 382
10.10Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 388
10.11Petite anthologie . . . . . . . . . . . . . . . . . . . . . . . . . 391

11 Intégrale sur un intervalle et séries 395


11.1 Théorème de Hake . . . . . . . . . . . . . . . . . . . . . . . . 395
11.2 Intégrale sur un intervalle borné . . . . . . . . . . . . . . . . 399
11.3 Intégrale sur un intervalle non borné . . . . . . . . . . . . . . 411
11.4 Tests de convergence des séries . . . . . . . . . . . . . . . . . 416
11.5 Tests de la racine et du quotient . . . . . . . . . . . . . . . . 421
11.6 Séries potentielles . . . . . . . . . . . . . . . . . . . . . . . . . 425
11.7 Séries trigonométriques . . . . . . . . . . . . . . . . . . . . . 429
11.8 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433
11.9 Petite anthologie . . . . . . . . . . . . . . . . . . . . . . . . . 434

12 Suites et séries de fonctions 437


12.1 Convergence ponctuelle . . . . . . . . . . . . . . . . . . . . . 437
12.2 Convergence uniforme . . . . . . . . . . . . . . . . . . . . . . 441
12.3 Régularité de la limite uniforme . . . . . . . . . . . . . . . . . 446
12.4 Une fonction continue sans dérivée . . . . . . . . . . . . . . . 451
12.5 Somme d’une série entière . . . . . . . . . . . . . . . . . . . . 453
12.6 Equations différentielles linéaires . . . . . . . . . . . . . . . . 458
12.7 Somme d’une série trigonométrique . . . . . . . . . . . . . . . 461
12.8 Convergence monotone . . . . . . . . . . . . . . . . . . . . . . 464
12.9 Convergence majorée et minorée . . . . . . . . . . . . . . . . 473
12.10Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 480
12.11Petite anthologie . . . . . . . . . . . . . . . . . . . . . . . . . 480
TABLE DES MATIÈRES 807

13 Fonctions et ensembles mesurables 483


13.1 Intégrale sur un borné . . . . . . . . . . . . . . . . . . . . . . 483
13.2 Bornés intégrables et leur mesure . . . . . . . . . . . . . . . . 487
13.3 Additivité complète de la L-intégrale . . . . . . . . . . . . . . 491
13.4 Exemples de bornés intégrables . . . . . . . . . . . . . . . . . 493
13.5 Ensembles négligeables . . . . . . . . . . . . . . . . . . . . . . 498
13.6 Intégrabilité sur une partie non bornée . . . . . . . . . . . . . 508
13.7 Ensembles et fonctions mesurables . . . . . . . . . . . . . . . 512
13.8 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 522
13.9 Petite anthologie . . . . . . . . . . . . . . . . . . . . . . . . . 525

14 Représentations et transformations 527


14.1 Limites et continuité . . . . . . . . . . . . . . . . . . . . . . . 527
14.2 Règle de Leibniz . . . . . . . . . . . . . . . . . . . . . . . . . 531
14.3 Théorème de Fubini . . . . . . . . . . . . . . . . . . . . . . . 534
14.4 Transformations affines . . . . . . . . . . . . . . . . . . . . . . 548
14.5 Difféomorphismes . . . . . . . . . . . . . . . . . . . . . . . . . 555
14.6 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 563
14.7 Petite anthologie . . . . . . . . . . . . . . . . . . . . . . . . . 566

15 Analyse vectorielle et extérieure 569


15.1 Intégrale sur une courbe . . . . . . . . . . . . . . . . . . . . . 569
15.2 Intégrale sur une surface . . . . . . . . . . . . . . . . . . . . . 575
15.3 Circulation d’un champ vectoriel . . . . . . . . . . . . . . . . 579
15.4 Flux d’un champ vectoriel . . . . . . . . . . . . . . . . . . . . 582
15.5 Algèbre des formes extérieures . . . . . . . . . . . . . . . . . 586
15.6 Formes différentielles . . . . . . . . . . . . . . . . . . . . . . . 594
15.7 Intégrale d’une forme sur une chaı̂ne . . . . . . . . . . . . . . 605
15.8 Théorème de Stokes-Cartan . . . . . . . . . . . . . . . . . . . 613
15.9 Bords, cycles, cobords et cocycles . . . . . . . . . . . . . . . . 619
15.10Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 633
15.11Petite anthologie . . . . . . . . . . . . . . . . . . . . . . . . . 637

16 Analyse complexe 643


16.1 Intégrale sur une courbe . . . . . . . . . . . . . . . . . . . . . 643
16.2 Fonctions holomorphes, théorème de Cauchy . . . . . . . . . 645
16.3 Résidus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 648
16.4 Représentation intégrale . . . . . . . . . . . . . . . . . . . . . 651
16.5 Théorème de Taylor et fonctions analytiques . . . . . . . . . . 655
808 TABLE DES MATIÈRES

16.6 Points singuliers isolés et théorème de Laurent . . . . . . . . 659


16.7 Le théorème des résidus . . . . . . . . . . . . . . . . . . . . . 664
16.8 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 670
16.9 Petite anthologie . . . . . . . . . . . . . . . . . . . . . . . . . 671

17 Analyse fonctionnelle 675


17.1 Espaces métriques . . . . . . . . . . . . . . . . . . . . . . . . 675
17.2 Espaces vectoriels normés . . . . . . . . . . . . . . . . . . . . 677
17.3 Intérieur, adhérence, frontière . . . . . . . . . . . . . . . . . . 684
17.4 Limites et continuité . . . . . . . . . . . . . . . . . . . . . . . 686
17.5 Espaces métriques complets . . . . . . . . . . . . . . . . . . . 690
17.6 Convergence en moyenne . . . . . . . . . . . . . . . . . . . . . 695
17.7 Théorème du point fixe de Banach . . . . . . . . . . . . . . . 700
17.8 Ouverts et fermés . . . . . . . . . . . . . . . . . . . . . . . . . 703
17.9 Parties denses et espaces séparables . . . . . . . . . . . . . . . 706
17.10Bornés et compacts . . . . . . . . . . . . . . . . . . . . . . . . 716
17.11Calcul des variations . . . . . . . . . . . . . . . . . . . . . . . 728
17.12Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 738
17.13Petite anthologie . . . . . . . . . . . . . . . . . . . . . . . . . 740

18 Index historique 743

View publication stats

You might also like