Ma WH in Analyse Complet

See
discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/266367922
Analyse. Fondements, techniques, évolution.

(Analysis. Foundations, techniques,
evolution).2ème éd. 2èm....
Article
CITATIONS READS
30 602
1 author:
Jean Mawhin
Université Catholique de Louvain
518 PUBLICATIONS 10,215 CITATIONS
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
General theory of dynamical systems View project
All content following this page was uploaded by Jean Mawhin on 28 May 2015.
The user has requested enhancement of the downloaded file.

ANALYSE
Fondements, techniques, évolution
Jean Mawhin
Université Catholique de Louvain

Préface de la deuxième édition
Ce Cours d’analyse constitue la partie théorique du cours de calcul différentiel

et intégral dispensé aux étudiants de candidatures en sciences mathématiques et
physiques à l’Université Catholique de Louvain. En le publiant, nous ne faisons
que suivre une tradition illustrée à l’U.C.L. par Ph. Gilbert et Ch.J. de la Vallée
Poussin et, dans les autres universités belges, par A. Timmermans, A. Meyer, M.
Schaar, E. Catalan, P. Mansion, J. Neuberg, L. Godeaux et H.G. Garnir.
Le but de cet ouvrage est d’introduire les concepts et les résultats fondamentaux
du calcul différentiel et intégral, de développer les techniques correspondantes utiles
à tant de disciplines scientifiques, et d’ouvrir à quelques domaines importants de
l’analyse qui seront développés dans d’autres cours.
La notion de limite est le seul concept vraiment nouveau que l’analyse introduit.
Face à une opération impossible pour les opérations habituelles de l’arithmétique
ou de l’algèbre, mais pour lesquelles un procédé de résolution “approchée” existe,
on cherche à montrer que l’erreur commise peut être rendue arbitrairement petite
pour un choix approprié, et suffisamment vaste, de solutions approchées. C’est une
méthodologie proche de celle de l’expérimentateur ou du technicien, à cela près
qu’il n’y a pas de limitation a priori dans la précision.
Depuis la publication par L’Hospital, il y a exactement trois cents ans, du pre-
mier d’entre eux, la production de livres de calcul différentiel et intégral a été très
abondante. Chaque auteur doit donc se justifier en dégageant l’originalité de son
produit. Après un premier chapitre rappelant le minimum indispensable sur le lan-
gage des ensembles, les nombres et l’espace vectoriel à n dimensions, les suivants
abordent successivement les notions de limite, continuité etdérivabilité en un point
pour les fonctions d’une ou de plusieurs variables réelles, en se limitant rigoureuse-
ment aux propriétés locales. Le débutant peut ainsi se concentrer sur la définition
de limite et sur les techniques régissant son utilisation. L’ouvrage insiste plus que
d’autres sur la notion de fonction localement bornée en un point: le produit d’une
fonction ayant une limite nulle par une fonction localement bornée a une limite nulle,
et l’utilisation systématique de ce résultat simplifie la démonstration de nombreuses
propriétés. C’est en particulier le cas pour l’étude du délicat concept de dérivée
totale d’une fonction de plusieurs variables. Le passage des propriétés locales aux
propriétés globales fait appel à une variante de la compacité classique, le lemme de
Cousin, qui sera indispensable pour définir, plus loin, la notion d’intégrale. Les pro-
priétés globales des fonctions continues sont systématiquement démontrés à partir
de cette technique, qui privilégie la notion de partition ou découpage, plus concrète
peut-être que celle de recouvrement. Le théorèmes et inégalités de la moyenne pour
les fonctions dérivables sont d’autres résultats globaux importants dont découlent
de nouvelles techniques de calcul des limites. Le lemme de Cousin fournit aussi une
démonstration naturelle de l’indispensable critère de Cauchy permettant de prou-
ver l’existence d’une limite sans en connaı̂tre a priori la valeur, une caractéristique
précieuse en théorie de l’itération et dans ses applications aux fonctions implicites.
ii
Afin de minimiser, chez les débutants, les confusions trop fréquentes entre les
notions liées à l’ordre et celles liées à la distance, un chapitre regroupe les résultats
dépendant de la structure d’ordre de la droite réelle. C’est là qu’apparaissent les
fonctions monotones, les fonctions convexes et les premières fonctions transcen-
dantes élémentaires: l’exponentielle et le logarithme. La notion de dérivée d’ordre
supérieur et le développement de Taylor conduisent à l’étude des séries, permet-
tant l’introduction analytique des fonctions trigonométriques et des exponentielles
complexes. On dispose ainsi du matériel nécessaire pour aborder les équations
différentielles linéaires à coefficients constants. L’approche proposée ne fait appel
qu’à des techniques simples d’algèbre linéaire sur des espaces convenables d’ex-
ponentielles-polynômes. Le problème de Cauchy pour un système différentiel est
introduit, et l’unicité de sa solution prouvée par des considérations élémentaires.
La résolution de l’équation différentielle linéaire non homogène la plus simple
n’est rien d’autre que le problème de la primitivation d’une fonction, qu’on résoud
explicitement pour certaines classes de fonctions élémentaires, avant de se tourner,
dans le cas général, vers le concept de résolution approchée infiniment précise men-
tionné plus haut. Son interprétation géométrique conduit très naturellement à une
approche nouvelle de l’intégrale, due à Kurzweil et Henstock, que nous enseignons
depuis une vingtaine d’années. Formellement très proche de celle de Riemann,
dont elle conserve le support intuitif et la simplicité technique, cette définition
fournit une intégrale plus puissante que celle de Lebesgue capable, en particulier,
d’intégrer toutes les dérivées. Cette approche autorise une progression naturelle,
sans modification de définition, depuis le calcul intégral élémentaire jusqu’aux as-
pects avancés de l’intégrale de Lebesgue. Elle rend également inutile le concept
d’intégrale généralisée ou impropre: ce qui servait de définition à cette notion n’est
plus, ici, qu’un procédé de calcul d’une véritable intégrale. On lui rattache na-
turellement la convergence simple ou absolue des séries, ce qui permet un traite-
ment unifié des critères correspondants. On dispose alors des outils nécessaires pour
étudier la continuité, la dérivabilité et l’intégrabilité de limites de suites de fonc-
tions, les ensembles et les fonctions mesurables et les représentations intégrales des
fonctions. A cette occasion sont introduites non seulement des fonctions spéciales
classiques comme les fonctions de Bessel, les fonctions beta et gamma d’Euler, les
polynômes d’Hermite, la fonction hypergéométrique et la fonction zeta, mais aussi
des fonctions continues non dérivables, ces monstres mathématiques récemment
transformés en paradigmes scientifiques par la théorie des fractales. C’est aussi le
moment de faire les premiers pas en analyse harmonique en introduisant les séries
et intégrales de Fourier et le produit de convolution.
Après avoir défini les intégrales sur une courbe et sur une surface, les extensions
du théorème fondamental du calcul différentiel et intégral aux fonctions de plusieurs
variables (formules de Green-Riemann, Stokes-Ampère, Gauss-Ostrogradsky) sont
présentées d’une manière générale et unifiée à partir du concept de forme diffé-
rentielle, indispensable aujourd’hui aux mathématiciens et aux physiciens. Cette
élégante et féconde théorie trouve des applications directes en analyse vectorielle,
et dans l’étude globale des fonctions C-dérivables d’une variable complexe. Les
concepts fondamentaux de la théorie des fonctions holomorphes sont ainsi dégagés,
iii
pour aboutir à cette puissante technique de calcul que constitue le théorème des
résidus.
La notion d’espace métrique avec, comme cas particulier, les plus importants
espaces de Banach, est alors introduite. Elle unifie de nombreux types de passage à
la limite définis précédemment et fournit des théorèmes d’existence au problème de
Cauchy pour les systèmes différentiels. Elle mène au calcul des variations, illustra-
tion exemplaire de cette analyse fonctionnelle qui étudie les fonctions définies sur
des espaces de fonctions, et outil fondamental dans la formulation et l’étude des
lois de la mécanique et de la physique.
L’ouvrage se termine par un index historique, qui, en plus de son rôle pratique
usuel, montre que la mathématique est une oeuvre humaine en constante évolution,
esquisse quelques développements récents et formule plusieurs problèmes ouverts.
Des exemples variés illustrent les définitions, et des contre-exemples montrent la
nécessité des hypothèses de nombreux théorèmes. Ils serviront de modèles au lecteur
pour en construire lui-même de nombreux autres. A la fin de chaque chapitre sont
rassemblés des exercices, qui proposent une approche plus personnelle à quelques
compléments théoriques. Une petite anthologie rejoint les préoccupations de l’index
historique en montrant, par des citations appropriées de mathématiciens célèbres,
l’évolution de l’énoncé des grands concepts et des grands résultats du chapitre. Le
lecteur pourra juger par lui-même si, comme on peut l’espérer, cette évolution s’est
faite dans le sens d’une plus grande clarté et d’une plus grande précision.
Il reste à parler des figures, totalement absentes de cet ouvrage. Si elles ont cessé
d’être indispensables à la présentation rigoureuse de l’analyse, elles demeurent un
précieux outil de compréhension et de découverte. Absentes du support écrit, où ne
pourrait subsister que le résidu figé du processus dynamique de leur construction,
les figures sont omniprésentes dans l’exposé oral, avec la dimension temporelle, si
importante, de leur tracé. Le lecteur devra donc illustrer, par ses propres figures,
les notions et les théorèmes introduits.
Chacun sait qu’il est difficile d’apprendre une matière délicate en consultant un
seul ouvrage. Tout enseignant qui publie un livre espère susciter la lecture d’autres
traités. En se limitant à un choix restreint, mais issu d’horizons divers, on peut
citer, parmi de nombreux livres de niveau et d’esprit assez proches de celui-ci, les
références suivantes:
T. Apostol, Mathematical Analysis, Addison-Wesley, Reading, 1974,

G. Chilov, Analyse mathématique, 3 vol., Mir, Moscou, 1973,
H.G. Garnir, Fonctions de variables réelles, 2 vol., Vander, Leuven, 1970,
R. Remmert, Theory of Complex Functions, Springer, New York, 1991,
W. Rudin, Principles of Mathematical Analysis, Mc Graw-Hill, New York, 1975,
W. Walter, Analysis I und II, Springer, Berlin, 1990.
Le lecteur qui reste sur sa faim poursuivra son effort avec beaucoup de profit
en lisant l’incomparable livre
iv
L. Schwartz, Analyse, 4 vol., Hermann, Paris, 1991-1993.
Par ailleurs, les ouvrages suivants fournissent des développements, aussi diffé-
rents que remarquables, de l’analyse harmonique,
T.W. Körner, Fourier Analysis, Cambridge University Press, Cambridge, 1988,

M. Willem, Analyse harmonique réelle, Hermann, Paris, 1995,
tandis que la monographie
H. Brézis, Analyse fonctionnelle. Théorie et applications, Masson, Paris, 1983
est sans rivale pour approfondir l’analyse fonctionnelle et ses applications actuelles.
Enfin, le lecteur curieux d’histoire pourra compléter ses connaissances en con-
sultant
E. Hairer, G. Wanner, Analysis by its History, Springer, New York, 1996.
Cette deuxième édition conserve strictement la structure et le volume de la

première, qui était une version profondément transformée de l’Introduction à l’a-
nalyse publiée pour la première fois en 1979. Elle en diffère par de nombreuses
corrections de détail, des améliorations typographiques et surtout par des modi-
fications de présentation portant principalement sur la dérivée totale, le passage
du local au global, les formes différentielles et les chaı̂nes, les ensembles compacts.
Les gains d’espace qui en résultent ont permis d’enrichir cette nouvelle édition de
notions importantes comme celles de système dynamique discret, de produit de con-
volution, de fonction à variation bornée, de forme symplectique, et de résultats
utiles dans la théorie des équations différentielles comme le lemme de Gronwall,
l’équation fonctionnelle de Cauchy et le théorème de Peano.
Ce texte a bénéficié, aux différents stages de son élaboration, des critiques,
remarques et corrections de nombreux collègues, en particulier de M. Anciaux, M.
Brémond, C. Debiève, C. de Coster, Th. De Pauw, E. Giusti, P. Habets,
M. Henrard, H. Kalf, J.R. Roisin, J.P. Tignol, G. Vandenbossche (†) et
M. Willem, mais aussi, et surtout, des améliorations suggérées ou provoquées
par les étudiants de candidatures en sciences mathématiques et physiques. Les
générations futures de lecteurs et lectrices auront tout le loisir de s’illustrer à leur
tour sur la présente édition, et ils en sont remerciés d’avance.
Verviers et Louvain-la-Neuve, août 1996

Chapitre 1
Ensembles, graphes,
fonctions
1.1 Logique et ensembles : terminologie et nota-

tions
La mathématique actuelle est fondée sur la théorie des ensembles, et utilise le
langage de la logique formelle. Il n’entre pas dans notre propos de développer
ici la logique formelle et la théorie des ensembles : le point de vue naı̈f nous
suffira et nous le supposerons connu du lecteur. Rappelons simplement que,
P , Q . . . étant des propositions ou énoncés ou formules, la négation de P se
note ¬P ou non P, la disjonction de P et Q se note P ∨ Q ou P ou Q, la
conjonction de P et Q se note P ∧ Q ou P et Q, l’implication matérielle, qui
est l’abréviation de (¬P ) ∨ Q, se note P ⇒ Q et l’équivalence matérielle, qui
est l’abréviation de (P ⇒ Q) ∧ (Q ⇒ P ), se note P ⇔ Q. On a en particulier
l’équivalence suivante
(P ⇒ Q) ⇔ (¬Q ⇒ ¬P ),
qui permet parfois de simplifier la démonstration d’un théorème. La deuxi-

ème proposition dans cette équivalence s’appelle la contraposée de la premi-
ère.
Signalons également que, pour éviter des paradoxes très vite apparus dès
l’introduction, par Georg Cantor, de la notion d’ensemble à la fin du XIXe
siècle, la théorie des ensembles a dû se construire comme théorie formelle
partant des notions primitives d’ensemble et d’appartenance, représentée par
le prédicat binaire ∈ (qui se lit appartient à ou élément de) et d’une liste
1
2 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS
d’axiomes que nous n’énoncerons pas formellement et que l’on peut d’ailleurs
présenter sous plusieurs formes.
Dans l’axiomatique de Zermelo-Fraenkel, le premier axiome affirme l’e-
xistence d’un ensemble sans élément : c’est l’ensemble vide, noté ∅.
Le deuxième axiome affirme que deux ensembles sont égaux dès qu’ils
ont les mêmes éléments. Dans l’approche naı̈ve des ensembles, un ensemble
est défini en extension lorsqu’on donne la liste de ses éléments.
Le troisième axiome affirme l’existence d’un ensemble z = {x, y} dont
les éléments sont deux ensembles quelconques donnés x et y. Cet ensemble
s’appelle la paire d’éléments x et y et, si x = y, la paire {x, x} est notée plus
simplement {x} et s’appelle le singleton de x. La paire {x, {x, y}} est notée
(x, y) et s’appelle le couple (x, y).
Le quatrième axiome affirme l’existence de l’union des éléments t d’un
ensemble d’ensembles x constituée des éléments z qui appartiennent à l’un
!
des t de x; cet ensemble est noté t∈x t. Si x et y sont des ensembles, la
réunion x ∪ y des ensembles x et y est la réunion des éléments de la paire
{x, y}. De manière plus naı̈ve, on peut écrire
x ∪ y = {u : u ∈ x ou u ∈ y}.
Le cinquième axiome affirme l’existence de l’ensemble des parties de tout

ensemble x (y est une partie de x si tout élément de y est élément de x); cet
ensemble se note P(x) ou 2x et si z ∈ P(x), on écrit aussi y ⊂ x (ou parfois
y ⊆ x). Lorsque y est une partie de x différente de x, on dit que y est une
partie propre de x et l’on écrit alors y ! x (ou y ⊂ x dans le second choix de
notation). Nous adopterons la première notation dans cet ouvrage. Si a est
un ensemble non vide, on appelle intersection des éléments de a, l’ensemble,
noté ∩x∈ax ou ∩{x : x ∈ a}, formé par les éléments qui appartiennent à tous
les ensembles qui appartiennent à a. Etant donnés deux ensembles x et y,
on appelle intersection des ensembles x et y l’intersection des éléments de la
paire {x, y}; elle est notée x ∩ y. De manière plus naı̈ve, on peut écrire
x ∩ y = {u : u ∈ x et u ∈ y}.
Le sixième axiome affirme l’existence d’un ensemble x contenant ∅ et tel

que, s’il contient y il contient son “successeur” y ∪ {y}; cet axiome garantit
l’existence d’ensembles infinis .
Le septième axiome (qui est en fait une liste sans fin de formules con-
struites sur le même schéma) entraı̂ne en particulier que, pour tout ensemble
u et pour toute propriété “raisonnable” P (x) dépendant des éléments x de
1.1. LOGIQUE ET ENSEMBLES : TERMINOLOGIE ET NOTATIONS3
v et qui peut être exprimée dans le langage formel de la théorie, il existera

un sous-ensemble v formé des éléments x satisfaisant à P ; cet ensemble est
noté {x ∈ u : P (x)}. Dans l’approche naı̈ve des ensembles, on dit qu’un tel
ensemble est défini en compréhension.
Le huitième axiome, dit axiome du choix ou axiome de Zermelo, affirme
qu’il est possible de former un ensemble en choissant un élément dans chaque
ensemble d’un ensemble d’ensembles. Le neuvième axiome exclut des for-
mules comme x ∈ x.
On peut construire, à partir de ces axiomes, l’ensemble
N = {0, 1, 2, . . .}
des entiers naturels et démontrer l’important principe d’induction affirmant

que si une partie A de N contient 0 et est telle que, chaque fois que n ∈ A,
on a n + 1 ∈ A, alors A = N. On désignera également par N∗ l’ensemble
N \ {0} l’ensemble des entiers naturels strictement positifs. On rappellera
que, si x et y sont des ensembles, x \ y désigne l’ensemble des éléments de x
qui n’appartiennent pas à y. On démontre également que N est un ensemble
ordonné et que toute partie de N possède un plus petit élément.
Si une propriété P (x) (dépendant des éléments x d’un ensemble y) est
satisfaite par tous les éléments de y, on écrira
(∀x ∈ y) : P (x), (1.1)
ce qui se lit “pour tout élément x de y, la propriété P (x) est vraie” ou “quel
que soit l’élément x de y, la propriété P (x) est vraie”. Le symbole ∀ est
appelé le quantificateur universel .
Si un élément x (au moins) de y vérifie la propriété P (x), on écrira
(∃x ∈ y) : P (x), (1.2)
ce qui se lit “il existe (au moins) un élément x de y tel que la propriété P (x)
soit vraie”. Le symbole ∃ est le quantificateur existentiel .
La négation logique de la formule (1.1), ¬[(∀x ∈ y) : P (x)] est equivalente
à la formule
(∃x ∈ y) : ¬P (x),
et la négation logique de la formule (1.2), ¬[(∃x ∈ y) : P (x)] est équivalente
à la formule
(∀x ∈ y) : ¬P (x).
On voit que, pour nier (1.1) (resp. (1.2)), on a remplacé le quantificateur uni-
versel, (resp. existentiel), par le quantificateur existentiel (resp. universel),
et remplacé P (x) par sa négation ¬P (x). La proposition suivante montre
que cette règle s’étend aux formules contenant un nombre fini d’expressions
de type (∀x ∈ y), (∃u ∈ v) suivi de l’énoncé d’une propriété P dépendant
des éléments des ensembles correspondants.
Proposition. La négation d’une proposition du type
(∀x1 ∈ y1 )(∃x2 ∈ y2 )(∃x3 ∈ y3 ) . . . (∃xm−1 ∈ ym−1 )(∀xm ∈ ym ) : (1.3)
P (x1 , x2 , x3 , . . . , xm−1 , xm ),
contenant un nombre fini d’expressions du type (∀x ∈ y) ou (∃x ∈ y) suivi de
l’énoncé d’une propriété P s’obtient en remplaçant chaque ∀ par ∃, chaque
∃ par ∀ et P par ¬P .
Démonstration. Elle se fait par récurrence sur le nombre d’expressions
du type (∀x ∈ y) ou (∃x ∈ y) qui précèdent P . Nous avons admis le résultat
pour une formule contenant une seule de ces expressions. Supposons donc la
proposition vraie pour une formule de type (1.3) contenant m−1 expressions
du type (∀x ∈ y) ou (∃x ∈ y) et montrons qu’elle est vraie pour une formule
en contenant m, par exemple, pour fixer les idées, la formule (1.3). Si nous
posons
Q(x1 , . . . , xm−1 ) = (∀xm ∈ ym ) : P (x1 , . . . , xm−1 , xm ),
la formule (1.3) peut s’écrire
(∀x1 ∈ y1 )(∃x2 ∈ y2 )(∃x3 ∈ y3 ) . . . (∃xm−1 ∈ ym−1 ) : Q(x1 , . . . , xm−1 ),
et, par l’hypothèse de récurrence, sa négation est équivalente à
(∃x1 ∈ y1 )(∀x2 ∈ y2 )(∀x3 ∈ y3 ) . . . (∀xm−1 ∈ ym−1 ) : ¬Q(x1 , . . . , xm−1 ),
et donc, en vertu de la définition de Q et de ce qui précède, à
(∃x1 ∈ y1 )(∀x2 ∈ y2 )(∀x3 ∈ y3 ) . . . (∀xm−1 ∈ ym−1 )(∃xm ∈ ym ) :
¬P (x1 , . . . , xm ).
1.2. GRAPHES, FONCTIONS, APPLICATIONS 5
Remarque. On a évidemment les équivalences
(∀x ∈ y)(∀u ∈ v) ⇔ (∀u ∈ v)(∀x ∈ y),
et
(∃x ∈ y)(∃u ∈ v) ⇔ (∃u ∈ v)(∃x ∈ y),
mais une permutation de quantificateurs consécutifs d’espèces différentes
modifie le sens de la formule.
1.2 Graphes, fonctions, applications

A partir d’ici nous utiliserons la convention usuelle consistant à désigner les
ensembles par des capitales et leurs éléments par des minuscules. Soient E et
F deux ensembles non vides. Rappelons que le produit cartésien ou produit
ensembliste de E par F , noté E × F , est l’ensemble des couples (a, b) tels
que a ∈ E et b ∈ F ; formellement,
E × F = {(a, b) : a ∈ E et b ∈ F }.
Définition. Un graphe ou relation de E vers F est une partie de E × F .

Si G ⊂ E × F est un graphe de E vers F , le domaine de G est l’ensemble
dom G défini par
dom G = {a ∈ E : (∃b ∈ F ) : (a, b) ∈ G},
et l’image de G est l’ensemble im G défini par
im G = {b ∈ F : (∃a ∈ E) : (a, b) ∈ G}.
Le graphe réciproque G−1 de G est le graphe de F dans E défini par
G−1 = {(b, a) ∈ F × E : (a, b) ∈ G}.
Exemples. Si b ∈ F , E × {b} est un graphe de E dans F appelé graphe

constant de E dans F , et si a ∈ E, alors {a} × F est un graphe de E dans
F que l’on peut appeler graphe vertical de E dans F . Le graphe réciproque
d’un graphe constant est un graphe vertical, et le graphe réciproque d’un
graphe vertical est un graphe constant.
On vérifie sans peine que
dom G−1 = im G, im G−1 = dom G.

Si a ∈ dom G, on dit encore que G est défini en a, et si b ∈ im G, on dit que

b est une valeur prise par G. En particulier, on dira que le graphe G de E
dans F est partout défini si dom G = E. Donc G−1 est partout défini si et
seulement si dom G−1 = F , c’est-à-dire si et seulement si im G = F . On est
ainsi conduit à la définition suivante.
Définition. On dit que le graphe G de E dans F est surjectif si im G = F .
Ainsi donc, G (resp. G−1 ) est partout défini si et seulement si G−1 (resp.
G) est surjectif.
Si A ⊂ E, l’ensemble G|A défini par
G|A = G ∩ (A × F ),
est évidemment encore un graphe de E dans F qui s’appelle la restriction de
G à A. Son image im G|A s’appelle l’image (directe) de A par G et se note
G(A). Si B ⊂ F , on appelle image réciproque de B par G l’image G−1 (B)
de B par le graphe réciproque G−1 . Par conséquent,
G(A) = {b ∈ F : (∃a ∈ A) : (a, b) ∈ G},
G−1 (B) = {a ∈ E : (∃b ∈ B) : (b, a) ∈ G−1 }
= {a ∈ E : (∃b ∈ B) : (a, b) ∈ G}.
En particulier, si A = {a} où a ∈ E, G({a}) est appelée l’image de a par G.
On notera que G({a}) /= ∅ si et seulement si a ∈ dom G.
Si G et H sont deux graphes de E dans F tels que G ⊂ H, on dit que
H est un prolongement de G ou encore que G est une restriction de H.
Définissons aussi l’importante notion de composé de deux graphes.
Définition. Soient D, E, F des ensembles, G un graphe de D dans E et H
un graphe de E dans F . Le composé H ◦ G de H et G est le graphe de D
dans F défini par
H ◦ G = {(a, c) ∈ D × F : (∃b ∈ E) : (a, b) ∈ G et (b, c) ∈ H}.
Le lecteur vérifiera aisément les égalités suivantes :
dom (H ◦ G) = {a ∈ dom G : G({a}) ∩ dom H /= ∅},
im (H ◦ G) = H(im G).
Il vérifiera aussi sans peine que le composé de deux graphes partout définis
est partout défini et que le composé de deux graphes surjectifs est surjectif.
Introduisons maintenant un type particulier de graphe qui joue un rôle
essentiel en analyse mathématique.
Définition. Un graphe G de E dans F est dit fonctionnel ou est appelé une

fonction de E dans F si, pour chaque a ∈ E, il existe au plus un b ∈ F tel
que (a, b) ∈ G, c’est-à-dire si les relations (a, b) ∈ G et (a, b$) ∈ G entraı̂nent
que b = b$ .
En d’autres termes, G est une fonction de E dans F si et seulement si,
pour chaque a ∈ E, G({a}) est soit vide, soit un singleton, ou encore si et
seulement si, pour chaque a ∈ dom G, G({a}) est un singleton. Dans ce cas,
G({a}) est donc de la forme {b} pour un certain élément b de F que l’on
notera G(a) et qu’on appellera l’image de a par G ou encore la valeur de la
fonction G en a.
Exemples. Un graphe constant de E dans F est toujours une fonction de
E dans F ; un graphe vertical de E dans F est une fonction de E dans F si
et seulement si F est un singleton.
Pour désigner une fonction G de E dans F , on utilise souvent la notation
G : dom G ⊂ E → F, a 2→ G(a),
qui met en évidence la valeur G(a) de G en a ∈ dom G.
Le caractère fonctionnel d’un graphe se conserve par composition.
Proposition. Si G est une fonction de D dans E et H une fonction de E
dans F , alors H ◦ G est une fonction de D dans F .
Démonstration. Soit a ∈ dom (H ◦ G) et soient c ∈ F et c$ ∈ F tels
que (a, c) ∈ H ◦ G et (a, c$) ∈ H ◦ G. Par définition du composé, il existe
b ∈ E tel que (a, b) ∈ G et (b, c) ∈ H et il existe b$ ∈ E tel que (a, b$ ) ∈ G et
(b$ , c$) ∈ H. Comme G est une fonction, on a nécessairement b = b$ et dès
lors, comme H est une fonction, on a nécessairement c = c$ .
On pourra donc parler de la fonction composée de deux fonctions, et la
démonstration ci-dessus montre que, si a ∈ dom (H ◦ G), alors (H ◦ G)(a) =
H(G(a)).
Même si G est une fonction de E dans F , l’exemple du graphe constant
avec E différent d’un singleton montre que le graphe réciproque G−1 (qui
est un graphe vertical) n’est pas nécessairement une fonction. Si G est un
graphe de E dans F , G−1 sera une fonction si et seulement si
(b, a) ∈ G−1 et (b, a$ ) ∈ G−1 ⇒ a = a$ ,
c’est-à-dire si et seulement si
(a, b) ∈ G et (a$ , b) ∈ G ⇒ a = a$ . (1.4)
On est ainsi conduit à la définition suivante.
Définition. Soit G un graphe de E dans F . On dit que G est injectif si la

condition (1.4) est satisfaite.
Ainsi donc, G−1 est un graphe fonctionnel si et seulement si G est un
graphe injectif.
On a la caractérisation suivante des graphes injectifs.
Proposition. Le graphe G de E dans F est injectif si et seulement si, pour
chaque a ∈ E et chaque a$ ∈ E tel que a$ =
/ a, on a G({a}) ∩ G({a$ }) = ∅.
Démonstration. La condition nécessaire et suffisante d’injectivité que
nous voulons démontrer est équivalente, par contraposition, à la condition
(∀a ∈ E)(∀a$ ∈ E) : G({a}) ∩ G({a$ }) /= ∅ ⇒ a = a$ ,
et donc à la condition
(∀a ∈ E)(∀a$ ∈ E) : (a, b) ∈ G et (a$ , b) ∈ G ⇒ a = a$ ,
c’est-à-dire à la définition d’injectivité.

On en déduit facilement que la composition de graphes préserve l’injecti-
vité.
Proposition. Si G est un graphe injectif de D dans E et H un graphe
injectif de E dans F , alors H ◦ G est un graphe injectif de D dans F .
Un graphe fonctionnel injectif est appelé une fonction injective ou une
injection. G est donc une injection si et seulement si
a ∈ dom G, a$ ∈ dom G et G(a) = G(a$ ) ⇒ a = a$ ,
ou encore, si et seulement si
(∀a ∈ dom G)(∀a$ ∈ dom G : a /= a$ ) : G(a) /= G(a$ ).
Les propositions qui précèdent montrent que G est une injection de E dans
F si et seulement si G−1 est une injection de F dans E et que le composé
de deux injections est une injection. Lorsque G est une injection de E dans
F , G−1 est appelée la fonction réciproque de G.
Un graphe fonctionnel G de E dans F partout défini est appelé une
application de E dans F , et noté
G : E → F, a 2→ G(a).
Bien entendu, si G est une fonction de E dans F , alors G|dom G est une
application de dom G dans F : toute fonction restreinte à son domaine de-
vient une application. D’autre part, si G est une application injective de E
dans F , on sait que G−1 est une fonction de F dans E et des exemples sim-
ples montrent que G−1 n’est pas nécessairement une application de F dans
E. Ainsi, si E = {a1 , a2, a3 }, F = {a1 , a2 , a3 , a4 } et si G est l’application
injective de E dans F définie par
G : E → F, ai 2→ ai (i = 1, 2, 3)
alors la fonction inverse G−1 n’est pas définie en a4 et n’est donc pas une
application de F dans E. Si G est une application injective de E dans F ,
G−1 sera une application de F dans E si et seulement im G = F , c’est-à-dire
si et seulement si G est surjectif. Un graphe fonctionnel surjectif G de E
dans F est appelé une fonction surjective ou une surjection de E sur F . En
combinant les propriétés des graphes déjà obtenues, on voit facilement que
G est une application injective et surjective de E sur F si et seulement si
G−1 est une application surjective de F sur E.
Une application injective et surjective G de E dans F est appelée une
application bijective ou bijection de E sur F . En combinant les propriétés
de conservation du caractère fonctionnel, du caractère partout défini, de
l’injectivité et de la surjectivité par passage au composé, on obtient immédia-
tement le résultat suivant.
Proposition. Si G est une bijection de D sur E et H une bijection de E

sur F , alors H ◦ G est une bijection de D sur F .
Il existe, pour les applications, une variante terminologique souvent utili-

sée en mathématiques. Si I est un ensemble, que l’on appellera ensemble des
indices, et E un ensemble, une application G de I dans E est parfois appelée
famille d’éléments de E indicée par I et, au lieu de la notation canonique
G : I → E, i 2→ G(i),
on utilise la notation
G : I → E, i 2→ Gi ,
ou encore la notation compacte (Gi)i∈I . En particulier, une famille d’élé-

ments de E indicée par N ou N∗ est appelée une suite dans E ou encore une
suite d’éléments de E, et notée en abrégé (Gk )k∈N ou (Gk )k∈N∗ selon le cas.
1.3 Ensembles finis, infinis, dénombrables

La notion de bijection permet de “comparer” les ensembles. Soient E et F
des ensembles.
Définition. On dit que E est équipotent à F s’il existe une bijection B de
E sur F .
Il en résulte aussitôt que E est équipotent à E (prendre B définie par
B(a) = a pour chaque a ∈ E), que E est équipotent à F si et seulement si F
est équipotent à E (puisque B est une bijection de E sur F si et seulement
si B −1 est une bijection de F sur E) et que si E est équipotent à F et F
équipotent à l’ensemble G, alors E est équipotent à G (puisque le composé
de deux bijections est une bijection). La relation “est équipotent à” est donc
une relation d’équivalence.
Pour chaque n ∈ N∗ , posons Jn = {1, 2, . . . , n}, et, pour unifier les
notations dans ce qui suit, posons J0 = ∅. On vérifiera facilement que Jn est
équipotent à Jm si et seulement si m = n.
Définition. On dit que l’ensemble E est fini s’il existe n ∈ N tel que E soit
équipotent à Jn . Dans le cas contraire, E est dit infini.
Les éléments d’un ensemble fini non vide pourront donc être ”numérotés”
par les entiers 1, 2, . . ., n pour un certain entier n. La remarque précédant la
définition montre que l’entier n ainsi associé à un ensemble fini E est unique;
on l’appelle le nombre d’éléments ou le cardinal de E et on le note # E.
Proposition. Si E est fini et s’il existe une bijection C de E sur l’ensemble
F , alors F est fini et # E = # F .
Démonstration. Si # E = n, il existe une bijection B de E sur Jn , et
donc B ◦ C −1 est une bijection de F sur Jn .
Corollaire. Si E est infini et s’il existe une bijection B de E sur F , alors

F est infini.
Démonstration. Si F est fini, E l’est aussi par la proposition précédente,
ce qui contredit l’hypothèse.
La définition d’ensemble fini entraı̂ne qu’un ensemble fini ne peut être
équipotent à aucune de ses parties propres (cette propriété peut d’ailleurs
être prise comme définition d’un ensemble fini). L’existence de la bijection
B : N → 2N, n 2→ 2n,
1.3. ENSEMBLES FINIS, INFINIS, DÉNOMBRABLES 11
de l’ensemble des entiers naturels sur l’ensemble 2N des entiers naturels pairs,
partie propre de N, montre que N est infini.
Introduisons maintenant une importante classe d’ensembles infinis. In-
tuitivement, ce sont les ensembles infinis dont les éléments peuvent être
“numérotés” par tous les entiers naturels.
Définition. On dit que l’ensemble E est dénombrable s’il est équipotent à
N.
Comme N est infini, un ensemble dénombrable est évidemment infini. Si
B : N → E est la bijection donc l’existence est assurée par la définition, on
aura donc E = {B(n) : n ∈ N} = {B(0), B(1), . . .}.
Ainsi, les ensembles 2N et N∗ sont dénombrables (prendre respectivement
les applications B définies sur N par B(n) = 2n et B(n) = n + 1 pour chaque
n ∈ N). De même, l’ensemble N × N est dénombrable, puisque l’application
(m + n)(m + n + 1)
B : N × N → N, (m, n) 2→ +n
2
est bijective. Elle correspond en effet au schéma de numérotation suivant
l(l+1) l(l+1) l(l+1)
0 1 2 ... 2 +1 2 +2 ... 2 +l ...
(0, 0) (1, 0) (0, 1) . . . (l, 0) (l − 1, 1) . . . (0, l) ...
qui consiste, sur le tableau suivant suivant “représentant” N × N,
(0, 0) (0, 1) (0, 2) (0, 3) (0, 4) ...

(1, 0) (1, 1) (1, 2) (1, 3) (1, 4) ...
(2, 0) (2, 1) (2, 2) (2, 3) (2, 4) ...
(3, 0) (3, 1) (3, 2) (3, 3) (3, 4) ...
(4, 0) (4, 1) (4, 2) (4, 3) (4, 4) ...
.. .. .. .. .. ..
. . . . . .
à associer un élément de type (l, 0) à l’entier constitué du nombre d’éléments

du tableau situés au dessus de la diagonale passant par (l, 0) (c’est-à-dire
1 + 2 + . . . + l = l(l + 1)/2), à numéroter successivement les éléments de
cette diagonale en ajoutant 1 au numéro de l’élément qui précède jusqu’à ce
qu’on arrive à l’élément de la première ligne, à revenir à l’élément (l + 1, 0)
et répéter le même processus.
Remarquons qu’un raisonnement strictement analogue permet de mon-
trer que le produit cartésien de deux ensembles dénombrables est dénombra-
ble.
Le résultat suivant permet de construire de nombreux ensembles dénom-

brables et montre qu’intuitivement, les ensembles dénombrables sont les
“plus petits” ensembles infinis que l’on puisse considérer.
Proposition. Toute partie infinie d’un ensemble dénombrable est dénom-
brable.
Démonstration. Soit E un ensemble dénombrable et A une partie infinie
de E. Il existe donc une bijection B : E → N. Comme A est infini, l’ensemble
B(A) est une partie infinie de N. Soit n0 le plus petit élément de B(A), n1 le
plus petit élément de B(A) \ {n0 }, et, de proche en proche, nk le plus petit
élément de B(A)\{n0 , n1 , . . . , nk−1 }. Comme B(A) est infini, on définit ainsi
une bijection C : N → B(A), k 2→ nk , qui fournit la bijection C ◦ B de A sur
N et montre que A est dénombrable.
Corollaire. Tout ensemble contenant une partie infinie non dénombrable

est infini non dénombrable.
Définition. On dira qu’un ensemble E est au plus dénombrable s’il est fini
ou dénombrable.
On vérifie aisément que E est au plus dénombrable s’il existe une surjec-
tion de N sur E.
Il est évident que toute partie d’un ensemble au plus dénombrable est
au plus dénombrable. Le résultat suivant montre qu’une union dénombrable
d’ensembles au plus dénombrables est encore au plus dénombrable.
Proposition. Soit (En )n∈N une suite d’ensembles En telle que chaque En
!
soit au plus dénombrable. Alors l’ensemble E = n∈N En est au plus
dénombrable.
Démonstration. Par hypothèse, pour chaque n ∈ N, il existe une surjec-
tion Bn : N → En . Il en résulte que l’application
B : N × N → E, (n, m) 2→ Bn (m)
est également surjective. Comme on a vu plus haut qu’il existe une bijection
C : N → N × N, on obtient une surjection B ◦ C de N sur E.
1.4 Nombres réels

Nous ne reviendrons pas ici sur les extensions de la notion de nombre obtenu-
es à partir de N et supposerons connus l’ensemble Z des entiers relatifs, l’en-
semble Q des nombres rationnels et leurs propriétés. On sait que N ! Z ! Q
1.4. NOMBRES RÉELS 13
et que l’on peut construire un ensemble R, l’ensemble des nombres réels, ou,
brièvement, des réels, qui contient strictement Q et possède les propriétés
suivantes. Nous n’aborderons pas ici le problème de la construction de R.
L’ensemble des réels ou corps des réels ou champ des réels est un ensem-
ble, noté R, pour lequel sont définies :
1) deux applications A et M de R × R dans R, respectivement appelées
l’addition et la multiplication sur R et pour lesquelles on peut utiliser respec-
tivement les notations A(x, y) = x + y et M (x, y) = x.y ou M (x, y) = xy ou
M (x, y) = x × y, qui se lisent respectivement x plus y et x fois y;
2) une relation G dite relation d’ordre de R dans R notée x ≤ y (ou
y ≥ x) si et seulement si (x, y) ∈ G, qui se lit x inférieur à y (ou y supérieur
à x);
qui vérifient les quatre groupes de propriétés suivantes.
(I) R est un corps commutatif ou champ.
En d’autres termes :
(i) pour tout x ∈ R, y ∈ R et z ∈ R, on a
x + y = y + x, x + (y + z) = (x + y) + z,
xy = yx, x(yz) = (xy)z, x(y + z) = xy + xz;

(ii) il existe un élément 0 ∈ R tel que, pour tout x ∈ R, on ait 0 + x = x;
(iii) pour chaque x ∈ R il existe un unique réel, noté −x tel que x+(−x) = 0;
(iv) il existe un élément 1 /= 0 dans R tel que, pour tout x ∈ R, on ait
1.x = x :
(v) pour chaque x /= 0 dans R, il existe un unique réel noté x−1 ou x1 tel que
x.x−1 = 1.
(II) R est un corps ordonné.
En d’autres termes :
(i) pour tout x ∈ R, y ∈ R et z ∈ R, les relations x ≤ y et y ≤ z impliquent
la relation x ≤ z;
(ii) pour tout x ∈ R et y ∈ R, ”x ≤ y et y ≤ x” équivaut à x = y;
(iii) pour chaque x ∈ R et chaque y ∈ R, on a x ≤ y ou y ≤ x;
(iv) pour tout x ∈ R, y ∈ R et z ∈ R, la relation x ≤ y implique la relation
x + z ≤ y + z;
(v) pour tout x ∈ R tel que x ≥ 0 et tout y ∈ R tel que y ≥ 0, on a xy ≥ 0.
La relation x ≤ y et x /= y s’écrira x < y ou y > x et se lira x strictement
inférieur à y ou y strictement supérieur à x. Si a < b sont deux réels,
l’ensemble
{x ∈ R : a < x < b}
sera appelé intervalle ouvert d’origine a et d’extrémité b et sera désigné par

]a, b[; l’ensemble
{x ∈ R : a ≤ x ≤ b}
sera appelé intervalle fermé d’origine a et d’extrémité b et sera désigné par
[a, b]; l’ensemble
{x ∈ R : a < x ≤ b} (resp.{x ∈ R : a ≤ x < b})
sera appelé un intervalle semi-ouvert ou semi-fermé et désigné par ]a, b]

(resp. [a, b[).
(III) R est un corps ordonné archimédien,
c’est-à-dire qu’il satisfait au théorème d’Archimède: pour tout réel x > 0
et tout réel y ≥ 0, il existe un entier m tel que mx ≥ y.
(IV) R est un corps complet,
c’est-à-dire qu’il vérifie le théorème des intervalles fermés emboı̂tés:
si ([ak , bk ])k∈N est une suite d’intervalles fermés tels que, pour tout k ∈ N,
on ait [ak+1 , bk+1 ] ⊂ [ak , bk ], alors
"
[ak , bk ] /= ∅.
k∈N
En d’autres termes, si les suites dans R (ak )k∈N et (bk )k∈N sont telles
que, pour chaque k ∈ N, on ait ak ≤ ak+1 < bk+1 ≤ bk , alors il existe au
moins un réel c tel que, pour chaque k ∈ N, on ait c ∈ [ak , bk ].
Rappelons que Q est formé du sous-ensemble des éléments de R qui
peuvent s’écrire sous la forme ± m
n où m ∈ N et n ∈ N .
∗
Proposition. L’ensemble Q des rationnels est dénombrable.

Démonstration. Comme Q ⊃ N, Q est infini et il suffit de montrer
qu’il est au plus dénombrable, ce qui sera le cas si l’on montre que Q+ =
{x ∈ Q : x ≥ 0} est au plus dénombrable, puisque Q = Q+ ∪ Q− avec
Q− = {x ∈ Q : x ≤ 0} et Q− est évidemment équipotent à Q+ . L’application
B : N × N∗ → Q+ est une surjection, et, comme N × N∗ est dénombrable, Q
est au plus dénombrable.
Donnons maintenant quelques conséquences importantes des propriétés
des réels. La première résulte des propriétés de l’ordre.
Proposition. Si b > c sont deux réels, il existe un réel ! > 0 tel que b > c+!.
Démonstration. Par hypothèse, b − c > 0 et dès lors b − c > b−c
2 > 0; il
suffit donc de prendre ! = b−c
2 .
Corollaire. Soient b et c des réels. Alors b ≤ c si et seulement si, pour tout

! > 0, on a b ≤ c + !.
Démonstration. Condition nécessaire. Si b ≤ c et ! > 0 est donné, on a
évidemment b ≤ c + !.
Condition suffisante. Elle est équivalente à sa contraposée, qui n’est rien
d’autre que la proposition précédente.
Démontrons maintenant une conséquence du théorème d’Archimède ex-
primant la propriété de densité des rationnels dans les réels.
Proposition. Tout invervalle ouvert de R contient un ensemble infini de
rationnels.
Démonstration. Montrons d’abord qu’il suffit de démontrer que tout
intervalle ouvert de R contient au moins un rationnel. En effet, s’il en est
ainsi et si c1 ∈ ]a, b[ est rationnel, alors ]a, c1[ contiendra un rationnel c2
et, en continuant de la sorte, on obtient un ensemble infini {ci : i ∈ N} de
rationnels contenus dans ]a, b[. Pour démontrer maintenant que ]a, b[ contient
au moins un rationnel, on peut supposer sans perte de généralité que b > 0,
car, dans le cas contraire, il suffit de considérer l’intervalle ] − b, −a[ dont
l’extrémité −a est strictement positive et de noter que si c ∈ ] − b, −a[, alors
−c ∈ ]a, b[. La démonstration consiste maintenant à déterminer un n ∈ N∗
et un m ∈ N tels que a < m n < b. Comme b − a > 0, le théorème d’Archimède
implique l’existence d’un entier n ≥ 1 tel que n(b − a) ≥ 2 et donc tel que
n(b − a) > 1, ou encore
1
b−a> . (1.5)
n
Comme b > 0, le même théorème d’Archimède entraı̂ne l’existence d’un
entier naturel k ≥ 1 tel que nk ≥ b. Désignons par h le plus petit entier
naturel ayant cette propriété. On a donc
h−1 h
< b, ≥ b. (1.6)
n n
En utilisant (1.5) et la deuxième inégalité de (1.6), on obtient
h 1
−a > ,
n n
c’est-à-dire a < h−1
n . En vertu de la première inégalité de (1.6), il suffit donc
de prendre m = h − 1.
Donnons maintenant une conséquence importante du théorème des in-

tervalles fermés emboı̂tés : l’existence d’ensembles infinis non dénombrables.
Proposition. Si a < b sont des réels, l’intervalle fermé [a, b] n’est pas
dénombrable.
Démonstration. Supposons que [a, b] soit dénombrable et soit B : N →
[a, b] une bijection fournie par la définition. Pour simplifier les notations,
nous poserons, pour chaque n ∈ N, xn = B(n). Notons que si c ∈ [a, b]
et que l’on divise [a, b] en trois intervalles fermés de même longueur, l’un
d’entre eux au moins ne contiendra pas c.
Cela étant, divisons [a, b] en trois intervalles fermés de même longueur et
soit [a0 , b0] l’un d’eux tel que x0 /∈ [a0 , b0]. Si x1 /∈ [a0 , b0], prenons [a1 , b1] =
[a0 , b0 ], tandis que si x1 ∈ [a0 , b0], divisons [a0 , b0 ] en trois intervalles fermés
de même longueur et prenons pour [a1 , b1] l’un deux tel que x1 /∈ [a1 , b1 ].
Ayant ainsi construit
[ak−1 , bk−1] ⊂ [ak−2 , bk−2 ] ⊂ . . . ⊂ [a1 , b1] ⊂ [a0 , b0] ⊂ [a, b],
tels que,
xj /∈ [aj , bj ], (1 ≤ j ≤ k − 1),
prenons [ak , bk ] = [ak−1 , bk−1 ] si xk /∈ [ak−1 , bk−1] tandis que, si xk ∈
[ak−1 , bk−1], divisons [ak−1 , bk−1] en trois intervalles fermés de même lon-
gueur et prenons pour [ak , bk ] l’un d’entre eux qui ne contient pas xk . En
continuant de la sorte, on obtient une suite ([ak , bk ])k∈N d’intervalles fermés
emboı̂tés contenus dans [a, b] et tels que, pour chaque k ∈ N, xk /∈ [ak , bk ].
Le théorème des intervalles emboı̂tés implique l’existence d’un réel c appar-
tenant à chaque intervalle [ak , bk ], (k ∈ N). Dès lors, cet élément c de [a, b]
est différent de xk pour chaque k ∈ N, ce qui contredit la définition de B.
Corollaire. Tout intervalle de R et R lui-même sont des ensembles non

dénombrables.
Démonstration. Ces ensembles contiennent en effet un intervalle fermé.
Corollaire. Tout intervalle de R contient un nombre rationnel et un nombre

irrationnel.
Démonstration. Tout intervalle I de R contient un intervalle ouvert qui
contient lui-même un rationnel. Si I ne contient pas d’irrationnel, alors
I ⊂ Q est au plus dénombrable, ce qui contredit le Corollaire précédent.
Nous avons donc démontré l’existence, à côté des ensembles infinis dé-
nombrables, d’ensembles infinis non dénombrables équipotents à R. On dit
qu’ils ont la puissance du continu. Le créateur de la théorie des ensem-
bles, Georg Cantor, et ses successeurs ont cherché sans succès à montrer
l’existence de parties infinies de R non dénombrables et non équipotentes à R
et ont été amenés à formuler la célèbre hypothèse du continu : tout ensemble
infini non dénombrable possède une partie équipotente à R. Paul Cohen
a démontré en 1962 que l’hypothèse du continu était indécidable (c’est-à-
dire ni vraie ni fausse) dans le cadre de la théorie des ensembles : on peut
ajouter indifféremment aux axiomes de la théorie des ensembles l’hypothèse
du continu ou sa négation et obtenir des théories ayant la même cohérence.
Définissons maintenant l’importante notion de valeur absolue d’un réel.
Définition. La valeur absolue du réel x, notée |x|, est le réel positif défini
par |x| = x si x ≥ 0 et |x| = −x si x < 0.
Il résulte aussitôt de cette définition que, pour tout x ∈ R, on a |x| = |−x|
et que |x| = 0 si et seulement si x = 0. En outre, il est très facile de montrer
que, a > 0 et x ∈ R étant donnés, on a les équivalences
|x| ≤ a ⇔ −a ≤ x ≤ a ⇔ x ∈ [−a, a],
|x| < a ⇔ −a < x < a ⇔ x ∈ ] − a, a[.

Dans la représentation géométrique de R, qui consiste à associer à chaque
réel x le point d’abscisse x sur une droite orientée munie d’une origine, |x|
représente la longueur du segment de droite joignant 0 à x. Dès lors, si x ∈ R
et y ∈ R, |x − y| représente la distance entre les points correspondants à x
et à y sur la droite.
Les inégalités suivantes, qui expriment les relations entre l’addition, la
soustraction et la valeur absolue, sont fondamentales.
Proposition. Pour tout x ∈ R et tout y ∈ R, on a
|x + y| ≤ |x| + |y|, ||x| − |y|| ≤ |x − y|.
Démonstration. Démonstrons tout d’abord la première inégalité. Si x ≥

0 et y ≥ 0, alors, en utilisant les propriétés (II), on a x + y ≥ 0 + y = y ≥ 0,
et dès lors |x + y| = x + y = |x| + |y|. On procède de même si x ≤ 0 et y ≤ 0.
Si x ≤ 0 ≤ y, alors
x + y ≤ 0 + y = y = |y| = |y| + 0 ≤ |y| + |x| = |x| + |y|,

x + y ≥ x + 0 = x = −(−x) = −|x| = −|x| + 0 ≥ −|x| − |y| = −(|x| + |y|).

Par conséquent, −(|x| + |y|) ≤ x + y ≤ |x| + |y|, c’est-à-dire la thèse. Si
y ≤ 0 ≤ x, il suffit d’intervertir x et y. Pour la seconde inégalité, en utilisant
la première et les égalités
x = (x − y) + y, y = (y − x) + x,
on obtient
|x| ≤ |x − y| + |y|, |y| ≤ |y − x| + |x| = |x − y| + |x|,
et dès lors
|x| − |y| ≤ |x − y|, |x| − |y| ≥ −|x − y|,
ce qui équivaut à la seconde inégalité.
Remarque. On déduit aussitôt, de proche en proche, de la Proposition
précédente, que si x1 , x2 , . . ., xn sont des réels, alors
# #
#$n # $ n
# #
# xi # ≤ |xi|.
# #
i=1 i=1
La propriété suivante exprime les relations entre valeur absolue et mul-

tiplication.
|xy| = |x||y|.
Démonstration. Si x ≥ 0 et y ≥ 0, alors xy ≥ 0 et
|xy| = xy = |x||y|.
Si x ≤ 0 ≤ y, alors, en utilisant le premier cas,
|xy| = | − (xy)| = |(−x)y| = |(−x)||y| = |x||y|.
Le cas où y ≤ 0 ≤ x s’en déduit en intervertissant x et y. Enfin, si x ≤ 0 et

y ≤ 0, on a
|xy| = |(−x)(−y)| = |(−x)||(−y)| = |x||y|.
1.5. L’ESPACE VECTORIEL NORMÉ RN 19
Si nous posons R+ = {x ∈ R : x ≥ 0}, la notion de valeur absolue d’un

réel permet de définir comme suit sur R l’application valeur absolue
| · | : R → R+ , x 2→ |x|,
vérifiant les propriétés suivantes :

1) pour chaque réel x, |x| = 0 ⇔ x = 0;
2) pour chaque c ∈ R et chaque x ∈ R, on a |cx| = |c||x|;
3) pour chaque x ∈ R et chaque y ∈ R, on a |x + y| ≤ |x| + |y|.
Enfin, la condition d’annulation suivante est souvent utile.
Proposition. Soit a un réel. Alors a = 0 si et seulement si, pour tout ! > 0,
on a |a| ≤ !.
Démonstration. La condition nécessaire est évidente. La condition suf-
fisante résulte d’une condition nécessaire et suffisante pour que b ≤ c vue
plus haut; il suffit de prendre c = 0 et b = |a|.
1.5 L’espace vectoriel normé Rn

L’étude des fonctions de plusieurs variables et des fonctions à valeurs vecto-
rielles gagne en clarté et en concision par l’emploi du langage géométrique
lié à l’espace vectoriel Rn .
Si n ≥ 1 est un entier, nous désignerons par Rn le produit cartésien
R × R × . . . R de n copies de R. Rn est donc l’ensemble des n-uples ordonnés
(x1 , x2 , . . . , xn ) de nombres réels. Un élément x = (x1 , x2 , . . ., xn ) de Rn est
souvent appelé un point de Rn et, pour chaque 1 ≤ i ≤ n, xi s’appelle la ie
composante de x. En définissant les applications
Rn × Rn → Rn , (x, y) 2→ x + y = (x1 + y1 , . . . , xn + yn ),
R × Rn → Rn , (c, x) 2→ cx = (cx1 , . . . , cxn),

respectivement appelées somme de deux éléments de Rn et multiplication
d’un élément de Rn par un réel, on vérifie aisément qu’on munit Rn d’une
structure d’espace vectoriel sur le corps R. Lorsque n = 1, ces applica-
tions se réduisent respectivement à l’addition et à la multiplication usuelles.
L’élément (0, . . ., 0) de Rn sera noté 0. L’espace vectoriel Rn est de dimen-
sion n et les points
e1 = (1, 0, . . ., 0), e2 = (0, 1, 0, . . ., 0), . . ., en = (0, . . ., 0, 1)

de Rn forment une base algébrique de cet espace vectoriel qui est appelée
base canonique. Tout élément x de Rn peut en effet s’écrire
n
$
x = x1 e1 + . . . + xn en = xi ei .
i=1
Pour chaque 1 ≤ i ≤ n, on appellera projection sur la ie composante

l’application
pi : Rn → R, x 2→ xi .
Comme, pour chaque x ∈ Rn , y ∈ Rn et c ∈ R, on a
pi (x + y) = (x + y)i = xi + yi = pi (x) + pi (y),
pi (cx) = (cx)i = cxi ,

on voit que pi est une application linéaire de Rn dans R. Nous n’insisterons
pas davantage ici sur la structure algébrique de Rn ni sur son interprétation
géométrique lorsque n = 1, 2 ou 3.
La définition suivante s’inspire des propriétés de l’application valeur ab-
solue sur R.
Définition. Si E est un espace vectoriel sur R, on appelle norme sur E
toute application
6 · 6 : E → R+ , x →
2 6x6,
vérifiant les conditions suivantes :
1) pour chaque x ∈ E, on a 6x6 = 0 ⇔ x = 0;
2) pour chaque c ∈ R et chaque x ∈ E, on a 6cx6 = |c|6x6;
3) pour chaque x ∈ E et chaque y ∈ E, on a 6x + y6 ≤ 6x6 + 6y6.
Un espace vectoriel E muni d’une telle norme est dit un espace vectoriel
normé . Il est clair que R muni de l’application valeur absolue est un espace
vectoriel normé. Nous allons voir que l’on peut, et de différentes manières,
définir, quel que soit n ∈ N∗ , une norme sur Rn qui se réduira à la valeur
absolue lorsque n = 1.
Définissons l’application | · |1 de Rn dans R+ par
n
$
| · |1 : Rn → R+ , x = (x1 , . . . , xn ) 2→ |x1 | + . . . + |xn | = |xi |.
i=1
Proposition. | · |1 est une norme sur Rn .

%
Démonstration. On a |0|1 = 0 et si |x|1 = 0, alors ni=1 |xi| = 0, et comme
chaque terme |xi| est positif, il faut nécessairement que |xi| = 0, (1 ≤ i ≤ n),
et donc que xi = 0, (1 ≤ i ≤ n), c’est-à-dire que x = 0. Si c ∈ R et x ∈ Rn ,

on a & n '
n $ n $ $
|cx|1 = |cxi | = |c||xi| = |c| |xi | = |c||x|1.
i=1 i=1 i=1
Enfin, si x ∈ Rn et y ∈ Rn , on a
n
$ n
$
|x + y|1 = |xi + yi | ≤ (|xi| + |yi |) = |x|1 + |y|1 .
i=1 i=1
Définissons l’application | · |2 de Rn dans R+ par

& n
'1/2 & n '1/2
$ $
| · |2 : R → R+ , x 2→
n
(x21 + . . . + x2n )1/2 = x2i = |xi | 2
.
i=1 i=1
Pour vérifier que | · |2 est une norme sur Rn , nous aurons besoin des
deux résultats importants suivants. Le premier porte le nom d’identité de
Lagrange.
Proposition. Pour tout x ∈ Rn et tout y ∈ Rn , on a
& n
' n  ,
n
-2 n $
n
$ $ $ 1$
2 
xi 2
yj − (xiyi ) = (xi yj − xj yi )2 .
i=1 j=1 i=1
2 i=1 j=1
Démonstration. On a
n $ n
1$
(xiyj − xj yi )2 =
2 i=1 j=1
n $ n n $ n n $ n
1$ $ 1$
x2i yj2 − xi yj xj yi + x2j yi2 =
2 i=1 j=1 i=1 j=1
2 i=1 j=1
& n
' n  ,
n
- n 
$ $ $ $
x2 
i y2 − (xi yi )  (xj yj ) ,
j
i=1 j=1 i=1 j=1
et l’identité de Lagrange s’en déduit aussitôt.

L’identité de Lagrange a pour conséquence immédiate l’inégalité de Cau-
chy.
Corollaire. Pour tout x ∈ Rn et tout y ∈ Rn , on a

, n -2 & n
' n 
$ $ $
(xi yi ) ≤ x2 
i y2  . j
i=1 i=1 j=1
Nous pouvons maintenant démontrer que | · |2 est une norme sur Rn .
Proposition. | · |2 est une norme sur Rn .
Démonstration. La vérification facile des propriétés 1 et 2 de la norme

est laissée au lecteur. La propriété 3 s’écrit explicitement
, n -1/2 & n
'1/2 & n
'1/2
$ $ $
(xi + yi ) 2
≤ x2i + yi2 ,
i=1 i=1 i=1
et les deux membres étant positifs, cette inégalité équivaut à l’inégalité

& '1/2 & '1/2 2
n
$ n
$ n
$
(xi + yi )2 ≤  x2i + y2 i
 ,
i=1 i=1 i=1
c’est-à-dire, en effectuant les calculs et en simplifiant les termes communs

aux deux membres, à l’inégalité
n
& n
'1/2 & n
'1/2
$ $ $
xi yi ≤ x2i yi2 .
i=1 i=1 i=1
%n
Cette inégalité est évidemment satisfaite si i=1 xi yi < 0 et elle résulte de
%
l’inégalité de Cauchy si ni=1 xi yi ≥ 0.
Remarque. La norme | · |2 est souvent appelée la norme euclidienne de Rn

parce que, si n = 2 ou 3 et si x ∈ Rn et y ∈ Rn , l’expression |x − y|2 n’est
rien d’autre que la distance euclidienne entre les points x et y.
Définissons l’application | · |∞ de Rn dans R+ par
| · |∞ : Rn → R+ , x = (x1 , . . ., xn ) 2→ max{|xi| : 1 ≤ i ≤ n},
où max{|xi | : 1 ≤ i ≤ n} désigne le plus grand élément de l’ensemble {|xi| :

1 ≤ i ≤ n}.
Proposition. | · |∞ est une norme sur Rn .

Démonstration. La vérification des conditions 1 et 2 est laissée au lecteur.
Pour la propriété 3, soit x ∈ Rn , y ∈ Rn et k un indice tel que
|x + y|∞ = max{|xi + yi | : 1 ≤ i ≤ n} = |xk + yk |.
On a évidemment
|xk + yk | ≤ |xk | + |yk | ≤ max{|xi| : 1 ≤ i ≤ n} + max{|yi | : 1 ≤ i ≤ n}
= |x|∞ + |y|∞ .
On a les inégalités suivantes entre les trois normes que nous venons de
définir sur Rn .
Proposition. Pour tout x ∈ Rn et tout 1 ≤ i ≤ n, on a
|xi| ≤ |x|∞ ≤ |x|2 ≤ |x|1 ≤ n|x|∞ .
Démonstration. Soit x ∈ Rn et k un indice tel |x|∞ = |xk |. On a

évidemment, pour chaque 1 ≤ i ≤ n,
& n
'1/2
$
|xi| ≤ |xk | ≤ |xi | 2
= |x|2 .
i=1
En outre, on a
n
$
|x|1 = |xi | ≤ n|xk | = n|x|∞ .
i=1
Enfin, on a trivialement,
n
$ n $
$ n
|x|22 = |xi ||xi| ≤ |xi ||xj | = |x|21 ,
i=1 i=1 j=1
ce qui entraı̂ne |x|2 ≤ |x|1 , puisque ces nombres sont positifs.
Définition. Si E est un espace vectoriel, les deux normes 6 · 61 et 6 · 62 sur

E seront dites équivalentes s’il existe deux constantes a > 0 et b > 0 telles
que, pour tout x ∈ E, on ait
a6x61 ≤ 6x62 ≤ b6x61 .

On vérifie sans peine qu’il s’agit bien d’une relation d’équivalence sur
les normes de E. La Proposition que nous venons de démontrer montre
que les trois normes | · |i , (i = 1, 2, ∞) que nous venons de définir sur Rn
sont équivalentes. On montrera plus loin que toutes les normes sur Rn sont
équivalentes.
La notion de norme permet de définir la notion de boule dans Rn .
Définition. Soit a ∈ Rn , r > 0 et i = 1, 2 ou ∞. La boule de centre a et
de rayon r pour la norme | · |i est la partie Bi [a; r] de Rn définie par
Bi [a; r] = {x ∈ Rn : |x − a|i ≤ r}.
Lorsque a = 0, on écrira en général Bi [r] au lieu de Bi [a; r]. La terminolo-

gie provient évidemment de ce que, pour n = 3 et pour la norme euclidienne,
l’ensemble B2 [a; r] correspond à la boule usuelle de centre a et de rayon r.
Pour n = 2 et la norme euclidienne, B2 [a; r] correspond au disque de centre
a et de rayon r. Enfin, pour n = 1, les trois normes se réduisent à la valeur
absolue et
Bi [a; r] = [a − r, a + r], (i = 1, 2, ∞),
et les boules sont donc des intervalles fermés. Réciproquement, tout inter-
valle fermé [a, b] de R corrrespond à la boule Bi [ a+b
2 ; 2 ].
b−a
Proposition. Pour tout a ∈ Rn et tout r > 0, on a

2 3
r
B∞ a; ⊂ B1 [a; r] ⊂ B2 [a; r] ⊂ B∞ [a; r].
n
Démonstration. C’est une conséquence facile des inégalités entre normes

qui entraı̂nent, pour tout x ∈ Rn , que
|x − a|∞ ≤ |x − a|2 ≤ |x − a|1 ≤ n|x − a|∞ .
La norme | · |2 sur Rn est associée à la notion de produit scalaire de deux

éléments de Rn .
Définition. L’application (·|·) de Rn × Rn dans R définie par
n
$
(x|y) = xi yi
i=1
1.6. NOMBRES COMPLEXES 25
s’appelle le produit scalaire sur Rn .

On vérifie facilement les propriétés suivantes du produit scalaire. Si
x ∈ Rn , y ∈ Rn , z ∈ Rn et c ∈ R, alors
1) (x|y) = (y|x) et (x|x) = |x|22 ;
2) (x + y|z) = (x|z) + (y|z);
3) (cx|y) = c(x|y).
On en déduit aussitôt que
(x|y + z) = (x|y) + (x|z), (x|cy) = c(x|y).
D’autre part, l’inégalité de Cauchy s’écrit, en termes de produit scalaire et

de norme | · |2
|(x|y)| ≤ |x|2 |y|2.
On notera que, si n = 1, le produit scalaire se ramène à la multiplication
ordinaire sur R mais que, pour n ≥ 2, il constitue une application bilinéaire
de Rn × Rn dans R et non pas l’éventuelle application de Rn × Rn dans Rn
qui étendrait à Rn la notion de multiplication définie sur R. Nous allons voir
qu’une telle extension est possible pour n = 2.
1.6 Nombres complexes

Introduisons dans R2 une multiplication à partir de l’application R2 × R2
dans R2
(x, y) 2→ xy = (x1 y1 − x2 y2 , x1 y2 + x2 y1 ).
On vérifie sans peine par des calculs très simples que l’addition usuelle dans
R2 et cette multiplication satisfont à tous les axiomes (I) vérifiés par les
nombres réels si l’on prend 0 = (0, 0) comme élément neutre pour l’addition,
e1 = (1, 0) comme élément neutre pour la multiplication, −x = (−x1 , −y1 )
et, pour x /= 0, 4 5
x1 −x2
x−1 = , .
x21 + x22 x21 + x22
Muni de cette addition et de cette multiplication, R2 possède donc la struc-
ture de champ, est appelé le corps ou le champ des nombres complexes, est
noté C et ses éléments sont appelés des nombres complexes.
L’application j de R dans C définie par x 2→ (x, 0) est une bijection de
R sur R × {0} et est telle que, pour tout x ∈ R et tout y ∈ R, on a
j(x) + j(y) = (x, 0) + (y, 0) = (x + y, 0) = j(x + y),

j(x).j(y) = (xy, 0) = j(xy).
On peut donc identifier R au sous-corps R × {0} de C; par suite de cette

identification, l’élément e1 = (1, 0) de C sera encore simplement noté 1 et les
éléments de R×{0} notés indifféremment (x1 , 0) ou x1 . L’élément e2 = (0, 1)
de C sera noté i et la loi de multiplication et l’identification que nous venons
de faire entraı̂nent
i2 = i.i = (0, 1).(0, 1) = (−1, 0) = −1.
On retrouve ainsi l’origine historique des nombres complexes comme ex-

tension des nombres réels permettant de donner un sens à la racine carrée
d’un nombre négatif, problème qui s’était présenté dès le XVIe siècle dans
la résolution des équations algébriques. On a aussi, pour tout c ∈ R et tout
x ∈ C,
(c, 0).x = (c, 0).(x1, x2 ) = (cx1 , cx2 ) = c(x1 , x2 ) = cx,
ce qui montre la compatibilité, via l’identification faite plus haut, entre le

produit par un réel d’un élément de C et la multiplication de cet élément par
l’élément de C identifié à ce réel. On pourra donc écrire, pour tout x ∈ C,
x1 e1 = x1 .1 = x1 , x2 e2 = (x2 , 0).(0, 1) = (0, x2 ) = x2 (0, 1) = x2 i = ix2 ,
et dès lors
x = x1 e1 + x2 e2 = x1 + ix2 ,
qui est l’écriture complexe de x ∈ C. x1 est alors appelé la partie réelle de x

et noté aussi 8x et x2 est appelé la partie imaginaire de x et noté aussi 9x.
L’avantage de la notation complexe est que les opérations d’additions et de
multiplication peuvent se faire avec les règles habituelles de l’algèbre sur R,
à condition de remplacer i2 par −1.
Pour éviter l’emploi d’indices, on utilise souvent, pour un nombre com-
plexe, la notation z = (x, y) = x + iy. Le nombre complexe x − iy = (x, −y)
est appelé le conjugué du nombre complexe z = x + iy = (x, y) et est noté
z̄. On vérifie sans peine que, pour tout z ∈ C et tout v ∈ C, on a
¯
z̄ = z, z + v = z̄ + v̄, zv = z̄v̄,
et
z z̄ = x2 + y 2 = |z|22 .
1.7. INTÉRIEUR, ADHÉRENCE, FRONTIÈRE 27
Dans C, la norme |z|2 de z, qui est donc égale à (z z̄)1/2, se note simplement
|z| et est souvent appelée (comme dans R), la valeur absolue de z ou le
module de z. On a, pour tout z ∈ C et tout v ∈ C,
|zv|2 = zvzv = zvz̄v̄ = z z̄vv̄ = |z|2 |v|2 ,
et dès lors |zv| = |z||v|, comme pour la multiplication et la valeur absolue

dans R. Cette dernière relation n’est pas vraie pour les deux autres normes
sur R2 , comme on le vérifie aisément. On utilisera uniquement la norme | · |2
dans C.
Tant que la notion de multiplication de deux éléments n’est pas utilisée
dans C, ce dernier ensemble ne diffère donc de R2 muni de la norme | · |2 que
par les notations et la terminologie. D’autre part, de la même manière que
R est un espace vectoriel sur R, on peut considérer C non seulement comme
un espace vectoriel sur R (lorsqu’on l’identifie à R2 ), mais aussi comme un
espace vectoriel sur C, le produit par un scalaire (c’est-à-dire un élément de
C) étant défini à partir de la multiplication dans C.
On notera enfin qu’il n’a pas été question de relation d’ordre dans C. On
démontre en algèbre qu’il est impossible de munir C d’une relation d’ordre
vérifiant tous les axiomes II de la section sur les réels. En outre, Georg
Frobenius a démontré qu’il était impossible, pour n ≥ 3, de munir Rn
d’une multiplication (c’est-à-dire d’une application bilinéaire de Rn × Rn
dans Rn telle que tous les axiomes I de la section sur les réels soient vérifiés).
1.7 Intérieur, adhérence, frontière

La notion de norme dans Rn permet de renforcer et d’affaiblir la notion
d’appartenance à une partie de Rn . Soit a ∈ Rn et E une partie de Rn .
Définition. On dit que a est intérieur à E (ou que E est un voisinage de
a) s’il existe r > 0 tel que B2 [a; r] ⊂ E.
L’intérieur int E de E est l’ensemble
int E = {a ∈ Rn : a est intérieur à E} = {a ∈ Rn : E est voisinage de a}.
Le résultat suivant est une conséquence immédiate de la définition.

Proposition. Si a est intérieur à E, alors a ∈ E. En d’autres termes,
int E ⊂ E.
La réciproque de cette proposition est fausse : un point peut appartenir
à un ensemble sans être intérieur à cet ensemble. Par exemple, si a 0, B2 [a; r] /⊂ [a, b] puisque B2 [a; r] = [a − r, a + r] et a − r /∈ [a, b].
Définition. On dit que a est adhérent à E si, pour tout r > 0, on a
B2 [a; r] ∩ E /= ∅.
L’adhérence adh E de E est l’ensemble
adh E = {a ∈ Rn : a est adhérent à E}.
On le note aussi E.
Le résultat suivant est une conséquence immédiate de la définition.
Proposition. Si a ∈ E, alors a est adhérent à E.
La réciproque de cette proposition est fausse : un point peut être adhé-
rent à un ensemble sans lui appartenir. Par exemple, si a 0, on a
B2 [a; r]∩ ]a, b[ = [a − r, a + r]∩ ]a, b[ /= ∅,
puisque a + r $ ∈ [a − r, a + r]∩ ]a, b[ si r $ = min{r, b−a

2 }.
Il résulte immédiatement des définitions que
int ∅ = adh ∅ = ∅,
et que
int Rn = adh Rn = Rn .
En outre, puisque tout intervalle de R contient à la fois un rationnel et un

irrationnel, on a nécessairement
int Q = int (R \ Q) = ∅,
et
adh Q = adh (R \ Q) = R.
La proposition suivante montre que le rôle privilégié joué par la norme

| · |2 dans la définition de point intérieur et de point adhérent à un ensemble
n’est qu’apparent.
Proposition. Si i = 1, 2 ou ∞, alors a est intérieur à E si et seulement s’il

existe r > 0 tel que Bi [a; r] ⊂ E. a est adhérent à E si et seulement si, pour
tout r > 0, on a Bi [a; r] ∩ E /= ∅.
Démonstration. Condition nécessaire. Si a est intérieur à E, il existe
r2 > 0 tel que B2 [a; r2] ⊂ E. Comme
2 3
r2
B∞ a; ⊂ B1 [a; r2] ⊂ B2 [a; r2],
n
il existe r1 = r2 tel que B1 [a; r1] ⊂ E et r∞ = rn2 tel que B∞ [a; r∞] ⊂ E. On
procède de même dans le cas de l’adhérence.
Condition suffisante. Soit a ∈ Rn tel que, pour i = 1 ou ∞, il existe
ri > 0 tel que Bi [a; ri] ⊂ E. Comme
2 3
r1
B2 [a; r∞] ⊂ B∞ [a; r∞] et B2 a; ⊂ B1 [a; r1],
n
on obtient, en prenant r = r∞ ou r = rn1 selon le cas considéré l’existence
d’un r > 0 tel que B2 [a; r] ⊂ E. On procède de même dans le cas de
l’adhérence.
Les notions de point intérieur et de point adhérent s’échangent par double
passage au complémentaire. On posera !E = Rn \ E.
Proposition. a est adhérent à E si et seulement si a n’est pas intérieur à
!E. a est intérieur à E si et seulement si a n’est pas adhérent à !E. En
d’autres termes, on a adh E = !int !E, int E = !adh !E, ou encore
Rn = E ∪ !E = int E ∪ adh !E = adh E ∪ int !E.
Démonstration. En utilisant les définitions et les règles de négation d’une

proposition contenant des quantificateurs, on a
a n’est pas intérieur à !E ⇔ (∀r > 0) : B2 [a; r] /⊂ !E
⇔ (∀r > 0) : B2 [a; r] ∩ !!E /= ∅ ⇔ (∀r > 0) : B2 [a; r] ∩ E /= ∅

⇔ a est adhérent à E.
L’autre proposition s’obtient en appliquant la première à !E.
Etudions maintenant les relations entre les notions d’intérieur et d’adhé-
rence et les relations et opérations usuelles entre ensembles. Soit F une
partie de Rn .
Le premier résultat est une conséquence immédiate des définitions.
Proposition. Si E ⊂ F , alors int E ⊂ int F et adh E ⊂ adh F .
Proposition. On a
int (E ∪ F ) ⊃ int E ∪ int F, int (E ∩ F ) = int E ∩ int F,
adh (E ∪ F ) = adh E ∪ adh F, adh (E ∩ F ) ⊂ adh E ∩ adh F.
Démonstration. Comme E∪F ⊃ E et E∪F ⊃ F , on a, par la proposition

précédente,
int (E ∪ F ) ⊃ int E et int (E ∪ F ) ⊃ int F,
et donc int (E ∪ F ) ⊃ int E ∪ int F. Comme E ⊃ E ∩ F et F ⊃ E ∩ F , on
a, par la proposition précédente,
int E ⊃ int (E ∩ F ), int F ⊃ int (E ∩ F ),
et dès lors int E ∩ int F ⊃ int (E ∩ F ). Par ailleurs, si a ∈ int E, il existe

r1 > 0 tel que B2 [a; r1] ⊂ E et si a ∈ int F , il existe r2 > 0 tel que
B2 [a; r2] ⊂ F. Dès lors, r = min{r1 , r2} est tel que B2 [a; r] ⊂ E ∩ F, ce
qui montre que int E ∩ int F ⊂ int (E ∩ F ). Comme l’inclusion contraire
a été démontrée plus haut, on a bien l’égalité souhaitée. Pour obtenir les
propriétés de l’adhérence, on utilise les propriétés de l’intérieur, les lois de
De Morgan
!(A ∪ B) = !A ∩ !B, !(A ∩ B) = !A ∪ !B,
et les relations entre intérieur et adhérence. Cela donne
adh (E ∪ F ) = !int !(E ∪ F ) = !int (!E ∩ !F )
= ![(int !E) ∩ (int !F )] = !(int !E) ∪ !(int !F )
= adh E ∪ adh F,
et
adh (E ∩ F ) = !int !(E ∩ F ) = !int (!E ∪ !F )
⊂ ![(int !E) ∪ (int !F )] = (!int !E) ∩ (!int !F )
= adh E ∩ adh F.
Remarque. Traduits en termes de voisinages, les résultats ci-dessus expri-

ment que toute partie de Rn contenant un voisinage de a est un voisinage
de a et que l’intersection de deux voisinages de a est encore voisinage de a.
A titre d’exemple, déterminons l’intérieur et l’adhérence des différents
types d’intervalle de R muni de la norme valeur absolue.
Proposition. Si a < b sont deux réels, alors
]a, b[= int ]a, b[ = int [a, b[ = int ]a, b] = int [a, b],
[a, b] = adh ]a, b[ = adh [a, b[ = adh ]a, b] = adh [a, b].
Démonstration. Démontrons d’abord la première série d’égalités. Puis-
que
]a, b[ ⊂ [a, b[ ⊂ [a, b] et ]a, b[ ⊂ ]a, b] ⊂ [a, b],
et que ces inclusions se conservent par passage à l’intérieur, il suffit de
démontrer que
]a, b[ = int ]a, b[ = int [a, b].
La première égalité sera démontrée si l’on prouve que ]a, b[ ⊂ int ]a, b[. Soit
x ∈]a, b[, c’est-à-dire tel que a < x < b. Par une propriété des réels démontrée
plus haut, il existe donc r1 > 0 tel que a + r1 < x et r2 > 0 tel que x + r2 < b
et, en prenant r = min{r1 , r2 }, on voit que a < x − r < x + r < b ou encore
que B2 [x; r] = [x − r, x + r] ⊂ ]a, b[. Pour démontrer que ]a, b[ = int [a, b], on
sait déjà, puisque ]a, b[ ⊂ [a, b], que ]a, b[ = int ]a, b[ ⊂ int [a, b] et il suffit
donc de prouver que int [a, b] ⊂ ]a, b[. Si x ∈ int [a, b], il existe r > 0 tel que
B2 [x; r] = [x − r, x + r] ⊂ [a, b]. Par conséquent, on a
a < a + r ≤ x ≤ b − r < b,
et x ∈ ]a, b[.
Pour calculer les adhérences, il suffit, comme dans le cas des intérieurs,
de prouver que
[a, b] = adh [a, b] = adh ]a, b[.
Pour la première égalité, il suffit de nouveau de prouver que adh [a, b] ⊂ [a, b].
Si x ∈ adh [a, b], alors, pour chaque r > 0, on a
B2 [x; r] ∩ [a, b] = [x − r, x + r] ∩ [a, b] /= ∅.
En d’autres termes,
(∀r > 0)(∃y ∈ R) : x − r ≤ y ≤ b et a ≤ y ≤ x + r,

ce qui entraı̂ne que
(∀r > 0) : a ≤ x + r et x ≤ b + r.
On a vu plus haut que cette propriété équivaut à a ≤ x ≤ b, et donc
x ∈ [a, b]. Pour démontrer que adh [a, b] = adh ]a, b[, on déduit tout d’abord
de l’inclusion ]a, b[ ⊂ [a, b] que
adh ]a, b[ ⊂ adh [a, b] = [a, b],
et il suffit de prouver que [a, b] ⊂ adh ]a, b[, ce qui se ramène à {a, b} ⊂
adh ]a, b[ et a été démontré plus haut.
Remarque. Les exemples suivants montrent qu’on ne peut pas améliorer
les conclusions de la proposition sur l’intérieur d’une union et l’adhérence
d’une intersection. Si a < b < c sont des réels, E = [a, b[ et F = [b, c[, alors
E ∪ F = [a, c[ et
int (E ∪ F ) = ]a, c[ /= ]a, b[ ∪ ]b, c[ = int E ∪ int F.

Si a < b < c < d sont des réels, et si E = [b, c[, F =]a, b] ∪ ]c, d[, alors
E ∩ F = {b} = {b} /= {b} ∪ {c} = [b, c] ∩ ([a, b] ∪ [c, d]) = E ∩ F .
Introduisons enfin la notion de frontière d’une partie de Rn .

Définition. Si E ⊂ Rn , la frontière fr E ou Ė ou ∂E est l’ensemble
fr E = adh E ∩ adh !E.
Il résulte aussitôt de cette définition que fr E = fr !E, et le lien entre

intérieur et adhérence entraı̂ne aussi la relation
fr E = adh E \ int E,
puisque
adh E \ int E = adh E ∩ !int E = adh E ∩ adh !E.
Il résulte de la définition et de résultats démontrés pour l’intérieur et

l’adhérence que l’on a
fr Q = R, fr Rn = ∅, fr ∅ = ∅,
et, si a < b sont des réels,
fr [a, b] = fr [a, b[ = fr ]a, b] = fr ]a, b[ = {a, b}.

1.8. EXERCICES 33
1.8 Exercices
1. Soient a1 , a2 , . . . , an et b1 , b2, . . . , bn des nombres réels. Vérifier l’identité
 & ' & '
n
$ n
$ n
$ $
 aj  bk −n ak bk = (aj − ak )(bk − bj ) =
j=1 k=1 k=1 1≤j<k≤n
n $ n
1$
(aj − ak )(bk − bj ).
2 j=1 k=1
En déduire que si aj ≤ ak et bj ≥ bk pour tout 1 ≤ j < k ≤ n, on a l’inégalité

de Tchebycheff
 & '
n n n

1$ 1$ 1$
aj  bk ≥ ak bk .
n j=1 n k=1 n k=1
2. Soient a1 , a2 , . . . an des nombres réels tels que aj ∈ ] − 1, 0] (1 ≤ j ≤ n)

ou aj ≥ 0, (1 ≤ j ≤ n). Démontrer, par récurrence, l’inégalité
n
6 n
$
(1 + aj ) ≥ 1 + aj ,
j=1 j=1
l’inégalité étant stricte dès que n ≥ 2. En déduire l’inégalité de Bernoulli :

si a > −1 et si n ≥ 1 est un entier, alors (1 + a)n ≥ 1 + na.
3. On dit qu’un nombre réel x est algébrique s’il est solution d’une équation
%
algébrique à coefficients aj entiers nj=0 aj xj = 0. On dit qu’un nombre réel
est transcendant s’il n’est pas algébrique. Démontrer que tout rationnel est
algébrique, que l’ensemble des nombres algébriques est dénombrable et que
l’ensemble des nombres transcendants est non-dénombrable.
1.9 Petite anthologie

Ensembles
Par ensemble, nous devons entendre toute collection M considérée com-

me un tout d’objets définis et séparés de notre intuition et de notre pensée.
Ces objets sont appelés les “éléments” de M.
Georg Cantor, 1895

Si, d’autre part, la totalité des éléments d’une multiplicité peut être con-
sidérée sans contradiction “comme un tout”, alors ils peuvent être rassemblés
en “une seule chose”. Je l’appelle une multiplicité consistante ou un ensem-
ble.
Georg Cantor, 1899
Jusqu’à présent, personne n’a réussi à définir correctement la notion

d’ensemble. Il ne faut probablement pas espérer une définition, mais plutôt
un système d’axiomes. Les définitions usuelles d’ensemble ne permettent
aucune conclusion utile, et en outre elles tolèrent des ensembles parado-
xaux.... Mais, comme il semble exister des ensembles infinis consistants,
une définition convenable ou un système d’axiomes correct devraient exclure
les êtres paradoxaux.
Gerhard Hessenberg, 1906
Fonctions, applications
On appelle ici fonction d’une grandeur variable, une quantité composée

de quelque manière que ce soit de cette grandeur variable et de constantes.
Jean Bernoulli, 1718
Une fonction d’une quantité variable est une expression analytique com-
posée de quelque manière que ce soit de cette quantité variable et de nombres
ou quantités constantes.
Leonhard Euler, 1748
On appelle fonction d’une ou de plusieurs quantités toute expression de

calcul dans laquelle ces quantités entrent d’une manière quelconque, mêlées
ou non avec d’autres quantités qu’on regarde comme ayant des valeurs donné-
es et invariables, tandis que les quantités de la fonction peuvent recevoir
toutes les valeurs possibles. Ainsi, dans les fonctions, on ne considère que
les quantités qu’on suppose variables, sans aucun égard aux constantes qui
peuvent y être mêlées. Nous désignerons en général par la caractéristique f
ou F , placée devant une variable, toute fonction de cette variable, c’est-à-
dire toute quantité dépendante de cette variable et qui varie avec elle suivant
une loi donnée.
Joseph-Louis Lagrange, 1797

1.9. PETITE ANTHOLOGIE 35
Enfin de nouvelles idées, amenées par le progrès de l’analyse, ont donné

lieu à la définition suivante des fonctions : toute quantité dont la valeur
dépend d’une ou plusieurs autres quantités, est dite fonction de ces dernières,
soit qu’on sache ou qu’on ignore par quelles opérations il faut passer pour
remonter de celles-ci à la première.
Sylvestre François Lacroix, 1797
En général, la fonction f (x) représente une suite de valeurs, ou or-

données, dont chacune est arbitraire. L’abscisse x pouvant recevoir une
infinité de valeurs, il y a un pareil nombre d’ordonnées f (x). Toutes ont des
valeurs numériques actuelles, ou positives, ou négatives, ou nulles. On ne
suppose point que ces ordonnées soient assujetties à une loi commune; elles
se succèdent d’une manière quelconque, et chacune d’elles est donnée comme
le serait une seule quantité.
Jean-Baptiste Joseph Fourier, 1822
Lorsque des quantités variables sont tellement liées entre elles que, la
valeur de l’une d’elles étant donnée, on puisse en conclure les valeurs de
toutes les autres, on conçoit d’ordinaire ces diverses quantités exprimées au
moyen de l’une d’entre elles, qui prend alors le nom de variable indépendan-
te; et les autres quantités, exprimées au moyen de la variable indépendante,
sont ce qu’on appelle des fonctions de cette variable.
Augustin Cauchy, 1823
D’une manière générale, on doit appeler fonction de x un nombre qui est

donné pour chaque x et qui change progressivement avec x. La valeur de la
fonction pourrait être donnée ou bien par une expression analytique, ou par
une condition qui offre un moyen de tester tous les nombres et de sélectionner
l’un deux, ou, finalement, la dépendance peut exister mais rester inconnue.
Nicolas Lobatchevsky, 1834
Il n’est pas, en outre, du tout nécessaire que y dépende de x dans tout

l’intervalle suivant la même loi; en fait, il n’est pas nécessaire de penser
seulement à des relations qui puissent être exprimées par des opérations
mathématiques.
Gustave Lejeune Dirichlet, 1837

Par le terme fonction, je considère une quantité dont les valeurs dépen-
dent d’une manière quelconque de la valeur de la variable, ou des valeurs de
plusieurs variables dont elle est composée. Ainsi, les fonctions considérées
n’ont pas besoin pour être admises d’être exprimées par une combinaison de
symboles algébriques, même entre des limites des variables arbitrairement
proches.
Georges Stokes, 1848
Une fonction de x est appelée f (x) si à chaque valeur de x à l’intérieur

d’un intervalle est associée une valeur univoquement déterminée de f (x). En
outre, la manière dont f (x) est déterminée n’a aucune importance, que ce
soit par une opération analytique sur les quantités ou une autre manière. La
valeur de f (x) doit seulement être déterminée univoquement partout.
Hermann Hankel, 1870
Quand deux multiplicités bien ordonnées M et N se laissent mettre en

correspondance, élément par élément, de façon univoque et complète (chose
qui, si elle est possible de quelque manière, peut toujours se faire de beau-
coup d’autres manières), nous nous autoriserons désormais à dire que ces
multiplicités one même puissance, ou encore qu’elles sont équivalentes. ...
La série des nombres entiers positifs offre, comme on peut le montrer facile-
ment, la plus petite de toutes les puissances qui se trouvent dans les mul-
tiplicités infinies. Néanmoins la classe des multiplicités qui ont cette plus
petite puissance est une classe extraordinairement riche et étendue.
Georg Cantor, 1878
Par une application d’une système S, on entend une loi par laquelle
à chaque élément déterminé s de S est associé un objet déterminé, qui est
appelé l’image de s et noté φ(s); on dit, aussi, que φ(s) correspond à l’élément
s, que φ(s) est déterminé ou engendré par l’application φ à partir de s, que
s est transformé par l’application φ en φ(s).
Richard Dedekind, 1887
Considérons un ensemble (X) de nombres distincts, et regardons ces

nombres comme des valeurs qui puissent être attribuées à une lettre x, laquel-
le sera désignée comme étant une variable. Supposons qu’à chaque valeur
de x, c’est-à-dire à chaque élément de l’ensemble (X) corresponde un nom-
bre que l’on regardera comme une valeur attribuée à une lettre y; on dira
que y est une fonction de x déterminée dans cet ensemble (X): la fonction
sera définie dans cet ensemble si la correspondance est définie. L’ensemble
(Y ) des valeurs distinctes que prend y est déterminé par la correspondance
même : dire que b est un élément de (Y ) c’est dire qu’il y a un élément a
de (X) auquel correspond le nombre b. A chaque élément de (X) corres-
pond un élément de (Y ) et un seul; mais rien n’empêche, dans la définition
précédente, qu’à plusieurs éléments différents de (X) corresponde un même
élément de (Y ).
Jules Tannery, 1904
Une fonction est une relation u telle que, si deux paires y; x et z; x ayant
le même second élément, satisfont à la relation u, il en résulte nécessairement
que y = x quelles que soient les valeurs de x, y, z.
Giuseppe Peano, 1911
Soient E et F deux ensembles, distincts ou non. Une relation entre une

variable x de E et une variable y de F est dite relation fonctionnelle en y,
ou relation fonctionnelle de E vers F , si, quel que soit x ∈ E, il existe un
élément y de F , et un seul, qui soit dans la relation considérée avec x.
Nicolas Bourbaki, 1939
Nombres réels
On doit se rappeler cependant que les quantités infiniment petites, même

comprises dans le sens populaire, ne sont en aucun cas constantes et détermi-
nées. Car si un opposant dénie l’exactitude de nos théorèmes, nos calculs
montrent que l’erreur est plus petite que toute quantité donnée, puisqu’il
est en notre pouvoir de diminuer l’incomparablement petit, que l’on peut
toujours supposer aussi petit que l’on veut. Nul doute que là se trouve la
démonstration rigoureuse de notre calcul infinitésimal.
Gottfried W. Leibniz, 1702
Les nombres irrationnels se trouvent en une quantité sans comparaison

plus grande que les nombres rationnels.
Bernard le Bovier de Fontenelle, 1727

Il n’y a pas de doute que toute quantité peut être diminuée de telle
manière qu’elle s’annule complètement et disparaisse. Mais une quantité
infiniment petite n’est rien d’autre qu’une quantité qui s’annule et dès lors
la chose elle-même est égale à zéro. C’est en harmonie aussi avec cette
définition des choses infiniment petites, par laquelle les choses sont dites
inférieures à toute quantité assignable; elles devraient certainement n’être
rien, car à moins qu’elle ne soit égale à zéro, une quantité égale peut lui être
assignée, ce qui est contraire à l’hypothèse.
Léonard Euler, 1755
Nombres complexes
Après les irrationnels sont nées les quantités impossibles ou imaginaires

dont la nature est très étrange mais dont l’utilité est indéniable.
Gottfried W. Leibniz
De la même manière qu’on peut imaginer le domaine entier des quantités

réelles comme étant représentées par une ligne droite infinie, le domaine
complet de toutes les grandeurs, nombres réels aussi bien qu’imaginaires,
peut être visualisé comme un plan infini, dans lequel le point défini par
l’abscisse a et l’ordonnée b représente la quantité a + bi.
Carl-Friedrich Gauss, 1811
On√ appelle expression imaginaire toute expression symbolique de la forme

a + b −1, a, b désignant deux quantités réelles.

Chapitre 2
Limites et continuité
2.1 Fonctions de plusieurs variables réelles

Soient n ≥ 1 et p ≥ 1 des entiers et soit f une fonction de Rn dans Rp. Pour
chaque x ∈ dom f, on a
f (x) = (p1 (f (x)), . . ., pp(f (x))) = ((p1 ◦ f ))(x), . . . , (pp ◦ f )(x))
où, pour chaque 1 ≤ j ≤ p, pj : Rp → R, y 2→ yj est l’application projection

sur la j e composante. On pose, pour chaque 1 ≤ j ≤ p, fj = pj ◦ f , ce qui
définit une fonction de Rn dans R, de domaine dom fj = dom f , appelée
fonction j e composante de f . Réciproquement, si l’on se donne p fonctions
f1 , . . . , fp de Rn dans R, de domaines respectifs dom f1 , . . . , dom fp , on peut
7p
leur associer la fonction f de Rn dans Rp , de domaine dom f = j=1 dom fj ,
définie, pour chaque x ∈ dom f , par f (x) = (f1 (x), . . . , fp(x)). La fonction
j e composante de f est alors la restriction de fj à dom f .
Lorsque n > 1 et p = 1, on dit que f est une fonction réelle de plusieurs
(ici n) variables réelles; si n > 1 et p > 1, on dit que f est une fonction
vectorielle de plusieurs variables réelles; si n = 1 et p > 1, on dit que f est
une fonction vectorielle d’une variable réelle et si n = p = 1, on dit que f
est une fonction réelle d’une variable réelle.
Exemples. 1. La fonction qui associe à chaque réel x son carré x2 est une
fonction réelle d’une variable réelle de domaine égal à R puisque l’opération
“élévation au carré” est définie pour chaque réel.
2. La fonction qui associe à chaque réel x différent de zéro le réel |x|
x
est une
fonction réelle de variable réelle de domaine égal à R = R \ {0}, puisque la
∗
division n’est définie que pour des diviseurs non nuls.
39
40 CHAPITRE 2. LIMITES ET CONTINUITÉ
3. La fonction qui associe à chaque réel positif x sa racine carrée arithmétique

x1/2 est une fonction réelle d’une variable réelle de domaine égal à R+ = {x ∈
R : x ≥ 0}, puisque l’opération “racine carrée arithmétique” n’est définie que
pour les réels positifs.
4. La fonction de R2 dans R2 définie par
4 5
x1 + x 2 x 1 x2
f (x1 , x2 ) = ,
x1 − x2 (x1 − 1)1/2
a pour domaine
dom f = {(x1 , x2 ) ∈ R2 : x1 /= x2 et x1 > 1}
puisque l’expression xx11 +x

−x2 est définie lorsque x1 /= x2 et l’expression (x1 −1)1/2
2 x1 x2
est définie lorsque x1 > 1.

Une fonction f de Rn dans R2 peut évidemment être considérée comme
une fonction f de Rn dans C et s’appelle alors une fonction complexe de
plusieurs variables réelles si n > 1 et d’une variable réelle si n = 1. Ses
composantes au sens défini plus haut s’appellent alors respectivement la
fonction partie réelle et la fonction partie imaginaire de f . Une fonction
de R2 dans Rp peut également être considérée comme fonction de C dans
Rp et s’appelle alors une fonction vectorielle d’une variable complexe. En
particulier, une fonction de R2 dans R2 peut être considérée comme une
fonction de C dans C; on l’appelle alors une fonction complexe d’une variable
complexe. Tant que la structure de corps qui distingue C de R2 n’est pas
utilisée, il n’y a évidemment aucune nécessité de distinguer R2 de C comme
espace de départ ou d’arrivée d’une fonction. Il en sera ainsi pour les notions
de limite et de continuité. Par contre, la notion de dérivabilité sera différente
selon que l’on considère C ou R2 .
Rappelons enfin que, conformément aux notions générales introduites
sur les graphes, si f est une fonction de Rn dans Rp et E une partie de
Rn , la restriction f |E de f à E sera la fonction de Rn dans Rp de domaine
dom f |E = dom f ∩ E telle que, pour chaque x ∈ dom f |E , on a f |E (x) =
f (x).
2.2 Limite des valeurs d’une fonction

Introduisons maintenant le concept fondamental de limite, en un point de
Rn , des valeurs d’une fonction de Rn dans Rp . Si f est une fonction de Rn
dans Rp , l’opération “calculer f (a) en a ∈ Rn ” est possible si et seulement
2.2. LIMITE DES VALEURS D’UNE FONCTION 41
si a ∈ dom f . Si nous considérons à titre d’exemple la fonction f de R dans

R définie par
1 1
f (x) = − ,
x x + x2
nous voyons immédiatement que son domaine est égal à R \ {−1, 0}. Si
nous calculons numériquement des valeurs de f (x) pour des x différents
de −1 mais proches de −1, nous constatons que f (x) prend des valeurs
positives et des valeurs négatives dont la valeur absolue peut devenir très
grande. Si nous calculons numériquement f (x) pour des valeurs différentes
de 0 mais proches de 0, nous constatons que les valeurs obtenues pour f (x)
diffèrent peu de 1. La fonction f présente donc un comportement différent
au voisinage des points −1 et 0 du complémentaire de son domaine. Dans le
cas de 0, l’opération impossible “calculer f (0)” semble réalisable “de manière
approchée” dans le sens suivant : f (x) diffère d’aussi peu que l’on veut de
1 si on la calcule aux points de dom f \ {0} suffisamment proches de 0.
D’une manière plus précise, montrons que chaque fois qu’on se donne un
réel ! > 0, on pourra trouver un réel δ > 0 tel que |f (x) − 1| ≤ ! pour tous
les x ∈ dom f vérifiant l’inégalité |x| ≤ δ. Pour ce faire, notons tout d’abord
que, pour chaque x ∈ dom f, on a
# # # #
#1 1 # # −x #
|f (x) − 1| = ## − − 1## = ## # = |x| .
x x+x 2 1 + x # |1 + x|
|x|
! > 0 étant donné, nous devons donc trouver un δ > 0 tel que |1+x| ≤ !
lorsque x /∈ {−1, 0} et |x| ≤ δ. Rappelons qu’on majore une fraction en
majorant son numérateur et en minorant son dénominateur. Pour minorer
|1 + x|, notons que si |x| ≤ 12 , c’est-à-dire si − 12 ≤ x ≤ 12 , on a 12 ≤ 1 + x ≤ 32 ,
et dès lors
1
|1 + x| = 1 + x ≥ .
2
En conséquence, on a
|x|
≤ 2|x|
|1 + x|
dès que |x| ≤ 12 , ce qui entraı̂ne que
|x|
|f (x) − 1| = ≤ 2|x| ≤ !,
|1 + x|
si, outre les conditions x /∈ {−1, 0} et |x| ≤ 12 déjà imposées, on ajoute

|x| ≤ 2! . Nous avons donc montré que le réel strictement positif δ = min{ 12 , 2! }
est tel que |f (x) − 1| ≤ ! pour tous les x ∈ dom f vérifiant l’inégalité
|x| ≤ δ. Dans ce sens précis, on peut dire que l’opération impossible “faire
prendre à f en 0 la valeur 1” est réalisée de manière approchée, et avec une
approximation aussi bonne que l’on veut. Dans ce processus, ! > 0 mesure
l’erreur maximale tolérée dans la réalisation de l’opération approchée et le
réel strictement positif δ qu’on lui associe délimite les valeurs de la variable x
pour lesquelles l’opération approchée est réalisée dans les limites de l’erreur
maximale tolérée. On voit tout de suite que si un δ1 > 0 convient, dans
ce qui précède, pour un !1 > 0 donné, il conviendra a fortiori pour chaque
! > !1 puisque |f (x) − 1| ≤ !1 entraı̂ne |f (x) − 1| ≤ !. Par contre, si ! < !1 ,
on constate facilement que le δ1 associé à !1 ne conviendra pas en général
pour !; il faudra prendre un δ < δ1 et être assuré de trouver des éléments x
dans dom f tels que |x| ≤ δ. Comme δ peut être arbitrairement petit, il est
important que dom f ∩ {x : |x| ≤ δ} /= ∅ pour tout δ > 0, c’est-à-dire que
0 ∈ adh dom f.
Nous pouvons maintenant formaliser ce qui précède et obtenir la définiti-
on suivante.
Définition. Soit f une fonction de Rn dans Rp, a ∈ Rn et b ∈ Rp . On dit
que f (x) tend vers b lorsque x tend vers a, ou encore que b est limite de f (x)
lorsque x tend vers a, et l’on écrit
f (x) → b si x → a,
si les deux conditions suivantes sont satisfaites :
1) a ∈ adh dom f ;
2) (∀! > 0)(∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ) : |f (x) − b|2 ≤ !.
Rappelons que la condition 2 se lit comme suit : pour tout ! > 0, il
existe un δ > 0 tel que pour tout x ∈ dom f vérifiant l’inégalité |x − a|2 ≤ δ,
on a l’inégalité |f (x) − b|2 ≤ !. Pour chaque ! > 0 donné, on devra donc
trouver un δ > 0 (pouvant dépendre d’!) tel que |f (x) − b|2 ≤ ! pour tous les
x ∈ dom f tels que |x − a|2 ≤ δ. Dans l’exemple considéré plus haut, toutes
les conditions de la définition sont satisfaites avec a = 0 et b = 1, et l’on
peut donc écrire
1 1
− → 1 si x → 0.
x x + x2
Donnons maintenant un exemple de vérification de la définition pour une
fonction de plusieurs variables.
Exemple. Soit f la fonction de R2 dans R définie par
x 1 x2 x 1 x2
f (x1 , x2 ) = = 2 .
|x|2 (x1 + x22 )1/2
Comme |x|2 = 0 si et seulement si x = 0, on voit que dom f = R2 \ {0}. On

a 0 ∈ adh dom f puisque adh dom f = R2 . Montrons que
f (x) → 0 si x → 0.
Soit ! > 0; il faut donc trouver un δ > 0 tel que, pour tout x = (x1 , x2 ) /=
(0, 0) vérifiant l’inégalité |x|2 ≤ δ, on ait
# #
# x1 x2 #
# #
# |x| # ≤ !,
2
c’est-à-dire
|x1 ||x2|
≤ !.
|x|2
L’étude de cette inégalité est simplifiée si l’on rappelle que, pour tout x =
(x1 , x2 ) ∈ R2 , on a
|xi | ≤ |x|2 , (i = 1, 2),
et dès lors, pour tout x ∈ R2 \ {0}, on a
|x1 ||x2| |x|22

≤ = |x|2 .
|x|2 |x|2
Il suffit donc de prendre δ = ! pour que les conditions x ∈ dom f et |x|2 ≤ δ

entraı̂nent |x|2 ≤ ! et dès lors |f (x)| ≤ |x|2 ≤ !.
Dans les applications pratiques de la notion de limite, il est souvent
nécessaire de restreindre les valeurs de la variable x à une certaine partie
de Rn fixée d’avance et constituant un ensemble de contraintes. Par exem-
ple, dans le cas d’une fonction réelle d’une variable réelle, on peut n’être
intéressé que par les valeurs strictement positives de la variable. Il est donc
nécessaire, pour couvrir toutes les situations rencontrées dans les applica-
tions, d’étendre la définition de limite au cas où la variable x est astreinte
à rester dans un ensemble de contraintes E, c’est-à-dire de demander à la
définition précédente de s’appliquer seulement à la restriction f |E de f à E.
Définition. Soit f une fonction de Rn dans Rp , a ∈ Rn , b ∈ Rp et E ⊂ Rn
tel que dom f ∩ E /= ∅. On dit que f (x) tend vers b lorsque x tend vers a
dans E, ou encore que b est limite de f (x) lorsque x tend vers a dans E, et
l’on écrit
f (x) → b si x → a dans E, (2.1)

si b est limite de f |E (x) pour x tendant vers a, c’est-à-dire si les deux con-
ditions suivantes sont satisfaites :
1) a ∈ adh (dom f ∩ E);
2) (∀! > 0)(∃δ > 0)(∀x ∈ dom f ∩ E : |x − a|2 ≤ δ) : |f (x) − b|2 ≤ !.
Exemple. Soit f la fonction de R dans R définie par f (x) = |x|
x
. On a
évidemment dom f = R \ {0}. Prenons E = R+ = {x ∈ R : x ≥ 0}, ce
qui entraı̂ne dom f ∩ E = R∗+ = {x ∈ R : x > 0}, et 0 ∈ adh R∗+ = R+ .
Montrons que
f (x) → 1 si x → 0 dans E.
On a, pour tout x > 0, f (x) = xx = 1 et donc |f (x) − 1| = 0. Si ! > 0 est
donné, on aura donc |f (x) − 1| = 0 ≤ ! quel que soit x > 0 et l’on peut donc
choisir n’importe quel δ > 0 dans la définition.
Il est évident que, pour chaque E ⊂ Rn tel que a ∈ adh (dom f ∩ E), on
a l’implication
f (x) → b si x → a ⇒ f (x) → b si x → a dans E.
Nous donnerons plus loin un exemple montrant que l’implication contraire

est fausse.
Donnons maintenant quelques remarques simples mais importantes sur
la structure et l’utilisation de la définition de limite.
Remarques. 1. La condition 2 est évidemment équivalente à la condition
(∀! > 0)(∃δ > 0)(∀x ∈ dom f ∩ B2 [a; δ]) : f (x) ∈ B2 [b; !],
elle-même équivalente à la condition
(∀! > 0)(∃δ > 0) : f (B2 [a; δ]) ⊂ B2 [b; !].
2. Si r > 0 est donné, la condition 2 de la définition est équivalente à la

condition
(∀! > 0)(∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ) : |f (x) − b|2 ≤ r!,
puisque l’application ! 2→ r! est une bijection de R∗+ = {x ∈ R : x > 0} sur

lui-même.
3. La condition 2 est équivalente à la condition
(∀! > 0)(∃δ $ > 0)(∀x ∈ dom f : |x − a|2 < δ $ ) : |f (x) − b|2 < !, (2.2)
où les signes ≤ sont remplacés par < (le changement de δ en δ $ n’a évidem-
ment aucune signification profonde et ne sert que pour clarifier la démonstra-
tion). Montrons tout d’abord que la condition 2 de la définition implique
(2.2) : si ! > 0 est donné, il faut donc trouver un δ $ > 0 tel que (2.2) soit
satisfaite. Par la condition 2 de la définition et la remarque 2, il existe un
δ $$ > 0 tel que
!
(∀x ∈ dom f ∩ E : |x − a|2 ≤ δ $$ ) : |f (x) − b|2 ≤ ,
2
ce qui entraı̂ne évidemment que
(∀x ∈ dom f ∩ E : |x − a|2 < δ $$ ) : |f (x) − b|2 < !.
On peut donc prendre δ $ = δ $$ . Montrons maintenant que la condition (2.2)

implique la condition 2 de la définition. Si ! > 0 est donné, nous devons
trouver un δ > 0 tel que la condition 2 soit satisfaite. Par (2.2), il existe un
δ $ > 0 tel que
!
(∀x ∈ dom f ∩ E : |x − a|2 < δ $ ) : |f (x) − b|2 < ,
2
ce qui entraı̂ne aussitôt que
δ$
(∀x ∈ dom f ∩ E : |x − a|2 ≤ ) : |f (x) − b|2 ≤ !,
2
"
et montre que δ = δ2 convient.
4. La deuxième partie de la démonstration de la Remarque 3 a fait usage
du fait suivant, qui est aussi simple qu’utile : si, étant donné un ! > 0
on a trouvé un δ > 0 qui convient pour cet ! dans la condition 2 de la
définition, alors tout δ $ ∈ ]0, δ] conviendra a fortiori, puisqu’alors |x − a|2 ≤ δ
si |x − a|2 ≤ δ $ . En particulier, on peut toujours décider d’avance de se
restreindre à déterminer des δ inférieurs à un nombre strictement positif
donné.
5. Si, dans la condition 2 de la définition, on a trouvé un δ > 0 qui convient
pour un ! > 0 donné, ce δ conviendra également pour tous les !$ ≥ !. Il suffit
donc que la condition 2 puisse être vérifiée pour chaque ! strictement positif
inférieur à un !∗ fixé d’avance. L’exigence “pour chaque ! > 0” signifie donc
fondamentalement “pour chaque ! > 0 arbitrairement petit”.
6. Les exemples que nous avons déjà traités montrent l’intérêt qu’il y a,
pour vérifier les conditions de la définition de limite, à majorer l’expression
|f (x) − b|2 par une expression plus simple à estimer. On utilise pour ce faire
un stock d’inégalités qui se constitue petit à petit par la pratique. Le choix

de l’inégalité est un art plus qu’une science puisqu’il faut veiller à ce qu’elle
simplifie suffisamment l’expression à majorer sans altérer la nature de cette
expression au point de rendre l’inégalité impossible.
Montrons maintenant qu’il ne peut pas exister plus d’un b vérifiant les
conditions de la définition de la limite.
Proposition. Etant donnés f et a, il existe au plus un b ∈ Rp vérifiant les
conditions de la définition de la limite des valeurs de f (x) lorsque x tend
vers a.
Démonstration. Supposons que b ∈ Rp et b$ ∈ Rp vérifient les conditions
de la définition de limite. Rappelons que
b = b$ ⇔ (∀! > 0) : |b − b$ |2 ≤ !,
et que, pour tout x ∈ dom f , on a évidemment
|b − b$ |2 = |b − f (x) + f (x) − b$ |2 ≤ |b − f (x)|2 + |f (x) − b$ |2 .
Soit ! > 0. Par hypothèse
!
(∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ) : |f (x) − b|2 ≤ ,
2
et
!
(∃δ $ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ $ ) : |f (x) − b$ |2 ≤ .
2
Dès lors, si l’on pose δ $$ = min{δ, δ $} et que l’on choisit x ∈ dom f tel que
|x − a|2 ≤ δ $$ (ce qui est toujours possible par la condition 1 de la définition),
on aura
! !
|b − b$ |2 ≤ + = !.
2 2
Ce résultat d’unicité entraı̂ne qu’on pourra appeler b la limite de f (x)

lorsque x tend vers a. On écrira alors
b = lim f (x).
x→a
En appliquant ce résultat à f |E , on obtient évidemment l’existence d’au plus

un b vérifiant les conditions de la définition de la limite des valeurs de f (x)
lorsque x tend vers a dans E. On l’appellera la limite de f (x) lorsque x tend
vers a dans E et l’on écrira
b= lim f (x).
x→a, x∈E
2.3. CONDITIONS NÉCESSAIRES D’EXISTENCE DE LA LIMITE 47
2.3 Conditions nécessaires d’existence de la limi-

te
La définition que nous avons donnée permet, étant donnés f, a et b, de
vérifier si b = limx→a f (x). Il est évidemment fastidieux de l’utiliser pour
montrer que f n’a pas de limite lorsque x tend vers a, puisqu’il faut alors
vérifier qu’elle n’est satisfaite pour aucun b ∈ Rp . Nous allons donner dans
cette section des conditions nécessaires d’existence d’une limite qui ne font
pas intervenir la valeur b de la limite. Par contraposition, ces conditions
nécessaires donneront alors des conditions de non-existence de la limite plus
facilement utilisables.
La première condition porte le nom de condition de Cauchy.
Proposition. Soit f une fonction de Rn dans Rp et a ∈ Rn . Si limx→a f (x)

existe alors la condition suivante est satisfaite:
(∀! > 0)(∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ)(∀x$ ∈ dom f : |x$ − a|2 ≤ δ) :
|f (x) − f (x$ )|2 ≤ !. (2.3)
Démonstration. Posons b = limx→a f (x) et notons tout d’abord que,

pour tout x ∈ dom f et tout x$ ∈ dom f , on a
|f (x) − f (x$ )|2 = |f (x) − b + b − f (x$ )|2 ≤ |f (x) − b|2 + |f (x$ ) − b|2 .
Si ! > 0 est donné, il existe δ > 0 tel que

!
(∀x ∈ dom f : |x − a|2 ≤ δ) : |f (x) − b|2 ≤ ,
2
et dès lors, en utilisant l’inégalité ci-dessus,
(∀x ∈ dom f : |x − a|2 ≤ δ)(∀x$ ∈ dom f : |x$ − a|2 ≤ δ) :
! !
|f (x) − f (x$ )|2 ≤ |f (x) − b|2 + |f (x$ ) − b|2 ≤ + = !.
2 2
Par contraposition, nous obtenons immédiatement le

Corollaire. Soit f une fonction de Rn dans Rp et a ∈ Rn tels que a ∈

adh dom f. Si la condition de Cauchy (2.3) n’est pas satisfaite, c’est-à-dire
si sa négation
(∃! > 0)(∀δ > 0)(∃x ∈ dom f : |x − a|2 ≤ δ)(∃x$ ∈ dom f : |x$ − a|2 ≤ δ) :
|f (x) − f (x$ )|2 > !, (2.4)
est vérifiée, alors la limite de f (x) pour x tendant vers a n’existe pas.
On notera que, dans la condition (2.4), il suffit de trouver un ! > 0 tel
que (2.4) soit satisfaite pour tout δ ∈ ]0, δ ∗ [ pour un δ ∗ fixé a priori, puisque,
si x et x$ conviennent dans (2.4) pour un δ > 0, ils conviennent pour tous les
δ supérieurs. On obtient évidemment une condition nécessaire de Cauchy
pour la limite de f (x) lorsque x tend vers a dans E en appliquant le résultat
précédent à f |E .
Exemples. 1. Nous avons vu précédemment que
x
lim = 1.
x→0, x>0 |x|
Montrons que
x
lim
x→0 |x|
n’existe pas, ce qui justifiera le fait mentionné plus haut que, lorsque E ∩
dom f ! dom f , l’existence de la limite de f (x) lorsque x tend vers a dans
E n’entraı̂ne pas nécessairement celle de la limite de f (x) lorsque x tend
vers a . Pour vérifier (2.4), il faut donc trouver des réels x et des réels
x$ arbitrairement proches de 0 tels que |f (x) − f (x$ )| reste supérieur à un
nombre positif fixe. Comme f (x) = −x x
= −1 si x < 0 et f (x) = xx = 1 si
x > 0, on voit que, pour tout x > 0 et tout x$ < 0, on aura
|f (x) − f (x$ )| = |1 − (−1)| = 2,
et la condition (2.4) est vérifiée pour ! = 1 en prenant, pour chaque δ > 0,

x = δ et x$ = −δ.
2. Si f est la fonction de R dans R définie par f (x) = 0 si x /= 0 et f (0) = 1,
alors limx→0 f (x) n’existe pas. En effet, pour chaque δ > 0 fixé, en prenant
x = δ et x$ = 0 (qui sont bien tels que |x| ≤ δ et |x$ | ≤ δ), on trouve
|f (x) − f (x$ )| = |0 − 1| = 1, et la condition (2.4) est vérifiée avec ! = 12 .
2.3. CONDITIONS NÉCESSAIRES D’EXISTENCE DE LA LIMITE 49
Ce dernier exemple nous conduit à une remarque terminologique impor-

tante. Certains auteurs définissent le concept de limite
f (x) → b si x → a
par les conditions

1’) a ∈ adh (dom f \ {a})
et
2’) (∀! > 0)(∃δ > 0)(∀x ∈ dom f \ {a} : |x − a|2 ≤ δ) : |f (x) − b|2 ≤ !,
et ils écrivent dans ce cas b = limx→a f (x). Cette définition, dans les nota-
tions que nous avons adoptées ici, n’est pas équivalente à notre définition
de b = limx→a f (x), mais au choix de E = dom f \ {a} dans la définition
générale, c’est-à-dire à b = limx→a, x(=a f (x). Pour éviter des contradictions
apparentes dans l’énoncé de certains résultats dans différentes ouvrages d’a-
nalyse, il convient donc d’être attentif à la définition de limite choisie par
l’auteur.
Une autre condition nécessaire d’existence de la limite est fondée sur
l’utile notion de fonction localement bornée.
Définition. Soit f une fonction de Rn dans Rp et a ∈ Rn . On dit que f est
localement bornée en a si la condition suivante est vérifiée :
(∃r > 0)(∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ) : |f (x)|2 ≤ r. (2.5)
En d’autres termes, f est localement bornée en a s’il existe une boule

B2 [a; δ] dans Rn centrée en a et une boule B2 [r] dans Rp centrée en 0 telles
que f ([B2 [a; δ]) ⊂ B2 [r].
Ainsi, la fonction réelle d’une variable réelle f définie par f (x) = |x|
x
, qui,
en vertu de l’exemple 1 ci-dessus, n’a # #pas de limite pour x tendant vers 0,
#x#
est localement bornée en 0. En effet, # |x| # ≤ 1 pour tout x ∈ R ∗
. De même, la
fonction réelle d’une variable réelle f définie par f (x) = |x|
x
+x est localement
bornée en 0 puisque, pour tout x ∈ [−1, 1] \ {0}, on a |f (x)| ≤ 2.
L’existence d’une limite en un point entraı̂ne que la condition de borne
locale est satisfaite en ce point. C’est une conséquence de la Proposition
suivante, montrant que le caractère localement borné de f en a est une
condition nécessaire pour que f vérifie la condition de Cauchy en a.
Proposition. Soit f une fonction de Rn dans Rp et a ∈ Rn . Si f vérifie la
condition de Cauchy (2.3), alors f est localement bornée en a.
Démonstration. En prenant ! = 1 dans la condition (2.3), on voit qu’il
existe δ > 0 tel que, pour tout x ∈ dom f tel que |x − a|2 ≤ δ, et pour
tout x$ ∈ dom f tel que |x$ − a|2 ≤ δ, on a |f (x) − f (x$ )|2 ≤ 1. Dès lors, si
l’on fixe un x$ ∈ dom f ∩ B2 [a; δ], on trouve, pour tout x ∈ dom f tel que
|x − a|2 ≤ δ,
|f (x)|2 = |f (x) − f (x$ ) + f (x$ )|2 ≤ |f (x) − f (x$ )|2 + |f (x$ )|2 ≤ 1 + |f (x$ )|2 ,
ce qui montre que la condition (2.5) est vérifiée pour ce δ et r = 1 + |f (x$)|2 .
La contraposée de cette proposition et le Corollaire précédent fournissent

immédiatement une condition suffisante de non-existence de la limite.
Corollaire. Soit f une fonction de Rn dans Rp et a ∈ Rn tels que a ∈
adh dom f. Si f n’est pas localement bornée en a (c’est-à-dire si la condition
suivante est vérifiée
(∀r > 0)(∀δ > 0)(∃x ∈ dom f : |x − a|2 ≤ δ) : |f (x)|2 > r),
alors la limite de f (x) pour x tendant vers a n’existe pas.

En appliquant les résultats précédents à f |E , on voit qu’une condition
nécessaire pour que f vérifie la condition de Cauchy lorsque x tend vers a
dans E est que f |E soit localement bornée en a.
Exemple. Utilisons ce corollaire pour montrer que la limite de x1 − x+x 1
2
lorsque x tend vers −1 n’existe pas. C’est la première fonction introduite
pour motiver l’introduction de la notion de limite, mais considérée cette
fois au deuxième point −1 du complémentaire de son domaine. Pour tout
x ∈ dom f , on a # #
# x + x2 − x # 1
# #
|f (x)| = # #= .
# x(x + x2 ) # |1 + x|
Dès lors, si r > 0 et δ > 0 sont donnés et si l’on prend x = −1+min{δ, 2r
1
}, on
voit que x−(−1) = x+1 = min{δ, 2r } > 0, donc |x+1| = x+1 = min{δ, 2r
1 1
},
ce qui entraı̂ne aussitôt que |x + 1| ≤ δ et |f (x)| = |1+x| ≥ 2r > r.
1
2.4 Règles de calcul des limites

Le recours systématique à la définition pour vérifier l’existence d’une limite
est long et fastidieux. Il est donc important de voir comment la notion
de limite se comporte vis-à-vis des opérations algébriques et ensemblistes
que l’on peut effectuer sur des fonctions, afin de déduire automatiquement
l’existence et la valeur de la limite de fonctions compliquées lorsqu’on connaı̂t
2.4. RÈGLES DE CALCUL DES LIMITES 51
celle de fonctions plus simples qui les composent. C’est l’objet des règles de
calcul des limites. La première exprime essentiellement que la limite d’une
somme est égale à la somme des limites. Rappelons que si f et g sont deux
fonctions de Rn dans Rp , la somme f + g de f et g est la fonction de Rn
dans Rp de domaine dom (f + g) = dom f ∩ dom g telle que, pour tout
x ∈ dom (f + g), on a (f + g)(x) = f (x) + g(x).
Proposition. Soient f et g deux fonctions de Rn dans Rp , a ∈ Rn , b ∈ Rp
et c ∈ Rp tels que a ∈ adh (dom f ∩ dom g). Si
lim f (x) = b et lim g(x) = c,

x→a x→a
alors
lim (f + g)(x) = b + c.
x→a
Démonstration. Notons tout d’abord que, pour tout x ∈ dom (f + g),

on a
|(f + g)(x) − (b + c)|2 = |f (x) − b + g(x) − c|2 ≤ |f (x) − b|2 + |g(x) − c|2 .
Si ! > 0 est donné, alors, par hypothèse,

!
(∃δ $ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ $ ) : |f (x) − b|2 ≤ ,
2
!
(∃δ $$ > 0)(∀x ∈ dom g : |x − a|2 ≤ δ $$ ) : |g(x) − c|2 ≤ .
2
Dès lors, si l’on pose δ = min{δ $ , δ $$ }, on aura, pour tout x ∈ dom f ∩dom g :
|x − a|2 ≤ δ,
! !
|(f + g)(x) − (b + c)|2 ≤ + = !.
2 2
Un raisonnement semblable, dont les détails sont laissés au lecteur, dé-

montre le résultat suivant.
Proposition. Si f et g sont des fonctions de Rn dans Rp localement bornées
en a ∈ Rn , alors f + g est localement bornée en a.
Le deuxième résultat affirme essentiellement que la limite d’un produit
de deux fonctions est égale au produit des limites. Encore faut-il que ce
produit soit bien défini, ce qui impose des restrictions aux espaces d’arrivée.
Rappelons que si f est une fonction de Rn dans Rp (resp. C) et g une
fonction de Rn dans R (resp. C), le produit gf de g par f est la fonction de
Rn dans Rp (resp. C) de domaine dom gf = dom f ∩ dom g telle que, pour

chaque x ∈ dom gf , on a (gf )(x) = g(x).f (x), g(x).f (x) désignant selon
le cas le produit de f (x) ∈ Rp par le réel g(x) ou le produit des nombres
complexes g(x) et f (x).
Proposition. Soit f une fonction de Rn dans Rp (resp. C), g une fonction
de Rn dans R (resp. C), a ∈ Rn , b ∈ Rp (resp. C) et c ∈ R (resp. C) tels
que a ∈ adh (dom f ∩ dom g). Si

x→a x→a
alors
lim (gf )(x) = cb.
x→a
Démonstration. Notons tout d’abord que, pour tout x ∈ dom f ∩ dom g,

on a
|(gf )(x) − cb|2 = |g(x)f (x) − g(x)b + g(x)b − cb|2
≤ |g(x)||f (x) − b|2 + |b|2|g(x) − c|.
D’autre part, l’existence de la limite de g lorsque x tend vers a entraı̂ne que

g est localement bornée en a, c’est-à-dire l’existence de r > 0 et δ $ > 0 tels
que
(∀x ∈ dom g : |x − a|2 ≤ δ $ ) : |g(x)| ≤ r.
Si ! > 0 est donné, alors, par hypothèse,

!
(∃δ $$ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ $$ ) : |f (x) − b|2 ≤ ,
2r
!
(∃δ $$$ > 0)(∀x ∈ dom g : |x − a|2 ≤ δ $$$) : |g(x) − c| ≤ .
2(1 + |b|2 )
Si l’on pose δ = min{δ $ , δ $$ , δ $$$}, on voit, en rassemblant les résultats ci-dessus
que, pour chaque x ∈ dom f ∩ dom g tel que |x − a|2 ≤ δ), on a
! !
|(gf )(x) − cb|2 ≤ r. + |b|2. ≤ !.
2r 2(1 + |b|2)
Un raisonnement semblable, dont les détails sont laissés au lecteur, dé-

montre le résultat suivant
Proposition. Si g est une fonction de Rn dans R (resp. C) localement

bornée en a et f une fonction de Rn dans Rp (resp. C) localement bornée
en a, alors gf est localement bornée en a.
On peut obtenir une variante utile des deux propositions précédentes
dans laquelle l’hypothèse sur l’une des deux fonctions est renforcée et celle
sur l’autre affaiblie. Essentiellement, le résultat affirme que la limite du
produit d’une fonction ayant une limite nulle par une fonction localement
bornée est égale à zéro.
de Rn dans R (resp. C) et a ∈ adh (dom f ∩ dom g). Si limx→a f (x) = 0 et
si g est localement bornée en a, alors
lim (gf )(x) = 0.
x→a
Démonstration. Par hypothèse, il existe r > 0 et δ $ > 0 tels que, pour

tout x ∈ dom g tel que |x − a|2 ≤ δ $ , on a
|g(x)| ≤ r.
Si ! > 0 est donné, alors
!
(∃δ $$ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ $$ ) : |f (x)|2 ≤ .
r
Dès lors, en posant δ = min{δ $ , δ $$} et en rassemblant les résultats qui
précèdent, on aura
!
(∀x ∈ dom f ∩ dom g : |x − a|2 ≤ δ) : |(gf )(x)|2 = |g(x)||f (x)|2 ≤ r. = !.
r
On a évidemment un résultat semblable, avec la même démonstration, si

f est localement bornée en a et limx→a g(x) = 0.
Le résultat suivant affirme que la limite d’un quotient de deux fonc-
tions est égale au quotient des limites lorsque la limite du dénominateur est
différente de zéro. Rappelons que si f est une fonction de Rn dans Rp (resp.
C) et g une fonction de Rn dans R (resp. C), le quotient fg de f par g est la
f
fonction de Rn dans Rp (resp. C) de domaine dom g = {x ∈ dom f ∩dom g :
g(x) /= 0} telle que, pour chaque x ∈ dom on a ( fg )(x) = fg(x)
f
g,
(x)
, où fg(x)
(x)
désigne selon le cas le produit de f (x) ∈ R par le réel g(x)

p 1
ou le produit
des nombres complexes f (x) et g(x) . Bien entendu, si 1 désigne l’application
1
f
constante de R dans R partout égale à 1, on a g = 1g .f.

de Rn dans R (resp. C), a ∈ Rn , b ∈ Rp (resp. C) et c ∈ R (resp. C) tels
que a ∈ adh (dom f ∩ dom g). Si
x→a x→a
avec c /= 0, alors
f b
lim (x) = .
x→a g c
Démonstration. En vertu de l’égalité fg = 1g .f. et du résultat sur le
produit des limites, il suffit de démontrer que, avec les hypothèses faites sur
g, on a
1 1
lim (x) = .
x→a g c
Notons que dom 1g = {x ∈ dom g : g(x) /= 0}, et montrons tout d’abord que
a ∈ adh dom 1g . En prenant ! = |c|/2, l’hypothèse et une inégalité classique
entraı̂nent l’existence d’un δ $ > 0 tel que, pour tout x ∈ dom g vérifiant
|x − a|2 ≤ δ $ , on ait
|c|
||g(x)| − |c|| ≤ |g(x) − c| ≤ ,
2
et dès lors, pour les mêmes valeurs de x,
|c|
|g(x)| ≥ .
2
En conséquence, dom 1g ⊃ dom g ∩ B2 [a; δ $], ce qui entraı̂ne aussitôt que
dom 1g ∩ B2 [a; r] /= ∅ pour tout r > 0. Pour tout x ∈ dom 1g , on a
# # # #
#1
# (x) − 1 # = # 1 − 1 # = |c − g(x)| .
# # #
#g c # # g(x) c # |c||g(x)|
Soit maintenant ! > 0; par hypothèse,
!|c|2
(∃δ $$ > 0)(∀x ∈ dom g : |x − a|2 ≤ δ $$ ) : |g(x) − c| ≤ .
2
Dès lors, en posant δ = min{δ $ , δ $$ }, on aura, en rassemblant les résultats
qui précèdent, pour chaque x ∈ dom 1g tel que |x − a|2 ≤ δ,
# #
#1
# (x) − 1 # ≤ !|c| . 1 . 2 = !.
# 2
#g c # 2 |c| |c|
Remarque. Le lecteur trouvera facilement des exemples montrant qu’on ne

peut tirer aucune conclusion générale sur la valeur de la limite d’un quotient
lorsque le dénominateur a une limite nulle. Nous analyserons plus tard
quelques situations particulières.
En appliquant les résultats qui précèdent à f |E et g|E , on obtient immédi-
atement les règles de calcul pour la limite lorsque x tend vers a dans E des
sommes, produits et quotients de fonctions.
Le résultat qui suit donne des conditions sous lesquelles la limite du
composé de deux fonctions existe.
Proposition. Soit f une fonction de Rn dans Rp, g une fonction de Rp dans
Rq , a ∈ Rn , b ∈ Rp et c ∈ Rq tels que a ∈ adh dom (g ◦ f ) et b ∈ adh dom g.
Si
lim f (x) = b et lim g(y) = c,
x→a y→b
alors
lim (g ◦ f )(x) = c.
x→a
Démonstration. Soit ! > 0; par hypothèse,
(∃η > 0)(∀y ∈ dom g : |y − b|2 ≤ η) : |g(y) − c|2 ≤ !,
et, pour cet η > 0,
(∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ) : |f (x) − b|2 ≤ η.
Dès lors, pour tout x ∈ dom (g◦f ) tel que |x−a|2 ≤ δ, on aura f (x) ∈ dom g
et |f (x) − b|2 ≤ η, et dès lors
|(g ◦ f )(x) − c|2 = |g(f (x)) − c|2 ≤ !.
Remarques. 1. En appliquant le résultat précédent à f |E , on obtient un

théorème sur la limite, lorsque x tend vers a dans E, du composé g ◦ f .
2. On peut démontrer que la proposition cesse d’être vraie si l’on remplace
l’hypothèse
lim g(y) = c
y→b
par
lim g(y) = c.
y→b, y(=b
Dans ce dernier cas, la limite de g ◦ f lorsque x tend vers a peut cesser

d’exister, être égale à g(b) ou être égale à c.
Donnons quelques conséquences du théorème sur la limite des fonctions
composées. Pour i = 1, 2 ou ∞, désignons par |f |i la fonction de Rn dans
Rp de domaine égal à dom f définie pour chaque x ∈ dom f par |f |i(x) =
|f (x)|i.
Corollaire. Soit f une fonction de Rn dans Rp, a ∈ Rn et b ∈ Rp tels que
limx→a f (x) = b. Alors, pour i = 1, 2 ou ∞, on a
lim |f |i(x) = |b|i.

x→a
Démonstration. Soit i = 1, 2 ou ∞; si g désigne l’application de Rp dans

R définie par g(y) = |y|i, on a évidemment |f |i = g ◦f et dom g ◦f = dom f .
D’ailleurs, pour chaque y ∈ Rp et chaque z ∈ Rp , on a la relation
||y|i − |z|i| ≤ |y − z|i ,
qui se démontre exactement comme l’inégalité correspondante pour la valeur

absolue et entraı̂ne aussitôt que, pour chaque z ∈ Rp , on a
lim g(y) = g(z).

y→z
La thèse résulte alors du théorème sur la limite d’une fonction composée.

La réciproque de ce résultat est fausse : limx→a |f |i(x) peut exister sans
que limx→a f (x) n’existe (penser à f (x) = |x| x
avec a = 0). Toutefois, la
réciproque est vraie dans le cas d’une limite nulle.
Corollaire. Soit f une fonction de Rn dans Rp , a ∈ Rn et b ∈ Rp tels que,
pour i = 1, 2 ou ∞, on ait
lim |f |i(x) = 0.
x→a
Alors, limx→a f (x) = 0.

Démonstration. C’est une conséquence immédiate de la définition et du
fait que, pour chaque x ∈ dom f , on a
||f |i(x)| = |f (x)|i ≤ n|f (x)|2 .

Une autre conséquence montre l’équivalence entre l’existence de la limite

des valeurs d’une fonction et de la limite des valeurs de chaque composante
de la fonction.
Corollaire. Soit f une fonction de Rn dans Rp , a ∈ Rn et b ∈ Rp . Alors,
limx→a f (x) = b si et seulement si, pour chaque 1 ≤ j ≤ p, on a
lim fj (x) = bj .
x→a
Démonstration. Pour chaque 1 ≤ j ≤ p, on a fj = pj ◦ f si pj désigne

l’application projection sur la j e composante de Rp dans R; en particulier,
dom fj = dom f.
Condition nécessaire. Pour chaque y ∈ Rp et chaque z ∈ Rp , on a
|pj (y) − pj (z)| = |yj − zj | ≤ |y − z|2 ,
on en déduit immédiatement que, pour chaque z ∈ Rp , on a limy→z pj (y) =

pj (z), et le résultat découle du théorème sur la limite d’une fonction com-
posée.
Condition suffisante. Soit ! et 1 ≤ j ≤ p; par hypothèse
!
(∃δj > 0)(∀x ∈ dom fj : |x − a|2 ≤ δj ) : |fj (x) − bj | ≤ .
p1/2
Dès lors, si l’on pose δ = min{δ1 , . . . , δp}, on voit que, pour chaque x ∈
dom f tel que |x − a|2 ≤ δ, on a
 1/2  1/2
p
$ p
$ !2
|f (x) − b|2 =  |fj (x) − bj |2  ≤  = !.
j=1 j=1
p
Ce résultat montre que l’étude de la limite des valeurs d’une fonction

de Rn dans Rp peut se ramener à l’étude de la limite des valeurs des p
fonctions composantes, qui sont chacune à valeurs réelles. Par contre, l’étude
de la limite des valeurs d’une fonction de Rn dans Rp ne peut pas se faire
“composante par composante” dans l’espace de départ Rn de la fonction, ainsi
que le montre l’exemple suivant.
Exemple. La fonction f de R2 dans R définie par f (x1 , x2 ) = xx21+x
x2
2 a pour
1 2
domaine R2 \ {0}. Si x1 = 0, alors, pour tout x2 /= 0, on a f (0, x2 ) = 0 et
dès lors
lim f (0, x2 ) = 0.
x2 →0
Si x1 /= 0 est fixé, la fonction réelle d’une variable réelle f (x1 , ·) : x2 2→ xx21+x

x2
2
1 2
est définie pour chaque x2 ∈ R, et il est facile de montrer, en utilisant par
exemple le théorème sur la limite d’un quotient de fonctions, que, pour
chaque x1 /= 0 fixé,
lim f (x1 , x2 ) = 0.
x2 →0
Ces résultats entraı̂nent aussitôt que
2 3
lim lim f (x1 , x2 ) = 0.
x1 →0 x2 →0
Comme f est symétrique par rapport à x1 et x2 , on a évidemment aussi

2 3
lim lim f (x1 , x2 ) = 0.
x2 →0 x1 →0
Il ne faut pourtant pas en déduire que limx→0 f (x1 , x2 ) = 0, car cette limite
n’existe pas ! En effet, pour chaque point de la forme (x1 , x1 ) avec x1 /=
x2
0, on a f (x1 , x1 ) = 2x12 = 12 et l’on en déduit aussitôt que, pour chaque
1
δ > 0, si l’on choisit x = (δ, 0) et x$ = ( 21/2
δ δ
, 21/2 ), on a |x|2 = |x$ |2 = δ et
|f (x) − f (x$ )| = 12 , ce qui montre que la négation de la condition nécessaire
de Cauchy est satisfaite avec ! = 14 .
Montrons enfin que la limite respecte les inégalités non strictes entre
fonctions à valeurs réelles.
Proposition. Soient f et g des fonctions de Rn dans R, a ∈ Rn , b ∈ R et
c ∈ R. Si,
x→a, x∈dom g x→a, x∈dom f
et si, pour tout x ∈ dom f ∩ dom g, on a f (x) ≤ g(x), alors b ≤ c.

Démonstration. On sait qu’il est équivalent de démontrer que, pour
chaque ! > 0, on a b ≤ c + !. Soit donc ! > 0; par hypothèse,
! !
(∃δ $ > 0)(∀x ∈ dom f ∩ dom g : |x − a|2 ≤ δ $ ) : − ≤ f (x) − b ≤ ,
2 2
et
! !
(∃δ $$ > 0)(∀x ∈ dom g ∩ dom f : |x − a|2 ≤ δ $$ ) : − ≤ g(x) − c ≤ .
2 2
Dès lors, si δ = min{δ $ , δ $$ } et si x ∈ dom f ∩ dom g est tel que |x − a|2 ≤ δ,
on aura
! ! ! !
b ≤ f (x) + ≤ g(x) + ≤ c + + = c + !.
2 2 2 2
2.5. FORMULATIONS ÉQUIVALENTES ET CARACTÈRE LOCAL 59
L’exemple de la fonction réelle d’une variable réelle f définie par f (x) =

x2
|x| qui est strictement positive sur son domaine R \ {0} et a pour limite 0
lorsque x tend vers zéro montre qu’une inégalité stricte n’est pas nécessaire-
ment conservée à la limite; seule l’inégalité non stricte correspondante est
satisfaite, en vertu de la proposition que nous venons de démontrer.
En considérant f |E et g|E , on voit immédiatement que tous ces résultats
restent valables pour les limites lorsque x tend vers a dans E.
2.5 Formulations équivalentes et caractère local

On va montrer que la notion de limite des valeurs de f lorsque x tend vers
a peut s’exprimer en termes de voisinages.
Soit f une fonction de Rn dans Rp , a ∈ Rn et b ∈ Rp.
Proposition. limx→a f (x) = b si et seulement si
2’) (∀V : V est voisinage de b)(∃U : U est voisinage de a) : f (U ) ⊂ V.
Démonstration. Condition nécessaire. Il faut montrer que la condition 2
de la définition de limite entraı̂ne la condition 2’. Soit V un voisinage de b;
il existe donc ! > 0 tel que B2 [b; !] ⊂ V. Pour cet ! > 0, la condition 2 dans
la définition de la limite entraı̂ne l’existence d’un δ > 0 tel que, pour tout
x ∈ dom f ∩ B2 [a; δ], on ait f (x) ∈ B2 [b; !]. En d’autres termes, le voisinage
U = B2 [a; δ] est tel que f (U ) ⊂ B2 [b; !] ⊂ V.
Condition suffisante. Il faut montrer que si 2’ est satisfaite, il en est de
même de la condition 2 de la définition de la limite. Soit donc ! > 0; comme
V = B2 [b; !] est un voisinage de b, il existera par (2’) un voisinage U de a
tel que
f (U ) ⊂ V = B2 [b; !],
c’est-à-dire tel que, pour tout x ∈ dom f ∩ U , on ait |f (x) − b|2 ≤ !. D’autre
part, U étant un voisinage de a, il existe un δ > 0 tel que B2 [a; δ] ⊂ U, et on
aura donc aussi |f (x) − b|2 ≤ ! pour tout x ∈ dom f tel que |x − a|2 ≤ δ.
Rappelons que n’importe quelle boule Bi [a; r] est voisinage de a ∈ Rn ,
n’importe quelle boule Bi [b; r] est voisinage de b ∈ Rp (i = 1, 2, ∞) et que
tout voisinage d’un point contient une boule en chacune des normes centrée
en ce point. Une conséquence de ce fait et de la proposition précédente
est évidemment que, dans la condition 2 de définition de la limite, on peut
remplacer |x − a|2 par |x − a|i et |f (x) − b|2 par |f (x) − b|j pour n’importe
quel choix de i, j = 1, 2 ou ∞.
Comme la notion de voisinage est liée à celle de point intérieur et que

cette notion peut s’exprimer en fonction de la notion de point adhérent, on
peut s’attendre à ce qu’il existe une formulation de la notion de limite en
termes de points adhérents. C’est bien le cas et l’on a la caractérisation
suivante, que nous n’utiliserons pas dans la suite et dont nous laissons la
démonstration au lecteur, en lui suggérant de démontrer la condition suf-
fisante par contraposition.
Proposition. limx→a f (x) = b si et seulement si
2”) (∀A ⊂ Rn : a ∈ adh (dom f ∩ A)) : b ∈ adh f (A).
On obtient évidemment des caractérisations analogues pour la limite de
f (x) lorsque x tend vers a dans E en appliquant les résultats précédents à
f |E .
Etudions maintenant l’influence du choix de l’ensemble de contraintes E
sur l’existence de la limite. Soit f une fonction de Rn dans Rp, a ∈ Rn ,
b ∈ Rp et E ⊂ Rn .
Le premier résultat montre que l’existence de la limite se maintient si l’on
diminue E en respectant évidemment la première condition de la définition.
Proposition. Si F ⊂ E et si a ∈ adh (dom f ∩ F ) et limx→a, x∈E f (x) = b,
alors, limx→a, x∈F f (x) = b.
Démonstration. C’est une conséquence immédiate de la définition.
Un exemple antérieur a montré qu’on pouvait par contre perdre l’existen-
ce de la limite en agrandissant l’ensemble des contraintes E. On a toutefois
l’importante propriété suivante, qui montre le caractère local de la notion de
limite, en ce sens que l’existence et la valeur de la limite ne dépendent que
des valeurs de la fonction dans un voisinage arbitrairement petit du point
considéré.
Proposition. Soit W un voisinage de a. Alors
lim f (x) = b ⇔ lim f (x) = b.

x→a, x∈E x→a, x∈E∩W
Démonstration. Condition nécessaire. Puisque E ∩ W ⊂ E, il suf-

fit, pour pouvoir appliquer la proposition précédente, de montrer que a ∈
adh (dom f ∩ E ∩ W ). Pour ce faire, soit r > 0; puisque W et B2 [a; r] sont
voisinages de a, il en est de même de W ∩ B2 [a; r], et il existe donc r $ ∈ ]0, r]
tel que B2 [a; r $] ⊂ W ∩ B2 [a; r]; d’autre part, puisque a ∈ adh (dom f ∩ E),
on a dom f ∩ E ∩ B2 [a; r $] /= ∅ et dès lors dom f ∩ E ∩ W ∩ B2 [a; r] /= ∅.
2.5. FORMULATIONS ÉQUIVALENTES ET CARACTÈRE LOCAL 61
Condition suffisante. Bien entendu, l’hypothèse a ∈ adh (dom f ∩ E ∩ W )

entraı̂ne a ∈ adh (dom f ∩ E). Il suffit donc maintenant de démontrer la
condition 2’ de la caractérisation de la limite par les voisinages. Soit V
un voisinage de b; par hypothèse, il existe un voisinage U $ de a tel que
f (U $ ∩ E ∩ W ) ⊂ V et, comme U $ ∩ W est un voisinage de a, il existe donc
un voisinage U = U $ ∩ W de a tel que f (U ∩ E) ⊂ V .
Pour une fonction f d’une variable réelle, les choix particuliers suivants
pour E donnent lieu à une terminologie et à des notations particulières. Si
f est une fonction de R dans Rp , a ∈ R et si E = {x ∈ R : x < a}, alors,
lorsque b = limx→a, x∈E f (x), on dira que b est la limite à gauche de f (x)
lorsque x tend vers a, et l’on écrira
b= lim f (x) ou b = lim f (x).

x→a, x<a x→a−
D’une manière similaire, si E = {x ∈ R : x > a}, et b = limx→a, x∈E f (x), on

dira que b est la limite à droite de f (x) lorsque x tend vers a, et l’on écrira
b= lim f (x) ou b = lim f (x).

x→a, x>a x→a+
La propriété d’existence de la limite lorsqu’on diminue l’ensemble des

contraintes entraı̂ne aussitôt la proposition suivante.
Proposition. Soit f une fonction de R dans Rp et a ∈ R. Si
a ∈ adh (dom f ∩ {x ∈ R : x < a}) ∩ adh (dom f ∩ {x ∈ R : x > a}),
et si limx→a, x(=a f (x) = b, alors
lim f (x) = lim f (x) = b.

x→a− x→a+
La réciproque est vraie dans le sens suivant.

Proposition. Soit f une fonction de R dans Rp et a ∈ R. Si
lim f (x) = lim f (x) = b,

x→a− x→a+
alors limx→a, x(=a f (x) = b.

Démonstration. Comme, par hypothèse, on a
a ∈ adh (dom f ∩ {x ∈ R : x < a}) ∩ adh (dom f ∩ {x ∈ R : x > a}),

on a évidemment que a ∈ adh [dom f ∩ (R \ {a})]. Soit ! > 0; par hypothèse,

(∃δ $ > 0)(∀x ∈ dom f : a − δ $ ≤ x < a) : |f (x) − b|2 ≤ !,
et
(∃δ $$ > 0)(∀x ∈ dom f : a < x ≤ a + δ $$ ) : |f (x) − b|2 ≤ !.
Dès lors, si δ = min{δ $ , δ $$}, et si x ∈ dom f \ {a} est tel que |x − a| ≤ δ, on
aura |f (x) − b|2 ≤ !.
2.6 Limites à l’infini et convergence des suites

Introduisons d’abord la notion de partie bornée de Rn .
Définition. On dit qu’une partie A de Rn est bornée s’il existe un r > 0
tel que A ⊂ B2 [r].
On montre sans peine que A est bornée si et seulement s’il existe un
r > 0 tel que A ⊂ Bi [r] pour i = 1, 2 ou ∞. L’ensemble vide est borné et
toute boule est bornée. En outre, il est évident que si A est bornée et si
B ⊂ A, alors B est bornée. La définition entraı̂ne aussi que A ⊂ Rn est non
bornée si et seulement si, pour tout r > 0, on a A /⊂ B2 [r], ou encore si et
seulement si,
(∀r > 0)(∃x ∈ A) : |x|2 > r.
En particulier, le théorème d’Archimède entraı̂ne que N∗ est non borné
puisque, si r > 0 est donné, il existe un m ∈ N∗ tel que m = m.1 ≥ r + 1, et
dès lors ce m /∈ B[r] = [−r, r]. D’autre part, si A est non borné et B ⊃ A,
B est non borné (par contraposition du résultat ci-dessus), et l’on en déduit
que Rn est une partie non bornée de Rn et que R, Q, Z et N sont des parties
non bornées de R.
L’exemple de la fonction f de Rn dans R définie par f (x) = |x|1 2 pour
chaque x /= 0 montre que la propriété “prendre la valeur zéro” est vérifiée
“approximativement” au sens donné dans l’introduction de la notion de lim-
ite non pas pour des valeurs suffisamment proches d’un point a de Rn mais
pour les points de Rn de norme suffisamment grande. En effet, si ! > 0 est
donné, on aura |f (x)| = |x|1 2 ≤ ! dès que |x|2 ≥ 1! . On est ainsi conduit à la
définition suivante de limite à l’infini pour une fonction.
Définition. Soit f une fonction de Rn dans Rp et b ∈ Rp. On dit que f (x)
tend vers b lorsque x tend vers l’infini, et l’on écrit
f (x) → b si x → ∞,
2.6. LIMITES À L’INFINI ET CONVERGENCE DES SUITES 63
si les conditions suivantes sont satisfaites :

1) dom f est non borné;
2) (∀! > 0)(∃ρ > 0)(∀x ∈ dom f : |x|2 ≥ ρ) : |f (x) − b|2 ≤ !.
Comme dans le cas classique, on démontre qu’il existe au plus un b
vérifiant cette définition (on écrit alors
b = lim f (x))
x→∞
et que la condition de Cauchy
(∀! > 0)(∃ρ > 0)(∀x ∈ dom f : |x|2 ≥ ρ)
(∀x$ ∈ dom f : |x$ |2 ≥ ρ) : |f (x) − f (x$ )|2 ≤ !,

est une condition nécessaire d’existence de la limite de f pour x tendant vers
l’infini. Une condition nécessaire pour la condition de Cauchy soit vérifiée,
et qui se démontre comme dans le cas classique, est que f soit bornée à
l’infini au sens de la définition suivante.
Définition. Soit f une fonction de Rn dans Rp . On dit que f est bornée à
l’infini si dom f est non borné et si la condition suivante est vérifiée:
(∃r > 0)(∃ρ > 0)(∀x ∈ dom f : |x|2 ≥ ρ) : |f (x)|2 ≤ r.
Enfin, les règles de calcul des limites s’étendent aussi, avec des démonstra-
tions analogues, à la limite à l’infini.
Si E est une partie de Rn , alors, en appliquant la définition ci-dessus
à f |E , on obtient immédiatement la notion de limite des valeurs de f (x)
lorsque x tend vers l’infini dans E.
Définition. Soit f une fonction de Rn dans Rp , b ∈ Rp et E ⊂ Rn . On dit
que f (x) tend vers b lorsque x tend vers l’infini dans E, et l’on écrit
f (x) → b si x → ∞ dans E,
si les conditions suivantes sont satisfaites :

1) dom f ∩ E est non borné;
2) (∀! > 0)(∃ρ > 0)(∀x ∈ dom f ∩ E : |x|2 ≥ ρ) : |f (x) − b|2 ≤ !.
Lorsque f est une fonction d’une variable réelle, des choix particuliers
de E bénéficient d’une terminologie et de notations spéciales. Ainsi, lorsque
E = R+ (resp. E = R− ) et que
lim f (x) = b, (resp. lim f (x) = b),

x→∞, x∈R+ x→∞, x∈R−
on dit que f (x) tend vers b lorsque x tend vers plus l’infini (resp. moins
l’infini), et l’on écrit
lim f (x) = b, (resp. lim f (x) = b).

x→+∞ x→−∞
Ces notions correspondent donc respectivement aux conditions
(∀! > 0)(∃ρ > 0)(∀x ∈ dom f : x ≥ ρ) : |f (x) − b|2 ≤ !,
et
(∀! > 0)(∃ρ > 0)(∀x ∈ dom f : x ≤ −ρ) : |f (x) − b|2 ≤ !.
Exemple. Soit f l’application de R dans R définie par f (x) = 1+|x| x
. Si
! > 0 est donné, alors, pour x ≥ 0, |f (x) − 1| = | 1+x − 1| = 1+x ≤ ! dès que
x 1
x ≥ 1! − 1. On voit donc que limx→+∞ f (x) = 1. On montre de même que

limx→−∞ f (x) = −1. D’autre part, pour chaque ρ > 0, on a
# #
# ρ −ρ ## 2ρ
|f (ρ) − f (−ρ)| = #
# − # = >1
1+ρ 1+ρ 1+ρ
si ρ > 1. On en déduit aisément que la condition nécessaire de Cauchy
d’existence de limx→∞ f (x) n’est pas satisfaite et que cette dernière limite
n’existe pas.
Les notions que nous venons de développer s’appliquent évidemment dans
le cas particulier d’une suite (ak )k∈N dans Rp , c’est-à-dire d’une application
de N (ou de N∗ ) dans Rp. Si b ∈ Rp alors b = limk→∞ ak si et seulement si
(∀! > 0)(∃ρ > 0)(∀k ∈ N : k ≥ ρ) : |ak − b|2 ≤ !.
Etant donné que, pour chaque ρ > 0, le théorème d’Archimède affirme

l’existence d’un entier naturel m ≥ ρ, il est clair que la condition précédente
est équivalente à la condition
(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m) : |ak − b|2 ≤ !,
plus couramment utilisée pour caractériser la limite d’une suite. On vérifie

immédiatement à partir de cette définition que, si q ∈ N est fixé, alors
lim ak = b ⇔ lim aq+k = b,

k→∞ k→∞
ce qui traduit simplement le fait qu’on peut ignorer les q premiers termes
d’une suite sans modifier l’existence et la valeur de sa limite. Lorsque la
2.6. LIMITES À L’INFINI ET CONVERGENCE DES SUITES 65
limite de (ak )k∈N existe, on dit aussi que la suite (ak )k∈N converge ou est
une suite convergente; sinon on dit qu’elle diverge ou est une suite divergente.
Les points ak de Rp sont souvent appelés les termes de la suite.
Exemple. La suite ( k1 )k∈N∗ converge vers zéro et la suite ((−1)k )k∈N diverge.
On le vérifiera comme exercice.
La condition nécessaire de Cauchy peut s’écrire, dans le cas d’une suite
(ak )k∈N dans Rp sous la forme équivalence
(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q ≥ m) : |ak − aq |2 ≤ !.
Les règles de calcul des limites s’appliquent évidemment au cas particulier

des suites.
On peut caractériser la notion de point adhérent à une partie de Rn en
termes de la notion de convergence d’une suite.
Proposition. Soit a ∈ Rn et E une partie de Rn . Alors a est adhérent à E
si et seulement s’il existe une suite (xk )k∈N dans E qui converge vers a.
Démonstration. Condition nécessaire. Soit a adhérent à E; alors, pour
chaque k ∈ N, on a E ∩ B2 [a; k+1 1
] /= ∅; on d’autres termes, pour chaque
k ∈ N, il existe un xk ∈ E ∩ B2 [a; k+1 1
], c’est-à-dire un xk ∈ E tel que
|xk − a|2 ≤ k+1 . Cette dernière condition entraı̂ne aussitôt que la suite
1
(xk )k∈N converge vers a.

Condition suffisante. Soit (xk )k∈N une suite dans E qui converge vers a. En
conséquence, si r > 0 est donné,
(∃m ∈ N)(∀k ∈ N : k ≥ m) : |xk − a|2 ≤ r,
et dès lors, xm ∈ E ∩ B2 [a; r]. Donc a ∈ adh E.

On peut également caractériser en termes de suite la notion de limite en
un point des valeurs d’une fonction.
Proposition. Soit f une fonction de Rn dans Rp , a ∈ Rn et b ∈ Rp . Alors,
limx→a f (x) = b si et seulement si les deux conditions suivantes sont satis-
faites :
2) toute suite (xk )k∈N dans dom f qui converge vers a, a pour image une
suite (f (xk ))k∈N qui converge vers b.
Démonstration. Condition nécessaire. Soit (xk )k∈N une suite dans
dom f qui converge vers a. Si l’on désigne par h : N → Rn , k 2→ xk ,
l’application correspondante, on voit que, pour chaque k ∈ N, f (xk ) =
(f ◦ h)(k), dom (f ◦ h) = N, et il suffit d’appliquer le théorème de la limite

d’une fonction composée.
Condition suffisante. On démontre le contraposé. Si b n’est pas limite de
f (x) lorsque x tend vers a, alors
(∃! > 0)(∀δ > 0)(∃x ∈ dom f : |x − a|2 ≤ δ) : |f (x) − b|2 > !.
En choisissant successivement δ = k+1 1
pour chaque k ∈ N, on trouve ainsi
un xk ∈ dom f tel que |xk − a|2 ≤ k+1 et |f (xk ) − b|2 > !. En conséquence,
1
la suite (xk )k∈N ainsi obtenue est une suite dans dom f qui converge vers a
et est telle que f (xk )k∈N ne converge pas vers b.
La forme contraposée de cette caractérisation de la limite des valeurs
d’une fonction est souvent utile pour montrer que la limite n’est pas égale
à b : il suffira de trouver une suite (xk )k∈N dans dom f qui converge vers
a et soit telle que la suite f (xk )k∈N ne converge pas vers b. On en déduit
également un moyen utile pour prouver la non-existence de la limite : il
suffira de trouver une suite (xk )k∈N dans dom f qui converge vers a et soit
telle que la suite f (xk )k∈N converge vers b$ et une suite (x$k )k∈N dans dom f
qui converge vers a et soit telle que la suite f (x$k )k∈N converge vers b$$ /= b$ .
En appliquant le résultat précédent à f |E , on obtient une caractérisation
en termes de suites de la limite de f (x) lorsque x tend vers a dans E.
2.7 Limites infinies

Soit f une fonction de Rn dans R et a ∈ adh dom f. Nous allons analyser
la situation dans laquelle la limite de f (x) lorsque x tend vers a n’existe
pas parce que |f (x)|2 prend des valeurs arbitrairement grandes lorsque x est
suffisamment proche de a. Par abus de langage, on parle alors d’existence
d’une limite infinie pour f .
Définition. Soit f une fonction de Rn dans Rp et a ∈ Rn . On dit que f (x)
tend vers l’infini lorsque x tend vers a, et l’on écrit
lim f (x) = ∞,
x→a
si les conditions suivantes sont réalisées.
1. a ∈ adh dom f.
2. (∀r > 0)(∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ) : |f (x)|2 ≥ r.
Par exemple, la fonction f : x 2→ |x|−1 2 est telle que limx→0 f (x) = ∞,
puisque, si r > 0 est donné, on a |x|−1
2 ≥ r dès que 0 < |x|2 ≤ r −1 .
On a une notion semblable lorsque x tend vers l’infini.
2.7. LIMITES INFINIES 67
Définition. Soit f une fonction de Rn dans Rp . On dit que f (x) tend vers
l’infini lorsque x tend vers l’infini, et l’on écrit
lim f (x) = ∞,
x→∞
si les conditions suivantes sont réalisées.

1. dom f est non borné.
2. (∀r > 0)(∃ρ > 0)(∀x ∈ dom f : |x|2 ≥ ρ) : |f (x)|2 ≥ r.
Par exemple, la fonction identité sur Rn tend vers l’infini lorsque x tend
vers l’infini.
On montre facilement que les définitions ci-dessus ne dépendent pas du
choix de la norme |·|2 et qu’on peut utiliser n’importe quelle autre norme. Si
E est une partie de Rn , on obtient évidemment les situations correspondantes
lorsque x tend vers a dans E ou lorsque x tend vers l’infini dans E en
appliquant les définitions ci-dessus à la restriction f |E de f à E. Cela revient,
dans les définitions ci-dessus, à remplacer partout dom f par dom f ∩ E.
Dans le cas particulier où p = 1, on utilise la structure d’ordre sur R pour
introduire les situations suivantes.
Définition. Soit f une fonction de Rn dans R et a ∈ Rn . On dit que f (x)
tend vers +∞ (resp. −∞) lorsque x tend vers a, et l’on écrit
lim f (x) = +∞ (resp. lim f (x) = −∞),

x→a x→a
si les conditions suivantes sont vérifiées.

1. a ∈ adh dom f.
2. (∀r > 0)(∃δ > 0)(∀x ∈ dom f : |x−a|2 ≤ δ) : f (x) ≥ r (resp. f (x) ≤ −r).
Définition. Soit f une fonction de Rn dans R. On dit que f (x) tend vers
+∞ (resp. −∞) lorsque x tend vers l’infini, et l’on écrit
lim f (x) = +∞ (resp. lim f (x) = −∞),

x→∞ x→∞
si les conditions suivantes sont vérifiées.

1. dom f est non borné.
2. (∀r > 0)(∃ρ > 0)(∀x ∈ dom f : |x|2 ≥ ρ) : f (x) ≥ r (resp. f (x) ≤ −r).
On a bien entendu des définitions analogues pour x tendant vers a ou
vers l’infini dans E ⊂ Rn en appliquant ces définitions à f |E .
Insistons sur le fait que ces définitions couvrent des situations où la limite
n’existe pas. Les conditions nécessaires d’existence de la limite et les règles
de calcul des limites n’ont donc aucune raison de s’appliquer, et il est facile
de le montrer par des exemples. D’ailleurs les énoncés correspondants n’ont
eux-mêmes souvent aucun sens. Il convient donc de traiter ces notions avec
prudence en retournant aux définitions.
La notion de limite infinie fournit toutefois des compléments d’informati-
on sur les limites de quotients de fonctions dans des situations où les règles
de calcul classiques ne s’appliquent pas. Nous les formulons dans le cas où
x tend vers a. On a des résultats entièrement analogues lorsque x tend vers
l’infini, dont les énoncés et les démonstrations sont laissés au lecteur.
de Rn dans R (resp. C) et a ∈ adh (dom f ∩ dom 1/g). Si
lim g(x) = 0
x→a
et s’il existe δ1 > 0 et η1 > 0 tels que |f (x)|2 ≥ η1 pour tout x ∈ dom f ∩
B2 [a; δ1 ], (ce qui est le cas si limx→a f (x) = b /= 0), alors
f
lim (x) = ∞.
x→a g
Démonstration. Soit r > 0; et soient δ1 et η1 donnés par les hypothèses.
Puisque g(x) tend vers 0 lorsque x tend vers a, il existera δ2 > 0 tel que,
pour tout x ∈ dom g ∩ B2 [a; δ2 ], on a |g(x)| ≤ ηr1 . Dès lors, si δ = min{δ1 , δ2 }
et si x ∈ dom f ∩ dom 1/g ∩ B2 [a; δ], on aura
# #
# (x)# = |f (x)|2 ≥ η1 r = r.
#f #
#g # |g(x)| η1
2

de Rn dans R (resp. C) et a ∈ adh dom f ∩ dom g. Si
lim g(x) = ∞
x→a
et si f est localement bornée en a, (ce qui est le cas si limx→a f (x) existe),
alors
f
lim (x) = 0.
x→a g
Démonstration. Notons tout d’abord qu’on montre facilement, comme

dans le cas classique de la limite d’un quotient, que a ∈ adh dom fg , en
2.8. CONTINUITÉ D’UNE FONCTION EN UN POINT 69
montrant que g ne s’annule pas suffisamment près de a. Par l’hypothèse sur

f , il existe δ1 > 0 et r1 > 0 tels que, pour tout x ∈ dom f ∩ B2 [a; δ1 ], on a
|f (x)|2 ≤ r1 . Soit ! > 0; l’hypothèse sur g entraı̂ne l’existence d’un δ2 > 0
tel que, pour tout x ∈ dom g ∩ B2 [a; δ2 ], on a |g(x)| ≥ r!1 . En conséquence,
si δ = min{δ1 , δ2 }, on aura, pour tout x ∈ dom fg tel que |x − a|2 ≤ δ, :
# #
# (x)# = |f (x)|2 ≤ r1 ! = !.
#f #
#g # |g(x)| r1
2
La notion de limite infinie fournit également, par une démonstration

entièrement analogue à celle du cas classique, une caractérisation en termes
de suites de l’existence de la limite limite de f (x) lorsque x tend vers l’infini.
Proposition. Soit f une fonction de Rn dans Rp telle que dom f soit non
borné et soit b ∈ Rp . Alors, limx→∞ f (x) = b si et seulement si, pour toute
suite (xk )k∈N dans dom f telle que xk → ∞ si k → ∞, la suite (f (xk ))k∈N
converge vers b.
2.8 Continuité d’une fonction en un point

Soit f une fonction de Rn dans Rp; nous allons maintenant étudier le pro-
blème de la limite de ses valeurs en un point a appartenant au domaine de
f . Dans ce cas, l’existence de la limite lorsque x tend vers a se ramène à
la vérification de la deuxième condition. Si cette deuxième condition est
vérifiée, on dira que f est continue en a; si elle ne l’est pas, on dira que f
est discontinue en a. En d’autres termes, on a la définition suivante.
Définition. Soit f une fonction de Rn dans Rp et a ∈ dom f . On dit que
f est continue au point a si limx→a f (x) existe et que f est discontinue au
point a si limx→a f (x) n’existe pas.
Bien entendu, dans l’expression d’existence de la limite, on pourra utiliser
n’importe laquelle des formulations équivalentes.
On a l’utile propriété suivante.
Proposition. Soit f une fonction de Rn dans Rp et a ∈ dom f . Alors f est
continue en a si et seulement si limx→a f (x) = f (a).
Démonstration. Condition nécessaire. Soit b = limx→a f (x). Par la ca-
ractérisation de la limite en termes de suites, si on prend la suite constante
(xk )k∈N définie par xk = a pour chaque k ∈ N, on obtient une suite dans
dom f convergeant vers a et dès lors la suite (constante) (f (xk ))k∈N égale
pour tout k ∈ N à f (a) convergera vers b; mais sa limite est évidemment
f (a), ce qui entraı̂ne que f (a) = b.
Condition suffisante. Elle est évidente.
Cette proposition montre qu’en un point de continuité d’une fonction, il
suffit simplement, pour obtenir la limite, de calculer la valeur de la fonction
en ce point. On pourra donc gagner beaucoup de temps, dans le calcul des
limites, en identifiant rapidement les points de continuité d’une fonction.
Il existe une condition sur a et dom f qui assure toujours la continuité
de f en a.
Définition. Si E ⊂ Rn et si a ∈ E, on dit que a est un point isolé de E s’il
existe r > 0 tel que B2 [a; r] ∩ E = {a}.
En d’autres termes, a est isolé dans E si et seulement s’il existe un r > 0
tel que B2 [a; r] ∩ (E \ {a}) = ∅ c’est-à-dire si et seulement si a n’est pas
adhérent à E \ {a}.
Proposition. Si f est une fonction de Rn dans Rp et si a est isolé dans
dom f , alors f est continue en a.
Démonstration. Soit r > 0 tel que B2 [a; r] ∩ dom f = {a}. Si ! > 0 est
donné, alors,
{x ∈ dom f : x ∈ B2 [a; r]} = {a},
et évidemment, |f (a) − f (a)|2 = 0 ≤ !.
Considérons maintenant le cas d’un point non isolé du domaine.
Proposition. Soit f une fonction de Rn dans Rp et a un point non isolé de
dom f . Alors
lim f (x) = f (a) ⇔ lim f (x) = f (a).

x→a x→a, x(=a
Démonstration. Condition nécessaire. Elle est évidente puisque, par

hypothèse, a ∈ adh (dom f \ {a}).
Condition suffisante. Soit ! > 0; par hypothèse,
(∃δ > 0)(∀x ∈ dom f \ {a} : |x − a|2 ≤ δ) : |f (x) − f (a)|2 ≤ !.
Comme on a évidemment |f (a)−f (a)|2 = 0 ≤ !, la thèse s’en déduit aussitôt.

2.8. CONTINUITÉ D’UNE FONCTION EN UN POINT 71
Exemples. 1. Toute fonction constante de Rn dans Rp est continue en

chaque point de son domaine et l’application identité I de Rn dans Rn est
continue en chaque point de Rn (vérification immédiate).
2. Si i = 1, 2 ou ∞, l’application | · |i de Rn dans R est continue en chaque
point de Rn ; on effet, si a ∈ Rn on a, pour chaque x ∈ Rn ,
||x|i − |a|i| ≤ |x − a|i ,
et le résultat s’en déduit aussitôt en prenant δ = ! dans la définition.

3. La fonction de Dirichlet est l’application de R dans R définie par d(x) = 1
si x est rationnel et d(x) = 0 si x est irrationnel. Cette fonction n’est continue
en aucun point de R. On le montre en utilisant la condition de non existence
de la limite déduite de la condition nécessaire de Cauchy. Si a ∈ R et si δ > 0
est donné, on a vu que l’intervalle [a−δ, a+δ] contient au moins un rationnel
x et un irrationnel x$ ; on a donc |d(x) − d(x$ )| = 1 et il suffit de prendre
! = 12 dans la négation de la condition de Cauchy.
4. L’application f de R dans R définie par f (x) = x si x est rationnel
et f (x) = −x si x est irrationnel est continue en 0 (le vérifier) mais n’est
continue en aucun autre point de R. En effet, si, pour fixer les idées, a > 0,
alors, pour chaque δ > 0, l’intervalle [a, a + δ] contient un rationnel x et un
irrationnel x$ ; ils sont tels que
|f (x) − f (x$ )| = |x + x$ | = x + x$ ≥ 2a > a,
et la négation de la condition de Cauchy est vérifiée avec ! = a. Le cas où

a < 0 se traite de même et est laissé au lecteur.
5. La fonction racine carrée arithmétique qui à chaque réel positif associe sa
racine carrée arithmétique est continue en chaque point de R+ . En effet, si
√
! > 0 est donné, on a, en a = 0, x ≤ ! pour tout 0 ≤ x ≤ !2 , et, en a > 0,
on a, pour tout x ≥ 0,
# #
√ √ # x−a # |x − a|
| x − a| = ## √ √ ## ≤ √ ,
x+ a a
√
et la dernière expression sera inférieure à ! si |x − a| ≤ a!.
On peut maintenant utiliser les règles de calcul sur les limites pour en
déduire immédiatement des résultats de continuité.
Proposition. 1. Si f et g sont des fonctions de Rn dans Rp continues en
a, alors f + g est continue en a.
2. Si f est une fonction de Rn dans Rp (resp. C) continue en a et g une
fonction de Rn dans R (resp. C) continue en a, alors gf est continue en a et

si, en outre, g(a) /= 0, fg est continue en a.
3. Si f est une fonction de Rn dans Rp continue en a et g une fonction de
Rp dans Rq continue en f (a), alors g ◦ f est continue en a.
Démonstration. Les propriétés 1 et 2 sont des conséquences immédiates
des définitions et des propriétés des limites. Pour la propriété 3, il suffit,
pour appliquer le théorème sur les limites, de noter que a ∈ dom (g ◦ f ).
En combinant cette proposition avec les exemples simples d’applications
continues déjà donnés, on voit que les applications polynômiales (et en par-
ticulier linéaires) de Rn dans Rp sont continues en chaque point de Rn et
que les fonctions rationnelles de Rn dans Rp (c’est-à-dire les fonctions qui
peuvent s’écrire comme quotient d’un polynôme de Rn dans Rp (resp. C)
par un polynôme de Rn dans R (resp. C)) sont continues en chaque point
de Rn où leur dénominateur est différent de zéro.
2.9 Applications linéaires

Approfondissons les propriétés de continuité des applications linéaires. Rap-
pelons qu’une application linéaire de Rn dans Rp est une application L de
Rn dans Rp telle que :
1. (∀x ∈ Rn )(∀y ∈ Rn ) : L(x + y) = L(x) + L(y).
2. (∀c ∈ R)(∀x ∈ Rn ) : L(cx) = cL(x).
On en déduit aussitôt que, pour tout x ∈ Rn , on a
n
$ n
$ n
$
L(x) = L( xj ej ) = L(xj ej ) = xj L(ej ). (2.6)
j=1 j=1 j=1
Réciproquement, si c1 , . . . , cn sont des éléments donnés de Rp , l’application

L de Rn dans Rp définie pour chaque x ∈ Rn par
n
$
L(x) = xj c j , (2.7)
j=1
sera telle que, pour tout x ∈ Rn , tout y ∈ Rn et tout c ∈ R, on ait

n
$ n
$ n
$ n
$
L(x + y) = (x + y)j cj = (xj + yj )cj = xj c j + yj cj = L(x) + L(y),
j=1 j=1 j=1 j=1
2.9. APPLICATIONS LINÉAIRES 73
n
$ n
$ n
$
L(cx) = (cx)j cj = cxj cj = c xj cj = cL(x),
j=1 j=1 j=1
et sera donc linéaire. En conséquence, toute application linéaire de Rn dans
Rp est de la forme (2.7) avec cj = L(ej ), (1 ≤ j ≤ n). Les éléments cj = L(ej )
s’appellent les coefficients de L dans la base canonique. Leurs composantes
Lk (ej ) = pk (L(ej )), (1 ≤ j ≤ n, 1 ≤ k ≤ p) définissent une matrice qui
représente l’application linéaire dans la base canonique. Ainsi, la donnée
d’une application linéaire de Rn dans Rp revient à la donnnée de n éléments
de Rp, c’est-à-dire de np réels. En particulier, la donnée d’une application
linéaire de Rn dans R revient à la donnée de n réels ou encore d’un élément de
Rn et celle d’une application linéaire de R dans Rp revient à la donnée d’un
élément de Rp . On notera aussi que L est l’application nulle si et seulement
si tous les cj sont nuls.
Exemple. Pour chaque 1 ≤ k ≤ n, l’application pk : x 2→ xk (projection sur
la ke composante) est une application linéaire de Rn dans R.
Le résultat suivant est la clef de l’étude des propriétés de continuité d’une
application linéaire.
Proposition. Soit k = 1, 2 ou ∞ et L une application linéaire de Rn dans
Rp . Pour tout x ∈ Rn et (i, j) = (1, ∞), (2, 2) ou (∞, 1), on a
|L(x)|k ≤ |L|k,i|x|j ,
# #
où |L|k,i = #(|L(e1 )|k , . . . , |L(en)|k )#i .
Démonstration. On a, pour chaque x ∈ Rn , en utilisant (2.6),
n
$ n
$
|L(x)|k ≤ |xj L(ej )|k = |xj ||L(ej )|k
j=1 j=1
et dès lors,
 
n
$
|L(x)|k ≤  |L(e )|k  max{|x1 |, . . . , |xn|} = |L|k,1 |x|∞ ,
j
j=1
n
$
|L(x)|k ≤ max{|L(e1 )|k , . . . , |L(en)|k } |xj | = |L|k,∞ |x|1 ,
j=1
et, en utilisant l’inégalité de Cauchy,
 1/2  1/2
n
$ n
$
|L(x)|k ≤  |L(ej )|2k   x2j  = |L|k,2 |x|2 .
j=1 j=1
Corollaire. Si L est une application linéaire de Rn dans Rp, alors, pour

chaque i = 1, 2 ou ∞ et pour tout x ∈ Rn et tout y ∈ Rn , on a
|L(x) − L(y)|i ≤ |L|i,j |x − y|i , (2.8)
et en particulier L est continue en chaque point de Rn et les fonctions x 2→

L(x)
|x|i sont localement bornées en 0.
Démonstration. Le cas de l’application nulle est évident. Sinon, soit
i = 1, 2 ou ∞, x ∈ Rn et y ∈ Rn ; par la proposition précédente et la
linéarité de L, on a
|L(x) − L(y)|i = |L(x − y)|i ≤ |L|i,j |x − y|i ,
et la continuité en y s’en déduit aussitôt en prenant,

# # dans la définition, si
# L(x) #
! > 0 est donné, δ = |L|i,i . Enfin, si x /= 0, on a # |x|i # ≤ |L|i,i, ce qui montre
!
i
que la fonction x 2→ L(x)
|x|i est localement bornée en 0 (elle l’est évidemment
aux autres points puisqu’elle y est continue).
Terminons par quelques remarques sur les applications linéaires de C
dans C. Rappelons que C peut être considéré comme un espace vectoriel sur
R (c’est alors essentiellement R2 ) et comme un espace vectoriel sur C. Dès
lors, nous dirons qu’une application L de C dans C est R-linéaire (resp. C-
linéaire) si elle est linéaire comme application de C dans C où C est considéré
comme espace vectoriel sur R (resp. C.) Ainsi donc, L sera R-linéaire si et
seulement si, pour tout x ∈ C, tout y ∈ C et tout c ∈ R, on a
L(x + y) = L(x) + L(y), L(cx) = cL(x),
et L sera C-linéaire si et seulement si, pour tout x ∈ C, tout y ∈ C et tout

c ∈ C, on a
L(x + y) = L(x) + L(y), L(cx) = cL(x).
Comme R est canoniquement injecté dans C, on en déduit aussitôt que
toute application C-linéaire de C dans C est R-linéaire. La réciproque n’est
pas vraie. En effet, l’application de conjugaison C : C → C, z 2→ z̄ est
évidemment R-linéaire puisque, pour chaque z ∈ C et chaque v ∈ C, on a
C(z + v) = z + v = z̄ + v̄ = C(z) + C(v),
et, pour chaque c ∈ R et chaque z ∈ C, on a
C(cz) = cz = cz̄ = cC(z).

2.10. EXERCICES 75
Mais elle n’est pas C-linéaire puisque
C(i.1) = C(i) = ī = −i /= i.1.
En fait, si L est C-linéaire, alors, pour tout z = x1 + ix2 ∈ C, on a
L(z) = L(z.1) = z.L(1) = x1 L(1) + x2 (iL(1)) = x1 L(e1 ) + x2 L(e2 ),
ce qui montre que les coefficients L(ej ) de L vérifient la relation
L(e2 ) = iL(e1 ),
ou encore, en posant L(ej ) = L1 (ej ) + iL2 (ej ), si et seulement si les coeffi-

cients Lk (ej ) vérifient les relations
L2 (e2 ) = L1 (e1 ), L1 (e2 ) = −L2 (e1 ).
En d’autres termes, la matrice représentant L dans la base canonique doit

avoir ses éléments diagonaux égaux et ses éléments hors diagonale opposés.
On montre facilement que si une application R-linéaire de C dans C vérifie
ces conditions, elle est également C-linéaire.
2.10 Exercices
1. Pour chaque nombre rationnel x, il existe un et un seul couple d’entiers
(m, n) tels que n > 0, m et n soient premiers entre eux et x = m n (représen-
tation irréductible de x). Si l’on définit l’application f de R dans R par
f (x) = n si x est rationnel de représentation irréductible m
n , et f (x) = 0 si
x est irrationnel, montrer que f n’est localement bornée en aucun point de
R. (Raisonner par l’absurde).
2. On définit la suite de Fibonacci (uk )k∈N par u0 = u1 = 1 et
uk+2 = uk+1 + uk ,
pour k ≥ 0. Ainsi, u2 = 2, u3 = 3, u4 = 5, u5 = 8, . . . . On définit la suite

u
(vk )k∈N par vk = uk+1k
. Montrer que, pour tout k ≥ 1, on a vk > 1 et que,
pour tout k ≥ 0, on a
1
vk+1 = 1 + .
vk
En déduire que, si la suite (vk )k∈N converge vers v ∗ , alors v ∗ est la racine
positive de l’équation algébrique
v 2 − v − 1 = 0,
c’est-à-dire √
∗ 1+ 5
v = = 1, 618 . . ..
2
Cette quantité est appelée le nombre d’or. Montrer que, pour tout k ≥ 1,
on a
|vk − v ∗ |
|vk+1 − v ∗ | ≤ ,
v∗
et dès lors
|v1 − v ∗ |
|vk+1 − v ∗ | ≤ .
(v ∗ )k
En déduire que (vk )k∈N converge vers v ∗ .
3. Si p ≥ 1 est un réel et si x ∈ Rn , on définit |x|p par
 1/p
p
$
|x|p =  |xj |p .
j=1
Montrer que
|x|∞ = lim |x|p,
p→∞
ce qui “justifie” la notation utilisée pour la norme |x|∞ . Pour ce faire, on

utilisera les inégalités suivantes, qui sont faciles à démontrer
|x|p ≤ n1/p |x|∞, |x|∞ ≤ |x|p.
4. Si d est la fonction de Dirichlet, montrer que, pour chaque a ∈ R, on a
lim d(x) = 1, lim d(x) = 0.

x→a; x∈Q x→a; x∈R\Q
En déduire que d n’est pas continue en a.

5. Soit f l’application de R dans R définie par f (x) = x si x est rationnel
et f (x) = −x si x est irrationnel. Montrer que f est continue en a si et
seulement si a = 0. La fonction f n’est donc continue qu’à l’origine. Par
contre, on a, pour tout x ∈ R, (f ◦ f )(x) = x, qui est continue en chaque
point de R.
6. Si l’on définit l’application g de R dans R par g(x) = n1 si x est rationnel de
représentation irréductible m n , et g(x) = 0 si x est irrationnel, montrer que
g est continue en chaque point irrationnel et discontinue en chaque point
rationnel. En utilisant le théorème de Baire démontré au chapitre 17, on
peut prouver qu’il n’existe pas de fonction de R dans R qui est discontinue
en chaque point irrationnel et continue en chaque point rationnel.
7. Soit f l’application de R2 dans R définie par f (0, 0) = 0 et

xy
f (x, y) = si (x, y) /= (0, 0).
x2 + y2
Montrer que cette fonction n’est pas continue en (0, 0) mais que les fonctions
x 2→ f (x, 0) et y 2→ f (0, y) sont continues en 0.
8. Soit (ak )k∈N∗ une suite dans Rp. Montrer que si limk→∞ ak = a, alors
%n
k=1 ak
lim = a.
n→∞ n
Suggestion. Soit ! > 0; il existe m$ ∈ N∗ tel que, pour tout k ≥ m$ , on a
|ak − a|2 ≤ 2! . Si n ≥ m$ , alors
# %n # # # %m" −1 %n
# k=1 ak # #$n
ak − a ##
# k=1 |ak − a|2 " |ak − a|2
#
# − a# = #
# # ≤ + k=m
n 2 # n # n n
k=1 2
%m" −1 %m" −1
|ak − a|2 n − m$ + 1 ! |ak − a|2 !
≤ k=1
+ ≤ k=1
+ .
n n 2 n 2
%m" −1
|ak −a|2
Prendre alors m ≥ m tel que k=1 n
$
≤ 2! lorsque n ≥ m. La récipro-
que est fausse, comme le montre l’exemple de ak = (−1)k .

Limites
On dit qu’une grandeur est la limite d’une autre grandeur, quand la se-
conde peut approcher de la première plus près que d’une grandeur donnée,
si petite qu’on la puisse supposer, sans pourtant que la grandeur, qui ap-
proche, puisse jamais surpasser la grandeur dont elle approche; en sorte que
la différence d’une pareille quantité à sa limite est absolument inassignable.
Jean le Rond d’Alembert, 1752
Si une quantité variable susceptible de limite, jouit d’une certaine pro-

priété, sa limite jouit de la même propriété.
Simon Lhuilier, 1786

Quand les valeurs successivement attribuées à une variable s’approchent

indéfiniment d’une valeur fixée, de manière à finir par en différer aussi peu
que l’on voudra, cette dernière est appelée la limite de toutes les autres.
Lorsque les valeurs numériques successives d’une même variable décroissent
indéfiniment, de manière à s’abaisser au-dessous de tout nombre donné, cette
variable devient ce qu’on nomme un infiniment petit ou une quantité infini-
ment petite.
Limites infinies
Lorsque les valeurs numériques successives d’une même variable croissent

de plus en plus, de manière à s’élever au-dessus de tout nombre donné, on
dit que cette variable a pour limite l’infini positif, indiqué par le signe ∞, s’il
s’agit d’une variable positive, et l’infini négatif, indiqué par la notation −∞,
s’il s’agit d’une variable négative. Les infinis positif et négatif sont désignés
conjointement sous le nom de quantités infinies.
Je proteste contre l’usage de la grandeur infinie comme quelque chose

d’achevé, ce qui n’est jamais admissible en mathématiques. L’infini est pure-
ment une manière de parler; son vrai sens est une limite de laquelle certains
rapports s’approchent indéfiniment, tandis que d’autres peuvent croı̂tre sans
restriction.
Carl-Friedrichs Gauss, 1831
Continuité
Les fonctions continues sont celles dont la nature est définie par une
relation précise entre les coordonnées exprimée par une équation; en sorte
que tous ses points soient déterminés par une même équation, comme par
une loi.
La loi de continuité consiste en ce qu’une quantité ne peut pas passer

d’un état à un autre sans passer par tous les états intermédiaires qui sont
sujets à la même loi. Les fonctions algébriques sont considérées comme
continues parce que les différentes valeurs de ces fonctions dépendent de
la même manière de celles de la variable; et supposant que la variable croı̂t

continûment, la fonction recevra des variations correspondantes; mais elle ne
passera pas d’une valeur à une autre sans passer aussi par toutes les valeurs
intermédiaires. La continuité peut être détruite de deux manières : (1) La
fonction peut changer de forme, c’est-à-dire la loi par laquelle la fonction
dépend de la variable peut changer tout d’un coup. (2) La loi de continuité
est aussi brisée quand les différentes parties d’une courbe ne tiennent pas les
unes aux autres.
Louis François Arbogast, 1791
En considérant la courbe dont i serait l’abscisse et l’une de ces fonc-

tions l’ordonnée, cette courbe coupera l’axe à l’origine des abscisses et ...
le cours de la courbe sera nécessairement continu depuis ce point; donc
elle s’approchera peu à peu de l’axe avant de le couper et s’en approchera,
par conséquent, d’une quantité moindre qu’aucune quantité donnée, de sorte
qu’on pourra toujours trouver une abscisse i correspondant à une ordonnée
moindre qu’une quantité donnée, et alors toute valeur plus petite de i répon-
dra aussi à des ordonnées moindres que la quantité donnée.
Une fonction f (x) qui varie selon la loi de continuité pour toutes les
valeurs de x situées à l’intérieur ou à l’extérieur de certaines limites n’est
rien d’autre que ce qui suit : si x est l’une quelconque de ces valeurs, la
différence f (x + w) − f (x) peut être rendue plus petite que n’importe quelle
quantité donnée si on fait w aussi petit qu’on le désire.
Bernard Bolzano, 1817
La fonction f (x) sera, entre les deux limites assignées à la variable x,

fonction continue de cette variable, si, pour chaque valeur de x intermédiaire
entre ces limites, la valeur numérique de la différence f (x + α) − f (x) décroı̂t
indéfiniment avec celle de α. En d’autres termes, la fonction f(x) restera con-
tinue par rapport à x entre les limites données, si, entre ces limites, un ac-
croissement infiniment petit de la variable produit toujours un accroissement
infiniment petit de la fonction elle-même.
S’il est possible de déterminer une borne δ telle que pour toute valeur de
h, plus petite en valeur absolue que δ, f (x + h) − f (x) soit plus petite qu’une
quantité ! aussi petite que l’on veut, alors on dira qu’on a fait correspondre à
une variation infiniment petite de la variable une variation infiniment petite
de la fonction.
Karl Weierstrass, 1861

Chapitre 3
Dérivabilité
3.1 Fonctions d’une variable réelle

Soit f une fonction de R dans Rp et a ∈ dom f . Des questions de géométrie
et de mécanique (vitesse moyenne) suggèrent l’introduction de la fonction
suivante.
Définition. Le taux de variation de f en a ou l’accroissement relatif de f
en a ou le quotient différentiel de f en a est la fonction de R dans Rp de
domaine dom f \ {a} définie par
f (x) − f (a)
∆af (x) = .
x−a
On remarquera que cette fonction ∆a f ne peut pas être définie pour une
fonction f de Rn dans Rp lorsque n > 1, puisqu’il n’existe pas de division
d’un élément de Rp par un élément de Rn .
La notion géométrique de tangente à une courbe et la notion mécanique
de vitesse instantanée conduisent alors à la notion suivante.
Définition. On dit que la fonction f de R dans Rp est dérivable au point
a ∈ dom f si la limite
f (x) − f (a)
lim ∆a f (x) ≡ lim (3.1)
x→a x→a x−a
df
existe. Dans ce cas, cette limite est notée f $ (a), Df (a) ou dx (a) et appelée le
vecteur dérivé de f en a (nombre dérivé si p = 1), ou encore, plus simplement,
la dérivée de f en a.
81
82 CHAPITRE 3. DÉRIVABILITÉ
Rappelons que l’existence de (3.1) impose que a ∈ adh (dom f \ {a}),

c’est-à-dire que a ne soit pas un point isolé de dom f.
Remarques. 1. Si nous posons
dom f − a = {h ∈ R : a + h ∈ dom f },
alors, en posant x = a + h dans la définition de (3.1) exprimée en termes d’!

et δ
# #
# f (x) − f (a) #
(∀! > 0)(∃δ > 0)(∀x ∈ dom f \{a} : |x−a| ≤ δ) : #
# − f (a)## ≤ !,
$
x−a 2
nous voyons immédiatement que la dérivabilité de f en a équivaut à la con-

dition
(∀! > 0)(∃δ > 0)(∀h ∈ (dom f − a) \ {0} : |h| ≤ δ) :
# #
# f (a + h) − f (a) $
#
#
# − f (a) # ≤ !.
#
h 2
2. En ajoutant dans (3.1) la contrainte “x < a” (resp. “x > a”), on définit
le concept de dérivabilité à gauche (resp. à droite) de f au point a, et les
propriétés de la limite impliquent aussitôt que si f est dérivable à gauche et
à droite en a et que ses dérivées à gauche et à droite sont égales, alors f est
dérivable en a.
Exemples. 1. Toute application constante de R dans Rp est dérivable en
chaque point de R et sa dérivée y est nulle.
2. Toute application linéaire f : R → Rp , x 2→ xc, où c ∈ Rp , est dérivable
en chaque point a ∈ R, et f $ (a) = c.
3. Pour chaque n ≥ 2, l’application de R dans R définie par f (x) = xn est
telle que, pour chaque a ∈ R, on a
xn − an
lim = lim (xn−1 + xn−2 a + . . . + xan−2 + an−1 ) = nan−1 ,
x→a x − a x→a, x(=a
ce qui montre que f est dérivable en a et f $ (a) = nan−1 .

4. Considérons maintenant l’application valeur absolue de R dans R. Si
a > 0, alors, pour tout x appartenant au voisinage U = [ a2 , 3a
2 ] de a, on a
|x| = x et dès lors, par le caractère local de la limite,
|x| − |a| |x| − |a| x−a
lim = lim = lim = 1,
x→a x−a x→a, x∈U x−a x→a, x∈U x−a
ce qui montre que l’application valeur absolue est dérivable en a > 0 et y
a pour dérivée 1. On montre de même que l’application valeur absolue est
3.1. FONCTIONS D’UNE VARIABLE RÉELLE 83
dérivable en chaque a < 0 et y a pour dérivée −1. Par contre, l’application

valeur absolue n’est pas dérivable en 0, puisque
|x| −x
lim = lim = −1,
x→0− x x→0− x
et
|x| x
lim = lim = 1.
x→0+ x x→0+ x
La dérivabilité en un point d’une fonction d’une variable réelle à valeurs

dans Rp se ramène à celle de ses p fonctions composantes.
Proposition. Si f est une fonction de R dans Rp et a ∈ dom f , alors f
est dérivable en a si et seulement si, pour chaque 1 ≤ k ≤ p, les fonctions
composantes fk sont dérivables en a, auquel cas l’on a
f $ (a) = ((f1 )$ (a), . . ., (fp)$ (a)),
c’est-à-dire (f $ (a))k = (fk )$ (a), (1 ≤ k ≤ p).

Démonstration. Comme, pour chaque 1 ≤ k ≤ p, fk = pk ◦ f et que pk
est linéaire, on a, pour tout a ∈ dom f et tout x ∈ dom f \ {a},
(pk ◦ f )(x) − (pk ◦ f )(a) fk (x) − fk (a)
(pk ◦ ∆a f )(x) = = = ∆afk (x).(3.2)
x−a x−a
Par ailleurs, en vertu des propriétés des limites,
lim ∆a f (x) = b ⇔ lim (pk ◦ ∆af )(x) = bk , (1 ≤ k ≤ p),

x→a x→a
et la thèse se déduit aussitôt de ce résultat et de (3.2).

Introduisons maintenant une formulation équivalente de la notion de
dérivabilité qui constitue une étape importante vers la généralisation de cette
notion aux fonctions de plusieurs variables.
Proposition. Soit f une fonction de R dans Rp et a ∈ dom f . Alors f est
dérivable en a si et seulement s’il existe b ∈ Rp et une fonction r de R dans
Rp définie au moins sur (dom f − a) \ {0} tels que
lim r(h) = 0,
h→0
et, tels que, pour tout h ∈ (dom f − a) \ {0}, on ait
f (a + h) = f (a) + hb + |h|r(h). (3.3)

S’il en est ainsi, b = f $ (a).

Démonstration. Condition nécessaire. Si f est dérivable en a, alors, en
prenant b = f $ (a), on a
f (a + h) − f (a)
lim = b,
h→0 h
c’est-à-dire
f (a + h) − f (a) − hb
lim = 0.
h→0 h
Dès lors si l’on pose
f (a + h) − f (a) − hb
r(h) = ,
|h|
on voit que dom r = (dom f − a) \ {0}, (3.3) est satisfaite, et

2 3
h f (a + h) − f (a) − hb
lim r(h) = lim . = 0,
h→0 h→0 |h| h
puisque la fonction h 2→ h/|h| est localement bornée en 0.

Condition suffisante. Si f vérifie (3.3), alors, pour tout h ∈ (dom f −a)\{0},
on a
f (a + h) − f (a) |h|
=b+ r(h),
h h
et dès lors
f (a + h) − f (a)
lim = b,
h→0 h
ce qui montre que la limite (3.1) existe et est égale à b.
Remarque. La caractérisation que nous venons d’obtenir peut évidemment
s’énoncer sous la forme équivalente de l’existence d’un b ∈ Rp tel que
f (a + h) − f (a) − hb
lim = 0,
h→0 |h|
ou encore tel que

f (x) − f (a) − (x − a)b
lim = 0.
x→a |x − a|
Quant à (3.3), elle peut bien sûr également s’écrire
f (x) = f (a) + (x − a)b + |x − a|r(x − a),

3.2. FONCTIONS DE PLUSIEURS VARIABLES RÉELLES 85
pour tout x ∈ dom f \ {a}.

La condition (3.3) peut être interprétée comme suit : une fonction f est
dérivable en a ∈ dom f si et seulement si f (a + h) peut être approchée pour
|h| suffisamment petit par une fonction affine g : h 2→ f (a) + hb, en ce sens
que l’erreur commise f (a+h)−g(h) est de la forme |h|r(h) avec r(h) tendant
vers 0 si h tend vers 0, c’est-à-dire tend vers zéro plus rapidement que |h|
lorsque |h| → 0.
En résumé, la dérivabilité en un point d’une fonction de R dans Rp peut
se concevoir comme l’existence d’un taux de variation “instantané” de la
fonction en ce point, ou comme la possibilité d’approcher cette fonction,
au voisinage de ce point, par une fonction affine. Géométriquement, parmi
toutes les droites de R × Rp passant par (a, f (a)), le graphe de g constitue la
meilleure approximation de celui de f au voisinage de (a, f (a)). On pourra
visualiser la situation lorsque p = 1 et p = 2.
3.2 Fonctions de plusieurs variables réelles

Si l’on rappelle que toute application linéaire de R dans Rp est de la forme
x 2→ xb pour un certain b ∈ Rp, on voit que la caractérisation de la notion de
dérivabilité en a ∈ dom f d’une fonction f de R dans Rp revient à demander
l’existence d’une application linéaire L de R dans Rp et d’une fonction r de
R dans Rp définie au moins sur (dom f − a) \ {0}, telle que limh→0 r(h) = 0
et telle que, pour tout h ∈ (dom f − a) \ {0}, on ait
f (a + h) = f (a) + L(h) + |h|r(h).
Les deux membres de cette égalité gardent un sens pour une fonction f
de Rn dans Rp à condition de prendre pour L une application linéaire de Rn
dans Rp , pour r une fonction de Rn dans Rp et de remplacer |h| par |h|2 .
Nous sommes ainsi conduits à la définition suivante.
Définition. Soit f une fonction de Rn dans Rp et a ∈ dom f . On dit que f
est dérivable (ou différentiable) au point a s’il existe une application linéaire
L de Rn dans Rp et une fonction r de Rn dans Rp définie au moins sur
(dom f − a) \ {0}, telles que
lim r(h) = 0
h→0
et telles que, pour tout h ∈ (dom f − a) \ {0}, on ait
f (a + h) = f (a) + L(h) + |h|2 r(h), (3.4)

ou encore, d’une manière équivalente,
f (x) = f (a) + L(x − a) + |x − a|2 r(x − a), (3.5)
pour tout x ∈ dom f \ {a}.

Dans cette définition, on a posé, par analogie avec le cas n = 1,
dom f − a = {h ∈ Rn : a + h ∈ dom f }.
Remarques. 1. La condition limh→0 r(h) = 0 implique évidemment que 0

ne soit pas isolé dans (dom f − a), c’est-à-dire que a ne soit pas isolé dans
dom f.
2. Si j = 1, 2 ou ∞, les inégalités entre les différentes normes entraı̂nent que
les relations (3.4) et (3.5) sont évidemment équivalentes respectivement à
f (a + h) = f (a) + L(h) + |h|j rj (h),
et
f (x) = f (a) + L(x − a) + |x − a|j rj (x − a),
pour une certaine function rj de Rn dans Rp définie au moins sur (dom f −

a) \ {a} et telle que limh→0 rj (h) = 0. En particulier, la définition ne dépend
pas du choix de la norme | · |2 .
3. La caractérisation de la dérivabilité d’une fonction de R dans Rp donnée
dans la section précédente et la structure générale des applications linéaires
de R dans Rp entraı̂nent évidemment que la définition de dérivabilité que
nous venons de donner dans le cas général d’une fonction de Rn dans Rp est
compatible avec celle donnée pour n = 1.
4. En vertu de la propriété correspondante pour la limite, la dérivabilité de f
en a est une notion locale, c’est-à-dire qu’elle ne dépend que de la restriction
de f à un voisinage arbitraire de a.
Comme pour n = 1, et avec une démonstration semblable, on a la car-
actérisation suivante de la dérivabilité de f en a.
Proposition. Soit f une fonction de Rn dans Rp et a ∈ dom f . Alors f
est dérivable en a si et seulement s’il existe une application linéaire L de Rn
dans Rp telle que
f (a + h) − f (a) − L(h)
lim = 0,
h→0 |h|2
c’est-à-dire telle que
f (x) − f (a) − L(x − a)

lim = 0.
x→a |x − a|2
Exemples. 1. Toute application constante de Rn dans Rp est dérivable en

chaque point a ∈ Rn . Il suffit de prendre L = 0 et r = 0 dans la définition.
2. Toute application linéaire f de Rn dans Rp est dérivable en chaque point
a ∈ Rn . Comme, par linéarité, on a, pour tout h ∈ Rn , f (a+h) = f (a)+f (h),
il suffit de prendre L = f et r = 0 dans la définition.
3. Soit f : R2 → R, (x1, x2 ) 2→ x21 + x2 . Si a = (a1 , a2 ) ∈ R2 et h = (h1 , h2 ) ∈
R2 , on a
f (a + h) = (a1 + h1 )2 + (a2 + h2 ) =
a21 + a2 + 2a1 h1 + h2 + h21 = f (a) + L(h) + |h|2 r(h),
si l’on définit l’application linéaire L : R2 → R par L(h) = 2a1 h1 + h2 et
h21
la fonction r de R2 dans R par r(h) = |h|2 . On voit que dom r = R2 \ {0}.
Comme, pour tout h /= 0, on a
h21 + h22
|r(h)| ≤ = |h|2 ,
|h|2
on voit que limh→0 r(h) = 0 et f est dérivable en chaque point a ∈ R2 .

Lorsque n ≥ 2, il peut exister plus d’une application linéaire L vérifiant
les conditions de la définition de dérivabilité. Pour le voir, soit f la fonction
de R2 dans R définie par f (x1 , x2 ) = x1 (x21 − |x2 |)1/2. On a
dom f = {(x1 , x2 ) ∈ R2 : |x2 | ≤ x21 }.
Si c ∈ R, si l’on considère l’application linéaire
Lc : R2 → R, (h1 , h2 ) 2→ ch2 ,
et si l’on définit la fonction rc de R2 dans R par
h1 8 2 91/2 h2
rc (h1 , h2 ) = h1 − |h2 | −c ,
|h|2 |h|2
on a, pour chaque (h1 , h2 ) ∈ dom f \ {(0, 0)},
f (h1 , h2 ) = f (0, 0) + Lc (h1 , h2 ) + |h|2 rc (h1 , h2 ).

Comme, pour tout (h1 , h2 ) ∈ dom f, on a

# # 2
# h2 #
#c # ≤ |c| |h1| ≤ |c||h|2,
# |h| # |h|2
2
on voit que limh→0 rc (h) = 0 et donc que, pour chaque c ∈ R, l’application

linéaire Lc vérifie la définition de la dérivabilité de f en 0.
Un dessin convaincra aisément le lecteur de la forme particulière du do-
maine de f dans l’exemple ci-dessus. On retrouve l’unicité en faisant des
hypothèses plus fortes sur les relations entre a et dom f .
Proposition. Soit f une fonction de Rn dans Rp . Si a ∈ int dom f, il existe
au plus une application linéaire L vérifiant les conditions de la définition de
dérivabilité de f en a.
Démonstration. Supposons qu’il existe deux applications linéaires L et
M de Rn dans Rp vérifiant les conditions de la définition de dérivabilité de
f en a. Alors, il existera deux fonctions r et s de Rn dans Rp définies au
moins sur (dom f − a) \ {0} et telles que, pour chaque h ∈ (dom f − a) \ {0},
on ait
f (a) + L(h) + |h|2 r(h) = f (a + h) = f (a) + M (h) + |h|2 s(h).
En conséquence, on a, pour chaque h ∈ (dom f − a) \ {0},
(L − M )(h) = |h|2 [s(h) − r(h)].
Soit ρ > 0 tel que B2 [a; ρ] ⊂ dom f. Comme B2 [ρ] ⊂ dom f − a, on aura,
pour chaque 1 ≤ k ≤ n, et chaque t ∈ ]0, ρ],
t(L − M )(ek ) = (L − M )(tek ) = |t|[s(tek ) − r(tek )] = t[s(tek ) − r(tek )],
et dès lors
(L − M )(ek ) = [s(tek ) − r(tek )].
En faisant tendre t vers 0 dans cette égalité, et en utilisant les propriétés de
r et s et le théorème sur la limite d’une fonction composée, on obtient, pour
chaque 1 ≤ k ≤ n,
(L − M )(ek ) = 0,
et dès lors L = M , puisqu’une application linéaire de Rn dans Rp est nulle
si et seulement si elle s’annulle sur chaque élément de la base canonique de
Rn .
Définition. Si f est une fonction de Rn dans Rp dérivable en a ∈ int dom f

si n ≥ 2 et en a ∈ dom f si n = 1, l’unique application linéaire L de Rn dans
Rp vérifiant les conditions de la définition est appelée la dérivée totale ou la
différentielle de f au point a et notée fa$ ou dfa .
fa$ est donc, dans ce cas, l’unique application linéaire de Rn dans Rp telle
que l’on puisse écrire, pour chaque h ∈ (dom f − a) \ {0},
f (a + h) = f (a) + fa$ (h) + |h|2 r(h),
avec r une fonction de Rn dans Rp définie au moins sur (dom f − a) \ {0}

et telle que limh→0 r(h) = 0, ou encore l’unique application linéaire de Rn
dans Rp telle que l’on ait
f (a + h) − f (a) − fa$ (h)

lim = 0.
h→0 |h|2
Lorsque n = 1 et que f est dérivable en a au sens de la première section

de de chapitre, il existe un élément unique f $ (a) ∈ Rp tel que, pour chaque
h ∈ (dom f − a) \ {0}, on ait
f (a + h) = f (a) + hf $ (a) + |h|r(h).
Dès lors, on a nécessairement, pour chaque h ∈ R,
fa$ (h) = hf $ (a),
et en particulier
f $ (a) = fa$ (1).
La connaissance de la dérivée f $ (a) de f en a entraı̂ne donc, pour n = 1, la
connaissance de sa dérivée totale fa$ , et réciproquement.
Géométriquement, lorsque n ≥ 2 et que f est une fonction de Rn dans
R dérivable en a ∈ int dom f, le graphe de la fonction affine h 2→ f (a) +
fa$ (h) est le plan de Rn × R passant par (a, f (a)) qui fournit la meilleure
approximation du graphe de f au voisinage de (a, f (a)). On l’appelle le plan
tangent au graphe de f en (a, f (a)). On pourra visualiser la situation lorsque
n = 2.
La dérivabilité de f en a entraı̂ne sa continuité en ce point.
Proposition. Soit f une fonction de Rn dans Rp et a ∈ dom f . Si f est
dérivable en a, alors, pour chaque j = 1, 2 ou ∞, la fonction g de Rn dans Rp
f (a+h)−f (a)
définie par g(h) = |h|j est localement bornée en 0 et f est continue
en a.
Démonstration. Soit j = 1, 2 ou ∞. Par hypothèse, il existe une appli-
cation linéaire L de Rn dans Rp et une fonction r de Rn dans Rp définie au
moins sur (dom f − a) \ {0} telle que limh→0 r(h) = 0 et
f (a + h) = f (a) + L(h) + |h|2 r(h)
pour chaque h ∈ (dom f − a) \ {0}. En conséquence, pour ces mêmes h, on
a
& '
f (a + h) − f (a) L(h) + |h|2 r(h) h |h|2
g(h) = = =L + r(h).
|h|j |h|j |h|j |h|j
On sait que le premier terme est une fonction localement bornée en 0 et, en
utilisant les inégalités entre normes, on voit aisément que le deuxième terme
est le produit par r d’une fonction localement bornée en 0; il tend donc vers
0 lorsque h tend vers 0, et est donc également localement borné en 0. Enfin,
pour tout x ∈ dom f \ {a}, on a
f (x) = f (a) + L(x − a) + |x − a|2 r(x − a),
et dès lors
lim f (x) = f (a),
x→a, x(=a
ce qui équivaut à la continuité de f en a, puisque a est non isolé dans dom f .
Remarque. La réciproque de cette proposition est fausse : une fonction

peut être continue en un point sans y être dérivable. Ainsi, l’application
valeur absolue de R dans R est continue en 0 et n’y est pas dérivable. Comme
on le verra plus loin, il existe même des fonctions de R dans R continues en
chaque point de R qui ne sont dérivables en aucun point de R !
3.3 Dérivées directionnelles et dérivées partielles

La définition de dérivabilité d’une fonction de Rn dans Rp requiert la dé-
termination de l’application linéaire L intervenant dans la définition. Cette
détermination est facilitée par l’introduction des dérivées d’une fonction de
Rn dans Rp dans une direction fixée. On appellera direction dans Rn tout
élément u ∈ Rn tel que |u|2 = 1. Un tel élément fixe en effet la direction de
la droite qui le joint à l’origine.
3.3. DÉRIVÉES DIRECTIONNELLES ET DÉRIVÉES PARTIELLES 91
Définition. Soit f une fonction de Rn dans Rp , a ∈ dom f et u ∈ Rn tel

que |u|2 = 1. On dit que f est dérivable au point a dans la direction u si la
fonction de R dans Rp t 2→ f (a + tu) est dérivable en 0, c’est-à-dire si
f (a + tu) − f (a)
lim (3.6)
t→0 t
existe. Dans ce cas, cette limite est notée f $ (a; u) ou Du f (a) et appelée la
dérivée de f au point a dans la direction u. Dans le cas particulier où u = ek
pour un certain 1 ≤ k ≤ n, f $ (a; ek ) est appelée la dérivée partielle de f en
a par rapport à la ke -composante (brièvement par rapport à xk ) et notée
∂f
Dk f (a) ou Dxk f (a) ou ∂x k
(a) ou ∂k f (a).
Notons que l’existence de la limite (3.6) requiert que a soit adhérent à
l’ensemble
{x ∈ dom f \ {a} : x = a + tu, t ∈ R}.
Si a ∈ int dom f, ce sera évidemment le cas, pour n’importe quel u ∈ Rn tel
que |u|2 = 1. Notons aussi que, si l’on introduit l’application affine g : R →
Rn , t 2→ a + tu, la dérivabilité de f en a dans la direction u équivaut à la
dérivabilité en 0 de la fonction de R dans Rp f ◦ g, auquel cas
f $ (a; u) = (f ◦ g)$(0).
D’autre part, lorsque n = 1, on a u = 1 ou u = −1 et l’on voit tout de suite

que l’existence de f $ (a; 1) et f $ (a; −1) équivalent toutes deux à la dérivabilité
(ordinaire) de f en a, avec les relations f $ (a; 1) = −f $ (a; −1) = f $ (a).
Remarquons enfin que, dans le cas de la dérivée partielle par rapport à
xk , on a, explicitement, par (3.6),
f (a1 , . . ., ak−1 , ak + t, ak+1 , . . . , an ) − f (a1 , . . ., an )
Dk f (a) = lim ,
t→0 t
ou encore, d’une manière équivalente,
f (a1 , . . . , ak−1, xk , ak+1 , . . . , an ) − f (a1 , . . ., an )
Dk f (a) = lim .
xk →ak xk − ak
L’existence et le calcul de Dk f (a) revient donc à la dérivabilité et au calcul
de la dérivée de la fonction de R dans Rp
xk 2→ f (a1 , . . . , ak−1 , xk , ak+1 , . . ., an ).
Il suffit donc de “geler” à leur valeur aj les composantes xj telles que j /= k

et de considérer la seule dépendance en xk .
Notons que, contrairement à la notion de dérivabilité introduite dans la

section précédente, la dérivabilité d’une fonction en un point dans toutes
les directions n’entraı̂ne pas la continuité de la fonction en ce point. Par
exemple, si f est la fonction de R2 dans R définie par
x1 x22
f (x) = si x /= 0
x21 + x42
et f (0) = 0, on voit que, pour chaque u = (u1 , u2 ) tel que |u|2 = 1, on a,
pour chaque réel t /= 0,
f (tu) − f (0) f (tu) u1 u22
= = 2 ,
t t u1 + t2 u42
et dès lors
f (tu) − f (0) u2
lim = 2 si u1 /= 0,
t→0 t u1
et
f (tu) − f (0)
lim = 0 si u1 = 0.
t→0 t
En conséquence, f $ (0; u) existe pour toute direction u de R2 . D’autre part,
pour tout réel h /= 0, on a
h4 1
f (h2 , h) = = ,
h4 + h4 2
ce qui montre que |f (h2 , h) − f (0, 0)| = 12 quel que soit h /= 0 et dès lors f
n’est pas continue en 0 puisque limx→0 f n’est pas égale à f (0).
Nous allons voir maintenant qu’en un point intérieur au domaine d’une
fonction de Rn dans Rp, l’existence de la dérivée totale entraı̂ne celle de
la dérivée dans n’importe quelle direction (et en particulier des n dérivées
partielles) et que la dérivée totale peut s’exprimer en termes des dérivées
directionnelles ou des dérivées partielles.
Proposition. Soit f une fonction de Rn dans Rp, a ∈ int dom f . Si f est
dérivable en a, alors, pour chaque u ∈ Rn tel que |u|2 = 1, f est dérivable
en a dans la direction u et l’on a
f $ (a; u) = fa$ (u).
En particulier, pour chaque 1 ≤ k ≤ n, f possède une dérivée partielle
Dk f (a) en a par rapport à xk et, pour tout h ∈ Rn , on a
n
$
fa$ (h) = hk Dk f (a). (3.7)
k=1
3.3. DÉRIVÉES DIRECTIONNELLES ET DÉRIVÉES PARTIELLES 93
Démonstration. Par la définition de la dérivabilité totale de f en a, il

existe une fonction r de Rn dans Rp définie au moins sur (dom f − a) \ {0},
telle que limh→0 r(h) = 0 et telle que, pour tout h ∈ (dom f − a) \ {0}, on
ait
f (a + h) = f (a) + fa$ (h) + |h|2 r(h).
Dès lors, pour tout réel t /= 0 tel que a + tu ∈ dom f , on a
f (a + tu) = f (a) + fa$ (tu) + |tu|2 r(tu) = f (a) + tfa$ (u) + |t|r(tu),
et, en utilisant le théorème sur la limite des fonctions composées et le fait

que la fonction t 2→ |t|
t est localement bornée en 0,
2 3
f (a + tu) − f (a) |t|
lim = lim fa$ (u) + r(tu) = fa$ (u).
t→0 t t→0 t
En particulier, en prenant u = ek , (1 ≤ k ≤ n), on obtient
Dk f (a) = fa$ (ek ), (1 ≤ k ≤ n),
et, pour tout h ∈ Rn , on aura

& n
' n n
$ $ $
fa$ (h) = fa$ k
hk e = hk fa$ (ek ) = hk Dk f (a).
k=1 k=1 k=1
L’exemple donné d’une fonction dérivable dans chaque direction sans

être continue, et donc sans être dérivable, montre que la réciproque de cette
proposition est fausse. Nous donnerons plus loin des conditions supplémen-
taires à imposer à l’existence des dérivées partielles en un point pour en
déduire la dérivabilité en ce point.
La proposition que nous venons de démontrer fournit un procédé systé-
matique pour étudier la dérivabilité d’une fonction f de Rn dans Rp en un
point a ∈ dom f :
1. On étudie l’existence des dérivées partielles de f en a par rapport à xk
(1 ≤ k ≤ n). Si l’une d’entre elles n’existe pas, f ne sera pas dérivable en a.
2. Si toutes les dérivées partielles D1 f (a), . . . , Dnf (a) existent, on définit
l’application linéaire L de Rn dans Rp par la relation
n
$
L(h) = hk Dk f (a).
k=1
Si f (a + h) − f (a) − L(h) = |h|2 r(h) avec limh→0 r(h) = 0, ou encore si
f (a + h) − f (a) − L(h)
lim = 0, (3.8)
h→0 |h|2
alors f est dérivable en a. Si la limite du premier membre de (3.8) est

différente de zéro ou n’existe pas, alors f n’est pas dérivable en a.
Exemple. Reprenons l’exemple de la fonction f de R2 dans R définie par
f (x) = x21 + x2 . Si a = (a1 , a2 ) ∈ R2 est donné, alors la fonction x1 2→ x21 + a2
est dérivable en a1 et y a pour dérivée 2a1 et la fonction x2 2→ a21 + x2 est
dérivable en a2 et y a pour dérivée 1. En conséquence,
D1 f (a) = 2a1 , D2 f (a) = 1.
Soit L l’application linéaire de R2 dans R définie par

2
$
L(h) = hk Dk f (a) = 2a1 h1 + h2 .
k=1
On a
f (a + h) − f (a) − L(h) = (a1 + h1 )2 + a2 − a21 − a2 − 2a1 h1 − h2 = h21 ,
et dès lors
f (a + h) − f (a) − L(h) h2
lim = lim 1 = 0.
h→0 |h|2 h→0 |h|2
Remarque. Dans le cas particulier d’une fonction f de Rn dans R dérivable

en a ∈ int dom f , chaque dérivée partielle Dk f (a) est un nombre réel et
l’élément (D1 f (a), . . ., Dnf (a)) de Rn est appelé le gradient de f en a et
noté ∇f (a) ou grad f (a). En utilisant le produit scalaire, la relation (3.7)
s’écrit
f $ (a; h) = fa$ (h) = (∇f (a)|h).
En vertu de l’inégalité de Cauchy, on aura alors, pour tout u ∈ Rn , tel que
|u|2 = 1,
fa$ (u) ≤ |fa$ (u)| ≤ |∇f (a)|2 |u|2 = |∇f (a)|2 ,
∇f (a)
et si ∇f (a) /= 0, on obtient, en prenant u = |∇f (a)|2 ,
4 5 4 5
∇f (a) ∇f (a) (∇f (a)|∇f (a))
f $ a; = ∇f (a)| = = |∇f (a)|2,
|∇f (a)|2 |∇f (a)|2 |∇f (a)|2
3.4. RÈGLES DE CALCUL DES DÉRIVÉES 95
∇f (a)
ce qui montre que f $ (a; u) prend sa plus grande valeur lorsque u = |∇f (a)|2 .
Comme
f (a + tu) = f (a) + t(∇f (a)|u) + |t|r(tu),
∇f (a)
avec r(h) → 0 si h → 0, le résultat qui précède montre que u = |∇f (a)|2
est
la direction suivant laquelle f croı̂t le plus vite à partir de a. L’opposée −u
est la direction de plus grande pente.
3.4 Règles de calcul des dérivées

Pour éviter de devoir retourner systématiquement à la définition pour étudier
la dérivabilité et calculer la dérivée, il est important de savoir comment
la dérivabilité se comporte par rapport aux opérations algébriques et en-
semblistes faites sur des fonctions dérivables. On pourra alors obtenir la
dérivabilité et la dérivée de fonctions compliquées lorsqu’on connaı̂t celle de
fonctions plus simples. On se contentera de traiter le cas important de la
dérivabilité en un point intérieur au domaine.
Montrons tout d’abord que la dérivée d’une somme est la somme des
dérivées.
Proposition. Soient f et g deux fonctions de Rn dans Rp et a ∈ int (dom f
∩dom g). Si f et g sont dérivables en a, alors f + g est dérivable en a et l’on
a
(f + g)$a = fa$ + ga$ .
En particulier, pour n = 1,
(f + g)$(a) = f $ (a) + g $ (a).
Démonstration. Par hypothèse, il existe des fonctions r et s de Rn dans

Rp définies au moins sur (dom f −a)\{0} et (dom g−a)\{0} respectivement,
telles que
lim r(h) = 0, lim s(h) = 0,
h→0 h→0
et
f (a + h) = f (a) + fa$ (h) + |h|2 r(h),
pour tout h ∈ (dom f − a) \ {0} et
g(a + h) = g(a) + ga$ (h) + |h|2 s(h),

pour tout h ∈ (dom g − a) \ {0}. Dès lors, pour tout h ∈ [(dom f − a) ∩

(dom g − a)] \ {0}, on a
(f + g)(a + h) = f (a + h) + g(a + h)
= f (a) + fa$ (h) + |h|2 r(h) + g(a) + ga$ (h) + |h|2 s(h)
= (f + g)(a) + (fa$ + ga$ )(h) + |h|2 [r(h) + s(h)],
avec
lim [r(h) + s(h)] = 0.
h→0
Le cas n = 1 s’en déduit aussitôt puisque
(f + g)$ (a) = (f + g)$a(1) = fa$ (1) + ga$ (1) = f $ (a) + g $ (a).
Etudions maintenant la dérivabilité d’un produit de fonctions dérivables.

de Rn dans R (resp. C), et a ∈ int (dom f ∩dom g). Si f et g sont dérivables
en a, alors gf est dérivable en a et l’on a
(gf )$a = ga$ (·)f (a) + g(a)fa$ .
En particulier, si n = 1, on a aussi
(gf )$ (a) = g $ (a)f (a) + g(a)f $ (a).
Démonstration. Par hypothèse, il existe une fonction r de Rn dans Rp

(resp. C) définie au moins sur (dom f − a) \ {0} et une fonction s de Rn
dans R (resp. C) définie au moins sur (dom g − a) \ {0}, telles que
lim r(h) = 0, lim s(h) = 0,

h→0 h→0
et
f (a + h) = f (a) + fa$ (h) + |h|2 r(h),
pour tout h ∈ (dom f − a) \ {0} et
g(a + h) = g(a) + ga$ (h) + |h|2 s(h),
pour tout h ∈ (dom g − a) \ {0}. Dès lors, pour tout h ∈ [(dom f − a) ∩

(dom g − a)] \ {0}, on a
(gf )(a + h) = g(a + h)f (a + h)

= [g(a) + ga$ (h) + |h|2 s(h)][f (a) + fa$ (h) + |h|2 r(h)]
2
ga$ (h)fa$ (h)
= (gf )(a) + ga$ (h)f (a) + g(a)fa$ (h) + |h|2 g(a)r(h) +
|h|2
:
+ ga$ (h)r(h) + s(h)f (a) + s(h)fa$ (h) + |h|2 s(h)r(h)
= (gf )(a) + ga$ (h)f (a) + g(a)fa$ (h) + |h|2 q(h),
si l’on pose
ga$ (h)fa$ (h)
q(h) = g(a)r(h) +
|h|2
+ga$ (h)r(h) + s(h)f (a) + s(h)fa$ (h) + |h|2 s(h)r(h).
Comme la fonction h 2→ |h|−1
2 ga (h) = ga ( |h|2 ) est localement bornée en 0, on
$ $ h
voit que chaque terme de q est formé du produit d’une fonction localement
bornée en 0 par une fonction ayant une limite nulle en 0, et donc que
lim q(h) = 0.
h→0
La formule particulière pour n = 1 s’en déduit aisément.

Remarque. On démontre de la même manière le théorème de dérivabilité
du produit scalaire de deux fonctions f et g de Rn dans Rp dérivables en
a ∈ int dom f ∩ int dom g et la formule pour la dérivée
(f |g)$a = (fa$ (·)|g(a)) + (f (a)|ga$ (·)).
Etudions la dérivabilité d’un quotient de fonctions dérivables.

en a et si g(a) /= 0, alors fg est dérivable en a et l’on a
4 5$
f g(a)fa$ (·) − ga$ (·)f (a)
= .
g a (g(a))2
En particulier, si n = 1, on a aussi
4 5$
f g(a)f $(a) − g $ (a)f (a)
(a) = .
g (g(a))2
Démonstration. Puisque fg = f. 1g , il suffit de montrer que 1

g est dérivable
en a, avec 4 5$
1 1
=− g$ ,
g a (g(a))2 a
et d’utiliser le résultat précédent sur le produit. Montrons tout d’abord que

a ∈ int dom fg . On a
f
dom = {x ∈ dom f ∩ dom g : g(x) /= 0}.
g
Puisque g(a) /= 0 et que g, dérivable en a, y est continue, il existera δ > 0

tel que, pour tout x ∈ dom g tel que |x − a|2 ≤ δ, on ait
|g(a)|
|g(x) − g(a)| ≤ ,
2
et dès lors
|g(a)|
||g(x)| − |g(a)|| ≤ ,
2
ce qui entraı̂ne en particulier que, pour tout x ∈ dom g tel que |x − a|2 ≤ δ,
on aura |g(x)| ≥ |g(a)|
2 > 0. Donc dom f ∩ dom g ∩ B2 [a; δ] ⊂ dom fg et
a ∈ int dom 1g . D’autre part, g étant dérivable en a, il existe une fonction
r de Rn dans R définie au moins sur (dom g − a) \ {0} telle que, pour tout
h ∈ (dom g − a) \ {0}, on ait
g(a + h) = g(a) + ga$ (h) + |h|2 r(h),
et dès lors, pour tout h ∈ [(dom g − a) ∩ B2 [δ]] \ {0}, on aura

2 3
1 1 1
− − − g $ (h)
g(a + h) g(a) (g(a))2 a
ga$ ( |h|h 2 )ga$ (h) + [ga$ (h) − g(a)]r(h)

= |h|2 = |h|2 s(h),
(g(a))2g(a + h)
et l’on vérifie sans peine que s(h) → 0 lorsque h → 0. La formule particulière
pour n = 1 s’en déduit aisément.
Donnons maintenant l’importante règle de dérivation d’une fonction
composée.
Proposition. Soif f une fonction de Rn dans Rp , g une fonction de Rp dans
Rq , a ∈ int dom f tel que f (a) ∈ int dom g. Si f est dérivable en a et si g
est dérivable en f (a), alors a ∈ int dom (g ◦ f ), g ◦ f est dérivable en a et
(g ◦ f )$a = gf$ (a) ◦ fa$ .

Si n = p = 1, on a aussi la formule particulière
(g ◦ f )$ (a) = g $ (f (a)).f $(a).
Démonstration. Par hypothèse, f , dérivable en a, y est continue. Si r > 0

est tel que B2 [f (a); r] ⊂ int dom g, il existera δ > 0 tel que f (B2 [a; δ]) ⊂
B2 [f (a); r] et donc tel que B2 [a; r] ⊂ dom (g ◦ f ). Donc a ∈ int dom (g ◦ f ).
D’autre part, il existe une fonction r de Rn dans Rp définie au moins sur
(dom f − a) \ {0} telle que, pour tout h ∈ (dom f − a) \ {0}, on ait
f (a + h) = f (a) + fa$ (h) + |h|2 r(h),
et une fonction s de Rp dans Rq définie au moins sur (dom g − f (a)) \ {0}

telle que, pour tout t ∈ (dom g − f (a)) \ {0}, on ait
g[f (a) + t] = g[f (a)] + gf$ (a)(t) + |t|2 s(t).
Dès lors, si h ∈ [(dom f − a) ∩ B2 [δ]] \ {0}, alors f (a + h) − f (a) ∈ (dom g −

f (a)) \ {0}, et
g(f (a + h)) = g[f (a) + f (a + h) − f (a)]
= g[f (a)] + gf$ (a)(f (a + h) − f (a)) + |f (a + h) − f (a)|2s[f (a + h) − f (a)]

= g[f (a)]+gf$ (a)(fa$ (h))+gf$ (a)(|h|2r(h))+|fa$ (h)+|h|2r(h)|2 s[f (a+h)−f (a)]
= g[f (a)] + (gf$ (a) ◦ fa$ )(h)
; # 4 5 # <
# $ h #
+|h|2 gf$ (a)(r(h)) + #f
# a |h| + r(h)## s[f (a + h) − f (a)]
2 2
= g[f (a)] + (gf$ (a) ◦ fa$ )(h) + |h|2 b(h),

et l’on vérifie sans peine que b(h) → 0 lorsque h → 0. La formule pour n = 1
s’en déduit facilement.
Remarque. En appliquant le théorème précédent aux fonctions composées
pk ◦ f (1 ≤ k ≤ p) lorsque f est une fonction de Rn dans Rp dérivable en
a ∈ int dom f , on trouve immédiatement que chaque composante fk de f
est dérivable en a et que
(fk )$a = (pk )$f (a) ◦ fa$ = pk ◦ fa$ = (fa$ )k ,
ce qui montre que la dérivée totale en a de la ke -composante de f est la

ke -composante de la dérivée totale de f en a. Réciproquement, si chaque
composante fk de f est dérivable en a ∈ int dom f , il existera des fonctions

rk de Rn dans R définies au moins sur (dom f − a) \ {0} telles que
fk (a + h) = f (a) + (fk )$a(h) + |h|2 rk (h), (1 ≤ k ≤ p),
pour tout h ∈ (dom f − a) \ {0}; dès lors, en définissant l’application linéaire

L de Rn dans Rp par
L(h) = ((f1 )$a(h), . . ., (fp)$a (h)),
et la fonction r de Rn dans Rp par
r(h) = (r1 (h), . . ., rp(h)),
on voit que f est dérivable en a et que fa$ = L.

Cette remarque combinée avec la formule (3.7) reliant la dérivée totale
aux dérivées partielles entraı̂ne aussitôt que, si f est une fonction de Rn
dans Rp dérivable en a ∈ int dom f , on a, pour chaque h ∈ Rn et chaque
1 ≤ j ≤ p,
n
$
(fa$ (h))j = (fj )$a(h) = hk Dk fj (a),
k=1
et dès lors, si l’on considère h comme un vecteur-colonne dans Rn , l’applicati-

on linéaire fa$ de Rn dans Rp est représentée par la matrice
(Dk fj (a))(1≤k≤n; 1≤j≤p)
à n colonnes et p lignes formée par les dérivées partielles des composantes

de f . Cette matrice appelée la matrice jacobienne de f en a constitue donc
la représentation de l’application linéaire fa$ dans les bases canoniques de Rn
et Rp .
3.5 Règles de calcul des dérivées partielles

Les règles de calcul des dérivées totales que nous venons d’établir se combi-
nent aux formules liant la dérivée totale aux dérivées directionnelles et aux
dérivées partielles pour fournir immédiatement les règles de calcul de ces
dernières dérivées dans le cas de la somme, du produit et du quotient de
deux fonctions.
3.5. RÈGLES DE CALCUL DES DÉRIVÉES PARTIELLES 101
Proposition. Soient f et g deux fonctions de Rn dans Rp et a ∈ int (dom f

∩dom g). Si f et g sont dérivables en a, alors, pour chaque u ∈ Rn tel que
|u|2 = 1, f + g est dérivable en a dans la direction u et l’on a
(f + g)$ (a; u) = f $ (a; u) + g $ (a; u).
En particulier, pour chaque 1 ≤ k ≤ n, on a
Dk (f + g)(a) = Dk f (a) + Dk g(a).

en a, alors, pour chaque u ∈ Rn tel que |u|2 = 1, gf est dérivable en a dans
la direction u et l’on a
(gf )$(a; u) = g $ (a; u)f (a) + g(a)f $ (a; u).
Dk (gf )(a) = Dk g(a)f (a) + g(a)Dk f (a).

en a et si g(a) /= 0, alors, pour chaque u ∈ Rn tel que |u|2 = 1, fg est dérivable
en a dans la direction u et l’on a
4 5$
f g(a)f $(a; u) − g $ (a; u)f (a)
(a; u) = .
g (g(a))2
4 5
f g(a)Dk f (a) − Dk g(a)f (a)
Dk (a) = .
g (g(a))2
Le cas du composé de deux fonctions est un peu moins direct. On ne
manquera pas de noter le contraste entre la simplicité de la règle de calcul
pour les dérivées totales et le caractère plus compliqué de la règle pour les
dérivées partielles.
Proposition. Soif f une fonction de Rn dans Rp , g une fonction de Rp dans
Rq , a ∈ int dom f tel que f (a) ∈ int dom g. Si f est dérivable en a et si g
est dérivable en f (a), alors, a ∈ int dom (g ◦ f ), et, pour chaque u ∈ Rn tel
que |u|2 = 1, g ◦ f est dérivable en a dans la direction de u, et
(g ◦ f )$ (a; u) = g $ [f (a); f $(a; u)].


p
$
Dk (g ◦ f )(a) = Dk fj (a)Dj g(f (a)), (3.9)
j=1
et, pour chaque 1 ≤ l ≤ q, on a

p
$
Dk (g ◦ f )l (a) = Dj gl (f (a))Dk fj (a). (3.10)
j=1
Démonstration. On a, en utilisant le lien entre dérivée totale et dérivée

directionnelle et la règle de la dérivée totale d’une fonction composée,
(g ◦ f )$ (a; u) = (g ◦ f )$a(u) = (gf$ (a) ◦ fa$ )(u)
= gf$ (a)(fa$ (u)) = gf$ (a)[f $ (a; u)] = g $ [f (a); f $(a; u)].
Dès lors, pour chaque 1 ≤ k ≤ n, il vient
Dk (g ◦ f )(a) = (g ◦ f )$ (a; ek ) = g $ [f (a); f $(a; ek )] = g $ [f (a); fa$ (ek )]

p
$ p
$ p
$
= (fa$ (ek ))j Dj g(f (a)) = (fj )$a(ek )Dj g(f (a)) = Dk fj (a)Dj g(f (a)).
j=1 j=1 j=1
La formule (3.10) s’obtient en passant aux composantes dans la formule

(3.9).
Remarque. La formule (3.10) montre que la matrice jacobienne de g ◦ f en
a est égale au produit matriciel de la matrice jacobienne de g en f (a) par la
matrice jacobienne de f en a.
Exemples. 1. Considérons le passage des coordonnées cartésiennes (x1 , x2 )
aux coordonnées polaires (r, θ) dans R2 pour une fonction g de R2 dans R
dérivable en chaque point de R2 \ {0}. Rappelons que ce changement de
variables est donné par l’application f de R+ × R dans R2 définie par
f (r, θ) = (r cos θ, r sin θ),
et que cette fonction f est dérivable en chaque point de R+ × R. En utilisant

la formule (3.10), on voit, que pour chaque (r, θ) ∈ R+ × R, on a
Dr (g ◦ f )(r, θ)
= D1 g(r cos θ, r sin θ)Dr f1 (r, θ) + D2 g(r cos θ, r sin θ)Dr f2 (r, θ)
3.6. C-DÉRIVABILITÉ 103
= D1 g(r cos θ, r sin θ) cos θ + D2 g(r cos θ, r sin θ) sin θ,

Dθ (g ◦ f )(r, θ)
= D1 g(r cos θ, r sin θ)Dθ f1 (r, θ) + D2 g(r cos θ, r sin θ)Dθ f2 (r, θ)
= −D1 g(r cos θ, r sin θ)r sin θ + D2 g(r cos θ, r sin θ)r cos θ.
En notations matricielles, ces relations s’écrivent
& ' & '& '
Dr (g ◦ f )(r, θ) cos θ sin θ D1 g(r cos θ, r sin θ)
= ,
Dθ (g ◦ f )(r, θ) −r sin θ r cos θ D2 g(r cos θ, r sin θ)
ce qui donne également, si r /= 0, en inversant la matrice,
& ' & '& '
D1 g(r cos θ, r sin θ) cos θ −r −1 sin θ Dr (g ◦ f )(r, θ)
= .
D2 g(r cos θ, r sin θ) sin θ r −1 cos θ Dθ (g ◦ f )(r, θ)
2. Un cas particulier important, pour la mécanique par exemple, est celui
où f est une fonction de R dans Rp+1 de la forme
f (x) = (x, h(x)),
avec h une fonction de R dans Rp dérivable en a ∈ int dom h et g une
fonction de Rp+1 dans R dérivable en f (a) = (a, h(a)) ∈ int dom g. On
numérotera les variables dans Rp+1 par les indices 0, 1, . . ., p. Dans ce cas,
g ◦ f = g(·, h(·)) est une fonction de R dans R dérivable en a et
(g ◦ f )$ (a) = (g ◦ f )$a (1) = [gf$ (a) ◦ fa$ ](1) = gf$ (a)(fa$ (1)) = gf$ (a)(f $ (a))
p
$
= D0 g(a, h(a))f0$ (a) + Dk g(a, h(a))fk$ (a)
k=1
p
$
= D0 g(a, h(a)) + Dk g(a, h(a))h$k(a).
k=1
3.6 C-dérivabilité
Soit f une fonction de C dans C et a ∈ dom f . On peut évidemment la con-
sidérer simplement comme une fonction de R2 dans R2 (en oubliant la struc-
ture supplémentaire de champ de R2 ), et considérer sa dérivabilité en a au
sens de l’existence de la dérivée totale en a. Mais la structure supplémentaire
de C nous permet également de généraliser à une telle fonction la notion de
fonction taux d’accroissement en a (puisqu’on peut diviser un élément de C
par un élément non nul de C) et la notion de dérivée correspondante.
Définition. Soit f une fonction de C dans C et a ∈ dom f . On dit que f

est C-dérivable en a si
f (z) − f (a)
lim
z→a z −a
existe. Dans ce cas, cette limite est appelée la C-dérivée de f en a et elle est
df
notée f $ (a) ou dz (a).
L’existence de la limite implique évidemment que a ne soit pas isolé dans
dom f.
Exemples. 1. Toute application constante de C dans C est évidemment
C-dérivable en chaque point a de C et f $ (a) = 0.
2. Toute application C-linéaire de C dans C est C-dérivable en chaque point
a de C puisqu’alors f est de la forme f (z) = cz pour un certain c ∈ C, et
cz − ca c(z − a)
lim = lim = c.
z→a z−a z→a z − a
On a, dans ce cas, f $ (a) = c.

3. L’application f : z 2→ z̄, qui est R-linéaire mais n’est pas C-linéaire, n’est
C-dérivable en aucun point a de C puisque
z̄ − ā
lim ,
z→a z−a
n’existe pas. En effet, si (hk )k∈N est une suite de nombres réels non nuls
tendant vers zéro, alors, en prenant zk = a + hk , on obtient
zk − ā hk
lim = lim = 1,
k→∞ zk − a k→∞ hk
et en prenant zk = a + ihk , on obtient
zk − ā −ihk
lim = lim = −1.
k→∞ zk − a k→∞ ihk
En procédant exactement comme dans le cas d’une fonction d’une vari-
able réelle, et en se rappelant la structure des applications C-linéaires de C
dans C, on démontre aisément le résultat suivant.
Proposition. Soit f une fonction de C dans C et a ∈ dom f . Alors f est
C-dérivable en a si et seulement s’il existe b ∈ C et une fonction r de C dans
C définie au moins sur (dom f − a) \ {0} tels que limh→0 r(h) = 0 et
f (a + h) = f (a) + hb + |h|r(h),
3.6. C-DÉRIVABILITÉ 105
pour tout h ∈ (dom f − a) \ {0}, ou encore si et seulement s’il existe une

application C-linéaire L de C dans C et une fonction r de C dans C définie
au moins sur (dom f − a) \ {0} tels que limh→0 r(h) = 0 et
f (a + h) = f (a) + L(h) + |h|r(h),
auquel cas L(1) = f $ (a).

On en déduit aisément une condition nécessaire et suffisante de
C-dérivabilité due à Maurice Fréchet et Grace Young.
Proposition. Soit f une fonction de C dans C et a ∈ int dom f. Alors f
est C-dérivable en a si et seulement si les deux conditions suivantes sont
réalisées
a. f , considérée comme fonction de R2 dans R2 , est dérivable en a;
b. D1 f (a) = 1i D2 f (a),
auquel cas on a f $ (a) = D1 f (a) = 1i D2 f (a).
Démonstration. Par la proposition précédente, on voit que f est C-
dérivable en a si et seulement si f , considérée comme fonction de R2 dans
R2 est dérivable en a et sa dérivée totale en a est une application C-linéaire
de C dans C. Il existera donc un b ∈ C tel que l’on ait, pour tout h ∈ C,
fa$ (h) = bh = b(h1 + ih2 ) = bh1 + (ib)h2,
ce qui entraı̂ne aussitôt, puisque
fa$ (h) = h1 D1 f (a) + h2 D2 f (a),
que
1
D1 f (a) = b = D2 f (a),
i
et
f $ (a) = fa$ (1) = D1 f (a).
La condition b du théorème de Fréchet-Young porte le nom de condition

de Cauchy-Riemann. Comme
Dk f (a) = (Dk f1 (a), Dkf2 (a)) (k = 1, 2)
et que le deuxième membre s’écrit encore, en notations complexes,
Dk f (a) = Dk f1 (a) + iDk f2 (a) (k = 1, 2),

ou
Dk f (a) = Dk 8f (a) + iDk 9f (a), (k = 1, 2),
les conditions de Cauchy-Riemann s’écrivent également, en égalant les par-
ties réelles et imaginaires des deux membres de la condition b,
D1 f1 (a) = D2 f2 (a), D2 f1 (a) = −D1 f2 (a),
ou
D1 8f (a) = D2 9f (a), D2 8f (a) = −D1 9f (a).
La matrice jacobienne en a d’une fonction C-dérivable en a a donc ses termes
diagonaux égaux et ses termes hors-diagonale opposés.
Exemple. L’application f de C dans C définie par f (z) = |z|2 n’est C-
dérivable qu’en z = 0. En effet, si z = x + iy, on a
f1 (z) = 8f (z) = x2 + y 2 , f2 (z) = 9f (z) = 0,
et f , considérée comme fonction de R2 dans R2 possède évidemment une

dérivée totale en chaque point a = (a1 , a2 ) = a1 + ia2 . En un tel point, on a
D1 f1 (a) = 2a1 , D2 f1 (a) = 2a2 , D1 f2 (a) = 0, D2 f2 (a) = 0,
et les conditions de Cauchy-Riemann
2a1 = 0, 2a2 = 0,
sont donc satisfaites si et seulement si a = 0.

Enfin, on obtient aisément les règles de calcul suivantes, en utilisant la
définition de la C-dérivabilité en terme de limite du taux d’accroissement
et les propriétés des limites par rapport aux opérations algébriques sur les
fonctions.
Proposition. Soient f et g deux fonctions de C dans C qui sont C-dériva-
bles en a non isolé dans dom f ∩ dom g. Alors :
1. f + g est C-dérivable en a et (f + g)$ (a) = f $ (a) + g $(a).
2. f g est C-dérivable en a et (f g)$ (a) = f $ (a)g(a) + f (a)g $ (a).
3. Si g(a) /= 0, fg est C-dérivable en a et
4 5$
f f $ (a)g(a) − f (a)g $ (a)
(a) = .
g (g(a))2
3.7. EXERCICES 107
Enfin, si f est C-dérivable en a et g est C-dérivable en f (a), alors g ◦ f est

C-dérivable en a et
(g ◦ f )$ (a) = g $ (f (a))f $ (a).
Une conséquence immédiate de cette proposition et des exemples donnés
plus haut est que tout polynôme de C dans C est C-dérivable en chaque
point de C et que toute fonction rationnelle de C dans C est C-dérivable en
chaque point où son dénominateur ne s’annule pas.
3.7 Exercices
1. Soit f une fonction de R dans R∗+ dérivable en a ∈ R. On appelle dérivée
logarithmique de f en a le nombre réel
f $ (a)
Dlog f (a) = = (log f )$ (a).
f (a)
Montrer que si f et g sont deux fonctions de R dans R∗+ dérivables en a ∈ R,
alors on a
Dlog (f g)(a) = Dlog f (a) + Dlog g(a),
f
Dlog (a) = Dlog f (a) − Dlog g(a).
g
2. Soit E une partie non vide de Rn , a ∈ E et b ∈ Rn tel que |b|2 = 1. On
dit que b est tangent à E en a s’il existe une suite (xk )k∈N dans E \ {a} qui
−a
converge vers a et est telle que la suite ( |xxkk−a| 2
)k∈N converge vers b. Montrer
que si a ∈ int E, alors tout b ∈ R tel que |b|2 = 1 est tangent à E en a.
n
Montrer que si E = {(r, r 2) ∈ R2 : r ∈ R}, alors b est tangent à E en 0 si et

seulement si b = e1 ou b = −e1 .
3. Soit f une fonction de Rn dans Rp dérivable en a ∈ dom f. Montrer qu’il
existe au plus une application linéaire L de Rn dans Rp telle que
f (a + h) = f (a) + L(h) + |h|2 r(h),
avec r définie au moins sur (dom f − a) \ {0} et
lim r(h) = 0,
h→0
si et seulement s’il existe une base {b1 , b2, . . . , bn} formée d’éléments bj tan-
gents à dom f en a.
4. Si m > 0 est un réel, on dit qu’une application f de Rn dans Rp est

homogène de degré m si, pour tout a ∈ Rn et tout t ∈ R, on a
f (ta) = tm f (a).
En dérivant les deux membres de cette expression par rapport à t en t = 1,

montrer que si f est dérivable en a, on a la formule d’Euler
n
$
aj Dj f (a) = mf (a).
j=1
5. Si f est une application de Rn dans Rn et k ≥ 1 un entier, posons

f k = f ◦ f ◦ . . . ◦ f (k fois). Montrer par récurrence sur k que si f est
dérivable en chaque point a ∈ Rn , alors, pour chaque k ≥ 2, f k est dérivable
en chaque point a ∈ Rn et
(f k )$a = ff$ k−1 (a) ◦ . . . ◦ ff$ (a) ◦ fa$ .
6. Soit v une fonction de R dans Rp dérivable en chaque point de R, aj ∈ R,

bj ∈ R, (1 ≤ j ≤ n). Montrer que la fonction u de Rn dans Rp définie par
& n
'
$
u(x) = v ak xk
k=1
est telle que, pour chaque x ∈ Rn ,

n
& n
'
$ $ $
bj Dj u(x) = aj bj v $
ak xk .
j=1 j=1 k=1
7. Soit f une fonction de Rn dans R dérivable en a, g et h des fonctions de

Rn dans Rn définies en a. On appelle dérivée de Lie en a de f par rapport
à g le réel
n
$
Lg f (a) = fa$ (g(a)) = gj (a)Dj f (a) = (g(a)|∇f (a)),
j=1
et on appelle dérivée de Lie en a de h par rapport à g l’élément de Rn

n
$
Lg h(a) = h$a (g(a)) = gj (a)Dj h(a).
j=1
Montrer que si ϕ est une fonction de Rn dans R et κ une fonction de Rn

dans Rn dérivables en a et si c ∈ Rn , alors
Lg (f + ϕ)(a) = Lg f (a) + Lg ϕ(a), Lg (h + κ)(a) = Lg h(a) + Lg κ(a),
Lg (cf )(a) = cLg f (a), Lg (ch)(a) = cLg h(a),

Lg (f ϕ)(a) = ϕ(a)Lg f (a) + f (a)Lg ϕ(a).
8. Soit f une fonction de R dans Rp et a non isolé dans dom f. Montrer que
f est dérivable en a si et seulement s’il existe une fonction ϕ de R dans Rp,
continue en a et telle que
f (x) = f (a) + (x − a)ϕ(x),
pour tout x ∈ dom f (caractérisation de Carathéodory). (Suggestion: pren-

dre pour ϕ le prolongement continu en a de ∆a f ). Soit f une fonction de
Rn dans R et a non isolé dans dom f. Montrer que f est dérivable en a si
et seulement s’il existe une fonction ϕ de Rn dans Rn continue en a et telle
que
f (x) = f (a) + (x − a|ϕ(x)),
pour tout x ∈ dom f. (Suggestion: si f (a + h) = f (a) + (∇f (a)|h) + |h|2r(h),
noter que |h|2 r(h) = r(h)
|h|2 (h|h)).

Dérivée
Les rapports ultimes dans lequels les quantités disparaissent ne sont pas
réellement les rapports de quantités ultimes, mais les limites vers lesquelles
les rapports de quantités, décroissant sans limite, s’en approchent toujours;
et vers lesquelles ils peuvent s’en approcher aussi près que toute différence
donnée, mais dont ils ne peuvent jamais les dépasser ou atteindre avant que
les quantités soient diminuées indéfiniment.
Isaac Newton, 1687
Le calcul différentiel en fait consiste seulement en la détermination algé-

brique de la limite d’un quotient.
Jean Le Rond d’Alembert, 1754

Si l’on pose alors ∆x = i, les deux termes du rapport aux différences
∆y f (x + i) − f (x)
= ,
∆x i
seront des quantités infiniment petites. Mais, tandis que ces deux termes
s’approcheront indéfiniment et simultanément de la limite zéro, le rapport
lui-même pourra converger vers une autre limite, soit positive, soit négative.
Cette limite, lorsqu’elle existe, a une valeur déterminée pour chaque valeur
particulière de x. Pour indiquer cette dépendance, on donne à la nouvelle
fonction le nom de fonction dérivée, et on la désigne, à l’aide d’un accent,
par la notation y $ ou f $ (x).
f (x0 + h) = f (x0 ) + c.h + h.h1 (h) où h1 tend vers zéro avec h et c est
une constante : là-dedans se trouve la véritable notion de dérivée.
Dérivées partielles et dérivée totale
Juste comme une fonction de y et z ne peut pas être appelée continue en

un point quand elle y est continue comme une fonction de y seulement, z
étant constante, et comme une fonction de z seulement, y étant constant, on
ne peut pas appeler la fonction dérivable simplement parce que les dérivées
partielles existent.
Karl Thomae, 1873
f a une différentielle première en (x, y), donnée par
∂f (x, y) ∂f (x, y)
df (x, y) = ξ+ η,
∂x ∂y
si, pour tous les points (x + ξ, y + η) proches de (x, y) on peut écrire
f (x + ξ, y + η) = f (x, y) + df (x, y) + ξρ(ξ, η) + ησ(ξ, η),
où ρ(ξ, η) et σ(ξ, η) sont des fonctions de ξ, η qui tendent vers zéro lorsque
ξ et η tendent vers zéro.
Otto Stolz, 1893

Dès que nous quittons le domaine d’une seule variable dans les appli-
cations des définitions fondamentales du calcul différentiel, nous sentons
presqu’immédiatement que nous nous trouvons sur un sol moins sûr. Il
ne peut pas, par la nature des choses, exister une théorie applicable aux
fonctions de deux ou plus variables aussi élégante et simple que celle du co-
efficient différentiel. Une connaissance des coefficients dérivées partielles
dans le cas le plus général n’est en aucune manière équivalent à celui du
seul coefficient différentiel d’une fonction d’une variable. En fait, gardant
à l’esprit l’interprétation géométrique usuelle, et, fixant notre pensée sur le
plan comme image géométrique de la région de variation de deux variables,
nous ne pouvons même pas affirmer qu’une connaissance des coefficients
différentiels dans toutes les directions issues du point constitue l’équivalent
de la connaissance du coefficient différentiel dans le cas d’une seule vari-
able. Pour comprendre et pour caractériser le comportement d’une fonc-
tion au voisinage d’un point, nous devons recourir à ce qui a été appelé la
différentielle.
William H. Young, 1909
C-dérivée
Supposons d’ailleurs que Z reste fonction continue de z, du moins pour

des valeurs de z comprises entre certaines limites. Pour de telles valeurs de
z, à des accroissements infiniment petits ∆x, ∆y de x, y correspondront des
accroissements infiniment petits ∆z, ∆Z de z, Z; et la dérivée de la variable
Z considérée comme fonction de z ne sera autre chose que la limite dont
s’approchera indéfiniment le rapport ∆Z ∆z tandis que ∆x, ∆y s’approcheront
indéfiniment de zéro. Cette dérivée sera désignée par la notation Dz Z. Cela
posé, la dérivée de Z, relative à z, se confondra évidemment avec le rapport
différentiel de Z à z, c’est-à-dire avec le rapport dZ
dz . Si, dans cette formule,
on substitue à la différentielle dz, sa valeur dz = dx+idy, et à la différentielle
dZ sa valeur dZ = Dx Z dx + Dy Z dy, on trouvera
DxZ dx + Dy Z dy
Dz Z = .
dx + idy
dy
Si, d’ailleurs, on pose dx = tg-, cette dernière équation donnera
Dx Z cos - + Dy Z sin -
Dz Z = .
cos - + i sin -
... Il suit immédiatement de cette formule que la dérivée de Z, considérée

comme fonction de z, dépend en général, non seulement de la position du
point A de coordonnées rectangulaires x, y sur la ligne qu’il décrit, mais
encore de la direction de cette ligne. Cette dérivée deviendra indépendante
de l’angle - si ...
Dy Z = iDxZ.
Lorsqu’une fonction u d’une variable imaginaire z est continue, à un

accroissement infiniment petit de la variable correspond un accroissement
infiniment petit de la fonction, et la limite du rapport de l’accroissement de
la fonction à l’accroissement de la variable est la dérivée de la fonction. On
a donc
du dX + idY
dX
dx dx + dX
dy dy + ( dX
dx dx +
dY
dy dy)i
= = ,
dz dx + idy dx + idy
ou
dY dy
du
dX
dx + i dY
dx + ( dy + i dy ) dx
dX
= dy
.
dz 1 + i dx
En général, la dérivée dépend de la quantité dy
dx , et par conséquent de la di-
rection du déplacement infiniment petit donné au point z. A chaque direction
de déplacement correspond une dérivée particulière, et la fonction a ainsi,
pour une même valeur de z, une infinité de dérivées. Lorsque la valeur de la
dérivée est indépendante de la direction du déplacement, en d’autres termes,
lorsque la fonction admet une dérivée unique en chaque point, M. Cauchy
dit que la fonction est monogène.
Charles Briot et Jean-Claude Bouquet, 1856

Chapitre 4
Fonctions continues ou
dérivables
4.1 Propriétés locales et propriétés globales

Il est important en mathématiques de distinguer les propriétés locales des
propriétés globales et d’étudier leurs relations. Si E est une partie non vide
de Rn , et P est une propriété, on dira que P est localement vérifiée sur E si,
pour chaque a ∈ E, il existe un nombre δ = δ(a) > 0 tel que P soit vérifiée
sur E ∩ B∞ [a; δ(a)]. Bien entendu, une telle définition est indépendante du
choix de la norme dans Rn et nous avons choisi | · |∞ pour des raisons de
commodité qui apparaı̂tront plus tard. Il est clair que si P est vérifiée sur
E, alors P est vérifiée localement sur E, mais la réciproque est fausse.
Ainsi, prenant pour P la propriété “être fini”, on voit que E sera locale-
ment fini si, pour chaque a ∈ E, il existe δ = δ(a) > 0 tel que E ∩B∞ [a; δ(a)]
soit fini. Z n’est pas fini mais est localement fini (prendre par exemple
δ(k) = 1/2 pour k ∈ Z), et E = {1/k : k ∈ N∗ }, également infini, est
localement fini (prendre δ(1/k) = 1/2k(k + 1)).
On a dit au Chapitre 2 qu’une fonction f de Rn dans Rp est localement
bornée en a ∈ Rn si la condition
(∃δ > 0)(∃r > 0)(∀x ∈ dom f ∩ B∞ [a; δ]) : |f (x)|2 ≤ r
est satisfaite. Cette propriété suggère la définition suivante. Soit f une
fonction de Rn dans Rp et E une partie de Rn telle que dom f ∩ E /= ∅.
Définition. On dit que f est bornée sur E si la condition
(∃r > 0)(∀x ∈ dom f ∩ E) : |f (x)|2 ≤ r
113
114 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES
est satisfaite.
Il est clair que f est localement bornée en a si et seulement s’il existe
δ > 0 tel que f soit bornée sur B∞ [a; δ].
La propriété pour f d’être bornée sur E est évidemment une propriété
globale de E. Elle implique évidemment la propriété locale correspondante.
Définition. On dit que f est localement bornée sur E si
(∀a ∈ E)(∃δ(a) > 0)(∃r(a) > 0)(∀x ∈ dom f ∩ E ∩ B∞ [a; δ(a)]) :
|f (x)|2 ≤ r(a).
Il est clair que si f est bornée sur E, elle est localement bornée sur E, et
que f est localement bornée sur E si et seulement si f est localement bornée
en chaque a ∈ E, au sens de la définition du Chapitre 2. Par exemple, la
fonction f de R dans R définie par f (x) = x1 est localement bornée sur R∗+ .
En effet, étant donné a > 0, si l’on prend# δ(a) # = a/2, on voit que pour
#1#
x ∈ ] 2 , 2 ], on aura x ∈ [ 3a , a [, et donc # x # < a2 . La valeur r(a) = 2/a
a 3a 1 2 2
convient donc dans la définition. Par contre, cette fonction n’est pas bornée
sur R∗+ puisque, pour chaque r > 0, on aura 1/2r 1
= 2r > r. Ainsi donc, la
propriété: la fonction f est localement bornée sur l’ensemble E n’implique
pas nécessairement que f soit bornée sur E.
Comme autre exemple, considérons la propriété, pour une fonction f
de Rn dans R, d’être de signe constant sur E ⊂ Rn , c’est-à-dire d’être
strictement positive sur E ou strictement négative sur E. C’est une pro-
priété globale sur E qu’on peut localiser en disant que f est localement de
signe constant sur E si, pour chaque a ∈ E, il existe δ(a) > 0 tel que f soit
de signe constant sur E ∩B∞ [a; δ(a)]. Toute fonction de signe constant sur E
est évidemment localement de signe constant sur E, mais la réciproque est
fausse. Ainsi, l’identité de R dans R n’est pas de signe constant sur R \ {0},
mais elle y est localement de signe constant. En effet, si a > 0, on voit que f
est strictement positive sur [a/2, 2a/2] et si a < 0, f est strictement négative
sur [3a/2, a/2]. On voit donc que δ(a) = |a|/2 convient dans la définition.
Une propriété vérifiée localement sur E introduit donc une application
δ : E → R∗+ , a 2→ δ(a), dont la valeur en a fixe sur le rayon d’une boule
centrée en a telle que la propriété P ait lieu sur E ∩ B∞ [a; δ(a)]. Une telle
application sera appelée une jauge sur E. Nous allons développer une tech-
nique permettant de montrer que, pour certaines classes d’ensembles E de
Rn , une propriété localement satisfaite sur E y sera globalement vérifiée.
En utilisant le théorème des intervalles fermés emboı̂tés, nous montrerons
4.2. P-PARTITIONS D’UN PAVÉ ET LEMME DE COUSIN 115
d’abord que c’est le cas pour les intervalles fermés (bornés) de R et les pro-
duits cartésiens de tels intervalles dans Rn . C’est le fait qu’une boule en
norme | · |∞ soit un produit d’intervalles fermés bornés qui suggère, par com-
modité, le choix de cette norme. Nous étendrons ensuite le résultat à une
classe plus vaste de parties de Rn .
4.2 P-partitions d’un pavé et lemme de Cousin

Généralisons à Rn la notion d’intervalle.
Définition. On appelle pavé de Rn toute partie K ⊂ Rn de la forme
n
6
K = K1 × K2 × . . . × Kn = Ki ,
i=1
où, pour chaque 1 ≤ i ≤ n, Ki = [ai , bi] est un intervalle fermé de R. On

appelle pavé ouvert de Rn toute partie J ⊂ Rn de la forme
n
6
J = J1 × J2 × . . . × Jn = Ji ,
i=1
où, pour chaque 1 ≤ i ≤ n, Ji = ]ai , bi[ est un intervalle ouvert de R. Enfin,

on appelle semi-pavé de Rn toute partie I ⊂ Rn de la forme
n
6
I = I1 × I2 × . . . × In = Ii ,
i=1
où, pour chaque 1 ≤ i ≤ n, Ii = ]ai , bi] est un intervalle ouvert à gauche

et fermé à droite. Lorsque b1 − a1 = b2 − a2 = . . . = bn − an , on parlera
respectivement d’un n-cube, d’un n-cube ouvert ou d’un n-semi-cube.
Ainsi donc, avec les notations de la définition,
K = {x ∈ Rn : ai ≤ xi ≤ bi , (1 ≤ i ≤ n)},
J = {x ∈ Rn : ai < xi < bi , (1 ≤ i ≤ n)},

I = {x ∈ Rn : ai < xi ≤ bi , (1 ≤ i ≤ n)}.
Exemple. Pour chaque a ∈ Rn et chaque r > 0, B∞ [a; r] est le n-cube
[a1 − r, a1 + r] × [a2 − r, a2 + r] × . . . × [an − r, an + r].

Définition. On dit que (K (i))i∈N est une suite de pavés emboı̂tés de Rn si

chaque K (i) est un pavé de Rn et si, pour chaque i ∈ N, on a
K (i+1) ⊂ K (i).
Si, pour chaque i ∈ N,

(i) (i)
K (i) = K1 × K2 × . . . × Kn(i) ,
l’hypothèse que (K (i))i∈N soit une suite de pavés emboı̂tés équivaut évidem-
(i)
ment à ce que, pour chaque 1 ≤ j ≤ n, la suite (Kj )i∈N soit une suite
d’intervalles fermés emboı̂tés de R.
Le résultat suivant, appelé théorème des pavés emboı̂tés, est une
conséquence facile du théorème des intervalles fermés emboı̂tés.
Proposition. Si (K (i))i∈N est une suite de pavés emboı̂tés de Rn , alors
7
i∈N K
(i)
/= ∅.
Démonstration. Soit (K (i))i∈N une suite de pavés emboı̂tés de Rn . Si,
pour chaque i ∈ N, on écrit
(i) (i)
K (i) = K1 × K2 × . . . × Kn(i) ,
(i)
alors, pour chaque 1 ≤ j ≤ n, la suite (Kj )i∈N est une suite d’intervalles
fermés emboı̂tés de R, et il existe donc un réel cj tel que, pour chaque i ∈ N,
on ait
(i)
cj ∈ K j .
Dès lors, c = (c1 , c2 , . . . , cn) ∈ Rn est tel que, pour chaque i ∈ N, on a
(i) (i)
c ∈ K1 × K2 × . . . × Kn(i) = K (i),
7
c’est-à-dire c ∈ i∈N K
(i)
.
Pour étudier les relations entre les pavés, pavés ouverts et semi-pavés, on
a besoin des compléments suivants sur l’intérieur et l’adhérence d’une partie
de Rn .
Proposition. Si m ≥ 1, p ≥ 1 sont des entiers et si A ⊂ Rm et B ⊂ Rp,
alors
int (A × B) = int A × int B,
adh (A × B) = adh A × adh B.
Démonstration. Soit x = (y, z) ∈ int (A × B), avec y ∈ A et z ∈ B. Il

existe donc r > 0 tel que
n
B∞ [x; r] ⊂ A × B,
où B∞
n [x; r] désigne la boule de centre x et de rayon r dans Rn avec n = m+p.
Comme
B∞n
[x; r] = B∞
m
[y; r] × B∞
p
[z; r],
on aura évidemment
m
B∞ [y; r] ⊂ A et B∞
p
[z; r] ⊂ B,
ce qui montre que y ∈ int A et z ∈ int B, et donc que
x = (y, z) ∈ int A × int B.
Réciproquement, si x = (y, z) ∈ int A × int B, alors y ∈ int A et z ∈ int B,

et il existera r1 > 0 et r2 > 0 tels que
m
B∞ [y; r1] ⊂ A et B∞
p
[z; r2] ⊂ B.
En conséquence, si r = min{r1 , r2 }, on aura

n
B∞ [x; r] = B∞
m
[y; r] × B∞
p
[z; r] ⊂ A × B,
ce qui montre que x ∈ int (A × B). On a donc démontré la première égalité.

Pour la seconde, notons que x = (y, z) ∈ adh (A × B) si et seulement si,
pour chaque r > 0, on a B∞ n [x; r] ∩ (A × B) /= ∅, c’est-à-dire si et seulement
si, pour chaque r > 0, on a

m
B∞ [y, r] ∩ A /= ∅ et B∞
p
[z; r] ∩ B /= ∅,
y ∈ adh A et z ∈ adh B,
ou encore si et seulement si x = (y, z) ∈ adh A × adh B.

En appliquant ce résultat de proche en proche et en le combinant avec
les calculs d’intérieur et d’adhérence des différents types d’intervalles de R,
on obtient aussitôt le corollaire suivant.
Corollaire. Soient ai < bi , (1 ≤ i ≤ n), des réels, et soient

n
6 n
6 n
6
K= [ai, bi], J = ]ai , bi[, I = ]ai , bi].
i=1 i=1 i=1
Alors,
int K = int J = int I = J,
K = J = I = K.
Rappelons que si E est un ensemble quelconque et (Eα)α∈A une famille
de parties Eα de E, on dit que (Eα)α∈A partitionne E ou est une partition
de E si les deux conditions suivantes sont vérifiées :
1) (∀α ∈ A)(∀β ∈ A : α /= β) : Eα ∩ Eβ = ∅.
!
2) E = α∈A Eα.
En d’autres termes, les Eα doivent être des parties mutuellement disjointes
de E dont l’union redonne E. Comme on travaillera en général avec des parti-
tions en un nombre fini d’ensembles, on utilisera l’abus de notation commode
consistant à désigner, lorsque A = {α1 , . . . , αm }, la famille (Eα)α∈A par
{Eα1 , Eα2 , . . . , Eαm }.
Bien entendu, (E) est une partition de E, que l’on qualifiera de triviale.
On se convaincra aisément que, à l’exception de la partition triviale, il
n’est pas possible de partitionner un pavé en un nombre fini de pavés et
qu’il n’est pas possible de partitionner un pavé ouvert en un nombre fini de
pavés ouverts. Ainsi, {[a, c], [c, b]} avec a < c < b n’est pas une partition
de [a, b] puisque [a, c] ∩ [c, b] = {c}, et {]a, c[, ]c, b[} n’est pas une partition
de ]a, b[ puisque ]a, c[ ∪ ]c, b[ /= [a, b[. Par contre, il est toujours possible
de partitionner un semi-pavé en un nombre fini de semi-pavés, puisque, si
=
a < c < b, {]a, c], ]c, b]} est une partition de ]a, b], et que si I = ni=1 Ii est
un semi-pavé de Rn et si, pour chaque 1 ≤ i ≤ n, les intervalles semi-ouverts
Ii1 , Ii2 , . . . , Iiki partitionnent l’intervalle semi-ouvert Ii , alors la famille finie
{I1j1 × I2j2 × . . . × Injn : 1 ≤ j1 ≤ k1 , 1 ≤ j2 ≤ k2 , . . . , 1 ≤ jn ≤ kn }
est une partition de I en un nombre fini de semi-pavés. Notons aussi que

si (I j )1≤j≤m est une partition du semi-pavé I en semi-pavés, alors, de la
!
relation I = m j=1 I , on déduit aussitôt
j
m
> m
>
I¯ = Ij = Ij.
j=1 j=1
Dans l’étude du passage d’une propriété locale à une propriété globale,

il est utile de considérer des partitions d’un semi-pavé de Rn en un nombre
fini de semi-pavés à chacun desquels est attaché un point de son adhérence.
Ce concept se formalise comme suit.
Définition. Soit I ⊂ Rn un semi-pavé. Une P-partition de I est une famille
finie 8 9 ? @
Π = (xj , I j ) = (x1 , I 1), (x2, I 2 ), . . ., (xm, I m )
1≤j≤m
telle que :
1) (I j )1≤j≤m = {I 1 , I 2 , . . . , I m} est une partition de I en semi-pavés.
2) xj ∈ I j pour chaque 1 ≤ j ≤ m.
Ainsi, quel que soit c ∈ I, ¯ {(c, I)} est une P-partition du semi-pavé I
de R et {(0, ]0, 1]), (2, ]1, 3])} est une P-partition de ]0, 3]. Bien entendu,
n
si les semi-pavés I 1 , . . . I q partitionnent le semi-pavé I et si, pour chaque

1 ≤ l ≤ q, 8 9
Πl = (xl,jl , I l,jl )
1≤jl ≤ml
est une P-partition de I l , alors

8 9
Π = (xl,jl , I l,jl )
1≤jl ≤ml , 1≤l≤q
sera une P-partition de I que l’on désignera souvent d’une manière impropre
mais commode par la notation {Π1 , Π2 , . . . , Πq }.
On a vu qu’une propriété locale P sur un ensemble E de Rn s’obtient
en associant à chaque point x ∈ Rn un nombre strictement positif (pouvant
dépendre de x) δ(x) tel que P soit satisfaite sur E ∩ B∞ [x; δ(x)], c’est-à-dire
en donnant une jauge δ sur E. La donnée d’une jauge sur l’adhérence I¯ d’un
semi-pavé permet de mesurer la “finesse” d’une P-partition de I.
A B
Définition. Si I ⊂ Rn est un semi-pavé, Π = (xj , I j ) 1≤j≤m une P-
¯ on dit que Π est δ-fine si, pour chaque
partition de I et δ une jauge sur I,
1 ≤ j ≤ m, on a
I j ⊂ B∞ [xj ; δ(xj )]. (4.1)
Comme, pour chaque 1 ≤ j ≤ m, on a
adh B∞ [xj ; δ(xj )] = B∞ [xj ; δ(xj )],

on voit que la condition (4.1) équivaut à ce que, pour chaque 1 ≤ j ≤ m, on

ait
I j ⊂ B∞ [xj ; δ(xj )].
Lorsque δ est une jauge constante sur I, ¯ dont la valeur constante est
également notée δ, il est facile de construire une P-partition δ-fine de I.
Si I = I1 × . . . × In , avec, pour chaque 1 ≤ k ≤ n, Ik = ]ak , bk ], il suffit
en effet de partitionner Ik en q semi-intervalles Ikl = ]clk , cl+1
k ] de longueur
cl+1 − c l ≤ δ (1 ≤ l ≤ q − 1), de considérer la partition produit
k k
(I1l1 × I2l2 × . . . × Inln )(1≤lk ≤q; 1≤k≤n) ,
et d’associer à chacun des semi-pavés I j de cette partition un élément quel-

conque xj appartenant à son adhérence (1 ≤ j ≤ m). Ici, m = q n . En effet,
=
si I j = nk=1 ]ajk , bjk ], alors on a, par construction, pour chaque 1 ≤ k ≤ n,
bjk − ajk ≤ δ, et dès lors
xjk − δ ≤ bjk − δ ≤ ajk < bjk ≤ ajk + δ ≤ xjk + δ,
I j ⊂ B∞ [xj ; δ] = B∞ [xj ; δ(xj )].
On ne dispose pas d’un tel procédé de construction dans le cas d’une

jauge quelconque δ sur I,¯ et l’existence d’une P-partition δ-fine résulte alors
de l’important résultat suivant, qu’on appelle le lemme de Cousin.
Théorème. Si I un semi-pavé de Rn et δ une jauge sur I, ¯ alors il existe
une P-partition δ-fine de I.
Démonstration. Supposons le résultat faux et soit δ une jauge sur I¯ telle
=
que I n’admette pas de P-partition δ-fine. Partitionnons I = ni=1 ]ai , bi]
en 2n semi-pavés congruents par bissection des côtés. En d’autres termes,
=
partitionnons I en 2n semi-pavés congruents du type ni=1 ]ci , di] avec
ai + bi ai + bi
ci = ai , di = , ou ci = , di = bi , (1 ≤ i ≤ n).
2 2
L’un de ces semi-pavés au moins, disons I (1), n’admet pas de P-partition
δ-fine car, autrement, la réunion des P-partitions δ-fines de chaque semi-
pavé de la division fournirait une P-partition δ-fine de I, ce qui a été ex-
clu. Partitionnons alors I (1) en 2n semi-pavés congruents par bissection des
côtés, comme on l’a fait pour I. L’un de ces semi-pavés au moins, disons
4.3. PROPRIÉTÉ DE VALEUR INTERMÉDIAIRE 121
I (2) n’admettra pas de P-partition δ-fine. En continuant indéfiniment cette

construction, on obtient une suite (I (k))k∈N de semi-pavés, avec I (0) = I,
vérifiant les propriétés suivantes :
(i) chaque I (k) n’admet pas de P-partition δ-fine;
(ii) I (k+1) ⊂ I (k), (k ∈ N);
(iii) si d = max{bi − ai : 1 ≤ i ≤ n} désigne la longueur du plus grand côté
de I, alors, pour tout x ∈ I (k) et tout y ∈ I (k), on a |x − y|∞ ≤ 2dk , (k ∈ N).
Cette dernière propriété résulte du fait que la longueur de chacun des côtés
d’un semi-pavé I (k) est deux fois plus petite que celle du côté correspondant
du semi-pavé qui le précède dans la suite.
En conséquence, la suite (I (k))k∈N constitue une suite de pavés emboı̂tés
7
et, par le théorème des pavés emboı̂tés, il existe c ∈ k∈N I (k) . Choisissons
p ∈ N suffisamment grand pour que 2dp ≤ δ(c). Comme c ∈ I (p), on aura,
pour tout x ∈ I (p),
d
|x − c|∞ ≤ p ≤ δ(c),
2
8 9
c’est-à-dire I (p) ⊂ B∞ [c; δ(c)], et (c, I (p)) sera une P-partition δ-fine de
I (p), ce qui contredit la propriété (i) ci-dessus.
Remarque. La démonstration que nous venons de faire prouve en fait que
pour tout ¯ il existe une P-partition
semi-pavé I de Rn et toute jauge δ sur I,
A j j B
δ-fine (x , I ) 1≤j≤m telle que chaque I soit semblable à I, c’est-à-dire telle
j
=n =n j j
que, si I = i=1 ]ai , bi] et I j = i=1 ]ai , bi ], (1 ≤ j ≤ m), on ait
bj1 − aj1 bj − aj2 bj − ajn

= 2 = ... = n .
b1 − a1 b2 − a2 bn − an
Une telle P-partition est appelée une P-partition régulière de I.
4.3 Propriété de valeur intermédiaire

Montrons tout d’abord qu’une fonction réelle, non nulle et continue en un
point garde son signe sur un voisinage du point: la propriété ponctuelle
devient une propriété locale.
Lemme. Soit f une fonction de Rn dans R continue en a ∈ dom f . Si
f (a) > 0 (resp. f (a) < 0), il existe δ = δ(a) > 0 tel que, pour tout
x ∈ dom f ∩ B∞ [a; δ(a)], on ait
f (x) > 0 (resp. f (x) < 0).

Démonstration. Faisons-la dans le cas où f (a) > 0, l’autre cas s’y ra-
menant en remplaçant f par −f. En prenant ! = f (a) 2 dans la définition de
continuité de f en a, on obtient l’existence d’un δ = δ(a) > 0 tel que, pour
tout x ∈ dom f ∩ B∞ [a; δ(a)], on aura
f (a) f (a)
− ≤ f (x) − f (a) ≤ ,
2 2
f (a)
et donc f (x) ≥ 2 > 0.
Remarque. La conclusion de la proposition précédente peut encore s’expri-
mer en disant que, pour tout x ∈ dom f ∩B∞ [a; δ(a)], on aura f (x)f (a) > 0.
Le théorème de Cousin permet, sous certaines conditions, de passer de
ce résultat local à un résultat global. Si f est une fonction de Rn dans Rp
et E ⊂ dom f , on dira que f est continue sur E si f est continue en chaque
point de E. Montrons tout d’abord qu’une fonction réelle d’une variable
réelle continue et non nulle sur un intervalle fermé garde un signe constant
sur cet intervalle.
Proposition. Soit f une fonction de R dans R continue sur l’intervalle
fermé [a, b]. Si, pour chaque x ∈ [a, b], on a f (x) /= 0, alors f (a)f (b) > 0.
Démonstration. Par la proposition précédente appliquée à chaque point
de [a, b], on trouve que
(∀x ∈ [a, b])(∃δ(x) > 0)(∀y ∈ [a, b] ∩ [x − δ(x), x + δ(x)]) : f (y)f (x) > 0.
On obtient ainsi une jauge δ : x 2→ δ(x) sur [a, b], et leAlemme Bde Cousin
garantit alors l’existence d’une P-partition δ-fine Π = (xj , I j ) 1≤j≤m de
I = ]a, b], que l’on peut évidemment toujours numéroter de telle sorte que,
si I j = ]aj−1 , aj ], on ait
a = a0 < a1 < a2 < . . . < am−1 < am = b.
Comme Π est δ-fine, on a, pour chaque 1 ≤ j ≤ m,
[aj−1 , aj ] ⊂ [xj − δ(xj ), xj + δ(xj )],
et dès lors
f (aj−1 )f (xj ) > 0, f (aj )f (xj ) > 0,
f (aj−1 )f (aj ) > 0,
et la thèse s’en déduit.
Remarque. Le résultat est faux si f cesse d’être continue en un point de

[a, b] (considérer par exemple la fonction f définie sur [0, 1] par f (x) = −1
si x ∈ [0, 12 ] et f (x) = 1 si x ∈ ] 12 , 1]) ou si elle est continue sur un ensemble
qui n’est pas un intervalle (considérer par exemple la fonction f définie sur
[0, 1] ∪ [2, 3] par f (x) = −1 si x ∈ [0, 1] et f (x) = 1 si x ∈ [2, 3]).
La forme contraposée de cette proposition fournit, pour une fonction
réelle d’une variable réelle, une utile condition suffisante d’existence d’un
zéro, appellée le théorème de Bolzano. C’est Bernard Bolzano qui le
premier, en 1817, sentit la nécessité de donner une démonstration analytique
de ce résultat, considéré jusqu’alors comme “géométriquement” évident.
Corollaire. Soit f une fonction de R dans R continue sur [a, b]. Si
f (a)f (b) ≤ 0,
alors il existe au moins un c ∈ [a, b] tel que f (c) = 0.
Une conséquence utile du théorème de Bolzano est l’existence d’un zéro
réel pour tout polynôme réel de degré impair.
Corollaire. Tout polynôme à coefficients réels de degré impair possède au
moins un zéro réel.
Démonstration. Soit
m
$
p : R → R, x 2→ aj xj ,
j=0
un polynôme à coefficients réels aj de degré impair m (am /= 0). Sans perte

de généralité, on peut supposer que am > 0, puisque, dans le cas contraire,
il suffit de considérer −p. On sait que p est continue sur R et, pour tout
x /= 0, on a  
m−1
$
p(x) = xm am + aj xj−m  .
j=0
%m−1
Comme j=0 aj xj−m → 0 si x → ∞, il existera ρ > 0 tel que, pour tout
|x| ≥ ρ, on ait # #
#m−1 #
#$ # am
# j−m #
# aj x #≤ 2 .
# j=0 #
Cela entraı̂ne en particulier que
 
m−1
$ am
p(ρ) = ρm am + aj ρj−m  ≥ ρm > 0,
j=0
2
et  
m−1
$ am
p(−ρ) = −ρ m
am + aj (−ρ) j−m 
≤ −ρm < 0.
j=0
2
La thèse résulte alors du théorème de Bolzano.

Il résulte immédiatement de ce résultat que tout nombre réel possède
une racine ne réelle lorsque n est impair. On va l’utiliser pour démontrer
l’existence de la racine ne complexe d’un nombre complexe quelconque pour
tout entier n strictement positif.
Proposition. Pour chaque entier n ≥ 1, et chaque c ∈ C, il existe au moins
un z ∈ C tel que z n = c.
Démonstration. Le résultat est trivial pour n = 1. Si n = 2 et c =
a + ib, z = x + iy, l’équation z 2 = c équivaut au système d’équations
x2 − y 2 = a, 2xy = b.
Comme x2 + y 2 = |z|2 = |c|, on en déduit que
2x2 = |c| + a, 2y 2 = |c| − a,
ce qui fournit les solutions

C C
1 1
z= (|c| + a) + i sign b (|c| − a),
2 2
et C C
1 1
z=− (|c| + a) − i sign b (|c| − a).
2 2
Supposons maintenant que n > 2 et démontrons le résultat par récurrence
sur n. Si n est pair, disons n = 2m, il existe, par ce qui précède, au moins
un η ∈ C tel que η 2 = c. Comme m < n, l’hypothèse de récurrence entraı̂ne
l’existence d’un z ∈ C tel que z m = η, et dès lors tel que z n = z 2m = η 2 = c.
Si n est impair, alors, puisqu’on sait déjà que tout réel possède une racine
ne réelle, on peut supposer sans perte de généralité que c n’est pas réel et
que |c| = 1. Soit d ∈ C tel que d2 = c, de telle sorte que dd¯ = 1. Définissons
le polynôme p sur R par
p(x) = i[d̄(x + i)n − d(x − i)n].
Son terme de degré n en x, i(d̄ − d)xn , est différent de zéro et, comme
p(x) = p(x) pour tout x ∈ R, p est donc un polynôme réel de degré impair
n. Par le Corollaire précédent, il existe donc un λ ∈ R tel que p(λ) = 0, ce

qui entraı̂ne
d(λ + i)n = d(λ − i)n ,
et dès lors 4 5n
λ+i d
= = d2 = c.
λ−i d
La propriété suivante a longtemps été confondue avec la propriété de

continuité sur E. Nous verrons qu’elle est seulement une condition nécessaire
de continuité sur E.
Définition. Soit f une fonction de Rn dans R définie sur E ⊂ Rn . On
dit que f possède la propriété de valeur intermédiaire ou la propriété de
Darboux sur E ou encore que f est continue au sens de Darboux sur E si,
pour chaque x ∈ E, chaque y ∈ E et chaque v compris entre f (x) et f (y), il
existe au moins un z ∈ E tel que f (z) = v.
En d’autres termes, une telle fonction prend sur E toutes les valeurs
intermédiaires entre deux quelconques de ses valeurs. Nous allons voir que
cette propriété est satisfaite par une fonction réelle continue sur une partie
“d’un seul tenant” de Rn .
Définition. Soit E ⊂ Rn . On dit que E est connexe par arcs si, pour tout
x ∈ E et tout y ∈ E, il existe une application continue γ : [0, 1] → E telle
que γ(0) = x et γ(1) = y.
Intuitivement, E est connexe par arcs si deux quelconques de ses points
peuvent être joints par un arc de courbe continu entièrement contenu dans
E. Par exemple, tout intervalle I de R est connexe par arcs puisque, si
x < y appartiennent à I, alors [x, y] ⊂ I et l’application continue γ : [0, 1] →
R, t 2→ (1 − t)x + ty, satisfait bien aux conditions de la définition puisque
γ([0, 1]) = [x, y] ⊂ I. Par contre, N, Z et Q ne sont pas connexes par arcs
mais R l’est. De même, toute boule de Rn est connexe par arcs, de même
que toute partie du type {x ∈ Rn : r ≤ |x|j ≤ R}, avec j = 1, 2 ou ∞. Mais
l’union de deux boules disjointes de Rn n’est pas connexe par arcs.
Proposition. Soit f une fonction de Rn dans R continue sur une partie
connexe par arcs E de Rn . Alors f possède sur E la propriété de valeur
intermédiaire.
Démonstration. Soit x ∈ E, y ∈ E et γ : [0, 1] → E une application
continue telle que γ(0) = x, γ(1) = y. Soit v compris entre f (x) et f (y)
(c’est-à-dire v ∈ [f (x), f (y)] si f (x) < f (y), v ∈ [f (y), f (x)] si f (y) < f (x) et
v = f (x) = f (y) si f (x) = f (y)). Par le théorème de continuité des fonctions
composées, la fonction g = f ◦ γ − v est une fonction de R dans R continue
sur [0, 1], et, par construction, elle est telle que
g(0)g(1) = (f (x) − v)(f (y) − v) ≤ 0.
Le théorème de Bolzano entraı̂ne donc l’existence d’au moins un τ ∈ [0, 1]

tel que g(τ ) = 0, c’est-à-dire de z = γ(τ ) ∈ E tel que f (z) = v.
4.4 Ouverts, fermés et bornés

Introduisons des familles importantes de parties de Rn qui jouent un rôle
important en analyse et qui conduiront à une extension du lemme de Cousin.
Définition. On dit que E ⊂ Rn est une partie ouverte ou un ouvert de Rn
si chaque élément de E est intérieur à E.
En d’autres termes, E est un ouvert s’il est voisinage de chacun de
ses points ou encore si int E ⊃ E, ce qui équivaut à int E = E, puisque
l’inclusion inverse est toujours satisfaite.
Par exemple, ∅ et Rn sont des ouverts de Rn , et ]a, b[ est un ouvert de
R. De même, si a ∈ R et b ∈ R, les ensembles
]a, +∞[ = {x ∈ R : x > a} et ] − ∞, b[ = {x ∈ R : x < b}
sont des ouverts de R (le vérifier). On les appelle respectivement des inter-
valles ouverts non bornés d’origine a et d’extrémité b.
Définition. On dit que F ⊂ Rn est une partie fermée ou un fermé de Rn si
tout point adhérent à F appartient à F .
En d’autres termes, F est un fermé si adh F ⊂ F , ce qui équivaut à
adh F = F , puisque l’inclusion inverse est toujours satisfaite.
Par exemple, ∅ et Rn sont des fermés de Rn , et [a, b] est un fermé de R.
D’autre part, ]a, b] et [a, b[ ne sont ni ouverts ni fermés dans R.
Les notions d’ouvert et de fermé s’échangent par passage au complémen-
taire.
Proposition. E ⊂ Rn est ouvert si et seulement si !E est fermé.
!E est fermé ⇔ adh !E = !E ⇔ !int E = !E

4.4. OUVERTS, FERMÉS ET BORNÉS 127
⇔ int E = E ⇔ E est ouvert.
Par conséquent, si a ∈ R et b ∈ R, les ensembles
[a, +∞[ = {x ∈ R : x ≥ a} et ] − ∞, b] = {x ∈ R : x ≤ b}
sont des fermés de R puisqu’ils sont respectivement les complémentaires dans

R des ensembles ouverts ] − ∞, a[ et ]b, +∞[. On les appelle respectivement
des intervalles fermés non bornés d’origine a ou d’extrémité b.
Etudions maintenant comment se comportent les ouverts et les fermés
vis-à-vis des opérations d’union et d’intersection.
Le premier résultat affirme qu’une union quelconque d’ouverts est un
ouvert.
Proposition. Si A est un ensemble non vide quelconque et (Eα)α∈A une
!
famille d’ouverts Eα de Rn , alors α∈A Eα est un ouvert de Rn .
!
Démonstration. Si x ∈ α∈A Eα, il existe α̃ ∈ A tel que x ∈ Eα̃ . Comme
!
Eα̃ est ouvert, il est voisinage de x et il en sera donc de même de α∈A Eα.
Donc ce dernier ensemble, voisinage de chacun de ses points, est ouvert.
Le deuxième résultat affirme qu’une intersection d’un nombre fini d’ou-
verts est un ouvert.
Proposition. Si (Ej )1≤j≤m est une famille finie d’ouverts Ej de Rn , alors
7m
j=1 Ej est un ouvert de R .
n
Démonstration. Par une propriété de l’intérieur vis-à-vis de l’intersecti-

on, on a  
m
" m
" m
"
int  Ej  = int Ej = Ej .
j=1 j=1 j=1
Remarque. Ce résultat est faux si la famille n’est pas finie. Ainsi, pour
7
chaque k ∈ N∗ , ] − 1k , k1 [ est un ouvert de R, mais {0} = k∈N∗ ] − k1 , 1k [ ne
l’est pas.
En utilisant les lois de De Morgan et les trois propositions, on obtient
aisément les résultats suivants sur le comportement des fermés : une in-
tersection quelconque de fermés est fermée; une union finie de fermés est
fermée.
Proposition. Si A est un ensemble non vide quelconque et (Fα )α∈A une

7
famille de fermés Fα de Rn , alors α∈A Fα est un fermé de Rn .
Proposition. Si (Fj )1≤j≤m est une famille finie de fermés Fj de Rn , alors

!m
j=1 Fj est un fermé de R .
n
Remarque. La dernière proposition ne s’étend pas au cas d’une famille non

finie de fermés. Ainsi, pour chaque k ∈ N∗ , [0, k+1
k
] est un fermé de R, mais
!
k∈N∗ [0, k+1 ] = [0, 1[ n’est pas un fermé de R.
k
Exemples. 1. Si a ∈ Rn , r > 0 et j = 1, 2 ou ∞, alors Bj [a; r] est un fermé

de Rn . Cela équivaut à montrer que
!Bj [a; r] = {x ∈ Rn : |x − a|j > r}
est ouvert. Soit x ∈ !Bj [a; r]. Alors, |x − a|j > r et il existe donc ! > 0 tel
que |x − a|j > r + !. Si y ∈ Bj [x; !], on a
|y − a|j = |(x − a) − (x − y)|j ≥ |x − a|j − |x − y|j > r + ! − ! = r,
c’est-à-dire Bj [x; !] ⊂ !Bj [a; r]; ce dernier ensemble est donc voisinage de
chacun de ses points.
2. Si a ∈ Rn , r > 0 et j = 1, 2 ou ∞, posons
Bj (a; r) = {x ∈ Rn : |x − a|j < r}.
Alors Bj (a; r) est un ouvert de Rn . En effet, si x ∈ Bj (a; r), alors |x−a|j < r
et il existera un ! > 0 tel que |x − a|j < r − !. Dès lors, si y ∈ Bj [x; !], on a
|y − a|j = |(y − x) + (x − a)|j ≤ |y − x|j + |x − a|j < ! + r − ! = r,
c’est-à-dire Bj [x; !] ⊂ Bj (a; r). Donc Bj (a; r) est voisinage de chacun de ses
points.
Il est naturel d’appeler Bj (a; r) la boule ouverte de centre a et de rayon
r en norme j dans Rn . Pour n = 1 et j = 1, 2 ou ∞, Bj (a; r) = ]a − r, a + r[.
On a les relations suivantes entre Bj [a; r] et Bj (a; r).
Proposition. Si a ∈ Rn , r > 0 et j = 1, 2 ou ∞, alors
int Bj [a; r] = Bj (a; r), adh Bj (a; r) = Bj [a; r].
Démonstration. Comme Bj (a; r) ⊂ Bj [a; r] et que Bj (a; r) est un ouvert,

on a immédiatement
Bj (a; r) = int Bj (a; r) ⊂ int Bj [a; r],

et, pour démontrer la première égalité, il suffit de prouver que

int Bj [a; r] ⊂ Bj (a; r).
Si x ∈ int Bj [a; r], il existe ρ > 0 tel que Bj [x; ρ] ⊂ Bj [a; r]. Bien sûr,
|a − a|j = 0 < r. Si x /= a, x + ρ |x−a|
x−a
j
∈ Bj [a; r], et dès lors
# # & '
# x−a # ρ
# #
#x + ρ − a# = 1 + |x − a|j ≤ r,
# |x − a|j # |x − a|j
j
ce qui entraı̂ne
r
|x − a|j ≤ ρ < r.
1+ |x−a|j
La démonstration de la deuxième égalité est similaire et laissée au lecteur.
On peut caractériser l’intérieur et l’adhérence d’une partie de Rn en

termes d’ouverts et de fermés.
Proposition. Soit G une partie de Rn . Alors int G est le plus grand ouvert
contenu dans G et adh G est le plus petit fermé contenant G.
Démonstration. Il faut démontrer que int G est un ouvert et que tout
ouvert contenu dans G est contenu dans int G, et que adh G est un fermé
contenu dans tout fermé qui contient G. C’est évident si G = ∅. Sinon,
démontrons le résultat sur l’intérieur, l’autre en résultant par les relations
entre intérieur et adhérence, ouvert et fermé et les lois de De Morgan. Soit
H l’union de tous les ouverts de Rn contenus dans G; on a vu que c’était
un ouvert et, par construction, c’est le plus grand ouvert contenu dans G. Il
reste à montrer que H = int G. Comme H ⊂ G, on aura H = int H ⊂ int G
et il reste à montrer que int G ⊂ H. Si x ∈ int G, alors il existe r > 0 tel
que B2 [x; r] ⊂ G et donc tel que B2 (x; r) ⊂ G. Comme B2 (x; r) est ouvert,
on voit que x appartient à un ouvert contenu dans G, et donc x appartient
à H.
Enfin, la caractérisation des points adhérents par les suites fournit une
caractérisation semblable pour les fermés : une partie de Rn est fermée si et
seulement si elle contient les limites de toutes ses suites convergentes.
Proposition. F ⊂ Rn est fermé si et seulement si, pour toute suite (ak )k∈N
dans F qui converge vers a ∈ Rn , on a a ∈ F .
Démonstration. Condition nécessaire. Par hypothèse, F = adh F . Soit
(ak )k∈N une suite dans F qui converge vers a ∈ Rn . Alors, a ∈ adh F = F.
Condition suffisante. Soit a ∈ adh F ; alors il existe une suite (ak )k∈N dans
F qui converge vers a. Mais alors, a ∈ F , et donc adh F ⊂ F et F est fermé.
Rappelons la notion de partie bornée déjà introduite précédemment.

Définition. On dit que B ⊂ Rn est une partie bornée ou un borné de Rn
s’il existe ρ > 0 tel que B ⊂ B2 [ρ].
On peut évidemment remplacer B2 [ρ] par B1 [ρ] ou par B∞ [ρ] dans la
définition. Ainsi, pour a ∈ Rn , r > 0 et j = 1, 2 ou ∞, Bj [a; r] est une partie
bornée de Rn puisque, pour tout x ∈ Bj [a; r], on a
|x|j = |(x − a) + a|j ≤ |x − a|j + |a|j ≤ r + |a|j ,
et donc Bj [a; r] ⊂ Bj [r + |a|j ]. Il est clair aussi que toute partie d’un borné
de Rn est un borné de Rn . En particulier, Bj (a; r) est un borné de Rn .
Les propriétés des bornés par rapport à l’union et l’intersection sont
analogues à celles des fermés. Leur démonstration est très facile et laissée
au lecteur.
Proposition. Si A est un ensemble quelconque non vide et (Bα )α∈A est
7
une famille de bornés Bα de Rn , alors α∈A Bα est un borné de Rn .
Proposition. Si (Bj )1≤j≤m est une famille finie de bornés Bj de Rn , alors

!m
j=1 Bj est un borné de R .
n
Le lemme de Cousin s’étend aux ensembles fermés et bornés.

Théorème. Soit F un fermé borné non vide de Rn . Alors, pour chaque
A j j B
jauge δ sur F , il existe une famille finie (x , F ) 1≤j≤m telle que
m
>
F = Fj
j=1
et telle que, pour chaque 1 ≤ j ≤ m, on ait
xj ∈ F j ⊂ B∞ [xj ; δ(xj )].
Démonstration. Puisque F est borné, il existe ρ > 0 tel que F ⊂ B∞ [ρ].

Soit I = ] − ρ, ρ] × . . . × ] − ρ, ρ] le semi-pavé de Rn tel que I¯ = B∞ [ρ].
Définissons comme suit la jauge δ̃ sur Rn . Si x ∈ F, posons δ̃(x) = δ(x). Si
x ∈ !F, il existe, puisque !F est ouvert, un r(x) > 0 tel que B∞ [x; r(x)] ⊂
!F ; posons alors δ̃(x) = r(x). Comme la restriction de δ̃ à I¯ est une jauge
sur ¯
8 I, le9 lemme de Cousin implique l’existence d’une P-partition δ̃-fine
(y , J k )
k de I. Si k est tel que y k ∈ !F, on a donc δ̃(y k ) = r(y k ),
1≤k≤q
et
J k ⊂ B∞ [y k ; δ̃(y k )] = B∞ [y k ; r(y k )] ⊂ !F.
Dès lors, & '
q
> q
>
F = F ∩ I¯ = F ∩ Jk = (F ∩ J k )
k=1 k=1
>
= (F ∩ J k ).
{1≤k≤q : yk ∈F }
Si 1 ≤ k1 < k2 < . . . < km ≤ q sont les valeurs de k telles que y k ∈ F , et si

l’on pose 8 9 8 9
(xj , F j ) = (y kj , F ∩ J kj ) ,
1≤j≤m 1≤j≤m
(c’est-à-dire si l’on renumérote les (y k , F ∩ J k ) correspondant aux k tels que

y k ∈ F ), on voit que
m
> m
> >
Fj = (F ∩ J kj ) = (F ∩ J k ) = F,
j=1 j=1 {1≤k≤q : yk ∈F }
et, pour chaque 1 ≤ j ≤ m, on a
xj = y kj ∈ F ∩ J kj = F j ⊂ J kj ⊂ B∞ [y kj ; δ̃(y kj )] = B∞ [xj ; δ(xj )].
Remarque. La démonstration du lemme de Cousin fournit en fait des F j

fermés (1 ≤ j ≤ n).
Définition. Soit E une partie de Rn et δ une jauge sur E. Une division
A j j B !
δ-fine de E est une famille finie (x , E ) 1≤j≤m telle que E = m j
j=1 E et
telle que, pour chaque 1 ≤ j ≤ m, on ait
xj ∈ E j ⊂ B∞ [xj ; δ(xj )].
Le lemme de Cousin affirme donc que, si F ⊂ Rn est un fermé borné,

alors, pour toute jauge δ sur F , il existe une division δ-fine de F . Montrons
que cette propriété, parfois appelée propriété de Cousin, caractérise les
fermés bornés.
Proposition. Une partie E de Rn est fermée et bornée si et seulement si,

pour toute jauge δ sur E, il existe une division δ-fine de E.
Démonstration. La condition nécessaire résulte du lemme de Cousin pour
les fermés bornés que nous venons de démontrer. Supposons maintenant que
E ait la propriété de Cousin. Montrons tout d’abord que E est borné. En
prenant
A j j B
sur E la jauge constante de valeur 1, on obtient une division 1-fine
(x , E ) 1≤j≤m . Comme chaque E j , contenu dans le borné B∞ [xj ; 1] est
borné, E, union finie de bornés, est borné. Montrons maintenant que E
est fermé ou, ce qui est équivalent, que !E est ouvert, c’est-à-dire voisinage
de chacun de ses points. Soit a ∈ !E; définissons la jauge δ sur E par
δ(x) = 12 |x − a|∞ pour chaque x ∈ E. Par construction, pour chaque x ∈ E,
a ∈ !B [x; δ(x)]. Par la propriété de Cousin, il existe une division δ-fine
A j j∞B
(x , E ) 1≤j≤m et
m
> m
>
E= Ej ⊂ B∞ [xj ; δ(xj )] = F.
j=1 j=1
Par construction, F ⊃ E est fermé et a /∈ F , c’est-à-dire !F ⊂ !E est un

ouvert contenant a.
4.5 Continuité uniforme

Si une fonction est continue en un point a, ses valeurs seront arbitrairement
proches de f (a) si l’on se restreint à des points suffisamment proches de a.
On peut en déduire la propriété locale un peu plus forte suivante.
Lemme. Soit f une fonction de Rn dans Rp continue en a ∈ dom f . Alors,
pour chaque ! > 0, il existe un δ = δ(a; !) > 0 tel que, pour tout x ∈
dom f ∩ B∞ [a; δ] et tout y ∈ dom f tel que |y − x|∞ ≤ δ, on a
|f (x) − f (y)|∞ ≤ !.
Démonstration. Soit ! > 0; puisque f est continue en a, il existe δ̃ =
δ̃(a; !) > 0 tel que, pour tout x ∈ dom f vérifiant |x − a|∞ ≤ δ̃, on ait
!
|f (x) − f (a)|∞ ≤ .
2
Posons δ = 2δ̃ , et soient x ∈ dom f ∩B∞ [a; δ] et y ∈ dom f tel que |y −x|∞ ≤
δ. Alors,
|y − a|∞ = |(y − x) + (x − a)|∞ ≤ |y − x|∞ + |x − a|∞ ≤ δ + δ = δ̃,
4.5. CONTINUITÉ UNIFORME 133
et dès lors,
! !
|f (y) − f (x)|∞ ≤ |f (y) − f (a)|∞ + |f (a) − f (x)|∞ ≤ + = !.
2 2
Remarque. La conclusion du lemme n’implique pas que f soit continue

en x ∈ (dom f ∩ B∞ [a; δ]) \ {a} ! En effet, l’ensemble dom f ∩ B∞ [a; δ]
des x autorisés pour que l’inégalité soit satisfaite dépend de δ, et donc d’!.
Rappelons à cet effet l’exemple donné précédemment d’une fonction de R
dans R qui n’est continue qu’en 0.
Lorsque f est continue sur un fermé borné de Rn , on peut utiliser le
lemme de Cousin pour obtenir une version globale du lemme : c’est le
théorème de Heine.
Théorème. Soit f une fonction de Rn dans Rp continue sur le fermé borné
E de Rn . Alors, pour chaque ! > 0, il existe un δE > 0 tel que, pour tout
x ∈ E et tout y ∈ dom f tel que |y − x|∞ ≤ δE , on a |f (y) − f (x)|∞ ≤ !.
Démonstration. Si ! > 0 est fixé, alors, par l’hypothèse de continuité de
f sur E et le lemme ci-dessus, on sait que,
(∀a ∈ E)(∃δ = δ(a) > 0)(∀x ∈ dom f ∩ B∞ [a; δ])(∀y ∈ dom f ∩ B∞ [x; δ]) :
|f (y) − f (x)|∞ ≤ !. (4.2)
Soit δ : a 2→ δ(a) la jauge

A
ainsi définie
B
sur E. Par le lemme de Cousin, il
existe une division δ-fine (aj , E j ) 1≤j≤m de E. Posons
δE = min{δ(aj ) : 1 ≤ j ≤ m},
et soit x ∈ E et y ∈ dom f tel que |y − x|∞ ≤ δE . Il existe donc un entier

1 ≤ l ≤ m tel que x ∈ E l , et donc tel que |x − al |∞ ≤ δ(al ); comme en outre
|y − x|∞ ≤ δE ≤ δ(al ), (4.2) implique que |f (y) − f (x)|∞ ≤ !.
Rappelons que la continuité de f en chaque point x de E équivaut à la
propriété suivante :
(∀x ∈ E)(∀! > 0)(∃δ > 0)(∀y ∈ dom f : |y − x|∞ ≤ δ) : (4.3)
|f (y) − f (x)|∞ ≤ !,
montrant clairement que le δ peut dépendre à la fois d’! et de x. La propriété

que nous venons démontrer dans le théorème de Heine est la suivante :
(∀! > 0)(∃δ > 0)(∀x ∈ E)(∀y ∈ dom f : |y − x|∞ ≤ δ) : (4.4)
|f (y) − f (x)|∞ ≤ !.
Dans (4.4), on a la propriété plus forte que δ ne dépend que d’! et convient
pour chaque x ∈ E. On est ainsi conduit à la définition suivante.
Définition. Soit f une fonction de Rn dans Rp et E ⊂ Rn . On dit que f
est uniformément continue sur E si f est définie sur E et vérifie la propriété
(4.4).
Bien entendu, toute fonction uniformément continue sur un ensemble E
est continue sur E, et le théorème de Heine montre que la réciproque est
vraie lorsque E est fermé et borné. Une fonction continue sur un ensemble
E peut ne pas y être uniformément continue si E n’est pas fermé ou n’est
pas borné. C’est ce que montrent les exemples suivants. On notera que,
dans (4.4), on peut toujours demander que le δ cherché soit inférieur à une
quantité fixe donnée.
Exemples. 1. La fonction f de R dans R définie par f (x) = x1 est continue
sur le borné (non fermé) ]0, 1] mais n’y est pas uniformément continue. En
effet, pour chaque δ ∈ ]0, 1], si l’on prend x = δ et y = 2δ, on a |y − x| = δ,
# #
#1 1 ## 1 1 1
|f (x) − f (y)| = # − # =
# ≥ > ,
δ 2δ 2δ 2 4
et la négation de (4.4) est satisfaite.

2. La fonction f de R dans R définie par f (x) = x2 est continue sur le fermé
(non borné) [0, +∞[ mais n’y est pas uniformément continue. En effet, pour
chaque δ > 0, si l’on prend x = 1δ et y = 1δ + δ, on a |y − x| = δ,
|f (x) − f (y)| = 2 + δ 2 > 2,
et la négation de (4.4) est satisfaite.

Remarque. Le lecteur se convaincra sans peine de l’équivalence de la con-
dition (4.3) de continuité de f sur E ⊂ dom f avec la propriété :
(∀! > 0)(∃δ, jauge sur E)(∀x ∈ E)(∀y ∈ dom f : |y − x|∞ ≤ δ(x)) :
|f (y) − f (x)|∞ ≤ !,
4.6. IMAGES PAR UNE FONCTION CONTINUE 135
et de l’équivalence de la condition (4.4) de continuité uniforme de f sur

E ⊂ dom f avec la propriété :
(∀! > 0)(∃δ, jauge constante sur E)(∀x ∈ E)(∀y ∈ dom f : |y − x|∞ ≤ δ) :
|f (y) − f (x)|∞ ≤ !.
4.6 Images par une fonction continue

Nous allons étudier, dans cette section la préservation des propriétés des
ensembles lorsqu’on prend leur image directe ou réciproque par une fonction
continue. Les propriétés que nous aurons en vue sont celles rencontrées dans
ce chapitre, c’est-à-dire la connexité par arcs, le caractère ouvert, le caractère
fermé et le caractère borné.
Notons tout d’abord que la fonction f identiquement nulle sur l’ensemble
R \ {0} y est évidemment continue et que l’image réciproque f −1 ({0}) de
l’ensemble connexe par arcs {0} est égale à R \ {0} qui n’est pas connexe
par arcs puisque, si x < 0 < y sont deux points de R \ {0}, toute application
continue γ : [0, 1] → R telle que γ(0) = x et γ(1) = y s’annule, par le
théorème de Bolzano, en un τ ∈ [0, 1] au moins, et son image n’appartient
donc pas à R \ {0}. Par contre, les images directes par une fonction continue
d’ensembles connexes par arcs sont connexes par arcs.
Proposition. Soit f une fonction de Rn dans Rp continue sur une partie
connexe par arcs E de Rn . Alors f (E) est connexe par arcs.
Démonstration. Soient u ∈ f (E) et v ∈ f (E). Il existe donc x ∈ E et
y ∈ E tels que u = f (x) et v = f (y). Comme E est connexe par arcs, il
existe une application continue γ : [0, 1] → E telle que γ(0) = x et γ(1) = y.
En conséquence, f ◦ γ est une application continue de [0, 1] dans f (E) telle
que (f ◦ γ)(0) = u et (f ◦ γ)(1) = v.
Si f est une application constante de l’ouvert E de Rn , alors f (E) est
un singleton et n’est donc pas un ouvert. Par contre, les images réciproques
d’ouverts par des fonctions continues sont des ouverts, et cette propriété
caractérise d’ailleurs les fonctions continues.
Proposition. Soit f une fonction de Rn dans Rp et E une partie de dom f .
Alors f est continue sur E si et seulement si, pour tout ouvert B de Rp, il
existe un ouvert A de Rn tel que
f −1 (B) ∩ E = A ∩ E.
Démonstration. Condition nécessaire. Soit B un ouvert de Rp ; si

f −1 (B) ∩ E = ∅,
il suffit de prendre A = ∅. Sinon, soit a ∈ f −1 (B) ∩ E. B est donc un
voisinage de f (a) et, f étant continue en a, il existera un voisinage Ua de
a, que l’on peut toujours prendre ouvert (puisque, par exemple, il contient
toujours une boule ouverte centrée en a) tel que f (Ua ∩ E) ⊂ B, c’est-à-dire
tel que
Ua ∩ E ⊂ f −1 (B) ∩ E.
Si nous posons >
A= Ua ,
a∈f −1(B)∩E
alors A est un ouvert de Rn tel que
f −1 (B) ∩ E ⊂ A ∩ E ⊂ f −1 (B) ∩ E.
Condition suffisante. Soit a ∈ E et montrons que f est continue en a. Si V

est un voisinage de f (a), il existe un ouvert B de Rp tel que f (a) ∈ B ⊂ V
(par exemple un boule ouverte centrée en f (a) de rayon suffisamment petit).
Par hypothèse, on peut donc trouver un ouvert A de Rn tel que f −1 (B)∩E =
A ∩ E. Comme a ∈ f −1 (B) ∩ E, a ∈ A et A est un voisinage de a tel que
f (A ∩ E) = f (f −1 (B) ∩ E) ⊂ B ⊂ V.
Donc f est continue en a.
L’image directe d’un fermé E de Rn par une fonction continue sur E
n’est pas nécessairement fermée, ainsi que le montre la fonction f de R dans
R définie par f (x) = 1+|x|
x
, qui est continue sur R et telle que le fermé R a
pour image ] − 1, 1[ qui n’est pas fermé. Comme pour les ouverts, les fermés
de conservent par image réciproque, et cette propriété caractérise également
les fonctions continues.
Proposition. Soit f une fonction de Rn dans Rp et E ⊂ dom f . Alors f
est continue sur E si et seulement si, pour tout fermé B de Rp , il existe un
fermé A de Rn tel que
f −1 (B) ∩ E = A ∩ E.
Démonstration. Elle se fonde sur le résultat correspondant pour les ou-
verts, le fait que le complémentaire d’un fermé est un ouvert et les propriétés
élémentaires des fonctions et des graphes. Ses détails sont laissés au lecteur.
4.7. THÉORÈME DES BORNES ATTEINTES ET EXTRÉMANTS 137
En particulier, on a la propriété suivante de l’ensemble des zéros d’une

fonction continue.
Corollaire. Soit f une fonction de Rn dans Rp continue sur E ⊂ Rn . Il
existe un fermé A de Rn tel que
f −1 ({0}) ∩ E = A ∩ E.
L’image directe d’un borné par une fonction continue n’est pas nécessaire-
ment bornée, ainsi que le montre l’exemple de la fonction f de R dans R
définie par f (x) = x1 . Elle est continue sur le borné ]0, 1] et f (]0, 1]) =]0, +∞[
n’est pas borné. L’image réciproque d’un borné par une fonction continue
n’est pas non plus nécessairement bornée comme le montre l’exemple de
l’application nulle sur R : l’image réciproque de tout borné contenant {0}
est R tout entier. Nous avons vu toutefois qu’une fonction f continue en
un point a est localement bornée en ce point, ce qui signifie qu’il existe une
boule B∞ [a; δ] centrée en a et de rayon δ = δ(a) telle que f (B∞ [a; δ]) soit
bornée. La caractérisation des fermés bornés par la propriété de Cousin va
nous permettre de globaliser ce résultat local.
Proposition. Si E ⊂ Rn est fermé et borné et si f est une fonction de Rn
dans Rp continue sur E, alors f (E) est fermé et borné.
Démonstration. On va montrer que f (E) possède la propriété de Cousin.
Soit ! une jauge sur f (E). Comme, pour chaque x ∈ E, f est continue en x,
si l’on prend !(f (x)) dans la définition correspondante, il existera δ(x) > 0
tel que
f (E ∩ B∞ [x; δ(x)]) ⊂ B∞ [f (x); !(f (x))].
On définit ainsi sur E une jauge δA : x 2→ δ(x),
B
et le lemme de Cousin entraı̂ne
l’existence d’une division δ-fine (xj , E j ) 1≤j≤m de E. En conséquence, si,
pour chaque 1 ≤ j ≤ m, on pose y j = f (xj ), on a
f (E j ) ⊂ f (B∞ [xj ; δ(xj )] ∩ E) ⊂ B∞ [y j ; !(y j )],
! !
y j ∈ f (E j ), et f (E) = f ( m
j=1 E ) =
j
j=1 f (E ). AEn posant,
m j
B
pour chaque
1 ≤ j ≤ m, F = f (E ), on obtient une division (y j , F j ) 1≤j≤m !-fine de
j j
f (E).
4.7 Théorème des bornes atteintes et extrémants

La proposition que nous venons de démontrer peut être précisée dans le cas
d’une fonction à valeurs réelles : c’est le théorème des bornes atteintes
ou théorème de Weierstrass et l’on peut en donner une démonstration

directe indépendante des résultats de la section précédente.
Théorème. Soit E un fermé borné de Rn et f une fonction de Rn dans R
continue sur E. Alors, il existe u ∈ E et v ∈ E tels que, pour tout x ∈ E,
on ait
f (u) ≤ f (x) ≤ f (v). (4.5)
Démonstration. Notons tout d’abord qu’il suffit de démontrer l’existence

d’un v ∈ E pour lequel l’inégalité de droite dans (4.5) est vérifiée car celle
de u se déduit alors de ce résultat appliqué à −f . Supposons qu’un tel v
n’existe pas; alors,
(∀v ∈ E)(∃xv ∈ E) : f (xv ) > f (v).
Choissons ! = 12 (f (xv ) − f (v)) dans la définition de la continuité de f en v;

on obtient ainsi un δ = δ(v) > 0 tel que
1
(∀y ∈ dom f ∩ B∞ [v; δ(v)]) : f (y) − f (v) ≤ (f (xv ) − f (v)),
2
et dès lors
1
(∀y ∈ dom f ∩ B∞ [v; δ(v)]) : f (y) ≤ (f (xv ) + f (v)) < f (xv ). (4.6)
2
En appliquant le lemme de Cousin à AE pour Bla jauge δ : v 2→ δ(v) ainsi
obtenue, on obtient une division δ-fine (v j , E j ) 1≤j≤m de E. Soit 1 ≤ l ≤ m
tel que
f (xvl ) = max{f (xvj ) : 1 ≤ j ≤ m}.
Si y ∈ E, il existe un 1 ≤ i ≤ m tel que y ∈ E i ⊂ E ∩ B∞ [v i ; δ(v i)], et donc
tel que
f (y) < f (xvi ) ≤ f (xvl ).
En prenant y = xvl dans cette inégalité, on obtient une contradiction.
Remarque. Le théorème de Weierstrass est faux si E n’est pas fermé ou
n’est pas borné. Ainsi, l’identité sur R est continue sur ]0, 1[ mais il n’existe
ni u ∈ ]0, 1[ ni v ∈ ]0, 1[ tels que, pour tout x ∈ ]0, 1[, on ait u ≤ x ≤ v (le
montrer par l’absurde). De même il n’existe ni u ∈ R ni v ∈ R tels que, pour
tout x ∈ R, on ait u ≤ x ≤ v.
Donnons quelques conséquences utiles du théorème de Weierstrass.
Corollaire. Soit E un fermé borné de Rn et f une fonction de Rn dans R

continue sur E et strictement positive en chaque point de E. Alors il existe
r > 0 tel que, pour tout x ∈ E, on a f (x) ≥ r.
Démonstration. Par le théorème de Weierstrass, il existe u ∈ E tel que,
pour tout x ∈ R, on ait
f (x) ≥ f (u) (> 0).
Il suffit donc de prendre r = f (u).
Remarque. Le premier exemple de la remarque précédente montre que le
Corollaire est faux si E n’est pas fermé. D’ailleurs, le Corollaire est faux si E
n’est pas borné car la fonction x 2→ x1 est continue sur [1, +∞[ et il n’existe
pas de r > 0 tel que x1 ≥ r pour tout x ≥ 1 (le vérifier).
Corollaire. Soit f une fonction de R dans R continue et non constante sur
[a, b]. Alors il existe u ∈ [a, b] et v ∈ [a, b] tels que
f ([a, b]) = [f (u), f (v)].
Démonstration. Par le théorème de Weierstrass et le fait que f n’est pas

constante, il existe u ∈ [a, b] et v ∈ [a, b] tels que f (u) < f (v) et
f ([a, b]) ⊂ [f (u), f (v)].
D’autre part, si d ∈ [f (u), f (v)], le théorème des valeurs intermédiaires en-

traı̂ne l’existence d’un c ∈ [a, b] tel que f (c) = d, et dès lors [f (u), f (v)] ⊂
f ([a, b]).
Remarque. Le Corollaire que nous venons de démontrer montre que l’image
d’un intervalle fermé par une fonction continue non constante est un inter-
valle fermé. L’exemple de la fonction x 2→ 1−x
1
2 continue sur ] − 1, 1[ montre
que l’image d’un intervalle ouvert n’est pas nécessairement un intervalle ou-
vert.
Corollaire. Soit E un fermé non borné de Rn et f une fonction de Rn dans
R continue sur E et telle que
f (x) → +∞ si x → ∞.
Alors il existe un y ∈ E tel que, pour tout x ∈ E, on ait
f (y) ≤ f (x).
Démonstration. Soit a ∈ E fixé; par hypothèse, il existe ρ > 0 tel que,

pour tout x ∈ E vérifiant |x|2 > ρ, on a f (x) > f (a). En particulier, |a|2 ≤ ρ.
Comme E ∩ B2 [ρ] est un fermé borné, le théorème de Weierstrass entraı̂ne
l’existence d’un y ∈ E ∩ B2 [ρ] tel que, pour tout x ∈ E ∩ B2 [ρ], on ait
f (y) ≤ f (x).
En particulier, f (y) ≤ f (a), et dès lors, pour tout x ∈ E tel que |x|2 > ρ, on
aura
f (y) ≤ f (a) < f (x).
Ce corollaire fournit une intéressante démonstration du théorème de

d’Alembert ou théorème fondamental de l’algèbre qui généralise le
résultat que nous avons déjà obtenu pour un polynôme de la forme z n − c.
Corollaire. Tout polynôme sur C de degré supérieur ou égal à un possède
au moins un zéro.
%
Démonstration. Soit p : C → C, z 2→ m k=0 ak z un polynôme de degré
k
m ≥ 1. On a donc, pour chaque 0 ≤ k ≤ m, ak ∈ C et am /= 0. Montrons

d’abord l’existence d’un u ∈ C tel que, pour tout z ∈ C, on a
|p(z)| ≥ |p(u)|. (4.7)
Pour ce faire, on note que l’application |p| : C 2→ R est continue et que, pour
tout z /= 0, on a
# & '# & '
# m−1
$ ak # m−1
$ |ak |
# k−m #
|p(z)| = #am z m
1+ z # ≥ |am ||z| m
1− |z| k−m
.
# am # |am |
k=0 k=0
Puisque
m−1
$ |ak | k−m
|z| → 0 si z → ∞,
k=0
|am |
il existera ρ > 0 tel que
m−1
$ |ak | k−m 1
|z| ≤
k=0
|am | 2
pour tout z ∈ C tel que |z| ≥ ρ. On a donc, si |z| ≥ ρ,

|am | m
|p(z)| ≥ |z| ,
2
et dès lors
|p(z)| → +∞ si z → ∞,
L’existence d’un u ∈ C vérifiant (4.7) résulte du corollaire précédent.
La deuxième partie de la démonstration consiste à montrer que p(u) = 0.
Si p(u) /= 0, la fonction q définie par q(z) = p(u+z)
p(u) est un polynôme sur C
de degré m tel que q(0) = 1 et |q(z)| ≥ 1 pour tout z ∈ C. En conséquence,
q est de la forme
m
$
q(z) = 1 + bk z k ,
k=j
avec 1 ≤ j ≤ m, bj /= 0, bm /= 0. Soit r > 0 tel que r j |bj | < 1. Pour

b̄
tout z ∈ C tel que z j = −r j |bjj | , (et l’existence d’un tel z a été démontrée
précédemment), on a
|z| = r, 1 + bj z j = 1 − r j |bj | > 0,
et dès lors
m
$ m
$
|q(z)| ≤ |1 + bj z j | + |bk ||z|k = 1 − r j |bj | + |bk |r k
k=j+1 k=j+1
 
m−j
$
= 1 − r j |bj | − |bj+k |r k  .
k=1
On en déduit aussitôt que |q(z)| < 1 si l’on diminue éventuellement r > 0

de telle sorte que
m−j
$
|bj+k |r k < |bj |,
k=1
ce qui est contradictoire.

Le résultat du théorème de Weierstrass conduit à la terminologie suivante
pour les fonctions à valeurs réelles.
Définition. Soit f une fonction de Rn dans R et E ⊂ dom f . On dit que
a ∈ E est un maximant (resp. minimant) de f sur E, ou encore que f
possède en a un maximum (resp. minimum) sur E, si, pour tout x ∈ E, on
a
f (x) ≤ f (a) (resp. f (x) ≥ f (a)).
On écrit dans ce cas

f (a) = max f (resp. f (a) = min f ),
E E
ou
f (a) = max f (x) (resp. f (a) = min f (x)),
x∈E x∈E
ou encore
f (a) = max{f (x) : x ∈ E} (resp. f (a) = min{f (x) : x ∈ E}).
On dit également que a ∈ E est un extrémant de f sur E (ou que f possède
un extrémum sur E) si a est un minimant ou est un maximant de f sur E.
Le théorème de Weierstrass montre donc que toute fonction réelle con-
tinue sur un fermé borné E possède un maximum et un minimum sur E. Il
ne fournit malheureusement aucune information quant à la localisation du
minimant et du maximant correspondant. De telles informations peuvent
se déduire de conditions nécessaires pour qu’un point de Rn soit extrémant
sur E d’une fonction de Rn dans R. De telles conditions nécessaires peu-
vent s’obtenir plus généralement dans le cas d’extrémants locaux, ce qui nous
conduit à localiser les notions de maximant et de minimant.
Définition. Soit f une fonction de Rn dans R et E ⊂ dom f . On dit que
a ∈ E est un maximant (resp. minimant) local de f sur E s’il existe un δ > 0
tel que a soit un maximant (resp. minimant) de f sur E ∩ B2 [a; δ]. Cette
propriété s’exprime également en disant que f possède en a un maximum
(resp. minimum) local sur E. On appellera généralement extrémant local
de f sur E un point de E qui est maximant local ou minimant local de f
sur E.
Tout maximant (resp. minimant) de f sur E est évidemment un maxi-
mant (resp. minimant) local de f sur E. Par contre, l’application f : x 2→
x3
3 − x de R dans R a un maximant local sur R en −1 et un minimant local
sur R en 1, mais n’a ni maximant ni minimant sur R.
Les extrémants locaux les plus simples à étudier sont ceux qui sont
intérieurs au domaine de la fonction. Ils ont droit à une terminologie propre.
Définition. Soit f une fonction de Rn dans R. On dit que a ∈ Rn est un
maximant (resp. minimant) local libre de f si a ∈ int dom f et si a est un
maximant (resp. minimant) local de f sur Rn . Un extrémant local libre de
f est un point qui est maximant ou minimant local libre de f .
x3
Par exemple, les extrémants locaux de l’application x 2→ 3 −x considérée
plus haut sont libres.
4.8. THÉORÈMES DE FERMAT ET DE ROLLE 143
Les deux notions locales que nous venons d’introduire sont liées par la
Proposition suivante.
Proposition. Soit f une fonction de Rn dans R, E ⊂ dom f et a ∈ E. Si a
est maximant (resp. minimant) local libre de f , alors a est maximant (resp.
minimant) local de f sur E. Si a est maximant (resp. minimant) local de f
sur E et si a ∈ int E, alors a est maximant (resp. minimant) local libre de
f.
Démonstration. La première assertion est immédiate. La seconde résulte
aisément du fait que, puisque E est voisinage de a, E ∩B2 [a; δ] sera voisinage
de a quel que soit δ > 0.
Définition. Soit f une fonction de Rn dans R, E ⊂ dom f et a ∈ E. On

dira que a est maximant (resp. minimant) local lié de f sur E si a n’est
pas intérieur à E et est maximant (resp. minimant) local de f sur E. Un
extrémant local lié de f sur E sera un maximant ou un minimant local lié
de f sur E.
3
Ainsi, pour l’application f : x 2→ x3 − x de R dans R considérée plus
haut, 0 est un extrémant local lié de f sur E = [0, +∞[ et sur E = ] − ∞, 0].
4.8 Théorèmes de Fermat et de Rolle

On peut obtenir d’intéressantes conditions nécessaires d’existence d’un ex-
trémant local libre d’une fonction de Rn dans R lorsque f possède en ce
point une dérivée directionnelle. C’est ce qu’exprime le résultat suivant,
appelé théorème de Fermat pour rappeler une condition similaire trouvée,
dans le cas d’un polynôme réel, par Pierre de Fermat, en 1629, c’est-à-dire
environ cinquante ans avant l’invention du calcul différentiel, et que Johannes
Kepler avait déjà exprimée d’une manière qualitative en 1615, en observant
qu’une fonction réelle varie très peu au voisinage d’un extrémum.
Théorème. Soit f une fonction de Rn dans R et a un extrémant local libre
de f . Si f possède en a une dérivée dans la direction u, alors f $ (a; u) = 0.
Démonstration. Supposons pour fixer les idées que a soit un maximant
local libre de f (sinon, il suffit de considérer −f .) Par hypothèse, on peut
donc trouver r > 0 tel que B2 [a; r] ⊂ dom f et tel que, pour tout x ∈ B2 [a; r],
on ait
f (x) ≤ f (a).
En particulier, pour tout réel t tel que 0 < |t| ≤ r, on aura a + tu ∈ B2 [a; r],
et dès lors
f (a + tu) − f (a) ≤ 0.
En conséquence, pour 0 < t ≤ r, on aura
f (a + tu) − f (a)
≤ 0,
t
d’où, en faisant tendre t vers 0,
f (a + tu) − f (a)
f $ (a; u) = lim ≤ 0.
t→0; t>0 t
De même, pour −r ≤ t < 0, on aura
f (a + tu) − f (a)
≥ 0,
t
d’où, en faisant tendre t vers 0,
f (a + tu) − f (a)
f $ (a; u) = lim ≥ 0.
t→0; t<0 t
Par conséquent, f $ (a; u) = 0.
Remarques. 1. La condition de Fermat n’est nullement suffisante pour que
a soit extrémant local libre de f ; ainsi, pour l’application f de R définie par
f (x) = x3 , on a f $ (0) = 0, et pourtant 0 n’est ni maximant, ni minimant
local libre de f , puisque x3 < 0 si x < 0 et x3 > 0 si x > 0.
2. La condition de Fermat n’est nullement nécessaire si a est un extrémant
local lié de f ; ainsi l’application identité sur R possède en 0 un minimant
local sur E = [0, +∞[ et f $ (0) = 1.
Corollaire. Si f est une fonction de Rn dans R qui possède en a ∈ Rn
un extrémant local libre et des dérivées partielles par rapport à toutes les
variables, alors on a
D1 f (a) = D2 f (a) = . . . = Dn f (a) = 0.
En particulier, si f est dérivable en un extrémant local libre a, on a fa$ = 0.

Démonstration. C’est une conséquence immédiate du théorème de Fer-
mat et du lien entre dérivée totale et dérivées partielles.
Ce corollaire conduit à la définition suivante.
4.8. THÉORÈMES DE FERMAT ET DE ROLLE 145
Définition. Soit f une fonction de Rn dans R et a ∈ dom f tel que, pour

chaque 1 ≤ k ≤ n, Dk f (a) existe. On dit que a est un point critique ou un
point stationnaire de f si, pour chaque 1 ≤ k ≤ n, on a Dk f (a) = 0. f (a)
est alors appelée une valeur critique de f .
Le Corollaire du théorème de Fermat affirme donc que tout extrémant
local libre de f en lequel f possède des dérivées partielles par rapport à chaque
variable est un point critique de f . L’exemple ci-dessus montre qu’un point
critique n’est pas nécessairement extrémant local libre. Lorsque n = 1,
un point critique qui n’est pas extrémant local libre est appelé un point
d’inflexion. Lorsque n ≥ 2, un point critique qui n’est pas extrémant local
libre est appelé un col ou un point de selle. Un exemple est donné par 0 pour
l’application f de R2 dans R définie par f (x1 , x2 ) = x1 x2 . On a en effet
D1 f (0, 0) = 0 = D2 f (0, 0),
ce qui montre que 0 est un point critique de f , mais, pour tout r > 0,
f (r, r) = r 2 > 0 = f (0, 0) > f (r, −r) = −r 2 ,
ce qui montre que 0 ne peut être ni maximant local libre, ni minimant local
libre.
Une conséquence très utile des théorèmes de Weierstrass et de Fermat est
une condition suffisante d’existence d’un point critique, appelé théorème
généralisé de Rolle, en référence à un cas particulier pour des polynômes
réels énoncé en 1691 par Michel Rolle (qui fut pourtant un farouche ad-
versaire du calcul différentiel naissant).
Théorème. Soit f une fonction de Rn dans R et E une partie de Rn vérifiant
les conditions suivantes.
1. E est fermé, borné et d’intérieur non vide.
2. f est continue sur E.
3. Pour chaque 1 ≤ k ≤ n, Dk f (x) existe en chaque x ∈ int E.
4. f est constante sur fr E.
Alors, f possède au moins un point critique c ∈ int E.
Démonstration. Si f est constante sur E, alors pour chaque a ∈ int E,
on a fa$ = 0 et le théorème est démontré. Si f n’est pas constante sur E, le
théorème des bornes atteintes de Weierstrass entraı̂ne l’existence d’un u ∈ E
et d’un v ∈ E tels que, pour tout x ∈ E, on ait f (u) ≤ f (x) ≤ f (v), et,
comme f n’est pas constante sur E, on a nécessairement f (u) < f (v), et
donc u /= v. Comme f est constante sur fr E, u et v ne peuvent tous les
deux appartenir à fr E = adh E \ int E = E \ int E. L’un d’entre eux au

moins, appelons-le c, appartient à int E et est donc un extrémant local libre
de f . Par le théorème de Fermat, Dk f (c) = 0 pour chaque 1 ≤ k ≤ n et c
est un point critique de f .
Le cas particulier suivant lorsque n = 1 et E = [a, b] est généralement
appelé théorème de Rolle.
Corollaire. Soit f une fonction de R dans R et [a, b] un intervalle fermé
vérifiant les conditions suivantes.
1. f est continue sur [a, b].
2. f est dérivable en chaque point de ]a, b[.
3. f (a) = f (b).
Alors il existe au moins un c ∈ ]a, b[ tel que f $ (c) = 0.
Le graphe de toute fonction vérifiant les conditions du théorème de Rolle
possède donc, en un point au moins, une tangente parallèle au segment
de droite joignant l’origine et l’extrémité du graphe. Chaque hypothèse
est essentielle dans le théorème de Rolle comme le montrent les exemples
suivants sur [−1, 1] pour lesquels la dérivée ne s’annule en aucun point de
] − 1, 1[ : f (x) = x (f (−1) /= f (1)), f (x) = |x| (f n’est pas dérivable en 0)
et f (x) = x si x ∈ [−1, 1[, f (1) = 0 (f n’est pas continue en 1.)
4.9 Théorème de Cauchy et règle de l’Hospital

On peut généraliser le théorème de Rolle à un couple de fonctions réelles
d’une variable réelle. C’est le théorème de la moyenne de Cauchy.
Proposition. Soient f et g deux fonctions de R dans R continues sur [a, b]
et dérivables en chaque point de ]a, b[. Alors il existe au moins un c ∈ ]a, b[
tel que
[f (b) − f (a)]g $(c) = [g(b) − g(a)]f $(c).
Démonstration. Il est clair que la fonction h de R dans R définie par
h(x) = [f (b) − f (a)]g(x) − [g(b) − g(a)]f (x)
est continue sur [a, b], dérivable sur ]a, b[ et, pour tout x ∈ ]a, b[, on a
h$ (x) = [f (b) − f (a)]g $(x) − [g(b) − g(a)]f $(x).
En outre,
h(a) = f (b)g(a) − g(b)f (a) = h(b).
4.9. THÉORÈME DE CAUCHY ET RÈGLE DE L’HOSPITAL 147
Le théorème de Rolle appliqué à h entraı̂ne donc l’existence d’un c ∈ ]a, b[

tel que h$ (c) = 0.
L’interprétation géométrique du théorème de Cauchy est la suivante. Si
l’on considère (f, g) : [a, b] → R2 comme la représentation paramétrique
d’une courbe du plan, le théorème de Cauchy affirme, dans le cas non trivial
où (f (a), g(a)) /= (f (b), g(b)), l’existence d’un point de la courbe, différent
de (f (a), g(a)) et (f (b), g(b)) en lequel la tangente à la courbe est parallèle
au segment de droite joignant (f (a), g(a)) à (f (b), g(b)).
En renforçant les hypothèses, on peut écrire la conclusion du théorème
de Cauchy sous forme d’une égalité entre quotients.
Corollaire. Soient f et g deux fonctions de R dans R continues sur [a, b]
et dérivables en chaque point de ]a, b[. Si l’une des conditions suivantes est
satisfaite :
1. g(a) /= g(b) et |f $ (x)| + |g $ (x)| =
/ 0 pour chaque x ∈ ]a, b[.
2. g $ (x) /= 0 pour tout x ∈ ]a, b[.
Alors g(b) /= g(a) et il existe au moins un c ∈ ]a, b[ tel que g $ (c) /= 0 et
f (b) − f (a) f $ (c)
= $ .
g(b) − g(a) g (c)
Démonstration. Le résultat se déduit immédiatement du théorème de
Cauchy si l’on peut montrer que les quantités apparaissant aux dénomina-
teurs sont différentes de zéro. Dans le cas de l’hypothèse 1, si c ∈ ]a, b[ est
tel que
[f (b) − f (a)]g $(c) = [g(b) − g(a)]f $(c),
et si g $ (c) = 0, alors, comme g(b) /= g(a), on a nécessairement f $ (c) = 0,
ce qui est exclus par hypothèse. Dans le cas de l’hypothèse 2, il suffit de
montrer que g(b) /= g(a). Si g(b) = g(a), le théorème de Rolle appliqué
à g entraı̂ne l’existence d’un c$ ∈ ]a, b[ tel que g $ (c$ ) = 0, ce qui contredit
l’hypothèse.
La version “quotient” du théorème de Cauchy conduit à une règle per-
mettant, dans certains cas, de prouver l’existence et de calculer la limite d’un
quotient de deux fonctions réelles d’une variable réelle lorsque la limite du
numérateur et du dénominateur sont toutes deux nulles. C’est une première
forme de la règle de l’Hospital, l’un des plus anciens théorèmes du calcul
différentiel puisque, quoique dû à Jean Bernoulli, il figure dans le premier
traité de calcul différentiel jamais publié, l’Analyse des infiniments petits
pour l’intelligence des lignes courbes du Marquis Guillaume de l’Hospital
(1696).
Proposition. Soit I un intervalle ouvert de R, a son origine ou son extrémi-

té, f et g des fonctions réelles d’une variable réelles dérivables en chaque
point de I. Supposons satisfaites les conditions suivantes.
1. limx→a, x∈I f (x) = 0 = limx→a, x∈I g(x).
2. g $ (x) /= 0 pour chaque x ∈ I.
"
3. limx→a, x∈I fg" (x) = b.
Alors,
f
lim (x) = b.
x→a, x∈I g
Démonstration. Supposons pour fixer les idées que a soit l’extrémité

de I, l’autre cas se traitant de même. Soient respectivement F et G les
prolongements de f et g à I ∪ {a} définis par F (a) = 0 = G(a). Il résulte de
l’hypothèse 1 que F et G sont continus sur I ∪ {a} et dérivables en chaque
point de I puisqu’ils coı̈cident respectivement avec f et g sur I. Soit ! > 0;
par l’hypothèse 3, il existe δ > 0, que l’on peut toujours choisir suffisamment
petit pour que a − δ ∈ I, tel que
# $ # # $ #
# f (y) # # F (y) #
(∀y ∈ I : a − δ ≤ y < a) : # $
# − b## = # #
# G$ (y) − b# ≤ !.
g (y)
D’autre part, pour chaque x ∈ [a − δ, a[, la version quotient du théorème

de Cauchy appliqué à F et G sur l’intervalle [x, a] entraı̂ne l’existence d’un
c ∈ ]x, a[ ⊂ ]a − δ, a[ tel que
f (x) F (a) − F (x) F $ (c) f $ (c)

= = $ = $ ,
g(x) G(a) − G(x) G (c) g (c)
et dès lors tel que # # # $ #

# f (x) # # f (c) #
# − b #= # − b # ≤ !,
# g(x) # # g $(c) #
ce qui démontre la thèse.

En utilisant l’équivalence entre l’existence de la limite à gauche et de
la limite à droite de a d’une fonction de R dans R avec l’existence de la
limite de cette fonction pour x tendant vers a par valeurs différentes de a,
on obtient aussitôt la version suivante de la règle de l’Hospital.
Corollaire. Soit I un intervalle ouvert de R, a ∈ I, f et g des fonctions
réelles d’une variable réelles dérivables en chaque point de I \{a}. Supposons
satisfaites les conditions suivantes.
1. limx→a, x(=a f (x) = 0 = limx→a, x(=a g(x).
4.9. THÉORÈME DE CAUCHY ET RÈGLE DE L’HOSPITAL 149
2. g $ (x) /= 0 pour chaque x ∈ I \ {a}.

"
3. limx→a, x(=a fg" (x) = b.
Alors,
f
lim (x) = b.
x→a, x(=a g
1/3
Exemple. La fonction de R dans R définie par x 2→ (x+1)x −1 est de la
forme fg avec f (x) = (x + 1)1/3 − 1 et g(x) = x. Ces fonctions vérifient les
conditions du Corollaire ci-dessus avec f $ (x) = 3(x+1)
1
2/3 et g (x) = 1, et dès
$
lors
(x + 1)1/3 − 1 1 1
lim = lim = .
x→0, x(=0 x x→0, x(=0 3(x + 1)2/3 3
On a également une version correspondante de la règle de l’Hospital
lorsque x tend vers +∞ ou vers −∞. Sa démonstration, tout à fait semblable
à celle de la Proposition ci-dessus, est laissée comme exercice au lecteur.
Proposition. Soit I = ]a, +∞[ (resp. I = ] − ∞, b[) un intervalle ouvert
non borné de R, f et g des fonctions réelles d’une variable réelles dérivables
en chaque point de I. Supposons satisfaites les conditions suivantes.
1. limx→+∞ f (x) = 0 = limx→+∞ g(x)
(resp. limx→−∞ f (x) = 0 = limx→−∞ g(x)).
2. g $ (x) /= 0 pour chaque x ∈ I.
"
3. limx→+∞ fg" (x) = b
f"
(resp. limx→−∞ g " (x) = b).
Alors,
f
lim (x) = b
x→+∞ g
(resp. limx→−∞ fg (x) = b).
On dispose également d’une règle de l’Hospital pour couvrir certaines
situations où g tend vers l’infini et f n’est pas nécessairement localement
bornée. Nous la traitons dans le cas d’une limite lorsque x tend vers a, le
cas où x tend vers +∞ ou −∞ étant laissé au lecteur.
Proposition. Soit I un intervalle ouvert de R, a son origine ou son extrémi-
té, f et g des fonctions de R dans R dérivables en chaque point de I. Sup-
posons satisfaites les conditions suivantes.
1. limx→a, x∈I g(x) = +∞.
2. Pour tout x ∈ I, on a g $(x) /= 0.
f"
3. limx→a, x∈I g " (x) = b.
Alors, limx→a, x∈I fg (x) = b.
Démonstration. Supposons pour fixer les idées que a soit l’extrémité de
I, l’autre cas étant semblable. Si ! > 0 est donné, alors, par l’hypothèse 3,
il existe δ $ > 0 tel que a − δ $ ∈ I et tel que, pour tout y ∈ [a − δ $ , a[, on a
# $ #
#f #
# (y) − b# ≤ ! .
# g$ # 2
D’autre part, en vertu de l’hypothèse 1, il existe δ $$ > 0 tel que a − δ $$ ∈ I
et tel que, pour tout y ∈ [a − δ $$ , a[, on a g(y) > 0. Posons δ $$$ = min{δ $ , δ $$}
et soient
a − δ $$$ ≤ y < x < a.
Le théorème de Cauchy sous forme quotient appliqué à l’intervalle [y, x]
entraı̂ne l’existence d’un c ∈ ]y, x[, et donc appartenant à [a − δ $$$ , c[, tel que
f (x) − f (y) f $ (c)
= $ ,
g(x) − g(y) g (c)
ce qui donne # # # $ #
# f (x) − f (y) # # f (c) #
# − b #= # − b # ≤ !.
# g(x) − g(y) # # g $ (c) # 2
Dès lors, pour ces mêmes x,
# # #4 54 5 #
# f (x) # # f (x) − f (y) f (y) ##
# − b #= # 1 − g(y) − b −
g(y)
b +
# g(x) # # g(x) g(x) − g(y) g(x) g(x) #
4 5
|g(y)| ! |g(y)| |f (y)|
≤ 1+ + |b| +
|g(x)| 2 |g(x)| |g(x)|
4 5
! ! |g(y)| |f (y)|
= + + |b| + .
2 2 |g(x)| |g(x)|
Le point y étant maintenant fixé, il résulte de l’hypothèse 1 qu’on peut
trouver un δ ∈ ]0, δ $$$] tel que, si x ∈ [a − δ, a[, on a
24 5 3
2 !
|g(x)| ≥ + |b| |g(y)| + |f (y)| ,
! 2
et dès lors # #
#f #
# (x) − b# ≤ ! + ! = !.
#g # 2 2
4.10. THÉORÈMES DE LAGRANGE ET DE LA MOYENNE 151
Remarque. Le lecteur pourra également vérifier que, toutes autres hy-

pothèses étant égales,
f
lim (x) = +∞ (resp. − ∞)
x→a g
lorsque
f$
lim (x) = +∞ (resp. − ∞),
x→a g $
a pouvant lui-même être remplacé par +∞ ou par −∞.
4.10 Théorèmes de Lagrange et de la moyenne

Un cas particulier immédiat mais important du théorème de Cauchy est
le résultat suivant, qui porte le nom de théorème de la moyenne de
Lagrange ou de formule des accroissements finis.
Théorème. Soit f une fonction de R dans R continue sur [a, b] et dérivable
en chaque point de ]a, b[. Alors, il existe c ∈ ]a, b[ tel que
f (b) − f (a) = (b − a)f $ (c).
Démonstration. Il suffit de prendre pour g l’identité dans le théorème de

Cauchy.
Géométriquement, le théorème de Lagrange assure l’existence d’un point
c ∈ ]a, b[ tel que la tangente en (c, f (c)) au graphe de f est parallèle au
segment de droite joignant les points (a, f (a)) et (b, f (b)). Comme tout
c ∈ ]a, b[ est de la forme a + θ(b − a) pour un certain θ ∈ ]0, 1[, le théorème
de Lagrange affirme l’existence d’un θ ∈ ]0, 1[ tel que
f (b) − f (a) = (b − a)f $ (a + θ(b − a)).
On a des théorèmes de Lagrange pour les fonctions de Rn dans

R. Donnons d’abord une version faisant intervenir la dérivée directionnelle.
Théorème. Soit f une fonction de Rn dans R, a ∈ Rn , u ∈ Rn tel que
|u|2 = 1 et T > 0 tels que f soit continue sur S = {a + tu : t ∈ [0, T ]} et
dérivable dans la direction u en chaque point de S0 = {a + tu : t ∈ ]0, T [}.
Alors il existe θ ∈ ]0, 1[ tel que
f (a + T u) − f (a) = T f $ (a + θT u; u).
Démonstration. Par hypothèse, la fonction g : t 2→ f (a + tu) est une

fonction de R dans R qui vérifie les conditions du théorème de Lagrange sur
[0, T ], et, par définition de la dérivée directionnelle, on a g $ (t) = f $ (a + tu; u)
pour chaque t ∈ ]0, T [. En conséquence, il existe θ ∈ ]0, 1[ tel que
f (a + T u) − f (a) = g(T ) − g(0) = T g $ (θT ) = T f $ (a + θT u; u).
Donnons maintenant une version faisant intervenir la dérivée totale.

Théorème. Soit f une fonction de Rn dans R, a ∈ Rn , b ∈ Rn , S =
{a + t(b − a) : t ∈ [0, 1]} et S0 = {a + t(b − a) : t ∈ ]0, 1[} vérifiant les
conditions suivantes.
1. f est continue sur S.
2. Chaque point de S0 est intérieur à dom f .
3. f est dérivable en chaque point de S0 .
$
f (b) − f (a) = fa+θ(b−a) (b − a),
ou encore il existe c ∈ S0 tel que
f (b) − f (a) = fc$ (b − a).
Démonstration. Soit h l’application affine de R dans Rn définie par

h(t) = a + t(b − a). Elle est dérivable en chaque point de R. Par le théorème
de continuité et de dérivabilité des fonctions composées, la fonction f ◦ h
sera continue sur [0, 1] et dérivable en chaque point de ]0, 1[. En outre, pour
chaque t ∈ ]0, 1[, on a
(f ◦ h)$ (t) = (f ◦ h)$t (1) = (fh(t)

$
◦ h$t )(1) = fh(t)
$
(h$ (t)) = fh(t)
$
(b − a).
Le théorème de Lagrange entraı̂ne donc l’existence d’un θ ∈ ]0, 1[ tel que
f [h(1)] − f [h(0)] = (f ◦ h)$ (θ),
et dès lors tel que

f (b) − f (a) = fh(θ)
$
(b − a),
et il suffit de poser c = h(θ) = a + θ(b − a).
Corollaire. Soit f une fonction de Rn dans R, a ∈ Rn et r > 0 tel que f

soit dérivable en chaque point de B2 (a; r). Alors, pour chaque 1 ≤ k ≤ n et
chaque h ∈ R tel que 0 < |h| < r, il existe θ ∈ ]0, 1[ tel que
f (a + hek ) − f (a) = hDk f (a + θhek ).
Démonstration. Les conditions du théorème de Lagrange sont satisfaites

pour b = a + hek . Dès lors, il existe θ ∈ ]0, 1[ tel que
$ $
f (a + hek ) − f (a) = fa+θhek (he ) = hfa+θhek (e ) = hDk f (a + θhe ).
k k k
Le théorème de Lagrange est faux pour les fonctions à valeurs dans

Rp lorsque p ≥ 2. Ainsi, la fonction f de R dans R2 définie par f (x) =
(cos x, sin x) est dérivable (et donc continue) en chaque point x de R et
telle que f (2π) − f (0) = 0. D’autre part, pour tout x ∈ R, on a f $ (x) =
(− sin x, cos x), et donc |f $ (x)|2 = 1. Il ne peut donc exister de c ∈ ]0, 2π[ tel
que f (2π) − f (0) = 2πf $ (c).
Toutefois, une version affaiblie, s’exprimant en termes d’inégalité ou
lieu d’égalité, mais tout aussi utile pour les applications, subsiste pour les
fonctions à valeurs vectorielles. Donnons tout d’abord l’inégalité de la
moyenne pour les fonctions de R dans Rp.
Théorème. Soit f une fonction de R dans Rp continue sur [a, b] et dérivable
en chaque point de ]a, b[. Alors il existe c ∈ ]a, b[ tel que
|f (b) − f (a)|2 ≤ (b − a)|f $ (c)|2.
Démonstration. Le théorème est évident si f (b) − f (a) = 0. Si f (b) −

f (a) /= 0, définissons la fonction g de R dans R par
n
$
g(x) = (f (b) − f (a)|f (x)) = [fk (b) − fk (a)]fk (x)
k=1
pour chaque x ∈ dom f. On montre sans peine qu’elle est continue sur [a, b]
et dérivable en chaque point x ∈ ]a, b[, avec
g $ (x) = (f (b) − f (a)|f $ (x)).
En lui appliquant le théorème de Lagrange, on obtient l’existence d’un c ∈

]a, b[ tel que
g(b) − g(a) = (b − a)g $(c),
c’est-à-dire tel que
|f (b) − f (a)|22 = (b − a)(f (b) − f (a)|f $ (c)).
La thèse s’en déduit en utilisant l’inégalité de Cauchy
|(f (b) − f (a)|f $ (c))| ≤ |f (b) − f (a)|2 |f $ (c)|2,
et en simplifiant les deux membres de l’inégalité obtenue par |f (b) − f (a)|2.
Remarque. Le théorème précédent peut encore s’exprimer en disant qu’il

existe θ ∈ ]0, 1[ tel que
|f (b) − f (a)|2 ≤ (b − a)|f $ (a + θ(b − a))|2 .
Une conséquence utile de cette inégalité de la moyenne pour les fonctions

vectorielles est une caractérisation des fonctions constantes en termes
de dérivabilité.
Corollaire. Soit I ⊂ R un intervalle borné ou non et f une fonction de R
dans Rp dérivable en chaque point de I. Alors f est constante sur I si et
seulement si, pour chaque x ∈ I, on a f $ (x) = 0.
Démonstration. La condition nécessaire a déjà été obtenue dans le chapi-
tre sur la dérivabilité. Pour la condition suffisante, si a < b sont deux
points de I, alors f est dérivable sur [a, b] et le théorème de la moyenne et
l’hypothèse sur f $ (x) entraı̂nent l’existence d’un c ∈ ]a, b[ (et donc contenu
dans I) tel que
0 ≤ |f (b) − f (a)|2 ≤ (b − a)|f $ (c)|2 = 0,
et dès lors tel que f (b) = f (a). Comme a et b sont arbitraires dans I, f est
constante sur I.
Nous pouvons maintenant énoncer et démontrer des inégalités de la
moyenne pour les fonctions de Rn dans Rp. La première s’exprime en
termes de dérivée directionnelle.
Théorème. Soit f une fonction de Rn dans Rp , a ∈ Rn , u ∈ Rn tel que
|u|2 = 1 et T > 0 tels que f soit continue sur S = {a + tu : t ∈ [0, T ]} et
dérivable dans la direction u en chaque point de S0 = {a + tu : t ∈ ]0, T [}.
|f (a + T u) − f (a)|2 ≤ T |f $ [a + θT u; u]|2 .
Démonstration. Par hypothèse, la fonction g : t 2→ f (a + tu) est une

fonction de R dans Rp qui vérifie les conditions du théorème de la moyenne
sur [0, T ], et, par définition de la dérivée directionnelle, on a g $ (t) = f $ (a +
tu; u) pour chaque t ∈ ]0, T [. En conséquence, il existe θ ∈ ]0, 1[ tel que
|f (a + T u) − f (a)|2 = |g(T ) − g(0)|2 ≤ T |g $ (θT )|2 = T |f $ (a + θT u; u)|2 .
On a aussi la version suivante en termes de dérivée totale.

Théorème. Soit f une fonction de Rn dans Rp , a ∈ Rn , b ∈ Rn , S =
{a + t(b − a) : t ∈ [0, 1]} et S0 = {a + t(b − a) : t ∈ ]0, 1[} vérifiant les
1. f est continue sur S.
2. Chaque point de S0 est intérieur à dom f .
3. f est dérivable en chaque point de S0 .
$
|f (b) − f (a)|2 ≤ |fa+θ(b−a) (b − a)|2 ,
ou encore il existe c ∈ S0 tel que
|f (b) − f (a)|2 ≤ |fc$ (b − a)|2 .
Démonstration. Soit h l’application affine de R dans Rn définie par

h(t) = a + t(b − a). Elle est dérivable en chaque point de R. Par le théorème
de continuité et de dérivabilité des fonctions composées, la fonction f ◦ h
sera continue sur [0, 1] et dérivable en chaque point de ]0, 1[. En outre, pour
chaque t ∈ ]0, 1[, on a
(f ◦ h)$ (t) = (f ◦ h)$t (1) = (fh(t)

$
◦ h$t )(1) = fh(t)
$
(h$ (t)) = fh(t)
$
(b − a).
Le théorème de la moyenne pour une fonction de R dans Rp entraı̂ne donc

l’existence d’un θ ∈ ]0, 1[ tel que
|f [h(1)] − f [h(0)]|2 ≤ |(f ◦ h)$ (θ)|2 ,

$
|f (b) − f (a)|2 ≤ |fh(θ) (b − a)|2 ,
et il suffit de poser c = h(θ) = a + θ(b − a).
Corollaire. Soit f une fonction de Rn dans Rp, a ∈ Rn et r > 0 tel que f

soit dérivable en chaque point de B2 (a; r). Alors, pour chaque 1 ≤ k ≤ n et
chaque h ∈ R tel que 0 < |h| < r, il existe θ ∈ ]0, 1[ tel que
|f (a + hek ) − f (a)|2 ≤ |h||Dk f (a + θhek )|2 .
Démonstration. Les conditions du théorème de la moyenne pour une

fonction de Rn dans Rp sont satisfaites pour b = a + hek . Dès lors, il existe
θ ∈ ]0, 1[ tel que
$
|f (a + hek ) − f (a)|2 ≤ |fa+θhek (he )|2
k
$
= |h||fa+θhek (e )|2 = |h||Dk f (a + θhe )|2 .
k k
4.11 Condition suffisante de dérivabilité

On a vu que l’existence des dérivées partielles en un point n’entraı̂nait pas
la dérivabilité (totale) en ce point. Les résultats globaux que nous venons
d’obtenir permettent de démontrer une intéressante condition suffisante (lo-
cale) de dérivabilité en un point en termes de propriétés des dérivées par-
tielles. Elle repose sur la conséquence suivante du théorème de la moyenne.
Lemme. Soit f une fonction de Rn dans Rp , a ∈ Rn , h ∈ R et 1 ≤ k ≤ n
tels que f soit continue en chaque point de S = {a + thek : t ∈ [0, 1]} et
Dk f (x) existe pour chaque x ∈ S0 = {a + thek : t ∈ ]0, 1[}. Alors il existe
θ ∈ ]0, 1[ tel que
|f (a + hek ) − f (a) − hDk f (a)|2 ≤ |h||Dk f (a + θhek ) − Dk f (a)|2.
Démonstration. Soit g la fonction de R dans Rp définie par g(t) = f (a +

thek ) − f (a) − thDk f (a). Par hypothèse g est dérivable en chaque point de
]0, 1[ et
g(τ ) − g(t) f (a + τ hek ) − f (a + thek ) − (τ − t)hDk f (a)

g $ (t) = lim = lim
τ →t τ −t τ →t τ −t
D E
= h Dk f (a + thek ) − Dk f (a) .
4.11. CONDITION SUFFISANTE DE DÉRIVABILITÉ 157
Le théorème de la moyenne pour une fonction de R dans Rp appliqué à g sur

[0, 1] entraı̂ne l’existence d’un θ ∈ ]0, 1[ tel que
|f (a + hek ) − f (a) − hDk f (a)|2 = |g(1) − g(0)|2 ≤ |g $(θ)|2
= |h||Dk f (a + θhek ) − Dk f (a)|2 .
Proposition. Soit f une fonction de Rn dans Rp, a ∈ dom f. Supposons

qu’il existe un entier 1 ≤ k ≤ n tel que Dk f (a) existe et un r > 0 tel que,
pour chaque entier j /= k compris entre 1 et n, Dj f (x) existe pour chaque
x ∈ B2 [a; r]. Si les fonctions de Rn dans Rp Dj f : x 2→ Dj f (x), (1 ≤ j /=
k ≤ n) sont continues en a, alors f est dérivable en a.
Démonstration. En modifiant éventuellement le nom des variables, on
peut, sans perte de généralité, supposer que k = n. Si h ∈ B2 [r], on a
n
$
f (a + h) − f (a) − hj Dj f (a)
j=1
, & n
' -
$
= f (a + h) − f a+ hk e k
− h1 D1 f (a)
k=2
, & n
' & n
' -
$ $
+ f a+ k
hk e −f a+ hk e k
− h2 D2 f (a)
k=2 k=3
+...
     
n
$ n
$
+ f  a + hk ek  − f a + hk ek  − hj Dj f (a)
k=j k=j+1
+...
   
n
$
+ f a + hk ek  − f (a + hn en ) − hn−1 Dn−1 f (a)
k=n−1
+[f (a + hn en ) − f (a) − hn Dn f (a)]

     
n−1
$ n
$ n
$
= f a + hk ek  − f a + hk ek  − hj Dj f (a)
j=1 k=j k=j+1
+[f (a + hn e ) − f (a) − hn Dn f (a)].

n
Dès lors, en appliquant le Lemme aux n − 1 premiers termes de la somme,

on obtient θj ∈ ]0, 1[, (1 ≤ j ≤ n − 1) tels que
#     #
# n n #
# $ $ #
#f a + h ek
− f  a + h ek
− h D f (a) #
# k k j j #
# k=j k=j+1 #
2
#   #
# n #
# $ #
≤ |hj | ##Dj f a + θj hj ej + hk ek  − Dj f (a)## .
# k=j+1 #
2
Si maintenant ! > 0 est donné, alors, pour chaque 1 ≤ j ≤ n−1, la continuité
de Dj f en a entraı̂ne l’existence d’un δj ∈ ]0, r] tel que, si |x − a|2 ≤ δj , on a
!
|Dj f (x) − Dj f (a)|2 ≤ ,
n
et l’existence de Dn f (a) entraı̂ne l’existence d’un δn ∈]0, r] tel que, si |t| ≤ δn ,
on a
!
|f (a + ten ) − f (a) − tDn f (a)|2 ≤ |t|.
n
En rassemblant tous ces résultats, on voit que si |h|2 ≤ δ = min{δj : 1 ≤ j ≤
n}, on a # #
# $n #
# #
#f (a + h) − f (a) − hj Dj f (a)## ≤
#
# j=1 #
2
#     #
n−1 # n n #
$ # $ $ #
#f a + hk e − f a +
k   hk e − hj Dj f (a)##
k 
#
j=1 # k=j k=j+1 #
2
!
+|f (a + hn e ) − f (a) − hn Dn f (a)|2 ≤ n |h|∞ ≤ !|h|2 ,
n
n
ce qui montre que f est dérivable en a.
Corollaire. Soit f une fonction de Rn dans Rp , a ∈ dom f. Supposons

qu’il existe un r > 0 tel que, pour chaque entier j compris entre 1 et n,
Dj f (x) existe pour chaque x ∈ B2 [a; r]. Si les fonctions de Rn dans Rp
Dj f : x 2→ Dj f (x), (1 ≤ j ≤ n) sont continues en a, alors f est dérivable en
a.
Remarque. La Proposition que nous venons de démontrer est une condition
suffisante mais nullement nécessaire de dérivabilité. Ainsi, la fonction f de
R2 dans R définie par f (0) = 0 et
4 5
1
f (x) = |x|22 sin
|x|22
4.12. EXERCICES 159
si x /= 0 est dérivable en 0 avec f0$ = 0 puisque, pour h /= 0, f (h) = |h|2 r(h)

avec 4 5
1
r(h) = |h|2 sin →0
|h|22
lorsque h → 0 comme produit d’une fonction tendant vers zéro par une
fonction localement bornée en 0. D’autre part, un calcul facile laissé au
lecteur montre que D1 f (0) = D2 f (0) = 0, et que, pour x /= 0,
4 5 4 5
1 2x1 1
D1 f (x) = 2x1 sin − 2 cos ,
|x|22 |x|2 |x|22
4 5 4 5
1 2x2 1
D2 f (x) = 2x2 sin − cos .
|x|22 |x|22 |x|22
Comme limx→0 Dj f (x) n’existe pas (j = 1, 2) (le vérifier), on voit que les
fonctions Dj f ne sont pas continues en 0.
4.12 Exercices
1. Soit ]a, b] un intervalle semi-ouvert et c ∈ [a,Ab]. Construire
B
une jauge δ
sur [a, b] telle que, pour toute P-partition δ-fine (xj , I j ) 1≤j≤m de ]a, b], on
ait nécessairement xj = c pour l’un des 1 ≤ j ≤ m.
2. Montrer que la fonction f de R dans R définie par
1
f (0) = 0, f (x) = sin si x /= 0,
x
est continue au sens de Darboux sur [0, 1] mais n’est pas continue sur [0, 1].
3. Soit g : [a, b] → R une application continue telle que g(a) ∈ [a, b] et
g(b) ∈ [a, b]. Montrer que le théorème de Bolzano appliqué à I − g entraı̂ne
l’existence d’au moins un c ∈ [a, b] tel que c = g(c). (Théorème du point fixe
de Rothe en dimension un). Le cas particulier où g([a, b]) ⊂ [a, b] s’appelle
le théorème du point fixe de Brouwer .
4. Soit f une application de R dans R continue sur R et telle que
f (x) → −∞ si x → −∞ et f (x) → +∞ si x → +∞.
Utiliser le théorème des valeurs intermédiaires pour montrer que f est sur-
jective. Il en est évidemment de même si
f (x) → +∞ si x → −∞ et f (x) → −∞ si x → +∞.

5. Montrer que E ⊂ Rn est un ouvert si et seulement si E est une union de

boules ouvertes.
6. Si E ⊂ R est une union finie d’intervalles fermés mutuellement dis-
joints, appelons C(E) l’union finie d’intervalles fermés mutuellement dis-
joints obtenue en retirant de chaque intervalle (disons [a, b]) constituant E
l’intervalle ouvert “central” ]a + b−a
3 , b − 3 [ de la division de [a, b] en trois
b−a
intervalles de longueurs égales. Si E0 = [0, 1], posons
E1 = C(E0 ), E2 = C(E1 ), . . . , Ek = C(Ek−1 ), . . ., .

7
Montrer que l’ensemble C = k∈N Ek est un fermé borné non vide. On
l’appelle l’ensemble de Cantor. Montrer (c’est plus difficile) que C est
d’intérieur vide et n’a aucun point isolé.
7. Montrer que si 6 · 6 : x 2→ 6x6 est une norme sur Rn , il existe des réels
0 < a ≤ b tels que, pour tout x ∈ Rn , on a
a|x|2 ≤ 6x6 ≤ b|x|2 .
En d’autres termes, toutes les normes sont équivalentes sur Rn . (Il suffit de
noter que, pour x /= 0, ces inégalités se réduisent à
F F
F x F
a≤F
F |x|
F ≤ b,
F
2
et d’appliquer le théorème de Weierstrass à la fonction x 2→ 6x6 sur le fermé

borné {x ∈ Rn : |x|2 = 1}).
8. Soit f une fonction de Rn dans R et a ∈ dom f. On dit que f est semi-
continue inférieurement (resp. semi-continue supérieurement) en a si
(∀! > 0)(∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ) :
f (a) − ! ≤ f (x) (resp. f (x) ≤ f (a) + !).

f est évidemment continue en a si elle est semi-continue inférieurement et
supérieurement en a. Montrer que la conclusion
f (y) ≤ f (x) (resp. f (x) ≤ f (z)),
du théorème de Weierstrass subsiste si f est semi-continue inférieurement

(resp. semi-continue supérieurement) sur le fermé borné E ⊂ Rn .
9. Soit f une application de Rn dans R+ dérivable en chaque point de Rn .
Montrer que, pour tout ! > 0, il existe au moins un point c! ∈ Rn tel que
4.12. EXERCICES 161
|∇f (c!)|2 ≤ !. Suggestion : dans le cas non trivial où il existe a ∈ Rn tel que
f (a) > 0, appliquer un Corollaire du théorème de Weierstrass à la fonction
g : x 2→ f (x) + δ2 |x − a|22 , où δ > 0 est à déterminer. Cette fonction atteint
un minimum en un point yδ pour lequel
∇f (yδ ) + δ(yδ − a) = 0.
Dès lors,
δ
f (yδ ) + |yδ − a|22 ≤ f (a),
2
ce qui entraı̂ne
4 51/2
2f (a)
|yδ − a|2 ≤ ,
δ
et dès lors
|∇f (yδ )|2 ≤ (2f (a)δ)1/2 ≤ !,
!2
si l’on prend δ = 2f (a) . Il suffit alors de prendre c! = y !2 . La fonction
2f (a)
exponentielle fournit un exemple vérifiant ce résultat sans que sa dérivée ne
s’annule jamais.
10. Soit f une fonction de R dans R dérivable en chaque point d’un voisinage
d’un point a ∈ R. Utiliser le théorème de Lagrange pour démontrer que si
limx→a, x(=a f $ (x) = b, alors b = f $ (a).
11. Soit f une fonction de Rn dans Rp et a ∈ adh (dom f \ {a}). On dit
que f est fortement dérivable en a s’il existe une application linéaire L de
Rn dans Rp telle que
f (x) − f (y) − L(x − y)
lim = 0.
(x,y)→(a,a) |x − y|2
Montrer que :
a. Si f est fortement dérivable en a, alors f est dérivable en a.
b. Si f est fortement dérivable en a ∈ int dom f, alors nécessairement
L = fa$ .
c. S’il existe r > 0 tel que f soit dérivable en chaque point de B2 (a; r), et si
les fonctions dérivées partielles correspondantes x 2→ Dj f (x), (1 ≤ j ≤ n),
sont continues en a, alors f est fortement dérivable en a. (Utiliser le théorème
de la moyenne).
12. Soient f et g des fonctions de R dans R et a ∈ dom f ∩ dom g tel que
g(a) = 0. On dit que f est dérivable par rapport à g en a si
f (x) − f (a)
lim
x→a g(x) − g(a)
df
existe, auquel cas cette limite est notée Dg f (a) ou dg (a). Utiliser le théorème
de l’Hospital pour montrer que si f et g sont dérivables sur un voisinage de
a et si g $ (a) /= 0, alors
f $ (a)
Dg f (a) = $ .
g (a)
Si h est une fonction de R dans R∗+ et a ∈ dom h, tel que a > 0, on appelle
(en économie mathématique) élasticité de h en a la dérivée en a de ln h par
rapport à ln x, et on la note Eh(a). Montrer que, si h est dérivable en a,
" (a)
alors Eh(a) = ah h(a) .

Soit, sur le plan Y OX, une aire connexe S limitée par un contour fermé
simple ou complexe; on suppose qu’à chaque point de S ou de son périmètre
correspond un cercle, de rayon non nul, ayant ce point pour centre : il est
alors toujours possible de subdiviser S en régions, en nombre fini et assez
petites pour que chacune d’elles soit complètement intérieure au cercle cor-
respondant à un point convenablement choisi dans S ou sur son périmètre.
Pierre Cousin, 1895
Dans la théorie des équations, il y a deux théorèmes dont on pouvait dire

récemment encore que la démonstration entièrement correcte est inconnue.
L’un est le suivant : il faut qu’il y ait toujours, entre deux valeurs quelcon-
ques de la grandeur inconnue qui donnent deux résultats de signes opposés,
au moins une racine réelle de l’équation.
On dit qu’une fonction f (x) est continue de x = a jusqu’à x = b quand

elle est continue pour chaque valeur particulière x = X entre x = a et x = b,
les valeurs a et b comprises; on dit qu’elle est uniformément continue de
x = a à x = b quand, pour une grandeur ! donnée aussi petite que l’on veut,
il existe une grandeur positive η0 telle que pour toutes les valeurs positives η
qui sont plus petites que η0 , f (x ± η) − f (x) reste inférieur à !. Quelles que
soient les valeurs qu’on a pu donner à x et seulement telles que x et x ± η
appartiennent au domaine entre a et b, la condition doit être réalisée avec
le même η0 .
Heinrich Heine, 1872

Cette démonstration s’appuie, pour l’essentiel, sur le théorème exposé

fréquemment et démontré dans les cours de Monsieur Weierstrass : “Une
fonction réelle continue ϕ(x), définie dans un intervalle (a . . . b) (les extré-
mités comprises), atteint le maximum g des valeurs qu’elle peut prendre au
moins pour une valeur x0 de la variable de façon que ϕ(x0 ) = g.”
Georg Cantor, 1870
Soit à chercher le maximum de b2 a − a3 . D’après les règles de la méthode

précitée, on aura de la sorte :
b2 a + b2 e − a3 − e3 − 3a2 e − 3e2 a = b2 a − a3 .
Il est clair que, si l’on supprime les termes semblables, tous ceux qui resteront
seront affectés de l’inconnue e; ceux en a seul se trouvent en effet les mêmes
de part et d’autre. On a ainsi : b2 e = e3 + 3a2 e + 3ae2 , et, en divisant
tous les termes par e, b2 = e2 + 3a2 + 3ae, ce qui donne la constitution des
deux équations corrélatives sous cette forme. Pour trouver le maximum, il
s’agit d’égaler les racines des deux équations, afin de satisfaire aux règles
de la première méthode, dont notre nouveau procédé tire sa raison et sa
façon d’opérer. Ainsi, il faut égaler a à a + e, d’où e = 0. Mais, d’après
la constitution que nous avons trouvée pour les équations corrélatives, b2 =
e2 +3a2 +3ae, nous devons donc supprimer, dans cette égalité, tous les termes
affectés de e, comme se réduisant à zéro; il restera b2 = 3a2 , équation qui
donnera le maximum cherché pour le produit dont il s’agit.
Pierre de Fermat, 1629
Si l’on substitue deux nombres au lieu de l’inconnue, chacun séparément,

et si l’un de ces nombres donne un résultat positif, et l’autre un résultat
négatif, il y a toujours une racine qui surpasse le plus petit des nombres,
et qui est surpassée par le plus grand. Ces deux nombres s’appelleront Hy-
pothèses. Si une égalité a pu être formée comme il a esté dit dans le premier
Article, ses racines sont les hypothèses des racines de la Cascade immédiate.
Cette Cascade se forme en multipliant par la progression 0.1.2. etc.
Michel Rolle, 1691
Depuis l’impression de cet ouvrage, j’ai reconnu qu’à l’aide d’une formule
très simple on pouvait ramener au Calcul différentiel la solution de plusieurs
problèmes que j’avais renvoyés au Calcul intégral. D’après ce qui a été dit
dans la septième Leçon, si l’on désigne par x0 , X deux valeurs de x entre
lesquelles les fonctions f (x) et f $ (x) restent continues, et par θ un nombre

inférieur à l’unité, on aura
f (X) − f (x0 )
= f $ [x0 + θ(X − x0 )].
X − x0
Or il est aisé de voir que des raisonnements entièrement semblables à ceux
dont nous avons fait usage pour démontrer l’équation précédente suffiront
pour établir la formule
f (X) − f (x0 ) f $ [x0 + θ(X − x0 )]

= $ ,
F (X) − F (x0 ) F [x0 + θ(X − x0 )]
θ désignant encore un nombre inférieur à l’unité, et F (x) une fonction nou-

velle qui, toujours croissante ou décroissante depuis la limite x = x0 jusqu’à
la limite x = X, reste continue, avec sa dérivée F $ (x), entre ces mêmes
limites.
Soit une ligne courbe AM D (AP = x, P M = y, AB = a) telle que la

valeur de l’appliquée y soit exprimée par une fraction, dont le numérateur et
le dénominateur deviennent chacun zéro lorsque x = a, c’est-à-dire lorsque
le point P tombe sur le point donné B. On demande quelle doit être alors
la valeur de l’appliquée BD. ... Et partant que si l’on prend la différence
du numérateur, et qu’on la divise par la différence du dénominateur, après
avoir fait x = a = Ab ou AB, l’on aura la valeur cherchée de l’appliquée bd
ou BD.
Guillaume-François de L’Hospital, 1696
n’a eu aucune signification jusqu’à présent, et nous n’allons pas lui en

0
0
donner une.
Edmund Landau , 1934

Chapitre 5
Fonctions implicites
5.1 Limites infinies et point d’accumulation

Le lemme de Cousin fournit une intéressante caractérisation des limites
infinies. Commençons par une remarque très simple.
Lemme. Soit f une fonction de Rn dans Rp et a ∈ adh dom f. Alors,
limx→a f (x) = ∞ si et seulement si
(∀b ∈ Rp )(∀! > 0)(∃δ > 0)(∀x ∈ dom f ∩ B2 [a; δ]) : |f (x) − b|∞ > !. (5.1)
Démonstration. La condition suffisante s’obtient immédiatement en pre-

nant b = 0 dans (5.1). Pour démontrer la condition nécessaire, soit b ∈ Rp
et ! > 0. Par hypothèse,
(∃δ > 0)(∀x ∈ dom f ∩ B2 [a; δ]) : |f (x)|∞ > |b|∞ + !,
et dès lors, pour ces mêmes x, on aura
|f (x) − b|∞ ≥ |f (x)|∞ − |b|∞ > !.
Le résultat suivant, plus profond, donne la caractérisation en question.

Proposition. Soit f une fonction de Rn dans Rp et a ∈ adh dom f. Alors,
limx→a f (x) = ∞ si et seulement si
(∀b ∈ Rp )(∃! > 0)(∃δ > 0)(∀x ∈ dom f ∩ B2 [a; δ]) : |f (x) − b|∞ > !. (5.2)
165
166 CHAPITRE 5. FONCTIONS IMPLICITES
Démonstration. Condition nécessaire. Il suffit d’utiliser la condition

nécessaire du lemme et de prendre, par exemple, ! = 1 dans (5.1).
Condition suffisante. Pour chaque b ∈ Rp, choisissons !(b) > 0 et δ(b) > 0
tels que (5.2) soit satisfaite, c’est-à-dire tels que
(∀x ∈ dom f ∩ B2 [a; δ(b)]) : f (x) /∈ B∞ [b, !(b)]. (5.3)
Nous définissons ainsi une jauge ! : b 2→ !(b) sur Rp. Soit r > 0; par le
lemme de Cousin appliqué
A
au pavé
B
B∞ [r] et à la jauge ! sur B∞ [r], il existe
une P-partition !-fine (bj , E j ) 1≤j≤m de (] − r, r])n. Posons δ = min{δ(bj ) :
1 ≤ j ≤ m}. Si x ∈ dom f ∩ B2 [a; δ], alors, pour chaque 1 ≤ j ≤ m, on a
x ∈ dom f ∩ B2 [a; δ(bj )], et dès lors, par (5.3) et la définition de !-finesse,
f (x) /∈ B∞ [bj , !(bj )], (1 ≤ j ≤ m).
En conséquence, pour ces mêmes x, f (x) /∈ B∞ [r], c’est-à-dire |f (x)|∞ > r.

Donc, limx→a f (x) = ∞.
On démontre exactement de la même manière une caractérisation des
limites infinies lorsque x tend vers l’infini.
Proposition. Soit f une fonction de Rn dans Rp telle que dom f ne soit
pas borné. Alors, limx→∞ f (x) = ∞ si et seulement si
(∀b ∈ Rp )(∃! > 0)(∃ρ > 0)(∀x ∈ dom f : |x|2 ≥ ρ) : |f (x) − b|∞ > !.
On obtient les résultats correspondants lorsque x tend vers a ou vers

l’infini dans E ⊂ Rn en appliquant les propositions qui précèdent à f |E .
Le choix des normes est évidemment indifférent dans les caractérisations.
Leur négation conduit aux définitions suivantes.
Définition. Soit f une fonction de Rn dans Rp et a ∈ adh dom f . On dit
que b ∈ Rp est un point d’accumulation ou une valeur d’adhérence de f (x)
lorsque x tend vers a si
(∀! > 0)(∀δ > 0)(∃x ∈ dom f : |x − a|2 ≤ δ) : |f (x) − b|2 ≤ !. (5.4)
Définition. Soit f une fonction de Rn dans Rp telle que dom f ne soit

pas borné. On dit que b ∈ Rp est un point d’accumulation ou une valeur
d’adhérence de f (x) lorsque x tend vers l’infini si
(∀! > 0)(∀ρ > 0)(∃x ∈ dom f : |x|2 ≥ ρ) : |f (x) − b|2 ≤ !. (5.5)
5.1. LIMITES INFINIES ET POINT D’ACCUMULATION 167
On obtient évidemment les définitions correspondantes de point d’accu-

mulation de f lorsque x tend vers a ou vers l’infini dans E ⊂ Rn en appli-
quant les définitions précédentes à f |E .
Enfin, dans le cas d’une suite, la définition obtenue à partir du cas général
est équivalente à la suivante.
Définition. Soit (ak )k∈N une suite dans Rp . b ∈ Rp est un point d’accumu-
lation ou une valeur d’adhérence de (ak )k∈N si
(∀! > 0)(∀m ∈ N)(∃k ≥ m) : |ak − b|2 ≤ !.
Bien entendu, dans ces définitions, le choix des normes est indifférent. Il
est immédiat que si b = limx→a f (x) (resp. b = limx→∞ f (x)), alors b est un
point d’accumulation de f (x) lorsque x tend vers a (resp. tend vers l’infini),
et c’est le seul. Mais f peut avoir des points d’accumulation lorsque x tend
vers a (ou vers l’infini) sans que la limite existe. Par exemple, -1 et 1 sont
des points d’accumulation de la fonction f : x 2→ x + |x| x
lorsque x tend vers
0 (le vérifier), alors que la limite correspondante n’existe pas.
En s’inspirant du résultat correspondant pour la limite, il est facile
d’obtenir les caractérisations suivantes d’un point d’accumulation en termes
de suites.
Proposition. Soit f une fonction de Rn dans Rp et a ∈ adh dom f (resp.
dom f non borné). Alors b est un point d’accumulation de f lorsque x tend
vers a (resp. x tend vers l’infini) si et seulement s’il existe une suite (xk )k∈N
dans dom f telle que xk → a (resp. xk → ∞) et f (xk ) → b lorsque k → ∞.
b est un point d’accumulation de la suite (ak )k∈N si et seulement s’il existe
une suite (kn )n∈N tendant vers l’infini telle que akn → b si m → ∞.
Par exemple, chaque réel b ∈ [−1, 1] est un point d’accumulation de la
fonction x 2→ sin x1 , puisque, si a ∈ [0, 2π] est tel que sin a = b, alors la suite
(xk )k∈N∗ = ( a+2kπ
1
)k∈N∗ converge vers 0 et est telle que sin x1k = b quel que
soit k ∈ N .
∗
Le contraposé de la caractérisation d’existence d’une limite infinie fournit

évidemment une condition nécessaire et suffisante d’existence d’un
point d’accumulation de f lorsque x tend vers a ou tend vers l’infini.
Proposition. Soit f une fonction de Rn dans Rp , a ∈ adh dom f (resp.
dom f non borné). Alors f possède un point d’accumulation lorsque x tend
vers a (resp. tend vers l’infini) si et seulement si f (x) ne tend pas vers l’infini
lorsque x tend vers a (resp. lorsque x tend vers l’infini).
Corollaire. Soit f une fonction de Rn dans Rp , a ∈ adh dom f (resp.dom f

non borné). Si f est localement bornée lorsque x tend vers a (resp. bornée
à l’infini), alors f possède un point d’accumulation lorsque x tend vers a
(resp. tend vers l’infini).
Démonstration. C’est une conséquence immédiate de la Proposition
précédente et du fait que si f est localement bornée en a (resp. bornée
à l’infini), elle ne tend pas vers l’infini lorsque x tend vers a (resp. tend vers
l’infini). Dans le premier cas par exemple,
(∃r > 0)(∃δ > 0)(∀x ∈ dom f ∩ B2 [a; δ]) : |f (x)|2 ≤ r,
ce qui implique la négation de la condition de limite infinie
(∃r $ > 0)(∀δ $ > 0)(∃x ∈ dom f ∩ B2 [a; δ $]) : |f (x)|2 < r $ ,
si l’on prend par exemple r $ = 2r et, pour chaque δ $ > 0, n’importe quel
x ∈ dom f tel que |x − a|2 ≤ min{δ, δ $ }.
Dans le cas des suites, le Corollaire ci-dessus a une formulation encore
plus simple due au résultat suivant.
Définition. On dit qu’une suite (ak )k∈N dans Rp est bornée si l’ensemble
{ak : k ∈ N} est borné.
Lemme. Soit (ak )k∈N une suite dans Rp. Alors (ak )k∈N est bornée si et
seulement si elle est bornée à l’infini.
Démonstration. La condition nécessaire est suffisante. Pour la condition
suffisante, (ak )k∈N est bornée à l’infini si et seulement s’il existe r > 0 et
m ∈ N tels que, pour tout entier k ≥ m, on a |ak |2 ≤ r, ce qui entraı̂ne
aussitôt que, pour tout k ∈ N, on aura
|ak |2 ≤ max{|a0 |2 , |a1 |2 , . . . , |am−1 |2 , r}.
En combinant ce résultat avec la Proposition précédente appliquée au

cas particulier d’une suite, on obtient le résultat important suivant, appelé
théorème de Bolzano-Weierstrass.
Corollaire. Toute suite bornée dans Rp possède au moins un point d’accu-
mulation.
La notion de point d’accumulation d’une suite peut s’exprimer en termes
de l’important concept de sous-suite.
5.2. CRITÈRE DE CAUCHY 169
Définition. Soit (ak )k∈N une suite dans Rp. On appelle sous-suite de
(ak )k∈N ou suite extraite de (ak )k∈N toute suite de la forme (akn )n∈N où
(kn )n∈N est une suite dans N telle que kn < kn+1 pour tout k ∈ N.
En d’autres termes, une sous-suite de (ak )k∈N est une suite obtenue en
composant (ak )k∈N avec une suite (kn )n∈N vérifiant kn < kn+1 pour chaque
n ∈ N. Par exemple, (2n)n∈N et (2n + 1)n∈N sont des sous-suites de (k)k∈N
(prendre respectivement kn = 2n et kn = 2n + 1). Notons que la condition
kn < kn+1 entraı̂ne évidemment que, pour chaque n ∈ N, kn+1 ≥ kn + 1, et
dès lors, par récurrence, que kn ≥ n.
La proposition suivante est une conséquence facile de la définition de
limite.
Proposition. Toute sous-suite d’une suite convergente converge vers la
même limite.
On a une autre caractérisation d’un point d’accumulation d’une
suite.
Proposition. b ∈ Rp est un point d’accumulation de la suite (ak )k∈N si et
seulement s’il existe une sous-suite (akn )n∈N de (ak )k∈N qui converge vers b.
Démonstration. Condition nécessaire. Soit b un point d’accumulation de
(ak )k∈N . En prenant ! = 1 et m = 1 dans la définition, on obtient un entier
k0 ≥ 1 tel que |ak0 − b|2 ≤ 1. En prenant ! = 12 et m = k0 + 1, on obtient un
entier k1 ≥ k0 + 1 tel que |ak1 − b|2 ≤ 12 . En continuant de la sorte, on trouve
pour chaque entier n ≥ 1 un entier kn ≥ kn−1 + 1 tel que |akn − b|2 ≤ n+1 1
.
En conséquence, (akn )n∈N est une sous-suite de (ak )k∈N qui converge vers b.
Condition suffisante. Soit (akn )n∈N une sous-suite de (ak )k∈N qui converge
vers b, et soient ! > 0 et m ∈ N. Par hypothèse, (∃q ∈ N)(∀j ≥ q) :
|akj − b|2 ≤ !. Dès lors, si n = kmax{m,q}, on a n ≥ km ≥ m et |an − b|2 ≤ !.
5.2 Critère de Cauchy

Nous sommes maintenant en mesure de démontrer que la condition nécessaire
de Cauchy d’existence de la limite est également suffisante. Cela fournira
le critère de Cauchy, dont l’intérêt est d’être une condition nécessaire et
suffisante d’existence de la limite, qui, au contraire de la définition, ne fait
pas intervenir la valeur de la limite.
Soit f une fonction de Rn dans Rp et a ∈ adh dom f . Rappelons tout

d’abord que la condition de Cauchy pour f lorsque x tend vers a est la
suivante :
(∀! > 0)(∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ)
(∀y ∈ dom f : |y − a|2 ≤ δ) : |f (x) − f (y)|2 ≤ !.
Complétons maintenant la démonstration du critère de Cauchy pour
la limite de f (x) lorsque x tend vers a en montrant que la condition de
Cauchy est une condition suffisante d’existence de la limite.
Théorème. Soit f une fonction de Rn dans Rp et a ∈ adh dom f . Si
f vérifie la condition de Cauchy lorsque x tend vers a, alors limx→a f (x)
existe.
Démonstration. Puisqu’elle vérifie la condition de Cauchy, f est locale-
ment bornée en a et dès lors f possède un point d’accumulation b lorsque
x tend vers a. Montrons maintenant que b = limx→a f (x). Soit ! > 0; par
hypothèse,
(∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ)
!
(∀y ∈ dom f : |y − a|2 ≤ δ) : |f (y) − f (x)|2 ≤ ,
2
et, puisque b est un point d’accumulation, pour cet 2! et ce δ > 0, il existe
un z ∈ dom f ∩ B2 [a; δ] tel que
!
|f (z) − b|2 ≤ .
2
En conséquence, pour tout x ∈ dom f tel que |x − a|2 ≤ δ, on a
! !
|f (x) − b|2 ≤ |f (x) − f (z)|2 + |f (z) − b|2 ≤ + = !.
2 2
On démontre d’une manière complètement analogue les résultats cor-

respondants lorsque x tend vers l’infini. Rappelons que, dans ce cas, la
condition de Cauchy s’énonce comme suit :
(∀! > 0)(∃ρ > 0)(∀x ∈ dom f : |x|2 ≥ ρ)
(∀y ∈ dom f : |y|2 ≥ ρ) : |f (x) − f (y)|2 ≤ !.

Lemme. Soit f une fonction de Rn dans Rp telle que dom f soit non borné.
Si f vérifie la condition de Cauchy lorsque x tend vers l’infini, alors f est
bornée à l’infini.
5.3. ITÉRÉES D’UNE APPLICATION 171
Théorème. Soit f une fonction de Rn dans Rp telle que dom f soit non
borné. Si f vérifie la condition de Cauchy lorsque x tend vers l’infini, alors
limx→∞ f (x) existe.
En appliquant ces résultats à la restriction f |E de f à E ⊂ Rn , le lecteur
obtiendra aisément les assertions correspondantes pour la limite de f (x)
lorsque x tend vers a ou vers l’infini dans E.
Enfin, le cas particulier d’une suite conduit aux formulations suivantes.
Appelons suite de Cauchy toute suite vérifiant la condition de Cauchy :
(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q ≥ m) :
|ak − aq |2 ≤ !.
Lemme. Toute suite de Cauchy dans Rp est bornée.
Théorème. Toute suite de Cauchy dans Rp est convergente.
5.3 Itérées d’une application

Soit h une application de Rp dans Rp dont nous nous proposons de trouver
les zéros, c’est-à-dire les éléments a ∈ Rp tels que h(a) = 0. En d’autres
termes, nous voulons résoudre l’équation en l’inconnue y
h(y) = 0, (5.6)
ou encore déterminer ses racines. En dehors de cas très particuliers (h

est une application affine, un polynôme de R dans R ou de C dans C
de degré inférieur ou égal à quatre,...), il n’est pas possible en général
de trouver une formule exacte fournissant les zéros de h et l’on est ra-
mené à leur détermination approchée, avec une erreur arbitrairement petite.
Une stratégie possible pour cette détermination approchée consiste à écrire
l’équation (5.6) sous la forme équivalente
y = y + h(y),
c’est-à-dire, en posant g = I + h, sous la forme
y = g(y). (5.7)
Les zéros a de h correspondent donc aux points fixes de g, c’est-à-dire aux

éléments a ∈ Rp tels que g(a) = a. Pour tenter de déterminer les points fixes
de g, on peut utiliser la méthode des approximations successives qui

consiste à partir d’un élément y0 arbitraire de Rp et de calculer g(y0 ). Si
g(y0 ) = y0 , alors y0 est un point fixe de g (et donc un zéro de h). Sinon, on
pose y1 = g(y0 ) et l’on calcule
g(y1) = g[g(y0)] = (g ◦ g)(y0) = g 2 (y0 ).
Si g(y1 ) = y1 , alors y1 est un point fixe de g; sinon, on pose y2 = g(y1 ) et

l’on calcule g(y2 ) = (g ◦ g ◦ g)(y0) = g 3 (y0 ). En continuant de la sorte, ou
bien l’on trouve un entier positif k et un yk ∈ Rp tel que g(yk ) = yk , ou bien
l’on détermine, de proche en proche, une suite (yk )k∈N par les relations
y0 ∈ Rp , yk = g(yk−1) = (g ◦ g ◦ . . . ◦ g)(y0) = g k (y0 ), (k ∈ N∗ ). (5.8)
Pour chaque entier k ≥ 1, l’application g k = g ◦ g ◦ . . . ◦ g (k fois) s’appelle

la ke -itérée de g (on pose aussi g 0 = I). Par exemple, si g est l’application
de R dans R définie par g(y) = y 2 , alors g k (y) = y 2k . Supposons maintenant
que la suite (yk )k∈N définie par les relations (5.8) converge vers y ∗ et que
l’application g soit continue. Alors, en faisant tendre k vers l’infini dans
(5.8), on obtient
y ∗ = lim yk = lim g(yk−1 ) = g( lim yk−1 ) = g(y ∗),

k→∞ k→∞ k→∞
et y∗ est un point fixe de g, c’est-à-dire un zéro de h. On dit que ce point

fixe y ∗ est obtenu par la méthode d’approximations successives définie par
(5.8). On voit donc que la convergence de (yk )k∈N et la continuité de g
suffisent pour obtenir un point fixe de g par la méthode des approximations
successives. Bien entendu, la limite y ∗ de la suite (yk )k∈N n’est pas, en
pratique, connue a priori puisque, dans ce cas, le point fixe correspondant
de g serait connu et le problème posé serait résolu. Il est donc important de
pouvoir déterminer la convergence de (yk )k∈N, sans connaı̂tre explicitement
y ∗ , et l’on fera naturellement appel au critère de Cauchy. La suite (yk )k∈N
dépend de g et de y0 , et il en est donc de même de sa convergence. Par
exemple, si g est l’application de R dans R définie par g(y) = y + 1, alors,
pour n’importe quel y0 ∈ R, on aura, pour k ∈ N∗ ,
yk = g k (y0 ) = y0 + k,
et la suite correspondante (yk )k∈N est divergente. D’autre part, si g est

l’application de R dans R définie par g(y) = y 2 , on a, pour chaque entier
k ≥ 1, g k (y) = y 2k ; dès lors, si l’on prend y0 = 2, la suite correspondante
5.4. THÉORÈME DES APPLICATIONS CONTRACTANTES 173
(yk )k∈N = (22k )k∈N est divergente tandis que si l’on prend y0 = 12 , la suite
correspondante (yk )k∈N = (2−2k )k∈N converge vers 0. Remarquons aussi
que (yk )k∈N convergera vers 1 si et seulement si y0 = 1. Notons enfin que,
étant donnée une application h dont on veut déterminer les zéros, on peut
construire différentes applications g dont les points fixes fournissent les zéros
de h : par exemple, si L est une application linéaire inversible de Rp dans
Rp , on aura évidemment
h(y) = 0 ⇔ y = y + L[h(y)],
et l’on peut donc prendre g = I + L ◦ h. On est donc amené à déterminer

des conditions sur g et sur y0 qui assurent la convergence de la suite des
itérées (g k (y0 ))k∈N. Nous donnerons, au paragraphe suivant, des condi-
tions sur g assurant cette convergence quel que soit le choix de y0 . Lorsque
de telles conditions sur g ne sont pas satisfaites, le comportement de la
suite des itérées (g k (y0 ))k∈N peut être extrêmement varié et extraordinaire-
ment compliqué même pour une fonction g de R dans R aussi simple que
g(y) = ay(1 − y). Une telle suite d’itérées d’une application constitue
l’exemple le plus simple d’un système dynamique discret, et (g k (y0 ))k∈N
s’appelle l’orbite issue de y0 . L’ensemble limite ω(y0 ) de cette orbite est
l’ensemble des points d’accumulation de (g k (y0 ))k∈N . L’étude du comporte-
ment asymptotique (pour k → ∞) des orbites conduit en particulier à la
théorie du chaos, qui fait actuellement l’objet de nombreuses recherches.
5.4 Théorème des applications contractantes

Le but de cette section est d’énoncer et démontrer un résultat qui, pour
une application g d’une partie E de Rp en elle-même, assure la convergence
de la suite des itérée (g k (y0 ))k∈N quel que soit le choix de y0 ∈ E. Nous
aurons besoin pour ce faire d’un type de continuité introduit par Rudolph
Lipschitz en 1868.
Définition. Soit E ⊂ Rn et f une application de E dans Rp . On dit que f

est lipschitzienne sur E s’il existe un α ≥ 0 tel que, pour tout u ∈ E et tout
v ∈ E, on ait
|f (u) − f (v)|2 ≤ α|u − v|2 .
Ainsi, toute application linéaire L de Rn dans Rp est lipschitzienne sur

Rn . Si f est une fonction de Rn dans Rp dérivable en chaque point d’une
boule ouverte B2 (a; r) de Rn et s’il existe une constante α telle que, pour
tout x ∈ B2 (a; r), et tout h ∈ Rn , on ait
|fx$ (h)|2 ≤ α|h|2 ,
alors f sera lipschitzienne sur Bj (a; r) puisque, par le théorème de la moyen-

ne, si u ∈ B2 (a; r) et v ∈ B2 (a; r), il existera θ ∈ ]0, 1[ tel que
$
|f (u) − f (v)|2 ≤ |fv+θ(u−v) (u − v)|2 ≤ α|u − v|2 ,
puisque u + θ(v − u) ∈ B2 (a; r). D’autre part, toute application f de E dans

Rp lipschitzienne sur E est évidemment uniformément continue sur E. En
outre, si f est lipschitzienne sur E, alors pour chaque a ∈ E, l’application
x 2→ f (x)−f (a)
|x−a|2 est localement bornée en a. On peut évidemment, dans la
définition, remplacer les normes | · |2 par d’autres normes.
Définition. Soit E ⊂ Rp et g une application de E dans Rp . On dit que
g est une application contractante ou une contraction sur E pour la norme
| · |j (j = 1, 2, ∞), s’il existe un α ∈ [0, 1[ tel que, pour tout u ∈ E et tout
v ∈ E, on ait
|g(u) − g(v)|j ≤ α|u − v|j .
α est appelée une constante de contraction de f .
Une application f de E dans Rp contractante sur E est évidemment
lipschitzienne sur E. La propriété suivante est utile.
Lemme. Soit E ⊂ Rp et g une application contractante de E dans E de
constante α pour la norme | · |j . Alors, pour chaque entier k ≥ 1, g k =
g ◦ g ◦ . . . ◦ g est contractante sur E de constante αk pour la norme | · |j .
Démonstration. Elle se fait par récurrence sur k. Le résultat est évident
pour k = 1. Si maintenant k ≥ 2 et g k−1 est contractante sur E de constante
αk−1 , alors, pour tout u ∈ E et tout v ∈ E, on a
# #
# #
|g k (u)−g k (v)|j = #g k−1 [g(u)] − g k−1 [g(v)]# ≤ αk−1 |g(u)−g(v)|j ≤ αk |u−v|j .
j
Quoiqu’énoncé et démontré dans Rp par Edouard Goursat en 1903, le

résultat suivant, appelé théorème des applications contractantes, est
aussi connu comme théorème du point fixe de Banach suite à l’extension
à des espaces plus généraux donnée par Stefan Banach en 1922.
5.4. THÉORÈME DES APPLICATIONS CONTRACTANTES 175
Théorème. Soit E un fermé non vide de Rp, j = 1, 2 ou ∞ et g une

application contractante de E dans E pour la norme | · |j , de constante
α ∈ [0, 1[. Alors, g possède dans E un point fixe unique y ∗ . En outre, pour
chaque y0 ∈ E, la suite (yk )k∈N des itérées de y0 définie par
yk = g(yk−1) = g k (y0 ), k ∈ N∗ ,
converge vers y ∗ . Enfin, pour chaque k ∈ N∗ , on a
αk
|yk − y ∗ |j ≤ |g(y0 ) − y0 |j .
1−α
8 y0 ∈9E. Notons tout d’abord que, puisque g(E) ⊂
E, la suite (yk )k∈N = g k (y0 ) des itérées de y0 est bien définie et est une
k∈N
suite dans E. Montrons que c’est une suite de Cauchy. Pour chaque k ∈ N∗ ,
on a # #
# #
|yk+1 − yk |j = #g k [g(y0)] − g k (y0 )# ≤ αk |g(y0 ) − y0 |j ,
j
et dès lors, si k ∈ N et q ∈ N, on a
|yk − yq |j = |yk − yk+1 + yk+1 − yq+1 + yq+1 − yq |j
≤ |yk − yk+1 |j + |yk+1 − yq+1 |j + |yq+1 − yq |j

≤ αk |g(y0 ) − y0 |j + |g(yk ) − g(yq )|j + αq |g(y0) − y0 |j
≤ (αk + αq )|g(y0) − y0 |j + α|yk − yq |j ,
ce qui entraı̂ne
αk + αq
|yk − yq |j ≤ |g(y0) − y0 |j . (5.9)
1−α
k
Comme α ∈ [0, 1[, la suite ( 1−α α
|g(y0 ) − y0 |j )k∈N converge vers zéro et dès
lors, si ! > 0 est donné, il existera m ∈ N tel que, pour tout entier k ≥ m ,
on a
αk !
|g(y0 ) − y0 |j ≤ ;
1−α 2
cela entraı̂ne que, pour k ≥ m et q ≥ m, on a |yk − yq |j ≤ !, et (yk )k∈N est
une suite de Cauchy dans E. Elle converge donc vers un élément y ∗ ∈ Rp
et, puisque E est fermé, on a y ∗ ∈ E. Montrons que y ∗ est un point fixe de
g; pour tout k ∈ N, on a
0 ≤ |y ∗ − g(y ∗ )|j = |y ∗ − yk+1 + g(yk ) − g(y ∗ )|j ≤ |y ∗ − yk+1 |j + α|yk − y ∗ |j ,

et dès lors, en faisant tendre k vers l’infini, on en déduit que |y ∗ −g(y ∗ )|j = 0.
On peut aussi obtenir le même résultat comme dans la section précédente
en utilisant la continuité de g. D’ailleurs, g possède un seul point fixe dans
E puisque, si y ∗ et y ∗∗ sont des points fixes de g dans E, on a
0 ≤ |y ∗ − y ∗∗ |j = |g(y ∗) − g(y ∗∗)|j ≤ α|y ∗ − y ∗∗ |j ,
et dès lors
0 ≤ (1 − α)|y ∗ − y ∗∗ |j ≤ 0,
ce qui implique y ∗ = y ∗∗ . Enfin, pour chaque k ∈ N∗ , si l’on fait tendre q
vers l’infini dans (5.9), on obtient
αk
|yk − y ∗ |j ≤ |g(y0 ) − y0 |j .
1−α
Par exemple, pour chaque a ∈ ] − 1, 1[ et chaque b ∈ R, l’équation de

Kepler
y = a sin y + b,
possède une solution unique y ∗ = limk→∞ yk où y0 ∈ R est arbitraire et,
pour chaque k ∈ N∗ ,
yk = a sin yk−1 + b,
puisque l’application g de R dans R définie par g(y) = a sin y + b est telle
que, pour tout u ∈ R et tout v ∈ R, il existe, par le théorème de Lagrange,
θ ∈ ]0, 1[ tel que
|g(u) − g(v)| = |a||(sin u − sin v)| = |a|| cos(u + θ(v − u))(u − v)| ≤ |a||u − v|,
et g est donc une contraction sur R de constante |a| ∈ [0, 1[.

Sous les hypothèses du théorème des applications contractantes, le point
fixe unique y ∗ de g est un attracteur global pour le système dynamique défini
par les itérées de g.
5.5 Fonctions implicites : existence

Soit F une fonction de Rn × Rp dans Rq . L’ensemble de ses zéros
F −1 ({0}) = {(x, y) ∈ dom F : F (x, y) = 0} (5.10)

5.5. FONCTIONS IMPLICITES : EXISTENCE 177
constitue donc un graphe de Rn dans Rp . L’objet de la théorie des fonctions

implicites est de déterminer des conditions sur F sous lesquelles le graphe
F −1 ({0}) est une fonction de Rn dans Rp (problème global) ou sous lesquelles
la restriction de F −1 ({0}) à un voisinage d’un de ses points est une fonction
de Rn dans Rp (problème local). Pour situer la difficulté du problème et
motiver les hypothèses du théorème qui donnera la solution du problème
local (le problème global est beaucoup plus difficile et ne sera pas abordé
ici), considérons tout d’abord le cas où F est une application affine de R × R
dans R. Elle peut donc s’écrire
F (x, y) = ax + by + c,
où a, b et c sont des réels. Pour que le graphe F −1 ({0}) correspondant soit
une fonction de R dans R, il faut qu’à chaque x ∈ R corresponde au plus un
élément y ∈ R tel que
ax + by + c = 0,
c’est-à-dire il faut que l’équation linéaire en y
by = −ax − c
ait au plus une solution; ce sera le cas si et seulement si b /= 0. On notera que

pour chaque x ∈ R et chaque y ∈ R, b = D2 F (x, y) est la dérivée partielle
de F par rapport à y en (x, y).
Considérons maintenant une situation simple où F est non linéaire. Soit
F l’application de R × R dans R définie par F (x, y) = x2 + y 2 − 1. Le graphe
F −1 ({0}) correspondant est la partie de R2 formée des points du cercle de
centre 0 et de rayon 1 et ce n’est pas un graphe fonctionnel, puisque, pour
chaque x ∈]−1, 1[⊂ [−1, 1] = dom F −1 ({0}), il existe deux éléments distincts
(x, (1 − x2 )1/2) et (x, −(1 − x2 )1/2) appartenant à F −1 ({0}). Pour la même
raison, la restriction de F −1 ({0}) à n’importe quel voisinage du point (−1, 0)
et du point (1, 0) de F −1 ({0}) ne sera pas une fonction de R dans R. Ces
points sont les seuls points du graphe de la forme (x, 0). Si (x, y) ∈ F −1 ({0})
avec y > 0 (resp. y < 0), on vérifie sans peine que la restriction de F −1 ({0})
au voisinage {(x, y) ∈ R2 : y ≥ 0} (resp. {(x, y) ∈ R2 : y ≤ 0}) de (x, y)
est une fonction f de R dans R de domaine [−1, 1] donnée explicitement
par f (x) = (1 − x2 )1/2 (resp. f (x) = −(1 − x2 )1/2). Notons que, pour
chaque (x, y) ∈ R × R, D2 F (x, y) = 2y et dès lors que la restriction de
F −1 ({0}) est une fonction sur un voisinage convenable des points (x, y) tels
que D2 F (x, y) /= 0 et n’est une fonction sur aucun voisinage des points (x, y)
tels que D2 F (x, y) = 0. Il ne faudrait toutefois pas en conclure trop vite que
la condition D2 F (x, y) /= 0 est nécessaire et suffisante pour que la restriction

de F −1 ({0}) à un voisinage d’un de ses points (x, y) soit une fonction de R
dans R puisque l’exemple de F (x, y) = y 3 − x, dont le graphe correspondant
F −1 ({0}) = {(x, y) ∈ R × R : y 3 − x = 0}
est celui de l’application f de R dans R définie par f (x) = x1/3, est tel que
D2 F (x, y) = 3y 2 et donc D2 F (0, 0) = 0 au point (0, 0) de F −1 ({0}). La
condition D2 F (x, y) /= 0 n’est donc pas nécessaire. Toutefois, l’important
théorème des fonctions implicites, que nous allons démontrer, montre
que, sous certaines conditions de régularité sur F , la condition D2 F (x, y) /= 0
est suffisante pour que la restriction de F −1 ({0}) à un voisinage suffisamment
petit du point (x, y) de F −1 ({0}) soit une fonction. Nous donnerons d’abord
le théorème dans le cas particulier où p = 1 avant de l’étendre au cas où p
est quelconque.
Théorème. Soit F une fonction de Rn ×R dans R, (x0 , y0 ) ∈ dom F, r0 > 0,
R0 > 0 tels que
B2 (x0 ; r0 )× ]y0 − R0 , y0 + R0 [ ⊂ dom F
et tels que les conditions suivantes soient satisfaites.

1. F (x0 , y0 ) = 0 (c’est-à-dire (x0 , y0 ) ∈ F −1 ({0})).
2. La fonction F (·, y0 ) : x 2→ F (x, y0 ) est continue en x0 .
3. Pour chaque x ∈ B2 (x0 ; r0) et chaque y ∈ ]y0 − R0 , y0 + R0 [, D2 F (x, y)
existe et la fonction correspondante D2 F : (x, y) 2→ D2 F (x, y) de Rn × R
dans R est continue en (x0 , y0 ).
4. D2 F (x0 , y0 ) /= 0.
Alors il existe r ∈ ]0, r0[ et R ∈ ]0, R0[ tels que la restriction f du graphe
F −1 ({0}) à B2 [x0 ; r] × [y0 − R, y0 + R] est une application de B2 [x0 ; r] dans
[y0 − R, y0 + R] continue en x0 .
Démonstration. La première partie de la thèse revient à démontrer l’exis-
tence de r ∈]0, r0[ et R ∈]0, R0[ tels que, pour chaque x ∈ B2 [x0 ; r], l’équation
F (x, y) = 0 (5.11)
en l’inconnue y possède dans [y0 − R, y0 + R] une solution unique, que l’on

notera alors f (x). La deuxième partie de la thèse revient à prouver que f
est continue en x0 . Nous allons construire, pour chaque x ∈ B2 (x0 ; r0) une
fonction de R dans R dont les points fixes y correspondent aux solutions
de (5.11) et pour laquelle le théorème des applications contractantes sera
applicable. Si nous posons L = D2 F (x0 , y0 ), alors pour chaque (x, y) ∈

B2 (x0 ; r0)× ]y0 − R0 , y0 + R0 [, nous avons
F (x, y) = 0 ⇔ Ly + F (x, y) − Ly = 0 ⇔ y = G(x, y),
si G est la fonction de Rn × R de domaine égal à dom F définie par
G(x, y) = −L−1 [F (x, y) − Ly].
Pour chaque x ∈ B2 (x0 ; r0), si u ∈ ]y0 − R0 , y0 + R0 [ et v ∈ ]y0 − R0 , y0 + R0 [,

le théorème de Lagrange appliqué à la fonction G(x, ·) : y 2→ G(x, y) entraı̂ne
G(x, u) − G(x, v) = (u − v)D2G(x, v + θ(u − v))
= −(u − v)L−1 [D2 F (x, v + θ(u − v)) − L]

= −(u − v)L−1 [D2 F (x, v + θ(u − v)) − D2 F (x0 , y0 )].
Par l’hypothèse 3, il existe r1 ∈ ]0, r0[ et R ∈ ]0, R0[ tels que, pour tout
(x, y) ∈ B2 [x0 ; r1] × [y0 − R, y0 + R] on a
L
|D2 F (x, y) − D2 F (x0 , y0 )| ≤ ,
2
et dès lors, si x ∈ B2 [x0 ; r1], u ∈ [y0 −R, y0 +R], v ∈ [y0 −R, y0 +R], on aura,
pour le θ donné par le théorème de Lagrange, v + θ(u − v) ∈ [y0 − R, y0 + R],
et dès lors,
L 1
|G(x, u) − G(x, v)| ≤ |u − v|L−1 = |u − v|,
2 2
ce qui montre que, pour chaque x ∈ B2 [x0 ; r1], l’application G(x, ·) est lip-
schitzienne de constante 12 sur [y0 − R, y0 + R]. Pour pouvoir appliquer le
théorème du point fixe de Banach, il faut encore que G(x, ·) soit une applica-
tion de [y0 − R, y0 + R] dans [y0 − R, y0 + R]. On a, pour tout x ∈ B2 [x0 ; r1]
et tout y ∈ [y0 − R, y0 + R],
|G(x, y) − y0 | ≤ |G(x, y) − G(x, y0 )| + |G(x, y0) − y0 |
= |G(x, y) − G(x, y0)| + |L−1 F (x, y0 )|

1 R
≤ |y − y0 | + |L−1 F (x, y0 )| ≤ + |L−1 F (x, y0 )|.
2 2
Par l’hypothèse 1 et l’hypothèse 2, il existe r ∈ ]0, r1] tel que, pour tout
x ∈ B2 [x0 ; r], on a
R
|L−1 F (x, y0 )| = |L−1 [F (x, y0 ) − F (x0 , y0 )]| ≤ ,
2
et dès lors, pour chaque x ∈ B2 [x0 ; r] et chaque y ∈ [y0 − R, y0 + R], on aura
|G(x, y) − y0 | ≤ R,
ce qui montre que G(x, ·) est une application du fermé [y0 − R, y0 + R] en

lui-même. Le théorème de Banach entraı̂ne donc, pour chaque x ∈ B2 [x0 ; r],
l’existence d’un point fixe unique y ∈ [y0 − R, y0 + R] de G(x, ·), c’est-à-dire
l’existence d’un unique y = f (x) ∈ [y0 − R, y0 + R] tel que F [x, f (x)] = 0.
Pour x = x0 , l’unicité entraı̂ne en particulier que f (x0 ) = y0 . Il reste à
montrer que f est continue en x0 . Si x ∈ B2 [x0 ; r], on a
|f (x) − f (x0 )| = |G[x, f (x)] − G[x0 , f (x0 )]|
= |G[x, f (x)] − G[x, f (x0)] + G(x, y0 ) − G(x0 , y0 )|

1
≤ |f (x) − f (x0 )| + |L−1 [F (x, y0 ) − F (x0 , y0 )]|.
2
Dès lors,
|f (x) − f (x0 )| ≤ 2|L−1 [F (x, y0 ) − F (x0 , y0 )]|,
et comme le second membre tend vers 0 lorsque x tend vers x0 en vertu de
l’hypothèse 2, on voit que f est continue en x0 .
Enonçons et démontrons maintenant le théorème dans le cas général.
Pour motiver l’énoncé dans ce cas (la démonstration sera très semblable à
celle du cas particulier précédent), considérons le cas où F est une application
linéaire de Rn × Rp dans Rq . Elle peut donc s’écrire
F (x, y) = Ax + By,
où A est une application linéaire de Rn dans Rq et B une application linéaire

de Rp dans Rq . Pour que le graphe F −1 ({0}) correspondant soit une fonction
de Rn dans Rp , il faut qu’à chaque x ∈ Rn corresponde au plus un élément
y ∈ Rp tel que
Ax + By = 0,
c’est-à-dire il faut que le système linéaire en y
By = −Ax
ait au plus une solution. La théorie des équations linéaires nous apprend que
ce sera le cas si et seulement si B est injective. Cela entraı̂ne en particulier
que p ≤ q et nous nous restreindrons au cas le plus simple où q = p. Dans ce
cas, la condition pour que F −1 ({0}) soit une fonction (en fait une application
de Rn dans Rp) est que B soit inversible, ou encore que det B /= 0. On notera
que si, pour chaque x ∈ Rn fixé, F (x, ·) désigne l’application (affine) de Rp
dans Rp définie par F (x, ·) = Ax + B(·), alors, pour chaque y ∈ Rp, B est
la dérivée totale de F (x, ·) en y, c’est-à-dire B = (F (x, ·))$y . On doit donc
s’attendre, dans le cas non linéaire, à trouver une hypothèse d’inversibilité
pour (F (x0 , ·))$y0 .
Théorème. Soit F une fonction de Rn × Rp dans Rp , (x0 , y0 ) ∈ dom F,
r0 > 0, R0 > 0 tels que
B2 (x0 ; r0 ) × B2 (y0 ; R0) ⊂ dom F
et tels que les conditions suivantes soient satisfaites.

1. F (x0 , y0 ) = 0 (c’est-à-dire (x0 , y0 ) ∈ F −1 ({0})).
2. La fonction F (., y0 ) : x 2→ F (x, y0 ) est continue en x0 .
3. Pour chaque x ∈ B2 (x0 ; r0 ) la fonction F (x, ·) : y 2→ F (x, y) de Rp dans
Rp est dérivable en chaque y ∈ B2 (y0 ; R0), et, pour chaque 1 ≤ j ≤ p, la
fonction correspondante Dyj F : (x, y) 2→ Dyj F (x, y) de Rn × Rp dans Rp est
continue en (x0 , y0 ).
4. L’application linéaire (F (x0 , ·))$y0 de Rp dans Rp est inversible (c’est-à-dire
le déterminant de la matrice jacobienne correspondante
(Dyj Fk (x0 , y0 ))(1≤j≤p; 1≤k≤p)
est différent de zéro).

Alors il existe r ∈ ]0, r0[ et R ∈ ]0, R0[ tels que la restriction f du graphe
F −1 ({0}) à B2 [x0 ; r]×B2 [y0 ; R] est une application de B2 [x0 ; r] dans B2 [y0 ; R]
continue en x0 .
Démonstration. La première partie de la thèse revient à démontrer l’exis-
tence de r ∈]0, r0[ et R ∈]0, R0[ tels que, pour chaque x ∈ B2 [x0 ; r], l’équation
F (x, y) = 0 (5.12)
en l’inconnue y possède dans B2 [y0 ; R] une solution unique, que l’on notera
alors f (x). La deuxième partie de la thèse revient à prouver que f est
continue en x0 . Nous allons construire, pour chaque x ∈ B2 (x0 , r0) une
fonction de R dans R dont les points fixes y correspondent aux solutions
de (5.12) et pour laquelle le théorème des applications contractantes sera

applicable. Si nous posons L = (F (x0 , ·))$y0 , (L est donc une application
linéaire inversible de Rp dans Rp ), alors pour chaque (x, y) ∈ B2 (x0 ; r0) ×
B2 (y0 ; R0), nous avons
F (x, y) = 0 ⇔ Ly + F (x, y) − Ly = 0 ⇔ y = G(x, y),
si G est la fonction de Rn × Rp de domaine égal à dom F définie par
G(x, y) = −L−1 [F (x, y) − Ly].
Pour chaque x ∈ B2 (x0 ; r0 ), si u ∈ B2 (y0 ; R0) et v ∈ B2 (y0 ; R0 ), l’inégalité de

la moyenne appliqué à la fonction G(x, ·) : y 2→ G(x, y) entraı̂ne l’existence
d’un θ ∈ ]0, 1[ tel que
|G(x, u) − G(x, v)|2 ≤ |(G(x, ·))$v+θ(u−v)(u − v)|2
= |L−1 [(F (x, ·))$v+θ(u−v) − L](u − v)|2

≤ |L−1 |2,2 |[(F (x, ·))$v+θ(u−v) − L](u − v)|2
≤ |L−1 |2,2 |(F (x, ·))$v+θ(u−v) − L|2,2 |u − v|2
 1/2
p
$
−1
= |L |2,2  |Dyj F (x, v + θ(u − v)) − Dyj F (x0 , y0 )|22  |u − v|2 .
j=1
Par l’hypothèse 3, il existe r1 ∈ ]0, r0[ et R ∈ ]0, R0[ tels que, pour tout
(x, y) ∈ B2 [x0 ; r1] × B2 [y0 ; R] et chaque 1 ≤ j ≤ p, on a
1
|Dyj F (x, y) − Dyj F (x0 , y0 )|2 ≤ ,
2p1/2|L−1 | 2,2
et dès lors, si x ∈ B2 [x0 ; r1], u ∈ B2 [y0 ; R], v ∈ B2 [y0 ; R], on aura, pour le θ
donné par le théorème de la moyenne, v + θ(u − v) ∈ B2 [y0 ; R], et dès lors,
1
|G(x, u) − G(x, v)|2 ≤ |u − v|2 ,
2
ce qui montre que, pour chaque x ∈ B2 [x0 ; r1 ], l’application G(x, ·) est lips-
chitzienne de constante 12 sur B2 [y0 ; R]. Pour pouvoir appliquer le théorème
du point fixe de Banach, il faut encore que G(x, ·) soit une application de
B2 [y0 ; R] dans B2 [y0 ; R]. On a, pour tout x ∈ B2 [x0 ; r1 ] et tout y ∈ B2 [y0 ; R],
|G(x, y) − y0 |2 ≤ |G(x, y) − G(x, y0 )|2 + |G(x, y0) − y0 |2

5.6. FONCTIONS IMPLICITES : RÉGULARITÉ 183
= |G(x, y) − G(x, y0 )|2 + |L−1 F (x, y0 )|2
1 R
≤ |y − y0 |2 + |L−1 F (x, y0 )|2 ≤ + |L−1 F (x, y0 )|2 .
2 2
Par l’hypothèse 1, l’hypothèse 2 et la continuité des applications linéaires, il
existe r ∈ ]0, r1] tel que, pour tout x ∈ B2 [x0 ; r], on a
R
|L−1 F (x, y0 )|2 = |L−1 [F (x, y0 ) − F (x0 , y0 )]|2 ≤ ,
2
et dès lors, pour chaque x ∈ B2 [x0 ; r] et chaque y ∈ B2 [y0 ; R], on aura
|G(x, y) − y0 |2 ≤ R,
ce qui montre que G(x, ·) est une application du fermé B2 [y0 ; R] en elle-
même. Le théorème de Banach entraı̂ne donc, pour chaque x ∈ B2 [x0 ; r],
l’existence d’un point fixe unique y ∈ B2 [y0 ; R] de G(x, ·), c’est-à-dire l’exis-
tence d’un unique y = f (x) ∈ B2 [y0 ; R] tel que F [x, f (x)] = 0. Pour x = x0 ,
l’unicité entraı̂ne en particulier que f (x0 ) = y0 . Il reste à montrer que f est
continue en x0 . Si x ∈ B2 [x0 ; r], on a
|f (x) − f (x0 )|2 = |G[x, f (x)] − G[x0 , f (x0 )]|2
= |G[x, f (x)] − G[x, f (x0)] + G(x, y0 ) − G(x0 , y0 )|2
1
≤ |f (x) − f (x0 )|2 + |L−1 [F (x, y0 ) − F (x0 , y0 )]|2.
2
Dès lors,
|f (x) − f (x0 )|2 ≤ 2|L−1 [F (x, y0 ) − F (x0 , y0 )]|2 ,
et comme le second membre tend vers 0 lorsque x tend vers x0 en vertu de

l’hypothèse 2, on voit que f est continue en x0 .
5.6 Fonctions implicites : régularité

Si l’on impose à F des conditions de continuité ou de dérivabilité plus fortes,
on obtient des conditions de continuité ou de dérivabilité plus fortes pour f .
Proposition. Dans les conditions du théorème des fonctions implicites, si

l’on suppose en outre que, pour chaque y ∈ B2 (y0 ; R0 ), la fonction F (·, y) :
x 2→ F (x, y) est continue sur B2 (x0 ; r0 ), alors f est continue sur B2 [x0 ; r].
Démonstration. Il suffit d’imiter la fin de la démonstration du théorème
des fonctions implicites. Si a ∈ B2 [x0 ; r] et x ∈ B2 [x0 ; r], on a
|f (x) − f (a)|2 = |G[x, f (x)] − G[a, f (a)]|2
= |G[x, f (x)] − G[x, f (a)] + G(x, f (a)) − G(a, f (a))|2

1
≤ |f (x) − f (a)|2 + |L−1 [F (x, f (a)) − F (a, f (a))]|2.
2
Dès lors,
|f (x) − f (a)|2 ≤ 2|L−1 [F (x, f (a)) − F (a, f (a))]|2,
et comme le second membre tend vers 0 lorsque x tend vers a en vertu de

l’hypothèse de continuité sur F (·, f (a)), on voit que f est continue en a.
Proposition. Dans les conditions du théorème des fonctions implicites, si

l’on suppose en outre que F est dérivable en (x0 , y0 ), alors f sera dérivable
en x0 et
fx$ 0 = −[(F (x0 , ·))$y0 ]−1 (F (·, y0 ))$x0 .
Démonstration. La dérivabilité de F en (x0 , y0 ) entraı̂ne l’existence d’une
fonction α de Rn ×Rp dans Rp de domaine au moins égal à (dom F −(x0 , y0 ))\
{(0, 0)}, tendant vers zéro lorsque son argument tend vers zéro et telle que
$
F (x0 + h, y0 + l) = F (x0 , y0 ) + F(x 0 ,y0 )
(h, l) + |(h, l)|2α(h, l)
= F (x0 , y0 ) + (F (., y0 ))$x0 (h) + (F (x0 , .))$y0 (l) + |(h, l)|2α(h, l),
pour tout (h, l) ∈ (dom F − (x0 , y0 )) \ {(0, 0)}. Dès lors, si h ∈ Rp est tel que
|h|2 ≤ r $ avec r $ ∈ ]0, r] tel que |f (x0 + h) − f (x0 )|2 ≤ R lorsque |h|2 ≤ r $ (un
tel r $ existe toujours puisque f est continue en x0 ), il résulte de la définition
de f et de l’égalité précédente avec l = f (x0 + h) − f (x0 ) que
0 = (F (·, y0))$x0 (h) + (F (x0 , ·))$y0 (f (x0 + h) − f (x0 ))
+|(h, f (x0 + h) − f (x0 ))|2α[h, f (x0 + h) − f (x0 )];

dès lors, puisque (F (x0 , ·))$y0 est inversible,
f (x0 + h) − f (x0 )
5.6. FONCTIONS IMPLICITES : RÉGULARITÉ 185
= −[(F (x0 , ·))$y0 ]−1 (F (·, y0 ))$x0 (h) + |(h, f (x0 + h) − f (x0 ))|2 β(h)], (5.13)
où β est définie par
β(h) = −[(F (x0 , ·))$y0 ]−1 α (h, f (x0 + h) − f (x0 )) ,
et tend donc vers 0 lorsque h tend vers zéro. En particulier, on peut trouver
un r $$ ∈ ]0, r $] tel que, pour tout 0 < |h|2 ≤ r $$ , on ait
1
|β(h)|2 ≤ ,
2
et dès lors, pour ces mêmes valeurs de h, on déduit de (5.13) que
# #
# #
|f (x0 + h) − f (x0 )|2 ≤ #[(F (x0 , ·))$y0 ]−1 (F (·, y0 ))$x0 (h)#
2
1 1
+ |h|2 + |f (x0 + h) − f (x0 )|2 ,
2 2
c’est-à-dire,
|f (x0 + h) − f (x0 )|2 ≤ 2|[(F (x0, ·))$y0 ]−1 [(F (·, y0 ))$x0 (h)|2 + |h|2 .
f (x0 +h)−f (x0 )
Il en résulte aussitôt que la fonction h 2→ |h|2 est localement bornée
en 0. Dès lors (5.13) peut s’écrire
f (x0 + h) − f (x0 )
#4 5#
# h f (x0 + h) − f (x0 ) ##
= −[(F (x0 , ·))$y0 ]−1 (F (·, y0 ))$x0 (h) + |h|2 ## , # β(h)
|h|2 |h|2 2
= −[(F (x0 , ·))$y0 ]−1 (F (·, y0 ))$x0 (h) + |h|2 γ(h),

où la fonction γ définie par
#4 5#
# h f (x0 + h) − f (x0 ) ##
γ(h) = ## , # β(h),
|h|2 |h|2 2
tend vers 0 lorsque h tend vers 0 comme produit d’une fonction localement
bornée en 0 par une fonction tendant vers zéro. Par la caractérisation de la
dérivabilité totale, f est dérivable en x0 et
fx$ 0 = −[(F (x0 , ·))$y0 ]−1 (F (·, y0 ))$x0 .

Remarque. Lorsque n = p = 1, la formule donnant la dérivée d’une fonc-

tion implicite peut évidemment s’écrire, en termes de dérivées ordinaires
D1 F (x0 , y0 )
f $ (x0 ) = − .
D2 F (x0 , y0 )
En faisant des hypothèses de dérivabilité plus fortes sur F , on obtient
des propriétés correspondantes de dérivabilité pour f .
Proposition. Supposons que, outre les conditions du théorème des fonc-
tions implicites, F soit dérivable en chaque point de B2 (0; r0) × B2 (y0 ; R0)
et que les fonctions (x, y) 2→ Dxi F (x, y), (1 ≤ i ≤ n) et (x, y) 2→ Dyj F (x, y),
(1 ≤ j ≤ p) soient continues sur B2 (0; r0)×B2 (y0 ; R0). Alors il existe r̃ ∈]0, r]
tel que f soit dérivable en chaque point x de B2 (0; r̃) et tel que les fonctions
x 2→ Dif (x), (1 ≤ i ≤ n), soient continues sur B2 (0; r̃).
Démonstration. Par hypothèse, la fonction (x, y) 2→ det(F (x, ·))$y est
continue sur B2 (0; r0) × B2 (y0 ; R0 ) et telle que det(F (x0 , ·)$y0 /= 0. Comme,
en outre, f est continue sur B2 (0; r0), la fonction x 2→ det(F (x, ·))$f (x) est
continue sur B2 (0; r0) et telle que
det(F (x0 , ·))$f (x0) = det(F (x0 , ·))$y0 /= 0.
En conséquence, il existe r̃ ∈ ]0, r0] tel que det(F (x, ·))$f (x) /= 0 pour tout x ∈
B2 (x0 ; r̃) et la Proposition précédente est applicable en un tel x, entraı̂nant
la dérivabilité de f en x et la formule
fx$ = −[(F (x, ·))$f (x)]−1 (F (·, f (x)))$x.
Dès lors, en utilisant les formules reliant dérivée totale et dérivées partielles,
la continuité des dérivées partielles de F et les formules donnant l’inverse et
le produit de deux matrices, on en déduit la continuité des dérivées partielles
Di f, (1 ≤ i ≤ n) en chaque point de B2 (x0 ; r̃).
Remarque. Dans le cas où n = p = 1 et où f est dérivable sur un voisinage
de x0 , la formule donnant la dérivée de f en x peut se retrouver à partir de
l’identité
F (x, f (x)) = 0,
en utilisant le théorème de dérivation d’une fonction composée, qui entraı̂ne
ici
d
0= [F (x, f (x))] = D1 F (x, f (x)) + D2 F (x, f (x))f $(x),
dx
dont on déduit aussitôt
D1 F (x, f (x))
f $ (x) = − .
D2 F (x, f (x))
5.7. FONCTION RÉCIPROQUE 187
5.7 Fonction réciproque

Le théorème des fonctions implicites permet d’étudier l’existence locale et
la régularité de la fonction réciproque d’une fonction de Rp dans Rp. Soit g
une fonction de Rp dans Rp , y0 ∈ dom g, et posons x0 = g(y0 ). Le graphe
de g est l’ensemble
G = {(y, x) ∈ Rp × Rp : y ∈ dom g et x = g(y)}
et le graphe réciproque G−1 est l’ensemble
G−1 = {(x, y) ∈ Rp × Rp : y ∈ dom g et x = g(y)}.
Le problème de l’existence locale de la fonction réciproque de g consiste à

trouver des conditions sous lesquelles la restriction de G−1 à un voisinage de
(x0 , y0 ) est une fonction, qui sera alors la fonction réciproque g −1 de g au
voisinage du point considéré. Si l’on remarque que
G−1 = {(x, y) ∈ Rp × Rp : y ∈ dom g et g(y) − x = 0},
on voit que l’existence de la fonction réciproque de g au voisinage de (x0 , y0 )

n’est rien d’autre que l’existence locale de la fonction implicite correspondant
à F (x, y) = g(y) − x.
Proposition. Soit g une fonction de Rp dans Rp , y0 ∈ dom g, x0 = g(y0 ).
S’il existe R0 > 0 tel que g soit dérivable en chaque point de B2 (y0 ; R0 ) et
tel que, pour chaque 1 ≤ j ≤ p, la fonction y 2→ Dj g(y) soit continue en
y0 , et si gy$ 0 est inversible (c’est-à-dire si det gy$ 0 /= 0), alors il existe r̃ > 0
et R̃ ∈ ]0, R0[ tels que la restriction du graphe G−1 à B2 (x0 ; r̃) × B2 (y0 ; R̃)
soit une application g −1 de B2 (x0 ; r̃) dans B2 (y0 ; R̃) continue sur B2 (x0 ; r̃),
dérivable en y0 et telle que
(g −1 )$x0 = [gg$ −1(x0 ) ]−1 .
Si, en outre, pour chaque 1 ≤ j ≤ p,la fonction y 2→ Dj g(y) est continue sur
B2 (y0 ; R0), alors g −1 est dérivable en chaque point de B2 (x0 ; r̃), telle que
(g −1 )$x = [gg$ −1(x)]−1 ,
et telle que, pour chaque 1 ≤ j ≤ p, la fonction x 2→ Dj g −1 (x) est continue

en chaque point x ∈ B2 (x0 ; r̃).
Démonstration. Il suffit de vérifier que la fonction F définie par F (x, y)
= g(y) − x sur dom F = Rp × dom g vérifie les conditions de régularité
requises par la version du théorème des fonctions implicites correspondant

aux hypothèses de régularité faites et de noter que
(F (x, ·))$y = gy$ , (F (·, y))$x = −I.
Remarque. Lorsque p = 1, la formule donnant la dérivée de la fonction

réciproque de g peut encore s’écrire
1
(g −1 )$ (x0 ) = .
g $ [g(x0)]
Par exemple, si g(y) = y 2 , y0 /= 0 et x0 = y02 , on retrouve la formule bien

connue
1
(g −1 )$ (x0 ) = 1/2 .
2x0
5.8 Théorème de l’application intérieure

Une autre application intéressante du théorème des fonctions implicites est
une version non linéaire de la propriété suivante des applications linéaires. Si
L : Rm → Rp est linéaire et surjective, c’est-à-dire si rang L = p, alors, pour
chaque a ∈ Rm , L(a) est évidemment intérieur à L(Rm ) = Rp; si L n’est
pas surjective, c’est-à-dire si rang L < p, L(Rm ) est un sous-espace vectoriel
propre de Rp et, quel que soit a ∈ Rm , L(a) n’est pas intérieur à L(Rm ),
puisque int L(Rm ) est vide. En d’autres termes, la condition nécessaire et
suffisante pour que L(a) soit intérieur à L(Rm ) est que rang L = p. C’est
la partie suffisante de ce résultat que le théorème des fonctions implicites
permet d’étendre, localement, sous le nom de théorème de l’application
intérieure, à certaines fonctions de Rm dans Rp . Ce théorème donne donc
des conditions sur g pour que l’image par g d’un voisinage de a soit un
voisinage de g(a).
Proposition. Soit a ∈ Rm , r0 > 0 et g une fonction de Rm dans Rp
dérivable en chaque point x ∈ B2 (a; r0) et telle que, pour chaque 1 ≤ j ≤ m,
la fonction x 2→ Dj g(x) soit continue en a. Si m ≥ p et rang ga$ = p, alors
g(a) est intérieur à g[B2 (a; r0)].
Démonstration. Il faut donc trouver un r ∈ ]0, r0[ tel que B2 [g(a); r] ⊂
g[B2 (a; r0)], c’est-à-dire trouver un r ∈ ]0, r0[ tel que, pour chaque v ∈
B2 [g(a); r], il existe un u ∈ B2 (a; r0) tel que g(u) = v. Puisque rang ga$ = p,
5.9. EXTRÉMANTS LIÉS 189
on peut trouver dans {D1 g(a), . . ., Dmg(a)} p éléments formant une famille
libre et, en permutant si nécessaire les indices des variables, on peut, sans
perte de généralité, supposer que les p premiers éléments forment une telle
famille, c’est-à-dire supposer que
det col [D1 g(a), . . ., Dpg(a)] /= 0.
En vertu des hypothèses, si l’on pose
y0 = (a1 , . . . , ap), x0 = (g1 (a), . . ., gp(a), ap+1, . . . , am ),
l’application F définie sur B2 (x0 ; r0 ) × B2 (y0 ; 0) par
F (x, y) = g(y1 , . . . , yp , xp+1 , . . . , xm) − (x1 , . . ., xp)
est telle que,

F (x0 , y0 ) = g(a) − g(a) = 0,
det(F (x0 , ·)$y0 = det col[D1 g(a), . . ., Dpg(a)] /= 0.
Le théorème des fonctions implicites implique donc l’existence d’un r ∈]0, r0[,
d’un R ∈ ]0, r0[ et d’une application f : B2 [x0 ; r] → B2 [y0 ; R] continue en x0
et telle que, pour tout x ∈ B2 [x0 ; r], on ait F (x, f (x)) = 0. En particulier, si
v ∈ B2 [g(a); r] ⊂ Rp , alors (v, ap+1 , . . . , am) ∈ B2 [x0 ; r], et on a donc
F [v, ap+1 , . . . , am , v, f (v, ap+1, . . . , am )] = 0,
c’est-à-dire
v − g[f (v, ap+1, . . . , am ), ap+1 , . . ., am ] = 0,
avec [f (v, ap+1, . . . , am), ap+1 , . . . , am] ∈ B2 (a; r0).
Remarque. Par définition du rang, on a rang ga$ ≤ min{m, p} = p. Dès
lors, le théorème de l’application intérieure implique que si g(a) n’est pas
intérieur à g(B2 (a; r0 )), alors rang ga$ < p.
5.9 Extrémants liés

Le théorème de Fermat a fourni une condition nécessaire pour l’existence
d’un extrémant local libre d’une fonction réelle f . Nous allons montrer que le
théorème des fonctions implicites ou ses conséquences permettent de donner
des conditions nécessaires d’existence pour certains extrémants liés , c’est-à-
dire non intérieurs au domaine de la fonction f . Pour motiver ces conditions,
soient f et g des fonctions de R2 dans R définies sur B2 (a; r0) pour un

certain a ∈ R2 et un certain r0 > 0, et soit E = {(x, y) ∈ R × R : g(x, y) =
0}. On supposera que a ∈ E, c’est-à-dire que g(a) = 0. On veut trouver
une condition nécessaire pour que a soit un extrémant local de f sur E.
Pour fixer les idées, supposons que a soit un maximant local de f sur E,
c’est-à-dire qu’il existe r $ ∈ ]0, r0[ tel que, pour tout (x, y) ∈ B2 (a; r $) ∩ E,
on ait f (x, y) ≤ f (a1 , a2 ). Supposons en outre que f soit dérivable en a,
que g soit dérivable en chaque point x ∈ B2 (a; r0), que D2 g(a1 , a2 ) /= 0 et
que les fonctions (x, y) 2→ D1 g(x, y) et (x, y) 2→ D2 g(x, y) soient continues
en a. Dans ce cas, le théorème des fonctions implicites appliqué à g en a
entraı̂ne l’existence d’un r ∈ ]0, r0[, d’un R ∈ ]0, r0[ et d’une application
e : [a1 − r, a1 + r] → [a2 − R, a2 + R] dérivable en a1 et telle que e soit la
restriction du graphe E sur [a1 − r, a1 + r] × [a2 − R, a2 + R]. En d’autres
termes, si l’on prend r ≤ r $ , on a (x, y) ∈ E ∩ B2 (a; r) si et seulement si
y = e(x) et dès lors
f (x, y) ≤ f (a1 , a2 ), x ∈ E ∩ B2 (a; r),
si et seulement si
f (x, e(x)) ≤ f (a1 , a2 ), x ∈ ]a1 − r, a1 + r[.
Par conséquent, a1 est un maximant local libre de la fonction (de R dans

R) x 2→ f (x, e(x)), qui est dérivable en a1 , et le théorème de Fermat et les
théorèmes de dérivation des fonctions composées et des fonctions implicites
entraı̂nent que
d
0= [f (a1 , e(a1))] = D1 f (a1 , e(a1 )) + D2 f (a1 , e(a1 ))e$ (a1 )
dx
D1 g(a1 , a2 )
= D1 f (a1 , a2 ) − D2 f (a1 , a2) ,
D2 g(a1 , a2 )
c’est-à-dire & '
D1 f (a1 , a2 ) D1 g(a1 , a2 )
det = 0.
D2 f (a1 , a2 ) D2 g(a1 , a2 )
Par conséquent, la famille {fa$ , ga$ } n’est pas libre et il existe donc (µ0 , µ1 )
/= (0, 0) tel que
µ0 fa$ + µ1 ga$ = 0.
On a nécessairement µ0 /= 0 car, si µ0 = 0, alors µ1 ga$ = 0 et donc, puisque
ga$ /= 0, µ1 = 0 ce qui est contradictoire. En divisant les deux membres par
µ0 , la relation précédente s’écrit
fa$ + λ1 ga$ = 0.
Si l’on se souvient que la condition a ∈ E équivaut à g(a) = 0, on voit que

si a est un extrémant local de f sur
E = {(x, y) : g(x, y) = 0},
alors il existe λ1 ∈ R tel que
(Lf,g )$a,λ1 = 0,
où Lf,g est la fonction de Lagrange associée à f et g, c’est-à-dire la fonction

de R3 dans R définie par
Lf,g (x, λ) = f (x) + λg(x).
On constate en effet que
D1 Lf,g (x, λ) = D1 f (x) + λD1 g(x),
D2 Lf,g (x, λ) = D2 f (x) + λD2 g(x),

D3 Lf,g (x, λ) = g(x).
Le nombre λ1 est appelé le multiplicateur de Lagrange relatif à l’extrémant
lié a de f . Si, au lieu de supposer que D2 g(a1, a2 ) /= 0, on suppose que
D1 g(a1 , a2 ) /= 0, on arrive au même résultat en intervertissant le rôle de x
et y dans l’application du théorème des fonctions implicites à g. On obtient
donc la conclusion sous la seule hypothèse que rang ga$ = 1.
On peut généraliser ce résultat à une fonction f de Rn dans R et à une
fonction g de Rn dans Rq . Dans ce cas, il est plus simple d’utiliser, au lieu
du théorème des fonctions implicites, le théorème de l’application intérieure.
Le premier résultat s’appelle la règle des multiplicateurs de Cara-
théodory.
Proposition. Soit f une fonction de Rn dans R, g une fonction de Rn dans
Rq , a ∈ Rn et r > 0 tels que f et g soient définies sur B2 (a; r) et g(a) = 0.
Supposons que f et g soient dérivables en x pour chaque x ∈ B2 (a; r) et
que, pour chaque 1 ≤ j ≤ n, les fonctions x 2→ Dj f (x) et x 2→ Dj g(x) soient
continues en a. Si a est un extrémant local de f sur l’ensemble
E = {x ∈ Rn : g(x) = 0},
alors il existe γ = (γ0 , γ1, . . . , γq ) ∈ Rq+1 \ {0} tel que γ0 ≥ 0 et tel que
q
$
γ0 fa$ + γj (gj )$a = 0,
j=1
c’est-à-dire tel que (a, γ1, . . . , γq) soit un point critique de la fonction Cf,g
de Rn × Rq définie par
q
$
Cf,g (x, γ1, . . . , γq ) = γ0 f (x) + γj gj (x).
j=1
Démonstration. Supposons, pour fixer les idées, que a soit un minimant

local de f sur E, et soit r $ ∈ ]0, r[ tel que
f (a) ≤ f (x) (5.14)
pour tout x ∈ B2 [a; r $] ∩ E. Soit h la fonction de Rn dans Rq+1 définie par

h = (f, g1 , . . . , gq), et soit
W = {(y0 , 0, . . ., 0) ∈ Rq+1 : y0 < f (a)}.
Notons que h(a) = (f (a), 0, . . ., 0). En vertu de (5.14), on a
h(B2 [a; r $ ]) ∩ W = ∅. (5.15)
En conséquence,
h(a) /∈ int h(B2 [a; r $]), (5.16)
car, dans le cas contraire, il existerait r0 > 0 tel que
B2 [h(a); r0] ⊂ h(B2 [a; r $])
et l’on aurait donc, pour k ≥ r10 , (f (a) − k1 , 0, . . ., 0) ∈ h(B2 [a; r $]) ∩ W, ce

qui est impossible par (5.15). Il résulte alors de (5.16) et de la remarque qui
suit le théorème de l’application ouverte que rang h$a < q + 1, c’est-à-dire
qu’il existe γ = (γ0 , γ1, . . . , γq ) ∈ Rq+1 \ {0} tel que
q
$
γ0 fa$ + γj (gj )$a = 0,
j=1
et l’on peut, sans perte de généralité, supposer que γ0 ≥ 0 dans cette égalité
en multipliant, le cas échéant, les deux membres par −1.
Remarque. Les nombres (γ0, γ1 , . . . , γq) s’appellent les multiplicateurs de

Carathéodory et Cf,g la fonction de Carathéodory associés à f et g.
Un cas particulier important de la proposition précédente porte le nom
de règle des multiplicateurs de Lagrange.
Corollaire. Dans les conditions de la proposition précédente, si l’on sup-
pose en outre que
rang ga$ = q,
il existe λ = (λ1 , . . . , λq ) ∈ Rq tel que
q
$
fa$ + λj (gj )$a = 0,
j=1
c’est-à-dire un λ tel que (a, λ) soit un point critique de la fonction Lf,g de

Rn × Rq dans R définie par
q
$
Lf,g (x, λ) = f (x) + λj gj (x) = f (x) + (λ|g(x)).
j=1
Démonstration. Soit γ = (γ0 , γ1 , . . . , γq) ∈ Rq+1 \ {0} donné par la règle

de Caratheodory. Si γ0 = 0, alors (γ1 , . . . , γq) /= 0 et
q
$
γj (gj )$a = 0,
j=1
ce qui contredit l’hypothèse rang ga$ = q. Donc, γ0 /= 0 et la thèse s’en déduit

γ
en posant λj = γj0 , (1 ≤ j ≤ q).
Remarque. Les nombres (λ1 , . . . , λq ) fournis par la proposition précédente
s’appellent les multiplicateurs de Lagrange et Lf,g la fonction de Lagrange
associés à f et g.
Exemple. Cherchons à déterminer les extrémants locaux de la fonction f
de R2 dans R définie par f (x) = |x|2 sur l’ensemble
E = {(x1 , x2 ) ∈ R2 : g(x1, x2 ) = 0},
lorsque, a > 0 et b > 0 étant donnés,

4 52 4 52
x1 x2
g(x1 , x2) = + − 1,
a b
c’est-à-dire les extrémants locaux de la distance entre l’origine et les points

de l’ellipse E. On a
x1 x2
D1 g(x1 , x2 ) = 2 2
, D2 g(x1 , x2 ) = 2 2 ,
a b
et dès lors rang gx$ = 1 pour tout x ∈ E puisque (0, 0) /∈ E. La fonction de
Lagrange est la fonction L = Lf,g définie par
,4 52 4 52 -
x1 x2
L(x, λ) = |x|2 + λ + −1 ,
a b
et ses points critiques sont les solutions du système d’équations

x1 x1
D1 L(x, λ) = + 2λ 2 = 0,
|x|2 a
x2 x2
D2 L(x, λ) = + 2λ 2 = 0,
|x|2 b
4 52 4 52
x1 x2
D3 L(x, λ) = + − 1 = 0.
a b
La résolution de ce système fournit les solutions
4 5 4 5 4 5 4 5
b b a a
0, b, − , 0, −b, − , a, 0, − , −a, 0, − ,
2 2 2 2
dont les deux premières composantes correspondent aux sommets de l’ellipse

E.
5.10 Exercices
1. Montrer que la suite (ak )k∈N dans Rp converge vers a si et seulement
toute sous-suite de (ak )k∈N contient une sous-suite convergeant vers a.
2. Montrer que si la suite (ak )k∈N dans Rp converge vers a, alors a est le
seul point d’accumulation de (ak )k∈N .
3. Utiliser le théorème de Bolzano-Weierstrass pour démontrer le théorème
de Cantor : Si (Bk )k∈N est une suite de fermés bornés emboı̂tés (Bk+1 ⊂ Bk
7
pour tout k ∈ N), alors k∈N Bk est un fermé borné non vide.
4. Utiliser le théorème de Bolzano-Weierstrass pour démontrer le théorème
de Heine (suggestion : procéder par l’absurde).
5.10. EXERCICES 195
5. Soit A : Rn → Rn une application linéaire inversible. Montrer que, pour

toute application linéaire B : Rn → Rn telle que
1
|B|2,2 < ,
|A−1 |2,2
l’application linéaire A + B est inversible. Suggestion : il suffit de montrer

que, pour tout x ∈ Rn , l’équation (A+B)y = x possède une solution unique.
Cette équation est équivalente au problème de point fixe
y = −A−1 By + A−1 x ≡ gx(y),
et l’on a, pour tout y ∈ Rn et tout z ∈ Rn ,
|gx (y) − gx(z)|2 ≤ |A−1 |2,2 |B(y − z)|2 ≤ |A−1 |2,2 |B|2,2 |y − z|2 ,
ce qui montre que gx est contractante sur Rn .

6. Soit f une contraction de Rn dans Rp , de constante de contraction α. On
définit g : Rn → R par
g(x) = |x − f (x)|2 .
Montrer que, pour tout x ∈ Rn , on a
g(x) ≥ (1 − α)|x|2 − |f (0)|2.
En conséquence, il existe y ∈ Rn tel que g(y) ≤ g(x) pour tout x ∈ Rn . En

particulier,
g(y) ≤ g(f (y)) = |f (y) − f (f (y))|2 ≤ α|y − f (y)|2 = αg(y),
ce qui entraı̂ne que g(y) = 0 et donc que y est un point fixe de f . Montrer que
cette nouvelle démonstration du théorème du point fixe de Banach fournit
l’existence d’un point fixe unique de f sous les hypothèses plus générales :
a. |x − f (x)|2 → +∞ si x → ∞.
b. |f (x) − f (y)|2 < |x − y|2 pour tout x /= y dans Rn .
7. Soit
n
$
F : R × Rn+1 → R, (x, a0, a1 , . . . , an ) 2→ ak xk .
k=0
Une racine simple de l’équation (en l’inconnue x)
F (x, a) = 0
est un x ∈ R vérifiant cette équation et tel que F1$ (x, a) /= 0. Utiliser le

théorème des fonctions implicites pour montrer que si x∗ est une racine
simple de l’équation
F (x, a∗ ) = 0,
alors il existe r > 0 et R > 0 et une application continue f : [−r, r] ×
B2 [−R, R] unique tels que, pour chaque a ∈ B2 [−R, R], l’équation
F (x, a)
possède dans [−r, r] la solution unique f (a). (Dépendance continue des so-
lutions d’une équation algébrique par rapport aux coefficients au voisinage
d’une racine simple). Généraliser le résultat aux équations complexes en
utilisant la notion de C-dérivabilité.
8. Montrer que l’application
g : R2 → R2 , (y1 , y2 ) 2→ (exp y1 cos y2 , exp y1 sin y2 ),
vérifie en chaque point (y1 , y2 ) ∈ R2 les conditions du théorème de la fonction

réciproque, mais n’est pas une bijection de R2 sur R2 (noter que g(y1 , y2 +
2kπ) = g(y1 , y2 )) (Caractère local du théorème de la fonction réciproque).
9. Soit a : Rn → R l’application définie par
n $
$ n
a(x) = ajk xj xk ,
j=1 k=1
où les ajk sont des nombres réels tels que
ajk = akj , (1 ≤ j, k ≤ n).
On dit que a est la forme quadratique associée à la matrice symétrique A

d’éléments ajk . En fait, on a, pour tout x ∈ Rn ,
a(x) = (Ax|x).
Comme a est continue sur Rn , elle admet, par le théorème de Weierstrass, un

minimant y et un maximant z sur le fermé borné S = {x ∈ Rn : |x|22 = 1}.
Utiliser la règle des multiplicateurs de Lagrange pour montrer que si l’on
pose
λ1 = a(y), λn = a(z),
alors λ1 et λn sont respectivement la plus petite et la plus grande valeur
propre de A.

Si l’on a à l’intérieur d’une partie bornée du plan une infinité de points
possédant une certaine propriété, alors il existe dans son intérieur ou sur sa
frontière au moins un point tel que dans tout voisinage de ce point il y a une
infinité de points ayant cette propriété.
Si dans une suite de grandeurs
F1 (x), F2(x), F3 (x), . . ., Fn (x), . . ., Fn+r (x),
la différence entre son ne terme Fn (x) et tout terme ultérieur Fn+r (x), aussi
éloigné soit-il du ne , reste plus petite que toute grandeur donnée, si l’on a
pris n suffisamment grand, alors il existe toujours une certaine grandeur
constante, et une seule, dont s’approchent toujours davantage les termes
de cette suite et dont ils peuvent s’approcher d’aussi près que l’on voudra,
lorsqu’on prolonge la suite suffisamment loin.
Soit un système de n équations entre m + n variables
f1 (x1 , . . . , xm, y1 , . . ., yn ) = 0, . . ., fn (x1 , . . . , xm , y1 , . . . , yn ) = 0,
qui sont satisfaites pour la valeur
a1 , . . ., am , b1, . . . , bn,
des variables; supposons que les fonctions f1 , . . . , fn et leurs dérivées par-

tielles du premier ordre soient continues dans un voisinage du point
(a1 , . . ., am , b1, . . . , bn);
finalement supposons que le déterminant :

# #
# ∂f1 ∂f1
... ∂f1 #
# ∂y1 ∂y2 ∂yn #
# ∂f2 ∂f2 ∂f2 #
# ... #
J = ## ∂y1 ∂y2 ∂yn #
# ... ... ... . . . ##
# ∂fn ∂fn ∂fn ##
# ∂y ∂y2 ... ∂y
1 n
ne soit pas nul en ce point. Alors il existe un et un seul système de fonctions

y des variables x:
y1 = ψ1 (x1 , . . . , xm ), . . ., yn = ψn (x1 , . . . , xn ),
définies sur un voisinage du point a1 , . . . , am et qui vérifient identiquement

les équations f1 = 0, . . ., fn = 0 pour les valeurs correspondantes de la
variable x; y1 , . . . , yn sont des fonctions continues, qui prennent au point
a1 , . . . , am les valeurs b1 , . . . , bn et qui possèdent des dérivées partielles pre-
mières.
Giuseppe Peano, 1884
On connaı̂t les beaux résultats obtenus par M. E. Picard dans l’étude des
équations différentielles et des équations aux dérivées partielles, grâce à sa
méthode des approximations successives. Cette méthode s’applique également
avec une grande facilité à la théorie des fonctions implicites. ... Soit f (x, y)
une fonction de deux variables indépendantes réelles x et y, continue dans le
voisinage d’un système de valeurs x0 , y0 , tel que f (x0 , y0 ) = 0. Pour préciser,
nous supposerons que cette fonction est continue dans un domaine D défini
par les inégalités
x0 − a ≤ x ≤ x0 + a, y0 − b ≤ y ≤ y0 + b,
a et b étant deux nombres positifs. Nous admettrons de plus que l’on peut
choisir les nombres a et b assez petits pour que l’on ait
|f (x, y $) − f (x, y $$)| < K|y $ − y $$ |,
x étant une valeur quelconque comprise entre x0 − a et x0 + a, y $ , y $$ étant

de même deux valeurs quelconques de y comprises entre y0 − b et y0 + b, et
K un nombre positif constant plus petit que l’unité. Ces conditions étant
supposées satisfaites, nous allons démontrer que l’équation
y − y0 = f (x, y),
où l’on regarde x comme une variable indépendante et y comme l’inconnue

admet une racine, et une seule, qui tend vers y0 lorsque x tend vers x0 .
Edouard Goursat, 1903

Chapitre 6
Fonctions monotones
6.1 Parties majorées ou minorées

Ce chapitre est consacré à l’étude de propriétés particulières de parties de R
et de fonctions réelles liées à l’existence d’une structure d’ordre sur R.
Définition. Soit E une partie de R et a ∈ R.
On dit que a majore E, ou que a est un majorant de E, ou encore que E est
majoré par a si, pour tout x ∈ E, on a x ≤ a.
On dit que a minore E, ou que a est un minorant de E, ou encore que E est
minoré par a si, pour tout x ∈ E, on a x ≥ a.
Ainsi, n’importe quel réel majore ∅ et n’importe quel réel minore ∅. Il
résulte immédiatement des définitions que si a majore E et si b ≥ a, alors b
majore E et que si a minore E et si b ≤ a, alors b minore E. On désignera par
M (E) l’ensemble des majorants de E et par m(E) l’ensemble des minorants
de E. Chacun de ces ensembles peut être vide : on vérifie aisément que
M ([0, +∞[) = ∅ et m(] − ∞, 0]) = ∅. Lorsque M (E) /= ∅, on dit que E est
majoré, et lorsque m(E) /= ∅, on dit que E est minoré. Ces notions sont
liées à celle d’ensemble borné par le résultat élémentaire suivant.
Proposition. E ⊂ R est borné si et seulement si E est majoré et minoré.
Démonstration. Condition nécessaire. Si r > 0 est tel que E ⊂ B[r] =
[−r, r], alors r majore E et −r minore E.
Condition suffisante. Si a minore E et b majore E, alors, pour tout x ∈ E,
on a |x| ≤ r = max{|a|, |b|}, et E est borné.
Il peut arriver qu’aucun majorant ou aucun minorant d’une partie E de
R n’appartienne à E. C’est le cas par exemple pour E = ]0, 1[. En effet,
199
200 CHAPITRE 6. FONCTIONS MONOTONES
si a ∈ ]0, 1[, c’est-à-dire si 0 < a < 1, alors a ne majore pas ]0, 1[ puisque
a + 1−a
2 > a et appartient à ]0, 1[. On montre de même qu’aucun minorant
de ]0, 1[ n’appartient à ]0, 1[. Il peut aussi arriver qu’un majorant ou un
minorant d’une partie E de R appartienne à E. C’est le cas par exemple
pour E = [0, 1] qui est majoré par 1 et minoré par 0. E ne contiendra pas
d’autre majorant ou d’autre minorant, ainsi que cela résulte de la proposition
suivante.
Proposition. Soit E une partie de R. Il existe au plus un majorant de E
appartenant à E et au plus un minorant de E appartenant à E.
Démonstration. Faisons-la, pour fixer les idées, dans le cas d’un majo-
rant. Si a et b majorent E et appartiennent à E, alors on a b ≤ a et a ≤ b,
et donc a = b.
Cette proposition justifie la définition suivante.
Définition. Soit E une partie de R et a ∈ R. On dit que a est le maximum
ou le plus grand élément de E, et on le note max E, si a ∈ E et a majore
E. On dit que a est le minimum ou le plus petit élément de E, et on le note
min E, si a ∈ E et a minore E.
Notons que, si max E existe, alors, puisque max E ∈ E, on a max E ≤ a
pour tout a ∈ M (E), et max E est donc le plus petit majorant de E. En
d’autres termes,
max E = min M (E).
On montre de même que si min E existe, alors
min E = max m(E).
L’important résultat suivant, qui porte le nom de théorème du supre-

mum montre que si E et M (E) sont non vides, M (E) possède toujours un
minimum. Ainsi, bien qu’une partie non vide et majorée E de R n’ait pas
nécessairement de plus grand élément, l’ensemble de ses majorants possédera
toujours un plus petit élément.
Théorème. Si E est une partie non vide et majorée de R, alors M (E)
possède un minimum.
Démonstration. Soit a ∈ E et b ∈ M (E) tel que b > a. Si M (E) possède
un minimum, ce minimum appartiendra nécessairement à [a, b]. Il faut donc
démontrer que
(∃x ∈ [a, b] ∩ M (E))(∀y ∈ M (E)) : x ≤ y.

6.1. PARTIES MAJORÉES OU MINORÉES 201
Nous procédons par l’absurde et supposons que cette proposition est fausse.
Alors,
(∀x ∈ [a, b] ∩ M (E))(∃yx ∈ M (E)) : x > yx . (6.1)
Définissons dès lors comme suit une jauge δ sur [a, b]. Si x ∈ [a, b] ∩ M (E),
prenons δ(x) = x−y 2 , où yx est donné par (6.1); si x ∈ [a, b] \ M (E), alors
x
il existera z ∈ E tel que zx > x et nous prendrons δ(x) = zx2−x . Soit

A j j xB
Π = (x , I ) 1≤j≤m une P-partition δ-fine de ]a, b], numérotée de telle sorte
que si I j = ]aj−1 , aj ], alors
a = a0 < a1 < . . . < am−1 < am = b.

zxj −xj
Par le choix de la jauge, si xj /∈ M (E), alors δ(xj ) = 2 pour un certain
zxj > xj appartenant à E et dès lors
zxj + xj
aj ≤ xj + δ(xj ) = < zxj ∈ E,
2
ce qui entraı̂ne que [aj−1 , aj ] ∩ M (E) = ∅. D’autre part, si xj ∈ M (E), alors

yxj −xj
δ(xj ) = 2 pour un certain yxj < xj appartenant à M (E) et dès lors
yxj + xj
aj−1 ≥ xj − δ(xj ) = > yxj ∈ M (E),
2
c’est-à-dire [aj−1 , aj ] ⊂ M (E) \ E. Comme b ∈ [am−1 , am ] ∩ M (E), on a

nécessairement, xm ∈ M (E) et donc [am−1 , am ] ⊂ M (E) \ E. Mais alors
xm−1 ∈ M (E) et le même raisonnement entraı̂ne que [am−2 , am−1 ] ⊂ M (E)\
E. En continuant de proche en proche, on en conclut finalement que [a0 , a1 ] ⊂
M (E) \ E, ce qui est contradictoire, puisque a0 = a ∈ E.
Définition. Soit E une partie non vide de R. Si E est non vide et majorée,
on appelle supremum de E, et l’on note sup E, le minimum de M (E), c’est-
à-dire le plus petit majorant de E. Si E est non vide et non majoré, on
pose, par extension, sup E = +∞. Si E est vide, on pose, par extension,
sup E = −∞.
Le résultat suivant fournit trois caractérisations du supremum.

Proposition. Soit E une partie non vide et majorée de R. Les quatre

propriétés suivantes sont équivalentes.
1. x = sup E.
2. (∀y ∈ E) : y ≤ x et (∀! > 0)(∃z ∈ E) : x − ! < z.
3. x ∈ adh E ∩ M (E).
4. x ∈ M (E) et il existe une suite (zk )k∈N dans E qui converge vers x.
Démonstration. a. 1 ⇔ 2. x = sup E équivaut à x ∈ M (E) et x =
min M (E), c’est-à-dire
(∀y ∈ E) : y ≤ x et (∀! > 0) : x − ! /∈ M (E),
ce qui équivaut à
(∀y ∈ E) : y ≤ x et (∀! > 0)(∃z ∈ E) : z > x − !.
2 ⇔ 3. Conséquence immédiate de la définition de l’adhérence.

3 ⇔ 4. Résulte de la caractérisation de l’adhérence par les suites.
Si E et F sont deux parties de R et si c ∈ R, on posera
E + F = {x + y : x ∈ E et y ∈ F },
et
cE = {cx : x ∈ E}.
Lorsque E = {a}, on écrira a + F au lieu de {a} + F et si c = −1, on
écrira −E au lieu de (−1)E. On a évidemment E + F = F + E et l’on se
gardera de confondre E + F avec E ∪ F . Ainsi [0, 1] + [0, 1] = [0, 2] alors que
[0, 1] ∪ [0, 1] = [0, 1].
Les propositions suivantes sont des conséquences faciles des propriétés
élémentaires des inégalités et des définitions.
Proposition. Si E ⊂ R et a ∈ R, alors a majore E si et seulement si −a
minore −E. En d’autres termes, M (E) = −m(−E).
Proposition. Si E ⊂ R possède un maximum (resp. un minimum), alors,

pour tout c ≥ 0, cE possède un maximum (resp. un minimum) et
max(cE) = c max E, (resp. min(cE) = c min E).
Démonstration. c max E (resp. c min E) appartient à cE et majore (resp.

minore) cE.
6.1. PARTIES MAJORÉES OU MINORÉES 203
Proposition. Si E ⊂ R possède un maximum (resp. un minimum), alors

−E possède un minimum (resp. un maximum) et
min(−E) = − max E, (resp. max(−E) = − min E.
Démonstration. − max E (resp. − min E) appartient à −E et minore

(resp. majore) −E.
Ces résultats permettent de déduire aisément du théorème du supremum
le théorème de l’infimum.
Théorème. Si E est une partie non vide et minorée de R, alors m(E)
possède un maximum et max m(E) = − sup(−E).
Démonstration. E étant non vide et minoré, −E est non vide et majoré,
et dès lors min M (−E) existe. Comme M (−E) = −m(E), on en déduit que
m(E) possède un maximum et que
max m(E) = − min[−m(E)] = − min[M (−E)] = − sup(−E).
Ce résultat et l’unicité du maximum conduisent à la définition suivante.

Définition. Soit E une partie non vide de R. Si E est non vide et minorée,
on appelle infimum de E, et l’on note inf E, le maximum de m(E), c’est-
à-dire le plus grand minorant de E. Si E est non vide et non minoré, on
pose, par extension, inf E = −∞. Si E est vide, on pose, par extension,
inf E = +∞.
Le théorème de l’infimum affirme donc que si E est une partie non vide
et minorée de R, alors
inf E = − sup(−E).
On en déduit aussitôt que si E est une partie non vide et majorée de R,
alors
sup E = − inf(−E).
En combinant le théorème de l’infimum avec les caractérisations du supre-
mum, on obtient trois caractérisations de l’infimum.
Proposition. Soit E une partie non vide et minorée de R. Les quatre
propriétés suivantes sont équivalentes.
1. x = inf E.
2. (∀y ∈ E) : y ≥ x et (∀! > 0)(∃z ∈ E) : z < x + !.
3. x ∈ adh E ∩ m(E).
4. x ∈ m(E) et il existe une suite (zk )k∈N dans E qui converge vers x.
Une conséquence immédiate mais très utile des définitions de supremum
et d’infimum est la règle de passage au supremum ou à l’infimum
dans une inégalité.
Proposition. Soit E une partie non vide de R et c ∈ R. Si, pour tout
x ∈ E, on a x ≤ c, alors sup E existe et sup E ≤ c. Si, pour tout x ∈ E, on
a x ≥ c, alors inf E existe et inf E ≥ c.
Démonstration. Faisons-la, pour fixer les idées, dans le cas du supremum.
Par hypothèse, c majore E et dès lors sup E existe. Comme il est le plus
petit des majorants de E, on a nécessairement sup E ≤ c.
Etudions maintenant le comportement du supremum et de l’infimum par
rapport aux opérations d’inclusion, d’homothétie et d’addition introduites
sur les ensembles.
Proposition. Soient E et F deux parties non vides et majorées de R et
soit c ≥ 0. On a les propriétés suivantes.
1. Si E ⊂ F , alors sup E ≤ sup F .
2. sup(cE) = c sup E.
3. sup(E + F ) = sup E + sup F.
Démonstration. 1. Si x ∈ E, alors x ∈ F et donc x ≤ sup F ; on déduit
de la proposition précédente que sup E existe et que sup E ≤ sup F.
2. Si c = 0, cE = {0} et le résultat est évident; si c > 0, alors M (cE) =
cM (E) et
sup(cE) = min M (cE) = min[cM (E)] = c min M (E) = c sup E.
3. Soit x ∈ E + F ; alors x = y + z avec y ∈ E et z ∈ F et dès lors
x ≤ sup E + sup F ; en conséquence,
sup(E + F ) ≤ sup E + sup F.
Soient maintenant x ∈ E et y ∈ F ; alors x + y ∈ E + F , et dès lors
y + z ≤ sup(E + F ). En particulier, z étant fixé dans F , on a, pour chaque
y ∈ E, y ≤ sup(E + F ) − z, et dès lors sup E ≤ sup(E + F ) − z. Par
conséquent, pour chaque z ∈ F , on a z ≤ sup(E + F ) − sup E, ce qui
entraı̂ne que sup F ≤ sup(E + F ) − sup E, c’est-à-dire
sup E + sup F ≤ sup(E + F ).
6.2. INTERVALLES 205
Proposition. Soient E et F deux parties non vides et minorées de R et

soit c ≥ 0. On a les propriétés suivantes.
1. Si E ⊂ F , alors inf E ≥ inf F .
2. inf(cE) = c inf E.
3. inf(E + F ) = inf E + inf F.
Démonstration. Elle est analogue à celle de la proposition précédente.
On peut aussi utiliser les relations entre infimum et supremum.
6.2 Intervalles
Les résultats des sections précédentes nous permettent de déterminer la
structure des intervalles de la droite réelle.
Définition. On dit qu’une partie non vide I de R est un intervalle si I n’est
pas un singleton et si
(∀x ∈ I)(∀y ∈ I : y > x)(∀z ∈ R : x ≤ z ≤ y) : z ∈ I.
En d’autres termes, un intervalle est une partie de R différente du vide

et d’un singleton qui, dès qu’elle contient deux réels distincts, contient tous
les réels compris entre ces deux nombres.
Proposition. Si I ⊂ R est un intervalle et est minoré et majoré, alors
] inf I, sup I[ ⊂ I ⊂ [inf I, sup I].
Démonstration. Pour chaque x ∈ I, on a évidemment x ≥ inf I et

x ≤ sup I, et l’inclusion de droite s’en déduit aussitôt. Soit maintenant x ∈
] inf I, sup I[. Comme x > inf I, il existe, par la caractérisation de l’infimum,
y ∈ I tel que inf I < y < x, et, comme x < sup I, il existe, par la ca-
ractérisation du supremum, z ∈ I tel que x < z < sup I. Comme I est un
invervalle, on en déduit que x ∈ I.
Corollaire. Si I ⊂ R est un intervalle et est minoré et majoré, alors int I =

] inf I, sup I[ et adh I = [inf I, sup I].
Démonstration. Passer à l’intérieur et à l’adhérence dans les inclusions
précédentes.
Les intervalles minorés et majorés sont donc les intervalles ouverts, semi-
ouverts ou fermés I = ]a, b[, I = ]a, b], I = [a, b[, I = [a, b] de R, et a =
inf I, b = sup I.
Proposition. Si I ⊂ R est un intervalle majoré et non minoré, alors

] − ∞, sup I[ ⊂ I ⊂ ] − ∞, sup I].
Démonstration. Pour tout x ∈ I, on a x ≤ sup I, et l’inclusion de droite
s’en déduit. Si x ∈ ] − ∞, sup I[, alors x < sup I et, par la caractérisation
du supremum, il existe z ∈ I tel que x < z < sup I. D’autre part, comme I
n’est pas minoré, x ne minore pas I et il existe donc y ∈ I tel que y < x.
Comme I est un intervalle, x ∈ I et l’inclusion de gauche est démontrée.
Une démonstration tout à fait analogue fournit le résultat suivant.
Proposition. Si I ⊂ R est un intervalle minoré et non majoré, alors
] inf I, +∞[ ⊂ I ⊂ [inf I, +∞[.
On en déduit évidemment l’analogue du Corollaire ci-dessus.
Corollaire. Si I ⊂ R est un intervalle majoré et non minoré, alors
int I = ] − ∞, sup I[, adh I = ] − ∞, sup I].
Si I ⊂ R est un intervalle minoré et non majoré, alors
int I = ] inf I, +∞[, adh I = [inf I, +∞[.
Les intervalles de I minorés et non majorés sont donc les intervalles non
majorés ouverts ou fermés ]a, +∞[, [a, +∞[, avec a = inf I, et les intervalles
de I majorés et non minorés sont donc les intervalles non minorés ouverts
ou fermés ] − ∞, a[, ] − ∞, a] avec a = sup I.
Enfin, il n’existe qu’un intervalle de R non minoré et non majoré.
Proposition. Si I est un intervalle non minoré et non majoré de R, alors
I = R.
Démonstration. Soit x ∈ R; comme I n’est pas minoré, il existe y ∈ I
tel que y < x, et comme I n’est pas majoré, il existe z ∈ I tel que x < z. I
étant un intervalle, on en déduit que x ∈ I.
Cette proposition conduit à la notation alternative ] − ∞, +∞[ pour R.
La définition de majorant d’une partie E de R entraı̂ne immédiatement
que, si E est non vide et majoré, alors M (E) est un intervalle non majoré
de R. Le théorème du supremum précise ce résultat en affirmant que M (E)
est l’intervalle fermé [sup E, +∞[. De même, la définition de minorant d’une
partie E de R entraı̂ne que, si E est non vide et minorée, alors m(E) est un
intervalle non minoré de R. Le théorème de l’infimum précise ce résultat en
affirmant que m(E) est l’intervalle fermé ] − ∞, inf E].
6.3. APPLICATIONS RÉELLES 207
6.3 Applications réelles

Soit A un ensemble quelconque (n’appartenant pas nécessairement à Rn ) et
f une application de A dans R. On dit alors que f est une application réelle.
Rappelons qu’on désigne par f (A) la partie de R définie par
f (A) = {f (x) : x ∈ A}.
L’application à f (A) des notions que nous venons d’introduire pour les par-
ties de R conduit à la terminologie suivante.
Définition. On dit que f est majorée (resp. minorée) sur A si f (A) est ma-
jorée (resp. minorée). Si f est majorée (resp. minorée) sur A, le supremum
(resp. l’infimum) de f sur A est le nombre réel noté
sup f ou sup f (x) (resp. inf f ou inf f (x)),

A x∈A A x∈A
et défini par
sup f = sup f (A) = sup{f (x) : x ∈ A}
A
(resp. inf f = inf f (A) = inf{f (x) : x ∈ A}).
A
Si f n’est pas majorée sur A, on écrira supA f = +∞ et si f n’est pas
minorée sur A, on écrire inf A f = −∞.
Lorsque supA f ∈ f (A), c’est-à-dire lorsqu’il existe x ∈ A tel que f (x) =
supA f , ou encore lorsque sup f (A) = max f (A), on dit qu’il est le maximum
de f sur A, et l’on écrit
max f ou max f (x).

A x∈A
Le point x ∈ A tel que f (x) = maxA f est alors appelé un maximant de f

sur A. De même, lorsque inf A f ∈ f (A), c’est-à-dire lorsqu’il existe x ∈ A
tel que f (x) = inf A f , ou encore lorsque inf f (A) = min f (A), on dit qu’il
est le minimum de f sur A, et l’on écrit
min f ou min f (x).

A x∈A
Le point x ∈ A tel que f (x) = minA f est alors appelé un minimant de

f sur A. Cette terminologie et ces notations sont compatibles avec celles
introduites précédemment pour une fonction de Rn dans R.
Si f et g sont deux applications de A dans R, si c ∈ R, et si l’on définit
l’application f +g de A dans R par (f +g)(x) = f (x)+g(x) pour chaque x ∈ A
et l’application cf de A dans R par (cf )(x) = c[f (x)] pour chaque x ∈ A,

avec la notation −f au lieu de (−1)f lorsque c = −1, on déduit aisément
des définition ci-dessus et des propriétés de l’infimum et du supremum d’une
partie de R les résultats suivants.
Proposition. Soit f une application majorée (resp. minorée) de A dans R.
On a les propriétés suivantes.
1. −f est minorée (resp. majorée) sur A et supA f = − inf A (−f ). (resp.
supA (−f ) = − inf A f ).
2. Si B ⊂ A, alors supB f ≤ supA f (resp. inf B f ≥ inf A f ).
3. Si g est une application de A dans R telle que, pour tout x ∈ A, on a
g(x) ≤ f (x) (resp. g(x) ≥ f (x)), alors g est majorée (resp. minorée) sur A
et
sup g ≤ sup f (resp. inf g ≥ inf f ).
A A A A
4. Si g est une application majorée (resp. minorée) sur A, alors f + g est

majorée (resp. minorée) et
sup(f + g) ≤ sup f + sup g (resp. inf f + inf g ≤ inf (f + g)).
A A A A
Si, en outre, g est minorée (resp. majorée) sur A, alors

sup f + inf f ≤ sup(f + g) (resp. inf (f + g) ≤ inf f + sup g).
A A A A A A
Remarque. On notera que les inégalités dans la partie 4 de la proposition
précédente sont les meilleures possibles et qu’on n’a pas en général les égalités
correspondantes (c’est essentiellement dû au fait que
(f + g)(A) = {f (x) + g(x) : x ∈ A}
est en général strictement inclus dans
f (A) + g(A) = {f (x) + g(y) : x ∈ A et y ∈ A}).
Par exemple, si A = [0, 1], f = I, g = −I, alors f + g = 0 et dès lors
inf (f + g) = 0 = sup(f + g),
[0,1] [0,1]
et
sup f = 1, inf f = 0, inf g = −1, sup g = 0.
[0,1] [0,1] [0,1] [0,1]
On déduit facilement des caractérisations du supremum et de l’infimum
d’une partie de R des caractérisations du supremum et de l’infimum
d’une application réelle.
6.4. FONCTIONS MONOTONES 209
Proposition. Soit A un ensemble non vide et f une application de A dans

R. Alors a = supA f si et seulement si l’une des deux conditions suivantes
est réalisée.
1. (∀x ∈ A : f (x) ≤ a) et (∀! > 0)(∃y ∈ A) : f (y) > a − !.
2. (∀x ∈ A : f (x) ≤ a) et il existe une suite (yk )k∈N dans A telle que
(f (yk ))k∈N converge vers a.
Une suite (yk )k∈N telle que (f (yk ))k∈N converge vers supA f est appelée
une suite maximisante pour f sur A.
Proposition. Soit A un ensemble non vide et f une application de A dans
R. Alors a = inf A f si et seulement si l’une des deux conditions suivantes
est réalisée.
1. (∀x ∈ A : f (x) ≥ a) et (∀! > 0)(∃y ∈ A) : f (y) < a + !.
2. (∀x ∈ A : f (x) ≥ a) et il existe une suite (yk )k∈N dans A telle que
(f (yk ))k∈N converge vers a.
Une suite (yk )k∈N telle que (f (yk ))k∈N converge vers inf A f est appelée
une suite minimisante pour f sur A.
6.4 Fonctions monotones

Nous allons étudier dans cette section les fonctions de R dans R qui préser-
vent (ou qui renversent) l’ordre sur R.
Définition. Soit f une fonction de R dans R et E ⊂ dom f . On dit que f
est croissante sur E si
(∀x ∈ E)(∀y ∈ E) : (x − y)[f (x) − f (y)] ≥ 0.
On dit que f est décroissante sur E si
(∀x ∈ E)(∀y ∈ E) : (x − y)[f (x) − f (y)] ≤ 0.
On dit que f est monotone sur E si f est croissante sur E ou est décroissante
sur E. On dit que f est strictement croissante sur E si
(∀x ∈ E)(∀y ∈ E : y /= x) : (x − y)[f (x) − f (y)] > 0.
On dit que f est strictement décroissante sur E si
(∀x ∈ E)(∀y ∈ E : y /= x) : (x − y)[f (x) − f (y)] < 0.

On dit que f est strictement monotone sur E si f est strictement croissante

sur E ou est strictement décroissante sur E.
Remarques. 1. On vérifiera aisément que les définitions ci-dessus sont
équivalentes aux suivantes :
f est croissante (resp. décroissante) sur E si et seulement si
(∀x ∈ E)(∀y ∈ E : y ≥ x) : f (y) ≥ f (x) (resp. f (y) ≤ f (x)).
f est strictement croissante (resp. strictement décroissante) sur E si et

seulement si
(∀x ∈ E)(∀y ∈ E : y > x) : f (y) > f (x) (resp. f (y) < f (x)).
Une fonction croissante (resp. strictement croissante) sur E préserve donc

l’ordre (resp. l’ordre strict) sur E.
2. Il résulte aussitôt des définitions que f est croissante (resp. strictement
croissante) sur E si et seulement si −f est décroissante (resp. strictement
décroissante) sur E. En outre, si f est croissante (resp. décroissante, stricte-
ment croissante, strictement décroissante) sur E et si F ⊂ E, alors f est
croissante (resp. décroissante, strictement croissante, strictement décrois-
sante) sur F .
Exemples. 1. Toute application constante de R dans R est à la fois crois-
sante et décroissante sur R.
2. L’identité sur R est strictement croissante sur R.
3. L’application partie entière définie sur R par
E(x) = [x] = le plus grand entier inférieur ou égal à x
est croissante sur R.

Ce dernier exemple, qui est discontinu en chaque entier, montre qu’une
fonction croissante n’est pas nécessairement continue. Toutefois, elle possède
en chaque point une limite à gauche et une limite à droite dans E.
Proposition. Soit E ⊂ R, f une fonction de R dans R telle que E ⊂ dom f ,
a ∈ E ∩ adh Ea− ∩ adh Ea+ , où
Ea− = {x ∈ E : x < a}, Ea+ = {x ∈ E : x > a}.
Si f est croissante sur E, alors
lim f (x) = sup f ≤ f (a) ≤ lim f (x) = inf f.

x→a, x∈Ea− Ea− x→a, x∈Ea+ Ea+
Si f est décroissante sur E, alors
lim f (x) = inf f ≥ f (a) ≥ lim f (x) = sup f.

x→a, x∈Ea− Ea− x→a, x∈Ea+ Ea+
Démonstration. Il suffit de démontrer le résultat pour une fonction crois-

sante et de l’appliquer à −f si f est décroissante. Nous ne considérerons que
le cas de la limite limx→a, x∈Ea− f (x), l’autre étant similaire. Puisque f est
croissante sur E, on a, pour tout x ∈ Ea− , f (x) ≤ f (a); donc f est majorée
sur Ea− , supEa− f existe et supEa− f ≤ f (a). Posons b = supEa− f et soit ! > 0;
en vertu de la caractérisation du supremum, on a
(∀x ∈ Ea− : f (x) ≤ b) et (∃y ∈ Ea− ) : b − ! < f (y).
En posant δ = a − y > 0 et en utilisant, dans ces inégalités, la croissance de

f , on trouve que
(∀x ∈ Ea− : x ≥ a − δ) : b − ! < f (a − δ) ≤ f (x) ≤ b,
et dès lors
(∀x ∈ Ea− : |x − a| ≤ δ) : |f (x) − b| ≤ !.
On a des résultats analogues si x tend vers le supremum ou l’infimum de

E. Lorsque, le cas échéant, f n’est pas majorée ou n’est pas minorée sur E,
les limites correspondantes sont évidemment des limites infinies.
Proposition. Soit E une partie non vide de R et f une fonction de R dans
R définie sur E.
1. Si E est majoré, a = sup E /∈ E et f croissante sur E, alors
lim f (x) = sup f.

x→a, x∈E E
2. Si E est majoré, a = sup E /∈ E et f décroissante sur E, alors
lim f (x) = inf f.

x→a, x∈E E
3. Si E est minoré, a = inf E /∈ E et f croissante sur E, alors
lim f (x) = inf f.

x→a, x∈E E
4. Si E est minoré, a = inf E /∈ E et f est décroissante sur E, alors

lim f (x) = sup f.
x→a, x∈E E
Démonstration. Nous la ferons pour le premier cas, le troisième étant
semblable et les deux autres s’en déduisant en appliquant les résultats à
−f. Nous supposerons également que f est majorée sur E, l’autre cas étant
semblable. Notons tout d’abord que a = sup E entraı̂ne que a ∈ adh E.
Comme f est majorée sur E, supE f existe et l’on posera b = supE f . Si
! > 0 est donné, alors la caractérisation du supremum entraı̂ne que
(∀x ∈ E : f (x) ≤ b) et (∃y ∈ E) : b − ! < f (y).
Comme a /∈ E, on a y < a et, en posant δ = a − y > 0, on déduit des
inégalités précédentes et de la croissance de f que
(∀x ∈ E : x ≥ a − δ) : b − ! < f (a − δ) ≤ f (x) ≤ b,
et dès lors
(∀x ∈ E : |x − a| ≤ δ) : |f (x) − b| ≤ !.
On a des résultats analogues pour les limites vers +∞ ou −∞ lorsque

E est non majoré ou non minoré. Les démonstrations sont laissées comme
exercice au lecteur.
Proposition. Soit E une partie non vide de R et f une fonction de R dans
R définie sur E.
1. Si E est non majoré et f croissante sur E, alors
lim f (x) = sup f.
x→+∞, x∈E E
2. Si E est non majoré et f décroissante sur E, alors
lim f (x) = inf f.
x→+∞, x∈E E
3. Si E est non minoré et f croissante sur E, alors

lim f (x) = inf f.
x→−∞, x∈E E
4. Si E est non minoré et f est décroissante sur E, alors

lim f (x) = sup f.
x→−∞, x∈E E
On peut évidemment considérer le cas particulier où f est une suite
réelle (ak )k∈N. Notons tout d’abord la caractérisation simple suivante des
suites croissantes ou décroissantes.
Proposition. Soit (ak )k∈N une suite réelle. Alors (ak )k∈N est croissante
(resp. décroissante) si et seulement si, pour tout k ∈ N, on a
ak+1 ≥ ak (resp. ak+1 ≤ ak ).
En outre, (ak )k∈N est strictement croissante (resp. strictement décroissante)

si et seulement si, pour tout k ∈ N, on a
ak+1 > ak (resp. ak+1 < ak ).
Démonstration. Nous la ferons dans le cas où (ak )k∈N est croissante,
l’autre s’y ramenant par changement de signe.
Condition nécessaire. Soit k ∈ N; en prenant x = k + 1 et y = k dans la
définition, on trouve ak+1 − ak ≥ 0 dans le cas croissant et ak+1 − ak > 0
dans le cas strictement croissant.
Condition suffisante. Soient r ≥ q des entiers naturels; alors
ar − aq = ar − ar−1 + ar−1 − ar−2 + . . . + aq+1 − aq ≥ 0,
l’inégalité étant stricte si ak+1 > ak pour chaque k ∈ N. Donc (ak )k∈N est
croissante ou strictement croissante selon le cas.
Exemples. 1. La suite ( k+1 1

)k∈N est strictement décroissante.
2. Si a > 0, la suite (a )k∈N est strictement croissante si a > 1, strictement
k
décroissante si a ∈ ]0, 1[ et à la fois croissante et décroissante si a = 0 et

a = 1.
L’application des propositions précédentes au cas d’une suite fournit le
résultat suivant, où les limites peuvent être des limites infinies.
Corollaire. Soit (ak )k∈N une suite réelle. Si (ak )k∈N est croissante, alors
lim ak = sup ak .
k→∞ k∈N
Si (ak )k∈N est décroissante, alors
lim ak = inf ak .
k→∞ k∈N
On en déduit une caractérisation de la convergence des suites

monotones.
Corollaire. Une suite réelle croissante converge si et seulement si elle est

majorée, auquel cas
lim ak = sup ak .
k→∞ k∈N
Une suite réelle décroissante converge si et seulement si elle est minorée,
auquel cas
lim ak = inf ak .
k→∞ k∈N
Démonstration. La condition suffisante résulte du Corollaire précédent.
Pour la condition nécessaire, en considérant le cas d’une suite croissante
convergente et en appelant a sa limite, on a, en prenant par exemple ! = 1
dans la définition de convergence :
(∃m ∈ N)(∀k ≥ m) : ak ≤ a + 1.
Dès lors, pour tout k ∈ N, on aura
ak ≤ max{a1 , a2 , . . . , am−1 , a + 1},
et (ak )k∈N est majorée.
6.5 Fonction exponentielle

Nous allons introduire dans cette section l’une des plus importantes des
fonctions élémentaires, la fonction exponentielle. Nous aurons besoin plusi-
eurs fois des inégalités élémentaires suivantes.
Lemme. Si α ≥ β ≥ 0, on a, pour tout entier k ≥ 1,
(α − β)(k + 1)β k ≤ αk+1 − β k+1 ≤ (α − β)(k + 1)αk ,
avec des inégalités strictes si α > β > 0.

Démonstration. En effet, on a l’identité
k
$
αk+1 − β k+1 = (α − β) αk−j β j ,
j=0
et les inégalités s’en déduisent aussitôt puisque, pour chaque 0 ≤ j ≤ k, on

a
β k ≤ αk−j β j ≤ αk ,
avec des inégalités strictes si α > 0, β > 0 et j > 0.
6.5. FONCTION EXPONENTIELLE 215
Pour chaque x ∈ R et chaque k ∈ N∗ , posons

4 5k
x
fk (x) = 1 + .
k
En particulier, fk (0) = 1 pour tout k ∈ N∗ et dès lors
lim fk (0) = 1.
k→∞
Proposition. Pour chaque x > 0 fixé, la suite réelle (fk (x))k∈N∗ est stricte-
ment croissante et majorée.
Démonstration. En appliquant l’inégalité de droite du lemme à α = 1+ xk
et β = 1 + k+1
x
, on trouve
4 5k+1 4 5k+1
x x
fk+1 (x) = 1 + > 1+
k+1 k
4 5k 4 5 4 5k
x x x x
−(k + 1) 1 + 1+ −1− = 1+ = fk (x),
k k k+1 k
et (fk (x))k∈N∗ est strictement croissante. D’autre part, en appliquant la
même inégalité à α = 1 + mk
x
, β = 1, où m ≥ 1 est un entier, on obtient
4 5k+1 4 5k 4 5k 4 5
x x x x x
1> 1+ − (k + 1) 1+ = 1+ 1− .
mk mk mk mk m
Dès lors, si m ≥ 2x, est fixé, (par exemple m = [2x] + 1, avec [2x] la partie
entière de 2x), on trouve
4 5k
1 x
1> 1+ ,
2 mk
c’est-à-dire 4 5k
x
1+ < 2.
mk
Par conséquent, pour tout k ∈ N∗ , on a
4 5mk
x
fmk (x) = 1 + < 2m .
mk
Pour chaque j ∈ N∗ , il existe k ∈ N∗ tel que
(k − 1)m ≤ j ≤ km,
et, en utilisant la croissance de (fk (x))k∈N∗ , on en déduit que, pour tout

j ∈ N∗ , on a
fj (x) ≤ fkm (x) < 2m .
Donc (fk (x))k∈N∗ est majorée et, en particulier, pour tout k ≥ 1 et tout
x > 0, on a fk (x) ≤ 2[2x]+1 .
Le critère de convergence d’une suite monotone donné dans la section
précédente entraı̂ne que, pour chaque x > 0, la suite (fk (x))k∈N∗ converge
et l’on posera (lire exponentielle de x)
4 5k
x
exp x = lim fk (x) = lim 1+ .
k→∞ k→∞ k
On a évidemment exp x > 1 pour tout x > 0. On posera e = exp 1.

Proposition. Si x < 0, alors (fk (x))k∈N∗ converge vers 1
exp(−x) .
Démonstration. Si x < 0, alors x = −|x| et, pour tout k ∈ N∗ , on a

8 9
4 5k 4 5k |x|2 k
x |x| 1− k2
1+ = 1− = 8 9 .
k k |x| k
1+ k
|x|2
En prenant α = 1, β = 1 − (k+1)2 , dans l’inégalité de droite du lemme et
k + 1 ≥ |x|, on obtient
& 'k+1
|x|2 |x|2 |x|2
1> 1− > 1 − (k + 1) =1− ,
(k + 1)2 (k + 1) 2 k+1

& 'k
|x|2
lim 1− 2 = 1,
k→∞ k
et dès lors, par l’égalité ci-dessus et la proposition précédente, que

4 5k
x 1 1
lim 1+ = = .
k→∞ k exp |x| exp(−x)
Cette proposition nous conduit à poser, pour chaque x < 0,

1
exp x = .
exp(−x)
Définition. La fonction exponentielle est l’application de R dans R définie
par
4 5
x k
exp : R → R, x 2→ lim 1 + .
k→∞ k
Corollaire. Pour tout x > 0 et tout k ∈ N∗ , on a
4 5k
x
exp x ≥ 1 + ,
k
pour tout x < 0 et tout k ∈ N∗ , on a
4 5−k
x
exp x ≤ 1 −
k
et, pour tout x ∈ R, on a
(exp x).[exp(−x)] = exp 0 = 1.
Démonstration. La première partie est une conséquence immédiate de la

définition. Si x < 0, la proposition précédente montre que
1
(exp x).[exp(−x)] = .[exp(−x)] = 1 = exp 0.
exp(−x)
Si x > 0, alors
(exp x).[exp(−x)] = [exp(−x)].[exp[−(−x)]] = exp 0,
et le cas de x = 0 est trivial.

Remarque. Le Corollaire montre en particulier que e = exp 1 > 2. Cette
quantité joue un rôle fondamental en mathématiques. Une approximation
numérique est donnée par
e = 2, 71828182845904523536028747135266249775724709366995 . . ..
En 1737, Leonard Euler a donné les grandes lignes de la démonstration de

l’irrationnalité de e et e2 , un résultat précisé et généralisé à ec pour tout ra-
tionnel positif c par Johann Lambert en 1761. Charles Hermite a montré
en 1873 que e est transcendant et ce résultat a conduit Ferdinand Linde-

mann à prouver en 1882 que π est également transcendant. Aujourd’hui
encore, on ignore si e + π et e.π sont ou non transcendants.
Enonçons et démontrons maintenant la propriété essentielle de la fonction
exponentielle, à savoir qu’elle fournit un homomorphisme du groupe additif
(R, +) sur le groupe multiplicatif (]0, +∞[, ·).
exp(x + y) = (exp x).(exp y).
Démonstration. Si x = 0 ou y = 0, le résultat est évident. Considérons

tout d’abord le cas où x + y > 0 et xy > 0. En prenant
4 54 5
x+y xy x y x+y
α = 1+ + = 1+ 1+ , β =1+ ,
k + 1 (k + 1) 2 k+1 k+1 k+1
dans le lemme ci-dessus, on trouve

4 5k 4 5k+1 4 5k+1 4 5k+1
xy x+y x y x+y
1+ ≤ 1+ 1+ − 1+
k+1 k+1 k+1 k+1 k+1
4 5k 4 5k
xy x y
≤ 1+ 1+ .
k+1 k+1 k+1
On en déduit aussitôt, en faisant tendre k vers l’infini, que
0 = [exp x].[exp y] − exp(x + y).
Si x + y > 0 et xy < 0, on posera

4 54 5
x+y xy x y x+y
β =1+ + = 1+ 1+ , α=1+ ,
k + 1 (k + 1) 2 k+1 k+1 k+1
et l’on raisonnera
# # comme dans le cas précédent avec k suffisamment grand
# xy #
pour que # (k+1)2 # ≤ 1 + x+y
k+1 . Enfin, si x + y < 0, alors, par la Proposition
précédente et la première partie de la démonstration, on a
1 1
exp(x + y) = = = [exp x].[exp y].
exp(−x − y) [exp(−x)].[exp(−y)]
Corollaire. La fonction exponentielle est strictement croissante sur R. En

outre, on a
lim exp x = 0, lim exp x = +∞.
x→−∞ x→+∞
Démonstration. Si y > x ≥ 0, on a y − x > 0, donc exp(y − x) > 1 et

dès lors,
exp y = exp[x + (y − x)] = [exp x].[exp(y − x)] > exp x.
Si y > 0 > x, alors, par ce qui précède,
exp y > exp 0 = 1,
et
1
exp x = < 1 < exp y.
exp(−x)
Si x < y ≤ 0, on a 0 ≤ −y < −x et dès lors
1 1
exp x = < = exp y.
exp(−x) exp(−y)
D’autre part, exp n’est pas majorée sur R puisque, pour tout k ∈ N∗ , on a
exp k = exp(k.1) = (exp 1)k = ek > 2k .
Comme exp est croissante, on en déduit que exp x → +∞ si x → +∞ et que

dès lors exp x = exp(−x)
1
→ 0 si x → −∞.
Etudions maintenant les propriétés de dérivabilité de la fonction expo-
nentielle.
Proposition. La fonction exponentielle est dérivable en 0 et (exp)$ (0) = 1.
Démonstration. Soit h > 0; en utilisant le lemme avec α = 1 + h
k+1 et
β = 1, on trouve
4 5k+1 4 5k 4 5k+1
h h h h
k ≤ 1+ −1 ≤ h 1+ ≤ h 1+ ,
k+1 k+1 k+1 k+1
et dès lors 4 5
k+1
h
h≤ 1+ − 1 ≤ h exp h.
k+1
En faisant tendre k vers l’infini, on en déduit aussitôt que
h ≤ exp h − 1 ≤ h exp h.
En particulier, si 0 < h ≤ 1, on a
h ≤ exp h − 1 ≤ eh,
ce qui entraı̂ne que exp h → 1 si h → 0 par valeurs positives, et dès lors
exp h − 1
lim = 1.
h→0, h>0 h
Si h < 0, on a
2 3
exp h − 1 exp h[1 − exp(−h)] 1 1 − exp(−h)
= = ,
h h exp(−h) −h
et dès lors
exp h − 1
lim = 1.
h→0, h<0 h
Comme les limites du quotient différentiel pour h tendant vers zéro par
valeurs positives et par valeurs négatives existent et sont égales à un, la
fonction exponentielle est dérivable en 0 et sa dérivée y vaut un.
Corollaire. La fonction exponentielle est dérivable (et donc continue) en

chaque point x de R et
(exp)$ (x) = exp x.
Démonstration. Si x ∈ R et h /= 0, on a
exp(x + h) − exp x exp h − 1

= exp x ,
h h
et dès lors
2 3
exp(x + h) − exp x exp h − 1
lim = lim exp x = exp x.
h→0 h h→0 h
6.6 Fonctions monotones continues

On a une caractérisation des fonctions continues strictement mono-
tones sur un intervalle.
6.6. FONCTIONS MONOTONES CONTINUES 221
Proposition. Soit I ⊂ R un intervalle et f une fonction de R dans R

continue sur I. Alors f est strictement monotone sur I si et seulement si f
est injective sur I.
Démonstration. Condition nécessaire. Elle résulte immédiatement du
fait que toute fonction (continue ou non) strictement monotone sur I est
injective sur I.
Condition suffisante. Si f , continue et injective sur I, n’est pas strictement
monotone sur I, il existera x < y < z dans I tels que f (x) < f (y) et
f (y) > f (z) ou f (x) > f (y) et f (y) < f (z). Considérons, pour fixer les idées,
le premier cas, l’autre se traitant de même. Si d ∈ ] max{f (x), f (z)}, f (y)[,
alors, par le théorème des valeurs intermédiaires, il existera u ∈ ]x, y[ et
v ∈ ]y, z[ tels que f (u) = d = f (v), ce qui contredit l’injectivité.
Le résultat suivant montre qu’une fonction strictement croissante sur un
intervalle a pour image un intervalle de même nature.
Proposition. Soit I = ]a, b[ (resp. ]a, b], [a, b[, [a, b]), avec éventuellement
a = −∞ (resp. b = +∞) si I est ouvert à gauche (resp. à droite). Si f est
strictement croissante sur I, et si l’on pose
f (a+) = lim f (x), f (b−) = lim f (x),

x→a, x∈I x→b, x∈I
on a
f (I) = ]f (a+), f (b−)[ (resp. ]f (a+), f (b)], [f (a), f (b−)[, [f (a), f (b)]).
Si f est strictement décroissante sur I, on a
f (I) = ]f (b−), f (a+)[ (resp. [f (b), f (a+)[, ]f (b−), f (a)], [f (b), f (a)]).
Démonstration. Considérons, pour fixer les idées, le cas de I = ]a, b],

et f strictement croissante, les autres se traitant de même. Puisque f est
continue sur I, il résulte du théorème des valeurs intermédiaires que f (I) est
un intervalle. D’ailleurs, pour tout x ∈ ]a, b], on a f (x) ≤ f (b) et f (b) est le
maximum de f (I). D’autre part, on a vu que
f (a+) = lim f (x) = inf f = inf f (I).

x→a, x∈I I
S’il existe u ∈ ]a, b] tel que f (u) = inf f (I), alors, pour tout v ∈ ]a, u[, on
aura f (v) < f (u) = inf f (I), ce qui est contradictoire. Donc f (u) > inf f (I)
pour tout u ∈ I, et f (I) = ]f (a+), f (b)].
La fonction réciproque d’une fonction continue et strictement monotone

sur un intervalle est continue et strictement monotone.
Proposition. Soit I ⊂ R un intervalle et f une fonction continue et stricte-

ment monotone sur I. Alors f −1 est strictement monotone et continue sur
f (I).
Démonstration. f , strictement monotone et continue sur I, est injective

sur I et dès lors sa fonction réciproque f −1 est bien définie sur f (I). Sup-
posons, pour fixer les idées, que f soit strictement croissante sur I = ]a, b[,
les autres cas se traitant de même. La relation
(x − y)[f (x) − f (y)] > 0 si x /= y dans I,
entraı̂ne, en posant u = f (x), v = f (y),
(u − v)[f −1 (u) − f −1 (v)] > 0 si u /= v dans f (I),
et f −1 est strictement croissante sur f (I). Soit d ∈ f (I) et c ∈ I l’unique

élément tel que f (c) = d. Soit ! > 0 tel que [c − !, c + !] ⊂ ]a, b[. De la
relation
c − ! < c < c + !,
on tire
f (c − !) < d < f (c + !),
et il existe dès lors δ > 0 tel que
f (c − !) < f (c) − δ < d < f (c) + δ < f (c + !).
Comme f −1 est strictement croissante, on en déduit aussitôt que
f −1 (d) − ! = c − ! < f −1 (d − δ) < f −1 (d) < f −1 (d + δ) < c + ! = f −1 (d) + !.
En conséquence, pour tout x ∈ [d − δ, d + δ] ∩ I, on aura
f −1 (d) − ! < f −1 (d − δ) ≤ f −1 (x) ≤ f −1 (d + δ) < f −1 (d) + !.

6.7. FONCTIONS MONOTONES DÉRIVABLES 223
6.7 Fonctions monotones dérivables

Le théorème de Lagrange fournit une caractérisation des fonctions mo-
notones et dérivables sur un intervalle.
Proposition. Soit I ⊂ R un intervalle ouvert et f une fonction de R dans
R dérivable sur I. Alors f est croissante (resp. décroissante) sur I si et
seulement si, pour tout x ∈ I, on a f $ (x) ≥ 0 (resp. f $ (x) ≤ 0).
Démonstration. Il suffit de considérer le cas de f croissante, l’autre s’en
déduisant par application à −f.
Condition nécessaire. Si f est croissante et dérivable sur I, on a, pour chaque
x ∈ I et chaque y /= x dans I,
(y − x)[f (y) − f (x)] ≥ 0,
et dès lors
f (y) − f (x)
f $ (x) = lim ≥ 0.
y→x, y∈I y−x
Condition suffisante. Si x ∈ I, y ∈ I et y > x, alors, par le théorème de
Lagrange, il existe z ∈ ]x, y[ tel que
f (y) − f (x) = (y − x)f $ (z),
et dès lors
(y − x)[f (y) − f (x)] = (y − x)2 f $ (z) ≥ 0.
On a également une caractérisation des fonctions dérivables et

strictement monotones sur un intervalle.
Proposition. Soit I un intervalle ouvert de R et f une fonction de R dans
R dérivable sur I. Alors f est strictement croissante (resp. strictement
décroissante) sur I si et seulement si f $ (x) ≥ 0 (resp. f $ (x) ≤ 0) pour tout
x ∈ I et f $ ne s’annule sur aucun intervalle J ⊂ I.
Démonstration. Il suffit de nouveau de considérer le cas où f est stricte-
ment croissante.
Condition nécessaire. Si f est strictement croissante et dérivable sur I, alors,
par la proposition précédente, f $ (x) ≥ 0 pour tout x ∈ I, et s’il existe un
intervalle J ⊂ I tel que f $ (x) = 0 pour tout x ∈ J, f sera constante sur J,
ce qui contredit son caractère strictement croissant.
Condition suffisante. Soient x < y dans I; par le théorème de Lagrange,
il existe z ∈ ]x, y[ tel que f (y) − f (x) = (y − x)f $ (z). Si f $ (z) = 0, alors,
f (y) = f (x) et puisque f est croissante sur I, on aura, pour tout u ∈ [x, y],
f (u) = f (x) = f (y), et dès lors f $ (u) = 0, ce qui contredit l’hypothèse sur
les zéros de f $ . Donc, f $ (z) > 0 et f (y) > f (x).
Le résultat suivant donne des conditions pour que la fonction réciproque
d’une fonction dérivable et injective soit dérivable.
Proposition. Soit I un intervalle de R et f une fonction de R dans R
dérivable et injective sur I. Pour tout a ∈ I tel que f $ (a) /= 0, f −1 est
dérivable en f (a) et
1
(f −1 )$ (f (a)) = $ .
f (a)
Démonstration. Par hypothèse f est continue et injective sur I, et donc
strictement monotone. Il existe donc certainement des a ∈ I tels que f $ (a) /=
0. Soit a l’un d’entre eux. Notons que f (x) /= f (a) si x /= a et f −1 (y) /=
f −1 (f (a)) si y /= f (a). Comme
f (x) − f (a)
lim = f $ (a) /= 0,
x→a, x∈I\{a} x−a
On aura
x−a 1 1
lim = lim = .
x→a, x∈I\{a} f (x) − f (a) x→a, x∈I\{a} f (x)−f (a) f $ (a)
x−a
Dès lors, si ! > 0 est donné,

# #
# x−a 1 #
(∃η > 0)(∀x ∈ I : 0 < |x − a| ≤ η) : ## − $ ## ≤ !.
f (x) − f (a) f (a)
Par un résultat ci-dessus, f −1 est continue en f (a) et dès lors
(∃δ > 0)(∀y ∈ f (I) : |y − f (a)| ≤ δ) : |f −1 (y) − f −1 (f (a)| = |f −1 (y) − a| ≤ η.
En conséquence,
# #
# f −1 (y) − f −1 (f (a)) 1 ##
#
(∃δ > 0)(∀y ∈ f (I) : 0 < |y − f (a)| ≤ δ) : # − $ # ≤ !.
# y − f (a) f (a) #
6.8. FONCTIONS CONVEXES OU CONCAVES 225
On a vu que la fonction exponentielle était une application strictement

croissante de R dans R, ayant une limite nulle lorsque x tend vers −∞ et
tendant vers +∞ lorsque x tend vers +∞. Elle est en outre dérivable en
chaque point x de R, sa dérivée étant égale à elle-même. En conséquence,
les résultats de cette section et de la précédente entraı̂nent que exp est une
bijection de R sur ]0, +∞[ et possède donc une fonction réciproque, définie
sur ]0, +∞[, strictement croissante et continue sur cet intervalle, et dérivable
en chaque point de cet intervalle. Cette fonction est appelée la fonction
logarithme et notée ln ou log. En vertu du théorème que nous venons de
démontrer, on aura, pour tout x ∈ ]0, +∞[,
1 1 1
(ln)$ (x) = (ln)$ [exp(ln x)] = = = .
exp$ (ln x) exp(ln x) x
D’autre part, pour tout x ∈ ]0, +∞[ et tout y ∈ ]0, +∞[, on a
exp(ln x + ln y) = [exp(ln x)].[exp(ln y)] = xy,
et dès lors
ln(xy) = ln x + ln y.
Donc la fonction logarithme fournit un homomorphisme du groupe multipli-
catif (]0, +∞[, ·) sur le groupe additif (R, +) et cette propriété remarquable
de la fonction logarithme est à la base de son utilisation comme outil de
calcul numérique. Si a > 0, on définit la fonction exponentielle de base a
x 2→ ax sur R par ax = exp(x ln a). On voit facilement que cette fonction est
positive et dérivable en chaque point x de R et que
(ax )$ = ax ln a.
En particulier, cette fonction sera strictement décroissante sur R si a ∈ ]0, 1[,
constante si a = 1 et strictement croissante si a > 1. On a évidemment
ex = exp x pour tout x ∈ R. Lorsque a > 0 est différent de un, la fonction
réciproque de l’exponentielle de base a est définie sur ]0, +∞[, appelée la
fonction logarithme de base a et notée loga . On vérifie aisément que, pour
tout x ∈ ]0, +∞[, on a
ln x
loga x = .
ln a
6.8 Fonctions convexes ou concaves

Soit f une fonction de R dans R définie sur un intervalle I ⊂ R. Il est
intéressant d’étudier les fonctions telles que, pour chaque a ∈ I, le taux de
variation
f (x) − f (a)
∆af : x 2→
x−a
de f en a est une fonction croissante sur I \ {a} ou une fonction décroissante
sur I \ {a}.
La caractérisation suivante est bien utile.
Proposition. Soit f une fonction de R dans R définie sur un intervalle
I ⊂ R. Alors la fonction ∆a f est, pour chaque a ∈ I, une fonction croissante
sur I \ {a} si et seulement si, pour chaque x ∈ I, chaque y ∈ I et chaque
λ ∈ [0, 1], on a
f [(1 − λ)x + λy] ≤ (1 − λ)f (x) + λf (y).
Démonstration. Condition nécessaire. Il suffit évidemment de démontrer

le résultat lorsque x /= y et λ ∈ ]0, 1[, les autres cas étant triviaux. Si x < y
et λ ∈ ]0, 1[, on a x + λ(y − x) < y, et dès lors, par hypothèse,
∆x f (x + λ(y − x)) ≤ ∆x f (y)
pour tout y ∈ I tel que y > x, c’est-à-dire

f [(1 − λ)x + λy] − f (x) f (y) − f (x)
≤ ,
λ(y − x) y−x
ce qui entraı̂ne facilement que
f [(1 − λ)x + λy] ≤ (1 − λ)f (x) + λf (y).
Si x > y et λ ∈ ]0, 1[, alors, en posant µ = 1 − λ, on a aussi µ ∈ ]0, 1[, et, par
la première partie de la démonstration,
f [(1−λ)x+λy] = f [(1−µ)y+µx] ≤ (1−µ)f (y)+µf (x) = (1−λ)f (x)+λf (y).
Condition suffisante. Si x < y < a appartiennent à I, alors

a−y y−x
λ= ∈ ]0, 1[, 1 − λ = ,
a−x a−x
et
f (y) = f (a+y −a) = f [a+λ(x−a)] = f [(1−λ)a+λx] ≤ (1−λ)f (a)+λf (x);
dès lors
f (y) − f (a) ≤ λ[f (x) − f (a)],
c’est-à-dire
f (y) − f (a) f (x) − f (a)
≥ .
y−a x−a
Le cas où a < x < y se traite d’une manière semblable. Si x < a < y
appartiennent à I, alors, par la première partie de la démonstration de la
condition suffisante, on a
f (a) − f (x) f (y) − f (x)

≤ ,
a−x y−x
et dès lors
(y − x)[f (a) − f (x)] ≤ (a − x)[f (y) − f (x)]
= (a − x)[f (y) − f (a)] + (a − x)[f (a) − f (x)].

(y − a)[f (a) − f (x)] ≤ (a − x)[f (y) − f (a)],
et donc que
f (x) − f (a) f (y) − f (a)
≤ .
x−a y−a
Remarque. L’examen de la démonstration de la proposition précédente

montre que, pour chaque a ∈ I, ∆a f est strictement croissante sur I \ {a}
si et seulement si, pour tout x /= y dans I et pour tout λ ∈ ]0, 1[, on a
f [(1 − λ)x + λy] < (1 − λ)f (x) + λf (y).

Définition. Soit f une fonction de R dans R définie sur un intervalle I de
R. On dit que f est convexe sur I si, pour tout x ∈ I, tout y ∈ I et tout
λ ∈ [0, 1], on a
f [(1 − λ)x + λy] ≤ (1 − λ)f (x) + λf (y).
Elle sera dite strictement convexe sur I si, pour tout x /= y dans I et tout
λ ∈ ]0, 1[, on a
f [(1 − λ)x + λy] < (1 − λ)f (x) + λf (y).

Géométriquement, cette définition exprime que, pout tout x ∈ I et pour

tout y ∈ I, le graphe de f situé entre (x, f (x)) et (y, f (y) est située “en-
dessous” du segment de droite joignant ces deux points. Par la proposition
qui précède, f est convexe (resp. strictement convexe) sur I si et seulement
si, pour chaque a ∈ I, la fonction ∆af est croissante (resp. strictement
croissante) sur I \ {a}.
On a évidemment la situation correspondant au cas où ∆a f est décrois-
sante.
Définition. Soit f une fonction de R dans R définie sur un intervalle I de
R. On dit que f est concave sur I si, pour tout x ∈ I, tout y ∈ I et tout
λ ∈ [0, 1], on a
f [(1 − λ)x + λy] ≥ (1 − λ)f (x) + λf (y).
Elle sera dite strictement concave sur I si, pour tout x /= y dans I et tout
λ ∈ ]0, 1[, on a
f [(1 − λ)x + λy] > (1 − λ)f (x) + λf (y).
Il est clair que f est concave (resp. strictement concave) sur I si et
seulement si −f est convexe (resp. strictement convexe) sur I, et dès lors si
et seulement si, pour chaque a ∈ I, ∆af est décroissante sur I \ {a}. Il suffit
donc d’étudier les fonctions convexes ou strictement convexes.
Exemples. 1. Toute fonction constante sur I est concave et convexe sur I.
2. Toute fonction affine sur R est concave et convexe sur R.
3. Pour tout entier n ≥ 2, la fonction x 2→ xn est strictement convexe sur
%
R; en effet, pour chaque a ∈ R, ∆a f (x) = n−1 k n−1−k
k=0 a x est strictement
croissante sur R.
Une fonction convexe sur I est continue en tout point intérieur à I.
Proposition. Si f est une fonction de R dans R convexe sur l’intervalle I,
alors, f est continue en tout point a ∈ int I et les limites
fg$ (a) = lim ∆af (x) et fd$ (a) = lim ∆af (x)
x→a, x<a x→a, x>a
existent et vérifient l’inégalité fg$ (a) ≤ fd$ (a).

Démonstration. Soit a ∈ int I. L’existence des limites en question et
l’inégalité fg$ (a) ≤ fd$ (a) sont une conséquence de la croissance de ∆a f et
des propriétés des fonctions croissantes. D’autre part,
f (x) − f (a)
lim [f (x) − f (a)] = lim (x − a) = 0.fg$ (a) = 0,
x→a, x<a x→a, x<a x−a
et de même
lim [f (x) − f (a)] = 0.
x→a, x>a
On en déduit aussitôt la continuité de f en a.

Remarque. Le résultat ci-dessus n’est pas vrai en une extrémité de I comme
le montre l’exemple de la fonction f égale à 1 en 0 et à 0 ailleurs qui est
convexe sur [0, 1] et n’est pas continue en 0.
Les fonctions convexes vérifient une inégalité de la moyenne en termes
des dérivées à gauche fg$ et à droite fd$ .
Proposition. Soit f une fonction de R dans R convexe sur un intervalle I.
Si a < b sont des points de I tels que fd$ (a) et fg$ (b) existent (en particulier
s’ils sont intérieurs à I), alors
f (b) − f (a)
fd$ (a) ≤ ≤ fg$ (b).
b−a
Démonstration. Si a < x < b sont intérieurs à I, on a
f (a) − f (x) f (b) − f (x)

≤ ,
a−x b−x
et dès lors, en faisant tendre x respectivement vers a et vers b, on obtient
f (b) − f (a)
fd$ (a) ≤ ≤ fg$ (b).
b−a
On a une caractérisation intéressante des fonctions convexes dérivables.

Proposition. Soit f une fonction de R dans R dérivable en chaque point
d’un intervalle I. Les énoncés suivants sont équivalents.
1. f est convexe sur I.
2. Pour tout x ∈ I et tout y ∈ I, on a
f (y) ≥ f (x) + f $ (x)(y − x).
3. f $ est croissante sur I.

Démonstration. Notons tout d’abord que, f étant dérivable en chaque
point de I, on a fg$ (x) = fd$ (x) = f $ (x) pour chaque x ∈ I. Dès lors, la
proposition précédente entraı̂ne que 1 ⇒ 2 et la caractérisation de la con-
vexité en termes de ∆a f et de la croissance d’une fonction dérivable entraı̂ne
que 3 ⇒ 1. Il reste à montrer que 2 ⇒ 3. L’hypothèse 2 entraı̂ne que, pour

tout x ∈ I et tout y ∈ I, on a
f (y) ≥ f (x) + f $ (x)(y − x) et f (x) ≥ f (y) + f $ (y)(x − y),
c’est-à-dire
f $ (x)(y − x) ≤ f (y) − f (x) ≤ f $ (y)(y − x),
et donc (y − x)[f $ (y) − f $ (x)] ≥ 0.
Remarques. 1. On démontre d’une manière analogue l’équivalence, pour
une fonction dérivable sur I, entre les énoncés
1. f est strictement convexe sur I.
2. Pour chaque x /= y dans I, on a
f (y) > f (x) + f $ (x)(y − x).
3. f $ est strictement croissante sur I.

On déduit aisément de cette remarque que la fonction exponentielle est une
fonction strictement convexe sur R et la fonction logarithme une fonction
strictement concave sur ]0, +∞[.
2. La propriété 2 de la Proposition précédente montre que, si f est
convexe sur I, tout point critique de f sur I est un minimant de f sur I.
3. La définition de fonction convexe peut s’étendre aux fonctions de Rn
dans R. Si E ⊂ Rn , on dira que E est convexe s’il contient le segment
de droite joignant deux quelconques de ses points, c’est-à-dire si, pour tout
x ∈ E, tout y ∈ E et tout λ ∈ [0, 1], on a (1 − λ)x + λy ∈ E. Les parties
convexes de R sont les intervalles. Une fonction f de Rn dans R sera dite
convexe sur E si elle est définie sur E et si, pour tout x ∈ E, tout y ∈ E et
tout λ ∈ [0, 1], on a f [(1 − λ)x + λy] ≤ (1 − λ)f (x) + λf (y).
6.9 Exercices
1. Si f est une fonction de Rn dans R et si a ∈ dom f, on appelle oscillation
de f en a la quantité
& '
o(f, a) = lim sup f − inf f .
r→0+ B2 [a;r] B2[a;r]
Montrer que o(f, a) existe au sens large et que f est continue en a si et

seulement si o(f, a) = 0.
6.9. EXERCICES 231
2. Utiliser le lemme de Cousin pour démontrer directement que si f est une

fonction de R dans R dérivable en chaque point d’un intervalle I et telle que
f $ (x) > 0 pour tout x ∈ I, alors f est strictement croissante sur I.
3. Soit a > 0 et (uk )k∈N la suite réelle définie par u0 > 0 arbitraire et
4 5
1 a
uk+1 = uk + , (k ∈ N).
2 uk
Montrer que cette suite est positive, décroissante et donc convergente. Mon-
√
trer que sa limite est égale à a. (Algorithme de Héron pour l’extraction
d’une racine carrée).
4. Soit (ak )k∈N une suite réelle. Pour chaque k ∈ N, posons (au sens large)
ak = inf{aj : j ≥ k}, ak = sup{aj : j ≥ k}.
a. Montrer que (ak )k∈N est une suite croissante dans R si et seulement si
(ak )k∈N est minorée. Si (ak )k∈N n’est pas minorée, on pose
lim inf ak = −∞.

k→∞
Si (ak )k∈N est minorée, on pose (au sens large)
lim inf ak = lim ak = lim inf aj .

k→∞ k→∞ k→∞ j≥k
b. Montrer que (ak )k∈N est une suite décroissante dans R si et seulement si
(ak )k∈N est majorée. Si (ak )k∈N n’est pas majorée, on pose
lim sup ak = +∞.

k→∞
Si (ak )k∈N est majorée, on pose (au sens large)
lim sup ak = lim ak = lim sup aj .

k→∞ k→∞ k→∞ j≥k
c. On a ainsi attaché à toute suite réelle deux éléments lim inf k→∞ ak
et lim supk→∞ ak de R ∪ {−∞} ∪ {+∞} respectivement appelés la limite
inférieure et la limite supérieure de la suite (ak )k∈N . Montrer (avec la con-
vention −∞ < a < +∞ pour tout a ∈ R) que l’on a toujours
lim inf ak ≤ lim sup ak ,

k→∞ k→∞
et que l’égalité a lieu si et seulement si la suite (ak )k∈N est convergente (au
sens large), auquel cas sa limite (au sens large) est égale à la valeur commune
de sa limite inférieure et de sa limite supérieure.
5. Soit f une fonction de Rn dans R semi-continue inférieurement en chaque
point du fermé E ⊂ Rn . Montrer que f possède un minimum sur E si et
seulement si f possède une suite minimisante convergente.
6. Soient A et B deux ensembles non vides et
f : A × B → R, (x, y) 2→ f (x, y)
une application réelle majorée et minorée. Montrer que
sup inf f (x, y) ≤ inf sup f (x, y).

x∈A y∈B y∈B x∈A

Si la propriété M n’appartient pas à toutes les valeurs d’une grandeur x,
mais appartient à toutes celles qui sont plus petites qu’un certain u, alors il
existe toujours une grandeur U qui est la plus grande de celles dont on peut
affirmer que toutes les valeurs inférieures x possèdent la propriété M.
Il ne faut pas trop s’étonner que la distinction entre minimum et borne

inférieure, ou maximum et borne supérieure, ait été faite si tardivement.
C’est qu’elle n’a aucune signification concrète. Qui oserait décider s’il existe
une charge maxima que peut supporter un pont, plutôt qu’une charge minima
qui le fasse s’écrouler ?
Henri Lebesgue
Il me semble que la notion de fonction convexe est à peu près aussi fon-
damentale que celles-ci : fonction positive, fonction croissante. Si je ne
me trompe pas en ceci, la notion devra trouver sa place dans les expositions
élémentaires de la théorie des fonctions réelles.
Johann L.W.V. Jensen, 1906

Chapitre 7
Développement de Taylor et
séries
7.1 Dérivées d’ordre supérieur

Soit f une fonction de R dans Rp dérivable en au moins un point de R. A
chaque point x ∈ R tel que f soit dérivable en x, nous pouvons associer
l’élément f $ (x) de Rp et définir ainsi une nouvelle fonction f $ de R dans Rp
de domaine
dom f $ = {x ∈ R : f est dérivable en x}.
Cette fonction s’appelle la fonction dérivée première de f ou, brièvement, la
dérivée première de f ou la dérivée de f . On la désigne également par Df
df
ou par dx .
Définition. Soit f une fonction de R dans Rp et a ∈ dom f $ . On dit que
f est deux fois dérivable en a si f $ est dérivable en a, auquel cas (f $ )$ (a) est
2
noté f $$ (a), D 2 f (a) ou ddxf2 (a) et appelé le vecteur dérivé deuxième de f en
a ou, plus simplement la dérivée deuxième de f en a.
On rappellera que l’existence de f $$ (a) requiert que a soit non isolé dans
dom f $ et que
f $ (x) − f $ (a)
lim
x→a x−a
existe. On sait que, n ≥ 1 étant un entier, l’application f : x 2→ xn est
dérivable en chaque x ∈ R et f $ (x) = nxn−1 . En conséquence la dérivée
deuxième f $$ (x) existe en chaque x ∈ R et est égale à zéro si n = 1 et à
n(n − 1)xn−2 si n ≥ 2.
233
234 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES
On peut alors procéder comme avec f $ et définir la fonction dérivée

deuxième de f ou, plus brièvement, la dérivée deuxième de f , notée f $$ ou
2
D2 f ou ddxf2 , comme la fonction de R dans Rp de domaine
dom f $$ = {x ∈ R : f $ est dérivable en x},
qui, à chaque x ∈ dom f $$ associe f $$ (x). On dira alors que f est trois fois
dérivable en a si f $$ est dérivable en a, auquel cas (f $$ )$ (a) est noté f $$$ (a),
3
f (3)(a), D3 f (a) ou ddxf3 (a) et appelé le vecteur dérivée troisième de f en a ou,
plus simplement la dérivée troisième de f en a. En continuant de la sorte,
si k ≥ 2 est un entier et si f k−1 désigne la fonction dérivée (k − 1)e de f ,
on dira que f est k fois dérivable en a si la fonction f (k−1) est dérivable en
a, auquel cas (f (k−1) )$ (a) est appelé le vecteur dérivée ke de f en a ou plus
k
simplement la dérivée ke de f en a, et noté f (k) (a) ou D k f (a) ou ddxfk (a). La
fonction dérivée ke de f est alors la fonction de R dans Rp de domaine
dom f (k) = {x ∈ R : f est k-fois dérivable en x}
qui, à chaque x ∈ dom f (k) associe f (k) (x). Ainsi, dans l’exemple ci-dessus
où f (x) = xn , un raisonnement par récurrence aisé montre que, pour chaque
x ∈ R,
f (k) (x) = n(n − 1) . . . (n − k + 1)xn−k si k ≤ n,
et
f (k) (x) = 0 si k > n.
On a bien entendu en général les inclusions
dom f (k) ⊂ dom f (k−1) ⊂ dom f,
et ces inclusions peuvent être strictes. Ainsi, pour la fonction f de Dirichlet
qui associe 1 à chaque x rationnel et 0 à chaque x irrationnel, on a dom f $ = ∅
(et dès lors dom f (k) = ∅ pour tout k ≥ 2), puisque f n’est continue en aucun
point de R et donc dérivable en aucun point de R. Karl Weierstrass a
donné en 1872 un exemple plus surprenant de fonction continue sur R qui
n’est dérivable en aucun point de R. Nous y reviendrons plus loin.
On déduit aisément des règles de calcul des dérivées (premières) certaines
règles de calcul pour les dérivées d’ordre supérieur. Par exemple, si f et g
sont des fonctions de R dans Rp k-fois dérivables en a ∈ R, et si c ∈ R, alors
f + g et cf sont k-fois dérivables en a et
(f + g)(k)(a) = f (k) (a) + g (k)(a), (cf )(k)(a) = cf (k) (a).
Le cas du produit (et dès lors du quotient) de deux fonctions est plus com-
pliqué et porte le nom de formule de Leibniz.
7.1. DÉRIVÉES D’ORDRE SUPÉRIEUR 235
Proposition. Soit k ≥ 1 un entier, f une fonction de R dans R (resp. C)

et g une fonction de R dans Rp (resp. C) k-fois dérivables en a. Alors, f g
est k-fois dérivable en a et
k
$
(f g)(k)(a) = Ckj f (j) (a)g (k−j)(a),
j=0
j
où Ck = k!
j!(k−j)! .
Démonstration. Elle se fait par récurrence sur k. Le résultat a déjà été

démontré pour k = 1. S’il est vrai jusqu’à l’ordre k − 1, alors
k−1
$ j
(f g)(k−1)(a) = Ck−1 f (j) (a)g (k−1−j)(a),
j=0
et (f g)(k−1) est dérivable en a puisqu’il en est ainsi de chacune des fonctions

f (j) g (k−1−j) (0 ≤ j ≤ k − 1) en vertu de l’hypothèse de récurrence. En outre,
par les règles de calcul d’une dérivée première, on a
k−1
$ j
(f g)(k)(a) = [(f g)(k−1)]$ (a) = Ck−1 [f (j)g (k−1−j) ]$ (a)
j=0
k−1
$ j
= Ck−1 [f (j+1)(a)g (k−1−j)(a) + f (j) (a)g (k−j)(a)]
j=0
k
$ k−1
$
j−1 (j) j
= Ck−1 f (a)g (k−j)(a) + Ck−1 f (j) (a)g (k−j)(a)
j=1 j=0
k−1
$ j−1 j
= f (k) (a)g(a) + (Ck−1 + Ck−1 )f (j) (a)g (k−j)(a) + f (a)g (k)(a)
j=1
k
$
= Ckj f (k) (a)g (k−j)(a),
j=0
puisque Ckj = Ck−1

j−1 j
+ Ck−1 .
7.2 Développement de Taylor

Soit f une fonction de R dans Rp et a ∈ dom f . Si f est dérivable en a,
alors, pour tout h ∈ (dom f − a) \ {0}, on a
f (a + h) = f (a) + hf $ (a) + |h|r(h),
où r est une fonction de R dans Rp de domaine au moins égal à (dom f −

a) \ {0} telle que r(h) → 0 si h → 0. En d’autres termes, on peut écrire,
pour tout h ∈ (dom f − a) \ {0},
f (a + h) = P 1 (h) + |h|r(h),
où P 1 (h) est un polynôme de degré un en h dont les coefficients s’expriment

en fonction de f (a) et f $ (a) et où r(h) → 0 si h → 0.
Lorsque f est une fonction de R dans Rp m-fois dérivable en a, (m ≥ 2),
il est naturel de se demander s’il existe un polynôme P m de degré m, dont
les coefficients s’expriment en fonction de f (a), f $ (a), . . ., f (m)(a) tel que,
pour tout h ∈ (dom f − a) \ {0}, on ait
f (a + h) = P m (h) + |h|m r(h) (7.1)
où r est une fonction de R dans Rp de domaine au moins égal à (dom f −a)\
{0} telle que r(h) → 0 si h → 0. Avant de donner des conditions suffisantes
pour l’existence d’un tel polynôme, montrons qu’il en existe au plus un.
Proposition. Soit f une fonction de R dans Rp et a non isolé dans dom f .
Il existe au plus un polynôme P m de degré m vérifiant (7.1).
%
Démonstration. Supposons que P m (h) = m k=0 ck h vérifie (7.1) et que
k
%m
Q (h) = k=0 dk h soit tel que, pour tout h ∈ (dom f − a) \ {0}, on ait
m k
f (a + h) = Qm (h) + |h|m s(h),
où s est une fonction de R dans Rp de domaine au moins égal à (dom f −

a) \ {0} telle que s(h) → 0 si h → 0. On en déduit aussitôt, par soustraction,
que, pour tout h ∈ (dom f − a) \ {0}, on a
Qm (h) − P m (h) = |h|m[r(h) − s(h)] = |h|m q(h), (7.2)
avec q(h) → 0 si h → 0. On déduit aussitôt de (7.2) que
d0 − c0 = lim [Qm (h) − P m (h)] = lim |h|mq(h) = 0,

h→0 h→0
7.2. DÉVELOPPEMENT DE TAYLOR 237
et, pour prouver par récurrence que P m = Qm , il suffit de montrer que si

cj = dj pour 0 ≤ j ≤ k − 1 ≤ m − 1, alors ck = dk . Si cj = dj pour
0 ≤ j ≤ k − 1 ≤ m − 1, la condition (7.2) entraı̂ne
m
$
(dj − cj )hj = |h|m q(h),
j=k
et dès lors m
$ |h|m
(dj − cj )hj−k = q(h),
j=k
hk
pour tout h ∈ (dom f − a) \ {0}. En conséquence,

m
$ |h|m
dk − ck = lim (dj − cj )hj−k = lim q(h) = 0,
h→0 h→0 hk
j=k
|h|m
puisque la fonction h 2→ hk
est localement bornée en 0 pour chaque 1 ≤
k ≤ m.
Cherchons maintenant à déterminer la forme de cet unique polynôme
de degré m qui vérifie éventuellement la condition (7.1). Pour ce faire,
%
considérons le cas particulier trivial où f (x) = m k=0 bk x est elle-même
k
un polynôme de degré m. Dans ce cas, si a ∈ R est donné, la fonction

%
h 2→ f (a + h) = m k=0 bk (a + h) est aussi un polynôme de degré m, comme
k
le montre le développement de chaque monôme (a + h)k par la formule

du binôme de Newton. Donc f (a + h) est dans ce cas l’unique polynôme
%
P m (h) = m k=0 ck h de degré m vérifiant la condition (7.1). De l’identité
k
m
$
f (a + h) = ck hk ,
k=0
on déduit aussitôt, par dérivations des deux membres, que, pour chaque
1 ≤ j ≤ m, on a
m
$
[f (a + ·)](j)(h) = f (j) (a + h) = ck k(k − 1) . . .(k − j + 1)hk−j ,
k=j
et dès lors, en prenant h = 0, on trouve
f (a) = c0 ,
f (j) (a) = j!cj , (1 ≤ j ≤ m).

Le polynôme de degré m vérifiant les conditions voulues est donc de la forme

m
$ hj
f (j) (a),
j=0
j!
(avec les conventions habituelles 0! = 1 et f (0) = f ) et s’exprime bien en

fonction de f (a), f $ (a), . . ., f (m)(a). Ce résultat suggère l’introduction de la
définition suivante.
Définition. Soit m ≥ 1 un entier et f une fonction de R dans Rp m fois
dérivable en a ∈ R. Le développement de Taylor d’ordre m de f en a est le
m
polynôme Tf,a de degré m défini par
m
$ f (j) (a)
m
Tf,a (h) = hj .
j=0
j!
Le reste du développement de Taylor d’ordre m de f en a est la fonction

f,a de R dans R de domaine dom f − a définie par
Rm p
f,a (h) = f (a + h) − Tf,a (h).

Rm m
Lorsque a = 0, Tf,0
m est aussi appelé le développement de Maclaurin d’ordre
m de f .
Un lemme sera utile pour donner des conditions suffisantes pour que le
développement de Taylor d’ordre m de f vérifie la relation (7.1).
Lemme. Soit m ≥ 1 un entier et g une fonction de R dans Rp (m − 1)-fois
dérivable en chaque point d’un voisinage V de 0 et m fois dérivable en 0
(cette hypothèse se réduisant à la dérivabilité de g en 0 si m = 1). Si
g(0) = g $ (0) = . . . = g (m)(0) = 0,
alors
g(h)
lim = 0.
h→0 |h|m
Démonstration. Elle se fait par récurrence sur m. Le résultat est évidem-
ment vrai pour m = 1 puisque, si g(0) = g $ (0) = 0, alors,
g(h) g(h) − g(0) − hg $ (0)

lim = lim = 0,
h→0 |h| h→0 |h|
puisque g est dérivable en 0. Supposons donc le résultat vrai pour k − 1,

où 2 ≤ k ≤ m est un entier, et montrons qu’il est vrai pour k. On a, par
hypothèse
g(0) = g $ (0) = . . . = g (k)(0) = 0,
et la fonction g $ est donc telle que
g $ (0) = (g $)$ (0) = . . . = (g $)(k−1) (0) = 0.
En conséquence, l’hypothèse de récurrence entraı̂ne que
g $ (h)
lim = 0. (7.3)
h→0 |h|k−1
Si r > 0 est suffisamment petit pour que le voisinage V de 0 contienne

B2 [0; r], alors, pour chaque h ∈ [−r, r], le théorème de la moyenne entraı̂ne
|g(h)|2 = |g(h) − g(0)|2 ≤ |h||g $(θh)|2 . (7.4)
Soit ! > 0; la condition (7.3) entraı̂ne l’existence d’un δ ∈ ]0, r] tel que, pour
tout h$ ∈ [−δ, δ], on ait
|g $(h$ )|2 ≤ !|h$ |k−1 .
Dès lors, pour tout h ∈ [−δ, δ], on aura |θh| ≤ δ, et, par (7.4),
|g(h)|2 ≤ |h|!|θh|k−1 ≤ !|h|k .
Le résultat suivant, dû à William H. Young, montre qu’il suffit d’ajouter

la dérivabilité jusqu’à l’ordre m − 1 sur un voisinage du point a à l’existence
de la dérivée me en ce point pour que le développement de Taylor d’ordre
m de f en a vérifie la condition (7.1).
Proposition. Soit m ≥ 1 un entier, f une fonction de R dans Rp (m − 1)-
fois dérivable en chaque point d’un voisinage V de a et m-fois dérivable en
a (si m = 1 cette hypothèse se réduit à la dérivabilité de f en a). Si Rm
f,a est
le reste du développement de Taylor d’ordre m de f en a, alors
f,a (h)
Rm
lim = 0.
h→0 |h|m
Démonstration. Pour tout h ∈ dom f − a, on a, par définition,

m
$ f (j) (a)
f,a (h) = f (a + h) − Tf,a (h) = f (a + h) −
Rm m
hj ,
j=0
j!
et dès lors, pour chaque 1 ≤ k ≤ m,

m
$ f (j) (a)
(Rm
f,a ) (h) = f
(k) (k)
(a + h) − j(j − 1) . . . (j − k + 1)hj−k ,
j=k
j!
ce qui entraı̂ne immédiatement que
f,a (0) = f (a)−f (a) = 0, (Rf,a) (0) = f

Rm (a)−f (k) (a) = 0, (1 ≤ k ≤ m).
m (k) (k)
Il suffit donc d’appliquer le lemme à Rm

f,a .
Exemples. 1. On a vu que, pour tout x ∈ R, (exp)$ (x) = exp x. En

conséquence, pour tout x ∈ R et tout k ∈ N∗ , on a (exp)(k)(x) = exp x. En
particulier, (exp)(k) (0) = exp 0 = 1 pour tout k ≥ 1 et dès lors, pour chaque
entier m ≥ 1 et chaque x ∈ R, on a
m
$ xj
exp x = exp,0 (x),
+ Rm
j=0
j!
Rm (x)
avec limx→0 exp,0
xm = 0.
2. On a vu que, pour tout x ∈ ]0, +∞[, (ln)$ (x) = x1 . Dès lors, pour chaque
k ≥ 2, on a (ln)(k)(x) = (−1)k−1 (k−1)!xk
(le montrer par récurrence). En
conséquence, pour chaque h ∈ ] − 1, +∞[, et chaque m ≥ 1, on aura (puisque
ln 1 = 0),
m
$ (−1)j−1
ln(1 + h) = hj ln,1 (h),
+ Rm
j=1
j
Rm (h)
avec limh→0 ln,1
hm = 0.
7.3 Calcul de limites et de dérivées

Le théorème de Young fournit un résultat pour le calcul de la limite du
quotient de deux fonctions d’une variable dans certains cas où la règle de
calcul de la limite d’un quotient et la règle de l’Hospital ne s’appliquent pas.
7.3. CALCUL DE LIMITES ET DE DÉRIVÉES 241
Proposition. Soit m ≥ 2 un entier, f une fonction de Rn dans Rp (resp. C)

et g une fonction de Rn dans R (resp. C) (m − 1)-fois dérivables en chaque
point d’un voisinage V de a ∈ R et m-fois dérivables en a. Si
f (a) = f $ (a) = . . . = f (m−1) (a) = 0,
g(a) = g $ (a) = . . . = g (m−1)(a) = 0,

et si
g (m)(a) /= 0,
alors
f f (m) (a)
lim (x) = (m) .
x→a, x(=a g g (a)
Démonstration. Par le théorème de Young, on a, pour tout h ∈ (dom f ∩
dom g) − a,
f (m) (a)
f (a + h) = hm f,a(h),
+ Rm
m!
g (m)(a)
g(a + h) = hm g,a (h),
+ Rm
m!
et
f,a (h)
Rm g,a (h)
Rm
lim m
= 0, lim = 0.
h→0 h h→0 hm
Dès lors, pour tout h ∈ [(dom f ∩ dom g) − a] \ {0}, il vient
hm f (m) (a)
f m! + Rm
f,a (h)
(a + h) =
g hm g (m) (a)
m! + Rm
g,a (h)
f (m) (a) Rm
f,a (h)
+ hm
= m!
Rm
.
g (m) (a) g,a (h)
m! + hm
Par conséquent, la règle usuelle de passage à la limite dans un quotient
appliquée au second membre entraı̂ne que
f f (a + h)
lim (x) = lim
x→a, x(=a g h→0, h(=0 g(a + h)
f (m) (a) Rm
f,a (h)
+ hm f (m)(a)
= lim m!
= .
h→0, h(=0 g (m) (a)
+
Rm
g,a (h) g (m)(a)
m! hm
Exemple. On a
(exp x − 1)3
lim = 1,
x→0 x3
puisque, si f (x) = (exp x − 1)3 et g(x) = x3 , alors,
f $ (x) = 3(exp x − 1)2 , f $$ (x) = 6(exp x − 1), f $$$ (x) = 6 exp x,
g $ (x) = 3x2 , g $$ (x) = 6x, g $$$(x) = 6,

et dès lors
f (0) = f $ (0) = f $$ (0) = g(0) = g $ (0) = g $$(0) = 0,
f $$$ (0) = 6, g $$$(0) = 6.

Le théorème de Young fournit aussi un moyen rapide de calculer les
dérivées d’ordre supérieur de certaines fonctions. Pour chaque entier q ≥ 1
et chaque h /= 1, on a l’identité algébrique
q
1 1 − hq+1 hq+1 $ hq+1
= + = hk + .
1−h 1−h 1 − h k=0 1−h
Comme
hq+1 h
lim = lim = 0,
h→0 (1 − h)hq h→0 1 − h
%
on voit que qk=0 hk est le développement de Taylor d’ordre q de la fonction
f : x 2→ 1−x
1
en 0, et dès lors, puisque q est arbitraire, on a, pour chaque
entier j ∈ N∗ ,
f (j) (0) = j!.
D’ailleurs, l’identité ci-dessus entraı̂ne que, pour tout entier p ≥ 2 et tout
h /= 1, on a
q
1 $ hp(q+1)
= hkp
+ ,
1 − hp k=0
1 − hp
et
q
1 $ (−1)q+1 hp(q+1)
= (−1) k kp
h + .
1 + hp k=0
1 + hp
Comme
hp(q+1)
lim = 0,
h→0 (1 ± hp )hqp
7.4. RESTE DE TAYLOR DE FONCTIONS RÉELLES 243
q %
on voit que, si f (x) = 1−x
1
p et g(x) = 1+xp ,
1
k=0 h
kp
est le développement
%q
de Taylor d’ordre qp de f en 0 et k=0 (−1) h est le développement de
k kp
Taylor d’ordre qp de g en 0. On en déduit aussitôt que
f (j) (0) = 0 si j n’est pas un multiple de p,
f (kp)(0) = (kp)!,
et
g (j)(0) = 0 si j n’est pas un multiple de p,
g (kp)(0) = (−1)k (kp)!.
7.4 Reste de Taylor de fonctions réelles

Le théorème de Cauchy permet de préciser l’expression du reste du déve-
loppement de Taylor d’ordre m en a d’une fonction de R dans R m + 1-fois
dérivable sur un voisinage de a.
Le résultat le plus général dans cette direction est l’expression de
Schlömilch du reste du développement de Taylor.
Proposition. Soit m ≥ 1 un entier et f une fonction de R dans R (m + 1)-
fois dérivable en chaque point d’un intervalle I de R. Soient a ∈ I, h /= 0
tel que a + h ∈ I et g une fonction de R dans R continue sur I, dérivable
en chaque point intérieur à I et telle que g $ ne s’annule pas sur l’intervalle
ouvert joignant a et a + h. Alors il existe θ ∈ ]0, 1[ tel que
2 3, -
g(a + h) − g(a) [(1 − θ)h]m f (m+1) (a + θh)
f,a (h)
Rm = .
g $ (a + θh) m!
Démonstration. Définissons la fonction F de R dans R par
F (y) = f (a + h) − Tf,y
m
(a + h − y).
F est définie sur I et, par construction,
F (a + h) = f (a + h) − Tf,a+h
m
(0) = f (a + h) − f (a + h) = 0,
F (a) = f (a + h) − Tf,a
m
(h) = Rm
f,a(h).
En outre, pour chaque y ∈ I, on a

 $
m
$ f (j) (y) 
F $ (y) = −  (a + h − y)j
j=0
j!
m m
$ f (j) (y) $ f (j+1) (y)
= (a + h − y)j−1 − (a + h − y)j
j=1
(j − 1)! j=0 j!
m−1 m
$ f (j+1)(y) $ f (j+1) (y)
= (a + h − y)j − (a + h − y)j
j=0
j! j=0
j!
f (m+1) (y)
= −(a + h − y)m .
m!
Si nous appliquons le théorème de la moyenne Cauchy à F et g sur l’intervalle
d’extrémités a et a + h, nous obtenons un θ ∈ ]0, 1[ tel que
[F (a + h) − F (a)]g $ (a + θh) = [g(a + h) − g(a)]F $(a + θh),

2 3, -
g(a + h) − g(a) [(1 − θ)h]m f (m+1) (a + θh)
f,a (h)
Rm = .
g $ (a + θh) m!
En choisissant convenablement la fonction g dans l’expression de Schlö-

milch, on obtient des expressions intéressantes du reste. La première, ap-
pelée expression de Lagrange du reste du développement de Taylor,
constitue une généralisation du théorème de Lagrange.
Corollaire. Soit m ≥ 1 un entier et f une fonction de R dans R (m+1)-fois
dérivable en chaque point d’un intervalle I de R. Soient a ∈ I, h /= a tel que
a + h ∈ I. Alors il existe un θ ∈ ]0, 1[ tel que
f (m+1) (a + θh)
f,a (h) = h
Rm m+1
.
(m + 1)!
Démonstration. Il suffit de prendre g définie par g(y) = (a + h − y)m+1

dans l’expression de Schlömilch, ce qui donne
g(a + h) − g(a) = −hm+1 , g $ (a + θh) = −(m + 1)[(1 − θ)h)]m .
Le deuxième cas particulier s’appelle l’expression de Cauchy du reste

du développement de Taylor.
7.5. EXTRÉMANTS LOCAUX LIBRES 245
Corollaire. Soit m ≥ 1 un entier et f une fonction de R dans R (m+1)-fois

dérivable en chaque point d’un intervalle I de R. Soient a ∈ I, h /= a tel que
a + h ∈ I. Alors il existe un θ ∈ ]0, 1[ tel que
(1 − θ)m hm+1 f (m+1) (a + θh)

f,a (h) =
Rm .
m!
Démonstration. Il suffit de prendre g définie par g(y) = a + h − y dans

l’expression de Schlömilch.
7.5 Extrémants locaux libres

L’expression de Lagrange du reste du développement de Taylor permet de
donner des conditions nécessaires et des conditions suffisantes pour qu’un
point soit maximant local libre ou minimant local libre d’une fonction de R
dans R.
Proposition. Soit m ≥ 2 un entier, f une fonction de R dans R m-fois
dérivable en chaque point d’un voisinage V d’un point a ∈ R, telle que f (m)
soit continue et différente de zéro en a et que
f $ (a) = f $$ (a) = . . . = f (m−1) (a) = 0.
Si m est impair, a n’est pas un extrémant local libre de f . Si m est pair et

si f (m)(a) > 0, alors a est un minimant local libre de f et si m est pair et
f (m) (a) < 0, alors a est un maximant local libre de f .
Démonstration. Soit r > 0 tel que [a − r, a + r] ⊂ V et tel que, pour tout
x ∈ [a−r, a+r], f (m) (x)f (m)(a) > 0 (c’est possible puisque f (m) est continue
en a et f (m) (a) /= 0). Soit h ∈ R tel que |h| ≤ r. En vertu des hypothèses
et de l’expression de Lagrange du reste du développement de Taylor d’ordre
m − 1 en a, il existe θ ∈ ]0, 1[ tel que
f (m) (a + θh)
f (a + h) − f (a) = hm .
m!
Dès lors, si m est impair, f (a + h) − f (a) a un signe différent pour h < 0
et h > 0 et a n’est pas un extrémant local libre de f . Si m est pair, alors
pour tout h ∈ [−r, r], f (a + h) − f (a) a le signe de f (m) (a) et le résultat s’en
déduit aussitôt.
Considérons maintenant le cas d’une fonction f de R dans R qui est m-

fois dérivable sur un voisinage V d’un point a quel que soit l’entier m ≥ 1.
Une telle fonction est appelée indéfiniment dérivable ou de classe C ∞ sur
V . Si a est un point critique de f et si toutes ses dérivées en a ne sont pas
nulles, la proposition précédente montre que l’examen de la première dérivée
non nulle en a permet de discuter complètement la nature du point critique.
Il n’en est pas de même si toutes les dérivées sont nulles en a. C’est ce que
montre l’étude de la fonction de Cauchy définie par
4 5
1
c(x) = exp − si x > 0, c(x) = 0 si x ≤ 0.
x
Les propriétés de cette fonction résultent des lemmes suivants.
Lemme. Pour tout entier m ≥ 0, on a
4 5
1 1
lim exp − = 0.
x→0+ xm x
4 5
1 1
lim exp − =0
x→0+ xm x
# 4 5#
# 1 1 #
⇔ (∀! > 0)(∃δ > 0)(∀x ∈ ]0, δ]) : ## m exp − ## ≤ !
x x
# #
# ym # ym
⇔ (∀! > 0)(∃ρ > 0)(∀y ≥ ρ) : ## # ≤ ! ⇔ lim = 0.
exp(y) # y→+∞ exp(y)
En appliquant m fois de suite la règle de L’Hospital, on trouve

ym my m−1 m!
lim = lim = . . . = lim = 0.
y→+∞ exp y y→+∞ exp y y→+∞ exp y
Lemme. Pour chaque x > 0 et chaque entier m ≥ 1, c est m-fois dérivable

en x et 4 5 4 5
1 1
c (x) = P
(m)
exp − ,
x x
où P est un polynôme tel que P (0) = 0.
Démonstration. Le résultat est vrai pour m = 1 puisque
4 5
1 1
c$ (x) = 2
exp − .
x x
7.5. EXTRÉMANTS LOCAUX LIBRES 247
Si, pour un entier 2 ≤ k ≤ m, on a

4 5 4 5
1 1
c (k−1)
(x) = P exp − ,
x x
avec P un polynôme tel que P (0) = 0, alors

2 4 5 4 53 4 5 4 5 4 5
1 $ 1 1 1 1 1 1
c(k) (x) = − P + 2P exp − =Q exp − ,
x2 x x x x x x
avec Q(y) = y 2 [P (y) − P $ (y)] un polynôme tel que Q(0) = 0.
Lemme. Pour chaque m ∈ N∗ , c est m-fois dérivable en 0 et c(m)(0) = 0.

Démonstration. Procédons par récurrence sur m. On a évidemment
c(x) − c(0)
lim = 0,
x→0− x
et, par le premier lemme,

4 5
c(x) − c(0) 1 1
lim = lim exp − = 0,
x→0+ x x→0+ x x
ce qui montre que c$ (0) = 0. Supposons que, pour un entier k ≥ 2, on

ait c(k−1) (0) = 0. Comme c est identiquement nulle sur ] − ∞, 0], on aura
c(k−1) (x) = 0 pour tout x < 0, et dès lors
c(k−1)(x) − c(k−1) (0)

lim = 0.
x→0− x
D’ailleurs, par le lemme ci-dessus, on a, pour x > 0,

4 5 4 5
1 1
c (k−1)
(x) = P exp −
x x
pour un certain polynôme P tel que P (0) = 0, et dès lors,

4 5 4 5
c(k−1) (x) − c(k−1)(0) 1 1 1
lim = lim P exp − = 0,
x→0+ x x→0+ x x x
en vertu du premier lemme. Donc c(k)(0) = 0, et le résultat s’en déduit.

En rassemblant les résultats des lemmes que nous venons de démontrer,

on voit que la fonction de Cauchy c est une fonction indéfiniment dérivable
sur R (ce qui entraı̂ne que chacune de ses dérivées est continue sur R) telle
que, pour tout entier k ≥ 0, on a c(k)(0) = 0. Comme par ailleurs c(x) ≥ 0
pour tout x ∈ R, 0 est un minimant de cette fonction. Par ailleurs, 0 est
un maximant pour la fonction −c, qui a aussi toutes ses dérivées nulles à
l’origine. Enfin, il est facile de vérifier que la fonction d définie par d(x) =
c(x) si x > 0, d(0) = 0 et d(x) = −c(x) si x < 0 a aussi toutes ses dérivées
nulles en 0 mais 0 n’est pas un extrémant local libre de d.
7.6 Séries
Soit f une fonction de R dans Rp et a ∈ dom f tel que f (k) (a) existe pour
chaque entier k ≥ 1. Pour chaque h ∈ R fixé et chaque entier q ≥ 0, on peut
q
considérer la valeur en h Tf,a (h) du développement de Taylor d’ordre q de f
8 9
q
en a. On obtient ainsi une suite Tf,a (h) dans Rp et, a priori, les cinq
q∈N
possibilités
8 9suivantes peuvent se présenter :
q
1. Tf,a(h) est divergente et a + h /∈ dom f − {a}.
8 9q∈N
q
2. Tf,a(h) est divergente et a + h ∈ dom f − {a}.
8 9q∈N
q
3. Tf,a (h) est convergente, a + h ∈ dom f − {a} et
q∈N
q
lim Tf,a (h) = f (a + h).
q→∞
8 9
q
4. Tf,a (h) est convergente, a + h ∈ dom f − {a} et
q∈N
q
lim Tf,a (h) /= f (a + h).
q→∞
8 9
q
5. Tf,a (h) est convergente et a + h /∈ dom f − {a}.
q∈N
La situation 1 se présente pour la fonction f de R dans R définie par f (x) =
q
1−x pour laquelle on a vu plus haut que, pour chaque q ∈ N, Tf,0 (h) =
1
% q q
k=0 h . Dans ce cas, 1 /∈ dom f et Tf,0 (1) = q + 1. La situation 2 se
k
présente pour la même fonction f au point −1 ∈ dom f puisque, pour chaque

q %
q ∈ N, on a Tf,0 (−1) = qk=0 (−1)k = 1 si q est pair et 0 si q est impair,
8 9
q
ce qui entraı̂ne la divergence de la suite Tf,0 (−1) . La situation 3 se
q∈N
7.6. SÉRIES 249
présente pour la même fonction f en chaque h ∈ ] − 1, 1[, puisque, en un tel

point, on a, pour chaque q ∈ N,
q
1 $ hq+1
f (h) = = hk +
1 − h k=0 1−h
q hq+1
= Tf,0(h) + ,
1−h
ainsi qu’on l’a vu plus haut, et dès lors
q hq+1
lim [f (h) − Tf,0 (h)] = lim = 0.
q→∞ q→0 1 − h
La situation 4 se présente pour la fonction de Cauchy c en a = 0 et h > 0.

q
En effet, on a vu que Tc,0 (h) = 0 pour tout h ∈ R, alors que c(h) /= 0 pour
tout h > 0. La situation 5 se présente pour la fonction f de R dans R définie
q
par f (x) = |x−1|
x−1
pour laquelle Tf,0 (h) = −1 pour tout q ∈ N et dès lors
8 9
q
Tf,0 (1) converge alors que 1 /∈ dom f.
q∈N
Pour trouver des conditions sur f sous lesquelles la situation83 se présente,
9
q
il convient donc au prélable d’étudier la convergence de la suite Tf,a (h) .
q∈N
On voit que chaque élément de cette suite s’obtient à partir du précédent
en ajoutant un terme : il s’agit donc d’une suite de sommes dont le nombre
de terme augmente indéfiniment. De telles suites se sont présentées très tôt
dans l’histoire des mathématiques en tant que détermination de la “somme
d’une infinité de nombres réels”. Il s’agit là d’une opération impossible pour
l’arithmétique ou l’algèbre, mais on peut, conformément à la philosophie de
l’analyse, chercher à la réaliser de manière approchée avec une erreur aussi
petite que l’on veut.
Définition. Soit (ak )k∈N une suite dans Rp. Pour chaque q ∈ N, définissons
%
la q e somme partielle de (ak )k∈N par Aq = qk=0 ak . On appelle série de
termes ak la suite (Aq )q∈N des sommes partielles de (ak )k∈N; on la note
%
k∈N ak pour rappeler son mode de construction en fonctions des données
ak .
%
Exemples. 1. k∈N 1 est la suite (q + 1)q∈N, puisque, pour chaque q ∈ N,
%q
k=0 1 = q + 1. 8 9
% (−1)q +1
2. k∈N (−1) k
est la suite 2 , puisque, pour chaque q ∈ N,
q∈N
%q
k=0 (−1) = 1 si q est pair et 0 si q est impair.
k
% 8 9 %q
q(q+1)
3. k∈N k est la suite 2 puisque, pour chaque q ∈ N, k=0 k =
q∈N
q(q+1)
2 . 8 9
% 1−aq+1
4. Pour chaque a ∈ C \ {1}, k∈N ak est la suite 1−a , puisque, pour
q∈N
%q q+1
chaque q ∈ N, k=0 ak = 1−a 1−a . On l’appelle la série géométrique de raison
a. 8 9
%
5. k∈N (k+1)(k+2)
1
est la suite q+1
q+2 puisque, pour chaque q ∈ N,
q∈N
q q 4 5 q q+1
$ 1 $ 1 1 $ 1 $ 1
= − = −
k=0
(k + 1)(k + 2) k=0
k + 1 k + 2 k=0
k + 1 k=1 k + 1
1 q+1
=1− = .
q+2 q+2
Définition. Si la suite (Aq )q∈N converge vers A ∈ Rp , dit que la série

%
k∈N ak converge
%∞
ou est convergente et a pour somme A. Dans ce cas, on
%
pose A = k=0 ak . Si la suite (Aq )q∈N diverge, on dit que la série k∈N ak
diverge ou est divergente.
Le mot “somme” n’a évidemment plus ici l’acception courante; c’est tout
simplement, si elle existe, la limite des sommes partielles Aq lorsque q tend
vers l’infini.
% % %
Exemples. Les séries k∈N 1, k∈N (−1)k et k∈N k des exemples 1 à 3 sont
%
divergentes. La série géométrique k∈N ak de l’exemple 4 converge et a pour
somme 1−a 1
lorsque |a| < 1, puisque, dans ce cas, aq → 0 lorsque q → ∞.
%
Nous verrons plus loin qu’elle diverge si |a| ≥ 1. La série k∈N (k+1)(k+2)1
de
l’exemple 5 converge et a pour somme 1.
Les remarques suivantes sont des conséquences immédiates de la définiti-
on.
%
Remarques. 1. Soit k∈N ak une série dans Rp et, pour m ≥ 1 entier fixé,
%
soit k∈N am+k la série obtenue à partir de la précédente en laissant tomber
ses m premiers termes a0 , a1 , . . . , am−1 . Comme les sommes partielles de
même indice de ces deux séries diffèrent toutes de la quantité constante
%
Am−1 = m−1 k=0 ak , il est clair que les deux séries convergent ou divergent
% %
simultanément. Pour m = 1, la série k∈N a1+k est souvent notée k∈N∗ ak .
% %
Ainsi, la série k∈N (k+1)(k+2)
1
s’écrit également k∈N∗ k(k+1)
1
.
%
2. Par définition, la série k∈N ak est la suite (Aq )q∈N. Réciproquement, à
%
toute suite (bk )k∈N dans Rp on peut associer la série télescopique k∈N (bk −
7.6. SÉRIES 251
bk−1 ) (avec la convention b−1 = 0) dont les sommes partielles

q
$ q
$ q−1
$
(bk − bk−1 ) = bk − bk = bq
k=0 k=0 k=0
redonnent les termes de la suite de départ.

Les règles de calcul des limites et les règles de l’algèbre élémentaire four-
nissent immédiatement les règles de calcul suivantes des séries dans Rp .
% %
Proposition. Soient k∈N ak et k∈N bk des séries dans Rp et soit c ∈ R.
% %
1. Si k∈N ak converge et a pour somme A et k∈N bk converge et a pour
%
somme B, alors k∈N (ak + bk ) converge et a pour somme A + B.
% %
2. Si k∈N ak converge et a pour somme A, alors k∈N cak converge et a
pour somme cA.
%
3. a converge et a pour somme A si et seulement si les p séries réelles
% k∈N k
k∈N k )j convergent%
(a et ont pour sommes respectives Aj (1 ≤ j ≤ p).
%
4. Si les séries réelles k∈N ak et k∈N bk convergent respectivement vers A
et B et sont telles que, pour chaque k ∈ N, on a ak ≤ bk , alors A ≤ B.
Ces règles de calcul généralisent aux séries des règles de calcul élémentai-
res pour les sommes finies. Certaines règles de calcul des sommes finies,
comme l’associativité ou la commutativité, ne s’étendent pas aux séries.
%
Ainsi, la série k∈N (−1)k est divergente (on l’a vu plus haut), alors que la
série qui s’en déduit en groupant deux à deux les termes consécutifs est la
série de termes nuls, qui est évidemment convergente. Nous donnerons plus
loin une classe de séries que l’on peut faire converger vers n’importe quel
réel en permutant les termes.
On dispose d’une condition nécessaire de convergence d’une série
facile à vérifier.
%
Proposition. Si la série k∈N ak converge, alors la suite de ses termes
(ak )k∈N a pour limite zéro.
%
Démonstration. Soit A la somme de la série k∈N ak . Pour chaque
q ∈ N∗ , on a
q
$ q−1
$
aq = ak − ak = Aq − Aq−1 ,
k=0 k=0
et dès lors
lim aq = lim Aq − lim Aq−1 = A − A = 0.
q→∞ q→∞ q→∞
Cette condition n’est pas suffisante pour la convergence d’une série. Ain-
si, la suite des termes de la série
$ 1
1
k∈N (k + 1) 2
tend vers zéro mais, pour chaque q ∈ N, on a
q q
$ 1 $ 1 1
1 ≥ 1 = (q + 1) 2 ,
k=0 (k + 1) 2
k=0 (q + 1) 2
et la suite des sommes partielles diverge. La forme contraposée de cette

condition nécessaire fournit un moyen aisé de vérification de la divergence
de certaines séries. Ainsi, lorsque |a| ≥ 1, la série géométrique de raison a
diverge puisque la suite de ses termes (ak )k∈N ne converge pas vers zéro en
vertu du fait que (|ak |)k∈N = (|a|k )k∈N ne converge pas vers zéro.
Le critère de Cauchy de convergence d’une suite fournit immédiatement
le critère de Cauchy de convergence d’une série.
%
Proposition. La série dans Rp k∈N ak converge si et seulement si
# #
# $ #
# r #
(∀! > 0)(∃m ∈ N)(∀q ∈ N : q ≥ m)(∀r ∈ N : r > q ≥ m) : ## ak ## ≤ !.
#k=q+1 #
2
%
Démonstration. La convergence de la série k∈N ak équivaut, par défini-
tion, à la convergence de la suite (Aq )k∈N de ses sommes partielles. En
appliquant le critère de Cauchy à cette suite et en notant qu’on peut toujours,
sans perte de généralité, y supposer que r > q, on trouve que (Aq )k∈N
converge si et seulement si
(∀! > 0)(∃m ∈ N)(∀q ∈ N : q ≥ m)(∀r ∈ N : r > q ≥ m) : |Ar − Aq |2 ≤ !,
ce qui fournit la thèse puisque
r
$ q
$ r
$
Ar − Aq = ak − ak = ak .
k=0 k=0 k=q+1
% %
Exemples. 1. La série harmonique k∈N k+1 1
= k∈N∗ 1
k est divergente.
En effet, par le critère de Cauchy, il suffit de montrer que
r
$ 1
(∃! > 0)(∀m ∈ N)(∃q ∈ N : q ≥ m)(∃r ∈ N : r > q ≥ m) : > !.
k=q+1
k
7.7. SÉRIES ABSOLUMENT CONVERGENTES 253
En prenant, pour chaque m ∈ N∗ , q = m et r = 2m, on a

2m 2m
$ 1 $ 1 m 1 1
≥ = = > ,
k=m+1
k k=m+1 2m 2m 2 4
et la négation du critère de Cauchy est satisfaite pour ! = 14 .

% k % (−1)k−1
2. La série harmonique alternée k∈N (−1) k+1 = k∈N∗ k est conver-
gente. En effet, pour tout entier q > r, on a
# #
# $ #
# r (−1)k #
# #
# #
#k=q+1 k + 1 #
# #
#r−q−1 j ## r−q−1
# $ (−1) $ (−1)j
= ## #=
# .
# j=0 q + 1 + j # j=0
q+1+j
Dès lors, si r − q est impair, on a

# #
# r # (r−q−1)/2 4 5
# $ (−1)k #
#= 1 − 1 1 1
$
# − ≤ ,
# #
#k=q+1 k + 1 # q+1 l=0
q + 2l q + 2l + 1 q + 1
et, si r − q est pair, on a

# #
# r # (r−q−2)/2 4 5
# $ (−1)k #
#= 1 − 1 1 1 1
$
# − − ≤ .
# k + 1 # q + 1 q + 2l q + 2l + 1 r q + 1
#k=q+1 # l=0
Dès lors, si ! > 0 est donné, il suffit de prendre m ≥ 1

! − 1 pour que la
condition de Cauchy soit satisfaite.
7.7 Séries absolument convergentes

Le critère de Cauchy fournit une importante condition suffisante de con-
vergence d’une série dans Rp .
%
Proposition. Soit k∈N ak une série dans Rp . Si, pour j = 1, 2 ou ∞, la
% %
série à termes positifs k∈N |ak |j converge, alors k∈N ak converge et
#∞ #
#$ # ∞
$
# #
# ak # ≤ |ak |j .
# #
k=0 j k=0
%
Démonstration. Il suffit de vérifier que k∈N ak vérifie le critère de
Cauchy. Pour tout r > q dans N, on a, si j = 1, 2 ou ∞, en vertu de
l’inégalité triangulaire,
# #
# r # r
# $ # $
# ak ## ≤ |aj |j .
#
#k=q+1 # k=q+1
j
%
D’autre part, en vertu du critère de Cauchy de convergence de k∈N |ak |j ,
si ! > 0 est donné, il existe m ∈ N tel que
r
$
(∀q ∈ N : q ≥ m)(∀r ∈ N : r > q ≥ m) : |ak |j ≤ !,
k=q+1
ce qui entraı̂ne aussitôt, par l’inégalité précédente, que

# #
# r #
# $ #
#
(∀q ∈ N : q ≥ m)(∀r ∈ N : r > q ≥ m) : # ak ## ≤ !.
#k=q+1 #
j
%
Donc k∈N ak converge et, en faisant tendre r vers l’infini dans l’inégalité
ci-dessus, on trouve facilement
#∞ #
#$ # ∞
$
# #
# ak # ≤ |ak |j .
# #
k=0 j k=0
%
Remarque. Nous montrerons plus loin que la série k∈N ak peut converger
%
sans que k∈N |ak |j converge. La condition ci-dessus n’est donc pas une
condition nécessaire de convergence. On est ainsi conduit à séparer les séries
%
convergentes en deux classes, selon que k∈N |ak |j converge ou diverge.
% %
Définition. Soit k∈N ak une série dans Rp. On dit que k∈N ak con-
%
verge absolument ou est absolument convergente si k∈N |ak |2 converge. Si
% % %
k∈N ak converge et que k∈N |ak |2 diverge, on dit que k∈N ak converge
non absolument ou converge simplement.
Remarque. En utilisant les inégalités entre normes et le critère de Cauchy,
on vérifie sans peine que la définition de convergence absolue est indépendan-
te du choix particulier de la norme | · |2 .
Exemples. 1. Toute série convergente à termes positifs est évidemment
absolument convergente.
7.7. SÉRIES ABSOLUMENT CONVERGENTES 255
% k
2. La série harmonique alternée k∈N (−1) k+1 est convergente mais la série de
%
ses valeurs absolues k∈N k+1 1
est la série harmonique qui est divergente. La
série harmonique alternée converge donc non absolument.
La convergence d’une série absolument convergente et la valeur de sa
somme ne dépendent pas de l’ordre dans lequel on prend les termes.
%
Proposition. Soit k∈N ak une série dans Rp absolument convergente et
%
soit b : N → N une bijection. Alors la série k∈N ab(k) converge vers la même
somme.
Démonstration. Soit ! > 0; par le critère de Cauchy appliqué à la série
%
k∈N |ak |2 , il existe m ∈ N tel que
r
$ !
(∀q ∈ N : q ≥ m)(∀r ∈ N : r > q ≥ m) : |ak |2 ≤ .
k=q+1
2
Choissons M ∈ N tel que
{0, 1, . . ., m} ⊂ {b(0), b(1), . . ., b(M )}
(par exemple M = max{b−1 (j) : 1 ≤ j ≤ m}). Pour tout entier q ≥ M,

l’expression
q
$ q
$
ak − ab(k)
k=0 k=0
ne contiendra pas les termes a0 , a1 , . . . , am (puisqu’ils sont communs aux

deux sommes), et dès lors, si q ≥ M ,
# q #
#$ q
$ # q
$ $ ! !
# #
# ak − ab(k) # ≤ |ak |2 + |ab(k) |2 ≤ + = !.
#
k=0 k=0
#
k=m+1 {1≤k≤q : b(k)>m}
2 2
2
On en déduit que & '

q
$
lim Aq − ab(k) = 0,
q→∞
k=0
% %∞
et donc que k∈N ab(k) converge vers k=0 ak .
La convergence absolue d’une série dans Rp revient à l’étude de la conver-
gence d’une série à termes positifs. On possède une intéressante condition
nécessaire et suffisante de convergence d’une série à termes posi-
tifs.
% %
Proposition. Soit k∈N ak une série à termes positifs. Alors k∈N ak con-
verge si et seulement si la suite (Aq )q∈N de ses sommes partielles est majorée,
auquel cas
∞
$
ak = sup Aq .
k=0 q∈N
Démonstration. Pour chaque q ∈ N, on a

Aq+1 = Aq + aq+1 ≥ Aq ,
ce qui montre que (Aq )q∈N est croissante. La thèse résulte alors de la con-
dition nécessaire et suffisante de convergence d’une suite croissante vue au
chapitre précédent.
Remarque. La Proposition précédente montre que si l’on regroupe d’une
façon arbitraire les termes d’une série absolument convergente, on obtient
encore une série absolument convergente.
% %
Exemple. La série k∈N (k+1) 1
2 = k∈N∗ k2 est convergente. En effet, pour
1
chaque q ∈ N, on a
q q q 4 5
$ 1 $ 1 $ 1 1 1
≤ 1 + = 1 + − = 1+1− ≤2
k=0
(k + 1) 2
k=1
k(k + 1) k=1
k k + 1 q +1
et la suite des sommes partielles est majorée par 2.
La condition précédente fournit une utile condition suffisante de con-
vergence absolue.
%
Proposition. Soit k∈N ak une série dans Rp . S’il existe un entier m ≥ 0
tel que, pour tout k ≥ m, on ait
1
|ak+1 |2 ≤ |ak |2 ,
2
%
alors k∈N ak converge absolument.
Démonstration. Si k ≥ 0, on a
4 5k
1 1
|am+k |2 ≤ |am+k−1 |2 ≤ . . . ≤ |am |2 ,
2 2
et dès lors, pour tout q ∈ N, on a
8 9q+1
q q 4 5k 1− 1
$ $ 1 2
|am+k |2 ≤ |am |2 = |am |2 ≤ 2|am |2 ,
k=0 k=0
2 1− 1
2
%
ce qui montre que la suite des sommes partielles de la série k∈N |am+k |2
%
est majorée. Donc k∈N am+k converge absolument et il en est de même de
%
k∈N ak .
7.8. SÉRIES NON ABSOLUMENT CONVERGENTES 257
% k
Exemple. Pour chaque z ∈ C, la série exponentielle de z k∈N zk! (ainsi
appelée parce que, pour z réel, ses sommes partielles sont les valeurs en z
des développements de Taylor en 0 d’ordres successifs de la fonction expo-
nentielle) converge absolument. En effet, pour tout k ∈ N, on a
# # # #
# z k+1 # |z|k+1 |z| |z|k 1 # zk #
# # # #
# #= = ≤ # #
# (k + 1)! # (k + 1)! k + 1 k! 2 # k! #
dès que k ≥ 2|z| − 1.
7.8 Séries non absolument convergentes

%
Soit k∈N ak une série réelle. Pour chaque k ∈ N, posons
|ak | + ak
k = max{ak , 0} =
a+ ,
2
|ak | − ak
a−
k = max{−ak , 0} = − min{ak , 0} = .
2
−
Il en résulte aussitôt que, pour chaque k ∈ N, on a ak = a+ k − ak et |ak | =
−
a+k + ak . La suite (ak )k∈N constitue donc la suite des termes positifs de
+
(ak )k∈N et la suite formée des a−

k non nuls constitue la suite des opposés des
termes strictement négatifs de (ak )k∈N . On a une intéressante condition
nécessaire de convergence non absolue d’une série réelle.
%
Proposition. Si la série réelle k∈N ak converge non absolument, alors
% + % −
k∈N ak et k∈N ak divergent.
%
Démonstration. Si, par exemple, k∈N a+ k converge (l’autre cas se trai-
%
tant de même), alors, comme ak = ak − ak , la série k∈N a−
− +
k converge et,
− %
puisque |ak | = a+
k + ak , il en sera de même de k∈N |ak |, en contradiction
avec l’hypothèse.
La propriété précédente permet de montrer qu’on peut faire diverger une
série réelle non absolument convergente en permutant l’ordre de ses termes.
%
Proposition. Si la série réelle k∈N ak converge non absolument, alors il
%
existe une permutation b : N → N telle que k∈N ab(k) diverge.
Démonstration. Par la Proposition précédente, les séries à termes posi-
% % −
tifs k∈N a+ k et k∈N ak divergent et dès lors, par la caractérisation donnée
% %q
avant, les suites de sommes partielles ( qk=0 a+ −
k )q∈N et ( k=0 ak )q∈N ne sont
pas majorées. Effectuons la permutation suivante des termes ak de la série;

retenons d’abord, dans l’ordre des indices, les termes positifs jusqu’à ce que
leur somme soit supérieure ou égale à 1; prenons alors le premier terme
strictement négatif; retenons alors, toujours dans l’ordre des indices, suff-
isamment de termes positifs non encore utilisés pour que leur somme soit
supérieure ou égale à 2; prenons alors le deuxième termes strictement négatif,
et continuons de la sorte. On obtient ainsi une permutation b : N → N telle
%
que la suite des sommes partielles ( qk=0 ab(k) )q∈N contient une sous-suite
dont le ke terme est supérieur à k, ce qui entraı̂ne sa divergence.
Remarques. 1. Un raffinement du raisonnement précédent a été utilisé
dans un travail de Bernhard Riemann publié en 1868 pour montrer que, si
%
k∈N ak est une suite réelle qui converge non absolument,
%
alors, pour chaque
A ∈ R, il existe une permutation b : N → N telle que k∈N ab(k) converge
vers A. Il suffit de remplacer, dans la démonstration précédente, 1, 2, . . . par
A et de tenir compte du fait que la suite des ak converge vers zéro.
2. En rapprochant le résultat précédent de la propriété de conservation de
convergence d’une série absolument convergente après permutation de ses
termes, on voit qu’une série réelle est absolument convergente si et seulement
si toute série obtenue en permutant ses termes est convergente.
7.9 Série de Taylor

Soit f une fonction de R dans Rp et a ∈ dom f tel que f (k) (a) existe pour
chaque k ∈ N, et soit h ∈ R.
Définition. On appelle valeur en h de la série de Taylor de f en a, la série
dans Rp
$ f (k) (a)
hk ,
k∈N
k!
c’est-à-dire la série dont les sommes partielles sont les valeurs en h des
q
développements de Taylor Tf,a .
On a vu précédemment que cette série pouvait être convergente ou di-
vergente, et, dans le cas de la convergence, sa somme pouvait être égale
à f (a + h) ou différente de f (a + h). La formule du reste de Lagrange va
nous permettre de donner une condition suffisante de convergence de
la série de Taylor d’une fonction réelle vers cette fonction.
Proposition. Soit f une fonction de R dans R, a ∈ dom f et r > 0, C ≥
0, M ≥ 0 tels que f (k) (x) existe pour chaque k ∈ N et chaque x ∈ ]a − r, a + r[
7.9. SÉRIE DE TAYLOR 259
et y vérifie l’inégalité
|f (k) (x)| ≤ CM k .
Alors, pour chaque h ∈ ] − r, r[, la valeur en h de la série de Taylor de f en a
$ f (k) (a)
hk
k∈N
k!
% (k) (a)
converge vers f (a + h). En outre, k∈N hk f k! converge absolument.
Démonstration. Par la formule de Lagrange du reste du développement
de Taylor de f en a, on a, pour chaque q ∈ N et chaque h ∈ ] − r, r[,
q
$ f (k) (a) hq+1 f (q+1) (a + θq h)
f (a + h) − hk = ,
k=0
k! (q + 1)!
pour un certain θq ∈ ]0, 1[. En conséquence, on a
# #
# $q (k)
(a) ## (M |h|)q+1 (M r)q+1
# kf
#f (a + h) − h #≤C ≤C ,
#
k=0
k! # (q + 1)! (q + 1)!
% (M r)k
et, puisque la série exponentielle k∈N k! converge, la suite de ses termes
% kf
(k) (a)
tend vers zéro et k∈N h k! converge vers f (a + h). Pour montrer que
% (k) (a)
k∈N hk f k! converge absolument, il suffit de noter que, pour tout entier
r > q, on a
r r
$ |f (k) (a)| $ (M r)k
|h|k ≤C ,
k=q+1
k! k=q+1
k!
et que, si ! > 0 est donné, la convergence absolue de la série exponentielle en-
traı̂ne l’existence d’un entier positif m tel que le second membre soit inférieur
à ! si r > q ≥ m.
Exemple. Puisque, r > 0 étant donné, on a, pour tout x ∈ ] − r, r[ et tout
entier k ≥ 0,
(exp)(k) (x) = exp x ≤ exp r,
on peut prendre C = exp r et M = 0 dans la Proposition précédente et en
conclure que, pour tout h ∈ ] − r, r[,
∞
$ hk
exp h = .
k=0
k!
Comme r est arbitraire, cette égalité entre la valeur en h de la fonction
exponentielle et la somme de la série exponentielle de h est valable pour
tout h ∈ R.
Définition. Soit f une fonction de R dans R, a ∈ int dom f , tels que, pour
chaque k ∈ N, f (k) (a) existe. On dit que f est analytique en a s’il existe
r > 0 tel que ]a − r, a + r[ ⊂ dom f et tel que, pour tout h ∈ ] − r, r[, on ait
∞
$ f (k) (a)
f (a + h) = hk .
k=0
k!
Ainsi, la fonction exponentielle est analytique en chaque point de R, mais

la fonction de Cauchy n’est pas analytique en 0.
7.10 Fonctions trigonométriques

Pour chaque x ∈ R, considérons les séries
$ (−1)k x2k+1
k∈N
(2k + 1)!
et
$ (−1)k x2k
.
k∈N
(2k)!
Puisque, pour tout k ∈ N, on a

# # # #
# (−1)k+1 x2(k+1)+1 # |x|2 # (−1)k x2k+1 #
# # # #
# #= # #,
# (2(k + 1) + 1)! # (2k + 2)(2k + 3) (2k + 1)! #
#
et # # # #
# (−1)k+1 x2(k+1) # |x|2 # (−1)k x2k #
# # # #
# #= # #,
# (2(k + 1)! # (2k + 1)(2k + 2) # (2k)! #
et qu’il existe un entier positif m tel que
|x|2 |x|2 1
≤ ≤
(2k + 2)(2k + 3) (2k + 1)(2k + 2) 2
pour tout entier k ≥ m, on peut appliquer une condition suffisante donnée

plus haut pour conclure à la convergence absolue de ses deux séries. On pose
alors
∞
$ (−1)k x2k+1
sin x = ,
k=0
(2k + 1)!
7.10. FONCTIONS TRIGONOMÉTRIQUES 261
et
∞
$ (−1)k x2k
cos x = ,
k=0
(2k)!
ce qui définit respectivement sur R l’application sinus et l’application cosi-
nus, qui sont les fonctions trigonométriques fondamentales. En particulier,
on a sin 0 = 0 et cos 0 = 1, et, pour chaque x ∈ R,
sin(−x) = − sin x, cos(−x) = cos x.
Proposition. Pour chaque x ∈ R, sin et cos sont dérivables en x et
(sin)$ (x) = cos x, (cos)$ (x) = − sin x.
Démonstration. Soit x ∈ R et q ∈ N; considérons, pour fixer les idées,

le cas de sin, l’autre se traitant de manière similaire. Posons, pour chaque
x ∈ R et chaque q ∈ N∗ ,
q
$ (−1)k x2k+1
Sq (x) = ,
k=0
(2k + 1)!
et
q
$ (−1)k x2k
Cq (x) = .
k=0
(2k)!
Un calcul simple montre que
Sq$ (x) = Cq (x), Sq$$(x) = −Sq−1 (x).
Par la formule de Lagrange du reste du développement de Taylor, il existe,

pour chaque h ∈ R, et chaque q ∈ N∗ , un θq ∈ ]0, 1[ tel que
h2 $$
Sq (x + h) − Sq (x) = hSq$ (x) + S (x + θq h),
2! q
et dès lors tel que, si h /= 0,
Sq (x + h) − Sq (x) h
= Cq (x) − Sq−1 (x + θq h).
h 2
On a
Sq (x + h) − Sq (x) sin(x + h) − sin x
lim = ,
q→∞ h h
et
lim Cq (x) = cos x,
q→∞
ce qui entraı̂ne que, pour chaque h /= 0,

4 5
1 sin(x + h) − sin x cos x
L(x, h) = lim − Sq−1 (x + θq h) = − .
q→∞ 2 h2 h
D’autre part, pour chaque q ∈ N∗ et chaque h tel que |h| ≤ 1, on a
q−1 2q−1
$ (|x| + |h|)|2k+1 $ (|x| + 1)j
|Sq−1 (x + θq h)| ≤ ≤ ≤ exp(|x| + 1),
k=0
(2k + 1)! j=0
j!
et dès lors, pour ces mêmes valeurs de h, on a
|L(x, h)| ≤ exp(|x| + 1).
En conséquence, pour tout 0 < |h| ≤ 1, on a

# #
# sin(x + h) − sin x #
#
# − cos x # = |hL(x, h)| ≤ |h| exp(|x| + 1),
#
h
ce qui montre que

sin(x + h) − sin x
lim = cos x.
h→0 h
Les résultats suivants sont des conséquences de la proposition précédente.

Les deux premiers sont immédiats.
Corollaire. sin et cos sont continues en chaque x ∈ R.
Corollaire. Pour chaque x ∈ R et chaque entier k ≥ 1, sin(k) (x) et cos(k) (x)

existent et, si l ∈ N∗ ,
(sin)(2l)(x) = (−1)l sin x, (sin)(2l−1)(x) = (−1)l−1 cos x,
(cos)(2l)(x) = (−1)l cos x, (cos)(2l−1)(x) = (−1)l sin x,
et les fonctions sin et cos sont analytiques en chaque point de R.

Corollaire. Pour tout x ∈ R, on a
sin2 x + cos2 x = 1.
Démonstration. Définissons l’application f de R dans R par f (x) =

sin x + cos2 x (avec sin2 x = (sin x)2 , cos2 x = (cos x)2 ). f est évidemment
2
dérivable en chaque point x ∈ R et
f $ (x) = 2 sin x cos x − 2 cos x sin x = 0.
En conséquence, f est constante sur R et, en particulier, pour tout x ∈ R,

on a
f (x) = f (0) = 1.
Ce Corollaire entraı̂ne en particulier que, pour tout x ∈ R, on a
| sin x| ≤ 1, | cos x| ≤ 1.
Corollaire. Pour tout x ∈ R et tout y ∈ R, on a
sin(x + y) = sin x cos y + cos x sin y,
cos(x + y) = cos x cos y − sin x sin y.

Démonstration. y ∈ R étant fixé, définissons l’application f de R dans
R par
f (x)
= [sin(x+y)−sin x cos y −cos x sin y]2 +[cos(x+y)−cos x cos y +sin x sin y]2 .
Cette fonction est évidemment dérivable en tout x ∈ R, et l’on a
f $ (x)
= 2[sin(x + y) − sin x cos y − cos x sin y][cos(x + y) − cos x cos y + sin x sin y]
+2[cos(x + y) − cos x cos y + sin x sin y][− sin(x + y) + sin x cos y + cos x sin y]
= 0.
Donc f est constante sur R, et en particulier, pour tout x ∈ R, on a
f (x) = f (−y) = (0 + sin y cos y − cos y sin y)2 + (1 − cos2 y − sin2 y) = 0,
ce qui entraı̂ne aussitôt la thèse.

Ce dernier résultat est appelé la formule d’addition pour les fonc-

tions trigonométriques.
Etudions maintenant les zéros des fonctions trigonométriques.
Proposition. Il existe un réel π > 0 tel que
π
cos x = 0 ⇔ x = + kπ, (k ∈ Z),
2
sin x = 0 ⇔ x = kπ, (k ∈ Z),
sin(x + π) = − sin x, cos(x + π) = − cos x, (x ∈ R).
Démonstration. On sait que cos 0 = 1 > 0. D’autre part, en utilisant
la formule du reste de Lagrange du développement de Taylor, pour chaque
x ∈ R, il existe θ ∈ ]0, 1[ tel que
x 2 x4
cos x = 1 − + cos θx,
2! 4!
et dès lors
2 1
cos 2 = 1 − 2 + cos 2θ ≤ − < 0.
3 3
Le théorème de Bolzano entraı̂ne alors l’existence d’au moins un zéro dans
]0, 2[. L’ensemble Z de ces zéros est fermé, car si (ak )k∈N est une suite dans
Z convergeant vers a∗ ∈ R, alors a∗ ∈ [0, 2], et les relations
cos ak = 0, (k ∈ N),
et la continuité de cos entraı̂nent que cos a∗ = 0, et donc a∗ ∈ Z. Par

ailleurs, si a ∈ [0, 2] est un zéro de cos, alors (cos)$ (a) = − sin a = ±1,
et, par continuité, il existe δ(a) > 0 tel que (cos)$ (x) /= 0 pour tout x ∈
[a − δ(a), a + δ(a)]. En conséquence, cos est injective sur [a − δ(a), a + δ(a)]
et a est donc le seul zéro de cos dans [a − δ(a), a + δ(a)]. Le lemme de
Cousin
A j j B
appliqué à Z et à la jauge δ entraı̂ne l’existence d’une famille finie
(a , Z ) 1≤j≤m telle que
m
>
Z= Z j , aj ∈ Z j ⊂ [aj − δ(aj ), aj + δ(aj )], (1 ≤ j ≤ m).
j=1
Il en résulte que cos possède m zéros sur [0, 2]. Désignons par π2 le plus
petit zéro de cos appartenant à ]0, 2[. Comme cos 0 = 1 > 0, on a, par
le théorème de Bolzano, cos x > 0 pour tout x ∈ [0, π2 [, et donc pour tout
x ∈ ] − π2 , π2 [ puisque cos(−x) = cos x. Il en résulte que la fonction sin est

strictement croissante sur ] − π2 , π2 [, et donc strictement négative sur ] − π2 , 0[
et strictement positive sur ]0, π2 [, puisque sin 0 = 0. En conséquence, comme
sin2 π2 = 1, on doit avoir
4 5
π π
− sin − = sin = 1.
2 2
La formule d’addition entraı̂ne alors que, pour tout x ∈ R, on a
4 5 4 5
π π
cos x + = − sin x, sin x + = cos x, (x ∈ R)
2 2
ce qui montre que cos x < 0 pour tout x ∈ ] π2 , 3π2 [, cos 2 = 0, sin x > 0 pour
3π
tout x ∈ ] 2 , π[ et que sin π = 0. On déduit alors de la formule ci-dessus que,

π
pour tout x ∈ R, on a
4 5 4 5
π π π
sin(x + π) = sin x + + = cos x + = − sin x,
2 2 2
4 5 4 5
π π π
cos(x + π) = cos x + + = − sin x + = − cos x,
2 2 2
ce qui, combiné avec les propriétés de sin sur [−π, π] et de cos sur [− π2 , π2 ],
achève la démonstration.
Remarques. 1. Le résultat précédent entraı̂ne évidemment que, pour tout
x ∈ R, on a
sin(x + 2π) = sin x, cos(x + 2π) = cos x,
c’est-à-dire que les fonctions trigonométriques sont périodiques de période
2π.
2. Le réel π ainsi introduit se rencontre dans de très nombreuses questions de
mathématique. Johann Lambert a montré en 1767 que π était irrationnel,
Adrien-Marie Legendre a montré en 1794 que π 2 l’était aussi. Il a fallu at-
tendre 1882 pour que Ferdinand Lindemann prouve que π était un nombre
transcendant, c’est-à-dire qu’il n’était pas racine d’une équation algébrique à
coefficients entiers, prouvant ainsi l’impossibilité de la quadrature du cercle.
3. Le calcul des décimales de π peut servir de mesure du progrès des
mathématiques et de la science du calcul. Le Livre des Rois de l’Ancien
Testament fournit π = 3, Archimède, au 3e siècle avant J.C. fournit 3
décimales exactes
π = 3, 141 . . ..
En 1593, le record était détenu par un professeur de l’Université de Louvain,

Adriaen van Roomen ou Romain, avec 15 décimales exactes. En 1873-74,
William Shanks calcula 707 décimales de π et il fallut attendre 1945 pour
que D.F. Ferguson montre que le calcul de Shanks était faux à partir de
la 528e décimale. On entre alors dans l’ère du calcul des décimales de π à
l’aide des ordinateurs. On en connaı̂t actuellement plus d’un milliard (la
milliardième décimale de π est un 9). Nous nous contenterons ici de donner
l’approximation plus modeste
π = 3, 14159265358979323846264338327950288419716939937510 . . ..
Comme sin est strictement croissante sur l’intervalle ] − π2 , π2 [, avec pour

limites respectives −1 et 1 lorsque x tend vers − π2 et vers π2 , elle possède une
fonction réciproque, appelée l’arc sinus, notée arcsin et définie sur ] − 1, 1[.
Par les résultats sur les fonctions monotones, arc sin sera dérivable en chaque
point x ∈ ] − 1, 1[, et
1 1
(arcsin)$ (x) = =
(sin)$ (arcsin x) cos(arcsin x)
1 1
= = .
(1 − sin (arcsin x))
2 1/2 (1 − x2 )1/2
De même, cos étant strictement décroissante sur l’intervalle ]0, π[, avec pour
limites respectives 1 et −1 lorsque x tend vers 0 et vers π, elle possède une
fonction réciproque, appelée l’arc cosinus, notée arcos et définie sur ] − 1, 1[.
Elle est dérivable en chaque x ∈ ] − 1, 1[, et
1 1
(arcos)$ (x) = =−
(cos)$ (arcos x) sin(arcos x)
1 1
=− =− .
(1 − cos2 (arcos x))1/2 (1 − x2 )1/2
Comme, pour tout x ∈ ] − 1, 1[, on a
(arcsin)$ (x) + (arcos)$ (x) = 0,
et que
π
arcsin 0 + arcos 0 = ,
2
on aura, pour tout x ∈ ] − 1, 1[,
π
arcsin x + arcos x = .
2
7.11. EXPONENTIELLES IMAGINAIRES ET COMPLEXES 267
A partir des fonctions sinus et cosinus, on définit la fonction tangente par

sin x
tg x = .
cos x
En conséquence,
π
dom tg = {x ∈ R : x /= + kπ, (k ∈ Z)},
2
et, pour chaque x ∈ dom tg, on a
1
tg (x + π) = tg x, (tg)$ (x) = ,
cos2 x
Il en résulte en particulier que tg est strictement croissante sur ] − π2 , π2 [,
avec comme limites respectives −∞ et +∞ lorsque x tend vers − π2 et vers π2 .
On peut donc définir sa fonction réciproque, appelée l’arc tangente et notée
arctg, sur R, et l’on aura
1
(arctg)$ (x) = = cos2 (arctg x)
(tg)$ (arctg x)
1
,=
1 + x2
puisque, pour tout x ∈ dom tg, on a
cos2 x 1
cos2 x = = .
sin x + cos x
2 2 1 + tg 2 x
7.11 Exponentielles imaginaires et complexes

Il existe une relation remarquable entre les fonctions trigonométriques et la
série exponentielle.
Proposition. Pour tout x ∈ R, on a
∞
$ (ix)k
= cos x + i sin x.
k=0
k!
Démonstration. On a, en effet, pour tout x ∈ R, puisque i2k = (−1)k

et que l’on peut permuter l’ordre des termes dans les séries absolument
convergentes,
∞ ∞ ∞
$ (ix)2j $ (ix)2j+1 $ (ix)k
cos x + i sin x = + = .
j=0
(2j)! j=0
(2j + 1)! k=0
k!
On est ainsi conduit à définir l’application exponentielle imaginaire de R

dans C par
∞
$ (ix)k
exp ix = .
k=0
k!
Elle vérifie donc la relation
exp ix = cos x + i sin x,
pour tout x ∈ R. En particulier, on a, pour tout x ∈ R,
| exp ix| = (cos2 x + sin2 x)1/2 = 1.
La fonction exponentielle imaginaire vérifie une formule d’addition sem-

blable à celle de l’exponentielle réelle.
exp i(x + y) = (exp ix).(exp iy).
Démonstration. On a, en utilisant la relation précédente et la formule

d’addition des fonctions trigonométriques,
(exp ix).(exp iy) = (cos x + i sin x)(cos y + i sin y)
= cos x cos y − sin x sin y + i(sin x cos y + cos x sin y)

= cos(x + y) + i sin(x + y) = exp i(x + y).
En particulier, on a, pour tout entier n ≥ 1 et tout x ∈ R,
exp(inx) = (exp ix)n ,
c’est-à-dire
cos nx + i sin nx = (cos x + i sin x)n ,
C’est la formule de Moivre qui permet, en calculant le second membre
par la formule du binôme de Newton et en égalant les parties réelles et
imaginaires des deux membres, d’exprimer cos nx et sin nx en termes des
puissances de sin x et cos x de degré inférieur ou égal à n.
L’exponentielle imaginaire possède des propriétés de dérivation intéres-
santes.
7.11. EXPONENTIELLES IMAGINAIRES ET COMPLEXES 269
Proposition. exp(i·) est dérivable en chaque x ∈ R et
D(exp ix) = i exp ix.
D(exp ix) = D(cos x+i sin x) = − sin x+i cos x = i(cos x+i sin x) = i exp ix.
On peut unifier la théorie des fonctions exponentielles et trigonométri-

ques en introduisant de nouvelles fonctions élémentaires de R dans C, les
exponentielles complexes.
Définition. Soit a = b + ic ∈ C. L’exponentielle complexe exp(a·) est la
fonction de R dans C définie, pour chaque x ∈ R par la formule
exp ax = (exp bx).(exp icx) = (exp bx).(cos cx + i sin cx).
Si a = b est réel, on retrouve l’exponentielle réelle exp(b·) et si a = ic

est imaginaire pur, on retrouve le composé de la fonction réelle x 2→ cx avec
la fonction exponentielle imaginaire. Nous allons voir que l’exponentielle
complexe conserve les propriétés essentielles de l’exponentielle réelle.
Proposition. Pour chaque x ∈ R et chaque entier k ≥ 1, exp(a·) est k-fois
dérivable en x et l’on a
D k [exp(ax)] = ak exp ax.
En outre, pour tout x ∈ R, on a
| exp ax| = exp bx,
et en particulier exp ax /= 0 quel que soit x ∈ R. De plus, pour chaque x ∈ R

et chaque y ∈ R, on a
exp a(x + y) = (exp ax).(exp ay),
ce qui entraı̂ne en particulier que, pour chaque x ∈ R, on a
exp(−ax) = (exp ax)−1 .
Enfin, pour chaque x ∈ R, on a
exp ax = exp āx.

Démonstration. Le fait que exp(a·) soit k fois dérivable en chaque x ∈

R résulte de ce que les fonctions élémentaires réelles exp, cos et sin sont
indéfiniment dérivables et des règles de dérivabilité de la somme, du produit
et du composé de deux fonctions. D’ailleurs, on a, pour chaque x ∈ R,
D[exp(ax)] =
(b exp bx). exp icx + (exp bx).(ic) exp icx =

(b + ic)(exp bx)(exp icx) = a exp ax,
et la formule pour les dérivées d’ordre supérieur s’en déduit aussitôt de
proche en proche. En outre, on a
| exp ax| = | exp bx|| exp icx| = exp bx,
exp a(x + y) = [exp b(x + y)].[exp ic(x + y)] =

(exp bx).(exp by).[(exp(icx)).(exp(icy))]
= (exp bx).(exp(icx))(exp by).(exp(icy)) = (exp ax).(exp ay),
(exp ax).[exp(−ax)] = exp a(x − x) = exp 0 = 1.
Enfin,
exp ax = (exp bx).(cos cx + i sin cx) = (exp bx).(cos cx − i sin cx) = exp āx.
7.12 Dérivées partielles d’ordre supérieur

Soit f une fonction de Rn dans Rp dérivable en au moins un point intérieur
à dom f. On peut alors lui associer la fonction df de Rn dans l’ensemble
L(Rn , Rp) des applications linéaires de Rn dans Rp de domaine
dom df = {x ∈ int dom f : f est dérivable en x},
définie par df (x) = fx$ . Cette fonction s’appelle la fonction différentielle ou la

fonction dérivée totale de f et l’on voit que ce n’est plus une fonction de Rn
dans Rp mais bien une fonction de Rn dans L(Rn , Rp). Nous ne considérerons
pas ici le problème de la continuité et de la dérivabilité d’une telle fonction.
Par contre, si j est un entier compris entre 1 et n et si la fonction f de
Rn dans Rp est telle que la dérivée partielle Dj f (x) existe en au moins un
7.12. DÉRIVÉES PARTIELLES D’ORDRE SUPÉRIEUR 271
point x ∈ Rn , on peut lui associer, comme nous l’avons déjà fait à plusieurs
reprises, la fonction
Dj f : Rn → Rp, x 2→ Dj f (x),
de domaine
dom Dj f = {x ∈ dom f : Dj f (x) existe}.
∂f
On la note également fj$ ou ∂x j
ou ∂j f. Si k est un entier compris entre 1
et n et si la fonction Dj f possède elle-même en x ∈ dom Dj f une dérivée
partielle Dk (Dj f )(x) par rapport à la ke variable, on peut définir la fonction
dérivée partielle seconde de f par rapport à la j e et puis la ke variable par
2
Djk f : x 2→ Djk
2
f (x) = Dk (Dj f )(x).
Son domaine est donc l’ensemble des points du domaine de Dj f en lesquels

cette fonction possède une dérivée partielle par rapport à la ke variable.
Comme Djk 2 f , que l’on note aussi f $$ ou ∂ 2 f
∂xk ∂xj ou ∂jk f est elle-même une
2
jk
fonction de Rn dans Rp , on peut évidemment continuer le processus et con-
sidérer, lorsqu’elle existe, la fonction dérivée troisième Dlkj3 f de f par rap-
port à la j , puis la k , et puis la l variable, et ainsi de suite, et arriver ainsi,

e e e
si m est un entier strictement positif et si j1 , j2 , . . ., jm sont des entiers com-

pris entre 1 et n à la fonction dérivée me de f par rapport successivement
aux j1e , j2e , . . . , jm
e
variables.
Exemples. 1. Soit f l’application de R2 dans R définie par
f (x) = f (x1 , x2 ) = x21 x2 .
On a évidemment, pour chaque x = (x1 , x2 ) ∈ R2 ,
D1 f (x) = 2x1 x2 , D2 f (x) = x21 ,
et dès lors
2
D11 f (x) = 2x2 , D12
2
f (x) = 2x1 , D21
2
f (x) = 2x1 , D22
2
f (x) = 0,
3
D111 f (x) = 0, D112
3
f (x) = 2, D121
3
f (x) = 2, D122
3
f (x) = 0,
3
D211 f (x) = 2, D212
3
f (x) = 0, D221
3
f (x) = 0, D222
3
f (x) = 0,
et dès lors toutes les fonctions dérivées partielles d’ordre supérieur ou égal à
quatre seront nulles. On constate sur cet exemple que
2
D12 f = D21
2 3
f, D112 f = D121
3
f = D211
3
f,
3
D122 f = D212
3
f = D221
3
f.
2. Soit f l’application de R2 dans R définie par f (0, 0) = 0 et
x21 − x22
f (x1 , x2 ) = x1 x2 si (x1 , x2 ) /= (0, 0).
x21 + x22
On calcule aisément que
D1 f (0, x2 ) = −x2 si x2 /= 0, D1 f (0, 0) = 0,
D2 f (x1 , 0) = x1 si x1 /= 0, D2 f (0, 0) = 0,
et dès lors
D1 f (0, h) − D1 f (0, 0) −h
2
D12 f (0, 0) = lim = lim = −1,
h→0 h h→0 h
D2 f (h, 0) − D2 f (0, 0) h
2
D21 f (0, 0) = lim = lim = 1.
h→0 h h→0 h
On constate dans ce cas que D12 2 f (0, 0) /= D 2 f (0, 0).

21
Ce dernier exemple montre que l’existence de D12 2
f (a) et D21
2
f (a) n’en-
traı̂ne pas leur égalité. Notons que
D1 f (a1 , a2 + h2 ) − D1 f (a1 , a2 )
2
D12 f (a) = lim
h2 →0 h2
2
1 f (a1 + h1 , a2 + h2 ) − f (a1 , a2 + h2 )
= lim lim
h2 →0 h2 h1 →0 h1
3
f (a1 + h1 , a2 ) − f (a1 , a2 )
− lim =
h1 →0 h1
2 3
f (a1 + h1 , a2 + h2 ) − f (a1 , a2 + h2 ) − f (a1 + h1 , a2 ) + f (a1 , a2 )
lim lim
h2 →0 h1 →0 h1 h2
et que, de même,
2
D21 f (a) =
2 3
f (a1 + h1 , a2 + h2 ) − f (a1 + h1 , a2 ) − f (a1 , a2 + h2 ) + f (a1 , a2 )
lim lim
h1 →0 h2 →0 h1 h2
L’égalité des deux expressions revient donc à la possibilité de permuter
l’ordre des limites d’une même fonction de deux variables, et cette permuta-
tion n’est assurée que si certaines conditions supplémentaires sont remplies.
Un premier résultat dans cette direction est le théorème de Schwarz.
Théorème. Soit f une fonction de Rn dans Rp , 1 ≤ i /= j ≤ n des entiers,

et V un voisinage de a ∈ Rn tels que les fonctions Di f, Dj f, Dij 2 f et D 2 f
ji
2 2
soient définies sur V . Si Dij f et Dji f sont continues en a, alors
2
Dij f (a) = Dji
2
f (a).
Démonstration. En passant si nécessaire aux composantes de f, il suffit

de démontrer le résultat lorsque p = 1. La thèse revient à démontrer que,
pour tout ! > 0, on a
2
|Dij f (a) − Dji
2
f (a)| ≤ !.
Soit donc ! > 0; par hypothèse, il existe δ > 0 tel que B2 [a; δ] ⊂ V et tel
que, pour tout h ∈ R2 vérifiant |h|2 ≤ δ, on ait
! !
2
|Dij f (a + h) − Dij
2
f (a)| ≤ , |Dji
2
f (a + h) − Dji
2
f (a)| ≤ .
2 2
Si h = hi ei + hj ej ∈ B2 [δ], avec h1 /= 0 et h2 /= 0, on a, en appliquant deux
fois le théorème de Lagrange,
f (a + hi ei + hj ej ) − f (a + hi ei ) − f (a + hj ej ) + f (a)
= [f (a + hi ei + hj ej ) − f (a + hi ei )] − [f (a + hj ej ) − f (a)]
= hi Di [f (a + θi hi ei + hj ej ) − f (a + θi hi ei )]
= hi [Di f (a + θi hi ei + hj ej ) − Dif (a + θi hi ei )]
= hi hj Dij
2
f (a + θi hi ei + θj hj ej ),
pour un certain θi ∈ ]0, 1[ et un certain θj ∈ ]0, 1[. De même, en groupant les
termes différemment,
= [f (a + hi ei + hj ej ) − f (a + hj ej )] − [f (a + hi ei ) − f (a)]
= hj Dj [f (a + hi ei + θj$ hj ej ) − f (a + θj$ hj ej )]
= hj [Dj f (a + hi ei + θj$ hj ej ) − Dj f (a + θj$ hj ej )]
= hj hi Dji
2
f (a + θi$ hi ei + θj$ hj ej ),
pour un certain θi$ ∈ ]0, 1[ et un certain θj$ ∈ ]0, 1[. Dès lors,
2
Dij f (a + θi hi ei + θj hj ej )
=
hi hj
= Dji
2
f (a + θi$ hi ei + θj$ hj ej ),
avec
θi hi ei + θj hj ej ∈ B2 [δ], θi$ hi ei + θj$ hj ej ∈ B2 [δ].
En conséquence, on a
2
|Dij f (a) − Dji
2
f (a)|
= |Dij
2
f (a) − Dij
2
f (a + θi hi ei + θj hj ej )
+Dji
2
f (a + θi$ hi ei + θj$ hj ej ) − Dji
2
f (a)|
2
≤ |Dij f (a) − Dij
2
f (a + θi hi ei + θj hj ej )|
+|Dji
2
f (a + θi$ hi ei + θj$ hj ej ) − Dji
2
f (a)|
! !
≤ + = !.
2 2
Une autre condition suffisante pour que Dij

2
f (a) = Dji
2
f (a) est donnée
par le théorème de Young.
Théorème. Soit f une fonction de Rn dans Rp , 1 ≤ i /= j ≤ n des entiers
et V un voisinage de a ∈ Rn tels que les fonctions Di f et Dj f soient définies
sur V et (totalement) dérivables en a. Alors
2
Dij f (a) = Dji
2
f (a).
Démonstration. Comme dans la démonstration du théorème de Schwarz,

on introduit la fonction F de R2 dans Rp par
F (hi , hj ) = f (a + hi ei + hj ej ) − f (a + hi ei ) − f (a + hj ej ) + f (a).
L’idée consiste ici à montrer que
F (h, h)
2
Dij f (a) = lim = Dji
2
f (a).
h→0 h2
Soit ! > 0; par hypothèse, il existe δ > 0 tel que B2 [a; δ] ⊂ V et tel que
|Dif (a + hi ei + hj ej ) − Di f (a) − hi Dii

2
f (a) − hj Dij
2
f (a)|2
!
≤ |(hi , hj )|2 ,
2
|Dj f (a + hi ei + hj ej ) − Dj f (a) − hi Dji
2
f (a) − hj Djj
2
f (a)|2
!
≤ |(hi , hj )|2 ,
2
lorsque |(hi, hj )|2 ≤ δ. Si nous définissons la fonction G de R dans Rp par
G(u) = f (a + uei + hj ej ) − f (a + uej ) − uhj Dij
2
f (a),
nous pouvons lui appliquer l’inégalité de la moyenne entre 0 et h1 , qui fournit
l’existence d’un θi ∈ ]0, 1[ tel que
|G(hi) − G(0)|2 ≤ |hi ||G$ (θi hi )|2 ,
c’est-à-dire, en explicitant et en utilisant la première inégalité ci-dessus,
|F (hi , hj ) − hi hj Dij
2
f (a)|2
≤ |hi ||Dif (a + θi hi ei + hj ej ) − Di f (a + θi hi ei ) − hj Dij
2
f (a)|2
≤ |hi ||Dif (a + θi hi + hj ej ) − Di f (a) − θi hi Dii
2
f (a) − hj Dij
2
f (a)|2
+|hi ||Dif (a + θi hi ei ) − Di f (a) − θi hi Dii
2
f (a)|2
! !
≤ |hi ||(θihi , hj )|2 + |hi ||(θi hi , 0)|2
2 2
≤ !|(hi , hj )|22 .
De même, en définissant la fonction H de R dans Rp par
H(v) = f (a + hi ei + vej ) − f (a + vej ) − hi vDji
2
f (a),
en lui appliquant l’inégalité de la moyenne entre 0 et hj , en explicitant et en
utilisant la deuxième inégalité ci-dessus, on obtient
|F (hi , hj ) − hj hi Dji
2
f (a)|2 ≤ !|(hi , hj )|22 ,
lorsque |(hi , hj )|2 ≤ δ. Dès lors, si h ∈ R est tel que 0 < |h| ≤ δ
21/2
, on aura
0 < |(h, h)|2 ≤ δ, et dès lors
# #
# F (h, h) #
#
# h2 − D 2
ij f (a) # ≤ !,
#
2
# #
# F (h, h) #
# 2
− Dji f (a)## ≤ !,
# h2
2
c’est-à-dire
F (h, h)
2
Dij f (a) = lim = Dji
2
f (a).
h→0 h2
Introduisons maintenant une classe importante de fonctions de Rn dans

Rp .
Définition. Soit f une fonction de Rn dans Rp , E un ouvert non vide de
Rn et k ≥ 1 un entier. On dira que f est de classe C k sur E, et l’on écrira
f ∈ C k (E; Rp), si f est continue sur E et si toutes les fonctions dérivées
partielles de f jusqu’à l’ordre k
Di1 f, Di21 i2 f, . . . , Dik1i2 ...ik f, (1 ≤ i1 , . . . , ik ≤ n)
sont définies et continues sur E.

On notera que si f ∈ C k (E; Rp), alors, pour chaque 1 ≤ j ≤ k, on a
évidemment f ∈ C j (E; Rp); en outre, par la condition suffisante de dérivabi-
lité en termes de la continuité des dérivées partielles, la fonction f et toutes
les dérivées partielles de f jusqu’à l’ordre k − 1 seront dérivables en chaque
point de E; enfin, pour chaque 1 ≤ j ≤ k, chaque dérivée partielle d’ordre j
de f sera de classe C k−j sur E.
On étend comme suit cette notion au cas où E n’est pas nécessairement
ouvert.
Définition. Soit f une fonction de Rn dans Rp, E une partie non vide de
Rn et k ≥ 1 un entier. On dira que f est de classe C k sur E, et l’on écrira
f ∈ C k (E; Rp), s’il existe un ouvert Ẽ ⊃ E et une fonction f˜ ∈ C k (Ẽ; Rp)
telle que f˜|E = f.
Lorsque f ∈ C k (E; Rp) pour tout entier k ≥ 1, on dit que f est indéfini-
ment continûment dérivable sur E, et l’on écrit f ∈ C ∞ (E; Rp). Par exten-
sion, si f est continue sur E, on dira qu’elle est de classe C 0 sur E, on écrira
f ∈ C 0 (E; Rp), et on posera Dj0 f (a) = f (a).
Le théorème de Schwarz ou le théorème de Young entraı̂nent, pour une
fonction de classe C k (k ≥ 2), l’important théorème d’interversion des
dérivées partielles.
Théorème. Soit k ≥ 2 un entier et f une fonction de Rn dans Rp de classe
C k sur un voisinage ouvert V de a ∈ Rn . Alors, pour tout 1 ≤ i1 , i2 , . . . , ik ≤
n et tout entier 1 ≤ j ≤ k − 1, on a
Dik1 i2 ...ij ij+1 ...ik f (a) = Dik1 i2 ...ij+1 ij ...ik f (a).
Démonstration. Elle se fait par récurrence sur l’ordre de dérivation. Le

résultat est vrai pour k = 2 en vertu du théorème de Schwarz (ou de Young).
Supposons maintenant le résultat vrai pour les fonctions de classe l − 1 sur
V , avec 3 ≤ l ≤ k − 1, et montrons qu’il est vrai pour celles de classe l sur

V . On a, si 1 ≤ j ≤ l − 2,
Dil1 ...ij ij+1 ...il f (a) = Dil (Dil−1

1 ...ij ij+1 ...il−1
f )(a)
= Dil (Dil−1
1 ...ij+1 ij ...il−1
f )(a)
= Dil1 ...ij+1 ij ...il f (a),

et, si j = l − 1,
Dil1 ...il−1 il f (a) = Di2l−1 il (Dil−2

1 ...il−2
f )(a)
= Di2l il−1 (Dil−2

1 ...il−2
f )(a) = Dil1...il−2 il il−1 f (a).
En vertu de ce résultat, si k ≥ 1 est un entier, f est une fonction de

classe C k sur l’ouvert E ⊂ Rn , a ∈ E, et si α = (α1 , α2 , . . . , αn ) ∈ Nn est tel
que
|α|1 = α1 + α2 + . . . + αn ≤ k,
on posera, sans ambiguı̈té,
Dα f (a) = ∂ αf (a) = D1α1 D2α2 . . . Dnαn f (a).
Cette notation exprime que l’on dérive f α1 fois par rapport à x1 , α2 fois
par rapport à x2 , . . . αn fois par rapport à xn .
7.13 Développement de Taylor

On peut étendre la notion de développement de Taylor aux fonctions de Rn
dans Rp . En passant si nécessaire aux composantes de la fonction, on peut
toujours, sans perte de généralité, supposer que p = 1, ce que nous ferons.
Nous aurons besoin de la conséquence élémentaire suivante du théorème
de dérivation des fonctions composées.
Lemme. Soit r > 0, a ∈ Rn et ϕ une fonction de Rn dans R dérivable en
chaque point de B2 (a; r). Si, pour chaque h ∈ Rn tel que 0 < |h|2 < r, on
définit l’application g par g : R → Rn , t 2→ a + th, alors ϕ ◦ g est dérivable
en chaque t ∈ [0, 1], et
n
$
(ϕ ◦ g)$ (t) = hj (Dj ϕ ◦ g)(t).
j=1
Démonstration. Par le théorème de dérivation des fonctions composées

et le lien entre dérivées partielles et dérivée totale ϕ ◦ g est dérivable en
t ∈ [0, 1], et
(ϕ ◦ g)$ (t) = (ϕ ◦ g)$t(1) = [ϕ$g(t) ◦ gt$ ](1)
n
$
= ϕg(t)(g $ (t)) = ϕg(t)(h) = hj (Dj ϕ ◦ g)(t).
j=1
Nous pouvons maintenant énoncer et démontrer le théorème du déve-

loppement de Taylor d’ordre m pour une fonction de classe C m .
Théorème. Soit m ≥ 1 un entier et f une fonction de Rn dans R de classe
C m+1 sur un voisinage ouvert V de a ∈ Rn et soit h ∈ Rn tel que, pour tout
t ∈ [0, 1], a + th ∈ V. Alors il existe θ ∈ ]0, 1[ tel que
n n $ n
$ 1 $
f (a + h) = f (a) + hj1 Dj1 f (a) + hj hj D 2 f (a)
j1 =1
2! j =1 j =1 1 2 j1 j2
1 2
n n n
1 $ $ $
+...+ ... hj1 hj2 . . . hjm Djm1 j2 ...jm f (a)
m! j =1 j =1 j =1
1 2 m
n n n
1 $ $ $
+ ... hj1 hj2 . . . hjm+1 Djm+1 f (a + θh).
(m + 1)! j 1 j2 ...jm+1
1 =1 j2 =1 jm+1 =1
Démonstration. Si l’on définit l’application g de R dans Rn par g(t) =

a + th, alors f (a + th) = (f ◦ g)(t) est dérivable en chaque point de [0, 1], et,
par le lemme,
n
$
(f ◦ g)$ (t) = hj1 (Dj1 f ◦ g)(t).
j1 =1
Comme les fonctions Dj1 f sont dérivables en chaque point de V , on peut

aussi leur appliquer le lemme, et dès lors (f ◦ g)$ est dérivable en chaque
point de [0, 1], et
n
$
(f ◦ g)$$(t) = hj1 (Dj1 f ◦ g)$(t)
j1 =1
n
$ n
$ n $
$ n
= hj1 hj2 (Dj21 j2 f ◦ g)(t) = hj1 hj2 (Dj21 j2 f ◦ g)(t).
j1 =1 j2 =1 j1 =1 j2 =1
En continuant de la sorte, on trouve que, pour chaque 1 ≤ k ≤ m + 1, f ◦ g

est k-fois dérivable sur [0, 1] et
n $
$ n n
$
(f ◦ g)(k)(t) = ... hj1 hj2 . . . hjk (Djk1 j2 ...jk f ◦ g)(t)
j1 =1 j2 =1 jk =1
n $
$ n n
$
= ... hj1 hj2 . . . hjk Djk1 j2 ...jk f (a + th).
j1 =1 j2 =1 jk =1
En conséquence, on peut appliquer à f ◦ g la formule de Lagrange du reste

du développement de Taylor d’ordre m d’une fonction d’une variable, ce qui
donne
f (a + h) = (f ◦ g)(1)
m
$ 1 1
= (f ◦ g)(0) + (f ◦ g)k (0) + (f ◦ g)(m+1)(θ),
k=1
m! (m + 1)!
pour un certain θ ∈ ]0, 1[, et le résultat se déduit du calcul des (f ◦ g)(k)(t).
Ce résultat conduit naturellement à la définition suivante.

Définition. Soit f une fonction de Rn dans R , a ∈ int dom f et m ≥ 1 un
entier tel que toutes les dérivées partielles de f jusqu’à l’ordre m existent
en a. On appelle développement de Taylor d’ordre m de f au point a le
m défini par
polynôme de degré m Tf,a
n n $ n
$ 1 $
m
Tf,a (h) = f (a) + hj1 Dj1 f (a) + hj hj D 2 f (a)
j1 =1
2! j =1 j =1 1 2 j1 j2
1 2
n n n
1 $ $ $
+...+ ... hj1 hj2 . . . hjm Djm1 j2 ...jm f (a)
m! j =1 j =1 j =1
1 2 m
 
m n n
$ 1 $ $
= f (a) +  ... hj1 . . . hjk Djk1 ...jk f (a) .
k=1
k! j =1 j =1
1 k
La fonction Rm
f,a
n
de R dans R définie par
f,a (h) = f (a + h) − Tf,a (h),

Rm m
s’appelle le reste du développement de Taylor d’ordre m de f en a et elle a

pour domaine dom f − a.
7.14 Conditions d’existence d’extrémants

Le développement de Taylor d’une fonction de plusieurs variables permet de
donner d’intéressantes conditions nécessaires ou suffisantes d’existence d’un
extrémant local libre pour une fonction de classe C 2 au moins au voisinage
de l’extrémant.
Soit f une fonction de Rn dans R de classe C 2 sur un voisinage ouvert
V d’un point a ∈ Rn . Par le théorème de développement de Taylor de f en
a, si h ∈ Rn est tel que a + th ∈ V pour tout t ∈ [0, 1], il existera θ ∈ ]0, 1[
tel que
n n $ n
$ 1$
f (a + h) = f (a) + hj Dj f (a) + 2
hj hk Djk f (a + θh)
j=1
2 j=1 k=1
n
$
= f (a) + hj Dj f (a) + g(a + θh; h),
j=1
si nous définissons, sur V × Rn , la fonction g par

n $ n
1$
g(x; h) = 2
hj hk Djk f (x).
2 j=1 k=1
On l’appelle la forme hessienne de f en x; la matrice correspondante

8 9
2
Djk f (x)
1≤j,k≤n
est appelée la matrice hessienne de f en x. On voit que, pour x ∈ V fixé,

g(x; ·) est une forme quadratique. Rappelons qu’une telle forme g(x; ·) est
dite définie positive (resp. définie négative) si, pour tout h /= 0, on a
g(x; h) > 0 (resp. g(x; h) < 0),
et qu’elle est dite semi-définie positive (resp. semi-définie négative) si, pour
tout h ∈ Rn , on a
g(x; h) ≥ 0 (resp. g(x; h) ≤ 0).
Enfin, g(x; ·) est dite indéfinie si elle n’est pas semi-définie. Notons que g
est définie négative (resp. semi-définie négative) si et seulement si −g est
définie positive (resp. semi-définie positive.) L’algèbre fournit des conditions
nécessaires et suffisantes pour qu’une forme quadratique soit de l’un des types
que nous venons de définir. Nous aurons besoin de la conséquence suivante
du théorème des bornes atteintes de Weierstrass.
7.14. CONDITIONS D’EXISTENCE D’EXTRÉMANTS 281
Lemme. Si g(x; ·) définie ci-dessus est définie positive, alors il existe γ > 0
tel que, pour tout h ∈ Rn tel que |h|2 = 1, on ait
g(x; h) ≥ γ.
Démonstration. On vérifie sans peine que l’ensemble E = {h ∈ Rn :

|h|2 = 1} est un fermé borné de Rn et que l’application h → g(x; h) est
continue sur Rn . Le théorème de Weierstrass entraı̂ne l’existence d’un point
y ∈ E tel que, pour tout h ∈ E, on ait
g(x; h) ≥ g(x; y).
Comme y /= 0, on a g(x; y) > 0 et il suffit de poser γ = g(x; y).

Donnons maintenant une condition nécessaire pour que a soit un extré-
mant local libre de f .
Proposition. Si a est un minimant local libre de f , alors g(a; ·) est semi-
définie positive.
Démonstration. Par hypothèse, il existe r > 0 tel que B2 [a; r] ⊂ V et tel
que, pour tout x ∈ B2 [a; r], on ait
f (x) ≥ f (a).
En outre, par le théorème de Fermat, on aura
Dj f (a) = 0, (1 ≤ j ≤ n).
Dès lors, si h ∈ Rn est tel que |h|2 = r, ces relations et le théorème du

développement de Taylor entraı̂nent que, pour chaque entier k ≥ 1, il existera
θk ∈ ]0, 1[ tel que
4 5 4 5
h θk h h
f (a) ≤ f a + = f (a) + g a + ;
k k k
c’est-à-dire tel que
n $ n 4 5
1 $ θk h
0≤ D 2
f a + hi hj .
2k2 i=1 j=1 ij k
On a donc, pour chaque entier k ≥ 1,

n n 4 5
1 $$ 2 θk h
0≤ Dij f a + hi hj ,
2 i=1 j=1 k
# # 8 9
# #
et, comme 0 ≤ # θkkh # ≤ kr , on voit que θk h
k k∈N∗ converge vers zéro. Comme
2
les fonctions 2f
Dij sont continues en a, on en déduit que
n n
1 $$
0≤ 2
hi hj Dij f (a) = g(a; h).
2 i=1 j=1
Si maintenant h /= 0 est quelconque dans Rn , alors h$ = rh

|h|2 est tel que
|h$ |2 = r, et dès lors
r2
0 ≤ g(a; h$) = g(a; h),
|h|22
ce qui entraı̂ne aussitôt que g(a; h) ≥ 0, et achève la démonstration, puisque
le résultat est trivial pour h = 0.
Proposition. Si a est un maximant local libre de f , alors g(a; ·) est semi-

définie négative.
Démonstration. Il suffit d’appliquer le résultat précédent à −f .
Ces résultats fournissent immédiatement une condition suffisante pour
que le point critique a soit un col.
Proposition. Si a est un point critique de f tel que g(a; ·) soit indéfinie,
alors a est un col de f .
Donnons maintenant des conditions suffisantes d’existence d’un extré-
mant local libre de f .
Proposition. Si a est un point critique de f tel que g(a; ·) soit définie
positive, alors a est un minimant local libre de f .
Démonstration. Soit γ > 0 donné par le Lemme ci-dessus. Puisque f est
de classe C 2 sur V , il existe δ > 0 tel que B2 [a; δ] ⊂ V et tel que, pour tout
h ∈ B2 [δ], on a
n $
$ n
2
|Djk f (a + h) − Djk
2
f (a)| ≤ γ.
j=1 k=1
Si h ∈ B2 [δ] \ {0}, le théorème de Taylor entraı̂ne l’existence d’un θ ∈ ]0, 1[

tel que
4 5
h
f (a + h) − f (a) = g(a + θh; h) = |h|22 g a; + [g(a + θh; h) − g(a; h)].
|h|2
7.15. EXERCICES 283
En conséquence,
f (a + h) − f (a) ≥ γ|h|22 − |g(a + θh; h) − g(a; h)|

n $ n
1$
≥ γ|h|22 − 2
|hj ||hk ||Djk f (a + θh) − Djk
2
f (a)|
2 j=1 k=1
1 γ
≥ γ|h|22 − |h|2∞ γ ≥ |h|22 > 0.
2 2
Proposition. Si a est un point critique de f tel que g(a; ·) soit définie

négative, alors a est un maximant local libre de f .
Démonstration. Il suffit d’appliquer le résultat précédent à −f.
7.15 Exercices
1. Soit f une fonction de R dans R deux fois dérivable sur un intervalle I
de R. Montrer que f est convexe sur I si et seulement si, pour tout x ∈ I,
on a f $$ (x) ≥ 0.
2. Soit f une fonction de Rn dans R dont les dérivées partielles du premier
et du second ordre existent et sont continues en a, et soient α, β et γ des
fonctions de Rn dans Rn dérivables en a. Montrer que les dérivées de Lie
vérifient les propriétés suivantes :
Lβ (Lαf )(a) − Lα (Lβ f )(a) = Lδ f (a),
L[[α,β],γ]f (a) = Lγ L[α,β]f (a) − L[α,β]Lγ f (a).

où δ = [α, β] est le crochet de Poisson de α et β défini par
n
$
[α, β] = (βj Dj α − αj Dj β),
j=1
En déduire l’identité de Jacobi

? @
L[[α,β],γ] + L[[β,γ],α] + L[[γ,α],β] f (a) = 0.
3. Considérons l’équation des ondes

2
Dtt u(t, x) − c2 Dxx
2
u(t, x) = 0,
où c est un nombre réel différent de zéro. Montrer que, si f : R → R et

g : R → R sont deux fonctions deux fois dérivables sur R, alors la fonction u
de R2 dans R définie par
u(t, x) = f (x − ct) + g(x + ct)
est solution de l’équation des ondes.

4. Si n ≥ 2 est un entier et u est une application de Rn dans R deux
fois dérivable en chaque point de Rn , on définit le laplacien ∆u de u par la
relation n $
∆u(x) = 2
Djj u(x).
j=1
Montrer que si u(x) = v(|x|2) (fonction radiale), où v est une application de
]0, +∞[ dans R deux fois dérivable en chaque point de ]0, +∞[, alors, pour
tout x ∈ Rn \ {0}, on a
n−1 $
∆[v(|x|2)] = v $$(|x|2 ) + v (|x|2 ).
|x|2
Comme, pour tout r > 0, on a
n−1 $
v $$ (r) + v (r) = 0 ⇔ r n−1 v $$ (r) + (n − 1)r n−2 v $ (r) = 0
r
⇔ [r n−1 v $ (r)]$ = 0 ⇔ v $ (r) = Ar 1−n ,
où A est une constante réelle arbitraire, en déduire que u(x) = v(|x|2 ) est
une solution radiale sur Rn \ {0} de l’équation de Laplace
∆u(x) = 0,
si et seulement si
u(x) = A log |x|2 + B si n = 2,
et
u(x) = A|x|2−n
2 + B si n ≥ 3,
où B est une constante réelle arbitraire.
%
5. Soit k∈N ck hk une série, où ck ∈ Rp et h ∈ R, et f une fonction de R
%
dans Rp définie sur ]a − r, a + r[. On dit que k∈N ck hk est un développement
asymptotique de f au voisinage de a si, pour chaque entier q ∈ N, on a
%q
f (a + h) − k=0 ck h
k
lim = 0.
h→0 |h|q
Montrer que si f est une fonction de classe C ∞ sur ]a − r, a + r[, alors la série
% (k)
de Taylor de f en a k∈N hk f k!(a) est un développement asymptotique de
f au voisinage de a.

Si, pour des accroissements tendant vers zéro, les fluxions qui leur sont pro-
portionnelles sont écrites, les quantités v, v $, v $$ , . . . étant maintenant toutes
prises égales à v, alors lorsque z, variant uniformément, devient z + v, la
v2
variable x deviendra x + ẋ 1.vż + ẍ 1.2. ż2 + etc.
Brook Taylor, 1715

Ce qu’on appelle la somme d’une suite, c’est la limite de la somme de
ses différents termes, c’est-à-dire une quantité dont on approche aussi près
qu’on veut, en prenant toujours dans la suite un nombre de termes de plus
en plus grand. Nous croyons devoir faire cette remarque en passant, pour
fixer l’idée nette du mot somme d’une suite.
Mais, pour notre objet, il importe moins de connaı̂tre les restes exacts de
la série développée jusqu’à un terme quelconque que d’avoir des limites de
ces restes pour pouvoir apprécier l’erreur qu’on peut commettre en ne tenant
compte que de quelques-uns des premiers termes.

On appelle série une suite indéfinie de quantités u0 , u1 , u2 , u3 , etc. . . .
qui dérivent les uns des autres suivant une loi déterminée. Ces quantités
elles-mêmes sont les différents termes de la série que l’on considère. Soit
sn = u0 + u1 + u2 + . . . + un−1
la somme des n premiers termes, n désignant un nombre entier quelconque.

Si, pour des valeurs de n toujours croissantes, la somme sn s’approche
indéfiniment d’une certaine limite s, la série sera dite convergente, et la
limite en question s’appellera la somme de la série. Au contraire, si, tandis
que n croı̂t indéfiniment, la somme sn ne s’approche d’aucune limite fixe, la
série sera dite divergente, et n’aura plus de somme.

Nous sommes donc conduits à envisager une relation d’une nature nou-
velle qui peut exister entre une fonction de x et de µ que nous appellerons
ϕ(x, µ) et une série divergente ordonnée suivant les puissances de µ
f0 + µf1 + µ2 f2 + . . . + µp fp + . . . ,
où les coefficients f0 , f1 , . . . peuvent être des fonctions de x seulement indé-

pendantes de µ, ou bien dépendre à la fois de x et de µ. Posons
ϕp = f0 + µf1 + µ2 f2 + . . . + µp fp .
Si l’on a
ϕ − ϕp
lim = 0 pour µ = 0,
µp
je dirai que la série ci-dessus représente asymptotiquement la fonction ϕ. . . .
Il est clair que, si µ est très petit, la différence ϕ − ϕp sera ausi très petite et,
bien que la série ci-dessus soit divergente, la somme de ses p + 1 premiers
termes représente très approximativement la fonction ϕ.
Henri Poincaré, 1893
Pour rien au monde je ne consacrerai de longues heures à établir que

∂ 2u ∂ 2u
∂x∂y = ∂y∂x et autres belles et grandes choses de même genre.
Charles Hermite, 1884

Chapitre 8
Equations différentielles
linéaires
8.1 Opérateurs différentiels linéaires

Dans un bouillon de culture en quantité suffisante, la vitesse de reproduction
des bactéries est proportionnelle à leur nombre. Si r désigne le coefficient
de proportionnalité et que l’on interpole la fonction décrivant le nombre de
bactéries en fonction du temps par une fonction n dérivable de R dans R+ ,
la loi de reproduction se traduit par l’équation
n$ (t) = rn(t),
où n(t) désigne le nombre de bactéries à l’instant t.

La hauteur h(t) à l’instant t d’un point matériel de masse m en chute
libre et soumis à une résistance de frottement proportionnelle à sa vitesse
vérifie, en vertu de la loi fondamentale de la mécanique, l’équation
mh$$ (t) + rh$ (t) = −mg,
où g désigne l’accélération de la pesanteur et r le coefficient de la force de

frottement.
Dans un circuit électrique oscillant de résistance R, de capacité C et
d’inductance L, l’intensité I(t) à l’instant t du courant électrique vérifie
l’équation
LI $$ (t) + RI $ (t) + (1/C)I(t) = 0.
Ces différents problèmes conduisent donc à la question suivante. Si l’on
se donne un entier n ≥ 1, des éléments aj , (0 ≤ j ≤ n) de K tels que an /= 0,
287
288 CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES
avec K = R ou C, et une fonction f de R dans K, il s’agit de déterminer les

applications y dans K n fois dérivables sur R telles que, pour tout x ∈ R, on
ait
n
$
aj y (j)(x) = f (x).
j=0
(on utilise la convention y (0) = y). Une telle équation dont l’inconnue est
une application y de R dans K est appelée une équation différentielle linéaire
d’ordre n à coefficients constants dans K et toute fonction y vérifiant l’équa-
tion sur R une solution sur R de l’équation. Lorsque les coefficients aj sont
réels, une solution réelle de l’équation sera une solution y à valeurs dans R.
Lorsque f = 0 l’équation différentielle correspondante
n
$
aj y (j)(x) = 0. (8.1)
j=0
est appelée une équation différentielle linéaire homogène d’ordre n à coef-

ficients constants. Sinon, elle est dite non homogène. Nous commencerons
par l’étude de l’équation homogène. Montrons d’abord que toute solution
éventuelle de l’équation (8.1) est indéfiniment dérivable sur R.
Proposition. Toute solution de l’équation (8.1) est indéfiniment dérivable
sur R.
Démonstration. On va le démontrer par récurrence sur l’ordre de dériva-
bilité. Soit y une solution de (8.1); on a donc
n−1
$
y (n) = −a−1
n aj y (j) , (8.2)
j=0
ce qui montre que y (n) est égale à une fonction dérivable sur R, c’est-à-dire
que y est n + 1 fois dérivable sur R. Si l’on suppose maintenant y n + k fois
dérivable sur R et que l’on égale les dérivées ke des deux membres de (8.2),
on obtient
n−1
$
y (n+k) = −a−1
n aj y (j+k) , (8.3)
j=0
et, en raisonnant sur (8.3) comme on l’a fait sur (8.2), on déduit que y (n+k)
est dérivable sur R, donc que y est n + k + 1 fois dérivable sur R. En
conséquence, y possède des dérivées de tous les ordres en chaque point de R
et la démonstration est complète.
8.1. OPÉRATEURS DIFFÉRENTIELS LINÉAIRES 289
Nous allons montrer que la résolution de l’équation (8.1) se ramène à

un problème essentiellement algébrique par l’introduction des opérateurs
différentiels à coefficients constants. Désignons par C ∞ = C ∞ (R, K) l’en-
semble des fonctions à valeurs dans K indéfiniment dérivables sur R. C’est
évidemment un espace vectoriel sur K. Pour chaque y ∈ C ∞ , la fonc-
tion dérivée y $ appartient aussi à C ∞ et nous pouvons donc introduire
l’application D : C ∞ → C ∞ , y 2→ y $ . Les propriétés de la dérivée entraı̂nent
que, si y et z appartiennent à C ∞ et si c ∈ K, alors on a
D(y + z) = (y + z)$ = y $ + z $ = Dy + Dz, D(cy) = (cy)$ = cy $ = c(Dy),
ce qui montre que D est une application linéaire de C ∞ dans C ∞ , c’est-à-dire
un endomorphisme de C ∞ . On peut dès lors définir de proche en proche,
pour tout entier m ≥ 1, l’endomorphisme Dm de C ∞ par D 0 = I (identité
sur C ∞ ) et
D m y = D[D m−1 y]
pour tout y ∈ C ∞ , c’est-à-dire D composé m fois avec lui-même, et l’on a
évidemment
D m y = y (m).
Si L est le polynôme à coefficients dans K défini par
n
$
L(z) = aj z j ,
j=0
où chaque aj ∈ K et an /= 0, nous pouvons lui associer l’endomorphisme

L(D) de C ∞ défini par
n
$ n
$
L(D)y = aj D j y = aj y (j),
j=0 j=0
pour tout y ∈ C∞. Un tel L(D) est appelé un opérateur différentiel linéaire
d’ordre n à coefficients dans K. On voit que la résolution de l’équation
différentielle homogène (8.1) revient à la détermination du noyau de l’endo-
morphisme L(D) de C ∞ . Cette détermination repose sur l’étude des pro-
priétés algébriques de L(D).
%
Si M (D) = m j=0 bj D est un autre opérateur différentiel linéaire à coef-
j
ficients dans K, la somme L(D) + M (D) de L(D) et M (D) sera l’endomor-

phisme défini, pour tout y ∈ C ∞ , par
n
$ m
$
[L(D) + M (D)]y = L(D)y + M (D)y = aj D j y + bj D j y,
j=0 j=0
tandis que le produit cL(D) de L(D) par c ∈ K sera l’endomorphisme de C ∞

défini, pour tout y ∈ C ∞ par
 
n
$
[cL(D)]y = c[L(D)y] = c  j
aj D y  .
j=0
On constate aussitôt que

p
$ n
$
[L(D) + M (D)]y = (aj + bj )D j y, [cL(D)]y = (caj )D j y, (8.4)
j=0 j=0
avec p = max(n, m) et aj = 0 pour j > n, bj = 0 pour j > m, c’est-à-dire

que
L(D) + M (D) = (L + M )(D), cL(D) = (cL)(D). (8.5)
Le composé de M (D) et L(D) est l’endomorphisme de C ∞ défini, pour tout

élément y ∈ C ∞ par
& m
' n

$ $
[M (D) ◦ L(D)]y = M (D)[L(D)y] = bk D k  aj D j y 
k=0 j=0
 
n $
$ m n+m
$ m
$
= bk aj D k+j y =  bl−j aj  D l y.
k=0 j=0 l=0 j=0
On le notera simplement M (D)L(D) et l’on voit immédiatement que
M (D) ◦ L(D) = (M L)(D), (8.6)
où M L désigne le produit usuel du polynôme L par le polynôme M . Par

exemple, si L(D) = D − r1 I et M (D) = D − r2 I avec r1 , r2 ∈ C, on a, pour
tout y ∈ C ∞ ,
M (D)L(D)y = (D − r2 I)(Dy − r1 y) = D 2 y − r1 Dy − r2 Dy + r1 r2 y
8 9
= D 2 − (r1 + r2 )D + r1 r2 I y.
Les relations (8.5) et (8.6) montrent que la somme et le produit de deux
opérateurs différentiels à coefficients dans K, ainsi que le produit d’un tel
opérateur par un élément de K sont encore des opérateurs différentiels liné-
aires à coefficients dans K, ce qui permet de définir, de proche en proche, la
8.1. OPÉRATEURS DIFFÉRENTIELS LINÉAIRES 291
somme et le produit d’un nombre quelconque de tels opérateurs. En outre,

les relations (8.5) et (8.6) et les propriétés des polynômes montrent que
L(D) + M (D) = M (D) + L(D), M (D)L(D) = L(D)M (D),
si l’on définit l’égalité L(D) = M (D) entre deux opérateurs différentiels

linéaires à coefficients dans K par la relation
L(D)y = M (D)y
pour tout y ∈ C ∞ , c’est-à-dire
[L(D)y](x) = [M (D)y](x),
pour tout y ∈ C ∞ et tout x ∈ R. Cette égalité équivaut à l’identité, au sens

algébrique, des polynômes L et M , ainsi que cela résulte de la proposition
suivante.
Proposition. Si 0 désigne l’endomorphisme nul dans C ∞ , alors
L(D) = 0
%n
si et seulement si le polynôme L(z) = j=0 aj z j est tel que aj = 0, (0 ≤ j ≤
n).
Démonstration. La condition suffisante est évidente. Pour démontrer la
condition nécessaire, notons que si L(D)y = 0 pour tout y ∈ C ∞ , alors, en
prenant y = 1, on trouve a0 = 0. Raisonnant par récurrence et supposant
que a0 = a1 = . . . = ak−1 = 0, on trouve, en prenant y(x) = xk , k!ak = 0, et
la démonstration est complète.
Tous ces résultats montrent que l’ensemble des opérateurs différentiels
à coefficients dans K est isomorphe à l’ensemble des polynômes sur K. En
particulier à toute identité L = M entre deux polynômes algébriques L
et M correspond l’égalité L(D) = M (D) pour les opérateurs différentiels
à coefficients constants correspondants. En guise d’application, rappelons
que le théorème fondamental de l’algèbre appliqué au polynôme L(z) nous
apprend que si r1 , r2, . . . , rq désignent les zéros complexes distincts de L et
m1 , m2, . . . , mq leurs multiplicités respectives, de telle sorte que 1 ≤ q ≤ n
et m1 + . . . + mq = n, on a l’identité
L(z) = an (z − r1 )m1 (z − r2 )m2 . . . (z − rq )mq ,

l’ordre des facteurs étant évidemment indifférent dans le second membre.

Cela entraı̂ne aussitôt, pour les opérateurs différentiels correspondants, l’éga-
lité
L(D) = an (D − r1 I)m1 (D − r2 I)m2 . . . (D − rq I)mq ,
l’ordre des facteurs étant de nouveau indifférent dans le second membre, et
(D − rI)m désignant le composé des m opérateurs (D − rI) . . .(D − rI).
8.2 Equation homogène complexe

Nous allons déterminer la structure de l’ensemble des solutions de l’équation
différentielle linéaire homogène à coefficients constants dans K
an y (n) + an−1 y (n−1) + . . . + a1 y $ + a0 y = 0, (8.7)
où n ∈ N∗ , aj ∈ K, (0 ≤ j ≤ n), an /= 0. Si L(D) est l’opérateur différentiel

à coefficients constants correspondant défini par
n
$
L(D) = aj D j ,
j=0
le problème revient donc à déterminer la structure du noyau ker L(D) de

l’endomorphisme L(D) de C ∞ .
Définition. On appelle polynôme caractéristique de l’équation différentielle
(8.7) le polynôme L sur C défini par
n
$
L(z) = aj z j ,
j=0
qui s’obtient à partir de (8.7) en remplaçant y (j) par z j . Les zéros dis-
tincts r1 , r2 , . . . , rq du polynôme caractéristique P (z) sont appelés les racines
caractéristiques de l’équation différentielle (8.7) et nous désignerons par
m1 , . . ., mq leurs multiplicités respectives.
La discussion de la section 1 montre que l’opérateur différentiel L(D)
peut s’écrire
L(D) = an (D − r1 I)m1 (D − r2 I)m2 . . . (D − rq I)mq ,
l’ordre des facteurs du second membre étant indifférent. Il est évident que
tout élément du noyau de (D − rj I)mj appartiendra au noyau de L(D). On
8.2. EQUATION HOMOGÈNE COMPLEXE 293
est donc amené à étudier d’abord la structure du noyau de (D − rI)m,

où r ∈ K et m ≥ 1 est un entier.
La détermination du noyau de D −rI équivaut à la résolution de l’équati-
on différentielle élémentaire
y $ (x) = ry(x). (8.8)
Si nous définissons la nouvelle fonction inconnue z par
y(x) = z(x) exp rx,
c’est-à-dire
z(x) = y(x) exp(−rx),
nous voyons que y est solution de l’équation différentielle (8.8) si et seulement
si
z $ (x) exp rx = 0,
c’est-à-dire, puisque exp rx /= 0 pour tout x ∈ R, si et seulement si
z $ (x) = 0.
Les solutions de cette équation sont les fonctions constantes z(x) = c, x ∈ R.
Par conséquent, les solutions de (8.8) sont les fonctions
y(x) = c exp rx
où c ∈ K est arbitraire.
Supposons maintenant que m soit un entier positif quelconque et con-
sidérons d’abord le cas particulier où r = 0.
Lemme. y ∈ C ∞ appartient à ker Dm si et seulement si
y(x) = P (x), x ∈ R,
où P est un polynôme arbitraire sur K de degré inférieur ou égal à m − 1.
Démonstration. On vérifie immédiatement que tout polynôme sur K de
degré inférieur ou égal à m−1 appartient au noyau de Dm . Réciproquement,
si y est réel et Dm y = 0, alors, le reste de Lagrange du développement de
Taylor d’ordre m − 1 de y autour de 0 est identiquement nul et l’on a donc
m−1
$ D k y(0) k
y(x) = x ,
k=0
k!
ce qui montre que y est un polynôme sur K de degré inférieur ou égal à

m − 1. Le cas de y complexe s’en déduit en passant aux composantes.
Le résultat suivant permet de ramener la recherche de la structure du

noyau de (D − rI)m à celle du noyau de Dm .
Lemme. Si r ∈ C et m ∈ N∗ alors, pour toute fonction g à valeurs dans K
m-fois dérivable sur R, on a
(D − rI)m g(x) = (exp rx). Dm [g(x) exp(−rx)], (8.9)
c’est-à-dire
[exp(−rx)].(D − rI)mg(x) = D m [g(x) exp(−rx)].
Démonstration. Notons que la fonction g. exp(−r.) est m fois dérivable

sur R puisqu’il en est ainsi de g et de exp(−r.). La formule à démontrer est
vraie pour m = 1 puisque
(exp rx).D[g(x). exp(−rx)] = Dg(x) − rg(x) = (D − rI)g(x).
Montrons par récurrence que si elle est vraie jusqu’à l’ordre k − 1 ≤ m − 1,

elle est vraie à l’ordre k. En fait, on a
(D − rI)k g(x) = (D − rI)[(D − rI)k−1 g(x)]
= (D − rI){(exp rx).Dk−1 [g(x). exp(−rx)]}

= (exp rx).D{[exp(−rx)].(exp rx).Dk−1 [g(x). exp(−rx)]}
= (exp rx).Dk [g(x). exp(−rx)].
Proposition. Si r ∈ C et m ∈ N∗ , alors y : R → C appartient au noyau de

(D − rI)m si et seulement si y est de la forme
y(x) = P (x) exp rx,
où P est un polynôme arbitraire sur C de degré inférieur ou égal à m − 1.

Démonstration. Comme exp(−rx) /= 0 et exp rx /= 0 quel que soit x ∈ R,
la formule (8.9) et le lemme qui précède entraı̂nent que
y ∈ ker(D − rI)m ⇔ (exp rx).Dm[y(x) exp(−rx)] = 0
⇔ D m [y(x) exp(−rx)] = 0
⇔ y(x) exp(−rx) = P (x) ⇔ y(x) = P (x) exp rx,
où P est un polynôme sur C de degré inférieur ou égal à m − 1.
Remarque. Lorsque r ∈ R, le raisonnement du lemme précédent montre

que les éléments de ker(D − rI)m à valeurs réelles s’obtiennent en prenant
pour P les polynômes sur R de degré inférieur ou égal à m − 1. Lorsque r
est complexe non réel, disons r = b + ic avec c /= 0, alors P (x) exp rx est réel
si et seulement si
P (x) exp rx = P (x) exp r̄x,
[P (x) − P (x)] cos cx = −i[P (x) + P (x)] sin cx,
ou encore
[9P (x)] cos cx = [8P (x)] sin cx,
pour tout x ∈ R, ce qui n’est possible que si P = 0. Ainsi donc, pour r
non réel, les éléments du noyau de (D − rI)m sont nécessairement à valeurs
complexes non réelles.
Pour chaque q ∈ N et chaque s ∈ C, désignons par E q,s l’ensemble
E q,s = {y : R → C : y(x) = P (x) exp sx et P est un
polynôme sur C de degré inférieur ou égal à q}.
Des fonctions de ce type s’appellent des exponentielles-polynômes et comme
la bijection
B : P 2→ P (·) exp(s·)
définit un isomorphisme entre E q,s et l’espace vectoriel sur C des polynômes
sur C de degré inférieur ou égal à q, qui est de dimension q + 1, on voit
que E q,s est un espace vectoriel sur C de dimension q + 1 contenu dans C ∞ .
L’étude du comportement de l’opérateur linéaire D − rI sur E q,s va nous
fournir la structure des éléments de ker L(D). Comme, pour tout polynôme
P de degré inférieur ou égal à q, tout r ∈ C et tout s ∈ C, on a
(D − rI)[P (x) exp sx] = [P $ (x) + (s − r)P (x)] exp sx,
on voit que D − rI est un endomorphisme de E q,s. On a un résultat plus
précis si r /= s.
Lemme. Si r /= s sont des nombres complexes, alors, pour chaque q ∈ N,
D − rI est un automorphisme de E q,s .
Démonstration. Puisque E q,s est de dimension finie, il suffit de vérifier
que D − rI est injectif, c’est-à-dire que ker(D − rI) ∩ E q,s = {0}. Si
(D − rI)[P (x) exp sx] = 0,
%
pour tout x ∈ R, où P (x) = qk=0 ck xk , alors, en vertu de la formule (8.9),
on a
0 = (exp rx).D[P (x) exp(s − r)x],
ou encore
P $ (x) + (s − r)P (x) = 0,
c’est-à-dire
q−1
$
(s − r)cq xq + [(s − r)ck + (k + 1)ck+1 ]xk = 0,
k=0
quel que soit x ∈ R. Le polynôme du premier membre doit donc avoir ses
coefficients nuls, c’est-à-dire
k+1
cq = 0, ck = − ck+1 , (0 ≤ k ≤ q − 1),
s−r
ce qui entraı̂ne, de proche en proche ck = 0, (0 ≤ k ≤ q) et achève la
démonstration.
Nous pouvons maintenant énoncer et démontrer le théorème de struc-
ture de l’ensemble des solutions complexes d’une équation différen-
tielle linéaire homogène à coefficients dans K.
Théorème. Si r1 , . . . , rq désignent les racines distinctes de l’équation ca-
ractéristique
n
$
L(z) ≡ aj z j = 0
j=0
et m1 , . . . , mq leurs multiplicités respectives, alors y est solution de l’équation

différentielle n
$
aj y (j) ≡ L(D)y = 0
j=0
si et seulement si
q
$
y(x) = Pj (x) exp rj x, x ∈ R, (8.10)
j=1
où Pj est un polynôme arbitraire de degré inférieur ou égal à mj − 1 à

coefficients dans C (1 ≤ j ≤ q).
Démonstration. La Proposition ci-dessus entraı̂ne que le résultat est
vrai si q = 1. Pour démontrer le résultat par récurrence, supposons le
vrai pour k − 1 racines caractéristiques distinctes et montrons qu’il est vrai

pour k racines caractéristiques distinctes. On a, en vertu de l’hypothèse de
récurrence,
 
k
6 k−1
6
(D − rj I)mj y = 0 ⇔  (D − rj I)mj  (D − rk I)mk y = 0
j=1 j=1
k−1
$
⇔ (D − rk I)mk y(x) = Qj (x) exp rj x, x ∈ R, (8.11)
j=1
où Qj est un polynôme sur C de degré inférieur ou égal à mj − 1, (1 ≤ j ≤

k − 1). Le dernier Lemme montre que (D − rk I)mk est un automorphisme
de E mj −1,rj pour chaque 1 ≤ j ≤ k − 1, et il existe donc pour chaque
1 ≤ j ≤ k − 1, un polynôme Pj sur C de degré inférieur ou égal à mj − 1 tel
que
Qj (x) exp rj x = (D − rk I)mk [Pj (x) exp rj x].
Dès lors, par la formule (8.11) et la linéarité de l’opérateur (D − rk I)mk , on
a  
k−1
$
(D − rk I)mk y(x) − Pj (x) exp rj x = 0,
j=1
ce qui équivaut, par la Proposition ci-dessus, à

k−1
$
y(x) − Pj (x) exp rj x = Pk (x) exp rk x,
j=1
où Pk est un polynôme sur C de degré inférieur ou égal à mk − 1. Le résultat

est donc vrai pour un nombre quelconque q de racines distinctes du polynôme
caractéristique.
Remarque. Si nous explicitons les polynômes Pj dans (8.10) en écrivant
mj −1
$
Pj (x) = pjk xk ,
k=0
nous voyons que la forme générale des solutions complexes de l’équation

différentielle (8.7) est donnée par
j −1
q m$
$
y(x) = pjk xk exp rj x, x ∈ R,
j=1 k=0
%
et elle contient les n = qj=1 mj constantes complexes arbitraires pjk . Cette
formule exprime aussi que la famille de fonctions
F = {x 2→ xk exp rj x : 0 ≤ k ≤ mj − 1, 1 ≤ j ≤ q}
constitue une famille génératrice du sous-espace vectoriel ker L(D) ⊂ C ∞

des solutions de l’équation différentielle (8.7).
Le lemme qui suit permet de montrer que cette famille est libre et con-
stitue donc une base de ker L(D).
Lemme. Si p1 , . . ., pl sont des entiers naturels et r1 , . . . , rl des nombres

complexes tels que ri /= rj pour 1 ≤ i /= j ≤ l, alors
(E p1,r1 + . . . + E pl−1,rl−1 ) ∩ E pl,rl = {0}.
Démonstration. Si
y ∈ (E p1,r1 + . . . + E pl−1 ,rl−1 ) ∩ E pl,rl ,
alors, pour chaque x ∈ R, on a
l−1
$
y(x) = P j (x) exp rj x = P l (x) exp rl x,
j=1
où chaque polynôme P j est de degré inférieur ou égal à pj (1 ≤ j ≤ l). Dès

lors, par le lemme de structure du noyau de (D − rI)p+1 , on a
 
l−1
6 l−1
$ l−1
6
0= (D − rk I)pk +1  P j (x) exp rj x = (D − rk I)pk +1 [P l (x) exp rl x].
k=1 j=1 k=1
=
Comme l−1 k=1 (D − rk I)
pk +1
est un automorphisme de E pl,rl , on en déduit
que P l exp(rl ·) = 0 et donc que y = 0.
Ce lemme et le théorème de structure montrent que ker L(D) est la

somme directe des sous-espaces vectoriels de dimension mj E mj −1,rj , (1 ≤
j ≤ q). Donc ker L(D) est de dimension n et comme la famille de fonctions
{x 2→ xk exp rj x : 0 ≤ k ≤ mj − 1} constitue une base de E mj −1,rj , (1 ≤
j ≤ q), la famille F ci-dessus constituera une base de ker L(D). On a donc
prouvé le résultat suivant.
8.3. EQUATIONS NON HOMOGÈNES 299
Corollaire. L’ensemble des solutions complexes de l’équation différentielle

(8.7) est le sous-espace vectoriel de C ∞ de dimension n engendré par la
famille de fonctions
F = {x 2→ xk exp rj x : 0 ≤ k ≤ mj − 1, 1 ≤ j ≤ q},
où les rj sont les racines caractéristiques et mj leurs multiplicités.

Exemple. Considérons l’équation différentielle linéaire homogène du second
ordre
a2 y $$ (x) + a1 y $ (x) + a0 y(x) = 0, (8.12)
où les aj ∈ C, (0 ≤ j ≤ 2). L’équation caractéristique correspondante est
a2 z 2 + a1 z + a0 = 0.
Dès lors, si a21 − 4a2 a0 /= 0, les racines caractéristiques

G G
−a1 − a21 − 4a2 a0 −a1 + a21 − 4a2 a0
r1 = , r2 = ,
2a2 2a2
sont simples (m1 = m2 = 1), et les solutions de (8.12) sont donc les fonctions
de la forme
y(x) = c1 exp r1 x + c2 exp r2 x,
où c1 et c2 sont des nombres complexes arbitraires.
Si a21 − 4a2 a0 = 0, l’équation caractéristique possède la racine double
a1
r1 = −
2a2
(m1 = 2) et les solutions de (8.12) sont les fonctions de la forme
y(x) = (c1 + c2 x) exp r1 x,
où c1 et c2 sont des nombres complexes arbitraires.
8.3 Equations non homogènes

Si les aj ∈ K, (0 ≤ j ≤ n) avec an /= 0 et si f est une application de R dans
K, considérons maintenant l’équation différentielle non homogène
n
$
L(D)y ≡ aj y (j)(x) = f (x). (8.13)
j=0
L’équation (8.7)
n
$
L(D)y ≡ aj y (j) (x) = 0
j=0
est appelée l’équation homogène associée à (8.13).

Le résultat suivant montre que la détermination de toutes les solutions de
(8.13) revient à celle de toutes les solutions de l’équation homogène associée
et d’une solution de l’équation (8.13).
Proposition. Soit v une solution de l’équation (8.13). Alors toute solution
y de l’équation (8.13) est de la forme y = u+v où u est solution de l’équation
homogène associée à (8.13).
Démonstration. Soient v et y deux solutions de (8.13); on a donc
n
$ n
$
aj v (j)(x) = f (x), aj y (j)(x) = f (x),
j=0 j=0
pour tout x ∈ R, et dès lors, par soustraction membre à membre,

n
$
aj (y − v)(j)(x) = 0,
j=0
pour tout x ∈ R, ce qui montre que y − v est une solution u de l’équation

homogène associée.
Il résulte de cette proposition que la détermination de la forme générale
de la solution de l’équation (8.13) revient à la détermination de la forme
générale de l’équation homogène associée à (8.13), problème résolu au para-
graphe précédent, et à celle d’une solution particulière de l’équation (8.13).
Le raisonnement fait dans le cas homogène pour démontrer la régularité
des solutions s’étend immédiatement au cas non homogène. Les détails sont
laissés au lecteur.
Proposition. Si la fonction f est indéfiniment dérivable sur R, alors toute
solution de l’équation (8.13) est indéfiniment dérivable sur R.
Enfin, l’obtention d’une solution de (8.13) est souvent facilitée par le
résultat suivant.
%s
Proposition. Si les applications fj de R dans K sont telles que f = j=1 fj ,
et si yj est solution de l’équation différentielle
L(D)(y) = fj ,
%s
(1 ≤ j ≤ s), alors y = j=1 yj est solution de (8.13).
Démonstration. On a, par linéarité de l’opérateur L(D),
 
s
$ s
$ s
$
L(D)y = L(D)  yj  = L(D)yj = fj = f.
j=1 j=1 j=1
La recherche d’une solution particulière de (8.13) lorsque f est donné est

un problème difficile sur lequel nous reviendrons par la suite. Nous allons le
résoudre dans cette section dans le cas particulier où f est une exponentielle-
polynôme, c’est-à-dire lorsque
f (x) = Qp(x) exp(rx),
où Qp est un polynôme à coefficients dans C de degré inférieur ou égal à p et

r ∈ C. Nous aurons besoin pour ce faire de quelques résultats préliminaires
de nature algébrique.
Soit s ∈ C, q ∈ N, m ∈ N et soit E m,q,s ⊂ E m+q,s l’ensemble défini par
E m,q,s = {y : R → C : y(x) = xm P (x) exp sx où P est un polynôme
sur C de degré inférieur ou égal à q}.

On vérifie sans peine que E m,q,s est un espace vectoriel sur C de dimension
q + 1 et que E 0,q,s = E q,s .
Lemme. Pour chaque m ≥ 1, D − sI est un isomorphisme de E m,q,s sur
E m−1,q,s.
Démonstration. Comme dim E m,q,s = dim E m−1,q,s, il suffit de démon-
trer que D − sI applique E m,q,s dans E m−1,q,s et est injectif. Si y(x) =
xm P (x) exp sx, avec P un polynôme sur C de degré inférieur ou égal à q,
alors, par la formule (8.9), on a
(D − sI)[xmP (x) exp sx] = (exp sx)D[xm P (x)]
= (exp sx)[mxm−1 P (x) + xm P $ (x)],

ce qui entraı̂ne que (D − sI)y ∈ E m−1,q,s et, si (D − sI)y = 0, que
xm P (x) = c, x ∈ R,
où c est une constante complexe; en faisant x = 0, on trouve c = 0 et donc

y = 0.
On en déduit aussitôt le résultat suivant.

Corollaire. Pour chaque m ≥ 1, (D − sI)m est un isomorphisme de E m,q,s
sur E q,s.
Considérons maintenant l’équation différentielle
L(D)y(x) = Qp (x) exp rx, (8.14)
où r ∈ C et Qp est un polynôme à coefficients dans C de degré p. Convenons

aussi de dire que r ∈ C est racine caractéristique de multiplicité zéro de
l’équation algébrique L(z) = 0 si r n’est pas racine de cette équation.
Théorème. L’équation différentielle non homogène (8.14) possède toujours
une solution particulière de la forme
y(x) = xm Rp (x) exp rx,
où m est la multiplicité de r comme racine de l’équation caractéristique

L(z) = 0 de l’équation homogène associée à (8.13) et Rp (x) est un cer-
tain polynôme complexe de degré inférieur ou égal à p dont les coefficients
dépendent linéairement de ceux de Qp.
Démonstration. L’équation (8.14) peut évidemment s’écrire sous la forme
équivalente
q
6
(D − rj I)mj y(x) = a−1
n Qp (x) exp rx,
j=1
où les rj sont les racines caractéristiques, de multiplicités respectives mj , de

l’équation homogène associée (1 ≤ j ≤ q). Supposons tout d’abord que r ne
soit pas racine de l’équation caractéristique L(z) = 0. Alors, on a vu plus
=
haut que l’opérateur qj=1 (D − rj I)mj est un automorphisme de E p,r et il
existera donc un unique élément Rp (·) exp(r·) ∈ E p,r tel que
q
6
(D − rj I)mj [Rp(x) exp rx] = a−1
n Qp (x) exp rx.
j=1
En conséquence, y = Rp (·) exp(r·) est une solution de (1.14) et l’on déter-

minera les coefficients de Rp par la méthode des coefficients indéterminés en
insérant cette solution dans l’équation (8.14), en identifiant les coefficients
de même puissance des polynômes après simplification des deux membres
par exp(r.), et en résolvant le système linéaire en les coefficients de Rp ainsi
obtenu.
Si r est racine de l’équation caractéristique L(z) = 0, on peut toujours

renuméroter les racines caractéristiques pour que r = rq . L’équation (8.14)
peut s’écrire
q−1
6
(D − rj I)mj (D − rq I)mq y(x) = a−1
n Qp (x) exp rx.
j=1
=q−1
Comme (D − rq I)mq est un isomorphisme de E mq ,p,rq sur E p,rq et j=1 (D −
rj I)mj un automorphisme de E p,rq ,
q−1
6
(D − rj I)mj (D − rq I)mq
j=1
sera un isomorphisme de E mq ,p,rq sur E p,rq et il existera un élément unique

(·)mq Rp (·) exp(rq ·) ∈ E mq ,p,rq tel que
q−1
6
(D − rj I)mj (D − rq I)mq [xmq Rp (x) exp(rq x)] = a−1
n Qp (x) exp rq x.
j=1
Donc, y(x) = xmq Rp(x) exp(rq x) est une solution particulière de (8.14) et
l’on pourra également déterminer les coefficients de Rp par la méthode des
coefficients indéterminés.
Exemple. Considérons l’équation différentielle non homogène du second
ordre
a2 y $$ (x) + a1 y $ (x) + a0 y(x) = (b0 + b1 x) exp rx,
où les aj , bk et r sont des nombres complexes. Utilisons les notations in-
troduites dans l’étude du cas homogène. Si r /∈ {r1 , r2 }, nous savons qu’il
existera une solution de la forme
y(x) = (c0 + c1 x) exp rx.
Introduisons cette expression dans l’équation différentielle, nous trouvons,

après simplification des deux membres par exp rx,
(2a2 r + a1 )c1 + (a2 r 2 + a1 r + a0 )c0 + (a2 r 2 + a1 r + a0 )c1 x = b0 + b1 x,
et dès lors, puisque a2 r 2 + a1 r + a0 = L(r) /= 0,
b1 b0 L(r) − b1 L$ (r)
c1 = , c0 = .
L(r) [L(r)]2
Si r = r1 /= r2 , alors r est racine de L(z) = 0 de multiplicité un et nous

savons qu’il existera une solution de la forme
y(x) = x(c0 + c1 x) exp rx.
Introduisant cette expression dans l’équation différentielle, nous obtenons,

après simplification, et en notant que L(r) = 0,
2a2 c1 + (a1 + r1 )c0 + 2L$ (r)c1 x = b0 + b1 x,
et dès lors, r étant racine simple, on a L$ (r) /= 0 et
b1 b0 L$ (r) − a2 b1
c1 = , c0 = .
2L (r)
$ [L$ (r)]2
Il reste à discuter le cas où r = r1 = r2 est racine double de l’équation

caractéristique. Nous savons alors qu’il existera une solution de la forme
y(x) = x2 (c0 + c1 x) exp rx.
Procédant encore de même et tenant compte du fait que L(r) = L$ (r) = 0,

car r est racine double de L(z) = 0, on trouve
2a2 c0 + 6a2 c1 x = b0 + b1 x,
et dès lors
1 b1
c0 = , c1 = .
2a2 6a2
8.4 Solutions réelles

Considérons tout d’abord le cas de l’équation linéaire homogène (8.7) et
supposons les aj réels (0 ≤ j ≤ n). C’est évidemment un cas particulier de
celui traité et les solutions complexes de (8.7) sont données par les fonctions
complexes y définies par
q
$
y(x) = Pj (x) exp rj x,
j=1
où les rj sont les racines caractéristiques de (8.7) et les Pj des polynômes
arbitraires à coefficients complexes de degré inférieur ou égal à mj − 1, mj
étant la multiplicité de rj . On sait que le caractère réel des aj n’implique
8.4. SOLUTIONS RÉELLES 305
pas le caractère réel des racines caractéristiques rj et l’on a vu que si rj est

non réelle, il ne suffit donc pas de choisir tous les Pj réels pour obtenir une
solution réelle de (8.7).
Si r est une racine non réelle de l’équation caractéristique L(z) = 0, alors,
en prenant le conjugué des deux membres de cette équation, on voit que le
conjugué r̄ de r est également racine de l’équation caractéristique L(z) = 0,
avec la même multiplicité que r. En conséquence, les racines distinctes de
l’équation caractéristique pourront toujours être numérotées comme suit
r1 , r2 , . . . , rp, s1 , s2 , . . ., st , s1 , s2 , . . . , st,
avec les multiplicités respectives
m1 , m2 , . . ., mp, n1 , n2 , . . ., nt , n1 , n2 , . . . , nt,
où les rj , (1 ≤ j ≤ p) sont des nombres réels, sk , (1 ≤ k ≤ t) sont des nombres

complexes non réels et où les entiers 0 ≤ p ≤ q, 0 ≤ t = (q − p)/2, mj (1 ≤
j ≤ p) et nk (1 ≤ k ≤ t) sont tels que
m1 + . . . + mp + 2(n1 + . . . + nt ) = n.
Si nous posons sk = bk + ick , alors sk = bk − ick , (1 ≤ k ≤ t). La solution

générale complexe de (8.7) peut donc s’écrire
p
$ t
$ t
$
y(x) = Pj (x) exp rj x + Qk (x) exp sk x + Rk (x) exp sk x,
j=1 k=1 k=1
où les Pj , Qk , Rk sont des polynômes sur C de degrés inférieurs ou égaux à

mj − 1, nk − 1 et nk − 1 respectivement. Dès lors,
p
$
y(x) = Pj (x) exp rj x
j=1
t
$
+ {[Qk (x) + Rk (x)] cos ck x + i[Qk (x) − Rk (x)] sin ck x} exp bk x.
k=1
Cette solution sera réelle si nous choisissons les polynômes Pj , Qk + Rk et
i(Qk − Rk ) réels, c’est-à-dire tels que
Pj = Pj , (1 ≤ j ≤ p), Qk + Rk = Qk + Rk ,
i(Qk − Rk ) = i(Qk − Rk ), (1 ≤ k ≤ t),

ce qui équivaut à prendre Pj réel (1 ≤ j ≤ p) et Qk et Rk complexes

conjugués (1 ≤ k ≤ t). Réciproquement, si la solution y est réelle, alors on a
y(x) = y(x) pour tout x ∈ R, et dès lors, en utilisant son expression donnée
ci-dessus, et le fait que exp ax = exp āx, on obtient
p
$ t
$
[Pj (x) − Pj (x)] exp rj x + [Qk (x) − Rk (x)] exp sk x
j=1 k=1
t
$
+ [Rk (x) − Qk (x)] exp sk x = 0, x ∈ R.
k=1
Puisque la famille
F = {x 2→ xl exp rj x : 0 ≤ l ≤ mj − 1, 1 ≤ j ≤ p;
x 2→ xl exp sk x : 0 ≤ l ≤ nk − 1, 1 ≤ k ≤ t;
x 2→ xl exp sk x : 0 ≤ l ≤ nk − 1, 1 ≤ k ≤ t},
est libre, on déduit aussitôt de l’identité précédente que, pour toute solution
réelle y de (8.7), on a
Pj = Pj , (1 ≤ j ≤ p), Qk = Rk , (1 ≤ k ≤ t),
qui est par conséquent une condition nécessaire et suffisante pour que y soit
réelle. Si cette condition est vérifiée, alors on a
p
$ t
$
y(x) = Pj (x) exp rj x + 28[ Qk (x) exp sk x],
j=1 k=1
où les Pj sont des polynômes réels arbitraires de degré inférieur ou égal à
mj − 1 (1 ≤ j ≤ p) et les Qk sont des polynômes complexes arbitraires de
degré inférieur ou égal à nk − 1 (1 ≤ k ≤ t). Les Qk peuvent donc toujours
s’écrire sous la forme
Qk (x) = (1/2)[Bk (x) − iCk (x)]
où les Bk et Ck sont des polynômes réels arbitraires de degré inférieur ou

égal à nk − 1 (1 ≤ k ≤ t), ce qui donne finalement la formule générale
p
$ t
$
y(x) = Pj (x) exp rj x + [Bk (x) cos ck x + Ck (x) sin ck x] exp bk x,
j=1 k=1
et achève la démonstration du résultat suivant.

Proposition. Si tous les coefficients aj sont réels dans l’équation (8.7), alors
y est une solution réelle de (8.7) si et seulement si elle est de la forme
p
$ t
$
y(x) = Pj (x) exp rj x + [Bk (x) cos ck x + Ck (x) sin ck x] exp bk x,
j=1 k=1
où les rj sont les racines réelles, de multiplicités respectives mj , de l’équati-

on caractéristique (1 ≤ j ≤ p), bk et ck sont respectivement les parties
réelles et imaginaires des racines non réelles, de multiplicités respectives nk ,
de l’équation caractéristique (1 ≤ k ≤ t) et où les Pj , Bk et Ck sont des
polynômes arbitraires à coefficients réels de degrés respectivement inférieurs
ou égaux à mj − 1, nk − 1 et nk − 1, (1 ≤ j ≤ p, 1 ≤ k ≤ t).
Remarque. On vérifie sans peine que si y est solution d’une équation
différentielle linéaire homogène à coefficients réels, alors ȳ l’est aussi. Dès
lors, puisque l’ensemble des solutions complexes de (8.7) est un espace vec-
toriel sur C et que
8y = (1/2)(y + ȳ), 9y = (1/2i)(y − ȳ),
on voit que 8y et 9y seront aussi solutions de (8.9) et seront des solutions

réelles. Cette remarque peut faciliter la détermination des solutions réelles
d’une équation différentielle homogène à coefficients réels.
Exemple. Revenons à l’équation différentielle linéaire homogène du second
ordre (8.12)
a2 y $$ (x) + a1 y $ (x) + a0 y(x) = 0,
mais supposons maintenant que les coefficients aj (0 ≤ j ≤ 2) sont réels.
L’équation caractéristique correspondante est
a2 z 2 + a1 z + a0 = 0.
Dès lors, si a21 − 4a2 a0 > 0, les racines caractéristiques

G G
−a1 − a21 − 4a2 a0 −a1 + a21 − 4a2 a0
r1 = , r2 = ,
2a2 2a2
sont toutes deux réelles et simples (m1 = m2 = 1), et les solutions réelles de
(8.12) sont donc les fonctions de la forme
y(x) = c1 exp r1 x + c2 exp r2 x,

où c1 et c2 sont des nombres réels arbitraires. Si a21 − 4a2 a0 < 0, les racines
caractéristiques
G G
−a1 − i 4a2 a0 − a21 −a1 + i 4a2 a0 − a21
r1 = , r2 = = r1 ,
2a2 2a2
sont complexes conjuguées non réelles et simples (m1 = m2 = 1), et en
posant r1 = b − ic, r2 = b + ic, les solutions réelles de (8.12) sont les fonctions
de la forme
y(x) = [c1 cos cx + c2 sin cx] exp bx,
où c1 et c2 sont des nombres réels arbitraires. Si a21 − 4a2 a0 = 0, l’équation
caractéristique possède la racine réelle double
a1
r1 = −
2a2
(m1 = 2) et les solutions réelles de (8.12) sont les fonctions de la forme
y(x) = (c1 + c2 x) exp r1 x,
où c1 et c2 sont des nombres réels arbitraires.

Passons maintenant au cas d’une équation différentielle linéaire non ho-
mogène
n
$
L(D)y ≡ aj y (j) (x) = f (x),
j=0
dont nous supposons les coefficients aj réels. Si y est solution de cette

équation, alors, en conjugant les deux membres, on trouve
L(D)ȳ = f¯,
ce qui entraı̂ne aussitôt, par combinaison linéaire de ces deux équations, que
L(D)(8y) = 8f, L(D)(9y) = 9f.
En d’autres termes, si y est solution de l’équation différentielle non homogène

L(D)y = f et si les coefficients de L(D) sont réels, alors 8y et 9y seront
respectivement des solutions réelles des équations non homogènes réelles
L(D)y = 8f, L(D)y = 9f.
En conséquence, si une équation différentielle non homogène
L(D)y = g
dont les coefficients et le second membre sont réels, est telle que g puisse
s’écrire g = 8f ou g = 9f pour une certaine exponentielle-polynôme com-
plexe f , et si l’on a déterminé une solution v de l’équation L(D)y = f , alors
8v ou 9v sera une solution de L(D)y = g. Cette remarque peut faciliter
l’obtention d’une solution particulière réelle lorsque g est le produit d’un
polynôme par une fonction trigonométrique.
Exemple. Considérons par exemple l’équation différentielle
y $$ (x) + γy(x) = cos ωx,
où γ est un réel et ω > 0. Comme cos ωx = 8 exp iωx, une solution parti-
culière réelle de cette équation s’obtiendra en prenant la partie réelle d’une
solution particulière complexe de l’équation
y $$ (x) + γy(x) = exp iωx.
Les racines caractéristiques de l’équation caractéristique de l’équation ho-

mogène associée sont données par
√
r1 = − −γ = −r2
si γ < 0, par
r1 = r2 = 0
si γ = 0 et par
√
r1 = −i γ = −r2
si γ > 0. La méthode des exponentielles-polynômes développée dans la
section précédente fournit donc la solution particulière complexe suivante :
1
y(x) = exp iωx
γ − ω2
si γ /= ω 2 et
x
y(x) = exp iωx
2iω
si γ = ω 2 , ce qui donne, en prenant la partie réelle, les solutions particulières
réelles de l’équation de départ
1
y(x) = cos ωx,
γ − ω2
si γ /= ω 2 et
x
y(x) = sin ωx
2ω
si γ = ω 2 . Ce dernier cas illustre le phénomène bien connu de résonance en

mécanique et en physique : lorsque γ = ω 2 , la fréquence ω de l’excitation
√
extérieure cos ωx est égale à la fréquence propre γ de l’oscillateur régi par
l’équation différentielle homogène associée
y $$ + γy = 0,
et, puisque la solution réelle générale est donnée par

x
y(x) = c1 cos ωx + c2 sin ωx + sin ωx,
2ω
la présence du facteur x montre que l’amplitude des oscillations augmentera
indéfiniment lorsque x tend vers +∞.
8.5 Problème de Cauchy

Soit maintenant A une application linéaire de Kn dans Kn , f une application
continue de R dans Kn .
Définition. On appelle système différentiel linéaire sous forme normale
toute équation différentielle de la forme
z $ (x) = Az(x) + f (x), x ∈ R. (8.15)
dont l’inconnue est une fonction z de R dans Kn . Une solution sur R de (8.15)
est une application z de R dans Kn dérivable sur R et vérifiant l’équation en
chaque x ∈ R.
Si
n
$
aj y (j)(x) = h(x) (8.16)
j=0
est une équation différentielle linéaire d’ordre n à coefficients dans K, on peut

la ramener à un système différentiel linéaire sous forme normale en posant
y(x) = z1 (x), y $ (x) = z2 (x), y $$ (x) = z3 (x), . . . , y (n−1) (x) = zn (x),
ce qui entraı̂ne les relations
z1$ = z2 , z2$ = z3 , . . . , zn−1

$
= zn ,
8.5. PROBLÈME DE CAUCHY 311
et, en utilisant l’équation, la relation

n−1
$
aj zj+1 (x) + an zn$ (x) = h(x).
j=0
Dès lors, si y est solution de (8.16), la fonction z(x) = (z1 (x), . . ., zn (x))
vérifie le système différentiel (8.15) avec
 
n
$ aj−1
Az = z2 , z3 , . . . , zn, − zj 
j=1
an
et 4 5
h(x)
f (x) = 0, . . . , 0, .
an
Réciproquement, on vérifie sans peine que si z est solution de (8.15) pour
l’application A et l’application f ci-dessus, sa première composante z1 sera
solution de (8.16).
Définition. Etant donné le système (8.15), x0 ∈ R et z0 ∈ Kn , on appelle
problème de Cauchy de condition initiale z0 en x0 la recherche d’une solution
z sur R de (8.15) telle que
z(x0 ) = z0 .
Dans le cas de l’équation différentielle linéaire à coefficients constants
d’ordre n (8.13), le problème de Cauchy revient, comme on le vérifie immé-
diatement, à rechercher une solution de l’équation telle que
y(x0 ) = y0 , y $ (x0 ) = y1 , . . . , y (n−1)(x0 ) = yn−1 ,
où les yj , (0 ≤ j ≤ n − 1) sont donnés dans K.

Montrons que le problème de Cauchy a au plus une solution.
Proposition. Pour chaque x0 ∈ R et chaque z0 ∈ Kn , il existe au plus une
solution du problème de Cauchy pour l’équation (8.15).
Démonstration. En passant aux parties réelles et imaginaires des com-
posantes de z, le cas où K = C se ramène au cas où K = R avec n remplacé
par 2n. Il suffit donc de considérer le cas où K = R. Si z et w sont solutions
du problème de Cauchy pour (8.15) de condition initiale z0 en x0 , alors, par
soustraction, la fonction u = z − w sera solution du problème de Cauchy
u$ (x) = Au(x), (x ∈ R), u(x0 ) = 0.

Dès lors, par les propriétés élémentaires de la dérivée , on aura

(|u(x)|22)$ = 2(u(x)|u$(x)) = 2(Au(x)|u(x)), x ∈ R.
L’inégalité de Cauchy et les propriétés des applications linéaires entraı̂nent

que
|(Au(x)|u(x))| ≤ |Au(x)|2|u(x)|2 ≤ K|u(x)|22, x ∈ R,
pour une certaine constante positive K, et dès lors, en posant v(x) =
|u(x)|22, x ∈ R, on aura
−2Kv(x) ≤ v $ (x) ≤ 2Kv(x), x ∈ R.
L’inégalité de droite entraı̂ne
v $ (x) exp(−2Kx) − 2Kv(x) exp(−2Kx) ≤ 0,

c’est-à-dire
[v(x) exp(−2Kx)]$ ≤ 0.
En conséquence, v(·) exp(−2K·) est décroissante et, par construction, posi-
tive. Comme elle s’annule en x = x0 , elle doit être nulle pour tout x ≥ x0 et
dès lors v(x) et u(x) sont nuls pour x ≥ x0 . De même, l’inégalité de gauche
entraı̂ne
v $ (x) exp(2Kx) + 2Kv(x) exp(2Kx) ≥ 0,
c’est-à-dire
[v(x) exp(2Kx)]$ ≥ 0.
En conséquence, v(·) exp(2K·) est croissante et, par construction, positive.
Comme elle s’annule en x = x0 , elle doit être nulle pour tout x ≤ x0 et dès
lors v(x) et u(x) sont nuls pour x ≤ x0 . Donc z(x) = w(x) pour tout x ∈ R
Corollaire. Si h est une application continue de R dans K, a ∈ R et yj ∈

K, (0 ≤ j ≤ n − 1), le problème de Cauchy
n
$
aj y (j) (x) = h(x), x ∈ R,
j=0
y(x0 ) = y0 , y $ (x0 ) = y1 , . . . , y (n−1)(x0 ) = yn−1

possède au plus une solution sur R.
En combinant ce corollaire avec les théorèmes d’existence obtenus plus
haut, on obtient le théorème d’existence et d’unicité suivant.
8.5. PROBLÈME DE CAUCHY 313
Corollaire. Si h est une combinaison linéaire d’exponentielles-polynômes

de R dans K, x0 ∈ R et yj ∈ K, (0 ≤ j ≤ n − 1), le problème de Cauchy
n
$
aj y (j) (x) = h(x), x ∈ R,
j=0
y(x0 ) = y0 , y $ (x0 ) = y1 , . . . , y (n−1)(x0 ) = yn−1

possède une solution unique sur R.
Remarque. Si I est un intervalle de R, x0 ∈ I, y0 ∈ Rn et f une application
continue de I × Rn dans Rn , le problème de Cauchy (local) de condition
initiale y0 en x0 pour le système différentiel sous forme normale
y $ (x) = f (x, y(x)),
est la détermination d’un sous-intervalle J ⊂ I contenant x0 et d’une solution
y du système différentiel définie sur J et telle que
y(x0 ) = y0 .
Dans le cas d’une équation différentielle du second ordre décrivant le mou-
vement d’un point matériel,
u$$ (x) = g(x, u(x), u$(x)),
et qui peut évidemment s’écrire sous la forme normale équivalente
y1$ (x) = y2 (x), y2$ (x) = g(x, y1(x), y2 (x)),
en posant y1 = u, y2 = u$ , la donnée des conditions de Cauchy revient à la
donnée de la position et de la vitesse à l’instant initial. Le raisonnement fait
plus haut dans le cas d’un système linéaire à coefficients constants montre
que le problème de Cauchy
y $ (x) = f (x, y(x)), y(x0 ) = y0 ,
possède au plus une solution sur tout sous-intervalle J de I contenant x0
lorsque f vérifie sur chaque ensemble du type I × B, où B est un borné de
Rn , la condition de Lipschitz
|f (x, y) − f (x, z)|2 ≤ LB |y − z|2 ,
où LB ≥ 0 est une constante ne dépendant que de B. Le théorème de
la moyenne montre que cette condition de Lipschitz sera satisfaite lorsque
f possède sur I × Rn des dérivées partielles par rapport aux yj qui sont
bornées sur les ensembles I × B. Les méthodes du Chapitre 18 permettront
de démontrer l’existence de cette solution.
8.6 Exercices
1. Montrer que si l’on introduit les fonctions sinus hyperbolique sinh et
cosinus hyperbolique cosh par
exp x − exp(−x) exp x + exp(−x)

sinh x = , cosh x = ,
2 2
alors, si a > 0, les solutions réelles de l’équation différentielle
y (4)(x) − a4 y(x) = 0,
(qui intervient en théorie de l’élasticité) sont données par
y(x) = A sin ax + B cos ax + C sinh ax + D cosh ax,
où A, B, C, D sont des nombres réels arbitraires.

2. Montrer que, si a ∈ R et T > 0, l’équation différentielle
y $$ (x) + ay(x) = 0
possède une solution non nulle vérifiant les conditions aux limites de Dirichlet
y(0) = y(T ) = 0,
si et seulement si
aT 2 = k2 π 2 , (k ∈ N∗ ),
et qu’elle possède une solution non nulle vérifiant les conditions aux limites
de Neumann
y $ (0) = y $ (T ) = 0,
si et seulement si
aT 2 = k2 π 2 , (k ∈ N).
3. Montrer que si a ∈ R et T > 0, l’équation différentielle
y $$ (x) + ay(x) = 0
possède une solution non nulle telle que y(x) = y(x + T ) pour tout x ∈ R
(solution T-périodique) si et seulement si
aT 2 = 4k2 π 2 , (k ∈ N).
8.6. EXERCICES 315
4. On appelle équation différentielle d’Euler toute équation différentielle de

la forme
an xn y (n) (x) + an−1 xn−1 y (n−1) (x) + . . . + a1 xy $ (x) + a0 y(x) = 0,
où n ≥ 1 est un entier et aj ∈ C, (0 ≤ j ≤ n). Une solution sur ]0, +∞[ de

l’équation d’Euler est une fonction y n-fois dérivable sur ]0, +∞[ vérifiant
cette équation sur cet intervalle. Montrer que le changement de variable
défini par
t = log x (et donc x = exp t)
transforme l’équation d’Euler en une équation différentielle linéaire homogè-
ne d’ordre n à coefficients constants pour la nouvelle fonction inconnue z
définie par z(t) = y(exp t).
5. Utiliser les résultats de l’exercice précédent pour montrer que, si n ≥ 2
est un nombre réel, les solutions sur ]0, +∞[ de l’équation différentielle
n−1 $
y $$ (x) + y (x) = 0,
x
sont données par
B
y(x) = A + si n > 2,
xn−2
et
y(x) = A + B log x si n = 2.
6. On dit que l’équation différentielle linéaire à coefficients constants dans
C
n
$
aj y (j) (x) = 0
j=0
est stable si toutes ses solutions sont bornées sur [0, +∞[. Montrer que
l’équation différentielle est stable si et seulement si les deux conditions sui-
vantes sont remplies :
a) toutes les racines caractéristiques de l’équation ont une partie réelle
négative;
b) les racines caractéristiques purement imaginaires sont simples.
On dit que l’équation différentielle ci-dessus est asymptotiquement stable
si toutes ses solutions tendent vers zéro lorsque x tend vers +∞. Montrer
que l’équation différentielle est asymptotiquement stable si et seulement si
toutes ses racines caractéristiques ont une partie réelle strictement négative.
7. On considère l’équation de la chaleur

2
Dtu(t, s) − Dss u(t, s) = 0,
dont les solutions sont des fonction u de R2 dans R de classe C 2 sur R2 .

Cette équation décrit la propagation de la chaleur dans un fil. Déterminer
les solutions de l’équation de la chaleur qui sont de la forme u(t, s) = y(at +
s), avec a un réel non nul et y une fonction de classe C 2 sur R (ondes
progressives). (La fonction y est solution de l’équation différentielle linéaire
à coefficients constants −y $$ (x) + ay $ (x) = 0, ce qui donne
u(t, s) = A + B exp(a2 t + as)).
8. On considère l’équation des télégraphistes

2
Dtt 2
u(t, s) − Dss u(t, s) + cDtu(t, s) = 0,
(c > 0), dont les solutions sont des fonction u de R2 dans R de classe C 2 sur
R2 . Cette équation décrit la propagation des ondes électromagnétiques dans
un fil conducteur. Déterminer les solutions de l’équation des télégraphistes
qui sont de la forme u(t, s) = y(at + s), avec a un réel non nul et y une
fonction de classe C 2 sur R (ondes progressives). (La fonction y est solution
de l’équation différentielle linéaire à coefficients constants (a2 − 1)y $$ (x) +
cay $ (x) = 0, ce qui donne u(t, s) = A si a = ±1 et
4 5
ca
u(t, s) = A + B exp − (at + s)
a −1
2
si a /= ±1).
9. On considère l’équation différentielle
mh$$ (x) + rh$ (x) = −mg,
introduite au premier paragraphe, où m > 0, r > 0 et g > 0. Déterminer les

solutions et montrer que, pour toute solution h de cette équation, on a
mg
lim h$ (x) = − .
x→+∞ r
(Vitesse limite de chute en présence d’un frottement sous l’action de la pe-
santeur).
10. On considère l’équation différentielle
y $$ (x) + by $ (x) + ay(x) = A sin ωx,

où a > 0, b > 0, ω > 0 et A ∈ R. Déterminer les solutions réelles de cette

équation et montrer que si θ est déterminé par la relation
bω
tg θ = ,
a − ω2
et si y est une solution quelconque de l’équation différentielle, alors
2 3
A
lim y(x) − sin(ωx − θ) = 0.
x→∞ [(a − ω ) + ω 2 b2 ]1/2
2 2
On dit que les solutions de cette équation s’approchent du régime station-

naire donné par ys (x) = [(a−ω2 )2A+ω2 b2 ]1/2 sin(ωx − θ).
11. Montrer que, si ω et Ω sont des nombres réels, les systèmes d’équations
différentielles réelles
u$$ (x) + ωv $ (x) = 0, v $$(x) − ωu$ (x) = 0,
et
u$$ (x) + 2ωv $ (x) + Ω2 u(x) = 0, v $$ (x) − 2ωu$ (x) + Ω2 v(x) = 0,
peuvent se résoudre par la méthode introduite dans ce chapitre.

Suggestion. En posant y = u + iv, les ramener respectivement aux équations
différentielles linéaires complexes
y $$ (x) − iωy $ (x) = 0, y $$ (x) − 2iωy $ (x) + Ω2 y(x) = 0.
Discuter la nature géométrique de la solution dans le plan complexe. Ces

systèmes interviennent dans différents problèmes de mécanique et de physi-
que mathématique (pendule de Foucault, précession de Larmor).

Monsieur Euler est même parvenu à . . . résoudre l’équation générale
dn y dn−1 y
a + b + . . . + X = 0.
dxn dxn−1
Il se sert à cet effet de la substitution adroite de la quantité exponentielle
Acf x (où c est la quantité dont le logarithme est égal à 1), et de ses différen-
tielles successives, au lieu de y, dy, ddy, etc.; cette substitution transforme
l’équation proposée en une autre, qui devient une simple équation finie, telle
que
(1 + bf + af 2 ) = 0, lorsque n = 2, ou
(1 + cf + bf 2 + af 3 ) = 0, si n = 3, etc.
Ayant donc trouvé les différentes valeurs de f suivant le degré de l’équation,

et mettant ces différentes valeurs au lieu de f, dans Acf x , on aura autant de
valeurs de y, puisque y = Acf x ; et ces différentes valeurs jointes ensemble
donneront l’intégrale complète de l’équation proposée. Il y a, à la vérité,
ici quelques cas qui pourroient embarrasser, savoir quand quelques-unes des
valeurs de f sont, ou égales, ou imaginaires; mais Euler résout ces difficultés.
Euler avoit d’abord été arrêté par la limitation que X fut égal à zéro; mais
dans la suite, il surmonta cette difficulté; en perfectionnant sa méthode, il
montra comment on pouvoit résoudre complètement l’équation ci-dessus, X
étant une fonction quelconque de x; mais la méthode est trop compliquée,
quoique sûre et complète, pour en pouvoir donner ici même une esquisse.
Jean-Etienne de Montucla, 1802
L’oscillateur harmonique que nous allons étudier possède des équivalents

très proches dans beaucoup de domaines; bien que partant de l’exemple mé-
canique d’un poids au bout d’un ressort, ou de petites oscillations d’un pen-
dule, ou encore d’autres appareils mécaniques, nous ne faisons en réalité
qu’étudier une certaine équation différentielle. Cette équation apparaı̂t très
souvent en physique comme dans d’autres sciences, et de fait, elle est sous-
jacente à tant de phénomènes que cela vaut bien la peine de l’étudier. Parmi
ces phénomènes, il y a les oscillations d’une masse accrochée à un ressort;
les oscillations des charges allant et venant dans un circuit électrique; les
vibrations d’un diapason créant des ondes sonores, les vibrations analogues
des électrons dans un atome engendrant des ondes lumineuses; les équations
de fonctionnement d’un servo-mécanisme comme un thermostat régulant la
température; des interactions compliquées au sein de réactions chimiques;
la croissance d’une population de bactéries en interaction avec l’apport de
nourriture et les poisons produits par ces bactéries; des renards mangeant des
lapins mangeant de l’herbe, etc. Tous ces phénomènes suivent des équations
qui sont très semblables les unes aux autres. Ces équations sont appelées
équations différentielles linéaires à coefficients constants.
Richard P. Feynman, 1963

Les équations linéaires [à coefficients constants] constituent pratiquement

l’unique importante classe d’équations différentielles dont la théorie est re-
lativement complète. Cette théorie qui en fait est une branche de l’algèbre
linéaire permet de résoudre totalement les équations linéaires autonomes.
La théorie des équations linéaires est par ailleurs utile comme première ap-
proximation dans la résolution de problèmes non linéaires. Elle permet entre
autres d’étudier la stabilité de l’équilibre dans les cas génériques.
Vladimir I. Arnold, 1974
Une intelligence qui, pour un instant donné, connaı̂trait toutes les forces
dont la nature est animée et la situation respective des êtres qui la composent,
si d’ailleurs elle était assez vaste pour soumettre ces données à l’Analyse,
embrasserait dans la même formule les mouvements des plus grands corps
de l’univers et ceux du plus léger atome; rien ne serait incertain pour elle,
et l’avenir, comme le passé, serait présent à ses yeux.
Simon de Laplace, 1795
Dans mes leçons données à l’Ecole Polytechnique, comme dans la plu-

part des Ouvrages ou Mémoires que j’ai publié sur le Calcul intégral, j’ai
cru devoir renverser cet ordre et placer en premier lieu la recherche, non pas
des intégrales générales, mais des intégrales particulières; en sorte que la
détermination des constantes ou des fonctions arbitraires ne fut plus séparée
de la recherche des intégrales. ... Les constantes arbitraires, que doivent
renfermer les intégrales générales d’un système d’équations différentielles du
premier ordre, se trouvent remplacées par des valeurs particulières des incon-
nues, correspondant à une valeur particulière de la variable indépendante, et
par conséquent le problème de l’intégration se trouve réduit à un problème
complètement déterminé.
Une cause très petite, qui nous échappe, détermine un effet considérable
que nous ne pouvons pas ne pas voir, et alors nous disons que cet effet est
dû au hasard. Si nous connaissions exactement les lois de la nature et la
situation de l’univers à l’instant initial, nous pourrions prédire exactement
la situation de ce même univers à un instant ultérieur. Mais, lors même
que les lois naturelles n’auraient plus de secret pour nous, nous ne pourrons
connaı̂tre la situation initiale qu’approximativement. Si cela nous permet
de prévoir la situation ultérieure avec la même approximation, c’est tout ce
qu’il nous faut, nous disons que le phénomène a été prévu, qu’il est régi par
des lois; mais il n’en est pas toujours ainsi, il peut arriver que de petites
différences dans les conditions initiales en engendrent de très grandes dans
les phénomènes finaux; une petite erreur sur les premières produirait une
erreur énorme sur les derniers. La prédiction devient impossible et nous
avons le phénomène fortuit.
Le problème de Cauchy apparaı̂t en mécanique : le mouvement d’un

système mécanique doit être calculé à partir des lois du mouvement, qui for-
ment un système différentiel, et des positions et vitesses initiales, qui sont
les données définissant une solution particulière de ce système. Le problème
de Cauchy pour les systèmes différentiels ordinaires a été, bien entendu, le
plus important problème mathématique tant que l’artillerie a régi le monde,
tant que la mécanique céleste a été la théorie scientifique principale et tri-
omphante.
Jean Leray, 1963

Chapitre 9
Fonctions primitivables
9.1 Fonctions primitivables et primitives

Le chapitre précédent a montré comment déterminer les solutions d’équa-
tions différentielles linéaires de la forme
n
$
L(D)y(x) ≡ aj y j (x) = f (x),
j=0
lorsque les aj sont des nombres complexes et f une exponentielle-polynôme.

Le problème de la détermination des solutions de telles équations pour des
classes plus générales de seconds membres f est un problème difficile (et
parfois impossible), même dans le cas le plus simple où l’équation se réduit
à
y $ (x) = f (x),
c’est-à-dire lorsqu’il s’agit de déterminer les fonctions qui sont les dérivées
d’une fonction donnée (problème inverse de la dérivation).
Soit I un intervalle et f une fonction de R dans Rp définie sur I.
Définition. On dit que f est primitivable sur I s’il existe une fonction F
de R dans Rp dérivable sur I et telle que
F $ (x) = f (x)
pour chaque x ∈ I. Une telle fonction s’appelle une primitive de f sur I.

Pour rappeler la contribution fondamentale d’Isaac Newton à l’élabora-
tion et à l’étude de cette notion, on désignera par N (I, Rp) l’ensemble des
321
322 CHAPITRE 9. FONCTIONS PRIMITIVABLES
fonctions f de R dans Rp qui sont primitivables sur I. Comme la fonction

nulle sur I admet toute fonction constante sur I comme primitive sur I, on
voit que N (I, Rp) n’est pas vide. On voit aussi que, si la primitive de f sur
I existe, elle n’est pas nécessairement unique. En traduisant, en termes de
primitives, le fait qu’une fonction a une dérivée nulle sur un intervalle si et
seulement si elle y est constante, on obtient le résultat suivant.
Proposition. Soit f une fonction de R dans Rp primitivable sur l’intervalle

I. Si F est une primitive de f sur I, alors la fonction G de R dans Rp est
une primitive de f sur I si et seulement si la fonction F − G est constante
sur I.
Démonstration. La condition suffisante est facile puisque, pour tout x ∈

I, on a, si F − G est constante sur I,
G$ (x) = F $ (x) + (G − F )$ (x) = F $ (x) = f (x).
En ce qui concerne la condition nécessaire, on a, par hypothèse, pour tout

x ∈ I,
(F − G)$ (x) = F $ (x) − G$ (x) = f (x) − f (x) = 0,
et dès lors F − G est constante sur I.
Corollaire. Soit f une fonction de R dans Rp primitivable sur l’intervalle

I. Pour chaque a ∈ I et chaque c ∈ Rp il existe une primitive unique F de
f telle que
F (a) = c.
Démonstration. Si G est une primitive de f sur I vérifiant la même

condition, alors, par la proposition précédente, F − G est constante sur I
et, par hypothèse, F (a) − G(a) = 0. Donc F = G sur I et l’unicité est
démontrée.
En particulier, l’unique
H
primitive F de f sur I telle que F (a) = 0 sera
désignée par Fa ou a· f . Les primitives de f sur I seront donc toutes de la
forme Fa + c où c ∈ Rp est arbitraire et, si G est une primitive quelconque
de f sur I, on a évidemment Fa = G − G(a).
La proposition ci-dessus nous conduit à introduire sur l’ensemble des
fonctions de R dans Rp définies sur l’intervalle I la relation = définie comme
suit.
9.1. FONCTIONS PRIMITIVABLES ET PRIMITIVES 323
Définition. Si g et h sont deux fonctions de R dans Rp définies sur l’inter-

valle I, on écrira
g=h
si g − h est constante sur I.
On vérifie sans peine que = est une relation d’équivalence sur l’ensemble
des fonctions de R dans Rp définies sur I. Si fI et gI sont deux classes
d’équivalence pour = contenant respectivement les fonctions f et g, on
pourra définir la somme fI+ gI par la classe d’équivalence contenant f + g (on
voit sans peine que cette définition ne dépend pas du choix des représentants
f et g), et l’on définira, pour c ∈ R, cfI comme étant la classe d’équivalence
de cf .
La proposition ci-dessus exprime donc qu’à toute fonction f primitivable
sur I correspond une et une seule classe d’équivalence pour = de l’ensemble
des fonctions de RHdans Rp définies sur I. On désigne en général cette classe
d’équivalence par f ou D −1 f et il faut signaler l’abus de notation, consacré
par l’usage, consistant parfois à désigner par le même symbole un élément
choisi dans cette classe d’équivalence, c’est-à-dire une primitive de f sur I.
De nombreuses fonctions élémentaires sont désignées en pratique par
leur valeur en un point x de leur domaine de définition (ainsi l’on parle de
la fonction x2 pour la fonction qui à x associe x2 ) et la notation ci-dessus
est mal adaptée pour de telles fonctions; on utilise alors la notation
J J J
f (x) dx ou f (t) dt ou f (u) du.
Avec l’abus de notation signalé plus haut, chacune de ces expressions désigne
aussi une primitive de f sur I et non sa valeur en un point x (ou t ou u) !
C’est le rôle du symbole dx ou dt ou du d’annuler l’apparente dépendance
des expressions ci-dessus par rapport à x, t ou u. Les symboles x, t ou u
jouent dans ces formules un rôle “muet” analogue à celui de l’indice dans
une formule sommatoire. Par exemple, on vérifie sans peine que la fonctionH
x 2→ x3 /3 est une primitive sur R de la fonction x 2→ x2 . Dès lors, x2 dx
représente la classe d’équivalence des fonctions f + c où f (x) = x3 /3 et c est
une constante réelle.
Signalons également que deux primitives d’une fonctions donnée sur un
intervalle donné, qui diffèrent entre elles par une constante additive, peuvent
avoir des expressions qui dissimulent sournoisement cette relation simple.
Ainsi, pour chaque c ∈ R, les fonctions x 2→ sin x et x 2→ 2 sin x+c 2 cos 2
x−c
sont deux primitives sur R de la fonction x 2→ cos x, puisque la seconde

fonction n’est rien d’autre que la fonction x 2→ sin x + sin c et celle-ci diffère
de la fonction x 2→ sin x par la constante sin c.
Les fonctions primitivables et leurs primitives possèdent les propriétés
élémentaires suivantes.
Proposition. Si f ∈ N (I, Rp) et g ∈ N (I, Rp), on a les propriétés suivantes.
1. f ∈ N (J, Rp) pour tout intervalle J ⊂ I et la restriction à J de toute
primitive sur I de f est une primitive sur J de f .
2. f + g ∈ N (I, Rp) et
J J J
(f + g) = f+ g.
H H
3. cf ∈ N (I, Rp) pour tout c ∈ R et cf = c f. H
4. Chaque composante fj de f appartient à N (I, R), 1 ≤ j ≤ p et fj est la
classe d’équivalence de la jème composante d’une primitive quelconque de f
sur I.
5. Si f ∈ N (I, C), c’est-à-dire si f ∈ N (I, R2) avec R2 muni de la structure
de corps, alors, cf ∈ N (I, C) pour tout c ∈ C et
J J
cf = c f.
Démonstration. Les propriétés 1 à 5 sont des conséquences immédiates

des définitions et des propriétés élémentaires des dérivées.
Cette proposition montre que N (I, Rp) (resp. N (I, C)) est un espace
vectoriel sur R (resp. C). Elle nous permet de trouver des classes de fonc-
tions primitivables sur I par combinaison linéaire de fonctions élémentaires
primitivables sur I. De telles fonctions s’obtiennent facilement en lisant “de
droite à gauche” un tableau donnant les dérivées de fonctions élémentaires.
On obtient ainsi le tableau suivant de fonctions appartenant à N (R, R).
Fonctions Primitives
m+1
x 2→ xm , m ∈ N x 2→ xm+1 + c
x 2→ exp x x 2→ exp x + c
x 2→ sin x x 2→ − cos x + c
x 2→ cos x x 2→ sin x + c
1
x 2→ 1+x 2 x 2→ arctg x + c
1
x 2→ √1+x 2 x 2→ arcsinh x + c
x 2→ sinh x x 2→ cosh x + c
x 2→ cosh x x 2→ sinh x + c
9.1. FONCTIONS PRIMITIVABLES ET PRIMITIVES 325
On déduit aussitôt de ce tableau et de la proposition précédente que si

K désigne R ou C, les fonctions polynômiales de R dans K appartiennent à
N (R, K).
Les fonctions élémentaires suivantes appartiennent à N (R∗+ , R) et à
N (R∗− , R) :
Fonctions Primitives
−m+1
x 2→ x , m /= 1 x 2→ x−m+1 + c
−m
x 2→ x−1 x 2→ ln |x| + c
Enfin, les fonctions x 2→ xa , a /∈ Z sont dans N (R∗+ , R) et ont pour primitives
a+1
les fonctions x 2→ xa+1 + c, (c ∈ R), les fonctions x 2→ exp ax, où a ∈ K, sont
dans N (R, K) et ont pour primitives les fonctions x 2→ a−1 exp ax+c, (c ∈ K)
et la fonction x 2→ √1−x
1
2 appartient à N (] − 1, 1[, R) et a pour primitives les
fonctions x 2→ arcsin x + c(c ∈ R).

On trouvera de nombreux autres exemples dans les tables de primi-
tives, également appelées, pour des raisons que nous verrons plus loin, tables
d’intégrales.
Nous reviendrons plus tard sur l’obtention de classes de fonctions ap-
partenant à N (I, Rp) pour un certain intervalle I. En particulier, nous
montrerons que toute fonction de R dans Rp continue sur I appartient à
N (I, Rp). Par ailleurs, N (I, Rp) contient des fonctions non continues sur I.
Ainsi, la fonction F de R dans R définie par
1
F (x) = x2 sin si x /= 0, F (0) = 0,
x2
possède en chaque point x /= 0 la dérivée
1 2 1
F $ (x) = 2x sin − cos 2
x2 x x
et en 0 la dérivée F $ (0) = 0, ainsi qu’on le vérifie aisément. Mais la fonction
f = F $ , primitivable sur R, n’est pas continue en 0 puisque limx→0 f (x)
n’existe pas. On notera en outre que la fonction f n’est bornée sur aucun
intervalle contenant l’origine. Donc N (I, Rp) contient des fonctions non
bornées.
On peut se demander s’il existe des fonctions réelles définies sur R et qui
n’appartiennent pas à N (R, R). La réponse affirmative résultera aisément
de la propriété de valeur intermédiaire ou propriété de continuité
de Darboux qui est une condition nécessaire pour qu’une fonction soit
primitivable sur un intervalle.
Proposition. Soit I ⊂ R un intervalle et f ∈ N (I, R). Alors f vérifie la

propriété de valeur intermédiaire sur I. En d’autres termes, pour chaque
x ∈ I, chaque y ∈ I tel que x < y et chaque v compris entre f (x) et f (y), il
existe un z ∈ [x, y] tel que f (z) = v.
Démonstration. Comme dans la démonstration du théorème de Bolzano,
on peut, sans perte de généralité, supposer que f (x) < v < f (y). Soit F une
primitive de f sur I et soit G la fonction de R dans R définie par
G(t) = F (t) − vt.
G est évidemment dérivable sur I et
G$ (t) = f (t) − v,
pour chaque t ∈ I, ce qui entraı̂ne en particulier que
G$ (x) < 0 < G$ (y).

"
En prenant ! = − G 2(x) dans la définition de la dérivée de G en x, on trouve
un δ ∈ ]0, y − x] tel que, pour tout t ∈ ]x, x + δ], on a
G$ (x) G(t) − G(x) G$ (x)

≤ − G$ (x) ≤ − ,
2 t−x 2
et dès lors
G(t) − G(x) G$ (x)
≤ < 0,
t−x 2
ce qui implique, pour chaque t ∈ ]x, x + δ], l’inégalité
G(t) < G(x).
En procédant d’une manière similaire en y, on trouve un δ $ ∈ ]0, y − x] tel

que
G(t) < G(y)
pour tout t ∈ [y − δ $ , y[. Comme G, dérivable sur [x, y], y est continue,
le théorème des bornes atteintes de Weierstrass entraı̂ne l’existence d’un
minimant z de G sur [x, y] et les deux inégalités que nous venons d’obtenir
montrent que, nécessairement, z ∈ ]x, y[, et est donc intérieur au domaine
de G. Le théorème de Fermat entraı̂ne alors que G$ (z) = 0, c’est-à-dire que
f (z) = v.
9.2. RÈGLES DE PRIMITIVATION 327
Remarque. Le résultat que nous venons de démontrer montre que la pro-

priété de valeur intermédiaire, vérifiée par les fonctions réelles continues sur
un intervalle, peut également l’être par des fonctions non continues sur cet
intervalle, et ne peut donc être prise, ainsi qu’on l’a fait parfois dans le
passé, comme définition de fonction continue sur un intervalle. En fait, on
sait maintenant qu’une fonction ayant la propriété de valeur intermédiaire
sur R peut être discontinue en chaque point de R !
Il résulte de la proposition précédente que toute fonction qui, sur un
intervalle I de R, prend un nombre fini strictement supérieur à un de valeurs
réelles ne peut appartenir à N (I, R) puisqu’elle ne peut vérifier la propriété
de valeur intermédiaire. Ainsi, la fonction sgn x (signe de x) définie par
sgn x = −1 pour x < 0, sgn 0 = 0 et sgn x = +1 pour x > 0 n’est primiti-
vable sur aucun intervalle contenant l’origine.
9.2 Règles de primitivation

Les règles de dérivation des fonctions composées et du produit de deux fonc-
tions se traduisent, dans le langage des primitives, en conditions suffisantes
de primitivabilité et en règles de calcul des primitives. Le premier résultat
s’appelle la règle de primitivation par substitution.
Proposition. Soit g une fonction réelle dérivable sur l’intervalle I ⊂ R et f
une fonction de R dans Rp primitivable sur g(I). Alors (f ◦ g)g $ ∈ N (I, Rp)
et J J
(f ◦ g)g $ = ( f ) ◦ g.
Démonstration. Si F désigne une primitive de f sur g(I), le théorème

de dérivation des fonctions composées entraı̂ne la dérivabilité sur I de la
fonction F ◦ g et la relation
(F ◦ g)$ = (F $ ◦ g)g $ = (f ◦ g)g $,
ce qui montre que (f ◦ g)g $ ∈ N (I, Rp) et que la formule de l’énoncé est
satisfaite.
Exemple. Si f ∈ N ([−1, 1], Rp), alors les fonctions x 2→ f (sin x) cos x et

x 2→ f (cos x) sin x appartiennent à N (R, Rp) et leurs primitives sont données
respectivement par F ◦ sin +c et F ◦ cos +c où F est une primitive de f sur
[−1, 1].
Corollaire. Si f ∈ N (I, Rp), alors pour tout réel a /= 0, la fonction f (a·) :

x 2→ f (ax) est primitivable sur a−1 I et l’on a
J 4J 5
f (a·) = a−1 f (a·).
Démonstration. Il suffit d’appliquer la proposition précédente avec g

définie par g(x) = ax et le fait que N (a−1 I, Rp) est un espace vectoriel.
Une autre conséquence du théorème de dérivation des fonctions com-
posées est la règle de primitivation par changement de variable.
Proposition. Soient I et J deux intervalles de R et h une bijection de J
sur I telle que h et h−1 soient dérivables sur J et I respectivement. Si f est
une fonction de R dans Rp définie sur I et si (f ◦ h)h$ est primitivable sur
J, alors f est primitivable sur I et
J 4J 5
f= (f ◦ h)h$ ◦ h−1 .
Démonstration. Par hypothèse, si G désigne une primitive de (f ◦ h)h$

sur J, le théorème de dérivation des fonctions composées appliqué à G ◦ h−1
entraı̂ne sa dérivabilité sur I et la formule
[G ◦ h−1 ]$ = (G$ ◦ h−1 )(h−1 )$ = f.(h$ ◦ h−1 ).(h−1 )$ = f,
puisque, de l’identité h ◦ h−1 = I sur I, on déduit, par le théorème de

dérivation des fonctions composées,
1 = (h ◦ h−1 )$ = (h$ ◦ h−1 )(h−1 )$ .
Donc f est primitivable sur I et la formule de l’énoncé est satisfaite.

Remarque. Avec les notations de la Proposition ci-dessus, on vérifie aisé-
ment que la formule
J 4J 5
f= (f ◦ h)h$ ◦ h−1
reste valable si h−1 n’est plus supposé dérivable sur I à condition de supposer
que f est primitivable sur I.
Exemple. Si P est un polynôme de R dans C et si f est définie par f (x) =
√
P ( x), alors f ∈ N (R∗+ ) et
J
√
f = Q( ·),
9.2. RÈGLES DE PRIMITIVATION 329
pour toute primitive Q du polynôme P̃ : y 2→ 2yP (y). En effet, l’application

h : R∗+ → R∗+ , y 2→ y 2 est une bijection dérivable ainsi que sa réciproque, et
h$ (y) = 2y. Dès lors,
f (h(y))h$ (y) = 2yf (y 2 ) = 2yP (y) = P̃ (y)

pour tout y strictement positif, ce qui entraı̂ne que (f ◦h)h$ , égal sur R∗+ à un
polynôme de R dans C, y est primitivable. Par la proposition ci-dessus, f est
primitivable sur R∗+ et ses primitives sont données par la formule annoncée.
Le résultat suivant, qui s’appelle la règle de primitivation par par-
ties, découle du théorème de dérivation d’un produit de fonctions.
Proposition. Soient f et g deux fonctions à valeurs dans K dérivables sur
un intervalle I ⊂ R. Alors f $ g ∈ N (I, K) si et seulement si f g $ ∈ N (I, K),
auquel cas l’on a J J
f $g = f g − f g $.
Démonstration. Le théorème de dérivation d’un produit de fonctions

entraı̂ne la dérivabilité de f g sur I et la formule
(f g)$ = f $ g + f g $ .
Comme (f g)$ est évidemment primitivable sur I, avec f g comme primitive,
il suffit d’utiliser le caractère d’espace vectoriel de N (I, K) pour achever la
démonstration.
Exemples. 1. La fonction ln est primitivable sur tout intervalle I ⊂ R∗+ et
ses primitives sont données par les fonctions x 2→ x ln x − x + c. En effet,
en prenant f (x) = x, g(x) = ln x, on voit que, pour tout x ∈ R∗+ , on a
ln x = f $ (x)g(x), f (x)g(x) = x ln x et f (x)g $ (x) = 1; donc f g $ est primi-
tivable sur I et ses primitives sont données par la formule ci-dessus.
2. Si P est un polynôme de R dans K et a ∈ K \ {0}, toute exponentielle-
polynôme f : x 2→ P (x). exp ax est primitivable sur R. Pour le montrer, on
procède par récurrence sur le degré du polynôme P . C’est évidemment vrai,
par les résultats qui précèdent, si P est un polynôme de degré zéro. Sup-
posons le résultat vrai pour un polynôme de degré n−1 et soit P un polynôme
de degré n. Alors P $ est un polynôme de degré n−1 et P $ (·). exp(a·) est prim-
itivable sur R par l’hypothèse de récurrence. Il en sera de même, par la règle
de primitivation par parties, pour la fonction P (·).(exp(a·))$ = aP (·). exp(a·)
et dès lors pour P (·). exp(a·). En outre, on a
J J
P (·). exp(a·) = a−1 P (·). exp(a·) − a−1 P $ (·). exp(a·),
et en appliquant cette formule successivement à P $ (·). exp(a·), P $$(·). exp(a·),

. . . et en recombinant les résultats, on obtient la formule
J
P (·). exp(a·) =
[a−1 P (·)−a−2 P $ (·)+. . .+(−1)n−1 a−n P (n−1) (·)+(−1)na−n−1 P (n) (·)] exp(a·).
Montrons enfin que la théorie des primitives fournit une expression du
reste du développement de Taylor d’une fonction réelle d’une variable.
Proposition. Si m ≥ 0 est un entier et si f est une fonction réelle (m + 1)-
fois dérivable sur un intervalle I, alors, pour chaque a ∈ I, et chaque h ∈ I −a
différent de 0, l’application
f (m+1) (y)
φh : I → R, y 2→ (a + h − y)m
m!
est primitivable sur I et sa primitive Φh,a qui s’annule en a est égale à la
f,a (h) en h du reste du développement de Taylor Tf,a d’ordre m de
valeur Rm m
f autour de a.
Démonstration. Définissons l’application g de I dans R par
m
$ f (j) (y)
g(y) = (a + h − y)j .
j=0
j!
Par hypothèse, g est dérivable sur I, g(a) = Tf,a

m
(h), g(a + h) = f (a + h) et,
pour chaque y ∈ I, on a
m m
$ f (j+1)(y) $ f (j) (y)
g $ (y) = (a + h − y)j − (a + h − y)j−1
j=0
j! j=1
(j − 1)!
f (m+1) (y)
= (a + h − y)m = φh (y).
m!
Donc φh est primitivable et la valeur en a + h de sa primitive s’annulant en
a est donnée par
g(a + h) − g(a) = f (a + h) − Tf,a

m
(h) = Rm
f,a(h).
9.3. PRIMITIVATION DES FONCTIONS RATIONNELLES 331
9.3 Primitivation des fonctions rationnelles

Soit f une fonction rationnelle de R dans K, où K = R ou C, c’est-à-
dire une fonction de la forme f = PQ où P et Q sont des polynômes d’une
variable réelle à coefficients dans K. Si le degré de P est supérieur ou égal
au degré de Q, on peut toujours écrire, en utilisant l’algorithme de division
des polynômes,
P R
=S+
Q Q
où S et R sont des polynômes d’une variable réelle à valeurs dans K tels
que le degré de R est strictement inférieur à celui de Q. Comme S est
primitivable et que l’on possède une formule pour calculer sa primitive, Q P
sera primitivable si et seulement s’il en est de même de R Q ; il suffit donc

d’étudier la primitivabilité de f sous l’hypothèse que le degré de P est
strictement inférieur à celui de Q. Rappelons aussi que Q P
est définie sur
le complémentaire dom Q dans R de l’ensemble des zéros réels de Q et qu’il
P
faut donc entendre par primitivabilité de PQ sa primitivabilité sur chacun des

intervalles ouverts qui forment dom PQ . Enfin, si m désigne le degré de Q,
c’est-à-dire si l’on peut écrire
m
$
Q(x) = aj xj
j=0
avec am /= 0, alors, comme on l’a déjà signalé, le théorème fondamental de

l’algèbre affirme l’existence de q ≤ m nombres complexes distincts s1 , . . ., sq
les racines de l’équation Q(x) = 0, et de q entiers m1 , . . . , mq supérieurs ou
égaux à un, leurs multiplicités, tels que, pour tout x ∈ R, on a
Q(x) = am (x − s1 )m1 (x − s2 )m2 . . . (x − sq )mq .
Enfin, rappelons que l’ensemble des polynômes de R dans K de degré infé-

rieur ou égal à m, muni des lois habituelles d’addition des polynômes et de
multiplication d’un polynôme par un élément de K, forme un espace vectoriel
sur K de dimension m+1 dont une base évidente est donnée par les monômes
1, x, . . ., xm. Une autre base très utile est donnée par le résultat d’algèbre
suivant, qui se démontre par récurrence.
Lemme. Si Q est le polynôme de R dans C de degré effectif m donné par
Q(x) = am (x − s1 )m1 (x − s2 )m2 . . . (x − sq )mq ,

alors les polynômes Qj,k de R dans C donnés par
Qj,k (x) = am (x − s1 )m1 . . . (x − sj )mj −k . . . (x − sq )mq ,
(1 ≤ k ≤ mj , 1 ≤ j ≤ m),
et obtenus en divisant Q respectivement par (x − sj )k , 1 ≤ k ≤ mj , 1 ≤
j ≤ m, forment une base de l’espace vectoriel des polynômes de R dans C
de degré inférieur ou égal à m − 1.
Une conséquence facile de ce lemme est le résultat suivant.
Corollaire. Si Q est donné par le lemme précédent et si P est un polynôme
de R dans C de degré inférieur ou égal à m − 1, il existe une famille unique
de nombres complexes cj,k , (1 ≤ k ≤ mj , 1 ≤ j ≤ m) telle que, pour tout
x ∈ dom PQ , on a
q mj , -
P (x) $ $
= cj,k (x − sj )−k .
Q(x) j=1 k=1
Ce corollaire entraı̂ne que la primitivabilité de PQ , et le calcul de ses

primitives, revient à celle des fonctions rationnelles particulières du type
g(x) = (x − s)−k
où s ∈ C et k ∈ N∗ . On vérifie sans peine que, pour k ≥ 2, on a, sur chaque

intervalle de R \ {s}, g(x) = G$ (x) pour
G(x) = c + (1 − k)−1 (x − s)−k+1 ,
c étant un nombre complexe arbitraire. Par conséquent, une telle fonction

rationnelle f est primitivable sur chaque intervalle en question et ses primi-
tives sont données par la formule ci-dessus. Si nous posons s = u + iv avec
u la partie réelle de s et v la partie imaginaire de s, les primitives G de g
peuvent encore s’écrire, avec s̄ = u − iv,
(x − s̄)k−1
F (x) = c + (1 − k)−1 .
[(x − u)2 + v 2 ]k−1
Si k = 1 et s = 0, g est primitivable sur R∗− et sur R∗+ et ses primitives G y
sont données par la formule
G(x) = c + ln |x|,
où c est une constante complexe arbitraire. Si k = 1 et s = u est réel, g

est primitivable sur R∗− et sur R∗+ et ses primitives G y sont données par la
formule
G(x) = c + ln |x − u|.
Enfin, si k = 1 et v /= 0, alors, pour tout x ∈ R, on a
x−u iv
g(x) = +
(x − u) + v
2 2 (x − u)2 + v 2
2 3
d ? @ d x−u
= (1/2) ln[(x − u)2 + v 2 ] + i arctg
dx dx v
en utilisant les règles de dérivation des fonctions élémentaires et le théorème
de dérivation des fonctions composées. En conséquence, les primitives G de
g sont données par la formule
x−u
G(x) = c + (1/2) ln[(x − u)2 + v 2 ] + i arctan .
v
En conclusion, quels que soient s ∈ C et k ∈ N∗ , la fonction g est pri-
mitivable sur chaque intervalle contenu dans son domaine et les formules
ci-dessus fournissent les primitives dans les différents cas. Ces résultats,
joints au corollaire ci-dessus et au caractère d’espace vectoriel de N (I, K),
impliquent la primitivabilité de PQ sur tout intervalle I contenu dans son
domaine et fournissent explicitement ses primitives.
La méthode que nous venons de développer s’applique bien entendu au
cas particulier des fonctions rationnelles de R dans R mais l’on sait que les
zéros sj d’un polynôme Q réel peuvent être complexes non réels ainsi que
les coefficients cj,k donnés par le corollaire ci-dessus. Si PQ est une fonction
rationnelle de R dans R, il est intéressant d’exprimer ses primitives en termes
purement réels. Pour ce faire, rappelons que si Q est réel et si sj est un zéro
non réel de Q de multiplicité mj , alors sj sera également un zéro de Q de
même multiplicité mj . En conséquence, les zéros de Q pourront être rangés
comme suit
r1 , . . . , rl , t1 , . . . , tn , t1 , . . . , tn ,
avec les multiplicités respectives
m1 , . . . , ml , m$1 , . . . , m$n, m$1 , . . . , m$n ,
%l
où les rj sont réels, les tj sont complexes non réels, l + 2n = q et j=1 mj +
%
2 nj=1 m$j = m. On a donc, par le corollaire ci-dessus
l mj n m"j
P (x) $ $ $$
= cj,k (x − rj )−k + [c$j,k (x − tj )−k + c$$j,k (x − tj )−k ],
Q(x) j=1 k=1 j=1 k=1
les constantes complexes cj,k , c$j,k et c$$j,k étant univoquement déterminées.

En égalant le complexe conjugué des deux membres de cette égalité et en
utilisant le caractère réel de x, P (x), Q(x) et rj , on obtient
mj n $D m"j
P (x) $l $ $ E
= cj,k (x − rj )−k + c$j,k (x − tj )−k + c$$j,k (x − tj )−k ,
Q(x) j=1 k=1 j=1 k=1
et dès lors l’unicité des constantes cj,k , c$j,k et c$$j,k entraı̂ne que
cj,k = cj,k , (1 ≤ k ≤ mj ; 1 ≤ j ≤ l),
c$j,k = c$$j,k , (1 ≤ k ≤ m$j ; 1 ≤ j ≤ l).

Les fonctions cj,k (x − rj )−k sont réelles et primitivables sur ] − ∞, rj [ et
]rj , +∞[, et y ont comme primitives les fonctions
x 2→ c + cj,k (1 − k)−1 (x − rj )−k+1 ,
si k /= 1, et
x 2→ c + cj,k ln |x − rj |,
si k = 1, où c est une constante réelle arbitraire. Par ailleurs, les fonctions
x 2→ c$j,k (x − tj )−k + c$$j,k (x − tj )−k = c$j,k (x − tj )−k + c$j,k (x − tj )−k
c$j,k (x − tj )k + c$j,k (x − tj )k Pk (x)

= = ,
[(x − uj )2 + vj2 ]k [(x − uj )2 + vj2 ]k
où l’on a posé tj = uj + ivj et où Pk désigne un polynôme réel de degré
inférieur ou égal à k, se ramènent, après division du polynôme Pk par le
polynôme [(x − uj )2 + vj2 ]p où p est le plus grand entier tel que 2p ≤ k, à des
fonctions hr du type
a + bx
hr (x) = ,
[(x − uj )2 + vj2 ]r
où r est un entier compris entre 1 et k, vj /= 0 et a, b ∈ R. Si b = 0, la

primitivation de hr se ramène, par changement de variable y = x − uj , à
la primitivation de fonctions du type gr (y) = (y2 +v
1
2 )r . Pour r = 1, g1 est
primitivable sur R et ses primitives sont les fonctions G1 données par

1 y
G1 (y) = arctg .
v v
Pour r > 1, comme
(y 2 + v 2 ) − y 2 y2
v 2 gr (y) = = gr−1 (y) − 2 ,
(y + v )
2 2 r (y + v 2 )r
on aura
J J J
y2
gr = v −2 gr−1 − v −2 dy.
(y 2 + v 2 )r
Mais,
2 3
y2 1 d 1
=− y ,
(y + v 2 )r
2 2r − 2 dy (y 2 + v 2 )r−1
et la formule de primitivation par parties entraı̂ne la relation
J J
y2 1 1
dy = −H + dy
(y + v )
2 2 r 2r − 2 (y 2 + v 2 )r−1
J
1
= −H + gr−1 ,
2r − 2
où H est définie par
1 y
H(y) = .
2r − 2 (y + v 2 )r−1
2
Dès lors,
J 2 J 3
−2 2r − 3
gr = v gr−1 + H ,
2r − 2
H
ce qui permet,
H
de proche en proche, de ramener le calcul de gr à celui,
connu, de g1 . Lorsque b /= 0, la primitivation de la fonction hr se ramène
à la primitivation d’une fonction de type précédent et d’une fonction fr de
la forme
x
fr (x) = .
[(x − uj )2 + vj2 ]r
Le changement de variable y = (x − uj )2 + vj2 ramène le calcul de cette

primitive à celui de la fonction y 2→ y −r , considéré plus haut.
En rassemblant ces résultats, on obtient une primitive réelle de PQ sur
tout intervalle contenu dans le domaine de la fonction.
9.4 Fonctions irrationnelles, transcendantes

Nous allons indiquer dans ce paragraphe quelques types de fonctions irra-
tionnelles ou transcendantes élémentaires dont la primitivation se ramène,
par un changement de variable adéquat à celle de fonctions rationnelles. La
liste donnée est loin d’être exhaustive et l’on pourra consulter à ce sujet les
tables de primitives.
Soit P un polynôme irréductible de R2 dans R et C la courbe algébrique
d’équation
P (x, y) = 0.
On appelle intégrale abélienne attachée à la courbe C (on devrait plutôt
dire primitive abélienne mais l’usage a consacré la terminologie précédente)
toute primitive d’une fonction (de x) du type R(x, y) où R est une fonction
rationnelle de R2 dans R et où y est remplacé par une des racines y(x) de
l’équation ci-dessus. Si l’on peut trouver deux fonctions rationnelles M et
N et un intervalle I tels que cette équation soit satisfaite si et seulement si
x = M (t), y = N (t), (t ∈ I),
on dit que la courbe C est unicursale et l’intégrale abélienne attachée à C

se ramène à la primitive de la fonction rationnelle t 2→ R[M (t), N (t)]M $(t).
L’obtention des fonctions M et N (c’est-à-dire l’uniformisation de C par des
fonctions rationnelles) est un problème difficile. Nous nous contenterons de
donner quelques exemples simples.
8 G 9
a. f (x) = R x, m ax+b
cx+d où R est une fonction rationnelle de R dans
2
K, m ∈ N∗ , a, b, c, , d ∈ R.
Si m est pair, on doit bien entendu se limiter aux valeurs de x pour
lesquelles ax+b
cx+d ≥ 0. Il s’agit d’une intégrale abélienne avec
P (x, y) ≡ (cx + b)y m − (ax + b).
Introduisons le changement de variable x = h(t) défini par la relation

K
−1 ax + b
t=h (x) =
m
,
cx + d
ce qui donne
b − dtm $ mtm−1 (ad − bc)

x = h(t) = − , h (t) = ,
a − ctm (ctm − a)2
9.4. FONCTIONS IRRATIONNELLES, TRANSCENDANTES 337
K
ah(t) + b
y= m
= t.
ch(t) + d
En conséquence, (f ◦ h)h$ est une fonction rationnelle de R dans K, donc
primitivable; dès lors, par le théorème de changement de variable, f sera
primitivable sur tout intervalle I = h(J) tel que h soit injective sur J et l’on
pourra calculer les primitives par les méthodes de la section précédente.
8 √ 9
b. f (x) = R x, ax2 + bx + c où R est une fonction rationnelle de
R2 dans K, a, b, c ∈ R, a /= 0.
Il s’agit d’une intégrale abélienne avec
P (x, y) ≡ y 2 − ax2 − bx − c.
On se limitera aux valeurs de x pour lesquelles ax2 + bx + c ≥ 0 et l’on peut

exclure le cas où la fonction x 2→ ax2 + bx + c a un zéro double puisqu’alors
f est une fonction rationnelle.
1. Si a > 0 et b2 − 4ac /= 0, on introduit le changement de variable x = h(t)
par la relation √ L
t = h−1 (x) = ax + ax2 + bx + c,
ce qui donne
√ √
t2 − c $ 2( at2 + bt + ac)
x = h(t) = √ , h (t) = √ ,
2 at + b (2 at + b)2
G √ √
y= a[h(t)]2 + bh(t) + c = t − (2 at + b)−1 a(t2 − c).
En conséquence, (f ◦ h)h$ est une application rationnelle de R dans K et elle
est donc primitivable sur R. Par le théorème de changement de variable,
f sera primitivable sur tout intervalle I = h(J) tel que h soit injective sur
J, et les primitives F de f seront obtenues
√ en composant les primitives de
√
(f ◦ h)h$ avec la fonction x 2→ ax + ax2 + bx + c.
2. Si a < 0, il faut que b2 − 4ac > 0 et que x ∈ ]p, q[ où p < q sont les zéros
distincts du polynôme ax2 + bx + c. On a, pour tout x ∈ ]p, q[,
K
L G a(x − q)
ax2 + bx + c = a(x − p)(x − q) = (x − p) .
x−p
Le changement de variables x = h(t) défini par la relation
K
a(x − q)
t = h−1 (x) = ,
x−p
et qui donne
pt2 − aq $ 2at(q − p)
x = h(t) = , h (t) = 2 ,
2
t −a (t − a)2
G
a(p − q)t
y= a[h(t)]2 + bh(t) + c = ,
t2 − a
est tel que (f ◦h)h$ est une fonction rationnelle de R dans K. Par le théorème
du changement de variable, f sera primitivable sur tout intervalle I = h(J)
tel que h soit injective sur J et les primitives F de f seront G obtenues en
composant les primitives de (f ◦ h)h avec la fonction x 2→ a(x−q)
$
x−p . 8 L 9
Remarque. Les primitives des fonctions de type f (x) = R x, P (x)
lorsque P est un polynôme de degré p ≥ 3 et R une fonction rationnelle
ne peuvent pas en général s’exprimer au moyen des fonctions élémentaires
et conduisent à des fonctions transcendantes nouvelles appelées intégrales
elliptiques si p = 3, 4 et intégrales hyperelliptiques lorsque p ≥ 5. L’étude
de ces intégrales et des fonctions réciproques correspondantes (en particulier
des fonctions elliptiques) doit se faire dans le cadre de la théorie des fonctions
complexes d’une variable complexe.
c. f (x) = R(cos x, sin x, cos 2x, sin 2x, . . ., cos mx, sin mx), m ∈ N∗ , où R
est une fonction rationnelle de R2m dans K.
En utilisant les formules trigonométriques classiques exprimant cos kx et
sin kx comme polynôme en cos x et sin x, on peut exprimer f sous la forme
f (x) = S(cos x, sin x),
où S est une fonction rationnelle de R2 dans K. En utilisant les relations

trigonométriques connues
1 − tg 2 (x/2) 2tg (x/2)
cos x = , sin x = ,
1 + tg 2 (x/2) 1 + tg 2 (x/2)
on obtient
S(cos x, sin x) = T [tg (x/2)],
où T est une fonction rationnelle de R dans K. Le changement de variable
x = h(t) défini par la relation
t = h−1 (x) = tg (x/2),
et donc tel que

2
x = h(t) = 2arctg t, h$ (t) = ,
1 + t2
9.5. CALCUL APPROCHÉ DES PRIMITIVES 339
montre que (f ◦ h)h$ = T h$ est une fonction rationnelle de R dans K. Le

théorème de changement de variable assure donc la primitivabilité de f sur
tout intervalle I = h(J) tel que h est injective sur J et les primitives de
f s’obtiennent en composant les primitives de la fonction t 2→ 2T (t)
1+t2
avec la
fonction t = tg (x/2).
Les quelques exemples que nous venons de donner montrent que, pour
une fonction primitivable sur un intervalle I, le calcul effectif peut être
extrêmement compliqué et aucune méthode générale n’existe. Il faudrait
d’ailleurs d’abord s’entendre sur ce que l’on appelle “calcul effectif”. Au
XIXe siècle, Joseph Liouville donna à cette question la forme classique
suivante : étant donné un ensemble de fonctions réelles d’une variable réelle
appelées fonctions élémentaires, et formé des fonctions qui peuvent s’écrire
en itérant, à partir de la variable x et de constantes, les quatre opérations
d’addition, soustraction, multiplication, division ainsi que la prise de loga-
rithmes, d’exponentielles ou l’extraction de racines de polynômes, calculer
sa primitive ou démontrer qu’elle n’est pas une fonction élémentaire. Liou-
ville donna, entre 1833 et 1841, plusieurs contributions fondamentales à ce
problème qui est encore ouvert. Il a fallu attendre les travaux de Maxwell
Rosenlicht en 1968 pour obtenir une formulation algébrique précise du
problème et des généralisations des résultats de Liouville. Robert Risch en
1969 a prouvé l’existence d’un algorithme répondant à la question ci-dessus
pour le sous-ensemble des fonctions élémentaires dites “purement transcen-
dantes” et J.H. Davenport en 1979 a fait de même pour la sous-classe des
fonctions élémentaires algébriques. En outre, pour des sous-ensembles im-
portants de fonctions, ces algorithmes ont été respectivement programmés
dans le cadre des méthodes de calcul symbolique sur ordinateur MACSYMA
et REDUCE, mais le problème général correspondant reste ouvert.
9.5 Calcul approché des primitives

L’impossibilité de la détermination explicite des primitives d’une fonction
primitivable nous suggère de retourner à l’idée fondamentale de “résolution
approchée indéfiniment précise d’un problème dont la solution exacte est
impossible” qui sous-tend de nombreux concepts fondamentaux de l’analyse
mathématique. Nous allons démontrer qu’étant donné une fonction f pri-
mitivable sur un intervalle I, un point a de I, un point x > a de I et un
nombre ! > 0, il est possible d’obtenir (au moins théoriquement) une valeur
approchée de Fa (x) avec une erreur inférieure ou égale à !. C’est l’importante
propriété d’approximation des primitives.

Proposition. Soit f une fonction de R dans Rp primitivable sur l’intervalle
I, a ∈ I et Fa la primitive de f qui s’annule en a. Pour chaque x ∈ I tel que
x > a et chaque ! > 0, ilA
existe une jauge
B
δ sur [a, x] telle que, pour toute
P-partition δ-fine Π = (xj , ]aj−1 , aj ]) 1≤j≤m avec a = a0 < a1 < . . . <
am−1 < am = x, on a
# #
# m #
# $ #
#Fa (x) − f (x )(a − a )# ≤ !.
j j j−1 #
#
# j=1 #
2
Démonstration. Soit ! > 0; pour chaque y ∈ I, Fa$ (y) = f (y) et il existe

donc un δ(y) > 0 tel que, pour chaque u ∈ I ∩ [y − δ(y), y + δ(y)], on a
!
|Fa (u) − Fa (y) − f (y)(u − y)|2 ≤ |u − y|;
x−a
dès lors, si u et v appartiennent à I et sont tels que
y − δ(y) ≤ u ≤ y ≤ v ≤ y + δ(y),
on aura
|Fa (v) − Fa (u) − f (y)(v − u)|2
= |Fa (v) − Fa (y) − f (y)(v − y) − [Fa (u) − Fa (y) − f (y)(u − y)]|2
≤ |Fa (v) − Fa (y) − f (y)(v − y)|2 + |Fa (u) − Fa (y) − f (y)(u − y)|2
! ! !
≤ (|v − y| + |u − y|) = (v − y + y − u) = (v − u).
x−a x−a x−a
Soit δ : y 2→ δ(y)
A j B
la jauge ainsi définie sur I, et donc sur [a, x]. Si Π =
(x , ]aj−1 , aj ]) 1≤j≤m avec a = a0 < a1 < . . . < am−1 < am = x, est une
P-partition δ-fine de ]a, x], alors on a
xj − δ(xj ) ≤ aj−1 ≤ xj ≤ aj ≤ xj + δ(xj ), (1 ≤ j ≤ m),
et dès lors, en utilisant l’inégalité ci-dessus,

# # !
# #
#Fa (aj ) − F (aj−1 ) − f (xj )(aj − aj−1 )# ≤ (aj − aj−1 ), (1 ≤ j ≤ m).
2 x−a
Comme on a évidemment
m D
$ E
Fa (x) = F (aj ) − F (aj−1 ) ,
j=1
9.5. CALCUL APPROCHÉ DES PRIMITIVES 341
on en déduit # #
# m #
# $ #
#Fa (x) − f (x )(a − a )#
j j j−1 #
#
# j=1 #
2
# #
#m D E##
#$
= ## Fa (a ) − Fa (a ) − f (x )(a − a ) ##
j j−1 j j j−1
#j=1 #
2
m #
$ # m
$
# # !
≤ #Fa (aj ) − Fa (aj−1 ) − f (xj )(aj − aj−1 )# ≤ (aj − aj−1 ) = !.
j=1
2
j=1
x − a
Lorsque f est à valeurs positives sur [a, x], les expressions

m
$
f (xj )(aj − aj−1 )
j=1
associées à la P-partition Π par le résultat précédent représentent la somme

des aires de rectangles de base [aj−1 , aj ] et de hauteur f (xj ) et peuvent donc
être considérées comme une approximation de l’aire de la figure plane E(f )
définie par
E(f ) = {(x1 , x2 ) ∈ R2 : 0 ≤ x2 ≤ f (x1 ), x1 ∈ [a, x]},
c’est-à-dire du polygone curviligne délimité par l’intervalle [a, x] de l’axe des

x1 , par les parallèles à l’axe des x2 menées par les points (a, 0) et (x, 0) et par
le graphe de f . Cette approximation consiste à remplacer l’aire de chaque
figure curviligne constituante
Ej (f ) = {(x1 , x2 ) ∈ R2 : 0 ≤ x2 ≤ f (x1 ), x1 ∈ [aj−1 , aj ]}
(1 ≤ j ≤ m) par celle du rectangle de même base et de hauteur f (xj ). Par

conséquent, la quantité Fa (x) approchée indéfiniment par ces expressions
sera un candidat naturel pour la valeur de l’aire de la figure curviligne E(f ).
On obtient ainsi un lien étonnant entre le concept de primitive, directement
issu du concept de dérivée, c’est-à-dire, géométriquement, et la notion de
tangente au graphe de f , de celui d’aire de la figure plane curviligne E(f )
associée à f . C’est la découverte de ce lien par Isaac Newton et par Got-
tfried Leibniz, il y a plus de trois cents ans, qui a donné naissance au calcul
différentiel et intégral.
9.6 Exercices
1. Montrer que si f et g sont deux fonctions réelles primitivables sur
l’intervalle I et telles que, pour tout x ∈ I, on Hait f (x)H ≤ g(x), alors, pour
tout a ∈ I et tout x ≥ a appartenant à I, on a ax f ≤ ax g.
2. Soient I ⊂ R un intervalle, a ∈ I, f une fonction réelle d’une variable
réelle, g une fonction positive d’une variable réelle et C ≥ 0. Si f g et g sont
primitivables sur I et si, pour tout x ≥ a appartenant à I, on a
J x
f (x) ≤ C + f g,
a
alors, pour les mêmes valeurs de x, on a

4J x 5
f (x) ≤ C exp g .
a
(Lemme de Gronwall). Ce lemme, qui transforme une inéquation sur f

en une inégalité sur f, joue un rôle important dans l’étude des équations
différentielles.
Suggestion. Utiliser l’hypothèse pour montrer que
2 4 J x 5J x 3 4 J x 5
D exp − g f g ≤ Cg(x) exp − g .
a a a
En déduire par l’exercice 1 que

4 J x 5J x J x 4 J · 5
exp − g fg ≤ C g exp − g .
a a a a
Noter que
J x 4 J · 5 J x 2 4 4 J · 553 2 4 J x 53
g exp − g = −D exp − g = C 1 − exp − g .
a a a a a
En déduire J 2 4J 5 3
x x
f g ≤ C exp g −1 ,
a a
et introduire cette dernière inégalité dans l’hypothèse.

3. Montrer que si a ∈ R∗ , alors, sur tout intervalle de R ne contenant pas
±a, on a J # #
dx 1 #x − a#
= log # #
#x + a# .
x2 − a2 2a
4. Utiliser la formule de primitivation par parties pour montrer que, si n ≥ 2

est un entier, alors
J J
cos x sinn−1 x n − 1
sinn x dx = − − sinn−2 x dx,
n n
J J
sin x cosn−1 x n − 1
cos x dx =
n
+ cosn−2 x dx.
n n
5. Utiliser les identités trigonométriques (qui se déduisent facilement de la
formule de Moivre)
1
cos mx cos nx = [cos(m + n)x + cos(m − n)x],
2
1
sin mx sin nx = [cos(m − n)x − cos(m + n)x],
2
1
sin mx cos nx = [sin(m + n)x + sin(m − n)x],
2
où m et n sont des entiers positifs, pour calculer les primitives des premiers
membres.

Dans des lettres échangées il y a une dizaine d’années avec le très habile
géomètre G.W. Leibniz, je lui ai fait savoir que j’étais en possession d’une
méthode pour déterminer les maxima et les minima, mener les tangentes et
traiter les autres questions semblables, méthode qui servait aussi bien dans
le cas des racines que dans celui des expressions rationnelles; je lui cachais
cette méthode dans la phrase suivante écrite en lettres transposées : Etant
donnée une équation contenant un nombre quelconque de quantités variables
ou fluentes, trouver leurs fluxions et inversement. Cet homme illustre me
répondit qu’il était aussi tombé sur une méthode analogue et il me commu-
niqua cette méthode qui s’écarte à peine de la mienne, sauf dans les termes
et les notations.
Isaac Newton, 1687
Considérant que les grandeurs qui croissent dans des temps égaux sont
plus grandes ou moindres suivant qu’elles croissent avec une vitesse plus
grande ou plus petite, je cherchai une méthode pour déterminer les grandeurs
d’après les vitesses des mouvements ou accroissements qui les engendrent; en

nommant fluxions les vitesses de ces mouvements ou accroissement, tandis
que les grandeurs engendrées prendraient le nom de fluentes, je suis tombé,
vers les années 1665 et 1666, sur la méthode des fluxions, dont je ferai
usage dans la quadrature des courbes. Les fluxions sont, d’aussi près que
possible, proportionnelles aux accroissements des fluentes, engendrés dans
des intervalles de temps égaux et aussi petits que possible; elles sont dans
la raison première des accroissements naissants et peuvent être représentées
par des lignes qui leur soient proportionnelles.
Isaac Newton, 1704
Mais d’après ce que j’ai montré dans ma méthode

H
des tangentes, on voit
que d( 12 xx) = x dx, et donc inversement 12 xx = x dx (car à l’exemple des
puissances et des racines dansH
le calcul ordinaire, dans mon calcul, sommes
et différences, c’est-à-dire et d, sont réciproques).
Gottfried W. Leibniz, 1686
Les intégrales des différentielles sont ces quantités dont ces différentielles
proviennent par différentiation.
Jean Bernoulli, 1691
Le calcul intégral est la méthode par laquelle, à partir d’une relation entre
les différentielles, on retrouve la relation entre les quantités elles-mêmes.
Leonard Euler, 1768

Chapitre 10
Fonctions intégrables
10.1 Intégrabilité sur un pavé

On a vu au chapitre précédent que si f est une fonction de R dans Rp
primitivable sur un intervalle I et si a < b appartiennent à I, les expressions
m
$
f (xj )(aj − aj−1 )
j=1
A B
associées à la P-partition Π = (xj , ]aj−1 , aj ]) 1≤j≤m de ]a, b] deviennent
arbitrairement proche d’un élément de Rp (à savoir F (b)−F (a) où F désigne
une primitive de f sur I), lorsque Π est “suffisamment fine”. Nous avons
également vu l’interprétation de ce résultat en termes d’aire de la figure
plane E(f ) définie par
E(f ) = {(x1 , x2 ) ∈ R2 : 0 ≤ x2 ≤ f (x1 ), x1 ∈ [a, b]},
lorsque f est une fonction positive. Par ailleurs, cette propriété de “conver-
gence” des expressions
m
$
f (xj )(aj − aj−1 )
j=1
est également vérifiée pour des fonctions qui ne sont pas primitivables sur I.
Ainsi, on sait que la fonction f définie sur R par
f (x) = 1 si x < 0, f (x) = 2 si x ≥ 0,
n’est primitivable sur aucun

A
intervalle Bcontenant l’origine. Pourtant, si ! > 0
est donné et si Π = (xj , ]aj−1 , aj ]) 1≤j≤m est une P-partition δ-fine de
345
346 CHAPITRE 10. FONCTIONS INTÉGRABLES
] − 1, 1] pour la jauge constante δ, on aura, si k est le plus grand entier entre

1 et m tel que ak < 0,
m
$
f (xj )(aj − aj−1 )
j=1
k
$ m
$
= (aj − aj−1 ) + f (xk+1 )(ak+1 − ak ) + 2 (aj − aj−1 )
j=1 j=k+2
= ak + 1 + f (xk+1 )(ak+1 − ak ) + 2(1 − ak+1 ).

Dès lors,
m
$
3 − ak+1 = ak + 1 + (ak+1 − ak ) ≤ f (xj )(aj − aj−1 )
j=1
≤ ak + 1 + 2(ak+1 − ak ) = 3 − ak ,
# #
#m #
#$ #
# f (x j
)(aj
− aj−1
) − 3 # ≤ max{−ak , ak+1 } ≤ 2δ ≤ !,
# #
#j=1 #
si l’on choisit δ = !/2. On notera que 3 mesure l’aire de la figure plane

(formée de deux rectangles) comprise entre le graphe de f , l’axe des x et les
parallèles à l’axe des y menées par les points (−1, 0) et (1, 0).
Dans le cas d’une fonction de R2 dans R positive sur l’adhérence I¯ d’un
semi-pavé de R2 (pour laquelle aucune notion de primitive n’a été définie !),
on peut encore considérer le problème de la définition et de la détermination
du volume du solide correspondant
¯
G(f ) = {(x1 , x2 , x3 ) ∈ R3 : 0 ≤ x3 ≤ f (x1 , x2 ), (x1 , x2 ) ∈ I}.
Le volume sera cette fois approché par des sommes de volumes de pa-
rallélépipèdes rectangles de base I j et de hauteur f (xj ), où {I 1 , . . . , I m}
est une partition de I en semi-pavés I j = ]aj1 , bj1]× ]aj2 , bj2] et où xj ∈ I¯j ,
(1 ≤ j ≤ m), c’est-à-dire par des expressions du type
m
$
f (xj )(bj1 − aj1 )(bj2 − aj2 ).
j=1
10.1. INTÉGRABILITÉ SUR UN PAVÉ 347
Plus généralement encore, on pourra chercher à définir et à déterminer

l’hypervolume d’un ensemble de Rn+1 du type
¯
H(f ) = {x ∈ Rn+1 : 0 ≤ xn+1 ≤ f (x1 , . . . , xn ), (x1 , . . . , xn ) ∈ I},
¯
lorsque I est un semi-pavé de Rn et f une fonction définie et positive sur I.
Les expressions approchées seront de la forme
m
$ n
6
f (xj ) (bji − aji ),
j=1 i=1
où {I 1 , . . . , I m} est une partition de I en semi-pavés
I j = ]aj1 , bj1] × . . . × ]ajn , bjn],
et xj = (xj1 , . . . , xjn ) ∈ I¯j , (1 ≤ j ≤ m).

Ces exemples suggèrent qu’il peut être intéressant d’étudier en toute
généralité la classe des fonctions de Rn dans Rp pour lesquelles les sommes
%m j =n j j
j=1 f (x ) i=1 (bi − ai ) associées aux P-partitions d’un semi-pavé I ⊂ R
n
convergent, au sens de la propriété d’approximation des primitives, vers un

élément de Rp.
Soit I = I1 × . . . × In , avec Ik = ]ak , bk ], (1 ≤ k ≤ n) un semi-pavé et
I = I1 × . . . × In le pavé correspondant.
Définition. On appelle mesure de I (longueur si n = 1, aire si n = 2,
volume si n = 3), et l’on note µ(I), le réel strictement positif défini par
n
6
µ(I) = (b1 − a1 )(b2 − a2 ) . . . (bn − an ) = (bi − ai ).
i=1
Une conséquence immédiate de cette définition est que, si K et I sont

des semi-pavés de Rn tels que K ⊂ I, alors
µ(K) ≤ µ(I),
l’égalité ayant lieu si et seulement si K = I.

On vérifie sans peine que si I et K sont deux semi-pavés de Rn , alors
I ∩ K est vide ou est un semi-pavé. Dans ce dernier cas, on pourra donc
parler de la mesure µ(I ∩ K) du semi-pavé I ∩ K. On notera que, par contre,
I ∪ K n’est pas en général un semi-pavé. Toutefois, si I 1 , . . . , I l sont des
semi-pavés mutuellement disjoints de Rn , on pourra définir, conformément

!
à l’idée intuitive de mesure, la mesure de lj=1 I j par
 
l
> l
$
µ I j = µ(I j ).
j=1 j=1
Soit enfin I0 ! I deux semi-pavés. Si

I 0 = I10 × . . . In0 , I = I1 × . . . × In ,
avec
Ii0 = ]ci , di], Ii = ]ai, bi], ai ≤ ci ≤ di ≤ bi , (1 ≤ i ≤ n),
l’une des inégalités entre ai et ci ou di et bi au moins étant stricte, et si l’on
pose, pour chaque 1 ≤ i ≤ n,
Ii1 = ]ai, ci] ou ∅ selon que ai < ci ou ai = ci ,
Ii2 = ]di , ci] ou ∅ selon que di < bi ou di = bi,
alors on a
Ii = Ii0 ∪ Ii1 ∪ Ii2 , (1 ≤ i ≤ n).
En conséquence, la famille finie
{I i1 ,i2 ,...,in = I1i1 × I2i2 × . . . × Inin : I i1 ,i2 ,...,in /= ∅, 0 ≤ i1 ≤ 2, . . . , 0 ≤ in ≤ 2},
constitue une partition de I en semi-pavés et I 0 = I 0,0,...,0. Il en résulte que
>
I \ I0 = I i1 ,...,in ,
{0≤i1 ,...,in ≤2 : i1 +...+in >0}
et l’on posera
$
µ(I \ I 0 ) = µ(I i1 ,...,in )
{0≤i1 ,...,in ≤2 : i1 +...+in >0, I i1 ,...,in (=∅}
= µ(I) − µ(I 0 ).
On montre de même que si I 1 , . . . , I l sont des semi-pavés disjoints contenus
dans I, alors I \ (I 1 ∪ . . . ∪ I l ) est une union de semi-pavés mutuellement
disjoints et l’on posera
l
$
µ[I \ (I 1 ∪ . . . ∪ I l )] = µ(I) − µ(I j ).
j=1
Etendons maintenant aux fonctions de dans Rp les expressions qui

Rn
interviennent à la fois dans l’approximation de la valeur d’une primitive et
l’approximation de l’aire d’une figure plane ou du volume d’un solide.
Définition. Soit I un semi-pavé de Rn , f une fonction de Rn dans Rp définie

A j j B
sur I¯ et Π = (x , I ) 1≤j≤m une P-partition de I. On appelle somme de
Riemann associée à I, f et Π l’élément S(I, f, Π) de Rp défini par
m
$
S(I, f, Π) = µ(I j )f (xj ).
j=1
On vérifiera sans peine que si f et g sont deux fonctions de Rn dans Rp

¯ si c ∈ R et si Π est une P-partition de I, alors on a
définies sur I,
S(I, f + g, Π) = S(I, f, Π) + S(I, g, Π), S(I, cf, Π) = cS(I, f, Π),
(S(I, f, Π))k = S(I, fk , Π), (1 ≤ k ≤ p),
|S(I, f, Π)|j ≤ S(I, |f |j , Π), (j = 1, 2, ∞),
tandis que si p = 1 et f (x) ≥ g(x) pour tout x ∈ I, ¯ on a
S(I, f, Π) ≥ S(I, g, Π).

Nous pouvons maintenant introduire l’importante classe de fonctions qui
vérifient la propriété introduite au début de la section.
Définition. Soit I un semi-pavé de Rn et f une fonction de Rn dans Rp
¯ On dit que f est intégrable au sens de Denjoy-Perron sur
définie sur I.
¯ ou DP-intégrable sur I¯ ou plus simplement intégrable sur I¯ s’il existe un
I,
J ∈ Rp ayant la propriété suivante: pour chaque ! > 0, il existe une jauge δ
sur I¯ telle que, pour toute P-partition δ-fine Π de I, on ait
|S(I, f, Π) − J|2 ≤ !.
Cette définition a un sens puisque, par le théorème de Cousin, l’existence
d’une P-partition δ-fine est garantie pour toute jauge δ sur I. ¯ On notera aussi
que sa structure est semblable à celle de la définition de limite des valeurs
d’une fonction, et que la définition ne dépend pas du choix de la norme
| · |2 pour l’estimation de S(I, f, Π) − J. Enfin la terminologie “intégrable au
sens de Denjoy-Perron” vient de ce que, pour n = 1, cette classe de fonctions
fut introduite pour la première fois indépendamment par Arnaud Denjoy
en 1912 et par Oskar Perron en 1914. Leurs définitions sont différentes
et distinctes de celle donnée ici, découverte indépendamment, en 1957 par
Jaroslav Kurzweil et en 1960 par Ralph Henstock.
On désignera par P (I,¯ Rp) l’ensemble des fonctions de Rn dans Rp inté-
¯
grables sur l’adhérence I d’un semi-pavé I de Rn .
Montrons qu’il ne peut exister plus d’un J vérifiant les conditions de la
définition.
Proposition. Il existe au plus un J ∈ Rp vérifiant les conditions de la

¯
définition d’intégrabilité sur I.
Démonstration. Soit J donné par la définition et soit J $ ∈ Rp tel que,
pour chaque ! > 0, il existe une jauge δ $ sur I¯ telle que, pour chaque P-
partition δ $ -fine Π$ de I, on ait
|S(I, f, Π$) − J $ |2 ≤ !.
On va prouver que J = J $ en montrant que |J − J $ |2 ≤ ! pour chaque ! > 0.

Soient en effet δ et δ $ les jauges associées à !/2 par les définitions de J et J $ ;
alors l’application δ $$ définie sur I¯ par
δ $$ (x) = min[δ(x), δ $(x)]
est une jauge sur I¯ et si Π$$ est une P-partition δ $$ -fine de I, elle sera à la
fois δ-fine et δ $ -fine. En conséquence, on aura
|J − J $ |2 ≤ |J − S(I, f, Π$$)|2 + |S(I, f, Π$$) − J $ |2 ≤ !,

La définition suivante est donc justifiée.
Définition. Si f est une fonction de Rn dans Rp intégrable sur I, ¯ l’unique
élément J vérifiant la définition ci-dessus est appelé l’intégrale de f sur I¯ et
noté J J J J
f, f (x) µ(dx), f (x) dx ou f dµ,
I¯ I¯ I¯ I¯
pour rappeler son mode de construction par les sommes de Riemann.
Une telle intégrale est dite simple si n = 1 et multiple si n ≥ 2 (double
pour n = 2 et triple pour n = 3). Dans le cas de l’intégrale simple de f sur
[a, b], on utilise aussi les notations
J b J b
f ou f (x) dx.
a a
Enfin, il est commode de poser également

J a J b J a
f =− f et f = 0.
b a a
La propriété d’approximation de la primitive s’annulant en un point

d’une fonction primitivable fournit directement une classe importante de
fonctions intégrables sur un intervalle fermé et borné de R.
Théorème. Si f est une fonction de R dans Rp primitivable sur un intervalle

fermé et borné [a, b], alors f est intégrable sur [a, x] pour chaque a < x ≤ b
et, F désignant une primitive quelconque de f sur [a, b], on a, pour chaque
x ∈ ]a, b], J x
f = F (x) − F (a),
a
et en particulier
J b
f = F (b) − F (a).
a
Démonstration. Il suffit de noter que si f est primitivable sur [a, b], elle
l’est aussi sur [a, x] quel que soit a < x < b et la propriété d’approximation
de la primitive Fa de f s’annulant en a équivaut à l’intégrabilité de f sur
[a, x]. On sait enfin que si F est une primitive quelconque de f sur [a, b], on
a Fa = F (·) − F (a).
Le théorème que nous venons de démontrer s’appelle le théorème fon-
damental du calcul différentiel et intégral. Il fournit un moyen éton-
namment simple pour calculer l’intégrale sur intervalle fermé [a, b] (donc en
particulier de l’aire de E(f )) de toute fonction f dont une primitive est
connue: il suffit de faire la différence entre la valeur d’une primitive entre
l’extrémité et l’origine de l’intervalle considéré. Le théorème fondamental
du calcul différentiel et intégral montre que
N ([a, b], Rp) ⊂ P ([a, b], Rp).
On peut encore l’énoncer sous la forme équivalente suivante, qui fait inter-
venir f $ et f au lieu de f et F .
Corollaire. Si f est une fonction de R dans Rp dérivable sur [a, b], alors f $
est intégrable sur [a, b] et
J b
f $ = f (b) − f (a).
a
¯
Il existe une condition nécessaire de Cauchy d’intégrabilité sur I.
Proposition. Si f est une fonction de Rn dans Rp intégrable sur l’adhéren-
ce I¯ d’un semi-pavé I de Rn , alors, pour chaque ! > 0, il existe une jauge δ
sur I¯ telle que, pour chaque P-partition δ-fine Π et chaque P-partition δ-fine
Π̃ de I, on a
|S(I, f, Π) − S(I, f, Π̃)|2 ≤ !.
Démonstration. Soit ! > 0 et δ une jauge sur I¯ associée par la définition

d’intégrabilité
H
à !/2. Alors, si Π et Π̃ sont des P-partitions δ-fines, on a,
avec J = I¯ f,
|S(I, f, Π) − S(I, f, Π̃)|2 ≤ |S(I, f, Π) − J|2 + |J − S(I, f, Π̃)|2 ≤ !.
Le cas particulier consistant à imposer pour chaque ! > 0, dans la

définition d’intégrabilité, l’existence d’une jauge constante est historique-
ment et numériquement important, même si son rôle dans l’analyse moderne
s’est singulièrement réduit.
¯ On dit que f est intégrable au sens de Riemann sur I,
définie sur I. ¯ ou
R-intégrable sur I ou plus explicitement uniformément intégrable sur I¯ s’il
¯
existe un J ∈ Rp ayant la propriété suivante: pour chaque ! > 0, on peut
trouver une jauge constante δ sur I¯ telle que, pour toute P-partition δ-fine
Π de I, on ait
|S(I, f, Π) − J|2 ≤ !.
La caractérisation suivante des fonctions R-intégrables, dont on établira
sans peine l’équivalence avec la définition donnée ici, est souvent prise comme
définition des fonctions R-intégrables dans la littérature mathématique.
Proposition. Soit I un semi-pavé de Rn et f une fonction de Rn dans Rp
¯ Alors f est R-intégrable sur I¯ si et seulement s’il existe un
définie sur I.
J ∈ R ayant la propriété suivante: pour chaque ! > 0, il existe une constante
p
η > 0 telle que, pour chaque partition {I 1 , . . . , I m} de I en semi-pavés tels

que
max (bji − aji ) ≤ η,
1≤j≤m; 1≤i≤n
et toute famille {x , . . . , xm} de points tels que xj ∈ I¯j , (1 ≤ j ≤ m), on a

1
|S(I, f, Π) − J|2 ≤ !.
Le résultat suivant est une conséquence facile de la définition et de
l’unicité de l’intégrale.
Proposition. Toute fonction f R-intégrable sur I¯ est intégrable
H
sur I¯ et le
J donné dans la définition de R-intégrabilité est égal à I¯ f.
Exemple. Si I est un semi-pavé de Rn , toute application constante c de Rn
dans Rp est R-intégrable sur I¯ et
J
c = µ(I)c.
I¯
En effet, pour toute P-partition Π = {(x1 , I 1 ), . . ., (xm, I m)} de I, on a

m
$
S(I, f, Π) = µ(I j )c = µ(I)c,
j=1
et ! > 0 étant donné, n’importe quelle jauge constante convient dans la

définition de R-intégrabilité.
En procédant comme pour l’intégrabilité, on obtient évidemment une
condition nécessaire de Cauchy de R-intégrabilité.
Proposition. Si f est une fonction de Rn dans Rp R-intégrable sur l’adhé-
rence I¯ d’un semi-pavé I de Rn , alors, pour chaque ! > 0, il existe une
jauge constante δ sur I¯ telle que, pour chaque P-partition δ-fine Π et chaque
P-partition δ-fine Π̃ de I, on a
|S(I, f, Π) − S(I, f, Π̃)|2 ≤ !.
Montrons que les fonctions R-intégrables sur I¯ y sont nécessairement

bornées.
Proposition. Toute fonction f de Rn dans Rp R-intégrable sur l’adhérence
I¯ d’un semi-pavé I de Rn est bornée sur I.
¯
H
Démonstration. Soit J = I¯ f et ! = 1. Il existe donc une jauge constante
δ sur I¯ telle que # #
#m #
#$ #
#
# µ(I )f (x )# ≤ |J|2 + 1,
j j #
#j=1 #
2
pour toute P-partition δ-fine Π = {(x1 , I 1 ), . . ., (xm, I m)} de I. Soit {K 1 , . . . , K m}

une partition de I en semi-pavés
K j = ]cj1 , dj1 ] × . . . × ]cjn , djn]
tels que
dji − cji ≤ δ, (1 ≤ i ≤ n, 1 ≤ j ≤ m).
A B
Alors, pour chaque xj ∈ K j , (1 ≤ k ≤ m), Π̃ = (xj , K j ) 1≤j≤m est une P-
partition δ-fine de I. Supposons que f ne soit pas bornée sur I. ¯ Il existera au
moins un K tel que f ne soit pas bornée sur K̄ , et donc tel que pour chaque
l l
r > 0, il existe un y r ∈ K̄ l tel que |f (y r )|2 > r. En prenant successivement

r = k, (k ∈ N∗ ), on obtient une suite (y k )k∈N∗ dans K̄ l telle que
|f (y k )|2 > k, (k ∈ N∗ ).
Si dès lors nous fixons xj ∈ K̄ j pour chaque 1 ≤ j ≤ m tel que j /= l, et que

nous prenons les P-partitions δ-fines
{(x1 , K 1 ), . . ., (xl−1, K l−1), (y k , K l ), (xl+1 , K l+1 ) . . . , (xm, K m)}, k ∈ N∗ ,
nous obtenons les inégalités

# #
# #
# $ #
#µ(K )f (y ) +
l k
µ(K j
)f (x j
) # ≤ |J|2 + 1, (k ∈ N∗ ),
# #
# {1≤j≤m : j(=l} #
2
et dès lors
# #
# #
# $ #
kµ(K l ) < µ(K l )|f (y k )|2 ≤ |J|2 + 1 + ## µ(K j )f (xj )## , (k ∈ N∗ ),
#{1≤j≤m : j(=l} #
2
ce qui est contradictoire dès que

 # # 
# $ #
−1 
# #
k ≥ [µ(K )]
l
|J|2 + 1 + #
# µ(K )f (x )##  .
j j
#{1≤j≤m : j(=l} #
2
La fonction
1 2 1
f : x 2→ 2x sin 2
− cos 2 , x /= 0, f (0) = 0,
x x x
donnée au Chapitre 9, qui est primitivable sur tout intervalle contenant
l’origine sans y être bornée, est donc un exemple de fonction qui n’est pas
R-intégrable sur un tel intervalle, alors qu’elle y est intégrable en vertu du
théorème fondamental du calcul différentiel et intégral.
L’exemple suivant montre qu’il existe même des fonctions bornées et
intégrables sur un intervalle fermé et qui n’y sont pas R-intégrables.
Exemple. La fonction de Dirichlet d, définie au chapitre 2 par d(x) = 1 si x
est rationnel et d(x) = 0 si x est irrationnel, est bornée sur R et donc sur tout
intervalle fermé. Montrons que d n’est pas R-intégrable sur [0, 1]. Il suffit
de montrer qu’elle ne vérifie pas la condition de Cauchy de R-intégrabilité.
Soit δ > 0 et {I 1 , . . ., I m} une partition de ]0, 1] en semi-intervalles telle
que µ(I j ) ≤ δ, (1 ≤ j ≤ m). On sait que chaque I j contient au moins un
rationnel xj et au moins un irrationnel x̃j . Dès lors, les P-partitions de ]0, 1]
A j j B
Π = {(x , I ), . . . , (x , I )}, Π̃ = (x̃ , I ) 1≤j≤m sont δ-fines et, puisque
1 1 m m
d(xj ) = 1, d(x̃j ) = 0, (1 ≤ j ≤ m),

ces P-partitions sont telles que

$
|S(]0, 1], d, Π) − S(]0, 1], d, Π̃)| = µ(I j ) = µ(]0, 1]) = 1.
j=1
La négation de la condition de Cauchy de R-intégrabilité est donc satisfaite.

Montrons maintenant que la fonction de Dirichlet est intégrable sur [0, 1]
et que son intégrale y est nulle. Notons tout d’abord que Q ∩ [0, 1] est
dénombrable et peut donc s’écrire sous la forme {rk : k ∈ N}, où l’application
k 2→ rk est une bijection de N sur Q ∩ [0, 1]. Soit ! > 0; associons-lui la jauge
δ sur [0, 1] définie comme suit. Si x ∈ [0, 1] \ Q, on prend δ(x) = 1; si
x ∈ Q ∩ [0, 1], il existe un unique rk tel que x = rk et l’on prend δ(x) = 2k+2
!
.
Soit Π = {(x , I ), . . ., (x , I )} une P-partition δ-fine de ]0, 1]. Comme
1 1 m m
d(x) = 0 si x est irrationnel, on a

m
$ $
S(]0, 1], d, Π) = d(xj )µ(I j ) = µ(I j ).
j=1 {1≤j≤m : xj ∈Q}
Soit q ∈ N tel que {xj ∈ Q : 1 ≤ j ≤ m} ⊂ {r0 , . . . , rq }. Alors,

 
$ q
$ $
µ(I j ) =  µ(I j )
{1≤j≤m : xj ∈Q} k=0 {1≤j≤m : xj =r k}
q
$ ! ! 1 − (1/2)q+1
≤ = ≤ !,
k=0
2k+1 2 1 − (1/2)
puisque, pour tous les j tels que xj = rk , les I j correspondants forment

une famille formée d’un ou deux intervalles disjoints de ]0, 1] contenus dans
[rk − 2k+2
!
, rk + 2k+2
!
], ce qui entraı̂ne
$ 42 35
! ! !
µ(I ) ≤ µ
j
rk − , rk + = .
2k+2 2k+2 2k+1
{1≤j≤m : xj =rk }
En conséquence, et en notant que S(I, f, Π) est positive et donc égale à sa

valeur absolue, on a |S(I, f, Π)| ≤ ! pour toutes les P-partitions δ-fines de
]0, 1] et le résultat est démontré.
On a vu qu’une fonction primitivable sur un intervalle fermé n’y est pas
nécessairement R-intégrable. L’exemple de la fonction
f (x) = −1 si x < 0, f (x) = 1 si x ≥ 0,

considéré au début de la section, qui est R-intégrable sur [−1, 1], sans vérifier
la propriété de Darboux, montre l’existence de fonctions R-intégrables sur
un intervalle fermé qui n’y sont pas primitivables.
¯ Rp) l’ensemble des fonctions de Rn dans Rp R-
Si l’on désigne par R(I,
intégrables sur l’adhérence I¯ du semi-pavé I de Rn on a donc les inclusions
(strictes)
¯ Rp) ! P (I,
R(I, ¯ Rp), N ([a, b], Rp) ! P ([a, b], Rp)
alors que R([a, b], Rp) \ N ([a, b], Rp) et N ([a, b], Rp) \ R([a, b], Rp) sont non
vides. L’ensemble des fonctions intégrables contient donc différentes classes
de fonctions intéressantes.
La discussion qui précède montre que le concept d’intégrabilité que Ber-
nard Riemann a introduit en 1854 est trop faible pour intégrer, sur un pavé,
les fonctions non bornées (en particulier certaines fonctions primitivables)
ainsi que des fonctions très discontinues comme la fonction de Dirichlet.
Vito Volterra a même donné en 1881 un exemple de fonction bornée,
primitivable mais non R-intégrable sur un intervalle. On peut chercher la
raison de ces limitations de l’intégrale de Riemann dans le fait que, ! > 0
étant donné, la condition imposée aux P-partitions pour lesquelles la somme
de Riemann doit approcher la valeur de l’intégrale à ! près, est d’être δ-fine
pour une jauge constante δ, c’est-à-dire pour une jauge qui ne force aucune-
ment la P-partition à être particulièrement “fine” au voisinage des points de
I¯ où la fonction a un comportement peu régulier (discontinuités, limites à
gauche ou à droite infinies, oscillations non bornées...). Une définition mieux
adaptée à des fonctions présentant ces caractéristiques doit “forcer” les P-
partitions acceptables pour un ! > 0 donné à être plus “fines” aux endroits
pathologiques, afin de permettre aux sommes de Riemann d’épouser mieux
la quantité qu’elles sont censées approcher. C’est une idée que Leonard Eu-
ler avait déjà exprimée, sans l’exploiter, en 1768. Près de deux siècles plus
tard, Jaroslav Kurzweil et Ralph Henstock ont refait, indépendamment,
cette observation. Ils ont proposé une modification formelle simple mais
fondamentale de la définition de Riemann, qui conduit à une intégrale con-
servant, pour la partie élémentaire de la théorie, le support intuitif et la
simplicité conceptuelle de l’approche de Riemann, mais qui s’avère suf-
fisamment puissante pour intégrer à la fois les fonctions primitivables et les
fonctions R-intégrables (et, comme on le verra, bien d’autres encore!).
10.2. PROPRIÉTÉS ÉLÉMENTAIRES DE L’INTÉGRALE 357
10.2 Propriétés élémentaires de l’intégrale

Soit I un semi-pavé de Rn , f et g des fonctions de Rn dans Rp définies sur
¯
I.
¯ alors f + g est intégrable sur
Proposition. Si f et g sont intégrables sur I,
¯
I et J J J
(f + g) = f + g.
I¯ I¯ I¯
H H
Démonstration. Posons J1 = I¯ f et J2 = I¯ g et soit ! > 0. Il existe une
jauge δ1 sur I¯ telle que
|S(I, f, Π1) − J1 |2 ≤ !/2
pour toute P-partition δ1 -fine Π1 de I et une jauge δ2 sur I¯ telle que
|S(I, g, Π2) − J2 |2 ≤ !/2
pour toute P-partition δ2 -fine Π2 de I. Définissant sur I¯ la jauge δ par

δ(x) = min[δ1 (x), δ2(x)], et notant que toute P-partition δ-fine Π de I sera
à la fois δ1 -fine et δ2 -fine, on aura, pour une telle P-partition,
|S(I, f + g, Π) − (J1 + J2 )|2 = |S(I, f, Π) + S(I, g, Π) − J1 − J2 |2
≤ |S(I, f, Π) − J1 |2 + |S(I, g, Π) − J2 |2 ≤ !/2 + !/2 = !,

Proposition. Si f est intégrable sur I¯ et c ∈ R, alors cf est intégrable sur

I¯ et J 4J 5
(cf ) = c f .
I¯ I¯
Démonstration.
H
Le résultat est évident si c = 0. Pour c /= 0, posons
J = I¯ f et soit ! > 0. Il existe donc une jauge δ sur I¯ telle que
|S(I, f, Π) − J|2 ≤ !/|c|,
pour toute P-partition δ-fine Π de I. En consequence, pour une telle P-

partition, on a
|S(I, cf, Π) − cJ|2 = |c[S(I, f, Π) − J]|2 ≤ |c|(!/|c|) = !,

Ces deux résultats montrent ¯ Rp) est un espace vectoriel sur R

que P (I,
H
et que l’application f 2→ I¯ f est une application linéaire de P (I, ¯ Rp) dans
R (et en particulier une fonctionnelle linéaire si p = 1). On démontre d’une
p
manière tout à fait identique que R(I, ¯ Rp) est un sous-espace vectoriel de
¯
P (I, R ).
p
La propriété suivante généralise aux intégrales le fait que la norme d’une

somme est inférieure ou égale à la somme des normes.
Proposition. Soit I un semi-pavé de Rn , f une fonction de Rn dans Rp et
g une fonction de Rn dans R+ définies sur I¯ et telles que
|f (x)|i ≤ g(x),
¯ (i = 1, 2 ou ∞). Si f et g sont intégrables sur I,
pour tout x ∈ I, ¯ alors on a
#J # J
# #
# f# ≤
# ¯ # g, (i = 1, 2 ou ∞),
I ¯ i I
¯ on a
En particulier, si f et |f |i sont intégrables sur I,
#J # J
# #
# f# ≤ |f |i , (i = 1, 2 ou ∞).
# ¯ # ¯
I i I
Démonstration. On va montrer que

#J # J
# #
# f# ≤
# ¯ # g+!
I ¯ i I
pour chaque ! > 0. Pour un tel ! > 0, il existe une jauge δ $ et une jauge δ $$
sur I¯ telles que
# J # # J #
# # # #
#S(I, f, Π$) − f # ≤ !/2, #S(I, g, Π$$) − g # ≤ !/2.
# ¯ # # ¯ #
I i I
Définissant la jauge δ sur I¯ par δ(x) = min{δ $ (x), δ $$(x)},

et choisissant une
P-partition δ-fine Π de I, on a, en utilisant les propriétés des sommes de
Riemann et le fait que Π est à la fois δ $ -fine et δ $$ -fine,
#J # #J #
# # # #
# f # ≤ # f − S(I, f, Π)# + |S(I, f, Π)|i
# ¯ # # ¯ #
I i I i
≤ !/2 + |S(I, f, Π)|i ≤ !/2 + S(I, |f |i, Π) ≤ !/2 + S(I, g, Π)

J # J # J J
# #
≤ !/2 + g + #S(I, g, Π) − g ## ≤ !/2 + g + !/2 = g + !.
#
¯ I ¯ ¯ ¯ I I I
Pour obtenir la deuxième inégalité, il suffit de prendre g = |f |i.
Une conséquence aisée de la proposition précédente est le fait que l’inté-

grale préserve les relations d’ordre entre deux fonctions réelles.
Corollaire. Si I est un semi-pavé de Rn et f une fonction réelle intégrable
sur I¯ et telle que f (x) ≥ 0 pour tout x ∈ I,
¯ alors
J
f ≥ 0.
I¯
Démonstration. Il suffit de prendre f = 0 et g = f dans la Proposition

précédente.
Corollaire. Si I est un semi-pavé de Rn et si f et g sont deux fonctions

réelles intégrables sur I¯ et telles que f (x) ≤ g(x) pour tout x ∈ I,
¯ alors on a
J J
f≤ g.
I¯ I¯
Démonstration. Il suffit d’appliquer le corollaire précédent à la fonction

g − f et d’utiliser la linéarité de l’intégrale.
Le résultat suivant montre que la théorie et le calcul de l’intégrale d’une
fonction de Rn dans Rp peuvent toujours se ramener au cas d’une fonction
à valeur réelle.
Proposition. Soit I un semi-pavé de Rn et f une fonction de Rn dans
Rp définie sur ¯ Alors f est intégrable sur I¯ si et seulement si chaque
I.
composante fk de f est intégrable sur I¯ (1 ≤ k ≤ p), auquel cas on a
4J 5 J
f = fk , (1 ≤ k ≤ p).
I¯ k I¯
Démonstration. La condition nécessaire résulte aisément des définitions

et du fait que, pour toute P-partition Π de I, et tout 1 ≤ k ≤ p, on a
# 4J 5 # #2 J 3 # # J #
# # # # # #
#S(I, fk, Π) − f #= # S(I, f, Π) − f # ≤ #S(I, f, Π) − f # .
# ¯ # # ¯ # # ¯ #
I k I k I 2
H
Pour la condition suffisante, si nous posons Jk = I¯ fk , (1 ≤ k ≤ p) et si ! > 0
étant donné, nous désignons par δk une jauge sur I¯ telle que la définition
d’intégrabilité de fk sur I¯ soit vérifiée pour p1/2
!
, il est facile de voir que la
définition d’intégrabilité de f sur I¯ relative à ! sera vérifiée pour le choix de
la jauge δ définie sur I¯ par δ(x) = min1≤k≤p δk (x).
Les propriétés qui suivent montrent le comportement de l’intégrale par

rapport à une translation ou une homothétie du domaine d’intégration.
¯ Alors, pour tout a ∈ Rn , f (· − a) est intégrable sur
Rp intégrable sur I.
a + I¯ = {a + x : x ∈ I}
¯ et
J J
f (x − a) dx = f.
a+I¯ I¯
Démonstration. Soit ! > 0 et δ une jauge sur I¯ telle que

# J #
# #
#S(I, f, Π) − f # ≤ !
# ¯ #I 2
pour toute P-partition δ-fine Π de I. On définit la jauge η sur a + I¯ par

A j j B
η = δ(· − a). Soit Πa = (x , I ) 1≤j≤m une P-partition η-fine de a + I =
A B
{a + x : x ∈ I}. Alors Π = (xj − a, −a + I j ) 1≤j≤m , où −a + I j = {−a + x :
x ∈ I j }, est une P-partition δ-fine de I puisque les relations
I j ⊂ B∞ [xj ; η(xj )], (1 ≤ j ≤ m),
entraı̂nent évidemment
−a + I j ⊂ B∞ [xj − a; δ(xj − a)], (1 ≤ j ≤ m).
En conséquence, puisque µ(−a + I j ) = µ(I j ), (1 ≤ j ≤ m), on a

# #
# J # #$ J #
# # #m #
#S(a + I, f (. − a), Πa ) − f # = # µ(I j )f (xj − a) − f ##
# # #
I¯ 2 #j=1 I¯ #
2
# #
#m J # # J #
#$ # # #
= ## µ(−a + I j )f (xj − a) − f ## = ##S(I, f, Π) − f ## ≤ !,
#j=1 I¯ # I¯ 2
2

¯ Alors, pour chaque r > 0, f (r·) est intégrable sur
Rp intégrable sur I.
¯
r I = {r x : x ∈ I}
−1 −1 ¯ et
J J
f (rx) dx = r −n f.
r −1 I¯ I¯
Démonstration. Soit ! > 0 et δ une jauge sur I¯ telle que

# J #
# #
#S(I, f, Π) − f # ≤ !r n
# ¯ #
I 2
A B
pour toute P-partition δ-fine Π de I. Soit Πr = (xj , I j ) 1≤j≤m une P-
A B
partition (δ/r)-fine de r −1 I = {r −1 x : x ∈ I}. Alors Π = (rxj , rI j ) 1≤j≤m
est une P-partition δ-fine de I puisque les relations
xj ∈ I¯j , I j ⊂ B∞ [xj ; δ(xj )/r], (1 ≤ j ≤ m),
entraı̂nent évidemment
rxj ∈ r I¯j , rI j ⊂ B∞ [rxj ; δ(xj )], (1 ≤ j ≤ m).
Dès lors, puisque µ(rI j ) = r n µ(I j ), on aura

# #
# J # #m J #
# # # $ #
#S(r −1 I, f (r·), Πr) − r −n f # = r −n # µ(rI j )f (rxj ) − f ##
# ¯ # # ¯
I 2 #j=1 I #
2
# J #
# #
= r −n ##S(I, f, Π) − f ## ≤ !,
¯ I 2
Donnons maintenant deux propriétés utiles de l’intégrale simple. La
première s’appelle la formule d’intégration par parties.
Proposition. Soient f et g deux fonctions de R dans K dérivables sur [a, b].
Alors f $ g est intégrable sur [a, b] si et seulement si f g $ est intégrable sur [a, b],
auquel cas on a
J b J b
f $ g = f (b)g(b) − f (a)g(a) − f g $.
a a
Démonstration. Par la formule de dérivation d’un produit de fonctions,

on a
f $ g = (f g)$ − f g $ ,
et, par le théorème fondamental du calcul différentiel et intégral, la fonction
(f g)$ est intégrable sur [a, b] et
J b
(f g)$ = f (b)g(b) − f (a)g(a).
a
La thèse résulte alors de la linéarité de l’intégrale.

La deuxième propriété s’appelle la formule d’intégration par substi-

tution.
Proposition. Soit g une fonction de R dans R non constante et dérivable
sur [a, b] et h une fonction de g([a, b]) dans Rp primitivable sur g([a, b]). Alors
(h ◦ g)g $ est primitivable sur [a, b] et
J b J g(b)
(h ◦ g)g $ = h.
a g(a)
Démonstration. Soit H une primitive de h sur g([a, b]); par le théorème de

primitivation par substitution, (h◦g)g $ = (H $ ◦g)g $ = (H ◦g)$ est primitivable
sur [a, b] et H ◦g en est une primitive. Par le théorème fondamental du calcul
différentiel et intégral, (h ◦ g)g $ est donc intégrable sur [a, b] et
J b
(h ◦ g)g $ = H[g(b)] − H[g(a)].
a
Le même théorème appliqué à h montre que cette fonction est intégrable

sur tout intervalle fermé de g([a, b]), et en particulier à l’intervalle fermé
d’extrémités g(a) et g(b), et que
J g(b)
h = H[g(b)] − H[g(a)],
g(a)
ce qui achève la démonstration.
10.3 Additivité de l’intégrale

Le but de cette section est de montrer que l’intégrale d’une fonction sur
l’adhérence d’un semi-pavé pavé I est égale à la somme des intégrales de
cette fonction sur les adhérences de semi-pavés formant une partition finie
de I. Pour démontrer cette propriété, nous aurons besoin d’un résultat
technique qui nous servira souvent par la suite, et que nous nommerons le
lemme des P-partitions subordonnées.
Lemme. Soit I un semi-pavé de Rn , {K 1 , . . . , K l } une partition de I en
¯ Il existe une jauge δ sur I¯ vérifiant la rela-
semi-pavés et δ0 une jauge sur I.
¯ et telle que, si Π = {(x1 , I 1 ), . . ., (xm, I m)}
tion δ(x) ≤ δ0 (x) pour tout x ∈ I,
est une P-partition δ-fine de I, chaque famille
Π̃i = {(xj , I j ∩ K i ) : I j ∩ K i /= ∅, 1 ≤ j ≤ m}
10.3. ADDITIVITÉ DE L’INTÉGRALE 363
est une P-partition δ-fine de K i , (1 ≤ i ≤ l), la famille
Π̃ = {(xj , I j ∩ K i ) : I j ∩ K i /= ∅, 1 ≤ j ≤ m, 1 ≤ i ≤ l, }
est une P-partition δ-fine de I et l’on a

l
$
S(I, f, Π) = S(I, f, Π̃) = S(K i, f, Π̃i )
i=1
¯
pour toute fonction f de Rn dans Rp définie sur I.
Démonstration. Construisons la jauge δ comme suit. Soit x ∈ I. ¯ Ap-
7
pelons J(x) l’ensemble {1 ≤ i ≤ l : x /∈ K }. Soit E(x) = i∈J(x) !K i si
i
J(x) /= ∅ et E(x) = Rn si J(x) = ∅. Comme E(x) est ouvert et x ∈ E(x),

il existe r(x) > 0 tel que B∞ [x; r(x)] ⊂ E(x). Ce choix de r(x) assure
que B∞ [x; r(x)] ne rencontre que des K i dont l’adhérence contient x. En
d’autres termes, si i est tel que B∞ [x : r(x)] ∩ K i /= ∅, alors x ∈ K i (car
B∞ [x; r(x)] ∩ K i /= ∅, et donc i /∈ J(x)).
Soit δ la jauge définie sur I¯ par δ(x) = min{δ0 (x), r(x)} et soit Π =
{(x , I 1 ), . . ., (xm, I m)} une P-partition δ-fine de I. Alors, pour chaque 1 ≤
1
i ≤ l, la famille
Π̃i = {(xj , I j ∩ K i ) : I j ∩ K i /= ∅, 1 ≤ j ≤ m}
est une P-partition de K i . En effet,
I j ∩ K i /= ∅ ⇒ B∞ [xj ; δ(xj )] ∩ K i /= ∅ ⇒ B∞ [xj ; r(xj )] ∩ K i /= ∅
⇒ xj ∈ K i ⇒ xj ∈ K i ∩ I j ,
et dès lors xj ∈ K i ∩ I j puisque K i ∩ I j = K i ∩ I j lorsque I j ∩ K i /= ∅ (le
vérifier). En outre, chaque P-partition Π Mi est évidemment δ-fine puisque Π
l’est. Bien entendu, la famille
N = {(xj , I j ∩ K i ) : I j ∩ K i /= ∅, 1 ≤ j ≤ m, 1 ≤ i ≤ l}
Π
Mi est une P-partition δ-fine de I.

formée de la réunion des éléments des Π
¯ alors
Enfin, si f est une fonction de Rn dans Rp définie sur I,
m
$
S(I, f, Π) = µ(I j )f (xj )
j=1
m
$ l
> m
$ $ 8 9
= µ(I j ∩ K i )f (xj ) = µ I j ∩ K i f (xj )
j=1 i=1 j=1 {1≤i≤l : I j ∩K i(=∅}
l
$ $
N =
= S(I, f, Π) µ(I j ∩ K i )f (xj )
i=1 {1≤j≤m : I j ∩K i (=∅}
l
$
= Mi ).
S(K i, f, Π
i=1
Le nom de ce lemme vient de ce que toute P-partition δ-fine pour la jauge

ainsi construite peut être remplacée, sans changer la somme de Riemann
correspondante, par une P-partition δ-fine que l’on dit subordonnée à la
partition {K 1 , . . . , K l }, puisque chacun de ses semi-pavés est contenu dans
l’un des semi-pavés K i .
Enonçons et démontrons maintenant la propriété d’additivité de l’in-
tégrale.
Proposition. Soit I un semi-pavé de Rn , {K 1 , . . . , K l } une partition de I
en semi-pavés K i , (1 ≤ i ≤ l) et soit f une fonction de Rn dans Rp définie
¯ Si f est intégrable sur chaque K̄ i , (1 ≤ i ≤ l), alors f est intégrable
sur I.
¯
sur I et
J l J
$
f= f.
I¯ i=1 K̄
i
Démonstration. Si ! > 0 est donné, il existe une jauge δi sur K̄ i telle que
# J #
# #
#S(K i, f, Πi) − f ## ≤ !/l,
#
K̄ i 2
pour toute P-partition δi -fine Πi de K i (1 ≤ i ≤ l). Soit δ0 la jauge définie

sur I¯ par
δ0 (x) = min{δi (x) : x ∈ K̄ i , 1 ≤ i ≤ l},
et soit δ la jauge donnée par le lemme des P-partitions subordonnées à partir
de δ0 et {K 1 , . . . , K l }. Si Π = {(x1 , I 1), . . . , (xm, I m)} est une P-partition
δ-fine de I et Π̃i (1 ≤ i ≤ l) et Π̃ sont les P-partitions qui lui sont associées
par le lemme des P-partitions subordonnées, on a
# # # #
# l J
$ # # l J
$ #
# # # #
#S(I, f, Π) − f # = #S(I, f, Π̃) − f#
# K̄ i # # K̄ i #
i=1 2 i=1 2
10.4. CRITÈRE DE CAUCHY D’INTÉGRABILITÉ 365
# 3##
#$l 2 J
# #
=# S(K i, f, Π̃i ) − f # ≤ l(!/l) = !,
# K̄ i #
i=1 2
puisque par construction chaque Π̃i est δ i -fine (1 ≤ i ≤ l).
Remarques. 1. La propriété d’additivité est également vraie pour l’inté-

grabilité au sens de Riemann mais la démonstration est différente et plus
longue, car le lemme qui précède n’a pas d’équivalent pour l’intégration au
sens de Riemann. Nous ne la donnerons pas ici car nous n’aurons pas à
l’utiliser explicitement.
2. La propriété d’additivité possède une réciproque, dont la démonstration
nécessite la démonstration du caractère suffisant de la condition de Cauchy
d’intégrabilité.
10.4 Critère de Cauchy d’intégrabilité

Montrons que la condition d’intégrabilité de Cauchy est également suf-
fisante, ce qui permettra de prouver l’intégrabilité de fonctions sans connaı̂tre
la valeur de leur intégrale.
Théorème. Soit I un semi-pavé de Rn et f une fonction de Rn dans Rp
¯ Si, pour chaque ! > 0, il existe une jauge δ sur I¯ telle que,
définie sur I.
pour toute P-partition δ-fine Π de I et toute P-partition δ-fine Π$ de I, on a
|S(I, f, Π) − S(I, f, Π$)|2 ≤ !,
¯
alors f est intégrable sur I.
Démonstration. Construisons tout d’abord un candidat pour la valeur

¯ En prenant ! = 1 dans la condition de Cauchy, on
de l’intégrale de f sur I.
peut trouver une jauge δ1 sur I¯ telle que
|S(I, f, Π) − S(I, f, Π$)|2 ≤ 1
lorsque Π et Π$ sont des P-partitions δ1 -fines de I. En prenant ! = 1/2, on

¯ que l’on peut toujours choisir telle
peut trouver de même une jauge δ2 sur I,
¯ pour laquelle
que δ2 (x) ≤ δ1 (x) pour tout x ∈ I,
1
|S(I, f, Π) − S(I, f, Π$)|2 ≤ ,
2
lorsque Π et Π$ sont des P-partitions δ2 -fines de I. En continuant de la sorte

avec ! = 1/k, k ≥ 2 entier, on trouve une suite (δk )k∈N∗ de jauges sur I¯ telles
que, pour chaque x ∈ I,¯ et chaque k ∈ N∗ , on ait
δk+1 (x) ≤ δk (x),

et pour lesquelles
1
|S(I, f, Π) − S(I, f, Π$)|2 ≤
,
k
lorsque Π et Π$ sont des P-partitions δk -fines de I. Fixons, pour chaque
k ∈ N∗ une P-partition δk -fine Πk de I et montrons que la suite
(S(I, f, Πk))k∈N∗
est une suite de Cauchy dans Rp. Par la propriété de décroissance de la suite
(δk (x))k∈N∗ , toute P-partition δq -fine sera δk -fine lorsque k ≤ q. Dès lors, si
q ≥ k sont des entiers supérieurs ou égaux à un, Πk et Πq seront δk -fines et
l’on a, par construction,
1
|S(I, f, Πk) − S(I, f, Πq)|2 ≤ .
k
En conséquence, si ! > 0 est donné, et si m ∈ N∗ est tel que 1/m ≤ !, il
suffira de prendre q ≥ k ≥ m pour que
1 1
|S(I, f, Πk) − S(I, f, Πq)|2 ≤ ≤ ≤ !.
k m
Donc (S(I, f, Πk))k∈N∗ , suite de Cauchy dans Rp , est convergente et nous
désignerons sa limite par J. En faisant tendre q vers l’infini dans l’inégalité
ci-dessus, on obtient
1
|S(I, f, Πk) − J|2 ≤ , (k ∈ N∗ ).
k
Pour montrer que f est intégrable sur I¯ et que son intégrale y vaut J, soit
! > 0 et soit m ∈ N∗ tel que m 1
≤ !. Si Π est une P-partition δm -fine de I, et
si, pour tout q ≥ m, Πq est définie dans la première partie de la définition,
on a
1
|S(I, f, Π) − S(I, f, Πq)|2 ≤ ≤ !.
m
Dès lors, si l’on fait tendre q vers l’infini, on obtient
|S(I, f, Π) − J|2 ≤ !,
10.4. CRITÈRE DE CAUCHY D’INTÉGRABILITÉ 367
Remarque. En remplaçant partout, dans l’énoncé et la démonstration,

jauge par jauge constante, on obtient une condition suffisante de Cauchy
pour la R-intégrabilité.
Une conséquence importante de la condition suffisante d’intégrabilité
de Cauchy est la propriété de restriction de l’intégrale qui assure
l’intégrabilité sur les sous-pavés de I¯ lorsqu’on a l’intégrabilité sur I.
¯
¯ Alors f est intégrable sur K̄ pour chaque semi-pavé K ⊂ I.
intégrable sur I.
Démonstration. On peut évidemment supposer que K ! I. On sait que
I \ K peut alors s’écrire sous la forme
q
>
I \K = K i,
i=1
où les K i sont des semi-pavés mutuellement disjoints contenus dans I. Soit
! > 0; on va montrer que f vérifie la condition de Cauchy d’intégrabilité
sur K̄. Comme f est intégrable sur I, ¯ elle y vérifie la condition de Cauchy
d’intégrabilité, et il existe donc une jauge δ sur I¯ telle que
|S(I, f, Π) − S(I, f, Π$)|2 ≤ !,
lorsque Π et Π$ sont des P-partitions δ-fines de I. Bien entendu, la restriction

de δ à K̄ et aux K̄ i définit une jauge sur ces ensembles. Pour chaque 1 ≤
i ≤ q, fixons une P-partition δ-fine Πi de K i , et soient ΠK et Π$K deux P-
partitions δ-fines de K. Alors la famille Π formée par la réunion des éléments
de ΠK et de ceux des Πi , (1 ≤ i ≤ q) et la famille Π$ formée par la réunion
des éléments de Π$K et de ceux des Πi , (1 ≤ i ≤ q) sont des P-partitions
δ-fines de I telles que
S(I, f, Π) − S(I, f, Π$) = S(K, f, ΠK ) − S(K, f, Π$K ),
puisque les autres termes sont communs à S(I, f, Π) et à S(I, f, Π$). En

conséquence,
|S(K, f, ΠK) − S(K, f, Π$K )|2 = |S(I, f, Π) − S(I, f, Π$)|2 ≤ !,

Remarque. La même démonstration montre évidemment que la propriété
de restriction est vraie pour la R-intégrabilité.
Nous pouvons maintenant énoncer et démontrer la réciproque de la
propriété d’additivité de l’intégrale.
Corollaire. Soit I un semi-pavé de Rn , {K 1 , . . . , K q } une partition de I

en semi-pavés et f une fonction de Rn dans Rp intégrable sur I. ¯ Alors f est
i
intégrable sur chaque K et
J q J
$
f= f.
I¯ i=1 K
i
¯ l’est sur chaque K i par la propriété

Démonstration. f , intégrable sur I,
de restriction, et la formule se déduit alors de la propriété d’additivité de la
section précédente.
10.5 Fonctions continues ou monotones

Le critère de Cauchy permet de démontrer la R-intégrabilité sur I¯ d’une
¯
fonction continue sur I.
Proposition. Toute fonction f de Rn dans Rp continue sur l’adhérence I¯
¯
d’un semi-pavé I de Rn est R-intégrable sur I.
Démonstration. On va montrer que f vérifie la condition de Cauchy de R-
intégrabilité ¯ Pour ce faire, notons d’abord que si Π = {(x1 , I 1 ), . . ., (xm, I m)}
sur I.
8 9
et Π̃ = (x̃k , Ĩ k ) sont deux P-partitions de I et si l’on pose I j,k =
1≤k≤m̃
! !m̃
I j ∩ I˜k , (1 ≤ j ≤ m; 1 ≤ k ≤ m̃), alors, comme I = m ˜k
j=1 I = k=1 I , on a
j
évidemment
& m̃
' m̃
> >
I =I ∩
j j
I˜k = I j,k , (1 ≤ j ≤ m),
k=1 k=1
 
m
> m
>
I˜k = I˜k ∩  Ij = I j,k , (1 ≤ k ≤ m̃),
j=1 j=1
et, puisque les I j sont mutuellement disjoints et les I˜k sont mutuellement
disjoints, on aura
$
µ(I j ) = µ(I j,k ), (1 ≤ j ≤ m);
{1≤k≤m̃ : I j,k (=∅}
$
µ(I˜k ) = µ(I j,k ), (1 ≤ k ≤ m̃).
{1≤j≤m : I j,k (=∅}
10.5. FONCTIONS CONTINUES OU MONOTONES 369
Dès lors, en désignant par y j,k , pour chaque (j, k) tel que I j,k /= ∅, un élément
arbitrairement fixé de I j,k , on a
|S(I, f, Π) − S(I, f, Π̃)|2

# #
#m m̃ #
#$ $ $ $ #
= ## µ(I )f (x ) −
j,k j
µ(I )f (x̃ )##
j,k k
#j=1 {1≤k≤m̃ : I j,k (=∅} k=1 {1≤j≤m : I j,k (=∅} #
2
# #
# #
# $ #
= ## µ(I j,k )[f (xj ) − f (x̃k )]##
#{1≤j≤m; 1≤k≤m̃ : I j,k (=∅} #
2
$
≤ µ(I j,k
)[|f (x ) − f (y
j j,k
)|2 + |f (y j,k
) − f (x̃k )|2 ].
{1≤j≤m; 1≤k≤m̃ : I j,k (=∅}
La continuité de f sur le fermé borné I¯ entraı̂ne sa continuité uniforme sur

¯ Dès lors, si ! > 0 est donné, il existe un δ > 0 tel que, pour chaque x ∈ I¯
I.
et chaque y ∈ I¯ ∩ B∞ [x; δ], on ait
!
|f (y) − f (x)|2 ≤ .
2µ(I)
Prenant ce δ comme jauge constante sur I, ¯ on voit, en utilisant les inégalités

ci-dessus, que si Π et Π̃ sont des P-partitions δ-fines de I, on aura évidem-
ment
y j,k ∈ I j ⊂ B∞ [xj ; δ], y j,k ∈ I˜k ⊂ B∞ [x̃k ; δ],
et dès lors
$ 2 3
! !
|S(I, f, Π)−S(I, f, Π̃)|2 ≤ µ(I j,k ) + =!
2µ(I) 2µ(I)
{1≤j≤m; 1≤k≤m̃ : I j,k (=∅}

Le même critère de Cauchy permet de montrer qu’une fonction de R dans
R monotone sur [a, b] y est R-intégrable.
Proposition. Toute fonction f de R dans R monotone sur [a, b] y est R-
intégrable.
Démonstration. Il suffit évidemment de prouver le résultat pour une
fonction croissante, puisque f et −f sont simultanément R-intégrables sur
[a, b]. Si f (a) = f (b), alors f est constante sur [a, b]A et le résultat Best déjà
connu. Supposons donc f (b) − f (a) > 0. Soient Π = (xj , ]aj−1 , aj ]) 1≤j≤m ,
8 9
et Π̃ = (x̃k , ]ãk−1 , ãk ]) , avec a0 = ã0 = a, am = ãm̃ = b, deux
1≤k≤m̃
P-partitions de ]a, b] telles que
S(I, f, Π) − S(I, f, Π̃) ≥ 0.
En vertu de la croissance de f , on a
|S(I, f, Π) − S(I, f, Π̃)| = S(I, f, Π) − S(I, f, Π̃)
m
$ m̃
$
= f (xj )(aj − aj−1 ) − f (x̃k )(ãk − ãk−1 )
j=1 k=1
m
$ m̃
$
≤ f (aj )(aj − aj−1 ) − f (ãk−1 )(ãk − ãk−1 ).
j=1 k=1
Si l’on pose
a0 , . . . , a
{I ImI } = {a0 , . . . , am } ∪ {ã0 , . . . , ãm̃ },
avec
a=a
I0 < a
I1 < . . . < a
ImI = b,
et
I j = ]aj−1 , aj ], (1 ≤ j ≤ m), I˜k = ]ãk−1 , ãk ], (1 ≤ k ≤ m̃),
IIl = ]I al ], (1 ≤ l ≤ m),
al−1, I I
alors la croissance de f entraı̂ne les inégalités

m̃
$ $
f (ãk )(ãk − ãk−1 ) = f (ãk )(I al−1 )
al − I
k=1 I : IIl ⊂I˜k }
{1≤k≤m̃; 1≤l≤m
$ I
m
$
≥ f (I
al )(I Il−1 ) =
al − a f (I
al )(I al−1 )
al − I
I : IIl ⊂I˜k }
{1≤k≤m̃; 1≤l≤m l=1
$
= f (I
al )(I Il−1 )
al − a
I : IIl ⊂I j }
{1≤j≤m; 1≤l≤m
$ $
≥ f (aj−1 )(I al−1 ) =
al − I f (aj−1 )(aj − aj−1 ).
I : IIl ⊂I j }
{1≤j≤m; 1≤l≤m j=1
10.5. FONCTIONS CONTINUES OU MONOTONES 371
Par conséquent,
|S(I, f, Π) − S(I, f, Π̃)|
$ m̃
$
≤ f (aj )(aj − aj−1 ) − f (ãk−1 )(ãk − ãk−1 )
j=1 k=1
m̃
$ m
$
+ f (ãk )(ãk − ãk−1 ) − f (aj−1 )(aj − aj−1 )
k=1 j=1
m
$ m̃
$
= [f (aj ) − f (aj−1 )](aj − aj−1 ) + [f (ãk ) − f (ãk−1 )](ãk − ãk−1 ).
j=1 k=1
! > 0 étant donné, choisissons la jauge constante δ = !

4[f (b)−f (a)] . Si les P-
partitions Π et Π̃ sont δ-fines et (sans perte de généralité) choisies de telle
sorte que S(I, f, Π) − S(I, f, Π̃) ≥ 0, on aura, en utilisant l’inégalité qui
précède et le fait que
!
aj − aj−1 ≤ , (1 ≤ j ≤ m),
2[f (b) − f (a)]
!
ãk − ãk−1 ≤ , (1 ≤ k ≤ m̃),
2[f (b) − f (a)]
l’inégalité
|S(I, f, Π) − S(I, f, Π̃)|
 
! $m $m̃ 
≤ [f (aj ) − f (aj−1 )] + [f (ãk ) − f (ãk−1 )]
2[f (b) − f (a)] j=1 k=1

!
= [f (b) − f (a) + f (b) − f (a)] = !,
2[f (b) − f (a)]
Remarque. En désignant par C(I, ¯ Rp) l’ensemble des fonctions de Rn dans

R continues sur I¯ et par M ([a, b], R) l’ensemble des fonctions de R dans R
p
définies et monotones sur [a, b], on a donc démontré les inclusions
¯ Rp) ⊂ R(I,
C(I, ¯ Rp) et M ([a, b], R) ⊂ R([a, b], R).
10.6 Intégrale indéfinie

Soit f une fonction de R dans
Ha
Rp intégrable sur [a, b]. Par la propriété de
restriction et la convention a f = 0, f sera intégrable sur [a, x] quel que soit
x ∈ [a, b], ce qui permet de définir une application de [a, b] dans Rp par
J x
x 2→ f.
a
Cette application est appelée l’intégrale indéfinie de f sur I¯ et est notée

J · J ·
f ou f (t) dt
a a
pour rappeler son mode de construction. Dans la seconde notation, la vari-

able t peut évidemment être remplacée par n’importe quelle autre lettre. On
évitera cependant d’utiliser x car alors, dans la valeur en x
J x
f (x) dx
a
de l’intégrale indéfinie, la lettre x aurait ou n’aurait pas de signification selon

sa position !
Lorsque f est une fonction de R dans Rp intégrable sur tout intervalle
fermé et borné contenu dans un intervalle quelconque I, on peut fixer un
élément a ∈ I et utiliser la convention de notation des intégrales simples pour
définir l’intégrale indéfinie de f correspondante comme étant l’application
de I dans Rp J · J x
f : x 2→ f.
a a
L’additivité
H· H·
de l’intégrale entraı̂ne aussitôt que deux intégrales indéfinies
a f et a " f de f sur I associées à des choix différents de a diffèrent par une
constante.
Montrons maintenant que, pour une fonction f primitivable sur I, les
intégrales indéfinies de f ne sont rien d’autre que ses primitives.
Proposition. Si f est une Hfonction de R dans Rp primitivable
H
sur un in-
tervalle I et si a ∈ I, alors a· f = Fa . En particulier, a· f est dérivable en
chaque point x de I et l’on a
4J · 5$
f (x) = f (x).
a
10.6. INTÉGRALE INDÉFINIE 373
Démonstration. Notons tout d’abord que, par le théorème fondamental

du calcul différentiel et intégral, f est intégrable sur tout intervalle fermé
borné contenu dans I, et si a ∈ I, x ∈ I avec x /= a, F désigne une primitive
quelconque de f sur I et Fa désigne la primitive de f sur I qui s’annule en
a, on a J x
f = F (x) − F (a) = Fa (x), (x ∈ I).
a
Comme la fonction définie par le second membre de cette égalité est dérivable
sur I et a pour dérivée f , la démonstration est complète.
Remarque. Ce résultat explique l’abus (regrettable) de langage qui consiste
à utiliser parfois le terme “intégrale indéfinie” et même le terme “intégrale”
H
au lieu du terme “primitive”. Il explique la similitude du symbole (un S
allongé) utilisé pour les deux concepts.
Lorsque f ∈ P ([a, b], Rp) \ N ([a, b], Rp), son intégrale indéfinie n’est plus
nécessairement dérivable en chaque point de [a, b] et, lorsqu’elle est dérivable
en x, sa dérivée n’est plus nécessairement égale à f (x). C’est ce que montrent
les exemples suivants.
Exemples. 1. En utilisant l’analogue d’un exemple antérieur et l’additivité
de l’intégrale, on sait que la fonction f définie par f (x) = 0 si x ≤ 0 et
f (x) = 1 si x > 0 est intégrable sur [−1, 1] sans y être primitivable et son
intégrale indéfinie se calcule aisément :
J x J x
f = 0 si x ∈ [−1, 0], f = x si x ∈ ]0, 1].
−1 −1
Elle n’est pas dérivable en 0.
2. La fonction de Dirichlet est intégrable, sans être primitivable, sur [0, x]
quel que soit x > 0 et son intégrale indéfinie est l’application nulle, dont la
dérivée, qui est l’application nulle, n’est pas égale à la fonction de Dirichlet.
Montrons maintenant qu’en chaque point de continuité d’une fonction
intégrable, la dérivée de l’intégrale indéfinie existe et est égale à la valeur de
la fonction en ce point.
Proposition. Soit f une fonction de R dans Rp intégrable sur [a, b], et soit
c ∈ [a, b] tel que f soit continue en c. Alors l’intégrale indéfinie de f est
dérivable en c et 4J 5$ ·
f (c) = f (c).
a
Démonstration. Il faut donc démontrer que
&J J '
c+h c
−1
lim h f− f = f (c),
h→0, c+h∈[a,b] a a
ou encore que
,J J -
c+h c
−1
lim h f− f − hf (c) = 0.
h→0, c+h∈[a,b] a a
Pour tout h ∈ R tel que c + h ∈ [a, b], on a, en vertu de l’additivité de

l’intégrale
J c+h J c J c+h J a J c+h
f− f − hf (c) = f (x) dx + f (x) dx − f (c) dx
a a a c c
J c+h
= [f (x) − f (c)] dx.
c
Soit ! > 0; f étant continue en c, il existe un δ > 0 tel que, pour tout
x ∈ [a, b] vérifiant |x − c| ≤ δ, on a |f (x) − f (c)|2 ≤ !. Dès lors, si h est
tel que c + h ∈ [a, b] et |h| ≤ δ, on a, pour tout x compris entre c et c + h,
|x − c| ≤ |h| ≤ δ et donc
|f (x) − f (c)|2 ≤ !.
Comme f (·) − f (c) et la fonction constante ! sont intégrables sur l’intervalle

fermé d’extrémités c et c + h, on en déduit que
#J # #J #
# c+h # # c+h #
# # # #
# [f (x) − f (c)] dx# ≤ # ! dx# = !|h|,
# c # # c #
2
et dès lors, si 0 < |h| ≤ δ et c + h ∈ [a, b], on a

# ;J <#
# c+h #
# −1 #
#h [f (x) − f (c)] dx # ≤ !,
# c #
2
Corollaire. Si f est une fonction de R dans Rp continue sur un intervalle

I, chaque intégrale indéfinie de f est dérivable sur I et, pour chaque a ∈ I,
on a 4J 5 · $
f (x) = f (x), (x ∈ I).
a
Démonstration. Il suffit de noter que toute fonction continue sur I est R-
intégrable sur tout intervalle fermé et borné de I et d’appliquer la proposition
précédente en chaque point de I.
10.7. EQUATIONS DIFFÉRENTIELLES SIMPLES 375
Une conséquence importante de ce corollaire est la primitivabilité sur un

intervalle I des fonctions continues sur I.
Corollaire. Toute fonction f de R dans Rp continue sur un intervalle I est
primitivable sur I.
Démonstration. L’intégrale indéfinie de f est, en vertu du corollaire
précédent, une primitive de f sur I.
On a donc, pour les fonctions d’une variable, les inclusions strictes
C([a, b], Rp) ! N ([a, b], Rp) ! P ([a, b], Rp),
C([a, b], Rp) ! R([a, b], Rp) ! P ([a, b], Rp),

M ([a, b], Rp) ! R([a, b], Rp) ! P ([a, b], Rp).
10.7 Equations différentielles simples

La résolution de certaines équations différentielles simples se ramène à des
intégrations indéfinies.
Définition. Soit I un intervalle, f et g des fonctions réelles continues sur I.
On appelle équation différentielle linéaire du premier ordre toute équation
différentielle de la forme
y $ (x) = f (x)y(x) + g(x), (10.1)
dont l’inconnue y est une fonction réelle dérivable sur I. Une solution sur I
de cette équation différentielle sera toute application réelle y dérivable sur I
et vérifiant l’équation en chaque point de I. L’équation est dite homogène
si g = 0 et non homogène sinon.
Puisque f est continue sur I, elle y est primitivable et chaque intégrale
indéfinie de f est dérivable, et donc continue sur I. Si a ∈ I est fixé, la
fonction 4 J x 5
x 2→ exp − f
a
est donc strictement positive et dérivable sur I. L’équation (10.1) est donc
équivalente à l’équation
4 J x 5 4 J x 5 4 J x 5
y $ (x) exp − f = f (x)y(x) exp − f + g(x) exp − f ,
a a a
c’est-à-dire à l’équation
2 4 J x 53$ 4 J x 5
y(x) exp − f = g(x) exp − f .
a a
Le second membre étant continu, dont primitivable sur I, les solutions de
cette équation seront données par
4 J x 5 J x 2 4 J y 53
y(x) exp − f = c+ g(y) exp − f dy,
a a a
où c est une constante réelle arbitraire, et dès lors les solutions de l’équation
linéaire (10.1) seront les fonctions y données par
U J x 2 4 J y 53 V 4J x 5
y(x) = c + g(y) exp − f dy exp f
a a a
4J x 5 J x2 4J x 5 3
= c exp f + exp f g(y) dy.
a a y
Exemple. Considérons l’équation différentielle
1
y $ (x) = y(x) + x
x
sur l’intervalle I = ]0, +∞[. Prenant par exemple a = 1, on a
J x
1
dy = ln x, exp(ln x) = x,
1 y
et dès lors les solutions sont données par les fonctions y définies par
2 J x 3
y(x) = c + dy x = [c + (x − 1)]x,
1
où c est un réel arbitraire.
Définition. Soit I un intervalle, f une fonction réelle continue sur I et h
une application continue de R dans R. On appelle équation différentielle du
premier ordre à variables séparées toute équation différentielle de la forme
y $ (x) = f (x)h(y(x)), (10.2)
où l’inconnue y est une fonction réelle. Si J ⊂ I est un intervalle, on ap-
pelle solution sur J de cette équation différentielle toute application réelle y
dérivable sur J et vérifiant l’équation pour chaque x ∈ J.
La terminologie “variables séparées” vient de ce que le second membre
de l’équation est le produit d’une fonction de x seulement par une fonction
de y seulement. Ainsi, une équation différentielle linéaire du premier ordre
est à variables séparées si elle est homogène ou si f et g sont constantes.
Notons tout d’abord le résultat simple suivant.
10.7. EQUATIONS DIFFÉRENTIELLES SIMPLES 377
Proposition. Pour tout y ∗ tel que h(y ∗ ) = 0, l’application constante y ∗ sur

I est une solution sur I de (10.2).
Démonstration. On a en effet, pour tout x ∈ I, (y ∗ )$ = 0 = f (x)h(y ∗ ).
Supposons maintenant que h vérifie une condition de Lipschitz sur chaque
borné de R. Ce sera en particulier le cas si h est de classe C 1 sur R. On
sait alors que, pour chaque x0 ⊂ I et chaque y0 ∈ R, le problème de Cauchy
correspondant
y $ (x) = f (x)h(y(x)), y(x0) = y0
possède au plus une solution. Dès lors, si y ∗ est un zéro de h et y une solution
de l’équation différentielle (10.2) telle que y(x0 ) = y ∗ pour un certain x0 ,
l’unicité de la solution du problème de Cauchy entraı̂ne que y(x) = y ∗ pour
chaque x ∈ I. Par conséquent, chaque solution de (10.2) différente d’un
zéro de h prendra ses valeurs dans un et un seul des intervalles ouverts de
R déterminés par les zéros de h. Soit K un tel intervalle. La fonction h1 est
donc continue sur K et y : I → K est solution de l’équation différentielle
(10.2) si et seulement si elle vérifie l’équation
y $ (x)
= f (x),
h(y(x))
ou encore, fixant a ∈ I et utilisant le théorème de dérivation des fonctions
composées et les propriétés de l’intégrale indéfinie, si et seulement si elle
vérifie l’équation &J '$
y(x) dt
= f (x).
a h(t)
Comme le second membre est continu, donc primitivable sur I, cette dernière
équation équivaut à
J y(x) J x
dt
=c+ f (t) dt,
a h(t) a
où c est une constante réelle arbitraire. Pour chaque valeur fixée de c, la
solution y s’obtiendra donc explicitement en résolvant alors le problème de
fonction implicite G(y, x) − c = 0, où G est définie par
J y J x
dt
G(x, y) = − f (t) dt.
a h(t) a
Comme G est de la forme G(y, x) = M (y)−F (x) où M est une fonction con-
tinue et strictement monotone, puisque M $ (y) = h(y)
1
est de signe constant
sur K, cette équation aura une solution unique y(x) pour chaque x ∈ I
tel que F (x) appartienne à M (K). On notera que la fonction G(x, y(x))
conserve une valeur constante c si y est solution de l’équation différentielle
(10.2). On dit que G est une intégrale première de l’équation différentielle
(10.2).
Exemples. 1. Considérons l’équation différentielle à variables séparées
y $ (x) = 2x[y(x)]2.
Notons tout d’abord que y = 0 est une solution sur R et recherchons main-
tenant les solutions à valeurs strictement positives ou à valeurs strictement
négatives. Les solutions sous forme implicite sont données, en prenant par
exemple a = 1, par
J y(x) J x
dt
=c+ 2t dt,
1 t2 1
c’est-à-dire par
1
1− = c + x2 − 1,
y(x)
ce qui peut encore s’écrire, puisque c est une constante arbitraire,
1
y(x) = .
c − x2
Dès lors, pour c < 0, cette solution est strictement négative et définie sur R.
Pour c = 0, cette formule fournit une solution strictement négative définie sur
] − ∞, 0[ et une solution strictement négative définie sur ]0, +∞[. Pour c > 0,
√
la formule fournit une solution strictement négative définie sur ] − ∞, − c[,
√ √
une solution strictement positive définie sur ] − c, + c[ et une solution
√
strictement négative définie sur ] c, +∞[. On voit que, contrairement au cas
de l’équation linéaire, les intervalles de définition des solutions peuvent être
strictement compris dans l’intervalle de définition de l’équation différentielle
(ici R) et peuvent dépendre de la solution elle-même.
2. L’équation différentielle
2 3
$ y(x)
y (x) = ay(x) 1 −
b
où a > 0 et b > 0, fut proposée en 1838 par le mathématicien belge Pierre-
François Verhulst pour remplacer la loi
y $ (x) = ay(x)
10.8. LEMME DE SAKS-HENSTOCK 379
donnée en 1798 par Thomas R. Malthus pour décrire l’évolution d’une

population. La loi de Malthus n’a évidemment, à côté de la solution cons-
tante y(x) = 0, que des solutions exponentielles y(x) = c exp ax, c ∈ R∗ .
L’équation de Verhulst possède les deux solutions constantes y(x) = 0 et
y(x) = b données par les zéros de la fonction h(y) = y(1 − yb ). On vérifie
aisément, en utilisant la méthode exposée plus haut, que les autres solutions
sont les fonctions y définies par
bc
y(x) = , c ∈ R \ {0, b}.
c + (b − c) exp(−ax)
Si c > b, la solution correspondante est strictement décroissante sur
]a−1 ln(1 − bc ), +∞[ tend vers +∞ si x tend vers a−1 ln(1 − bc ) et tend vers b
lorsque x tend vers +∞. Si c ∈ ]0, b[ , la solution est strictement croissante
sur R, avec limx→−∞ y(x) = 0, limx→+∞ y(x) = b. Enfin, si c < 0, la solu-
tion (négative et donc sans intérêt pour la démographie !) est strictement
décroissante sur ] − ∞, a−1 ln(1 − bc )[ et elle tend vers 0 si x tend vers −∞
et vers −∞ si x tend vers a−1 ln(1 − bc ). La courbe décrite par cette solution
lorsque 0 < c < b est appelée la courbe logistique et joue un grand rôle dans
la description des phénomènes biologiques et sociologiques. Contrairement
au modèle de Malthus, qui mène à une croissance exponentielle, le modèle
de Verhulst conduit à une saturation de la population.
10.8 Lemme de Saks-Henstock

Le résultat technique suivant, qui porte le nom de lemme de Saks-Hens-
tock, joue un rôle essentiel dans la démonstration de plusieurs résultats
importants en théorie de l’intégration. Il exprime essentiellement que, pour
une fonction f intégrable sur l’adhérence I¯ d’un semi-pavé I, la somme de
Riemann associée àH un “morceau” d’une P-partition Π dont la somme de
Riemann approche I¯ f à ! près est elle-même une approximation à ! près de
la somme des intégrales sur les adhérences des pavés constituant le morceau.
Lemme. Soit I un semi-pavé de Rn , f une fonction de Rn dans Rp intégra-
ble sur I¯ et J son intégrale sur I.
¯ Soit ! > 0 et δ une jauge sur I¯ telle que
l’on ait
|S(I, f, Π) − J|2 ≤ !,
pour toute P-partition δ-fine Π de I. Alors, pour toute famille
{(x1 , K 1 ), . . ., (xq , K q )}
formée de semi-pavés K j mutuellement disjoints contenus dans I et de points

xj ∈ K̄ j tels que
K j ⊂ B∞ [xj , δ(xj )], (1 ≤ j ≤ q),
on a # #
# q 2 J 3#
#$ #
# µ(K )f (x ) −
j j
f ## ≤ !.
#
#j=1 K̄ j #
2
Démonstration. On va montrer que
# #
# q 2 J 3#
#$ #
#
# µ(K )f (x ) −
j j
f ## ≤ ! + η,
#j=1 K̄ j #
2
!q
quel que soit η > 0. On sait que I \ j=1 K j peut s’écrire sous la forme
!r
k=1 L , où les L (1 ≤ k ≤ r) sont des semi-pavés contenus dans I et
k k
¯ l’est aussi sur
mutuellement disjoints. Bien entendu, f , intégrable sur I,
chaque L , et
k
J q J
$ r J
$
f= f+ f.
I¯ j=1 K̄
j
k=1 L̄
k
En conséquence, si η > 0 est donné, il existera une jauge δk sur L̄k , que l’on
peut toujours choisir telle que δk (x) ≤ δ(x), (x ∈ L̄k , 1 ≤ k ≤ r), ayant la
propriété que # J #
# # η
#S(Lk , f, Πk ) − f ## ≤ ,
# k r
L̄ 2
pour toute P-partition δk -fine Πk de Lk , (1 ≤ k ≤ r). Par conséquent, la

famille finie Π formée des (xj , K j ), (1 ≤ j ≤ k), et des éléments des familles
Πk , (1 ≤ k ≤ r) constitue une P-partition δ-fine de I telle que
q
$ r
$
S(I, f, Π) = µ(K j )f (xj ) + S(Lk , f, Πk ).
j=1 k=1
On aura donc, par hypothèse,

# #
# q 2 J 3#
#$ #
#
# µ(K )f (x ) −
j j
f ##
#j=1 K̄ j #
2
# J #
# r
$ r J
$ #
# #
= #S(I, f, Π) − S(Lk , f, Πk ) − f + f#
# I¯ L̄k #
k=1 k=1 2
10.8. LEMME DE SAKS-HENSTOCK 381
# J # r ## J #
# # $ #
≤ ##S(I, f, Π) − f ## + #S(Lk , f, Πk ) −
# f ##
I¯ 2 k=1 L̄k 2
η
≤ !+r = ! + η,
r
Corollaire. Dans les conditions du lemme de Saks-Henstock, si f est réelle,

on a q # J #
$# #
#µ(K j )f (xj ) − f ## ≤ 2!.
#
j=1 K̄ j
Démonstration. Soient K j1 , . . . , K jl (resp. K jl+1 , . . ., K jq ) les K j tels

que J J
µ(K )f (x ) −
j j
f ≥ 0, (resp. µ(K )f (x ) − j j
f < 0).
K̄ j K̄ j
Le théorème précédent s’applique à chaque famille {(xji , K ji ) : 1 ≤ i ≤ l} et

{(xji , K ji ) : l + 1 ≤ i ≤ q} et fournit les inégalités
l ##
$ J #
# l 2
$ J 3
#µ(K ji )f (xji ) − f ## = µ(K ji )f (xji ) − f ≤ !,
#
i=1 K̄ ji i=1 K̄ ji
et
q #
$ J # q 2
$ J 3
# #
#µ(K ji )f (xji ) − f ## = − µ(K ji )f (xji ) − f ≤ !.
#
i=l+1 K̄ ji i=l+1 K̄ ji
La thèse résulte de l’addition membre à membre de ces inégalités.

Le résultat correspondant pour une fonction à valeurs dans Rp s’en déduit
aisément.
Corollaire. Dans les conditions du lemme de Saks-Henstock, on a, avec
i = 1, 2 ou ∞,
q #
$ J #
# #
#µ(K j )f (xj ) − f ## ≤ 2p!.
#
j=1 K̄ j i
Démonstration. En appliquant le corollaire précédent à chaque com-

posante fk de f , qui vérifie aussi les conditions du lemme de Saks-Henstock,
on obtient # J #
q
$ # #
#µ(K j )fk (xj ) − fk ## ≤ 2!, (1 ≤ k ≤ p).
#
j=1 K̄ j
Dès lors, si i = 1, 2 ou ∞, on a
q #
$ J # q #
$ J #
# # # #
#µ(K j )f (xj ) − #
f# ≤ #µ(K j )f (xj ) − f ##
# #
j=1 K̄ j i j=1 K̄ j 1
p #
q $
$ J #
# #
= #µ(K j )fk (xj ) −
# fk ## ≤ 2p!.
j=1 k=1 K̄ j
Enfin, la conséquence suivante du lemme de Saks-Henstock va nous con-

duire à la notion d’intégrabilité absolue.
Corollaire. Soit I un semi-pavé de Rn , f une fonction de Rn dans Rp
intégrable sur I¯ et J son intégrale sur I.
¯ Soit ! > 0 et δ une jauge sur I¯ telle
que l’on ait
|S(I, f, Π) − J|2 ≤ !,
pour toute P-partition δ-fine Π de I. Alors, pour ces mêmes P-partitions
Π = {(x1 , I 1), . . . , (xm, I m)}, on a, si i = 1, 2 ou ∞,
# #
# m #J # #
# $ # # #
#S(I, |f |i, Π) − # f ## # ≤ 2p!.
# # ¯j #
# j=1 I i#
Démonstration. En appliquant les inégalités classiques sur les normes et

le corollaire précédent à la famille Π = {(x1 , I 1 ), . . ., (xm, I m)}, on obtient
# # # #
# m #J # # #m 2 #J # 3#
# $ # # # #$ # # #
#S(I, |f |i, Π) − # f ## #= # µ(I )|f (x )|i − ##
j j
f ## #
# # ¯j # # #
# j=1 I i# #j=1 I¯j i #
m #
$ #J ## m #
$ J #
# # ## # #
≤ #µ(I j )|f (xj )|i − # f ## ## ≤ #µ(I j )f (xj ) − f ## ≤ 2p!.
# # ¯j # ¯j
j=1 I i j=1 I i
10.9 L-intégrabilité sur un pavé

L’intégrabilité d’une fonction f sur un pavé I¯ de Rn n’entraı̂ne pas nécessai-
rement l’intégrabilité de |f |i sur I¯ et l’intégrabilité de |f |i sur I¯ n’entraı̂ne
pas nécessairement celle de f sur I¯ (i = 1, 2 ou ∞). Nous donnerons plus loin
10.9. L-INTÉGRABILITÉ SUR UN PAVÉ 383
des exemples justifiant cette assertion. On va voir que la classe des fonctions
f telles que f et |f |i sont toutes deux intégrables sur I¯ est un sous-ensemble
particulièrement important de l’ensemble des fonctions intégrables sur I, ¯ de
la même manière que le sous-ensemble des séries absolument convergentes
constitue un sous-ensemble particulièrement intéressant de l’ensemble des
séries convergentes. Le dernier corollaire du lemme de Saks-Henstock montre
que, ! > 0 étant donné et δ étant une jauge associée à cet ! par l’intégrabilité
de f sur I,¯ les sommes de Riemann S(I, |f |i, Π) relatives à |f |i et aux P-
partitions δ-finesHΠ = {(x1 , I 1 ), . . ., (xm, I m)} diffèreront de moins de 2p! des
%
quantités m j=1 | I¯j f |i . Cette observation suggère la condition nécessaire et
suffisante suivante pour qu’une fonction f ∈ P (I, ¯ Rp) soit telle que |f |i ∈
¯ R ).
P (I, p
Proposition. Soit I un semi-pavé de Rn , f une fonction de Rn dans Rp

intégrable sur I¯ et i = 1, 2 ou ∞. Alors, |f |i est intégrable sur I¯ si et
seulement si le sous-ensemble de R+
; q #J # <
$# #
Si = #
# f # : {K , . . ., K } ∈ P(I) ,
# 1 q
K̄ l
l=1 i
est majoré, où P(I) désigne l’ensemble de toutes les partitions {K 1 , . . .,

K q } de I en un nombre fini de semi-pavés. En outre, si Si est majoré, alors
J & q #J #'
$ # #
|f |i = sup Si = sup #
# f ## .
I¯ {K 1 ,...,K q }∈P (I) l=1 K̄ l
i
Démonstration. Condition nécessaire. Soit i = 1, 2 ou ∞. Si f et

¯ et si {K 1 , . . . , K q } ∈ P(I), alors f et |f |i sont
|f |i sont intégrables sur I,
intégrables sur chaque K etl
#J # J
# #
#
# f ## ≤ |f |i, (1 ≤ l ≤ q).
K̄ l i K̄ l
Dès lors, en vertu de l’additivité de l’intégrale, on a

q #J
$
# q J
$ J
# #
# f ## ≤ |f |i = |f |i ,
#
l=1 K̄ l i l=1 K̄ l I¯
H
ce qui montre que Si est majoré par I¯ |f |i .
Condition suffisante. i = 1, 2 ou ∞ étant fixé, posons
& q #J #'
$ # #
Ai = sup Si = sup #
# f ## .
K̄ l
{K 1 ,...,K q }∈P (I) l=1 i
Soit ! > 0 donné. Par la caractérisation du supremum, il existe {K 1 , . . . ,

K q } ∈ P(I) tel que
q #J #
! $ ## #
Ai − ≤ f # ≤ Ai .
2 l=1 # K̄ l #i
Par l’intégrabilité de f sur I¯ et le lemme des P-partitions subordonnées, il

existe une jauge δ sur I¯ telle que
# J #
# #
#S(I, f, Π) − f # ≤ !
# # 4p
I¯ 2
pour toute P-partition δ-fine Π de I et telle que, pour chacune de ces P-

partitions Π = {(x1 , I 1 ), . . ., (xm, I m)}, la famille
Π̃ = {(xj , I j ∩ K l ) : I j ∩ K l /= ∅, 1 ≤ l ≤ q, 1 ≤ j ≤ m}
est une P-partition δ-fine de I pour laquelle S(I, |f |i, Π) = S(I, |f |i, Π̃). En
conséquence, on a
# #
q #J # q # J #
! $ ## # $ # $ #
Ai − ≤ f ## = # f ##
2 l=1 # K̄ l i
#
l=1 #{1≤j≤m : I j ∩K l (=∅} K ∩I
l j #
i
q #J #
$ $ # #
≤ # f ## ≤ Ai ,
#
l=1 {1≤j≤m : I j ∩K l (=∅} K l ∩I j
i
et, en vertu du dernier corollaire du lemme de Saks-Henstock,

# #
# $ #J ##
# # ## !
#S(I, |f |i, Π̃) − # ##
# # l j f# # ≤ 2.
# {1≤j≤m, 1≤l≤q : I j ∩K l (=∅}
K ∩I i#
En conséquence, si Π est une P-partition δ-fine de I, on a
|S(I, |f |i, Π) − Ai | = |S(I, |f |i, Π̃) − Ai |

# #
# #J ##
# $ # ##
≤ ##S(I, |f |i, Π̃) − # ##
# l j f# #
# {1≤j≤m, 1≤l≤q : I j ∩K l (=∅}
K ∩I i#
# #
# #J # #
# $ # # # ! !
+#
#
# l j f # − Ai # ≤ 2 + 2 = !.
# # #
#{1≤j≤m, 1≤l≤q : I j ∩K l (=∅} K ∩I i #
Remarque. Les inégalités bien connues entre les trois types de normes
d’un élément de Rp montrent que si Si est majorée pour une des normes, il
l’est pour les deux autres. En conséquence, lorsque f est intégrable sur I, ¯
l’intégrabilité de l’une des fonctions |f |i entraı̂nera celle des deux autres, ce
qui justifie l’indépendance de la définition qui suit par rapport au choix de
la norme | · |2 .
¯ On dit que f est absolument intégrable sur I¯ ou intégrable
définie sur I.
au sens de Lebesgue sur I¯ ou encore L-intégrable sur I¯ si f et |f |2 sont
¯
intégrables sur I.
L’appellation “intégrable au sens de Lebesgue” vient de ce que cette
classe de fonctions fut introduite pour la première fois en 1902 par Henri
Lebesgue à partir d’une définition différente de celle utilisée ici. Toute
fonction L-intégrable sur I¯ y est donc évidemment intégrable. En d’autres
¯ Rp) l’ensemble des fonctions de Rn dans Rp
termes, si l’on désigne par L(I,
¯ on a l’inclusion
L-intégrables sur I,
¯ Rp) ⊂ P (I,
L(I, ¯ Rp).
On montrera plus loin que l’inclusion est stricte. Bien entendu, par définiti-
on, l’intégrabilité et la L-intégrabilité coı̈ncident pour des fonctions positives
¯
sur I.
Une conséquence simple mais importante de la proposition que nous
venons de démontrer est le test de comparaison de L-intégrabilité sui-
vant.
Corollaire. Soit I un semi-pavé de Rn et g une fonction positive intégrable
¯ Alors, toute fonction f de Rn dans Rp intégrable sur I¯ et telle que,
sur I.
¯ on ait
pour i = 1, 2 ou ∞ et chaque x ∈ I,
|f (x)|i ≤ g(x),
¯ et l’on a
est L-intégrable sur I,
J J
|f |i ≤ g.
I¯ I¯
Démonstration. Par hypothèse et par la propriété de restriction, f et g

sont intégrables sur K̄ pour tout semi-pavé K ⊂ I, on a,
#J # J
# #
# f ## ≤ g.
#
K̄ i K̄
Dès lors, si {K 1 , . . . , K q } ∈ P(I), on aura, en utilisant l’additivité de l’inté-

grale,
q #J
$ # q J
$ J
# #
# f ## ≤ g= g.
#
l=1 K̄ l i l=1 K̄
l I¯
H
Donc I¯ g majore l’ensemble Si et la proposition ci-dessus entraı̂ne l’intégra-
bilité de |f |i sur I¯ et l’inégalité
J J
|f |i ≤ g.
I¯ I¯
Ce test de comparaison a plusieurs conséquences intéressantes. La premi-

¯ entre l’intégrabilité et
ère est l’équivalence, pour les fonctions bornées sur I,
la L-intégrabilité.
Corollaire. Soit I un semi-pavé de Rn et f une fonction de Rn dans Rp

¯ Alors f est L-intégrable sur I¯ si et seulement si f
définie et bornée sur I.
¯
est intégrable sur I.
Démonstration. La condition nécessaire est évidente. Pour la condition

suffisante, il existe par hypothèse une constante M ≥ 0 telle que
|f (x)|2 ≤ M
pour tout x ∈ I. ¯ Comme la fonction constante M est intégrable sur I,

¯ la
thèse résulte du test de comparaison.
Comme toute fonction R-intégrable sur I¯ est bornée sur I, ¯ on déduit de

ce corollaire la L-intégrabilité sur I¯ de toute fonction R-intégrable sur I.
¯ En
d’autres termes, on a l’inclusion
¯ Rp) ⊂ L(I,
R(I, ¯ Rp),
et l’inclusion est stricte puisque la fonction de Dirichlet, positive et intégra-

ble sur [0, 1], y est évidemment L-intégrable. Le corollaire montre aussi que
c’est parmi les fonctions non bornées sur I¯ qu’il faudra chercher les éléments
¯ Rp) \ L(I,
de P (I, ¯ Rp).
Une autre conséquence du test de comparaison est le caractère d’espace
vectoriel de L(I,¯ Rp).
Corollaire. Si I est un semi-pavé de Rn , si f et g sont des fonctions de Rn

dans Rp L-intégrables sur I¯ et si c ∈ R, alors f + g et cf sont L-intégrables
¯
sur I.
Démonstration. Par hypothèse, f , g, |f |2 et |g|2 sont intégrables sur I, ¯ et
¯ Rp )
il en est dès lors de même de f + g, |f |2 + |g|2 , cf et |c||f |2, puisque P (I,
est un espace vectoriel. D’ailleurs, pour chaque x ∈ I, ¯ on a
|(f + g)(x)|2 ≤ |f (x)|2 + |g(x)|2 = |f |2 (x) + |g|2(x),

|cf (x)|2 ≤ |c||f (x)|2 = |c||f |2(x).
La thèse résulte alors du test de comparaison.
Le test de comparaison montre aussi que les composantes d’une fonction
L-intégrable sur I¯ y sont L-intégrables.
Corollaire. Si I est un semi-pavé de Rn et f une fonction de Rn dans Rp
¯ Alors f est L-intégrable si et seulement si chaque composante
définie sur I.
fk de f est L-intégrable sur I¯ (1 ≤ k ≤ p).
Démonstration. Condition nécessaire. Par hypothèse et par les pro-
priétés de l’intégrale, f , fk , (1 ≤ k ≤ p) et |f |2 sont intégrables sur I.¯
Comme on a
|fk (x)| ≤ |f (x)|2 ,
pour chaque entier k compris entre 1 et p et tout x ∈ I, ¯ la thèse résulte du
test de comparaison.
Condition suffisante. Par hypothèse, chaque fk et chaque |fk | est inté-
¯ (1 ≤ k ≤ p), et dès lors, par les propriétés de l’intégrabilité, il
grable sur I,
%
en est de même de f et de |f |1 = pk=1 |fk |, et donc de f et de |f |2 .
On peut donc ramener l’étude de la L-intégrabilité sur I¯ des fonctions
de Rn dans Rp à celle de fonctions réelles. Pour celles-ci, on possède une
version raffinée du test de comparaison.
Proposition. Soit f une fonction réelle intégrable sur l’adhérence I¯ d’un
semi-pavé I de Rn . Alors f est L-intégrable sur I¯ si et seulement s’il e-
xiste une fonction réelle g L-intégrable sur I¯ et telle que l’une des conditions
suivantes
f (x) ≤ g(x) ou f (x) ≥ g(x)
soit satisfaite pour tout x ∈ I.¯
Démonstration. Condition nécessaire. Il suffit évidemment de prendre
g = f.
Condition suffisante. Le deuxième cas se ramène au premier en con-

sidérant −f au lieu de f . On a f = g − (g − f ) avec g L-intégrable sur I¯ et
¯ donc L-intégrable sur I.
g − f positive et intégrable sur I, ¯ Comme L(I, ¯ R)
est un espace vectoriel, le résultat est démontré.
Enfin, une application directe de la définition et de la propriété d’additi-

vité des fonctions intégrables fournit la propriété d’additivité pour les
fonctions L-intégrables.

¯ Etant donné {K 1 , . . ., K q } ∈ P(I), f est L-intégrable sur I¯ si
définie sur I.
et seulement si f est L-intégrable sur chaque K̄ l (1 ≤ l ≤ q).
10.10 Exercices
1. Montrer que si f est une fonction de R dans Rp R-intégrable sur [a, b], on
a
J b m 4 5
b−a $ (j − 1)(b − a)
f = lim f a+ .
a m→∞ m m
j=1
2. Si f et g sont deux fonctions de R dans R telles que f soit continue sur

[a, b], g intégrable et positive sur [a, b] et f g intégrable sur [a, b], montrer
qu’il existe c ∈ [a, b] tel que
J b J b
f g = f (c) g.
a a
(Premier théorème de la moyenne du calcul intégral). Suggestion : par le

théorème de Weierstrass, il existera y et z dans [a, b] tels que
J b J b J b
f (y) g≤ f g ≤ f (z) g,
a a a
et la thèse résulte
H
du théorème des valeurs intermédiaires appliqué à la fonc-
tion continue ( ab g)f. Le cas particulier où g = 1 est intéressant.
3. Montrer que si f est uneH fonction réelle définie et croissante sur [a, b],
alors son intégrale indéfinie a· f est convexe sur [a, b].
4. Soit I un semi-pavé de Rn et ϕ une application positive définie sur
l’ensemble des semi-pavés contenus dans I et étendue à toute union finie
10.10. EXERCICES 389
I 1 ∪ . . . ∪ I r de semi-pavés contenus dans I et mutuellement disjoints par la

relation  
r
> r
$
ϕ I j = ϕ(I j ).
j=1 j=1
Montrer que la mesure µ d’un semi-pavé de Rn vérifie cette condition. Si

f est une fonction de Rn dans Rp définie sur I, on dit que f est intégrable
sur I au sens de Perron-Stieltjes par rapport à ϕ s’il existe J ∈ Rp tel que,
pour chaque ! >A0, on puisse
B
trouver une jauge δ sur I tel que, pour toute
P-partition Π = (xj , I j ) 1≤j≤m δ-fine de I, on ait
# #
#m #
#$ #
# ϕ(I j
)f (x j
) − J # ≤ !.
# #
#j=1 #
2
%m
L’expression S(I, ϕ, f, Π) = j=1 ϕ(I j )f (xj ) s’appelle la somme de Rie-
mann-Stieltjes relative à I, ϕ, f et Π. Montrer qu’il existe au plus un J
vérifiant la définition ci-dessus. On l’appelle l’intégrale de Perron-Stieltjes
de f sur I par rapport à ϕ, et on le note
J J J
f dϕ ou f (x) dϕ(x) ou f (x)ϕ(dx).
I¯ I¯ I¯
Si l’on peut prendre la jauge δ constante dans la définition précédente, on

parle d’intégrale de Riemann-Stieltjes. Etudier les propriétés de l’intégrale
qui restent valables dans ce cadre plus général. Un cas particulier important
est celui où n = 1 et où, si I j = ]aj , bj ], on prend
ϕ(I j ) = g(bj ) − g(aj ),
où g est une fonction réelle définieH et croissante sur [a, b]. L’intégrale corres-
pondante est alors souvent notée ab f dg.
5. Si f est une fonction de Rn dans Rp continue sur l’adhérence I¯ du semi-
pavé I de Rn , et si J
|f |2 = 0,
I¯
montrer que f = 0 sur I. ¯ On procédera par l’absurde en notant que l’existen-

¯
ce d’un y ∈ I tel que |f (y)|2 > 0 et la continuité de f entraı̂nent l’existence
d’un semi-pavé J ⊂ I tel que |f (x)|2 ≥ 12 |f (y)|2 pour tout x ∈ J. ¯ On a donc,
si I = J ∪ I 1 ∪ I 2 ∪ . . . ∪ I r , où les I j sont des semi-pavés mutuellement
¯
disjoints de I \ J,
J r J
$ J
0= |f |2 = |f |2 + |f |2
I¯ ¯j
j=1 I J¯
J J
1 µ(J)
≥ |f |2 ≥ |f (y)|2 = |f (y)|2 > 0,
¯
J 2 J¯ 2
6. Soient a > 0 et b > 0 des nombres réels. Démontrer la formule de Gauss
∞ J
$ (−1)k 1 xa−1
= dx.
k=0
a + bk 0 1 + xb
Suggestion : on part de l’identité, valable pour tout x ≥ 0 et tout entier

n ≥ 1,
n−1
xa−1 $ (−1)n xa−1+bn
= x a−1
(−xb )k + ,
1+x b
k=0
1 + xb
et l’on intègre les deux membres sur [0, 1], ce qui donne
J n−1
$ (−1)k
1 xa−1
dx = + Rn ,
0 1 + xb k=0
a + bk
où # J 1 nb+a−1 # #J #
# x # # 1 # 1
# #
|Rn | = #(−1) n
dx #≤ #
# x nb+a−1
dx## = .
# 0 1+x b # 0 a + bn
Donc Rn → 0 lorsque n → ∞. On en déduit en particulier la formule de
Mercator
1 1 (−1)k
log 2 = 1 − + − . . . + + . . ..
2 3 k+1
7. Si c /= 1 est un réel et si a et b sont deux applications de l’intervalle I ⊂ R
dans R, montrer que l’application y : I → R∗+ est solution de l’équation
différentielle de Bernoulli
y $ (x) = a(x)y(x) + b(x)y(x)c,
si et seulement si l’application z = y 1−c est solution sur I de l’équation

différentielle linéaire
z $ (x) = (1 − c)a(x)z(x) + (1 − c)b(x).

8. Soit I ⊂ R un intervalle et g une application continue de I dans R.

Montrer que toute solution y sur I de l’équation différentielle
y $$ (x) = g[y(x)],
(c’est-à-dire toute application y de I dans R deux fois dérivable sur I vérifiant
cette relation sur I) vérifie l’équation différentielle du premier ordre
[y $ (x)]2 = 2[G(y(x)) + C],
où G est une primitive de g sur I et C une constante réelle arbitraire.
9. Montrer que l’équation fonctionnelle de Cauchy
f (x + y) = f (x) + f (y), (x ∈ R, y ∈ R),
où l’inconnue f est une fonction continue, a pour solutions les fonctions
f (x) = cx, (c ∈ R). Suggestion. En prenant x = y = 0, on voit que
f (0) = 0. En intégrant les deux membres de l’égalité par rapport à y, x
étant fixé, on trouve
J 1 J 1
f (x + y) dy = f (x) + f (y) dy,
0 0
et donc, par l’invariance de l’intégrale pour une translation,
J x+1 J 1 J x+1 J x J 1
f (x) = f (u) du− f (y) dy = f (u) du− f (u) du− f (y) dy.
x 0 0 0 0
Donc f est dérivable et, pour tout x ∈ R,

f $ (x) = f (x + 1) − f (x) = f (1),
ce qui entraı̂ne f (x) = f (1)x.

Je ne ferai d’aucune difficulté d’user de cette expression la somme des or-
données qui semble ne pas être géométrique à ceux qui n’entendent pas la doc-
trine des indivisibles, et qui s’imaginent que c’est pécher contre la géométrie
que d’exprimer un plan par un nombre infini de lignes; ce qui ne vient que
de leur manque d’intelligence puisqu’on n’entend autre chose par là sinon
la somme d’un nombre indéfini de rectangles faits de chaque ordonnée avec
de petites portions égales du diamètre, dont la somme est certainement un
plan, qui ne diffère de l’espace du demi-cercle que d’une quantité moindre
qu’aucune donnée.
Blaise Pascal, 1660

Nous avons déjà noté que les distances aj − aj−1 , par lesquelles x est
supposé croı̂tre successivement, doivent être prises très petites pour que les
valeurs correspondantes f (aj−1 ), f (aj ) ne diffèrent à leur tour guère l’une
de l’autre; à partir de cela, il faut juger si les intervalles a1 − a, a2 − a1 , . . .
doivent être pris égaux ou inégaux. En fait, là où la valeur de f (x) ne change
guère lorsque x varie, l’intervalle par lequel x croı̂t peut être pris grand sans
danger. D’autre part, là où des changements peu importants de x conduisent
à des variations violentes de f (x), on devra prendre l’intervalle très petit.
Je considère chaque intégrale comme étant juste la somme des valeurs
infiniment petites de l’expression différentielle placée sous le signe intégrale,
qui correspond aux différentes valeurs de la variable incluses entre les limites
en question. Quand on adopte cette manière de regarder l’intégrale définie,
on prouve aisément qu’une telle intégrale a une valeur unique et finie lorsque,
les deux limites de la variable étant finie, les intégrands restent finis et con-
tinus entre ces limites. Il me semble que cette manière de regarder une
intégrale définie devrait être adoptée de préférence, comme je l’ai fait, parce
qu’elle vaut également pour tous les cas, même ceux dans lesquels nous ne
pouvons pas passer généralement de la fonction sous le signe intégral à la
fonction primitive.
L’incertitude qui règne encore sur quelques points fondamentaux de la
théorie des intégrales définies nous oblige à placer ici quelques remarques
sur la notion de l’intégrale définie, et sur Hla généralité dont elle est suscep-
tible. Et d’abord que doit-on entendre par ab f (x) dx? Pour répondre à cette
question, prenons entre a et b une série de valeurs x1 , x2 , . . . , xn−1 rangées
par ordre de grandeur, depuis a jusqu’à b, et désignons pour abréger x1 − a
par δ1 , x2 − x1 par δ2 , . . ., b − xn−1 par δn ; soient en outre !i des nombres
positifs plus petits que l’unité. Il est clair que la valeur de la somme
S = δ1 f (a + !1 δ1 ) + δ2 f (x1 + !2 δ2 ) + . . . + δn f (xn−1 + !n δn )
dépendra du choix des intervalles δ et des fractions !. Si elle a la propriété,

de quelque manière que les δ et les ! puissent être choisis, de s’approcher
indéfiniment d’une limite fixe A, quand les δ Htendent tous vers zéro, cette
limite s’appelle la valeur de l’intégrale définie ab f (x) dx.
Bernard Riemann, 1854
Dans le cas des fonctions continues, il y a identité entre les notions

d’intégrale et de fonction primitive. Riemann a défini l’intégrale de cer-
taines fonctions discontinues, mais toutes les fonctions dérivées ne sont
pas intégrables au sens de Riemann. Le problème des fonctions primitives
n’est donc pas résolu par l’intégration, et l’on peut désirer une définition de
l’intégrale comprenant comme cas particulier celle de Riemann et permettant
de résoudre le problème des fonctions primitives.
Henri Lebesgue, 1901
Un caractère important de la définition de Riemann est le suivant: la di-

vision en intervalles est entièrement indépendante des propriétés de la fonc-
tion; si l’on considère deux fonctions différentes, on prendra pour ces fonc-
tions les mêmes intervalles, c’est-à-dire qu’on leur appliquera un procédé
de calcul uniforme. C’est évidemment là un grand avantage pour le calcul;
mais c’est en même temps un inconvénient : un tel procédé qui ne tient pas
compte des propriétés particulières de la fonction à laquelle il s’applique peut
être comparé à ces vêtements confectionnés, qui ne sauraient être exactement
ajustés, surtout s’il s’agit d’habiller un individu difforme : certaines fonc-
tions singulières ont pu être justement comparées aux types monstrueux de
la biologie.
Emile Borel, 1909
Intégrer, c’est pousser à l’infini les deux règles conjointes de Descartes :

d’abord diviser la difficulté pour la mieux résoudre, ensuite recomposer cette
désagrégation préliminaire. Dans une masse étendue, une cause s’exerce, un
effet s’accomplit. Si l’intensité des phénomènes était constante aux divers
points, les résultats se manifesteraient proportionnels à cette intensité et à
cette masse à la fois. Un simple produit des facteurs les livrerait. Mais si
ces intensités sont fluctuantes, comment évaluer leur concours total ? Par la
pensée, on partage le corps en éléments tellement réduits et ainsi disposés que
sur chacun d’entre eux l’action et sa conséquence, rapportées l’une et l’autre
à la mesure de la parcelle, ne présentent plus de variation appréciable. Les
évaluer est donc immédiat. Additionner ensemble des infiniment petits, pour
calculer le phénomène total, c’est procéder à une intégration. Le tout est de
prendre la partition préalable par le bon biais.
Arnaud Denjoy, 1920

Presque tout étudiant de premier cycle en mathématique, physique ou sci-

ences de l’ingénieur étudie assez d’analyse pour rencontrer les intégrales de
Riemann, les intégrales “impropres”, les intégrales de lignes et de surfaces,
bref, tous les types d’intégration du dix-neuvième siècle. Mais le vingtième
siècle a produit des progrès en théorie de l’intégration qui furent indispen-
sables pour l’analyse et se révélèrent plus tard magnifiquement adaptés à la
théorie des probabilités et à des applications comme la théorie quantique, la
théorie de la communication et le contrôle optimal de systèmes perturbés de
manière aléatoire. Pour toutes ces applications et pour beaucoup d’autres,
il convient de connaı̂tre les idées associées à la théorie de l’intégrale de
Lebesgue. Une solution logiquement fondée mais pédagogiquement inaccep-
table consiste à écarter l’intégrale de Riemann et enseigner l’intégrale de
Lebesgue dès le début du cours d’analyse. Mais ce choix ignore l’évidence
expérimentale que les différentes manières usuelles d’introduire l’intégrale
de Riemann sont toutes considérées par les étudiants comme plus naturelles
et plus facilement comprises que n’importe laquelle des manières usuelles
d’introduire l’intégrale de Lebesgue. Une voie pour sortir de cette impasse
apparente fut ouverte en 1957, lorsque J. Kurzweil publia pour l’intégrale
d’une fonction d’une variable une définition qui ressemblait fortement à celle
de Riemann, et était pourtant plus générale; en fait, l’intégrale de Kurzweil
est plus générale que celle de Lebesgue.
Edward J. McShane, 1983

Chapitre 11
Intégrale sur un intervalle et

séries
11.1 Théorème de Hake

Soit I = ]a, b] un semi-intervalle de R et f une fonction de R dans Rp
¯ Montrons d’abord que son intégrale indéfinie est continue
intégrable sur I.
¯
sur I.
H·
Proposition. Si f est intégrable sur [a, b], alors af est continue sur [a, b].
Démonstration. Soit c ∈ [a, b] et ! > 0; il faut montrer l’existence d’un
η > 0 tel que #J x J c #
# #
# f− f ## ≤ !
#
a a 2
lorsque x ∈ [a, b] et |x−c| ≤ η, c’est-à-dire, en vertu des propriétés d’additivi-
té de l’intégrale, tel que #J #
# x #
# f ## ≤ !,
#
c 2
pour ces mêmes x. Pour cet ! > 0, il existe une jauge δ sur [a, b] telle que
# J b ##
#
# #
#S(I, f, Π) − f # ≤ !/2
# a #
2
pour toute P-partition δ-fine Π de I. Prenons

U V
!
η = min δ(c), ,
2[1 + |f (c)|2 ]
395
396 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES
et soit x ∈ [a, b] tel que |x − c| ≤ η. Alors, si x < c, on a
[x, c] ⊂ [c − η, c] ⊂ [c − δ(c), c + δ(c)],
et, pour x > c, on a de même
[c, x] ⊂ [c, c + η] ⊂ [c − δ(c), c + δ(c)].
Le lemme de Saks-Henstock appliqué, selon le cas, à {(c, ]x, c])} ou à

{(c, ]c, x])} entraı̂ne que
#J c #
# #
# f − f (c)(c − x)## ≤ !/2,
#
x 2
ou #J #
# x #
#
# f − f (c)(x − c)## ≤ !/2,
c 2
d’où l’on déduit aussitôt

#J #
#
#
x # !|f (c)|2
# f ## ≤ !/2 + |f (c)|2 |x − c| ≤ !/2 + < !,
c 2 2[1 + |f (c)|2]
Cette proposition et la propriété de restriction de l’intégrale impliquent

aussitôt que si f est intégrable sur [a, b], alors f est intégrable sur [a, c] pour
chaque c ∈ ]a, b[ et l’on a
J c J b
lim f= f.
c→b− a a
Nous allons montrer que cette condition nécessaire d’intégrabilité sur [a, b]
est également suffisante. Ce résultat, qui est très utile pour l’obtention de
tests pratiques d’intégrabilité sur un intervalle, porte le nom de théorème
de Hake. Il n’est pas valable pour la R-intégrabilité ou la L-intégrabilité
car l’existence de la limite du membre de gauche dans l’égalité ci-dessus
n’entraı̂ne pas nécessairement la R- ou la L-intégrabilité sur [a, b] de f ,
c’est-à-dire l’existence du membre de droite. Dans le cadre de ces types
d’intégration, cette limite doit être et est appelée intégrale impropre ou
intégrale généralisée.
11.1. THÉORÈME DE HAKE 397
Théorème. Soit f une fonction de R dans Rp définie sur [a, b]. Si f est
intégrable sur [a, c] pour chaque c ∈ ]a, b[ et si
J c
lim f = J,
c→b− a
alors f est intégrable sur [a, b] et

J b
f = J.
a
Démonstration. Soit ! > 0; nous allons construire une jauge δ sur [a, b]
telle que
|S(]a, b], f, Π) − J|2 ≤ !
dès que Π est une P-partition δ-fine de ]a, b]. Si nous posons aj = b − 2−j (b −
a), (j ∈ N), alors a0 = a, a < aj < aj+1 
[a, b[ = [aj , aj+1 [.
j∈N
Dès lors, la fonction f est intégrable sur [aj , aj+1 ] pour chaque j ∈ N et il
existe donc une jauge δj sur [aj , aj+1 ] telle que
# J aj+1 ##
# !
# #
#S(]aj , aj+1 ], f, Πj ) − f # ≤ j+2 ,
# aj # 2 2
pour toute P-partition δj -fine Πj de ]aj , aj+1 ], (j ∈ N). D’ailleurs, puisque
f (b)(b − c) → 0 si c → b, c < b,
il existe, par hypothèse, un η > 0 tel que

#J c
#
# #
# f − J + f (b)(b − c)## ≤ !/2,
#
a 2
pour tout c ∈ [b − η, b[. Définissons comme suit la jauge δ sur [a, b] :
δ(a) = min[δ0 (a), a1 − a],
δ(x) = min[δj (x), x − aj , aj+1 − x] si x ∈ ]aj , aj+1 [, (j ∈ N),

δ(aj ) = min[δj−1 (aj ), δj (aj ), aj − aj−1 ], (j ∈ N∗ ),
δ(b) = η.
Par un raisonnement strictement analogue à celuiA utilisé Bdans le lemme des

P-partitions subordonnées, on voit que si Π = (xj , I j ) 1≤j≤m est une P-
partition δ-fine de ]a, b] telle que xj ≤ xj+1 , (1 ≤ j ≤ m − 1), alors, pour
chaque k ∈ N,
Πk = {(xj , I j ∩ ]ak , ak+1 ]) : I j ∩ ]ak , ak+1 ] /= ∅, 1 ≤ j ≤ m}
est une P-partition δk -fine de ]ak , ak+1 ] et

$
S(]ak , ak+1 ], f, Πk ) = µ(I j ∩ ]ak , ak+1 ])f (xj ).
{1≤j≤m:I j ∩ ]ak ,ak+1 ](=∅}
D’autre part, pour toute P-partition δ-fine Π de ]a, b] comme ci-dessus, on

a nécessairement xm = b puisque, si xm < b il existera r ∈ N tel que
xm ∈ [ar , ar+1 [, et donc, par construction de la jauge δ, tel que I m = ]d, b] ⊂
[ar−1 , ar+1 ] ⊂ [ar−1 , b[, ce qui est contradictoire. Désignons par q le plus
petit entier naturel tel que
m−1
>
I j ⊂ ]a, aq+1 ].
j=1
On a donc # #
#m #
#$ #
|S(I, f, Π) − J|2 = ## µ(I j )f (xj ) − J ##
#j=1 #
2
#
#q−1
#$ $
= ## µ(I j ∩ ]ak , ak+1 ])f (xj )
#k=0 {1≤j≤m:I j ∩ ]a
k ,ak+1 ](=∅}
$
+ µ(I j ∩ ]aq , d])f (xj ) + (b − d)f (b)
{1≤j≤m:I j ∩ ]aq ,d](=∅}
#
#
$ J ak+1
q−1 J d J d #
− f− f+ f − J ##
k=0 ak aq a #
2
# #
#q−1 2 J ak+1 3#
#$ #
≤ ## S(]ak , ak+1 ], f, Πk ) − f ##
#k=0 ak #
2
# #
# $ J d #
# #
+ ## µ(I ∩ ]aq , d])f (x ) −
j j
f ##
#{1≤j≤m:I j ∩ ]aq ,d](=∅} aq #
2
11.2. INTÉGRALE SUR UN INTERVALLE BORNÉ 399
#J #
# d #
# #
+# f − J + (b − d)f (b)# .
# a #
2
Le premier et le dernier terme de cette expression ont déjà été estimés. Pour
celui du milieu, il suffit de remarquer que la famille
{(xj , I j ∩ ]aq , d]) : I j ∩ ]aq , d] /= ∅, 1 ≤ j ≤ m}
vérifie les conditions du lemme de Saks-Henstock pour f et δq sur ]aq , aq+1 ].

En conséquence, on aura
q−1
$ ! ! !
|S(I, f, Π) − J|2 ≤ + + < !,
k=0
2k+2 2q+2 2

On démontre d’une manière strictement analogue le théorème de Hake
correspondant à l’autre extrémité de l’intervalle.
Théorème. Soit f une fonction de R dans Rp définie sur [a, b]. Si f est
intégrable sur [c, b] pour chaque c ∈ ]a, b[ et si
J b
lim f = J,
c→a+ c
alors f est intégrable sur [a, b] et

J b
f = J.
a
11.2 Intégrale sur un intervalle borné

Il est important de noter que les hypothèses du théorème de Hake ne font
pas intervenir, dans le premier cas, la valeur de la fonction f en b et, dans
le second cas, la valeur de f en a. Par conséquent, si f est une fonction de
R dans Rp définie sur I = [a, b[ ou sur I = ]a, b], chaque prolongement de f
à [a, b] sera intégrable sur [a, b] si un seul d’entre eux l’est, et tous auront la
même intégrale. Cette remarque justifie la définition suivante d’intégrabilité
sur un semi-intervalle borné [a, b[ ou ]a, b].
Définition. Soit f une fonction de R dans Rp définie sur [a, b[ (resp. ]a, b]).
On dira que f est intégrable sur [a, b[ (resp. ]a, b]) s’il existe un prolongement
f˜ de f à [a, b] qui est intégrable

H
sur [a, b], auquel
H
cas l’intégrale
H
de f sur
Hb
[a, b[
˜
(resp. ]a, b]) sera définie par [a,b] f et notée [a,b[ f (resp. ]a,b] f ) ou a f .
H
Il n’y a pas d’ambiguité dans la notation ab f puisque, lorsque f est
définie et intégrable sur [a, b], les trois notions coı̈ncident.
Exemples. 1. Soit b ∈ R et f la fonction définie par
f (x) = (b − x)−p ,
où p > 0. La fonction f est primitivable sur ]−∞, b[ et l’une de ses primitives
est donnée par la fonction F définie par F (x) = (p − 1)−1 (b − x)1−p si p /= 1
et F (x) = − ln(b − x) si p = 1. En conséquence, si a < b est donné, f est
intégrable sur [a, c] quel que soit c ∈ ]a, b[ et
J c
f = (p − 1)−1 [(b − c)1−p − (b − a)1−p ]
a
si p /= 1 et J c
f = ln(b − a) − ln(b − c)
a
si p = 1. Le théorème de Hake montre alors que f est intégrable sur [a, b[ si

et seulement si p < 1, auquel cas
J b
(b − x)−p dx = (1 − p)−1 (b − a)1−p.
a
2. Soit a ∈ R et f la fonction définie par
f (x) = (x − a)−p ,
où p > 0. La fonction f est primitivable sur ]a, +∞[ et l’une de ses primitives
est donnée par la fonction F définie par F (x) = (1 − p)−1 (x − a)1−p si p /= 1
et F (x) = ln(x − a) si p = 1. En conséquence, si b > a est donné, f est
intégrable sur [c, b] quel que soit c ∈ ]a, b[ et
J b
f = (1 − p)−1 [(b − a)1−p − (c − a)1−p ]
c
si p /= 1 et
J b
f = ln(b − a) − ln(c − a)
c
si p = 1. Le théorème de Hake montre alors que f est intégrable sur ]a, b] si

et seulement si p < 1, auquel cas
J b
(x − a)−p dx = (1 − p)−1 (b − a)1−p .
a
On peut également définir l’intégrabilité d’une fonction définie sur un
intervalle ouvert borné ]a, b[.
Définition. Soit f une fonction de R dans Rp définie sur un intervalle ouvert
borné ]a, b[. On dit que f est intégrable sur ]a, b[ s’il existe un c ∈]a, b[ tel que
f soit intégrable sur ]a, c]
H
et intégrable
H
sur [c, b[. S’il en est ainsi, l’intégrale
de f sur ]a, b[ est notée ]a,b[ f ou ab f et définie par
J b J c J b
f= f+ f.
a a c
L’additivité de l’intégrale usuelle entraı̂ne aisément que si un c ∈ ]a, b[

existe pour lequel la condition de la définition est vérifiée, alors elle le sera
pour tout autre c$ ∈ ]a, b[, avec la même valeur de l’intégrale. On peut
aussi vérifier aisément que f est intégrable sur ]a, b[ si et seulement si f est
intégrable sur [c, d] quels que soient c < d contenus dans ]a, b[ et
J d
lim f
(c,d)→(a,b),c>a,d<b c
existe.
Les propriétés élémentaires de l’intégrale (linéarité, propriétés d’or-
dre, passage aux composantes, comportement par rapport à une translation
ou une homothétie) et les propriétés d’additivité et de restriction s’é-
tendent immédiatement, à partir des définitions et des propriétés correspon-
dantes de l’intégrale ordinaire, aux intégrales sur un semi-intervalle ou sur
un intervalle ouvert bornés.
Le théorème fondamental du calcul différentiel et intégral peut
être étendu à l’intégration sur un intervalle borné quelconque.
Proposition. Soit f une fonction de R dans Rp primitivable sur ]a, b[ et F
une primitive de f sur ]a, b[. Si
lim F (c) et lim F (c)
c→a+ c→b−
existent, alors f est intégrable sur ]a, b[ et

J b
f = lim F (c) − lim F (c).
a c→b− c→a+
Démonstration. La fonction f , primitivable sur ]a, b[, l’est sur [c, c$] quels
que soient c < c$ dans ]a, b[ et dès lors, par le théorème fondamental du calcul
différentiel et intégral et l’additivité de l’intégrale, si d ∈ ]a, b[ est fixé et si
c < d < c$ , f est intégrable sur [c, d] et sur [d, c$] et l’on a
J d J c"
f = F (d) − F (c), f = F (c$ ) − F (d).
c d
Comme, par hypothèse,

J d
lim f = lim [F (d) − F (c)] = F (d) − lim F (c),
c→a+ c c→a+ c→a+
et J c"
"
lim f = "lim [F (c$ ) − F (d)] = "lim F (c$ ) − F (d),
c →b− d c →b− c →b−
le théorème de Hake entraı̂ne l’intégrabilité de f sur ]a, d] et sur [d, b[, avec
J d J b
f = F (d) − lim F (c), f = "lim F (c$ ) − F (d),
a c→a+ d c →b−
et la thèse résulte de la définition de l’intégrabilité de f sur ]a, b[ et de celle

de son intégrale sur cette intervalle.
Exemple. Les considérations que nous venons de développer permettent
de donner un exemple de fonction intégrable sur un intervalle sans y être
L-intégrable. Soit f la fonction de R dans R définie par
1 2 1
f (x) = 2x sin − cos 2 si x /= 0, f (0) = 0.
x2 x x
On a vu précédemment que f était la dérivée de la fonction F définie par
1
F (x) = x2 sin si x /= 0, F (0) = 0.
x2
En particulier, f est intégrable sur [0, b] quel que soit b > 0 et
J b 1
f = b2 sin .
0 b2
Si nous définissons les fonctions g et h sur R par
2 1
g(x) = cos 2 si x /= 0, g(0) = 0,
x x
1
h(x) = 2x sin si x /= 0, h(0) = 0,
x2
nous constatons immédiatement que h, continue sur R, sera intégrable sur
[0, b] quel que soit b > 0, et il en sera dès lors de même de g = h − f.
En particulier, g est intégrable sur [0, 1]. Nous allons montrer que |g| n’est
pas intégrable sur [0, 1], ce qui entraı̂nera que g ∈ P ([0, 1], R) \ L([0, 1], R).
Notons tout d’abord que |g|, continue sur [c, 1] quel que soit c ∈ ]0, 1[, est
primitivable sur [c, 1]. Le théorème d’intégration par substitution s’applique
donc à |g| sur chaque intervalle [((k + 1)π)−1/2, (kπ)−1/2], (k ∈ N∗ ), et
fournit, en effectuant la substitution x2 2→ y1 ,
J (kπ)−1/2
# # J
2 ## 1# (k+1)π | cos y|
cos 2 ## dx = dy.
((k+1)π)−1/2 x# x kπ y
D’autre part,
J J
(k+1)π | cos y| 1 (k+1)π 2
dy ≥ | cos y| dy =
kπ y (k + 1)π kπ (k + 1)π
J J
2 k+2 dy 2 k+2 dy
= ≥ .
π k+1 k+1 π k+1 y
Dès lors, pour tout entier n ≥ 0, on a
J 1 J 1 n J
$ (kπ)−1/2
|g| = |g| + |g|
((n+1)π)−1/2 π−1/2 k=1 ((k+1)π)
−1/2
J n J k+2 J 1 J
1 2$ dy 2 n+2 dy
≥ |g| + = |g| +
π−1/2 π k=1 k+1 y π−1/2 π 2 y
J 4 5
1 2 n+2
= |g| + ln .
π−1/2 π 2
H
Il en résulte aussitôt que limc→0+ c1 |g| n’existe pas et |g| n’est pas intégrable
sur [0, 1].
On peut aussi étendre à l’intégrabilité sur un intervalle borné quel-
conque la formule d’intégration par parties. Nous traiterons le cas
de l’intégration sur ]a, b[, l’adaptation à ]a, b] ou à [a, b[ étant aisée.
Proposition. Soient f et g deux fonctions de R dans K dérivables sur ]a, b[.

Si f $ g est intégrable sur ]a, b[ et si limx→a+ f (x)g(x) et limx→b− f (x)g(x)
existent, alors f g $ est intégrable sur ]a, b[ et l’on a
J b J b
f g $ = lim f (c)g(c) − lim f (c)g(c) − f $ g.
a c→b− c→a+ a
Démonstration. Soit d ∈ ]a, b[ fixé et soient c et c$ tels que a < c < d <
c < b. Par hypothèse, f $ g est intégrable sur [c, d] et sur [d, c$] et la formule
$
d’intégration par parties entraı̂ne l’intégrabilité de f g $ sur ces intervalles et

les formules J J
d d
f g $ = f (d)g(d) − f (c)g(c) − f $ g,
c c
J c" J c"
f g $ = f (c$ )g(c$) − f (d)g(d) − f $ g.
d d
Par hypothèse, on a alors

J d J d
lim f g $ = f (d)g(d) − lim f (c)g(c) − f $ g,
c→a+ c c→a+ a
J c" J b
"
lim f g $ = "lim f (c$ )g(c$) − f (d)g(d) − f $ g.
c →b− d c →b− d
L’intégrabilité de f g $ sur ]a, b[ et la formule correspondante d’intégration par

parties résulte alors d’une double application du théorème de Hake et de la
définition d’intégrabilité sur ]a, b[.
Exemple. La fonction h définie sur R∗+ par h(x) = ln x est intégrable sur
]0, b] quel que soit b > 0. En effet, ln x = (x)$ ln x et dès lors si l’on pose
f (x) = ln x et g(x) = x, on a h = f g $ et (f $ g)(x) = 1, (f g)(x) = x ln x pour
tout x. Donc f $ g est intégrable sur [0, b] et, par le théorème de l’Hospital,
lim (f g)(x) = 0,
x→0+
tandis que f g est continue en b. Par conséquent, ln est intégrable sur [0, b]
et J b
ln x dx = b ln b − b.
0
On peut évidemment définir une notion de L-intégrabilité sur des inter-

valles bornés quelconques.
Définition. Soit I = [a, b[, ]a, b], ou ]a, b[ et f une fonction de R dans
Rp définie sur I. On dira que f est intégrable au sens de Lebesgue ou L-
intégrable ou absolument intégrable sur I si f et |f |2 sont intégrables sur
I.
Les propriétés élémentaires de la L-intégrale, ainsi que les propriétés
d’additivité et de restriction s’étendent immédiatement à ce nouveau type
d’intégrale. Bien que le théorème de Hake ne soit pas vrai, comme on l’a
déjà remarqué plus haut, pour la L-intégrabilité, c’est-à-dire si l’on remplace
partout “intégrable” par “L-intégrable”, il en existe une version plus restric-
tive qui fait intervenir l’intégrale indéfinie de |f |2 . Donnons ce théorème
de Hake pour la L-intégrabilité, pour fixer les idées, dans le cas d’un
intervalle de type [a, b[, les autres cas étant analogues.
Proposition. Soit f une fonction de R dans Rp définie sur [a, b[. Alors f
est L-intégrable sur [a, b[ si et seulement si f est L-intégrable sur [a, c] quel
que soit c ∈ ]a, b[ et si
J c
lim |f |2
c→b− a
existe.
Démonstration. Condition nécessaire. Si f est L-intégrable sur [a, b[,
alors, par définition, il existe un prolongement f˜ de f à [a, b] tel que f˜
˜ 2 soient intégrables sur [a, b]. En conséquence, par la continuité de
et |f|
H H
l’intégrale indéfinie, limc→b− ac |f |2 = limc→b− ac |f˜|2 existe.
Condition
Hc
suffisante. Par le théorème de Hake, il suffit de montrer que
limc→b− a f existe, ce qui sera le cas si la condition de Cauchy correspondant
à cette limite est vérifiée. Or, si a < c < c$ < b, on a
#J " # J c"
# c #
# #
# f# ≤ |f |2 ,
# c # c
2
et la thèse résulte de ce que l’intégrale indéfinie de |f |2 vérifie la condition

de Cauchy pour la limite en b.
On a un test de comparaison pour la L-intégrabilité sur [a, b[.
Proposition. Soit g une fonction de R dans R+ intégrable sur [a, b[ et f
une fonction de R dans Rp définie sur [a, b[ et intégrable sur [a, c] quel que
soit c ∈ ]a, b[. Si
|f (x)|2 ≤ g(x)
pour tout x ∈ [a, b[, alors f est L-intégrable sur [a, b[.
Démonstration. La dernière hypothèse et le test de comparaison classique

entraı̂nent la L-intégrabilité de f sur [a, c] quel que soit c ∈ ]a, b[. En outre,
quels que soient c < c$ dans ]a, b[, on a
J c" J c"
|f |2 ≤ g.
c c
H
Comme g est intégrable sur [a, b[, limc→b− ac g existe et la condition de
Cauchy correspondante est donc satisfaite. En conséquence, elle l’est aussi
pour l’intégrale indéfinie de |f |2 et la thèse résulte de la proposition précé-
dente.
On démontre d’une manière strictement analogue le résultat pour ]a, b]

et le cas de ]a, b[ s’en déduit alors aisément.
Proposition. Soit g une fonction de R dans R+ intégrable sur ]a, b] et f

une fonction de R dans Rp définie sur ]a, b], intégrable sur [c, b] quel que soit
c ∈ ]a, b[. Si
|f (x)|2 ≤ g(x)
pour tout x ∈ ]a, b], alors f est L-intégrable sur ]a, b].
Proposition. Soit g une fonction de R dans R+ intégrable sur ]a, b[ et f

une fonction de R dans Rp définie sur ]a, b[, intégrable sur [a, c] quel que soit
c ∈ ]a, b[. Si
|f (x)|2 ≤ g(x)
pour tout x ∈ ]a, b[, alors f est L-intégrable sur ]a, b[.
Une première conséquence du test de comparaison est le résultat suivant.
Corollaire. Soit I = [a, b[ (resp. ]a, b]) et f une fonction de R dans Rp

définie sur I et intégrable sur [a, c] (resp. [c, b]) quel que soit c ∈ ]a, b[. Si,
pour i = 1, 2 ou ∞, |f |i est intégrable sur I, alors f est L-intégrable sur I.
Démonstration. Il suffit de prendre g = |f |i dans le test de comparaison.
Une deuxième conséquence du test de comparaison est le test de la

limite pour l’intégrabilité de fonctions positives.
Corollaire. Soit I = [a, b[ (resp. ]a, b]) et f et g deux fonctions de R dans

R+ définies sur I et intégrables sur [a, c] (resp. [c, b]) quel que soit c ∈ ]a, b[.
Supposons que, pour tout x ∈ I, on ait g(x) > 0 et que
f (x) f (x)
lim (resp. lim )
x→b− g(x) x→a+ g(x)
existe au sens large et soit notée d.

1. Si d = 0 et si g est intégrable sur I, alors f est intégrable sur I.
2. Si d > 0 est fini, alors f est intégrable sur I si et seulement si g est
intégrable sur I.
3. Si d = +∞ et si f est intégrable sur I, alors g est intégrable sur I.
Démonstration. Considérons, pour fixer les idées, le cas où I = [a, b[,
l’autre se traitant de même. Dans le cas de l’hypothèse 1, il existe c ∈ ]a, b[
tel que, pour tout x ∈ [c, b[, on ait fg(x)
(x)
≤ 1 et dès lors 0 ≤ f (x) ≤ g(x). Par
hypothèse et par le test de comparaison, f est alors intégrable sur [c, b[, et
donc sur [a, b[ puisqu’elle l’est déjà sur [a, c]. Dans le cas de l’hypothèse 2,
en prenant ! = d/2 dans la définition de la limite, il existe c ∈ ]a, b[ tel que,
pour tout x ∈ [c, b[, on ait
d f (x) d
− ≤ −d≤ ,
2 g(x) 2
et dès lors 4 5 4 5
d 3d
0≤ g(x) ≤ f (x) ≤ g(x).
2 2
Comme les fonctions ( d2 )g, ( 3d
2 )g et g sont simultanément intégrables sur I,
la thèse en résulte en appliquant deux fois le test de comparaison. Enfin,
dans le cas de l’hypothèse 3, il existe c ∈ ]a, b[ tel que, pour tout x ∈ [c, b[,
on ait f (x) > 0. En outre, l’hypothèse équivaut à
g(x)
lim = 0,
x→b− f (x)
et il suffit d’appliquer la première partie du résultat en permutant le rôle de

f et g.
Exemple. Si a > 0 et b > 0, la fonction f donnée par
f (x) = xa−1 (1 − x)b−1

est définie sur ]0, 1[ et telle que

f (x) f (x)
lim = 1, lim = 1.
x→0+ x a−1 x→1− (1 − x)b−1
On a vu précédemment que la fonction x 2→ xa−1 est intégrable sur ]0, 1] et

que la fonction x 2→ (1 − x)b−1 est intégrable sur [0, 1[. Le test de la limite
entraı̂ne alors l’intégrabilité de f sur ]0, d] et sur [d, 1[ quel que soit d ∈ ]0, 1[,
et donc l’intégrabilité de f sur ]0, 1[. L’intégrale correspondante
J 1
xa−1 (1 − x)b−1 dx
0
s’appelle l’intégrale d’Euler de première espèce et se note B(a, b) (lire “bêta

majuscule” de (a, b)). On notera que, quels que soient c < d dans ]0, 1[, le
changement de variable x = 1 − y sur [c, d] entraı̂ne l’égalité
J d J 1−c
xa−1 (1 − x)b−1 dx = (1 − y)a−1y b−1 dy,
c 1−d
et dès lors, si c → 0+ et d → 1−, on obtient l’égalité
B(a, b) = B(b, a)
quels que soient a > 0 et b > 0.

On peut combiner le test de comparaison que nous venons d’obtenir avec
la formule d’intégration par parties pour obtenir d’utiles tests d’intégrabi-
lité pour des produits de fonctions. Ils se fondent sur le lemme suivant.
Lemme. Soit I = [a, b[ (resp. ]a, b]), f et g des fonctions de R dans K
définies sur I et vérifiant les conditions suivantes.
1. f g est intégrable sur [a, c] (resp. [c, b]) quel que soit c ∈ H]a, b[. H
2. f est primitivable sur I et son intégrale indéfinie F = a· f (resp. ·b f )
est bornée sur I.
3. g est dérivable sur I.
4. g $ est L-intégrable sur I.
Alors f g est intégrable sur I si et seulement si
5. limc→b− F (c)g(c) (resp. limc→a+ F (c)g(c)) existe.
Démonstration. Considérons, pour fixer les idées, le cas où I = [a, b[.
Par la formule d’intégration par parties sur [a, c], avec c ∈ ]a, b[, on a
J c J c
f g = F (c)g(c) − F (a)g(a) − F g$.
a a
L’hypothèse 2 entraı̂ne l’existence d’un M ≥ 0 tel que |F (x)| ≤ M pour

tout x ∈ I, et dès lors, pour les mêmes x, |F (x)g $(x)| ≤ M |g $ (x)|. Comme
M |g $ | est intégrable sur I par l’hypothèse 4, le test de comparaison entraı̂ne
la L-intégrabilité de F g $ sur I, et dès lors l’existence de la limite du dernier
terme du membre de droite lorsque c tend vers b dans ]a, b[. L’hypothèse 1,
la continuité de l’intégrale indéfinie et le théorème de Hake permettent alors
de conclure.
On déduit de ce lemme quatre tests pratiques d’intégrabilité. Les deux
premiers requièrent l’intégrabilité de f sur I. Le premier s’appelle le test
d’intégrabilité de Du Bois-Reymond.
Corollaire. Soit I = [a, b[ (resp. ]a, b]), f et g des fonctions de R dans K
définies sur I et vérifiant les conditions suivantes.
a. f g est intégrable sur [a, c] (resp. [c, b]) quel que soit c ∈ H]a, b[. H
b. f est primitivable sur I et son intégrale indéfinie F = a· f (resp. ·b f )
est telle que
lim F (c) (resp. lim F (c))
c→a+ c→b−
existe.
c. g est dérivable sur I.
d. g $ est L-intégrable sur I.
Alors f g est intégrable sur I.
Démonstration. Par l’hypothèse b, |F | est majorée sur [c, b[ (resp. ]a, c])
pour un certain c ∈ ]a, b[. Comme F est continue sur [a, c] (resp. [c, b]),
|F | y est également majorée. Enfin, par le théorème fondamental du calcul
différentiel et intégral et la continuité de l’intégrale indéfinie, on a
2 J c 3 J b
lim g(c) = lim g(a) + g $ = g(a) + g $,
c→b− c→b− a a
2 J c 3 J b
(resp. lim g(c) = lim g(b) + g $ = g(b) − g $ ),
c→a+ c→a+ b a
ce qui assure l’existence de la limite correspondante pour F g.

Le deuxième test s’appelle le test d’intégrabilité d’Abel.
Corollaire. Soit I = [a, b[ ou ]a, b], f une fonction de R dans K et g une
fonction de R dans R vérifiant les hypothèses (a), (b), (c) du test de du
Bois-Reymond. Si en outre
d$ . g est monotone et bornée sur I,

alors f g est intégrable sur I.
Démonstration. Comme g est monotone sur I, g $ y est de signe constant
et la L-intégrabilité de g $ sur I équivaut à son intégrabilité. Celle-ci résulte
de la forme généralisée du théorème fondamental du calcul différentiel et
intégral puisque g, bornée et monotone sur I, possède une limite pour x
tendant vers b ou a selon que I = [a, b[ ou ]a, b]. Il suffit alors d’appliquer le
test de Du Bois-Reymond.
Exemple. Comme la fonction f définie par f (x) = x2 cos x12 est intégrable
sur ]0, 1] et la fonction g définie
D parE g(x) = ln(x + 1) est croissante et bornée
sur ]0, 1], la fonction x 2→ 2 ln(x+1)
x cos x12 est également intégrable sur ]0, 1].
Les deux derniers tests ne requièrent plus l’intégrabilité de f sur I. Le
premier s’appelle le test d’intégrabilité de Dedekind.
Corollaire. Soit I = [a, b[ (resp. ]a, b]), f , g des fonctions de R dans K
définies sur I et telles que les conditions suivantes soient vérifiées.
A. f g est intégrable sur [a, c] (resp. [c, b]) quel que soit c ∈ H]a, b[. H
B. f est primitivable sur I et son intégrale indéfinie F = a· f (resp. ·b f )
est bornée sur I.
C. g est dérivable sur I.
D. g $ est L-intégrable sur I.
E. limx→b− g(x) = 0 (resp. limx→a+ g(x) = 0).
Alors f g est intégrable sur I.
Démonstration. Elle résulte directement du lemme si l’on note que, par
les hypothèses B et E, on a
lim F (x)g(x) = 0 (resp. lim F (x)g(x) = 0).

x→b− x→a+
Le deuxième test s’appelle le test d’intégrabilité de Dirichlet.

Corollaire. Soit I = [a, b[ ou ]a, b], f une fonction de R dans K et g une
fonction de R dans R vérifiant les hypothèses A, B, C, E du test de Dedekind.
Si en outre
D $ . g est monotone sur I,
alors f g est intégrable sur I.
Démonstration. On montre, comme dans le test d’Abel, que les hy-
pothèses D $ et E entraı̂nent l’hypothèse D.
11.3. INTÉGRALE SUR UN INTERVALLE NON BORNÉ 411
Exemple. Pour tout α ∈ [0, 2[, la fonction h : x 2→ x−α cos x1 est intégrable
sur ]0, 1]. En effet, elle peut s’écrire h = f g avec
4 5$
1 1
f (x) = x−2 cos = − sin , g(x) = x2−α,
x x
qui vérifient les conditions du test de Dirichlet.
11.3 Intégrale sur un intervalle non borné

Soient a et b des nombres réels, I = [a, +∞[ (resp. ]a, +∞[, ] − ∞, b],
] − ∞, b[) un intervalle non borné. Soit f une fonction de R dans Rp définie
sur I. La condition nécessaire et suffisante d’intégrabilité sur un intervalle
borné donnée par le théorème de Hake et sa réciproque suggère la définition
suivante d’intégrabilité de f sur I.
Définition. On dit que f est intégrable sur I si f est intégrable sur I ∩ [a, b]
quel que soit b > a et si
J b
lim f
b→+∞ a
ou J b
lim f
a→−∞ a
existe selon que I est non majoré ou non H

minoré, auquel cas cette limite est
appelée l’intégrale de f sur I et notée I f ou, plus explicitement, pour les
quatre choix de I,
J J +∞ J J +∞
f ou f, f ou f,
[a,+∞[ a ]a,+∞[ a
J J b J J b
f ou f, f ou f,
]−∞,b] −∞ ]−∞,b[ −∞
ou encore par les variantes faisant intervenir f (x) dx.

On peut également définir la notion d’intégrale sur R =] − ∞, +∞[.
Définition. Soit f une application de R dans Rp. On dit que f est inté-
grable sur R s’il existe c ∈ R tel queHc
f soit Hintégrable sur ] − ∞, c] et sur
[c, +∞[, auquel cas l’élément de R −∞ f + c+∞ f est appelé l’intégrale de
p
f sur R et noté
J J +∞ J J +∞
f ou f ou f (x) dx ou f (x) dx.
R −∞ R −∞
On vérifiera sans peine que si la condition de la définition ci-dessus est

satisfaite pour un élément c de R, elle le sera pour n’importe quel d ∈ R avec
la même valeur de l’intégrale. Il est également facile de montrer que f est
intégrable sur R si et seulement si f est intégrable sur [a, b] quels que soient
a < b dans R et si J b
lim f
(a,b)→(−∞,+∞) a
existe, auquel cas cette limite est l’intégrale de f sur R. On peut également
vérifier sans peine que si f est une fonction de R dans Rp définie sur [a, b] et
si l’on définit l’application f[a,b] de R dans Rp par f[a,b](x) = f (x) si x ∈ [a, b]
et f[a,b] (x) = 0 si x ∈ R \ [a, b], alors f est intégrable sur [a, b] si et seulement
si f[a,b] est intégrable sur R.
Définition. Soit I l’un des intervalles non bornés considérés dans les défi-
nitions précédentes et soit f une fonction de R dans Rp définie sur I. On
dit que f est intégrable au sens de Lebesgue ou L-intégrable ou absolument
intégrable sur I si f et |f |2 sont intégrables sur I.
Exemples. 1. Si a > 0, la fonction f : x 2→ x−c est L-intégrable sur
I = [a, +∞[ si et seulement si c > 1. En effet, f étant positive sur l’intervalle
considéré, elle y est L-intégrable si et seulement si elle y est intégrable. En
outre, f est primitivable sur I, une primitive étant donnée par F (x) =
(1 − c)−1 x1−c si c /= 1 et par F (x) = ln x si c = 1. Dès lors, si b > a, on a
J b b
f = (1 − c)−1 (b1−c − a1−c ) ou ln ,
a a
H
selon que c /= 1 ou c = 1, et par conséquent limb→+∞ ab f existe si et
seulement si 1 − c < 0. On énoncera et démontrera aisément le résultat
correspondant pour le cas de ] − ∞, a] lorsque a < 0.
2. Aucune fonction constante non nulle n’est intégrable sur ] − ∞, a] ou
[a, +∞[. De même, la fonction cos n’est H
pas intégrable sur ces intervalles
puisque, par exemple, la fonction b 2→ ab cos x dx = sin b − sin a n’a pas de
limite lorsque b → +∞.
3. La fonction f : x 2→ exp(−|x|) est L-intégrable sur R. En effet, f
positive et continue, et donc primitivable sur R, est L-intégrable sur [a, 0] et
sur [0, b] quels que soient a < 0 < b et l’on a
J 0 J 0 J b J b
f= exp x dx = 1 − exp a, f= exp(−x) dx = 1 − exp(−b),
a a 0 0
ce qui entraı̂ne la L-intégrabilité de f sur ] − ∞, 0] et sur [0, +∞] avec

J 0 J +∞
exp(−|x|) dx = 1, exp(−|x|) dx = 1,
−∞ 0
et dès lors J
exp(−|x|) dx = 2.
R
Les propriétés élémentaires de l’intégrale et de la L-intégrale,
ainsi que les propriétés d’additivité et de restriction de ces intégrales
s’étendent immédiatement au cas d’un intervalle non borné. Il en est de
même, avec des démonstrations strictement analogues, pour l’extension
du théorème du calcul différentiel et intégral, de la formule d’inté-
gration par parties, du test de comparaison de L-intégrabilité, du
test de la limite et des tests de Du Bois-Reymond, Abel, Dedekind
et Dirichlet pour l’intégrabilité d’un produit.
Exemples. 1. Si c > 0, la fonction f définie sur ]0, +∞[ par f (x) =
xc−1 exp(−x) est continue (donc primitivable) et telle que
f (x) f (x)
lim = 1, lim = 0,
x→0+ xc−1 x→+∞ exp(−x/2)
puisque
2 3
f (x) x
lim = lim exp − + (c − 1) ln x =
x→+∞ exp(−x/2) x→+∞ 2
4 5 2 3
x ln x
lim exp − . 1 − 2(c − 1) = 0.
x→+∞ 2 x
Dès lors, par le test de la limite et l’intégrabilité de la fonction x 2→ xc−1 sur
]0, 1] et de la fonction x 2→ exp(− x2 ) sur [1, +∞[, on voit que l’intégrale
J +∞
xc−1 exp(−x) dx
0
existe pour chaque c > 0. Elle s’appelle l’intégrale d’Euler de deuxième

espèce et sa valeur est notée Γ(c). En intégrant par parties, on trouve
aisément, pour c > 1,
Γ(c) = (c − 1)Γ(c − 1),
et, comme Γ(1) = 1, on en déduit aussitôt que, pour chaque n ∈ N∗ , on a
Γ(n) = (n − 1)!.
2. On appelle intégrales trigonométriques les intégrales de la forme

J +∞ J +∞
g(x) cos λx dx ou g(x) sin λx dx,
0 0
où λ > 0 et g est une fonction définie au moins sur ]0, +∞[. Si f désigne
l’une des fonctions cos(λ·) ou sin(λ·), alors f est continue sur R et
#J # J # #
# x # | sin λx| # x # |1 − cos λx|
#
# cos λt dt## = ≤ λ−1 , ## sin λt dt## = ≤ 2λ−1 .
0 λ 0 λ
Dès lors, en appliquant le test de Dirichlet, l’existence des intégrales trigono-

métriques sera assurée si l’on suppose que g est dérivable et décroissante sur
[0, +∞[, et telle que limx→+∞ g(x) = 0. Ce sera en particulier le cas pour
les intégrales
J +∞ J +∞
cos λx sin λx
p
dx et dx,
0 x 0 xp
lorsque 0 0 et, sur ]0, c],
# #
# cos λx # −p
# #
# xp # ≤ x ,
et, comme on l’a vu au paragraphe précédent, le second membre est intégra-

ble sur ]0, c], tandis que la fonction x 2→ sinxpλx , qui peut être prolongée
continûment en 0 en lui donnant la valeur 0 si p < 1 et λ si p = 1, est
alors R-intégrable sur [0, c]. Lorsque p = 1/2, ces intégrales portent le nom
d’intégrales de Fresnel et elles jouent un rôle important en optique. Notons
√
que la substitution y = x transforme, pour chaque a < b strictement
positifs,
J b J b
sin λx cos λx
√ dx et √ dx
a x a x
respectivement en
J b2 J b2
2 sin λy 2 dy et 2 cos λy 2 dy,
a2 a2
et dès lors, en faisant tendre a vers 0 et b vers +∞ et en utilisant les

définitions, on trouve
J J
+∞ sin λx +∞
√ dx = 2 sin λy 2 dy
0 x 0
et
J J
+∞ cos λx +∞
√ dx = 2 cos λy 2 dy.
0 x 0
On notera finalement qu’un raisonnement analogue à celui utilisé dans l’e-

xemple de fonction intégrable et non L-intégrable sur un intervalle borné
montre que chaque intégrand des intégrales trigonométriques ci-dessus est
intégrable sur ]0, +∞[ sans y être L-intégrable.
Remarque. Le lecteur peut s’être posé la question de savoir si l’intégrabilité
d’une fonction f sur un intervalle non borné pouvait être définie en termes de
sommes de Riemann. La réponse est positive et, pour [a, +∞[ par exemple,
la définition est la suivante.
Définition. Soit f une fonction de R dans Rp définie sur I = [a, +∞[. On

dit que f est intégrable sur I s’il existe J ∈ Rp ayant la propriété suivante:
pour chaque ! > 0, il existe une jauge δ sur I et il existe B > a tels que,
pour chaque b ≥ B et chaque P-partition δ-fine Π de ]a, b], on ait
|S(]a, b], f, Π) − J|2 ≤ !.
On peut alors démontrer, à partir de cette définition, l’analogue du

théorème de Hake sur [a, +∞[ et montrer ainsi que cette définition est
équivalente à celle que nous avons adoptée ici pour court-circuiter cette
démonstration. Le cas de I = ] − ∞, b] est évidemment analogue et celui
des intervalles ouverts se traite par la technique de prolongement. Enfin,
la définition d’intégrabilité sur R en termes de sommes de Riemann est la
suivante.
Définition. Soit f une fonction de R dans Rp définie sur R. On dit que

f est intégrable sur R s’il existe J ∈ Rp ayant la propriété suivante : pour
chaque ! > 0, il existe une jauge δ sur I et il existe ρ > 0 tels que, pour
chaque a ≤ −ρ, chaque b ≥ ρ et chaque P-partition δ-fine Π de ]a, b], on ait
|S(]a, b], f, Π) − J|2 ≤ !.

11.4 Tests de convergence des séries

Montrons tout d’abord que l’étude de la convergence d’une série dans Rp
équivaut à l’étude de l’intégrabilité sur [0, +∞[ d’une certaine fonction de R
dans Rp construite à partir des termes de la série.
%
Soit k∈N ak une série dans Rp . Associons à la suite (ak )k∈N de ses
termes l’application
a[·] : R+ → Rp , x 2→ a[x],
où [x] désigne le plus grand entier inférieur ou égal à x. C’est donc l’applica-
tion définie pour chaque x ∈ R+ par a[x] = ak si x ∈ [k, k + 1[, (k ∈ N).
Proposition. Pour chaque b ≥ 1, la fonction a[·] est intégrable sur [0, b] et
l’on a
J b [b]−1
$
a[x] dx = ak + (b − [b])a[b].
0 k=0
Démonstration. En vertu de l’additivité de l’intégrale, il suffit de montrer

que a[.] est intégrable sur [0, 1], [1, 2], . . ., [[b]−1, [b]] et sur [[b], b] (si ce dernier
intervalle n’est pas réduit à un point) et que
J k+1 J b
a[x] dx = ak , (0 ≤ k ≤ [b] − 1), a[x] dx = (b − [b])a[b].
k [b]
C’est évident pour la dernière intégrale puisque a[·] a sur [[b], b] la valeur
constante a[b] . Pour l’intervalle [k, k + 1], la fonction a[·] a, sur [k, k + 1[ la
valeur constante ak et dès lors
J c
a[x] dx = (c − k)ak ,
k
pour tout c ∈ ]k, k + 1[, ce qui entraı̂ne que

J c
lim a[x] dx = ak .
c→(k+1)− k
L’intégrabilité de a[·] sur [k, k + 1] et la valeur de l’intégrale correspondante

résultent alors du théorème de Hake.
Remarque. On notera que a[·] , bornée sur chaque sous-intervalle borné de
[0, +∞[, y est en fait L-intégrable.
Nous pouvons maintenant démontrer les deux résultats fondamentaux
ramenant la convergence d’une série à l’intégrabilité de la fonction associée.
11.4. TESTS DE CONVERGENCE DES SÉRIES 417
%
Proposition. La série k∈N ak converge si et seulement si la fonction as-
sociée a[·] est intégrable sur [0, +∞[, auquel cas l’on a
∞
$ J ∞
ak = a[x] dx.
k=0 0
Démonstration. Condition nécessaire. Soit A la somme de la série con-

%
vergente k∈N ak . Par la proposition précédente, il suffit de montrer que
H %
limb→+∞ 0b a[x] dx = A. Si Aq = qk=0 ak , (q ∈ N), on a, pour chaque b ≥ 1,
#J #
# b #
# #
# a[x] dx − A# = |A[b]−1 − A + (b − [b])a[b]|2 ≤ |A[b]−1 − A|2 + |a[b]|2 ,
# 0 #
2
puisque 0 ≤ b − [b] < 1. Si ! > 0 est donné, il existe m ∈ N tel que
|A − Ak |2 ≤ !/2, |ak |2 ≤ !/2,
pour chaque k ≥ m, et dès lors, si b ≥ m + 1, on aura [b] − 1 ≥ m et

#J #
# b #
# #
# a[x] − A# ≤ !/2 + !/2 = !.
# 0 #
2
Hb
Condition suffisante. Puisque limb→+∞ 0 a[x] dx existe,
J b
lim a[x] dx
b→+∞,b∈N 0
existe aussi, avec la même valeur, et comme, pour tout q ∈ N, on a

J q+1
Aq = a[x] dx,
0
on voit que
J b
lim Aq = lim a[x] dx,
q→∞ b→+∞ 0

%
Proposition. La série k∈N ak converge absolument si et seulement si la
fonction associée a[·] est L-intégrable sur [0, +∞[.
Démonstration. On vérifie immédiatement que |a[·]|2 est la fonction as-
%
sociée à la série k∈N |ak |2 . La thèse résulte alors de la proposition précé-
dente appliquée à a[·] et à |a[·] |2 .
Il est maintenant facile de traduire dans le langage des séries, via les
propositions précédentes et la fonction associée, un certain nombre de résul-
tats d’intégrabilité obtenus dans la section précédente. Le premier fournit
un test de comparaison pour la convergence absolue d’une série.
% %
Proposition. Si la série k∈N ak dans Rp et la série k∈N bk dans R+ sont
telles que, pour un certain entier q ≥ 0 et chaque entier k ≥ q, on ait
|ak |2 ≤ bk ,
% %
et si la série k∈N bk converge, alors la série k∈N ak converge absolument.
Le deuxième est le test de la limite pour la convergence des séries
à termes positifs.
% %
Corollaire. Soit k∈N ak et k∈N bk deux séries réelles pour lesquelles il
existe un entier q ≥ 1 tel que ak ≥ 0 et bk > 0 si k ≥ q. Supposons en outre
que limk→+∞ abkk existe au sens large, et notons la d.
% %
1. Si d = 0 et si k∈N bk converge, alors k∈N ak converge.
% %
2. Si d > 0 est fini, k∈N ak et k∈N bk convergent et divergent simul-
tanément.
% %
3. Si d = +∞ et si k∈N ak converge, alors k∈N bk converge.
Le test de comparaison permet de démontrer le test intégral de Mac-
laurin-Cauchy pour la convergence de séries positives dont les termes sont
donnés par la restriction à N d’une fonction positive et décroissante sur
[0, +∞[.
Proposition. Soit f une fonction réelle définie, positive et décroissante sur
%
[0, +∞[. Alors la série k∈N f (k) converge si et seulement si f est intégrable
sur [0, +∞[.
Démonstration. Notons tout d’abord que f , décroissante sur [0, +∞[,
est R-intégrable sur [0, b] quel que soit b > 0, et dès lors
H
l’intégrabilité de f
sur [0, +∞[ équivaut à l’existence de la limite limb→+∞ 0b f. Par ailleurs, les
% %
séries k∈N f (k) et k∈N f (k + 1) convergent et divergent simultanément.
%
Soit fˆ : x 2→ f ([x]) la fonction associée à la série k∈N f (k) et fˇ : x 2→
%
f ([x] + 1) la fonction associée à la série k∈N f (k + 1). Par la décroissance
de f , on a évidemment
0 ≤ fˇ(x) = f ([x] + 1) ≤ f (x) ≤ f ([x]) = fˆ(x),
pour tout x ∈ [0, +∞[, et le test de comparaison montre alors que f, fˆ et
%
fˇ sont simultanément intégrables sur [0, +∞[. En conséquence, k∈N f (k)
converge si et seulement si f est intégrable sur [0, +∞[.
11.4. TESTS DE CONVERGENCE DES SÉRIES 419
Remarques. 1. L’inégalité entre f, fˆ et fˇ montre que

∞
$ J +∞ ∞
$
f (k) ≤ f≤ f (k),
k=1 0 k=0
dès que l’un des trois termes existe.

%
2. La convergence de k∈N∗ f (k) équivaut évidemment à l’intégrabilité
de f sur [1, +∞[.
%
Exemples. 1. La série de Riemann k∈N∗ k−c , où c ≥ 0, converge si c > 1
et diverge si c ∈ [0, 1]. En effet, les termes de cette série sont les valeurs
de la restriction à N∗ de la fonction f définie sur [1, +∞[ par f (x) = x−c ,
qui est positive et décroissante sur cet intervalle. On a vu au paragraphe
précédent que cette fonction était intégrable sur [1, +∞[ si et seulement si
c > 1. On en déduit en particulier une nouvelle preuve de la divergence de
%
la série harmonique k∈N∗ k1 . Cette série “diverge très lentement”, puisque
l’inégalité, déduite des considérations qui précèdent,
q J
$ 1 q dx
≥ = ln q,
k=1
k 1 x
montre qu’il faudra plus de exp 10 = 22.026 termes pour que les sommes
partielles dépassent 10 ! La différence
q
$ 1
− ln q
k=1
k
Hq
entre la q e somme partielle de la série harmonique et ln q = dx
1 x est égale,
puisque
$q $q
k
ln q = [ln k − ln(k − 1)] = ln ,
k=2 k=2
k−1
à
q 4 5
$ 1 k
1+ − ln .
k=2
k k−1
D’autre part, en utilisant l’expression de Lagrange du reste du développe-
ment de Taylor, il existera, pour chaque entier k ≥ 2, un θk ∈ ]0, 1[ tel
que
 
4 5 4 54 5
k 1 1 1 1  1 
− ln = ln 1 − = ln 1 − − 8 9 .
k−1 k k 2 k 2 θk 2
1− k
Par conséquent,
 
q q 4 54 5
$ 1 1$ 1  1 
− ln q = 1 + 8 9 .
k=1
k k=2
2 k 2
1− kθk 2
Comme
1
2
lim k
4 5 = 2,
k→∞
( 12 )( k12 ) 1
θ
(1− kk )2
%
le test de la limite et la convergence de la série de Riemann k∈N∗ k12 entraı̂ne
%
la convergence de la série 1+ k≥2 ( k1 −ln k−1k
), et donc l’existence de la limite
, q
-
$ 1
lim − ln q .
q→∞
k=1
k
Cette limite est appelée la constante d’Euler, désignée par C et joue un

grand rôle dans différentes questions d’analyse et de théorie analytique des
nombres. Sa valeur approximative est
C = 0, 577215664901532860606512090082....
On ignore toujours si la constante d’Euler est un nombre rationnel ou un

nombre irrationnel, un nombre algébrique ou un nombre transcendant. Pour
s > 1, la somme de la série de Riemann, que l’on désigne par ζ(s), peut se
calculer, par des moyens qui sortent du cadre de ce chapitre, lorsque s est
2 4 π6
pair. Ainsi, ζ(2) = π6 , ζ(4) = π90 , ζ(6) = 945 . Plus généralement, Leonard
Euler a montré que, pour chaque entier positif k, ζ(2k) = ak π 2k pour un
certain nombre rationnel ak . On peut en déduire que ζ(2k) est toujours
irrationnel, et même transcendant. Par contre on ignore si ζ(2k + 1) est
ou non irrationnel lorsque k ≥ 2. Ce n’est qu’en 1978 que Roger Apery a
démontré que ζ(3) était irrationnel.
%
2. La série d’Abel k≥2 k ln 1
k est telle que
1
lim k
1 = +∞
k→∞
k ln k
tandis que, pour chaque c > 1,

1
kc
lim 1 = 0.
k→∞
k ln k
11.5. TESTS DE LA RACINE ET DU QUOTIENT 421
Le test de la limite combiné aux résultats sur la convergence de la série de

Riemann ne permettent donc pas de décider de sa convergence. Mais, pour
tout x ≥ 2, on a
J x J ln x
dy dt
= = ln(ln x) − ln(ln 2),
2 y ln y ln 2 t
et la fonction décroissante x 2→ x ln
1
x n’est pas intégrable sur [2, +∞[. Le
test de Maclaurin-Cauchy montre aussitôt que la série d’Abel est divergente.
%
Par contre, le même test montre que, pour tout a > 1, la série k≥2 k(ln1k)a
est convergente.
11.5 Tests de la racine et du quotient

Des combinaisons judicieuses du test de comparaison et des résultats sur la
convergence de la série géométrique fournissent d’utiles tests de convergence
absolue. Le premier s’appelle le test de la racine de Cauchy.
%
Proposition. Soit k∈N ak une série dans Rp . Posons L = +∞ si la suite
1/k
(|ak |2 )k∈N n’est pas majorée et
& '
1/k
L = lim sup |ak |2 ,
q→∞ {k∈N:k≥q}
sinon.
%
1. Si L < 1, la série k∈N ak converge absolument.
%
2. Si L > 1, la série k∈N ak diverge.
%
3. Si L = 1, on ne peut pas conclure, c’est-à-dire la série k∈N ak peut
converger ou diverger.
8 Démonstration. 9Notons tout d’abord que, si elle est définie, la suite

1/k
sup{k∈N:k≥q} |ak |2 est décroissante et positive, et sa limite L existe
q∈N
bien. Si l’hypothèse 1 est satisfaite, choisissons ! > 0 tel que L + ! < 1 (par
exemple ! = 1−L2 ). Il existera dès lors un m ∈ N tel que
1/k
L−! ≤ sup |ak |2 ≤ L + !,
{k∈N:k≥q}
1/k
pour tout q ≥ m, et dès lors, pour tout k ≥ m, on aura |ak |2 ≤ L + !,
%
c’est-à-dire |ak |2 ≤ (L + !)k . Comme la série géométrique k∈N (L + !)k est
convergente, la thèse résulte du test de comparaison.
Supposons maintenant que L > 1 et considérons le cas où L est fini (on
procède de même pour L = +∞). La décroissance de la suite
& '
1/k
sup |ak |2
{k∈N:k≥q} q∈N
entraı̂ne que, pour tout q ∈ N, on a
1/k
sup |ak |2 ≥ L > 1.
{k∈N:k≥q}
Choisissons ! > 0 tel que L−! > 1 (par exemple ! = L−1 2 ). La caractérisation
du supremum appliquée à l’inégalité ci-dessus entraı̂ne alors l’existence, pour
chaque q ∈ N, d’un entier kq ≥ q tel que
1/kq 1/k
|akq |2 ≥ sup |ak |2 − ! ≥ L − ! > 1,
{k∈N:k≥q}
et donc tel que |akq |2 > 1. Par conséquent, la suite (ak )k∈N des termes de
%
la série ne tend pas vers zéro et la série k∈N ak diverge. Enfin, la série de
%
Riemann k∈N∗ k1c , avec c > 0 est telle que (k−c )1/k = [k1/k ]−c . Par ailleurs,
l’étude élémentaire du comportement de la fonction x 2→ x1/x montre que
cette fonction décroı̂t pour x ≥ e et tend vers 1 lorsque x tend vers l’infini
(calculer la dérivée et utiliser la règle de l’Hospital). En conséquence, la
suite ([k1/k ]−c )k≥3 est croissante et a pour limite 1, ce qui entraı̂ne, puisque
sup ([k1/k ]−c ) = 1,
{k∈N:k≥q}
dès que q ≥ 3, que L = 1. Or la série de Riemann diverge pour c ≤ 1 et

converge pour c > 1.
Le résultat qui suit simplifie fortement, lorsqu’il s’applique, le calcul de
L.
Proposition. Avec les notations du test de la racine de Cauchy, si
1/k
limk→∞ |ak |2 existe, alors L est égal à cette limite.
1/k
Démonstration. Soit a = limk→∞ |ak |2 et soit ! > 0. Il existe donc
m ∈ N tel que, pour tout entier k ≥ m, on ait
1/k
a − ! ≤ |ak |2 ≤ a + !,
et dès lors, pour tout q ≥ m, on a
1/q 1/k
a − ! ≤ |aq |2 ≤ sup |ak |2 ≤ a + !,
{k∈N:k≥q}
ce qui implique L = a.
11.5. TESTS DE LA RACINE ET DU QUOTIENT 423
Le deuxième test s’appelle le test du quotient de d’Alembert.

%
Proposition. Soit k∈N ak une série dans Rp telle que ak /= 0 pour tout
|a |2
k ∈ N. Si la suite ( |ak+1
k |2
)k∈N n’est pas majorée, posons Q2 = +∞. Sinon,
posons & '
|ak+1 |2
Q2 = lim sup ,
q→∞ {k∈N:k≥q} |ak |2
& '
|ak+1 |2
Q1 = lim inf .
q→∞ {k∈N:k≥q} |ak |2
%
1. Si Q2 < 1, la série k∈N ak converge absolument.
%
2. si Q1 > 1, la série k∈N ak diverge.
%
3. Si Q1 ≤ 1 ≤ Q2 , le test ne peut conclure, c’est-à-dire la série k∈N ak
peut converger ou diverger.
Démonstration. Notons tout d’abord que, lorsqu’elle est définie, la suite
& '
|ak+1 |2
sup
{k∈N:k≥q} |ak |2 q∈N
est décroissante et positive, donc convergente, et chacun de ses termes majore

le terme correspondant de la suite croissante et positive
& '
|ak+1 |2
inf ,
{k∈N:k≥q} |ak |2
q∈N
qui convergera donc également. En conséquence, Q2 et Q1 existent et Q1 ≤

Q2 . Dans le cas de l’hypothèse 1, soit ! > 0 tel que Q2 + ! < 1. Il existera
un entier naturel m tel que
|ak+1 |2
sup ≤ Q2 + !,
{k∈N:k≥q} |ak |2
pour tout q ≥ m et donc tel que
|ak+1 |2 (Q2 + !)k+1

≤ Q2 + ! = ,
|ak |2 (Q2 + !)k
pour tout k ≥ m. Pour ces mêmes k, on a donc
|ak+1 |2 |ak |2
≤ ,
(Q2 + !) k+1 (Q2 + !)k
8 9
|ak |2
et la suite (Q2+!)k
est donc décroissante. Par conséquent, pour tout
k≥m
k ≥ m, on a
|ak |2 ≤ Cm (Q2 + !)k ,
%
avec Cm = (Q|a2m |2
+!)m . Comme la série géométrique k∈N (Q2 + !) converge,
k
le test de comparaison et l’inégalité ci-dessus entraı̂nent aussitôt la conver-

%
gence absolue de k∈N ak . Si Q1 > 1, (et nous nous contenterons de traiter
explicitement le cas où Q1 est fini, l’autre étant semblable), il existe ! > 0
tel que Q1 − ! > 1. Pour cet !, il existe un entier naturel m tel que
|ak+1 |2
Q1 − ! ≤ inf ≤ Q1 + !,
{k∈N:k≥q} |ak |2
si q ≥ m, et donc tel que, pour tout k ≥ m,

|ak+1 |2
1< .
|ak |2
En conséquence, on a, pour tout k ≥ m, |ak+1 |2 ≥ |ak |2 ≥ |am |2 > 0,

et la suite (ak )k∈N ne tend pas vers zéro, ce qui entraı̂ne la divergence de
%
k∈N ak . Enfin, on montre aisément que la série de Riemann fournit, quel
que soit c > 0, les valeurs Q1 = Q2 = 1 et l’on sait qu’elle diverge pour c ≤ 1
et converge pour c > 1.
Le résultat suivant facilite, lorsqu’il s’applique, le calcul des expressions
Q1 et Q2 . Sa démonstration, semblable au résultat analogue pour le critère
de Cauchy, est laissée au lecteur.
Proposition. Avec les notations du test du quotient de d’Alembert, si
|a |2
limk→∞ |ak+1k |2
existe, alors Q1 = Q2 et leur valeur commune est égale à
cette limite.
Remarque. Le test du quotient est en général plus facile à appliquer que le
test de la racine, car il est en général plus facile de calculer des quotients que
des racines. Cependant, le test de la racine est plus général que le test du
quotient dans le sens suivant : si le test du quotient entraı̂ne la convergence
ou la divergence, il en est de même du test de la racine; si le test de la racine
ne peut conclure, il en est du même du test du quotient. Ce fait résulte des
inégalités ci-dessous, dont le lecteur vérifiera aisément la validité pour toute
suite strictement positive (ck )k∈N :
4 5 4 5
ck+1 1/k
lim inf ≤ lim inf ck ,
q→∞ k≥q ck q→∞ k≥q
11.6. SÉRIES POTENTIELLES 425
& ' & '
1/k ck+1
lim sup ck ≤ lim sup .
q→∞ k≥q q→∞ k≥q ck
11.6 Séries potentielles

Une application importante des tests de la racine et du quotient est fournie
par l’étude des séries potentielles, qui constituent la généralisation naturelle
des polynômes sur C.
Définition. Etant donnés une suite (ck )k∈N dans C et deux nombres com-
plexes a et z, on appelle série potentielle ou série de puissances ou série
%
entière une série de la forme k∈N ck (z − a)k .
%
Les sommes partielles de la série potentielle k∈N ck (z − a)k sont les
%
polynômes qk=0 ck (z − a)k . Ces expressions ont un sens quel que soit z ∈
%
C. L’exemple de la série géométrique k∈N z k de raison z ∈ C qui ne
converge que pour |z| < 1 montre que la somme d’une série potentielle n’est
pas nécessairement définie pour tout z ∈ C. On a dans cette direction
l’important théorème de convergence d’une série potentielle.
%
Théorème. Considérons la série potentielle k∈N ck (z − a)k . Si la suite
(|ck |1/k )k∈N n’est pas majorée, posons C = +∞. Sinon, posons
& '
C = lim sup |ck | 1/k
.
q→∞ {k∈N:k≥q}
%
1. Si C > 0 est fini, et si l’on pose R = 1/C, la série k∈N ck (z −a)k converge
absolument si |z − a| < R et diverge si |z − a| > R.
%
2. Si C = 0, la série k∈N ck (z − a)k converge absolument pour tout z ∈ C.
%
3. si C = +∞, la série k∈N ck (z − a)k converge absolument pour z = a et
diverge pour tout z /= a.
Démonstration. Appliquons le test de la racine de Cauchy à la série
$
ck (z − a)k .
k∈N
Comme |ck (z − a)k | = |ck ||z − a|k pour chaque k ∈ N, on a

# #1/k
# #
#ck (z − a)k # = |ck |1/k |z − a|,
8 9
et, pour z /= a, la suite |ck (z − a)k |1/k est majorée si et seulement si
k∈N∗
la suite (|ck | 1/k
)k∈N∗ l’est. Dans ce cas, on a, pour chaque q ∈ N,
# #1/k
# #
sup #ck (z − a)k # = sup |ck |1/k |z − a|
{k∈N:k≥q} {k∈N:k≥q}
= |z − a| sup |ck |1/k ,

{k∈N:k≥q}
et dès lors L = |z − a|C. Dès lors, si C > 0 est fini, L < 1 si et seulement si
|z − a| < 1/C = R et L > 1 si et seulement si |z − a| > 1/C = R, et la thèse
résulte du critère de la racine de Cauchy. Si C = 0, L = 0 quel que soit z ∈ C
et le critère de la racine de Cauchy permet encore de conclure. Si C = +∞,
alors, pour chaque z /= a, L = +∞ et la série diverge. Sa convergence pour
z = a est triviale puisque ses termes sont nuls dès que k ≥ 1.
Lorsque C > 0 est fini, le nombre R = 1/C s’appelle le rayon de con-
%
vergence de la série k∈N ck (z − a)k et le disque ouvert de centre a et de
rayon R s’appelle son disque de convergence. Lorsque limk→∞ |ck |1/k existe
et est strictement positive, les résultats de la section précédente entraı̂nent
évidemment que le rayon de convergence est égal à l’inverse de cette limite.
En utilisant un cas particulier du critère du quotient de d’Alembert, on
peut obtenir un théorème de convergence moins général, mais souvent plus
facile à appliquer que le précédent.
%
Proposition. Soit k∈N ck (z − a)k une série potentielle telle que ck /= 0
|c |
pour chaque k ∈ N. Si la limite limk→∞ |ck+1 k|
existe et est strictement
positive, elle est égale à l’inverse du rayon de convergence de la série. Si elle
est nulle, la série converge absolument pour tout z ∈ C. Si elle est égale à
+∞, la série diverge pour tout z /= a.
Démonstration. Etudions la convergence absolue de la série
$
ck (z − a)k
k∈N
par le test du quotient de d’Alembert. On a

|ck+1 ||z − a|k+1 |ck+1 |
= |z − a| ,
|ck ||z − a|k |ck |
et dès lors
|ck+1 ||z − a|k+1
lim = |z − a|r,
k→∞ |ck ||z − a|k
11.6. SÉRIES POTENTIELLES 427
|c |
si r = limk→∞ |ck+1
k|
. La thèse se déduit alors du cas particulier du test de
d’Alembert où Q1 = Q2 .
Exemples. 1. Rappelons que si z ∈ C, la série exponentielle de z est la
% k
série potentielle k∈N zk! . Puisque
1
(k+1)! 1
lim = lim = 0,
k→∞ 1
k!
k→∞ k+1
la proposition précédente montre que cette série converge absolument pour

tout z ∈ C. On montre de même que les séries potentielles
$ z 2k $ z 2k+1
(−1)k et (−1)k
k∈N
(2k)! k∈N
(2k + 1)!
convergent pour chaque z ∈ C. On les appelle respectivement la série poten-

tielle cosinus de z et la série potentielle sinus de z et leurs sommes respectives
sont désignées par cos z et sin z.
%
2. La série potentielle k∈N∗ kk z k est telle que
8 91/k
lim kk = lim k = +∞,
k→∞ k→∞
et dès lors elle converge pour z = 0 et diverge pour z /= 0.

% k
3. La série potentielle k∈N∗ zkc où c ∈ R est telle que
1 4 5c
(k+1)c k
lim = lim = 1,
k→∞ 1
kc
k→∞ k+1
et dès lors elle converge absolument pour |z| < 1 et diverge pour |z| > 1. Le
théorème fondamental de convergence d’une série entière ne fournit aucune
information sur sa convergence lorsque |z| = 1 et il faut étudier chaque
série cas
# k #par cas. Si nous remarquons que, pour |z| = 1 et chaque k ∈ N ,
∗
#z #
on a # kc # = kc , le test de comparaison et la convergence de la série de
1
Riemann pour c > 1 entraı̂nent dans ce cas la convergence absolue de la

% k
série potentielle k∈N∗ zkc pour chaque z tel que |z| = 1. Lorsque c ∈ ]0, 1],
et z = 1, la série potentielle se réduit à la série de Riemann divergente
%
k∈N∗ kc , et l’on montrera plus loin qu’elle converge pour les autres valeurs
1
#dek #z telles que |z| = 1. Enfin, si c ≤ 0, on a, pour |z| = 1 et k ∈ N ,

∗
#z #
# kc # = k |c| et la série diverge puisque la suite de ses termes ne tend pas vers
zéro. On voit donc qu’une série potentielle peut converger en tous les points
tels que |z − a| soit égal au rayon de convergence, diverger en tous ces points,
ou encore converger en certains de ces points et diverger en d’autres. Nous
reviendrons sur cette question dans la section suivante.
On peut associer à une série potentielle une famille d’autres séries po-
tentielles ayant le même rayon de convergence.
%
Définition. On appelle série dérivée de la série potentielle k∈N ck (z − a)
k
la série potentielle
$ $
kck (z − a)k−1 = (k + 1)ck+1 (z − a)k ,
k∈N∗ k∈N
dont chaque terme est la valeur en z de la C-dérivée par rapport à z du

terme correspondant de la série originelle.
%
Ainsi, la série dérivée de la série géométrique k∈N z
k est la série
$ $
kz k−1 = (k + 1)z k .
k∈N∗ k∈N
% zk
La série dérivée de la série exponentielle de z k∈N k! est la série
$ z k−1 $ zk $ zk
k = (k + 1) = ,
k∈N∗
k! k∈N
(k + 1)! k∈N k!
c’est-à-dire la série exponentielle de z elle-même. La série dérivée de la série

cosinus de z est égale à moins la série sinus de z et la série dérivée de la série
sinus de z est égale à la série cosinus de z.
Proposition. Une série potentielle et sa série dérivée ont le même rayon de
convergence.
Démonstration. Notons tout d’abord que, pour z /= a, les termes de
% %
la série dérivée k∈N∗ kck (z − a)k−1 et ceux de la série k∈N∗ kck (z − a)k
ne diffèrent que par un facteur constant z − a et les deux séries convergent
ou divergent donc simultanément. Pour étudier la convergence de la série
%
k∈N∗ kck (z − a) , il faut étudier les quantités supk≥q (k|ck |)
k 1/k pour q ≥ 1.
On a vu précédemment que la fonction x 2→ x1/x décroı̂t monotonément vers

1 dès que x ≥ e. En conséquence, on aura, pour tout k ≥ q ≥ 3,
|ck |1/k ≤ (k|ck |)1/k = k1/k |ck |1/k ≤ q 1/q |ck |1/k ,
et dès lors
sup |ck |1/k ≤ sup (k|ck |)1/k ≤ sup q 1/q |ck |1/k = q 1/q sup |ck |1/k .
k≥q≥3 k≥q≥3 k≥q≥3 k≥q≥3
11.7. SÉRIES TRIGONOMÉTRIQUES 429
On en déduit aussitôt que les suites correspondantes sont simultanément

majorées, et que, s’il en est ainsi,
& ' , -
≤ lim sup (k|ck |) 1/k
= C$
q→∞ k≥q≥3 q→∞ k≥q≥3
& ' & '
≤ lim q 1/q
sup |ck | 1/k
= lim q 1/q
. lim sup |ck | 1/k
q→∞ k≥q≥3 q→∞ q→∞ k≥q
& '
= lim sup |ck |1/k = C,
q→∞ k≥q
et dès lors C = C $ .
On peut évidemment itérer le processus de passage à la série dérivée et
considérer la série dérivée de la série dérivée
$ $
(k − 1)kck (z − a)k−2 = (k + 1)(k + 2)ck+2 (z − a)k ,
k≥2 k∈N
que l’on appellera la série dérivée seconde de la série potentielle

$
ck (z − a)k .
k∈N
En continuant de la sorte, on définira, pour chaque entier m ≥ 1, la série

%
dérivée me de k∈N ck (z − a)k comme étant la série
$
(k − m + 1) . . . (k − 1)kck (z − a)k−m
k≥m
$
= (k + 1)(k + 2) . . .(k + m)ck+m (z − a)k .
k∈N
Toutes ces séries dérivées ont évidemment le même rayon de convergence
%
que la série k∈N ck (z − a)k .
11.7 Séries trigonométriques

%
Soit k∈N ck (z −a)k une série potentielle et R > 0 son rayon de convergence.
Les points z tels que |z − a| = R, peuvent s’écrire z = a + R exp it, t ∈ R, et,
%
en ces points, la série potentielle prend la forme k∈N ck Rk exp ikt, avec
& ' & '
lim sup (|ck |R ) k 1/k
= R lim sup |ck | 1/k
= 1.
q→∞ k≥q≥1 q→∞ k≥q≥1
%
Il s’agit d’un cas particulier de séries de la forme k∈N dk exp ikt où t ∈ R
et (dk )k∈N est une suite de nombres complexes. Ces séries s’appellent des
%
séries trigonométriques et elles sont du type k∈N ak bk avec bk = dk et
ak = exp ikt. Pour de tels ak , on a pour chaque q ∈ N,
q
$ 1 − exp[i(q + 1)t]
Aq = exp ikt = si t /= 2πm, m ∈ Z
k=0
1 − exp it
et Aq = q + 1 si t = 2πm, m ∈ Z. En conséquence, pour chaque t /=

2πm, m ∈ Z et chaque q ∈ N, on a |Aq | ≤ |1−exp 2
. Nous allons voir qu’il
% it|
est possible d’obtenir pour les séries de type k∈N ak bk pour lesquelles la
suite (|Aq |)q∈N est majorée d’intéressants résultats de convergence qui sont
l’analogue de tests d’intégrabilité obtenus précédemment pour des produits
de fonctions. Ces résultats reposent sur la proposition suivante, appelée le
lemme d’Abel.
Lemme. Soient (ak )k∈N et (bk )k∈N deux suites dans K vérifiant les condi-
tions suivantes.
%q
1. La suite (Aq )q∈N des sommes partielles Aq = k=0 ak est bornée.
%
2. La série k∈N(bk − bk+1 ) converge absolument.
%
Alors la série k∈N ak bk converge si et seulement si limq→∞ Aq bq existe.
Démonstration. La démonstration utilise la transformation d’Abel qui
est l’analogue, pour les séries, de l’intégration par parties :
q
$ q
$ q
$ q−1
$
ak bk = a0 b0 + (Ak − Ak−1 )bk = A0 b0 + Ak bk − Ak bk+1
k=0 k=1 k=1 k=0
q−1
$
= Aq bq + Ak (bk − bk+1 ) (q ∈ N).
k=0
Si M > 0 est tel que |Ak | ≤ M pour chaque k ∈ N, alors
|Ak (bk − bk+1 )| ≤ M |bk − bk+1 |

%
pour chaque k ∈ N et, comme la série k∈N M |bk − bk+1 | converge par
l’hypothèse 2, le test de comparaison entraı̂ne la convergence absolue de la
%
série k∈N Ak (bk − bk+1 ). La thèse résulte alors facilement de la formule
d’Abel.
On déduit de ce lemme des tests de convergence utiles. Les deux premiers
%
requièrent la convergence de k∈N ak . On a d’abord le test de convergence
de Du Bois-Reymond.
11.7. SÉRIES TRIGONOMÉTRIQUES 431
Corollaire. Soit (ak )k∈N et (bk )k∈N deux suites dans K vérifiant les condi-
tions suivantes.
%
a. La série k∈N ak converge.
%
b. La série k∈N (bk − bk+1 ) converge absolument.
%
Alors la série k∈N ak bk converge.
Démonstration. Par l’hypothèse a, la suite des sommes partielles
(Aq )q∈N est convergente, et donc bornée. Les sommes partielles de la série
%
k∈N (bk − bk+1 ) sont données par
q
$ q
$ q+1
$
(bk − bk+1 ) = bk − bk = b0 − bq+1 .
k=0 k=0 k=1
Par l’hypothèse b, la suite (b0 − bq+1 )q∈N converge, et il en est donc de même
de (Aq bq )q∈N. Le lemme d’Abel permet de conclure.
Le deuxième résultat s’appelle le test de convergence d’Abel.
Corollaire. Soit (ak )k∈N une suite dans K et (bk )k∈N une suite dans R
%
a. La série k∈N ak converge.
b$ . La suite (bk )k∈N est monotone et convergente.
%
Démonstration. Comme (bk )k∈N est monotone, les expressions bk − bk+1
%
ont toutes le même signe et la série k∈N (bk − bk+1 ) converge absolument si
et seulement si elle converge, ce qui est le cas puisque, comme on l’a montré
plus haut, la suite de ses sommes partielles est la suite (b0 − bq+1 )q∈N qui
converge par l’hypothèse b’.
%
Les test suivants ne requièrent plus la convergence de k∈N ak . On a
d’abord le test de convergence de Dedekind.
Corollaire. Soit (ak )k∈N et (bk )k∈N deux suites dans K vérifiant les condi-
tions suivantes.
A. La suite (Aq )q∈N est bornée.
%
B. La série k∈N (bk − bk+1 ) converge absolument.
C. La suite (bk )k∈N converge vers zéro.
%
Démonstration. Si M majore tous les |Aq |, on a |Aq bq | ≤ M |bq | pour
tout q ∈ N, et dès lors limq→∞ Aq bq = 0. La thèse résulte du lemme d’Abel.
On a enfin le test de convergence de Dirichlet.

Corollaire. Soit (ak )k∈N une suite dans K et (bk )k∈N une suite dans R
A. La suite (Aq )q∈N est bornée.
B $ . La suite (bk )k∈N est monotone et converge vers zéro.
%
Démonstration. On montre, comme dans le test d’Abel, que la condition
B’ entraı̂ne l’hypothèse B du test de Dedekind.
Exemples. 1. Le test de Dirichlet s’applique aux séries trigonométriques
%
k∈N dk exp ikt pour t /= 2πm, m ∈ Z, lorsque la suite (dk )k∈N est décrois-
sante et a une limite nulle. Ce sera en particulier le cas pour les séries
$
k−c exp(ikt)
k∈N
quel que soit c > 0 et t /= 2πm, m ∈ Z. On en déduit en particulier la

%
convergence de la série potentielle k∈N k−c z k considérée plus haut pour
tout z /= 1 tel que |z| = 1 et tout c ∈ ]0, 1]. Rappelons qu’on avait déjà
démontré la convergence absolue de cette série pour tout z tel que |z| = 1
et tout c > 1.
2. Une autre classe intéressante de séries auxquelles le test de Dirichlet
%
s’applique est celle des séries alternées k∈N (−1)k bk où les bk sont réels et
positifs. En posant ak = (−1)k , on trouve aussitôt que A2q = 1, A2q+1 =
0, et donc |Aq | ≤ 1 quel que soit q ∈ N. Le test de Dirichlet entraı̂ne
alors que la série alternée converge dès que la suite (bk )k∈N décroit vers
zéro. Ce sera en particulier le cas pour les séries de Riemann alternées
% (−1)k
k∈N∗ kc qui convergent quel que soit c > 0. On savait déjà qu’elles
convergeaient absolument si et seulement si c > 1. Elles sont donc non
absolument convergente pour c ∈ ]0, 1]. C’est en particulier le cas pour la
% k
série harmonique alternée k∈N∗ (−1) k .
Remarque. On appellera plus généralement série trigonométrique toute
série de la forme $
[d−k exp(−ikt) + dk exp(ikt)]
k∈N
où les d−k et dk sont des nombres complexes et t ∈ R. Lorsque d−k = dk

pour chaque k ∈ N, la série est réelle et peut encore s’écrire
$
a0 + (ak cos kt + bk sin kt)
k∈N
11.8. EXERCICES 433
avec ak = dk + d−k , bk = i(dk − d−k ), (k ∈ N). Si l’on pose Ak = (a2k + b2k )1/2
et θk = arctan abkk , cette dernière série prend la forme équivalente
$
Ak sin(kt + θk ).
k∈N
L’étude de la convergence des séries trigonométriques est l’un des chapitres

les plus importants et les plus délicats de l’analyse.
11.8 Exercices
1. Utiliser le théorème de Hake, la convergence de la série harmonique
alternée et la divergence de la série harmonique pour montrer que la fonction
f de R dans R définie par f (0) = 0 et
2 3
1
f (x) = (−1)[ x ]
1
,
x
pour x ∈ ]0, 1] (où [u] désigne la partie entière de u) est intégrable sur [0, 1]
mais n’y est pas L-intégrable.
2. Soit g une fonction de R dans R de classe C 1 sur R et a− , a+ deux zéros
consécutifs de g entre lesquels g est strictement positive. Utiliser le théorème
de Lagrange et le test de la limite d’intégrabilité pour montrer que, si a− et
a+ sont des zéros simples de g (c’est-à-dire des zéros tels que g $ (a− ) /= 0 et
g $ (a+ ) /= 0) alors la fonction x 2→ √ 1 est intégrable sur ]a− , a+ [. Ce type
g(x)
d’intégrale intervient dans la discussion, à partir de l’intégrale d’énergie, du
mouvement d’un système mécanique conservatif à un degré de liberté.
3. Montrer que la fonction f de R dans R définie par f (0) = 0 et f (x) = x1
si x /= 0 n’est pas intégrable sur ]a, b[ lorsque a < 0 < b. Montrer toutefois
que ,J -
−c dx J b
dx b
lim + = log .
c→0+ a x c x |a|
Cette limite s’appelle la valeur principale de Cauchy de l’“intégrale” de f
sur ]a, b[ et s’écrit
J b
dx b
vp = log .
a x |a|
4. Soit p ≥ 1 un entier, f une fonction de R dans R de classe C p sur [0, 1],
et α ∈ ]0, 1[. En utilisant le reste de Lagrange du développement de Taylor
et le test d’intégrabilité de la limite, montrer que la fonction

p−1
f (x) − Tf,0 (x)
x 2→
xp+α
est intégrable sur [0, 1]. Son intégrale est appellée la partie finie de l’“inté-
grale” de la fonction x 2→ xfp+α
(x)
, et notée
J 1 f (x)
Pf dx.
0 xp+α
En particulier, montrer que
J 1 1+x 1
Pf dx = .
0 x1+α 1−α
5. Démontrer le théorème de Kummer : la série à termes strictement positifs
%
k∈N ak converge si et seulement s’il
8 existe une suite
9 (bk )k∈N de nombres
strictement positifs tels que limk→∞ bk ak+1 − bk+1 > 0. Suggestion: pour
ak
% %q
la condition nécessaire, si A = ∞k=0 ak , et Aq = k=0 ak , il suffit de prendre
bk = ak ; pour la condition suffisante, il existe h > 0 et m ∈ N tels que
A−Ak
ak
bk − bk+1 > h,
ak+1
pour tout k ≥ m. on en déduit aisément que, pour tout k ≥ m, on a
h(Ak − Am ) < bmam − bk ak < bm am ,
et dès lors la suite (Ak )k≥m est majorée par Am + bmham . En déduire le test
de Raabe : si limk→∞ k( aak+1 k
− 1) > 1, alors la série à termes strictement
%
positifs k∈N ak converge.
% m(m−1)...(m−k+1) k
6. Montrer que, si m ∈ R, la série binomiale k∈N k! z a un
rayon de convergence égal à un. Cette série se réduit au développement de
(1 + z)m par le binôme de Newton si m ≥ 1 est un entier.

Si on élève 1 + µ à la puissance m, le terme ne de la série sera
m(m − 1) . . .(m − n + 2)
µn−1 ,
2.3.4. . . ..(n − 1)
et le suivant, c’est-à-dire le (n + 1)e , sera
m(m − 1) . . . (m − n + 2)(m − n + 1)
µn ;
2.3.4. . . .(n − 1).n
donc le rapport du (n + 1)e terme au ne sera µ (m−n+1)

n ; or pour que la série
soit convergente, il faut que ce rapport (abstraction faite du signe qu’il doit
avoir) soit plus petit que l’unité.
Lorsque la série
u0 , u1 , u2 , . . . , un , etc, . . .
a tous ses termes positifs, on peut ordinairement décider si elle est conver-
gente ou divergente, à l’aide du théorème suivant. Théorème. Cherchez la
limite ou les limites vers lesquelles converge, tandis que n croı̂t indéfiniment,
l’expression (un )1/n ; et désignez par k la plus grande de ces limites, ou, en
d’autres termes, la limite des plus grandes valeurs de l’expression dont il
s’agit. La série sera convergente, si l’on a k < 1, et divergente, si l’on a
k > 1.
Soit
a0 , a1 x, a2 x2 , . . . , an xn , etc . . . ,
une série ordonnée suivant les puissances entières et ascendantes de la vari-
able x. Théorème. Soit A la limite vers laquelle converge, pour des valeurs
croissantes de n, la racine ne des plus grandes valeurs numériques de an .
La série sera convergente pour toutes les valeurs de x comprises entre les
limites
1 1
x=− , x=+ ,
A A
et divergentes pour toutes les valeurs de x situées hors des mêmes limites.
Etant donné une série
a0 + a1 x + . . . + am xm + . . . ,
on peut se proposer de déterminer, s’il y a lieu, son cercle de convergence.

Cette question a été traitée par M. Lecornu (Comptes rendus, 7 février 1887)
1/m
dans le cas où le module de am+1
am ou celui de am a une limite. Cette limite
est alors l’inverse du rayon de convergence. L’objet de la présente note est
de résoudre le problème dans tous les cas. Pour cela, je rappellerai quelques
principes relatifs aux suites infinies.
Soit une suite infinie de nombres positifs
u0 , u1 , . . . , um, . . . .
Il peut arriver, comme premier cas, que cette suite contienne des termes
supérieures à tout nombre donné A.
S’il n’en est pas ainsi, il y a lieu de distinguer deux classes de nombres.
Dans la première, on mettra tout nombre A tel qu’il existe dans la suite des
termes d’un rang aussi élevé qu’on le veut supérieurs à A; dans la seconde,
tout nombre B, tel que tous les termes de la suite, à partir d’un certain
rang, soient moindres que B. Il est clair que si un nombre A appartient à la
première classe, il en est de même de tous les nombres inférieurs, et que si
un nombre B est de la seconde classe, il en est de même de tous les nombres
supérieurs. La supposition que nous avons faite au commencement de cet
alinée consiste dans l’existence des nombres de la seconde classe.
Il est alors facile de définir, par des procédés bien connus, un nombre
α, tel que la première classe soit composée des nombres plus petits que α,
et la seconde, des nombres plus grands que α; en sorte que α − !(! > 0)
appartiendra à la première classe, et α + ! à la seconde. Pour abréger, nous
appellerons ce nombre α la limite supérieure de la suite.
Cette limite est nulle dans le cas où la suite tend vers 0, et dans ce cas
seulement.
Cela posé, pour rechercher le cercle de convergence de la série donnée, il
suffira de considérer la suite
|a1 |, |a2|1/2, . . . , |am|1/m, . . . .
1. Si cette suite contient des termes supérieurs à toute quantité donnée, la
série n’est jamais convergente;
2. Si cette suite ne renferme pas de termes augmentant indéfiniment, elle
admet une limite supérieure α. Le rayon de convergence de la série est alors
ρ = α1 .
3. La condition nécessaire et suffisante pour que la série soit convergente
dans tout le plan et représente une fonction entière est que |am |1/m tende
vers zéro.
Jacques Hadamard, 1888
Chapitre 12
Suites et séries de fonctions
12.1 Convergence ponctuelle

De nombreuses fonctions intervenant en analyse s’obtiennent comme limites
de suites de fonctions plus simples. Le but de ce chapitre est d’étudier la
conservation éventuelle, après passage à la limite, de différentes propriétés
des fonctions de la suite. Nous allons voir que cette conservation dépend du
mode de passage à la limite.
Soit (fk )k∈N une suite de fonctions de Rn dans Rp, c’est-à-dire une appli-
cation de N dans l’ensemble des fonctions de Rn dans Rp , soit E une partie
de Rn contenue dans dom fk pour chaque k ∈ N et soit f une application
de E dans Rp .
Définition. On dit que la suite (fk )k∈N converge simplement ou ponctuel-
lement sur E vers f si, pour chaque x ∈ E, la suite (dans Rp) (fk (x))k∈N
converge vers f (x).
Cette définition et l’unicité de la limite d’une suite dans Rp entraı̂nent
aussitôt qu’il existe au plus une application f de E dans Rp vérifiant les
conditions de cette définition. Lorsqu’elle existe, cette application s’appelle
la limite ponctuelle sur E de la suite (fk )k∈N.
En explicitant la définition de convergence d’une suite dans Rp, on trouve
immédiatement que (fk )k∈N converge ponctuellement sur E vers f si et seule-
ment si
(∀x ∈ E)(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m) : |fk (x) − f (x)|2 ≤ !, (12.1)
la norme | · |2 pouvant évidemment être remplacée par une autre. On voit

que le m donné dans (12.1) dépendra en général d’ ! et de x. Il est évident
437
438 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS
que, si G ⊂ E, la convergence ponctuelle sur E vers f de la suite (fk )k∈N

entraı̂ne la convergence ponctuelle de cette suite sur G vers la restriction de
f à G.
Exemples. 1. Si E = [0, 1], la suite de fonctions réelles (fk )k∈N définies par
fk (x) = xk converge ponctuellement sur E vers l’application réelle f définie
par f (x) = 0 si x ∈ [0, 1[ et f (1) = 1. Pour chaque 0 < ! < 1 et chaque
x ∈ [0, 1], le plus petit entier m = m(!, x) pour lequel (12.1) est satisfaite est
donné par m(!, 0) = 0, m(!, 1) =D 0 et,
E
pour 0 < x < 1, m(!, x) = ln x si ce
ln !
dernier nombre est entier et par ln x + 1, s’il ne l’est pas, où [y] désigne la
ln !
partie entière du réel y. On voit donc que m(!, x) tend vers l’infini lorsque
x tend vers 1 par valeurs strictement inférieures à un.
2. Considérons la suite (fk )k∈N de fonctions réelles d’une variable réelle
définies par fk (x) = 1+(x−k)
1
2 . Pour chaque k ∈ N, on vérifie facilement que
1
lim = 0.
k→∞ 1 + (x − k)2
Par conséquent, cette suite converge ponctuellement sur R vers l’application
nulle. Le lecteur vérifiera facilement que la quantité m(!, x) introduite dans
l’exemple précédent tend vers +∞ lorsque x tend vers l’infini.
3. Si E = R, la suite de fonctions réelles (fk )k∈N définies par f0 (x) = 0
et fk (x) = k−1/2 sin kx pour k ≥ 1 converge ponctuellement sur R vers
l’application nulle sur R.
La conséquence immédiate suivante de la définition et des propriétés des
suites dans Rp montre qu’on peut se ramener à l’étude de la convergence
ponctuelle des suites de fonctions réelles.
Proposition. La suite (fk )k∈N converge ponctuellement sur E vers f si et
seulement si chaque suite de fonctions réelles (pq ◦fk )k∈N converge ponctuelle-
ment sur E vers pq ◦ f .
Le critère de Cauchy de convergence d’une suite dans Rp appliqué à
chaque suite (fk (x))k∈N fournit évidemment un critère de Cauchy de
convergence ponctuelle sur E.
Proposition. La suite (fk )k∈N converge ponctuellement sur E si et seule-
ment si
(∀x ∈ E)(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q ≥ m) :
|fk (x) − fq (x)|2 ≤ !.

On peut évidemment considérer aussi des séries de fonctions.
12.1. CONVERGENCE PONCTUELLE 439
Définition. On appelle série de fonctions de termes fk , k ∈ N, et l’on note

%
k∈N fk , la suite de fonctions (Fq )q∈N , où chaque fonction somme partielle
Fq est définie par
q
$
Fq = fk .
k=0
Définition. Soit F une application de E dans Rp . On dit que la série

%
k∈N fk converge simplement ou ponctuellement sur E vers F si la suite
(Fq )q∈N converge ponctuellement sur E vers F .
Si elle existe, l’unique application F vérifiant cette définition s’appelle
% %
alors la somme de la série de fonctions k∈N fk et se note ∞ k=0 fk . Il résulte
%
immédiatement de la définition que k∈N fk converge ponctuellement sur E
%
vers F si et seulement si, pour chaque x ∈ E, la série (dans Rp ) k∈N fk (x)
converge vers F (x).
Exemple. Si, pour chaque k ∈ N, la fonction réelle d’une variable réelle fk
est définie par fk (x) = xk /k, on a vu en étudiant les séries entières que la
%
série k∈N fk converge ponctuellement sur [−1, 1[.
La notion de convergence absolue d’une série dans Rp conduit à un second
type de convergence pour une série de fonctions.
%
Définition. On dit que la série de fonctions k∈N fk converge absolument
%
sur E si, pour chaque x ∈ E, la série numérique k∈N |fk (x)|2 converge,
%
c’est-à-dire si, pour chaque x ∈ E, la série (dans Rp) k∈N fk (x) converge
absolument.
La propriété suivante est une conséquence immédiate de la définition et
d’une propriété connue des séries dans Rp .
%
Proposition. Si la série de fonctions k∈N fk converge absolument sur E,
elle converge ponctuellement sur E.
Exemples. 1. Soit fk les fonctions réelles d’une variable réelle définies par
%
fk (x) = k−x et soit E =]1, +∞[. La série k∈N fk converge absolument sur E
et sa somme est la restriction à ]1, +∞[ d’une fonction complexe d’une vari-
able complexe appelée la fonction zeta (ζ). Cette fonction joue un grand rôle
en théorie analytique des nombres. Bernhard Riemann a conjecturé en 1859
que les zéros non triviaux de cette fonction ont tous une partie réelle égale
à 1/2. Vérifiée pour les quelques premiers millions de zéros de la fonction,
cette hypothèse de Riemann attend encore sa démonstration. Celle-ci perme-
ttrait de préciser le théorème des nombres premiers, conjecturé en 1792 par
Karl-Friedrich Gauss et seulement démontré en 1896 (indépendamment) par
Jacques Hadamard et Charles-Jean de La Vallée Poussin . Ce théorème

affirme que le nombre π(k) de nombre premiers inférieurs ou égaux à un en-
tier positif k est tel que
π(k)
lim = 1.
k→∞ k/ ln k
2. Soit fk les fonctions complexes d’une variable complexe définies par

fk (z) = z k et considérée comme fonction de R2 dans R2 . En vertu des
%
résultats sur la convergence de la série géométrique, la série k∈N fk converge
absolument sur B2 (0; 1) vers l’application F définie par F (z) = 1−z 1
.
3. Si les fonctions réelles d’une variable réelle fk sont définies par fk (x) =
x(1 − x)k , alors, pour chaque q ∈ N, on a Fq (0) = 0 et Fq (x) = 1 − (1 − x)q+1
si x /= 0. Par conséquent, puisque fk (x) = |fk (x)| pour chaque x ∈ [0, 1], la
% %
série k∈N fk converge absolument sur [0, 1] et ∞ k=1 x(1 − x) = 0 si x = 0
k
et est égale à 1 si x ∈]0, 1].

Enfin, on traduit aisément dans le langage des séries les critères de
Cauchy de convergence ponctuelle et de convergence absolue.
%
Proposition. La série de fonctions k∈N fk converge ponctuellement (resp.
absolument) sur E si et seulement si
(∀x ∈ E)(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q > k ≥ m) :

# #
# q # q
# $ # $
#
# fj (x) # ≤ !. (resp.
# |fj (x)|2 ≤ !.)
#j=k+1 # j=k+1
2
L’exemple 1 de suite de fonctions et l’exemple 3 de série de fonctions

montrent que la limite ponctuelle d’une suite de fonctions continues ou la
somme d’une série absolument convergente de fonctions continues n’est pas
nécessairement continue sur l’ensemble de convergence. D’ailleurs, dans ces
exemples, les fonctions sont indéfiniment dérivables et la limite ou la somme
ne l’est évidemment pas. La limite ponctuelle sur un ensemble d’une suite de
fonctions bornées sur cet ensemble n’y est pas nécessairement bornée. Ainsi,
pour chaque k ∈ N, la fonction réelle d’une variable réelle fk définie sur R∗+
par
k
fk (x) = ,
kx + 1
est bornée sur R+ par k et la suite converge ponctuellement sur R∗+ vers
l’application f définie par f (x) = 1/x qui n’est pas bornée sur R∗+ . Enfin,
la convergence ponctuelle ne préserve pas non plus l’intégrabilité. Dans
12.2. CONVERGENCE UNIFORME 441
l’exemple précédent, chaque fk est intégrable sur ]0, 1] alors que f ne l’est
pas, ainsi que cela se vérifie en utilisant le théorème de Hake.
Si l’on note que les propriétés des fonctions que nous venons d’analyser
expriment une certaine “solidarité” entre les valeurs de la fonction et que la
convergence ponctuelle (c’est-à-dire “point par point”) est un concept tout
à fait “individualiste”, on ne doit pas s’étonner trop que ces propriétés ne
subsistent pas nécessairement après passage à la limite. Il convient donc
d’introduire une notion de convergence plus globale si l’on veut que la fonc-
tion limite conserve de telles propriétés.
12.2 Convergence uniforme

Soit (fk )k∈N une suite de fonctions de Rn dans Rp , soit E une partie de Rn
contenue dans dom fk pour chaque k ∈ N et soit f une application de E
dans Rp . Nous allons introduire un type de convergence plus restrictif que
la convergence ponctuelle en imposant que la quantité m figurant dans la
définition (12.1) puisse être choisie indépendamment de x dans E.
Définition. On dit que la suite (fk )k∈N converge uniformément sur E vers
f si
(∀! > 0)(∃m ∈ N)(∀x ∈ E)(∀k ∈ N : k ≥ m) : |fk (x) − f (x)|2 ≤ !. (12.2)
Bien entendu, si G ⊂ E, la convergence uniforme vers f de (fk )k∈N sur
E entraı̂ne la convergence uniforme sur G de (fk )k∈N vers la restriction de
f à G.
Les propriétés du supremum entraı̂nent aussitôt le résultat suivant.
Proposition. Les propositions suivantes sont équivalentes :
1. (fk )k∈N converge uniformément sur E vers f .
2.
(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m) : sup |fk (x) − f (x)|2 ≤ !. (12.3)
x∈E
3. La suite réelle (supx∈E |fk (x) − f (x)|2 )k∈N converge vers zéro.
Exemple. Dans l’exemple 3 de suite de fonctions donné dans la section
précédente, il y a converge uniforme sur R vers l’application nulle puisque
la suite 4 5
−1/2
sup |k sin kx| = (k−1/2)k∈N∗
R k∈N∗
converge vers zéro.
Signalons une autre conséquence immédiate de la définition.
Proposition. Si (fk )k∈N converge uniformément sur E vers f , alors

(fk )k∈N converge ponctuellement sur E vers f .
L’unicité de la limite ponctuelle entraı̂ne alors qu’il existe au plus un f
vérifiant (12.2). On l’appelle souvent la limite uniforme de (fk )k∈N sur E et
elle est nécessairement égale à sa limite ponctuelle.
L’exemple 2 de suite de fonctions donné dans la section précédente mon-
tre que la convergence ponctuelle sur un ensemble n’entraı̂ne pas nécessaire-
ment la convergence uniforme sur cet ensemble. En effet, la suite de fonctions
donnée dans cet exemple converge ponctuellement sur R vers l’application
nulle alors que la suite
& # #'
# 1 #
#
sup # # ,
x∈R 1 + (x − k)2 # k∈N
qui est la suite constante 1, ne converge évidemment pas vers zéro.

On dispose d’un critère de Cauchy de convergence uniforme.
Théorème. La suite de fonctions (fk )k∈N converge uniformément sur E si
et seulement si
(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q ≥ m)(∀x ∈ E) : (12.4)
|fk (x) − fq (x)|2 ≤ !,

ou encore si et seulement si,
(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q ≥ m) :
sup |fk (x) − fq (x)|2 ≤ !.

x∈E
Démonstration. Condition nécessaire. Si ! > 0 est donné, alors, par

définition,
(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀x ∈ E) : |fk (x) − f (x)|2 ≤ !/2.
Dès lors, pour tout k ≥ m, tout q ≥ m et tout x ∈ E, on a
|fk (x) − fq (x)|2 ≤ |fk (x) − f (x)|2 + |f (x) − fq (x)|2 ≤ !/2 + !/2 = !.
Condition suffisante. Construisons tout d’abord un candidat pour l’ap-

plication limite f . Si la suite (fk )k∈N vérifie la condition de Cauchy (12.4),
alors, pour chaque x ∈ E, la suite (fk (x))k∈N est une suite de Cauchy dans
Rp et elle converge dès lors vers un élément de Rp que nous désignerons par
f (x). On obtient ainsi une application f de E dans Rp .
Montrons maintenant que (fk )k∈N converge uniformément sur E vers f .
Si ! > 0 est donné, la condition (12.4) implique que
(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀x ∈ E)(∀q ∈ N : q ≥ m) : |fk (x) − fq (x)|2 ≤ !.
En faisant tendre q vers l’infini, on obtient alors, par continuité de l’appli-

cation norme et conservation des inégalités par passage à la limite
(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀x ∈ E) : |fk (x) − f (x)|2 ≤ !,

Le critère de Cauchy permet de prouver la convergence uniforme sur
adh E de certaines suites de fonctions convergeant uniformément sur E.
Proposition. Soit (fk )k∈N une suite de fonctions de Rn dans Rp continues
sur adh E \ E qui converge uniformément sur E. Alors (fk )k∈N converge
uniformément sur adh E.
Démonstration. On peut évidemment supposer que adh E /= E. Si ! > 0
est donné, le critère de Cauchy de convergence uniforme sur E entraı̂ne
l’existence d’un m ∈ N tel que
(∀y ∈ E)(∀k ∈ N : k ≥ m)(∀q ∈ N : q ≥ m) : |fk (y) − fq (y)|2 ≤ !/3.
D’autre part, pour chaque x ∈ adh E \ E, la continuité de chaque fonction

fk au point x entraı̂ne l’existence d’un δ = δ(k, x) > 0 tel que
(∀y ∈ E : |y − x|2 ≤ δ(k, x)) : |fk (y) − fk (x)|2 ≤ !/3.
Dès lors, pour chaque x ∈ adh E \ E, k ≥ m et chaque q ≥ m, si nous

choisissons (ce qui est toujours possible puisque x ∈ adh E \ E) un y ∈ E
tel que
|y − x|2 ≤ min[δ(k, x), δ(q, x)],
nous obtenons
|fk (x) − fq (x)|2 ≤ |fk (x) − fk (y)|2 + |fk (y) − fq (y)|2 + |fq (y) − fq (x)|2
≤ !/3 + !/3 + !/3 = !,

ce qui entraı̂ne la convergence uniforme de (fk )k∈N sur adh E puisque la
condition de Cauchy était déjà satisfaite, avec le même m, pour chaque
x ∈ E.
Une forme contraposée et affaiblie de cette proposition est souvent utile.
Corollaire. Soit (fk )k∈N une suite de fonctions de Rn dans Rp continues

sur adh E. Si cette suite ne converge pas uniformément sur adh E, alors elle
ne converge pas uniformément sur E.
Passons maintenant à la convergence uniforme des séries de fonctions.

%
Soit k∈N fk une série dont les termes sont des fonctions définies sur E ⊂ Rn
et F une application de E dans Rp.
%
Définition. On dit que la série de fonctions k∈N fk converge uniformé-
ment sur E vers F si la suite (Fq )q∈N des sommes partielles converge unifor-
mément sur E vers F .
%
Définition. On dit que la série de fonctions k∈N fk converge absolument
%
uniformément sur E si la série de fonctions positives k∈N |fk |2 converge
uniformément sur E.
On notera que cette notion est plus forte que celle de convergence absolue
%
et uniforme de k∈N fk sur E.
%
Exemple. Considérons la série k∈N fk de fonctions complexes d’une vari-
able complexe fk définies par fk (z) = z k . On a vu que cette série converge
ponctuellement sur B2 (0; 1) vers l’application F : z 2→ 1−z
1
. Elle ne converge
pas uniformément sur B2 (0; 1) vers F car, pour chaque q ∈ N, on a
|z|q+1
sup |Fq (z) − F (z)| = sup = +∞.
z∈B2 (0;1) z∈B2 (0;1) |1 − z|
%
Toutefois, pour chaque r < 1, k∈N fk converge uniformément sur B2 [0; r]
vers F puisque
|z|q+1 r q+1
sup |Fq (z) − F (z)| = sup = ,
z∈B2 [0;r] z∈B2 [0;r] |1 − z| 1−r
et que le dernier terme peut être rendu inférieur ou égal à ! > 0 donné
en prenant q ≥ m pour m tel que r m+1 ≤ !(1 − r). Le même raisonnement
% %
appliqué à la série k∈N |z|k montre que k∈N fk converge en fait absolument
et uniformément sur B2 [0; r].
On traduit sans peine, dans le langage des séries, le critère de Cauchy
de convergence uniforme (resp. de convergence absolue uniforme).
%
Corollaire. La série de fonctions k∈N fk converge uniformément (resp.
absolument uniformément) sur E si et seulement si
(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q > k ≥ m)(∀x ∈ E) :
# #
# q # q
# $ # $
# fj (x)## ≤ !, (resp. |fj (x)|2 ≤ !),
#
#j=k+1 # j=k+1
2
ou, d’une manière équivalente, si et seulement si
(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q > k ≥ m) :
# #  
# q # q
# $ # $
sup ## fj (x)## ≤ !. (resp. sup  |fj (x)|2  ≤ !).
x∈E #j=k+1 # x∈E j=k+1
2
En particulier, puisqu’on a toujours l’inégalité
 
q
$ q
$
sup  |fj (x)|2 ≤ sup |fj (x)|2 ,
x∈E j=k+1 j=k+1 x∈E
on voit qu’il y aura toujours convergence absolue uniforme sur E pour la série
% %
de fonctions k∈N fk si la série à termes positifs k∈N supx∈E |fk (x)|2 est de
Cauchy, c’est-à-dire est convergente. Cette remarque suggère l’introduction
d’un nouveau type de convergence pour une série de fonctions.
%
Définition. On dit que la série k∈N fk de fonctions de Rn dans Rp con-
%
verge normalement sur E si la série à termes positifs k∈N supx∈E |fk (x)|2
converge.
Par la remarque que nous venons de faire, la convergence normale sur E
entraı̂ne évidemment la convergence absolue uniforme sur E.
On a l’intéressant test de comparaison de Weierstrass pour la
convergence normale.
%
Théorème. Considérons la série k∈N fk de fonctions de Rn dans Rp . S’il
%
existe une série convergente à termes positifs k∈N Mk telle que, pour chaque
k ∈ N et chaque x ∈ E on ait
|fk (x)|2 ≤ Mk ,
%
alors la série k∈N fk est normalement convergente sur E.
Démonstration. Pour chaque k ∈ N, on a, par hypothèse,
sup |fk (x)|2 ≤ Mk ,
x∈E
et la thèse résulte de la définition et du test de comparaison pour les séries

numériques.
Exemple. Soit s > 1 et fk la fonction complexe d’une variable réelle définie
par fk (x) = (k + 1)−s exp i(k + 1)x. Pour chaque k ∈ N et chaque x ∈ R, on
a
|fk (x)| ≤ (k + 1)−s
% %
et la série numérique k∈N (k + 1)−s est convergente. Donc la série k∈N fk
est normalement convergente sur R.
12.3 Régularité de la limite uniforme

Le résultat suivant est fondamental pour étudier la continuité et la dériva-
bilité de la limite uniforme d’une suite de fonctions continues ou dérivables.
Théorème. Soit (fk )k∈N une suite de fonctions de Rn dans Rp définies sur
E, f une application de E dans Rp et a ∈ adh E. Si les conditions suivantes
sont réalisées
1. La suite (fk )k∈N converge uniformément sur E vers f .
2. Pour chaque k ∈ N, limx→a, x∈E fk (x) = bk .
Alors la suite (bk )k∈N converge et
lim f (x) = lim bk .

x→a, x∈E k→∞
2 3 2 3
lim lim fk (x) = lim lim fk (x) .
x→a, x∈E k→∞ k→∞ x→a, x∈E
Démonstration. Pour montrer que la suite (bk )k∈N converge, il suffit de

montrer qu’elle est une suite de Cauchy. Si ! > 0 est donné, la condition de
Cauchy de convergence uniforme de (fk )k∈N sur E entraı̂ne l’existence d’un
m ∈ N tel que
(∀k ≥ m)(∀q ≥ m)(∀x ∈ E) : |fk (x) − fq (x)|2 ≤ !.
Dès lors, en faisant tendre x vers a et en utilisant la conservation d’une

inégalité par passage à la limite et la continuité de la fonction | · |2 , on
obtient
|bk − bq |2 ≤ !,
12.3. RÉGULARITÉ DE LA LIMITE UNIFORME 447
pour tout k ≥ m et tout q ≥ m, et (bk )k∈N est une suite de Cauchy dans Rp.
Si nous désignons sa limite par b, il reste à montrer que
lim f (x) = b.
x→a, x∈E
Etant donné un ! > 0, la convergence de (bk )k∈N vers b et la convergence

uniforme de (fk )k∈N vers f entraı̂nent respectivement l’existence d’un m$ ∈ N
et d’un m$$ ∈ N tels que, si m = max(m$ , m$$), on a
|bm − b|2 ≤ !/3
et
|fm (x) − f (x)|2 ≤ !/3
quel que soit x ∈ E. D’autre part, puisque limx→a, x∈E fm (x) = bm , il existe
un δ > 0 tel que
|fm (x) − bm|2 ≤ !/3
pour tout x ∈ E tel que |x − a|2 ≤ δ. Pour ces mêmes x, on aura donc
|f (x) − b|2 ≤ |f (x) − fm (x)|2 + |fm (x) − bm |2 + |bm − b|2
≤ !/3 + !/3 + !/3 = !,

On a un résultat similaire pour les séries de fonctions.
%
Corollaire. Soit k∈N fk une série de fonctions de Rn dans Rp définies sur
E, F une application de E dans Rp et a ∈ adh E. Si les conditions suivantes
sont satisfaites :
%
1. La série k∈N fk converge uniformément sur E vers F .
2. Pour chaque k ∈ N, limx→a, x∈E fk (x) = bk .
%
Alors la série k∈N bk converge et
∞
$
lim F (x) = bk .
x→a, x∈E
k=0
, ∞
- ∞ 2 3
$ $
lim fk (x) = lim fk (x) .
x→a, x∈E x→a, x∈E
k=0 k=0
Démonstration. En vertu des définitions, il suffit d’appliquer le théorè-

me ci-dessus à la suite des sommes partielles (Fq )q∈N et de noter que, par
suite des propriétés des limites des valeurs d’une fonction, on a, pour chaque
q ∈ N,
, q - q 2 3 q
$ $ $
lim Fq (x) = lim fk (x) = lim fk (x) = bk .
x→a, x∈E x→a, x∈E x→a, x∈E
k=0 k=0 k=0
%
Remarque. La convergence uniforme de la série k∈N fk sur E autorise
%
donc la permutation des symboles limx→a, x∈E et ∞ k=0 .
Les résultats suivants sont des conséquences immédiates du théorème et
du corollaire précédents et de la définition de continuité.
Corollaire. Si (fk )k∈N converge uniformément sur E vers f et si chaque
fonction fk est continue sur E, alors f est continue sur E.
%
Corollaire. Si k∈N fk converge uniformément sur E vers F et si chaque
fonction fk est continue sur E, alors F est continue sur E.
Considérons maintenant le problème de la conservation de la dérivabilité
par passage à la limite. La convergence uniforme d’une suite de fonctions
dérivables ne suffit pas à assurer la dérivabilité de la limite. Ainsi, la suite
k+2
(fk )k∈N de fonctions réelles d’une variable réelle définies par fk (x) = |x| k+1
et dérivables en chaque point de R converge uniformément sur [−1, 1] vers
la fonction valeur absolue qui n’est pas dérivable à l’origine. Il peut arriver
aussi que la limite soit dérivable mais ne soit pas égale à la limite des dérivées
des fonctions de la suite. Le résultat suivant fournit des conditions sous
lesquelles de telles conclusions sont exclues.
Théorème. Soit (fk )k∈N une suite de fonctions de Rn dans Rp définies sur
un ouvert E et soit f une application de E dans Rp . Supposons satisfaites
1. La suite (fk )k∈N converge ponctuellement sur E vers f .
2. Il existe 1 ≤ j ≤ n tel que, pour chaque k ∈ N, la dérivée partielle
Dj fk (x) existe pour chaque x ∈ E.
3. La suite de fonctions (Dj fk )k∈N converge uniformément sur E.
Alors Dj f (x) existe pour chaque x ∈ E et est égale à limk→∞ Dj fk (x). En
d’autres termes, on a
4 5
Dj lim fk (x) = lim Dj fk (x).
k→∞ k→∞
12.3. RÉGULARITÉ DE LA LIMITE UNIFORME 449
Démonstration. Soit x ∈ E fixé, r > 0 tel que Ix = [−r, r] ⊂ Ex = {h ∈

R : x + hej ∈ E}, et φ, φk les fonctions définies pour chaque k ∈ N par les
quotients différentiels
f (x + hej ) − f (x) fk (x + hej ) − fk (x)
φ(h) = , φk (h) = .
h h
Par construction, les fonctions φ et φk sont définies sur Ix \ {0} et sont telles
que
lim φk (h) = Dj fk (x), k ∈ N,
h→0, h∈Ix
et
lim φk (h) = φ(h), h ∈ Ix \ {0}.
k→∞
D’autre part, en appliquant l’inégalité de la moyenne à fk − fq , on trouve,
pour chaque h ∈ Ix \ {0}, chaque k ∈ N et chaque q ∈ N,
|φk (h) − φq (h)|2 = |h|−1 |fk (x + hej ) − fq (x + hej ) − [fk (x) − fq (x)]|2
≤ |Dj fk (x + h$ ej ) − Dj fq (x + h$ ej )|2 ,
pour un certain h$ tel que 0 < |h$ | < |h|.
Si ! > 0 est donné, la condition de Cauchy de convergence uniforme sur
E de (Dj fk )k∈N entraı̂ne l’existence d’un m ∈ N tel que, pour chaque k ≥ m,
chaque q ≥ m et chaque y ∈ E, on ait
|Dj fk (y) − Dj fq (y)|2 ≤ !.
Dès lors, puisque x + h$ ej ∈ E si h ∈ Ix \ {0}, on aura, pour chaque k ≥ m,

chaque q ≥ m et chaque h ∈ Ix \ {0},
|φk (h) − φq (h)|2 ≤ !.
En conséquence, la suite de fonctions (φk )k∈N converge uniformément sur

Ix \ {0} vers φ et, en lui appliquant le premier théorème de cette section, on
en déduit que
2 3 2 3
lim lim φk (h) = lim lim φk (h) ,
h→0, h∈Ix k→∞ k→∞ h→0, h∈Ix
c’est-à-dire, par des calculs faits plus haut, que
lim φ(h) = lim Dj fk (x).

h→0, h∈Ix k→∞
Donc Dj f (x) existe et est égal à limk→∞ Dj fk (x).

On a évidemment un résultat analogue pour les séries.

%
Corollaire. Soit k∈N fk une série de fonctions de Rn dans Rp dont les
termes sont définis sur un ouvert E et soit F une application de E dans Rp.
Supposons satisfaites les conditions suivantes.
%
1. La série k∈N fk converge ponctuellement sur E vers F .
2. Il existe 1 ≤ j ≤ n tel que, pour chaque k ∈ N, la dérivée partielle
Dj fk (x) existe pour chaque x ∈ E.
%
3. La série de fonctions k∈N Dj fk converge uniformément sur E.
%
Alors Dj F (x) existe pour chaque x ∈ E et est égale à ∞ k=0 Dj fk (x). En
d’autres termes, on a
& ∞
' ∞
$ $
Dj fk (x) = Dj fk (x).
k=0 k=0
Démonstration. Elle consiste à appliquer le théorème précédent à la suite

des sommes partielles. Les détails sont laissés au lecteur.
Montrons maintenant que la limite uniforme d’une suite de fonctions
bornées est bornée.
Proposition. Soit (fk )k∈N une suite de fonctions de Rn dans Rp définies
sur E et soit f une application de E dans Rp . Supposons satisfaites les
1. La suite (fk )k∈N converge uniformément sur E vers f .
2. Pour chaque k ∈ N, il existe Mk ≥ 0 tel que |fk (x)|2 ≤ Mk , pour tout
x ∈ E.
Alors il existe M ≥ 0 tel que |f (x)|2 ≤ M pour tout x ∈ E.
Démonstration. En prenant ! = 1 dans la définition de convergence
uniforme de (fk )k∈N sur E, on obtient un entier positif m tel que, pour
chaque x ∈ E, on a
|fm (x) − f (x)|2 ≤ 1,
ce qui entraı̂ne
|f (x)|2 = |f (x) − fm (x) + fm (x)|2 ≤ 1 + |fm (x)|2 ≤ 1 + Mm
pour tout x ∈ E et achève la démonstration.

Remarque. On pourrait démontrer maintenant que la limite uniforme
sur un pavé d’une suite de fonctions intégrables (resp. L-intégrables, R-
intégrables) sur ce pavé y est également intégrable (resp. L-intégrable,
12.4. UNE FONCTION CONTINUE SANS DÉRIVÉE 451
R-intégrable). Mais on trouvera plus loin des résultats plus généraux sur
l’intégrabilité ou la L-intégrabilité de la limite d’une suite de fonctions inté-
grables.
12.4 Une fonction continue sans dérivée

Les résultats que nous venons de développer permettent de construire un
exemple, donné par Henri Lebesgue en 1940, de fonction réelle d’une vari-
able réelle continue partout et dérivable nulle part. Considérons la série de
%
fonctions k∈N∗ fk où, pour chaque k ∈ N∗ , fk est l’application de R dans
R définie par
2
sin 2k x
fk (x) = .
2k
Chaque fk est évidemment continue sur R et telle que
1
sup |fk (x)| ≤ .
x∈R 2k
%
Le test de Weierstrass assure donc la convergence normale de k∈N∗ fk sur
R et la somme F de cette série sera une application continue de R dans R.
D’autre part, on aura, pour tout x ∈ R et tout h /= 0,
∞ 2 2 ∞
F (x + h) − F (x) $ sin 2k (x + h) − sin 2k x $
= = gk (x, h),
h k=1
2k h k=1
et dès lors, par le théorème de Lagrange, on aura, pour tout k ∈ N∗ , tout

x ∈ R et tout h /= 0,
2
|gk (x, h)| ≤ 2k −k = ak .
Comme ak < 12 ak+1 , on a, pour tout entier m ≥ 2,
m−1
$ 1 − (1/2)m−1 2 2
ak < am−1 < 2am−1 = 2(m−1) −(m−1)+1 = 2m −3m+3 .
k=1
1 − (1/2)
Donnons à h les quatre suites suivantes de valeurs tendant vers zéro lorsque
m tend vers l’infini
π π 3π 3π
h1,m = , h2,m = − m2 +1 , h3,m = m2 +1 , h4,m = − m2 +1 .
2m +1 2 2 2
2
2
Pour chaque m ∈ N∗ fixé, et chaque 1 ≤ j ≤ 4, 2k hj,m sera un multiple de
2π lorsque k > m, et dès lors gk (x, hj,m ) = 0. Pour k = m, on a, en posant
2
xk = 2k x,
4 5
π
gm (x, h1,m) = sin xm + − sin xm = cos xm − sin xm ,
2
4 5
π
gm (x, h2,m) = sin xm − − sin xm = − cos xm − sin xm ,
2
4 5
3π
gm (x, h3,m) = sin xm + − sin xm = − cos xm − sin xm ,
2
4 5
3π
gm (x, h4,m) = sin xm − − sin xm = cos xm − sin xm .
2
Comme
(cos xm − sin xm )2 + (cos xm + sin xm )2 = 2,
la valeur absolue d’un des termes au moins est supérieure ou égale à un, et
dès lors, pour les deux termes correspondants gm (x, hj,m), (avec j = 1, 4 ou
j = 2, 3), on aura
2 −m+1
1 2m
|gm(x, hj,m )| ≥ = .
2m 3π
2 3π
2m +1
En outre les termes correspondants seront de signe contraire. En résumé, on

aura donc
# #
# F (x + h ) − F (x) # 2
2m −m+1
# j,m # 2
# #> − 2m −3m+3 .
# hj,m # 3π
Comme le membre de droite tend vers l’infini avec m, on pourra donc tou-
jours trouver une suite (hjm ,m )m∈N∗ tendant vers zéro telle que la suite cor-
respondante &# #'
# F (x + h #
# jm ,m ) − F (x) #
# # ,
# hjm ,m #
m∈N∗
tende vers l’infini, et de telle sorte que pour chaque m le quotient différentiel
ait un signe choisi d’avance. En conséquence, la fonction F ainsi construite
n’a de dérivée (ni même de dérivée au sens large) en aucun point de R. On
notera que chaque somme partielle de la suite dont F est la limite est de
classe C ∞ !
12.5. SOMME D’UNE SÉRIE ENTIÈRE 453
Jusqu’à la moitié du XIXe siècle, les mathématiciens pensaient qu’une

fonction continue admet une dérivée sauf en quelques point exceptionnels.
Après un exemple partiellement discuté par Bernard Bolzano en 1830, et
un travail non publié de Charles Cellérier, le premier traitement rigoureux
d’un exemple de fonction continue non dérivable fut publié par Karl Weier-
strass en 1872; il s’agit de la somme de la série trigonométrique
∞
$
F (x) = ak cos(bk πx),
k=0
où b est un entier impair et a un réel tel que 0 < a < 1 et ab > 1 + (3/2)π.
Godefrey Harold Hardy a d’ailleurs montré en 1916 que la dernière con-
dition pouvait être remplacée par ab ≥ 1. De nombreux autres exemples
ont alors été proposés. Le graphe de telles fonctions constitue un ensem-
ble fractal dans la terminologie de Benoı̂t Mandelbrot. Après n’avoir été
pendant de nombreuses années que des “monstres mathématiques”, ces en-
sembles, souvent caractérisés par des propriétés d’auto-similarité quelle que
soit l’échelle à laquelle on les examine, sont depuis quelques années l’objet
d’un intérêt croissant et leur champ d’application aux sciences de la nature
ne cesse d’augmenter. Felix Hausdorff a introduit en 1919 une notion
de dimension qui redonne respectivement, pour les courbes, surfaces ou vol-
umes “réguliers”, les valeurs usuelles un, deux ou trois mais attribue, aux
ensembles fractals, des valeurs non entières! On sait que la dimension de
Hausdorff du graphe de la fonction de Weierstrass est strictement comprise
entre un et deux, mais on ignore toujours sa valeur exacte.
12.5 Somme d’une série entière

%
Soit k∈N ck (z − a)k une série entière, avec z ∈ C, a ∈ C, , ck ∈ C pour
chaque k ∈ N. Si R = 1/C avec
, -
8 9
,
q→∞ k≥q
désigne le rayon de convergence de cette série entière, elle convergera absolu-

ment sur son disque de convergence B2 (a; R), avec la convention B2 (a; R) =
{a} si R = 0 et B2 (a; R) = C si R = +∞. On peut évidemment con-
%
sidérer aussi cette série comme une série k∈N fk de fonctions complexes
d’une variable complexe fk définies par fk (z) = ck (z − a)k . On la notera
% %
alors k∈N ck (· − a)k . L’exemple de la série géométrique k∈N z k considérée
plus haut montre qu’une série entière peut ne pas converger uniformément
sur son disque de convergence. On va montrer qu’elle converge normalement
sur tout disque fermé centré en a et de rayon strictement inférieur au rayon
de convergence.
Proposition. Soit R le rayon de convergence de la série entière
$
ck (z − a)k .
k∈N
Alors la série de fonctions correspondante converge absolument sur B2 (a; R)

et normalement sur B2 [a; r] pour tout r ∈]0, R[.
Démonstration. La convergence absolue sur B2 (a; R) n’est qu’une refor-
mulation du théorème fondamental de convergence d’une série entière. Soit
r ∈]0, R[; pour chaque k ∈ N, on a
sup |ck (z − a)k | = |ck |r k .

z∈B2 [a;r]
%
D’autre part, la série numérique k∈N |ck |r k est convergente en vertu du
critère de la racine de Cauchy, puisque
, - , -
8 91/k 8 9 r
lim sup |ck |r k
= r lim sup |ck | 1/k
= < 1.
q→∞ k≥q q→∞ k≥q R
La thèse résulte alors du test de comparaison de Weierstrass.

Etudions maintenant les propriétés de la somme d’une série entière sur
son disque de convergence, c’est-à-dire les propriétés de l’application F :
B2 (a; R) → C définie par
∞
$
F (z) = ck (z − a)k .
k=0
Proposition. F est continue sur B2 (a; R).

Démonstration. Notons tout d’abord que chaque terme fk de la série
entière est un polynôme de C dans C et est donc continu sur C. Soit main-
tenant z ∈ B2 (a; R) fixé et r > 0 tel que |z − a| < r < R. Evidemment,
z ∈ int B2 [a; r] et, puisque la série converge uniformément sur B2 [a; r], sa
somme est continue sur cette boule et en particulier au point z.
Considérant maintenant la série entière comme une série de fonctions de

R2 dans R2 , nous pouvons étudier l’existence des dérivées partielles de sa
somme. Notons tout d’abord que chaque terme fk étant un polynôme sur
C, il sera C-dérivable en chaque point de C et vérifiera les conditions de
Cauchy-Riemann
D1 fk (z) = (1/i)D2fk (z) = fk$ (z) = kck (z − a)k−1 (12.5)
pour chaque z ∈ C et chaque k ∈ N∗ . On notera que le dernier terme de ces

égalités est le terme général de la série dérivée de la série entière de départ.
Proposition. En chaque point z ∈ B2 (a; R), la somme F de la série entière
%
k∈N ck (z − a) possède des dérivées partielles premières qui vérifient les
k
égalités
∞
$
D1 F (z) = (1/i)D2F (z) = kck (z − a)k−1 .
k=1
Démonstration. Pour appliquer le théorème de dérivabilité de la somme

d’une série de fonctions, il suffit de remarquer que la série entière considé-
rée converge ponctuellement sur B2 (a; R), que chaque terme fk possède en
chaque point z ∈ C des dérivées partielles premières par rapport à toutes les
variables vérifiant les conditions (12.5) et que les séries des dérivées partielles
%
qui sont respectivement égales à la série dérivée de k∈N ck (z − a)k et au
produit de cette série par 1/i ont le même rayon de convergence R que la série
%
k∈N ck (z − a) et convergent donc normalement sur B2 [a; r] quel que soit
k
r ∈]0, R[. Dès lors, pour obtenir la dérivabilité partielle de F en z ∈ B2 (a; R),
%
il suffit d’appliquer le théorème général à la série k∈N ck (z −a)k sur l’ouvert
B2 (a, r) où r ∈]0, R[ est tel que |z − a| < r. On a aussitôt
∞
$ ∞
$
D1 F (z) = D1 fk (z) = kck (z − a)k−1
k=1 k=1
∞
, ∞
-
$ $
= (1/i)D2fk (z) = (1/i)D2 fk (z) = (1/i)D2F (z),
k=1 k=1
Corollaire. En chaque point z ∈ B2 (a; R), la somme F de la série entière

%
k∈N ck (z−a) est% C-dérivable et sa C-dérivée F $ (z) est égale à la valeur en z
k
de la série dérivée ∞k=1 kck (z−a)

k−1 . La fonction F est dès lors indéfiniment
C-dérivable et, pour chaque j ∈ N∗ , on a

∞
$
F (j) (z) = k(k − 1) . . .(k − j + 1)ck (z − a)k−j .
k=j
Démonstration. C’est une conséquence immédiate de la Proposition

précédente, de la condition nécessaire et suffisante de C-dérivabilité de Fré-
chet-Young et du fait que le rayon de convergence reste le même quand on
passe d’une série entière à sa série dérivée.
Ainsi, la fonction exponentielle exp de C dans C définie pour chaque
z ∈ C comme somme de la série exponentielle de z est C-dérivable en chaque
point z de C et (exp)$ (z) = exp z. De même, la fonction sinus (resp. cosinus)
sin (resp. cos) de C dans C définie en chaque z ∈ C par la somme de la série
sinus (resp. cosinus) est C-dérivable en chaque z ∈ C et (sin)$ (z) = cos z
(resp. (cos)$ (z) = − sin z). Si α, β et γ sont des nombres complexes et si γ
n’est pas un entier strictement négatif, la somme de la série hypergéométrique
$ α(α + 1) . . . (α + k − 1)β(β + 1) . . .(β + k − 1)
1+ zk ,
k∈N∗
k!γ(γ + 1) . . .(γ + k − 1)
définit sur son disque de convergence B2 (0; 1) une fonction indéfiniment C-
dérivable que l’on appelle la fonction hypergéométrique et dont la valeur en
z ∈ B2 (0; 1) est notée F (α, β; γ; z).
Désignons par C(a; R) la frontière du disque B2 (a; R), c’est-à-dire l’en-
semble {z ∈ C : |z − a| = R}. Le résultat suivant, qui porte le nom de
théorème d’Abel, fournit des compléments d’information sur la conver-
gence d’une série entière et sur la régularité de sa somme lorsqu’il y a con-
vergence en un point de C(a; R).
%
Proposition. Si la série entière k∈N ck (z − a)k possède un rayon de con-
%
vergence R > 0 et s’il existe u ∈ C(a; R) tel que la série k∈N ck (u − a)k
%
converge, alors la série k∈N ck (.−a)k converge uniformément sur l’ensemble
[a, u] = {a + t(u − a) : t ∈ [0, 1]}
et, si F désigne sa somme sur B2 (a; R), alors

∞
$
lim F (z) = ck (u − a)k .
z→u,z∈[a,u]\{u}
k=0
Démonstration. Pour démontrer la convergence uniforme de la série sur

[a, u], on utilise le critère de Cauchy et la transformation d’Abel. Si nous
%
posons, pour chaque q ∈ N, Sq = qk=0 ck (u − a)k , alors, en notant que
ck (u − a)k = Sk − Sk−1 pour k ≥ 1, nous obtenons, pour tout r > q ≥ 0,
r
$ r
$
ck [a + t(u − a) − a]k = ck tk (u − a)k
k=q+1 k=q+1
r
$ r
$ r
$
= tk (Sk − Sk−1 ) = tk Sk − tk Sk−1
k=q+1 k=q+1 k=q+1
r
$ r−1
$ r−1
$
= tk Sk − tk+1 Sk = Sk (tk − tk+1 ) + Sr tr − Sq tq+1
k=q+1 k=q k=q+1
r−1
$ r−1
$
= (Sk − Sq )(tk − tk+1 ) + Sq (tk − tk+1 ) + Sr tr − Sq tq+1
k=q+1 k=q+1
r−1
$ r−1
$ r−1
$
= (Sk − Sq )(tk − tk+1 ) + Sq tk − Sq tk+1 + Sr tr − Sq tq+1
k=q+1 k=q+1 k=q+1
r−1
$
= (Sk − Sq )(tk − tk+1 ) + (Sr − Sq )tr .
k=q+1
%
Par hypothèse, la suite (Sq )q∈N des sommes partielles de k∈N ck (u − a)k
converge et est donc de Cauchy; pour ! > 0 donné, il existe donc m ∈ N ne
dépendant que d’! tel que
|Sk − Sq | ≤ !/2
si k ≥ q ≥ m. Dès lors, en introduisant cette inégalité dans l’égalité ci-dessus

et en notant que 0 ≤ tk − tk+1 = tk (1 − t) ≤ 1 et 0 ≤ tr ≤ 1, on obtient
# #
# r # r−1
# $ # $
# ck [a + t(u − a) − a] # ≤
k#
|Sk − Sq |(tk − tk+1 ) + |Sr − Sq |tr
#
#k=q+1 # k=q+1
r−1
$
≤ (!/2) (tk − tk+1 ) + (!/2) = (!/2)(tq+1 − tr ) + (!/2)
k=q+1
= (!/2)[tq+1 (1 − tr−q−1 ) + 1] ≤ !.
En conséquence, il existe m ∈ N tel que, pour tout r > q ≥ m et tout

z ∈ [a, u], on ait # #
# $ #
# r #
#
# c k (z − a) k#
# ≤ !,
#k=q+1 #
ce qui implique la convergence uniforme de la série entière sur [a, u]. La

restriction à [a, u] de chaque terme de la série y étant continue, l’application
%
G définie sur [a, u] par G(z) = k∈N ck (z − a)k sera continue sur [a, u]. Mais
comme [a, u] \ {u} ⊂ B2 (a; R), on a nécessairement G(z) = F (z) pour tout
z ∈ [a, u] \ {u}, et dès lors
∞
$
ck (u − a)k = G(u) = lim G(z) =
z→u,z∈[a,u]
k=0
lim G(z) = lim F (z),

z→u,z∈[a,u]\{u} z→u,z∈[a,u]\{u}
12.6 Equations différentielles linéaires

Les propriétés des séries entières permettent de rechercher des solutions de
certaines équations différentielles linéaires à coefficients variables. A titre
d’exemple, considérons l’équation différentielle d’Hermite
y $$ (z) − 2zy $ (z) + 2νy(z) = 0,
où ν est un nombre réel, et voyons si elle possède des solutions qui peuvent
s’écrire comme somme d’une série entière dont le disque de convergence n’est
pas réduit à un point. Si
∞
$
y(z) = ck z k
k=0
est une telle solution, alors on aura, par les résultats de la section précédente,
∞
$ ∞
$
y $ (z) = kck z k−1 , y $$ (z) = (k − 1)kck z k−2 ,
k=1 k=2
et, en introduisant ces expressions dans l’équation on obtient

∞
$ ∞
$ ∞
$
(k − 1)kck z k−2 − 2 kck z k + 2ν ck z k = 0,
k=2 k=1 k=0
12.6. EQUATIONS DIFFÉRENTIELLES LINÉAIRES 459
c’est-à-dire, en regroupant les coefficients des termes de même puissance de

z,
∞
$
2(c2 + νc0 ) + [(k + 1)(k + 2)ck+2 − 2(k − ν)ck ]z k = 0.
k=1
Cette relation sera évidemment satisfaite si les ck sont tels que
(k + 1)(k + 2)ck+2 = 2(k − ν)ck , (k ∈ N).
Partant d’un c0 arbitraire et résolvant de proche en proche, on obtient
2k (−ν)(2 − ν)(4 − ν) . . . (2k − 2 − ν)

c2k = c0 , (k ∈ N∗ )
(2k)!
et
2k (1 − ν)(3 − ν) . . . (2k − 1 − ν)
c2k+1 = c1 , (k ∈ N∗ ).
(2k + 1)!
Posant u = z 2 , il est facile de voir que ces deux séries convergent pour tout
z ∈ C. Par conséquent, les calculs précédents sont justifiés pour ces séries et
chaque fonction de la forme cj yj où cj ∈ C est arbitraire et, j = 1, 2, y1 est
la somme de la série entière
∞ k
$ 2 (−ν)(2 − ν)(4 − ν) . . . (2k − 2 − ν)
y1 (z) = 1 + z 2k
k=1
(2k)!
et y2 est la somme de la série entière

∞ k
$ 2 (1 − ν)(3 − ν) . . . (2k − 1 − ν)
y2 (z) = 1 + z 2k+1 ,
k=1
(2k + 1)!
est une solution de l’équation différentielle donnée définie sur C. Il en est

dès lors de même pour c1 y1 + c2 y2 . Lorsque ν est un entier positif, il est
immédiat que l’une des fonctions yj se réduit à un polynôme en z, que l’on
appelle polynôme d’Hermite et qui joue un grand rôle en analyse.
La méthode peut encore fournir des solutions de ce type pour des équa-
tions différentielles linéaires singulières en 0, c’est-à-dire dont le coefficient
de la dérivée d’ordre le plus élevé s’annule en z = 0. Par exemple, si a et b
sont des nombres complexes tels que a ne soit pas nul et b ne soit pas égal à
un entier négatif, considérons l’équation différentielle
zy $$ (z) + (b − z)y $ (z) − ay(z) = 0

et recherchons ses solutions pouvant s’écrire sous la forme de la somme d’une

série entière
∞
$
y(z) = ck z k .
k=0
Procédant comme ci-dessus, on trouve, en introduisant cette expression dans
l’équation différentielle et en regroupant les coefficients des mêmes puissances
de z que l’on doit avoir
∞
$
[(k + 1)(k + b)ck+1 − (k + a)ck ]z k = 0,
k=0
ce qui sera le cas si les coefficients ck vérifient les relations

a+k
ck+1 = ck , k ∈ N,
(b + k)(k + 1)
qui fournissent aisément l’expression
(a + k − 1)(a + k − 2) . . .a
ck = c 0 , k ∈ N∗ .
k!(b + k − 1)(b + k − 2) . . . b
On vérifie aisément que la série entière
$ (a + k − 1)(a + k − 2) . . .a
zk
k∈N
k!(b + k − 1)(b + k − 2) . . . b
a un disque de convergence égal à C et dès lors sa somme, que l’on appelle

la fonction hypergéométrique confluente de Kummer et que l’on désigne par
M (a, b; z) est telle que, pour chaque c ∈ C, cM (a, b; ·) est une solution sur
C de l’équation différentielle donnée.
On peut montrer de la même manière que, pour chaque n ∈ N fixé,
l’équation différentielle de Bessel
z 2 y $$ (z) + zy $ (z) + (z 2 − n2 )y(z) = 0
possède les solutions cy où c ∈ C est arbitraire et y est la somme de la série
entière
$ (−1)k
z n+2k ,
k∈N
2 n+2k k!(n + k)!
dont le disque de convergence est égal à C. La fonction définie par la somme

de cette série entière s’appelle la fonction de Bessel d’ordre n et se note Jn .
On vérifiera aisément qu’on a la relation
J0$ (z) = −J1 (z).
12.7. SOMME D’UNE SÉRIE TRIGONOMÉTRIQUE 461
Les fonctions de Bessel jouent un grand rôle en analyse et dans ses applica-
tions à la physique.
Une équation différentielle linéaire importante est l’équation hypergéo-
métrique de Gauss
z(1 − z)y $$ (z) + [γ − (α + β + 1)z]y $ (z) − αβy(z) = 0
où α, β et γ sont des nombres complexes. La méthode que nous venons de

développer permet de montrer que si γ n’est pas un entier négatif, la somme
F (α, β; γ; z) de la série hypergéométrique
$ α(α + 1) . . . (α + k − 1)β(β + 1) . . .(β + k − 1)
1+ zk ,
k∈N∗
k!γ(γ + 1) . . .(γ + k − 1)
est solution, sur son disque de convergence B2 (0, 1), de l’équation hypergéo-
métrique de Gauss. En fait, pour des valeurs particulières de α, β et γ, la
série hypergéométrique fournit comme cas particulier ou comme cas limite
la plupart des fonctions élémentaires et de nombreuses fonctions transcen-
dantes comme par exemple les fonctions de Bessel et les fonctions de Kum-
mer considérées plus haut. Carl-Friedrich Gauss a démontré l’importante
formule
Γ(γ)Γ(γ − α − β)
F (α, β, γ; 1) = , si 8(γ − α − β) > 0,
Γ(γ − α)Γ(γ − β)
reliant la valeur de la somme de la série hypergéométrique au point 1 de la
frontière de son disque de convergence à la fonction Γ.
12.7 Somme d’une série trigonométrique

On a vu précédemment qu’une série trigonométrique est une série de la forme
$
(ak cos kx + bk sin kx)
k∈N
où x ∈ R et les ak et bk sont des nombres réels. Bien entendu, une série
trigonométrique peut également s’écrire sous la forme complexe
$
[c−k exp(−ikx) + ck exp ikx]
k∈N
avec
c−k = (1/2)(ak + ibk ) = ck , k ∈ N,
ce qui conduit aussi à considérer les séries trigonométriques complexes quel-

conques $
[c−k exp(−ikx) + ck exp ikx]
k∈N
où les c−k et ck sont des nombres complexes arbitraires. On a vu que
de telles séries trigonométriques apparaissaient lorsqu’on étudiait la con-
vergence d’une série entière sur la frontière de son disque de convergence.
Une série trigonométrique peut évidemment être considérée comme une série
%
de fonctions k∈N fk où les fonctions fk définies par
fk (x) = c−k exp(−ikx) + ck exp ikx
sont indéfiniment dérivables et 2π-périodiques sur R, c’est-à-dire telles que
fk (x + 2π) = fk (x)
pour tout x ∈ R. On ne dispose pas, comme pour les séries entières, de
résultat général pour la convergence uniforme des séries trigonométriques.
Toutefois, les résultats généraux sur la continuité et la dérivabilité des som-
mes de séries de fonctions fournissent les conditions suffisantes suivantes.
% %
Proposition. Si la série numérique k∈N(|ak | + |bk |) (resp. k∈N (|c−k | +
|ck |) converge, alors la série de fonctions
$
[ak cos(k·) + bk sin(k·)]
k∈N
(resp. $
[c−k exp(−ik·) + ck exp(ik·)])
k∈N
converge normalement sur R et sa somme est une fonction continue et 2π-
périodique sur R.
Démonstration. Si nous considérons, pour fixer les idées, le premier cas,
l’autre se traitant de même, nous voyons que, pour chaque k ∈ N et chaque
x ∈ R, on a
|fk (x)| = |ak cos kx + bk sin kx| ≤ |ak | + |bk |,
et la convergence normale sur R découle de l’hypothèse et du test de com-
paraison de Weierstrass. Comme la convergence normale entraı̂ne la con-
vergence uniforme sur R de la série et que chaque fk est continue sur R, sa
somme sera également continue sur R. Enfin, la convergence ponctuelle sur
R et les égalités Fq (x + 2π) = Fq (x) valables pour chaque x ∈ R et chaque
somme partielle Fq entrainent la propriété de 2π-périodicité pour la somme
de la série.
12.7. SOMME D’UNE SÉRIE TRIGONOMÉTRIQUE 463
Exemple. Pour chaque réel s > 1, la série trigonométrique

$
k−s [cos(k·) + sin(k·)]
k∈N∗
converge normalement sur R vers une fonction continue et 2π-périodique.

On a la condition suffisante suivante de dérivabilité de la somme d’une
série trigonométrique.
Proposition. S’il existe un entier m ≥ 1 tel que la série numérique
$
km (|ak | + |bk |)
k∈N
(resp. $
km (|c−k | + |ck |))
k∈N
converge, alors la somme F de la série trigonométrique
$
[ak cos(k·) + bk sin(k·)]
k∈N
(resp. $
[c−k exp(−ik·) + ck exp(ik·)])
k∈N
est m-fois continûment dérivable sur R et, pour chaque x ∈ R, et chaque
1 ≤ j ≤ m, la dérivée j-ème s’obtient en dérivant j fois sous le signe somme.
Démonstration. Il est aisé de voir que le résultat pour m ≥ 2 découle
aisément, par récurrence, du résultat pour m = 1 et il suffit de démontrer ce
dernier. Nous le ferons dans le cas d’une série trigonométrique réelle. Pour
chaque k ∈ N, et chaque x ∈ R, on a
|fk$ (x)| = | − kak sin kx + kbk cos kx| ≤ k(|ak | + |bk |),
et un argument semblable à celui de la Proposition précédente montre que la
%
série k∈N fk$ converge normalement sur R et que sa somme est une fonction
continue. D’ailleurs, comme
|ak | + |bk | ≤ k(|ak | + |bk |)
%
pour tout k ∈ N , la Proposition précédente montre que la série k∈N fk
∗
converge aussi normalement sur R. Les conditions du théorème de dérivabi-

lité de la somme d’une série de fonctions sont donc satisfaites. Donc F est
dérivable sur R et
∞
$
F $ (x) = fk$ (x),
k=0
ce qui montre que F est continûment dérivable et achève la démonstration.
Exemple. Si s > 2, la somme de la série trigonométrique

$
k−s [cos(k·) + sin(k·)]
k∈N∗
est m-fois continûment dérivable sur R, où m désigne la partie entière de

s − 1.
12.8 Convergence monotone

Soit (fk )k∈N une suite de fonctions réelles définies sur E ⊂ Rn .
Définition. On dit que (fk )k∈N est une suite croissante (resp. décroissante)
sur E de fonctions réelles si, pour chaque x ∈ E, la suite réelle (fk (x))k∈N est
croissante (resp. décroissante), c’est-à-dire si, pour chaque x ∈ E et chaque
k ∈ N, on a
fk+1 (x) ≥ fk (x). (resp. fk+1 (x) ≤ fk (x)).
Une suite de fonctions réelles sur E qui est croissante ou qui est dé-
croissante est appelée une suite monotone sur E de fonctions réelles. Bien
entendu, (fk )k∈N est croissante si et seulement si (−fk )k∈N est décroissante.
Définition. On dit que (fk )k∈N est une suite majorée (resp. minorée) sur
E de fonctions réelles s’il existe une application g de E dans R telle que,
pour chaque k ∈ N et chaque x ∈ E, on ait
fk (x) ≤ g(x). (resp. fk (x) ≥ g(x)).
Il est clair que (fk )k∈N est minorée sur E si et seulement si (−fk )k∈N est
majorée sur E et que (fk )k∈N est majorée (resp. minorée) sur E si et seule-
ment si la suite réelle (fk (x))k∈N est majorée (resp. minorée) pour chaque
x ∈ E. En combinant cette remarque à la condition nécessaire et suffisante
de convergence d’une suite réelle monotone, on obtient immédiatement un
critère de convergence ponctuelle d’une suite monotone de fonctions réelles.
Proposition. Une suite croissante (resp. décroissante) sur E de fonctions
réelles converge ponctuellement sur E si et seulement si elle est majorée
(resp. minorée) sur E.
On a vu plus haut que la convergence uniforme sur un ensemble était
une condition suffisante pour que la continuité des fonctions de la suite se
12.8. CONVERGENCE MONOTONE 465
transmette à la fonction limite. L’exemple de la suite (fk )k∈N de fonctions

continues définies par
1
fk (x) =
1 + (x − k)2
qui converge ponctuellement (mais non uniformément) sur R vers la fonction
continue zéro montre que la convergence uniforme n’est pas nécessaire pour
que la limite soit continue. Le théorème de Dini ou théorème de con-
vergence monotone pour les fonctions continues montre que lorsque
E est fermé borné et que la suite est monotone, la convergence uniforme
est une condition nécessaire et suffisante pour que la limite d’une suite de
fonctions continues sur E soit continue sur E.
Théorème. Soit E ⊂ Rn un fermé borné, (fk )k∈N une suite de fonctions
réelles définies sur E et f une application de E dans R vérifiant les conditions
suivantes.
1. La suite (fk )k∈N converge ponctuellement sur E vers f .
2. Chaque fonction fk est continue sur E.
3. La suite (fk )k∈N est monotone sur E.
Alors f est continue sur E si et seulement si (fk )k∈N converge uniformément
sur E vers f .
Démonstration. Condition suffisante. C’est une conséquence immédiate
de la préservation de la continuité par la convergence uniforme.
Condition nécessaire. On peut, sans perte de généralité, supposer que
(fk )k∈N est croissante. On a donc fq (x) ≥ fk (x), pour chaque entier q ≥
k et chaque x ∈ E, ce qui entraı̂ne, en faisant tendre q vers l’infini, que
f (x) ≥ fk (x) pour chaque entier k ∈ N et chaque x ∈ E. Si ! > 0 est donné,
l’hypothèse 1 entraı̂ne que
(∀x ∈ E)(∃m ∈ N)(∀k ∈ N : k ≥ m) : 0 ≤ f (x) − fk (x) ≤ !/2. (12.6)
Pour chaque x ∈ E, désignons par m(x) le plus petit entier positif m pour
lequel la condition (12.6) est satisfaite.
L’hypothèse 2, la continuité de f sur E, le caractère fermé borné de E et
le théorème de Heine entraı̂nent la continuité uniforme de chaque fonction
f − fk sur E. En conséquence,
(∀k ∈ N)(∃δk > 0)(∀x ∈ E)(∀y ∈ E : |y − x|∞ ≤ δk ) :
0 ≤ f (y) − fk (y) ≤ f (x) − fk (x) + !/2. (12.7)
Si nous définissons la jauge δ sur E par la relation
δ(x) = δm(x) , x ∈ E,
A B
le théorème de Cousin entraı̂ne l’existence d’une division (xj , E j ) (1≤j≤q)
telle que
q
>
E j = E, xj ∈ E j ⊂ B∞ [xj ; δ(xj )] = B∞ [xj ; δm(xj ) ], 1 ≤ j ≤ q.
j=1
Posons
m = max m(xj ),
1≤j≤q
et soit y ∈ E. Il existe donc un entier j compris entre 1 et q tel que y ∈ E j et

donc tel que y ∈ B∞ [xj ; δm(xj ) ]. En conséquence, en utilisant (12.6), (12.7)
et la croissance de (fk )k∈N , on trouve, pour tout k ≥ m,
0 ≤ f (y) − fk (y) ≤ f (y) − fm(xj ) (y) ≤ f (xj ) − fm(xj ) (xj ) + !/2
≤ !/2 + !/2 = !,
%
En se rappelant que la suite des sommes partielles d’une série k∈N fk de
fonctions fk positives sur un ensemble E dès que k ≥ 1 est nécessairement
croissante sur E, on a évidemment une formulation du théorème de Dini
pour ce type de séries.
%
Corollaire. Soit E ⊂ Rn un fermé borné, k∈N fk une série de fonctions
définies sur E et F une application de E dans R vérifiant les conditions
suivantes.
%
1. La série k∈N fk converge ponctuellement sur E vers F .
2. Chaque fonction fk est continue sur E.
3. fk est positive sur E pour chaque k ≥ 1.
%
Alors F est continue sur E si et seulement si k∈N fk converge uniformément
sur E vers F .
On possède, pour une suite monotone de fonctions intégrables, un théorè-
me dont la forme est analogue à celle du théorème de Dini. C’est l’important
théorème de Levi ou théorème de convergence monotone pour les
fonctions intégrables.
Théorème. Soit I ⊂ Rn un semi-pavé, (fk )k∈N une suite de fonctions réelles
définies sur I¯ et f une application de I¯ dans R vérifiant les conditions sui-
vantes.
1. La suite (fk )k∈N converge ponctuellement sur I¯ vers f .
2. Chaque fonction fk est intégrable sur I. ¯
3. La suite (fk )k∈N est monotone sur I. ¯

H
¯
Alors f est intégrable sur I si et seulement si la suite réelle ( I¯ fk )k∈N con-
verge, auquel cas l’on a
J J
f = lim fk ,
I¯ k→∞ I¯
c’est-à-dire J J
lim fk = lim fk .
I¯ k→∞ k→∞ I¯
Démonstration. Sans perte de généralité, on peut supposer que la suite

¯ auquel cas on a évidemment
(fk )k∈N est croissante sur I,
fk (x) ≤ fk+1 (x) ≤ f (x)
pour chaque k ∈ N et chaque x ∈ I. ¯

¯ l’inégalité ci-dessus en-
Condition nécessaire. Si f est intégrable sur I,
traı̂ne aussitôt que
J J J
fk ≤ fk+1 ≤ f.
I¯ I¯ I¯
H
Dès lors, la suite réelle ( I¯ fk )k∈N , croissante et majorée, est convergente.
H
Condition suffisante. Par hypothèse, la suite réelle ( I¯ fk )k∈N est crois-
sante et convergente, et nous poserons
J
J = lim fk .
k→∞ I¯
Il faut donc démontrer que f est intégrable sur I¯ et que son intégrale vaut
J. En d’autres termes, ! > 0 étant donné, il faut construire une jauge δ sur
I¯ pour laquelle la définition d’intégrabilité sur I¯ est satisfaite pour f .
Soit donc ! > 0 donné. Il existera un entier naturel q1 tel que, pour tout
entier k ≥ q1 , on ait
J
0≤J− fk ≤ !/3.
I¯
D’autre part, puisque la suite (fk )k∈N converge ponctuellement sur I¯ vers f ,
on aura
¯
(∀x ∈ I)(∃q(x) ∈ N, q(x) ≥ q1 )(∀k ∈ N : k ≥ q(x)) :
!
|fk (x) − f (x)| ≤ . (12.8)
3µ(I)
Si maintenant Π = {(x1 , I 1), . . . , (xm, I m)} est une P-partition quelconque

de I, on aura
# #
#m #
#$ #
|S(I, f, Π) − J| ≤ ## [f (x ) − fq(xj ) (x )]µ(I )##
j j j
#j=1 #
# # # #
#m 2 J 3# # $ m J #
#$ # # #
+ ## fq(xj ) (xj )µ(I j ) − fq(xj ) ## + ## fq(xj ) − J ## .
#j=1 I¯j # #j=1 I¯j #
Comme
# #
#$ # $
#m # m
# [f (x ) − f j (x )]µ(I )# ≤
j j j
|f (xj ) − fq(xj ) (xj )|µ(I j )
# q(x ) #
#j=1 # j=1
m
! $
≤ µ(I j ) = !/3
3µ(I) j=1
et que, si
r = min q(xj ), s = max q(xj ),
1≤j≤m 1≤j≤m
on a q1 ≤ r ≤ s et donc, en utilisant la croissance de (fk )k∈N,

J m J
$
0≤J− fs = J − fs
I¯ ¯j
j=1 I
m J
$ m J
$ J
≤J− fq(xj ) ≤ J − fr = J − fr ≤ !/3,
¯j ¯j I¯
j=1 I j=1 I
on obtient
# #
#m 2 J 3#
#$ #
|S(I, f, Π) − J| ≤ 2!/3 + ## fq(xj ) (xj )µ(I j ) − fq(xj ) ## .
#j=1 I¯j #
Il nous reste maintenant à construire une jauge δ sur I¯ telle que le dernier
terme de l’inégalité soit majoré par !/3 lorsque la P-partition Π est δ-fine.
Pour ce faire, notons que si nous groupons dans la somme ci-dessus les termes
pour lesquels les q(xj ) sont égaux à une même valeur k, nous obtenons,
# #
#m 2 J 3#
#$ #
#
# fq(xj ) (xj )µ(I j ) − fq(xj ) ##
#j=1 I¯j #
#  #
# s  2 J 3#
#$ $ #
= ## fk (xj )µ(I j ) − fk ##

#k=r {1≤j≤m : q(xj )=k} I¯j  #
# #
$s ## $ 2 J 3#
#
≤ #
# fk (xj )µ(I j ) − fk ## .
¯
k=r #{1≤j≤m : q(xj )=k} #
I j
Puisque chaque somme partielle regroupe tous les indices q(xj ) ayant la
même valeur k, on peut lui appliquer le lemme de Saks-Henstock relatif à la
¯ il existera
fonction fk . Comme, pour chaque k ∈ N, fk est intégrable sur I,
une jauge ηk sur I¯ telle que
# J #
#S(I, fk , Πk ) − fk # ≤ 1
# #
# ¯ # 2k
I
pour toute P-partition ηk -fine Πk de I. Choisissons un entier positif q2 tel

que
l
$ 1
≤ !/3
j=k
2j
dès que l ≥ k ≥ q2 . C’est toujours possible en vertu du critère de Cauchy

%
appliqué à la série géométrique convergente k∈N (1/2)k. Choisissons main-
tenant, pour chaque x ∈ I, ¯ le plus petit entier q(x) ≥ max(q1 , q2 ) qui vérifie
la relation (12.8) et définissons la jauge δ sur I¯ par la relation
¯
δ(x) = ηq(x)(x), x ∈ I.
Si la P-partition Π = {(x1 , I 1), . . . , (xm, I m)} est δ-fine, alors chaque famille
{(xj , I j ) : q(xj ) = k, 1 ≤ j ≤ m} sera telle que
I j ⊂ B∞ [xj ; δ(xj )] = B∞ [xj ; ηq(xj ) (xj )] = B∞ [xj ; ηk (xj )],
et, par le lemme de Saks-Henstock, on aura

# #
# 2 J 3#
# $ #
# fq(xj )(x )µ(I ) −
j j
fq(xj ) ##
#
#{1≤j≤m : q(xj )=k} I¯j #
# #
# 2 J 3#
# $ # 1
= ## fk (x )µ(I ) −
j j
fk ## ≤ k ,
#{1≤j≤m : q(xj )=k} I¯j # 2
et par conséquent,
# #
$s # $ 2 J 3#
# #
#
# fq(xj ) (xj )µ(I j ) − fq(xj ) ##
k=r #{1≤j≤m : q(xj )=k} I¯j #
s
$ 1
≤ ≤ !/3.
k=r
2k
On aura donc
|S(I, f, Π) − J| ≤ 2!/3 + !/3 = !,
dès que Π est δ-fine.
Le théorème de Levi est vrai pour la L-intégrabilité.
Corollaire. Soit I ⊂ Rn un semi-pavé, (fk )k∈N une suite de fonctions réelles
définies sur I¯ et f une application de I¯ dans R vérifiant les conditions sui-
vantes.
2. Chaque fonction fk est L-intégrable sur I.¯
3. La suite (fk )k∈N est monotone sur I.¯
H
Alors f est L-intégrable sur I¯ si et seulement si la suite réelle ( I¯ fk )k∈N
converge, auquel cas l’on a
J J
f = lim fk ,
I¯ k→∞ I¯
lim fk = lim fk .
I¯ k→∞ k→∞ I¯
Démonstration. Supposons pour fixer les idées que (fk )k∈N soit croissante
sur I.¯ La condition nécessaire se démontre exactement de la même manière.
Pour la condition suffisante, notons tout d’abord que la croissance de la suite
(fk )k∈N entraı̂ne la positivité des fonctions fk − f0 . D’autre part, la suite
(fH k − f0 )k∈N vérifie les conditions 1 àH3 du théorème de Levi et la suite réelle
( I¯(fk − f0 ))k∈N converge vers J − I¯ f0 . Le théorème de Levi appliqué à
cette suite entraı̂ne l’intégrabilité de sa limite f − f0 qui est une fonction
positive sur I. ¯ Donc f − f0 est L-intégrable sur I¯ et comme f0 l’est aussi
par hypothèse, il en est de même de f = (f − f0 ) + f0 .
En remarquant que les sommes partielles d’une série de fonctions fk
intégrables sur I¯ forment une suite croissante de fonctions intégrables sur I¯ si
elles sont positives pour k ≥ 1, on déduit facilement des résultats précédents
un théorème de convergence monotone de Levi pour les séries de
fonctions intégrables positives.
%
Corollaire. Soit I ⊂ Rn un semi-pavé, k∈N fk une série de fonctions
réelles définies sur I¯ et F une application de I¯ dans R vérifiant les con-
ditions suivantes.
%
1. La série k∈N fk converge ponctuellement sur I¯ vers F .
2. Chaque fonction fk est intégrable (resp. L-intégrable) sur I.¯
3. fk est positive sur I¯ pour chaque k ≥ 1.
Alors F est Hintégrable (resp. L-intégrable) sur I¯ si et seulement si la série
%
réelle k∈N I¯ fk converge, auquel cas l’on a
J ∞ J
$
F = fk ,
I¯ ¯
k=0 I
c’est-à-dire J $
∞ ∞ J
$
fk = fk .
I¯ k=0 ¯
k=0 I
On a également un théorème de convergence monotone de Levi

pour l’intégrabilité sur un intervalle non borné de R.
Corollaire. Soit U un intervalle non borné de R, (fk )k∈N une suite de fonc-
tions réelles définies sur U et f une application de U dans R vérifiant les
1. La suite (fk )k∈N converge ponctuellement sur U vers f .
2. Chaque fonction fk est intégrable sur U .
3. La suite (fk )k∈N est monotone sur U . H
Alors f est intégrable sur U si et seulement si la suite réelle ( U fk )k∈N
converge, auquel cas l’on a
J J
f = lim fk ,
U k→∞ U
lim fk = lim fk .
U k→∞ k→∞ U
Démonstration. Sans perte de généralité, on peut supposer que la suite

(fk )k∈N est croissante sur U et, en considérant (fk −f0 )k∈N au lieu de (fk )k∈N,
on peut supposer que chaque fonction fk est positive sur U . Enfin, on se
limitera au cas où U = [a, +∞[, les autres se traitant de même. La condi-
tion nécessaire se démontre comme dans le cas classique. Pour la condition
suffisante, il faut donc prouver que f Hest intégrable sur [a,H b] pour chaque
b > a et que, si l’on pose J = limk→∞ U fk , alors limb→+∞ ab f = J.
H
Soit donc b > a;Hla suite réelle ( ab fk )k∈N est croissante et majorée par la
suite convergente ( U fk )k∈N, donc est convergente, et le théorème de Levi
appliqué à la restriction à [a, b] de la suite (fk )k∈N entraı̂ne son intégrabilité
sur [a, b] et la relation
J b J b
f = lim fk . (12.9)
a k→∞ a
Pour chaque k ∈ N, l’intégrale indéfinie de fk est croissante sur U , puisque

fk est positive sur U , et dès lors, pour tout b > a, on a
J b J b J
fk ≤ lim fk = fk ,
a b→+∞ a U
ce qui implique, par (12.9), que, pour tout b > a, on a

J b J
f ≤ lim fk = J. (12.10)
a k→∞ U
Par conséquent, l’intégrale indéfinie de f , croissante sur U puisque f y est

positive, est majorée, et possède donc une limite inférieure ou égale à J.
Donc f est intégrable sur U et, pour tout b > a, on a
J b J
f≤ f ≤ J. (12.11)
a U
Il reste à montrer qu’on a en fait l’égalité. Soit ! > 0; comme

J & J '
b
J = lim fk = lim lim fk ,
k→∞ U k→∞ b→+∞ a
il existera r ∈ N tel que

J b
J − (!/2) ≤ lim fk ≤ J
b→+∞ a
dès que k ≥ r. En particulier, il existera c ∈ U tel que, pour tout b ≥ c, on

a J b
J −! ≤ fr ≤ J.
a
H
Comme la suite ( ab fk )k∈N est croissante et majorée par J, on aura donc,
pour tout k ≥ r et tout b ≥ c,
J b
J −! ≤ fk ≤ J,
a
12.9. CONVERGENCE MAJORÉE ET MINORÉE 473
ce qui implique, en faisant tendre k vers l’infini, et en utilisant (12.9), que

J b
J −! ≤ f ≤J
a
dès que b ≥ c, et la démonstration est complète.

Nous laisserons au lecteur le soin de formuler le résultat correspondant
pour une série de fonctions.
12.9 Convergence majorée et minorée

On a vu dans la section précédente que la convergence ponctuelle sur E d’une
suite monotone sur E de fonctions réelles pouvait se caractériser en termes
de majoration ou de minoration sur E. Nous allons démontrer dans cette
section un important résultat sur la conservation de l’intégrabilité (ou de
la L-intégrabilité) de la limite d’une suite de fonctions intégrables qui n’est
plus nécessairement monotone mais est maintenant minorée et majorée sur
E.
La démonstration de ce résultat repose sur le théorème de Levi et sur
une étude préliminaire de la conservation de l’intégrabilité par passage au
maximum ou au minimum de deux fonctions réelles intégrables. Rappelons
que si f et g sont deux fonctions réelles, les fonctions max(f, g) et min(f, g)
sont les fonctions réelles de domaine dom f ∩ dom g définies respectivement
par
max(f, g)(x) = max(f (x), g(x)), min(f, g)(x) = min(f (x), g(x)),
et que l’extension se fait facilement, de proche en proche, à un nombre fini

quelconque de fonctions. On vérifie facilement qu’on a aussi
max(f, g) = (1/2)(f + g + |f − g|), min(f, g) = (1/2)(f + g − |f − g|).
En particulier,
min(f, g) = − max(−f, −g),
et dès lors, si f et g sont intégrables sur un pavé fermé,
min(f, g)
le sera si et seulement si
max(f, g)
l’est. On ne peut pas espérer que le maximum et le minimum de deux fonc-

tions intégrables mais non L-intégrables sur un pavé fermé soient toujours
intégrables sur ce pavé fermé, puisqu’un tel resultat appliqué à une fonc-
tion f intégrable mais non L-intégrable et à la fonction g = 0 entraı̂nerait
l’intégrabilité de |f | = max(f, 0) − min(f, 0). Par contre, ces opérations
préservent toujours la L-intégrabilité.
Proposition. Si I est un semi-pavé de Rn et f et g des fonctions réelles

¯ alors max(f, g) et min(f, g) sont L-intégrables sur I.
L-intégrables sur I, ¯
Démonstration. Par hypothèse, f + g et f − g sont L-intégrables sur I¯

et donc |f − g| l’est aussi. La thèse résulte alors des formules ci-dessus.
On en déduit aisément une condition suffisante pour que l’intégrabilité

soit préservée.
Proposition. Si I est un semi-pavé de Rn et f, g et h sont des fonctions

réelles intégrables sur I¯ telles que f et g soient toutes deux minorées ou
majorées par h sur I, ¯ alors max(f, g) et min(f, g) sont intégrables sur I¯ et
J 4J J 5 J 4J J 5
max(f, g) ≥ max f, g , min(f, g) ≤ min f, g .
I¯ I¯ I¯ I¯ I¯ I¯
Démonstration. Par hypothèse, f − h et g − h sont de signe constant et

intégrables sur I¯ et y sont donc L-intégrables. Il en est dès lors de même,
par la proposition précédente, pour max(f − h, g − h) = max(f, g) − h et
min(f − h, g − h) = min(f, g) − h, ce qui entraı̂ne aussitôt l’intégrabilité sur
I¯ de max(f, g) et min(f, g).
Les deux propositions ci-dessus s’étendent immédiatement à un nombre

fini de fonctions et au cas de l’intégrale sur un intervalle non borné.
Définition. Si f est une fonction réelle, on définit la partie positive f + de

f par f + = max(f, 0) et la partie négative f − de f par f − = max(−f, 0) =
− min(f, 0).
En conséquence, f + et f − sont deux fonctions positives telles que
f = f + − f − , |f | = f + + f − , f + = (1/2)(|f | + f ), f − = (1/2)(|f | − f ).
Ces formules fournissent une intéressante caractérisation de la L-intégra-

bilité pour les fonctions réelles.
Proposition. Soit I un semi-pavé de Rn et f une fonction réelle définie sur

¯ Alors f est L-intégrable sur I¯ si et seulement si f + et f − sont intégrables
I.
¯
sur I.
Démonstration. Cela résulte des égalités |f | = f + 2f − = 2f + − f et de
la définition de L-intégrabilité.
Corollaire. Soit I un semi-pavé de Rn et f une fonction réelle définie sur

¯ Si f est intégrable sur I¯ et n’est pas L-intégrable sur I,
I. ¯ alors f + et f −
¯
ne sont pas intégrables sur I.
Nous pouvons maintenant énoncer et démontrer l’important théorème
de Lebesgue ou théorème de convergence majorée et minorée pour
les suites de fonctions réelles intégrables.
Théorème. Soit I un semi-pavé de Rn , (fk )k∈N une suite de fonctions
réelles définies sur I¯ et f une application de I¯ dans R. Supposons satis-
faites les conditions suivantes.
3. Il existe des fonctions réelles g et h intégrables sur I¯ et telles que
g(x) ≤ fk (x) ≤ h(x)

Alors f est intégrable sur I¯ et l’on a
J J
f = lim fk ,
I¯ k→∞ I¯
lim fk = lim fk .
I¯ k→∞ k→∞ I¯
Démonstration. k et q étant des entiers naturels, posons
φk,q = min(fk , fk+1 , . . ., fk+q ), Φk,q = max(fk , fk+1 , . . . , fk+q ).
En vertu des hypothèses 2 et 3 et de la discussion qui précède, φk,q et Φk,q

sont intégrables sur I¯ pour chaque entier naturel k et q et, par construction,
on a, pour tout k, tout q ≥ 1 et tout x ∈ I, ¯
g(x) ≤ φk,q+1 (x) ≤ φk,q (x) ≤ φk+1,q−1 (x) ≤ fk+1 (x)

≤ Φk+1,q−1 (x) ≤ Φk,q (x) ≤ Φk,q+1 (x) ≤ h(x). (12.12)
Dès lors, pour chaque k ∈ N fixé, la suite de fonctions réelles (φk,q )q∈N (resp.
(Φk,q )q∈N) est décroissante et minorée (resp. croissante et majorée) sur I, ¯ et
¯
elle converge donc ponctuellement sur I vers une application φk (resp. Φk )
de I¯ dans R. On déduit de (12.12), en faisant tendre q vers l’infini, que l’on
a
g(x) ≤ φk (x) ≤ φk+1 (x) ≤ fk+1 (x) ≤ Φk+1 (x) ≤ Φk (x) ≤ h(x), (12.13)
pour chaque x ∈ I¯ et chaque k ∈ N. D’ailleurs, par intégration sur I¯

des
H
inégalités (12.12),
H
on voit que, pour chaque k ∈ N fixé, la suite
H
réelle
( I¯ φk,q )q∈N (resp. ( I¯ Φk,q )Hq∈N) est décroissante et minorée par I¯ g (resp.
croissante et majorée par I¯ h), et est donc convergente. On peut donc
appliquer le théorème de convergence monotone de Levi aux deux suites
(φk,q )q∈N et (Φk,q )q∈N et en déduire, pour chaque k ∈ N, l’intégrabilité sur I¯
de φk et Φk et les relations
J J J J
lim φk,q = φk , lim Φk,q = Φk . (12.14)
q→∞ I¯ I¯ q→∞ I¯ I¯
D’autre part, la relation (12.13) montre que la suite de fonctions (φk )k∈N
(resp. (Φk )k∈N) est croissante et majorée par h (resp. décroissante et minorée
par g), et donc ponctuellement convergente, sur I. ¯ En fait, on a, pour chaque
¯
x ∈ I,
lim φk (x) = lim Φk (x) = lim fk (x) = f (x), (12.15)

k→∞ k→∞ k→∞
¯ l’hypothèse 1 entraı̂ne l’existence

puisque, si ! > 0 est donné et si x ∈ I,
d’un entier naturel m tel que
f (x) − ! ≤ fk (x) ≤ f (x) + !
si k ≥ m. Par conséquent, pour tout k ≥ m et tout q ∈ N, on a aussi
f (x) − ! ≤ φk,q (x) ≤ fk (x) ≤ Φk,q (x) ≤ f (x) + !,
et dès lors, en faisant tendre q vers l’infini, on a, pour chaque k ≥ m,
f (x) − ! ≤ φk (x) ≤ fk (x) ≤ Φk (x) ≤ f (x) + !,
ce qui prouve (12.15).

H
Par intégration
H
sur I¯ des inégalités (12.13), on voit que
la suite réelle ( I¯ φk )k∈N (resp. ( I¯ Φk )k∈N ) est croissante et majorée (resp.
décroissante et minorée), et donc convergente. En appliquant le théorème
de convergence monotone de Levi aux suites (φk )k∈N et (Φk )k∈N, on voit que
f est intégrable sur I¯ et que, par suite de (12.15),
J J J
f = lim φk = lim Φk .
I¯ k→∞ I¯ k→∞ I¯
Mais, en intégrant (12.13) sur I¯ et en passant à la limite, on trouve que

J J J J J
f = lim φk ≤ lim fk ≤ Φk = f,
I¯ k→∞ I¯ k→∞ I¯ I¯ I¯

Remarque. Le théorème de convergence majorée et minorée de
Lebesgue et sa démonstration restent valables pour l’intégration sur un
intervalle non borné.
Le théorème de convergence majorée et minorée de Lebesgue
est vrai pour la L-intégrabilité, avec une conclusion un peu plus forte.
Corollaire. Soit I un semi-pavé de Rn , (fk )k∈N une suite de fonctions réelles
définies sur I¯ et f une application de I¯ dans R. Supposons satisfaites les
2. Chaque fonction fk est L-intégrable sur I. ¯
¯ telles que
3. Il existe deux fonctions réelles g et h L-intégrables sur I,
g(x) ≤ fk (x) ≤ h(x)

¯
Alors f est L-intégrable sur I et l’on a
J J
f = lim fk ,
I¯ k→∞ I¯
lim fk = lim fk ,
I¯ k→∞ k→∞ I¯
et J
lim |f − fk | = 0.
k→∞ I¯
¯ En
Démonstration. Par le théorème précédent, f est intégrable sur I.
outre, l’hypothèse 3 entraı̂ne que
g(x) ≤ f (x) ≤ h(x)

pour tout x ∈ I¯ et dès lors, f − g, positive et intégrable sur I¯ y est L-

intégrable. Par conséquent, f = (f − g) + g est également L-intégrable sur
¯ Dès lors, la suite de fonctions (|f − fk |)k∈Nconverge ponctuellement sur I¯
I.
vers zéro et est formée de fonctions L-intégrables sur I¯ telles que
min(g − f, f − h)(x) ≤ |f (x) − fk (x)| ≤ max(h − f, f − g)
pour tout x ∈ I,¯ avec min(g − f, f − h) et max(h − f, f − g) L-intégrables sur

¯
I. Il suffit de lui appliquer le théorème de convergence majorée et minorée
de Lebesgue pour obtenir la conclusion finale.
Une conséquence de cette version du théorème de Lebesgue est ce que
l’on appelle parfois le théorème de convergence dominée de Lebesgue
pour des suites de fonctions pouvant avoir des valeurs vectorielles.
Corollaire. Soit I un semi-pavé de Rn , (fk )k∈N une suite de fonctions de
Rn dans Rp définies sur I¯ et f une application de I¯ dans Rp . Supposons
satisfaites les conditions suivantes.
2. Chaque fonction fk est L-intégrable sur I. ¯
¯ telle que
3. Il existe une fonction réelle g L-intégrable sur I,
|fk (x)|2 ≤ g(x)

¯
Alors f est L-intégrable sur I et l’on a
J J
f = lim fk ,
I¯ k→∞ I¯
lim fk = lim fk .
I¯ k→∞ k→∞ I¯
Démonstration. Il suffit de passer aux composantes des fk et de f et de

noter que, pour chaque 1 ≤ j ≤ p, la suite des composantes (pj ◦ fk )k∈N et
fj vérifient les conditions du Corollaire précédent, puisqu’on a
|pj ◦ fk (x)| ≤ |fk (x)|2 ≤ g(x),
et dès lors
−g(x) ≤ pj ◦ fk (x) ≤ g(x),
¯ chaque k ∈ N et chaque 1 ≤ j ≤ p.
pour chaque x ∈ I,
Remarque. Un cas particulier important du corollaire précédent est celui

où, dans les hypothèse 3, g est une constante. On l’appelle parfois le
théorème de convergence bornée de Lebesgue.
Le théorème de Lebesgue permet de démontrer que la convergence uni-
forme préserve l’intégrabilité et la L-intégrabilité.
Corollaire. Soit I un semi-pavé de Rn , (fk )k∈N une suite de fonctions réelles
définies sur I¯ et f une application de I¯ dans R. Supposons satisfaites les
1. La suite (fk )k∈N converge uniformément sur I¯ vers f .
¯
2. Chaque fonction fk est intégrable (resp. L-intégrable) sur I.
¯
Alors f est intégrable (resp. L-intégrable) sur I et l’on a
J J
f = lim fk ,
I¯ k→∞ I¯
lim fk = lim fk .
I¯ k→∞ k→∞ I¯
Démonstration. Par hypothèse, la suite (fk )k∈N vérifie la condition de

Cauchy de convergence uniforme sur I¯ et il existe donc un entier naturel m
tel que, pour tout entier k ≥ m, on ait
fm (x) − 1 ≤ fk (x) ≤ fm (x) + 1.
Il suffit donc d’appliquer la version correspondante du théorème de con-

vergence minorée et majorée de Lebesgue à la suite (fk )k≥m avec le choix
g = fm − 1 et h = fm + 1.
Enfin, il est facile de déduire des résultats précédents les versions du
théorème de convergence majorée et minorée de Lebesgue pour
une série de fonctions. On obtient en particulier le résultat suivant.
%
Corollaire. Soit I un semi-pavé de Rn , k∈N fk une série de fonctions
réelles définies sur I¯ et F une application de I¯ dans R. Supposons satisfaites
%
1. La série k∈N fk converge ponctuellement sur I¯ vers F .
3. Il existe des fonctions réelles g et h intégrables sur I¯ et telles que
q
$
g(x) ≤ fk (x) ≤ h(x)
k=0
pour chaque q ∈ N et chaque x ∈ I. ¯

¯
Alors F est intégrable sur I et l’on a
J ∞ J
$
F = fk ,
I¯ ¯
k=0 I
c’est-à-dire J $
∞ ∞ J
$
fk = fk .
I¯ k=0 ¯
k=0 I
12.10 Exercices
1. Soit (fk )k∈N la suite d’applications de R dans R définies par
fk (x) = lim [cos(k!πx)]2j .
j→∞
Montrer que fk (x) = 1 si (k!x) ∈ Z et 0 si (k!x) /∈ Z.

Montrer que (fk )k∈N converge ponctuellement sur R vers la fonction de
Dirichlet. On notera que, si x /∈ Q, k!x /∈ Z, et fk (x) = 0 pour tout k ∈ N;
si x ∈ Q, avec pq comme représentation irréductible, alors k! pq ∈ Z, ce qui
entraı̂ne fk (x) = 1 dès que k ≥ q.
% z2k+1
2. Montrer que la série entière k∈N∗ (2k+1)(2k−1) admet 1 comme rayon de
convergence et converge uniformément sur la boule fermée B2 [1].
3. Montrer que l’équation différentielle linéaire
zy $$ (z) − y(z) = 0
admet des solutions sur C de la forme
, ∞
-
$ zk
y(z) = c ,
k=1
[(k − 1)!]2 k
où c est une constante complexe arbitraire.

Convergence ponctuelle et uniforme
%
Lorsque les différents termes de la série un sont des fonctions d’une
même variable x, continues par rapport à cette variable dans le voisinage
d’une valeur particulière pour laquelle la série est convergente, la somme s
de la série est aussi, dans le voisinage de cette valeur particulière, fonction
continue de x.

Où cela est-t-il prouvé que l’on obtient la dérivée d’une série infinie en
prenant la dérivée de chaque terme ?
Niels Henrik Abel, 1839
Si une série convergente de fonctions continues est discontinue au point
x0 , alors, dans le voisinage immédiat de x0 , il y a des valeurs de x pour
lesquelles la série converge aussi lentement que l’on veut.
Philipp Ludwig von Seidel, 1847
On dit ici que la convergence devient infiniment lente si, n étant le
nombre de termes qu’on doit prendre de façon que la somme des termes
négligés soit en valeur absolue plus petite qu’une quantité e donnée, qu’on
peut prendre aussi petite que l’on veut, n croı̂t indéfiniment lorsque x décroı̂t
indéfiniment.
Fonctions continues non dérivables
On peut même dire que le rapport de deux choses homogènes ne dépendant
ni de leur nature, ni de leurs grandeurs absolues, par la définition même du
rapport, la quantité (Dy/Dx) a toujours une limite; et c’est ce que la con-
sidération d’une courbe et de sa tangente, dont l’existence n’est pas douteuse,
fait voir d’ailleurs avec la dernière évidence.
Louis Poinsot, 1815
On peut demander si une fonction continue quelconque a une dérivée.
Nous répondrons d’abord qu’en fait nous allons trouver, dans les paragraphes
suivants, les dérivées des principales fonctions; ce qui démontrera leur e-
xistence a posteriori. Comme en chaque point une courbe continue a une
tangente bien déterminée, la fonction admet une dérivée.
Joseph Bertrand, 1878
Considérons la fonction donnée par la série suivante
sin ax sin a2 x sin a3 x $ sin an x
f (x) = + + + . . . = ,
a a2 a3 an
dans laquelle a est un entier constant que nous supposerons positif et très
grand. Cette série nous fournira un exemple soit d’une fonction qui n’a ja-
mais de dérivée, soit d’une fonction qui n’a jamais aucune période de crois-
sance ou de décroissance.
Charles Cellerier, s.d.
Je me détourne avec effroi et horreur de cette plaie lamentable des fonc-

tions continues qui n’ont point de dérivée.
Charles Hermite, 1893
Suites de fonctions intégrables
Si une suite de fonctions sommables, ayant des intégrales, f1 , f2 , f3 , . . .

a une limite f et si |f − fn | reste, quel que soit n, inférieure à un nombre
fixe M , f a une intégrale qui est la limite des intégrales des fonctions fn . Le
cas particulier le plus intéressant de ce théorème, celui où f et les fi sont
des fonctions continues, a déjà été obtenu, à l’aide de considérations toutes
différentes, par Mr. Osgood.

Chapitre 13
Fonctions et ensembles
mesurables
13.1 Intégrale sur un borné

Le but de cette section est d’étendre la notion d’intégrale au cas d’un borné
quelconque de Rn . Pour ce faire, nous aurons besoin d’une conséquence du
théorème de Levi, montrant que l’intégrabilité d’une fonction sur un pavé
fermé et la valeur de l’intégrale ne dépendent pas des valeurs prises par la
fonction sur la frontière du pavé.
Lemme. Soit Q =]c1 , d1 ]×. . . ×]cn , dn] un semi-pavé de Rn et g une fonction
de Rn dans Rp définie sur Q̄. Si g(x) = 0 pour tout x ∈ int Q, alors g est
L-intégrable sur Q̄ et J J
g = 0, |g|2 = 0.
Q̄ Q̄
Démonstration. Comme on a
|S(Q, g, Π)|2 ≤ S(Q, |g|2, Π),
A B
pour toute P-partition Π = (xj , Qj ) 1≤j≤m de Q, il suffit évidemment de
H
montrer que |g|2 est intégrable sur Q̄ et que Q̄ |g|2 = 0.
Démontrons d’abord le résultat sous l’hypothèse supplémentaire que g
soit bornée sur Q̄ et soit M > 0 tel que
|g(x)|2 ≤ M, x ∈ Q̄.
Soit ! > 0 et cherchons à déterminer une jauge constante δ, telle que
S(Q, |g|2, Π) ≤ !,
483
484 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES
A B
si Π = (xj , Qj ) 1≤j≤m est δ-fine. On a, puisque g(x) = 0 pour x ∈ int Q,
$ $
S(Q, |g|2, Π) = |g(xj )|2 µ(Qj ) ≤ M µ(Qj ).
{1≤j≤m : xj ∈f r Q} {1≤j≤m : xj ∈f r Q}
Mais, comme Π est δ-fine, on a

>
Qj ⊂ Q̄ \ Qδ ,
{1≤j≤m : xj ∈f r Q}
où
Qδ = ]c1 + δ, d1 − δ[ × . . . × ]cn + δ, dn − δ[,
avec la convention ]cj + δ, dj − δ[ = ∅ si cj + δ ≥ dj − δ. Dès lors, les Qj étant
mutuellement disjoints, on a
$ n
$ 6
µ(Qj ) ≤ 2 δ (di − ci ) = δS,
{1≤j≤m : xj ∈f r Q} k=1 {1≤i≤n : i(=k}
où n n
$ 6 $ µ(Q)
S=2 (di − ci ) = 2
k=1 {1≤i≤n : i(=k} k=1
dk − ck
est la somme des (n-1)-mesures des faces de Q̄ qui constituent fr Q. En

conséquence,
S(Q, |g|2, Π) ≤ δM S ≤ !,
à condition de prendre δ = !/M S.
Soit maintenant g une fonction quelconque de Rn dans Rp telle que Q̄ ⊂
dom g et g(x) = 0 si x ∈ int Q. Pour chaque k ∈ N, définissons gk par
gk (x) = min(|g(x)|2, k), x ∈ Q̄.
Par construction, la suite de fonctions de Rn dans R+ est croissante sur Q̄,

0 ≤ gk (x) ≤ k pour chaque k ∈ N et chaque x ∈ Q̄, et, si x ∈ int Q, gk (x) =
min{0, k} = 0, k ∈ N. En vertu du résultat de la première partie de la
démonstration appliqué à gk , on voit donc que gk est L-intégrable sur Q̄ et
J
gk = 0, k ∈ N.
Q̄
D’autre part, pour chaque x ∈ Q̄, on a gk (x) = |g(x)|2 dès que k ≥ |g(x)|2,
ce qui montre la convergence ponctuelle de la suite (gk )k∈N vers |g(x)|2 sur
13.1. INTÉGRALE SUR UN BORNÉ 485
Q̄. Le théorème de convergence monotone de Levi entraı̂ne alors que |g|2 est
L-intégrable sur Q̄ et que
J J
|g|2 = lim gk = 0,
Q̄ k→∞ Q̄

Si f est une fonction de Rn dans Rp et si A ⊂ dom f , nous désignerons
par fA l’application de Rn dans Rp définie par
fA (x) = f (x) si x ∈ A,
fA (x) = 0 si x ∈ Rn \ A.
En particulier, nous appellerons fonction caractéristique de A ⊂ Rn , et nous
désignerons par 1A , l’application de Rn dans R définie par
1A (x) = 1 si x ∈ A,
1A (x) = 0 si x ∈ Rn \ A.
Lemme. Soit I ⊂ Rn un semi-pavé et h une fonction de Rn dans Rp définie
¯ Alors h est intégrable (resp. L-intégrable) sur I¯ si et seulement si h ¯
sur I. I
est intégrable (resp. L-intégrable) sur J¯ pour tout semi-pavé J ⊂ Rn tel que
I¯ ⊂ J, auquel cas on a J J
hI¯ = h.
J¯ I¯
Démonstration. Soit J ⊂ Rn un semi-pavé tel que I¯ ⊂ J. Alors I ⊂ J et

l’on a & r '
>
J =I∪ Ii ,
i=1
où est une partition de J en semi-pavés. Comme I¯ ∩ int I i = ∅

{I, I 1, . . ., I r }
pour chaque 1 ≤ i ≤ r, on a hI¯(x) = 0 pour tout x ∈ int I i, 1 ≤ i ≤ r, et le
lemme précédent entraı̂ne la L-intégrabilité de hI¯ sur chaque I¯i avec
J
hI¯ = 0, 1 ≤ i ≤ r.
I¯i
Combinant ces résultats avec la propriété d’additivité de l’intégrale, on voit

que hI¯ sera intégrable (resp. L-intégrable) sur J¯ si et seulement si hI¯ est
¯ c’est-à-dire (puisque h ¯ = h sur I)
intégrable (resp. L-intégrable) sur I, ¯ si et
I
¯ auquel cas on aura,

seulement si h est intégrable (resp. L-intégrable) sur I,
en outre,
J J r J
$ J
hI¯ = hI¯ + hI¯ = h,
J¯ I¯ ¯i
i=1 I I¯

Soit A une partie bornée de Rn et f une fonction de Rn dans Rp définie
sur A. La définition suivante est naturelle.
Définition. On dit que f est intégrable sur A (resp. L-intégrable sur A) s’il
existe un semi-pavé I ⊂ Rn tel que
H
A ⊂ I¯ et telHque fA soit intégrable (resp.
¯
L-intégrable) sur I, auquel cas I¯ fA est notée A f et appelée l’intégrale de
f sur A.
Cette définition et la terminologie seront justifiées si l’intégrabilité (resp.
H
la L-intégrabilité) de fA sur I¯ et la valeur de I¯ fA ne dépendent pas du
choix de I. Cette indépendance résulte de la proposition suivante.
Proposition. Si I ⊂ Rn est un semi-pavé tel que A ⊂ I¯ et tel que fA soit
¯ alors, pour tout semi-pavé K ⊂ Rn tel
intégrable (resp. L-intégrable) sur I,
H H
que A ⊂ K̄, fA est intégrable (resp. L-intégrable) sur K̄ et K̄ fA = I¯ fA .
Démonstration. Soit J ⊂ Rn un semi-pavé tel que I¯ ⊂ J et K̄ ⊂ J.
Notons tout d’abord que (fA )I¯ = (fA )K̄ = fA puisque A ⊂ I¯ ∩ K̄. Par le
second lemme ci-dessus et l’intégrabilité (resp. L-intégrabilité) de fA sur
¯ (fA ) ¯ = fA est intégrable (resp. L-intégrable) sur J¯ et H ¯ fA = H ¯ fA . Par
I, I I J
ce même lemme, l’intégrabilité (resp. la L-intégrabilité) de (fA )K̄ = fA sur
J¯ entraı̂ne
H H
l’intégrabilité (resp. la L-intégrabilité) de fA sur K̄ et l’égalité
K̄ fA = J A.
¯ f
Remarques. 1. La proposition ci-dessus montre encore que la définition
et la notation que nous venons d’introduire sont compatibles, lorsque A
est l’adhérence I¯ d’un semi-pavé I de Rn , avec la définition et la notation
originales d’intégrabilité (resp. de L-intégrabilité) sur I,¯ puisque f ¯ = f
I
sur I,¯ et avec les notions d’intégrabilité (resp. de L-intégrabilité) sur des
intervalles non fermés. En outre, la même proposition montre que si B ⊂ A,
alors f est intégrable (resp. L-intégrable) sur B si et seulement si fB est
intégrable (resp. L-intégrable) sur A.
2. Il résulte aisément de la définition ci-dessus que les propriétés élé-
mentaires de l’intégrale (sauf celles de restriction et d’additivité),
le test de comparaison de L-intégrabilité, l’identité entre les fonc-
tions intégrables et L-intégrables lorsqu’elles sont bornées ou positives, le
13.2. BORNÉS INTÉGRABLES ET LEUR MESURE 487
théorème de Levi et le théorème de Lebesgue s’étendent à l’intégrabi-

lité (resp. L-intégrabilité) sur un borné A de Rn en remplaçant simplement
I¯ par A. En particulier, l’ensemble P (A; Rp) (resp. L(A; Rp)) des fonctions
de Rn dans Rp intégrables (resp. L-intégrables) sur A forme un espace vec-
toriel sur R. On verra plus loin que l’extension des propriétés de restriction
et d’additivité est plus délicate. Elle nécessite l’introduction de la notion de
partie n-intégrable de Rn .
13.2 Bornés intégrables et leur mesure

Soit A une partie bornée de Rn .
Définition. On dit que A est n-intégrable si la fonction

H
constante 1 est
intégrable sur A, auquel cas le nombre positif ou nul A 1 est appelé la n-
mesure (de Lebesgue) de A et noté µ(A). On dit aussi longueur de A pour
n = 1, aire d’un ensemble plan de A pour n = 2 et volume de A pour n = 3.
H
On a donc, par définition, µ(A) = I¯ 1A pour tout semi-pavé I ⊂ Rn tel
que A ⊂ I. ¯ En particulier, l’adhérence I¯ de tout semi-pavé I = ]a1 , b1 ] ×
. . . × ]an , bn] de Rn est n-intégrable et a pour n-mesure de Lebesgue
J J n
6
¯ =
µ(I) 1I¯ = 1= (bi − ai ).
I¯ I¯ i=1
En utilisant le premier lemme de cette section, on voit aussi que fr I =

I¯ \ int I et I¯ \ I sont n-intégrables et que
µ(fr I) = µ(I¯ \ I) = 0,
puisque 1fr I (x) = 1I\I

¯ (x) = 0 si x ∈ int I. Comme 1int I = 1I¯ − 1fr I et
1I = 1I¯ − 1I\I
¯ , on en déduit aussitôt la n-intégrabilité de int I et de I et les
relations
n
6
¯ =
µ(int I) = µ(I) = µ(I) (bi − ai ),
i=1
qui montrent la compatibilité de la nouvelle notation avec la notation µ(I)

introduite précédemment pour désigner le dernier terme de l’égalité.
Les propriétés élémentaires de la n-mesure résultent aisément de
la définition et des propriétés élémentaires de l’intégrale.
Proposition. Si A, B, A1 , . . . , Aq sont des parties bornées n-intégrables de

Rn , on a les propriétés suivantes.
1. Si B ⊂ A, alors µ(B) ≤ µ(A) (monotonie).
! 7
2. qk=1 Ak et qk=1 Ak sont n-intégrables,
& q ' q
> $
µ Ak ≤ µ(Ak ) (sous-additivité),
k=1 k=1
et si les Ak sont mutuellement disjoints (Aj ∩ Ak = ∅ si j /= k),
& q
' q
> $
µ Ak = µ(Ak ) (additivité).
k=1 k=1
3. µ(A ∪ B) = µ(A) + µ(B) − µ(A ∩ B),

4. A \ B est n-intégrable et, si B ⊂ A, µ(A \ B) = µ(A) − µ(B).
Démonstration. Il suffit d’appliquer à la définition les propriétés élémen-
taires de l’intégrale en tenant compte des propriétés suivantes des fonctions
caractéristiques, que l’on démontre aisément:
1) B ⊂ A si et seulement si 1B (x) ≤ 1A (x) pour tout x ∈ Rn .
2) 1!q Ak = max1≤k≤q 1Ak , 17q Ak = min1≤k≤q 1Ak , et 1!q Ak =
%q k=1 k=1 k=1
k=1 1Ak si les Ak sont mutuellement disjoints.

3) 1A∪B = 1A + 1B − 1A∩B .
4) A \ B = A ∩ (Rn \ B) et, si B ⊂ A, 1A\B = 1A − 1B . En particulier,
1Rn \B = 1 − 1B .
Le théorème de Levi permet de généraliser la propriété 2 de la proposition
ci-dessus aux familles dénombrables d’ensembles. Un résultat préliminaire est
nécessaire.
Lemme. Si (Ak )k∈N est une suite croissante (resp. décroissante) de parties
de Rn , alors la suite de fonctions (1Ak )k∈N converge ponctuellement sur Rn
vers 1! Ak (resp. 17 Ak ).
k∈N k∈N
Démonstration. Si, pour fixer les idées, on suppose (Ak )k∈N croissante,
!
et si x /∈ A = k∈N Ak , x n’appartient à aucun Ak et on a donc
lim 1Ak (x) = 0 = 1A (x).
k→∞
Si x ∈ A, il existe un m ∈ N tel que x ∈ Am . Comme (Ak )k∈N est croissante,

on aura donc x ∈ Ak pour tout k ≥ m, et dès lors
lim 1Ak (x) = 1 = 1A (x).
k→∞
Le cas d’une suite décroissante se démontre de la même manière.
13.2. BORNÉS INTÉGRABLES ET LEUR MESURE 489
Proposition. Soit (Ak )k∈N une suite croissante de parties bornées et n-

!
intégrables de Rn telles que A = k∈N Ak soit bornée. Alors A est n-
intégrable et
µ(A) = lim µ(Ak ) = sup µ(Ak ).
k→∞ k∈N
Démonstration. Soit I un semi-pavé de Rn tel que A ⊂ I. ¯ Par hypothèse,

(1Ak )k∈N est une suite croissante de fonctions intégrables sur I¯ qui, en vertu
du lemme précédent,
H
converge ponctuellement vers 1A . En outre, la suite
(µ(Ak ))k∈N = ( I¯ 1Ak )k∈N est croissante et majorée par µ(I), donc conver-
gente. On déduit aussitôt du théorème de Levi que 1A = limk→∞ 1Ak est
intégrable sur I¯ (donc que A est n-intégrable) et que
J J
µ(A) = 1A = lim 1Ak = lim µ(Ak ) = sup µ(Ak ).
I¯ k→∞ I¯ k→∞ k∈N
Proposition. Soit (Ak )k∈N une suite décroissante de parties bornées et n-

7
intégrables de Rn . Alors A = k∈N Ak est n-intégrable et
µ(A) = lim µ(Ak ) = inf µ(Ak ).

k→∞ k∈N
Démonstration. Soit I un semi-pavé de Rn tel que A0 ⊂ I. ¯ Par hypothèse,

(1Ak )k∈N est une suite décroissante de fonctions intégrables sur I¯ qui, en
vertu du lemme précédent,
H
converge ponctuellement vers 1A . En outre, la
suite (µ(Ak ))k∈N = ( I¯ 1Ak )k∈N est décroissante et minorée par 0, donc con-
vergente. On déduit aussitôt du théorème de Levi que 1A = limk→∞ 1Ak est
intégrable sur I¯ (donc que A est n-intégrable) et que
J J
µ(A) = 1A = lim 1Ak = lim µ(Ak ) = inf µ(Ak ).
I¯ k→∞ I¯ k→∞ k∈N
Un lemme est nécessaire pour démontrer l’importante propriété d’addi-

tivité complète de la mesure.
Lemme. Si (Ak )k∈N est une suite de parties de Rn mutuellement disjointes,
%
alors la série de fonctions k∈N 1Ak converge ponctuellement vers 1! Ak .
k∈N
Démonstration. Comme les Ak sont mutuellement disjoints, on a, pour

tout q ∈ N,
q
$
1!q Ak = 1Ak .
k=0
k=0
! %q
Si x /∈ A = k∈N Ak , alors x /∈ Ak pour tout k ∈ N et k=0 1Ak (x) = 0 pour
tout q ∈ N. En conséquence,
q
$
lim 1Ak (x) = 0 = 1A (x).
q→∞
k=0
Si x ∈ A, il existe un (et un seul) entier m tel que x ∈ Am . Dès lors, pour

tout q ≥ m, on a
q
$
1Ak (x) = 1Am (x) = 1,
k=0
et
q
$
lim 1Ak (x) = 1 = 1A (x).
q→∞
k=0
Nous pouvons maintenant démontrer la propriété d’additivité complè-

te de la mesure.
Proposition. Si (Ak )k∈N est une suite de parties de Rn bornées, n-intégra-
!
bles, mutuellement disjointes et telles que A = k∈N Ak soit bornée, alors A
%
est n-intégrable, la série k∈N µ(Ak ) converge et
∞
$
µ(A) = µ(Ak ).
k=0
Démonstration. Soit I un semi-pavé de Rn tel que A ⊂ I. ¯ Par hypothèse,

%
¯
k∈N 1Ak est une série de fonctions positives et intégrables sur I et, par le
lemme, cette série converge ponctuellement sur Rn vers 1A . En outre, la
série à termes positifs J
$ $
1Ak = µ(Ak )
¯
k∈N I k∈N
est convergente, puisque, pour tout q ∈ N, on a
q & q '
$ >
µ(Ak ) = µ Ak ≤ µ(I).
k=0 k=0
Par le théorème de Levi pour les séries de fonctions, la fonction 1A est

intégrable sur I¯ et
J ∞ J
$ ∞
$
µ(A) = 1A = 1Ak = µ(Ak ).
I¯ ¯
k=0 I k=0
13.3. ADDITIVITÉ COMPLÈTE DE LA L-INTÉGRALE 491
13.3 Additivité complète de la L-intégrale

On sait que l’intégrabilité (resp. la L-intégrabilité) d’une fonction sur un
pavé fermé I¯ entraı̂ne son intégrabilité (resp. sa L-intégrabilité) sur tout
pavé fermé contenu dans I. ¯ On pourrait penser que l’intégrabilité d’une
fonction sur une partie bornée A entraı̂ne son intégrabilité sur toute partie
de A. Qu’il n’en soit rien résulte de l’existence de parties bornées de Rn qui
ne sont pas n-intégrables, un résultat fondé sur l’axiome du choix et qui est
esquissé dans les exercices. En effet, si B est un tel ensemble borné et non
n-intégrable, et I un semi-pavé tel que B ⊂ I, ¯ la fonction constante 1 est
intégrable sur I¯ et ne l’est pas sur B.
On peut alors penser que l’intégrabilité d’une fonction sur une partie
bornée A entraı̂ne son intégrabilité sur toute partie n-intégrable de A. Ce
résultat est faux pour les fonctions intégrables mais non L-intégrables sur A.
En effet, si f ∈ P (A; R) \ L(A; R), on a vu précédemment que f + et f − ne
sont pas intégrables sur A. Dès lors, si
A+ = {x ∈ A : f (x) ≥ 0},
on a f + (x) = fA+ (x) pour tout x ∈ A et f n’est pas intégrable sur A+ .

Dans le cas de f (x) = (2/x) cos(1/x2) si x /= 0 et f (0) = 0, qui est un
élément de P ([0, 1], R) \ L([0, 1], R), il est facile de voir que A+ est une
union dénombrable d’intervalles fermés bornés mutuellement disjoints con-
tenus dans [0, 1], donc que A+ est 1-intégrable. On ne connaı̂t pas de classe
intéressante, autre que l’union finie de pavés, pour laquelle l’intégrabilité
d’une fonction intégrable mais non L-intégrable sur un borné A se trans-
mette à une partie de A appartenant à cette classe. C’est évidemment un
handicap important de l’extension de la notion d’intégrabilité à une partie
bornée quelconque.
La situation est meilleure pour la L-intégrabilité sur une partie bornée
qui se transmet à tout sous-ensemble n-intégrable. C’est la propriété de
restriction de la L-intégrale sur un borné.
Proposition. Soit A un borné de Rn et f une fonction de Rn dans Rp
définie et L-intégrable sur A. Alors, pour toute partie n-intégrable B de A,
f est L-intégrable sur B.
Démonstration. En passant aux composantes fj de f et puis en notant
que fj = fj+ − fj− , on voit qu’il suffit de démontrer le résultat pour une
fonction f de Rn dans R+ , ce que nous supposerons. Soit B ⊂ A n-intégrable
et I un semi-pavé de Rn tel que A ⊂ I. ¯ Définissons sur A la suite (fk )k∈N
de fonctions de Rn dans R+ par
fk (x) = min[f (x), k.1B (x)], k ∈ N.
Chaque fk est telle que

0 ≤ fk (x) ≤ f (x),
pour x ∈ A, et est L-intégrable sur A puisqu’il en est ainsi de f et de k.1B .
En outre, (fk )k∈N converge ponctuellement sur A vers fB . En effet, si x ∈ B,
k.1B (x) = k et dès lors fk (x) = f (x) = fB (x) dès que k ≥ fB (x), tandis que,
si x ∈ A\B, k.1B (x) = 0 pour tout k ∈ N, et dès lors fk (x) = 0 = fB (x) pour
tout k ∈ N. Le théorème de convergence majorée et minorée de Lebesgue
entraı̂ne alors la L-intégrabilité de fB sur A, c’est-à-dire la L-intégrabilité
de f sur B.
On en déduit aisément la propriété d’additivité finie pour la L-
intégrale sur un borné.
Proposition. Soit A un borné de Rn , {A1 , . . . , Aq } une partition de A en un
nombre fini de parties n-intégrables, et f une fonction de Rn dans Rp définie
sur A. Alors f est L-intégrable sur A si et seulement si f est L-intégrable
sur chaque Ak , 1 ≤ k ≤ q, auquel cas on a
J q J
$
f= f.
A k=1 Ak
Démonstration. Si f est L-intégrable sur A, la propriété de restriction

que nous venons de démontrer entraı̂ne sa L-intégrabilité sur chaque Ak , 1 ≤
k ≤ q, et donc l’intégrabilité de chaque fAk sur A. Comme en outre
q
$
f= fAk ,
k=1
la formule cherchée s’en déduit par intégration sur A. Réciproquement, si f

est L-intégrable sur chaque Ak , 1 ≤ k ≤ q, fAk est L-intégrable sur A, et la
formule ci-dessus entraı̂ne que f est L-intégrable sur A.
Le théorème de Levi pour les séries de fonctions positives fournit la pro-
priété d’additivité complète pour la L-intégrale sur un borné.
Proposition. Soit A un borné de Rn , (Ak )k∈N une suite de parties n-
intégrables de A telle que {A0 , A1 , . . .} forme une partition de A et f une
fonction de Rn dans Rp définie sur A. Alors, f est L-intégrable sur A si
13.4. EXEMPLES DE BORNÉS INTÉGRABLES 493
% H
et seulement si f est L-intégrable sur chaque Ak , k ∈ N et k∈N Ak |f |2
converge, auquel cas
J ∞ J
$
f= f.
A k=0 Ak
Démonstration. Comme ci-dessus, on peut se ramener au cas où f est à

valeurs positives. Comme, pour chaque x ∈ A, on a
fAk (x) = f (x).1Ak (x) ≥ 0,

% %
on voit que la série k∈N fAk = f.( k∈N 1Ak ) converge ponctuellement sur
A vers f.1A = fA . On peut donc appliquer le théorème de convergence de
Levi pour les séries de fonctions positives,
H
qui assure Hl’intégrabilité de f sur
% %
A si et seulement si la série k∈N A f.1Ak = k∈N Ak f converge, auquel
cas on a J J
∞
$
f= f.
A k=0 Ak
Enfin, le théorème de Levi pour une suite croissante de fonctions fournit

à son tour une condition nécessaire et suffisante du type de Hake
pour la L-intégrabilité sur une partie bornée.
Proposition. Soit (Ak )k∈N une suite croissante de parties bornées et n-
!
intégrables telle que A = k∈N Ak soit bornée, et soit f une fonction de Rn
dans Rp définie sur A. Alors f est L-intégrable sur
H
A si et seulement si f est
L-intégrable sur chaque Ak , k ∈ N et la suite ( Ak |f |2 )k∈N est convergente,
auquel cas on a J J
f = lim f.
A k→∞ Ak
Démonstration. On peut de nouveau, sans perte de généralité, se ramener

au cas d’une fonction f positive et l’on procède comme dans la démonstration
précédente.
13.4 Exemples de bornés intégrables

Le premier résultat, qui porte le nom d’inégalité de Tchebycheff, associe
à une fonction positive intégrable sur un borné A une intéressante classe de
parties intégrables de A.
Proposition. Soit A un borné de Rn et f une fonction de Rn dans R+

intégrable sur A. Alors, pour chaque r > 0, l’ensemble
Ar = {x ∈ A : f (x) > r}
est n-intégrable et J
−1
µ(Ar ) ≤ r f.
A
¯
Démonstration. Soit r > 0 et I un semi-pavé de Rn tel que A ⊂ I;
définissons sur R la suite d’applications (fk )k∈N par
n
fk (x) = min[1, k. max(fA (x) − r, 0)], k ∈ N, x ∈ Rn .
Chaque fk est intégrable sur I¯ et telle que
0 ≤ fk (x) ≤ 1, k ∈ N, x ∈ Rn .
En outre, la suite (fk )k∈N converge ponctuellement sur Rn vers 1Ar . En

effet, si x ∈ Rn \ Ar , alors fA (x) − r ≤ 0 et fk (x) = 0 pour tout k ∈ N,
ce qui entraı̂ne que fk (x) → 0 = 1Ar (x) si k → ∞. Si x ∈ Ar , fk (x) =
min[1, k(f (x) − r)] et dès lors fk (x) = 1 dès que k ≥ 1/(f (x) − r); donc
fk (x) → 1 = 1Ar (x) si k → ∞.
On peut donc appliquer le théorème de convergence majorée et mi-
norée de Lebesgue pour obtenir l’intégrabilité de 1Ar sur I, ¯ c’est-à-dire la
n-intégrabilité de Ar . Par la propriété de restriction (puisque, f étant po-
sitive, son intégrabilité équivaut à sa L-intégrabilité), f sera alors intégrable
sur Ar et comme
r.1Ar (x) ≤ fAr (x) ≤ f (x), x ∈ A,
on en déduit, par intégration sur A que

J J
rµ(Ar ) ≤ f≤ f,
Ar A

Remarque. La fonction
df : R∗+ → R+ , r 2→ µ(Ar )
définie par la Proposition précédente s’appelle la fonction de distribution de

f et joue un grand rôle en analyse.
Corollaire. Dans les conditions de la proposition précédente, l’ensemble

A∗r = {x ∈ A : f (x) ≥ r} est n-intégrable et
J
µ(A∗r ) ≤r −1
f.
A
Démonstration. Avec les notations de la Proposition précédente, on a

"
A∗r = Ar−(1/k).
{k∈N:k>r −1 }
Comme Ar−(1/k) ⊃ Ar−(1/k+1) pour k ≥ 1 et comme, par la proposition

précédente, chaque Ar−(1/k) est n-intégrable, on en déduit que A∗r est n-
intégrable et que
4 5−1 J J
1
µ(A∗r ) = lim µ(Ar−(1/k)) ≤ lim r− f = r −1 f.
k→∞ k→∞ k A A
Corollaire. Si A est un borné de Rn et si f est une fonction de Rn dans

Rp L-intégrable sur A, alors l’ensemble
S(f ) = {x ∈ A : f (x) /= 0}
est n-intégrable.
>
S(f ) = {x ∈ A : |f (x)|2 > 0} = Sk ,
k∈N∗
où Sk = {x ∈ A : |f (x)|2 > 1/k}. Par le théorème de Tchebycheff, chaque

Sk est n-intégrable et, par construction, Sk ⊂ Sk+1 ⊂ A pour tout k ∈ N∗ .
La n-intégrabilité de S(f ) en découle aussitôt.
L’obtention de classes concrètes d’ensembles n-intégrables repose sur le
lemme de recouvrement suivant.
Proposition. Soit I un semi-pavé de Rn , E une partie non vide
8 de I et9δ une
jauge sur E. Alors il existe une famille au plus dénombrable (xk , J k ) ,
k∈M
avec M = {0, 1, . . . , s} ou N, telle que chaque J k est un semi-pavé contenu
dans I et semblable à I, J k ∩J l = ∅ si j /= l, xk ∈ E ∩J k , J k ⊂ B∞ [xk ; δ(xk )]
pour chaque k ∈ M, l ∈ M, et
>
E⊂ J k ⊂ I.
k∈M
Démonstration. Effectuons des divisions successives de I en 2n , 22n , . . .,

2kn , . . . semi-pavés congruents par bissection des intervalles dont I est le pro-
duit cartésien, et appelons respectivement D1 , D2 , . . ., Dk , . . . les collections
finies de semi-pavés ainsi obtenues. Chaque Dk constitue évidemment une
partition de I en semi-pavés congruents semblables à I. Posons
E1 = {J ∈ D1 : il existe x ∈ E ∩ J tel que J ⊂ B∞ [x; δ(x)]},
E2 = {J ∈ D2 : J n’est pas contenu dans un semi-pavé de E1 et il existe
x ∈ E ∩ J tel que J ⊂ B∞ [x; δ(x)]},
et, d’une manière générale, pour chaque k ∈ N∗ ,
!
Ek = {J ∈ Dk : J n’est pas contenu dans un semi-pavé de k−1 j=1 Ej et il
existe x ∈ E ∩ J tel que J ⊂ B∞ [x; δ(x)]}.
!
Posons E = k∈N∗ Ek . C’est une famille au plus dénombrable de semi-pavés
contenus dans I et mutuellement disjoints. Montrons que tout point de E ap-
partient à l’un au moins de ces semi-pavés. Soit x ∈ E et δ(x) la valeur corre-
spondante de la jauge. Il existe un entier k1 ≥ 1 tel que, pour tout k ≥ k1 , le
semi-pavé Jk,x de Dk qui contient x soit contenu dans B∞ [x; δ(x)], et dès lors
Jk1 ,x vérifie la deuxième condition de définition de Ek1 . Par conséquent, ou
! 1 −1
bien Jk1 ,x ∈ Ek1 , ou bien Jk1 ,x est contenu dans un semi-pavé de kj=1 Ej . Par
conséquent, x appartient à un semi-pavé de la famille E. Si nous désignons
les semi-pavés de cette famille par (Jk )k∈M , avec M = {0, 1, . . ., s} un en-
semble fini ou M = N, nous avons par construction, pour 8 chaque 9 k ∈ M,
un x ∈ E ∩ J tel que J ⊂ B∞ [x ; δ(x )]. La famille (x , J )
k k k k k k k a les
k∈M
propriétés voulues.
Le lemme de recouvrement fournit un intéressant résultat sur la struc-
ture des ouverts bornés de Rn .
Proposition. Soit E un ouvert borné non vide de Rn et I un semi-pavé
tel que E ⊂ I. Il existe une suite (J k )k∈N de semi-pavés contenus dans I et
semblables à I qui partitionne E.
Démonstration. Puisque E est ouvert, il existe, pour chaque x ∈ E,
un δ(x) > 0 tel que B∞ [x; δ(x)] ⊂ E, ce qui nous définit une jauge δ sur
E. Par le lemme
8 de 9recouvrement, on peut trouver une famille au plus
dénombrable (x , J k )
k où chaque J k est un semi-pavé contenu dans I
k∈M
et semblable à I, les J k sont mutuellement disjoints, xk ∈ E ∩ J k , J k ⊂
!
B∞ [xk ; δ(xk )], k ∈ M, et E ⊂ k∈M J k . Comme, pour chaque k ∈ M , on
!
a J k ⊂ B∞ [xk ; δ(xk )] ⊂ E, on en déduit que k∈M J k ⊂ E, et donc que
!
k∈M J = E. Comme une union finie de semi-pavés J ne peut donner un
k k
ouvert, on a nécessairement M = N et la démonstration est complète.

On en déduit aussitôt l’intégrabilité de tout ouvert borné.

Proposition. Tout ouvert borné de Rn est n-intégrable.
Démonstration. C’est trivial si l’ouvert est vide. Si E est un ouvert
non vide de Rn , et I un semi-pavé qui le contient, E peut s’écrire, par la
Proposition précédente, comme une union dénombrable de semi-pavés J k
mutuellement disjoints et contenus dans I. E est donc n-intégrable par la
propriété d’additivité complète, puisque chaque J k l’est.
On ne s’étonnera pas que la propriété s’étende aux fermés bornés.
Proposition. Tout fermé borné de Rn est n-intégrable.
Démonstration. Soit F un fermé borné de Rn et I un semi-pavé tel que
F ⊂ int I. Alors E = (Rn \ F ) ∩ int I est un ouvert borné de Rn et est donc
n-intégrable. Comme F = int I \ E, F est également n-intégrable.
Terminons par une intéressante propriété d’approximation des bor-
nés n-intégrables par une union au plus dénombrable de semi-pavés mu-
tuellement disjoints.
Proposition. Soit A une partie bornée et n-intégrable de Rn et I un semi-
pavé contenant A. Pour chaque ! > 0, il existe une famille au plus dénombra-
ble (J k )k∈M de semi-pavés mutuellement disjoints contenus dans I et tels
!
que A ⊂ k∈M J k et $
µ(J k ) ≤ µ(A) + !.
k∈M
Démonstration. Si ! > 0 est donné, il existe une jauge δ sur I¯ telle que,
pour toute P-partition δ-fine Π de I, on ait
|S(I, 1A, Π) − µ(A)| ≤ !.

8 9
Pour cette jauge δ et l’ensemble A, soit (xk , J k ) la famille au plus
k∈M
dénombrable donnée par le lemme de recouvrement. En vertu du lemme de
Saks-Henstock, on aura, pour chaque q ∈ M ,
# q 2 J 3##
#$
# #
# 1A (x )µ(J ) −
k k
1A # ≤ !,
# J¯k #
k=1
c’est-à-dire, puisque xk ∈ A, k ∈ M ,
# q 2 J 3##
#$
# #
# µ(J ) −
k
1A # ≤ !.
# J¯k #
k=1
En conséquence, on a, pour tout q ∈ M ,

q
$ q J
$ J
µ(J ) ≤
k
1A + ! ≤ 1A + ! = µ(A) + !,
¯k I¯
k=1 k=1 J
et le résultat s’en déduit en faisant tendre q vers l’infini dans le cas où M = N.
13.5 Ensembles négligeables

On a vu plus haut qu’une fonction de Rn dans Rp définie sur l’adhérence
I¯ d’un semi-pavé I de Rn et nulle sur int I est L-intégrable sur I¯ et son
intégrale est nulle. Toutes ces fonctions ont donc la même intégrale sur I. ¯
On avait vu également que l’intégrale d’une fonction sur un intervalle ne
dépendait pas de sa valeur aux extrémités de l’intervalle. Ce sont là des ma-
nifestations particulières d’un phénomène général en théorie de l’intégration:
l’indépendance de la propriété d’intégrabilité et de la valeur de l’intégrale
sur un ensemble par rapport aux valeurs prises par la fonction sur des par-
ties suffisamment “petites” de l’ensemble d’intégration. Dans cette sec-
tion, ces parties suffisamment “petites” pour pouvoir être négligées dans
l’opération d’intégration vont être caractérisées d’une manière indépendan-
te de la théorie de l’intégrale et de la mesure. Nous en déduirons alors
une extension des notions d’intégrabilité et de L-intégrabilité facilitant la
démonstration de l’intégrabilité d’une fonction ou d’un ensemble, et une
généralisation des théorèmes de convergence monotone et dominée.
La propriété d’approximation des parties bornées n-intégrables donnée
dans la section précédente suggère la définition suivante.
Définition. On dit que E ⊂ Rn est n-négligeable si, pour chaque ! > 0, il
existe une famille au plus dénombrable (Ek )k∈M de semi-pavés de Rn , avec
M = {0, 1, . . ., s} ou N, telle que les propriétés suivantes soient satisfaites :
!
1. E ⊂ k∈M Ek .
%
2. k∈M µ(Ek ) ≤ !.
Exemples. 1. ∅ est n-négligeable.
2. Tout singleton {a} de Rn est n-négligeable.
En effet, si ! > 0 est donné, il suffit de prendre M = {0} et
n
6
E0 = ]ai − (1/2)!1/n, ai + (1/2)!1/n].
i=1
13.5. ENSEMBLES NÉGLIGEABLES 499
3. Toute partie dénombrable de Rn est n-négligeable.

En effet, une telle partie peut s’écrire E = {ak : k ∈ N} et, si ! > 0 est
donné, il suffit de prendre M = N et
n
6
Ek = ]aki − (1/2)(!/2k+1 )1/n, aki + (1/2)(!/2k+1 )1/n], k ∈ N,
i=1
!
ce qui donne E ⊂ k∈N Ek et
∞
$ ∞
$
µ(Ek ) = (!/2k+1 ) = !.
k=0 k=0
En particulier, N, Z et Q sont 1-négligeables, ce qui montre qu’une partie

n-négligeable n’est pas nécessairement bornée.
4. Tout hyperplan de Rn de la forme E = R × . . . × {ci} × . . . × R est
n-négligeable.
En effet, si ! > 0 est donné, il suffit de prendre M = N et, pour k ∈ N,
3 3
! !
Ek =]−(k +1), k +1]×. . .× ci − , ci + n+k+1
2 n+k+1 (k + 1) n−1 2 (k + 1)n−1
× . . . × ] − (k + 1), k + 1],
!
ce qui entraı̂ne aussitôt que E ⊂ k∈N Ek et
∞
& ∞
'
$ $
µ(Ek ) = 2! 2 −k−2
= !.
k=0 k=0
Les propriétés suivantes des ensembles n-négligeables permettent d’en

construire d’autres.
Proposition. Si E est une partie n-négligeable de Rn et si F ⊂ E, alors F

est n-négligeable.
Démonstration. Immédiat.
Ainsi, toute partie du type [a1 , b1 ] × . . . × {ci } × . . . × [an , bn] sera n-

négligeable. En particulier, les faces et la frontière d’un pavé de Rn sont
n-négligeables.
Proposition. Si (Fj )j∈N est une suite de parties n-négligeables de Rn , alors

!
j∈N Fj est n-négligeable.
Démonstration. Soit ! > 0. Pour chaque j ∈ N, il existe une famille

(Ekj )k∈Mj de semi-pavés de Rn , avec Mj = {0, 1, . . ., sj } ou N, telle que
> $
Fj ⊂ Ekj , µ(Ekj ) ≤ !/2j+1 .
k∈Mj k∈Mj
Dès lors, (Ekj )k∈Mj ;j∈N est une famille dénombrable de semi-pavés de Rn telle
que > > >
Fj ⊂ Ekj ,
j∈N j∈N k∈Mj
et, dès lors,

 
$ ∞
$ $ ∞
$
µ(Ekj ) =  µ(Ekj ) ≤ (!/2j+1 ) = !,
k∈Mj ;j∈N j=0 k∈Mj j=0
puisque tout réarrangement d’une série convergente à termes positifs con-

verge vers la même somme.
Ainsi, Qn est n-négligeable.
La Proposition suivante établit l’identité, parmi les ensembles bornés,
entre les parties n-négligeables et les parties n-intégrables de n-mesure nulle.
Proposition. Toute partie bornée de Rn est n-négligeable si et seulement
si elle est n-intégrable et de n-mesure nulle.
Démonstration. Condition nécessaire. Soit E un borné n-négligeable de
Rn et I un semi-pavé telH que E ⊂ I.¯ Il faut montrer que la fonction 1E est
intégrable sur I¯ et que I¯ 1E = 0. Soit ! > 0; par hypothèse, il existe une
famille au plus dénombrable (Ek )k∈M de semi-pavés de Rn telle que
> $
E⊂ Ek , µ(Ek ) ≤ !/2.
k∈M k∈M
Soit (Fk )k∈M une famille de semi-pavés tels que

$
Ek ⊂ int Fk , k ∈ M, µ(Fk ) ≤ !.
k∈M
Une telle famille est facile à construire en agrandissant légèrement les Ek .

Définissons comme suit une jauge δ sur I. ¯ Si x ∈ I¯ \ E, prenons δ(x) = 1. Si
x ∈ E, il existe un Ek tel que x ∈ Ek et donc tel que x ∈ int Fk . Désignons

par k(x) le plus petit entier appartenant à M tel que x ∈ int Fk , et soit
δ(x) > 0 tel que B∞ [x; δ(x)] ⊂ Fk(x) ; ce δ(x) fournit la valeur de la jauge
pour un tel x. Soit Π = {(x1 , I 1), . . . , (xm, I m)} une P-partition δ-fine de I;
alors,
m
$ $
S(I, 1E, Π) = 1E (xj )µ(I j ) = µ(I j ).
j=1 {1≤j≤m : xj ∈E}
Mais, si xj ∈ E, on a I j ⊂ B∞ [xj ; δ(xj )] ⊂ Fk(xj ), et dès lors, en posant

r = max{k(xj ) : xj ∈ E, 1 ≤ j ≤ m} et en regroupant, dans la dernière
somme, les termes pour lesquels k(xj ) prend la valeur i, on obtient
 
r
$ $
S(I, 1E , Π) =  µ(I j )
i=1 {1≤j≤m : k(xj )=i}
r
$ $
≤ µ(Fi ) ≤ µ(Fi ) ≤ !,
i=1 i∈M

Condition suffisante. Soit E un borné de Rn n-intégrable et de n-mesure
nulle et soit ! > 0. Par la propriété d’approximation des parties bornées et n-
intégrables, il existe une famille au plus dénombrable (J k )k∈M de semi-pavés
mutuellement disjoints et tels que
> $
E⊂ Jk, µ(J k ) ≤ !,
k∈M k∈M
et le résultat s’en déduit aussitôt.

Terminons par une condition nécessaire utile pour qu’une partie bornée
soit de n-mesure nulle.
Proposition. Soit E une partie bornée et n-intégrable de Rn . Si E est de
n-mesure nulle, alors int E = ∅.
Démonstration. On démontre le contraposé. Si int E /= ∅, il existe a ∈ E
et r > 0 tels que B∞ [a; r] ⊂ E, et dès lors
0 < (2r)n ≤ µ(E).

Etudions maintenant l’intégrabilité d’une fonction sur une partie bornée

n-négligeable.
définie sur A. Alors f est L-intégrable sur A et
J
|f |2 = 0
A
si et seulement si l’ensemble
S(f ) = {x ∈ A : f (x) /= 0}
H
est n-négligeable, auquel cas on a Af = 0.
Démonstration. Notons tout d’abord que
>
S(f ) = {x ∈ A : |f (x)|2 > 0} = Sk ,
k∈N∗
où
Sk = {x ∈ A : |f (x)|2 > k−1 } ⊂ Sk+1 , k ∈ N∗ .
En conséquence, S(f ) sera n-intégrable et de n-mesure nulle si et seulement
s’il en est ainsi de chaque Sk . H
Condition nécessaire. Si f est L-intégrable sur A et A |f |2 = 0, alors,
en appliquant l’inégalité de Tchebycheff à |f |2 , on voit que chaque Sk est
n-intégrable et que J
0 ≤ µ(Sk ) ≤ k |f |2 = 0,
A
ce qui montre que chaque Sk est de n-mesure nulle.
Condition suffisante. Démontrons-la tout d’abord sous l’hypothèse sup-
plémentaire que f soit bornée sur A, et soit r > 0 tel que |f (x)|2 ≤ r pour
tout x ∈ A. Soit I un semi-pavé de Rn tel que A ⊂ I, ¯ et montrons que
H
fA est L-intégrable sur I¯ et que I¯ |fA |2 = 0. Soit ! > 0; puisque S(f ) est
n-intégrable et de n-mesure nulle, il existe une jauge δ sur I¯ telle que
m
$ $
S(I, 1S(f ), Π) = 1S(f )(xj )µ(I j ) = µ(I j ) ≤ !/r,
j=1 {1≤j≤m : xj ∈S(f )}
pour toute P-partition δ-fine Π = {(x1 , I 1 ), . . ., (xm , I m)} de I, et dès lors

$
|S(I, fA, Π)|2 ≤ S(I, |fA|2 , Π) = |f (xj )|2 µ(I j )
{1≤j≤m : xj ∈S(f )}
$
≤ rµ(I j ) ≤ !.
{1≤j≤m : xj ∈S(f )}
H
On voit donc que fA et |fA |2 sont L-intégrables sur I¯ et que I¯ |f |2 = 0.
Passons maintenant au cas d’une fonction f quelconque. Pour chaque
k ∈ N, posons
gk = min(|f |2 , k).
Chaque fonction gk est bornée sur A, et la suite (gk )k∈N est croissante sur
A. On vérifie comme d’habitude que (gk )k∈N converge ponctuellement sur
A vers |f |2 . En outre, gk (x) = |f (x)|2 dès que k ≥ |f (x)|2, ce qui entraı̂ne
aussitôt que, pour chaque k ∈ N, S(gk ) = S(f ) est de n-mesure nulle. Le
résultat de la première partie de la démonstration
H
entraı̂ne la L-intégrabilité
de chaque gk sur A et les relations A gk = 0, k ∈ N. Une application du
théorème de Levi entraı̂ne alors l’intégrabilité de |f |2 sur A et l’égalité
J J
|f |2 = lim gk = 0.
A k→∞ A
Comme on l’a vu précédemment, cela implique l’intégrabilité de f sur A et

Corollaire. Si A est une partie bornée et n-négligeable de Rn , toute fonction

f de Rn dans Rp définie sur A est L-intégrable sur A et
J J
f = 0, |f |2 = 0.
A A
S(f ) = {x ∈ A : f (x) /= 0} ⊂ A,
et S(f ) est donc n-négligeable.

Introduisons maintenant une terminologie utile.
Définition. Soit A une partie non vide de Rn . On dit qu’une propriété est
vraie presque partout sur A (en abrégé p.p. sur A) ou pour presque tout
point de A, s’il existe un ensemble E ⊂ A n-négligeable tel que la propriété
soit vraie sur A \ E.
Exemples. Soit f une fonction de Rn dans Rp.
1. f est définie p.p. sur A si A \ dom f est n-négligeable.
2. f est continue p.p. sur A s’il existe E ⊂ A n-négligeable tel que f
soit continue en chaque point de A \ E.
3. Si g est une fonction de Rn dans Rp , f = g p.p. sur A si l’ensemble

des points x de A pour lesquels f (x) /= g(x) est n-négligeable.
On vérifie aisément que l’égalité p.p. de deux fonctions sur un ensemble
est une relation d’équivalence. On notera la différence entre une fonction
continue p.p. sur A et une fonction égale p.p. sur A à une fonction continue.
Ainsi, 1Q n’est continue en aucun point de R, alors qu’elle est égale p.p. sur
R à la fonction continue zéro.
4. Considérons une suite (fk )k∈N de fonctions de Rn dans Rp définies p.p.
sur A ⊂ Rn . Pour chaque k ∈ N, il existe Ek ⊂ A n-négligeable tel que fk soit
!
définie sur A \ Ek , et comme E = k∈N Ek est encore n-négligeable, chaque
fonction fk est définie sur A\E. On dira que (fk )k∈N converge ponctuellement
p.p. sur A vers une fonction f de Rn dans Rp s’il existe une partie n-
négligeable F de A telle que la suite converge ponctuellement vers f sur
A \ (E ∪ F ).
L’intégrabilité des fonctions sur un ensemble borné n-négligeable donnée
plus haut se formule de manière très suggestive dans la terminologie “presque
partout”.
Proposition. Soit A un borné de Rn et f uneH fonction de Rn dans Rp
définie sur A. Alors f est L-intégrable sur A et A |f |2 = 0 si et seulement
si f est égale à zéro presque partout sur A.
On en déduit aussitôt le résultat suivant.
intégrable (resp. L-intégrable) sur A. Alors toute fonction g de Rn dans Rp
définie sur A et égale p.p. sur A à f est intégrable (resp. L-intégrable) sur
A et J J
f= g.
A A
Démonstration. Par hypothèse, la fonction h = g − f est définie sur A

et égale à zéro p.p. sur A. Elle est donc L-intégrable sur A et
J
h = 0.
A
En conséquence, g = f + h est intégrable (resp. L-intégrable) sur A et

J J J J
g= f+ h= f.
A A A A
Notons en passant que, I¯ \ I étant n-négligeable pour tout semi-pavé I

de Rn , une fonction de Rn dans Rp sera définie p.p. sur I si et seulement si
¯ On pourra donc utiliser indifféremment l’une ou
elle est définie p.p. sur I.
l’autre terminologie.
Nous pouvons maintenant étendre les notions d’intégrabilité et de L-
intégrabilité sur un borné A de Rn aux fonctions définie p.p. sur A. Cette
extension utile se fonde sur le résultat suivant.

définie p.p. sur A. Si f possède un prolongement f˜ à A qui est intégrable
(resp. L-intégrable) sur A, alors tout autre prolongement fˆ de f à A sera
intégrable (resp. L-intégrable) sur A et l’on aura
J J
fˆ = f˜.
A A
Démonstration. Comme f est définie p.p. sur A, il existe E ⊂ A n-

négligeable tel que A \ E ⊂ dom f. Par conséquent, pour tout x ∈ A \ E, on
a
fˆ(x) − f˜(x) = f (x) − f (x) = 0,
ce qui montre que fˆ = f˜ p.p. sur A. La thèse résulte alors de la Proposition

précédente.
La définition suivante est donc justifiée.
Définition. Soit A un borné de Rn et f une fonction de Rn dans Rp définie

p.p. sur A. On dit que f est intégrable (resp. L-intégrable) sur A s’il existe
un prolongement
H
f˜ de f à A qui soit intégrable (resp. L-intégrable) surH A,
auquel cas A f , qui ne dépend pas du prolongement f˜ choisi, est noté A f
˜
et appelé l’intégrale de f sur A.
On en déduit aussitôt que deux fonctions de Rn dans Rp définies p.p.

et égales p.p. sur un borné A de Rn sont simultanément intégrables (resp.
L-intégrables) sur A, auquel cas leurs intégrales sur A sont égales.
Les propriétés élémentaires de l’intégrale, le test de comparai-
son, les théorèmes de Levi et Lebesgue, les propriétés de restriction
et d’additivité et les inégalités de Tchebycheff s’étendent à la nouvelle
définition avec des affaiblissements évidents des hypothèses. A titre indicatif,
donnons la forme généralisée du théorème de convergence majorée et
minorée de Lebesgue.
Théorème. Soit A un borné de Rn , (fk )k∈N une suite de fonctions de Rn

dans R et f une fonction de Rn dans R. Supposons satisfaites les conditions
suivantes.
1. Chaque fk est définie p.p. et intégrable sur A.
2. La suite (fk )k∈N converge ponctuellement p.p. sur A vers f .
3. La suite (fk )k∈N est minorée p.p. sur A par une fonction h de Rn dans R
définie p.p. et intégrable sur A, et majorée p.p. sur A par une fonction H
de Rn dans R définie p.p. et intégrable sur A.
Alors f est intégrable sur A et
J J
f = lim fk .
A k→∞ A
La convergence de la suite des intégrales sur un ensemble d’une suite de

fonctions n’entraı̂ne évidemment pas la convergence ponctuelle des fonctions
sur cet ensemble. On construira facilement des contre-exemples. Pour une
suite monotone, elle entraı̂ne toutefois la convergence ponctuelle presque
partout.
Proposition. Soit A un borné de Rn et (fk )k∈N une suite de fonctions de
Rn dans R. Supposons satisfaites les conditions suivantes.
1. Chaque fk est définie p.p. et intégrable sur A.
2. La suite (fk )k∈NH est monotone p.p. sur A.
3. La suite réelle ( A fk )k∈N converge.
Alors la suite de fonctions (fk )k∈N converge ponctuellement p.p. sur A.
Démonstration. Supposons, pour fixer les idées, que (fk )k∈N soit crois-
sante p.p. sur A; en considérant si nécessaire la suite (fk − f0 )k∈N au lieu
de (fk )k∈N , on peut, sans perte de généralité, supposer que
H
fk (x) ≥ 0 pour
chaque k ∈ N et presque tout x ∈ A. Puisque la suite ( A fk )k∈N est crois-
sante et convergente, elle est majorée et nous désignerons par M un de ses
majorants. D’ailleurs, la suite réelle (fk (x))k∈N est croissante pour presque
tout x ∈ A, ce qui implique, pour presque tout x ∈ A, l’existence au sens
7
large de sa limite. Posons F = k∈N dom fk et
E = {x ∈ A ∩ F : lim fk (x) = +∞}.
k→∞
La Proposition revient à montrer que E est de n-mesure nulle. Comme

E = {x ∈ A ∩ F : (∀j ∈ N∗ )(∃m ∈ N∗ )(∀k ≥ m) : fk (x) ≥ j},
on a " > "
E= Fkj ,
j∈N∗ m∈N∗ k≥m
où l’on a posé

Fkj = {x ∈ A ∩ F : fk (x) ≥ j},
pour tous les j et k dans N∗ . Par l’hypothèse 1 et l’inégalité de Tchebycheff,
chaque Fkj est n-intégrable et
J
µ(Fkj ) ≤ j −1 fk ≤ j −1 M.
A
D’autre part, on a
Fkj+1 ⊂ Fkj ⊂ Fk+1
j
,
ce qui entraı̂ne " j
Fk = Fm
j
,
k≥m
pour tous les j et k dans N∗ . Pour chaque j ∈ N∗ fixé, la suite
 
"
 Fkj  = (Fm
j
)m∈N∗
k≥m m∈N∗
est donc une suite croissante de parties n-intégrables de A. Il en résulte que
> " >
Fkj = j
Fm
m∈N∗ k≥m m∈N∗
est également n-intégrable et, pour chaque j ∈ N∗ ,

 
> "
µ Fkj  = lim µ(Fm
j
) ≤ j −1 M.
m→∞
m∈N∗ k≥m
!
Si nous posons maintenant F j = m∈N∗
j , alors
Fm
"
E= Fj,
j∈N∗
avec chaque F n-intégrable et tel que

j
µ(F j ) ≤ j −1 M.
Enfin, les propriétés des Fm
j entraı̂nent les relations
> >
F j+1 = j+1
Fm ⊂ j
Fm = Fj,
m∈N∗ m∈N∗
pour chaque j ∈ N∗ ,
c’est-à-dire la décroissance de la suite (F j )j∈N∗ . Par
7
conséquent, E = j∈N∗ F j est n-intégrable et
0 ≤ µ(E) = lim µ(F j ) ≤ lim j −1 M = 0;
j→∞ j→∞

En combinant ce résultat à l’extension de la notion d’intégrale que nous

venons de donner et au théorème de Levi, nous obtenons l’intéressante
généralisation du théorème de convergence monotone de Levi.
Théorème. Soit A un borné de Rn et (fk )k∈N une suite de fonctions de Rn
dans R. Supposons satisfaites les conditions suivantes.
1. Chaque fk est définie p.p. et intégrable (resp. L-intégrable) sur A.
2. La suite (fH k )k∈N est monotone p.p. sur A.
3. La suite ( A fk )k∈N converge.
Alors la suite (fk )k∈N converge ponctuellement p.p. sur A vers une fonction
f définie p.p. et intégrable (resp. L-intégrable) sur A et l’on a
J J
f = lim fk .
A k→∞ A
Le lecteur formulera aisément la version correspondante pour une série

de fonctions.
13.6 Intégrabilité sur une partie non bornée

L’extension de la notion d’intégrale de Denjoy-Perron à des parties non bor-
nées de Rn lorsque n ≥ 2 est un problème délicat qui attend encore sa
solution définitive. Nous nous contenterons dès lors de développer cette
extension dans l’important cas particulier de la L-intégrabilité, en modelant
la définition sur une condition nécessaire et suffisante de L-intégrabilité sur
un borné obtenue dans l’étude de l’additivité complète.
Définition. Soit A une partie non bornée de Rn et f une fonction de Rn
dans Rp définie p.p. sur A. On dit que f est L-intégrable sur A si les con-
ditions suivantes sont satisfaites.
1. f est L-intégrable sur Ak = A ∩ B∞ [0; k] pour chaque k ∈ N∗ .
H
2. limk→∞ Ak |f |2 existe.
La définition de l’intégrale de f sur A requiert le résultat suivant.
Proposition.
H
Si f est L-intégrable sur l’ensemble non borné A de Rn , alors
limk→∞ Ak f existe.
Démonstration. Pour chaque 1 ≤ j ≤ p et chaque x ∈ dom f, on a
0 ≤ fj+ (x) ≤ |fj (x)| ≤ |f (x)|2 , 0 ≤ fj− (x) ≤ |fj (x)| ≤ |f (x)|2 ,
13.6. INTÉGRABILITÉ SUR UNE PARTIE NON BORNÉE 509
et, puisque chacune de ces fonctions est L-intégrable sur Ak quel que soit
k ∈ N∗ , on a
J J J J
0≤ fj+ ≤ |f |2 , 0 ≤ fj− ≤ |f |2 ,
Ak Ak Ak Ak
quels que soient k ∈ N∗ et 1 ≤ j ≤ p. Comme Ak ⊂ Ak+1 pour tout k ∈ N∗ ,

les suites 4J 5 4J 5 4J 5
fj+ , fj− , |f |2 ,
Ak k∈N∗ Ak k∈N∗ Ak k∈N∗
sont croissantes pour chaque 1 ≤ j ≤ p et la dernière est convergente par
hypothèse. La convergence des autres découle
H
alors du test de comparaison
et entraı̂ne la convergence de chaque suite ( Ak fj )k∈N∗ , (1 ≤ j ≤ p), puisque
J J
fj = (fj+ − fj− ), 1 ≤ j ≤ p.
Ak Ak
Définition. Si f est L-intégrable

H
sur l’ensemble non borné A de RnH , l’inté-
grale de f sur A, notée A f est l’élément de Rp défini par limk→∞ Ak f.
Exemples. 1. La fonction
H
constante 1 n’est pas L-intégrable sur Rn . Pour
chaque k ∈ N , on a B∞ [0;k] 1 = (2k)n, et (2k)n → ∞ si k → ∞.
∗
2. La fonction f de Rn dans R définie par
f (x) = 1, x ∈ B∞ [0; 1],

1
f (x) = , x ∈ B∞ [0; k] \ B∞ [0; k − 1], k ≥ 2,
kn
est L-intégrable sur Rn . En effet, on a
J
f = 2n ,
B∞ [0;1]
J J k J
$
f= f+ f
B∞ [0;k] B∞ [0;1] j=2 B∞ [0;j]\B∞[0;j−1]
 
k
$ k
$
−n
= 2 +k
n  (2j) −
n
(2(j − 1)) n
= 2n+1 − 2n k−n ,
j=2 j=2
et dès lors J
lim f = 2n+1 .
k→∞ B∞ [0;k]
Les propriétés élémentaires de la L-intégrale sur un borné, ainsi

que le test de comparaison s’étendent aussitôt, via la définition ci-dessus,
à l’intégrale sur une partie non bornée. Montrons qu’il en est de même pour
le théorème de convergence monotone de Levi.
Théorème. Soit A une partie non bornée de Rn et (fk )k∈N une suite de
fonctions de Rn dans R. Supposons satisfaites les conditions suivantes.
1. Chaque fk est définie p.p. et L-intégrable sur A.
2. La suite de fonctions
H
(fk )k∈N est monotone p.p. sur A.
3. La suite réelle ( A fk )k∈N converge.
Alors la suite de fonctions (fk )k∈N converge ponctuellement p.p. sur A vers
une fonction f définie p.p. et L-intégrable sur A, et l’on a
J J
f = lim fk .
A k→∞ A
Démonstration. Supposons pour fixer les idées que (fk )k∈N soit crois-
sante. En considérant la suite (fk − f0 )k∈N au lieu de (fk )k∈N , on peut
toujours, sans perte de généralité, supposer que fk (x)H ≥ 0 pour presque tout
x ∈ A et chaque k ∈ N. Si nous posons J = limk→∞ A fk , alors
& J '
J = lim lim fk .
k→∞ q→∞ Aq
H
Pour chaque q ∈ N∗ fixé, la convergence de la suite croissante ( Aq fk )k∈N
résulte des inégalités J J
fk ≤ fk , k ∈ N,
Aq A
et de l’hypothèse 3. On peut donc appliquer le théorème de Levi sur un borné
à la suite (fk )k∈N restreinte à Aq et en déduire l’existence d’une fonction f q
définie p.p. et L-intégrable sur Aq , telle que (fk )k∈N converge ponctuellement
p.p. sur Aq vers f q et telle que
J J J
f q = lim fk ≤ lim fk = J.
Aq k→∞ Aq k→∞ A
Notons aussi qu’on a nécessairement f q+1 = f q p.p. sur Aq pour chaque

q ∈ N∗ et que l’on peut ainsi définir p.p. sur A une fonction f par la relation
f = f q p.p. sur Aq , q ∈ N∗ . Cette fonction fH est évidemment H
supérieure
ou égale à zéro p.p. sur A et, comme la suite ( Aq f )q∈N∗ = ( Aq f q )q∈N∗ est
croissante et majorée par J, elle converge et l’on a
J
lim f ≤ J.
q→∞ Aq
13.6. INTÉGRABILITÉ SUR UNE PARTIE NON BORNÉE 511
Il reste à démontrer que J

lim f = J.
q→∞ Aq
Soit ! > 0; par l’expression de J comme double limite donnée plus haut, il
existe m ∈ N∗ tel que
J
J − (!/2) ≤ lim fk ≤ J,
q→∞ Aq
lorsque k ≥ m. En conséquence, il existe r ∈ N∗ tel que

J
J −! ≤ fm ≤ J,
Aq
dès que q ≥ r. La croissance de la suite (fk )k∈N entraı̂ne alors que pour tout
q ≥ r et tout k ≥ m, on a
J
J−!≤ fk ≤ J;
Aq
dès lors, pour tout q ≥ r, on aura

J
J − ! ≤ lim fk ≤ J,
k→∞ Aq

Comme la définition et les propriétés correspondantes de l’intégration sur
un borné impliquent aisément que max(f, g) et min(f, g) sont L-intégrables
sur un non-borné de Rn lorsque les fonctions réelles f et g le sont, on peut
étendre à l’intégrale sur une partie non bornée la méthode utilisée dans le
cas d’un pavé fermé pour déduire le théorème de convergence majorée et
minorée de Lebesgue du théorème de Levi. Le théorème de convergence
majorée et minorée de Lebesgue tel qu’il est énoncé dans la section
précédente reste donc valable lorsque A est non borné.
Etendons maintenant la notion d’ensemble n-intégrable au cas non borné.
Définition. Soit A une partie non bornée de Rn . On dit que A est n-
intégrable si sa fonction
H
caractéristique 1A est L-intégrable sur Rn , auquel
cas le nombre positif Rn 1A est noté µ(A) et appelé sa n-mesure (sa longueur
si n = 1, son aire d’un ensemble plan si n = 2, son volume si n = 3).
Exemple. Soit A la partie non bornée de R2 définie par
A = ({0} × [0, 1]) ∪ {(x, y) : 0 ≤ y ≤ 1/k2 si x ∈]k − 1, k], k ∈ N∗ }.

Pour chaque k ∈ N∗ , on a
Ak = ({0} × [0, 1]) ∪ {(x, y) : 0 ≤ y ≤ 1/j 2 si x ∈]j − 1, j], 1 ≤ j ≤ k},

%
et dès lors Ak est 2-intégrable avec µ(Ak ) = kj=1 (1/j 2). Comme la série
%
j∈N∗ (1/j ) converge, A est 2-intégrable.
2
Les propriétés élémentaires des parties n-intégrables bornées ainsi

que les propriétés d’intégrabilité de l’intersection d’une suite dé-
croissante de parties bornées n-intégrables s’étendent aussitôt, avec le mê-
me énoncé, au cas non borné. Dans le cas d’une suite croissante (Ak )k∈N de
!
parties non bornées, il faut remplacer l’hypothèse que k∈N Ak soit bornée
par la condition que (µ(Ak ))k∈N soit majorée et utiliser dans la démons-
tration la version que nous venons de donner du théorème de Levi. On
en déduit la sous-additivité complète de la mesure: si (Ak )k∈N est une
% !
suite de parties n-intégrables et si n∈N µ(Ak ) converge, alors k∈N Ak est
! %
n-intégrable et µ( k∈N Ak ) ≤ k∈N µ(Ak ). On vérifie également que les pro-
priétés de L-intégrabilité pour la restriction à une partie n-intégrable
bornée ou non d’une fonction L-intégrable sur un ensemble non
borné, l’additivité finie ou complète de la L-intégrale et l’inégalité de
Tchebycheff s’étendent sans peine au cas non borné. Il en est de même
des propriétés des ensembles de n-mesure nulle et de l’équivalence
entre une partie n-négligeable et une partie de n-mesure nulle.
13.7 Ensembles et fonctions mesurables

L’extension suivante de la classe des parties n-intégrables de Rn joue un
grand rôle en analyse.
Définition. On dit qu’une partie A de Rn est n-mesurable si Ak = A ∩
B∞ [0; k] est n-intégrable pour chaque k ∈ N∗ .
A est donc n-mesurable si et seulement si la fonction 1A est intégrable
sur B∞ [0; k] pour chaque k ∈ N∗ . Toute partie n-intégrable de Rn est
évidemment n-mesurable, mais Rn , qui est évidemment n-mesurable puisque
chaque fermé borné B∞ [0; k] est n-intégrable, n’est pas n-intégrable puisque
µ(B∞ [0; k]) = (2k)n tend vers l’infini si k tend vers l’infini. Pour les par-
ties bornées, il y a évidemment identité entre les parties n-intégrables et les
parties n-mesurables.
Proposition. Tout ouvert de Rn est n-mesurable.
13.7. ENSEMBLES ET FONCTIONS MESURABLES 513
Démonstration. Si E ⊂ Rn est ouvert et si k ∈ N∗ , alors

Ek = E ∩ B∞ [0; k] = (E ∩ B∞ (0; k)) ∪ (E ∩ fr B∞ [0; k])
est l’union d’un ouvert borné et d’une partie n-négligeable et est par consé-
quent n-intégrable.
Proposition. Tout fermé de Rn est n-mesurable.

Démonstration. Si F ⊂ Rn est fermé et si k ∈ N∗ , alors F ∩ B∞ [0; k] est
fermé et borné, et donc n-intégrable.
Corollaire. L’intérieur, l’adhérence et la frontière d’une partie quelconque

de Rn sont n-mesurables.
Donnons quelques propriétés élémentaires des ensembles n-mesurables.
Proposition. Si A, B et Ak , k ∈ N sont des parties n-mesurables de Rn ,
! 7
alors A \ B, k∈N Ak et k∈N Ak sont n-mesurables.
Démonstration. Conséquence immédiate de la définition et des propriétés
des parties n-intégrables.
Proposition. Toute partie n-mesurable contenue dans une partie n-inté-

grable est n-intégrable.
Démonstration. Soit A n-mesurable contenue dans B n-intégrable. Si
Ak = A ∩ B∞ [0; k], on a 1Ak (x) ≤ 1B (x) pour chaque x ∈ Rn , la suite
(1Ak )k∈N converge ponctuellement sur Rn vers 1A et 1B est L-intégrable sur
Rn . La thèse résulte du théorème de convergence majorée et minorée de
Lebesgue.
L’inégalité de Tchebycheff suggère l’introduction d’une classe de fonc-
tions réelles qui sera aux fonctions réelles L-intégrables ce que les parties
n-mesurables sont aux parties n-intégrables.
Définition. Soit f une fonction de Rn dans R définie p.p. sur A ⊂ Rn . On
dit que f est n-mesurable sur A si, pour chaque r ∈ R l’ensemble
A[f > r] = {x ∈ A : f (x) > r}
est n-mesurable.
Proposition. Si f est n-mesurable sur A, alors A est n-mesurable.

!
Démonstration. On a A = k∈N A[f > −k] et chaque ensemble A[f >
−k] est n-mesurable.
On étend la définition aux fonctions à valeurs dans Rp en passant aux

composantes.
Définition. Soit f une fonction de Rn dans Rp définie p.p. sur A ⊂ Rn . On
dit que f est n-mesurable sur A si chaque composante fj de f est n-mesurable
sur A.
Il suffit donc d’étudier la n-mesurabilité des fonctions réelles. La termi-
nologie est justifiée par le résultat suivant.
Proposition. Une partie A de Rn est n-mesurable si et seulement si la
fonction constante 1 est n-mesurable sur A.
Démonstration. La condition suffisante résulte de la Proposition qui
précède. Pour la condition nécessaire, A[1 > r], égal à A si r < 1 et vide si
r ≥ 1 est n-mesurable pour tout r ∈ R.
Les caractérisations suivantes des fonctions n-mesurables sont souvent
utiles.
Proposition. Soit f une fonction réelle définie p.p. sur une partie n-
mesurable A de Rn . Les quatre conditions suivantes sont équivalentes.
1. A[f > r] = {x ∈ A : f (x) > r} est n-mesurable pour chaque r ∈ R.
2. A[f ≥ r] = {x ∈ A : f (x) ≥ r} est n-mesurable pour chaque r ∈ R.
3. A[f < r] = {x ∈ A : f (x) < r} est n-mesurable pour chaque r ∈ R.
4. A[f ≤ r] = {x ∈ A : f (x) ≤ r} est n-mesurable pour chaque r ∈ R.
Démonstration. C’est une conséquence facile des relations, aisément
vérifiées,
"
A[f ≥ r] = A[f > r − (1/k)], A[f < r] = A \ A[f ≥ r],
k∈N∗
"
A[f ≤ r] = A[f > r + (1/k)], A[f > r] = A \ A[f ≤ r],
k∈N∗
et des propriétés élémentaires des parties n-mesurables.

Le résultat suivant montre que l’ensemble des fonctions n-mesurables est
stable pour de très nombreuses opérations d’algèbre et d’analyse.
Proposition. Si f et g sont des fonctions réelles n-mesurables sur A ⊂ Rn ,
et si (fk )k∈S est une famille finie ou une suite de telles fonctions, on a les
propriétés suivantes.
1. cf + b est n-mesurable sur A pour chaque b, c ∈ R.
2. f + g est n-mesurable sur A.
3. f 2 est n-mesurable sur A.

4. f g est n-mesurable sur A.
5. f est n-mesurable sur B pour toute partie n-mesurable B de A.
6. 1/f est n-mesurable sur A si f (x) /= 0 p.p. sur A.
7. La fonction supk∈S fk donnée par [supk∈S fk ](x) = supk∈S [fk (x)] est n-
mesurable sur A lorsqu’elle y est définie p.p..
8. La fonction inf k∈S fk donnée par [inf k∈S fk ](x) = inf k∈S [fk (x)] est n-
mesurable sur A lorsqu’elle y est définie p.p..
9. Si (fk )k∈N converge ponctuellement p.p. sur A vers f , alors f est n-
mesurable sur A.
10. f + , f − et |f |s sont n-mesurables sur A pour tout s > 0.
Démonstration. 1. Si c = 0, A[b > r] = A si r 0, on a A[cf + b > r] = A[f + (b/c) > r/c] =
A[f > (r − b)/c] qui est n-mesurable quel que soit r ∈ R. Si c < 0 on a
A[cf + b > r] = A[f + (b/c) < r/c] = A[f < (r − b)/c] et l’on conclut de
même.
2. Pour tout r ∈ R, on a A[f + g > r] = A[f > r − g]. Si f (x) > r − g(x),
il existe un rationnel q tel que f (x) > q > r − g(x), et réciproquement, s’il
existe un rationnel q tel que f (x) > q et r − g(x) < q, alors f (x) > r − g(x).
Par conséquent,
>
A[f > r − g] = (A[f > q] ∩ A[r − g < q]),
q∈Q
et le résultat découle des propriétés des parties n-mesurables puisque Q est

dénombrable et les ensembles A[f > q] et A[r − g < q] sont n-mesurables.
3. Résulte de ce que A[f 2 > r] = A si r < 0 et
A[f 2 > r] = A[f > r 1/2] ∪ A[f < −r 1/2]
si r ≥ 0.
4. On a f g = (1/2)[(f +g)2 −f 2 −g 2 ] et le résultat découle des propriétés
1, 2 et 3.
5. Pour tout r ∈ R, B[f > r] = B ∩ A[f > r] est n-mesurable.
6. Notons tout d’abord que A[f = 0] = {x ∈ A : f (x) = 0} est n-
négligeable et donc de n-mesure nulle, et dès lors A[f /= 0] = {x ∈ A :
f (x) /= 0} = A\A[f = 0] est n-mesurable. En outre, si r > 0, A[(1/f ) > r] =
A[f /= 0] ∩ A[f < (1/r)] est n-mesurable tandis que si r < 0, A[(1/f ) > r] =
A[(1/f ) > 0] ∪ A[f < (1/r)] est également n-mesurable. Enfin, A[(1/f ) >
0] = A[f > 0] est n-mesurable et le résultat s’ensuit.
!
7. Montrons que A[supk∈S fk > r] = k∈S A[fk > r] pour tout r ∈ R.
Si [supk∈S fk ](x) > r, il existe, par la caractérisation du supremum (ou
trivialement si S est fini) un k0 ∈ S tel que fk0 (x) − r > 0 et dès lors
x ∈ A[fk0 > r]. Réciproquement, si fk (x) > r pour un certain k ∈ S, alors
[supk∈S fk ](x) > r. La thèse en résulte aisément.
8. Soit r ∈ R. On montre comme ci-dessus que A[inf k∈S fk < r] =
!
k∈S A[fk < r] et l’on conclut de la même manière.
9. Un argument utilisé dans l’étude des tests de la racine ou du quotient
montre que, pour presque tout x ∈ A, on a
f (x) = inf ∗ sup fk (x) = sup inf fk (x),

m∈N k≥m m∈N∗ k≥m
et la thèse résulte alors des propriétés 7 et 8.

10. On a f + = max(f, 0), f − = max(−f, 0), |f | = f + + f − , et la thèse
résulte des propriétés 7 et 2 et du raisonnement fait en 3 pour le cas de |f |s.
Donnons maintenant deux classes importantes de fonctions n-mesurables.

Proposition. Toute fonction réelle continue p.p. sur une partie n-mesura-
ble A de Rn est n-mesurable sur A.
Démonstration. Si f est une telle fonction, sa continuité sur A \ B avec
B de n-mesure nulle entraı̂ne que pour chaque r ∈ R, (A \ B)[f > r] =
(A \ B) ∩ E pour un certain ouvert E de Rn . Comme tout ouvert est n-
mesurable, le résultat s’ensuit.
Proposition. Toute fonction réelle définie p.p. et L-intégrable sur une

partie n-mesurable A de Rn est n-mesurable sur A.
Démonstration. Si f est une telle fonction, on peut toujours, en passant
à f et f − , supposer sans perte de généralité que f (x) ≥ 0 pour presque
+
tout x ∈ A. Par hypothèse, f est L-intégrable sur l’ensemble n-mesurable

Ak = A ∩ B∞ [0; k] pour chaque k ∈ N∗ . Dès lors, si r > 0, l’inégalité de
Tchebycheff entraı̂ne la n-intégrabilité, et donc la n-mesurabilité de Ak [f >
r]; d’autre part, si r ≤ 0, Ak [f ≥ r] = Ak est également n-mesurable. Il en
!
résulte aussitôt que A[f ≥ r] = k∈N∗ Ak [f ≥ r] est n-mesurable quel que
soit r ∈ R.
La réciproque de cette proposition est fausse : la fonction constante 1
est n-mesurable sur Rn sans y être L-intégrable. Même si A est n-intégrable,
une fonction peut-être n-mesurable sur A sans y être L-intégrable. Ainsi, la
fonction f définie sur ]0, 1] par f (x) = 1/x est 1-mesurable sur ]0, 1] puisque
qu’elle y est continue alors qu’une application facile du théorème de Hake
montre qu’elle n’est pas intégrable sur ]0, 1]. Nous allons toutefois établir un
important test de comparaison de L-intégrabilité sur A pour les fonctions
n-mesurables sur A. Sa démonstration nécessite l’introduction de quelques
concepts et résultats préliminaires.
Définition. Soit E une partie de Rn et s une fonction de Rn dans Rp . On
dit que s est simple sur E si s est définie sur E et si s(E) est une partie finie
de Rp.
Si s est simple sur E, si s(E) = {y 1 , . . . , y r } et si Ej = s−1 ({y j }) = {x ∈
E : s(x) = y j }, 1 ≤ j ≤ r, on aura, pour tout x ∈ E,
r
$
s(x) = 1Ej (x).y j .
j=1
Par conséquent, toute fonction simple sur E peut s’écrire comme une somme
finie de produits, par des éléments de Rp , de fonctions caractéristiques de
parties de E qui partitionnent cet ensemble. Nous allons montrer que toute
fonction réelle définie sur un ensemble est la limite ponctuelle sur cet ensem-
ble d’une suite de fonctions simples.
Proposition. Soit f une fonction réelle définie sur une partie E de Rn .
Alors il existe une suite (sk )k∈N∗ de fonctions simples sur E qui converge
ponctuellement sur E vers f et une suite (tk )k∈N∗ croissante sur E de fonc-
tions simples et positives sur E convergeant ponctuellement sur E vers |f |.
Si f est bornée sur E, la suite ainsi obtenue converge uniformément sur E
vers f .
Démonstration. Supposons tout d’abord que f (x) ≥ 0 pour tout x ∈ E.
Définissons Ekj et Fk pour 1 ≤ j ≤ k.2k , k ∈ N∗ par
Ekj = {x ∈ E : 2−k (j − 1) ≤ f (x) < 2−k j}, Fk = {x ∈ E : f (x) ≥ k},
et sk : Rn → R par
k.2 k
$
sk (x) = 2−k (j − 1).1E j (x) + k.1Fk (x).
k
j=1
Etant donnés x ∈ E et ! > 0, choisissons m ∈ N∗ tel que m > f (x) et

2−m ≤ !; on aura donc f (x) < k pour tout k ≥ m et il existera donc un
1 ≤ j ≤ k.2k tel que x ∈ Ekj . En conséquence,

sk (x) = 2−k (j − 1), 2−k (j − 1) ≤ f (x) < 2−k j,
et donc
0 ≤ f (x) − sk (x) < 2−k ≤ 2−m ≤ !.
On voit ainsi que la suite (sk )k∈N∗ converge ponctuellement sur E vers f .
Notons en outre que si f est majorée par M sur E, la convergence sera
uniforme sur E puisqu’on pourra toujours prendre m > M et 2−m ≤ ! dans
le raisonnement ci-dessus. Montrons maintenant que la suite (sk )k∈N∗ est
croissante sur E. Soient x ∈ E et k ∈ N∗ ; si f (x) ≥ k + 1, alors, puisque
f (x) > k, on a
sk+1 (x) = k + 1 > k = sk (x);
si k ≤ f (x) < k + 1, il existe 2k+1 k ≤ j ≤ 2k+1 (k + 1) tel que
k ≤ 2−k−1 (j − 1) ≤ f (x) < 2−k−1 j,
et dès lors
sk+1 (x) = 2−k−1 (j − 1) ≥ k = sk (x);
enfin, si f (x) < k, il existera 1 ≤ j < k.2k+1 tel que
2−k−1 (j − 1) ≤ f (x) < 2−k−1 j,
et il existera 1 ≤ l < k.2k tel que
2−k (l − 1) ≤ f (x) < 2−k l,
ce qui entraı̂ne
sk+1 (x) = 2−k−1 (j − 1), sk (x) = 2−k (l − 1).
Comme
2(l − 1)2−k−1 ≤ f (x) < (2l)2−k ,
on a
2l − 2 = 2(l − 1) ≤ j − 1 < j ≤ 2l,
sk+1 (x) = 2−k−1 (j − 1) ≥ 2−k−1 2(l − 1) = 2−k (l − 1) = sk (x);
la croissance est démontrée.
Lorsque f (x) n’est pas positive pour tout x ∈ E, on applique séparément
la construction ci-dessus à f + et à f − et comme les suites associées res-
pectivement à f + et à f − sont croissantes, leur somme sera croissante et
convergera ponctuellement sur E vers |f |.
Corollaire. Si f est une fonction réelle n-mesurable sur E ⊂ Rn , alors les

suites de fonctions simples construites dans la proposition précédente sont
formées de combinaisons linéaires de fonctions caractéristiques de parties
n-mesurables de E et sont donc n-mesurables sur E.
Démonstration. Supposons tout d’abord que f (x) ≥ 0 pour tout x ∈ E
et reprenons les notations de la démonstration de la proposition précédente.
Pour chaque r ≥ 0, posons Fr = {x ∈ E : f (x) ≥ r}, ce qui entraı̂ne aussitôt
que Fs ⊂ Fr si s > r, et Ekj = F2−k (j−1) \ F2−k j . On en déduit aussitôt que,
pour chaque k ∈ N∗ et chaque x ∈ Rn , on a
k
2 k
$
sk (x) = 2−k (j − 1)[1F2−k (j−1) − 1F2−k j (x)] =
j=1
k
2 k
$
2−k (j − 1)[1F2−k (j−1) − 1F2−k j (x)].
j=2
En vertu de la n-mesurabilité de f sur E, chaque fonction 1F2−k j et 1Fk est

n-mesurable, et le résultat s’en déduit. Si f n’est pas positive sur E, il suffit
de considérer séparément f + et f − .
Nous pouvons maintenant énoncer et démontrer un très utile test de
comparaison pour la L-intégrabilité des fonctions n-mesurables.
Théorème. Soit f une fonction réelle définie p.p. et n-mesurable sur A ⊂
Rn . S’il existe une fonction positive g L-intégrable sur A et telle que, pour
presque tout x ∈ A, on ait
|f (x)| ≤ g(x),
alors f est L-intégrable sur A.

Démonstration. Supposons tout d’abord que f soit positive p.p. sur A.
Par le corollaire ci-dessus, il existe une suite croissante (sk )k∈N∗ de fonctions
positives p.p. et n-mesurables sur A, explicitement donnée dans le corollaire,
qui converge ponctuellement p.p. sur A vers f . En outre, si l’on pose
Fr = {x ∈ A : f (x) ≥ r} et Gr = {x ∈ A : g(x) ≥ r}, on aura évidemment
Fr ⊂ Gr pour chaque r ∈ R. Comme l’inégalité de Tchebycheff entraı̂ne la n-
intégrabilité de Gr pour chaque r > 0, chaque ensemble Fr sera également n-
intégrable pour chaque r > 0. Dès lors, chaque fonction sk sera L-intégrable
sur A et telle que, pour presque tout x ∈ A, on a
0 ≤ sk (x) ≤ f (x) ≤ g(x), k ∈ N∗ ,

Le théorème de convergence majorée et minorée de Lebesgue entraı̂ne alors

la L-intégrabilité de f sur A. Si f n’est pas positive p.p. sur A, on ap-
plique le résultat que nous venons de démontrer séparément à f + et f − et
Corollaire. Toute fonction réelle n-mesurable sur A ⊂ Rn dont la valeur

absolue est L-intégrable sur A, est elle-même L-intégrable sur A.
Démonstration. Prendre g = |f | dans le test de comparaison.
On a aussi un intéressant résultat sur la L-intégrabilité d’un produit de
fonctions.
Corollaire. Si f est une fonction réelle L-intégrable sur A ⊂ Rn et g une
fonction réelle n-mesurable et bornée p.p. sur A, alors f g est L-intégrable
sur A.
Démonstration. On sait que f g est n-mesurable sur A et si M est un
majorant p.p. de |g| sur A, on aura, pour presque tout x ∈ A,
|f (x)g(x)| ≤ M |f (x)|,
et le test de comparaison permet de conclure puisque M |f | est L-intégrable

sur A.
Exemple. Soit f une fonction réelle L-intégrable sur I = [0, 2π]. Le dernier
corollaire implique que, pour chaque k ∈ N, les fonctions x 2→ f (x) cos kx
et x 2→ f (x) sin kx sont également L-intégrables sur I. Les nombres réels
a0 , ak , bk , k ∈ N∗ définis par les formules
J 2π J 2π
a0 = (2π)−1 f (x) dx, ak = π −1 f (x) cos kx dx,
0 0
J 2π
bk = π −1 f (x) sin kx dx, k ∈ N∗ ,
0
sont appelés les coefficients de Fourier de f , et la série trigonométrique
correspondante $
a0 + (ak cos kx + bk sin kx)
k∈N∗
s’appelle la série de Fourier de f . L’étude de la convergence de cette

série est un problème délicat qui ne sera pas abordé ici. Ainsi, Andrej
N. Kolmogorov a donné en 1926 un exemple de fonction L-intégrable
sur I dont la série de Fourier diverge partout sur I ! Il a fallu attendre
1966 pour que Lennart Carleson démontre que la série de Fourier de

f converge ponctuellement p.p. sur I vers f sous l’hypothèse plus forte
que f soit 1-mesurable sur I et f 2 soit L-intégrable sur I (ce qui entraı̂ne
la L-intégrabilité de f sur I par le test de comparaison ci-dessus puisque
|f (x)| ≤ (1/2)(1 + |f (x)|2 )). Ce résultat avait été conjecturé par Nicolas
N.Lusin en 1913 ! Même pour le cas encore plus particulier d’une fonction
f continue sur I, on n’a pas nécessairement convergence ponctuelle partout
sur I de la série de Fourier de f vers f . Par contre, si f est de classe C 1 sur I
et si f (0) = f (2π), on peut démontrer que la série de Fourier de f converge
uniformément sur I vers f . La théorie des séries de Fourier et ses diverses
extensions ont joué et jouent encore un rôle absolument fondamental dans
le développement des mathématiques pures et appliquées.
Une autre conséquence utile du test de comparaison est le résultat sui-
vant.
Corollaire. Si f est une fonction réelle continue sur un fermé borné A de
Rn , alors f est L-intégrable sur A.
Démonstration. A, fermé et borné, est n-intégrable et f , continue sur A,
y est n-mesurable. D’autre part, le théorème de Weierstrass entraı̂ne que f
est bornée sur A et la thèse résulte du test de comparaison ci-dessus et du
fait que toute fonction constante sur A y est L-intégrable.
Les notions de fonctions L-intégrables et n-mesurables permettent d’in-
troduire de nouvelles notions de convergence pour les suites de fonctions: la
convergence en moyenne et la convergence en moyenne quadratique.
Définition. Si (fk )k∈N est une suite de fonctions de Rn dans Rp L-inté-
grables sur A (resp. n-mesurables sur A et telles que chaque |fk |22 soit L-
intégrable sur A), et si f est une fonction de Rn dans Rp L-intégrable sur A
(resp. n-mesurable sur A et telle que |f |22 soit L-intégrable sur A), on dit que
(fk )k∈N converge en moyenne sur A (resp. converge en moyenne quadratique
sur A) vers f si la suite
4J 5 4J 5
|fk − f |2 (resp. |fk − f |22 )
A k∈N A k∈N
converge vers zéro.

On a également une notion importante de convergence pour les suites de
fonctions n-mesurables: la convergence en mesure.
Définition. Si (fk )k∈N est une suite de fonctions de Rn dans R n-mesu-
rables sur A, on dit que (fk )k∈N converge en mesure sur A vers f si, pour
chaque k ∈ N suffisamment grand et chaque ! > 0, l’ensemble {x ∈ A :

|fk (x) − f (x)| ≥ !} est n-intégrable et si
lim µ ({x ∈ A : |fk (x) − f (x)| ≥ !}) = 0.

k→∞
Cette notion joue un rôle important en calcul des probabilités.

Le lien entre ces types de convergence et ceux déjà introduits sera étudié
au Chapitre 17.
13.8 Exercices
1. Montrer que tout borné n-intégrable de mesure non nulle contient un
ensemble qui n’est pas n-intégrable. Suggestion : soit E ⊂ B∞ [ρ] ⊂ Rn un
tel borné et définissons-y la relation d’équivalence x = y si et seulement
si x − y ∈ Qn ; soit (Eα)α∈A la partition correspondante de E en classes
d’équivalence; si x ∈ Eα, alors Eα = (x + Qn ) ∩ E est dénombrable et donc
n-négligeable; en déduire que A est non dénombrable (puisque µ(E) > 0);
par l’axiome du choix, on choisit, pour chaque α ∈ A, un xα ∈ Eα et l’on
définit F par F = {xα : α ∈ A}; F n’est pas dénombrable et, pour r ∈ Qn ,
on pose Fr = r + F (noter que Fr ∩ Fr" = ∅ si r /= r $ ) et
> > >
G= Fr = (xα + r) ⊃ E;
r∈Qn ; |r|∞ ≤2ρ r∈Qn ; |r|∞ ≤2ρ α∈A
si F est n-intégrable, G l’est aussi et dès lors, si µ(F ) = 0, alors

$
µ(E) = µ(Fr ) = 0,
r∈Qn , |r|∞ ≤2ρ
(contradiction), tandis que si µ(F ) > 0, alors

$
µ(G) ≤ µ(Fr ) = +∞,
r∈Qn , |r|∞ ≤2ρ
(contradiction); donc F n’est pas n-intégrable.

2. Soit f une fonction de Rn dans R et A ∈ Rn . Montrer que si |f | (resp.
f 2 ) est n-mesurable sur A, f ne l’est pas nécessairement.
Suggestion. Si E ⊂ Rn est une partie non n-intégrable (voir exercice précé-
dent), alors f = 1E − 1Rn \E n’est pas n-mesurable sur Rn alors que |f | = 1
et f 2 = 1 le sont.
13.8. EXERCICES 523
3. Montrer que l’ensemble de Cantor défini aux Exercices du Chapitre 4

est 1-négligeable. Cela fournit un exemple d’ensemble 1-négligeable et non
dénombrable.
4. Montrer que si (fk )k∈N est une suite de fonctions de Rn dans R intégrables
sur A ⊂ Rn et telles que, pour presque tout x ∈ A, on ait, pour une certaine
fonction g de Rn dans R intégrable sur A,
fk (x) ≥ g(x) (resp. fk (x) ≤ g(x)), (k ∈ N),
alors, si J J
lim inf fk (resp. lim sup fk ),
k→∞ A k→∞ A
existe et si la fonction lim inf k→∞ fk (resp. lim supk→∞ fk ) existe, cette
fonction est intégrable sur A et l’on a
J J
lim inf fk ≤ lim inf fk ,
A k→∞ k→∞ A
J J
(resp. lim sup fk ≥ lim sup fk ).
A k→∞ k→∞ A
Ce résultat s’appelle le lemme de Fatou. Considérant, pour fixer les idées, le

cas de lim inf et travaillant sur fk − g au lieu de fk , on peut supposer les fk
positives p.p. sur A. On notera que l’on a, p.p. sur A,
4 5 2 4 53
lim inf fk = lim inf fj = lim lim min fj ,
k→∞ k→∞ j≥k k→∞ l→∞ k≤j≤l
et le lemme de Fatou se déduit de deux applications successives du théorème

de convergence monotone de Levi.
5. Montrer que si f est une fonction de Rn dans R et A une partie de Rn
telles que f soit mesurable sur A et |f |2 soit intégrable sur A, alors, pour
tout r > 0, on a, si Ar = {x ∈ A : |f (x)| > r},
J
1
µ(Ar ) ≤ |f |2 .
r2 A
(Inégalité de Tchebycheff pour les fonctions de carré intégrable). Cette

inégalité joue un grand rôle en calcul des probabilités: en appliquant ce
H 8 H 91/2
résultat à f − f , où f = µ(A)
1
A f, et en posant σ(f ) = µ(A)
1
A |f − f |2 ,
on trouve
µ{x ∈ A : |f (x) − f | > tσ(f )} 1
≤ 2,
µ(A) t
ce qui donne une limite à la dispersion, autour de sa moyenne f , d’une

variable aléatoire f admettant un écart quadratique moyen σ(f ), et permet
de prouver la loi faible des grands nombres.
6. Montrer que si f est une fonction de Rn dans Rp L-intégrable sur Rn , alors
f n’a pas nécessairement de limite à l’infini, et n’est même pas nécessairement
bornée au voisinage de l’infini.
Suggestion. Utiliser le théorème de Hake pour montrer que la fonction de R
dans R définie par
∞
$
f (x) = 2k 1Yk− 1
,k+ 1
:
2k 2k
k=1
est L-intégrable sur R alors qu’elle n’est pas bornée au voisinage de l’infini.
7. Montrer que si f est une fonction de Rn dans Rp L-intégrable sur Rp et
si limx→∞ f (x) existe, alors cette limite est nulle.
Suggestion. Si L = limx→∞ f (x) /= 0, il existe m ∈ N tel que |f (x)|2 ≥ |L|2 2
pour tout x ∈ Rn tel que |x|∞ ≥ m. En conséquence, pour tout k ≥ m,
J J J
|f |2 = |f |2 + |f |2
B∞ [k] B∞ [m] B∞ [k]\B∞[m]
J
|L|2
≥ |f |2 + [(2k)n − (2m)n ] ,
B∞ [m] 2
H
ce qui montre que limk→∞ B∞ [k] |f |2 = ∞.
On comparera utilement les résultats des exercices 6 et 7 à ceux corre-
spondants pour une série.

Tous les ensembles que nous considérerons seront formés de points compris
entre 0 et 1. Lorsqu’un ensemble sera formé de tous les points compris
dans une infinité dénombrable d’intervalles n’empiétant pas les uns sur les
autres et ayant une longueur totale s, nous dirons que l’ensemble a pour
mesure s. Lorsque deux ensembles n’ont pas de points communs, et que
leurs mesures sont s et s$ , l’ensemble obtenu en les réunissant, c’est-à-dire
leur somme, a pour mesure s + s$ . D’ailleurs il importe peu que dans la
définition de la mesure d’un ensemble, ou dans celle de la somme de deux en-
sembles, qu’on néglige ou qu’on tienne tel compte qu’on veut des extrémités
des intervalles, en infinité dénombrable. Plus généralement, si l’on a une
infinité dénombrable d’ensembles n’ayant deux à deux aucun point commun
et ayant respectivement pour mesures s1 , s2 , . . ., sn , . . . , leur somme (ou en-

semble formé par leur réunion) a pour mesure
s1 + s2 + . . . + sn + . . . .
Tout cela est une conséquence de la définition de la mesure. Voici main-

tenant des définitions nouvelles : si un ensemble E a pour mesure s, et
contient tous les points d’un ensemble E $ dont la mesure est s$ , l’ensemble
E − E $ , formé des points de E qui n’appartiennent pas à E $ , sera dit avoir
pour mesure s − s$ ; de plus, si un ensemble est la somme d’une infinité
dénombrable d’ensembles sans partie commune, sa mesure sera la somme
des mesures de ses parties et enfin les ensembles E et E $ ayant, en vertu de
ces définitions, s et s$ comme mesures, et E renfermant tous les points de
E $ , l’ensemble E − E $ aura pour mesure s − s$ .
Emile Borel, 1898
Nous nous proposons d’attacher à chaque ensemble borné un nombre posi-

tif ou nul que nous appellerons sa mesure et satisfaisant aux conditions sui-
vantes :
1. Il existe des ensembles dont la mesure n’est pas nulle.
2. Deux ensembles égaux ont même mesure.
3. La mesure de la somme d’un nombre fini ou d’une infinité dénombrable
d’ensembles, sans points communs deux à deux, est la somme des mesures
de ces ensembles.
Nous ne résoudrons ce problème de la mesure que pour les ensembles que
nous appellerons mesurables.
Une fonction sera dite sommable si, quels que soient a et b, l’ensemble
des valeurs de x pour lesquelles on a a < f (x) < b est mesurable. Les
fonctions continues par rapport à l’ensemble des variables sont sommables.
La somme, le produit de deux fonctions sommables, la limite d’une suite
de fonctions sommables sont des fonctions sommables. Donc les fonctions
discontinues que Mr. Baire appelle fonctions de première classe, de seconde
classe, etc. sont sommables. Les fonctions de n variables continues par
rapport à chacune d’elles sont de n − 1e classe au plus, donc elles sont
sommables.

La question de l’existence des classes d’ensembles se ramène à celle des

classes de fonctions et réciproquement. ... Commençons par montrer la
dépendance des deux classifications. Soit E un ensemble mesurable (B).
Définissons une fonction φ(x) égale à 1 dans E et à 0 dans !E. Nous
l’appellerons la fonction caractéristique de E.
Charles-Jean de La Vallée Poussin, 1915
Chaque progrès avait consisté à estimer la mesure d’un ensemble E au

moyen de la longueur totale d’un ensemble d’intervalles couvrant E. Mais
on avait toujours pris ces intervalles parmi des intervalles choisis d’avance.
Borel a écrit lui-même que son point de départ a été de prendre, pour chaque
ensemble, des intervalles non seulement couvrant l’ensemble, mais dépendant
directement de cet ensemble. En prenant comme intervalles ceux qu’on ob-
tient en divisant un segment en parties égales, Jordan arrivait à la conclu-
sion que l’ensemble R des points d’abscisse rationnelle entre 0 et 1 avait
pour mesure l’unité. En attachant, avec Borel, à chaque point d’abcisse ra-
tionnelle rn un segment de longueur !/n2 , on constate que R est couvert
%
par un ensemble d’intervalles dont la longueur totale est ! n12 ; sa mesure
devant intuitivement être inférieure à ce total est aussi petite que l’on veut
avec !. Borel arrivait ainsi à cette conclusion, qui, à l’époque, a paru sur-
prenante, que l’ensemble des nombres rationnels, pourtant dense partout,
était de mesure nulle. C’est par cet exemple que Borel a été conduit à la
notion générale de mesure.
Maurice Fréchet, 1965

Chapitre 14
Représentations et
transformations
14.1 Limites et continuité

Si f est une fonction de R dans R intégrable sur [a, b],H on sait que son
intégrale indéfinie est l’application F : [a, b] → R, x 2→ ax f (t) dt. Si nous
définissons g : [a, b] × [a, b] → R, (x, t) 2→ 1[a,x]f (t), l’intégrale indéfinie de f
peut encore se définir par la formule
J b
F (x) = g(x, t) dt.
a
On a vu précédemment que la fonction Gamma d’Euler était définie pour

chaque x ∈ ]0, ∞[ par la formule
J +∞
Γ(x) = tx−1 exp(−t) dt.
0
Si f est une fonction de Rn dans C L-intégrable sur Rn , la transformée de

Fourier de f est la fonction de Rn dans C définie par la formule
J
fˆ(x) = exp[−2iπ(x|y)]f (y) dy.
Rn
Plus généralement, si, pour
p = (ξ1 + iη1 , . . . , ξn + iηn ) ∈ Cn ,
527
528 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS
%
et y ∈ Rn , on pose (p|y) = nj=1 pj yj , et si f est une fonction de Rn dans C,
la transformée de Laplace de f est la fonction de Cn dans C définie sur
Γf = {p ∈ Cn : exp[−(p|·)]f est intégrable sur Rn }
par J
Lf (p) = exp[−(p|y)]f (y) dy.
Rn
Le potentiel du champ de gravitation créé par un corps matériel M de densité

variable ρ en un point x ∈ R3 extérieur à M est donné par la formule
J
ρ(y)
V (x) = −G dy,
M |x − y|2
où G désigne la constante de gravitation.

Les fonctions données dans tous ces exemples ont en commun d’être définies
à partir d’une fonction de plusieurs variables que l’on intègre, sur un ensem-
ble fixe, par rapport à une partie des variables seulement. On les appelle
des représentations intégrales, des intégrales paramétriques ou des fonctions
définies par une intégrale. Dans toute ce chapitre, sauf mention contraire,
l’expression “intégrable sur B” devra se lire “L-intégrable sur B” lorsque B
est une partie non bornée contenue dans un espace vectoriel de dimension
supérieure ou égale à 2.
Si q ≥ 1 et s ≥ 1 sont des entiers tels que q + s = n, nous écrirons Rn
sous la forme Rq × Rs avec l’écriture correspondante x = (y, z) pour chaque
élément x de Rn .
Définition. Soit f une fonction de Rn dans Rp , A une partie de Rq et B

une partie de Rs . Si, pour chaque y ∈ A (resp. pour presque tout y ∈ A), la
fonction f (y, ·) de Rs dans Rp est intégrable sur B, alors l’application F de
A dans Rp définie (resp. définie p.p.) par
J
F (y) = f (y, z) dz
B
est appelée une intégrale paramétrique ou une application définie par une
intégrale. On dit aussi que le membre de droite est une représentation
intégrale de F. Dans le cas particulier important où h est une fonction de Rs
dans C et K une fonction de Rn dans C telles que, pour chaque y ∈ A (resp.
pour presque tout y ∈ A), la fonction f (y, ·), avec f définie (resp. définie
14.1. LIMITES ET CONTINUITÉ 529
p.p.) sur A par f (y, z) = K(y, z)h(z), soit intégrable sur B, l’application
correspondante H définie (resp. définie p.p.) sur A par
J
H(y) = K(y, z)h(z)dz
B
est appellée la transformée intégrale de h de noyau K. Lorsque g et h

sont des fonctions de Rq dans C telles que, pour presque tout y ∈ Rq , la
fonction f (y, ·), avec f définie par f (y, z) = g(y − z)h(z), est L-intégrable
sur
H
Rq , l’application correspondante g ∗ h définie p.p. sur Rq par (g ∗ h)(y) =
Rq g(y − z)h(z) dz s’appelle le produit de convolution de g et h.
Comme pour les fonctions définies par la limite d’une suite de fonctions
ou la somme d’une série de fonctions, il est intéressant de savoir sous quelles
conditions certaines propriétés de la fonction f sont conservées par F . En
passant, si nécessaire, aux composantes de F et f , on peut, sans perte de
généralité, supposer que p = 1.
Considérons tout d’abord le problème fondamental de l’existence d’une
limite pour F (y) lorsque y tend vers a ∈ adh A ou tend vers l’infini.
Proposition. Soit a ∈ adh A (resp. A non borné) et supposons satisfaites
1. f (y, ·) est intégrable sur B pour chaque y ∈ A.
2. limy→a, y∈A f (y, z) (resp. limy→∞, y∈A f (y, z)) existe pour presque tout
z ∈ B.
3. Il existe r > 0 et des fonctions réelles g et h intégrables sur B telles que,
pour tout y ∈ A ∩ B∞ [a; r] (resp. y ∈ !B∞ [0; r] ∩ A) et presque tout z ∈ B,
on a
g(z) ≤ f (y, z) ≤ h(z).
Alors la fonction ϕ définie presque partout sur B par
ϕ(z) = lim f (y, z) (resp. lim f (y, z))

y→a, y∈A y→∞, y∈A
est intégrable sur B et

J J
lim F (y) = ϕ(z) dz (resp. lim F (y) = ϕ(z) dz).
y→a, y∈A B y→∞, y∈A B
En d’autres termes, on a
2J 3 J 2 3
lim f (y, z) dz = lim f (y, z) dz
y→a, y∈A B B y→a, y∈A
2J 3 J 2 3
(resp. lim f (y, z) dz = lim f (y, z) dz.
y→∞, y∈A B B y→∞, y∈A
Démonstration. Considérons, pour fixer les idées, le cas où y → a. Soit

(yk )k∈N une suite dans A∩B∞ [a; r] qui converge vers a. La suite (f (yk , ·))k∈N
de fonctions intégrables sur B converge ponctuellement p.p. sur B vers ϕ et
est telle que
g(z) ≤ f (yk , z) ≤ h(z)
pour tout k ∈ N et presque tout z ∈ B. Le théorème de convergence ma-
jorée et minorée de Lebesgue entraı̂ne alors l’intégrabilité de ϕ sur B et les
relations J J
lim F (yk ) = lim f (yk , z) dz = ϕ(z) dz.
k→∞ k→∞ B B
La proposition résulte du caractère local de la notion de limite et de sa
caractérisation par les suites.
Une conséquence facile de cette proposition est la continuité de F en a
lorsque f (·, z) est continue en a pour presque tout z ∈ B et que les hypothèses
1 et 3 sont vérifiées.
Corollaire. Supposons satisfaites les conditions suivantes.
2. f (·, z) est continue en a ∈ A pour presque tout z ∈ B.
3. Il existe r > 0 et des fonctions réelles g et h intégrables sur B tels que,
pour tout y ∈ B∞ [a; r] ∩ A et presque tout z ∈ B, on ait
g(z) ≤ f (y, z) ≤ h(z).
Alors F est continue en a.
Corollaire. Si f est continue sur A × B, A est ouvert et B est fermé et

borné, alors F est continue sur A.
Démonstration. Par hypothèse, f (y, ·) est continue sur B, et donc inté-
grable sur B pour chaque y ∈ A, et f (·, z) est continue sur A pour chaque
z ∈ B. D’autre part, si a ∈ A, il existe r > 0 tel que B∞ [a; r] ⊂ A et dès
lors, f étant continue sur le fermé borné B∞ [a; r] × B, il existe C > 0 tel
que
−C ≤ f (y, z) ≤ C
pour tout (y, z) ∈ B∞ [a; r] × B. Il suffit donc de prendre g = −C = −h dans
la Proposition précédente.
14.2. RÈGLE DE LEIBNIZ 531
14.2 Règle de Leibniz

Passons maintenant à la dérivabilité d’une fonction définie par une intégrale.
Le résultat suivant s’appelle la règle de Leibniz de dérivation sous le
signe d’intégration.
Proposition. Supposons que int A /= ∅ et que les conditions suivantes
soient satisfaites.
2. Il existe un entier 1 ≤ i ≤ q, un point a ∈ int A et un réel r > 0 tels que
B∞ [a; r] ⊂ A et tels que f (·, z) possède pour presque tout z ∈ B une dérivée
partielle par rapport à yi en chaque point y ∈ B∞ [a; r].
3. Il existe deux fonctions réelles g et h intégrables sur B telles que, pour
tout y ∈ B∞ [a; r] et presque tout z ∈ B, on ait
g(z) ≤ Dyi f (y, z) ≤ h(z).
Alors F possède en a une dérivée partielle par rapport à yi , Dyi f (a, ·) est
intégrable sur B et J
Di F (a) = Dyi f (a, z) dz.
B
2J 3 J
Di f (a, z) dz = Dyi f (a, z) dz.
B B
Démonstration. Soit ψ la fonction définie sur ([−r, r] \ {0}) × B par le

quotient différentiel
ψ(h, z) = h−1 [f (a + hei , z) − f (a, z)].
Par construction, ψ(h, ·) est intégrable sur B pour chaque h ∈ [−r, r] \ {0}
et
lim ψ(h, z) = Dyi f (a, z)
h→0, h(=0
pour presque tout z ∈ B. En outre, en appliquant le théorème de Lagrange

à la fonction h → f (a + hei , z), on obtient, pour chaque h ∈ [−r, r] et pour
presque tout z ∈ B un h$ ∈ R tel que 0 < |h$ | < |h| et
f (a + hei , z) − f (a, z) = hDyi (a + h$ ei , z).
En conséquence, par l’hypothèse 3, on a
g(z) ≤ ψ(h, z) ≤ h(z)

pour tout h ∈ [−r, r]\{0} et presque tout z ∈ B. On peut donc appliquer à ψ

la Proposition relative à la limite d’une intégrale paramétrique, qui implique
l’intégrabilité de Dyi f (a, ·) sur B et l’égalité
J J
lim ψ(h, z) dz = Dyi f (a, z) dz.
h→0, h(=0 B B
Comme on a évidemment
J J
1
lim ψ(h, z) dz = lim [f (a + hei , z) − f (a, z)] dz
h→0, h(=0 B h→0, h(=0 h B
= lim h−1 [F (a + hei ) − F (a)],

h→0, h(=0
H
on voit que DiF (a) existe et vaut B Dyi f (a, z) dz.
Corollaire. Si A est ouvert, B est fermé borné et s’il existe 1 ≤ i ≤ q

tel que, pour chaque (y, z) ∈ A × B, f possède une dérivée partielle par
rapport à yi en (y, z) et si la fonction dérivée partielle Dyi f est continue sur
A × B, alors F possède en chaque y ∈ A une dérivée partielle par rapport yi ,
la fonction dérivée partielle Di F est continue sur A et l’on a, pour chaque
y ∈ A, J
Di F (y) = Dyi f (y, z) dz.
B
Démonstration. Soit a ∈ A et r > 0 tels que B∞ [a; r] ⊂ A. Pour chaque
y ∈ B∞ [a; r], la fonction Dyi f (y, ·) est continue, et donc intégrable, sur B
et, Dyi f étant continue sur le fermé borné B∞ [a; r] × B, il existera C > 0
tel que
−C ≤ Dyi f (y, z) ≤ C
pour tout (y, z) ∈ B∞ [a; r] × B. Les conditions de la Proposition précédente
sont donc satisfaites. Le seul point qui n’en découle pas, à savoir la continuité
de DiF , est une conséquence de la formule de Leibniz et du Corollaire ci-
dessus sur la continuité d’une intégrale paramétrique.
La règle de Leibniz peut être utilisée pour calculer certaines intégrales.
Pour montrer, par exemple que, si a et b sont strictement positifs, on a
J +∞ exp(−ax) − exp(−bx) b
dx = ln
0 x a
il suffit de noter tout d’abord que les deux membres, considérés comme
fonctions de b, sont tous deux égaux (à zéro) si b = a. Ces fonctions seront
14.2. RÈGLE DE LEIBNIZ 533
donc égales pour tout b > 0 si leurs dérivées sont égales pour tout b > 0. Celle
du deuxième membre est égale à 1/b. En utilisant la règle H
de Leibniz (vérifier
les hypothèses!), celle du premier membre est égale à 0+∞ exp(−bx) dx, et
donc à 1/b.
Comme autre exemple, montrons que cette règle jointe aux résultats
sur la limite d’une intégrale paramétrique permet de calculer l’intégrale de
Poisson J ∞
exp(−x2 ) dx,
0
qui joue un rôle important en analyse et en calcul des probabilités. Cette
intégrale existe évidemment puisque l’intégrand est continu et tel que, pour
tout x ≥ 1, on a
exp(−x2 ) ≤ exp(−x),
le second membre de l’inégalité étant évidemment intégrable. Posons
4J 52 J
y 1 exp[−y 2 (z 2 + 1)]
f (y) = exp(−z ) dz
2
, g(y) = dz.
0 0 z2 + 1
Il est facile de voir que ces fonctions sont définies et continues pour tout
y ≥ 0, et que
J 1 dz π
f (0) = 0, g(0) = = arctg 1 = .
0 z2 + 1 4
On a, par les propriétés de dérivabilité d’une intégrale indéfinie et par la
règle de Leibniz (vérifier que les hypothèses sont satisfaites)
J y J 1
f $ (y) = 2 exp[−(y 2 + z 2 )] dz, g $ (y) = −2 y exp[−y 2 (z 2 + 1)] dz.
0 0
En particulier, si y > 0, on trouve, en posant t = zy, que

J y
g $ (y) = −2 exp[−(y 2 + t2 )] dt = −f $ (y).
0
Donc la fonction f + g est constante sur ]0, +∞[, et comme elle est continue
en 0, on aura, pour tout y ≥ 0,
π
f (y) + g(y) = f (0) + g(0) = ,
4
ce qui entraı̂ne particulier que (justifier le passage à la limite sous le signe
intégral)
π
= lim [f (y) + g(y)]
4 y→+∞
4J 52 J
∞ 1 exp[−y 2 (z 2 + 1)]
= exp(−z 2 ) dz + lim dz
0 y→+∞ 0 z2 + 1
4J 52 J
∞ 1 exp[−y 2 (z 2 + 1)]
= exp(−z 2 ) dz + lim [ ] dz
0 0 y→+∞ z2 + 1
4J ∞ 52
= exp(−z 2 ) dz .
0
On en déduit aussitôt la valeur de l’intégrale de Poisson

J ∞
√
π
exp(−x ) dx =2
.
0 2
14.3 Théorème de Fubini

Passons maintenant au problème de l’intégrabilité d’une fonction définie par
une intégrale. Les “hypothèses naturelles” pour la validité de l’intégrabili-
té (c’est-à-dire l’analogue des “hypothèses naturelles” 1 et 2 des résultats
sur l’existence de la limite ou des dérivées pour F ) sont évidemment les
suivantes:
1. f (y, ·) est intégrable sur B pour presque tout y ∈ A.
2. f (·, z) est intégrable sur A pour presque tout z ∈ B.
En tenant compte de la symétrie de ces hypothèses par rapport aux deux
groupes de variables, la conclusion souhaitée,H qui doit évidemment respecter
cette symétrie, est que la fonction
H
F : y 2→ B f (y, z) dz soit intégrable sur
A, que la fonction G : z 2→ A f (y, z) dy soit intégrable sur B et que l’on ait
l’égalité
J J
F (y) dy = G(z) dz,
A B
c’est-à-dire J 2J 3 J 2J 3
f (y, z) dz dy = f (y, z) dy dz.
A B B A
Comme pour la limite et la dérivabilité, ces “hypothèses naturelles” ne suf-

fisent pas à assurer la validité du résultat, ainsi que le montre l’exemple
suivant.
Exemple. Soit f la fonction réelle définie comme suit sur [0, 1] × [0, 1] :
f (y, z) = z −2 si 0 < y < z < 1, f (y, z) = −y −2 si 0 < z < y < 1

14.3. THÉORÈME DE FUBINI 535
et f (y, z) = 0 ailleurs dans [0, 1] × [0, 1]. On vérifie facilement que, pour
chaque 0 < z < 1, on a
J 1 J z J 1
dy dy
f (y, z) dy = − = 1,
0 0 z2 z y2
et dès lors J 1 2J 1 3 J 1
f (y, z) dy dz = 1 dz = 1.
0 0 0
De même, on a, pour chaque 0 < y < 1,

J 1 J y J 1
dz dz
f (y, z) dz = − + = −1,
0 0 y2 y z2
et dès lors, 2J 3
J 1 1 J 1
f (y, z) dz dy = (−1) dy = −1.
0 0 0
Il faut donc remplacer l’hypothèse “naturelle” par une hypothèse plus forte.
Celle-ci s’exprime dans le théorème de Fubini que nous commencerons par
énoncer et démontrer dans le cas où A et B sont des pavés fermés. L’impor-
tance de ce théorème proviendra également de ce qu’il nous permettra de
ramener le calcul d’une intégrale sur un pavé de Rn à une succession de n
intégrales sur des intervalles de R.
Soit I = J × K un semi-pavé de Rn , avec J ⊂ Rq et K ⊂ Rs des semi-
pavés, q + s = n, et soit f une fonction de Rn dans R. Notons tout d’abord
que {y} × K̄ étant de n-mesure nulle pour chaque y ∈ J¯, toute fonction f
intégrable sur I¯ le reste, avec la même intégrale, si, pour un nombre fini et
même une infinité dénombrable de y, on remplace f (y, ·) par une fonction
quelconque de z, et en particulier une fonction non intégrable sur K̄. Par
conséquent, cette fonction modifiée montre que l’intégrabilité de f sur I¯
n’entraı̂ne pas celle de f (y, ·) sur K̄ pour tout y ∈ J¯. Le résultat qui suit
montre cependant que cette conclusion est valide pour presque tout y ∈ J¯.
Théorème. Si f est intégrable sur I¯ et si l’on pose
T = {y ∈ J¯ : f (y, ·) n’est pas intégrable sur K̄},
alors T est de q-mesure nulle.

Démonstration. Par la condition nécessaire et suffisante de Cauchy pour
l’intégrabilité de f (y, ·) sur K̄, on a
T = {y ∈ J¯ : il existe ! > 0 tel que, pour toute jauge δK sur K̄,

il existe deux P-partitions δK -fines ΠK et Π̃K de K telles que
S(K, f (y, ·), ΠK) − S(K, f (y, ·), Π̃K) > !}.
Si dès lors, pour chaque i ∈ N∗ , on pose
Ti = {y ∈ J¯ : pour toute jauge δK sur K̄,
il existe deux P-partitions δK -fines ΠK et Π̃K de K telles que
S(K, f (y, ·), ΠK ) − S(K, f (y, ·), Π̃K) > 1i },
!
alors Ti ⊂ Ti+1 ⊂ J¯, (i ∈ N∗ ), et T = i∈N∗ Ti . Par les propriétés de la
mesure, il suffit donc de prouver que chaque ensemble Ti est de q-mesure
nulle. Soit i ∈ N∗ et ! > 0 fixés. Nous allons montrer qu’il existe une jauge
δJ¯ sur J¯ telle que, pour toute P-partition δJ¯-fine Π de J, on a S(J, 1Ti , Π) ≤ !.
Pour cet !, la condition nécessaire et suffisante de Cauchy d’intégrabilité de
f sur I¯ entraı̂ne l’existence d’une jauge δ sur I¯ telle que
!
|S(I, f, Π) − S(I, f, Π̃)| ≤ ,
i
lorsque Π et Π̃ sont des P-partitions δ-fines de I. Pour chaque y ∈ J¯, δ(y, ·)
est une jauge sur K̄. Si y ∈ Ti , la définition de Ti implique l’existence de
deux P-partitions δ(y, ·)-fines de K
ΠyK = {(zyj , Kyj ) : 1 ≤ j ≤ my }, Π̃yK = {(z̃yl , K̃yl ) : 1 ≤ l ≤ m̃y },
telles que
1
S(K, f (y, ·), ΠyK ) − S(K, f (y, ·), Π̃yK) ≥ .
i
Posons
δJ (y) = min[ min δ(y, zyj ), min δ(y, z̃yl )].
1≤j≤my 1≤l≤m̃y
Si y ∈ J¯ \ Ti , prenons
y y
ΠK = Π̃K = {(zyj , Kyj ) : 1 ≤ j ≤ my },
avec ΠyK une P-partition δ(y, ·)-fine quelconque de K, et posons
δJ (y) = min δ(y, zyj ).
1≤j≤my
8 9
Nous avons ainsi défini une jauge δJ sur J¯. Soit ΠJ = (y h , J h ) une
1≤h≤m
P-partition δJ -fine de J. Par construction et choix de la jauge,
?8 9 @
Π= (y h , zyj h ), J h × Kyjh : 1 ≤ j ≤ myh , 1 ≤ h ≤ m
et ?8 9 @
Π̃ = (y h , z̃yj h ), J h × K̃yjh : 1 ≤ j ≤ m̃yh , 1 ≤ h ≤ m
sont des P-partitions δ-fines de I = J × K. Dès lors, on trouve

!
≥ |S(I, f, Π) − S(I, f, Π̃)|
i
# m #
# m yh
m̃y h #
#$ $ j j
$ #
=#
# µ(J )
h 
f (y , zyh )µ(Kyh ) −
h
f (y , z̃yh )µ(K̃yh ) #
h l l #
#h=1 j=1 l=1 #
# m #
# yh
m̃y h #
# $ $ j j
$ #
= ## µ(J ) 
h
f (y , zyh )µ(Kyh ) −
h
f (y , z̃yh )µ(K̃yh )##
h l l
#{1≤h≤m : yh ∈T } j=1 l=1 #
i
# #
# #
# $ h h #
= ## µ(J h )[S(K, f (y h, ·), ΠyK ) − S(K, f (y h, ·), Π̃yK )]##
#{1≤h≤m : yh ∈T } #
i
$ h h
= µ(J h )[S(K, f (y h, ·), ΠyK ) − S(K, f (y h, ·), Π̃yK )]
{1≤h≤m : yh ∈Ti}
m
1 $ 1$ 1
≥ µ(J h ) = 1Ti (y h )µ(J h ) = S(J, 1Ti , ΠJ ).
i i j=1 i
{1≤h≤m : yh ∈Ti }
On a donc, 0 ≤ S(J, 1Ti , ΠJ ) ≤ !, et la démonstration est complète.

Le théorème queH nous venons de démontrer montre que la fonction F
donnée par F (y) = K̄ f (y, z) dz est définie p.p. sur J. ¯ La deuxième partie
du
H
théorème
H
de Fubini consiste à prouver l’intégrabilité de F sur J¯ et l’égalité
J¯ F = I¯ f.
¯ alors la fonction F définie p.p. sur J¯
Théorème. Si f est intégrable sur I,
par J
F (y) = f (y, z) dz
K̄
est intégrable sur J¯ et J J

F = f,
J¯ I¯
ce qui s’écrit encore
J 2J 3 J
f (y, z) dz dy = f.
J¯ K̄ ¯ K̄
J×
Démonstration. Soit ! > 0. L’intégrabilité de f sur I¯ entraı̂ne l’existence

d’une jauge δ sur I¯ telle que, si Π et Π̃ sont des P-partitions δ-fines de I, on
a # J #
# #
#S(I, f, Π) − f # ≤ !/4,
# #
I¯
et
|S(I, f, Π) − S(I, f, Π̃)| ≤ !/4.
Avec les notations du théorème précédent, et en désignant encore par F une
extension quelconque de F à J¯, soit y ∈ T et soit
Π̄yK = {(z̄yj , K̄yj ) : 1 ≤ j ≤ my }
une P-partition fixée δ(y, ·)-fine de K. Posons
δ̃J (y) = min δ(y, z̄yj ),

1≤j≤my
Q1 = {y ∈ T : |F (y)| + |S(K, f (y, ·), Π̄yK)| ≤ 1},

Qk = {y ∈ T : k − 1 < |F (y)| + |S(K, f (y, ·), Π̄yK)| ≤ k}, k = 2, 3, . . .,
ce qui implique >
T = Qk , Qk ∩ Ql = ∅ si k /= l.
k∈N∗
On a donc, pour tout k ∈ N∗ et tout y ∈ Rq ,
1Qk (y) ≤ 1T (y),
et dès lors, pour toute P-partition ΠJ de J, on a
0 ≤ S(J, 1Qk , ΠJ ) ≤ S(J, 1T , ΠJ ).
Par le théorème précédent,

A i i B
il existe une jauge δJk sur J¯ telle que, pour toute
P-partition ΠJ = (y , J ) 1≤i≤m δJk -fine de J, on ait,
!
S(J, 1T , ΠJ ) ≤ ,
k.2k+2
et dès lors
$ !
0≤ µ(J i ) = S(J, 1Qk , ΠJ ) ≤ .
{1≤i≤m : y∈Qk }
k.2k+2
Si y ∈ T , il existe un et un seul Qk tel que y ∈ Qk ; on posera
δJ (y) = min{δ̃J (y), δJk (y)}.
Soit maintenant y ∈ J¯ \ T et soit
Π̃yK = {(z̃yj , K̃yj ) : 1 ≤ j ≤ m̃y }
une P-partition δ(y, ·)-fine de K; puisque f (y, ·) est intégrable sur K̄ et a

F (y) comme intégrale, on peut choisir une P-partition
Π̂ = {(ẑyl , K̂yl ) : 1 ≤ l ≤ m̂y }
δ(y, ·)-fine de K telle que
|S(K, f (y, ·), Π̂yK) − F (y)| ≤ (1/2)|S(K, f (y, ·), Π̃yK) − F (y)|.
Posons U V
δJ (y) = min min δ(y, z̃yj ), min δ(y, ẑyl ) ,
1≤j≤m̃y 1≤l≤m̂y
¯
ce qui achève de définir uneA jauge δBJ sur J.
Soit maintenant ΠJ = (y , J ) 1≤i≤m une P-partition δJ -fine de J. Si
i i
y ∈ T , posons
i
i i
ΠyK = {(zyj i , Kyji ) : 1 ≤ j ≤ myi } = Π̄yK
et
i i
Π̆yK = {(z̆yj i , K̆yji ) : 1 ≤ j ≤ m̆yi } = Π̄yK .
Si y i ∈ J¯ \ T et
i
S(K, f (y i, ·), Π̃yK ) − F (y i ) > 0,
posons
i i
ΠyK = {(zyj i , Kyji ) : 1 ≤ j ≤ myi } = Π̃yK ,
yi j j yi
Π̆K = {(z̆yi , K̆yi ) : 1 ≤ j ≤ m̆yi } = Π̂K ,
tandis que si y i ∈ J¯ \ T et
i
S(K, f (y i, ·), Π̃yK ) − F (y i ) ≤ 0,
posons
i i
ΠyK = {(zyj i , Kyji ) : 1 ≤ j ≤ myi } = Π̂yK ,
i i
Π̆yK = {(z̆yj i , K̆yji ) : 1 ≤ j ≤ m̆yi } = Π̃yK .
Par construction,
j
Π = {((y i, zyi ), J i × Kyi ) : 1 ≤ j ≤ myi , 1 ≤ i ≤ m}
et
Π̆ = {((y i, z̆yi ), J i × K̆yji ) : 1 ≤ j ≤ m̆yi , 1 ≤ i ≤ m}
sont des P-partitions δ-fines de I, ainsi qu’on le vérifie aisément, et dès lors
|S(I, f, Π) − S(I, f, Π̆)| ≤ !/4.
D’ailleurs, par construction on a aussi

m
$ i
S(I, f, Π) = S(K, f (y i, ·), ΠyK )µ(J i )
i=1
et m
$ i
S(I, f, Π̆) = S(K, f (y i, ·), Π̆yK )µ(J i ).
i=1
D’autre part, on a
|S(I, f, Π) − S(J, F, ΠJ )|
= |S(I, 1T f, Π) + S(I, 1J̄\T f, Π) − S(J, 1T F, ΠJ ) − S(J, 1J\T
¯ F, ΠJ )|
≤ |S(I, 1T f, Π) − S(J, 1T F, ΠJ )| + |S(I, 1J̄\T f, Π) − S(J, 1J\T

¯ F, ΠJ )|.
Mais,
|S(I, 1T f, Π) − S(J, 1T F, ΠJ )|
# #
# #
# $ i #
= ## [S(K, f (y i, ·), ΠyK ) − F (y i )]µ(J i )##
#{1≤i≤m : yi ∈T } #
 
∞ 
$ $ D E 
i
≤ |S(K, f (y , ·), ΠyK )|
i
+ |F (y )| µ(J )
i i
 
k=1 {1≤i≤m : yi ∈Qk }
 
∞ ∞
$ $ $ 1
≤  kµ(J i ) ≤ ! = !/4.
k=1 k=1
2k+2
{1≤i≤m : yi ∈Qk }
D’ailleurs, si y i ∈ J¯ \ T et si
i
S(K, f (y i, ·), Π̃yK ) − F (y i ) > 0,
alors
i i
S(K, f (y i, ·), Π̂yK ) − F (y i ) ≤ (1/2)[S(K, f (y i, ·), Π̃yK ) − F (y i )],
et donc
i i
0 < S(K, f (y i, ·), ΠyK ) − F (y i ) = S(K, f (y i, ·), Π̃yK ) − F (y i )
i i
≤ 2[S(K, f (y i, ·), ΠyK ) − S(K, f (y i, ·), Π̆yK )],
tandis que si y i ∈ J¯ \ T et si
i
S(K, f (y i, ·), Π̃yK ) − F (y i ) ≤ 0,
alors
i i
−S(K, f (y i, ·), Π̂yK ) + F (y i ) ≤ (1/2)[F (y i) − S(K, f (y i, ·), Π̃yK )];
cela entraı̂ne en particulier que

i i
(−1/2)[F (y i) − S(K, f (y i, ·), Π̃yK )] ≤ S(K, f (y i, ·), Π̂yK ) − F (y i ),
et dès lors,
i i
|S(K, f (y i, ·), ΠyK ) − F (y i )| = |S(K, f (y i, ·), Π̂yK ) − F (y i )|
i
≤ (1/2)[F (y i) − S(K, f (y i, ·), Π̃yK )]
i i
≤ S(K, f (y i, ·), Π̂yK ) − S(K, f (y i, ·), Π̃yK )
i i
= S(K, f (y i, ·), ΠyK ) − S(K, f (y i, ·), Π̆yK ).
En résumé, si y i ∈ J¯ \ T, on a
i i i
|S(K, f (y i, ·), ΠyK ) − F (y i )| ≤ 2[S(K, f (y i, ·), ΠyK ) − S(K, f (y i, ·), Π̆yK )].
i i
Comme, pour y i ∈ T, on a par construction Π̆yK = ΠyK , on a
S(I, f, Π) − S(I, f, Π̆) = S(I, 1J̄\T f, Π) − S(I, 1J̄\T f, Π̆)

$ i i
= [S(K, f (y i, ·), ΠyK ) − S(K, f (y i, ·), Π̆yK )]µ(J i ).
¯ }
{1≤i≤m : yi ∈J\T
D’autre part,
|S(I, 1J̄\T f, Π) − S(J, 1J\T
¯ F, ΠJ )|
# #
# #
# $ i #
= ## [S(K, f (y i, ·), ΠyK ) − F (y i )]µ(J i )##
#{1≤i≤m : yi ∈J\T
¯ } #
$ i i
≤2 [S(K, f (y i, ·), ΠyK ) − S(K, f (y i, ·), Π̆yK )]µ(J i )
¯ }
{1≤i≤m : yi ∈J\T
= 2[S(I, f, Π) − S(I, f, Π̆)] ≤ !/2.

Dès lors,
|S(I, f, Π) − S(J, F, ΠJ )| ≤ !/4 + !/2 = 3!/4,
#J # #J #
# # # #
# f − S(J, F, ΠJ )# ≤ # f − S(I, f, Π)# + |S(I, f, Π) − S(J, F, ΠJ )|
# ¯ # # ¯ #
I I
≤ !/4 + 3!/4 = !.
En inversant le rôle des variables y et z, on obtient évidemment la version

duale du théorème de Fubini.
Théorème. Si f est intégrable sur I¯ et si l’on pose
S = {z ∈ K̄ : f (·, z) n’est pas intégrable sur J¯},
alors S est de s-mesure nulle, la fonction G définie p.p. sur K̄ par

J J
G(z) = f (·, z) = f (y, z) dy
J¯ J¯
est intégrable sur K̄ et J J

G= f,
K̄ I¯
J 2J 3 J
f (y, z) dy dz = f.
K̄ J¯ I¯
Le résultat suivant montre que le calcul d’un intégrale sur un pavé de Rn

se ramène au calcul de n intégrales successives sur un intervalle fermé.
Corollaire. Si f est une fonction de Rn dans Rp intégrable sur I¯ = I¯1 ×

. . . × I¯n , alors, pour toute permutation {i1 , . . . , in} de {1, . . ., n}, on a
J J ,J , ,J - - -
f= ... f (x1 , . . ., xn )dxi1 . . . dxin−1 dxin .
I¯ I¯in I¯in−1 I¯i1
Démonstration. Elle consiste en des applications successives du théorème

de Fubini pour différentes décompositions de I¯ :
J J
f= f
I¯ (I¯1 ×...×I¯i1 )×(I¯i1 +1 ×...×I¯n )
J ,J -
= f (x) dx1 . . . dxi1 dxi1 +1 . . . dxn
I¯i1 +1 ×...×I¯n I¯1 ×...×I¯i1
J ,J ,J - -
= f (x) dxi1 dx1 . . . dxi1 −1 dxi1 +1 . . . dxn
I¯i1 +1 ×...×I¯n I¯1 ×...×I¯i1 −1 I¯i1
J ,J -
= Zi . . . dxn ,
f (x) dxi1 dx1 . . . dx 1
I¯1 ×...×I¯i1 −1 ×I¯i1 +1 ×...×I¯n I¯i1
Z signifie que l’expression dx manque. En écrivant

où dx i1 i1
I¯1 × . . . × I¯i1 −1 × I¯i1 +1 × . . . × I¯n
sous la forme
(I¯1 × . . . × I¯i2 ) × (I¯i2 +1 × . . . × I¯n )
avec le terme I¯i1 omis dans celui des deux facteurs où il se trouve, on obtient,
en procédant exactement comme ci-dessus pour i1 ,
J J ,J ,J - -
f= f (x) dxi1 dxi2 dx1 . . . dx" "
min(i1 ,i2 ) . . . dxmax(i1 ,i2 ) . . . dxn ,
I¯ J¯ I¯i2 I¯i1
avec
",i ) × . . . × Imax(i
J = I1 × . . . × Imin(i ",i ) × . . . × In .
1 2 1 2
En continuant de la sorte jusqu’à in , on obtient le résultat.

Remarque. Le théorème de Fubini est valable si l’on remplace partout
intégrable par L-intégrable. Pour le démontrer, il suffit d’appliquer les théorè-
mes ci-dessus à f et à |f |.
Nous allons maintenant étendre le théorème de Fubini au cas de l’inté-
grale sur une partie quelconque de Rn . Comme plus haut, dans le cas d’une
partie non bornée de Rn , intégrable signifiera L-intégrable. Fixons tout

d’abord les notations. Si C ⊂ Rn = Rq × Rs , posons
A = {y ∈ Rq : ∃z ∈ Rs : (y, z) ∈ C}, B = {z ∈ Rs : ∃y ∈ Rq : (y, z) ∈ C}.
Ce sont respectivement les projections orthogonales de C sur Rq et sur Rs .

Pour chaque y ∈ A, posons
B(y) = {z ∈ Rs : (y, z) ∈ C},
et pour chaque z ∈ B, posons
A(z) = {y ∈ Rq : (y, z) ∈ C}.
On notera que
C = {(y, z) : y ∈ A et z ∈ B(y)} = {(y, z) : z ∈ B et y ∈ A(z)},
et dès lors, pour tout x = (y, z) ∈ Rn = Rq × Rs , on a
1C (x) = 1C (y, z) = 1A (y)1B(y)(z) = 1A (z)(y)1B (z).
Nous pouvons maintenant énoncer et démontrer le théorème de Fubini

pour l’intégration sur une partie quelconque de Rn .
Théorème. Si f est intégrable (resp. L-intégrable) sur C ⊂ Rn , et si, avec
les notations ci-dessus, on pose
Ã = {y ∈ A : f (y, ·) n’est pas intégrable (resp. L-intégrable) sur B(y)},
B̃ = {z ∈ B : f (·, z) n’est pas intégrable (resp. L-intégrable) sur A(z)},

alors Ã est de q-mesure nulle, B̃ est de s-mesure nulle, la fonction F définie
p.p. sur A par J
F (y) = f (y, z) dz
B(y)
est intégrable (resp. L-intégrable) sur A, la fonction G définie p.p. sur B

par J
G(z) = f (y, z) dy
A(z)
est intégrable (resp. L-intégrable) sur B, et l’on a

J J J
F = G= f,
A B C

J ,J - J ,J - J
f (y, z) dz dy = f (y, z) dy dz = f.
A B(y) B A(z) C
Démonstration. Supposons tout d’abord que C soit borné et soit I =

J × K un semi-pavé de Rn = Rq × Rs tel que C ⊂ I. ¯ Démontrons le résultat
sous l’hypothèse d’intégrabilité, le cas de la L-intégrabilité s’obtenant en
remplaçant partout “intégrable” par “L-intégrable” dans l’argument. Si f˜
est un prolongement arbitraire de f à I, ¯ on a, pour presque tout x ∈ I, ¯
˜
fC (x) = 1C (x)f(x),
et dès lors 1C .f˜ est intégrable sur I.
¯ Par ailleurs,
T = {y ∈ J¯ : 1C (y, ·)f(y,
˜ ·) n’est pas intégrable sur K̄}
= {y ∈ J¯ : 1A (y).1B(y)(·).f(y,
˜ ·) n’est pas intégrable sur K̄}
˜ ·) n’est pas intégrable sur B(y)}
= {y ∈ J¯ : 1A (y).f(y,
= {y ∈ A : f (y, ·) n’est pas intégrable sur B(y)} = Ã.
Par le théorème de Fubini pour un pavé fermé, T est de q-mesure nulle et il
en est donc de même pour Ã. L’autre cas se traite de manière analogue. En
appliquant la seconde partie du théorème de Fubini pour un pavé fermé, on
trouve que la fonction F̃ définie par
J J
F̃ (y) = ˜ z) dz = 1A (y)
1C (y, z)f(y, ˜ z) dz
1B(y)(z)f(y,
K̄ K̄
J J
= 1A (y) f˜(y, z) dz = 1A (y) f (y, z) dz = 1A (y)F (y)
B(y) B(y)
est intégrable sur J¯ et que

J , J - J
1A (y) f (y, z) dz dy = fC .
J¯ B(y) I¯
En d’autres termes, F est intégrable sur A et l’on a

J ,J - J
f (y, z) dz dy = f.
A B(y) C
L’autre cas se traite d’une manière strictement analogue. Enfin, le cas de f

L-intégrable sur un ensemble C non borné se déduit aisément de la définition
de l’intégrale et du résultat pour le cas d’un ensemble borné.
L’application du théorème de Fubini à la fonction caractéristique d’un

ensemble fournit immédiatement le résultat suivant, où l’on conserve les
mêmes notations que ci-dessus.
Corollaire. Si C est une partie n-intégrable de Rn , et si l’on pose
Ã = {y ∈ A : B(y) n’est pas n-intégrable},
B̃ = {z ∈ B : A(z) n’est pas n-intégrable},

alors Ã est de q-mesure nulle, B̃ est de s-mesure nulle, la fonction définie
p.p. sur A par y 2→ µ(B(y)) est intégrable sur A, la fonction définie p.p. sur
B par z 2→ µ(A(z)) est intégrable sur B et l’on a
J J
µ(B(y)) dy = µ(A(z)) dz = µ(C).
A B
Exemple. Si C = B2 (0; r) ⊂ R2 , alors

3 G G 2
A = ] − r, r[, B(y) = − r2 − y2 , r2 − y2 ,
L
et dès lors µ(B(y)) = 2 r 2 − y 2 et l’aire de B2 (0, r) vaut
J r G J π/2 G
µ(B2 (0, r)) = 2 r 2 − y 2 dy = 2r 2 1 − sin2 t cos t dt = πr 2 .
−r −π/2
Montrons enfin que l’emploi simultané du théorème de Fubini et du test

de comparaison pour les fonctions n-mesurables conduit à un critère utile de
L-intégrabilité sur un ensemble pour des fonctions réelles n-mesurables sur
cet ensemble. C’est le critère de L-intégrabilité de Tonelli.
Théorème. Si f est une fonction réelle n-mesurable sur A ⊂ Rn et s’il
existe un groupement (y1 , y2 , . . . , yr ) de (x1 , x2, . . . , xn ) tel que l’expression
J ,J ,J ,J - - -
... |f | dyr dyr−1 . . . dy2 dy1
A1 A2 (y1 ) Ar−1 (y1 ,...,yr−2 ) Ar (y1 ,...,yr−1 )
ait un sens (c’est-à-dire telle que chacune des intégrales successives à partir
du centre existe), où, pour chaque 1 ≤ k ≤ r,
Ak (y1 , . . . , yk−1 )
= {yk : (y1 , . . . , yk , yk+1 , . . ., yr ) ∈ A pour un (yk+1 , . . . , yr ) au moins},

alors f est L-intégrable sur A.

Démonstration. Soit (fk )k∈N la suite de fonctions réelles définies p.p. sur
A par
fk = min(|f |, k)1Ak , k ∈ N,
où Ak = A ∩ B∞ [k]. Cette suite converge ponctuellement p.p. sur A vers |f |
et l’on a
0 ≤ fk (x) ≤ fk+1 (x) ≤ |f (x)|
pour presque tout x ∈ A et tout k ∈ N. En outre, chaque fonction fk est
n-mesurable et bornée p.p. sur Ak par k. Elle est donc L-intégrable sur
Ak en vertu du test de comparaison pour les fonctions mesurables, et donc
L-intégrable sur A puisqu’elle est nulle sur l’ensemble n-mesurable A \ Ak . .
Enfin, par le théorème de Fubini, on a
J
fk
A
J ,J ,J ,J - - -
= ... fk dyr dyr−1 . . . dy2 dy1
A1 A2 (y1 ) Ar−1 (y1 ,...,yr−2 ) Ar (y1 ,...,yr−1 )
J ,J ,J ,J - - -
≤ ... |f | dyr dyr−1 . . . dy2 dy1 ,
A1 A2 (y1 ) Ar−1 (y1 ,...,yr−2 ) Ar (y1 ,...,yr−1 )
H
pour chaque k ∈ N, ce qui montre que la suite croissante ( A fk )k∈N est
majorée, et donc convergente. Le théorème de convergence monotone de
Levi entraı̂ne donc l’intégrabilité sur A de |f | et, comme f est n-mesurable
sur A, un Corollaire du test de comparaison pour les fonctions mesurables
entraı̂ne sa L-intégrabilité.
Exemple. En guise d’application du critère de Tonelli, montrons que si
g et h sont des fonctions de Rn dans C L-intégrables sur Rn , alors leur
produit de convolution g ∗ h est défini p.p. sur Rn et est L-intégrable sur
Rn . Par hypothèse, g et h sont n-mesurables sur Rn et il en résulte que la
fonction f : (y, z) 2→ g(y − z)h(z) est 2n-mesurable sur R2n . D’autre part, en
utilisant l’invariance de l’intégrale pour une translation, on a, pour presque
tout z ∈ Rn , J J
|g(y − z)| dy = |g|,
Rn Rn
et dès lors
J 4J 5 J 4J 5
|h(z)| |g(y − z)| dy dz = h(z) |g| dz
Rn Rn Rn Rn
4J 5 4J 5
= |h| |g| .
Rn Rn
Par le critère de Tonelli, f est L-intégrable sur R2n et, par le théorème
de Fubini, pour presque tout y ∈ Rn , la Hfonction z 2→ f (y − z)g(z) est L-
intégrable sur Rn et la fonction g∗h : y 2→ Rn g(y−z)h(z) dz est L-intégrable
sur Rn , avec J 4J 5 4J 5
g∗h= g h .
Rn Rn Rn
14.4 Transformations affines

Nous avons étudié précédemment l’effet d’un changement de variables sur
l’existence et le calcul des primitives d’une fonction de R dans Rp et nous en
avons déduit une formule donnant l’effet d’un changement de variable sur
le calcul de l’intégrale sur un intervalle fermé d’une fonction primitivable.
Nous allons étudier l’extension de ce résultat aux intégrales multiples.
Nous commencerons par le cas d’une transformation affine et considére-
rons tout d’abord une translation dans Rn , c’est-à-dire une application du
type
ta : Rn → Rn , x 2→ x + a,
pour un certain a ∈ Rn fixé. On notera que, pour tout x ∈ Rn , on a
det(ta )$x = det I = 1,
et l’on désignera par Jta (jacobien de ta ) l’application de Rn dans R définie

par Jta (x) = det(ta )$x.
Soit I un semi-pavé de Rn et f une H
fonction de Rn dans Rp définie et
¯ Nous poserons J = ¯ f et nous désignerons par I − a le
intégrable sur I. I
translaté
I − a = {x − a ∈ Rn : x ∈ I} = t−1 a (I)
de I par a. C’est évidemment un semi-pavé de Rn . Le résultat suivant a été

démontré parmi les propriétés élémentaires de l’intégrale.
Proposition. Si f est définie et intégrable sur I, ¯ alors f ◦ ta = (f ◦ ta )|Jta |
−1 ¯ ¯
est intégrable sur ta (I) = I − a et
J J
f (· + a) = f ◦ ta =
¯
I−a t−1 ¯
a (I)
J J
(f ◦ ta )|Jta | = f.
t−1 ¯
a (I) I¯
14.4. TRANSFORMATIONS AFFINES 549
Passons maintenant au cas d’un automorphisme de Rn . Nous aurons

besoin des résultats suivants d’algèbre linéaire.
Lemme. Tout automorphisme de Rn peut s’obtenir comme composé d’un
nombre fini d’automorphismes élémentaires appartenant aux types suivants:
a. hr : x 2→ (rx1 , x2 , . . . , xn ), (r > 0);
b. s : x 2→ (−x1 , x2 , . . ., xn );
c. pkl : x = (x1 , . . . , xk , . . . , xl , . . . , xn ) 2→ (x1 , . . ., xl , . . ., xk , . . . , xn);
d. r : x 2→ (x1 + x2 , x2 , . . . , xn).
Lemme. Si L1 , . . . , Lm sont des endomorphismes de Rn ,, alors
det(L1 ◦ . . . ◦ Lm ) = (det L1 ). . . ..(det Lm ).
On notera que, pour tout x ∈ Rn , on a
Jhr (x) = det(hr )$x = det hr = r,
Js (x) = det s$x = det s = −1,

Jpkl (x) = det(pkl )$x = det pkl = −1,
Jr (x) = det rx$ = det r = 1.
La démonstration des formules de changement de variables pour les trans-
formations hr , s et pkl est similaire. Considérons tout d’abord le cas de hr .
¯ alors r.(f ◦hr) = (f ◦hr )|Jr |
Proposition. Si f est définie et intégrable sur I,
est intégrable sur h−1
r ( ¯
I) et on a
J J J
r.(f ◦ hr ) = (f ◦ hr )|Jhr | = f.
h−1 ¯
r (I) h−1 ¯
r (I) I¯
Démonstration. On notera tout d’abord que puisque
h−1 −1
r : x 2→ (r x1 , x2 , . . ., xn ),
h−1 n ¯
r (I) est un semi-pavé de R . Soit ! > 0; il existe une jauge δ sur I telle
que
|S(I, f, Π) − J|2 ≤ !.
−1 −1 ¯
Soit δ̃ la jauge définie sur
8 hr (I)9 = hr (I) par δ̃ = c.(δ ◦ hr ) où c =
j ˜j
min(1, r ), et soit Π̃ = (x̃ , I )
−1
une P-partition δ̃-fine de h−1
r (I).
1≤j≤m
Posons
xj = hr (x̃j ), I j = hr (I˜j ), (1 ≤ j ≤ m).
Par construction, xj ∈ I¯j , (1 ≤ j ≤ m) et hr (I˜j ) est un semi-pavé contenu

dans I. En outre, puisque hr est une bijection de Rn sur Rn et que les
I˜j , (1 ≤ j ≤ m) partitionnent h−1
r (I), les I , (1 ≤ j ≤ m) partitionnent I.
j
Enfin, les relations
I˜j ⊂ B∞ [x̃j ; δ̃(x̃j )], (1 ≤ j ≤ m),
entraı̂nent, si I˜j = I˜1j × . . . × I˜nj et I j = I1j × . . . × Inj , les inclusions
I˜kj ⊂ [x̃jk − δ(x̃j ), x̃jk + δ(x̃j )], (1 ≤ k ≤ n, 1 ≤ j ≤ m).
Dès lors, si 2 ≤ k ≤ n, on a
Ikj = I˜kj ⊂ [x̃jk − δ̃(x̃j ), x̃jk + δ̃(x̃j )] = [xjk − cδ(hr (x̃j )), xjk + cδ(hr (x̃j ))]
j j j j
= [xk − cδ(xj ), xk + cδ(xj ))] ⊂ [xk − δ(xj ), xk + δ(xj )],
tandis que, si k = 1, on a
I1j = r I˜1j ⊂ [rx̃j − r δ̃(x̃j ), rx̃j + r δ̃(x̃j )] = [xj1 − δ(xj ), xj1 + δ(xj )].
Dès lors I j ⊂ B∞ [xj ; δ(xj )] pour chaque 1 ≤ j ≤ m et Π = {(x1 , I 1), . . . , (xm, I m)}
est une P-partition δ-fine de I. En conséquence, si l’on note en outre que
µ(I j ) = rµ(I˜j ) pour chaque 1 ≤ j ≤ m, on obtient
# #
#$m #
# #
−1
|S(hr (I), r.(f ◦ hr ), Π̃) − J|2 = #
# ˜
rf (hr (x̃ ))µ(I ) − J ##
j j
#j=1 #
2
# #
#m #
#$ #
= ## f (x )µ(I ) − J ## = |S(I, f, Π) − J|2 ≤ !,
j j
#j=1 #
2
Considérons maintenant le cas des transformations de type s.
¯ alors f ◦ s = (f ◦ s)|Js |
Proposition. Si f est définie et P-intégrable sur I,
−1 ¯
est P-intégrable sur s (I) et l’on a
J J J
f ◦s= (f ◦ s)|Js | = f.
¯
s−1 (I) ¯
s−1 (I) I¯
Démonstration. Notons tout d’abord que si I = I1 × . . . × In avec Ii =

]ai , bi], 1 ≤ i ≤ n, alors, puisque s−1 = s, on a
s−1 (I) = s(I) = (−I1 ) × I2 × . . . × In = [−b1 , −a1 [ ×I2 × . . . × In ,

n’est pas un semi-pavé, mais
¯ = s−1 (I) = K̄,

s−1 (I)
si K = K 1 × . . . × K n désigne le semi-pavé ] − b1 , −a1 ] × I2 × . . . × In . Il

¯ remplacé par K̄. Si ! > 0
suffit donc de démontrer le théorème avec s−1 (I)
est donné, il existe une jauge δ sur I¯ telle que
|S(I, f, Π) − J|2 ≤ !
pour toute P-partition A

δ-fine BΠ de I. Définissons la jauge δ̃ sur K̄ par
δ̃ = δ ◦ s, et soit Π̃ = (x̃j , K j ) 1≤j≤m une P-partition δ̃-fine de K̄. On peut,
sans perte de généralité, supposer les K j = K1j × . . .× Knj numérotés de telle
sorte que K1j =]cj , cj+1 ], avec c1 = −b1 , cm+1 = −a1 , cj < cj+1 , (1 ≤ j ≤ m).
Posons, pour chaque 1 ≤ j ≤ m,
j j
xj = s(x̃j ), I j = I1 × . . . × Inj = ] − cj+1 , −cj ] × I2 × . . . × Inj .
De la relation
−b1 = c1 < c2 < . . . < cm < cm+1 = −a1 ,
on tire aussitôt
a1 = −cm+1 < −cm < . . . < −c2 < −c1 = b1 ,
et les I j , (1 ≤ j ≤ m) partitionnent I. D’ailleurs, par construction, xj ∈ I¯j

pour chaque 1 ≤ j ≤ m et, des relations
K j ⊂ B∞ [x̃j ; δ̃(x̃j )], 1 ≤ j ≤ m,
on déduit aisément, pour 2 ≤ k ≤ n,
Ikj = Kkj ⊂ [x̃jk − δ̃(x̃j ), x̃jk + δ̃(x̃j )] = [xjk − δ(s(x̃j )), xjk + δ(s(x̃j ))]
= [xjk − δ(xj ), xjk + δ(xj )],

et, pour k = 1,
I1j =] − cj+1 , −cj ] ⊂ [−cj+1 , −cj ] = −K1j
= −K1j ⊂ [−x̃j1 − δ̃(x̃j ), −x̃j1 + δ̃(x̃j )]

= [xj1 − δ(s(x̃j )), xj1 + δ(s(x̃j ))] = [xj1 − δ(xj ), xj1 + δ(xj )].
Donc Π = {(x1 , I 1), . . . , (xm, I m)} est une P-partition δ-fine de I telle que,
pour chaque 1 ≤ j ≤ m, on a µ(I j ) = µ(I˜j ). En conséquence,
# #
#m #
#$ #
|S(K, f ◦ s, Π̃) − J|2 = ## f (s(x̃j ))µ(I j ) − J ##
#j=1 #
2
# #
#$ #
#m #
= ## f (x )µ(I ) − J ## = |(S(I, f, Π) − J|2 ≤ !,
j j
#j=1 #
2
Considérons pour suivre le cas de la transformation pkl avec 1 ≤ k < l ≤
n.
¯ alors f ◦pkl = (f ◦pkl )|Jp |
Proposition. Si f est définie et intégrable sur I, kl
−1 ¯
est intégrable sur pkl (I) et l’on a
J J J
f ◦ pkl = f ◦ pkl |Jpkl | = f.
p−1
kl
¯
(I) p−1
kl
¯
(I) I¯
Démonstration. Notons tout d’abord que p−1

kl = pkl et dès lors, si I =
I1 × . . . × In , alors
p−1
kl (I) = I1 × . . . × Il × . . . × Ik × . . . × In
est un semi-pavé de Rn . Soit ! > 0 et δ une jauge sur I¯ telle que |S(I, f, Π)−
J|2 ≤ ! pour toute P-partition δ-fine Π de I. Définissons 8 la 9jauge δ̃ sur
−1 −1 ¯ j ˜j
pkl (I) = pkl (I) par la relation δ̃ = δ ◦ pkl , et soit Π̃ = (x̃ , I ) une
1≤j≤m
P-partition δ̃-fine de p−1
kl (I). Posons, pour chaque 1 ≤ j ≤ m,
xj = pkl (x̃j ), I j = pkl (I j ) = I˜1 × . . . × I˜l × . . . × I˜k × . . . × I˜nj ,

j j j
ce qui implique aussitôt µ(I j ) = µ(I˜j ) et xj ∈ I¯j , 1 ≤ j ≤ m. D’ailleurs,

puisque pkl est une bijection de Rn sur Rn et que les I˜j partitionnent p−1 kl (I),
les I j partitionnent I. Enfin, puisque I˜j ⊂ B∞ [x̃j ; δ̃(x̃j )], 1 ≤ j ≤ m, on a,
pour chaque i /= k et /= l compris entre 1 et n,
Iij = I˜ij ⊂ [x̃ji − δ̃(x̃j ), x̃ji + δ̃(x̃j )] = [xji − δ(pkl (x̃j )), xji + δ(pkl (x̃j ))]
= [xji − δ(xj ), xji + δ(xj )],

tandis que, si i = k,
Ik = I˜l ⊂ [x̃l − δ̃(x̃j ), x̃l + δ̃(x̃j )] = [xK − δ(xj ), xk + δ(xj )],

j j j j j j
et de même,
Ilj ⊂ [xjl − δ(xj ), xjl + δ(xj )].
Donc Π = {(x1 , I 1 ), . . ., (xm, I m)} est une P-partition δ-fine de I, ce qui
entraı̂ne
# #
#m #
# $ #
−1
|S(pkl (I), f ◦ pkl , Π̃) − J|2 = #
# ˜
f (pkl (x̃ ))µ(I ) − J ##
j j
#j=1 #
2
# #
#m #
#$ #
=#
# f (x )µ(I ) − J ## = |S(I, f, Π) − J|2 ≤ !,
j j
#j=1 #
2
et achève la démonstration.
Le cas de la transformation r diffère substantiellement des précédents
par le fait que, si I = I1 × . . . × In , l’adhérence de
r −1 (I) = {x ∈ Rn : x1 + x2 ∈ I1 , x2 ∈ I2 , . . . , xn ∈ In }
n’est pas un pavé fermé de Rn , ce qui exclut un traitement direct à partir de

la définition d’intégrabilité sur un pavé fermé. En fait, on peut construire
un exemple de fonction f de R2 dans R qui est intégrable (mais non L-
intégrable) sur l’adhérence I¯ d’un semi-pavé I de R2 et telle que f ◦ r ne
soit pas intégrable sur r −1 (I)¯ (c’est-à-dire telle que f ◦ r ne soit intégrable
sur aucun pavé fermé contenant r −1 (I)). ¯ On a toutefois une formule de
changement de variable pour une transformation de type r lorsque f est
¯
L-intégrable sur I.
Proposition. Si f est L-intégrable sur I, ¯ alors f ◦ r = (f ◦ r)|Jr | est L-
−1 ¯
intégrable sur r (I) et l’on a
J J J
f ◦r = (f ◦ r)|Jr | = f.
¯
r −1 (I) ¯
r −1 (I) I¯
Démonstration. Les fonctions f et |f |2 , L-intégrables sur I,¯ sont n-

¯ ¯
mesurables sur I et dès lors f ◦ r et |f ◦ r|2 sont n-mesurables sur r −1 (I).
En vertu du théorème de Fubini, on a
J J 2J 3
f= f (x1 , x2 , . . . , xn ) dx1 dx2 . . . dxn ,
I¯ I¯2 ×...×I¯n I¯1
et pour les (x2 , . . ., xn ) pour lesquels f (·, x2 , . . ., xn ) est L-intégrable sur I¯1 ,
la première proposition de cette section entraı̂ne la L-intégrabilité sur I¯1 −x2
de la fonction f (· + x2 , x2 , . . . , xn ) et les égalités
J J
f (x1 , x2 , . . ., xn ) dx1 = f (x1 + x2 , x2 , . . . , xn) dx1
I¯1 I¯1 −x2
J
= (f ◦ r)(x1 , . . ., xn ) dx1 .
I¯1 −x2
Par conséquent, (f ◦r)(·, x2, . . . , xn ) est L-intégrable sur I¯1 −x2 pour presque
tout (x2 , . . . , xn) ∈ I¯2 × . . . × I¯n et l’on a l’égalité
J J 2J 3
f= (f ◦ r)(x1 , . . . , xn) dx1 dx2 . . . dxn .
I¯ I¯2 ×...×I¯n I¯1 −x2
On montre de la même manière que |f ◦ r|2 (·, x2, . . . , xn ) est L-intégrable sur
I¯1 − x2 pour presque tout (x2 , . . . , xn ) ∈ I¯2 × . . . × I¯n et que
J J 2J 3
|f |2 = |f ◦ r|2 (x1 , . . . , xn) dx1 dx2 . . . dxn .
I¯ I¯2 ×...×I¯n I¯1 −x2
Le critère de Tonelli implique alors que f ◦ r est L-intégrable sur l’ensemble

{x ∈ Rn : x1 ∈ I¯1 − x2 , x2 ∈ I¯2 , . . . , xn ∈ I¯n } = r −1 (I),
¯
H
et la dernière formule obtenue pour I¯ f avec une nouvelle application du
¯ fournit l’égalité
théorème de Fubini à la fonction f ◦ r sur r −1 (I)
J J
f ◦r = f;
¯
r −1 (I) I¯

En combinant les résultats d’algèbre linéaire rappelés plus haut et les
propositions que nous venons de démontrer, nous obtenons aussitôt le thé-
orème du changement de variable affine dans une intégrale suivant.
Théorème. Si f est L-intégrable sur I¯ et si
g : Rn → Rn , x 2→ g(x) = a + A(x)
avec a ∈ Rn et A est un automorphisme de Rn , alors (f ◦g)|Jg | = (f ◦g)| det A|
¯ et l’on a
est L-intégrable sur g −1 (I)
J J
(f ◦ g)|Jg | = f.
¯
g −1 (I) I¯
Une conséquence utile de ce théorème fournit une expression pour la

mesure du transformé d’un pavé fermé par une application affine.
14.5. DIFFÉOMORPHISMES 555
Corollaire. Si I est un semi-pavé de Rn et h : Rn → Rn , x 2→ a + A(x) est

¯ est n-intégrable et l’on
une application affine telle que det A /= 0, alors h(I)
a
¯ = | det A|µ(I)
µ(h(I)) ¯ = |Jh |µ(I).
¯
Démonstration. Appliquons le théorème précédent à f = 1 et g = h−1 .

On a donc, pour tout x ∈ Rn ,
g(x) = −A−1 a + A−1 (x),
et dès lors
Jg (x) = det A−1 = (det A)−1 , f ◦ g = 1 ◦ g = 1.
Par le théorème précédent, (f ◦ g)|Jg | = | det A|−1 (et donc toute fonction
¯ = h(I)
constante) est L-intégrable sur g −1 (I) ¯ et l’on a
J J
−1
| det A| = 1.
¯
h(I) I¯
¯ est n-intégrable et
Par conséquent, h(I)
¯ = | det A|µ(I).
µ(h(I)) ¯
14.5 Difféomorphismes
L’extension du théorème de changement de variables à certaines transforma-
tions non affines requiert quelques résultats préliminaires.
Définition. Soit E un ouvert non vide de Rn et g une application de E

dans Rn . On dit que g est un difféomorphisme de E sur g(E) si g est une
bijection de E sur l’ouvert g(E) telle que g et g −1 soient de classe C 1 sur E
et g(E) respectivement.
Soit E un ouvert non vide de Rn , g un difféomorphisme de E sur g(E).

Comme g −1 ◦ g = I entraı̂ne Jg−1 (x).Jg (x) = 1, on aura Jg (x) /= 0 pour tout
x ∈ E.
Lemme. Soit η > 0 donné. Pour chaque a ∈ E, il existe δ(a) > 0 tel que,
pour tout semi-cube I de côté c pour lequel
a ∈ I¯ ⊂ B∞ [a; δ(a)],
on a
g(I) ⊂ h(I $ ),
où h est l’application affine de Rn dans Rn définie par
h(x) = g(a) + ga$ (x − a),
et I $ est le semi-cube de Rn concentrique à I et de côté (1 + η)c.
Démonstration. Puisque (ga$ )−1 existe et est linéaire, il existe une cons-
tante b = b(a) > 0 telle que
|(ga$ )−1 (x)|∞ ≤ b|x|∞
pour tout x ∈ Rn . Soit σ ∈ ]0, η/2b[ ; comme g est dérivable en a, il ex-
iste δ(a) > 0 (que l’on peut toujours supposer suffisamment petit pour que
B∞ [a; δ(a)] ⊂ E puisque E est ouvert) tel que
|g(x) − h(x)|∞ = |g(x) − g(a) − ga$ (x − a)|∞ ≤ σ|x − a|∞
pour tout x ∈ B∞ [a; δ(a)]. Soit I un semi-cube tel que
a ∈ I¯ ⊂ B∞ [a; δ(a)],
et soit y ∈ g(I). Il existe un et un seul x ∈ I ⊂ B∞ [a; δ(a)] tel que y = g(x)
et, h étant une bijection de Rn sur Rn , il existe un et un seul u ∈ Rn tel que
y = h(u). Si nous posons v = h(x), nous obtenons
y − v = h(u) − h(x) = ga$ (u − x),
et dès lors
|u − x|∞ = |(ga$ )−1 (y − v)|∞ ≤ b|y − v|∞ = b|g(x) − h(x)|∞ ≤ bσ|x − a|∞ .
¯ on a |x − a|∞ ≤ c, et dès lors
Mais, puisque x ∈ I et a ∈ I,
|u − x|∞ ≤ bσc < (η/2)c,
ce qui implique, si w désigne le centre de I, que
|u − w|∞ ≤ |u − x|∞ + |x − w|∞ < (η/2)c + c/2 = (c/2)(1 + η).
Donc u appartient au semi-cube I $ de centre w et de côté (1 + η)c et y =
h(u) ∈ h(I $ ).
Lemme. Soit f une fonction de Rn dans R+ continue sur g(E) et soit ! > 0.
Pour chaque a ∈ E, il existe δ(a) > 0 tel que B∞ [a; δ(a)] ⊂ E et tel que,
pour tout semi-cube I vérifiant les relations
a ∈ I¯ ⊂ B∞ [a; δ(a)],
la fonction f est L-intégrable sur g(I) et l’on a

J J
f≤ (f ◦ g)|Jg | + !µ(I).
g(I) I¯
Démonstration. Notons tout d’abord que la fonction (f ◦ g)|Jg | continue

sur E, est L-intégrable sur tout pavé fermé I¯ contenu dans E et dès lors
l’intégrale du membre de droite dans l’inégalité ci-dessus existe. D’autre
part, pour tout semi-pavé I = ]a1 , b1] × . . . × ]an , bn] contenu dans E, on a
n
>
I = I¯ \ (K i ∪ Li ),
i=1
où
K i = [a1 , b1 ] × . . . × {ai } × . . . × [an , bn],
Li = [a1 , b1] × . . . × {bi } × . . . × [an , bn].
Dès lors, g étant injective, on a
, n
-
>
¯ \g
g(I) = g(I) (K ∪ L ) ,
i i
i=1
¯ et g[!n (K i ∪Li )] ⊂ g(I)

et g étant continue, g(I) ¯ sont des fermés bornés et
i=1
la fonction continue f y est L-intégrable. Comme 1g(I) = 1g(I) !
¯ −1 n (K i ∪Li)
i=1
on en déduit aussitôt la L-intégrabilité de f sur g(I). Soit maintenant a ∈
E, b = g(a), et posons
A = f (b) = (f ◦ g)(a) ≥ 0, B = |Jg (a)| > 0.
Définissons la fonction réelle ψ sur R2 par
ψ(ξ, η) = (A − ξ)(B − ξ) − (A + ξ)B(1 + η)n;
elle est continue sur R2 et telle que ψ(0, 0) = 0; en conséquence, pour l’!
donné dans l’énoncé, on pourra trouver un δ $ > 0 tel que pour tout ξ vérifiant
|ξ| ≤ δ $ et tout η vérifiant |η| ≤ δ $ , on aura |ψ(ξ, η)| ≤ !.
En particulier, si ξ ∈ ]0, b[ ∩ ]0, δ $ [ et si η ∈ ]0, δ $[ sont fixés, on a
(A + ξ)B(1 + η)n ≤ (A − ξ)(B − ξ) + !.
D’autre part, f étant continue en b, il existera un δ $$ > 0 (que l’on peut

toujours choisir suffisamment petit pour que B∞ [b; δ $$] ⊂ g(E)) tel que
A − ξ ≤ f (y) ≤ A + ξ
pour tout y ∈ B∞ [b; δ $$]. Enfin, g et |Jg | étant continues en a, il existera

δ(a) > 0 (que l’on peut toujours choisir inférieur ou égal au δ(a) associé à η
par le lemme précédent et suffisamment petit pour que B∞ [a; δ(a)] ⊂ E) tel
que
|g(x) − g(a)|∞ = |g(x) − b|∞ ≤ δ $$
et
|Jg (x)| ≥ B − ξ,
pour tout x ∈ B∞ [a; δ(a)]. En conséquence, si I est un semi-cube tel que
a ∈ I¯ ⊂ B∞ [a; δ(a)], on obtient, en vertu du lemme précédent et du corollaire
du théorème de changement de variables affine,
J
f ≤ (A + ξ)µ(g(I)) ≤ (A + ξ)µ(h(I $)) = (A + ξ)|Jg (a)|µ(I $)
g(I)
= (A + ξ)B(1 + η)n cn = (A + ξ)B(1 + η)nµ(I).

D’autre part, pour tout x ∈ B∞ [a; δ(a)], on a, par les inégalités qui précè-
dent,
f (g(x))|Jg(x)| ≥ (A − ξ)(B − ξ),
et dès lors J
(f ◦ g)|Jg | ≥ (A − ξ)(B − ξ)µ(I)
I¯
J
≥ (A + ξ)B(1 + η)nµ(I) − !µ(I) ≥ f − !µ(I),
g(I)
Lemme. Soit f une fonction de Rn dans R+ continue sur g(E). Pour tout
semi-cube I tel que I¯ ⊂ E, on a
J J
f≤ (f ◦ g)|Jg |.
g(I) I¯
Démonstration. L’existence des deux intégrales a déjà été prouvée dans

la première partie de la démonstration du lemme précédent. Si ! > 0 est
donné, l’application strictement positive δ définie pour chaque a ∈ E par le
δ(a) fournit par le lemme précédent est évidemment une jauge sur E. Soit
I un semi-cube tel que I¯ ⊂ E. Par le théorème de Cousin, il existe une
P-partition régulière et δ-fine Π = {(x1 , I 1 ), . . ., (xm, I m)} de I; les I j sont
donc des semi-cubes partitionnant I et tels que
xj ∈ I¯j ⊂ B∞ [xj ; δ(xj )], 1 ≤ j ≤ m.
Dès lors, par le lemme précédent, on a

J J
f≤ (f ◦ g)|Jg | + !µ(I j ), 1 ≤ j ≤ m.
g(I j ) I¯j
D’autre part, g étant injective, les g(I j ) partitionnent g(I); dès lors, si K
est un semi-pavé tel que g(I) ⊂ K̄, on a
 
J J J m
$ m 4J
$ 5
f= 1g(I)f =  1g(I j ) f  = 1g(I j ) f =
g(I) K̄ K̄ j=1 j=1 K̄
 
m J
$ m J
$ m
$ J
f≤ (f ◦ g)|Jg| + !  µ(I j ) = (f ◦ g)|Jg | + !µ(I).
j
j=1 g(I ) j=1 I
j
j=1 I¯
Comme ! > 0 est arbitraire, la thèse en résulte.

Nous pouvons maintenant énoncer et démontrer le théorème du chan-
gement de variables dans l’intégrale sur un fermé borné d’une fonc-
tion réelle continue.
Théorème. Soit f une fonction réelle continue sur g(E) et F ⊂ g(E) un
fermé borné. Alors on a
J J
f= (f ◦ g)|Jg |.
F g −1 (F )
Démonstration. Notons tout d’abord que les deux membres de la formule

ont un sens puisque, F et g −1 (F ) étant des fermés bornés et f et (f ◦ g)|Jg |
des fonctions continues sur ces ensembles, elles y seront L-intégrables. Soit
I un semi-cube tel que G = g −1 (F ) ⊂ int I, ce qui implique en outre
que F ⊂ g(I). Le théorème de structure des ouverts bornés qui suit le
lemme de recouvrement et le fait que int I \ G soit un ouvert borné en-
traı̂nent l’existence d’une suite (gk )k∈N de fonctions réelles et d’une suite
({I1k , . . . , Im
k
k
})k∈N de partitions de I en semi-cubes telles que chaque gk soit
constante p.p. sur Ijk , 1 ≤ j ≤ mk , et telle que, pour tout x ∈ I, on ait
0 ≤ gk (x) ≤ gk+1 (x) ≤ 1, lim gk (x) = 1G (x).

k→∞
Dès lors, en utilisant le théorème de Levi, le lemme qui précède et le ca-

ractère injectif de g, on trouve, en désignant par xk,l un élément arbitraire
de Ilk et en supposant provisoirement que f est une fonction de Rn dans R+ ,
J J
(f ◦ g)|Jg | = 1G .(f ◦ g)|Jg |
g −1 (F ) I¯
J 4 5 J
= lim gk .(f ◦ g)|Jg| = lim gk .(f ◦ g)|Jg |
I¯ k→∞ k→∞ I¯
   
mk J
$ mk
$ J
= lim  gk .(f ◦ g)|Jg | = lim  gk (xk,j ) (f ◦ g)|Jg |
k→∞ ¯k k→∞ I¯jk
j=1 Ij j=1
   
mk
$ J mk J
$
≥ lim  gk (xk,j ) f  = lim  gk (xk,j )f 
k→∞ g(Ijk ) k→∞ k
j=1 j=1 g(Ij )
   
mk J
$ mk J
$
−1 −1
= lim  gk (g (g(x k,j
)))f  = lim  (gk ◦ g )f 
k→∞ k k→∞ k
j=1 g(Ij ) j=1 g(Ij )
J J J J
= lim (gk ◦ g −1 )f = lim [(gk ◦ g −1 )f ] = 1F f = f.
k→∞ g(I) g(I) k→∞ g(I) F
On a donc J J
(f ◦ g)|Jg | ≥ f.
g −1 (F ) F
En appliquant cette inégalité avec g, F, f respectivement remplacés par

g −1 , g −1 (F ), (f ◦ g)|Jg |, on obtient
J
(f ◦ g)|Jg |
g −1 (F )
J
≤ ((f ◦ g) ◦ g −1 ).|Jg | ◦ g −1 .|Jg−1 |
(g −1 )−1 (g −1 (F ))
J J
= f.|(Jg ◦ g −1 ).Jg−1 | = f,
F F
puisque, de l’identité sur g(E),
g ◦ g −1 = I,
on déduit, par le théorème de dérivation des fonctions composées, pour tout

y ∈ g(E),
I = (g ◦ g −1 )$y = gg$ −1 (y) ◦ (g −1 )$y ,
et dès lors, en prenant les déterminants,
8 9 D ED E
1 = det gg$ −1 (y) ◦ (g −1 )$y = det gg$ −1 (y) det(g −1 )$y )
D E
= Jg (g −1 (y)).Jg−1 (y) = (Jg ◦ g −1 ).Jg−1 (y).
En conséquence, on a, pour une fonction continue et positive sur g(E),

J J
f= (f ◦ g)|Jg |.
F g −1 (F )
Si maintenant f est une fonction réelle continue sur g(E), alors f = f + − f −

avec f + et f − des fonctions réelles positives L-intégrables sur g(E) et,
puisque |Jg | est une fonction à valeurs strictement positives, on trouve
aisément que
[(f ◦ g)|Jg|]+ = (f + ◦ g)|Jg |, [(f ◦ g)|Jg |]− = (f − ◦ g)|Jg |.
Dès lors, en appliquant le résultat à f + et f − et en recombinant, on obtient

le résultat désiré.
Remarque. La formule que nous venons de démontrer s’étend facilement au
cas d’une fonction continue sur un fermé non borné en utilisant la définition
de L-intégrabilité sur un ensemble non borné et le théorème précédent.
Terminons cette section en énonçant, sans démonstration, le théorème
général de changement de variables dans une intégrale multiple.
Théorème. Soit g un difféomorphisme de l’ouvert E de Rn sur l’ouvert
g(E) de Rn et soit f une fonction de Rn dans Rp définie p.p. sur une partie
A de g(E). Alors f est L-intégrable sur A si et seulement si (f ◦ g)|Jg | est
L-intégrable sur g −1 (A), auquel cas on a la formule
J J
f= (f ◦ g)|Jg |.
A g −1 (A)
Ce théorème peut se démontrer à partir du cas particulier traité ici en

utilisant un théorème d’approximation, pour la convergence en moyenne,
des fonctions L-intégrables par des fonctions continues, que nous n’avons
pas démontré ici.
Dans le cas particulier où n = 1 et où A = [a, b], l’hypothèse faite sur g
entraı̂ne que g est strictement croissante ou strictement décroissante. Dans
le premier cas, g $ est strictement positive,
g −1 ([a, b]) = [g −1 (a), g −1 (b)]
et la formule devient
J b J g −1 (b)
f= (f ◦ g)g $.
a g −1 (a)
Dans le deuxième cas, g $ est strictement négative,
g −1 ([a, b]) = [g −1 (b), g −1(a)]
et la formule devient
J b J g −1 (a) J g −1 (b)
f =− (f ◦ g)g $ = (f ◦ g)g $.
a g −1 (b) g −1 (a)
On retrouve donc bien la formule démontrée dans le cas des fonctions pri-
mitivables.
Les théorèmes de Fubini, Tonelli et du changement de variable fournissent
une autre méthode pour calculer l’intégrale de Poisson
J ∞
I= exp(−x2 ) dx.
0
On a, par les théorèmes de Tonelli et Fubini,

4J ∞ 5 4J ∞ 5
I =2
exp(−x ) dx 2
exp(−y ) dy 2
0 0
J ∞ 2J ∞ 3 J
= exp[−(x + y )] dx dy =
2 2
exp[−(x2 + y 2 )] dx dy.
0 0 ]0,∞ × ]0,∞[
La transformation g (passage aux coordonnées polaires) définie par
g(ρ, θ) = (ρ cos θ, ρ sin θ)

14.6. EXERCICES 563
est un difféomorphisme de ]0, ∞[ × ]0, π2 [ sur ]0, ∞[ × ]0, ∞[ et l’on calcule

aisément que Jg (ρ, θ) = ρ. En conséquence, le théorème du changement de
variables et le théorème de Fubini entraı̂nent
J
exp[−(x2 + y 2 )] dx dy
]0,∞[ × ]0,∞[
J
= exp(−ρ2 )ρ dρ dθ
]0,∞[ × ]0, π
2
[
J J ∞
π π π
= exp(−ρ2 )ρ dρ = exp(−t) dt = ,
2 ]0,∞[ 4 0 4
√
π
d’où l’on déduit aussitôt la valeur 2 de l’intégrale de Poisson.
14.6 Exercices
1. Soit f une fonction continue de R2 dans R possédant une dérivée partielle
par rapport à la première variable continue sur R et soient a et b deux
fonctions dérivables de R dans R. Si F est l’application de R dans R définie
par
J b(y)
F (y) = f (y, z) dz,
a(y)
montrer que F est dérivable en tout point de R et que

J b(y)
$ $ $
F (y) = f (y, b(y))b (y) − f (y, a(y))a (y) + D1 f (y, z) dz.
a(y)
Pour ce faire, on définira l’application H de R3 dans R par

J v
H(u, v, y) = f (y, z) dz,
u
qui est donc telle que F (y) = H(a(y), b(y), y), et on calculera F $ (y) en
utilisant le théorème de dérivation des fonctions composées et la règle de
Leibniz.
2. Utiliser la règle de Leibniz pour montrer que le potentiel V du champ de
gravitation créé par un corps matériel M de densité continue ρ vérifie, en
tout point x n’appartenant pas à M , l’équation de Laplace
3
$
∆V (x) ≡ 2
Djj V (x) = 0.
j=1
3. Pour chaque n ∈ N, soit Jn la fonction définie par l’intégrale

J
1 π
Jn (x) = cos(nt − x sin t) dt.
π 0
En utilisant la règle de Leibniz, montrer que Jn vérifie l’équation différentielle

de Bessel. On notera que
Dt[cos(nt − x sin t)] = −[sin(nt − x sin t)](n − x cos t)
= −n sin(nt − x sin t) + xDx[cos(nt − x sin t)].

En déduire que le membre de droite de cette expression constitue une repré-
sentation intégrale de la fonction de Bessel Jn .
4. Soit v : R → R une fonction L-intégrable. Montrer que la fonction u
donnée par
J , - , -
1 ∞ (x − y)2 1 (·)2
u(t, x) = √ exp − v(y) dy = √ exp − ∗ v,
2 πt −∞ 4t 2 πt 4t
est bien définie sur ]0, ∞[ ×R. Montrer que, pour chaque x ∈ R, on a
lim u(t, x) = v(x),

t→0+
et, en utilisant la règle de Leibniz, montrer que u vérifie sur ]0, ∞[ ×R,
l’équation de la chaleur
2
Dt u(t, x) − Dxx u(t, x) = 0.
5. Soit E ⊂ Rn un ensemble n-intégrable et f et g des fonctions de Rn dans

R intégrables sur E et telles que la fonction de Rn × Rn dans R définie par
(x, y) 2→ [f (x) − f (y)][g(x) − g(y)]
soit intégrable sur E × E. Utiliser le théorème de Fubini pour montrer que

f g est intégrable sur E et que l’on a l’identité de Tchebycheff
J J 4J 5 4J 5
1
[f (x) − f (y)][g(x) − g(y)] dx dy = µ(E) fg − f g .
2 E×E E E E
Si n = 1, E est un intervalle et si f et g sont toutes deux croissantes sur E

ou décroissantes sur E, en déduite l’inégalité de Tchebycheff
J 4J 5 4J 5
1
fg ≥ f g .
E µ(E) E E
14.6. EXERCICES 565
6. Soit E ⊂ Rn et f et g des fonctions de Rn dans R telles que f 2 et g 2

soient intégrables sur E et telles que la fonction de Rn × Rn dans R définie
par
(x, y) 2→ [f (x)g(y) − f (y)g(x)]2
soit intégrable sur E × E. Utiliser le théorème de Fubini pour montrer que
f g est intégrable sur E et que l’on a l’identité de Lagrange
J 4J 5 4J 5 4J 52
1
[f (x)g(y) − f (y)g(x)] dx dy = 2
f 2
g 2
− fg .
2 E×E E E E
En déduire l’inégalité de Cauchy-Schwarz-Bouniakowsky

4J 52 4J 5 4J 5
fg ≤ f2 g2 .
E E E
7. Soit I = ]0, b]× ]0, d] un semi-pavé de R2 et P une partition de I en un

nombre fini de semi-pavés. Montrer que si chaque semi-pavé de P possède
un côté de longueur entière, alors I possède un côté de longueur entière. On
notera que
J β 1
sin 2πx dx = [sin π(β + α). sin π(β − α)],
α π
et que dès lors cette intégrale est nulle si et seulement si β + α ou β − α
est entier. D’autre part, le théorème de Fubini entraı̂ne que si f (x, y) =
sin 2πx. sin 2πy, et si K = ]α, β]× ]γ, δ], alors
J
1
f (x, y) dx dy = [sin π(β + α). sin π(β − α)][sin π(δ + γ). sin π(δ − γ)].
K̄ π2
Cette intégrale est donc nulle si l’un des côtés de K a une longueur entière.
D’ailleurs, si P = {I 1 , . . . , I m}, on a, par le calcul ci-dessus, l’additivité de
l’intégrale et l’hypothèse sur les I j ,
J m J
1 $
sin2 πb sin2 πd = f= f = 0,
π2 I¯ ¯j
j=1 I
ce qui entraı̂ne que b ou d est entier.

8. Les coordonnées polaires dans Rn (qui généralisent les coordonnées po-
laires dans R2 et les coordonnées sphériques dans R3 ) sont définies par les
relations
x1 = r cos ϕ1 ,
x2 = r sin ϕ1 cos ϕ2 ,
...
xn−1 = r sin ϕ1 sin ϕ2 . . . sin ϕn−2 cos ϕn−1 ,
xn = r sin ϕ1 sin ϕ2 . . . sin ϕn−2 sin ϕn−1 .
Montrer que si g est l’application de E =]0, ∞[ × ]0, π[n−2 × ]0, 2π[ dans Rn
définie par le second membre de ces relations, alors g est un difféomorphisme
de E sur g(E) et
Jg (r, ϕ1, . . . , ϕn−1 ) = r n−1 sinn−2 ϕ1 sinn−3 ϕ2 . . . sin ϕn−2 .
En déduire que si f est une fonction de ]0, ∞[ dans R, alors la fonction

radiale x 2→ f (|x|2 ) est L-intégrable sur Rn si et seulement si la fonction
r 2→ r n−1 f (r) est L-intégrable sur ]0, ∞[, auquel cas l’on a
J J ∞
f (|x|2) dx = ωn f (r)r n−1 dr,
Rn 0
2πn/2
où ωn est une constante positive ne dépendant que de n (en fait, ωn = Γ( n )
).
2

Si la fonction donnée est telle que tous les ensembles e$p soient mesurables
(B), auquel cas on pourra dire que la fonction est sommable (B), la formule
se simplifie et devient
J J &J '
A B
ϕ(x, y) dx dy = ϕ(x, y) dy dx.
0ACB 0 0
C’est la formule classique. On sait que cette formule doit être remplacée par
une formule plus compliquée, analogue à celle que nous avons obtenue, quand
on s’occupe de l’intégration, au sens de Riemann, appliquée dans toute sa
généralité.
M. Lebesgue a traité le problème de la réduction des intégrales doubles

dans son mémoire des Annali di Matematica de 1902. Pour faire cette
réduction, M. Lebesgue définit ce qu’il appelle les intégrales supérieure et
inférieure d’une fonction. Quand la fonction est mesurable, les deux inté-
grales coı̈ncident et réciproquement. M. Lebesgue étend, sans nouvelle dé-
monstration, cette formule aux intégrales de fonctions non bornées, pourvu
que celles-ci existent. M. Fubini a montré que l’introduction des intégrales
supérieures et inférieures est inutile et que la réduction peut toujours se faire
à l’aide des intégrales ordinaires. De plus, il a donné la démonstration de la
formule pour le cas où f est sommable dans Γ sans être bornée. Si on laisse
de côté cette dernière démonstration, on peut observer que le théorème de
M. Fubini peut se déduire, sans autre examen, de la formule de M. Lebesgue.
... La formule de M. Lebesgue prend donc la forme définitive
J J J J
f dx dy = dx f dy.
Mais il faut négliger au second membre l’ensemble (de mesure nulle) des
valeurs de x pour lesquelles l’intégrale intérieure n’existerait pas. C’est le
résultat indiqué par M. Fubini. A cause de son importance, nous allons
démontrer à nouveau cette formule de réduction par la voie qui nous paraı̂t
la plus naturelle. Cette démonstration détaillée, où nous ne ferons appel à
aucun théorème étranger, aura peut-être l’avantage de préciser sur certains
points les conditions de validité de la formule.
Charles-Jean de La Vallée Poussin, 1910
L’approximation par des sommes intégrales (qui est analogue à l’approche
usuelle de l’intégrale de Riemann) est utilisée pour obtenir le théorème de
Fubini pour l’intégrale de Perron dans une forme générale; on trouve des
conditions nécessaires et suffisantes pour l’existence de l’intégrale itérée.
Jaroslav Kurzweil, 1973
Parlons d’abord du changement de variables dans les intégrales multi-
ples. La véritable origine de la formule obtenue est dans le fait que le ja-
cobien d’une transformation ponctuelle, pris en valeur absolue, représente
le rapport de deux aires infiniment petites correspondantes, ou, s’il s’agit
d’intégrales triples, de deux volumes infiniment petits correspondants. ... Ce
résultat conduit évidemment à écrire
H H
la formule classique pour le change-
ment de variables sous le signe . Il n’en constitue pas cependant une
démonstration satisfaisante, au moins au premier abord, et l’on a, jusqu’ici,
présenté la démonstration autrement. Deux méthodes sont connues : l’une
consistant à faire successivement un changement de variable sur x seul et un
changement de variable sur y seul; l’autre dans laquelle on obtient l’aire S
de l’image d’une portion s du premier plan en la ramenant à une intégrale

étendue à la frontière de s et établissant ainsi la formule S = sj $ , où j $
est compris entre le minimum et le maximum du jacobien j dans l’aire s :
formule qui entraı̂ne, sans nouvelle difficulté, celle du changement de vari-
ables. Ne peut-on obtenir une démonstration rigoureuse de la formule du
changement de variables en partant de ce fait fondamental ?
Jacques Hadamard, 1938
L’idée la plus naı̈ve (pour démontrer le théorème de changement de vari-

ables dans un intégrale multiple) serait de diviser D1 en parallélipipèdes
rectangles “infinitésimaux”, d’observer que l’image par h d’un tel parallé-
lipipède rectangle est un parallélipipède rectangle infinitésimal, de calculer
le volume de ce parallélipipède, de sommer tous les infinitésimaux produits
de cette manière, et ainsi d’arriver à la formule. ... Transformer cette ap-
proche heuristique en une démonstration rigoureuse n’est pas entièrement
trivial. Cela est seulement fait, à ma connaissance, en deux places : le
Cours d’Analyse de Jordan et le Differential-und Integralrechnung unter
besondere Berucksichtigung neuere Ergebnisse de Haupt. Dans chacune de
ces démonstrations, un petit rectangle C est considéré et, par une construc-
tion soignée, deux parallélipipèdes, le premier contenant h(C) et le second
entièrement contenu dans h(C) sont obtenus. De cette manière, on trouve
pour le volume de h(C) des bornes suffisamment exactes pour que la for-
mule puisse s’obtenir par passage à la limite. La principale difficulté de
cette démonstration est l’obtention du parallélipipède intérieur à h(C), car
le parallélipipède extérieur peut s’obtenir sans difficulté.
Jacob T. Schwartz, 1954

Chapitre 15
Analyse vectorielle et
extérieure
15.1 Intégrale sur une courbe
Soit C ⊂ Rn non vide et image d’une application Γ : [a, b] → Rn continue sur

[a, b], injective sur [a, b[ et telle que Γ(a) = Γ(b), ou injective sur [a, b]. En
géométrie différentielle, C s’appelle le support ou la trace d’un arc de courbe
simple (fermée dans le premier cas), et Γ est une représentation paramétrique
de C.
Un exemple extrêmement simple est celui du segment de droite [c, d]
joignant c ∈ Rn à d ∈ Rn , défini par [c, d] = {c + t(d − c) : t ∈ [0, 1]}, et muni
de sa représentation paramétrique canonique
Σ : [0, 1] → Rn , t 2→ c + t(d − c).
Il est alors naturel d’appeler longueur de [c, d] (pour la représentation para-

métrique Σ) le nombre positif L([c, d]) = |d−c|2 = |T ([c, d])|2, où T ([c, d]) =
d − c est le vecteur tangent à [c, d].
Si nous voulons donner un sens à la notion de longueur de C (dans
la représentation paramétrique Γ), il est naturel, comme nous l’avons fait
dans la discussion de la notion d’aire d’une figure plane servant à motiver la
notion d’intégrale, de considérer une partition {I 1 , . . . , I m} de I = ]a, b] en
semi-intervalles consécutifs I j = ]aj−1 , aj ], 1 ≤ j ≤ m, et de considérer les
“valeurs approchées” de la longueur données par les “sommes de Riemann”
569
570 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE
du type
m
$ m
$
|T ([Γ(aj−1 ), Γ(aj )])|2 = |Γ(aj ) − Γ(aj−1 )|2 (15.1)
j=1 j=1
m
$
= L([Γ(aj−1 ), Γ(aj )]),
j=1
où L([Γ(aj−1 ), Γ(aj )]) = |Γ(aj ) − Γ(aj−1 )|2 est la longueur, au sens con-
sidéré plus haut, du segment de droite [Γ(aj−1 ), Γ(aj )]. On est alors amené
à dire que le nombre positif L est la longueur de C (dans la représentation
paramétrique Γ) si toutes les expressions (15.1) peuvent être rendues arbi-
trairement proches de L en prenant des partitions de pas
max (aj − aj−1 )

1≤j≤m
suffisamment petit.
Plus généralement, soit f une fonction de Rn dans Rp définie sur C et Γ
une représentation paramétrique de C. Certains problèmes de mathémati-
que, de science ou de technique, et en particulier celui de la détermination de
la masse d’un fil dont on connaı̂t la densité linéaire, conduisent à considérer
des “sommes de Riemann” du type
m
$
SL (Γ, f, Π) = f (Γ(tj ))|Γ(aj ) − Γ(aj−1 )|2 (15.2)
j=1
m
$ m
$
= f (Γ(tj ))L([Γ(aj−1 ), Γ(aj )]) = f (Γ(tj ))|T ([Γ(aj−1 ), Γ(aj )])|2,
j=1 j=1
A B
où Π = (tj , I j ) 1≤j≤m est une P-partition de I, avec I j = ]aj−1 , aj ]. Le cas
particulier f = 1 correspond évidemment au problème de la longueur analysé
plus haut et celui de la détermination de la masse d’un fil dont on connaı̂t
la densité linéaire correspond à p = 1. La somme de Riemann revient à
approcher l’arc de courbe par une ligne brisée et à supposer que, sur chaque
segment, la densité est constante et égale à sa valeur en un point de la partie
de la courbe approchée par le segment de droite. Il est alors assez naturel
d’obtenir la masse du fil par un processus de passage à la limite sur ces
sommes de Riemann analogue à celui introduit pour le concept d’intégrale.
Cela conduit à la définition suivante.
15.1. INTÉGRALE SUR UNE COURBE 571
Définition. On dit que f est L−intégrable sur l’arc de courbe simple C

de représentation paramétrique Γ s’il existe J ∈ Rp tel que, pour chaque
! > 0, il existe une jauge δ sur I¯ telle que, pour chaque P-partition δ−fine
A j j B
Π = (t , I ) 1≤j≤m de I, on ait |SL (Γ, f, Π) − J|2 ≤ !.
Comme précédemment, on montre facilement l’unicité d’un tel J, on
l’appelle l’intégrale de f sur l’arc de courbe simple C de représentation
paramétrique Γ, et on le note
J J J J
f L(dΓ) ou f dL(Γ) ou f dL ou f |dT |2 ,
C C CΓ CΓ
H
pour rappeler son mode de construction. En particulier, si C dL(Γ) exis-
te, on l’appelle la longueur de l’arc de courbe simple C de représentation
paramétrique Γ, et on la note L(CΓ ).
On peut bien entendu, à partir de cette définition, construire une théorie
de l’intégration sur un arc de courbe analogue à celle que nous avons dévelop-
pée pour l’intégrale ordinaire. Dans ce cours, nous nous contenterons de
montrer qu’en se limitant aux fonctions f bornées sur C et aux arcs de
courbe C dont la représentation paramétrique Γ est de classe C 1 sur [a, b],
l’intégrale que nous venons d’introduire se ramène à une intégrale ordinaire
sur I¯ d’une expression faisant intervenir f, Γ et Γ$ , et à laquelle nous pourrons
donc appliquer tous les résultats obtenus pour l’intégrale d’une fonction sur
un intervalle fermé. La Proposition suivante est à la base de ce résultat.
Pour la motiver, notons que si Γ est dérivable sur ]a, b[, on a, en utilisant le
théorème de Lagrange,
m
; n <1/2
$ $
SL (Γ, f, Π) = f (Γ(t ))
j
[Γi (a ) − Γi (a
j j−1
)] 2
j=1 i=1
m
, n -1/2
$ $
= f (Γ(t )) j
(Γ$i (tji ))2 (aj −a )
j−1 2
j=1 i=1
m
, n -1/2
$ $
= f (Γ(t )) j
(Γ$i (tji ))2 (aj − aj−1 ),
j=1 i=1
j j
oùti ∈ ]a , a [, 1 ≤ j ≤ m, 1 ≤ i ≤ n. Si on remplace ti par tj dans la
j−1 j
dernière expression, elle devient

m
, n -1/2
$ $
f (Γ(t )) j
(Γ$i (tj ))2 (aj − aj−1 )
j=1 i=1
m
$
= f (Γ(tj ))|Γ$ (tj )|2 (aj − aj−1 ) = S(I, (f ◦ Γ)|Γ$ |2 , Π),
j=1
où le second membre est une somme de Riemann usuelle. Le problème est
donc de voir sous quelles conditions sur f et sur Γ ce remplacement est licite.
Proposition. Si f est bornée sur C et si Γ est de classe C 1 sur [a, b], alors,
¯ telle que pour toute
pour chaque ! > 0, il existe une jauge constante η sur I,
P-partition η-fine Π de I, on ait
|SL (Γ, f, Π) − S(I, (f ◦ Γ)|Γ$ |2 , Π)|2 ≤ !.
Démonstration.
A
En B
vertu du calcul effectué ci-dessus, on a, pour la P-
partition Π = (tj , I j ) 1≤j≤m de I, avec I j = ]aj−1 , aj ],
SL (Γ, f, Π) − S(I, (f ◦ Γ)|Γ$ |2 , Π)

, -1/2 , -1/2 
m
$  $n n
$ 
= f (Γ(tj )) (Γ$i (tji ))2 − (Γ$i (tj ))2 (aj − aj−1 )
 
j=1 i=1 i=1
m
$
= f (Γ(tj ))[h(tj1 , . . . , tjn ) − h(tj , . . . , tj )](aj − aj−1 ),
j=1
tji
avec ∈ ]aj−1 , aj [, 1 ≤ j ≤ m, 1 ≤ i ≤ n, si l’on définit l’application h de
[a, b] × . . . × [a, b] dans R par
, n -1/2
$
h(t1 , . . . , tn ) = (Γ$i (ti ))2 .
i=1
Puisque Γ est de classe C 1 sur [a, b], h est uniformément continue sur [a, b] ×
. . . × [a, b]. Par conséquent, si M > 0 désigne un majorant de |f (x)|2 sur
C et si ! > 0 est donné, il existe une constante η > 0 telle que pour tout
(t1 , . . . , tn ) ∈ [a, b]×. . .×[a, b] et tout (t$1 , . . . , t$n ) ∈ [a, b]×. . .×[a, b] vérifiant
l’inégalité
|(t1 , . . . , tn ) − (t$1 , . . . , t$n )|∞ ≤ η,
on ait
|h(t1 , . . . , tn ) − h(t$1 , . . . , t$n )| ≤ !/M (b − a).
Si l’on prend cet η comme jauge constante sur [a, b] et si Π est une P-partition
η-fine de I, on aura
tji ∈ ]aj−1 , aj [ ⊂ [tj − η, tj + η], 1 ≤ i ≤ n, 1 ≤ j ≤ m,

15.1. INTÉGRALE SUR UNE COURBE 573
donc,
|(tj1 , . . ., tjn ) − (tj , . . . , tj )|∞ ≤ η,
et dès lors
|SL (Γ, f, Π) − S(I, (f ◦ Γ)|Γ$ |2 , Π)|2
m
$
≤ M (!/M (b − a))(aj − aj−1 ) = !,
j=1

L’équivalence annoncée résulte aisément de cette Proposition.
Proposition. Dans les conditions de la Proposition qui précède, les inté-

grales J J
f dL(Γ) et (f ◦ Γ)|Γ$ |2
C I¯
existent simultanément et sont égales.
Démonstration. Nous démontrerons le résultat dans un sens, l’autre

cas étant strictement analogue. Supposons donc f L-intégrable sur C (de
représentation paramétrique Γ) et montrons H
que (f ◦ Γ)|Γ$ |2 est P-intégrable
¯ ¯
sur I et a pour intégrale sur I la quantité C f dL(Γ). Si ! > 0 est donné, on
peut trouver une jauge δ1 sur I¯ telle que, pour toute P-partition δ1 -fine Π
de I, on ait
# J #
# #
#SL (Γ, f, Π) − f dL(Γ)## ≤ !/2,
#
C 2
Si maintenant η est la constante associée par la Proposition précédente à

!/2, si δ est la jauge sur I¯ définie par δ(t) = min(δ1 (t), η), et si Π est une
P-partition δ-fine de I, on aura alors
# J #
# #
#S(I, (f ◦ Γ)|Γ$ |2 , Π) − f dL(Γ)##
#
C 2
# J #
# #
≤ |S(I, (f ◦ Γ)|Γ$ |2 , Π) − SL (Γ, f, Π)|2 + ##SL (Γ, f, Π) − f dL(Γ)##
C 2
≤ !/2 + !/2 = !.
Corollaire. Si Γ est de classe C 1 sur [a, b], alors la longueur de l’arc de

courbe simple C de représentation paramétrique Γ est donnée par
J J J , n -1/2
b b $
$
L(CΓ ) = dL(Γ) = |Γ |2 = (Γ$i )2 .
C a a i=1
Soit maintenant Γ̃ : [c, d] → Rn une représentation paramétrique de

classe C 1 équivalente à Γ, c’est-à-dire telle que Γ = Γ̃ ◦ h pour un difféomor-
phisme h : [a, b] → [c, d]. Alors, on a
J b J b J b
L(CΓ ) = |Γ$ |2 = |(Γ̃$ ◦ h)h$ |2 = |Γ̃$ ◦ h|2 |h$ |.
a a a
Comme h est bijective sur [a, b], elle y est monotone et h$ y a un signe
constant. Par le théorème de changement de variable dans une intégrale
simple, on obtient alors
J b J h(b) J d
L(CΓ ) = sign h$ |Γ̃ ◦ h|2 h$ = sign h$ |Γ̃$ |2 = |Γ̃$ |2 = L(CΓ̃ ),
a h(a) c
puisque, si h$ ≥ 0 (resp. ≤ 0) sur [a, b], h est croissante (resp. décroissante)

et h(a) = c, h(b) = d (resp. h(a) = d, h(b) = c). Donc, la longueur de l’arc de
courbe simple ne dépend pas de la représentation paramétrique à l’intérieur
de la classe définie par la relation d’équivalence ci-dessus.
Considérons par exemple la représentation paramétrique usuelle du cercle
C(r) de centre 0 et de rayon r > 0, à savoir
Γr : [0, 2π] → R2 , t 2→ (r cos t, r sin t).
On trouve la formule familière
J 2π J 2π
L(CΓr )) = (r 2 sin2 t + r 2 cos2 t)1/2 dt = r dt = 2πr.
0 0
Dans le cas particulier d’un arc de courbe simple dont la trace dans R2
est le graphe F = {(x, f (x)) : x ∈ [a, b]} d’une fonction f de R dans R
de classe C 1 sur [a, b], on a évidemment la représentation paramétrique de
classe C 1 correspondante
Φ : [a, b] → R2 , x 2→ (x, f (x)),
et, puisque
Φ$ (x) = (1, f $ (x)), x ∈ [a, b],
on obtient immédiatement la formule
J b
L(FΦ ) = [1 + (f $ )2 ]1/2.
a
15.2. INTÉGRALE SUR UNE SURFACE 575
15.2 Intégrale sur une surface

Soit S une partie non vide de R3 qui est l’image d’une application
Σ : K = [a1 , b1] × [a2 , b2] ⊂ R2 → R3
continue sur K et injective sur int K. En géométrie différentielle, S est ap-

pelé le support ou la trace d’un arc ou d’un élément de surface simple, et Σ
s’appelle une représentation paramétrique de S. Un exemple extrêmement
simple est celui du parallélogramme [c, d, e] construit sur les points non
colinéaires c, d, e (dans l’ordre) de R3 ,
[c, d, e] = {c + u1 (d − c) + u2 (e − c) : (u1 , u2 ) = u ∈ K = [0, 1] × [0, 1]},
et muni de sa représentation paramétrique canonique
Π : K → R3 , u 2→ c + u1 (d − c) + u2 (e − c).
En accord avec la géométrie élémentaire, il est naturel d’appeler aire de

[c, d, e] (pour la représentation paramétrique Π) le nombre positif
A([c, d, e]) = |(d − c) ∧ (e − c)|2 = |N ([c, d, e])|2,
où N ([c, d, e]) = (d − c) ∧ (e − c) désigne le produit vectoriel de d − c par

e − c, c’est-à-dire l’élément de R3 (normal à P ) défini par
(d − c) ∧ (e − c) = ((d2 − c2 )(e3 − c3 ) − (e2 − c2 )(d3 − c3 ),
(d3 − c3 )(e1 − c1 ) − (e3 − c3 )(d1 − c1 ), (d1 − c1 )(e2 − c2 ) − (e1 − c1 )(d2 − c2 ))

& & ' & '
d2 − c2 d3 − c3 d3 − c3 d1 − c1
= det , det ,
e2 − c2 e3 − c3 e3 − c3 e1 − c1
& ''
d1 − c1 d2 − c2
det .
e1 − c1 e2 − c2
Pour donner un sens à la notion d’aire de S (pour la représentation para-
métrique Σ), il est naturel de considérer une partition {I 1 , . . . , I m} de I =
]a1 , b1 ]× ]a2 , b2 ] en semi-pavés I j = ]aj1 , bj1 ]× ]aj2 , bj2 ], 1 ≤ j ≤ m, et de con-
sidérer les “valeurs approchées” de l’aire données par les “sommes de Rie-
mann”
m
$ m
$ m
$
A([cj , dj , ej ]) = |(dj − cj ) ∧ (ej − cj )|2 = |N ([cj , dj , ej ])|2 (15.3)
j=1 j=1 j=1
où cj = Σ(aj1 , aj2 ), dj = Σ(bj1 , aj2 ), ej = Σ(aj1 , bj2 ), où l’on a assimilé l’élément
de surface correspondant à la restriction de Σ à I j au parallélogramme
[cj , dj , ej ] et où l’on a sommé les aires correspondantes. On est alors amené
à dire que le réel positif A est l’aire de S (pour la représentation paramétri-
que Σ) si les expressions (15.3) deviennent arbitrairement proches de A en
prenant des partitions de I suffisamment fines.
Plus généralement, et pour pouvoir donner un sens par exemple à la
notion de masse d’une plaque dont on connaı̂t la densité superficielle, on est
conduit, si f est une fonction de R3 dans Rp définie sur l’élément de surface
S de représentation paramétrique Σ, à considérer des “sommes de Riemann”
du type
m
$
SA (Σ, f, Π) = f (Σ(uj ))A([cj , dj , ej ])
j=1
m
$
= f (Σ(uj ))|N ([cj , dj , ej ])|2 , (15.4)
j=1
A B
relatives à la P-partition Π = (uj , I j ) 1≤j≤m de I, où, de nouveau, on a
posé c =
j
Σ(aj1 , aj2 ), dj
= Σ(bj1, aj2 ), ej = Σ(aj1 , bj2 ), 1 ≤ j ≤ m. On arrive
ainsi à la définition suivante.
Définition. On dit que f est A-intégrable sur l’élément de surface S de
représentation paramétrique Σ s’il existe J ∈ Rp tel que pour tout ! > 0,
il existe une jauge δ sur I¯ telle que, pour toute P-partition δ-fine Π =
A j j B
(u , I ) 1≤j≤m de I, on ait
|SA (Σ, f, Π) − J|2 ≤ !.
On montre comme précédemment, qu’il existe au plus un tel J, on

l’appelle l’intégrale de f sur l’élément de surface simple S de représentation
paramétrique Σ, et on le note
J J J J
f A(dΣ)) ou f dA(Σ) ou f dA ou f |dN |2,
S S SΣ SΣ
H
pour rappeler son mode de construction. En particulier, si S dA(Σ) existe,
on l’appelle l’aire de l’élément de surface S de représentation paramétrique
Σ et on la note A(SΣ ).
On peut de nouveau, à partir de cette définition, construire une théorie
de l’intégrale sur un élément de surface analogue à celle développée pour
15.2. INTÉGRALE SUR UNE SURFACE 577
l’intégrale sur un pavé fermé. Comme dans le cas de l’intégrale sur un

arc de courbe, nous nous contenterons ici de montrer qu’en se limitant aux
fonctions bornées et aux éléments de surface de classe C 1 , l’intégrale que
nous venons d’introduire se ramène à l’intégrale ordinaire sur I¯ = K d’une
expression faisant intervenir la fonction, la représentation paramétrique et
ses dérivées partielles. On pourra donc appliquer à cette dernière intégrale
tous les résultats précédemment obtenus. Pour motiver la forme de cette
¯ on obtient,
expression, notons que, si Σ possède des dérivées partielles sur I,
en utilisant le théorème de Lagrange,
A([cj , dj , ej ]) =
#8 9
# j,1 j j j j,2 j j j j,3 j j j
# D1 Σ1 (u1 , a2 )(b1 − a1 ), D1Σ2 (u1 , a2 )(b1 − a1 ), D1Σ3 (u1 , a2 )(b1 − a1 ) ∧
8 9#
#
D2 Σ1 (aj1 , uj,1 j j j j,2 j j j j,3 j j
2 )(b2 − a2 ), D2 Σ2 (a1 , u2 )(b2 − a2 ), D2 Σ3 (a1 , u2 )(b2 − a2 ) # 2
# & '
# D1 Σ2 (uj,2 j
D1 Σ3 (uj,3 j
#
= #det 1 , a2) 1 , a2 ) ,
# D2 Σ2 (aj1 , uj,2
2 ) D2 Σ3 (aj1 , uj,3
2 )
& '
D1 Σ3 (uj,3 j j,1 j
1 , a2 ) D1 Σ1 (u1 , a2 )
det ,
D2 Σ3 (a1 , u2 ) D2 Σ1 (a1 , uj,1
j j,3 j
2 )
& '#
D1 Σ1 (uj,1 j j,2 j #
det 1 , a2 ) D1 Σ2 (u1 , a2 ) #
# µ(I j ),
D2 Σ1 (aj1 , uj,1 j j,2
2 ) D2 Σ2 (a1 , u2 )
#
2
où les uj,k

l appartiennent à ]ajl , bjl [ , (1 ≤ j ≤ m, 1 ≤ k ≤ 3, 1 ≤ l ≤ 2).
Si, dans cette expression, on remplace les arguments des Dl Σk par uj
(1 ≤ j ≤ m, 1 ≤ k ≤ 3, 1 ≤ l ≤ 2), on trouve, au lieu de A([cj , dj , ej ]),
l’expression
|D1 Σ(uj ) ∧ D2 Σ(uj )|2 µ(Ij )
= |(JΣ2 ,Σ3 (uj ), JΣ3 ,Σ1 (uj ), JΣ1 ,Σ2 (uj ))|2 µ(Ij ),
où JΣi ,Σj désigne comme d’habitude le jacobien de l’application
u 2→ (Σi(u), Σj (u)), 1 ≤ i, j ≤ 3.
On notera que la direction de l’élément NΣ (u) défini par
NΣ (u) = D1 Σ(u) ∧ D2 Σ(u)

est orthogonale à celle des éléments D1 Σ(u) et D2 Σ(u) parallèles au plan

tangent à la surface S en Σ(u), et est donc normale à S en Σ(u). Les sommes
de Riemann après ce remplacement deviennent les expressions
m
$
f (Σ(uj ))|NΣ (uj )|2 µ(I j ), (15.5)
j=1
c’est-à-dire les sommes de Riemann usuelles pour l’intégration sur I¯ de la

fonction (f ◦ Σ)|NΣ |2 . Le problème consiste de nouveau à voir sous quelles
conditions on peut remplacer, sans changer les conclusions, les sommes de
Riemann SA (Σ, f, Π) par les sommes de Riemann usuelles
S(I, (f ◦ Σ)|NΣ |2 , Π).
Dans cette direction, on a le résultat suivant, qui se démontre d’une manière

strictement analogue au résultat correspondant pour l’intégration sur un arc
de courbe, et dont les détails de la démonstration seront laissés au lecteur.
Proposition. Si f est bornée sur S et si Σ est de classe C 1 sur K, alors
J
f dA(Σ)
S
et J J
(f ◦ Σ)|NΣ |2 = (f ◦ Σ)[JΣ2 2 ,Σ3 + JΣ2 3 ,Σ1 + JΣ2 1 ,Σ2 ]1/2
K K
Corollaire. Si Σ est de classe C 1 sur K, alors l’aire de l’élément de surface

simple S de représentation paramétrique Σ est donnée par
J J
A(SΣ ) = |NΣ |2 = [JΣ2 2 ,Σ3 + JΣ2 3 ,Σ1 + JΣ2 1 ,Σ2 ]1/2.
K K
En utilisant le théorème de changement de variables dans une intégrale

multiple, on peut montrer, comme dans le cas d’un arc de courbe, que
l’aire d’un élément de surface simple ne dépend pas de la représentation
paramétrique à l’intérieur de la classe d’équivalence des représentations para-
métriques au sens de la géométrie différentielle.
Si nous considérons, à titre d’exemple, la représentation paramétrique
usuelle de la sphère S(r) de centre 0 et de rayon r > 0, c’est-à-dire l’appli-
cation
Σr : [0, π] × [0, 2π] → R3 ,
15.3. CIRCULATION D’UN CHAMP VECTORIEL 579
(u1 , u2 ) 2→ (r sin u1 cos u2 , r sin u1 sin u2 , r cos u1 ),

nous obtenons aisément, en utilisant le théorème de Fubini, le résultat fa-
milier J 2π J π
A(SΣr ) = (r 4 sin4 u1 cos2 u2 + r 4 sin4 u1 sin2 u2
0 0
+r sin2 u1 cos2 u2 )1/2 du1 du2

4
J 2π J π J 2π
= r2 sin u1 du1 du2 = 2r 2 du2 = 4πr 2 .
0 0 0
Dans le cas particulier d’un élément de surface simple dont la trace dans
R3 est le graphe F = {(x1 , x2, f (x1 , x2 )) : (x1 , x2 ) ∈ K} d’une fonction f de
R2 dans R de classe C 1 sur le pavé fermé K, on considère la représentation
paramétrique naturellement associée
Σ : K → R3 , (x1 , x2 ) 2→ (x1 , x2 , f (x1 , x2 )).
Comme
JΣ2 ,Σ3 = −D1 f, JΣ3 ,Σ1 = −D2 f, JΣ1 ,Σ2 = 1,
on trouve immédiatement la formule importante
J
A(F ) = [1 + (D1 f )2 + (D2 f )2 ]1/2.
K
15.3 Circulation d’un champ vectoriel

Si n ≥ 2 est un entier, convenons d’appeler champ vectoriel dans Rn toute
fonction de Rn dans Rn , et rappelons la notation (x|y) du produit scalaire
%n
i=1 xi yi des éléments x et y de R .
n
Si [c, d] est le segment de droite joignant c ∈ Rn et d ∈ Rn introduit

précédemment, et si f est un champ vectoriel constant sur [c, d], dont nous
désignerons également par f la valeur constante, différentes questions de
physique conduisent à considérer l’expression
n
$
(f |d − c) = (f |T ([c, d])) = fi (di − ci ).
i=1
Ainsi, lorsque n = 3 et que f représente une force constante, (f |d − c)

fournit le travail de cette force le long du segment orienté [c, d]. L’extension
nécessaire de ces notions au cas où f n’est plus nécessairement constant
et où [c, d] est remplacé par un arc de courbe simple C de représentation
paramétrique Γ : [a, b] ⊂ R → Rn conduit à la considération de “sommes de

Riemann” du type
m
$
SC (Γ, f, Π) = (f (Γ(tj ))|Γ(aj ) − Γ(aj−1 ))
j=1
m
$
= (f (Γ(tj ))|T ([Γ(aj−1 ), Γ(aj )])),
j=1
A B
si Π = (tj , ]aj−1 , aj ])
1≤j≤m est une P-partition de I =]a, b]. De telles
sommes apparaissent lorsqu’on remplace la restriction de Γ à [aj−1 , aj ] par
le segment de droite [Γ(aj−1 ), Γ(aj )] et que l’on suppose que, sur ce segment,
le champ vectoriel garde la valeur constante f (Γ(tj )).
Définition. On dit que J ∈ R est la circulation du champ vectoriel f le
long de l’arc de courbe C de représentation paramétrique Γ si pour chaque
! > 0 il existe une jauge δ sur I¯ telle que pour toute P-partition δ-fine Π de
I, on a
|SC (Γ, f, Π) − J| ≤ !.
On montre comme d’habitude l’unicité d’un tel J, ce qui justifie la ter-
minologie, et on le désigne par
J J J
(f |T (dΓ)) ou (f |dT (Γ)) ou (f |dT )
C C CΓ
pour rappeler son mode de construction. Comme pour les autres extensions
de l’intégrale introduites précédemment, on peut déduire de cette définition
un certain nombre de propriétés. Nous nous contenterons de montrer que si
f est borné sur C et si Γ est de classe C 1 , la circulation de f le long de Γ se
ramène à l’intégrale usuelle sur [a, b] d’une fonction de R dans R construite
à partir de f, Γ et Γ$ . Pour déterminer heuristiquement la forme de cette
fonction, il suffit encore, lorsque Γ est dérivable, d’appliquer le théorème de
Lagrange aux composantes Γi dans l’expression de la somme de Riemann.
On trouve ainsi
, n -
m $
$ 8 9
SC (Γ, f, Π) = fi (Γ(t )) Γi (a ) − Γi (a
j j j−1
)
j=1 i=1
, n
m $
-
$
= fi (Γ(t j
))Γ$i (tji )(aj −a j−1
) ,
j=1 i=1
15.3. CIRCULATION D’UN CHAMP VECTORIEL 581
pour des tji ∈]aj−1 , aj [, 1 ≤ i ≤ n, 1 ≤ j ≤ m. Si, dans la dernière expression,

j
on remplace les ti par tj , 1 ≤ i ≤ n, 1 ≤ j ≤ m, on obtient
, n
m $
-
$
fi (Γ(t j
))Γ$i (tj )(aj −a j−1
)
j=1 i=1
m
$
= (f (Γ(tj ))|Γ$ (tj ))(aj − aj−1 ) = S(I, (f ◦ Γ|Γ$ ), Π),
j=1
c’est-à-dire la somme de Riemann usuelle pour la fonction (f ◦ Γ|Γ$ ) et la P-

partition Π de I = ]a, b]. D’une manière strictement analogue à celle utilisée
dans le cas de l’intégration sur un arc de courbe, on peut démontrer la condi-
tion suffisante suivante pour que SC (Γ, f, Π) et S(I, (f ◦ Γ|Γ$ ), Π) fournissent
la même intégrale.
Proposition. Si f est bornée sur C et si Γ est de classe C 1 sur [a, b], alors
J
(f |dT (Φ))
C
et J J
b n
b$
$
(f ◦ Γ|Γ ) = (fi ◦ Γ)Γ$i
a a i=1

Si Γ̃ : [c, d] → Rn est une représentation paramétrique de C équivalente à
Γ, c’est-à-dire si Γ = Γ̃ ◦ h pour un certain difféomorphisme h : [a, b] → [c, d],
le théorème du changement de variable dans une intégrale entraı̂ne que
J J b J b
$
(f |dT (Γ)) = (f ◦ Γ|Γ ) = (f ◦ Γ̃ ◦ h|Γ̃$ ◦ h)h$
C a a
J d J
=± (f ◦ Γ̃|Γ̃$ ) = ± (f |dT (Γ̃)),
c C
avec le signe + ou le signe − selon que h est croissante ou décroissante. Donc,
dans
H
la classe des représentations paramétriques considérées, seul le signe de
C (f |dT (Φ)) dépend du choix de la représentation. On dit en géométrie
différentielle que Γ et Γ̃, liés par la relation ci-dessus, correspondent à une
même orientation de C si h$ est positive sur [a, b] et correspondent à des
orientations opposées si h$ est négative sur [a, b]. Dans le cas du segment de
droite, on vérifie aisément que les orientations différentes correspondent aux
deux sens de parcours possibles sur le segment.
Si nous supposons maintenant que Γ, bijective et de classe C 1 , est en

outre telle que, pour tout t ∈ [a, b], on ait |Γ$ (t)|2 /= 0, nous pouvons définir
la tangente unitaire à C dans la représentation paramétrique Γ par
Γ$ ◦ Γ−1
τΓ = ,
|Γ$ ◦ Γ−1 |2
ce qui implique immédiatement que
Γ$ = (τΓ ◦ Γ)|Γ$ |2 .
Dès lors, par les propriétés de l’intégrale sur un arc de courbe, on obtient
J J b
(f |dT (Γ)) = (f ◦ Γ|Γ$ )
C a
J b J
= (f ◦ Γ|τΓ ◦ Γ)|Γ$ |2 = (f |τΓ )dL(Γ),
a C
ce qui montre que, dans ces conditions, la circulation de f le long de l’arc
de courbe C de représentation paramétrique Γ est égale à l’intégrale sur C
de la fonction (f |τΓ ).
15.4 Flux d’un champ vectoriel

Soit maintenant S un élément de surface dans R3 de représentation para-
métrique Σ et soit f un champ vectoriel dans R3 . Si [c, d, e] représente
de nouveau le parallélogramme construit sur les points c, d, e de R3 avec
sa représentation paramétrique canonique, et si f est un champ vectoriel
constant sur [c, d, e], différentes questions de mécanique ou de physique con-
duisent à considérer l’expression
(f |(d − c) ∧ (e − c)) = (f |N ([c, d, e])),
qui représente le flux de f à travers l’élément de surface [c, d, e] dans le sens

de la normale N ([c, d, e]). La terminologie provient de l’hydrodynamique
lorsque f représente le champ des vitesses d’un fluide en mouvement. Pour
étendre cette notion au cas où f n’est plus nécessairement constant et où S
est un élément de surface de représentation paramétrique Σ, on est conduit
à des “sommes de Riemann” du type
m
$
SF (Σ, f, Π) = (f (Σ(uj ))|N ([cj , dj , ej ]))
j=1
15.4. FLUX D’UN CHAMP VECTORIEL 583
m 8
$ 9
= f (Σ(uj ))|(Σ(dj ) − Σ(cj )) ∧ (Σ(ej ) − Σ(cj )) ,
j=1
où les notations sont celles utilisées pour les intégrales de surface. De telles
sommes correspondent à l’approximation qui consiste à remplacer la restric-
tion de Σ à I j par le parallélogramme [cj , dj , ej ] et de supposer que le champ
f y a la valeur constante f (Σ(uj )). On est ainsi conduit à la définition
suivante.
Définition. On dit que J ∈ R est le flux du champ vectoriel f : S → R3
à travers l’élément de surface S de représentation paramétrique Σ si pour
chaque ! > 0, il existe une jauge δ sur I¯ telle que, pour toute P-partition
δ-fine Π de I, on a
|SF (Σ, f, Π) − J|2 ≤ !.
On montre comme d’habitude qu’il existe au plus un tel J et on le note
J J J
(f |N (dΣ)) ou (f |dN (Σ)) ou (f |dN ),
S S SΣ
pour rappeler son mode de construction.

De nouveau, plutôt que de reconstruire une théorie de l’intégration basée
sur la définition ci-dessus, nous nous contenterons de montrer que, sous
certaines hypothèses supplémentaires relatives à f et Σ, cette intégrale se
ramène à une intégrale habituelle sur I.¯ Pour motiver la forme de cette
intégrale, il suffit encore de supposer Σ dérivable et d’appliquer le théorème
de Lagrange à chaque composante Σi . On obtient ainsi
m
, & '
$ D1 Σ2 (uj,2 j j,3 j
1 , a2 ) D1 Σ3 (u1 , a2 )
SF (Σ, f, Π) = f1 (Σ(u )) det
j
j=1
D2 Σ2 (aj1 , uj,2 j j,3
2 ) D2 Σ3 (a1 , u2 )
& '
D1 Σ3 (uj,3 j j,1 j
1 , a2 ) D1 Σ1 (u1 , a2 )
+f2 (Σ(u )) detj
D2 Σ3 (aj1 , uj,3 j j,1
2 ) D2 Σ1 (a1 , u2 )
& '-
j,1 j j,2 j
D1 Σ1 (u1 , a2 ) D1 Σ2 (u1 , a2 )
+ f3 (Σ(u )) det
j
j j,1 j j,2 µ(I j ),
D2 Σ1 (a1 , u2 ) D2 Σ2 (a1 , u2 )
où les uj,k
l appartiennent à ]ajl , bjl [, (1 ≤ j ≤ m; 1 ≤ k ≤ 3; 1 ≤ l ≤ 2).
Si, dans cette expression, on remplace les arguments des Dl Σk par uj , on
obtient la somme de Riemann usuelle
m
$
[f1 (Σ(uj ))JΣ2 ,Σ3 (uj ) + f2 (Σ(uj ))JΣ3 ,Σ1 (uj )
j=1
+f3 (Σ(uj ))JΣ1 ,Σ2 (uj )]µ(I j ) = S(I, (f ◦ Σ|NΣ ), Π),

où l’application “normale” NΣ a été introduite précédemment. D’une maniè-
re similaire à celle utilisée dans l’intégration sur un arc de surface, on
démontre la condition suffisante suivante pour que les sommes de Riemann
SF (Σ, f, Π) et S(I, (f ◦ Σ|NΣ ), Π) conduisent à la même intégrale.
¯
Proposition. Si fH est bornée sur S et si Σ est de classe C 1 sur K = I,
alors les intégrales S (f |dN (Σ)) et
J J
(f ◦ Σ|NΣ ) = [(f1 ◦ Σ)JΣ2 ,Σ3 + (f2 ◦ Σ)JΣ3 ,Σ1 + (f3 ◦ Σ)JΣ1 ,Σ2 ]
K K

En utilisant encore le théorème de changement de variables dans une
intégrale on peut encore montrer, comme dans le cas de la circulation, que
si Σ̃ est une représentation paramétrique de S régulièrement C 1 -équivalente
à Σ, c’est-à-dire si Σ = Σ̃ ◦ h pour un difféomorphisme h de K sur K̃, on
trouve que J J
(f |dN (Σ̃)) = sign Jh (f |dN (Σ)).
S S
Dans le langage de la géométrie différentielle, on voit donc que les intégrales
sont donc égales ou opposées selon que les représentations ont même orien-
tation ou des orientations opposées.
Si l’on suppose maintenant que Σ est injective sur K et que |NΣ (u)|2 /= 0
pour tout u ∈ K, on peut définir l’application normale unitaire à S dans la
représentation Σ par
NΣ ◦ Σ−1
νΣ = ,
|NΣ ◦ Σ−1 |2
ce qui entraı̂ne
NΣ = (νΣ ◦ Σ)|NΣ |2 ,
et, dès lors, J J
(f |dN (Σ)) = (f ◦ Σ|NΣ )
S K
J J
= (f ◦ Σ|νΣ ◦ Σ)|NΣ |2 = (f |νΣ )dA(Σ).
K S
Donc, dans les conditions mentionnées ci-dessus, le flux du champ vectoriel
f à travers l’élément de surface S de représentation paramétrique Σ est égal
à l’intégrale sur S de la fonction (f |νΣ ).
15.4. FLUX D’UN CHAMP VECTORIEL 585
En conclusion, les intégrales de circulation et de flux conduisent à des

intégrales ordinaires d’expressions du type
(f1 ◦ Γ)Γ$1 + . . . + (fn ◦ Γ)Γ$n ,
sur un intervalle fermé de R, et du type
(f1 ◦ Σ)JΣ2 ,Σ3 + (f2 ◦ Σ)JΣ3 ,Σ1 + (f3 ◦ Σ)JΣ1 ,Σ2
sur un pavé fermé de R2 . D’autre part, le théorème du changement de vari-

ables dans les intégrales a conduit à la considération d’intégrales du type
(f ◦ Ψ)JΨ où Ψ applique Rn en lui-même. Si l’on remarque que, dans la
première expression, on a évidemment Γ$i = JΓi , (1 ≤ i ≤ n), on voit que
toutes ces expressions possèdent une structure semblable et sont des cas
particuliers d’expressions de la forme
n
$ n
$
... (fi1 ,...,ik ◦ Φ)JΦi1 ,...,ik ,
i1 =1 ik =1
où k est un entier compris entre 1 et n, les fi1 ,...,ik sont des fonctions de Rn
dans R, Φ : K ⊂ Rk → Rn est une application de classe C 1 sur le pavé
fermé K et JΦi1 ,...,ik : K → R, u 2→ det[(Φi1 , . . . , Φik )$u ] est le jacobien de
l’application (Φi1 , . . . , Φik ) de K dans Rk . Le premier exemple correspond à
k = 1 et n quelconque, le deuxième à k = 2 et n = 3 et le troisième à k = n.
Des expressions du type général se présentent lorsqu’on cherche à étendre
les notions des deux dernières sections du cas particulier des courbes et des
surfaces dans R2 ou R3 au cas général des “variétés de dimension k dans
Rn ”. Elles possèdent par ailleurs des propriétés algébriques et différentielles
remarquables qui unifient les opérateurs différentiels de l’analyse vectorielle
et fournissent le langage naturel pour la généralisation aux intégrales mul-
tiples du théorème fondamental du calcul différentiel et intégral. Cette
généralisation s’appelle le théorème de Stokes-Cartan et fournit en outre un
traitement unifié et rigoureux des résultats d’analyse vectorielle, rencontrés
en physique et en mécanique, sur la réduction d’intégrales de volume à des
intégrales de surface, et d’intégrales de surface à des intégrales curvilignes.
C’est à ces questions et à des applications à l’analyse complexe que nous
consacrerons les sections et le chapitre suivants. Sans perte de généralité, on
pourra toujours supposer, en faisant si nécessaire une reparamétrisation, que
K est le produit cartésien d’intervalles unitaires [0, 1]. Pour des raisons de
simplicité, on se limitera au cas où les fonctions fi1 ,...,ik sont au moins con-
tinues sur K, ce qui suffit pour bon nombre d’applications. Enfin, l’élément
primordial dans une théorie analytique étant la représentation paramétrique

plutôt que l’être géométrique, on abandonnera les hypothèses d’injectivité
faites sur Φ.
15.5 Algèbre des formes extérieures

Soient n ≥ 1 et k ≥ 1 des entiers.
Définition. Si J = (j1 , j2 , . . . , jk ) est un k-uple d’entiers (1 ≤ ji ≤ n), la
k-forme (extérieure ou alternée ou antisymétrique) élémentaire pJ sur Rn
est l’application de Rn × . . . × Rn = Rnk dans R définie par
# #  
# h1 h1j2 . . . h1jk # (h1 )J
# j1 #
# h2 #  
# j1 h2j2 . . . h2jk #  (h2 )J 
pJ (h1 , h2 , . . ., hk ) = ## . .. .. .. # = det 
#  .. ,

# .. . . . #  . 
# k #
# hj
1
hkj2 . . . hkjk # (hk )J
où, si hi = (hi1 , hi2 , . . . , hin ), on pose (hi )J = (hij1 , hij2 , . . ., hijk ).

Si k = 1, les 1-formes élémentaires pj sont simplement les applications
projection sur la j e composante pj : Rn → R, h 2→ hj (1 ≤ j ≤ n). Si n = 4 et
k = 2, les 2-formes élémentaires sur R4 sont les applications pi,j de R4 × R4
dans R définies par
p1,1 (h1 , h2 ) = h11 h21 − h21 h11 , p1,2 (h1 , h2 ) = h11 h22 − h21 h12 ,
p1,3 (h1 , h2 ) = h11 h23 − h21 h13 , p1,4 (h1 , h2 ) = h11 h24 − h21 h14 ,
p2,1 (h1 , h2 ) = h12 h21 − h11 h22 , p2,2 (h1 , h2 ) = h12 h22 − h22 h12 ,
p2,3 (h1 , h2 ) = h12 h23 − h22 h13 , p2,4 (h1 , h2 ) = h12 h24 − h22 h14 ,
et ainsi de suite pour p3,1 , p3,2 , p3,3, p3,4 , p4,1, p4,2, p4,3 et p4,4 .
Par les propriétés des déterminants, on a
pj1 ,...,ji ,...,jl ,...,jk = −pj1 ,...,jl ,...,ji ,...,jk ,
et dès lors,
pj1 ,...,ji ,...,jl ,...,jk = 0
s’il existe i =
/ l tel que ji = jl . En particulier, si k > n, un tel couple existe
toujours et donc pJ = 0 quel que soit J.
15.5. ALGÈBRE DES FORMES EXTÉRIEURES 587
Posons
B(n, k) = {J = (j1 , . . . , jk ) : 1 ≤ j1 ≤ n, . . . , 1 ≤ jk ≤ n},
A(n, k) = {J = (j1 , . . . , jk ) ∈ B(n, k) : jr /= js si r /= s, 1 ≤ r, s ≤ k},

C(n, k) = {J = (j1 , . . . , jk ) ∈ B(n, k) : j1 < j2 < . . . < jk },
de telle sorte que B(n, k) ⊃ A(n, k) ⊃ C(n, k), et que B(n, k), A(n, k) et
C(n, k) contiennent respectivement nk , (n−k)!n!
et k!(n−k)!
n!
éléments. Il résulte
de la discussion précédente que pJ /= 0 si et seulement si J ∈ A(n, k) et que si
J ∈ A(n, k), il existe un élément unique I ∈ C(n, k) et une permutation π(I)
de I telle que J = π(I), et donc, en vertu des propriétés des déterminants,
telle que
pJ = pπ(I) = (sign π(I))pI,
où sign π(I) = 1 si π(I) s’obtient par un nombre pair de permutations de
deux éléments seulement et sign π(I) = −1 si π(I) s’obtient par un nombre
impair de telles opérations.
Dès lors, toutes les k-formes élémentaires non nulles pJ s’expriment
en fonction des k-formes pI , I ∈ C(n, k), qui sont appelées les k-formes
(extérieures, alternées ou antisymétriques) fondamentales et sont en nombre
k!(n−k)! . Ainsi, pour k = 1, les n 1-formes élémentaires pi (1 ≤ i ≤ n) sont
n!
fondamentales, pour k = n−1, il y a également n (n-1)-formes fondamentales
p2,3,...,n , p1,3,...,n , . . . , p1,2,...,n−1 ,
et pour k = n, il y a une seule n-forme fondamentale p1,2,...,n . Les 2-formes

fondamentales dans R3 sont p1,2 , p1,3, p2,3 , et les 2-formes fondamentales
dans R4 sont p1,2 , p1,3, p1,4, p2,3 , p2,4, p3,4 .
Définition. Une k-forme extérieure (ou alternée ou antisymétrique) réelle
(resp. complexe) sur Rn est une application u de Rn × . . . × Rn = Rnk dans
R (resp. C) de la forme $
u= uJ pJ ,
J∈B(n,k)
où les uJ ∈ R (resp. C).

Les 1-formes extérieures réelles (resp. complexes) sont donc les formes
linéaires réelles (resp. complexes) sur Rn , c’est-à-dire les éléments de
L(Rn , R) (resp. L(Rn , C)).

L’application 5p1,2 + 12 p2,1 + 8p4,3 est une 2-forme extérieure réelle sur Rn .
[
Si K = R ou C, l’ensemble k (Rn , K) des k-formes extérieures à valeurs
dans K est donc l’espace vectoriel sur K engendré par les k-formes élémentai-
res pI. C’est évidemment un sous-espace vectoriel de l’ensemble Lk (Rn , K)
des applications k-linéaires de Rn dans K.
Il est utile également de donner un sens à la notion de 0-forme extérieure.
Toute application u : {0} → K est caractérisée par son unique valeur u =
u(0), et l’on peut ainsi associer une 0-forme à chaque élément de K.
% [
Si u = J∈B(n,k) uJ pJ ∈ k (Rn , K), alors, on a
 
$ $  $ 
u= uJ pJ =  uπ(I) pπ(I)
J∈A(n,k) I∈C(n,k) permutations π(I) de I
 
$  $  $
=  uπ(I) sign π(I) pI = ũI pI,
I∈C(n,k) permutations π(I) de I I∈C(n,k)
si l’on pose
$
ũI = uπ(I) sign π(I).
permutations π(I) de I
[k
On voit donc que tout u ∈ (Rn , K) peut s’exprimer comme combinai-
son linéaire à coefficients dans K des k-formes fondamentales. Que cette
expression soit unique résulte du lemme suivant.
%
Lemme. I∈C(n,k) uI pI = 0 si et seulement si uI = 0, (I ∈ C(n, k)).
Démonstration. La condition suffisante est évidente. Pour la condition
nécessaire, si I = (i1 , . . . , ik ) ∈ C(n, k), de telle sorte que 1 ≤ i1 < i2 < . . . <
ik ≤ n, alors, en prenant h = (h1 , . . . , hk ) ∈ Rnk défini par
il = δl,m (symbole de Kronecker) , 1 ≤ m ≤ k, 1 ≤ l ≤ k,

hm
i = 0, i ∈ {1, 2, . . ., n} \ {i1 , . . ., ik },
hm
on trouve
$
0= uJ pJ (h1 , . . . , hk ) = uI ,
J∈C(n,k)

[k
Dès lors, si u ∈ (Rn , K) et si
$ $
u= uIpI = u$I pI ,
I∈C(n,k) I∈C(n,k)
on en déduit
$
(uI − u$I)pI = 0,
I∈C(n,k)
et donc, par le Lemme, uI = u$I , (I ∈ C(n, k)).

En résumé, toute k-forme extérieure u sur Rn s’exprime d’une manière
unique comme combinaison linéaire des k-formes fondamentales pI
$
u= uI pI,
I∈C(n,k)
et cette expression s’appelle l’écriture canonique de u. Il en résulte que

[k
(Rn , K) est un espace vectoriel sur K de dimension k!(n−k)!
n!
, et que si
% %
u = I∈C(n,k) uI pI , v = I∈C(n,k) vI pI sont deux k-formes extérieures en
% %
écriture canonique, et si c ∈ K, alors I∈C(n,k) (uI +vI )pI et I∈C(n,k) cuIpI
sont les écritures canoniques de u + v et de cu respectivement.
Soient n ≥ 1, k ≥ 1 et l ≥ 1 des entiers. Nous allons d’abord définir le
produit extérieur d’une k-forme fondamentale pI et d’une l-forme fondamen-
tale pJ .
Définition. Le produit extérieur pI ∧ pJ de pI = pi1 ,...,ik par pJ = pj1 ,...,jl

est la (k+l)-forme élémentaire dans Rn
pI ∧ pJ = p(I,J),
où (I, J) désigne le (k+l)-uple (i1 , . . . , ik , j1 , . . . , jl ). Si α, β ∈ {−1, 1}, on

définit (αpI ) ∧ (βpJ ) par
(αpI ) ∧ (βpJ ) = (αβ)p(I,J).
En d’autres termes, pi1 ,...,ik ∧pj1 ,...,jl = pi1 ,...,ik ,j1 ,...,jl . Si (I, J) /∈ A(n, k +
l) (c’est-à-dire si I et J ont un élément en commun), alors, par ce qui précède,
pI ∧ pJ = 0. Si (I, J) ∈ A(n, k + l), désignons par [I, J] ∈ C(n, k + l) le (k+l)-
uple obtenu en réordonnant les éléments de I∪J dans l’ordre croissant: p[I,J]
est donc une (k+l)-forme fondamentale.
Proposition. Si I ∈ C(n, k), J ∈ C(n, l) et (I, J) ∈ A(n, k + l), on a
pI ∧ pJ = (−1)α(I,J)p[I,J],
où α(I, J) désigne le nombre de différences jr − is strictement négatives

(1 ≤ r ≤ l, 1 ≤ s ≤ k).
Démonstration. Partant de (I, J) = (i1 , . . ., ik , j1, . . . , jl ), on arrivera pas
à pas à [I, J] en permutant successivement ik avec tous les jr tels que jr < ik ,
puis en permutant successivement ik−1 avec tous les jr tels que jr < ik−1 , et
ainsi de suite jusqu’à i1 . Comme, à chaque opération pI ∧ pJ est multiplié
par (−1), la formule est prouvée.
Proposition. Si I ∈ C(n, k), J ∈ C(n, l) et K ∈ C(n, m), on a
(pI ∧ pJ ) ∧ pK = pI ∧ (pJ ∧ pK ),
dont on désigne la valeur commune par pI ∧ pJ ∧ pK .

Démonstration. Si (I, J, K) /∈ A(n, k + l + m), les deux membres de
l’égalité à prouver sont nuls et donc égaux. On peut donc supposer que
(I, J, K) ∈ A(n, k + l + m). Par la définition et la proposition précédentes,
on a
(pI ∧ pJ ) ∧ pK = p(I,J) ∧ pK = (−1)α(I,J)p[I,J] ∧ pK
= (−1)α(I,J)p([I,J],K) = (−1)α(I,J)(−1)α([I,J],K)p[I,J,K]
= (−1)α(I,J)+α(I,K)+α(J,K)p[I,J,K].
On montre de la même manière que pI ∧ (pJ ∧ pK ) est égal à cette dernière
expression.
Passons maintenant à la définition du produit extérieur de deux formes
quelconques.
Définition. Si
% [k % [l
u= I∈C(n,k) uI pI ∈ (Rn , K), v = J∈C(n,l) vJ pJ ∈ (Rn , K),
sont respectivement une k-forme extérieure et une l-forme extérieure sur Rn ,
[
le produit extérieur u ∧ v de u par v est l’élément de k+l (Rn , K) défini par
$ $
u∧v = uI vJ p(I,J).
I∈C(n,k) J∈C(n,l)
Le produit extérieur possède les propriétés suivantes.

[k [l
Proposition. 1. Si u ∈ (Rn , K), v ∈ (Rn , K) et k + l > n, alors
u ∧ v = 0.
[k [k [l
2. Si u ∈ (Rn , K), v ∈ (Rn , K) et w ∈ (Rn , K), c ∈ K, alors
(u + v) ∧ w = (u ∧ w) + (v ∧ w),
w ∧ (u + v) = (w ∧ u) + (w ∧ v),
(cu) ∧ w = u ∧ (cw) = c(u ∧ w).
[k [l [m
3. Si u ∈ (Rn , K), v ∈ (Rn , K) et w ∈ (Rn , K), alors
(u ∧ v) ∧ w = u ∧ (v ∧ w),
et la valeur commune s’écrit u ∧ v ∧ w.
[ [
4. Si u ∈ k (Rn , K) et v ∈ l (Rn , K), alors
u ∧ v = (−1)kl (v ∧ u).
5. Si I = (i1 , . . . , ik ) ∈ B(n, k), alors

pi1 ∧ pi2 ∧ . . . ∧ pik = pi1 ,...,ik = pI .
Démonstration. Les propriétés 1, 2 et 5 sont des conséquences immédi-
ates de la définition. Par la propriété 2, il suffit de démontrer la propriété
3 pour des formes fondamentales, ce qui a été fait plus haut. Quant à la
propriété 4, elle découle de la propriété 2 et du fait que, si I = (i1 , . . . , ik ) ∈
C(n, k) et J = (j1 , . . . , jl ) ∈ C(n, l), alors les deux membres sont nuls si
(I, J) /∈ A(n, k + l) tandis que, dans le cas contraire, on a
p(I,J) = pi1 ,...,ik ,j1 ,...,jl = (−1)kl pj1 ,...,jl ,i1 ,...,ik = (−1)kl p(J,I).
%3 %3 %3
Exemple. Si u = i=1 ui pi et v = j=1 k=1 vj,k pj,k , on a
u ∧ v = u1 v2,3 p1,2,3 + u1 v3,2 p1,3,2 + u2 v1,3 p2,1,3

+u2 v3,1 p2,3,1 + u3 v1,2 p3,1,2 + u3 v2,1 p3,2,1
= [u1 (v2,3 − v3,2 ) + u2 (v3,1 − v1,3 ) + u3 (v1,2 − v2,1 )]p1,2,3.
Soient n ≥ 1 et k ≥ 0 des entiers.
% %
Définition. Si u = I∈C(n,k) uIpI et v = I∈C(n,k) vI pI sont deux élé-
[
ments de k (Rn , K), le produit scalaire (u|v) de u par v est l’élément de K
défini par $
(u|v) = uI vI ,
I∈C(n,k)
où vI est le conjugué de vI .

%
En particulier, si u = ni=1 ui pi est une 1-forme, on peut lui associer
%
biunivoquement l’élément u = (u1 , . . . , un) de Kn . Si alors v = ni=1 vi pi
est aussi une 1-forme, on voit que le produit scalaire (u|v) n’est rien d’autre
que le produit scalaire usuel (u|v) des éléments de Kn qui leur sont respec-
tivement associés. On vérifie sans peine les propriétés suivantes du produit
scalaire.
[
Proposition. Si u, v, w ∈ k (Rn , K), on a
1. (u|v) = (v|u)
2. (u + v|w) = (u|w) + (v|w)
3. Si c ∈ K, (cu|v) = c(u|v).
Soient n ≥ 1 et 0 ≤ k ≤ n des entiers.
% [
Définition. Si u = I∈C(n,k) uI pI ∈ k (Rn , K), l’adjointe (de Hodge) 7u
[
de u est l’élément de n−k (Rn , K) défini par
$
7u = !(I)uI pI∗ ,
I∈C(n,k)
où, pour chaque I = (i1 , . . . , ik ) ∈ C(n, k), on pose I∗ = (i∗1 , . . . , i∗n−k ),

où les 1 ≤ i∗1 < i∗2 < . . . < i∗n−k ≤ n sont tels que {i∗1 , . . . , i∗n−k } =
{1, 2, . . ., n} \ {i1 , . . . , ik }, tandis que !(I) est la signature de la permuta-
tion (i1 , . . . , ik , i∗1 , . . . , i∗n−k ) 2→ (1, 2, . . ., n).
Bien entendu, si u est une 0-forme de valeur constante u ∈ K cette
définition signifie que
7u = ūp1,...,n ,
et si u = u1,...,n p1,...,n est une n-forme, cette définition signifie que 7u est la
0-forme associée à l’élément u1,...,n de K.
On notera que (I∗ )∗ = I et que !(I∗ ) = (−1)k(n−k) !(I).
%
Exemple. Si u = 3i=1 ui pi , alors 7u = u1 p2,3 − u2 p1,3 + u3 p1,2 .
L’adjointe de Hodge est caractérisée par la propriété importante suivante,
qui relie les produits extérieur et scalaire.
[k
Proposition. Soient n ≥ 1 et 0 ≤ k ≤ n des entiers et soit u ∈ (Rn , K).
[
Alors 7u est l’unique élément de n−k (Rn, K) tel que l’on ait
v ∧ 7u = (v|u)p1,...,n (= 7(v|u) = 7(u|v)),

[k
pour tout v ∈ (Rn , K),
Démonstration. En vertu des propriétés des produits extérieur et scalai-

re, il suffit de démontrer le résultat pour des k-formes fondamentales u =
pI , I = (i1 , . . . , ik ) ∈ C(n, k) (u = 1 si k = 0) et v = pL , L = (l1 , . . ., lk ) ∈
C(n, k) (v = 1 si k = 0). Alors, laissant les cas particuliers k = 0 et k = n
au lecteur, on a 7u = !(I)pI∗ , et dès lors
v ∧ 7u = !(I)p(L,I∗)
et le second membre est égal à !(I)p(I,I∗) = p1,...,n si L = I, et est égal à zéro

si L /= I. D’autre part, (pI |pL ) est égal à zéro si L /= I, et à un si L = I, et
la formule s’en déduit aussitôt.Pour montrer l’unicité de l’élément vérifiant
la propriété de la proposition, on remarque que si w et z sont des éléments
[
de n−k (Rn , K) tels que l’on ait
v ∧ w = v ∧ z = (v|u)p1,...,n ,
[k
pour tout v ∈ (Rn , K), alors, pour ces v, on aura
v ∧ (w − z) = 0.
En posant
$
w−z= cIpI ,
I∈C(n,n−k)
et en prenant v = 7(w − z), on trouve alors
0 = 7(w − z) ∧ (w − z) = (−1)k(n−k) (w − z) ∧ [7(w − z)]

$
= (−1)k(n−k) (w − z|w − z)p1,...,n = (−1)k(n−k) |cI|2 p1,...,n ,
I∈C(n,k)
et donc w − z = 0.
L’adjointe d’une forme a les propriétés suivantes.
[k
Proposition. Si u, v ∈ (Rn , K) et si c ∈ K, on a
1. 7(cu) = c̄(7u)
2. 7(u + v) = 7u + 7v
3. 77u = (−1)k(n−k) u.
Démonstration. Les propriétés 1 et 2 sont évidentes. Pour la propriété
% %
3, si u = I∈C(n,k) uI pI, alors 7u = I∈C(n,k) !(I)uIpI∗ et
$ $
7(7u) = !(I∗ )!(I)uIpI∗∗ = (−1)k(n−k) uI pI = (−1)k(n−k) u.
%3 %3
Exemples. 1. Si u = i=1 ui pi et v = i=1 vi pi sont des éléments de
[1 3
(R , R), alors
u ∧ v = (u1 v2 − u2 v1 )p1,2 + (u1 v3 − u3 v1 )p1,3 + (u2 v3 − u3 v2 )p2,3 ,
et
7(u ∧ v) = (u1 v2 − u2 v1 )p3 − (u1 v3 − u3 v1 )p2 + (u2 v3 − u3 v2 )p1
= (u2 v3 − u3 v2 )p1 + (u3 v1 − u1 v3 )p2 + (u1 v2 − u2 v1 )p3 ,
qui est la 1-forme dans R3 associée au produit vectoriel u ∧ v des éléments u
et v de R3 naturellement associés à u et v.
2. Avec les mêmes notations que dans l’exemple 1, on a aussi
(7u) ∧ v = (u|v)p1,2,3 = u ∧ (7v)
ou encore
7[(7u) ∧ v] = 7[u ∧ (7v)] = (u|v).
15.6 Formes différentielles

Soit E ⊂ Rn un ouvert et f ∈ C 1 (E, K). En chaque point x ∈ E, la dérivée
totale fx$ de f est l’application linéaire de Rn dans K telle que
n
$ n
$
fx$ (h) = Di f (x) hi = Di f (x) pi(h).
i=1 i=1
%
En d’autres termes, pour chaque x ∈ E, fx$ = ni=1 Dif (x) pi ∈ L(Rn , K)
[
= 1 (Rn , K). En conséquence, l’application x 2→ fx$ peut être considérée
[
comme une application de E dans 1 (Rn , K). Il est utile de considérer, plus
[
généralement, des applications de E dans k (Rn , K).
Soit E ⊂ Rn non vide et k ≥ 1 un entier.
15.6. FORMES DIFFÉRENTIELLES 595
Définition. On appelle k-forme différentielle (extérieure) sur E toute ap-

[
plication ω de E dans k (Rn , K) de la forme
$
ω : x 2→ wI pI,
I∈B(n,k)
où, pour chaque I ∈ B(n, k), wI est une application de E dans K.

D’une manière équivalente, une k-forme différentielle sur E peut être
considérée comme une application de E × Rn × . . . × Rn = E × Rnk dans K
de la forme
$
ω(x; h1 , . . . , hk ) = wI(x)pI(h1 , . . . , hk ).
I∈B(n,k)
Ainsi, l’application ω définie par

ω(x1 , x2 , x3 ; h1 , h2 )) = x2 p1,2 (h1 , h2 ) + sin(x1 x2 x3 )p3,2 (h1 , h2 )
est une 2-forme dans R3 .
%
Si ω = I∈B(n,k) wI pI est une k-forme différentielle sur E, alors, pour
%
chaque x ∈ E, la k-forme extérieure ω(x) = I∈B(n,k) wI (x)pI possède
%
une écriture canonique unique I∈C(n,k) w̃I (x)pI. La k-forme différentielle
%
I∈C(n,k) w̃I pI est appelée l’écriture canonique de ω. Notons en particulier
qu’une 0-forme différentielle sur E sera identifiée à une application de E
dans K.
%
La k-forme différentielle ω = I∈C(n,k) wI pI sera dite réelle (resp. com-
plexe) si K = R (resp. C). Elle sera dite de classe C l (l ≥ 0, entier)
si, pour chaque I ∈ C(n, k), wI est de classe C l sur E. On désignera par
[
C l (E, k (Rn , K)) l’ensemble des k-formes différentielles (réelles pour K = R,
complexes pour K = C) de classe C l sur E.
On définit de façon naturelle les opérations d’addition, de multiplication
extérieure, de produit scalaire et d’adjointe de la manière suivante :
(ω + λ)(x) = ω(x) + λ(x), (gω)(x) = g(x)ω(x),
(ω ∧ µ)(x) = ω(x) ∧ µ(x), (ω|λ)(x) = (ω(x)|λ(x)), (7ω)(x) = 7(ω(x)),
pour tout x ∈ E, où ω et λ sont des k-formes différentielles sur E, µ une
l-forme différentielle sur E et g est une application de E dans K.
Exemples. 1. Une 1-forme différentielle réelle dans E ⊂ Rn s’écrit d’une
manière unique
n
$
ω= wipi ,
i=1
où les wi : E ⊂ Rn → R. Sa donnée correspond donc à celle d’un champ w

sur E, c’est-à-dire d’une application w : E ⊂ Rn → Rn . Réciproquement, à
un champ w sur E, on peut associer la 1-forme différentielle
n
$
1
ωw = wi pi .
i=1
Mais on peut également lui associer la (n-1)-forme différentielle

n
$
n−1
ωw = wip1,...,Ii,...,n ,
i=1
où (1, . . . , Ii, . . . , n) = (1, . . . , i − 1, i + 1, . . ., n), puisque chaque élément I ∈

C(n, n − 1) peut-être caractérisé par l’élément i de {1, 2, . . ., n} qu’il ne
contient pas.
%
2. La 1-forme différentielle ni=1 Dif pi introduite au début de ce para-
graphe est la 1-forme ωgrad 1
f
ou ω∇f
1
associée au champ gradient de f défini
par grad f = ∇f = (D1 f, . . . , Dn f ).
3. A une application f : E → K on peut non seulement associer la
0-forme différentielle correspondante, mais aussi la n-forme différentielle
ωfn = f p1,...,n .
Supposons maintenant que E ⊂ Rn soit un ouvert et que f ∈ C 1 (E, K).

On a vu que la notion de dérivée totale permet d’associer à f (ou à la 0-forme
différentielle correspondante) la 1-forme différentielle
n
$
Dif pi
i=1
que nous noterons df et appellerons la différentielle extérieure de f . Nous

étendrons comme suit cette notion aux k-formes différentielles de classe C 1
sur E.
%
Définition. Soit E ⊂ Rn un ouvert et ω = I∈C(n,k) wIpI une k-forme
différentielle de classe C 1 sur E. On appelle différentielle extérieure dω de ω
la (k+1)-forme différentielle de classe C 0 sur E définie par
$
dω = dwI ∧ pI ,
I∈C(n,k)
où les dwI sont donnés, conformément à ce qui précède, par

n
$
dwI = Di wIpi .
i=1
Explicitement, on a donc,
$ n
$
dω = Di wIp(i,I).
I∈C(n,k) i=1
En particulier, les dérivées partielles d’une fonction constante étant nulles,

on a
dpI = 0,
pour tout I ∈ C(n, k). D’autre part, en appliquant la définition de différen-
tielle extérieure à la projection sur la j e composante pj : Rn → R, considérée
ici comme une 0-forme dans Rn (ce que l’on traduit par l’emploi d’un symbole
en caractère non gras), on voit que
dpj = pj , (1 ≤ j ≤ n),
et, comme il est d’usage de commettre l’abus d’écriture qui consiste à rem-
placer pj par sa valeur xj en x, on écrit traditionnellement dxj au lieu de
dpj . Comme, par ailleurs, on sait que
pI = pi1 ,...,ik = pi1 ∧ . . . ∧ pik ,
on écrira, pour suivre la tradition,
pI = dxi1 ∧ . . . ∧ dxik = dxI ,
%
ce qui fournit, pour la k-forme différentielle ω = I∈B(n,k) wI pI , les nota-
tions usuelles $
wI dxI,
I∈B(n,k)
ou
n $
$ n n
$
... wi1,i2 ,...,ik dxi1 ∧ dxi2 ∧ . . . ∧ dxik .
i1 =1 i2 =1 ik =1
En particulier, on écrira
n
$ $
dwI = Di wI dxi , dω = dwI ∧ dxI.
i=1 I∈C(n,k)
La différentielle extérieure d’une forme possède les propriétés suivantes.

[
Proposition. Soit E ⊂ Rn un ouvert, k ≥ 0, l ≥ 0, ω ∈ C 1 (E, k (Rn , K)),
[ [ [
λ ∈ C 1 (E, k (Rn , K)), µ ∈ C 1 (E, l (Rn , K)), ν ∈ C 2 (E, k (Rn , K)), c ∈ K
et f ∈ C 1 (E, K). Alors, on a
[ [
1. ω + λ ∈ C 1 (E, k (Rn , K)), cω ∈ C 1 (E, k (Rn , K)) et
d(ω + λ) = dω + dλ, d(cω) = cdω.
[k
2. f ω ∈ C 1 (E, (Rn , K)) et
d(f ω) = df ∧ ω + f dω.
[k+l
3. ω ∧ µ ∈ C 1 (E, (Rn , K)) et
d(ω ∧ µ) = dω ∧ µ + (−1)k (ω ∧ dµ).
4. d2 ν = d(dν) = 0 (Théorème de Poincaré).

Démonstration. La propriété 1 est immédiate et il suffit dès lors de
démontrer la propriété 2 dans le cas où ω = wI dxI. Alors, f ω = f wI dxI ∈
[
C 1 (E, k (Rn , K)) et
n
$
d(f wIdxI) = d(f wI) ∧ dxI = Di (f wI)dxi ∧ dxI
i=1
n
$
= [(Dif )wI + f DiwI ]dxi ∧ dxI
i=1
n
$ n
$
= [Dif dxi ∧ wIdxI] + f Di wI dxi ∧ dxI = df ∧ ω + f dω.
i=1 i=1
Il suffit également de démontrer la propriété 3 lorsque ω = wI dxI et µ =

mJ dxJ. On a, par la propriété 2,
d(ω ∧ µ) = d(wImJ dx(I,J)) = d(wImJ ) ∧ dx(I,J) + wI mJd(dx(I,J))

n
$ n
$
= Di (wImJ)dxi ∧ dx(I,J) = (Di wI)mJ dxi ∧ dxI ∧ dxJ
i=1 i=1
n
& n
'
$ $
I J I
+ wI (DimJ )dxi ∧ dx ∧ dx = (DiwI)dxi ∧ dx ∧ mJ dxJ
i=1 i=1
& n
'
$
I J
+(−1) wIdx ∧
k
Di mJ dxi ∧ dx = dω ∧ µ + (−1)k ω ∧ dµ.
i=1
Enfin, il suffit de prouver la propriété 4 lorsque ν = wI dxI avec wI ∈

C 2 (E, K). On a, en utilisant les propriétés 1 et 3,
& n '
$
d ν = d(dwI
2
∧ dxI) = d(dwI ) ∧ dxI − dw I ∧ d(dxI) =d Di wI dxi ∧ dxI
i=1
 
n
$ n
$ n
$
I
= d(Di wI) ∧ dxi ∧ dx =  2
Dij wI dxj  ∧ dxi ∧ dxI
i=1 i=1 j=1
   
$ $
= 2
Dij wI dxj ∧ dxi  ∧ dxI +  2
Dij wI dxj ∧ dxi  ∧ dxI =
1≤i<j≤n 1≤j<i≤n
 
$
 (Dij
2 2
wI − Dji wI )dxj ∧ dxi  ∧ dxI = 0,
1≤i<j≤n
puisque Dij2 w = D 2 w . Dans l’avant-dernière ligne du calcul, on a remplacé

I ji I
i par j et j par i dans la deuxième somme et utilisé le fait que dxi ∧ dxj =
−dxj ∧ dxi.
Exemples. 1. Soit E ⊂ Rn un ouvert et f ∈ C 2 (E, R). On a vu plus haut
que
n
$
df = ωgrad
1
f = Di f dxi .
i=1
Dès lors,
n
$ n
$
7df = !(i) Dif dxi∗ = Z ∧ . . . ∧ dx ,
(−1)i−1 Dif dx1 ∧ . . . ∧ dx i n
i=1 i=1
Zi indique que le terme correspondant est absent. Par conséquent,

où dx
n
$
d 7 df = Z ∧ . . . ∧ dx
(−1)i−1d(Dif ) ∧ dx1 ∧ . . . ∧ dx i n
i=1
n
$ n
$
= (−1)i−1 2
Dij Zi ∧ . . . ∧ dxn
f dxj ∧ dx1 ∧ . . . ∧ dx
i=1 j=1
n
$
= (−1)i−1 Dii
2 Z ∧ . . . ∧ dx
f dxi ∧ dx1 ∧ . . . ∧ dx i n
i=1
& n
'
$
= 2
Dii f dx1 ∧ . . . ∧ dxn = ?f dx1 ∧ . . . ∧ dxn ,
i=1
%n
où ?f = i=1
2 f s’appelle le laplacien de f . On a donc aussi
Dii
7d 7 df = ?f.
%n [1
2. Soit ωw
1
= i=1 wi dxi ∈ C 1 (E, (Rn , R)), où E ⊂ Rn est ouvert.
Alors,
n
$ n $
$ n $
1
dωw = dwi ∧ dxi = Dj wi dxj ∧ dxi = Dj wi dxj ∧ dxi
i=1 i=1 j=1 1≤i<j≤n
$ $
+ Dj wi dxj ∧ dxi = (Diwj − Dj wi)dxi ∧ dxj .
1≤j<i≤n 1≤i<j≤n
En particulier, si n = 2,
1
dωw = (D1 w2 − D2 w1 )dx1 ∧ dx2 , 7dωw
1
= D1 w2 − D2 w1 .
Si n = 3,
1
7dωw = (D1 w2 − D2 w1 )dx3 − (D1 w3 − D3 w1 )dx2 + (D2 w3 − D3 w2 )dx1
= (D2 w3 − D3 w2 )dx1 + (D3 w1 − D1 w3 )dx2 + (D1 w2 − D2 w1 )dx3 = ωrot

1
w,
où l’opérateur différentiel rotationnel est défini par
rot w = (D2 w3 − D3 w2 , D3 w1 − D1 w3 , D1w2 − D2 w1 ),
et parfois noté symboliquement ∇ ∧ w. D’autre part,

n
$
1
7ωw = Z ∧ . . . ∧ dx ,
wi(−1)i−1 dx1 ∧ . . . ∧ dx i n
i=1
et n
$
1
d 7 ωw = Z ∧ . . . ∧ dx
(−1)i−1 dwi ∧ dx1 ∧ . . . ∧ dx i n
i=1
n
$ n
$
= (−1)i−1 Zi ∧ . . . ∧ dxn
Dj wi dxj ∧ dx1 ∧ . . . ∧ dx
i=1 j=1
n
$
= Z ∧ . . . ∧ dx
(−1)i−1 Di wi dxi ∧ dx1 ∧ . . . ∧ dx i n
i=1
& n
'
$
= Di wi dx1 ∧ . . . ∧ dxn = ωdiv
n
w,
i=1
où l’opérateur différentiel divergence est défini par

n
$
div w = Di wi ,
i=1
et parfois noté symboliquement (∇|w). La formule peut encore s’écrire

1
7d 7 ωw = div w.
L’opérateur 7d7 est appelé l’opérateur de codifférentiation extérieure et est

noté δ.
3. Si f ∈ C 2 (E, R) et w ∈ C 2 (E, R3), avec E ⊂ R3 ouvert, on aura, par
ce qui précède,
0 = 7d2 f = 7dωgrad
1
f = ωrot grad f ,
1
et donc
rot grad f = 0,
tandis que
0 = d2 ωw
1
= d(7 7 dωw
1
) = d(7ωrot
1
w ) = ωdiv rot w ,
3
et donc
div rot w = 0.
L’étude des propriétés des opérateurs différentiels gradient, divergence,
rotationnel et de leurs dérivés s’appelle l’analyse vectorielle. La théorie des
formes différentielles lui fournit un cadre général et systématique.
Si F ⊂ Rm et E ⊂ Rn sont des ouverts, si f ∈ C 1 (E, K) et g ∈ C 1 (F, E),
on sait, par le théorème de dérivation des fonctions composées, que f ◦ g ∈
C 1 (F, K) et que
d(f ◦ g)(y, h) = (f ◦ g)$y (h) = (fg(y)

$
◦ gy$ )(h)
   
m
$ n
$ m
$
= fg(y)
$
(gy$ (h)) = fg(y)
$  hj Dj g(y) = Di f (g(y))  Dj gi (y)hj 
j=1 i=1 j=1
n
$
= Di f (g(y))dgi(y, h),
i=1
pour tout y ∈ F et tout h ∈ R . On a donc
m
n
$
d(f ◦ g) = [(Dif ) ◦ g]dgi, (15.6)
i=1
et l’on voit qu’en définissant le changement de variables x = g(y) dans la

1-forme différentielle df par le membre de droite de (15.6), cette opération
commutera avec l’opération de différentiation extérieure. On est ainsi con-
duit à la définition suivante, dans le cas général.
[
Définition. Soient E ⊂ Rn , ω ∈ C 0 (E, k (Rn , K)), où n, k ≥ 1 sont des
entiers, F ⊂ Rm et g ∈ C 1 (F, E). La transformée par g de
$
ω= wIdxI
I∈C(n,k)
[k
est l’élément g ∗ ω de C 0 (F, (Rm, K)) défini par
$
g ∗ω = (wI ◦ g)dgI,
I∈C(n,k)
où, si dxI = dxi1 ∧ . . . ∧ dxik , on a posé

   
m
$ m
$
dgI = dgi1 ∧ . . . ∧ dgik =  Dj1 gi1 dyj1  ∧ . . . ∧  Djk gik dyjk  ,
j1 =1 jk =1
les dyj désignant les 1-formes fondamentales dans Rm . Si f ∈ C 0 (E, K), la

transformée par g de f (considérée comme 0-forme) est définie par
g ∗ f = f ◦ g,
c’est-à-dire par le composé de f avec g.

La transformée possède les propriétés suivantes.
[
Proposition. Soient E ⊂ Rn , F ⊂ Rm des ouverts, ω ∈ C 0 (E, k (Rn , K)),
[ [
λ ∈ C 0 (E, k (Rn, K)), µ ∈ C 0 (E, l (Rn , K)), f ∈ C 0 (E, K) et g ∈ C 1 (F, E).
Alors, on a
1. g ∗ (ω + λ) = g ∗ ω + g ∗ λ
2. g ∗ (f ω) = (f ◦ g)g ∗ω
3. g ∗ (ω ∧ µ) = g ∗ ω ∧ g ∗ µ
4. Si f ∈ C 1 (E, K), d(g ∗f ) = g ∗ (df )
[
5. Si ω ∈ C 1 (E, k (Rn , K)), k ≥ 1 et g ∈ C 2 (F, E),
d(g ∗ω) = g ∗ dω.
6. Si G ⊂ Rl est un ouvert et h ∈ C 1 (G, F ),
(g ◦ h)∗ ω = h∗ (g ∗ω).
Démonstration. Les propriétés 1 à 3 sont des conséquences immédiates

de la définition et la propriété 4 est une écriture différente de (15.6). Elles
impliquent qu’il suffit de démontrer les propriétés 5 et 6 pour ω = wIdxI où
I ∈ C(n, k). Pour la propriété 5, on a
d(g ∗ (wIdxI )) = d[(wI ◦ g)dgi1 ∧ . . . ∧ dgik ]
= d(wI ◦ g) ∧ dgi1 ∧ . . . ∧ dgik + (wI ◦ g)d2 gi1 ∧ dgi2 ∧ . . . ∧ dgik
−(wI ◦ g)dgi1 ∧ d2 gi2 ∧ . . .∧ dgik + . . .+ (−1)k−1(wI ◦ g)dgi1 ∧ dgi2 ∧ . . .∧ d2 gik .

Du théorème de Poincaré et de la propriété 4, on déduit
d(g ∗(wIdxI )) = d(g ∗wI) ∧ dgI = g ∗ dwI ∧ g ∗ (dxI) = g ∗ (dwI ∧ dxI) = g ∗ (dω).
Pour la propriété 6, on a
(g ◦ h)∗ ω = (wI ◦ g ◦ h)d(g ◦ h)I
et
h∗ (g ∗ ω) = h∗ ((wI ◦ g)dgI) = (wI ◦ g ◦ h)h∗ dgI .
Comme
d(g ◦ h)I = d(g ◦ h)i1 ∧ . . . ∧ d(g ◦ h)ik = d(gi1 ◦ h) ∧ . . . ∧ d(gik ◦ h),
et
h∗ dgI = h∗ (dgi1 ∧ . . . ∧ dgik ) = h∗ dgi1 ∧ . . . ∧ h∗ dgik ,
la thèse découle de la propriété 4.
Le résultat qui suit montre le lien entre les formes différentielles et les
intégrands liés à la circulation et au flux d’un champ de vecteurs.
Proposition. Si E ⊂ Rn ,
% I [k
ω= I∈C(n,k) wI dx ∈ C 0 (E, (Rn , K)),
k ≥ 1, F ⊂ Rk et g ∈ C 1 (F, E), alors

 
$
∗
g ω= (wI ◦ g)J(g)  dy1 ∧ . . . ∧ dyk ,
I
I∈C(n,k)
où J(g) désigne le Jacobien de (g)I = (gi1 , . . . , gik ), c’est-à-dire

I
 # #
D1 (g)I # D g . . . D1 gik #
# 1 i1 #
  # #
 D2 (g)I  # D2 gi1 . . . D2 gik #
J(g) = det 
 .. =#
 # .. .. .. #.
#
I  .  # . . . #
# #
Dk (g)I # Dk gi1 . . . Dk gik #
En particulier, si n = k et ω = dx1 ∧ . . . ∧ dxn , alors
dg1 ∧ . . . ∧ dgn = Jg dy1 ∧ . . . dyn .
Démonstration. Comme
$
g ∗ω = (wI ◦ g)dgI,
I∈C(n,k)
il suffit de prouver que
dgI = J(g) dy1 ∧ . . . ∧ dyk .

I
On a
dgI = dgi1 ∧ . . . ∧ dgik
   
k
$ k
$
= Dj1 gi1 dyj1  ∧ . . . ∧  Djk gik dyjk 
j1 =1 jk =1
$
= (Dj1 gi1 ) . . . (Djk gik ) dyj1 ∧ . . . ∧ dyjk
J=(j1 ,...,jk )∈B(k,k)
$
= (Dj1 gi1 ) . . . (Djk gik ) dyj1 ∧ . . . ∧ dyjk
J∈A(k,k)
 
$
= sign J (Dj1 gi1 ) . . .(Djk gik ) dy1 ∧ . . . ∧ dyk ,
J∈A(k,k)
15.7. INTÉGRALE D’UNE FORME SUR UNE CHAı̂NE 605
où sign J est la signature de la permutation J = (j1 , . . . , jk ) de (1, . . ., k).

Comme A(k, k) constitue l’ensemble des permutations de {1, 2, . . ., k}, on
déduit de la théorie des déterminants que
dgI = J(g) dy1 ∧ . . . ∧ dyk ,

I

Remarque. Dans les conditions de la Proposition ci-dessus, on a donc
$
7(g ∗ω) = (wI ◦ g)J(g) ,
I
I∈C(n,k)
si l’on pose
$
ω= wIdxI .
I∈C(n,k)
15.7 Intégrale d’une forme sur une chaı̂ne

Soit k ≥ 1 un entier, U = [0, 1], U k = U × . . . × U (k fois), E ⊂ Rn et r ≥ 1
un entier.
Définition. Un k-simplexe dans E de classe C r est une application Φ :
U k → E de classe C r sur U k .
Un 1-simplexe dans E de classe C r est également appelé un chemin
dans E de classe C r . Lorsque n = 3, l’image Φ(U ) d’un 1-simplexe dans
E correspond à la notion géométrique intuitive d’un arc de courbe contenu
dans E et l’image Φ(U 2 ) d’un 2-simplexe dans E correspond à la notion
géométrique intuitive d’un élément de surface contenu dans E. Bien entendu,
puisque nous n’imposons pas de propriété d’injectivité à Φ, l’arc de courbe
peut “dégénérer” en un point, et l’élément de surface “dégénérer” en un arc
de courbe ou en un point.
Définition. Un 0-simplexe dans E est une application Φ : {0} → E.
On peut donc identifier un 0-simplexe dans E à sa valeur unique a =
Φ(0) ∈ E, c’est-à-dire à un élément de E.
On désignera par Skr (E) l’ensemble des k-simplexes dans E de classe
C . Pour k = 0, cela n’a de sens que pour r = 0 et l’ensemble S0 (E) des
r
0-simplexes dans E peut être identifié à E.

Définition. Si k ≥ 1, Φ ∈ Sk1 (E) et

% I [k
ω= I∈C(n,k) wI dx ∈ C 0 (E, (Rn , K)),
on appelle intégrale de ω sur Φ l’élément de K défini par
J J $ $ J
7(Φ∗ ω̄) = (wI ◦ Φ)J(Φ) = (wI ◦ Φ)J(Φ) .
Uk Uk I k I
I∈C(n,k) I∈C(n,k) U
Si k = 0, Φ ∈ S0 (E), avec Φ(0) = a ∈ E, et f ∈ C 0 (E, K) est considérée

comme 0-forme sur E, on appelle intégrale de f sur Φ l’élément de K défini
par
Φ∗ f (0) = f (Φ(0)) = f (a).
Les intégrales ainsi définies généralisent évidemment celles de circulation
le long d’un arc de courbe et de flux à travers un élément de surface, qui
correspondent respectivement à k = 1, ω = ωw 1 , w ∈ C 0 (E, Rn) et à k =
2, n = 3, ω = 7ωw , w ∈ C (E, R ). Si a < b, Φ : [0, 1] → R, u 2→ a + u(b − a)

1 0 3
[
est le 1-simplexe affine d’image [a, b], et si ω = w dx ∈ C 0 ([a, b], 1 (R1 , K)),
alors, en utilisant le théorème de changement de variable dans une intégrale
simple, on trouve
J J 1 J b
∗ $
7(Φ ω) = (w ◦ Φ) Φ = w,
[0,1] 0 a
et la notion se réduit donc au concept classique d’intégrale de w sur [a, b].

Notons que si Φ a au plus (k − 1) composantes non constantes ou ne
dépend pas effectivement d’une des variables (donc en particulier si Φ est
[
constante), l’intégrale de ω sur Φ est nulle pour tout ω ∈ C 0 (E, k (Rn , K)).
Cela résulte immédiatement de l’annulation, dans ces conditions, de tous les
jacobiens qui apparaissent dans l’intégrale.
On déduit aussitôt de la définition et de la linéarité de l’intégrale d’une
fonction, que si
[k [k
Φ ∈ Sk1 (E), ω ∈ C 0 (E, (Rn , K)), c ∈ K et λ ∈ C 0 (E, (Rn , K)),
on a J J J
∗ ∗
7[Φ (ω + λ)] = 7(Φ ω) + 7(Φ∗ λ),
Uk Uk Uk
J 4J 5
7(Φ∗ (cω)) = c 7(Φ∗ω) .
Uk Uk
En conséquence, à chaque Φ ∈ Sk1 (E), on peut associer la forme linéaire Φ
[k n
sur l’espace vectoriel C 0 (E, (R , K)) des k-formes différentielles dans E,
définie par
[k H
Φ : C 0 (E, (Rn , K)) → K, ω 2→ Φ(ω) = Uk 7(Φ∗ ω).
Pour rappeler sa construction, on écrira

J
ω
Φ
au lieu de Φ(ω), ce qui fournit une notation concise pour l’intégrale de ω sur
Φ. Par extension, on appellera également Φ un k-simplexe et l’on parlera de
l’intégrale de ω sur Φ. On peut combiner linéairement ces formes linéaires:
%
si cj ∈ R et Φj ∈ Sk1 (E), (1 ≤ j ≤ m), la forme linéaire m j=1 cj Φ sur
j
[k n
C (E, (R , K)) est définie de manière usuelle par
0
%m [k %m %m H
j=1 cj Φ
j : C 0 (E, (Rn , K) → K, ω 2→ j=1 cj Φ
j (ω) = j=1 Φj ω.
On notera qu’une même forme linéaire peut correspondre à des k-sim-

[
plexes différents. Ainsi, si O désigne la forme nulle sur C 0 (E, k (Rn , K)),
[
(c’est-à-dire la forme telle que O(ω) = 0 pour tout ω ∈ C 0 (E, k (Rn , K)),
on a vu plus haut que Φ = 0 pour n’importe quel Φ ∈ Sk1 (E) ayant au plus
k − 1 composantes non constantes ou ne dépendant que de k − 1 variables.
Un autre exemple important est le suivant, qui permet aussi de donner une
interprétation géométrique à la forme linéaire −Φ.
Définition. Si Φ ∈ Sk1 (E), k ≥ 1, on appelle reparamétrisation de Φ tout
Ψ ∈ Sk1 (E) qui peut s’écrire Ψ = Φ ◦ t où, V étant un ouvert contenant U k ,
t : V → t(V ) ⊂ Rk est un difféomorphisme tel que t(U k ) = U k .
Donc, si Ψ est une reparamétrisation de Φ, on a Ψ(U k ) = Φ(U k ). Nous
poserons sign Jt = +1 si Jt > 0 sur V et sign Jt = −1 si Jt < 0 sur V.
[k
Proposition. Si Φ ∈ Sk1 (E), ω ∈ C 0 (E, (Rn , K)) et si Ψ est une repara-
métrisation de Φ, avec Ψ = Φ ◦ t, on a
J J
ω = sign Jt ω.
Ψ Φ
Démonstration. Par la linéarité de l’intégrale, il suffit de démontrer le

résultat pour ω = wIdxI . On a
J J J
wIdxI = wIdxI = (wI ◦ Φ ◦ t)J(Φ◦t)
Ψ Φ◦ t Uk I
J J
= (wI ◦ Φ ◦ t)J(Φ) = (wI ◦ Φ ◦ t)(J(Φ) ◦ t)Jt
Uk I ◦t Uk I
J
= sign Jt (wI ◦ Φ ◦ t)(J(Φ) ◦ t)|Jt |
t−1 (U k ) I
J J
= signJt (wI ◦ Φ)J(Φ) = sign Jt wIdxI ,
Uk I Φ
où l’on a utilisé le fait que
J(Φ) (s) = det((Φ)I ◦ t)$s = det[((Φ)$I)t(s) ◦ t$s ] =

I ◦t
[det((Φ)$I)t(s)][det t$s ] = (J(Φ) (t(s))).(Jt(s)),

I
et le théorème de changement de variables dans les intégrales.
Cette proposition permet de partitionner l’ensemble des reparamétrisa-
tions de Φ en deux classes correspondant à sign Jt = +1 (c’est la classe
contenant Φ) et à sign Jt = −1. L’intégrale d’une k-forme différentielle sur
deux éléments d’une même classe donnera le même résultat, tandis que les
intégrales sur des représentants de classes différentes ne différeront que par
le signe. Si Φ et Ψ appartiennent à la même classe, on dira qu’ils ont même
orientation; sinon, on dira qu’ils ont des orientations opposées. Dès lors, la
forme linéaire −Φ peut s’interpréter comme correspondant à Φ muni d’une
orientation opposée.
La terminologie “orientation” est motivée par les exemples suivants. Si
Φ ∈ S11 (E) et si t : U → U, u 2→ 1 − u, alors t$ (u) = Jt (u) = −1, et
Φ ◦ t = Φ; d’autre part, lorsque u “parcourt [0, 1] de 0 à 1”, Φ(u) et Φ(1 − u)
“parcourent Φ(U ) dans des sens opposés”. Si Φ ∈ S21 (E), avec E ⊂ R3 , et si
t : U 2 → U 2 , (u1 , u2 ) 2→ (u2 , u1 ), alors Jt (u1 , u2 ) = −1 et Φ ◦ t = −Φ. On a
d’autre part
D1 (Φ ◦ t)(u1 , u2 ) = D2 Φ(u2 , u1 ),
D2 (Φ ◦ t)(u1 , u2 ) = D1 Φ(u2 , u1 ),
et dès lors, en tout point x = (Φ◦t)(u1, u2 ) = Φ(u2 , u1 ) de Φ(U 2 ) = Φ◦t(U 2 ),
les normales respectives
D1 (Φ ◦ t)(u1 , u2 ) ∧ D2 (Φ ◦ t)(u1 , u2)
et
D1 Φ(u2 , u1 ) ∧ D2 Φ(u2 , u1 )
(où ∧ désigne ici le produit vectoriel dans R3 ) seront de sens opposés, ce qui
rejoint la notion intuitive d’orientation opposée pour deux surfaces dans R3
ayant la même image.
Dans le cas du 0-simplexe Φ tel que Φ(0) = a, on a évidemment

J J
f = −Φ(f ) = − f = −f (a).
−Φ Φ
Nous aurons besoin dans la suite de la généralisation suivante de la notion

de k-simplexe.
Définition. Une k-chaı̂ne dans E de classe C r est une forme linéaire sur
[
C(E, k (Rn , K)) du type
m
$
ni Φi ,
i=1
où les ni ∈ Z et où les Φ ∈ Skr (E), (1 ≤ i ≤ m).

i
% !m
L’image de la k-chaine m i=1 ni Φ sera par définition
i
i=1 Φi (U k ), et
l’ensemble des k-chaı̂nes dans E de classe C r sera noté Crk (E).
Un exemple important de 1-chaı̂ne dans E ⊂ R est le suivant. Soit
n
r ≥ 1 un entier.
Définition. On appelle chemin dans E de classe C r par morceaux toute
%
1-chaı̂ne mi=1 Φ dans E de classe C telle que
i r
Φi (1) = Φi+1 (0), 1 ≤ i ≤ m − 1.
Un chemin sera dit fermé ou sera appelé un cycle dans E de classe C r par
morceaux si, en outre,
Φm (1) = Φ1 (0).
La terminologie s’explique aisément si l’on traduit géométriquement les
conditions de la définition sur l’image du chemin.
La définition d’intégrale d’une k-forme différentielle sur une k-chaı̂ne est
un cas particulier de la combinaison linéaire des formes linéaires associées à
des k-simplexes.
% [k
Définition. Si mi=1 ni Φ ∈ Ck (E) et ω ∈ C (E, (Rn , K)), l’intégrale de
i r 0
%m
ω sur i=1 ni Φ est définie par
i
J m
$ J
%m ω= ni ω.
i=1
ni Φi i=1 Φi
La notion de chaı̂ne permet d’introduire l’important concept de bord d’un

k-simplexe (et ensuite d’une k-chaı̂ne), qui fournit un support analytique, et
sans restriction sur la dimension, à la notion intuitive de frontière orientée
de figures simples de R2 ou R3 .
Définition. Si k ≥ 2 est un entier, 1 ≤ j ≤ k et α ∈ {0, 1}, l’application

face (j, α) est définie par
F j,α : U k−1 → U k , (u1, . . . , uk−1 ) 2→ (u1 , . . . , uj−1 , α, uj , . . . , uk−1).
Pour k = 1, l’application face (1, α) est définie par
F 1,α : U 0 = {0} → U 1 , 0 2→ α.
Ainsi, pour k = 2, les images des applications “faces (j, α)” (j = 1, 2; α =

0, 1) fournissent les quatre côtés du carré U 2 .
Définition. Si Φ ∈ Skr (E), avec E ⊂ Rn et r ≥ 1 entier, on appelle bord de
Φ, et l’on note ∂Φ la (k-1)-chaı̂ne dans E de classe C r définie par
k $
$ 1
∂Φ = (−1)j+α Φj,α ,
j=1 α=0
où Φj,α est la forme linéaire associée au (k-1)-simplexe Φ ◦ F j,α .

Exemples. 1. Soit k = 1 et Φ ∈ S1r (E). Alors,
1
$
∂Φ = (−1)1+αΦ1,α = Φ(1) − Φ(0)
α=0
si l’on identifie un 0-simplexe à son image.

2. Soit n = 2, k = 2 et I : U 2 → R2 , u 2→ u l’injection canonique. Alors,
2 $
$ 1
∂I = (−1)j+α Fj,α.
j=1 α=0
On a F 1,0 (u) = (0, u), F 1,1(u) = (1, u), F 2,0(u) = (u, 0), F 2,1(u) = (u, 1),
et dès lors, en vertu des remarques faites sur l’orientation, on peut prendre
respectivement pour −F1,0 , −F2,1 , F1,1 et F2,0 les formes linéaires associées
aux 1-simplexes définis par u 2→ (0, 1 − u), u 2→ (1 − u, 1), u 2→ (1, u) et
u 2→ (u, 0). Lorsque le paramètre u décrit U = [0, 1] monotonément de 0 à
1, l’image de la première application décrit le segment orienté joignant e2 à
0 dans R2 , l’image de la deuxième décrit le segment orienté joignant 0 à e1 ,
l’image de la troisième décrit le segment orienté joignant e1 à (1, 1) et l’image
de la quatrième décrit le segment orienté joignant (1, 1) à e2 . La frontière
fr U 2 de l’image U 2 de I est donc parcourue en laissant l’intérieur de U 2 à
gauche. On voit que ∂I munit la frontière fr I(U ) d’une orientation.
3. Il résulte aussitôt de calculs analogues à ceux de l’exemple 2 que si Φ

est un 2-simplexe dans E ⊂ Rn , son bord ∂Φ écrit dans l’ordre suivant
∂Φ = Φ2,0 + Φ1,1 − Φ2,1 − Φ1,0
est un cycle dans E de classe C 1 par morceaux.

4. Soit n = 3, k = 3 et Σ : U 3 → R3 ,
(u, v, w) 2→ (ur cos 2πv sin πw, ur sin 2πv sin πw, ur cos πw)
un k-simplexe dont l’image est la boule fermée dans R3 de centre 0 et de

rayon r. On trouve sans peine que
Σ1,0 (v, w) = (0, 0, 0),
Σ1,1 (v, w) = (r cos 2πv sin πw, r sin 2πv sin πw, r cos πw),
Σ2,0 (u, w) = (ur sin πw, 0, ur cos πw), Σ2,1 = Σ2,0,
Σ3,0 (u, v) = (0, 0, ur), Σ3,1 = Σ3,0 .
Dès lors, ∂Σ = Σ1,1 , et Σ1,1 est une 2-chaı̂ne dans R3 dont l’image est la
sphère de centre 0 et de rayon r.
La définition du bord s’étend sans peine à une k-chaı̂ne.
% %m
Définition. Si m i=1 ni Φ ∈ Ck (E), avec E ⊂ R , le bord ∂( ni Φi ) de
i r n
%m i=1
i=1 ni Φ est la (k-1)-chaı̂ne dans E de classe C définie par
i r
& m
' m m $
k $
1
$ $ $
∂ ni Φ i
= ni ∂Φi = (−1)j+αni Φi,j,α ,
i=1 i=1 i=1 j=1 α=0
[k
où Φi,j,α est la forme linéaire sur C 0 (E, (Rn , K) associée à Φi ◦ F j,α .
%m
Exemple. Soit i=1 Φi un chemin dans E de classe C 1 par morceaux.
Alors, & '
m
$ m
$ m
$
∂ Φ i
= ∂Φi = [Φi(1) − Φi (0)] =
i=1 i=1 i=1
m−1
$ m
$
= Φi+1 (0) + Φm (1) − Φi(0) = Φm (1) − Φ1 (0),
i=1 i=1
si l’on identifie de nouveau un 0-simplexe à son image.

Une propriété importante du bord est la suivante.
Proposition. Si Φ ∈ Sk1 (E), où k ≥ 2 et E ⊂ Rn , alors ∂(∂Φ) = O.

Démonstration. Soient
F j,α : U k−1 → U k , α = 0, 1, 1 ≤ j ≤ k,
et
Gl,β : U k−2 → U k−1 , β = 0, 1, 1 ≤ l ≤ k − 1,
les applications faces (avec des notations distinctes puisque les dimensions
sont distinctes). On vérifie aisément, à partir des définitions, que
F j,α ◦ Gl,β = F l,β ◦ Gj−1,α
si k ≥ j > l ≥ 1, 0 ≤ α, β ≤ 1. Dès lors,

 
1 $
$ k 1 $
$ k
∂(∂Φ) = ∂  (−1)α+j Φ ◦ Fj,α = (−1)α+j ∂(Φ ◦ Fj,α)
α=0 j=1 α=0 j=1
1 $
$ k 1 k−1
$ $
= (−1)α+j (−1)β+l Φ ◦ Fj,α ◦ Gl,β
α=0 j=1 β=0 l=1
$ k j−1
1 $ $
= (−1)α+β+j+l Φ ◦ Fj,α ◦ Gl,β
α,β=0 j=2 l=1
1 $
$ k k−1
$
+ (−1)α+β+j+l Φ ◦ Fj,α ◦ Gl,β
α,β=0 j=1 l=j
$ k j−1
1 $ $
= (−1)α+β+j+l Φ ◦ Fl,β ◦ Gj−1,α
α,β=0 j=2 l=1
1 $
$ k k−1
$
+ (−1)α+β+j+l Φ ◦ Fj,α ◦ Gl,β
α,β=0 j=1 l=j

1
$ k−1
$$ j
=  (−1)α+β+j+l+1 Φ ◦ Fl,β ◦ Gj,α
α,β=0 j=1 l=1

k−1
$ k−1
$
+ (−1)α+β+j+l Φ ◦ Fj,α ◦ Gl,β 
j=1 l=j
15.8. THÉORÈME DE STOKES-CARTAN 613

1
$ k−1
$ k−1
$
=  (−1)α+β+j+l+1 Φ ◦ Fj,α ◦ Gl,β
α,β=0 j=1 l=j

k−1
$ k−1
$
+ (−1)α+β+j+l Φ ◦ Fj,α ◦ Gl,β 
j=1 l=j
1 k−1
$ $ k−1
$
= (−1)α+β+j+l [Φ ◦ Fj,α ◦ Gl,β − Φ ◦ Fj,α ◦ Gl,β ],
α,β=0 j=1 l=j
et la Proposition s’en déduit aussitôt.

Le résultat s’étend trivialement aux k-chaı̂nes.
Proposition. Si Φ ∈ C1k (E), k ≥ 2 et E ⊂ Rn , alors ∂(∂Φ) = O.
15.8 Théorème de Stokes-Cartan

Le résultat central de la théorie des formes différentielles est le théorème de
Stokes-Cartan, qui étend aux intégrales multiples le théorème fondamental
du calcul différentiel et intégral.
Nous énoncerons et démontrerons d’abord le théorème de Stokes-
Cartan pour les 0-formes et les 1-chaı̂nes.
Théorème. Soit E ⊂ Rn une partie non vide, f ∈ C 1 (E, K) (considérée
%
comme 0-forme) et Φ = mi=1 ni Φ ∈ C1 (E). Alors,
i 1
J J
df = f.
Φ ∂Φ
J m J & n
'
$ $
df = ni Dk f dxk
Φ i=1 Φi k=1
m J , n
- m J
$ 1 $ $ 1
= ni (Dk f ◦ Φ i
)(Φik )$ = ni (f ◦ Φi )$
i=1 0 k=1 i=1 0
m
$ J J
= ni [f (Φi(1)) − f (Φi(0))] = %m f= f.
i=1 i=1
ni ∂ Φi ∂Φ
Donnons maintenant le théorème de Stokes-Cartan pour les (k-1)-

formes et les k-chaı̂nes lorsque k ≥ 2.
Théorème. Soit E ⊂ Rn une partie non vide, k ≥ 2 un entier,
[k−1
ω ∈ C 1 (E, (Rn , K))
%m
et Φ = i=1 ni Φi ∈ C2k (E). Alors, on a
J J
dω = ω.
Φ ∂Φ
Démonstration. En vertu des définitions de bord et d’intégrale d’une

forme différentielle sur une chaı̂ne, il suffit de prouver le théorème pour un
k-simplexe Φ ∈ Sk2 (E). Comme Φ est de classe C 2 , on a
J J J
dω = 7Φ∗ (dω) = 7d(Φ∗ω),
Φ Uk Uk
[k−1
où Φ∗ ω ∈ C 1 (U k , (Rk , K)). D’autre part, on a
J J
ω = %k %1 ω
∂Φ j=1 α=0
(−1)j+α Φj,α
k $
$ 1 J
= (−1)j+α 7(Φ ◦ F j,α )∗ ω
j=1 α=0 U k−1
k $
$ 1 J
= (−1) j+α
7(F j,α )∗ (Φ∗ ω).
j=1 α=0 U k−1
[k−1
Il suffit donc de prouver que, pour tout λ ∈ C 1 (U k , (Rk , K)), on a
J k $
$ 1 J
7dλ = (−1)j+α 7(F j,α )∗ λ,
Uk j=1 α=0 U k−1
et comme un tel λ peut s’écrire

k
$
Zi ∧ . . . ∧ dxk ,
li dx1 ∧ . . . ∧ dx
i=1
il suffit, par linéarité, de considérer le cas particulier où λ est de la forme

Z ∧ . . . ∧ dx ,
λ = li dx1 ∧ . . . ∧ dx i k
avec li ∈ C 1 (U k , R).
Dans ce cas, on a
& k
'
$
dλ = Z ∧ . . . ∧ dx
Dm li dxm ∧ dx1 ∧ . . . ∧ dx i k
m=1
Zi ∧ . . . ∧ dxk = (−1)i−1 Di li dx1 ∧ . . . ∧ dxk ,

= Dili dxi ∧ dx1 ∧ . . . ∧ dx
et
7dλ = (−1)i−1 Di li.
Par conséquent, par le théorème de Fubini et le théorème fondamental du
calcul différentiel et intégral, on trouve
J J
7dλ = (−1)i−1 Di li
Uk Uk
J 2J 1 3
= (−1)i−1 Z . . . du
Di li(u1 , . . . , ui, . . . , uk ) dui du1 . . . du i k
U k−1 0
J
= (−1)i−1 Z . . . du .
[li(u1 , . . ., 1, . . ., uk )−li(u1 , . . . , 0, . . ., uk )]du1 . . . du i k
U k−1
D’autre part,
k $
$ 1 J
(−1)j+α 7(F j,α )∗ λ
j=1 α=0 U k−1
k $
$ 1 J
= (−1)j+α (li ◦ F j,α )J .
,...,FZ
j,α j,α j,α
U k−1 (F1 i ,...,Fk )
j=1 α=0
Or, comme Fjj,α (u1 , . . . , uk−1 ) = α pour tout u ∈ U k−1 , on a
J = 0,
,...,FZ
j,α j,α j,α
(F1 i ,...,Fk )
si j /= i, tandis que, si j = i, on a
Z
(F1i,α , . . . , Fii,α , . . . , Fki,α)(u) = (u1 , . . . , uk−1 ) = u,
et
J Z = 1.
(F1i,α ,...,F i,α i,α
i ,...,Fk )
Dès lors,
k $
$ 1 J 1
$ J
∗
(−1)j+α 7(F j,α) λ = (−1)i+α (li ◦ F i,α )
j=1 α=0 U k−1 α=0 U k−1
J
= (−1)i−1 [li(u1 , . . . , uj−1 , 1, uj , . . ., uk−1 )
U k−1
−li (u1 , . . ., uj−1 , 0, uj , . . . , uk−1 )] du1 . . . duk−1 ,
et le théorème est démontré.
Remarque. Les deux membres de l’égalité exprimant le théorème de Stokes-
Cartan ont un sens sous la seule hypothèse que la forme et la k-chaı̂ne soient
de classe C 1 . On peut donc se poser la question de la nécessité de l’hypothèse
que la chaı̂ne soit de classe C 2 (lorsque k ≥ 2) que notre démonstration
impose. Un procédé d’approximations que nous ne développerons pas ici,
montre que le théorème de Stokes-Cartan est valide pour des chaı̂nes de
classe C 1 .
Donnons maintenant quelques cas particuliers importants du théorème
de Stokes-Cartan.
1. k = 1 : circulation d’un champ gradient.
%
Soit Φ = m i=1 Φ un chemin dans E ⊂ R de classe C par morceaux et
i n 1
f ∈ C 1 (E, K) une 0-forme différentielle sur E. On a donc, par le théorème

de Stokes-Cartan,
J J
df = f = f (Φm (1)) − f (Φ1 (0)),
Φ ∂Φ
en utilisant un résultat antérieur sur le calcul de ∂Φ. D’autre part, df =

1
ωgrad f
, et dès lors, si C est la courbe formée des arcs de courbe images du
chemin Φ dans E , le résultat peut s’écrire, en langage vectoriel
J
(grad f |dT (Φ)) = f (Φm (1)) − f (Φ1 (0)),
C
ce qui montre que l’intégrale d’un champ gradient sur E le long d’un chemin
dans E ne dépend que des extrémités Φ1 (0) et Φm (1) du chemin, et non du
chemin lui-même.
2. n = 2, k = 2 : formule de Green-Riemann
Soit A ⊂ R2 telle que A = Φ(U 2 ), où Φ : F → Φ(F ) est un difféomor-
phisme de classe C 2 de l’ouvert F ⊂ R2 sur l’ouvert E = Φ(F ), tel que
JΦ > 0 sur F , et soit w un champ dans R2 de classe C 1 sur E. On peut lui

associer la 1-forme différentielle sur E
1
ωw = w1 dx1 + w2 dx2 ,
telle que
1
dωw = (D1 w2 − D2 w1 ) dx1 ∧ dx2 .
Les conditions du théorème de Stokes-Cartan sont satisfaites pour ωw 1
et
pour le 2-simplexe dans E constitué par la restriction de Φ à U , que nous
2
noterons encore Φ. On obtient

J J
1
dωw = 1
ωw .
Φ ∂Φ
Mais, en vertu de la définition de l’intégrale d’une forme et du théorème de

changement de variables dans une intégrale double, on trouve
J J
1
dωw = [(D1w2 − D2 w1 ) ◦ Φ]JΦ
Φ U2
J J
= [(D1w2 − D2 w1 ) ◦ Φ]|JΦ | = (D1 w2 − D2 w1 )
U2 Φ(U 2 )
J
= (D1 w2 − D2 w1 ).
A
D’autre part, on a vu plus haut que le bord ∂Φ de Φ est un cycle dans E
de classe C 2 par morceaux, et dès lors
J
1
ωw
∂Φ
représente la circulation du champ w le long de l’union des arcs de courbe

formés par l’image du cycle. En langage vectoriel, on obtient donc la for-
mule de Green-Riemann
J J
(D1 w2 − D2 w1 ) = (w|dT (∂Φ)),
A C
où C désigne l’image du cycle ∂Φ.

3. n = 3, k = 2 : formule de Stokes-Ampère ou de la circulation
Soit S un élément de surface simple dans R3 dont la représentation
paramétrique est la restriction à U 2 d’un difféomorphisme Σ : F → Σ(F ) ⊂
R3 de classe C 2 de l’ouvert F tel que U 2 ⊂ F ⊂ R2 sur l’ouvert E = Σ(F ).
Soit w un champ dans R3 , de classe C 1 sur E. On peut associer à w la

1-forme différentielle sur E
1
ωw = w1 dx1 + w2 dx2 + w3 dx3 ,
et l’on sait que

1
7dωw = ωrot
1
w,
et donc
1
dωw = 7ωrot
1
w
= (rot w)1 dx2 ∧ dx3 + (rot w)2 dx3 ∧ dx1 + (rot w)3 dx1 ∧ dx2 .
D’ailleurs, le théorème de Stokes-Cartan entraı̂ne l’égalité
J J
1
dωw = 1
ωw .
Σ ∂Σ
D’une part, on a J
1
dωw =
Σ
J
[((rot w)1 ◦ Σ)J(Σ2 ,Σ3 ) + ((rot w)2 ◦ Σ)J(Σ3 ,Σ1 ) + ((rot w)3 ◦ Σ)J(Σ1 ,Σ2 ) ]
U2
J
= (rot w|dN (Σ)).
S
D’autre part, ∂Σ est un cycle dans E de classe C 2 par morceaux et dès lors
J
1
ωw
∂Σ
est égale à la circulation du champ w le long de la courbe formée des arcs

images de ce chemin, c’est-à-dire à
J
(w|dT (∂Σ)),
C
si C désigne l’image de ∂Σ. On obtient ainsi la formule de Stokes-Ampère

ou de la circulation
J J
(rot w|dN (Σ)) = (w|dT (∂Σ)),
S C
qui exprime que le flux du champ rot w à travers une surface S bordée par
un chemin fermé C est égal à la circulation du champ w le long de C.
15.9. BORDS, CYCLES, COBORDS ET COCYCLES 619
4. n = 3, k = 3 : formule de Gauss-Ostrogradski ou du flux ou de

la divergence.
Soit V ⊂ R3 une partie telle que V = Ψ(U 3 ) où Ψ : F → Ψ(F ) est un
difféomorphisme de classe C 2 de l’ouvert F ⊂ R3 sur l’ouvert E = Ψ(F ), tel
que JΨ > 0 sur F . Soit w un champ vectoriel dans R3 de classe C 1 sur E.
On peut associer à w la 1-forme différentielle sur E
1
ωw = w1 dx1 + w2 dx2 + w3 dx3 ,
à laquelle correspond la 2-forme différentielle 7ωw

1 telle que
1
d 7 ωw = div w dx1 ∧ dx2 ∧ dx3 .
Par le théorème de Stokes-Cartan, on a

J J
d 1
7 ωw = 1
7ωw .
Ψ ∂Ψ
En utilisant le théorème de changement de variables dans une intégrale triple,

on obtient
J J J J
1
d 7 ωw = [(div w) ◦ Ψ]JΨ = div w = div w.
Ψ U3 Ψ(U 3 ) V
En utilisant un argument analogue à celui du cas précédent, on voit que

H
∂ Ψ 7ωw représente une somme d’intégrales de (w|dN (∂Ψ)) sur des éléments
1
de surface dont l’union redonne la surface qui borde V . On obtient donc la

formule de Gauss-Ostrogradski, ou du flux, ou de la divergence
J J
div w = (w|dN (∂Ψ)),
V S
qui exprime que le flux du champ vectoriel w à travers la surface S bordant

V est égal à l’intégrale sur V de la divergence de w.
15.9 Bords, cycles, cobords et cocycles

La formulation du théorème de Stokes-Cartan suggère l’introduction des
classes suivantes de k-chaı̂nes et de k-formes. Soit E ⊂ Rn un ouvert et
k ≥ 0, l ≥ 0 des entiers.
Définition. On dit que la k-chaı̂ne Φ dans E est un k-bord dans E de classe

C l s’il existe une (k+1)-chaı̂ne Ψ dans E de classe C l telle que
Φ = ∂Ψ.
Un k-bord est donc une k-chaı̂ne égale au bord d’une (k+1)-chaı̂ne. Bien
entendu, le bord d’une (k+1)-chaı̂ne est un k-bord.
Définition. Si k ≥ 1, on dit que la k-chaı̂ne Φ dans E est un k-cycle dans
E si
∂Φ = O.
Un k-cycle est donc une k-chaı̂ne dont le bord est une forme linéaire
nulle. Ainsi, pour k ≥ 2, le bord ∂Φ d’une k-chaı̂ne est nécessairement un
(k-1)-cycle puisque ∂(∂Φ) = O. D’autre part, on verra plus loin que tout
cycle (c’est-à-dire tout chemin fermé) dans E est un 1-cycle, ce qui explique
la terminologie.
Soit en outre l ≥ 0 un entier.
Définition. Si k ≥ 1, on dit que la k-forme différentielle ω est un k-cobord
de classe C l sur E s’il existe une (k-1)-forme λ de classe C l+1 sur E telle que
ω = dλ.
On dit aussi dans ce cas que ω est exacte sur E.

Ainsi, toute 1-forme différentielle ω = w dx de classe C l sur un intervalle
E ⊂ R est un 1-cobord de classe C l sur E puisque, en désignant par W une
primitive de w sur E, on a nécessairement
dW = W $ dx = w dx = ω.
Lorsque n ≥ 2, les cobords sont des formes différentielles particulières, ainsi

que le montre la condition nécessaire suivante.
Proposition. Si k ≥ 1, l ≥ 1 et si ω est un k-cobord de classe C l sur E,
alors
dω = 0.
Démonstration. Par hypothèse, il existe une (k-1)-forme λ de classe C l+1
sur E telle que ω = dλ. Dès lors, par le théorème de Poincaré,
dω = d2 λ = 0.
Cette propriété des k-cobords suggère la définition suivante.

Définition. On dit que la k-forme ω de classe C 1 sur E est un k-cocycle
sur E si
dω = 0.
On dit aussi dans ce cas que ω est fermée sur E.
Ainsi, tout k-cobord de classe C 1 au moins est un k-cocycle. Si k ≥ n,
toute k-forme différentielle de classe C 1 est un k-cocycle.
Appliqué aux bords, cycles, cobords et cocycles, le théorème de Stokes-
Cartan conduit à des propriétés intéressantes.
Proposition. Si k ≥ 1, ω est un k-cobord de classe C 1 sur E ⊂ Rn et Φ
un k-cycle sur E de classe C 2 (C 1 si k = 1), alors on a
J
ω = 0.
Φ
Démonstration. Par hypothèse, on a ω = dλ pour une (k-1)-forme
différentielle λ sur E, et dès lors, en utilisant le théorème de Stokes-Cartan,
on obtient J J J
ω= dλ = λ = 0,
Φ Φ ∂Φ
puisque Φ est un k-cycle.
Proposition. Si k ≥ 0, ω est un k-cocycle sur E ⊂ Rn et Φ un k-bord dans

E de classe C 2 (C 1 si k = 0), alors on a
J
ω = 0.
Φ
Démonstration. Par hypothèse, on a Φ = ∂Ψ pour une certaine (k+1)-
chaı̂ne Ψ dans E de classe C 2 (C 1 si k = 0). Dès lors, par le théorème de
Stokes-Cartan, il vient
J J J
ω= ω= dω = 0.
Φ ∂Ψ Ψ
Remarque. Comme tout k-bord est un k-cycle, on voit que l’intégrale

d’un k-cobord sur un k-bord sera également nulle. Il n’en est pas de même
de l’intégrale d’un k-cocycle sur un k-cycle, ainsi que le montre l’exemple
suivant. La 1-forme différentielle
x2 x1
ω= 2 dx1 − 2 dx2
x1 + x 2
2 x1 + x22
est de classe C ∞ sur R2 \ {0} et on vérifie sans peine que dω = 0. ω est donc
un 1-cocycle sur R2 \ {0}. Mais, sur le 1-simplexe Φ dans R2 \ {0} défini par
Φ(u) = (cos 2πu, sin 2πu), est un 1-cycle dans R2 \ {0} (le vérifier) et l’on a
J J 1
ω= [(sin 2πu)(−2π sin 2πu) − (cos 2πu)(2π cos 2πu)]du = −2π /= 0.
Φ 0
Pour appliquer les deux propositions que nous venons de démontrer,

il faut disposer de caractérisations simples des objets que nous venons de
définir. Nous commencerons par donner une caractérisation des 1-cycles.
%
Proposition. Soit Φ = m i=1 Φ un chemin dans E ⊂ R de classe C par
i n l
morceaux (l ≥ 1.) Alors Φ est un 1-cycle de classe C dans E si et seulement

l
si
Φm (1) = Φ1 (0),
c’est-à-dire si et seulement si Φ est un cycle.
Démonstration. Soit f ∈ C(E, K) une 0-forme différentielle sur E. Alors,
par le résultat de l’exemple 1 qui suit le théorème de Stokes-Cartan, on a
J
f = f (Φm (1)) − f (Φ1 (0)).
∂Φ
Dès lors, si Φ est un cycle, on aura

J
f = 0,
∂Φ
quelle que soit la 0-forme différentielle f et Φ est un 1-cycle. Réciproque-

ment, si Φ est un 1-cycle, alors
f (Φm (1)) − f (Φ1 (0)) = 0,
pour tout f ∈ C(E, K), et en prenant successivement f = pk , 1 ≤ k ≤ n, on

obtient
Φmk (1) = Φk (0), 1 ≤ k ≤ n,
1
et Φ est un cycle.
La notion suivante aide à vérifier si certaines 1-chaı̂nes sont des 1-bords.
% %
Définition. Soient Φ = m k=1 Φ et Ψ =
k m
k=1 Ψ des cycles dans E ⊂ R
k n
de classe C par morceaux (l ≥ 1). On dit que Φ est homotope à Ψ dans E

l
s’il existe une 2-chaı̂ne

m
$
Θ= Θk
k=1
dans E de classe C l telle que les conditions suivantes soient satisfaites :
Θk (·, 0) = Φk , Θk (·, 1) = Ψk , (1 ≤ k ≤ m),
Θk (1, ·) = Θk+1 (0, ·), (1 ≤ k ≤ m − 1),

Θm (1, ·) = Θ1 (0, ·).
En d’autres termes, pour chaque v ∈ [0, 1], Θ(·, v) est un cycle dans E
qui se réduit à Φ lorsque v = 0 et à Ψ lorsque v = 1. On peut donc visualiser
Θ comme une déformation continue de Φ en Ψ qui, à chaque étape de la
déformation, reste un cycle dans E. En changeant v en 1 − v, on vérifie sans
peine que si Φ est homotope dans E à Ψ, alors Ψ est homotope dans E à
Φ. La relation d’homotopie ainsi définie est donc une relation d’équivalence
entre cycles dans E formés d’un même nombre de 1-simplexes (ce qui peut
toujours être réalisé en rajoutant si nécessaire des 1-simplexes constants).
Proposition. Si Φ et Ψ sont des cycles de classe C l par morceaux homo-
topes dans E, alors
m
$
Φ−Ψ = [Φk − Ψk ] = ∂Θ
k=1
et Φ − Ψ est donc un 1-bord de classe C l dans E.

Démonstration. Soit ω une 1-forme différentielle dans E. On a
J m J
$ m $
$ 1
2 $ J
ω= ω= (−1) j+α
ω
∂Θ k=1 ∂ Θ
k
k=1 j=1 α=0 Θk,j,α
m $
$ 2 4J J 5
= (−1)j ω− ω .
k=1 j=1 Θk,j,0 Θk,j,1
Le fait que Φ et Ψ soient homotopes dans E peut s’écrire
Θk,1,1 = Θk+1,1,0 , (1 ≤ k ≤ m − 1),
Θm,1,1 = Θ1,1,0 ,
Θk,2,0 = Φk , Θk,2,1 = Ψk , (1 ≤ k ≤ m).
Dès lors,
J m 4J
$ J 5 m 4J
$ J 5
ω=− ω− ω + ω− ω
∂Θ k=1 Θk,1,0 Θk,1,1 k=1 Θk,2,0 Θk,2,1
&m−1 J m J
' m 4J J 5
$ $ $
=− ω− ω + ω− ω
k=0 Θk+1,1,0 k=1 Θ
k,1,1
k=1 Φk Ψk
4J J 5 J
=− ω− ω + %m ω
Θ1,1,0 Θm,1,1 k=1
Φk −Ψk
J J
= %m ω= ω.
k=1
Φk −Ψk Φ−Ψ
Donc, ∂Θ = Φ − Ψ.
Dans les conditions de la Proposition précédente, on a donc, pour toute
1-forme différentielle ω dans E,
J J J
ω− ω= ω.
Φ Ψ ∂Θ
On en déduit aussitôt les résultats suivants.

Corollaire. Si Φ et Ψ sont des cycles dans E ⊂ Rn de classe C 2 homotopes
dans E, alors, pour tout 1-cocycle ω dans E, on a
J J
ω= ω.
Φ Ψ
En d’autres termes, l’intégrale de ω ne change pas pendant la déforma-
tion.
Corollaire. Si Φ est un cycle dans E de classe C 2 homotope à O et si ω
est un 1-cocycle dans E, alors
J
ω = 0.
Φ
Caractérisons maintenant quelques cas particuliers importants de co-
bords.
Proposition. Si E ⊂ Rn est un ouvert, la 1-forme différentielle
n
$
ω= wi dxi
i=1
est un 1-cobord sur E si et seulement s’il existe f ∈ C 1 (E, K) telle que
Di f = wi, 1 ≤ i ≤ n.
Démonstration. Il suffit d’expliciter la définition qui requiert l’existence

d’une 0-forme différentielle f sur E telle que ω = df.
La caractérisation donnée par cette proposition s’exprime en langage

vectoriel en disant que le champ w (associé à ω) dérive sur E d’un potentiel
scalaire f . Les 1-cobords sur E sont donc les 1-formes différentielles sur E
associées aux champs sur E dérivant d’un potentiel scalaire. Dans le langage
%
des équations différentielles, le fait que ω = ni=1 wi dxi soit un 1-cobord sur
E équivaut à l’existence d’une solution de classe C 1 au système d’équations
aux dérivées partielles en l’inconnue f :
Dif (x) = wi(x), x ∈ E, 1 ≤ i ≤ n.
On sait que, pour n = 1, ce système, qui se réduit à l’équation différentielle
élémentaire
f $ (x) = w(x),
a toujours une solution. Il n’en est plus de même lorsque n ≥ 2.
Proposition. Si E ⊂ R3 est un ouvert et si w : E → R3 est un champ de
classe C m sur E, alors la 2-forme différentielle 7ωw
1
est un 2-cobord de classe
C sur E si et seulement s’il existe un champ l : E → R3 de classe C m+1
m
tel que
w = rot l.
Démonstration. 7ωw
1
est un 2-cobord de classe C m sur E si et seulement
%
s’il existe une 1-forme différentielle λ = 3i=1 li dxi de classe C m+1 sur E
telle que
7ωw 1
= dλ.
Comme
7dλ = ωrot
1
l,
notre résultat équivaut à
1
ωw = 7(7ωw
1
) = 7dλ = ωrot
1
l,
c’est-à-dire à
w = rot l
sur E.
La caractérisation donnée par cette proposition s’exprime en langage
vectoriel en disant que le champ w dérive sur E d’un potentiel vectoriel l.
En termes d’équations différentielles, le fait que 7ωw
1 est un 2-cobord sur E
correspond à l’existence d’une solution au système d’équations aux dérivées

partielles d’inconnue l
rot l(x) = w(x), x ∈ E.
Caractérisons quelques cas particuliers importants de cocycles.
Proposition. Si E ⊂ Rn est ouvert, alors la 1-forme différentielle de classe

C 1 sur E
n
$
ω= wi dxi
i=1
est un 1-cocycle sur E si et seulement si, pour chaque 1 ≤ i < j ≤ n, on a
Di wj = Dj wi .
Démonstration. Il suffit évidemment de démontrer que la thèse équivaut

à dω = 0. On notera que les relations ci-dessus sont trivialement satisfaites
lorsque i = j et que, si elles sont satisfaites, elles le sont aussi pour 1 ≤ j <
i ≤ n. Il suffit en effet de permuter les indices i et j. Par ailleurs, on a
$
dω = (Diwj − Dj wi ) dxi ∧ dxj ,
1≤i<j≤n
et le second membre est l’écriture canonique de dω. La thèse en résulte

aussitôt.
%3
Proposition. Si E ⊂ R3 est ouvert, alors la 1-forme ωw 1
= i=1 wi dxi de
1
classe C sur E est un 1-cocycle sur E si et seulement si
rot w = 0.
Démonstration. On a en effet dω = 7ωrot

1
w et la thèse en résulte aussitôt.
En langage vectoriel, un champ w : E → R3 de classe C 1 tel que rot w =

0 est appelé un champ irrotationnel. Les 1-cocycles correspondent donc
naturellement aux champs irrotationnels.
Proposition. Si E ⊂ R3 est ouvert, alors la 2-forme 7ωw
1 de classe C 1 sur
E est un 2-cocycle sur E si et seulement si
div w = 0.
Démonstration. On a en effet d 7 ωw
1
= 7div w, et la thèse en résulte
aussitôt.
En langage vectoriel, un champ w : E → R3 de classe C 1 tel que
div w = 0 est appelé un champ indivergentiel ou solénoı̈dal. Les 1-cocycles
correspondent donc naturellement aux champs indivergentiels.
On a vu plus haut que tout k-cobord de classe C 1 sur un ouvert E de Rn

était un k-cocycle sur E. L’exemple donné précédemment d’un 1-cocycle ω
dont l’intégrale sur un 1-cycle n’est pas nulle monte que la réciproque n’est
pas vraie puisque, si ω était un 1-cobord sur E, cette intégrale serait nulle.
On va voir cependant que si la géométrie de E est suffisamment simple
(en particulier si E = Rn ), tout k-cocycle sur E sera un k-cobord sur E.
Définition. On dit que E ⊂ Rn est étoilé s’il existe a ∈ E tel que pour tout
x ∈ E et pour tout t ∈ [0, 1], on a a + t(x − a) ∈ E.
Géométriquement, E est donc étoilé s’il contient un point a tel que, pour
tout point x de E, le segment de droite joignant a à x est contenu dans E.
Ainsi, Rn est étoilé mais, quel que soit b ∈ Rn , Rn \ {b} ne l’est pas puisque,
pour chaque a ∈ Rn \ {b}, le segment joignant a au symétrique de a par
rapport à b n’est pas contenu dans Rn \ {b}. Dans R, les ensembles étoilés
sont les intervalles et les singletons. Une classe importante d’ensembles étoi-
lés est fournie par les ensembles convexes.
Définition. On dit que E ⊂ Rn est convexe si, pour tout a ∈ E, tout x ∈ E
et tout t ∈ [0, 1], on a a + t(x − a) ∈ E.
Géométriquement, un ensemble est convexe s’il contient le segment de
droite joignant deux quelconques de ses points. Ainsi, les boules dans Rn
sont convexes.
Le résultat suivant, qui s’appelle la réciproque du théorème de Poin-
caré, montre que si E est étoilé, tout k-cocycle sur E est un k-cobord sur
E. Nous le démontrerons séparément pour les 1-formes et pour les k-formes
(k ≥ 2).
Théorème. Si E ⊂ Rn est un ouvert étoilé, tout 1-cocycle ω sur E est un
1-cobord de classe C 1 sur E.
Démonstration. Il faut donc prouver l’existence d’une 0-forme différen-
%
tielle f ∈ C 2 (E, K) telle que ω = df , ou encore, si ω = ni=1 wi dxi, telle
que
Dif = wi , 1 ≤ i ≤ n. (15.7)
Pour motiver la construction de f notons tout d’abord que, pour tout f ∈
C 1 (E, K), si a est l’élément intervenant dans la définition de l’ensemble étoilé
E, on a, par le théorème fondamental du calcul différentiel et intégral et le
théorème de dérivation des fonctions composées
J 1 d
f (x) = f (a) + [f (a + t(x − a))] dt
0 dt
 
J 1 n
$
= f (a) +  Dj f (a + t(x − a))(xj − aj ) dt,
0 j=1
quel que soit x ∈ E. Dès lors, si l’on note en outre qu’une fonction f vérifiant
les conditions (15.7) n’est évidemment définie qu’à une constante additive
près, il est naturel de prendre pour candidat la fonction f définie en chaque
x ∈ E par l’intégrale
 
J 1 n
$
f (x) =  wj (a + t(x − a))(xj − aj ) dt.
0 j=1
Comme l’intégrand est une fonction de classe C 1 en tous ses arguments, il

est facile de vérifier que les conditions de la formule de Leibniz de dérivation
sous le signe intégral sont satisfaites. Dès lors, f est de classe C 1 sur E et,
pour chaque x ∈ E et chaque 1 ≤ i ≤ n, on a, en utilisant successivement
la règle de Leibniz, le théorème de dérivation d’un produit, le théorème
de dérivation des fonctions composées, la caractérisation des 1-cocycles en
termes des dérivées croisées et le théorème fondamental du calcul différentiel
et intégral
 
J 1 n
$
Di f (x) = D xi  wj (a + t(x − a))(xj − aj ) dt
0 j=1
J n
1$
= {(xj − aj )Dxi [wj (a + t(x − a))] + wj (a + t(x − a))δij } dt
0 j=1
 
J 1 $
n 
= [(xj − aj )tDi wj (a + t(x − a))] + wi (a + t(x − a)) dt
0  
j=1
 
J 1  $
n 
= t [(xj − aj )Dj wi (a + t(x − a))] + wi (a + t(x − a)) dt
0  
j=1
J 1U d
V
= t [wi(a + t(x − a))] + wi (a + t(x − a)) dt
0 dt
J 1 d
= [twi(a + t(x − a))] dt = wi(x).
0 dt
Comme les wi sont de classe C 1 sur E, on en déduit également que f est de
classe C 2 sur E et la démonstration est complète.
Exemple. Si n = 3, le théorème précédent exprime, en langage vectoriel,

que si w est un champ de classe C 1 et irrotationnel sur l’ensemble étoilé
E ⊂ R3 , alors w dérive d’un potentiel scalaire f de classe C 2 sur E. Ainsi,
tout champ de classe C 1 et irrotationnel sur R3 dérive d’un potentiel scalaire.
Une conséquence immédiate du théorème de Stokes-Cartan et de la réci-
proque du théorème de Poincaré est la suivante.
Corollaire. Si E ⊂ Rn est un ouvert étoilé, alors, pour tout k-cocycle ω
sur E et tout k-cycle Φ de classe C 2 (C 1 si k = 1) dans E, on a
J
ω = 0.
Φ
Une autre conséquence immédiate est la suivante: si E est étoilé, l’inté-

grale d’un 1-cocycle sur E sur un chemin dans E de classe C 1 par morceaux
ne dépend que des extrémités du chemin, et non du chemin lui-même. Ce
résultat possède une intéressante réciproque.
Proposition. Soit E ⊂ Rn un ouvert étoilé et ω une 1-forme différentielle
sur E telle que J J
ω= ω
Φ Ψ
%m %r
pour tous les chemins Φ = k=1 Φk et Ψ = j=1 Ψj dans E de classe C 1
par morceaux vérifiant les conditions
Φ1 (0) = Ψ1 (0), Φm (1) = Ψr (1).
Alors, ω est un 1-cobord sur E.

Démonstration. Pour chaque x ∈ E et chaque y ∈ E tel que le segment
de droite
[x, y] = {x + u(y − x) : u ∈ [0, 1]}
soit contenu dans E, définissons le 1-simplexe ∆[x,y] dans E par
∆[x,y](u) = x + u(y − x).
Soit a ∈ E le point intervenant dans la définition d’ensemble étoilé. Si

%
ω = ni=1 wi dxi , définissons la fonction W : E → K par
J J n
1$
W (x) = ω= wi (a + u(x − a))(xi − ai ) du.
∆[a,x] 0 i=1
Soit x ∈ E, r > 0 tel que B2 [x; r] ⊂ E, 1 ≤ j ≤ n et h ∈ [−r, r] \ {0} fixés.

Considérons la 1-chaı̂ne Φ dans E de classe C 1 par morceaux définie par
Φ = ∆[a,x] + ∆[x,x+hej ] .
C’est un chemin dans E de classe C 1 par morceaux qui a la même origine a

et la même extrémité x + hej que ∆[a,x+hej ] . Dès lors, par l’hypothèse,
J J J J
W (x + hej ) = ω= ω= ω+ ω
∆[a,x+hej ] Φ ∆[a,x] ∆[x,x+hej ]
J n
1$ J 1
= W (x) + wi (x + uhej )heji du = W (x) + h wj (x + uhej ) du.
0 i=1 0
Dès lors, par les propriétés des fonctions définies par une intégrale, on trouve
aussitôt
J 1
−1
lim h [W (x + he ) − W (x)] = lim
j
wj (x + uhej ) du
h→0 h→0 0
J 1
= wj (x) du = wj (x).
0
Par conséquent, la 0-forme W est de classe C 1 sur E et telle que dW = ω,
ce qui montre que ω est un 1-cobord sur E.
La démonstration de la réciproque du théorème de Poincaré pour
les k-formes différentielles avec k ≥ 2, procède d’une idée semblable à
celle utilisée pour k = 1, mais les détails techniques sont nettement plus
compliqués; en outre, sa conclusion est un peu plus faible en ce qui concerne
la régularité de la (k-1)-forme différentielle obtenue.
Théorème. Soit E ⊂ Rn un ouvert étoilé et ω un k-cocycle de classe C r
sur E (r ≥ 1, k ≥ 2). Alors ω est un k-cobord de classe C r sur E.
Démonstration. Pour alléger les notations, nous supposerons que a = 0
dans la définition d’ensemble étoilé. Soit
[l [l−1
I : C r (E, (Rn , K)) → C r (E, (Rn , K))
définie par
I(η) =
$ l
$ 4J 1 5
(−1)m−1 #
tl−1 ei1 ,...,il (t·) dt pim dxi1 ∧. . .∧ dx im ∧. . . dxil ,
1≤i1 <...<il ≤n m=1 0
si $
η= ei1 ,...,il dxi1 ∧ . . . ∧ dxil ,
1≤i1 <...<il ≤n
#
où dx im signifie comme d’habitude que le terme correspondant manque dans
le produit extérieur, où, pour chaque t ∈ [0, 1], ei1,...,il (t·) est l’application
de E dans K donnée par x → ei1 ,...,il (tx), et où pim désigne l’application
projection sur la ieme
m coordonnée. Nous allons montrer que, pour toute
k-forme différentielle ω de classe C 1 sur E, on a
ω = I(dω) + d(I(ω)).
Dès lors, si ω est un k-cocycle de classe C r sur E, cela impliquera, puisque

par construction I(0) = 0, que ω = d(I(ω)), c’est-à-dire que ω est un k-
cobord de classe C r sur E.
%
Soit donc ω = I∈C(n,k) wIdxI une k-forme différentielle de classe C r
% %
sur E. Alors, dω = ni=1 I∈C(n,k) Di wI dxi ∧ dxI, et
n
$ $ 2J 1
I(dω) = tk Di wI(t·) dt)pidxI
i=1 1≤i1 <...<ik ≤n 0
k 4J 5 -
$ 1
+ (−1) m #
t DiwI (t·) dt pim dxi ∧ dxi1 ∧ . . . ∧ dx
k
im ∧ . . . ∧ dxik
m=1 0
$ n 4J
$ 1 5
= t Di wI(t·) dt pi dxI
k
0
I∈C(n,k) i=1
$ n $
$ k 4J 1 5
− (−1)m−1 tk Di wI(t·) dt pim
1≤i1 <...<ik ≤n i=1 m=1 0
#
dxi ∧ dxi1 ∧ . . . ∧ dx im ∧ . . . ∧ dxik .
Par ailleurs, en utilisant la règle de Leibniz de dérivation sous le signe intégral

et la règle de dérivation des fonctions composées, il vient
d(I(ω))
$ k
$ 24J 1 5 3
= (−1) m−1
d k−1
t #
wI(t·) dt pim ∧dxi1 ∧. . . dx im ∧. . .∧dxik
0
I∈C(n,k) m=1
$ k
$ n 24J
$ 1 5
= (−1) m−1 k−1
t Di wI(t·)t dt pim
0
I∈C(n,k) m=1 i=1
4J 1 5 3
+ k−1
t #
wI(t.)dt δim i dxi ∧ dxi1 ∧ . . . dx im ∧ . . . dxik =
0
$ n $
$ k 4J 1 5
(−1)m−1 #
tk DiwI (t·) dt pim dxi ∧dxi1 ∧. . . dx im ∧. . . dxik
0
I∈C(n,k) i=1 m=1
$ k
$ 4J 1 5
+ (−1)m−1 #
tk−1 wI(t·)dt dxim ∧ dxi1 ∧ . . . dx im ∧ . . . dxik =
0
I∈C(n,k) m=1
$ n $
$ k 4J 1 5
(−1)m−1 #
tk DiwI (t·) dt pim dxi ∧dxi1 ∧. . . dx im ∧. . . dxik
0
I∈C(n,k) i=1 m=1
$ 4J 1 5
+k wI(t·) dt dxI.
0
I∈C(n,k)
En conséquence,
I(dω) + d(I(ω))
$ n 4J
$ 1 5 $ 4J 1 5
tk DiwI (t·) dt pi dxI + ktk−1 wI (t·) dt dxI
0 0
I∈C(n,k) i=1 I∈C(n,k)
$ 4J 1 5 $
d k
= (t wI(t·)) dt dxI = wI dxI = ω.
0 dt
Exemple. En langage vectoriel, le théorème précédent entraı̂ne que si E est

un ouvert étoilé de R3 et w un champ indivergentiel sur E, alors w dérive
sur E d’un potentiel vectoriel.
Remarque. Si ω est un k-cobord sur E ⊂ Rn , toute (k-1)-forme diffé-
rentielle λ de classe C 1 sur E telle que ω = dλ est appelée une primitive
extérieure de ω sur E. Il n’y a bien entendu pas unicité de la primitive
extérieure puisque, si η est un k-cocycle sur E, λ + η est également une
primitive extérieure de ω sur E. On a là une situation analogue à celle qui
se présente pour la primitivation des fonctions de R dans R.
15.10 Exercices
H
1. Soit Γ : [a, b] → Rn une fonction dérivable. Montrer que $
[a,b] |Γ |2 existe
si et seulement si l’ensemble
; m
<
$
VΓ = |Γ(ak ) − Γ(ak−1 )|2 : a = a0 < a1 < . . . < am = b
k=1
est majoré, auquel cas J

|Γ$ |2 = sup VΓ.
[a,b]
Suggestion. Comme Γ$ est intégrable sur [a, b], l’hypothèse équivaut à la

L-intégrabilité de Γ sur [a, b]. Il suffit alors d’utiliser la condition nécessaire
et suffisante de L-intégrabilité du Chapitre 10 et le théorème fondamental
du calcul différentiel et intégral. Une fonction Γ telle que VΓ soit majoré est
appelée une fonction à variation bornée sur [a, b] et sup VΓ est sa variation
sur [a, b].
2. Soient f et ϕ des champs scalaires et g et γ des champs vectoriels de
classe C 1 sur un ouvert E de R3 . En utilisant la formule de différentiation
extérieure d’un produit extérieur de deux formes différentielles et la notion
de forme différentielle associée à un champ scalaire ou à un champ vectoriel
dans R3 , démontrer les formules suivantes de l’analyse vectorielle
grad (f ϕ) = ϕgrad f + f grad ϕ,
rot (f g) = grad f ∧ g + f rot g,
div (f g) = (grad f |g) + f div g,
div (g ∧ γ) = (rot g|γ) − (g|rot γ).

3. Soit u une k-forme extérieure dans Rn et A ∈ Rn . La (k − 1)-forme
extérieure iA u est définie par
iA u(h1 , . . . , hk−1 ) = u(A, h1 , . . . , hk−1).
Soit ω une k-forme différentielle dans un ouvert E ⊂ Rn et g un champ de

vecteurs sur E. Si ω et g sont de classe C 1 sur E, on définit la dérivée de
Lie de ω relativement à g comme étant la k-forme différentielle dans E
Lg ω = ig dω + d(ig ω).
Montrer que, dans le cas d’une 0-forme et celui d’une 1-forme associée à un
champ vectoriel, cette notion généralise la dérivée de Lie d’un champ scalaire
et d’un champ vectoriel. Montrer aussi que les ω et g sont de classe C 2 , alors
dLg ω = Lg dω.
4. Soit g un difféomorphisme de Rn (dont les éléments sont notés x) sur Rn
(dont les éléments sont notés y), h = g −1 , γ une 1-forme dans Rn et λ la
1-forme dans Rn définie par
λ = d(y|h) − h∗ γ.
Montrer que si γ est exacte sur Rn , avec γ = df, où f : Rn → R, est de

classe C 2 , alors λ = df ∗ , où f ∗ : Rn → R est la transformée de Legendre de
f définie par
f ∗ (y) = (y|h(y)) − f (h(y)).
Comme
ω = df ⇔ y = g(x) = grad f (x), (x ∈ Rn ),
γ = df ∗ ⇔ x = h(y) = grad f ∗ (y), (y ∈ Rn ),
on voit que grad f ∗ ◦ grad f = I. La transformée de Legendre joue un grand
rôle en mécanique et en thermodynamique.
5. Etant donné un gaz, p sa pression et v son volume, on appelle, en ther-
modynamique, état du gaz tout point (v, p) ∈ R2 , transformation réversible
tout chemin dans R2 de classe C 1 par morceaux et cycle tout cycle dans R2
de classe C 1 par morceaux. On introduit la 1-forme travail τ = −p dv et
la 1-forme quantité de chaleur κ = M dv + N dp. Le premier principe de la
thermodynamique affirme que, pour tout cycle Γ dans R2 , on a
J
(τ + κ) = 0.
Γ
Montrer que ce premier principe est équivalent à l’une des assertions suivan-
tes :
1. τ + κ est fermée sur R2 .
2. τ + κ est exacte sur R2 .
En particulier, il existera une fonction E : R2 → R de classe C 1 telle
que τ + κ = dE. E est appelée l’énergie interne du gaz. Montrer qu’on
a nécessairement
Dp M − Dv N = 1.
Le deuxième principe de la thermodynamique des phénomènes réversibles
affirme l’existence d’une fonction continue T : R2 → R telle que la 1-forme
1
Tκ soit exacte. Il existera donc une fonction S : R2 → R de classe C 1 telle
que
κ = T dS.
S est appelée l’entropie du gaz. Montrer qu’on a nécessairement
T = M Dp T − N Dv T.
Si l’on suppose que la relation t = T (v, p) peut s’écrire sous les formes
équivalentes v = V (t, p) ou p = P (v, t), on peut utiliser la notion de trans-
formée d’une forme différentielle pour exprimer les 1-formes τ, κ et T1 κ en
terme des variables (v, t) ou (t, p).
6. Soit
r : Rn → R, x 2→ |x|2 ,
ω = dx1 ∧ . . . ∧ dxn ,
n
$
ω$ = Z ∧ . . . ∧ dx .
(−1)j−1 xj dx1 ∧ . . . dx j n
j=1
Montrer que dω $ = nω et que, sur Rn \ {0}, on a dr ∧ ω $ = rω. Si λ = r −n ω $ ,

montrer que λ est fermée sur Rn \ {0}.
7. Soit
 
3
$
ω= Ej dxj  ∧ dx4 + B1 dx2 ∧ dx3 + B2 dx3 ∧ dx1 + B3 dx1 ∧ dx2 ,
j=1
une 2-forme de classe C 1 dans R4 . Montrer que 7dω = 0 si et seulement si
rot E + D4 B = 0, div B = 0,
et que d 7 ω = 0 si et seulement si
rot B + D4 E = 0, div E = 0,
où E et B sont considérés comme les champs vectoriels sur R3 de com-

posantes respectives (E1 , E2 , E3), (B1 , B2 , B3 ) considérés comme fonctions
de (x1 , x2 , x3 ) et dépendant du paramètre x4 . On reconnaı̂t la structure
des équations de Maxwell de l’électrodynamique. L’expression la plus satis-
faisante des équations de Maxwell dans le langage des formes différentielles
s’obtient à partir d’une notion d’adjointe de Hodge construite sur la métrique
de Lorentz de l’espace-temps au lieu de la métrique euclidienne considérée
ici.
8. Soient u et v des fonctions de Rn dans R. Montrer que si u et v sont de

classe C 1 sur un ouvert E ⊂ Rn , alors
du ∧ 7dv = 7du ∧ dv = (grad u|grad v)dx1 ∧ . . . ∧ dxn .
Si Φ est un n-simplexe dans E de classe C 2 , on définit l’intégrale de Dirichlet
de u et v sur Φ par J
D(u, v) = du ∧ 7dv.
Φ
On a donc J
D(u, v) = (grad u|grad v).
Φ(U n )
Montrer que si v est de classe C 2 sur E, alors

J J J
u 7 dv = D(u, v) + u∆vdx1 ∧ . . . ∧ dxn = D(u, v) + u∆v,
∂Φ Φ Φ(U n )
%
où ∆u = nj=1 Djj
2 v est le laplacien de v. En déduire que, si u et v sont de
classe C sur E, on a la formule de Green

2
J J
(u 7 dv − v 7 du) = (u∆v − v∆u).
∂Φ Φ(U n )
Cette formule joue un rôle important en théorie du potentiel.

9. Un ouvert E de Rn est dit contractile s’il existe a ∈ E et une application
γ : E × [0, 1] → E,
de classe telle que γ(., 0) = a et γ(., 1) soit l’identité sur E. Montrer
C2
qu’un ouvert étoilé est contractile. Généraliser la réciproque du théorème de
Poincaré pour les 1-formes au cas d’un ouvert contractile.
10. Désignons les coordonnées de R2n par (p1 , . . . , pn , q1 , . . . , qn ). Soit la
%
1-forme γ = nj=1 pj dqj dans R2n et
n
$
σ = dγ = dpj ∧ dqj
j=1
sa différentielle extérieure. σ est donc un 2-cocycle dans R2n , appelé forme

symplectique. Montrer que (pour n facteurs)
n(n−1)
σ ∧ σ ∧ . . . ∧ σ = n!(−1) 2 dp1 ∧ . . . dpn ∧ dq1 ∧ . . . ∧ dqn .
Une transformation g : R2n → R2n est dite canonique si g ∗ σ = σ. En utilisant
la relation précédente, montrer que si g est canonique, alors la forme volume
ω = dp1 ∧ . . . ∧ dpn ∧ dq1 ∧ . . . ∧ dqn de R2n est invariante sous l’action de g,
c’est-à-dire que g ∗ ω = ω.

Si X, Y, Z sont des fonctions des coordonnées rectangulaires x, y, z, dS un
élément d’une surface limitée, l, m, n les cosinus des inclinaisons de la norme
en dS sur les axes, ds un élément de la courbe bordant la surface, montrer
que J J U V
dZ dY dX dY dY dX
l( − ) + m( − ) + n( − ) dS
dy dz dz dx dx dy
J 4 5
dx dy dz
= X +Y +Z ds,
ds ds ds
les coefficients différentiels de X, Y, Z étaient partiels, et l’intégrale simple
étant prise sur le périmètre de la surface.
Soient x1 , x2 , . . . , xn n variables indépendantes et soient X1 , X2 , . . . , Xn
n fonctions de ces n variables; il est aisé de définir l’intégrale simple
J
(X1 dx1 + X2 dx2 + . . . Xn dxn ).
En effet, introduisons une variable auxiliaire et posons

x1 = ϕ1 (u), x2 = ϕ2 (u), . . ., xn = ϕn (u).
Ces équations définiront le chemin d’intégration. Nous ferons varier u depuis
u0 jusqu’à u1 . Nous poserons
x01 = ϕ1 (u0 ), . . . , x0n = ϕn (u0 ), x11 = ϕ1 (u1 ), . . . , x1n = ϕn (u1 ).
Les deux systèmes de valeurs (x01 , x02 , . . . , x0n ) et (x11 , x12 , . . . , x1n) définiront
les deux points extrêmes de ce chemin d’intégration. Alors l’intégrale ci-
dessus prise le long du chemin d’intégration ainsi défini depuis le point
(x01 , x02 , . . . , x0n ) jusqu’au point (x11 , x12 , . . . , x1n ) ne sera autre chose que l’in-
tégrale définie
J u1 4 5
dx1 dx1 dxn
X1 + X2 + . . . Xn du.
u0 du du du
Nous chercherons les conditions d’intégrabilité, c’est-à-dire les conditions
pour que cette intégrale soit indépendante du chemin d’intégration, c’est-à-
dire ne dépende que des deux points extrêmes de ce chemin (x01 , x02 , . . . , x0n) et
n(n−1)
(x11 , x12 , . . . , x1n ). Ces conditions sont au nombre de 2 et elles s’écrivent
dXi dXk
= .
dxk dxi
Passons maintenant au cas général. Désignons par la notation (Xi, Xk )

diverses fonctions données de ces n variables. Nous supposerons que l’on a
(Xi, Xi) = 0, (Xk , Xi) = −(Xi , Xk ). Nous allons envisager l’intégrale double
J J $
J= (Xi, Xk ) dxidxk
% n(n−1)
où l’on fait entrer sous le signe les 2 combinaisons des deux indices
i et k. . . . Les conditions d’intégrabilité sont
d(Xi, Xk ) d(Xk , Xh) d(Xh , Xi)

+ + = 0.
dxh dxi dxk
Il faut prendre pour le système des trois nombres (i, h, k) toutes les combi-
naisons possibles, en excluant celles où deux des lettres seraient identiques et
en ne regardant pas comme distinctes celles qui ne diffèrent que par l’ordre
des lettres.. . . Qu’arrive-t-il si l’on passe aux intégrales d’ordre supérieur ?
On trouvera des conditions tout à fait analogues aux conditions ci-dessus
et l’on rencontrera encore le fait suivant. Pour les conditions relatives aux
intégrales d’ordre pair, tous les termes seront précédés du signe +; pour les
conditions relatives aux intégrales d’ordre impair, les termes seront alterna-
tivement précédés des signes + et -.
Soient Li1 i2 ...ir des fonctions de points dans un hyperespace Sn définies

et continues avec leurs derivées premières et telles que toute transposition
des indices change seulement le signe. Considérons les formes
r+1
$ ∂Li1 i2 ...is−1 is+1 ...ir+1
Mi1 i2 ...ir = (−1)s−1 .
s=1
∂xis
Nous désignons par Sr la frontière d’un hyperespace Sr+1 de dimension r + 1

ouvert et immergé dans Sr ; par αi1 i2 ...ir+1 les cosinus directeurs de Sr+1 et
par βi1 i2 ...ir ceux de Sr . L’extension du théorème de Stokes consiste en la
formule suivante :
J $ J $
Mi1 i2 ...ir+1 dSr+1 = Li1 i2 ...ir βi1 i2 ...ir dSr .
Sr+1 i Sr i
Vito Volterra, 1889

Cela posé, je vais définir l’intégrale suivante

J $
Xα1 ,α2 ,...,αm dxα1 dxα2 . . . dxαm .
Les différentielles dxα1 , dxα2 , . . . , dxαn sont m quelconques des n différenti-

elles dx1 , dx2, . . . , dxn . Les fonctions Xα1,α2 ,...,αm sont des fonctions données
de x1 , x2 , . . . , xn et il y en a autant qu’il y a de combinaisons possibles des
indices α1 , α2 , . . . , αm , c’est-à-dire qu’il y a de combinaisons de n lettres m
à m. Il faut convenir que la fonction X est nulle si deux de ses indices sont
égaux et qu’elle change de signe quand on permute deux de ses indices. Cela
posé, l’intégrale ci-dessus sera, par définition, égale à l’intégrale d’ordre m
J $
∂(xα1 , xα2 , . . . , xαm )
Xα1 ,α2 ,...,αm dy1 , dy2 , . . . , dym .
∂(y1 , y2 , . . ., ym )
Cette définition laisse toutefois subsister encore une ambiguı̈té. En effet, si
l’on permute deux des lettres y1 et y2 , l’intégrale change de signe; il importe
donc de se donner l’ordre de ces lettres et la permutation de deux de ces
lettres équivaudrait à un changement du sens de l’intégration dans l’étude
des intégrales simples. Je dirai donc le sens de l’intégration pour parler
de l’ordre dans lequel on convient de ranger les lettres y1 , y2 , . . . , ym . J’ai
recherché en 1887 dans quels cas les conditions d’intégrabilité sont remplies,
c’est-à-dire dans quels cas l’intégrale ci-dessus est nulle toutes les fois qu’elle
s’applique à une variété fermée. Voici ce que j’ai trouvé; écrivons pour
abréger l’écriture (α1 , α2 , . . . , αm) au lieu de Xα1 ,α2 ,...,αm et [αp ] au lieu de
xαp . Nos conditions d’intégrabilité s’écriront
d(α1 , α2 , . . . , αm ) d(α2 , α3 , . . . , αm−1 ) d(α3 , α4 , . . . , αm−2 )

± ±
d[αm+1 ] d[α1 ] d[α2 ]
d(αm+1 , α1 , α2 , . . . , αm−1 )
±...± = 0.
d[αm ]
Voici la loi suivant laquelle doivent être choisis les signes ±. On prendra
toujours le signe + si m est pair, et alternativement le signe + et le signe -
si m est impair.
De même et plus généralement soit
J $
A dω
une expression intégrale d’ordre p; . . . nous supposons cette intégrale étendue

à une variété fermée quelconque d’ordre p; un théorème analogue à celui de
Stokes nous apprendra alors qu’elle peut être transformée en une intégrale
d’ordre p + 1 étendue à une variété quelconque, fermée ou non, d’ordre p + 1.
L’intégrale transformée s’écrit
J $$
dA
± dxk dω.
k
dxk
On prend toujours le signe + si p est pair et alternativement le signe + et

le signe - si p est impair.
Etant données n variables x1 , x2 , . . . , xn, considérons des expressions ω,

purement symboliques, se déduisant, au moyen d’un nombre fini de signes
d’addition ou de multiplication, des n différentielles dx1 , dx2 , . . . , dxn et de
certains coefficients fonctions de x1 , x2 , . . . , xn ; ces expressions étant, dans
le sens ordinaire du mot, homogènes en dx1 , dx2 , . . . , dxn. Comme elles sont
purement symboliques, nous nous astreindrons, toutes les fois qu’il y aura un
signe d’addition ou de multiplication, à ne pas changer l’ordre des termes
ou des facteurs réunis par ce signe. . . . Les expressions différentielles du
premier degré s’appellent encore expressions de Pfaff; elles sont de la forme
analogue à la suivante :
A2 dx2 + A1 dx1 + . . . .
Comme exemples d’expressions de degrés supérieurs, on peut avoir les sui-

vantes :
A1 dx2 dx1 + A2 dx3 dx2 ,
(A1 dx1 + A2 dx2 )(B1 dx1 dx2 + B2 dx2 dx1 ) + Cdx1 dx2 dx1 . . . .
Pour définir, par convention, la valeur d’une expression différentielle ω,
de degré h par exemple, nous considérerons x1 , x2 , . . ., xn comme des fonc-
tions de h paramètres indéterminés α1 , α2 , . . . , αh supposés rangés dans un
certain ordre que nous appellerons l’ordre naturel. Cela étant, on considère
toutes les h! permutations des lettres α1 , α2 , . . . , αh . Soit (β1 , β2, . . . , βh)
une de ces permutations. A cette permutation, on fait correspondre la valeur
que prend, d’après les règles ordinaires du calcul, l’expression ω, lorsqu’on y
remplace les différentielles qui occupent le 1er , 2e , . . . , he rang respectivement
par les dérivées correspondantes prises par rapport à β1 , β2, . . . , βh. On fait
précéder la quantité ainsi déterminée du signe + ou du signe -, suivant que

la permutation (β1 , β2, . . . , βh) présente un nombre pair ou un nombre im-
pair d’inversions. La somme algébrique des h! quantités ainsi obtenues est,
par définition, la valeur de l’expression différentielle donnée.. . .
De ce qui précède, il résulte que l’on peut toujours mettre une expression
différentielle quelconque sous la forme d’une expression polynôme, chaque
monôme de cette dernière expression ne contenant pas de différentielles iden-
tiques et les différentielles qu’il contient étant rangées par ordre d’indices
croissantes. Nous disons que dans ces conditions l’expression est réduite à
sa forme la plus simple. . . .
Considérons un produit (symbolique) ω d’expressions différentielles
ω1 , ω2 , . . ., ωm .
Soit ω = ω1 ω2 . . . ωm . Imaginons que nous intervertissions deux des facteurs

de ce produit, ωµ , ων , supposés d’ordre h et k, et supposons que ces deux fac-
teurs soient séparés par un ou plusieurs autres facteurs megaρ de degré total
p. . . . L’expression différentielle ω est alors multipliée par (−1)hk+(h+k)p . . . .
Imaginons qu’on fasse sur x1 , x2 , . . . , xn un changement de variables
en prenant pour nouvelles variables n fonctions indépendantes y1 , y2 , . . . , yn
de x1 , x2 , . . . , xn . Alors réciproquement x1 , x2 , . . ., xn sont des fonctions in-
dépendantes de y1 , y2 , . . . , yn . Cela étant, remplaçons dans une expression
différentielle ω en x1 , x2 , . . ., xn les anciennes variables par les nouvelles et
les différentielles dx1 , dx2 , . . . , dxn par
∂x1 ∂x1 ∂x1

dy1 + dy2 + . . . + dyn ,
∂y1 ∂y2 ∂yn
...
∂xn ∂xn ∂xn
dy1 + dy2 + . . . + dyn .
∂y1 ∂y2 ∂yn
Nous obtiendrons ainsi une certaines expression différentielle - de même
degré en y1 , y2 , . . . , yn et dans laquelle chaque différentielle dy aura le même
rang que la différentielle dx qui l’a fournie avait dans ω. . . . Il résulte
immédiatement de là que, si les expressions ω1 , ω2 , . . . , ωm se transforment,
par le changement de variables, en -1 , -2 , . . . , -m, l’expression
ω = ω1 ω2 . . . ωm
se transforme en - = -1 -2 . . . -m . . . .
Etant donnée une expression de Pfaff à n variables
ω = A1 dx1 + A2 dx2 + . . . + An dxn ,
on appelle expression dérivée l’expression différentielle du deuxième degré

définie par l’égalité
ω $ = dA1 dx1 + dA2 dx2 + . . . + dAn dxn .
La propriété fondamentale de cette dérivée est la suivante :

Théorème.- Si un changement de variables transforme l’expression de
Pfaff ω en une expression -, ce même changement de variables transforme
l’expression dérivée ω $ dans l’expression dérivée -$ . . . .
Supposons que l’expression de Pfaff ω soit une différentielle exacte. Il
est clair alors que, par un changement de variables, elle peut se mettre sous
la forme - = dy1 . Or la dérivée de - est ici identiquement nulle, puisque
les coefficients des différentielles sont des constantes; il en résulte donc que
ω $ est également nulle. La dérivée d’une expression de Pfaff différentielle
exacte est donc identiquement nulle.
Elie Cartan, 1899

H
Prenons une variété quelconque Mp−1 ; l’intégrale ω $ étendue à cette
variété Mp−1 est égale, d’après la formule de Stokes généralisée, à l’intégrale
H
ω, étendue à la variété fermée à p dimensions Mp$ qui limite Mp .
Edouard Goursat, 1917

Chapitre 16
Analyse complexe
16.1 Intégrale sur une courbe

Soit C un arc de courbe simple dans C, c’est-à-dire l’image Γ(U ) d’une
application
Γ : U = [0, 1] → C, t 2→ Γ(t) = Γ1 (t) + iΓ2 (t)
continue sur U, injective sur [0, 1[ et telle que Γ(0) = Γ(1), ou injective sur
U . Soit f une fonction de C dans C définie sur C. Dans le cas particulier où
C est le segment de droite [c, d] joignant c ∈ C à d ∈ C avec sa représentation
canonique Σ : U → C, t 2→ c + t(d − c), l’introduction d’une intégrale de f
sur [c, d] analogue à l’intégrale d’une fonction réelle sur un intervalle fermé
conduit à la considération de “sommes de Riemann” du type
m
$
f (z j )(cj − cj−1 )
j=1
où l’on a découpé [c, d] en m sous-segments adjacents [cj−1 , cj ], avec c0 =

c, cm = d, et où chaque z j appartient à [cj−1 , cj ]. En termes de la représen-
tation paramétrique Σ, on a donc
z j = Σ(tj ), cj = Σ(aj ), 1 ≤ j ≤ m,
A B
pour une P-partition Π = (tj , ]aj−1 , aj ]) 1≤j≤m de ]0, 1] telle que a0 =
0, am = 1. L’extension au cas d’un arc de courbe quelconque C de représen-
tation paramétrique Γ conduit à la considération de “sommes de Riemann”
du type
m
$ 8 9
SC (Γ, f, Π) = f (Γ(tj )) Γ(aj ) − Γ(aj−1 )
j=1
643
644 CHAPITRE 16. ANALYSE COMPLEXE
A B
où Π = (tj , ]aj−1 , aj ]) 1≤j≤m est une P-partition de ]0, 1] telle que a0 =
0, am = 1, et à la définition suivante d’intégrabilité.
Définition. On dit que f est C−intégrable sur l’arc de courbe C de repré-
sentation paramétrique Γ s’il existe J ∈ C ayant la propriété suivante: pour
tout ! > 0, il existe une jauge δ sur U telle que pour toute P-partition δ-fine
Π de ]0, 1], on ait
|SC(Γ, f, Π) − J| ≤ !.
On montre aussitôt qu’il peut exister au plus un tel J, on le note

J J
f dΓ ou f (z) dz
C CΓ
pour rappeler son mode de construction, et on l’appelle l’intégrale de f sur

l’arc de courbe C de représentation paramétrique Γ. Une fois encore, on
peut construire à partir de cette définition une théorie de l’intégration ana-
logue à celle développée pour une fonction réelle d’une variable réelle. Nous
nous contenterons ici de montrer que, sous des hypothèses de régularité con-
venables pour f et Γ, cette intégrale se ramène à l’intégrale usuelle sur U
d’une fonction à valeurs complexes faisant intervenir f, Γ et Γ$ . Pour mo-
tiver l’introduction de cette fonction, il suffit, une fois encore, de supposer
Γ dérivable et d’appliquer, dans l’expression de la somme de Riemann, le
théorème de Lagrange à ses composantes Γk , k = 1, 2. On obtient ainsi
m
$ 8 9
SC (Γ, f, Π) = f (Γ(tj )) Γ(aj ) − Γ(aj−1 )
j=1
m
$ D E
= f (Γ(tj )) Γ1 (aj ) − Γ1 (aj−1 ) + i(Γ2 (aj ) − Γ2 (aj−1 ))
j=1
m
$ D E
= f (Γ(tj )) Γ$1 (tj1 ) + iΓ$2 (tj2 ) (aj − aj−1 ),
j=1
j j
pour des t1 et t2 appartenant à ]aj−1 , aj [, 1 ≤ j ≤ m. Si, dans cette dernière
expression, on remplace les tjk par tj , 1 ≤ j ≤ m, 1 ≤ k ≤ 2, on obtient la
somme de Riemann usuelle
m
$ D E
f (Γ(tj )) Γ$1 (tj ) + iΓ$2 (tj ) (aj − aj−1 )
j=1
16.2. FONCTIONS HOLOMORPHES, THÉORÈME DE CAUCHY 645
m
$
= f (Γ(tj ))Γ$ (tj )(aj − aj−1 ) = S(]0, 1], (f ◦ Γ)Γ$ , Π)
j=1
associée à l’application (f ◦ Γ)Γ$ de U dans C et à la P-partition Π de ]0, 1].

On peut alors démontrer, comme dans le cas de l’intégrale sur un arc de
courbe, le résultat suivant.
Proposition. Si f est bornée sur C et si Γ est de classe C 1 , les intégrales
J J 1
f (z)dz et (f ◦ Γ)Γ$
CΓ 0

Notons maintenant que la dernière intégrale peut encore s’écrire
J 1 J 1
(f ◦ Γ)(Γ$1 + iΓ$2 ) = (f ◦ Γ)Γ$1 + (if ◦ Γ)Γ$2 ,
0 0
H
et est donc égale, si l’on suppose f continue sur C, à l’intégrale Γ ωf sur le
1-simplexe Γ dans R2 ≈ C de la 1-forme différentielle complexe ωf définie
par
ωf = f dx1 + if dx2 .
Si l’on définit alors la 1-forme différentielle dz par
dz = dx1 + idx2 ,
(différentielle extérieure de l’application

H
(x1 , x2 ) → x1 + ix2 de R2 dans C),
on voit que l’étude de l’intégrale CΓ f (z)dz d’une fonction complexe continue
f sur l’arc de courbe C dans C de représentation
H
paramétrique Γ de classe
C 1 se ramène à l’étude de l’intégrale Γ f dz de la 1-forme différentielle dans
R2 ≈ C, f dz = f dx1 + if dx2 = ωf sur le 1-simplexe HΓ dans R2 ≈ C.
Lorsque
H
cela simplifiera l’écriture, on se permettra d’écrire Γ f (z) dz au lieu
de Γ f dz.
16.2 Fonctions holomorphes, théorème de Cauchy

Soit E ⊂ C un ouvert et f = f1 + if2 une fonction de C dans C de classe
C 1 sur E (c’est-à-dire, rappelons-le, telle que D1 f et D2 f existent et soient
continues sur E). Alors, la 1-forme ωf = f dz associée à f est de classe C 1
sur E.
Proposition. Soit E ⊂ C ouvert et f : E → C de classe C 1 . Alors ωf =

f dz est un 1-cocycle sur E si et seulement si les relations de Cauchy-Riemann
1
D1 f = D2 f
i
sont satisfaites.
d(f dz) = d(f dx1 + if dx2 ) = df ∧ dx1 + d(if ) ∧ dx2 =

4 5
1
D2 f dx2 ∧ dx1 + iD1 f dx1 ∧ dx2 = i D1 f − D2 f dx1 ∧ dx2 ,
i
et la thèse en résulte aussitôt.
Cette Proposition suggère l’introduction d’une classe importante de fonc-
tions de C dans C.
Définition. Si E ⊂ C est un ouvert non vide et f une fonction de C dans
C, on dit que f est continûment C-dérivable ou holomorphe sur E si f est
C-dérivable en chaque point de E et si la fonction C-dérivée f $ est continue
sur E.
Ainsi, tout polynôme de C dans C est holomorphe sur C, toute fonction
rationnelle de C dans C est holomorphe sur le complémentaire des zéros de
son dénominateur et la somme d’une série entière est holomorphe sur son
disque de convergence.
Donnons une caractérisation des fonctions holomorphes.
Proposition. Si E ⊂ C est un ouvert non vide et f une fonction de C dans
C, alors f est holomorphe sur E si et seulement si la 1-forme différentielle
ωf = f dz est un 1-cocycle de classe C 1 sur E.
Démonstration. Si f est holomorphe sur E, alors, par la caractérisation
de Fréchet-Young des fonctions C-dérivables et la Proposition qui précède,
on voit que ωf est un 1-cocycle de classe C 1 sur E. Réciproquement, si ωf est
un 1-cocycle de classe C 1 sur E, alors f est de classe C 1 sur E et vérifie, en
vertu de la Proposition précédente, les conditions de Cauchy-Riemann. La
caractérisation de Fréchet-Young des fonctions C-dérivables entraı̂ne qu’elle
est C-dérivable en chaque point de E et que
f $ = D1 f
sur E. Donc f $ est continue sur E et f y est holomorphe.

16.2. FONCTIONS HOLOMORPHES, THÉORÈME DE CAUCHY 647
Il est intéressant de caractériser les fonctions f pour lesquelles ωf est un

1-cobord sur E.
Proposition. Soit E ⊂ C un ouvert non vide et f une fonction de C dans
C continue sur E. Alors f dz est un 1-cobord sur E si et seulement s’il existe
une fonction g de C dans C holomorphe sur E et telle que
f = g $.
Démonstration. Par définition, f dz est un 1-cobord sur E si et seulement

s’il existe une 0-forme sur E, c’est-à-dire une application g : E → C de classe
C 1 telle que
f dx1 + if dx2 = f dz = dg = D1 g dx1 + D2 g dx2 .
Les écritures étant canoniques, cela équivaut à

1
D1 g = f = D2 g,
i
c’est-à-dire à l’holomorphie de g sur E.
Cette Proposition conduit naturellement à la définition suivante.
Définition. Soit E ⊂ C un ouvert non vide et f une fonction de C dans
C continue sur E. On dit que f est C-primitivable sur E s’il existe une
fonction g de C dans C holomorphe sur E et telle que f = g $ sur E. Une
telle fonction g est appelée une C-primitive de f sur E.
Les fonctions f pour lesquelles les 1-formes différentielles f dz sont des
1-cobords sur E sont donc les fonctions C-primitivables sur E.
Ainsi, pour tout entier n ≥ 2, la fonction f : z 2→ z −n est C-primitivable
sur C\{0} puisque z −n = (1−n)−1 (z 1−n )$ . Par contre, la fonction f : z 2→ 1z ,
holomorphe sur C \ {0}, n’y est pas C-primitivable. En effet, sur le 1-cycle
Γ : [0, 1] → C, t 2→ exp 2iπt (dont l’image est le cercle unité), on a
J J
dz 1 2iπ exp 2iπt
= dt = 2iπ /= 0,
Γ z 0 exp 2iπt
alors que cette intégrale serait nulle si 1/z était C-primitivable sur C \ {0},
puisqu’alors ω1/z serait un 1-cobord sur C \ {0}.
La réciproque du théorème de Poincaré appliqué à f dz et les résultats
qui précèdent fournit une condition géométrique sur E pour qu’une fonction
holomorphe sur E y soit C-primitivable.
Corollaire. Si E ⊂ C est un ouvert étoilé non vide, toute fonction f de C

dans C holomorphe sur E y est C-primitivable.
Une conséquence importante des résultats du chapitre précédent sur
l’annulation de l’intégrale d’un cobord sur un cycle ou d’un cocycle sur un
bord fournissent deux versions légèrement différentes d’une propriété impor-
tante des fonctions holomorphes portant le nom de théorème de Cauchy.
Théorème. Si E ⊂ C est un ouvert étoilé non vide et f une fonction de C
dans C holomorphe sur E, alors pour tout 1-cycle Γ dans E de classe C 1 on
a J
f dz = 0.
Γ
Démonstration. Par la réciproque du théorème de Poincaré et le fait que
f dz soit un 1-cocycle, f dz est un 1-cobord sur E et le résultat s’ensuit.
Théorème. Si E ⊂ C est un ouvert non vide et f une fonction de C dans

C holomorphe sur E, alors pour tout 1-bord Γ dans E de classe C 2 on a
J
f dz = 0.
Γ
Démonstration. Immédiat puisque l’holomorphie de f entraı̂ne que f dz

est un 1-cocycle sur E.
Dans le même ordre d’idées, on a le résultat suivant pour les fonctions
C-primitivables.
Théorème. Si E ⊂ C est un ouvert non vide et f une fonction de C dans
C C-primitivable sur E, alors pour tout 1-cycle Γ dans E de classe C 1 on a
J
f dz = 0.
Γ
Démonstration. Immédiat puisque la C-primitivabilité de f entraı̂ne que

f dz est un 1-cobord sur E.
16.3 Résidus
Soit a ∈ C, V un voisinage ouvert de a et f une fonction de C dans C
holomorphe sur V \ {a}.
16.3. RÉSIDUS 649
Définition. On appelle résidu de f en a, et on note Rés(f ; a), le nombre

complexe J
1
Rés (f ; a) = f dz,
2iπ Σa,r
où r > 0 est tel que B2 [a; r] ⊂ V et où
Σa,r : [0, 1] → C, t 2→ a + r exp 2iπt
est le 1-simplexe représentation canonique du cercle de centre a et de rayon

r dans C.
Pour justifier cette définition, il faut encore montrer que l’intégrale du
membre de droite ne dépend pas du choix de r > 0 dès que la condition
B2 [a; r] ⊂ V est réalisée. Cela résulte aussitôt de la Proposition suivante.
Proposition. Dans les conditions de la définition ci-dessus, si 0 < r1 < r2
sont tels que B2 [a; r2] ⊂ V, on a
J J
f dz = f dz.
Σa,r1 Σa,r2
A[a; r1 , r2] = {z ∈ C : r1 ≤ |z − a| ≤ r2 }
l’anneau de centre a et de rayons r1 et r2 dans C ≈ R2 . Si l’on définit le

2-simplexe Θa,r1 ,r2 : U 2 → C par
Θa,r1 ,r2 (u1 , u2 ) = a + [r1 + u2 (r2 − r1 )] exp 2iπu1 ,
on voit facilement que
Θ(·, 0) = Σa,r1 , Θ(·, 1) = Σa,r2 ,
et dès lors Σa,r1 et Σa,r2 sont homotopes dans V \ {a} ⊃ A[a; r1, r2 ]. Comme
f dz est un 1-cocycle dans A[a; r1, r2 ], la thèse découle d’un résultat connu.
Une conséquence immédiate de la définition est que, pour tout c ∈ C, on
a Rés(cf ; a) = cRés(f ; a).
Nous aurons besoin dans ce qui suit d’un résultat de nature purement
technique. Si m ≥ 2 est un entier, nous désignerons par Σm a,r une 1-chaı̂ne
formée de m 1-simplexes dont l’image est le cercle dans C de centre a et de
rayon r et telle que
Σma,r = Σa,r
On pourra prendre par exemple
a,r = Σa,r + {a + r} + . . . + {a + r}
Σm
où {a + r} désigne le 1-simplexe constant t 2→ a + r, ou bien

m
$
a,r =
Σm Σj,a,r
j=1
où
Σj,a,r : U → C, t 2→ a + r exp[2iπ(j − 1 + t)/m], 1 ≤ j ≤ m.
Le résidu de f en a peut donc se calculer en remplaçant Σa,r par Σm a,r . Il
peut aussi se calculer en remplaçant Σa,r par un cycle Φ dans V \ {a} de
classe C 2 par morceaux homotope dans V \ {a} à Σm a,r . On dit qu’un tel Φ
entoure une fois le point a.
Donnons quelques exemples de calcul de résidu.
Proposition. Si V est un voisinage ouvert de a ∈ C et f une fonction de
C dans C holomorphe sur V \ {a} et telle que
lim (z − a)f (z) = b,

z→a,z(=a
alors
Rés(f ; a) = b.
Démonstration. Pour tout r > 0 tel que B2 [a; r] ⊂ V, on a
J J
1 1
Rés(f ; a) = f dz = f (a + r exp(2iπt))r exp(2iπt) dt =
2iπ Σa,r 0
2J 1 3
lim f (a + r exp(2iπt))r exp(2iπt) dt ,
r→0, r>0 0
puisque le premier membre ne dépend pas du r > 0 suffisamment petit choisi.

En utilisant le théorème sur la limite des valeurs d’une fonction définie par
une intégrale, dont il est facile de vérifier les hypothèse, on obtient
J 1 2 3 J 1
Rés(f ; a) = lim f (a + r exp(2iπt))r exp(2iπt) dt = b dt = b.
0 r→0, r>0 0
16.4. REPRÉSENTATION INTÉGRALE 651
Corollaire. Si V est un voisinage ouvert de a ∈ C et f une fonction de C

dans C holomorphe sur V \ {a} et localement bornée en a, alors
Rés(f ; a) = 0.
C’est en particulier le cas si limz→a,z(=a f (z) existe ou si f est holomorphe

sur V .
Démonstration. On a en effet dans ce cas
lim (z − a)f (z) = 0.

z→a, z(=a
En particulier, on a 4 5
1
Rés ; a = 1.
z−a
Proposition. Si V est un voisinage ouvert de a ∈ C et f une fonction de
C dans C holomorphe et C-primitivable sur V \ {a}, alors
Rés(f ; a) = 0.
Démonstration. Les hypothèses entraı̂nent que f dz est un 1-cobord sur

V \ {a}.
En particulier, pour tout entier k ≥ 2, on a
1 d 1
= ,
(z − a)k dz (1 − k)(z − a)k−1
et la fonction z 2→ 1
(1−k)(z−a)k−1
est holomorphe sur C \ {a}. Donc,
4 5
1
Rés ; a = 0, k ≥ 2.
(z − a)k
16.4 Représentation intégrale

Une conséquence importante de la notion de résidu est la formule de
représentation intégrale d’une fonction holomorphe due à Augustin
Cauchy.
Théorème. Soit E ⊂ C un ouvert non vide et f une fonction de C dans C

holomorphe sur E. Alors, pour tout a ∈ E, tout r > 0 tel que B2 [a; r] ⊂ E
%
et tout cycle Φ = m l=1 Φ dans E \{a} de classe C par morceaux homotope
l 2
dans E \ {a} à Σa,r , on a

m
J
1 f (z)
f (a) = dz.
2iπ Φ z − a
Démonstration. Soit g la fonction de C dans C définie par
f (z)
g(z) = .
z−a
Par les propriétés élémentaires de la C−dérivabilité, g est holomorphe sur
E \ {a} et telle que
lim (z − a)g(z) = f (a).
z→a
En conséquence, en vertu des propriétés et des résultats de calcul du résidu,
on a
J J J
1 f (z) 1 1
dz = g dz = g dz = Rés(g; a) = f (a).
2iπ Φ z − a 2iπ Φ 2iπ Σm a,r
La formule de Cauchy fournit une représentation d’une fonction holomor-

phe par une fonction définie par une intégrale. Elle montre que les valeurs
d’une fonction holomorphe à l’intérieur d’un contour fermé sont entièrement
déterminées par les valeurs de la fonction sur le seul contour.
Le résultat suivant fournit une classe intéressante de cycles auxquels le
résultat précédent peut être appliqué.
Lemme. Soient a ∈ C, r > 0, b ∈ B2 (a; r) et ρ > 0 tel que B2 [b; ρ] ⊂
B2 [a; r]. Alors, Σb,ρ et Σa,r sont homotopes dans B2 [a; r] \ {b}.
Démonstration. Soit Θ : U 2 → C le 2-simplexe défini par
Θ(u1 , u2 ) = (1 − u2 )[b + ρ exp(2iπu1 )] + u2 [a + r exp(2iπu1)].
C’est un cycle de classe C ∞ tel que
Θ(·, 0) = Σb,ρ , Θ(·, 1) = Σa,r .
D’autre part, Θ(u) /= b pour tout u ∈ U 2 et
|Θ(u) − a|2 ≤ (1 − u2 )|b + ρ exp(2iπu1) − a|2 + u2 r
≤ (1 − u2 )r + u2 r = r,
ce qui montre que Θ(U 2 ) ⊂ B2 [a; r] et achève la démonstration.
16.4. REPRÉSENTATION INTÉGRALE 653
Corollaire. Dans les conditions de la formule de représentation intégrale

de Cauchy, on a, pour tout w ∈ B2 (a; r),
J
1 f (z)
f (w) = dz.
2iπ Σa,r z − w
Démonstration. Soit w ∈ B2 (a; r); il existe donc ρ > 0 tel que B2 [w; ρ] ⊂
B2 [a; r] ⊂ E. En appliquant la formule de représentation intégrale à w, ρ et
Σw,ρ , on obtient
J
1 f (z)
f (w) = dz.
2iπ Σw,ρ z − w
Mais, par le Lemme ci-dessus, Σw,ρ et Σa,r sont homotopes dans B2 [a; r] \
{w}, ce qui entraı̂ne
J J
f (z) f (z)
dz = dz,
Σw,ρ z − w Σa,r z − w
Nous allons voir que la formule de représentation intégrale de Cauchy
a comme conséquence surprenante que l’holomorphie d’une fonction sur un
ouvert, c’est-à-dire essentiellement sa C-dérivabilité première, entraı̂ne son
indéfinie C-dérivabilité sur cet ouvert, phénomène qui n’a évidemment pas
d’équivalent pour la dérivabilité ordinaire. Nous aurons besoin pour ce faire
d’un résultat préliminaire.
Lemme. Soit f une fonction de C dans C C-dérivable sur un ouvert non
vide E ⊂ C et de classe C ∞ (comme fonction de R2 dans R2 ) sur E. Alors
f est indéfiniment (continûment) C-dérivable sur E.
Démonstration. Par hypothèse, on a, pour tout z ∈ E, en vertu des
conditions de Cauchy-Riemann,
1
D1 f (z) = D2 f (z) = f $ (z).
i
Dès lors f est de classe C sur E et, en vertu des identités qui précèdent
$ ∞
et du théorème de Schwarz, on a
1 1 1
D1 f $ (z) = D1 D2 f (z) = D2 D1 f (z) = D2 f $ (z).
i i i
Les conditions de Cauchy-Riemann sont donc satisfaites pour f $ et les dé-
rivées partielles correspondantes sont continues. Donc f $ est totalement
dérivable sur E et y vérifie les conditions de Cauchy-Riemann, ce qui entraı̂ne
sa C-dérivabilité sur E. En appliquant le même raisonnement à partir de f $ ,
on obtient la C-dérivabilité de f $$ , et ainsi de suite.
Proposition. Soit f une fonction de C dans C holomorphe sur l’ouvert non

vide E ⊂ C. Alors, pour chaque a ∈ E et chaque entier k ≥ 0, la C-dérivée
ke
dk f
f (k) (a) = k (a)
dz
existe et, pour tout r > 0 tel que B2 [a; r] ⊂ E, on a
J
k! f (z)
f (k) (a) = dz.
2iπ Σa,r (z − a)k+1
Démonstration. Soit a ∈ E et r > 0 tel que B2 [a; r] ⊂ E,. En vertu
du Corollaire de la formule de représentation de Cauchy, on a, pour tout
w = w1 + iw2 ∈ B2 (a; r),
J
1 f (z)
f (w) = dz
2iπ Σa,r z − w
J J
1 f (a + r exp(2iπt)) r exp(2iπt) 1
= dt = h(w1 , w2, t) dt.
0 a + r exp(2iπt) − (w1 + iw2 ) 0
Considérée comme fonction de w1 et w2 , f est donc égale sur B2 (a; r) à une
fonction définie par l’intégrale d’une fonction h qui est indéfiniment dérivable
par rapport à w1 et w2 et continue sur B2 (a; r) × R. On en déduit aisément
que les conditions du théorème de Leibniz de dérivation sous le signe intégral
sont satisfaites pour tous les ordres de dérivation par rapport à w1 et w2 ; on
en déduit que f est de classe C ∞ sur B2 (a; r), et donc sur E puisque a ∈ E
est arbitraire. Dès lors, par le Lemme qui précède, f sera indéfiniment C-
dérivable sur E et, en appliquant la règle de Leibniz, on trouvera pour tout
w ∈ B2 (a; r),
2J 1 3 J 1
f (k) (w) = D1k h(w1 , w2, t) dt = D1k h(w1 , w2, t) dt
0 0
J J
1k!f (a + r exp(2iπt))r exp(2iπt) k! f (z)
= dt = dz;
0 [a + r exp(2iπt) − (w 1 + iw 2 )] k+1 2iπ Σa,r (z − w)k+1
le résultat s’en déduit aussitôt en prenant w = a.
On obtient ainsi, pour les C-dérivées successives d’une fonction holomor-
phe, des formules de représentation intégrale ne faisant intervenir que la
valeur de la fonction.
Donnons deux conséquences simples mais intéressantes de la formule
de représentation des C-dérivées. La première fournit les inégalités de
Cauchy.
16.5. THÉORÈME DE TAYLOR ET FONCTIONS ANALYTIQUES 655
Corollaire. Si f est une fonction de C dans C holomorphe sur un ouvert

non vide E ⊂ C, alors, pour tout a ∈ E, tout entier k ≥ 0 et tout r > 0 tel
que B2 [a; r] ⊂ E, on a
k! Mf (r; a)
|f (k) (a)| ≤ ,
rk
où
Mf (r; a) = max |f (z)|.
|z−a|=r
Démonstration. En vertu de la formule de représentation ci-dessus, on a
# #
# k! J f (z) #
# #
|f (k)
(a)| = # dz #
# 2iπ Σa,r (z − a)k+1 #
J 1 |f (a + r exp(2iπt)|r k! Mf (r; a)
≤ k! k+1
dt ≤ .
0 r rk
La deuxième conséquence porte le nom de théorème de Liouville.

Corollaire. Si f est une fonction de C dans C holomorphe et bornée sur
C, alors f est constante sur C.
Démonstration. Soit M > 0 tel que |f (z)| ≤ M pour tout z ∈ C, et soit
a ∈ C. Alors, quel que soit r > 0, on a, en vertu du Corollaire précédent et
des relations de Cauchy-Riemann,
Mf (r; a) M
|D1 f (a)| = |D2 f (a)| = |f $ (a)| ≤ ≤ ,
r r
ce qui entraı̂ne l’annulation des dérivées en faisant tendre r vers l’infini.
L’inégalité de la moyenne entraı̂ne aussitôt que f est constante sur C.
16.5 Théorème de Taylor et fonctions analytiques

On a vu au Chapitre 12 que la somme d’une série entière est une fonction
indéfiniment C-dérivable à l’intérieur de son disque de convergence. Nous al-
lons démontrer une réciproque partielle de ce résultat: une fonction complexe
holomorphe sur un ouvert E ⊂ C peut s’écrire, au voisinage de chaque point
de E, comme somme d’une série entière convergeant dans un certain disque
ouvert centré au point considéré. Ce résultat porte le nom de théorème
de Taylor pour rappeler que le mode de construction des coefficients de
cette série entière est identique à celui apparaissant dans le développement
de Taylor d’une fonction réelle d’une variable réelle.
Théorème. Soit f une fonction de C dans C holomorphe sur un ouvert non

vide E ⊂ C. Soit a ∈ E et
ra = sup{r > 0 : B2 (a; r) ⊂ E}.
Alors, pour tout z ∈ B2 (a; ra) (z ∈ C si ra = +∞), on a
∞
$ f (k) (a)
f (z) = (z − a)k ,
k=0
k!
la série entière du second membre convergeant absolument dans B2 (a; ra) et

uniformément dans B2 [a; r] pour tout r ∈ ]0, ra[.
Démonstration. Soit w ∈ B2 (a; ra) et soit r ∈ ]0, ra[ tel que w ∈
B2 [a; r] (r = (1/2)(|w − a| + ra) par exemple). Par le Corollaire du théorème
de représentation intégrale des fonctions holomorphes, on a,
J
1 f (z)
f (w) = dz.
2iπ Σa,r z − w
Comme, pour tout z ∈ fr B2 (a; r) = Σa,r (U ), on a
# #
#w − a# |w − a| |w − a|
#
# z − a # = |z − a| =
# < 1,
r
on obtient, en utilisant la formule de la somme d’une série géométrique
convergente,
4 5−1 ,
∞ 4 5-
f (z) f (z) f (z) w−a f (z) $ w−a k
= = 1− = .
z−w z − a − (w − a) z−a z−a z − a k=0 z − a
Introduisant cette expression dans la représentation intégrale de f (w) donnée

plus haut, on obtient
J ∞ 4
, 5 -
1 f (z) $ w−a k
f (w) = dz
2iπ Σa,r z − a k=0 z − a
J ∞
1$ (w − a)k
= f (a + r exp(2iπt)) dt.
0 k=0 r k exp(2iπkt)
Pour pouvoir permuter les signes intégrale et série dans cette expression, il
suffit de montrer que la série (de fonctions de t) converge uniformément sur
[0, 1]. On a
# #
# (w − a)k ## |w − a|k
#
#f (a + r exp(2iπt)) k # ≤ Mf (r; a) .
# r exp(2iπkt) # rk
16.5. THÉORÈME DE TAYLOR ET FONCTIONS ANALYTIQUES 657
%
Comme |w − a|/r < 1, la série numérique k∈N(|w − a|/r)k converge et le
test de Weierstrass entraı̂ne la convergence normale sur [0, 1] de la série
∞
$ (w − a)k
f (a + r exp(2iπt)) .
k=0
r k exp(2iπkt)
Par conséquent,
∞ J
$ 1 (w − a)k
f (w) = f (a + r exp(2iπt)) dt
k=0 0
r k exp(2iπkt)
∞ 2J 3
$ 1 r exp(2iπt)
= (w − a)k f (a + r exp(2iπt)) dt
k=0 0 r k+1 exp(2iπ(k + 1)t)
∞ J ∞
$ 1 f (z) $ f (k) (a)
= (w − a)k dz = (w − a)k ,
k=0
2iπ Σa,r (z − a)k+1 k=0
k!
où, pour obtenir le dernier terme, on a utilisé la formule de représentation
intégrale des C-dérivées successives d’une fonction holomorphe. La série
entière du membre de droite étant convergente (puisqu’égale à f (w)) pour
tout w ∈ B2 (a; ra), son rayon de convergence sera supérieur ou égal à ra . Les
propriétés de convergence absolue et uniforme d’une série entière fournissent
alors les résultats de convergence annoncés.
L’unicité de la représentation de f comme série entière résulte de la
Proposition suivante.
Proposition. Soit f une fonction de C dans C holomorphe dans un ouvert
non vide E ⊂ C, soit a ∈ E et ra donné par le théorème de Taylor. S’il
%
existe une série entière k∈N ak (z − a)k de rayon de convergence au moins
égal à ra et telle que, pour tout z ∈ B2 (a; ra), on ait
∞
$
f (z) = ak (z − a)k ,
k=0
alors, pour chaque k ∈ N, on a

f (k) (a)
. ak =
k!
Démonstration. Par le théorème de Taylor et l’hypothèse, on a, pour
tout z ∈ B2 (a; ra),
∞
& '
$ f (k) (a)
0= ak − (z − a)k ,
k=0
k!
ce qui montre que la série entière du membre de droite converge au moins

dans B2 (a; ra) et y représente la fonction holomorphe nulle. En particulier,
en faisant z = a, on trouve a0 = f (a). En outre, les séries dérivées successives
de la série du membre de droite représentent dans le même disque les C-
dérivées successives de la fonction nulle, c’est-à-dire la fonction nulle. On a
donc, pour chaque entier m ≥ 1,
∞
& '
$ f (k) (a)
0= (k − m + 1)(k − m + 2) . . .(k − 1)k ak − (z − a)k−m ,
k=m
k!
ce qui entraı̂ne, en y faisant z = a,

& '
f (m) (a)
0 = m! am − ,
m!
Le développement de f (z) en série entière s’appelle la série de Taylor de
f au voisinage de a ou autour de a.
Cette propriété suggère la définition suivante.
Définition. Soit K = R ou C, E ⊂ K un ouvert non vide et f une fonction
de K dans K. On dit que f est analytique sur E si, pour chaque a ∈ E,
il existe un voisinage V de a contenu dans E et une série entière (réelle si
%
K = R) k∈N ak (z − a)k telle que, pour tout z ∈ V , on ait
∞
$
f (z) = ak (z − a)k .
k=0
Le résultat suivant montre, pour les fonctions complexes d’une variable

complexe, l’identité entre les fonctions holomorphes et les fonctions analy-
tiques.
Proposition. Si E ⊂ C est un ouvert non vide, alors f est analytique sur
E si et seulement si f est holomorphe sur E.
Démonstration. Condition nécessaire. Si f est analytique sur E et si
a ∈ E, il existe un voisinage Va de a tel que, sur ce voisinage, f soit égale
à la somme d’une série entière. Par les propriétés des séries entières, f sera
donc continûment C-dérivable, et donc holomorphe sur Va. En conséquence,
f est holomorphe sur E = ∪a∈E Va.
Condition suffisante. C’est une conséquence immédiate du théorème de
Taylor.
16.6. POINTS SINGULIERS ISOLÉS ET THÉORÈME DE LAURENT659
16.6 Points singuliers isolés et théorème de Lau-

rent
Si a ∈ C et si 0 < r1 < r2 sont donnés, appelons anneau ouvert de centre a
et de rayons r1 et r2 l’ensemble
A(a; r1, r2 ) = {z ∈ C : r1 < |z − a| < r2 }.
On vérifie sans peine que A(a; r1, r2) = int A[a; r1, r2].
Nous commencerons par donner, pour une fonction holomorphe sur un
anneau, une extension du théorème de Taylor, appelée théorème de Laurent.
Sa démonstration requiert le lemme suivant.
Lemme. Soit A(a; r1 , r2) un anneau ouvert, b ∈ A(a; r1, r2) et f une fonc-
tion de C dans C holomorphe sur A(a; r1, r2 ) \ {b} et continue en b. Pour
tout 0 < r1 < ρ1 ≤ ρ2 < r2 , on a
J J
f dz = f dz.
Σa,ρ1 Σa,ρ2
Démonstration. Définissons la fonction g sur ]r1 , r2[ par

J J 1
g(r) = f dz = 2iπr f (a + r exp(2iπt)) exp(2iπt) dt.
Σa,r 0
Puisque f est continue sur A(a; r1, r2 ), il résulte du théorème sur la continuité
des fonctions définies par une intégrale que g est une fonction de R dans C
continue sur ]r1 , r2 [. D’autre part, si l’on pose r3 = |b − a|, f est, par
hypothèse, holomorphe sur A(a; r1, r3 ) et sur A(a; r3, r2). Dès lors g doit
être constante sur ]r1 , r3 [ et constante sur ]r3 , r2[. Comme elle est continue
sur ]r1 , r2[, elle doit y être constante, et la démonstration est complète.
Remarque. Le Lemme ci-dessus s’étend sans peine au cas où f est holomor-
phe sur A(a; r1, r2 ) à l’exception d’un nombre fini de points de A(a; r1, r2).
Nous pouvons maintenant énoncer et démontrer le théorème de Lau-
rent.
Théorème. Soit A(a; r1 , r2) un anneau ouvert de C et f une fonction de C
dans C holomorphe sur A(a; r1, r2 ). Alors, pour tout z ∈ A(a; r1, r2), on a
f (z) = fr (z) + fp (z),

où ∞ ∞
$ $
fr (z) = ck (z − a)k , fp (z) = c−k (z − a)−k ,
k=0 k=1
J
1 f (z)
ck = dz, k ∈ Z, ρ ∈ ]r1 , r2[.
2iπ Σa,ρ (z − a)k+1
En outre, fr est holomorphe sur B2 (a; r2) et fp est holomorphe sur C \
B2 [a; r1].
Démonstration. On notera tout d’abord que, suite à l’holomorphie sur
A(a; r1, r2 ) des fonctions
f (z)
z 2→ , k ∈ Z,
(z − a)k+1
la valeur des ck donnée par la formule ci-dessus ne dépend pas du choix de
ρ dans ]r1 , r2[, puisque deux Σa,ρ correspondant à des valeurs différentes de
ρ dans ]r1 , r2[ sont homotopes dans A(a; r1, r2). Soit w ∈ A(a; r1, r2 ) et g la
fonction de C dans C définie sur A(a; r1 , r2) par
f (z) − f (w)
g(z) = si z /= w, g(w) = f $ (w).
z−w
Il est clair que g est holomorphe sur A(a; r1, r2) \ {w} et continue au point
w. Dès lors, par le lemme précédent, on a
J 2 3 J 2 3
f (z) f (w) f (z) f (w)
− dz = − dz,
Σa,ρ1 z−w z−w Σa,ρ2 z − w z −w
c’est-à-dire,
&J J ' J J
dz dz f (z) f (z)
f (w) − = dz − dz.
Σa,ρ2 z −w Σa,ρ1 z − w Σa,ρ2 z−w Σa,ρ1 z − w
Mais, puisque la fonction z 2→ 1/(z − w) est holomorphe sur B2 (a; |w − a|) ⊃

B2 [a; ρ1], on a, par le théorème de Cauchy,
J
dz
= 0,
Σa,ρ1 z−w
tandis que, puisque w ∈ B2 (a; ρ2), on a, par le Corollaire de la formule de
représentation intégrale appliqué à la fonction constante 1,
J
1 dz
1= .
2iπ Σa,ρ2 z − w
Introduisant ces deux résultats dans la formule qui les précède, on obtient
une formule de représentation intégrale pour f
J J
1 f (z) 1 f (z)
f (w) = dz − dz.
2iπ Σa,ρ2 z − w 2iπ Σa,ρ1 z − w
Pour la première intégrale du membre de droite, on peut procéder exacte-

ment comme dans la démonstration du théorème de Taylor en écrivant
∞
f (z) f (z) $ f (z)(w − a)k
= = ,
z−w z − a − (w − a) k=0 (z − a)k+1
ce qui entraı̂ne, avec les mêmes justifications,

J ∞
& J '
1 f (z) $ 1 f (z)
dz = dz (w − a)k
2iπ Σa,ρ2 z − w k=0
2iπ Σ a,ρ 2
(z − a) k+1
∞
$
= ck (w − a)k ,
k=0
puisque la valeur des ck ne dépend pas du choix de ρ dans ]r1 , r2[. En ce qui
concerne la deuxième intégrale de la représentation, on a, puisque
# #
#z−a#
#
# w − a # < 1 pour tout z ∈ Σa,ρ1 (U ),
#
f (z) f (z) f (z)

− = =
z−w w − a − (z − a) (w − a)(1 − w−a )
z−a
∞ ∞
$ f (z)(z − a)k $ f (z)(z − a)k−1
= = .
k=0
(w − a)k+1 k=1
(w − a)k
0n a, en outre, pour z ∈ fr B2 [a; ρ1] et k ∈ N∗ ,
# # 4 5k−1
# f (z)(z − a)k−1 # |f (z)|ρk−1 Mf (ρ1 ; a) ρ1
# #
# # = 1
≤ .
# (w − a)k # |w − a|k |w − a| |w − a|
Comme |w − a| > ρ1 , le test de Weierstrass entraı̂ne que la série de fonctions

(de t)
$ f (a + ρ1 exp(2iπt))(ρ1 exp(2iπt))k−1(2iπρ1 exp(2iπt))
k∈N∗
(w − a)k
converge uniformément sur U et l’on peut permuter les signes série et inté-
grale. On obtient ainsi
J J ∞
1 f (z) 1 $ f (z)(z − a)k−1
− dz = dz
2iπ Σa,ρ1 z − w 2iπ Σa,ρ1 k=1 (w − a)k
J ∞
1$ f (a + ρ1 exp(2iπt))(ρ1 exp(2iπt))k−1(ρ1 exp(2iπt))
= dt
0 k=1
(w − a)k
∞ J 1
$ f (a + ρ1 exp(2iπt))(ρ1 exp(2iπt))k−1(ρ1 exp(2iπt))
= dt
k=1 0
(w − a)k
∞ J
$ 1 f (z)(z − a)k−1
= dz
k=1
2iπ Σa,ρ1 (w − a)k
∞
& J ' ∞
$ 1 f (z) −k
$
= dz (w − a) = c−k (w − a)−k ,
k=1
2iπ Σa,ρ1 (z − a)1−k k=1
puisque la valeur de ck ne dépend pas du choix de ρ dans ]r1 , r2[. Enfin, la
série entière égale au premier terme de la représentation intégrale de f con-
verge pour tout w ∈ B2 (a; ρ2) quel que soit ρ2 < r2 , et dès lors converge dans
B2 (a; r2) où sa somme est holomorphe. De même, en remplaçant (w − a)−1
par v dans la série entière associée au deuxième membre de la représentation
%
intégrale de f , on voit que la série entière k∈N∗ c−k v k converge pour tout
v tel que |v| < ρ1 quel que soit ρ1 > r1 , et donc pour tout v ∈ B2 (0, r1),
sa somme y étant holomorphe. En composant cette fonction holomorphe
avec la fonction w 2→ (w − a)−1 holomorphe sur C \ {a}, on voit que fp sera
holomorphe sur C \ B2 [a; r1], ce qui achève la démonstration.
Remarques. 1. Un raisonnement semblable à celui donné pour le dévelop-
pement de Taylor montre que, dans les conditions du théorème de Laurent,
la décomposition de f en fr et fp est unique. En conséquence, fr +fp avec fr
et fp donnés par l’énoncé du théorème de Laurent, s’appelle le développement
de Laurent de f dans la couronne A(a; r1, r2 ). Au lieu de
∞
$ ∞
$
ck (z − a)k + c−k (z − a)−k ,
k=0 k=1
on écrit souvent, pour abréger,

+∞
$
ck (z − a)k .
k=−∞
La fonction
∞
$
fr : z 2→ ck (z − a)k
k=0
s’appelle la partie régulière de f sur A(a; r1, r2) et la fonction

∞
$
fp : z 2→ c−k (z − a)−k
k=1
s’appelle la partie principale de f sur A(a; r1 , r2).

2. On notera que, sous les hypothèses du théorème de Laurent, les co-
(k)
efficients ck pour k ∈ N∗ ne peuvent pas s’écrire f k!(a) puisque f n’est
pas supposée holomorphe sur un voisinage de a. Bien entendu, si f est
holomorphe sur un voisinage de a contenant B2 [a; r1], les coefficients de fp
f (k) (a)
s’annulent en vertu du théorème de Cauchy, ceux de fr sont égaux à k!
et le développement de Laurent se ramène au développement de Taylor.
Le théorème de Laurent fournit une classification des points singuliers
isolés d’une fonction f de C dans C.
Définition. On dit que a est un point singulier isolé de f si f n’est holo-
morphe sur aucun voisinage de a et s’il existe un voisinage V de a tel que f
soit holomorphe sur V \ {a}.
Par exemple, 0 est un point singulier isolé de la fonction f : z 2→ 0 si z /= 0
et f (0) = 1, de la fonction f : z 2→ 1/z et de la fonction f : z 2→ exp(1/z).
Si a est un point singulier de f , si V est un voisinage de a tel que f
soit holomorphe sur V \ {a} et si r2 > 0 est tel que B2 (a; r2) ⊂ V , alors f
sera holomorphe sur A(a; r1, r2) pour tout 0 < r1 < r2 . Par le théorème de
Laurent, f pourra s’écrire, pour tout z ∈ B2 (a; r2) \ {a},
∞
$ ∞
$
f (z) = fr,a (z) + fp,a (z) = ck (z − a)k + c−k (z − a)−k ,
k=0 k=1
où J
1 f (z)
ck = dz, k ∈ Z,
2iπ Σa,ρ (z − a)k+1
et ρ est quelconque dans ]0, r2[. En outre, la série représentant fr,a converge
absolument dans B2 (a; r2) et la série représentant fp,a converge absolument
dans C\{a}. L’expression fr,a +fp,a s’appelle le développement de Laurent de
f au point a, ou au voisinage de a, ou autour de a, la fonction fr,a s’appelle
la partie régulière de f en a et la fonction fp,a s’appelle la partie principale

de f en a.
Trois cas peuvent se présenter.
1. fp,a = 0, c’est-à-dire c−k = 0 pour tout k ∈ N∗ .
On dit que a est un point singulier apparent ou un point singulier régulier
de f . Ainsi, 0 est un point singulier régulier pour le premier exemple de point
singulier isolé donné plus haut.
2. Un nombre fini non nul de c−k , k ∈ N∗ sont différents de zéro.
Dans ce cas, si p ≥ 1 désigne le plus grand entier positif k tel que c−k /= 0,
alors fp,a peut s’écrire
p
$
fp,a (z) = c−k (z − a)−k ,
k=1
avec c−p /= 0. On dit que a est un pôle d’ordre p de f . Ainsi, 0 est un

pôle d’ordre un dans le deuxième exemple de point singulier isolé donné plus
haut.
3. Il existe une infinité de c−k , k ∈ N∗ différents de zéro.
Dans ce cas, on dit que a est un point singulier essentiel de f . Ainsi, 0
est un point singulier essentiel dans le troisième exemple de point singulier
isolé donné plus haut.
L’étude du comportement d’une fonction de C dans C au voisinage d’un
point singulier essentiel est une partie difficile et importante de la théorie
des fonctions d’une variable complexe que nous n’aborderons pas ici. Par
contre, nous allons caractériser les points singuliers réguliers et les pôles et
donner des moyens concrets d’y calculer le résidu de f.
16.7 Le théorème des résidus

Notons tout d’abord une conséquence immédiate de la définition du résidu
et de la définition du développement de Laurent.
Proposition. Si f est une fonction de C dans C, a un point singulier isolé
de f et si les ck , k ∈ Z sont les coefficients de son développement de Laurent
en a, alors
Rés(f ; a) = Rés(fp,a; a) = c−1 .
On voit pourquoi le résidu de f en a ne fournit qu’une mesure très par-
tielle de sa “non-holomorphie” au point a. Celle-ci est en fait déterminée
par tous les coefficients c−k de sa partie principale.
16.7. LE THÉORÈME DES RÉSIDUS 665
Donnons maintenant des caractérisations simples d’un point singulier

régulier et la valeur du résidu en en tel point.
Proposition. Soit f une fonction de C dans C et a un point singulier isolé
de f . Alors les quatre assertions suivantes sont équivalentes.
1. a est un point singulier régulier de f .
2. limz→a, z(=a f (z) existe.
3. Il existe une fonction g holomorphe sur un voisinage V de a et telle que
f (z) = g(z) pour tout z ∈ V \ {a}.
4. f est localement bornée en a.
En outre, Rés(f ; a) = 0.
Démonstration. Si a est un point singulier régulier de f , alors f = fr,a
sur B2 (a, r2) pour r2 suffisamment petit, et dès lors
lim f (z) = lim fr,a (z) = c0 .

z→a, z(=a z→a, z(=a
L’assertion 2 entraı̂ne trivialement l’assertion 4. Si l’assertion 4 est vérifiée,

alors, pour tout k ∈ N∗ , on a,
f (z)
lim (z − a) = lim (z − a)k f (z) = 0,
z→a, z(=a (z − a)−k+1 z→a, z(=a
et dès lors, par un résultat antérieur sur le calcul du résidu,

4 5
f (z)
c−k = Rés ; a = 0.
(z − a)−k+1
Donc fp,a = 0 et l’assertion 1 est vérifiée. En outre, la fonction g = fr,a,

somme sur B2 (a; r2) d’une série entière convergente, est holomorphe sur
B2 (a; r2) et égale à f sur B2 (a; r2) \ {a}. Donc, l’assertion 1 entraı̂ne
l’assertion 3. L’assertion 3 entraı̂ne trivialement l’assertion 4 puisque g est
nécessairement localement bornée en a. Comme, enfin, l’assertion 3 entraı̂ne
trivialement l’assertion 2, la Proposition est démontrée, puisque la valeur
du résidu résulte aisément de l’assertion 2 et d’un résultat antérieur sur le
calcul du résidu.
On a une caractérisation semblable et une formule de calcul de résidu
dans le cas d’un pôle d’ordre p.
Proposition. Soit f une fonction de C dans C et a un point singulier isolé
de f . Alors les quatre assertions suivantes sont équivalentes.
1. a est un pôle d’ordre p de f .
2. limz→a, z(=a (z − a)p f (z) existe et limz→a, z(=a (z − a)p−1 f (z) = ∞. En

particulier, limz→a, z(=a f (z) = ∞.
3. Il existe une fonction g de C dans C holomorphe sur un voisinage V de a
telle que g(a) /= 0 et
g(z)
f (z) =
(z − a)p
pour tout z ∈ V \ {a}.
4. La fonction z 2→ (z − a)pf (z) est localement bornée en a, et la fonction
z 2→ (z − a)p−1 f (z) n’est pas localement bornée en a.
En outre,
g (p−1)(a)
Rés(f ; a) = .
(p − 1)!
Démonstration. Si a est un pôle d’ordre p de f , alors
lim (z − a)pf (z) = lim (z − a)p (fr,a + fp,a )

z→a, z(=a z→a, z(=a
, p -
$
−k
= lim (z − a) p
c−k (z − a) = c−p ,
z→a, z(=a
k=1
et
lim (z − a)p−1 f (z) = lim (z − a)p−1 c0 + lim (z − a)p−1 fp,a =

z→a, z(=a z→a, z(=a z→a, z(=a
c−p
lim (z − a)p−1 c0 + c−p+1 + lim= ∞,
z→a, z(=a z→a, z(=a z − a
puisque la première limite existe et la deuxième est infinie. Donc l’assertion

2 est satisfaite. D’autre part, si a est un pôle d’ordre p de f , alors la fonction
g définie par
p
$
g(z) = (z − a)p fr,a (z) + c−k (z − a)p−k
k=1
est holomorphe sur une boule centrée en a, telle que g(a) = c−p /= 0 et telle
g(z)
que f (z) = fr,a(z) + fp,a (z) = (z−a)p pour tout z /= a contenu dans cette
boule. Donc l’assertion 3 est vérifiée. D’ailleurs, l’assertion 3 implique tri-
vialement l’assertion 2. Si l’assertion 3 est vérifiée, alors, en appliquant le
théorème de Taylor à g, on trouve une boule B2 (a; r) telle que
∞
$ g (k) (a)
g(z) = (z − a)k ,
k=0
k!
pour tout z ∈ B2 (a; r), et donc, pour z ∈ B2 (a; r) \ {a}, on a

p−1 ∞
$ g (k)(a) $ g (k) (a)
f (z) = (z − a)k−p + (z − a)k−p , (16.1)
k=0
k! k=p
k!
qui est le développement de Laurent de f en a et montre, puisque g(a) /=

0, que a est un pôle d’ordre p de f . L’assertion 2 entraı̂ne trivialement
l’assertion 4. Si cette dernière est vérifiée, alors, pour k ≥ p + 1, on a
f (z)
lim (z − a) = lim (z − a)(z − a)k−1 f (z) = 0,
z→a (z − a)−k+1 z→a
et dès lors 4 5
f (z)
c−k = Rés = 0,
(z − a)−k+1
pour k ≥ p + 1. En outre, c−p = 0, car si c−p = 0, alors pour z /= a et
suffisamment proche de a, on a
∞
$
f (z) = ck (z − a)k ,
k=1−p
et ∞ ∞
$ $
(z − a)p−1f (z) = ck (z − a)k+p−1 = cj+1−p (z − a)j
k=1−p j=0
serait localement bornée en a. Donc l’assertion 4 entraı̂ne l’assertion 1. Enfin,

le calcul du résidu résulte aisément de la valeur du coefficient c−1 tirée de
(16.1).
On voit donc qu’en un point singulier isolé a, f est localement bornée en
a (et y a même une limite) si a est singulier régulier et f tend vers l’infini
lorsque z tend vers a si a est un pôle. Lorsque a est un point singulier es-
sentiel, il n’est pas trop difficile de prouver que, pour tout b ∈ C, il existe
une suite (zk )k∈N tendant vers a et telle que (f (zk ))k∈N converge vers b
(théorème de Casorati-Weierstrass). Un résultat beaucoup plus pro-
fond et beaucoup plus difficile, appelé le second théorème de Picard,
montre qu’au voisinage d’un point singulier essentiel, f prend une infinité
de fois toute valeur b ∈ C, sauf une au plus.
Si E ⊂ C est un ouvert non vide et que les seuls points de E en lesquels f
ne soit pas holomorphe sont des pôles, on dit que f est méromorphe sur E. En
particulier, une fonction rationnelle de C dans C est toujours méromorphe
sur C. Une fonction f de C dans C holomorphe sur C est appelée une

fonction entière. Tout polynôme de C dans C, et toute fonction définie
par la somme d’une série entière convergeant partout sur C (par exemple la
fonction exponentielle complexe) sont des fonctions entières. Le théorème
fondamental de l’algèbre entraı̂ne que si f est un polynôme non constant
de C dans C, alors f (C) = C. L’exemple de la fonction exponentielle de z,
différente de zéro pour tout z ∈ C, montre que ce résultat ne s’étend pas
aux fonctions entières. Il n’est pas trop difficile de prouver que, si f est
entière, adh [f (C)] = C. Un profond résultat, appelé le premier théorème
de Picard, affirme que pour toute fonction entière non constante, il existe
au plus un b ∈ C tel que b /∈ f (C), et, pour toute fonction méromorphe sur
C, il existe au plus deux telles valeurs.
Nous allons maintenant énoncer et démontrer le fameux théorème des
résidus qui étend le théorème de Cauchy au cas où le cycle entoure un
nombre fini de points singuliers isolés de la fonction.
Théorème. Soit E ⊂ C un ouvert non vide, aj ∈ E, 1 ≤ j ≤ q, et f

une fonction de C dans C holomorphe sur E \ ∪qk=1 {ak }. Alors, pour tout
r > 0 suffisamment petit pour que les boules B2 [ak , r], (1 ≤ k ≤ q) soient
%
contenues dans E et mutuellement disjointes et pour tout cycle Φ = m j=1 Φj
q
dans E \ ∪k=1 {a } de classe C par morceaux homotope dans E \ {ak } à
k 2
Σmak ,r
, (1 ≤ k ≤ q), on a
J q
$
f dz = 2iπ Rés(f ; ak ).
Φ k=1
Démonstration. Soient fr,ak et fp,ak respectivement la partie régulière et

la partie principale de f en ak , 1 ≤ k ≤ q. On sait que fp,ak est holomorphe
sur C \ {ak } et que fr,ak est holomorphe sur B2 (ak , R) pour tout R > r
%
tel que B2 (ak , R) ⊂ E. Par conséquent, la fonction g = f − qk=1 fp,ak est
holomorphe sur E \ ∪qk=1 {ak } et, pour chaque 1 ≤ k ≤ q, limz→ak , z(=ak g(z)
existe. Donc, les ak sont des points singuliers réguliers pour g, (1 ≤ k ≤ q),
ce qui entraı̂ne
Rés(g; ak ) = 0, 1 ≤ k ≤ q.
Soit g̃ le prolongement holomorphe de g à E obtenu en posant

$
g̃(al ) = fr,al (al ) − fp,ak (al ), 1 ≤ l ≤ q.
1≤k(=l≤q
Puisque Φ est un cycle dans E \ ∪qk=1 {ak } homotope dans chaque E \ {ak }
à Σak ,r , on a
J & q
$
' J J
f− fp,ak dz = g dz = g̃ dz
Φ k=1 Φ Φ
J J
= g̃ dz = g dz = 2iπRés(g; ak ) = 0.
Σmk Σmk
a ,r a ,r
Dès lors,
J q J
$ q J
$
f dz = fp,ak dz = fp,ak dz
Φ m
k=1 Φ k=1 Σak ,r
q
$ q
$
= 2iπ Rés(fp,ak ; ak ) = 2iπ Rés(f ; ak ).
k=1 k=1
On remarquera que si tous les ak sont des pôles, le théorème des résidus
permet de calculer l’intégrale du membre de gauche en n’effectuant que des
opérations de C-dérivation, puisque le résidu d’un pôle peut s’obtenir par de
telles opérations.
Le théorème des résidus permet de calculer de nombreuses intégrales
définies de fonctions de R dans C ainsi que certaines sommes finies. Par
exemple, si h : R2 → R est une fonction rationnelle définie sur le cercle de
C centré à l’origine et de rayon un, alors, si z = exp(2iπt), on a, puisque
|z| = 1,
cos 2πt = (1/2)(z + z̄) = (1/2z)(z 2 + 1),
sin 2πt = (1/2i)(z − z̄) = (1/2iz)(z 2 − 1),
et dès lors, en vertu de la définition de l’intégrale d’une 1-forme sur Σ0,1 , on
a J 1
h(cos 2πt, sin 2πt) dt
0
J 1
= h(cos 2πt, sin 2πt)[2iπ exp(2iπt)]−1 [2iπ exp(2iπt)] dt
0
J & '
z2 + 1 z2 − 1 1
= h , dz
Σ0,1 2z 2iz 2iπz
& & ' '
$ 1 z2 + 1 z2 − 1
= 2iπ Rés h , ;a
2iπz 2z 2iz
& & ' '
$ 1 z2 + 1 z2 − 1
= Rés h , ;a ,
z 2z 2iz
8 2 2
9
où la somme est étendue aux pôles a de la fonction z 2→ 1z h z 2z+1 , z2iz−1
situés dans le disque ouvert centré à l’origine et de rayon 1.

D’autres artifices permettent de ramener au théorème des résidus le calcul
d’intégrales définies de différentes classes de fonctions.
16.8 Exercices
1. Montrer que si f est une fonction de C dans C holomorphe sur un
ouvert E ⊂ C, alors ∆f = 0 sur E, où ∆f = D11 2
f + D22
2
f. (Utiliser
l’indéfinie dérivabilité de f , les conditions de Cauchy-Riemann et le théorème
de Schwarz).
2. Soit T : C → C une application R-linéaire injective. On dit que T préserve
les angles si, pour tout w et tout z dans C, on a
|w||z|(T w|T z) = |T w||T z|(w|z).
Si f est une application continûment dérivable d’un ouvert E ⊂ C dans C,

on dit que f préserve les angles si, pour chaque a ∈ E, la dérivée totale fa$
préserve les angles. Montrer que si f est holomorphe sur E et si f $ (z) /= 0
pour tout z ∈ E , alors f préserve les angles sur E. On dit que f est une
représentation conforme de E sur f (E).
3. Démontrer le théorème fondamental de l’algèbre à partir du théorème
de Liouville. (Si f est un polynôme de C dans C non constant de degré n
n’ayant pas de zéro, alors f1 est une fonction entière bornée sur C, et donc
constante, ce qui est contradictoire.)
4. Montrer que si E est un ouvert borné et f une fonction C dans C con-
tinue sur adh E et non constante et holomorphe sur E. Alors |f | atteint son
maximum et son minimum sur fr E (Principe du maximum pour les fonc-
tions holomorphes). (Sinon, par exemple, le maximant a de |f | sur adh E
appartient à E et, par continuité de f , il existe b ∈ E et ρ > 0 tels que
B2 [b; ρ] ⊂ E et |f (z)| < |f (a)| pour tout z ∈ B2 [b; ρ]. Si r = |b − a|, la
formule de représentation de Cauchy
J
1
f (a) = f (z) dz,
2iπ Σa,r
conduit à une contradiction.)

5. Montrer que si f est une fonction de C dans C holomorphe dans un ouvert

E ⊂ C, et si a ∈ E est un zéro de f , alors ou bien f est identiquement
nulle sur une boule centrée en a, ou bien il existe un entier k ≥ 1 tel que
f (k) (a) /= 0. (Utiliser le théorème de Taylor). En déduire que, dans ce cas,
a est isolé; le plus petit entier tel que f (m) (a) /= 0 est appelé la multiplicité
du zéro a de f .
6. Montrer que si f est une fonction méromorphe de C dans C ayant comme
zéros les nombres aj ∈ C, (1 ≤ j ≤ q) avec les multiplicités respectives
mj , (1 ≤ j ≤ q), et admettant comme pôles les nombres bk ∈ C, (1 ≤ k ≤ r),
avec les ordres respectifs pj , (1 ≤ j ≤ r), alors si R > 0 est suffisamment
grand pour que B2 (R) contienne ces zéros et ces pôles, on a
J q r
1 f $ (z) $ $
dz = mj − pk .
2iπ Σ0,R f (z) j=1 k=1
En particulier, si f est entière, cette intégrale fournit le nombre de zéros de

f (comptés avec leur multiplicité). (Utiliser le théorème des résidus).

H
Que devrions nous faire de ϕx.dx pour x = a + bi? Evidemment, si nous
voulons procéder à partir de concepts clairs, nous devons supposer que x
passe, par des accroissements infiniment petits (chacun de la forme α + iβ)
de cette valeur à laquelle l’intégrale est supposée être 0 à x = a + bi et
qu’alors tous les ϕx.dx soient sommés. De cette manière, la signification
est rendue précise. Mais la progression des valeurs de x peut se faire d’une
infinité de manières différentes : De la même manière que nous pouvons
concevoir la totalité de toutes les grandeurs réelles comme une ligne droite
infinie, nous pouvons visualiser la totalité de toutes les grandeurs, réelles
et imaginaires, comme un plan infini où chaque point qui est déterminé par
une abscisse a et une ordonnée b représente aussi bien la quantité a + bi. Le
passage continu d’une valeur de x à une autre a + bi se fait par conséquent
le long d’une courbe et est dèsH lors possible d’une infinité de manières. Mais
je maintiens que l’intégrale ϕx.dx calculée le long de deux tels passages
différents donne toujours la même valeur tant que ϕx = ∞ n’arrive jamais
dans la région du plan entourée par les courbes décrivant ces deux passages.
C’est un très beau théorème, dont je donnerai la démonstration, qui n’est
pas si difficile, quand l’occasion se présentera. Il est relié intimement à
d’autres belles vérités relatives aux développements de fonctions en séries.
Le passage d’un point à un autre peut toujours être effectué sans toucher
l’un des points où ϕx = ∞. Cependant, je demande que Hces points soient
évités sous peine de voir le concept fondamental original de ϕx.dx perdre sa
clarté et conduire à des contradictions.
H
En outre, il est clair aussi à partir de
là qu’une fonction engendrée par ϕx.dx pourrait avoir différentes valeurs
pour la même valeur de x, qui dépendent du nombre de tours effectuésH autour
d’un point où ϕx = ∞. Si par exemple nous définissons log x via x1 dx à
partir de x = 1, et que nous arrivons à log x en ayant tourné autour du point
x = 0 une ou plusieurs fois ou pas du tout, tout circuit ajoute la constante
+2πi ou −2πi; donc le fait que tout nombre ait des logarithems multiples
devient tout à fait clair.
Carl Friedrich Gauss, 1811 (lettre à Friedrich Bessel)
Les équations
∂u ∂v ∂u ∂v
= , =−
∂x ∂y ∂y ∂x
renferment toute la théorie du passage du réel à l’imaginaire, et il ne nous
reste plus qu’à indiquer la manière de s’en servir.
Pour embrasser dans la même définition les intégrales prises entre des
limites réelles et les intégrales prises entre des limites imaginaires, il convient
de représenter par la notation
J √
X+Y −1
√ f (z) dz
x0 +y0 −1
la limite ou l’une des limites vers lesquelles converge la somme des produits
de la forme
D √ E √
(x1 − x0 ) + (y1 − y0 ) −1 f (x0 + y0 −1),
D √ E √
(x2 − x1 ) + (y2 − y1 ) −1 f (x1 + y1 −1),
...
D √ E √
(X − xn−1 ) + (Y − yn−1 ) −1 f (xn−1 + yn−1 −1),
lorsque chacune des deux suites
x0 , x1 , x2 , . . . , xn−1 , X,
y0 , y1 , y2 , . . . , yn−1 , Y,
étant composée de termes qui aillent toujours en croissant ou en décroissant
depuis le premier jusqu’au dernier, ces mêmes termes se rapprochent indé-
finiment les uns des autres, et que leur nombre croı̂t de plus en plus. Pour
obtenir deux suites de cette espèce, il suffit de supposer
x = ϕ(t), y = χ(t),
puis de représenter par
x0 , x1 , x2 , . . . , xn−1 , X,
y0 , y1 , y2 , . . . , yn−1 , Y,
les valeurs de x et de y correspondant à des valeurs de t, qui composent une
série croissante ou décroissante de la forme
t0 , t1 , t2 , . . . , tn−1 , T.
Si, après avoir cherché les valeurs de z où la fonction f (z) est infinie,
on ajoute à l’une de ces valeurs, désignée par z1 , la quantité infinitésimale
! et que l’on développe alors f (z1 + !) en séries de puissances croissantes
de !, les premiers termes contiendront des puissances négatives de !, et l’un
d’entre eux sera le produit de 1/! par un coefficient fini, que nous appellerons
le résidu de la fonction f (z) relatif à la valeur particulière z1 de la variable
z. . . . L’étude des résidus d’une fonction f (z) est habituellement facile. En
fait, soit encore z1 une valeur de z où f (z) devient infinie, c’est-à-dire une
racine de l’équation
1
= 0.
f (z)
La valeur du produit (z − z1 )f (z), correspondant à z = z1 , apparaı̂t comme
une forme indéterminé. Mais en réalité elle est très souvent bornée. Adop-
tons cette hypothèse et posons
(z − z1 )f (z) = g(z).
De cette équation, on obtient alors

g(z)
f (z) = ,
z − z1
et dès lors
g(z1 + !) 1
f (z1 + !) = = g(z1) + g $ (z1 + θ!),
! !
θ désignant un nombre inférieur à l’unité. Par conséquent, le résidu de la
fonction f (z) en z = z1 sera la quantité finie g(z1 ), ou, en d’autres termes,
la valeur du produit !f (z1 + !) correspondant à ! = 0.
La fonction f (x) sera développable par la formule de Maclaurin en une

série convergente ordonnée suivant les puissances ascendantes de x, si le
module de la variable réelle ou imaginaire conserve une valeur inférieure à
celle pour laquelle la fonction (ou sa dérivée du premier ordre) cesse d’être
finie et continue.
Le calcul intégral ne vaudrait pas grand’chose si, au lieu d’être cherchée

sous forme finie, la primitive demandait toujours un passage à la limite; il n’y
aurait alors aucun progrès. Le mérite immense de Newton et Leibniz est de
rendre possible la représentation explicite du résultat d’une opération qui est
en fait irréalisable. 250 années passèrent depuis, et pas mal d’hommes forts
refirent le chemin de Newton et Leibniz. Personne ne put continuer l’oeuvre
des fondateurs de l’analyse infinitésimale, ni indiquer une autre méthode
pour mettre sous forme finie le résultat de la sommation d’infiniment petits.
Seul Cauchy eut l’honneur de donner un procédé original, qu’il nomma calcul
des résidus, dont on peut se servir pour mettre sous forme finie le résultat
de la sommation d’un nombre infiniment grand de termes infiniment petits,
et cela dans une quantité de cas où la méthode éprouvée des primitives de
Newton est en défaut.
Nicolas Lusin, 1943

Chapitre 17
Analyse fonctionnelle
17.1 Espaces métriques

Un examen attentif des définitions de limite, continuité, convergence et
des démonstrations de leurs propriétés fondamentales montre qu’elles ne
dépendent pas de la nature particulière des ensembles sur lesquels les fonc-
tions sont considérées (parties de Rn ) mais de l’existence sur ces ensembles
d’une notion de distance entre deux éléments vérifiant un petit nombre de
propriétés caractéristiques. D’autre part, le développement de questions
classiques d’analyse nous a conduit progressivement à considérer, à côté des
ensembles de points de Rn des ensembles de fonctions (C(A; Rp), N (I, Rp),
¯ Rp), L(I;
P (I; ¯ Rp), . . .) et à définir sur ces ensembles différents types de con-
vergence. Pour unifier et généraliser ces notions, on est conduit à la définition
suivante.
Définition. Soit M un ensemble non vide quelconque. Une distance sur M
est une application d : M × M → R+ vérifiant les conditions suivantes :
(i) Pour chaque x ∈ M et chaque y ∈ M , d(x, y) = 0 si et seulement si
x = y.
(ii) Pour chaque x ∈ M et chaque y ∈ M , d(x, y) = d(y, x) (propriété de
symétrie).
(iii) Pour chaque x ∈ M , chaque y ∈ M et chaque z ∈ M ,
d(x, y) ≤ d(x, z) + d(z, y)
(inégalité triangulaire).
Définition. On appelle espace métrique un ensemble non vide M muni

d’une distance d. On le note (M, d) ou, plus brièvement, M , lorsque le choix
675
676 CHAPITRE 17. ANALYSE FONCTIONNELLE
de d ressort clairement du contexte. On dit aussi qu’on a muni M d’une

structure métrique ou d’une métrique.
Les éléments x ∈ M d’un espace métrique (M, d) seront en général ap-
pelés des points. Un même ensemble non vide peut évidemment être muni
de plusieurs distances; ainsi, si d est une distance sur M , cd est une dis-
tance sur M quel que soit c > 0. Si d1 et d2 sont deux distances différentes
sur un même ensemble M , (M, d1) et (M, d2 ) sont évidemment des espaces
métriques différents.
Exemples. 1. Si M est un ensemble non vide, on peut toujours définir
l’application d0 : M × M → R+ par
d0 (x, x) = 0, d0 (x, y) = 1 si x /= y.
On vérifie sans peine qu’elle satisfait aux conditions (i) à (iii) de la définition
ci-dessus. La structure métrique que d0 définit sur M s’appelle la métrique
discrète.
2. L’application d1 : R × R → R+ , (x, y) 2→ |x − y| satisfait aux conditions
(i) à (iii) de la définition de distance. Cette distance définit la métrique
naturelle sur R. L’application
d2 : R × R → R+ , (x, y) 2→ |arctg x − arctg y|,
est également une métrique sur R, ainsi qu’on le vérifie sans peine. On
obtient d’autres métriques en remplaçant arctg par n’importe quelle appli-
cation injective de R dans R.
3. Soit S = {0, 1} et Σ l’ensemble des suites dans S, c’est-à-dire l’ensemble
des applications de N dans S. Ainsi donc, s ∈ Σ si et seulement si s =
(sk )k∈N , avec sk = 0 ou 1. Définissons l’application d : Σ × Σ → R+ par
∞
$ |sk − tk |
d(s, t) = .
k=0
2k
Comme, pour chaque k ∈ N, |sk − tk | ≤ 1, il résulte du test de comparaison

que la série qui définit d(s, t) est convergente pour chaque s ∈ Σ et chaque
t ∈ Σ. En outre, la série étant à termes positifs, sa somme est nulle si et
seulement si chaque terme est nul, c’est-à-dire si et seulement si sk = tk
pour chaque k ∈ N, ou encore si et seulement si s = t. Il est clair que
d(s, t) = d(t, s), et, enfin, si r ∈ Σ, on a
∞
$ |sk − rk + rk − tk |
d(s, t) =
k=0
2k
17.2. ESPACES VECTORIELS NORMÉS 677
∞ 4
$ 5
|sk − rk | |rk − tk |
≤ + ≤ d(s, r) + d(r, t).
k=0
2k 2k
Si s et t sont des éléments de Σ tels que sk = tk pour chaque 0 ≤ k ≤ n pour

un certain n ∈ N, alors
∞ ∞
$ |sk − tk | $ 1 1
d(s, t) = ≤ = n.
k=n+1
2k k=n+1
2 k 2
Réciproquement, s’il existe 0 ≤ k ≤ n tel que sk /= tk , alors |sk − tk | = 1

et d(s, t) ≥ 21k ≥ 21n . Cette distance est utile dans l’étude des schémas de
Bernoulli en théorie des probabilités et en théorie ergodique.
Soit (M, d) est un espace métrique et A une partie non vide de M . La
restriction dA de d à A×A est évidemment une distance sur A, ce qui justifie
la définition suivante.
Définition. Si (M, d) est un espace métrique et A une partie non vide de
M , la restriction dA de d à A × A est appelée distance induite sur A par d et
(A, dA) (que l’on notera plus simplement (A, d)) est appelé un sous-espace
métrique de (M, d).
Exemple. Si d est une distance sur R, alors (Q, d) est un sous-espace
métrique de (R, d).
17.2 Espaces vectoriels normés

Soit K = R ou C et E un espace vectoriel sur K. La notion suivante, qui a
été introduite au chapitre 1 lorsque K = R, est liée à la notion de distance.
Définition. Une norme sur E est une application 6 · 6 : E → R+ vérifiant
les conditions suivantes :
1. Pour chaque x ∈ E, 6x6 = 0 si et seulement si x = 0.
2. Pour chaque c ∈ K et chaque x ∈ E, on a 6cx6 = |c|6x6.
3. Pour chaque x ∈ E et chaque y ∈ E, on a
6x + y6 ≤ 6x6 + 6y6.
Le couple (E, 6 · 6) est appelé un espace vectoriel normé.

Les exemples suivants d’espaces vectoriels normés sont bien connus.
Exemples. 1. L’application valeur absolue | · | est évidemment une norme

sur R.
2. L’application
| · | : C → R+ , z = x + iy 2→ |z| = (x2 + y 2 )1/2,
est une norme sur C considéré comme espace vectoriel sur R ou sur C.
3. Si j = 1, 2 ou ∞, l’application | · |j est une norme sur Rn .
On a vu que tout ensemble non vide pouvait être muni d’une distance,
par exemple celle de la métrique discrète. On peut démontrer, mais c’est
plus difficile et nécessite le recours à l’axiome du choix, qu’il est possible de
définir une norme sur tout espace vectoriel sur K.
Proposition. Si (E, 6 · 6) est un espace vectoriel normé, l’application
d2·2 : E × E → R+ , (x, y) 2→ 6x − y6,
est une distance sur E.

Démonstration. En effet, si x, y et z appartiennent à E, on a, en utilisant
la définition et les propriétés d’une norme,
d2·2(x, y) = 0 ⇔ x − y = 0 ⇔ x = y,
d2·2 (y, x) = 6y − x6 = 6 − (x − y)6 = 6x − y6 = d2·2 (x, y),
d2·2 (x, y) = 6x−y6 = 6x−z+z−y6 ≤ 6x−z6+6z−y6 = d2·2 (x, z)+d2·2(z, y).
La distance d2·2 ainsi définie s’appelle la distance sur E induite par la

norme 6 · 6 et munit tout espace vectoriel normé d’une structure d’espace
métrique.
Si F est un sous-espace vectoriel de E, il est clair que la restriction 6 · 6F
de 6 · 6 à F définit une norme sur F , ce qui justifie la définition suivante.
Définition. Si (E, 6 · 6) est un espace vectoriel normé sur K et F un sous-
espace vectoriel de E, la norme induite par 6 · 6 sur F est la restriction
6 · 6F de 6 · 6 à F , et (F, 6 · 6F ) ou, plus simplement, (F, 6 · 6) est appelé un
sous-espace vectoriel normé de (E, 6 · 6).
Exemples. 1. Espace l 1 . L’espace (Rn , | · |1 ) possède la généralisation na-
turelle suivante. Soit l 1 l’ensemble des suites réelles x = (xk )k∈N∗ telles que
%
la série k∈N∗ xk converge absolument. On montre sans peine que c’est un
espace vectoriel sur R et, par définition, l’application
∞
$
| · |1 : l 1 → R+ , x = (xk )k∈N∗ 2→ |xk |,
k=1
est bien définie. Les deux premières propriétés d’une norme sont trivialement
satisfaites par | · |1 et la troisième résulte de l’inégalité triangulaire dans R,
q
$ q
$ q
$
|xk + yk | ≤ |xk | + |yk |,
k=1 k=1 k=1
qui entraı̂ne, successivement,

q
$ ∞
$ ∞
$
|xk + yk | ≤ |xk | + |yk |,
k=1 k=1 k=1
et
∞
$ ∞
$ ∞
$
|xk + yk | ≤ |xk | + |yk |.
k=1 k=1 k=1
(l 1 , | · |1 ) est donc un espace vectoriel normé sur R.

2. Espace l ∞. L’espace (Rn , |·|∞) possède la généralisation naturelle suivante.
Soit l ∞ l’ensemble des suites réelles x = (xk )k∈N∗ bornées. On montre sans
peine que c’est un espace vectoriel sur R et, par définition, l’application
| · |∞ : l ∞ → R+ , x = (xk )k∈N∗ 2→ sup{|xk | : k ∈ N∗ }
est bien définie. Les trois propriétés d’une norme sont trivialement satisfaites
par | · |∞ . (l ∞ , | · |∞ ) est donc un espace vectoriel normé sur R.
3. Espace des applications bornées d’un ensemble dans un espace vectoriel
normé. Soit A un ensemble non vide quelconque, (E, 6·6) un espace vectoriel
normé sur K. Par analogie avec le cas d’une application de Rn dans Rp, nous
dirons qu’une application f de A dans E est bornée sur A s’il existe M ≥ 0
tel que, pour tout x ∈ A, on ait
6f (x)6 ≤ M,
c’est-à-dire si l’application norme de f définie par 6f 6(x) = 6f (x)6 est ma-

jorée sur A, ce qui assure aussitôt l’existence de supx∈A 6f (x)6. Désignons
par B(A; E) l’ensemble des applications bornées de A dans E. Il est facile
de munir B(A; E) d’une structure d’espace vectoriel en définissant, pour

f ∈ B(A; E), g ∈ B(A; E) et c ∈ K, f + g et cf respectivement par
(f + g)(x) = f (x) + g(x), (cf )(x) = cf (x),
pour chaque x ∈ A. Si nous définissons maintenant sur B(A; E) l’application

6 · 6∞ par
6f 6∞ = sup 6f (x)6,
x∈A
alors, si f, g ∈ B(A; E) et c ∈ K, on a
6f 6∞ = 0 ⇔ 6f (x)6 = 0 pour tout x ∈ A ⇔ f = 0,
6cf 6∞ = sup 6cf (x)6 = |c| sup 6f (x)6 = |c|6f 6∞,

x∈A x∈A
et, pour chaque x ∈ A, on a
6f (x) + g(x)6 ≤ 6f (x)6 + 6g(x)6,
et dès lors
6f (x) + g(x)6 ≤ sup 6f (x)6 + sup 6g(x)6 = 6f 6∞ + 6g6∞,

x∈A x∈A
6f + g6∞ = sup(6f (x) + g(x)6) ≤ 6f 6∞ + 6g6∞.

x∈A
En conséquence, 6 · 6∞ est une norme sur B(A; E) appelée, pour des raisons
qui apparaı̂tront plus loin, la norme de la convergence uniforme sur A. La
distance induite par 6 · 6∞ définit sur B(A; E) la métrique de la convergence
uniforme sur A.
4. Espace des applications continues d’un fermé borné de Rn dans Rp . Soit A
un fermé borné non vide de Rn et C(A; Rp) l’ensemble des applications f de
A dans Rp continues sur A. C’est un espace vectoriel sur R. Le théorème de
Weierstrass entraı̂ne qu’une application continue sur A y est nécessairement
bornée, et dès lors C(A; Rp) est un sous-espace vectoriel de B(A; Rp). En
le munissant de la norme de la convergence uniforme sur A, on en fait un
espace vectoriel normé sur R.
5. Espace des applications linéaires de Rn dans Rp. L’ensemble L(Rn , Rp)
des applications linéaires de Rn dans Rp est un espace vectoriel sur R. Si
l’on munit Rn de la norme | · |j et Rp de la norme | · |k (j, k = 1, 2 ou ∞),
on sait que si L ∈ L(Rn , Rp), la fonction x 2→ L(x)

|x|j est bornée sur R \ {0}
n
et dès lors ; <

|L(x)|k
|L|j,k = sup : x ∈ R \ {0}
n
|x|j
= sup{|L(y)|k : y ∈ Rn , |y|j = 1}
existe. L’application
| · |j,k : L(Rn , Rp) → R+ , L 2→ |L|j,k
est une norme sur L(Rn , Rp); on le montre par un raisonnement analogue à
celui de l’exemple 3.
6. Espace des (classes d’équivalence) de fonctions L-intégrables sur A ⊂ Rp.
Si A est une partie non vide de Rn , on désigne par L(A; Rp) l’ensemble des
fonctions de Rn dans Rp L-intégrables sur A; elles sont donc définies presque
partout sur A, et cet ensemble constitue un espace vectoriel sur R pour les
définitions usuelles d’addition de deux fonctions et de multiplication d’une
fonction par un réel. L’application
J
6 · 6L : L(A; Rp) → R+ , f 2→ |f |2 ,
A
est bien définie et telle que 606L = 0. En outre, si f, g ∈ L(A; Rp) et si c ∈ R,

on a J J J
6cf 6L = |cf |2 = |c||f |2 = |c| |f |2 = |c|6f 6L,
A A A
et J J
6f + g6L = |f + g|2 ≤ (|f |2 + |g|2)
A A
J J
= |f |2 + |g|2 = 6f 6L + 6g6L.
A A
Mais, on a vu précédemment que
6f 6L = 0 ⇔ f = 0 p.p. sur A,
et par conséquent la première propriété de la norme n’est pas satisfaite. Pour

surmonter cette difficulté, notons que
E = {f ∈ L(A; Rp) : f = 0 p.p. sur A}

est un sous-espace vectoriel de L(A; Rp), ce qui nous permet de définir

l’espace vectoriel quotient L1 (A; Rp) = L(A; Rp)/E des classes d’équivalence
d’éléments de L(A; Rp) pour l’égalité presque partout sur A. Comme
E = {f ∈ L(A; Rp) : 6f 6L = 0},
on voit que, si f et g sont des éléments de L(A; Rp) tels que f = g p.p. sur
A, alors
6f 6L = 6g + (f − g)6L ≤ 6g6L + 6f − g6L = 6g6L,
et, symétriquement, 6g6L ≤ 6f 6L, c’est-à-dire 6f 6L = 6g6L. En conséquen-

ce, si fˆ désigne la classe d’équivalence de l’élément f ∈ L(A; Rp), l’applica-
tion
6 · 61 : L1 (A; Rp) → R+ , fˆ 2→ 6f 6L ,
est bien définie et vérifie les trois conditions d’une norme. Cette norme
est appelée la norme de la convergence en moyenne sur A et l’ensemble
(L1 (A; Rp), 6 · 61 ) est l’espace des (classes d’équivalence) des fonctions de
Rn dans Rp L-intégrables sur A. En pratique, on laisse souvent tomber la
terminologie “classe d’équivalence” et la notation fˆ.
7. Espaces préhilbertiens. Soit H un espace vectoriel sur K. On appelle
produit scalaire sur H une application (·|·) de H × H dans K vérifiant les
propriétés suivantes : pour tout x ∈ H, y ∈ H, z ∈ H et a, b ∈ K, on a
a. (x|y) = (y|x).
b. (ax + by|z) = a(x|z) + b(y|z).
c. (x|x) > 0 si x /= 0.
Notons que a et b entraı̂nent que
(z|ax + by) = (ax + by|z) = a(x|z) + b(y|z) = a(z|x) + b(z|y).
Montrons que l’application
6 · 6 : H → R+ , x 2→ [(x|x)]1/2,
est une norme sur H, que l’on appellera la norme induite par le produit
scalaire (·|·). On a 6x6 = 0 si et seulement si x = 0 en vertu de b et c,
puisque, si x = 0, x = 0x et
(x|x) = (0x|x) = 0(x|x) = 0,
et l’on a
6cx6 = [(cx|cx)]1/2 = [c(x|cx)]1/2 = [c(cx|x)]1/2
= [cc(x|x)]1/2 = [|c|2(x|x)]1/2 = |c|6x6,

en vertu de a, b. Enfin,
6x + y6 = [(x + y|x + y)]1/2 = [(x|x + y) + (y|x + y)]1/2

D E1/2
= [(x + y|x) + (x + y|y)]1/2 = (x|x) + (y|x) + (x|y) + (y|y)
= [6x62 + 28(x|y) + 6y62 ]1/2 ≤ 6x6 + 6y6,

en utilisant a, b et l’inégalité de Cauchy-Schwarz
|(x|y)| ≤ 6x66y6,
qui est triviale pour y = 0 et, si y /= 0, résulte de a, b et c puisque, en posant

y
z = 2y2 , on a
0 ≤ ([x − (x|z)z]|[x − (x|z)z]) = (x|[x − (x|z)z]) − (x|z)(z|[x − (x|z)z])
= (x|x) − (z|x)(x|z) − (x|z)(z|x) + (x|z)(z|x)(z|z) = (x|x) − |(x|z)|2,

et dès lors
|(x|y)|2 ≤ 6x62 6y62 .
Le couple (H, (·|·)) est appelé un espace préhilbertien; c’est un espace vecto-
riel normé pour la norme 6 · 6 induite par le produit scalaire.
8.Espace l 2 . (Rn , (·|·)) muni du produit scalaire introduit au chapitre 1 est
un espace préhilbertien sur R. On peut le généraliser comme suit. Soit l 2
%
l’ensemble des suites réelles x = (xk )k∈N∗ telles que la série k∈N∗ |xk |2 soit
convergente. Comme, pour chaque k ∈ N∗ , on a
|xk + yk |2 ≤ |xk |2 + 2|xk ||yk | + |yk |2 ≤ 2(|xk |2 + |yk |2 ),
le test de comparaison entraı̂ne aisément que l 2 est un espace vectoriel sur

R. Comme, d’autre part, si x = (xk )k∈N∗ et y = (yk )k∈N∗ appartiennent à
l 2 , on a, pour chaque q ∈ N∗
q & q q '
$ 1 $ $
|xk ||yk | ≤ |xk | +
2
|yk | 2
,
k=1
2 k=1 k=1
%
on voit que la série k∈N∗ xk yk converge absolument et dès lors l’application
∞
$
(·|·) : l 2 → R, (x, y) = ((xk )k∈N∗ , (yk )k∈N∗ ) 2→ xk yk
k=1
est bien définie. On vérifie sans peine qu’elle vérifie les conditions pour
être un produit scalaire sur l 2 . En conséquence, (l 2, (·|·)) est un espace
préhilbertien sur R.
9. Espace L2 (A; Rp). Si A est une partie non vide de Rn , on désigne par
L2 (A; Rp) l’ensemble des classes d’équivalences au sens de l’exemple 6 de
fonctions f de Rn dans Rp n-mesurables sur A et telles que |f |22 soit L-
intégrable sur A. L’inégalité
1D E
(f (x)|g(x)) ≤ |f (x)|2 + |g(x)|2
2
et le test de comparaison pour la L-intégrabilité des fonctions n-mesurables
montre queH
si f et g appartiennent à L2 (A; Rp), alors (f |g) est L-intégrable
sur A et A (f |g) ne dépend que de la classe d’équivalence de f et de celle de
g. Si l’on définit l’application Afˆ|ĝB par
J
Afˆ|ĝB = (f |g),
A
on montre facilement que A·|·B est un produit scalaire sur L2 (A; Rp) qui en fait
un espace préhilbertien, et donc normé. La norme correspondante s’appelle
la norme de la convergence en moyenne quadratique.
17.3 Intérieur, adhérence, frontière

La notion de boule dans Rn ne dépend que de l’existence d’une distance sur
Rn . Elle se généralise aisément à un espace métrique quelconque.
Définition. Soit (M, d) un espace métrique, a ∈ M et r > 0. On appelle
boule de centre a et de rayon r l’ensemble
B[a; r] = {x ∈ M : d(x, a) ≤ r},
et boule ouverte de centre a et de rayon r l’ensemble
B(a; r) = {x ∈ M : d(x, a) < r}.
Ainsi, pour M est muni de la métrique discrète, B[a; r] = {a} si r < 1 et

B[a; r] = M si r ≥ 1.
Les notions introduites dans Rn et qui ne dépendent que du concept de
boule s’étendent donc aussitôt à un espace métrique quelconque.
Définition. Soit (M, d) un espace métrique, a ∈ M et E ⊂ M. On dit que

a est intérieur à E ou que E est un voisinage de a s’il existe r > 0 tel que
B[a; r] ⊂ E. L’intérieur de E, noté int E, est l’ensemble des points de M
intérieurs à E.
On a évidemment, par définition, int E ⊂ E, int ∅ = ∅ et int M = M.
Exemple. Si (M, d0 ) est un espace métrique avec la métrique discrète d0
et si E est une partie de M , alors int E = E. C’est évident si E est vide;
sinon, pour tout a ∈ E, on a B[a; 12 ] = {a} ⊂ E, et donc E ⊂ int E.
Définition. On dit que a est adhérent à E si, pour tout r > 0, E ∩B[a; r] /=
∅. L’adhérence de E, notée adh E ou E est l’ensemble des points de M
adhérents à E.
On a évidemment, par définition, E ⊂ adh E, adh ∅ = ∅ et adh M = M.
Exemple. Si (M, d0 ) est un espace métrique avec la métrique discrète et si
E est une partie de M , alors adh E = E. C’est évident si E est vide; sinon,
pour tout a ∈ adh E, on a E ∩ {a} = E ∩ B[a; 12 ] /= ∅, et donc a ∈ E, ce qui
montre que adh E ⊂ E.
Les propriétés suivantes se démontrent exactement comme leur équiva-
lent dans Rn . Bien entendu, !E = M \ E.
Proposition. Soit (M, d) un espace métrique et E, F des parties de M .
Alors, on a
1. adh E = !int !E, int E = !adh !E.
2. Si E ⊂ F , alors int E ⊂ int F et adh E ⊂ adh F .
3. int (E ∪ F ) ⊃ int E ∪ int F, int (E ∩ F ) = int E ∩ int F.
4. adh (E ∪ F ) = adh E ∪ adh F, adh (E ∩ F ) ⊂ adh E ∩ adh F.
Définition. Soit (M, d) un espace métrique et E ⊂ M. La frontière de E,

notée fr E, Ė ou ∂E est l’ensemble
fr E = adh E ∩ adh !E.
Il en résulte aussitôt que
fr E = fr !E = adh E \ int E.
Exemple. Si (M, d0) est un espace métrique avec la métrique discrète et

si E est une partie de M , alors fr E = ∅. En effet, fr E = adh E \ int E =
E \ E = ∅.
17.4 Limites et continuité

Il est facile d’étendre la notion de limite des valeurs d’une fonction au cas
d’une fonction d’un espace métrique dans un autre.
Définition. Soient (M, d) et (M $ , d$ ) deux espaces métriques, f une fonc-
tion de M dans M $ , a ∈ M et b ∈ M $ . On dit que f (x) tend vers b lorsque x
tend vers a ou encore que b est limite de f (x) lorsque x tend vers a, et l’on
écrit
f (x) → b si x → a,
si les deux conditions suivantes sont satisfaites :
1. a ∈ adh dom f.
2.(∀! > 0)(∃δ > 0)(∀x ∈ dom f : d(x, a) ≤ δ) : d$ (f (x), b) ≤ !.
La condition 2 de cette définition équivaut évidemment à
2’.(∀! > 0)(∃δ > 0)(∀x ∈ dom f ∩ B[a; δ]) : b ∈ B[b; !],
et les remarques faites à la suite de la définition de la limite pour les fonctions
de Rn dans Rp s’étendent trivialement à cette situation générale.
Exemples. 1. Dans les conditions de la définition, supposons M muni de
la métrique discrète. Alors la condition 1 implique a ∈ dom f et, si ! > 0
est donné, la condition 2 sera trivialement satisfaite en prenant b = f (a) et
δ = 12 . En conséquence, si M est muni de la métrique discrète, toute fonction
de M dans M $ a une limite en a ∈ adh dom f si et seulement si a ∈ dom f ,
auquel cas cette limite est égale à f (a).
2. Dans les conditions de la définition, supposons maintenant que M $ soit
muni de la métrique discrète. Alors, dès que ! < 1, B[b; !] = {b} et, si
b est limite de f (x) pour x tendant vers a, il existera un δ > 0 tel que
f (x) = b pour tout x ∈ dom f ∩ B[a; δ]. Réciproquement, si un tel b et
un tel δ existent, b sera évidemment limite de f (x) lorsque x tend vers a.
En conséquence, si M $ est muni de la métrique discrète, les fonctions de
M dans M $ qui ont une limite lorsque x tend vers a ∈ adh dom f sont les
fonctions localement constantes en a, c’est-à-dire les fonctions constantes sur
l’intersection de dom f avec un voisinage de a.
Ces deux exemples montrent que l’emploi de la métrique discrète ne conduit
pas à une analyse mathématique très subtile.
Les propriétés suivantes de la limite se démontrent exactement comme
dans le cas des fonctions de Rn dans Rp.
Proposition. Soient (M, d) et (M $ , d$) deux espaces métriques, f une fonc-
tion de M dans M $ , a ∈ adh dom f. On a les propriétés suivantes.
1. (Unicité). Il existe au plus un b ∈ M $ vérifiant les conditions de la

définition de limite. On écrit alors
b = lim f (x).
x→a
2. (Condition nécessaire de Cauchy). Si limx→a f (x) existe, alors f vérifie

la condition de Cauchy :
(∀! > 0)(∃δ > 0)(∀x ∈ dom f : d(x, a) ≤ δ)

(∀y ∈ dom f : d(y, a) ≤ δ) : d$ (f (x), f (y)) ≤ !.
3. (Condition nécessaire de borne locale). Si f vérifie en a la condition de
Cauchy, alors
(∃r > 0)(∃δ > 0)(∃y ∈ dom f )
(∀x ∈ dom f : d(x, a) ≤ δ) : d$ (f (x), f (y)) ≤ r.
4. (Caractérisation de la limite par les voisinages). b = limx→a f (x) si et
seulement si pour tout voisinage V de b, il existe un voisinage U de a tel que
f (U ) ⊂ V.
5. (Caractère local de la notion de limite). Si W est un voisinage de a, et
f |W désigne la restriction de f à W, alors
lim f (x) = b ⇔ lim f |W (x) = b.

x→a x→a
On notera la légère variante dans la formulation du caractère localement

borné; elle est due au fait qu’il n’existe pas d’élément “origine” dans un
espace métrique quelconque. La seule règle de calcul des limites qui garde
un sens dans le cas de fonctions entre espaces métriques quelconques est celle
sur la limite d’une fonction composée. Elle se démontre exactement comme
dans le cas d’une fonction de Rn dans Rp .
Proposition. Soient (M, d), (M $ , d$ ) et (M $$ , d$$) des espaces métriques, f
une fonction de M dans M $ , g une fonction de M $ dans M $$ , a ∈ adh dom
(g ◦ f ), b ∈ adh dom g et c ∈ M $$ . Si
lim f (x) = b et lim g(y) = c,

x→a y→b
alors
lim (g ◦ f )(x) = c.
x→a
Comme pour les fonctions de Rn dans Rp , il est intéressant de considérer
la situation où a ∈ dom f.
Définition. Soient (M, d) et (M $ , d$) des espaces métriques, f une fonction

de M dans M $ et a ∈ dom f. On dit que f est continue au point a si
limx→a f (x) existe.
On démontre, comme dans le cas des fonctions de Rn dans Rp , que f est
continue en a si et seulement si limx→a f (x) = f (a), et que f est toujours
continue en un point isolé a du domaine de f , c’est-à-dire un point qui n’est
pas adhérent à dom f \ {a}. Les exemples précédents montrent que, si M est
muni de la métrique discrète, toute fonction de M dans M $ est continue en
chaque point de son domaine et que, si M $ est muni de la métrique discrète,
les fonctions continues en a sont les fonctions constantes sur un voisinage de
a. Si l’un des deux espaces est muni de la métrique discrète, on voit donc
que les fonctions continues entre ces espaces sont trop nombreuses ou trop
rares.
Exemples. 1. Le décalage de Bernoulli est l’application
σ : Σ → Σ, s = (sk )k∈N 2→ σ(s) = (sk+1 )k∈N ,
où (Σ, d) est l’espace métrique des suites dans S = {0, 1} défini dans la
Section 1. Montrons que l’application σ est continue en chaque s ∈ Σ. Si
! > 0 est donné, il existe un entier naturel n tel que 21n ≤ !. Si nous prenons
δ = 2n+2
1
et si t ∈ Σ est tel que d(t, s) ≤ δ, alors d(t, s) < 2n+1 1
et, par
une propriété démontrée dans la Section 1, on aura tk = sk pour chaque
0 ≤ k ≤ n + 1, et dès lors d(σ(t), σ(s)) ≤ 21n ≤ !. Le décalage de Bernoulli
joue un grand rôle en théorie ergodique et dans l’étude du chaos.
2. Si (M, d) et (M $ , d$) sont des espaces métriques, on dira qu’une application
f dans M dans M $ est lipschitzienne de constante α si, pour tout x ∈ M et
tout y ∈ M , on a
d$ (f (x), f (y)) ≤ αd(x, y).
Il est clair qu’une application lipschitzienne de M dans M $ est continue en
chaque point de M . En particulier, si M = M $ , d = d$ et f est lipschitzienne
de constante α < 1, on dit que f est une contraction ou une application
contractante sur M .
3. Si (M, d) est un espace métrique, alors, pour chaque a ∈ M, l’application
d(·, a) : (M, d) → (R, | · |), x 2→ d(x, a)
est lipschitzienne de constante 1 sur M . En effet, en vertu de l’inégalité

triangulaire, on a, pour chaque y ∈ M ,
d(x, a) − d(y, a) ≤ d(x, y), d(y, a) − d(x, a) ≤ d(y, x),

et dès lors
|d(x, a) − d(y, a)| ≤ d(x, y).
4. Si (E, 6 · 6) est un espace vectoriel normé, alors l’application norme
6 · 6 : (E, 6 · 6) → (R, | · |), x 2→ 6x6 est lipschitzienne de constante 1. En
effet, pour tout x ∈ E et tout y ∈ E, on a, par l’inégalité triangulaire,
6x6 − 6y6 ≤ 6x − y6, 6y6 − 6x6 ≤ 6y − x6,
et dès lors
|6y6 − 6x6| ≤ 6y − x6.
La notion de convergence d’une suite dans Rp s’étend sans peine au cas
d’une suite dans un espace métrique.
Définition. Soit (M, d) un espace métrique, (ak )k∈N une suite dans M
(c’est-à-dire une application de N dans M ) et soit b ∈ M. On dit que b
est limite de la suite (ak )k∈N ou que (ak )k∈N converge vers b si
(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m) : d(ak , b) ≤ !,
c’est-à-dire si la suite réelle (d(ak , b))k∈N converge vers zéro.

On démontre, comme dans le cas où M = Rp , qu’il existe au plus un
b ∈ M vérifiant cette condition; on l’appelle alors la limite de la suite (ak )k∈N,
et on le note limk→∞ ak .
Exemples. 1. Soit A une partie non vide de Rn et soit Rp muni de la norme
| · |2 . Soit (fk )k∈N une suite dans l’espace B(A; Rp ) des applications bornées
de A dans R muni de la norme de la convergence uniforme 6 · 6∞ et soit
f ∈ B(A; Rp ). Alors, en vertu de la définition précédente, (fk )k∈N converge
vers f si et seulement si
(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m) : sup |fk (x) − f (x)|2 ≤ !,

x∈A
c’est-à-dire si et seulement si la suite (fk )k∈N d’applications bornées de A

dans Rp converge uniformément sur A vers l’application bornée f de A dans
Rp . C’est la raison pour laquelle la norme correspondante de B(A; Rp ) est
appelée la norme de la convergence uniforme sur A.
2. Soit A une partie non vide de Rn et soit Rp muni de la norme | · |2 .
Soit (fˆk )k∈N une suite dans l’espace L1 (A; Rp) des classes d’équivalence de
fonctions de Rn dans Rp L-intégrables sur A muni de la norme 6·61 de la con-
vergence en moyenne. Si (fˆk )k∈N converge vers fˆ ∈ L1 (A; Rp), l’application
de la définition de convergence et de la définition de la norme entraı̂nent que

pour chaque fk ∈ fˆk et chaque f ∈ fˆ, on a
J
(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m) : |fk − f |2 ≤ !,
A
ce qui équivaut à dire que la suite (fk )k∈N converge en moyenne sur A vers
f . C’est la raison pour laquelle la norme 6 · 61 est appelée la norme de la
convergence en moyenne sur A.
Comme dans le cas de Rn , et avec des démonstrations entièrement ana-
logues, on peut formuler en termes de suites plusieurs notions fondamentales
d’analyse.
Proposition. Soit (M, d) un espace métrique, a ∈ M et E ⊂ M. Alors
a ∈ adh E si et seulement il existe une suite (ak )k∈N dans E qui converge
vers a.
Proposition. Soient (M, d) et (M $ , d$ ) des espaces métriques, f une fonc-

tion de M dans M $ , a ∈ M et b ∈ M $ . Alors, limx→a f (x) = b si et seulement
les deux conditions suivantes sont satisfaites.
1. a ∈ adh dom f.
2. Pour toute suite (xk )k∈N dans dom f qui converge vers a, (f (xk ))k∈N
converge vers b.
17.5 Espaces métriques complets

Soit (M, d) un espace métrique et (ak )k∈N une suite dans M . En procédant
exactement comme pour M = Rp , on démontre la condition nécessaire
de convergence de Cauchy.
Proposition. Si (ak )k∈N converge, elle vérifie la condition de Cauchy :
(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q ≥ m) : d(ak , aq ) ≤ !.
Une suite vérifiant cette condition est appellée une suite de Cauchy dans
M . On a vu que, si M = Rp muni de l’une des normes | · |j (j = 1, 2, ∞),
toute suite de Cauchy est convergente. Il n’en est pas de même dans tout
espace métrique, ainsi que le montrent les exemples suivants.
Exemples. 1. (Q, | · |), où | · | désigne la valeur absolue usuelle, est un sous-
espace vectoriel normé de (R, | · |). Soit a ∈ R \ Q un nombre irrationnel.
17.5. ESPACES MÉTRIQUES COMPLETS 691
D E
Comme tout intervalle a − k+1 1
, a + k+1
1
(k ∈ N) contient un nombre ra-
tionnel ak , la suite (ak )k∈N est une suite dans Q qui converge dans (R, | · |)
vers a. Elle est donc une suite de Cauchy dans (R, | · |) et, puisqu’elle prend
ses valeurs dans Q, elle est une suite de Cauchy dans (Q, | · |). Elle n’est
pas convergente dans (Q, | · |) puisque sa limite au sens de la norme | · | est
a ∈ R \ Q.
2. Soit f l’application de R dans R définie par f (x) = 1+|x| x
. On montre
sans peine que f est strictement croissante sur R, que f (−x) = −f (x) et
|f (x)| < 1 pour tout x ∈ R, et que
lim f (x) = −1, lim f (x) = 1.

x→−∞ x→+∞
En vertu d’une remarque faite dans la Section 1, l’application
df : R × R → R, (x, y) 2→ |f (x) − f (y)|,
définit une distance sur R. Si (ak )k∈N est une suite dans R et b ∈ R, alors
(ak )k∈N converge vers b au sens de la distance df si et seulement si
(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m) : |f (ak ) − f (b)| ≤ !,
c’est-à-dire si et seulement si la suite (f (ak ))k∈N converge vers f (b) au sens

de la distance usuelle dans R, et (ak )k∈N sera une suite de Cauchy dans
(R, df ) si et seulement si (f (ak ))k∈N est une suite de Cauchy dans (R, | · |).
Considérons dès lors la suite (k)k∈N. Puisque
lim f (k) = +1,

k→+∞
la suite (f (k))k∈N vérifie la condition de Cauchy dans (R, | · |) et la suite

(k)k∈N est donc une suite de Cauchy dans (R, df ). Mais cette suite n’est
pas convergente dans (R, df ) car, si (k)k∈N converge vers b ∈ R dans (R, df ),
alors (f (k))k∈N converge vers f (b) dans (R, | · |). En conséquence, f (b) = 1
ce qui contredit le fait que |f (b)| < 1 pour tout b ∈ R.
3. Soit I = [−1, 1] et C 1 (I, R) l’ensemble des applications f de I dans R de
classe C 1 sur I. C 1 (I; R) est un sous-espace vectoriel de C(I, R) et on peut
donc le munir de la norme induite par la norme 6 · 6∞ de la convergence
uniforme sur I, c’est-à-dire la norme
6f 6∞ = sup |f (x)|.
x∈I
1
Si, pour chaque k ∈ N, on définit fk par fk (x) = |x|1+ k , alors (fk )k∈N est
une suite dans C 1 (I, R) et elle converge uniformément sur I vers la fonction
f définie par f (x) = |x|. En effet, pour tout x ∈ [−1, 1], et tout k ∈ N, on a,
fk (0) − f (0) = fk (−1) − f (−1) = fk (1) − f (1) = 0,
fk (−x) − f (−x) = fk (x) − f (x),

et dès lors
& '
8 9 1 1 1
1+ k1
sup |fk (x) − f (x)| = sup x−x = ≤ .
x∈I x∈ ]0,1[ k (1 + k)
1 k+1 k
En conséquence, (fk )k∈N vérifie la condition de Cauchy de convergence uni-

forme, c’est-à-dire
(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)
(∀q ∈ N : q ≥ m) : sup |fk (x) − fq (x)| ≤ !,

x∈I
et est donc une suite de Cauchy dans (C 1 (I, R), 6 · 6∞ ). Pourtant, elle ne
converge pas vers un élément de cet espace puisque sa limite (unique) au sens
de cette convergence, qui est la fonction valeur absolue, n’est pas dérivable
en 0 et n’appartient donc pas à C 1 (I, R).
Si l’on se souvient de l’importance jouée par la condition suffisante de
Cauchy dans Rn pour l’analyse des fonctions de Rn dans Rp , il est important
de déterminer les espaces métriques (M, d) dans lesquels les suites de Cauchy
convergent vers un élément de l’espace.
Définition. On dit qu’un espace métrique (M, d) est complet si toute suite
de Cauchy dans M converge vers un élément de M .
On a une terminologie particulière dans le cas d’un espace vectoriel nor-
mé et dans le cas d’un espace préhilbertien.
Définition. On dit qu’un espace vectoriel normé (E, 6 · 6) est un espace de
Banach s’il est complet pour la distance induite par la norme.
Définition. On dit qu’un espace préhilbertien (H, (·|·)) est un espace de

Hilbert s’il est complet pour la norme induite par le produit scalaire.
Bien entendu, tout espace de Hilbert est un espace de Banach.
On peut caractériser un espace de Banach par une propriété des séries
dans cet espace. D’une manière entièrement analogue au cas de Rp , si (E, 6 ·
17.5. ESPACES MÉTRIQUES COMPLETS 693
6) est un espace vectoriel normé sur K et si (ak )k∈N est une suite dans E, la
%
série k∈N ak de termes ak dans E est la suite (Aq )q∈N des sommes partielles
%
Aq = qk=0 ak de (ak )k∈N . On dira qu’elle converge vers A ∈ E si (Aq )q∈N
converge vers A dans (E, 6 · 6). Dans ce cas, A sera appelé la somme de la
% %
série k∈N ak et noté ∞ k=0 ak .
Proposition. Soit (E, 6 · 6) un espace vectoriel normé. Alors (E, 6 · 6) est

%
un espace de Banach si et seulement si toute série k∈N ak dans E, dont la
%
série des normes k∈N 6ak 6 converge, converge elle-même vers un élément
de E.
%
Démonstration. Condition nécessaire. Soit k∈N ak une série dans
% %
E telle que k∈N 6ak 6 converge. Alors k∈N 6ak 6 vérifie la condition de
Cauchy et dès lors
q
$
(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q > k) : 6aj 6 ≤ !.
j=k+1
Comme, pour tous les entiers q > k, on a

F F
F $ F
F q F q
$
F aj F
F F≤ 6aj 6,
Fj=k+1 F j=k+1
%
on en déduit aussitôt que k∈N ak vérifie la condition de Cauchy dans E et,
E étant complet, cette série converge donc vers un élément de E.
Condition suffisante. Soit (ak )k∈N une suite de Cauchy dans (E, 6 · 6). Pour
chaque entier naturel j ≥ 0, Il existe donc un entier naturel mj , avec mj >
mj−1 si j ≥ 1, tel que, pour tous les entiers k ≥ mj et q ≥ mj , on ait
1
6ak − aq 6 ≤ .
2j
Posons b0 = am0 , bj = amj − amj−1 si j ≥ 1, de telle sorte que, pour tout
j ≥ 0, on ait
1
6bj 6 = 6amj − amj−1 6 ≤ j .
2
%
Dès lors, la série j∈N 6bj 6 converge, et l’hypothèse entraı̂ne que la série
%
j∈N bj converge vers un élément b de E, ce qui équivaut évidemment à la
convergence vers b de la suite (amj )j∈N. Pour montrer que b = limk→∞ ak ,
soit ! > 0, m ∈ N tel que, pour tous entiers k, q ≥ m, on ait
6ak − aq 6 ≤ !.
Comme mj > mj−1 pour tout j ≥ 1, on a mj ≥ j pour tout j ≥ 0, et dès

lors pour tout k ≥ m et tout q ≥ m, on aura aussi
6ak − amq 6 ≤ !.
En faisant tendre q vers l’infini dans ces inégalités, on en déduit que
(∀k ∈ N : k ≥ m) : 6ak − b6 ≤ !,
puisque la norme est une application continue de (E, 6 · 6) dans (R, | · |).
Exemples. 1. Si j = 1 ou ∞, alors (Rn , | · |j ) est un espace de Banach.
(Rn , (·|·)) est un espace de Hilbert.
2. Si A est un ensemble non vide quelconque et si (E, 6 · 6) est un espace de
Banach, alors (B(A; E), 6 · 6∞) est un espace de Banach. En effet, si (fk )k∈N
est une suite de Cauchy dans (B(A; E), 6 · 6∞ ), alors
(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)
(∀q ∈ N : q ≥ m)(∀x ∈ A) : 6fk (x) − fq (x)6 ≤ !.

Il en résulte aussitôt que, pour chaque x ∈ A fixé, la suite (fk (x))k∈N est
une suite de Cauchy dans (E, 6 · 6). Comme ce dernier espace est de Banach,
(fk (x))k∈N converge, et nous désignerons sa limite par f (x). On définit
ainsi une application f de A dans E. En faisant tendre q vers l’infini dans
l’expression ci-dessus, on trouve
(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀x ∈ A) : 6fk (x) − f (x)6 ≤ !,
ce qui équivaut à
(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m) : sup 6fk (x) − f (x)6 ≤ !.

x∈A
En prenant par exemple ! = 1 et appelant m1 un m qui convient, on trouve

que
sup 6fm1 (x) − f (x)6 ≤ 1,
x∈A
et dès lors
sup 6f (x)6 ≤ 1 + sup 6fm1 (x)6 = 1 + 6fm1 6∞ .

x∈A x∈A
Donc f ∈ B(A; E) et (fk )k∈N converge vers f dans (B(A; E), 6 · 6∞ ).

3. Si A ∈ Rn est un fermé borné non vide, alors (C(A; Rp), 6 · 6∞ ) est un
17.6. CONVERGENCE EN MOYENNE 695
espace de Banach. On sait que (C(A; Rp), 6 · 6∞) est un sous-espace vectoriel
normé de (B(A; Rp), 6 · 6∞ ) et dès lors toute suite de Cauchy (fk )k∈N dans
(C(A; Rp), 6 · 6∞ ) convergera vers un élément f ∈ B(A; Rp). Cela revient à
dire que la suite de fonctions (fk )k∈N converge uniformément sur A vers f
et, comme chaque fk est continue sur A, on sait que f sera continue sur A,
et donc appartient à C(A; Rp).
4. Les résultats de la section suivante consacrée à l’étude de la convergence
en moyenne vont nous permettre de montrer que, si A ⊂ Rn , alors L1 (A; Rp)
est un espace de Banach. C’est le théorème de Fischer-Riesz.
17.6 Convergence en moyenne

Nous consacrerons cette section à l’étude des relations entre la convergence
en moyenne d’une suite de fonctions intégrables et les autres types de con-
vergence. Rappelons tout d’abord la définition.
Définition. Soit A une partie de Rn , (fk )k∈N une suite de fonctions de Rn
dans Rp L-intégrables sur A et f une fonction de Rn dans Rp L-intégrable
sur A. On dit que (fk )k∈N converge en moyenne sur A vers f si
J
lim |fk − f |2 = 0.
k→∞ A
Les propriétés de l’intégrale fournissent aisément les propriétés élémentai-

res suivantes de la convergence en moyenne.
Proposition. Soit A une partie de Rn et (fk )k∈N une suite de fonctions de
Rn dans Rp L-intégrables sur A.
a) Si (fk )k∈N converge en moyenne sur A vers f et g, alors f = g p.p. sur A.
b) Si (fk )k∈N converge en moyenne sur A, alors (fk )k∈N vérifie la condition
de Cauchy de convergence en moyenne sur A :
J
(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q ≥ m) : |fk − fq |2 ≤ !.
A
H
c) Si (fk )k∈N converge
H
en moyenne sur A vers f , alors la suite ( A fk )k∈N
converge vers A f.
Montrons maintenant que la condition de Cauchy de convergence en
moyenne sur A est une condition suffisante pour la convergence en moyenne
sur A (théorème de Fischer-Riesz).
Théorème. Soit (fk )k∈N une suite de fonctions de Rn dans Rp L-intégrables

sur A ∈ Rn qui vérifie la condition de Cauchy de convergence en moyenne
sur A. Alors (fk )k∈N converge en moyenne sur A vers une fonction f de Rn
dans Rp L-intégrable sur A.
Démonstration. Le théorème équivaut évidemment à démontrer que
l’espace L1 (A; Rp) des (classes d’équivalence de) fonctions L-intégrables sur
A est complet. Par une caractérisation du caractère complet d’un espace vec-
%
toriel normé, il suffit donc de prouver que toute série k∈N fk de fonctions
H
% %
fk de Rn dans Rp L-intégrables sur A telle que k∈N 6fk 61 = k∈N A |fk |2
soit convergente converge en moyenne sur A vers une fonction L-intégrable
sur A (on conviendra, dans cette démonstration, deH confondre les éléments
%
de L1 (A; Rp) et leurs représentants). Puisque k∈N A |fk |2 converge, la ver-
sion généralisée du théorème de convergence de Levi entraı̂ne la convergence
%
p.p. sur A de la série k∈N |fk |2 vers une fonction L-intégrable G de Rn
%
dans R. En conséquence, la série k∈N fk convergera p.p. sur A vers une
fonction F de Rn dans Rp . Comme, pour tout entier q ≥ 0 et pour presque
tout x ∈ A, on a
# q #
#$ # q
$
# #
# fk (x)# ≤ |fk (x)|2 ≤ G(x),
# #
k=0 2 k=0
le théorème de convergence dominée de Lebesgue entraı̂ne que F est L-

intégrable sur A. D’autre part, pout tout entier q ≥ 0 et presque tout
x ∈ A, on a
# q #
#$ # q
$
# #
# fk (x) − F (x)# ≤ |fk (x)|2 + |F (x)|2 ≤ G(x) + |F (x)|2,
# #
k=0 2 k=0
et dès lors, puisque G + |F |2 est L-intégrable sur A, le théorème de conver-

%
gence majorée et minorée de Lebesgue appliqué à la suite (| qk=0 fk −F |2 )q∈N
entraı̂ne # # # #
J #$ q # J #$q #
# # # #
lim # fk − F # = lim # fk − F # = 0,
k→∞ A # # A k→∞ # #
k=0 2 k=0 2
%
et k∈N fk converge dans L1 (A; Rp) vers F .
Examinons maintenant les relations entre la convergence en moyenne et
les autres types de convergence. La convergence uniforme sur une partie
n-intégrable entraı̂ne la convergence en moyenne sur cette partie.
Proposition. Soit A une partie n-intégrable de Rn et (fk )k∈N une suite

de fonctions de Rn dans Rp L-intégrables sur A. Si (fk )k∈N converge uni-
formément sur A \ E vers une fonction f et si E est n-négligeable, alors
(fk )k∈N converge en moyenne sur A vers f .
Démonstration. Il résulte d’un corollaire du théorème de convergence
majorée et minorée de Lebesgue que f est L-intégrable sur A. Si ! > 0 est
donné, il existe un entier positif m tel que, pour tout entier k ≥ m et tout
x ∈ A \ E, on ait
!
|fk (x) − f (x)|2 ≤ .
µ(A)
En conséquence, pour tout entier k ≥ m, on aura
J J
!
|fk − f |2 ≤ = !.
A A µ(A)
La relation entre la convergence en moyenne et la convergence ponctuelle,

même p.p., sur A est plus compliquée. Tout d’abord, la convergence ponctu-
elle p.p. sur A d’une suite (fk )k∈N de fonctions L-intégrables sur A vers une
fonction f L-intégrable sur A n’entraı̂ne pas la convergence en moyenne sur
A de (fk )k∈N vers f . En effet, la suite (fk )k∈N∗ de fonctions de R dans R
définies par
k
fk (x) = 1]− 1 , 1 ] ,
2 k k
est formée de fonctions fk L-intégrables sur [−1, 1], et converge ponctuelle-

ment vers zéro sur R\{0}. Elle converge donc ponctuellement p.p. sur [−1, 1]
vers zéro. Mais, pour tout k ∈ N∗ , on a
J 1
|fk − 0| = 1,
−1
ce qui montre que (fk )k∈N∗ ne converge pas en moyenne sur [−1, 1] vers la
fonction nulle.
D’autre part, la convergence en moyenne sur A d’une suite (fk )k∈N
de fonctions L-intégrables sur A vers une fonction f L-intégrable sur A
n’entraı̂ne pas la convergence ponctuelle p.p. sur A de cette suite vers f .
Par exemple, définissons, pour chaque k ∈ N∗ , les k fonctions fkj (1 ≤ j ≤ k)
par fkj = 1[ j−1 , j ] . Chaque fonction fkj est évidemment L-intégrable sur [0, 1]
k k
et J 1
1
|fkj | = , (1 ≤ j ≤ k; k ∈ N∗ ).
0 k
Soit (fk )k∈N∗ la suite de fonctions de R dans R définies par
f1 = f11 , f2 = f21 , f3 = f22 , . . ..

H
Par la calcul précédent, la suite ( 01 |fk |)k∈N∗ converge vers zéro et dès lors
(fk )k∈N converge en moyenne sur [0, 1] vers la fonction nulle. Par ailleurs,
pour chaque x ∈ ]0, 1], il existe des valeurs arbitrairement grandes de k pour
lesquelles fk (x) prend la valeur 0 et des valeurs arbitrairement grandes de
k pour lesquelles fk (x) prend la valeur 1, ce qui montre que (fk )k∈N∗ ne
converge pas ponctuellement p.p. sur [0, 1] vers la fonction nulle.
Le théorème de convergence dominée de Lebesgue fournit des conditions
supplémentaires sous lesquelles la convergence ponctuelle p.p. implique la
convergence en moyenne.
Proposition. Soit A une partie de Rn et (fk )k∈N une suite de fonctions

de Rn dans Rp L-intégrables sur A qui converge ponctuellement sur A vers
une fonction f de Rn dans Rp . S’il existe une fonction g de Rn dans R+
L-intégrable sur A et telle que, pour presque tout x ∈ A et tout k ∈ N, on
ait
|fk (x)|2 ≤ g(x),
alors (fk )k∈N converge en moyenne sur A vers f .
Démonstration. Le théorème de convergence dominée de Lebesgue en-

traı̂ne que f est L-intégrable sur A. En conséquence, chaque fonction f − fk
est L-intégrable sur A. D’ailleurs, la suite (|fk − f |2 )k∈N converge p.p. sur
A vers la fonction zéro et, pour presque tout x ∈ A et tout entier positif k,
on a
|fk (x) − f (x)|2 ≤ |fk (x)|2 + |f (x)|2 ≤ g(x) + |f (x)|2 ,
avec g + |f |2 L-intégrable sur A. En appliquant à cette suite le théorème de

convergence majorée et minorée de Lebesgue, on obtient
J J
lim |fk − f |2 = 0 = 0.
k→∞ A A
Montrons maintenant que la convergence en moyenne sur A de la suite

de fonctions (fk )k∈N vers la fonction f entraı̂ne l’existence d’une sous-suite
de (fk )k∈N qui converge ponctuellement p.p. sur A vers f .
Proposition. Soit A une partie de Rn , (fk )k∈N une suite de fonctions de

Rn dans Rp L-intégrables sur A qui converge en moyenne sur A vers une
fonction f de Rn dans Rp L-intégrable sur A. Alors il existe une sous-suite
de (fk )k∈N qui converge ponctuellement p.p. sur A vers f .
Démonstration. En passant si nécessaire aux composantes, on peut sup-
poser que p = 1 et en considérant la suite (fHk − f )k∈N au lieu de (fk )k∈N, on
peut supposer que f = 0. Puisque Hlimk→∞ A |fk | = 0, il existe m0 ∈ N tel
que, pour tout entier k ≥ m0 , on a A |fk | ≤ 1 = 2−0 , et, en continuant de la
sorte, il existe, pour chaque
H
entier j ≥ 1, un entier mj > mj−1 tel que, pour
tout entier k ≥ mj , on a A |fk | ≤ 2−2j . Montrons que la sous-suite (fmk )k∈N
de (fk )k∈N converge ponctuellement p.p. sur A vers f . Posons, pour chaque
k ∈ N et chaque j ∈ N,
>
Gk = {x ∈ A : |fmk (x)| ≥ 2−k }, Hj = Gk .
k≥j
Pour presque tout x ∈ A \ Hj , on a |fmk (x)| < 2−k dès que k ≥ j, et dès
lors (fmk )k∈N converge vers zéro presque partout sur A \ Hj pour chaque
j ∈ N. En conséquence, (fmk )k∈N converge vers zéro presque partout sur
7
A \ H, où H = j∈N Hj . Il reste à démontrer que H est de n-mesure nulle.
Par l’inégalité de Tchebycheff, chaque Gk est n-intégrable et
J
µ(Gk ) ≤ 2k |fmk | ≤ 2k .2−2k = 2−k , (k ∈ N).
A
!q
Dès lors, pour chaque q ≥ k, j=k Gj est n-intégrable et
 
q
> q
$ q
$
µ Gj  ≤ µ(Gj ) ≤ 2−j < 2−k+1 .
j=k j=k j=k
!
Comme la suite ( qj=k Gj )q∈N est croissante et que la suite de ses n-mesures
!
est majorée, Hk = j≥k Gj sera n-intégrable et, pour chaque k ∈ N, on aura
 
q
>
µ(Hk ) = lim µ  Gj  ≤ 2−k+1 .
q→∞
j=k
Comme, par construction, (Hk )k∈N est une suite décroissante, H sera n-
intégrable et
0 ≤ µ(H) = lim µ(Hk ) ≤ lim 2−k+1 = 0;
k→∞ k→∞
donc H est de n-mesure nulle.

17.7 Théorème du point fixe de Banach

On peut généraliser aux espaces métriques complets le théorème des ap-
plications contractantes ou théorème du point fixe de Banach. Il
suffit de reprendre la démonstration donnée dans le cas où M = Rp . Rap-
pelons que, si M est un ensemble, f une application de M dans M et k ∈ N,
on pose f 0 = I et f k = f ◦ f ◦ . . . ◦ f (k fois) si k ≥ 1. On dit que y est un
point fixe de M si y = f (y).
Théorème. Soit (M, d) un espace métrique complet et f : M → M une ap-
plication contractante de constante α. Alors f possède un point fixe unique
y ∗ . En outre, pour chaque y0 ∈ M , la suite (yk )k∈N définie récursivement
par
yk+1 = f (yk ) = f k (y0 )
converge vers y ∗ et, pour tout entier k ≥ 0, on a
αk
d(yk , y ∗ ) ≤ d(f (y ∗ ), y ∗ ).
1−α
Le lemme simple suivant nous permet d’ailleurs de démontrer une géné-
ralisation utile de ce théorème.
Lemme. Soit (M, d) un espace métrique et f : M → M une application.
Alors, pour chaque entier k ≥ 1, tout point fixe de f est un point fixe de f k ,
et, s’il existe un entier q ≥ 1 tel que f q ait un point fixe unique y ∗ , alors f
possède l’unique point fixe y ∗ .
Démonstration. Soit y un point fixe de f ; alors y = f (y), et dès lors
f (y) = f 2 (y), f 2 (y) = f 3 (y), . . . , f k−1 (y) = f k (y).
D’autre part, si y ∗ = f q (y ∗ ), alors f (y ∗ ) = f q+1 (y ∗ ) = f q (f (y ∗ )), et f (y ∗ )

est un point fixe de f q . Par l’unicité, y ∗ = f (y ∗ ) ce qui montre que y ∗ est
un point fixe de f ; il est unique, puisque, par la première partie, tout point
fixe de f est un point fixe de f q .
Corollaire. Soit (M, d) un espace métrique complet, f : M → M et q ≥ 1

un entier tel que f q soit une application contractante de constante α sur M .
Alors f possède un point fixe unique y ∗ . En outre, pour chaque y0 ∈ M , la
suite (yk )k∈N définie récursivement par
yk+1 = f (yk ) = f k (y0 )

17.7. THÉORÈME DU POINT FIXE DE BANACH 701
converge vers y ∗ .
Démonstration. L’existence et l’unicité du point fixe y ∗ de f résultent
du théorème du point fixe de Banach appliqué à f q et du lemme précédent.
En outre, en prenant respectivement y0 , f (y0 ), . . ., f q−1 (y0 ) comme points
de départ des itérations dans le théorème du point fixe de Banach appliqué
à f q , on voit que les suites
8 9 8 9 8 9
f kq (y0 ) , f kq+1 (y0 ) = f kq (f (y0 )) , . . .,
k∈N k∈N k∈N
8 9 8 9
f kq+q−1 (y0 ) = f kq (f q−1 (y0 )) ,
k∈N k∈N
8 9
convergent toutes vers y ∗ . On en déduit aussitôt que la suite f k (y0 )
k∈N
converge aussi vers y ∗ .
Ce théorème est très utile pour démontrer l’existence et l’unicité de la
solution de nombreux types d’équations apparaissant en analyse. Par exem-
ple, soit I ⊂ R un intervalle non vide et f : I × Rp → Rp une application
continue. Supposons en outre qu’il existe une constante λ ≥ 0 telle que,
pour tout x ∈ I, y ∈ Rp, z ∈ Rp , on ait
|f (x, y) − f (x, z)|2 ≤ λ|y − z|2 ,
(condition de Lipschitz par rapport à la deuxième variable). Comme on l’a vu

au chapitre 8, le problème de Cauchy de conditions initiales x0 ∈ I, y0 ∈ Rp
consiste à déterminer une application y : I → Rp dérivable sur I et telle que
y $ (x) = f (x, y(x)), (x ∈ I), y(x0 ) = y0 .
Les propriétés de l’intégrale indéfinie d’une fonction continue et le théorème

fondamental du calcul différentiel et intégral montrent immédiatement que
ce problème est équivalent à la recherche d’une application y : I → Rp
continue sur I et telle que
J x
y(x) = y0 + f (s, y(s)) ds, (x ∈ I).
x0
Si I = [a, b] est un intervalle fermé borné, alors le second membre de cette

équation définit une application
J ·
ϕ : C(I; Rp) → C(I; Rp), y 2→ y0 + f (s, y(s)) ds.
x0
On munit évidemment C(I; Rp) de la norme 6 · 6∞ de la convergence uni-

forme, qui en fait un espace de Banach. Pour tout x ∈ I, y ∈ C(I; Rp) et
z ∈ C(I; Rp), on a
#J x
#
# #
|[ϕ(y)](x) − [ϕ(z)](x)|2 = ## [f (s, y(s)) − f (s, z(s)] ds##
x0 2
#J x
#
# #
≤ λ ## |y(s) − z(s)|2 ds## ≤ λ|x − x0 |6y − z6∞ .
x0
Si l’on suppose que, pour k ≥ 2, on a
# # (λ|x − x0 |)k−1
# k−1 #
#[ϕ (y)](x) − [ϕk−1(z)](x)# ≤ 6y − z6∞ ,
2 (k − 1)!
alors,
# # # #
# k # # #
#[ϕ (y)](x) − [ϕk (z)](x)# = #[ϕ(ϕk−1 (y)](x) − [ϕ(ϕk−1 (z)](x)#
2 2
#J x ? @ ##
#
= ## f (s, [ϕk−1(y)](s)) − f (s, [ϕk−1(z)](s)) ds##
x0 2
#J #
# x ## k−1 #
# #
≤ λ ## #[ϕ (y)](s) − [ϕk−1 (z)](s)# ds##
x0 2
#J #
λk # x # (λ|x − x0 |)k
≤ 6y − z6∞ ## |s − x0 |k−1 ds## = 6y − z6∞ .
(k − 1)! x0 k!
Par récurrence, on a donc, pour tout entier k ≥ 1,
# # (λ|x − x0 |)k
# k #
#[ϕ (y)](x) − [ϕk (z)](x)# ≤ 6y − z6∞ ,
k!
2
et dès lors, pour chaque entier k ≥ 1, chaque y ∈ C(I; Rp) et chaque z ∈

C(I; Rp), on a
(λ(b − a))k
6ϕk (y) − ϕk (z)6∞ ≤ 6y − z6∞ .
k!
(λ(b−a))k
Comme k! est le (k + 1)e terme de la série exponentielle de λ(b − a), il
tend vers zéro lorsque k tend vers l’infini, et il existera donc un entier q ≥ 1
tel que
(λ(b − a))q
< 1,
q!
c’est-à-dire tel que ϕq soit une contraction sur C(I; Rp). Le Corollaire du
théorème du point fixe de Banach entraı̂ne alors l’existence d’un point fixe
unique y ∗ de ϕ sur C(I; Rp). Nous avons donc démontré le résultat suivant,
souvent appelé théorème de Cauchy-Picard.
17.8. OUVERTS ET FERMÉS 703
Théorème. Soit I = [a, b] ⊂ R un intervalle fermé non vide et f : I × Rp →

Rp une application continue. Supposons en outre qu’il existe une constante
λ ≥ 0 telle que, pour tout x ∈ I, y ∈ Rp , z ∈ Rp , on ait
|f (x, y) − f (x, z)|2 ≤ λ|y − z|2 .
Alors, pour chaque x0 ∈ I et chaque y0 ∈ Rp , le problème de Cauchy
y $ (x) = f (x, y(x)), (x ∈ I), y(x0 ) = y0 ,
possède une solution unique.

En particulier, le théorème de Cauchy-Picard s’applique au problème de
Cauchy linéaire
y $ (x) = A(x)y(x) + h(x), (x ∈ I), y(x0 ) = y0 ,
lorsque I = [a, b], h : I → Rp est continue et lorsque la matrice A(x) =

(aij (x))1≤i,j≤p est telle que chaque fonction aij est continue sur I.
17.8 Ouverts et fermés

Soit (M, d) un espace métrique. Les notions suivantes correspondent exacte-
ment à celles données précédemment dans Rn .
Définition. On dit que E ⊂ M est une partie ouverte de M ou encore
un ouvert de M si tout élément de E est intérieur à E (ou encore si E est
voisinage de chacun de ses points), c’est-à-dire si E ⊂ int E.
Cette définition équivaut évidemment à la condition E = int E. En
particulier, ∅ et M sont des ouverts de M . Dans l’espace métrique (M, d0)
muni de la métrique discrète, toutes les parties de M sont ouvertes.
Définition. On dit que F ⊂ M est une partie fermée de M ou encore
un fermé de M si tout élément de adh F appartient à F , c’est-à-dire si
adh F ⊂ F .
Cette définition équivaut évidemment à la condition f = adh F . En
particulier, ∅ and M sont des fermés de M . Dans l’espace métrique (M, d0)
muni de la métrique discrète, toutes les parties de M sont fermées. Les
liens entre intérieur et adhérence fournissent immédiatement la proposition
suivante.
Proposition. E est une partie ouverte de M si et seulement si M \ E est

une partie fermée de M .
Une adaptation immédiate des raisonnement faits dans Rn montre immé-
diatement que si a ∈ M et r > 0, alors B(a; r) est un ouvert de M et B[a; r]
est un fermé de M. Les propriétés suivantes des ouverts et des fermés se
démontrent également comme dans Rn .
Proposition. 1. Si A est un ensemble non vide quelconque et (Eα)α∈A
une famille d’ouverts (resp. fermés) Eα de l’espace métrique (M, d), alors
! 7
α∈A Eα est un ouvert de (M, d) (resp. α∈A Eα est un fermé de (M, d)).
2. Si (Ej )1≤j≤m est une famille finie d’ouverts (resp. fermés) Ej de l’espace
7 !m
métrique (M, d), alors m j=1 Ej est un ouvert de (M, d) (resp. j=1 Ej est
un fermé de (M, d)).
3. Si E est une partie non vide de l’espace métrique (M, d), alors int E est le
plus grand ouvert contenu dans E et adh E est le plus petit fermé contenant
E.
En particulier, pour toute partie E de M , fr E = adh E ∩ adh !E est un
fermé de M .
Corollaire. Si (M, d) est un espace métrique, alors E ⊂ M est ouvert si et
seulement si E est une union de boules ouvertes de M .
Démonstration. Condition nécessaire. Si E est ouvert, alors, pour cha-
que a ∈ E, il existe ra > 0 tel que B[a; ra] ⊂ E et donc tel que B(a; ra) ⊂ E.
En conséquence,
>
E⊂ B(a; ra) ⊂ E,
a∈E
!
et dès lors E = a∈E B(a; ra).
Condition suffisante. Résulte immédiatement de la propriété 1 dans la Pro-
position précédente.
On a, comme dans Rn une intéressante caractérisation des fermés par les
suites.
Proposition. Soit F une partie non vide de M . Alors F est fermé dans M
si et seulement si, pour toute suite (ak )k∈N dans F convergeant vers b, on a
b ∈ F.
On en déduit une caractérisation utile des parties fermées d’un espace
métrique complet.
17.8. OUVERTS ET FERMÉS 705
Proposition. Soit (M, d) un espace métrique complet et F une partie non

vide de M . Alors F est fermé si et seulement si le sous-espace métrique
(F, d) de (M, d) est complet.
Démonstration. Condition nécessaire. Soit (ak )k∈N une suite de Cauchy
dans (F, d). C’est donc une suite de Cauchy dans (M, d), qui est complet;
elle converge donc vers b ∈ M. Comme F est fermé, la caractérisation par
les suites entraı̂ne que b ∈ F . Donc (F, d) est complet.
Condition suffisante. Soit (ak )k∈N une suite dans F qui converge vers b ∈ M .
Alors (ak )k∈N est une suite de Cauchy dans l’espace métrique complet (F, d).
En conséquence, b ∈ F, et F est fermé.
Corollaire. Soit (E, 6·6) un espace de Banach (resp. (H, (·|·))) un espace de
Hilbert) et F un sous-espace vectoriel de E (resp. H). Alors le sous-espace
vectoriel normé (F, 6 · 6) de E (resp. le sous-espace vectoriel préhilbertien
(F, (·|·)) de H) est un espace de Banach (resp. de Hilbert) si et seulement
si F est fermé dans E (resp. H).
Le résultat suivant donne la structure des ouverts et des fermés d’un
sous-espace métrique M $ de M .
Proposition. Soit (M, d) un espace métrique et M $ un sous-espace métri-
que de M . Alors E $ ⊂ M $ est un ouvert (resp. fermé) de M $ si et seulement
s’il existe un ouvert (resp. fermé) E de M tel que E $ = E ∩ M $ .
Démonstration. Faisons-la dans le cas d’un ouvert; celui d’un fermé s’en
déduit par passage au complémentaire. Condition nécessaire. Si E $ ⊂ M $
!
est un ouvert, alors, par la Proposition précédente, E $ = a∈E " B $ (a; ra), où
B $ (a; r) désigne une boule ouverte dans M $ . Comme, pour chaque a ∈ E $,
on a B $ (a; ra) = B(a; ra) ∩ M $ (où B(a; r) désigne une boule ouverte dans
M ), on voit que
 
>
$
E = B(a; ra) ∩ M $ = E ∩ M $ ,
a∈E "
!
avec E = a∈E " B(a; ra) ouvert dans M .
Condition suffisante. Si E $ = E ∩ M $ , avec E ouvert dans M , et si a ∈ E $,
alors a ∈ E et il existe donc r > 0 tel que B(a; r) ⊂ E; en conséquence,
B $ (a; r) = B(a; r) ∩ M $ ⊂ E ∩ M $ = E $ , ce qui montre que E $ est ouvert
dans M $ .
17.9 Parties denses et espaces séparables

Il est intéressant de pouvoir approcher les éléments d’un espace métrique
par certains de ses éléments “plus simples”.
Définition. Soit (M, d) un espace métrique et A une partie de M . On dit
que A est dense dans M si adh A = M.
Donc, A est dense dans M si et seulement si, pour chaque x ∈ M et
chaque r > 0, on a B[x; r] ∩ A /= ∅ (ou B(a; r) ∩ A /= ∅), ou encore si et
seulement si, pour chaque x ∈ M , il existe une suite (ak )k∈N dans A qui
converge vers x, ou encore si int !A = ∅, puisque cette dernière condition
équivaut à M = !∅ = !int !A = adh A.
Exemples. 1. Comme adh Q = adh (R \ Q) = R, on voit que l’ensemble
des nombres rationnels et l’ensemble des nombres irrationnels sont tous deux
denses dans R (muni de la distance ordinaire).
2. Qn est dense dans (Rn , | · |j ) pour j = 1, 2 ou ∞.
On peut “relativiser” la notion de densité de la manière suivante.
Définition. Soient A et B deux parties d’un espace métrique (M, d). On
dit que A est dense par rapport à B si adh A ⊃ B.
Il en résulte que si A est dense par rapport à B et B dense par rapport à
C, alors A est dense par rapport à C, puisque adh A ⊃ B entraı̂ne adh A ⊃
adh B ⊃ C. Si B ⊃ A, alors la densité de A par rapport à B équivaut à la
densité de A dans adh B considéré comme sous-espace métrique de M .
Exemple. Q est dense par rapport à R \ Q et R \ Q est dense par rapport
à Q.
Il résulte de la définition que si B ⊃ A et A est dense dans M , alors B
est dense dans M. En particulier, toute union de parties denses dans M est
dense dans M . Par contre l’intersection de deux parties denses dans M peut
être vide : c’est le cas de Q et R \ Q dans R. Toutefois, l’intersection d’une
famille finie d’ouverts denses dans M sera dense dans M .
Proposition. Soit (M, d) un espace métrique et (Ej )1≤j≤m une famille finie
7
d’ouverts denses Ej dans M . Alors m
j=1 Ej est un ouvert dense dans M .
7
Démonstration. Il est évident que m j=1 Ej est ouvert. Pour montrer sa
densité dans M , il faut prouver que si x ∈ M et r > 0, alors B(x; r) ∩
7
( m
j=1 Ej ) /= ∅. Comme l’ouvert E1 est dense dans M , B(x; r) ∩ E1 est un
ouvert non vide, et il existe a1 ∈ E1 et r1 > 0 tels que B[a1 ; r1 ] ⊂ B(x; r)∩E1 .
Comme l’ouvert E2 est dense dans M , B(a1 ; r1 ) ∩ E2 est un ouvert non vide,
17.9. PARTIES DENSES ET ESPACES SÉPARABLES 707
et il existe a2 ∈ E2 et r2 > 0 tels que
B[a2 ; r2 ] ⊂ B(a1 ; r1 ) ∩ E2 ⊂ B(x; r) ∩ E1 ∩ E2 .
En continuant de la sorte, on trouve donc finalement am ∈ Em et rm > 0

tels que
B[am ; rm] ⊂ B(am−1 ; rm−1 ) ∩ Em ⊂ B(x; r) ∩ E1 ∩ . . . ∩ Em ,

Lorsque (M, d) est un espace métrique complet, la construction de la
démonstration précédente peut être adaptée au cas d’une famille dénombra-
ble d’ouverts denses dans M . C’est le théorème de Baire qui joue un
grand rôle dans de nombreuses questions d’analyse et de topologie.
Théorème. Soit (Ej )j∈N une famille dénombrable d’ouverts Ej denses dans
7
un espace métrique complet (M, d). Alors j∈N Ej est dense dans M .
Démonstration. Soit x ∈ M et r > 0; il faut montrer que B(x; r) ∩
7
( j∈N Ej ) /= ∅. Comme E0 est ouvert et dense dans M , B(x; r) ∩ E0 est
ouvert et non vide et il existe donc a0 ∈ M et r0 ∈ ]0, 1] tels que
B[a0 ; r0] ⊂ B(x; r) ∩ E0 .
Comme E1 est ouvert et dense dans M , B(a0 ; r0) ∩ E1 est ouvert et non vide
et il existe donc a1 ∈ M et r1 ∈ ]0, 12 ] tels que
B[a1 ; r1 ] ⊂ B(a0 ; r0 ) ∩ E1 ⊂ B(x; r) ∩ E0 ∩ E1 .
En continuant de la sorte, on obtient

E uneE suite (ak )k∈N dans M et une suite
(rk )k∈N dans R∗+ telles que rk ∈ 0, k+1
1
et
B[ak+1 ; rk+1 ] ⊂ B(ak ; rk ) ∩ Ek+1 ⊂ B(x; r) ∩ E0 ∩ E1 ∩ . . . ∩ Ek+1 .
En conséquence, on a B[aq ; rq ] ⊂ B[ak ; rk ] pour tous les entiers q ≥ k ≥ 0,

et dès lors
1
d(aq , ak ) ≤ rk ≤ ,
k+1
si q ≥ k ≥ 0. On en déduit aisément que (ak )k∈N est une suite de Cauchy,
et elle converge donc vers un élément a ∈ M . Comme, pour chaque entier
k fixé, on a aq ∈ B[ak ; rk ] pour tout q ≥ k, on obtient, en faisant tendre
7
q vers l’infini, a ∈ B[ak ; rk ], et donc a ∈ k∈N B[ak ; rk ]. Dès lors, a ∈
7
B(x; r) ∩ ( k∈N Ek ) .
En passant aux complémentaires, le théorème de Baire affirme que si

(Fj )j∈N est une famille dénombrable de fermés Fj d’intérieur vide dans un
!
espace métrique complet (M, d), alors j∈N Fj a un intérieur vide dans M .
Si l’on se souvient que, dans Rn , les ensembles de n-mesure nulle (ou n-
négligeables) sont d’intérieur vide, et que la propriété d’être de mesure nulle
se conserve par union dénombrable, le théorème de Baire suggère l’introduc-
tion, dans un espace métrique (M, d), d’une notion “métrique” de petitesse
d’une partie de M .
Définition. Soit (M, d) un espace métrique et A une partie de M . On dit
que A est rare si int adh A = ∅. On dit que A est maigre s’il existe une suite
!
(Ak )k∈N de parties rares Ak de M telle que A ⊂ k∈N Ak , c’est-à-dire s’il
!
existe une suite (Fk )k∈N de fermés d’intérieur vide telle que A ⊂ k∈N Fk .
On dit qu’une partie B de M est résiduelle si M \ B est maigre.
Toute partie dénombrable A d’un espace métrique (M, d) dans lequel
les singletons sont d’intérieur vide est évidemment maigre puisqu’elle peut
!
s’écrire sous la forme A = k∈N {ak } avec ak ∈ M, et que chaque {ak } est
rare. Par exemple, Q est maigre dans (R, |·|) et R\Q est résiduel dans (R, |·|).
On démontre facilement toute partie d’un ensemble maigre est maigre et que
l’union d’une famille au plus dénombrable de parties maigres d’un espace
métrique est maigre et le théorème de Baire exprime que toute partie maigre
d’un espace métrique complet est d’intérieur vide. D’autre part, B ⊂ M est
résiduel si et seulement s’il existe une suite (Ek )k∈N d’ouverts denses Ek de
7
M tels que B ⊃ k∈N Ek , et le théorème de Baire exprime encore que toute
partie résiduelle d’un espace métrique complet est dense dans cet espace. En
1931, les mathématiciens polonais Stefan Banach et Stefan Mazurkiewicz
ont utilisé le théorème de Baire pour démontrer que l’ensemble des fonctions
qui ont une dérivée à droite en au moins un point est maigre dans le sous-
espace BC(R, R) ⊂ B(R, R) des fonctions réelles bornées et continues sur
R!
On dit qu’une propriété P des points d’un espace métrique M est géné-
rique sur M si elle est vérifiée sur une partie résiduelle de M . L’étude des
propriétés génériques constitue une partie très active des mathématiques
actuelles.
Il est important de déterminer concrètement des parties denses d’un
espace métrique donné. Pour l’espace de Banach C(A; Rp), avec A un
fermé borné de Rn , on a l’important résultat suivant, qui porte le nom
de théorème d’approximation de Weierstrass, et montre que les re-
strictions à A des polynômes de Rn dans Rp forment une partie dense de
C(A; Rp).
Théorème. Si A est un fermé borné de Rn et si f est une fonction de Rn
dans Rp continue sur A, alors, pour chaque ! > 0, il existe un polynôme P
de Rn dans Rp tel que
sup |f (x) − P (x)|2 ≤ !.

x∈A
Démonstration. En passant si nécessaire aux composantes de f et de P ,

on peut supposer, sans perte de généralité, que p = 1. Désignons par P(A)
l’ensemble des restrictions à A des polynômes de Rn dans R, et soit P(A)
son adhérence dans C(A; R). La démonstration se fait en plusieurs étapes.
a. Si g ∈ P(A) et si 0 ≤ g(x) ≤ 1 pour tout x ∈ A, alors g 1/2 ∈ P(A).
Soit g une telle fonction et (fk )k∈N la suite de fonctions de Rn dans R
définie par récurrence par
1
f0 = 0, fk+1 = fk + (g − fk2 ), (k ∈ N).
2
Par construction, si fk ∈ P(A), il en est de même de fk+1 , et dès lors (fk )k∈N
est une suite dans P(A). D’ailleurs, si 0 ≤ fk (x) ≤ g 1/2(x) pour tout x ∈ A,
on aura aussi
1
0 ≤ fk+1 (x) = fk (x) + [g 1/2(x) + fk (x)][g 1/2(x) − fk (x)]
2
≤ fk (x) + [g 1/2(x) − fk (x)] = g 1/2(x),
ce qui montre, puisque g0 = 0, que (fk )k∈N est une suite croissante de fonc-
tions positives et majorées par g 1/2 sur A. En conséquence, (fk )k∈N converge
ponctuellement sur A vers une fonction h qui vérifie l’égalité
1
h = h + (g − h2 ),
2
c’est-à-dire h = g 1/2. Comme g est continue sur A, il en est de même de h et
le théorème de Dini implique alors que la convergence de (fk )k∈N vers g 1/2
est uniforme sur A. Donc, si ! > 0 est donné, il existe un entier m ≥ 0 tel
que
!
sup |g 1/2(x) − fm (x)| ≤ ,
x∈A 2
et, comme fm ∈ P(A), il existe un Pm ∈ P(A) tel que
!
sup |fm (x) − Pm (x)| ≤ .
x∈A 2
sup |g 1/2(x) − Pm (x)| ≤ !,

x∈A
et donc que g 1/2 ∈ P(A).

b. Si h ∈ P(A), alors |h| ∈ P(A).
Le résultat est trivial si h = 0. Si h /= 0, alors g = ( suph |h| )2 ∈ P(A) et
A
vérifie 0 ≤ g(x) ≤ 1 pour tout x ∈ A. Par la partie (a) de la démonstration,
g 1/2 = sup|h| |h| ∈ P(A), et il en est dès lors de même de |h|.
A
c. Si f 1 , . . . , f q appartiennent à P(A), alors
max(f 1 , . . ., f q ) et min(f 1 , . . ., f q )
appartiennent à P(A).
Il suffit de noter que
1 1
max(f 1 , f 2 ) = (f 1 + f 2 + |f 1 − f 2 |), min(f 1 , f 2 ) = (f 1 + f 2 − |f 1 − f 2 |),
2 2
et d’appliquer, de proche en proche, les résultats de (b).
d. Si ! > 0 est donné, il existe g ∈ P(A) tel que, pour tout x ∈ A, on a
! !
f (x) − ≤ g(x) ≤ f (x) + .
2 2
Si f ∈ C(A; R) et si u ∈ A et y ∈ A sont donnés, associons leur un
polynôme Pu,y de Rn dans R égal à f (y) en y et à f (u) en u, ce qui est
toujours possible. Comme la fonction Pu,y − f est continue et égale à 0 au
point y, il existe δ(y) > 0 tel que, pour tout x ∈ B2 [y; δ(y)], on ait
!
Pu,y (x) ≥ f (x) − .
2
On définit ainsi une jaugeA δ : y 2→Bδ(y) sur A et le lemme de Cousin entraı̂ne
l’existence d’une famille (y j , Aj ) 1≤j≤m telle que
m
>
A= Aj , y j ∈ Aj ⊂ B2 [y j ; δ(y j )], (1 ≤ j ≤ m).
j=1
Par la partie (c) de la démonstration, la fonction
gu = max(Pu,y1 , . . . , Pu,ym )
appartient à P(A) et, par construction, est telle que gu (u) = 0, et, pour tout
x ∈ A,
!
gu (x) ≥ f (x) − .
2
Comme gu − f est continue et nulle au point u, il existe η(u) > 0 tel que,
pour tout x ∈ B2 [u; η(u)], on a
!
gu (x) ≤ f (x) + .
2
On définit ainsi une jaugeA η : u 2→Bη(u) sur A et le lemme de Cousin entraı̂ne
l’existence d’une famille (uj , B j ) 1≤j≤r telle que
r
>
A= B j , uj ∈ B j ⊂ B2 [uj ; η(uj )], (1 ≤ j ≤ r).
j=1
Par la partie (c) de la démonstration, la fonction
g = min(gu1 , . . . , gur ),
appartient à P(A) et, par construction, est telle que, pour tout x ∈ A, on a
! !
f (x) − ≤ g(x) ≤ f (x) + .
2 2
e. Si ! > 0 est donné, il existe P ∈ P(A) tel que, pour tout x ∈ A, on ait
f (x) − ! ≤ P (x) ≤ f (x) + !.
Par la partie d de la démonstration, il existe g ∈ P(A) tel que, pour tout

x ∈ A, on a
! !
f (x) − ≤ g(x) ≤ f (x) + ,
2 2
et, puisque g ∈ P(A), il existe P ∈ P(A) tel que, pour tout x ∈ A, on a
! !
g(x) − ≤ P (x) ≤ g(x) + .
2 2
On en déduit, que, pour tout x ∈ A, on a
f (x) − ! ≤ P (x) ≤ f (x) + !.

Pour obtenir une classe de fonctions simples qui sera dense dans l’espace
¯ Rp),
L1 (I; où I est un un semi-pavé de Rn , on a besoin d’un second théo-
rème d’approximation des parties bornées et n-intégrables de Rn .
Proposition. Soit I ⊂ Rn un semi-pavé et A ⊂ I n-intégrable. Pour chaque

! > 0, il existe une famille finie (J k )1≤k≤q de semi-pavés mutuellement dis-
!
joints contenus dans I et tels que, si B = qk=1 J k , on a
J
|1A − 1B | ≤ !.
I
Démonstration. Si ! > 0 est donné, il existe, par le premier théorème

d’approximation des parties bornées n-intégrables, une suite (J k )k∈N de
semi-pavés mutuellement disjoints, contenus dans I tels que
> ∞
$ !
A⊂ J k et µ(J k ) ≤ µ(A) + .
k∈N k=0
2
!
C = k∈N J k est évidemment n-intégrable comme union d’une infinité dé-
nombrable de semi-pavés mutuellement disjoints contenus dans I, et
 
> ∞
$ !
µ(A) ≤ µ(C) = µ  J k
= µ(J k ) ≤ µ(A) + .
k∈N j=0
2
Soit q ∈ N tel que

q
$ !
µ(C) ≤ µ(J k ) + ,
k=0
2
!q
et soit B = k=0 J k ⊂ C. On a
J J J J J
|1A − 1B | ≤ |1A − 1C | + |1C − 1B | = (1C − 1A ) + (1C − 1B )
I I I I I
! !
= µ(C) − µ(A) + µ(C) − µ(B) ≤ + = !.
2 2
En procédant maintenant comme dans le corollaire du théorème d’appro-

ximation des fonctions de Rn dans R par des fonctions simples donné au
chapitre 13, si ce n’est qu’on remplace, dans la démonstration, l’emploi
de la définition de fonction n-mesurable par l’inégalité de Tchebycheff, on
démontre un second corollaire de ce théorème d’approximation, dont nous
conservons ici la terminologie.
Corollaire. Soit I ⊂ Rn un semi-pavé et f une fonction de Rn dans R

définie et L-intégrable sur I. Alors, pour chaque k ∈ N, la fonction simple
construite dans le théorème d’approximation est combinaison linéaire de
fonctions caractéristiques de parties n-intégrables de I.
Introduisons maintenant la notion de fonction en escalier sur I.
Définition. Soit I un semi-pavé de Rn . On dit que la fonction f de Rn
dans Rp est en escalier sur I s’il existe une partition {I 1 , I 2 , . . ., I m } de I en
semi-pavés I j telle que f soit constante sur chaque int I j , (1 ≤ j ≤ m).
Il résulte aussitôt de cette définition qu’une fonction en escalier sur I est
définie p.p. sur I et son intégrale est particulièrement facile à calculer.
Proposition. Si I ⊂ Rn est un semi-pavé, si f est une fonction de Rn dans
Rp en escalier sur I et si, avec les notations de la définition, f j désigne la
valeur constante de f sur int I j , (1 ≤ j ≤ m), alors f est L-intégrable sur I
et J m
$
f= µ(I j )f j .
I j=1
Démonstration. Pour chaque 1 ≤ j ≤ m, la fonction fH, égale p.p. sur

I j à la fonction constante f j , est L-intégrable sur I j et I j f = µ(I j )f j .
L’intégrabilité de f sur I découle alors de l’additivité de l’intégrale, et l’on
procède de même pour |f |2 .
La densité des (classes d’équivalence) des fonctions en escalier sur I¯ dans
¯ Rp) découle du résultat suivant, appelé théorème d’approxi-
l’espace L1 (I;
mation des fonctions L-intégrables par les fonctions en escalier.
Théorème. Soit I un semi-pavé de Rn et f une fonction de Rn dans Rp
L-intégrable sur I. Alors, pour tout ! > 0, il existe une fonction g en escalier
sur I telle que J
|f − g|2 ≤ !.
I
Démonstration. En passant éventuellement aux composantes de f , on
peut supposer que p = 1. Par le corollaire ci-dessus et la remarque qui
termine la démonstration du théorème d’approximation par les fonctions
simples, il existe une suite (sk )k∈N de combinaisons linéaires de fonctions
caractéristiques de parties n-intégrables de I qui converge ponctuellement
p.p. sur I vers f et est telle que, pour presque tout x ∈ I, on a
|sk (x)| ≤ |s1k (x) − s2k (x)| ≤ s1k (x) + s2k (x) ≤ |f (x)|,
(les notations sont celles du théorème d’approximation par les fonctions sim-
ples). Pour chaque k ∈ N, |sk − f | est L-intégrable sur I,
(sk − f )(x)| ≤ |sk (x)| + |f (x)| ≤ 2|f (x)|,
pour presque tout x ∈ I, et la suite (sk − f |)k∈N converge ponctuellement

p.p. sur I vers zéro. Le théorème de convergence dominée de Lebesgue
entraı̂ne alors que
J J
lim |sk − f | = lim |sk − f | = 0.
k→∞ I I k→∞
Soit ! > 0; il existe un entier m ≥ 0 tel que

J
!
|sm − f | ≤ .
I 2
D’autre part, sm peut s’écrire
r
$
sm (x) = ck 1Ak (x), (x ∈ Rn ),
k=1
où les ck sont des réels non nuls et les Ak des parties n-intégrables de I. Par
le second théorème d’approximation des parties bornées et n-intégrables, on
peut, pour chaque 1 ≤ k ≤ r, trouver une famille finie (J k,l )1≤l≤qk de semi-
!qk
pavés mutuellement disjoints contenus dans I et tels que, si Bk = s=1 J k,s ,
on ait J
!
|1Ak − 1Bk | ≤ .
I 2|ck |r
Dès lors, si nous posons
r
$
g= ck 1B k ,
k=1
la fonction g est en escalier sur I, et

J J J
|f − g| ≤ |f − sm | + |sm − g|
I I I
r J r J
! $ ! $
≤ + |ck (1Ak − 1Bk )| ≤ + |ck | |1Ak − 1Bk |
2 k=1 I 2 k=1 I
! !
≤ + = !.
2 2
Une conséquence intéressante du théorème d’approximation des fonctions

L-intégrables et des propriétés de la convergence en moyenne est le résultat
suivant.
Corollaire. Soit I un semi-pavé de Rn et f une fonction de Rn dans Rp
L-intégrable sur I. Alors, il existe une suite (fk )k∈N de fonctions de Rn dans
Rp en escalier sur I qui converge vers f ponctuellement p.p. et en moyenne
sur I.
Démonstration. En prenant successivement ! = k+1 1
, (k ∈ N) dans
le théorème d’approximation, on obtient une suite (gk )k∈N de fonctions en
escalier sur I (et donc L-intégrables sur I) qui converge en moyenne sur I
vers f . Par une propriété de la convergence en moyenne, cette suite (gk )k∈N
possède une sous-suite (fk )k∈N = (gjk )k∈N qui converge ponctuellement p.p.
sur I vers f .
Une autre conséquence intéressante du théorème d’approximation des
fonctions intégrables est une caractérisation des fonctions n-mesura-
bles sur I.
Proposition. Soit I ⊂ Rn un semi-pavé et f une fonction de Rn dans R
définie p.p. sur I. Alors f est n-mesurable sur I si et seulement s’il existe
une suite (fk )k∈N de fonctions en escalier sur I qui converge ponctuellement
p.p. sur I vers f .
Démonstration. Condition suffisante. Comme chaque fk est L-intégrable
sur I, et donc n-mesurable sur I, f sera n-mesurable sur I.
Condition nécessaire. Comme f est n-mesurable sur I, il existe une suite
(gk )k∈N de fonctions simples sur I, formées de combinaisons linéaires de
fonctions caractéristiques de parties n-mesurables (et donc n-intégrables) de
I, et qui converge ponctuellement p.p. sur I vers f . Comme chaque gk est L-
intégrable sur I, le théorème d’approximation que nous venons de démontrer
entraı̂ne l’existence d’une fonction réelle hk en escalier sur I telle que
J
1
|hk − gk | ≤ .
I k
Donc la suite (hk − gk )k∈N converge en moyenne sur I vers zéro et contient
par conséquent une sous-suite (hjk − gjk )k∈N qui converge ponctuellement
p.p. sur I vers zéro. Alors, la suite (fk )k∈N = (hjk )k∈N de fonctions en
escalier sur I converge ponctuellement p.p. sur I vers f .
La notion de partie dense permet d’introduire une classe intéressante
d’espaces métriques.
Définition. On dit qu’un espace métrique (M, d) est séparable si M est fini
ou s’il existe une partie A de M dénombrable et dense dans M .
Bien entendu, tout sous-espace métrique d’un espace métrique séparable
est séparable.
Exemples. 1. (Rn , | · |j ) (j = 1, 2, ∞) est séparable puisque Qn est dénom-
brable et dense dans Rn .
2. Si A ⊂ Rn est un fermé borné, alors C(A; Rp ) est séparable car il est facile
de montrer que l’ensemble des polynômes de Rn dans Rp à coefficients dans
Qp est dénombrable. D’autre part, cet ensemble est dense dans C(A; Rp) en
vertu du théorème d’approximation de Weierstrass et de la densité de Qp
dans Rp .
¯ Rp) est séparable car il est facile de montrer que le sous-ensemble
3. L1 (I;
des (classes d’équivalence) de fonctions en escalier sur I¯ à valeurs dans Qp
est dénombrable. D’autre part, cet ensemble est dense dans L1 (I; ¯ Rp) en
vertu du théorème d’approximation ci-dessus et de la densité de Qp dans
Rp .
17.10 Bornés et compacts

On peut introduire la notion de partie bornée d’un espace métrique.
Définition. Soit (M, d) un espace métrique et E ⊂ M . On dit que E est
une partie bornée ou un borné de M s’il existe a ∈ M et r > 0 tels que
E ⊂ B[a; r].
On montre sans peine que cette définition est équivalente, pour (Rn , |·|j ),
(j = 1, 2, ∞), à celle donnée précédemment. On démontre, comme dans le
cas de Rn , les propriétés suivantes.
Proposition. Si A est un ensemble quelconque non vide et (Eα)α∈A une
7
famille de bornés Eα de M , alors α∈A Eα est un borné de M . Si (Ej )1≤j≤m
!
est une famille finie de bornés Ej de M , alors 1≤j≤m Ej est un borné de
M. Enfin, si E ⊂ M est borné, alors int E, adh E et fr E sont bornés.
On a vu précédemment que les parties fermées et bornées de Rn jouissent
de propriétés particulièrement intéressantes dues au fait que ces parties ont
la propriété de Cousin. Celle-ci se généralise facilement à un espace métrique
quelconque, mais une partie fermée et bornée d’un tel espace ne possède plus
nécessairement la propriété de Cousin. C’est donc par cette propriété ou par
une propriété équivalente qu’il faudra caractériser, dans un espace métrique
quelconque, les parties qui y joueront le rôle des fermés bornés de Rn .
17.10. BORNÉS ET COMPACTS 717
Si (M, d) est un espace métrique et E ⊂ M , on appellera jauge sur E

toute application de E dans R∗+ .
Définition. Soit (M, d) un espace métrique et E une partie non vide de M .
On dit que E vérifie la propriété de Cousin si, pour chaque jauge
A
δ surB
E, il
existe une division δ-fine de E, c’est-à-dire une famille finie (xj , E j ) 1≤j≤m
telle que
m
>
E= E j , xj ∈ E j ⊂ B[xj ; δ(xj )], (1 ≤ j ≤ m).
j=1
Nous allons voir que cette propriété peut se formuler, d’une manière
équivalente, en termes d’ouverts. Une définition préliminaire est nécessaire.
Définition. Soit (M, d) un espace métrique et E une partie de M . Un
recouvrement de E est une famille F = (Fα )α∈A de parties Fα de M telle
que >
E⊂ Fα .
α∈A
On dit aussi que F recouvre E. Le recouvrement F = (Fα)α∈A de E est
dit fini si A est fini et ouvert si, pour chaque α ∈ A, Fα est ouvert. Si
F = (Fα)α∈A est un recouvrement de E et si Ã ⊂ A est tel que F̃ = (Fα )α∈Ã
recouvre E, on dit que F̃ est un sous-recouvrement de E extrait de F ou
que le recouvrement F̃ de E contient le sous-recouvrement F̃ de E.
Définition. Soit (M, d) un espace métrique et E une partie de M . On dit

que E possède la propriété de Borel-Lebesgue si tout recouvrement ouvert
F de E contient un sous-recouvrement fini de E.
Nous allons montrer que les propriétés de Cousin et de Borel-Lebesgue
sont équivalentes.
Proposition. Soit (M, d) un espace métrique et E une partie non vide de
M . Alors E a la propriété de Cousin si et seulement si E a la propriété de
Borel-Lebesgue.
Démonstration. Condition nécessaire. Soit F = (Fα )α∈A un recouvre-
ment ouvert de E. Alors, pour chaque x ∈ E, il existe un α(x) ∈ A tel
que x ∈ Fα(x) , et comme Fα(x) est ouvert, il existe un δ(x) > 0 tel que
B[x; δ(x)] ⊂ Fα(x). On définit ainsi une jauge δ : x 2→ δ(x)
A
sur E B
et la pro-
priété de Cousin entraı̂ne l’existence d’une famille finie (xj , E j ) 1≤j≤m telle
que
m
>
E= E j , xj ∈ E j ⊂ B[xj ; δ(xj )], (1 ≤ j ≤ m),
j=1
et donc telle que

m
> m
>
E⊂ B[xj ; δ(xj )] ⊂ Fα(xj ) .
j=1 j=1
En conséquence, (Fα(xj ) )1≤j≤m est un sous-recouvrement fini de E extrait

de F .
Condition suffisante. Soit δ une jauge sur E. Alors (B(x; δ(x)))x∈E est un re-
couvrement
A
ouvertB
de E, et, par hypothèse, il contient un sous-recouvrement
fini B(x ; δ(x )) 1≤j≤m de E. En posant, pour chaque 1 ≤ j ≤ m, E j =
j j
E ∩ B(xj ; δ(xj )), on voit que

m
> m
>
E=E∩ B(xj ; δ(xj )) = Ej,
j=1 j=1
et, pour chaque 1 ≤ j ≤ m,
xj ∈ E ∩ B(xj ; δ(xj )) = E j ⊂ B[xj ; δ(xj )].

Définition. Soit (M, d) un espace métrique et E une partie de M . On dit
que E est une partie compacte de M ou est un compact de M s’il possède
la propriété de Borel-Lebesgue. En particulier, si M possède la propriété de
Borel-Lebesgue, on dit que M est un espace métrique compact.
La propriété de compacité est intrinsèque dans le sens suivant.
Proposition. Soit (M, d) un espace métrique et E une partie de M . Alors
E est une partie compacte de M si et seulement si le sous-espace métrique
(E, d) est un espace métrique compact.
Démonstration. Condition nécessaire. Soit F = (Fα )α∈A un recouvre-
ment de E par des ouverts Fα de E; on sait alors que, pour chaque α ∈ A, il
existe un ouvert F̃α de M tel que Fα = F̃α ∩E. En conséquence, F̃ = (F̃α )α∈A
est un recouvrement de E par des ouverts de M et il contient donc, par hy-
pothèse, un sous-recouvrement fini (F̃αj )1≤j≤m de E. En conséquence,
m
> m
>
E=E∩ F̃αj = Fαj ,
j=1 j=1
et (E, d) est un espace métrique compact.

Condition suffisante. Soit F = (Fα)α∈A un recouvrement de E par des
ouverts Fα de M ; on sait alors que, pour chaque α ∈ A, F̂α = Fα ∩ E est

un ouvert de (E, d). En conséquence, F̂ = (F̂α)α∈A est un recouvrement
de E par des ouverts de (E, d) et il contient donc, par hypothèse, un sous-
recouvrement fini (F̂αj )1≤j≤m de E. En conséquence,
m
> m
>
E⊂ F̂αj ⊂ Fαj ,
j=1 j=1
et (Fαj )1≤j≤m est donc un sous-recouvrement fini de E extrait de F .

Exemples. 1. ∅ est compact.
2. Toute partie finie d’un espace métrique (M, d) est compacte. En effet, si
E = {x1 , . . . , xm} est une partie finie de M et si F = (Fα )α∈A est un recou-
vrement ouvert de E, alors, pour chaque 1 ≤ j ≤ m, il existe un αj ∈ A tel
que xj ∈ Fαj , et (Fαj )1≤j≤m est donc un sous-recouvrement de E extrait de
F.
3. Si (ak )k∈N est une suite dans M qui converge vers b ∈ M , alors l’ensemble
!
E = {b} ∪ k∈N {ak } est compact. En effet, soit F = (Fα)α∈A un recouvre-
ment ouvert de E. Il existe donc un α−1 ∈ A tel que b ∈ Fα−1 et comme
Fα−1 est ouvert, il existe r > 0 tel que B[b; r] ⊂ Fα−1 . Comme b est limite
de la suite, il existera alors un entier m ≥ 0 tel que, pour tout entier k ≥ m,
on ait
ak ∈ B[b; r] ⊂ Fα−1 .
D’ailleurs, pour chaque 0 ≤ k ≤ m − 1, il existe un αk ∈ A tel que ak ∈ Fαk ;
en conséquence, (Fαk )−1≤k≤m−1 est un sous-recouvrement de E extrait de
F.
4. Dans (Rn , | · |j ) (j = 1, 2 ou ∞, les compacts sont les fermés bornés. C’est
une conséquence de l’équivalence entre la propriété d’être fermé et borné, la
propriété de Cousin et la propriété de Borel-Lebesgue.
Donnons maintenant quelques conditions nécessaires pour qu’un ensem-
ble soit compact. Les deux premières ont déjà été démontrées dans Rn à
partir de la propriété de Cousin. Nous utiliserons ici la propriété de Borel-
Lebesgue pour nous familiariser avec sa formulation.
Proposition. Tout compact d’un espace métrique est borné.
Démonstration. Soit E un compact dans l’espace métrique (M, d). La
famille (B(x; 1))x∈E estA un recouvrement
B
ouvert de E qui contient donc un
!
sous-recouvrement fini B(xj ; 1) 1≤j≤m . En conséquence, E ⊂ mj=1 B(x ; 1)
j
est contenu dans un borné et est donc borné.

Proposition. Tout compact d’un espace métrique est fermé.

Démonstration. Soit E un compact dans l’espace métrique (M, d). Il faut
démontrer que M \E est ouvert
8 dans M9. Soit a ∈ M \E; Comme d(x, a) > 0
pour chaque x ∈ E, F = B(x; d(x,a) 2 ) est un recouvrement ouvert de
x∈E 8 9
j
E, et F contient donc un sous-recouvrement fini B(xj ; d(x2,a)) de
1≤j≤m
E. En conséquence, , -
m
>
d(xj , a)
E⊂ B x; , j
j=1
2
et, par construction,

, -
d(xj , a)
a /∈ B x ; j
, (1 ≤ j ≤ m).
2
En conséquence,
m
, -
>
d(xj , a)
a∈M \ B x; j
⊂ M \ E,
j=1
2
! D E
d(xj ,a)
Comme m j=1 B x ;
j
2 est fermé, a appartient à un ouvert contenu dans
M \ E, c’est-à-dire M \ E ⊂ int (M \ E).
Proposition. Tout fermé contenu dans un compact d’un espace métrique

(M, d) est un compact de (M, d).
Démonstration. Soit E un compact de (M, d) et F ⊂ E un fermé de
M . Soit F = (Fα )α∈A un recouvrement ouvert de F . Comme F est fermé,
M \ F est ouvert et, si l’on pose Ã = {a} ∪ A, Fa = M \ F , où a /∈ A, alors
F̃ = (Fα)α∈Ã est évidemment un recouvrement ouvert de E. Il contient donc
un sous-recouvrement fini (Fαj )1≤j≤m de E, et la famille (Fαj )αj (=a;1≤j≤m
sera un sous-recouvrement fini de F extrait de F .
La propriété de compacité peut également s’exprimer en termes de suites.
La définition suivante est l’extension triviale de la notion correspondante
dans Rn .
Définition. Soit (M, d) un espace métrique et (ak )k∈N une suite dans M .
On dit que b ∈ M est un point d’accumulation de la suite (ak )k∈N si
(∀! > 0)(∀m ∈ N)(∃k ∈ N : k ≥ m) : d(ak , b) ≤ !.

Le théorème de Bolzano-Weierstrass affirme que toute suite bornée dans

Rp possède un point d’accumulation. Si l’on prend l’adhérence de l’image
d’une telle suite, celle-ci prend ses valeurs dans un fermé borné, donc un
compact, et il est facile de montrer que le point d’accumulation appartient
au compact. Sous cette forme, ce résultat est vrai dans un espace métrique
quelconque. C’est la propriété de Bolzano-Weierstrass.
Proposition. Soit (M, d) un espace métrique et E un compact non vide
de M . Toute suite (ak )k∈N dans E possède un point d’accumulation appar-
tenant à E.
Démonstration. Il faut donc démontrer que
(∃b ∈ E)(∀! > 0)(∀m ∈ N)(∃k ∈ N : k ≥ m) : d(ak , b) ≤ !.
Si ce n’est pas le cas, alors
(∀b ∈ E)(∃!b > 0)(∃mb ∈ N)(∀k ∈ N : k ≥ mb ) : d(ak , b) > !b .
Comme (B(b; !b))b∈E

8
est un 9recouvrement ouvert de E, il contient un sous-
recouvrement fini B(bj ; !bj ) de E. Dès lors, pour chaque 1 ≤ j ≤ m,
1≤j≤m
on a, pour tout entier k ≥ mbj , d(ak , bj ) > !bj , c’est-à-dire ak /∈ B[bj ; !bj ].
En conséquence, pour tout entier k ≥ q = max{mbj : 1 ≤ j ≤ m}, on aura
!
ak /∈ mj=1 B[bj ; !bj ], et donc ak /∈ E, ce qui est contradictoire.
Remarques. 1. On peut démontrer, mais nous ne le ferons pas ici, que

la propriété de Bolzano-Weierstrass caractérise également les compacts d’un
espace métrique.
2. On étend sans peine la notion de sous-suite au cas d’une suite dans
un espace métrique et l’on démontre, comme dans Rn , que b est un point
d’accumulation d’une suite (ak )k∈N dans un espace métrique si et seulement
si (ak )k∈N contient une sous-suite qui converge vers b.
On a la relation suivante entre espace métrique compact et espace métri-
que complet.
Corollaire. Tout espace métrique compact est complet.
Démonstration. Soit (M, d) un espace métrique compact et soit (ak )k∈N
une suite de Cauchy dans M . Comme M est compact, (ak )k∈N possède un
point d’acculumation b ∈ M et il suffit de montrer que b = limk→∞ ak . Soit
! > 0; comme (ak )k∈N est une suite de Cauchy, il existe un entier m tel que,
pour tout entier j ≥ m et tout entier q ≥ m, on ait d(aj , aq ) ≤ 2! . D’ailleurs,
comme b est un point d’accumulation de (ak )k∈N , il existe k ≥ m tel que

d(ak , b) ≤ 2! . Dès lors, en prenant q = k, on voit que
! !
(∀j ≥ m) : d(aj , b) ≤ d(aj , ak ) + d(ak , b) ≤ + = !.
2 2
Il est utile de donner des conditions explicites pour qu’un fermé borné
d’un espace métrique soit compact. Dans le cas de C(A; Rp) avec A un
fermé borné (c’est-à-dire un compact) de Rn , ces conditions reposent sur la
notion de partie équi-uniformément continue de l’ensemble C(M, M $ ) des
applications continues d’un espace métrique (M, d) dans un espace métrique
(M $ , d$ ).
Donnons d’abord l’extension immédiate aux fonctions entre espaces mé-
triques de la notion de continuité uniforme.
Définition. Soient (M, d) et (M $ , d$ ) des espaces métriques et f une fonc-
tion de M dans M $ définie au moins sur M . On dit que f est uniformément
continue sur M si
(∀! > 0)(∃δ > 0)(∀x ∈ M )(∀y ∈ dom f : d(y, x) ≤ δ) : d$ (f (y), f (x)) ≤ !.
Par exemple, toute application de M dans M $ lipschitzienne sur M est
uniformément continue sur M .
Définition. Soient (M, d) et (M $ , d$) des espaces métriques et E une partie
de C(M, M $ ). On dit que E est équi-uniformément continu ou également
continu si
(∀! > 0)(∃δ > 0)(∀f ∈ E)(∀x ∈ M )(∀y ∈ M : d(y, x) ≤ δ) :
d$ (f (y), f (x)) ≤ !.
Les éléments d’un tel ensemble E sont donc des applications de M dans
M $ uniformément continues sur M et telles que, pour chaque ! > 0 donné,
le δ correspondant puisse convenir pour tous les f ∈ E. Par exemple, si tous
les éléments de A sont des applications lipschitziennes de même constante
sur M , alors A est équi-uniformément continu.
Le théorème d’Ascoli-Arzela affirme que les compacts de C(A; Rp)
sont les parties fermées, bornées et équi-uniformément continues de cet es-
pace. Nous nous contenterons de démontrer ici que les parties fermées,
bornées et équi-uniformément continues de C(A; Rp) ont la propriété de
Bolzano-Weierstrass. Nous aurons besoin pour ce faire d’une intéressante
condition suffisante de convergence uniforme d’une suite contenue dans une
partie équi-uniformément continue de C(A; Rp).
Proposition. Soit E une partie bornée de Rn , D ⊂ E dense par rapport à

E et (fk )k∈N une suite de fonctions de Rn dans Rp définies sur E et telles
que l’ensemble {fk |E : k ∈ N} soit équi-uniformément continu. Si (fk )k∈N
converge ponctuellement sur D, alors (fk )k∈N converge uniformément sur E.
Démonstration. Soit ! > 0. Comme {fk |E : k ∈ N} est équi-uniformé-
ment continu,
(∃δ > 0)(∀k ∈ N)(∀x ∈ E)(∀y ∈ E : |x − y|2 ≤ δ) :
!
|fk (x) − fk (y)|2 ≤ .
3
Puisque E est borné, on peut trouver une famille finie (Bj )1≤j≤q de boules
!
ouvertes de rayon inférieur ou égal à δ2 telles que E ⊂ qj=1 Bj et E ∩ Bj /= ∅,
(1 ≤ j ≤ q). D étant dense par rapport à E, il existe, pour chaque 1 ≤ j ≤ q,
un yj ∈ D ∩ Bj . Par la convergence ponctuelle sur D de (fk )k∈N , il existe un
entier m ≥ 0 tel que, pour tous les entiers 1 ≤ j ≤ q, k ≥ m et l ≥ m, on a
!
|fk (yj ) − fl (yj )|2 ≤ .
3
Soit x ∈ E; il existe i = i(x) ∈ {1, 2, . . ., q} tel que x ∈ Bi . Par conséquent,

|x − yi |2 ≤ δ et |fk (x) − fk (yi )|2 ≤ 3! pour tout k ∈ N. Dès lors, pour tout
k ≥ m et l ≥ m, on aura
|fk (x) − fl (x)|2 ≤ |fk (x) − fk (yi ))|2 + |fk (yi ) − fl (yi )|2
! ! !
+|fl (yi ) − fl (x)|2 ≤ + + = !.
3 3 3
Démontrons maintenant la partie suffisante du théorème d’Ascoli-Arzela.

Théorème. Soit A un fermé borné de Rn et B une partie bornée, fermée
et équi-uniformément continue de l’espace de Banach C(A; Rp). Alors, toute
suite dans B contient une sous-suite qui converge dans C(A; Rp) vers un
élément de B.
Démonstration. Soit (fk )k∈N une suite dans B. Puisque Rn est séparable,
A contient un sous-ensemble dénombrable et dense D = {xj : j ∈ N}. En
vertu de la Proposition précédente, il suffit de trouver une sous-suite
A B
de
(fk )k∈N qui converge ponctuellement sur D. Comme la suite fk (x0 ) k∈N
est bornée dans Rp (B étant borné), il résulte du théorème

8 9de Bolzano-
Weierstrass qu’elle possède une sous-suite convergente fj 0 (x )
0 . De mê-
8 9 k k∈N
me, la suite fj 0 (x )
1 , bornée dans Rp , possède une sous-suite conver-
8 9k k∈N
gente fj 1 (x1 ) . En continuant de la sorte, pour chaque entier l ≥ 1, on
k k∈N 8 9
obtient à partir de la suite bornée fj l−1 (xl ) , une sous-suite convergente
8 9 k k∈N
8 9
fj l (xl ) . Mais alors la suite “diagonale” fj k est une sous-suite de
k k∈N k k∈N
(fk )k∈N qui converge ponctuellement
8 sur
9 D puisque, si x ∈ D est donné,
i
alors, par construction, la suite fj k (xi ) est une sous-suite de la suite

k k∈N,k≥i
convergente (fj i (xi ))k∈N, et est donc convergente.
k
Une belle application du théorème d’Ascoli-Arzela est fournie par la

démonstration de Leonida Tonelli du théorème d’existence de Peano
pour les équations différentielles.
Théorème. Soit I = [a, b] ⊂ R un intervalle fermé non vide et f : I × Rn →
Rn une application continue. Si, en outre, f est bornée sur I × Rn , alors,
pour chaque y0 ∈ Rp, le problème de Cauchy
y $ (x) = f (x, y(x)), (x ∈ I), y(a) = y0
possède au moins une solution.

Démonstration. Pour chaque entier n ≥ 1, définissons l’application yn :
[a, b] → Rp comme suit :
2 3
b−a
yn (x) = y0 si x ∈ a, a + ,
n
J x− b−a 3 3
n b−a
yn (x) = y0 + f (s, yn (s)) ds si x ∈ a + ,b .
a n
Le changement de variable s = t − b−a
n permet d’écrire la seconde formule
sous la forme
J x 4 5
b−a b−a
yn (x) = y0 + f t− , yn (t − ) dt,
a+ b−a
n
n n
et montre que yn est explicitement définie puisque, sur

2 3
j(b − a) (j + 1)(b − a)
a+ ,a+ ,
n n
D E
l’intégrale ne fait intervenir que les valeurs de yn sur a, a + j(b−a)
n . Soit
M > 0 tel que |f (x, y)|2 ≤ M pour tout x ∈ [a, b] et y ∈ Rp . On a
2 3
$ b−a $
|yn (x) − yn (x )|2 = 0 si x, x ∈ a, a + ,
n
#J # # #
# x− b−a # # b − a ##
$ # n #
|yn (x)−yn (x )|2 = # f (s, yn (s)) ds# ≤ M ##x − a − ≤ M |x−x$ |
# a # n # 2
si a ≤ x$ ≤a+ b−a
n ≤ x ≤ b, et
#J #
# x− b−a #
# $ n #
|yn (x) − yn (x )|2 = # f (s, yn (s)) ds# ≤ M |x − x$ |
# x" − b−a #
n 2
D E
si x, x$ ∈ a + b−a
n ,b . En particulier, pour x$ = a, on a
|yn (x) − y0 |2 ≤ M (b − a)
pour tout x ∈ [a, b], et dès lors la suite (yn )n∈N appartient à la partie bornée
et équi-uniformément continue
B = {y ∈ C([a, b], Rp) : |y(x) − y0 |2 ≤ M (b − a),
|y(x) − y(x$ )|2 ≤ M |x − x$ |, (x, x$ ∈ [a, b])}

de C([a, b], Rp). Elle contient donc une sous-suite (ynk )k∈N qui converge uni-
formément sur [a, b] vers une fonction y ∈ C([a, b], Rp). Comme
J x J x
ynk (x) = y0 + f (s, ynk (s)) ds − f (s, ynk (s)) ds, (k ∈ N),
a x− b−a
n k
on trouve, en faisant tendre k vers l’infini, que

J x
y(x) = y0 + f (s, y(s)) ds, (x ∈ [a, b]),
0
puisque J J
x x
lim f (s, ynk (s)) ds = f (s, y(s)) ds,
k→∞ a a
# #
#J x #
# ≤ M (b − a) ,
# #
#
# f (s, ynk
(s)) ds# (k ∈ N).
b−a
# x− nk # nk
Donc y est de classe C 1 sur [a, b] et solution du problème de Cauchy de

condition initiale y(a) = y0 .
Remarque. On comparera utilement les hypothèses et les conclusions des

théorèmes de Cauchy-Picard et de Peano. Les conditions du théorème de
Peano n’assurent pas l’unicité de la solution comme le montre l’exemple
y $ (x) = f (y(x)), y(0) = 0,
√
avec f (y) = 0 si y < 0, f (y) = y si y ∈ [0, 1] et f (y) = 1 si y > 1, qui
2
admet sur [0, 1] les deux solutions y(x) = 0 et y(x) = x4 , ainsi qu’on le
vérifie aisément.
Comme dans Rn , la continuité d’une fonction sur un ensemble compact
entraı̂ne sa continuité uniforme : c’est l’extension du théorème de Heine.
On peut la démontrer en adaptant la démonstration basée sur la propriété
de Cousin. Faisons-le en utilisant la propriété de Borel-Lebesgue.
Proposition. Soient (M, d) et (M $ , d$ ) des espaces métriques, E ⊂ M un
compact non vide et f une fonction de M dans M $ continue sur E. Alors f
est uniformément continue sur E.
Démonstration. Soit ! > 0; par la continuité de f sur E,
!
(∀x ∈ E)(∃δ(x) > 0)(∀y ∈ dom f : d(y, x) ≤ δ(x)) : d$ (f (y), f (x)) ≤ .
2
8 9
F = B(x; δ(x)
2 ) est un recouvrement ouvert de E et il contient donc
x∈E 8 9
j j)
un sous-recouvrement fini B(xj ; δ(x2 ) ) de E. Posons δ = min{ δ(x2 :
1≤j≤m 8 9
j
1 ≤ j ≤ m}. Si x ∈ E, il existe un 1 ≤ j ≤ m tel que x ∈ B xj ; δ(x2 )
, et
dès lors tel que d (f (x), f (x )) ≤ 2 . Si y ∈ dom f est tel que d(y, x) ≤ δ,
$ j !
alors,
δ(xj )
d(y, xj ) ≤ d(y, x) + d(x, xj ) ≤ δ + ≤ δ(xj ),
2
et dès lors
!
d$ (f (y), f (xj )) ≤ .
2
En conséquence,
! !
d$ (f (y), f (x)) ≤ d$ (f (y), f (xj )) + d$ (f (xj ), f (x)) ≤ + = !.
2 2
On peut également généraliser le théorème des bornes atteintes de

Weierstrass. La démonstration repose sur une généralisation aux espaces
métriques d’une caractérisation en termes d’ouverts des fonctions continues
de Rn dans Rp .
Lemme. Soient (M, d) et (M $ , d$ ) des espaces métriques, et f une applica-

tion de M dans M $ . Alors f est continue sur M si et seulement si, pour tout
ouvert V de M $ , f −1 (V ) est un ouvert de M.
Démonstration. Condition nécessaire. Soit V un ouvert de M $ ; si f −1 (V )

= ∅, le théorème est démontré. Sinon, si a ∈ f −1 (V ), l’ouvert V contient f (a)
et est donc un voisinage de f (a); par la caractérisation de la continuité en a
en termes de voisinages, il existera un voisinage Ua de a tel que f (Ua) ⊂ V,
et, puisque Ua contient toujours un voisinage ouvert de A (par exemple
B(a; r) pour r > 0 suffisamment petit), on peut supposer, sans perte de
généralité, que Ua est ouvert dans M . On a donc, pour chaque a ∈ f −1 (V ),
Ua ⊂ f −1 (V ), et dès lors
>
f −1 (V ) ⊂ Ua ⊂ f −1 (V ),
a∈f −1(V )
!
c’est-à-dire f −1 (V ) = U si U désigne l’ouvert a∈f −1(V ) Ua de M .
Condition suffisante. Soit a ∈ M , V un voisinage de f (a) et W ⊂ V un voisi-
nage ouvert de f (a). Par hypothèse, U = f −1 (W ) est un ouvert contenant
a, et donc un voisinage de a tel que
f (U ) = f [f −1 (W )] = W ⊂ V,
ce qui entraı̂ne la continuité de f en a.
Proposition. Soient (M, d) et (M $ , d$) des espaces métriques. Si f est une

application de M dans M $ continue sur M et si M est compact, alors f (M )
est un compact de M $ .
Démonstration. Soit F = (Fα )α∈A un recouvrement ouvert de f (M ).

Comme f est continue sur M , le lemme précédent entraı̂ne que, pour chaque
α ∈ A, il existe un ouvert Vα de M tel que f −1 (Fα ) = Vα. Dès lors (Vα)α∈A
est un recouvrement ouvert de l’espace métrique compact M et il contient
un sous-recouvrement fini (Vαj )1≤j≤m . On en déduit aussitôt que
8 9
(Fαj )1≤j≤m = f (Vαj )
1≤j≤m
recouvre f (M ).
Corollaire. Soit (M, d) un espace métrique compact et f une application

de M dans R continue sur M . Alors f possède un maximum et un minimum
sur M .
Démonstration. Par la proposition précédente, f (M ) est un compact de
(R, | · |) et donc un fermé borné; il est donc majoré et minoré et, puisque
f (M ) est fermé,
sup f (M ) ∈ adh f (M ) = f (M ), inf f (M ) ∈ adh f (M ) = f (M ).
Ce Corollaire fournit une condition suffisante pour qu’une fonction réelle

définie sur un espace métrique possède un maximant et un minimant sur cet
ensemble. Pour pouvoir localiser ce maximant ou ce minimant, il est utile de
trouver des conditions nécessaires d’existence d’un tel extrémant, et de telles
conditions peuvent se déduire, comme pour les fonctions réelles définies sur
une partie de Rn , de conditions nécessaires d’extrémants locaux. C’est ce
problème qui sera abordé dans la section suivante.
17.11 Calcul des variations

Si a < b et c, d sont des réels fixés, un cas particulier du problème des
géodésiques consiste à déterminer, parmi les applications y : [a, b] → R de
classe C 1 sur I = [a, b] et telles que y(a) = c, y(b) = d, celles pour lesquelles
la longueur de l’arc de courbe correspondant γ : I → R2 , x 2→ (x, y(x))
est minimale. Géométriquement, cela revient à rechercher, parmi les arcs
de courbe ayant une représentation paramétrique de type γ et joignant les
points (a, c) et (b, d) de R2 , celui ou ceux qui minimisent la distance. On a
vu précédemment que la longueur de l’arc de courbe de représentation γ est
donnée par
J b
λ(y) = (1 + y $2 )1/2.
a
Si nous désignons par C 1 (I; R) l’espace vectoriel des applications y de I

dans R qui sont de classe C 1 sur R, alors la formule qui précède définit une
application λ de C 1 (I; R) dans R dont il faut déterminer les minimants sur
le sous-ensemble
H = {y ∈ C 1 (I; R) : y(a) = c, y(b) = d}.

17.11. CALCUL DES VARIATIONS 729
Notons que H n’est pas un sous-espace vectoriel de C 1 (I; R) mais que si y

et z appartiennent à H, alors y − z ∈ C01 (I; R) où C01 (I; R) est le sous-espace
vectoriel
C01 (I; R) = {u ∈ C 1 (I; R) : u(a) = u(b) = 0}
de C 1 (I; R). Tout élément de H peut donc s’écrire sous la forme
H = y0 + C01 (I; R) = {y0 + u : u ∈ C01 (I; R)},
où y0 (x) = c + x−a

b−a (d − c). C’est donc un sous-espace affine de C (I; R). Si
1
l’on veut considérer, ce qui est utile, la notion d’extrémant local de λ sur
H, il faut pouvoir définir la notion de voisinage d’un point dans H. C’est
possible en munissant H d’une métrique et l’on choisira une métrique d de
la forme d(y, z) = 6y − z6, où 6 · 6 est une norme sur C01 (I; R).
D’une manière générale, si (E, 6 · 6) est un espace vectoriel normé sur R,
y0 ∈ E, (E0 , 6 · 6) un sous-espace vectoriel normé de E et ϕ une application
de E dans R, on est conduit à étudier les extrémants de ϕ sur H = y0 + E0
muni de la distance d(y, z) = 6y − z6.
Définition. Dans les conditions ci-dessus, on dit que y ∈ H est un maxi-
mant (resp. minimant) local de ϕ sur H s’il existe un voisinage V de y dans
H tel que, pour tout z ∈ V , on ait
ϕ(z) ≤ ϕ(y) (resp. ϕ(z) ≥ ϕ(y)).
On dira que y ∈ H est un extrémant local de ϕ sur H s’il est un maximant

local ou un minimant local de ϕ sur H.
Sous des hypothèses adéquates de dérivabilité, on peut donner, dans
cette situation, une condition nécessaire du type de Fermat d’existence d’un
extrémant local sur H. On l’appelle souvent la condition nécessaire d’Eu-
ler.
Proposition. Soit (E, 6 · 6) est un espace vectoriel normé sur R, y0 ∈ E,
(E0 , 6 · 6) un sous-espace vectoriel de E, ϕ une application de E dans R. Si
y ∈ H est un extrémant local de ϕ sur H et si, pour u ∈ E0 , l’application
de R dans R ϕy,u : s 2→ ϕ(y + su) est dérivable en s = 0, alors
ϕ$y,u (0) = 0.
Démonstration. Elle est tout à fait identique à celle du théorème de

Fermat pour une fonction de Rn dans R. Si, pour fixer les idées, y est un
minimant local de ϕ sur H, si V est le voisinage de y donné par la définition
et siDr > 0 est Etel que B[y; r] ⊂ V , alors, pour chaque u ∈ E0 \ {0} et chaque
s ∈ − 2u2r r
, 2u2 , on a 6su6 ≤ r et donc y + su ∈ V, et dès lors
ϕ(y + su) ≥ ϕ(y).

E E D D
En particulier, pour s ∈ 0, 2u2
r
(resp. s ∈ − 2u2
r
, 0 ), on aura
ϕ(y + su) − ϕ(y) ϕ(y + su) − ϕ(y)

≥ 0, (resp. ≤ 0).
s s
En faisant tendre s vers 0 dans ces inégalités, on trouve 0 ≤ ϕ$y,u (0) ≤ 0.
Un élément y ∈ H pour lequel ϕ$y,u (0) = 0 pour tout u ∈ E0 est appelé
un point critique ou un point stationnaire de ϕ sur H.
L’exemple des géodésiques qui nous a servi d’introduction suggère la
considération du cas particulier important suivant qui constitue le problème
fondamental du calcul des variations. Soit I = [a, b], p ≥ 1 un entier et
f : I × Rp × Rp → R, (x, y, z) 2→ f (x, y, z)
une application continue sur I × Rp × Rp et telle que les fonctions dérivées

partielles Dyj f et Dzj f existent et soient continues sur I × Rp × Rp . En
désignant par C 1 (I; Rp) l’espace vectoriel sur R des applications y : I → Rp
de classe C 1 sur I, on
Hb
peut associer à f l’application ϕ de C 1 (I, Rp) dans R
définie par ϕ(y) = a f [x, y(x), y $(x)] dx. Cette application est bien définie
puisque l’intégrand est une fonction continue sur I. Le cas particulier des
géodésiques du plan correspond à p = 1 et f (x, y, z) = (1 + z 2 )1/2. Si c ∈ Rp
et d ∈ Rp sont fixés, désignons par H le sous-ensemble de C 1 (I; Rp) défini
par
H = {y ∈ C 1 (I; Rp) : y(a) = c, y(b) = d}.
On a évidemment
H = y0 + C01 (I; Rp) = {y0 + u : u ∈ C01 (I; Rp)},
où y0 ∈ C 1 (I; Rp) est définie par

x−a
y0 (x) = c + (d − c).
b−a
Pour considérer la notion d’extrémant local de ϕ sur H, il nous reste à définir
une distance sur H, c’est-à-dire, en vertu des considérations qui précèdent,
une norme sur C 1 (I; Rp), ce qui peut se faire de différentes manières. Ainsi,
puisque C 1 (I; Rp) ⊂ C(I; Rp), on peut munir C 1 (I; Rp) de la norme de
la convergence uniforme 6y6∞ = supx∈I |y(x)|2. Cette norme “ignore” é-
videmment la propriété de dérivabilité des éléments de C 1 (I; Rp). Pour
tenir compte de cette dérivabilité, on peut définir l’application 6 · 6∞,1 :
C 1 (I; Rp) → R+ par
6y6∞,1 = 6y6∞ + 6y $ 6∞ = sup |y(x)|2 + sup |y $ (x)|2 .

x∈I x∈I
On a évidemment, pour tout y ∈ C 1 (I; Rp), 6y6∞ ≤ 6y6∞,1 . On est ainsi

conduit à considérer deux types d’extrémants locaux pour ϕ sur H. On
désignera par d∞ (resp. d∞,1 ) la distance définie sur H par la norme 6 · 6∞
(resp. 6 · 6∞,1 ).
Définition. Soit f : I × Rp × Rp → R vérifiant les conditions de régularité
ci-dessus et
J b
ϕ : C 1 (I; Rp) → R, y 2→ f [x, y(x), y $(x)] dx,
a
l’application correspondante. On dit que y ∈ H est un minimant local fort

(resp. faible) de ϕ sur H si y est un minimant local de ϕ sur (H, d∞) (resp.
sur (H, d∞,1)). On définit de même la notion de maximant local fort et de
maximant local faible de ϕ sur H, et dès lors celle d’extrémant local fort et
d’extrémant local faible de ϕ sur H.
Il est clair que tout extrémant local fort de ϕ dans H est un extrémant
local faible de ϕ dans H. Pour l’obtention de conditions nécessaires, il suf-
fit donc de considérer la notion d’extrémant local faible. La situation est
évidemment différente dans l’étude des conditions suffisantes que nous n’a-
borderons pas ici.
Pour expliciter, dans la cas particulier de la fonction ϕ associée à f , la
condition nécessaire d’Euler d’existence d’un extremum sur H, on a besoin
de quelques résultats préliminaires.
Proposition. Pour chaque y ∈ C 1 (I; Rp) et chaque u ∈ C01 (I; Rp) fixés, la
fonction ϕy,u : R → R, s 2→ ϕ(y + su) est dérivable en s = 0 et
J b
ϕ$y,u (0) = {(∇y f [x, y(x), y $(x)]|u(x)) + (∇z f [x, y(x), y $(x)]|u$(x))} dx,
a
où
∇y f = (Dy1 f, . . . , Dyp f ), ∇z f = (Dz1 f, . . . , Dzp f ),
et (·|·) désigne le produit scalaire usuel dans Rp .

Démonstration. Il est facile de vérifier que les conditions de la règle de
Leibniz de dérivation sous le signe intégral sont vérifiées, ainsi que celles de
la dérivation d’une fonction composée, ce qui donne
d
ϕ$y,u (0) = [ϕ(y + su)]s=0
ds
J b d
= [f (x, y(x) + su(x), y $(x) + su$ (x)]s=0 ds
a ds
J p
b$
= {[Dyj f [x, y(x), y $(x)]uj (x) + Dzj f [x, y(x), y $(x)]u$j (x)} dx
a j=1
J b
= {(∇y f [x, y(x), y $(x)]|u(x)) + (∇z f [x, y(x), y $(x)]|u$(x))} dx.
a
Proposition. Si y ∈ H est un extrémant local faible de ϕ dans H, alors,

pour tout u ∈ C01 (I; Rp), on a
J b4 J x 5
∇z f [x, y(x), y $(x)] − ∇y f [t, y(t), y $(t)] dt | u$(x) dx = 0.
a a
Démonstration. Si y est un extrémant local faible de ϕ sur H, la propo-

sition précédente et la condition nécessaire d’Euler entraı̂nent que, pour tout
u ∈ C01 (I; Rp), on a
0 = ϕ$y,u (0)
J b
= {(∇y f [x, y(x), y $(x)]|u(x)) + (∇z f [x, y(x), y $(x)]|u$(x))} dx.
a
En utilisant la formule d’intégration par parties et le fait que u(a) = u(b) = 0,
on obtient
J b p J
$ b
(∇y f [x, y(x), y $(x)]|u(x)) dx = Dyj f [x, y(x), y $(x)]uj (x) dx
a j=1 a
p J
$ b UJ x V
d
= uj (x) Dyj f [t, y(t), y (t)] dt dx
$
j=1 a
dx a
p J
$ bU J x V
=− u$j (x) Dyj f [t, y(t), y $(t)] dt dx
j=1 a a
J b 4J x 5
=− ∇y f [t, y(t), y $(t)] dt | u$(x) dx,
a a
et la thèse en résulte en introduisant ce résultat dans l’égalité précédente.
Pour éliminer u dans la proposition précédente, on utilise le lemme de
Du Bois-Reymond.
Lemme. Si w ∈ C(I; Rp), alors w est constante sur I si et seulement si,
pour tout u ∈ C01 (I; Rp), on a
J b
(w(x)|u$(x)) dx = 0.
a
Démonstration. Condition nécessaire. Si w est constante sur I, et qu’on

désigne sa valeur par w, alors, pour tout x ∈ I, on a
(w(x)|u$(x)) = (w|u$ (x)) = (w|u)$ (x),
et dès lors, en utilisant le théorème fondamental du calcul différentiel et

intégral, on obtient
J b J b
(w(x)|u$(x)) dx = (w|u)$(x) dx
a a
= (w|u(b)) − (w|u(a)) = 0.
Condition suffisante. Définissons la valeur moyenne sur I de w par
J
1 b
w= w.
b−a a
Alors, pour tout u ∈ C01 (I; Rp), on a, en utilisant l’hypothèse et le théorème

fondamental du calcul différentiel et intégral,
J b J b J b
(w − w|u$ ) = (w|u$ ) − (w|u$ )
a a a
J b
=− (w|u)$ = −(w|u(b)) + (w|u(a)) = 0. (17.1)
a
Définissons v ∈ C 1 (I; Rp) par la formule

J x
v(x) = [w(s) − w] ds, (x ∈ I).
a
Alors,
J b
v(a) = 0, v(b) = w − (b − a)w = (b − a)w − (b − a)w = 0,
a
ce qui montre que v ∈ C01 (I; Rp). On peut donc prendre u = v dans (17.1),
ce qui entraı̂ne
J b J b
0= (w − w|v $ ) = |w − w|22 .
a a
Par conséquent, w − w est nulle presque partout sur I, et dès lors E =

{x ∈ I : w(x) − w /= 0} est d’intérieur vide. Si x ∈ E, il existe donc une
suite (xk )k∈N dans I \ E qui converge vers x, et dès lors, puisque w − w est
continue,
w(x) − w = lim [w(xk ) − w] = 0,
k→∞
ce qui montre que w(x) = w pour tout x ∈ I, et donc que w est constante
sur I.
Nous pouvons maintenant énoncer et démontrer l’importante condition
nécessaire d’Euler-Lagrange d’existence d’un extrémant local faible de
ϕ sur H.
Théorème. Si y est un extrémant local faible de ϕ dans H, alors l’applica-
tion x 2→ ∇z f [x, y(x), y $(x)] est de classe C 1 sur I, et, pour tout x ∈ I, on
a
d
{∇z f [x, y(x), y $(x)]} − ∇y f [x, y(x), y $(x)] = 0, (17.2)
dx
c’est-à-dire,
d
{Dzj f [x, y(x), y $(x)]} − Dyj f [x, y(x), y $(x)] = 0, (1 ≤ j ≤ p). (17.3)
dx
Démonstration. Soit y un extrémant local faible de ϕ dans H. En vertu
du lemme de Du Bois-Reymond et de la proposition qui précède, l’application
J x
x 2→ ∇z f [x, y(x), y $(x)] − ∇y f [s, y(s), y $(s)] ds,
a
est constante sur HI et donc dérivable et de dérivée nulle sur I; comme

l’application x 2→ ax ∇y f [s, y(s), y $(s)] ds est de classe C 1 comme intégrale
indéfinie d’une fonction continue, il en est de même de l’application x 2→

∇z f [x, y(x), y $(x)], et, pour tout x ∈ I,
U J x V
d
0= ∇z f [x, y(x), y $(x)] − $
∇y f [s, y(s), y (s)] ds
dx a
d
= {∇z f [x, y(x), y $(x)]} − ∇y f [x, y(x), y $(x)].
dx
Les relations (17.3) forment un système de p équations dans lesquelles

l’inconnue y ∈ C 1 (I; Rp) apparaı̂t avec ses dérivées. C’est donc un système
d’équations différentielles qui sont appelées les équations d’Euler-Lagrange
du problème d’extrémum considéré. Etant donné que, dans (17.3), la vari-
able zj de f est remplacée par yj$ (x), on utilise souvent, pour (17.3), la
notation un peu ambiguë
d
{D " f [x, y(x), y $(x)]} − Dyj f [x, y(x), y $(x)] = 0, (1 ≤ j ≤ p).
dx yj
Remarques. 1. Le théorème ci-dessus fournit une information sur la
dérivabilité sur I de l’application ∇z f [., y(.), y $(.)] mais n’assure nullement
que y $ soit dérivable sur I. Lorsque l’extrémant local y de ϕ sur H est de
classe C 2 sur I, le théorème de dérivation d’une fonction composée appliqué
au premier terme des équations d’Euler-Lagrange fournit pour ces équations
la forme plus explicite
p
$ p
$
Dz2j ,zk f [x, y(x), y $(x)]yk$$(x) + Dz2j ,yk f [x, y(x), y $(x)]yk$ (x)
k=1 k=1
+Dz2j ,x f [x, y(x), y $(x)] − Dyj f [x, y(x), y $(x)] = 0, (1 ≤ j ≤ p).

2. Dans le cas particulier où f = f (y, z) ne dépend pas explicitement de x,
les équations d’Euler-Lagrange sont de la forme
d
{∇z f [y(x), y $(x)]} − ∇y f [y(x), y $(x)] = 0,
dx
et dès lors, pour tout x ∈ I,
4 5
d
y $ (x) | {∇z f [y(x), y $(x)]} − (y $ (x)|∇y f [y(x), y $(x)]) = 0.
dx
Si l’on suppose en outre que y est de classe C 2 sur I, cette relation peut
s’écrire
d
{(y $ (x)|∇z f [y(x), y $(x)])}
dx
−(y $$ (x)|∇z f [y(x), y $(x)]) − (y $ (x)|∇y f [y(x), y $(x)]) = 0,
c’est-à-dire, en utilisant le théorème de dérivation d’une fonction composée,
d
{(y $ (x)|∇z f [y(x), y $(x)]) − f [y(x), y $(x)]} = 0.
dx
En conséquence, la fonction x 2→ (y $ (x)|∇z f [y(x), y $(x)]) − f [y(x), y $(x)]
est constante sur I. On dit que c’est une intégrale première des équations
d’Euler-Lagrange et on l’appelle l’intégrale première de Painlevé.
3. Dans le cas particulier où f = f (x, z) ne dépend pas explicitement de y,
on a ∇y f = 0 et les équations d’Euler-Lagrange deviennent
d
{∇z f [x, y $(x)]} = 0.
dx
En conséquence, elles sont équivalentes aux p intégrales premières
Dzj f [x, y $ (x)] = cj , (x ∈ I), (1 ≤ j ≤ p),
où les cj sont des constantes réelles.

Exemples. 1. Le problème des géodésiques qui a motivé cette section
correspond à une situation où la Remarque 3 s’applique. Soit donc y un
extrémant faible local de
J b
λ : C (I; R) → R, y 2→
1
[1 + y $ (x)2 ]1/2 dx,
a
sur H = {y ∈ C 1 (I; R) : y(a) = c, y(b) = d}. Comme Dz (1 + z 2 )1/2 =

z
(1+z2 )1/2
, l’équation d’Euler-Lagrange correpondant à y est équivalente à
l’intégrale première
y $ (x)
= A, x ∈ I,
[1 + (y $ (x))2 ]1/2
où A ∈ R est nécessairement telle que |A| < 1. En résolvant cette équation
A2
par rapport à y $ (x), on obtient (y $ (x))2 = 1−A 2 , ce qui, pour une fonction
de classe C 1 , équivaut à y $ (x) = D, et dès lors à y(x) = Dx + C, x ∈ I,

où D et C appartiennent à R. Comme, en outre, y ∈ H, on a Da + C = c,
Db + C = d, et la résolution de ce système linéaire en (C, D) fournit pour y

l’expression
x−a
y(x) = c + (d − c).
b−a
On reconnaı̂t l’équation de la droite dans R2 joignant (a, c) à (b, d). Nous
avons ainsi démontré que si la fonction y ∈ C 1 (I; R) joignant (a, c) et (b, d)
est un extrémant local faible, parmi les autres fonctions joignant ces points,
de la fonction λ donnant la longueur de la courbe correspondante, alors y
correspond au segment de droite joignant ces points. Il resterait évidemment
encore à montrer, ce qui est possible, que cette droite fournit effectivement
un minimum de λ.
2. On a vu en mécanique analytique que si l’on considère un système
mécanique à p degrés de liberté dont les coordonnées généralisées sont q1 , . . .,
qp , d’énergie cinétique de la forme T (t, q, q̇) (avec q̇(t) la dérivée de q par rap-
port à t) et soumis à des forces extérieurs dérivant d’un potentiel V = V (t, q),
les équations différentielles du mouvement de ce système sont données par
les équations de Lagrange
d
{∇q̇ T [t, q(t), q̇(t)]} − ∇q T [t, q(t), q̇(t)] = −∇q V [t, q(t)].
dt
En définissant le lagrangien L du système par
L(t, q, z) = T (t, q, z) − V (t, q),
on voit que les équations de Lagrange peuvent encore s’écrire
d
{∇q̇ L[t, q(t), q̇(t)]} − ∇q L[t, q(t), q̇(t)] = 0,
dt
et, sur un intervalle [a, b], leur solution q correspond donc à un extrémant
local, parmi les fonctions de classe C 1 prenant les mêmes valeurs que y en a
et b, de la fonction
J b
ϕ : q 2→ L[t, q(t), q̇(t)] dt.
a
C’est ce qu’on appelle le principe de Hamilton en mécanique analytique. On
a un résultat semblable si les forces extérieures sont de la forme −∇q U +
dt [∇q̇ U ] pour une certaine fonction U = U (t, q, q̇) que l’on appelle le potentiel
d
généralisé des forces extérieures.

3. Supposons maintenant que p = 2q soit pair et que f soit de la forme
q
$
f (t, z, v) = zi vq+i − H(t, z),
j=1
pour une certaine fonction H : I × R2q → R continue et telle que ∇z H existe

et soit continu. Les équations d’Euler-Lagrange
d
{∇v f [t, z(t), ż(t)]} − ∇z f [t, z(t), ż(t)] = 0,
dt
s’écrivent dans ce cas, en séparant les q premières des q dernières com-
posantes,
−żq+j + Dzj H[t, z(t)] = 0, żj + Dzq+j H[t, z(t)] = 0, (1 ≤ j ≤ q).
En introduisant la matrice symplectique dans R2q définie par

& '
0 −Iq
Iq 0
où Iq est la matrice identité sur Rq , on peut écrire ce système sous la forme
J ż(t) + ∇z H[t, z(t)].
On reconnaı̂t la structure des équations de Hamilton en mécanique analy-

tique. La solution de ces équations sur un intervalle I = [a, b] est donc un
extrémant local de l’expression
 
J b $
q 
ϕ(z) = zi (t)żq+i (t) − H[t, z(t)] dt,
a  
j=1
parmi les fonctions de C 1 (I, R2q) qui prennent les mêmes valeurs que z en a
et b. C’est une autre forme du principe de Hamilton.
17.12 Exercices
1. Soit A ⊂ Rn un fermé borné et soit C 1 (A; Rp) l’ensemble des applications
y : A → Rp de classe C 1 sur A. Montrer que, muni de la norme
6y6∞,1 = max |y(x)| + max |y $ (x)|,

x∈A x∈A
C 1 (A; Rp) est un espace de Banach.

2. Soit M un espace métrique, H un espace de Hilbert et
F : M × H → H, (x, y) 2→ F (x, y),

une application. On dit que F est fortement monotone en y uniformément

en x ∈ M s’il existe a > 0 tel que, pour tout x ∈ M, tout y ∈ H et tout
z ∈ H, on ait
(F (x, y) − F (x, z)|y − z) ≥ a6y − z62 .
On dit que F est lipschitzienne en y uniformément en x ∈ M s’il existe b > 0
telle que, pour tout x ∈ M, tout y ∈ H et tout z ∈ H, on ait
6F (x, y) − F (x, z)6 ≤ b6y − z6.
Démontrer le théorème des fonctions implicites global de Zarantonello : il

existe une application f : M → H telle que, pour chaque x ∈ M, on ait
F (x, y) = 0 ⇔ y = f (x).
Suggestion : Si c > 0, on a
F (x, y) = 0 ⇔ y = y − cF (x, y) ≡ Gc (x, y);
d’ailleurs,
6Gc (x, y) − Gc (x, z)62
= 6y − z62 − 2c(y − z|F (x, y) − F (x, z)) + c2 6F (x, y) − F (x, z)62
≤ (1 − 2ac + c2 b2 )6y − z62 .
Gc (x, .) sera donc une application contractante sur H si et seulement si l’on
choisit 0 < c < 2a
b2
, ce qui est toujours possible. Le minimum de la constante
de Lipschitz est donné par c = ba2 et fournit la constante de Lipschitz (1 −
a2 1/2
b2
) . Le point fixe unique f (x) de Gc (x, .) fournit la solution du problème.
3. Soit (M, d) un espace métrique et A une partie non vide de M . On définit
l’application d(·, A) : M → R+ par d(x, A) = inf y∈A d(x, y). Montrer que
d(·, A) est continue sur M (utiliser la caractérisation de l’infimum). Montrer
que si A et B sont deux parties fermées et disjointes de M , alors l’application
d(x,A)
f de M dans [0, 1] définie par f (x) = d(x,A)+d(x,B) est continue, telle que
f (x) = 0 pour tout x ∈ A, f (x) = 1 pour tout x ∈ B, et 0 < f (x) < 1 en
dehors de A et B. (Théorème d’Urysohn).
4. Soit M un espace métrique compact et T : M → M une applica-
tion telle que d(T x, T y) < d(x, y) pour tout x /= y dans M. Alors T
possède un point fixe unique dans M . L’unicité se montre facilement. Pour
l’existence, le théorème de Weierstrass appliqué à la fonction réelle con-
tinue x 2→ d(x, T (x)), entraı̂ne l’existence d’un y ∈ M tel que d(y, T (y)) =
minx∈M d(x, T (x)). Si α = d(y, T (y)) = 0, alors y est un point fixe de T ; si

α > 0, alors
0 < α ≤ d(T (y), T 2(y)) < d(y, T (y)) = α,
5. Montrer qu’il n’existe pas de
z ∈ H = {y ∈ C 1 ([−1, 1]; R) : y(−1) = −1, y(1) = 1}

1 H
tel que, ϕ(z) = inf y∈H ϕ(y), si ϕ est définie par ϕ(y) = −1 x2 [y $ (x)]2 dx.
Suggestion : pour tout y ∈ H, on a ϕ(y) > 0 et, pour chaque a > 0, la
arctg x
fonction ya définie sur [−1, 1] par ya (x) = arctg a1 appartient à H et est telle
a
que ϕ(ya ) → 0 as a → 0. (Contre-exemple de Weierstrass à l’existence d’une
solution à un problème de calcul des variations).
6. Ecrire et résoudre les équations d’Euler-Lagrange pour les fonctions ϕ
définies par
J b
ϕ(y) = x[1 + (y $ (x))2 ]1/2 dx,
a
(surface de révolution autour de l’axe des x d’aire minimum),
J b
ϕ(y) = y(x)[1 + (y $ (x))2]1/2 dx,
a
(surface de révolution autour de l’axe des y d’aire minimum),

J L
b 1 + (y $ (x))2
ϕ(y) = L dx,
a 2gy(x)
(problème du brachystochrone, c’est-à-dire du temps de parcours minimum

le long d’une courbe sous l’action de la gravitation),
J L
b 1 + (y $ (x))2
ϕ(y) = dx,
a y
(minimum du temps de propagation de la lumière dans un milieu où la vitesse
de propagation est proportionnelle à l’altitude).

Mais on voit que ces remarques conduisent tout naturellement à étudier les
propriétés d’un ensemble linéaire P satisfaisant à la condition suivante: Il
existe une infinité dénombrable d’ensemble P1 , P2 , . . ., Pn , . . . , dont chacun

est non dense, et tels que tout point de P fait partie de l’un au moins des
ensembles P1 , P2 , . . ., Pn , . . . . Je dirai qu’un ensemble de cette nature est
de première catégorie. Tout ensemble qui ne possède pas cette propriété
sera dit de deuxième catégorie. Je commence par démontrer la proposi-
tion suivante: Si P est un ensemble de première catégorie, il existe, dans
toute portion αβ du segment sur lequel il est défini, au moins un point (et
par suite une infinité) n’appartenant pas à P. . . . Il résulte immédiatement
de là que le continu constitue un ensemble de deuxième catégorie; nous
venons en effet de démontrer qu’on ne peut pas obtenir tous les points
d’un intervalle continu au moyen d’une infinité dénombrable d’ensembles
non denses. L’ensemble formé par la réunion d’un nombre fini ou d’une in-
finité dénombrable d’ensembles de première catégorie est encore un ensemble
de première catégorie; cela résulte de la définition même. Le continu, dont
on a retranché un ensemble de première catégorie est de second catégorie.
. . . On voit la différence profonde qui existe entre les ensembles des deux
catégories; cette différence ne réside, ni dans la dénombrabilité, ni dans la
condensation dans un intervalle continu, puisqu’un ensemble de première
catégorie peut avoir la puissance du continu, et peut aussi être dense dans
toute l’étendue du segment qu’on considère; mais elle est en quelque sorte
une combinaison des deux notions précédentes.
René Baire, 1899
J’ai eu l’occasion, dans l’introduction à mes leçons sur les fonctions de

lignes, de parler avec beaucoup de détail de l’évolution d’idées laquelle m’a
conduit aux fonctions d’un nombre infini et continu de variables que j’ai ap-
pelées quantités qui dépendent de toutes les valeurs d’une ou de plusieurs
fonctions, et que j’ai aussi désignées - pour employer une locution plus ex-
pressive - par le nom de fonctions de lignes. . . . J’étais saisi de la nécessité
de considérer les fonctions de lignes, car une grande partie des phénomènes
naturels conduit à des quantités qui dépendent d’un nombre infini de vari-
ables. Beaucoup de problèmes d’analyse mènent aussi aux mêmes quantités.
Leur conception et leur définition se présentaient donc naturellement. J’ai
pensé qu’il aurait été utile de les envisager comme des éléments qu’on pour-
rait étudier par eux-mêmes. Ils devaient aussi constituer une catégorie à part
d’entités dont on pourrait obtenir des propriétés communes et qu’on pourrait
considérer dans leur ensemble. . . . Ce qui s’imposait à mon esprit du pre-
mier abord était donc de créer une analyse propre à embrasser les propriétés
des fonctions de lignes et leurs représentations et de constituer un calcul qui
donnât le moyen de poser d’une manière exacte les problèmes qui les concer-
nent et d’en obtenir des solutions rigoureuses. Il y avait un exemple dans le
calcul des variations, car ce célèbre calcul étudie les problèmes des maxima
et des minima de certaines intégrales définies, et les intégrales définies peu-
vent justement être envisagées comme des quantités qui dépendent de toutes
les valeurs des fonctions qui paraissent sous le signe d’intégration.
Vito Volterra, 1914
L’opération c’est une relation univoque yRx c’est-à-dire telle que yRx
et zRx entraı̂ne y = z pour tout x, y, z. Chaque relation yRx comporte un
contre-domaine (c’est la réserve des y) et un domaine (la réserve des x) ou
champ. L’opération fonctionnelle ou la fonction de ligne c’est une opération
dont le domaine et le contre-domaine sont des ensembles de fonctions. La
notion de fonction de ligne fut introduite par M. Volterra. L’ouvrage présent
a pour but d’établir quelques théorèmes valables pour différents champs fonc-
tionnels, que je spécifie dans la suite. Toutefois, afin de ne pas être obligé
à les démontrer isolément pour chaque champ particulier, ce qui serait bien
pénible, j’ai choisi une voie différente que voici : je considère d’une façon
générale les ensembles d’éléments dont je postule certaines propriétés, j’en
déduis des théorèmes et je démontre ensuite de chaque champ fonctionnel
particulier que les postulats adoptés sont vrais pour lui.
Stefan Banach, 1922
Admettons ensuite qu’il existe une opération appelée norme (nous la

désignerons par le symbole 6X6), définie dans le champ E, ayant pour
contre-domaine l’ensemble des nombres réels et satisfaisant aux conditions
suivantes :
1. 6X6 ≥ 0,
2. 6X6 = 0 équivaut à X = 0,
3. 6a.X6 = |a|.6X6,
4. 6X + Y 6 ≤ 6X6 + 6Y 6,
5. Si {Xn } est une suite d’éléments de E et limr→∞,p→∞ 6Xr − Xp 6 = 0, il
existe un élément X tel que limn→∞ 6X − Xn 6 = 0.
Stefan Banach, 1922

Chapitre 18
Index historique
Abel (lemme et transformation d’) (430). Abel (1826).
Abel (série d’) (420).
Abel (test d’intégrabilité d’) (409).
Abel (test de convergence d’une série d’) (431). Abel (1826).
Abel (théorème d’) (456). Enoncé et démontré par Abel (1826).
Abel, Niels (1802-1829) (409, 420, 430, 431, 456, 480). Mathématicien
norvégien célèbre pour sa démonstration de l’impossibilité de la résolution
par radicaux de l’équation algébrique du cinquième degré (1824), publiée à
compte d’auteur et que Gauss ignora, et pour sa découverte des fonctions
elliptiques. Il fut emporté par la tuberculose deux jours avant l’annonce de
sa nomination à l’Université de Berlin.
abélienne (intégrale) (336). Etudiées par Abel (1826), qui démontra un théo-
rème généralisant largement le théorème d’addition des intégrales elliptiques.
Riemann apportera à leur théorie des contributions essentielles en 1857. Ces
intégrales sont un outil important en géométrie algébrique, discipline née de
l’étude des racines communes à une famille de polynômes sur un corps. Elle
s’occupe de la classification des variétés algébriques et de l’étude de leurs
invariants. Les fonctions réciproques des intégrales abéliennes sont appelées
les fonctions abéliennes.
absolue uniforme (convergence) (444).
absolument convergente (série) (254, 439). Notion introduite par Cauchy

(1821), qui démontre, de manière inexacte, qu’elle entraı̂ne la convergence. Il
donne une preuve correcte en 1833.
743
744 CHAPITRE 18. INDEX HISTORIQUE
accroissement relatif (81). Dès 1629, Fermat connaissait la méthode suivant

laquelle le coefficient angulaire de la tangente à la courbe d’équation y = f(x)
s’obtient en prenant h = 0 dans la fraction f(a+h)−f(a)h après simplification
par h. La méthode de Fermat fut appliquée par Torricelli (1644), Sluse
(1652) et Wallis (1652).
accroissements finis (formule des) (151). Voir “Lagrange (théorème de)” et

“moyenne (théorème de la)”.
accumulation (point d’) (166, 167, 720). La notion est due à Cantor (1870).
La terminologie est due à Fréchet (1906) et F. Riesz (1908).
additivité complète de la L-intégrale (492). Due à Lebesgue (1902).
additivité complète de la mesure (490). Démontrée pour la première fois par

Borel (1898).
additivité de l’intégrale (364, 367, 387, 492).
adhérence, adhérent (28, 65, 129, 685). Notion due à Hausdorff (1914).
adjointe de Hodge d’une forme (592). Introduite par Hodge (1932).
aire (d’un élément de surface) (576). Formule connue d’Euler (1770) pour
une représentation paramétrique dérivable. Schwarz (1862) montra par un
exemple qu’une telle aire ne peut être définie en général comme limite de
l’aire de polyèdres inscrits. La définition de l’aire d’une surface dans des
conditions générales est un problème délicat qui fait partie de ce que l’on ap-
pelle aujourd’hui la théorie géométrique de la mesure. Celle-ci est étroitement
liée au célèbre problème de Plateau qui consiste à trouver la surface d’aire
minimum s’appuyant sur une courbe gauche fermée donnée, que l’on peut
représenter physiquement par un film d’eau savonneuse. L’existence d’une
solution à ce problème fut démontrée par Rado et Douglas (1931).
aire (d’un parallélogramme) (575), (d’un rectangle) (347).
aire (d’une figure plane) (487, 511). Le calcul de l’aire de figures planes fut
étudié dès l’Antiquité : Démocrite (rectangle et triangle), Archimède
(cercle, segment parabolique, secteur de spirale). Il faut attendre les XVIe
et XVIIe siècles pour le calcul de l’aire d’autres domaines par des méthodes
délicates et fastidieuses de passage à la limite, qui seront spectaculairement
simplifiées et unifiées par l’invention du calcul intégral.
algèbre (théorème fondamental de l’) (140). Enoncé par Girard (1629), ce

théorème a reçu des démonstrations incomplètes de d’Alembert (1746), Eu-
ler (1749) et Lagrange (1749). Gauss en donnera quatre démonstrations
distinctes (1799, 1815, 1816, 1847). L’idée de la démonstration donnée ici est
745
due à Argand (1806), qui suppose que l’infimum du module du polynôme

est atteint, ce que Servois critique (1815) et Weierstrass démontre. On
trouve une démonstration semblable chez Cauchy (1821).
algébrique (nombre) (33). La distinction entre nombres algébriques et nombres

transcendants était déjà reconnue par Euler dès 1744. La théorie moderne
des nombres algébriques est l’oeuvre de Dedekind.
alternée (série) (432). La série harmonique alternée fut considérée pour la pre-
mière fois par Mengoli (1648), Gregory (1671) et Leibniz (1682). Le test
de convergence des séries alternées est dû à Leibniz (1705).
Ampère, André-Marie, (1775-1836) (618). Célèbre pour ses contributions à

l’électromagnétisme, ce savant français autodidacte a aussi contribué à
l’histoire naturelle, la chimie, la philosophie des sciences et aux mathéma-
tiques (calcul des probabilités et équations aux dérivées partielles (équation
de Monge-Ampère)).
analyse vectorielle (601). Dans sa théorie des quaternions (1844), Hamilton

introduisit un opérateur différentiel, qu’il nota ∇ et appela nabla, et qui, ap-
pliqué à un champ scalaire fournit (en termes actuels) le gradient, et appliqué
à un champ vectoriel fournit un quaternion dont la partie scalaire est égale à
moins la divergence et la partie vectorielle au rotationnel. C’est Maxwell
(1873) qui sépara la partie scalaire et la partie vectorielle d’un quaternion,
et dans le cas du nabla d’un champ vectoriel, il les appela respectivement la
convergence et le rotationnel; Maxwell remarqua aussi que la répétition de
∇ appliqué à un champ scalaire fournit le laplacien changé de signe. C’est
aussi Maxwell (1871) qui remarqua que le rotationnel d’un gradient et la
divergence d’un rotationnel sont toujours nuls. Les ouvrages de Gibbs (1901)
et de l’excentrique Heaviside (1893-1912) édifièrent l’analyse vectorielle en
tant que discipline autonome.
analytique (fonction) (260, 658). Terme dû à Lagrange (1772) qui essaya en
vain de fonder la théorie générale des fonctions sur le développement en série
de Taylor. La définition donnée ici est due à Weierstrass (1859). S. Bern-
stein (1914) a démontré que si f est de classe C ∞ au voisinage de 0 et telle
que (−1)k f (k) (0) ≥ 0 pour tout k ≥ 0, alors f est analytique en 0.
Apéry, Roger (1919-1994) (420). Mathématicien français, professeur à l’uni-

versité de Caen.
apparent ou régulier (point singulier) (664).
application (8). Dedekind (1888) a défini la notion d’application d’un ensemble

dans un autre et en a développé les propriétés élémentaires.
approximation d’un ensemble intégrable (théorème d’) (497, 712). On a

un résultat proche chez Denjoy (1910).
approximation d’une fonction intégrable (théorème d’) (713).
approximation d’une primitive (théorème d’) (340). Un énoncé proche é-

merge dans une lettre de Peano (1884) au mathématicien louvaniste Gil-
bert, contestant sa justification d’une démonstration du théorème des ac-
croissements finis parue dans la première édition du Cours d’analyse de Jor-
dan et critiquée par Peano. Peano en laisse la démonstration comme ex-
ercice à Gilbert !
approximations successives (172). Utilisée depuis l’Antiquité pour la résoluti-

on d’équations numériques, la méthode des approximations successives fut
utilisée par Liouville (1831), Schwarz (1885), Peano (1888) et Picard
(1890) dans l’étude des équations différentielles et aux dérivées partielles.
C’est Goursat (1903) qui l’a introduite dans l’étude des fonctions implicites.
Arbogast, Louis, (1739-1803) (79). Mathématicien alsacien, professeur à l’E-

cole d’Artillerie de Strasbourg et recteur du Collège catholique de la même
ville. Il a contribué à l’étude des fondements du calcul différentiel et intégral
et à l’étude des équations aux dérivées partielles.
Archimède (théorème d’) (14). Mentionné par Archimède, qui l’attribue à

Eudoxe, dans ses études sur la quadrature des courbes. On le trouve aussi
dans les Eléments d’Euclide.
Archimède (287-212) (14). Le plus grand mathématicien de l’Antiquité, il fut

aussi le créateur de la statique, de l’hydrostatique et de la théorie des corps
flottants, ainsi que le créateur d’étonnantes machines de guerre. Tué par un
soldat romain lors de la prise de Syracuse.
Arnold, Vladimir I. (né en 1937) (319). Mathématicien russe contemporain.

Travaux importants sur la théorie des équations différentielles, la mécanique
céleste, la théorie des singularités et les systèmes dynamiques.
Arzela, Cesare (1847-1912) (722). Elève de Betti et de Dini, ce mathémati-

cien italien a contribué à la théorie des fonctions de variables réelles et à la
naissance de l’analyse fonctionnelle. On lui doit une condition nécessaire et
suffisante de continuité de la limite d’une suite de fonctions continues.
Ascoli-Arzela (théorème d’) (722). Ascoli (1883) et Arzela (1889).
Ascoli, Giulio (1843-1896) (722). Mathématicien italien. Importantes contri-

butions au calcul des variations et à la théorie des ensembles de fonctions
continues.
747
asymptotique (développement) (284). Notion due simultanément à Poinca-

ré (1886) et Stieltjes (1886).
attracteur (176). Etant donné un système dynamique défini par f : R → R, un
attracteur est un ensemble fermé A invariant par f (f(A) ⊂ A) pour lequel il
existe un ouvert U ⊃ A tel que, pour tout x ∈ U et tout entier k ≥ 1, f k (x) ∈
U et dist(f k (x), A) → 0 si k → +∞. L’exemple le plus simple est un point fixe
asymptotiquement stable considéré il y a une centaine d’année par Poincaré,
Liapounov et Levi-Civita. Les travaux de Levinson (1949), Lorenz
(1963), Smale (1967) ont révélé l’existence d’attracteurs ayant une structure
fractale, auxquels Ruelle, Takens (1971) ont donné le nom d’attracteurs
étranges. Leur existence entraı̂ne un comportement chaotique du système
dynamique.
au plus dénombrable (ensemble) (12).

axiomatique de Zermelo-Fraenkel (2). Due à Zermelo (1908), à Fraenkel
(1922) et à Skolem (1922). On la note (ZFC). Une autre axiomatique fut in-
troduite par von Neumann (1925), Bernays (1937-1954) et Gödel (1940).
E. Nelson (1977) a introduit une extension conservative de la théorie de
Zermelo-Fraenkel faisant intervenir le prédicat unaire supplémentaire stan-
dard et trois axiomes supplémentaires régissant son emploi. C’est la théorie
des ensembles internes (IST) dans laquelle toute formule n’impliquant pas
le nouveau prédicat est appelée standard, ainsi que tout ensemble construit
à partir des seuls axiomes de (ZFC). L’un des nouveaux axiomes entraı̂ne
que tout ensemble infini contient au moins un élément non standard. Ainsi,
dans N, les éléments non standards sont les entiers infiniment grands, c’est-
à-dire les entiers supérieurs à tous les entiers standards. On obtient alors
des réels infiniment petits en prenant leurs inverses. Cette structure permet
de présenter rigoureusement l’analyse mathématique en termes d’infiniment
petits et d’infiniment grands, un programme pratiquement abandonné depuis
l’approche weierstrassienne, et de réhabiliter ainsi, d’une certaine manière,
le langage et une certaine intuitition des créateurs du calcul infinitésimal.
C’est ce que l’on appelle l’analyse non standard, introduite par A. Robinson
(1961) par une approche différente fondée sur des résultats délicats de logique
mathématique, et qui constitue un point de vue alternatif et une technique
nouvelle en analyse mathématique.
Baire (théorème de) (76, 707). Dû, indépendamment, à Osgood (1897) dans
R, et à Baire (1899) dans Rn . C’est Banach et Steinhaus (1927), utilisant
une idée de Saks, qui montreront le rôle de l’extension du théorème de Baire
aux espaces métriques complets dans des questions fondamentales d’analyse
fonctionnelle.
Baire, René (1874-1932) (76, 707, 741). Mathématicien français; un des cré-
ateurs de la théorie des fonctions de variables réelles. Auteur d’intéressantes
Leçons sur les théories générales de l’analyse. Il se suicida après avoir souffert
longuement de troubles nerveux.
Banach (espaces de) (692). Introduits et étudiés par Banach à partir de 1922.
Banach (théorème du point fixe de) (174, 700). Voir “Applications contrac-
tantes (théorème des)”.
Banach, Stefan (1892-1945) (174, 692, 700, 708, 742). Mathématicien po-
lonais; ses contributions à l’analyse fonctionnelle, la théorie de la mesure et
à la théorie des fonctions d’une variable réelle sont capitales. Sa Théorie des
opérations linéaires est aujourd’hui classique.
Bernoulli (décalage de) (688). Introduit par Jacques Bernoulli (1685).
Bernoulli (équation différentielle de) (390). Jacques Bernoulli l’introduit

(1695), Leibniz (1696) et Jean Bernoulli (1697) la résolvent.
Bernoulli (inégalité de) (33). Due indépendamment à Barrow (1670) et Jac-

ques Bernoulli (1670).
Bernoulli, Jacques (1654-1705) (33, 390, 688). Mathématicien suisse, d’une

famille protestante anversoise qui émigra à Bâle pour échapper aux persécu-
tions du duc d’Albe. Contributions fondamentales au calcul différentiel et
intégral, à la théorie des courbes, aux équations différentielles, au calcul des
probabilités et à la mécanique. Un des créateurs du calcul des variations.
Bernoulli, Jean (1667-1748) (34, 147, 344). Mathématicien suisse, frère de

Jacques Bernoulli. D’un caractère très querelleur, qui n’épargna ni son frère
ni ses enfants, il a apporté des contributions essentielles au calcul différentiel
et intégral, au calcul exponentiel, à la théorie des équations différentielles, au
calcul des variations et à la mécanique.
Bertrand, Joseph (1822-1900) (481). Enfant prodige (il entre à l’Ecole Poly-
technique à seize ans), ce mathématicien français n’a peut-être pas réalisé les
espérances mises en lui mais son influence sur la vie académique française a
été énorme. Il conjectura que, pour tout entier n > 3, il existe un nombre
premier compris entre n et 2n − 2, un résultat que Tchebycheff démontra
en 1851.
Bessel (équation différentielle et fonctions de) (460, 564). Introduites par

Bessel (1817). Des cas particuliers avaient déjà été rencontrés par Jacques
Bernoulli (1703), Daniel Bernoulli (1724, 1738, 1748), Euler (1764,
1784), Lagrange (1770) et Fourier (1812). Elles constituent un exemple
important des fonctions spéciales qui jouent un grand rôle en physique et dont
la théorie constitue une partie importante des mathématiques appliquées.
749
Bessel, Friedrich W. (1784-1846) (460, 564, 672). Astronome et mathéma-

ticien allemand, ami de Gauss.
bijection (9). Déjà utilisée par Cantor, cette notion sera définie en général par
Dedekind (1888).
binomiale (série) (434). Enoncée par Newton (1665; publié dans des lettres
en 1776 et dans un ouvrage de Wallis (1685)) et Gregory (1668-1670) et
étudiée dans le cas d’un exposant rationnel par Euler (1774). La première
démonstration convenable et complète de sa convergence est due à Abel
(1826).
Bolzano (théorème de) (123). Enoncé déjà par le mathématicien belge Stevin
(1594), qui l’utilisa pour la résolution d’équations numériques, ce théorème fut
longtemps considéré comme “géométriquement” évident. Bolzano (1817) et
Cauchy (1821) sentirent la nécessité d’une démonstration analytique et en
proposèrent; leur procédé fut rendu complètement rigoureux par la construc-
tion analytique de l’ensemble des nombres réels. Extension aux fonctions de
Rn dans R due à Darboux (1872).
Bolzano-Weierstrass (propriété de) (721). C’est Fréchet (1906) qui mon-

tra son importance dans l’étude des espaces métriques.
Bolzano-Weierstrass (théorème de) (168). Prouvé par Weierstrass (1860)

qui attribue le crédit de la méthode de démonstration à Bolzano (1817).
Bolzano, Bernard (1781-1848) (79, 123, 162, 168, 197, 232, 453, 721).
Mathématicien, logicien, théologien, sociologue et philosophe, ce prêtre tchè-
que a dû affronter l’hostilité des autorités politiques et religieuses en place.
Il est un pionnier de l’étude des fondements de l’analyse mathématique et de
la théorie des ensembles.
bord (620). Si Bq (E) désigne l’ensemble des q-bords dans E et Zq (E) l’ensemble
des q-cycles dans E, munis d’une structure de A-module sur un anneau A,
on sait que Bq (E) ⊂ Zq (E) et le quotient Zq (E)/Bq (E) constitue le q e A-
module d’homologie de E, noté Hq (E). L’homologie constitue une partie im-
portante de la topologie algébrique, c’est-à-dire de l’étude, par des méthodes
algébriques, de la topologie (c’est-à-dire des propriétés géométriques des en-
sembles invariantes par transformations continues).
bord d’un simplexe (610), d’une chaı̂ne (611). Notions introduites par
Poincaré (1899) et précisées par Alexander (1926), Alexandroff
(1926), Newmann (1926) et Lefschetz (1933).
Borel-Lebesgue (propriété de) (717). Enoncée et démontrée pour un interval-

le fermé borné de R par Borel (1895) dans le cas d’un recouvrement dénom-
brable, et par Lebesgue (1904) dans le cas d’un recouvrement quelconque.
Borel, Emile (1871-1956) (393, 525, 717). Mathématicien français; à côté de

la mesure qui porte son nom, il a apporté des contributions essentielles à la
théorie des fonctions de variables réelles et de variables complexes, au calcul
des probabilités et à la théorie des jeux. Il anima les mathématiques françaises
de la première moitié du sièce et fut ministre de la marine en 1925. Ses Leçons
sur la théorie des fonctions sont célèbres.
borné (ensemble) (62, 130, 199, 716).
bornée (fonction) (113, 679), (suite) (168). La terminologie et la notion pré-

cises furent introduites pour les suites par Pasch (1882).
bornée à l’infini (fonction) (63).
bornes atteintes (théorème des) (137). Enoncé et prouvé dans R par Weier-
strass aux environs de 1860. Extension à R2 par Darboux (1872) et à Rn
par Riquier (1890) et Peano (1884).
boule, boule ouverte (24, 684, 128). Notion introduite dans Rn par Dede-
kind (1871) et Baire (1899). Dedekind démontra qu’une boule ouverte
est un ouvert.
Bouquet, Jean-Claude (1819-1885) (112). Mathématicien français, élève de

Cauchy. Avec Briot, il est l’auteur du premier traité présentant de manière
systématique la théorie des fonctions d’une variable complexe élaborée par
Cauchy (Théorie des fonctions elliptiques).
Bourbaki, Nicolas (37). Pseudonyme d’un groupe fondé par de jeunes mathé-
maticiens français (comprenant en particulier H. Cartan, Chevalley, Di-
eudonné et Weil) qui, dans les années trente, se proposèrent d’écrire un
traité de mathématiques fondé principalement sur la notion de structure. Ce
sont les célèbres Eléments de mathématique.
Briot, Charles (1817-1882) (112). Mathématicien et physicien français (voir

Bouquet).
Brouwer (théorème du point fixe de) (159). Le cas général affirme que toute
application continue d’une boule fermée de Rn en elle-même possède un
point fixe. Sa démonstration, beaucoup plus difficile que pour n = 1, est
due à Brouwer (1912), et peut se faire à partir de techniques de topologie
algébrique ou du théorème de Stokes-Cartan.
Brouwer, Luitzen E.J. (1881-1966) (159). Mathématicien hollandais, il a ap-

porté des contributions fondamentales à la topologie algébrique et la théorie
de la dimension. Il est aussi le créateur de l’école intuitioniste, qui refuse
l’emploi du principe du tiers exclus en mathématique.
751
C-dérivée, C-dérivable (fonction) (104). Notion due, sous le nom de monogè-

ne, à Cauchy (1846).
C-linéaire (application) (74).
C-primitivable (fonction) (647). Notion introduite par Cauchy (1825).
canonique (transformation) (636). Dans le cadre de la mécanique analytique,

des cas particuliers furent considérés par Lagrange (1808), Poisson (1809)
et Hamilton (1834-35). Le cas général fut considéré par Jacobi (1842-
43), Mathieu (1874) et Lie (1877). On les appelle aussi transformations de
contact.
Cantor (ensemble de) (160, 523). Des ensembles de ce type furent introduits
par Smith (1875), Du Bois-Reymond (1880), Volterra (1881) et Cantor
(1883). C’est aujourd’hui un exemple célèbre d’ensemble fractal omniprésent
en théorie du chaos.
Cantor (théorème de) (194).
Cantor, Georg (1845-1918) (1, 17, 33, 34, 36, 159, 163, 194, 523). Ma-
thématicien allemand, créateur de la théorie des ensembles. Il souffrit de
nombreuses crises de dépression nerveuse.
caractéristique (fonction) (485). Notion introduite par de La Vallée Pous-

sin (1915).
Carathéodory (dérivée au sens de) (109). Carathéodory (1918).
Carathéodory (fonction et multiplicateur de) (191, 193). Introduits par

Carathéodory (1935) et Bliss (1938).
Carathéodory, Constantin (1873-1950) (109, 191, 193). Mathématicien

grec, ancien élève de l’Ecole Royale Militaire de Belgique. Contributions
importantes en théorie des fonctions de variables réelles et complexes et en
calcul des variations. Ses Vorlesungen über reelle Funktionen sont classiques.
cardinal (d’un ensemble) (10). Notion due à Cantor (1895).
Carleson, Lennart (né en 1928) (521). Mathématicien suédois, spécialiste de

l’analyse harmonique.
Cartan, Elie (1869-1951) (613, 642). Mathématicien français; plusieurs con-

tributions fondamentales en géométrie différentielle et en théorie des groupes.
Casorati, Felice (1835-1890) (667). Analyste et géomètre italien. Auteur d’un

des premiers traités sur les fonctions holomorphes (1868).
Cauchy (condition d’intégrabilité de) (351, 353, 365, 366).
Cauchy (critère de) (47, 63, 65, 169, 170, 171, 252, 438, 440, 442, 444,
687, 690). Introduit, pour les suites numériques, par Bolzano (1816) et
par Cauchy (1821). Une démonstration rigoureuse fut donnée par Cantor
(1872). Dû à Cauchy (1853) et Weierstrass (1861) pour la convergence
uniforme.
Cauchy (équation fonctionnelle de) (391). Résolue par Cauchy (1821).
Cauchy (fonction de) (246). Introduite comme contre-exemple par Cauchy

(1821), elle joue un grand rôle en analyse moderne, et en particulier dans la
théorie des distributions qui généralise la notion de fonction et l’opération de
dérivation et qui est due à Sobolev (1936) et L. Schwartz (1945). Ainsi,
si f et g sont des fonctions de R dans R L-intégrables sur tout intervalle
borné de R, on dira que g est la dérivée de f au sens des distributions si,
pour toute fonction
H ϕ de R dans R de H classe C
∞
et nulle en dehors d’un com-
pact de R, on a R g(x)ϕ(x) dx = − R f(x)ϕ (x) dx. La formule d’intégration
#
par parties montre que, si f est deH classe C 1 sur R, on a nécessairement

g = f # . L’application < g, . >: ϕ 2→ R g(x)ϕ(x) dx est une forme linéaire sur
l’ensemble D ⊂ C ∞ des fonctions de classe C ∞ nulles en dehors d’un com-
pact. On l’appelle la distribution associée à la fonction g. On peut définir
plus généralement une distribution comme une forme linéaire sur D vérifiant
certaines conditions de continuité que nous ne préciserons pas ici. Ainsi, la
fonction de Dirac δ “définie” comme fonction nulle sauf en zéro et dont
l’intégrale sur R est égale à un (une telle fonction n’existe évidemment pas
en vertu des propriétés de l’intégrale), est en fait la distribution δ définie
par < δ, ϕ >= ϕ(0) pour tout ϕ ∈ D. Si H désigne l’application d’Heaviside
définie par H(x) = 0 si x < 0 et H(x) = 1 si x ≥ 0, alors, sa dérivée au sens
des distributions est la distribution H # définie par
J J +∞
< H # , ϕ >= − H(x)ϕ# (x) dx = − ϕ# (x) dx = ϕ(0) =< δ, ϕ >,
R 0
pour tout ϕ ∈ D, c’est-à-dire (au sens de l’égalité des distributions), h# = δ.

La théorie des distributions joue un grand rôle en analyse moderne.
Cauchy (inégalité de) (21). On la trouve chez Cauchy (1821).
Cauchy (inégalité pour une fonction holomorphe) (654). Cauchy (1831).
Cauchy (problème de) (311, 313, 701, 724). Considéré pour la première fois
par Cauchy (1823).
Cauchy (reste du développement de Taylor de) (244). Cauchy (1823).
Cauchy (suite de) (171, 690).

753
Cauchy (théorème de la moyenne de) (146). Cauchy (1823).
Cauchy (théorème intégral de) (648). Résultat dû indépendamment à Cau-

chy (1825, 1846) et Weierstrass (1842). On le trouve en outre dans des
papiers non publiés de Gauss révélés par une lettre de ce dernier à Bessel
(1811). Goursat (1900) a démontré le théorème intégral de Cauchy sous la
seule hypothèse que f soit C-dérivable (sans hypothèse de continuité sur f # ).
Cette démonstration repose essentiellement sur le lemme de Cousin.
Cauchy-Picard (théorème de) (702). Découvert par Cauchy (1824). La dé-

monstration donnée est essentiellement celle de Picard (1890).
Cauchy-Riemann (conditions de) (105). Obtenues par d’Alembert (1752)

et Euler (1755) pour les composantes u et v de la vitesse d’écoulement d’un
fluide parfait, elles expriment que les formes u dy − v dx et u dx + v dy sont
exactes. En 1776, Euler montre qu’elles expriment le fait que l’expression
(u + iv)(dx + idy) est une différentielle exacte. Elles apparaissent alors chez
Cauchy (1814) dans le cas général et sont à la base de l’approche de Rie-
mann (1851) en analyse complexe.
Cauchy-Schwarz (inégalité de) (683). Elle apparaı̂t chez Cauchy (1821).
Cauchy-Schwarz-Bouniakowsky (inégalité de) (565). Enoncée pour la pre-

mière fois par Bouniakowsky (1859) et retrouvée par Schwarz (1885).
Cauchy, Augustin (1789-1857) (22, 35, 38, 47, 63, 65, 78, 80, 105, 110,
112, 146, 164, 169, 170, 171, 244, 246, 251, 286, 311, 313, 319, 391,
392, 421, 433, 435, 438, 440, 442, 444, 480, 648, 651, 654, 672, 677,
683, 687, 690, 701, 702, 724). Mathématicien français très prolifique et
catholique militant, il a apporté des contributions fondamentales dans toutes
les parties des mathématiques et de la physique mathématique. Par fidélité à
Charles X, il le suivit en exil et sera, à Prague, le tuteur de l’impertinent duc
de Bordeaux, héritier des Bourbons. Son Cours d’analyse et son Résumé sur
le calcul infinitésimal, aujourd’hui célèbres et universellement admirés, repro-
duisent des leçons à l’Ecole polytechnique qui furent unanimement critiquées
à l’époque.
Cellérier, Charles (mort en 1889) (453, 481). Les travaux de ce mathémati-

cien suisse sur les fonctions continues sans dérivées ont été découverts après
sa mort.
chaı̂ne (609). Notion due à Poincaré (1899) et et précisée par Alexander

(1926), Alexandroff (1926), Newmann (1926) et Lefschetz (1933).
chaleur (équation de la) (316, 564). Introduite par Fourier (1812).
champ vectoriel (579). Notion introduite par Thomson (1851).

changement de variable dans une intégrale (554, 559, 561). Des cas parti-
culiers apparaissent chez Euler (1759), Lagrange (1773), Laplace (1776),
Legendre (1788) et Gauss (1813). Le cas général pour des fonctions con-
tinues fut traité par Ostrogradsky (1836), Catalan (1841) et Jacobi
(1833, 1841) et, pour les fonctions L-intégrables, par Hobson (1910). La
démonstration donnée ici s’inspire de celle de Hadamard (1937) et de J.T.
Schwartz (1954).
chaos (173). La théorie du chaos, c’est-à-dire l’étude de la dépendance sensitive

aux conditions initiales dans les systèmes dynamiques, trouve ses racines dans
les travaux de Poincaré (1889, 1899) et Hadamard (1898). Leur impor-
tance en physique fut déjà remarquée par Duhem (1906).
chemin (605, 609).
choix (axiome du) (3). Enoncé par Zermelo (1908), il suscita de nombreuses
controverses parmi les mathématiciens.
circulation (580, 618). Première apparition du concept chez Clairaut (1743).
classe C ∞ , C k (fonction de) (246, 276).
cobord (620), cocycle (621). Si B q (E) désigne l’ensemble des q-cobords dans
E et Z q (E) l’ensemble des q-cocycles dans E, alors B q (E) ⊂ Z q (E) et
H q (E) = Z q (E)/B q (E) est le q e espace vectoriel de cohomologie de E (de
Rham (1950)). Le théorème de Stokes-Cartan établit une dualité entre
l’homologie et la cohomologie de E.
codifférentielle extérieure (601). Notion introduite par de Rham (1950).
coefficients indéterminés (méthode des) (302). Utilisés par Newton (1671;

publ. 1736) dans sa résolution formelle des équations différentielles par des
séries.
Cohen, Paul (né en 1934) (17). Mathématicien américain, médaille Fields en

1966. A côté de travaux importants sur l’analyse réelle, l’analyse harmo-
nique et les équations aux dérivées partielles, il est connu surtout pour sa
démonstration de l’indépendance de l’hypothèse du continu et de l’axiome du
choix en théorie des ensembles de Zermelo-Fraenkel (1963).
col (145). Voir “selle (point de)”.
compact (718). Notion introduite par Fréchet (1906) dans les espaces métri-
ques à partir de la propriété de Bolzano-Weierstrass. La définition donnée
ici, fondée sur la propriété de Borel-Lebesgue, est celle d’Alexandroff et
Urysohn (1924).
complet (espace métrique) (692). Notion introduite par Fréchet (1906).

755
complexes (nombres) (25). Introduits heuristiquement par Cardan (1545) et

utilisés par Bombelli (1572) pour résoudre les équations du troisième degré,
on les rencontre pour la première fois hors d’Italie chez Stevin (1585).
Leibniz (1702) les considère comme un “remarquable et merveilleux refuge
de l’esprit humain, une sorte d’amphibie de l’être et du non-être”. Leur
représentation trigonométrique est due à Euler (1748) et leur représentation
géométrique à Gauss (1796), Wessel (1797) et Argand (1806). Leur
présentation algébrique comme couples de réels soumis à certaines opérations
est due à Hamilton (1833). L’expression nombre complexe est due à Gauss.
composé (graphe) (6). Notion due à Dedekind (1888).
concave (fonction) (228).
conditions aux limites (314). Des conditions aux limites particulières pour des
équations différentielles ordinaires apparaissent au XVIIIe siècle, en partic-
ulier chez Taylor (1715). Une théorie générale pour les équations linéaires
du second ordre sera édifiée par Sturm et Liouville (1836) et jouera un
grand rôle dans la genèse de l’analyse fonctionnelle. Le cas de conditions
aux limites ou d’équations différentielles non linéaires requiert l’emploi de
méthodes itératives, topologiques ou variationnelles.
conforme (représentation) (670). Les transformations conservant les angles

sont importantes en cartographie. C’est le cas de la célèbre projection de Mer-
cator (1569), due à Gerhard Kremer, dit Mercator, qui fut, à l’Université
de Louvain, l’élève de Gemma Frisius. Euler (1768, 1777) les étudie par
les fonctions complexes et les appelle “infinitésimalement semblables”. Le
terme “application conforme” est dû à Schubert (1789). Gauss (1825)
résoud le problème de la représentation conforme d’un plan sur lui-même. Le
problème de la représentation conforme d’un domaine simplement connexe
sur un disque, considéré par Riemann (1851), sera traité rigoureusement par
Neumann et Schwarz.
conjugué (d’un nombre complexe) (26). Notion déjà familière à Newton

(1673) et Leibniz (1675); la dénomination semble due à Cauchy (1841).
connexe par arcs (125). La définition générale d’ensemble connexe (qui équi-
vaut, pour un ouvert, à celle donnée ici), est due à Hausdorff (1914).
continue (fonction) (69, 122, 159, 688). La notion intuitive de fonction con-
tinue est présente dès le XVIIIe siècle, avec des acceptions diverses, mais il
faut attendre Bolzano (1817) et Cauchy (1821) pour une formulation plus
précise, qui conduit à la définition de Weierstrass (1861) adoptée ici. La
formulation en termes de voisinages est due à Hausdorff (1914). La carac-
térisation de la continuité par les suites est due à Cantor (1871). Pour les
fonctions de plusieurs variables, Cauchy (1821) pensait avoir démontré que
la continuité résulte de la continuité séparée par rapport à chaque variable.

Des contre-exemples furent donnés par Thomae (1870), Schwarz (1872) et
Baire (1896).
contractante (application) ou contraction (174, 688, 700).
contractantes (théorème des applications) (174, 700). Enoncé et démontré

par Goursat (1903) pour des applications de Rn dans Rn , par Banach
(1922) pour des espaces normés complets et par Caccioppoli (1930) pour
des espaces métriques complets.
contractile (ensemble) (636).
contraction (constante de) (174).
contraposée (1).
convergence absolue (condition suffisante de) (256).
convergence bornée (théorème de) (478). Dû à Lebesgue (1902). Version

plus faible pour l’intégrale de Riemann chez Arzela (1875) et Osgood
(1897).
convergence d’une série (condition nécessaire de) (251). Longtemps con-

sidérée comme suffisante. Bolzano (1817) a remarqué que la divergence
de la série harmonique est un exemple de son caractère non suffisant.
convergence d’une série (condition suffisante de) (253).
convergence d’une série à termes positifs (CNS) (255).
convergence de la série de Taylor (condition suffisante de) (258). Cas

particuliers chez Laplace (1812), Cauchy (1823), Schlömilch (1852).
convergence des suites monotones (CNS) (213). Dedekind (1872) prouve

l’existence d’une limite pour une suite croissante et majorée, longtemps con-
sidérée comme géométriquement évidente.
convergence dominée ou majorée et minorée (théorème de) (474, 478).

Dû, pour son intégrale, à Lebesgue (1910).
convergence monotone pour les fonctions continues (théorème de)

(465). Dû à Dini (1878).
convergence non absolue d’une série (condition nécessaire de) (257).

757
convergente (série) (250). L’expression est due à Gregory (1667) et la premi-

ère définition rigoureuse à Bolzano (1817) et Cauchy (1821). Les premiers
cas particuliers d’étude rigoureuse de convergence d’une série remontent à
Gauss (1813) et Bolzano (1816).
convergente (suite) (65, 689).
convexe (ensemble) (230, 627). Définition due à Minkowski (1903).
convexe (fonction) (227, 230, 283). L’étude de la convexité d’une fonction à

l’aide du signe de sa dérivée seconde apparaı̂t chez Leibniz (1677; publ.
1684) et Newton (1671; publ. 1736). La définition et l’étude systématique
des fonctions convexes est due à Jensen (1905), après que certains résultats
aient été obtenus par Stolz (1893).
convolution (produit de) (529). Des produits de convolution particuliers ap-

paraissent chez Poisson (1815), Cauchy (1815) et Dirichlet (1829) dans
l’obtention de solutions d’équations différentielles et dans l’étude des séries
de Fourier, et chez Weierstrass (1885) dans sa démonstration du théorème
d’approximation d’une fonction continue. Tchebychev (1890) étudie le pro-
duit de convolution de deux transformées de Fourier et Volterra (1913) met
l’accent sur les aspects algébriques de cette “composition” de deux fonctions.
couple (2).
courbe simple (569). Notion due à Jordan (1893). Si l’on abandonne la condi-
tion d’injectivité, on peut construire une application continue de [0, 1] dans
R2 dont l’image est [0, 1] × [0, 1] ! (Peano (1890)).
Cousin (lemme de) (120, 130). Un résultat de ce type, pour une “région régu-
lière” de R2 , est énoncé et démontré par Cousin (1895). Pour un intervalle
de R, un résultat analogue est dû à Lusin (1911) et Henstock (1963) l’étend
à un pavé de R2 .
Cousin (propriété de) (131, 717).
Cousin, Pierre (1867-1933) (120, 130, 131, 162, 717). Mathématicien fran-
çais, élève de Poincaré et Appell. Importantes contributions à la théorie
des fonctions de plusieurs variables complexes.
critique (point) (145, 730). La théorie des points critiques, qui étudie l’exis-
tence et le nombre des points critiques de fonctions réelles définies sur des
espaces de dimension finie ou infinie, a des connections importantes avec la
topologie, l’analyse fonctionnelle, l’analyse convexe, la théorie des équations
différentielles et aux dérivées partielles, la mécanique, la physique théorique
et l’économie mathématique.
croissante (fonction) (209).
cube (115).
cycle (609, 620). Voir “bord”.
d’Alembert (théorème de) (140). Voir “algèbre (théorème fondamental de

l’)”.
d’Alembert, Jean le Rond (1717-1783) (77, 109, 140, 285, 423, 435). Ma-
thématicien, physicien et philosophe français. Fils naturel de la marquise
de Tencin, il a apporté des contributions de premier ordre à l’analyse et la
mécanique. Il dirigea, avec Diderot, la publication de l’Encyclopédie.
Darboux (continuité au sens de ou propriété de) (125, 159, 325). Notion

étudiée rigoureusement par Darboux (1875). On sait aujourd’hui qu’une
fonction continue au sens de Darboux sur un intervalle peut être discontinue
en chaque point et non-mesurable sur chaque partie de mesure positive. La
somme et le produit de deux fonctions continues au sens de Darboux ne le
sont pas nécessairement.
Darboux, Gaston (1842-1917) (125, 159, 325). Mathématicien français. A-

près des travaux sur les fonctions réelles et leur intégration, il se consacra
à la géométrie différentielle. Sa correspondance est émaillée de remarques
impertinentes sur ses contemporains.
décroissante (fonction) (209).
Dedekind (test de convergence d’une série de) (431). On le trouve dans la

deuxième édition (1871) des leçons de Dirichlet éditées par Dedekind.
Démontré indépendamment par du Bois-Reymond (1870). On trouve un
cas particulier chez Catalan (1860).
Dedekind (test d’intégrabilité de) (410).
Dedekind, Richard (1831-1916) (36, 410, 431). Mathématicien

allemand, auteur d’une théorie des nombres réels, il a introduit et étudié
de nombreux concepts fondamentaux en algèbre et en théorie des ensembles.
Sa soeur Julie fut romancière.
défini (6).
de La Vallée Poussin, Charles-Jean (1866-1962) (440, 526, 567). Mathé-

maticien belge, professeur à l’Université de Louvain pendant soixante ans,
il démontra le théorème des nombres premiers et contribua à la théorie des
fonctions de variables réelles, de la représentation conforme et du potentiel.
Son Cours d’analyse infinitésimale est resté célèbre.
759
De Moivre (formule de) (268). Introduite par De Moivre (1707).
De Moivre, Abraham (1667-1754) (268). Mathématicien d’origine française

réfugié en Angleterre pour ses opinions protestantes. On lui doit un im-
portant traité sur le calcul des probabilités.
Denjoy, Arnaud (1884-1974) (349, 393). Mathématicien français. On lui doit

la première intégrale capable d’intégrer toutes les dérivées (il l’appela la
totale). Contributions importantes en analyse harmonique et en équations
différentielles.
dénombrable (ensemble) (11). Notion due à Cantor (1873), qui démontra que
Q est dénombrable et que R ne l’est pas.
dense (partie) (706). Introduite pour R par Cantor (1879).
dérivabilité à gauche ou à droite (82).
dérivabilité par rapport à une fonction (161).
dérivable (fonction indéfiniment) (246).
dérivable (fonction k fois) (234).
dérivable dans une direction (fonction) (91). Parfois appelée dérivable au

sens de Gateaux (1919)
dérivable (fonction) (81, 85). Pour une fonction de R dans Rp , la première

définition donnée ici, en germe chez Newton et d’Alembert, se trouve
chez L’Huilier (1786), Bolzano (1817) et Cauchy (1821). La formulation
équivalente est due à Weierstrass (1861); on la trouve déjà en germe chez
da Cunha (1790). Quoiqu’on trouve déjà chez Euler (1734) des formes
linéaires dont les coefficients sont les dérivées partielles d’une fonction, la
notion de dérivabilité d’une fonction de Rn dans Rp introduite ici est due à
Stolz (1893). Elle fut développée par Pierpont (1905), William H. Young
(1910), Fréchet (1912) et de La Vallée Poussin (1913), qui l’introduisit
dès 1914 dans son cours d’analyse à l’Université de Louvain.
dérivation d’une fonction composée (règle de) (98). La forme donnée ici est
due à Stolz (1893).
dérivé (nombre ou vecteur) (81). Bien qu’on trouve des traces de la notion de
dérivée dans les recherches géométriques sur la détermination des tangentes
aux courbes, spécialement chez Fermat, Torricelli et Barrow au XVIIe
siècle, il faut attendre Newton (1687) et Leibniz (1676) pour en dégager la
notion analytique correspondante et en donner les premières règles de calcul.
La terminologie et la notation df/dx sont dues à Leibniz (1676), tandis que
la notation f # (x), due à Foncenex (1759), fut systématiquement popularisée

par Lagrange.
dérivé d’ordre supérieur (vecteur) (234).
dérivée (fonction) (233).
dérivée d’ordre supérieur (fonction) (234).
dérivée dans une direction (91).
dérivée logarithmique (107).
dérivée partielle (91). Utilisée dans des situations particulières par Leibniz
(1694), Newton, Jacques Bernoulli, Nicolas Bernoulli (1720), cette
notion fut introduite plus systématiquement par Fontaine, Euler (1734),
Clairaut (1739) et d’Alembert (1744). La notation fi# est due à La-
grange et la notation ∂f/∂xi à Legendre (1786).
dérivée partielle d’ordre supérieur (fonction) (271).
dérivée totale (89), dérivée totale (fonction) (270).
difféomorphisme (555). Un des buts de la topologie différentielle est de décider

si deux variétés différentiables sont difféomorphes.
différentiable (fonction) (85).
différentielle (89), différentielle (fonction) (270).
différentielle extérieure d’une forme (596). Notion introduite par Frobeni-

us (1877) et, dans le cas général, par Elie Cartan (1899). La notation dω,
déjà utilisée par le physicien mathématicien belge De Donder en 1902, ne
se généralisera qu’après son adoption par Kähler en 1934.
Dini (théorème de) (465). Dû à Dini (1878).
Dini, Ulisse (1845-1918) (465). Mathématicien italien, le créateur de l’école

italienne de théorie des fonctions de variables réelles. Son traité Fondamenti
per la teoria delle funzioni di variabili reali est célèbre et sa statue se trouve
à Pise.
direction (90).
Dirichlet (fonction de) (71, 76, 354). Introduite par Dirichlet (1829).
Dirichlet (intégrale de) (636). On la trouve déjà chez Gauss (1839).
Dirichlet (test d’intégrabilité de) (410). dû en réalité à Chartier (1853).

761
Dirichlet (test de convergence d’une série de) (432). On le trouve dans les
leçons de Dirichlet publiées par Dedekind (1863).
Dirichlet, Peter G. Lejeune (1805-1859) (35, 71, 76, 314, 354, 410, 432,
636). Mathématicien allemand dont la famille est d’origine belge (le nom
vient de “de Richelette”, village de la province de Liège et le grand-père
de Dirichlet était verviétois). Dirichlet épousa la soeur du musicien
Mendelsohn. Contributions essentielles en analyse et en théorie des nombres.
discontinue (fonction) (69, 687).
discrète (métrique) (676).
disque de convergence d’une série entière (426). Le terme cercle de conver-

gence fut introduit par Méray (1872).
distance (675). Les axiomes de la distance, sous une forme équivalente à celle
donnée ici, furent introduits par Fréchet (1906). Leur forme actuelle est
due à Hausdorff (1914).
distribution (fonction de) (494).
divergence (d’un champ vectoriel) (601, 619). Notion déjà connue au temps
d’Euler mais systématisée (avec le signe opposé) par Maxwell (1873), qui
l’appelle la convergence du champ. C’est Clifford (1878) qui change le
signe et l’appelle divergence.
divergente (série) (250). Expression due à Nicolas Bernoulli (1713). On peut

parfois donner un sens généralisé à la notion de “somme” dans le cas d’une sé-
rie divergente, par exemple en remplaçant l’existence de la limite des sommes
partielles des termes de la série par celle de la limite de la suite des moyen-
nes arithmétiques des termes de la série, ou des moyennes arithmétiques de
ces moyennes, etc. Cette méthode, en germe chez d’Alembert (1768), D.
Bernoulli (1771) et Lagrange (1799), a été développée par Kronecker
(1876), Frobenius (1880), Hölder (1882) et Cesaro (1890). D’autres
méthodes de sommations de séries divergentes, trouvant leurs germes dans des
travaux d’Euler (1745), Poisson (1820) et Abel (1826), ont été développées
par Borel (1899).
divergente (suite) (65).
division (131, 717).
domaine (5).
Du Bois-Reymond (lemme de) (733). Dû à Du Bois-Reymond, à l’occasion

d’une critique pénétrante des traitements antérieurs du calcul des variations.
Du Bois-Reymond (test d’intégrabilité de) (409).

Du Bois-Reymond (test de convergence d’une série de) (430). du Bois-
Reymond (1870).
Du Bois-Reymond, Paul (1831-1889) (409, 430, 733). On doit à ce frère du
célèbre physiologiste Emile Du Bois-Reymond des contributions au calcul
intégral, au calcul des variations et à la théorie des séries de Fourier.
écriture canonique d’une forme (589, 595).
élasticité d’une fonction (161).
élément de surface simple (575). Cette notion peut se généraliser comme suit
à des dimensions quelconques. Soit W ⊂ Rn non vide. On appelle représen-
tation paramétrique vraie de W de classe C m , de dimension k, une application
Φ d’un ouvert O de Rk dans Rn de classe C m qui est un homéomorphisme de
O sur W (c’est-à-dire une bijection continue et d’inverse continu de O sur W )
tel que, pour chaque u ∈ O, le rang de Φ#u est égal à k. Cela étant, une partie
non vide V de Rn est appelée une sous-variété de classe C m et de dimension
k de Rn si, pour chaque a ∈ V , il existe un voisinage ouvert Ua de a dans Rn
tel que l’intersection Ua ∩ V admette une représentation paramétrique vraie,
de dimension k et de classe C m . Le théorème des fonctions implicites permet
alors de démontrer que pour que V ⊂ Rn soit une sous-variété de classe C m
et de dimension k de Rn , il faut et il suffit que, pour tout a ∈ V , il existe
un voisinage ouvert Ua de a dans Rn et une application F : Ua → Rn−k
de classe C m telle que le rang de Fx# soit égal à n − k pour tout x ∈ Ua ,
et telle que V ∩ Ua = F −1 (0). Dans ce cas, on dit que la sous-variété est
définie par des équations implicites. Par exemple, si f est une application
de classe C m d’un ouvert G ⊂ Rk dans Rn−k , alors le graphe de f est une
sous-variété de Rn de dimension k et de classe C m . Le théorème des fonctions
implicites permet de prouver que toute sous-variété de Rn de classe C m et de
dimension k est, localement, le graphe d’une telle fonction f. La notion de
variété différentiable de dimension k peut se définir d’une manière abstraite
sans qu’elle soit contenue dans Rn . Un important théorème démontré en 1936
par H. Whitney montre en fait que toute variété abstraite de dimension k
et de classe C m peut être considérée comme une sous-variété de dimension k
et de classe C m dans R2k+1 . L’étude locale et globale des variétés fait l’objet
de la géométrie différentielle et de la topologie différentielle.
H (intégrales et fonctions) (338). Les intégrales indéfinies de la for-

elliptiques
me √dx , où P est un polynôme de degré quatre (intégrales elliptiques),
P (x)
ne se ramènent pas en général à des fonctions algébriques ou transcendantes
élémentaires et Legendre (1825-26) réduit leur étude à celle de trois formes
normales. Un an plus tard, Jacobi et Abel ont l’idée de considérer les fonc-
tions réciproques (dites fonctions elliptiques) des intégrales elliptiques comme
763
fonctions d’une variable complexe, et ils montrent leur double périodicité. Des
cas particuliers avaient été obtenus (mais non publiés) par Gauss en 1796.
L’analogie avec les fonctions circulaires se révèle ainsi et les intégrales el-
liptiques sont aux fonctions elliptiques ce que les fonctions trigonométriques
inverses sont aux fonctions trigonométriques. Le développement de la théorie
des fonctions elliptiques occupera les mathématiciens jusqu’à la fin du XIXe
siècle, et de nouvelles applications voient continuellement le jour.
ensemble (1). Anticipée par Bolzano (1851), la première étude systématique

des ensembles est due à Cantor (1873-1897), motivée par de délicats
problèmes relatifs aux séries trigonométriques. Dedekind (1871) et Du
Bois-Reymond (1882) ont également contribué de manière significative à
la naissance de la théorie.
entier (naturel), (relatif ) (3, 12). Abordé par Grassmann, qui employa ex-
plicitement le principe d’induction, le problème de la définition axiomatique
des entiers naturels fut résolu par Frege (1884), Dedekind (1888) et Peano
(1891).
entière (fonction) (668). Les fonctions entières constituent une généralisation

des fonctions polynômiales sur C. Elles jouissent de propriétés remarquables,
analogues à celles des polynômes (par exemple leur expression comme pro-
duits infinis de monômes) mais aussi de propriétés différentes (comme le
théorème de la valeur lacunaire de Picard.) La théorie des fonctions entières
est une partie importante et développée de la théorie des fonctions d’une vari-
able complexe.
entière (série) (425). Voir “potentielle (série)”.
équation (171).
équation différentielle à variables séparées (376). La méthode pour leur in-

tégration fut communiquée par Leibniz à Huygens en 1691. Le nom et la
méthode générale sont dus à Jean Bernoulli (1694).
équation différentielle linéaire (288, 375). L’équation linéaire du premier or-

dre fut intégrée par Leibniz (1684) et Jean Bernoulli (1692). Des cas
particuliers d’équations différentielles linéaires à coefficients constants furent
résolus par Jean Bernoulli (1698), Euler (1739) et Daniel Bernoulli
(1739). Le premier traitement systématique du cas homogène est dû à Eu-
ler (1743). La réduction du cas non homogène au cas homogène et à la
connaissance d’une solution particulière est due à d’Alembert (1762-1765).
La notation symbolique L(D) est due à Lagrange (1766), Arbogast (1800)
et Cauchy (1827).
équipotent (10). La notion d’équipotence entre ensembles est due à Cantor

(1878), qui montra que R et Rn sont équipotents. Cantor (1877) af-
firma aussi que deux ensembles sont équipotents si chacun d’entre eux est
équipotent à une partie de l’autre, un résultat démontré par Dedekind
(1887), Schröder (1896) et F. Bernstein (1898).
équi-uniforme (continuité) (722). Notion introduite par Ascoli (1883).
équivalentes (normes) (23, 160).
escalier (fonction en) (713).
espace métrique (675). Voir “distance.”
essentiel (point singulier) (664). Casorati (1868), Sohotsky (1868) et Wei-

erstrass (1876) démontrèrent indépendamment que si f possède un point
singulier essentiel en a, alors, pour tout voisinage U de a, f(U \ {a}) est dense
dans C. Picard (1879) démontrera le résultat beaucoup plus précis suivant :
f(U \ {a}) est égal à C privé au plus d’un point (valeur lacunaire de Picard).
étoilé (ensemble) (627).
euclidienne (norme) (22).
Euler (condition nécessaire) (729). De nombreuses équations de toutes na-

tures peuvent s’écrire sous forme de la condition nécessaire d’Euler d’existence
d’un point critique d’une fonction réelle ϕ définie sur un certain espace
métrique. L’existence d’une solution de ces équations est donc équivalente
à celle d’un point critique de ϕ et, dans le cas le plus simple, à l’existence
d’un minimum (ou d’un maximum) absolu de ϕ. C’est ce que l’on appelle la
méthode directe du calcul des variations qui, après avoir été utilisée heuris-
tiquement par Dirichlet (1848) et Riemann (1857) en théorie du potentiel
et en théorie des fonctions d’une variable complexe, a été mise sur des bases
sûres par Hilbert (1900) (après des tentatives incomplètes mais intéressantes
d’Arzela (1889)) et systématisée par Tonelli (1922).
Euler (constante d’) (420). Découverte par Euler (1734), qui en calcule 16
décimales. Elle reste l’une des plus mystérieuses constantes de l’analyse.
Euler (équation différentielle d’) (315). Le travail d’Euler date de 1743,

mais la solution était déjà connue de Jean Bernoulli (1700).
Euler (formule d’) (108). Donnée par Euler (1755).
Euler (intégrales d’) (408, 413). La fonction Gamma fut introduite par Euler
(1729), la terminologie et la notation étant dues à Legendre (1814). La
fonction Beta fut déjà considérée par Wallis, Newton (1676) et Stirling
765
(1770). Les travaux d’Euler datent de 1770 et la notation B(p, q) est due à
Binet (1839).
Euler-Lagrange (équations d’) (734, 735). Obtenues par Euler (1744) par
une méthode d’approximation polygonale de la courbe cherchée et un passage
à la limite, ces équations seront obtenues plus simplement par Lagrange
(1762) par une méthode analytique.
Euler, Leonhard (1707-1783) (34, 38, 78, 108, 217, 315, 344, 356, 392,
408, 413, 420, 729, 734, 735). Mathématicien suisse, le plus prolifique de
l’histoire des mathématiques (la publication de ses oeuvres n’est pas encore
achevée !), malgré la cécité qui l’affligea à la fin de sa vie. Il fut au service de
Frédéric II de Prusse et de la Grande Catherine de Russie. Prodigieux algo-
riste, il a contribué à toutes les parties des mathématiques pures et appliquées.
Ses traités Introduction à l’analyse infinitésimale, Guide de calcul différentiel
et Guide de calcul intégral ont eu une importance fondamentale. Auteur du
premier ouvrage systématique de calcul des variations et de mécanique ra-
tionnelle et des Lettres à une princesse allemande, ouvrage de vulgarisation
scientifique où l’on trouve une surprenante anticipation des diagrammes de
Venn de la théorie naı̈ve des ensembles.
exacte (forme) (620). La notion apparaı̂t, pour les 1-formes, chez Euler (1739)
et Clairaut (1740) et puis, au XIXe siècle, chez Jacobi, Clebsch et
Frobenius.
exponentielle (fonction) (216, 217, 225). Pour un argument rationnel, elle est
connue depuis longtemps (Stifel (1544)). Newton (1669) et Leibniz (1676)
trouvent son développement en série. Jean Bernoulli (1694, 1697) est le
premier qui ait cherché à créer un calcul particulier pour ces puissances que
Leibniz proposa d’appeler exponentielles. Glaisher (1883) en donne la
première table. La dérivée de l’exponentielle est calculée par Leibniz (1694).
La formule adoptée ici pour définir l’exponentielle remonte sûrement à Eu-
ler (1748), mais Daniel Bernoulli (1728) la connaissait pour x = 1 et
probablement pour x quelconque.
exponentielle (série) (257, 427). On la trouve pour la première fois chez New-
ton (1669) et Leibniz (1674).
exponentielle complexe (fonction) (269). La formule exp ix = cos x + i sin x

est due à Euler (1743). Le mathématicien belge Mansion insista sur
l’intérêt méthodologique de la définition de l’exponentielle complexe adoptée
ici.
exponentielle imaginaire (fonction) (268).
exponentielle-polynôme (295).
extrémant, extrémum (142). Voir aussi “libre”, “lié”.
face d’un simplexe (610).
faible (extrémant local) (731). La notion d’extrémant local faible ou fort fut
introduite par Weierstrass (1879). La terminologie est due à Kneser
(1900).
famille (9).
Fatou (lemme de) (523). Il est dû à Fatou (1906).
Fatou, Pierre (1878-1929) (523). Mathématicien français. Ses travaux ont

rapproché la théorie des fonctions d’une variable réelle et d’une variable com-
plexe.
Fermat (théorème de) (143). Kepler (1615), qui établit des tables donnant le
volume de tonneaux en fonction de leur dimension, observa qu’à l’approche
du volume maximum, le changement de volume pour un changement donné
de dimension diminuait, un fait déjà observé précédemment par Oresme
au XIVe siècle pour l’ordonnée maximum d’un demi-cercle. En 1636, Fer-
mat détermina les extrema de polynômes par une méthode équivalente à la
recherche des zéros de la dérivée (non encore définie à l’époque !). L’emploi
explicite de la dérivée dans ces problèmes est dû à Leibniz (1684) et une
définie claire d’extrémant apparaı̂t chez Cauchy (1821). La généralisation
du résultat de Fermat au cas de fonctions de deux variables est due à Euler
(1755).
Fermat, Pierre de (1601-1665) (143, 163). Juriste français, conseiller du roi

au Parlement de Toulouse, on l’a justement appelé le prince des amateurs
en mathématiques. Il a créé, indépendamment de Descartes, la géométrie
analytique, anticipé le calcul différentiel et intégral et enrichi l’optique et la
théorie des nombres. Sa conjecture (il n’existe pas de solutions en nombres
entiers de l’équation xn + yn = z n lorsque l’entier n ≥ 3) n’est toujours pas
démontrée pour toutes les valeurs de n, même si l’on sait aujourd’hui, grâce
à Faltings, que, pour chaque n ≥ 3, l’ensemble des solutions est fini.
fermé (ensemble) (126, 129, 703). Notion due à Cantor (1879).
fermée (forme différentielle) (621). Notion déjà utilisée par Clairaut (1739-
1740) pour les 1-formes. Dès 1768, d’Alembert donna l’exemple (x dy −
y dx)/(x2 + y2 ) pour distinguer une forme exacte d’une forme fermée. Poin-
caré (1887) et Volterra (1889) obtinrent les conditions pour d’une 2-
forme, et plus généralement une k-forme soit fermée sans utiliser explicitement
la différentielle extérieure (non encore définie), qui devra attendre les travaux
d’Elie Cartan (1899). La terminologie est due à de Rham.
767
Feynman Richard P. (1918-1988) (318). Physicien américain, spécialiste de

la théorique quantique des champs et auteur d’un remarquable Cours de
Physique.
Fibonacci (suite de) (75). Introduite par Fibonacci (1202) pour déterminer le
nombre de couples de lapins produits par un couple
√
de lapins
√
en une année.
(1+ 5)n+1 −(1− 5)n+1
Binet a obtenu la formule explicite un = √
2n+1 5
pour les ter-
mes de la suite.
Fibonacci, Leonardo da Pisa, dit (1170?-1250?) (75). Après s’être impré-
gné, au cours de ses voyages, des mathématiques byzantines et arabes, ce
Pisan écrit son ouvrage principal, le Liber Abaci, traitant d’arithmétique et
d’algèbre.
fine (P-partition) (119). Notion due à Kurzweil (1957) et Henstock (1960).
La terminologie est due à McShane (1973).
fini (ensemble, ensemble localement) (10, 113).
Fischer-Riesz (théorème de) (694, 695). Dû, indépendamment, à Fischer
(1907) et F. Riesz (1907, 1910).
Fischer, Ernst (1875-1954) (695). Mathématicien d’origine autrichienne. Un
des pionniers de l’analyse fonctionnelle.
flux (582, 583, 619).
fonction (7). Le mot fonction apparaı̂t chez Leibniz (1692). Le concept général
s’est progressivement développé, grâce surtout à Jean Bernoulli (1698),
Euler (1748) (qui introduit la notation f(x)), Condorcet (1778), Lacroix
(1797), Fourier (1821), Lobatchevsky (1834) et Dirichlet (1837).
fonction composée (7).
fonction définie par une intégrale (528). Leurs propriétés ont été étudiées par
Lebesgue (1909) et Tonelli (1910)
fonction réciproque (8).
fonctionnel (graphe) (7). La définition d’une fonction en terme de graphe ou
relation est due à Peano (1911).
fonctions implicites (théorème des) (178, 181). Le mathématicien liégeois
Sluse (1672) donna le premier la formule de la dérivée d’une fonction im-
plicite lorsque la relation qui la définit est polynômiale. Pour une relation
de classe C 1 , l’existence locale de la fonction implicite fut démontrée par
Cauchy (1839). Les conditions d’existence dans les cas plus généraux furent
précisées par Genocchi (1884) et Jordan (1893). La démonstration donnée
ici est due à Goursat (1903).
Fontenelle, Bernard le Bouvier de (1657-1757) (37). Homme de sciences et

philosophe français, surtout connu par ses Eloges académiques.
forme différentielle (595). Notion introduite par Poincaré (1887, 1892, 1895)
dans ses recherches sur les fonctions de deux variables complexes, les invari-
ants intégraux et la topologie algébrique, comme expression figurant sous le
signe intégrale, et, plus formellement, par Elie Cartan (1899) qui observe
que la structure algébrique sous-jacente à ces expressions est celle de l’algèbre
extérieure de Grassmann (1844, 1861). D’où le nom de formes différentielles
extérieures qu’il leur donne (1922). La définition actuelle semble publiée pour
la première fois chez Chevalley (1946).
forme extérieure (587). Notion introduite par Grassmann (1844, 1861). Elle
équivaut à celle de tenseur antisymétrique.
forme extérieure élémentaire (586), fondamentale (587).
forme normale (d’un système différentiel) (310, 313).
fort (extrémant local) (731). Notion introduite par Weierstrass (1879). La

terminologie et due à Kneser (1900).
fortement dérivable (fonction) (161). Notions introduite pour une variable

par Peano (1892) et pour plusieurs variables par Leach (1961).
fortement monotone (application) (739).
Fourier (coefficients de) (520). Des cas particuliers des formules donnant ces
coefficients sont obtenus par d’Alembert (1749), Clairaut (1757), Euler
(1748), Gauss (1810). Le cas général est obtenu par Fourier (1807, 1811).
Fourier (série de) (520). Le problème de la représentation d’une fonction par

une série trigonométrique fut posé par Euler (1730) et traité systémati-
quement, pour la première fois, par Fourier (1807). Ce problème et les
difficultés qu’il souleva sont à la base de théories mathématiques fondamen-
tales (intégrales de Riemann et de Lebesgue, théorie des ensembles, analyse
fonctionnelle). Sa généralisation constitue l’analyse harmonique qui étend
les notions de séries et d’intégrales de Fourier à des groupes commutatifs
localement compacts.
Fourier (transformée de) (527). Introduite par Fourier (1822) et développée

par Cauchy (1827). Elle joue un grand rôle dans l’étude des équations aux
dérivées partielles et dans la théorie du signal.
Fourier, Jean-Baptiste-Joseph (1768-1830) (35, 520, 527). Mathématicien

et physicien mathématicien français. Après des travaux sur les équations
algébriques, il prit part, avec Napoléon, à la campagne d’Egypte, où il fut
769
secrétaire perpétuel de l’Institut d’Egypte. Persuadé que la chaleur du désert

était idéale pour la santé, il vécut en permanence, après son retour en France,
dans une atmosphère surchauffée. Faut-il s’étonner qu’il se consacra alors à
la théorie mathématique de la chaleur. Sa Théorie analytique de la chaleur
est un classique de la physique mathématique.
fractal (ensemble) (453). Terminologie inventée par B. Mandelbrot pour dé-

signer les ensembles de dimension de Hausdorff non entière.
Fraenkel, Abraham (1891-1965) (2). Mathématicien allemand. L’un des au-

teurs d’une axiomatique de la théorie des ensembles.
Fréchet-Young (théorème de) (105). Obtenu indépendamment par Fréchet

(1919) et Grace C. Young. La partie nécessaire était connue de Cauchy.
Fréchet, Maurice (1878-1973) (105, 526). Mathématicien français. L’un des

fondateurs de l’analyse fonctionnelle et de la théorie des espaces abstraits.
Fresnel (intégrales de) (414). Etudiées en 1743 et 1781 par Euler et utilisées
par Fresnel (1818) dans ses études sur la diffraction de la lumière.
Fresnel, Augustin (1788-1827) (414). Physicien mathématicien français qui a

développé la théorie ondulatoire de la lumière.
Frobenius, Georg (1849-1917) (27). Mathématicien allemand, spécialiste de la

théorie des groupes et de leurs représentations.
frontière (32, 685). Notion introduite par Weierstrass (1861), Dedekind

(1871), Peano (1887) et Jordan (1893).
Fubini (théorème de) (535, 543, 544). Des premiers résultats de ce type sont
dus à Euler (1770), Cauchy (1827), Thomae (1878), Du Bois-Reymond
(1883) et Arzela (1891). Jordan (1892) en donne la formulation définitive
pour l’intégrale de Riemann. Le cas des intégrales de Riemann généralisées est
traité par de La Vallée Poussin (1892, 1899) et Hobson (1906). En 1902,
Lebesgue obtient un théorème de ce type pour son intégrale. B. Levi (1906)
énonce un résultat meilleur qui est, indépendamment, énoncé et démontré
(quoique non correctement) par Fubini (1907). de La Vallée Poussin
(1910) montre que, pour les fonctions bornées, le résultat de Fubini peut se
déduire de celui de Lebesgue, ce qui fournit une démonstration correcte. Pour
les fonctions intégrables, le résultat donné ici et sa démonstration sont dus à
Kurzweil (1973).
Fubini, Guido (1879-1943) (535, 543, 544). Mathématicien italien, qui

émigra aux USA en 1939. Outre ses contributions au calcul intégral, on
lui doit d’importants résultats en géométrie différentielle et en théorie des
fonctions automorphes.
Gauss (formule de) (390).
Gauss-Ostrogradsky (formule de) (619). Etablie dans un cas particulier par

Gauss (1813) et dans le cas général par Ostrogradsky (1828, 1834).
Gauss, Carl-Friedrich (1777-1855) (38, 78, 390, 439, 461, 619, 672). Ma-
thématicien, physicien et astronome allemand, l’un des géants de l’histoire
des mathématiques. Ses contributions vont de la théorie des nombres au
télégraphe électrique, en passant par l’algèbre, l’analyse, la géométrie, la
statistique, l’optique, l’électromagnétisme, la géodésie et la mécanique céleste.
Son journal scientifique couvrant la période de 1796 à 1814 montre qu’il fut
loin de publier l’entièreté de ses découvertes.
générique (propriété) (708). L’étude des propriétés génériques a pris, ces derni-
ères années, un grande importance, en particulier dans la théorie des systèmes
dynamiques.
géodésiques (problème des) (728). Le problème des géodésiques sur une sur-
face fut posé par Jacques Bernoulli (1697), à qui l’on doit la terminologie.
géométrique (série) (250). De telles séries, en langage géométrique, apparais-

sent déjà chez Archimède dans son calcul de l’aire de la parabole. Leur
somme est déterminée par Viète (1593), le mathématicien brugeois de
Saint-Vincent (1622) et le mathématicien anversois Tacquet (1656).
globale (propriété) (113). Le passage d’une propriété locale à une propriété

globale, et l’étude des obstructions correspondantes, est à la base de pro-
fondes théories mathématiques, comme, par exemple, la théorie des faisceaux
de Leray (1950).
Goursat, Edouard (1858-1936) (174, 198, 642). On doit à ce mathématicien

français un Cours d’analyse mathématique très populaire pendant plus d’un
demi-siècle.
gradient (94, 596). Notion introduite par Hamilton (1847). Le nom est dû à
Riemann (1851).
graphe, graphe réciproque (5).
Green (formule de) (636). Etablie par Green (1828) dans un ouvrage publié à
compte d’auteur, elle est fondamentale en théorie du potentiel.
Green-Riemann (formule de) (617). Etablie par Lagrange (1760), Euler

(1771-72), Gauss (1813) et Green (1828), elle fut mise par Riemann (1851)
à la base de sa théorie des fonctions complexes.
771
Green, George (1793-1841) (617, 636). Cet anglais autodidacte (il était meu-
nier) a apporté des contributions fondamentales à la théorie mathématique
de l’électromagnétisme.
Gronwall (lemme de) (342). Isolé comme résultat indépendant par Bellman
(1943), il remonte à Peano (1892) et Gronwall (1918).
Gronwall, Thomas-Hakon (1877-1932) (342). Né en Suède, mort aux U.S.A.

Travaux en analyse classique, fonctions complexes et physique mathématique.
Hadamard, Jacques (1865-1963) (436, 440, 568). Mathématicien français à

qui l’on doit la démonstration du théorème des nombres premiers et des con-
tributions importantes à la théorie des fonctions, des équations différentielles
(en particulier à la théorie du chaos), des équations aux dérivées partielles
(problèmes bien posés, solutions fondamentales) et à la naissance de l’analyse
fonctionnelle. Son Cours d’analyse a un contenu très riche.
Hake (théorème de) (396, 399, 405, 493). Enoncé et démontré par Hake
(1921) à partir de la définition de Perron, il constitue un pas décisif dans
la démonstration de l’équivalence entre la définition de Denjoy et celle de
Perron. Ce théorème n’est pas valable pour l’intégrale de Riemann ou de
Lebesgue et, depuis Cauchy (1823), la limite apparaissant dans le théorème
est prise comme définition de l’intégrale généralisée, impropre ou fléchée, qui,
au sens de Denjoy-Perron, sont de vraies intégrales.
Hake, Heinrich (396, 399, 405, 493). Mathématicien allemand, élève de Hahn.
Hamilton (équations de) (738). Introduites, à des degrés de généralité divers,

par Poisson (1809), Lagrange (1809), Pfaff (1814-15), Cauchy (1819)
et Hamilton (1835).
Hamilton (principe de) (737). Introduit par Hamilton (1834, 1835), il con-
stitue l’une des formes du principe de moindre action en mécanique.
Hamilton, William (1788-1856) (737, 738). Mathématicien irlandais. Enfant

prodige, il est l’auteur d’une importante généralisation des nombres complexes
(les quaternions) et il grava, lors de leur découverte, les formules fondamen-
tales i2 = j 2 = k 2 = ijk = −1 sur le parapet du Brougham Bridge de
Dublin. Ses contributions essentielles à la mécanique analytique et à l’optique
mathématique seront cruciales pour la genèse de la mécanique ondulatoire.
Il eut un goût prononcé pour la versification et pour l’alcool.
Hankel, Hermann (1839-1873) (36). Mathématicien et historien des mathé-

matiques allemand. A côté de travaux sur les fondements de l’analyse, il
a introduit une classe de fonctions spéciales qui portent son nom.
Hardy, Godefrey Harold (1877-1947) (453). Mathématicien anglais, passi-

onné de cricket. On lui doit une série d’ouvrages remarquables (en particulier
un Course in pure mathematics) et la “découverte” du mathématicien indien
Ramanujan.
harmonique (série) (252, 419, 432). Sa divergence fut démontrée par Oresme
(1350) et puis par Mengoli (1650). Jacques Bernoulli (1689) en donna
deux démonstrations, dont l’une attribuée à son frère Jean.
harmonique alternée (série) (253). Elle fut étudiée pour la première fois par
Mengoli (1648) qui en calcula la somme.
Hausdorff, Felix (1868-1942) (453). Mathématicien allemand. L’un des fon-
dateurs de la topologie générale qui étend l’étude des applications continues
à des espaces plus généraux que les espaces métriques. On lui doit aussi une
notion de mesure et de dimension qui joue un grand rôle dans l’étude des en-
sembles fractals. A publié, dans sa jeunesse, des poèmes sous le pseudonyme
de Paul Mongré. Il se suicida pour échapper aux Nazis.
Heine (théorème de) (133, 726). Enoncé et démontré, pour un intervalle de
R, par Dirichlet (1854) et Heine (1872), il fut étendu aux fonctions d’un
compact de Rn dans R par Lüroth (1873).
Heine, Heinrich (1821-1881) (133, 162, 726). Mathématicien allemand, au-
teur d’un important traité sur les fonctions sphériques.
Henstock, Ralph (né en 1923) (349, 356, 379). Mathématicien britannique,
spécialiste de la théorie de l’intégration et de l’analyse fonctionnelle.
Hermite (équation différentielle et polynôme d’) (458, 459). Introduits
par Hermite (1864).
Hermite, Charles (1822-1901) (217, 286, 458, 459, 482). Mathématicien
français, beau-frère de Bertrand et beau-père de Picard. On lui doit des
contributions importantes en théorie des fonctions elliptiques, en théorie ana-
lytique des nombres et en algèbre. Il prouva en particulier la transcendance
de e et la possibilité de résoudre l’équation algébrique du cinquième degré
par les fonctions elliptiques.
Héron (algorithme de) (231). Dû à Héron d’Alexandrie (vers 75).
Héron d’Alexandrie (231). Mathématicien et mécanicien grec de l’Antiquité,

dont on sait seulement qu’il a vécu dans la période allant de 150 ans av. J.C.
à l’an 250 de notre ère ! On lui doit la formule de l’aire d’un triangle en
fonction de la longueur des côtés et du demi-périmètre.
Hessenberg, Gerhard (1874-1925) (34). Mathématicien allemand, spécialiste
des fondements de la géométrie.
773
Hilbert (espace de) (692). Après l’introduction des exemples “concrets” l2

(Hilbert (1906)) et L2 (Fischer, F. Riesz (1907)), les espaces de Hilbert
généraux furent définis par von Neumann (1929).
Hilbert, David (1862-1943) (692). Mathématicien allemand, défenseur de la

méthode axiomatique en mathématique, il a contribué de manière es-
sentielle à presque toutes les branches des mathématiques. Il dirigea à
Göttingen une brillante école mathématique. Les vingt-trois problèmes de
mathématiques qu’il énonça à Paris en 1900 lors du 2e Congrès international
des mathématiciens ne sont pas tous résolus à ce jour.
Hodge, William V.D. (1903-1975) (592). Mathématicien écossais. Créa la

théorie des formes harmoniques, qu’il appliqua avec bonheur à la géométrie
algébrique. Son ouvrage The theory and applications of harmonic integrals
est l’un des classiques de ce siècle.
holomorphe (fonction) (646). Elles furent définies par Cauchy (1851) qui les
appela synectiques. La terminologie actuelle est due à Briot et Bouquet
(1875). Goursat (1900) a démontré que toute fonction complexe C-dérivable
sur un ouvert y est holomorphe. La théorie des fonctions holomorphes de
plusieurs variables complexes est loin d’être une extension facile du cas d’une
variable. Elle requiert l’emploi de techniques délicates d’algèbre, de topologie,
d’analyse et de géométrie algébrique. En particulier, elle fait un usage abon-
dant de la théorie des formes différentielles. Elle a d’importantes applications
à la théorie quantique des champs.
homogène (équation différentielle linéaire) (288). Lagrange (1765) mon-

tra que la solution peut s’écrire comme combinaison linéaire d’un nombre
fini de solutions particulières.
homogène (fonction) (108).
homotopes (cycles) (622). Notion introduite par Jordan (1866) et développée

par Poincaré (1895). Le concept d’homotopie remonte certainement à la no-
tion de “déformation de courbes” dans le calcul des variations de Lagrange
et sera utilisé intuitivement durant tout le XIXe siècle. C’est Brouwer
(1911) qui donnera la première définition générale et précise d’homotopie en-
tre deux applications continues f : X → Y, g : X → Y, comme application
continue F : X × [0, 1] → Y telle que F (., 0) = f et F (., 1) = g. La théorie de
l’homotopie est une partie importante de la topologie algébrique.
hyperboliques (fonctions) (314). Introduites par Riccati (1757). Les abré-

viations sh, ch, th (ou sinh, cosh, tgh) sont dues à Lambert (1761). Les
premières tables de ces fonctions furent dressées par Ligovsky (1890). Le
graphe de ch x s’appelle la chaı̂nette (Huygens (1646), Leibniz (1691)), à qui
l’on doit le terme. Cette courbe fut étudiée par Jacques et Jean Bernoulli.
hyperelliptiques (intégrales) (338). Abordé par Abel, le problème de leur in-

version fut considéré par Jacobi (1832-1835).
hypergéométrique (équation) (461). On la trouve chez Euler (1778) et elle

est étudiée en détail par Gauss (1813).
hypergéométrique (série) (456, 461), (fonction) (456). Le mot “hypergéo-

métrique” apparaı̂t chez Wallis (1655) pour désigner une classe de séries
non géométriques. La série hypergéométrique elle-même fut mentionnée pour
la première fois par Euler (1778). Sa convergence ne fut étudiée qu’en 1812
par Gauss dans le cas d’une variable réelle et par Weierstrass (1842-43)
dans le cas d’une variable complexe. C’est Riemann (1856) qui commença
l’étude globale de la fonction hypergéométrique.
hypergeométrique confluente (fonction) (460). Introduite et étudiée par

Kummer (1836).
hypothèse du continu (17). Formulée par Cantor (1884). On sait depuis Co-
hen (1962) qu’elle est indédicable dans ZFC.
image et image réciproque (d’un graphe ou d’une fonction) (5, 6, 7).

Notions dues à Dedekind (1888).
implicite (fonction) (177).
indéfinie (intégrale) (371, 372). Les résultats donnés sont dus, lorsque f est
continue, à Cauchy (1823) qui, le premier, démontra l’existence de la prim-
itive d’une fonction continue. La notion même d’intégrale indéfinie remonte
à Newton (1669) et Leibniz (1675).
indivergentiel ou solénoı̈dal (champ) (626).
induction (3). Le plus ancien emploi de l’induction mathématique semble dû à

Maurolycus dans son étude des nombres polygonaux (1575). Pascal con-
naissait ce travail et utilisa la méthode d’induction dans son étude des co-
efficients du binôme vers 1657. Le terme d’induction mathématique distinct
de l’induction scientifique est dû à De Morgan (1838). Poincaré a beau-
coup insisté sur le rôle de l’induction mathématique dans ses écrits sur la
philosophie de la science publiés au début du siècle.
induite (distance, norme) (677, 678).
infimum (d’un ensemble) (203). Notion introduite par Gauss (1800).
infimum (d’une application) (207, 208).
infimum (théorème de l’) (203).

775
infini (ensemble) (2, 10). C’est Bolzano (1851) qui attira l’attention sur la
propriété d’un ensemble infini d’être équipotent à l’une de ses parties pro-
pres. Cantor (1878) refit la même observation et Dedekind (1888) l’utilisa
comme définition d’un ensemble infini.
infinie (limite) (66,165). Le symbole ∞ est dû à Wallis (1655). La définition

est due à Cauchy (1821).
inflexion (point d’) (145).
injectif (graphe), injection (8, 221). Notion due à Dedekind (1888).
intégrable (ensemble) (487, 511). Voir “mesurable (ensemble)”.
intégrale au sens de Denjoy-Perron ou intégrale (349, 350, 400,H 401). Le

mot intégrale apparaı̂t chez Jacques Bernoulli (1690), le signe apparaı̂t
Hb
chez Leibniz (1675) et la notation a f(x) dx chez Fourier (1822). Denjoy
(1912) a introduit son intégrale à partir de celle de Lebesgue par un délicat
procédé de passage à la limite. Perron (1914) a introduit son intégrale
par une méthode basée sur le concept de fonction majorante et de fonction
minorante introduites par de La Vallée-Poussin (1909) dans le cadre de
la théorie de Lebesgue, et qui généralisent la notion de primitive. Il fau-
dra attendre les travaux de Hake (1921), Alexandrov (1924) et Looman
(1925) pour montrer l’équivalence des intégrales de Denjoy et de Perron. La
définition adoptée ici est due à Kurzweil (1957), qui montra son équivalence
avec l’intégrale de Perron, et, indépendamment, à Henstock (1961, 1963),
qui l’étendit aux fonctions de plusieurs variables.
intégrale au sens de Lebesgue ou L-intégrale (385). Lebesgue (1902) a in-

troduit ce type de fonctions intégrables (qu’il appelle sommables) par une
méthode différente de celle adoptée ici, basée sur une définition préalable de
la mesure des ensembles de R et sur une partition de l’ensemble des ordonnées
de la fonction intégrée. D’autres approches furent proposées indépendamment
(Vitali (1904), W.H. Young (1904)) et par la suite (W.H. Young (1910,
1912), F. Riesz (1912), Pierpont (1912), Radon (1913), Daniell (1919),
Denjoy (1919), etc.). de La Vallée Poussin l’introduit en 1909 dans son
cours d’analyse de l’Université de Louvain. Lebesgue (1909) observa qu’une
fonction L-intégrable pouvait s’obtenir comme limite d’une certaine suite de
sommes de Riemann, mais n’étudia pas le problème inverse. La définition
donnée ici est due à Henstock (1963) qui prouva son équivalence avec celle
de Lebesgue.
intégrale au sens de Perron-Stieltjes (388). Introduite, dans un cas particu-

lier, par Stieltjes (1894). Le cas général fut considéré par Jeffery (1932),
Ridder (1935) et Ward (1936) en utilisant l’approche de Perron, et, par
la méthode utilisée ici, par Kurzweil (1957).
intégrale au sens de Riemann ou R-intégrale (352). Riemann (1854) in-

troduit essentiellement la définition donnée ici, en s’inspirant de la tenta-
tive de Cauchy (1823) pour donner un fondement rigoureux à la notion
d’intégrale d’une fonction continue. C’est Darboux (1875) qui donnera
la première démonstration vraiment complète de la R-intégrabilité de ces
fonctions. Cauchy aurait été précédé par Gregory, qui aurait donné
une démonstration équivalant à la R-intégrabilité d’une fonction monotone.
L’extension aux fonctions de deux variables est due à Thomae (1876).
intégrale au sens de Riemann-Stieltjes (389). Considérée pour la première

fois par Stieltjes (1894) dans le cas particulier où n = 1, f est continue
et la mesure s’obtient par différence des valeurs d’une fonction croissante aux
extrémités de l’intervalle.
intégrale d’une fonction définie p.p. (505).
intégrale d’une forme sur un simplexe (606) ou une chaı̂ne (609). On la

trouve chez Poincaré (1887, 1895, 1899).
intégrale généralisée ou impropre (396). Introduites par Cauchy (1823).
intégrale paramétrique (528). Voir “Fonction définie par une intégrale”.
intégrale première (377, 736).
intégrale sur un arc de courbe (571, 644).
intégrale sur un borné (486).
intégrale sur un élément de surface (576).
intégrale sur un intervalle (399, 400, 401, 405, 411, 412, 415).
intégrale sur un ensemble non borné (508).
intérieur (27, 129, 685). Notion introduite par Peano (1887) et Jordan (1893)
dans Rn et par Hausdorff (1914) en général.
intérieure (théorème de l’application) (188). Ce théorème entraı̂ne que l’i-

mage d’un ouvert de Rn par une application de Rn dans Rn classe C 1 dont la
dérivée totale est partout inversible est un ouvert. Brouwer (1911) a étendu
ce résultat aux applications continues injectives et en a déduit l’invariance
topologique de la dimension.
intervalle (14, 126, 127, 205).
intervalles fermés emboı̂tés (théorème des) (14). L’argument apparaı̂t déjà

chez Bolzano (1817).
777
interversion des dérivées partielles (théorème d’) (276). D’abord “démon-

trée” par Nicolas II Bernoulli (1721) et envisagée comme évidente par Nico-
las Bernoulli (1743). Pour Euler (1734) et Cauchy (1829), elle résulte
∆( ∆u ) 2 ∆( ∆u )
de la symétrie en ∆x et ∆y de l’expression ∆x ∆y
= ∆x∆y
∆ u
= ∆y ∆x
. C’est
probablement Blanchet (1841) qui, le premier, s’est rendu compte de la
difficulté, suivi par L. Lindelöf (1867) et Genocchi (1869). Sous la forme
donnée ici, le résultat et dû à Weierstrass (1861).
√
irrationnel (nombre) (217). L’irrationnalité de 2 fut découverte par Pytha-
gore vers 500 avant J.C.
irrotationnel (champ) (626).
isolé (point) (70, 688).
itération (172). La possibilité de calculer par itération une racine d’une équation
fut vraisemblablement aperçue et utilisée par les Arabes aux alentours de
l’an 900, à l’occasion de la résolution de l’équation du troisième degré qui a
pour racine sin 1◦ . On cite à ce sujet Kusta Ibn Luka. Vers l’an 1000, la
méthode par itération fut employée par Al Biruni pour résoudre l’équation
de la trisection de l’angle, qui est du troisième degré. Fibonacci appprit
cette méthode des Arabes et sut en 1225, dans un tournoi mathématique,
déterminer avec 9 décimales exactes la racine de l’équation x3 +2x2 +10x = 20.
En 1303, le chinois Chu Chi Ki résolut l’équation x3 + x = 1 par itération.
Les méthodes utilisées par Viète (1600) et Newton (1685) sont des mé-
thodes d’itération. Fourier (1822) utilise l’itération pour étudier l’équation
x = λ tg x.
Jacobi (identité de) (283). Analogue à l’identité de Jacobi (1842) en mécani-

que.
Jacobi, Carl Gustav (1804-1851) (100, 283). Mathématicien allemand, l’un

des créateurs de la théorie des fonctions elliptiques, qu’il appliqua à la théorie
des nombres. Il était également philologue et habile musicien. Son frère est
l’inventeur de la galvanoplastie.
jacobien (déterminant), jacobienne (matrice) (100). Introduits par Jacobi

(1833) dans ses études sur la formule de changement de variables dans une
intégrale multiple. Le mot jacobien est dû à Sylvester.
jauge (114, 717). Terminologie due à McShane (1973).
Jensen, Johann L.W.V. (1859-1925) (232). Mathématicien danois autodi-

dacte, spécialiste des fonctions holomorphes et des fonctions convexes.
Kepler (équation de) (176). Sa résolution numérique fut déjà considérée au X e

siècle par al-Khwarizmi. Etudiée par Lagrange (1771), Carlini (1817)
et Bessel.
Kepler, Johannes (1571-1630) (143, 176). Astronome et mathématicien alle-

mand. A côté de ses découvertes des lois du mouvement des planètes, on
lui doit des contributions mathématiques à la détermination des volumes de
solides curvilignes (à l’occasion du problème de jaugeage des tonneaux de
vin) et à la théorie des logarithmes.
Kolmogorov, Andrej N. (1903-1987) (520). Mathématicien russe. Il a con-

tribué à de nombreux aspects des mathématiques; en particulier, il a créé
la théorie axiomatique du calcul des probabilités et développé une méthode
nouvelle d’étude de la stabilité des mouvements de systèmes hamiltoniens.
Kummer (critère de convergence de) (434). Dû à Kummer (1835).
Kummer, Ernst Eduard (1810-1893) (434, 460). Mathématicien allemand.

A démontré la conjecture de Fermat pour une grande classe d’exposants et,
ce faisant, créé la théorie des idéaux. Il s’occupa aussi de la théorie de la
réfraction et de balistique.
Kurzweil, Jaroslav (né en 1926) (349, 356, 567).

Mathématicien tchèque, spécialiste de la théorie des équations différentielles
ordinaires qui l’ont conduit à sa définition de l’intégrale de Perron par les
sommes de Riemann.
Lacroix, Sylvestre (1765-1843) (35). Mathématicien français, surtout connu

pour ses ouvrages didactiques de mathématiques et en particulier par son
influent Traité du calcul différentiel et du calcul intégral en trois volumes.
Lagrange (équations de) (737). Dues à Lagrange, qui les mit à la base de sa
Mécanique analytique (1788).
Lagrange (fonction et multiplicateurs de) (191, 193). Introduits par Eu-

ler (1744) et développés par Lagrange (1797).
Lagrange (identité de) (21, 565).
Lagrange (reste du développement de Taylor de) (244). On le trouve chez

Lagrange (1797) avec la formule intégrale de ce reste.
Lagrange (théorème de la moyenne de) (151). On le trouve chez Lagran-

ge (1772) et, sous sa forme actuelle, chez Cauchy (1821). Première
démonstration rigoureuse par Schwarz (1870), probablement inspirée par
le cours de Weierstrass (1861) et reprise par Dini (1878).
779
Lagrange, Joseph Louis (1736-1813) (21, 34, 79, 151, 191, 193, 244, 285,
565, 734, 735, 737). Mathématicien français d’origine italienne. Célèbre
pour son approche analytique du calcul des variations et sa Mécanique ana-
lytique, que Hamilton qualifiera de poème scientifique, il a contribué à la
théorie des nombres, l’algèbre, l’analyse et à la mécanique céleste. Pendant
la révolution française, il contribua au perfectionnement du système métrique
des poids et mesures et fut le premier professeur de mathématiques à l’Ecole
polytechnique.
lagrangien (737). Lagrange (1773).
Lambert, Johann H. (1728-1777) (217). Mathématicien et astronome alle-

mand. Il a prouvé l’irrationnalité de e et de π et a créé la photométrie.
Landau, Edmund (1877-1938) (164). Mathématicien allemand, spécialiste en

théorie analytique des nombres et en théorie des fonctions d’une variable
complexe.
Laplace (équation de) (284, 563). Elle apparaı̂t pour la première fois chez Eu-
ler (1752) dans ses travaux d’hydrodynamique. On la retrouve chez La-
grange (1762), chez Laplace en coordonnées polaires (1785) et puis en
coordonnées cartésiennes (1789).
Laplace (transformée de) (528). Déjà utilisée par Euler (1737), pour trouver
les solutions d’équations différentielles, et systématisée par Laplace (1812).
Laplace, Pierre Simon de (1749-1827) (283, 284, 319, 528, 563, 600,
636). Mathématicien et astronome français, auteur de l’immortel Traité
de Mécanique céleste et de travaux de calcul des probabilités. Membre
de l’Académie royale sous Louis XVI, professeur à l’Ecole Normale sous la
république, ministre de l’intérieur et comte sous Napoléon, il sera marquis et
Pair de France sous Louis XVIII.
laplacien (284, 600, 636). Il se rencontre déjà chez Euler (1752) mais a été
systématiquement étudié par Laplace. Le nom est dû à Maxwell (1873)
et la notation ∆ à Murphy (1833).
Laurent (développement et théorème de) (659, 662, 663). Dû à Laurent,

présenté à l’académie par Cauchy en 1843, et publié de manière posthume
en 1863. Connu de Weierstrass (1841) mais non publié.
Laurent, Pierre Alphonse (1813-1854) (659, 662, 663). Officier français. Il

a contribué à la théorie des fonctions d’une variable complexe et au calcul
des variations, mais aussi à la construction du port du Havre.
Lebesgue (théorèmes de convergence de) (474, 477, 479, 505, 511).

Lebesgue, Henri (1875-1941) (232, 385, 393, 451, 474, 477, 479, 482, 505,
511, 525, 566, 717). Mathématicien français. Outre l’intégrale qui porte
son nom, Lebesgue a contribué au calcul des variations et à la théorie des
séries de Fourier.
Legendre (transformée de) (634). Introduite par Legendre (1787). Généra-

lisée aux fonctions convexes par Fenchel (1949), elle joue un grand rôle en
analyse convexe moderne.
Legendre, Adrien-Marie (1752-1833) (634). Mathématicien français. Spéci-

aliste de la théorie des nombres, de la théorie des intégrales elliptiques et de
la théorie du potentiel. Auteur d’Eléments de géométrie très populaires.
Leibniz (formule de) (234). Donnée par Leibniz (1678).
Leibniz (règle de) (531). Enoncée formellement par Leibniz (1697). Sa jus-
tification fera l’objet de nombreux travaux dans les différentes théories de
l’intégration.
Leibniz, Gottfried Wilhelm (1646-1716) (37, 38, 234, 341, 344, 531). Ma-
thématicien, philosophe, historien, théologien, juriste et diplomate allemand.
Il rêva d’une caractéristique universelle et d’une fusion des églises protestantes
et catholique. Un des créateurs du calcul différentiel et intégral. La querelle
de priorité correspondante avec Newton est célèbre.
Leray, Jean (1906-1998) (320). Mathématicien français. Auteur de travaux

fondamentaux en analyse non linéaire, hydrodynamique, équations aux
dérivées partielles, topologie algébrique, fonctions de plusieurs variables com-
plexes.
Levi (théorème de convergence monotone de) (466, 470, 471, 508, 510).
Enoncé et démontré, pour l’intégrale de Lebesgue, par B. Levi (1906). La
démonstration donnée ici, valable pour l’intégrale de Denjoy-Perron, est due
à Henstock (1968).
Levi, Beppo (1875-1961) (466, 470, 471, 508, 510). Mathématicien italien,
il émigra en Argentine. Il a contribué à l’analyse et à la géométrie algébrique.
L’Hospital (règle de) (147, 149). Publiée en 1696 par L’Hospital qui l’avait
apprise de son précepteur Jean Bernoulli, tenu, par un contrat annuel de
300 livres, de lui réserver la primeur de ses découvertes scientifiques.
L’Hospital, Guillaume de (1661-1704) (147, 149, 164). Mathématicien

français, auteur du premier traité de calcul différentiel, l’Analyse des infini-
ment petits pour l’intelligence des lignes courbes (1696).
781
L’Huillier, Simon (1750-1840) (77). Mathématicien français qui a contribué

aux fondements de l’analyse.
libre (extrémant local) (142, 280, 729). Des problèmes géométriques d’extre-
mum sont étudiés par les Grecs dans l’Antiquité. Une définition claire
d’extrémant apparaı̂t chez Cauchy (1821). Les conditions suffisantes
d’existence d’un minimum ou d’un maximum pour une fonction de plusieurs
variables sont dues à Lagrange (1759). La démonstration rigoureuse est
due à Peano (1884).
Lie (dérivée de) (108, 633).
Lie, Sophus (1842-1899) (108, 633). Mathématicien norvégien. Créateur de

la théorie des groupes continus. La théorie des groupes de Lie constitue une
partie importante des mathématiques contemporaines.
lié (extrémant local) (143, 189).
limite (42, 43, 65, 69, 686, 689). Il en est question, plus ou moins clairement,
dans les travaux de Stevin (1586), Valerio (1604), Kepler (1615), Snel-
lius (1624), Cavalieri (1635), Fermat (1643), de Saint-Vincent (1647),
Tacquet (1656), Wallis (1656), Gregory (1667), Leibniz (1664), New-
ton (1687), d’Alembert (1765), L’Huilier (1786). Cauchy (1821) précise
le concept et le met à la base du calcul différentiel et intégral. La formula-
tion donnée ici est due dans Rn à Weierstrass (1861) et, dans un espace
métrique, à Fréchet (1906). L’abréviation lim fut utilisée pour la première
fois par L’Huilier (1786) et la mention x → a en dessous par Riemann
(1856) et Leathem (1905). On peut généraliser comme suite la notion de
limite à un ensemble quelconque. Soit E un ensemble quelconque. Une
partie D de l’ensemble P(E) s’appelle une direction si elle ne contient pas
l’ensemble
7 vide, si, pour tout A ∈ D et tout B ∈ D, on a A ⊂ B ou B ⊂ A et
si S∈D S = ∅. Soit f une application de E dans un espace métrique (M, d).
On dit que b ∈ M est limite des valeurs de f suivant la direction D si, pour
tout ! > 0, il existe A ∈ D tel que, pour tout x ∈ A on a d(f(x), b) ≤ !. Cette
notion, introduite par Chatounovski (1923) et Moore et Smith (1923),
est un cas particulier de la notion de filtre due à H. Cartan (1937). Un
filtre F sur E est une partie de P(E) ne contenant pas la partie vide, telle
que toute partie de E contenant un élément de F appartient à F et toute
intersection d’un nombre fini d’éléments de F appartient à F . Le lecteur
pourra déterminer les directions qui correspondent aux différentes définitions
de limite et d’intégrale données dans ce cours.
limite à droite, à gauche (61). Les notations f(a + 0) = limx→a+ f(x) et f(a −
0) = limx→a− f(x) sont dues à Dirichlet (1837).
limite à l’infini (62).

limite inférieure, supérieure (231). On trouve ces notions chez Gauss (1800)
et Abel (non publiées) et chez Cauchy (1821). La notation est due à Pasch
(1887).
Lindemann, Ferdinand (1852-1939) (218). Mathématicien allemand. Il a dé-

montré la transcendance de π. Par contre, ses tentatives pour démontrer la
conjecture de Fermat ont échoué.
linéaire (application) (72).
Liouville (théorème de) (655). Il est dû en fait à Cauchy (1844) qui l’établit
au moyen de la théorie des résidus; la démonstration proposée est due à Jor-
dan (1893). Borchardt en entendit parler dans le cours de Liouville
(1847) et lui attribua. Liouville avait démontré un cas particulier inter-
venant dans la théorie des fonctions elliptiques.
Liouville, Joseph (1809-1882) (339, 655). Mathématicien français qui a con-

tribué à la théorie des nombres, la théorie des fonctions elliptiques et la
théorie des problèmes aux limites et des équations intégrales. Il a donné
les premiers exemples de nombres transcendants et créé le célèbre Journal de
Mathématiques Pures et Appliquées.
Lipschitz (condition de) (313). Introduite par Lipschitz (1864) dans l’étude
des séries de Fourier; il l’appliqua ensuite au problème de Cauchy (1868).
Lipschitz, Rudolf (1832-1903) (173, 313, 688, 739). Mathématicien alle-

mand, auteur de travaux d’analyse et de géométrie différentielle.
lipschitzienne (application) (173, 688, 739).
Lobatchevsky, Nikolai I. (1792-1856) (35). Mathématicien russe. L’un des

créateurs de la géométrie non-euclidienne. Il fut longtemps recteur de l’u-
niversité de Kazan.
local (extrémant) (142). Voir aussi “libre”, “lié.”
locale (propriété) (113, 119, 121, 132).
localement bornée (fonction) (49, 114).
logarithme (fonction) (225). Les logarithmes furent introduits, ainsi que les
premières tables correspondantes, par Neper (1617) et Bürgi (1620). La
fonction logarithme et sa représentation graphique furent connues avant celle
de l’exponentielle (Descartes (1639), Torricelli (1646)). Les travaux de
Wallis, Newton, Leibniz et Jean Bernoulli sur la fonction exponentielle
montrèrent que la fonction logarithme est sa réciproque. Jones (1742) en
donna une introduction systématique de cette manière, ce que fera aussi Eu-
ler (1748), à qui l’on doit également la formule log x = limn→∞ n(n1/n − 1).
783
Le développement en série potentielle de ln(1 + x) fut mentionné par de

Saint-Vincent (1647), Hudde (1656), Brouncker (1657), Mercator
(1668), Newton (1669) et Leibniz (1694). La dérivée de log x fut calculée
par Leibniz (1694).
logistique (courbe) (379). Etudiée par le mathématicien belge Verhulst

(1838).
longueur (d’un arc de courbe) (571). Du Bois-Reymond (1879) fut le pre-

mier à considérer le problème de l’existence de la longueur d’un arc de courbe,
et Jordan (1881, 1887) le résolut en introduisant la notion de fonction à
variation bornée. Pour le graphe d’une fonction continûment dérivable, la
formule était connue de Wallis (1658) et Van Heuraet (1659), et des cas
particuliers avaient été considérés auparavant par Neil, Fermat et Wren.
longueur (d’un ensemble linéaire) (487, 511).
longueur (d’un intervalle, d’un segment) (347, 569).
Lusin, Nikolai (1883-1950) (521, 674). Mathématicien russe, spécialiste de la

théorie des fonctions de variables réelles et créateur de l’Ecole de Moscou. On
lui doit le théorème, qui porte son nom, affirmant que si une fonction réelle
f est n-mesurable sur E ⊂ Rn , alors, pour tout ! > 0, il existe F ⊂ E tel que
µ(F ) ≤ ! et une fonction réelle g continue sur E telle que f = g sur E \ F.
Maclaurin (développement de) (238). Le cas particulier des fonctions algébri-

ques fut donné par Stirling (1717) qui l’étendit au cas général en 1730.
Maclaurin (1742) le mentionne comme cas particulier du résultat de Tay-
lor.
%
Maclaurin-Cauchy (test intégral de) (418). L’idée de comparer k∈N∗ f(k)
H∞
à 1 f apparaı̂t déjà dans certains cas particuliers chez Jacques Bernoulli.
Le test apparaı̂t chez Euler (1736), Maclaurin (1742) et il est précisé par
Cauchy (1827) et Raabe (1832).
Maclaurin, Colin (1698-1746) (238, 418). Mathématicien écossais. Enfant

prodige, il entra à onze ans à l’Université de Glasgow. Il a cherché à mettre
le calcul des fluxions de Newton sous forme géométrique.
maigre (ensemble) (707). Notion introduite par Baire (1899) sous le nom d’en-
semble de première catégorie.
majorant (199). Notion déjà claire chez Gauss (1800).
majorée (application, suite) (207, 464).

Malthus, Thomas (1766-1834) (378). Démographe anglais. Sa théorie de la

lutte pour la vie inspira à Darwin sa théorie de l’évolution par sélection
naturelle.
Mandelbrot, Benoı̂t (né en 1924) (453). Mathématicien né à Varsovie. Il a

montré l’importance des ensembles fractals et leur a donné leur nom.
maximant, maximum (141, 142, 200, 207).
maximant local libre (245).
maximisante (suite) (209).
maximum (principe du) (670). Enoncé et démontré par Riemann (1851) pour
les fonctions harmoniques, il joue un grand rôle en analyse complexe et en
théorie des équations différentiel les.
Maxwell (équations de) (635). Introduites par Maxwell (1873) pour unifier
l’électricité et le magnétisme. Leur structure a inspiré d’importantes théories
récentes en mathématique et en physique théorique (théories de jauge).
Maxwell, James C. (1831-1879) (635). Mathématicien et physicien écossais.

Ses contributions à l’électromagnétisme et à la théorie cinétique des gaz sont
essentielles.
Mazurkiewicz, Stefan (1888-1945) (708). Mathématicien polonais, auteur de

remarquables travaux en topologie, en analyse réelle et en calcul des proba-
bilités.
McShane, Edward (1904-1989) (394). Mathématicien américain. Spécialiste

de la théorie de l’intégration et du calcul des variations.
Mercator (formule de) (390). Mercator (1651).
Mercator, Nicolas Kauffman, dit (1620-1687) (390). Mathématicien et as-

tronome allemand. Il vécut en Angleterre et en France, où il dessina les
fontaines de Versaille.
méromorphe (fonction) (667). Ces fonctions furent étudiées par Weierstrass

(1876). Le terme est dû à Briot et Bouquet (1859).
mesurable (ensemble) (512). Notion introduite dans R (par une définition dif-
férente) par Borel (1898).
mesurable (fonction) (514). Notion introduite par Lebesgue (1902).
mesurables (caractérisation des fonctions) (715).
mesure (convergence en) (521).

785
mesure d’un ensemble (487, 511). Après les travaux de Harnack (1881),
Hankel (1882), Du Bois-Reymond (1882), Stolz (1884), Cantor (1884),
Peano (1887) et Jordan (1892), le concept actuel apparut chez Borel
(1898) pour n = 1 et chez Lebesgue (1902) pour n quelconque, qui le mit
à la base de sa théorie de l’intégration. Différentes applications, et en par-
ticulier la théorie des probabilités, ont conduit à généraliser la notion de
mesure à des espaces abstraits. On appelle espace mesurable tout couple
(E, B) où E est un ensemble et B une tribu de parties de E, c’est-à-dire une
partie non vide de l’ensemble P(E) des parties de E telle que si A ∈ B,
alors !A ∈ B et si chaque élément de la suite (An )n∈N appartient à B, alors
!
n∈N An ∈ B. On appelle espace mesuré tout triplet (E, B, µ) où (E, B) est
un espace mesurable et µ une mesure positive sur B, c’est-à-dire une applica-
tion µ : B → [0, +∞[∪{+∞}, non identiquement égale à +∞ telle que, pour
%∞suite (An )n∈N !
toute dans B, dont les éléments sont deux à deux disjoints, on
a n=0 µ(An ) = µ( n∈N An ), et telle que E peut s’écrire comme la réunion
d’une suite (Bn )n∈N d’éléments de B tels que µ(Bn ) soit fini.
mesure (d’un pavé) (347).
métrique (structure) (676).
minimant, minimum (141, 142, 200, 207).
minimant local libre (245).
minimisante (suite) (209).
minorant (199).
minorée (application, suite) (207, 464).
module (d’un nombre complexe) (27). Terminologie due à Argand (1806).
monotone (fonction, suite) (209, 464). Cauchy (1821) admet encore qu’une
suite monotone bornée est convergente.
Montucla, Jean Etienne (1725-1799) (318). Auteur d’une monumentale His-

toire des mathématiques.
moyenne (convergence en) (521, 695). Notion due à F. Riesz (1910).
moyenne (norme de la convergence en) (682).
moyenne (théorème et inégalité de la) (150, 153, 154, 229, 388).

Enoncé en langage géométrique par Cavalieri (1635). Cauchy (1829) le
démontra pour une fonction de R dans R continûment dérivable et Bon-
net le démontra sous les hypothèses actuelles. Voir aussi l’article “Lagrange
(formule de)”.
moyenne quadratique (convergence en) (521, 684).
multiple (intégrale) (350).
multiplicité d’un zéro (671).
naturelle (métrique) (676).
négligeable (ensemble) (498). Introduit implicitement par Borel (1894) qui

montra que tout ensemble dénombrable est négligeable. Il explicitera le con-
cept en 1897.
Neumann, Carl Gottfried (1832-1925) (314). Mathématicien et fils de ma-

thématicien allemand. Travaux en théorie du potentiel. Créa le journal
Mathematische Annalen (1868).
Newton, Isaac (1642-1727) (109, 321, 341, 343, 344). Mathématicien, as-
tronome et physicien anglais. Co-inventeur du calcul différentiel et intégral
et auteur de la théorie de la gravitation, on lui doit aussi des contributions
essentielles à l’algèbre et à l’optique. Ses Principes mathématiques de philoso-
phie naturelle sont à l’origine de la science moderne. Il devint Gouverneur de
la Monnaie et s’intéressa activement à la théologie et à l’alchimie.
non intégrable (ensemble borné) (522). Exemple dû à Vitali (1904).
normale (convergence) (445). Notion introduite par Baire (1908) en s’excu-

sant d’ajouter un nouveau concept aux mathématiques.
normale unitaire à une surface (584).
norme (20, 677).
normé (espace vectoriel, sous-espace vectoriel) (20, 677, 678). Pressentie

par F. Riesz (1910), la définition abstraite des espaces vectoriels normés
apparaı̂t, entre 1920 et 1922, dans les travaux de Helly, Hahn, Banach et
Wiener.
ondes (équation des) (283). Appelée également équation des cordes vibrantes,
elle fut étudiée par Taylor (1713) et résolue pour la première fois par
d’Alembert (1747) et puis par Daniel Bernoulli (1747) et Euler (1748).
La discussion de sa solution fut essentielle dans l’évolution du concept de
fonction. La résolution de sa généralisation utt − ∆u = 0 est plus délicate.
opérateur différentiel linéaire (289). L’étude des opérateurs différentiels liné-

aires dans les espaces de fonctions de plusieurs variables est beaucoup plus
délicate et a fait l’objet de nombreuses recherches contemporaines. La théorie
des distributions y joue un rôle important.
787
orbite (173). Pour le système dynamique défini par l’application rélle d’une vari-
able réelle f, l’ensemble des points d’accumulation de la suite (f k (x0 ))k∈N est
appelé son ensemble ω-limite. Si f possède une application inverse, l’ensemble
des points d’accumulation de la suite (f −k (x0 ))k∈N est appelé son ensemble
α-limite. Ces ensembles, introduits en 1927 par G.D. Birkhoff, jouent
un rôle important dans l’analyse du comportement asymptotique du système
dynamique.
orientation (581, 608).
oscillation d’une fonction (230). Notion définie (indépendamment) par Rie-

mann et Volterra (1881).
Ostrogradsky, Michel (1801-1862) (619). Mathématicien russe qui a contri-

bué à la théorie des équations aux dérivées partielles et des intégrales multi-
ples.
ouvert (126, 160, 496, 703). Notion introduite par Weierstrass (1860), De-
dekind (1871), Cantor (1879) et Baire (1899).
P-partition (119). Quoiqu’elle apparaisse, dès l’Antiquité, dans des cas particu-
liers, cette notion se trouve précisée par Cauchy (1823) et Riemann (1854)
pour les fonctions d’une variable et par Thomae (1876) pour les fonctions de
deux variables.
Painlevé (intégrale première de) (736). Obtenue par Painlevé (1895)
Painlevé, Paul (1863-1933) (736). Mathématicien, mécanicien et homme poli-

tique français, il fut ministre de la guerre et premier ministre. Ses contribu-
tions aux équations différentielles à points critiques fixes, qui sont au coeur de
théories mathématiques récentes, font autorité. Passionné d’aviation, il fut le
premier passager de Wright lors des démonstrations en France de l’aviateur
américain.
paire (2).
parallélogramme (575).
partie entière (210). Le symbole [x] pour la partie entière de x fut employé dans
des cas particuliers par Dirichlet (1849) et, dans le cas général, par F.
Mertens (1874). Peano utilisa la notation Ex (1899).
partie finie (434). Notion introduite par d’Adhémar et Hadamard (1904) dans
l’étude des équations aux dérivées partielles hyperboliques.
partie réelle, imaginaire (26).

parties (intégration par) (361, 403). Elle apparaı̂t, en langage géométrique,

chez Torricelli (1644), Fermat (1657), Pascal et, en langage analytique,
chez Leibniz (1675).
partition (118).
Pascal, Blaise (1623-1662) (391). Mathématicien, physicien, philosophe polé-

miste et écrivain français. Inventeur du calcul des probabilités, d’une machine
à calculer et d’un service d’omnibus à Paris, il a également étudié la variation
de la pression atmosphérique.
pavé (115).
pavés emboı̂tés (théorème des) (116).
Peano (théorème de) (724). Démontré par Peano (1892), et, indépendam-
ment, par de La Vallée Poussin (1892).
Peano, Giuseppe (1858-1939) (37, 198, 724). Mathématicien et logicien ital-

ien. Il s’est occupé des fondements de l’arithmétique, de l’algèbre linéaire,
de l’analyse, et de la théorie des équations différentielles. Son Calcolo dif-
ferenziale e principii di calcolo integrale reste une excellente introduction
à l’analyse. Certains de ses articles sont écrits en pasigraphie, un système
de signes quasi illisible qu’il inventa pour écrire les propositions logiques et
mathématiques.
périodique (solution) (314). A cause de leur importance en mécanique céleste,

en mécanique et en électricité et électronique, l’étude des solutions périodi-
ques, systématisée par Poincaré (1883, 1892), constitue une partie impor-
tante de la théorie des équations différentielles.
Perron, Oskar (1880-1975) (349, 388). Mathématicien allemand, à qui l’on

doit de nombreuses contributions aux équations différentielles et aux dérivées
partielles.
π (264). C’est dans un ouvrage de Jones (1706), que le symbole π est utilisé pour
la première fois pour exprimer le rapport de la circonférence au diamètre.
Depuis que Gregory (1670) trouva un moyen pour calculer arctg x, on a
cherché des formules avantageuses exprimant le nombre π par un ou plusieurs
arctg, afin de calculer le plus grand nombre possible de décimales dans le
temps le plus court. Le nombre π apparaı̂t dans de nombreuses formules
d’analyse.
Picard, Emile (1856-1941) (667, 702). Gendre d’Hermite, ce mathématicien

français a apporté des contributions fondamentales à la théorie des fonc-
tions de variables complexes, aux équations différentielles et à la géométrie
algébrique. Son Traité d’analyse a fait autorité.
789
Poincaré (théorème de) (598, 627, 628, 630, 631). Avant l’introduction de
la notion de différentielle extérieure, Poincaré (1887, 1892, 1895) et
Volterra (1889) obtinrent les conditions équivalant à ce qu’une forme
différentielle soit fermée (cocycle). Le théorème de Poincaré est énoncé
et démontré pour la première fois par Volterra (1889). On trouve le
théorème de Poincaré et sa réciproque pour Rn , dans le langage des formes
différentielles, chez E. Cartan et Goursat en 1922, et, pour un ensemble
étoilé, chez Szucs (1928).
Poincaré, Henri (1854-1912) (286, 320, 598, 627, 630, 638, 639, 640). Ma-
thématicien, astronome, physicien et philosophe français. Considéré comme
l’un des derniers savants universels, il est le véritable créateur de la topolo-
gie algébrique, de la théorie qualitative des équations différentielles (premiers
travaux sur la bifurcation et le chaos) et de la mécanique céleste moderne. Il
créa aussi la théorie des fonctions fuchsiennes, qui généralisent les fonctions
elliptiques, étudia la télégraphie et développa, indépendamment d’Einstein,
la mathématique de la relativité restreinte. Ses ouvrages de philosophie scien-
tifique La science et l’hypothèse, La valeur de la science, Science et méthode
et Dernières pensées méritent encore le détour.
Poinsot, Louis (1777-1859) (481). Mathématicien français, spécialiste de la

mécanique du solide.
point fixe (171, 700).
Poisson (crochet de) (283). Ainsi appelé par suite de son analogie avec la par-
enthèse introduite par Poisson en mécanique (1809).
Poisson (intégrale de) (533, 562). Elle apparaı̂t dans la Doctrine des chances
de De Moivre (1718). Gauss l’attribue à Laplace en 1809 et plus tard
à Euler. Poisson la calcule par double intégration. On l’appelle aussi
intégrale de Laplace ou intégrale de Gauss.
Poisson, Simeon-Denis (1781-1840) (283, 533, 562). Physicien mathémati-

cien français. Ses parenthèses, son intégrale, son noyau et sa distribution
sont célèbres.
polaires (coordonnées) (102, 565). Apparaissent chez Gregory (1666) et,

plus systématiquement, chez Jacques Bernoulli (1691-1694).
pôle (664).
polynôme caractéristique (292). Introduit par Euler (1743).
ponctuelle (convergence) (437, 439).
ponctuelle presque partout (convergence) (504).

potentiel scalaire (625, 737). Terminologie due à Daniel Bernoulli (1738).
potentiel généralisé (737).
potentiel vectoriel (625). Notion due à Maxwell (1873).
potentielle (série) (425). Dénomination

% k due à Weierstrass (1859). La plus
ancienne étude est celle de ax par Tacquet (1656). Le théorème de
convergence des séries potentielles est dû à Cauchy (1821). Tombé dans
l’oubli, il fut redécouvert indépendamment par Hadamard (1892).
préhilbertien (espace) (683).
premiers (théorème des nombres) (439). Conjecturé par Gauss (1792-93),

qui ne publia pas, et par Legendre (1798), il fut démontré indépendamment
par Hadamard et de La Vallée Poussin en 1896, en se fondant sur des
résultats partiels antérieures de Dirichlet (1837), Tchebycheff (1851-52)
et Riemann (1860).
presque partout (propriété vraie) (503). Concept introduit et utilisé par Le-
besgue (1903).
primitivable (fonction) (321).
primitivation par changement de variable (328).
primitivation par parties (329). Utilisée déjà, en langage géométrique, chez

Torricelli (1644) et Fermat (1657).
primitivation par substitution (327). Utilisée déjà, en langage géométrique,

chez Roberval (1645) et Fermat (1657).
primitive (321). Barrow (1663) et Torricelli (1647), dans un langage pure-

ment géométrique, ont soupçonné l’importance de l’étude de l’opération in-
verse de la dérivation et leurs conceptions furent reprises, amplifiées et ex-
primées en langage analytique par Newton (1676), qui attira déjà l’attention
sur le rôle de la constante arbitraire. Chez Newton, la dérivée s’appelait
fluxion et la primitive fluente, et il fut le premier à dresser des tables de
primitives (1676). Auparavant, des procédés géométriques équivalant à la
primitivation de xn pour certaines valeurs de n avaient été introduits par
Archimède, Stévin (1596), Valerio (1604), Cavalieri (1635), Fermat
(1636), Roberval (1636), Huygens (1644), Torricelli (1644), Wallis
(1650). Le cas difficile où n = −1 apparaı̂t chez de Saint-Vincent (1622).
Le cas de xa, a /= 1 rationnel, fut traité par Fermat (1657). On trouve chez
Roberval et Wallis l’équivalent de la primitivation de polynômes. New-
ton (1676) et Leibniz (1684) dégagèrent la structure analytique commune de
ces résultats et les règles simples de calcul. On leur doit aussi la détermination
791
de la primitive de l’exponentielle et des fonctions trigonométriques, qui était

déjà apparue, sous forme géométrique, chez Kepler (1609) et Pascal (1659).
Des cas particuliers de primitivation des fonctions rationnelles sont intro-
duits indépendamment par Jean Bernoulli (1702) et Leibniz (1702). Ils
seront développés par Euler (1702), Cotes (1716) et de Moivre (1718).
La démonstration de la décomposition d’une fonction rationnelle propre est
due à Jacobi (1835). Stirling (1717) introduisit la locution courbe ra-
tionnelle et Euler (1748) la terminologie fonction rationnelle. La première
démonstration rigoureuse du fait qu’une fonction dérivable de dérivée nulle est
constante est due à Schwarz (1870), inspiré par le cours de Weierstrass.
La démonstration de la propriété de valeur intermédiaire des fonctions prim-
itivables est due à Darboux (1875).
primitive extérieure d’une forme différentielle (632). Notion déjà connue

d’Euler (1770) dans le cas particulier d’une 1-forme dans R2 .
principale (partie) (664).
produit cartésien ou ensembliste (5).
produit extérieur de formes (589, 590). Introduit pour les formes extérieures
par Grassmann (1861) et pour les formes différentielles par E. Cartan
(1899).
produit scalaire (25, 682). Introduit par Grassmann (1844) sous le nom de
produit intérieur et par Hamilton (1844).
produit scalaire de formes (592).
produit vectoriel (594). Introduit par Grassmann (1844), sous le nom de pro-
duit extérieur, et Hamilton (1844). Heaviside (1892) l’appelle produit vec-
toriel.
projection (20).
prolongement (6).
puissances (série de) (425). Voir potentielle (série).
quantificateurs existentiel et universel (3). Leur étude a été faite par Frege
(1879). Le symbole ∃ fut introduit par Peano (1900) et le symbole ∀ par
Gentzen (1934).
quotient (test du) (423). Un cas particulier est dû à d’Alembert (1768) et le
cas général à Waring (1776) et Cauchy (1821).
quotient différentiel (81).

R-linéaire (application) (74).
Raabe (test de convergence de) (434). Raabe (1832) et Duhamel (1839).
Raabe, Josef Ludwig (1801-1859) (434). Mathématicien né en Ukraine, spé-

cialiste des séries.
racine (test de la) (421). Il est dû à Cauchy (1821)
racine caractéristique (292).
racine d’une équation (171).
radiale (fonction) (284).
rare (ensemble) (708). Egalement appelé clairsemé.
rationnels (nombres) (12). La construction des nombres rationnels à partir des

nombres entiers, commencée par Ohm, fut faite indépendamment par Weier-
strass (1860) et Peano (1899). C’est Heine (1872) qui utilisa le premier
des paires de nombres entiers pour construire les rationnels.
rayon de convergence d’une série (426). Terminologie due à Méray (1872).
réciproque (fonction) (187). La notion f −1 , utilisée par Herschel (1820), fut

popularisée seulement au XXe siècle.
recouvrement (717).
recouvrement (lemme de) (495). Dû à R.M. McLeod (1980).
réelle (application) (207).
réels (nombres) (13). L’expression nombre réel est due à Descartes (1637). A-
près d’intéressantes ébauches dues à Bombelli (1550), Stévin (1594), Bar-
row (1665), Gauss (1812), Bolzano (1817), Cauchy (1821) et Catalan
(1835), différentes constructions rigoureuses des nombres réels à partir des ra-
tionnels furent données par Méray (1869), Weierstrass (1872), Dedekind
(1872) et Cantor (1872). La première construction axiomatique directe des
réels, non basée sur Q, est due à Hilbert (1900).
régulier (point singulier) (664).
régulière (P-partition) (121).
régulière (partie) (663, 664).
relation (5).
793
reparamétrisation d’un simplexe (607).
représentation intégrale (528). Voir “Fonction définie par une intégrale”.
représentation intégrale d’une fonction holomorphe (651). On la doit à

Cauchy (1831, 1841).
représentation irréductible d’un rationnel (75).
représentation paramétrique d’une courbe, d’une surface (569, 575).
résidu (649). Notion et terme introduits et étudiés par Cauchy (1826, 1830,
1841).
résiduelle (partie) (708). Notion introduite par Baire (1899) sous le nom
d’ensemble de deuxième catégorie.
résidus (théorème des) 668. Il est dû à Cauchy (1846).
restriction (d’un graphe ou d’une fonction) (6, 40).
restriction à un sous-pavé, à une partie intégrable (propriété de) (366,

491).
Riemann (hypothèse de) (439). Conjecturée par Riemann (1859), elle reste
indémontré aujourd’hui, malgré des résultats partiels théoriques et numéri-
ques.
Riemann (série de) (419). Sa convergence fut discutée par Waring (1762). Le
nom vient du rôle que lui a fait jouer Riemann en théorie analytique des
nombres.
Riemann (somme de) (349). Dans R et pour les fonctions continues, elles furent
introduites par Cauchy (1823) pour donner une définition analytique de
l’intégrale sur un intervalle d’une fonction continue. Riemann (1854) les
prit comme base de sa définition d’intégrabilité sur un intervalle, et Thomae
(1876) les définit pour les fonctions de deux variables. Kurzweil (1957)
et Henstock (1961) les mirent à la base de leur définition de l’intégrale de
Denjoy-Perron.
Riemann-Stieltjes (somme de) (389).
Riemann, Bernard (1826-1866) (105, 258, 349, 352, 356, 389, 392, 419,
439, 617). Mathématicien allemand, auteur de travaux fondamentaux en
analyse, en géométrie, en théorie analytique des nombres et en physique
mathématique. Il succéda, à Göttingen, à Dirichlet, lui-même successeur
de Gauss. Phtisique, il mourut prématurément en Italie du Nord, où il se
soignait.
Riesz, Frédéric (1880-1956) (695). Mathématicien hongrois, l’un des pères de

l’analyse fonctionnelle.
Rolle (théorème de) (146). Enoncé et démontré, pour un polynôme, par Rolle
(1691), qui qualifiait cependant le calcul différentiel de “collection de men-
songes bien trouvés”. L’énoncé moderne apparaı̂t chez Cauchy (1821).
Pour des démonstrations rigoureuses, il faut attendre Dini (1878), Harnack
(1881), Pasch (1882), Mansion (1887) (démonstration basée sur le théorème
de Weierstrass), Tannery (1886), Demoulin (1902).
Rolle (théorème généralisé de) (145).
Rolle, Michel (1652-1719) (145, 146, 163). Mathématicien français, spécia-

liste de l’algèbre et farouche opposant au nouveau calcul différentiel.
rotationnel (600). Notion introduite par Maxwell (1873).
Rothe (théorème du point fixe de) (159). Dû, dans Rn , à Knaster, Kura-
towski et Mazurkiewicz (1929), et dans un espace de Banach, à Rothe
(1936).
Rothe, Erik (1895-1988) (159). Mathématicien américain d’origine allemande.

Spécialiste de l’analyse fonctionnelle non linéaire.
Saks-Henstock (lemme de) (379). Introduit, pour un autre type d’intégrales,

par Saks (1927) et Henstock (1946) et, dans le présent contexte, par Hen-
stock (1968).
Saks, Stanislaw (1897-1942) (379). Mathématicien polonais, auteur d’une

intéressante Théorie de l’intégrale. Assassiné par les nazis.
Schlömilch (reste du développement de Taylor de) (243). Obtenu par

Schlömilch (1847).
Schlömilch, Oscar (1823-1901) (243). Mathématicien allemand. Auteur de

nombreux ouvrages didactiques.
Schwartz, Jacob T. (né en 1930) (568). Mathématicien américain contempo-

rain.
Schwarz (théorème de) (272). Dû à Schwarz (1873) qui donna le premier
contre-exemple à l’égalité des dérivées partielles secondes. Son résultat fut
généralisé par Thomae (1875), Peano (1890) et Dini (1877).
Schwarz, Hermann Amandus (1843-1921) (272, 683). Mathématicien alle-

mand, spécialiste de la théorie des surfaces minimales et de la théorie du
potentiel.
795
segment de droite (569).
Seidel, Philippe von (1821-1896) (481). Mathématicien, physicien et astrono-

me allemand. Importantes contributions en analyse numérique.
selle (point de) (145). Ils jouent un grand rôle en théorie des jeux.
semi-continuité (160). Notion introduite par Baire (1899).
semi-cube, semi-pavé (115).
séparable (espace métrique) (716).
série (249). Cette notion, d’une manière plus ou moins% explicite, apparaı̂t très tôt
en mathématiques (Archim ède somme
% 3 k % 1 k la série ( 14 )k et, au XIVe siècle,
Oresme somme les séries ( 4 ) et k( 2 ) ). Leur emploi systématique com-
mence avec Newton (1669). On trouve la définition précise chez Cauchy
(1821). de Saint-Vincent (1647) donna le premier énoncé explicite du fait
qu’une série numérique peut représenter un nombre (sa somme) qu’il appelle
terminus de la série.
série dérivée (428).
simple (convergence) (437, 439). Terminologie due à Dini (1878).
simple (fonction) (517).
simple (intégrale) (350).
simplement convergente (série) (254). Cauchy % (1833) montra qu’une mod-

ification de l’ordre des termes dans la série k∈N (−1)k /(k + 1) pouvait la
rendre divergente. Dirichlet (1837) montra qu’une telle modification pou-
vait changer la somme (contrairement au cas d’une série absolument con-
vergente). Riemann (1868) montra que l’ordre d’une série semi-convergente
pouvait toujours être modifié pour donner une somme fixée a priori.
simplexe (605). Notion introduite par Poincaré (1899) et précisée par Lef-
schetz (1933).
singleton (2).
singulier (point) (663).
singulières (équations différentielles linéaires) (459). Leur théorie générale

est due à Fuchs (1866-1868).
somme (d’une série) (249).
somme partielle (d’une série) (249).

sous-additivité d’une mesure (488, 512).
sous-espace métrique (677).
sous-recouvrement (717).
sous-suite (169, 721).
stable (équation différentielle linéaire) (315). La théorie de la stabilité cons-

titue une partie importante de la théorie des équations différentielles ordi-
naires. Elle doit ses concepts et méthodes fondamentaux à Lyapounoff
(1893).
stationnaire (point) (145, 730).
Stieltjes, Thomas (1856-1894) (388, 389). Mathématicien hollandais, profes-

seur à Toulouse. Travaux sur les fractions continues. Sa correspondance avec
Hermite est célèbre.
Stokes-Ampère (formule de) (618). Etablie par Thomson (1850) dans le

post-scriptum d’une lettre à Stokes, qui l’inclut dans l’examen à Cambridge
à partir de 1854 et l’utilise dans ses travaux, ce qui explique comment son
nom y est attaché. Démonstrations par Hankel (1861), Thompson, Tait
(1879) et Maxwell (1873). Un cas particulier est dû à Ampère (1825).
Stokes-Cartan (théorème de) (613, 614). Dû à Volterra (1889), Poinca-

ré (1895, 1899), Goursat (1916) et, dans une version plus proche de celle
donnée ici, par E. Cartan (1945). Par analogie avec le cas particulier où
n = 1 (théorème fondamental du calcul différentiel et intégral), on peut se
demander si le théorème de Stokes-Cartan pour le k-simplexe identité I et
%k
une (k − 1)-forme ω = j=1 (−1)j fj dx1 ∧ . . . ∧ dx Zj ∧ . . . ∧ dxk dans Rk reste
vrai si les coefficients fj de ω sont seulement supposés (totalement) dérivables
%k ∂f
au lieu de classe C 1 . Il n’en est rien car la fonction div f = j=1 ∂xjj , telle
que dω = div f dx1 ∧ . . . ∧ dxk n’est même pas nécessairement intégrable sur
[0, 1]k. Les intégrales plus générales qui intègrent div f sur [0, 1]k lorsque f y
est totalement dérivable et qui fournissent, pour l’intégrale correspondante,
la valeur fournie par le théorème de Stokes-Cartan font actuellement l’objet
de recherches soutenues.
Stokes, George (1819-1903) (36, 481, 613, 618, 637). Mathématicien et

physicien mathématicien irlandais. Importantes contributions à l’hydrodyna-
mique. Il découvrit aussi que l’hémoglobine peut se lier de façon réversible à
l’oxygène.
Stolz, Otto (1842-1905) (110). Mathématicien autrichien. Il publia les pre-

miers ouvrages dans le style weierstrassien, et en particulier les Grundzüge
797
der Differential und Integralrechnung, où l’on trouve pour la première fois la
notion de dérivée totale d’une fonction de plusieurs variables.
strictement concave, convexe (fonction) (227, 228).
strictement croissante, décroissante, monotone (fonction) (209, 210).
subordonnées (lemme des P-partitions) (362).
substitution (intégration par) (362). Méthode introduite, en langage géomé-

trique, par Pascal, Gregory (1667), Roberval (1645), Fermat (1657),
Barrow (1670).
suite (9). Des suites infinies apparaissent déjà chez les mathématiciens grecs de
l’Antiquité. La définition d’une suite réelle comme fonction réelle de domaine
N, approchée par Gauss (1800), est due à Peano (1895).
supremum (d’un ensemble) (201). Notion introduite par Gauss (1800), qui
en donne la caractérisation, et par Bolzano (1817).
supremum (d’une application) (207, 208).
supremum (théorème du) (200). Démontré par Bolzano (1817).
surjectif (graphe) ou surjection (6, 9).
symplectique (forme) (636), (matrice) (738). Une structure symplectique sur

une variété différentiable de dimension 2n est la donnée d’un 2-cocycle non
dégénéré. Un
%nthéorème de Darboux montre qu’une telle forme peut s’écrire
localement j=1 dpj ∧ dqj , c’est-à-dire que toutes les variétés symplectiques
sont localement les mêmes. L’étude de la géométrie symplectique, dont
l’origine remonte aux travaux de mécanique analytique de Lagrange (1788),
est un domaine très vivant des mathématiques actuelles, trouvant de nom-
breuses applications en analyse, en mécanique et en physique. Le mot sym-
plectique fut inventé en 1946 par Weyl.
système dynamique (173). Issue de la mécanique analytique et des propriétés

des solutions du problème de Cauchy, la théorie des systèmes dynamiques
trouve son origine dans les travaux de Poincaré, Liapounov et Hadamard
à la fin du XIXe siècle et de G.D. Birkhoff dans le premier tiers du XXe.
Elle touche à de nombreuses parties des mathématiques (analyse, topologie,
théorie ergodique) et connaît actuellement un prodigieux développement avec
l’étude des phénomènes chaotiques.
tangent (107).
tangente unitaire à une courbe (582).

Tannery, Jules (1848-1910) (37). Mathématicien français, auteur d’une éton-

namment moderne Théorie des fonctions d’une variable et de spirituels apho-
rismes.
taux de variation d’une fonction (81).
Taylor (développement de) (238, 279, 284). La forme donnée ici est due à
Lagrange (1772), ainsi que l’extension aux fonctions de plusieurs variables
(1794).
Taylor (reste du développement de) (238, 330). Lagrange (1797) posa le

problème de leur obtention.
Taylor (série de) (258, 658). Elle apparaı̂t chez Gregory (1670), Newton
(1676), Leibniz, Jean Bernoulli (1697) avant d’être publiée par Taylor
(1715).
Taylor (théorème de) (655). Sa démonstration est due à Cauchy qui la publia
d’abord sous forme lithographique en Italie (1831) et sous forme imprimée en
France (1841).
Taylor, Brook (1685-1731) (238, 258, 279, 285, 330, 655, 658).
Mathématicien anglais. Peintre et musicien, il est l’auteur de travaux im-
portants sur la perspective et sur les cordes vibrantes. Il prit les eaux à Spa
pour soigner ses rhumatismes et sa fille se prénommait Elisabeth.
Tchebycheff (identité et inégalité de) (33, 564). Communiquée par Tche-

bycheff à Hermite, qui l’insère dans son Cours d’analyse de 1882.
Tchebycheff (inégalité de) (493, 523). Due à Tchebycheff (1874). Elle cor-
respond, en probabilité, à l’inégalité (parfois appelée aussi inégalité de
Markov) affirmant que, pour tout réel k, la probabilité pour qu’une variable
aléatoire X prenne une valeur supérieure à k fois l’espérance mathématique
E[X] est inférieure à 1/k.
Tchebycheff, Pafnuti L. (1821-1894). (33, 493, 523, 564). Mathématicien

russe. Importantes contributions au calcul des probabilités, à l’analyse et à
la théorie des nombres.
télégraphistes (équation des) (316). Cette équation apparaı̂t dans les travaux
de Kirchoff et a été déduite des équations de Maxwell par Thomson
(Lord Kelvin) et Heaviside (1876). Elle a été étudiée ensuite par du Bois-
Reymond, Poincaré et Picard. Son importance à l’époque était liée à la
construction et la pose des premiers cables télégraphiques transatlantiques.
télescopique (série) (250).

799
test de comparaison de convergence d’une série (418). La preuve de la

convergence d’une série par comparaison avec une série géométrique se trouve
déjà chez d’Alembert (1768), Gauss (1812), Bolzano (1816) et le test
général est dû à Cauchy (1821).
test de comparaison de L-intégrabilité (385, 387, 405, 519).
test de la limite d’intégrabilité (406).
test de la limite de convergence d’une série (418). Dû à Cauchy (1821).
théorème fondamental du calcul différentiel et intégral (351, 401). Il ap-

paraı̂t déjà, en langage géométrique, chez Barrow (1670) et sous forme
analytique chez Newton (1669) et Leibniz (1675), révélant ainsi ce lien
surprenant entre la recherche des tangentes et des aires liées à une courbe.
Pour une fonction continue, le théorème est énoncé et démontré par Cauchy
(1823), et, pour une fonction primitivable et R-intégrable, par Darboux
(1875) et Du Bois-Reymond (1875). Volterra (1881) et Smith (1875)
donnèrent des exemples de fonction bornée et primitivable non R-intégrable.
Le théorème est alors démontré, dans le cadre de son intégrale, par
Lebesgue (1902), pour une fonction primitivable et bornée et par Den-
joy (1912) et Perron (1914) dans le cadre de leurs intégrales respectives.
La démonstration donnée ici pour une fonction primitivable quelconque est
due à Henstock (1963, 1968).
Thomae, Johannes Karl (1840-1921) (110). Mathématicien allemand, au-

teur de fines critiques sur les fondements de l’analyse.
Tonelli (critère de L-intégrabilité de) (546). Dû indépendamment à Tonel-

li (1909) et Hobson (1909).
Tonelli, Leonida (1885-1946) (546, 724). Mathématicien italien, qui a déve-

loppé la méthode directe du calcul des variations, donnant des conditions sur
l’intégrand de la fonctionnelle à minimiser qui assurent l’existence d’un mi-
nimum, et donc l’existence d’une solution aux équations d’Euler-Lagrange.
transcendant (nombre) (33, 218, 265). C’est Liouville (1844) qui donna le
premier
% exemple de nombre transcendant, à savoir tout nombre de la forme
k /10 où les ak sont des entiers arbitraires entre 0 et 9.
k!
k∈N ∗ a
transformée d’une forme (602).
transformée intégrale (529). La théorie des transformées intégrales (trans-

formées de Laplace, Mellin, Hankel, Weber, Watson, Stieltjes, Hilbert,...)
est l’un des chapitres les plus développés de l’analyse.
trigonométrique (intégrale) (414).

trigonométrique (série) (430, 432, 461). De telles séries apparaissent chez

Euler (1730), Clairaut (1757) et Daniel Bernoulli (1772). Malmsten
(1844) et Holmgren (1851) ont prouvé la convergence pour x /= 2kπ de ces
séries lorsque les coefficients décroissent vers zéro.
trigonométriques (fonctions) (261). Connues dès l’antiquité, les séries utilisées

pour les définir se trouvent déjà chez Newton (1711) et leur théorie analy-
tique date d’Euler (1748).
unicursale (courbe) (336). Définies déjà par Maclaurin (1720).
uniforme (continuité) (134, 722). Bien que Dirichlet (1854) ait énoncé un
théorème sur la continuité uniforme, la notion sera introduite explicitement
et indépendamment par Heine (1872).
uniforme (convergence) (441, 444). L’expression fut mentionnée pour la pre-

mière fois par Guderman (1838), le professeur de Weierstrass à Münster,
et la notion précise fut introduite par Weierstrass (1841; publ. 1894).
Indépendamment, Seidel (1847) et Stokes (1847), ainsi que Cauchy
(1853), introduisirent des notions correspondant à celle de convergence uni-
forme. C’est Weierstrass (1861) qui prouva la continuité de la limite uni-
forme de fonctions continues et la dérivabilité de la limite uniforme lorsque
la suite des dérivées converge uniformément.
uniforme (norme de la convergence) (680).
uniformisation d’une courbe (336).
Urysohn (théorème d’) (739). Démontré par Urysohn (1925).
Urysohn, Pawel (1898-1924) (739). Mathématicien russe. Il mourut noyé en

France.
valeur (6, 7).
valeur absolue (17, 19, 27). La notation |x| est due à Weierstrass (1859).
valeur d’adhérence (166, 167).
valeur intermédiaire (propriété de) (125, 325). Longtemps considérée com-

me traduisant la continuité d’une fonction, alors qu’elle n’en est qu’une con-
dition nécessaire (Darboux (1875)).
valeur principale de Cauchy (433). Introduite par Cauchy (1823).
variation bornée (fonction à) (633). Notion introduite par Jordan (1881)
dans une étude des séries de Fourier. Une fonction réelle est à variation
bornée si et seulement si elle est la différence de deux fonctions croissantes.
801
Lebesgue (1904) a montré que toute fonction continue et à variation bornée

est dérivable p.p..
variations (calcul des) (730). Les premiers problèmes de calcul des variations
furent traités heuristiquement par Newton (1687), Jean Bernoulli (1696)
et Jacques Bernoulli (1697). Il faut attendre Euler (1744) et surtout La-
grange (1760) pour en dégager un corps de doctrine. Des contributions im-
portantes sont apportées par Legendre, Jacobi, Weierstrass, Kneser
et Hilbert. Le nom est dû à Euler (1766).
Verhulst Pierre-François (1804-1849) (378). Mathématicien belge, élève de

Quételet et professeur à l’Ecole militaire. Il fut expulsé de Rome en 1831
pour avoir proposé au pape de donner aux Etats pontificaux un régime par-
lementaire. Travaux en démographie mathématique.
voisinage (27, 685). Le mot (sans définition) apparaı̂t chez Cauchy (1821) et
le concept, dans Rn , apparaı̂t chez Weierstrass (1861) et Cantor (1870).
Weyl (1913) fut le premier à saisir l’importance du concept dégagé de la
notion de distance et Hausdorff (1914) l’introduisit axiomatiquement.
Volterra, Vito (1860-1940) (356, 638). Mathématicien italien. Travaux en

analyse réelle et complexe. Créateur de l’analyse fonctionnelle (fonctions de
lignes) et de la biologie mathématique. Il s’opposa courageusement au régime
fasciste.
volume (d’un parallélipipède) (347).
volume (d’un solide) (487, 511).
Weierstrass (contre-exemple de) (740).
Weierstrass (test de convergence normale de) (445). Dû à Weierstrass

(1880).
Weierstrass (théorème d’approximation de) (708). Découvert par Weier-

strass (1885). La démonstration, due à Stone (1936), s’inspire d’une idée
de Lebesgue (1898).
Weierstrass (théorème des bornes atteintes de) (138, 726). Enoncé et dé-
montré par Weierstrass aux environs de 1860.
Weierstrass, Karl (1815-1897) (80, 110, 138, 168, 197, 445, 453, 667,
708, 721, 726, 740). Mathématicien allemand, dont les travaux en analyse
marquent profondément la pensée moderne. Spécialiste de la théorie des
fonctions de variables complexes et de la théorie des fonctions elliptiques.
Après des années d’études à Bonn placées sous le signe des duels et de la bière,
Weierstrass travailla pendant treize ans dans des gymnases de province où il
enseigna la botanique, la géographie, la calligraphie et même la gymnastique,

avant de devenir, à l’université de Berlin, un professeur vénéré.
Young (reste du développement de Taylor de) (239). Dû à W.H. Young

(1910).
Young (théorème de) (274). W.H. Young (1910).
Young, Grace (1868-1944) (105). Mathématicienne anglaise, épouse de Willi-

am Young. Première femme à obtenir, en Allemagne, le doctorat en suivant
un cycle régulier d’étude.
Young, William (1863-1942) (111, 239, 274). Mathématicien anglais. Nom-

breux travaux en théorie des fonctions de variables réelles.
Zarantonello (théorème des fonctions implicites global de) (739).
Zermelo, Ernst (1871-1953) (2, 3). Mathématicien allemand, auteur de tra-

vaux importants sur les fondements de la théorie des ensembles et le calcul
des variations.
zéro d’une application (171).
zeta (fonction) (420, 439). Euler l’étudia dès 1731 pour des valeurs réelles de
la variable et remarqua le lien avec la théorie des nombres premiers. Le cas
d’une variable complexe a été considéré par Riemann (1859).
Table des matières
1 Ensembles, graphes, fonctions 1

1.1 Logique et ensembles : terminologie et notations . . . . . . . 1
1.2 Graphes, fonctions, applications . . . . . . . . . . . . . . . . . 5
1.3 Ensembles finis, infinis, dénombrables . . . . . . . . . . . . . 10
1.4 Nombres réels . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.5 L’espace vectoriel normé Rn . . . . . . . . . . . . . . . . . . . 19
1.6 Nombres complexes . . . . . . . . . . . . . . . . . . . . . . . . 25
1.7 Intérieur, adhérence, frontière . . . . . . . . . . . . . . . . . . 27
1.8 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
1.9 Petite anthologie . . . . . . . . . . . . . . . . . . . . . . . . . 33
2 Limites et continuité 39
2.1 Fonctions de plusieurs variables réelles . . . . . . . . . . . . . 39
2.2 Limite des valeurs d’une fonction . . . . . . . . . . . . . . . . 40
2.3 Conditions nécessaires d’existence de la limite . . . . . . . . . 47
2.4 Règles de calcul des limites . . . . . . . . . . . . . . . . . . . 50
2.5 Formulations équivalentes et caractère local . . . . . . . . . . 59
2.6 Limites à l’infini et convergence des suites . . . . . . . . . . . 62
2.7 Limites infinies . . . . . . . . . . . . . . . . . . . . . . . . . . 66
2.8 Continuité d’une fonction en un point . . . . . . . . . . . . . 69
2.9 Applications linéaires . . . . . . . . . . . . . . . . . . . . . . . 72
2.10 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
3 Dérivabilité 81
3.1 Fonctions d’une variable réelle . . . . . . . . . . . . . . . . . . 81
3.2 Fonctions de plusieurs variables réelles . . . . . . . . . . . . . 85
3.3 Dérivées directionnelles et dérivées partielles . . . . . . . . . . 90
3.4 Règles de calcul des dérivées . . . . . . . . . . . . . . . . . . . 95
803
804 TABLE DES MATIÈRES
3.5 Règles de calcul des dérivées partielles . . . . . . . . . . . . . 100

3.6 C-dérivabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
3.7 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
4 Fonctions continues ou dérivables 113

4.1 Propriétés locales et propriétés globales . . . . . . . . . . . . 113
4.2 P-partitions d’un pavé et lemme de Cousin . . . . . . . . . . 115
4.3 Propriété de valeur intermédiaire . . . . . . . . . . . . . . . . 121
4.4 Ouverts, fermés et bornés . . . . . . . . . . . . . . . . . . . . 126
4.5 Continuité uniforme . . . . . . . . . . . . . . . . . . . . . . . 132
4.6 Images par une fonction continue . . . . . . . . . . . . . . . . 135
4.7 Théorème des bornes atteintes et extrémants . . . . . . . . . 137
4.8 Théorèmes de Fermat et de Rolle . . . . . . . . . . . . . . . . 143
4.9 Théorème de Cauchy et règle de l’Hospital . . . . . . . . . . . 146
4.10 Théorèmes de Lagrange et de la moyenne . . . . . . . . . . . 151
4.11 Condition suffisante de dérivabilité . . . . . . . . . . . . . . . 156
4.12 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
5 Fonctions implicites 165

5.1 Limites infinies et point d’accumulation . . . . . . . . . . . . 165
5.2 Critère de Cauchy . . . . . . . . . . . . . . . . . . . . . . . . 169
5.3 Itérées d’une application . . . . . . . . . . . . . . . . . . . . . 171
5.4 Théorème des applications contractantes . . . . . . . . . . . . 173
5.5 Fonctions implicites : existence . . . . . . . . . . . . . . . . . 177
5.6 Fonctions implicites : régularité . . . . . . . . . . . . . . . . . 184
5.7 Fonction réciproque . . . . . . . . . . . . . . . . . . . . . . . 187
5.8 Théorème de l’application intérieure . . . . . . . . . . . . . . 188
5.9 Extrémants liés . . . . . . . . . . . . . . . . . . . . . . . . . . 189
5.10 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194
6 Fonctions monotones 199

6.1 Parties majorées ou minorées . . . . . . . . . . . . . . . . . . 199
6.2 Intervalles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205
6.3 Applications réelles . . . . . . . . . . . . . . . . . . . . . . . . 207
6.4 Fonctions monotones . . . . . . . . . . . . . . . . . . . . . . . 209
6.5 Fonction exponentielle . . . . . . . . . . . . . . . . . . . . . . 214
TABLE DES MATIÈRES 805
6.6 Fonctions monotones continues . . . . . . . . . . . . . . . . . 220

6.7 Fonctions monotones dérivables . . . . . . . . . . . . . . . . . 223
6.8 Fonctions convexes ou concaves . . . . . . . . . . . . . . . . . 225
6.9 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230
7 Développement de Taylor et séries 233

7.1 Dérivées d’ordre supérieur . . . . . . . . . . . . . . . . . . . . 233
7.2 Développement de Taylor . . . . . . . . . . . . . . . . . . . . 236
7.3 Calcul de limites et de dérivées . . . . . . . . . . . . . . . . . 240
7.4 Reste de Taylor de fonctions réelles . . . . . . . . . . . . . . . 243
7.5 Extrémants locaux libres . . . . . . . . . . . . . . . . . . . . . 245
7.6 Séries . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248
7.7 Séries absolument convergentes . . . . . . . . . . . . . . . . . 253
7.8 Séries non absolument convergentes . . . . . . . . . . . . . . . 257
7.9 Série de Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . 258
7.10 Fonctions trigonométriques . . . . . . . . . . . . . . . . . . . 260
7.11 Exponentielles imaginaires et complexes . . . . . . . . . . . . 267
7.12 Dérivées partielles d’ordre supérieur . . . . . . . . . . . . . . 270
7.13 Développement de Taylor . . . . . . . . . . . . . . . . . . . . 277
7.14 Conditions d’existence d’extrémants . . . . . . . . . . . . . . 280
7.15 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283
8 Equations différentielles linéaires 287

8.1 Opérateurs différentiels linéaires . . . . . . . . . . . . . . . . . 287
8.2 Equation homogène complexe . . . . . . . . . . . . . . . . . . 292
8.3 Equations non homogènes . . . . . . . . . . . . . . . . . . . . 299
8.4 Solutions réelles . . . . . . . . . . . . . . . . . . . . . . . . . . 304
8.5 Problème de Cauchy . . . . . . . . . . . . . . . . . . . . . . . 310
8.6 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 314
9 Fonctions primitivables 321

9.1 Fonctions primitivables et primitives . . . . . . . . . . . . . . 321
9.2 Règles de primitivation . . . . . . . . . . . . . . . . . . . . . . 327
9.3 Primitivation des fonctions rationnelles . . . . . . . . . . . . . 331
9.4 Fonctions irrationnelles, transcendantes . . . . . . . . . . . . 336
9.5 Calcul approché des primitives . . . . . . . . . . . . . . . . . 339
9.6 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342

10 Fonctions intégrables 345

10.1 Intégrabilité sur un pavé . . . . . . . . . . . . . . . . . . . . . 345
10.2 Propriétés élémentaires de l’intégrale . . . . . . . . . . . . . . 357
10.3 Additivité de l’intégrale . . . . . . . . . . . . . . . . . . . . . 362
10.4 Critère de Cauchy d’intégrabilité . . . . . . . . . . . . . . . . 365
10.5 Fonctions continues ou monotones . . . . . . . . . . . . . . . 368
10.6 Intégrale indéfinie . . . . . . . . . . . . . . . . . . . . . . . . . 372
10.7 Equations différentielles simples . . . . . . . . . . . . . . . . . 375
10.8 Lemme de Saks-Henstock . . . . . . . . . . . . . . . . . . . . 379
10.9 L-intégrabilité sur un pavé . . . . . . . . . . . . . . . . . . . . 382
10.10Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 388
10.11Petite anthologie . . . . . . . . . . . . . . . . . . . . . . . . . 391
11 Intégrale sur un intervalle et séries 395

11.1 Théorème de Hake . . . . . . . . . . . . . . . . . . . . . . . . 395
11.2 Intégrale sur un intervalle borné . . . . . . . . . . . . . . . . 399
11.3 Intégrale sur un intervalle non borné . . . . . . . . . . . . . . 411
11.4 Tests de convergence des séries . . . . . . . . . . . . . . . . . 416
11.5 Tests de la racine et du quotient . . . . . . . . . . . . . . . . 421
11.6 Séries potentielles . . . . . . . . . . . . . . . . . . . . . . . . . 425
11.7 Séries trigonométriques . . . . . . . . . . . . . . . . . . . . . 429
11.8 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433
12 Suites et séries de fonctions 437

12.1 Convergence ponctuelle . . . . . . . . . . . . . . . . . . . . . 437
12.2 Convergence uniforme . . . . . . . . . . . . . . . . . . . . . . 441
12.3 Régularité de la limite uniforme . . . . . . . . . . . . . . . . . 446
12.4 Une fonction continue sans dérivée . . . . . . . . . . . . . . . 451
12.5 Somme d’une série entière . . . . . . . . . . . . . . . . . . . . 453
12.6 Equations différentielles linéaires . . . . . . . . . . . . . . . . 458
12.7 Somme d’une série trigonométrique . . . . . . . . . . . . . . . 461
12.8 Convergence monotone . . . . . . . . . . . . . . . . . . . . . . 464
12.9 Convergence majorée et minorée . . . . . . . . . . . . . . . . 473
12.10Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 480
TABLE DES MATIÈRES 807
13 Fonctions et ensembles mesurables 483

13.1 Intégrale sur un borné . . . . . . . . . . . . . . . . . . . . . . 483
13.2 Bornés intégrables et leur mesure . . . . . . . . . . . . . . . . 487
13.3 Additivité complète de la L-intégrale . . . . . . . . . . . . . . 491
13.4 Exemples de bornés intégrables . . . . . . . . . . . . . . . . . 493
13.5 Ensembles négligeables . . . . . . . . . . . . . . . . . . . . . . 498
13.6 Intégrabilité sur une partie non bornée . . . . . . . . . . . . . 508
13.7 Ensembles et fonctions mesurables . . . . . . . . . . . . . . . 512
13.8 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 522
14 Représentations et transformations 527

14.1 Limites et continuité . . . . . . . . . . . . . . . . . . . . . . . 527
14.2 Règle de Leibniz . . . . . . . . . . . . . . . . . . . . . . . . . 531
14.3 Théorème de Fubini . . . . . . . . . . . . . . . . . . . . . . . 534
14.4 Transformations affines . . . . . . . . . . . . . . . . . . . . . . 548
14.5 Difféomorphismes . . . . . . . . . . . . . . . . . . . . . . . . . 555
14.6 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 563
15 Analyse vectorielle et extérieure 569

15.1 Intégrale sur une courbe . . . . . . . . . . . . . . . . . . . . . 569
15.2 Intégrale sur une surface . . . . . . . . . . . . . . . . . . . . . 575
15.3 Circulation d’un champ vectoriel . . . . . . . . . . . . . . . . 579
15.4 Flux d’un champ vectoriel . . . . . . . . . . . . . . . . . . . . 582
15.5 Algèbre des formes extérieures . . . . . . . . . . . . . . . . . 586
15.6 Formes différentielles . . . . . . . . . . . . . . . . . . . . . . . 594
15.7 Intégrale d’une forme sur une chaı̂ne . . . . . . . . . . . . . . 605
15.8 Théorème de Stokes-Cartan . . . . . . . . . . . . . . . . . . . 613
15.9 Bords, cycles, cobords et cocycles . . . . . . . . . . . . . . . . 619
15.10Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 633
16 Analyse complexe 643

16.1 Intégrale sur une courbe . . . . . . . . . . . . . . . . . . . . . 643
16.2 Fonctions holomorphes, théorème de Cauchy . . . . . . . . . 645
16.3 Résidus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 648
16.4 Représentation intégrale . . . . . . . . . . . . . . . . . . . . . 651
16.5 Théorème de Taylor et fonctions analytiques . . . . . . . . . . 655
16.6 Points singuliers isolés et théorème de Laurent . . . . . . . . 659

16.7 Le théorème des résidus . . . . . . . . . . . . . . . . . . . . . 664
16.8 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 670
17 Analyse fonctionnelle 675

17.1 Espaces métriques . . . . . . . . . . . . . . . . . . . . . . . . 675
17.2 Espaces vectoriels normés . . . . . . . . . . . . . . . . . . . . 677
17.3 Intérieur, adhérence, frontière . . . . . . . . . . . . . . . . . . 684
17.4 Limites et continuité . . . . . . . . . . . . . . . . . . . . . . . 686
17.5 Espaces métriques complets . . . . . . . . . . . . . . . . . . . 690
17.6 Convergence en moyenne . . . . . . . . . . . . . . . . . . . . . 695
17.7 Théorème du point fixe de Banach . . . . . . . . . . . . . . . 700
17.8 Ouverts et fermés . . . . . . . . . . . . . . . . . . . . . . . . . 703
17.9 Parties denses et espaces séparables . . . . . . . . . . . . . . . 706
17.10Bornés et compacts . . . . . . . . . . . . . . . . . . . . . . . . 716
17.11Calcul des variations . . . . . . . . . . . . . . . . . . . . . . . 728
17.12Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 738
18 Index historique 743
View publication stats

Ma WH in Analyse Complet

Uploaded by

Document Information

Original Description:

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Ma WH in Analyse Complet

Uploaded by

Copyright:

Available Formats

See

Analyse. Fondements, techniques, évolution.

General theory of dynamical systems View project

The user has requested enhancement of the downloaded file.

Université Catholique de Louvain

Ce Cours d’analyse constitue la partie théorique du cours de calcul différentiel

T. Apostol, Mathematical Analysis, Addison-Wesley, Reading, 1974,

L. Schwartz, Analyse, 4 vol., Hermann, Paris, 1991-1993.

T.W. Körner, Fourier Analysis, Cambridge University Press, Cambridge, 1988,

tandis que la monographie

H. Brézis, Analyse fonctionnelle. Théorie et applications, Masson, Paris, 1983

E. Hairer, G. Wanner, Analysis by its History, Springer, New York, 1996.

Cette deuxième édition conserve strictement la structure et le volume de la

Verviers et Louvain-la-Neuve, août 1996

1.1 Logique et ensembles : terminologie et nota-

qui permet parfois de simplifier la démonstration d’un théorème. La deuxi-

Le cinquième axiome affirme l’existence de l’ensemble des parties de tout

Le sixième axiome affirme l’existence d’un ensemble x contenant ∅ et tel

v et qui peut être exprimée dans le langage formel de la théorie, il existera

des entiers naturels et démontrer l’important principe d’induction affirmant

(∀x ∈ y) : P (x), (1.1)

(∃x ∈ y) : P (x), (1.2)

(∀x1 ∈ y1 )(∃x2 ∈ y2 )(∃x3 ∈ y3 ) . . . (∃xm−1 ∈ ym−1 )(∀xm ∈ ym ) : (1.3)

Q(x1 , . . . , xm−1 ) = (∀xm ∈ ym ) : P (x1 , . . . , xm−1 , xm ),

la formule (1.3) peut s’écrire

(∀x1 ∈ y1 )(∃x2 ∈ y2 )(∃x3 ∈ y3 ) . . . (∃xm−1 ∈ ym−1 ) : Q(x1 , . . . , xm−1 ),

et, par l’hypothèse de récurrence, sa négation est équivalente à

(∃x1 ∈ y1 )(∀x2 ∈ y2 )(∀x3 ∈ y3 ) . . . (∀xm−1 ∈ ym−1 ) : ¬Q(x1 , . . . , xm−1 ),

et donc, en vertu de la définition de Q et de ce qui précède, à

(∃x1 ∈ y1 )(∀x2 ∈ y2 )(∀x3 ∈ y3 ) . . . (∀xm−1 ∈ ym−1 )(∃xm ∈ ym ) :

Remarque. On a évidemment les équivalences

(∀x ∈ y)(∀u ∈ v) ⇔ (∀u ∈ v)(∀x ∈ y),

1.2 Graphes, fonctions, applications

Définition. Un graphe ou relation de E vers F est une partie de E × F .

dom G = {a ∈ E : (∃b ∈ F ) : (a, b) ∈ G},

et l’image de G est l’ensemble im G défini par

im G = {b ∈ F : (∃a ∈ E) : (a, b) ∈ G}.

Le graphe réciproque G−1 de G est le graphe de F dans E défini par

G−1 = {(b, a) ∈ F × E : (a, b) ∈ G}.

Exemples. Si b ∈ F , E × {b} est un graphe de E dans F appelé graphe

dom G−1 = im G, im G−1 = dom G.

Si a ∈ dom G, on dit encore que G est défini en a, et si b ∈ im G, on dit que

Définition. Un graphe G de E dans F est dit fonctionnel ou est appelé une

Définition. Soit G un graphe de E dans F . On dit que G est injectif si la

(∀a ∈ E)(∀a$ ∈ E) : G({a}) ∩ G({a$ }) /= ∅ ⇒ a = a$ ,

(∀a ∈ E)(∀a$ ∈ E) : (a, b) ∈ G et (a$ , b) ∈ G ⇒ a = a$ ,

c’est-à-dire à la définition d’injectivité.

a ∈ dom G, a$ ∈ dom G et G(a) = G(a$ ) ⇒ a = a$ ,

(∀a ∈ dom G)(∀a$ ∈ dom G : a /= a$ ) : G(a) /= G(a$ ).

Proposition. Si G est une bijection de D sur E et H une bijection de E

Il existe, pour les applications, une variante terminologique souvent utili-

ou encore la notation compacte (Gi)i∈I . En particulier, une famille d’élé-

1.3 Ensembles finis, infinis, dénombrables

Corollaire. Si E est infini et s’il existe une bijection B de E sur F , alors

qui consiste, sur le tableau suivant suivant “représentant” N × N,

(0, 0) (0, 1) (0, 2) (0, 3) (0, 4) ...

à associer un élément de type (l, 0) à l’entier constitué du nombre d’éléments

Le résultat suivant permet de construire de nombreux ensembles dénom-

Corollaire. Tout ensemble contenant une partie infinie non dénombrable

1.4 Nombres réels

xy = yx, x(yz) = (xy)z, x(y + z) = xy + xz;

sera appelé intervalle ouvert d’origine a et d’extrémité b et sera désigné par