You are on page 1of 87

Cours de Gostatistique

Multivariable

Hans WACKERNAGEL

Publication C146
4e Edition: Mars 1993

Centre de Gostatistique, Ecole des Mines de Paris


35 rue Saint Honor, 77305 Fontainebleau, France

LAnalyse des Donnes est un outil pour dgager de la gangue


des donnes le pur diamant de la vridique nature.
J.-P. Benzcri

(daprs [96])

Prface
Nous avons rassembl dans ce document des notes du cours de Gostatistique
Multivariable dispens dans le cadre du D.E.A. au Centre de Gostatistique de
lEcole des Mines de Paris.
Le premier Chapitre numre quelques rsultats du calcul matriciel (sans
dmonstrations), ce qui permet ensuite, dans les chapitres suivants, une prsentation acclre de trois mthodes de lAnalyse des Donnes, importantes
pour la Gostatistique, savoir: lanalyse en composantes principales, lanalyse canonique et lanalyse des correspondances.
Le cinquime Chapitre donne des dfinitions lmentaires du variogramme et de la fonction de covariance, prcise la notion de variogramme
gigogne et prsente trois modles de rgionalisation particuliers donnant lieu
des structures gigognes. Le sixime Chapitre examine le krigeage des composantes de la variation spatiale dfinies par les modles linaires de rgionalisation.
Le septime Chapitre prsente une premire mthode gostatistique multivariable, qui consiste introduire dans le systme de krigeage, sous la forme
de drives externes, des variables connues sur tout le domaine spatial. Le huitime Chapitre parle du filtrage dune drive temporelle dans le cas de donnes spatio-temporelles.
Le neuvime Chapitre tudie la fonction de covariance croise dune paire
de variables, le variogramme crois, ainsi que la relation entre ces deux fonctions structurales. Le dixime Chapitre expose la thorie du cokrigeage en
liaison avec les notions disotopie/htrotopie, de corrlation intrinsque et
dautokrigeabilit.
Le onzime et dernier Chapitre est consacr au modle linaire de corgionalisation et lanalyse krigeante multivariable, qui permettent de pratiquer
lAnalyse des Donnes dans un contexte spatial.
Ce document est destin voluer au fil du temps: toutes remarques, commentaires et critiques sont bienvenues !

Note
Ce document a servi de point de dpart la rdaction du livre Multivariate
Geostatistics paru chez Springer-Verlag, Berlin, 256p, ISBN 3-540-60127-9.
ii

Table des matires


Prface
1

ii

Rappel de Calcul Matriciel


Le tableau des donnes . . . . . . . . . . . . . .
Matrice, vecteur, scalaire . . . . . . . . . . . . .
Addition . . . . . . . . . . . . . . . . . . . . . .
Multiplication par un scalaire . . . . . . . . . .
Multiplication de deux matrices . . . . . . . . .
Transposition . . . . . . . . . . . . . . . . . . .
Matrice carre . . . . . . . . . . . . . . . . . . .
Matrice diagonale . . . . . . . . . . . . . . . . .
Matrice orthogonale . . . . . . . . . . . . . . . .
Matrice symtrique . . . . . . . . . . . . . . . .
Indpendance linaire . . . . . . . . . . . . . .
Rang dune matrice . . . . . . . . . . . . . . . .
Matrice inverse . . . . . . . . . . . . . . . . . .
Dterminant dune matrice . . . . . . . . . . . .
Trace . . . . . . . . . . . . . . . . . . . . . . . .
Valeurs propres . . . . . . . . . . . . . . . . . .
Vecteurs propres . . . . . . . . . . . . . . . . . .
Matrice dfinie positive . . . . . . . . . . . . . .
Dcomposition en valeurs et vecteurs propres .
Dcomposition en valeurs singulires . . . . .
Inverse gnralise de Moore-Penrose . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

1
1
1
2
2
2
2
3
3
3
3
4
4
5
5
5
6
6
6
7
8
9

Analyse en Composantes Principales


Transformation en facteurs . . . . . . . . .
Maximisation de la variance dun facteur
Interprtation des variances des facteurs .
Corrlation des variables avec les facteurs

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

11
11
12
13
14

Analyse Canonique
Etude des facteurs de deux groupes de variables . . . . . . . . . . . .
Intermde:dcomposition en valeurs singulires . . . . . . . . . . . .

16
16
17

iii

.
.
.
.

.
.
.
.

.
.
.
.

Maximisation de la corrlation . . . . . . . . . . . . . . . . . . . . . .

17

Analyse des Correspondances


Tableau disjonctif . . . . . . . . . . . . . . . . . .
Tableau de contingence . . . . . . . . . . . . . . .
Analyse canonique de tableaux disjonctifs . . . .
Codage dune variable quantitative . . . . . . . .
Contingences entre deux variables quantitatives
Analyse des correspondances continue . . . . . .

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

19
19
19
20
20
20
21

Modle Linaire de Rgionalisation


Variogramme exprimental . . . . . . . . . . . . . . . . . . .
Variable rgionalise et fonction alatoire . . . . . . . . . . .
Variogramme thorique . . . . . . . . . . . . . . . . . . . . .
Fonction de covariance . . . . . . . . . . . . . . . . . . . . . .
Fonction de type positif . . . . . . . . . . . . . . . . . . . . . .
Fonction de type ngatif conditionnel . . . . . . . . . . . . .
Ajustement du variogramme par une fonction de covariance
Variogramme gigogne . . . . . . . . . . . . . . . . . . . . . .
Dcomposition de la fonction alatoire . . . . . . . . . . . . .
Rgionalisation stationnaire dordre deux . . . . . . . . . . .
Rgionalisation avec une composante intrinsque . . . . . .
Rgionalisation localement stationnaire . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

22
22
23
23
24
24
25
26
27
28
29
29
29

.
.
.
.

30
30
31
32
33

.
.
.
.
.

38
38
38
39
40
41

Drive temporelle
Drive spatiale et temporelle . . . . . . . . . . . . . . . . . . . . . . . .
Filtrage de la variation temporelle . . . . . . . . . . . . . . . . . . . .

49
49
49

Covariance Croise
Fonction de covariance croise . . . . . . . . . . . . . . . . . . . . . . .
Effet de retard . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

51
51
51

Krigeage de Composantes Spatiales


Krigeage ordinaire . . . . . . . . . . . .
Krigeage de la moyenne locale . . . . .
Krigeage de la composante intrinsque .
Krigeage dune composante stationnaire
Drive externe
Deux variables mesurant la mme chose
Estimation avec une fonction de forme .
Drive invariante par translation . . . .
Covariance gnralise . . . . . . . . . .
Krigeage avec drive externe . . . . . .

iv

.
.
.
.

.
.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.

.
.
.
.
.

Variogramme crois . . .
Reprsentation spectrale
Densit spectrale . . . .
Dphasage . . . . . . . .
Corrlation intrinsque .
10

11

Cokrigeage
Isotopie et htrotopie
Cokrigeage ordinaire .
Cokrigeage simple . .
Autokrigeabilit . . . .

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

52
53
55
56
56

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

58
58
58
60
61

Analyse Krigeante
Modle linaire de corgionalisation . . . . . . . . . . .
Ajustement bivariable de variogrammes exprimentaux
Ajustement multivariable . . . . . . . . . . . . . . . . .
Analyse de corgionalisation . . . . . . . . . . . . . . .
Cokrigeage de facteurs . . . . . . . . . . . . . . . . . . .

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

63
63
64
64
65
68

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

Solution des Exercices

69

Rfrences
Mots-clefs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

75
75
76

Rappel de Calcul Matriciel

Ce bref rappel consiste en lnonc des principaux concepts du calcul matriciel, parsem de quelques exercices et exemples. Pour un expos plus dtaill, on pourra consulter avec profit le livre de S TRANG [94].

Le tableau des donnes


En Analyse des Donnes, on manipule des tableaux de nombres (matrices)
et le tableau de dpart est gnralement le tableau des donnes Z
0

Echantillons
(lignes)

z1;1

B ..
B .
B
B z ;1
B .
@ ..

V ariables
(colonnes)
1
: : : z1;i : : : z1;N
..
.

z ;i
..
.

.. C
. C

z ;N C
C
.. C
. A

= [z i ] = Z

zn;1 : : : zn;i : : : zn;N

Llment z i dnote la valeur numrique place au croisement de la ligne


numro (indice de lchantillon) et de la colonne numro i (indice de la variable).

Matrice, vecteur, scalaire


Une matrice est un tableau rectangulaire de nombres

A = [aij ]
avec des indices

i = 1; : : : ;n
j = 1; : : : ;m
On parle dune matrice dordre nm pour dsigner une matrice de n lignes
et m colonnes.
Un vecteur (par convention: un vecteur colonne) de dimension n est une
matrice dordre n  1, cest--dire une matrice ne possdant quune seule co-

lonne.
Un scalaire est un nombre (si lon veut: une matrice dordre 1  1).
1

Du point de vue des notations, les matrices seront dsignes par des majuscules en caractres gras et les vecteurs par des minuscules en caractres
gras.

Addition
Deux matrices de mme ordre peuvent tre additionnes

A + B = [aij ] + [bij ] = [aij + bij ]


Laddition de matrices se fait en additionnant les lments de mme indice

i et j .

Multiplication par un scalaire


Une matrice peut tre multiplie droite ou gauche par un scalaire 

A  =  A = [ aij ]
Cela revient multiplier tous les lments aij par le scalaire .

Multiplication de deux matrices


Le produit AB de deux matrices A et B ne peut tre ralis que si B a
autant de lignes que A a de colonnes. Soit A dordre n  m et B dordre m  l.
La multiplication de A par B donne une matrice C dordre n  l,

A  B =

(nm) (ml)

"

m
X
j =1

aij bjk = [cik ] = C

(nl)

o i = 1; : : : ;n et k = 1; : : : ;l.
Le produit BA de ces mmes matrices nest possible que si n est gal l et
le rsultat est une matrice dordre m  m.

Transposition
La transpose A> dune matrice A dordre n  m est obtenue en inversant
la squence des indices, de sorte que les lignes de A deviennent les colonnes
de A>

> = [a ]
A
ji
(mn)

A = [aij ];
(nm)

La transpose du produit de deux matrices est gal au produit des transposes en squence inverse

(AB)> = B> A>


2

E XERCISE 1.1 Soit 1 le vecteur de dimension


>
>
gaux 1. Effectuer les produits 1 1 et 11 .

n dont les lments sont tous

E XERCISE 1.2 Calculer les matrices rsultant des produits

1 >
Z1
n

et

o Z est la matrice n  N des donnes.

1 >
11 Z
n

Matrice carre
Une matrice carre a autant de lignes que de colonnes.

Matrice diagonale
Une matrice diagonale D est une matrice carre dont les seuls lments
non nuls se trouvent sur la diagonale
0

d11 0 0
@
D = 0 ... 0 A
0 0 dnn
En particulier, il y a la matrice identit
0

1 0 0
I = @ 0 ... 0 A
0 0 1
qui, multipliant droite ou gauche une matrice de mme ordre, ne la modifie
pas

AI = IA = A

Matrice orthogonale
Une matrice A carre est orthogonale, si elle vrifie

A> A = A A> = I
Matrice symtrique
Une matrice carre A est symtrique, si elle est gale sa transpose

A = A>
3

E XEMPLE 1.3 Un exemple de matrice symtrique est la matrice de variancecovariance V, contenant les variances sur la diagonale et les covariances en
dehors de celle-ci

1
n
o M est la matrice rectangulaire n  m des moyennes (solution de lexercice

V = [ij ] = (Z M)> (Z M)

1.2), dont tous les lments de chaque colonne sont gaux la moyenne de la
variable correspondant cette colonne.

E XEMPLE 1.4 Un autre exemple de matrice symtrique est la matrice


corrlations

R = [ij ] = D 1 V D

R des

o D 1 est la matrice diagonale contenant les inverses des carts-types des


variables
0
1

D 1 =

B
@

p111

0
0

...

p1NN

C
A

Indpendance linaire
Un ensemble de vecteurs fa1 ; : : : ;am g est linairement indpendant, si il
nexiste pas densemble non trivial de scalaires fx1 ; : : : ;xm g, tel que
m
X
j =1

a j xj = 0

Autrement dit, lindpendance linaire des colonnes dune matrice


acquise, si seul le vecteur nul x = 0 satisfait lquation Ax = 0.

A est

Rang dune matrice


Une matrice rectangulaire peut tre subdivise en lensemble des vecteurs
colonnes qui la constituent. De mme, on peut considrer les vecteurs lignes
de cette matrice, qui sont en fait les vecteurs colonnes de sa transpose.
Le rang des colonnes dune matrice est le nombre maximal de vecteurs
colonnes linairement indpendants. Le rang des lignes de la matrice est dfini
de manire analogue. On dmontre que le rang des lignes est gal au rang des
colonnes.
Le rang dune matrice A rectangulaire n  m est donc au plus gal la plus
petite de ses deux dimensions
rang(A)  min(n;m)
4

Le rang de la matrice A indique la dimension 1 des espaces vectoriels


R(A>) et R(A) engendrs par les colonnes et les lignes de A

R(A>) = fy : y = Axg

R(A) = fx : x = y>Ag

et

o x dsigne un vecteur de dimension m et y un vecteur de dimension n.

Matrice inverse
Une matrice A carre n  n est singulire, si rang(A) < n, et non singulire,
si rang(A) = n.
Si A est non singulire (inversible), il existe une matrice inverse A 1 tel
que

AA 1 = A 1A = I
Linverse Q 1 dune matrice orthogonale Q est sa transpose Q> .

Dterminant dune matrice


Le dterminant jAj dune matrice A carre n  n est

jAj

= det(A) =

1)N (k1 ;:::;kn )

n
Y
i=1

aiki

o la somme porte sur lensemble des permutations (k1 ; : : : ;kn ) des entiers
(1; : : : ;n) et o N (k1 ; : : : ;kn ) est le nombres de transpositions de deux entiers
ncessaires pour passer de lensemble de dpart (1; : : : ;n) la permutation
(k1 ; : : : ;kn ) de cet ensemble.
Dans le cas dune matrice 2  2 on a la formule bien connue


A = ac db ;

det(A) = a d b c

Un dterminant non nul indique que la matrice est inversible.

Trace
La trace dune matrice carre
diagonaux

n  n est gale la somme de ses lments

tr(A) =

n
X
i=1

aii

1. ne pas confondre: la dimension dun vecteur et la dimension dun espace vectoriel.

Valeurs propres
Soit A une matrice carre n  n. Lquation caractristique

j I A j

= 0

a n solutions  en gnral complexes, appeles valeurs propres de A.


La somme des valeurs propres est gale la trace de la matrice
n
X

tr(A) =

p=1

p

Le produit des valeurs propres est gal au dterminant de la matrice

det(A) =

n
Y
p=1

p

Si A est symtrique, toutes les valeurs propres sont relles.

Vecteurs propres
Soit A une matrice carre et  une valeur propre de A. Il existe des vecteurs
x et y, diffrents du vecteur nul 0, satisfaisant

y> ( I A) = 0

( I A)x = 0;
cest--dire

y> A =  y>

A x =  x;

Les vecteurs x sont les vecteurs propres des colonnes de A et les y sont les
vecteurs propres des lignes de A.
Lorsque A est symtrique, il ny a pas lieu de distinguer entre des vecteurs
propres de colonnes et de lignes.
E XERCISE 1.5 Montrer que les valeurs propres du carr dune matrice A symtrique, A2 = AA, sont gales au carr des valeurs propres de A. Et que
tout vecteur propre de A est un vecteur propre de A2 .

Matrice dfinie positive


D FINITION :
Une matrice A symtrique n  n est dfinie positive, ssi (si et seulement si)
pour tout vecteur x non nul la forme quadratique

x> Ax > 0
6

A est qualifie de semi-dfinie positive (dfinie non ngative), ssi


 0 pour tout vecteur x. Ou encore, A est indfinie, ssi x>Ax > 0
pour certains x et x> Ax < 0 pour dautres x.

De mme,

x> Ax

On remarque que cette dfinition est identique celle dune fonction de


type positif.
Suivent trois critres trs utiles, noncs pour des matrices semi-dfinies
positives.
P REMIER C RITRE :
A est semi-dfinie positive, ssi il existe une matrice
>
W W.
p
Une telle matrice W scrit parfois A.

telle que

D EUXIME C RITRE :
A est semi-dfinie positive, ssi toutes les valeurs propres p

A =

 0.

T ROISIME C RITRE :
A est semi-dfinie positive, ssi tous les mineurs principaux sont non ngatifs.
Un mineur principal est le dterminant dune sous-matrice principale
A. Une sous-matrice principale est obtenue en biffant k colonnes (k =
0;1; : : : ;n 1) et les lignes correspondantes les croisant sur les lments diagonaux. La combinatoire des mineurs principaux vrifier rend ce critre peu
intressant dans les applications avec n > 3.

de

R EMARQUE 1.6 On vrifie aisment avec le troisime critre que la matrice

(n + 1)  (n + 1) membre gauche du Krigeage Ordinaire, crite en covariances,

nest pas semi-dfinie positive.


La sous-matrice principale S obtenue en biffant toutes les colonnes et les
lignes se croisant en des lments diagonaux, sauf les deux dernires,

S=

cnn 1
1 0

a un dterminant qui vaut 1.


Le calcul des valeurs propres de la matrice membre gauche du KO donne
une valeur propre ngative (de la condition duniversalit) et n valeurs
propres positives (ou nulles) dans le cas de covariances. Constitue laide de
la fonction de covariance, cette matrice est indfinie, alors quelle est (semi)dfinie ngative dans le cas du variogramme.

Dcomposition en valeurs et vecteurs propres


Pour une matrice A symtrique, les valeurs propres p et des vecteurs
propres qp norms lunit forment le systme

AQ = Q

avec
7

Q> Q = I

o  est la matrice diagonale des valeurs propres et Q est la matrice orthogonale des vecteurs propres.
Etant donn que Q> = Q 1 , on aboutit une dcomposition de la matrice
symtrique A,

A = Q  Q>

Dcomposition en valeurs singulires


LAnalyse des Donnes tant lart de dcomposer des tableaux, une dcomposition sappliquant une matrice rectangulaire (dans le mme esprit que la dcomposition dune matrice symtrique en valeurs et vecteurs
propres) va videmment jouer un rle central.
La dcomposition en valeurs singulires p dune matrice A rectangulaire
n  m de rang r scrit:

(n  m)

Q1

( n  n)

( n  m)

Q>2

( m  m)

o Q1 et Q2 sont des matrices orthogonales et o  est une matrice rectangulaire avec r valeurs positives p sur la diagonale ( savoir lensemble des
lments dindices gaux) et des zros ailleurs. Par exemple, dans le cas o
n > m et r = m, la matrice  a la structure suivante
0

1 0 0 1
B 0 ... 0 C
B
C
B 0
C
0

r
B
C
=B
C
0
0
0
B
C
@ ..

..
.

.. A
.

Une telle dcomposition existe toujours et peut tre obtenue en calculant


les valeurs propres p de AA> et de A> A, qui sont identiques et positives ou
nulles. Les valeurs singulires sont les racines carres des valeurs propres non
nulles,

p =

p

Dans cette dcomposition, Q1 est la matrice des vecteurs propres de AA> ,


tandis que Q2 est la matrice des vecteurs propres de A> A.
E XERCISE 1.7 Quelle est la dcomposition en valeurs singulires dune matrice symtrique?
8

Inverse gnralise de Moore-Penrose


Une matrice inverse existe pour toute matrice carre non singulire. Il est
intressant de gnraliser le concept dinverse des matrices singulires et
des matrices rectangulaires.
Une matrice X dordre m  n est inverse gnralise de Moore-Penrose
dune matrice A rectangulaire n  m, si elle vrifie les quatres conditions suivantes

AXA
XAX
(A X)>
(X A)>

=
=
=
=

A
X
AX
XA

Une telle matrice X est note A+ .


E XERCISE 1.8 Est-ce que linverse A 1 dune matrice carre non singulire A
est une inverse gnralise de Moore-Penrose?
Linverse de Moore-Penrose sobtient partir de la dcomposition en valeurs singulires en intervertissant les deux matrices orthogonales, en transposant  et en inversant chacune des valeurs singulires:

A+ = Q2 + Q>1
La matrice
structure

+ est dordre m  n et a, dans le cas o n > m et r = m, la

1 1 0 0 0 : : : 0
..
.
0 0 ::: 0C
+ = B
@ 0
A =
0 0 r 1 0 : : : 0

1 1=2 0
0
0 ::: 0
...
B
0
0 ::: 0C
@ 0
A
0
0 r 1=2 0 : : : 0

E XEMPLE 1.9 (K RIGEAGE SIMPLE AVEC UN DOUBLON ) On peut se demander


si linverse de Moore-Penrose peut tre utilise pour rsoudre un systme de
krigeage dont le membre gauche est singulier. Nous nallons pas traiter le
problme de manire gnrale, mais nous contenter dun petit exercice trs
simple.
On cherche estimer une valeur en x0 partir de deux valeurs situes au
mme point x1 . Le systme de krigeage simple est


a a
a a



w1
w2

 

= bb

o a est la variance des donnes et o b est la covariance entre les points x1 et


x0 .
9

La matrice A tant singulire on va recourir linverse gnralise de MP.


Soit


 
2
2
AA> = A> A = 22aa2 22aa2 = cc cc = C

On a

)
)

det(C) = 0
tr(C) = 2c

2 = 0
1 = 2 c

et une matrice de vecteurs propres norms

Q=

p1

2
1
p
2

p1

2
p1
2

La solution du systme au sens de linverse gnralise est

w = A+ b = Q + Q> b =

pb !
2c
b
p
2c

b
2a
b
2a

En considrant des donnes de moyenne nulle, on a en fin de compte lestimation par krigeage simple

z ? (x

b
0) =
a

z1 (x1 ) + z2 (x1 )
2

Cette solution satisfait lesprit, puisque lestimateur prend la moyenne des


deux valeurs z1 et z2 mesures au point x1 et la multiplie par le pondrateur
que livre le krigeage simple lorsquil ny a quune seule information disponible.

10

Analyse en Composantes Principales

Transformation en facteurs
Le problme de base que rsoud lanalyse en composantes principales est
de transformer un jeu de variables corrles en des variables non corrles,
qui, dans un contexte idal (Gaussien) pourraient tre interprtes comme des
facteurs indpendants sous-jacents au phnomne. Cest pourquoi ces quantits orthogonales seront appeles facteurs, bien que cette interprtation ne
soit pas toujours parfaitement adquate.
Z est la matrice n  N des donnes centres et V est la matrice N  N de
variance-covariance correspondante

1
n

V = [ij ] = Z> Z
Soit Y une matrice n  N contenant dans ses lignes les n chantillons de
facteurs Yp (p = 1; : : : ;N ) non corrls et desprances nulles.
La matrice de variance-covariance des facteurs est videmment diagonale,
puisque les covariances entre les facteurs sont nulles par dfinition
0

d11 0
0
1 >
.
@
D = Y Y = 0 .. 0 A
n
0 0 dNN
et les lments diagonaux dpp sont les variances des facteurs.
On cherche une matrice A, orthogonale N N , qui transforme linairement
les variables mesures en facteurs synthtiques

Y = ZA

avec A> A = I

En multipliant cette quation gauche par n1 et par Y> on a

1
1 >
Y Y = Y> Z A
n
n
et en remplaant Y par ZA droite, il vient

1
1
1
(Z A)> (Z A) = A> Z> Z A = A> (Z> Z) A
n
n
n
11

En fin de compte,

D = A> V A

cest--dire

VA = AD
On voit immdiatement que la matrice Q de vecteurs propres orthonor-

ms offre une solution au problme, et que les valeurs propres p sont alors
tout simplement les variances des facteurs Yp . Lanalyse en composantes principales nest rien dautre quune interprtation statistique du problme de valeur propre
V Q = Q  avec Q> Q = I
dfinissant des facteurs par

Y = ZQ

Maximisation de la variance dun facteur


Un autre aspect important de lanalyse en composantes principales est
quelle permet de dfinir une suite de facteurs orthogonaux, qui absorbent
successivement une part maximale de la variance des donnes.
Prenons le vecteur y1 correspondant un premier facteur obtenu par transformation de la matrice des donnes Z avec un vecteur a1 calibr lunit

y1 = Za1

avec a>1 a1

=1

La variance de y1 vaut

1
1
var(y1 ) = y>1 y1 = a>1 Z> Za1 = a>1 Va1
n
n
Pour attribuer une part maximale de la variance des donnes y1 , on dfinit une fonction objectif 1 avec un paramtre de Lagrange 1 , qui multiplie
la condition de norme unit du vecteur a1

1 = a>1 Va1

1 (a>1 a1

1)

En annulant la drive selon a1

@1
=0
@ a1

()

2Va1

21 a1 = 0

on voit que 1 est une valeur propre de la matrice de variance-covariance et


que a1 est gal au vecteur propre q1 associ cette valeur propre

Vq1 = 1 q1
12

On sintresse un deuxime vecteur y2 orthogonal au premier

cov(y2 ;y1 ) = cov(Za2 ;Za1 ) = a>2 Va1 = a>2 1 a1 = 0


La fonction 2 maximiser contient deux contraintes: le fait que lon choisisse a2 norm lunit, et lorthogonalit de a2 avec a1 . Ces contraintes ncessitent lintroduction de deux nouveaux pondrateurs de Lagrange 2 et 

2 = a>2 Va2

2 (a>2 a2

1) +  a>2 a1

On annule la drive selon a2

@2
=0
()
2Va2 22 a2 +  a1 = 0
@ a2
Que vaut  ? En multipliant lquation par a>1 gauche

2 a>1 Va2 22 a>1 a2 + a>1 a1 = 0


| {z }
0

|{z}
0

|{z}
1

on voit que  est gal zro (la contrainte nest pas active) et ainsi

Va2 = 2 a2
A nouveau 2 savre tre une valeur propre de la matrice de variancecovariance et a2 un vecteur propre q2 correspondant.
En numrotant les valeurs propres de V, de la plus forte la plus faible,
on obtient une suite de N facteurs non corrls, qui assurent un redcoupage
optimal (au sens des moindres carrs) de la variance totale, puisque

tr(V) =

N
X
i=1

ii =

N
X
p=1

p

Interprtation des variances des facteurs


Les valeurs propres indiquent la part de la variance totale associe
chaque facteur et le rapport
variance du facteur
variance totale

p
tr(V)

donne une indication numrique, habituellement indique en %, de limportance du facteur.


Il est gnralement prfrable de standardiser les variables (en soustrayant
demble les moyennes et en divisant par les carts-types), de sorte que lanalyse en composantes principales est base sur la matrice de corrlation R.
Dans ce cadre, lorsquune valeur propre est infrieure 1, on considre parfois
que le facteur associ a moins de valeur explicative que chacune des variables
mesures, car sa variance est infrieure la variance unit des variables.
13

Corrlation des variables avec les facteurs


En gnral on travaille avec des donnes standardises ze i pour ramener
toutes les variables une chelle unique et les rendre comparables

ze i =

p
et 

z i

p mi
ii

o mi
ii sont la moyenne et lcart-type de la variable zi .
La matrice de variance-covariance associe aux donnes standardises est
la matrice de corrlation

1
n

R = Ze> Ze

dont la dcomposition en valeurs propres donne


e
eQ
e> = Q
e
R=Q

e

p >
e 
e
Q

= A A>

Les vecteurs ai , colonnes de A> , ont ceci de remarquable quils indiquent


la corrlation entre une variable zei et les diffrents facteurs yp , car

corr(zei ;yp ) =

e qeip = aip

La longueur des vecteurs ai est gale lunit, et leur produit scalaire est
gal au coefficient de corrlation

a>i aj = ij
Du point de vue gomtrique les vecteurs ai peuvent tre utiliss pour
reprsenter la position des variables sur la surface de lhypersphre unit centre lorigine. Les coefficients de corrlation ij sont les cosinus des angles
entre deux vecteurs se rapportant des variables diffrentes.
La projection de la position des variables depuis la surface de lhypersphre dans des plans dfinis par des axes factoriels donne une reprsentation graphique, appele cercle des corrlations, qui montre leur proximit
lintrieur dun cercle unit centr lorigine. Ces reprsentations sont utiles
pour juger de laffinit ou de lantagonisme existant entre des variables. Ces
graphiques sont fiables, si les variables auquelles on sintresse sont situes
prs de la circonfrence du cercle. Sinon, il faut examiner plusieurs plans factoriels pour sassurer quune proximit constate sur un cercle correspond effectivement une proximit sur lhypersphre.
Dans le cas plus gnral de donnes non standardises, on peut galement
fabriquer des cercles de corrlation entre les variables et des paires de facteurs.
On multiplie la matrice V gauche et droite par la matrice diagonale des
inverses des carts-types

D 1 V D 1 = D

>
1 QQ D

 1

14

= D 1 Q  D 1 Q 

>

do lon dduit la formule gnrale des corrlations entre variables et facteurs

corr(zi ;yp ) =

p
q
ii ip

E XERCISE 2.1 Dduire de

1 e>
e =Q
e
e
Z Y = RQ
n

e> Q
e =I
avec Q

que le coefficient de corrlation entre deux vecteurs e


zi et yp vaut

ip =

ep qeip

Il sensuit que, lorsquune variable standardise est orthogonale toutes


les autres, elle sera identifie un facteur de variance unit dans lanalyse en
composantes principales.
e une matrice de donnes standardises et Y la matrice
E XERCISE 2.2 Soit Z
de facteurs correspondants obtenue par analyse en composantes principales,
e est la matrice des vecteurs propres orthonorms de la matrice
e , o Q
Y = Ze Q
de corrlation R.
Montrer que:


e ;Z
e = R = corr Z
e ;Y
corr Z

15



e ;Y
corr Z

>

Analyse Canonique

Etude des facteurs de deux groupes de variables


Lanalyse canonique propose dtudier simultanment deux groupes de
variables mesurant des proprits diffrentes sur le mme jeu dchantillons.
Ceci afin de mettre en vidence, successivement, des couples forms dun facteur du premier groupe ayant un lien maximal avec un facteur du deuxime
groupe. Le but tant, au moment de linterprtation, de voir pour chaque facteur sous-jacent un groupe de proprits, sil peut tre mis en rapport avec
un facteur sous-jacent un autre ensemble de mesures de nature diffrente,
ralises sur les mmes chantillons.
Le tableau de donnes centr Z dordre n  N est scind en deux groupes
de variables

Z = [Z1 jZ2 ]

cest--dire, la matrice Z est forme par juxtaposition des colonnes dune matrice Z1 dordre n  M et dune matrice Z2 dordre n  L, avec N = M + L.
La matrice de variance-covariance V associe Z est subdivise en quatre
blocs



1
11 C12
V = [Z1 jZ2 ]> [Z1 jZ2 ] = V
C
n
21 V22
o les matrices V11 dordre M  M et V22 dordre L  L sont des matrices
de variance-covariance associes Z1 et Z2 . Les matrices de covariances C12
dordre M  L et C21 dordre L  M contiennent les covariances entre variables
de groupes diffrents

C>12 = C21
On cherche des couples de facteurs fup ;vp g
up = Z1 ap
et
v p = Z 2 bp

qui soient non corrls lintrieur de leurs groupes respectifs

up ?uk

vp ?vk
pour p 6= k
et pour lesquels la corrlation corr(up ;vp ) est maximale. Cette corrlation (appele corrlation canonique) entre deux facteurs u et v est
a> Z>1 Zp2 b
corr(u;v) = p > >
a Z1 Z1 a  b> Z>2 Z2 b
et

16

En dcidant de normer a et b selon la mtrique donne par les matrices de


variance-covariance (supposes dfinies positives) de leurs groupes respectifs

a> V11 a = b> V22 b = 1


la corrlation scrit plus simplement

corr(u;v) = a> C12 b


Intermde: dcomposition en valeurs singulires
Il est instructif de se livrer un petit dtour algbrique. On pose
p

x = V11 a

avec x> x = y> y = 1

y = V22 b

et

de sorte que

corr(u;v) = x>

"
p

V11

 1

C12


p

V22

 1#

{z

G
Pour le systme complet des vecteurs x et y on a

X> GY = 
cest--dire la dcomposition en valeurs singulires

G = X  Y>
o les corrlations canoniques , seuls lments non nuls de la matrice rectangulaire , se rvlent tre les valeurs singulires du tableau rectangulaire
G.

Maximisation de la corrlation
On cherche une paire de vecteurs de transformation
male la corrlation entre les facteurs fu;vg

corr(u;v) = a> C12 b

fa;bg rendant maxi-

avec a> V11 a = b> V22 b = 1

La fonction objectif  est

 = a> C12 b

1 >
 (a V11 a 1)
2

o  et 0 sont des paramtres de Lagrange.


17

1 0 >
 (b V22 b 1)
2

Lannulation des drives partielles selon a et b donne

@
=0
@a
@
=0
@b

()

C12 b V11 a = 0

()

C21 a 0 V22 b = 0

Quelle est la relation entre  et 0 ? En prmultipliant la premire quation


par a> et la seconde par b>

()
()

a> C12 b  a> V11 a = 0


b> C21 a 0 b> V22 b = 0
on voit que

 = a> C12 b
0 = b> C21 a

 = 0 = corr(u;v)

Ayant trouv plus haut que

C12 b = V11 a

C21 a = V22 b
on prmultiplie la premire quation par C21 V111
C21 V111 C12 b = C21 a
et

et en tenant compte de la deuxime quation

C21 V111 C12 b = 2 V22 b


Cela donne, au bout du compte, deux problmes de valeur propre, en posant  = 2

V221 C21 V111 C12 b = b


V111 C12 V221 C21 a = a
Seul le plus petit de ces deux systmes a besoin dtre rsolu. La solution de
lautre peut alors tre obtenue par les relations de transition entre les vecteurs
de transformation

1


a = p V111 C12 b

et

1


b = p V221 C21 a

E XERCISE 3.1 Montrer que cov(up ;uk ) = pk .


E XERCISE 3.2 Montrer que cov(up ;vk ) =  pk .
E XERCISE 3.3 Montrer que le vecteur propre a dans lquation

V11 a =  C12 V221 C21 a


rsoud le problme de lanalyse canonique.
18

Analyse des Correspondances

On a vu que lanalyse canonique tudie, en quelque sorte, les correspondances entre des facteurs de deux groupes de variables quantitatives. La
mme approche, applique deux variables qualitatives, qui reprsentent,
chacune delles, un groupe de catgories mutuellement exclusives, est connue
sous le nom vocateur danalyse des correspondances.

Tableau disjonctif
Une variable qualitative z est un systme de catgories (classes) mutuellement exclusives. Lappartenance dun chantillon z une catgorie Ci peut
tre reprsente numriquement laide dune fonction indicatrice
n
1Ci (z ) = 1 si z 2 Ci
0 sinon
La matrice indiquant les appartenances des n chantillons aux N catgories
de la variable qualitative est le tableau disjonctif H dordre n  N
h

H = 1Ci (z )

Chaque ligne du tableau disjonctif ne contient quun seul lment gal


1 et a des zros ailleurs, tant donn quil est exclu quun chantillon appartienne deux catgories la fois.
Le produit de H> avec H donne une matrice diagonale, dont les lments
diagonaux nii indiquent le nombre dchantillons se trouvant dans la catgorie numro i. La division des nii par n donne la proportion Fii dchantillons
contenus dans une certaine catgorie et lon obtient
0

F11 0
0
1 >
.
@
.
V= H H= 0
.
0 A
n
0 0 FNN
Tableau de contingence
Deux variables qualitatives mesures sur le mme ensemble dchantillons
sont reprsentes, respectivement, par un tableau H1 dordre n  M et un
tableau H2 dordre n  L.
19

Le produit des deux tableaux disjonctifs a pour lments les effectifs nij
dchantillons appartenant simultanment la catgorie i de la premire variable qualitative et la catgorie j de la deuxime variable. Les lments de ce
tableau, qui est le tableau de contingence dordre M  L, peuvent tre diviss
par le nombre total n dchantillons, mesurant ainsi la proportion dchantillons se trouvant au croisement des catgories des deux variables

1
n

C12 = H>1 H2 = [Fij ]


Analyse canonique de tableaux disjonctifs
Lanalyse des correspondances consiste appliquer le formalisme de lanalyse canonique aux tableaux disjonctifs H1 et H2 en formant les matrices (non
centres)

C>21 = C12 ;

V11 = H>1 H1 ; V22 = H>2 H2


n
n
Vu la structure diagonale des matrices V11 et V22 , qui ninterviennent que

dans le calibrage des vecteurs de transformation, on peut dire que lanalyse


des correspondances revient tudier les liens entre les lignes et les colonnes
du tableau de contingence C12 .

Codage dune variable quantitative


Une variable quantitative z peut tre transforme en une variable qualitative en la dcoupant en un ensemble dintervalles disjoints Ci . Des fonctions
indicatrices de ces intervalles permettent de constituer le tableau disjonctif H
associ z
n
1Ci (z ) = 1 si z appartient lintervalle Ci
0 sinon
Une subdivision est parfois donne a priori, comme cest par exemple le
cas pour des fractions granulomtriques dun chantillon de sol.
Le codage dune variable quantitative permet deffectuer une analyse des
correspondances croisant les intervalles de cette variable avec les catgories
dune variable qualitative.
La matrice diagonale V = (1=n) H> H contient les valeurs de lhistogramme des chantillons z , puisque ses lments diagonaux exhibent les frquences dapparition des chantillons dans les classes de valeurs de z .

Contingences entre deux variables quantitatives


Le tableau de contingence C12 = (1=n) H>1 H2 de deux variables quantitatives z1 et z2 renferme linformation sur un histogramme bivariable, car on y
trouve les frquences des chantillons au croisement des classes de z1 et de z2 .
20

Analyse des correspondances continue


Lhistogramme bivariable, cest--dire le tableau de contingence de deux
variables quantitatives, peut tre modlis par une loi bivariable F (dZ1 ;dZ2 ).
Si cette loi admet une densit '(Z1 ;Z2 ), elle scrit

F (dZ1 ;dZ2 ) = '(Z1 ;Z2 ) F1 (dZ1 ) F2 (dZ2 )


o F1 (dZ1 ); F2 (dZ2 ) sont les lois marginales de Z1 et Z2 , modlisant les histogrammes respectifs. En supposant, en outre, que la densit ' est de carr
intgrable, on peut la dcomposer en un systme de valeurs propres p = 2p
et de fonctions propres fp (Z1 ); gp (Z2 )

'(Z1 ;Z2 ) =

1
X
p=0

p fp (Z1 ) gp (Z2 )

Cette dcomposition est lanalogue, en continu, de la dcomposition en


valeurs singulires.
E XEMPLE 4.1 Lorsque la loi bivariable est Gaussienne, la dcomposition en
valeurs propres donne des coefficients p gaux un coefficient  mis la
puissance p
p =  p
avec jj < 1

ainsi que des fonctions propres gales des polynmes dHermite p normaliss

p =

pHpp!

La loi bivariable Gaussienne G(dZ1 ;dZ2 ) scrit

G(dZ1 ;dZ2 ) =

1
X
p=0

 p p (Z1 ) p (Z2 ) G(dZ1 ) G(dZ2 )

R EMARQUE 4.2 En gostatistique non linaire, on sintresse la loi bivariable de deux variables alatoires Z (x ) et Z (x ) situes en deux points x
et x dun domaine spatial. La dcomposition de cette loi bivariable donne
lieu, sous certaines hypothses, un modle isofactoriel. Les modles isofactoriels sont dune grande utilit pour la mise en oeuvre de ce qui sappelle,
non par hasard, le krigeage disjonctif.
En particulier, dans le cas du modle isofactoriel Gaussien, le coefficient 
sera tout simplement gal la valeur (x x ) de la fonction de corrlation
pour la paire de points concerne.
E XERCISE 4.3 Quest-ce quun modle isofactoriel qualifi de discret?

21

Modle Linaire de Rgionalisation

Variogramme exprimental
Nous allons mesurer la variabilit diffrentes chelles dune variable rgionalise z (x) tout simplement en calculant une mesure de dissemblance
entre deux donnes z1 et z2 situes en deux points x1 et x2 dun domaine spatial. Cette dissemblance entre deux valeurs, dsigne par ? , vaudra

? =

(z2

z1 )2

cest--dire la moiti du carr de la diffrence entre deux valeurs.


On fait dpendre la dissemblance ? de la distance et de lorientation dune
paire de points, dcrits par le vecteur h = x2 x1 , indiffremment de la position de la paire dans le domaine tudi

? (h) =

2
1
z (x1 +h) z (x1 )
2

En formant la moyenne des dissemblances ? entre valeurs pour toutes


les nh paires de points relies par un vecteur h donn pour une maille donne (avec, le cas chant, une certaine tolrance sur la longueur et langle du
vecteur), on obtient la notion de variogramme exprimental

? (h)

nh 
2
1 X
=
z (x +h) z (x )
2nh =1

Habituellement on observe que la dissemblance des valeurs augmente en


moyenne en fonction de lloignement spatial des points de mesure et atteint
frquemment un palier de variation aux grandes distances. Lorsque la pente
du variogramme change abruptement, on peut penser des paliers intermdiaires.
Le comportement aux trs petites chelles, prs de lorigine du variogramme, est dune importance capitale, car il est un indicateur du degr de
continuit de la variable rgionalise, savoir: diffrentiable, continue mais
non diffrentiable, ou carrment discontinue. Dans ce dernier cas on aura affaire une variable rgionalise donnant lieu un effet de ppite, symptme
22

de valeurs changeant abruptement trs petite chelle par rapport la maille,


comme les teneurs de lor lorsquil y a des ppites.
Lorsque la dissemblance moyenne des valeurs est constante pour toutes
les distances jhj, il y a une absence complte de structuration spatiale des
valeurs. A linverse, une pente non nulle du variogramme prs de lorigine
indique une structuration des donnes. Un changement soudain de la pente
du variogramme indique le passage une structuration des valeurs de nature
diffrente.
Ces transitions seront dabord modlises par des variogrammes gigognes,
puis les diffrents types de structuration spatiale des valeurs pourront tre visualiss sparment sous forme de cartes en effectuant le krigeage de composantes spatiales.

Variable rgionalise et fonction alatoire


La variable rgionalise z (x) est considre comme une ralisation dune
fonction alatoire Z (x) (la famille infinie des variables alatoires implantes en
tout point x dun domaine spatial D). Les donnes z (x ) sont des informations
fragmentaires que lon possde sur une ralisation particulire z (x) de Z (x).
Cette approche est radicalement diffrente de celle de la statistique, o les
chantillons z sont des ralisations dune variable alatoire Z .
Les implications pistmologiques de ltude dun phnomne unique par
des mthodes probabilistes sont dbattues dans M ATHERON [66].

Variogramme thorique
Le variogramme thorique (h) est dfini par lhypothse intrinsque.
Lhypothse intrinsque est forme de deux conditions sur les accroissements
Z (x+h) Z (x) de la fonction alatoire:
La moyenne des accroissements est invariante pour toute translation du
vecteur h dans le domaine. Plus spcifiquement, la moyenne des accroissements est suppose nulle, quelle que soit la position de h dans le domaine.
La variance des accroissements admet une valeur finie en fonction de h
et indpendante de la position de h dans le domaine.
Cest--dire,
(

E [Z (x+h) Z (x)] = 0
pour tout x; x+h 2 D
var [Z (x+h) Z (x)] = 2 (h) pour tout x; x+h 2 D
23

ce qui donne le variogramme thorique

1 
(h) = E (Z (x+h)
2

Z (x))2

pour tout

x; x+h 2 D

Lexistence de lesprance des accroissements dune fonction alatoire intrinsque nimplique pas celle de lesprance de la fonction alatoire. Une
fonction alatoire intrinsque peut avoir une variance infinie, tout en ayant
une variance des accroissements finie pour tout vecteur h.

Fonction de covariance
La fonction de covariance C (h) est dfinie sur la base de lhypothse de stationnarit des deux premiers moments, moyenne et covariance, de la fonction
alatoire
(

E [Z (x)] = m
pour tout x 2 D
E [Z (x)  Z (x+h)] m2 = C (h) pour tout x 2 D

La fonction de covariance est borne et nexcde pas la variance

jC (h)j  C (0) = var(Z (x))


Cest une fonction paire: C ( h) = C (+h).
On peut dduire un variogramme dune fonction de covariance par la formule

(h) = C (0)

C (h)

Etant donn que lhypothse de stationnarit dordre deux est moins gnrale que lhypothse intrinsque, tout modle de variogramme ne peut pas
tre dduit dun modle de covariance.
E XEMPLE 5.1 Par exemple, le variogramme puissance

 ( h ) = b jh j

avec

0<<2

dborde manifestement du cadre fix par lhypothse de stationnarit dordre


deux.

Fonction de type positif


Du point de vue algbrique, lemploi dune fonction de covariance C (h)
dans le calcul de la variance dune combinaison linaire de n+1 variables
alatoires Z (x ) (sous-ensemble dune fonction alatoire stationnaire dordre
24

deux) avec n+1 pondrateurs  doit ncessairement conduire une matrice


semi-dfinie positive

var

n
X
=0

 Z (x ) =

n X
n
X
=0 =0

  C (x x ) = l> C l  0

quels que soient les points x et les pondrateurs  . Une fonction de covariance est donc une fonction de type positif.
Une fonction de covariance continue est dfinie par le thorme de Bochner comme tant la transforme de Fourier dune mesure positive.

Fonction de type ngatif conditionnel


Le variogramme, quant--lui, doit tre une fonction de type ngatif conditionnel pour garantir la positivit de la variance dune combinaison linaire de
n+1 variables alatoires, sous-ensemble dune fonction alatoire intrinsque,
avec n+1 pondrateurs de somme nulle

var

n
X
=0

 Z (x ) =

n X
n
X
=0 =0

  (x x )  0

si

n
X
=0

 = 0

cest--dire

[ ]> [ (x x )][ ] = l> l  0

pour

n
X
=0

 = 0

Pour comprendre lutilit (le caractre suffisant) de la condition sur la


somme des pondrateurs, il faut se livrer un calcul explicite de la variance
de la combinaison linaire.
Dabord, la fonction alatoire Z (x) tant intrinsque, seule lesprance
daccroissements a un sens. Pour pouvoir former des accroissements, nous
introduisons dans lexpression de la variance une variable alatoire supplmentaire Z (0), place arbitrairement lorigine 0 (on suppose que 0 2 D),
multiplie par les pondrateurs de somme nulle, ce qui ne modifie pas la variance

var

n
X
=0

 Z (x )

= var

"

= var
=

Z (0) 
n
X

=0
n
n
XX
=0 =0

n
X

 +

=0
| {z }
0


n
X
=0

 Z (x )


 Z (x ) Z (0)

  E
25

h

Z (x ) Z (0)

 

i

Z (x ) Z (0)

n X
n
X
=0 =0

  CI (x ;x )

o CI (x ;x ) est la covariance des accroissements avec la variable supplmentaire.


Dans un calcul intermdiaire, on introduit le point supplmentaire Z (0)
dans lexpression du variogramme


2
1 
x ) = E Z (x ) Z (0) Z (x )+Z (0)
2

1
=
2 (x ) + 2 (x ) 2 CI (x ;x )
2

(x

de sorte que

CI (x ;x ) = (x ) + (x )

(x x )

avec deux termes non stationnaires (x ) et (x ).


En reprenant le calcul de la variance de la combinaison linaire, on constate
que la condition sur la somme des pondrateurs annule les termes non stationnaires

var
=

n
X

n
X
=0

 Z (x ) =

n
X

=0
=0
| {z }
0

 (x ) +

n X
n
X
=0 =0

n
X

  CI (x ;x )

n
X

=0
| {z } =0
0

 (x )

n X
n
X
=0 =0

  (x x )

Ajustement du variogramme par une fonction de covariance


Quand le variogramme exprimental prsente un palier aux grandes distances jhj, on supposera souvent que la fonction alatoire Z (x) a une variance
finie et lon ajustera le variogramme par une fonction de covariance C (h) en
se basant sur la formule

(h) = b

C (h)

o b caractrise un palier de variation.


Dans la suite, le modle C (h) sera soit un effet de ppite
(

Cpep (h) =

b lorsque jhj = 0
0 lorsque jhj > 0
26

soit un modle sphrique

Csph (h) =

8 
>
<b 1
>
:

3 jh j 1 jh j3
+
2 a 2 a3

pour 0  jhj  a
pour jhj > a

Le paramtre a indique la porte de la covariance: la covariance steint


lorsque la porte est atteinte. Le paramtre b indique la valeur maximale de
la covariance: la covariance sphrique diminue de manire continue partir
de la valeur maximale b, situe lorigine, jusqu disparatre compltement
lorsque la porte est atteinte. Le modle de leffet de ppite pourrait tre considr comme un cas particulier dun sphrique avec une porte a infiniment
petite. Il y a cependant une diffrence notable entre les deux modles: Cpep (h)
dcrit un phnomne discontinu, pour lequel les valeurs changent brutalement dun point un autre, tandis que Csph (h) dcrit un phnomne continu,
mais non diffrentiable, qui serait en quelque sorte rugueux au toucher.

Variogramme gigogne
On peut souvent distinguer plusieurs paliers de variation qui sont en rapport troit avec la morphologie de la variable rgionalise 1 .
Dfinissons dabord une fonction de corrlation (h), obtenue en normant
la fonction de covariance un palier unitaire

(h) =

C (h)
b

cest--dire

C (h) = b (h)

On numrotera les paliers de variation bu observs sur le variogramme


avec un index u = 0;:::;S . On peut ainsi construire un variogramme gigogne

(h) =

S
X
u=0

u (h) =

S
X
u=0

bu gu (h)

o les gu (h) sont des variogrammes norms.


Si les variogrammes u (h) peuvent tre dduits de fonctions de covariance
Cu (h), le modle gigogne devient

(h) = b

S
X
u=0

Cu (h) = b

S
X
u=0

bu u (h)

avec, typiquement, une covariance ppitique


sphriques Cu (h) de portes au diffrentes.

S
X
u=0

bu = b

C0 (h) et plusieurs covariances

E XEMPLE 5.2 La Figure 5.1 montre le variogramme du deuxime canal dune


1. S ERRA [90] a men une tude remarquable du gisement de fer Lorrain, dans laquelle il
a pu distinguer jusqu sept paliers de variation ayant une signification gologique, dans les
multiples transitions entre lchelle micromtrique et lchelle kilomtrique.

27

 



F IG . 5.1 Variogramme du deuxime canal dune image SPOT.

image SPOT sur une zone de 5  4 km2 , ajust avec un modle gigogne compos de trois structures sphriques de portes 60m, 240m et 920m (daprs
[50]).

Dcomposition de la fonction alatoire


En association avec le variogramme gigogne, la fonction alatoire Z (x) est
dcompose en une somme de composantes spatiales indpendantes agissant
diffrentes chelles spatiales, i.e. atteignant diffrents paliers de variation bu
des chelles diffrentes, mis part ventuellement un coefficient bS , qui ne
reprsente pas forcment un palier.
Il est clair quune composante petite chelle ne pourra tre identifie que
si la maille dchantillonnage est suffisamment fine. De mme, une composante grande chelle napparatra sur le variogramme que si le diamtre du
domaine chantillonn est assez important.
Une composante dterministe (moyenne m ou drive m(x)) pourra, le cas
chant, galement faire partie de la dcomposition.
Nous prsentons trois modles linaires de rgionalisation particuliers, obtenus en mlangeant des composantes spatiales de types diffrents.
28

Rgionalisation stationnaire dordre deux


Une fonction alatoire stationnaire dordre deux Z (x) peut tre constitue
partir dune somme de fonctions alatoires dordre deux Zu (x), non corrles
et de moyennes nulles, plus une constante m reprsentant lesprance de Z (x)

Z (x) = Z0 (x) + : : : + Zu (x) + : : : + ZS (x) + m


Un calcul simple montre que le modle de covariance correspondant est

C (h) = C0 (h) + : : : + Cu (h) + : : : + CS (h)


Rgionalisation avec une composante intrinsque
Un modle de rgionalisation intrinsque particulier, qui nous sera utile
plus loin, peut tre construit en additionnant une fonction alatoire intrinsque ZS (x) et S fonctions alatoires stationnaires dordre deux Zu (x) (u =
0; : : : ;S 1), de moyennes nulles, non corrles entre elles et non corrles
avec les accroissements de ZS (x)

Z (x) = Z0 (x) + : : : + Zu (x) + : : : + ZS (x)


Le modle de variogramme associ est un modle gigogne compos de S
structures dduites de fonctions de covariance et dune structure purement
intrinsque.

Rgionalisation localement stationnaire


Une fonction alatoire non stationnaire Z (x) peut tre obtenue en superposant S +1 fonctions alatoires dordre deux non corrles de moyennes nulles
Zu (x) et une drive m(x) (lesprance de Z (x) au point x)

Z (x) = Z0 (x) + : : : + Zu (x) + : : : + ZS (x) + m(x)


En choisissant une fonction ml (x) trs continue, qui ne varie que trs lentement dun bout lautre du domaine, on peut lui donner le sens dune
moyenne locale et qualifier

Z (x) = Z0 (x) + : : : + Zu (x) + : : : + ZS (x) + ml (x)


de localement stationnaire, lesprance de Z (x) tant approximativement
constante dans tout voisinage local du domaine.

29

Krigeage de Composantes Spatiales

Krigeage ordinaire
Le krigeage ordinaire est une opration qui est rpte en chaque noeud

x0 dune grille rgulire recouvrant le domaine tudi. Pour un ensemble de n


points de donnes x dun voisinage centr autour dun point x0 de la maille
destimation, on peut construire, en minimisant la variance destimation, le
systme de krigeage ordinaire suivant
0

C (x1 x1 ) : : : C (x1 xn ) 1 1 0 1

..
B
.
B
@ C (x
n

..

.. C B .. C B
. CB . C = B

..
.

x1 ) : : : C (xn xn ) 1 A @ n A
:::

C (x1 x0 ) 1

@ C (x

..
.

x0

C
C
)A

o les  sont des pondrateurs affecter aux points de donnes et o  est


un paramtre de Lagrange qui intervient pour des raisons algbriques. Le
membre gauche du systme contient les covariances entre les points de donnes, tandis que le membre droit contient les covariances entre chaque point
de donne et le point destimation x0 .
Ce systme, une fois rsolu, permet de transfrer au point x0 de linformation en provenance des points de donnes voisins, par le calcul dune
moyenne pondre

z ? (x0 )

n
X
=1

 z (x )

En effectuant la multiplication matricielle, on peut rcrire le systme sous


la forme
8 n
X
>
>
>
 C (x
>
>
< =1
n
>
X
>
>
>

>
:
=1

x )  = C (x x0 )

pour = 1; : : : ;n

=1

La condition que les poids soient de somme unit exprime le fait que dans
le cas extrme o les donnes sont gales une constante dans un voisinage
donn, la valeur estime reproduira cette constante.
30

Krigeage de la moyenne locale


Dans le cadre dun modle de fonction alatoire localement stationnaire,
on est intress par une estimation de la moyenne locale ml (x0 ).
Lestimateur bas sur une combinaison linaire de variables alatoires Z
implantes en n points de donnes x proximit dun point arbitraire x0

m?l (x0 )

n
X
=1

 m Z (x )

Lestimateur doit tre non biais au sens que lon veut que lerreur destimation, cest--dire la diffrence entre la valeur estime m?l (x0 ) et la valeur
effective ml (x0 ), soit nulle en moyenne. Lesprance de lerreur est gale
h

E m?l (x0 ) ml (x0 ) = E

n
hX
=1

 m Z (x )

ml (x0 ) = ml (x0 )

n
X
=1

 m

ml (x0 )

en identifiant ml (x ) ml (x0 ) sur la base de lhypothse de stationnarit locale.


Lesprance de lerreur sannule avec des pondrateurs de somme unit, ce qui
donne la condition de non biais
n
X
=1

 m = 1

La variance E2 de lerreur destimation (variance destimation) vaut, en


utilisant la condition de non biais


E2 = var m?l (x0 )

= E
=

"
n
X

2

 m Z (x )

ml (x0 )

 m  m C (x

x )

=1
n X
n
X
=1 =1

ml (x0 )

Dans le but doptimiser la variance destimation, on construit une fonction


objectif  en introduisant la contrainte sur les pondrateurs avec un paramtre
de Lagrange m

=

E2

2 m

n
X
=1

 m

En annulant les drives partielles selon  m

@
= 0
@ m

()

n
X
=1

31

 m C (x x )

2 m = 0

et selon m

@
= 0
@m

()

n
X
=1

 m

1 =0

on obtient le systme de krigeage de la moyenne locale


8 n
X
>
>
>
 m C (x
>
>
< =1
n
>
X
>
>
>
 m
>
:
=1

x ) m = 0

pour = 1; : : : ;n

=1

2 , cest dire la variance destimation loptiLa variance de krigeage K


mum, est gale

K2

n
X
=1

 m

n
X
=1

 m C (x x ) = m
{z

m

On notera bien la diffrence entre un krigeage de la moyenne locale et le


calcul de la moyenne arithmtique des donnes dans le voisinage de krigeage:
cette dernire ne tient pas compte de la disposition spatiale des chantillons.

Krigeage de la composante intrinsque


Si Z (x) est dfinie dans le cadre du modle de rgionalisation intrinsque
dcrit plus haut, on peut chercher estimer la composante intrinsque ZS (x)
partir de donnes dans le voisinage en formant lestimateur

ZS? (x0 )

n
X
=1

 S Z (x )

On obtient le non biais de lerreur destimation en utilisant des pondrateurs de somme unit
h

ZS? (x0 )

ZS (x0 )

= E

=
=

n
hX
=1

n
X
=1
n
X
=1

 S Z (x )
h

 S E
 S

Z (x )

ZS (x0 ) 
i

n
X

 S

=1
| {z }
1

ZS (x0 )

S 1 h
X

i

E Zu (x ) + E ZS (x ) ZS (x0 )

u=0 |

32

{z
0

{z
0

= 0
La variance destimation E2 scrit

E2 = var (ZS? (x0 )


2

ZS (x0 ))

S 1X
n
X

= E4

u=0 =1

 S Zu (x ) +

n
X
=1

! 3
 2
ZS (x0 ) 5

 S ZS (x )

En tenant compte de la non corrlation

E2

S 1X
n X
n
X

 S  S C u (x x )

u=0 =1 =1
n X
n
X
=1 =1
S 1
X

u=0

 S  S S (x

S (x

x )

x0 ) + 2

n
X
=1

 S S (x x0 )

C u (x0 x0 )
S (x0

x0 )

n X
n
X
=1 =1

 S  S (x

x ) + 2

n
X
=1

 S S (x x0 )

En optimisant sous contrainte, on a le systme


8 n
X
>
>
>
 S (x
>
>
< =1
n
>
X
>
>
>
 S
>
:
=1

x ) + S = S (x x0 )

pour = 1; : : : ;n

=1

Ce systme diffre de celui du krigeage ordinaire par lapparition dans le


membre droit de termes S (x x0 ) spcifiques la composante ZS (x).

Krigeage dune composante stationnaire


Pour kriger une composante stationnaire dordre deux particulire Zu0 ,
dans le modle de rgionalisation intrinsque, on part de la combinaison linaire
n

Zu?0 (x0 ) =

X
=1

 u0 Z (x )

Le non biais est obtenu sur la base dune somme des pondrateurs nulle

Zu?0 (x0 )

Zu0 (x0 )

= E

 S n
XX
u=0 =1

33

 u0 Zu (x )

Zu0 (x0 )

on introduit un point fictif pour former des accroissements

= E

S 1 n
XX
u=0 =1
n
X

=1

S 1X
n
X
u=0 =1

 u0 Zu (x )

=1

{z
0
h

 u0 E ZS (x )
|

E2 = var Zu?0 (x0 )

C u0 (x

x0 )

n
X

 u0

=1
| {z }
0
h
i
E Zu0 (x0 )
|
{z
}
0
i

{z
0

= 0
La variance destimation est

ZS (0) 

 u0 ZS (x )

 u0 E Zu (x )

n
X

Zu0 (x0 )

ZS (0)

Zu0 (x0 )
n X
n
X
=1 =1

 u0  u0 (x

x ) + 2

n
X
=1

 u0 (x x0 )

Le systme de krigeage de la composante Zu0 (x0 ) est alors


8 n
X
>
>
>
 u0 (x
>
>
< =1
n
>
X
>
>
>
 u0
>
:
=1

x ) + u0 = u0 (x x0 )

pour = 1; : : : ;n

=0

On est ainsi capable dextraire des donnes des composantes de variation


spatiale, en partant dune interprtation du variogramme exprimental par un
variogramme gigogne.
Ces techniques sont proches des mthodes danalyse spectrale, trs populaires en prospection gophysique.
R EMARQUE 6.1 (F ILTRAGE ) Soit Z (x) une fonction alatoire dfinie dans un
modle de rgionalisation localement stationnaire. On filtre une composante
spatiale en retirant les covariances correspondantes Cu (x x0 ) du membre
droit de lquation du krigeage ordinaire. Ainsi peut-on par exemple liminer
leffet de ppite en retirant les termes correspondant C0 (h) du membre droit
et lon obtient alors une estimation ampute de la composante ppitique z0 (x).
34

R EMARQUE 6.2 (M AILLE D CHANTILLONNAGE IRRGULIRE ET KO) Prenons


une variable rgionalise pour laquelle on aurait identifi trois composantes
de variation non corrles, que lon interprte comme des ralisations de fonctions alatoires stationnaires dordre deux, plus une moyenne locale

z (x) = z0 (x) + z1 (x) + z2 (x) + ml (x)


A cette situation correspond le modle de covariance

C (h) = C0 (h) + C1 (h) + C2 (h)


avec C0 (h) un effet de ppite et C1 (h);C2 (h) des modles sphriques de portes a1 et a2 , numrots de sorte que a1 < a2 .
Supposons que la maille dchantillonnage soit trs irrgulire, entranant
une rpartition des donnes extrmement ingale dans lespace. Afin dtablir
une carte, on va construire un rseau de points, aussi fin que lon voudra, et
lon excutera en chaque point lopration de krigeage ordinaire.
Vu la grande irrgularit dans la disposition des chantillons, diffrents cas
de figure peuvent se prsenter, que nous allons examiner sparment dans la
suite.
1. x0 est loign > a2 des donnes

Ce cas de figure peut se produire si x0 se trouve en plein milieu dun grand


trou dans la maille dchantillonnage. Le krigeage ordinaire est alors quivalent un krigeage de la moyenne.
Le membre droit est nul puisque toutes les composantes sannulent pour
un cartement suprieur a2 . Linformation transfre au point x0 sera une
estimation de la moyenne locale dans le voisinage.
2. x0 est cart < a2 et > a1 du point x le plus proche

Avec cette disposition spatiale le systme de krigeage ordinaire est quivalent un filtrage des composantes z0 (x) et z1 (x),
8 n
X
>
>
>
 C (x
>
>
< =1
n
>
X
>
>
>

>
:
=1

x )  = C2 (x x0 )

=1
35

pour = 1; : : : ;n

3. x0 est situ < a1 et > 0 du point x le plus proche

Dans cette situation le krigeage ordinaire transfrera de linformation non


seulement sur la composante de longue porte z2 (x), mais aussi sur la composante z1 (x), qui varie plus rapidement dans lespace et qui suscitera une
description plus dtaille de la variable rgionalise dans les zones de la carte
o les donnes abondent. On devine que le krigeage ordinaire est maintenant
quivalent au filtrage,
8 n
X
>
>
>
 C (x
>
>
< =1
n
>
X
>
>
>

>
:
=1

x )  = C1 (x x0 ) + C2 (x x0 )

pour = 1; : : : ;n

=1

4. x0 concide avec un point de donne

Dans ce dernier cas, le krigeage ordinaire ne filtrera rien du tout et restituera fidlement la donne mesure au point x = x0 : cest un interpolateur
exact !
Cette fidlit peut cependant tre indsirable lorsquil ny a que quelques
points de concidence, purement fortuits, entre une maille dchantillonnage
irrgulire et une maille destimation rgulire. Pour viter des sauts abrupts
des valeurs estimes en ces quelques points, certains programmes de krigeage
vocation cartographique (tel Bluepack) proposeront de filtrer systmatiquement la composante ppitique z0 (x).
E XERCISE 6.3 On dit quil y a interpolation exacte, si lestimation en un point
de donne restitue la valeur de la donne. Montrer que le krigeage ordinaire
(ponctuel) est un interpolateur exact.
E XERCISE 6.4 Z (x) est une FA stationnaire dordre 2 desprance nulle, scinde en deux composantes non corrles desprance nulle, selon le modle de
rgionalisation

Z (x) = Y P (x) + Y G (x)

o Y P (x) est la composante de petite porte de covariance C P (h), et o Y G (x)


est la composante de grande porte de covariance C G (h), avec

C (h) = C P (h) + C G (h)


Les donnes sont disposes sur une grille rgulire, et lon fait du krigeage
simple (sans condition duniversalit) aux noeuds de cette mme grille pour
36

estimer les composantes de courte et de longue porte, en utilisant un voisinage constitu de toutes les donnes.
Quelle relation peut-on tablir entre les pondrateurs P et G
des deux
composantes en chaque point du voisinage de krigeage?
E XERCISE 6.5 Z (x) est une FA localement stationnaire dordre 2, constitue
de composantes Y P (x) et Y G (x) non corrles desprances nulles, ainsi que
dune drive assimilable une constante dans tout voisinage local du domaine.
Montrer que la somme des krigeages des composantes et du krigeage de
la moyenne est gale au krigeage ordinaire de Z (x)

YP? (x0 ) + YG? (x0 ) + m?0 = Z ? (x0 )

37

Drive externe

Deux variables mesurant la mme chose


Il arrive que deux variables mesures par des procds diffrents traduisent le mme phnomne et que la premire variable est prcise, mais
connue en peu de points seulement, tandis que la seconde variable est connue
peu prs partout dans le domaine spatial, mais avec une prcision plus approximative, donnant uniquement lallure gnrale de la morphologie du phnomne rgionalis.
Lexemple classique provient de lexploration ptrolire, o lon cherche
cartographier un niveau gologique, qui est en gnral continu (mis part des
failles), parce que le ptrole se trouve dans des formations sdimentaires. On
dispose de deux sources dinformation:
de mesures prcises de la profondeur dune couche faites sur des forages
ptroliers. Ces mesures sont cependant peu nombreuses cause du cot
trs lev des forages. Elles sont modlises par une fonction alatoire
Z (x).
de mesures imprcises, mais trs abondantes spatialement, de la profondeur de la couche dduite des temps sismiques. Cette deuxime variable
est reprsente par la variable rgionalise s(x).
Puisque Z (x) et s(x) sont deux expressions du mme phnomne profondeur de la couche, on suppose que Z (x) est en moyenne proportionnelle
s(x) une constante a0 prs
h

E Z (x) = a0 + b1 s(x)
s(x) est une fonction qui dcrit lallure gnrale (shape en Anglais) de
la carte de la couche, tandis que les donnes de Z (x) donnent en quelques
endroits seulement une information prcise sur la profondeur de la couche.
Estimation avec une fonction de forme
Dans un premier temps on va examiner le cas dune fonction alatoire Z (x)
dont on voudrait amliorer lestimation en introduisant la fonction de forme
s(x).
38

On impose que la valeur estime avec des pondrateurs de somme unit


soit en moyenne cohrente avec une interpolation exacte de s(x)
h

Z ? (x

0)

n
X
=1

 E Z (x ) = a0 + b1

n
X
=1

 s(x ) = a0 + b1 s(x0 )

et on obtient la condition suivante sur les pondrateurs

s(x0 ) =

n
X
=1

 s(x )

Cela donne une condition supplmentaire intgre dans la fonction objectif

 = E2

1

n
X
=1

2

n
X
=1

 s(x )

s(x0 )

Le systme de krigeage ordinaire devient alors un systme de krigeage


universel
8 n
X
>
>
>
 C (x
>
>
>
>
=1
>
>
>
>
n
<X

x ) 1 2 s(x ) = C (x x0 )

pour = 1; : : : ;n

 = 1

>
>
=1
>
>
>
>
n
>
X
>
>
>
 s(x )
>
:
=1

= s(x0 )

Le cadre fix jusquici parat videmment trop troit pour la plupart des
applications et il convient de passer des modles non stationnaires.

Drive invariante par translation


Considrons une fonction alatoire
toire intrinsque dordre k )

Z (x) non stationnaire (fonction ala-

Z (x) = Zk (x) + mk (x)


constitue dune partie dterministe mk (x), modlisant la drive par un polynme, et dune partie alatoire Zk (x) de covariance gnralise K (h). La
drive mk (x) est un polynme de degr k de fonctions des coordonnes fl (x)
avec des coefficients al

mk (x) =

L
X
l=0

39

al fl (x)

Les fonctions fl (x), au nombre de L + 1, doivent engendrer un espace vectoriel invariant par translation. On peut montrer que les seuls ensembles de
fonctions satisfaisant cette condition sont les exponentielles-polynmes.
R EMARQUE 7.1 A deux dimensions spatiales, de vecteur de coordonnes x =
(x1 ;x2 ), on prend gnralement les monmes suivants:

f0 (x) = 1; f1 (x) = x1 ; f2 (x) = x2 ; f3 (x) = (x1 )2 ; f4 (x) = x1  x2 ; f5 (x) = (x2 )2


qui engendrent un espace vectoriel invariant par translation. Le nombre de
fonctions de base, L+1, dpend alors du degr k de la drive de la manire
suivante:
k = 0 ) L = 0 (une fonction de base)
k = 1 ) L = 2 (trois fonctions de base)
k = 2 ) L = 5 (six fonctions de base)
Ayant en vue des problmes destimation, on regarde les pondrateurs 
interpolant exactement les termes al fl (x) de la drive
n
X
=1

 al fl (x ) = al fl (x0 )

Les coefficients al sont manifestement redondants et il suffit de considrer


linterpolation des fonctions de base fl (x).
En se limitant des pondrateurs ainsi dfinis, on constate que lerreur
destimation sannule
h

E Z ? (x0 ) Z (x0 ) = E Zk? (x0 ) Zk (x0 ) = 0


pour

Pn

=1  fl (x )

= fl (x0 ) et l = 0; : : : ;L.

R EMARQUE 7.2 En introduisant un pondrateur 0

Z ? (x

0)

Z (x0 ) = E

 n
X
=0

 Zk (x ) = 0

= 1, on peut aussi crire

pour

n
X
=0

 fl (x ) = 0;

8l

o des pondrateurs de somme nulle filtrent une drive invariante par translation.

Covariance gnralise
Une fonction symtrique K (h) est la covariance gnralise dune fonction
alatoire intrinsquement stationnaire lordre k , si
n
X

var

=0

 Zk (x ) = E

 n
X
=0

2 

 Zk (x )
40

n X
n
X
=0 =0

  K (x x )

P
pour tout ensemble de pondrateurs satisfaisant n =0  fl (x ) = 0 pour
chaque l = 0; : : : ;L.
Une covariance gnralise est une fonction de type positif conditionnel
dordre k
n X
n
X
=0 =0

  K (x x )  0

pour

n
X
=0

 fl (x ) = 0; l = 0; : : : ;L

Linfrence du degr maximal du polynme filtrer et de la covariance


gnralise se fait habituellement via des algorithmes automatiss.
R EMARQUE 7.3 Un modle possible de covariance gnralise dordre k est

K (h) =
o


2

jh j

avec

0 <  < 2k+2

() est la fonction gamma.

R EMARQUE 7.4 On peut construire partir du modle prcdent une autre


covariance gnralise dordre k , appele polynomiale

Kpol (h) =

k
X
u=0

bu ( 1)u+1 jhj2u+1

avec 1

bu  0

Cette covariance gnralise gigogne a la particularit de renfermer des


structures avec des comportements trs diffrents lorigine. Pour k = 1 (drive linaire) le terme en u= 0 est linaire lorigine et est adapt pour des
variables rgionalises continues mais non drivables, tandis que le terme en
u= 1 est appropri pour des variables rgionalises drivables.
En rajoutant une covariance ppitique ce modle, on couvre galement
des phnomnes plus erratiques (discontinus). Le modle prend alors un caractre polyvalent en ce qui concerne le comportement lorigine, et est particulirement bien adapt pour des ajustements automatiques, quitte ce que
les structures inutiles dans la modlisation dune application aient des coefficients bu nuls.
Les covariances gnralises polynomiales sont importantes, parce que
lont peut les utiliser en voisinage glissant.

Krigeage avec drive externe


La mthode de la drive externe consiste intgrer dans le systme de krigeage des conditions duniversalit supplmentaires, relatives une ou plusieurs variables externes si (x); i = 1; : : : ;N mesures de manire exhaustive
dans le domaine. En fait, on doit connatre les si (x) en tous les points de donnes x des chantillons de Z (x), ainsi quaux noeuds de la grille destimation.
41

Il faut bien voir que les conditions


n
X
=1

 si (x ) = si (x0 )

i = 1; : : : ;N

sont rajoutes au systme de krigeage indpendamment du choix de la classe


de covariances K (h), do la dnomination tout--fait pertinente de drives
externes. La classe de covariances gnralises ne pourra en effet tre fonction que de lensemble de fonctions de base fl (x), quon peut qualifier dans ce
contexte de drive interne.
R EMARQUE 7.5 Si on adopte une dfinition aussi restrictive pour la drive externe, il apparat que la thorie classique du Krigeage Universel, dans laquelle
on se limite demble la classe des variogrammes (h) ou la classe des fonctions de covariances C (h), ne fait usage que de drives externes ! On pourrait
mme dire que les problmes dinfrence du KU proviennent du fait que les
fonctions de drive fl (x) (l > 0) ou si (x) restent toujours externes (hormis le
cas o les drives sont constantes dans une direction donne, qui permet linfrence du variogramme sous-jacent moyennant une hypothse disotropie).
Le systme de krigeage avec drive interne et drives externes multiples
scrit finalement
8
n
>
>X
>
 K (x
>
>
>
>
=1
>
>
>
>
>
>
<
n
X
>
>
 fl (x )
>
>
>

=1
>
>
>
n
>
X
>
>
>
 si (x )
>
:
=1

x )

L
X
l=0

l fl (x )

N
X
i=1

i si (x ) = K (x x0 )
pour = 1; : : : ;n

= fl (x0 )

pour l = 0; : : : ;L

= si (x0 )

pour i = 1; : : : ;N

Quand on travaille en voisinage glissant, il est utile de cartographier galement les coefficients bi des drives externes pour se rendre compte de linfluence exerce par les diffrentes variables externes au niveau de chaque
noeud de la grille destimation.
E XEMPLE 7.6 (daprs [41]) La Figure 7.1 montre la carte des tempratures
moyennes au mois de Janvier ralise par krigeage (en voisinage glissant)
avec une drive linaire, partir de mesures en 146 stations mtorologiques
toutes situes en dessous de 400m daltitude (alors que le plus haut point de
lEcosse, le Ben Nevis, est situ 1344m). On peut raisonnablement faire lhypothse que la temprature est en relation linaire avec laltitude et utiliser
une carte topographique digitalise pour introduire laltitude comme drive
42













 






  
 


  
 

  
 

  
 

  
 

  
 

F IG . 7.1 Krigeage avec une drive linaire des tempratures en Janvier en Ecosse.

externe s(x) dans le krigeage de des tempratures. La carte correspondante est


reproduite sur la Figure 7.2, tandis quune carte du coefficient b de la drive
externe est exhibe sur la Figure 7.3.

E XERCISE 7.7 (daprs [4]) On sintresse des couples de valeurs (z ;s )


dune variable dintrt Z (x) de fonction de covariance C (h) et dune drive
externe s(x) en des points x , = 1; : : : ;n dun domaine D. Ces valeurs sont
ranges respectivement dans des vecteurs z et s de dimension n.

Pour fixer les notations, nous rappelons des systmes de krigeage relatifs
43













 






  
 

   
 

 
   

  
 

 
  

  
 

 
 

 
 

F IG . 7.2 Krigeage avec une drive linaire des tempratures en Janvier en Ecosse en
utilisant une carte topographique digitalise comme drive externe.

lestimation de la variable dintrt, ainsi que le krigeage de la moyenne,


Krigeage Simple (KS):

C lKS = c0
Krigeage Ordinaire (KO):


C> 1

1
et



lKO

KO

lKO

KO

lKS = R c0

et


= c10

=K

1k

cest--dire:

avec:
44

R=C

o:

K


lKO

KO

K = vA> wv
1

= k0













 






   
   

 
   

   
  

  
  

  
  

  



   

F IG . 7.3 Carte du coefficient b de la drive externe dans le krigeage des tempratures


en voisinage glissant.

Krigeage avec drive Externe (KE):


0

C> 1 s

10

lKE

c0

0 0 A @ KE A = @ 1 A
s0
0 KE
0 0

@1

s>

cest--dire:

lKE

F @ KE A = f0
0 KE

Krigeage de la Moyenne (KM):

lKM

KM

 

= o1

m?

et

n
X
=1

a) Montrer que la variance du KO scrit:

k>0 K 1 k0

2 =c
KO
00

45

>
1
KM z = (z ;0) K

 

o
1

b) En se basant sur les relations suivantes entre les matrices et vecteurs du


KO:

C A + 1 v>
Cv + 1 w
>
1A
1> v

=I
=o
= o>
=1

montrer que le krigeage de la moyenne peut sexprimer comme:

z> R 1
m? = >
1 R1
c) On dfinit un produit scalaire (de Castelier):

x> R y

< x;y >= >


1 R1
et, au moyen de celui-ci, une moyenne et une covariance:
h i

En z

= < z;1 >

En z;s

= < z;s >

covn z;s

= En z;s

h i

h i

En z En s

Sur la base dun pseudo-produit scalaire de Castelier dfini au moyen de


linverse K 1 du KO (au lieu de linverse R du KS):


Kn z;s
montrer que:

Kn z;s

= (z> ;0) K 1

 

0


= z> A s = 1> R 1 covn z;s

d) Sachant que la drive externe est lie lesprance de la variable dintrt par une relation linaire:
h

E Z (x) = a + b s(x)
et que la constante a et le coefficient b de la drive externe sont estims par:
0 1

b? = (z> ;0;0) F

0 1

1 @0A

a? = (z> ;0;0) F

et

1 @1A

montrer que b? et a? sont les coefficients dune rgression linaire au sens du


produit scalaire de Castelier:


b?

covn z;s


covn s;s

a?

et

46

h i

= En z

b? E

h i
n

E XERCISE 7.8 (daprs [4]) Considrons, dans un premier temps, que nous
possdons une donne z0 en un point supplmentaire x0 , et crivons la matrice
membre gauche du KO avec n + 1 informations:


>
K0 = ck00 kK0

K0

et

v>0
= wv00 A
0

o c00 = C (x0 x0 ), K, k0 sont dfinis comme dans lexercice prcdant.


Etant donn que K0 K0 1 = I, on peut poser les relations:

c00 w00 + k>0 v0


k0 w00 + K v0
c00 v>0 + k>0 A0
k0 v>0 + K A0
a) Montrer que:

w00 =
b) Soient z>0

=1
=o
= o>
=I

2
KO

= (z0 ;z> ) et s>0 = (s0 ;s> ) des vecteurs de dimension n + 1 et:




Kn+1 z0;s0

= (z> ;0) K 1
0

s0

Montrer que:


Kn+1 z0;s0

= Kn z;s + w00 z0

(z> ;0) K 1 k0

 

s0

(s> ;0) K 1 k0

c) Soit (z0 jz) lerreur du KO:

(z0 jz) = z0

z0? = z0

(z> ;0) K 1 k0

Montrer que:


Kn+1 z0;s0
et que:

= z0

(s0 js)
2
KO

(z> ;0) K 1 k0


(s0 js)
= (w00 ;v>0 )  s00
2
KO

 
(s0 js)
+
K
z;s
n
2
KO


E XERCISE 7.9 (daprs [4]) Dans un deuxime temps, on sintresse un KO


avec n 1 points et lon note (z jz ) lerreur en un point x dun krigeage nutilisant que les n 1 donnes contenues dans le vecteur z> =
(z1 ; : : : ;z 1 ;z +1 ; : : : ;zn ) et lon crit  2 la variance de krigeage correspondante.
47

a) Dduire de ce qui prcde la trs lgante relation:


0

 

B (s

s =B
B
B
0
@

.
..

js

 2
.
..

) C
C

C
C
A

m?
b) Sachant que lon a pour le coefficient de la drive externe:


Kn z;s
b? =
 b z =  
Kn s;s
=1
n
X

montrer que lon a:

 b =

(s js )
 2 Kn s;s

On saisit lintrt, dans la pratique, du calcul des erreurs (s js ). Elles


peuvent, en effet, servir montrer linfluence des diffrentes valeurs s sur un
KE dans un voisinage donn.

48

Drive temporelle

Drive spatiale et temporelle


Dans ltude du magntisme terrestre proximit de lquateur, on
constate une forte variation temporelle avec une priode de 24 h, de la
rotation de la terre. Les mesures prises par un bateau zigzaguant pendant
plusieurs jours dans un domaine dtude en rgion quatoriale doivent tre
corriges de leffet de cette variation diurne, si lon veut tablir une carte, en
quelque sorte intemporelle, du magntisme (S GURET & H UCHON [89]).
Le magntisme est modlis par une fonction alatoire spatio-temporelle
Z (x;t) compose de deux fonctions alatoires intrinsques dordre k Zk;! (x),
Zk;! (t) (supposes non corrles), dune drive spatiale polynomiale mk (x) et
dune drive temporelle priodique m! (t)

Z (x;t) = Zk;! (x) + mk (x) + Zk;! (t) + m! (t)

o x est un point appartenant au domaine spatial D et t est une coordonne


du temps T .
La variation temporelle du magntisme est connue partir de stations
fixes. A proximit de lquateur, la composante prpondrante est une drive
priodique

m!;' (t) = sin(! t + ')


de priode ! =24 heures et de phase '. En utilisant une relation bien connue,
on peut aussi crire

m! (t) = a sin(! t) + b cos(! t)


o a = cos ' et b = sin ' sont des constantes multiplicatives qui seront prises
en charge, dans les calculs, par les divers pondrateurs affects la drive, de
sorte que le paramtre de phase ' devient implicite.

Filtrage de la variation temporelle


En zone quatoriale, la composante temporelle alatoire Zk;! (t) du magntisme se traduisant par un bruit de faible ampleur par rapport m! (t), on peut
adopter dans un premier temps le modle

Z (x;t) 
= Zk;! (x) + mk (x) + m! (t)
49

Pour cartographier un magntisme intemporel Z (x) = Zk;! (x) + mk (x),


on fait dabord linfrence de la covariance gnralise en tenant compte de la
drive spatio-temporelle, puis on filtre la drive temporelle en lannulant dans
le membre droit du systme de krigeage
8
n
L
X
>
>X
>
>

K
(
x
x
)
l fl (x )



>
>
>
>
=1
l=0
>
>
>
>
>
>
>
>
>
n
>
>X
>
>
<
 fl (x ) = fl (x0 )
=1
>
>
> n
>
X
>
>
>
 sin(! t ) = 0
>
>
>
>
=1
>
>
>
>
>
n
>
X
>
>
>
 cos(! t ) = 0
>
:
=1

1 sin(! t ) 2 cos(! t )

= K (x x0 )

pour = 1; : : : ;n

pour l = 0; : : : ;L

avec = 1; : : : ;n et l = 0; : : : ;L.
Si toutefois la composante temporelle alatoire Zk;! (t) est non ngligeable,
il faut dabord faire linfrence de la covariance gnralise K (t) correspondante, puis filtrer Z (t) = Zk;! (t) + m! (t) par le systme (avec = 1; : : : ;n et
l = 0; : : : ;L)
8
n
X
>
>
>
>
 K (x x ;t t )
>
>
>
>

=1
>
>
>
>
>
>
>
>
>
n
>
X
>
>
>
<
 fl (x ) = fl (x0 )
=1
>
>
>
n
>
X
>
>
>
 sin(! t ) = 0
>
>
>
>

=1
>
>
>
>
>
n
>
X
>
>
>
 cos(! t ) = 0
>
:
=1

o les termes

K (t t ).

L
X
l=0

l fl (x )

1 sin(! t ) 2 cos(! t )

= K (x x0 )

pour = 1; : : : ;n

pour l = 0; : : : ;L

K (x x ;t t ) sont la somme des covariances K (x x ) et

50

Covariance Croise

Fonction de covariance croise


Les fonctions de covariance Cij (h) dun ensemble de N fonctions alatoires
Zi (x) sont dfinies par lhypothse de stationnarit dordre deux conjointe
8 h
i
>
< E Zi (x) = mi
h

>
: E Zi (x) mi Zj (x+h)

mj

i

pour tout x 2 D; i = 1; : : : ;N

= Cij (h) pour tout x 2 D; i;j = 1; : : : ;N

La moyenne de chaque variable Zi (x) en tout point du domaine est gale


une constante mi . La covariance dune paire de variables ne dpend que du
vecteur h reliant une paire de points et elle est invariante pour toute translation de la paire de points dans le domaine.
La matrice de fonctions de covariance simples et croises est de type positif, la variance de toute combinaison linaire de N variables en n+1 points
avec un ensemble de poids i devant tre positive
N X
N X
n X
n
X
i=1 j =1 =0 =0

i Cij (x x ) j  0

pour tout x ;x

2 D; i ;j 2 R

Effet de retard
La fonction de covariance croise nest pas a priori une fonction paire ou
impaire. Gnralement on a pour i6= j

Cij (h) 6= Cji (h)


mais toujours

et

Cij ( h) 6= Cij (+h)

Cij (h) = Cji ( h)

En particulier, il arrive que le maximum de la fonction de covariance soit


dcal de lorigine h= 0 vers un point r6= 0. Ce dcalage de la corrlation
maximale est frquent pour des sries temporelles, o une variable peut avoir
une influence sur une deuxime variable. Le temps de raction de la deuxime
51

variable des fluctuations de la premire provoque alors un retard dans la


corrlation entre les sries temporelles.
E XEMPLE 9.1 Soit Z1 (x) une fonction alatoire obtenue en multipliant par une
constante a une fonction alatoire Z2 (x) dcale de r

Z1 (x) = a Z2 (x r) + E (x)
o E (x) est une erreur de mesure sans corrlation spatiale, de moyenne nulle
et de fonction de covariance Cpep (h).
La fonction de covariance simple de Z1 (x) est proportionnelle celle de

Z2 (x)

C11 (h) = a2 C22 (h) + Cpep (h)

et la fonction de covariance croise est obtenue partir de la fonction paire


C22 (h) translate de r

C12 (h) = a C22 (h

r)

E XERCISE 9.2 Calculer la fonction de covariance croise entre Z1 (x) et Z2 (x)


pour

Z1 (x) = a1 Z2 (x

r1 ) + a2 Z2 (x r2 )
dans laquelle interviennent deux dcalages r1 et r2 .

Variogramme crois
Le variogramme crois ij (h) fait son apparition dans le cadre dune hypothse de stationnarit intrinsque conjointe de N fonctions alatoires
i
8 h
>
E Zi (x+h) Zi (x) = 0
>
>
<
h

cov
Z
(
x
+
h
)
Z
(
x
)
; Zj (x+h)
i
i
>
>
>
:

Zj (x)

i

8 x 2 D; i = 1; : : : ;N
= 2 ij (h)

8 x 2 D; i;j = 1; : : : ;N

Il sensuit quil est dfini par

1 h
ij (h) = E Zi (x+h)
2

Zi (x)

 

Zj (x+h)

i

Zj (x)

Le variogramme crois tant de toute vidence une fonction paire, il est


intressant dtudier sa relation avec la covariance croise dans un contexte
de stationnarit dordre deux. On obtient facilement la formule

ij (h) = Cij (0)


1
Cij ( h) + Cij (+h)
2

52

qui montre que le variogramme crois prend la moyenne de la valeur en h et


en +h de la fonction de covariance correspondante. En dcomposant la fonction de covariance croise en une fonction paire et une fonction impaire

Cij (h) =

 1

1
Cij (+h) + Cij ( h) + Cij (+h) Cij ( h)
|2
{z
} |2
{z
}

terme pair

terme impair

on voit que le variogramme crois nincorpore que le terme pair de la fonction


de covariance croise.
E XEMPLE 9.3 (G AS F URNACE D ATA ) On trouve dans B OX & J ENKINS [2]
(p. 371, 532) lexemple de deux sries temporelles correspondant, dune part,
la fluctuation du volume dun gaz introduit dans un fourneau, dautre part,
la fluctuation du taux de CO2 en rsultant. La raction chimique prenant
quelques dizaines de secondes, on observe un effet de retard sur des mesures
prises toutes les 9 secondes.
La Figure 9.1 montre la covariance croise exprimentale

Cij? (h)

nh 
 

1 X
=
zi (x ) mi  zj (x +h) mj
nh =1

qui permet de constater un retard de 45 secondes entre les fluctuations de


lapport de gaz et leur effet sur le taux de gaz carbonique mesur en sortie du
systme. La mme Figure 9.1 exhibe le variogramme crois exprimental

ij? (h)

nh 
 

1 X
=
z (x +h) zi (x )  zj (x +h) zj (x )
2nh =1 i

qui est symtrique par rapport lordonne.


La Figure 9.2 reproduit les valeurs du terme pair et du terme impair de la
covariance croise exprimentale. On y retrouve, dans le terme pair, la structure suggre par le variogramme crois. Le terme impair mesure le degr
dasymtrie de la covariance croise par rapport lordonne (en cas de symtrie il serait identiquement nul).

Reprsentation spectrale
La matrice C(h) de fonctions de covariance dun vecteur de fonctions alatoires complexes conjointement stationnaires z(x) (de moyennes nulles, sans
perte de gnralit)

>i

C(h) = E z(x) z(x+h)


53












 

 

 


    

F IG . 9.1 Covariance croise exprimentale Cij? (h) et variogramme crois exprimental ij? (h).
est semi-dfinie positive hermitienne 1 , cest--dire
N X
N X
n X
n
X
i=1 j =1 =0 =0

i Cij (x x ) j  0

pour tout x ;x

2 D; i ;j 2 C

Selon la gnralisation multivariable et multidimensionnelle du thorme


de Bochner, une matrice de fonctions continues C(h), h 2 Rd , est une matrice
de fonctions de covariances, ssi elle admet une reprsentation spectrale

C(h) =

>
ei k h F(dk)

Rd
avec une matrice de fonctions hermitienne F() semi-dfinie positive, quel que
soit largument de F().
1. Une matrice hermitienne est la gnralisation dans le domaine complexe dune matrice
symtrique relle. Les lments diagonaux dune matrice hermitienne A dordre N  N sont
rels et les lments non diagonaux sont gaux la conjugue complexe de leur transpose:
aij = aji .

54









 

 

 


  

F IG . 9.2 Termes pair et impair de la covariance croise exprimentale.

Densit spectrale
Si lon se limite des fonctions de covariance intgrables en valeur absolue,
une densit spectrale fij (k) existe, tel que

Cij (h) =

+1
Z

+1
Z



>
ei k h fij (k) dk

et, en inversant la transforme de Fourier

1
fij (k) =
(2)n

+1
Z

+1
Z



>
e i k h Cij (h) dh

La matrice des densits spectrales dun ensemble de fonctions de covariances continues doit tre semi-dfinie positive pour toute valeur de k. Cela
implique la relation de Schwarz

jfij (k)j2  fii(k) fjj (k)


55

Dphasage
Dans lespace une dimension, le long de laxe temporel par exemple, on
peut aisment interprter des dcalages spectraux. Si lon considre les transformes de Fourier inverses (en admettant leur existence) du terme pair et du
terme impair de la fonction de covariance croise, qui sont appeles tradionnellement le cospectre cij (k ) et le spectre de quadrature qij (k ), on a

fij (k) = cij (k)

i qij (k)
En criture polaire, la fonction complexe fij (k ) sexprime sous la forme
fij (k) = jfij (k)j ei '(k)
o '(k ) est le dphasage moyen de la proportion de Zi (x) de frquence k sur
la proportion de Zj (x) cette frquence, et
Im(fij (k))
q (k )
tan '(k) =
= ij
Re(fij (k))
cij (k)
Un dphasage nul une frquence k implique une partie imaginaire
Im(fij (k)) nulle cette frquence. Lorsquil ny a pas de dphasage aucune
frquence, la densit spectrale croise fij (k ) est relle et sa transforme de
Fourier est une fonction paire.

Corrlation intrinsque
Le modle multivariable de fonctions de covariance relles le plus simple
que lon puisse adopter consiste dcrire les relations entre variables par la
matrice de variance-covariance V et les relations entre les points dchantillonnage par une fonction de corrlation (h) qui est la mme pour toutes
les variables

C(h) = V (h)

Ce modle, dit de corrlation intrinsque, revient choisir des covariances simples et croises qui sont toutes proportionnelles une mme fonction de corrlation de base

Cij (h) = ij (h)


E XERCISE 9.4 Montrer que le modle de corrlation intrinsque est de type
positif.
E XERCISE 9.5 La covariance croise relle stationnaire Cij (h) vrifie-t-elle les
ingalits suivantes:

a)
b)
c)

Cii (0) Cjj (0)


Cij (0)
Cii (h) Cjj (h)
56

 jCij (h)j2
 jCij (h)j
 jCij (h)j2

R
>
E XERCISE 9.6 Soit C(h) = ei k h F(k)dk la reprsentation spectrale dune
matrice de fonctions de covariance relles, continues et intgrables en valeur
absolue.h Montrer
i quil peut arriver que la matrice de distributions spectrales

F(k) = fij (k)

soit hermitienne, bien que C(h) soit relle.

E XERCISE 9.7 Rcemment, une dfinition alternative du variogramme crois


a fait son apparition dans la littrature sous le nom de pseudo-variogramme
crois (PVC), not ij (h). Un auteur le considre comme une gnralisation
plus naturelle du variogramme simple et augure mme quil remplacera
terme le variogramme crois habituel ij (h) (VCH) .
Faites preuve de sens critique en examinant le PVC !
D FINITION (PVC):


1
ij (h) = var Zi (x+h) Zj (x)
2

a) Sagit-il dune gnralisation du variogramme simple ii (h) ?


b) Dans le contexte dune hypothse de stationnarit dordre 2, quelle relation peut-on tablir entre le PVC et la fonction de covariance croise?
c) Dans le contexte dune hypothse intrinsque, quelle hypothse supplmentaire est-on oblig de faire pour le PVC, que lon na pas besoin de
faire pour le VCH?
d) Discuter l(es) avantage(s) et inconvnient(s) que peut prsenter le PVC
par rapport au VCH (les examiner, en particulier, la lumire des
concepts dhtrotopie et de corrlation ngative).

57

10

Cokrigeage

Isotopie et htrotopie
Les mesures disponibles sur deux variables Z1 (x) et Z2 (x) dans un domaine donn peuvent tre situes, soit aux mmes points de mesure, soit en
des points diffrents. On distingue les cas suivants:
isotopie: en tous les points dchantillonnage on dispose dinformations
sur la paire de variables.
htrotopie: les deux variables ont t mesures sur deux ensembles de
points disjoints.
htrotopie partielle: une partie des points de mesure ne sont pas communs
aux deux variables. Un cas particulier dhtrotopie partielle est celui o
lensemble des points de mesure dune variable est inclu dans lensemble
des points de mesure de lautre variable.
Lestimateur du cokrigeage ordinaire est une combinaison linaire de pondrateurs i avec des variables situes en des points dun voisinage du domaine

Zi?0 (x0 )

ni
N X
X
i=1 =1

i Zi (x )

o lindex i0 dsigne une variable particulire de lensemble de N variables.


On remarque que le nombre dchantillons ni dpend de lindice i des variables, afin dinclure dans la notation le cas de lhtrotopie, partielle ou totale.

Cokrigeage ordinaire
Dans le cadre dune hypothse de stationnarit intrinsque conjointe, on
dsire estimer une variable particulire dun ensemble de N variables, en se
basant sur une erreur destimation nulle en moyenne. Cette condition est remplie en choisissant des pondrateurs de somme unit pour la variable dintrt, et de somme nulle pour les variables auxiliaires
ni
X
=1

i

= ii0 =

58

1 si i= i0 ,
0 sinon

On dveloppe lerreur destimation


h

E
= E

Zi?0 (x0 )

ni
N X
hX
i=1 =1

Zi0 (x0 )

ni
X

i Zi (x )

=1

i 0

ni
N X
X

Zi0 (x0 )

i

i=0 =1
i6=i0 | {z }
0

| {z }
1
ni
N X
h
i
X
i
 E Zi (x ) Zi (x0 )
{z
}
|
i=1 =1
0

Zi (x0 )

= 0

Pour la variance de lerreur destimation il vient alors

E2

=E

  N ni
XX
i=1 =1

i Zi (x )

2 

Zi0 (x0 )

En introduisant des pondrateurs i0 dfinis par

i0

= ii0 =

1 si i= i0 ,
0 si i6= i0

ajouts aux sommations, on condense lexpression de la variance destimation

E2

=E

  N ni
XX
i=1 =0

2 

i Zi (x )

puis, en introduisant des variables alatoires fictives situes arbitrairement


lorigine, on peut former des incrments

E2

= E

= E

 N  ni
X X
i=1 =0

 N ni
XX
i=1 =0

i Zi (x )

Zi (0)

i Zi (x )
|

{z

Zi (0)

incrments

ni
X

i

=0
| {z }
0
2 

et une covariance croise dincrments CijI (x ;x )

E2

nj
ni X
N X
N X
X
i=1 j =1 =0 =0

59

i j CijI (x ;x )

2 

Il est important de voir que lon est oblig dintroduire, du point de vue
physique, lhypothse que les covariances croises dincrments sont symtriques, pour pouvoir les remplacer par des variogrammes croiss. A cette
condition, on a finalement

E2

= 2

N X
n
X
i=1 =1

i ii0 (x x0 )

nj
ni X
N X
N X
X
i=1 j =1 =1 =1

i0 i0 (x0 x0 )

i j ij (x x )

Aprs minimisation, o les contraintes sur les pondrateurs suscitent


paramtres de Lagrange i , vient le cokrigeage ordinaire
8 N nj
XX
>
>
>
j ij (x
>
>
< j =1 =1
ni
>
X
>
>
>
i
>
:
=1

x ) + i = ii0 (x x0 )

pour i = 1; : : : N ; = 1; : : : ni

= ii0

pour i = 1; : : : N

et la variance de cokrigeage
2
CK

ni
N X
X
i=1 =1

i ii0 (x x0 ) + i0

i0 i0 (x0

x0 )

Cokrigeage simple
Le cokrigeage ordinaire na en gnral pas de sens lorsquaucune information nest disponible sur la variable dintrt dans le voisinage o lon dsire
le pratiquer. Par contre, le cokrigeage simple sappuie sur une connaissance
des moyennes des variables, ce qui lui permet de calibrer lestimation dune
variable sans possder aucune donne sur cette variable dans le voisinage de
cokrigeage.
Lestimateur du cokrigeage simple est constitu de la moyenne de la variable dintrt et dune combinaison linaire de pondrateurs i avec les rsidus de toutes les variables par rapport leurs moyennes

Zi?0 (x0 )

= mi0 +

ni
N X
X
i=1 =1

60

i

Zi (x )

mi

On lui associe le systme de cokrigeage simple, crit sous forme matricielle


0
B
B
B
B
B
@

W11 : : : C1j : : : C1N


..
.

...

Ci1
..
.

10

..
.

Wii

...

CB
CB
B
CB
CiN C
C
.. A B
@
.

CN 1 : : : CNj : : : WNN

l1

.. C
. C

li C
C=
C
.. A
.

lN

c1i0

B .. C
B . C
B
C
B cii0 C
B . C
@ .. A

cNi0

o la matrice du membre gauche est construite avec des blocs symtriques


Wii dordre ni  ni sur la diagonale, et des blocs rectangulaires Cij dordre
ni  nj en dehors de la diagonale avec

Cij = C>ji
Dans un contexte disotopie, on peut rcrire le vecteur des pondrateurs
sous la forme de loprateur de vectorisation vec() appliqu une matrice L
dordre n  N contenant les vecteurs li de pondrateurs des variables dans ses
colonnes
0 1
B
B
B
B
B
@

l1

.. C
. C

li C
C = vec(L)
C
.. A
.

lN

De mme, le membre droit peut tre reprsent comme vectorisation dune


matrice C0 dordre n  N contenant les vecteurs de covariances cii0 de chaque
variable avec la variable dintrt. En dsignant par W la matrice membre
gauche dordre nN  nN , le cokrigeage simple peut tre pos comme

W vec(L) = vec(C0 )
Autokrigeabilit
Une variable est dite autokrigeable par rapport un ensemble de variables, si son krigeage propre concide avec son cokrigeage. Le cas trivial est
celui o toutes les variables sont non-corrles avec la variable dintrt, et
lon voit facilement que tous les pondrateurs du cokrigeage sont nuls, mis-part ceux affects aux chantillons de la variable dintrt.
Dans une situation disotopie, une variable est autokrigeable si lensemble
des variables est en corrlation intrinsque, avec une matrice V dfinie positive. Le cokrigeage simple scrit alors

(V
R) vec(L) = vec(c0 v>i0 ) = vi0
r0
La matrice membre gauche du cokrigeage sexprime ici comme le produit
de Kronecker entre la matrice de variance-covariance V et la matrice membre
61

gauche du krigeage R ( une constante prs). Le membre droit correspond


la vectorisation de la matrice rsultant du produit entre le membre droit r0
du krigeage et la transpose dun vecteur vi0 , lequel dsigne la colonne de
V contenant la variance i0 i0 de la variable dintrt. Or, comme on retrouve
vi0 dans le membre gauche, il existe une solution du systme pour laquelle
les pondrateurs du vecteur lio sont ceux du krigeage direct et tous les autres
sont nuls. Cest lunique solution du systme de cokrigeage, vu que V et R
sont supposes dfinies positives.
En examinant les sous-blocs dun systme de cokrigeage quelconque tabli
avec un modle de corgionalisation de type positif dans le cas isotopique,
on saperoit quil suffit, pour quune variable dindice i0 soit autokrigeable,
que la fonction de covariance simple de cette variable soit proportionnelle
chacune des fonctions de covariances croises

Ci0 j (h) = i0 j (h)


E XERCISE 10.1 Montrer que le concept dautokrigeabilit sapplique sous des
conditions identiques au cokrigeage ordinaire et au cokrigeage universel.

62

11 Analyse Krigeante
Ltude des corgionalisations peut tre subdivise en deux parties:
lanalyse de la corgionalisation dun ensemble de variables, base sur
une interprtation par un modle linaire multivariable;
un cokrigeage des facteurs dfinis par lanalyse des corgionalisations.
Lorsquon a affaire qu une seule variable, lopration se rsume au krigeage de composantes spatiales vu prcdemment.
Cet ensemble de techniques a reu le nom danalyse krigeante.

Modle linaire de corgionalisation


Un ensemble de fonctions alatoires fZi (x); i = 1; : : : ;N g peut tre dcompos en des ensembles fZui (x); u = 0; : : : ;S g de composantes spatialement non
correles

Zi (x) =

S
X
u=0

Zui (x)

Aux composantes spatiales sont associes des covariances Ciju (h) de palier
buij et de fonction de corrlation spatiale u (h)

Cij (h) =

S
X
u=0

Ciju (h)

S
X
u=0

buij u (h)

En regroupant les paliers buij en S +1 matrices de corgionalisation Bu


dordre N  N , ncessairement semi-dfinies positives, on obtient le modle
de covariance

C(h) =

S
X
u=0

Bu u (h)

E XERCISE 11.1 Dans quel cas ce modle de covariance est-il quivalent au


modle de corrlation intrinsque?
E XERCISE 11.2 Montrer quune fonction de corrlation u (h) apparaissant
avec un palier non nul sur une covariance croise obtient ncessairement un
palier non nul sur les deux covariances simples correspondantes.
63

Chacune des composantes spatiales Zui (x) peut elle-mme tre dcompose laide de coefficients de transformation aiup en un ensemble de facteurs
Ypu (x) spatialement non corrls et orthogonaux au sens dune mtrique donne

Zui (x)

N
X
p=1

aiup Ypu (x)

En combinant la dcomposition spatiale avec la dcomposition multivariable, on obtient finalement le modle linaire de corgionalisation

Zi (x) =

S X
N
X
u=0 p=1

aiup Ypu (x)

Ajustement bivariable de variogrammes exprimentaux


Le modle de variogramme dduit dun modle linaire de corgionalisation de fonctions alatoires intrinsques scrit

(h) =

S
X
u=0

Bu gu (h)

o les gu (h) sont des variogrammes norms.


Dans le cas bivariable, il est trs simple de dfinir une procdure dajustement du modle de variogramme aux variogrammes exprimentaux. On
commence par ajuster les variogrammes simples en utilisant au moins une
structure commune ces deux variogrammes. Puis on peut ajuster les paliers buij du variogramme crois en utilisant ceux des simples pour dfinir des
bornes garantissant un modle autoris

jbuij j 

buii bujj

Il existe des algorithmes de moindres carrs sous contrainte permettant


dautomatiser lajustement. Lextension de cette procdure plus de deux variables ne garantit pas demble un modle autoris, car les mineurs principaux dordre suprieur deux des matrices Bu ne sont pas forcment positifs.

Ajustement multivariable
Lajustement multivariable de matrices de variogrammes exprimentaux
k ) calcules pour nc classes de vecteurs hk par un algorithme itratif d
G OULARD [35] est bas sur le critre de moindres carrs
? (h

nc
X
k=1

h

tr

? (h

k)

64

2 i

(hk )

que lon cherche minimiser sous la contrainte que les matrices de corgionalisation Bu du modle (h) soient semi-dfinies positives.
En se donnant S matrices Bu semi-dfinies positives, on cherche dans un
premier temps une S +1-ime matrice Bv qui comble au mieux les carts d ?vk
entre un modle S matrices et les matrices exprimentales ? (hk )
d ?vk

? (h

S
X

k)

u=0
u6=v

Bu gu (hk )

La somme des carts pondrs par gv (hk ) est une matrice symtrique d ?v
qui nest en gnral pas semi-dfinie positive. En la dcomposant en valeurs
et vecteurs propres
nc
X
k=1

d ?vk gv (hk ) = d ?v

= Qv v Q>v

avec

Q>v Qv = I

on peut construire avec les valeurs propres positives une nouvelle matrice
d ?v , qui est la matrice semi-dfinie positive la plus proche de d ?v au sens des
moindres carrs
d ?v = Qv ov Q>v

o ov correspond v , si ce nest que des valeurs propres nulles remplacent


les valeurs propres ngatives. En divisant par le carr du variogramme gv (h)
de la S + 1-ime structure, on obtient une matrice semi-dfinie positive B?v
minimisant le critre dajustement

B?v =

nc 
P
k=1

d ?v

2

g v ( hk )

Cette procdure est applique tour de rle chacune des matrices Bu ,


puis itre, et lon constate en pratique une assez bonne convergence du critre, bien que celle-ci ne soit pas assure du point de vue thorique.

Analyse de corgionalisation
Lorsque lon fait tendre h vers linfini dans un contexte de stationnarit
dordre deux avec des fonctions gu (h) de palier unitaire, on voit que le modle
de variogramme tend vers la matrice de variance-covariance

(h) ! V

pour

h!1

Dans ce contexte, la matrice de variance-covariance est un mlange de matrices de corgionalisation

V=

S
X
u=0

65

Bu

 

!#"$&%('*),+.-0/21 /3-547681 49/:%(;*<-04>=





F IG . 11.1 Variogramme crois de deux composantes principales.


On voit que lorsquon ne se trouve pas dans le cas de la corrlation intrinsque, il est du plus grand intrt danalyser sparment chacune des matrices de corgionalisation Bu , considres comme des matrices de variancecovariance dun ensemble de variables fZui (x); i = 1; : : : ;N g. En outre, les matrices de corgionalisation Bu peuvent tre construites sous nimporte quelle
hypothse de stationnarit, alors que la matrice de variance-covariance V na
de sens que dans un contexte de stationnarit dordre deux.
E XEMPLE 11.3 (VARIOGRAMME CROIS DE DEUX COMPOSANTES PRINCIPALES )
La Figure 11.1 montre le variogramme crois entre les troisime et quatrime
composantes principales calcules sur la base de la matrice de variancecovariance de donnes pour lesquelles lhypothse de corrlation intrinsque
est manifestement fausse. En effet, prs de lorigine les composantes principales sont corrles de manire significative, symptme du fait que la structure de corrlation des donnes est diffrente petite chelle, ce dont une
analyse en composantes principales non spatialise ne peut tenir compte
(daprs [102]).
Lanalyse en composantes principales dune matrice de corgionalisation
66

consiste dcomposer chaque matrice Bu en valeurs et vecteurs propres

Bu = Au A>u

avec

Au = Qu u

et

Qu Q>u = I

On peut gnraliser cette analyse en choisissant des vecteurs propres orthogonaux par rapport une matrice symtrique Mu , reprsentant une mtrique
p
Au = Qu Mu u
avec Qu Mu Q>u = I
en utilisant, par exemple, la mtrique

Mu =

S
X
u=0

Bu

Une autre possibilit, lorsquon sintresse lanalyse conjointe de deux


groupes de variables, est de partitionner les matrices de corgionalisation

B11
B12
u
u
Bu =
21
Bu B22
u

et de pratiquer une analyse canonique de la corgionalisation, cest--dire, en


prenant pour illustration le premier groupe


11
11
B11
u = Au Au

11 11 11
A11
u
u = Qu Mu

et

avec


12
22
M11
u = Bu Bu

>


11
11
Q11
u M u Qu

 1

>

=I

B21
u

avec des matrices B22


u videmment non singulires.
Lanalyse canonique donne souvent des rsultats dcevants, car difficilement interprtables. Lanalyse en composantes principales avec des variables
instrumentales (aussi appele analyse de redondance) peut savrer une alternative plus performante. On passe lACPVI simplement en remplaant
B22
u par la matrice identit dans lexpression prcdente, cest--dire
12 21
M11
u = Bu Bu

E XERCISE 11.4 Montrer que


p

Au = Qu Mu u
dans la factorisation
gnralis

avec

Qu Mu Q>u = I

Bu = Au A>u est solution du probme de valeur propre


Bu Qu = Qu Mu u
67

Cokrigeage de facteurs
Le modle linaire de corgionalisation permet destimer localement les
facteurs rgionaliss Ypu (x) par cokrigeage. Lestimateur utilis pour valuer
un facteur Ypu00 (x) donn est une combinaison linaire de pondrateurs i avec
des variables dans le voisinage dun point quelconque x0 du domaine

Yu?0 p0 (x)

ni
N X
X
i=1 =1

i Zi (x )

En se plaant dans le cadre dune hypothse de stationnarit locale, donnant un sens des moyennes locales mi (x0 ), on construit un estimateur sans
bias de facteurs synthtiques (auxquels on a attribu des moyennes nulles)
h

Yu?0 p0 (x)

Ypu00 (x)

N
X
i=1

n
X

mi (x0 )

=1

i

=0

pour

n
X
=1

i = 0

La variance destimation E2 vaut




Yu?0 p0 (x)

2 

Ypu00 (x)

N X
N X
n X
n
X

= 1+

i=1 j =1 =1 =1

N X
n
X
i=1 =1

i j Cij (x x )

i aiu0 p0 u0 (x x0 )

De sorte que lon a le systme de cokrigeage


8
nj
N X
X
>
>
j
>
>

Cij (x
>
>
>
j
=1

=1
>
<
>
>
>
ni
>
X
>
>
>
i
>
:
=1

=0

x ) i = aiu0 p0 u0 (x x0 )
pour i = 1; : : : N ; = 1; : : : n
pour i = 1; : : : N

Dans le membre droit de ce systme apparaissent les coefficients de transformation aiup , rsultats de la dcomposition des matrices de corgionalisation
Bu . Dans le cas dune analyse en composantes principales de ces matrices, les
aiup indiquent les covariances entre les variables Zi et les facteurs Ypu .
Le cokrigeage de facteurs permet de raliser des cartes de facteurs en nutilisant que les donnes multivariables contenues dans un voisinage local autour de chaque point de la carte.

68

Solution des Exercices

>

E XERCICE 1.1 1 1 = n;

1 ::: 1

{z
(nn)

11> = @ ... . . . ... A


1 ::: 1
|

E XERCICE 1.2 n1 Z> 1 = m est le vecteur des moyennes mi des variables.


1 >
n 11 Z

= M est une matrice n  N contenant dans chaque ligne la tranpose du vecteur des moyennes; chaque colonne mi de M a N lments gaux
la moyenne mi de la variable numro i.
E XERCICE 1.5 A2 x = A  x =  A x = 2 x
E XERCICE 1.7 La dcomposition classique en valeurs et vecteurs propres.
E XERCICE 1.8 Oui.
E XERCICE 2.2 corr

Ze ;Ze

e
Q

e

e>
e Q

= corr

Ze ;Y



corr

Ze ;Y

>

E XERCICE 3.1 Il suffit de montrer que les contraintes dorthogonalit correspondantes sont redondantes (de manire analogue lACP).
E XERCICE 3.2 Idem.
E XERCICE 3.3 Multiplier lquation par linverse de .
E XERCICE 4.3 Voir M ATHERON [65], L AJAUNIE & L ANTUJOUL [48].
69

E XERCICE 6.3 Si un point de donne concide avec le point destimation, le systme dquations correspondant aura une colonne du membre gauche (mis-part le dernier lment) gale au membre droit. Une solution du systme est
de prendre un ensemble de pondrateurs nuls, sauf le pondrateur de la colonne correspondant la donne concidante, valant un. Cette solution est la
seule solution, puisque le membre gauche est suppos inversible, et elle restitue la valeur mesure au point destimation.
E XERCICE 6.4 Etant donn quil y a interpolation exacte, les poids de
valent
 =  x ;x0
Vu la linarit des estimateurs

P =  x ;x0

G

E XERCICE 6.5 Le krigeage ordinaire peut scrire


2

C1;1 : : : C1;N

B ..
B .
@C

..

.. C
.C

: : : CN;N 1 A
:::
1
0

N;1

..
.

11

{z

60  P
1
6
6B ..
6B .
6@ P
6 N
6
4 P
| {z

xP

B
B
@

0 G 1 0 m0 1 7
1
1
7
.
C B .. C B ... C 7
C7
C B
C+B
A @ G A + @ m0 A 7
7
N
N
7
m0 5
G
} | {z } | {z }
1

xm0

xG

C0P;1 1

0 1

C0G;1 1

C B .. C B ... C
C+B . C+B C
P
C0;N A @ C0G;N A @ 0 A

avec A xP = bP ;
On a alors

Z ? (x0 )

..
.

{z

bP

{z

bG

A xG = bG ; A xm0 = bm0 :

| {z }

bm0

z ? (x0 ) = z> lP + z> lG + z> lm0 = z> (lP + lG + lm0 ) = z> l


o z est le vecteur des n donnes et lP ; lG ; lm0 ; l sont des vecteurs de n pond-

rateurs correspondants.
E XERCICE 7.7 a)

2

KO

= c00
= C (x0

k>0 K 1 k0 = c00
x0 )

n
X
=1

70

k>
0

 KO C (x

lKO

KO

x0 ) + KO

b)

R1
R 1 (R 1)>
v= >
A=R
1 R1
1> R 1
 
 
v = z> v = z> R 1
o
?
>
1
>
=
(
z
;
0)
m = (z ;0) K
w
1
1> R 1
1
w= >
1 R1

c)


Kn z;s

z> R 1 1> R s 

1h>i
R 1 1> R 1  
En z En s = 1> R 1 covn z;s

 z> R s
= z> A s = 1> R 1 >
 h i 1 Rh 1i
>

= 1 R 1 En z;s
d)
Soient z0 =

 

avec:

 

z ; s0 = s
0
0

AF = K

et
0 1

b?

= (z> ;0;0) F 1 @ 0 A = (z> ;0;0)


1

(z0 )> K 1 s0
=
(s0 )> K 1 s0

vF
0>
w = ( z ) vF
F

Kn z;s covn z;s


  =
 
Kn s;s covn s;s
o

= (z> ;0;0) F 1 @ 1 A = (z> ;0) AF


0

 

o
1

 

K 1 s0 (K 1 s0 )>  o
K
1
(s0 )> K 1 s0
 
 
0
1
0
zK s 0 1 o
o
0
1
= zK
0 K 1 s0  s K
1
1
s
h i
h i
= En z b? En s
= z0

E XERCICE 7.8 a) v0

= K 1 k0 w00
c00 w00

et

k>0 K 1 k0 w00 = 1
71

K 1 s0 (K 1 s0 )>
(s0 )> K 1 s0

0 1

a?

0
vF
F
F = (sK0 )> s0 = A
>
vF wF

et

K 1 s0
vF = 0 > 1 0
(s ) K s

w00 c00

k> K 1 k
0

= 1

w00 =

2
KO

b)


Kn+1 z0;s0


avec:

Kn+1 z0;s0

v>0 (s ;s> ;0)


v0 A0 0
A0 = K 1 + w00 K 1 k0 (K 1 k0 )>
 
s
>
>
>
= z0 w00 s0 + (z ;0) v0 s0 + z0 v0 0 + (z ;0) A0 0s

= (z0 ;z> ;0) w00

w00 (z> ;0) K 1 k0 s0

= w00 z0 s0

w00 z0 K

1k

 

0
0
 

 
+Kn z;s + w00 (z> ;0) K 1 k0 (K 1 k0 )> 0s

 

 
>
1
>
1
= w00 z0 (z ;0) K k0  s0 (s ;0) K k0 + Kn z;s

c)


Kn+1 z0;s0

= z0

(z> ;0) K 1 k


0

 
(s0 js)
 2 + Kn z;s
KO

et

(w00 ;v>0 ) 

s0

= w00 s0 + v>0

 

 

s = w s w K 1k s
00 0
00
0
0
0

= w00 (s0 js) =

(s0 js)
2
KO

E XERCICE 7.9 a) Pour = 1 on a:

(w11 ;v>1 )

 

s = (s1 js 1 )
2
0
1

et pour = n:

(v1;n ; : : : ;vn

1;n ;wnn ;vn+1;n )

 

s
0 =

(sn js n )
n2

ainsi que pour 6= 1 et 6= n:

(v1; ; : : : ;v

1; ;w ;v +1; ; : : : ;vn+1; )

72

 

s = (s js )
2
0


b)


 

K
Kn z;s
0
?
>


 
b =
= (z ;0)
Kn s;s
Kn s;s
1

E XERCICE 9.2 C12 (h) = a1 C22 (h

n
X
=1

(s js )
 2 Kn s;s

r1 ) + a2 C22 (h r2 )

E XERCICE 9.4 La matrice V est une matrice semi-dfinie positive en tant que
matrice de variance-covariance et (h) est une fonction de type positif en tant
que fonction de covariance, de sorte que lon vrifie aisment que le produit
des deux vrifie le thorme de Bochner multivariable.
E XERCICE 9.5 a) Oui. b) Cij (0) peut tre ngatif ! c) Cii (h) peut tre ngatif !
E XERCICE 9.6 Lorsque Cij (h) nest pas une fonction paire, le spectre de quadrature qij (h) nest pas nul et fij (h) est complexe.
E XERCICE 9.7 a) ii (h) = ii (
h).
1
b) ij (h) = 2 Cii (0) + Cjj (0)
Cij (h) et peut donc servir dtecter des effets
de retard au mme titre que la fonction de covariance croise.
c) On est oblig de hsupposer pour iji(h) que les accroissements croiss sont
intrinsques avec E Zi (x+h) Zj (x) = 0. Cest aventureux, lorsque les variables sont de nature diffrente.
d) ij (h) peut tre calcul dans un contexte dhtrotopie totale. Son inconvnient majeur est quil ne peut traduire une corrlation ngative ventuelle
entre deux variables.
E XERCICE 11.1 Lorsque toutes les matrices de corgionalisation sont proportionnelles une mme matrice B

C(h) =

S
X
u=0

au B u (h) = B

S
X
u=0

au u (h)

o les au sont des coefficients de proportionnalit.


E XERCICE 11.2 Etant donn que Bu est semi-dfinie positive, la positivit de
ses mineurs principaux dordre 2 implique la relation de Cauchy-Schwarz
entre les paliers simples et croiss

jbuij j 

73

buii bujj

E XERCICE 11.4 Bu

= Qu Mu u Mu Q>u avec Qu = Mu Q>u




Bu Qu = Qu Mu u Mu
|

74

Q>
u

 

 Mu
{z

Q>
u

 1

 1
}

, donc:

Rfrences
Mots-clefs
Thorie

Rappel de calcul matriciel: [94]; [53]; [75].


ACP, Analyse Canonique, Analyse des Correspondances: [75]; [55]; [85]; [32];
[38]; [31]; [71]; [104].
Analyse de redondance (ACPVI): [74]; [95].
Modles isofactoriels, krigeage disjonctif: [62], [65]; [48]; [78]; [49]; [18].
Modle de rgionalisation: [59].
Krigeage de composantes spatiales: [59], [64]; [82]; [29]; [14]; [99]; [18].
Dconvolution: [7]; [88]; [43].
Drive externe: [23]; [21]; [30]; [57]; [76]; [41]; [4].
Drive spatio-temporelle: [89]; [87].
Covariance gnralise: [61]; [22]; [12]; [26].
Covariance croise: [15]; [105], [106]; [73]; [67]; [58].
Pseudo-variogramme crois: [69]; [16].
Cokrigeage: [59], [63]; [5], [6].
Equations aux drives partielles: [60]; [25]; [3].
Ajustement multivariable de variogrammes exprimentaux: [35][36]; [46]; [37].
Analyse de corgionalisation: [64]; [97]; [101]; [35], [36]; [33].
Cokrigeage de facteurs: [64]; [83]; [98]; [19], [20]; [18].
Classification: [91]; [70]; [103].
Gostatistique exploratoire: [8]; [40].
Fonction alatoire complexe: [47].

Applications

Analyse dimages: [52]; [19][20]; [43]; [18].


Godsie: [67].
Hydrologie: [93]; [1]; [25]; [79]; [17]; [13].
Exploration gochimique: [82]; [83]; [98]; [84]; [80]; [100]; [40]; [102].
Exploration gophysique: [14]; [76]; [86]; [89]; [87].
Exploration minire: [44]; [91].
Exploration ptrolire et gazire: [24]; [21]; [29]; [57]; [30]; [42];

75

Mtallurgie: [19][20].
Mtorologie: [10]; [72]; [45]; [39]; [51]; [81]; [68]; [41].
Science des sols: [103]; [36]; [70]; [104]; [37]; [92]; [33].
Sylviculture: [54]; [27].
Tldtection: [27]; [50].

Bibliographie
[1] A HMED S & DE M ARSILY (1987) Comparison of geostatistical methods for estimating
transmissivity using data on transmissivity and specific capacity. Water Resources Research, 23, 17171737.
[2] B OX GEP & J ENKINS GM (1970) Time Series Analysis: Forecasting and Control.
Holden-Day, San Francisco.
[3] C ASTELIER E (1992) Le krigeage propagatif. Mmoire de DEA, Publication S-291, Centre
de Gostatistique, Ecole des Mines de Paris, Fontainebleau, 22p.
[4] C ASTELIER E (1992) La drive externe vue comme une rgression linaire. Publication
N-34/92/G, Centre de Gostatistique, Ecole des Mines de Paris, Fontainebleau, 22p.
[5] C HAUVET P (1975) Formulaire du cokrigeage en FAI-k. Application au cas Gaussien.
Publication N-425, Centre de Gostatistique, Ecole des Mines de Paris, Fontainebleau.
[6] C HAUVET P (1977) Exemple dapplication de la gostatistique non stationnaire: le cokrigeage. Publication N-502, Centre de Gostatistique, Ecole des Mines de Paris, Fontainebleau.
[7] C HAUVET P (1977) Exemple simplifi de dconvolution de courbe lecteur par cokrigeage. Publication N-509, Centre de Gostatistique, Ecole des Mines de Paris, Fontainebleau.
[8] C HAUVET P (1982) The variogram cloud. In: Johnson TB & Barnes RJ (eds) 17th APCOM,
757764, Society of Mining Engineers, New York.
[9] C HAUVET P (1991) Aide Mmoire de Gostatistique Linaire. Cahiers de Gostatistique,
Fascicule 2, Ecole des Mines de Paris, Fontainebleau.
[10] C HAUVET P, PAILLEUX J & C HILS JP (1976) Analyse objective des champs mtorologiques par cokrigeage. La Mtorologie, 6e srie, No 4, 3754.
[11] C HAUVET P & G ALLI A (1982) Universal Kriging. Publication C-96, Centre de Gostatistique, Ecole des Mines de Paris, Fontainebleau.
[12] C HILS JP (1977) Gostatistique des Phnomnes Non Stationnaires (dans le plan).
Thse de Doctorat, Universit de Nancy I, Nancy, 152p.
[13] C HILS JP (1991) Application du krigeage avec drive externe limplantation dun
rseau de mesures pizomtriques. Sciences de la Terre, Srie Informatique, 30, 131
147.
[14] C HILS JP & G UILLEN A (1984) Variogrammes et Krigeages pour la Gravimtrie et le
Magntisme. Sciences de la Terre, Srie Informatique, 20, 455468.
[15] C RAMER H & L EADBETTER MR (1967) Stationary and Related Stochastic Processes. Wiley, New York.
[16] C RESSIE N (1991) Statistics for Spatial Data. Wiley, New York.
[17] D AGAN G (1989) Flow and Transport in Porous Formations. Springer-Verlag, Berlin.
[18] D ALY C (1991) Application de la Gostatistique quelques Problmes de Filtrage. Thse
de Doctorat, Ecole des Mines de Paris, Fontainebleau.
[19] D ALY C, L AJAUNIE C & J EULIN D (1989) Application of multivariate kriging to the processing of noisy images. In: Armstrong M (ed) Geostatistics, 749760, Kluwer Academic
Publisher, Amsterdam, Holland.

76

[20] D ALY C, J EULIN D, B ENOIT D & A UCLAIR G (1990) Application of Multivariate Geostatistics to Macroprobe Mappings in Steels. ISIJ International, 30, 529534.
[21] D ELFINER P, D ELHOMME JP & P ELISSIER -C OMBESCURE J (1983) Application of geostatistical analysis to the evaluation of petroleum reservoirs with well logs. 24th Annual
Logging Symposium of the SPWLA, Calgary, June 2730 1983.
[22] D ELFINER P & M ATHERON G (1980) Les fonctions alatoires intrinsques dordre k.
Publication C-84, Centre de Gostatistique, Ecole des Mines de Paris, Fontainebleau.
[23] D ELHOMME JP (1979) Rflexions sur la prise en compte simultane des donnes de forages et des donnes sismiques. Publication LHM/RC/79/41, Centre dInformatique
Gologique, Ecole des Mines de Paris, Fontainebleau.
[24] D ELHOMME JP, B OUCHER M, M EUNIER G & J ENSEN F (1981) Apport de la gostatistique la description des stockages de gaz en aquifre. Revue de lInstitut Franais du
Ptrole, 36, 309327.
[25] D ONG A (1990) Estimation Gostatistique des Phnomnes rgis par des Equations aux
Drives Partielles. Thse de Doctorat, Ecole des Mines de Paris, Fontainebleau.
[26] D OWD PA (1989) Generalized cross-covariances. In: Armstrong M (ed) Geostatistics,
151162, Kluwer Academic Publisher, Amsterdam, Holland.
[27] F OUQUET C DE & M ANDALLAZ D (1992) Using geostatistics for forest inventory with air
cover: an example. Publication N-20/92/G, Centre de Gostatistique, Ecole des Mines
de Paris, Fontainebleau, 12p.
[28] F RANOIS -B ONGARON D (1981) Les corgionalisations, le cokrigeage. Publication C86 , Centre de Gostatistique, Ecole des Mines de Paris, Fontainebleau.
[29] G ALLI A, G ERDIL -N EUILLET F & D ADOU C (1984) Factorial kriging analysis: a substitute to spectral analysis of magnetic data. In: Verly G et al (eds) Geostatistics for Natural
Resources Characterization, 543557, NATO ASI Series C-122, Reidel, Dordrecht, Hollande.
[30] G ALLI A & M EUNIER G (1987) Study of a gas reservoir using the external drift method.
In: G Matheron et M Armstrong (eds) Geostatistical Case Studies, 105119, Reidel, Dordrecht, Holland.
[31] G IFI A (1990) Nonlinear Multivariate Analysis. Wiley, New York.
[32] G ITTINS R (1985) Canonical Analysis: a Review with Applications in Ecology. Biomathematics, Vol. 12, Springer-Verlag, Berlin, 351p.
[33] G OOVAERTS P (1992) Multivariate Geostatistical Tools for Studying Scale-Dependent
Correlation Structures and Describing Space-Time Variations. Doctoral Thesis, Universit Catholique de Louvain, Louvain-la-Neuve, 233p.
[34] G OOVAERTS P (1992) Factorial kriging analysis: a useful tool for exploring the structure
of multivariate spatial information. Journal of Soil Science, 43, 597619.
[35] G OULARD M (1988) Champs Spatiaux et Statistique Multidimensionnelle. Thse de Doctorat, Universit des Sciences et Techniques du Languedoc, Montpellier.
[36] G OULARD M (1989) Inference in a coregionalization model. In: Armstrong M (Ed.) Geostatistics, Kluwer Academic Publisher, Amsterdam, Holland, 397408.
[37] G OULARD M & V OLTZ M (1992) Linear coregionalization model: tools for estimation
and choice of cross-variogram matrix. Mathematical Geology, 24, 269286.
[38] G REENACRE MJ (1984) Theory and Applications of Correspondence Analysis. Aacademic Press, London.
[39] H ASLETT J (1989) Space time modelling in meteorology: a review. Proceedings of 47th
Session, International Statistical Institute, Paris, 229246.
[40] H ASLETT J, B RADLEY R, C RAIG PS, W ILLS G & U NWIN AR (1991) Dynamic graphics
for exploring spatial data, with application to locating global and local anomalies. The
American Statistician, 45, 234242.

77

[41] H UDSON G & WACKERNAGEL H (1992) Kriging temperature in Scotland using the external drift method. Publication N-2/92/G, Centre de Gostatistique, Ecole des Mines
de Paris, Fontainebleau.
[42] J AQUET O (1989) Factorial Kriging Analysis Applied to Geological Data from Petroleum
Exploration. Mathematical Geology, 21, 683691.
[43] J EULIN D & R ENARD D (1991) Practical limits of the deconvolution of images by kriging.
Publication N-13/91/G. Centre de Gostatistique, Ecole des Mines de Paris, Fontainebleau.
[44] J OURNEL AG & H UIJBREGTS CJ (1978) Mining Geostatistics. Academic Press, London,
600p.
[45] L AJAUNIE C (1984) A geostatistical approach to air pollution modelling. In: Verly G et
al (eds) Geostatistics for Natural Resources Characterization, 877891, NATO ASI Series
C-122, Reidel, Dordrecht, Hollande.
[46] L AJAUNIE C (1988) Ajustement automatique de corgionalisation. Note non publie.
[47] L AJAUNIE C & B JAOUI (1991) Sur le krigeage des fonctions complexes. Publication
N-23/91/G, Centre de Gostatistique, Ecole des Mines de Paris, Fontainebleau.
[48] L AJAUNIE C & L ANTUJOUL C (1989) Setting up the general methodology for discrete
isofactorial models. In: Armstrong M (Ed.) Geostatistics, Kluwer Academic Publisher,
Amsterdam, Holland, 323334.
[49] L ANTUJOUL C (1990) Cours de Slectivit. Publication C-140, Centre de Gostatistique,
Ecole des Mines de Paris, Fontainebleau.
[50] L INDNER S & WACKERNAGEL H (1993) Statistische Definition eines Lateritpanzer-Index
fr SPOT/Landsat-Bilder durch Redundanzanalyse mit bodengeochemischen Daten.
Publication N-8/93/G, Centre de Gostatistique, Ecole des Mines de Paris, Fontainebleau, 11p.
[51] L UMLEY JL (1970) Stochastic Tools in Turbulence. Academic Press, London.
[52] M A YZ & R OYER JJ (1988) Local geostatistical filtering: application to remote sensing.
Sciences de la Terre, Srie Informatique, 27, 1736.
[53] M AGNUS JR & N EUDECKER H (1988) Matrix Differential Calculus with Applications in
Statistics and Econometrics. Wiley, New York.
[54] M ARBEAU JP (1976) Gostatistique Forestire. Thse de Doctorat, Universit de Nancy,
Nancy.
[55] M ARDIA KV, K ENT JT & B IBBY JM (1979) Multivariate Analysis. Academic Press, London, 521p.
[56] M ARCHAL A (1970) Cokrigeage et rgression en corrlation intrinsque. Publication
N-205, Centre de Gostatistique, Ecole des Mines de Paris, Fontainebleau.
[57] M ARCHAL A (1984) Kriging seismic data in presence of faults. In: Verly G et al.(eds)
Geostatistics for Natural Resources Characterization, 271294, NATO ASI Series C-122,
Reidel, Dordrecht, Hollande.
[58] M ATHERON G (1965) Les Variables Rgionalises et leur Estimation. Masson, Paris,
305p.
[59] M ATHERON G (1970) La Thorie des Variables Rgionalises et ses Applications. Fascicule 5, Les Cahiers du Centre de Morphologie Mathmatique, Ecole des Mines de Paris,
Fontainebleau, 211p.
[60] M ATHERON G (1971) La Thorie des Fonctions Alatoires Intrinsques Gnralises.
Publication N-252, Centre de Gostatistique, Ecole des Mines de Paris, Fontainebleau.
[61] M ATHERON G (1973) The intrinsic random functions and their applications. Advances
in Applied Probability, 5, 439468.
[62] M ATHERON G (1976) A simple substitute for conditional expectation: the disjunctive
kriging. In: Guarascio M et al.(eds) Advanced Geostatistics in the Mining Industry, 221
236, NATO ASI Series C 24, Reidel, Dordrecht, Hollande.

78

[63] M ATHERON G (1979) Recherche de simplification dans un problme de cokrigeage. Publication N-628, Centre de Gostatistique, Ecole des Mines de Paris, Fontainebleau, 19p.
[64] M ATHERON G (1982) Pour une Analyse Krigeante des Donnes Rgionalises. Publication N-732, Centre de Gostatistique, Fontainebleau, France, 22p.
[65] M ATHERON G (1989) Two classes of isofactorial models. In: Armstrong M (ed) Geostatistics, 309322, Kluwer Academic Publisher, Amsterdam, Holland.
[66] M ATHERON G (1989) Estimating and Choosing. Springer-Verlag, Berlin, 141p.
[67] M EIER S & K ELLER W (1990) Geostatistik. Springer-Verlag, Wien.
[68] M ONESTIEZ P & S WITZER P (1991) Semiparametric estimation of nonstationary spatial
covariance models by multidimensional scaling. Technical report No. 165, Stanford University, Stanford.
[69] M YERS DE (1991) Pseudo-cross variograms, positive-definiteness, and cokriging. Mathematical Geology, 23, 805816.
[70] O LIVER MA & W EBSTER R (1989) A geostatistical basis for spatial weighting in multivariate classification. Mathematical Geology, 21, 1535.
[71] O RFEUIL JP (1973) LAnalyse des Donnes. Publication N-353, Centre de Gostatistique,
Ecole des Mines de Paris, Fontainebleau.
[72] O RFEUIL JP (1977) Etude, mise en oeuvre et test dun modle de prdiction court terme
de pollution athmosphrique. Rapport CECA, Publication N-498, Centre de Gostatistique, Ecole des Mines de Paris, Fontainebleau.
[73] P RIESTLEY MB (1981) Spectral Analysis and Time Series. Academic Press, London.
[74] R AO CR (1964) The use and interpretation of principal component analysis in applied
research. Sankhya, Series A, 329358.
[75] R AO CR (1973) Linear Statistical Inference and its Applications. 2nd edition, Wiley, New
York, 625p.
[76] R ENARD D & N AI -H SIEN M (1988) Utilisation de drives externes multiples. Sciences
de la Terre, Srie Informatique, 28, 281301.
[77] R IVOIRARD J (1988) Modles rsidus dindicatrices autokrigeables. Sciences de la
Terre, Srie Informatique, 28, 303326.
[78] R IVOIRARD J (1990) Introduction to Disjunctive Kriging and Nonlinear Geostatistics.
Publication C-143, Centre de Gostatistique, Ecole des Mines de Paris, Fontainebleau.
[79] R OUHANI S & WACKERNAGEL H (1990) Multivariate geostatistical approach to spacetime data analysis. Water Resources Research, 26, 585591.
[80] R OYER JJ (1988) Analyse Multivariable et Filtrage des Donnes Rgionalises. Thse de
Doctorat, Institut National Polytechnique de Lorraine, Nancy.
[81] S AMPSON P & G UTTORP (1992) Nonparametric estimation of nonstationary spatial
structure. Journal of the American Statistical Association, 87, 108119.
[82] S ANDJIVY L (1983) Analyse krigeante de donnes gochimiques. Sciences de la Terre,
Srie Informatique, 18, 141172.
[83] S ANDJIVY L (1984) The factorial kriging analysis of regionalized data. In: Verly G et
al.(eds) Geostatistics for Natural Resources Characterization, 559571, NATO ASI Series
C-122, Reidel, Dordrecht, Hollande.
[84] S ANDJIVY L (1987) Analyse krigeante des donnes de prospection gochimique. Thse
de Doctorat, Ecole des Mines de Paris, Fontainebleau.
[85] S APORTA G (1990) Probabilits, Analyse des Donnes et Statistique. Technip, Paris,
493p.
[86] S CHULZ -O HLBERG (1989) Die Anwendung geostatistischer Verfahren zur Interpretation von gravimetrischen und magnetischen Felddaten. Wissenschaftlich-Technische Berichte, 19896, Deutsches Hydrographisches Institut, Hamburg.
[87] S GURET S (1991) Gostatistique des Phnomnes Tendance Priodique (dans
lespace-temps). Thse de Doctorat, Ecole des Mines de Paris, Fontainebleau.

79

[88] S GURET S & C HAUVET P (1988) Pour une mthodologie de dconvolution de variogrammes. Publication N-51/88/G, Centre de Gostatistique, Ecole des Mines de Paris,
Fontainebleau.
[89] S GURET S & H UCHON P (1990) Trigonometric kriging: a new method for removing
the diurnal variation from geomagnetic data. Journal of Geophysical Research, Vol. 32,
No. B13, 21.38321.397.
[90] S ERRA J (1968) Les structures gigognes: morphologie mathmatique et interprtation
mtallognique. Mineral. Deposita, 3, 135154.
[91] S OUSA AJ (1989) Geostatistical data analysis: an application to ore typology. In: Armstrong M (ed) Geostatistics, 851860, Kluwer Academic Publisher, Amsterdam, Holland.
[92] S TEIN A (1991) Spatial Interpolation. Doctoral thesis, Agricultural University, Wageningen, Netherlands.
[93] S TEIN M (1986) A simple model for spatial-temporal processes. Water Resources Research, Vol. 22, 21072110.
[94] S TRANG G (1984) Linear Algebra and its Applications. Academic Press, 2e dition.
[95] T YLER DE (1982) On the optimality of the simultaneous redundancy transformations.
Psychometrika, 47, 7786.
[96] V OLLE M (1985) Analyse des Donnes. 3e dition, Economica, Paris.
[97] WACKERNAGEL H (1985) Linfrence dun Modle Linaire en Gostatistique Multivariable. Thse de Doctorat, Ecole des Mines de Paris, Fontainebleau.
[98] WACKERNAGEL H (1988) Geostatistical techniques for interpreting multivariate spatial
information. In: Chung CF et al.(eds) Quantitative Analysis of Mineral and Energy Resources, 393409, NATO ASI Series C 223, Reidel, Dordrecht, Hollande.
[99] WACKERNAGEL H (1991) Changement de maille et changement de support. In: Mullon
C (ed) SEMINFOR 4: Le Transfert dEchelle, 159171, Editions de lOrstom, Paris.
[100] WACKERNAGEL H & B UTENUTH C (1989) Caractrisation danomalies gochimiques
par la gostatistique multivariable. J. Geochem. Explor., 32, 437444.
[101] WACKERNAGEL H, P ETITGAS P & T OUFFAIT Y (1989) Overview of methods for coregionalization analysis. In: Armstrong M (ed) Geostatistics, 409420, Kluwer Academic
Publisher, Amsterdam, Holland.
[102] WACKERNAGEL H & S ANGUINETTI H (1992) Gold prospection with factorial cokriging in the Limousin, France. In: Davis JC & Herzfeld UC (eds) Computers in Geology:
25 years of progres. Studies in Mathematical Geology, Vol. 5, 3343, Oxford University
Press.
[103] WACKERNAGEL H, W EBSTER R & O LIVER MA (1988) A geostatistical method for segmenting multivariate sequences of soil data. In: Bock HH (ed) Classification and Related
Methods of Data Analysis, 641650, Elsevier (North-Holland), Amsterdam.
[104] W EBSTER R & O LIVER MA (1990) Statistical Methods in Soil and Land Resource Survey. Oxford University Press, Oxford.
[105] YAGLOM AM (1962) An Introduction to the Theory of Stationary Random Functions.
Dover, New York.
[106] YAGLOM AM (1986) Correlation Theory of Stationary and Related Random Functions.
Springer-Verlag, Berlin.

80

You might also like