You are on page 1of 141

COURS DE SERIES TEMPORELLES THEORIE ET APPLICATIONS

VOLUME 2 Modles linaires multivaris : VAR et cointgration Introduction aux modles ARCH et GARCH Introduction la notion de mmoire longue Exercices corrigs et complments informatiques

ARTHUR CHARPENTIER arthur.charpentier@ensae.fr

DESS Actuariat & DESS Mathmatiques de la Dcision

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Contents
1 Les sries temporelles multivaries 1.1 La notion de causalit . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.1 Dpendence stochastique . . . . . . . . . . . . . . . . . . . . . . 1.1.2 Causalit au sens de Granger . . . . . . . . . . . . . . . . . . . . 1.2 La notion de cointgration . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.1 Modles correction derreur (E CM ) . . . . . . . . . . . . . . . 1.2.2 Tests de cointgration . . . . . . . . . . . . . . . . . . . . . . . . 1.2.3 Gnralisation k variables . . . . . . . . . . . . . . . . . . . . . 1.2.4 Dirences entre les approches de Engle/Granger et de Johansen 1.3 La modlisation V AR (p ) . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3.1 La reprsentation V AR (p ) . . . . . . . . . . . . . . . . . . . . . 1.3.2 Les modles ARM AX ou V ARM A . . . . . . . . . . . . . . . . 1.3.3 Estimation des paramtres dun modle V AR . . . . . . . . . . . 1.3.4 Autocovariances et autocorrlations . . . . . . . . . . . . . . . . 1.3.5 Application sur un exemple . . . . . . . . . . . . . . . . . . . . . 1.3.6 Prvision laide des modles V AR . . . . . . . . . . . . . . . . 1.3.7 Tests de bruit blanc des erreurs . . . . . . . . . . . . . . . . . . . 1.3.8 Test de causalit (Granger (1969 )) sur des mod les V AR . . . . 1.3.9 Les modles V AR (p) : analyse des chocs . . . . . . . . . . . . . 1.4 Application des modles V AR . . . . . . . . . . . . . . . . . . . . . . . . 1.4.1 Application : investissement, revenu et consommation . . . . . . 1.4.2 Application des modles V AR : rendements dune action et dun 1.5 Rgression linaire dans un cadre dynamique . . . . . . . . . . . . . . . 1.5.1 Les retards chelonns . . . . . . . . . . . . . . . . . . . . . . . . 1.5.2 Le modle dajustement partiel . . . . . . . . . . . . . . . . . . . 1.5.3 Les modles autorgressifs retards chelonn s (ADL (p; q)) . . 1.6 Complments : modles multivaris sous SAS . . . . . . . . . . . . . . . 1.6.1 Estimation dun modle V AR . . . . . . . . . . . . . . . . . . . . 1.6.2 Estimation dun modle correction derreur . . . . . . . . . . . 1.7 Conseils bibliographiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . indice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 5 5 6 6 8 9 9 10 14 14 16 17 18 18 23 24 24 25 28 28 32 33 33 34 35 36 36 38 41 42 43 43 44 45 45 46 46 48 48 49 49 49 50 52 53 54 54 55 55 55 56 57 59 59

2 Les modles ARCH - Autorgressifs Conditionellement Htroscdastiques 2.1 Notions de stationnarit et notions de linarit . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Prsntation des modles ARCH . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.1 Processus ARCH (1) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.2 Processus ARCH ( p) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.3 Processus GARC H (p; q) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3 Modles avec erreurs ARCH . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1 Erreurs ARCH (1) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.2 Erreurs ARCH ( p) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.3 Remarque : test de racine unit en prsence derreurs ARC H . . . . . . . . . . . . 2.4 Estimation et prvision . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.1 Estimation des paramtres dun modles ARCH . . . . . . . . . . . . . . . . . . . 2.4.2 La procdure de Diebold (1987) : test dautocorrlation en prsence deet ARC H 2.4.3 Prvision et intervalle de conance . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5 Modles ARC H et nance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5.1 Liens entre temps continu et temps discret . . . . . . . . . . . . . . . . . . . . . . 2.5.2 Modles avec variance stochastique/dterministe en temps continu . . . . . . . . . 2.5.3 Modles avec variance stochastique/dterministe en temps discret . . . . . . . . . 2.6 Autres types de modles non-linaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6.1 Les modles bilinaires - nots BL (p; q; P; Q) . . . . . . . . . . . . . . . . . . . . . 2.6.2 Les modles autorgressifs exponentiels - EXP AR . . . . . . . . . . . . . . . . . . 2.6.3 Les modles autorgressifs seuils - T AR, ST AR ou SET AR . . . . . . . . . . . . 2.6.4 Les gnralisations des modles ARCH . . . . . . . . . . . . . . . . . . . . . . . . 2.7 Les tests de linarit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.7.1 Les tests du multiplicateur de Lagrange . . . . . . . . . . . . . . . . . . . . . . . .

Sries temporelles : thorie et applications

Arthur CHARPENTIER

2.7.2 Le test du CU SUM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.7.3 Le test BDS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.7.4 Le test RESE T (Regression error specication test ) . . . . . . . . . . . . . . . 2.7.5 La procdure AUT OREG sous SAS=ET S . . . . . . . . . . . . . . . . . . . . 2.8 Application sur des donnes relles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.8.1 Modlisation GARCH du CAC 40 . . . . . . . . . . . . . . . . . . . . . . . . . 2.8.2 Modlisation des rendements du cours Intel : modle ARC H . . . . . . . . . . 2.8.3 Modlisation des rendements de lindice S &P : modle GARCH . . . . . . . . 2.8.4 Modlisation des rendements de laction IBM (avec dividendes) : modle T AR 2.8.5 Modlisation du taux de chmage aux Etats Unis : modles T AR et ARCH . 2.9 Conseils bibliographiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.10 Complments sur les sries temporelles en nance . . . . . . . . . . . . . . . . . . . . . 2.10.1 Introduction historique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.10.2 Complment sur les donnes disponibles . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . .

60 61 62 62 65 65 67 68 69 69 72 73 73 73 75 76 76 76 77 79 79 79 80 81 81 81 84 84 85 85

3 Introduction la notion de mmoire longue 3.1 Processus self-similaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1.1 Accroissements stationnaires de processus self-similaires . . . . . . . . . . . . . . . 3.2 Processus F ARIM A - ARIM A Fractionnaires . . . . . . . . . . . . . . . . . . . . . . . . 3.2.1 Processus fractionnaire sans composante AR et M A : processus F ARIM A (0 ; d; 0) 3.2.2 Autocorrlations des processus ARF IM A . . . . . . . . . . . . . . . . . . . . . . . 3.3 Estimation du paramtre d . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.1 Mthode du log-autocorrlogramme . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.2 Mthode du log-priodogramme . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.3 Mthode de Whittle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4 Exemples dapplications des processus mmoire longue . . . . . . . . . . . . . . . . . . . 3.4.1 Applications en nance : rendements dindices boursier . . . . . . . . . . . . . . . 3.4.2 Applications en nance : taux de change . . . . . . . . . . . . . . . . . . . . . . . . 3.4.3 Applications en hydrologie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4.4 Applications en conomie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.5 Conseils bibliographiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Complments : exercices 4.1 Exercices avec correction 4.2 Examen de 2001/2002 . 4.3 Examen de 2002/2003 . 4.4 Examen de 2003/2004 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

86 . 86 . 91 . 95 . 100 . . . . . . . . . . . . . . . . . 113 113 113 114 115 115 116 116 117 117 119 120 121 123 124 124 125 126 126

5 Complments : simulation de sries temporelles 5.1 Simulation de processus en temps discret . . . . . . 5.1.1 Simulation dun bruit blanc gaussien . . . . 5.1.2 Simulation dun processus ARM A . . . . . 5.1.3 Simulation dun processus ARCH . . . . . 5.2 Introduction la simulation de processus en temps 6 Complments : Logiciels de sries temporelles 6.1 Introduction EViews . . . . . . . . . . . . . . . 6.1.1 Les donnes sous EViews . . . . . . . . . 6.1.2 Les graphiques sous Eviews . . . . . . . . 6.2 La rgression linaire sous Eviews . . . . . . . . 6.2.1 Estimation des paramtres (1) (2) . . . 6.2.2 Statistique de Student F (3) (4) . . . . 6.2.3 Coecient R2 (5) (6) . . . . . . . . . . 6.2.4 Somme des carrs (7) (8) . . . . . . . . 6.2.5 Log-vraissemblance du modle (9) . . . . 6.2.6 Test du Durbin-Watson (10) . . . . . . . 6.2.7 Dependent var (11) (12) . . . . . . . . 6.2.8 Critre dAikak (13) et de Schwarz (14) . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . continu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Sries temporelles : thorie et applications

Arthur CHARPENTIER

6.3 6.4

6.5 6.6 6.7 6.8

6.2.9 Statistique de Fisher F (15) (16) . . . . . 6.2.10 Statistique sur les rsidus . . . . . . . . . . 6.2.11 Copier/coller des sorties dans un rapport . 6.2.12 La rgression linaire sur dautres logiciels . Lecture de lautocorrlogramme sous Eviews . . . . Estimation dun modle ARM A sous Eviews . . . 6.4.1 Racines des polynmes AR et M A (17) . . 6.4.2 Tests sur les erreurs " t . . . . . . . . . . . . Les sorties de la procdure ARIM A sous SAS . . Utilisation de SAS avec des sries chronologiques . Mthode de lissage exponentiel : Holt-Winters . . Modles ARIM A sous SAS . . . . . . . . . . . . . 6.8.1 Syntaxe de la procdure ARIM A sous SAS 6.8.2 La lecture des sorties SAS . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

126 127 128 130 132 133 133 134 136 138 139 139 139 140

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Les sries temporelles multivaries

Les graphiques ci-dessous donnent lvolution des indices sectoriels du C AC , pour les secteurs de lagro-alimentaire, de la distribution, des services nanciers, et de limmobilier. Un portefeuille diversi pourrait correspondre un portefeuille comportant des titres de chacun de ces secteurs. Pour prvoir les rendements futurs du portefeuille, il convient de modliser conjointement lvolution de ces dirents indices. Comme le conrment les graphiques ci-dessous, lvolution de ces indices ne se fait pas indpendemment les uns des autres.
0.08 V_AGRO_ALIM 0.04

12000 10000 8000 6000 4000 2000 0 -2000 500 1000 1500 2000 2500
AGRO_ALIM DISTRIB IMMO RESID

0.00

-0.04

-0.08

500

1000

1500

2000

2500

0.12 0.08 V_DISTRIB

0.04 0.00

-0.04

-0.08

500

1000

1500

2000

2500

0.04 V_IMMO 0.02

0.00

-0.02

-0.04

500

1000

1500

2000

2500

0.10 V_SERVICE_FI 0.05

0.00

-0.05

-0.10

500

1000

1500

2000

2500

Le graphique de gauche correspond lvolution conjointe de ces indices, alors que les graphiques de droites permettent de comparer les rendements de ces indices. Nous allons introduire dans cette partie un certain nombre de concepts an de bien comprendre la dynamique de la dpendence entre direntes sries (notions de dpendence, de causalit, de cointgration...). Nous verrons galement une classe de modles, gnralisant les modles AR (p ) univaris dans un cadre multivari : les modles V AR (p ). Exemple 1 Le graphique ci-dessous1 reprsente lvolution du spread des obligations dEtat pour lArgentine, le Brsil et le Mexique, entre 1997 et 2000 ,

1 source

: Bazdresch, S & Werner, A.M. Contagion of International nancial crises : the case of Mexico (2001).

Sries temporelles : thorie et applications

Arthur CHARPENTIER

1.1
1.1.1

La notion de causalit
Dpendence stochastique On peut dnir linformation de

Dpendance partir les lois conditionnelles : information de Kullback Kullback par f (y jx) K (y jx) = E log jx : f ( y)

Daprs la proprit de Jensen, f (y jx ) f (y ) f (y ) K (y jx ) = E log jx = E log jx log E jx = 0; f (y ) f (y jx ) f (y jx) et on peut noter que K ( y jx ) = 0 si et seulement si f (y jX = x ) = f (y ) presqe srement. Remarque 1 Dans le cas gaussien, cov (X; Y ) = 0 si et seulement si X et Y sont indpendants. Supposons que X 0 X XY sN ; : Y 0 Y X Y Alors les lois marginales et conditionelles vrient Y s N (0 ; Y ), et 1 E (Y jX ) = Y X X X Y jX s N (E (Y jX ) ; V (Y jX )) o 1 V (Y jX ) = Y Y X X XY : Aussi la loi du rapport gurant dans linformation de Kullback est donn par p det (V (Y ) j) f (y jx ) 1 0 = p exp [Y E (Y jX )] V (Y jX ) [Y E (Y jX )] ; f (y ) 2 det (V (Y jX )) do nalement (aprs calculs) log La notion de causalit f ( y) f (y jx) = h i 1 log det V (Y ) :V ( Y jX )1 : 2

La loi du processus est la loi du processus du couple (Xt ; Yt ). Cette dernire scrit, la date t; conditionellement au pass ( not x t1 et y t1 ), ` x t; y tjx t1 ; yt 1 . Dans le cas o les processus (Xt) et (Yt ) sont indpendants, alors ` x t; y tjx t1 ; yt 1 = ` xt jxt 1 ` yt jy t1 : On peut montrer que ` x t; y t jx t1 ; y t1 ` x tjx t1 ; yt 1 ` yt jxt 1; y t1 ` x t ; y t jx t1 ; y t1 = : ` x t jx t1 ` y tjyt 1 ` xt jxt1 ` yt jyt1 ` x tjx t1 ; yt 1 ` yt jx t1 ; y t1

En passant au log et en prenant lesprance (et en multipliant par 2) alors 1 1 1 0 0 0 ` xt ; yt jxt 1 ; y t1 ` x tjx t1 ; yt 1 ` y t jx t1 ; y t1 A = 2 E @log A + 2 E @ log A 2E @log ` xt jxt 1 ` y t j; y t1 ` x t jx t1 ` y tjy t1 | {z } | {z } | {z } Mesure de dpendance Causalit unidirectionnelle Causalit unidirectionnelle CX;Y CY !X CX! Y 0 1 ` x t ; yt jxt1 ; y t1 A: +2 E @ log ` x t jx t1 ; y t1 ` yt jxt 1; y t1 | {z } Causalit instantanne C X !Y 5

Sries temporelles : thorie et applications

Arthur CHARPENTIER

1.1.2

Causalit au sens de Granger

Soient (Xt ) et (Y t) deux sries temporelles, et notons le pass de (Xt) et (Y t), X t = fXt ; Xt1 ; :::g et Y t = f Yt ; Y t1 ; :::g . Granger a introduit en 1969 direntes notions de causalit : Dnition 1 (i) Y cause X la date t si et seulement si E Xt jX t1 ; Y t 1 6= E XtjX t1 :

(ii) Y cause X instantanment la date t si et seulement si E Xt jX t 1 ; Y t 6= E Xt jX t 1 ; Y t 1 : Il y a quivalence entre (1) X ne cause pas Y instantanment la date t (2) Y ne cause pas X instantanment la date t

Exemple 2 Soient (Xt ) et (Y t ) dnis par Xt = " t + Zt + Zt 1 Y t = Zt ;

o ("t ) et blancs indpendants. (Zt ) sont des bruits (i ) E XtjX t1 ; Y t 6 0; 1 = Zt 1 = Yt 1 : Y cause X la date t si et seulement si = (ii) E XtjX t1 ; Y t = Zt + Zt1 = Y t + Y t 1 : il y a causalit instantane de Y vers X si et seulement si 6= 0 :

1.2

La notion de cointgration

Lanalyse de la cointgration permet didentier la relation entre plusieurs variables. Cette notion a t introduite ds 1974 par Engle et Newbold, sous le nom de spurious regressions , ou rgressions fallacieuses, puis formalise par Engle et Granger en 1987, et enn par Johansen en 1991 et 1995. Une srie est intgre dordre d sil convient de la direncier d fois avant de la stationnariser. Dnition 2 La srie (Xt ) sera dite intgre dordre d (d 1 ) si d 1 Xt nest pas stationnaire et d Xt est stationnaire. Une srie stationnaire sera dite intgre dordre 0. Remarque 2 Soient (Xt ) une srie stationnaire et (Y t) intgre dordre 1 , alors ( Xt + Y t ) est intgre dordre 1. Toutefois, si (Xt ) et (Y t ) sont intgres dodre d, alors (Xt + Y t) peut tre soit intgre dordre d, soit stationnaire (dans le cas o les tendances sannulent). Le graphique ci-dessous gauche prsente deux sries non-cointgres, alors que le graphique de droite correspond des sries cointgres
400

8000

300

6000

200

4000

100

2000

25 30 35 40

45 50 55 60 65 OEUFS

70 75 80 85 90

0 60 65 70 PIB 75 80 85 90 95 00 CONSOMMATION

POULET

avec droite, les P IB et la consommation aggrge en France, et gauche, le prix de la douzaine doeufs et dun poulet, aux Etats Unis. Comme nous le verrons plus tard, mme si les courbes de gauche semblent avoir une tendance commune, elles ne sont pas pour autant contgres. Dnition 3 Deux sries (Xt ) et (Y t ) sont cointgres si (i ) (Xt) et (Yt ) sont intgres dordre d (ii) il existe une combinaison linaire de ces sries qui soit intgre dordre strictement infrieur d, not d b 6

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Dans le cas de lintgration, on notera Xt s I (d), et pour la cointgration Xt ; Y t s CI (d; b ). Le vecteur (; ) tel que Xt + Y t s I (d b ) sera appel vecteur de cointgration. Exemple 3 Le cas le plus simple est le suivant : deux sries (Xt ) et (Y t ) intgres dordre 1 seront cointgres sil existe une combinaison linaire Xt + Yt telle que le processus (Zt ) dni par Zt = Xt + Y t soit stationnaire. Aussi, si Xt est intgr dordre 1 (par exemple une marche alatoire), et si ("t ) un un bruit blanc (Xt ) et (Xt + "t ) sont cointgrs. Ce cas est reprsent ci-dessous, avec gauche (Xt ) et (Y t ) o Y t = Xt + "t + , et droite la dirence ( + "t ).
25 20
6 8

15 10 5
2 4

0 -5 20 40 60 80 100 120 140 160 180 200 PROCESSUS_X PROCESSUS_Y


0 20 40 60 80 100 120 140 160 180 200 PROCESSUS_DIFF

Les graphiques ci-dessous reprsentent les sries (Xt ) et (Zt ) o Z t = Xt + "t + , et droite la somme ( "t ).
25 20 18 15 10 5 14 0 -5 20 40 60 80 100 120 140 160 180 200 PROCESSUS_X PROCESSUS_Z 12 20 40 60 80 100 120 140 160 180 200 PROCESSUS_SOMME 16 20

Les deux combinaisons linaires tant stationnaires, les sries sont cointgres. La notion de cointgration peut galement se visualiser en reprsentant le nuage de points (scatterplot) des observations ( Xt; Y t ) - gauche - et (Xt ; Zt ) droite
20 15 PROCESSUS_X
PROCESSUS_X 20 15 10

10 5

5 0

-5

10

15

20

25

-5 -5 0 5 10 15 20 25

PROCESSUS_Y

PROCESSUS_Z

Remarque 3 Le dernier point de lexemple prcdant permet davoir davoir une intuition visuelle sur la prsence ou absence de relation de cointgration (linaire) entre les variables prsentes initialement, avec gauche les observations

Sries temporelles : thorie et applications

Arthur CHARPENTIER

des prix du poulet et des oeufs, et droite, le P IB et la consommation


400

8000

300

6000
OEUFS 200

PIB 4000 2000 1000

100

0 0 50 100 150 200 250

2000

3000
CONSOMMATION

4000

5000

POULET

1.2.1

Modles correction derreur (EC M )

Les modles dits correction derreur ont t introduits au dbut des annes 80, par Hendry en particulier. Ces modles dynamiques permettent dintgrer les volutions long terme et courte terme des variables. Consdrons deux variables (Xt ) et (Y t ) cointgres dordre 1 (Xt ; Y t s CI (1; 1)) et soit [; 1] le vecteur de cointgration. Lide des modles correction derreur est de considrer des relations de la forme Y t = Xt + [Y t1 Xt 1 ] + "t; (1)

ce qui revient dcomposer un processus stationnaire (Y t ) en une somme de deux processus stationnaires (Xt et Y t1 Xt 1 ). De faon plus gnrale que (1), ces modles scrivent Y t = +
p X i =1

i Yt i +

q X

j =0

bi Xti + c [Y t 1 Xt1 ] + t ;

(2)

o les variables interviennent soit travers leurs dirences premires (supposes stationnaires ), soit travers un terme dcart la cible long terme, la priode prcdante ( qui doit tre stationnaire si la thorie conomique sous-jacente est pertinente ). Proprit 1 Thorme de reprsentation de Granger - Toutes les sries cointgres peuvent tre reprsentes par un modle correction derreur Preuve. Engle,R.E. & Granger,C.W.J. (1987). Cointegration and error-correction : representation, estimation and testing. Econometrica. 55 Remarque 4 Le thorme de reprsentation de Granger prsente lintrt de faire la synthse entre les deux approches: - lapproche E CM issue de lide de concilier des proccupations de thorie conomique avec une criture rigoureuse des quations conomtriques - lapproche V AR (que nous dvelopperont dans la partie suivante) issue dune approche purement statistique, de type bote noire. Exemple 4 Considrons les variables conomiques (C t) et ( Rt), correspondant respectivement la consommation et au revenu. Dun point de vue thorique, il est souvent admis quil existe une relation long terme de la forme Ct = Rt , ce qui donne, sous forme logarithmique, ct = k + rt: Dun point de vue conomique, lexpression long terme ne correspond pas uniquement une valeur limite, mais plus gnralement, un comportement asymptotique : on suppose que lon a une chemin de croissance quilibr taux constant, i.e. ct ct1 = cste . On suppose quil existe une relation dynamique liant consommation et revenu de la forme suivante, A (L) ct = + B ( L) + "t (3)

o A et B sont ici supposs de degr p et q respectivement, et o ("t ) est un bruit blanc. Or, daprs la formule de Taylor, il est possible dcrire A (L) = A (1) + (1 L) A (L) o A ( L) = 8
p k X (1) (k ) k 1 A (1) (1 L) ; k! k= 1

Sries temporelles : thorie et applications

Arthur CHARPENTIER

et de mme B (L) = B (1) + (1 L) B ( L). Par substitution dans (3), on peut alors crire A (1) ct = A ( L) ct + B (1) rt + B (L) rt + " t: On dit que cette expression combine les termes en niveau et les termes en dirence premire. Daprs la relation de long terme ( ct = C , rt = R et ct = k + rt:) on en dduit A (1) ct = A (L) C + B (1) rt + B (L) R ; (4)

en supposant le terme derreur nul long terme. (4) est dite relation de long terme associe (3). Il faut toutefois rajouter lquation suivante, correspodant lhypothse dlasticit unitaire de la consommation au revenu, A (1) = B (1). Dans le cas par exemple, o p = q = 1 , alors A (L) = 1 + a1 L et B (L) = b 0 + b 1 L, alors (3) scrit ct + a1 ct1 = + b 0 rt + b 1 rt1 + "t ; do nallement Et en utilisant lgalit A (1) = B (1) = 1 , cette quation scrit ct = (1 + a1 ) ct 1 + b 0 rt + ( b0 + b1 ) rt1 + "t : ct = (1 + a1 ) [ct 1 rt1 ] + b 0 rt + "t : qui correspond lcriture propose dans lquation (2). Sous la forme ct = [ + (1 + a1 ) k] (1 + a1 ) [ct 1 rt1 k ] + b0 rt + "t : il sagit de la forme gnrale dun modle correction derreur, dcrivant lajustement instantan de la consommation ct aux varations de revenu et lcart la cible long terme, (ct 1 rt1 k ). De faon pratique, supposons que lon dispose de 2 (ou plus) sries (Xt ) et (Y t ) intgres lordre 1 . Notons 0 Zt = (Xt ; Y t ) . Daprs le thorme de Wold, on peut reprsenter (Zt ) sous la forme (1 L) Zt = (L) " t o ("t ) est un bruit blanc (en dimension 2 ), (0) = I et aucune ligne de (1) nest nulle ( sinon une des composantes est stationnaire ). (i ) si les composantes (Xt) et (Y t) ne sont pas cointgres, alors le vecteur (Zt ) peut scrire sous forme V AR, ou V ARM A, en dirences premires, (L) Zt = "t ou (L) Zt = - (L) "t : (ii) si les composantes ( Xt) et (Y t ) sont cointgres, alors le vecteur (Zt ) peut scrire sous forme V ARM A, A (L) Zt = B (L ) "t , avec une reprsentation correction derreur A ( L) Zt = Zt1 + B (L) " t. La relation V ARM A est dite relation de court terme, et la seconde relation de long terme, dans laquelle apparait une force de rappel vers la cible de long terme. 1.2.2 Tests de cointgration

An de tester la cointgration entre deux variables, on peut utiliser lalgorithme mis en place par Engle et Granger. (1) tester lordre dintgration des variables : une des conditions ncessaire pour quil y ait cointgration tant que les deux sries doivent tre intgres de mme ordre. Ces tests reposent sur lutilisation des tests de Dikey & Fuller. On cherche alors d tel que Xt s I (d) et Y t s I (d) . (2) estimation de le relation de long-terme. Compte tenu du thrme de reprsentation de Granger, il est galement possible de tester la cointgration en estimant le modle correction derreur associ. Cette estimation peut se faire en deux tapes, en estimant par mco la relation de long-terme b t +b Yt = b + X " t; puis en estimant, toujours par mco la relation de court-terme Le coecient doit alors tre signicativement ngatif : dans le cas contraire, on rejette lhypothse dune modlisation de la forme EC M: 1.2.3 Gnralisation k variables Y t = Xt + b "t 1 + t:

La notion de cointgration peut se gnraliser de 2 k variables. 9

Sries temporelles : thorie et applications

Arthur CHARPENTIER

1.2.4

Dirences entre les approches de Engle/Granger et de Johansen

Comme nous venons de le voir la mthode de Engle et Granger (1987) sarticule en deux tapes (1) rgression statistique entre variables intgres (aprs avoir vri que les variables sont intgres de mme ordre ) (2) test de vricarion de la stationnarit des rsidus (test de Dikey & Fuller ) La mthode Johansen consiste tester les restrictions imposes par la cointgration sur le modle V AR non restreint. On considre un modle V AR ( p) de la forme Y t = A1Y t 1 + :: + Ap Y tp + "t ou Yt = Yt 1 + 1 Y t1 + 2 Y t2 + ::: + p1 Y tp +1 + "t ; (5)

o = (A1 + ::: + Ap ) I et i = (Ai+1 + ::: + Ap ). Le thorme de reprsentation de Granger arme alors que le coecient de la matrice a un rang rduit r < k , nombre de variables cointgres, et donc, il existe des matrices U et V de rang r, telles que = U V 0 et telles que V 0Y t soit stationnaire. r est alors le nombre de relations de cointgration (rang de cointgration ), chaque clonne de V est le vecteur de cointgration, et les lments de U sont des paramtres dajustement. La mthode de Johansen consiste estimer la matrice et de voir si on peut rejeter des restrictions impliques par le rang rduit de : si on a k variables endognes, toutes avec une racine unitaire ( non stationnaire, mais stationnaire aprs direnciation - une fois ), on peut avoir k 1 relations de cointgration linaires indpendantes. Sil ny a aucune relation de cointgration, des analyses standards de sries chronologiques telles que les V AR peuvent tre appliques aux dirences premires des donnes. Exemple 5 Sur les donnes dtailles dans lexemple (1 :3 :5) , intgres 2 , le test de de causalit de Granger propos par E V iews donne les rsultats suivants, droite
20 0
Pairwise Granger Causality Tests Sample: 1992:01 1999:12 Lags: 1 Null Hypothesis : Z2 does not Granger Cause Z1 Z1 does not Granger Cause Z2 Lags: 2 Obs 95 F-Statistic 8.19171 1.63180 Probability 0.00521 0.20467

-20 -40

Null Hypothesis : Z2 does not Granger Cause Z1 Z1 does not Granger Cause Z2 Lags: 3

Obs 94

F-Statistic 23.8840 2.73080

Probability 5.0E-09 0.07063

-60 -80 92 93 94 95 Z1 96 97 Z2 98 99

Null Hypothesis : Z2 does not Granger Cause Z1 Z1 does not Granger Cause Z2

Obs 93

F-Statistic 16.0105 2.42069

Probability 2.4E-08 0.07152

avec gauche les courbes des processus Z1 et Z2 . Trois cas sont prsents ici : lorsque le modle contient 1 , 2 et 3 retards. Lhypothse nulle est ici quil ny a pas causalit, savoirque Z2 ne cause pas Z1 dans la premire quation, et que X ne cause pas Y dans la seconde. Ici, on rejette lhypothse nulle selon laquelle Z2 ne cause pas Z 1 car la puissance associe aux tests est trs faible (dans les trois cas), et au seuil 5, on accepte lhypothse que Z1 cause Z2 au sens de Granger. Au contraire, on rejete lhypothse de causalit de Z2 vers Z1 .
2 Ce

test ( test de Johansen ) est un test de contgration : il nest donc valable que sur des variables non-stationnaires.

10

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Le test de Johansen est prsent ci-dessous


Included observations: 91 Test assumption: No deterministic trend in the data Series : Z1 Z2 Lags interval : 1 to 4 Eigenvalue 0.035347 0.007598 Likelihood Ratio 3.968895 0.694084 5 Percent Critical Value 12.53 3.84 1 Percent Hypothesized Critical Value No. of CE(s) 16.31 6.51 None At most 1 Included observations: 91 Test assumption: No deterministic trend in the data Series : Z1 Z2 Lags interval : 1 to 4 Eigenvalue 0.104344 0.006586 Likelihood Ratio 10.62946 0.601353 5 Percent Critical Value 15.41 3.76 1 Percent Hypothesized Critical Value No. of CE(s) 20.04 6.65 None At most 1

*(**) denotes rejection of the hypothesis at 5%(1%) significance level L.R. rejects any cointegration at 5% significance level Unnormalized Cointegrating Coefficients: Z1 0.019804 -0.029400 Z2 -0.023022 0.040442

*(**) denotes rejection of the hypothesis at 5%(1%) significance level L.R. rejects any cointegration at 5% significance level Unnormalized Cointegrating Coefficients: Z1 0.018941 -0.037981 Z2 -0.016819 0.049285

Normalized Cointegrating Coefficients: 1 Cointegrating Equation(s) Z1 1.000000 Log likelihood Z2 -1.162462 (0.17327) -390.7528

Normalized Cointegrating Coefficients: 1 Cointegrating Equation(s) Z1 1.000000 Z2 -0.887939 (0.25230) -385.9191 C 13.86919

Log likelihood

Included observations: 93 Test assumption : No deterministic trend in the data Series : Z1 Z2 Lags interval : 1 t o 2 Eigenvalue 0.032396 0.007270 Likelihood Ratio 3.741320 0.678590 5 Percent Critical Value 12.53 3.84 1 Percent Critical Value 16.31 6.51 Hypothesized No. of CE(s) None At most 1

Sample : 1992:01 1999:12 Included observations: 93 Series : Z1 Z2 Lags interval : 1 to 2

Data Trend:None None Linear Linear Quadratic ------------------------------------------------------------------------------------------------------------------------------------------------------------Rank No Intercept Intercept Intercept Intercept Intercept No. No Trend No Trend No Trend Trend Trend Log Likelihood by Model and Rank 0 1 2 -409.0860 -407.9648 -407.9018 -409.0860 -402.8793 -401.7586 -407.4978 -402.0757 -401.7586 -407.4978 -402.0359 -397.3329 -402.6242 -397.9195 -397.3329

*(**) denotes rejection of the hypothesis at 5%(1%) significance level L.R. rejects any cointegration at 5 % significance level Unnormalized Cointegrating Coefficients: Z1 0.023160 -0.022981 Z2 -0.027864 0.032209

Akaike Information Criteria by Model and Rank 0 1 2 8.797548 8.773436 8.772081 8.797548 8.664070 8.639970 8.763393 8.646789 8.639970 8.763393 8.645932 8.544793 8.658585 8.557409 8.544793

Schwartz Criteria by Model and Rank

Normalized Cointegrating Coefficients: 1 Cointegrating Equation(s) Z1 1.000000 Log likelihood Z2 -1.203111 (0.11159) -437.2565

0 1 2

9.187449 9.358288 9.551884

9.187449 9.297660 9.517247

9.250770 9.329116 9.517247

9.250770 9.376997 9.519545

9.243436 9.337211 9.519545

L.R. Test:

Rank = 0 Rank = 0 Rank = 0 Rank = 0 Rank = 0

E V iews propose plusieurs options pour les tests de cointgration 3 . La sortie en bas droite est la sortie rcapitulative. Pour les autres, les valeurs propres sont prsentes dans la premire colonne. Le LR - Likelihood Radio - est dni par k X Q (r) = T log (1 i ) ; pour r = 0 ; 1; :::; k 1 ;
i =r +1

o i est la i me valeur propre (lorsquelle sont ranges par ordre croissant). Cette statistique est aussi appele statistique de la trace. La premire ligne de la cinquime colonne (Hypotheized No. of CE(s)) teste lhypothse de non-cointgration ( r = 0 : relation de cointgration). La deuxime ligne teste lhypothse dune relation de contgration (r = 1), la deuxime ligne teste lhypothse de deux relations de contgration (r = 2 )...etc. Toutes ces hypothses sont testes contre lhypothse alternative que la matrice est de plein rang (cest dire que toutes les sries sont stationnaires). Dans lexemple ci-dessus, la statistique de la trace ne rejette aucune des hypothse au seuil de 5% : il ny a donc aucune relation de cointgration car on na pas rejet 0 ( None) relation de cointgration pour au moins une. Le vecteur de cointgration nest pas identi, moins dimposer une normalisation arbitraire : E V iews adopte une normalisation de sorte que les r premires sries dans le vecteur Y t soient normaliss une matrice identit. Dans le cas prsent en haut droite, par exmple, la relation de cointgration normalise qui fait lhypothse (ctive) dune relation de cointgration est donne par
Normalized Cointegrating Coefficients: 1 Cointegrating Equation(s) Z1 1.000000 Z2 -0.887939 (0.25230) -385.9191 C 13.86919

Log likelihood

ce qui donne la relation de cointgration de la forme Z1 0:8873 :Z2 + 13 :869 . Enn, le graphique ci-dessous montre le scatterplot de ( Z1 ; Z2 ), qui montre (graphiquement) quil ny a pas de relation de cointgration a priori, compte tenu
3 Les 5 cas tudis sont les suivants : ( i) pas de trend, pas de constante dans la relation de contgration Yt1 = 0 Yy 1 ( ii) pas de tre nd dans la relation de contgration Yt1 = ( 0 Yy 1 + ) ( iii) trend linaire dans la relation de contgration Yt1 = ( 0Yy1 + ) + ? ( iv) trend linaire dans la relation de contgration Yt1 = ( 0Yy1 + + t) + ? ( v) trend quadratique dans la relation de contgration Yt1 = ( 0 Yy 1 + + t) + ? ( + t)

11

Sries temporelles : thorie et applications

Arthur CHARPENTIER

de cette rupture pour les valeurs positives, avec deux tendances distinctes.
20 0 -20 Z1 -40 -60 -80 -80 -60 -40 Z2 -20 0 20

Pour reprendre lexemple introductif, les prix de la douzaine doeufs et dun poulet, bien que non-stationnaires, ne sont pas pour autant contgres,
400

300

200

100

0 25 30 35 40 45 50 55 60 OEUFS 65 70 75 80 85 90 POULET

omme cela peut se voir sur les sorties des tests de Johansen
Included observations: 67 Test assumption: Linear deterministic trend in the data Series: OEUFS POULET Lags interval : 1 to 2 Eigenvalue 0.072879 0.059236 Likelihood Ratio 9.161157 4.091221 5 Percent Critical Value 15.41 3.76 1 Percent Critical Value 20.04 6.65 Hypothesized No. of CE(s) None At most 1 *

*(**) denotes rejection of the hypothesis at 5%(1%) significance level L.R. rejects any cointegration at 5% significance level Unnormalized Cointegrating Coefficients: OEUFS -0.004465 -0.001669 POULET 0.003299 0.003287

Normalized Cointegrating Coefficients: 1 Cointegrating Equation(s) OEUFS 1.000000 Log likelihood POULET -0.738944 (0.20045) -634.8795 C -109.7839

La lecture des sorties des tests de cointgration sous Eviews 4.1 se fait de la faon suivante,

On considre un modle V AR pour (Y t ), savoir Y t = A1 Yt 1 + ::: + Ap Y tp + "t , o (Y t ) est un vecteur de processus I (1). On rcrit alors ce modle sous la forme dcrite ci-dessus, savoir Yt = Yt 1 + 1 Y t1 + 2 Yt 2 + ::: + p1 Y tp +1 + "t ; 12

Sries temporelles : thorie et applications

Arthur CHARPENTIER

o = (A1 + ::: + Ap ) I et i = (Ai+1 + ::: + Ap ) . Daprs le thorme de reprsentation de Granger, il existe et matrices k r, o r < k , telles que = 0 et telles que 0Y t soit stationnaire. r est alors le nombre de relations de cointgration, et les colonnes de correspondent aux vecteurs de cointgration. De la mme faon que Johansen (1995) 5 cas sont distingus, suivant la tendance retenue, 1. 2. 3. 4. 5. Pas de tendance dterministe pour (Y t ), quations de cointgration sans constantes, Pas de tendance dterministe pour (Y t ), quations de cointgration avec constantes, Tendance dterministe pour (Y t ), quations de cointgration avec constantes, Tendance dterministe pour (Y t ), quations de cointgration avec tendances linaires, Tendance quadratique pour (Y t), quations de cointgration avec tendances linaires.

Les modles tests scrivent alors 1. 2. 3. 4. 5. Y t1 Y t1 Y t1 Y t1 Y t1


0 = t 1 Y = 0 Y t1 + = 0 Y t1 + + = 0 Y t1 + + t + = 0 Y t1 + + t + + t

Il est dailleurs possible sous Eviews de ra jouter des compostantes exognes. On considre alors des modles de la forme Y t = A1 Y t1 + :: + Ap Y tp + +BXt + "t . Exemple 6 Pour reprendre lexemple introductif, les P IB franais et lindice de la cnsommation sont des sries non-stationnaires, et cointgres,
8000

6000

4000

2000

0 60 65 70 PIB 75 80 85 90 95 00 CONSOMMATION

comme cela peut se voir sur les sorties des tests de Johansen
Included observations: 39 Test assumption: No deterministic trend in the data Series : PIB CONSOMMATION Lags interval: 1 to 1 Likelihood 5 Percent 1 Percent Eigenvalue Ratio Critical Value Critical Value 0.266578 0.111813 16.71568 4.624333 12.53 3.84 16.31 6.51

Hypothesized No. of CE(s) None ** At most 1 *

*(**) denotes rejection of the hypothesis at 5%(1%) significance level L.R. test indicates 2 cointegrating equation(s) at 5% significance level Unnormalized Cointegrating Coefficients: PIB 0.000644 -0.001586 CONSOMMATION -0.000961 0.002665

Normalized Cointegrating Coefficients: 1 Cointegrating Equation(s) PIB 1.000000 Log likelihood CONSOMMATION -1.492961 (0.12258) -434.1513

13

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Il est toutefois possible, sur la version 4.1, dobtenir des sorties plus compltes sur ce test,
Included observations: 39 after adjusting endpoints Trend assumption: Quadratic deterministic trend Series: CONSOMMATION PIB Lags interval (in first differences): 1 to 1 Unrestricted Cointegration Rank Test Hypothesized No. of CE(s) None At most 1 * Trace Statistic 13.52735 5.013688 5 Percent Critical Value 18.17 3.74 1 Percent Critical Value 23.46 6.40

Unrestricted Cointegrating Coefficients (normalized by b'*S11*b=I): CONSOMMA TION -0.047692 0.009142 PIB 0.016639 0.002159

Eigenvalue 0.196115 0.120636

Unrestricted Adjustment Coefficients (alpha): D(CONSOMM ATION) D(PIB) 8.415089 -0.123872 -6.857180 -26.79345

*(**) denotes rejection of the hypothesis at the 5%(1%) level Trace test indicates no cointegration at both 5% and 1% levels

1 Cointegrating Equation(s):
Hypothesized No. of CE(s) None At most 1 * Eigenvalue 0.196115 0.120636 Max-Eigen Statistic 8.513665 5.013688 5 Percent Critical Value 16.87 3.74 1 Percent Critical Value 21.47 6.40

Log likelihood

-390.8848

Normalized cointegrating coefficients (std.err. in parentheses) CONSOMMA PIB TION 1.000000 -0.348888 (0.03825) Adjustment coefficients (std.err. in parentheses) D(CONSOMM -0.401329 ATION) (0.21329) D(PIB) 0.005908 (0.63095)

*(**) denotes rejection of the hypothesis at the 5%(1%) level Max-eigenvalue test indicates no cointegration at both 5% and 1% levels

La lecture de la sortie se fait de la faon suivante : il sagit ici dun test de type ADF o les deux sries sont supposes avoir une tedance et une constante
Sample: 1960 2000 Included observations: 39 Series: CONSOMMATION PIB Lags interval: 1 to 1 Data Trend: None None Linear Linear Quadratic Rank or No Intercept Intercept Intercept Intercept Intercept No. of CEs No Trend No Trend No Trend Trend Trend Selected (5% level) Number of Co integrating Relations by Model (columns) Trace Max-Eig 0 1 2 0 1 2 0 1 2 2 2 -407.9952 -401.9496 -399.6374 21.12796 21.02305 21.10961 21.29858 21.36430 21.62148 1 1 -407.9952 -394.8963 -392.0803 21.12796 20.71263 20.82463 21.29858 21.09653 21.42181 0 0 -395.3806 -392.3676 -392.0803 20.58362* 20.63423 20.82463 20.83955* 21.06079 21.42181 0 0 -395.3806 -391.0583 -388.3780 20.58362* 20.61837 20.73733 20.83955* 21.08758 21.41982 0 0 -395.1417 -390.8848 -388.3780 20.67393 20.66076 20.73733 21.01518 21.17263 21.41982

Log Likelihood by Rank (rows) and Model (columns)

Akaike Information Criteria by Rank (rows) and Model (columns)

Schwarz Criteria by Rank (rows) and Model (columns)

1.3
1.3.1

La modlisation V AR (p)
La reprsentation V AR ( p)

La reprsentation V AR k variables et p dcalages V AR ( p) scrit sous forme matricielle, Yt = A0 + A1 Y t1 + ::: + Ap Yt p + "t ; avec 6 6 Yt = 6 4 2 Yt1 Yt2 . . . Y tk 3 7 6 7 6 7 Ai = 6 5 4 2 a1 1i a1 2i . . . a1 ki a2 1i a2 2i . . . a2 ki ak 1i ak 2i . . . ak ki 3 7 6 7 6 7 A0 = 6 5 4 2 a0 1 a0 2 . . . a0 k 3 7 6 7 6 7 et "t = 6 5 4 2 "1 t "2 t . . . "k t 3 7 7 7: 5 (6)

La matrice de covariance des erreurs = E ( "0 t" t) est ici inconnue. De la mme faon que dans le cas univariari, on pourra noter A (L) Yt = A0 + "t ; 14

Sries temporelles : thorie et applications

Arthur CHARPENTIER

2 p o A est un polynome matriciel ( k k); A (z) = I A1 z A2 z ::: Ap z , et on appera polynme charactristique 2 p let polynme det I A1 z A2 z ::: Ap z .

Remarque 5 Lcriture V AR prsente ici suppose que la i me quation, dnissant Yti ne fasse intervenir aucun j Y t . Ceci nest pas forcment toujours le cas : considrons les deux processus stationnaires (Xt ) et (Y t) dnis par les relations suivantes Xt = + 1 Xt1 + ::: + p Xtp Y t + 1 Y t1 + ::: + q Y tq + " t Y t = a + b1 Y t1 + ::: + b r Yt p dXt + c1Xt 1 + ::: + cs Xts + t ; qui peut se rcrire sous forme matricielle DZt = A + 1 Zt1 + ::: + n Ztn + u t o n = max fp; q; r; sg avec les notations matricielles Xt "t 1 i i Zt = , ut = ,D= ,A= et pour i = 1; :::; n Ai = ; Yt t d 1 a bi ci avec la convention, par exemple, i = 0 pour p < i n. On supposera que les bruits (" t) et ( t) sont non-corrls. Il est alors possible dcrire lquation sous forme rduite, obtenue en mutipliant par par D1 : Zt = + 1 Zt1 + ::: + n Ztn + vt o v t = B 1 u t: On constate que les innovations (vt ) sont alors fonctions des innovations de la forme structurelle, ( "t) et ( t), et peuvent tre corrls : 0 "t t t d"t vt = ; : 1 d 1 d 2 2 2 2 Si chacunes des composantes sont i:i:d: les variances sont alors respectivement 2 " + = [1 d] et + d " = [1 d On constate que lon peut alors toujours se ramener des processus de la forme (6). Dnition 4 Le processus Yt est stationnaire (au second ordre) si (i ) E (Y t) = pour tout t (ii) V (Y t ) est nie et constante (iii ) cov (Y t ; Yt+k ) = E ([Yt ] [Y t+k ]) = k pour tout t Proprit 2 U,n processus V AR (p ) est stationnaire si le polynme caractrisque (dni partir du dterminant det I A1 z A2 z 2 ::: Ap z p ) a ses racines lextrieur du cercle unit. Preuve. Hamilton (1994) page 259 Exemple 7 Le processus bivari dni par 1 Yt 2 0 :7 = + Y t2 3 0 :2 a pour polynme caractristique 1 0 0:7 det 0 1 0:2

0 :4 0 :3

Yt1 1 Yt2 1

"1 t "2 t

0:4 0:3

qui admet pour racines z1 = 0:84 et z2 = 0 :15 : le processus nest pas stationnaire. Exemple 8 Le processus dni par 1 Yt 2 0 :2 = + Y t2 3 0 :7 a pour polynme caractristique 1 0 0 :2 det 0 1 0 :7

1 0:7 z z = 0 :2z

0 :4z = 1 z + 0 :13 z2 ; 1 0:3 z

0 :4 0 :3

Yt1 1 Yt2 1

"1 t "2 t

0:4 0:3

qui admet pour racines conjugues z1 = 0 :25 0 :79 i et z2 = 0 :25 + 0 :79 i : le processus nest pas stationnaire. 15

1 0 :2z z = 0 :7 z

0 :4 z = 1 0:5 z 0:22 z 2 ; 1 0 :3 z

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Exemple 9 Le processus dni par 1 Yt 2 0 :2 = + Y t2 3 0 :3 a pour polynme caractristique 1 0 0 :2 det 0 1 0 :3

0 :7 0 :4

Yt1 1 Yt2 1

"1 t "2 t

0:7 0:4

qui admet pour racines z1 = 1:30 et z2 = 5 :91 : le processus est stationnaire.

1 0 :2z z = 0 :z

0 :7 z = 1 0:6 z + 0:13 z 2 ; 1 0 :4 z

0 Les processus V AR (p ) peuvent se mettre sous forme V AR (1) en utilisant lcriture suivante. Soit Y t = Y t1 ; ::::; Y tn 2 R n satisfaisant la reprsentation V AR (p ) suivante : pour tout t, Yt (n; 1) = + A1 Y t1 + ::: + Ap Y tp + "t soit A (L) Y t = + "t :

Lesprance de ce processus est alors E (Xt ) = E (L)1 [ + "t] = (1) 1 c = pour tout t: On peut alors rcrire (L) [Y t ] = "t . Considrons alors B B Zt = B @ (np;1) 0 Yt Y t1 . . . Yt p+1 1 C C C A B B B =B B @ 0 A1 In 0n 0n A2 0n In 0n .. . In Ap 1 0n 0n Ap 0n 0n . . . 0n 1 0 C C B C B C et t = B C @ (np;1) A "t 0n . . . 0n 1

(np;np )

C C C: A

On peut alors noter que le processus V AR (p) (Y t ) peut se rcrire sous la forme dun processus transform Zt satisfaisant une reprsentation V AR (1) : Zt = AZt 1 + t : Exemple 10 Considrons le processus bivari dni par 1 1 Yt 3 0:2 0 :7 Yt 1 0 :4 = + Y t2 1 0:3 0 :4 Yt2 0 :1 1 suivant un modle V AR (2) . Le polynme A (L) = =

0:6 0:8

Y t1 2 Y t2 2

"1 t "2 t

autorgressif A (L) est alors donn par 1 0 0 :2 0:7 0:4 0:6 + L+ L2 0 1 0 :3 0:4 0:1 0:8 1 0:2 L + 0 :4 L2 0:7 L + 0 :6 L2 : 0 :3L + 0:1 L2 1 0 :4 L + 0 :8L2

Lesprance du processus (Yt ) est alors donne par = A (L) On a alors 2 3 2 Y t1 2 :59 0 :2 6 Y t2 1 :80 7 6 0 :3 6 1 7 6 4 Yt 1 2:59 5 = 4 1 Yt2 0 1 1: 80
1

3 1

2 :59 1 :80

: 3 3 "1 t 7 6 "2 7 7 +6 t 7: 5 4 0 5 0 2

0 :7 0 :4 0 1

32 1 0:4 0:6 Yt 1 2 :59 6 Yt2 0:1 0:8 7 7 6 1 1 :80 0 0 5 4 Yt1 2 2 :59 0 0 Yt2 2 1 :80

1.3.2

Les modles ARM AX ou V ARM A

Les modles ARM AX sont une gnralisation des processus V AR (p ), de la mme faon que les processus ARM A (p; q) sont une gnralisation des processus AR (p ) : Y t = A0 + A1 Yt 1 + ::: + Ap Y tp + "t + B1 "t1 + ::: + Bq "tq ; 16

Sries temporelles : thorie et applications

Arthur CHARPENTIER

o Ai et Bj sont des matrices k k . Il est possible de distringus les processus V M A (obtenus quand p = 0 ) : moyennes mobiles mutivaries. - les processus V AR sont toujours inversibles, et sont stationnaires si les racines du polynme caractristique sont lextrieur du disque unit - les processus V M A sont toujours stationnaires, et sont inversibles si les racines du polynme caractristique sont lextrieur du disque unit - les conditions dinversibilit et de stationnarit des processus ARM A dpendent des parties V AR et V M A du processus. Remarque 6 Il est possible de montrer que les processus V ARM A peuvent se mettre sous forme V AR (1) : Soit Y t suivant un modle V ARM A (p; q), tel que Yt = A1 Yt 1 + ::: + Ap Y tp + "t M 1 "t1 ::: Mq " tq et notons Yt 6 . . 6 . 6 6 Y tp +1 Zt = 6 6 "t 6 6 . . 4 . "t q1 On posera alors 2 3 6 7 6 7 7 6 7 7 6 7 7 6 7 7 6 0 7 7 vecteur de taille K (p + q) et Ut = 6 7 7 6 "t 7 de taille K p + K q: 7 6 7 7 6 0 7 6 7 5 6 . 7 4 . . 5 0 B11 B21 0 B22 de taille K ( p + q ) K (p + q) ; 3 2 "t 0 . . . 3

B= o les blocs Bij sont dnis par

B11

A1 6 IK 6 =6 4 M1 6 0 6 =6 4 2 2

.. .

Ap1

IK .. . 0 .. . IK 0 M q 1

Ap 0 . . . 0 Mq 0 . . . 0 0 . . . 0 0 3

7 7 7 de taille K p Kp , 5 3 7 7 7 de taille K p K q; 5

B12

B22

Alors, le processus ( Zt) suit un modle V AR (1) ; Zt = BZt 1 + Ut : 1.3.3 Estimation des paramtres dun modle V AR

0 6 IK 6 =6 4

7 7 7 de taille Kq Kq: 5

Chacun des paramtres peut tre obtenue soit par mco ( moindres carrs ordinaires ), soit par maximum de vraissemblance. Pour un modle V AR stationnaire, la stationnarit de la srie va entraner la convergence et la normalit asymptotique des estimateurs obtenus par mco, ce qui permet de mener des tests sur les paramtres du modle, ou de donner des intervalles de conance pour les prvisions. Toutefois, comme nous lavons dj dit dans le cas univari, les variables conomiques sont souvent intgres (dordre 1 ou plus ). Dans ce cas, lcriture (6) est toujours valable, mais le determinant du polynme charactristique admet des racines de module 1 . Les coecients du modles peuvent toujours tre estims par des mco et les estimateurs obtenus sont ptoujours convergents (en fait, ils sont mme super-convergents puisquils convergent la vitesse 1 =T et non pas 1= T ). Cependant, ces estimateurs ne sont pas asymptotiquement normaux, et lon peut plus, dans ce cadre, mener les tests usuels sur les paramtres du modle, ni dterminer dintervalle de conance pour les prvisions. 17

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Cependant, lorsque les variables sont non-stationnaires et cointgres, les rsultats de Engle et Granger (1987) montrent que la bonne spcication du modle consiste utiliser une forme correction derreur (dvelopp dans la partie (1 :2 :1)), qui permet de se ramener une criture ne faisant intervenir que des variables stationnaires, et dans lesquels il est possible deectuer des tests sur les paramtres du modle. 1.3.4 Autocovariances et autocorrlations h i

La k-ime autocovariance croise entre la i -ime et la j -ime variable est donne par ij ( h) = E

Y ti Y

Y th Y

Remarque 7 La proprit de symtrie valable dans le cas univari nest plus vrie ici : pour h 6= 0 , ij (h ) 6= ij ( h) . En eet, si Y t dpend fortement de Xt1 , ce ne signie pas que Yt dpende, de la mme faon, de Xt+1 . Et de mme ij (h) 6= ji ( h) La fonction dautocorrlation est alors ij (h) = q ij (h ) i (0) j (0) 3 :

Aussi, on peut dnir, pour tout retard h la matrice dautocorrlation 2 11 (h ) 12 (h) 1n (h ) 6 21 (h ) 22 (h) 1n (h ) 6 (h) = 6 . . . . . . 4 . . . n1 ( h) n2 (h ) nn ( h)
0

On peut alors noter que (h) = (h ) , et que les lments sur la diagonale correspondent aux autocorrlations usuelles. 1.3.5 Application sur un exemple

7 7 7: 5

Considrons les sries suivantes, Y 1 et Y 2,


4 2

0 -2 -4 -6 92 93 94 95 Y1 96 97 Y2 98 99

18

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Les observations sont les suivantes, 1992 01 1992 02 1992 03 1992 04 1992 05 1992 06 1992 07 1992 08 1992 09 1992 10 1992 11 1992 12 1993 01 1993 02 1993 03 1993 04 1993 05 1993 06 1993 07 1993 08 1993 09 1993 10 1993 11 1993 12 1994 01 1994 02 1994 03 1994 04 1994 05 1994 06 1994 07 1994 08 Y1 0 :999 0 :415 1 :22 1 :251 2 :056 2 :847 3 :446 1 :316 0 :436 1 :033 0 :889 2 :096 2 :963 0 :714 1 :109 2 :626 1 :924 2 :899 2 :627 0 :824 0 :16 1 :395 1 :019 1 :303 3 :123 0 :533 0 :427 0 :793 2 :38 2 :66 1 :726 1 :596 Y2 0 :202 2 :135 1 :734 0 :768 2 :648 2 :387 2 :104 1 :869 0 :443 0 :01 0 :157 0 :949 1 :135 1 :672 2 :234 0 :845 1 :35 1 :449 0 :523 0 :281 0 :695 0 :117 1 :347 1 :329 0 :623 0 :975 2 :129 1 :596 1 :407 2 :467 2 :019 1 :063 1994 09 1994 10 1994 11 1994 12 1995 01 1995 02 1995 03 1995 04 1995 05 1995 06 1995 07 1995 08 1995 09 1995 10 1995 11 1995 12 1996 01 1996 02 1996 03 1996 04 1996 05 1996 06 1996 07 1996 08 1996 09 1996 10 1996 11 1996 12 1997 01 1997 02 1997 03 1997 04 Y1 0 :806 0 :79 0 :155 0 :062 1 :259 0 :263 0 :642 2 :391 0 :032 0 :316 1 :717 0 :329 2 :52 1 :36 2 :264 3 :935 5 :133 2 :051 2 :321 1 :767 0 :696 0 :393 0 :586 1 :334 0 :559 0 :696 0 :979 0 :615 1 :173 0 :115 0 :427 1 :618 Y2 1 :036 1 :188 0 :952 2 :341 1 :138 0 :753 1 :257 1 :385 0 :253 0 :994 1 :68 0 :398 1 :584 1 :163 2 :163 3 :727 3 :934 3 :298 0 :705 0 :308 1 :596 0 :226 0 :203 0 :278 0 :143 1 :111 1 :249 1 :395 1 :409 0 :464 1 :125 1 :52 1997 05 1997 06 1997 07 1997 08 1997 09 1997 10 1997 11 1997 12 1998 01 1998 02 1998 03 1998 04 1998 05 1998 06 1998 07 1998 08 1998 09 1998 10 1998 11 1998 12 1999 01 1999 02 1999 03 1999 04 1999 05 1999 06 1999 07 1999 08 1999 09 1999 10 1999 11 1999 12 Y1 2 :22 2 :171 3 :32 1 :397 0 :555 0 :438 1 :033 1 :972 0 :848 0 :337 0 :074 2 :177 1 :263 0 :246 0 :391 1 :471 0 :363 1 :15 2 :115 1 :75 2 :367 1 :398 0:7 0 :147 1 :01 0 :728 0 :222 0 :496 1 :734 1 :217 1 :899 0 :373 Y2 2 :913 2 :405 2 :394 0 :704 1 :461 0 :134 1 :271 1 :024 0 :048 0:3 1 :264 1 :406 0 :855 1 :389 1 :063 0 :434 0 :776 1 :124 2 :718 3 :002 0 :387 1 :295 0 :258 0 :663 0 :000 0 :535 1 :054 0 :129 1 :292 0 :395 0 :407 0 :227

Lanalyse univarie des sries Y 1 et Y2 donne les autocorrlogrammes suivants,

19

Sries temporelles : thorie et applications

Arthur CHARPENTIER

2 1 Lautocorrlogramme crois permet de reprsenter Y2! Y1 (h ) = corr Y t1 ; Y t2 h et Y 1!Y 2 (h) = corr Yt ; Y th ,

Estimation dun modle V AR (1) avec constante Estimons le modle suivant sur notre chantillon, 1 1 1 Yt a1 a11 a12 Y t1 "t = + + ; Yt2 a2 a21 a22 Y t2 "2 1 t qui peut se rcrire
2 1 Y t1 = a 1 + a11 Y t1 1 + a12Y t1 + "t 2 1 2 Y t = a 2 + a21 Y t1 + a22Y t1 + "2 t:

Pour estimer les paramtres de ce modle, nous pouvons utiliser les mco sur chacune des quations indpendament :
LS // Dependent Variable is Y1 Sample: 1992:01 1999:12 Included observations: 96 Variable Coefficient C Y1(-1) Y2(-1) -0.219299 0.132401 0.712173 Std. Error 0.111804 0.096128 0.104954 0.574829 0.565686 0.976670 88.71123 -132.4279 2.099930 T-Statistic -1.961460 1.377344 6.785548 Prob. 0.0528 0.1717 0.0000 -0.741438 1.481991 -0.016462 0.063674 62.86777 0.000000 LS // Dependent Variable is Y2 Sample: 1992:01 1999:12 Included observations: 96 Variable Coefficient C Y1(-1) Y2(-1) -0.239672 0.219594 0.369461 Std. Error 0.126545 0.108802 0.118792 0.333872 0.319547 1.105439 113.6457 -144.3175 1.910206 T-Statistic -1.893965 2.018300 3.110149 Prob. 0.0613 0.0464 0.0025 -0.620939 1.340096 0.231237 0.311373 23.30639 0.000000

R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat

Mean dependent var S.D. dependent var Akaike info criterion Schwartz criterion F-statistic Prob(F-statistic)

R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat

Mean dependent var S.D. dependent var Akaike info criterion Schwartz criterion F-statistic Prob(F-statistic)

dont les sorties graphiques donnent respectivement


4 2 0 -2 2 1 0 -1 -2 -3 92 93 94 95 96 97 98 99 Residual Actual Fitted -4 -6

4 2 0 4 2 0 -2 -4 -2 -4

92

93

94 Residual

95

96

97

98 Fitted

99

Actual

Les rsidus estims, b "1 b2 t et " t sont alors estims (reprsents ci-dessus ). Leur matrice de variance-covariance est alors b = 0 :924075 0 :545083 ; 0 :545083 1 :183809 20

Sries temporelles : thorie et applications

Arthur CHARPENTIER

do les expressions des critres AIC et SC , k 21 22 b AIC (1) = ln +2 = ln 0 :796051 + 2 = 0 :144759 ; n 96 k2 1 ln n 22 ln 96 b SC (1) = ln = ln 0:796051 + = 0:037911 : + n 96 Cette estimation peut tre faite directement sous EV iews, de faon globale
Sample: 1992:01 1999:12 Included observations: 96 Standard errors & t- statistics in parentheses Y1 Y1(-1) 0.132401 (0.09613) (1.37734) 0.712173 (0.10495) (6.78555) -0.219299 (0.11180) (-1.96146) Y2 0.219594 (0.10880) (2.01830) 0.369461 (0.11879) (3.11015) -0.239672 (0.12655) (-1.89397) R-squared 0.574829 Adj. R-squared 0.565686 Sum sq. resids 88.71123 S.E. equation 0.976670 Log likelihood -132.4276 Akaike AIC -0.016462 Schwartz SC 0.063674 Mean dependent -0.741438 S.D. dependent 1.481991 0.333872 0.319547 113.6457 1.105439 -144.3171 0.231237 0.311373 -0.620939 1.340096
Y1 Residuals
2 1

0 -1

-2 -3 92 93 94 95 96 97 98 99

Y2(-1)

Y2 Residuals
3 2 1 0 -1 -2 -3 92 93 94 95 96 97 98 99

Toutefois, si lon considre les deux rgressions faite au dbut, on peut noter que la constante nest pas signicative ( un seuil de 5%) : on peut tester un modle V AR (1) sans constante. Estimation dun modle V AR (1) sans constante Estimons le modle suivant sur notre chantillon, 1 1 1 Yt a11 a12 Y t1 "t = + ; Y t2 a21 a22 Y t2 "2 1 t qui peut se rcrire
2 1 Y t1 = a 1 + a11 Y t1 1 + a12Y t1 + "t 2 1 2 Y t = a 2 + a21 Y t1 + a22Y t1 + "2 t:

Pour estimer les paramtres de ce modle, nous pouvons utiliser les mco sur chacune des quations indpendament :
LS // Dependent Variable is Y1 Sample: 1992:01 1999:12 Included observations: 96 Variable Coefficient Y1(-1) Y2(-1) 0.175336 0.734900 Std. Error 0.095009 0.105881 0.557240 0.552530 0.991352 92.38113 -134.3737 2.133717 T-Statistic 1.845459 6.940826 Prob. 0.0681 0.0000 -0.741438 1.481991 0.003241 0.056665 118.3047 0.000000

LS // Dependent Variable is Y2 Sample: 1992:01 1999:12 Included observations: 96 Variable Coefficient Y1(-1) Y2(-1) 0.266518 0.394300 Std. Error 0.107391 0.119680 0.308179 0.300819 1.120548 118.0291 -146.1341 1.929628 T-Statistic 2.481746 3.294631 Prob. 0.0148 0.0014 -0.620939 1.340096 0.248250 0.301674 41.87322 0.000000

R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat

Mean dependent var S.D. dependent var Akaike info criterion Schwartz criterion F-statistic Prob(F-statistic)

R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat

Mean dependent var S.D. dependent var Akaike info criterion Schwartz criterion F-statistic Prob(F-statistic)

21

Sries temporelles : thorie et applications

Arthur CHARPENTIER

dont les sorties graphiques donnent respectivement


4 2 0 -2 2 1 0 -1 -2 -3 92 93 94 Residual 95 96 97 98 Fitted 99 -4 -6
4 2 0 -2 -4 92 93 94 95 96 97 98 99 Residual Actual Fitted 4 2 0 -2 -4

Actual

Les rsidus estims, b "1 b2 t et " t sont alors estims (reprsents ci-dessus ). Leur matrice de variance-covariance est alors 0 :931916 0 :553652 = ; 0 :553652 1 :193174 do les expressions des critres AIC et SC , AIC (1) = ln jj + 2 SC (1) = ln j j + k2 1 22 = ln 0 :805407 + 2 = 0:216407 ; n 96

k2 1 ln n 22 ln 96 = ln 0:805407 + = 0:0262263: n 96 Cette estimation peut tre faite directement sous EViews, de faon globale
Sample: 1992:01 1999:12 Included observations: 96 Standard errors & t- statistics in parentheses Y1 Y1(-1) 0.175336 (0.09501) (1.84546) 0.734900 (0.10588) (6.94083) Y2 0.266518 (0.10739) (2.48175) 0.394300 (0.11968) (3.29463) 0.308179 0.300819 118.0291 1.120548 -146.1337 0.248250 0.301674 -0.620939 1.340096
Y1 Residuals
2 1

0 -1

-2 -3 92 93 94 95 96 97 98 99

Y2(-1)

Y2 Residuals
3

R-squared 0.557240 Adj. R- squared 0.552530 Sum sq. resids 92.38113 S.E. equation 0.991352 Log likelihood -134.3733 Akaike AIC 0.003241 Schwartz SC 0.056665 Mean dependent -0.741438 S.D. dependent 1.481991

2 1 0 -1 -2 -3 92 93 94 95 96 97 98 99

Comparaison de dirents modles V AR (p ) Pour dirents modles V AR (p ), les critres AIC et SC sont jj 0:796051 0:805407 0:741204 0:749653 AIC Y1 0:016462 0:003241 0:018655 0:038084 0:059019 0:074667 0:092828 0:111325 AIC Y2 0 :231237 0 :248250 0 :242400 0 :254792 0 :250520 0 :276974 0 :289736 0 :318514 AIC tot 0:144759 0:216407 0:132813 0:121478 SC Y 1 0 :063674 0 :056665 0 :152215 0 :144932 0 :246003 0 :234939 0 :333236 0 :325021 SC Y2 0:311373 0:301674 0:375960 0:361640 0:437504 0:437246 0:530143 0:532210 SC tot 0 :037911 0 :026226 0 :080883 0 :092217

V AR (1) V AR (1) V AR (2) V AR (2) V AR (3) V AR (3) V AR (4) V AR (4)

avec constante sans constante avec constante sans constante avec constante sans constante avec constante sans constante

La comparaison des critres AIC pousse choisir un modle V AR (1) sans constante. Le modle retenu 1 1 1 Yt 0:175 0 :735 Y t1 "t 0:931916 0 :553652 b = + o = : Y t2 0:267 0 :394 Y t2 "2 0:553652 1 :193174 1 t 22

Sries temporelles : thorie et applications

Arthur CHARPENTIER

1.3.6

Prvision laide des modles V AR

Expression de la prvision horizon h Considrons un modle V AR (1) ; Yt = A0 + A1Y t1 + " t; estim partir de T observations. La prvision horizon 1 faite en T est alors bT (1) = A b0 + A b1 Y T : Y

La prvision horizon 2 est alors

De faon plus gnrale, la prvision horizon h est alors

h i bT (2) = A b0 + A b1 Y bT (1) = A b0 + A b1 A b0 + A b1 YT = A b0 + A b1 A b0 + A b2 Y 1 YT : h i bT (h) = A b0 + A b1 Y bT (h 1) = I + A b1 + ::: + A bh 1 A b0 + A bh Y 1 YT : 1

Lesprance de lerreur de prvision est nulle, et sa variance est donne par 1 = horizon 1 . A horizon 2 , cette variance est b1 A b0 = + A b1 A b0 ; 2 = 1 + A 1 1 et horizon 3, elle vaut De faon plus gnrale, la variance de la prvision horizon h est b2 b2 0 b b0 b2 b20 2 = 2 + A 1 A1 = + A1 A1 + A1 A1 :

Des formules analogues existent pour les processus V AR (p ). La variance de lerreur de prvision de chacune des k variables est obtenue sur la diagonale des h : lintervalle de conance de la prvision au niveau 1 = 2 est donne par q b i (h ) t=2 : i; i; Y
T h

bh 1 A bh 10 = + A b1 A b0 + A b2 A b20 + ::: + A bh 1 A bh 10 : h = h1 + A 1 1 1 1 1 1 1

o t= 2 est le fractile de la loi normale.

Application sur lexemple prcdant Le modle retenu tait 1 1 1 Yt 0:175 0 :735 Y t1 "t 0:931916 = + o = 2 Y t2 0:267 0 :394 Y t2 " 0:553652 1 t

0 :553652 1 :193174

En utilisant cette estimation, on obtient de faon rcursive ( 1 b2000 b1 b2 Y 02 = 0 :175336: Y 200001 + 0: 7349 :Y 200001 2 1 b b b2 Y = 0 :266518:Y + 0:3943 :Y ;
200002 200001 200001

On obtient alors la prvision, faite n dcembre 1999 , pour le mois de janvier 2000, de la forme ( 1 1 2 b2000 Y 01 = 0 :175336:Y 199912 + 0: 7349 :Y 199912 2 1 2 b Y 200001 = 0 :266518:Y 199912 + 0:3943 :Y 1999 12 :

La variance de lerreur de prvision est donne par h , soit 0 :931916 0:553652 h = = : 0 :553652 1:193174

b1 b1 b2 Y 200003 = 0 :175336: Y 200002 + 0: 7349 :Y 200002 2 1 2 b200003 = 0 :266518:Y b200002 + 0:3943 :Y b2000 Y 02 :

23

Sries temporelles : thorie et applications

Arthur CHARPENTIER

1.3.7

Tests de bruit blanc des erreurs

De la mme faon que pour les modles AR, il convient de vrier que les erreurs correspondent un bruit blanc. Soit ("t ) le processus derreur, et (h ) sa fonction dautocorrlation. Lhypothse tester est alors H0 : (1) = ::: = (h ) = 0: La statistique Q de Box & Pierce peut alors se gnraliser en multivari, Q ( h) = n La statistique de Ljung & Box scrit Q0 (h ) = n2
h X i =1 h X i =1

1 b (i )0 b (0)1 b ( i) b trace (0) :

La distribution asymptotique suit une loi du chi-deux. 1.3.8

1 0 1 b b (0) 1 : trace b (i ) b (0) (i ) ni

Test de causalit (Granger (1969)) sur des mod les V AR

En dimension 2 , considrons deux processus (Xt ) et ( Yt ). Le but est de se demander si (Xt ) cause ( Yt ), et de voir dans quelle proportion la valeur courante de (Y t) peut tre explique par ses valeurs passes, et si en ajoutant des valeurs retardes de (Xt ), lexplication est meilleure. Considrons un modle autorgressif; X (L) X Y (L) Xt X "t (L) Zt = + ut soit = + ; Y X (L) Y ( L) Yt Y t o on supposera (0) = I , ce qui permettra dinterprter le vecteur u t comme le processus dinnovation. - (Xt ) ne cause pas (Y t ) au sens de Granger si et seulement si les coecients de Y X sont nuls : Y X ( L) = 1 - (Y t) ne cause pas (Xt ) au sens de Granger si et seulement si les coecients de XY sont nuls : XY ( L) = 1 Le test peut se faire sous E V iews (Granger Causality ) : pour cela, on commence par choisir le nombre de retards introduire, et lhypothse nulle teste est que (Y t) ne cause pas (Xt ) dans la premire quation, et que (Xt ) ne cause pas (Y t) dans la seconde. Considrons ici deux vecteurs ( ou variables ) (Xt ) et (Yt ), respectivement de taille n et m , de telle sorte que 0 n + m = K; de telle sorte que le processus (Zt ) = (Xt ; Y t ) soit un processus V AR ( p) :
Zt = M + A1 Zt1 + A2 Zt 2 + ::: + Ap Zt p + "t ou encore Zt = BZt 1 + Ut ;

en reprenant les notations de la remarque (6), cest dire 6 6 6 =6 6 4 2 1 Zt Zt1 . . . Ztp +1 3 7 6 7 6 7 6 7 et Ut = 6 7 6 5 4 2 0 "t 0 . . . 0 3 7 7 7 7: 7 5

B=

A1

Ap 1

Ap

de taille K (K p + 1) ;

Zt

Le test de lhypothse de causalit est un test de Wald : on cherche tester (H0 ) : R = c contre (H1 ) : R 6= c, b, estimateur de , o C est une matrice N K 2 p + K de rang N et c est un vecteur RN . Supposons que p p L L b ! N 0; 1 - , alors T R b vrie une proprit de normalit asymptotique, cest dire T R ! N 0 ; R 1 - R0 et on a alors En remplaant les matrices et par leur estimateurs usuels 1 0 L T (R c) R 1 - R0 (R c) ! 2 ( N ) : 1 1 b b= = ZZ 0 et u bb u0 ; T T Kp 1 24

Sries temporelles : thorie et applications

Arthur CHARPENTIER

on obtient lestimateur de Wald 0 h i 1 1 b R0 = Rb c R (ZZ 0 ) - Rb c ;

qui suit asymptotiquement un chi-deux N degrs de libert. Toutefois, une alternative galement utilise est de considrer =N qui suit asymptotiquement une loi de Fisher N et T Kp 1 degrs de libert. Dans le cas du test de causalit de Granger le coecient c est nul, de taille (m n) p , est le vecteur vec ( B) cest dire la concatnation des vecteurs colonnes de B : le modle de base scrivant de la faon suivante X Y Y Y Xt MX AX AX X t 1 AX AX X t 2 AX AX Xtp "t 1 1 2 2 p p = + + + :::+ + ; X Y YX Y YX Y Yt MY AY A Y A A Y A A Y "Y t 1 t 2 t p 1 1 2 2 p p t on a B = MX MY AX 1 X AY 1 AX 1;11 . . . X A1 ;1n X AY 1;11 . . .
X AY 1;1 m

2 =

AXY 1 AY 1

AX 2 X AY 2 AX 1;n 1 . . . X A1 ;nn X AY 1;n 1 . . .


X AY 1;nm

AX AXY 2 ::: YpX AY A 2 p


Y AX 1 ;11 . . . XY A1;1n AY 1 ;11 . . .

Y AX p AY p

et donc

X M1 6 . 6 . 6 . 6 MX 6 n 6 MY 1 6 6 . 4 . . Y Mm

AY 1 ;1m

Y AX AX 1 ;m1 p;11 . . . . . . XY X A1;mn Ap;1n ::: Y X AY Ap;11 1 ;m1 . . . . . . Y YX A1 ;mm Ap;1 m

AX p; n1 . . . X Ap;nn X AY p; n1 . . .
X AY p; nm

AXY p;11 . . . XY Ap; 1n AY p;11 . . . AY p;1m

AXY p;m 1 . . . XY Ap;mn AY p;m 1 . . . AY p;mm

7 7 7 7 7; 7 7 7 5

La matrice R est alors la matrice remplie de 0 et de 1 permettant de tester la nullit des coecients AXY ,...,AXY , 1 p cest dire 2 3 6 6 6 6 6 6 6 6 6 R=6 6 6 6 6 6 6 6 4 nullit de AXY 1;12 nullit de AXY 1;11 . . . nullit de AXY 1;mn nullit de . . . nullit de AXY p; mn AXY p;11
n +m

X 0 2 X Y Y X YX YX X Y Y = M1 Mn M1 Mm AX 2 R(n +m ) p+n +m : 1;11 A1; 1n A1; 11 A1;1m A2 ;11 Ap;m1 Ap; mm

0 0 . . . 0

0 0 . . . 0

1 0 . . . 0

0 1 . . . 0

n (n +m)

0 0 . . . 0

0 0 . . . 1 . . . 0 0

0 0 . . . 0

m( n+m )

0 0 0 0 ::: . . . . . . 0 0 ::: 0 1 . . . . ::: . . 0 0

0 0 . . .

m(n +m )

0 0 . . . 0

0 0 . . . 0

. . . 0 . . . 0 0 0 0 0

. . .

0 . . . 0

0 0

n +m

n (n +m )

0 . . . 0

0 . . . 0 . . . 0

0 . . . 0

0 . . . 1

m( n+m )

m(n +m )

On rejette alors (H0 ) (de non-causalit ) quand la puissance du test est trs faible (infrieure 5%), et dans le cas contraire, on ne peut pas rejeter lhypothse de non-causalit (puissance suprieure 5%). 1.3.9 Les modles V AR (p ) : analyse des chocs

7 7 7 (n m) 7 7 7 7 7 7 . 7 . 7 . 7 7 7 7 (n m) 7 7 5

(Y t ) suit un modle V AR dordre p si et seulement si Y t = M + A1 Y t1 + A2 Y t2 + ::: + Ap Y tp + "t ; o ( "t) est un bruit blanc de dimension K , de matrice de variance-covariance . Proprit 3 Ce processus admet une reprsentation V AR (1) de la forme Zt = + AZ t1 + Ut o 2 3 2 3 2 3 2 3 Yt M "t A1 Ap 1 Ap 6 Yt 1 7 6 0 7 6 0 7 6 IK 0 0 7 6 7 6 7 6 7 6 7 Zt = 6 , = 6 . 7 , Ut = 6 . 7 et A = 6 7 7: . .. . 4 5 4 . 4 . 4 5 . . . 5 . 5 Y tp+1 0 0 0 IK 0 25

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Remarque 8 En posant J = [IK ; 0 ; :::; 0], on peut crire Y t = J Zt Sous lhypothse de stabilit du processus (racines du polynme charactristique lextrieur du disque unit ) la reprsentation V M A est la suivante (appele aussi dcomposition de Wald ) Yt = +
1 X i =0

i"t i o

i = J AiJ 0 : = (I K A1 ::: Ap )1 M

(7)

Impact dune impulsion Nous allons tudier ici leet dune innovation dune des variables Y ti sur le systme de K variables. Pour cela, on suppose que Y t = pour t < 0 et quen t = 0 , la ime variable augmente de 1 (soit "j t = 0 pour j 6= i et "i t = 1 ). Lide est alors dtudier comme ragit le systme aux dates 1 , 2 , ..etc, si aucun autre choc ne survient. Nous supposerons pour la suite que le processus (Y t ) est centr, et que linnovation se fait sur la premire variable. Enn, nous noterons = (1 ; 0; 0 ; :::; 0) 0 le vecteur dimpulsion. Remarque 9 Lide gnrale de lanalyse des chocs (ou fonction de rponse aux innovations) est de rsumer linformation concernant lvolution dune composante Y tj suite une impulsion sur Y ti, la date t = 0 , en supposant que toutes les autres variables sont constantes pour t 0 . En utilisant lcriture V M A (1 ), on en dduit Y0 =
1 X i =0

i "ti = 0 + 0 + 0 + ::: =
1 X i=0

( car 0 = I),

Y1 =

i "ti = 0 + 1 + 0 + ::: = 1 ;

et plus gnrallement, Y h = h o la matrice h est le coecient du retard dordre h de lcriture V M A (1), cest dire i = J AiJ 0. Aussi, la rponse une choc sur linnovation se lit sur les vecteurs colonnes des matrices de la forme moyenne mobile. On peut galement considrer les rponses accumules. Pour cela, on considre les matrices dnies par i = 1 I + 1 + 2 + ::: + h , avec la matrice limite 1 = I + 1 + 2 + ::: + h + ::: = (IK A1 ::: Ap ) . Un exemple sera trait dans la partie suivante. Orthogonalisation des innovations et dcomposition de la variance Dans lanalyse prcdante, nous avons suppos quil tait possible davoir, la date t = 0 une impulsion sur lune des composantes, cest dire que le bruit ("t ) scrivait sous la forme (0; :::; 0 ; 1; 0 ; :::; 0) 0. Supposons que la matrice de variance-covariance soit de la forme E ( "t" 0 t) = 6= I . Il peut tre intressant (dans le cas bivari, pour simplier ) disoler linnovation propre au processus (Y t ) non pollue par la raction de linnovation (Xt ) : on parle alors dorthogonalisation des innovations. On considre alors la dcomposition suivante de la matrice de covariance des innovations : 1 0 0 0 0 = E (" t"t ) = ADA o A = et D = : 1 0 Exemple 11 Dans le cas bivari, on a par exemple la dcomposition suivante 2 2 1 2 1 0 1 0 1 1 = 2 1 = : 1 2 2 1 = 2 1 0 1 2 2 0 1 2 2 1 0 1 1 1 E ( t 0 E ("t "0 = A1 (A0 ) = A1 ADA0 ( A0) = D: t) = A t) A

On pose alors t = A1 " t : on remarque que les innovations ( t ) sont alors des combinaisons linaires des innovations du modle initial ( "t) , qui sont indpendantes (ou tout du moins non corrles ) :

Un processus bivari (Y t) dnit par un modle V AR (1) de la forme suivante Xt = 0 + 1 Xt 1 + 2 Y t1 + "X t Yt = 0 + 1 Xt 1 + 2 Y t1 + "Y t ;

26

Sries temporelles : thorie et applications

Arthur CHARPENTIER

devient alors

Lide est alors de considrer un choc unitaire non pas sur une composante de ("t ) mais sur la composante Y : t la date t = 0, ( t) = (0 ; 1)0 . En partant de la dcomposition des rsidus en innovations orthogonales, on peut i alors calculer la contribution de chaque innovation la variance totale de lerreur de prvision du processus Xt : cest cela que lon appelle dcomposition de la variance. Considrons le processus (Xt ) admettant la reprsentation V AR (p ) suivante A (L) Y t = Y t A0 A1 Y t1 ::: Ap Yt p = M + "t : On suppose que le bruit blanc ("t ) est de matrice de variance-covariance : On suppose que ce processus est stationnaire, de telle sorte quil puisse tre reprsent sous forme la V M A (1 ) suivante Y t = + "t + 1 "t 1 + ::: + i"ti + ::: = + (L) "t : Lerreur de prvision faite en T horizon h scrit sous la forme bT (h ) = X T +h X = XT +h EL (XT +h jXT ; XT 1 ; :::; X1 ) XT +h EL (XT +h j"T ; "T 1 ; :::; "1 ) = "T +h + 1 "T +h 1 + ::: + h1 "T +1 :

Xt = 0 + 1 Xt 1 + 2 Y t1 + X t Y Yt = 0 + 1 Xt 1 + 2 Y t1 + 1 = 2 : X t + t :

Lesprance vaut alors 0 (les bruits blancs tant, par dnition, des processus centrs ), et la matrice de variancecovariance est alors donne par 0 0 b b E XT +h XT (h ) XT + h XT ( h) = + 1 0 1 + ::: + h 1 h1 : Cette erreur de prvision est alors exprime en fonction de la matrice de variance-covariance des rsidus ( non diagonale ). Comme prcdemment, considrons la transformation t = A1 "t ou "t = A t, o = ADA0 : 2 1 3 2 1 3 "t t 6 . 7 6 . 7 o a 2 R d : "t = 4 . i . 5 = [a1 ; a2 ; :::; an ] 4 . . 5 "d t d t Ds lors En substituant alors cette expression dans la variance de la prvision pour un horizon h , cela permet de rexprimer cette variance en fonction de la variance des innovations orthogonales : E
d 0 X 0 0 0 bT (h ) XT +h X b T (h) X T +h X = V j 1 (a1 a0 t 1 ) 1 + ::: + h 1 ah 1 ah1 h1 ; j =1

1 2 d 0 0 0 = E (" t" 0 t) = a1 a1 V t + a2 a2 V t + ::: + ad ad V t :

do nalement la denition suivante

Dnition 5 On appelle contribution dune innovation pure la variance totale de la prvision un horizon h la quantit 0 0 0 V j 1 (a1 a0 t 1 ) 1 + ::: + h 1 ah1 ah 1 h1 : Exemple 12 Sur lexemple considr dans la partie prcdante, le graphique ci-dessous correspond aux rponses aux fonctions dimpulsion, respectivement sur la variable (Y 1 ) gauche et ( Y2 ) droite
Response of Y1 to One S.D. Innovations
1.0 0.8 0.6 0.4 1.0 0.8 0.6 0.4

Response of Y2 to One S.D. Innovations

0.2 0.0

0.2 0.0

5 Y1

6 Y2

10

5 Y1

6 Y2

10

27

Sries temporelles : thorie et applications

Arthur CHARPENTIER

avec la dcomposition de la variance ci-dessous


Variance Decomposition of Y1
100 80 70 60 60 50 40 40 20 0 1 2 3 4 5 Y1 6 Y2 7 8 9 30 20 10 1

Variance Decomposition of Y2

80

5 Y1

6 Y2

10

1.4
1.4.1

Application des modles V AR


Application : investissement, revenu et consommation

Nous allons considrer ici lexemple dvelopp par Ltkepohl (1991), Introduction to Multiple Time Series Analysi s, dans le chapitre 3: La base considre contient 22 ans de donnes trimestrielles, avec linvestissement (X ), le revenu (Y ) et la consommation (Z ).
2500 2000 1500
0.0 0.2

0.1

1000
-0.1

500 0

-0.2

60

62

64

66

68

70

72

74

76 REVENU

60

62

64

66

68

70

72

74

76

CONSOMMATION

INVESTISSEMENT

RDMT_CONS

RDMT_INV

RDMT_REV

Le graphique ci-dessus gauche reprsente, en donnes brutes, alors que le graphique de droite correspond aux rendements : on posera alors C t = log ( Zt) log (Zt 1 ), It = log (Xt) log (Xt 1 ) et Rt = log (Yt ) log (Y t1 ). Remarque 10 Un test de cointgration peut tre men rapidement, en reprsentant les scatterplots des direntes variables,
2000
700 600 INVESTISSEMENT

2500 2000 1500 1000

CONSOMMATION

1500

500 400 300 200

1000

500

REVENU

500 0

0 100

200

300

400

500

600

700

100

500

1000

1500

2000

2500

500

1000

1500

2000

INVESTISSEMENT

REVENU

CONSOMMATION

Comme le montrent les graphiques ci-dessus, seul le couple (Zt; Y t ) semble cointgr.

28

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Le tableau ci-dessous donne direntes statistiques de choix pour des modles V AR (p ) dirents4 : Retards 1 2 3 4 AIC 24 :50 24 :59 24 :41 24 :36 HQ 24 :38 24 :37 24 :07 23 :90 SC 24 :41 24 :02 23 :55 23 :21 FP E 2:500 2:272 2:748 2:910

Ltkepohl retenait, en utilisant le critre AIC dAkaike et le F P E (critre que lon cherche minimiser ), un modle V AR (2) ; Zt = M + A1 Zt 1 + A2 Zt2 + " t: Lestimation des paramtres donne les rsultats suivants 2 3 2 3 2 32 It 0:0167 0 :3196 0 :1460 0 :9612 4 Rt 5 = 4 0:0158 5 + 4 0 :0439 0:1527 0 :2885 5 4 Ct 0:0129 0 :0024 0 :2248 0 :2640 2 32 3 2 1 b "t 0 :1606 0 :1146 0:9344 It2 + 4 0 :0500 0 :0192 0:0102 5 4 Rt2 5 + 4 b "2 t 0 :0339 0 :3549 0:0222 C t2 b "3 t o la matrice de variance-covariance peut etre estime 2 212:96 b = 4 7 :16 12:3 par 7 :16 13 :73 6 :15 3 12:3 6 :15 5 10 5 : 8 :92 3 It1 Rt 1 5 C t1 3 5;

(8)

La reprsentation V M A ( 1) ; permettant de calculer les fonctions dimpulsions, est la suivante 2 3 2 32 1 3 2 32 1 3 2 32 1 3 It 1 0 0 b "t 0:319 0 :145 0 :961 b "t1 0:054 0 :621 0 :415 b "t2 4 Rt 5 = 4 0 1 0 5 4 b 5 + 4 0 :043 0 :152 0 :288 5 4 b 5 + 4 0:028 0 :113 0 :088 5 4 b 5 "2 "2 "2 t t1 t2 3 3 Ct 0 0 1 0:002 0 :224 0 :263 0:045 0 :260 0 :109 b "t b "t1 b "3 t2 2 32 1 3 2 32 1 3 "t 3 b "t 4 b 0 :119 0:352 0:407 0 :014 0:018 0:261 5 + 4 0 :003 0:011 54 b 5 + ::: + 4 0 :008 0:071 0:119 5 4 b "2 0 : 008 "2 t 3 t 4 3 3 0 :000 0 :098 0:090 0 :005 0:845 0:015 "t 3 b "t 4 b Les fonctions dautocovariance du processus sont alors donnes par 2 3 2 0:00245 0:00006 0 :00014 0 :00045 0 = 4 0:00006 0:00015 0 :00006 5 et 1 = 4 0 :00011 0:00014 0:00006 0 :00012 0 :00002 et les fonctions dautocorrlation sont alors 2 3 2 1:0000 0:0905 0 :2578 0 :1981 0 = 4 0:0905 1:0000 0 :4525 5 et 1 = 4 0 :1876 0:2578 0:4525 1 :0000 0 :0408
4 o

0 :00007 0 :00000 0 :00002

3 0 :00007 0 :00003 5 ; 0 :00001

0 :1196 0 :0128 0 :1658

AIC est le critre dAkaike, donn pour m retards, par

3 0:1388 0:2241 5 : 0 :0875

2mK 2 T o T est le nombre dobservation, m le nombre de retards, K le nombre de variables, et m est lestimateur ( du maximum de vraissemblance )de la matrice de variance-covariance du bruit. HQ est le critre de Hanna-Quinn, dni par AIC ( m) = ln (det (m)) + HQ (m) = ln (det (m )) + SC est le critre de Schwarz dni par SC ( m) = ln (det (m)) + F P E correspond au critre nal prediction error , dnit par T + Km + 1 K F P E ( m) = det (m ) T Mk 1 ln T mK 2 T 2 ln (ln T ) mK2 T

(F P E est ici donne un facteur multiplicatif prs ( 1011 ) ).

29

Sries temporelles : thorie et applications

Arthur CHARPENTIER

An de tester la causalit au sens de Granger, par exemple de revenu/consommation vers investissement, on va tester si les matrices A1 et A2 sont de la forme 2 3 2 3 0 0 0 0 0 0 Ai = 4 5 soit B = [M ; A1; A2 ] = 4 5 : Ces hypothses peuvent scrire sous forme matricielle Rb = 0 , en considrant que le processus Zt se subdivisionne 0 en 2 sous-processus (C t; Rt ) et (It ). On a alors N = 4, et K 2 p + K = 32 2 + 3 = 21 : la matrice R ( matrice 4 21) est alors dnie par 2 3 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 6 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 7 7 R=6 4 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 5; 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 ce qui peut tre test laide de principe de Wald (test de Student ). 0 h i 1 1 b 1 b R0 b c = 1 :59 ; = R c R (ZZ 0 ) - R 4

alors que le quantile 95% de la loi de Fisher F (4; 66) vaut 2:5 . Aussi, au niveau 5%, on ne peut pas rejeter lhypothse de non-causalit des variables revenu et investissment sur la consommation. En revanche, un test de non-causalit instantane revient tester si est de la forme 2 3 0 0 = 4 0 5: 0

La prvision peut se faire en utilisant lcriture V AR (2) , estime par (8), compte tenu du fait que les deux derniers points sont 2 3 2 3 0 :02551 0:03637 ZT 1 = 4 0 :02434 5 et ZT = 4 0:00517 5 : 0 :01319 0:00599 La prvision optimale se fait alors, de faon rcursive, 2 3 2 3 0:011 0 :011 bT (1) = M + A1Z T + A2 ZT 1 = 4 0 :020 5 , Z bT (2) = M + A1 Z bT (1) + A2 ZT = 4 0 :020 5 ...etc. Z 0 :022 0 :015 Lestimateur de la matrice de variance covariance se faire alors, au rang 2 23 :34 K + K p + 1 73 + 6 + 1 b Y (1) = b" = b " = 4 0 :785 T 73 1 :351 Les matrices de variance covariance des ordres plus levs se 2 25 :12 0 :580 b Y (2) = 4 0:580 1 :581 1:300 0 :586 1 , de la faon suivante 3 0 :785 1:351 1 :505 0:674 5 10 4 : 0 :674 0:978

do, nallement, les prvisions suivantes : 2 3 2 3 0 :011 0:095 0:011 0 :098 bT (1) 2 4 0 :020 0 :024 5 et horizon 2 : Z bT (2) 2 4 0:020 0 :025 5 : horizon 1 : Z 0 :022 0 :019 0:015 0 :020 Nous allons maintenant tudier les fonctions rponses une impulsion. composantes de la forme V M A (1) sont 2 3 2 0 :319 0 :145 0:961 0 :054 b 1 = 4 0 :043 0 :152 0:288 5 = A b1 et b 2 = 4 0 :028 0 :002 0 :224 0 :263 0 :045 30

calculent laide de la forme V M A (1), et donnent 3 1:300 0:586 5 10 4 ; 1:009

Pour cela, rappelons que les deux premires 0:621 0:113 0:260 3 0 :415 b1 b1 + A b2 : 0 :088 5 = A 0 :109

Sries temporelles : thorie et applications

Arthur CHARPENTIER

b 0 = I , et bi = b0 + b 1 + ::: + b i , on a alors les estimations suivantes, avec, entre parenthses, les En notant intervalles de conance i 2 6 7 6 0 :044 0 :153 0 :289 7 6 (0 :032) (0: 167) 7 (0 :143) 4 5 0:002 0 :225 0 :264 (0 :115) (0: 134) 2 (0 :025) 3 0:054 0 :262 0 :416 (0 : 546) (0 : 663) 6 (0 :129) 7 6 0 :029 0 :114 0 :088 7 6 (0 :032) (0 7 :135) (0: 162) 5 4 0 :045 0 :261 0 :110 2 (0 :026) (0 :108) (0: 131) 3 0 :119 0 :353 0 :408 (0 :384) (0: 476) 7 6 (0 :084) 6 0:009 0 :071 0 :120 7 6 (0 :016) (0 :078) (0: 094) 7 4 5 0:001 0 :098 0 :091
(0 :017) (0 :078) (0: 102)

0:320
(0 :125)

(0 :562)

bi 0 :146

(0: 657)

0 :961

avec les comportements limites suivants : 0 bi = 4 0 lim i !1 0 2

6 6 0 :044 6 (0:032) 4 0 :002 2 (0:025) 0 :626 6 (0:148) 6 0 :073 6 (0:043) 4 0 :043 (0:033) 2 0 :745 6 (0:099) 6 0 :064 6 (0:037) 4 0 :042
(0:033)

(0:125)

0 :680

7 0 :289 7 (0:143) (0:167) 7 5 0 :225 0 :736 (0:115) (0:134) 3 0 :408 1 :377 (0:651) (0:755) 7 0 :961 0 :200 7 7 (0:192) (0:222) 5 0 :486 0 :846 (0:144) (0:167) 3 0 :761 0 :969 (0:483) (0:550) 7 1 :033 0 :320 7 7 (0:176) (0:203) 5 0 :388 0 :937 0 :847
(0:156) (0:183)

(0:562)

bi 0 :146

(0:657)

0 :961

0 0 0

Ceci peut se rprsenter sur les graphiques ci-dessous, avec limpact sur la consommation dun choc de 1 sur le revenu la data t = 0 , avec limpact aux direntes dates gauche, et limpact cumul droite,
0.6

0 6 (0:133) 6 0:076 b 5 0 et lim i = 6 (0 i !1 4 :048) 0 0:053


(0:043)

0:756

( 0:661) ( 0:236) ( 0:213)

0:866 1:076 0:505

7 0:344 7 7: (0 :285) 5 0:964


(0 :798) (0 :257)

1:295

1.0 0.8 0.6 0.4 0.2 0.0


1 2 3 4 5 6 7 8

0.4 0.2

0.0

-0.2

-0.4 CONSOMMATION CONS_INF CONS_SUP

CONSOMMATION

CONS_INF

CONS_SUP

31

Sries temporelles : thorie et applications

Arthur CHARPENTIER

1.4.2

Application des modles V AR : rendements dune action et dun indice

Considrons les deux sries suivantes, le rendement de laction IBM , et le rendement de lindice SP 500 (rendement mensuel, entre janvier 1926 et dcembre 1999)
4 0 3 0 2 0 1 0 0 - 1 0 - 2 0 - 3 0 - 4 0 1 9 3 0 1 9 4 0 1 9 5 0 1 9 6 0 1 9 7 0 IB M 4 0 3 0 2 0 1 0 0 - 1 0 - 2 0 - 3 0 - 4 0 1 9 3 0 1 9 4 0 1 9 5 0 1 9 6 0 1 9 7 0 1 9 8 0 1 9 9 0 S P 5 0 0 1 9 8 0 1 9 9 0

40 30 20 10 0 -10 -20 -30 -40 -40 -30 -20 -10 0 10 20 30 40

avec les sries ( Xt) et (Y t) gauche ( i.e. le rendement du titre IBM et de lindice SP 500 respectivement ), et le nuages des points (Xt ; Yt ) Une estimation V AR avec 5 retards donne les rsultats suivants
Vector Autoregression Estimates Date: 06/04/03 Time: 14:28 Sample(adjusted): 1926:06 1999:12 Included observations: 883 after adjusting endpoints Standard errors in ( ) & t -statistics in [ ]
IBM(-1) IBM 0.019012 (0.04354) [ 0.43664] SP500 -0.012372 (0.03658) [-0.33819] SP500(-1) IBM 0.105749 (0.05176) [ 2.04322] SP500 0.088680 (0.04349) [ 2.03927] C IBM 1.167488 (0.24126) [ 4.83912] SP500 0.509100 (0.20271) [ 2.51144] IBM(-2) 0.096939 (0.04344) [ 2.23143] 0.056943 (0.03650) [ 1.56002] SP500(-2) -0.138224 (0.05174) [-2.67166] -0.047391 (0.04347) [-1.09018] IBM(-3) 0.048639 (0.04411) [ 1.10266] -0.001835 (0.03706) [-0.04951] SP500(-3) -0.113612 (0.05222) [-2.17546] -0.110083 (0.04388) [-2.50873] IBM(-4) -0.010359 0.028003 SP500(-4) -0.016755 0.017162 (0.05238) [-0.31988] (0.04401) [ 0.38997] (0.04397) [-0.23559] (0.03695) [ 0.75794] IBM(-5) -0.073582 (0.04387) [-1.67740] -0.075260 (0.03686) [-2.04191] SP500(-5) 0.131304 0.132369 (0.05238) [ 2.50697] (0.04401) [ 3.00790]

R-squared IBM SP500 0.032500 0.033216

Adj. R-squared Sum sq. resids 0.021404 0.022129 38600.50 27250.91

S.E. equation 6.653317 5.590263

F-statistic

Log likelihood

Akaike AIC 6.640487 6.292309

Schwarz SC 6.700076 6.351897

Mean dependent S.D. dependent 1.251308 0.546273 6.725687 5.653163

2.929166 -2920.775 2.995981 -2767.054

cest dire que, dans une criture o lon noterait Zt = (Xt ; Y t) , Zt = 0 + 1 Zt 1 + ::: + 5 Xt5 + "t ; on aurait alors les matrices suivantes, 1:167 0 :019 0:105 0 :097 0:138 0 = , 1 = , 2 = , 0:509 0 :012 0:088 0 :057 0:047 0 :049 0 :114 0:010 0 :017 0 :073 0 :131 3 = , 4 = , et 5 = : 0 :002 0 :110 0 :028 0 :017 0 :075 0 :132

Le schma ci-dessous indique quelles sont les valeurs signicatives, ainsi que leur signe (+ : signicative positive, - : signicative ngative et : non signicative ) + + + + 0 = , 1 = , 2 = , 3 = , 4 = , et 5 = : + + + Cest dire que les retards lordre 4 ne sont pas signicatifs par exemple. En fait, ce cas est encore plus particulier car un certain nombre de colonnes semblent non-signicative, en particulier la premire colonne de 1 ou de 3 (et dans une moindre mesure de 5). Cela siginie que les retards de Xt 32

Sries temporelles : thorie et applications

Arthur CHARPENTIER

ninuencent ni Xt , ni Yt : en terme dinterprtations, le rendement du cours du titre IBM la date t, ainsi que le cours de lindice SP 500 cette mme date dpendent des cours passs de lindice (en loccurence avec 1, 3 et 5 retards ), mais pas vraiment du cours pass du titre IBM . Autrement dit, on pourrait tre intress de tester un modle particulier, de la forme Zt = 0 + 1 Yt 1 + 3 Y t3 o ici i 2 R 2 ; (et i nest plus une matrice 2 2 ). Lestimation de ce modle contraint donne alors IBMt 1:24 0 :117 0 :083 "t = + SP 500t 1 SP 500 t3 + : SP 500 t 0:57 0 :073 0 :109 t

1.5

Rgression linaire dans un cadre dynamique

Nous allons ici voir les proprits des modles conomtriques de la forme Y = X + ", o, contrairement aux modles conomtriques, les observations (de la variable expliquer Y ) Y 1 ; Y 2 ; :::; Y i ; :::; Y n ne sont pas observes pour des individus dirents (et peuvent alors tre supposes indpendantes )mais sont des observations temporelles Y 1 ; Y2 ; :::; Y t ; :::; Y n . Nous supposerons ici la fonction de rgression dpend des valeurs retardes dune ou de plusieurs variables dpendantes. 1.5.1 Les retards chelonns

On pense souvent quune variable dpendante (Y t) dpend de la valeur actuelle et dun certain nombre de valeurs retardes dune variable indpendante (Xt ). Une modlisation de ce genre consiste utiliser un modle retards chelonns tel que q X Yt = + j Xtj + "t o ("t ) s BB 0; 2 : (9)
j =0

Le problme consiste alors estimer la constante et les coecients j . Le nombre entier q est ici la longueur du dernier retard. Dans certains cas, imaginer que q est inni peut avoir du sens, mais nous supposerons pour linstant quil prend une valeur nie. La fonction de rgression pourrait tout fait dpendre dautres variables explicatives, mais nous ne considrerons ici que le cas o intervient une seule variable explicative poour conserver des notations simples. Le problme avec un tel mo dle est que, parce que Xt sera - a priori - fortement corrl Xt 1 , Xt2 , ...etc, et donc les estimations par moindres carrs des coecients j devraient tre assez imprcises. Sauf si cest limpact long terme b la matrice de covarinace du vecteur b estimateur mco du vecteur = ; ; :::; . qui nous intresse. Soit V
0 1 q

Alors, si b dsigne la somme des b j , la variance de b V (b ) =


q X j =0

Si Xtj est corrl positivement Xtk pour tout j 6= k, les termes de covariance dans lexpression ci-dessus seront gnralement ngatifs. sont importants et comme cest souvent le cas, V (b ) peut tre plus petite Lorsquils ngatifs, b b que la somme des V ou mme que chaque V . Si cest le paramtre qui nous intresse plutt que les
j j j

q j 1 X X b bj : j + 2 cov b i ; j =0 i =0

individuels, lapproche la plus simple consiste estimer une version reparamtre de (9) par moindres carrs. Cette version scrit alors q X Y t = + Xt + j (Xtj Xt ) + "t o = 0 + 1 + ::: + q :
j =1

Lavantage de cette criture est que lcart type de b est disponible immdiatement dans les rsultats de la rgression. La colinarit peut tre un problme important si lon sintresse aux j . Lapproche la plus connue pour rsoudre ce problme consiste employer les retards chelonns polynomiaux, ou P DL. Ces derniers sont quelquefois appels retards dAlmon, suite larticle dAlmon (1965). Dans un polynme de retards chelonns, les coecients j de (9) doivent apparatre dans un polynme de degr d donn. Par, si le polynme tait du second degr, nous aurions j = P (j ) = 0 + 1 j + 2 j 2 pour tout j = 0 ; :::; q: (10)

Si q > 2 , on peut noter quil y aura moins de paramtres i que j et, par consquent, cette relation impose q 2 contraintes sur les j . Lestimation dun modle soumis des contraintes imposes par un P DL est assez immdiate. 33

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Par exemple, pour estimer (9) soumis (10), nous pouvons remplacer simplement les j par 0 + 1 j + 2 j 2 , cest dire q q q X X X Yt = + 0 X t j + 0 jXtj + 0 j 2 X t j + " t: (11)
j =0 j =0 j =0

Ceci est un exemple de modle P DL(q; 2). Un modleP DL( q; d) doit toujours tre tel que d < q . En fait, les contraintes imposes aux j sont simplement des contraintes linaires. La rsolution de (10) montre que 3 + 32 31 + 0 = 0 4 + 33 32 + 1 = 0 5 + 34 33 + 2 = 0 ::: et ainsi de suite. On peut rcrire ces contraintes sous la forme R = 0 o la matrice R serait dans ce cas 2 3 1 3 3 1 0 0 0 0 0 0 6 0 1 3 3 1 0 0 0 0 0 7 6 7 6 1 3 3 1 0 0 0 0 7 R=6 0 0 7: 6 . . . . . . . . . . 7 . . . . . . . . . 4 . . . . . . . . . . . 5 0 0 0 0 0 0 1 3 3 1

Puisque les contraintes sont linaires, on peut les tester facilement, par exemple laide dun test de Fisher : le modle contraint est (11) ), le modle non contraint est (9) , et le nombre de contraintes dans ce cas est q 2 (de faon plus gnrale, pour un modle P DL(q; d), il y aura q j contraintes ). Ainsi, on peut tester un modle P DL(q; d) contre un modle P DL(q; d + 1) en utilisant un test de Fisher. La meilleure approche consiste dbutanter par une valeur importante de q et en examinant la dtrioration de la qualit de lajustement du modle en diminuant sa valeur, sans imposer aucun contrainte sur la forme des retards chelonns. Une fois que q est dtermin, on peut ensuite dterminer d, en dbutant avec une valeur importante et en la rduisant au fur et mesure. Sargan (1980) a propos un exemple empirique dans Some tests of dynamic specication for a single equation . Une variante intressante a t propose par Shiller (1973) : comme nous lavons vu, les contraintes imposes par un P DL peuvent toujours scrire sous la forme R = 0 pour une matrice R de dimension r k o r = q d et k est le nombre dlments de (gnralement suprieur q + 1 ). Shiller suggra quau lieu de stipuler que chaque ligne de R soit nulle, il proposa quelle soit gale une variable alatoire desprance nulle et de variance nie. Lun des avantages de cette approche est que d peut tre trs faible sans pour cela imposer des contraintes trop fortes sur les donnes. Puisque les estimations nont pas besoin de se conformer exactement la forme du polynme, d = 2 est, dans la pratique, souvent susante. Ce genre de contrainte est appel contrainte stochastique, parce quelle nest pas senses tre vrie exactement. Les contraintes sto chastiques sont trs direntes de nimporte quel autre type de contraintes dont nous avons discut. Cest ainsi que la phase destimation est relativement plus complique que dans le cas prcdant, et repose le plus souvent sur des rsultats de statistique baysienne. Des complments sur ce point peuvent tre trouvs dans Davison et MacKinnon. 1.5.2 Le modle da justement partiel

Un modle dynamique simple, et trs frquent dans la littrature, est le mo dle dajustement partiel, dont lhitoire en conomie remonte assez loin puisquil date de Nerlove (1958). Dans le cadre dun modle de politique conomique, supposons que le niveau dsir dune variable conomique (Y t) quelconque. soit (Y t ), qui est suppos tre reli un vecteur de variables explicatives exognes (Xt) par la relation 0 1 1 1 C d B . Yt = Xt + " t = Xt ; :::; Xt @ . . A + "t d Suppons que la variable (Y t) sajuste vers (Y t ), la valeur ralise, laide dune relation de la forme Yt Y t1 = (1 ) (Y t Y t1 ) + t : Ces deux quations permettent dobtenir la relation suivante Yt = Y t1 (1 ) Y t1 + (1 ) Xt + (1 ) " t + t = Xt + Y t1 + u t;

34

Sries temporelles : thorie et applications

Arthur CHARPENTIER

o = (1 ) et u t = (1 ) " t + t . Cet a justement nest toutefois pertinent que si 0 < < 1 et si nest pas trop proche de 1 ( sinon la vitesse dajustement est trop faible ) De faon itrative, on peut montrer que ce modle se rcrit 2 3 2 3 + 1 + 1 + 1 X X X Yt = j [Xtj + u tj ] = 4 j Xtj 5 + 4 j u tj 5 : (12)
j =0 j =0 j =0

Ainsi ce modle corrige une dfaillance ma jeure que nous avions dj remarque dans les modles retards chelonns: (Y t) dpend maintenant autant des valeurs retardes de lala ("t ) que des valeurs retardes des variables exognes (Xt ). Notons que la solution de (12) repose sur lhypothse que j j < 1 , qui est une condition de stationnarit pour ce modle. Le modle dajustement partiel nest quun des nombreux modles conomiques que lon peut utiliser pour justier la prise en compte dun ou de plusieurs retards des variables dpendantes dans la fonction de rgression. Dhrymes (1971) et Hendry, Pagan, et Sargan (1984) discutent de nombreux autres modles. Si nous ne discuterons pas ici ces modles, nous nous concentrerons ici sur quelques rsultats dordre gnral qui peuvent survenir lorsque lon tente de spcier et destimer des modles de rgression dynamiques. Un problme qui se manifeste chaque fois que la matrice X contient des variables dpendantes retardes est que lestimation mco par moindres carrs ne produisent pas des estimations sans biais. Ce problme survient parce que X est une matrice stochastique, dont certains lments sont corrls quelques lments de u . Ainsi on peut en particulier noter que E (X 0X )
1

X 0 u 6= (X 0 X )

X 0:E (u ) :

Ceci peut se noter sur lexemple trs simple des modles AR (p) : supposons que (Yt ) soit un processus AR (1) Y t = Y t1 + u t o j j < 1 et (u t) :

Le second terme dans lexpression la plus droite de (13) nest pas desprance nulle, parce que le numrateur et le dnominateur ne sont pas indpendants. Son esprance est dailleurs assez dicile dterminer. La conclusion est alors la suivante A retenir 1 Dans tous les modles pour lesquels il y a des variables dpendantes retardes, lestimateur mco est biais b obtenu par mco est convergent. Si lon divise la fois le numrateur et le Par contre, videmment, lestimateur dnominateur du terme alatoire du membre le plus droite de (13) par n et si lon prend les limites en probabilit, on obtient P p limn!1 n t= 2 ut Y t1 b p lim = + P = : n n!1 p limn!1 t =2 Y t2 1 1.5.3 Les modles autorgressifs retards chelonn s (ADL (p; q)) Ces modles sont prsents ici dans le cas simple o (Y t ) est la variable expliquer et (Xt) la variable explicative (ce type de modles peut toutefois se gnraliser un ensemble plus vaste de variables explicatives ). La forme gnrale scrit p q X X Yt = + iY ti + j Xt j + "t o "t s BB 0; 2 ;
i =1 j =1

Lestimation mco de est donn par Pn Pn Pn Pn t=2 Y t2 Y tY t1 1 + t=2 ut Y t1 t =2 t=2 ut Y t1 b Pn = Pn = =+ P : n 2 2 2 t=2 Y t1 t=2 Y t1 t= 2 Yt 1

(13)

ou bien, en utilisant des polynmes doprateurs retard, B (L) Yt = + (L) Xt + "t . Un cas particulier, mais relativement utilis est le modle ADL (1 ; 1) Y t = + 1 Y t1 + 0 Xt + 1 Xt 1 + "t : (14)

Nous tudierons ici le modle ADL(1; 1), la plupart des rsultats tant aisment gnralisables aux modles ADL(p; q) . Le cas o 1 = 1 = 0 correspond au modle gnral de rgression linaire (statique, tel quil est tudi en cours dconomtrie ), le cas 0 = 1 = 0 correspond au modle AR (1) tel quil est tudi au dbut de ce cours, le cas o 1 = 1 et 1 = 0 correspond au modle en dirences premires...etc. Le modle ADL(1 ; 1) fournit ainsi une alternative naturelle contre laquelle on peut tester nimporte lequel de ces cas particuliers. 35

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Nous allons tudier ici la faon dont ( Xt) inuence (Y t ) long terme, dans un modle ADL (1; 1) :Sans lala ( "t) , (Xt ) et ( Yt ) convergeraient vers des valeurs de long terme (stables ) X et Y telles que Y = + 1 Y + 0 X + 1X , cest dire que + 1 Y = + 0 X = + X ; 1 1 1 1 1 1 o peut alors tre vue comme une lasticit. Toutefois, ce rsultat nest pertinent que si j 1 j < 1, ce qui est une conditon de statibilit pour ce modle. Une des caractristiques intressantes et importantes des mo dles ADL est que lon peut les crire de direntes faons : par exemple, (14) peut tre crit sous les formes suivantes (toutes quivalentes ) : (1) (2) (3) (4) (5) Yt Yt Yt Yt Yt = + ( 1) Y t1 + 0 Xt + 1 Xt 1 + "t ; = + ( 1) Y t1 + 0 Xt + ( 0 + 1 ) Xt1 + " t; = + ( 1) Y t1 1 Xt + ( 0 + 1 ) Xt + "t ; = + ( 1) (Y t1 Xt1 ) + 0 Xt + ( 0 + 1 + 1 1) Xt1 + " t; = + ( 1) (Y t1 Xt 1 ) + + 0 Xt + "t ;

o est loprateur des dirences premires, = (1 L). Si lon sintresse la somme des i, les estimations et les carts types sobtiennent directement partir de lestimation par mco de (2) ou (3), et si lon sintresse , elles peuvent tre obtenues par une estimation par moindres carrs non-linaires de(5). La plus intressante de ces spcications est sans doute (5), dans laquelle le modle est crit sous la forme que lon appelle forme correction derreur. Le paramtre apparat directement dans cette forme du modle. Et bien que la forme correction derreur soit non linaire, lestimation peut se faire facilement parce que le modle est simplement un modle linaire soumis une contrainte non linaire. La dirence entre Y t 1 et Xt1 mesure limportance de la dfaillance de la relation dquilibre de long terme entre (Xt ) et (Y t ). On appelle alors souvent le terme ( 1) (Y t1 Xt1 ) qui apparat dans (5) terme de correction derreur, et le modle est alors appel modle correction derreur, ou E CM . Ce quil convient de retenir sur cette partie, cest que lorsque lon tente de spcier des mo dles de rgression dynamiques, il existe, en gnral, plusieurs manires a priori de le faire.

1.6

Complments : modles multivaris sous SAS

Il est possible de modliser des sries temporelles sous SAS laide de la procdure VARMAX (Vector AutoRegressive and Moving-Average processes with eXogenous regressors ). La synthaxe de cette procdure est la suivante, PROC VARMAX options; BY variables ; CAUSAL group1 = (variables) group2 = (variables) ; COINTEG rank = number < options > ; ID variable interval= value < option > ; MODEL dependent variables < = regressors > ; OUTPUT < options > ; RESTRICT restrictions ; TEST restrictions ; Les ordres autorgressifs et moyenne-mobile sont dtermins ici, en utilisant les critres usuels (AIC; HQ ou encore SBC ). Cette procdure propose galement, dans le cas de donnes non-stationnaires, un certain nombre de tests : des tests de racine unit (ADF ), de cointgration (Johansen ), des tests de causalit ( Granger ). Enn, un grand nombre doptions sont possibles (erreurs ARC H , composantes saisonnires, introduction de variables exognes ) Les tests de cointgration, par exemple, reprennent la mme forme que sous Eviews, i.e. pour un modle de la forme (5), savoir sans variable exogne. 1.6.1 Estimation dun modle V AR

Considrons ici le mo dle V AR (1) simul suivant, Zt = AZt 1 + ut o Xt 1 :2 0:5 Xt1 "t 1:0 = + ou = V (u t) = Yt 0 :6 0:3 Y t1 t 0:5

0 :5 1:25

36

Sries temporelles : thorie et applications

Arthur CHARPENTIER

que nous simulons sur 100 observations,

Le programme permettant de tester les paramtres du modle V AR sont les suivants, o les sries sont X et Y , PROC VARMAX data=donnes; MODEL X Y / p=1 noint lagmax=3; run ; Parmi les sorties, on notera le deux sorties prsentes ci-dessous
The VARMAX Procedure Number of Observations Number of Pairwise Missing Variable y1 y2 Type DEP DEP NoMissN 100 100 Mean -0.17054 -0.15409 100 0 Min -4.80463 -4.63446 Max 3.94386 3.69658 Covariance Matrix for the Innovation Variable y1 y2 y1 0.85478 0.60495 Information Criteria AICC(Corrected AIC) HQC(Hannan-Quinn Criterion) AIC(Akaike Information Criterion) SBC(Schwarz Bayesian Criterion) FPEC(Final Prediction Error Criterion) -0.26658 -0.22582 -0.26824 -0.16339 0.764729 y2 0.60495 1.28770

StdDev 2.05299 2.02123

Type of Model Estimation Method

VAR(1) Least Squares Estimation

AR Coefficient Estimates Lag 1 Variable y1 y2 y1 1.20790 0.58047 y2 -0.52848 0.29561

Residual Cross-Covariance Matrices Lag 0 Variable y1 y2 y1 y2 y1 y2 y1 0.83413 0.59108 0.09129 0.13094 -0.13532 -0.11822 y2 0.59108 1.26089 0.08060 0.03236 -0.15877 -0.05082

Model Parameter Estimates Equation y1(t) y2(t) Parameter AR1_1_1 AR1_1_2 AR1_2_1 AR1_2_2 Estimate 1.20790 -0.52848 0.58047 0.29561 Std Error 0.06766 0.06925 0.08304 0.08500 T Ratio 17.85 -7.63 6.99 3.48 Prob>|T| 0.0001 0.0001 0.0001 0.0008 Variable y1(t-1) y2(t-1) y1(t-1) y2(t-1)

1 2

o apparat la matrice autorgressive lordre 1 , relativement proche des valeurs thorique (du modle simul ), 1:20790 0:52848 1:2 0 :5 b = relativement proche de = ; 0:58047 0:29561 0:6 0 :3

dont les prcisions (cart-type de lestimateur par exemple ) sont donns dans le tableau en bas gauche. La matrice de variance-covariance du bruit est elle aussi relativement bien estime, 1 :0 0:5 b = 0:85478 0 :60495 relativement proche de = : 0:60495 1 :28770 0 :5 1 :25

SAS donne aussi des informations permettant de faire par la suite du choix de modle, avec les critre AIC corrig, de Hannan-Quinn, ou AIC et SBC . La sortie ci-dessous permet de vrier si lon na pas oubli de composante autorgressive dans la rgression, puisque SAS teste un modle de la forme Zt = 1 Zt1 + 2 Zt2 + 3 Zt3 : comme

37

Sries temporelles : thorie et applications

Arthur CHARPENTIER

le montre le petit tableau en bas droite, seule la premire composante est signicative.
The VARMAX Procedure Residual Cross-Covariance Matrices Lag 3 Variable y1 y2 y1 -0.06343 -0.12722 y2 -0.02261 -0.06607
Portmanteau Test for Residual Cross Correlations To ChiProb> Lag Square DF ChiSq 2 3 6.74 8.40 4 8 0.1503 0.3957

Residual Cross-Correlation Matrices Lag 0 1 2 3 Variable y1 y2 y1 y2 y1 y2 y1 y2 y1 1.00000 0.57636 0.10945 0.12768 -0.16223 -0.11528 -0.07604 -0.12405 y2 0.57636 1.00000 0.07859 0.02566 -0.15481 -0.04030 -0.02204 -0.05240

The VARMAX Procedure Univariate Model Diagnostic Checks Variable y1 y2 R-square 0.8003 0.6907 StdDev 0.9245 1.1348 F Value 388.84 216.63 Prob>F <.0001 <.0001

Schematic Representation of Residual Cross Correlations Variable/ Lag y1 y2 0 ++ ++ 1 .. .. 2 .. .. 3 .. ..

Univariate Model Diagnostic Checks Variable y1 y2 DW(1) 1.77 1.93 Normality ChiSq 0.85 0.05 Prob> ChiSq 0.6541 0.9742 ARCH1 F Value 1.39 0.60 Prob>F 0.2408 0.4417

+ is > 2*std error, - is < -2*std error, . is between

SAS donne alors des prvisions sur un horizon plus ou moins long, sous hypothse de modle V AR (1) ;

Univariate Model Diagnostic Checks Variable y1 y2 AR1 F Value 1.17 0.06 Prob>F 0.2816 0.7995 AR1-2 F Value Prob>F AR1-3 F Value 1.42 0.13 Prob>F 0.2425 0.9443 AR1 -4 F Value 1.55 0.25 Prob>F 0.1944 0.9069

2.07 0.1324 0.13 0.8755 Forecasts Forecast 0.5676 1.2602 1.5178 1.4456 1.1658 -1.0871 0.00814 0.7339 1.0980 1.1637 Standard Error 0.9245 1.2997 1.5904 1.7990 1.9285 1.1348 1.3769 1.5418 1.6965 1.8290

Variable y1

Obs 101 102 103 104 105 101 102 103 104 105

95% Confidence Limits -1.2444 -1.2872 -1.5993 -2.0805 -2.6139 -3.3112 -2.6905 -2.2881 -2.2270 -2.4211 2.3797 3.8075 4.6350 4.9716 4.9456 1.1370 2.7068 3.7558 4.4230 4.7484

y2

1.6.2

Estimation dun modle correction derreur

Les sorties ci-dessous correspondent lestimation dun modle correction derreur, not V E CM sous SAS. Considrons le modles VAR (2) non stationnaire suivant Y1 ;t 0 :2 0:1 Y1 ;t1 0 :8 0 :7 Y 1;t2 " 1;t Yt = = + + ; Y2 ;t 0 :5 0:2 Y2 ;t1 0:4 0 :6 Y 2;t2 " 2;t o le bruit blanc admet pour matrice de variance-covariance = 100 I2 dont une simulation ( partir de la valeur initiale Y 1;0 = Y2 ;0 = 0 ) a lallure suivante

38

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Remarque 11 Ce processus est en eet non-stationnaire : On retrouve dailleurs sur le graphique que ces deux sries sont cointgres. Lcriture V E CM de ce processus a la forme suivante 0:4 0:8 1 2 Y t1 Y t = 0:1 0:4

0 :7 0 :6

Yt 1 + "t :

Considrons alors le programme SAS suivant

PROC VARMAX data=donnes; MODEL X Y / p=2 noint dftest cointtest=(johansen); run ;


Long-Run Parameter BETA Estimates
The VARMAX Procedure Number of Observations Number of Pairwise Missing Variable y1 y2 Type DEP DEP NoMissN 100 100 Mean 96.42914 54.56026 100 0 Min -11.71118 -24.92182 Max 233.29867 135.77617

Variable y1 y2

Dummy 1 -0.04867 0.09518

Dummy 2 0.03109 -0.04155

StdDev 62.79930 37.03117

Adjustment Coefficient ALPHA Estimates Variable y1 y2 Dummy 1 9.59171 -2.19184 Dummy 2 0.25 525 1.07837

Dickey-Fuller Unit Root Tests Variable y1 y2 Type Zero Mean Single Mean Trend Zero Mean Single Mean Trend Rho 1.465786 -0.80452 -10.8813 -0.05134 -6.02682 -50.4873 Prob<Rho 0.9628 0.9016 0.3573 0.6692 0.3358 0.0003 Tau 1.65 -0.47 -2.20 -0.03 -1.72 -4.92 Prob<Tau 0.9755 0.8916 0.4815 0.6707 0.4204 0.0006

The VARMAX Procedure Type of Model Estimation Method VAR(2) Least Squares Estimation

Cointegration Rank Test H_0: Rank=r 0 1 H_1: Rank>r 0 1 Eigenvalue 0.5086 0.0111 Trace 70.73 1.09 Critical Value 12.21 4.14 Drift InECM NOINT DriftIn Process Constant

AR Coefficient Estimates Lag 1 2 Variable y1 y2 y1 y2 y1 - 0.20804 0.52041 0.74917 - 0.38021 y2 0.16002 0.19141 0.74233 0.55517

la sortie ci-dessus gauche montre que chacune des composantes est ectivement intgre dordre 1, laide des tests ADF . Le test de cointgration de Johansen nous conduit rejeter lhypothse de rang r = 0 (premire ligne du tableau : 70.73>12.21 ) et accepter lhypothse de rang r = 1 ( seconde ligne du tableau : 1.09< 4.14 ). On peut dailleurs noter que loption NOINT dit quil ny a pas de constante dans la forme E CM ; mais quil y a un terme constant dans lcriture long terme. : en conclusion, il existe une relation de cointgration entre Y1 et Y 2 : La sortie 0 prsent ci-dessus droite donne galement une estimation des termes constants et : b = 1 :07837 2 :19184 correspondant la premire colonne de la matrice BETA et b = 0 :04867 0:09518 correspondant la seconde ligne de la matrice ALPHA. On retrouve galement une estimation des matrices autorgressive, 0 :749 0:742 0 :2 0 :1 0:8 0 :7 b 1 = 0 :208 0:160 b2 = et , avec 1 = et 2 = ; 0 :504 0:191 0 :380 0:555 0:5 0 :2 0:4 0 :6 De plus,on obtient, sur la sortie ci-dessous gauche, la matrice de variance covariance des rsidus, 98:72 4:432 100 0 b = relativement proche de = 4 :432 113:02 0 100 On obtient alors des sorties relativement proches de celles dcrites dans le paragraphe prcdant.
Model Parameter Estimates Equation y1(t) Parameter AR1_1_1 AR1_1_2 AR2_1_1 AR2_1_2 AR1_2_1 AR1_2_2 AR2_2_1 AR2_2_2 Estimate -0.20804 0.16002 0.74917 0.74233 0.52041 0.19141 -0.38021 0.55517 Std Error 0.03375 0.06766 0.05161 0.05102 0.03612 0.07240 0.05522 0.05459 T Ratio -6.16 2.36 14.52 14.55 14.41 2.64 -6.88 10.17 Prob>|T| 0.0001 0.0201 0.0001 0.0001 0.0001 0.0096 0.0001 0.0001 Variable y1(t-1) y2(t-1) y1(t-2) y2(t-2) y1(t-1) y2(t-1) y1(t-2) y2(t-2) Portmanteau Test for Residual Cross Correlations ChiProb> Square DF ChiSq 9.96 13.90 18.06 22.49 23.04 24.70 27.06 29.42 30.35 33.07 4 8 12 16 20 24 28 32 36 40 0.0410 0.0843 0.1137 0.1281 0.2867 0.4222 0.5147 0.5979 0.7338 0.7729

To Lag

y2(t)

Covariance Matrix for the Innovation Variable y1 y2 y1 98.71998 4.43251 Information Criteria AICC(Corrected AIC) HQC(Hannan-Quinn Criterion) AIC(Akaike Information Criterion) SBC(Schwarz Bayesian Criterion) FPEC(Final Prediction Error Criterion ) 9.404962 9.483367 9.398015 9.609033 12065.5 y2 4.43251 113.02058 Variable y1 y2

3 4 5 6 7 8 9 10 11 12

The VARMAX Procedure Univariate Model Diagnostic Checks R-square 0.9750 0.9199 StdDev 9.9358 10.6311 F Value 1219.97 359.87 Prob>F <.0001 <.0001

Univariate Model Diagnostic Checks Variable y1 y2 DW(1) 1.93 1.77 Normality ChiSq 2.97 0.25 Prob> ChiSq 0.2264 0.8808 ARCH1 F Value 0.16 0.00 Prob >F 0.6931 0.9694

39

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Univariate Model Diagnostic Checks Variable y1 y2 AR1 F Value 0.02 0.91 Prob>F 0.8797 0.3420 AR1-2 F Value 0.74 2.63 Prob>F 0.4815 0.0773 AR1-3 F Value 0.70 1.73 Prob>F 0.5563 0.1655 AR1-4 F Value 0.61 1.36 Prob>F 0.6554 0.2544
Equation y1(t) Parameter AR1_1_1 AR1_1_2 AR2_1_1 AR2_1_2 AR1_2_1 AR1_2_2 AR2_2_1 AR2_2_2

Model Parameter Estimates Estimate -0.20804 0.16002 0.74917 0.74233 0.52041 0.19141 -0.38021 0.55517 Std Error 0.03375 0.06766 0.05161 0.05102 0.03612 0.07240 0.05522 0.05459 T Ratio -6.16 2.36 14.52 14.55 14.41 2.64 -6.88 10.17 Prob>|T| 0.0001 0.0201 0.0001 0.0001 0.0001 0.0096 0.0001 0.0001 Variable y1(t-1) y2(t-1) y1(t-2) y2(t-2) y1(t-1) y2(t-1) y1(t-2) y2(t-2)

y2(t)

The VARMAX Procedure Type of Model Estimation Method VAR(2) Least Squares Estimation

Covariance Matrix for the Innovation Variable y1 y2 y1 98.71998 4.43251 y2 4.43251 113.02058

AR Coefficient Estimates Lag 1 2 Variable y1 y2 y1 y2 y1 -0.20804 0.52041 0.74917 -0.38021 y2 0.16002 0.19141 0.74233 0.55517

Information Criteria AICC(Corrected AIC) HQC(Hannan-Quinn Criterion) AIC(Akaike Information Criterion) SBC(Schwarz Bayesian Criterion) FPEC(Final Prediction Error Criterion) 9.404962 9.483367 9.398015 9.609033 12065.5

Estimating the VECM(2) model with one cointegrating The VARMAX Procedure Type of Model Estimation Method Cointegrated Rank

relationship
DIF_Lag 1

AR Coefficient Estimates Variable y1 y2 y1 -0.74332 0.40493 y2 -0.74621 -0.57157

VECM(2) Maximum Likelihood Estimation 1

Long-Run Parameter BETA Estimates given RANK=1 Variable y1 y2 Dummy 1 1.00000 -1.95575

Model Parameter Estimates Equation D_y1(t) Parameter AR1_1_1 AR1_1_2 AR2_1_1 AR2_1_2 AR1_2_1 AR1_2_2 Estimate -0.46680 0.91295 -0.74332 -0.74621 0.10667 -0.20862 Std Error 0.04786 0.09359 0.04526 0.04769 0.05146 0.10064 T Ratio -9.75 9.75 -16.42 -15.65 2.07 -2.07 Prob>|T| 0.0001 0.0001 0.0001 0.0001 0.0409 0.0409 Variable y1(t-1) y2(t-1) D_y1(t-1) D_y2(t-1) y1(t-1) y2(t-1)

D_y2(t)

Adjustment Coefficient ALPHA Estimates given RANK=1 Variable y1 y2 Dummy 1 -0.46680 0.10667
Equation

Estimating the VECM(2) model with one cointegrating The VARMAX Procedure Model Parameter Estimates Parameter AR2_2_1 AR2_2_2 Estimate 0.40493 -0.57157 Std Error 0.04867 0.05128 T Ratio 8.32 -11.15

relationship

Parameter ALPHA * BETA' Estimates Variable y1 y2 y1 -0.46680 0.10667 y2 0.91295 -0.20862

Prob>|T| 0.0001 0.0001

Variable D_y1(t-1) D_y2(t-1)

D_y2(t)

Covariance Matrix for the Innovation Variable y1 y2 y1 94.75575 4.52684 y2 4.52684 109.57038

The VARMAX Procedure Schematic Representation of Residual Cross Correlations Variable/ Lag y1 y2 0 +. .+ 1 .. .. 2 .. .3 .. .. 4 .. .. 5 .. .. 6 .. .. 7 .. .. 8 .. .. 9 .. .. 10 .. .. 11 .. .. 12 .. ..

Information Criteria AICC(Corrected AIC) HQC(Hannan-Quinn Criterion) AIC(Akaike Information Criterion) SBC(Schwarz Bayesian Criterion) FPEC(Final Prediction Error Criterion) 9.37221 9.432357 9.368343 9.526606 11712.14

+ is > 2*std error,

- is < -2*std error,

. is between

Residual Cross- Covariance Matrices Lag 0 1 2 3 4 5 6 7 Variable y1 y2 y1 y2 y1 y2 y1 y2 y1 y2 y1 y2 y1 y2 y1 y2 y1 94.66850 5.04865 1.76527 1.25695 -11.01656 -0.72040 -6.74860 -7.66607 5.04511 -8.08221 8.60918 15.74197 -0.16002 9.02414 0.73321 -2.06990 y2 5.04865 106.44947 -11.59694 7.13378 -4.97710 -25.06356 6.14494 -4.25547 -13.61834 8.89626 -2.52994 -9.33422 8.31450 -17.81379 6.74612 1.81515

Portmanteau Test for Residual Cross Correlations To ChiProb> Lag Square DF ChiSq 3 4 5 6 7 8 9 10 11 12 10.55 14.43 18.69 23.51 24.06 25.82 28.15 30.93 31.95 34.63 4 8 12 16 20 24 28 32 36 40 0.0321 0.0713 0.0963 0.1008 0.2399 0.3624 0.4565 0.5208 0.6616 0.7103

Univariate Model Diagnostic Checks Variable y1 y2 R-square 0.9391 0.9409 StdDev 9.7343 10.4676 F Value 482.78 498.42 Prob>F <.0001 <.0001

40

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Univariate Model Diagnostic Checks Variable y1 y2 DW(1) 1.93 1.83 Normality ChiSq 2.14 0.46 Prob> ChiSq 0.3437 0.7951 ARCH1 F Value 0.20 0.03 Prob >F 0.6536 0.8545

Estimating the VECM(2) model with one cointegrating The VARMAX Procedure Univariate Model Diagnostic Checks Variable y1 y2 AR1 F Value 0.03 0.44 Prob>F 0.8541 0.5068 AR1-2 F Value 0.69 3.11 Prob>F 0.5049 0.0491 AR1-3 F Value 0.64 2.01

relationship

Prob>F 0.5881 0.1181

AR1-4 F Value 0.57 1.53

Prob>F 0.6877 0.1998

Infinite Order AR Representation Lag 1 2 Variable y1 y2 y1 y2 y1 -0.21013 0.51160 0.74332 -0.40493 y2 0.16674 0.21980 0.74621 0.57157

1.7

Conseils bibliographiques

GOURIEROUX,C. & MONFORT,A. (1995). Sries temporelles et modles dynamiques. Economica. LUTKEPOHL,H. (1991). Introduction to multiple time series analysis. Springer DAVISON,R. & MacKINNON (1993) Estimation and Inference in Econometrics. Oxford University Press, New York

41

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Les modles ARCH - Autorgressifs Conditionellement Htroscdastiques

Les modles ARC H ont t introduits par Engle en 1982, puis gnraliss en modles GARCH en 1986 par Bollerslev. Lanalogie entre les modles ARCH en temps discret et les modles de diusion en temps continu a t tablie par Nelsen en 1990 . Ce analogie a permis, en particulier, le dveloppement des modles volatilit stochastique. Un des apports des modles ARC H tait de mieux sajuster aux donnes ( en particulier aux donnes nancires ) que ne le faisaient les modles ARM A. Considrons la srie suivante, correspondant au rendement de lindice C AC 40
0.08
800

0.04
600

Series: CAC40 Sample 2 3315 Observations 3314 Mean 0.000644 Median 0.000597 Maximum 0.070452 Minimum -0.072933 Std. Dev. 0.012226 Skewness -0.114047 Kurtosis 5.162046 Jarque-Bera 652.6468 Probability 0.000000

0.00

400

-0.04

200

-0.08

0 -0.075 -0.050 -0.025 0.000

0.025

0.050

0.075

500

1000

1500

2000

2500

3000

CAC40

avec droite, lhistogramme, correspondant la distribution marginale de rt. La premire constatation que lon peut faire est que la srie nest pas gaussienne, et, en particulier, a des queues de distribution trop paisses (kurtosis suprieure 3 ). La seconde est que la srie est stationnaire, mais que lon observe quand mme des priodes de forte variation, ou de forte volatilit. Si lon considre un processus AR, avec un bruit blanc gaussien, il est relativement dicile de modliser ce genre de comportement.
8 6 4 2 0 -2 -4 -6 -8 500 1000 ARMA 1500 2000
0 -5.00 -3.75 -2.50 -1.25 0.00 1.25 2.50 3.75 40 120 160 Series: ARMA Sample 1 2000 Observations 2000 Mean 0.028070 Median 0.037485 Maximum 4.461123 Minimum -4.798971 Std. Dev. 1.425617 Skewness -0.063327 Kurtosis 3.021379 Jarque-Bera 1.374873 Probability 0.502863

80

En eet, le processus AR (1) est un processus gaussien : les queues de distribution sont moins paisses que les queues observes sur la variation de lindice C AC 40, et on nobserve pas de priode de haute volatilit. Les modles ARCH

42

Sries temporelles : thorie et applications

Arthur CHARPENTIER

(simul ci-dessous ) permettent, eux, de mieux prendre en compte ce genre de comportement :


8 6 4 2 0 -2 -4 -6
0 300 200 500 400 Series: ARCH Sample 1 2000 Observations 2000 Mean -0.019286 Median 0.018501 Maximum 6.054874 Minimum -6.605945 Std. Dev. 1.006716 Skewness -0.419740 Kurtosis 6.479866 Jarque-Bera 1067.850 Probability 0.000000 -6 -4 -2 0 2 4 6

100

-8

500

1000 ARCH

1500

2000

Les queues de distribution peuvent tre plus paisses que celles des lois normales (kurtosis de 6 :5 avec les paramtres choisis ), et on observe, comme sur les donnes empiriques, des zones de forte volatilit. Ces modles non-linaires permettent davoir des proprits que navaient pas les modles linaires (ARM A), et permettent ainsi de modliser de faon plus raliste un grand nombre de donnes, en particulier les donnes nancires.

2.1

Notions de stationnarit et notions de linarit

Dnition 6 Stationnarit au second ordre - Un processus (Y t) est dit stationnaire au second ordre si - la moyenne du processus est constante : E (Yt ) = m pour tout t 2 Z, - les autocovariances ne dpendent que de la dirence entre les observations : cov (Xt ; Xs ) = (jt sj) ; Cette dernire proprit implique en particulier que la variance de (Y t ) est constante en fonction du temps : V (Y t) = 2 . Dnition 7 Stationnarit au sens fort - Un processus (Y t) est dit stationnaire au sens fort si quel que soit n, t1 ; :::; tn et h, on a lgalit entre les lois jointes L (Y t1 ; :::; Y tn ) = L (Y t1+h ; :::; Y tn+h ) Thorme 1 Thorme de Wold - Soit (Y t ) un processus stationnaire au second ordre. Alors ( Yt ) peut scrire Yt = c0 +
1 X i =0

i "ti o "t est un bruit blanc au second ordre.

Lcriture est ici plus simple que dans le thorme ( ??) puisque lon impose plus ici de contraintes pour avoir unicit de la dcomposition. Thorme 2 Thorme de Volterra - Soit (Yt ) un processus stationnaire au sens fort. Alors ( Yt ) peut scrire Yt = c0 +
1 X i =0

i "ti +

i;j =0

1 X

ij " ti" tj +

i;j;k =0

1 X

ijk "ti" tj "tk + ::: o " t est un bruit blanc fort gaussien.

2.2

Soit (Xt ) un processus AR (1), tel que Xt = Xt1 + "t o " t s N 0 ; 2 , alors V (Xt ) = 1 2 et V (Xt jXt1 ) = 2 ; 1 2 cest dire que la variance, et la variance conditionnelle, q ne dpendent pas du temps. 2 Soit (Xt ) un processus ARCH (1) , tel que Xt = "t 0 + 1Xt2 1 o "t s N 0 ; , alors 2 2 V (XtjXt1 ) = 0 + 1 Xt 1 : 43

Prsntation des modles ARC H

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Dnition 8 On dit que le processus (Xt ) suit un processus ARC H (p ) sil est dni par une quation de la forme Xt = "t p ht o ht = 0 +
p X i =1 2 i Xt i ;

o ("t ) est un bruit blanc gausien, centr, de variance 2 , soit "t s N 0 ; 2 . Ceci peut aussi scrire
2 Xt

= " t 0 +

"

2 Ce nest plus le processus (Xt ) que lon cherche modliser, mais le processus Xt .

p X i =1

2 i Xt i

2 Exemple 13 Les graphiques montrent lvolution des processus Xt dans le cas dun modle ARM A gauche, dun modle ARC H (1) au centre, et du rendement de lindice C AC 40 droite
30 25 20 15
40 100

0.006 0.005 0.004

80

60

0.003 0.002
20 0

10 5 0 500 1000 ARMA2 1500 2000

0.001 0.000
500 1000 ARCH2 1500 2000

500

1000

1500

2000

2500

3000

CAC402

Exemple 14 Les graphiques ci-dessous permettent de comparer un processus AR (1) et un processus ARCH (1)
15 10 5 0 -5 -10 -15 250 500 ARCH1 750 AR1 1000 50 40 30 20 10 0 -10 -20 -30 250 500 ARCH2 750 AR2 1000

Remarque 12 Les variables Xt sont non-corrles, mais ne sont pas indpendantes. 2.2.1 Processus ARCH (1)

q 2 Dnition 9 Le processus (Xt) est un processus ARCH (1) si Xt = " t 0 + 1 Xt 1 o ( "t ) est un bruit blanc p 2 2 gaussien, " t s N 0 ; . On notera gnrallement h t = 0 + 1 Xt 1, et donc Xt = h t:"t . Dans le cas o ("t ) est un bruit blanc fort ("t i:i:d:) gaussien, alors ( "t) peut tre vu comme une dirence de martingale. Pour que le processus (Xt ) soit stationnaire au second ordre, la variance marginale de (Xt ) soit tre constante. Or V (Xt) = 0 + 1V ( Xt1 ) ; cest dire que lon doit avoir 1 < 1 , et donc V (Xt ) = 0 = (1 1 ). Proprit 4 (Xt ) est stationnaire au second ordre si 0 > 0 et 0 1 < 1 .

44

Sries temporelles : thorie et applications

Arthur CHARPENTIER

E Xt jXt h = 0 ; puisque E Xt jXth = E E XtjXt1 jXth = E 0 jXt h = 0 . De plus, V Aussi,

On peut alors noter que pour tout h 1 ;

1 h 0 1 2 Xt jXt h = 0 + 1 Xt : h et V (Xt ) = 1 1 1 1 V 2 Xt jXth V (Xt ) = h 1 Xth V (Xt h) :

(15)

Comme nous lavions vu en introduction, les modles ARC H permettent davoir des processus avec des queues de distribution plus paisses que les processus ARM A: La kurtosis conditionnelle est obtenue laide de la relation 2 4 2 E Xt jXt1 = 3 0 + 1 Xt ; 1 et la kurtosis la date t est 4 4 2 1 2 3 2 0 2 0 (1 + 1 ) E Xt = 3 2 + + E X = : 0 1 t1 1 1 (1 3 2 1 ) (1 1 )

La condition dexistence du moment dordre 4 est 3 2 1 < 1 , et on en dduit alors lexpression de la kurtosis 4 E Xt 1 2 1 = =3 > 3 (cas de la loi normale ). 2 2) 1 3 2 E (Xt 1 Les queues de la distribution marginale dun processus ARC H (1) sont donc plus paisses que pour un processus gaussien (on parlera de distribution leptokurtique ). 2.2.2 Processus ARCH (p )

Les modles ARCH ( p) sont des extensions des modles ARCH (1) : Les modles ARCH (1) taient 2 2 Xt = "t ht o h 2 ; t = 0 + 1 Xt 1 et "t s N 0 ; et les modles ARCH (p ) font intervenir plusieurs retards, Xt = "th t o h2 t = 0 +
p X i =1

2 2 i Xt : i et "t s N 0;

La volatilit de la date t est alors fonction des carrs des carts la moyenne observs dans le pass proche. Si les coecients i sont tous positifs ( et assez grands ), il y a une persistance des niveaux de volatilit : on observe des priodes de forte volatilit suivies de priode de faible volatilit. On peut alors crire
p X 2 2 E XtjXt1 = 0; et E Xt jXt1 = h 2 = + i Xt 0 t i: i =1

2.2.3

Processus GARC H (p; q)

Ces modles ont t introduits par Bollerslev en 1986, inspirs de la dmarche de Box et Jenkins, avec une dynamique autorgressive, p q X X 2 2 Xt = "t h t o h 2 = + X + j h2 : (16) 0 i ti t t j et "t s N 0 ;
i =1 j =1

On peut noter tout dabord que, sous cette forme, les coecients p et q ne sont pas analogues ceux des modles ARM A : en particulier, q correspond au caractre autorgressif du processus h 2 t . On a alors
p q X X 2 2 E Xt jXt 1 = 0 et E Xt jXt1 = h 2 = + X + j h2 0 i t ti tj : i=1 i =1

45

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Proprit 5 Si le processus GARC H (p; q) est stationnaire au second ordre, alors ncessairement
p X i =1

i +

q X j =1

j < 1;

(17)

et dans ce cas, la variance de Xt est V (Xt ) = 1

Pp Pq Dans le cas o (17) est sature, i.e. i =1 i + j= 1 j = 1 , on dira alors que le processus GARC H (p; q) est intgr, et on parlera de processus IGARCH ( p; q ). Cette dnomination peut se justier par lexistance dune racine unit dans la composante autorgressive de (16). Toutefois, cette analogie avec lextention des modle ARM A aux modles ARIM A peut tre trompeuse : un processus ARIM A nest pas stationnaire (au second ordre ou au sens fort ) alors quil existe une solution stationnaire (au sens fort ) dun modle IGARC H (qui admettra une variance innie daprs la proprit ci-dessus ). Dans le cas dun processus GARCH (1; 1), il est possible de montrer que la kurtosis de Xt est de la forme (Xt ) = 1 ( 1 + 1 )
2 2

Pp

0 Pq : i =1 i + j =1 j

1 ( 1 + 1 )

2 1

(4 1)

("t ) o 4 = E "4 t :

2.3

Modles avec erreurs ARCH


Xt = Xt1 + "t

Nous allons considrons un processus ( Xt) dont la dynamique est rgie par un processus de type AR (1) :

Dans la partie sur les processus ARIM A, nous avions tudier le cas o ("t ) correspondait un bruit blanc, cest dire non-autocorrl avec son pass. 2.3.1 Erreurs ARC H (1)

Nous allons regarder les proprits de (Y t ), processus autorgressif, dans le cas o ("t ) nest plus un bruit blanc, en particulier lorsque ("t ) est un processus AR (1), " t = "t 1 + t , et lorsque ( "t ) est un processus ARCH (1) , q "t = t 1 + "2 t 1 . Le premier cas correspond aux modles ARM A, et le second correspond aux modles autorgressifs erreurs ARCH . Considrons le modle 8 < (1) : E "t j" t1 = 0 Y t = + Y t1 + " t o jj < 1 et "t satisfait : (2) : V "t j" t1 = c + "2 : t1 Lesprance conditionnelle de (Y t) est alors 1 h E Y tjY th = + E Yt 1 jY th = + Y th ; 1 c = 1 " 1 2h 1
2

et sa variance conditionelle, en utilisant (15) V Y t jY t1

h 2h
2

h 2h 2

"2 th ;

qui nest pas constante ( puisquel le dpend de "th ).

Dans le cas derreurs ARCH , la condition (1) : E " tj"t 1 = 0 signie que ("t ) est un bruit blanc faible qui satisfait la condition de dirence de martingale, et dont la variance conditionelle V "t j"t1 suit un processus ARC H (1) :
2 "2 t = c + "t 1 + t, o ( t ) est un bruit blanc gaussien. Les proprits du processus dinnovation ( "t) sont alors les suivantes,

Proprit 6 (i) Le processus ("t ) est orthogonal aux valeurs passes, quel que soit le retard : E ( "tj"t h ) = 0 pour tout h (ii) La proprit dorthogonalit implique que les corrlations conditionelles sont nulles : cov ("t ; "t+k j"th ) = 0. 46

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Preuve. Cette seconde proprit sobtient de la faon suivante cov ("t ; "t+k j"th ) = = E ("t "t+k j"th ) E ("t j"t h ) E ("t+ k j"th ) = E (" t"t+ k j"th ) E ((" t"t+ k j"t+k 1 ) j" th ) = E ("t E ("t+k j"t+k 1 ) j"t h ) = 0 :

Il y a donc absence de corrlation entre les valeurs prsentes et futures du processus, quels que soient les retards h et k: Mais si la variance conditionelle de "t nest pas constante, la variance (non conditionnelle ) est constante : 2 2 h 1 h 1 "2 + h "2 th+1 ; t = c + "t1 + t = ::: + c 1 + + + ::: + th + t + t1 + ::: + et donc 1 h V ("t j"t h ) = E "2 + h "2 t j "th = c th ; 1 2 = V ("t ) = E (V ("t j"th )) = c : 1

alors que

Exemple 15 Le graphique ci-dessous correspond la simulation dun tel processus, avec droite son autocorrlogramme,
15 10 5 0 -5 -10 -15 500 1000 Y 1500 2000

Lautocorrlogramme suggre de tester un modle autorgressif dordre 1 sur Y . Toutefois, si lon tudie la distribution des rsidus du modle Y t = Yt 1 + "t , lhypothse de normalit est clairement rejete

LS // Dependent Variable is Y Sample: 2 2000 Included observations: 1999 after adjusting endpoints Convergence achieved after 2 iterations Variable AR(1) Coefficient 0.794042 Std. Error 0.013613 T-Statistic 58.33134 Mean dependent var S.D. dependent var Akaike info criterion Schwartz criterion Durbin-Watson stat Prob. 0.0000 -0.087891 2.508131 0.846451 0.849252 2.064924

400

300

Series: Residuals Sample 2 2000 Observations 1999 Mean Median Maximum Minimum Std. Dev. Skewness Kurtosis -0.019357 0.010571 7.226993 -8.941829 1.526374 -0.133441 6.043845

200

R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Inverted AR Roots

0.629583 0.629583 1.526497 4655.723 -3681.486 .79

100

Jarque-Bera 777.6292 Probability 0.000000 0 -8 -6 -4 -2 0 2 4 6

Lautocorrlogramme ne permet pas de rejeter lhypothse de bruit blanc, mais lautocorrlogramme ne permet de ne mesurer quune dpendence linaire entre "t et "t h . Lide peut alors tre de tester le caractre ARC H des rsidus

47

Sries temporelles : thorie et applications

Arthur CHARPENTIER

obtenus, pour expliquer cette forte kurtosis,


ARCH Test: F-statistic Obs*R-squared 444.8826 364.1615 Probability Probability 0.000000 0.000000

Test Equation: LS // Dependent Variable is RESID^2 Sample: 3 2000 Included observations: 1998 after adjusting endpoints Variable C RESID^2(-1) Coefficient 1.335464 0.426916 Std. Error 0.116004 0.020240 T-Statistic 11.51218 21.09224 Mean dependent var S.D. dependent var Akaike info criterion Schwartz criterion F-statistic Prob (F-statistic) Prob. 0.0000 0.0000 2.330146 5.237595 3.112012 3.117617 444.8826 0.000000

R-squared Adjusted R -squared S.E. of regression Sum squared resid Log likelihood Durbin -Watson stat

0.182263 0.181853 4.737481 44797.68 -5941.939 1.985069

Ce test est alors clairement signicatif, et lon valide lhypothse de modle ARCH pour les rsidus. Le modle est alors r Y t = 0:7940 4 Y t 1 + "t o "t = t 1:335464 + 0 :42691 "2 t1
(0 :0136) ( 0:116) (0 :0202)

et o ( t ) est un bruit blanc gaussien. 2.3.2 Erreurs ARC H (p )

On considre ici un modle plus gnral, sur le processus (Y t) , de la forme Y t = AXt + "t o jj < 1 et ("t ) satisfait "t = h t t avec ( t) bruit blanc,

et o (Xt ) est un vecteur multivari (modle de rgression classique : variables exognes), ou compos de retards de Y t (modle ARM A) ) 2 2 2 2 h2 t = 0 + 1 "t 1 + 2 " t2 + ::: + p "t p = 0 + A (L ) "t ; en posant A (L) = 1 L + 2 L2 + ::: + p Lp . Nous allons tester ici lhypothse H0 : 1 = 2 = ::: = p = 0 , contre lhypothse alternative o il existe i tel que i 6= 0 . La procdure pour tester cette absence deet ARC H est fonde soit sur un test de Fisher, soit sur un test LM du multiplicateur de Lagrange. La mise en place de ces tests se fait de la faon suivante, (1) calcul des rsidus/erreurs du modles de rgression : b "t; (2) calcul du carr des erreurs b "2 t; (3) p x, on eectue la rgression linaire de b "2 "2 "2 t sur son pass b t1 ; :::; b tp :
2 "t b

= 0 +

p X i =1

(4) calcul de la statistique LM , LM = nR2 o n est le nombre dobservations utilises lors de la rgression, et R2 le coecient de la rgression. Si LM > 2 (p) , on rejette H0 : lerreur est alors modlise par un processus ARCH ( p) : 2.3.3 Remarque : test de racine unit en prsence derreurs ARC H

ib " ti;

Comme nous lavions vu dans la partie (?????), les tests de Dickey-Fuller permet de tester lhypothse de prsence ou non de racine unit : le test de rgression scrit alors Xt = Xt1 + t dont lestimation est Xt = b Xt1 + b t ; (18)

(ou, de faon plus gnrale encore Xt = Xt1 + + t + t ). Il est alors possible de montrer que sous lhypothse (H0 ) : = 1 , dans le cadre du modle (18) 5 la statistique de Student du test scrit P i 2 b 1 Xt1 1 Xh s2 b b t =1 = o 1 = P 2 t ; s2 = Xt b Xt1 et b b =P 2 ; Xt1 T 1 X t 1 b b 48

5 Dans le cas plus compliqu avec tendance et c onstante (i.e.X = X t t1 + + t + t), la distribution asymptotique est alors un peu plus complique : cf article de Stock (1994) dans le Handbook of Econometrics.

Sries temporelles : thorie et applications

Arthur CHARPENTIER

b cart type (par moindre carrs ) de lestimateur de , et sa distribution est donne par avec b
0 t

Il est possible de montrer que ces tests, bien que dvelopps en thorie sur des modles de type AR restent asymptotiquement robustes en prsence deet ARCH sur les rsidus6 .

R1 b Wt dWt 1 L b t= 1 = ! h 0 6= N (0; 1) o (W t ) est un brownien standard sur [0 ; 1] : R 1 2 i1 =2 b b W dt

2.4
2.4.1

Estimation et prvision
Estimation des paramtres dun modles ARC H

Lestimation peut se faire en utilisant des techniques inspires du maximum de vraissemblance. La log-vraissemblance la date t est de la forme 1 1 2 2 Lt = constante log h2 t " t ht ; 2 2 et la log-vraissemblance totale du modle scrit L = constante
n n 1X 1 X 2 2 log h 2 " h : t 2 t= 1 2 t=1 t t

La mthode pour estimer les paramtres est alors la suivante (1) calcul des rsidus/erreurs du modles de rgression : b "t; (2) calcul du carr des erreurs b "2 "2 b2 "2 t ; et on eectue la rgression linaire de b t sur son pass " t 1 ; :::; b tp : "t = 0 + b
2 p X i= 1

(3) on considre que la variance de lerreur peut tre approche par h2 paramtres t , et on estime de nouveau les du modle par moindres carrs gnraliss, avec comme facteur de pondration ! = 1 =ht et - = diag h 2 = t : b 0 1 1 0 b "- b " b " -h et p X h2 = b + ib b "2 0 t ti + u t:
i =1

ib "t i + u t ;

Par rapport aux modles linaire, on a une grande dirence quant la variance de lerreur du modle, qui va tre fonction de la variance rsiduelle b , alors que pour les modles ARC H , elle sera fonction de h 2 t : la variance de lerreur nest alors plus constante (ce qui va inuencer, par exemple, les intervalles de conance lors des prvisons ). Plus rigoureusement, lestimation des paramtre dans les modles ARCH se fait en utilisant lestimateur du pseudo maximum de vraisemblance, sous lhypothse de loi conditionelle normale.Aussi, so lt ( y; ) dsigne la vraisemblance de Yt , conditionelle au pass, la vraisemblance de Y 1; :::; Y T , conditionelle Y 0 est alors L (y; ) =
T Y

t=1

En fait, cet estimateur est convergent, mme si la loi conditionelle nest pas normale. Cet estimateur est galement asymptotiquement normal 2.4.2 La procdure de Diebold (1987) : test dautocorrlation en prsence deet ARC H

lt ( y; ) et on pose b = arg max log L (y; ) :

Considrons une srie (Xt ) de moyenne nulle. Lautocorrlation empirique dordre h est donne par (h ) = b
T X b (h ) 1 o b (h ) = Xt Xth : (0) b T h t=h+1

6 On

pourra consulter en particulier Kim et Schmidt (1993) Unit root with conditional heteroskedasticity, dans Journal of Econometrics.

49

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Sous lhypothse (H0 ) o (Xt ) est un bruit blanc, b (h ) est asymptotiquement normalement distribue, de moyenne nulle et de variance V (b (h )) quivalente 1=T . Cependant en prsence dhtroscdasticit, la variance de lautocorrlation nest plus en 1=T mais est gale 1 X 2 (h ) V ( c 1+ ; X (h )) = T 4 p 2 o X 2 (h) est lautocovariance du processus Xt . Aussi, lintervalle de conance de Bartlett (1 :96 = T 95%) savre trop troit en prsence deet ARC H . Et comme ces deux paramtres, X 2 (h ) et 2, sont facilement estimables, une estimation de la variance des autocorrlations peut tre obtenue comme 1 X 2 (h ) b b ( V c ( h )) = 1 + ; X T b4 q b ( et lintervalle de conance corrig des eets ARC H devient, 95%, 1:96 V c X (h)). La statistique de Box-Pierce corrige est alors donne par k X 4 0 Q (k) = T c 2 (h ) ; 2 + b X 2 (h ) X
h= 1

qui est asymptotiquement distribue comme une loi du chi-deux k degrs de libert. 2.4.3 Prvision et intervalle de conance

Nous allons ici tudier la prvision dune variable, modlise par un modle ARM A dont les erreurs suivent un bruit blanc ou un modle ARCH . Considrons par un modle AR (1) Xt = + Xt 1 + "t : Compte tenu de cette criture, la date t + 1, Xt+ 1 est donne par Xt+1 = + Xt + "t+1 , dont la prvision, faite la date t est b t (1) = E L (Xt+ 1 jXt ; Xt1 ; :::; "t ; "t1 ; :::) = + Xt + E L ("t+1 j"t ; "t1 ; :::) : X Dans le cas o ("t ) est un bruit blanc, " t+1 est orthogonal son pass, et donc EL ( "t+1 j"t; " t1 ; :::) = 0 et donc b t (1) = + Xt. De faon itrative, on aura, pour tout h > 0, X b t (h ) = + X b t (h 1) = 1 + h Xt ; X 1
h

bt (h ) = "t+h + "t+h 1 +::+ h 1 "t+1 . On peut noter que X b t (h ) ! = (1 ) dont lerreur de prvision est e h = Xt+h X quand h ! 1. Lintervalle de prvision, au seuil , est de la forme X (h ) ; X (h) de telle sorte que h i bt (h ) + X (h) ; X b t (h) + X (h ) = 1 : P eh 2 X (h ) ; X (h ) = P Xt+h 2 X

Dans le cas o ("t ).est un bruit blanc fort gaussien, alorsn pour un horizon de 1 , on peut noter aisment que e1 = bt (1) = "t+1 s N 0 ; 2 , et donc, un intervalle de conance 95% pour la valeur en t + 1 sera Xt+1 X h i bt (1) 1:96; X bt (1) + 1 :96 ; X bt (h ) = "t+ h + "t+h 1 + :: + h1 " t+1 s N 0; 1 + 2 + ::: + 2(h 1) 2 et et plus gnrallement, eh = Xt+h X donc, un intervalle de conance 95% pour la valeur en t + h sera h i p p b t (h ) 1 :96 1 + 2 + ::: + 2( h1) ; X bt (h ) + 1 :96 1 + 2 + ::: + 2(h1) : X

Mo dle AR (1) ARC H (1) Supposons que p (" t) ne soit plus un bruit blanc (indpendant de son pass ) mais que le bruit soit ARC H (1), cest dire que "t = t h t o h t = 0 + 1 "2 t1 , o on supposera que ( t ) est un bruit blanc que lon supposera de variance unitaire, indpendant du pass de ("t ), cest dire t indpendant de "t1 ; "t2 ; ::: On notera tout dabord que E ("t ) = 0 pour tout t, que la corrlation entre deux dates est donne par la relation q q q q 2 2 : 2 E ("t "s) = E t 0 + 1 " 2 : + " = E ( ) E + " + " = 0 pour s < t; 0 1 0 1 0 1 t1 s s1 t t1 s s 1 50

Sries temporelles : thorie et applications

Arthur CHARPENTIER

et que la variance la date t vrie 2 2 2 2 2 2 = E "2 = E 2 t = E t 0 + 1 "t1 t E 0 + 1 "t1 = 0 + 1 E "t 1 = 0 + 1 ;

cest dire 2 = 0 = (1 1 ). Pour obtenir un intervalle de conance pour Xt+h , ra joutons une hypothse supplmentaire de normalit du bruit ( t ). Dans ce cas, lintervalle de conance, 95%, pour la valeur la date t + 1 est donn par q q 2 : b t (1) 1 :96 0 + 1 "2 b X ; X (1) + 1 : 96 + " t 0 1 t t Aussi, dans le cas dun modle ARCH , la taille de lintervalle de conance dpend de la valeur " 2 t. Mo dle AR (1) GARCH (1; 1) On considre ici un modle AR (1) GARCH (1; 1), i.e. un processus (Xt ) vriant une relation de type AR (1) -sans constante - et (" t) suit un modle GARCH (1 ; 1), 8 8 + " < Xt = X < Xt = Xt1 + "t t 1 t p "t = t h t ou " t = t t : : 2 2 h t = ! + "2 + h t = ! + "2 t1 t1 t1 + t1 ; o ! > 0 , ; 0 et + 1 et jj < 1. Alors, pour tout h 0 ; Xt+ h = "t+ h + "t+h1 + ::: + h "t + h+1 Xt1 ; de telle sorte que E (Xt+h jXt1 ) = h+1 Xt1 (ou mme, plus gnralement, E Xt+h jXt1 = h+1 Xt1 ). De plus, V o V "t j"t1 = 2 t et pour i 1, V " t+ij"t1 = = de telle sorte que V Xt+h jXt1 = = 2(h+1) h+1 ! 1 2(h+1) ! ( + ) 2 + si 2 6= + t (1 ( + )) (1 2 ) 1 ( + ) 2 ( + ) ! 1 2(h+1) ! 2 + t (h + 1) 2h si 2 = + : 2 1 ( + ) (1 2 ) V ("t ) lim V Xt+ hjXt 1 = V (Xt ) = : h!1 1 2
h X Xt+h jXt1 = 2(h i) V " t+ij"t1 ; i= 0

2 E 2 t+i j" t1 = ! + ( + ) E t+i 1 j "t 1

i 1 ( + ) i 1 i i ! 1 + ::: + ( + ) + ( + ) 2 = ! + ( + ) 2 t t; 1 ( + )

On peut dailleurs noter que si h ! 1, on retrouve la variance non conditionelle de Xt , i.e.

Exemple 16 Les graphiques ci-dessous donnent les intervalles de conance 95%, horizon 1 , 2 et 5 respectivement, pour des processus GARCH (1; 1) simul, o ! = 1, = 0 :1 et = 0 :8 (avec un bruit t gaussien, t N (0; 1))

Les graphiques ci-dessous correspondent au cas ! = 1 , = 0 :6 et = 0 :2 (avec un bruit t gaussien, t N (0 ; 1))

Enn, pour rappels, les graphiques ci-dessous correspondent des intervalles de conance associs des bruits blancs, pour les mmes horizons

51

Sries temporelles : thorie et applications

Arthur CHARPENTIER

2.5

Modles ARC H et nance

La srie temporelle ci-dessous reprsente lindice N ASDAQ, avec le rendement de lindice au jour le jour, et le logarithme de lindice (en haut ). De mme que pour la srie du CAC 40 , on retrouve l aussi des priodes de forte volatilit sur le march, comportement qui ne peut tre pris en compte laide de modles ARM A,
10 5

-5

-10
RDMNT_NASDAQ LOG_NASDAQ

-15 500 1000 1500 2000 2500

Notons (pt ) le prix dun titre la date t, et (rt ) le logarithme du rendement, i.e. rt = log (p t) log (p t1 ) = log (1 + R t) o Rt correspond la variation relative des prix, i.e. Rt = [Rt Rt1 ] =Rt . Ces deux sries sont dailleurs sans unit, ce qui facilite la comparaison entre elles. Les proprits suivantes ont t notes sur la plupart des sries nancires, (1) Les processus (p t) sont non-stationnaires : les tra jectoires de prix sont gnrallement proches dune marche alatoire sans terme constant. Et, en revanche, les sries des rendements ont des trajectoires compatibles avec la stationnarit au second ordre. (2) Autocorrlations des carrs des variations des prix : les faibles autocorrlations de la srie (rt ) la rendent proche dun bruit blanc7 ( sauf pour 2 des rendements dnis sur des priodes trs courtes, de lordre dune vingtaine de minutes ) Nanmois, la srie rt est souvent fortement corrle. Ce qui nest pas compatible avec une hypothse de bruit blanc. (3) Queues de distribution paisses : les distributions empiriques des sries des rendements, on saperoit que lhypothse de normalit est rejete. En particulier, au niveau des queues, la dcroissance est gnrallement plus faible que dans le cas gaussien, i.e. en exp x2 = 2 . On parle alors de distribution leptokurtique. (4) Volatility clustering (regroupement des extrmes ) : empiriquement, de fortes valeurs, ou de fortes variations, tendent tre suivies par dautres grandes variations. (5) Queues paisses conditionelles : souvent, mme une fois corriges de la volatility clustering (en utilisant des modles de type GARCH , par exemple ), les sries ont des rsidus possdant encore des queues paisses (mme si cela est moins important que la distribution non conditionelle, i.e. la distribution des rendements ). (6) Eet de levier : cette proprit, note par Brock en 1976 repose sur lobservation du fait quil existe une asymtrie entre limpact des valeurs passes positives et des valeurs passes ngatives. Les baisses de cours tendent provoquer un accroissement de la volatilit suprieure celui induit par une hausse du cours, de mme amplitude. (7) Saisonnalit : la volatilit tend augmenter lorsque les marchs ferment (week end ou jours fris ). On parle alors daccumulation dinformation. (8) Asymtrie perte/gain : ormis dans le cas des taux de change, il y a gnralement asymtrie de la distribution : il y a plus de mouvements forts la baisse qu la hausse. Toutes ces proprits sont diciles obtenir laide de modles ARM A classiques. Les modles ARC H sont apparus une poque o se dveloppaient les modles en temps continu, en particulier pour la valorisation de produits drivs. Mais si cette valorisation a donn de bons rsultats thoriques, lestimation, partir de donnes discrtes sest avre plus dicile : les modles les plus simples (brownien gomtrique, modle dOrnstein-Uhlenbeck ou modle de Cox-Ingersoll-Ross ) taient gnralement trs mal spcis. Les modles ARCH en revanche se prtaient bien lestimation, et fournissaient de bons ajustements, mme si la valorisation des produits drivs a pos quelques problmes (le temps discret impliquant une incompltude du march ). Toutefois, ces modles
7 Lhypothse usuelle en thorie de la nance consistait eectivement supposer que les processus de re ndements sont i.i.d. et de variance nie. Cette hypothse dindpe ndance nest souvent retenue quen premire approximation. Un hypoth se plus forte est aussi souvent faite sur le caractre gaussien de ces rendements. Ces hypothses se traduisent, dans le cas continu, des modles de la forme dRt = dt + dWt o (Wt) est un mouvement brownien standard.

52

Sries temporelles : thorie et applications

Arthur CHARPENTIER

avaient quelques faiblesses, do le grands nombre de modles gnralisant encore davantage ces modles : IGARC H , T ARCH , QARC H , SW ARC H , ACD GARCH ...etc. 2.5.1 Liens entre temps continu et temps discret

Il est possible de passer du temps continu en temps discret en considrant des petites variations de temps. Ce passage est en particulier utile si lon souhaite faire de lestimation de modle. Soit (Xt) un processus dIto en temps continu, i.e. dXt = (Xt ; t) dt + (Xt ; t) dWt o (W t) est un brownien standard, (19) et soit g (x; t) une application direntiable en x et en t, alors, si Y t = g (Xt ; t), le lemme dIto permet dcrire @g @g 1 @2g 2 @g dYt = (X; t; t) + + (Xt ; t) dt + ( X;t; t) dW t : @x @t 2 @x2 @x La version discrte dun processus dIto est Xt = Xt+1 Xt = (Xt; t) + (Xt ; t) "t : Supposons que (Xt ) suit un browien gomtrique, i.e. et sont des constantes dans (19), o (Xt) correspond, par exemple, au prix dune action , o un niveau dindice. Soit alors (Y t) le log-rendement associ, i.e. Y t = log Xt log Xt1 pour t = 1 ; :::; T (en supposant (Xt) observ la date 0 ), soit Xt = Xt1 : exp ( Yt ). Nous noterons le temps entre les deux observations, exprim en anne8 . Puisque (Xt ) suit un brownien gomtrique, alors chaque date, Yt est distribu suivant une loi gaussienne, de moyenne 2 = 2 et de variance 2 , et cov (Yt ; Y t+h ) = 0 2 pour h 6= 0. Notons Y = 2 =2 et 2 Y = ; , Y et SY les estimateurs empiriques de Y et de Y , i.e. v u T T u 1 X 2 1 X Y = Yi et SY = t Yi Y T T 1
i =1 i =1

(qui sont alors des estimateurs consistants de Y et de ). On peut alors estimer et par = b Y S2 SY + Y et b =p 2

On peut galement noter que les rendements sont supposs gaussiens, et en particulier, on aura alors, pour h > 0 2 log Xt+h log Xt~ N h; 2 h : 2 Exemple 17 Considrons le rendement de laction IBM au cours de lanne 1998 [A INSERER]

Lautocorrlogramme montre que la srie des log-rendements est non-autocorrles (cf statistique de Ljung Box par exemple). Supposons que le prix de laction soit modlis par un brownien gomtrique, i.e. dXt = dt + dW t , alors, en utilisant le fait que Y = 0 :002276 et SY = 0:01915 (cf statistiques ci-dessous), les paramtres et peut estims par Y S2 SY b= + Y 0 :6198 et b = p 0 :3040 2 Cest dire que le rendement espr annuel est de 61 :98%, avec une volatilit de 30:4%, en 1998. On peut toutefois noter que lhypothse de normalis nest pas valide.

8 On prendra = 1=12 pour des donnes mensuelles, ou = 1=250 pour des donnes journalires (si lon ne prend en compte que les jours ouvrs ).

53

Sries temporelles : thorie et applications

Arthur CHARPENTIER

2.5.2

Modles avec variance sto chastique/dterministe en temps continu

Dans le modle initial propos par Black et Scholes, le processus de prix des actifs (risqus ) est modlis par un processus dIto, i.e. dSt = St + StdBt o Bt est un mouvement brownien standard, et o et sont des constantes. Toutefois, cette hypthse de constance de sest vite avre, en pratique, inexacte9 . Une alternative a t de supposer que cette volatilit pouvait tre, elle mme, stochastique, dont la dynamique pourrait galement tre modlise par un processus stochastique, dSt = St [t dt + t dWt ] d t = b ( t; t ) dt + (t; t ) dBt : 2.5.3 Modles avec variance sto chastique/dterministe en temps discret

Les modles introduits dans la littrature conomique se prsentaient gbralement sous forme multiplicative, "t = t t o ( t) est un processus i.i.d. et ( t ) une suitede variables alatoires telles que - t soit mesurable par rapport la ltration engendre par le pass de "t - et ventuellement le prsent - et par le pass dun processus sous-jacent inobservable (vt ), - t et t soient des variables indpendantes, - t > 0 pour tout t: La variable alatoire t est appele volatilit de "t . Il est possible de noter que E ("t ) = E ( t t ) = 0 et cov (" t; "t h ) = 0 pour tout h > 0 : ("t ) est alors uin bruit blanc, au sens faible. Mais pas au sens fort. Plusieurs types de modles existent alors suivant la spcication retenue pour ( t) (1) les processus conditionellement htroscdastiques, de type GARC H pour lesquels la ltration F t est engendre par le pass de " t. La volatilit est alors une fonction dterministe du pass de "t . Les modles GARCH standard sont caractriss par une volatilit fonction ane des valeurs passes de "2 t. (2) les processus volatili stochastique, pour lesquels la ltration F t est engendre par le pass de vt . La volatilit est alors un processus. Le modle le plus simple et le plus utilis consiste supposer que le processus (log t ) suit un AR (1), i.e. log t = ! + log t1 + v t. (3) les processus changement de rgime, pour lesquels on suppose alors gnrrallement que le processus sous-jacent (v t) est modlisable par une chane de Markov espace dtat ni. Exemple 18 ARCH - Lide est ici de modliser la volatilit laide dun processus ARC H . Si lon note Si le prix dun actif la date i , o i = 0 ; 1 ; :::; n, et u i le log-rendement associ, ui = log (Si ) log (Si1 ) pour i = 1 ; :::; n, on suppose que lon peut crire la volatilit 2 n sous la forme
2 2 2 2 n = 1 u n1 + 2 u n 2 + :: + n 1 u1 = n 1 X i =1

iu 2 n i ;

o les variables i correspondent au poids donn la n i me observation, de telle sorte que leur somme fasse 1. On obtient ainsi un modle ARCH ( n) : Un cas un peu plus gnral consiste considrer un modle avec constante, 2 2 2 2 n = 0 V + 1 u n1 + 2 u n 2 + :: + n 1 u1 o V correspond une moyenne, long terme de la volatilit. Exemple 19 EWMA (Exponentially Weighted Movering Average) - Un cas particulier du cas prcdant consiste prendre des poids dcroissantes de faon exponentielle, i.e. i = i 1 o 0 < < 1 , d telle sorte que lquation ci-dessus se rcrit n 1 X n 2 2 2 2 = + (1 ) u = (1 ) i 1 u2 n n 1 n 1 n i + 0 :
i =1

Exemple 20 GARCH - Dans le cas des modles GARC H (1 ; 1), on considre des modles de la forme
2 2 2 n = + n 1 + u n 1 o = V:

Dans le cas particulier o = 0 , on retrouve le modle E W M A:


9 Il est possible, connaissant le prix de march dun call de dduire une valeur unique pour la volatilit, dans le cas du modle de Black et Scholes. Cette valeur de volatilit, appele volatilit implicite, peut scarter notablement de la volatilit historique ( cart type des rendements du sous-jacent ) c ar elle est cens reter la volatilit future anticipe par le march. En particulier, en calculant, partir des prix de calls de mme maturit, et de prix dexercice dirents, les valeurs de vette volatilit implicite. On obtient une courbe convexe assez caractristique que lon appelle le smile de volatilit.

54

Sries temporelles : thorie et applications

Arthur CHARPENTIER

2.6
2.6.1

Autres types de modles non-linaires


Les modles bilinaires - nots BL (p; q; P; Q)

Les modles bilinaires ont t introduits en 1978 par Granger et Andersen, de faon gnraliser les modles ARM A, Yt =
p X i =1

iY ti + "t

q X j =1

j "tj +

P X Q X

i =1 j =1

ij Yt i"t j ;

o ("t ) est un bruit blanc gaussien. Ce modle sera not BL (p; q; P; Q ). Une sous classe possible (diagonal ) est dnie par p q P X X X Yt = i Y ti + "t j "t j + iY ti "ti :
i =1 j =1 i= 1

Exemple 21 Le modle BL (0 ; 0 ; 2 ; 1) est donn par Yt = "t + Yt 2 "t1 : Ce processus est centr, puisque le bruit est indpendant du pass (et donc cov ("t 1 ; Y t2 ) ), E ( Yt ) = E ("t ) + E (" t1 Y t2 ) : Le processus dautocovariance est donn par E (Y t Yt h ) = " 0 pour h 1 2 + 2 2 E Y t2 2 :
j Y

La variance marginale est alors V (Y t) = 2 = 1 2 2 : Il est alors possible de montrer que Y t scrit aussi Y t = "t +
1 X j =1

"t2 j :

k =1

"t2 k+ 1 :

La srie ci-dessous correspond une simulation de la srie Y t = "t + 0 :6:Y t2 "t1


6 4 2 0 -2 -4 -6
140 120 100 80 60 40 20 0 -5.00 -3.75 -2.50 -1.25 0.00 Series: BILINEAIRE Sample 1 1500 Observations 1500 Mean Median Maximum Minimum Std. Dev. Skewness Kurtosis 0.049644 0.075453 3.793614 -4.864823 1.221865 -0.148632 3.492173

Jarque-Bera 20.66254 Probability 0.000033 1.25 2.50 3.75

200

400

600

800 BILINEAIRE

1000

1200

1400

2.6.2

Les modles autorgressifs exponentiels - E XP AR

Ces modles sont une gnralisation des processus AR, permettant de prendre en compte les explosions en variance de la srie : p X 2 Xt = + ai + i: exp Xt Xti + "t : 1
i =1

55

Sries temporelles : thorie et applications

Arthur CHARPENTIER

2.6.3

Les modles autorgressifs seuils - T AR, ST AR ou SE T AR

Les modles autorgressifs seuils ont t introduits par Tong en 1978 , sous le nom de threshold autoregressive, ou T AR. On suppose, dans le cas dun seuil unique, quil existe deux rgimes dirents, ( (1) (1) 1 Xt 1 + 2 Xt2 + ::: + (1) p1 Xtp 1 + "t si Xt s Yt = (2) (2) 1 Xt 1 + 2 Xt2 + ::: + (2) p2 Xtp 1 + t si Xt > s; o (Xt ) est soit une variable exogne, soit une variable (Yt ) retarde (Y td ). Dans ce dernier cas, on parlera ventuellement de modle SE T AR, self excited threshold AR. Il est dailleurs poissible de gnraliser davantage en considrant des sous-modles ARM A au lieu de modles AR. Il est noter que les bruit ( "t) et ( t) sont indpendants, et peuvent tre de variance dirente. Exemple 22 Considrons le cas de modles AR (1) avec un seuil unique 1 Xt1 + " t si Xt 1 s Xt = 2 Xt1 + " t si Xt 1 > s; avec le mme bruit. Une condition ncessaire et sucante dexistence dune solution stationnaire et 1 < 1 , 2 < 1 et 1 2 < 1 . La srie ci-dessous correspond une simulation de la srie 0 :2 :Xt1 + "t si Xt1 1 Xt = 0 :9 :Xt1 + "t si Xt1 > 1 ; avec un bruit blanc gaussien, centr rduit,
10 8 6 4 2 0
50 250 200 150 100 Series: TAR Sample 1 1500 Observations 1500 Mean Median Maximum Minimum Std. Dev. Skewness Kurtosis 1.010332 0.806912 9.491056 -3.801579 1.699211 0.872733 4.688627

-2
0

Jarque-Bera 368.6318 Probability 0.000000 -4 -2 0 2 4 6 8

-4

200

400 TAR

600 SEUIL

800

1000

Ce type de processus, l aussi, permet davoir des queues de distribution plus paisses (en loccurence ici pour les fortes valeurs de Y t - queue droite). Une criture quivalente du modle seuil deux rgimes, avec un seul reatard, ou une seule variable exogne ( Xt ou Y t1 ), est la suivante 1 + 1 Xt + "t si Xt s Yt = 2 + 2 Xt + t si Xt > s; (20) m Yt = ( 1 + 1 Xt) IX ts + ( 2 + 2 Xt ) IX t> s + ut ;
2 o (u t ) est une squence de bruits indpendants, dont la variance est de la forme V (u t) = 2 " I Xt s + IX t>s . Il sera possible de se reporter larticle de Ben Salem et Perraudin (2001) Tests de linarit, spcication et estimation des modles seuil : une analyse compare des mthodes de Tsay et Hansen pour des complments dinformation sur le sujet.

Test de linarit An dtre sr quil est ncessaire dutiliser un modle T AR, il est possible dutiliser des tests de linarit, dont lide est de tester H0 : 1 = 2 et 1 = 2 contre laternative fournie par le modle seuil. Plus ( 1) ( 2) gnralement, on test H0 : 1 = 2 et i = i pour i = 1; :::; p:

56

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Tsay (1989) propose la statistique suivante, o m est le nombre dtats, et Y t = 0 + 1 Y t1 + 2 Y t2 + ::: + ( i) (i ) p Yt p1 + "t si Xt 2 tat i, Q (m ) = X 1 1 X 2 X 2 1 bt " at b a2 b ; t m+1 n b 2m 1

(i )

(i )

( i)

o b dsigne le nombre dobservation utilises pour initialiser les estimations rcursives, i.e. b = n=10 + p ( comme le 0 conseille Tsay ), b " t correspondent aux rsidus "t standardiss, et b at les rsidus de la rgression de b "(i) sur 1 ; X( i) . Sous lhypothse nulle de linarit, Q (m ) suit une loi de Fisher (m + 1) et (n b 2 m 1) dgrs de libert. Estimation des paramtres Pour un nombre de retard p donn, et pour un seuil s x, les estimateurs par moindres carrs ordinaires des coecients autorgressifs sont asymptotiquement normaux comme lont montr Chan et Tong en 1986. Pour chacun des rgimes, on minimise la somme des carrs des rsidus, i.e. dans le cas du modle (20) par exemple X 2 ( i; i) = arg min SC Ri o SC Ri = (Y t i i Xt) ;
t;X t2 tat i 1 0 bi = b et lestimateur de la matrice de variance covariance des coecients estims est alors donne par V 2 o i (X X ) X = (1 ; Xt0)t; Xt 2 tat i et SCRi 2 b o m est le nombre dtat (ici 2 ), i = ni (m + 1)

et ni est le cardinal de ft; Xt 2 tat i g.

Dtection et choix du seuil Hansen a propos, en 1996 dutiliser des moindres carrs squentiels pour estimer le seuil. Nous allons nous placer ici dans le cas dun seuil unique s (modle deux tats ). Pour une valeur du seuil donne, on estime par moindres carrs, pour chacun des rgimes, les coecients (i), pour i = 1; 2 . On value alors la 2 2 1 PT variance rsiduelle du modle seuil, conditionellement cette valeur du seuil : b T ( s) = T " t ( s)) o t=1 (b Ces estimations sont alors faites pour dirents seuils s, et on choisit alors le seuil qui minimise la variance rsiduelle, s = arg min b b2 T (s) :
s

"t ( s) = Yt [( 1 + 1 Xt) IX ts + ( 2 + 2 Xt ) IX t> s] : b

Un intervalle de conance peut galement tre obtenu pour s en utilisant la distribution asymptotique de la statistique du rapport de vraisemblance, et fait intervenir un coecient tabul par Hansen. 2.6.4 Les gnralisations des mo dles ARCH

Considrons un modle linaire usuel, de la forme


0 Y t = Xt + Ut:

Lhypothse faite en conomtrie est que (Ut) est un bruit blanc, cest dire un processus i:i:d: Toutefois, il est possible que le bruit (Ut ) soit autocorrl, cest dire que (Ut) puisse scrire U t = Ut1 + "t o ("t ) est ici i:i:d:. Comme nous lavons vu dans ce chapitre, il est possible que le bruit (Ut ) soit conditionellement htroscdastique, par exemple, modlisable par un processus ARCH (1) dni sous la forme p 2 Ut = t h t o h t = + Ut 1 : Ce pro cessus peut se gnraliser sous la forme GARC H (1 ; 1) suivante p 2 Ut = t ht o ht = + Ut 1 + ht 1 :

Parmi les autres modles possible, on notera les modles ARC H M (ARC H en moyenne, ou ARCH in Mean ), cest dire que le modle linaire scrira ici p 0 Yt = Xt + g ( ht ) + Ut o Ut = t h t avec h t = + Ut2 1 + h t1 : 57

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Ce type de modle a t introduit en 1987 par Engle, Lilien et Robbins. Parmi les modles asymtriques, on notera les modles T ARC H ou E GARC H . Les modles T ARC H (ARC H seuil, ou Threshold ARC H ) ont t introduits par Zakoian en 1994 . Par exemple, le modle T ARCH (1; 1) scrit p 2 2 Ut = t ht o h t = + Ut 1 + Ut 1 Iut <0 + h t1 :
2 Cest dire que limpact de Ut 1 sera de si Ut > 0 , alors quil sera de + sinon. Le modle EGARCH (GARCH exponentiel, ou Exponential GARCH ), introduit par Nelson en 1991 , peut scrire, dans le cas du modle E GARC H (1 ; 1) Ut = p t o log h t = + jUt1 j + log h t1 + Ut1 : ht

Exemple 23 Considrons ici le rendement de lindice N ASDAQ, de janvier 1989 fvrier 2000 : Le graphique cidessous reprsente le logarithme de lvolution de lindice N ASDAQ ainsi que le rendement journalier
9 8 0.10 0.05 0.00 -0.05 -0.10 7 6 5
Variable C AR(1) Coefficient 0.000863 0.105134 Std. Error 0.000231 0.018791 T-Statistic 3.738457 5.594793 Prob . 0.0002 0.0000 0.086119 1.097336 3.013434 3.017668 31.30171 0.000000

R-squared 0.011052 Adjusted R-squared 0.010699 S.E. of regression 0.010932 Sum squared resid 3338.542 Log likelihood -4224.341 Durbin -Watson stat 1.997377 Inverted AR Roots .11 Variable C MA(1) Coefficient 0.000862 0.106483

Mean dependent var S.D. dependent var Akaike info criterion Schwartz criterion F-statistic Prob (F-statistic)

Std. Error 0.000228 0.018791

T-Statistic 3.782551 5.666722

Prob . 0.0002 0.0000 0.086119 1.097336 3.013331 3.017565 31.69207 0.000000

500

1000

1500

2000

2500

RETURN_NASDAQ

LOG_NASDAQ

R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin -Watson stat Inverted MA Roots

0.011184 0.010831 0.010929 3338.198 -4224.196 2.000222 -.11

Mean dependent var S.D. dependent var Akaike info criterion Schwartz criterion F-statistic Prob (F-statistic)

avec, droite, les rsultats dun ajustement respectivement par un modle AR (1) et M A (1) de la srie des rendements. Un tude des rsidus (avec ci-dessous lanalyse des rsidus des modles autorgressif AR (1) gauche et moyenne mobile M A (1) droite)
0.10 0.05 0.00 0.10 0.05 0.00 -0.05 -0.10 500 1000 Residual 1500 Actual 2000 2500 Fitted -0.05 -0.10

0.10 0.05 0.00 0.10 0.05 0.00 -0.05 -0.10 500 1000 Residual 1500 Actual 2000 2500 Fitted -0.05 -0.10

montre que lhypothse de bruit blanc est rejette, mais surtout, les graphiques ci-dessus montrent des priodes de forte volatilit de la srie des rsidus : il semble ncessaire de modliser lerreur par un modle non linaire. Les sorties prsentes ci-dessous montrent les ajustments de modles M A (1) GARC H (1 ; 1) (cest dire un modle M A (1)

58

Sries temporelles : thorie et applications

Arthur CHARPENTIER

dont les erreurs suivent un modle GARC H (1 ; 1)) et ARCH M , respectivement gauche et droite,
Variable C MA(1) C ARCH(1) GARCH(1) Coefficient 0.084907 0.171620 0.027892 0.121770 0.857095 Std. Error T-Statistic 0.017700 4.797124 0.020952 8.190983 VARIANCE EQUATION 0.009213 4.797124 0.020448 5.955103 0.021526 39.81666 Prob . 0.0000 0.0000 0.0000 0.0000 0.0000 Variable SQR(GARCH) MA(1) C ARCH(1) GARCH(1) Coefficient 0.119204 0.174104 0.031291 0.133713 0.843131 Std. Error T-Statistic 0.022944 5.195479 0.020771 8.382098 VARIANCE EQUATION 0.009545 3.278211 0.021011 6.363810 0.021785 38.70279 Prob . 0.0000 0.0000 0.0000 0.0000 0.0000

R-squared 0.007104 Adjusted R-squared 0.005685 S.E. of regression 1.094213 Sum squared resid 3352.444 Log likelihood -3775.938 Durbin-Watson stat 2.129878 Inverted AR Roots -.17

Mean dependent var 0.086119 S.D. dependent var 1.097336 Akaike info criterion 2.695856 Schwartz criterion 2.706443 F- statistic 5.008069 Prob(F- statistic ) 0.000000

R-squared 0.010861 Adjusted R-squared 0.009448 S.E. of regression 1.092141 Sum squared resid 3339.759 Log likelihood -3339.759 Durbin-Watson stat 2.132844 Inverted AR Roots -.17

Mean dependent var 0.086119 S.D. dependent var 1.097336 Akaike info criterion 2.694578 Schwartz criterion 2.705165

Exemple 24 Considrons ici la srie du rendement de lindice SP 500 , reprsent ci-dessous. La sortie prsente droite est lajustement dun modle AR (3),
0.6

0.4 0.2 0.0

LS // Dependent Variable is SP500 Sample: 4 792 Included observations: 789 after adjusting endpoints Convergence achieved after 2 iterations Variable C AR(1) AR(3) Coefficient 0.006262 0.086019 -0.125241 Std. Error 0.001983 0.035303 0.035302 T-Statistic 3.158517 2.436595 -3.547748 Prob. 0.0016 0.0150 0.0004

-0.2 -0.4 100 200 300 400 SP500 500 600 700

R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Inverted AR Roots

0.023610 0.021126 0.057872 2.632480 1130.228 1.979390 .28+.43i

Mean dependent var 0.006269 S.D. dependent var 0.058494 Akaike info criterion -5.695235 Schwartz criterion -5.677476 F-statistic 9.503281 Prob (F-statistic) 0.000084 .28 -.43i -.47

Les sorties ci-aprs corresondent lajustement de modles AR (3) GARC H (1 ; 1), GARCH (1; 1), IGARCH (1 ; 1), GARCH (1; 1) M ,

2.7

Les tests de linarit

Avant de construire un modle non-linaire, il est recommander de vrier quun modle linaire ne sut modliser correctement la srie. Il peut arriver (surtout si les sries temporelles sont courtes ) que lon estime - avec succs - un modle non-linaire alors que la vraie relation sous-jacente est linaire. Le danger est alors de compliquer inutilement la construction du modle Tester la linarit peut alors aider ne pas compliquer outrance, mais cela peut, en outre, aider pour la spciction du type de non-linarit. Deux types de tests sont alors utiliss : - les tests contre un modle non-linaire spcique (comme les tests du multiplicateur de Lagrange et le test du Cusum ) - les tests sans alternative spcique (tels que le BDS ou le Reset ) 2.7.1 Les tests du multiplicateur de Lagrange

Puisque lestimation de modles non-linaires est en gnral plus dicile que celle des modles linaires, il est naturel de considrer des tests qui, bien quavec des alternatives non-linaires spciques, ne requirent pas lestimation de ces alternatives. Cest cette catgorie quappartiennent les tests du multiplicateur de Lagrange. Nous disposons ainsi de quatre tests de ce type, chacun testant un type de non-linarit: ARCH , BL, E XP AR et SE T AR. AR(p ) contre AR( p) erreurs ARC H( q ) Dans ce type de tests, on considre un processus ("t ) bruit blanc gaussien, cest dire i:i:d: dont la loi est N 0 ; 2 . Les hypothses sont alors v u p p q X X X u t ( H0 ) : Xt = + iXt i + "t contre (H1 ) : Xt = + i Xti + 0 + j "2 t j :
i =1 i =1 j =1

59

Sries temporelles : thorie et applications

Arthur CHARPENTIER

On estime le modle (H0 ) par moindres carrs, et on calcule les rsidus b "t obtenus. On estime alors par les moindres carrs la rgression P 2 q X t 2 2 P b "2 = + b " + avec R = 1 : 0 j t tj t (b "t ")
j= 1

La statistique du multiplicateur de Lagrange est alors asymptotiquement quivalente T R2 . Si lon pose LM 0 = T R2 alors, sous ( H0 ), LM0 est asymptotiquement distribue comme un chi-deux q degrs de liberts.

AR BL (p; 0; P; Q ) On considre un processus ("t ) bruit blanc gaussien, cest dire i:i:d: dont la loi est ( p) contre N 0 ; 2 . Les hypothses sont alors (H0 ) : Xt = +
p X i =1

iXti + "t contre (H1 ) : Xt = +

p X i =1

i Xti + "t +

Q P X X

i= 1 j = 1

i;j Xti"t j :

L encore, on estime le modle (H0 ) par moindre carrs, ainsi que b 2 , estimateur de 2 . La statistique du test du multplicateur de Lagrange est o LM1 = b
2

et

hX
0

b0;t = (1 ; Xt1 ; :::; Xtp ) z z1;t = (b b " t1 Xt1 ; :::; b "t 1 XtP ; b "t2 Xt1 ; :::; b "t 2 XtP ; :::; b "tQ Xt 1 ; :::; b "tQ XtP ) ;
0 pour i = 0 ; 1 cii = P z M bi;t b zi;t P c c M01 = M 10 = z b1 ;tz b0 0;t .

z1;t b b "t

i0 h

c11 M c10 M c 1 M c01 M 00

i hX

i z1; tb b "t ;

Il est possible de montrer que sous (H0 ), LM0 est asymptotiquement distribue comme un chi-deux P Q degrs de liberts. AR E XP AR (p) On considre un processus (" t) bruit blanc gaussien, cest dire i:i:d: dont la loi est ( p) contre N 0 ; 2 . Les hypothses sont alors (H0 ) : Xt = +
p X i =1

iXti + "t contre (H1 ) : Xt = +

p X i= 1

i + i exp Xt2 Xti + "t: 1

De faon quivalente lhypothse alternative peut scrire


(H1 ) : Xt = + p X i =1

i Xti +

p X i=1

2 iXti Xt 1 + "t :

L encore, la statistique du test du multplicateur de Lagrange est LM2 = b 2 hX z1;t b b "t


0

i0 h

c11 M c10 M c 1 M c01 M 00 et

i hX

Il est possible de montrer que sous (H0 ), LM 0 est asymptotiquement distribue comme un chi-deux p degrs de liberts. 2.7.2 Le test du CU SUM

z b0;t = ( 1 ; Xt 1 ; :::; Xtp ) 3 2 2 z b1;t = Xt 1 ; Xt 2Xt 1 ; :::; Xtp Xt1

P 0 cii = M z bi;t b zi;t pour i = 0; 1 P 0 c01 = M c10 = M z1; tz b b0 ;t .

i z1; tb b "t ;

Le test du C USU M permet de dtecter lexistence de rgimes ou de seuils. Il consiste reclasser les observations suivant les variables de transition. On estime alors les paramtres de manire rcursive et on considre les sommes cumules des rsidus obtenus.

60

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Par exemple, dans le cas dun modle SET AR, on suppose que lon connait le dlai d, et que lon dispose des observations Xd +1 ; :::; X0 ; ::::; XT . On ordonne les observations X1 ; :::; Xn selon les valeurs de X1 d ; ::::; Xtd . Soient T T X(1) ; :::; X( T ) les observations ainsi rordonnes. Pour tout j , on considre le modle linaire suivant
T X( i) = j + p X T j k X(i )k + "(j ) pour tout i j:

k =1

Lhypothse (H0 ) est alors j = , 2.7.3 Le test BDS

j k

= k pour tout k, et lhypothse alternative (H1 ) est que (H0 ) nest pas vrie.

Ce test permet de dtecter un bruit blanc indpendant, cest--dire si les observations sont (ou non ) indpendantes, partir de ltude de la dimension de corrlation ( notion issue de la thorie du chaos ). Remarque 13 Cette notion, introduite par Grassgerber et Procaccia en 1983 est trs lie la thorie des fractales et la dimension de capacit. Lide de base est la suivante : plus un ensemble est de dimension leve, plus rapidement le nombre de voisins dun point donn de cet ensemble augmentera avec la distance ce point. Encore faut-il pouvoir valuer le nombre de voisins. Dans ce but, nous introduisons lintgrale de corrlation, dnie comme la probabilit de trouver une paire de points distants de moins dun certain rayon r (donn priori) dans un espace dimmersion m -dimensionnel. A partir dune srie temporelle, on commence donc par former des m -uples. Si lon dispose de N observations, lintgrale de corrlation sera donne par Cn;N (r ) =
N N X X 1 (r d ( i; j )) ; N (N 1) i= 1 j =1 ;j 6=i

o d(i; ; j ) est la distance entre les points i et j et (k) est la fonction de Heaviside (ou fonction signe) qui, par dnition, vaut 1 si k 0 et 0 dans le cas contraire. Ceci revient donc compter, dans un espace dimmersion, le nombre de voisins dun point quelconque distants de moins de r. En principe, d( i; ; j ) est la distance euclidienne usuelle, mais on prend en gnral la norme-sup (ou norme de Takens) pour distance. Cette dernire est dnie comme la plus grande des dirences (en valeur absolue) entre deux coordonnes quivalentes de 2 vecteurs. Quand N ! 1 , on pose alors Cm;N ( r) ! Cm ( r) = r m . Lexposant m ainsi dnit sera la dimension de corrlation dans limmersion m, dont lestimateur naturel est d log ( Cm ( r)) m = lim b : r! 0 d log r A partir de cette notion, il est ais de mettre en place le test BDS de non-linarit. Ce test peut tre interprt comme un test de non linarit : il sut en eet destimer le modle linaire retenu et de calculer les rsidus obtenus. On applique ensuite le BDS ces rsidus; si ce test rvle que les rsidus sont indpendants et identiquement distribus, alors lhypothse de linarit est accepte. Dans le cas contraire, la srie est soit stochastique non-linaire, soit chaotique. m Soit le vecteur m -historique Xt = (Xt ; Xt+ 1 ; :::; Xt+ m1 ) , et T m = n m + 1 le nombre de vecteurs m-historiques pour la srie (Xt) avec n observations. On dsigne par I" (:) la fonction indicatrice de [0 ; "], o " est une constante positive pralablement choisie. On pose alors X 2 m m Cn;m (" ) = I" (k Xt Xs k1 ) ; T m (T m 1) t<s et on a, sous lhypothse o les (Xt ) sont indpendants et identiquement distribus h im lim C n;m (") = lim C n;1 ( ") :
n !1 n !1

Remarque 14 Cette proprit peut tre illustre simplement dans le cas o m = 2 : Cn;2 (") correspond la frquence des observations plus proches voisins dans le plan (Xt 1; Xt ) tandis que C1 ;n ( ") mesure toujours la proportion de points de la srie distants de moins de " de moins de " de leur valeur la date prcdante. Dans le cas dune srie indpendante, on voit que lon considre une surface lmentaire, et que lon double la longueur des cts ( C1 ;n est alors multipli par 2 ), le nombre de points contenu dans la surface est alors multipli par 4 ( cause de la rpartition purement alatoire des points dans le plan). En revanche, avec une srie non-indpendante, le nombre de points nest plus multipli par 4 lorsque la surface lmentaire voit ses cts doubls : Cn;1 (") est bien multpli par 2 mais C n; 2 (") nest pas multipli par 4 . 61

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Compte tenu de cette remarque, on dnit la statistique BDS par BDS = avec p C n;m (") C n; 1 (") n ; m (")

et

v u m 1 u X 2 m (") = 2 tK m + 2 K mj C 2j + (m 1) C 2m m2 K C 2m 2 ;
j =1

C = C n;1 (") et K =

X 1 I" (jXt Xs j) I" (jXr Xs j) ; n (n 1) ( n 2)


( t;r;s)

o la sommeseectue sur les (r; s; t) distincts deux deux. Sous (H0 ) : (Xt ) est i:i:d: la statistique BDS est asymptotiquement normale, centre et rduite. 2.7.4 Le test RE SET (Regression error specication test )

On estime ici les paramtres du mo dle linaire (H0 ) : Xt = +


p X i =1

i Xti + "t ,

Pp bt = b et on calcule les rsidus obtenus b " t, les valeurs ajustes X + i=1 b iXti = Xt b "t et la somme des carrs des P 2 rsidus SC R0 = b "t . On estime alors, par la mthode des moindres carrs, les paramtres de P b "t = b 0 +
p X i =1

bi Xti +

h X j =1

et on calcule SC R1 =

b2 t . La statistique de test est RE SE T =

bj + ; jX t t

[SCR0 SC R1 ] = ( h 1) ; SC R1 = (n p h )

qui suit sous (H0 ) (hypothse de modle AR (p )) un loi de Fisher F ( h 1; n p h ). En fait, le test du RESE T peut tre interprt comme un test du multiplicateur de Lagrange. 2.7.5 La procdure AU T ORE G sous SAS=E T S

La syntaxe de la procdure AUT OREG est la suivante PROC AUTOREG options; BY variables; MODEL dependent = regressors / options; HETERO variables/options; RESTRICT equation,...,equation; TESTequation,...,equation / option; OUTPUT OUT=SAS data set options; Estimation de modles GARCH ( p; q ) Le modle que nous souhaitons tester est de la forme suivante : Y t jY t1 ; Y t2 ; ::: s N (0 ; ht ) o h t = ! +
q X i =1

i Yt2 i

p X

j =1

j h tj ;

o h t est alors appele variance conditionelle . Le modle ARC H (q ) est obtenu quand p = 0 . Lestimation sous SAS se fait par maximum de vraissemblance, sous lhypothse o le processus ( t) est normalement distribu (centr rduit )

62

Sries temporelles : thorie et applications

Arthur CHARPENTIER

La dclaration M ODE L Pour les modles GARC H : - GARCH =(option-list) : spcie la forme du modle GARC H , par exemple, pour un modle GARCH (1 ; 1) linstruction sera MODEL y=x1 x2 / GARCH=(q=1,p=1); Toute la classe des modles gnralisant les modles GARC H sont dailleurs obtenus laide de linstruction TYPE= : modles E GARC H ( GARC H exponentiel ), IGARCH (GARC H intgr), sans contraintes de non-ngativit, contrainte de stationnarit... - DIST=T ou DIST=NORMAL : spcie la distribution du terme derreur : soit une loi normale, soit une loi de Student, Pour les tests statistiques - ARCHTEST : cette option permet dobtenir les statistiques Q et LM permettant de tester labsence deet ARC H , - CHOW =(obs1,...obsn ) : met en place les tests de Chow an de tester la stabilit des coecients de rgression, - COVEST =OPjHESSIANjQML : cette option spcie le type de matrice de covariance pour le modle GARCH . OP signie que la matrice produit est utilis la matrice, HESSIAN signie que la matrice Hessienne est utilise pour calculer la matrice de covariance, et QML signie que la mthode retenue est base sur du quasi maximum de vraissemblance, - DW =n : met en place le test de Durbin Watson lordre n (par dfaut gal 1 ). Linstruction DWPROB donne la p -value du test. - GODFREY =r : met en place le test du multiplicateur de Lagrange, avec comme hypothse alternative des erreurs ARM A, - RESET : met en place le test RE SE T , avec p valant 2 , 3 ou 4, - STATIONNARITY =(PHILLIPS) : met en place le test de Phillips-Perron, test de stationnarit du modle La dclaration OUP UT Un certain nombre doutput peuvent tre imprims, laide des instructions CEV= variable ou - HT= variable. Linstruction CEV= option permet dobtenir, en sortie, la table de la variance des erreurs du modle htroscdastique (spci dans linstruction HETERO ou la valeur de la variance de lerreur conditionel le ht de la dclaration GARCH= option dans linstruction MODEL) Parmi les tests possible, on notera les instructions CUSUM et CUSUMSQ, dont les intervalles de conance (haut et bas) peuvent tre obtenus laide des instructions CUSUMUB= variable, CUSUMUB= option, CUSUMLB= variable, CUSUMLB= option , CUSUMSQUB= variable, CUSUMSQUB= option ou encore CUSUMSQLB= option. Etimation dun modle ARCH (p) sous SAS Lexemple ci-dessous ( tir de Box et Jenkins (1976) page 527) correspond au cours de laction IBM , entre le 29 juin 1959 et le 30 juin 1960 . Le rendement ( journalier ) de ce titre est la variable r, reprsent ci-dessous,

Le modle que nous souhaitons tester est de la forme suivante :


2 ARCH (2) : Yt jYt 1 ; Yt 2 ; ::: s N (0; h t) o ht = ! + 1 Y t2 1 + 2 Y t2 :

An de tester ce modle, les instructions sont les suivantes proc AUTOREG data=IBM; model r=/noint GARCH=(Q=2); output out=a cev=v; 63

Sries temporelles : thorie et applications

Arthur CHARPENTIER

et la sortie SAS (estimation des paramtres et tests statistiques ) est alors


Autoreg Procedure Dependent Variable = R Ordinary Least Squares Estimates SSE 0.032143 MSE 0.000127 SBC -1558.8 Reg Rsq 0.0000 Durbin-Watson 2.1377 DFE Root MSE AIC Total Rsq 254 0.011249 -1558.8 0.0000

NOTE: No intercept term is used. R-squares are redefined. GARCH Estimates SSE MSE Log L SBC Normality Test Variable ARCH0 ARCH1 ARCH2 DF 1 1 1 0.032143 0.000127 781.0174 -1545.42 105.8557 B Value 0.000112 0.041348 0.069749 OBS 254 UVAR 0.000126 Total Rsq 0.0000 AIC -1556.03 Prob >Chi-Sq 0.0001 Std Error 7.561E-6 0.0511 0.0432 t Ratio Approx Prob 14.851 0.810 1.616 0.0001 0.4181 0.1062

cest die que ! b; b 1 et b 2 valent respectivement 0 :00011 , 0 :04136 et 0:06976. Les coecients donns sont, pour lestimation par moindre carrs : - SSE : (Sum of Square Errors) - M SE : (Mean Square Error) - SBC : critre de Schwarz dni par SBC = 2 ln L + K ln N , o L est la vraissemblance, N le nombre dobservations et K le nombre de paramtres estims. - Regress R-square : donn par T SSE R2 ; REG = 1 T SST o T SST est la somme des carrs ... - DW : statistique de Durbin-Watson - DF E : (Error Degrees of Freedom) the number of observations minus the number of parameters - Root M SE : (Root Mean Square Error) - AIC : critre dAkaike dni par AIC = 2 ln L + 2 K , o L est la vraissemblance et K le nombre de paramtres estims. - Total R-square : donn par SSE R2 ; T OT = 1 SST Et pour lestimation des paramtres GARCH - Log Likelihood : valeur de la log-vraissemblance (sous hypothse de normalit des rsidus ) - Normal Test :test de Bera et Jarque (1982) bas sur lutilisation du skewness et de la kurtosis (qui doivent tre proches respectivement de 0 et de 3 dans le cas normal ) - Observations : nombre dobservations utilises - Uncond Var : variance non-conditionelle - Total R-square : - Pr>ChiSq : p -value associe au test de normalit SAS renvoie galement la sortie graphique suivante, correspondant la variance conditionelle

64

Sries temporelles : thorie et applications

Arthur CHARPENTIER

ainsi que la prvision.

2.8
2.8.1

Application sur des donnes relles


Modlisation GARCH du C AC 40

Prsentation de la srie et analyse prliminaire Considrons la srie du CAC 40 , observe du 2 janvier 1990 au 20 septembre 1996 ( soit un peu plus de 1750 observations )
2400 2200
160

2000 1800

120

Series: FRCAC40 Sample 1/02/90 9/20/96 Observations 1754 Mean Median Maximum Minimum Std. Dev. Skewness Kurtosis Jarque-Bera Probability 1915.304 1916.445 2355.930 1441.170 162.8632 -0.078139 2.917500 2.282331 0.319447

80

1600

40

1400 1/02/90

12/03/91

11/02/93 FRCAC40

10/03/95

1500 1600 1700 1800 1900 2000 2100 2200 2300

Comme le suggre lautocorrlogramme ci-dessous, ainsi que le processus moyenne glissante (avec quipondration, 10 jours (soit 21 jours) ), cette srie nest pas stationnaire
2400 2200

2000 1800 1600

1400 1/02/90

12/03/91

11/02/93 MOYENNE_CAC

10/03/95

Pour stationnariser la srie, considrons la srie direncie, correspondant la variation de lindice C AC 40 sur une journe (en points )
150 100 50 0 -50 -100 -150 1/02/90
500 400 Series: D_FRCAC40 Sample 1/02/90 9/20/96 Observations 1754 Mean Median Maximum Minimum Std. Dev. Skewness Kurtosis Jarque-Bera Probability 0 0.044686 0.000000 102.7000 -132.7700 20.50039 -0.144215 4.957569 286.1407 0.000000

300 200 100

12/03/91

11/02/93 D_FRCAC40

10/03/95

-120

-80

-40

40

80

65

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Cette transformation semble stationnariser la srie au second ordre, comme le laissent penser les graphiques cidessous,
150 100 50 0 -50 -100 -150 1/02/90

12/03/91

11/02/93 MOYENNE_DCAC

10/03/95

Si la srie initiale du C AC 40 prsentait - a priori - une racine unit, comme cela peut se voir sur le scatterplot cidessous gauche, on peu noter que la srie direncie une fois est elle stationnaire (la corrlation entre deux dates 1 jour et 5 jours ci-dessous - est dailleurs trs faible ),
2400 2200

150 100 50 0 -50 -100 -150


1400 1600 1800 2000 2200 2400

150 100 50 0 -50 -100 -150

D_FRCAC40

FRCAC40

2000 1800

1600 1400

-150

-100

-50

50

100

150

D_FRCAC40

-150

-100

-50

50

100

150

FRCAC40_1

D_FRCAC40_1

D_FRCAC40_1

Tests de non-linarit An de dterminer le type de modlisation adopter, un certain nombre de tests simples de non-linarit peuvent tre utiliss : multiplicateur de Lagrange et RE SET . Quel que soit le test, on peut noter une forte non-linarit de la srie (cela peut toutefois tre d la nature particulire des tests eectus, postulant une forme AR (1) comme hypothse alternative ) : Test LM (AR contre ARC H ) LM (AR contre BL) LM (AR contre EXP AR ) RE SET Valeur de la statistique 206:6051 9 :236277 39 :06230 8 :876685 p -value 0 :00000 0 :00237 0 :00000 0 :00293 Linaire non non non non

Ltude des autocorrlogrammes de la srie des variations et de la srie au carr semblent conrmer ce phnomne : si les autocorrlogrammes de la srie nindiquent pas de corrlations importantes (laissant penser que la srie pourrait tre un bruit blanc ), des autocorrlations non-nulles apparaissent en considrant la srie dnie comme le carr de la

66

Sries temporelles : thorie et applications

Arthur CHARPENTIER

variation du CAC 40 ,
150 100 50 0 -50 -100 -150 1/02/90

12/03/91

11/02/93 D_FRCAC40

10/03/95

20000

15000

10000

5000

0 1/02/90

12/03/91

11/02/93 D_FRCAC40_C

10/03/95

Ces rsultats incitent adapter une modlisation de type ARC H=GARC H et non pas ARIM A. Mo dlisation ARC H GARC H de la variation du C AC 40 Le critre dAkaike incite retenir un modle ARC H (1). Il pourrait tre galement intressant de considrer des modles GARC H (2 ; 1) ou ARM A ( titre de comparaison ). Nous noterons dans la suite Xt la srie correspondant la variaiton de lindice C AC 40. Modle ARCH (1) - avec erreurs conditionnellement normales Le modle est de la forme 2 Xt jXt1 s N 0 ; 2 o 2 t t = 398 :6559 + 0 : 1488 Xt2 :

Considrons la srie des rsidus standardiss (la srie des rsidus concidant avec la srie des variations ellemme ). Modle GARC H (2 ; 1) [A INSERER] Modle ARM A [A INSERER] 2.8.2 Modlisation des rendements du cours Intel : modle ARCH

[A INSERER]

67

Sries temporelles : thorie et applications

Arthur CHARPENTIER

2.8.3

Modlisation des rendements de lindice S &P : modle GARC H

Considrons la srie du rendement mensuel de lindice SP 500 , depuis 1926 ( soit de lordre de 800 observations ),
.5 .4 .3 .2 .1 .0 -.1 -.2 -.3 -.4 1930 1940 1950 1960 S P 50 0 1970 1980 1990

Au vu de lautocorrlogramme prsent ci-dessus, il est possible de modliser ce processus soit par un AR (3) , soit par un M A (3) (voire un ARM A (3 ; 3) )
Dependent Variable: SP500 Method: Least Squares Date: 05/28/03 Time: 10:04 Sample: 1926:01 1991:12 Included observations: 792 Convergence achieved after 5 iterations Backcast: 1925:10 1925:12 Variable C MA(1) MA(3) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Coefficient 0.006161 0.094167 -0.141599 0.026877 0.024410 0.057741 2.630535 1136.321 1.995371 Std. Error 0.001955 0.035150 0.035173 t-Statistic 3.151074 2.678963 -4.025809 Prob. 0.0017 0.0075 0.0001 0.006143 0.058459 -2.861921 -2.844215 10.89573 0.000021

Dependent Variable: SP500 Method: Least Squares Date: 05/28/03 Time: 09:59 Sample(adjusted): 1926:04 1991:12 Included observations: 789 after adjusting endpoints Convergence achieved after 3 iterations Variable C AR(1) AR(3) R-squared Adjusted R -squared S.E. of regression Sum squared resid Log likelihood Durbin -Watson stat Inverted AR Roots Coefficient 0.006262 0.086019 -0.125241 0.023610 0.021126 0.057872 2.632480 1130.228 1.979390 .28 -.43i Std. Error 0.001983 0.035303 0.035302 t -Statistic 3.158519 2.436595 -3.547748 Prob. 0.0016 0.0150 0.0004 0.006269 0.058494 -2.857358 -2.839599 9.503281 0.000084

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F -statistic) .28+.43i -.47

i.e.

Xt = 0 :006 + "t + 0 :094"t 1 0 :141 "t 3 Xt = 0 :006 + 0:088 Xt1 0:123 Xt2 + t : Toutefois, si lon regarde par exemple lautocorrlogramme de la srie 2 t , ci-dessous droite, on peut constater que ( t ) nest pas un bruit blanc,
Dependent Variable: RESID_AR3 Method: ML - ARCH (Marquardt) Date: 05/28/03 Time: 10:17 Sample(adjusted): 1926:04 1991:12 Included observations: 789 after adjusting endpoints Convergence achieved after 14 iterations Variance backcast: ON Coefficient C ARCH(1) GARCH(1) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood 7.97E-05 0.113723 0.862719 0.000000 -0.002545 0.057872 2.632480 1261.407 Std. Error 2.42E-05 0.020449 0.020530 z-Statistic 3.289844 5.561203 42.02175 Prob. 0.0010 0.0000 0.0000 7.05E-14 0.057799 -3.189878 -3.172118 1.979390 Variance Equation

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat

Il est alors possible de tester un modle AR (3) GARCH (1; 1) [A INSERER]

68

Sries temporelles : thorie et applications

Arthur CHARPENTIER

2.8.4

Modlisation des rendements de laction IBM (avec dividendes) : modle T AR

Considrons la srie des rendements journaliers de laction IBM ,de juillet 62 dcembre 99
20

10 0

-10 -20

-30 2500 5000 IB M 7500

[A INSERER] 2.8.5 Modlisation du taux de chmage aux Etats Unis : modles T AR et ARCH

Considrons la srie du taux de chmage dsaisonnalis en donnes trimestrielles1 0 aux Etats-Unis, de 1948 1993 ,
11 10 9 8 7 6 5 4 3 2 50 55 60 65 70 75 80 85 90

11 10 9 8 7 6 5 4 3 2 50 55 60 65 70 75 80 85 90

Comme le montre le graphique de droite, cette srie prsente des phases cycliques, avec de lentes variations, suivies de trs fortes variations, laissant penser que les comportements la hausse et la baisse sont sensiblement dirents. Ce type de constatation empirique pousse tester un modle T AR Lutilisation de modles T AR sur des donnes macroconomiques a t conrme, par exemple pour modliser le P IB amricain, dnas A Nonlinear Approach to US GNP par Potter en 1995.
1 0 Cette srie est tudie dans Montgomery, Zarnowitz, Tsay et Tiao (1998) , Forecasting the U.S. Unemployment Rate , dans Journal of the American Statistical Association.

69

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Mo dle linaire ARIM A Lautocorrlogramme ( ou uniquement une analyse graphique de la srie ), tendent rejeter lhypothse de stationnarit de la srie, ainsi que le test de Phillips Perron
Null Hypothesis: X has a unit root Exogenous: Constant, Linear Trend Bandwidth: 2 (Newey-West using Bartlett kernel) Adj. t-Stat Phillips -Perron test statistic Test critical values: 1% level 5% level 10% level *MacKinnon (1996) one -sided p -values.
Null Hypothesis: D(X) has a unit root Exogenous: Constant, Linear Trend Bandwidth: 17 (Newey-West using Bartlett kernel) Adj. t -Stat Phillips-Perron test statistic Test critical values: 1% level 5% level 10% level *MacKinnon (1996) one -sided p-values. -4.778448 -4.012296 -3.436163 -3.142175 Prob.* 0.0007

Prob.* 0.1407

-2.980680 -4.011977 -3.436009 -3.142085

Cette prsence de racine unit correspond au phnomne conomique appel prsence deets dhystrsis du taux de chmage . Le test de Dickey Fuller (avec constante et tendance ) rejette en revanche lhypothse de prsence de racine unit.
Null Hypothesis: X has a unit root Exogenous: Constant, Linear Trend Lag Length: 1 (Automatic based on SIC, MAXLAG=13) t-Statistic Augmented Dickey-Fuller test statistic Test critical values: 1% level 5% level 10% level *MacKinnon (1996) one-sided p-values. -4.745048 -4.012296 -3.436163 -3.142175 Prob.* 0.0008

Null Hypothesis: DX has a unit root Exogenous: Constant Lag Length: 1 (Automatic based on SIC, MAXLAG=13) t-Statistic Augmented Dickey-Fuller test statistic Test critical values: 1% level 5% level 10% level *MacKinnon (1996) one-sided p-values. -7.087081 -3.468749 -2.878311 -2.575791 Prob.* 0.0000

La srie direncie une fois semblant stationnaire, il est alors possible de tester un modle ARM A, en particulier des modles AR (p ),
1.0 0.5 0.0 -0.5 -1.0 -1.5 -2.0 50 55 60 65 70 75 80 85 90

70

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Les sorties suivantes correspondent lestimation de modles AR (2) - les deux premires autocorrlations partielles tant clairement signicatives - et AR (4) - la srie tant trimestrielle, il convient de tester une saisonnalit
Dependent Variable: DX Method: Least Squares Date: 06/04/03 Time: 07:53 Sample(adjusted): 1948:3 1991:1 Included observations: 171 after adjusting endpoints Convergence achieved after 3 iterations Variable AR(1) AR(2) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Inverted AR Roots Coefficient 0.790459 -0.245083 0.437927 0.434601 0.330531 18.46335 -52.32612 .40+.30i Std. Error 0.074567 0.074975 t-Statistic 10.60065 -3.268889 Prob. 0.0000 0.0013 -0.017930 0.439577 0.635393 0.672138 2.078329

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat .40 -.30i

Dependent Variable: DX Method: Least Squares Date: 06/04/03 Time: 07:51 Sample(adjusted): 1949:1 1991:1 Included observations: 169 after adjusting endpoints Convergence achieved after 3 iterations Variable Coefficient Std. Error t-Statistic AR(1) AR(2) AR(4) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Inverted AR Roots 0.735183 -0.171892 -0.161908 0.469192 0.462797 0.320760 17.07926 -46.12376 .64 -.45i 0.075316 0.078142 0.060665 9.761291 -2.199747 -2.668864

Prob. 0.0000 0.0292 0.0084 -0.012817 0.437634 0.581346 0.636907 2.033721 -.27 -.43i

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat .64+.45i -.27+.43i

On peut noter que, dans les deux cas, lhypothse de bruit blanc des rsidus doit tre rejete. Un modlisation laide dun modle ARM A (4 ; 4) sur la srie direncie donne
Dependent Variable: DX Method: Least Squares Date: 06/04/03 Time: 07:58 Sample(adjusted): 1949:1 1991:1 Included observations: 169 after adjusting endpoints Convergence achieved after 36 iterations Backcast: 1948:1 1948:4 Variable AR(1) AR(2) AR(3) AR(4) MA(1) MA(2) MA(3) MA(4) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Inverted AR Roots Inverted MA Roots Coefficient 1.297687 -0.993817 0.760099 -0.229478 -0.600397 0.560191 -0.500735 -0.377559 0.544289 0.524475 0.301785 14.66296 -33.23409 .79 .97 Std. Error 0.163808 0.256960 0.226467 0.130645 0.160056 0.175028 0.158612 0.141700 t-Statistic 7.922013 -3.867598 3.356336 -1.756506 -3.751166 3.200575 -3.156981 -2.664495 Prob. 0.0000 0.0002 0.0010 0.0809 0.0002 0.0017 0.0019 0.0085 -0.012817 0.437634 0.487977 0.636138 2.031076 .01+.77i -.42

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat .49 .02 -.97i .01 -.77i .02+.97i

Lhypothse de bruit blanc des rsidus semble ici valide. Une modlisation ARM A (ici AR (2) la vue du corrlogramme ) de la srie brute (Xt ) - et non plus (1 L) Xt -

71

Sries temporelles : thorie et applications

Arthur CHARPENTIER

donne
Dependent Variable: X Method: Least Squares Date: 06/04/03 Time: 08:05 Sample(adjusted): 1948:3 1991:2 Included observations: 172 after adjusting endpoints Convergence achieved after 3 iterations Variable C AR(1) AR(2) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin -Watson stat Inverted AR Roots Coefficient 5.801028 1.602622 -0.662140 0.960964 0.960502 0.326525 18.01853 -50.03334 1.761995 .80 -.14i Std. Error 0.420081 0.057652 0.057465 t-Statistic 13.80931 27.79812 -11.52241 Prob. 0.0000 0.0000 0.0000 5.689140 1.642964 0.616667 0.671565 2080.160 0.000000

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) .80+.14i

o l encore, lhypothse de bruit blanc des rsidus est encore rejete. Mo dle deux niveaux : modle T AR Comme nous lavions not empiriquement, il existe un comporetement dirent, suivant que le taux de chmage monte ou baisse, i.e. si la variation du taux est positive ou ngative. Il conviendrait donc dessayer un modle T AR sur Y t = (1 L) Xt, avec comme seuil 0 . Nous allons tester ici des modles deux retards, de la forme + 1 Y t1 + 2 Y t2 si Yt 2 0 Yt = + 1 Yt 1 + 2 Y t2 si Yt 2 > 0 En testant le modle AR (2) sous la contrainte Y t2 0, on obtient que [A INSERER] Mo dle ARM A avec erreurs ARCH Dans les modles ARM A tests ci-dessus, on peut noter quun test de prsence deet ARCH sur les rsidus est valide chaque fois (AR (4) et ARM A (4 ; 4) respectivement )
ARCH Test: F-statistic Obs*R-squared 10.09410 9.630129 Probability Probability 0.001774 0.001914
ARCH Test: F-statistic Obs*R-squared 14.80236 13.75422 Probability Probability 0.000170 0.000208

Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 06/04/03 Time: 09:20 Sample(adjusted): 1949:2 1991:1 Included observations: 168 after adjusting endpoints Variable C RESID^2(-1) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin -Watson stat Coefficient 0.075393 0.238223 0.057322 0.051643 0.168190 4.695797 62.11120 2.010038 Std. Error 0.015049 0.074981 t-Statistic 5.009880 3.177122 Prob. 0.0000 0.0018 0.099608 0.172709 -0.715610 -0.678419 10.09410 0.001774

Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 06/04/03 Time: 09:21 Sample(adjusted): 1949:2 1991:1 Included observations: 168 after adjusting endpoints Variable C RESID^2( -1) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Coefficient 0.061079 0.285836 0.081870 0.076339 0.145521 3.515287 86.43312 2.079100 Std. Error 0.012965 0.074294 t-Statistic 4.711009 3.847383 Prob. 0.0000 0.0002 0.086026 0.151415 -1.005156 -0.967966 14.80236 0.000170

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F -statistic)

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F -statistic)

[A INSERER]

2.9

Conseils bibliographiques

DROESBEKE,J.J., FICHET,B. & TASSI,P. (1994). Modlisation ARC H : thorie statistique et applications dans le domaine de la nance. Association pour la Statistique et ses Utilisation . Ellipses ENGLE,R. (1995). ARCH : selected readings. Oxford University Press.

GOURIEROUX,C. (1997). Modles htroscdastiques. dans Encyclopdie des Marchs Financiers, Economica GOURIEROUX,C, SCAILLET,O. & SZAFARZ,A.. (1998). Economtrie de la nance : analyses historiques. Economica JOHNSTON,J. (1988). Mthodes Economtriques. Econometrica. 72

Sries temporelles : thorie et applications

Arthur CHARPENTIER

2.10

Complments sur les sries temporelles en nance

On pourra consulter sur ce sujet larticle de Walter (2003) 1900-2000 : un sicle de descriptions statistiques des uctuations boursires ou les alas du modle de marche alatoire en nance , ainsi que les deux ouvrages de Berstein (19) et (19), Against the gods : et . 2.10.1 2.10.2 Introduction historique Complment sur les donnes disponibles

Comme nous lavons vu en introduction, il est possible de travailler par cotation, cest dire en utilisant le prix des titres chaque fois quils sont changs sur le march. Soit N t le nombre de fois o le titre a t chang entre la date 0 et la date t. On observe alors 1 ; 2 ; :::; Nt la suite des cotations, et 1 ; 2 ; :::; N t la suite correspondant au volume chang chaque cotation. Entre la date 0 et la date t il est possible dcrire S t = 0 + ( 1 0) + ( 2 1 ) + ::: + ( Nt Nt 1 ), alors que le volume nal chang est Vt = 1 + 2 + ::: + N t . On suit alors ( St) le processus du cours de lactif, ou processus du prix dchange, (N t ) le processus de comptage correspondant au nombre de transaction et ( t) le processus du nombre de titres changs. Dans ce cours, on sintresse la srie (St ) observe des dates rgulirement espaces (jour, mois... ), au processus de gain (Y t) o Y t = St S0 , ou encore au taux de rentabilit (rt ) o rt = log St log S0 . De faon plus gnrale, il est possible de considrer des rendements sur des prio des , et on tudie alors ( rt; ) o rt; = log S t log St . Le choix du temps

73

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Le niveau du Nil, ses crues et ses tiages sont connus depuis lanne 622. Il sagit l de donnes exceptionnelles, fascinantes, tant pour les hydrologues que pour les statisticiens. Quel est le bon modle pour prdire les crues importantes ou ltiage des annes de scheresse ? Est-ce que les annes d scheresse sont distribues de manire uniforme, au hasard ? Supposons 11 vouloir prdire les crues entre 1107 et 1206 partir des crues observes entre 1007 et 1106. Si lon cherche construire un modle mmoire courte comme en conomie, la prvision devient vite simplement la moyenne du sicle pass, du XI e sicle. Elle ne rend pas bien compte du phnomne rellement observ au XII e sicle. Il faut donc introduire une mmoire longue, mme trs longue, mais la condition dtre capable de le faire avec un nombre restreint de paramtres quil faudra estimer. Il existe plusieurs sortes de modles de ce type donnant dassez bons rsultats. La Bible (Gense 41) dit: Sept annes dabondance vont venir sur la terre dEgypte, mais elles seront suivies de sept annes de famine . Nous ne possdons pas de donnes sur le niveau du Nil lpoque biblique mais sur les donnes connues, on observe de longues priodes dhumidit et de longues priodes de scheresse et non de brves alternances. Un des promoteurs des modles longue mmoire, B. Mandelbrot, a donc appel ce phnomne l eet Joseph . Son nom scientique est leet Hurst. Ce spcialiste dhydrologie a pu montrer en construisant un modle de rservoir qui peut reprsenter le bassin du Nil, que de simples considrations sur les qualits du rservoir, indpendamment de toutes variations du climat, pouvaient expliquer cet eet Joseph. Si lon prend en compte les donnes du Nil sur une priode plus longue, par exemple, sur les cinq sicles allant du V II e au X III e, on peut estimer avec prcision la forme de la mmoire, si lon a une ide du type de modle qui dcrit le rgime du euve. Pour trouver ce modle on utilise la constatation suivante : si lon fait un changement dchelle convenable sur les donnes de 50 annes conscutives, le rsultat a la mme allure que la suite des donnes sur 500 ans. Cette permanence par changement dchelle sappelle lautosimilarit. Elle guide le choix du modle longue mmoire12 . Mais le Nil pose une autre question; il semble quau cours du X e et du XV II e sicle son rgime ait chang, quil y ait eu une rupture du niveau moyen des crues puis de la forme de la mmoire. Et les tests faits partir de modles longue mmoire ont tendance conforter cette hypothse dont le motif physique est mal connu. Le problme des crues du Nil concerne la recherche dun changement de rgime qui a eu lieu il y a plusieurs sicles. Pour cette recherche, si lon se place linstant de cette rupture hypothtique, on dispose dun pass mais aussi dun futur comportant un nombre signicatif de donnes. Il nen est pas ainsi en conomie puisquil ny a pas de futur linstant mme de la rupture hypothtique. En 1992, les pouvoirs publics ont tabl sur 2,4 % de croissance lan, certains instituts de prvision, quant eux, sur 3,4 %. En fait de croissance, on a constat plus de 1% de rcession. LI.N.S.E.E. nest pas en cause. Il utilise des modles danalyse conomtrique dont les paramtres sont estims partir de lobservation dun pass rcent. Les prvisions fournies nont de validit quen faisant lhypothse de stationnarit. Ces analyses ne sont pas faites pour intgrer limprvu lorsquil est structurel, cest--dire lorsquil invalide les modles conomtriques admis jusqualors, lorsquil faut envisager un changement trs probable des paramtres du modle. Aprs quelques mois de ottement, une fois accumules les nouvelles donnes, les modles conomtriques peuvent recommencer donner des prdictions correctes, mais les valeurs de leurs paramtres ont chang. On a eu rupture de modle . De telles ruptures peuvent parfois tre discernes assez rapidement, mais jamais instantanment. Quelques mois sont ncessaires en conomtrie pour admettre, avec une forte probabilit, quil y a eu un changement de modle; une fois cela admis, il ne reste plus qu rebtir le modle de prvision. Dans le cas de lI.N.S.E.E. en 1992, la rapidit na videmment pas t susante pour que les erreurs de prvision naient pas t rcupres par le dbat politique. (Source : Dacunha-Castelle Chemins de lalatoires, le hasard et le risque dans la socit moderne )

1 1 Voir 1 2 Ces

ce sujet: J. Beran, Statistics for long-memory processes, Chapman e t Hall, 1994. modle s autosimilaires dcouverts par Paul Ikvy ont un caractre fractal. Ils ont t populariss par Benot Mandelbrot.

74

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Introduction la notion de mmoire longue

Les processus ARM A sont souvent appel processus mmoire courte compte tenu de la dcroissance rapide de lautocorrlation entre Xt et Xth quand h ! 1 (dcroissance exponentielle de ( h)). En fait, il est possible de montrer que, pour un processus ARM A stationnaire, sa fonction dautocorrlation est borne, j (h )j Cr h pour h = 1; 2 ; ::: pour une certaine constante C > 0 et 0 < r < 1 . Dnition 10 Un processus stationnaire sera dit mmoire longue si les autocorrlations (h ) satisfont (h) s C h2 d1 quand h ! 1 o C est une constante non nulle et d < 1 = 2. Il est possible de faire une distrinction suivant la valeur de d : P - si d < 0 : mmoire intermdiaire, la srie (h ) est absolument convergente j (h )j < 1 : P - si 0 < d < 1 =2 : mmoire longue, la srie (h ) nest plus absolument convergente j (h )j = 1 Ce type de comportement a t mis en vidence ds 1951 sur des donnes hydrologiques, puis conomiques. Le graphique ci-dessous gauche correspond au minimum annuel atteint par le Nil, et droite, son autocorrlogramme,
15 14 13 12 11 10 9

(21)

700

800

900

1000 NILE

1100

1200

Remarque 15 Lexpression (21) dit uniquement la forme asymptotique des autocorrlations, sous forme dun quivalent, mais ne dit en aucun cas que certains retards spciques doivent tre particulirement importants. Remarque 16 Cette condition (21) se rcrit galement ( h) = 1: h!1 C h2 d 1 lim De faon heuristique, une srie mmoire longue est caractrise par une fonction dautocorrlation qui dcrot lentement lors que le retard h augmente. En terme de frquence et de densit spectrale, le spectre de telles sries ont un ple la frquence 0 . Cette proprit est trs frquente sur les donnes conomiques, tel point que Granger avait parl en 1966 de forme spectrale tque dune variable conomique , comme le note Valrie Mignon dans Mthodes destimation de lexposant de Hurst . Historiquement,le premier processus mmoire longue est le mouvement brownien fractionnaire, dvelopp par Mandelbrot et Van Ness en 1968 . Ce processus est caractris par un paramtre appel exposant de Hurst, not H , permettant de classer les sries temporelles en fonction de leur structure de dpendance : mmoire courte ou nulle, mmoire longue et positive (appel phnomne de persistance ), et antipersistance. Les sries empiriques tant des processus en temps discret, Mandelbrot et Wallis ont dni, en 1969 , lanalogue du mouvement brownien fractionnaire en temps discret, appel bruit gaussien fractionnaire. Une seconde classe de modles, lis au bruit gaussien fractionnaire, est constitu des processus ARF IM A (AutoRegressive Fractionnaly Integrated Moving Average ) parfois galement appels F ARIM A: Ceux-ci constituent une gnralisation des processus ARIM A ( p; d; q) standards, dans lesquels le paramtre de direnciation d tait un entier. Le paramtre d explique alors le comportement de long terme de la srie, le comportement de court terme tant expliqu par les composantes autorgressives et moyenne-mobiles. Si ces processus sont trs prsents en conomie (comme le notait Granger ), ils sont galement prsents en nance. En 1991 , Lo a ainsi tudi les implications des processus mmoire longue dans la thorie nancire, et Mignon 75

Sries temporelles : thorie et applications

Arthur CHARPENTIER

a tudi en 1995 limpact de ce comportement sur lecience des marchs. En eet, on dit que les marchs sont ecients (ecient dun point de vue informationel ) si les cours des actifs cts retent toute linformation disponible : il est alors impossible de prvoir les rentabilits futures partir des rentabilits passes puisque toute linformation (anticipe ) est incorpore dans les prix. Mais si les rentabilits ont une structure de dpendance long terme, alors les observations prsentent des autocorrlations signicatives. La connaissance du pass fournit alors de linformation pour prvoir les valeurs futures. En fait, Samuelson a montr en 1965 que si un march est ecient, le prix observ sur le march correspond la valeur fondamentale (cest dire la somme actualis des dividendes futurs anticips par les agents ), et la mmoire longue impliquerait un cart durable entre le cours et la valeur fondamentale. Remarque 17 Si la mmoire longue a t dnie partir de la fonction dautocorrlation, elle peut aussi tre dnie laide de la densit spectrale. Les processus ARM A, exemples classiques de processus mmoire courte, la densit spectrale est positive et nie quand la frquence tend vers 0 . On dira quun processus ( Xt) est mmoire longue sil existe une constante telle que 0 < < 1 et une constante C > 0 telles que lim f (! ) = 1; C !

! !0

o f est la densit spectrale du processus (Xt ) . Ainsi, la densit spectrale prsente un ple la frquence 0 .

3.1

Processus self-similaires

Dnition 11 On dit quil processus est self-similaire , de paramtre de self-similarit H si, pour tout c, le processus (Y ct) la mme distribution que le processus cH Y t , pour tout t 0 Cette classe de processus a t introduite ds 1968 par Mandelbrot, mme si, dun point de vue probabiliste, cette proprit avait t tudie ds 1940 par Kolmogorov.

Exemple 25 En temps continu, le mouvement brownien est un processus self-similaire de paramtre H = 1= 2 . Aussi, dans les modles nanciers de type Black et Scholes, o le rendement est modlis par une quation de la forme dRt = dt + dWt , o (W t) est un mouvement brownien standard, on obtient, en notant R ( ) le rendement sur une p priode , que la distribution de R ( ) = est indpendante du temps : en terme nancier, lordre de grandeur de la rentabilit dun titre nancier pendant une priode est proportionnelle la racine carre de cette p priode. Une des application a t que la volatilit sur 12 mois est gale la volatilit sur 1 mois, multupli par 12 . La plupart de rgles prudentielle imposes pour le contrle des risques repose sur ce genre dapproche permettant dextrapoler le risque long terme partir du risque court terme. Toutefois, il est apparu en pratique, dans les annes 70 que le coecient H tait plutt de lordre de 0:3 . Ces observations ont mis en vidence des phnomnes dits de retour la moyenne des rentabilits, introduisant la notion dhorizon long terme sur les marchs. 3.1.1 Accroissements stationnaires de processus self-similaires

Soit (Y t ) un processus H -self-smilaire, accroissements stationnaires. Posons alors Xt = Y t Y t1 pour t = 1 ; 2; ::: Soit 2 = V (Xt ) : Alors la fonction dautocovariance est donne par (h ) = i 2 h jh + 1 j2 H 2 jhj2H + jh 1 j2 H : 2 (22)

3.2

Processus F ARIM A - ARI MA Fractionnaires

Dans la partie sur les processus ARIM A, nous avions introduit un aspect tendanciel aux processus ARM A en retenant un polynme autorgressif admettant 1 comme racine (ventuellement multiple ). Ceci a conduit considrer les processus crits sous la forme d (1 L) (L) Xt = (L) "t ; o d est un entier positif. Le fait que le paramtre d soit entier pose un certain nombre de problmes, des problmes didentication par exemple, et cest pour cela que d est estim sparment des autres paramtres. Les processus F ARIM A sont une gnralisation o lon considre d a priori quelconque (rel ).

76

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Dnition 12 Un processus fractionnaire est un processus (Xt ), dni pour t 0, satisfaisant une quation de la forme d (1 L ) (L) X t = ( L) "t pour t 0;

avec comme condition initiale Xt = 0 pour t < 0 et "t un bruit blanc pour t 0 , nul sinon, de variance nie 2 , et o (L) et (L) sont deux polynmes ayant leurs racines lextrieur du disque unit, et o d est rel, avec la convention 1 X d (d 1) ::: (d j + 1) d j (1 L) = 1 + ( 1) Lj : j!
j =1

La dnition de (1 L) est fonde sur le dveloppement en srie entire de la fonction puissance (qui peut se simplier en introduisant la fonction Gamma ) : soit Z +1 (d) = x d1 exp ( x) dx;
0

alors (1 L) =
d

1 X (d + j ) j L : ( d) :j ! j =0

Proprit 7 Un processus fractionnaire admet une reprsentation moyenne mobile (innie) de la forme Xt = H (L) "t o les coecients h j vrient asymptotiquement hj s (1) j d 1 quand j ! 1 : (1) (d) o H (L) =
1 X j =0

h j Lj ;

Dnition 13 Cette srie est P 2 - asymptotiquement non-stationnaire si hj = +1 ; P 2 - asymptotiquement stationnaire si P h j < +1, et dans ce cas, on dira que - mmoire courte si P jh j j < +1 ; - mmoire longue si jhj j = 1 ;

Proprit 8 Les processus ARM A sont des processus asymptotiquement stationnaires mmoire courte. Compte tenu du comportement asymptotique des hj , on a la proprit suivante, Proprit 9 Le processus fractionnaire est asymptotiquement stationnaire si et seulement si d < 1 =2 . Il est mmoire courte si d 0 et 0 < d < 1= 2 : Remarque 18 Ces processus sont parfois appels processus intgrs dordre d, et not I ( d) . 3.2.1 Processus fractionnaire sans composante AR et M A : processus F ARIM A (0 ; d; 0)
d

Considrons un processus de la forme (1 L) Xt = " t avec d < 1 = 2. ("t ) est ici un bruit blanc, et nous supposerons, dans un premier temps, quil est de variance nie 2 . Exemple 26 Comme nous lavons vu auparavant, les processus ARIM A (0 ; 1; 0) - cest dire la marche alatoire Xt = Xt1 + "t - dans le cas o ("t ) est un bruit blanc gaussien de variance 2 , peuvent tre vus comme des discrtisations du mouvement brownien. De faon analogue, dans le cas o le bruit ("t ) est gaussien, le processus (Xt ) ARF IM A (0 ; d; 0) est rapprocher du mouvement brownien fractionnaire (not F BM - fractional Brownian motion) : un processus (en temps continu) BH ( t) est appel F BM sil est trajectoires continues, telles que BH (t) soit gaussien pour tout t, BH (0) = 0 , E (BH ( t) BH (s)) = 0 pour tout s; t, et cov (BH (t) ; BH (s )) = i 2 h 2H 2H 2H jtj jt sj + jsj ; 2 (23)

pour tout 0 < H < 1 . On peut noter que le cas H = 1= 2 correspond au mouvement brownien. La version discrte dun tel processus est alors appel bruit blanc gaussien fractionnaire (F GN - fractional Gaussian noise). La relation (23) est dailleurs rapprocher de (22). 77

Sries temporelles : thorie et applications

Arthur CHARPENTIER

La fonction dautocovariance (t; h) = cov (Xt; Xt+ h) converge vers (h ) = 2 o 2 est la variance du bruit blanc. Remarque 19 La fonction dautocovariance (t; h ) dpend de t : le processus nest pas stationnaire (mais il est asymptotiquement stationnaire). La vitesse de convergence de lautocorrlogramme vers 0 est donne, pour h grand, par (h ) s 2 h2 d 1 (1 2 d) ou (h ) s d .h 2d 1 quand h ! 1: (d) (1 d) (h + d) (1 2 d) quand t ! 1 ; (h + 1 d) ( d) (1 d)

A titre de comparaison, pour les processus ARM A, nous avions vu que la vitesse de dcroissance tait de la forme exponentielle, cest dire beaucoup plus rapide. Par dfaut, nous considrerons les processus F ARIM A Gaussien, cest dire que le bruit (" t) est suppos tre un processus gaussien. Toutefois, toute une thorie existe pour des processus plus gnraux, non-gaussiens, mais de variance nie, ou alors de variance innie. Ce dernier cas est dailleurs relativement utilis dans la pratique. Parmi ces familles, on peut considrer les distributions de Pareto (cest dire que P ( " > x) s Cx ) de paramtre < 2 , ou les distributions stables (cest dire que leur fonction charactristique est de la forme (t) = E eit" = exp ( jx j ) 13 o est un paramtre dchelle ) de paramtre 1 < 2 (le cas = 2 correspondant au cas gaussien ) . Les processus ARF IM A (0; d; 0) peuvent scrire sous la forme Xt =
+1 X k =0

(k + d) k ( 1) " tk pour d < 1= 2 ; (d) (k + 1)

dont la densit spectrale est donne par fX ( !) = 2 j2 sin (! )j


2d

2 j2! j
2d

Le graphique ci-dessous prsente les tra jectoires de 3 processus F ARIM A, avec d = 0 :9, 0 :7 et 0 :5,
20

10

-10

-20 500 FARIMA5 1000 FARIMA7 1500 FARIMA9 2000

Remarque 20 La densit spectrale de ces processus ARIM A(0; d; 0) vrie la relation suivante ! 2 d f (! ) = 2 sin pour 0 < !; 2 (24)

de telle sorte que le comportement en 0 est donn par

e galementf (! ) = ! 2d quand ! ! 0:

(25)

1 3 De plus amples informations peuvent tre trouves dans Samorodnitsky et Taqqu (1994) Stable non-gaussian processes : stochastic models with innite variance

78

Sries temporelles : thorie et applications

Arthur CHARPENTIER

3.2.2

Autocorrlations des processus ARF IM A

Lcriture des autocorrlations se fait laide de la forme M A du processus, si elle existe. Une autre prossibilit, en utilisant la partie prcdante est dutiliser le paragraphe prcdant et le rsultat suivant, d Hosking (1981) , Proprit 10 Soit Xt un processus ARF IM A (p; d; q ), vriant (1 L)d ( L) Xt = ( L) "t . Les autocorrlations X k du processus Xt peuvent scrire en fonction des autocorrlations des deux processus d Y t = (1 L) Xt : processus ARM A (p; q) 1 Zt = (L) (L) Xt : processus ARF IM A (0 ; d; 0) : Alors X k =
+ 1 X Z Y i k i :

i =1

Z Chacune des processus dautocorrlations Y i et k i pouvant se calculer aisment par des mthodes itratives.

Exemple 27 Considrons les simulations du processus ARF IM A (0 ; d; 0) Xt dnit par (1 L)d Xt = "t o "t est un bruit blanc gaussien. Les graphiques ci-dessous reprsentent Xt dans le cas o d = 0:1 gauche d = 0 :5 au centre et d = 0 :9 droite
3 2 1 0

4 2

15 10 5 0 -5 -10

0 -2

-1 -2 -3

-4 -6 50 100 150 200 250 300 350 400 450 500

50

100

150

200

250

300

350

400

450

500

50

100

150

200

250

300

350

400

450

500

FARIMA1

FARIMA5

FARIMA9

avec les autocorrlogrammes ( d = 0:3 ; d = 0 :5 ; d = 0:9 ) ci-dessous,

Les cas limites d ! 0 et d ! 1 correspondant respectivement au bruit blanc gaussien et la marche alatoire gaussienne (cest dire au processus intgr dordre 1 ARIM A (0 ; 1; 0)).

3.3

Estimation du paramtre d

Parmi les mthodes pour estimer le paramtre d, nous en retiendrons 3 . 3.3.1 Mthode du log-autocorrlogramme

La mthode la plus simple pour dtecter la prsence de mmoire longue est lutilisation du log-autocorrlogramme. Comme nous lavons vu, asymptotiquement, les autocorrlations sont de la forme (h ) s d .h2 d1 . En prenant le logarithme, log (h ) s d + (2 d 1) log h, on peut noter une relation linaire entre le logarithme des retards log h et le logarithme de lautocorrlation log (h) . Le coeent d peut alors tre estim en considrant la pente de la droite : soit b et b tels que b= 1 b log jb (h) j s b + b log h alors d +1 : 2 79

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Exemple 28 Les graphiques ci-dessous correspondent des log-log autocorrlogrammes de donnes internet gauche (nombre de bytes changs par seconde) et de la crue du Nil chaque anne droite
LogLog Autocorrelogramme - Ethernet
0 0 0.5 1 1.5 2 2.5 3 3.5

LogLog Autocorrelogramme - Nile


0 0 0.5 1 1.5 2 2.5 3

-0.5

-0.5

-1

-1

-1.5

-1.5

-2

-2

-2.5

-2.5

-3

-3

-3.5

-3.5

Si laspect linaire apparat dicilement sur des donnes relles, il apparat davantage sur des donnes simules,
LogLog Autocorrelogramme - FARIMA(0,0.3,0)
0 0 -1 -2 0.5 1 1.5 2 2.5 3

LogLog Autocorrelogramme - FARIMA(0,0.5,0)


0 0 -0.5 -1 -1.5 0.5 1 1.5 2 2.5 3

-3 -4 -5 -6

-2 -2.5 -3 -3.5 -4

-7 -8

-4.5 -5

avec gauche un processus ARF IM A (0; 0 :3 ; 0) et un processus ARF IM A (0 ; 0:5 ; 0) droite. On peut toutefois noter que les autocorrlations ne sont pas nulles au bout dun temps relativement faible (< 200) comme cela devrait tre le cas pour les processus mmoire courte. 3.3.2 Mthode du log-priodogramme
2d

Soit (Xt ) un processus stationnaire, dont la densit spectrale est de la forme f X ( ) = j2 sin ( = 2)j f ( ) o 0 :5 < d < 0:5 est le paramtre de mmoire et o f est une fonction continue, borne sur [ ; + ]. Le priodogramme associ un chantillon de taille T est dni par 1 IT ( ) = 2 T T 2 X Xt e it :
t=1

On dnit les frquences de Fourier par j = 2 j=T pour j = 1 ; :::; (T 1) =2 . A partir de la densit spectrale et du priodogramme pris aux frquences de Fourier, on obtient la rgression suivante : log IT ( j ) = + Zj + "j o 8 = log f (0) > > < =d o est la constante dEuler. Zj = 2 log j2 sin ( j =2)j > > : "j = log (IT (j )) log f ( j ) + Pour 0 s < t < T , on utilise lestimateur bR (s; t) = d Pt
j = s+1

Zj Z log (IT ( j )) o Z est la moyenne des Zj : 2 Pt j= s+1 Zj Z 80

Sries temporelles : thorie et applications

Arthur CHARPENTIER

3.3.3

Mthode de Whittle

Soit ( Xt) un processus F ARIM A (0; d; 0) dnit par (1 L)d Xt = "t o ("t ) est un bruit blanc de variance nie 0 2 . La mthode de Whittle revient estimer le vecteur = 2 ; d de paramtres. La fonction que lon cherche minimiser est appele vraissemblance de Whittle, et est donne par Z + 1 IT ( ) LW (X; ) = log fX ( ; ) + d; 2 fX (; ) o fX et IT sont respectivement la densit spectrale et le priodogramme du processus. En notant = (1 ; d)0 et en R + choissant 2 ( paramtre dchelle ) tel que fX ( ; ) = 2 fX (; ), et log fX (; ) d = 0 , alors la vraissemblance de Whittle, L W (X; ) scrit simplement sous la forme
2 L W ( X; ) = LW (X; ) = log +

1 2 2

0 2 b Lestimateur de Whittle b = b ;d est alors obtenu en minimisant la fonction L W (X; ) par rapport . Puisque lchantillon est de taille nie, cela revient minimiser par rapport la fonction Q T ( ) dnie par QT ( ) =
(T 1)= 2

IT ( ) d: fX (; )

X
i =1

IT ( j ) 4 et b2 vaut alors Q T ( ) : fX ( j ; ) T

3.4

Exemples dapplications des processus mmoire longue

Le dveloppement rapide des sries longues a t principalement d des questions poses en hydrologie. La rsolution laide de modle statistique mmoire longue a commenc des 1951, suit un article de Hurst sur le stockag deau par les barrages. Ce phnomne de mmoire longue se manifeste par la prsence de cycles de toutes priodicits, qui se rencontrent dans un grand nombre de phnomnes physiques. Ainsi, en 1975 , Mandelbrot a appliqu cette thorie aux communication, Halett et Rafterey (en 1989) sur de la mtorologie, Ogata et Abe (en 1991 ) en sismologie...etc. Des tentatives ont galement t faites en conomie, en particulier pour faire de la prvision moyen ou long terme. 3.4.1 Applications en nance : rendements dindices boursier

Les prix dactifs nanciers (taux de change, cours boursiers. . . etc ) sont des sries qui prsentent des comportement de type htroscdastique, avec trs souvent de la persistance. En outre, la plupart du temps, les distributions des prix ne sont pas normales. A partir des annes 80 (et de larticle de Engle en 1982 ), une large classe de modles temps discret a t propose : ARC H , GARC H , E GARC H , T ARCH , IGARCH . . . etc. Une des caractristiques des modles est la prise en compte explicite de lhypothse dhtroscdasticit dans les sries observes. Nanmoins, leur fonction dautocorrlation est semblable celle dun bruit blanc ou dun processus mmoire courte : la fonction dautocorrlation dun modle ARCH dcrot exponentiellement vers 0 . Pour h grand, lautocorrlation entre Xt et Xt h est alors suppose trs faible. A partir des annes 90 , de nouveaux modles, permettant la prise en compte des hypothses dhtroscdasticit et de mmoire longue ont t proposs. En 1986 , Taylor remarquait le premier que les valeurs absolues des rendements des indices boursiers ont une fonction dautocorrlation qui dcrot trs lentement. En 1993 , Ding, Granger et Engle observent le mme genre de comportement en prenant une puissance quelconque (en prenant le carr par exemple ) du rendement. Plusieurs mthodes ont t proposes pour estimer le coecient d sur des donnes nancires. La mthode du log-priodogramme a t propose par Geweke et Porter-Hudak en 1983 , an destimer lordre d, en rgressant le logarithme du priodogramme sur les basses frquences. Cet estimateur, not dGP H , semble toutefois fortement biais et non-asymptotiquement normal pour 0:5 < d < 0:5 . Cet estimateur sera amlior par Robinson en 1995 . La mthode de Whittle propose en 1951 repose sur lapproximation de la matrice de variance-covariance du processus. Cet estimateur, not dW , est non-biais et sa distribution asymptotique est normale (comme Fox et Taqqu lont montr en 1986 dans le cas des processus gaussiens, puis gnralis par Giraitis et Surgalis en 1990 ).

81

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Rendements dindices boursiers Rt Considrons le processus (Xt ), indice boursier, et posons (R t) le rendement associ, dni par Rt = log Xt log Xt1 . Une analyse rapide montre que, sil y a des phases de fortes volatilits, les sries de rendement sont gnralement stationnaires. Les graphiques ci-dessous reprsentent les indices C AC 40 (en haut ) et DAX 30 (en bas ), avec, de gauche droite, la srie de lindice (Xt ), le logarithme de lindice (log Xt ), et enn, le rendement ( Rt) ;
3500 3000 2500 2000 1500 1000 500 1/06/88
8.2 8.0 7.8 7.6 7.4 7.2 7.0 6.8 6.6 1/06/88 12/06/89 11/06/91 10/06/93 LOG_CAC 9/06/95 8/06/97
-0.08 1/06/88 12/06/89 11/06/91 10/06/93 R_CAC 9/06/95 8/06/97 -0.04 0.00 0.04 0.08

12/06/89

11/06/91

10/06/93 FRCAC40

9/06/95

8/06/97

5000

8.8

0.10 0.05 0.00 -0.05 -0.10 -0.15 1/06/88

4000 3000

8.4

8.0

2000 1000

7.6 7.2

0 1/06/88

12/06/89

11/06/91

10/06/93 DAXINDX

9/06/95

8/06/97

6.8 1/06/88

12/06/89

11/06/91

10/06/93 LOG_DAX

9/06/95

8/06/97

12/06/89

11/06/91

10/06/93 R_DAX

9/06/95

8/06/97

La sortie ci-dessous montre lautocorrlogramme dans le cas de lindice CAC 40

Etude de la valeur absolue du rendement jRtj du rendement pour lindice CAC 40


0.08

La srie reprsente ci-dessous correspond la valeur absolue

0.06

0.04

0.02

0.00 1/06/88

12/06/89 11/06/91 10/06/93 ABS_CAC

9/06/95

8/06/97

On oberve eectivement une dcroissance relativement lente de lautocorrlogramme14 . Un modle de type F ARIM A pourrait modliser le comportement de cette srie. Sur la priode allant de Janvier 1992 Dcembre 2000 , les rsultats
1 4 (25) = 0:074; (38) = 0:059; (69) = 0:053; (86) = 0:062...etc Un grand nombre dautocorrlations sont encore signicatives ( (179) ; (183) ; (185) par exemple sont encore signicativement non nul les ).

82

Sries temporelles : thorie et applications

Arthur CHARPENTIER

suivants sont obtenus, par la mthode de Whittle, bW d LW SP 500 0 :149 14 :13 CAC 40 0:126 13:71 DAX 30 0 :178 13 :59

o LW dsigne la valeur de la vraissemblance de Whittle, dnie dans la partie prcdante. Les coecients estims sont signicativement positifs, ce qui conrme lhypothse de mmoire lonue persistante.
2 Etude du carr du rendement Rt CAC 40
0.006 0.005 0.004 0.003 0.002 0.001 0.000 1/06/88

La srie reprsente ci-dessous correspond au carr du rendement pour lindice

12/06/89

11/06/91

10/06/93 CAC2

9/06/95

8/06/97

De faon analogue la valeur absolue du rendement, on obtient bW d LW SP 500 0 :170 20 :95 CAC 40 0:154 20:21 DAX 30 0 :162 19 :76

Etude par sous-priodes En tudiant par sous-prio des, on peut noter, par exemple pour lindice C AC 40, que le comportement mmoire longue dpend de la priode considre : avec ci-dessous le comportement de jRt j bW d LW bW d LW 87 = 89 0 :202 13 :27 87 = 89 0 :182 18 :59 90 =94 0 :118 13:84 90 =94 0 :134 20:31 95 =00 0:126 13:71 95 =00 0:166 20:31 87= 00 0 :150 13 :59 87= 00 0 :170 19 :66

suivi du comportement de R2 t

Remarque 21 Comme nous lavions rappel au dbut de cette partie, la notion decience de march est trs lie labsence de mmoire : lhypothse decience est alors associe au modle de marche alatoire. Les cours boursiers suivent une marche alatoire, et les processus de rentabilit sont alors des bruits blancs : le prix observ sur le march uctue de faon alatoire autour de sa valeur fondamentale. Cette absence de mmoire tant empiriquement une hypothse trop restictive, Samuelson a propos en 1965 de remplacer le modle de marche alatoire par un modle de martingale : ce modle est alors moins restrictif puisquaucune condition nest alors impose sur les autocorrlations des rsidus. En fait, Fama a montr en 1970 puis en 1991 que la mmoire courte ne remet pas en cause lhypothse decience puisque le fait que quelques autocorrlations soient signicatives court-terme ne peut pas tre utilis pour spculer. En revanche, la prsence dune mmoire longue pose davantage de problmes. En 1986, Summers a tudi en dtail le phnomne de retour la moyenne (mean reversion) des prix : la suite dun choc, le prix scarte de sa valeur fondamentale mais nit toujours par y revenir. Ce phnomne implique alors lexistence possible dun cart entre le cours et la valeur fondamantale. Toutefois, si lecart est durable, cela peut tre traduit comme la prsence dune mmoire longue. Ce phnomne va alors lencontre de la proprt decience de Samuelson : plus une srie sera persistante, plus il sera possible detablir une stratgie rmunratrice sur les marchs, ce qui remet fortement en cause lecience de ces marchs.

83

Sries temporelles : thorie et applications

Arthur CHARPENTIER

3.4.2

Applications en nance : taux de change

Cette tude a t faite dans la thse de Christelle Lecourt (Les variations de taux de change au jour le jour : une approche conomtrie partir des processus mmoire longue ). De la mme faon que pour les rendements dindice bouriser, la reprsentation ARIM A a t la premire modlisation retenue. Toutefois, compte tenu des caractristiques de la plupart des sries nancires (en particulier la prsence dune dpendance temporelle dans la variance conditionelle ) a conduit modliser les seconds moments (et moments plus levs ). La classe la plus utilise avait trait aux modles dhtroscdasticit conditionelle autorgressive : les modles ARC H (puis les modles GARCH ). Toutefois, ces modles nont jamais permis de modliser correctement les taux de change. Dans les annes 90, les modles F ARIM A ou ARF IM A introduit par Granger en 1980 ont t utilsis an de mieux prendre en compte la dpendance temporelle dans les premiers moments. [A COMPLETER] 3.4.3 Applications en hydrologie

Comme lavait fait Hurst, considrons une suite dobservations (Xt) (par exemple la quantit deau dcharge par une rivire dans un rservoir, le jour t), et dnissons la suite (Xt ) correspondant au cumul de ces ( Xt)
X0 = 0 et Xt = t X i =1

Xi

Soit d un entier, et considrons R (d), tendue de (Xt ), a juste sur lintervalle [0; d], cest dire h h u i u i R (d) = max Xu Xd min Xu Xd 0 ud d 0 ud d
Dans notre exemple (Xt ) est l a quantit deau dcharge par une rivire dans un rservoir, le jour t, et ( Xt ) la quantit totale deau dverse jusquau jour t. A un horizon d, la quantit moyenne deau arrive par jour esr Xd =d. Aussi, si la quantit (Xu ) est la quantit deau arrive jusquen u, la quantit uXd =d est la quantit deau qui aurait du arriver en moyenne. Supposons quun barrage permette un coulement constant, un dbit journalier de Xd =d: Pour tre certain de ne pas avoir dinnodation, la quantit R (d) est le volume du rservoir. Il est galement possible de dnir S (t) de telle sorte que d !2 d 1X 2 1 X 2 S (t) = X 2 Xi d i=1 i d i =1

La statistique dite R=S a t introduite par Hurst pour tudier les crues du Nil. Cette statistique est lie aux processus self-similaires puisque, si Xt est self-similaire alors la statistique R ( d) est gale, en distribution, dH R (1) . Le graphique ci-dessous est extrait de Stochastic modelling of riverow time series, de Lawrance et Kottegoda (1977 ) :

On y voit un dbit annuel (en haut ), mensuel (au milieu ) et journalier (en bas ).

84

Sries temporelles : thorie et applications

Arthur CHARPENTIER

3.4.4

Applications en conomie

Les processus mmoire longue peuvent tre utiles pour modliser, par exemple, des donnes conomiques, comme lination. Dans cette partie, nous considrerons le taux dination aux Etats Unis. Les courbes ci-dessous montrent le taux dination (variation de lindice par rapport au mois prcdant ) gauche, et les les fonctions dautocorrlation droite
0.020

0.015 0.010

0.005

0.000 -0.005 60 65 70 75 80 85 90 95 00

INFLATION_US

Comme on peut le voir sur lautocorrlogramme, les fonctions dautocorrlations sont toutes signicativement non nulles mme aprs 60 retards (5 ans puisque les donnes sont mensuelles ). Le modle test ici est de la forme suivante 1 L12 (1 L)d (Xt [c + 198007 ]) = 1 L12 "t ;

o t est une fonction dummy permettant de modrer une chute brutale de lination en Juillet 1980 . Direntes mthodes peuvent tre utilises pour estimer les paramtres : E M L (), M P L (), ou N LS (), donnant les rsultats suivants sur la priode 1959 01 / 1995 12 , b d c b EML 0 :400 0 :769 MPL 0 :411 0 :783 N LS 0 :409 0 :620

(0 :033) (0 :101)

(0 :034) (0 :091)

(0 :036) (0 :110)

b b b2

0 :605
(0 :123) (0 :002)

0:621
(0 :113) (0 :003)

0:447
(0 :121) (0 :002)

0 :003

0 :003

0:04

0 :011
(0 :002)

0:011 3 :625

( 0:002)

0:011
(0 :002)

3 :626

3 :548

On peut noter que pour chacune des mthodes d < 0 :5

3.5

Conseils bibliographiques

Sur ce sujet, et pour une application des modles ARF IM A (et des processus GARM A) sur des donnes rles, je renvoie au mmoire de Bouette, JC., Chassagneux, J.F, Sibai, D. et Terron, R. (2003) sur la modlisation du vent en ireland 15 .

AVOUYI-DOVI,S., GUEGAN,D. & LADOUCETTE,S. (2000) Application des processus de longue mmoire lanalyse des indices boursiers BERAN,J. (1994). Statistics for long-memory processes. Chapman & Hall. JASIAK,J. (1999). Long memory in economics : a comment. Working Paper - York University

1 5 Ce

mmoire est tlchargeable http://www.crest.fr/pageperso/lfa/charpent/statapp2003.pdf.pdf

85

Sries temporelles : thorie et applications

Arthur CHARPENTIER

4
4.1

Complments : exercices
Exercices avec correction

Exercise 1 Soit ("t ) un bruit blanc. Les processus suivants sont-ils stationnaires ? (ventuellement avec certaines restrictions sur les paramtres) (i ) Xt = a + b"t + c"t1 o a; b; c 2 R (ii) Xt = "t cos (ct) + "t1 sin (ct) o c 2 R (iii ) Xt tel que Xt Xt1 = "t (i ) Le processus Xt vrie E (Xt ) = a = constante. Sa variance est donne par V (Xt ) = b 2 + c2 2 o 2 est la variance du bruit, puisque le bruit est non-autocorrl : cov ( "t; "t 1 ) = 0. De plus, cov (Xt ; Xt1 ) = bc 2 qui ne dpend pas de t et cov (Xt ; Xt h ) = 0 pour tout h > 1 . Aussi, le processus Xt est stationnaire. (ii) Le processus Xt vrie E (Xt ) = 0 (= constante). De plus, sa variance est donne par V (Xt ) = cos2 ( ct) + sin2 (ct) 2 o 2 est la variance du bruit, puisque le bruit est non-autocorrl : cov (" t; "t 1 ) = 0 . . Enn, cov ( Xt; Xt1 ) = 2 [sin ct cos c ( t 1)] qui dpend de t pour c 2 = Z.Aussi, le processus Xt nest pas stationnaire (iii ) Le processus Xt peut se rcrire t X Xt = "k + X0
k =1

qui correspond une marche alatoire. Aussi, le processus Xt nest pas stationnaire. On peut montrer que le processus p explose en t. Exercise 2 Soit (" t) un bruit blanc et (Xt) un processus vriant 7 3 Xt Xt1 + Xt2 = "t pour tout t 2 Z 2 2 Montrer quil existe un processus stationnaire, solution de (26) sous la forme X et = X ak "tk
k 2Z

(26)

e t: En dduire que " t nest pas linnovation du processus X

Le polynme caractristique de la forme AR est (Z ) = 1 7 Z=2 + 3 Z 2 = 2, qui peut scrire 7 3 1 (Z ) = 1 Z + Z 2 = (1 3 Z ) 1 Z 2 2 2

Les racines sont alors 1= 3 et 2:La racine 1 = 3 nest pas lextrieur du disque unit : la reprsentation nest pas canonique. e t est dni par Toutefois, il est possible dinverser le poylnme retard . Soit X 1 6=5 1= 5 1 e Xt = (L) "t = "t = "t (1 3L) 1 1 L 1 3L 1 L=2 2 1 k 1 1 k + 1 X 2 X 1 1 X 1 = "t+k "t k soit i" ti 5 3 5 2 1 k= 1 k =0 | {z } | {z } dpend du futur dpend du pass de "t de "t e t1 ; X et2 ; ::: (puisque X f Le processus "t est alors corrl avec X t sexprime en fonction du pass et du futur de "t ) : le processus "t nest pas linnovation. 2 En revanche, en considrant un bruit blanc de la forme t s BB 1 ; 2 =9 (le coecient 1= 9 venant de (1 =3) , 1 = 3 e t sous forme AR, tant la racine appartenant au disque unit ), on peut mettre X 1 1 et = soit X et 5 X e t1 + 1 X et 2 = o s BB 1 ; 2 =9 1 L 1 L X t t t 2 3 6 6 et . Cette criture correspondra lcriture canonique du processus X 86

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Exercise 3 On considre le processus alatoire AR (2) suivant Xt = 40 + 0:4 Xt1 0 :2Xt 2 + "t o "t s BB 0 ; 2 = 12 :8

(i ) vrier que le processus est stationnaire (ii) calculer lesprance de Xt (iii ) donner les quations de Yule-Walker du processus, calculer la variance, ainsi que les 5 premires valeurs des autocorrlations (iv ) calculer les 3 premires autocorrlations partielles (i ) Le processus peut scrire 1 0 :4 L + 0 :2L2 Xt = 40 + "t. Le processus est stationnaire si les racines du polynme sont lextrieur du disque unit : p 0:4 i 0 :64 Z = 1 + 2i 2 1 0:4 Z + 0 :2 Z = 0 ssi Z = cest dire Z = Z = 1 2i 0:4 p p dont le module est 1 + 2 2 = 5 > 1 : le processus est stationnaire.16 (ii) Le processus est un AR (2) avec constante : il nest pas centr. E (Xt ) = 0:4 E (Xt1 ) 0 :2E (Xt2 ) + 40 + 0 soit = E (Xt ) = 40 = 0:8 = 50 (iii ) Soit Y t = Xt 50 . Alors Y t satisfait Y t = 0 :4 Y t1 0:2 Yt 2 + "t avec E (Y t) = 0 . La fonction dautocovariance de Yt (qui est la mme que celle de Xt) est obtenue de la faon suivante E (Y tY t h) = 0 :4E (Y t 1Y th ) 0:2 E (Y t2 Y th ) + E ( "tY th ) ce qui donne lquation de Yule Walker h = 0:4 h 1 0 :2 h2 . Les initialisations sont obtenue par les relations 1 = 0 :4 0 0 :2 1 2 = 0 :4 1 0 :2 0

La premire quation permet dcrire 1 = 0 :4 0 =1 :2 = 0 =3 , et la seconde 2 = 0:2 0 = 3 . Or 0 vrie 0 = E (Y tY t ) = 0 :4E (Yt 1 Yt ) 0 :2E ( Yt 2 Yt ) + E ( "t Yt ) = 0:4 1 0:2 2 + E ( "tY t )
2 2 Et comme "t Yt = 0:4 "t Yt 1 0:2 "t Yt 2 + "2 t , on en dduit que E ( "tY t ) = . Et donc 0 = 0 : 4 1 0 :2 2 + . Do nallement, par substitution

0 = 0 :4 0 = 3 0:2 (0 :2 0 =3) + 2 et donc 0 = 3 2 = 2:56 = 15 Do nalement 8 1 = 0 =3 = 5 > > > > < 2 = 0 :2 0 = 3 = 1 3 = 0 :4 1 0 :2 5 = 1 :4 > > > 4 = 0 :4 1:4 0:2 1 = 0:36 > : 5 = 0 :4 0:36 0 :2 1 :4 = 0:136 (1) = (1) = 1 1 1 1 1 2 1 1 8 1 = 0 :333 > > > > < 2 = 0:068 et donc 3 = 0:093 > > = 0:024 > > : 4 5 = 0 :009

(iv ) Les autocorrlations partielles se calculent laide des dterminants des matrices dautocorrlations : j 1 j = 0:33 j1j 2 1 = 2 = 0:199 1 2 1

1 6 Cec i

pouvait galement se noter directement en notant que les conditions de stationnarit dans le cas dun AR (2) scrivent 8 < 1 + 2 < 1 1 + 2 < 1 : 2 > 1

87

Sries temporelles : thorie et applications (1) = = 0 :00069 2 1 1 1 2 3

Arthur CHARPENTIER

1 1 2 1 1 2

1 1 1 1 1 1

On peut noter que a (3) est trs faible, ce qui conrme la nature AR (2) du modle (en thorie, les autocorrlations partielles dun processus AR (p ) sont nulles au del du rang p ). Exercise 4 Considrons deux processus (Xt ) et (Y t) lis par les relations suivantes Yt = Yt 1 + Xt + "t Xt = Xt1 + t
2 o " t et t sont des bruits blancs non-corrls, de variance respective 2 " et . Pour les applications pratiques, on prendra 2 = 1 :5, = 0:4 , = 0 :6 , 2 " = 0 : 016 et = 0 :036

(i ) on pose !t = (1 L) (1 L) Y t . Calculer les moments de ! t et en dduire quil sagit dun processus moyenne mobile ( prciser). Donner la reprsentation canonique de ! t (ii) en dduire que Y t est un processus ARM A dont on prcisera les ordres. Donner la reprsentation canonique de Yt (i ) Le processus ! t est dni par !t = (1 L) (1 L) Y t. Xt et Y t tant centrs, on peut dj noter que E (! t ) = 0. (1 L) Y t = Y t Y t 2 = Y t1 + Xt + "t [Y t2 + Xt1 + "t1 ] = [Y t1 Y t2 ] + [Xt Xt1 ] + "t "t1 = [Y t1 Y t2 ] + t + " t "t 1 = [1 L] Y t 1 + t + "t "t1

Ainsi (1 L) Y t = [1 L] LYt + t + "t "t 1 , soit (1 L) (1 L) Y t = ! t = t + "t "t 1 . Le processus ! t vrie alors, 8 2 2 2 2 < (0) = E !2 " = 0 :10276 t = + 1 + (1) = E (!t ! t1 ) = 2 = 0 : 0096 " : (h ) = 0 pour h 2 Ce comportement de lautocorrlogramme est caractristique des processus M A (1) (nullit des autocorrlations au del du rang 1) : !t est un processus moyenne-mobile. Cherchons crire !t sous forme M A (1) : ! t = u t ut 1 o u t est un bruit blanc de variance 2 . Les paramtres et 2 doivent alors vrier (0) = 1 + 2 2 (1) = 2 cest dire que doit vrier 1 + 2 = (1) 2 = " 2 = 0:0934 (0) 2 2 + 1 + 2 "

doit alors vrier 0 :0934 2 + 0:0934 = 0 soit = 0 :095 ou = 10:61. On choisit la racine de module infrieur 1 pour la reprsentation canonique ( tant linverse de la racine du polynme caractristique ). ! t satisfait ! t = u t ut 1 o ut est un bruit blanc de variance 2 = 0 :101 et o = 0 :095. (ii) Daprs ce que nous venons de montrer !t = (1 L) (1 L) Y t = (1 L ) ut o ut est un bruit blanc, cest dire que Y t suite un processus ARM A (2 ; 1). La forme dveloppe de la dynamique de Y t est Il est galement possible de calculer les autocorrlations ( h) du processus : pour cela, on va multiplier cette expression par Xth , puis prendre lesprance ( le processus Y t tant centr17 ) : Y t2 = =
1 7 Ce

Yt = ( + ) Y t1 Y t2 + u t ut 1

(27)

( + ) Y t1 Y t Y t2 Y t + u tY t u t1 Y t

( + ) Y t1 Y t Y t2 Y t + u t [( + ) Y t1 Y t2 + u t u t1 ] u t1 [( + ) Yt 1 Y t2 + ut u t1 ]

2 qui implique que cov (Xt ; Xth) = E ( Xt Xth ) E (X t) E ( Xth ) = E ( XtX th ) pour tout h. En particulier V (Xt ) = E Xt .

88

Sries temporelles : thorie et applications

Arthur CHARPENTIER

(on remplace Y t par (27) dans ut Y t et ut 1 Yt ). En prenant lesprance, on obtient (0) = ( + ) (1) (2) + 2 1 ( + ) + 2 De plus, en multipliant (27) par Y t1 on peut crire Y tY t1 = ( + ) Yt 1 Yt 1 Y t2 Y t1 + ut Y t1 u t1 Y t1

= ( + ) Yt 1 Yt 1 Y t2 Y t1 + ut Y t1 u t1 [( + ) Y t2 Y t3 + u t1 ut 2 ] (1) = ( + ) (0) (1) 2

(u t est indpendant du pass de Y t , en particulier indpendant de Y t1 ) do, en prenant lesprance

En multipliant (27) par Y t2 on a et de faon plus gnrale

(2) = ( + ) (1) (0) (h) = ( + ) (h 1) (h 2)

Exercise 5 Dcomposition de Beveridge-Nelson dun processus intgr On sintresse dans cet exercice la dcomposition dun processus ARIM A, intgr dordre 1, en la somme dune marche alatoire, et dun processus stationnaire. (1) Soit Y t admettant la dcomposition (1 L) Yt = (L) "t avec (L) =
+1 X

k Lk o 0 = 1 et

k =0

+1 X

k =0

j k j < + 1

et "t bruit blanc de variance 2 . Posons alors = (1). (1 i ) Soit tel que ( L) = + (1 L) ( L). Donner lexpression des coecients k du polynme . P P (1 ii) Montrer que si k jk j < + 1 alors j k j < +1 . (1 iii ) Montrer que lon peut dcomposer Y t sous la forme Y t = Tt + Ct o (1 L ) T t = " t et o C t est un processus stationnaire. (1 iv) Quelle est la limite de V (Y t ) =t quand t ! 1 ? (1 v ) Considrons une dcomposition quelconque du processus Y t; Y t = T t + C t en une somme dune marche alatoire T t et dun processus stationnaire C t . Montrer qualors, on a ncessairement V (1 L) T t = 2 2 (2) On supposera dsormais que le processus Yt vrie une quation de la forme (1 L) (1 L) Y t = "t o 0 < < 1 (28)

(2 i ) Ecrire la relation prcdente sous la forme (1 L) Y t = (L) "t (Forme de Wold) (2 ii) Dcomposer le processus Y t en somme dune marche alatoire et dun processus stationnaire. Les processus Ct et T t sont-ils indpendants ? (3) On veut montrer ici quil est impossible dcrire le processus Y t sous la forme Y t = Tt + C t o (1 L) Tt = u t et C t = (L) v t o les processus ut et vt sont des bruits blancs indpendants, et o (L) est un polynme en L dont les racines sont de module strictement suprieur 1 . (3 i ) En utilisant (28) ; calculer la densit spectrale de Xt = (1 L) Yt (3 ii) En supposant que Y t = Tt + C t o (1 L) T t = u t et Ct = (L) vt ; o les processus u t et v t sont des bruits blancs indpendants, calculer la densit spectrale de Xt = (1 L) Yt (3 iii ) Etudier les comportements pour ! = 0 des deux densits spectrales trouves en (3 i ) et en (3 ii ). (3 iv) Conclure. (1 i ) Par hypothse, (1 L) Yt = (L) "t . Soit alors Xt = (1 L) Y t. Le polynme vrie (L) =
+1 X k =0 1 +1 X X + k Lk 1 + k = k Lk 1 + (1) k =0 k =0

Or la dirence Lk 1 peut se rcrire

Lk 1 = (L 1) 1 + L + ::: + Lk 1 89

Sries temporelles : thorie et applications

Arthur CHARPENTIER

et donc ( L) = (1) + (1 L ) (1) (1 L )


+ 1 X +1 X

k =0

k 1 + L + ::: + Lk 1 0 @
j =k +1 +1 X

k =0

Do nallement lcriture (L) = + (1 L) (L) o (L) = (1 ii) En utilisant cette expression,


+ 1 X k =0 +1 X k =0 k kL

j A Lk
+1 X

avec k =

j =k +1

k =

+ 1 X

k= 0 j =k +1

+ 1 X

j = [ 1 + 2 + 3 + :::] + [ 2 + 3 + :::] + [3 + :::] + ::: =

+1 X k =0

j j

et

P P Donc nallement si k jk j < +1 alors j k j < + 1. (1 iii ) Daprs la question prcdente, on peut crire Xt = ( L) "t = "t + (1 L) ( L) "t Si Y t = Tt + C t, alors Xt = (1 L) Y t = (1 L) Tt + (1 L) Ct . Aussi, on devrait avoir (1 L) T t = "t C t = (L) " t - Montrons que le processus C t est stationnaire : Ct = ( L) "t = P
+1 X

k =0

+ 1 X

j kj

+1 X k =0

k j k j

k =0

k " tk P k jk j < +1 :

qui sera stationnaire si et seulement si j k j < + 1, qui sera vri ds lors que - Le processus T t dnie par (1 L) T t = "t est une marche stationnaire : Tt = T t1 + "t = : (1 iv) La variance de Y t peut se dcomposer en V (Y t ) = V (Ct ) + 2 cov (C t ; T t ) + V (T t )
t X

k =0

" tk + T 1

avec V (C t) = constante et V ( Tt ) est quivalent 2 2 " t , carT t = T 0 + [" 1 + ::: + "t ] . De plus, p p p jcov (T t; C t)j V (T t ) V (C t) = O t et nalement, on a V (Y t) ! 2 2 " quand t ! 1 t En eectuant exactement le mme genre de calcul sur Yt = T t + C t, p, a V (Y t) = V C t + 2cov C t ; T t + V T t et on obtient alors V Tt V (Y t ) lim = lim = 2 2 " t!1 t!1 t t 90

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Do nallement de rsultat souhait, V T t = 2 2 ". PARTIE 2 (3 i et ii ) Le processus Y t se dcompose en Yt = T t + Ct , avec (1 L) Y t = ut et Ct = B (L) vt . Aussi, en direnciant Y t, on a (1 L) Y t = (1 L) T t + (1 L) Ct = ut + (1 L) B ( L) vt = ( L) "t o (L) "t = u t + (1 L) B (L) vt . Le processus Xt = (1 L) Yt = ( L) "t admet pour densit spectrale f ( !) = 1 2 1 u e i! 2 2 1 e i! B e i! 2 2 + " = v 2 2 2 2 2 2 u = " j (1) j2 soit u = j (1)j2 2 2 2 " 2 2 Et comme 1 ei! B ei! 2 v 0 , alors f (! ) f (0) = u =2 : f admet un minimum global en ! = 0 . (3 iv) Soit (1 L) (1 L) Y t = "t pour 0 < < 1 . Alors (1 L) Xt = "t en posant Xt = (1 L) Y t, on peut crire 2 1 2 1 f (! ) = " et f (0) = " 2 2 j1 ei! j 2 (1 )2 2 2 Montrons qualors 0 nest pas un minimum golbal : si ! = =2 alors 1 ei! = 1 + 2 > (1 ) puisque 0 < < 1 , et donc 1 1 2 > 2 et donc f (0) > f 2 1+ (1 ) (Y t) ne peut donc pas tre dcompose en tendance - cycle, daprs le modle de la question (2) . Par contre il peut ltre dapres le modle (1) :

en utilisant lcriture ( L) "t = ut + (1 L) B (L) v t (3 iii ) En comparant les deux critures pour ! = 0 on constate alors que

4.2

Examen de 2001/2002
t X

Exercise 6 (i ) Soit ("t ) un bruit blanc et Xt dni par Xt = k ("t k "tk 1 ) o 2 R

k =0

Le processus Xt est il stationnaire ? (ventuellement avec certaines restrictions sur les paramtres) t (ii) Soit ( "t) un bruit blanc, et Xt , Yt et Zt dni par Xt = " t, Y t = ( 1) "t et Zt = Xt + Y t pour tout t 2 Z.Les processus Xt, Y t et Z t sont-ils stationnaires ? (iii ) La somme de deux processus stationnaires est-elle stationnaire ? (i ) Le processus Xt est un processus centr, E (Xt ) = 0. Le processus Xt peut scrire Xt = 0 ["t "t1 ] + 1 ["t1 "t2 ] + 2 ["t2 " t3 ] + ::: + t1 ["1 " 0 ] + t ["0 0] avec la convention " 1 = 0 . Cette relation peut se rcrire, en mettant en facteur les "ti , Xt = 0 "t + 1 0 "t1 + 2 1 "t 2 + 3 2 "t3 + ::: + t 1 t 2 " 1 + t t1 "0 = 0 "t + ( 1) " t1 + "t2 + 2 "t 3 + 3 "t4 + ::: + i 1" ti + ::: + t2 "1 + t1 " 0 Aussi, pour = 1 , alors Xt = " t et le processus est stationnaire. Pour 6= 1, on peut crire t1 X Xt = " t + ( 1) k "tk 1
k =0

Aussi,

V (Xt ) = 2 + ( 1)

t1 X

k =0

2 k 2 = 2 + ( 1) 91

1 2t 2 1 2

Sries temporelles : thorie et applications

Arthur CHARPENTIER

qui nest pas indpendante de t : Xt nest pas un processus stationnaire. (ii) Le processus Xt est un bruit blanc donc Xt est stationnaire. 2 Le processus Y t vrie E (Yt ) = 0 (=constante), et (0) = E Y t2 = E "2 t = (=constante). Enn, pour tout h 6= 0 , (h ) vrie ( h) = E (Y t Yt h ) = E ( 1)2th "t" th = E ("t "th ) = 0 Le processus Yt est stationnaire (et cest mme un bruit blanc ). Le processus Z t est dni de la faon suivante 2"t pour t pair Zt = 0 pour t impair

2 Si E (Zt ) = 0 (=constante), on peut noter que la variance, elle, ne sera pas constante : E Zt = 4 2 pour t 2 2 pair, et E Zt = 0 pour t impair (car Zt est alors une constante ). La variance de Zt dpend de t : le processus Zt nest pas stationnaire. (iii ) Dans la question prcdante, nous avions vu que Xt et Y t taient des processus stationnaire, et pourtant, leur somme Zt nest pa un processus stationnaire : la somme de deux processus stationnaires nest pas forcment stationnaire. Exercise 7 Soit "t un bruit blanc, centr de variance 5 =18 , et considrons le processus Y t dni par Y t = 2 Y t1 + "t On suppose que Yt nest observable quavec une erreur dobservation : on ne peut observer que le processus Xt = Y t + t o t est un bruit blanc non corrl avec "t ; de variance 1= 6 (avec de plus cov "t; t h = 0 pour tout h 2 Z) (i ) montrer que le processus ! t = "t + t 2 t1 est un processus M A; et en dduire que Xt est un processus ARM A (1; 1) que lon prcisera, (ii) donner la reprsentation canonique de Xt , (iii ) en dduire une reprsentation de Xt du type Xt =
1 X i =1

i Xti + ut

avec

1 X i =1

j ij < 1

(29)

et o u t est un bruit blanc que lon explicitera (donner sa volatilit), non corrl avec Xt . A quoi sert une telle reprsentation ? (i ) Soit !t = "t + t 2 t 1 . Ce processus est centr : E (! t ) = 0 + 0 0 = 0. Sa variance est donne par (0) = E ! 2 "t + t 2 t 1 "t + t 2 t1 t = E 2 2 = E "2 t + t + 4 t1 + 2 "t t 4 t t1 4" t t 1
2 2 2 = 2 " + 5 + 0 + 0 + 0 = " + 5

car E ("t t ) = E " t t 1 = 0 (les processus sont indpendants ) et E t t1 = 0 (car t est un bruit blanc ). Donc 2 2 E ! t = 2 " + 5 qui est une constante : (0) = 5 = 18 + 5 = 6 = 20= 18 = 10 = 9. De plus (1) = = = E (! t !t 1 ) = E "t + t 2 t1 "t1 + t 1 2 t2 E "t "t 1 + "t t1 2 "t t2 + t "t 1 + t t1 2 t t2 2 t1 "t 1 2 t 1 t1 + 4 t1 t 2
2 0 + 0 0 + 0 + 0 0 0 22 + 0 = 2

do (1) = 2 =6 = 1 =3 . Enn, on peut montrer que (2) = 0 et, plus gnralement, (h ) = 0 pour h 2. Ce processus ! t vrie (1) 1 9 3 (1) = = = et (h ) = 0 pour h 2 (0) 3 10 10 Le processus !t est un processus M A (1). Aussi, il existe un bruit blanc t et un paramtre tel que ! t = t t1

92

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Le processus Xt vrie Xt = = Y t + t = [2Y t 1 + "t ] + t = 2 Xt 1 t1 + "t + t 2 Xt1 + "t + t 2 t1 = 2 Xt1 + ! t

donc, daprs la question prcdente, il existe bruit blanc t et un paramtre tel que Xt = 2Xt 1 + t t 1, cest dire que Xt est un processus ARM A (1 ; 1). (ii) Pour expliciter lcriture de ce processus ARM A, il convient de donner deux paramtres : (composante moyenne-mobile ) et 2 , la variance du nouveau bruit blanc. Pour identier ces deux paramtres, on utilise les deux quations que nous avions obtenues auparavant. Pour le processus ! t = t t1 , on a 2 2 (0) = E ! 2 = 10 = 9 t = 1+ (1) = E (! t !t 1 ) = 2 = 1 =3 En divisant la premire quation par la seconde, on obtient que 1 + 2 10 3 10 = = 9 1 3 ce qui donne lquation de degr 2 suivante, 3 2 10 + 3 = 0 , dont les racines sont p p 10 10 2 4 3 3 10 64 10 8 3 = = = = 1 =3 23 6 6 Pour mettre le processus sous forme canonique on choisit de telle sorte que la racine du polynme moyennemobile ( (L) = 1 L) est lextrieur du disque unit, cest dire < 1 . On choisit = 1 = 3: Cette valeur 2 permet den dduire la variance du bruit blanc associ : 2 = 1 = 3 donc = 1. La forme canonique du processus est alors 1 Xt = 2 Xt1 + t t1 o t s BB (0 ; 1) 3 (iii ) Nous avons crit le processus sous la forme (L) Xt = (L) t . An dobtenir une reprsentation de la forme (29) , il convient dinverser le polynme retard (L) : 1 (L) (L) Xt = t . Puisque nous avions choisi la racine de lextrieur du disque unit, le polynme (L) est inverble en fonction des oprateurs passs, et 1 (L) (L) =
1 1 X X i1 1 (1 + L ) = (1 + L) i Li = 1 + + i Li 1 L | {z } i =0 i =1 i

Avec cette criture, on obtient nalement Xt =


1 X i =1

i Xti + t avec

i = i1 + i = 2 = 3i1 + 1 = 3i t s BB (0; 1)

Cette criture est utile pour faire de la prvision : la meilleur prvision possible, faite la date T pour un horizon h est h 1 T +h X X b b X = : X k XT + hk T T +h k T T +h k
k =1 k =h

Remarque 22 Lexercice suivant utilisait les sorties informatiques disponibles sur http://www.crest.fr/pageperso/lfa/cha Exercise 8 Considrons la srie brute Xt , srie trimestrielle observe de 1980 2000. Nous noterons dans toute la suite - Xt la srie brute - Y t la srie direncie une fois Y t = Xt = (Xt Xt1 ) - Zt la srie direncie deux fois Zt = 2 Xt = Y t = Xt 2 Xt1 + Xt 2 - Y 2 t la srie Y 2t = Y t Y t 2 et Z 2t la srie Z 2t = Zt Zt2 - Y 4 t la srie Y 4t = Y t Y et Z 4 t la srie Z 4 t = Zt Zt 4 A partir de lensemble des sries informatiques suivantes (courbes, histogrammes, tests, estimation dquations...etc),le but est ici de trouver un (ou plusieurs) modle permettant de modliser au mieux la srie Xt : 93

Sries temporelles : thorie et applications

Arthur CHARPENTIER

(i ) quelle(s) srie(s) peut-on essayer de modliser laide dun processus ARM A ? (ii) les modles suivants sont-ils valides ? (1 L) 1 1 L 2 L2 3 L3 4 L4 5 L5 6 L6 7 L7 Xt = "t o "t est un bruit blanc (1 L) 1 L2 Xt = "t o "t est un bruit blanc (1 L) 1 L2 1 L2 Xt = "t o "t est un bruit blanc (1 L) 1 L4 Xt = "t " t1 o "t est un bruit blanc

(30) (31) (32) (33)

Les simulations correspondent-elles eectivement un tel modle ? Existe-t-il de meilleurs modles, ou dautres modles permettant de modliser la srie Xt ? (i ) Si lon regarde la srie brute Xt , nous sommes en prsence dune srie non-stationnaire : nous nobservons pas la dcroissance exponentielle de lautocorrlogramme, que lon pourrait observer sur un processus AR, et les 20 premires autocorrlations sont signiactives : X t est non-stationnaire, avec prsence dune racine unit. La srie direncie (une fois ) Y t semble stationnaire, avec toutefois prsence dune racine unit saisonnire : toutes les autocorrlations obtenues avec un retard pair sont signicativement non nulle. Yt nest pas stationnaire, avec prsence racine unit saisonnire. dune La srie 1 L2 Y t prsente le mme genre de comportement que Yt , cest donc que 2 ntait pas la frquence de la racine unit. Y 2 t nest pas stationnaire. En revanche la srie Y 4t est stationnaire. Les autres sries proposes tant obtenues partir dune srie ( Zt) direncie davantage, nous nallons pas les prendre en compte. De toutes faons, un raisonnement analogue aurait pousser ne retenir que Z 4 t, qui est la seule srie stationnaire. Or Y 4 t = 2 (1 L) 1 L4 Xt et Z 4t = (1 L) 1 L 4 Xt = (1 L) Y 4 t : puisque Y 4 t est dj stationnaire, il est inutile de direncier davantage. Nous allons modliser Y 4 t = (1 L) 1 L4 Xt . Ceci est valid par les tests de Dickey-Fuller. (ii) Lestimation du modle (30) - modle AR (7) pour Y t - dni par (1 L) 1 1 L 2 L2 3L 3 4 L4 5 L5 6 L6 7 L7 Xt = "t o "t est un bruit blanc est donne dans le slide (50) . Si tous les paramtres semblent signicatif, on peut noter que lestimation aboutit une racine unit ( 1:01 est racine du polynme AR, et E views prcise Estimated AR process is nonstationary ) : ce modle ne peut pas tre retenu. Lestimation du modle (31) - modle AR (2) pour Y t - dni par (1 L) 1 L2 Xt = "t o "t est un bruit blanc

(iii ) les mthodes SCAN et E SCF suggrent-elles de bons modles ? si oui, lesquels ? (iv ) est-il possible de modliser la srie Xt sans composante M A ? (v ) la srie Xt a en fait t simule sur 80 valeurs, laide dun bruit blanc gaussien N (0 ; 1), de telle sorte que (1 L) 1 L4 (1 0 :8 L) Xt = 1 0:6 L2 "t

est donne dans le slide (67). Le paramtre est signicativement non nul. Toutefefois, si lon considre lautocorrlogramm des rsidus obtenus aprs rgression (slide (69) ), on peut noter que lon na pas un bruit blanc : toutes les autocorrlations paires sont non nulles. Ce modle ne peut tre retenu. Lestimation du modle (32) - modle AR (2) pour Y 2t - dni par (1 L) 1 L2 1 L2 Xt = "t o "t est un bruit blanc est donne dans le slide (79). Le paramtre est signicativement non nul. Toutefefois, si lon considre lautocorrlogramm des rsidus obtenus aprs rgression (slide (81) ), on peut noter que lon na pas un bruit blanc : toutes les autocorrlations paires sont non nulles. Ce modle ne peut pas tre retenu. Lestimation du modle (33) - modle M A (1) pour Y 4t - dni par (1 L) 1 L4 Xt = "t "t1 o "t est un bruit blanc est donne dans le slide (96). Le paramtre est signicativement non nul. Si lon considre lautocorrlogramme des rsidus obtenus aprs rgression (slide (98)), on peut noter quaucune autocorrlation nest signiactivement non nulle. Si les tests de Box-Pierce (Q) ne sont pas valids 5%, on peut malgr tout noter que ce modle reste relativement bon Ce modle pourrait tre retenu. 94

Sries temporelles : thorie et applications

Arthur CHARPENTIER

(iii ) La mthode SC AN applique Y 4t (cest la variable que nous avions retenu dans la partie ( i)) suggre des modles ARM A (0 ; 1) ou ARM A (4 ; 0) , alors que la mthode E SACF suggre des modles ARM A (2; 3) ou ARM A (0; 4). Le modle ARM A (0; 1) appliqu Y 4t correspond au modle (33) : ce modle peut tre retenu. Le modle ARM A (4 ; 0) appliqu Y 4 t correspond au modle estim slide (106) : les 4 paramtres sont signicatifs, et si lon considre les autocorrlations, on obtient un bruit blanc : ce modle peut tre retenu. Le modle ARM A (2; 3) appliqu Y 4 t correspond au modle estim slide (110) : on peut noter que le coecient en AR (1) est non-signicatif. Le slide (111) permet de rester la mme quation sans retard dordre 1 sur Y 4t : tous les coecients sont l aussi signicatifs. Et si lon considre lautocorrlogramme des rsidus obtenus aprs rgression (slide (11) ), on peut noter quaucune autocorrlation nest signiactivement non nulle : l hytpothse de bruit blanc est valide galement par le Qtest : ce modle peut tre retenu. Le modle ARM A (0; 4) appliqu Y 4 t correspond au modle estim slide (115) : les composantes dordre 2 et 3 sont ne sont pas signiactivement non nulles, et si lon teste le modle sans les composantes dordre 2 et 3 , la composante dordre 1 nest plus signicative. Enn, le modle M A (4) ne marchant pas non plus, ce modle ne peut pas tre retenu. (iv ) Le modle AR (4) applique Y 4 t (slide (106)) est valide : il est possible de modliser la srie Xt sans composante M A : le modle (1 L) 1 L4 1 0:6236L 0:5452 L2 0 :5238 L3 0 :2815 L4 Xt = "t

est valide. (v ) Le modle (1 L) 1 L4 (1 0 :8 L) Xt = 1 0:6 L2 "t cest dire Y 4 t modlis par une modle ARM A (1; 2) est estim dans le slide (88). Ce modle est valid : les paramtres sont tous signicatifs, et le rsidu est un bruit blanc. Ce modle est retenu. Les dirents modles possibles sont alors [1] - slide (96) (1 L) 1 L4 X t = (1 L) t [2] - slide (111) (1 L) 1 L4 1 L2 Xt = 1 1 L 2 L2 3L 3 "t 2 3 4 [3] - slide (106) (1 L) 1 L4 1 1 L 2 L 3 L 4 L Xt = ut 4 2 [4] - slide (88) (1 L) 1 L (1 vt L) Xt = 14 L 2 [5] - slide (131) (1 L) 1 L4 1 2 L2 L X = 1 1 L 2 L 5 L5 e t 4 t [6] - slide (123) (1 L) 1 L4 1 L2 Xt = 1 1 L 3 L3 4L 4 et o t; "t ; ut et v t sont des bruit blancs. Les indicateurs de choix de modles donnt les rsultats suivants : [1] [2] [3] [4] [5] [6] R2 0 :2893 0 :3322 0 :3487 0 :3273 0 :9920 0 :9913 R 0:2893 0:3032 0:3196 0:3179 0:9916 0:9910
2

Comme le montre le tableau ci-dessus, le modle [4] a beau tre celui qui a t simul, ce nest pas celui qui modliser la mieux la srie. En particulier, [5] prsente un meilleur critre dAkaike, et [6] un meilleur critre de Schwarz (que lon cherche minimiser ), ainsi quune meilleure F -stat.

log L 101 :6273 94 :7231 91 :8485 97 :4373 92 :8359 99 :1440

Akaike 0 :10115 0 :13313 0 :13792 0 :15038 0 :15744 0 :08737

Schwarz 0 :07025 0 :00763 0 :01044 0 :08811 0 :00056 0:036229

F -stat 11:44084 11:95962 35:02662 2117 :092 2709 :168

4.3

Examen de 2002/2003

Exercise 9 Le processus M A (2) suivant est-il stationnaire (au second ordre) ? 1 si s = t Yt = 1 2 :4L + 0:8L 2 "t o E ("s "t ) = et E ( "t) = 0 pour tout t; s 0 sinon Si oui, calculer sa fonction dautocovariance (h ) = cov (Y t ; Yt+ h) . Un processes M A (q) est toujours stationnaire (ds lors que q est ni ). Dans le cadre gnral des processus M A (q) , la fonction dautocovarariance est donne par (h ) = = = E (Xt Xth ) E (["t + 1 "t1 + ::: + q "tq ] ["th + 1 "t h1 + ::: + q "t hq ]) [ h + h+1 1 + ::: + q q h] 2 si 1 h q 0 si h > q 95

Sries temporelles : thorie et applications

Arthur CHARPENTIER

avec, pour h = 0, la relation Dans le cas dun processus M A (2),

2 2 2 (0) = 1 + 2 1 + 2 + ::: + q 8 2 2 1 + 2 > 1 + 2 pour h = 0 > < 1 [1 + 2 ] 2 pour h = 1 (h ) = 2 2 pour h = 2 > > : 0 pour h 3 (0) = 1 + 2 :42 + 0:8 2 = 7 :4 (1) = 2:4 :8 2:4 = 0 :48 (2) = 0:8 (h ) = pour h 3

Do la fonction dautocovariance dans le cas particulier Y t = 1 2:4 L + 0 :8 L2 "t o V ( "t ) = 1 ,

Exercise 10 Un processus (Zt ) suivant a t simul suivant un processus AR (1), sans constante, de la forme Zt = Zt1 + "t o ("t ) est un bruit blanc gaussien. Il a t simul une premire fois avec = 0 :7 et une seconde fois = 0:85. Sur les sorties ci-dessous, quelle srie correspond au cas = 0:7 ? Quelle srie correspond au cas = 0:85 ? Justiez votre rponse.
6 4 2 0 -2 -4 -6 20 40 60 80 X 100 120 140 6 4 2 0 -2 -4 -6 20 40 60 80 Y 100 120 140

Le processus de droite semble correspond au cas o lautocorrlation est ngative : si Xt1 est positif, Xt semble ngative (en moyenne), et rciproquement, ce qui correspond un cas o corr (Zt 1; Zt ) 0 . Le comportement semble le contraire dans le cas de gauche : corr ( Zt1 ; Zt ) 0 . La srie de gauche correspond au cas = 0 :85 et le cas de droite = 0 :7. Exercise 11 ( i) Dans le cas dun processus stationnaire AR (2) ; Xt = Xt 1 + Xt2 + "t o ( "t) est un bruit blanc, rappeler les valeurs des (1) et (2) en fonction de et . (ii) Lors de la modlisation dune srie dobservations X1 ; :::; XT , lautocorrlogramme suivant a t obtenu,
Autocorr. Partial Corr. 1 2 3 4 5 AC -0.60555 0.68580 -0.51155 0.498081 -0.40768 PAC -0.60555 0.50387 -0.00083 0.00121 -0.00091 Q-Stat 1834.56 4188.07 5497.80 6739.72 7571.90 Prob 0 0 0 0 0

On souhaite alors modliser la srie laide dun processus AR (2). En utilisant uniquement cette sortie, proposez des estimateurs b et b des coecients autorgressifs. 96

Sries temporelles : thorie et applications

Arthur CHARPENTIER

(i ) Soit (Xt ) un processus stationnaire AR (2) de la forme Xt = Xt1 + Xt 2 + " t o ( "t) est un bruit blanc, les deux premires quations de Yule-Walker sont (1) 1 (1) = ; (2) (1) 1 cest dire (1) = + (1) (2) = (1) + 1 soit (1) = = (1 ) (2) = 2 = (1 ) +

(ii) Lquation de Yule-Walker peut sinverser, de la faon suivante = 1 (1) (1) 1 (1) (2) = 1 1 (1) et =
2

1 (1) (1) 1
2

(1) (2)

ce qui donne, respectivement = dont des estimateurs naturels sont = b (1) [1 (2)] 1 (1)
2

(2) (1) 1 (1)


2

AN : dans lexemple considr, b (1) t 0:60555 et b (1) t 0:68580, et donc t b

(1) [1 b b (2)] 1b (1)2

(2) b b (1) et b = : 1b (1)2

Exercise 12 Les sorties informatiques suivantes ont t obtenues lors de modlisations de modles ARIM A (p; d; q), suivant la mthodologie propose par Box et Jenkins, sur trois sries direntes. Le but est de rpondre aux questions laide uniquement des sorties proposes . (1) Indiquez si le modle ARM A (3; 1) suivant peut tre retenu, sinon, en proposer un autre quil pourrait tre intressant de tester
Dependent Variable: Z Method: Least Squares Sample(adjusted): 4 5000 Included observations: 4997 after adjusting endpoints Convergence achieved after 7 iterations Variable AR(1) AR(2) AR(3) MA(1) Coefficient -0.148403 0.549109 -0.077412 -0.150609 Std. Error 1.648750 0.494613 0.831452 1.649037 t-Statistic -0.090009 1.110179 -0.093105 -0.091332 Prob. 0.9283 0.2670 0.9258 0.9272 -0.013720 1.435987 2.813116 2.818332 2.000307 -.886

0 :60555: [1 0 :68580] 0 :68580 0 :605552 t 0:3 et b t t 0; 5 : 2 1 0 :60555 1 0 :60555 2

R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Inverted AR Roots Inverted MA Roots

0.527571 0.527287 0.987301 4866.989 -7024.570 .573 .152

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat .152

Lors de lestimation des coecients, aucun ne semble signicatif, donc ce modle ne peut pas tre retenu. En fait, si lon regarde les racines des polynmes AR et M A (ou linverse des racines comme cela est prsent si-dessus ), on peut noter que la racine 0 :152 apparat pour les deux polynmes : les polynmes AR et M A ont une racine commune ((1 L) (1 a1 L) (1 a2 L) Xt = (1 L) "t ) Lestimation des modles ARM A se faisant pour des polynmes minimaux, il est alors normal que la forme ARM A teste ne convienne pas. Toutefois, il pourrait tre intressant de tester un modle AR (2).

97

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Exercise 13 (2) Indiquez si le modle ARM A (1; 2) suivant peut tre retenu,
6 4 2 0 -2 -4 -6 -8 -10 20 40 60 80 X1
Dependent Variable: X1 Method: Least Squares Sample(adjusted): 2 160 Included observations: 159 after adjusting endpoints Convergence achieved after 7 iterations Variable AR(1) MA(1) MA(2) Coefficient 0.991881 0.242948 -0.498274 Std. Error 0.025671 0.078655 0.078661 0.791638 0.788966 1.278635 255.0455 -263.1780 .99 .59 t-Statistic 37.47017 3.088764 -6.334439 Prob. 0.0000 0.0024 0.0000 -2.355312 2.783367 3.348151 3.406055 2.055100

100

120

140

160

5 0 -5 -10

4 2 0 -2 -4 20 40 60 80 100 Actual 120 140

R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Inverted AR Roots Inverted MA Roots

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat -.84

160

Residual

Fitted

En particulier, il pourra tre intressant de commenter lhypothse de stationnarit de la srie laide de plusieurs arguments. Les autocorrlations sont importantes et largement signicatives (au moins pour les 15 premiers retards ), ce qui, en pratique, laisse prsager la prsence dune racine unit. Cette hypothse est dailleurs conrme lors que lon regarde lestimation dun modle ARM A (1; 2), (1 L) Xt = (1 L) (1 L) "t , on peut noter que b = 0 :99 : le pokynme autorgressif semble avoir une racine unit. Exercise 14 (3) Indiquez si le modle ARM A (1; 2) suivant peut tre retenu, en utilisant la sortie suivante,
Dependent Variable: X2 Method: Least Squares Sample(adjusted): 2 160 Included observations: 159 after adjusting endpoints Convergence achieved after 7 iterations Variable AR(1) MA(1) MA(2) Coefficient 0.731881 0.372958 -0.517354 Std. Error 0.025671 0.078655 0.078661 0.791638 0.788966 1.278635 255.0455 -263.1780 .73 .59 t-Statistic 5.547017 13.08764 -4.334439 Prob. 0.0003 0.0000 0.0061 -2.355312 2.783367 3.348151 3.406055 0.975515

5 0 -5 -10

4 2 0 -2 -4

R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Inverted AR Roots Inverted MA Roots

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat -.84

20

40

60

80

100 Actual

120

140

160

Residual

Fitted

98

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Une des conditions importantes lors dune modlisation ARM A est que les rsidus "t doivent tre un bruit blanc. Dans le cas prsent ci-dessus, les coecients de la modlisation ARM A sont certes signicatifs, mais le bruit nest pas un bruit blanc, comme le montre la reprsentation graphique ci-dessous. Le test de Durbin-Watson conrme dailleurs cette hypothse, puisquil valide lhypothse alternative " t = "t1 + t o 6= 1. Exercise 15 Un utilisateur a rcupr un programme de modlisation de processus ARM A sur internet, mais sans guide dutilisation. En particulier, en essayant de modliser la srie par un processus M A (3), il ne sait pas si le modle test est le modle [1] ou le modle [2], [1] Xt = "t 1 "t 1 2 " t2 3 "t3 o ("t ) et ( t) sont des bruits blancs [2] Xt = t + 1 t1 + 2 t2 + 3 t 3 La sortie obtenue lors de lestimation des paramtres est la suivante, ainsi que lautocorrlogramme de (Xt ),
************************************************************** Conditional Least Squares Estimation Parameter Estimate MA(1) MA(2) MA(3) -0.642247 0.487406 -0.794482 Std Error 0.011338 0.013856 0.010962 t Value -56.64595 35.17769 -72.47537 Pr > |t| 0.0000 0.0000 0.0000

************************************************************** Constant Estimate Variance Estimate Std Error Estimate AIC SBC 0.075183 0.016339 0.127823 -300.396 -279.512

Prcisez, en justiant votre rponse, quel modle ([1] ou [2]) est test laide de ce programme. Autrement, le modle est-il [1] : Xt = "t + 0 :642 "t1 0 :487 "t2 + 0 :794 "t 3 o ("t ) est un bruit blanc (0: 0113) (0:0114) (0 :0109) ou bien [2] : Xt = "t 0 :642 "t1 + 0 :487 "t2 0 :794 "t 3 o ("t ) est un bruit blanc (0: 0113) (0:0114) (0 :0109)

Dans le cas dun processus M A (q), crit sous la forme [1], lautocovariance lordre q est donne par (q ) = = = cov (Xt ; Xtq ) = E (Xt Xtq )

E (["t 1 " t1 ::: q "tq ] ["tq 1 "t q1 ::: q "t qq ]) E ( q "tq :"tq ) = q 2 car E ("ti "tj ) = 2 I (i = j )

Lautocorrlation tant du mme signe que lautocovariance, alors (q ) est toujours du signe oppos q dans un modle crit sous forme [1]. Dans lexemple, la troisime autocorrlation est ngative ( (3) t 0 :385) et le 3me coecient de la rgression, correspondant au retard dordre 3 de la moyenne mobile est 0:794482 . Autrement dit, le modle test ne peut pas tre le modle [1] (les signes auraient d tre opposs ), cest donc un modle de la forme [2] qui a t test. La modlisation de la srie temporelle est alors [2] : Xt = "t 0 :642 " t1 + 0:487 "t2 0 :794 "t3 o ("t ) est un bruit blanc ( 0:0113) (0: 0114) (0:0109)

Exercise 16 Des tests de stationnarit ont t fait sur la srie (Xt) prsente ci-dessous, laide de la mthode de Dickey et Fuller. En utilisant uniquement les deux sorties prsentes ci-dessous (deux tests de racine unit ont t

99

Sries temporelles : thorie et applications

Arthur CHARPENTIER

faits), expliquez si lhypothse de stationnarit est accepte, rejete, ou si lon ne peut pas conclure.
6.6 6.4 6.2 6.0 5.8 5.6 5.4 5.2 72 74 76 78 80 Y
ADF Test Statistic -15.03881 1% Critical Value* 5% Critical Value 10% Critical Value -3.4639 -2.8758 -2.5743 ADF Test Statistic -0.410240 1% Critical Value* 5% Critical Value 10% Critical Value -2.5757 -1.9413 -1.6165

*MacKinnon critical values for rejection of hypothesis of a unit root Augmented Dickey-Fuller Test Equation - NONE Dependent Variable: D(Y) Method: Least Squares Sample(adjusted): 1971:03 1988:01 Included observations: 203 after adjusting endpoints Variable Y(-1) D(Y(-1)) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Coefficient -0.000765 0.421666 0.179261 0.175178 0.156682 4.934414 89.22815 Std. Error 0.001864 0.063685 t-Statistic -0.410240 6.621136 Prob. 0.6821 0.0000 -0.000231 0.172520 -0.859391 -0.826748 1.474710

82

84

86

88

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat

*MacKinnon critical values for rejection of hypothesis of a unit root Augmented Dickey-Fuller Test Equation - INTERCEPT Dependent Variable: D(Y) Method: Least Squares Sample(adjusted): 1971:03 1988:01 Included observations: 203 after adjusting endpoints Variable Y(-1) D(Y(-1)) C R-squared Adjusted R -squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Coefficient -0.610786 0.727746 3.600772 0.614518 0.610663 0.107647 2.317581 165.9327 1.765054 Std. Error 0.040614 0.048263 0.239613 t-Statistic -15.03881 15.07888 15.02746 Prob. 0.0000 0.0000 0.0000 -0.000231 0.172520 -1.605248 -1.556285 159.4153 0.000000

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F -statistic)

Le test de Dickey-Fuller simple (test dun modle AR (1) sous contrainte ) vise tester si le coecient devant la composante AR(1) vaut 1 (prsence de racine unit ). Trois tests sont alors possibles : sans constante, avec constante, avec trend et constante, cest dire que lontest des modles de la forme suivante, [1] Xt = aXt1 + " t (sans constante, test en haut ) ou [2] Xt = + aXt 1 + "t (avec constante, en bas ), par exemple. Le processus ( "t) est suppos tre un bruit blanc, lors dune modlisation ARM A, donc desprance nulle. Et si lon cherche lesprance de ( Xt), on trouve (si le processus (Xt) est eectivement stationnaire ) : [1] E ( X ) = aE (X ) + 0 , donc si a est dirent de 1, E (X ) = 0 ; [2] E ( X ) = + aE (X ) + 0 , donc si a est dirent de 1, E ( X ) = = (1 a) . Le graphique ci-dessus montrer que (Xt) oscille, en moyenne, autour de 6 : on est donc amener tester un modle avec constante. Et comme le montre la sortie du base, le test de Dickey-Fuller pousse rejeter lhypothse a = 1. Le modle sans constante pousse accepter lhypothse H0 : a 6= 1 , mais le modle test semble manifestement faux. Au vu du test de Dickey-Fuller, on rejette lhypothse de prsence de racine unit.

4.4

Examen de 2003/2004
Yt = Xt + "t , (34)

Exercise 17 On considre (Y t) un processus vriant

o ("t ) est un bruit blanc, et o ( Xt) vrie Xt = Xt 1 + t + t 1 ; (35)

o ( t) est un bruit blanc tel que E (" t s ) = 0 pour tout s; t. On suppose de plus que jj < 1, jj < 1 et 6= . Montrer que (Y t ) est un processus stationnaire et donner sa fonction dautocorrlation.

100

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Le processus ( Yt ) peut scrire Yt = = = Xt + "t = Xt1 + t + t1 + "t [Y t1 "t 1] + t + t1 + "t car Y t1 = Xt1 + "t 1 ; Y t1 + "t "t 1 + t + t 1 = Y t1 + ut : | {z }

Le processus (u t ) tant un somme de bruits blancs, il doit tre possible de montrer que ( ut ) est un processus M A (q) . (on peut pas utiliser le fait que ut est la somme de deux processus stationnaires et que donc, (u t) est stationnaire, ce rsultat est en gnral faux (cf examen de 2001/2002)). Montrons plus particuliremenet que (ut ) est un processus M A (q), en calculant ses autocorrlations, en notant que E (u t) = 0 (car E ("t ) = E ( t ) = 0 ), 2 E u2 = E "t "t1 + t + t 1 t = E "t "t 1 + t + t 1 "t "t1 + t + t 1 2 2 2 2 2 = E "2 t + "t1 + t + t 1 2" t"t 1 + 2 "t t + 2 "t t1 2 "t1 t 2 " t1 t1 + 2 t t 1 : En utilisant la linarit de lesprance, et en utilisant le fait que E ("t "t1 ) = 0 ( ("t ) est un bruit blanc) E t t1 = 0 , et E ("t t) = E t 1 "t1 = E "t t1 = E (" t1 t ) = 0 ; (par hypothse E (" t s ) = 0 pour tout s; t), cette expression se simplie en 2 2 2 2 2 2 2 2 E u2 " + 1 + 2 2 t = E " t + E "t1 + E t + E t1 = 1 + ;

2 en notant 2 " et , respectivement, les variances des deux bruits blancs (et en dtaillant outragesement les calculs...). De mme

E (u tu t1 )

= E

2 = E(" t" t1 "t "t2 + "t t 1 + "t t2 "2 t1 + "t1 "t2 "t1 t1 "t 1 t2

"t "t 1 + t + t 1 "t 1 "t2 + t 1 + t2

2 + "t1 t "t 2 t + t t 1 + t t 2 + " t1 t1 "t 2 t1 + 2 t1 + t1 t 2 ):

En utilisant encore une fois la linarit de lesprance, et le fait que E ("s "t ) = E ( s t) = 0 pour s 6= t (hypothse de bruit blanc), et que, par hypothse, E ("t s ) = 0 pour tout s; t (mme gaux), on note quil ne reste plus que deux termes non nuls, 2 2 2 E (ut u t1 ) = E "2 t 1 + E t1 = " : Et de faon plus gnral, un calcul identique celui dtaill ci-dessus donne E (u tu th ) = 0 pour h 2 . On en dduit, tout dabord que, pour tout h , et pour tout t, E (ut u th ) ne dpend pas de t : le processus (ut ) est eectivement un processus stationnaire . De plus, compte tenu de la forme particulire des autocorrlations, on peut noter que u (h ) = E (ut u th ) = E u 2 t = 0 pour h 2 : le processus (u t) est un processus M A ( q), o q = 1. Remarque : En fait, on sait juste que q = 1...il y avait une petite erreur dans lnonc : il en mentionn que 2 6= , ce qui na ici aucun intrt...la condition qui aurait pu tre utile tait plutt 2 " 6= 0 , qui scrirait 6= dans le cas o les bruits ont mme variance : dans ce cas, on peut en dduire que (u t) est un processus M A (1) - sinon (u t) est un bruit blanc. (tout ce qui tait mentionn dans cette remarque ntait, bien entendu, pas demand). Aussi, ( Yt ) est un processus ARM A (1 ; 1). Notons quil sagit dun vrai ARM A (1 ; 1) puisque les racines des polynmes autorgressuf et moyenne-mobile sont direntes. En eet, il existe un bruit blanc vt tel que u t = vt + vt 1 o est solution de
2 2 " = 2 1 + 2 1 + 2 2 2 " + 1+

(ce coecient tant obtenu en notant que pour un processus M A (1), de la forme ut = vt + v t1 , la premire autocorrlation (1) est gale = 1 + 2 ). On obtient ainsi une quation de degr 2, admettant deux racines (lune tant linverse de lautre - cf exercice 2). 101

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Aussi, (Yt ) suit un processus ARM A (1; 1), qui peut dailleurs scrire Y t = Y t1 + vt + vt1 , o (v t) est un bruit blanc. En utilisant la relation donne dans les notes de cours (page 106), on en dduit la forme des autocorrlations, savoir (1) = et (h) = h (1) pour h 2: Exercise 18 Monter que les deux processus M A (1) suivant ont la mme fonction dautocorrlations, 1 Xt = "t + "t1 et Y t = t + t 1 , o ("t ) et ( t ) sont des bruits blancs au sens L2 , et o 0 < jj < 1 . Le cours tant autoris pendant lexamen (il est aussi possible de retrouver la forme des autocorrlations en moins de 2 pages), on obtient facilement que les autocorrlations pour le processus (Xt ) est donnes par (Xt tant centr, i.e. EXt = 0 ) E " 2 E (Xt Xt1 ) t X (1) = = = ; E (Xt2) 1 + 2 E ("2 ) 1 + 2 t et X (h) = E (Xt Xth ) 0 = = 0; pour h 2. 2 E (Xt ) 1 + 2 E ("2 t) (36) (1 + ) ( + ) 1 + 2 + 2

De faon strictement analogue ((Y t) tant galement un processus M A (1) que lon notera Yt = t + t 1, o = 1 = E "2 E (Yt Y t1 ) 1 = t Y (1) = = = = = 2 ; 2 2 E ( Yt2 ) (1 + 2 ) E (" 2 ) 1 + 1 + 1 = +1 t (en multipliant en haut et en bas par 2 ) et Y ( h) = E (Y tY th ) 0 = = 0 ; pour h 2. E (Y t2 ) (1 + 2 ) E ( 2 t)

Cest dire que pour tout h, Y (h) = X ( h) : les deux processus ont la mme fonction dautocorrlation . Exercise 19 1) Supposons que (Y t) soit un processus AR (1) stationnaire, et que (Xt) soit un processus M A (1), soit Y t = Y t1 + "t et Xt = t t1 , (37)

o ("t ) et ( t) sont des bruits blancs. Si pour tout t, Zt = Xt + Yt , montrez que (Z t) suit un processus ARM A (1 ; q) o lon prcisera q ? 2).Soit (Xt ) un processus que lon souhaite modliser, suppos suivre un processus ARIM A (p; d; q), scrivant d (1 L) ( L) Xt = (L) "t , o ("t ) est un bruit blanc. Malheureusement, ce processus nest pas observable directe ment, et lon ne peut observer que Xt = Xt + Y t o (Y t ) est une erreur dobservation (erreur de mesure ou bruit exogne) suppos suivre un processus ARM A (; ), dont le bruit associ ( t ) est suppos indpendant de ("t ). ) suit un processus ARIM A ( p ; d; q ) o lon prcisera p et q . Montrer que (Xt 1. Le processus (Zt ) est la somme dun processus M A (1) et dun processus AR (1) , Zt = Xt + Y t = t t 1 + [Y t1 + "t ] :

Comme Zt1 = Xt 1 + Y t1 , et que le terme Y t1 est dj apparu, faisons apparatre Xt1 (ou plus prcisment Xt1 ), Zt = t t1 + Y t1 + "t + Xt1 Xt1 = Zt1 + t1 + "t Xt1 102

Sries temporelles : thorie et applications

Arthur CHARPENTIER

or Xt 1 = t 1 t2 , donc, par substitution, Zt = Zt 1 + t 1 + "t t 1 t 2 = Zt1 + ut ;

o ut = "t ( + ) t1 + t 2 . On retrouve ici une question proche de lexercice 1, traite auparavant : de la mme faon, comme il est demand de montrer que Z t est un processus ARM A (1; 1), montrons que (u t ) est un processus M A (1). En notant que (u t) est centr, on en dduit sa fonction dautocovariance, 2 E u2 = E " " + + t t 1 t t t 1 = E "t "t 1 + t + t 1 "t "t1 + t + t 1 2 2 2 2 2 = E "2 t + "t1 + t + t 1 2" t"t 1 + 2 "t t + 2 "t t1 2 "t1 t 2 " t1 t1 + 2 t t 1 : En utilisant la linarit de lesprance, et en utilisant le fait que E ("t "t1 ) = 0 ( ("t ) est un bruit blanc) E t t1 = 0 , et E ("t t) = E t 1 "t1 = E "t t1 = E (" t1 t ) = 0 ; (par hypothse E (" t s ) = 0 pour tout s; t), cette expression se simplie en 2 2 2 2 2 2 2 2 E u2 " + 1 + 2 2 t = E " t + E "t1 + E t + E t1 = 1 + ;

2 en notant 2 " et , respectivement, les variances des deux bruits blancs (et en dtaillant outragesement les calculs...). De mme

E (u tu t1 )

= E

2 = E(" t" t1 "t "t2 + "t t 1 + "t t2 "2 t1 + "t1 "t2 "t1 t1 "t 1 t2

"t "t 1 + t + t 1 "t 1 "t2 + t 1 + t2

2 + "t1 t "t 2 t + t t 1 + t t 2 + " t1 t1 "t 2 t1 + 2 t1 + t1 t 2 ):

En utilisant encore une fois la linarit de lesprance, et le fait que E ("s "t ) = E ( s t) = 0 pour s 6= t (hypothse de bruit blanc), et que, par hypothse, E ("t s ) = 0 pour tout s; t (mme gaux), on note quil ne reste plus que deux termes non nuls, 2 2 2 E (ut u t1 ) = E "2 t 1 + E t1 = " : Et de faon plus gnral, un calcul identique celui dtaill ci-dessus donne E (u tu th ) = 0 pour h 2 . On en dduit, tout dabord que, pour tout h , et pour tout t, E (ut u th ) ne dpend pas de t : le processus (ut ) est eectivement un processus stationnaire . De plus, compte tenu de la forme particulire des autocorrlations, on peut noter que u (h) = E (u t ut h ) = E u2 t = 0 pour h 2 : le processus ( ut ) est un processus M A (1). Encore une fois, le fait que q = 1 (et que (ut ) nest alors pas un bruit blanc) est assur en rajoutant lhypothse 2 2 6= " . On peut alors conclure que (Y t ) est un processus ARM A (1 ; 1). 2. De faon analogue, supposons que (Xt ) suive un processus ARIM A ( p; d; q) tel que (1 L) (L ) Xt = (L) " t et que le bruit dobservation Y t suive un processus ARM A ( ; ), tel que A (L) Y t = B (L) t. On sintresse alors la somme de ces deux processus, Xt = Xt + Yt . d Soit (L) = (L) A (L) de degrs respectif p = p + , et q = q + . Montrons qualors (1 L) (L) Xt suit un processus M A (q ), i.e. ( Xt ) est un processus ARIM A (p ; d; q ), ou ARIM A (p + ; d; q ).
(1 L)d (L) Xt d

= = = =

(1 L)d (L) A (L) [Xt + Y t ] h i d d A (L) (1 L) (L) Xt + (1 L) ( L) [A (L) Yt ] A (L) (L) "t + (1 L)d (L) B (L) t ut
d

On notera 1 ( L) = A (L) (L) et 2 (L) = (1 L) (L) B (L) , de degrs respectifs q1 = a + q et q 2 = d + p + , et q i X i j i (L) = j L pour i = 1; 2 .
j= 0

103

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Pour montrer que u t est un processus M A ( q ) - pour un certain q - calculons ses autocorrlations, en notant tout dabord que E (u t) = 0 , et montrons quelles sannulent partir dun certain rang. h ih i d d E u2 = E A ( L ) ( L ) " + (1 L ) ( L ) B ( L ) A ( L ) ( L ) " + (1 L ) ( L ) B ( L ) t t t t t =
q X j =0
1

tous les autres termes tant nuls car ils sont soit de la forme E (" tj "tk ) ou E tj tk avec j 6= k , soit E "tj tk . Dans le premier cas, les termes sont nuls car ("t ) et ( t ) sont des bruits blancs (et donc non-autocorrls), et dans le second cas, les termes sont nuls car les deux bruits sont supposs indpendants (on utilise encore une fois les mmes rsultats que dans la question prcdante, ainsi que dans lexercice 1). h ih i d d E (u tu t1 ) = E A (L) (L) " t + (1 L) (L) B (L) t A (L) (L) " t1 + (1 L) (L) B (L) t1 =
q X
1

1 2 j

"2 tj

q X j =0

2 j

E 2 tj

j =1

2 1 1 j j 1 E "tj

q X

j= 1

2 1 1 j j 1 E t j

en utilisant encore et toujours les mmes arguments : bruits blancs indpendants entre eux. De faon plus gnrale, on en dduit h ih i E (u tu tk ) = E A ( L) (L) "t + (1 L)d (L) B (L) t A ( L) (L) "t k + (1 L)d (L) B ( L) tk =
q X j =k
1

q 2 X 2 1 1 1 1 E " + j j k tj j j k E t j j= k

condition que ces sommes soient bien dnies, cest dire q1 k et q 2 k , sinon, ces sommes valent 0 . En particulier, h ih i E u tu tq 1 1 = E A ( L) ( L) "t + (1 L)d (L) B (L) t A ( L) (L) "t q11 + (1 L )d (L) B ( L) tq 11 = 0+
q X j =k
2

et de mme pour q 2 + 1 : aussi, on en dduit facilement que max q 1 ; q2 + 1 = 0, et de faon plus gnrale max q1 ; q 2 + h = 0 pour h 1 . Aussi, (u t ) est un processus M A (q ) o q = max f a + q; d + p + g . Notons que des racines communes peuvent apparatre, aussi de faon plus rigoureuse, on peut juste conclure que ) est un processus ARIM A (p ; d; q ) , o p p + et q max f a + q; d + p + g. (Xt Exercise 20 Supposons que (Xt ) et (Y t) soient deux processus tels que Xt = Xt1 + Yt 1 + "t Y t = Y t1 + Xt 1 + t

2 1 1 j j k E tj

(38)

o ( "t) et ( t ) sont des bruits blancs mutuellement indpendants (i.e. E" t t+h = 0 pour tout h 2 Z), montrer que (Xt ) et (Y t ) suivent tout deux des processus ARM A (2; 1) dont on donnera la forme (en indiquant les hypothses ventuel les). (indice : il sera intressant dcrire (38) sous forme matricielle M (L) Zt = "t o M est une matrice de polynmes doprateurs retards, puis de noter quen multipliant une matrice carre par une autre matrice carre (bien choisie) il est possible dobtenir une matrice diagonale). En notant Zt = (Xt; Y t )0 , notons que Zt vrie Zt = KZt 1 + ut o K = soit M (L) Zt = u t o M (L) = 104 et u t = ("t ; vt ) ;
0

1 L L

L 1 L

(39)

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Comme le suggre lindication donne en n dexercice, notons que d b a b ad bc = c a c d 0 Lquation (39) scrit alors L 1 L 1 L L 1 L L L 1 L L 1 L

0 ad bc

Zt = u t 1 L L L 1 L

et donc

soit, compte tenu de la relation matricielle dcrite ci-dessus, (1 L) (1 L) + L2 0 1 L Zt = 0 (1 L) (1 L) L2 L soit 1 [ + ] L + [ ] L2 Xt Yt = 1 L L L 1 L

1 L L

Zt =

ut ;

L 1 L ut ;

ut ;

soit

En utilisant une nouvelle fois lapproche de lexercice 1 (et de lexercice 3), on peut noter que les processus (1 L) "t + L t et L"t+(1 L) t sont des processus M A (1) : Et donc, nallement, (Xt ) et (Y t) sont des processus ARM A (2 ; 1). Lhypothse la plus important pour que ces deux processus aient eectivement une forme ARM A (2; 1) est que 6= . Il existe en fait deux autres hypothses, savoir que les polynmes autorgressifs et moyenne-mobiles naient pas de racine commune. Cette condition est toutefois relativement dicile expliciter de faon analytique. Exercise 21 Le but de cet exercice est de montrer que les modles ARIM A sont prfrables aux modles AR avec des racines proches du disque unit, pour faire de la prvision. Considrons pour cela la srie suivante (Xt) suivante,
10 0

2 1 [ + ] L + [ ] L2 Xt = (1 L) "t + L t : 1 [ + ] L + [ ] L Yt = L" t + (1 L) t

-10 -20 -30 -40 20 40 60 80 100 X 120 140 160 180

1) Au vue de lautocorrlogramme, on hsite entre un modle AR (1) et un modle AR (2). Jusitiez ces deux choix. Commentez les sorties suivantes, et prcisez quel modle vous retiendriez ? (les sorties prsentes respectivement lestimation des coecients, lautocorrlogramme des rsidus, puis une reprsentation graphique suivi de lhistogramme

105

Sries temporelles : thorie et applications

Arthur CHARPENTIER

des rsidus)
Dependent Variable: X Method: Least Squares Sample(adjusted): 2 180 Included observations: 179 after adjusting endpoints Convergence achieved after 2 iterations Variable AR(1) R-squared Adjusted R -squared S.E. of regression Sum squared resid Log likelihood Inverted AR Roots Coefficient 0.997954 0.980131 0.980131 1.253865 279.8476 -293.9839 1.00 Std. Error 0.004974 t-Statistic 200.6441 Prob. 0.0000 -16.62738 8.895314 3.295909 3.313716 0.836582

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat

10 0 -10 -20 4 2 0 -2 -4 20 40 60 80 100 Actual 120 140 160 180 Residual Fitted -30 -40

25
Series: Residuals Sample 2 180 Observations 179 Mean -0.010724 Median 0.033882 Maximum 3.281628 Minimum -3.621340 Std. Dev. 1.253819 Skewness -0.177427 Kurtosis 3.104613 Jarque-Bera 1.020782 Probability 0.600261

20 15 10

5 0 -3 -2 -1 0 1 2 3

Dependent Variable: X Method: Least Squares Sample(adjusted): 3 180 Included observations: 178 after adjusting endpoints Convergence achieved after 3 iterations Variable AR(1) AR(2) R-squared Adjusted R -squared S.E. of regression Sum squared resid Log likelihood Inverted AR Roots Coefficient 1.580110 -0.583467 0.986550 0.986473 1.026244 185.3589 -256.1765 .99 Std. Error 0.061657 0.061661 t-Statistic 25.62737 -9.462509 Prob. 0.0000 0.0000 -16.72500 8.823730 2.900860 2.936610 1.932620

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat .59

10 0 -10 4 2 0 -2 -4 20 40 60 80 100 120 140 160 180 Residual Actual Fitted -20 -30 -40

25
Series: Residuals Sample 3 180 Observations 178 Mean Median Maximum Minimum Std. Dev. Skewness Kurtosis Jarque-Bera Probability -0.043396 -0.057294 2.419986 -3.657695 1.022415 -0.220462 3.804549 6.242704 0.044098

20 15 10

5 0 -3 -2 -1 0 1 2

2) En regardant de plus prs lallure de la srie, on souhaite vrier que la srie nest pas intgre. Lhypothse de prsence de racine unit est-elle vrie (la sortie du haut prsentant le test ADF sans constante, en bas avec) ? On

106

Sries temporelles : thorie et applications

Arthur CHARPENTIER

posera Y t = Xt Xt1 (reprsente ci-dessous droite)


ADF Test Statistic -0.824171 1% Critical Value* 5% Critical Value 10% Critical Value -2.5771 -1.9415 -1.6166

*MacKinnon critical values for rejection of hypothesis of a unit root. Augmented Dickey-Fuller Test Equation Dependent Variable: D(X)

ADF Test Statistic

-1.467257

1% Critical Value* 5% Critical Value 10% Critical Value

-3.4682 -2.8777 -2.5753

-2

*MacKinnon critical values for rejection of hypothesis of a unit root.

-4
Augmented Dickey-Fuller Test Equation Dependent Variable: D(X)

20

40

60

80

100 Y

120

140

160

180

dont on observe lautocorrlogramme suivant (ainsi que le test ADF avec constante droite)
ADF Test Statistic -6.326442 1% Critical Value* 5% Critical Value 10% Critical Value -3.4684 -2.8778 -2.5754

*MacKinnon critical values for rejection of hypothesis of a unit root. Augmented Dickey-Fuller Test Equation Dependent Variable: D(Y)

Quel(s) modle(s) proposeriez vous pour modliser la srie (Y t ) ? Aprs rexion, on propose de modliser (Yt ) laide dun processus AR (1) et lon obtient les sorties suivantes
Dependent Variable: Y Method: Least Squares Date: 12/03/03 Time: 12:46 Sample(adjusted): 3 180 Included observations: 178 after adjusting endpoints Convergence achieved after 2 iterations Variable AR(1) R-squared Adjusted R -squared S.E. of regression Sum squared resid Log likelihood Inverted AR Roots Coefficient 0.581741 0.335086 0.335086 1.025313 186.0743 -256.5193 .58 Std. Error 0.061570 t-Statistic 9.448527 Prob. 0.0000 0.021036 1.257401 2.893476 2.911351 1.928592

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat

4 2

25
Series: Residuals Sample 3 180 Observations 178 Mean Median Maximum Minimum Std. Dev. Skewness Kurtosis 0.012845 -0.007849 2.466733 -3.643992 1.025232 -0.213662 3.800602

20
0 4 -2 2 -4 0 -2 -4 20 40 60 80 100 120 140 160 180 Residual Actual Fitted

15 10

5
Jarque-Bera 6.108137 Probability 0.047167

0 -3 -2 -1 0 1 2

107

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Commentez ces sorties. 3) En utilisant ces deux premires questions, proposer deux modles pour la srie ( Xt). On crira les modles sous la forme (1) (1 L) (1 L) Xt = "t (40) (2) (1 L) (1 L) Xt = t (avec = 0 si lon a retenu un modle AR (1) la premire question, 6= 1 sinon). On prcisera les valeurs de , , , ainsi que la variance des bruits. 4) Donnez, dans les deux cas, une mthode pour obtenir une prvision, faite la date T , pour un horizon h , i.e. X T T +h . 5) Donnez, dans les deux cas, la variance de lerreur de prvision, horizon 1 puis horizon 2 . Commentez.

1. Il ne sagissait pas, pour linstant, de commenter la stationnarit (ou non) de la srie. En eet, si lon considre les autocorrlations partielles de la srie, on peut noter que les deux premires (et seulement les deux premires) sont non-nulles Aussi, un modle AR (2) pourrait tre tudi. Nanmoins, la seconde corrlation partielle est la limite de la borne de lintervalle de conance. Statistiquement, on peut donc aussi considrer que cette seconde autocorrlation est nulle, ce qui pousserait tudier un modle AR (1) . Les premires sorties correspondent lestimation du modle AR (1) : si le coecient est signiactif, notons que le rsidu associ nest pas un bruit blanc. Il sut de considrer le test de Ljjung-Box (colonne de droite de lautocorrlogramme), mme sil susait de noter que les premires autocorrlations sont largement signicative (b (1) t 0 ; 576). Un modle AR (1) ne peut pas tre retenu. Les dernires sorties correspondent lestimation du modle AR (2) : Les deux coecients sont signicatifs. De plus, lhypothse de bruit blanc du rsidu peut tre ici valide : les autocorrlations sont lintervalle de conance, et le test de Ljjung-Box conrme lhypothse de bruit blanc. On notera dailleurs galement que lhypothse de normalit est elle aussi valide. Aussi, le modle retenir est ici le modle AR (2).

2. Lhypothse de stationnarit semble dicile valider en considrant lallure de la srie : il est donc lgitime de tester la prsence, ou non, de racine unit. La srie ntant pas centre autour de 0, il convient de tester le modle avec constante, dans le test de Dickey-Fuller. La sortie du bas conrme la prsence de racine unit. On notera galement pour la srie direncie Yt = Xt Xt1 est stationnaire (conrm par le test de Dickey-Fuller droite). En notant que seule la premire autocorrlation partielle est signicative, unmodle AR (1) pourrait tre test. Ce modle est dailleurs retenu si lon considre les sorties : le coecient autorgressif est signicatif et lhypothse de bruit blanc du rsidu est elle aussi valide.

3. Ces deux premires questions nous ont permi de valider deux modles, (1 0 ; 99 L) (1 0 ; 59 L) Xt = "t (1 L) (1 0 ; 58L) Xt = t Compte tenu des direntes sorties, on peut noter que les variances associes aux deux bruits sont respectivement. Dans les deux cas, notons que la variance du bruit est quasiment unitaire.

4. Pour les deux modles, on a exactement les mmes prvisions : en eet, que ce soit la forme AR (Z ) (1 0 ; 99 L) (1 0 ; 59L) Xt = "t ou la forme AR intgre, ces deux modles scrivent, de faon plus "claire" Xt = 1 ; 58 Xt1 0; 58Xt 2 + "t : A la date T , les prvisions horizon T + 1; T + 2 , T + 3... sont
T XT +1

= 1 ; 58XT 0 ; 58 XT 1

XT +2

= =

1; 58T XT + 1 0; 58 XT = 1; 58 [1 ; 58XT 0 ; 58 XT 1 ] 0; 58XT 1 ; 58 2 0 ; 58 XT 1 ; 58 0 ; 58XT 1 = 1 ; 92 XT 0 ; 92XT 1 108

Sries temporelles : thorie et applications

Arthur CHARPENTIER

T XT +3

= = =

1 ; 58 T XT +2 0 ; 58T XT +1 = 1 ; 58 1 ; 58 2 0 ; 58 XT 1 ; 58 0 ; 58XT 1 0 ; 58 [1; 58 XT 0 ; 58 XT 1 ] 1; 58 1 ; 58 2 0 ; 58 0; 58 1 ; 58 XT + 0; 582 1; 582 0; 58 XT 1 2 ; 11 XT 1; 11XT 1 ;


T XT +4 T XT +5

puis = 1 ; 89XT 1 ; 22 XT 1 = 0 ; 70XT 1 ; 09 XT 1

...etc
T XT +9

On retrouve ici le rsultat gnral dun modle AR (Z ), Xt = Xt 1 + Xt2 + " t;


T XT +1 T XT +2

= 52; 69 XT + 14 ; 11 XT 1 . = XT + XT 1

T XT +3

= T XT +1 + XT = [XT + XT 1 ] + XT = 2 + XT + XT 1 = T XT +2 + T XT +1 = 2 + XT + XT 1 + [XT + XT 1 ] = 2 + 2 XT + 2 + XT 1 XT +4 = = T XT +3 + T XT +2 = 2 + 2 XT + 2 + XT 1 + 2 + XT + XT 1 2 2 + 3 XT + 2 + 2 XT 1

et de faon plus gnrale


T

(ce qui peut se montrer par rcurence).

XT + k = T XT +k 1 + T XT +k 2 = k 2 2 + ( k 1) XT + k 3 2 + (k 2) XT 1

5. (i) Calculons lerreur de prvision pour le modle (1), cest dire le modle AR (2). De faon gnrale, (1 L) (1 L) Xt = "t peut sinverser, de faon avoir une criture " M A (1 )", Xt = (1 L) 1 (1 L)1 "t = =
1 X i =0

1 X i= 0

! i"ti o ! i =

i X

1 !0 1 X j i Li @ Lj A "t
j =0

k i k

k =0

(en utilisant des rsultats sur les produits de sries entires). Cette expression permet en particulier den dduire lerreur de prvision (cf cours pour plus de dtails). Lerreur de prvision horizon 1, T T +1 est "T + 1 , dont la variance est 2 = V (" T + 1 ) t 1 . A horizon suprieur, les erreurs de prvision sont respectivement T + 2 = XT +2 T XT + 2 = "T +2 + [ + ] "T +1 2 2 "T +1 T T +3 = XT +3 T XT +3 = " T + 3 + [ + ] " T +2 + + + 2 3 2 2 "T +2 + + + 2 + 3 "T +1 T T + 4 = X4 T XT +4 = " T +4 + [ + ] "T +3 + + +
T

dont les variances respectives sont

2 2 2 V 4 = 1 + [ + ]2 + 2 + + 2 + 3 + 2 + 2 + 3 : 109

2 V 1 = 2 , V2 = 1 + [ + ] 2, 2 2 V 3 = 1 + [ + ]2 + 2 + + 2

Sries temporelles : thorie et applications

Arthur CHARPENTIER

(ii) Dans le cas du modle AR (1) intgr, il nest pas possible dutiliser la forme M A (1), puisque le polynme (1 L) nest pas inversible ! Toutefois, en reprenant ce qui a t fait dans les notes de cours, on notera que, pour un processus ARIM A (1; 1 ; 0) , de faon formelle, (1 L) (1 L) Xt = t peut se rcrire (1 L) Xt = (1 L)1 t = t + t1 + 2 t2 + 3 t3 + ::: = Xt Xt 1: On a alors
T

alors que Aussi,

XT +1 = (1 + ) XT XT 1 = XT + ( XT XT 1 ) = XT + T + T 1 + 2 T 2 + 3 T 3 + ::: XT +1 = XT + T +1 + T + 2 T 1 + 3 T 2 + :::
T

De faon analogue,
T XT +2

T +1 = XT +1 T XT +1 = T +1 .

= =

alors que XT +2 = = = Aussi,

(1 + )T XT +1 XT = (1 + ) XT + T + T 1 + 2 T 2 + 3 T 3 + ::: XT XT + (1 + ) T + T 1 + 2 T 2 + 3 T 3 + ::: XT +1 + T + 2 + T + 1 + 2 T + 3 T 1 + ::: XT + T + 1 + T + 2 T 1 + 3 T 2 + ::: + T +2 + T + 1 + 2 T + 3 T 1 + ::: XT + T +2 + (1 + ) T + 1 + (1 + ) T + 2 (1 + ) T 1 + 3 (1 + ) T 2 + :::


T

T +2 = T +2 + (1 + ) T + 1.

alors que

En itrant une nouvelle fois an dexpliciter clairement le rsultat, = (1 + )T XT +2 T XT +1 = (1 + ) XT + (1 + ) T + T 1 + 2 T 2 + 3 T 3 + ::: T XT +3 XT + T + T 1 + 2 T 2 + 3 T 3 + ::: = XT + 1 + + 2 T + 2 T 1 + 3 T 2 + 4 T 3 + ::: XT +3 = = = XT +2 + T +3 + T +2 + 2 T +1 + 3 T + ::: XT + T +2 + (1 + ) T + 1 + (1 + ) T + 2 (1 + ) T 1 + 3 (1 + ) T 2 + :::

Aussi,

+ T +3 + T +2 + 2 T +1 + 3 T + ::: XT + T + 3 + (1 + ) T +2 + 1 + + 2 T +1 + 1 + + 2 T 1 + 2 1 + + 2 T 2 + :::
T T +3

De faon gnrale, on en dduit que


T T +h

= T +3 + (1 + ) T +2 + 1 + + 2 T +1 .

On en dduit alors les variances respectives sont

= T +h + (1 + ) T +h 1 + 1 + + 2 T +h 2 + :::: + 1 + + ::: + h1 T +1 2 V 1 = 2 , V 2 = 1 + [1 + ] 2 ,

2 2 V 3 = 1 + [1 + ]2 + 1 + + 2 110

Sries temporelles : thorie et applications 2 2 2 2 V 4 = 1 + [1 + ] + 1 + + 2 + 1 + + 2 + 3 :

Arthur CHARPENTIER

(iii ) si lon eectue les calculs, on notera que les chires sont ici grosso modo gaux, dans les deux cas. En fait, on peut noter que lon est dans un cas o (1 L) (1 L) t (1 L) (1 L), soit + t 1 + et t . Aussi, dans le cas ( i) - forme AR (2), si lon suppose avoir la mme variance dans les deux cas (ce qui est dailleurs le cas 10 3 prs), (i ) 2 2 (ii) V 2 = 1 + [ + ] 2 t 1 + [1 + ] 2 = V 2 V3
(i )

V2

(i )

2 2 2 2 + + 2 2 = [ + ] 2 2 (ii ) (ii ) t [1 + ] 2 = 1 + + 2 2 = V 3 V 2 =

V4

(i )

V3

(i )

Du point de vue de la prvision, il est donc quivalent de considrer un modle AR (2) ou de supposer que la srie direncie suit un modle AR (1) : les prvision et les intervalles de conances associs sont quasiment identiques. Exercise 22 On dispose de T observations dune srie temporelle, X1 ; :::; XT . On suppose que lon se trouve la date T et que lon souhaite prvoir la valeur XT +h . On notera T XT + h une telle prvision, eectue la date T pour un horizon h 2 N . Une mthode propose pour fournir une prvision est la suivante : soit une constante, appele constante de lissage, appartenant ]0; 1[, et considrons
T XT +1 = (1 ) T 1 X j =0

h i2 2 3 3 + 2 + 2 + 3 2 = ( + ) 2 ( + ) 2 3 (ii ) (ii ) t [1 + ] 2 (1 + ) 2 = 1 + + 2 + 3 2 = V 4 V 3 =

j XT j :

(44)

1) Donner une interprtation du coecient , en particulier que signie proche de 0 et proche de 1 ? 2) On supposera alors que T XT +h =T XT +1 . Montrer que la prvision T XT +h peut scrire comme une moyenne pondre entre la prvision faite la date prcdante (en T 1 , i.e. T 1 XT +h ) et la dernire observation XT . Rcrire cette expression comme la dernire prvision corrige dun terme proportionnel la dernire erreur de prvision,
T X T +h

=T 1 XT +h + (XT T 1 XT ) .

(45)

Donner lexpression du coecient . 3) On considrera dnit par = arg min


2 T 1 X j =0

j (XT j )2 :

(46)

Donner lexpression de . Montrer en particulier que

T X T +h

1 1 T

(47)

De cette dernire relation, on notera que pour T susement grand (cest dire si lon a beaucoup dobservations), X T T +h t , cest dire que T XT +h peut tre interprt comme la constante qui sajuste le mieux la srie au voisinage de XT . 4) Comme on peut le voir, cette mthode de prvision pose un gros problme : le choix de la constante de lissage . On dira que la prvision est optimale si "T = XT T 1 XT est linnovation du processus (Xt ). Montrer que sous cette hypothse, en utilisant la relation (45) , (1 L) XT + 1 = (1 L) "T +1 , cest dire que (Xt ) est un processus ARIM A (0 ; 1; 1). 111

Sries temporelles : thorie et applications

Arthur CHARPENTIER

1. est ici un coecient permettant de pondrer plus ou moins les observations plus ou moins lontaines. Aussi, si ! 0, on notera que toutes les observations, ormis la premire ( j = 0 ) seront trs peu pondres : dans cas, on prviligera les toutes dernires observations, au dtriment des plus anciennes, dont le poids sera trs trs faible. De faon analogue, si ! 1 , mme les anciennes observations auront un poids non ngligeables. 2. A la date T 1 , une prvision a horizon h a t eectue, en posant
T 1 XT +h

= (1 )

T 2 X j =0

j XT 1j = (1 ) XT 1 + XT 2 + 2 XT 3 + ::: .

De faon analogue, la prvision faite la date T , en considrant


T X T +h

= (1 )

aussi, T XT +h est obtenu comme moyenne pondre, avec respectivement des poids (1 ) et , de la dernire observation XT , et de lancienne prvision T 1 XT +h . On retrouve dailleurs ici que si ! 0, on ne prend en compte que la dernire observation et pas la dernire prvision (on nintgre plus le pass "lointain"), alors que si ! 1 , on est assez peu sensible la toute dernire observation, compte tenu du poids important du pass "lointain". On peut dailleur rcrire
T X T +h

= (1 ) XT + (1 ) XT 1 + XT 2 + 2 XT 3 + :::: | {z }
=T 1XT +h

T 1 X j =0

j XT j = (1 ) XT + XT 1 + 2 XT 2 + 3 XT 3 + :::

= =

(1 ) XT + T 1 XT +h = (1 ) XT + [1 (1 )]T 1 XT + h
T 1 XT + h

+ (1 ) [XT T 1 XT + h] ;

soit = 1 : 1 est alors le poids donn la correction pour erreur de prdiction. 3. On note ici T 1 X 2 = arg min j (XT j ) :
2 R j =0

On sait (cf cours dconomtrie de licence) que la moyenne est la constante minimisant lerreur quadratique : en eet, si T 1 X 2 h : 7! j (XT j ) ;
j =0

alors

T 1 X dh () = 2 j (XT j ) : d j =0

Aussi, dh ( ) =d = 0 si et seulement si
T 1 X j =0

do nallement

j (XT j ) = 0 soit @ =

T 1 X j =0

jA =

T 1 X j =0

j XT j

On peut dduire de cette expression que


T X T +h

T1 1 T X j XT j : 1 j =0

T 1 1 X j 1 XT j = ; 1 j =0 1 T

aussi, avec un long historique ( T grand), on note que T XT +h t (dautant plus que est petite) : cette prvision est alors la constante qui sa juste au mieux (au sens de lerreur quadratique) la srie au voisinage de XT .

112

Sries temporelles : thorie et applications

Arthur CHARPENTIER

4. Sous lhypothse de prvision optimale, lerreur de prvision " T = XT T 1 XT est linnovation du processus (Xt ). Et donc, en utilisant (8),
T

XT +h =T 1 XT +h + (1 ) [XT T 1 XT +h ] :

En remplaant T 1 XT par XT "T , ou, de faon plus gnrale, T XT +h =T XT +1 par XT + 1 " T + 1, on peut rcrire cette expression sous la forme
T XT +1

=T 1 XT + (1 ) [XT T 1 XT ] ou XT +1 "T +1 = XT "T + (1 ) "T XT +1 XT = "T + 1 "T , soit (1 L) XT +1 = (1 L) T +1

soit aussi, le processus (Xt ) est un processus ARM A (0 ; 1 ; 1).

5
...

Complments : simulation de sries temporelles


Simulation de processus en temps discret

5.1

Avant de parler de simulation de processus, il convient de rapeler quelques mthodes de simulations de variables alaoires, en particulier des lois gaussiennes. On supposera ici quil est possible de gnrer les nombres alatoires (ou pseudo alatoires) suivant une loi uniforme sur [0; 1] (cf Fishman (1996)) 5.1.1 Simulation dun bruit blanc gaussien

La mthode la plus simple (et la plus ecace ) pour simuler des variables gaussiennes indpendantes consiste utiliser lalgorithme de Box-Mller, reposant sur le rsultat suivant p Lemme p1 Si U et V sont des variables alatoires uniformes sur [0 ; 1] et indpendantes, alors X = 2 log U cos (2V ) et Y = 2 log U sin (2V ) suivent des loi gaussienne N (0; 1) indpendantes. Ceci permet de simuler aisment un vecteur " N (0; I) 2 Rd en simulant d variables uniformes indpendantes. Pour information, si lon cherche simuler un vecteur X N (m; ) o la matrice est une matrice de covariance (i.e. dnie positive ) que lon supposera inversible, lalgorithme est le suivant : (i ) trouver une matrice racine carre de , i.e. T telle que T T 0 = ( ex: dcomposition de Cholesky ) : comme est inversible, T aussi, On peut noter que Z = T 1 (X m ) N (0 ; I), et donc (ii) simuler n variables gaussiennes centres rduites et indpendantes, que lon notera Z (iii ) poser X = m + T Z , et alors X N ( m; ). Exemple 29 Le graphique ci-dessous correspond la simulation dun bruit blanc, respectivement pour 20 observations, et pour 250
1.2 0.8 0.4 0.0 -0.4 -0.8 -1.2 -1.6 2 4 6 8 10 12 IID 14 16 18 20 4 3 2 1 0 -1 -2 -3 50 100 150 IID 200 250

113

Sries temporelles : thorie et applications

Arthur CHARPENTIER

5.1.2

Simulation dun processus ARM A

Simulation dun processus M A ( q) Nous avons vu dans la partie prcdante comment simuler une chantillon i.i.d. gaussien, "1 ; :::; "n correspondant notre bruit blanc. De faon gnrale, pour simuler un processus M A (q) lalgorithme est le suivant : (i ) simuler q + n valeurs initiales dun bruit blanc "q+ 1; :::; " 0 ; " 1 ; ::::; "n (ii) ltape i + 1 , on pose x i+ 1 = "i+1 + 1 "i + 2" i 1 + ::: + q "iq+1 : Exemple 30 Les graphiques suivant correspondent la simulation dun processus M A (1) de coecient 1 = 0 :8, avec n = 20 en haut et n = 250 en bas, et avec x t gauche, et "t droite,
4 3 2 1 0 -1 -2 -3 2 4 6 8 10 12 MA1 14 16 18 20 1.2 0.8 0.4 0.0 -0.4 -0.8 -1.2 -1.6 2 4 6 8 10 12 IID 14 16 18 20

4 3 2 1 0 -1 -2 -3 50 100 150 MA1 200 250

4 3 2 1 0 -1 -2 -3 50 100 150 IID 200 250

Simulation dun processus AR (p ) Un processus AR (p ) tant un processus Markovien, simuler un processus AR ( p) revient simuler une chane de Markov (dordre p ) Lemme 2 Une chane de Markov dordre 1 sur R (ou plus gnralement sur E , un espace mesurable) est une suite de variables alatoires (Xt ), t 2 N telle quil exsite (i ) une suite ("t ) de variables indpendantes et de mme loi valeurs (ii) une application mesurable telle que pour tout t 2 N , Xt+ 1 = (t; Xt ; " t) Pour simuler un processus AR (p ) lalgorithme est le suivant : (i ) choisir ou simuler une valeur initiale x0 et simuler un bruit blanc "1 ; ::::; "n (ii) ltape i + 1 , on pose x i+ 1 = 1 x i + " i+1 . Exemple 31 Les graphiques suivant correspondent la simulation dun processus AR (1) de coecient 1 = 0 :8,

114

Sries temporelles : thorie et applications

Arthur CHARPENTIER

avec n = 20 en haut et n = 250 en bas, et avec x t gauche, et "t droite,


3 2 1 0 -1 -2 -3 2 4 6 8 10 12 AR1 14 16 18 20 3 2 1 0 -1 -2 -3

10

12 IID

14

16

18

20

4 3 2 1 0 -1 -2 -3 -4 -5 50 100 150 AR1 200 250

4 3 2 1 0 -1 -2 -3 -4 -5 50 100 150 IID 200 250

De faon gnrale, pour simuler un processus AR (p ) lalgorithme est le suivant : (i ) choisir ou simuler p valeurs initiales x 0 ; x1 ; :::; x p +1 et simuler un bruit blanc "1 ; ::::; " n (ii) ltape i + 1 , on pose x i+ 1 = 1 x i + 2 x i1 + ::: + p x ip +1 + "i+1 . Simulation dun ARM A ( p; q ) Un processus ARM A (p; q), de la forme (L) Xt = (L) "t peut se voir comme un processus AR (p ) o le bruit associ suit un processus M A (q) : il convient alors de simuler un processus M A ( q) tout dabord, puis dutiliser lalgorithme de simulation dun processus AR (p ) en remplaant le bruit blanc par le processus M A (q). 5.1.3 Simulation dun processus ARC H

[A INSERER]

5.2

Introduction la simulation de processus en temps continu

Les processus de diusion quil peut tre intressant de simuler, en particulier en nance, sont gnralement de la forme dXt = b ( Xt) dt + a (Xt ) dWt , X0 = x: (48) On suppose que b et a sont lipschitziennes, i.e. il existe K > 0 tel que k a (x ) a (y )k + kb (x ) b (y ) k K k x y k pour tout x; y . Par exemple, dans le cadre du modle de Black et Scholes, la dynamique des prix, sous la probabilit risque neutre scrit dXt = rXtdt + Xt dW t dont la solution est Xt = X0 exp 1 r 2 t + W t 2

Pour simuler Xt, il sut alors de simuler la valeur de (W t ) la date t, i.e. une loi normale N (0 ; t). Pour simuler (Xt) , on a recours une approximation de (Xt ), correspondant une discretisation de lquation (48) . Pour cela, considrons une partition de [0; T ] en n subdivision, de taille T =n, et notons ti = iT =n. Soit n = T =n i le pas de temps, et on noter W n = W ti W ti1 . La discrtisation dEuler consiste crire Z ti Z ti i Xti = Xti 1 + b (Xs ) ds + a (Xs ) dW s Xti 1 + b (Xti1 ) n + a (Xti1 ) Wn
ti 1 ti1

115

Sries temporelles : thorie et applications

Arthur CHARPENTIER

ce qui conduit considrer le processus suivant ( e 0 = X0 X i e ti = X eti 1 + b X e ti1 n + a X eti 1 W n X

(49)

et revient simuler les accroissement W i N (0 ; n ) ; i.e ce qui revient simuler les lois gaussienne et simuler X n

indpendantes, centres, de variance n . Sous lhypothse o a et b sont lipschitziennes, il est alors possible de montrer (application du lemme de Gronwall ) que, pour p 1 , ! p 1=p C et E sup Xt X p n t2[0 ;T ] et vers le processus ( Xt) en cest dire que lon a une convergence uniforme, dans L p , du processus discretis X p 1 = n. Ou de faon plus gnrale, en ra joutant des conditions de rgularit sur a; b et g , on a que C eT E g ( XT ) g X n

(en utilisant le thorme dIto ).

Remarque 23 Lapproximation utilise ici, correspondant au schma dEuler, repose sur lapproximation Z
ti ti1 i a (Xs ) dWs a (Xti 1 ) W n

mais une apprxomiation un ordre suprieure est galement possible. En utilisant le fait que h i 1 i 2 W n n , peut approximer 2 Z h i 1 i i 2 a (Xs ) dW s a (Xti 1 ) W n + a0 (Xti 1 ) a ( Xti1 ) Wn n 2 ti1
ti

R ti

ti 1

i W n dWs =

Aussi, le schma dapproximation (49) peut se rcrire (

(en fait, le terme de drive b ayant une contribution infrieure dans lerreur dapproximation par rapport au terme de diusion, il est inutile de le corriger). On peut alors noter que dans le cas de cette approximation, on a, pour a et b deux fois continuement drivables, et pour p 1 p 1=p C et max E Xti X i i =1; :::;n n p cest dire que la convergence Lp se fait ici en 1 =n, et non plus en 1= n (dans le cas du schma dEuler). Les rfrences sur ce sujet sont Peter E. Kloeden et Eckhard Platen, Numerical Solution of Stochasstic Dierential Equations Springer-Verlag (1995) ou encore Peter E. Kloeden, Eckhard Platen et Henri Schurz, Numerical Solution of SDE Through Computer Experiment, Springer-Verlag (1997) :

e0 = X0 X h i et = X e t 1 + b X e t 1 n + a X et 1 W i + 1 a0 ( Xt 1 ) a (Xt 1 ) W i 2 n X i i i i n i i n 2

6
6.1

Complments : Logiciels de sries temporelles


Introduction EViews

La version 3.1 de EViews semble pouvoir tre tlcharge gratuitement sur le site http://ysdxf.myetang.com/soft.htm. La page tant en chinois, je dcline toute responsabilit sur lusage de cette version nest pas autorise par les diteurs.

116

Sries temporelles : thorie et applications

Arthur CHARPENTIER

6.1.1

Les donnes sous EViews

La work le La premire tape consiste crer un work le, qui contiendra lensemble des sries chronologiques. La dmarche suivre est de cliques sur File puis New, puis de donner un nom la base. Il est alors ncessaire dindiquer le format des donnes des sries qui seront utilises (comme cela est prsent ci-dessous gauche ) : donnes annuelles (annual : 1950 1994), donnes trimestrielles (quarterly 1950:1 1994:4), donnes mensuelles (monthly1950:01 1994:12), donnes journalires (daily 3:25:1950 12:7:1994), ou sans date (undated or irregular 1 174). Par dfaut, deux sries seront alors crees, c qui correspondra, par dfaut la constante, et resid qui correspondra (lors de rgressions ) la srie des rsidus.

Une fois cre cette work le, deux alternatives existent pour travailler avec des donnes : importer des donnes (sous format texte ou excel, par exemple ), ou les gnrer. Limportation est relativement simple, condition que les sries soient prsentes sous forme de colonnes. La procdure dimportation est prsente ci-dessus droite : il sut de cliquer sur File puis Import, puis dindiquer le format de la base importer. Dans lexemple prsent, il sagit dimporter une srie au format txt : on choisit Read Text Lotus-Excel puis on va chercher la base dans le rpertoire o elle se trouve ( par dfaut dans le rpertoire o est install Eviews ). Une fois slectionn le chier, une autre fentre demande de nommer les sries dans lordre o elle apparaissent : dans lexemple considr, il ny avait quune srie, que nous avons appele Serie18 . Pour gnrer une srie, deux alternatives sont possibles : - gnrer une srie partir dune autre srie Xt : ceci arrive lorsque lon souhaite crer une srie direncier. En cliquant sur Generate Series , il sut de taper alors Z=X-X(-1) pour gnrer la srie Z t = Xt Xt1 , encore.Z=2X-3 pour gnrer la srie Zt = 2 Xt 3. On peut alors gnrer, de faon gnrale, toute srie Zt = (L) Xt o est un polynme. - gnrer une srie alatoire : il est assez facile de simuler un chantillon gaussien, centr, de variance unitaire. A partir de ces deux mthodes, il est possible de simuler et de gnrer toutes sortes de sries. Une fois gnre la srie, il est possible de la visualiser en cliquant dessus. 6.1.2 Les graphiques sous Eviews

Plusieurs types de reprsentations sont possibles sous Eviews. Pour gnrer le graphique (standard ) dune srie temporelle, il sut de cliquer sur Line Graph (ci-dessous gauche ). Une fois le graphique obtenu (ci-dessous au centre ), il est possible dobtenir la fentre associe au module graphique, permettant de changer les dirents
1 8 Dans le cas de limportation de sries dun chier MSExcel, EViews demande quelle cellule comme les bases : en commenant en B2 par exemple, il prendra les sries B2:Bn, C2:Cn, D2:D n,... o n correspond au nombre de valeurs des sries de la workle ( nombre des valeurs+1 en fait ). L encore les sries sont toujours en colonne.

117

Sries temporelles : thorie et applications

Arthur CHARPENTIER

paramtres,

En particulier, le type de graphique peut tre modi ( lignes simples, lignes avec points pour les valeurs, histogramme...etc ), les chelles...etc

Il peut tre alors intressant de copier un graphique dans un document Word (ou tout autre traitement de texte ). Le plus simple est de cliquer sur Edit puis Copy an de copier le graphique en mmoire (plusieurs options sont nanmoins possibles : copier en couleur, copier en noir et blanc - cette dernire option tant la plus intressant si lon est amen imprimer en noir et blanc, les traits de direntes couleurs tant alors tranforms en traits de forme direntes : traits plein, pointills, direntes paisseurs...). Il est alors soit denregistrer le chier en tant que chier wmf, soit de le copier, avant de le coller dans un document externe,

118

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Il sut, une fois copier le graphique, de retrourner sur le document Word et dy coller limage.

6.2

La rgression linaire sous Eviews


LS // Dependent Variable is Y Sample: 1 14 Included observations: 14 Variable Coefficient (1) C 32.89132 X1 0.801901 X2 -0.381362 X3 -0.037132 Std. Error (2) 11.66331 0.298436 0.156581 0.052023 T-Statistic (3) 2.820068 2.687012 -2.435564 -0.713768 Mean dependent var S.D. dependent var Akaike info criterion Schwartz criterion F-statistic Prob(F-statistic) Prob. (4) 0.0182 0.0228 0.0351 0.4917 17.71429 (11) 4.177385 (12) 2.143723 (13) 2.326311 (14) 7.878181 (15) 0.005452 (16)

Considrons la sortie suivante, obtenue sous EViews,

R-squared 0.702687 (5) Adjusted R-squared 0.613493 (6) S.E. of regression 2.597069 (7) Sum squared resid 67.44767 (8) Log likelihood -30.87120 (9) Durbin-Watson stat 3.186886 (10)

Ce type de sortie correspond des sorties obtenues en conomtrie, lors de lestimation des paramtres du modle linaire 1 2 3 4 Y i = 1 Xi + 2 Xi + 3 Xi + 4 Xi + "i
i ; :::; X i de qui se rcrit de faon matricielle Y i = Xi + "i. Supposons que nous avons un chantillon Y1 ; :::; Y n et X1 n n observations. On supposera lhypothse (H ) sur les rsidus "t ; de stationnarit au second ordre : - les rsidus sont centrs E ("i ) = 0 - la variance des rsidus est constante : V ("i) = 0 ( homoscdasticit ) - les rsidus sont non-autocorrls : cov ("i ; "ih ) = 0 pour tout h 6= 0 Dans les procdures de tests, nous ajouterons une hypothse supplmentaire : - les rsidus sont gaussiens : " i s N 0; 2 bi a juste sont reprsents ci-dessous gauche. La Dans lexemple dvelopp ci-dessus, les rsidus, et la courbe Y bi, sortie de droite donne direntes statistiques sur b "i = Yi Y
30 25 20 6 4 10 2 0
1 5 4 3 Series: RESID Sample 1 14 Observations 14 Mean Median Maximum Minimum Std. Dev. Skewness Kurtosis Jarque-Bera Probability 0 -1.17E-15 0.190658 4.487981 -3.697326 2.277780 0.043167 2.286940 0.300946 0.860301

15

-2 -4 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Fitted Residual Actual


-4 -3 -2 -1 0 1 2 3 4 5

Pour information, les observations taient les suivantes, Y X1 X2 X3 b Y " b 1 12 2 45 121 11 :16 0 :84 2 14 1 43 132 15 :61 1 :61 3 10 3 43 154 6:82 3:18 4 16 6 47 145 17 :61 1 :61 5 14 7 42 129 10 :30 3 :70 6 19 8 41 156 20 :12 1 :12 7 21 8 32 132 19 :80 1 :20 8 19 5 33 147 19:14 0:14 9 21 5 41 128 25 :49 4 :49 10 16 8 38 163 13:24 2:76 11 19 4 32 161 20 :08 1 :08 12 21 9 31 172 20 :10 0 :90 13 25 12 35 174 27:29 2:29 14 21 7 29 180 21 :24 0 :24

(Source : Bourbonnais,1998).

119

Sries temporelles : thorie et applications

Arthur CHARPENTIER

6.2.1

Lestimation par la mthode des moindre carrs ordinaires donne


1 b = (X 0 X ) X 0 Y

Estimation des paramtres (1) (2)

La valeur de cette estimation est donne en (1).

b est un estimateur sans biais, linaire, de Proprit 11 b = (X 0 X )1 X 0E ( Y ) puisque la matrice X est suppose constante, et que lesprance est un Preuve. E b = (X 0 X ) 1 X 0 X = oprateur linaire. Et puisque E ("t ) = 0 par hypothse, alors E (Y ) = X et donc E Thorme 3 Gauss-Markov - b est lestimateur, linaire en Y , sans biais de , dont la variance est minimale b est un estimateur gaussien, centr en de variance (X 0 X )1 2 Proprit 12 La variance 2 des rsidus peut tre estime par s2 = 1 1 k Y X k 2 = "0b b " n p 1 np1 Cet estimateur sera quali de BLU E - Best Linear Unbiaised Estimator (meilleur estimateur linaire sans biais ). Sous lhypothse o (" t) est gaussien, soit "t s N 0 ; 2 , on a le rsultat suivant

o p est le nombre de paramtres. Cet estimateur est alors sans biais. Lcart-tpye des estimateurs, donn en (2) est alors estim par r 1 1 2 s b = (X 0 X ) kY X k n p 1 bt = Xt b. On notera par la suite Y Exemple 32 Dans lexemple prsent dans lintroduction, on a 0 1 0 1 2 45 121 14 B 1 1 43 132 C B B C 85 0 X =B . . C, X X = B . . @ 532 . . . @ . A . . . . 2094 1 7 29 180 dont linverse est (X 0 X ) Aussi
1

85 631 3126 13132

532 3126 2066 78683

1 2094 13132 C C 78683 A 317950

20 :17 B 0 :015 =B @ 0 :231 0 :076 0:231 0:001 0:003 0:001

Exemple 33 Toujours dans cet exemple, la variance des rsidus est estime par s2 = X 2 1 67 :45 "i = b = 6 :745 14 3 1 i=1 10
14

20:17 B 0 :015 B @ 0 :231 0 :076 |

0 :015 0 :013 0 :012 0 :001

(X 0X )1

{z

10 1 0 0:076 248 32 :891 B 1622 C B 0 :802 0:001 C CB C=B 0:001 A@ 9202 A @ 0 :381 0:000 37592 0 :037 }| {z } | {z
X 0Y b

0 :015 0 :013 0 :012 0 :001

0 :231 0 :001 0 :003 0 :001

1 0 :076 0 :001 C C 0 :001 A 0 :000

1 C C A }

La matrice de variance-covariance des estimateurs est alors estime par 0 11 :66 B 0 : 29 1 b = s2 (X 0 X ) = B @ 0 :15

les valeurs sur la diagonale correspondant aux variances des coecients de la rgression. 120

1 C C A 0 :05

Sries temporelles : thorie et applications

Arthur CHARPENTIER

6.2.2

La statistique de Student Le but est de tester ici le caractre signicatif des coecients de la rgression. On teste, pour chaque coecient, H0 : i = 0 contre lhypothse alternative i 6= 0. Pour cela, utilisons le thorme de Pythagore, correspondant de la dcomposition de la variance 2 2 X 2 1 X 1 X bi + 1 bi Y Yi Y = Yi Y Y n n n | {z } | {z } | {z } variance variance variance totale rsiduelle explique qui peut aussi scrire 2 2 2 b kb "t k = Y X b + X X 2 b Y X suit un 2 (n p 1)

Statistique de Student F (3) (4)

On peut alors montrer (thorme de Cochran ) que

Donc, en remplaant par son estimateur, on peut montrer, toujours sous lhypothse de normalit de " t que bi i p tn p1 = r n p 1 h i 2 P 1 0 bi Yi Y (X X )i;i

suit n p 1 degrs de libert. En eet, sous H 0, b i suit une loi normale centre, de variance rhun t de Student i 1 0 (X X )i;i . La statistique tn p1 doit alors tre compare la valeur donne dans la table de Student.

Dans le cas o tn p 1 est suprieur la valeur indique dans le tableau, on rejette H0 : le coecient est signicativement non nul.

121

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Exemple 34 En reprenant lexemple de lintroduction, la T -stat tant le ratio de la valeur estime sur lcart-type estim, on obtient 32:89132 0 :801901 (1) (2) = 2 :687012 t = = 2 :820068 et t = 11:66331 0 :298436 0 :381362 = 2 :435564 et t(4) = 0 :037132 = 0 :713768 t(3) = 0 :156581 0 :052023

Ces valeurs sont alors comparer avec le quantile de la loi de Student n p 1 = 10 degrs de libert. Daprs la table ci-dessus, t5% 10 = 2: 228 : si les 3 premiers coecients (la constante, X1 et X2 ) sont signicatifs, le dernier ( X3 ) ne semble pas ltre. Il conviendrait alors denlever cette variable du modle, et de refaire une estimation sans cette variable Puissance dun test, ou p -value La variable (4) correspond la p-value (ou puissance ) du test. Considrons deux hypothses, dont une seule est vrie, H0 (hypothse tester ) et H1 ( hypothse alternative ). Il y a 4 cas possibles distinguer, suivant la dcision prise ( valider H0 ou rejetter H0 ) et la vrit (H0 tait, ou ntait pas, vrie ) : (i ) valider H0 et H0 tait vraie : bonne dcision (ii) valider H0 alors que H0 ntait pas vraie : mauvaise dcision (iii ) rejeter H0 (et valider H1 ), alors que H0 tait vraie : mauvaise dcision (iv ) rejeter H0 et H0 ntait pas vrie : bonne dcision Deux types derreurs sont alors possible : - rejeter tort H0 : cas ( iii) ; erreur de premire espce - probabilit - accepeter tort H0 : cas ( ii ), erreur de seconde espce - probabilit Dnition 14 On appelera puissance du test, ou p -value, la probabilit 1 , probabilit de rejetter H0 en ayant raison. On peut montrer que et varie en sens inverse, aussi, plus 1 sera petit, plus sera petit : miniser la puissance revient minimiser le risque de premire espce. Dans le cas de la rgression linaire, et du test de signicativit des coecients, une trs faible p-value signie que lon a peu de chance de rejeter H0 tort. Exemple 35 En reprenant lexemple de lintroduction, les T -stats sont t(1) = 2 :820068, t(2) = 2 :687021, t(3) = 2:435564 et t(4) = 0:713768 Ces valeurs sont comparer avec les quantiles de la loi de Student n p 1 = 10 degrs de libert : 10 0 :60 0:542 0 :50 0 :700 0:40 0 :879 0 :30 1 :093 0:20 0 :10 1 :372 1 :812 0:05 2 :228 0 :02 2:764 0:01 3 :169

Pour le dernier coecient t = 0:713768 : ceci correspond une probabilit comprise entre 0 :4 ( t = 0 :879) et 0 :5 (t = 0 :7 ). t tant proche de 0 :7 , on peut eectivement sattendre avoir une p -value proche de 0:5 . Pour le premier coecient (la constante), t = 2 :82 : ceci correspond une probabilit comprise entre 0 :01 ( t = 3 :169) et 0 :02 (t = 2 :764). t tant proche de 0:276 , on peut eectivement sattendre avoir une p-value proche de 0:02. Remarque 24 La p-value peut servir pour savoir si lon accepte ou si lon rejette lhypothse H0 : une faible valeur de p pousse rejetter H0 . Pour savoir si cest bien ou pas davoir une faible valeur, il est important de rappeler lhypothse H0 : - pour le test de Student (T -stat), H0 correspond la nullit du coecient : si p est faible, le coecient peut tre jug comme signicatif - pour le test de Fisher (F -stat), H0 correspond la nullit de tous les coecients : si p est faible, le modle peut tre jug comme signicatif - pour le test de Box-Pierce, H0 correspond lhypothse de bruit blanc : si p est faible, on rejette lhypothse de bruit blanc des rsidus

122

Sries temporelles : thorie et applications

Arthur CHARPENTIER

6.2.3

Coecient R2 (5) (6)

b1 ; :::; Y bn . Coecient R2 Le coecient R est le coecient de corrlation entre la srie Y 1 ; :::; Yn et la srie estime Y Le carr de ce coecient sinterprte alors en termes de variance explique : 2 2 P P bi Y Y Y Y i i Variance explique par la rgression R2 = = 2 P Variance totale de Y Y Y
Y

0
Y

EL(Y|1,X1Xk) =
Consta ntes

i Remarque 25 Il est toujours possible daugmenter articiellement un R2 : considrons p + 1 variables Xt , alors on a toujours 1 p p +1 p 1 R2 X t ; :::; Xt ; Xt R2 X t ; :::; Xt

b Y dans Rn , o Y est le vecteur Y I. Le coecient R2 est le cosinus de langle form par Y Y et Y

Pour augmenter un R 2 , il sut de rajouter une variable explicative. Si lon se xe uniquement un critre de maximisation de R 2 dans le cadre dune modlisation, le meilleur modle prendra en compte toutes les variables possibles. Le coecient R2 peut tre calcul laide de la relation suivante Pn 2 "i 2 i =1 b R = 1 Pn 2 i =1 Y i Y

Il faut toutefois prendre des prcaution lors de lutilisation du R2 : un coecient ne mesure que de la dpendance linaire. Exemple 36 Considrons Xi = i et Y i = i2 pour i = 1; :::; n. Pour n = 30 , on obtient le modle Yi = 5 :92 + 0 :03 Xi avec un R2 = 0 :94
(8 :5) (19:8)

Ce modle peut paratre trs signicatif (R2 = 94%) mais ne peut pas tre utilis pour autant : Durbin Watson : DW = 0:057 . Coecient R2 ajust - R dans le modle,
2

Le R 2 a just, not R , permet de prendre en compte le nombre de variables utilises (n 1) R2 p n 1 R = =1 np n p Pn


2

i= 1

Pn

o n est le nombre dobservations, et p le nombre de variables explicatives ( y compris la constante ). Ce coecient ajust est plus intressant que le R2 puisquil prend en compte le nombre de variables explicatives. Pn Pn 2 Exemple 37 En reprenant lexemple de lintroduction, en notant que "i = 67:45 et que = i= 1 b i =1 Y i Y 226 :86 , on alors 67 :45 R2 = 1 = 0 :702 226 :86 et le R2 ajust est 2 n1 14 1 R = 1 1 R2 = 1 (1 0 :702) = 0 :613 np1 14 4 123

2 "i i =1 b

Yi Y

Sries temporelles : thorie et applications

Arthur CHARPENTIER

6.2.4

La variable (8) est la somme des carrs des rsidus, SQR = SC R = s2 =


n X i= 1

Somme des carrs (7) (8)

La variable (7) est lcart-type de la rgression, cest dire , cart-type des erreurs "i. Cette valeur est estim par SER = p s 2 o s 2 =
14 X 1 67 :45 b2 " = 6 :745 i = 14 3 1 i= 1 10

b "2 i

Exemple 38 En reprenant lexemple de lintroduction, on a SC R =


14

SE R = s o s2 = donc SER = 6.2.5 p 6 :745 = 2 :597 .

X 2 1 67 :45 b "i = = 6 :745 14 3 1 10


i =1

Pn

"i i =1 b

= 67:45 et donc

Log-vraissemblance du modle (9)

La valeur donne en (9) correspond la log-vraissemblance du modle. On suppose l encore que les erreurs "i 0 sont normalement distribues, centres, de variance 2 . Lidpendance des " que " = ("1 ; :::; "n ) suit une i implique 2 2 vecteur gaussien, N 0; In n . Aussi, Y suit un vectuer gaussien Y s N X; n n I . Aussi, conditionnellement aux vecteurs Xj , j = 1 ; :::; p , aux vecteurs des coecients de la rgression, et 2 , la distribution des Yi est normale : " # 0 1 (Y i Xi )2 2 f Y ijX1; i; :::; Xp; i; ; = p exp 22 2 2 en notant Xi = (X1 ;i; :::; Xp;i) : Les observations tant supposes indpendantes, la distribution jointe des Y i est f ( Y1 ; Y 2 ; :::; Yn ) = = Aussi, la vraissemblance du modle est ` ; jY ; X = et la log-vraissemblance scrit alors
2 0

f (Y 1 ) f (Y 2 ) ::: f (Y n ) 0 1 (Y X ) (Y X ) exp n=2 2 2 (2 2 )

1 (2 2 )n=2

(Y X ) (Y X ) exp 22

Aussi, la log-vraissemblance empirique du modle, donne dans (9) , est L=


0

n n (Y X )0 (Y X ) log ` ; 2 jY; X = log 2 log 2 2 2 22


n

Exemple 39 En reprenant lexemple de lintroduction, on a s 2 = 6 :745 et donc L=

X n n (Y X ) ( Y X ) 1 1 0 2 log 2 log s2 o s = b "2 (Y X ) ( Y X ) i = 2 2 2 2s np1 n p1


i =1

14 14 14 3 1 log 2 log 6 :745 = 30:871 2 2 2

Remarque 26 Lors dune comparaison entre modles, un critre de choix peut tre bas sur cette vraissemblance : le meilleur modle aura une plus grande vraissemblance, ce qui revient minimiser L (L tant toujours ngatif par construction).

124

Sries temporelles : thorie et applications

Arthur CHARPENTIER

6.2.6

Test du Durbin-Watson (10)

Le test du Durbin-Watson permet de dtecter une autocorrlation des rsidus dordre 1 , sous la forme "t = "t1 + t o t s N 0 ; 2 et le test dhypothse scrit Pour tester lhypothse H0 , la statistique de Durbin Watson utilise est Pn [b "t b " t1 ]2 DW = t=2 Pn "2 t=1 b t H0 : = 0 contre H 1 : 6= 0

o les b "t sont les rsidus de lestimation du modle. De part sa construction, cette statistique est comprise entre 0 et 4 . On peut aussi montrer que DW = 2 lorsque = 0 (b b tant le observ ). An de tester H0 , Durbin et Watson ont tabul les valeurs critiques de DW au seuil de 5% en fonction de la taille de lchantillon de la taille de lchantillon n et du nombre de variables explicatives p (k dans le tableau ci-dessous ). La lecture de la table permet de dterminer deux valeurs d1 et d2 comprises entre 0 et 2 qui peuvent dlimiter les rgions suivantes :

>0 0 d1

? d2

=0 2 4-d2

<0 ? 4-d1 4

Selon la position de DW on peut conclure : - si d2 DW 4 d2 : on accepte lhypothse H0 : = 0 - si 0 DW d1 : on rejette H0 : > 0 - si 4 d1 DW 4 : on rejette H0 : < 0 Dans le cas o d1 < DW < d2 ou 4 d2 < DW < 4 d1 , nous sommes dans un cas dindtermination : il est impossible de conclure dans un sens ou dans un autre. Ces rgles de dcision sont illustre ci-dessous,

125

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Les coecients de Durbin & Watson sont indiqus ci-dessous

Toutefois, 2 rgles doivent tre vries (voir construction et dmonstration du test : Gourieroux & Monfort ), - le modle doit comporter un terme constant (sinon dautres tables existent ) - la variable expliquer ne doit pas gurer parmi les variables explicatives (en tant que variable retarde ) Cette statistique ne permet de tester que la forme AR (1) des rsidus. L aussi, dautres tests existent pour tester une forme " t = "th + t pour h 6= 1 . 6.2.7 Dependent var (11) (12)

Les valeurs (11) et (12) sont des informations sur la variable Y expliquer : sa moyenne empirique (11) et son cart-type (12). 6.2.8 Critre dAikak (13) et de Schwarz (14)

Le critre dAkaike - AIC Ce critre est utilis pour choisir un modle, et comparer des modles. Ce critre mesure la distance entre les densits de probabilit observe et estime. Dans le cas dune estimation par moindre carrs, ce critre mesurera lcart entre les rsidus et la distribution gaussienne. ! n 1X 2 2p AIC = log "i + b n n
i =1

Le critre de Schwarz - BIC ou SC par Akaike,

Le critre de Schwarz est un critre lgrment dirent de celui introduit 1X 2 b "i n


i =1 n

SC = log

p log n n

De la mme faon que pour la vraissemblance, un critre de choix peut tre de minimiser SC ou AIC . 6.2.9 Statistique de Fisher F (15) (16)

Ce test est une gnralisation des tests de Student, vus dans la partie (6 :2:2) : on va tester ici la nullit de lensemble des coecients de la rgression : H0 : 1 = ::: = p = 0 contre H1 : il existe j tel que j 6= 0 .

126

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Ce test est un cas particulier des tests de relation linaire entre les coecients, de la forme A = o A est une b la solution des moindres carrs ordinaires, soit Y b = X (X 0 X )1 X 0 Y , et Y b0 la solution matrice de rang q . On pose Y des moindres carrs ordinaires contraints (contrainte A = ). On peut alors montrer que si H0 est vraie, 2 2 b0 b Y Y Y Y np = F (p 1; n p ) 2 p1 b Y Y o p est le nombre de variables, incluent la constante. Ce test permet en particulier de faire un test simultan de tous les coecients de la rgression : Les valeurs F sont alors comparer

Exemple 40 En reprenant lexemple de lintroduction, la statistique de Fisher, permettant de tester la signicativit globale de la regression 3 variables19 ( X1 ; X2 ; X3), est donne par F = n p R2 10 0 :702 = = 7 :878 2 p11R 3 1 0:702

5% Cette valeur est comparer avec le F de Fisher 3 et 10 degr de libert : t5% 3;10 = 3 : 71 . F tant plus grande que t 3;10 , nous rejetons lhypothse de nullit de tous les coecient : la rgression est globalement signicative. La puissance du test est obtenue de la mme faon que pour le test de Student : elle permet de conrmer que la regression est globalement signicative.

6.2.10

Statistique sur les rsidus

Dans la partie intiale, nous avons montr des sorties statistiques sur les rsidus. Parmi les direntes statistiques, en plus des 4 premiers moments (moyenne, variance/dispersion, skewness/asymtrie, kurtosis/paisseur des queues ), un 2 test de normalit est donn. La variance b nest pas ici exactement la mme que s 2 . En eet, s2 =
1 9 Ce

test inclus toujours la constante comme variable explicative.

n 14 X 1 X 2 1 67 :45 2 "t = b bi = " = 6 :745 n p i=1 14 3 1 i=1 10

127

Sries temporelles : thorie et applications

Arthur CHARPENTIER

alors que s2 = 1 X 2 1 X 2 67:45 b "t = b " = = 5:188 n 1 i=1 14 1 i=1 i 13


n 14

Test de Jarque-Berra Un test possible est celui de Bera et Jarque (1984), bas sur le skewness (coecient dasymtrie de la distribution ) et la kurtosis (aplatissement - paisseur des queues ). k En notant k le moment dordre k de la distribution, k = E [X E (X )] , on appelle skewness le coecient s = 3 =2 et kutosis k = 4 =2 2 . Sous des hypothses de normalits, on a normalit des estimateurs du skewness et de la kurtosis, p p L L s ! N 0; 6=n et k ! N 3 ; 24 =n quand n ! 1 Le test de Bera & Jarque repose sur le fait que, si la distribution suit une loi normale, alors la quantit BJ = n 2 n s + [k 3]2 6 24
3=2

suit asymptotiquement une loi du 2 2 degrs de libert. Aussi, si BJ 2 1 (2) on rejette lhypothse H0 de normalit des rsidus au seuil .

Exemple 41 En reprenant une dernire fois lexemple dvelopp dans lintroduction, le skewness empirique vaut 0 :043167 et la kurtosis empirique 2 :28694 . La statistique de Bera-Jarque est alors BJ = 14 14 2 0 :043167 2 + [2 :28694 3] = 0 :0043 + 0 :2966 = 0:3009 6 24

Cette valeur est alors comparer au quantile de la loi du 2 . 6.2.11 Copier/coller des sorties dans un rapport

Les crans prsents ci-dessous montrer comment estimer un modle AR (12) ( sans constante : pour rajouter la constante, il sut de rajouter c dans lquation estimer ). Il sut de cliquer sur Quick et Extimate Equation. La mthode est toujours la mme : on crit lquation linaire conomtrique que lon cherche estimer (Z = Y + X + + "), avec comme premire variable la variable expliquer (Z ), puis la liste de toutes les autres variales (Y , X et la constante ) : on tape alors Z Y X c. De la mme faon en srie temporelle, pour estimater un modles 128

Sries temporelles : thorie et applications

Arthur CHARPENTIER

ARM A pour une srie ( Xt), tape Xt puis les composantes AR et M A que lon souhaite prendre en compte : par exemple, lcriture X AR(3) AR(5) MA(1) MA(3) permettra de tester et didentier le modle Xt = Xt 3 + Xt5 + "t + " t1 + " t3 Dans le cas prsent ci-dessous (SERIE AR(12)) on estime un modle AR (12), ne prenant en compte que le 12me retard, sur la srie Serie (prsente dans lintroduction sur EViews )

Il est possible, de la mme faon que nous avions vu comment coller un graphique (quel quil soit ), de coller des sorties chires (sortie dune rgression dans lexemple qui nous intresse, mais aussi sorties de dirents tests proposs sous EViews ). La mthode la plus simple est alors de slectionner le texte de la sortie ( ci-dessous gauche ), de le copier en cliquant sur Edit et Copy, et de slectionner les options adquates proposes dans la fentre reprsente en bas,

Loption la plus utile est ici Formatted ( moins de souhaiter les valeurs des paramtres et des statistiques avec 12 chires signicatifs ). Une fois copie la sortie, il sut l encore de retourner sous le traitement de texte, et dy copier les informations copies ( ci-dessus droite ). An davoir une sortie sous un format proche de celui obtenu sous EViews, il est alors gnrallement possible de changer la police de caractre (en gnral Time New Roman par dfaut ) et de slectionner une police plus proche de celle utilise sous Eviews (Courier New par exemple ). La sortie reformatte est prsente ci-dessous. Il est toutefois possible que les espaces ne soient pas ajusts de faon optimale, et il sut de

129

Sries temporelles : thorie et applications

Arthur CHARPENTIER

quelques suppression despaces pour avoir une sortie prsentable.

6.2.12

La rgression linaire sur dautres logiciels

Les parties prcdantes ont montr comment lire des sorties destimations de modles linaires, obtenues sous Eviews. Les sorties obtenues sont relativement gnrales, et tous les logiciels fournissent les mmes informations en sortie. Nous allons prsenter tout dabord les sorties sous S- P lus, qui peuvent tre obtenues, comme sous EViews, sans ligne de programmation, en utilisant uniquement les menus droulants. Nous voquerons ensuite les sorties sous SAS et sous RAT S . La rgression linaire sous S -P lus forme suivante Les sorties sous S - P lus se prsentent (toujours sur lexemple initial ) sous la

*** Linear Model ***

Call: lm(formula = Y ~ X1 + X2 + X3, data = data.exemple.reg, na.action = na.omit) Residuals: Min 1Q Median 3Q Max -3.697 -1.126 0.1907 1.485 4.488

Coefficients: Value Std. Error (Intercept) X1 X2 X3 32.8913 0.8019 -0.3814 -0.0371 11.6633 0.2984 0.1566 0.0520 t value Pr(>|t|) 2.8201 2.6870 -2.4356 -0.7138 0.0182 0.0228 0.0351 0.4917

Residual standard error: 2.597 on 10 degrees of freedom Multiple R-Squared: 0.7027 F-statistic: 7.878 on 3 and 10 degrees of freedom, the p-value is 0.005452

La variable Intercept correspond (comme sous SAS ) la constante. La premire partie donne des informations quantitatives sur le rsidu de la rgression (moyenne, quartiles, mdiane...). Lestimation est la mme que celle sous EViews, avec lestimateur des coecients, son cart-type estim, la statistique de Student, et sa p-value. Enn, S - P lus donne la residual standard error , le R2 du modle, la statistique de Fisher, et sa p-value. La rgression linaire sous SAS La rgression linaire se fait laide de la commande suivante PROC REG; MODEL Y = X1 X2 X3;

130

Sries temporelles : thorie et applications

Arthur CHARPENTIER

SAS fournit alors la sortie suivante


Dependent V a r i a b l e : Y A n a l y s i s of Variance Source Model Error C Total Root M S E Dep Mean C.V. DF 3 10 13 Squares 159.40948 67.44767 226.85714 R-square Adj R- s q Sum o f Square 53.13649 6.74477 0.7027 0.6135 Mean F Value 7.878 P r o b >F 0.0055

2.59707 17.71429 14.66087 Parameter Estimate 1 1 1 1

Parameter Estimates Variable DF Standard Error 11.66331015 0.29843584 0.15658069 0.05202312 T for H0: P a r a m e t e r =0 2.820 2.687 -2.436 -0.714 P r o b > |T| 0.0182 0.0228 0.0351 0.4917

I NTERCEP X1 X2 X3

32.891324 0.801901 -0.381362 -0.037132

L encore, la sortie est assez proche de celles obtenues laide des autres logiciels. En particulier, le tableau du bas correspond ceux dj obtenus (estimateur des coecients, son cart-type estim, la statistique de Student, et sa p -value ). Tout un ensemble dindicateurs est toutefois donn auparavant, dans la partie Analyse de la Variance : - la somme des carrs de erreurs ( SCR) : ligne Error, colonne Squares = 67 :44767 - la statistique de Fisher : F Value = 7 :878, ainsi que la p -value associe (Prob> F) = 0 :0055 - lcart-type de la rgression : Root MSE = 2:59707 - la moyenne de la variable Y : Dep Mean = 17 :71429 - le coecient de variation : C.V. = 14 :66087 . Ce coecient correspond au rapport Root MSE/Dep Mean exprim en pourcentage, CV = 100 2 :59707 =17:1429 - le R2 : R-square = 0 :7027 2 - le R2 a just, R : Adj R-sq = 0:6135 La rgression linaire sous RAT S La rgression linaire se fait laide de la commande suivante linreg Y residus; #constant X1 X2 X3; RAT S fournit alors la sortie suivante
Dependent Variable Y - Estimation by Least Squares Usable Observations 14 Degrees of Freedom Total Observations 24 Skipped/Missing Centered R**2 0.702687 R Bar **2 0.613493 Uncentered R**2 0.985401 T x R**2 13.796 Mean of Dependent Variable 17.714285714 Std Error of Dependent Variable 4.177385480 Standard Error of Estimate 2.597068848 Sum of Squared Residuals 67.447666031 Regression F(3,10) 7.8782 Significance Level of F 0.00545230 Durbin-Watson Statistic 3.186886 Q(6-0) 15.898588 Significance Level of Q 0.01430876

10 10

Variable Coeff Std Error T-Stat Signif ************************************************************************ 1. Constant 32.89132428 11.66331015 2.82007 0.01815860 2. X1 0.80190069 0.29843584 2.68701 0.02281643 3. X2 -0.38136236 0.15658069 -2.43556 0.03511440 4. X3 -0.03713244 0.05202312 -0.71377 0.49169355

L encore, la sortie est assez proche de celles obtenues laide des autres logiciels. En particulier, le tableau du bas correspond ceux dj obtenus (estimateur des coecients, son cart-type estim, la statistique de Student, et sa p -value ). Tout un ensemble dindicateurs est toutefois donn auparavant : 131

Sries temporelles : thorie et applications

Arthur CHARPENTIER

- le R2 : Centred R**2 = 0 :702687 2 - le R2 a just, R : R Bar**2 = 0:613493 2 - un R non centr : Uncentred R**2 = 0:985401 - la variable N R2 : T x R**2 = 0 :985401 14 = 13:769 - la moyenne de la variable Y : Mean of Dependent Variable = 17:71429 - lcart-type de la variable Y : Std Error of Dependent Variable = 4:177385 - lcart-type de la rgression : Standard Error of Estimate = 2 :59707 (= s - indiqu en (7)) - la somme des carrs de erreurs ( SCR) : Sum of Squared Residuals = 67:447666031 - la statistique de Fisher : Regression F(3,10) = 7 :878, ainsi que la p -value associe (Significance Level of F) = 0 :00545230 - la statistique de Durbin Watson : Durbin Watson Statistic = 3 :186886 - la statistique Q de : Q(6-0) = 15:898588 , ainsi que la p-value associe (Significance Level of Q) = 0:01430876 Cette statistique Q correspond celle de Box-Pierce, Statistique de Box-Pierce Q, ou test de portmanteau Le test de Box-Pierce permet didentier les processus de bruit blanc (i.e. les processus alatoires de moyenne nulle, de variance constante et non autocorrls ) Cette statistique permet de tester cov ("t ; "t k ) = 0 pour tout k , soit (k) = 0 pour tout k. Ce test scrit H0 : (1) = (2) = ::: = (h ) = 0 Ha : il existe i tel que (i) 6= 0 Pour eectuer ce test, on utilise la statistique de Box et Pierce (1970) Q , donne par Qh = T
h X

k =1

o h est le nombre de retards, T est le nombre dobservations et b k lautocorrlation empirique. Asymptotiquement, sous H0 , Q h suit un 2 h degrs de libert. Nous rejetons lhypothse de bruit blanc au seuil h si Q est suprieure au quantile dordre (1 ) de la loi du 2 h degrs de libert. Une statistique ayant de meilleurs proprits asymptotiques peut tre utilise : Q0 h = T (T + 2)
h X

b 2 k

k =1

qui suit asymptotiquement, sous H0 une loi du 2 h degrs de libert. Ces tests sont appels par les anglo-saxons portmanteau tests, soit littralement tests fourre-tout. RAT S eectue le test pour h = 6 . Exemple 42 Dans lexemple prcdant, Q 6 = 15:898588 qui est comparer avec la quantile de la loi de 2 6 degrs de libert : 10 :645 , ce qui conduit rejeter H0 , hypothse de bruit blanc des rsidus. Ce rejet est conrm par le faible niveau de la p -value.

bk T k

6.3

Lecture de lautocorrlogramme sous Eviews

Sous EViews, les autocorrlogrammes se prsentent sous la forme suivante

(1)

(2)

(3)

(4)

132

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Les courbes gauche correpondent lautocorrlogramme de la srie, et son autocorrlogramme partiel. Les valeurs des sries sont donnes respectivement en (1) et en (2). Lautocorrlogramme (1) correspond (h ) = corr (Xt ; Xt h ), estim partir de lchantillon par c T ( h) =
T h X c 1 T (h ) o c ( h ) = X t X T X t h X T T c T h t=1 T (0)

La fonction dautocorrlation partielle (2) correspond X (h ) dni parpar

X ( h) = corr (Xt h EL (Xth jXt1 ; :::; Xth+ 1 ) ; Xt EL (XtjXt1 ; :::; Xt h+1 )) Le test (3) est la valeur du test de Ljung-Box, et la valeur (4) tant la puissance de ce test. Remarque 27 Contrairement aux sorties de rgression et aux graphiques, il est assez dicile de copier les donnes de lautocorrlogramme, qui ne correspondent ni un image (comme pouvait ltre un graphique : les autocorrlations ou la Q-stat sont prsents sous format texte : il est possible de copier dans un document la valeur exacte de lautocorrlation), ni du texte (les graphiques de gauche - autocorrlogrammes - seraient alors copis sous une forme dicilement exploitable). La mthode la plus simple semble alors tre dutiliser la copie dcran. Pour cela, il sut gnrallement de cliquer simultanment sur les touches XXX et Impr cran sur le clavier, et de coller limage dans le traitement de texte2 0 .

6.4

Estimation dun modle ARM A sous Eviews

Considrons la srie Zt (reprsente gauche ), et considrons la modlisation ARM A (2; 1), dont lestimation donne les rsultats ci-dessous droite
4
LS // Dependent Variable is Z Sample: 3 798 Included observations: 796 after adjusting endpoints Convergence achieved after 5 iterations Variable Coefficient AR(1) AR(2) MA(1) 0.550493 -0.398390 -0.504204 Std. Error 0.064097 0.033359 0.067464 0.171043 0.168953 1.020111 825.2175 -1143.822 2.001555 .28 -.57i .50 T- Statistic 8.588434 -11.94246 -7.473705 Prob . 0.0000 0.0000 0.0000 0.017017 1.119012 0.043586 0.061222 81.81215 0.000000

-2

R-squared Adjusted R- squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Inverted AR Roots Inverted MA Roots

Mean dependent var S.D. dependent var Akaike info criterion Schwartz criterion F-statistic Prob(F-statistic) .28+.57i (17)

-4 100 200 300 400 Z 500 600 700

Cette sortie (obtenue sous EV iews) est trs proche de la sortie dune rgression linaire que nous avions dj comment en (6 :2). Seule la ligne (17) napparait pas lors dune simple rgression linaire 6.4.1 Racines des polynmes AR et M A (17)

Linformation supplmentaire, correspondant la sortie (17) correspond linverse des racines du polynme ARM A. Dans lexemple que nous avons considr ici, les inverses des racines du polynme AR sont 0 :28 0 :57 i , et linverse de la racine de la composante M A est 0 :50 . Deux rsultats importants sont noter : - les racines sont lextrieur du disque unit (les inverses tant lintrieur ), et ne sont pas de module gal 1 - les racines du polynme AR et du polynme M A sont distinctes La sortie ci-dessous gauche correspond lestimation dun modle ARM A (2; 1), et droite, dun modle ARM A (3; 2)
2 0 Toute

autre suggestion de mthode sera la bienvenue.

133

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Comme nous pouvons le noter, nous retrouvons des racines trs proches de celle obtenu dans le cas ARM A (2 ; 1) , mais nous obtenons une racine commune ( 0:45) aux deux polynmes : le processus ARM A nest alors plus sous la forme minimale. Dans ce cas, aucun des coecient napparait comme signicatif, mme si les R2 et la statistique de Fisher sont identiques pour les 2 modle. En fait, toutes les statistiques sont identiques pour les deux modles : nous obtenons exactement le mme modle. 6.4.2 Tests sur les erreurs "t

Un grand nombre de tests et dinformation peuvent tre obtenus sur le processus "t,
4 2 0 4 2 0 -2 -4 -2 -4

100

200

300

400

500

600

700 Fitted

Residual

Actual

Les crans ci-dessous montrent lensemble des tests quil est possible de faire sur les rsidus.

Autocorrlogramme des erreurs Lautocorrlogramme permet de tester lhypothse de bruit blanc des erreurs, ou plutt le caractre non-autocorrl des erreurs. Dans notre exemple, les 3 premires valeurs de la p -value de la statistique Q de Ljung Box napparait pas, correspondant aux 3 termes du modles ARM A (2; 1) (2 coecients autorgressifs et 1 coecient moyenne mobile ). Sur lexemple ci-dessous, la p -value (toujours trs leve ) permet de valider lhypothse de bruit-blanc de lerrreur "t ,

134

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Distribution (marginale ) des erreurs

Les statistique de la distribution des erreurs permettent de tester lhypothse de normalit des erreurs "t . Encore une fois, si cette hypothse ne fait pas partie des hypothses de base des modles ARM A, cette hypothse est ncessaire pour faire tous les tests de validation du modle ( Student, Fisher, vraissemblance ). Tests LM et modlisation ARCH des rsidus

Test LM - test de Breusch-Godfrey Ce test est (de mme que le test de Durbin Watson ) un test dautocorrlation des erreurs " t. Toutefois, cette procdure permet de tester lautocorrlation des ordres plus levs que lordre 1 , comme ctait le cas pour le test de Durbin Watson. Supposons que nous ayons test le modle (L) Xt = (L) "t , et que lon souhaite tester une autocorrlation des erreurs de la forme m X "t = i"t i = (L) "t
i =1

Le test du multiplicateur de Lagrange mis en place par Breusch et Godfrey vise tester lhypothse H0 : i = 0 pour tout i. Pour cela, on considre le modle( ) ( L) Xt = (L) (L) "t : sous lhypothse H0 , alors (n m ) R2 suit un chi-deux m degrs de libert. En loccurence, E V iews teste une forme M A (2) pour les erreurs " t. Sur lexemple tudi, on peut noter que la statistique de Fisher du modle ( ) vaut 0 :136 , avec une p -value de 87%, et le la statistique ( n m) R2 est nulle. Ce test permet de rejeter lhypothse o les erreurs "t suivent un modle M A (2) : 135

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Mo dlisation ARC H (1) des erreurs Il est galement possible de tester si les erreurs " t suivent un modle ARC H (1). La sortie obtenue sous E V iews prsentent la statistique de Fisher et le R2 du modle (L) Xt = (L) "t o " t suit un processus ARCH (1) . De plus, E V iews donne les rsultats de lestimation des paramtres du modle ARCH (1) ajust sur la srie "t ; q "t s t c + " 2 t1 o t est un bruit blanc

Si la constante est signicative sur lexemple prsent, le paramtre lest nettement moins ( statistique de Student valant 0 :83 , correspondant une p -value de 40%) : lhypothse ARC H (1) des erreurs est rejete.

6.5

Les sorties de la procdure ARIM A sous SAS

Les sorties ci-dessous correspondent lestimation laide de la procdure ARIM A de SAS dun modle de type (1 L ) 1 L4 (1 L) Zt = 1 L L2 "t

pourune variable Z . La premire sortie correspond lautocorrlogramme de la srie Zt comme cela est rappel par la ligne (1). Les lignes (2) et (3) rappellent la moyenne et lcart type empiriques que la srie Zt . Enn (5) donne le nombre utilisables : si lon part de 200 observations et que lon considre la srie direncie deobservations Y t = (1 L) 1 L4 , on ne pourra travailler que sur 195 observations. La colonne de gauche (4) indique le retard h (allant ici de 0 15 ), la colonne (5) donne les autocovariances empiriques b (h) et la colonne (6) les autocorrlations empiriques b ( h) = b ( h) =b (0). Les points (7), . donnent lintervalle de conance de la srie des autocorrlations empiriques : ils donnent la limite de la rgion dacceptation du test (h) = 0. Lcart-type de lestimateur b (h ) est donn colonne (9). Enn, les barres (8) ; **** reprsentent les autocorrlations.
ARIMA Procedure Name of variable = Z. (1) Mean of working series = 0.042511 Standard deviation = 1.112798 Number of observations = 75 (1) (2) (3) (9) Std 0 0.115470 0.129426 0.130392 0.133566 0.134065 0.139042 0.140154 0.140483 0.141641 0.145306 0.145436 0.148441 0.149047 0.150174 0.152213

Autocorrelations (4) (5) (6) Lag Covariance Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1 0 1.238320 1.00000 | |********************| 1 -0.443324 -0.35800 | *******| . | 2 -0.120113 -0.09700 | . **| . | 3 -0.219486 -0.17724 | .****| . | 4 0.087635 0.07077 | . |* . | 5 0.279599 0.22579 | . |***** (8) | 6 -0.133568 -0.10786 | . **| . | 7 -0.072910 -0.05888 | . *| . | 8 -0.137041 -0.11067 | (7) . **| . | 9 0.245910 0.19858 | . |**** . | 10 0.046701 0.03771 | . |* . | 11 -0.225334 -0.18197 | . ****| . | 12 -0.101882 -0.08227 | . **| . | 13 0.139227 0.11243 | . |** . | 14 0.188290 0.15205 | . |*** . | 15 -0.0045016 -0.00364 | . | . | "." marks two standard errors

La sortie suivante donne lautocorrlogramme inverse (10) et lautocorrlogramme partiel (11) de la srie Zt ,
ARIMA Procedure Inverse Autocorrelations (10) Lag Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1 1 0.77158 | . |*************** | 2 0.61314 | . |************ | 3 0.50585 | . |********** | 4 0.38195 | . |******** | 5 0.28273 | . |****** | 6 0.26963 | . |***** | 7 0.27145 | . |***** | 8 0.28372 | . |****** | 9 0.23720 | . |***** | Partial Autocorrelations (11) Lag Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1 1 -0.35800 | *******| . | 2 -0.25827 | *****| . | 3 -0.38516 | ********| . | 4 -0.29795 | ******| . | 5 0.02150 | . | . | 6 -0.05608 | . *| . | 7 -0.06272 | . *| . | 8 -0.15030 | . ***| . | 9 0.04093 | . |* . |

136

Sries temporelles : thorie et applications

Arthur CHARPENTIER

Le tableau suivant donne le test de Portmanteau ( autocorrelation check for white noise ) permettant de tester lhypothse de bruit blanc des rsidus. La statistique considre est Q K = N (N + 2)
K X b 2 (h ) Nh h=1

qui suit un 2 k p q degrs de libert sous lhypothse H0 de bruit blanc. La colonne (12) donne la valeur de K , nombre de retards considrs, et la colonne (13) donne La colonne (14) indique le nombre de degrs de libert associ au test du 2 . Enn, la colonne (15) donne la probabilit que le 2 ( K p q) soit suprieur Q K . Enn, (16) rappelle les autocorrlations empiriques (soit (6)),
ARIMA Procedure Autocorrelation Check for White Noise (12) (13) To Chi (14) Lag Square DF 6 18.85 6 12 27.39 12 (15) Autocorrelations (16) Prob 0.004 -0.358 -0.097 -0.177 0.071 0.226 -0.108 0.007 -0.059 -0.111 0.199 0.038 -0.182 -0.082 ARIMA Estimation Optimization Summary (17) Estimation Method: Unconditional Least Squares Parameters Estimated: 4 Termination Criteria: Maximum Relative Change in Estimates Iteration Stopping Value: 0.001 Criteria Value: 2.01533823 Maximum Absolute Value of Gradient: 31.2375772 R-Square (Relative Change in Regression SSE) from Last Iteration Step: 0.99999906 Objective Function : Sum of Squared Residuals Objective Function Value: 59.010527 Marquardt's Lambda Coefficient: 0.00001 Numerical Derivative Perturbation Delta: 0.001 Iterations: 4 Warning Message: Estimates may not have converged.

La colonne (17) [A FINIR]


ARIMA Procedure Unconditional Least Squares Estimation (19) (18) Approx . (20) (21) Parameter Estimate Std Error T Ratio MU 0.04560 0.0077016 5.92 MA1,1 1.06967 0.41311 2.59 MA1,2 -0.06969 0.32291 -0.22 AR1,1 0.43898 0.31266 1.40 Constant Estimate = 0.02558089 (23) (24) (25) (26) (27) (28) (29) AR1,1 0.055 0.786 -0.929 1.000

(22) Lag 0 1 2 1

Variance Estimate = 0.83113418 Std Error Estimate = 0.91166561 AIC = 206.350923 SBC = 215.620875 Number of Residuals= 75

Correlations of the Estimates Parameter MU MA1,1 MA1,2 AR1,1 MU 1.000 0.052 -0.051 0.055 MA1,1 0.052 1.000 -0.843 0.786 MA1,2 -0.051 -0.843 1.000 -0.929

137

Sries temporelles : thorie et applications

Arthur CHARPENTIER

ARIMA Procedure To Lag 6 12 18 24 Chi Square 8.98 17.54 25.73 30.16 Autocorrelations (30) DF Prob 3 0.030 -0.099 -0.069 -0.131 0.109 0.253 -0.054 9 0.041 -0.068 -0.091 0.168 0.017 -0.203 -0.115 15 0.041 0.087 0.144 -0.028 -0.230 -0.049 0.003 21 0.089 0.048 -0.073 -0.147 0.070 0.028 -0.079

Model for variable Z Estimated Mean = 0.04559679 (31) Autoregressive Factors (32) Factor 1: 1 - 0.43898 B **(1) Moving Average Factors (33) Factor 1: 1 - 1.0697 B**(1) + 0.069688 B**( 2)

6.6

Utilisation de SAS avec des sries chronologiques

Nous allons reprendre ici 2 exemples (sample programs ) de SAS , le premier montrant comment mettre en place la mthode de Holt-Winters, et la seconde montrant comment faire de la modlisation laide de processus ARIM A,
title1 'Intervention Data for Ozone Concentration'; title2 '(Box and Tiao , JASA 1975 P.70)'; data air; input ozone @@; label ozone = 'Ozone Concentration' x1 = 'Intervention for post 1960 period' summer = 'Summer Months Intervention' winter = 'Winter Months Intervention'; date = intnx( 'month' , '31dec54'd, _n_ ); format date monyy.; month = month( date ); year = year( date ); x1 = year >= 1960; summer = ( 5 < month < 11 ) * ( year > 1965 ); winter = ( year > 1965 ) - summer ; cards; 2.7 2.0 3.6 5.0 6.5 6.1 5.9 5.0 6.4 7.4 8.2 3.9 4.1 4.5 5.5 3.8 4.8 5.6 6.3 5.9 8.7 5.3 5.7 5.7 3.0 3.4 4.9 4.5 4.0 5.7 6.3 7.1 8.0 5.2 5.0 4.7 3.7 3.1 2.5 4.0 4.1 4.6 4.4 4.2 5.1 4.6 4.4 4.0 2.9 2.4 4.7 5.1 4.0 7.5 7.7 6.3 5.3 5.7 4.8 2.7 1.7 2.0 3.4 4.0 4.3 5.0 5.5 5.0 5.4 3.8 2.4 2.0 2.2 2.5 2.6 3.3 2.9 4.3 4.2 4.2 3.9 3.9 2.5 2.2 2.4 1.9 2.1 4.5 3.3 3.4 4.1 5.7 4.8 5.0 2.8 2.9 1.7 3.2 2.7 3.0 3.4 3.8 5.0 4.8 4.9 3.5 2.5 2.4 1.6 2.3 2.5 3.1 3.5 4.5 5.7 5.0 4.6 4.8 2.1 1.4 2.1 2.9 2.7 4.2 3.9 4.1 4.6 5.8 4.4 6.1 3.5 1.9 1.8 1.9 3.7 4.4 3.8 5.6 5.7 5.1 5.6 4.8 2.5 1.5 1.8 2.5 2.6 1.8 3.7 3.7 4.9 5.1 3.7 5.4 3.0 1.8 2.1 2.6 2.8 3.2 3.5 3.5 4.9 4.2 4.7 3.7 3.2 1.8 2.0 1.7 2.8 3.2 4.4 3.4 3.9 5.5 3.8 3.2 2.3 2.2 1.3 2.3 2.7 3.3 3.7 3.0 3.8 4.7 4.6 2.9 1.7 1.3 1.8 2.0 2.2 3.0 2.4 3.5 3.5 3.3 2.7 2.5 1.6 1.2 1.5 2.0 3.1 3.0 3.5 3.4 4.0 3.8 3.1 2.1 1.6 1.3 ; proc arima data=air; identify var=ozone(12) crosscorr =( x1(12) summer winter ) noprint; estimate q=(1)(12) input=( x1 summer winter ) noconstant method=ml itprint; forecast lead=12 id=date interval=month; run; quit ; title1 "Sales of Passenger Cars"; symbol1 i=spline v=plus; proc gplot data=sashelp.usecon; plot vehicles * date = 1 / haxis= '1jan80'd to '1jan92'd by year; where date >= '1jan80'd; format date year4.; run; proc forecast data=sashelp .usecon interval=month method =winters seasons=month lead=12 out=out outfull outresid outest=est; id date; var vehicles ; where date >= '1jan80'd; run; title2 'The OUT= Data Set'; proc print data=out; run; proc print data=est; run; title2 'Plot of Residuals'; symbol1 i=needle; proc gplot data=out; plot vehicles * date = 1 / vref=0 haxis= '1jan80'd to '1jan92'd by year; where _type_ = 'RESIDUAL'; format date year4.; run; title2 'Plot of Forecast from WINTERS Method'; symbol1 i=none v=star h=2; /* for _type_=ACTUAL */ symbol2 i=spline v=plus h=2; /* for _type_=FORECAST */ symbol3 i=spline l=3; /* for _type_=L95 */ symbol4 i=spline l=3; /* for _type_=U95 */ proc gplot data=out; plot vehicles * date = _type_ / href= '15dec91'd haxis= '1jan90'd to '1jan93'd by qtr; where _type_ ^= 'RESIDUAL' & date >= '1jan90'd; run;

138

Sries temporelles : thorie et applications

Arthur CHARPENTIER

6.7

Mthode de lissage exponentiel : Holt-Winters

Le programme ci-dessus donne les sorties suivantes

6.8
6.8.1

Modles ARI MA sous SAS


Syntaxe de la procdure ARIM A sous SAS

La procdure ARIM A contient trois phase successives, 1/ la phase didentication (IDENTIFY) pour dnir la srie tudier et obtenir des statistiques descriptives (en particulier les autocorrlogrammes ), 2/ la phase destimation (ESTIMATE) pour eectuer lestimation des paramtres intervenant une fois la spcication du modle eectue, 3/ la phase de prvision ( FORECAST) pour eectuer la prvision de la srie considre laide du modle estim dans la phase 2. La synthaxe gnrale de cette procdure est de la forme suivante proc ARIMA data=nom_base; identify var=N_serie nlag=24; estimate p=1 q=1; forecast lead=24 interval=month id=date out=resultats; run; Pour crer une srie en direnciant la srie autant de fois quon le souhaite identify identify identify identify identify var=N_serie; var=N_serie(1); var=N_serie(12); var=N_serie(1,1); var=N_serie(1,12); on on on on on travaille travaille travaille travaille travaille sur sur sur sur sur la la la la la srie srie srie srie srie Xt Y t = LXt = Xt1 Zt Ut Vt

La forme du modle ARIM A estimer peut tre assez complexe. Pour cela, direntes notation sont possibles sous SAS estimate estimate estimate estimate estimate P=1; P=4; P=(1 4); P=(1)(4); P=(1)(1 4); on considre on considre on considre on considre on considre le le le le le poylnme poylnme poylnme poylnme poylnme AR AR AR AR AR (L) (L) (L) (L) (L) = (1 1 L) = 1 1 L 2 L 2 3 L3 4 L4 4 = 1 1 L 4 L 4 = (1 1 L) 1 4L = (1 L) 1 1 L 4 L4

De plus, un grand nombre doptions sont disponibles pour chacunes des tapes identify identify identify identify identify identify identify identify identify CENTER NOMISS ALPHA= ESACF SCAN P= Q= NLAG= STATIONARITY

la srie est centr les valeurs manquantes sont exclues permet de spcier le niveau de signicativit des tests ache les rsultats de la procdure E SAC F ache les rsultats de la procdure SCAN dtermine la dimension AR dans les mthodes ESACF et SCAN dtermine la dimension M A dans les mthodes ESAC F et SCAN permet de spcier le nombre des retards dans les autocorrlogrammes permet deectuer des tests de stationnarit sur la srie 139

Sries temporelles : thorie et applications

Arthur CHARPENTIER

estimate estimate estimate estimate estimate

METHOD= PLOT AR= MA= MU=

dtermine la mthode utilise pour lestimation ache le graphique des rsidus permet de spcier la valeur initiale du modle AR permet de spcier la valeur initiale du modle M A permet de spcier la constante

Tous les dtails sur la procdure ARIM A sont disponibles dans la doc SAS ou sur internet. 6.8.2 La lecture des sorties SAS

Les sorties SAS sont les suivantes


ARIMA Procedure Conditional Least Squares Estimation Iteration 0 SSE MA1,1 -0.2924 MA2,1 0.4074 NUM1 -1.1349 NUM2 -0.1173 NUM3 0.05581 Lambda R Crit 0.00001 1 154.53372

ARIMA Estimation Optimization Summary Estimation Method: Parameters Estimated: Termination Criteria: Iteration Stopping Value: Criteria Value: Alternate Criteria: Maximum Likelihood 5 Maximum Relative Change in Estimates 0.001 0.00019544 Relative Change in Objective Function 1.24707E-8 0.00712034 0.00007323 Log Gaussian Likelihood -245.88481 1E-9 0.001

Maximum Likelihood Estimation Iter Loglike MA1,1 MA2,1 NUM1 NUM2 NUM3 Lambda R Crit

Alternate Criteria Value: Maximum Absolute Value of Gradient: Step: Objective Function: Objective Function Value: Marquardt's Lambda Coefficient: Numerical Derivative Perturbation Delta:

R-Square (Relative Change in Regression SSE) from Last Iteration

Maximum Likelihood Estimation Approx. Parameter MA1,1 MA2,1 NUM1 NUM2 NUM3 Estimate -0.26684 0.76665 -1.33062 -0.23936 -0.08021 Variance AIC SBC Std Error 0.06710 0.05973 0.19236 0.05952 0.04978 T Ratio -3.98 12.83 -6.92 -4.02 -1.61 Lag 1 12 0 0 0 Variable Shift OZONE OZONE X1 SUMMER WINTER 0 0 0 0 0

Forecasts for variable OZONE Obs 217 218 219 220 221 222 223 224 225 226 227 228 Forecast Std Error 1.4205 1.8446 2.4567 2.8590 3.1501 2.7211 3.3147 3.4787 2.9405 2.3587 1.8588 1.2898 0.7966 0.8244 0.8244 0.8244 0.8244 0.8244 0.8244 0.8244 0.8244 0.8244 0.8244 0.8244 Lower 95% -0.1407 0.2287 0.8408 1.2431 1.5342 1.1053 1.6989 1.8629 1.3247 0.7429 0.2429 -0.3260 Upper 95% 2.9817 3.4604 4.0725 4.4748 4.7659 4.3370 4.9306 5.0946 4.5564 3.9746 3.4746 2.9057

Estimate = 0.63450562

Std Error Estimate = 0.79655861 = 501.769629 = 518.360229 204

Number of Residuals=

140

You might also like