CoursSeriesTemp Chap2

Chapitre 2.
Les Processus Alatoires Non Stationnaires
Chapitre 2 Tests de Non Stationnarit et Processus Alatoires Non Stationnaires
Chapitre 2. Les Processus Alatoires Non Stationnaires
Dans le premier chapitre, nous avons vu quune des premire tape de la dmarche de modlisation dune srie temporelle consiste vrier la stationnarit du processus gnrateur de donnes. Gnralement, on se limite vrier la stationnarit faible ou stationnarit du second ordre. Nous allons prsent tudier de faon de plus prcise ce quest un processus non stationnaire. Il existe en eet deux sorte de non stationnarit : la non stationnarit dterministe et la non stationnarit stochastique. Nous verrons que suivant lorigine de la non stationnarit, il convient dadopter une mthode de stationnarisation particulire. La seconde partie de ce chapitre sera ensuite consacre la prsentation des principaux tests de non stationnarit. Il sagit alors de dnir une stratgie empirique permettant de vrier si les processus sont stationnaires ou au contraire si il est ncessaire de les stationnariser et quelle est alors la mthode approprie.
Processus non stationnaires
Dans le premier chapitre, nous avons introduit la notion de stationnarit du second ordre ou stationnarit faible. Daprs cette dnition, un processus est stationnaire au second ordre si lensemble de ses moments dordre un et dordre deux sont indpendants du temps. Par opposition, un processus non stationnaire est un processus qui ne satisfait pas lune ou lautre de ces deux conditions. Ainsi, lorigine de la non stationnarit peut provenir dune dpendance du moment dordre un (lesprance) par rapport au temps et/ou dune dpendance de la variance ou des autocovariances par rapport au temps. Le fait quun processus soit stationnaire ou non conditionne le choix de la modlisation que lon doit adopter. En rgle gnrale, si lon sen tient notamment la mthodologie de Box et Jenkins, si la srie tudie est issue dun processus stationnaire, on cherche alors le meilleur modle parmi la classe des processus stationnaire pour la reprsenter, puis on estime ce modle. En revanche si la srie est issue dun processus non stationnaire, on doit avant toutes choses, chercher la stationnariser, cest dire trouver une transformation stationnaire de ce processus. Puis, on modlise et lon estime les paramtres associs la composante stationnaire. La dicult rside dans le fait quil existe direntes sources de non stationnarit et qu chaque origine de la non stationnarit est associe une mthode propre de stationnarisation. Nous allons donc commencer dans cette section par prsenter deux classes de processus non stationnaires, selon la terminologie de Nelson et Plosser (1982) : les processus T S (Time Stationary) et les processus DS (Dierency Stationary). Dans la section suivante, nous prsenterons les mthodes de stationnarisation pour chacune de ces classes de processus. Mais au del des enjeux de modlisation conomtriques, nous verrons dans cette partie, que lorigine de la non stationnarit a de trs fortes
implications sur lanalyse conomique des sries que lon tudie. Nous verrons en particulier que pour les processus DS il existe une proprit de persistance des chocs qui nexiste pas dans les processus T S: Une telle hypothse implique par exemple que si les sries macroconomiques satisfont une reprsentation de type DS; limpact des chocs conjoncturels peut avoir un eet permanent sur le niveau de la srie tudie.
Avant de prsenter de faon formelle les direntes sources de non stationnarit, nous allons considrer quelques exemples simples de processus non stationnaires. Rappelons au passage la dnition de la stationnarit du second ordre (cf. chapitre 1) : Denition 1 Un processus (xt ; t 2 Z) est dit stationnaire au second ordre, ou stationnaire au sens faible, ou stationnaire dordre deux si les trois conditions suivantes sont satisfaites : 8t 2 Z; E x2 < 1 t 8t 2 Z; E (xt ) = m; indpendant de t 8 (t; h) 2 Z2 ; cov (xt ; xt+h ) = E [(xt+h m) (xt m)] = (h) ; indpendant de t Figure 1.1: Processus Non Stationnaire : Modle avec Rupture
15
10
-5 50 100 X 150 200 250
Sur la gure (1.1), est reprsente une simulation dun processus (xt ; t 2 Z) prsentant une rupture de moyenne partir de la date t0 = 125; avec ("t ; t 2 Z) i:i:d: (0; 2) : xt = 3 + "t xt = 10 + "t t < t0 t t0
Ce processus est par dnition non stationnaire (condition sur le moment dordre un) et lon vrie bien sur la gure (1.1) que la ralisation de la moyenne empirique (estimateur convergent de
lesprance) dpendra alors de lchantillon considr (avant t0 ; ou aprs t0 ): Dans ce cas, la non stationnarit provient de la rupture du modle, ou plus gnralement de la non linarit. Un autre exemple de processus non stationnaire est celui du processus suivant : xt = 1 + 0:05t + "t avec "t i:i:d:N (0; 1) : Dans ce cas, le processus xt correspond la somme dune fonction linaire du temps, f (t) = 1 + 0:05t et dun bruit blanc. Figure 1.2: Processus Non Stationnaire : Trend Dterministe
20 15 10 5 0 -5 50 100 Y 150 200 250
On voit clairement sur le graphique (1.2) que ce processus ne satisfait pas la seconde condition de la dnition de la stationnarit du second ordre. En eet E (xt ) = 1 + 0:05t croit avec le temps, chaque date la variable alatoire xt ; 8t 2 Z a une esprance plus grande que celle de xt1 ; xt2 ; :::; xtj ::: Dans ce cas, lorigine de la non stationnarit provient tout naturellement de linclusion de la tendance (ou plus gnralement de la fonction du temps f (:)) dans la dnition du processus (xt ; t 2 Z) : On dit que la non stationnarit est alors de type dterministe. Mais il existe dautres sources de non stationnarit. Considrons le processus suivant, que lon qualie gnralement de marche alatoire pure (Random Walk Process) ou marche alatoire sans drive : xt = xt1 + "t (1.1) avec "t i:i:d:N 0; 2 : A priori dans ce cas, la non stationnarit nest pas de type dterministe, " puisque le processus xt ne comporte pas de fonction dterministe du temps (gure 1.3). Pourtant ce type de processus est aussi non stationnaire. Cherchons donc dterminer lorigine de cette non
Chapitre 2. Les Processus Alatoires Non Stationnaires stationnarit. Le processus (xt ; t 2 Z) peut se rcrire sous la forme : xt = "t + "t1 + "t2 + ::: + "tj + ::: 1 X = "tj
j=0
(1.2)
La variance de xt est non convergente. De plus, si lon avait dnie une condition initiale P x0 ; alors la variance de xt ; dnie par V (xt ) = t1 2 = t2 serait fonction de t: La troisime " j=0 " condition de la stationnarit faible est alors viole. Le processus (xt ; t 2 Z) est donc un processus non stationnaire. Pourtant, lexamen dune ralisation quelconque de ce processus (gure 1.3) ne permet pas a priori de dire que cette variable est non stationnaire. On sent dores et dj, la ncessit de proposer des tests de lhypothse de stationnarit. Figure 1.3: Processus Non Stationnaire : Marche Alatoire Sans Drive
15 10 5 0 -5 -10 -15 50 100 Z 150 200 250
Donc le processus xt ; 8t 2 Z a une esprance nulle et donc satisfait la seconde condition de la dnition de la stationnarit. Mais il ne satisfait pas la premire condition puisque : 1 0 1 1 1 X X X A= @ V ("tj ) = 2 1 (1.4) "tj V (xt ) = V "
j=0 j=0 j=0
Ds lors, connaissant les proprits du bruit blanc "t ; on montre que : 1 0 1 1 X X A= @ E ("tj ) = 0 "tj E (xt ) = E
j=0 j=0
(1.3)
Dans ce dernier cas, la non stationnarit du processus (xt ; t 2 Z) tient au fait que les chocs "t saccumulent au cours du temps, ce qui accrot la variance de xt au fer et mesure que le temps passe. Lorigine de la non stationnarit provient ici de laccumulation de chocs stochastiques "t :
la non stationnarit peut donc tre de type stochastique. Le fait que la stationnarit puisse tre de type dterministe ou stochastique nous amne prsent dnir la classe des processus T S (T rend Stationary), qui correspondent une non stationnarit de type dterministe et la classe des processus DS (Dif ferency Stationary), qui correspondent une non stationnarit de type stochastique. Cette distinction selon lorigine de la non stationnarit est essentielle tant sur le plan statistique que sur le plan de lanalyse conomique.
1.1
Les processus TS
Commenons par dnir ce quest un processus T S pour T rend Stationary , selon la terminologie propose par Nelson et Plosser (1982) Denition 2 (xt ; t 2 Z) est un processus T S sil peut scrire sous la forme xt = f (t) + zt (1.5)
o f (t) est une fonction du temps et zt est un processus stochastique stationnaire. Dans ce cas, le processus xt scrit comme la somme dune fonction dterministe du temps et dune composante stochastique stationnaire, ventuellement de type ARMA: Ds lors, il est vident que le processus ne satisfait plus la dnition de la stationnarit du second ordre. En eet, on montre immdiatement que E (xt ) = f (t) + z o z = E (zt ) ; dpend du temps, ce qui viole la seconde condition de la dnition dun processus stationnaire. Lexemple le plus simple dun processus T S est celui dune tendance linaire perturbe par un bruit blanc. On pose f (t) = a0 + a1 t et zt = "t : xt = a0 + a1 t + "t (1.6)
avec (a0 ; a1 ) 2 R2 ; "t i:i:d: 0; 2 : Dans ce cas, on vrie que le processus xt est non stationnaire " puisque lesprance, E (xt ) = a0 + a1 t; dpend de t: En revanche, le processus yt dni par lcart entre xt et la composante dterministe f (t) = a0 + a1 t; est quand lui stationnaire : yt = xt a0 + a1 t = "t est un bruit blanc, par dnition stationnaire.
Une des proprits importantes de ce type de processus rside dans linuence des innovations stochastiques "t : En eet, nous allons montrer que lorsque un processus T S est aect par un choc stochastique, leet de ce choc tend disparatre au fer et mesure que le temps passe : cest la proprit de non persistance des chocs. De faon plus formelle, cette proprit est la suivante :
Chapitre 2. Les Processus Alatoires Non Stationnaires Proprit 1. Linuence dun choc "t une date T sur un processus xt dni par xt = f (t) + zt
avec zt stationnaire et E (zt ) = 0; est transitoire. La tendance du modle tant dterministe, aprs le choc "T ; la squence des xt converge ainsi vers sa valeur de long terme dnie par f (t) : Il ny a pas de persistance des chocs. Cela signie que lorsque lon a un processus T S, en cas de choc positif ou ngatif une date donne, toutes choses gales par ailleurs, linuence de ce choc a tendance sestomper au cours du temps. La variable considre rejoint alors sa dynamique de long terme dtermine par f (t). Dans le cas o f (t) est une fonction ane du temps, la variable rejoint la tendance linaire de long terme. Cette proprit traduit lexistence dune tendance non stochastique, et qui donc ne prsente pas de rupture ds lors que la fonction f (t) est continue. Economiquement, cela signie que la trajectoire de long terme de la srie est insensible aux alas conjoncturels. An dillustrer cette proprit considrons lexemple suivant o lon a introduit une structure autorgressive dans la perturbation zt : xt = a0 + a1 t + zt (1.7)
zt = zt1 + "t (1.8) o (a0 ; a1 ) 2 R2 , jj < 1 et "t i:i:d: 0; 2 : Le processus zt est un AR (1) stationnaire, puisque " la racine associe son polynme autorgressif, gale 1=, est suprieure lunit en module. Admettons que E (zt ) = 0: Etudions prsent linuence du choc "t une date T quelconque sur la squence des (xt ; t T ) : Pour ce faire, appliquons la dcomposition de Wold au processus stationnaire zt ; il vient : 1 X zt = j "tj
j=0
On peut alors rcrire le processus xt sous la forme suivante : xt = a0 + a1 t +

1 X j=0
j "tj
Supposons qu la date T; on a ait une ralisation du choc "T positive ("T > 0) et quensuite les chocs "t pour t T soient nuls. A la date T; on a donc : xT = a0 + a1 T +
1 X j=0
j "T j
A la date T + 1; les chocs "T +1 tant nul, on obtient : xT +1 = a0 + a1 (T + 1) +

1 X j=1
j "T +1j
Chapitre 2. Les Processus Alatoires Non Stationnaires De faon gnrale, toute date T + k; k 0; le processus xT +k est dni par : xT +k = a0 + a1 (T + k) +
1 X j=k
j "T +kj
(1.9)
On peut alors montrer que plus le temps passe, cest dire plus k est lev, plus linuence du choc "T de la date T sestompe. Linuence de ce choc est donc transitoire. En eet, la v.a.r. xT +k va converger vers sa valeur de long terme dnie par la tendance linaire f (:) : Pour le montrer, il sut de considrer lcart entre xT +k et la valeur correspondante de la tendance f (T + k) = a0 + a1 (T + k) et de montrer que cet cart converge vers 0 quand k tend vers linni. On pose xt = xt f (t) : A la date T + k; on a xT +k = xT +k a0 + a1 (T + k) et daprs lquation e e (1.9), cet cart la tendance linaire; peut se rcrire sous la forme : xT +k = e
1 X j=k
j "T +kj = lim
n!1
k "T + k+1 "T 1 + ::: + k+n "T n
(1.10)
Ce rsultat signie que lorsque k tend vers linni, lcart entre le processus xT +k et la tendance linaire, converge en probabilit vers 0. Ainsi, sous leet des chocs antrieurs la date T; on sest loign de la tendance, mais lorsque le temps passe, leet de ces chocs sestompe et lon rejoint la tendance de long terme. Ce rsultat illustre labsence de persistance des chocs, ou labsence dhystrsis pour les processus T S.
Sous lhypothse que le processus zt est stationnaire, cest dire sous lhypothse que jj < 1; alors montre immdiatement que : p xT +k ! 0 e (1.12)
k!1
Maintenant, voyons ce qui se passe lorsque lon sloigne de la date du dernier choc T; cest dire lorsque k tend vers linni. h i lim xT +k = lim lim k "T + k+1 "T 1 + ::: + k+n "T n e (1.11)
k!1 k!1 n!1
Nous allons prsent raliser une exprience numrique pour illustrer cette proprit de non persistance. On considre le processus xt = 1+0:05 t+zt avec zt = zt1 +"t o z0 = 1; = 0:4 < 1 et "t i:i:d: (0; 1) : Le prol gnral dune ralisation de ce processus est celui de la gure (1.2). Nous allons prsent crire un petit programme sous Eviews dans lequel nous allons annuler toutes les ralisations du choc "t partir de la date T = 50; puis nous allons comparer les volutions du processus xt et de la tendance dterministe f (t) = 1 + 0:05 t: Le programme1 utilis sous Eviews est le suivant :
Pour lancer ce programme, il convient au pralable de crer un Workle de type Undated or Irregular, de 1 100, puis de charger le programme (open program ) ou de le taper (new program ), et ensuite de lexcuter (Run).
1

0 - Creation de la serie de chocs-
smpl 1 50 genr eps = nrnd smpl 51 100 genr eps = 0 0 - Creation de la composante stationnaire z smpl 1 100 genr z = 1 smpl 2 100 genr z = 0.4*z(-1)+eps 0 - Creation de la tendance f smpl 1 100 genr f = 1+0.05*@trend(1) 0 - Creation de la serie x genr x = f+z Ce programme dbute par la simulation dune ralisation des chocs tirs dans une loi normale N (0; 1) par linstruction nrnd sur la priode de 1 50, puis par lannulation des chocs pour t allant de 51 100. Ensuite on construit une ralisation de la composante stationnaire zt . On commence pour cela par initialiser la srie zt lunit (puisque z0 = 1) sur lensemble de la priode, puis on gnre un AR (1) grce linstruction z(-1) qui correspond aux valeurs retardes dune priode de la srie zt : Enn, on cre la composante tendancielle dterministe f (t) laide de linstruction @trend(n) qui permet de gnrer un trend prenant la valeur 0 la date N. Figure 1.4: Illustration de la Proprit de Non Persistance des Chocs : Processus T S
8 6 4 2 0 -2 10 20 30 40 50 X 60 F 70 80 90 100
10
Sur le graphique (1.4) on a report les deux sries f et x en crant un groupe sous Eviews. On vrie sur cette gure qu partir de la date darrt des chocs (T = 50), la ralisation du processus xt converge vers la tendance dterministe. Les chocs antrieurs la date T voient leur inuence diminuer au fer et mesure que le temps passe. On vrie bien ici la proprit de non persistance des chocs propre au processus T S.
1.2
Les processus DS
Comme nous lavons prcdemment mentionn, il existe une autre forme de non stationnarit, provenant non pas de la prsence dune composante dterministe tendancielle, mais dune source stochastique. Cest pourquoi nous allons prsent introduire la dnition des processus DS pour Dif ferency Stationnary. Denition 3 Un processus non stationnaire (xt ; t 2 Z) est un processus DS (Dif ferency Stationnary) dordre d; o d dsigne lordre dintgration, si le processus ltr dni par (1 L)d xt est stationnaire. On dit aussi que (xt ; t 2 Z) est un processus intgr dordre d; not I (d) : Ainsi, on peut dnir une classe de processus stochastiques qui ne satisfont pas les conditions de la stationnarit, mais dont la dirence lordre d satisfait elle les proprits de la stationnarit. Par exemple, si un processus zt nest pas stationnaire, on dit que ce processus est DS, intgr dordre un, not I (1) ; si le processus dni par la dirence premire zt = zt zt1 est quant lui stationnaire. De la mme faon, le processus zt est I (2) si le processus dni par la dirence seconde (1 L)2 zt = (1 L) zt = zt 2zt1 + zt2 est stationnaire. On comprend alors que la dnition des processus DS repose sur la prsence de racines unitaires dans le polynme associ la dynamique autorgressive du processus. Proprit 1. Un processus non stationnaire (xt ; t 2 Z) est un processus DS intgr dordre d, not I (d) ; si le polynme (L) dni en loprateur retard L; associ sa composante autorgressive admet d racines unitaires : (L) xt = zt e avec (L) = (1 L)d (L) (1.13)
e En eet, on pose (L) xt = zt avec (L) = (1 L)d (L) : Si lon admet que les racines du e polynme (L) sont infrieures lunit en module, ce polynme est inversible. On peut alors crire la dirence deme de xt sous la forme dune somme de valeurs retardes de zt ; : e (1 L)d (L) xt = zt () (1 L)d xt = (L) zt (1.14)
e o zt est un processus stationnaire, et si les racines du polynme (L) sont toutes suprieures strictement lunit en module.
11
e o (L) = 1 (L) : Si zt est un processus stationnaire, la somme pondre de ses valeurs passes (L) zt est elle aussi stationnaire. Donc, en rsum, ds lors que le polynme autorgressif (L) de xt admet d racines unitaires, la quantit (1 L)d xt est stationnaire, donc le processus xt est I (d) :
Exemple : Considrons le processus ARMA(2; 2) suivant (L) xt = (L) "t avec (L) = 1 2:5L + 1:5L2 et (L) = (1 0:5L) ; et "t i:i:d: 0; 2 : On admet que xt est non " stationnaire et lon cherche dterminer si xt est un processus I (d) et quel est alors son degr dintgration. Pour cela il sut de dterminer le nombre de racines unitaires de (L) : Soient 1 et 2 les racines de (L) = 0; on a 1 = 1 et 2 = 2=3: Ds lors, le processus xt est I (1) ; en eet : 1 3 1 e 1 L = (1 L) 1 L (1 L)d (L) (L) = 1 L 1 2 2 e o (L) = 1 3 L admet une racine 2 = 2=3 infrieure un en module. 2 Dans la classe gnrale des processus DS, un type de processus apparat de faon rgulire, si bien que lon lui a attribu un nom particulier : la marche alatoire. Denition 4 Une marche alatoire (Random W alk) est un processus AR (1) intgr dordre un, not I (1) : xt = (1 L) xt = c + "t () xt = c + xt1 + "t (1.15)
o "t est un bruit blanc i:i:d: 0; 2 : Si c = 0; on parle dune marche alatoire pure " (P ure Random W alk) : xt = xt1 + "t (1.16) Le terme de marche alatoire provient du fait que la ralisations du processus la date t; part de lendroit o stait arrt xt1 (la ralisation de xt1 ) et va dans une direction (le choc "t ) totalement alatoire. De faon gnrale, il convient de bien distinguer (i) les processus intgrs, (ii) la marche alatoire et (iii) les martingales qui sont souvent employes en nance. Nous avons vu que la marche alatoire est un processus intgr particulier avec une dynamique autorgressive dordre 1 : cest donc un AR(1): Maintenant, reste prciser la dirence qui existe entre la marche alatoire dune part, et plus particulirement la marche alatoire pure (c = 0), et une martingale dautre part. Cette distinction est particulirement importante en nance. En eet, sous des proprits particulires
12
(marchs complets etc..), on peut montrer quil ny a pas de meilleure prdicteur pour le cours de demain dun actif nancier que le cours daujourdhui. Techniquement, cette proprit revient dmontrer que le cours dun actif a les proprits dune martingale. Dnissons prsent ce quest une martingale2 .: Denition 5 Un processus (xt ; t 2 Z) est une martingale si et seulement si : E xt+1 =xt = xt 8t 2 Z (1.17)
Alors quelle est la dirence entre une martingale (quation 1.18) et une marche alatoire pure (quation 1.16) ? Tout dpend de la dnition que lon donne au bruit blanc "t: La premire faon3 de dnir "t , la plus simple, mais aussi la plus restrictive, consiste a supposer que les bruits blancs "t sont indpendamment et identiquement distribus (i:i:d:) : tel est le cas dans la dnition (4). Ds lors, sous cette hypothse, la marche alatoire pure (quation 1.16) correspond une martingale. P En eet, les accroissements de xt sont indpendants donc E "t =xt1 = E "t = 1 "tj = 0: j=0 Mais cette dnition de la marche alatoire nest pas la seule possible. On peut dnir la marche alatoire en levant lhypothse de distribution identique, mais en conservant lhypothse dindpendance : "t indpendamment mais non identiquement distribus4 , i:n:i:d: 0; 2 : On peut aussi lever lhypothse dindpendance5 et ne plus conserver que lhypothse " de bruit blanc au sens faible (cf chapitre prcdent) : E ("t ) = 0 E "2 = 2 t " E ("t "tk ) = 0 8k 6= 0 (1.19)
De faon quivalente, cette condition peut scrire sous la forme : xt+1 = xt + "t avec E "t =xt1 = 0 8t 2 Z
(1.18)
Dans ce cas, la dnition de la martingale devient plus contrainte que celle de la marche alatoire pure (cf. Gouriroux et Jasiak 2001) : on perd alors lquivalence entre la pure marche alatoire et la martingale. En eet, la proprit de martingale implique lindpendance des accroissements "t ; or la dnition de la marche alatoire nimplique plus alors que la nullit de la corrlation de ces accroissements. Or, si lindpendance implique la nullit des covariances, la rciproque nest pas toujours vraie. Dans la suite de ce cours, par souci de simplicit, nous postulerons souvent lhypothse dindpendance des accroissements ("t i:i:d):
Pour une discussion dtaille cf. Financial Econometrics, C. Gourieroux et J. Jasiak (200), Princeton. Note RW1 chez Campbell, Lo et McKinley (1996), The Econometrics of Financial Markets, Princeton University Press. 4 Note RW2, dans Campbell and al. (1996). 5 Note RW3, dans Campbell and al. (1996)
3 2
13
Une des principales proprits des processus DS est lhystrsis ou la persistance des chocs. Proprit 2. Linuence dune innovation "t une date T sur un processus I (d) (1 L)d xt = (L) "t (1.20)
est permanente. On a ainsi une proprit de persistance des chocs ou dhystrsis. Cela signie que, contrairement au cas des processus T S; les chocs alatoires "t conservent une inuence sur le niveau de la variable I (d) et cela jusqu linni des temps. Pour bien comprendre cette proprit, nous allons considrer le cas dune marche alatoire avec drive : xt = c + xt1 + "t (1.21)
o "t i:i:d: 0; 2 : On sait que ce processus I (1) est, par dnition, non stationnaire, donc on " ne peut pas lui appliquer la dcomposition de Wold (cf. chapitre prcdent). Pour autant, rien ne nous empche dexprimer xt sous la forme dune moyenne mobile innie dans les innovations passes "tj : En eet, on a xt = c + xt1 + "t ; en substituant xt1 par son expression on obtient xt = 2c + xt2 + "t1 + "t : En itrant t fois cette substitution, on obtient nalement : xt = x0 + t:c +
t X j=1
"j
(1.22)
On constate6 partir de cette criture moyenne mobile innie que le processus (xt ; t 2 Z) correspond une accumulation des chocs passs et prsent. Ds lors, un choc une date T quelconque un impact permanent sur le niveau processus pour toutes les dates ultrieures. Supposons ainsi pour simplier que c = 0 et quil ny ait quun seul choc "T la date T ("t = 0; 8t 6= T ). Le processus xt la date T est alors dni par xT = x0 + "T : Pour tout k 0; on a xT +k = x0 + "T : Ds lors, lorsque k tend vers linni, le niveau du processus xT +k ne rejoint pas la valeur initiale x0 : Leet du choc est donc permanent.
Ds lors, les trois conditions de la stationnarit du second ordre sont violes. Ceci est vrai, mme si la constante c est nulle puisque dans ce cas les premire (quation 1.24) et troisime conditions (quation 1.25) demeurent invalides. Pour stationnariser la srie, il sut de lui appliquer le ltre (1 L)d ; avec ici d = 1: En eet, (1 L) xt = "t ; o "t est un bruit blanc, donc la srie (1 L) xt est bien stationnaire.
6 On vrie au passage que la marche alatoire xt est non stationnaire puisque si lon suppose que la condition initiale x0 est donne et exogne, on a : E (xt ) = t = x0 + t:c (1.23) 2 2 lim E (xt t ) = lim t" = 1 (1.24) t!1 t!1 (h) = E (xt t ) xth th = 2 min (t; t h) 8h 2 Z (1.25) "
14
Sur la gure (1.5), on a simul deux marches alatoires avec et sans drive, pour un chantillon de taille 100. La premire not xt correspond au processus xt = xt1 + "t et la seconde au processus yt = yt1 + 0:05 + "t avec "t i:i:d: N (0; 1) et x1 = y1 = 1: Le programme utilis sous Eviews est le suivant :
0 - Creation de la serie d innovations-
smpl 1 1000 genr eps = nrnd 0 - Initialisations des series smpl 1 1000 genr x = 1 genr y = 1 0 - Creation des series x et y smpl 2 1000 genr x = x(-1)+eps genr y = y(-1)+0.05+eps smpl 1 1000 Le programme nappelle aucun commentaire particulier. Pour les deux ralisations obtenues sur la gure (1.5), on constate qua priori il nexiste aucun phnomne de rattrapage vers une quelconque tendance linaire de long terme pour ces deux processus. Mais en fait, nous verrons que leur tendance est stochastique. Figure 1.5: Simulations de Marches Alatoires
80 60 40 20 0 -20 200 400 X 600 Y 800 1000
15
1.3
Processus DS ou T S : quels enjeux ?
A ce niveau de lexpos, on peut se demander quels sont les enjeux associs la distinction entre les notions de non stationnarit dterministe et de non stationnarit stochastique. En eet aprs tout, jusquen matrise les tudiants ont dj eu une certaine pratique de lconomtrie sans connatre la notion de stationnarit. Alors, aprs tout, quest ce que cela change que les sries soient T S; DS etc..., pourrait se demander ltudiant press de cliquer sur sa souris. Nous allons montrer que les consquences sont doubles, sur le plan statistique et sur le plan conomique. 1.3.1 Consquences statistiques de la non stationnarit
Ce que nous allons montrer tout au long de ce chapitre, cest que si on lve lhypothse de stationnarit, et quen particulier on considre des processus de la classe DS, alors les principales mthodes destimation et dinfrence deviennent non fondes. Remarque Les proprits de stationnarit ou de non stationnarit des sries utilises dterminent le type de modlisation et les proprits asymptotiques des mthodes conomtriques correspondantes. En dautres termes, le fait de savoir si la srie statistique est une ralisation dun processus stationnaire, non stationnaire DS ou non stationnaire T S conditionne dune part le choix du modle conomtrique qui doit tre utilis. Mais de faon plus fondamentale et insidieuse, cela conditionne les proprits asymptotiques des estimateurs des paramtres de ce modle et donc par consquent les proprits asymptotiques des statistiques des tests usuels sur les paramtres. Si le processus est stationnaire on retrouve les proprits standard du cours dconomtrie de base, mais si le processus est non stationnaire, et en particulier DS; on a alors des proprits asymptotiques particulires. Mais aprs tout, dira lconomtre cliqueur, moi les proprits asymptotiques des MCO et des statistiques de test de Student cest pas mon problme ! Certes, mais lignorance de ces proprits asymptotiques particulires peut conduire, par exemple dans le cas dun processus DS des erreurs de diagnostics et des modlisations totalement fallacieuses. Prenons un exemple concret : le seuil asymptotique de signicativit 5% dune statistique de Student dun test de nullit sur un coecient. Tout conomtre, mme cliqueur, doit savoir que du fait de lapproximation de la loi de Student par une loi normale N (0; 1) ; ce seuil est asymptotiquement gal 1:96 dans le cas standard. Ce seuil est en particulier valide dans le cas dune rgression entre deux processus stationnaires. Or, nous allons montrer que lorsque lon rgresse deux processus I (1) ; la loi asymptotique de la statistique de Student associ au test de la nullit du coecient estim nest plus une loi de Student, ni une loi normale centre rduite. Ds lors, le fameux seuil 5% de 1.96 nest
16
plus valide. Si lconomtre cliqueur continue dutiliser ce seuil pour tablir son diagnostic ou sil continue dutiliser les pvalues fournies par le logiciel dconomtrie sur la base dune distribution normale, il peut commettre et il commettra souvent des erreurs de diagnostic. Ainsi, il acceptera tort la signicativit dune variable ou au contraire il rejettera tort la signicativit dune autre. Pour bien prendre la mesure des enjeux statistiques, nous allons mener une petite exprience sous Eviews. On simule deux marches alatoires xt et yt qui nont aucun lien entre elles : xt = xt1 + "t yt = yt1 + t avec "t N 0; 2 et t N 0; 2 : On pose T = 1000; 2 = 2 = 1: A partir de deux ralisations de " " ces deux processus on estime le modle suivant par la mthode des MCO : xt = 0 + 1 yt + t (1.26)
De faon thorique, on sait que 1 = 0; puisquil nexiste aucune corrlation thorique entre les deux variables. Le programme sous Eviews est le suivant :
0 - Creation des series d innovations-
smpl 1 1000 genr epsx = nrnd genr epsy = nrnd 0 - Initialisations des series smpl 1 1000 genr x = 1 genr y = 1 0 - Creation des series x et y smpl 2 1000 genr x = x(-1)+epsx genr y = y(-1)+epsy smpl 1 1000 0 - Regression ls x c y Les rsultats de lestimation sont reports sur la gure (1.6). On constate que si lon sen tient la thorie standard et que la test la signicativit du coecient 1 ; on conclut que 1 est dirent de zro puisque la statistique de Student associe est trs largement suprieure au seuil 1.96 5%. La variable yt est donc largement signicative, alors que les deux marches alatoires sont totalement indpendantes.
17
Figure 1.6: Rgression de Deux Marches Alatoires
Cet exemple de simulations est ce que lon appelle une rgression fallacieuse (Spurious Regression). Dans la vraie vie, on peut ainsi multiplier cet exercice linni. Il sut de considrer deux sries non stationnaires, par exemple deux sries possdant une tendance croissante relativement similaire, et de les rgresser lune sur lautre. En appliquant les thories asymptotiques standards, vous montrerez ainsi que la production de sous vtements fminins au Burkina Faso est une variable explicative trs importante dans la dtermination du cours de laction Microsoft sur la place de New York. Il ne restera plus alors qu trouver une justication conomique...
1.3.2
Consquences conomiques
Les consquences conomiques de lintroduction des processus DS furent toutes aussi importantes que les consquences statistiques. La mise vidence de la non stationnarit dorigine stochastique a tout dabord conduit une mise en cause gnrale des schmas de dcomposition tendance / cycle. Ce type de dcomposition est utilise dans de nombreux champs de lconomie applique (par exemple en nance dans le cadre de lanalyse chartiste etc..), mais plus particulirement en macroconomie. En eet, en macroconomie applique, la dcomposition des principales sries, comme le PIB, le taux de chmage, en une composante tendancielle et un cart conjoncturel est trs souvent employe. Sur le plan thorique, elle se justie par la relative indpendance des thories traditionnelles de la croissance par rapport aux thories des uctuations conjoncturelles, souvent inspirs des thses keynsiennes ou montaristes. Jusqu la n des annes 80, les macroconomistes eectuaient cette dcomposition laide de lextraction dune tendance dterministe des principales sries macroconomiques. Dans le cas du PIB, la tendance tait alors assimil au PIB potentiel, et les carts la tendance estime correspondaient aux uctuations conjoncturelles, cest dire aux cycles conomiques (GNP-
18
gap). Or dj la suite de la crise conomique des annes 70, la rupture de rythme de croissance des conomies occidentales, avait conduit sinterroger sur cette mthode de dcomposition, puisque une composante tendancielle ane du temps ne permet pas de rendre compte de cette volution. Les plus optimistes assimilaient le ralentissement conomique leet transitoire dun choc sur la composante dcart conjoncturel. Pour dautres, au contraire, les annes 70 marquaient une rupture de tendance dans le schma de croissance. Mais ds lors que lon autorise la prsence dune rupture de tendance, on tend remettre en cause le statut dterministe de la composante tendancielle. La date de rupture est elle alatoire ? Le phnomne de rupture peut il se reproduire ? Quel aurait t la signication dune tendance dterministe prsentant des ruptures toutes dates ? La rponse toutes ces questions est venue avec la remise en cause de lassimilation de la composante tendancielle une composante dterministe et donc au choix de la mthode de dcomposition. Lextraction dune tendance est en eet une mthode de stationnarisation propre aux processus T S; et ne sapplique pas aux processus DS: Nous allons montrer dans ce chapitre que la rgression dun processus DS sur une tendance dterministe peut engendrer des rsultats totalement fallacieux. Chan, Hayya et Ord (1977) furent les premiers mettre en vidence ce rsultat, ils montrent en particulier que : Llimination dune tendance linaire dune marche alatoire cre articiellement une forte autocorrlation positive des rsidus dans les premiers retards, Chan, Hayya et Ord (1977), p. 741. Cela signie que si la srie tudie est DS; et en particulier une marche alatoire, le fait de la rgresser sur une tendance, comme le faisaient lpoque les macroconomistes, va conduire une forte autocorrlation, totalement fallacieuse, des rsidus, qui correspondent en fait la composante dcarts conjoncturels dans la dcomposition tendance / cycle. Or cette autocorrlation dterminent en fait les caractristiques cycliques des uctuations conjoncturelles. Nelson et Kang (1981, 1984), partir de simulations, montrent ainsi que la composante conjoncturelle prsente une volution pseudo priodique alors quaucun facteur nintervenait dans les processus gnrateurs de donnes. Les cycles conomiques proviendraient ils dun artefact statistique ? Lenjeu est important pour lanalyse conjoncturelle et la vision traditionnelle dune dissociation entre cycle et croissance. A la limite, lexistence mme du phnomne cyclique relverait-il de la construction articielle de sries en carts une tendance dterministe ? Slutz et Wasserfallen (1985) trouvent en eet que les cycles disparaissent dans plusieurs conomies de lOCDE lorsque les sries dactivit sont considres comme DS et non comme T S: On mesure de ce fait limportance que revt la possibilit de tests spciques de la nature des sries macroconomiques, Hnin (1989), p. 666.
19
La question qui se pose prsent est de savoir, si les principales sries utilise en macroconomie sont issues de processus DS ou de processus T S: Aprs tout, si la non stationnarit stochastique est un phnomne marginal, le rsultat de Chan, Hayya et Ord naurait que peu dimportance. Remarque. Ainsi, Nelson et Plosser (1982) furent les premiers appliquer de faon systmatique un ensemble de tests7 de lhypothse de racine unitaire, cest dire de tests de lhypothse DS, un ensemble de 14 sries macroconomiques amricaines annuelles sur des dures de 60 ans un sicle et se terminant en 1970. Ils considrent le PNB rel, le PNB nominal, le PNB par tte, la production industrielle, diverses sries de prix, de salaires et de rendement, la monnaie et sa vitesse de circulation ainsi que le taux de chmage. A la seule exception du taux de chmage, les tests eectus ne permettent pas de rejeter lhypothse de sries DS: Ainsi, lexception du taux de chmage, toutes les sries macroconomiques amricaines sont issues de processus DS et non T S: Des conclusions similaires ont t obtenues pour la plupart des pays de lOCDE. Les conclusions de Nelson et Plosser (1982) ont trois principales consquences : la premire cest que la prsence de racines unitaires implique que, pour une part au moins, les impulsions conjoncturelles sont constitues de chocs permanents. Linuence dun choc aecte de faon permanente le niveau de la variable observ, cest la proprit de persistance des chocs des processus DS: Une telle proprit peut par exemple expliquer labsence de phnomne de rattrapage sur le PNB aprs le choc des annes 70. Les sries comporte alors des tendances stochastiques. La seconde consquence est que la plus grande part de la variabilit conjoncturelle aurait son origine dans la tendance stochastique de lconomie, cest dire dans les ralisations du processus de croissance lui mme. La troisime implication fut notamment lorigine du courant de pense de nouvelle conomie classique ou des cycles rels (RBC pour Real Busisnes Cycles) : si lon assimile, comme dans le keynsianisme de la synthse, les chocs de demande des chocs transitoires, il faut alors interprter comme chocs dore les impulsions permanentes qui dominent la variabilit conjoncturelle des sries macroconomiques amricaines.
Les tests de Dickey Fuller et de Dickey Fuller Augments utiliss par les auteurs seront prsents dans les sections 3 et 4 de ce chapitre.
20
Elments de thorie asymptotique pour les processus I (1)
On cherche prsent connatre les proprits asymptotiques destimateurs usuels comme les MCO dans des modles conomtriques incluant des sries intgres. Nous nous au limiterons au cas de sries intgres dordre 1, not I (1). Ces proprits nous permettront de non seulement comprendre les modications des proprits asymptotiques des MCO dans le cadre de rgressions avec variables I (1) ; mais aussi de construire des tests de lhypothse de non stationnarit.
2.1
Mouvement Brownien et Thorme Central Limite Fonctionnel
Dans cette section, nous introduirons la notion de mouvement Brownien, ou processus de Wiener, puis nous prsenterons le thorme central limite fonctionnel. 2.1.1 Mouvement Brownien
La dnition dun mouvement Brownien est la suivante : Denition 6 Un mouvement Brownien standard W (:) est un processus stochastique en temps continu qui chaque date t 2 [0; 1] associe le scalaire W (t) tel que (i) W (0) = 0 (ii) Pour toutes dates 0 t1 t2 ::: tk 1; les accroissements correspondants [W (t2 ) W (t1 )] ; [W (t3 ) W (t2 )] ;...et [W (tk ) W (tk1 )] sont indpendants et distribus selon une loi normale N (0; s t) (iii) Pour toutes ralisations, W (t) est continu en t avec une probabilit de 1. Un processus stochastique en temps continu W (:) associe toute date t 2 R+ une variable alatoire W (t) ; alors quun processus en temps discret nest dni que pour des indices de temps entiers, t 2 N. Cest pourquoi, on distingue gnralement la notation des indices pour ces deux types de processus : un indice en subscript pour les processus en temps discret, Yt ; et un indice entres parenthses pour un processus en temps continu W (t) : Un processus en temps discret est ainsi reprsent par une squence dnombrable de variables alatoires fYt g1 ; tandis que la ralisation t=1 dun processus en temps continu correspond une fonction stochastique W (:) ; t 2 [0; 1[ ! R1 : Le mouvement Brownien est un processus en temps continu particulier, dont les ralisations W (t) sont dnies de faon continue sur t 2 [0; 1], et dont les accroissements sont indpendants et distribus selon une loi normale. On comprend ainsi, que bien que W (t) soit continu en t; cette quantit ne peut pas tre direncie en utilisant les techniques usuelles, puisque laccroissement
21
entre les dates t et t+ peut aller dans nimporte quel direction et prendre nimporte quelle valeur, et cela dautant plus que est trs petit. 2.1.2 Thorme central limite fonctionnel
On considre une Nous avons vu que lorsquune srie est intgre dordre un, linuence des chocs est persistante. Ds lors, si lon suppose par exemple que les ralisations des innovations dun processus xt sont toutes positives, le processus considr a un comportement explosif, au sens o la squence des xt diverge lorsque T tend vers linni. Soit xt un processus I (1) observ sur les dates t = 1; :; T: On sait que xt explose quand T tend vers linni. On a donc ici une dirence entre lindice du processus et la dimension T qui tend vers linni. On commence donc par se ramener un indice de temps unique tendant vers linni.
t Denition 7 Si lon pose t = T: T = [r:T ] o [:] dsigne la partie entire, on a :
xt = x[r:T ] avec r =
t T
(2.27)
2 [0; 1] : On a ainsi concentr le temps et x[r:T ] est dite srie concentre.
Prenons lexemple dun processus fxt gT avec T = 4: On cherche donc changer lindice de t=0 temps de la squence de la faon suivante : 1 = [T:r] () 1 1 r< 4 2 2 = [T:r] () 1 3 r< 2 4
3 r<1 4 = [T:r] () r = 1 4 On peut donc changer lindice de temps de la squence fx0 ; x1 ; x2 ; x3 ; x4 g en construisant une srie concentre x[r:T ] dnie pour un indice r continu sur [0; 1]. Ainsi, si r < 1=4; alors [T:r] = 0; donc on a :x[T:r] = x0 : Pour8 r 2 [1=4; 1=2[ alors [T:r] = 1, donc x[T:r] = x1 : La dnition du processus concentr x[r:T ] pour r 2 [0; 1] est donc la suivante : 3 = [T:r] () 8 > x0 > > > x1 < = x > 2 > x3 > > : x4 r<1 4 1 r< 1 4 2 1 3 2 r < 4 3 4 r <1 r=1
x[r:T ]
(2.28)
De plus, lorsque T tend vers linni lindice de la srie concentre x[T r] ; r 2 [0; 1] converge lui aussi vers linni.
8
Par exemple r = 0:3 2 [1=4; 1=2[ , on a [T:r] = [4:0:3] = [1:2] = 1:
Chapitre 2. Les Processus Alatoires Non Stationnaires Si lon considre un processus xt reprsent par une marche alatoire pure : xt = xt1 + "t
22
(2.29)
P avec "t i:i:d: 0; 2 : On pose x0 = 0; ds lors on a xt = t "j : Ds lors, on a dans ce cas : " j=1
[T:r]
x[T r] =
X
j=1
"j r 2 [0; 1]
(2.30)
Nous allons prsent donner lnonc du thorme central limite fonctionnel : Theorem 8 (Thorme Central Limite Fonctionnel). Soit "t un processus i:i:d: 0; 2 ; et soit " xt tel que xt = xt1 + "t avec x0 : La quantit :
[T:r] 1 1 X XT (r) = x[T r] = "j r 2 [0; 1] T T j=1
(2.31)
converge en distribution vers :
p L T XT (:) ! W (:) o W (:) dsigne un mouvement Brownien standard.

T !1
(2.32)
On remarque que pour r = 1; on reconnait le thorme central limite standard puisque : 0 1 T p p 1X A L T XT (1) = T @ "j ! W (1) N (0; 1) (2.33) T !1 T
j=1
Dans le cas gnral, lorsque les innovations "t ne sont pas i:i:d:; on a lnonc suivant :
Theorem 9 (Thorme Central Limite Fonctionnel TCLF) Soit vt un vecteur de dimension n de variables alatoires i:i:d: (0; ) ; avec = P P 0 : On pose, 8t = 1; ::; T
1 X ut = (L) vt = s vts s=0
P o les lments s du polynme matriciel (L) vrient 1 s s < 1 8i; 8j = 1; ::; n: ij ij s=0 o1 np dnies par T XT (:) La squence de fonctions stochastiques vectorielles
T =1 XT (r) =
a une distribution asymptotique dcrite par un mouvement Brownien vectoriel (n; n) standard, not W (:). p L T XT (:) ! (1) P W (:) T !1 (r) est distribu suivant une loi normale N 0; r (1) (1)0 : o (1) P W
1 X ut 8r 2 [0; 1] T t=1
[T r]
23
Nous utiliserons en outre le thorme suivant : Theorem 10 (Continuous Mapping Theorem) Soit ST (:) une fonction stochastique telle que L L ST (:) ! S (:) et soit g (:) une fonctionnelle continue, alors g [ST (:)] ! g [S (:)] :
2.2
Application aux processus I (1)
La premire utilisation du thorme central limite fonctionnel pour tablir les distributions asymptotiques de statistiques construites partir de processus I (1) est due Phillips (1986, 1978). On se limitera ici ltude du cas simple dune marche alatoire. Pour ltude des processus dont les innovations sont autocorrles, le lecteur pourra se rfrer Phillips (1986, 1978). Ces distributions asymptotiques nous serons particulirement utiles pour la construction des tests de non stationnarit et pour bien comprendre les enjeux statistiques de la non stationnarit statistique. Lillustration la plus simple des rsultats de Phillips conduit tudier une marche alatoire pure : xt = xt1 + "t (2.34) avec "t i:i:d: 0; 2 : On suppose pour simplier que la condition initiale sur le processus (2.34) est " dterministe et nulle : x0 = 0: Nous avons vu que dans ce cas l le processus en temps discret xt correspond laccumulation des chocs passs entre la date 1 et la date t : xt = "1 + "2 + ::: + "t (2.35)
A partir de la dnition du processus xt on peut dnir la fonction continue stochastique XT (r) = x[r:T ] =T en fonction dun indice de temps continu r 2 [0; 1] : 8 > > > > <
1 T x0 1 T x1 1 T x2
XT (r) =
La fonction stochastique XT (r), conditionnellement aux ralisations "1 ; "2 ; :::; "T peut ainsi tre reprsente sous la forme dune fonction en marches descalier, comme le montre lillustration (2.7). Pour toutes les valeurs de r comprises entre 0 et 1=T; valeur exclue, les ralisations de T XT (r) correspondent la condition initiale x0 : Entre 1=T et 2=T; valeur exclue, les ralisations de T XT (r) correspondent la ralisation "1 ; et ainsi de suite. Pour les valeurs de r comprises entre (T 1) =T et T; ralisations de T XT (r) correspondent la somme des ralisations de "1 "T 1 .
> > ::: > > : 1 T xT =
=0 = "1 T 1 = T ("1 + "2 )

1 T
("1 + :: + "T )
1 0r< T 1 2 T r < T 2 3 T r < T ::: r=1
(2.36)
24
Figure 2.7: Illustration de la Forme des Ralisations XT (r)

X T (r )
X T /T
X 1 /T
X 2 /T X T - 1/ T r X i /T
Bien entendu, laire dnie par cette fonction en marches descalier correspond la somme de laire de T rectangles. Le ieme rectangle a une largeur gale 1=T et une longueur gale xi1 =T , et donc son aire est gale xi1 =T 2 : Ds lors lintgrale de la fonction stochastique XT (r) est quivalente la somme : Z 1 x0 x1 x2 xT 1 XT (r) dr = 2 + 2 + 2 + ::: + (2.37) T T T T2 0 p En multipliant les deux membres de cette galit par T ; on obtient : p Z T
1
XT (r) dr = T 2
T X t=1
xt1
(2.38)
Or, daprs le thorme central limite fonctionnel on sait que : p L T XT (:) ! " W (:)
T !1
(2.39)
hp i R p 1 On dnie prsent une fonctionnelle continue g (:) ; telle que g T XT (r) = 0 T XT (r) dr = p R1 T 0 XT (r) dr; par application du continuous mapping theorem on obtient : Ds lors, on peut tablir la distribution asymptotique de la somme de marches alatoires : T2
3
p Z T
XT (r) dr ! "
T !1
Z
1
W (r) dr
(2.40)
T X t=1
xt1 ! "
T !1
W (r) dr
(2.41)
25
3 P Ce rsultat implique que pour une marche alatoire sans drive, la somme T 2 T xt1 cont=1 2 =3 dont la distribution peut tre verge vers une variable alatoire de distribution normale N 0; " exprime comme une intgrale de ralisations de mouvements Browniens de variance 2 : Il est in" P tressant de rappeler ici que pour une marche alatoire sans drive, la moyenne empirique T T xt t=1 diverge.
De la mme faon, en utilisant le thorme central limite fonctionnel ainsi que le continuous mapping theorem, on peut driver la distribution asymptotique de la plupart des moments empiriques dune marche alatoire. Ces rsultats sont rsums dans la proposition (11). Proposition 11 On considre un processus xt satisfaisant une reprsentation AR (1) non stationnaire I (1) telle que : xt = xt1 + "t (2.42) avec x0 = 0 et o "t i:i:d: 0; 2 : Les distributions asymptotiques des principaux mo" ments empiriques de xt sont alors les suivantes : T
T X t=1 1=2 T X t=1
"t ! " W (1)

T !1 L
(2.43)
T 1
xt1 "t !
L
T !1
o 1 2n " [W (1)]2 1 2 Z
1
(2.44)
3=2
T X t=1
t "t ! " W (1) "

T !1 T X t=1
W (r) dr
(2.45)
3=2
xt1 ! "
T !1 L
Z
1
W (r) dr
(2.46)
T 2
T X t=1
x2 ! 2 t1 "
T !1 L
[W (r)]2 dr
1
(2.47)
5=2
T 3
T X t=1
T X t=1
t xt1 ! "
T !1 L
Z
1
r W (r) dr
(2.48)
t x2 ! 2 t1 "
T !1 T X t=1
r [W (r)]2 dr
(2.49)
(v+1)
tv ! 1= (v + 1) v 2 N
T !1
(2.50)
o W (:) dsigne un mouvement Brownien standard.
26
Nous ne dmontrerons pas lensemble des ces convergences. Nous nous limiterons aux rsultats (2.44) et (2.47). Commenons par le rsultat (2.47). Pour cela, on dnit une nouveau processus en temps continu ST (r) tel que : ST (r) T [XT (r)]2 8r 2 [0; 1] (2.51)
Ce nouveau processus ST (r) correspond en fait la somme partiel des carrs des innovations "t puisque : 8 1 2 1 0r< T > T x0 = 0 > 1 2 > 1 2 1 > T x1 = T "2 < 1 T r < T 2 1 2 3 1 2 x = ("1 + "2 ) (2.52) ST (r) = T r < T > T 2 T > ::: ::: > > : 1 2 1 xT = T ("1 + :: + "T )2 r = 1 T En faisant le mme raisonnement que prcdemment, on montre que : T
2 T X t=1
x2 t1
x2 x2 x2 x2 = 0 + 1 + 2 + ::: + T 1 = T2 T2 T2 T2
ST (r) dr
(2.53)
Daprs le thorme central limite fonctionnel on sait que : p L T XT (:) ! " W (:)
T !1
On dnit prsent une fonctionnelle continue g (:) ; telle que toute ralisation ST (r) = hp i2 i2 R1 R 1 hp T [XT (r)]2 = T XT (r) on associe g [ST (r)] = 0 ST (r) dr = 0 T XT (r) dr: Par application du continuous mapping theorem on obtient : Z 1 Z 1 Z 1 hp i2 L T XT (r) dr ! g [ " W (r)] ST (r) dr = [ " W (r)]2 dr
0 0 T !1 0
Daprs ce rsultat, en reprenant lgalit (2.53), on dmontre nalement le rsultat (2.47) : T

2 T X t=1
x2 t1
ST (r) dr !
T !1
2 "
[W (r)]2 dr
(2.54)
Dmontrons prsent le rsultat (2.44) de la proposition (11) selon lequel : T

1 T X t=1
xt1 "t !
T !1
o 1 2n " [W (1)]2 1 2
(2.55) PT
t=1 xt1 "t :
Pour cela il convient tout dabord de transformer le moment empirique on utilise le rsultat suivant : 0 1 " T #2 T T t1 X X X X @ "t = "2 + 2 "j A "t t
t=1 t=1 t=1 j=1
Pour cela,
(2.56)
Chapitre 2. Les Processus Alatoires Non Stationnaires Etant la dnition de la marche alatoire xt ; on sait que xt = cette galit peut se rcrire sous la forme suivante : x2 T PT =
T X t=1
27 PT
t=1 "t
puisque x0 = 0: Ds lors
"2 t
+2
On en dduit alors une nouvelle expression du moment empirique qui nous intresse, savoir t=1 xt1 "t : X X T T 1 1 1 1 1 2 xt1 "t = "2 xT (2.57) T t=1 2 T 2 T t=1 t P Etudions la convergence de ces dirents lements. Commenons par la quantit T 1 T "2 : t=1 t 2 alors cette En utilisant la loi des grands nombres (cf. chapitre 1), on sait que si "t est i:i:d: 0; " quantit, qui est tout simplement le moment empirique dordre deux des "t ; converge en probabilit vers le moment thorique dordre deux, savoir la variance 2 : " X T 1 p "2 ! 2 t T t=1 T !1 " (2.58)
T X t=1
xt1 "t
converge en loi vers 2 [W (1)]2 : Finalement, on montre ainsi que : " 1 L x2 = ST (1) ! g [ST (1)] 2 [W (1)]2 T " T !1 T
Reste le premier lments de lquation (2.57). En reprenant la dnition du processus en hp i2 temps continu ST (:) ; on montre immdiatement que T 1 x2 = ST (1) T XT (1) . Daprs T p le thorme central limite fonctionnel, on sait que T XT (1) converge en loi versh" W (1) : i Ds p p lors, on dnit une fonctionnelle g (:) qui toute ralisation T XT (r) associe g T XT (r) = hp i2 T XT (r) = ST (r) : Par application du continuous mapping theorem on montre alors que ST (1) (2.59)
En reprenant les rsultats (2.58) et (2.59), ainsi que lexpression (2.57) du moment empirique on retrouve le rsultat (2.44) de la proposition (11) : X X T T 1 1 1 1 1 xt1 "t = x2 "2 T T t=1 2 T 2 T t=1 t 2 2 " " L 2 ! [W (1)] T !1 2 2
(2.60)
Rappelons que la ralisation W (1) ; cest dire la ralisation dun mouvement Brownien la date 1, a une distribution N (0; 1) : Cela signie que la variable alatoire [W (1)]2 a une distribution 2 (1) : Ltude de ces distributions asymptotiques nous permet en particulier de dnir les vitesses de convergence des dirents moments empiriques de la marche alatoire. Cette vitesse est reprsent
28
par la puissance de T pour laquelle un processus T zt converge en probabilit vers une valeur nie. Denition 12 Une squence de variable alatoire fzt g1 est dite Op (T ), si pour tout t=1 " > 0, il existe une valeur nie M telle que : o n z T (2.61) P > M < " T En appliquant cette dnition aux rsultats de la proposition (11), on dtermine les vitesses de convergence des dirents moments empiriques :
Proposition 13 Les vitesses de convergence alatoire sont les suivantes : 1 PT "t = Op T 2 t=1 3 PT t "t = Op T 2 t=1 2 PT 2 t=1 xt1 = Op T 3 PT L 2 t=1 t xt1 ! = Op T
T !1
des moments empiriques dune marche PT
= Op (T ) 3 xt1 = Op T 2 t=1 5 PT t xt1 = Op T 2 t=1 PT
t=1 xt1 "t
Ltudiant intress devra outre la proposition (11), tudier le cas o les innovations "t sont autocorrls et le cas vectoriel, o xt dsigne un vecteur dobservation de n variables.
2.3
Les rgressions fallacieuses
Maintenant que nous avons tabli les distributions asymptotique dun certain nombre de moments empiriques associs une marche alatoire, on peut sintresser aux proprits asymptotiques des estimateurs des MCO et des principales statistiques de tests usuelles lorsque le modle comprend des variables I (1) : Nous allons en particulier tudier le cas des rgressions fallacieuses (Spurious Regressions). De faon gnrale, on a le rsultat suivant : Denition 14 On considre une rgression de la forme yt = xt + t o xt et yt dsigne deux variables I (1) : On suppose quil nexiste aucune valeur de telle que le rsidu t = yt xt soit I (0). Alors lestimateur des MCO; appliqu ce modle, conduit une phnomne de rgression fallacieuse. Ce phnomne a t mis en vidence partir dexpriences de Monte Carlo par Granger et Newbold (1974) et fut plus tard expliqu thoriquement par Phillips (1986). Que ce passe-t-il dans le cas des rgressions fallacieuses ? Nous allons montrer que bien que les estimateurs des MCO soient convergents, la plupart des statistiques de tests usuelles nont plus une distribution standard. Ds lors, on comprend les enjeux statistiques associs la non stationnarit : si lon applique les
29
thories usuelles dans des congurations de rgressions fallacieuses, on pourra montrer sans aucun problme que la production de sous vtements fminins au Burkina Faso est une variable explicative trs importante dans la dtermination du cours de laction Microsoft sur la place de New York.... Nous allons tout dabord tudier ce phnomne sur le plan thorique avant de mener des expriences de Monte Carlo. 2.3.1 Distributions asymptotiques dans le cas des rgressions fallacieuses
Montrons prsent comment, dans le cas dune rgression fallacieuse, les proprits asymptotiques des estimateurs et des statistiques de tests usuelles sont aectes. Pour cela nous allons considrer un petit modle extrmement simple. Hypothses (H1 ) On considre deux marches alatoires pures sans aucun lien : xt = xt1 + "t (2.62)
yt = yt1 + t (2.63) avec x0 = y0 = 0; et "t i:i:d: 0; 2 ; t i:i:d: 0; 2 : On suppose que les innovations " des processus xt et yt sont totalement indpendantes : E ("t s ) = 0; 8 (s; t) : Supposons quun conomtre tourdi rgresse la variable xt sur la variable yt ; sans avoir au pralable diagnostiquer la non stationnarit de ces deux processus et labsence de relation stable entre les deux sries. Notre conomtre va donc eectuer la rgression : yt = 0 + 1 xt + t (2.64)
Nous sommes ici dans une conguration de rgression fallacieuse. Etudions le comportement b b asymptotitque des estimateurs des MCO; 0 et 1 ainsi que le comportement asymptotique de la statistique de Student associe au test H0 : 1 = 0: Rappelons au passage, que puisque les deux variables xt et yt nont aucun lien, on a 1 = 0 = 0: b b Commenons par tudier le comportement des estimateurs 0 et 1 : Daprs la dnition des estimateurs de MCO du modle (2.64), on a : 11 0 T 1 0 T P P ! yt C T xt C B b B 0 t=1 C B t=1 C =B T (2.65) T T A @ P b P 2 A @ P 1 xt xt xt yt
t=1 t=1 t=1
Essayons prsent dtudier la vitesse de convergence des dirents lements des estimateurs P b b 0 et 1 : Llment T diverge la vitesse T; il est Op (T ). Concernant llment T xt ; on a : t=1
T X t=1
xt =
T X t=1
xt1 + xT =
T X t=1
xt1 +
T X t=1
"t
(2.66)
30
1 3 P P Nous avons vu dans la section prcdent que T "t = Op T 2 et que T xt1 = Op T 2 : t=1 t=1 P Il convient donc de dater T xt par T 3=2 pour obtenir une distribution non divergente : t=1 ! T T T X X X 1 1=2 3=2 3=2 "t xt1 + T T xt = T T
t=1 t=1 t=1
= T 3=2
Cela signie que la quantit droite de cette expression converge en probabilit vers 0, lorsque T tend vers linni : ! T T X X p L 1 1=2 1=2 "t ! 0 "t ! " W (1) () T T T
t=1 T !1 t=1 T !1
T X t=1
1 xt1 + T 1 :Op T 2
P P Ainsi la quantit T 3=2 T xt converge vers la mme limite que T 3=2 T xt1 : Ds lors, en t=1 t=1 utilisant la proposition (11), on montre que : Z 1 T X L 3=2 T xt ! " W1 (r) dr (2.67)
t=1 T !1 0
De la mme faon, on montre que : T

3=2
o W1 (:) et W2 (:) sont deux mouvement Browniens standards indpendants. Concernant llment PT
t=1
T X t=1
yt !
T !1
W2 (r) dr
(2.68)
P Par un raisonnement analogue au prcdent, sachant que T x2 = Op T 2 ; il convient de t=1 t1 P dater T x2 par T 2 pour obtenir une distribution non divergente : t=1 t !2 T T T X X X 2 2 2 2 1 1=2 T xt = T xt1 + T T "t
t=1
de la dnition des MCO; on sait que : T !2 T T T X X X X x2 = x2 + x2 = x2 + "t t t1 T t1

t=1 t=1 t=1
2 t=1 xt
(2.69)
= T 2
P De la mme faon, on montre que la quantit T 2 T x2 converge vers la mme limite que t=1 t P T 2 T x2 : Ds lors, en utilisant la proposition (11), on montre que : t=1 t1 T 2
T X t=1
t=1 T X t=1
t=1
h 1 i2 xt1 + T 1 : Op T 2
x2 ! 2 t1 "
T !1
[W1 (r)]2 dr
(2.70)
Chapitre 2. Les Processus Alatoires Non Stationnaires o W1 (:) dsigne le mouvement Brownien prcdemment dni.
31
P Il ne reste plus enn qu tudier la convergence de llment T xt yt : On admettra le rsultat t=1 suivant : Z 1 T X L 2 W1 (r) W2 (r) dr (2.71) xt yt ! " T
t=1 T !1 0
o W1 (:) et W2 (:) sont les deux mouvement Browniens prcdemment dnis.
b b Proposition 15 Sous les hypothses (2.3.1), les estimateurs des MCO ; 0 et 1 ; obtenus dans le modle : yt = 0 + 1 xt + t (2.72) ont pour distribution asymptotique :
1 2
Nous avons prsent lensemble des lements ncessaires la dtermination de la distribution b b asymptotique des estimateurs 0 et 1 : Il sut pour cela dquilibrer lquation (2.65) dans les termes en T , aprs avoir contrler la vitesse de convergence de chaque lment9 . On obtient alors b b la distribution asymptotique des estimateurs 0 et 1 :
b 1
b 0
B = B @
L
0 T
T 1 :T
3 2
T 2 xt T 2 1
T !1
t=1
T P
t=1
b On remarque que la loi asymptotique de lestimateur 1 est non standard, pour autant cette estimateur demeure convergent puisque on peut montrer que la distribution h1 est quivalente b une loi normale centre sur 0. En moyenne, lestimateur 1 est donc nul, ce qui est logique compte b tenu de la dnition du modle. Mais attention cela ne signie pas que la ralisation de 1 est nulle. b Or, lconomtre tourdi partir de la ralisation de 1 va eectuer un test de signicativit pour
9
En explicitant les termes de la proposition (15), on montre en particulier que : 0 1 R1 R1 R1 B 0 W1 (r) W2 (r) dr 0 W1 (r) dr 0 W2 (r) dr C L b 1 ! h1 = @ A hR i2 R1 T !1 " 1 [W1 (r)]2 dr 0 W1 (r) dr 0
" 0 W1 (r) dr R1 R1 " 0 W1 (r) dr 2 0 [W1 (r)]2 dr "
11 0 T 3 P xt C B T 2 yt t=1 t=1 C B T T P 2 A @ 2 P xt T xt yt
T P
1 C C A
(2.73) ! R1 0 W2 (r) dr R1 " 0 W1 (r) W2 (r) dr
R1
t=1
!1
(2.74)
En eet, 8T 2 R+ ; et 8 (a; b; c; d; e; f ) 2 R6 tels que ad 6= c2 ; on a : #1 # " " p de+cf 3 3 T 1 a T 2 c T2 e T (ad+c2 ) = 3 T 2 f T 2 c T 2 d ce+af ad+c2
32
tester si le paramtre 1 est nul. Reste donc savoir si le test de Student 1 = 0 ne va pas conduire lconomtre un mauvais diagnostic si ce dernier continue dappliquer la thorie standard et par 1 b exemple le seuil de 1.96 5%. Par la suite, on notre h0 la distribution asymptotique de T 2 0 : Dterminons donc prsent la distribution de la statistique de Student, not t , associe au b 1 test de lhypothse 1 = 0; sachant que sous (2.3.1) cette hypothse est vraie. De faon standard, la statistique t est dnie de la faon suivante : b
1
s2 T
Commenons par dterminer la distribution asymptotique de s2 et en particulier de la somme T P T des carrs des rsidus SCRT = b2 : t t=1 SCRT =
t=1 T X t=1 T X
llment de la deuxime colonne, deuxime ligne de la matrice (XX)1 : En utilisant lcriture (2.65), on montre que : !2 T T !2 3 1 2 X X b1 2 4T 5 xt (2.76) xt t = b 1 1 sT T 2 t=1 t=1
P T
2 t=1 bt
t = b
1
sT ( 22 ) 2
b 1
(2.75)
= (T 2) dsigne lestimateur de la variance des rsidus t et o 22 dsigne
b2 t
2 yt
T 2 X b b = yt 0 1 xt t=1 T X t=1
avec < 2: En utilisant les rsultats prcdents, on montre que : T 1 s2 = T SCRT L ! T (T 2) T !1
2 On sait que le premier lment de cette somme t=1 yt est Op T 2 : Dans le second lment, P b2 P b la quantit T 1 x2 est aussi Op T 2 ; ainsi que la quantit T 0 xt : Enn, dans le troisime t t=1 t=1 P terme, seul la quantit T xt yt est Op T 2 : Il faut donc diviser la somme des carrs des rsidus t=1 par T 2 pour obtenir une distribution non divergente. En regroupant les termes croiss ayant une vitesse de convergence gale T 2 ; on obtient : " T # T T T X X X 2X 2 2 b b b T 2 SCRT = T 2 yt 1 xt 2 0 xt 2 1 xt yt + T 2+ Op () PT
t=1 t=1 t=1 t=1
b b 0 + 1 xt
T X t=1
b b yt 0 + 1 xt
(2.77)
(2.78)
Chapitre 2. Les Processus Alatoires Non Stationnaires avec = 2 Z 1 [W2 (r)]2 dr h1 2 [W1 (r)]2 dr " 0 0 Z 1 Z 1 2h0 " W1 (r) dr 2h1 " W1 (r) W2 (r) dr
1 0 0
33
(2.79)
b b o h0 et h1 dsignent les distributions asymptotiques de 0 et de 1 ; et o W1 (:) et W2 (:) sont deux mouvement Browniens standards indpendants. Dores et dj, on peut faire la remarque suivante : Remarque Sous les hypothses (2.3.1), lestimateur s2 de la variance des rsidus t T dans le modle yt = 0 + 1 xt + t (2.80) diverge, puisque : T 1 s2 ! T avec = 2 Z
1 2 T !1 L
(2.81)
[W2 (r)] dr [W1 (r)]2 dr 0 0 Z 1 Z 1 2h0 " W1 (r) dr 2h1 " W1 (r) W2 (r) dr h1 2 "
0 0
(2.82)
b b o h0 et h1 dsignent les distributions asymptotiques de 0 et de 1 ; et o W1 (:) et W2 (:) sont deux mouvement Browniens standards indpendants. Cette remarque signie que si lconomtre tourdi ne date pas lestimateur s2 par T; il T obtiendra une ralisation dun processus divergent. Plus T sera important, plus s2 sera grand. T Pour T tendant vers linni, s2 diverge. Le problme cest que s2 intervient dans la construction T T de la statistique de Student. Ds lors, nous allons montrer que cette statistique diverge elle aussi. En eet, reprenons lexpression (2.76) de la statistique de Student b 1 !2 T T !2 3 1 2 X X 2 4T 5 xt xt 1
t=1 t=1
P P b On sait que sT est Op T 1=2 ; 1 est Op (1) ; T x2 est Op T 2 et que T xt est Op T 3=2 . t=1 t t=1 En utilisant ces proprits, on contrle la vitesse de convergence des dirents lements de la faon suivante : " #2 ! !2 3 1 2 T T X X b1 2 3 3=2 4T T 2 T 2 5 t = xt T T xt b 1 T 1=2 sT T 1=2 T 1=2 t=1 t=1
t = b
1
sT T 2
(2.83)
Chapitre 2. Les Processus Alatoires Non Stationnaires " # 2 ! !2 3 1 2 T T X X 2 2 3=2 4 T xt T xt 5

t=1 t=1
34
T 3=2 T
Ds lors, on constate immdiatement que pour obtenir une valeur non divergente de la statistique de Student, celle-ci doit imprativement tre multipli par une facteur T 1=2 : Si lon ne multiplie pas la statistique de Student par ce facteur, celle -ci diverge. Plus lchantillon est grand plus les ralisations de la statistique de Student seront importantes. En eet, en utilisant les rsultats asymptotiques prcdents, on tablit immdiatement la proposition suivante. Proposition 16 Sous les hypothses (2.3.1), la statistique de Student associe au test 1 = 0; fonde sur lestimateur des MCO; dans le modle : yt = 0 + 1 xt + t est divergente. On montre que : T 2 t b
1
T 1=2 sT
b 1
(2.84)
(2.85)
T 1=2 sT t=1 t=1 "Z 1 Z 1 2 # h1 " L 2 ! [W1 (r)] dr W1 (r) dr T !1 0 0
"
b 1
1 # 2 ! !2 3 2 T T X X 4 T 2 x2 T 3=2 xt 5 t
(2.86)
b b o h0 et h1 dsignent les distributions asymptotiques de 0 et de 1 ; et o W1 (:) et W2 (:) sont deux mouvement Browniens standards indpendants. Ainsi, si notre conomtre tourdi ne contrle pas la vitesse de convergence de la statistique de Student, cest dire sil considre uniquement les ralisations de t ; il obtiendra ds lors des b 1 1=2 : Pour un mme tirage de chocs, plus la ralisations dun processus qui diverge la vitesse T taille dchantillon sera importante, plus la ralisation de t sera grande. Ds lors, si lconomtre b 1 applique le seuil de signicativit standard de 1.96 5%, il aura de forte chance de rejeter tort la nullit du paramtre ; et ce dautant plus que la taille dchantillon est importante. Ainsi si lon rgresse deux marches alatoires qui nont aucun lien, les tests usuels conduisent dans de trs nombreux cas accepter tort la signicativit de la variable explicative. Cest que lon a pu observer dans le tableau (1.6) o lon constate que la statistique de Student est gale 20 (T = 1000) alors que les deux sries non aucun lien. Voil pourquoi, si lon sen tient la thorie usuelle des tests, la production de sous vtements fminins au Burkina Faso est une variable explicative trs importante dans la dtermination du cours de laction Microsoft sur la place de New York...
Chapitre 2. Les Processus Alatoires Non Stationnaires 2.3.2 Exercices de Simulations
35
An de mieux comprendre la divergence de la statistique dans le cas dune rgression fallacieuse, nous allons prsent mener un exercice de simulation. On simule 1000 ralisations des processus fxt gT et fyt gT ; pour une taille dchantillon T; selon le modle : t=1 t=1 xt = xt1 + "t yt = yt1 + t (2.87) (2.88)
avec x0 = y0 = 0; et "t i:i:d: N (0; 1) ; t i:i:d: N (0; 1) : Pour chaque pseudo chantillon, on eectue la rgression : yt = 0 + 1 xt + t et lon stocke la ralisation de la statistique de Student t associe au test 1 = 0: On dispose b 1 ainsi de 1000 ralisations de cette statistique partir desquelles on peut calculer un certain nombre dindicateurs. Dans le programme, nous faisons varier la taille des chantillons qui est dabord xe T = 5000; puis T = 1000; puis T = 500 et enn T = 100: Le programme utilis est report en Annexe (A.1). Les rsultats sont reports dans le tableau (2.1) Tableau 2.1: Rsultats des Simulations : t b Moyenne des t b 1 Mdiane des t b 1 Ecart Type Moyenne des t b 1 Skewness Kurtosis P t > 1:96 b
1
T = 100 0:03 0:17 10:24 8:06 0:03 3:03 0:83
T = 500 0:45 0:73 22:01 17:40 0:03 3:05 0:93
T = 1000 0:47 0:32 31:77 24:46 0:03 3:46 0:94
T = 5000 0:54 4:14 69:83 55:74 0:13 2:81 0:98
L es r su ltats s ont ob tenu s p a rtir d e 1 0 0 0 sim u la tio n s.
On observe que plus la taille dchantillon crot, plus lcart type des ralisations augmente tandis que la moyenne est peu prs stable. Cela signie que plus la taille augmente, plus les ralisations sont importantes en valeur absolue, comme le conrme la quatrime ligne du tableau (2.1). La valeur absolue de t crot avec T , ce qui conrme notre rsultat thorique de divergence. b 1 Cest pourquoi, notre conomtre tourdi sil applique les thories usuelles et sil compare la rali sation de t avec le seuil de 1.96 5%, rejettera dautant plus souvent lhypothse nulle 1 = 0 b 1 que la taille T sera importante. On constate, sur la dernire ligne du tableau, que le nombre de ralisations de t suprieures au seuil de 1.96 crot avec T: b
1
36
Les implications statistiques de la non stationnarit sont donc particulirement fortes, puisque dans notre exercice pour T = 100; lconomtre tourdi rejettera dans prs de 83% de cas lhypothse de nullit de 1 : Ainsi, notre conomtre aura 8 chances sur dix darmer que la variable xt est signicative dans la rgression de yt sur xt ; alors que les deux processus nont aucun lien. Encore une fois, si lon sen tient la thorie usuelle des tests, la production de sous vtements fminins au Burkina Faso est ainsi une variable explicative trs importante dans la dtermination du cours de laction Microsoft sur la place de New York... Bien entendu, une telle conclusion ne serait sans doute pas accept, si lon avait au pralable stationnaris les deux sries xt et yt en les direntiant. Cest pourquoi la stationnarisation des sries est une tape fondamentale de la modlisation conomtrique.
2.4
Consquences dune mauvaise stationnarisation du processus
Nous avons dans la section prcdente montrer quel point la stationnarisation des sries tait importante pour viter de se retrouver dans la situation des rgressions fallacieuses. Reste dterminer quelle est la mthode de stationnarisation approprie suivant que la srie est DS ou T S: Proposition 17 Pour stationnariser un processus T S; il convient de retirer la composante dterministe ft en rgressant la srie xt sur la plan dni par les puissances de t: Pour stationnariser un processus DS dordre d; il convient dappliquer le ltre (1 L)d : Par exemple, pour stationnariser le processus xt = a0 + a1 t + "t ; il sut de rgresser xt sur une constante et sur t pour obtenir un processus xt b0 b1 t stationnaire. Nous allons prsent a a tudier les consquences dune mauvaise stationnarisation des processus. 2.4.1 Consquence sur un processus TS Supposons que (xt ; t 2 Z) soit un processus T S dni par xt = a0 + a1 t + "t o "t est un bruit blanc gaussien N 0; 2 : Supposons que lon applique, tort, au processus xt " un ltre aux dirences premires. On dnit le processus xt tel que xt = (1 L) xt = xt xt1 On montre que xt = a1 + "t "t1 Cette criture implique que lapplication dun ltre aux dirences premires au processus T S xt a conduit introduire une racine unitaire dans la partie moyenne mobile du processus
37
xt = (1 L) xt . Vrions si lapplication dun ltre aux dirences premires nous a permis de dnir un processus xt stationnaire. Reprenons les trois conditions de la dnition de la stationnarit du second ordre.i h h i Convergence de E (xt )2 : On montre que E (xt )2 converge puisque h i h i E (xt )2 = E (xt xt1 )2 = E [a1 + ("t "t1 )]2 h i = a2 + E ("t "t1 )2 = a2 + 22 < 1 1 1 " Moment dordre un : Montrons que E (xt ) est indpendant de t E (xt ) = a1 indpendant de t Moments dordre deux : Dterminons la fonction gnratrice dautocovariance (h) du processus xt : (h) = E f[xt E (xt )] [xth E (xth )]g = E [("t "t1 ) ("th "th1 )] Do lon tire que : 8 < 22 " (h) = 2 " : 0 h=0 h = f1; 1g sinon
(2.89)
On vrie que (h) est indpendant de t: Donc les trois conditions de la stationnarit du second ordre sont vries. Le processus xt est stationnaire. Attention, rsultat nest pas gnral puisque par exemple lapplication dun ltre lordre deux (1 L)2 aurait conduit un processus 2 xt non stationnaire. Mais mme si le processus xt est stationnaire, il ne correspond un bruit blanc. Remarque 1. La direnciation dun processus T S conduit une autocorrlation fallacieuse du rsidu du ltre. En eet, la fonction gnratrice dautocovariance (h) ne correspond pas celle dun bruit blanc. Donc le fait davoir direnci xt a introduit une autocorrlation dordre un de linnovation du processus xt qui nexistait pas dans la composante stationnaire du processus xt a0 a1 t: 2.4.2 Consquence sur un processus DS
Supposons que (xt ; t 2 Z) soit un processus DS dni dordre un sans drive (P ure Random W alk) xt = xt1 + "t (2.90) o "t est un bruit blanc gaussien N 0; 2 : Supposons que lon applique, tort, au processus xt " une mthode de stationnarisation consistant rgresser la srie xt sur une constante et un trend dterministe t: On considre donc le modle empirique suivant xt = 0 + 1 t + t (2.91)
38
b b On devrait alors montrer que les estimateurs des MCO 0 et 1 convergent vers 0 et que les t-statistiques (test de Student) associes sont gnralement non signicatives aux seuils standards. Or nous allons voir prcisment que tel nest pas le cas. La distribution des t-statistiques est en particulier divergente et une fois contrle par la vitesse de convergence, cette distribution est de plus non standard. Remarque 2. Lextraction dune tendance linaire dun processus DS conduit crer articiellement une forte autocorrlation des rsidus aux premiers retards et donc un mouvement pseudo-priodique des rsidus.
Considrons un petit exemple. Soit le processus xt = xt1 + "t o "t suit une N (0; 1=4) : On considre 1000 chantillons du bruit blanc "t partir desquels sont construites 1000 pseudo sries xt : Pour chacun de ces pseudo chantillons, on tudie la rgression : xt = 0 + 1 t + t On obtient alors les rsultats suivants :
1 4 b b b moyenne des 0 = 1:3081 moyenne des 1 = 0:0007: var(T 2 1 ) ' 3 2 "
moyenne des b 0 = 5:26 et moyenne des b 1 = 2:34 t t P b 0 > 1:96 = 93% et P b 1 > 1:96 = 96% . Cela signie que si lon applique tort t t les seuils de signicativit standard, dans plus de 90% des cas on rejette lhypothse de nullit des coecients 0 et 1 :
Autocorrlation moyenne des rsidus t : ordre 1 : 0.9899, ordre 2 : 0.9799, ordre 3 : 0.9699, b ordre 10 : 0.9012. Tout ceci montre limportance de bien choisir la mthode de stationnarisation des sries en fonction de lorigine de la non stationnarit : DS ou T S Il convient donc prsent de prsenter des tests qui nous permettent, tout dabord de vrier que les sries sont non stationnaires et dautre part de discriminer entre les processus DS et T S : ce sont les tests de racine unitaire.
39
Un Test de Racine Unitaire : le Test de Dickey Fuller
Le test de Dickey Fuller simple (1979) est un test de racine unitaire (ou de non stationnarit) dont lhypothse nulle est la non stationnarit dun processus autorgressif dordre un. Considrons un processus (xt ; t 2 Z) satisfaisant la reprsentation AR (1) suivante : xt = xt1 + "t (3.92) avec "t i:i:d: 0; 2 ; et 2 R: Le principe gnral du test de Dickey Fuller consiste tester " lhypothse nulle de la prsence dune racine unitaire : H0 : = 1 Ha : jj < 1 (3.93) (3.94)
En eet, sous lhypothse nulle H0 ; le processus (3.92) se ramne une pure marche alatoire (Random Walk Process). Lhypothse nulle teste correspond ainsi une hypothse de non stationnarit stochastique 10 . Ce test, comme tout test non symtrique, peut tre ralis de direntes faons. La plus simple consiste utiliser une statistique de Student associe lhypothse H0 : En cela, le test de Dickey Fuller ne se distingue pas dun test quelconque dune hypothse non symtrique. L o lapplication du test de Dickey Fuller dire de celle dun test standard, cest dans la distribution asymptotique de la statistique de Student associe au test H0 : En eet, nous allons montrer que la distribution asymptotique de lestimateur des MCO du paramtre ; sous lhypothse de non stationnarit; est non standard. On na plus dans ce cas une distribution asymptotique normale, comme en conomtrie de base. De la mme faon, la statistique de Student associe au tests = 1; na pas une distribution asymptotique standard (distribution de Student approxime par une distribution normale). Cest pourquoi, lapplication du test de Dickey Fuller ncessite que lon utilise des seuils dirents de ceux que lon utilise traditionnellement pour des statistiques de Student. De plus, puisquun malheur narrive jamais seul, nous montrerons que la distribution asymptotique de la statistique de Student associe au test H0 ; nest pas la mme suivant que dans le modle (3.92) on inclut ou non, une constante et un trend dterministe. Ds lors, puisque a priori, on se sait pas si lon doit inclure cette constante et ce trend, il convient dappliquer non pas un test simple, mais une stratgie de tests de Dickey Fuller.
Cest pourquoi le test de Dickey Fuller, contrairement dautres tests que nous verrons par la suite, est un test de non stationnarit, et non pas un test de stationnarit.
10
40
3.1
Des distributions asymptotiques non standard sous H0
Considrons le modle le plus simple sans constante, ni trend. Soit un processus (xt ; t 2 Z) satisfaisant la reprsentation AR (1) suivante : xt = xt1 + "t (3.95) avec "t i:i:d: 0; 2 : Dans ce modle, le test de Dickey Fuller revient tester lhypothse nulle " = 1: Nous commencerons par tudier la distribution asymptotique de lestimateur des MCO du paramtre ; sous lhypothse H0 : Puis nous tudierons la distribution la statistique de Student associe au test = 1: 3.1.1 Distribution de lestimateur b
Daprs la dnition des MCO; pour un chantillon de taille T; lestimateur b est dni par : b=
t=1 T P T P
xt xt1 x2 t1
(3.96)
t=1
Nous savons que sous, lhypothse H0 ( = 1) ; le processus gnrateur de donnes (modle 3.113) se ramne alors une simple marche alatoire xt = xt1 + "t (3.97) P P P avec "t i:i:d: 0; 2 : Ainsi on a T xt xt1 = T x2 + T xt1 "t : Ds lors, le biais associ " t=1 t=1 t1 t=1 lestimateur b peut scrire sous la forme : b1 =
t=1 T P T P
xt1 "t x2 t1
(3.98)
t=1
An de contrler les vitesses de convergence des moments empiriques apparaissant au numrateur et au dnominateur, nous allons transformer cette expression de la faon suivante : T 1 T (b 1) =
T P
xt1 "t (3.99) x2 t1
t=1 T P T 2
t=1
Nous savons que sous, lhypothse H0 ( = 1) ; le processus gnrateur de donnes est une simple marche alatoire. En appliquant le Thorme Central Limite Fonctionnel et le Continuous Mapping Theorem, on sait que dans ce cas : T 1
T X t=1
xt1 "t !
T !1
i 2 h " W (1)2 1 2
(3.100)

T X t=1
41
x2 t1
T !1
2 "
[W (r)]2 dr
(3.101)
Proposition 18 Sous lhypothse H0 de non stationnarit, = 1, la distribution asymptotique de lestimateur b des MCO du paramtre dans le modle xt = xt1 + "t (3.102) avec "t i:i:d: 0; 2 ; est la suivante : " h i W (1)2 1 1 L T (b 1) ! R 1 2 T !1 2 0 [W (r)] dr
o W (:) dsigne un mouvement Brownien scalaire standard. On peut alors tablir la distribution asymptotique de lestimateur b sous lhypothse H0 :
(3.103)
o W (:) est un mouvement Brownien standard.
On vrie ainsi que conformment ce que nous avions nonc en introduction, la distribution asymptotique de lestimateur b obtenue sous H0 est non standard, et en particulier non symtrique. Plusieurs remarques peuvent tre faites ce niveau, qui nous permettront de bien comprendre les implications de la non stationnarit.
Remarque 1. Lestimateur b converge la vitesse 1=T , sous lhypothse H0 = 1; alors quil converge la vitesse 1=T 1=2 sous lhypothse alternative Ha ; jj < 1 : h i W (1)2 1 1 L Sous H0 : T (b 1) ! R 1 (3.104) 2 T !1 2 0 [W (r)] dr p L Sous Ha : T (b ) ! N 0; 2 (3.105) b
T !1
Une autre faon de comprendre ce rsultat est la suivante. Quelle que soit lhypothse retenue, stationnarit ou non, lestimateur des MCO converge en probabilit vers la vraie valeur (avec = 1; si H0 est vraie, jj < 1; si Ha est vraie). b !
T !1 p
Toutefois, si les donnes sont non stationnaires (H0 : = 1), lestimateur des MCO; converge plus vite vers la vraie valeur du paramtre ; gale 1 dans ce cas l. La variance de la distribution p asymptotique scrase alors la vitesse T sous H0 ; alors quelle ne scrase qu la vitesse T dans le cas stationnaire (cf. illustration de la convergence en probabilit, chapitre 1).
42
Remarque 2. Sous lhypothse de non stationnarit H0 ; la distribution asympotique de lestimateur b est non standard (non normale). En particulier, cette distribution est non symtrique. p Rappelons que dans le cas stationnaire, la distribution asymptotique de T (b ) est une loi normale centre, donc par dnition une distribution symtrique. En revanche, sous H0 ; la distribution de T (b 1) nest pas une distribution normale, et en particulier cette distribution est non symtrique. h i W (1)2 1 1 L T (b 1) ! R 1 2 T !1 2 0 [W (r)] dr
Pour illustrer cette dernire remarque, on peut raliser un exercice de simulation sous Eviews. Lide gnrale de cet exercice est la suivante. On va rpliquer, par la mthode de Monte Carlo, N chantillons (qualis de pseudo chantillons) du processus xt dni par lquation (3.95) sous lhypothse nulle = 1: Pour cela il sut de se donner une valeur numrique pour 2 et de tirer " N chantillons de taille T dans une loi normale11 N 0; 2 : A partir de ces N chantillons du " processus f"t gT , on reconstruit N chantillons de taille T du processus fxt gT selon lquation t=1 t=1 xt = xt1 +"t ; en se donnant pour chaque chantillon une condition initiale sur x0 (par exemple x0 = 0): Ensuite, il sut deectuer la rgression de xt sur xt1 et de stocker pour chaque chantillon la ralisation de lestimateur b des MCO: Ainsi, au nal, on obtient N ralisations de cet estimateurs, partir desquelles on peut calculer un certain nombre de statistiques et construire, en particulier, un estimateur de la distribution de b: Tableau 3.2: Valeurs des Paramtres de la Simulation N 100 T 5000 2 " 1 x0 0
En eet, tant donne la dnition dun mouvement Brownien standard, le processus W (1)2 suit approximativement un 2 (1) : Sachant que P 2 (1) < 1 = 0:68; cela signie que la distribution de R1 T (b 1) ; conditionnellement 0 [W (r)]2 dr; est non symtrique et quenviron 2=3 des ralisations b de seront infrieures 1.
Pour approcher au mieux de la distribution asymptotique il convient de choisir une taille T dchantillon assez importante. De plus, il convient de faire un grand nombre N de simulations pour obtenir des statistiques indpendantes des tirages eectus dans la loi normale. Les paramtres que nous avons retenus pour cet exercice sont reports dans le tableau (3.2).
11
Lhypothse de normalit des "t est en eet compatible avec lhypothse "t i:i:d: de notre modle.
Chapitre 2. Les Processus Alatoires Non Stationnaires Le programme12 utilis sous Eviews est le suivant :
0 - Vecteur des Realisations de l estimateur des MCO-
43
vector (100) rho for !i = 1 to 100 0initialisation du processus smpl 1 5001 genr x = 0 0Construction de la Marche Aleatoire genr eps = nrnd smpl 2 5001 genr x = x(-1)+eps 0Regression OLS equation eq1.ls x x(-1) rho(!i) = eq1.@coefs(1) next 0Conversion des Vecteurs en Series smpl 1 100 mtos(rho,rho-s) genr biais-s = (rho-s-1)*5000 Ce programme dbute par la dclaration dun vecteur, nomm rho, de dimension (N; 1) dans lequel seront stockes les valeurs de la ralisation de lestimateur b pour chaque simulation. Ensuite une boucle est construite avec un indice i allant de 1 N = 100: Au sein de cette boucle, on commence par initialiser le processus xt en lgalisant 0 sur lensemble de la priode allant de 1 5001 (la premire valeur correspondant au x0 ). Ensuite, laide de la commande nrnd on eectue un tirage dans un loi normale N (0; 1) que lon stocke dans une srie eps. En rduisant la priode dchantillon, de la date 2 la date 5001, on reconstruit la srie xt selon le modle xt = xt1 + "t : La valeur retarde de xt se note x(-1). Reste enn eectuer la rgression de xt sur xt1 (ls x x(-1)) et stocker dans le vecteur rho la valeur de lestimateur b obtenue pour le eme pseudo chantillon, grce linstruction rho(!i) = eq1.@coefs(1). Au sortir de la boucle, i on convertit le vecteur rho en une srie rho-s an deectuer plus facilement certains calculs, et lon construit la variable transforme biais-s correspondant la v.a.r. T (b 1). En cliquant sur la srie rho-s, puis en cliquant sur View, Descriptive Statistics, et Histogramm and Stats, on obtient les informations qui sont reportes sur la gure (3.8). Tout dabord, ces
Pour lancer ce programme, il convient au pralable de crer un Workle de type Undated or Irregular, de 1 5001, puis de charger le programme (open program ) ou de le taper (new program), et ensuite de lexcuter (Run).
12
44
rsultats apparaissent compatibles avec le fait que lestimateur b soit un estimateur convergent (plim b = 1) puisque lon observe que la moyenne des 100 ralisations des b est trs proche de 1. La distribution des b apparat en outre relativement concentre autour de la vraie valeur = 1: Mais ce qui est le plus frappant, cest que lon vrie partir de cette petite exprience la non symtrie de la distribution (cf. remarque 2). On peut le vrier visuellement partir de lhistogramme, mais en outre cette intuition est conforte par lexamen de la Skewness qui vaut 1:38 dans cette exprience et qui est donc largement dirente de 0. Le test de normalit de Jarque-Bera (cf. chapitre 4) rejette ainsi la normalit de la distribution. Figure 3.8: Histogramme et Statistiques Descriptives des b
Series: RHO_S Sample 1 100 Observations 100 Mean Median Maximum Minimum Std. Dev. Skewness Kurtosis Jarque-Bera Probability 0.999622 0.999819 1.000712 0.997520 0.000579 -1.381356 5.011701 48.66468 0.000000
14 12 10 8 6 4 2
0 0.9975 0.9980 0.9985 0.9990 0.9995 1.0000 1.0005
Ce premier examen quand la non normalit de la distribution, est toute fois incomplet et non fond sur le plan thorique. En eet, nous avons montr que la distribution asymptotique de b tait dgnre dans le sens o b converge en probabilit vers 1. Ainsi si lon fait tendre T vers linni, la distribution des b convergera vers une masse ponctuelle en 1. Donc pour tudier correctement la forme de la distribution asymptotique des b, il convient dtudier le comportement de la transforme T (b 1) qui elle possde une distribution non dgnre. Pour ce faire, on clique sur la srie biais-s, puis sur View, Distribution Graphs, Kernel Density. On obtient alors un estimateur (estimateur noyau) de la fonction de densit thorique de la v.a.r. T (b 1) : Cet estimateur de la densit thorique est reproduit sur la gure (3.9). Sur la gure (3.9), on vrie bien que la distribution asymptotique de T (b 1) nest pas une loi normale, conformment la proposition (18). On vrie en outre que cette distribution est non symtrique, et que la probabilit dobtenir une valeur de b infrieure 1, est largement suprieure celle dobtenir une valeur suprieure, et cela dans un rapport de 2=3; 1=3: En eet, la surface dnie
45
par la fonction de distribution empirique de T (b 1) entre 1 et 1 est largement suprieure celle dnie entre 1 et +1: Ainsi pour les N = 100 simulations eectues, nous avons obtenu 74 ralisations infrieures 1, et 26 suprieures. La probabilit empirique 0:74 dobtenir une valeur infrieure 1 est donc relativement proche de la probabilit thorique de 0.68. Pour un nombre de simulations N plus important, la dirence aurait t encore plus faible. Figure 3.9: Estimateur de la Fonction de Densit Thorique des T (b 1)
Kernel Density (Epanechnikov, h = 1.8832)
0.25 0.20 0.15 0.10 0.05 0.00 -10 -5 BIAIS_ST 0 5
3.1.2
Nous allons maintenant nous intresser au coeur du problme du test de Dickey Fuller, savoir le comportement asymptotique de la statistique de Student associe au test = 1 dans le modle : xt = xt1 + "t (3.106)
Distribution de la statistique de Student tb=1
avec "t i:i:d: 0; 2 : La question que lon se pose sur le plan pratique est la suivante : peut on, " sous lhypothse H0 , adopter les seuils standard dune loi normale (1.96 5% par exemple) pour eectuer le test de Dickey Fuller ? Exprime en dautres termes, cette question revient dterminer si la distribution asympotique de la statistique de Student associe au test = 1, correspond, sous H0 ; une loi de Student, qui peut tre approxime par une loi normale pour T ! 1 (cf. chapitre 1). Si tel nest pas le cas, alors le test de Dickey Fuller ne devra bien entendu pas tre construit partir des seuils standards de la loi normale.
46
Pour rpondre cette question, commenons par dnir la statistique de Student sur laquelle sera fonde le test de Dickey Fuller de lhypothse nulle = 1. Cette dernire, note tb=1 ; est tout simplement dnie de la faon suivante : 2 31 2 T P 2 xt1 7 6 (b 1) 6 7 = (b 1) 6 t=1 2 7 (3.107) tb=1 = b 4 sT 5 o s2 dsigne lestimateur empirique de la variance des rsidus : T
T T
s2 T
Essayons prsent dtablir la distribution asymptotique de tb=1 sous H0 : Pour cela tudions 2 : On sait que sous H ; ou sous H ; lestimateur tout dabord le comportement asymptotique de sT 0 a b est convergent (plim b = ): Donc par construction, les rsidus estimes bt = xt bxt1 sont non " 2 converge en probabilit biaiss. Dans ce cas, on montre que le moment empirique dordre deux sT vers la variance 2 de la population des rsidus "t (cf. chapitre 1). "
p b p ! =) s2 ! 2 T " T !1 T !1
An de contrler la vitesse de convergence des moments intervenant au numrateur et au dnominateur de tb=1 ; nous allons tudier la distribution asymptotique de tb=1 exprime sous la forme suivante : T P T 1 xt1 "t t=1 tb=1 = (3.109) 1 2 T P 2 T 2 xt1 sT
t=1
X X 1 1 b2 = "t (xt bxt1 )2 = (T 1) t=1 (T 1) t=1
(3.108)
(3.110)
Reprenons maintenant un un les dirents lements de lexpression de tb=1 (quation 3.109) et tudions leurs distributions respectives. Daprs les rsultats de la premire section, on a : T 1
T X t=1
xt1 "t !
L
T !1
i 2 h " W (1)2 1 2 Z
1
T 2
T X t=1
x2 ! 2 t1 "
T !1 p T !1
[W (r)]2 dr
sT ! " En utilisant les direntes proprits numres dans le cadre des rappels du premier chapitre sur la convergence en loi et en probabilit, on peut alors immdiatement driver la distribution asymptotique de tb=1 .
47
Proposition 19 Sous lhypothse H0 de non stationnarit, la distribution asymptotique de la statistique de Student associe au test de Dickey Fuller, = 1; dans le modle xt = xt1 + "t avec "t i:i:d: 0; 2 ; est la suivante : " tb=1 h i W (1)2 1 1 L ! n o1 T !1 2 R 1 2 [W (r)]2 dr 0 (3.111)
(3.112)
o W (:) est un mouvement Brownien standard.
Ainsi, on vrie que cette distribution asymptotique nest pas une distribution normale. Encore une fois, en particulier, cette distribution est non symtrique en raison de la prsence du terme W (1)2 distribu selon un 2 : Les seuils de cette loi ont t tabuls par Dickey et Fuller (1979) et par dautres auteurs comme Mc Kinnon (1981).
Remarque 1. La distribution asymptotique, sous H0; de la statistique de Student tb=1 du test de Dickey Fuller dans le modle (3.106) nest pas standard. Lutilisation, tort, des seuils standard associs une distribution normale peut ainsi conduire un mauvais diagnostic quant la non stationnarit de la srie tudie. En particulier, ce type derreur conduit rejeter trop souvent lhypothse de non stationnarit. Essayons, de bien comprendre les enjeux de cette remarque. Pour cela, menons nouveau un exercice de simulation. On simule, de la mme faon que prcdemment, un grand nombre (N) de pseudo chantillons du processus fxt gT sous lhypothse H0 : Pour chaque pseudo chantillon, on t=1 ralise la rgression de xt sur xt1 ; et lon conserve la ralisation de la statistique de Student tb=1 associe au test = 1: On obtient N ralisations de cette statistique, partir desquelles on peut la distribution de tb=1 :
Dans la pratique, les principaux logiciels dconomtrie (et en particulier Eviews), proposent une statistique de Student associe au test de la nullit dun paramtre dj programme, alors que le test de lgalit dun paramtre 1 nest pas toujours programm. Cest pourquoi, pour viter de programmer la construction de tb=1 ; nous allons tout dabord transformer ce modle avant dappliquer le test de Dickey Fuller. Proposition 20 Le test de lhypothse = 1 dans lquation (3.95) est identique au test de lhypothse = 0 dans le modle transform suivant : xt = xt1 + "t (3.113)
48
avec = 1 et xt = (1 L) xt = xt xt1 : Dans ce modle, le test de Dickey Fuller se ramne alors H0 : = 1 = 0 contre Ha : < 0: La statistique t=0 a la mme b distribution asympotique que tb=1 : Pour cet exercice de simulation, nous avons retenu les mme paramtres que pour la simulation prcdente (cf. tableau 3.2), lexception du nombre de simulations N que nous avons port 1000. Le programme13 sous Eviews est le suivant :
0 - T Statistique : Test de Dickey Fuller-
vector (1000) tstat for !i = 1 to 1000 0initialisation du processus smpl 1 5001 genr x = 0 0 Construction de la Marche Aleatoire genr eps = nrnd smpl 2 5001 genr x = x(-1)+eps genr dx = x - x(-1) 0Regression OLS equation eq1.ls dx x(-1) tstat(!i) = eq1.@tstats(1) next 0 Conversion des V ecteurs en Series smpl 1 1000 mtos(tstat,tstat-s) Lide gnrale du programme est sensiblement la mme que pour lexercice prcdent, la seule dirence tant que cette fois-ci, on construit le vecteur des statistiques de Student grce linstruction @tstats(1) qui permet de rcuprer les t-stats de la rgression des MCO. Lestimateur de la fonction de densit de t=0 obtenu partir des 1000 simulations est report sur la gure b (3.10). On constate une nouvelle fois que la distribution asymptotique de t=0 (qui a la mme b distribution asympotique que tb=1 ) nest pas une loi normale. On vrie, que conformment au rsultat thorique, cette distribution nest pas symtrique. A partir des 1000 simulations, il est en outre possible de calculer les quantiles au seuil associs au test non symtrique = 1 et de le comparer ceux que lon obtiendrait, si lon supposait,
13 Pour lancer ce programme, il convient au pralable de crer un Workle de type Undated or Irregular, de 1 5001, puis de charger le programme (open program ) ou de le taper (new program), et ensuite de lexcuter (Run).
49
Figure 3.10: Estimateur de la Fonction de Densit Empirique de t=0 b

Kernel Density (Epanechnikov, h = 0.4944) 0.5 0.4 0.3 0.2 0.1 0.0 -3 -2 -1 0 TRHO_S 1 2 3
tort que tb=1 tait distribue selon une loi N (0; 1) : On cherche donc le seuil C() tel que14 : n o P t=0 C() = b
(3.114)
Pour cela, il sut de classer dans lordre croissant les 1000 ralisations de t=0 et de considrer b la N=100 eme ralisation. Par exemple, pour le seuil 5%; aprs avoir class les ralisations, on retiendra la 50eme observation, puisque empiriquement, il existe 95% de chances que lon ait une ralisation suprieure ce seuil. Sur le tableau (3.3) sont reports les seuils obtenus partir des simulations, et les seuils thoriques associs un test unilatral fond sur une loi N (0; 1) : Tableau 3.3: Seuils Critiques des Tests t=0 b C() N(0;1) C() = 1% 2; 44 2:32 = 5% 1; 98 1:64 = 10% 1; 58 1:28
On observe ainsi que si lon considre un risque de premire espce de 5%, le seuil dune loi normale pour le test unilatral = 1, est gal 1:64. Mais, nous avons vu thoriquement que la statistique t=0 ne suit pas une loi normale. Les 1000 simulations montrent que le vrai seuil b
14
Contrairement au test standard, on ne considre pas ici la valeur absolue de la t-stat : le test est non symtrique.
50
5% de la loi de t=0 ; est en fait plus proche de 1:98. Ainsi, on vrie que lon aurait eu tendance b trop souvent rejeter la non stationnarit si lon avait appliqu pour le test de Dickey Fuller les seuils standard dune loi normale. Le mme diagnostic vaut pour les autres niveaux de risque. Cest pourquoi, il est ncessaire dutiliser les seuils tabuls par Dickey Fuller (1979) ou Mc Kinnon (1981) pour eectuer les test de non stationnarit.
3.2
Des distributions conditionnelles au modle choisi...
Comme un malheur narrive jamais seul, le pauvre conomtre qui voit dj disparatre sa sacro sainte loi normale dans lapplication des tests de Dickey Fuller, va de plus tre confront un autre type de problme : celui de la dpendance des distributions asymptotiques au modle choisi.
Proposition 21 Sous lhypothse H0 de non stationnarit, la distribution asymptotique de la statistique de Student tb=1 dire suivant que le modle utilis soit : xt = xt1 + "t (3.115) (3.116) (3.117) xt = xt1 + c + "t xt = xt1 + c + t + "t avec "t i:i:d: 0; 2 : "
Ainsi, le fait dintroduire une constante, ou une constante et un trend dterministe aecte la distribution asymptotique de tb=1 : Pour le praticien, cela signie que les seuils critiques du tests de Dickey Fuller ne seront pas identiques, suivant que lon inclut ou non dans le modle une constante et un trend. Cela pose naturellement un problme, puisque a priori, on ne sait pas si lon doit inclure ces lments dans le modle test. Cest pourquoi, on propose gnralement une stratgie de tests de Dickey Fuller, et non pas un seul test unique. Nous ne dmontrerons pas le rsultat gnral de cette proposition. Nous nous contenterons de dmontrer que la distribution de lestimateur b obtenue dans le modle (3.115) dire de celle obtenue dans le modle (3.116). Naturellement, il en dcoule que la distribution de tb=1 dans les deux modles dire. Dterminons la distribution de tb=1 partir du modle (3.116). Pour ce faire, nous considrerons pour simplier que sous H0 ; le processus xt est non stationnaire (hypothse du test de Dickey Fuller), mais quen plus il se ramne une marche alatoire pure (c = 0): Ainsi supposons que les donnes soient gnres par le modle : xt = xt1 + "t (3.118)
51
avec "t i:i:d: 0; 2 : Le modle estim par les M CO; pour eectuer le test de non stationnarit, " inclut une constante (modle 1 des tests Dickey Fuller donn par lquation 3.116) : xt = xt1 + c + "t Les estimateurs b et b sont alors dnis par le systme matriciel : c c b b1 6 T =6 T 4 P
T X t=1
(3.119)
xt1
t=1
Etudions le comportement asymptotique de ces dirents lments : T 1 xt1 "t ! x2 t1 !

L L
t=1 T P
T P
t=1
xt1 7 7 5 x2 t1
31 2
7 6 t=1 "t 7 6 T 5 4 P xt1 "t

t=1
T P
T !1
i 2 h " W (1)2 1 2 Z
1
T X t=1
T !1 L
2 "
[W (r)]2 dr
1
3 2
T X t=1
xt1 ! "
T !1 T X t=1 L
W (r) dr
T2
"t ! " W (1)

T !1
An de contrler la vitesse de convergence des dirents lments de cette donc utiliser la transforme suivante15 : 2 31 2 T T 3 P 1 P 1 T 1 T T2 xt1 7 6 T 2 "t 6 T 2b c t=1 t=1 6 7 6 =4 T T T 5 4 P 2 P 3 P T (b 1) T2 xt1 T 2 xt1 T 1 xt1 "t
t=1 t=1 t=1
expression, on doit 3 7 7 5
(3.120)
Ds lors, en utilisant les proprits de la convergence en loi, on montre que : #1 " " # R1 1 " W (1) 2b 1 " 0 W (r) dr L T c h i R R ! 2 " W (1)2 1 T (b 1) T !1 " 01 W (r) dr 2 01 [W (r)]2 dr 2 "
A partir de ces dirents lments, on peut facilement driver la distribution asymptotique de lestimateur b.
15
En eet, 8T 2 R+ ; et 8 (a; b; c; d; e; f ) 2 R6 tels que ad 6= c2 ; on a : " #1 " p decf # 3 1 T adc2 T 1 a T 2 c T2 e = 3 T ce+af T 1 f T 2 c T 2 d adc2
52
Proposition 22 La distribution asymptotique de lestimateur b obtenue dans le modle xt = xt1 + c + "t (3.121) sous lhypothse de non stationnarit H0 ; est la suivante : h i R1 1 W (1)2 1 W (1) 0 W (r) dr 2 L T (b 1) ! hR i2 R1 T !1 1 [W (r)]2 dr 0 W (r) dr 0 xt = xt1 + "t cette mme distribution asymptotique de b tait dnie par : h i W (1)2 1 1 L T (b 1) ! R 1 T !1 2 [W (r)]2 dr
0
(3.122)
Dans le modle :
(3.123)
(3.124)
On vrie bien que la distribution de lestimateur b dire suivant que lon inclut ou non dans le modle estim une constante. Il en va de mme pour lintroduction dune tendance dterministe. Naturellement, si la distribution de b dire suivant les modles, celle de la statistique de Student du test de Dickey Fuller dire elle aussi suivant le modle estim. En particulier, on peut montrer (exercice) : Proposition 23 Sous lhypothse H0 de non stationnarit, la distribution asymptotique de la statistique de Student associe au test de Dickey Fuller, = 1; dans le modle xt = xt1 + c + "t avec "t i:i:d: 0; 2 ; est la suivante : " h i R1 W (1)2 1 W (1) 0 W (r) dr 1 L tb=1 ! hR i2 1 T !1 2 R 2 1 1 2 [W (r)] dr 0 W (r) dr 0 (3.125)
(3.126)
Ainsi, on vrie que la prsence dune constante modie la distribution asymptotique de la statistique de test de lhypothse de racine unitaire. En eet, dans le modle sans constante, nous avions montr que : h i W (1)2 1 1 L tb=1 ! n (3.127) o1 T !1 2 R 1 2 2 0 [W (r)] dr Il en est exactement de mme concernant la prsence dune tendance dans le modle. A chaque fois la distribution asymptotique de tb=1 est aecte.
53
Tout ceci est dautant plus regrettable pour lconomtre que les seuils critiques sont relativement dirents pour les 3 modles. Comme on peut lobserver sur le tableau (3.4), la dformation de la distribution asymptotique est susamment importante pour que les seuils standard soient 1 trs dirents. On note C() le seuil critique pour un risque de premire espce de % associ au 2 modle (3.115) sans constante ni trend. On note C() le seuil critique associ au modle (3.116) 3 avec constante sans trend. On note C() le seuil critique associ au modle (3.117) avec constante et trend. Tableau 3.4: Seuils Critiques des Tests t=0 b
1 C() 2 C() 3 C()
= 1% 2:58 3:43 3:96
= 5% 1:95 2:86 3:41
= 10% 1:62 2:57 3:12 1
L es seu ils so nt tirs d e Fu ller (1 9 7 6 ) p o u r T =
On comprend ainsi que si lon se trompe de modle, par exemple si lon inclut tort une constante dans le modle estim, on se trompe de seuil critique, et donc risque fort de se tromper de diagnostic quant la stationnarit de la srie tudie. Cest pourquoi, il convient prsent de dvelopper une stratgie de tests de non stationnarit pour tester la non stationnarit dans un modle adquat.
54
3.3
Une Stratgie de Tests
Nous allons prsent proposer une stratgie de tests de Dickey Fuller permettant de tester la non stationnarit conditionnellement la spcication du modle utilis. On considre trois modles dnis comme suit : Modle 1 : xt = xt1 + "t (3.128) Modle 2 : xt = xt1 + c + "t Modle 3 : xt = xt1 + c + t + "t avec "t i:i:d: 0; 2 : On cherche tester lhypothse de racine unitaire : " H0 : = 0 H1 : < 0 (3.129) (3.130)
(3.131)
Remarque 1. Le principe gnral de la stratgie de tests est le suivant. Il sagit de partir du modle le plus gnral, dappliquer le test de racine unitaire en utilisant les seuils correspondant ce modle, puis de vrier par un test appropri que le modle retenu tait le bon. En eet, si le modle ntait pas le bon, les seuils utiliss pour le test de racine unitaire ne sont pas valable. On risque alors de commettre une erreur de diagnostic quant la stationnarit de la srie. Il convient dans ce cas, de recommencer le test de racine unitaire dans un autre modle, plus contraint. Et ainsi de suite, jusqu trouver le bon modle, les bons seuils et bien entendu les bons rsultats.
Le droulement de la stratgie de test est reporte sur la gure suivante. On commence par tester la racine unitaire partir du modle le plus gnral, savoir le modle 3. On compare 3 la ralisation de la statistique de Student t=0 aux seuils C() tabuls par Dickey et Fuller, ou b McKinnon pour le modle 3 (par exemple 3:41 5%, pour T ! 1). Si la ralisation de t=0 b 16 au seuil C 3 ; on accepte lhypothse nulle de non stationnarit. Une fois que le est suprieure () diagnostic est tabli, on cherche vrier si la spcication du modle 3, incluant une constante et un trend, tait une spcication compatible avec les donnes. On teste alors la nullit du coecient de la tendance. Deux choses lune : Soit on a rejet au pralable lhypothse de racine unitaire, dans ce cas on teste la nullit de par un simple test de Student avec des seuils standards (test symtrique, donc seuil de 1:96 5%). Si lon rejette lhypothse = 0; cela signie que le modle 3 est le bon modle
Etant donn que le test est non symtrique, on ne considre pas, bien entendu, la valeur absolue de t=0 ; mais b son niveau relatif.
16
55
pour tester la racine unitaire, puisque la prsence dune tendance nest pas rejete. Dans ce cas, on conclut que la racine unitaire est rejete, la srie est T S; du fait de la prsence de la tendance. En revanche, si lon accepte lhypothse = 0, le modle nest pas adapt puisque la prsence dune tendance est rejete. On doit refaire le test de racine unitaire partir du modle 2, qui ne comprend quune constante. Soit, au contraire, on avait au pralable, accept lhypothse de racine unitaire, et dans ce cas, on doit construire un test de Fischer de lhypothse jointe = 0 et = 0: On teste ainsi la nullit de la tendance, conditionnellement la prsence dune racine unitaire:
3 3 H0 : (c; b; ) = (c; 0; 0) contre H1
(3.132)
La statistique de ce test se construit de faon standard par la relation : SCR3;c SCR3 =2 F3 = SCR3 = (T 3)
3 o SCR3;c est la somme des carrs des rsidus du modle 3 contraint sous H0 :
(3.133)
xt = c + "t et SCR3 est la somme des carrs des rsidus du modle 3 non contraint (quation 3.130). Les seuils distance ni de cette statistique sont fournies dans la partie annexe du programme de cours. Si la ralisation de F3 est suprieure la valeur 3 lue dans la table un seuil %, on 3 rejette lhypothse H0 : Dans ce cas, le modle 3 est le bon modle et la srie xt est intgre dordre 1, I (1) + c + T; le taux de croissance est T S, xt = c + t + "t . En revanche, si lon 3 accepte H0 ; le coecient de la tendance est nul, le modle 3 nest pas le bon modle, on doit donc eectuer nouveau le test de non stationnarit dans le modle 2.
56
Stratgie de Tests de Dickey Fuller
57
Si lon a accept la nullit du coecient de la tendance, on doit alors eectuer nouveau les tests de non stationnarit partir cette fois-ci du modle 2 (quation 3.129) incluant uniquement 2 une constante. On compare alors la ralisation de la statistique de Student t=0 aux seuils C() b tabuls par Dickey et Fuller, ou McKinnon pour le modle 2 (par exemple 2:86 5%, pour 2 T ! 1). Si la ralisation de t=0 est suprieure au seuil C() ; on accepte lhypothse nulle de b non stationnarit. Une fois que le diagnostic est tabli, on cherche vrier si la spcication du modle 2, incluant une constante, est une spcication compatible avec les donnes. On teste alors la nullit du coecient c de la constante. Deux choses lune : Soit on a rejet au pralable lhypothse de racine unitaire, dans ce cas on teste la nullit de c par un simple test de Student avec des seuils standard (test symtrique, donc seuil de 1:96 5%). Si lon rejette lhypothse c = 0; cela signie que le modle 2 est le bon modle pour tester la racine unitaire, puisque la prsence dune constante nest pas rejete. Dans ce cas, on conclut que la racine unitaire est rejete, la srie est stationnaire I (0) + c. En revanche, si lon accepte lhypothse c = 0, le modle 2 nest pas adapt puisque la prsence dune constante est rejete. On doit refaire le test de racine unitaire partir du modle 1, qui ne comprend ni constante ni trend. Soit, au contraire, on avait au pralable, accept lhypothse de racine unitaire, et dans ce cas, on doit construire un test de Fischer de lhypothse jointe = 0 et c = 0: On teste ainsi la nullit de la constante, conditionnellement la prsence dune racine unitaire:
2 2 H0 : (c; ) = (0; 0) contre H1
(3.134)
La statistique de ce test se construit de faon standard par la relation : SCR2;c SCR2 =2 F2 = SCR2 = (T 2)
(3.135)
2 o SCR2;c est la somme des carrs des rsidus du modle 2 contraint sous H0 , cest dire PT 2 PT SCR2;c = t=1 "t = t=1 (xt )2 et SCR2 est la somme des carrs des rsidus du modle 2 non contraint (quation 3.129). Les seuils distance ni de cette statistique sont fournies dans la partie annexe du programme de cours. Si la ralisation de F2 est suprieure la 2 valeur 1 lue dans la table un seuil , on rejette lhypothse H0 au seuil %: Dans ce cas, le modle 2 est le bon modle et la srie xt est intgre dordre 1, I (1) + c. En revanche, si 2 lon accepte H0 ; le coecient de la constante est nul, le modle 2 nest pas le bon modle, on doit donc eectuer nouveau le test de non stationnarit dans le modle 1.
Enn, si lon a accept la nullit du coecient c de la constante, on doit alors eectuer nouveau les tests de non stationnarit partir cette fois-ci du modle 1 (quation 3.128) sans constante ni trend. On compare alors la ralisation de la statistique de Student t=0 aux seuils b
58
1 C() tabuls par Dickey et Fuller, ou McKinnon pour le modle 1 (par exemple 1:95 5%, pour 1 T ! 1). Si la ralisation de t=0 est suprieure au seuil C() ; on accepte lhypothse nulle de b non stationnarit. Dans ce cas la srie xt est I (1) et correspond une pure marche alatoire, xt = xt1 + "t : Si lhypothse nulle est rejete, la srie est stationnaire, I (0) de moyenne nulle xt = xt1 + "t ; avec jj < 1.
3.4
Application : PIB, consommation et commerce extrieur
Nous allons proposer prsent une application de la stratgie de tests de Dickey Fuller direntes sries17 issues des Comptes Nationaux Trimestriels de lINSEE, releves sur la priode allant du premire trimestre 1978 au deuxime trimestre 2001, soit 94 observations. Les quatre sries utilises sont exprimes en milliards deuros, au prix de 1995, et correspondent ainsi des agrgats en volume qui sont de plus corrigs des variations saisonnires (donnes CVS ). 1. CONSO : correspond la consommation des mnages. 2. EXPORT : correspond aux exportations CAF agrges. 3. IMPORT : correspond aux importations CAF agrges. 4. PIB : correspond au produit intrieur brut. Le graphique de ces sries est report sur la gure (3.11). Figure 3.11: Comptes Trimestriels de lINSEE : 1978:1-2001:2
200 120 100 80 160 60 140 40 20 78 80 82 84 86 88 90 92 94 96 98 00 CONSO 78 80 82 84 86 88 90 92 94 96 98 00 EXPORT
180
120
100
360 340
80
320 300
60
280 260
40
240 220
20 78 80 82 84 86 88 90 92 94 96 98 00 IMPORT
200 78 80 82 84 86 88 90 92 94 96 98 00 PIB
17
Ces sries sont disponibles sur le site de lINSEE (www.insee.fr) dans la rubrique comptes nationaux.
59
Un simple examen graphique met clairement en vidence le fait que les quatre sries tudies sont a priori non stationnaires. Les processus gnrateurs correspondants ne semblent pas satisfaire en eet la condition dinvariance de lesprance, et il en va de mme pour la variance. Reste savoir si ces processus sont des processus DS ou T S selon la terminologie de Nelson et Plosser (1982). Nous faisons lhypothse18 pour linstant que les quatre processus, sils sont I (d) ; sont au plus I (1) : Appliquons la stratgie de tests de Dickey Fuller expose prcdemment tout dabord la consommation des mnages. On commence par estimer le modle 3, xt = xt1 + c + :t + "t ; incluant une constante et un trend. On teste alors la prsence dune racine unitaire dans le processus en testant la nullit du b paramtre laide dune statistique de Student t , o dsigne lestimateur des MCO: Sous le b logiciel Eviews; on peut soit eectuer directement cette rgression en crant au pralable la srie xt et la tendance grce linstruction @trend(n), soit on utilise le test pr-programm sous le logiciel. Pour cela, il sut de cliquer sur la srie, puis sur longlet View; puis sur longlet Unit Root Test. Apparat alors une bote de dialogue dans lequel on choisit le type Augmented Dickey Fuller, le test in level, on inclut une constante et un trend (Trend and Intercept) et lon choisit un nombre de termes en dirences retards (Lagged Dierence) gal 0. Le rsultat de lachage pour la srie CONSO est reproduit sur la gure (3.12). Figure 3.12: Test de Racine Unitaire sur CONSO : Modle 3
18 Si lon dsire vrier cette hypothse, il sut de tester la stationnarit des taux de croissance des sries en appliquant les tests de Dickey Fuller ces taux de croissance.
60
Cette procdure nous donne la valeur des ralisations des estimateurs des MCO des dirents paramtres du modle 3 (; c; ) ainsi que les statistiques de Student associes aux tests de nullit de ces paramtres. Ce qui nous intresse ici plus particulirement cest bien entendu la statistique de Student t associe la variable endogne retarde CONSO(1). Celle-ci est ici gale 1:236, b et cette valeur est en outre reporte en haut de lachage (ADF Test Statistic). Pour tester lhypothse = 0; on utilise alors les seuils tabuls par Dickey et Fuller (cf. document joint, polycopi dexercices) pour le modle 3 et pour une taille dchantillon de 93 observations (T 1 en raison de la valeur retarde sur CONSO). Ces seuils sont reports dans lachage de la procdure dEviews. Au seuil de 5%, le seuil critique est C() = 3:4581 (3:45 dans la table fournie en annexe pour 100 observations). Ainsi, dans ce cas pour un niveau de risque de 5%, t > C() ; on b accepte lhypothse nulle de racine unitaire ( = 0). Il faut prsent valuer la validit de notre diagnostic en vriant que le modle partir duquel nous avons fait le test (modle 3) est bien le bon modle. Il nous faut donc prsent tester la nullit du coecient de la tendance conditionnellement la prsence dune racine unitaire. 3 On eectue pour cela le test H0 : (c; ; ) = (c; 0; 0) : Malheureusement, ce test joint nest pas prprogramm dans Eviews, il faut donc crire le petit programme suivant pour obtenir la valeur 3 de la statistique de Fisher F3 associe H0 :
0 - Construction des differences premieres
smpl 1978:2 2001:2 genr dconso = conso-conso(-1) 0 - Estimation du modele libre equation mod3.ls dconso c @trend(1978:1) conso(-1) scalar scr3=@ssr scalar ndl=@regobs-@ncoef 0 - Estimation du modele contraint equation mod3c.ls dconso c scalar scr3c=@ssr 0 - Construction de la statistique f3 scalar f3=((scr3c-scr3)/2)/(scr3/ndl) Ce programme nappelle que peu de commentaires. Il utilise simplement linstruction @ssr qui correspond la somme des carrs des rsidus de la rgression prcdente, linstruction @regobs qui correspond au nombre dobservations de cette rgression et linstruction @ncoef qui correspond au nombre de coecients estims. On estime19 successivement le modle libre (modle 3) et le modle
Dans ce cas, bien entendu il nest pas ncessaire dappliquer les M CO pour obtenir la somme des carrs des 2 PT P rsidus du modle contrainte puisque RC3c = avec xt = (1=T ) T xt : Toutefois, nous t=1 xt xt t=1 verrons que dans le cas des tests ADF; il sera ncessaire de faire une telle rgression. Cest pourquoi, nous prsentons
19
61
3 contraint sous H0 ; cest dire le modle xt = c + "t : La valeur de la ralisation de la statistique de Fischer F3 est stocke dans la variable scalaire (scalar) nomme f3. Il sut de cliquer sur ce scalaire dans le Workle dEviews pour voir sacher la valeur correspondante en bas de lcran. Pour la variable de consommation, nous obtenons ainsi une valeur de F3 gale 1:08: Cette valeur est comparer aux seuils critiques lus dans la table de Dickey et Fuller (1981), tableau VI, page 1063, fournie en annexe (cf. polycopi dexercices). Pour une taille dchantillon de 100, et un risque de premire espce de 5%, la valeur critique est gale 6:49. Donc la ralisation de F3 est infrieure au seuil critique, on accepte lhypothse nulle de la nullit du coecient de la tendance conditionnellement la prsence dune racine unitaire. Ceci signie que le test de non stationnarit pratiqu avec les seuils asymptotiques incluant une tendance (modle 3) doit tre remis en cause. Il faut donc recommencer ce test partir du modle incluant uniquement une constante.
On estime alors le modle 2, xt = xt1 + c + "t et lon teste la prsence dune racine unitaire. Pour cela, il sut de cliquer sur la srie, puis sur longlet View; puis sur longlet Unit Root Test. Apparat alors une bote de dialogue dans lequel on choisit le type Augmented Dickey Fuller, le test in level, on inclut uniquement une constante (Intercept) et lon choisit un nombre de termes en dirences retards (Lagged Dierence) gal 0. Le rsultat de lachage pour la srie CONSO est reproduit sur la gure (3.13). Figure 3.13: Test de Racine Unitaire sur CONSO : Modle 2
le programme sous cette forme an de prsenter une dmarche systmatique.
62
La statistique de Student t associe la variable endogne retarde CONSO(1) prend ici une b valeur de 0:595. Pour tester lhypothse = 0; on utilise alors les seuils tabuls par Dickey et Fuller pour le modle 2 (cf. document joint, polycopi dexercices) et pour une taille dchantillon de 93 observations. Ces seuils sont reports dans lachage de la procdure dEviews. Au seuil de 5%, le seuil critique est C() = 2:8925 (2:89 dans la table fournie en annexe pour 100 observations). Ainsi, dans ce cas pour un niveau de risque de 5%, t > C() ; on accepte lhypothse nulle de racine b unitaire ( = 0) dans le modle 2. Il faut nouveau valuer la validit de notre diagnostic en vriant que le modle 2 partir duquel nous avons fait le test de racine unitaire est bien le bon modle. On teste pour cela la nullit du coecient de la constante conditionnellement la prsence dune racine unitaire. On 2 eectue le test H0 : (c; ) = (0; 0) ; ce qui revient, dans le cas du test de Dickey Fuller simple, tester la nullit des deux coecients du modle 2. Ds lors, on peut utiliser la valeur de la ralisation de la statistique de Fisher programm dans Eviews pour le test de la nullit de lensemble des coecients du modle. Attention, ceci nest valable que pour le test de Dickey Fuller simple et ne le sera plus pour les tests ADF que nous verrons ultrieurement. Sur la gure (3.13), on observe que la ralisation de la statistique de Fisher, qui dans ce cas prcis et uniquement dans ce cas prcis correspond F2 ; est gale 0:354: Par contre, on ne doit surtout pas utiliser la pvalue programm sous Eviews, puisque celle-ci est construite partir dune distribution de Fischer standard de F2 : Il faut en eet comparer la ralisation de F2 aux seuils critiques de la table de Dickey et Fuller (1981), tableau VI, page 1063, fournie en annexe (cf. polycopi dexercices). Pour une taille dchantillon de 100, et un risque de premire espce de 5%, la valeur critique est gale 4:71. Pour un risque de 5%, la ralisation de F3 est infrieure au seuil critique, on accepte lhypothse nulle de la nullit de la constante conditionnellement la prsence dune racine unitaire. Ceci signie que le test de non stationnarit pratiqu avec les seuils asymptotiques incluant une constante (modle 2) doit tre remis en cause. Il faut donc recommencer ce test partir du modle 1 sans constante, ni trend. Il ne reste plus alors qu recommencer le test de racine unitaire partir du modle 1, xt = xt1 + "t . Dans la bote de dialogue, on choisit le type Augmented Dickey Fuller, le test in level, on exclut la constante et la tendance (None) et lon choisit un nombre de termes en dirences retards (Lagged Dierence) gal 0. Le rsultat de lachage pour la srie CONSO est reproduit sur la gure (3.14). La statistique de Student t associe la variable endogne retarde prend ici b une valeur de 6:538. Pour tester lhypothse = 0; on utilise alors les seuils tabuls par Dickey et Fuller pour le modle 1 (cf. document joint, polycopi dexercices). Ces seuils sont reports dans lachage de la procdure dEviews. Au seuil de 5%, le seuil critique est C() = 1:9436 (1:94 dans la table fournie en annexe pour 100 observations). Ainsi, dans ce cas pour un niveau de risque de 5%, t > C() ; on accepte lhypothse nulle de racine unitaire ( = 0) dans le modle 1. b
63
Figure 3.14: Test de Racine Unitaire sur CONSO : Modle 1
Finalement, selon le test de Dickey Fuller simple, on conclut que la srie trimestrielle de consommation des mnages est issue dun processus non stationnaire, de type I (1) et peut tre reprsente par une pure marche alatoire : xt = xt1 + "t (3.136) avec "t i:i:d: 0; 2 : Pour stationnariser cette srie, il convient donc de la direncier. En eet, on " peut vrier sur la gure (3.15) que la dirence premire de la srie de consommation des mnages semble possder un comportement de type stationnaire. A lissue de nos tests nous avons conclu que la dirence premire de la srie correspond linnovation "t ; qui dans le test de Dickey Fuller est assimil un bruit blanc. Or, il convient de sassurer que la srie direncie possde bien les proprits dun bruit blanc. En particulier, il convient de sassurer que celle-ci nest pas autocorrle puisque par dnition E ("t "tk ) = 0; si k 6= 0: Pour cela, il nous faut tudier le corrlogramme de la srie DCONSO. Pour obtenir ce corrlogramme sous Eviews, on clique sur la srie, puis sur Correlogram. Pour un choix de lags de 10, les rsultats achs sont reports sur la gure (3.16). Pour un ordre k allant de 1 10, gurent ce corrlogramme la ralisation de lautocorrlation empirique dordre k dnie pour une srie zt par : bk = 1 X [(zt z t ) (ztk z tk )] T k t=1
T
(3.137)
64
Figure 3.15: Srie de Consommation en Dirences Premires

3 2 1 0 -1 -2 -3 80 82 84 86 88 90 92 94 96 98 00 DCONSO
Figure 3.16: Corrlogramme de la Srie DCONSO
On sait que bk converge en probabilit vers k = E [(zt z t ) (ztk z tk )] : Or, on observe dans la premire colonne de la gure (3.16), note AC pour autocorrlation, que lautocorrlation de la srie DCONSO notamment lordre 2 est relativement importante. Elle est statistiquement dirente de zro puisque la ralisation sort de lintervalle de la rgion de conance de lhypothse de nullit matrialise par des petits tirets verticaux. Cela signie que la srie de consommation direncie est autocorrle. Par consquent, puisque nous avions conclu que xt = "t ; le processus "t nest pas un bruit blanc. Or si le processus "t nest pas un bruit blanc i:i:d:; cela remet en cause la validit de lensemble des distributions asymptotiques des statistiques de tests de Dickey Fuller et donc les conclusions que nous avons dress quant la non stationnarit de la srie. Il est donc ncessaire de tester la non stationnarit de la srie en prenant en compte lautocorrlation des perturbations "t : Cest prcisment lobjet des tests de Dickey Fuller Augments, ou tests ADF:
65
Tests de Dickey Fuller Augments
Comme nous lavons vu dans le cadre de lapplication sur la consommation des mnages, il arrive parfois que les rsidus "t du modle de Dickey Fuller soient autocorrls. Or, les distributions asymptotiques des statistiques de test de racine unitaire ont t construites sous lhypothse que "t est un bruit blanc. Ds que lon lve cette hypothse les statistiques des tests de Dickey Fuller ne suivent plus les mmes distributions asymptotiques, et donc les seuils de signicativit des tests de racine unitaire sont dirents. Il apparat donc ncessaire de tenir compte de lventuelle autocorrlation des rsidus dans la construction des tests de racine unitaire. Il existe alors deux approches direntes pour tenir de cette ventuelle autocorrlation. La premire approche, propose par Phillips (1987) et Phillips et Perron (1988) consiste proposer une correction des estimateurs des MCO et des statistiques de Student associes ces estimateurs prenant en compte la possible autocorrlation des rsidus. La seconde approche, dveloppe par Dickey et Fuller (1979), consiste contrler directement lautocorrlation dans le modle (et non au niveau des estimateurs) en incluant un ou plusieurs termes autorgressifs direncis. Nous allons montrer quune telle approche permet en eet de blanchir les rsidus et de plus, de se ramener une reprsentation similaire celle du test de Dickey Fuller Simple. Ds lors, lapplication de cette nouvelle stratgie est identique celle prsente prcdemment et lon retrouve les mmes distributions asymptotiques.
4.1
Les tests ADF : la prise en compte de lautocorrlation des rsidus
Pour bien comprendre largument de Dickey Fuller, considrons un processus xt admettant une reprsentation de type AR (1) dont les innovations "t sont autocorrles dordre p 1. xt = xt1 + "t o "t ne satisfait pas les hypothses dun bruit blanc et est autocorrl dordre p 1 : "t + 1 "t1 + :: + p1 "tp+1 = t (4.139) avec t i:i:d: 0; 2 . En substituant "t par lexpression xt xt1 ; lquation (4.139) se rcrit sous la forme : t = (xt xt1 ) + 1 (xt1 xt2 ) + 2 (xt2 xt3 ) ::: + p1 (xtp+1 xtp ) (4.138)
= xt + (1 ) xt1 + ( 2 1 ) xt2 + ::: + (p1 p2 ) xtp+1 p1 xtp (4.140)
66
Ainsi, la reprsentation de type AR (1) avec autocorrlation des innovations dordre p 1 peut tre transforme en une reprsentation AR (p) o les innovations sont des bruits blancs. xt = 1 xt1 + 2 xt2 + :::: + p xtp + t avec 1 = (1 ) ; i = (i1 i2 ) pour i = 2; ::; p 1 et p = p1 : Remarque 1. Lintuition de la dmarche du test de Dickey Fuller Augment consiste postuler un modle de type AR (p) an de corriger une ventuelle autocorrlation dordre p 1 des innovations dune reprsentation de type AR (1) : Toutefois, le test de Dickey Fuller Augment nest pas construit directement partir de la forme AR (p) avec innovations i:i:d: de lquation (4.140). Les auteurs privilgient une spcication incluant p 1 termes direncis retards, connue sous le nom de reprsentation de Sims, Stock et Watson ( 1990). Proposition 24 (Reprsentation de Sims, Stock et Watson 1990) Tout processus (xt ; t 2 Z) satisfaisant une reprsentation AR (p) xt = 1 xt1 + 2 xt2 + :::: + p xtp + t avec t i:i:d: 0; 2 ; peut tre exprim sous la forme suivante : (4.142) (4.141)
xt = xt1 + 1 xt1 + 2 xt2 + ::: + p1 xt(p1) + t
(4.143)
o j dsigne loppos de la somme partielle des coecients 8j = 0; 1; ::; p 1 : j = j+1 + j+2 + ::: + p = 0 = 1 + 2 + ::: + p
(4.144) (4.145)
Cette forme canonique est connue sous le nom de reprsentation de Sims, Stock et Watson (1990). La dmonstration de cette proposition est la suivante. On considre un processus AR (p) : (L) xt = 1 1 L 2 L2 :::: p Lp xt = t (4.146) avec t i:i:d: 0; 2 : Notons que cette quation est formellement identique lquation (4.140). Nous allons prsent exprimer ce modle en introduisant des termes direncis retards. On commence par poser : 1 1 L 2 L2 :::: p1 Lp1 p Lp = 1 1 L 2 L2 :::: p2 Lp2 p + p1 + p1 Lp1 p Lp = 1 1 L 2 L2 :::: p3 Lp3 p + p1 + p2 + p1 + p Lp2 p + p1 + p Lp1 p Lp
67
En poursuivant cette dmarche, on obtient une expression du polynme (L) faisant apparatre les sommes partielles des coecients, notes j : (L) = 1 ( 1 0 ) L ( 2 1 ) L2 ( 3 2 ) L3 :::: p1 p2 Lp1 p1 Lp j = j+1 + j+2 + ::: + p j = 0; 1; ::; p 1
(4.147)
avec
(4.148)
En arrangeant les termes du polynme (L) ; on parvient alors la formulation suivante : (L) = (1 + 0 L) 1 L + 2 L2 + ::: + p1 Lp1 (1 L) (4.149)
Cest cette expression de (L) qui nous permet de faire apparatre un polynme retard dni en la dirence premire (1 L) : En posant = 0 ; on retrouve alors la reprsentation de Sims, Stock et Watson (quation 4.143). Maintenant, envisageons le cas o le processus AR (p) admet au plus une racine unitaire. Si tel est le cas, le polynme (L) admet un pour racine. (1) = 0 () 1 1 2 :::: p = 0 (4.150)
Sous cette hypothse, le terme = 0 de la reprsentation de Sims, Stock et Watson est alors gal lunit. Proposition 25 Si le polynme (L) associ au processus (xt ; t 2 Z), admet une racine unitaire, alors le terme dans la reprsentation de Sims, Stock et Watson (quation 4.143) est gal lunit. Le processus (xt ; t 2 Z) se rcrit alors sous la forme : xt = 1 xt1 + 2 xt2 + ::: + p1 xt(p1) + t (4.151)
Ds lors, le test de lhypothse de racine unitaire dans un modle ADF revient tester la nullit du coecient dans le modle incluant p 1 termes direncis retards : xt = xt1 + 1 xt1 + 2 xt2 + ::: + p1 xt(p1) + t (4.152)
avec = 1: Cette structure est identique celle des tests de Dickey Fuller Simples aux termes retards prs. On comprend ainsi que lide de Dickey Fuller consiste se ramener une reprsentation similaire celle du test de Dickey Fuller Simple, mais qui leur permet de traiter le problme de lautocorrlation des innovations.
68
Rsum de la dmarche Partant dun modle AR (1) (quation 4.138), on sait que les rsidus "t sont autocorrls dordre p 1. Donc on peut pas faire le test directement partir de cette reprsentation. On cherche se ramener une reprsentation alternative dans laquelle les innovations sont des bruits blancs. Pour ce faire, on se ramne un AR dordre p (quation 3.92). Mais si lon dsire tester la racine unitaire directement partir de lquation 3.92, il est ncessaire de proposer une stratgie de test dirente de celle du test de Dickey Fuller Simple. Donc, les auteurs ont cherch une autre reprsentation de l AR (p) leur permettant de pratiquer un test de racine unitaire dont la spcication est exactement identique celle du test de Dickey Fuller Simple : cest la reprsentation de Sims, Stock et Watson (quation 4.143). Ne reste plus qu dmontrer que les distributions asymptotiques des statistiques de tests sont identiques celles des tests de Dickey Fuller Simples. An de mieux comprendre cette dmarche considrons lexemple suivant.
Exemple : On considre le processus zt satisfaisant une reprsentation AR (1) o les rsidus "t sont autocorrls : 1 zt = zt1 + "t 2 "t = "t1 + t avec t i:i:d: 0; 2 : Dans ce cas, les rsidus "t sont autocorrls dordre 1, on peut donc trouver une reprsentation de type AR (2) sur zt avec des innovations de type bruits blancs : 1 1 (4.153) "t = "t1 + t () zt zt1 = zt1 zt2 + t 2 2 3 1 zt zt1 + zt2 = (L) zt = t 2 2 A partir de cet AR (2) ; on cherche la reprsentation canonique de Sims, Stock et Watson : 3 1 (L) = 1 L + L2 2 2 3 1 1 1 = 1+ + L + L2 2 2 2 2 1 1 2 = 1L L+ L 2 2 On obtient ainsi la reprsentation suivante : 1 (L) = (1 + 0 L) ( 1 L) (1 L) = (1 L) L (1 L) 2 1 avec 0 = (1 + 2 ) = 3 2 = 1 et 1 = 2 = 1 : Le modle scrit donc en un 2 2 polynme de degr 1 dni en la dirence premire (1 L) zt : 1 (L) zt = zt zt1 = t 2 (4.154) On obtient ainsi :
Chapitre 2. Les Processus Alatoires Non Stationnaires ou encore :
69
1 (4.155) zt = zt1 + zt1 + t 2 On a ici inclut 1 terme direnci retard pour corriger lautocorrlation dordre 1 des rsidus du modle initial. De plus, daprs la proposition prcdente, on sait que le processus zt comporte une racine unitaire et est par l mme I (1) :
Ainsi, pour un choix de p retards, correspondant une autocorrlation dordre p + 1 des innovations dans une reprsentation AR (1) ; les trois modles utiliss pour dvelopper le test ADF sont les suivants : p X Modle 1 : xt = xt1 + j xtj + t (4.156)
j=1
Modle 2 : xt = xt1 + Modle 3 : xt = xt1 +
p X j=1
p X j=1
j xtj + c + t
(4.157) (4.158)
j xtj + c + t + t
Proposition 26 La stratgie de test ADF consiste en un premire tape dterminer le nombre de retard p ncessaire pour blanchir les rsidus. Dans la seconde tape, il sut dappliquer la stratgie squentielle du test de Dickey Fuller Simple aux modles (4.156), (4.157) et (4.158). Les distributions asymptotiques des statistiques de test t obtenues dans ces trois modles sont alors identiques celles obtenues dans les b modles de Dickey Fuller Simple correspondants. La dmonstration de cette proposition sera fournie titre dexercice. Pour lconomtre appliqu, cela implique que les seuils de signicativit pour les tests de racine unitaire DF et ADF sont identiques, et cest l le principale avantage de dmarche de Dickey Fuller (1979). Ces deux auteurs ont ainsi fourni une dmarche de tests intgre, avec des seuils identiques en cas dautocorrlation ou non des rsidus, grce ladoption de la reprsentation de Sims, Stock et Watson.
4.2
Choix du nombre de retards optimal
Jusqu prsent nous avons suppos que lordre dautocorrlation des rsidus "t tait connu. Si cet ordre est gal p, on sait prsent quil faut inclure dans le test ADF; p termes direncis retards, ce qui correspond alors un modle de type AR (p + 1). Le problme, cest que dans la vraie vie, on ignore souvent a priori lordre dautocorrlation des rsidus. On doit donc chercher le nombre optimal p: Pour ce faire, plusieurs approches peuvent tre envisages, parmi celles-ci nous nen retiendrons que deux : le contrle ex-post de labsence dautocorrlation des innovations ou la minimisation de critres dinformation.
Chapitre 2. Les Processus Alatoires Non Stationnaires 4.2.1 Critres dinformation
70
Une des manires de choisir le nombre de retards consiste comparer dirents modles ADF incluant dirents choix de retards, sur la base de critres dinformation. Un critre dinformation est un critre fond sur le pouvoir prdictif du modle considr et qui tient du nombre de paramtres estimer. De faon concrte ces critres sont construits comme des fonctions de la 2 variance des rsidus estims du modle bt et du nombre de paramtres estimer. Lobjectif tant " bien entendu de minimiser cette fonction par rapport ces deux arguments (application du principe de parcimonie). Ces critres sapplique de faon gnrale tout type de modle et pas uniquement aux modles des tests ADF: Nous en retiendrons que deux : le critre dAkaike et le critre de Schwarz (1978). Denition 27 Pour un modle, incluant k paramtres, estim sur T priodes et dont 2 la ralisation de lestimateur de la variance des rsidus est bt ; le critre dAkaike, ou " AIC, est : 2 AIC (k) = T log bt + 2 (k) (4.159) " 2 SC (k) = T log bt + k log (T ) " (4.160)
Le critre de Schwartz (1978) est dni par :
On cherche donc le nombre de retards p qui minimise ces deux critres. Sous Eviews, ces deux critres sont fournis ds lors que lon utilise linstruction de rgression. Nous verrons dans lapplication comment obtenir la ralisation de ces deux critres.
Dans ce cas, pour un choix de retards p on a un nombre de paramtres estimer gal k = 3+p: 2 Si lon dispose dun hcnatillon de taille T et que lon note bt la ralisation de lestimateur de la " variance des rsidus obtenue dans le modle avec p retard, les deux critres sont dnis en fonction de p par : 2 AIC (p) = T log bt + 2 (3 + p) (4.162) " 2 SC (p) = T log bt + (3 + p) log (T ) (4.163) "
Dans le cas de notre application au choix du nombre de retards dans les modles ADF; on cherche le nombre de retard p qui minimise ces deux critres. Prenons par exemple, le cas du modle ADF 3 : p X j xtj + c + t + t (4.161) xt = xt1 +
j=1
Chapitre 2. Les Processus Alatoires Non Stationnaires 4.2.2 Tests dautocorrlation des rsidus
71
Une fois que lon est parvenu apporter un diagnostic quant la non stationnarit de la srie et identier un modle nal, on peut obtenir une ralisation du processus des innovations f"t ; t 2 Zg : Il convient alors de vrier que celle-ci satisfait les proprits dun bruit blanc. Les tests dautocorrlation de rsidus ne peuvent donc tre mis en place quex-post : ils ne servent pas directement au choix ex-ante du nombre de retards, ils ne servent qu valider un choix de retards. Par exemple, supposons que lon ait identier un modle du type : xt = xt1 + 1 xt1 + c + t (4.164)
avec = 0; p = 1: Le processus xt est donc I (1) : En estimant le modle xt = 1 xt1 + c + t ; on obtient une ralisation de taille T des innovations t : On doit alors vrier labsence dautocorrlation des t : Remarque 1. Si il ny pas dautocorrlation, le modle est bien spci. Si en revanche, il existe de lautocorrlation, le modle est mal spci et en particulier le choix p = 1 nest pas valide. Il convient daugmenter le nombre de retards an de corriger lautocorrlation des rsidus.
Pour tester lautocorrlation, on tudie le corrlogramme de la srie et lon utilise le test dit du porte-manteau20 , dont il existe deux variantes : Denition 28 On note rn lautocorrlation empirique dordre n des rsidus "t dun modle incluant k paramtres et estim sur T priodes. Pour un ordre N, le test de Box et Pierce est le test de lhypothse H0 : r1 = ::: = rN = 0 contre H1 : 9j 2 [1; N] ; tel que rj 6= 0: La statistique de ce test est : QBP = T
N X 2 rn ! X 2 (N k) T !1 L
(4.165)
n=1
Lhypothse H0 est rejete au seuil de 5% si QBP est suprieur au quantile 0.95 de la loi du X 2 correspondant.
Denition 29 Le test du Ljung-Box, pour un ordre N; correspond lhypothse nulle H0 : rn = 0 8n N et sont construites de la faon suivante : QK = T (T + 2)
20
n=1
N X
2 rn L ! X 2 (N k) T n T !1
(4.166)
Ou fourre tout dans une traduction plus prcise du terme anglais.
72
Sous Eviews, linstruction Correlogram permet dobtenir les Qstats associes au second test, celui de Ljung-Box. On peut ainsi facilement tester lautocorrlation des rsidus empiriques dun modle ADF incluant p retards.
4.3
Application des tests ADF : la consommation des mnages
Nous avions montr prcdemment la ncessit dappliquer les tests ADF la srie de consommation des mnages issues des comptes nationaux trimestriels, en raison de la prsence dune autocorrlation des rsidus du modle retenu. Cest ce que nous allons faire prsent et nous dterminer la correction de lautocorrlation modie le diagnostic quant la non stationnarit de la srie. Rappelons que cette srie est disponible du premier trimestre 1978 au deuxime trimestre 2001, soit sur 94 observations. La srie est exprime en milliards deuros, au prix de 1995, et est corrige des variations saisonnires (donnes CVS ). Nous allons dans un premier temps chercher dterminer lordre des retards optimal, puis nous appliquerons la stratgie de test ADF la srie CONSO. 4.3.1 Choix optimal des retards
Comme nous lavons indiqu prcdemment, il existe direntes faons de choisir lordre optimal p des retards dans le modle des tests Dickey Fuller Augments. Dans la pratique, on se limite souvent lobservations des critres dinformation et la vrication ex-post de labsence dautocorrlation des innovations. Tableau 4.5: Choix du Nombre de Retards p 5 4 3 2 1 0 Modle 3 AIC SC 2.765 2.990 2.778 2.974 2.754 2.921 2.779 2.917 2.838 2.948 2.882 2.964 Modle 2 AIC SC 2.810 3.007 2.800 2.967 2.782 2.921 2.785 2.895 2.827 2.910 2.881 2.935 Modle 1 AIC SC 2.791 2.960 2.779 2.919 2.764 2.875 2.766 2.849 2.808 2.862 2.859 2.887
Dans un premier temps, on utilise ainsi les critres dinformation disponibles sous Eviews, savoir le critre dAkaike (AIC) et le critre de Schwartz (tableau 4.5). Pour ce faire, il sut tout dabord de se donner un nombre de retards maximum admissibles, not pmax , compte tenu du nombre dobservations disponibles et donc du nombre de degrs de libert des rgressions correspondantes. Dans cette tude nous poserons pmax = 5. Puis, pour chaque modle, on cherche le nombre de retards p optimal, compris entre 0 (test de Dickey Fuller simple) et pmax qui minimise les deux critres dinformations. Une des faons de dobtenir les deux critres dinformation sous
73
Eviews consiste cliquer sur la srie, sur Unit Root Test, de choisir le modle (Intercept and Trend, Intercept ou None) et le nombre de lags, puis de recommencer lopration pour p variant de 0 pmax . Les critres dinformation (Akaike Info Criterion et Schwarz criterion) gurent alors sur lcran dachage des rsultats (voir par exemple la gure 3.14). Aprs avoir rpt cette opration, les rsultats obtenus ont t reports dans le tableau 4.5. Quel que soit le modle retenu, on constate que le critre dAkaike conduit un choix de retard optimal p = 3, tandis que le critre de Schwartz conduit p = 2: On est donc ici en prsence dune divergence de diagnostic quant lutilisation de ces deux critres dinformation, ce qui arrive souvent dans la pratique. Dans ce cas, il est ncessaire de bien comprendre que lobjectif de lintroduction des termes retards consiste blanchir les rsidus, cest dire contrler lautocorrlation des innovations. Ds lors, on cherche la structure minimale qui permet datteindre cet objectif. Selon un principe de parcimonie, il convient de choisir le modle incluant le minimum de paramtres estimer et qui permet de blanchir totalement les rsidus. On adopte donc ici un choix optimal de retard p = 2 et nous vrierons ex-post dans le modle retenu (avec ou sans constante) que lintroduction des deux termes direncis retards a permis dliminer totalement lautocorrlation des rsidus. 4.3.2 Stratgie de tests ADF
Comme nous lavons expliqu prcdemment, la stratgie de test des Dickey Fuller Augments est strictement identique celle des tests Dickey Fuller simple, mis part la modication des 3 modles qui inclut prsent des termes direncis retards. On commence par estimer le modle 3 incluant une constante, un trend et deux termes direncis retards : 2 X xt = xt1 + c + :t + i xti + t (4.167)
i=1
avec t i:id: 0; 2 : On teste alors la prsence dune racine unitaire dans le processus en testant b la nullit du paramtre laide dune statistique de Student t , o dsigne lestimateur des b MCO: Pour eectuer ce testes sous le logiciel Eviews; on clique sur la srie, puis sur longlet View; puis sur longlet Unit Root Test. Apparat alors une bote de dialogue dans lequel on choisit le type Augmented Dickey Fuller, le test in level, on inclut une constante et un trend (Trend and Intercept) et lon choisit un nombre de termes en dirences retards (Lagged Dierence) gal 2. Le rsultat de lachage pour la srie CONSO est reproduit sur la gure (4.17). Pour cet chantillon de 91 observations (aprs les ajustements ds aux valeurs retardes), la ralisation de la statistique de Student t est gale 1:344. On compare cette valeur aux seuils21 b
21
On utilise ici les mmes seuils que pour le test de Dickey Fuller Simple.
74
Figure 4.17: Test de Racine Unitaire ADF sur CONSO : Modle 3
On vrie ensuite que le modle partir duquel nous avons fait le test (modle 3) est bien le bon modle. On teste pour cela la nullit du coecient de la tendance conditionnellement la 3 prsence dune racine unitaire : cest le test H0 , (c; ; ) = (c; 0; 0) : Pour obtenir la ralisation de 3 la statistique de Fisher F3 associe H0 ; on construit le mme programme que celui expos dans le cadre des tests DF simples. La seule dirence rside dans le fait que dans les deux rgressions (modle libre et modle contraint), on doit maintenant ajouter les termes dconso(-1) et dconso(2). Pour la variable de consommation, nous obtenons ainsi une valeur de F3 gale 1:8725: Cette valeur est comparer aux seuils critiques lus dans la table de Dickey et Fuller (1981), tableau VI, page 1063, fournie en annexe (cf. polycopi dexercices). Pour une taille dchantillon de 100, et un risque de premire espce de 5%, la valeur critique est gale 6:49. Donc la ralisation de F3 est infrieure au seuil critique, on accepte lhypothse nulle de la nullit du coecient de la tendance conditionnellement la prsence dune racine unitaire. Ceci signie que le test de non stationnarit pratiqu avec les seuils asymptotiques incluant une tendance (modle 3) doit tre remis en cause.
tabuls par Dickey et Fuller (cf. document joint, polycopi dexercices) pour le modle 3 et pour une taille dchantillon de 91 observations. Au seuil de 5%, le seuil critique est C() = 3:4591 (3:45 dans la table fournie en annexe pour 100 observations). Ainsi, dans ce cas pour un niveau de risque de 5%, t > C() ; on accepte lhypothse nulle de racine unitaire ( = 0). b
Chapitre 2. Les Processus Alatoires Non Stationnaires Il faut donc recommencer ce test partir du modle incluant uniquement une constante. On estime prsent le modle 2 et lon teste la prsence dune racine unitaire dans : xt = xt1 + c +
2 X i=1
75
i xti + t
(4.168)
avec t i:id: 0; 2 : Si dans la procdure Eviews, on inclut uniquement une constante (Intercept) et lon choisit un nombre de termes en dirences retards (Lagged Dierence) gal 2, on obtient les rsultats suivants (gure 4.18). Figure 4.18: Test de Racine Unitaire ADF sur CONSO : Modle 2
La statistique de Student t associe la variable endogne retarde CONSO(1) prend ici une b valeur de 1:151. Pour tester lhypothse = 0; on utilise alors les seuils tabuls par Dickey et Fuller pour le modle 2 (cf. document joint, polycopi dexercices) et pour une taille dchantillon de 91 observations. Ces seuils sont reports dans lachage de la procdure dEviews. Au seuil de 5%, le seuil critique est C() = 2:8932 (2:89 dans la table fournie en annexe pour 100 observations). Ainsi, dans ce cas pour un niveau de risque de 5%, t > C() ; on accepte lhypothse nulle de racine b unitaire ( = 0) dans le modle 2. Il faut nouveau valuer la validit de notre diagnostic en vriant que le modle 2 partir duquel nous avons fait le test de racine unitaire est bien le bon modle. On teste pour cela la
76
nullit du coecient de la constante conditionnellement la prsence dune racine unitaire : test 2 2 H0 , (c; ) = (0; 0) : Dans le cas des tests de Dickey Fuller Augments, le test H0 ne correspond 2 plus lhypothse de nullit jointe de lensemble des coecients de la rgression. En eet, sous H0 , les coecients i ne sont pas ncessairement nuls. On ne peut donc plus utiliser la statistique de Fisher programm dans Eviews pour le test de la nullit de lensemble des coecients du modle. 2 On doit donc programmer la statistique de Fisher F2 associe H0 :
0 - Construction des differences premieres
smpl 1978:2 2001:2 genr dconso = conso-conso(-1) 0 - Estimation du modele libre equation mod2.ls dconso c conso(-1) dconso(-1) dconso(-2) scalar scr2=@ssr scalar ndl=@regobs-@ncoef 0 - Estimation du modele contraint equation mod2.ls dconso dconso(-1) dconso(-2) scalar scr2c=@ssr 0 - Construction de la statistique f2 scalar f2=((scr2c-scr2)/2)/(scr2/ndl) La ralisation de la statistique de Fisher F2 ; est gale 8:47: On compare cette ralisation de F2 aux seuils critiques de la table de Dickey et Fuller (1981), tableau VI, page 1063, fournie en annexe (cf. polycopi dexercices). Pour une taille dchantillon de 100, et un risque de premire espce de 5%, la valeur critique est gale 4:71. Pour un risque de 5%, la ralisation de F3 est suprieure au seuil critique, on rejette donc lhypothse nulle de la nullit de la constante conditionnellement la prsence dune racine unitaire. Ceci signie que le modle 2 est le bon modle, ce qui valide par la mme notre diagnostic quant la non stationnarit de la srie de consommation. Finalement, lapplication des tests ADF nous indique que la srie trimestrielle de consommation des mnages est engendre par un processus non stationnaire I (1) de type AR (3), puisque : Consot = 0:56 +Consot1 0:13 (Consot1 Consot2 )
(3:94) (1:26)
+ 0:26 (Consot2 Consot3 ) + t

(2:56)
(4.169)
Par contre, la srie de consommation direncie (qui correspond au taux de croissance si la srie en logarithme), est gnre par un processus stationnaire I (0) de type AR (2) avec constante : Consot =0:56 0:13 Consot1 + 0:26 Consot2 + t (4.170)
(3:94) (1:26) (2:56)
77
o t est un processus bruit blanc. On vrie en eet que le choix du lag p = 2; nous a permis de blanchir totalement les rsidus t ; comme le conrme lexamen du corrlogramme (non report).
78
Les processus ARIM A
Il ne nous reste plus qu introduire prsent une sous-classe de processus ARMA, la classe des processus ARIMA cest les processus ARMA intgr ou DS. Nous distinguerons les processus ARIMA non saisonniers et les processus saisonniers SARIMA Denition 30 Le processus stationnaire xt satisfait une reprsentation ARIMA (Integrated AutoRegressive Moving Average) dordre p et q; intgr dordre d;note ARIMA(p; d; q) si : (L) (1 L)d xt = c + (L) "t (5.171) Pq Pp j j 2 2 avec c 2 R, (L) = j=0 j L ; (L) = j=0 j L o 8j < q j 2 R ; 8j < p j 2 R ; 0 = 0 = 1 et p ; q 2 R2 ;avec f"t g i:i:d: 0; 2 : Les polynmes (L) et (L) ont " toutes racines situes lextrieur du cercle unit.
Pq Pp j j 2 2 avec c 2 R, (L) = j=0 j L ; (L) = j=0 j L o 8j < q j 2 R ; 8j < p j 2 R ; 0 = 0 = 1 et p ; q 2 R2 ;avec f"t g i:i:d: 0; 2 : Les polynmes (L) et (L) ont " toutes racines situes lextrieur du cercle unit.
Denition 31 Le processus stationnaire xt satisfait une reprsentation SARIMA saisonnier (Seasonal Integrated AutoRegressive Moving Average) dordre p et q; intgr dordre d; de priode s et s0 ; note SARIMAs;s0 (p; d; q); si : 0 (Ls ) (1 Ls )d xt = c + Ls "t (5.172)
79
A
A.1
Annexes
Simulations de rgressions fallacieuses
Le programme des simulations est le suivant : Tstatistiques : Spurious Regressions vector (1000) tstat5000 vector (1000) tstat1000 vector (1000) tstat500 vector (1000) tstat100 for !i=1 to 1000 Initialisation du Processus smpl 1 5000 genr x=0 genr y=0 Construction des Marches Alatoires smpl 2 5000 genr x=x(-1)+nrnd genr y=y(-1)+nrnd Regression 5000 points smpl 1 5000 equation eq1.ls y c x tstat5000(!i)=eq1.@tstats(1) Regression 1000 points smpl 1 1000 equation eq1.ls y c x tstat1000(!i)=eq1.@tstats(1) Regression 500 points smpl 1 500 equation eq1.ls y c x tstat500(!i)=eq1.@tstats(1) Regression 100 points smpl 1 100 equation eq1.ls y c x tstat100(!i)=eq1.@tstats(1) next smpl 1 100 mtos(tstat5000,tstat5000_s)
Chapitre 2. Les Processus Alatoires Non Stationnaires mtos(tstat1000,tstat1000_s) mtos(tstat500,tstat500_s) mtos(tstat100,tstat100_s)
80

CoursSeriesTemp Chap2

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

CoursSeriesTemp Chap2

Uploaded by

Copyright:

Available Formats

Chapitre 2.

Les Processus Alatoires Non Stationnaires

Chapitre 2 Tests de Non Stationnarit et Processus Alatoires Non Stationnaires

Chapitre 2. Les Processus Alatoires Non Stationnaires

Processus non stationnaires

Chapitre 2. Les Processus Alatoires Non Stationnaires

-5 50 100 X 150 200 250

Chapitre 2. Les Processus Alatoires Non Stationnaires

Chapitre 2. Les Processus Alatoires Non Stationnaires

On peut alors rcrire le processus xt sous la forme suivante : xt = a0 + a1 t +

A la date T + 1; les chocs "T +1 tant nul, on obtient : xT +1 = a0 + a1 (T + 1) +

j "T +kj = lim

k "T + k+1 "T 1 + ::: + k+n "T n

Chapitre 2. Les Processus Alatoires Non Stationnaires

Chapitre 2. Les Processus Alatoires Non Stationnaires

Chapitre 2. Les Processus Alatoires Non Stationnaires

Chapitre 2. Les Processus Alatoires Non Stationnaires

Chapitre 2. Les Processus Alatoires Non Stationnaires

Chapitre 2. Les Processus Alatoires Non Stationnaires

Chapitre 2. Les Processus Alatoires Non Stationnaires

Processus DS ou T S : quels enjeux ?

Chapitre 2. Les Processus Alatoires Non Stationnaires

Chapitre 2. Les Processus Alatoires Non Stationnaires

Figure 1.6: Rgression de Deux Marches Alatoires

Chapitre 2. Les Processus Alatoires Non Stationnaires

Chapitre 2. Les Processus Alatoires Non Stationnaires

Chapitre 2. Les Processus Alatoires Non Stationnaires

Elments de thorie asymptotique pour les processus I (1)

Mouvement Brownien et Thorme Central Limite Fonctionnel

Chapitre 2. Les Processus Alatoires Non Stationnaires

2 [0; 1] : On a ainsi concentr le temps et x[r:T ] est dite srie concentre.

Par exemple r = 0:3 2 [1=4; 1=2[ , on a [T:r] = [4:0:3] = [1:2] = 1:

converge en distribution vers :

p L T XT (:) ! W (:) o W (:) dsigne un mouvement Brownien standard.

Chapitre 2. Les Processus Alatoires Non Stationnaires

Application aux processus I (1)

> > ::: > > : 1 T xT =

=0 = "1 T 1 = T ("1 + "2 )

1 0r< T 1 2 T r < T 2 3 T r < T ::: r=1

Chapitre 2. Les Processus Alatoires Non Stationnaires

Figure 2.7: Illustration de la Forme des Ralisations XT (r)

Chapitre 2. Les Processus Alatoires Non Stationnaires

"t ! " W (1)

t "t ! " W (1) "

o W (:) dsigne un mouvement Brownien standard.

Chapitre 2. Les Processus Alatoires Non Stationnaires

Daprs ce rsultat, en reprenant lgalit (2.53), on dmontre nalement le rsultat (2.47) : T

Dmontrons prsent le rsultat (2.44) de la proposition (11) selon lequel : T

Chapitre 2. Les Processus Alatoires Non Stationnaires

des moments empiriques dune marche PT

= Op (T ) 3 xt1 = Op T 2 t=1 5 PT t xt1 = Op T 2 t=1 PT

t=1 xt1 "t

Les rgressions fallacieuses

Chapitre 2. Les Processus Alatoires Non Stationnaires

Chapitre 2. Les Processus Alatoires Non Stationnaires

De la mme faon, on montre que : T

de la dnition des MCO; on sait que : T !2 T T T X X X X x2 = x2 + x2 = x2 + "t t t1 T t1

o W1 (:) et W2 (:) sont les deux mouvement Browniens prcdemment dnis.

" 0 W1 (r) dr R1 R1 " 0 W1 (r) dr 2 0 [W1 (r)]2 dr "

(2.73) ! R1 0 W2 (r) dr R1 " 0 W1 (r) W2 (r) dr

Chapitre 2. Les Processus Alatoires Non Stationnaires

= (T 2) dsigne lestimateur de la variance des rsidus t et o 22 dsigne

avec < 2: En utilisant les rsultats prcdents, on montre que : T 1 s2 = T SCRT L ! T (T 2) T !1