Professional Documents
Culture Documents
Cov[X] = = (ij )
x1
.
.
p
iXi
x p
1
X = (1,. . ., p)
= 1X1 + + pXp =
MaximizarL
Sujeto
Var LX LL
LL 1
2
li ijl j li 1
1 (L; ) = LL (LL 1) = ij
1 (L; )
L
= 2L 2L
| I |= 0(2)
. . . , p = (p1, . . . ,
pp)
1p),
U = X = 1iXi
i=1
.
.
p
iXi
x p
1
X = (1,. . ., p)
= 1X1 + + pXp =
Con varianza mxima entre todas las combinaciones lineales LX normalizadas (unicidad)
X / Var [ X] = max Var [LX]
LRp
LL = 1
e incorreladas con U1
= L 1 = L11 = 1L1
Se sigue que los vectores L y 1 son ortogonales. Se
plantea el problema de optimizacin
Var LX
LL 1
L1 0
MaximizarL
Sujeto
= 2L 2L 2v1 (4)
L
Si denota la solucin de este problema, multiplicando (4) a la izquierda por , deber
1 satisfacer
1
1 v 1 1 = 0
1=0
11 = 1
se llega a
v1 = 0
y, al ser 1
( I) = 0
| I |= 0
Los coeficientes de la segunda componente principal de X se obtienen a partir del vector
caracterstico normalizado 2 de correspondiente a su segunda raz caracterstica 2.
La combinacion lineal normalizada
p
U2 =
X = 2iXi
i=1
El proceso continua hasta llegar al paso r + 1. Se busca ahora una combinacin lineal
x1
.
.
p
iXi
x p
= 1X1 + + pXp = i 1
X = (1,. . ., p)
con varianza mxima entre todas las combinaciones lineales normalizadas que sean incorreladas con
U 1 , . . . , Ur
X / Var [ X] = max Var [L X]
LRp
L L = 1,
Cov [L X, Ui] = 0, i = 1, . . . , r
En este caso,
Cov [L X, Ui ] = E [L XUi ] = E [L XX i ] = L E[XX]i
= L i = L ii = i L i = 0,
i = 1, . . . , r
max
L
S.a
Var LX
LL 1
L1 0
i = 1, . . . , r
r+1 (L; ; v1 , . . . , vr ) = L L (L L 1) 2
r
vi Li
i 1
Igualando a cero, se obtiene que el vector que sea solucin de este problema ha de verificar
r
2 2 2 vi i 0
i 1
se obtiene
Si i 0
Si i = 0
vi i 0
i ii 0
vi 0
Li 0
Por tanto,
( I) = 0,
| I |= 0
r+1
autovector normalizado de
r+1
i = 0, i = r + 1
i r 1 0
i r 1 0
r+1
combinacin lineal de
r+1
r+1
y i / i = 0
ortogonal a i , i = 1, . . . , r
incorrelado
U1 . . . Um
m<p
0 2
.
.
. .
. .
0
0
...
.
...
... p 1 2 p , i /
i I = 0
i/ ( iI)i = 0, i =
i 1 matriz
Puesto que
=I
se concluye
t =
Si
Adems, el vector
Rango [ I ] = p m.
de U estn incorreladas y tienen varianza mxima entre todas las combinaciones lineales
incorreladas con U1, . . . , Ui1.
El vector U es el vector de componentes principales de X.
Traza[ ]
Suma de varianzas de
Suma de varianzas de
las componentes de X
las componentes de U
Ejemplo 2.1
Sea X = (X1, X2, X3)t un vector aleatorio con matriz de covarianzas
1 2
2 5
0
0
2
(2 ) [(1 )(5 ) 4] = 0
(2 ) = 0
(1 )(5 ) 4 = 0
2
3
= 5.83
=2
= 0.17
( 1I)1 = 0
X
Y
Z
0
0
0
4.83x 2y = 0
3.83z
9
= 0
*
1 2.42 , 1*
0
1*1* 2.61
0.38
1* 0.92
0
( 2I)2 = 0
X
Y
Z
0
0
0
x 2y = 0
2x + 3y = 0
0
*2 0 , *2 1
1
0
2 0
1
( 3I)3 = 0
X
Y
Z
0
0
0
0.83x 2y = 0
1.83z = 0
10
Var
UE[
= Var1 [X31]) =+ 20.38(X
= 2 2 2) ]2
Var [ U3 ] = Var [ 0.92X1 + 0.38X
2 ][ =
2 ] 0.92(X
= E [ (0.92)2(X1 1)2 ] + E [ (0.38)2(X2 2)2 ] +
+2E [ (0.92)(0.38)(X1 1)(X2 2) ]
= (0.92)2Var [ X1 ] + (0.38)2Var [ X2 ] + 2(0.92)(0.38)Cov [ X1X2 ]
U3 = 3X = 0.92X1 + 0.38X2
= 0.17 = 3
Var [ U1 ] = Var [ 0.38X1 0.92X2 ] = E[0.38(X1 1) 0.92(X2 2) ]2
= E [ (0.38)2(X1 1)2 ] + E [ (0.92)2(X2 2)2 ]
2E [ (0.38)(0.92)(X1 1)(X2 2) ]
*
3 0.42 , *3 1.08
0
0.92
3 0.38
0
U1 = 1 X = 0.38X1 0.92X2
.
.
Cov [ U1, U2 ] = E (U1 E[U1])(U2 E[U2])
U12=
X =2 X3 2)}{X3 3} ]
= E[ {0.38(X
1)
20.92(X
= E[ 0.38(X1 1)(X3 3) ] E[ 0.92(X2 2)(X3 3) ]
= 0.38Cov [ X1, X3 ] 0.92Cov [ X2, X3 ] = 0
11
.
.
Cov [ U1, U3 ] = E (U1 E[U1])(U3 E[U3])
= E [ {0.38(X1 1) 0.92(X2 2)}
.
.
Cov [ U2, U3 ] = E (U2 E[U2])(U3 E[U3])
= E[ (X3 3){0.92(X1 1) + 0.38(X2 2)} ]
= 0.92Cov [ X3, X1 ] + 0.38Cov [ X3, X2 ] 0
Traza [ ] = 1 + 5 + 2 = 8
Traza [ t ] = 1 + 2 + 3 = 5.83 + 2 + 0.17 = 8
su
. 1 2
5
0
Sea
muestra aleatoria de tamao N de X(N > p).
una
Sean:
El estimador verosmil de
respectivamente.
TEOREMA 3
Los estimadores mximo verosmiles de las races caractersticas de
son las races ordenadas de
, 1, 2,, p son
El vector caracterstico de
asociado al i-esimo valor caracterstico,
denominar tambin i-esimo eje principal.
La estimacin de la varianza total el sistema, Traza
se suele
cuyas
races
caractersticas
son
2.- emplear como criterio el porcentaje acumulado de variancia total explicado por los
varios componentes principales sucesivos. Es decir, retener m < p componentes si:
Emplear la prueba grafica que consiste en contruir un grafico cuyas ordenadas son las
raices caracteristicas de los componentes y las abcisas el rden sucesivo de edxtyraccion
de los componentes. Se trata luego de ubicar un punto o codo , donde la curva
descendente se convierta en una recta descendente. Se retienen entonces un numero de
componentes al igual que a la abcisa donde comienza el codo.
Este mtodo tiene la desventaja de que no siempre existe un codo y, a veces, puede
hablar ms de uno
M = atSa
Sujeta a la condicin = 1. La funcin M puede escribirse como:
2
Supongamos que, a modo de ejemplo, la varianza
1 s es mucho mayor que las
dems varianzas, una manera de maximizar M es sencillamente es hacer tan grande
como se pueda la coordenada a1 asociada a esta variable x1. Si una variable
original tiene una varianza mucho mayor que las dems, el primer componente
coincidir muy aproximadamente con esta variable, en efecto recuerde que el
primer componente satisface para cada observacin i:
Siendo
el coeficiente de correlacin lineal entre las variables i y j. En
consecuencia, la solucin depende de las correlaciones y no de las varianzas.
Los componentes principales normados se obtienen calculando los vectores y valores
propios de la matriz R, de coeficientes de correlacin. Llamando
a las races
caractersticas de esa matriz, que suponemos no singular, se verifica que:
(3)
Las propiedades de los componentes extrados de R son:
1. La proporcin de variacin explicada por
ser:
(4)
1.