You are on page 1of 5

ANLISIS INFLUENCIAL.

Si el modelo postulado es

es no singular, el vector de residuales

se puede escribir en forma

matricial como :

Donde la matriz
simtrica e idempotente

es llamada matriz "sombrero", la cual es

Residuales estudentizados.
Para estudentizar un residual se debe determinar el valor dado por la expresin

La desviacin estndar del residual es la raiz cudrada de la varianza del residual

para

estimar

la

desviacin

reemplazar la varianza
por su estimador
que el el residual estudentizado es dado por

estndar,

se

requiere

., con lo cual se tiene

Se

les

estndar

llama estudentizados

internamente porque

contiene dentro de ella los residuales

la

desviacin

Utilidad
Los residuales estudentizados, se puede utilizar para determinar posibles valores
extremos o atpicos, ya que se espera que las mayora de los residuos se espera
que fluctuen entre -3 y 3

Outliers.
En el caso univariado, cuando se tiene un conjunto de datos, se dice que un dato
es un outlier, si es un punto que no esta de acuerdo con el conjunto de datos, o es
un valor atpico o raro, o es una observacin extrema.

En regresin Simple, un outlier es el dato que se sale de la relacin lineal de un


conjunto de datos. Para identificar estos puntos deben utilizar estadistcas. Una
forma preliminar de detectarlos outliers es calculando los residuales, se espera si
todos los puntos estan ubicados muy cerca de recta, los residuales sean pequeos
y si un residual es grande es seal que el punto puede ser Outlier. Se considera
que es un potencial outlier si est a ms de 3 desviaciones de la media.

Existen muchas estadsticas que permiten detectar outliers y `` Leverage Points

La matriz H

Distancia de Cook
DFFITS
DFBETAS

COVRATIO

La matriz H

determina la varianza y covarianza de los vectores de estimados


de residuales

. Los elementos

de la matriz

LA CANTIDAD DE INFLUENCIA EMPLEADA POR


Luego la inspeccin de los elementos de

y del vector

pueden ser interpretados como


sobre su estimacin

puede mostrar los puntos que son

potencialmente influyentes de acuerdo a su localizacin en el rango de las

La atencin es focalizada sobre los elementos de la diagonal. Debido a que


idempotente,
al

donde

entonces el

elemento de la diagonal de

es

es igual

elemento de la diagonal de H2

es el nmero de datos y

es el nmero de parmetros en el

modelo.
es un valor grande si esta alejado del rango de las
puede concluir que no identifica "Outliers.

por lo cual

DF-FITS.

De la primera expresin se puede decir que la estadstica


de desviaciones estndar

cambia si la

mide el nmero

observacin es eliminada.

Se consideran datos influnciales si,

For small/medium
datasets: value of 1 or greater is considered suspicious. For large dataset: value
of 2pp/n.

DF-BETAS.
indica cuanto el coeficiente de regresin estimado
desviaciones estndar, si la

Donde

observacin fuera eliminada.

es la varianza del coeficiente de regresin

la

observacin.

Un

la

observacin

tiene

el

coeficiente de regresin

si

cambia, en unidades de

valor

, entonces la

una

grande

de

DFBETAS

considerable

calculada sin
indica

influencia

que
sobre

observacin se debe examinar.

For small/medium datasets: value of 1 or greater is suspicious. For large dataset:


value of 2/n.

COV-RATIO.
La estadstica COVRATIO utiliza la varianza generalizada del vector de parmetros
estimados

definida por

Luego para determinar el papel del

observacin en la precisin de la

estimacin, se define la estadstica COVRATIO como

1. Si COVRATIO
la
la
2. Si
la

, entonces la

estimacin,mientras

que

observacin mejora la precisin de


si

COVRATIO

la

inclusin

de

observacin disminuye la precisin de la estimacin


COVRATIO

si

COVRATIO

entonces

observacin debera ser considerada influyente. Esta regla fu

dada por Belsley, Kuh, and Welsch

You might also like