You are on page 1of 3

La varianza (se representa como 2)

Es una medida de dispersin definida como la esperanza del cuadrado


de la desviacin de dicha variable respecto a su media.
Est medida en unidades distintas de las de la variable. Por ejemplo, si
la variable mide una distancia en metros, la varianza se expresa en
metros al cuadrado. La desviacin estndar es la raz cuadrada de la
varianza, es una medida de dispersin alternativa expresada en las
mismas unidades de los datos de la variable objeto de estudio. La
varianza tiene como valor mnimo 0.
Hay que tener en cuenta que la varianza puede verse muy influida por
los valores atpicos y no se aconseja su uso cuando las distribuciones de
las variables aleatorias tienen colas pesadas. En tales casos se
recomienda el uso de otras medidas de dispersin ms robustas.
Si tenemos un conjunto de datos de una misma variable, la varianza se
calcula de la siguiente forma:

Siendo:

: cada dato
: El nmero de datos
: la media aritmtica de los datos

La covarianza
Es un valor que indica el grado de variacin conjunta de dos variables
aleatorias. Es el dato bsico para determinar si existe una dependencia
entre ambas variables y adems es el dato necesario para estimar otros
parmetros bsicos, como el coeficiente de correlacin lineal o la recta
de regresin.
Cuando

grandes

valores

de

una

de

las

variables

suelen

mayoritariamente corresponderles los grandes de la otra y lo mismo se

verifica para los pequeos valores de una y la otra, se corrobora que


tienden a mostrar similar comportamiento lo que se refleja en un valor
positivo de la covarianza
Por el contrario, cuando a los mayores valores de una variable suelen
corresponder en general los menores de la otra, expresando un
comportamiento opuesto, la covarianza es negativa.
El signo de la covarianza, por lo tanto, expresa la tendencia en la
relacin lineal entre las variables.
La magnitud requiere un esfuerzo adicional de interpretacin:
La versin normalizada de la covarianza, el coeficiente de correlacin
indica la magnitud de la especificidad de la relacin lineal.
Se debe distinguir entre:
(1) la covarianza de dos variables aleatorias, parmetro estadstico de
una poblacin considerado una propiedad de la distribucin conjunta y
(2) la covarianza muestral que se emplea como un valor
estadsticamente estimado del parmetro.
La

covarianza

entre

dos distribucin

conjunta variables

aleatorias reales x e y de segundos momentos finitos se define como


Donde E[x] es el valor esperado de x, conocido tambin como la media
de x. Apelando a la propiedad de la esperanza matemtica lineal, se
puede simplificar como

Aunque esta ltima ecuacin es proclive a perder sentido cuando se la


calcula con punto flotante aritmtico y

y lo que debe

evitarse en programas de computacin cuando el dato no ha sido


previamente centrado.

El estimador insesgado de la covarianza denotado


aleatorias

Cuando

las

es:

variables

decir,
covarianzas

de dos variables

e
es:

aleatorias

son
,

.
n-dimensionales,

es

su

de

matriz

You might also like