You are on page 1of 5

PRUEBA EMPRIRICA DE NORMALIDAD

1. Concepto de distribucin normal


En estadstica y probabilidad se llama distribucin normal, distribucin de Gauss o distribucin
gaussiana, a una de las distribuciones de probabilidad de variable continua que con ms
frecuencia aparece aproximada en fenmenos reales.
Se dice que una distribucin es normal si la funcin de densidad es:

Donde el valor esperado de X y la varianza se denotan como:

La nomenclatura usual para identificar a la distribucin normal es: N(,2)


La grfica de su funcin de densidad tiene una forma acampanada y es simtrica respecto de un
determinado parmetro estadstico. Esta curva se conoce como campana de Gauss y es el grfico
de una funcin gaussiana.
La importancia de esta distribucin radica en que permite modelar numerosos fenmenos
naturales, sociales y psicolgicos. Mientras que los mecanismos que subyacen a gran parte de
este tipo de fenmenos son desconocidos, por la enorme cantidad de variables incontrolables que
en ellos intervienen, el uso del modelo normal puede justificarse asumiendo que cada
observacin se obtiene como la suma de unas pocas causas independientes.
De hecho, la estadstica es un modelo matemtico que slo permite describir un fenmeno, sin
explicacin alguna. Para la explicacin causal es preciso el diseo experimental, de ah que al
uso de la estadstica en psicologa y sociologa sea conocido como mtodo correlacional.
La distribucin normal tambin es importante por su relacin con la estimacin por mnimos
cuadrados, uno de los mtodos de estimacin ms simples y antiguos.

Algunos ejemplos de variables asociadas a fenmenos naturales que siguen el modelo de la


normal son:

Caracteres morfolgicos de individuos como la estatura


Caracteres fisiolgicos como el efecto de un frmaco
Caracteres sociolgicos como el consumo de cierto producto por un mismo grupo de

individuos.
Caracteres psicolgicos como el cociente intelectual;
Nivel de ruido en telecomunicaciones
Errores cometidos al medir ciertas magnitudes; etc.

La distribucin normal tambin aparece en muchas reas de la propia estadstica. Por ejemplo,
la distribucin muestral de las medias muestrales es aproximadamente normal, cuando la
distribucin de la poblacin de la cual se extrae la muestra no es normal. Adems, la distribucin
normal maximiza la entropa entre todas las distribuciones con media y varianza conocidas, lo
cual la convierte en la eleccin natural de la distribucin subyacente a una lista de datos
resumidos en trminos de media muestral y varianza. La distribucin normal es la ms extendida
en estadstica y muchos tests estadsticos estn basados en una supuesta "normalidad".
En probabilidad, la distribucin normal aparece como el lmite de varias distribuciones de
probabilidad continua y discreta.
La distribucin normal es una de las distribuciones de muestreo ms utilizadas en el trabajo
estadstico. Si bien muchos datos siguen una distribucin normal es no es la regla. No obstante es
posible investigar si un conjunto de mediciones provenientes de una muestra aleatoria de tamao
n poseen una distribucin normal, aunque sea de manera aproximada. Este tema ha resultado de
gran inters en la estadstica existiendo distintas pruebas formales e informales. Dentro de las
primeras, se encuentran las de Smirnov-Kolmogorov, Jarque y Bera, Carmer.Von Mises, ShairoWilk, entre otras. El segundo tipo de pruebas las informales, descansan ms en pruebas grficas o
que involucran clculos sencillos apoyados en la estadstica descriptiva como el histograma de
frecuencias relativas; la regla emprica; la razn entre el rango intercuartlico (RIC) y la
desviacin estndar y el grafico de probabilidad normal.

2. Pruebas informales para determinar la distribucin normal.

Histograma
Esta representacin grfica es considerada la forma menos confiable para determinar si la
distribucin en cuestin es o no normal. Sin
embargo es una aproximacin. Para tener una idea
el anlisis se debe centrar en la forma que se crea
con las barras, se busca una apariencia de campana.
Donde las barras de ambos extremos deben ser ms
pequeas que las centrales.

Grfico de probabilidad Normal


Este criterio parte del supuesto que la funcin de distribucin Normal representada en Papel
Probabilstico Normal es una recta en la que a cada uno de sus puntos le corresponde un valor de
la variable.

Si tenemos n valores, y una vez ordenados de menor a mayor j representa su nmero de orden,
una forma de asignar las ordenadas es haciendo F(Xi)=j/n. Si tenemos muchos puntos,
supongamos

que

10.000,

esta

frmula puede ser buena, ya que una


vez

ordenados

es

razonable

considerar que el que ocupa la


posicin

1.000

es

un

buen

representante del que en la poblacin


deja tambin un 10% de valores por
debajo y le podemos asignar un valor
de la funcin de distribucin de 0,10.
Al que est en la posicin 2.000 le
asignamos 0,2, etc. Pero si vamos a representar pocos puntos, por ejemplo 10, ya no es tan
razonable suponer que el menor representa al que en la poblacin deja por debajo el 10 %, el
segundo al que deja por debajo al 20 %, ni el mayor de todos es el que representa al valor
mximo de la distribucin. Sera, por tanto, mejor, asignarles valores de la funcin de
distribucin que correspondan a puntos que representen al intervalo mejor que su valor mximo.
Esto se consigue de una forma muy satisfactoria restando 0,5 al nmero de orden, ya que as se
asigna a cada uno de nuestros valores la funcin de distribucin que corresponde a punto que
divide cada zona en 2 reas de igual probabilidad. Pero adems, existe una tercera forma para
calcular la f(x) y esa es (j-(3/8) / (n + ()) Sin embrago, como se mostrar a continuacin, los
tres sistemas producen una salida muy parecida al graficarlas, utilizando una muestra de 100
elementos:
Observar que en la grfica los puntos generados por los tres sistemas siguen el mismo patrn, e
incluso se superponen. Asimismo, el resultado que ofrece la R2 de cada uno de los mtodos es
superior a 90%, en este ejemplo, por lo que se asume que la distribucin tiene un
comportamiento aproximadamente normal.

El grfico de probabilidad normal compara la distribucin emprica de la muestra de datos, con


la terica distribucin normal. La idea bsica consiste en representar, en un mismo grfico, los

datos empricos observados, frente a los datos que se obtendran en una distribucin normal
terica. Si la distribucin de la variable es normal, los puntos quedarn cerca de una lnea recta.
Regla emprica
La regla emprica establece que cuando una poblacin presenta una distribucin en forma, ms o
menos, a la de una distribucin normal, la media, la mediana y la moda coinciden en el centro de
la distribucin y los porcentajes de todos los valores poblacionales se encuentran dentro de 1,
2, y 3 desviaciones estndar de la media. Estos porcentajes son aproximadamente iguales a 68,
95 y 99% , respectivamente.

Calculo de razn RIC/


Se espera que para datos distribuidos normalmente RIC =1.3. Al obtener un valor cercano al
esperado es posible que los datos se distribuyan normalmente.

You might also like