You are on page 1of 18

INFERENCIA ESTADISTICA

NO PARAMETRICA

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

ESTADSTICOS DE ORDEN

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

1
Definicin:
Sea X una v.a continua con funcin de densidad f(x) y definida en el
intervalo - < x < . De esta poblacin se toman muestras aleatorias
simples de tamao n:

x1, x2, ......, xn.


Dichos elementos muestrales son ordenados por orden de magnitud (de
mayor a menor) denominando u1 al primero, u2 al segundo, , un al ltimo.

El resultado de la ordenacin : u1 u2 ...... un , recibe el nombre de


muestra ordenada.

Como es evidente el primer elemento de la muestra ordenada u1 =


mn(x1,..,xn) y el ltimo, un=Mx (x1,..,xn).

Estas nuevas variables ui reciben el nombre de estadsticos de orden i


en muestras aleatorias simples de tamao n.

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

Observacin:

Evidentemente, u1, u2, , un son variables aleatorias no


independientes, y aunque x1, x2, , xn estn igualmente
distribuidas (caso de m.a.s.) u1, u2, , un no lo estn.

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

2
Ejemplo: Sea X una v.a continua con funcin de densidad f(x), -<x< .
Se toman muestras aleatorias simples de tamao 5

x1 x2 x3 x4 x5
muestra 1 10 6 11 3 25

muestra 2 4 8 2 22 10

muestra 3 30 8 15 11 9

muestra 4 21 7 11 4 8

u1 u2 u3 u4 u5

muestra 1 3 6 10 11 25

muestra 2 2 4 8 10 22

muestra 3 8 9 11 15 30

muestra 4 4 7 8 11 21

Nuestro inters es el de conocer la probabilidad de estas nuevas variables


INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

En ocasiones nos interesan conocer concretamente algunos


valores de variables aleatorias como los siguientes:

-En las temperaturas: los valores mnimo y mximo diarios

-Anlisis de fiabilidad: la vida mxima de una pieza

-Salud: dcimas mnimas o mximas de un medicamento.

-Economa: cotizaciones extremas de Bolsa.

En todos estos ejemplos pretende llevar a cabo inferencias


sobre los aspecto particulares de los campos de variacin. Los
estadsticos de orden resuelven estos problemas y otros
similares.

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

3
Distribucin Conjunta de los n
Estadsticos de Orden

La muestra original extrada de una poblacin


continua con f.d.p. f (x) esta constituida por n v.a.
independientes e idnticamente distribuidas
la funcin de distribucin (o probabilidad)
conjunta de los X i , i=1,2,,n las denotaremos por:

n
fX(n) (x1, x2,...,xn) = fX1,X2,...Xn (x1, x2,...,xn) =fX (xi )
i=1

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

La funcin de distribucin (o probabilidad)


conjunta de n estadsticas de orden es: n!
veces la distribucin conjunta de la muestra
original.
original

n
f X(1) , X( 2) ,...,X( n) ( y1, y2 ,...yn ) = n! f X ( yi )
i =1

para y1 <y2 <...<yn

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

4
DISTRIBUCION DE LA ESTADISTICA DE ORDEN i (ui)

Siendo g(ui) la funcin de distribucin (o probabilidad)


de la poblacin particularizada para ui,

resulta la funcin de distribucin (o probabilidad) de


la variable aleatoria ui :

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

DISTRIBUCION DE LA ESTADISTICA DE ORDEN 1 (u1)

Hemos denominado al menor valor de la muestra como


u1, esto es, u1=mn(x1,,xn).

La funcin de densidad en el muestreo de esta variable


aleatoria, u1, la obtenemos reemplazando en la
distribucin de i-esimo valor, haciendo i=1, obtendremos
la siguiente funcin:

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

5
PRUEBAS ESTADISTICAS

Las pruebas estadsticas pueden ser paramtricas y no


paramtricas.

Las pruebas paramtricas asumen los parmetros de la


distribucin de la variable (media y varianza) y un tipo de
distribucin normal.

Las pruebas no paramtricas no asumen acerca de los


parmetros de distribucin ni se preocupa por el tipo de
di t ib i sino
distribucin, i t b j
trabajan con simple
i l ordenacin
d i y recuentot
(asignando rankings) a los valores de la variable sin importar
la distribucin.

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

PRUEBAS PARAMETRICAS, para usarlas deben


cumplirse supuestos:

Las variables tienen que ser cuantitativas y estar medidas


en escalas de intervalo o razn

Los datos siguen una distribucin normal

Las varianzas son iguales

Muestras
Muestras grandes (n > 30)

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

6
PRUEBAS NO PARAMTRICAS, se usan con:

Datos de distribucin libre ((no necesariamente normal).


)

Trata datos cuantitativos y cualitativos, ordinales o


nominales

Con varianza grande, un grupo con varianza 0 y el otro no

Son aplicables con muestras pequeas.


pequeas

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

VENTAJAS DE LAS PRUEBAS NO PARAMETRICAS

Hay ciertas ventajas en su uso, tales como:


Trabajar con magnitudes cualitativas, adems de las
cuantitativas;;
Estudiar casos donde no es posible precisar la naturaleza de
la distribucin;
Son fciles de entender.

DESVENTAJAS DE LAS PRUEBAS NO PARAMETRICAS


Tiene algunas desventajas como:
Clculos usualmente ms engorrosos;
No extraen tanta informacin como los paramtricos si se
aplican al mismo caso.
INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

7
DOCIMAS PARA UNA
MUESTRA

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

Aleatoriedad de una muestra:


Prueba de rachas

A veces al realizar un muestreo, puede llegar a influir el orden


temporal o espacial en que las muestras han sido elegidas, con lo
cual no estamos en las condiciones de un muestreo aleatorio.

La Prueba de rachas contrasta la aleatoriedad de una secuencia


de eventos a partir del nmero de rachas r de la misma.

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

8
Consideremos una muestra de tamao n que ha sido dividida
en dos categoras + y - con n1 y n2 observaciones
cada una.

Se denomina racha (r) a una sucesin de items, eventos o


smbolos idnticos que pueden estar separados por otros
smbolos.

Por ejemplo si estudiamos una poblacin de personas


podemos considerar como categora el sexo :

- : Ser hombre (H)


+ : Ser mujer (M)

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

Se observa los siguientes eventos:

HHH MM H MMM

4 rachas n11=4

HHH MM H MMM n2=5


- - -++ - +++ n= n1 + n2=9

En funcin de las cantidades n1 y n2 se espera que el


e o de rachas
nmero ac as no
o sea ni muy
uy peque
pequeo
o ni muy
uy g
grande.
a de

Una muestra con un nmero excesivamente grande o


excesivamente pequeo de rachas no sugiere que la
muestra sea aleatoria.

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

9
Si las observaciones son cantidades numricas estas pueden
ser divididas en dos categoras o pueden ser clasificados en una
sucesin dicotomica segn que cada observacin este por
encima o por debajo de algn nmero fijado; a menudo este
j
nmero fijado es la mediana muestral obtenida.

En este caso, las observaciones que igualen al nmero fijado se


ignoran en el anlisis y n1, n2 y n se reducen adecuadamente.

Por ejemplo si consideramos la mediana como el nmero fijado,


tendremos las siguientes categoras:

+ : Observacin es superior a la mediana.


- : Observacin es inferior a la mediana.

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

Pasos para el uso de la prueba de rachas de una muestra:

1) Se plantea la hiptesis H0 y H1.

Bilateral:

H0: Estipula que el patrn de ocurrencia de los 2 tipos de


observaciones es determinado por un proceso
aleatorio.

H1: El patrn de ocurrencia no es aleatorio.

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

10
Unilateral (menores):

H0:Estipula que el patrn de ocurrencia de los 2 tipos de


observaciones es determinado por un proceso aleatorio.

H1: El patrn de ocurrencia no es aleatorio (debido a la presencia


de pocas rachas).

Unilateral (mayores):

H0:Estipula
s pu a que eel pa
patrn
de ocu
ocurrencia
e c a de los
os 2 tipos
pos de
observaciones es determinado por un proceso aleatorio.

H1: El patrn de ocurrencia no es aleatorio (debido a la presencia


de muchas rachas).

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

2) Se clasifican las observaciones muestrales, en el orden que


ocurrieron, como una sucesin dicotomica, determinndose n1
y n 2.

3) Conteo del nmero de rachas ro, donde ro: N de rachas


observadas en el proceso.

4)Establecer el nivel de significacin para el anlisis.

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

11
5)Se establecen los valores crticos, dependiendo del tamao de
los grupos n1 y n2 :

a) Si n1 <20 y n2 son <20, respectivamente :

-Para una prueba de 2 colas y rechazamos Ho si:

ro rmnimo=rn1,n2;(/2)

ro r
mximo = rn1,n2;(1-/2)

tablas A.21-24

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

-Para una prueba de 1 cola (menores, izquierda), se rechaza H0


cuando:

ro rmnimo
i

- Para una prueba de 1 cola (mayores, derecha), se rechaza H0


cuando:

ro rmximo

rmnimo y rmximo se obtienen


bti d tablas
de t bl (A.21-24).

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

12
b) Si n1 y n2 son 20, las tablas A.21-24 no pueden usarse.

Para muestras tan grandes, una buena aproximacin a la


distribucin muestral de ro es la distribucin normal

con :
ro N ( ro , 2
ro ) ; y

2 n1 n 2
Media = ro = +1
n1 + n 2

2 n1n 2 ( 2 n1n 2 n1 n 2 )
Varianza = r2o =
( n1 + n 2 ) 2 ( n1 + n 2 1)

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

Por lo tanto, cuando n1 o n2 es mayor que 20, H0 puede probarse


estandarizando ro obtenindose zc (estadstico z calculado):

ro r
zc = , donde zc ~ N (0,1)
r

se rechaza H0, si:

Unilateral Derecha: Z c > Z tabla ,( )

Unilateral Izquierda: Z c < Z tabla , ( )

Bilateral: Zc Z o Zc Z
tabla, tabla,
2 2

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

13
Ejemplo: Los siguientes datos muestran la discrepancia de la
temperatura de rea normal registrada en una ciudad.
Deseamos saber, si podemos concluir que el patrn de
discrepancias por encima y por debajo de lo normal, es el
resultado de un proceso aleatorio.

DIA 1 2 3 4 5 6 7 8 9 10 11
DISCREPANCIA
DE LO NORMAL 12 13 12 11 5 2 -1 2 -1 3 2

DIA 12 13 14 15 16 17 18 19 20 21 22 23 24
DISCREPANCIA
DE LO NORMAL -6
6 -7
7 -7
7 -12
12 -3
3 6 7 10 6 1 1 3 7

DIA 25 26 27 28 29 30
DISCREPANCIA
DE LO NORMAL -2 -6 -6 -5 -2 -1

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

Planteamos las hiptesis:

H0:Las observaciones de discrepancia de la temperatura normal


es aleatorio.
aleatorio
H1:Las observaciones de discrepancia de la temperatura normal
no es aleatorio.

Determinaremos las rachas observadas en la muestra.

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

14
DIA 1 2 3 4 5 6 7 8 9 10 11
DISCREPANCIA
DE LO NORMAL 12 13 12 11 5 2 -1 2 -1 3 2
1 2 3 4 5
DIA 12 13 14 15 16 17 18 19 20 21 22 23 24
DISCREPANCIA
DE LO NORMAL -6 -7 -7 -12 -3 6 7 10 6 1 1 3 7
6 7
DIA 25 26 27 28 29 30
DISCREPANCIA
DE LO NORMAL -2 -6 -6 -5 -2 -1
8

(+) n1= 17 y (-) n2=13

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

ro = 8

El nivel de significancia ser =0.05

(+) n1= 17 y (-) n2=13

Entonces usando la tabla A.24 (izquierda: /2=0.025 y Derecha: 1-/2=0.975):

rmn (/2=0.025) = 10
rmx (1-/2=0.975) = 21

Como ro< rmn se rechaza H0 con =0.05

Por lo tanto: con un nivel de significacin del 5% podemos afirmar que


las observaciones de discrepancia de la temperatura normal no es
aleatoria o no proceden de un proceso aleatorio.

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

15
Ejemplo 2: Se desea conocer si la colocacin de hombres y
mujeres en la cola frente a la taquilla de un cine es ordenado o
azaroso. Los datos se obtuvieron simplemente anotando el sexo de
50 personas en el momento de acercarse a la taquilla.

O d de
Orden d Hombres
H b (M) y Mujeres
M j (F) formados
f d frente
f t a la
l taquilla.
t ill

M F M F M M M F F M F M F

M F M M M M F M F M F M M

F F F M F M F M F M M F

M M F M M M M F M F M M

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

Se plantean las hiptesis:

H0: La serie de hombres y mujeres en la cola es al azar

H1 : La serie de hombres y mujeres en la cola no es al azar.

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

16
Orden de Hombres (M) y Mujeres (F) formados frente a la taquilla.

M F M F M M M F F M F M F

M F M M M M F M F M F M M

F F F M F M F M F M M F

M M F M M M M F M F M M

ro = 35
3

(M) n1 = 30 y (F) n2 = 20

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

(M) n1 = 30 y (F) n2 = 20

Entonces se calcula el valor de zc :

2 n1 n 2
ro ( + 1)
n1 + n 2
zc =
2 n1 n 2 ( 2 n1 n 2 n1 n 2 )
( n 1 + n 2 ) 2 ( n 1 + n 2 1)
2 ( 30 )( 20 )
35 ( + 1)
zc = 30 + 20
2 ( 30 )( 20 )[ 2 ( 30 )( 20 ) 30 20 ]
( 30 + 20 ) 2 ( 30 + 20 1)

z c = 2 . 98
INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

17
z c = 2 . 98

Usando la tabla Normal obtenemos el valor del

Ztabla, 0.025=1.96 (prueba de dos colas)

Zc=2.98 > Ztabla, 0.025=1.96

Entonces, se rechaza Ho.

Concluimos que con un nivel de significancia del 5% la fila de


hombres y mujeres frente al cine no es aleatorio.

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

18

You might also like