You are on page 1of 12

PRUEBAS PARA 2 MUESTRAS

INDEPENDIENTES

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

PRUEBA U DE MANN-WHITNEY

La prueba U contrasta si dos muestras, extraídas


independientemente, proceden de la misma población o si dicha
variable tiende a ser mayor (o menor) en alguno de los dos grupos
poblacionales, basándose en los datos muestrales.

El único supuesto preciso es que la población o poblaciones del que


se han extraído las muestras, sean de tipo continuo, no requiere
simetría.

Entonces dadas X1, X2, ..., Xn1 y Y1, Y2, ..., Yn2 m.a.
independientes de dos poblaciones con distribuciones continuas,
consideraremos la prueba de la hipótesis nula:
H0 : F1 (x) = F2(y) (las poblaciones tienen la misma distribución)

En cuanto a la hipótesis alternativa esta puede ser “ unilateral“ o “


bilateral “.

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

1
Hipótesis

a) Bilateral

H0: - Las 2 poblaciones están equidistribuidas, F(xa)=F(yb).


- Las poblaciones tienen la misma distribución.
- Proceden de la misma población.
población

H1:- Las 2 poblaciones no están equidistribuidas F(xa) ≠ F(yb)


- Las poblaciones no tienen la misma distribución.
- Proceden de diferentes poblaciones.

b) Unilateral (podría ser derecha o izquierda)

H0: La masa de la p
población “A” es igual
g ó mas g
grande qque
la población de “B”.
(la capacidad de A es igual ó mas alta que la de B).

H1: La masa de la población de “A” no es mas grande que la de “B”.


(la capacidad de A es mas baja que la de B).

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

Tratamiento de las observaciones, pasos para la aplicación


de la Prueba:

1)Determinar el tamaño de las muestras (n1 y n2). “n1” es el


número de casos en el grupo más pequeño y n2 el número de
casos en el grupo más grande.

2)Considerar ambas muestras como una muestra global de tamaño


n1+n2, ordenar las observaciones de menor a mayor (orden
algebraico, se considera los signos negativos, si hubiera, para el
ordenamiento), y asignamos rangos a todos estos elementos, en
los casos de igualdad se le asignará un rango promedio.

3) Se reagrupan los rangos de acuerdo a la muestra a la que


pertenece la observación.

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

2
4) Para el caso de n1 , n2 < 8 (usar Tabla J), se calcula los
valores de U1 y U2 (valores estadísticos de U Mann- Whitney),
de modo que se elija el mínimo valor entre ellos como
estadístico de prueba el mismo que será comparado con los
valores críticos de U Mann-Whitney de tabla.

Para los casos de 9 ≤ (n1 , n2) ≤ 20 usar Tabla K

5) En caso de muestras grandes (n2 > 20) el estadístico de


prueba de U Mann- Whitney se distribuye normalmente.

6)) Decidir si se rechaza o no la hipótesis.


p

7)Conclusión

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

Estadístico de Prueba

- Para n1, n2 ≤ 20 :
n1 ( n1 + 1)
U 1 = n1n 2 + − R1
2
n ( n + 1)
U 2 = n1n 2 + 2 2 − R2
2
Entonces Uc=mín {U1 y U2}

Donde:

n1 = tamaño de la muestra menor.


n2 = tamaño de la muestra mayor.
R1 = sumatoria de los rangos de la muestra 1.
R2 = sumatoria de los rangos de la muestra 2.

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

3
-Para n2 > 20, el comportamiento del estadístico U se aproxima
a una distribución normal con media y varianza:

n1n 2 (n1)(n2 )(n1 + n2 + 1)


media = μU = Varianza = σU2 =
2 12

Donde el estadístico de prueba Zc es:

U − μU
Z c = c
σU

Donde Uc=mín {U1 y U2}, U1 y U2 calculado con las formulas


anteriores.

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

Regla de Decisión:

- Para n1, n2 ≤ 20, se rechaza H0, si:

ó pU de tabla < α/2


/ (Bilateral)
Uc ≤U α
tabla ,
2

U c ≤ U tabla ,α
ó pU de tabla < α (Unilateral)

pu : probabilidad asociada a Ho

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

4
- Para n1, n2 >20, se rechaza H0, si:

¾ Unilateral:
9 Unilateral Derecha: Z c > Z tabla ,(α )

9 Unilateral Izquierda: Z c < − Z tabla , (α )

¾ Bilateral:

Zc ≤ −Z α o Zc ≥ Z α
t bl ,
tabla t bl ,
tabla
2 2

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

Aplicativo:

Un experimentador utiliza dos métodos para enseñar a leer a un


grupo de 10 niños de 6 años, quienes ingresan por primera vez a la
escuela. El experimentador quiere demostrar que el procedimiento
ideado por él es más efectivo que el tradicional; para ello, mide el
desempeño en la lectura en función de la fluidez,
fluidez comprensión,
comprensión
análisis y síntesis.

El plan experimental preliminar consiste en elegir al azar tanto una


muestra de 10 niños como el método por utilizar.
Dos métodos diferentes aplicados en dos grupos de niños.

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

5
Planteamiento de la hipótesis:

H0: Las diferencias observadas entre las calificaciones de ejecución de lectura


mediante los dos métodos se deben al azar.

H1: Las calificaciones de ejecución de lectura, según el método de enseñanza


del experimentador son más altas y diferentes que las observadas en el
método tradicional.
tradicional

Nivel de significación para la prueba α=0.05.

Calcular el estadístico de prueba:

Las observaciones se deben ordenar como si fueran una sola muestra y


asignarle los rangos del menor al mayor.
Muestra
25 45 70 80 85 90 93 95 100 110
combinada
Muestra
T I T T T T I I I I
correspondiente
1 2 3 4 5 6 7 8 9 10

T: Tradicional
I: Inventado por el investigador

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

Agrupamos nuevamente según la muestra que corresponda:

Rangos de lectura de la tabla anterior.


Suma
Método aplicado calificaciones de
rangos
Tradicional 80 85 25 70 90
(Rango) (4) (5) (1) (3) (6) 19
Inventado por el 95 100 93 110 45
investigador
(Rango) (8) (9) (7) (10) (2) 36

Calculamos la U:
n1 ( n1 + 1) n1 5(5 + 1)
U 1 = n1n2 + − ∑ R1 = 5(5) + − 19 = 21
2 1 2
n2 (n2 + 1) n2 5(5 + 1)
U 2 = n1n2 + − ∑ R2 = 5(5) + − 36 = 4
2 1 2
De los dos valores de U calculados, se elige el más pequeño (4) y se
comparan con los valores críticos de U Mann-Whitney.

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

6
Decisión:

A la probabilidad del valor U de Mann-Whitney, calculado


anteriormente, corresponde 0.048, el cual es más pequeño que el
nivel de significancia; por lo tanto, se rechaza H0.

Conclusión:

Con un nivel de significancia del 5%, podemos concluir que las


calificaciones de la ejecución de lectura mediante los dos métodos
de enseñanza presentan diferencias significativas, es decir, las
calificaciones más altas mediante el método diseñado p por el
experimentador señalan más efectividad.

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

PRUEBA DE DOS MUESTRAS DE KOLMOGOROV-SMIRNOV

La Prueba de dos muestras de Kolmogorov-Smirnov


g puede confirmar q
p que
dos muestras independientes han sido extraídas de la misma población (o
de poblaciones con la misma distribución).

Esta prueba está construida, teniendo como base detectar las diferencias
existentes entre las frecuencias relativas acumuladas de las dos muestras
objeto de estudio.

La prueba admite que los tamaños de las muestras no sean iguales.


iguales

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

7
La prueba de una muestra de kolmogorov-Smirnov examinaba los
puntos de coincidencia de la distribución de un conjunto de valores
muestrales y una distribución teórica. La prueba de dos muestras
examina los puntos de coincidencia de dos conjuntos de valores
muestrales.

Si las muestras han sido extraídas de la misma distribución de


población, puede esperarse que las distribuciones acumulativas de
ambas muestras sean próxima entre sí, ya que debería mostrar
solamente desviaciones debido a la aleatoriedad de la muestra.

METODO DE APLICACION DE LA PRUEBA

1) Planteamiento de Hipótesis y determinación del nivel de significancia.


significancia
Entre las hipótesis tenemos:

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

Hipótesis

a) Bilateral

H0:- Las distribuciones poblacionales son iguales


- Proceden de la misma población

H1:- Las distribuciones poblacionales son distintas


- Proceden de poblaciones diferentes

b) Unilateral (podría ser derecha o izquierda)

H0: Los valores de la población de la que se extrajo una de las muestras es


estocásticamente menor o igual
g q
que de los de la p
población de la q
que se
sacó la otra. (puede cambiar la dirección de acuerdo al análisis).

H1: Los valores de la población de la que se extrajo una de las muestras es


estocásticamente más grande que de los de la población de la que se
sacó la otra. (puede cambiar la dirección de acuerdo al análisis).

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

8
2) Hacemos una tabla de distribución de frecuencia acumulativa
particionada en “k” categorías o intervalos, para cada muestra de
observaciones (se usan tantos intervalos como sea factible), usaremos los
mismos intervalos para ambas distribuciones.

3) Se
S determinan
d t i l diferencias
las dif i entret las
l frecuencias
f i acumuladas
l d de
d las
l dos
d
muestras en cada punto registrado. Se analiza entonces en la columna de
las diferencias de las frecuencias, en qué clases se obtiene la más grande de
las diferencias (valor máximo) denotado por “D”.

Para una prueba de una cola, D es la diferencia más grande en la dirección


que se establezca en el estudio.

P
Para una prueba
b de
d una cola
l (debe considerarse la dirección establecida en el estudio):

Dc = máxima ( S n1 − S n2 )

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

Para una prueba de dos colas será la diferencia máxima en valor absoluto.

para una prueba de dos colas:

D c = máxima S n1 − S n 2

4) Determinación de los valores críticos para la toma de decisión

a) Cuando n1=n2=n, n >40 , se usa la tabla de Kolmogrov-Smirnov, si son


diferentes usaremos la tabla para Muestras de distinto tamaño, según
sean de una o dos colas.

Entonces: rechazamos H0, si: Dc≥ Dtabla.

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

9
b) Cuando n1 y n2 son mayores a 40 haciendo caso omiso de que
sean iguales o no, el estadístico de prueba a utilizarse es:

n1 n 2
χ c2 = 4 D c2 ≈ χ (22 g .l .)
n1 + n 2
Este estadístico de prueba es también útil para muestras pequeñas
con n1≠n2, no tabulados.

Entonces para una prueba de una cola, rechazamos H0,


si: χc2 ≥ χ2tabla, (2) α

5)Conclusión

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

Aplicativo:
Se muestran las pérdidas en peso (medidas en kilogramos), de dos grupos de
personas que han sido sometidas a dos tipos diferentes de medicamentos,
designado por Grupo1 y Grupo2. Los resultados obtenidos se muestran en la
siguiente tabla:

GRUPO1 GRUPO2
5.49 3.76 Con un nivel de significancia del
3.08 4.22
5%, ¿podemos afirmar que existe
diferencia significativa entre las
4.13 4.17
poblaciones de las cuales se
5.03 5.03 extrajeron las muestras?.
7 4.85
6.03 2.09
4.45 4.45
5.13 3.58
4.26 3.86
4.62 4.13
4.4
2.81

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

10
Solución:

En cuanto a la prueba a aplicar, observamos que los grupos 1 y 2 son


independientes.

Entonces bajoj estas condiciones una p prueba de Kolmogorov-Smirnov


g
será la adecuada y como nos interesa decidir si existe diferencias o no
entre las poblaciones, entonces la aplicación será de una prueba de 2
colas.

Planteamos las hipótesis:

H0: No existe diferencia significativa entre las poblaciones de donde


f
fueron extraídas
íd las
l muestras.

H1: Existe diferencia significativa entre los grupos poblacionales en


estudio.

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

Luego del enunciado tenemos α=0.05, calculamos la tabla de distribución


correspondiente:
n=n1+n2 22
Máximo 7
Mínimo 2.09
Rango 4.91
N° de clases o intervalos 5.46
(1+3.32log10(n)) 5
Ancho de clase 1.0

Intervalos -
frecuencia frecuencia
medidas de perdida F-acuma1 F-acuma2
grupo 1 grupo 2
de pesos
2.09 a 3.09 1 2 1 2
3.10 a 4.10 0 3 1 5
4.11 a 5.11 5 7 6 12
5.12 a 6.12 3 0 9 12
6.13 a 7.13 1 0 10 12
10 12

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

11
Para aplicar la prueba de Kolmogorov-Smirnov, reorganizamos estos datos en
dos distribuciones de frecuencias acumulativas, que se muestra a continuación
y por simple sustracción encontramos las diferencias entre las distribuciones en
los diferentes intervalos de las 2 muestras:

Distribución de Distribución de
Diferencia
frecuencia frecuencia acumulativa
|S10-S12|
acumulativa 1 2
0.1 0.17 0.07
0.1 0.42 0.32
0.6 1 0.40
0.9 1 0.10
1 1 0.00

Luego calculamos el estadístico: D c = máxima S n1 − S n 2


Dc=0.4, como no se tiene el dato tabulados calculamos el siguiente estadístico de prueba:

n1 n 2
χ c2 = 4 D c2 ≈ χ (22 g .l .)
n1 + n 2

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

Reemplazando:
(10 )(12 )
χ c2 = 4 ( 0 .4 ) 2 = 3 . 49 ≈ χ (22 g .l .)
10 + 12

χ tabla
2
( 0 . 05 , 2 gl ) = 5 . 99

Entonces: χ c2 < χ tabla


2
, por lo tanto, No rechazamos H0.

Concluimos, bajo un nivel de significancia del 5%, no existen diferencias


significativas entre las perdidas de peso de las personas sometidas a los
medicamentos en estudio.

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

12

You might also like