You are on page 1of 48

ESTADÍSTICA NO

PARAMÉTRICA
ESTADÍSTICA APLICADA

1
¿CUÁNDO APLICAR UN
PROCEDIMIENTO NO PARAMÉTRICO
• Cuando nuestro la redacción de nuestro problema no nos da información
sobre ciertos parámetros específicos, como la media, la desviación estándar o
la proporción, así como también que los datos muestrales provengan de una
población distribuida normalmente

2
Estadística no paramétrica

PRUEBA DE SIGNO

3
PRUEBA DE SIGNO

• Es una prueba no paramétrica que utiliza signos positivos y negativos para


probar diferentes aseveraciones.
• La idea básica que subyace en la prueba del signo es el análisis de las
frecuencias de los signos positivos y negativos para determinar si son
significativamente diferentes.

4
PROCEDIMIENTO

5
Continua
6
7
EJEMPLO

• ¿En 1908 William Gosset publicó el artículo “The Probable Error of a Mean”
bajo el seudónimo de “Student” (Biometrika, vol. 6, núm. 1). Él incluyó los datos
que se listan en la tabla 13-3 para dos tipos diferentes de semillas de maíz
(normales y secadas en horno), que se utilizaron en parcelas de tierra
adyacentes. Los valores corresponden a las cosechas de cabezas de maíz (o
mazorcas) en libras por acre. Utilice la prueba del signo con un nivel de
significancia de 0.05 para probar la aseveración de que no hay diferencia entre
las cosechas de las semillas normales y las de las semillas secadas en horno.

8
SOLUCIÓN

• 𝐻0 : No existe diferencia (la mediana de las diferencias es igual a 0).


• 𝐻1 : Existe una diferencia (la mediana de las diferencias no es igual a 0).
• El nivel de significancia es 𝛼 = 0.05

9
• La hipótesis nula se rechaza si el
número del signo menos
frecuente (x) es menor que o
igual al valor en la tabla

10
• No hay suficiente evidencia para sustentar el rechazo de la aseveración de que
la mediana de las diferencias es igual a 0; esto es, no existe suficiente evidencia
para justificar el rechazo de la aseveración de que no existe una diferencia
entre las cosechas de las semillas normales y las cosechas de las semillas
secadas en horno.

11
EJERCICIO

• El conjunto de datos 2 del apéndice B incluye temperaturas corporales


medidas en adultos. Utilice las 106 temperaturas listadas para las 12:00 a.m. del
día 2 con la prueba del signo para probar la aseveración de que la mediana es
menor que 98.6°F. El conjunto de datos tiene 106 sujetos, 68 sujetos con
temperaturas por debajo de 98.6°F, 23 sujetos con temperaturas por arriba de
98.6°F y 15 sujetos con temperaturas iguales a 98.6°F.
• En esta prueba de una cola con 𝛼 = 0.05.

12
SOLUCIÓN

• descartamos los 15 ceros


• Tenemos 68 signos negativos
• 23 signos positivos
• n= 91 y x =23

13
• Con base en la evidencia muestral disponible, sustentamos la aseveración de
que la mediana de la temperatura corporal de adultos saludables es menor que
98.6°F.

14
Estadística no paramétrica

PRUEBA DE RANGO CON


S I G N O D E W I LC O X O N

15
¿CUÁNDO USAR ESTA PRUEBA?

• Los datos consisten en datos apareados que se seleccionaron aleatoriamente.


• cuando la población de diferencias tienen la distribución aproximadamente
simétrica.
• los panes de valores tienen diferencias que no provienen de una población con
una distribución aproximadamente normal

16
ESTADÍSTICO DE PRUEBA

para numero de datos:


𝑛 ≥ 30; el estadístico de prueba es z
𝑛 𝑛+1
𝑇−
𝑧= 4
𝑛 𝑛 + 1 2𝑛 + 1
24

𝑛 ≤ 30, el estadístico de prueba es T (suma de rangos)

17
EJEMPLO
¿El tipo de semilla afecta el crecimiento del maíz?
En 1908 William Gosset publicó el artículo “The Probable Error of a Mean” bajo el
seudónimo de “Student” (Biometrika, vol. 6, núm. 1). Él incluyó los datos que se listan
en la tabla siguiente para dos tipos diferentes de semillas de maíz (normales y
secadas en horno), que se utilizaron en parcelas de tierra adyacentes. Los valores
corresponden a las cosechas de cabezas de maíz (o mazorcas) en libras por acre.
Utilice la prueba de rangos con signos de Wilcoxon, con un nivel de significancia de
0.05, para probar la aseveración de que no hay diferencia entre las cosechas de las
semillas normales y de las semillas secadas en horno.

18
SOLUCIÓN
• 𝐻0 : Las cosechas de las semillas normales y de las semillas secadas en horno son tales que la
mediana de la población de las diferencias es igual a cero.
• 𝐻1 : La mediana de la población de diferencias no es igual a cero.

19
𝑃𝑜𝑠𝑖𝑡𝑖𝑣𝑜𝑠 = 1 + 3 + 4 + 7 = 15
𝑁𝑒𝑔𝑎𝑡𝑖𝑣𝑜𝑠 = −10 − 9 − 8 − 6 − 5 − 11 − 2 = 51

En este caso recordar que el numero de datos pares es menor a 30 por lo que sabemos que T es el
numero con la suma menor, por lo tanto 𝑇 = 15.
Resumiendo
n = 11
𝑇 = 15
𝛼 = 0.05
21
𝑇𝛼ൗ = 11 𝑇 = 15
2

22
Valor critico de T se encuentra en la tabla A-8, 10ma edición Triola.
0.95

0.025
0.025

𝑇𝛼ൗ = −11 𝑇𝛼ൗ = 11 𝑇 = 15


2 2

Por lo tanto existe evidencia suficiente que justifica el rechazo de la aseveración de que las
cosechas de las semillas normales y de las semillas secadas en horno son tales que la mediana
de la población de las diferencias es diferente a cero.

23
EJERCICIO
• Se afirma que un estudiante universitario de último año puede aumentar su
calificación en el área del campo de especialidad del examen de registro de graduados
si de antemano se le proporcionan problemas de muestra. Para probar esta
afirmación, se dividen 20 estudiantes del último año en 10 pares de modo que cada
par tenga casi el mismo promedio de puntos de calidad general en sus primeros años
en la universidad. Los problemas y respuestas de muestra se proporcionan al azar a un
miembro de cada par una semana antes del examen. Utilice la prueba de rangos con
signos de Wilcoxon, con un nivel de significancia de 0.05, para probar la aseveración
de que no hay diferencia entre recibir problemas de prueba antes del examen y no
recibir problemas de prueba.
Con problemas de 531 621 663 579 451 660 591 719 543 575
muestra
Sin problemas de 509 540 688 502 424 683 548 748 530 524
muestra
24
SOLUCIÓN

• 𝐻0 : La calificación de un alumno no difiere con recibir problemas de muestra


una semana antes de un examen. Por lo que la mediana de la población de las
diferencias es igual a cero.
• 𝐻1 : La mediana de la población de diferencias es mayor a cero, es decir que
recibir problemas de muestra aumenta la calificación de un alumno

25
Con problemas de 531 621 663 579 451 660 591 719 543 575
muestra
Sin problemas de 509 540 688 502 424 683 548 748 530 524
muestra
Diferencias d 22 81 -25 77 27 -23 43 -29 13 51
Rango de 2 10 4 9 5 3 7 6 1 8
diferencias
Rangos con signo 2 10 -4 9 5 -3 7 -6 1 8

𝑃𝑜𝑠𝑖𝑡𝑖𝑣𝑜𝑠 = 2 + 10 + 9 + 5 + 7 + 1 + 8 = 42
𝑁𝑒𝑔𝑎𝑡𝑖𝑣𝑜𝑠 = −4 − 3 − 6 = 13
En este caso recordar que el numero de datos pares es menor a 30 por lo que sabemos que T es el
estadístico de prueba, por lo tanto 𝑇 = 13.
Resumiendo
n = 10
𝑇 = 13
26
𝛼 = 0.05
𝑇𝛼 = 11 𝑇 = 13

27
Valor critico de T se encuentra en la tabla A-8, 10ma edición Triola.
0.95

0.05

𝑇𝛼 = 11 𝑇 = 13

Por lo tanto existe evidencia suficiente que justifica el rechazo de la aseveración que
dice que la calificación de un alumno no difiere con recibir problemas de muestra
una semana antes de el examen. Por lo que la mediana de la población de las
diferencias es diferente a cero. .

28
Estadística no paramétrica

PRUEBA DE LA SUMA
DE RANGOS DE
W I LC O X O N

29
PRUEBA DE LA SUMA DE RANGOS DE WILCOXON
PARA DOS MUESTRAS INDEPENDIENTES

• La prueba de la suma de rangos de Wilcoxon es una prueba no paramétrica


que utiliza rangos de datos muestrales de dos poblaciones independientes. Se
utiliza para probar la hipótesis nula de que las dos muestras independientes
provienen de poblaciones con medianas iguales. La hipótesis alternativa es la
aseveración de que las dos poblaciones tienen medianas diferentes.
• 𝐻0 : Las dos muestras provienen de poblaciones con medianas iguales
• 𝐻1 : Las dos muestras provienen de poblaciones con medianas diferentes.

30
REQUISITOS

• Hay dos muestras independientes de datos seleccionados al azar.


• Cada una de las dos muestras tiene más de 10 valores. (Para muestras con 10
valores o menos, en libros de referencia están disponibles tablas especiales,
como las CRC Standard Probability and Statistics Tables and Formulae,
publicadas por CRC Press).
• No existe el requisito de que las dos poblaciones tengan una distribución
normal o cualquier otra distribución particular.

31
ESTADÍSTICO DE PRUEBA

𝑅 − 𝜇𝑅
𝑧=
𝜎𝑅
donde:
𝑛1 (𝑛1 + 𝑛2 + 1)
𝜇𝑅 =
2
𝑛1 𝑛2 (𝑛1 + 𝑛2 + 1)
𝜎𝑅 =
12

32
Notación
𝑛1 = tamaño de la muestra 1
𝑛2 = tamaño de la muestra 2
𝑅1 = suma de rangos de la muestra 1
𝑅2 = suma de rangos de la muestra 2
𝑅 = lo mismo que 𝑅1 (suma de rangos de la muestra 1)
𝜇𝑅 = media de los valores muestrales R que se espera cuando las dos poblaciones tienen
medianas iguales
𝜎𝑅 = desviación estándar de los valores muestrales R que se espera cuando las dos poblaciones
tienen medianas iguales

33
EJEMPLO

34
EJEMPLO 2

35
36
SOLUCIÓN

37
38
EJERCICIO

39
Estadística no paramétrica

PRUEBA DE KRUSKAL-WALLIS

40
¿QUÉ ES LA PRUEBA DE KRUSKAL-
WALLIS?
• La prueba de Kruskal-Wallis (también llamada la prueba H) es una prueba no paramétrica que
utiliza rangos de datos muestrales de tres o más poblaciones independientes. Se utiliza para
probar la hipótesis nula de que las muestras independientes provienen de poblaciones con
medianas iguales; la hipótesis alternativa es la aseveración de que las poblaciones tienen
medianas que no son iguales.

41
REQUISITOS

• Tenemos al menos tres muestras independientes, las cuales se seleccionan al


azar.
• Cada muestra tiene al menos cinco observaciones. (Si las muestras tienen
menos de cinco observaciones, remítase a tablas especiales de valores críticos,
como las CRC Standard Probability and Statistics Tables and Formulae,
publicadas por CRC Press).
• No existe el requisito de que las poblaciones tengan una distribución normal o
alguna otra distribución particular.

42
ESTADÍSTICO DE PRUEBA

12 𝑅12 𝑅22 𝑅𝑘2


𝐻= + +⋯+ − 3(𝑁 + 1)
𝑁 𝑁+1 𝑛1 𝑛2 𝑛𝑘

• Notación
• N =número total de observaciones en todas las muestras combinadas
• k =número de muestras
• 𝑅1 =suma de los rangos de la muestra 1
• 𝑛1 =número de observaciones de la muestra 1

43
EJEMPLO

• Un conjunto de datos incluye los pesos (en kilogramos) de álamos que


recibieron distintos tratamientos en terrenos diferentes. Sólo consideraremos
los pesos del año 1 en el terreno 1, el cual tiene un suelo fértil y húmedo, y se
localiza cerca de un arroyo. Use la prueba de Kruskal-Wallis para probar la
hipótesis nula de que las cuatro muestras provienen de poblaciones con
medianas iguales.

– 𝐻0 : Las poblaciones de los pesos de álamos con los cuatro tratamientos tienen medianas
iguales.
– 𝐻1 : Las medianas de las cuatro poblaciones no son todas iguales.
44
45
• Aplicando el estadístico
12 452 37.52 42.52 852
𝐻= + + + − 3(20 + 1)
20 20 + 1 5 5 5 5
𝐻 = 8.214
• La distribución de H es aproximadamente chi cuadrada
• Gl= K-1
• Gl=3 con una significancia de .05 el valor critico es 7.815
• H>valor critico, se rechaza la hipótesis nula
Existe suficiente evidencia para rechazar la aseveración de que la población de los pesos
de álamos con los cuatro tratamientos tienen medianas iguales.
46
EJERCICIO
¿Afecta el peso de un automóvil las heridas en el pecho producidas en un
choque?
• Se obtuvieron datos de experimentos de choques realizados por la National
Transportation Safety Administration. Se compraron automóviles nuevos y se
impactaron contra una barrera fija a 35 mi/h; abajo se presentan los datos de
desaceleración del pecho (g). Utilice los datos para probar la hipótesis nula de que las
diferentes categorías de peso tienen medianas que no son iguales.

• Subcompacto: 55 47 59 49 42
• Compacto: 57 57 46 54 51
• Mediano: 45 53 49 51 46
• Grande: 44 45 39 58 44

47
REFERENCIAS
• F. Triola, Mario. (2009). Estadística. 10th ed. [ebook] PEARSON EDUCACIÓN, México, pp.674-
707. Available at: https://www.uv.mx/rmipe/files/2015/09/Estadistica.pdf [Accessed 15 Oct.
2017].

INFORMACIÓN ADICIONAL
• Para las tablas de T critica necesarias para la prueba de rango con signo de wilcoxon consultar
tabla A-8 del libro Estadistica 10th edicion de Mario F. Triola o consultar pagina 37 de
http://materias.unq.edu.ar/pye/Trabajos%20Pr%C3%A1cticos/Tablas%20de%20Estadistica.pdf

48

You might also like