You are on page 1of 9

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS

FACULTAD DE MEDICINA
DEPARTAMENTO ACADMICO DE MEDICINA PREVENTIVA Y SALUD PBLICA

EAP DE ENFERMERA .
ASIGNATURA: BIOESTADSTICA
PROMOCIN 2017
MARZO JULIO 2017

SOLUCIONARIO DE LA PRCTICA 11

PRUEBAS DE ASOCIACION
(Mircoles 28 de Junio del 2017)
Dr. Ricardo Terukina Terukina
Profesor Principal

Usos de la Prueba de Chi cuadrado o Ji cuadrado.

A. Cuando se trata de una tabla de 2 x 2.

Si n > 40, se usa X2 corregida por continuidad de Yates . Algunos recomiendan no aplicar esta correccin
cuando el tamao de la muestra es mayor de 50.

Si n se halla entre 20 y 40, se usa X2 cuando todas las frecuencias esperadas son mayores de 5.

Si n es menor de 20, no usar Chi cuadrado, sino utilizar la Prueba exacta de Fisher.

B. Cuando se trata de una tabla con grados de libertad mayor de 1.

Usar Chi cuadrado cuando menos del 20% de las celdas tienen frecuencias esperadas menor de 5 y cuando
ninguna de las celdas tiene una frecuencia esperada menor de 1.

Si no se cuenta con estos requisitos, se pueden combinar celdas para aumentar las frecuencias en las diferentes
celdas.

Aplicaciones:

a. Prueba de independencia: Cuando se trata de determinar si hay asociacin entre dos o ms variables. Se trabaja con
una sola muestra (Diseo de corte transversal).
b. Prueba de homogeneidad: Se trata de determinar si dos o ms poblaciones pertenecen a una misma poblacin. Se
trabaja con dos o ms muestras (Diseo de casos y controles, diseo de cohorte)
c. Prueba de bondad del ajuste: Se lleva a cabo cuando la interrogante es saber si un grupo observado de mediciones
sigue una distribucin terica de cierta clase (Distribucin normal, binomial, Poisson, etc)

1. Se est interesado en estudiar la contaminacin de cierto componente nutricional con relacin al distribuidor que los
suministra. Para realizar esto, tomamos una muestra de 100 muestras de cada uno de los 3 distribuidores que nos
distribuyen el producto comprobando el nmero de muestras contaminadas para cada distribuidor. La siguiente tabla
muestra el nmero de muestras contaminadas para cada uno de los distribuidores.

Distribuidor Muestras Muestras validas Total


contaminadas
1 16 84 100
2 24 76 100
3 19 81 100
Total 59 241 300

Formule la prueba estadstica correspondiente, use =0.01


La prueba de Chi cuadrado se utiliza fundamentalmente en las pruebas de independencia y de homogeneidad.

Pruebas de independencia:
Permite probar la hiptesis nula de que dos criterios de clasificacin, cuando se aplican al mismo conjunto de
entidades (personas, animales o cosas), son independientes. En estos casos, se trata de SOLO UNA MUESTRA en
la que los individuos son clasificados simultneamente en funcin de las variables cuya asociacin se quiere
demostrar. Ejemplo: La asociacin entre la edad (Edad 21 aos y Edad < 21 aos) y la reaccin de la prueba
de tuberculina (PPD + y PPD - )..

Prueba de homogeneidad:
Nos permiten conocer si dos o mas muestras pertenecen a una misma poblacin En estos casos se trata de DOS O
MS MUESTRAS en las que se quiere demostrar que varan en relacin a alguna variable de estudio. Por ejemplo:
Comparar la efectividad de dos esquemas de tratamiento.

Pasos:

Se tienen las variables: Distribuidores de alimentos y muestras contaminadas.

Paso 1. Formulacin de hiptesis:

Ho : Los tres distribuidores no difieren con respecto a la proporcin de muestras contaminadas


H1 : Los tres distribuidores difieren con respecto ala proporcin de muestras contaminadas

Paso 2: Nivel de significacin = 0,01

Paso 3: Eleccin de la prueba de significacin estadstica: Ji cuadrada . Prueba de homogeneidad.

Paso 4: Regla de decisin: estadstica:


Grados de libertad = (F-1) (C-1) = (3-1) (2-1) = 21 x 1 = 2
La H0 se rechazar con un nivel de significacin de 0,01 y 2 grados de libertad si el Ji cuadrado calculado
es 9,210

Paso 5: Clculo de la prueba:


Para el clculo de Chi cuadrado se utiliza la siguiente frmula:

2 Valor de Chi cuadrado



(O E) 2
Suma de
2 Donde
E2 O Valor observado

E Valor esperado o terico

Se siguen los siguientes pasos:

a. Identificar los valores observados (O).


Los valores observados (O) vienen a ser los resultados del estudio. As, el valor observado de muestras
contaminadas del Distribuidor 1 es de 16 y el de muestras vlidas es de 84, tal como se observa en el
cuadro adjunto. Igualmente, los valores observados de muestras contaminadas del Distribuidor 2 es de
24 y el de muestras vlidas es de 76. Asimismo, los valores observados de muestras contaminadas del
Distribuidor 3 es de 19 y el de muestras vlidas es de 81.

b. Calcular los valores esperados (E).


Los valores esperados (E) son los valores que se tendran si los tres Distribuidores tuviesen la misma
proporcin de muestras contaminadas. En el cuadro se observa que el total de Distribuidores que
presentaron muestras contaminadas es de 19,67% (59/300) y los que presentaron muestras vlidas es
del 80,33% (241/300). Sin embargo, estos porcentajes son diferentes en el Distribuidor 1 (16% y 84%),
en el Distribuidor 2 (24% y 76%) y en el Distribuidor 3 (19% y 81% respectivamente); es decir, existe
una diferencia, aparentemente, entre la proporcin de muestras contaminadas en los tres Distribuidores.
Si no hubiese diferencia en la proporcin de muestras contaminadas, el porcentaje de muestras
contaminadas sera igual tanto en el Distribuidor 1, 2 y 3; entonces, se esperara en el Distribuidor 1 que
el 19,67% de las muestras se encuentren contaminadas, o sea 19,67 muestras (100 x 0,1967 = 19,67) ;
este sera el valor esperado de muestras contaminadas en el Distribuidor 1. En forma similar, el valor
esperado de muestras contaminadas en el Distribuidor 2 sera tambin de 19,67%, o sea 19,67
muestras contaminadas (100 x 0.1967 = 19,67). Igualmente, el valor esperado de muestras
contaminadas en el Distribuidor 3, tambin sera de 19,67%, o sea 19,67 muestras contaminadas (100 x
0,1967 = 19,67). Siguiendo el mismo razonamiento, el porcentaje de muestras vlidas tambin sera
igual en los tres Distribuidores; entonces, se esperara en el Distribuidor 1 que el 80,33% de las
muestras sean vlidas, o sea 80,33 muestras contaminadas (100 x 0,8033 = 80,33); este sera el valor
esperado de las muestras vlidas en el Distribuidor 1. En forma similar, el valor esperado de muestras
vlidas en el Distribuidor 2 sera tambin del 80,33%, o sea 80,33 muestras vlidas (100 x 0,8033 =
80,33). Igualmente, el valor esperado de muestras vlidas en el Distribuidor 3, tambin sera de 80,33%,
o sea 80,33 muestras vlidas (100 x 0,8033 = 80,33).

Muestra contaminada Muestra vlida


Distribuidor Total
Nmero % Nmero %
1 16 16,00 84 84,00 100
2 24 24,00 76 76,00 100
3 19 19,00 81 81,00 100
Total 59 19,67 241 80,33 300

Muestra contaminada Muestra vlida


Distribuidor Total
Observado Esperado Observado Esperado
1 16 19,67 84 80,33 100
2 24 19,67 76 80,33 100
3 19 19,67 81 80,33 100
Total 59 59,01 241 240,99 300

Una forma prctica para calcular los valores esperados es empleando la siguiente frmula:

(Total marginal de fila) (Total marginal de columna)


E
Total general

Para la casilla superior izquierda (Distribuidor 1 con muestras contaminadas) :

(100) (59) 5900


E .19,67
300 300

Para la casilla media izquierda (Distribuidor 2 con muestras contaminadas) :

(100) (59) 5900


E .19,67
300 300

Para la casilla inferior izquierda (Distribuidor 3 con muestras contaminadas) :

(100) (59) 5900


E .19,67
300 300

Para la casilla superior derecha (Distribuidor 1 con muestra vlida) :

(100) (241) 24100


E 80,3333 80,33
300 300

Para la casilla media derecha (Distribuidor 2 con muestra vlida) :

(100) (241) 24100


E 80,3333 80,33
300 300

Para la casilla inferior derecha (Distribuidor 2 con muestra vlida) :


(100) (241) 24100
E 80,3333 80,33
300 300

c. Calcular Chi-cuadrado:

Se aplica la frmula:

(O E) 2
X2 E
0,6847 0,4453 0,0228 0,2335 0,2335 0,0056 1,6254
(Ver tabla adjunta)

(O E ) 2
O-E (O E)2
E
16 - 19,67 = -3,67 -3,672 = 13,4689 13,4689 / 19,67 = 0,6847
24 - 19,67 = 4,33 4,332 = 18,7589 18,7589 / 19,67 = 0,9537
-
19 - 19,67 = -0,67 -0,672 = 0,4489 0,4489 / 19,67 = 0,0228
84 - 80,33 = 3,67 3,672 = 13,4689 13,4689 / 80,33 = 0,1677
76 - 80,33 = -4,33 -4,332 = 18,7589 18,7589 / 80,33 = 0,2335
81 - 80,33 = 0,67 0,672 = 0,4489 0,4489 / 80,33 = 0,0056
X = 2,0680

Paso 6 Decisin estadstica y conclusin:


Como X2 = 2,0680 es menor que 9,210, NO se rechaza la hiptesis de nulidad.
No slo debemos expresar si rechazamos o no la Hiptesis nula, sino que adems debemos determinar
el valor de p.
Consultando Excel (Funcin Estadstica : DISTR.CHICUAD.CD) para X 2 = 2,0680 para 2 grados de
liberta, p = 0,355581785
Conclusin: No existe diferencia en la proporcin de muestras contaminadas entre las tres
Distribuidoras.

2. Se est interesado en estudiar la relacin entre cierta enfermedad y la adiccin al tabaco. Para ello se selecciona una
muestra de 150 individuos, 100 individuos no fumadores y 50 fumadores. La siguiente tabla muestra las frecuencias
de enfermedad en cada grupo.

Grupo Enfermos Sanos Total


No Fumadores 12 88 100
Fumadores 25 25 50
Total 37 113 150

Formule la prueba estadstica correspondiente, use =0.05

Pasos:

Se tienen las variables: Hbito de fumar y estado de salud.

Paso 1. Formulacin de hiptesis:

Ho : No existe asociacin entre el hbito de fumar y el estado de salud.


H1 : Hay asociacin entre el hbito de fumar y el estado de salud.

Paso 2: Nivel de significacin = 0,05

Paso 3: Eleccin de la prueba de significacin estadstica: Ji cuadrada . Prueba de independencia.

Paso 4: Regla de decisin: estadstica:


Grados de libertad = (F-1) (C-1) = (2-1) (2-1) = 21 x 1 = 1
La H0 se rechazar con un nivel de significacin de 0,05 y 1 grados de libertad si el Ji cuadrado calculado
es 3,841

Paso 5: Clculo de la prueba:


Para el clculo de Chi cuadrado se utiliza la siguiente frmula:

2 Valor de Chi cuadrado



(O E) 2
Suma de
2 Donde
E2 O Valor observado

E Valor esperado o terico

Se siguen los siguientes pasos:

a. Se calculan los valores esperados:

Una forma simple y rpida para calcular los valores esperados (E) es empleando la siguiente frmula:

(Total marginal de filas) (Total marginal de columna)


E
Total general

Para la casilla superior izquierda (Pacientes no fumadores y enfermos):

(100) (37) 3700


E 24,67
150 150

Para la casilla inferior izquierda (Pacientes de fumadores y enfermos)

(50) (37) 1850


E 12,33
150 150

Para la casilla superior derecha (Pacientes no fumadores y sanos):

(100) (113) 11300


E 75,33
150 150
Para la casilla inferior derecha (Pacientes de sexo masculino sin diabetes):

(50) (113) 5650


E 37,67
150 150

Estado de salud
Enfermo Sano
Grupo Total
Observado Esperado Observado Esperado
(O) (E ) (O) (E )
No fumadores 12 24,67 88 75,33 100
Fumadores 25 12,33 25 37,67 50
Total 37 113 150

b. Calcular Ji-cuadrado:

Se aplica la frmula:
(O E) 2
X2 E
6,5070 13,0194 2,1310 4,2615 25,9189

( O E )2
O-E ( O E )2
E
12 24,67 = -12,67 -12,672 = 160,5289 160,5289 / 24,67 = 6,5070
25 12,33 = 12,67 12,672 = 160,5289 160,5289 / 12,33 = 13,0194
88 75,33 = 12,67 12,672 = 160,5289 160,5289 / 75,33 = 2,1310
25 37,67 = -12,67 -12,672 = 160,5289 160,5289 / 37,67 = 4,2615
X2 = 25,9189

Otra alternativa para obtener Ji cuadrado en una tabla 2 x 2::


Como alternativa se puede utilizar una frmula ms breve y simple, porque no es necesario calcular los
valores esperados.

Una tabla auxiliar nos puede ayudar a comprender el procedimiento; en ella se presenta la estructura de una
tabla 2 x 2 para la frmula simplificada:

Estado de salud
Grupo Total
Enfermo Sano
No fumadores a b a+b
Fumadores c d c+d
Total a+c b+d a + b+ c + d = n

Se emplea la siguiente frmula:


n (ad bc ) 2
X2
(a b ) ( c d ) (a c) ( b d )

Datos:

Estado de salud (150)


Grupo Total
Enfermo Sano
No fumadores a (12) b (88) a + b (100)
Fumadores c (25) d (25) c + d (50)
Total a + c (37) b + d (113) n (150)

Aplicando la frmula:

n (ad bc) 2 150 (12 ) ( 25) (88 ) ( 25)2 150 300 2200 2
X2
(a b) (c d ) (a c) ( b d ) (12 88 ) ( 25 25) (12 25) (88 25) (100 ) (50 ) (37 ) (113 )

150 1900 2 150 (3610000 ) 541500000


25,90289404 25,9029
20905000 20905000 20905000

Resultado casi igual, salvo una diferencia de 16 milsimo por redondeo.

6. Decisin estadstica y conclusin:


Grados de libertad = (F-1) (C-1) = (2-1) (2-1) = 1 x 1 = 1
La H0 se rechazar con un nivel de significacin de 0.05 y 1 grados de libertad si el Ji cuadrado calculado es
Ji cuadrado tabular (3.841)
Como X2 = 25,9029 es mayor que 3.841, se rechaza la hiptesis de nulidad.

Conclusin: Hay asociacin entre el hbito de fumar y el estado de salud.

Como el tamao de la muestra es mayor de 50 (150 casos), no es necesario aplicar la correccin de Yates. Sin
embargo, algunos consideran que en todos los casos de tabla 2 x 2 se debe usar la correccin de Yates. Para ello se
emplea la siguiente frmula:
2 Valor de Ji cuadrado

( O E - 0.5) 2
2 Donde Suma de
O Valor observado
E
E Valor esperado o terico

En la frmula corregida, las barras verticales que encierran O E , indican que en el resultado de la diferencia slo
se tome en cuenta su valor absoluto, ignorando los signos negativos.

Aplicando la frmula, se tiene:

( O E )2
O - E- 0.5 ( O E )2
E
| 12 24,67| - 0.5 = 12,17 12,172 = 148,1089 148,1089/24,67 = 6,0036
| 25 12,33| - 0.5 = 12,17 12,172 = 148,1089 148,1089/12,33 = 12,0121
| 88 75,33| - 0.5 = 12,17 12,172 = 148,1089 148,1089/75,33 = 1,9661
| 25 37,67| - 0.5 = 12,17 12,172 = 148,1089 148,1089/37,67 = 3,9317
X2 = 23,9135


( O - E - 0.5)
X2 6,0036 12,0121 1,9661 3,9317 23,9135
E

El valor de Ji cuadrado corregido es menor. Y una X2 menor significa que la hiptesis nula no se rechazar con
tanta frecuencia como ocurre con la Ji cuadrada mayor sin corregir; es decir, es ms conservadora. Por
consiguiente, existe menor riesgo de cometer un error de tipo I, pero aumenta el riesgo de un error tipo II..

Otra alternativa para obtener Ji cuadrado corregida, es utilizando la frmula simplificada:

X
2 n ( ad bc 0.5 n ) 2


150 (12 ) (25) (88 ) ( 25) 0.5 (150 ) 2 150 (300 2200 ) 752
( a b) ( c d ) ( a c ) ( b d ) (12 88 ) ( 25 25) (12 25) (88 25) (100 ) (50 ) (37 ) (113 )



150 1900 75 2
150 1825 2 150 3330625 499593750
23,89828988 23,8983
20905000 20905000 20905000 20905000

Resultado casi igual, salvo una diferencia de 152 diez milsimo por redondeo.

La H0 se rechazar con un nivel de significacin de 0.05 y 1 grados de libertad si el Ji cuadrado calculado es Ji


cuadrado tabular ( 3.841)
Como X2 = 23,9135 es mayor que 3.841, se rechaza la hiptesis de nulidad.
Consultando Excel (Funcin Estadstica DISTR.CHICUA.DC) p = 1,00763-6 = 0,00000100763

Comentario: Como se observa, tanto con Ji cuadrado corregida como sin corregir, se rechaza la hiptesis nula; esto
significa, desde un punto de vista prctico, que vale la pena aplicar la correccin de Yates cuando el valor de Ji
cuadrado es muy cercano al valor crtico de Ji cuadrado para un determinado nivel de significacin (Ji cuadrado
tabular).
Asimismo, la probabilidad de Ji cuadrada corregida es mayor que sin corregir (25,9189 > 23,9138)

Conclusin: Hay asociacin entre el hbito de fumar y el estado de salud.

3. Para estudiar la dependencia entre la prctica de algn deporte y la depresin, se seleccion una muestra aleatoria
simple de 100 jvenes, con los siguientes resultados:

Sin depresin Con depresin Total


Deportista 38 9 47
No deportista 31 22 53
Total 69 31 100
Determinar si existe independencia entre la actividad del sujeto y su estado de nimo. Emplee un nivel de
significacin de 5%.

Pasos:

Se tienen las variables: Prctica deportiva y depresin..

Paso 1. Formulacin de hiptesis:

Ho : No existe asociacin entre la prctica deportiva y la depresin.


H1 : Hay asociacin entre la prctica deportiva y la depresin.

Paso 2: Nivel de significacin = 0,05

Paso 3: Eleccin de la prueba de significacin estadstica: Ji cuadrada . Prueba de independencia.

Paso 4: Regla de decisin: estadstica:


Grados de libertad = (F-1) (C-1) = (2-1) (2-1) = 21 x 1 = 1
La H0 se rechazar con un nivel de significacin de 0,05 y 1 grados de libertad si el Ji cuadrado calculado
es 3,841

Paso 5: Clculo de la prueba:


Se obtiene el valor de chi cuadrado por el procedimiento ya conocido y se halla que es de 5,8227
Al obtener los valores esperados, ninguno de ellos fue < 5

Paso 6. Decisin estadstica y conclusin:


Grados de libertad = (F-1) (C-1) = (2-1) (2-1) = 1 x 1 = 1
La H0 se rechazar con un nivel de significacin de 0.05 y 1 grados de libertad si el Ji cuadrado calculado
es Ji cuadrado tabular (3.841)
Como X2 = 25,9029 es mayor que 3.841, se rechaza la hiptesis de nulidad.

Conclusin: Existe asociacin entre prctica deportiva y la depresin, siendo menor la proporcin de
depresin en los que practican alguna actividad deportiva.

4. Un estudio que se realiz con 81 personas referente a la relacin entre la cantidad de violencia vista en la televisin
y la edad del televidente produjo los siguientes resultados.

Violencia 16-34 35-55 56 a mas


Poca 8 12 21
Mucha 18 15 7

Indican los datos que ver violencia en la televisin est asociado a la edad del televidente, a un nivel de
significacin del 5%?

Pasos:

Se tienen las variables: cantidad de violencia observada en la televisin y edad del televidente.

Paso 1. Formulacin de hiptesis:

Ho : No existe asociacin entre la cantidad de violencia observada en la televisin y la edad del televidente.
H1 : Existe asociacin entre la cantidad de violencia observada en la televisin y la edad del televidente.

Paso 2: Nivel de significacin = 0,05

Paso 3: Eleccin de la prueba de significacin estadstica: Ji cuadrada . Prueba de independencia.


Paso 4: Regla de decisin: estadstica:
Grados de libertad = (F-1) (C-1) = (2-1) (3-1) = 1 x 2 = 2
La H0 se rechazar con un nivel de significacin de 0,05 y 2 grados de libertad si el Ji cuadrado calculado
es 5,99

Paso 5: Clculo de la prueba:


Se obtiene el valor de chi cuadrado por el procedimiento ya conocido y se halla que es de 11,1688

Paso 6. Decisin estadstica y conclusin:

Como X2 = 11,1688 es mayor que 5,99, se rechaza la hiptesis de nulidad.

Consultando Excel p = 0,0038

Conclusin: Existe asociacin entre la edad del televidente y la observacin de violencia en la televisin.

Revisado
Dr. Ricardo Terukina
20-06-2016

You might also like