You are on page 1of 4

PRUEBA DE INDEPENDENCIA

ji-cuadrado
En una prueba de independencia el nico nmero que el investigador controla
directamente es el tamao total de la muestra. Se extrae una muestra de
tamao n de la poblacin y cada objeto se clasifica segn las dos variables que
se estudian. Ni las frecuencias de cada celda, ni los totales de fila y columna se
conocen de antemano.
El investigador no fija previamente ningn conjunto, es decir, son aleatorios.
El planteamiento de las Hiptesis ser:
H 0 : A y B son independientes
H 1 : A y B no son independientes

Independencia significa que el conocimiento del nivel de clasificacin de un


objeto respecto a la caracterstica A no tiene nada que ver con su nivel respecto
a la caracterstica B. Para expresar esta idea matemticamente utilizamos las
probabilidades dadas en la siguiente tabla:
Tabla 2. Tabla de contingencia 2 x 2 con proporciones o probabilidades
Variable 1 (A)
Variable 2
(B)

Si
No Total
p 11 p 12 p 1.
p 21 p 22 p 2.

Si
No

Total p .1 p .2

Se sabe que, para que dos sucesos sean independientes, la probabilidad de que
ocurran ambos a la vez debe ser igual al producto de las probabilidades de que
cada suceso ocurra individualmente.
P[A y B] = P[A]P[B]
O
p 11 = p .1 p 1.
La relacin debe cumplirse para cada celda. Por tanto, la hiptesis nula de
independencia se expresa matemticamente como

i = 1, 2
H 0 : p ij = p i. P .j
j = 1, 2
i = 1, 2
H 1 : p ij ? p i. P .j
j = 1, 2
Comparamos el nmero de observaciones en cada celda con el nmero
esperado, si H 0 es cierta. Si estos nmeros difieren poco, no hay razn para
rechazar H 0 ; si hay una gran discrepancia entre los valores observados y
esperados, entendemos esto como evidencia de que H 0 no es
cierta. Entonces se calcula el valor esperado as:
E ij = np ij

n 1. n .1

11 =

total fila marginal x total comlumna margin

________________________

_________________________

tamao de la muestra

La pregunta es la siguiente: son estas diferencias demasiado grandes como


para que se deban nicamente al azar?
Para responderla necesitamos un estadstico cuya distribucin de probabilidad
sea conocida bajo la hiptesis de que H0 es cierta. El estadstico en cuestin es:

Prefijamos un nivel de significancia en 0.05


Si el valor p es pequeo (es menor de 0.05); podemos rechazar H 0
Para que las pruebas de Ji-cuadrado sean vlidas, es necesario que las
muestras sean grandes. Es decir que las frecuencias esperadas no sean
menores de 5. Si esto no se cumple, puede utilizarse una prueba para
pequeas muestras llamada prueba exacta de Fischer para contrastar
independencia.
EJEMPLO
Se realiza una investigacin para determinar si hay
alguna asociacin aparente entre la altura de los estudiantes de posgrado y el

xito en sus clases, a juicio de sus profesores. Se selecciona una muestra


aleatoria consistente en 500 estudiantes. Se clasifica a cada estudiante de
acuerdo a dos criterios, la altura y el xito. La tabla de contingencia generada
es la siguiente:

Mayor altura que el promedio poblacional

Si

No

Exito
Si

162

No

38

263 425

37

200

75

300 500

Comparamos el nmero de observaciones en cada celda con el nmero


esperado, si H 0 es cierta:

Datos utilizados para contrastar asociacin entre altura y xito en las clases.
Las frecuencias esperadas aparecen entre parntesis :

Mayor altura que el promedio poblacional

Si

No

162 (170)

263 (255)

Exito
Si

425

No

38 (30)

37 (45)

75

200

300

500

Para saber si las diferencias entre valores halladoz y valores esperados es


significativa entonces aplicamos el estadistico ji-cuadrado:

A partir de la tabla Ji-cuadrado vemos que:


y
Como 4.18 est entre 3.84 y 5.02, el valor p est entre 0.025 (0.975) 0.05
(0.950). El valor p es pequeo, es menor de 0.05. Podemos rechazar H 0 y
concluir que la sobretalla y el xito en las clases no son independientes.

You might also like