You are on page 1of 8

Jess Reynaga Obregn

83
Prueba de bondad de ajuste

Descripcin

La prueba de bondad de ajuste se aplica en diseos de investigacin en los que se estudia a un nico
grupo.

La prueba compara la distribucin de frecuencias observada (Fo) de una variable usualmente cualitativa,
pero que tambin puede ser cuantitativa, con la distribucin de frecuencias de la misma variable medida
en un grupo de referencia.

El procedimiento de la prueba implica el clculo de una distribucin esperada (Fe) en el grupo estudiado,
usando como punto de partida a la distribucin de la variable en el grupo de referencia.

El propsito de la prueba es averiguar si existen diferencias estadsticamente significativas entre la
distribucin observada (Fo) y la distribucin esperada (Fe).

En la prueba se plantean las siguientes hiptesis estadsticas:

Hiptesis estadstica nula: Ho: Fo = Fe
Hiptesis estadstica alterna: Ha: Fo Fe

El procedimiento de la prueba incluye el clculo de la medida de resumen llamada Chi cuadrada. El
rechazo de la Ho ocurre cuando el valor calculado con los datos resulta mayor que el valor crtico de
dicha medida contenido en una tabla llamada Valores Crticos de Chi cuadrada.

En el caso de que el valor de Chi cuadrada calculada sea igual o menor al de Chi cuadrada crtica se dice
que no se rechaza a la Ho y, por tanto, se concluye que la Fo es semejante a la Fe. En otras palabras, se
dice que ambas distribuciones se ajustan bien; de ah el nombre de la prueba: bondad de ajuste.

Ejemplo desarrollado

Un cirujano desarroll una nueva tcnica quirrgica para el reemplazo de la cabeza del fmur que
consideraba superior a la tradicional en cuanto a complicaciones postoperatorias inmediatas. Luego de
intervenir a 106 adultos con edades comprendidas entre los 55 y los 65 aos observ la siguiente
distribucin de frecuencias de las complicaciones:


Tcnica nueva: distribucin de frecuencias de complicaciones observada

Dao
nervioso
Hemorragia Desplazamiento Ninguna Total
28 16 4 58 106


La distribucin de frecuencias de complicaciones que utiliz como referencia para su comparacin fue la
siguiente:

Jess Reynaga Obregn


84

Tcnica anterior: distribucin de frecuencias de complicaciones (referencia)

Dao
nervioso
Hemorragia Desplazamiento Ninguna Total
485 285 52 148 970
50.0%

(0.500)
29.4%

(0.294)
5.36%

(0.054)
15.26%

(0.153)
100%

(1.00)

Las cifras entre parntesis son las proporciones equivalentes a los porcentajes

El cirujano razon as: Si no hubiera diferencia entre ambas distribuciones; es decir: si ambas
distribuciones se ajustaran bien entre s, mis pacientes hubieran presentado las complicaciones de la
siguiente forma:

Dao
nervioso
Hemorragia Desplazamiento Ninguno Total
50 % de
106 seran:
53
29.4% de
106 seran:
31
5.36% de 106
seran:
6
15.26% de
106 seran
16
106

Para facilitar la comparacin, el cirujano construy la siguiente tabla:

Distribucin
de
frecuencias
Dao
nervioso
Hemorragia Desplazamiento Ninguno Total
Observada
(tcnica
nueva)
28 16 4 58 106
Esperada
(tcnica
anterior)
53 31 6 16 106
Diferencias - 25 -15 - 2 42

Al encontrar que su tcnica produjo 25 pacientes menos de los que cabra esperar con dao nervioso, 15
pacientes menos con hemorragia, 2 pacientes menos con desplazamiento y 42 pacientes de ms sin
complicaciones, concluy que, al no ajustarse bien ambas distribuciones de frecuencias, haba diferencia
entre tales distribuciones; es decir, haba una diferencia evidentemente favorable para los resultados con
la tcnica nueva.

Con el propsito de calcular una medida de resumen que pudiera sintetizar en una sola cifra las
diferencias encontradas, el cirujano decidi calcular el valor de la medida llamada Chi cuadrada o
tambin ji cuadrada, que se simboliza de la siguiente manera
2

, y cuya frmula es la siguiente:



( )
2
2
o e
e


=

Jess Reynaga Obregn


85


Donde:

: Letra griega sigma que indica sumar todas las expresiones del siguiente tipo
o
: Cada frecuencia observada
e
: cada frecuencia esperada


Para realizar los clculos de la medida de resumen, el cirujano elabor la siguiente tabla auxiliar:



Dao
nervioso
Hemorragia Desplazamiento Ninguno Total
o

28 16 4 58 106
e

53 31 6 16 106
( )
o e

- 25 -15 - 2 42
( )
2
o e

625 225 4 1,764
( )
2
o e
e


625 / 53 =
11.79
225 / 31 =
7.26
4 / 6 =
0.67
1,764 / 16
= 110.25
Suma =
129.97


Por tanto, la medida que resuma las diferencias, en este caso llamada Chi cuadrada calculada, vali:

( )
2
2
129.97
o e
e


= =


El cirujano complet su razonamiento concluyendo que si cada una de las frecuencias observadas
hubiera sido idntica a su correspondiente frecuencia esperada entonces cada diferencia hubiera valido 0
(cero). Si ello hubiera ocurrido, cada diferencia elevada al cuadrado tambin hubiera valido cero, por
tanto cada expresin
( )
2
o e
e

tambin hubiera valido cero y, finalmente, el valor de su suma, es


decir, el valor de Chi cuadrada hubiera sido cero.

El valor que el cirujano calcul no fue cero, sino 129.97; por lo tanto decidi que deba encontrar un valor
crtico que, al ser rebasado, le indicara que no haba un buen ajuste entre la serie completa de
frecuencias observadas (serie a la que denomin Fo) y la serie completa de frecuencias esperadas (serie
a la que identific como Fe). Para ello recurri a un libro en donde encontr una tabla de la que se
muestra un fragmento en seguida:
Jess Reynaga Obregn


86

Fragmento de la tabla de valores crticos de
2



Grados de libertad
Valores crticos al nivel
de significancia de 0.05
1 3.84
2 5.99
3 7.81
4 9.49
5 11.07

100 124.34
En el mismo libro, encontr que el rengln de la columna llamada Grados de libertad en donde deba
buscar el valor crtico por rebasar corresponda al nmero de modalidades o clases de la variable que
haba estudiado menos uno. La variable que midi se llamaba tipo de complicacin y su escala estaba
constituida por cuatro modalidades: dao nervioso, hemorragia, desplazamiento, ninguno; por tanto los
grados de libertad correspondientes seran 4 1 = 3.

Al encontrar que el valor calculado de Chi cuadrada (129.97) rebasaba al valor crtico de Chi cuadrada
(que era de 7.81) supo que no haba un buen ajuste de la distribucin de frecuencias observadas con la
distribucin de frecuencias esperadas; es decir; que la idea de que Fo era igual a Fe (Fo = Fe) podra
rechazarse para quedarse con el planteamiento de que Fo era diferente a Fe (Fo Fe).

Leyendo un poco ms, encontr que en toda prueba de anlisis estadstico la suposicin de igualdad se
llama hiptesis estadstica nula, que en su caso se simbolizaba de la siguiente forma: Ho: Fo = Fe, y que
la suposicin de diferencia se llama hiptesis estadstica alterna, que en su estudio se simbolizaba as:
Ha: Fo Fe.

En resumen, el cirujano concluy que, en virtud de que el valor calculado de Chi cuadrada rebasaba al
valor crtico de Chi cuadrada, poda rechazar a la hiptesis estadstica nula (o de igualdad entre la
distribucin de frecuencias observadas Fo y la distribucin de frecuencias esperadas Fe).

El cirujano escribi sintticamente: Se rechaz a la Ho (p < 0.05). Por lo anterior concluy que ambas
distribuciones de frecuencias (Fo y Fe) no se ajustaban bien o que, en otras palabras, los resultados de la
tcnica quirrgica nueva no eran iguales a los de la tcnica quirrgica anterior. Hablando en trminos
estadstico, el cirujano pudo rechazar la hiptesis estadstica nula Ho: Fo = Fe con un riesgo de error
menor a 0.05.
Procedimiento

1. Confirmar que el propsito del estudio consiste en comparar la distribucin observada en la
escala de una variable medida en un grupo en estudio (distribucin observada) con la distribucin
esperada de dicha variable considerando el antecedente de algn grupo de referencia para
verificar si ambas distribuciones se ajustan bien o no.

2. Disponer de las frecuencias absolutas de la distribucin observada en la escala de la variable
medida en el grupo en estudio (distribucin observada).

Jess Reynaga Obregn


87
3. Disponer de las frecuencias absolutas o de las relativas (porcentajes o proporciones) de la
distribucin en la escala de la variable medida en el grupo de referencia.

4. Calcular las frecuencias esperadas aplicando al total del grupo en estudio las proporciones o
porcentajes de la distribucin de referencia, modalidad por modalidad o clase por clase, para
obtener las correspondientes frecuencias esperadas.

5. Usando una tabla auxiliar como la siguiente, determinar el valor de Chi cuadrada calculada


Modalidad
o intervalo
de la
variable (*)
Modalidad
o intervalo
de la
variable (*)
Modalidad
o intervalo
de la
variable (*)
Modalidad
o intervalo
de la
variable (*)
Total
o


e


( )
o e


( )
2
o e


( )
2
o e
e


Suma =



(*) Ajustar el nmero de columnas al nmero de modalidades o clases que tenga la
variable. La suma del rengln
o
debe ser coincidente con la suma del rengln
e


6. Comparar el valor de Chi cuadrada calculada con el valor de Chi cuadrada crtica, usando una
tabla de valores crticos. Identificar el rengln de los grados de libertad (G.L.) correspondientes al
nmero de modalidades o clases de la variable en estudio mediante la frmula G.L. = k 1
(donde: k nmero de modalidades o clases).

7. En caso de que el valor de Chi cuadrada calculada rebase al valor crtico de la tabla, rechazar a
la hiptesis estadstica nula Ho sealando que el nivel de significancia fue de 0.05; usualmente
se acostumbra redactar lo anterior de la siguiente forma: se rechaz Ho con una p < 0.05; en
caso de que el valor calculado haya sido igual o no hubiera rebasado al valor crtico se seala
que no fue posible rechazar la Ho.

8. De acuerdo al paso anterior, establecer la conclusin referente a si ambas distribuciones se
ajustan bien o no.


Problema resuelto

El Secretario Acadmico de una escuela de medicina aplic un examen departamental a la generacin de
236 alumnos de primer ao. Resumi las calificaciones con promedio y desviacin estndar, encontrando
valores de 7.0 y 1.5 respectivamente. El funcionario saba que solo es vlido usar el promedio y la
Jess Reynaga Obregn


88
desviacin estndar si los valores son cuantitativos continuos y si, adems, se distribuyen como la curva
normal.

La distribucin observada de las calificaciones de los alumnos fue la siguiente:

Entre el promedio ms una desviacin estndar; es decir entre 7.01 y 8.50 se encontraron 74
calificaciones

Entre el promedio menos una desviacin estndar ; es decir entre 5.50 y 7.00 se encontraron 86
calificaciones

44 calificaciones tenan un valor superior a 8.50

32 calificaciones tenan un valor inferior a 5.50


Debido a sus conocimientos de estadstica, el funcionario saba que, si las 236 calificaciones se
distribuan de acuerdo a la curva normal, habra que esperar que los valores se distribuyeran
aproximadamente as:

Entre el promedio ms una desviacin estndar debera haber el 0.3413 de los valores; esto
equivala aproximadamente a 81 calificaciones con valor de 7.01 a 8.50

Entre el promedio menos una desviacin estndar debera haber el 0.3413 de los valores; esto
equivala aproximadamente a 81 calificaciones con valor de 5.50 a 7.00

Debera haber un 0.1587 de las calificaciones con valor mayor de 8.50; esto equivala
aproximadamente a 37 calificaciones con valor superior a 8.50

Debera haber un 0.1587 de las calificaciones con valor menor de 5.50: esto equivala
aproximadamente a 37 calificaciones con valor inferior a 5.50

Para evaluar sus datos los acomod de la siguiente manera:



Menos de
5.50
5.50 a 7.00 7.01 a 8.50
Ms de
8.50
Total
o

32 74 86 44 236
e

0.1587 X
236 = 37
0.3413 X
236 = 81
0.3413 X
236 = 81
0.1587 X
236 = 37
236
( )
o e

- 5 - 7 5 7
( )
2
o e

25 49 25 49
( )
2
o e
e

0.68 0.60 0.31 1.32


Suma =
2.91


Jess Reynaga Obregn


89


Lo que el Secretario Acadmico hizo fue estimar el valor de Chi cuadrada calculada mediante la frmula:

( )
2
2
2.91
o e
e


= =

En seguida, el funcionario calcul que los grados de libertad que debera considerar para encontrar el
valor crtico de Chi cuadrada mediante la frmula G.L. = k 1 correspondan a la operacin 4 1 = 3.

A continuacin acudi a la tabla de valores crticos de Chi cuadrada
Fragmento de la tabla de valores crticos de
2



Grados de libertad
Valores crticos al nivel
de significancia de 0.05
1 3.84
2 5.99
3 7.81
4 9.49
5 11.07

100 124.34

Encontr que el valor crtico de 7.81 no era rebasado por el valor calculado ( 2.91 ).

Decidi que no poda rechazar a la hiptesis estadstica nula Ho: Fe = Fe .

Por lo anterior concluy que la distribucin observada de las calificaciones se ajustaba bien a la
distribucin esperada de las mismas. En otras palabras las 236 calificaciones parecan distribuirse de
manera semejante a la curva normal y, por ello, se consider autorizado a utilizar legtimamente al
promedio y a la desviacin estndar para resumir su serie de datos.


Problemas a resolver


Problema 1

Al estudiar a una aislada poblacin de la costa, un antroplogo descubri que los rasgos tnicos de los
pobladores eran semejantes a los de los oriundos de otro continente. En una muestra de 174 miembros
de dicho lugar encontr la siguiente distribucin de grupos sanguneos:

Tipo A Tipo B Tipo AB Tipo O
70 personas 22 personas 24 personas 58 personas

Jess Reynaga Obregn


90
El antroplogo saba que la poblacin general del pas tena una distribucin de grupos sanguneos de la
siguiente forma:


Tipo A Tipo B Tipo AB Tipo O
15% 7% 8% 70 %


El antroplogo se preguntaba s la poblacin costea podra tener ancestros en otro continente. Para
resolver la cuestin decidi efectuar una prueba de anlisis estadstico denominada Prueba de bondad
de ajuste.

Preguntas:

1.1 Cul podra ser el propsito de la prueba de anlisis estadstico usada por el antroplogo?

1.2 Cmo es la distribucin de frecuencias observada?; describa cul era el grupo sanguneo ms
frecuente y cul el ms infrecuente en el grupo de 174 personas observadas.

1.3 Cmo es la distribucin de frecuencias del grupo de referencia?; describa cul era el grupo
sanguneo ms frecuente y cul el ms infrecuente en la poblacin general del pas.

1.4 Cmo es la distribucin de frecuencias esperada?; efecte el clculo de las frecuencias esperadas
(Fe)

1.5 Cmo es la tabla auxiliar de trabajo?

1.6 El valor de Chi cuadrada calculada rebasa o no al valor crtico de Chi cuadrada?

1.7 Se puede rechazar a la hiptesis estadstica Ho?

1.8 Se ajustan bien la Fo y la Fe?; es decir, hay bondad de ajuste entre ambas distribuciones?

1.9 Cul fue la conclusin a la que lleg el antroplogo?



Problema 2

El administrador de un hospital supona que los ingresos al servicio de ciruga provenan
equivalentemente de tres fuentes: a) consulta externa, b) urgencias o c) traslados desde otros
hospitales.

Al estudiar el origen de los internamientos en ciruga en los ltimos tres aos, encontr lo siguiente:

Ingresos al servicio de ciruga

Consulta externa Urgencias Traslados
735 684 795

Pregunta: Qu tan razonable era la suposicin del administrador del hospital?

You might also like