You are on page 1of 53

ESTADSTICA INFERENCIAL I

UNIDAD IV.- PRUEBA DE HIPTESIS


CON DOS MUESTRAS Y VARIAS
MUESTRAS DE DATOS NUMRICOS

INTRODUCCIN:
Una manera de hacer inferencia es haciendo una afirmacin acerca del valor que el
parmetro de la poblacin bajo estudio puede tomar. Esta afirmacin puede estar basada
en alguna creencia o experiencia pasada que ser contrastada con la evidencia que
nosotros obtengamos a travs de la informacin contenida en la muestra. Esto es a lo que
llamamos Prueba de Hiptesis
Una prueba de hiptesis comprende cuatro componentes principales:

Hiptesis Nula
Hiptesis Alternativa
Estadstica de Prueba
Regin de Rechazo

La Hiptesis Nula, denotada como H0 siempre especifica un solo valor del parmetro de la
poblacin si la hiptesis es simple o un conjunto de valores si es compuesta (es lo que
queremos desacreditar)

H 0 : =0

H 0 : 0

H 0 : 0

La Hiptesis Alternativa, denotada como H1 es la que responde nuestra pregunta, la que


se establece en base a la evidencia que tenemos. Puede tener cuatro formas:

H 1 : =1 H 1 : > 0
H 1 : < 0 H 1 : 0
Como las conclusiones a las que lleguemos se basan en una muestra, hay posibilidades
de que nos equivoquemos.
Dos decisiones correctas son posibles:

Rechazar H0 cuando es falsa


No Rechazar H0 cuando es verdadera.

Dos decisiones incorrectas son posibles:

Rechazar H0 cuando es verdadera


No Rechazar H0 cuando es falsa.

La Probabilidad de cometer un error Tipo I se conoce como Nivel de Significancia, se


denota como y es el tamao de la regin de rechazo El complemento de la regin de
rechazo es 1y es conocido como el Coeficiente de Confianza
En una prueba de Hiptesis de dos colas la regin de no rechazo corresponde a un
intervalo de confianza para el parmetro en cuestin
La Regin de Rechazo es el conjunto de valores tales que si la prueba estadstica cae
dentro de este rango, decidimos rechazar la Hiptesis Nula
Su localizacin depende de la forma de la Hiptesis Alternativa:

ESTADISTICA INFERENCIAL I

Si

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

H 1 : > 0 entonces la regin se encuentra en la cola derecha de la distribucin de la

estadstica de prueba.
Si

H 1 : < 0 entonces la regin se encuentra en la cola izquierda de la distribucin de

la estadstica de prueba
Si

H 1: 0

entonces la regin se divide en dos partes, una parte estar en la cola

derecha de la distribucin de la estadstica de prueba y la otra en la cola izquierda de la


distribucin de la estadstica de prueba.
La prueba de hiptesis para dos muestras es casi semejante a la prueba de una sola
muestra es decir que este capitulo se tomaran dos muestras aleatorias para determinar si
proviene de una misma poblacin o a su ves de poblaciones iguales.
As mismo puedo entender que en el caso de que se den las dos poblaciones iguales, se
esperara que la media entre las dos medias mustrales sea cero.
En el caso que existan poblaciones independientes, estas son iguales a la suma de dos
variables individuales.
Por ende las muestras deben ser suficientemente grandes para que la distribucin de las
medias mustrales siga una distribucin normal.
As mismo constituyo que para realizar una comparacin de poblaciones con muestras
pequeas es necesario tener en cuanta las siguientes suposiciones: las dos muestras
provienen de poblaciones independientes, de igual manera las desviaciones estndar de
las dos poblaciones son iguales, as mismo las poblaciones muestreadas siguen una
distribucin normal.
Como consiguiente tenemos que el nmero de grados de libertad en la prueba es igual al
nmero total de elementos muestreados, menos el nmero de muestras.
Existen casos en que las muestras no son independiente sino son dependientes o que a
su ves estas estn relacionadas entre si
Por tal razn puedo entender que existen dos tipos de muestras dependientes,
1. Las que se caracterizan por una medicin, una intervencin de cierto tipo y esta a
su ves otra medicin.
2. Existe una formacin de pares de las observaciones correspondientes.
Para tener una idea mas concreta formulare la existencia de una comparacin de las
muestras independientes y dependientes.
Las muestras dependientes son aquellas que se caracteriza por una medicin seguida,
por un intervalo de algn tipo y despus otra medida. A esta tambin se la puede llamar
un estudio antes o despus.
De la misma forma el segundo tipo de muestra dependiente se caracteriza por la
formacin de pares de observaciones.
101

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

UNIDAD V.- PRUEBAS DE HIPTESIS CON DOS MUESTRAS Y VARIAS


MUESTRAS DE DATOS CATEGRICOS.
5.1 PRUEBA Z PARA LA DIFERENCIA ENTRE DOS PROPORCIONES
Prueba Z para la diferencia entre dos proporciones.
El concepto de prueba de hiptesis se puede utilizar para probar hiptesis en relacin con
datos cualitativos.
Cuando el objetivo del muestreo es evaluar la validez de una afirmacin con respecto a la
proporcin de una poblacin, es adecuado utilizar una prueba de una muestra.
La metodologa de prueba depende de si el nmero de observaciones de la muestra es
grande o pequeo.
Como se habr observado anteriormente, las pruebas de grandes muestras de medias y
proporciones son bastante semejantes. De este modo, los valores estadsticos de prueba
miden la desviacin de un valor estadstico de muestra a partir de un valor propuesto. Y
ambas pruebas se basan en la distribucin normal estndar para valores crticos. Quiz la
nica diferencia real entre las ambas radica en la forma corno se obtiene la desviacin
estndar de la distribucin de muestreo.
Esta prueba comprende el clculo del valor estadstico de prueba Z

Z prueba =

x
p0
n

p0 (1 p0 )
n

Donde
X= ocurrencias
n= observaciones

x
= proporcionde lamuestra
n
P0= proporcin propuesta

p0 (1p 0)
=desviacion estandar de la poblacion
n
102

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

Si se muestra a partir de una poblacin finita:

n
100 >5
N
Se debe utilizar el factor finito de correccin

Z prueba =

x
p0
n

p0 (1 p0 ) N n

n
N 1

Posteriormente este valor es comparado con el valor de Z, obtenido a partir de una tabla
normal a un nivel de significacin seleccionado.
Como ocurri con la prueba de medias de una muestra, las pruebas de proporciones
pueden ser de una o dos colas.
El tipo de prueba refleja H1. Por ejemplo, hay tres posibilidades para H1:

H 1 : p> p0

H 1 : p< p0

H 1: p p0

La hiptesis nula es

H 1 : p=p 0

La primera alternativa establece una prueba de cola derecha, la segunda, izquierda y la


tercera, una prueba de dos colas.
El objetivo de una prueba de dos muestras es determinar si las dos muestras
independientes fueron tomadas de dos poblaciones, las cuales presentan la misma
proporcin de elementos con determinada caracterstica. La prueba se concentra en la
diferencia relativa (diferencia dividida entre la desviacin estndar de la distribucin de
muestreo) entre las dos proporciones mustrales. Diferencias pequeas denotan
nicamente la variacin casual producto del muestreo (se acepta H0), en tanto que
grandes diferencias significan lo contrario (se rechaza H0). El valor estadstico de prueba
(diferencia relativa) es comparado con un valor tabular de la distribucin normal, a fin de
decidir si H0 es aceptada o rechazada. Una vez ms, esta prueba se asemeja
considerablemente a la prueba de medias de dos muestras.
La hiptesis nula en una prueba de dos muestras es

H 1 : p1= p 2
103

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

Las hiptesis alternativas posibles son

H 1 : p1 p2
H 1 : p1 > p2
H 1 : p1 < p2
La estimacin combinada de p se puede calcular de la siguiente manera:

p=

x 1+ x 2
n 1+ n2

Donde:
P= proporcin muestral
X1= numero de aciertos en la muestra 1
X2= numero de aciertos de la muestra 2
n1= numero de observaciones de la muestra 1
n2= numero de observaciones de la muestra 2
Este valor de p se utiliza para calcular el valor estadstico de prueba:

Z prueba =

x1
x
2
n1
n2

p(1p)

1
1
+
n1 n 2

EJEMPLOS:
Ejemplo 1:

104

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

Resolucin:
Los datos son:
n1= 20
n2= 20
x1= 18
x2=14
= 0.05
Las hiptesis son

H 0 : p1 =p 2
H 1 : p1 p2
Como se trata de una poblacin de hiptesis a dos colas se debe calcular

0.05
=
=0.025
2
2
Con lectura en la tabla para un rea de 0.025 le corresponde un valor z= 1.96

Calculando la proporcin muestral se obtiene:

p=

x 1+ x 2 18+ 14
=
=0.8
n 1+ n2 20+20

Calculando zprueba se obtiene:

Z prueba =

x1
x
2
n1
n2

p(1p)

1
1
+
n1 n 2

105

ESTADISTICA INFERENCIAL I

Z prueba =

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

18
14

20
20

0.8 (10.8)

( 201 + 201 )

= 1.58

H0 es aceptada ya que la prueba 1.58 est en la zona de aceptacin de la tabla z =1.96


entonces la proporcin de los estudiantes que estn a favor de la nueva enseanza de la
estadstica es la misma en los dos paralelos.

Solucion:

H 0 : p1 =p 2

106

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

H 1 : p1 p2
Como se trata de una poblacin de hiptesis a dos colas se debe calcular

0.05
=
=0.025
2
2
Con lectura en la tabla para un rea de 0.025 le corresponde un valor z= 1.96
Calculando zprueba se obtiene:

Z prueba =

Z prueba =

x1
x
2
n1
n2

p(1p)

1
1
+
n1 n 2

0.200.30 0.10
=
=1.15
0.087
0.087

El valor calculado para z,-1.15, est en la regin de aceptacin de la hiptesis nula. Por
tanto, no se puede rechazar la hiptesis de que no hay diferencia en la proporcin de
televidentes en las dos comunidades.

Solucin;
107

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

La hiptesis nula y alternativa se pueden expresar como sigue:

H 0 : p=0.08 ( funciona correctamente )


H 1= p>0.08( no funciona cor rectamente)
Ahora se determinar si el proceso funciona correctamente para las llantas producidas
para el turno de da. Los resultados del turno de da indican que cinco llantas en una
muestra de 100 se reventaron antes de 10,000 millas para este problema, si se selecciona
un nivel de significancia de .05, las regiones de rechazo y no rechazo se estableceran
como a continuacin se muestra:
Y la regla de decisin sera:

H 0 si>+1.645

Rechazar

Con los datos que se tienen,

Z prueba =

Z prueba =

x1
x
2
n1
n2

p(1p)

1
1
+
n1 n 2

0.050.1
=1.107
0.05

Por tanto no rechazar Ho.


La hiptesis nula no se rechazara por que la prueba estadstica no ha cado en la regin
de rechazo. Se llegara a la conclusin de que no hay pruebas de que ms del 8% de las
llantas producidas en el turno de da se revienten antes de 10,000 millas. El gerente no ha
encontrado ninguna prueba de que ocurra un nmero excesivo de reventones en las
llantas producidas en el turno de da.

5.2 PRUEBA PARA LA DIFERENCIA ENTRE DOS PROPORCIONES


Pruebas de hiptesis a partir de proporciones.

108

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

Las pruebas de hiptesis a partir de proporciones se realizan casi en la misma forma


utilizada cuando nos referimos a las medias, cuando se cumplen las suposiciones
necesarias para cada caso. Pueden utilizarse pruebas unilaterales o bilaterales
dependiendo de la situacin particular.
La proporcin de una poblacin
Las hiptesis se enuncian de manera similar al caso de la media.

H 0 : p= p0
H 1 : p1= p 0
Se distribuye normal estndar.
Regla de decisin: se determina de acuerdo a la hiptesis alternativa (si es bilateral o
unilateral). En el caso de muestras pequeas se utiliza la distribucin Binomial.
Diferencia entre las proporciones de dos poblaciones
La situacin ms frecuente es suponer que existen diferencias entre las proporciones de
dos poblaciones, para ello suelen enunciarse las hiptesis de forma similar al caso de las
medias: Puede la hiptesis alternativa enunciarse unilateralmente.
Cuando se tienen dos poblaciones y se han tomado muestras aleatorias de tamaos n 1 y
n2, para observar una caracterstica o cualidad, se puede comparar el comportamiento de
dicha caracterstica en las poblaciones a travs de la diferencia de proporciones.
Hiptesis
Como en los casos anteriores se puede plantear uno de los siguientes tres tipos de
hiptesis:
-

Prueba de hiptesis a dos colas

H 0 : 1= 2 H 0 : 1 2=K
H 1 : 1 2 H 1 : 1 2 K

Prueba de hiptesis a una cola superior

H 0 : 1= 2 H 0 : 1 2 K
H 1 : 1 > 2 H 1 : 1 2 > K

109

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

Prueba de hiptesis a una cola inferior

H 0 : 1= 2 H 0 : 1 2 K
H 1 : 1 < 2 H 1 : 1 2 < K

La estadstica de trabajo es la expresin:

Z
P1P2=

( P1P 2) ( 1 2 )

N ( 0,1 )

P1 q1 P1 q 2
+
n1
n2

Regla de decisin:
Como en los casos anteriores depende del tipo de hiptesis que se haya planteado.
-

Si se ha planteado la hiptesis alternativa como:

H 1 : 1 2 H 1 : 1 2 K K se tiene una prueba de hiptesis a dos colas, por lo tanto,


el nivel de significancia ( ) se divide en dos partes iguales, quedando estos valores en
los extremos de la distribucin.

Z 2 y Z 12

pertenecen a una distribucin Normal estndar. Si el valor de la

estadstica de trabajo (Zp1-p2) est entre

Z 2 y Z 12 no se rechaza la hiptesis nula,

en caso contrario se rechaza H0 lo cual implica aceptar H1. Es decir, si


p2

<

Z 12

Z 2 < Z
p1-

no se rechaza H0 .
-

Si se ha planteado la hiptesis alternativa como:

H 1 : 1 > 2 H 1 : 1 2 > K K, se tiene una prueba de hiptesis a una cola superior,


quedando el nivel de significancia () en la parte superior de la distribucin.

110

ESTADISTICA INFERENCIAL I

Z 12

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

Pertenece a una distribucin Normal estndar. Si el valor de la estadstica de

trabajo es menor que

Z 12

no se rechaza la hiptesis nula, en caso contrario se

rechaza H0 lo cual implica aceptar H1. Es decir, si Zp1-p2 <


-

Z 12 no se rechaza H .
0

Si se ha planteado la hiptesis alternativa como:

H 1 : 1 < 2 H 1 : 1 2 < K K, se tiene una prueba de hiptesis a una cola inferior,


quedando el nivel de significancia () en la parte inferior de la distribucin
Z pertenece a una distribucin Normal estndar. Si el valor de la estadstica de trabajo
(Zp1-p2) es mayor que Z no se rechaza la hiptesis nula, en caso contrario se rechaza H o
lo cual implica aceptar H1. Es decir, si Zp1-p2 > Z no se rechaza H0.

EJEMPLOS
Ejemplo 1:

Resolucin:

H 0 : =0.05
H 1 : >0.05

0 ( 1H 0 )
n

111

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

0.0475
= 0.000475=0.022
100
( 0.05 )( 0.95 )

=
100

z=

p 0 100.05 0.05
=
=
=+2.27
p
0.022
0.022

El valor calculado de z es de +2.27 el cual es mayor que el valor crtico de+1.645 de esta
prueba de cola superior. Por lo tanto, con 10 partes de 100detectadas como defectuosas,
la hiptesis de que la proporcin de partes defectuosas de la poblacin es de o inferior a .
05 se rechaza, con el uso en la prueba del nivel de significancia de 5%

Solucin:

H 0 : ( 1 2) =0
H 1 : ( 1 2 ) 0
Donde el valor critico es 2.58

z=

0.99
=2.58
2.495

=0.01

112

ESTADISTICA INFERENCIAL I

n1 p1 +n 2 p2 50 ( .20 )+50 ( .30 ) 10+15


=
=
=.25
n1 +n 2
50+50
100

p1 p

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

2=

( 1 ) ( 1 )
+
n1
n2

( .25 ) ( .75 ) ( .25 ) ( .75 )


+
= 0.00375+ 0.0375=0.087
50
50

Z=

p 1 p 2 0.200.30 .10
=
=
=1.15
1 p2
p
0.087
0.087

Lo que nos dice que la z calculada de -1.15 se encuentra en la regin de aceptacin de la


hiptesis nula. Por lo tanto la hiptesis de que no existe diferencia en la proporcin de
espectadores de las dos zonas no puede rechazarse.

Solucin:

H 0 : ( 1 2) =0

113

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

H 1 : ( 1 2 ) > 0

( =0.05 ) =+1.645

Z critica

=
p1 p

n1 p1 +n 2 p2 50 ( .10 )+ 80 ( .75 ) 5+6


=
=
=.085
n1 +n 2
50+80
130

2=

( 1 ) ( 1 )
+
n1
n2

( .085 ) ( .915 ) ( .085 ) (.915 )


+
= 0.0016+ 0.0010=0.51
50
80

Z=

p 1 p 2 0.100.75 0.025
=
=
=+0.49
1 p2
p
0.051
0.051

El valor calculado de z de +.49 no es mayor que +1.645 en esta prueba decola superior.
Por tanto, la hiptesis nula no puede ser rechazada al nivel de significancia de 5%

5.3 PRUEBA PARA DIFERENCIA EN N PROPORCIONES Z.

La finalidad de una prueba de k muestras es evaluar la aseveracin que establece que


todas las k muestras independientes provienen de poblaciones que presentan la misma
proporcin de algn elemento. De acuerdo con esto, las hiptesis nula y alternativa son:

114

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

H0: Todas las proporciones de la poblacin son iguales


H1: No todas las proporciones de la poblacin son iguales

La estimacin combinada de la poblacin muestral p se calcula de la siguiente manera:

p=

x 1+ x 2 + x 3+ xn
n1 +n2 +n3 + n n

En una muestra se puede dar un conjunto de sucesos, los cuales ocurren con frecuencias
observadas "o"(las que se observa directamente) y frecuencias esperadas o tericas "e"
(las que se calculan de acuerdo a las leyes de probabilidad).

La frecuencia esperada e se calcula as:

e= pototal
Donde:

P= proporcin muestral

total= frecuenca total observada


o

El estadstico de prueba es:

115

ESTADISTICA INFERENCIAL I

2prueba

2prueba

( o1e1 )

e1

( oiei )

( o 2e 2 )
e2

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.
2

( o 3e 3 )
e3

( o ne n )
en

ei

Donde:

X: es la letra griega ji
X2: se lee ji cuadrado

Por lo tanto el valor estadstico de prueba para este caso es la prueba ji cuadrado o
conocida tambin como chi cuadrado.

Como sucede con las distribuciones t y F, la distribucin ji cuadrado tiene una forma que
depende del nmero de grados de libertad asociados a un determinado problema.
Para obtener un valor crtico (valor que deja un determinado porcentaje de rea en la
cola) a partir de una tabla de ji cuadrado, se debe seleccionar un nivel de significacin y
determinar los grados de libertad para el problema que se est resolviendo.

116

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

Los grados de libertas sin una funcin del numero de casillas de 2* k. Es decir, los grados
de libertas reflejan el tamao de la tabla. Los grades de libertas de la columna son el
numero de filas (categoras) menos 1, o bien r-1. Los grados de libertas de cada fila es
igual al numero de columnas (muestras) menos 1, o bien, k-1. El efecto neto es que el
numero de grados de libertad para la tala es el producto de (numero de fialas-1) por
(numero de columnas -1), o bien, (r-1) (k-1). Por lo tanto con 2 filas y 4 columnas. Los
grades de libertad son (2-1) (4-1)=3.

La prueba ji cuadrada requiere la comparacin del

2prueba

con el

2tabla

. Si el valor

estadstico de prueba es menor que el valor tabular, la hiptesis nula es aceptada, caso
contrario, H0 es rechazada.

INTERPRETACION : Una valor estadstico de

x2

prueba

menor que el valor crtico

x2

tabla

o igual a l se considera como prueba de la variacin casual en donde H0, es aceptada.

117

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

EJEMPLOS:
EJEMPLO 1

Resolucin:
Los grados de libertad se calculan aplicando la frmula:

GL=( r1 ) ( k 1 )
( 31 ) ( 41 )
12
0.995

0.990

0.975

0.950

0.900

0.750

0.500

0.250

0.100

0.050

0.025

0.010

0.005

0.10
2
0.57
5
1.21
3
1.92
3
2.67
5
3.45
5
4.25
5
5.07
1
5.89
9

2.706

3.841

5.024

6.635

7.879

0.02
0
0.115

0.01
6
0.211

1.323

0.01
0
0.07
2
0.20
7
0.41
2
0.67
6
0.98
9
1.34
4
1.73
5

0.00
4
0.10
3
0.35
2
0.711

0.455

0.00
1
0.05
1
0.21
6
0.48
4
0.83
1
1.23
7
1.69
0
2.18
0
2.70
0

1.386

2.773

4.605

5.991

7.378

9.210

10.597

2.366

4.108

6.251

7.815

9.348

11.345

12.838

3.357

5.385

7.779

9.488

11.143

14860

4.351

6.626

9.236

11.070

5.348

7.841

6.346

9.037

7.344

10.21
9
11.389

10.64
5
12.01
7
13.36
2
14.68
4

12.59
2
14.06
7
15.50
7
16.91
9

12.83
3
14.44
9
16.01
3
17.53
5
19.02
3

13.27
7
15.08
6
16.81
2
18.47
5
20.09
0
20.66
6

3
4
5
6
7
8
9

0.97
0.55
4
0.87
2
1.23
9
1.64
6
2.08
8

1.14
5
1.63
5
2.16
7
2.73
3
3.32
5

0.58
4
1.06
4
1.61
0
2.20
4
2.83
3
3.49
0
4.16
8

8.343

118

16.750
18.548
20.278
21.955
23.589

ESTADISTICA INFERENCIAL I

1
0
11
1
2

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

2.15
6

2.55
8

3.24
7

3.94
0

4.86
5

6.73
7

9.342

12.54
9

15.98
7

18.30
7

20.48
3

23.20
9

25.188

2.60
3
3.07
4

3.05
3
3.57
1

3.81
6
4.40
4

4.57
5
5.22
6

5.57
8
6.30
4

7.58
4
8.43
8

10.34
1
11.340

13.70
1
14.84
5

17.27
5
18.54
9

19.67
5
21.02
6

21.92
0
23.33
7

24.72
5
26.21
7

26.757

Con la lectura en la tabla con 12 grados de libertad y 0.05 de rea se obtiene

x 2 =21.026 ,
tabla

Resolucin:
Datos:
r=2
k=6
Las hiptesis son:
H0: Todas las proporciones de la poblacin son iguales
H1: No todas las proporciones de la poblacin son iguales

Los grados de libertad se calculan aplicando la formula:

GL=( 21 ) ( 61 ) =5

119

28.300

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

Con la lectura en la tabla con 5 grados de libertad y 0.01 de rea se obtiene


0.995

0.990

0.975

0.950

0.900

0.750

0.500

0.250

0.100

0.050

0.025

0.010

0.005

3.841

5.024

6.635

7.879

1.386

2.773

4.605

5.991

7.378

9.210

2.366

4.108

6.251

7.815

9.348

3.357

5.385

7.779

9.488

4.351

6.626

9.236

5.348

7.841

6.346

9.037

7.344

10.21
9
11.38
9
12.54
9

10.64
5
12.01
7
13.36
2
14.68
4
15.98
7

11.07
0
12.59
2
14.06
7
15.50
7
16.91
9
18.30
7

11.14
3
12.83
3
14.44
9
16.01
3
17.53
5
19.02
3
20.48
3

11.34
5
13.27
7
15.08
6
16.81
2
18.47
5
20.09
0
20.66
6
23.20
9

10.59
7
12.83
8
14860

0.55
4
0.87
2
1.23
9
1.64
6
2.08
8
2.55
8

0.10
2
0.57
5
1.21
3
1.92
3
2.67
5
3.45
5
4.25
5
5.07
1
5.89
9
6.73
7

2.706

0.02
0
0.11
5
0.97

0.01
6
0.21
1
0.58
4
1.06
4
1.61
0
2.20
4
2.83
3
3.49
0
4.16
8
4.86
5

1.323

0.01
0
0.07
2
0.20
7
0.41
2
0.67
6
0.98
9
1.34
4
1.73
5
2.15
6

0.00
4
0.10
3
0.35
2
0.71
1
1.14
5
1.63
5
2.16
7
2.73
3
3.32
5
3.94
0

0.455

0.00
1
0.05
1
0.21
6
0.48
4
0.83
1
1.23
7
1.69
0
2.18
0
2.70
0
3.24
7

2.60
3

3.05
3

3.81
6

4.57
5

5.57
8

7.58
4

10.34
1

13.70
1

17.27
5

19.67
5

21.92
0

24.72
5

26.75
7

3.07
4

3.57
1

4.40
4

5.22
6

6.30
4

8.43
8

11.34
0

14.84
5

18.54
9

21.02
6

23.33
7

26.21
7

28.30
0

3
4
5
6
7
8
9
1
0
1
1
1
2

8.343
9.342

16.75
0
18.54
8
20.27
8
21.95
5
23.58
9
25.18
8

x 2 =15.086
tabla

Calculando

2prueba

2prueba

x2
x

prueba

2prueba

x2

prueba

( oiei )

se obtiene:
2

ei

( 610 )2 ( 810 )2 ( 910 )2 ( 1510 )2 (1410 )2 ( 810 )2


=
+
+
+
+
+
10
10
10
10
10
10
=1.6+0.4+ 0.1+ 2.5+1.6+0.4
=6.6
120

ESTADISTICA INFERENCIAL I

H0 es aceptada, ya que

2prueba

(6.6)

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

es menor que

2tala

x (15.086) , por lo tanto se concluye que

todas las proporciones de la poblacin son iguales, es decir, el dado es bueno

Resolucin:

Datos:
121

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

n= 500
p=

15
=0.033
500

z (0.90)=1.645

P p z

( 0.03 ) ( 0.97 )
pq
=0.03 ( 1.645 )
n
500

0.0237

0.0237< p<0.0376

Se sabe que con un nivel de confianza del 90% que la proporcin de discos
defectuosos que no pasan la pruea en esa poblacion esta entre 0.0237y 0.0376

5.4 PRUEBA DE INDEPENDENCIA (JI-CUADRADA)


En una prueba de independencia el nico nmero que el investigador controla
directamente es el tamao total de la muestra. Se extrae una muestra de tamao n de la
poblacin y cada objeto se clasifica segn las dos variables que se estudian. Ni las
frecuencias de cada celda, ni los totales de fila y columna se conocen de antemano.

El investigador no fija previamente ningn conjunto, es decir, son aleatorios.


El planteamiento de las Hiptesis ser:

H 0 : Ay B son independientes
H 1 : Ay B no son independientes
122

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

Independencia significa que el conocimiento del nivel de clasificacin de un objeto


respecto a la caracterstica A no tiene nada que ver con su nivel respecto a la
caracterstica B. Para expresar esta idea matemticamente utilizamos las probabilidades
dadas en la siguiente tabla:
Variable 1(A)
si
Variable 2

no

total

Si

p11

p12

p1

No

p21

p22

p2

Total

p1

p2

(B)

Se
sabe
que, para que dos sucesos sean independientes, la probabilidad de que ocurran ambos a
la vez debe ser igual al producto de las probabilidades de que cada suceso ocurra
individualmente.

p [ AyB ] = p [ A ] p [ B ]

p11= p1 p1
La relacin debe cumplirse para cada celda. Por tanto, la hiptesis nula de independencia
se expresa matemticamente como:
I= 1,2
H0: p ij = pi*p*j
j=1,2
I= 1,2
H1: p ij = pi*p*j
j= 1,2
Comparamos el nmero de observaciones en cada celda con el nmero esperado, si H 0
es cierta. Si estos nmeros difieren poco, no hay razn para rechazar H 0; si hay una gran
discrepancia entre los valores observados y esperados, entendemos esto como evidencia
de que H0 no es cierta. Entonces se calcula el valor esperado as:

123

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

Eij =npij

E11 =

n 1 n 1 total fila marginal x total columna marginal


=
n
tamao de lamuestra

La pregunta es la siguiente: son estas diferencias demasiado grandes como para que se
deban nicamente al azar?
Para responderla necesitamos un estadstico cuya distribucin de probabilidad sea
conocida bajo la hiptesis de que H0 es cierta. El estadstico en cuestin es:

x =
21

( nij E y )

y
E

Prefijamos un nivel de significancia en 0.05 con (k-1) (r-1) grados de libertad.


Si el valor p es pequeo (es menor de 0.05); podemos rechazar H0
Para que las pruebas de Ji-cuadrado sean vlidas, es necesario que las muestras sean
grandes. Es decir que las frecuencias esperadas no sean menores de 5. Si esto no se
cumple, puede utilizarse una prueba para pequeas muestras llamada prueba exacta de
Fischer para contrastar independencia.

Ejercicios propuestos

124

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

Comparamos el nmero de observaciones en cada celda con el nmero esperado, si H0 es cierta:

11 = n 1 n1 = 425(200) =170
E
n
500
12= n1 n2 = 425 (300 ) =225
E
n
500
21= n2 n1 = 75( 200) =30
E
n
500
22= n2 n2 = 75( 300) =45
E
n
500
Para saber si las diferencias entre valores halladoz y valores esperados es
significativa entonces aplicamos el estadistico ji-cuadrado:
125

ESTADISTICA INFERENCIAL I

( nij E y )

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

=
y
E
2
x =
1

( 162170 )2 ( 263255 )2 (3830 )2 ( 3745 )2

+
+
+
=4.18
170
255
30
45
P=P [ x 2 4.18 ]
1

A partir de la tabla Ji-cuadrado vemos que:

P=P [ x 2 3.48 ] y
1

P=P [ x 2 5.02 ] = 0.025


1

Como 4.18 est entre 3.84 y 5.02, el valor p est entre 0.025 (0.975) 0.05
(0.950). El valor p es pequeo, es menor de 0.05. Podemos rechazar H 0 y
concluir que la sobretalla y el xito en las clases no son independientes.

Resolucin:
Debemos primero calcular las frecuencias esperaas bajo el supuesto de
independencia. La tabla de frecuencias esperadas sera:
Deportista
No deportista

Sin depresin
32.43
36.57
69

Con depresin
14.57
16.43
31

47
53
100

Calculemos ahora el estadistico del contraste:

126

ESTADISTICA INFERENCIAL I

( nij E y )

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

=
y
E
2
x =
1

( 3832.43 )2 ( 914.57 )2 ( 3136.57 )2 ( 2216.43 )2

+
+
+
=5.82
32.43
14.57
36.57
16.43
Este valor debemos compararlo con el percentil de la distribucin
1) (2-1)=1 grado de libertad x

20.95

(1)=3.84 .

x2

con (2-

Por lo tanto como el valor del

estadstico es superior al valor crtico, concluimos que debemos rechazar la


hiptesis de independencia y por lo tanto asumir que existe relacin entre la
depresin e los hbitos deportistas del individuo.

Resolucin:

Sexo
Del
entrevistado
Total

Hombre
Mujer

Salud 2
EX+MB+B
139
124
263

R+M
42
61
103

Total
181
185
366

127

ESTADISTICA INFERENCIAL I

e 21=

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

n 2n1 185263
=
=132.94
n
366

Calculemos ahora el estadistico del contraste:

( nij E y )

=
y
E
2
x =
1

( 139130.1 )2 ( 4250.9 )2 (124132.9 )2 ( 6152.1 )2


+
+
+
=4.32
130.1
50.9
132.9
521

5.5 PRUEBA DE CONTINGENCIA (JI-CUADRADA).


El trmino tabla de contingencia se refiere a que las tablas construidas se usan para
contrastar una asociacin o relacin entre dos variables. Las tablas de contingencia son
una forma de presentar datos categricos, con dos o ms niveles.
Las tablas de contingencia 2 x 2, aparecen cuando cada una de las dos variables se
estudia en dos niveles. Cada observacin del conjunto de datos cae exactamente en una
celda. El anlisis de datos se basa en el examen del nmero de observaciones que caen
dentro de cada categora. Tambin son llamadas tablas tetralgicas, o tablas de conteo.
La notacin cuando estamos en frente de un conteo de frecuencias es:
n11 = nmero de observaciones dentro de la celda en la fila 1 y la columna 1.
n12 = nmero de observaciones dentro de la celda en la fila 1 y la columna 2.
n21 = nmero de observaciones dentro de la celda en la fila 2 y la columna 1.
n22 = nmero de observaciones dentro de la celda en la fila 2 y la columna 2.
n1. = n11 + n12 = nmero de observaciones en la fila 1
n2. = n21 + n22 = nmero de observaciones en la fila 1
n1 = n11 + n21 = nmero de observaciones en la fila 1
128

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

n2 = n12 + n22 = nmero de observaciones en la fila 1


n = nmero total de observaciones
La hiptesis de que las m poblaciones son homogneas, se traduce en que cada conjunto
Aj debe tener una probabilidad terica pj, desconocida, pero que no vara de la poblacin i
a la poblacin homognea en las diversas muestras.

La tabla ji- cuadrada (

) se utiliza principalmente:

Para probar si una serie de datos observada, concuerda con el modelo (serie esperada) de la
informacin.
Para probar las diferencias entre las proporciones de varios grupos (tabla de contingencia).

Para todos los casos,


Ho: No hay diferencia o no hay dependencia entre variables
H1: Hay diferencia o si hay dependencia entre variables

Pasos para realizar la tabla de contingencias


1

Plantear las hiptesis:

H 0= p1= p2 =p 3 =p k
H1: al menos dos proporciones son diferentes.
2
3
4

E y=

Construir una tabla que contenga los valores observados.


Sumar los totales de los renglones y columnas de los valores observados.
Debajo de cada valor observado poner el valor esperado utilizando la frmula:

( total delsimo renglntotal de jsima columna)


n

Calcular el valor del estadstico de prueba

x 2=

usando la frmula:

( Oij Eij )
Ey

Donde:
Oij = Valor observado de la celda i,j.
129

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

Eij = Valor esperado de la celda i,j


5

Determinar los grados de libertad mediante:

gl=(r1)(c1)

Donde:
r = nmero de renglones
c = nmero de columnas

6
7

Calcular el valor crtico en la tabla


Criterio de decisin: si el valor crtico < valor del estadstico de prueba rechazamos
Ho

En muchas ocasiones, los n elementos de una muestra tomada de una poblacin pueden
clasificarse con dos criterios diferentes. Por tanto, es interesante saber si los dos mtodos
de clasificacin son estadsticamente independientes. Supngase que el primer mtodo
de clasificacin tiene r niveles, y que el segundo tiene c niveles. O sea Oij la frecuencia
observada para el nivel i del primer mtodo de clasificacin y el nivel j del segundo
mtodo de clasificacin. En general, los datos aparecern como se muestra en la
siguiente tabla. Una tabla de este tipo usualmente se conoce como tabla de contingencia r
x c.

Ejercicios propuestos:

Resolucin:
H0 : p1 = p2 = p3
H1 : Al menos dos proporciones son diferentes.
130

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

Los valores Oij = 135, 110... Corresponden a los valores observados, los valores
esperados se colocan en las celdas con parntesis, para calcular los utilizamos la
frmula:
E y=

( total delsimo renglntotal de jsima columna)


n

Numero
ausencias
0-3

de

4-6
7-45
Total

Aprobado

No aprobado

Total

135
(147)
36
(24)
9
(9)
180

110
(98)
4
(16)
6
(6)
120

245

Calculamos el valor del estadstico de prueba


x 2=

40
15
300

usando la frmula:

( Oij Eij )
Ey

La tabla siguiente nos ayuda a organizar los clculos para el estadstico.


Celda
(1,1)
(1,2)
(2,1)
(2,2)
(3,1)
(3,2)

Oij
135
110
36
4
9
6

Eij
147
98
24
16
9
6

(Oij Eij)2
144
144
144
144
0
0

(Oij Eij)2/Eij
0.98
1.47
6.00
9.00
0.00
0.00
17.45

Para determinar el valor crtico del estadstico de prueba procedemos de la siguiente


manera:
Determinar los grados de libertad usando la frmula:

gl=(r1)(c1)
gl=( 31 ) ( 21 ) =2

131

ESTADISTICA INFERENCIAL I

El valor critico del estadstico ji-cuadrada para

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

y gl. = 2 se denota. En la tabla ji-

cuadrada encontramos que vale 5.991, el valor del estadstico de prueba es

x 2=

17.44.
Como este estadstico est localizado en la regin de rechazo (a la derecha del valor
crtico), rechazamos Ho por lo cual aceptamos la hiptesis alternativa H1: al menos dos
proporciones son diferentes. La tasa de aprobacin si depende de las asistencias.

Resolucin
Ho; La satisfaccin en el trabajo y el rango son independientes.
H1; La satisfaccin en el trabajo y el rango son dependientes.
Grados de libertad:

gl=(r1)(c1)
gl=( 31 ) ( 41 ) =6

132

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

Regla de decisin:
Si X2R

12.592 no se rechaza Ho.

Si X2R > 12.592 se rechaza Ho.


Se proceder a calcular los valores esperados de cada celda. Como los grados de libertad
son 6, esto quiere decir que necesitamos calcular nicamente 6 frecuencias esperadas, y
las faltantes se encuentran por diferencia.
Se calcularn los valores esperados E11, E12, E13, E21, E22 y E23.

Rango
Instructor
Satisfaccin
en el
trabajo

Profesor

Profesor

asistente

asociado

Profesor

Total

Mucha

40

60

52

63

215

Regular

78

87

82

88

335

Poca

57

63

66

64

250

Total

175

210

200

215

800

11 = 215 (175) =47.03


E
800
12= 215(210) =56.44
E
800
13= 215 ( 200 ) =53.75
E
800
21= 335(175) =73.28
E
800
22= 335(210) =87.94
E
800
133

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

23= 335(200) =83.75


E
800

Satisfaccin

Mucha

Regular

Poca

Total

Instructor

Profesor

Profesor

Profesor

Total

asistente

asociado

40

60

52

63

215

(47.03)

(56.44)

(53.75)

(57.78)

78

87

82

88

(73.28)

(87.94)

(83.75)

(90.03)

57

63

66

64

(54.69)

(65.62)

(62.50)

(67.19)

175

210

200

215

335

250

800

Los valores entre parntesis son los esperados, los que no se calcularon, por frmulas se
obtuvieron por diferencia con respecto a los totales.

( nij E y )

=
y
E
x2 =

( 4047.03 )2 ( 6056.44 )2 ( 5253.75 )2


( 6467.19 )2

+
+
+
=2.75
47.03
56.44
53.75
67.19
Como el valor de 2.75 es menor que el de tabla 12.592, por lo tanto no se rechaza Ho y
se concluye con un =0.05 que la satisfaccin en el trabajo y el rango son independientes.

134

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

solucin:

Ho; La proporcin de artculos defectuosos es la misma para los tres


turnos.
H1; La proporcin de artculos defectuosos no es la misma para los tres
turnos.
Grados de libertad:
gl=( r1)(c1)

gl=( 21 ) ( 31 ) =2

Regla de decisin:
Si X2R

7.378 no se rechaza Ho.

Si X2R > 7.378 se rechaza Ho.

135

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

Se proceder a calcular los valores esperados de cada celda. Como los grados de libertad
son 2, esto quiere decir que necesitamos calcular nicamente 2 frecuencias esperadas, y
las faltantes se encuentran por diferencia.
Se calcularn los valores esperados E11, y E22.
Como se necesitan los totales de rengln y columna se mostrarn en la tabla:

Matutino

Vespertino

Nocturno

Total

45

55

70

170

No defectuosos

905

890

870

2665

Total

950

945

940

2835

Defectuoso
s

11 = 170( 950) =57


E
2835
22= 2665(945) =888.33
E
2835

Vespertino

Nocturno

Total

45

55

70

(57.0)

(56.7)

(56.3)

905

890

870

(893.0)

(888.3)

(883.7)

950

945

940

Matutino

Defectuoso
s
No defectuosos

Total

170

2665

2835

136

ESTADISTICA INFERENCIAL I

( nij E y )

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

=
y
E
x2 =

( 4557.0 )2 (5556.7 )2 ( 7056.3 )2


( 870883.7 )2
+
+
+
=6.29
57.0
56.7
56.3
883.7

Si se busca este valor dentro de la tabla de ji-cuadrada con 2 grados de libertad nos dar
un valor de P aproximado a 0.04. Si se observa el valor de la ji-cuadrada calculada de
6.29 con el valor de tabla de 7.378, se llega a la decisin de no rechazar Ho. Sin embargo
sera riesgoso concluir que la proporcin de defectuosos producidos es la misma para
todos los turnos por tener un valor de P de 0.04.

5.6 PRUEBAS DE BONDAD DE AJUSTE.


La mayora de la informacin que se trabaja en las ciencias sociales o administrativas es
de carcter no-mtrico nominal. Por lo mismo, muchas de las tcnicas multivariadas ms
populares, como la regresin lineal de mnimos cuadrados, presentan serias limitaciones
analticas.

Es una prueba estadstica no paramtrica para diferencias entre dos o ms muestras


donde frecuencias esperadas son comparadas en relacin con frecuencias obtenidas.

Se utiliza para hacer comparaciones entre frecuencias y no entre valores medios.

137

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

Prueba No Paramtrica: procedimiento estadstico que no adopta ningn supuesto acerca


de cmo se distribuye la caracterstica bajo estudio en la poblacin, y que slo requiere
datos nominales u ordinales.
Estas medidas son importantes porque la mayora de la informacin en la investigacin
social y administrativa es de carcter nominal u ordinal, y porque no siempre estamos
seguros que la caracterstica que deseamos estudiar se distribuye normalmente en la
poblacin.

La prueba de significacin
se refiere esencialmente a la distincin entre frecuencias
esperadas y frecuencias obtenidas.

Las frecuencias esperadas


se refieren a los trminos de la hiptesis nula, segn la
cual la frecuencia relativa (o proporcin) se supone es la misma entre los dos grupos.
Hasta ahora se han mencionado formas de probar lo que se puede llamar hiptesis
paramtricas con relacin a una variable aleatoria, o sea que se ha supuesto que se
conoce la ley de probabilidad y se vieron pruebas de hiptesis que declaran valores para
los parmetros. En algunos casos se necesita probar si una variable o unos datos siguen
determinada distribucin de probabilidad, un mtodo para hacer esta prueba es el de
bondad de ajuste o ji-cuadrado.
La informacin debe estar presentada en un cuadro de distribucin de frecuencias. Sea m
el nmero de clases y nj el nmero de observaciones en cada clase (frecuencias
observadas). Se trata de comparar los valores o frecuencias observadas (n j ) con las
frecuencias que habra en cada grupo o clase o sea el valor esperado (e j ) si se cumple la
hiptesis nula (H0 ).
Las diferencias entre lo observado y lo esperado dan las discrepancias entre la teora y la
realidad. Si no hay diferencias, la realidad coincidir perfectamente con la teora y por el
contrario, si las diferencias son grandes indica que la realidad y la teora no se parecen.

Los pasos a seguir son:


Hiptesis
H0 : La variable tiene distribucin X con tales parmetros
H1 : La variable no tiene la distribucin X
La estadstica de trabajo es:
m

T =
j=l

( n je j )
ej

138

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

Donde:
nj : frecuencia observada en la muestra
ej : frecuencia esperada segn la distribucin terica
n: tamao de la muestra
Nota. El nmero de observaciones esperadas en cada clase debe ser mayor o igual a 5,
es decir, ej 5. Si esto no ocurre se unen las clases adyacentes hasta cumplir el requisito.
Al unir las clases se disminuirn los grados de libertad de la ji-cuadrado.

si T < x2

(l ,m,1)

no se rechaza lahipotesis nula( H 0 )

Una extensin de la prueba sobre la proporcin binomial ocurre cuando una realizacin
puede clasificarse en k posibles categoras en vez de dos (xito y fracaso). Esto puede
ocurrir en la eleccin de un individuo de un partido poltico (tricolor, amarillo, azul, otro), en
el tipo de delito por el cual un individuo es recluido (un delito de violencia, un delito de
cuello blanco, otro), por mencionar algunos ejemplos.
Supngase que en una muestra en particular se observa que ocurre un conjunto de
eventos posibles E1, E2, E3, , Ek (vase la tabla), con frecuencias o1, o2, o3, , ok,
denominadas frecuencias observadas, y que de acuerdo con las reglas de probabilidad,
se espera que ocurran con frecuencias e1, e2, e3, , ek, llamadas frecuencias esperadas.
En un escenario como el descrito arriba se desea saber si las frecuencias observadas
difieren significativamente de las frecuencias esperadas.
Evento

E1

E2

E3

Ek

Frecuencia observada

o1

o2

o3

ok

Frecuencias esperadas

e1

e2

e3

ek

El estadstico
(lase chi cuadrada) proporciona una medida de la discrepancia
existente entre la frecuencia observada y la frecuencia esperada, que est dada por:
2

x=

( o1e1 )
e1

( o2e2 )
e2

+ +

( ok e k )
ek

=
j1

( o je j )
ej

Donde, se la frecuencia total es n,


139

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

o j = e j=n
La hiptesis nula que se desea probar es
H0: p1=p10pk = pk0
Contra
H1: al menos una pj pj0 para j=1,,k,
Donde pj0 es la proporcin correspondiente a la j-sima categora.
Ntese que bajo H0 ej = n pj0.

Bajo la hiptesis nula, el estadstico

(ji-cuadrado) se distribuye aproximadamente

(k-1) y entonces se rechaza H0 al nivel de significancia si


.

excede el valor critico

EJEMPLOS:

Resolucin:
H0: La estatura de los empleados tiene distribucin normal
H1: La estatura de los empleados no tiene distribucin normal
Para hallar la estadstica de trabajo se utiliza la expresin 3.15. Para calcular la frecuencia
esperada es necesario obtener la probabilidad en cada intervalo y para esto se requiere el
promedio aritmtico y la desviacin estndar, que se obtienen con la informacin
suministrada por la muestra, los que respectivamente son: 68,42 y 4,4451.

p ( x <63.5 ) =p z <

63.568.42
=P ( Z<1.11 )=0.1335
4.4451

140

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

p ( 63.5< x< 69.5 )=P (1.11< Z <0.24 )=0.59481.1335=0.4613


p ( 69.5< x<72.5 )=P ( 0.24< Z< 0.92 )=0.82120.5948=0.2264
p ( x >72.5 ) =P ( Z> 0.92 )=lP ( Z< 0.92 )=10.8212=0.1788
La estadstica de trabajo es:
k

j1

( o je j )
ej

( 2926.7 )2 ( 7592.26 )2 ( 6845.28 )2 ( 2835.76 )2


=
+
+
+
=16.511
2.7
92.26
45.28
35.76

Con una confiabilidad del 95 por ciento, en una tabla de la distribucin chi-cuadrado y un
grado de libertad (nmero de clases: m=4, nmero de estimadores obtenidos a partir de la
muestra: k=2, promedio y desviacin estndar. Entonces m-k-1 = 1) se obtiene un valor
para Z de 3,84. El valor de la estadstica de trabajo est en la zona de rechazo de la
hiptesis nula (Figura 3.21), por lo tanto con una confiabilidad del 95 por ciento, se acepta
que la estatura de los empleados no tiene distribucin normal.

SOLUCION
141

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

H0; Los datos se ajustan a una distribucin binomial.


H1; Los datos no se ajustan a una distribucin binomial.
Para obtener los valores esperados se tiene que utilizar la formula de la
distribucin binomial:

(n x)

n Cx p q

, donde n en este ejercicio vale

5, p y q son las probabilidades respectivas de cara y sello en un solo


lanzamiento de la moneda. Para calcular el valor de p, se sabe que =np
en una distribucin binomial, por lo que = 5p.
Para la distribucin de frecuencias observada, la media del nmero de
caras es:
=

fx = (38 )( 0 )+ (144 ) (1 )+( 342 ) ( 2 ) +( 287 ) ( 3 ) +( 164 ) ( 4 ) +(25)(5) = 2470 =2.47


1000
1000
x

2.47
p= =
=0.494
Por lo tanto
. As pues, la distribucin binomial
5
5
x
(5 x)
ajustada viene dada por p(x) = 5 C x (0.494) (0.506)
.

Al seguir esta frmula se calcula la probabilidad de obtener caras, segn


el valor de la variable aleatoria. La probabilidad multiplicada por 1000 nos
dar el valor esperado. Se resumen los resultados en la tabla siguiente:
Nmero de caras
(x)

P(x caras)

Frecuencia
esperada

Frecuencia
observada

0.0332

33.2

38

0.1619

161.9

144

0.3162

316.2

342

0.3087

308.7

287

0.1507

150.7

164

0.0294

29.4

25

142

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

Para los grados de libertad el valor de m ser uno, ya que se tuvo que
estimar la media de la poblacin para poder obtener el valor de p y as
poder calcular los valores esperados.

Grados de libertad:
k 1m=611=4

Regla de decisin:
Si X2R 9.49 no se rechaza Ho.
Si X2R >9.49 se rechaza Ho.
Clculos:
k

x =
2

j1

( o je j )
ej

( 3833.2 )2 ( 144161.9 )2 ( 342316.2 )2 ( 287308.7 )2 (164150.7 )2 ( 2529.4 )2


+
+
+
+
+
=
33.2
161.9
316.2
308.7
150.7
29.4

INTERPRETACION

143

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

Como el 7.54 no es mayor a 9.49, no se rechaza H 0 y se concluye con


un = 0.05 que el ajuste de los datos a una distribucin binomial es
bueno.

Resolucin:

H0; La forma de la distribucin de los defectos es Poisson.


H1; La forma de la distribucin de los defectos no es Poisson.
La media de la distribucin Poisson propuesta en este ejemplo es
desconocida y debe estimarse a partir de los datos contenidos en la
muestra.
==

( 32 )( 0 )+ ( 15 )( 1 ) + ( 9 )( 2 ) +( 4)(3)
=0.75
60

A partir de la distribucin Poisson con parmetro 0.75, pueden calcularse


las probabilidades asociadas con el valor de x. Esto es la frmula de la
Poisson es:
P ( x )=

e e0.75 0.75 x
=
x!
x!

Con esta frmula se calculan las probabilidades, mismas que se


multiplican por 60 para obtener los valores esperados.
144

ESTADISTICA INFERENCIAL I

Nmero
defectos

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

de

Probabilidad

Frecuencia
esperada

Frecuencia
observada

0.472

28.32

32

0.354

21.24

15

0.133

7.98

3 ms

0.041

2.46

Puesto que la frecuencia esperada en la ltima celda es menor que 5, se


combinan las dos ltimas celdas.
Nmero
defectos

de

Frecuencia
esperada

Frecuencia
observada

28.32

32

21.24

15

2 ms

10.44

13

Los grados de libertad seran 3-1-1=1, debido a que la media de la


distribucin Poisson fue estimada a partir de los datos.

Regla de decisin:
Si X2R 3.84 no se rechaza Ho.
Si X2R >3.84 se rechaza Ho.
Clculos:
145

ESTADISTICA INFERENCIAL I

x =
2

( o je j )

j1

ej

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

( 3228.32 )2 ( 1521.24 )2 ( 1310.44 )2


=
+
+
=2.94
28.32
21.24
10.44

Como el 2.94 no es mayor a 3.84, no se rechaza H 0 y se concluye con


un = 0.05 que la distribucin de defectos en las tarjetas de circuito
impreso es Poisson.

5.7 APLICACIONES.
Para la ocurrencia de dos eventos, en la cual se desea observar si son dependientes o
independientes.
La distribucin ji cuadrada sirve para todas las inferencias sobre la variancia de una
poblacin.
Existen muchos problemas para los cuales los datos son categorizados y los resultados
expuestos en forma de conteos o cuentas.
Se pueden aplicar en: un conjunto de calificaciones de un examen final puede ser
representado como una distribucin de frecuencias. Estos valores son cuentas: l numero
de datos que caen en cada celda.
En una encuesta determinada se podra preguntar a unas personas si votaran por los
candidatos A, B o C, por lo general, los resultados se indican en una grfica que informa
acerca del nmero de votantes para cada categora posible.
Ejemplos:

Ejemplo:
El procedimiento para la prueba de hiptesis de proporciones es el siguiente:
146

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

Especifica la hiptesis nula y alternativa.

Hiptesis Nula:
Hiptesis Alternativa:

Donde
P = la proporcin de clientes con ingresos familiares anuales de $200,000 o ms.
2

Especfica el nivel de significacin, , permitido. Para una =0.05, el valor de tabla


de Z para una prueba de una sola cola es igual a 1.64.

Calcula el error estndar de la proporcin especificada en la hiptesis nula.

S p=

p (1 p)
n

Donde:
p = proporcin especificada en la hiptesis nula.
n = tamao de la muestra.
Por consiguiente:

S p=

0.60(10.60)
=0.0828
35

Calcula la estadstica de prueba:

z=

0.74290.60
=1.73
0.0828

147

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

La hiptesis nula se rechaza porque el valor de la Z calculada es mayor que el


valor crtico Z . El banco puede concluir con un 95 por ciento de confianza
que ms de un 60 por ciento de sus clientes tienen ingresos
familiares de $200,000 o ms. La administracin puede introducir el nuevo
paquete de servicios orientado a este grupo.

SOLUCION
El primer paso es calcular el error estndar de la proporcin utilizando el valor hipottico
del porcentaje que histricamente vota por el PRI:

0.950.05
= 0.0066
1100
p(1 p)
SE p =
=
n

Ahora slo es necesario construir el intervalo de confianza:

p0 1.96SE p
0.95 ( 1.960.0066 )=0.937 0.963

La proporcin de .87 de votos por el PRI en la encuesta no cae en la regin de


aceptacin, por lo tanto el presidente del PRI debe de preocuparse por que la tendencia
entre los votantes es a favorecer menos al PRI.
148

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

Probemos la hiptesis de que el porcentaje de microempresas cuyos dueos son


hombres captado por la ENAMIN es distinto de 88 por ciento.

Hiptesis Nula:
Hiptesis Alternativa:

S p=

0.88(10.88)
=0.0074
1948

z=

0.8390.88
=5.54
0.0074

La hiptesis nula se rechaza porque el valor de la Z calculada es menor que el valor


crtico Z de 1.96. Podemos concluir con un 95 por ciento de confianza
proporcin captada por la ENAMIN es estadsticamente distinta de 0.88.

que la

Resolucin:

149

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

Especifica el nivel de significacin de


una sola cola es de 1.64.

Estima el error estndar de la diferencia de las dos proporciones:

S p = p ( 1 p )
km

1
1
+
nH hM

. El valor crtico para la prueba de

Donde:

P=

n H P H + nM P M
nH +n M

PH = proporcin muestra de hombres (H)


PM = proporcin muestra de mujeres (M)
NH = tamao de muestra hombres
NM = tamao de muestra mujeres
Por lo tanto:

P=

45 ( .58 ) +71(.42)
=0.48
45+ 71

S p = .48 ( 1.48 )
km

( 451 + 711 )=0.10

Calcula de prueba estadstica:

Z=

( diferencia entre proporciones observadas )(diferencia entre proporciones H 0)


Sp
km

z=

( .58.42 )(0)
=1.60
.10

La hiptesis nula es aceptada porque el valor de la Z calculada es menor que el valor


crtico Z. La administracin no puede concluir con un 95 por ciento de confianza que la
proporcin de hombres que visita 9 o ms veces los Oxxo es mayor que la proporcin de
mujeres.

150

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

LINKOGRAFA Y BIBLIOGRAFIA
Estadstica descriptiva:
https://bibliotecadeinvestigaciones.wordpress.com/matematicas/estadistica-descriptivaconceptos-generales/
INFERENCIA ESTADISTICA
http://www.ub.edu/aplica_infor/spss/cap4-1.htm
David M. Levine, M. L. (2006). Estadstica para administracin, Cuarta edicin. Mxico:
PEARSON EDUCACIN.
Vargas Sabadas Antonio (1995) Estadstica descriptiva e inferencial, segunda edicin,
Mexico, Castilla-la mancha.

151

ESTADISTICA INFERENCIAL I

UNIDAD V.- PRUEBA DE HIPTESIS CON DOS


MUESTRAS Y VARIAS MUESTAS DE DATOS
CATEGRICOS.

http://es.slideshare.net/ekthordanielrg/82253086unidadivpruebasdehipotesiscondosmuestrasyvariasmuestrasdedatosnumericos
https://es.wikipedia.org/wiki/Wikipedia
David M. Levine, M. L. (2006). Estadstica para administracin, Cuarta edicin. Mxico:
PEARSON EDUCACIN.
Douglas A. Lind, W. G. (2008). Estadstica aplicada a los negocios y la economa. Mxico:
Mc Graw Hill
http://www.geociencias.unam.mx/~ramon/EstInf/Clase13.pdf
http://es.scribd.com/doc/106656471/Unidad-5-PRUEBAS-DE-HIPOTESIS-CON-DOSMUESTRAS
https://books.google.com.mx/books?id=2N09O8Oe0QC&pg=PA606&lpg=PA606&dq=PRUEBAS+DE+HIP
%C3%93TESIS+CON+DOS+MUESTRAS+Y+VARIAS+MUESTRAS+DE+DATOS+CATE
G
%C3%93RICOS&source=bl&ots=4zXqaHCRss&sig=AARK9a9gIt9VVb2nkLkdNmsaTRU&
hl=es419&sa=X&ei=NvYlVfmkLsSdgwTO0IHoAg&ved=0CDoQ6AEwBQ#v=onepage&q=PRUE
BAS%20DE%20HIP%C3%93TESIS%20CON%20DOS%20MUESTRAS%20Y
%20VARIAS%20MUESTRAS%20DE%20DATOS%20CATEG%C3%93RICOS&f=false

152

You might also like