Professional Documents
Culture Documents
INTRODUCCIN:
Una manera de hacer inferencia es haciendo una afirmacin acerca del valor que el
parmetro de la poblacin bajo estudio puede tomar. Esta afirmacin puede estar basada
en alguna creencia o experiencia pasada que ser contrastada con la evidencia que
nosotros obtengamos a travs de la informacin contenida en la muestra. Esto es a lo que
llamamos Prueba de Hiptesis
Una prueba de hiptesis comprende cuatro componentes principales:
Hiptesis Nula
Hiptesis Alternativa
Estadstica de Prueba
Regin de Rechazo
La Hiptesis Nula, denotada como H0 siempre especifica un solo valor del parmetro de la
poblacin si la hiptesis es simple o un conjunto de valores si es compuesta (es lo que
queremos desacreditar)
H 0 : =0
H 0 : 0
H 0 : 0
H 1 : =1 H 1 : > 0
H 1 : < 0 H 1 : 0
Como las conclusiones a las que lleguemos se basan en una muestra, hay posibilidades
de que nos equivoquemos.
Dos decisiones correctas son posibles:
ESTADISTICA INFERENCIAL I
Si
estadstica de prueba.
Si
la estadstica de prueba
Si
H 1: 0
ESTADISTICA INFERENCIAL I
Z prueba =
x
p0
n
p0 (1 p0 )
n
Donde
X= ocurrencias
n= observaciones
x
= proporcionde lamuestra
n
P0= proporcin propuesta
p0 (1p 0)
=desviacion estandar de la poblacion
n
102
ESTADISTICA INFERENCIAL I
n
100 >5
N
Se debe utilizar el factor finito de correccin
Z prueba =
x
p0
n
p0 (1 p0 ) N n
n
N 1
Posteriormente este valor es comparado con el valor de Z, obtenido a partir de una tabla
normal a un nivel de significacin seleccionado.
Como ocurri con la prueba de medias de una muestra, las pruebas de proporciones
pueden ser de una o dos colas.
El tipo de prueba refleja H1. Por ejemplo, hay tres posibilidades para H1:
H 1 : p> p0
H 1 : p< p0
H 1: p p0
La hiptesis nula es
H 1 : p=p 0
H 1 : p1= p 2
103
ESTADISTICA INFERENCIAL I
H 1 : p1 p2
H 1 : p1 > p2
H 1 : p1 < p2
La estimacin combinada de p se puede calcular de la siguiente manera:
p=
x 1+ x 2
n 1+ n2
Donde:
P= proporcin muestral
X1= numero de aciertos en la muestra 1
X2= numero de aciertos de la muestra 2
n1= numero de observaciones de la muestra 1
n2= numero de observaciones de la muestra 2
Este valor de p se utiliza para calcular el valor estadstico de prueba:
Z prueba =
x1
x
2
n1
n2
p(1p)
1
1
+
n1 n 2
EJEMPLOS:
Ejemplo 1:
104
ESTADISTICA INFERENCIAL I
Resolucin:
Los datos son:
n1= 20
n2= 20
x1= 18
x2=14
= 0.05
Las hiptesis son
H 0 : p1 =p 2
H 1 : p1 p2
Como se trata de una poblacin de hiptesis a dos colas se debe calcular
0.05
=
=0.025
2
2
Con lectura en la tabla para un rea de 0.025 le corresponde un valor z= 1.96
p=
x 1+ x 2 18+ 14
=
=0.8
n 1+ n2 20+20
Z prueba =
x1
x
2
n1
n2
p(1p)
1
1
+
n1 n 2
105
ESTADISTICA INFERENCIAL I
Z prueba =
18
14
20
20
0.8 (10.8)
( 201 + 201 )
= 1.58
Solucion:
H 0 : p1 =p 2
106
ESTADISTICA INFERENCIAL I
H 1 : p1 p2
Como se trata de una poblacin de hiptesis a dos colas se debe calcular
0.05
=
=0.025
2
2
Con lectura en la tabla para un rea de 0.025 le corresponde un valor z= 1.96
Calculando zprueba se obtiene:
Z prueba =
Z prueba =
x1
x
2
n1
n2
p(1p)
1
1
+
n1 n 2
0.200.30 0.10
=
=1.15
0.087
0.087
El valor calculado para z,-1.15, est en la regin de aceptacin de la hiptesis nula. Por
tanto, no se puede rechazar la hiptesis de que no hay diferencia en la proporcin de
televidentes en las dos comunidades.
Solucin;
107
ESTADISTICA INFERENCIAL I
H 0 si>+1.645
Rechazar
Z prueba =
Z prueba =
x1
x
2
n1
n2
p(1p)
1
1
+
n1 n 2
0.050.1
=1.107
0.05
108
ESTADISTICA INFERENCIAL I
H 0 : p= p0
H 1 : p1= p 0
Se distribuye normal estndar.
Regla de decisin: se determina de acuerdo a la hiptesis alternativa (si es bilateral o
unilateral). En el caso de muestras pequeas se utiliza la distribucin Binomial.
Diferencia entre las proporciones de dos poblaciones
La situacin ms frecuente es suponer que existen diferencias entre las proporciones de
dos poblaciones, para ello suelen enunciarse las hiptesis de forma similar al caso de las
medias: Puede la hiptesis alternativa enunciarse unilateralmente.
Cuando se tienen dos poblaciones y se han tomado muestras aleatorias de tamaos n 1 y
n2, para observar una caracterstica o cualidad, se puede comparar el comportamiento de
dicha caracterstica en las poblaciones a travs de la diferencia de proporciones.
Hiptesis
Como en los casos anteriores se puede plantear uno de los siguientes tres tipos de
hiptesis:
-
H 0 : 1= 2 H 0 : 1 2=K
H 1 : 1 2 H 1 : 1 2 K
H 0 : 1= 2 H 0 : 1 2 K
H 1 : 1 > 2 H 1 : 1 2 > K
109
ESTADISTICA INFERENCIAL I
H 0 : 1= 2 H 0 : 1 2 K
H 1 : 1 < 2 H 1 : 1 2 < K
Z
P1P2=
( P1P 2) ( 1 2 )
N ( 0,1 )
P1 q1 P1 q 2
+
n1
n2
Regla de decisin:
Como en los casos anteriores depende del tipo de hiptesis que se haya planteado.
-
Z 2 y Z 12
<
Z 12
Z 2 < Z
p1-
no se rechaza H0 .
-
110
ESTADISTICA INFERENCIAL I
Z 12
Z 12
Z 12 no se rechaza H .
0
EJEMPLOS
Ejemplo 1:
Resolucin:
H 0 : =0.05
H 1 : >0.05
0 ( 1H 0 )
n
111
ESTADISTICA INFERENCIAL I
0.0475
= 0.000475=0.022
100
( 0.05 )( 0.95 )
=
100
z=
p 0 100.05 0.05
=
=
=+2.27
p
0.022
0.022
El valor calculado de z es de +2.27 el cual es mayor que el valor crtico de+1.645 de esta
prueba de cola superior. Por lo tanto, con 10 partes de 100detectadas como defectuosas,
la hiptesis de que la proporcin de partes defectuosas de la poblacin es de o inferior a .
05 se rechaza, con el uso en la prueba del nivel de significancia de 5%
Solucin:
H 0 : ( 1 2) =0
H 1 : ( 1 2 ) 0
Donde el valor critico es 2.58
z=
0.99
=2.58
2.495
=0.01
112
ESTADISTICA INFERENCIAL I
p1 p
2=
( 1 ) ( 1 )
+
n1
n2
Z=
p 1 p 2 0.200.30 .10
=
=
=1.15
1 p2
p
0.087
0.087
Solucin:
H 0 : ( 1 2) =0
113
ESTADISTICA INFERENCIAL I
H 1 : ( 1 2 ) > 0
( =0.05 ) =+1.645
Z critica
=
p1 p
2=
( 1 ) ( 1 )
+
n1
n2
Z=
p 1 p 2 0.100.75 0.025
=
=
=+0.49
1 p2
p
0.051
0.051
El valor calculado de z de +.49 no es mayor que +1.645 en esta prueba decola superior.
Por tanto, la hiptesis nula no puede ser rechazada al nivel de significancia de 5%
114
ESTADISTICA INFERENCIAL I
p=
x 1+ x 2 + x 3+ xn
n1 +n2 +n3 + n n
En una muestra se puede dar un conjunto de sucesos, los cuales ocurren con frecuencias
observadas "o"(las que se observa directamente) y frecuencias esperadas o tericas "e"
(las que se calculan de acuerdo a las leyes de probabilidad).
e= pototal
Donde:
P= proporcin muestral
115
ESTADISTICA INFERENCIAL I
2prueba
2prueba
( o1e1 )
e1
( oiei )
( o 2e 2 )
e2
( o 3e 3 )
e3
( o ne n )
en
ei
Donde:
X: es la letra griega ji
X2: se lee ji cuadrado
Por lo tanto el valor estadstico de prueba para este caso es la prueba ji cuadrado o
conocida tambin como chi cuadrado.
Como sucede con las distribuciones t y F, la distribucin ji cuadrado tiene una forma que
depende del nmero de grados de libertad asociados a un determinado problema.
Para obtener un valor crtico (valor que deja un determinado porcentaje de rea en la
cola) a partir de una tabla de ji cuadrado, se debe seleccionar un nivel de significacin y
determinar los grados de libertad para el problema que se est resolviendo.
116
ESTADISTICA INFERENCIAL I
Los grados de libertas sin una funcin del numero de casillas de 2* k. Es decir, los grados
de libertas reflejan el tamao de la tabla. Los grades de libertas de la columna son el
numero de filas (categoras) menos 1, o bien r-1. Los grados de libertas de cada fila es
igual al numero de columnas (muestras) menos 1, o bien, k-1. El efecto neto es que el
numero de grados de libertad para la tala es el producto de (numero de fialas-1) por
(numero de columnas -1), o bien, (r-1) (k-1). Por lo tanto con 2 filas y 4 columnas. Los
grades de libertad son (2-1) (4-1)=3.
2prueba
con el
2tabla
. Si el valor
estadstico de prueba es menor que el valor tabular, la hiptesis nula es aceptada, caso
contrario, H0 es rechazada.
x2
prueba
x2
tabla
117
ESTADISTICA INFERENCIAL I
EJEMPLOS:
EJEMPLO 1
Resolucin:
Los grados de libertad se calculan aplicando la frmula:
GL=( r1 ) ( k 1 )
( 31 ) ( 41 )
12
0.995
0.990
0.975
0.950
0.900
0.750
0.500
0.250
0.100
0.050
0.025
0.010
0.005
0.10
2
0.57
5
1.21
3
1.92
3
2.67
5
3.45
5
4.25
5
5.07
1
5.89
9
2.706
3.841
5.024
6.635
7.879
0.02
0
0.115
0.01
6
0.211
1.323
0.01
0
0.07
2
0.20
7
0.41
2
0.67
6
0.98
9
1.34
4
1.73
5
0.00
4
0.10
3
0.35
2
0.711
0.455
0.00
1
0.05
1
0.21
6
0.48
4
0.83
1
1.23
7
1.69
0
2.18
0
2.70
0
1.386
2.773
4.605
5.991
7.378
9.210
10.597
2.366
4.108
6.251
7.815
9.348
11.345
12.838
3.357
5.385
7.779
9.488
11.143
14860
4.351
6.626
9.236
11.070
5.348
7.841
6.346
9.037
7.344
10.21
9
11.389
10.64
5
12.01
7
13.36
2
14.68
4
12.59
2
14.06
7
15.50
7
16.91
9
12.83
3
14.44
9
16.01
3
17.53
5
19.02
3
13.27
7
15.08
6
16.81
2
18.47
5
20.09
0
20.66
6
3
4
5
6
7
8
9
0.97
0.55
4
0.87
2
1.23
9
1.64
6
2.08
8
1.14
5
1.63
5
2.16
7
2.73
3
3.32
5
0.58
4
1.06
4
1.61
0
2.20
4
2.83
3
3.49
0
4.16
8
8.343
118
16.750
18.548
20.278
21.955
23.589
ESTADISTICA INFERENCIAL I
1
0
11
1
2
2.15
6
2.55
8
3.24
7
3.94
0
4.86
5
6.73
7
9.342
12.54
9
15.98
7
18.30
7
20.48
3
23.20
9
25.188
2.60
3
3.07
4
3.05
3
3.57
1
3.81
6
4.40
4
4.57
5
5.22
6
5.57
8
6.30
4
7.58
4
8.43
8
10.34
1
11.340
13.70
1
14.84
5
17.27
5
18.54
9
19.67
5
21.02
6
21.92
0
23.33
7
24.72
5
26.21
7
26.757
x 2 =21.026 ,
tabla
Resolucin:
Datos:
r=2
k=6
Las hiptesis son:
H0: Todas las proporciones de la poblacin son iguales
H1: No todas las proporciones de la poblacin son iguales
GL=( 21 ) ( 61 ) =5
119
28.300
ESTADISTICA INFERENCIAL I
0.990
0.975
0.950
0.900
0.750
0.500
0.250
0.100
0.050
0.025
0.010
0.005
3.841
5.024
6.635
7.879
1.386
2.773
4.605
5.991
7.378
9.210
2.366
4.108
6.251
7.815
9.348
3.357
5.385
7.779
9.488
4.351
6.626
9.236
5.348
7.841
6.346
9.037
7.344
10.21
9
11.38
9
12.54
9
10.64
5
12.01
7
13.36
2
14.68
4
15.98
7
11.07
0
12.59
2
14.06
7
15.50
7
16.91
9
18.30
7
11.14
3
12.83
3
14.44
9
16.01
3
17.53
5
19.02
3
20.48
3
11.34
5
13.27
7
15.08
6
16.81
2
18.47
5
20.09
0
20.66
6
23.20
9
10.59
7
12.83
8
14860
0.55
4
0.87
2
1.23
9
1.64
6
2.08
8
2.55
8
0.10
2
0.57
5
1.21
3
1.92
3
2.67
5
3.45
5
4.25
5
5.07
1
5.89
9
6.73
7
2.706
0.02
0
0.11
5
0.97
0.01
6
0.21
1
0.58
4
1.06
4
1.61
0
2.20
4
2.83
3
3.49
0
4.16
8
4.86
5
1.323
0.01
0
0.07
2
0.20
7
0.41
2
0.67
6
0.98
9
1.34
4
1.73
5
2.15
6
0.00
4
0.10
3
0.35
2
0.71
1
1.14
5
1.63
5
2.16
7
2.73
3
3.32
5
3.94
0
0.455
0.00
1
0.05
1
0.21
6
0.48
4
0.83
1
1.23
7
1.69
0
2.18
0
2.70
0
3.24
7
2.60
3
3.05
3
3.81
6
4.57
5
5.57
8
7.58
4
10.34
1
13.70
1
17.27
5
19.67
5
21.92
0
24.72
5
26.75
7
3.07
4
3.57
1
4.40
4
5.22
6
6.30
4
8.43
8
11.34
0
14.84
5
18.54
9
21.02
6
23.33
7
26.21
7
28.30
0
3
4
5
6
7
8
9
1
0
1
1
1
2
8.343
9.342
16.75
0
18.54
8
20.27
8
21.95
5
23.58
9
25.18
8
x 2 =15.086
tabla
Calculando
2prueba
2prueba
x2
x
prueba
2prueba
x2
prueba
( oiei )
se obtiene:
2
ei
ESTADISTICA INFERENCIAL I
H0 es aceptada, ya que
2prueba
(6.6)
es menor que
2tala
Resolucin:
Datos:
121
ESTADISTICA INFERENCIAL I
n= 500
p=
15
=0.033
500
z (0.90)=1.645
P p z
( 0.03 ) ( 0.97 )
pq
=0.03 ( 1.645 )
n
500
0.0237
0.0237< p<0.0376
Se sabe que con un nivel de confianza del 90% que la proporcin de discos
defectuosos que no pasan la pruea en esa poblacion esta entre 0.0237y 0.0376
H 0 : Ay B son independientes
H 1 : Ay B no son independientes
122
ESTADISTICA INFERENCIAL I
no
total
Si
p11
p12
p1
No
p21
p22
p2
Total
p1
p2
(B)
Se
sabe
que, para que dos sucesos sean independientes, la probabilidad de que ocurran ambos a
la vez debe ser igual al producto de las probabilidades de que cada suceso ocurra
individualmente.
p [ AyB ] = p [ A ] p [ B ]
p11= p1 p1
La relacin debe cumplirse para cada celda. Por tanto, la hiptesis nula de independencia
se expresa matemticamente como:
I= 1,2
H0: p ij = pi*p*j
j=1,2
I= 1,2
H1: p ij = pi*p*j
j= 1,2
Comparamos el nmero de observaciones en cada celda con el nmero esperado, si H 0
es cierta. Si estos nmeros difieren poco, no hay razn para rechazar H 0; si hay una gran
discrepancia entre los valores observados y esperados, entendemos esto como evidencia
de que H0 no es cierta. Entonces se calcula el valor esperado as:
123
ESTADISTICA INFERENCIAL I
Eij =npij
E11 =
La pregunta es la siguiente: son estas diferencias demasiado grandes como para que se
deban nicamente al azar?
Para responderla necesitamos un estadstico cuya distribucin de probabilidad sea
conocida bajo la hiptesis de que H0 es cierta. El estadstico en cuestin es:
x =
21
( nij E y )
y
E
Ejercicios propuestos
124
ESTADISTICA INFERENCIAL I
11 = n 1 n1 = 425(200) =170
E
n
500
12= n1 n2 = 425 (300 ) =225
E
n
500
21= n2 n1 = 75( 200) =30
E
n
500
22= n2 n2 = 75( 300) =45
E
n
500
Para saber si las diferencias entre valores halladoz y valores esperados es
significativa entonces aplicamos el estadistico ji-cuadrado:
125
ESTADISTICA INFERENCIAL I
( nij E y )
=
y
E
2
x =
1
+
+
+
=4.18
170
255
30
45
P=P [ x 2 4.18 ]
1
P=P [ x 2 3.48 ] y
1
Como 4.18 est entre 3.84 y 5.02, el valor p est entre 0.025 (0.975) 0.05
(0.950). El valor p es pequeo, es menor de 0.05. Podemos rechazar H 0 y
concluir que la sobretalla y el xito en las clases no son independientes.
Resolucin:
Debemos primero calcular las frecuencias esperaas bajo el supuesto de
independencia. La tabla de frecuencias esperadas sera:
Deportista
No deportista
Sin depresin
32.43
36.57
69
Con depresin
14.57
16.43
31
47
53
100
126
ESTADISTICA INFERENCIAL I
( nij E y )
=
y
E
2
x =
1
+
+
+
=5.82
32.43
14.57
36.57
16.43
Este valor debemos compararlo con el percentil de la distribucin
1) (2-1)=1 grado de libertad x
20.95
(1)=3.84 .
x2
con (2-
Resolucin:
Sexo
Del
entrevistado
Total
Hombre
Mujer
Salud 2
EX+MB+B
139
124
263
R+M
42
61
103
Total
181
185
366
127
ESTADISTICA INFERENCIAL I
e 21=
n 2n1 185263
=
=132.94
n
366
( nij E y )
=
y
E
2
x =
1
ESTADISTICA INFERENCIAL I
) se utiliza principalmente:
Para probar si una serie de datos observada, concuerda con el modelo (serie esperada) de la
informacin.
Para probar las diferencias entre las proporciones de varios grupos (tabla de contingencia).
H 0= p1= p2 =p 3 =p k
H1: al menos dos proporciones son diferentes.
2
3
4
E y=
x 2=
usando la frmula:
( Oij Eij )
Ey
Donde:
Oij = Valor observado de la celda i,j.
129
ESTADISTICA INFERENCIAL I
gl=(r1)(c1)
Donde:
r = nmero de renglones
c = nmero de columnas
6
7
En muchas ocasiones, los n elementos de una muestra tomada de una poblacin pueden
clasificarse con dos criterios diferentes. Por tanto, es interesante saber si los dos mtodos
de clasificacin son estadsticamente independientes. Supngase que el primer mtodo
de clasificacin tiene r niveles, y que el segundo tiene c niveles. O sea Oij la frecuencia
observada para el nivel i del primer mtodo de clasificacin y el nivel j del segundo
mtodo de clasificacin. En general, los datos aparecern como se muestra en la
siguiente tabla. Una tabla de este tipo usualmente se conoce como tabla de contingencia r
x c.
Ejercicios propuestos:
Resolucin:
H0 : p1 = p2 = p3
H1 : Al menos dos proporciones son diferentes.
130
ESTADISTICA INFERENCIAL I
Los valores Oij = 135, 110... Corresponden a los valores observados, los valores
esperados se colocan en las celdas con parntesis, para calcular los utilizamos la
frmula:
E y=
Numero
ausencias
0-3
de
4-6
7-45
Total
Aprobado
No aprobado
Total
135
(147)
36
(24)
9
(9)
180
110
(98)
4
(16)
6
(6)
120
245
40
15
300
usando la frmula:
( Oij Eij )
Ey
Oij
135
110
36
4
9
6
Eij
147
98
24
16
9
6
(Oij Eij)2
144
144
144
144
0
0
(Oij Eij)2/Eij
0.98
1.47
6.00
9.00
0.00
0.00
17.45
gl=(r1)(c1)
gl=( 31 ) ( 21 ) =2
131
ESTADISTICA INFERENCIAL I
x 2=
17.44.
Como este estadstico est localizado en la regin de rechazo (a la derecha del valor
crtico), rechazamos Ho por lo cual aceptamos la hiptesis alternativa H1: al menos dos
proporciones son diferentes. La tasa de aprobacin si depende de las asistencias.
Resolucin
Ho; La satisfaccin en el trabajo y el rango son independientes.
H1; La satisfaccin en el trabajo y el rango son dependientes.
Grados de libertad:
gl=(r1)(c1)
gl=( 31 ) ( 41 ) =6
132
ESTADISTICA INFERENCIAL I
Regla de decisin:
Si X2R
Rango
Instructor
Satisfaccin
en el
trabajo
Profesor
Profesor
asistente
asociado
Profesor
Total
Mucha
40
60
52
63
215
Regular
78
87
82
88
335
Poca
57
63
66
64
250
Total
175
210
200
215
800
ESTADISTICA INFERENCIAL I
Satisfaccin
Mucha
Regular
Poca
Total
Instructor
Profesor
Profesor
Profesor
Total
asistente
asociado
40
60
52
63
215
(47.03)
(56.44)
(53.75)
(57.78)
78
87
82
88
(73.28)
(87.94)
(83.75)
(90.03)
57
63
66
64
(54.69)
(65.62)
(62.50)
(67.19)
175
210
200
215
335
250
800
Los valores entre parntesis son los esperados, los que no se calcularon, por frmulas se
obtuvieron por diferencia con respecto a los totales.
( nij E y )
=
y
E
x2 =
+
+
+
=2.75
47.03
56.44
53.75
67.19
Como el valor de 2.75 es menor que el de tabla 12.592, por lo tanto no se rechaza Ho y
se concluye con un =0.05 que la satisfaccin en el trabajo y el rango son independientes.
134
ESTADISTICA INFERENCIAL I
solucin:
gl=( 21 ) ( 31 ) =2
Regla de decisin:
Si X2R
135
ESTADISTICA INFERENCIAL I
Se proceder a calcular los valores esperados de cada celda. Como los grados de libertad
son 2, esto quiere decir que necesitamos calcular nicamente 2 frecuencias esperadas, y
las faltantes se encuentran por diferencia.
Se calcularn los valores esperados E11, y E22.
Como se necesitan los totales de rengln y columna se mostrarn en la tabla:
Matutino
Vespertino
Nocturno
Total
45
55
70
170
No defectuosos
905
890
870
2665
Total
950
945
940
2835
Defectuoso
s
Vespertino
Nocturno
Total
45
55
70
(57.0)
(56.7)
(56.3)
905
890
870
(893.0)
(888.3)
(883.7)
950
945
940
Matutino
Defectuoso
s
No defectuosos
Total
170
2665
2835
136
ESTADISTICA INFERENCIAL I
( nij E y )
=
y
E
x2 =
Si se busca este valor dentro de la tabla de ji-cuadrada con 2 grados de libertad nos dar
un valor de P aproximado a 0.04. Si se observa el valor de la ji-cuadrada calculada de
6.29 con el valor de tabla de 7.378, se llega a la decisin de no rechazar Ho. Sin embargo
sera riesgoso concluir que la proporcin de defectuosos producidos es la misma para
todos los turnos por tener un valor de P de 0.04.
137
ESTADISTICA INFERENCIAL I
La prueba de significacin
se refiere esencialmente a la distincin entre frecuencias
esperadas y frecuencias obtenidas.
T =
j=l
( n je j )
ej
138
ESTADISTICA INFERENCIAL I
Donde:
nj : frecuencia observada en la muestra
ej : frecuencia esperada segn la distribucin terica
n: tamao de la muestra
Nota. El nmero de observaciones esperadas en cada clase debe ser mayor o igual a 5,
es decir, ej 5. Si esto no ocurre se unen las clases adyacentes hasta cumplir el requisito.
Al unir las clases se disminuirn los grados de libertad de la ji-cuadrado.
si T < x2
(l ,m,1)
Una extensin de la prueba sobre la proporcin binomial ocurre cuando una realizacin
puede clasificarse en k posibles categoras en vez de dos (xito y fracaso). Esto puede
ocurrir en la eleccin de un individuo de un partido poltico (tricolor, amarillo, azul, otro), en
el tipo de delito por el cual un individuo es recluido (un delito de violencia, un delito de
cuello blanco, otro), por mencionar algunos ejemplos.
Supngase que en una muestra en particular se observa que ocurre un conjunto de
eventos posibles E1, E2, E3, , Ek (vase la tabla), con frecuencias o1, o2, o3, , ok,
denominadas frecuencias observadas, y que de acuerdo con las reglas de probabilidad,
se espera que ocurran con frecuencias e1, e2, e3, , ek, llamadas frecuencias esperadas.
En un escenario como el descrito arriba se desea saber si las frecuencias observadas
difieren significativamente de las frecuencias esperadas.
Evento
E1
E2
E3
Ek
Frecuencia observada
o1
o2
o3
ok
Frecuencias esperadas
e1
e2
e3
ek
El estadstico
(lase chi cuadrada) proporciona una medida de la discrepancia
existente entre la frecuencia observada y la frecuencia esperada, que est dada por:
2
x=
( o1e1 )
e1
( o2e2 )
e2
+ +
( ok e k )
ek
=
j1
( o je j )
ej
ESTADISTICA INFERENCIAL I
o j = e j=n
La hiptesis nula que se desea probar es
H0: p1=p10pk = pk0
Contra
H1: al menos una pj pj0 para j=1,,k,
Donde pj0 es la proporcin correspondiente a la j-sima categora.
Ntese que bajo H0 ej = n pj0.
EJEMPLOS:
Resolucin:
H0: La estatura de los empleados tiene distribucin normal
H1: La estatura de los empleados no tiene distribucin normal
Para hallar la estadstica de trabajo se utiliza la expresin 3.15. Para calcular la frecuencia
esperada es necesario obtener la probabilidad en cada intervalo y para esto se requiere el
promedio aritmtico y la desviacin estndar, que se obtienen con la informacin
suministrada por la muestra, los que respectivamente son: 68,42 y 4,4451.
p ( x <63.5 ) =p z <
63.568.42
=P ( Z<1.11 )=0.1335
4.4451
140
ESTADISTICA INFERENCIAL I
j1
( o je j )
ej
Con una confiabilidad del 95 por ciento, en una tabla de la distribucin chi-cuadrado y un
grado de libertad (nmero de clases: m=4, nmero de estimadores obtenidos a partir de la
muestra: k=2, promedio y desviacin estndar. Entonces m-k-1 = 1) se obtiene un valor
para Z de 3,84. El valor de la estadstica de trabajo est en la zona de rechazo de la
hiptesis nula (Figura 3.21), por lo tanto con una confiabilidad del 95 por ciento, se acepta
que la estatura de los empleados no tiene distribucin normal.
SOLUCION
141
ESTADISTICA INFERENCIAL I
(n x)
n Cx p q
2.47
p= =
=0.494
Por lo tanto
. As pues, la distribucin binomial
5
5
x
(5 x)
ajustada viene dada por p(x) = 5 C x (0.494) (0.506)
.
P(x caras)
Frecuencia
esperada
Frecuencia
observada
0.0332
33.2
38
0.1619
161.9
144
0.3162
316.2
342
0.3087
308.7
287
0.1507
150.7
164
0.0294
29.4
25
142
ESTADISTICA INFERENCIAL I
Para los grados de libertad el valor de m ser uno, ya que se tuvo que
estimar la media de la poblacin para poder obtener el valor de p y as
poder calcular los valores esperados.
Grados de libertad:
k 1m=611=4
Regla de decisin:
Si X2R 9.49 no se rechaza Ho.
Si X2R >9.49 se rechaza Ho.
Clculos:
k
x =
2
j1
( o je j )
ej
INTERPRETACION
143
ESTADISTICA INFERENCIAL I
Resolucin:
( 32 )( 0 )+ ( 15 )( 1 ) + ( 9 )( 2 ) +( 4)(3)
=0.75
60
e e0.75 0.75 x
=
x!
x!
ESTADISTICA INFERENCIAL I
Nmero
defectos
de
Probabilidad
Frecuencia
esperada
Frecuencia
observada
0.472
28.32
32
0.354
21.24
15
0.133
7.98
3 ms
0.041
2.46
de
Frecuencia
esperada
Frecuencia
observada
28.32
32
21.24
15
2 ms
10.44
13
Regla de decisin:
Si X2R 3.84 no se rechaza Ho.
Si X2R >3.84 se rechaza Ho.
Clculos:
145
ESTADISTICA INFERENCIAL I
x =
2
( o je j )
j1
ej
5.7 APLICACIONES.
Para la ocurrencia de dos eventos, en la cual se desea observar si son dependientes o
independientes.
La distribucin ji cuadrada sirve para todas las inferencias sobre la variancia de una
poblacin.
Existen muchos problemas para los cuales los datos son categorizados y los resultados
expuestos en forma de conteos o cuentas.
Se pueden aplicar en: un conjunto de calificaciones de un examen final puede ser
representado como una distribucin de frecuencias. Estos valores son cuentas: l numero
de datos que caen en cada celda.
En una encuesta determinada se podra preguntar a unas personas si votaran por los
candidatos A, B o C, por lo general, los resultados se indican en una grfica que informa
acerca del nmero de votantes para cada categora posible.
Ejemplos:
Ejemplo:
El procedimiento para la prueba de hiptesis de proporciones es el siguiente:
146
ESTADISTICA INFERENCIAL I
Hiptesis Nula:
Hiptesis Alternativa:
Donde
P = la proporcin de clientes con ingresos familiares anuales de $200,000 o ms.
2
S p=
p (1 p)
n
Donde:
p = proporcin especificada en la hiptesis nula.
n = tamao de la muestra.
Por consiguiente:
S p=
0.60(10.60)
=0.0828
35
z=
0.74290.60
=1.73
0.0828
147
ESTADISTICA INFERENCIAL I
SOLUCION
El primer paso es calcular el error estndar de la proporcin utilizando el valor hipottico
del porcentaje que histricamente vota por el PRI:
0.950.05
= 0.0066
1100
p(1 p)
SE p =
=
n
p0 1.96SE p
0.95 ( 1.960.0066 )=0.937 0.963
ESTADISTICA INFERENCIAL I
Hiptesis Nula:
Hiptesis Alternativa:
S p=
0.88(10.88)
=0.0074
1948
z=
0.8390.88
=5.54
0.0074
que la
Resolucin:
149
ESTADISTICA INFERENCIAL I
S p = p ( 1 p )
km
1
1
+
nH hM
Donde:
P=
n H P H + nM P M
nH +n M
P=
45 ( .58 ) +71(.42)
=0.48
45+ 71
S p = .48 ( 1.48 )
km
Z=
z=
( .58.42 )(0)
=1.60
.10
150
ESTADISTICA INFERENCIAL I
LINKOGRAFA Y BIBLIOGRAFIA
Estadstica descriptiva:
https://bibliotecadeinvestigaciones.wordpress.com/matematicas/estadistica-descriptivaconceptos-generales/
INFERENCIA ESTADISTICA
http://www.ub.edu/aplica_infor/spss/cap4-1.htm
David M. Levine, M. L. (2006). Estadstica para administracin, Cuarta edicin. Mxico:
PEARSON EDUCACIN.
Vargas Sabadas Antonio (1995) Estadstica descriptiva e inferencial, segunda edicin,
Mexico, Castilla-la mancha.
151
ESTADISTICA INFERENCIAL I
http://es.slideshare.net/ekthordanielrg/82253086unidadivpruebasdehipotesiscondosmuestrasyvariasmuestrasdedatosnumericos
https://es.wikipedia.org/wiki/Wikipedia
David M. Levine, M. L. (2006). Estadstica para administracin, Cuarta edicin. Mxico:
PEARSON EDUCACIN.
Douglas A. Lind, W. G. (2008). Estadstica aplicada a los negocios y la economa. Mxico:
Mc Graw Hill
http://www.geociencias.unam.mx/~ramon/EstInf/Clase13.pdf
http://es.scribd.com/doc/106656471/Unidad-5-PRUEBAS-DE-HIPOTESIS-CON-DOSMUESTRAS
https://books.google.com.mx/books?id=2N09O8Oe0QC&pg=PA606&lpg=PA606&dq=PRUEBAS+DE+HIP
%C3%93TESIS+CON+DOS+MUESTRAS+Y+VARIAS+MUESTRAS+DE+DATOS+CATE
G
%C3%93RICOS&source=bl&ots=4zXqaHCRss&sig=AARK9a9gIt9VVb2nkLkdNmsaTRU&
hl=es419&sa=X&ei=NvYlVfmkLsSdgwTO0IHoAg&ved=0CDoQ6AEwBQ#v=onepage&q=PRUE
BAS%20DE%20HIP%C3%93TESIS%20CON%20DOS%20MUESTRAS%20Y
%20VARIAS%20MUESTRAS%20DE%20DATOS%20CATEG%C3%93RICOS&f=false
152