Professional Documents
Culture Documents
Contenidos
I Hipotesis para la diferencia entre las medias de dos poblaciones:
muestras pareadas
I Hipotesis para la diferencia entre las medias de dos poblaciones:
muestras independientes
I Dos poblaciones normales con varianzas iguales (y desconocidas)
I Dos poblaciones normales con varianzas conocidas
I Dos poblaciones no normales y muestras grandes
I Dos poblaciones Bernoulli
I Hipotesis para la razon de las varianzas de dos poblaciones:
muestras independientes
Tema 3. Comparaciones de dos poblaciones
Objetivos de aprendizaje
Al finalizar este tema, debieras ser capaz de:
I Llevar a cabo un contraste de hipotesis para la diferencia de las
medias y para el cociente de las varianzas de dos poblaciones
I Construir intervalos de confianza para la diferencia o el cociente
I Diferenciar las situaciones en las que un contraste basado en
muestras pareadas es adecuado, de aquellas en las que se debe
aplicar un contraste basado en muestras independientes
I Calcular la potencia de un contraste y la probabilidad de un error de
Tipo II
Tema 3. Comparaciones de dos poblaciones
Referencias
I Newbold, P. Estadstica para administracion y economa
I Captulo 9 (9.6-9.9)
I Ross, S. Introduccion a la Estadstica
I Captulo 10
Introduccion
producto: i 1 2 3 4 5 6 7 8 9 10
recuerdo fuerte: xi 137 135 83 125 47 46 114 157 57 144
recuerdo debil: yi 53 114 81 86 34 66 89 113 88 111
dif.: di = xi yi 84 21 2 39 13 20 25 44 31 33
Contrastes para la diferencia entre dos medias: muestras
pareadas
I Sea X una poblacion con media X e Y otra poblacion con media
Y .
I Disponemos de una muestra aleatoria de n observaciones pareadas
de ambas poblaciones, {(Xi , Yi )}. Denotaremos como
d1 = x1 y1 , d2 = x2 y2 , . . . , dn = xn yn
'
Muestra: d =
MAS: n = 10
210
10 = 21
14202210(21)2
D0 = 0
d = 21
t =
n = 10
sd = 1088 = 32.98
d D0
sd2 = 101 = 1088 sd / n
21
Objetivo: contrastar = = 2.014
32.98/ 10
D0
z}|{
H0 : X Y 0 frente a H1 : X Y > 0
(Contraste unilateral)
Contrastes para la diferencia entre dos medias: muestras
pareadas
Ejemplo: cont.
p-valor = P(T 2.014)
(0.025, 0.05) ya que
t9;0.05 t9;0.025
z }| { z }| { t=
1.833 < 2.014 < 2.262
2.014
Por tanto, como p-valor < = 0.05, pvalor
rechazamos la hipotesis nula a este =area
nivel.
Densidad tn1
||
1.833 2.262
Conclusion: La evidencia muestral apoya que en promedio la actividad cerebral
es mayor para el grupo con recuerdo fuerte que para el grupo con recuerdo
debil. Si la actividad cerebral promedio fuese igual para ambos grupos, la
probabilidad de obtener muestras tan extremas o mas que la observada estara
entre 0.025 y 0.05 (un valor bajo).
Contrastes para la diferencia entre dos medias: muestras
pareadas
Ejemplo: cont. En Excel: Ir al menu Datos, submenu Analisis de
datos, seleccionar la opcion: Prueba t para medias de dos muestras
emparejadas
Columnas A y B (datos), en amarillo se muestran el valor observado del
estadstico y el p-valor.
Contraste bilateral para la diferencia entre dos medias via
IC: muestras pareadas
X Y D0
T = q H0 tn1 +n2 2
sp n11 + n12
donde el estimador de la varianza comun para las dos poblaciones es
(n1 1)sX2 + (n2 1)sY2
sp2 =
n1 + n2 2
Nota: grados de libertad = n1 + n2 2 (numero de observaciones de
las muestras menos dos - por tener que estimar X y Y )
I La region de rechazo (para un nivel de significacion ) es:
RR = {t : t < tn1 +n2 2;/2 o t > tn1 +n2 2;/2 }
Contrastes para la diferencia entre dos medias: muestras
normales independientes, varianzas de poblaciones iguales
Ejemplo: 9.8 (Newbold) Se estudia el efecto que la presencia de un moderador
puede tener en el numero de ideas generadas en un grupo de trabajo. Se
observan grupos de cuatro personas, con y sin moderador. En una muestra
aleatoria de cuatro grupos con moderador el numero promedio de ideas
generadas por grupo fue 78.0, con cuasi desviacion tpica muestral de 24.4.
Para una muestra independiente de cuatro grupos sin moderador el promedio
de ideas generadas fue 63.5, y su cuasi desviacion tpica fue 20.2. Suponiendo
que distribuciones normales con varianzas iguales, contraste la hipotesis nula
(para = 0.1) de igualdad de medias, frente a la alternativa de que la media
de la poblacion es mayor para grupos con moderador.
Poblacion 1: Poblacion 2:
X = numero de ideas en grupos Y = numero de ideas en grupos sin
con moderador moderador
X N(X , X2 ) X N(Y , Y2 )
' MAS: n1 = 4
Muestra: x = 78.0
sx = 24.4
' MAS: n2 = 4
Muestra: y = 63.5
sy = 20.2
Suponemos muestras normales independientes y X2 = Y2 = 2
Contrastes para la diferencia entre dos medias: muestras
normales independientes, varianzas de poblaciones iguales
Ejemplo: 9.8 (Newbold cont.) sp = 501.7 = 22.4
x y
t = p
Objetivo: contrastar sp 1/n1 + 1/n2
D0 78.0 63.5
= p = 0.915
22.4 1/4 + 1/4
z}|{
H0 : X Y = 0
frente a
Region de rechazo:
H1 : X Y > 0
(Test unilateral) 1.440
z }| {
Estadstico del contraste: RR0.1 = {t : t > t6;0.1 }
T = rX Y H tn +n 2
1 + 1 0 1 2
sp Como t = 0.915 / RR0.1 , no podemos rechazar la hipotesis
n1 n2
nula a un nivel del 10%.
Valor observado del estadstico:
D0 = 0 n1 = 4 n2 = 4
x = 78.0 sx = 24.4 y = 63.5 sy = 20.2 Conclusion: Los datos muestrales no
contienen suficiente evidencia para
(n1 1)sx2 + (n2 1)sy2 pensar que en promedio se generan mas
2
sp =
n1 + n2 2 ideas en grupos con moderador. Pero
(4 1)24.42 + (4 1)20.22
para tamanos muestrales tan pequenos
= el contraste tiene potencia baja y seran
4+42
necesarias diferencias muy grandes
= 501.7
entre las medias de las poblaciones para
rechazar la hipotesis nula.
Contrastes para la diferencia entre dos medias: muestras
normales independientes, varianzas de poblaciones iguales
Muestra: x = 4.059
sx = 0.839
' MAS: n2 = 172
Muestra: y = 3.680
sy = 0.966
Contrastes para la diferencia entre dos medias: muestras
grandes independientes o dos poblaciones normales con
varianzas conocidas
Ejemplo: 9.7 (Newbold cont.)
Region de rechazo:
4.059 3.680
= q = 3.95
0.8392 /186 + 0.9662 /172
Contrastes para la diferencia entre dos medias: muestras
grandes independientes o dos poblaciones normales con
varianzas conocidas
donde
n1 pX + n2 pY
p0 =
n1 + n2
I La region de rechazo (para un nivel de significacion ) es:
Muestra: px = 101
250
= 0.404
'
Muestra: py =
MAS: n2 = 250
75
250
= 0.300
Contrastes para la diferencia entre dos proporciones:
muestras grandes independientes
Ejemplo: 9.9 (Newbold cont.) px py
z = r
p0 (1 p0 ) n1 + 1
n2
Objetivo: contrastar 1
H0 : pX = pY 0.404 0.300
= q ` 1 = 2.43
frente a 1
0.352(1 0.352) 250 + 250
H 1 : pX > pY
(Contraste unilateral) p-valor = P(Z z) = P(Z 2.43) = 0.0075
son dos conjuntos de variables
aleatorias independientes, con
Densidades F
distribucion N(0, 1). La variable
aleatoria (cociente de dos v.a.s
chi-cuadrado normalizadas)
1.2
1 Pn 2
i=1 Xi
F = n1 Pm
1.0
2
m i=1 Yi gl1=30 gl2=30
gl1=10 gl2=15
0.8
sigue una distribucion Fn,m con n y
m grados de libertad. Para el gl1=8 gl2=8
gl1=5 gl2=3
0.6
resultado de la transparencia
anterior:
2n1 1
z }| { 0.4
(n1 1)sX2
0.2
1
2
sX n 1 1
2
=H0 Fn1 1,n2 1
sY2 1 (n2 1)sY2
0.0
n2 1 2
| {z } 0 2 4 6 8
2n2 1
Contrastes para el cociente de varianzas: muestras
normales
' MAS: n1 = 17
Pobls. normales X Y D0
X Y = D0 s H0 N(0, 1)
Vars. conocidas 2 2
X + Y
n1 n2
Pobls. no normales X Y D0
Vars. desconocidas s H0 aprox N(0, 1)
s2 s2
Muestras grandes X + Y
n1 n2
Pobls. Bernoulli pX pY
pX pY = 0 s H0 aprox N(0, 1)
Muestras grandes
p0 (1p0 ) 1 + 1
n1 n2
2
sX
X2 /Y2 = 1 Pobls. normales H0 Fn1 1,n2 1
s2
Y