You are on page 1of 41

Tema 1. Probabilidad.

Problemas Resueltos del Tema 1


1- Un estudiante responde al azar a dos preguntas de verdadero o falso. Escriba el
espacio muestral de este experimento aleatorio.
Solucin.
El espacio muestral es el conjunto de todos los sucesos elementales. Los sucesos
elementales son cada uno de los resultados posibles del experimento aleatorio,
indescomponibles en otros ms simples. Como el experimento consiste en responder al
azar a dos preguntas, cada uno de los posibles patrones de respuesta constituir un
suceso elemental. Un patrn de respuesta sera contestar verdadero a la primera
pregunta y verdadero a la segunda, lo representamos (V, V). Con esta representacin
podemos escribir el espacio muestral como:
E = {(V, V) (V, F) (F, V) (F, F)}
2- Otro estudiante responde al azar a 4 preguntas del mismo tipo anterior.
a) Escriba el espacio muestral.
b) Escriba el suceso responder falso a una sola pregunta.
c) Escriba el suceso responder verdadero al menos a 3 preguntas.
d) Escriba la unin de estos dos sucesos, la interseccin y la diferencia del 2 y el 1.
e) La coleccin formada por estos 5 sucesos, ms el suceso seguro y el suceso
imposible Constituyen un sigma-lgebra?
Solucin
a) Con la misma convencin del problema anterior, los sucesos elementales seran:
(V, V, V, V) (V, V, V, F)
(F, V, V, V) (V, V, F, F)
(F, V, V, F) (F, V, F, V)
(F, V, F, F) (F, F, V, F)

(V, V, F, V) (V, F, V, V)
(V, F, V, F) (V, F, F, V)
(F, F, V, V) (V, F, F, F)
(F, F, F, V) (F, F, F, F)

b) El Suceso responder falso a una sola pregunta ser el subconjunto del espacio
muestral formado por todos los sucesos elementales en que solo hay una respuesta
falso, lo llamaremos A y ser:
A = {(V, V, V, F) (V, V, F, V) (V, F, V, V) (F, V, V, V)}
c) El suceso responder verdadero al menos a 3 preguntas, lo llamaremos B y ser:
B = {(V, V, V, F) (V, V, F, V) (V, F, V, V) (F, V, V, V) (V, V, V, V)}
d) Observando los sucesos elementales que los componen se deducen inmediatamente
los siguientes resultados:
AB=B

AB=A

B- A = {(V, V, V, V)}

2 Problemas de Anlisis de Datos. Jos M. Salinas

e) La coleccin formada por el suceso A, el B, la unin de ambos, su interseccin, y su


diferencia, ms el suceso seguro y el suceso imposible, no constituye un sigma-lgebra.
Para demostrarlo basta comprobar que se incumple una de las dos condiciones. Por
ejemplo, el suceso A incumple la segunda porque su contrario no pertenece a la
coleccin.
3- Una rata es colocada en una caja con tres pulsadores de colores rojo, azul y blanco. Si
pulsa dos veces las palancas al azar:
a) Cul es la probabilidad de que las dos veces pulse la roja?
b) Cul es la probabilidad de que pulse la primera vez o la segunda o ambas la tecla
azul?
Solucin
a) Para que las dos veces pulse la roja tiene que ocurrir que la primera vez pulse la roja
y la segunda tambin pulse la roja, es decir que se verifique el suceso (R1 R2).
Ahora bien , como ambos sucesos son independientes, la probabilidad de la
interseccin es igual al producto de las probabilidades de ambos sucesos. La
probabilidad de estos sucesos se determina mediante la regla de Laplace de casos
favorables (uno), partido por casos posibles (tres)
P(R1 R2) = P(R1) P(R2) = 1/3 1/3 = 1/9
b) En este apartado, claramente, nos piden la probabilidad de la unin de los sucesos
pulsar azul la primera vez y pulsar azul la segunda. Ahora bien, estos dos sucesos no
son incompatibles, luego la probabilidad de la unin ser igual a la suma de las
probabilidades menos la probabilidad de la interseccin. La probabilidad de la
interseccin, al igual que en el apartado anterior, se calcula basndonos en el hecho
de que son independientes.
P(A1 A2) = P(A1) + P(A2) P(A1 A2) = 1/3 + 1/3 1/9 = 5/9

4- Como todo el mundo sabe, la probabilidad de que en una ruleta salga 10 veces
seguidas el color rojo es muy pequea. Habiendo salido 9 veces seguidas el rojo, un
jugador apuesta al negro Qu probabilidad tiene de ganar?
Solucin
Para que el jugador gane tiene que ocurrir la secuencia R1, R2, ..., R9, N10. Como
sabemos ya se ha producido R1, R2, ..., R9. La probabilidad que buscamos ser la
probabilidad de que salga negro en el dcimo lanzamiento, condicionada por que haya
salido rojo en las nueve anteriores. Por la definicin de probabilidad condicionada:
P (N 10 I R1 I R 2 I ... I R9 )
0,510
=
= 0,5
P(R1 I R2 I ... I R9 )
0,59
Como vemos el hecho de que previamente haya salido nueve veces rojo no cambia la
probabilidad de que salga la dcima vez. Esto es as porque cada lanzamiento es
independiente de los restantes. (Nota. En realidad la probabilidad de que salga rojo o negro en una
P( N10 / R1 I R 2 I ... I R9 ) =

ruleta no es exactamente 0,5, sino 18/37 ya que adems de los 18 nmeros rojos y los 18 negros, existe el

Tema 1. Probabilidad. 3

cero que no tiene asignado color, pero este dato no cambia el razonamiento hecho y el resultado sera
18/37)

5- En una asignatura se ha decidido aprobar a aquellos que superen uno de los dos
parciales. Con este criterio aprob el 80%, sabiendo que el primer parcial lo super el
60% y el segundo el 50% Cul hubiese sido el porcentaje de aprobados, si se hubiese
exigido superar ambos parciales?
Solucin
Sea A1 el suceso aprobar el primer parcial y A2 aprobar el segundo. Los datos del
problema nos dicen que:
P(A1 A2) = 0,8

P(A1) = 0,6

P(A2) = 0,5

Y se pide la probabilidad de la interseccin de ambos sucesos. Como A1 y A2 no son


incompatibles, la probabilidad de la unin ser:
P(A1 A2) = P(A1) + P(A2) P(A1 A2)
Despejando tenemos:
P(A1 A2) = P(A1) + P(A2) P(A1 A2)
Sustituyendo los valores numricos:
P(A1 A2) = 0,6 + 0,5 0,8 = 0,3
La conclusin es que si se hubiese exigido aprobar los dos parciales el porcentaje de
aprobados hubiese sido del 30%.
6- La probabilidad de resolver correctamente alguna de las dos versiones de la tarea de
Martens es 0,45. La de resolver la 1 es 0,40 y la de la 2 0,30 La resolucin de las dos
versiones es independiente?
Solucin
Sea V1 el suceso de resolver la primera versin y V2 resolver la segunda. Los datos del
problema nos indican que:
P(V1 V2) = 0,45

P(V1) = 0,4

P(V2) = 0,3

Para determinar si los sucesos son independiente, calcularemos la probabilidad se su


interseccin, de forma anloga al problema anterior, y comprobaremos si el valor
obtenido es igual al producto de las probabilidades de estos dos sucesos.
P(V1 V2) = P(V1) + P(V2) P(V1 V2)
Sustituyendo

4 Problemas de Anlisis de Datos. Jos M. Salinas

P(V1 V2) = 0,4 + 0,3 0,45 = 0,25


Por otra parte
P(V1) P(V2) = 0,4 0,3 = 0,12 0,25 = P(V1 V2)
Luego, no son independientes.
7- La prevalencia de la diabetes es del 4%. La glucemia basal diagnstica correctamente
el 95% de los diabticos, pero da un 2% de falsos positivos. Diagnosticada una persona
Cul es la probabilidad de que realmente sea diabtica?
Solucin
Sea D el suceso de tener diabetes, D el suceso de no tenerla y Gl+ el suceso de dar
positivo en la prueba de la glucemia basal. Los datos del problema nos dicen que:
P(D) = 0,04

P(D) = 0,96 P(Gl+ / D) = 0,95

P(Gl+ / D) = 0,02

Entonces el teorema de Bayes, escrito en los trminos de este problema nos dice que:
P( D / Gl +) =

P( Gl + / D) P( D)
~
~
P(Gl + / D ) P( D ) + P (Gl + / D) P ( D)

sustituyendo por los valores numricos


P( D / Gl +) =

0,95 0,04
0,95 0,04 + 0,02 0,96

0,038
0,038 + 0,0192

= 0,664

Tema 2. Variables aleatorias. 5

Problemas resueltos del Tema 2


2.1- Calcule y escriba en una tabla la distribucin de la variable aleatoria suma de los nmeros
que aparecen al lanzar dos dados.
Solucin.
A continuacin presentamos todos los sucesos que pueden ocurrir al lanzar dos dados
y el valor que para cada uno de estos sucesos tiene la variable suma:
(1,1) 2
(1,2) 3
(1,3) 4
(1,4) 5
(1,5) 6
(1,6)) 7

(2,1) 3
(2,2) 4
(2,3) 5
(2,4) 6
(2,5) 7
(2,6) 8

(3,1) 4
(3,2) 5
(3,3) 6
(3,4) 7
(3,5) 8
(3,6) 9

(4,1) 5
(4,2) 6
(4,3) 7
(4,4) 8
(4,5) 9
(4,6) 10

(5,1) 6
(5,2) 7
(5,3) 8
(5,4) 9
(5,5) 10
(5,6) 11

(6,1) 7
(6,2) 8
(6,3) 9
(6,4) 10
(6,5) 11
(6,6) 12

Como todos estos sucesos tienen la misma probabilidad 1/36, la distribucin de la


suma ser:
X
P

2
1/36

3
2/36

4
3/36

5
4/36

6
5/36

7
6/36

8
5/36

9
4/36

10
3/36

11
2/36

12
1/36

2.2- Un jugador afirma que al lanzar dos dados es igual de probable obtener un seis que un
siete, ya que hay el mismo nmero de resultados a favor de un resultado que de otro. Cinco y
uno, cuatro y dos, tres y tres, para el seis y seis y uno, cinco y dos, cuatro y tres, para el siete.
Es cierta esta afirmacin? Razone la respuesta.
Solucin.
No, en realidad los sucesos que dan origen a que la suma valga 6 son: (1,5) (2,4)
(3,3) (4,2) (5,1) por tanto la probabilidad ser 5/36, mientras que los sucesos que hacen que
la suma sea 7 son (1,6) (2,5) (3,4) (4,3) (5,2) (6,1) y en consecuencia esta probabilidad
ser 6/36.
2.3- Para estudiar si las ratas tienen visin cromtica, en una caja que cuenta con tres
palancas se marca en rojo aquella que al pulsarla proporciona alimento. En cada prueba la
posicin de este pulsador se cambia aleatoriamente. Se somete una rata a cuatro pruebas.
Cual sera la distribucin de la variable aleatoria nmero de pulsaciones que consiguen
alimento, si la rata no distinguiera el rojo y pulsase al azar?
Solucin.
La variable aleatoria nmero de pulsaciones puede tomar los valores 0, 1, 2, 3 y 4. El
suceso que da origen a que la variable valga 0 sera:

6 Problemas de Anlisis de Datos. Jos M. Salinas

(R , R , R , R )

cuya probabilidad sera 2/3 2/3 2/3 2/3 = 16/81

El suceso que da origen a que la variable valga 1 sera:

( R , R , R , R ) U( R , R, R , R ) U( R , R , R, R ) U( R , R , R , R)
y su probabilidad sera 4 1/3 2/3 2/3 2/3 = 32/81
El suceso que es la imagen inversa de 2 es:

( R , R , R , R ) U( R, R , R , R ) U( R, R , R , R ) U( R , R, R, R ) U( R , R, R , R) U( R , R , R, R)
y su probabilidad 6 1/3 1/3 2/3 2/3 = 24/81
La imagen inversa de 3 es:

( R , R, R, R ) U( R, R, R , R) U( R, R , R, R) U( R , R , R , R)
y su probabilidad 4 1/3 1/3 1/3 2/3 = 8/81
La imagen inversa de 4 es el suceso:

( R , R, R, R)

y su probabilidad es 1/3 1/3 1/3 1/3 = 1/81

Resumiendo la distribucin del nmero de aciertos es:


X
P

0
16/81

1
32/81

2
24/81

3
8/81

4
1/81

2.4- Un jugador de Rol, en una partida de Dungeons and Dragons, para salvarse de un
conjuro de Raistlin, necesita sacar un 18 en el lanzamiento de los dados. El Dungeon Master
le ofrece lanzar tres dados de seis caras o uno de diez junto con uno de ocho. En cual de
estas dos alternativas es ms probable obtener un 18 y salvarse del conjuro? Explique su
respuesta Sera la respuesta la misma si hubiese que sacar 17 o ms para evitar el conjuro?
Solucin.
Para sacar 18 con tres dados de seis caras tiene que ocurrir el suceso (6, 6, 6) que
tiene una probabilidad 1/6 1/6 1/6 = 1/216.
Para obtener 18 con un dado de diez caras y otro de ocho tiene que ocurrir el suceso
(10, 8) cuya probabilidad es 1/10 1/8 = 1/80. Obviamente esta probabilidad es mayor que
la anterior.
Para obtener 17 o ms con los tres dados tiene que ocurrir el suceso:

Tema 2. Variables aleatorias. 7

(5, 6, 6) (6, 5, 6) (6, 6, 5) (6, 6, 6) cuya probabilidad es 4/216.


Para conseguir el mismo resultado con los dos dados tiene que ocurrir:
(10, 7) (9, 8) (10, 8) que tiene una probabilidad de 3/80 que tambin sera mayor que
con los tres dados.
2.5- Tenemos una urna con dos bolas blancas, tres verdes y cinco rojas. Extraemos al azar
dos bolas simultneamente. Recibimos 200 pesetas si las dos bolas son blancas, 100 si las
dos son verdes y 10 si una es roja y la otra verde, en los dems casos no recibimos nada.
Cual es el valor esperado de los premios?
Solucin.
P(B1 B2) = P(B1) P(B2 / B1) = 2/10 1/9 = 2/90 = 1/45
P(V1 V2) = P(V1) P(V2 / V1) = 3/10 2/9 = 6/90 = 1/15
P((R1 V2) (V1 R2)) = P(R1 V2) + P(V1 R2) = 5/10 3/9 + 3/10 5/9 =
15/90 + 15/90 = 1/3
Por consiguiente el premio esperado sera:
E[premio] = 200 1/45 + 100 1/15 + 10 1/3 + 0 26/45 = 14,4
2.6- En el punto de partida de un laberinto hay tres orificios iguales A, B y C. Si la rata elige
A vuelve al punto de partida despus de recorrer dos metros. Si elige B recorre cinco metros
y vuelve al mismo punto. Si elige C sale al exterior recorriendo un metro. Por trmino medio
que distancia recorre una rata antes de salir, si siempre elige un orificio distinto de los
seleccionados en veces anteriores?
Solucin.
Los itinerarios que pueden darse con las distancias recorridas en cada caso, son (A,
B, C) 8, (B, A, C) 8, (A, C) 3, (B, C) 6, (C) 1, y sus probabilidades seran:
P(A, B, C) = P(A) P(B/A) P(C/AB) = 1/3 1/2 1 = 1/6
P(B, A, C) = P(B) P(A/B) P(C/BA) = 1/3 1/2 1 = 1/6
P(A, C) = P(A) P(C/A) = 1/3 1/2 = 1/6
P(B, C) = P(B) P(C/B) = 1/3 1/2 = 1/6
P(C) = 1/3
En consecuencia la distancia media recorrida ser:
E[D] = 8 1/3 + 6 1/6 + 3 1/6 + 1 1/3 = 4,5

Terma 3. Distribuciones. 9

Problemas resueltos del Tema 3.


3.1- Si un estudiante responde al azar a un examen de 8 preguntas de verdadero o falso Cual
es la probabilidad de que acierte 4? Cual es la probabilidad de que acierte dos o menos?
Cual es la probabilidad de que acierte cinco o ms? Cuanto valen la media y la varianza del
nmero de preguntas acertadas?
Solucin.
La distribucin del nmero de aciertos ser una distribucin Binomial de parmetros n
= 8 y p = 1/2, en consecuencia:
8
70
Pr( = 4 ) = 0,54 0,5 4 =
= 0,273
256
4
Para resolver los dos apartados siguientes calculamos previamente
8
1
Pr( = 0) = 0,50 0,58 =
= 0,004
256
0
8
8
Pr( = 1) = 0,51 0,57 =
= 0,031
256
1
8
28
Pr( = 2 ) = 0,52 0,5 6 =
= 0,109
256
2
8
56
Pr( = 3) = 0,53 0,55 =
= 0,219
256
3
en consecuencia
Pr( 2) = Pr ( = 0) + Pr ( = 1) + Pr ( = 2) = 0,004 + 0,031 + 0,109 = 0,144
Pr( 5) = 1 Pr ( 4) = 1 (0,004 + 0,031 + 0,109 + 0,219 + 0,273) = 0,364
La media y la varianza se obtienen aplicando la expresin obtenida de forma general
para la media y la varianza de una distribucin Binomial:
E[] = n p = 8 0,5 = 4

Var[] = n p q = 8 0,5 0,5 = 2

3.2- En una poblacin en la que hay un 40% de hombres y un 60% de mujeres seleccionamos
4 individuos Cual es la probabilidad de que haya 2 hombres y 2 mujeres? Cual es la
probabilidad de que haya ms mujeres que hombres?

10 Problemas de Anlisis de Datos. Jos M. Salinas

Solucin.
El nmero de hombres en la muestra sigue una distribucin Binomial de parmetros n
= 4 y p = 0,4. Entonces para calcular la probabilidad de que haya 2 hombres y 2 mujeres en
la muestra, basta calcular la probabilidad de que haya dos hombres en la misma.
4
Pr( = 2) = 0,4 2 0,62 = 6 0,16 0,36 = 0,3456
2
Para que haya ms mujeres que hombres en la muestra, el nmero de estos tiene que
ser menor que 2, luego la probabilidad ser:
4
4
Pr( < 2) = Pr ( = 0) + Pr ( = 1) = 0,4 0 0,6 4 + 0,4 1 0,6 3 = 0,4752
0
1
3.3- Sabiendo que la variable Z sigue una distribucin Normal cero, uno, calcule las siguientes
Probabilidades:
P(Z 0,93) P(Z 1,68) P(Z -2,27) P(Z -0,27)
P(Z > 0,62) P(Z > 2,05) P(Z > -1,07) P(Z > -3,39)
P(0,56 < Z 2,80) P(-2,81 < Z -0,33) P(-0,85 < Z 0,72)
Solucin.
Los ejercicios de la primera fila se resuelven buscando directamente en las tablas de la
distribucin Normal, donde se obtienen los siguientes valores:
P(Z 0,93) = 0,8238
P(Z -0,27) = 0,3936

P(Z 1,68) = 0,9535

P(Z -2,27) = 0,0116

Para resolver los ejercicios de la segunda fila se recurre a calcular la probabilidad del
suceso contrario:
P(Z > 0,62) = 1 - P(Z 0,62) = 1 - 0,7324 = 0,2676
y de forma anloga se obtiene:
P(Z > 2,05) = 0,0202

P(Z > -1,07) = 0,8577

P(Z > -3,39) = 0,9996

En la tercera fila se pide calcular la probabilidad de una serie de intervalos, para ello
debe recordarse que la probabilidad de un intervalo es igual al valor de la Funcin de
Distribucin para el extremo superior menos el valor de la Funcin de Distribucin para el
extremo inferior, es decir:
P(0,56 < Z 2,80) = P(Z 2,80) - P(Z 0,56) = 0,9974 - 0,7123 = 0,2851

Terma 3. Distribuciones. 11

y para los otros dos intervalos sera:


P(-2,81 < Z -0,33) = 0,3707 - 0,0025 = 0,3682

P(-0,85 < Z 0,72) = 0,5665

3.4- Siendo Z una N(0,1), calcule los valores de la variable que verifican las siguientes
condiciones:
P(Z z) = 0,70 P(Z z) = 0,90 P(Z z) = 0,35 P(Z z) = 0,05
P(Z > z) = 0,25 P(Z > z) = 0,05 P(Z > z) = 0,85 P(Z > z) = 0,69
P(-z < Z z) = 0,90
P(-z < Z z) = 0,60
Solucin.
Los ejercicios de la primera fila se resuelven buscando en las tablas de la Normal el
valor ms prximo a la probabilidad pedida y viendo a que valor de la variable corresponde:
P(Z z) = 0,70 z 0,52
P(Z z) = 0,35 z -0,39

P(Z z) = 0,90 z 1,28


P(Z z) = 0,05 z -1,64

La resolucin de los ejercicios de la segunda fila utiliza las propiedades de la


probabilidad del suceso contrario:
P(Z > z) = 0,25 P(Z z) = 1- 0,25 = 0,75 z 0,67
anlogamente:
P(Z > z) = 0,05 z 1,64 P(Z > z) = 0,85 z -1,04 P(Z > z) = 0,69 z -0,5
Para resolver los ejercicios de la tercera fila se aplica la simetra de la Normal
P(-z < Z z) = 0,90 P(Z -z) = 0,05 y P(Z z) = 0,95 z 1,64
P(-z < Z z) = 0,60 z 0,84
3.5- Partiendo de que X es una variable que sigue una distribucin Normal de media 50 y
desviacin tpica 4, calcule las siguientes probabilidades:
P(X 55) P(X 59) P(X 47,5)
P(X 45,6)
P(X > 60,4) P(X > 58,64) P(X > 48,2) P(X > 46,26)
P(52 < X 54) P(44,5 < X 49) P(47,25 < X 53,48)
Solucin.
Estos ejercicios se resuelven merced a la propiedad de que al tipificar una variable
Normal la variable resultante sigue una distribucin Normal cero, uno.
55 50

P( X 55) = P Z
= P( Z 1,25) = 0,8944

4
anlogamente:

12 Problemas de Anlisis de Datos. Jos M. Salinas

P(X 59) = 0,9878

P(X 47,5) = 0,2676

P(X 45,6) = 0,1357

Para los ejercicios de la segunda fila vuelve a utilizarse las propiedades del suceso
contrario:
60,4 50

P( X > 60,4) = P Z >


= P( Z > 2,6) = 1 P( Z 2,6) = 0,0047

4
de forma semejante:
P(X > 58,64) = 0,0154

P(X > 48,2) = 0,6736

P(X > 46,26) = 0,8264

Los intervalos de la tercera fila se resuelven en la forma siguiente:


54 50
52 50

P( 52 < X 54) = P( X 54) P( X 52) = P Z


P Z

4
4
= P( Z 1) P( Z 0,5) = 0,8413 0,6915 = 0,1498
similarmente
P(44,5 < X 49) = 0,3175

P(47,25 < X 53,48) = 0,5627

3.6- La variable aleatoria Y sigue una distribucin Normal de media 2,55 y desviacin tpica
0,36. Halle los valores de la variable que cumplen las siguientes condiciones:
P(Y y) = 0,54 P(Y y) = 0,95 P(Y y) = 0,42 P(Y y) = 0,1
P(Y > y) = 0,38 P(Y > y) = 0,05
P(Y > y) = 0,54 P(Y > y) = 0,01
P(a < Y b) = 0,80
P(a < Y b) = 0,95
Solucin.

y 2 ,55
P(Y y ) = 0,54 P Z
= 0,54

0,36
buscando en las tablas de la Normal:
P( Z 0,1) 0,54

y 2,55
= 0,1 y = 2 ,55 + 0,36 0,1 = 2 ,586
0,36

de manera semejante:
P(Y y) = 0,95 y = 3,1404
P(Y y) = 0,1 y = 2,0892

P(Y y) = 0,42 y = 2,478

Terma 3. Distribuciones. 13

y 2,55
P(Y > y ) = 0,38 P(Y y ) = 0,62 P Z
= 0,62

0,36
buscando en las tablas de la Normal cero, uno:
P( Z 0,31) 0,62

y 2,55
= 0,31 y = 2,55 + 0,36 0,31 = 2,6616
0,36

anlogamente:
P(Y > y) = 0,05 y =3,1404
P(Y > y) = 0,01 y = 3,3888

P(Y > y) = 0,54 y = 2,514

P( a < Y b) = 0,80 P( Y a) = 0,1 P( Y b) = 0,9

a 2,55
a 2,55
P Z
= 1,28 a = 2 ,0892
= 0,1 P( Z 1,28) = 0,1

0,36
0,36

b 2,55
b 2 ,55
P Z
= 1,28 b = 3,0108
= 0,9 P( Z 1,28) = 0,9

0,36
0,36
y para el otro intervalo:
P(a < Y b) = 0,95 a = 1,8444 y b = 3,2556
3.7- Las calificaciones en un examen siguen una distribucin Normal de media 5,6 y
desviacin tpica 0,8.
a) Qu proporcin de alumnos tendr puntuaciones inferiores o iguales a 4?
b) Qu proporcin de alumnos aprobar?
c) Qu proporcin de alumnos obtendr Notable o Sobresaliente?
Solucin.
a) Pr( X 4) =

4 5,6
Pr Z

0,8

Pr ( Z 2) = 0,0228

5 5,6
b) Pr( X > 5) = Pr Z >
= 1 Pr( Z 0,75) = 1 0,2266 = 0,7734

0,8

7 5,6
c) Pr( X > 7) = Pr Z >
= 1 Pr ( Z 1,75) = 1 0,9599 = 0,0401

0,8
3.8- Las puntuaciones en un test de ansiedad-rasgo siguen, en una poblacin de mujeres, una
distribucin Normal de media 25 y desviacin Tpica 10. Si queremos clasificar la poblacin
en cuatro grupos de igual tamao Cuales sern las puntuaciones que delimiten estos grupos?
Solucin.

14 Problemas de Anlisis de Datos. Jos M. Salinas

Las puntuaciones que delimitan estos cuatro grupos sern el primer, segundo y tercer
cuartil de la distribucin
Pr( X Q1 ) = 0,25

Q 25

Pr Z 1
= 0,25

10

buscando en las tablas de la Normal cero, uno el valor de la variable que deja por debajo de
si una probabilidad de 0,25 tenemos:
Pr( Z 0,67) = 0,25
y despejando

Q1

= 25 10 0 ,67

luego

Q1 25
10

= 0 ,67

= 18, 3

Como en la distribucin Normal Media y Mediana son iguales tendremos que:


Q2

= 25

Q 25

Pr( X Q3 ) = 0,75 Pr Z 3
= 0,75

10
buscando en las tablas
Q3 25
Pr( Z 0,67) = 0,75 luego
= 0 ,67
10
despejando
Q3 = 25 + 10 0 ,67 = 31,7
Por consiguiente el primer grupo seran los individuos con puntuaciones inferiores o
iguales a 18,3, el segundo aquellos con puntuaciones entre 18,3 y 25, el tercero los sujetos
con puntuaciones entre 25 y 31,7 y el cuarto aquellos que tengan puntuaciones superiores a
31,7.
3.9- Una prueba consta de 200 preguntas de verdadero o falso, para un sujeto que
respondiese al azar Cual sera la probabilidad de que acertase?
a) 50 preguntas o menos.
b) Ms de 50 y menos de 100.
c) Ms de 120 preguntas.
Solucin.
El nmero de preguntas acertadas seguir una distribucin Binomial con n = 200 y p
= 0,5. Ahora bien, como el nmero de pruebas es elevado esta distribucin se puede
aproximar por una Normal de media 2000,5 = 100 y de varianza 2000,50,5 = 50 o lo que
es lo mismo con desviacin tpica 7,07, luego:

Terma 3. Distribuciones. 15

50,5 100
Pr( 50) Pr ( X 50,5) = Pr Z
= Pr ( Z 7) 0

7,07

99,5 100

50,5 100
Pr(50 < < 100) = Pr( 99) Pr ( 51) = Pr Z
Pr Z

7,07

7,07
= Pr ( Z 0,07 ) Pr( Z 7 ) = 0,4721 0 = 0,4721

120,5 100
Pr( > 120) Pr Z >
= 1 Pr( Z 2 ,9 ) = 1 0,9981 = 0,0019

7 ,07
3.10- En una distribucin Binomial con n = 10 y P = 0,8 Qu error se comete al calcular la
probabilidad de que la variable sea igual a 6, mediante la aproximacin Normal?
Solucin.
Pr( = 6)

10
= 0,8 6 0,2 4
6

= 0,0881

Esta distribucin Binomial se aproxima por una Normal de media 8 y desviacin tpica
1,265, luego:
Pr( = 6)

Pr (5,5 < X 6,5) = Pr ( X 6,5) Pr( X 5,5)

6,5 8

5,5 8
= Pr Z
Pr Z

1,265

1,265

Pr( Z 1,18) Pr( Z 1,98)

= 0,1190 - 0,0238 = 0,0952


y el error que cometeramos sera:
0,0952 - 0,0881 = 0,0071

Tema 6. Descripcin de la distribucin de frecuencias

Problemas resueltos del Tema 6


1.- Los datos siguientes corresponden a los tiempos de reaccin de una muestra de 33
sujetos, medidos en centsimas de segundo:
55, 51, 60, 56, 64, 56, 63, 63, 61, 57, 62, 50, 49, 70, 72, 54, 48, 53, 58, 66, 68, 45, 74,
65, 58, 61, 62, 59, 64, 57, 63, 52, 67.
Calcule la media, mediana, el primer y el tercer cuartil, directamente a partir de los
datos.
Solucin:
a) Para calcular la media simplemente sumamos todos los valores, lo cual da como
resultado 1963, y dividimos entre el nmero de observaciones que es 33, con lo cual
obtenemos:
1963
x =
= 59,48
33
b) Para calcular la mediana, el primer paso es escribir los valores en orden creciente:
45, 48, 49, 50, 51, 52, 53, 54, 55, 56, 56, 57, 57, 58, 58, 59, 60, 61, 61, 62, 62, 63, 63,
63, 64, 64, 65, 66, 67, 68, 70, 72, 74
Como el nmero de observaciones es impar el valor central, es decir el decimosexto, es
la mediana, por consiguiente la Mediana de esta distribucin es 60.
El clculo del primer cuartil es anlogo, es la observacin que deja una cuarta parte de
las observaciones por debajo y tres cuartas partes por encima, luego en este caso es la
novena observacin y por consiguiente el valor del primer cuartil es 55.
Anlogamente el tercer cuartil es el valor que ocupa en la anterior ordenacin la
posicin vigesimoquinta y es 64.

2.- Con los datos del problema anterior, construya una tabla estadstica de estos datos,
agrupados en 5 intervalos de igual amplitud, calcule la media, y la mediana, compare
estos resultados con los obtenidos en el problema anterior.
Solucin:
Tiempos
45 a 51
51 a 57
57 a 63
63 a 69
69 a 75

N sujetos
4
6
11
9
3

Para llegar a la anterior tabla se ha calculado en primer lugar el rango de la distribucin


que es el mayor valor 74 menos el menor 45, lo que nos da 29. Como 29 no es divisible
entre 5 redondeamos hasta el valor ms prximo por exceso que es 30, dividiendo este
rango entre el nmero de intervalos que deseamos, cinco, obtenemos la amplitud que
deben tener los intervalos, seis. A partir del primer valor, 45 se han calculado los

Problemas de Anlisis de Datos. Jos M. Salinas

restantes extremos sumando 6, sucesivas veces. Posteriormente se ha contado el nmero


de observaciones comprendidas dentro de cada intervalo, recurdese que los intervalos
se toman abiertos a la derecha, y de esta forma se han obtenido las frecuencias que
aparecen en la tabla.
Tiempos
45 a 51
51 a 57
57 a 63
63 a 69
69 a 75

ni
4
6
11
9
3
33

ci
48
54
60
66
72

ci n i
192
324
660
594
216
1986

Ni
4
10
21
30
33

La media es: 1986/33 = 60,18


Mediana:
Comenzamos calculando la mitad del tamao de la muestra 33/2 = 16,5. A continuacin
observamos cul es la primera frecuencia acumulada que es mayor que 16,5 que resulta
ser 21. Esto nos indica que la Mediana se encuentra en el intervalo de 57 a 63, aplicando
entonces la frmula que determina la mediana, obtenemos:
Me = 57 +

(16,5 10) 6
11

= 60,5

Las diferencias existentes entre los valores anteriores (exactos) y los valores actuales
(aproximados) son debidas al efecto del agrupamiento de los valores en clases. En este
ltimo caso los clculos hacen la suposicin de que las observaciones estn
uniformemente distribuidas dentro de los intervalos, si este supuesto se cumple
exactamente ambos valores coincidirn. Conforme los datos reales se aparten de este
supuesto mayor ser la discrepancia entre ambos procedimientos. Como en este caso los
datos se distribuyen de forma bastante uniforme, las discrepancias entre los valores
obtenidos por ambos procedimientos son pequeas.

3.- La distribucin de las puntuaciones en una escala de hostilidad, de 160 sujetos de


una muestra, ha sido la siguiente:
Xi
0 a 10
10 a 20
20 a 30
30 a 40
40 a 50
50 a 60
60 a 70

a)
b)
c)
d)

ni
8
22
32
44
28
20
6

Entre que valores se encuentra el 50% central de los individuos?


Calcule el percentil 27.
A partir de que puntuacin se encuentra el 12% de los sujetos ms hostiles?
Si descontamos el 15 % de los individuos menos hostiles y el 15% de los ms
hostiles En qu intervalo de puntuacin se encuentran los restantes?

Tema 6. Descripcin de la distribucin de frecuencias

Solucin:
Antes de comenzar a responder los distintos apartados, debemos en primer lugar
calcular las frecuencias acumuladas
Xi
0 a 10
10 a 20
20 a 30
30 a 40
40 a 50
50 a 60
60 a 70

ni
8
22
32
44
28
20
6

Ni
8
30
62
106
134
154
160

a) Se trata de calcular el primer cuartil que dejar por debajo el 25% inferior, y el
tercer cuartil que dejar por encima el 25% superior. De esta forma entre ambos
valores se encontrar el 50% central. Para calcular el primer cuartil determinamos la
cuata parte del tamao de la muestra 160/4 = 40. La primera frecuencia acumulada
que supera este valor es 62, por consiguiente el primer cuartil se encuentra en el
intervalo de 20 a 30, aplicamos la frmula para su determinacin:
Q1

= 20 +

( 40 30) 10
32

= 23,125

Las tres cuartas partes del tamao de la muestra son 120, por tanto el tercer cuartil se
encuentra en el intervalo de 40 a 50 y su valor es:
Q3

= 40 +

(120 106) 10
28

= 45

b) El 27% del tamao de la muestra es 43,2, luego el percentil 27 est en el intervalo


de 20 a 30 y su valor es:
P27

= 20 +

( 43,2 30) 10
32

= 24,125

c) El valor que deja por encima el 12% de los sujetos ms hostiles, es el mismo que
deja por debajo el 88% con menores puntuaciones, por tanto debemos calcular el
percentil 88. El 88% del tamao de la muestra vale 140,8. Aplicando la formula
tenemos:
P88

= 50 +

(140,8 134) 10
20

= 53,4

d) Se trata de calcular el percentil 15 y el percentil 85. El 15% del tamao de la


muestra es 24. El 85% del tamao es 136 y por tanto:
P15
P85

( 24 8) 10
= 17, 27
22
(136 134) 10
= 50 +
= 51
20
= 10 +

Problemas de Anlisis de Datos. Jos M. Salinas

4.- Hemos medido la variable neuroticismo en un grupo de sujetos obteniendo los


siguientes resultados:
3, 5, 3, 6, 4, 2, 8, 3, 7, 5, 8, 9, 4, 5, 5, 3
Calcule la desviacin media y la desviacin tpica.
Solucin:
Comenzamos calculando la media de la muestra, para ello sumamos los valores de las
observaciones obteniendo 80. Dividiendo por el nmero de observaciones, 16, tenemos
el valor de la media, 5.
A continuacin calculamos las desviaciones a la media:
2, 0, 2, 1, 1, 3, 3, 2, 2, 0, 3, 4, 1, 0, 0, 2
Sumando estas desviaciones, obtenemos 26 y dividiendo por el tamao de la muestra,
16, obtenemos la Desviacin media:
Dm =

26
16

= 1,625

Para calcular la desviacin tpica, empezamos calculando los cuadrados de los valores:
9, 25, 9, 36, 16, 4, 64, 9, 49, 25, 64, 81, 16, 25, 25, 9
Sumando obtenemos 466, por consiguiente la varianza valdr:
S2

466
52
16

= 4,125

calculando su raz cuadrada obtenemos el valor de la desviacin tpica:


S = 2,03

Temas 7 y8. Estimadores y sus distribuciones. 1

Problemas resueltos Temas 7 y 8.


1- En una poblacin se presenta una alteracin leve en una cierta proporcin P de los
individuos que la componen. Definimos una variable aleatoria X que vale 1 para los individuos
alterados y 0 para los no alterados.
a) Escriba la distribucin poblacional de esta variable aleatoria
b) Si p es la proporcin de veces que aparece el valor 1 en muestras aleatorias simples de
tamao 3. Calcule la distribucin en el muestreo de p, suponiendo que P es igual a 0,2.
c) Demuestre que en este caso p es un estimador insesgado de P.
d) Repita los pasos b) y c) de forma general para un valor cualquiera de P.
Solucin:
La solucin del apartado a) aparece en la siguiente tabla:
xi
0
1

pi
0,8
0,2

Para resolver el apartado b) comenzamos con una tabla donde aparecen todas las
posibles muestras de tamao 3, la probabilidad de estas muestras y el valor de la proporcin
muestral en cada una de ellas
Muestra
(0,0,0)
(1,0,0)
(0,1,0)
(0,0,1)
(1,1,0)
(1,0,1)
(0,1,1)
(1,1,1)

Prob.
0,512
0,128
0,128
0,128
0,032
0,032
0,032
0,008

p
0
1/3
1/3
1/3
2/3
2/3
2/3
1

Distribucin de p:
p
0
1/3
2/3
1

Prob.
0,512
0,384
0,096
0,008

por consiguiente la esperanza matemtica ser:


E[p] = 0 0,512 + 1/3 0,384 + 2/3 0,096 + 1 0,008 = 0,2
y queda resuelto el apartado c). Para el apartado d) escribimos la distribucin de p en el caso
genrico que ser:
p
0
1/3
2/3
1
y la esperanza matemtica de p ser:

Prob.
Q3
3PQ2
3P2Q
P3

2 Problemas de Anlisis de Datos. Jos M. Salinas

E [ p] = PQ2 + 2 P 2 Q + P 3 = P(Q 2 + 2 PQ + P 2 ) = P( Q + P ) = P
2

2- Una variable aleatoria puede tomar los valores 1, 2 y 3 con probabilidades 0,25 0,5 y 0,25
respectivamente. Si para estimar la media de esta variable aleatoria extraemos muestras
aleatorias simples de tamao 3 y utilizamos como estimadores la media muestral y la semisuma
de los valores extremos. Queremos confirmar que:
a) Los dos estimadores son insesgados y b) La media muestral es ms eficiente
Realice los clculos necesarios para verificar estos dos puntos.
Solucin:
En la siguiente tabla damos todas las muestras posibles de tamao 3, sus
probabilidades y los valores que tomaran ambos estimadores en esas muestras:
Muestra
(1,1,1)
(2,1,1)
(1,2,1)
(1,1,2)
(3,1,1)
(1,3,1)
(1,1,3)
(2,2,2)
(3,2,2)
(2,3,2)
(2,2,3)
(1,2,2)
(2,1,2)
(2,2,1)
(3,3,3)
(2,3,3)
(3,2,3)
(3,3,2)
(1,3,3)
(3,1,3)
(3,3,1)
(1,2,3)
(1,3,2)
(2,3,1)
(2,1,3)
(3,1,2)
(3,2,1)

Prob.
0,015625
0,03125
0,03125
0,03125
0,015625
0,015625
0,015625
0,125
0,0625
0,0625
0,0625
0,0625
0,0625
0,0625
0,015625
0,03125
0,03125
0,03125
0,015625
0,015625
0,015625
0,03125
0,03125
0,03125
0,03125
0,03125
0,03125

Media
1
4/3
4/3
4/3
5/3
5/3
5/3
2
7/3
7/3
7/3
5/3
5/3
5/3
3
8/3
8/3
8/3
7/3
7/3
7/3
2
2
2
2
2
2

Semisum.
1
1,5
1,5
1,5
2
2
2
2
2,5
2,5
2,5
1,5
1,5
1,5
3
2,5
2,5
2,5
2
2
2
2
2
2
2
2
2

Por consiguiente la distribucin de la media muestral ser:

Temas 7 y8. Estimadores y sus distribuciones. 3

Media
Prob.

1
4/3
5/3
0,015625 0,09375 0,234375

2
0,3125

7/3
8/3
3
0,234375 0,09375 0,015625

y la distribucin de la semisuma de los valores extremos ser:


Semisuma
Prob.

1
0,015625

1,5
0,28125

2
0,40625

2,5
0,28125

3
0,015625

por consiguiente las esperanzas de estos dos estimadores seran:


E[Media] = 1 0,015625 + 4/3 0,09375 + 5/3 0,234375 + 2 0,3125 +
7/3 0,234375 + 8/3 0,09375 + 3 0,015625 = 2
E[Semisuma] = 1 0,015625 + 1,5 0,28125 + 2 0,40625 + 2,5 0,28125 +
3 0,015625 = 2
luego ambos estimadores son insesgados. Las varianzas respectivas seran:
Var[Media] = 1 0,015625 + 16/9 0,09375 + 25/9 0,234375 + 4 0,3125 +
49/9 0,234375 + 64/9 0,09375 + 9 0,015625 - 4 = 0,167

Var[Semisuma] = 1 0,015625 + 2,25 0,28125 + 4 0,40625 + 6,25 0,28125 +


9 0,015625 - 4 = 0,172
por consiguiente la media es en este caso un estimador ms eficiente que la semisuma de los
valores extremos.

3- Las puntuaciones en la Escala de Inteligencia para Adultos de Wechsler (WAIS) siguen en


una poblacin una distribucin Normal de media 100 y desviacin tpica 16. Si extraemos de
esa poblacin una muestra aleatoria simple de 25 individuos
a) Cual es la probabilidad de que la media de esos 25 individuos sea inferior a 95?
b) Cual es la probabilidad de que esa misma media est comprendida entre 98 y 102?
Solucin:
De acuerdo con el teorema de Fisher:
x


N ,

Por lo que en nuestro caso:


x

16
N 100,,

25

N (100,, 3,2)

4 Problemas de Anlisis de Datos. Jos M. Salinas

Entonces el apartado a) se resuelve en la forma siguiente:

95 100
Pr( x 95) = Pr Z

3,2

Pr( Z 1,56) =

0,0594

y el apartado b) quedar resuelto de la siguiente forma:


102 100
98 100

Pr( 98 < x 102) = Pr ( x 102) Pr ( x 98) = Pr Z


Pr Z

3,2

3,2
= Pr ( Z 0,62 ) Pr ( Z 0,62) = 0,7324 0,2676 = 0,4648
4- Las puntuaciones obtenidas en la escala de Locus de Control de James por los sujetos
depresivos, siguen una distribucin Normal de media 90 y desviacin tpica 12. Si se extraen
muestras aleatorias simples de 30 sujetos depresivos Por debajo de que cantidad se
encontrar el 90% de las veces el valor de la varianza de la muestra?
Solucin:
En virtud del teorema de Fisher sabemos que:
nS 2
2

2n 1

Por tanto en el problema que nos ocupa se verificar:


30 S 2
144

229

De las tablas de la Ji-cuadrado obtenemos:


Pr( 292 x ) = 0,9

x = 39,09

Por consiguiente:
30 S 2

39,09 144

Pr
39,09 = 0,9 Pr S 2
= 0,9 Pr ( S 2 187,63) = 0,9

144

30
Por tanto, el valor pedido es 187,63.

Tema 9. Intervalos de confianza 1

Problemas resueltos. Tema 9


1- Los tiempos de reaccin, en mili segundos, de 17 sujetos frente a una matriz de 15
estmulos fueron los siguientes: 448, 460, 514, 488, 592, 490, 507, 513, 492, 534,
523, 452, 464, 562, 584, 507, 461
Suponiendo que el tiempo de reaccin se distribuye Normalmente, determine un intervalo de
confianza para la media a un nivel de confianza del 95%.
Solucin:
Mediante los clculos bsicos obtenemos que la media muestral vale 505,35 y la desviacin
tpica 42,54.
Buscando en las tablas de la t de Student con 16 grados de libertad, obtenemos que el valor
que deja por debajo una probabilidad de 0,975 es 2,12
Sustituyendo estos valores en la expresin del intervalo de confianza de la media tenemos:
(505,35 - 2,12 42,54 / 4 ,, 505,35 + 2,12 42,54 / 4)
operando
( 482,80 ,, 527,90 )
2- En una muestra de 65 sujetos las puntuaciones en una escala de extroversin tienen una
media de 32,7 puntos y una desviacin tpica de 12,64.
a) Calcule a partir de estos datos el correspondiente intervalo de confianza, a un nivel del
90%, para la media de la poblacin.
b) Indique, con un nivel de confianza del 95%, cual sera el mximo error que podramos
cometer al tomar como media de la poblacin el valor obtenido en la estimacin puntual.
Solucin:
a) Buscando en las tablas de la t de Student obtenemos que el valor que deja por debajo una
probabilidad del 95% es 1,671 (aproximadamente). Sustituyendo los valores de esta muestra
en la expresin del intervalo de confianza obtenemos:
( 32,7 - 1,671 12,64 / 8 ,, 32,7 + 1,671 12,64 / 8 )
operando
( 30,06 ,, 35,34 )
b) En las tablas de la t de Student encontramos que el valor de la variable que deja por
debajo una probabilidad de 0,975 es 2. En consecuencia a un nivel de confianza del 95% la
media de la poblacin puede valer
32,7 2 12,64 / 8
luego el mximo error que se puede cometer, a este nivel de confianza, es: 3,16

2 Problemas de Anlisis de Datos. Jos M. Salinas

3- Con los datos del problema 1, calcule a un nivel de confianza del 90% un intervalo de
confianza para la varianza e indique cual sera el mximo error por exceso y por defecto que
podra cometerse utilizando el estimador insesgado de la varianza.
Solucin:
Mediante clculos bsicos obtenemos que la varianza de la muestra vale 1809,29 y la
cuasivarianza 1922,37
En las tablas de la Ji-cuadrado encontramos que el valor que deja por debajo una
probabilidad de 0,05 es 7,96 y que 26,30 deja por debajo una probabilidad de 0,95.
Sustituyendo en la expresin del intervalo de confianza para la varianza tenemos:
( 17 1809,29 / 26,30 ,, 17 1809,29 / 7,96 )
operando
( 1169,50 ,, 3864,06 )
Por tanto el error por defecto sera 1922,37 - 3864,06 = -1941,69
y el error por exceso 1922,37 1169,50 = 752,87

4- En una muestra de 300 universitarios el 80% ha respondido que asiste semanalmente al


cine. Entre que valores se encuentra, con un nivel de confianza del 95%, la proporcin de
universitarios que acude todas las semanas al cine.
Solucin:
En las tablas de la Normal encontramos que el valor de la variable que deja por debajo una
probabilidad de 0,975 es 1,96.
Sustituyendo en la expresin del intervalo de confianza para una proporcin:

0,8 0,2
0,8 0,2
0,8 1,96

,, 0,8 + 1,96
300
300

operando
( 0,755 ,, 0,845 )

Temas 10 y 11. Contrastes paramtricos de hiptesis. 1

Problemas resueltos. Temas 10 y 11


1- las puntuaciones en un test que mide la variable creatividad siguen, en la poblacin general
de adolescentes, una distribucin Normal de media 11,5. En un centro escolar que ha
implantado un programa de estimulacin de la creatividad una muestra de 30 alumnos ha
proporcionado las siguientes puntuaciones:
11, 9, 12, 17, 8, 11, 9, 4, 5, 9, 14, 9, 17, 24, 19, 10, 17, 17,
23, 8, 6, 14, 16, 6, 7, 15, 20, 14, 15.

8,

A un nivel de confianza del 95% Puede afirmarse que el programa es efectivo?


Solucin:
1

Ho = 11,5

H1 > 11,5
x 0
El estadstico de contraste en este caso es: t =
S
n 1

4
La media muestral es 12,47 y la desviacin tpica de la muestra es 5,22, sustituyendo
en el estadstico estos valores se obtiene:
t=

12 , 47 11,5
= 1, 00
5,22
29

5
Como el contraste es unilateral, buscamos en las tablas de la t de Student, con 29
grados de libertad, el valor que deja por debajo de s una probabilidad de 0,95, que resulta
ser 1,699
6
El valor del estadstico es menor que el valor crtico, por consiguiente se acepta la
hiptesis nula.
7

La interpretacin sera que no hay evidencia de que el programa sea efectivo.

2- En una muestra de 1000 nacimientos el nmero de varones ha sido 542 Puede


considerarse, con un nivel de significacin del 10%, que en general nacen ms nios que
nias?
Solucin:
1
La hiptesis nula sera que nacen igual nmero de nios que de nias, o lo que es lo
mismo que la proporcin de nios nacidos es igual 1/2.

2 Problemas de Anlisis de datos. Jos M. Salinas

Por consiguiente:

Ho P = 0,5

H1 P > 0,5

El estadstico de contraste es :

p P0
P0 Q0
n

4
Como la proporcin muestral es 542/1000 = 0,542, sustituyendo se obtiene el valor
del estadstico:
0 ,542 0 ,5
= 2 , 66
0,5 0,5
1000
5
Como el contraste es unilateral, buscamos en las tablas de la Normal el valor de la
variable que deja por debajo de s una probabilidad de 0,9, este valor es 1,282.
6
El valor del estadstico 2,66 es mayor que el valor crtico 1,282 por consiguiente, se
rechaza la hiptesis nula.
7

Efectivamente, nacen en mayor proporcin ios que nias.

3- En una muestra de 66 alumnos se ha calculado el coeficiente de correlacin de Pearson


entre sus puntuaciones en el primer parcial de Anlisis de Datos y el tiempo que se emplea en
desplazarse desde su domicilio hasta la Facultad, obtenindose que r vale 0,24. Podemos
mantener, con un nivel de confianza del 95%, la idea de que estas variables son incorreladas,
o por el contrario debemos rechazarla.
Solucin:
1

Ho

= 0

H1

El estadstico de contraste es:

Sustituyendo tenemos:

t=

r n2
1 r2

0, 24 64
1 0, 0576

= 1, 98

5
El contraste es bilateral, por ello buscamos en las tablas de la t de Student, con 60
grados de libertad (el valor ms prximo a 64 que figura en nuestras tablas), el valor que deja

Temas 10 y 11. Contrastes paramtricos de hiptesis. 3

por debajo una probabilidad de 0,975 que es 2. Por tanto la regin de aceptacin ser el
intervalo (-2 ,, 2).
6
El valor del estadstico pertenece a la regin de aceptacin, por consiguiente se acepta
la hiptesis nula.
7
No existe correlacin entre ambas variables, de donde se deduce que el tiempo
empleado no influye en la calificacin.

4- Las puntuaciones en un test de razonamiento abstracto siguen una distribucin Normal de


media 35 y varianza 60. Para evaluar un programa de mejora de las capacidades intelectuales,
a 101 individuos que estn realizando este programa se les pasa el test, obtenindose una
media de 50 puntos y una varianza de 80 Puede asegurarse, a un nivel de confianza del 90%,
que el programa incrementa las diferencias individuales en esta variable?
Solucin:
1

H0 2 = 60

H1 2 > 60

El estadstico de contraste es:


nS 2
20

Sustituyendo en el estadstico obtenemos:


101 80
60

= 134 ,7

5
Como el contraste es unilateral buscamos en las tablas de la Ji-cuadrado, con 100
grados de libertad, el valor de la variable que deja por debajo de s una probabilidad de 0,9,
este valor es 118,5.
6
El valor del estadstico es mayor que el valor crtico, por consiguiente se rechaza la
hiptesis nula.
7
En efecto, la varianza es significativamente mayor lo que indica que ha aumentado la
dispersin de la puntuaciones lo que indica que se han incrementado las diferencias entre los
individuos.

5- Las notas obtenidas en Anlisis de Datos de 5 individuos elegidos al azar del grupo T1 y
de 6 individuos, elegidos tambin al azar, del grupo T2 son las siguientes:

4 Problemas de Anlisis de datos. Jos M. Salinas

T1
T2

10
4

6
8

4
6

5
6

4
2

Puede concluirse a un nivel de confianza del 95% que las puntuaciones medias de ambos
grupos son iguales? o por el contrario que hay diferencia entre ambas.
Solucin:
1

Ho 1 = 2

H1 1 2

El estadstico de contraste en este caso es:


t=

x1 x 2
n1 S12 + n2 S 22 1
1
+
n1 + n 2 2 n1 n2

4
La muestra del grupo T1 tiene una media de 5,8 y una varianza de 4,96. En la muestra
del grupo T2 la media es 4,83 y la varianza 4,14 sustituyendo en el estadstico estos valores
se obtiene:
5,8 4,83
= 0,68
5 4,96 + 6 4,14 1 1
+
5 6
5+62

t=

5
Como el contraste es bilateral, buscamos en las tablas de la t de Student, con 9
grados de libertad, el valor que deja por debajo de s una probabilidad de 0,975, que resulta
ser 2,262
6
El valor del estadstico es menor que el valor crtico, por consiguiente se acepta la
hiptesis nula.
7
La interpretacin sera que no hay evidencia de diferencias significativas entre ambos
grupos.

6- Para comprobar la utilidad de una tcnica de enriquecimiento motivacional un investigador


pasa una prueba de rendimiento acadmico a una muestra de 16 sujetos. Despus aplica su
tcnica de enriquecimiento y tras ello, vuelve a pasar la prueba de rendimiento. Los resultados
fueron los siguientes:
1

10 11 12 13 14 15 16

Temas 10 y 11. Contrastes paramtricos de hiptesis. 5

8
9

12
16

14
23

11
21

16
17

6
10

11
14

9
8

10
11

10
12

19
19

12
16

17
16

8
13

13
17

12
11

A un nivel de confianza del 95%, Podemos rechazar que los rendimientos acadmicos son
iguales antes que despus frente a la alternativa de que se produce una mejora?
Teniendo en cuenta que los sujetos son los mismos en ambas muestras se trata de un contraste
de igualdad de medias con datos emparejados, por consiguiente:
Solucin:
1

Ho d = 0

H1 d > 0

El estadstico de contraste en este caso es:


t=

xd
Sd
n 1

4 En primer lugar calculamos las diferencias muestrales


Pre
Pos
Dif.

8
9
1

12
16
4

14
23
9

11
21
10

16
17
1

6
10
4

11
14
3

9
8
-1

10
11
1

10
12
2

19
19
0

12
16
4

17
16
-1

8
13
5

13
17
4

12
11
-1

La media de las diferencias es 2,81 y la desviacin tpica 3,19, sustituyendo en el estadstico


estos valores se obtiene:
t=

2 , 81
= 3, 41
3,19
15

5
Como el contraste es unilateral, buscamos en las tablas de la t de Student, con 15
grados de libertad, el valor que deja por debajo de s una probabilidad de 0,95, que resulta
ser 1,753
6
El valor del estadstico es mayor que el valor crtico, por consiguiente se rechaza la
hiptesis nula.
7
La interpretacin sera que que el programa es efectivo e incrementa el rendimiento
acadmico.

Tema 12. Contrastes No Paramtricos. 1

Problemas resueltos. Tema 12

1.- En una partida de Rol se lanza 200 veces un dado de cuatro caras obtenindose 60
veces el nmero 1, 45 veces el nmero 2, 38 veces el nmero 3 y 57 veces el nmero 4.
Se puede aceptar, a un nivel de confianza del 95%, que estos resultados corresponden a
un dado homogneo.
Solucin:
1 La hiptesis nula ser que el dado es homogneo, esto implica que la distribucin de
los nmeros es uniforme, es decir que los cuatro nmeros tienen una probabilidad de
aparecer de 0,25.
2 La hiptesis alternativa ser que la distribucin no es uniforme.
3 Como la variable es discreta utilizaremos el test Ji-cuadrado de bondad de ajuste a
una distribucin.
4 En la tabla siguiente se han realizado todos los clculos necesarios, obtenindose el
valor 4,36 para el estadstico de contraste.
xi
1
2
3
4

ni
60
45
38
57
200

pi
0,25
0,25
0,25
0,25

Npi
50
50
50
50

ni-np i
10
-5
-12
7

(ni-np i)2
100
25
144
49

(ni-np i)2 /np i


2
0,5
2,88
0,98
4,36

5 Como el estadstico tena 4 sumandos, buscamos en las tablas de la Ji-cuadrado con 3


grados de libertad el valor que deja por debajo una probabilidad de 0,95 y obtenemos
que el valor crtico es 7,81.
6 Como el valor del estadstico es inferior al valor crtico, aceptamos la hiptesis nula.
7 Estos resultados son compatibles con el hecho de que el dado sea homogneo.
2.- En una encuesta preelectoral realizada a 500 personas se obtuvo la siguiente
distribucin en funcin de sus edades y de su intencin de voto:

Partido
A
B
C
D

Edad
18 35
10
15
45
30

35 50
40
70
60
30

50 o ms
60
90
35
15

A un nivel de confianza del 90% Puede afirmarse que la intencin de voto es


independiente de la edad?

2 Problemas de Anlisis de datos. Jos M. Salinas

Solucin:
1 La hiptesis nula es que las dos variables son independientes.
2 La hiptesis alternativa es que hay relacin entre ambas variables.
3 Se trata de un contraste de independencia entre dos variables, por consiguiente el
estadstico de contraste a utilizar es el estadstico Ji-cuadrado para tablas de
contingencia.
4 Las tablas siguientes presentan los clculos del estadstico:

Partido
A
B
C
D

Edad
18 35
10
15
45
30
100

35 50
40
70
60
30
200

50 o ms
60
90
35
15
200

110
175
140
75
500

A partir de las frecuencias marginales de la tabla anterior, se obtienen las frecuencias


esperadas que aparecen a continuacin:

Partido
A
B
C
D

Edad
18 35
22
35
28
15

35 50
44
70
56
30

50 o ms
44
70
56
30

Por consiguiente las discrepancias entre frecuencias empricas y frecuencias esperadas


son:

Partido
A
B
C
D

Edad
18 35
-12
-20
17
15

35 50
-4
0
4
0

50 o ms
16
20
-21
-15

35 50
16
0
16
0

50 o ms
256
400
441
225

Los cuadrados de las discrepancias son:

Partido
A
B
C
D

Edad
18 35
144
400
289
225

Dividiendo por las frecuencias esperadas se obtiene:

Tema 12. Contrastes No Paramtricos. 3

Partido
A
B
C
D

Edad
18 35
6,55
11,43
10,32
15
43,30

35 50
0,36
0
0,29
0
0,65

50 o ms
5,82
5,71
7,88
7,5
26,91

70,86

Sumando, se obtiene el valor del estadstico 70,86.


5 Como la edad presenta tres intervalos y los partidos son cuatro, el estadstico tendr
(3 - 1)(4 -1 ) = 6. Buscamos en las tablas de la distribucin Ji-cuadrado con 6 grados
de libertad el valor de la variable que deja por debajo una probabilidad de 0,9
encontramos que el valor crtico es 10,64.
6 Como el valor del estadstico es mayor que el valor crtico rechazamos la hiptesis
nula de que ambas variables son independientes.
7 La edad cambia la intencin de voto.
3.- Los tiempos de respuesta de 9 sujetos en una tarea de reconocimiento de palabras,
previamente presentadas, han sido los siguientes:
115, 98, 123, 109, 112, 87, 118, 104, 116
A un nivel de confianza del 95% Son compatibles estos resultados con la hiptesis de
que el tiempo de reaccin en esta tarea sigue una distribucin Normal de media 110 y
desviacin tpica 10?
Solucin:
1 La hiptesis nula es que los datos proceden de una Normal (110, 10).
2 La hiptesis alternativa es que no siguen esa distribucin Normal.
3 Como la variable es continua, y la hiptesis nula especifica totalmente la distribucin
utilizaremos el test de Kolmogoroff-Smirnoff, cuyo estadstico de contraste es:
max | Fn (xi ) - Mn (xi) |
4 los clculos del estadstico se especifican en la siguiente tabla:
xi
87
98
104
109
112
115
116
118
123
zi
-2,3
-1,2
-0,6
-0,1
0,2
0,5
0,6
0,8
1,3
Fn
0,0107 0,1151 0,2743 0,4602 0,5793 0,6915 0,7257 0,7881 0,9032
Mn
0,1111 0,2222 0,3333 0,4444 0,5556 0,6667 0,7778 0,8889
1
|Fn -Mn | 0,1004 0,1071 0,059 0,0158 0,0237 0,0248 0,0521 0,1008 0,0968
5 Buscando en las tablas del test Kolmogoroff-Smirnoff para n = 9 el valor crtico para
un nivel de confianza del 95% se obtiene 0,43001.

4 Problemas de Anlisis de datos. Jos M. Salinas

6 Como el valor del estadstico 0,1071 es menor que el valor crtico se acepta la
hiptesis nula.
7 A un nivel de confianza del 95% no hay evidencia en contra de que el tiempo de
reaccin siga una distribucin N(110, 10).
4.- En la encuesta telefnica realizada el pasado curso por los alumnos los resultados
fueron muy dispares, mientras algunos realizaron las cuatro entrevistas programadas
otros no consiguieron cumplimentar ninguna de ellas. La distribucin del nmero de
entrevistas conseguidas por los 57 alumnos que participaron en el proyecto fue la
siguiente:
N entrevistas
0
1
2
3
4
Total

N alumnos
6
16
24
9
2
57

A un nivel de confianza del 90% Puede afirmarse que estas diferencias han sido
debidas al azar? O por el contrario estn motivadas por alguna otra causa.
1 La hiptesis nula de que los resultados obtenidos son debidos al azar implica que en
todas las llamadas hay la misma probabilidad de conseguir respuesta y que el resultado
de cada llamada es independiente de las restantes. Entonces el nmero de entrevistas
conseguidas por cada alumno es la suma de cuatro variables de Bernouilli y por
consiguiente, la distribucin sera una Binomial con n = 4 y P desconocida.
2 La hiptesis alternativa es que no siguen esa distribucin Binomial.
3 Como la variable es discreta y adems la hiptesis nula no especifica totalmente la
distribucin utilizaremos el test Ji-cuadrado de bondad de ajuste.
4 Para calcular el valor del estadstico necesitamos las probabilidades de los valores,
para ello es preciso estimar previamente el valor de P a partir de los datos de la muestra.
El total de llamadas ha sido 574 = 228.
Las llamadas con xito han sido 116 + 224 + 39 + 42 = 99.
La proporcin es 99/228 = 0,4342.
Las probabilidades aplicando la funcin de probabilidad de la distribucin Binomial
sern:
4
Pr( x = 0) = 0,4342 0 0,56584
0

= 0,1025

4
Pr( x = 1) = 0,43421 0,56583
1

= 0,3146

Tema 12. Contrastes No Paramtricos. 5

4
Pr( x = 2) = 0,4342 2 0,5658 2
2

= 0,3621

4
Pr( x = 3) = 0,4342 3 0,56581
3

= 0,1853

4
Pr( x = 4) = 0,4342 4 0,56580 = 0,0355
4
El resto de los clculos necesarios para obtener el valor del estadstico aparecen
ordenados en la tabla siguiente:
xi
0
1
2
3
4

ni
6
16
24
9
2
57

pi
0,1025
0,3146
0,3621
0,1853
0,0355

npi
5,84
17,93
20,64
10,56
2,02

ni-np i
0,16
-1,93
3,36
-1,56
-0,02

(ni-np i)2
0,03
3,72
11,29
2,43
0

(ni-np i)2 /np i


0,005
0,207
0,547
0,230
0
0,989

5 El estadstico tiene 5 sumandos, pero como hemos estimado un parmetro, debemos


buscar en las tablas de la Ji-cuadrado con 3 grados de libertad. El valor de la variable
que deja por debajo una probabilidad de 0,9 es 6,25.
6 Como el valor del estadstico 0,989 es menor que el valor crtico, 6,25 se acepta la
hiptesis nula.
7 Los resultados obtenidos por los alumnos pueden ser fruto del azar.

Tema13. Regresin. 1

Problemas resueltos. Tema 13


1- En una tarea de clasificacin de patrones que constaba de 10 lminas se obtuvieron los
siguientes datos de las diferencias de las distancias logartmicas del estmulo a clasificar con
respecto a los prototipos de las dos clases en que poda ser encuadrado y del nmero de
errores cometidos por los sujetos:
Lmina
Diferencia
N errores

1
0,71
12

2
0,67
10

3
1,98
4

4
1,61
2

5
0,67
6

6
1,48
5

7
0,25
16

8
1,44
3

9
1,06
4

10
0,95
8

a) Calcule el coeficiente de correlacin de Pearson e interprete el resultado.


b) Determine la recta de regresin que permite predecir el nmero de errores en funcin de la
diferencia entre las distancias.
c) De acuerdo con el modelo anterior, indique cual tiene que ser la diferencia para que no
haya errores.
Solucin:
a) Comenzamos calculando media, varianza y desviacin tpica de ambas variables
2
Dl = 1,082 SDl
= 0 ,256 S Dl = 0,506
2
E = 7 S E = 18 S E = 4 ,243

Calculamos la covarianza
S EDl

E Dl E Dl
n

= 5, 794 7 ,574

= 1, 78

El coeficiente de correlacin ser:


r =

S EDl
S E S Dl

1,78
4 , 243 0 ,506

= 0 ,829

El signo negativo del coeficiente de correlacin nos indica que la relacin entre ambas
variables es inversa, es decir que al aumentar la distancia disminuye el nmero de errores. El
valor absoluto nos indica que la relacin lineal entre distancia y nmero de errores es bastante
alta, por consiguiente las variaciones en el nmero de errores en esta tarea se pueden explicar
y predecir en gran medida, por la diferencia de las distancias de los estmulos a clasificar.
b) Para determinar la recta de regresin E = aDl + b calculamos los valores de los
coeficientes a y b mediante las expresiones obtenidas por el mtodo de mnimos cuadrados:
SEDl
1, 78
a =
=
= 6 ,953
2
S Dl
0, 256

2 Problemas de Anlisis de datos. Jos M. Salinas

E aDl = 7 + 6, 953 1,082

= 14 ,523

Luego la recta ser E = -6,953Dl + 14,253


c) Haciendo cero el nmero de errores en la expresin anterior tenemos:
0 = -6,953Dl + 14,503, despejando obtenemos Dl = -14,503/-6,953 = 2,089
Tngase en cuenta que no se trata de predecir la distancia en funcin del nmero de errores,
sino de buscar en que punto corta la recta de regresin el eje de abscisas. Es decir para que
valor de la distancia se hace cero E.
2- En el mismo trabajo del problema anterior, se calcul tambin la diferencia de las distancias
eucldeas del patrn a clasificar con respecto a los prototipos de ambas clases, obtenindose
el siguiente resultado:
Lmina
Diferencia

1
9,98

2
9,97

3
9,93

4
9,92

5
9,99

6
9,99

7
9,93

8
9,93

9
9,97

10
8,00

Indique que distancia le parece mas adecuada para expresar la dificultad de la tarea y porqu.
Solucin:
Calculamos la media, varianza y desviacin tpica de las diferencias de distancias eucldeas:
2
De = 9 , 761 S De
= 0, 345 S De = 0,588
Calculamos la covarianza entre el nmero de errores y esta distancia
S EDe

E De E De
n

= 68 ,146 68, 327 =

0 ,181

Por consiguiente el coeficiente de correlacin de Pearson entre el nmero de errores y la


diferencia de las distancias eucldeas valdr:
r =

SEDe
S E S De

0,181
4 , 243 0 ,588

= 0 ,073

Comparando ambos coeficientes de correlacin se ve que la diferencia de distancias


logartmicas explica mucho mejor el nmero de errores que la diferencia de distancias
eucldeas.

Tema13. Regresin. 3

3- Se ha medido la motivacin ante el estudio a 38 sujetos, antes y despus de participar en


un programa de innovacin didctica. Obtenindose los siguientes datos:
Sujeto
Pre-prueba
Post-prueba

1
55
65

2
49
53

3
37
57

4
40
51

5
50
66

6
45
60

7
35
51

8
38
53

9
28
62

10
56
57

11
41
58

12
44
51

13
44
48

Sujeto
Pre-prueba
Post-prueba

14
38
48

15
56
48

16
58
64

17
38
67

18
46
48

19
57
61

20
45
59

21
58
69

22
57
64

23
62
69

24
63
62

25
46
60

26
60
61

Sujeto
Pre-prueba
Post-prueba

27
54
68

28
56
61

29
66
55

30
48
56

31
46
58

32
60
65

33
55
68

34
57
58

35
51
49

36
43
66

37
56
62

38
52
65

a) Calcule la recta de regresin que permite predecir los resultados de la post-prueba en


funcin de las puntuaciones en la pre-prueba y descomponga la varianza total de las
puntuaciones en la post-prueba en dos componentes.
b) Calcule para cada individuo la diferencia entre el valor pronosticado por la recta obtenida
en el apartado a y el valor observado.
c) Calcule la media y varianza de las diferencias obtenidas en el apartado anterior y compare
los resultados con lo obtenido en el apartado a.
d) Calcule la recta de regresin que permite deducir las puntuaciones en la pre-prueba a partir
del resultado obtenido por los sujetos en la post-prueba.
Solucin:
a) Calculamos los estadsticos bsicos de ambas puntuaciones:
2
Pr = 49 , 737 S Pr
= 78 ,194 S Pr = 8 ,843
2
Po = 59 , 026 S Po = 42 , 289 S Po = 6 ,503

S Pr Po

Pr Po Pr Po
n

= 2956 ,71 2935, 776 = 20, 934

Por consiguiente los coeficientes de la recta Po = aPr + b valdrn:


a

20 ,934
78,194

= 0, 268 b = 59 ,026 0 ,268 49 , 737 = 45, 696

Por consiguiente la recta de regresin pedida, tendr de ecuacin:


Po = 0,268Pr + 45,696
y la varianza de las predicciones ser:

4 Problemas de Anlisis de datos. Jos M. Salinas

= a 2 S P2 r

S P2o

= 0,268 2 78,194 = 5,616

Por consiguiente, la varianza de los residuos ser:


S r2

2
S Po
S P2 o

= 42,289 5,616 = 36,673

b) Sustituyendo las puntuaciones Pre en la recta de regresin, obtenida en el apartado


anterior, calculamos las predicciones para las puntuaciones Post. La diferencia entre la
puntuacin Post y esta prediccin constituye el residuo. Repitiendo esta operacin para todos
los sujetos obtenemos los siguientes datos:
Sujeto
Prediccin
Residuo

60,436

58,828

55,612

56,416

59,096

57,756

55,076

55,88

4,564

-5,828

1,388

-5,416

6,904

2,244

-4,076

-2,88

Sujeto
Prediccin
Residuo

10

11

12

13

14

15

16

53,2

60,704

56,684

57,488

57,488

55,88

60,704

61,24

8,8

-3,704

1,316

-6,488

-9,488

-7,88

-12,704

2,76

Sujeto
Prediccin
Residuo

17

18

19

20

21

22

23

24

55,88

58,024

60,972

57,756

61,24

60,972

62,312

62,58

11,12

-10,024

0,028

1,244

7,76

3,028

6,688

-0,58

Sujeto
Prediccin
Residuo

25

26

27

28

29

30

31

32

58,024

61,776

60,168

60,704

63,384

58,56

58,024

61,776

1,976

-0,776

7,832

0,296

-8,384

-2,56

-0,024

3,224

Sujeto
Prediccin
Residuo

33

34

35

36

37

38

60,436

60,972

59,364

57,22

60,704

59,632

7,564

-2,972

-10,364

8,78

1.296

5,368

c) Calculando la media y varianza de los residuos obtenemos que la media es 0,0008 y la


varianza 36,687. Como vemos la media de los residuos es prcticamente nula y la varianza
coincide con la que habamos deducido tericamente.
d) Tenemos que calcular los coeficientes de la ecuacin Pre = a'Post + b que sern:
a =
b =

Pr a Po

S Pr Po
2
S Po

20 ,934
42 ,289

= 0, 495

= 49 ,737 0, 495 59 ,026 = 20 ,519

Con lo cual la ecuacin resulta ser Pre = 0,495Post + 20,519

Tema 14 Anlisis de Varianza. 1

Problemas resueltos. Tema 14 Anlisis de Varianza


1.- Los miembros de un equipo ciclista se dividen al azar en tres grupos que entrenan
con mtodos diferentes. El primer grupo realiza largos recorridos a ritmo pausado, el
segundo grupo realiza series cortas de alta intensidad y el tercero trabaja en el gimnasio
con pesas y se ejercita en el pedaleo de alta frecuencia. Despus de un mes de
entrenamiento se realiza un test de rendimiento consistente en un recorrido
cronometrado de 9 Km. Los tiempos empleados fueron los siguientes:
Mtodo I
15
16
14
15
17

Mtodo II
14
13
15
16
14

Mtodo III
13
12
11
14
11

A un nivel de confianza del 95% Puede considerarse que los tres mtodos producen
resultados equivalentes? O por el contrario Hay algn mtodo superior a los dems?
Solucin:
Comenzamos calculando los totales y los cuadrados de los totales divididos por el
nmero de observaciones:

Suma
Sum2 /n

Metd. I
77
1185,8

Metd. II
72
1036,8

Metd. III
61
744,2

Total
210
2966,8

Sum2 /n
2940

A continuacin calculamos los cuadrados de las observaciones y su total:


Metd. I
225
256
196
225
289
1191

Metd. II
196
169
225
256
196
1042

Metd. III
169
144
121
196
121
751

2984

A partir de estas cantidades bsicas calculamos las Sumas de Cuadrados:


SC(total) = 2984 - 2940 = 44
SC(intra) = 2984 2966,8 = 17,2
SC(entre) = 2966,8 2940 = 26,8
Los cuadrados medios sern:
CM(entre) = 26,8/2 = 13,4
CM(intra) = 17,2/12 = 1,43
Por consiguiente el estadstico de contraste vale:

2 Problemas de Anlisis de Datos. Jos Mara Salinas

F = 13,4/ 1,43 = 9,37


El valor de la F terica con 2 y 12 grados de libertad, a un nivel de confianza del 95% es
3,89. Por consiguiente se rechaza la hiptesis nula y se concluye que los tres mtodos de
entrenamiento producen diferencias significativas.

2.- Una lista de palabras sin sentido se presenta en la pantalla del ordenador con cuatro
procedimientos diferentes, asignados al azar a un grupo de sujetos. Posteriormente se
les realiza una prueba de recuerdo de dichas palabras, obtenindose los siguientes
resultados:
Procdmt. I
5
7
6
3
9
7
4
2

Procdmt. II
9
11
8
7
7

Procdmt. III
8
6
9
5
7
4
4

Procdmt. IV
1
3
4
5
1
4

Qu conclusiones pueden sacarse acerca de las cuatro formas de presentacin, con un


nivel de significacin del 5%?
Solucin:
Comenzamos calculando los totales y los cuadrados de los totales divididos por el
nmero de observaciones:

Suma
Sum2 /n

Proc. I
43
231,1

Proc. II
42
352,8

Proc. III
43
264,1

Proc. IV
18
54

Total
146
902

A continuacin calculamos los cuadrados de las observaciones y su total:


Procdmt. I
25
49
36
9
81
49
16
4
269

Procdmt. II
81
121
64
49
49

Procdmt. III
64
36
81
25
49
16
16

Procdmt. IV
1
9
16
25
1
16

364

287

68

988

A partir de estas cantidades bsicas calculamos las Sumas de Cuadrados:

Sum2 /n
819,8

Tema 14 Anlisis de Varianza. 3

SC(total) = 988 819,8 = 168,2


SC(intra) = 988 902 = 86
SC(entre) = 902 819,8 = 82,2
Los cuadrados medios sern:
CM(entre) = 82,2/3 = 27,4
CM(intra) = 86/22 = 3,9
Por consiguiente el estadstico de contraste vale:
F = 27,4/ 3,9 = 7,03
El valor de la F terica con 3 y 22 grados de libertad, a un nivel de confianza del 95% es
3,05. Por consiguiente se rechaza la hiptesis nula y se concluye que los cuatro
procedimientos de presentacin producen diferencias significativas.

You might also like