You are on page 1of 184

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$

(67$'67,&$'(6&5,37,9$

ESTADSTICA DESCRIPTIVA

N 1.- Hallar: Media, moda, mediana, 1er cuartil, 6 decil, 52 percentil de la siguiente
distribucin:
Xi
ni

1
2

2
15

3
9

4
6

5
3

6
1

Solucin

Xi
ni
; Q

Ni

1
2
2

2
15
30

3
9
27

4
6
24

5
3
15

6
1
6

17

26

32

35

36

;  Q

104
= 2,89
36

MEDIA

MODA

Mo = Valor de la variable que ms veces se repite = 2

104

MEDIANA
Me = Valor de la variable que deja por debajo suya el 50% de los
valores, valor central de la distribucin
36
1
=
= 18 Valor de la variable cuya frecuencia acumulada sea 18, en este caso
2
2
Me = 3
T

1
4

36
= 9 Valor de la variable que deja el 25% de los valores debajo suya, el valor
4

de la variable que ocupa el lugar 9

60
100

Percentil 52
T

52
100

1
4

=2

60
36 = 21,6 El valor de la variable que ocupa el
100

52
36 = 18,72
100

El valor de la variable que ocupa el lugar 19

6 decil es = al percentil 60
lugar 22

60
100

=3
T

60
100

=3

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 2.- De las 283 personas encuestadas en 1993 sobre si se encontraban afiliados a algn
sindicato, 86 contestaron afirmativamente. Con los resultados afirmativos y clasificados
segn la edad obtenemos la siguiente tabla:
Edad
N personas
Marca de clase
;  Q

25-35
45
30
1350

35-45
23
40
920

45-55
15
50
750

55-65
3
60
180

Ni

45

68

83

86

86
3200

Hallar: Media aritmtica. Mediana. Moda. 1er cuartil, 6 decil y 52 percentil.


Solucin
; = edad de las personas encuestadas
Media =

;  Q
1

3200
= 37,21
86

Mediana = Me

86
= 43
2
el intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y
44, es decir el intervalo (25 - 35)
Intervalo mediano es el intervalo que contiene a la mediana, como N/2 es

Me =

1
2

1
1
1 1
86 0
1
2
2
= / 1 +
&  = 25 +
10 = 34,55
Q
45


Moda = Mo
Intervalo modal es aquel que contiene la moda, la moda se encuentra en el intervalo
que presenta mayor densidad de frecuencia, en este caso como los intervalos son de
igual amplitud, el de mayor densidad de frecuencia coincide con el de mayor
frecuencia, es decir el intervalo (25 - 35), y dentro de l consideramos como la
moda, la marca de clase, es decir
Moda = Mo = 30.
Tambin podemos aplicar la formula:
Q 

0 

/  1 

F  1
Q  1
F 

Q  1

 

Como todos los ci son iguales la formula

F 
1

nos queda:
0

= / 1 +

Q
Q

+1

+1

+ Q 1

= 25 +

23
10 = 35 . es la moda
23 + 0

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 3.- Calcular los datos que faltan en la siguiente tabla:


Li-1 - Li
0 - 10
10 - 20
20 - 30
30 - 100
100 - 200

ni
60
n2
30
n4
n5

fi
f1
0,4
f3
0,1
f5

Ni
60
N2
170
N4
200

Solucin
N = 200
N2 = N3 - n3 = 170 - 30 = 140
N2 = N2 - n1 = 140 - 60 = 80

f4 =

n4 = f4 N = (0,1) 200 = 20

N4 = N3 + n4 = 170 + 20 = 190
n5 = N5 - N4 = 200 - 190 = 10
f1 =

f3 =

f5 =

60
= 0,3
200

30
= 0,15
200

10
= 0,05
200

La tabla completa queda:


Li-1 - Li
0 - 10
10 - 20
20 - 30
30 - 100
100 - 200

ni
60
80
30
20
10

fi
0,30
0,40
0,15
0,10
0,05

Ni
60
140
170
190
200

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 4.- Se desea conocer la media de edad de los tres grupos de teatro infantil que funcionan
en un barrio.
Grupo A:
Aos
N nios
2
6
3
7
4
8
5
9

Grupo B:
Aos N nios
5
1
7
2
2
1
3
1

Grupo C:
Aos N nios
7
2
9
3
2
9
13
1

Solucin

X = edad de los nios


GRUPO A
aos
2
3
4
5

N nios
6
7
8
9
30

Xini
12
21
32
45
110

N nios
1
2
1
1
5

Xini
5
14
2
3
24

N nios
2
3
9
1
15

Xini
14
27
18
13
72

= 30
;

;LQL
1

110
= 3,66 aos
30

GRUPO B
aos
5
7
2
3

= 5
=

;LQL
1

24
= 4,8 aos
5

GRUPO C
aos
7
9
2
13

1

204
=
50

 1

1  1

 1

 1

C = 15
;

;LQL
1

72
= 4,8 aos
15

30(3,66) + 5 /(4,8) + 15(4,8)


=
30 + 5 + 15

DxRV

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 5.- Se ha tomado una muestra de 65 personas que leen ms de 5 revistas al mes, y se ha


clasificado segn el nivel cultural. Calcular la mediana.

Nivel cultural

N personas que leen 5 o


ms revistas
7
5
8
15
30

1. Lee sin estudios


2. Lee sin terminar primaria
3. Estudios primarios
4. Bachiller o similar
5. Universitarios

Solucin
Nivel cultural
1
2
3
4
5

ni
7
5
8
15
30
65

Ni
7
12
20
35
65

Mediana Me = Valor de la variable que divide a la distribucin en dos partes


iguales. Valor de la variable que ocupa el lugar central.
Valor de la variable que deja por debajo suya el 50% de los valores.
Como N/2 es 32,5, ser el valor de la variable que ocupa el lugar inmediatamente
siguiente al 32,5; en nuestro caso el nivel 4 "bachiller o similar"
Luego: El 50% de las personas que leen 5 revistas o ms tienen un nivel cultural igual o
inferior a "bachiller" y lgicamente el otro 50% tienen un nivel superior a "bachiller".

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 6.- Se desea estudiar las alturas de un grupo de 20 alumnos, a travs de sus promedios.
Realizar el estudio:1) Con los datos sin agrupar.
2)Con los datos agrupados en intervalos de amplitud 10 cm.
Las alturas fueron expresadas en cm.: 162-166-168-170-172-174-180-164-166-168168-172-178-182-164-166-168-170-176-188.
Solucin
X = altura de los alumnos
1 Sin agrupar:
Xi
162
164
166
168
170
172
174
176
178
180
182
188

ni
1
2
3
4
2
2
1
1
1
1
1
1
20

Ni
1
3
6
10
12
14
15
16
17
18
19
20

Xini
162
328
498
672
340
344
174
176
178
180
182
188
3422

N = 20
N/2 = 10

;  Q




0HGLD

 ;

i Q

3.422

20

FP

Moda Mo = Valor de la variable que ms veces se repite, en este caso el valor


168 es la moda, que se repite cuatro veces.
Mediana Me = Valor de la variable que divide a la distribucin en dos partes
debajo suya el 50% de los valores. Como N/2 es 10, ser la media aritmtica de los
valores que ocupan los lugares 10 y 11, es decir los valores 168 y 170 por tanto la
mediana es el valor 169 cm.
2 Con los datos agrupados:
Li-1 - Li
160 - 170
170 - 180
180 - 190

Xi

ni

Ni

Xini

165
175
185

10
7
3
20

10
17
20

1650
1225
555
3.430

  = 3.430
X n = 3.430
=
; Q

N
20
= 171,5 cm.

Moda: Intervalo modal es aquel que contiene la moda, la moda se encuentra en


el intervalo que presenta mayor densidad de frecuencia, en este caso como los
intervalos son de igual amplitud, el de mayor densidad de frecuencia coincide con
el de mayor frecuencia, es decir el intervalo (160 - 170), y dentro de l
consideramos como la moda, la marca de clase, es decir
6

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

Moda = 165 cm.


Tambin podemos aplicar la formula:
Q 
/ 
1 

0 

F 
1
Q 

F 

Q 
1

 

Como todos los ci son iguales la formula

F 
1

nos queda:
0

/

 1

Q
Q

1  Q  1

F

160 

7
70

10 170 cm. es la moda

Mediana Me Intervalo mediano es el intervalo que contiene a la mediana, como


N/2 es 10 el intervalo mediano es aquel que contiene a los valores que ocupan los
lugares 10 y 11, es decir el intervalo (160 - 170) contiene el valor que ocupa el
lugar 10 y el intervalo (170 - 180) contiene el valor que ocupa el lugar 11, la
mediana ser entonces el valor 170 cm.
Como vemos hay pequeas diferencias. Lo que se consigue agrupando los datos es
rapidez y facilidad de clculos a cambio de perder informacin

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 7.- La siguiente distribucin se refiere a la duracin en horas de un lote de 500 tubos


fluorescentes:
DURACIN EN HORAS
300 - 499
500 - 699
700 - 1.099
1.100 - O MS
TOTAL

NMERO DE TUBOS
50
150
275
25
500

1.- Representar el histograma de frecuencias relativas y el polgono de frecuencias


2.- Trazar la curva de frecuencias relativas acumuladas
3.- Determinar el nmero mnimo de tubos que tienen una duracin inferior a 900 horas.
Solucin
X = duracin, en horas, de tubos fluorescentes

3.-

1
50+150+ 275 = 337,5 tubos
2
U

100

= 900

100

= 700 + 100

500 200
275

400 = 900

(900 700)275
100
=
+ 200
= 67,5%
400

500

67,5% de 500 = 0,675 (500) = 337,5 tubos. El nmero mnimo de tubos con una
duracin inferior a 900 horas sern 338 tubos.

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 8.- Calcular: Media, moda, mediana, 1er y 3er cuartil. Varianza, desviacin tpica y
coeficiente de variacin. De los siguientes datos obtenidos de una investigacin en un
establecimiento benfico que tiene acogidos a 112 personas de diversas edades:
Edad
N Personas

40-50
13

50-60
24

60-70
29

70-80
35

80-90
11

Solucin
X = edad de los personas del establecimiento benfico
Edad

40-50
45

50-60
55

60-70
65

70-80
75

80-90
85

24

29

35

11

37

66

101

112

585

1320

1885

2625

935

26325

72600

122525 196875 79475

N Personas ( Q  ) 13
13
1
;  Q

Q

;  Q
1

112
7350
497800

7350
 65,625 aos
112

Moda Mo
Intervalo que presenta mayor densidad de frecuencia, en este caso como todos los
intervalos tienen la misma amplitud, el intervalo modal es (70.- 80)  y dentro del
intervalo podemos considerar la moda igual a la marca de clase  o tambin aplicar la
formula:
Q #
/ " 1 

0 !

F # 1
Q # 1
F #

Me =

1
4

1
2

= T2
4

Q " 1

70 +

11
10 = 72,75 aos
11 + 29

F "
1

1
1
1 1$
112 37
1
2
2
= /$ 1 +
& $ = 60 +
10 = 66,55 aos
Q
29
$

1
1
1 1%
112 13
1
4
4
= /% 1 +
& % = 50 +
10 = 56,25 aos
Q
24
%

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

6(

3
4

3
3
1 1&
112 66
1
4
= /& 1 + 4
& & = 70 +
10 = 75,14 aos
Q
35
&

'

Q'

6)

&9

( )=
;

6)

 ;

497800
65,625 2 = 138
112

= 138 = 11,75 aos

6*
;

11,75
= 0,18
65,625

Como es menor de 1 podemos admitir que es homognea y al ser bastante cercano a


cero diremos que es bastante homognea, por lo que la media de la distribucin ser
bastante representativa del conjunto.

10

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 9.- Las calificaciones de 150 alumnos en una determinada asignatura se distribuyen de


la siguiente manera. Calcular la media aritmtica y dar una medida de la
representatividad.
Calificaciones
N Alumnos

0-2
30

2-5
52

5-7
38

7-9
25

9-10
5

Solucin
X = calificaciones de los alumnos en una asignatura
Calificaciones
;

N Alumnos
; , Q,
;

Q-

1,

60

; . Q.

Q/

61

&9

( )=
;

61

0-2
1

2-5
3,5

5-7
6

7-9
8

9-10
9,5

30
30

52
182

38
228

25
200

5
47,5

687,5

30

637

1368

1600

451,25

4086,25

30

82

120

145

150

687,5
 4,58
150

 ;

4086,25
4,58 2 = 6,23
150

= 6,23 = 2,497

62
;

2,497
= 0,5451
4,58

Como es menor de 1 podemos admitir que es homognea diremos que la media de la


distribucin es bastante representativa del conjunto.

11

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 10.- Dada la siguiente distribucin relativa a una muestra de 100 personas que emigran
de una zona rural a una urbana clasificada segn la edad.
a).- Calcular: media, mediana y moda.
b).- Calcular el recorrido intercuartlico.
c).- Calcular el coeficiente de variacin.
Edades
N Personas

11-20
40

21-30
30

31-50
20

51-70
10

Solucin
X = edad de las personas que emigran
Edades
3

N Personas
densidad
; 4 Q4

Q5

14

; 6 Q6
1

11 - 20
15,5

20 - 30
25

30 - 50
40

50 70
60

40
4,44
620

30
3
750

20
2
800

10
3
600

100

9610

18750

32000

36000

96360

40

70

90

100

2770

2770
 27,70 aos
100

Moda Mo
Intervalo que presenta mayor densidad de frecuencia, en este caso como todos los
intervalos no tienen la misma amplitud, el intervalo modal es (11.- 20) TXH WLHQH
PD\RU GHQVLGDG GH IUHFXHQFLD  y dentro del intervalo podemos considerar la moda
igual a la marca de clase o tambin aplicar la formula:
Q7 :
/7 9 1 

0 8

F7 : 1
Q7 : 1
F7 :

Q7 9 1
F7 9
1

30
10 9 = 20 aos
 11 +
30
+0
10

Mediana:
1

100
= 50 Ser el valor de la variable que ocupa el lugar 75, y est en el intervalo
2
2
mediano (20 30)
=

Me =

1
2

= T2
4

1
1
1 1;
100 40
1
2
= /; 1 + 2
& ; = 20 +
10 = 23,33 aos
Q
30
;

12

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1
4

1
1
1 1<
100 0
1
4
= /< 1 + 4
& < = 11 +
9 = 16,625 aos
Q
40
<

3
4

3
3
1 1=
100 70
1
4
= /= 1 + 4
& = = 30 +
20 = 35 aos
Q
20
=

Recorrido intercuartlico = Re = distancia entre el 1 y 3 cuartil =


T

Re =

6?

3
4

T1
4

>

6@

&9

( )=
;

3
4

T 1 = 35 16,625 = 18,375 aos

Q>

6@

 ;

96360
27,7 2 = 196,31
100

= 196,31 = 14 aos

6A
;

14
= 0,50
27,7

Como es menor de 1 podemos admitir que es homognea, por lo que la media de la


distribucin ser bastante representativa del conjunto.

13

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 11.- Tipificar la siguiente distribucin de frecuencias y comprobar que esta bien


tipificada.
Xi
ni

2
5

3
9

4
10

5
6

Solucin

2
3
4
5

QC

; D QD

5
9
10
6
30

10
27
40
30
107

6L

La varianza ser:

La desviacin tpica ser:

6T

=+

= P QP
1

6S

0
=0
30

6U

QE

6N

=
;

; J QJ
1

=+

; =
6M

= H QH

= I QI

6F

-1,5834
-0,5726
0,4380
1,4488

QK

=G

20
81
160
150
411

La media ser:

-7,918
-5,154
4,380
8,692
0

12,537
2,951
1,919
12,593
30

107
= 3,56667
30

411
3,56667 2 = 0,978888
30
6O

6R

=+ 1= 1

14

= + 0,97888 = 0,98938

= Q QQ
1

; =

30
02 = 1
30

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 12.- Se desea averiguar la superficie media de los pisos en 2 barrios de Pamplona:


Ermitagaa y Mendebaldea.
Del primero se toman 10 muestras y del segundo 12, con los siguientes resultados:
Ermitagaa: 125-120-90-75-100-90-65-110-80-90
Mendebaldea: 70-65-70-90-85-140-65-70-80-90-92-100
Cul es la media del conjunto de ambos barrios?
Solucin
;1

= superficie de los pisos de Ermitagaa


;
2 = superficie de los pisos de Mendebaldea
1 1 = Nmero de pisos de Ermitagaa = 10
1
2 = Nmero de pisos de Mendebaldea = 12

;1
;

125
70

;1

120
65

90
70

75
90

945
= 94,5P 2
10

100
85

90
140

65
65

; 2

110
70

80
80

90
90

92

100

945
1017

1017
= 84,75P 2
12

Lgicamente son subconjuntos excluyentes, la media del conjunto total ser la


media ponderada de las dos medias.
;

V WXV Y[Z

+ 12 ; 2
10(94,5) + 12(84,75) 1962
=
=
= 89,18 P 2
1 + 1
10
+
12
22
1
2

1;1

La superficie media de los pisos del conjunto Ermitagaa Mendebaldea es de


89,18 P 2

15

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 13.- Dada la siguiente distribucin del nmero de hijos de 100 familias, calcular
sus cuartiles:
Xi
ni
Ni
0
14
14
1
10
24
2
15
39
3
26
65
4
20
85
5
15
100
total
100
Solucin
X = nmero de hijos en una familia

1
100 = 25
4

2
100 = 50
4

3
100 = 75
4

1
4

1
4

1
4

= Valor de la variable que ocupa el lugar 25

= Valor de la variable que ocupa el lugar 50

= Valor de la variable que ocupa el lugar 75

16

1
4

2
4

3
4

=2

=3

=4

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 14.- El paro registrado en Navarra en el mes de Junio, por sexos y grupos de edad, fue:
VARONES
Li-1- Li
ni
< 20 842
20-24 1439
25-29 1412
30-34 872
35-39 628
40-44 516
45-49 453
50-54 456
55-59 666
> 59 319

MUJERES
Li-1-Li
ni
< 20 1493
20-24 3140
25-29 3381
30-34 2841
35-39 1919
40-44 1516
45-49
944
50-54
487
55-59
318
>59
101

Solucin
1.- Calcular razonadamente Media, varianza, desviacin tpica, mediana, moda
2.- Calcular razonadamente 1er cuartil, 60 percentil.
EDAD
\
/\
1 /
16-20
20-25
25-30
30-35
35-40
40-45
45-50
50-55
55-60
60-65

VARONES
;

18
22,5
27,5
32,5
37,5
42,5
47,5
52,5
57,5
62,5

Q^

1^

842
1439
1412
872
628
516
453
456
666
319
7603

842
2281
3696
4565
5193
5709
6162
6618
7284
7603

; _ Q_

15156
32377,5
38830
28340
23550
21930
21517,5
23940
38295
19937,5
263.873,5

MUJERES
;

Q`

272808
728493,75
1067825
921050
883125
932025
1022081,3
1256850
220162,5
1246093,8
10.532.314

Qa

1493
3140
3381
2841
1919
1516
944
487
318
101
16140

1b

1493
4633
8014
10855
12774
14290
15234
15721
16039
16140

<c Q c

<d

26874
70650
92977,5
92332,5
71962,5
64430
44840
25567,5
18285
6312,5
514.231,5

483732
1589625
2556881,3
3000806,3
2698593,8
2738275
2129900
1342293,8
1051387,5
394531,25
17.986.026

Qd

X = edad de los varones


Y = edad de las mujeres
VARONES
;

; e Qe
1

263.873,5
 34,7 aos
7.603

Moda Mo
Intervalo que presenta mayor densidad de frecuencia, en este caso como todos los
intervalos tienen la misma amplitud, el intervalo modal es (20-25)  y dentro del
intervalo podemos considerar la moda igual a la marca de clase  o tambin aplicar
la formula:

17

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

/f h
1 

0 g

Qf i

Ff i

Qf i

Ff i

Qf h
1

20 +

1412
5 = 23,13aos
1412 + 842

Ff h
1

1
7603 = 3801,5 Intervalo mediano = (30 35)
2

Me =

= T2

1
2

1
1
1 1j
7603 3693
1
2
= /j 1 + 2
& j = 30 +
5 = 30,62aos
Q
872
j

1
7603 = 1900,75 Intervalo = (20 25)
4

1
4

1
1
1 1k
7603 842
1
4
= /k 1 + 4
& k = 20 +
5 = 23,68aos
Q
1439
k

60
7603 = 4561,8 Intervalo = (30 35)
100
60
60
1 1l
7603 3693
1
100
100
T
& l = 30 +
5 = 34,98 aos
60 = /l 1 +
Q
872
l
100

6n

Qm

6o

&9

( )=

6o

 ;

10.532.314
34,7 2 = 180,78
7603

= 180,78 = 13,44 aos

6p

13,44
= 0,387
34,7

Como es menor de 1 podemos admitir que es homognea y al ser bastante cercano a


cero diremos que es bastante homognea, por lo que la media de la distribucin ser
bastante representativa del conjunto.
MUJERES
<

<q

514.231,5
 31,86 aos
16140
18

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

Moda Mo
Intervalo que presenta mayor densidad de frecuencia, en este caso como todos los
intervalos tienen la misma amplitud, el intervalo modal es (25-30)  y dentro del
intervalo podemos considerar la moda igual a la marca de clase  o tambin aplicar
la formula:
Qr u
/r t 1 

0 s

Fr u 1
Qr u 1
Fr u

Qr t 1

20 +

1412
5 = 23,13aos
1412 + 842

Fr t
1

1
16140 = 8070 Intervalo mediano = (30 35)
2

Me =

= T2

1
2

1
1
1 1v
16140 8014
1
2
2
= /v 1 +
& v = 30 +
5 = 30,01aos
Q
2841
v

1
16140 = 4035 Intervalo = (20 25)
4

1
4

1
1
1 1w
16140 1493
1
4
= /w 1 + 4
& w = 20 +
5 = 20,81aos
Q
3140
w

60
16140 = 9684 Intervalo = (30 35)
100
60
60
1 1x
16140 8014
1
100
100
T
=
/x
+
& x = 30 +
5 = 32,94 aos
1
60
Q
2841
x
100

6{

6|

=
=

6|

( )=

&9 <

<z

Qy

< =

17.986.026
31,86 2 = 99,2724
16140

= 99,2724 = 9,96 aos

6}
<

9,96
= 0,310
31,86

Como es menor de 1 podemos admitir que es homognea y al ser bastante cercano a


cero diremos que es bastante homognea, por lo que la media de la distribucin ser
bastante representativa del conjunto.
19

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 15.- Calcular la mediana del salario de una determinada empresa con 34 empleados.
~

;
Q

20000

30000

40000

50000

60000

15

70000 80000
2

Solucin
X = Salarios de los empleados de una empresa
20000

30000

40000

50000

60000

Q

15

1

22

28

30

34

70000 80000

1
34 = 17 Me = 50.000 Valor de la variable que ocupa el lugar central. Valor que
2
deja el 50% de los valores por debajo suya.

El 50% de los empleados de la empresa tienen un salario inferior a 50.000

20

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 16.-Se ha tomado una muestra de 45 personas que asisten a los conciertos y se ha


clasificado segn la edad obtenindose la siguiente distribucin.
Calcular la edad mediana.
Aos
N Personas

14-19
10

20-26
8

27-32
6

33-40
4

41-50
4

51-60
10

61-69
3

51-61
10
42

61-69
3
45

Solucin
Primeramente ponemos los lmites de los intervalos.
X = edad de las personas que asisten a conciertos
Aos
N Personas
1

14-20
10
10

20-27
8
18

27-33
6
24

33-41
4
28

41-51
4
32

1
45 = 22,5 Me = Valor de la variable que ocupa el lugar central. Valor que deja el
2
50% de los valores por debajo suya.
Intervalo mediano = aquel en el que se encuentra la mediana (27 33)
Aplicando la formula:

Me =

1
2

= T2
4

1
1
1 1
45 18
1
2
2
= / 1 +
& = 27 +
6 = 31,5 aos
Q
6

El 50% de las personas que asisten a conciertos tienen menos de 31,5 aos

21

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 17.-El nmero de varones jvenes clasificados segn la edad en el censo de 1987 era el
siguiente. Calcular la desviacin tpica.
;

Q

19

20

21

22

23

127

120

112

130

120

Solucin
X = edad de los varones jvenes.
19

20

21

22

23

Q

127

120

112

130

120

609

; Q

2.413

2.400

2.351

2.860

2.760

12.785

45.847 48.000 49.392

62.920

63.480

269.639

La desviacin tpica es la raz cuadrada positiva de la varianza


La varianza es la media aritmtica de los cuadrados de las desviaciones de los valores de
la variable a su media aritmtica.
Tanto la varianza como la desviacin son medidas de dispersin absoluta, nos dan una
idea de la distancia entre los valores y su media. A mayor desviacin mayor ser la
dispersin de los valores y por tanto la media aritmtica ser menos representativa.
Como medida de dispersin suele ser ms interesante el coeficiente de variacin que es
una medida de dispersin relativa, que si esta entre 0 y 1 se considera que la
distribucin es homognea, y cuanto mas se acerque a 0 ser menos dispersa, por tanto
ms homognea y la media ms representativa del conjunto.

; Q

&9

( )=
;

12.785
 20,99 21 aos
609

 ;

269.639
212 = 2,06
609

= 2,06 = 1,435 Aos

6
;

1,435
= 0,068
21

Como es menor de 1 podemos admitir que es homognea y al ser bastante cercano a


cero diremos que es bastante homognea, por lo que la media de la distribucin ser
bastante representativa del conjunto.

22

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 18.-Los ingresos mensuales de 4 personas son: 60.000, 75.000, 65.000 y 150.000 ptas.
La media aritmtica de estos valores, puede ser representativa? dgalo en %.
Solucin
;

= Ingresos mensuales en miles

60
65
75
150

1
1
1
1
4
;

; Q

&9

( )=
;

; Q

1
2
3
4

60
65
70
75
350

3.600
4.225
5.625
22.500
35.950

350
 87,5 miles
4

 ;

35.950
87,5 2 = 1.331,25
4

= 1331,25 = 36,48 miles

6
;

36,48
= 0,417 41,7%
87,5

Como es menor de 1 podemos admitir que es homognea y al ser bastante cercano a


cero diremos que es bastante homognea, por lo que la media de la distribucin ser
bastante representativa del conjunto.

23

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 19.-Los asalariados de una oficina cobran los siguientes sueldos mensuales:


Sueldo (miles)
N Empleados

10-20
40

20-30
30

30-50
20

50-70
10

1.- Obtener el Sueldo medio del asalariado.


2.- Hallar la mediana y la Moda de la distribucin de salarios y explicar su significado.
3.- Analizar la dispersin de la distribucin, mediante el coeficiente de variacin.
Solucin
X = sueldos de los asalariados de una oficina.
Sueldo (miles)

10-20
15

20-30
25

30-50
40

50-70
60

40

30

20

10

0,5

40

70

90

100

; Q

600

750

800

600

2.750

9.000

18.750

32.000

36.000

95.750

N Empleados =

1.-

100

Obtener el Sueldo medio del asalariado.


;

2.-

; Q
1

2.750
 27,5 miles
100

Hallar la mediana y la Moda de la distribucin de salarios y explicar su


significado.
1
100 = 50 La mediana es el valor de la variable que ocupa el lugar central,
2
en nuestro caso el lugar 50.
Intervalo mediano = Es aquel en el que se encuentra la mediana (20 30)

1
1
1 1
100 40
1
2
& = 20 +
10 = 23,33 miles
Me = T 1 = T 2 = / 1 + 2
Q
30

2
4
El 50% de los asalariados de esta oficina, cobran menos de 23,33 miles

Moda Mo
Intervalo que presenta mayor densidad de frecuencia, en este caso como
todos los intervalos no tienen la misma amplitud, el intervalo modal es el
que presenta mayor densidad de frecuencia, (10-20)  y dentro del intervalo
podemos considerar la moda igual a la marca de clase  o tambin aplicar
la formula:
24

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

/
1 

3.-

Q
1

F
1

30
10 10 = 20 miles
 10 +
30
+0
10

Analizar la dispersin de la distribucin, mediante el coeficiente de


variacin.
La desviacin tpica es la raz cuadrada positiva de la varianza
La varianza es la media aritmtica de los cuadrados de las desviaciones de
los valores de la variable a su media aritmtica.
Tanto la varianza como la desviacin son medidas de dispersin absoluta,
nos dan una idea de la distancia entre los valores y su media. A mayor
desviacin mayor ser la dispersin de los valores y por tanto la media
aritmtica ser menos representativa.
Como medida de dispersin suele ser ms interesante el coeficiente de
variacin que es una medida de dispersin relativa, que si esta entre 0 y 1 se
considera que la distribucin es homognea, y cuanto mas se acerque a 0
ser menos dispersa, por tanto ms homognea y la media ms
representativa del conjunto.
6

&9

( )=
;

 ;

95.750
27,5 2 = 201,25
100

= 201,25 = 14,186 miles

6
;

14,186
= 0,51
27,5

Como es menor de 1 podemos admitir que es homognea y al ser bastante


cercano a cero diremos que es poco dispersa, es decir, bastante homognea,
por lo que la media de la distribucin ser bastante representativa del
conjunto.

25

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 20.- Se han seleccionado una muestra de 176 personas que han respondido mejor a la
pregunta: Cree Vd. que dentro de un ao la situacin poltica ser mejor, igual o peor que
ahora? Se ha clasificado la respuesta segn la edad del entrevistado.
1.- Desarrollar la distribucin.
2.- Calcular medidas de tendencia central, de variabilidad o dispersin.
3.- Calcular las unidades Z para los siguientes valores: (18, 23, 29, 35, 44, 69)

15-18

19-21

22-25

26-35

36-45

46-60

61-70

10

19

27

42

42

27

Solucin

= edad de las personas que han respondido a la pregunta = marca de clase del
intervalo i-esimo

/
1 / = Intervalo i-esimo
Q

= frecuencia absoluta del intervalo i-esimo

1
I

= frecuencia absoluta acumulada hasta el intervalo i-esimo incluido


= frecuencia relativa del intervalo i-esimo

= frecuencia relativa acumulada hasta el intervalo i-esimo incluido

&

= amplitud del intervalo i-esimo

Q
&

= densidad de frecuencia

%
= 100
5,7
5,1
10,8
15,3
23,9
23,9
15,7
100
I

15-19
19-22
22-26
26-36
36-46
46-61
61-71

17
20,5
24
31
41
53,5
66

Media =

10
19
38
65
107
149
176

0,057
0,051
0,108
0,153
0,239
0,239
0,157
1

0,057
0,108
0,216
0,369
0,608
0,847
1

&

5,7
10,8
21,6
36,9
60,8
84,7
100

4
4
4
10
10
15
10

2,5
2,25
4,75
2,7
4,2
2,8
2,7

; Q

170
184,5
456
837
1722
2247
1782
7.398,5

2890
3782,25
10944
25947
70602
120214,5
117642
351.991,75

Moda

10
9
19
27
42
42
27
176

%acumulado
( ) 100)

; Q
1

7398,5
 42 aos
176

Mo
Valor de la variable que ms veces se repite
Intervalo Modal, es el intervalo en el que se encuentra la moda, en este caso como
todos los intervalos no tienen la misma amplitud, el intervalo modal es el que
presenta mayor densidad de frecuencia, (22 - 26)  y dentro del intervalo podemos
considerar la moda igual a la marca de clase o tambin aplicar la formula:
26

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

/
1 

Q
1

22 +

2,7
4 = 24,18aos
2,7 + 2,25

F
1

24,18 aos es la edad que ms veces se repite, es decir la ms comn entre los
entrevistados.
Mediana = Me
1
176 = 88 La mediana es el valor de la variable que ocupa el lugar central,
2
en nuestro caso el lugar 88.
Intervalo mediano = Es aquel en el que se encuentra la mediana (36-46)

1
1
1 1
176 65
1
2
2
& = 36 +
10 = 41,60 aos
Me = T 1 = T 2 = / 1 +
Q
41

2
4
El 50% de los entrevistados tienen una edad inferior a 41,6 aos
1 Cuartil = T 1
4

1
176 = 44 El 1 cuartil es el valor de la variable que ocupa el lugar 44.
4
Intervalo en el que se encuentra el 1 cuartil (26-36)

1
4

1
1
1 1
176 38
1
4
= / 1 + 4
& = 26 +
10 = 28,22 aos
Q
27

El 25% de los entrevistados tienen una edad inferior a 28,22 aos


3 Cuartil = T 3
4

3
176 = 132 El 1 cuartil es el valor de la variable que ocupa el lugar 132.
4
Intervalo en el que se encuentra el 3 cuartil (46-61)

3
4

3
3
1 1
176 107
1
4
4
= / 1 +
& = 70 +
15 = 54,93aos
Q
42

El 75% de los entrevistados tienen una edad inferior a 54,93 aos

Varianza =
6

Desviacin =

;
1

; =

351.991,75
42,04 2 = 232,59
176

6 

27

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

= 232,59 = 15,25 aos

Coeficiente de variacin =
&9

( )=
;

6
;

&9

( )
;

15,25
= 0,36
42,04

Como es menor de 1 podemos admitir que es homognea y al ser bastante cercano a


cero diremos que es poco dispersa, por tanto, bastante homognea, por lo que la
media de la distribucin ser bastante representativa del conjunto.

28

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 21.- La distribucin de la renta personal en 1970 segn los hogares era:


Ingresos (en miles)
60-120
120-180
180-240
240-500
500-1.000
1.000-2.000
2.000-3.000
3.000-4.000
4.000-5.000

N Hogares
3.433.103
2.129.198
1.002.469
748.196
167.814
70.025
16.477
16.916
3.411

Analizar la distribucin de la renta en ese ao.


Solucin
/
60-120
120-180
180-240
240-500
500-1000
1000-2000
2000-3000
3000-4000
4000-5000
/

90
150
210
370
750
1500
2500
3500
4500

; Q

3433103
2129198
1002469
748196
167814
70025
16477
16916
3411
7.587.612

; Q

; Q

; Q

0,4225
0,2806
0,1321
0,0968
0,0221
0,0092
0,0022
0,0022
0,0005
1

0,4525
0,7331
0,8652
0,9638
0,9859
0,9951
0,9973
0,9995
1

; Q

acumulado

308.979.270
319.379.700
210.518.490
276.832.520
125.860.500
105.037.500
41.192.500
59.216.500
15.349.500
1.462.366.500

=1

0,2113
0,2184
0,1440
0,1893
0,0861
0,0718
0,0282
0,0405
0,0104
1

0,2113
0,4297
0,5737
0,7630
0,8491
0,9209
0,9491
0,9896
1

45,25
73,31
86,52
96,38
98,59
99,51
99,73
99,95
100

21,13
42,97
57,37
76,30
84,91
92,09
94,91
98,96
100

24,21
30,34
29,15
20,08
13,68
7,42
4,82
0,99
0
130,60

130,60
= 0,187 No existe demasiada concentracin, El coeficiente
699,24

=1

est comprendido entre 0 y 1, a mayor ndice mayor concentracin.


29

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 22.- A partir de los siguientes datos sobre ingresos mensuales por hogar (en euros) de
cierta localidad
Ingreso mensual
por hogar
280-600
600-1200
1200-1800
1800-2400
2400-3000
3000-3600
3600-4200
4200-4800
4800-5400
5400-6000
6000-7000
7000-10000
10000-15000

N de hogares
15
120
150
224
270
310
358
320
208
115
35
9
1

a) Obtener razonadamente: El ingreso anual medio por hogar. Y El ingreso ms comn.


c) Si la cantidad mxima disponible para gastos de alquiler de una vivienda es la tercera
parte del ingreso mensual, qu precio sera inaccesible a la mitad de los hogares?
d) Es cierto que el 80 % de los ingresos totales de dicha poblacin recae sobre el 20 %
de los hogares con mayores ingresos?
Solucin

&

; Q

; Q

280-600
600-1200
1200-1800
1800-2400
2400-3000
3000-3600
3600-4200
4200-4800
4800-5400
5400-6000
6000-7000
7000-10000
10000-15000

320
600
600
600
600
600
600
600
600
600
1000
3000
5000

15
120
150
224
270
310
358
320
208
115
35
9
1
2.135

0.04
0.20
0.25
0.37
0.45
0.52
0.60
0.53
0.35
0.19
0.03
0.00
0.00

440
900
1500
2100
2700
3300
3900
4500
5100
5700
6500
8500
12500

30

6600
108000
225000
470400
729000
1023000
1369200
1440000
1060800
655500
227500
76500
12500
7.431.000

15
135
285
509
779
1089
1447
1767
1975
2090
2125
2134
2135

6600
114600
339600
810000
1539000
2562000
3958200
5398200
6459000
7114500
7342000
7418500
7431000

0.09
1.54
4.57
10.90
20.71
34.48
53.27
72.65
86.93
95.75
98.81
99.84
100

0.70
6.32
13.35
23.84
36.49
51.01
67.78
82.76
92.51
97.89
99.53
99.95
100

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

; Q

7.431.000
= 3.480,5621 Euros
1
2.135
2.El ingreso ms comn ser el valor que ms veces se repita, es decir la moda:
Intervalo modal, aquel en el que se encuentra la moda, es el intervalo que tenga
mayor densidad de frecuencia (3.600 4.200)

1.-

Moda =

/ 1 

F 1
Q 1
F

Q 1
F
1

320
600
 3.600 +
600 = 3.904,76 
320 310
+
600 600

Euros.
3.- Mediana = Me
1
2135 = 1067,5 La mediana es el valor de la variable que ocupa el lugar central,
2
en nuestro caso el lugar 1068
Intervalo mediano = Es aquel en el que se encuentra la mediana (3.000 3.600)
1
1
1 1
2135 779
1
2
& = 3.000 +
600 = 3.558,38 Euros
Me = T 1 = T 2 = / 1 + 2
Q
310

2
4
La tercera parte de esa cantidad (mximo a dedicar en concepto de alquiler) es de
3558,38
= 1186,13 Euros.
3
Luego una vivienda cuyo alquiler fuera mayor de 1186.13 Euros/mes no seria accesible
para la mitad de los hogares.

4.No parece a simple vista que sea cierta ya que no se aprecia excesiva concentracin.
No obstante vamos a calcular los porcentajes que los valores acumulados ; Q representan
sobre el total de ingresos 7.431.000 (que denominamos

), as como los porcentajes

acumulados de hogares sobre el total de hogares 2.135 (que denominamos


ambos en el sentido creciente de la variable Ingresos.

31

). Calculamos

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 23.- Qu transformaciones sufren la media aritmtica y la varianza de una variable


estadstica X, cuando se aumentan sus valores en K unidades? Razone su respuesta.
Solucin
Q

[1

Q1

+N

[2

Q2

[2

.
.
.
.
.

+N

+k
[ +k
3
.
.
.
.
.

.
.
.
.
.

+k
8

+N

Es un cambio de origen
Media Aritmtica
;

; Q
1

8 Q
1

+ N )Q

; Q

NQ

; Q

+N

=; +N

La media aritmtica se modifica de la misma manera que cualquier valor


Los cambios de origen le afectan a la media aritmtica
Varianza

(
=

+N ; N
1

(
=

;
1

La varianza permanece igual


Los cambios de origen NO afectan a la varianza

32

((
=

+ N )
1

+N

))

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 24.- En una caja de reclutas se han medido la altura de 110 jvenes obtenindose la
tabla:
Altura
N Jvenes

1,55-1,60
18

1,60-1,70
31

1,70-1,80
24

1,80-1,90
20

1,90-2,00
17

1.- Calclense: Los percentiles 21 y 87 y los deciles 3 y 9.


2.- Se consideran "bajos" a aquellos cuya altura est bajo el percentil 3. cul es la
altura mxima que puede alcanzar?
3.- Se consideran "altos" aquellos cuya altura est sobre el percentil 82. Cul es su
altura mnima?
4.- En qu percentil estar un joven de altura 1,78?
Solucin
1,55-1,60

1,60-1,70

1,70-1,80

1,80-1,90

1,90-2,00

18

31

24

20

17

18

49

73

93

110

Altura

N Jvenes

PERCENTIL r-esimo

= / 1

+ 100

100

DECIL r-esimo

= / 1

+ 10

&

1 1
Q

10

1 1

&

1.21
110 = 23,1
100
Valor de la variable que ocupa el lugar 24, se encuentra en el intervalo (1,60-1,70)

1.1.- Percentil 21

21
21
1 1
110 18
1
100
100
T
& = 1,60 +
0,10 = 1,6164 metros
21 = / 1 +
Q
31
100
El 21% de los jvenes miden menos de 1,6164 metros

87
110 = 95,7
100
Valor de la variable que ocupa el lugar 96, se encuentra en el intervalo (1,90 -2,00)
1.2.- Percentil 87

87
100

87
87
1 1
110 93
1
100
100
= / 1 +
& = 1,90 +
0,10 = 1,9159 metros
17
Q

El 87% de los jvenes miden menos de 1,9159 metros


33

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

3
110 = 33
10
Valor de la variable que ocupa el lugar 33-34, se encuentra en el intervalo (1,60-1,70)

1.3.- Decil 3

3
10

3
3
1 1
110 18
1
10
= / 1 + 10
& = 1,60 +
0,10 = 1,6483 metros
Q
31

Las 3 dcimas partes de los jvenes miden menos de 1,6483 metros


2.- Se consideran "bajos" a aquellos cuya altura est bajo el percentil 3. Cul es la altura
mxima que puede alcanzar?
3
Percentil 3
110 = 3,3
100
Valor de la variable que ocupa el lugar 4, se encuentra en el intervalo (1,55-1,60)
3
3
1 1
110 0
1
100
100
T
& = 1,55 +
0,10 = 1,559 metros
3 = / 1 +
Q
18
100
El 3% de los jvenes miden menos de 1,559 metros

3.- Se consideran "altos" aquellos cuya altura est sobre el percentil 82. Cul es su altura
mnima?
82
Percentil 82
110 = 90,2
100
Valor de la variable que ocupa el lugar 91, se encuentra en el intervalo (1,80-1,90)
82
82
110 73
1 1
1
100
100
T
=
/
+
& = 1,80 +
0,10 = 1,8860 metros
82
1
Q
20
100
El 82% de los jvenes miden menos de 1,8860 metros

4.- En qu percentil estar un joven de altura 1,78?


U
T

= / 1

+ 100

100

1 1

&

= 1,78 Hallar r

1,78 est en el intervalo (1,70-1,80)


U
T

= 1,70 + 100

100

Por tanto

62
100

110 49
24

= 1,78

0,10

(1,78 1,70)24
100
r =
+ 49
= 62
0,10

110

En el percentil 62

34

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 25.- Se han medido mediante pruebas los coeficientes intelectuales de 20 alumnos,


viniendo los resultados agrupados en seis intervalos de amplitud variable. Estas
amplitudes son: C1=12, C2=12, C3=4, C4=4, C5=12, C6=20. Si las frecuencias relativas
acumuladas correspondientes a cada uno de los intervalos son: 0,15; 0,15; 0,55; 0,8;
0,95; 1.
a) Formar la tabla de la distribucin de frecuencias, sabiendo que el extremo inferior del
1er intervalo es 70.
b) Dibujar el Histograma y el polgono de frecuencias absolutas. Calcular la moda.
c) Entre qu dos percentiles est comprendido un coeficiente intelectual de 98,4?
Encontrar el valor de ambos percentiles.
Al mismo grupo de alumnos se les hace una prueba de rendimiento, y los resultados nos
vienen dados en el grfico siguiente:

20
16
15
10
5
1
0

10

d) Formar la tabla de distribucin de frecuencias y calcular la mediana.


e) Qu medidas estn ms dispersas, los coeficientes intelectuales o las puntuaciones del
rendimiento?
Solucin

35

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 26.- En un convenio colectivo para mejorar las condiciones retributivas de los


trabajadores de una fbrica se est discutiendo entre dos mtodos para aumentar los
salarios:
Mtodo I: Aumentar a todo el personal una cantidad constante "c" pesetas.
Mtodo II: Aumentar a todo el personal un porcentaje fijo "p" sobre el sueldo actual.
Probar que el mtodo I hace disminuir la desigualdad entre los salarios de los trabajadores
Solucin
Lamamos X, a la variable sueldo actual. Despus de la subida salarial tenemos:
< = ; + & = Sueldo despus de la subida segn el Mtodo I
:

=. * ; = Sueldo despus de la subida segn el Mtodo II 1 +


=.
100

; Q

2
6

 ;

&9

Mtodo I
<

< Q

(
=

<

<

=+

=+

( )=

&9 <

((
=

; Q
1

+ & )

+&

&

))

+&

(
=

=6 2

= 6
6

<

+ & )Q

+&

Mtodo II
:

(
=

=+

: Q

=+

( )=

&9 :

6
:

; . Q
1

=.

((
=

* . )

; Q
1

*.

* 6 2 = . * 6
.
.

* 6
*;

6
;

= &9 ( ; )

36

= .*;

))

;
1

*6 2

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

Luego:
Con el sueldo actual

CV(X) =

Aumento Mtodo I

&9 <

Aumento Mtodo II

&9 :

( )=

( )=

6
;

6
<

6
:

6
;

+&

.
.

* 6
*;

6
;

= &9 ( ; )

Por tanto
CV (Y) < CV (W) Luego el Mtodo I presenta menor dispersin en trminos
relativos. Luego hace disminuir la desigualdad de los salarios.

37

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 27.- Con objeto de conocer determinada informacin sobre el grado de satisfaccin de


los enfermos ingresados en un hospital se han realizado 200 encuestas. La tabla recoge la
distribucin de los encuestados segn grupos de edad:
Edad
Individuos

0-20
6

20-40
40

40-50
30

50-60
28

60-70
48

70-80
40

80-90
8

1.- Edad media y desviacin tpica de los individuos ingresados


2.- Calcular los cuartiles. El 70 percentil. Y La edad ms frecuente.
3.- En una clnica privada se ha realizado la misma encuesta a 150 personas y se ha
obtenido una edad media de 55,8 aos. Calcular la edad media del conjunto de los dos
centros.
Solucin
/

 1

 /

Q

0 - 20
20 - 40
40 - 50
50 - 60
60 - 70
70 - 80
80 - 90

6
40
30
28
48
40
8
200

;
Q

;
1

10
30
45
55
65
75
85

;  Q

60
1200
1350
1540
3120
3000
680
10950

QL

600
36000
60750
84700
202800
225000
57800
667650

1

6
46
76
104
152
192
200

&

20
20
10
10
10
10
10

10950
 54,75 aos
200

 ;

667650
54,75 2 = 340,68 aos
200

= 340,68 = 18,45 aos

1
4

1
1
1 1
200 46
1
4
= / 1 + 4
&  = 40 +
10 = 41,33DxRV
Q
30

2
4

2
2
1 1
200 76
1
4
4
= / 1 +
&  = 50 +
10 = 58,57 DxRV
Q
28

3
4

3
3
1 1
200 104
1
4
4
= / 1 +
&  = 60 +
10 = 69,58DxRV
Q
48

De este modo: el 25% de los ingresados tienen menos de 41,33 aos


El 50% de los ingresados tienen menos de 58,57 aos
38

0,3
2,0
3,0
2,8
4,8
4,0
0,8

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

El 75% de los ingresados tienen menos de 69,58 aos


Percentil 70
70
200 140
100

/

70
100

 1

,QWHUYDOR

(60  70)

70
1  1 
1
100

&
Q

70
200  104
100
60 
10
48

67,5DxRV

Moda Mo Intervalo que presenta mayor densidad de frecuencia, en este caso


como todos los intervalos no tienen la misma amplitud, el intervalo modal es (60.- 70)
y dentro del intervalo podemos considerar la moda igual a la marca de clase  aos o
tambin aplicar la formula:
Q 

F  1

/  1 

0 

Q  1
F 

Q  1

60 

F 
1

40
10
40 28

10 10

10

65,88 aos

Que, como vemos, nos da muy parecido.


Media del conjunto total
Hospital

Clnica




54,75DxRV

55,8DxRV ...

1
1

200
150

Media Total

1
1

+ ;
+ 1

1

(54,75)(200) + (55,8)(150) 19320


=
= 55,2DxRV
200 + 150
350

39

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 28.- Una residencia de ancianos tiene 5 tipos de habitaciones, cuyos precios, as como
los ingresos obtenidos, son los siguientes:
Precio por habitacin
Ingresos

200
16.000

500
20.000

750
37.500

1.000
30.000

1.300
26.000

1.- Calclese razonadamente el precio medio y su representatividad.


2.- Si el coeficiente de variacin de los precios de otra residencia es 0,75 Cul de las dos
residencias presenta una estructura de precios ms homognea? Por qu?
Solucin
En primer lugar hay que hallar el nmero de habitaciones de cada precio
Como los ingresos correspondientes a las habitaciones de 200 unidades han sido 16.000
unidades esto indica que el nmero de habitaciones de este precio ser:
16000
Q
80KDELWDFLRQHV
1
200
De la misma manera:
20000
37500
Q
40KDELWDFLRQHV
Q
50KDELWDFLRQHV
2
3
500
750
30000
26000
Q
30KDELWDFLRQHV
Q
20KDELWDFLRQHV
4
5
1000
1300
Luego la distribucin de los precios por habitacin ser:
Xi

ni

X i ni

200
500
750
1000
1300

20
40
50
30
20
220

16.000
20.000
37.500
30.000
26.000
129.500

El precio medio por habitacin ser:

;  Q

&9

2
6

2
6"

;
1

ni
3.200.000
10.000.000
28.125.000
30.000.000
33.800.000
105.125.000
129.500
= 588,64XQLGDGHV
220
calcularemos el Coeficiente de

Para comprobar si este promedio es representativo


Variacin
6

Q!

 ;

105.125.000
2
6#
=
588,64 2 = 131.343,86
6 $ = + 131,343,86 = 362, 4
220
362,4
&9 ( ; )
0,61
588,64
Para poder comparar las estructuras de precios entre dos residencias, compararemos los
coeficientes de variacin de ambas. Ser ms homognea aquella que tenga menor
coeficiente de variacin. En este caso como la otra residencia tiene un coeficiente de 0,75
>0,61. Quiere decir que la primera residencia tiene una estructura ms homognea ya que
presenta menor dispersin.

40

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 29.- Una variable X tiene su desviacin tpica igual a 4 y su media es 6. Determnese la


media y la varianza de las variables. Razone el porqu de sus resultados
<

1.-

1
2

2.-

6
4

Solucin
;

1.- < =

<

1
2

1
2

<% Q %

1 =

; % 1 %
Q
2

1
;

1
= 2

; % Q%

1 Q %

1 ; % Q%
Q%
1

1
2 1

1 6 1
=
= 2,5
2
2

Los cambios de origen y de escala afectan a la media aritmtica


=+

6&

6)

6&

(
=

<

<(

Q(

; ( 1
2

2
Q(

1
=
4

;
1

Q(

1
= 6'2
4

1 * 2 6,
4
6
=
= =2
4
2
2
Los cambios de origen No afectan a la desviacin tpica
Los cambios de escala Si afectan a la desviacin tpica
6+

=+

2.- 7 =

6+

6
4

7- Q -

1
4

6 =

;- 6 Q
4

1
;

1
= 4

; - Q-

6 Q -

1 ; - Q Q6

4 1
1

6 66
=
=0
4
4

Los cambios de origen y de escala afectan a la media aritmtica


6.

=+

6.

41

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

61

63

( 0
=

=+

63

Q0

;0 6
4

2
Q0

1
=
16

1 2 2 64
4
6
=
= =1
16
4
4

Los cambios de origen No afectan a la desviacin tpica


Los cambios de escala Si afectan a la desviacin tpica
Esta variable T es precisamente la variable X tipificada
=5

;
66

6
=75
4

42

;
1

Q0

1
= 6/ 2
16

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 30.- De dos regiones con la misma poblacin, de un determinado pas, se han tomado
sendas muestras sobre las rentas percibidas. La informacin recogida es la siguiente:
REGION I
Renta (en miles)
N Familias
10-20
24
20-30
36
30-40
20
40-50
20
50-100
50

REGION II
Renta (en miles)
N Familias
05-15
10
15-25
42
25-55
35
55-75
20
75-95
13

a) Hllese la renta media de las muestras de cada regin y del conjunto de las dos regiones.
Cul de las dos rentas medias es ms representativa?
b) Es posible decir si una regin posee un nivel de vida superior a la otra, si medimos este
nivel a travs de la renta?
d) Cul es el nivel de renta percibido por un mayor nmero de familias en la primera
regin?
e) Si en la segunda regin clasificamos a una familia en el grupo en donde se encuentra el
50 % de las menos favorecidas. Cul sera el tope de renta que podra percibir?
Solucin
REGIN I
/7

/7

10-20
20-30
30-40
40-50
50-100

Q7

24
36
20
20
50

18

24
60
80
100
150

; 9 Q9

15
25
35
45
75

360
900
700
900
3750
6610

Q:

5400
22500
24500
40500
281250
374.150

&;

G<

10
10
10
10
50

Q<
&<

2,4
3,6
2
2
1

REGIN II
/<

/<

05-15
15-25
25-55
55-75
75-95

Q<

10
42
35
20
13

1<

10
52
87
107
120

<

; < Q<

10
20
40
65
85

1.- La renta media de cada regin ser:

100
840
1400
1300
1105
4745
=

43

; @ Q@
1

Q=

1000
16800
56000
84500
93925
252.225

&>

10
10
30
20
20

G?

Q?
&?

1
4,2
1,17
1
0,65

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

Regin I

Regin II

; A QA
1

; B QB
1

6.610
= 44,06
150

4.745
= 39,54
120

Conjunto de ambas Regiones:


;

C DEC FHG

+ 1 2 ; 2 150 * 44,06 + 120 * 39,54


=
= 42.05
1 + 1
150 + 120
1
2

1;1

2.- Para estudiar cual de las dos medias es ms representativa debemos calcular sus
correspondientes coeficientes de variacin. Y ser ms representativa aquella que
tenga menor coeficiente de variacin.

6O

QN

&9

6J

&9

( 2) =

6P

QL

 ;

374150
2
(44,06 ) = 553,04
150

23,52
= 0,53
44,06

Regin II

= + 553.04 = 23,52

6P

(1) =

2
6M

2
6J

 ;

6K

6M

6K

Regin I

6I

&9

6Q
;

QL

6P

 ;

6M

;
1

QL

 ;

252225
2
(39,54 ) = 538,46
120

= + 538,46 = 23,20
=

23,20
= 0,58
39,54

Por tanto la renta media de la Regin I es ms representativa que la renta media de la


Regin II, aunque la dispersin relativa de ambas no es muy diferente.
44

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

3.- Al ser los coeficientes de variacin bastante similares, la variabilidad es parecida


en ambas distribuciones, as como la representatividad de cada una de las rentas
medias. Como en la regin I la renta media es superior, podemos suponer que en esta
regin las personas disfrutan de un nivel de vida ms alto que en la regin II
4.- El nivel de renta percibido por un mayor nmero de familias en la regin I ser la
MODA.
Como la distribucin viene dada en intervalos de desigual amplitud, hallaremos el
intervalo modal, que es en el que se halla la moda, y es el que presenta mayor
densidad de frecuencia, es decir: (20 30)
Y dentro de ese intervalo tomaremos como MODA el valor central Mo = 25
O tambin podemos utilizar la formula

/R T
1 

0 S

QR U

FR U

QR U

FR U

QR T
1

20 +

2
10 = 24,56 24,18aos
2 + 2,4

FR T
1

5.- El tipo de renta que podran percibir ser la renta MEDIANA

.- Mediana = Me
1
120 = 60 La mediana es el valor de la variable que ocupa el lugar central, en
2
nuestro caso el lugar inmediatamente siguiente al 60.
Intervalo mediano = Es aquel en el que se encuentra la mediana, en el que se
encuentran los valores que ocupan los lugares 60 y 61 (25 55)

Me =

1
2

= T2
4

1
1
1 1V
120 52
1
2
2
= /V 1 +
& V = 3.000 +
30 = 31,85
Q
35
V

El 50% de las familias de la Regin II tienen una renta inferior a 31,85

45

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 31.- El Servicio Central de Correos realiza una encuesta por muestreo sobre el franqueo
medio de las cartas (en unidades monetarias) que diariamente tiene que distribuir en el
Hospital de Navarra. La informacin recogida, sobre una muestra de 500 cartas es la
siguiente:
Franqueo
N Cartas

3
145

4
132

5
84

7
50

10
48

12
22

18
10

20
8

25
1

1.- Determnese el franqueo medio en la muestra y verifquese si es representativo.


2.- Si la muestra anterior es significativa del total de cartas que diariamente se reparten en
el hospital, calclese si el servicio es rentable, teniendo en cuenta que se reparten 35.000
cartas al da y que el costo diario del servicio es de medio milln de unidades monetarias
Solucin
Franqueo

10

12

18

20

25

N Cartas

QX

145

132

84

50

48

22

10

500

; Y QY

435

528

420

350

480

264

180

160

25

2842

1305 2112 2100 2450 4800 3168 3240 3200

625

23000

Z 2 QZ

1.- Determnese el franqueo medio en la muestra y verifquese si es representativo.


; [ Q[ = 2842 = 5,684 unidades monetarias
Media aritmtica: ; =
1
500
Para verificar si esta media es representativa hallaremos el coeficiente de variacin, es
decir una medida de la dispersin relativa.
&9

6^

6\
;

1
6_

Q]

; 2 =

23000
2
(5,684) = 13,7
500

6_

=+

6_

= 13,7 = 3,7

3,7
= 0,65 Como es menor de 1 podemos decir que no hay gran dispersin y
5,684
;
por tanto la media es bastante representativa.
&9

2.- Si la muestra anterior es significativa del total de cartas que diariamente se reparten en
el hospital, calclese si el servicio es rentable, teniendo en cuenta que se reparten 35.000
cartas al da y que el costo diario del servicio es de medio milln de unidades monetarias.
Para determinar si el servicio es rentable debemos estimar los ingresos diarios por este
servicio, para ello supondremos que el franqueo medio de la muestra es el franqueo medio
del total de las 35.000 cartas, es decir el franqueo medio de la poblacin.
Ingresos = (350.000) 5,684 = 1.989.400 u.m.
Beneficio = Ingresos Costes = 1.989.400-2.000.000 = -106.000 u.m.
Como el beneficio es negativo, significa que el servicio de correos, en este supuesto No es
rentable.

46

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 32.- En unos laboratorios farmacuticos, los empleados se encuentran clasificados en


tres categoras: Tcnicos, Administrativos y Operarios; de tal forma que, en diciembre de
1988 se tena:
N
empleados

Salario
medio/mes
(En miles.)

Desviacin
tpica
(En miles.)

CV=

6[
;

Tcnicos

20

300

70

70/300= 0,233

Administrativos

50

145

22.5

22.5/145 = 0,155

operarios

130

156

42

42/ 156 = 0,261

1.- Calclese el salario medio para el conjunto de la empresa.


2.- Estdiese en qu categora de empleados existe mayor homogeneidad salarial.
Solucin
1.-

El salario medio del conjunto ser la media ponderada de los salarios


medios de cada categora:
;

1b

 1a

1b

1a

 1`

1`

(20)(300) + (50)(145) + (130)(156)


= 167,65
200

Salario medio al mes: 167.650 pesetas.


2.-

Existir mayor homogeneidad en aquella categora que tenga menor dispersin,


para poder comparar las dispersiones hallamos los coeficientes de variacin, que es
una medida de dispersin relativa, tendr mayor homogeneidad la categora que
tenga menor coeficiente de variacin, en este caso los administrativos.

CV=

6[
;

Tcnicos

70/300= 0,233

Administrativos

22.5/145 = 0,155

operarios

42/ 156 = 0,261

47

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 33.- Dada la siguiente distribucin:

/c

/c

10-20

20-30

30-40

40-50

50-60

60-70

Qc

11

15

10

Ni

7
105

18
275

33
525

43
450

48
275

50
130

; d Qd

1760

Calclese: Media, mediana, moda, tercer cuartil, sexto decil, trigsimo percentil
Solucin

Media

Mediana

; e Qe

= T2

0H

1760
 35,2
50

1
1
1 1f
50 18
1
2
= /f 1 + 2
& f = 30 +
10 = 34,66
Q
15
f

Moda Mo Intervalo que presenta mayor densidad de frecuencia, en este caso


como todos los intervalos tienen la misma amplitud, el intervalo modal es el que
presenta mayor frecuencia (30.- 30)y dentro del intervalo podemos considerar la moda
igual a la marca de clase aos o tambin aplicar la formula:
Qg j

0 h

/g i 1 

Qg j 1
Fg j

1 Cuartil

3 Cuartil

1
4

Fg j 1

Qg i 1

30 +

11
10 = 34,76
11 + 10

Fg i
1

1
1
1 1k
50 7
1
4
= /k 1 + 4
& k = 20 +
10 = 25
Q
11
k

3
4

3
3
1 1l
50 33
1
4
= /l 1 + 4
& l = 40 +
10 = 44,5
Q
10
l

6 Decil = Percentil 60
60
50 = 30 ,QWHUYDOR(30 40)
100
48

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

60
100

60
60
1 1m
50 18
1
100
= /m 1 + 100
& m = 30 +
10 = 38
Q
15
m

Percentil 30
30
50 = 15
100

30
100

,QWHUYDOR

(30 40)

30
30
1 1
50 7
n 1
100
= /n 1 + 100
& n = 30 +
10 = 37,27
Q
11
n

49

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 34.- Calcular los cuartiles de la siguiente distribucin:

/o

/o

0-1

1-2

2-3

3-4

4-5

Qo

10

12

12

10

Ni

10

22

34

44

50

Solucin

1 Cuartil

2 Cuartil

3 Cuartil

1
4

1
1
1 1p
50 10
1
4
= /p 1 + 4
&p = 1 +
1 = 1,208
Q
12
p

2
4

2
1
1 1q
50 22
1
4
= /q 1 + 4
&q = 2 +
1 = 2,25
Q
12
q

3
4

3
3
1 1q
50 34
1
4
4
= /q 1 +
&q = 3 +
1 = 3,35
Q
10
q

50

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 35.- Calcular la varianza, desviacin tpica, y coeficiente de variacin del conjunto de


datos siguiente:
r

36

25

36

64

36

188

Solucin
Xi
1
2
3
5
6
8

ni
1
2
2
1
2
1
9

Media:

Varianza:

6v

Desviacin Tpica:

=
;

; t Qt

Qu

6x

X i ni
1
4
6
5
12
8
36

 ;

6w

36
=4
9

188
4 2 = 4,89
9

X i 2 ni
1
8
18
25
72
64
188

= + 4,89 = 2,21

Para comprobar si este promedio es representativo, calcularemos el Coeficiente de


Variacin
6y
2,21
= 0,55
Coeficiente de variacin: &9 =
=
4
;
Si, es representativo ya que el CV es menor de 1

51

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 36.- Las edades de los alumnos de un centro de enseanza se refleja en la siguiente


tabla:

/z

/z

7-9

9 - 11 11 - 12 12 - 13 13 - 14 14 - 15 15 - 17 17 - 19

Qz

18

14

27

42

31

20

Determinar la variabilidad de la edad mediante los estadsticos varianza, desviacin tpica,


coeficiente de variacin Estudiar la simetra de la variable.
Solucin
En primer lugar realizaremos los clculos necesarios a partir de la tabla de frecuencias:
intervalos
7 -9
9 11
11 12
12 13
13 14
14 15
15 17
17 - 19

ni
4
18
14
27
42
31
20
1
157

La media ser:

La varianza ser:

Xi
8
10
11,5
12,5
13,5
14,5
16
18

6}

La desviacin tpica ser:

=
;

Q|

6

; { Q{

=+

Ni
4
22
36
63
105
136
156
157

; =
6~

Xi2ni
256
1800
1851,5
4218,75
7654,5
6517,75
5120
324
27742,5

2065
= 13,15DxRV
157

27742,5
13,15 2 = 3,78DxRV 2
157
6

= + 3,78 = 1,94DxRV

Para comprobar si este promedio es representativo


Variacin
6

X i ni
32
180
161
337,5
567
449,5
320
18
2065

calcularemos el Coeficiente de

1,94
= 0,15 Es muy representativo ya que se acerca bastante a 0
13,15
;
Para analizar la simetra de la distribucin hallaremos las distancias entre cuartiles, para
ello primero hallaremos los cuartiles:
&9

1 cuartil ser:
1
157 = 39,25 El 1 cuartil ser el valor de la variable que ocupa el lugar
4
inmediatamente siguiente al 39.25 y se encuentra en el intervalo (12 13) por tanto,
aplicando la formula:
52

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1
4

1
1
1 1
200 46
1
4
= / 1 + 4
& = 40 +
10 = 41,33DxRV
Q
30

2 cuartil, que es la Mediana ser:


2
157 = 78,5 El 2 cuartil ser el valor de la variable que ocupa el lugar inmediatamente
4
siguiente al 78.5 y se encuentra en el intervalo (13 14) por tanto, aplicando la formula:
2
2
1 1
157 63
1
4
4
T
=
/
+
& = 13 +
1 = 13,37 aos
2
1
Q
42

4
3 cuartil ser:
3
157 = 117,75 El 3 cuartil ser el valor de la variable que ocupa el lugar
4
inmediatamente siguiente al 117,75 y se encuentra en el intervalo (14 15) por tanto,
aplicando la formula:

3
3
1 1
157 105
1
4
4
T
=
/
+
& = 60 +
1 = 14,41 aos
3
1
Q
31

4
Comprobamos las distancias
T

3
4

T 2 = T 2 T 1 14,41 13,37 13,37 12,12


4

1,04 1,25 Hay una pequea

diferencia, esto nos indica que hay una pequea asimetra


Vamos hacer lo mismo entre dos percentiles 30 y 70, y ver si las distancias a la mediana
son iguales:
El percentil 30 ser:
30
157 = 47,1 El 30 percentil ser el valor de la variable que ocupa el lugar
100
inmediatamente siguiente al 47.1 y se encuentra en el intervalo (12 13) por tanto,
aplicando la formula:
30
30
1 1
157 36
1
100
100
T
=
/
+
& = 12 +
1 = 12,41 aos
30
1
Q
27

100
El percentil 70 ser:
70
157 = 109,9 El 70 percentil ser el valor de la variable que ocupa el lugar
100
inmediatamente siguiente al 109.9 y, que se encuentra en el intervalo (14 15) por
tanto, aplicando la formula:

70
100

70
70
1 1
157 105
1
100
= / 1 + 100
& = 14 +
1 = 14,158 aos
Q
31

53

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

Comprobamos las distancias


T

70
100

T 2 = T 2 T 30
4

14,158 13,37 13,37 12,41

0,788 0,96 Sigue

100

habiendo una pequea diferencia, esto nos indica que hay una pequea asimetra

54

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 37.- Dado el nmero de horas semanales trabajadas por un colectivo de 100 empleados,
obtener:
1.- La variable tipificada Z
2.- Valores de la media y varianza de la Z

horas trabajadas
nmero empleados
Solucin

/
1 /
04
4 10
10 20
20 - 40

0-4
47

2
7
15
25

; Q

47
32
17
4
100

La desviacin tpica ser:

=+

= Q
1

94
224
255
100
673

La media ser:

La varianza ser:

4 - 10
32

=
;

=+

; Q

; =
6

20 - 40
4

= Q

= Q

-0,7937
0,0453
1,3877
3,0656

0
=
=0
100

188
1568
3825
2500
8081

10 - 20
17

-37,304
1,450
23,591
12,263
0

29,61
0,060
32,74
37,59
100

673
= 6,73
100

8081
6,73 2 = 35,5171
100
6

2
6

=+ 1= 1

55

= + 35,5171 = 5,9596

= Q
1

; =

100
02 = 1
100

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 38.- El consumo de productos farmacuticos y sanitarios (Yj) y la renta mensual


familiar en una muestra de 5 hogares son los siguientes:
Consumo: 100
Renta
20.000

150
25.000

180
35.000

200
40.000

210
45.000

1.- Representacin grfica de la nube de puntos


2.- Ajstese un modelo por mnimos cuadrados, razonando la eleccin de la funcin.
Solucin
No es necesario establecer la tabla de doble entrada ya que ningn par de valores se
repite.
Y = Consumo
X = Renta en miles

<

100
150
180
200
210
840

La media ser:

<

20
25
35
40
45
165

10.000
22.500
32.400
40.000
44.100
149.000

<

Consumo

La varianza ser: Consumo

Renta

6
6

356
= 0,9673
(9,27)(39,70)

< =

149.000
168 2 = 1.576
5

<

2.000
3.750
6.300
8.000
9.450
29.500

840
= 168
5
165
=
= 33
5

Renta

;<

La desviacin tpica ser: Consumo

La covarianza Consumo/renta

<

400
625
1.225
1.600
2.025
5.875

Renta

; =

5.875
332 = 86
5

=+

= + 31.576 = 39,70

=+

= + 86 = 9,27

; <
1

;< =

= (0,9673) 2 = 0,9357

56

29.500
(168)(33) = 356
5

93,57% de fiabilidad

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

Como es bastante grande nos indica que es buena la relacin lineal entre Consumo y Renta.
Por lo que establecemos esa relacin:
6

= < E ; = 168 4,14(33) = 31,38

<

<

2
6

356
= 4,14
86

&RQVXPR

Re QWD

= 31,38 + 4,14 ;

57

=
<

2
6

356
= 0,22
1.576

E < = 33 0,22(1688) = 3,96

= Re QWD

&RQVXPR

= 3,96 + 0,22<

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 39.- Dada la distribucin Bidimensional


;

<

10

20

30

40

50

200

180

150

120

100

1.- Ajstese una recta por el procedimiento de los Mnimos Cuadrados.


2.- Calclese el coeficiente de correlacin lineal y explquese su significado.
Solucin
No es necesario establecer la tabla de doble entrada ya que ningn par de valores se
repite.

<

200
180
150
120
100
750

10
20
30
40
50
150

La varianza ser:

40.000
32.400
22.500
14.400
10.000
119.300

<

La media ser:

<

<

<

100
400
900
1.600
2.500
5.500

119.300
150 2 = 1.360
5

; =

=+

; <

2.000
3.600
4.500
4.800
5.000
19.900

< =

;<

750
= 150
5
150
=
= 30
5

La desviacin tpica ser:

5.500
30 2 = 200
5

= + 1.360 = 36,88

=+

= + 200 = 14,14

19.900
(150)(30) = -520
1
5
Covarianza negativa por tanto relacin inversa, cuando una variable crece la otra decrece y
viceversa.

La covarianza

6
6

520
= 0,9971
(36,88)(14,14)

;< =

= (0,9971) 2 = 0,9943

58

99,43% de fiabilidad

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

Como es bastante grande nos indica que es buena la relacin lineal entre las dos variables.
Por lo que establecemos esa relacin:
E

520
= 2,6
1200

= < E ; = 150 + 2,6(30) = 228

<

<

2
6

= 228 2,6 ;

2
6

520
= 0,38
1.360

E < = 30 + 0,38(150) = 87

<

= 87 0,38<

Significados
Coeficiente de correlacin lineal = r = 0,9971
Mide la bondad de la estimacin, la bondad de la prediccin o la bondad del ajuste.
Mide la fiabilidad
Vara entre (-1 y + 1). Cuanto ms se acerque a +1 o a -1 mayor ser la bondad, mejor
ser el ajuste
Su signo nos indica si la correlacin es positiva o negativa, es decir directa o inversa.
En este caso inversa las variables varan en sentido contrario.
Tiene el mismo signo que el de la covarianza y el de los coeficientes de regresin
Covarianza = 6
6 =  520 Covariacin (variacin conjunta) negativa. Nos indica que existe cierta
covariacin pero no nos dice si es muy grande o no. Es una medida en trminos absolutos

59

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 40.- El consumo y la renta mensual de 100 familias expresadas en 104 pesetas, son los
siguientes: X= (Consumo) Y = (Renta).
X/Y
30
40
50

15 25 35 45
10 15 -- -5 20 25 --- 15
5
5

1.- Calclese la recta de regresin del consumo sobre la renta.


2.- Consumo esperado para una renta de 60.104 Pts. y la representatividad de esta
regresin.
Solucin
Y

15

25

35

45

; Q

; < Q

X
30
40
50
Q
< Q

<

10
5
15

15
20
15
50

25
5
30

5
5

25
50
25
100

750
2000
1250
4.000

225

12250

1050

225

2750

3775

31250

36750

10125

81500

15

65

95

100

22500
80000
62500
165.000

15750
25
58000
75
38750
100
112.500

Solucin
=

4000
= 40
100

2750
= 27,5
100

<

165000
(40) 2 = 50
100
6

81500
(27,5) 2 = 58,75
100

25
= 0,46
(7,07)(7,66)

= (0,46) 2 = 0,213

= < E ; = 27,5 + 0,5( 40) = 47,5

<

= 58,75 = 7,66

112500
(40)(27,5) = 25
100

6
6

= 50 = 7,07

25
= 0,5
50

6
6

= 47,5 + 0,5 ;

60

21,3% de fiabilidad

=
*

25
= 0,425
58,75

E < = 40 + 0,425( 27,5) = 28,3

= 28,3 + 0,4257<

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1.-

= 28,3 + 0,4257<

2.- Renta de 60 104 Predecir

conocido

Sustituimos en la recta de regresin


;

<

= 60

= 28,3 + 0,4257<

= 28,3 + 0,4257(60 ) = 53,8

Para una renta de 600.000 el consumo esperado ser de 538.000.


3.-

25
= 0,46
(7,07)(7,66)

= (0,46) 2 = 0,213

21,3% de fiabilidad

La bondad de la prediccin es pequea r = 0,46. Es decir solamente el 21,3% de la


variacin de la renta nos explica la variacin del consumo. Por tanto la prediccin es muy
poco fiable.

61

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 41.- El volumen de ahorro y la renta del sector familiar, en billones de pesetas


constantes de 1986, para el periodo 1986-1995, fueron:
Aos t
Ahorro X
Renta Y

1986
1,9
20,5

1987
1,8
20,8

1988
2,0
21,2

1989
2,1
21,7

1990
1,9
22,1

1991
2,0
22,3

1992
2,2
22,2

1993
2,3
22,6

1994
2,7
23,1

1995
3,0
23,5

Ajstese un modelo lineal que explique el comportamiento del ahorro en funcin de la renta.
Solucin
;

<

<

;<

1,9
1,8
2,0
2,1
1,9
2,0
2,2
2,3
2,7
3

20,5
20,8
21,2
21,7
22,1
22,3
22,2
22,6
23,1
23,5

3,61
3,24
4,00
4,41
3,61
4,00
4,84
5,29
7,29
9,00

420,25
432,64
449,44
470,89
488,41
497,29
492,84
510,76
533,61
552,25

38,95
37,44
42,40
45,57
41,99
44,60
48,84
51,98
62,37
70,50

21,9

220

49,29

4.848,38

484,64

Media
Varianza
Desviacin tpica
21,9
49
,
29
; =
6
= 0,133 = 0,365
= 2,19 6 2 =
(2,19) 2 = 0,133
10
10
Media
Varianza
Desviacin tpica
220
4848,38
2
6
6
= 0,838 = 0,915
< =
= 22
=
(22) 2 = 0,838
10
10
Covarianza
484,64
=
(2,19)(22) = 0,284
6
10
Coeficiente de correlacin
Coeficiente de determinacin
0,284
2
U =
= 0,85
U
= (0,85) 2 = 0,723 72,3% de fiabilidad
(0,365)(0,915)
Coeficiente de regresin de Y/X
Coeficiente de regresin de X/Y

6
6
0,284
0,284

E =
=
=
2
,
13
E =
=
= 0,34
2
2

0,133
0,838
6
6
Ordenada en el origen
Ordenada en el origen

D = < E ; = 22 2,13( 2,19) = 17,33


D = ; E < = 2,19 0,34( 22) = 5, 29
Recta de regresin Y/X
Recta de regresin de X/Y
*
*
<
= 17,33 + 2,13 ;
;
= 5,29 + 0,34<
Coeficientes de regresin:
b = 2,13 Nos indica lo que varia la renta, al variar el ahorro en una unidad
b= 0,34 Nos indica lo que varia el ahorro, al variar la rente en una unidad
Al ser positivos nos indican que las variaciones son en el mismo sentido.
62

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 42.-En una empresa el 20% es personal "no cualificado", el 50% es personal


"cualificado" y el resto personal "tcnico". La plantilla consta de 1000 empleados. Se ha
estimado la productividad para cada uno de estos grupos en unos coeficientes que van de 1
a 5, siendo como se puede observar en la tabla siguiente:

Coeficiente
Productividad

Personal No
Cualificado
(En %)
10
20
30
30
10

1
2
3
4
5

Personal
Cualificado
(En %)
5
20
20
40
15

Personal
Tcnico
(En %)
10
40
30
20

1.- Hllese la productividad media de los 1000 empleados.


2.- Qu nivel de productividad es el ms corriente en esta empresa?
3.- Bajo qu coeficiente estn el 50% de los trabajadores menos productivos?
4.- Comparando las productividades medias del personal no cualificado y del personal
cualificado, cul de ellas corresponde a una distribucin de frecuencias ms
homognea?
Solucin
1.- Para hallar la productividad media Haremos:
Coeficiente
Productividad

Personal No
Cualificado
(En %)

Personal
Cualificado
(En %)

Personal
Tcnico
(En %)

1
2
3
4
5

10
20
30
30
10

5
20
20
40
15

10
40
30
20

; Q
1

100

; Q
1

100

4,5
17
28
35
15,5
100

4,5
34
84
140
77,5
340

%
acumulado

4,5
21,5
49,5
84,5
100

340
= 3,4 Coeficiente de productividad media.
100

2.- El nivel de productividad ms corriente ser la moda.


Productividad modal 0 = 4 Valor de la variable que presenta mayor frecuencia.
3.- El nivel de productividad que separa al 50% de los trabajadores es la mediana
1

= 50 Luego la mediana es

=4

4.- Analizar la homogeneidad, es decir hallar CV de cada distribucin:


63

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

(1) Personal No cualificado


Coeficiente
Productividad
; (1)

Personal No
Cualificado
(En %)

1
2
3
4
5

10
20
30
30
10
100

(1) =

(S

100

 (1) =

10
40
90
120
50
310

310
=
= 3,1
100

10
80
270
480
250
1090
2
6  (1) =

 2 = 1,29 = 1,1358

 2 S

; =

100

&9

(1)=

1090
(3,1) 2 = 1,29
100

1,1358
= 0,36 Homogeneidad
3,1

aceptable ya que es menor de 1. Nos dice que hay una dispersin bastante pequea.
;

(2) Personal cualificado


Coeficiente
Productividad
; (2)

Personal No
Cualificado
(En %)

1
2
3
4
5

5
20
20
40
15
100

( 2) =

( 2) =

 ( S

100
6

340
=
= 3,4
100

2 = 1,24 = 1,1135

5
40
60
160
75
340

 2 S

5
80
180
640
375
1280
2
6 ( 2) =

&9

 2 S

; =

100
(2)=

1280
(3,4) 2 = 1,24
100

1,1135
= 0,32 Homogeneidad
3,4

aceptable ya que es menor de 1. Nos dice que hay una dispersin bastante pequea.
Mayor homogeneidad ser el que tenga menor coeficiente de variacin, es decir el de
menor dispersin en este caso el personal cualificado presenta una productividad
MS homognea.

64

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 43.- En el departamento de personal de un determinado Banco, se ha realizado un


estudio queriendo constatar si la edad de los empleados est en relacin con el nmero de
das que no se asiste al trabajo. Establecer una funcin lineal que relacione las dos
variables y la bondad del ajuste. Los resultados numricos son:

DAS DE
AUSENCIA
65 71
58 64
51 57
44 50

20 - 28

29 - 37

0
2
5
14

1
6
9
6

EDAD
38 - 46 47 - 55
8
10
5
2

56 - 64

7
2
0
2

16
4
1
0

Solucin
Primero reorganizamos los datos y construimos la tabla:
 2 Q

4755
51

5664
60

44 50
(47)
50 57
(54)
57 64
(62)
64 71
(68)

14

24

1128

53016

20

1080

58320

10

24

1488

92256

16

32

2176

147968

21

22

25

11

21

100

5872

351560

 

504

726

1050

561

1260

4101

 2 Q

12096

23958

44100

26611

75600

182365

25248

39864

64176

35394

83400

248082

< Q

<

; Q
;

 

; < Q

<

2 =

 =+

"! =



3846
42

<

2937
33

<

2028
24

<

2

5872
= 58,72 das
100
2

< =

 2 Q

1
6

 

4101
= 41,01 aos
100

351560
(58,72 2 = 67,56
100
2

; =

182365
(41,01) 2 = 141,83
100

 2 = + 67,56 = 8,2 das


; <

;< =

 =+

 2 = + 141,83 = 12 aos

248082
(41,01)(58,72) = 72,71
100
65

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

$"#

72,71
= 0,74 U 2 = (0,74) 2 = 0,546
54,6% de fiabilidad. Es decir el
6$ 6#
(12)(8,2)
54,6% de las variaciones de la edad explican las variaciones de los das de ausencia, y
viceversa.
U

Como es bastante grande nos indica que es buena la relacin lineal entre Edad y das de
ausencia. Por lo que establecemos esa relacin:
6

%"&

72,71
= 0,51
141,83

= < E ; = 58,72 0,51(41,01) = 37,7

2
6%

<

<

=
*

'tDV$XVHQFLD

(GDG

= 37,7 + 0,51; )

=
<

=
;

("'

2
6'

72,71
= 1,07
67,56

E < = 41,01 1,07(58,72) = 22,18


(GDG

'tDV$XVHQFLD

= 22,18 + 1,07<*

No hay demasiada fiabilidad por lo que las predicciones no sern buenas.

66

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 44.- La relacin de los gastos de publicidad y el volumen de ventas de 25 empresas se


recoge en la siguiente tabla: Hallar la recta de regresin X/Y
;

10

15

1
1
2

2
7
1

2
4
5

<

100
125
150
Solucin

<

15

1
1
2
4

2
7
1
10

2
4
5
11

5
12
8
25

2 2

20

100

165

285

3 2 Q3

100

1000

2475

3575

45

2625

12250

21750

36625

3200
= 128
25

< Q

0 2 Q0

<

; Q
;

4 5

; < Q

10

100
125
150

<

<

92 =

<2 =

A"B =

2
<8

< =

; 2 Q;

;
1

@ ?

; <
1

D"C

6D

417500
128 2 = 316
25
2

500
1500
1200
3200

285
= 11,4
25

: =+

3575
(11,4) 2 = 13,04
25
36625
=
(128)(11,4) = 5,8
25

; =
;<

5,8

6C
(3,61)(17,77)

= 0,09

50000
187500
180000
417500

: 2 = + 316 = 17,77

> =+

= (0,09) 2 = 0,00817

= 2 = + 13,04 = 3,61

0,8% de fiabilidad.

Es decir solamente el 0,8% de las variaciones de una variable vienen explicadas por las
variaciones de la otra variable. Como U 2 es muy pequeo nos indica que es muy mala la
relacin lineal entre las variables. Aun y todo establecemos la relacin:
6

E"F

= < E ; = 128 0,44(11,41) = 122,9

<

5,8
= 0,44
13,04

<

= 122,9 + 0,44 ; I

=
<

H"G

5,8
= 0,018
316

E < = 11,41 0,018(128) = 9,05


;

= 9,05 + 0,018<J

No hay demasiada fiabilidad, es prcticamente nula. Por lo que las predicciones


sern muy malas, El modelo no nos sirve.

67

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 45.- La relacin entre el precio de un producto y el volumen de consumo es la siguiente:


Precio X
Consumo Y

180
1905

220
2370

260
2835

300
3300

340
3765

Hallar el valor del coeficiente de correlacin y las rectas de regresin


Solucin

<

M2

N2

; <

<

180
220
260
300
340

1905
2370
2835
3300
3765

32400
48400
67600
90000
115600

3629025
5616900
8037225
10890000
14175225

342900
521400
737100
990000
1280100

1300

14175

354000

42348375

3871500

Media
Varianza
Desviacin tpica
1300
354000
; =
= 260 6 O 2 =
(260) 2 = 3200
6P
= 3200 = 56,56
5
5
Media
Varianza
Desviacin tpica
14175
42348375
2
< =
= 2835
6Q
=
(2835) 2 = 435450 6 R = 435450 = 659,88
5
5
Covarianza
3871500
=
(260)(2835) = 37200
6 S"T
5
Coeficiente de correlacin
Coeficiente de determinacin
37200
2
U =
= 0 ,9965
U
= (0,9965) 2 = 0,9931 99,31% de fiabilidad
(56 ,56 )( 659 ,88 )
Coeficiente de regresin de Y/X
Coeficiente de regresin de X/Y
6 U"V
6 U"V
37200
37200

E =
=
= 11,625
E =
=
= 0,08
2
2
3200
435450
6U
6V
Ordenada en el origen
Ordenada en el origen

D = < E ; = 2835 11,625( 260) = 1875


D = ; E < = 260 0,08( 2835) = 33, 2
Recta de regresin Y/X
Recta de regresin de X/Y
*
*
<
= 1875 + 11,625 ; W
;
= 33,2 + 0,08<X
Coeficientes de regresin:
b = 11,625 Nos indica lo que varia la renta, al variar el ahorro en una unidad
b= 0,08 Nos indica lo que varia el ahorro, al variar la rente en una unidad
Al ser positivos nos indican que las variaciones son en el mismo sentido.
r = 0,9965 Fiabilidad muy grande
2
U
= 0,9931 1 100% de fiabilidad, bondad de las estimaciones. Es decir el 100% de
las variaciones de una variable vienen explicadas por las variaciones de la otra variable,
a travs de las rectas de regresin, que al ser r prcticamente 1 coincidirn ambas rectas.

68

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 46.- En un estudio sobre alcohlicos se informa que el 40% de los mismos tienen padre
alcohlico y el 6% madre alcohlica. El 42% tienen al menos uno de los padres
alcohlicos.
1.- Porcentaje de personas que tengan ambos padres alcohlicos.
2.- Porcentaje de personas que tengan madre alcohlica si lo es el padre.
3.- Porcentaje de personas que tengan madre alcohlica pero no un padre alcohlico.
4.- Porcentaje de personas que tengan madre alcohlica si el padre no lo es
Solucin
P = padre alcohlico
M = madre alcohlica

%(P) = 40%
%(M) = 6%

%(P M) = 42%

No tener padre alcohlico y no tener madre alcohlica = suceso


Suceso

0 = suceso

SI
NO

Madre
alcohlica

SI
NO

1.-

%(P M ) = 4%

2.-

%( 0 ) =

3.-

%( ( 3 0 ) = 2%

4.-

%( 0 ) =

SI
%0 3
%0 3
%3

P
NO
%0 3
%0 3
%3

Padre alcohlico
SI
NO
4
2
6
36
58
94
40
60
100

4
100 = 10%
40

%( 0 3)
2
100 = 100 = 33,33%
6
%( 3)

69

0 = 100 42= 58%

%0
%0
100

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 47.- Realizada una encuesta entre fumadores se obtuvieron los resultados sobre las
variables:
X: N de cigarrillos fumados diariamente
Y: Horas de sueo diarias
Que hemos recogido en la siguiente tabla
X
Y
4-6
6-7
7-8
8-9

2
10
24
26
62

8
16
14
10
48

26
20
12
4
62

36
26
14
2
78

72
76
82
70
300

^ ^

200

558

624

1054

1950

4386

800

5022 8112

17918

48750

80602

1700

4284 4342

6528

11775

28629

50

112

222

300

; Q

0
4
18
28
50

2 - 6 6 - 12 12 14 14 - 20 20 - 30
4
9
13
17
25

` a

; < Q

`a

160

360
494
615
595
2064

[ 2 Q[

1800
3211
4612,5
5057,5
14681

72
148
230
300

Solucin
=

4386
= 14,63
300

2064
= 6,88
300

<

c2 =

80602
(14,63) 2 = 54,63
300

e2 =

14681
(6,88) 2 = 1,6
300

g"h =

= < E ; = 6,88 + 0,096(14,63) = 8,28

<

5,23
= 0,56
(7,39)(1,26)
i"j

= 54,63 = 7,39
f = 1,6 = 1,26

28629
(14,63)(6,88) = 5,23
300

= (0,56) 2 = 0,315

5,23
= 0,096
54,63

= 8,28 0,096 ; m

70

=
=
*

31,5% de fiabilidad
6

l"k

5,23
= 3,27
1,6

E < = 14,63 + 3,27(6,88) = 37,13

= 37,13 3,27<n

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1.- Calcular el porcentaje de personas que fuman entre 15 y 22 cigarrillos al da


Distribucin Y/15<X<22
Y
4-6
6-7
7-8
8-9

5 26 + 2 36 = 28,86
6
10
5 20 + 2 26 = 26,86
6
10
5 12 + 2 14 = 12,80
6
10
5 4 + 2 2 = 3,73
6
10
72,25

72,25
100 = 24,08%
300

2.- Obtener el nmero mnimo de cigarrillos diarios que fuma uno de los fumadores del
30% que ms fuma.
70
Hay que hallar el percentil 70
300 = 210 El valor de la variable que ocupa
100
el lugar 210, que esta en el intervalo (14 20)

70
100

70
1 1o
1
210 160
100
= /o 1 +
& o = 14 +
6 = 18,84 Cigarrillos
Q
62
o

3.- Podemos pronosticar que a mayor nmero de cigarrillos fumados diariamente se


dormir ms horas. Con que fiabilidad
No, porque la covarianza es negativa, luego a ms cigarrillos, menos horas se
dormir.
La fiabilidad es del 31,5%
4.- Estimar el consumo de tabaco para una poblacin de 1.500 personas de las que son
fumadoras el 32%
32% de 1.500 ser 0,32 (1.500) = 480 personas fumadoras
Cada persona fumadora, fuma un promedio de 14,63 cigarrillos, es decir 15
cigarrillos por persona fumadora al da
Luego ser: 480(15) = 7.200 cigarrillos
5.- Estimar el nmero de horas de sueo diarias para una persona que fuma 35 cigarrillos al
da.
*
<
= 8,28 0,096 ; p
Para X = 35

<

= 8,28 0,096(35)= 4,9

5 horas de sueo diarias

6.- Porcentaje de personas fumadoras que duermen entre 6 y 8 horas sabiendo que no
fuman ms de 15 cigarrillos al da

71

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

Si Duerme (6 8)
No Duerme (6 8)
Totales

No fuma
ms de 15
81,33
89
170,33

Si fuma
ms de 15
76,67
53
129,66

% (Duerme entre (6 8) / No fuma ms de 15) =

72

Totales
158
142
300

81,33
100 = 47,748%
170,33

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 48.- Un estudio indica que el 10% de la poblacin de Pamplona tiene 65 o ms aos, y


que el 1% de la poblacin padece deficiencia cardiaca moderada. Adems el 10,4% de la
poblacin tiene 65 o ms aos o padece deficiencia cardiaca moderada.
1.- Porcentaje de personas que tengan 65 o ms y padezcan la enfermedad.
2.- Porcentaje de personas que Si tienen 65 o ms padezcan de deficiencia cardiaca
3.- Porcentaje de personas que Si no tienen 65 tengan la enfermedad
Solucin

Suceso A = tener 65 o ms aos

%(A) = 10%

Suceso B = Padecer deficiencia cardiaca moderada

%(B) = 1%
%( $ % )=10,4%

B
%

1.-

A
0,6
9,4
10

0,4
89,6
90

1
99
100

%( $ % ) = 0,6%


2.-

%( % )=

3.-

%(

%
$

%( % $) 0,6
=,
100 = 6%
%( $)
10

)=

%( % $ )
0,4
=
100 = 0 , 444 %
90
%( $ )

73

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 49.- Se estima que el 30% de los ciudadanos de Navarra son obesos y el 3% sufre de
diabetes. El 2% son obesos y sufre diabetes. Cul es el porcentaje de personas que son
obesas o sufren diabetes?
Solucin
Suceso A = ser obeso

%(A) = 30%

Suceso B = Padecer Diabetes

%(B) = 3%
%(

B
%

A
2
28
30

1
69
70

3
97
100

%( $ % )=%( $)+ %( % ) %( $ % ) =30 + 3 2 = 31

74

)= 2 %

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 50.- De 300 estudiantes 100 cursan Antropologa y 80 Estadstica. Estas cifras incluyen
30 estudiantes que cursan ambas asignaturas. Cul es el porcentaje de estudiantes que
cursan Antropologa o Estadstica?
Solucin
100
100 = 33,33%
300
80
P(E) =
100 = 26,67%
300
30
3 ( $ ( )=
100 = 10%
300

Suceso A = Estudiar A

%(A) =

Suceso E = Estudiar E

E
(

% ($ % )=

A
30
70
100

50
150
200

80
220
300

30 + 50 + 70
100 = 50%
300

E
(

A
10
23,33
33,33

16,67
50
66,67

26,67
73,33
100

%( $ % )=%( $)+ %( % ) %( $ % ) = 33,33 + 26,67 10 = 50%

75

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 51.- Se estima que entre la poblacin total de Europa el 55% padece de obesidad, el
20% es hipertensa, y el 60% es obesa o hipertensa. Es, de hecho, independiente el que
una persona sea obesa de que padezca hipertensin?
Solucin

Suceso A = padecer obesidad

%(A) = 55%

Suceso B = Ser hipertenso

% (B) = 20%

Ser obeso o hipertenso = suceso A B

%(A B) = 60%

( )
% ( ) = 100 60 = 40%

No ser obeso y no ser hipertenso = suceso


Suceso

% = suceso

B
%

A
15
40
55

5
40
45

20
80
100

Luego A y B

12

son Independientes

15
5
20

No se mantienen las proporciones, condicin necesaria para ser


55 45 100

Independientes

76

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 52.- Se sabe por informes recientes que el 18% de los estudiantes sufren de depresin
en algn periodo de su escolarizacin, que el 2% piensa en el suicidio y que el 19% sufre
de depresin o piensa en el suicidio.
1.- Cul es el porcentaje de estudiantes que sufren depresin y piensen en el suicidio? 2.Cul es el porcentaje de estudiantes que sufren depresin pero no piense en el suicidio?
Solucin
Suceso A = Sufrir depresin

%(A) = 18%

Suceso B = Pensar en suicidio

%(B) = 2%

Sufrir depresin R pensar en suicidio = Suceso ( $ % )

%(A B) = 19%

Sufrir depresin \ pensar en suicidio = Suceso (A B)


Sufrir depresin \QR pensar en suicidio = Suceso (A % )
No sufrir depresin y no pensar en el suicidio = suceso
Suceso

% = suceso

B
%

A
1
17
18

% = 100 19 = 81%

1
81
82

2
98
100

1.-

Sufrir depresin \ pensar en suicidio = Suceso (A B)


% (A B) = 15

2.-

Sufrir depresin \QR pensar en suicidio = Suceso (A % )


%(A % ) = 17%
Sufrir depresin 6DELHQGRTXHQR piensa en el suicidio = Suceso $
%
17
% $ = 100 = 17,347%
% 98

77

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 53.- Se estima que el 15% de la poblacin adulta padece de hipertensin, pero que el
75% de todos los adultos creen no tener este problema. Se estima tambin que el 6% de la
poblacin tiene hipertensin pero no es consciente de padecer dicha enfermedad. Cul es
el porcentaje de personas que creyendo que no tienen hipertensin, y sin embargo la
tienen?
Solucin


Suceso A = Sufrir Hipertensin

%(A) = 15%

Suceso B = Creer no tener problemas

%(B) = 75%

Sufrir Hipertensin

Creer no tener problemas = Suceso A B

%(A B) = 6%
Padecer hipertensin / creer no tener problemas = Suceso

B
%

%( $ ) =
%

A
6
9
15

69
16
85

75
25
100

6
100 = 8%
75

Es decir un 8% de personas que creen no tener problemas de hipertensin, padecen


de hecho la enfermedad.

78

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 54.- Dados los siguientes valores de las variables X e Y ajustar una recta por mnimos
cuadrados y dar una medida del ajuste realizado.
Y
X

16
52

19
39

22
45

25
51

16

19

22

25

82

52

39

45

51

187

s2

256

361

484

625

1726

t2

2704

1521

2025

2601

8851

v u

832

741

990

1275

3838

Solucin
<

<

; <

<

82
= 20,5
4

187
= 46,75
4

{"| =

w2 =

1726
(20,5) 2 = 11,25
4
6

y2 =

x = 11,25 = 3,35

8851
(46,75) 2 = 27,19
4

= 27,19 = 5,21

3838
(46,75)(20,5) = 1,125
4

1,125
= 0,064
(3,35)(5,21)

= (0,064) 2 = 0,0041

0,41% de fiabilidad (muy pequea = 0)


6

}"~

= < E ; = 20,5 0,041(46,75) = 18,5

1,125
= 0,041
27,19

=
=

"

1,125
= 0,1
11,25

E < = 46,75 0,1(20,5) = 44,7

*
= 18,5 + 0,041;
;
= 344,7 + 0,1<
Demasiado pequea la bondad de las estimaciones
<

79

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 55.- En una residencia de ancianos tenemos: El 20% casados, el 30% solteros y el 50%
viudos. El 5% de los casados tienen mal carcter, el 10% de los solteros y el 20% de los
viudos tambin tienen mal carcter.
1.- Hallar el porcentaje de personas que tengan mal carcter y estn casadas.
2.- Sabiendo que tienen mal carcter hallar el porcentaje de personas que estn casadas.
Solucin

Tener mal
Carcter

SI

Estado civil
C
S
1
3

NO

V
10

14

19

27

40

86

20

30

50

100

) = 5%

C = Casado

%(C) = 20%

%( 0

S = Soltero

%(S) = 30%

%( 0 ) = 10%

V = Viudo

%(V) = 50%

%( 0 ) = 20%

M = Tener Mal Carcter


0

= No Tener Mal Carcter

1.-

%(& 0 ) = 5% del 20% = 1%

2.-

%( 6 0 ) = 10% del 30% = 3%


%(9 0 ) = 20% del 50% = 10%

%(0 ) = 1 + 3 + 10 = 14%
%(&

)=

%(& 0 )
=
%( 0 )

1
(100)= 7,14%
14

80

&

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 56 - De un grupo de 522 personas se desea conocer el grado de relacin entre el sexo y


la delincuencia. Se sabe que hay: 190 mujeres de las cuales 112 son delincuentes, mientras
que entre los hombres solo hay 122 delincuentes.
Solucin

Suceso A = ser mujer (190)

%(A) =

190
100 = 36,40%
522

Suceso $ = No ser mujer (522 190) = 332

%( $ ) =

332
100 = 63,6%
522

Suceso B = Ser delincuente


Suceso

= No ser delincuente

Suceso Ser delincuente siendo mujer

( )
%

Suceso Ser delincuente No siendo mujer %


$

B
%

A
112
78
190

( )= 112
100 = 58,95%
190
%

122
% % =
100= 36,75%
$ 332

122
210
332

234
288
522

Luego A y B

12

son Independientes

112 122 234

No se mantienen las proporciones, condicin necesaria para ser


190 332 522

Independientes
4

(112)(210) (78)(122) = 14004


(112)(210)+ (78)(122) 30036

= 0,424

0,424 es el grado de asociacin entre sexo y delincuencia, se atraen el ser mujer con ser
delincuente

81

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 57.- Se desea conocer la posible relacin entre las diferentes nacionalidades y su


actitud en contra o a favor del federalismo, a travs de la siguiente muestra:
Galicia
10
6
16

A favor
En contra
Total

P. vasco
37
13
50

Catalua
22
8
30

Andaluca
8
6
14

Total
77
33
110

Catalua
22
8
30

Andaluca
8
6
14

Total
77
33
110

Solucin
FRECUENCIAS OBSERVADAS (OB)
Galicia
10
6
16

A favor
En contra
Total

P. vasco
37
13
50

FRECUENCIAS TEORICAS CASO DE INDEPENDENCIA (TE)


Galicia
11,2
4,8
16

A favor
En contra
Total

P. vasco
35
15
50

Catalua
21
9
30

Andaluca
9,8
4,2
14

No se mantienen iguales luego hay alguna relacin, algn grado de dependencia

2 =

2%

7( )

7(

(10 11,2)2 + (37 35)2 + (22 21)2


11,2

35

21

82

+ ....................... =

Total
77
33
110

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 58.- Deseamos analizar la posible relacin entre el color de la piel y el tener o no los
ojos azules, para ello tomamos una muestra de 200 personas de las cuales 79 tienen piel
clara y entre estas hay 49 con ojos azules, mientras que entre los que tienen piel oscura
tenemos 25 con ojos azules.
Solucin
A = Tener la piel clara
B = Tener ojos azules

B
%

A
49
30
79

25
96
121

74
126
200

49 25
74

No se mantienen las proporciones, condicin necesaria para ser


79 121 200
Independientes
Luego A y B

12

son Independientes

(49)(96) (30)(25) =
(49)(96)+ (30)(25)

3954
= 0,7249
5454

0,7249 es el grado de asociacin entre el color de la piel y el de los ojos, tener piel clara
y tener ojos azules, se atraen

83

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 59 - Se quiere analizar la posible dependencia entre la prctica religiosa y la


identificacin con grupos pacifistas, de los jvenes entre 15 y 25 aos de Pamplona para
ello se realiza una encuesta, y los datos se recogen en la tabla siguiente:

Grupos
Pacifistas
Muy cercano
Cercano
Distante
Muy Distante

nunca
77
161
42
14

PRCTICA RELIGIOSA
Varias Algunas
Solo
Domingos
al ao al mes domingos y festivos
31
18
16
25
119
57
67
62
26
36
34
21
18
6
13
12

Varias a la
semana
4
3
2
0

Solucin
FRECUENCIAS OBSERVADAS (OB)

Grupos
Pacifistas
Muy cercano
Cercano
Distante
Muy Distante
TOTAL

nunca
77
161
42
14
294

PRCTICA RELIGIOSA
Varias Algunas
Solo
Domingos
al ao al mes domingos y festivos
31
18
16
25
119
57
67
62
26
36
34
21
18
6
13
12
194
117
130
120

Varias a la
semana
4
3
2
0
9

TOTAL
171
469
161
63
864

FRECUENCIAS TEORICAS CASO DE SER INDEPENDIENTES (TE)


PRCTICA RELIGIOSA
Grupos
Nunca Varias Algunas
Solo
Domingos
Pacifistas
al ao al mes domingos y festivos
Muy cercano
58,4
38,4
23,1
25,7
23,8
Cercano
159,6 105,3
63,5
70,6
65,1
Distante
54,8
36,2
21,8
24,2
22,4
Muy Distante 21,2
14,1
8,6
9,5
8,7
TOTAL
294
194
117
130
120

Varias a la
semana
1,6
4,9
1,6
0,9
9

TOTAL
171
469
161
63
864

Las tablas de frecuencias observadas y las tericas caso de independencia no coinciden, lo


que indica que hay algn grado de dependencia.

2 =

2%

7( )

7(

(77 58,4)2
58,4

31 38,4 2 (18 23,1)


+
+ ....................... = 7,2
38,4
23,1
2

COEFICIENTE DE CONTINGENCIA
&

2
=
2 + 1

7, 2
= 0,09 No Parece demasiado grande
7,2 + 864

84

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 60.- Se esta estudiando la relacin existente entre los aos de estudio realizados por los
padres y los estudios realizados por los hijos. Para ello se toma una muestra de 7 personas.
ENTREVISTADOS
PADRES HIJOS
A
12
12
B
10
8
C
6
6
D
16
11
E
8
10
F
9
8
G
12
11
Analizar y establecer la posible dependencia y correlacin entre ambas variables. Y en su
caso, dar una medida de la bondad de los posibles pronsticos de ambas.
Solucin
Entrevistados

Padres
X
12
10
6
16
8
9
12
73

A
B
C
D
E
F
G
TOTAL
<

<

2
=
6

2
<

=+

" =

6
6

66
= 9,43 aos
7

<

Hijos
Y
12
8
6
11
10
8
11
66

666
=
(9,43) 2 = 6,2
7

= + 6,2 = 2,49 aos

; <

;< =

"

4,5

6
(3,01)(2,49)

<

144
100
36
256
64
81
144
825

;<

144
64
36
121
100
64
121
666

144
80
36
176
80
72
132
720

73
= 10,43 aos
7

2
=
6

2 Q

=+

; =

825
(10,43) 2 = 9,07
7

2 = + 9,07 = 3,01 aos

720
(9,43)(10,43) = 4,5
7

= 0,60

= (0,60) 2 = 0,36

36% de fiabilidad. Aunque no es

bastante grande nos indica que no es demasiado buena la relacin lineal entre ambas
variables. De todas formas establecemos esa relacin:
E

"

2
6

4,5
= 0,49
9,07

= < E ; = 9,43 0,49(10,43) = 4,32

Recta: < * = 4,32 + 0,49 ;

85

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 61.- Hallar las rectas de regresin de las variables X e Y correspondientes a las edades
de hombres y mujeres a la hora de contraer matrimonio, y hallar el grado de correlacin.
Esposo
Esposa

40
27

36
25

20
17

18
16

60
37

50
32

Solucin
Esposo
X
40
36
20
18
60
50
224
<

<

2 =

2 =

=+

" =

<

< =

2 Q

; <

"

<

1600
1296
400
324
3600
2500
9720

;<

729
625
289
256
1369
1024
4292
;

1080
900
340
288
2220
1600
6458
;

224
= 37,3 aos
6

4292
(25,6) 2 = 59,97
6
2

; =

9720
(37,3) 2 = 228,71
6

2 = + 59,97 = 7,74 aos

154
= 25,6 aos
6

Esposa
Y
27
25
17
16
37
32
154

;< =

116,45

(15,12)(7,74)
6

=+

2 = +

228,71 = 15,12 aos

6428
(25,6)(37,3) = 116,45
6

= 0,995

= (0,995) 2 = 0,99

99% de fiabilidad. Es bastante

grande nos indica que es buena la relacin lineal entre ambas variables. Establecemos esa
relacin:
E

"

2
6

116,45
= 0,50
228,71

= < E ; = 25,6 0,50(37,3) = 6,95

*
Recta: < = 6,95 + 0,50 ;

86

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 62.- Dadas las variables estadsticas correspondientes a las edades de 5 nios y sus
pesos respectivos, hallar las rectas de regresin y su representacin grfica.
Edad

Peso

15

19

25

33

34

Solucin
Edad
X
2
4
6
7
8
27
<

<

2 =

=+

" =

<

4
16
36
49
64
169
;

;< =

;<

225
361
625
1089
1156
3456
=

3456
(25,2) 2 = 56,16
5

= + 56,16 = 7,5 Kg.

; <
1

< =

126
= 25,2 Kg.
5

<

Peso
Y
15
19
25
33
34
126

30
76
150
231
272
759

27
= 5,4 aos
5

2 =

=+

2 Q

;
1

; =

169
(5,4) 2 = 4,64
5

= + 4,64 = 2,15 aos

759
(25,2)(5,4) = 15,72
5

"

15,72
2
= 0,974
U
= (0,974) 2 = 0,95
95% de fiabilidad. Es bastante
6 6
(2,15)(7,5)
grande nos indica que es buena la relacin lineal entre ambas variables. Establecemos esa
relacin:
U

= < E ; = 25,2 3,38(5,4) = 6,948

"

15,72
= 3,38 Es lo que varia Y al variar X en una unidad
4,64

Recta: < * = 6,948 + 3,38 ;

87

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 63.- La tabla de frecuencias siguiente corresponde a una variable bidimensional


(X; Y)
Y = Edad de pacientes ingresados en Ubarmin por fractura de menisco
X = Nmero de das que permanecen ingresados dichos pacientes.
Se desea hacer un estudio sobre pacientes entre 14 y 30 aos. Para ello tomamos una
muestra de pacientes de esas edades ingresados en Ubarmin durante el mes de marzo
por fracturas de menisco. Recogemos los datos en la tabla:

Yj

14 - 18

18 - 22

22 - 26

26 - 30

0,00
0,08
0,30

0,01
0,06
0,02

0,09
0,03
0,00

0,40
0,01
0,00

Xi
3-5
5-7
7-9

OBTENGA RAZONADAMENTE Y EXPLIQUE BREVEMENTE EL PORQUE


Y EL SIGNIFICADO DE TODOS Y CADA UNO DE LOS RESULTADOS
OBTENIDOS.
1.- Distribuciones condicionadas:
Xi / Yj < 22
Xi / Yj > 26
1.1.- Cual es ms homognea y por qu?
2.- Porcentaje de pacientes con edad inferior a 26 y mayores de 18 aos.
3.- Media aritmtica y cuartiles de la siguiente distribucin:
Yj / 5 < Xi < 7
4.- Analizar razonadamente la dependencia y la correlacin entre las variables X e Y.
5.- Suponiendo que el da 30 de Junio ingresas en Ubarmin por rotura de menisco,
analiza las posibilidades que tienes de que el 6 de Julio, puedas or el cohete desde la
plaza del Castillo.
6.- En el mes de marzo una persona estuvo ingresada en Ubarmin por rotura de menisco
7 das
y afirma tener 18 aos. Comentar posible veracidad y fiabilidad de su
afirmacin.
Solucin
Yj

2 I

22 - 26

26 - 30

Xi
3-5
5-7
7-9

0,00
0,08
0,30

0,01
0,06
0,02

0,09
0,03
0,00

0,40
0,01
0,00

0,50
0,18
0,32

2,00
1,08
2,56

8,00
6,48
20,48

0,38

0,09

0,12

0,41

5,64

34,96

6,08

1,80

2,88

11,48

22,24

2 I

97,28

36,00

69,12

321,44

523,84

46,08

11,20

12,48

46,48

116,24

<

<

; <

<

18 - 22

14 - 18

= ;

= <

= 5,64

2 =

= 22,24

2 =

2 I

= 34,96 (5,64) 2 3,16

2 I < = 523,84 ( 22,24) 2 = 22,22

<

88

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

= 3,16 = 1,777

" =

; <

22,22 = 5,217

= 116,24 (5,64)(22,24) = 9,1936

;<

1.- Distribuciones condicionadas:

Xi / Yj < 22
Xi / Yj > 26

1.1.- Cual es ms homognea y por qu?

4
6
8

0,01
0,14
0,32
0,47

= ;

4
6
8

0,021
0,298
0,681

= 7,32

2 =

Xi / Yj > 26
4
6
8

0,4
0,01
0,0
0,41

= ;

&9

4
6
8

= 4,048

= 0,093696 = 0,306098

2 I ;

( ; )=

2 =

0,976
1
1
1
;

2 I

&9

( ; )=

6
;

0,084
1,788
5,448
7,32

2 I

0,336
10,728
43,584
54,648

1,032
= 0,141
7,32

= 54,648 (7,32) 2 = 1,0656

0,976
0,024
0

0,021
0,319
1
1

= 1,0656 = 1,032

Xi / Yj < 22

3,904
0,144
0
4,048

2 I

15,616
0,864
0
16,48

= 16,48 (4,048) 2 = 0,093696

0,306098
= 0,075
4,048

Es ms homognea la que sea menos dispersa, es decir la que tenga menor coeficiente de
variacin. Es decir la distribucin de Xi / Yj > 26 es ms homognea que la distribucin
de Xi / Yj < 22
2.- Porcentaje de pacientes con edad inferior a 26 y mayores de 18 aos.
18 - 22
0,01
0,06
0,02
0,09

22 - 26
0,09
0,03
0,00
0,12

totales
0,10
0,09
0,02
0,21

Luego el 21% tienen una edad entre 18 y 26 aos


89

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

3.- Media aritmtica y cuartiles de la siguiente distribucin:

/5 <X< 7

14 - 18
0,08

18 - 22
0,06

22 - 26
0,03

26 - 30
0,01

totales
0,18

0,445

0,333

0,167

0,055

16

20

24

28

7,12

6,66

1,54

0,445

0,778

0,945

Yj
I

<
<

<

Yj / 5 < Xi < 7

19,32

= 19,32 aos

1
4

0,25 0
1

= =0,25 ,QWHUYDOR(14 18) = 14 +


4 = 16,25
0,445
4

2
4

0,5 0,445
2

= =0,50 ,QWHUYDOR(18 22) = 18 +


4 = 18,66
0,333
4

3
4

0,75 0,445
3

= =0,75 ,QWHUYDOR(18 22) = 18 +


4 = 21,66
0,333
4

2
4

1
4

= 18,66 16,25 = 2,41

3
4

2
4

= 21,66 18,66 = 3

Para que la distribucin fuera simtrica, deberan de ser iguales ambas distancias.
4.- Analizar razonadamente la dependencia y la correlacin entre las variables X e Y.
FRECUENCIAS OBSERVADAS

Yj
Xi
3-5
5-7
7-9

14 - 18

18 - 22

22 - 26

26 - 30

0,00
0,08
0,30

0,01
0,06
0,02

0,09
0,03
0,00

0,40
0,01
0,00

0,50
0,18
0,32

0,38

0,09

0,12

0,41

FRECUENCIAS TEORICAS CASO DE INDEPENDENCIA

Yj
Xi
3-5
5-7
7-9

14 - 18

18 - 22

22 - 26

26 - 30

0,19
0,0684
0,1216

0,045
0,0162
0,0288

0,06
0,0216
0,0384

0,205
0,0738
0,1312

0,50
0,18
0,32

0,38

0,09

0,12

0,41

90

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

Como se ve no se mantienen ninguna proporcin por tanto No son Independientes


Hay dependencia
6 "
= ; < I ; < = 116,24 (5,64)(22,24) = 9,1936 0 Luego Hay correlacin
Como 6" = 9,1936 < 0 Correlacin inversa o negativa, ambas variables varan en
sentido contrario cuando una aumenta la otra disminuye y viceversa.
=

6
6

"

9,1936
= -0,9916
(1,777)(5,217)

= (0,9916) 2 = 0,98337

98,337% de fiabilidad, o bondad del ajuste. El 98,337% de las variaciones de una variable
vienen explicadas por las variaciones de la otra variable a travs de las rectas de regresin.
Como es suficientemente bueno establecemos la recta de regresin.
6

"

= < E ; = 22,24 + 2,9(5,64) = 38,65

9,1936
= 2,9 Es lo que varia Y al variar X en una unidad
3,16

* = 38,65 2,9 ;

<

Recta: Y/X
E

"

2
6
;

9,1936
= 0,413 Es lo que varia X al variar Y en una unidad
22,22

E< = 5,64 + 0,413(22,24) = 14,83


Recta: X/Y

* = 14,83 0,413<

5.- Suponiendo que el da 30 de Junio ingresas en Ubarmin por rotura de menisco,


analiza las posibilidades que tienes de que el 6 de Julio, puedas or el cohete desde la
plaza del Castillo.
*
; = 14,83 0, 413<
Suponiendo que tienes 18 aos
*
; = 14,83 0, 413(18) = 7,396 das
el cohete desde la plaza del castillo.

Estar ingresada el da 6 de julio No podr or

6.- En el mes de marzo una persona estuvo ingresada en Ubarmin por rotura de menisco
7 das
y afirma tener 18 aos. Comentar posible veracidad y fiabilidad de su
afirmacin.
*
; = 14,83 0, 413<
Para Y = 18

X = 7,369 das
*
= 38,65 2,9 ;

<

*
Para X = 7 < = 38,65 2,9(7) = 18,35 aos
Puede ser verdad.
Con una fiabilidad del 98,337%

91

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 64.- A un grupo de alumnos se les examina de teora (X) y prctica (Y) de una
asignatura. La nota global de dicha asignatura (Z) se obtiene de la siguiente forma:
Zi = X + Y
Se pide: Comparar la Homogeneidad de la distribucin de la nota global en los dos casos
siguientes:
1.- las variables X e Y estn totalmente correlacionadas
2.- Las variables X e Y son totalmente independientes
Solucin
Zi = X + Y
=

= Q
1

(
=

(
=

&9

) = ((

+ <

)
Q

( = )=

(
+

<

; Q
1

) (

+ <

+<

< Q
1

))

<
1

+2

((
=

+<

)(

<

)+ (
<

<

))

< Q

A.1.- r = +1

A.2.- r = 1

B.- r = 0

 > 0

 < 0

 = 0

&9

&9

&9

( = )=

( = )=

( = )=

 2 + 6  2 + 2 6 
;

 2 + 6  2 2 6 
;

+<

+<

2 + 6
2

+<

Ms homognea la que tenga menor coeficiente de variacin


El CV(Z) en el caso A.-1 siempre ser mayor que el CV(Z) del caso B
El CV(Z) en el caso A.-2 siempre ser menor que el CV(Z) del caso B
Luego la ms homognea ser cuando existe correlacin perfecta negativa.

92

+ 2 6 

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 65.- Un hospital adquiere una nueva maquina para rellenar bombonas de oxigeno. Al
cabo de un mes, se eligen 100 bombonas al azar y se comprueba su peso:
peso en Kg.
N bombonas
Ni

(45 - 48)
10
10

(48 - 50)
48
58

(50 - 53)
30
88

(53 - 55)
12
100

Se supone que si el 75% de las bombonas pesan menos de 52 Kg., la maquina ser
aceptada como buena, en caso contrario la maquina ser devuelta. Cree usted que el
hospital aceptara la maquina? Explique clara y exactamente el porqu de su respuesta.
Solucin
Habr que comprobar que el 75% de las bombonas pesan ms o menos de 52 kilos.
Para ello hallaremos el percentil 75 y comprobaremos si es mayor o menor de 52.
O Tambin podemos hallar bajo que percentil se encuentra el valor 52 y comprobar
si es mayor o menor que 75.
El percentil 75 ser:
75
100 = 75 El percentil 75 ser el valor de la variable que ocupa el lugar
100
inmediatamente siguiente al 75 y, que esta en el intervalo (50 53). Aplicando la
formula:

75
100

75
75
1 1
100 58
1
100
100
= / 1 +
& = 14 +
3 = 51,7 < 52
Q
30

Por tanto No devolver la maquina ya que 75% de las bombonas pesan menos de
52 kilos
De la otra forma:
Despejaremos r de la formula del percentil
U
T

 = / 1

+ 100

100

1 1

1
Q

&

(T 75 / 1 ) * Q 
U

100
&

+ 1 =

(52 50)(30)
+ 58 = 78
3

El 78% de las bombonas pesan menos de 52 kilos por tanto No devolver la


maquina.

93

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 66.-A una feria acuden 600 firmas expositoras que ocupan otros tantos Stands. La
superficie de estos, as como el personal asignado a cada uno vienen dados en la siguiente
tabla:
m2 X

Personal
Y
0-2
2-6
6 - 10
10 - 12
12 - 18
totales

10 - 20
74
46
18
2
0
140

20 - 30 30 - 70
10
0
86
22
76
26
60
50
30
26
262
124

70 - 130
0
2
12
22
38
74

total
84
156
132
134
94
600

1.- Superficie aproximada de la feria teniendo en cuenta que hay 60.000 m2 desocupados.
2.- Distribucin, en frecuencias relativas, de la superficie de los Stands en que trabajan
entre 5 y 15 personas.
3.- Distribucin del personal asignado en Stands con superficie entre 25 y 70 m2.
Analizar la posible simetra de dicha distribucin.
4.- Distribuciones de: N personas asignadas a un Stand / superficie > 30 m2
N personas asignadas a un Stand / superficie < 30 m2
Cul de las dos es ms homognea y por qu?
5.- % de Stands que tengan asignadas menos de10 personas sabiendo que ocupan ms
de 25 m2.
6.- Analizar y establecer la posible relacin lineal entre ambas variables
7.- Estimar el nmero de personas que podemos esperar que tenga asignado un Stand
con 78 m2. Dar una media de la bondad de dicha estimacin.
Solucin
m2 X
15
Personal
Y
10 - 20
1
4
8
11
15

0-2
2-6
6 - 10
10 - 12
12 - 18
Q

25
20 - 30

50
30 - 70

100
70 - 130

74
46
18
2
0
140

10
86
76
60
30
262

0
22
26
50
26
124

0
2
12
22
38
74

84
156
132
134
94
600

2100

6550

6200

7400

22250

31500

163750

310000

740000

1245250

  

6360

51800

61800

91600

211560

 

; Q
;

; < Q

 

< Q

 2 Q

<

84
624
1056
1474
1410
4648

84
2496
8448
16214
21150
48392

1.-Superficie aproximada de la feria teniendo en cuenta que hay 60.000 m2 desocupados.


22.250 + 60.000 = 82.250 metros cuadrados
2.- Distribucin, en frecuencias relativas, de la superficie de los Stands en que trabajan
entre 5 y 15 personas.
94

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

 1 /

10 - 20
20 30
30 70
70 - 130

Frecuencias absolutas

1 46 + 18 + 2 + 1 0 = 31,5
4
2
1 86 + 76 + 60 + 1 30 = 172,5
4
2
1 22 + 26 + 50 + 1 26 = 94,5
4
2
1 2 + 12 + 22 + 1 38 = 53,5
4
2
352

0,090
0,490
0,270
0,150
1

3.- Distribucin del personal asignado en Stands con superficie entre 25 y 70 m2.
Analizar la posible simetra de dicha distribucin.
/

/

Frecuencias absolutas

02
26
6 10
10 12
12 - 18

1 10 + 0 = 5
2
1 86 + 22 = 65
2
1 76 + 26 = 64
2
1 60 + 50 = 80
2
1 30 + 26 = 41
2
255

70
134
214
255

1
4

63,75 5
1

= 255 =63,75 ,QWHUYDOR(2 6) = 2 +


4 = 5,615
65
4

2
4

127,5 70
2

= 255 = 127,5 ,QWHUYDOR(6 10) = 6 +


4 = 9,594
64
4

3
4

191,25 134
3

= 255 = 191,25 ,QWHUYDOR(10 12) = 10 +


2 = 11,431
80
4

Distancias entre cuartiles:


T

2
4

1
4

= 9,594 5,615 = 3,979

3
4

2
4

= 11,431 9,594 = 1,837

Para que la distribucin fuera simtrica, deberan de ser iguales ambas distancias. Por tanto
No es simtrica.

4.- Distribuciones de: N personas asignadas a un Stand / superficie > 30 m2


N personas asignadas a un Stand / superficie < 30 m2
95

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

Cul de las dos es ms homognea y por qu?


Distribucin de N personas asignadas a un Stand / superficie > 30 m2


/

<

> 30
0+0=0
22 + 2 = 24
26 + 12 = 38
50 + 22 = 72
26 + 38 = 64
198

 

< Q

<

02
26
6 10
10 12
12 - 18

La varianza ser:

<

La media ser:

#2 =

<

" 2 Q"

< =

$ =+

! !

< Q
1

La desviacin tpica ser:

1
4
8
11
15

0
384
2432
8712
14400
25928

2152
= 10,87
198

25928
10,87 2 = 12,82
198

$ 2 = + 12,82 = 3,58

&9

El Coeficiente de Variacin ser:

0
96
304
792
960
2152

<

3,58
= 0,329
10,87

Distribucin de N personas asignadas a un Stand / superficie < 30 m2


/

&

/&

02
26
6 10
10 12
12 - 18

'

< 30
74 + 10 = 84
46 + 86 = 132
18 + 76 = 94
2 + 60 = 62
0 + 30 = 30
402

) )

< Q

+ 2 Q*

<

<

La media ser:

La varianza ser:

<

2
=
6.

La desviacin tpica ser:

- 2 Q-

<

/ =+

El Coeficiente de Variacin ser:

1
4
8
11
15

, ,

< Q
1

< =
6

84
528
752
682
450
2496

84
2112
6016
7502
6750
22464

2496
= 6,20
402

22464
6,20 2 = 17,44
402

/ 2 = + 17,44 = 4,1762

&9

<

96

4,1762
= 0,6735
6,20

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

Es ms homognea, la que es menos dispersa es decir la que tiene el coeficiente de


variacin menor. La ms homognea es la Distribucin del N personas asignadas a un
Stand/ superficie > 30 m2
5.- % de Stands que tengan asignadas menos de10 personas sabiendo que ocupan ms
de 25 m2.

Personal
Menos de 10
Ms de 10

Superficie de los Stand


Menos de 25
Ms de 25
224
148
47
181
271
329

% de Stand con (menos de 10 personas / ms de 25 m2) =

372
228
600

148
100 = 44,985%
329

6.- Analizar y establecer la posible relacin lineal entre ambas variables


74

140 * 84
= 19,6
600

Como no se mantienen las proporciones,


dependencia
<1 Q1 = 4648 = 7,75 .
; 2 Q2 =
< =
; =
1
600
1
2
3
< < 2 = 48392 (7,75) 2 = 20,65
2
64
=
1
600
2
5
5
; Q ; 2 = 1245250 (37,08) 2 = 700,5
2
66
=
1
600
2
67
= + 6 7 = + 20,65 = 4,54
69 = +
6

<= =
6

; :

; <
1

;< =

No son Independientes. Luego hay


22250
= 37,08
600

8 2 = + 700,5 = 26,46

211560
(37,08)(7,75) = 65,23
600

?>

65,23
= 0,543 U 2 = (0,543) 2 = 0,295
29,5% de fiabilidad. Es
6? 6>
(26,46)(4,54)
bastante pequea nos indica que es bastante pequea la relacin lineal entre ambas
variables. Solamente el 29,5% de las variaciones de una variable vienen explicadas por las
variaciones de la otra variable a travs de las rectas de regresin.
Establecemos esa relacin:
Recta Y/X
6 @A
65,23
E =
=
= 0,09 Es lo que varia Y al variar X en una unidad
2
@
700,5
6
U

= < E ; = 7,75 0,09(37,08) = 4,3


*
Recta: <C = 4,3 + 0,09 ; B

97

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

Recta que nos sirve para pronosticar el comportamiento de la Y (personal asignado al


Stand)conocida la X(metros cuadrados del Stand), pero solamente con una fiabilidad
del 29,5%
Recta X/Y
6 ED
65,23
E =
=
= 3,15 Es lo que varia Y al variar X en una unidad
2
20,65
6D
D

E< = 37,08 3,15(7,75) = 12,6

Recta: ; G * = 12,6 + 3,15<F


Recta que nos sirve para pronosticar el comportamiento de la X (metros cuadrados del
Stand), conocida la Y (personal asignado al Stand), pero solamente con una fiabilidad
del 29,5%
7.- Estimar el nmero de personas que podemos esperar que tenga asignado un Stand
con 78 m2. Dar una media de la bondad de dicha estimacin.
Recta: <F * = 4,3 + 0,09 ; G
*
Para ; H = 78 <I = 4,3 + 0,09(78) = 11,32
Es decir estimamos que tendr 11 o 12 personas asignadas pero la bondad de esta
estimacin es muy pequea es U = 0,543 U 2 = (0,543) 2 = 0,295 29,5% de fiabilidad.
Solamente el 29,5% de las variaciones del nmero de personas asignadas al stand
(Y) vienen explicadas por las variaciones de los metros cuadrados del Stand (X) a travs
*
de la recta de regresin. <K = 4,3 + 0,09 ; J

98

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 67.- En una empresa el 20% es personal "no cualificado", el 50% es personal


"cualificado" y el resto personal "tcnico". La plantilla consta de 1000 empleados. Se ha
estimado la productividad para cada uno de estos grupos en unos coeficientes que van de 1
a 5, siendo como se puede observar en la tabla siguiente:
Coeficiente
Productividad
x
1
2
3
4

Personal
no cualificado
en %
10
20
30
30

Personal
cualificado
en %
5
20
20
40

Personal
tcnico
en %
10
40
30

a) Hllese la productividad media de los 1000 empleados.


b) Qu nivel de productividad es el ms corriente en esta empresa?
c) Bajo qu coeficiente estn el 50% de los trabajadores menos productivos?
d) Comparando las productividades medias del personal no cualificado y del personal
cualificado, cul de ellas corresponde a una distribucin de frecuencias ms homognea?

Solucin
1.- Para hallar la productividad media Haremos:
Coeficiente
Productividad

Personal No
Cualificado
(En %)

Personal
Cualificado
(En %)

Personal
Tcnico
(En %)

1
2
3
4
5

10
20
30
30
10

5
20
20
40
15

10
40
30
20

L L

; Q
1

L L

; Q
1

M = I M 100

N SN

acumulado

4,5
17
28
35
15,5
100

O %

4,5
34
84
140
77,5
340

4,5
21,5
49,5
84,5
100

340
P SP
=
= 3,4 Coeficiente de productividad media.
100
100

2.- El nivel de productividad ms corriente ser la moda.


Productividad modal 0 Q = 4 Valor de la variable que presenta mayor frecuencia.
3.- El nivel de productividad que separa al 50% de los trabajadores es la mediana
1

= 50 Luego la mediana es

R =4

4.- Analizar la homogeneidad, es decir hallar CV de cada distribucin:


;

(1) Personal No cualificado


Coeficiente

Personal No

S SS

T 2 ST
99

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

Productividad
; (1)

Cualificado
(En %)

1
2
3
4
5

10
20
30
30
10
100

(1) =

10
40
90
120
50
310

U ( SU 310
=
= 3,1
100
100

X (1) =

10
80
270
480
250
1090
6

W 2 (1) =

X 2 = 1,29 = 1,1358

V 2 SV

; =

100

&9

(1)=

1090
(3,1) 2 = 1,29
100

1,1358
= 0,36 Homogeneidad
3,1

aceptable ya que es menor de 1. Nos dice que hay una dispersin bastante pequea.
;

(2) Personal cualificado


Coeficiente
Productividad
; (2)

Personal No
Cualificado
(En %)

1
2
3
4
5

5
20
20
40
15
100

( 2) =

_ ( 2) =

340
\ ( S\
=
= 3,4
100
100
6

_ 2 = 1,24 = 1,1135

Z SZ

5
40
60
160
75
340

[ 2 S[

5
80
180
640
375
1280
6

^ 2 (2) =

&9

] 2 S]

; =

100
(2)=

1280
(3,4) 2 = 1,24
100

1,1135
= 0,32 Homogeneidad
3,4

aceptable ya que es menor de 1. Nos dice que hay una dispersin bastante pequea.
Mayor homogeneidad ser el que tenga menor coeficiente de variacin, es decir el de
menor dispersin en este caso el personal cualificado presenta una productividad
MS homognea.

100

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 68.- En los ltimos 10 aos (1.988 - 1.997) el nmero de personas menores de 18 aos
ingresadas en Ubarmin han sido: 28 - 30 - 29- 30 - 32 - 34 - 33 - 33 - 34 - 35
1.- Podemos confirmar la aparente tendencia lineal creciente, del nmero de personas,
menores de 18 aos, ingresadas en Ubarmin en los ltimos aos? Con que fiabilidad?
2.- Pronosticar el nmero de personas, menores de 18 aos, que cabe esperar para el ao
2.005. Suponiendo que se mantiene la tendencia lineal.
3.- Analizar la representatividad del nmero medio de ingresos en Ubarmin de personas
menores de 18 aos, en los ltimos 10 aos.
Solucin

Aos
T
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003

d2 =

c 2 Qc

g2

<

Personas
X
28
30
29
30
32
34
33
33
34
35
318
318
= 31,8
10
2

; =

T- 1.993
Y
1
2
3
4
5
6
7
8
9
10
55
<

<

784
900
841
900
1024
1156
1089
1089
1156
1225
10164

<

10164
(31,8) 2 = 5,16
10

1
4
9
16
25
36
49
64
81
100
385

;<

28
60
87
12
160
204
231
264
306
350
1810

55
= 5,5
10
6

f =+

e 2 = + 5,16 = 2,27

385
(5,5) 2 = 8,25 6 i = + 6 i 2 = + 8,25 = 2,87
1
10
; k <j ; < = 1810 (31,8)(5,5) = 6,1
6 lm
=
1
10

< =

on

6,1
2
= 0,936
U
= (0,936) 2 = 0,8767
87,67% de fiabilidad. Es
n
6
(2,27)(2,87)
bastante grande nos indica que es buena la relacin lineal entre ambas variables.
Establecemos esa relacin:
U

= < E ; = 5,5 1,18(31,8) = 31,36

6o

pq

2
6p

6,1
= 1,18 Es lo que varia Y al variar X en una unidad
5,16
*
Recta: <s = 31,36 + 1,18 ; r

101

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

ut

6,1
= 0,74 Es lo que varia X al variar Y en una unidad
8,25

E< = 31,8 0,74(5,5) = 27,73


Recta:

Sustituyendo <x =7 1993 Nos queda:

w * = 27,73 + 0,74<v

y * = 27,73 + 0,74(7 1993)

Donde T es el ao en el que queremos pronosticar el nmero de personas que estimamos


van a ingresar en Ubarmin, estimacin con una bondad de U = 0,936
U

= (0,936) 2 = 0,8767

87,67% de fiabilidad.

1.- Podemos confirmar la aparente tendencia lineal creciente, del nmero de personas,
menores de 18 aos, ingresadas en Ubarmin en los ltimos aos? Con que fiabilidad?
Si porque r es positivo y adems bastante cercano a 1 con lo que la fiabilidad es bastante
grande U = 0,936 lo que significa que U 2 = (0,936) 2 = 0,8767 87,67% de fiabilidad.
2.- Pronosticar el nmero de personas, menores de 18 aos, que cabe esperar para el ao
2.005. Suponiendo que se mantiene la tendencia lineal.
*
*
; z = 27,73 + 0,74(7 1993)
; { = 27,73 + 0,74( 20051993) = 36,61
T = 2.005
Es decir estimamos que en 2.005 habr 37 ingresos de personas menores de 18 aos, en
Ubarmin.

3.- Analizar la representatividad del nmero medio de ingresos en Ubarmin de personas


menores de 18 aos, en los ltimos 10 aos.
6

2,27
= 0,071 Menor de 1 y adems muy pequeo, Luego poca dispersin,
31,8
;
es decir es muy homognea la distribucin, los datos son muy parecidos, la media es muy
representativa del conjunto.
&9

(; )

102

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 69.- En una clase el 30% de alumnos varones y el 10% de mujeres son repetidores.
Sabiendo que en una clase de 160 alumnos hay 90 varones. Calcular el porcentaje de
alumnos que siendo repetidores sean mujeres.
Solucin

Suceso A = Ser hombre

A = 90

= 160 90 = 70

Suceso B = Ser repetidor


% Ser repetidor 6DELHQGRTXHHVKRPEUH = 30% 0,3 (90) = 27
Suceso

% ) = 27

% Ser repetidor 6DELHQGRTXHHVPXMHU = 10%


Suceso

0,1 (70) = 7

% =7

Suceso B =

B
%

%) +

A
27
63
90

% = 27 + 7 = 34

= 160 34 = 126

7
63
70

34
126
160

1.-% de alumnos que siendo repetidores sean mujeres


% (Mujer/repetidor) = % $ =
%

Re SHWLGRUD )
7
=
100 = 20,588 %
(Re SHWLGRUD )
34

0XMHU

Es decir el 20,588% de los repetidores son mujeres.

103

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 70.- La tabla de frecuencias siguiente, corresponde a una variable bidimensional


X/Y
50-150
150-250
250-350
350-450

1,5-2,5
14
4
6
4

2,5-3,5
28
8
12
8

3,5-4,5
21
6
9
6

4,5-5,5
7
2
3
2

Sabiendo que:
Xi = peso, en kilos, de los nios nacidos en maternidad en una semana
Yj = peso, en gramos, que pierden los recin nacidos en esos primeros das
1.- Analizar y establecer la posible relacin lineal entre ambas variables.
2.- Pronosticar el peso de un nio que ha perdido en esos das 400 gramos de peso. Dar una
medida de la fiabilidad de dicho pronstico.
3.- Calcular el peso medio de los nios nacidos en maternidad que han perdido menos de
200 gramos. Compararla con la media de los que si han perdido mas de 200 gramos. Y
decir cual es mas representativa y porque.
4.- distribucin de X/ 100 < Y< 400 podemos afirmar que es simtrica?
5.- Distribuciones marginales de ambas variables. Cul es ms homognea? Por qu?
Solucin

1,5 2,5
Y
2
100 50-150
14
200 150-250
4
300 250-350
6
400 350-450
4
28
Q

Peso en kilos de los nios (X)


2,5 3,5 3,5 4,5 4,5 5,5
3
4
5
28
21
7
8
6
2
12
9
3
8
6
2
56
42
14

70
20
30
20
140

56

168

168

70

462

2 Q

112

504

672

350

1638

11200

33600

33600

14000

92400

; Q
;

; < Q

1.- Analizar y establecer la posible relacin lineal entre ambas variables.


Frecuencias observadas (OB)
X 1,5 2,5
Y
50-150
150-250
250-350
350-450
Q

14
4
6
4
28

2,5 3,5

3,5 4,5

4,5 5,5

28
8
12
8
56

21
6
9
6
42

7
2
3
2
14

104

70
20
30
20
140

~ ~

< Q

7000
4000
9000
8000
28000

 2 Q

<

700000
800000
2700000
3200000
7400000

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

Frecuencias tericas caso de ser Independientes


X 1,5 2,5
Y
50-150
150-250
250-350
350-450
Q

14
4
6
4
28

2,5 3,5

3,5 4,5

4,5 5,5

28
8
12
8
56

21
6
9
6
42

7
2
3
2
14

70
20
30
20
140

Como se mantienen todas las proporciones, Son Independientes. Luego No hay


ninguna dependencia
< Q = 28000 = 200 .
; Q = 462 = 3,3
; =
< =
1
140
1
140
2

; Q ; 2 = 1638 (3,3) 2 = 0,81 6 = + 6 2 = + 0,81 = 0,9


2
6
=
1
140
6

2 =

<

7400000
(200) 2 = 12857,14 6 = + 12857,14 = 113,39
1
140

;
<
92400

6 
=
;< =
(3,3)(200) = 0 Incorrelacin total
1
140
2

< =

2.- Pronosticar el peso de un nio que ha perdido en esos das 400 gramos de peso. Dar una
medida de la fiabilidad de dicho pronstico.
No se puede pronosticar ya que son dos variables Independientes e Incorrelacionadas
3.- Calcular el peso medio de los nios nacidos en maternidad que han perdido menos de
200 gramos. Compararla con la media de los que si han perdido mas de 200 gramos. Y
decir cual es mas representativa y porque.
(1) = Nios nacidos en maternidad que han perdido menos de 200 gramos.
X

1,5 2,5
2

2,5 3,5
3

3,5 4,5
4

4,5 5,5
5

16

32

24

80

32

96

96

40

264

2 Q

64

288

384

200

936

; Q

(1) =

(1) =

;
1

( Q

264
= 3,3
80

2 (1) =

2 Q

2 = 0,81 = 0,9

; =

936
(3,3) 2 = 0,81
80
6
0,9
&9 (1)=
=
= 0,2727
3,3
;

(2) = Nios nacidos en maternidad que han perdido ms de 200 gramos.


105

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1,5 2,5
2

2,5 3,5
3

3,5 4,5
4

4,5 5,5
5

12

24

18

60

24

72

72

30

198

48

216

288

150

702

; Q
;

( 2) =
6

( Q

( 2) =

198
= 3,3 6 2 (2) =
60

2 Q

; =

2 = 0,81 = 0,9

702
(3,3) 2 = 0,81
60
6
0,9
&9 ( 2)=
=
= 0,2727
3,3
;

Son igual de homogneas adems tienen la misma media, y son igual de representativas. Es
porque las variables son independientes y por tanto se mantienen las proporciones.
4.- distribucin de X/ 100 < Y< 400 podemos afirmar que es simtrica?
X

1,5 2,5
2

2,5 3,5
3

3,5 4,5
4

4,5 5,5
5

19

38

28,5

9,5

95

; Q

38

114

114

47,5

313,5

2 Q

76

342

456

237,5

1111,5

19

57

85,5

95

; Q
1

315,5
= 3,3
95

1
4

23,75 19
1

= 95 =23,75 ,QWHUYDOR(2,5 3,5) = 2,5 +


1 = 2,625
38
4

2
4

47,5 19
2

= 95 = 47,5 ,QWHUYDOR(2,5 3,5) = 2,5 +


1 = 3,25
38
4

3
4

71,25 57
3

= 95 = 71,25 ,QWHUYDOR(3,5 4,5) = 3,5 +


1= 4
28,5
4

Distancias entre cuartiles:


T

2
4

1
4

= 3,25 2,625 = 0,625

3
4

2
4

= 4 3,25 = 0,75

Para que la distribucin fuera simtrica, deberan de ser iguales ambas distancias. Por tanto
No es simtrica.
106

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

5.- Distribuciones marginales de ambas variables. Cul es ms homognea? Por qu?


X

1,5 2,5
2,5 3,5
3,5 4,5
4,5 5,5

28
56
42
14
140

50-150
150-250
250-350
350-450

70
20
30
20
140

462
< Q = 28000 = 200 .
< =
= 3,3
1
140
1
140
6
= + 0,81 = 0,9
6
= + 12857,14 = 113,39
6
6
113,39
0,9
=
= 0,56
&9 (< )=
&9 ( ; )=
=
= 0,2727
200
3,3
<
;
Es ms homognea la distribucin de la variable X (peso de los recin nacidos) que la
distribucin de la variable Y (peso, en gramos, que pierden los recin nacidos en esos
primeros das) Ya que presenta un coeficiente de variacin menor, es decir tiene menor
dispersin por tanto es ms homognea.
;

; Q

107

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 71.- Un hospital adquiere una nueva maquina para rellenar bombonas de oxigeno. Al
cabo de un mes, se eligen 100 bombonas al azar y se comprueba su peso:
Peso en Kg.
N bombonas

(45 - 48)
10

(48 - 50)
48

(50 - 53)
30

(53 - 55)
12

Se supone que si el 75% de las bombonas pesan menos de 52 Kg., la maquina ser
aceptada como buena, en caso contrario la maquina ser devuelta. Cree usted que el
hospital aceptara la maquina? Explique clara y exactamente el porqu de su respuesta.
Solucin
Habr que comprobar que el 75% de las bombonas pesan ms o menos de 52 kilos.
Para ello hallaremos el percentil 75 y comprobaremos si es mayor o menor de 52.
O Tambin podemos hallar bajo que percentil se encuentra el valor 52 y comprobar
si es mayor o menor que 75.
El percentil 75 ser:
75
100 = 75 El percentil 75 ser el valor de la variable que ocupa el lugar
100
inmediatamente siguiente al 75 y, que esta en el intervalo (50 53). Aplicando la
formula:

75
100

75
75
1 1
100 58
1
100
100
= / 1 +
& = 14 +
3 = 51,7 < 52
Q
30

Por tanto No devolver la maquina ya que 75% de las bombonas pesan menos de
52 kilos
De la otra forma:
Despejaremos r de la formula del percentil
U
T

= / 1 + 100

100

1 1

1
Q

&

(T 75 / 1 ) * Q
U

100
&

+ 1 =

(52 50)(30)
+ 58 = 78
3

El 78% de las bombonas pesan menos de 52 kilos por tanto No devolver la


maquina.

108

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 72.- Realizada una encuesta entre fumadores se obtuvieron los resultados, de la tabla,
sobre las variables:
X: N de cigarrillos fumados diariamente
Y: Horas de sueo diarias

Horas
4-6
6-7
7-8
8-9
total

2 -6
0
4
18
28
50

N DE CIGARRILLOS
6 - 12 12 - 14 14 - 20
2
8
26
10
16
20
24
14
12
26
10
4
62
48
62

20 - 30
36
26
14
2
78

total
72
76
82
70
300

Solucin

1).- Calcular el porcentaje de personas que fuman entre 15 y 22 cigarrillos al da

,QWHUYDORV

4-6

6-7

6,5

7-8

7,5

8-9

8,5

5
2
26+ 36 =28,87
6
10
5
2
20+ 26 =21,86
6
10
5
2
12+ 14 =12,80
6
10
5
2
4+ 2 =3,73
6 10
67,26

28,87
50,73
63,53
67,26

67,26
= 22,42%
300
Obtener el nmero mnimo de cigarrillos diarios que fuma uno de los fumadores
del 30% que ms fuma.

2).-

Percentil 70
70
300 = 210 ,QWHUYDOR(14 20)
100

3).-

70
100

70
70
1 1
300 160
1
100
= / 1 + 100
& = 60 +
6 = 18,84FLJDUULOORV
Q
62

Podemos pronosticar que a mayor nmero de cigarrillos fumados diariamente se


dormir ms horas. Con que fiabilidad

109

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

No ya que la covarianza es negativa, y ambas variables varan en sentido contrario a


mayor nmero de cigarrillos, pronosticaremos menos horas de sueo con una
fiabilidad del 34,34%
4).-

Estimar el consumo de tabaco para una poblacin de 1.500 personas de las que son
fumadoras el 32%
32% de 1.500 = (0,32) (1500) = 480 personas que fuma
Como la media de cigarrillos es de 14,62 es decir 15 cigarrillos por persona
El consumo de tabaco ser 480 personas a un promedio de 15 cigarrillos por
persona sern: ( 480)(15 ) = 7.200 cigarrillos/da

5).- Estimar el nmero de horas de sueo diarias para una persona que fuma 35
cigarrillos al da.
Como la recta de regresin de Y/X es Y* = 8,3 0,1 Xi
Para un valor X = 35 aos sustituimos en la recta y obtenemos
Y* = 8,3 (0,1 )(35) = 4,8 horas de sueo que pronosticamos para una persona
que tiene 35 aos, pero con una fiabilidad, o bondad de 0,58 es decir del 34,34% Que
parece un poco pequea.
6).- Porcentaje de personas fumadoras que duermen entre 6 y 8 horas sabiendo que no
fuman ms de 15 cigarrillos al da

Menos de 6 horas de
sueo
Entre 6 y 8 horas de
sueo
Ms de 8 horas de
sueo

Menos de 15
cigarrillos
14,33

Ms de 15
cigarrillos
57,67

72

91,33

66,67

158

64,67

5,33

70

170,33

129,67

Duermen entre 6 y 8 horas

91,33
%
=
100 = 53,62%
No
fuman
ms
de
15
cigarrillo
s
170,33

110

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 73.- Una empresa decide hacer un reajuste entre sus empleados. La clasificacin se lleva a
cabo mediante un Test, que arroja las siguientes puntuaciones:
N de Empleados
Puntuacin
0 30
30 50
50 70
70 90
90 - 100

Ni

94
140
160
98
8

94
234
394
492
500

La planificacin ptima de la empresa exige que el 65% sean Administrativos, el 20% Jefes de
Seccin, el 10% Jefes de Departamento y el 5% Inspectores, segn sea la puntuacin obtenida
(estas categoras van de menor a mayor puntuacin) Calcular la puntuacin mxima para ser
Administrativo, Jefe de Seccin y Jefe de Departamento.
Solucin
65%

Administrativos

siguiente a

65
100

Valor de la variable que ocupa el lugar, inmediatamente

65
(500) = 325
100
T

El siguiente 20% Jefes de seccin


inmediatamente siguiente a

Valor de la variable que ocupa el lugar,

85
(500) = 425
100

El siguiente 10% Jefes Departamento


inmediatamente siguiente a

85
100

95
100

Valor de la variable que ocupa el lugar,

95
(500) = 475
100

El ltimo 5% Inspectores.
Luego hay que hallar los tres puntos que dividirn la distribucin en cuatro partes:
T

65 T 85
100 100

95
100
U

Aplicando la formula del percentil:

= / 1 + 100

100
T

65
100

65
100

1 1

1
Q

&

Se encuentra en el intervalo (5070)


65
(500) 234
= / 1 + 100
(20) = 61,375 SXQWRV.
160

61,375 puntos: puntuacin mxima para ser Administrativo


111

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

85
100

85
100

Se encuentra en el intervalo (70 90)


85
(500) 394
100
= / 1 +
(20) = 76,326 SXQWRV.
98

76,326 puntos: puntuacin mxima para ser Jefe de seccin


T

95
100

95
100

Se encuentra en el intervalo (70 90)


95
(500) 394
100
= / 1 +
(20) = 86,53 SXQWRV.
98

86,53 puntos: puntuacin mxima para ser Jefe de Departamento.

112

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 74.- Se ha efectuado un examen a un grupo de alumnos, en una determinada materia. El


examen constaba de dos pruebas A y B. De la informacin obtenida se han hecho los
siguientes clculos:
; = 15,5
; = 75
6 = 2,5
6 = 30,6
Los alumnos F y G han obtenido en la A un 16,7 y 14 respectivamente y en la prueba B
77,5 y 82,4 respectivamente.
Diga globalmente cul de los dos alumnos supera en puntuacin al otro.
Solucin
=

() ) =

16,7 15,5
= 0,48
2,5

() ) =

77,5 75
= 0,081
30,6

(* ) =

14 15,5
= 0,6
2,5

(* ) =

82,4 75
= 0,24
30,6

= *

( ) ) = 0,48 + 0,081 = 0,561

( ) = 0,6 + 0,24 = 0,36

La posicin relativa ms alejada de la media es 0,561 Luego en trminos relativos esta


ms cerca de la media - 0,36
En este caso como se supone que es mejor estar por encima de la media tendr mejor
posicin el alumno F que tiene posicin ms alejada de la media pero por encima

113

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 75.- De la encuesta de salarios correspondiente a un periodo que abarca los tres


primeros meses de 1.988, obtenemos los siguientes datos en cuanto a ganancias medias
mensuales de los trabajadores del sector industrial. Se pide: Estudiar la concentracin
salarial del sector
Ganancias en pesetas
N de Trabajadores
(En millones)
15.000 - 25.000 ................................................ 16
25.001 - 30.000 ................................................ 34
30.001 - 40.000 .............................................. 211
40.001 - 50.000 .............................................. 332
50.001 - 60.000 .............................................. 310
60.001 - 80.000 .............................................. 582
80.001 - 100.000 .............................................. 194
100.001 - 200.000 .............................................. 134
Solucin
/

1 /

15.000 25.000
25.001- 30.000
30.001 - 40.000
40.001 - 50.000
50.001 - 60.000
60.001 - 80.000
80.001 -100.000
100.001 - 200.000

; Q

; Q

; Q

20
27,5
35
45
55
70
90
150

; Q

; Q

16
34
211
332
310
582
194
134
1813

*100= T

16
50
261
593
903
1485
1679
1813

0.882
2.758
14.40
32.70
49.80
81.91
92.61
100

0.882
2.758
14.40
32.70
49.80
81.91
92.61
100

0.275
1.080
7.430
20.28
34.94
69.97
84.98
100

* 100 =

acumulado

320
935
7385
14940
17050
40740
17460
20100
116290

=1

0.275
0.805
6.35
12.85
14.66
35.03
15.01
7.39

)
=

0.275
1.080
7.430
20.28
34.94
69.97
84.98
100

0.607
1.678
6.966
12.42
14.86
11.94
7.63
0

56,101
= 0,2004
275,0056

=1

No existe demasiada concentracin, El coeficiente est comprendido entre 0 y 1, a


mayor ndice mayor concentracin.
114

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 76.- Se conocen las ventas de un cierto nmero de empresas. Y se desea obtener las
ventas medias de este nmero de empresas.

Ventas (millones)
Empresas

4
10

5
3

6
3

7
10

Solucin
;

4
5
6
7

Ventas Medias

10
3
3
10
26

; Q

40
15
18
70
143

; Q
1

143
= 5,5 millones
26

115

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 77.- De una encuesta realizada entre 100 familias han agrupado la masa de salarios
segn la siguiente distribucin:
Salario
Familias
1.2.3.4.-

1.000
20

2.000
30

3.000
30

4.000
20

Obtener el salario medio


Obtener el salario medio con cambio de origen 2.000
Obtener el salario medio con cambio de unidad 1.000
Obtener el salario medio con cambio de origen y unidad simultneamente

Solucin
1.- Obtener el salario medio
;

20
30
30
20
100

1000
2000
3000
4000

Salario medio

; Q

20000
60000
90000
80000
250.000

.
2.- Obtener el salario medio con cambio de origen 2.000

= ; 2000

-1000
0
1000
2000

Salario medio

20
30
30
20
100

-20000
0
30000
40000
50.000

1
2
3
4

1.000

20
30
30
20
100

8 Q
1

50000
= 500
100

= 8 + 2.000 = 2.500

1.000

Salario medio

8 Q

250.000
= 2.500
100

= ; 2000

8 Q

3.- Obtener el salario medio con cambio de unidad 1.000

; Q

20
60
90
80

250

=
;

116

8 Q
1

50000
= 500
100

= 8 + 2.000 = 2.500

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

4.- Obtener el salario medio con cambio de origen y unidad simultneamente:


8

2000
1000

-1
0
1
2

2000
1000

20
30
30
20
100

Salario medio

8 Q

-2
0
3
4
5

117

8 Q
1

5
= 0,05
100

= 8 *1000 + 2.000 = 2.500

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 78.- Dados los siguientes valores: Xi: 1, 2, 3, 4, 3, 2, 1, 1, 5, 1, 2, 4, 2, 1, 1, 2, 3, 4, 5, 5.


Obtener la tabla estadstica. Y el diagrama de barras de la distribucin.
Solucin

Xi

ni

1
2
3
4
5

Ni
6
11
14
17
20

6
5
3
3
3
20

Xi ni
6
10
9
12
15
52

valores de la variable
7

Frecuencia

2
Desv. tp. = 1,47

Media = 2,6
N = 20,00

0
1,0

2,0

3,0

4,0

valores de la variable

118

5,0

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1 .- Dados los siguientes valores: 2,38; 2,06; 2,15; 2,47; 2,21; 2,36; 2,32; 2,32; 2,24;
2,15; 2,10; 2,13; 2,49; 2,41; 2,29; 2,36; 2,22; 2,46; 2,19; 2,06.
1.- Obtener la tabla estadstica de valores agrupados, comprendidos entre 2,00 y 2,50; con
una amplitud de 0,10 para cada intervalo
2.- Obtener el histograma de frecuencias

Solucin

INTERVALOS
2 2,10
2,10 2,20
2,20 2,30
2,30 2,40
2,40 2,50

ni
2
5
4
5
4
20

Xi
2,05
2,15
2,25
2,35
2,45

valores de la variable
6

Frecuencia

Desv. tp. = ,13

Media = 2,27
N = 20,00

0
2,05

2,15

2,25

2,35

valores de la variable

119

2,45

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 80.- Dada la siguiente distribucin, calcular las frecuencias absolutas acumuladas,


sabiendo que el nmero de observaciones ha sido 50
Xi
fi

7,90
0,10

8,10
0,20

8,30
0,40

8,50
0,30


6ROXFLyQ


;




I 

= I (50) 

= Q
=1

7,90
8,10
8,30
8,50

0,10
0,20
0,40
0,30

5
10
20
15












120

5
15
35
50

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 81.- Dada la distribucin


Xi
ni

5.000

6.000

7.000

8.000

9.000

60

50

70

80

50

Obtener la media, la Mediana y la moda.



6ROXFLyQ


;

Q 

1 

; Q 

5.000
6.000
7.000
8.000
9.000

60
50
70
80
50

60
110
180
260
310

300.000
300.000
490.000
640.000
450.000








Media =

Xini
N

3.422
= 171,1 cm.
20

Moda Mo = Valor de la variable que ms veces se repite, en este caso el valor


168 es la moda, que se repite cuatro veces.
Mediana Me = Valor de la variable que divide a la distribucin en dos partes
iguales. Valor de la variable que ocupa el lugar central. Valor de la variable que
deja por debajo de ella el 50% de los valores. Como N/2 es 10, ser la media
aritmtica de los valores que ocupan los lugares 10 y 11, es decir los valores 168 y
170 por tanto la mediana es el valor 169 cm.

121

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 82-. Realizada una encuesta entre 100 pacientes de un hospital sobre dos caractersticas
x e y se obtuvieron los siguientes resultados:

= 1.650

; Q

<

= 840

< Q

2 Q =149.000

2 Q = 587.500

= 295.000

; < Q

1.- Grado de homogeneidad de cada variable


2.- Hallar r y explicar su Significado
3.- % de la variacin de Y explicada por la variacin de X
4.- Variacin de X al variar Y en una unidad
5.- Estimar el valor de X para Y =9
6.- Fiabilidad de la estimacin anterior
7.- Significado del valor del coeficiente de regresin lineal de la recta de Y*/X
8.- Hallar y explicar el Significado de (1 - r2)
9.- Es cierto que la variable X es ms dispersa que la variable Y, ya que tiene una mayor
varianza
10.- Significado de la Covarianza entre X e Y
11.- % de la variacin de X explicada por la variacin de Y
12.- Dibujar las dos rectas de regresin y comentar el grfico.
Solucin
;

; Q
1

; 2 Q

2 =

1
<

1.650
= 16,50
100
2

; =

<

< Q
1

587.500
(16,5) 2 = 5602,75
100

840
= 8,4 .
100

=+

2 = + 5602,75 = 74,85

149.000
(8,4) 2 = 1419,44 6 = + 1419,44 = 37,67
1
100
; < ; < = 295.000 (16,5)(8,4) = 2811,4 Correlacin positiva
6 
=
100
1

6
2811,44
2
2
=
= 0,9971
U =
U
= (0,9971) = 0,9942 99,42% de fiabilidad

(74,85)(37,67)
6 6
6

2 =

< =

(1 ) = (1 0,9942) = 0,0058
U

0,58% No explicado
6
37,67
&9 (< )=
=
= 4,484
8,4
<

6
74,85
( ; )=
=
= 4,536
16,5
;

6
2811,4
2 =
E =
= 0,5 Es lo que varia Y al variar X en una unidad
5602,75
6
&9

= < E ; = 8,4 0,5(16,5) = 0,15

6
;

Recta

<

: < * = 0,15 + 0,5 ;

2811,4
= 1,98 Es lo que varia X al variar Y en una unidad
1419,44

E< = 16,5 1,98(8,4) = 0,13

Recta

122

<

* = 0,13 + 1,98<

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1.- Grado de homogeneidad de cada variable


6
74,85
37,67
= 4,536
&9 (< )=
=
= 4,484
16,5
8,4
;
<
Ambas tienen mucha dispersin ya que los coeficientes son mayores de 1 luego hay muy
poca homogeneidad.
2.- Hallar r y explicar
su Significado

6
2811,44
=
= 0,9971
U =

(74,85)(37,67 )
6 6
Coeficiente de correlacin lineal es bastante cercano a 1 luego hay mucha correlacin,
prcticamente perfecta, y positiva, es decir ambas variables varan en el mismo sentido. La
recta ser creciente.
3.- % de la variacin de Y explicada por la variacin de X
2
2
U
= (0,9971) = 0,9942
4.- Variacin de X al variar Y en una unidad
6
2811,4
2 =
E =
= 1,98 Coeficiente de regresin de ;
<
1419,44
6
5.- Estimar el valor de X para Y =9
*
*
;
= 0,13 + 1,98<
;  = 0,13 + 1,98(9 ) = 17,69
&9

( ; )=

6.- Fiabilidad de la estimacin anterior


2
2
U
= (0,9971) = 0,9942 99,42% de fiabilidad
7.- Significado del valor del coeficiente de regresin lineal de la recta de Y*/X
6 
2811,4
E =
=
= 0,5 Es lo que varia Y al variar X en una unidad
2

5602,75
6
8.- Hallar y explicar el Significado de (1 - r2)
1 U 2 = (1 0,9942 ) = 0,0058 0,58% De la variacin de una variable que No
viene explicado por las variaciones de la otra variable.
9.- Es cierto que la variable X es ms dispersa que la variable Y, ya que tiene una mayor
varianza
No, la varianza mide dispersin absoluta, para comparar dispersiones es necesario
medidas de dispersin relativas, en este caso utilizamos el coeficiente de variacin, es algo
mayor el de la variable X por lo que ser un poco ms dispersa, pero ambas son demasiado
dispersas.
10.- Significado de la Covarianza entre X e Y
;  < ; < = 295.000 (16,5)(8,4) = 2811,4 Correlacin positiva Ambas
6 
=
1
100
variables varan en el mismo sentido.
11.- % de la variacin de X explicada por la variacin de Y
2
2
U
= (0,9971) = 0,9942 99,42%
12.- Dibujar las dos rectas de regresin y comentar el grfico.
Prcticamente ser la misma recta ya que hay correlacin casi perfecta, es decir,
todos los puntos estn en la recta, las dos rectas coinciden.

123

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 83.- En un determinado pas la renta "per capita" fue en 1.997 de 3.200 $. Se ha


estimado que en los prximos 8 aos se duplicar la renta "per capita". Determnese:
1.- Si la tasa de crecimiento de 1.998 fue un 3% anual. Cul ser la renta "Per capita" en
ese periodo?
2.- La tasa media anual acumulativa para poder alcanzar el objetivo de duplicar esa renta.
Solucin
Es de Indices, no entra

124

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 84.- En un museo se sabe que el precio medio de las entradas es de 76 Pts. Los adultos
deben pagar sus correspondientes entradas a 100 Pts. Y los nios a 20 Pts. Que porcentaje
de adultos y nios visitan el museo?
Solucin

125

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 85.- En un barrio de una ciudad, el 20% de las viviendas tienen una superficie entre 50
y 60 m2, el 25% entre 60 y 70 m2, el 20% entre 70 y 80 m2, el 25% entre 80 y 100 m2 y, el
10% entre 100 y 120 m2. Determnese:
1.- La superficie media por vivienda
2.- El tipo de vivienda ms frecuente.
Solucin


126

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 86.- A partir de una distribucin bidimensional de las variables X e Y, hemos calculado


la regresin de Y sobre X, con el siguiente resultado: Y* = 5 + 3X
1.-Estimar los parmetros de la recta de regresin de X sobre Y, teniendo en cuenta,
adems, que en la regresin anterior el coeficiente de correlacin obtenido ha sido 1.
2.- Qu pensara si le dijeran que en dicha regresin de Y sobre X el coeficiente de
correlacin obtenido ha sido 1 en lugar de +1?
Solucin

127

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 87.- Entre las variables X e Y se han estimado las rectas de regresin:


Y* = 1,7 - 0,8X
X* = 0,1- 0,8Y
Si construimos dos nuevas variables:
Z = 3X + 1 W = 3Y- 3
Hallar los coeficientes de correlacin entre las variables X e Y, y entre las variables Z y W.
Comentar brevemente y razonadamente los resultados obtenidos.
Solucin

128

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 88.- Diga si es cierto o falso el siguiente apartado:


2x + 3
1- "Al hacer el cambio de variable z =
, el coeficiente de variacin permanece
4
invariable (CVx = CVz)". Demuestre razonadamente su respuesta.
Solucin

129

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 89.- En la distribucin bidimensional (xi yj), sabiendo que:


1
1

; < Q

= 15

Pueden ser las rectas de regresin entre las variables X e Y las siguientes:
2X Y = 1
X 3Y = 2
Diga razonadamente El Porqu.
Solucin

130

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 90 .- Se desea analizar la relacin entre la madurez de la persona (medida por un test,


entre 0 y 4)) y la edad (de 3 a 27 aos, de un grupo de jvenes discapacitados psquicos,
despus de tres aos de funcionamiento de un centro de salud mental, con un programa
especfico. En la tabla siguiente se recogen los datos de las dos variables:
<
Grado de madurez alcanzado.
;
Edad actual de los jvenes

Edad actual




Grado 
Madurez
0
1
2
3
4

(3 - 9)
5
2
1
0
0

(9-13)
3
5
10
2
0

(13-17)
3
6
15
5
1

(17-23)
2
8
17
4
3

(23-27)
0
1
5
1
1




  = 1.598

; Q

<

 =402

< Q

 = 174

 

; < Q

 = 28.058

  = 2.960

1- Distribucin de la "madurez" de los jvenes entre 13 y 23 aos


2- Covarianza entre las variables X e Y Significado
3.- Coeficiente de variacin de la variable Y Significado
4.- Percentil 57 de la variable X Significado
5.- Valor de la variable Y que deja por encima suyo el 72% de los valores
6 Coeficiente de 'HWHUPLQDFLyQ entre ambas variables y su significado

Solucin




131

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1 Si entre las variables X e Y se establece la recta de regresin Y* = - 3 + 2X, con


una fiabilidad del 96%. Podemos afirmar que (seale todas las afirmaciones ciertas
marcando V, y todas las falsas marcando F):

1) coeficiente de correlacin > 0

2)si aumenta X en una unidad


Y disminuye un 2%
3) coeficiente de regresin = 2

4) Las variables X e Y
son Independientes
5) si aumenta X en una unidad
Y disminuye en 2 unidades
6) si aumenta Y en una unidad
X disminuye en 0,96
7) Las variables X e Y
estn correlacionadas
8)la desviacin tpica es negativa

9)coeficiente de determinacin
es igual 0,96
10) coeficiente de correlacin
es igual 0,96
11)coeficiente de regresin
es positivo
12) la recta es decreciente

13) la varianza es negativa

14)la recta es creciente

15) la covarianza es negativa

16) hay una correlacin = 0,98

132

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1

Seale todas las expresiones que son ciertas, marcando V, y las que son falsas marcando

F
El coeficiente de correlacin
no puede ser 2,3
La Mediana es el valor central
de la distribucin
La desviacin tpica es siempre
no negativa
La mediana es igual
al segundo cuartil
Coeficiente de determinacin
es siempre no negativo
la covarianza puede
ser negativa
la varianza nunca
puede ser negativa
El percentil 50 es igual
a la mediana
La covarianza puede ser positiva

La probabilidad de un suceso X V
puede ser 0,5
el coeficiente de correlacin
V
puede ser negativo
la covarianza puede ser cero
V

El coeficiente de variacin
V
puede ser -1,4
El coeficiente de regresin puede V
ser - 1.4
El Coeficiente de correlacin
V
puede ser 0,98

F
F

F
F

El percentil 50
es un Promedio
La Varianza
puede ser cero
Coeficiente de correlacin
puede ser 0
19)La
La Moda es el valor de
mayor densidad
La Covarianza
puede ser negativa
La Moda es un promedio
La desviacin tpica
no puede ser < 0
La Covarianza puede
ser negativa
La Media aritmtica
puede ser negativa
La Varianza siempre
es positiva
La Probabilidad de X
puede ser 0,2
La media aritmtica
puede ser cero
La desviacin tpica
no puede ser <0
Coeficiente de variacin
puede ser 0.98
la moda puede ser cero 0

V F
V F
V F
V F
V F
V F
V F
V F
V F
V F
V F
V F
V F
V F
V F

1  Que significa que entre dos variables haya un coeficiente r = -0,999 (seale todos los
significados ciertos marcando la V, y todos los falsos marcando la F):


Estn poco
correlacionadas
ambas variables
son dependientes
el coeficiente de regresin
es 0,999
cuando Y disminuye
X aumenta
varan en sentido contrario
la covarianza es < 0

la covarianza es > 0

V F

Estn muy correlacionadas

V F

V F

V
V

F
F

ambas variables
son independientes
rectas de regresin
son perpendiculares
Estn incorrelacionadas
la covarianza es muy grande

133

V F
V F
V F

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1  Que significa que entre dos variables haya un coeficiente r = 0 (seale todos los
significados ciertos marcando la V, y todos los falsos marcando la F):

ambas variables
estn correlacionadas
la recta de X sobre Y
es decreciente
las varianzas
son negativas
la covarianza
es muy grande
el coeficiente de
determinacin es cero
las varianzas
son iguales
un disparate

V F
V F
V F
V F
V F
V F
V F

134

ambas variables
son dependientes
ambas variables
estn incorrelacionadas
las medias son
muy representativas
el coeficiente de variacin
es cero
el coeficiente de regresin
es uno
ambas varan
conjuntamente
la recta de Y sobre X
Es creciente.

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1 A partir de una distribucin bidimensional de las variables X e Y, hemos calculado


la regresin de Y sobre X, con el siguiente resultado:
< 

;

Estimar los parmetros de la recta de regresin de X sobre Y: ;  DE< teniendo en


cuenta, adems, que en la regresin anterior el coeficiente de correlacin obtenido ha sido 1.
 Qu pensara si le dijeran que en dicha regresin de Y sobre X el coeficiente de
correlacin obtenido ha sido 1 en lugar de +1?


Solucin


135

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1

- Sea una distribucin (Xi ni) con las siguientes caractersticas:


; = 7
Mo = 5
S2 = 3,4
N = 50

Determnese estas medidas para:


La distribucin (Xi +2, ni) y La distribucin (20Xi, ni)
Solucin



136

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1 Cincuenta y cinco alumnos reciben puntuaciones de una asignatura (Z): En Teora
(X) y en problemas (Y) del 1 al 10 reflejndose en la siguiente tabla:



7(25,$

0-2
2-4
4-5
5-7
7 - 10

352%/(0$6

0 -2
5
4
1
0
0

2-4
4
4
4
3
0

4-5
4
2
5
2
2

5-7
2
4
3
2
1

7 - 10
0
1
1
0
1

1.- Podemos afirmar que ambas variables son estadsticamente dependientes?


2.- Distribuciones
X/ Y 2
X/ 1 Y 4
2.1.- Cual es ms homognea? Porque?
3.- Porcentaje de alumnos que habiendo obtenido ms de 3,5 puntos en teora tambin
hayan obtenido ms de 3,5 en problemas.
4.- Analizar y establecer la posible relacin lineal entre ambas variables.
5.- Supongamos que la nota global de dicha asignatura (Z) se obtiene de la siguiente forma:
2

+ 3<
3

Comparar la Homogeneidad de la distribucin de la nota global en los dos casos siguientes:


5.1.- las variables X e Y estn totalmente correlacionadas
5.2.- Las variables X e Y son totalmente independientes
Solucin


137

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1 Se ha estudiado las cotas mximas de rendimiento de un grupo de enfermeras de un


hospital en los turnos de maana y de tarde. Se han hecho las siguientes anotaciones X =
tiempo mximo de concentracin y rendimiento por la maana y Z = tiempo mximo de
concentracin y rendimiento por la tarde (al mismo grupo de personas). As se obtuvo los
siguientes datos (en horas)

= 3,5

=2

Sx = 1,2

Sz = 0,8

Siendo el coeficiente de Correlacin Lineal entre ellas 0,9. Se pide:


1.- Qu tiempo se puede esperar para la tarde, en una persona que haya tenido 4 horas de
rendimiento mximo por la maana? Si es posible, dar una medida de la estimacin
realizada.
2.- Una persona cuyos tiempos mximos de rendimiento y concentracin por la maana y
por la tarde han sido respectivamente: 3 y 2,5. Dnde ha obtenido mayor tiempo de
rendimiento relativo?


Solucin


138

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1 .-En dos compaas de seguros mdicos, el pago de indemnizaciones durante el ao


1998 tuvo la siguiente distribucin:

ODV 1~PHURSDJRV

1~PHURSDJRV

&XDQWtD

FRPSDxtD$ 

,QGHPQL]DFLRQHV

GH

FRPSDxtD% 

FLHQWRV 

0LOORQHV 

FLHQWRV 

10
12
30
40
10

0 - 20
20 - 40
40 - 50
50 - 100
100 - 150

11
12
41
20
8


- Qu porcentaje del montante total de las indemnizaciones que ha pagado la compaa
B corresponde al 20% de los pagos ms bajos?
Calcular la cuanta mxima de la indemnizacin, que ha pagado la compaa B, recibida
por el 20% de las personas con menores indemnizaciones.
Calcular la cuanta mnima de la indemnizacin, que ha pagado la compaa B, recibida
por el 20% de las personas con mayores indemnizaciones.


6ROXFLyQ

Qu porcentaje del montante total de las indemnizaciones que ha pagado la
compaa B corresponde al 20% de los pagos ms bajos?

 

; Q

;  Q

3

=1


=

 

; Q

=1

 

; Q

(100)

 =

(100)

10
30
45
75
125

11
12
41
20
8

11
23
64
84
92

110
360
1.845
1.500
1.000

110
470
2.315
3.815
4.815

11,96
25,00
69,56
91,30
100,00

2,28
9,76
48,08
79,23
100,00





 =

= 92 

  = 4.815 

; Q

3 (VHODFXPXODGRGH Q H[SUHVDGRHQSRUFHQWDMHV

 

T HVHODFXPXODGRGH ; Q H[SUHVDGRHQSRUFHQWDMHV

+DFHPRVXQDLQWHUSRODFLyQHQODVFROXPQDV 3 \ T GHODVLJXLHQWHIRUPD





o





o

[



o





 

o

 

 

o

[ 

139

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$


[

= 2,28 +

(20 11,96)(9,76 2,28)


60,1392
= 2,28 +
= 2,28 + 4,612 = 6,892 
(25 11,96)
13,04



3RU WDQWR HO  GHO PRQWDQWH WRWDO GH ODV LQGHPQL]DFLRQHV TXH KD
SDJDGRODFRPSDxtD%FRUUHVSRQGHDOGHORVSDJRVPiVEDMRV





Calcular la cuanta mxima de la indemnizacin, que ha pagado la compaa B,


recibida por el 20% de las personas con menores indemnizaciones.



;

0 20
20 40
40 50
50 100
100 - 150

11
12
41
20
8

11
23
64
84
92




Habr que hallar el percentil 20.

20
92 = 18,4 El percentil 20 ser el valor de la variable que ocupa el lugar
100
inmediatamente siguiente a 18,4 y que est en el intervalo (20 40).
Aplicando la formula del percentil ser:


= / 1 + 100

100

1  1

1
Q

&

20
100

20
92 11
= 20 + 100
(20) = 32,33
12

32,33 millones, es la cuanta mxima de la indemnizacin, que ha pagado la compaa B,


recibida por el 20% de las personas con menores indemnizaciones.



Calcular la cuanta mnima de la indemnizacin, que ha pagado la compaa B,


recibida por el 20% de las personas con mayores indemnizaciones.
Habr que hallar el percentil 80.
80
(92) = 73,6 El percentil 80 ser el valor de la variable que ocupa el lugar
100
inmediatamente siguiente a 73,6 y est en el intervalo (50 100).
Aplicando la formula del percentil ser:
140

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

= / 1 + 100

100

1  1

1
Q

&

80
100

80
92 64
= 50 + 100
(50) = 74
20

74 millones, es la cuanta mnima de la indemnizacin, que ha pagado la compaa B,


recibida por el 20% de las personas con mayores indemnizaciones.


141

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1  Se tienen las puntuaciones de 8 sujetos en una prueba de inteligencia X, y el


nmero de problemas resueltos en un examen de Psicoestadstica Y.

X:
Y:

95
8

105
5

87
3

98
6

115
8

100
7

99
8

125
9

1. - Calcular: La proporcin de la variacin de la variable Y que no puede ser explicada por


la variacin de la variable X.
2. - Contestar razonadamente si, en este caso, la inteligencia es un buen predictor del
nmero de problemas resueltos en el examen de Psicoestadstica.
3. - Calcular Mediana y Cuartiles de X. Podemos afirmar que es Simtrica? Por qu?
Solucin

<

<

;<

87
95
98
99
100
105
115
125

3
8
6
8
7
5
8
9

7569
9025
9604
9801
10000
11025
13225
15625

9
64
36
64
49
25
64
81

261
760
588
792
700
525
920
1125














$2 =

# 2 Q#

;
1

<

'2

824
= 103
8
2

; =

<

<

"

185874
(103) 2 = 125,25
8

54
= 6,75
8
6

& =+

% 2 = + 125,25 = 11,19

392
(6,75) 2 = 3,4375 6 ) = + 6 ) 2 = + 3,4375 = 1,85
1
8
; + <* ; < = 5671 (103)(6,75) = 13,625
6 ,=
1
8

/.

6/

< =

13,625

6.
(11,19)(1,85)

= 0,66

= (0,66) 2 = 0,43

43% de fiabilidad. Es bastante

pequea nos indica que no es buena la relacin lineal entre ambas variables. Establecemos
esa relacin:
6

01

= < E ; = 6,75 0,1(103) = 4,45

2
60

13,625
= 0,1 Es lo que varia Y al variar X en una unidad
125,25

*
Recta: <3 = 4,45 + 0,1; 2

142

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

54

13,625
= 3,96 Es lo que varia X al variar Y en una unidad
3,4375

E< = 103 3,96(6,75) = 76,24


Recta:

7 * = 76,24 + 3,96<6

1. - Calcular: La proporcin de la variacin de la variable Y que no puede ser explicada por


la variacin de la variable X.
(1 U 2 )* 100 = (1-0,43) = 0,57 57% de las variaciones de una variable no
vienen explicadas por las variaciones de la otra a travs de la recta de regresin
2. - Contestar razonadamente si, en este caso, la inteligencia es un buen predictor del
nmero de problemas resueltos en el examen de Psicoestadstica.
No lo es, ya que solo el 43% de las variaciones de la X, explican las variaciones de
la Y
3. - Calcular Mediana y Cuartiles de X. Podemos afirmar que es Simtrica? Por qu?

1
8=2
4

2
8=4
4

3
8=6
4

1
4

8 =

2
4

3
4

1
4

95 + 98
= 96,5
2

99 + 100
= 99,5
2

105 + 115
= 110
2

2
4

3
4

'LVWDQFLDVHQWUHFXDUWLOHV
0

3
4

8 -

1
4

= 99,5 96,5 = 3

9 = 110 99,5 = 10,5

No son simtricas las distancias entre cuartiles no son iguales

143

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1  En un estudio sobre alcohlicos se informa que el 40% de los mismos tienen un
padre alcohlico y el 6% madre alcohlica. El 42% tienen al menos uno de los padres
alcohlicos.
Se pide: obtener razonadamente los porcentajes de personas alcohlicas que:
1. - Tenga ambos padres alcohlicos.
2. - Tenga madre alcohlica si lo es el padre.
3. - Tenga madre alcohlica y no padre alcohlico.
4. - Tenga madre alcohlica si el padre no lo es.

Solucin
P = padre alcohlico
%(P) =40%
M = madre alcohlica
%(M) = 6%
%(P M) = 42 %
% 3 0 = % 3 0 = 100 - %(3 0 ) 100 42 = 58%

Madre
alcohlica

1.-

SI
NO

Padre alcohlico
SI
NO
4
2
36
58
40
60

6
94
100

%(P M ) %(P M) =%(P) +%(M)- %(P M )


%(P M ) = %(P) + %(M) %(P M) = 40 + 6 - 42 = 4
4
100 = 10%
40

2.-

%( 0 ) =

3.-

%( ( 3 0 ) = %( 0 ) %( 3 0 ) = 6 4 = 2%

4.-

%( 0 ) =

%( 0 3 )
2
100 = 100 = 33%
6
%( 3 )

144

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1 Cincuenta y cinco alumnos reciben puntuaciones de una asignatura (Z): En Teora
(X) y en problemas (Y) del 1 al 5 reflejndose en la siguiente tabla:

 ;<
















5
4
1
0
0

4
4
4
3
0

4
2
5
2
2

2
4
3
2
1

0
1
1
0
1

1.- Podemos afirmar que ambas variables son estadsticamente Independientes?


2.- Distribuciones
X/ Y>2
X/ 1< Y < 4
2.1.- Cual es ms homognea? Porque?
2.2.- Analizar la forma de ambas distribuciones
3.- % de alumnos que habiendo obtenido ms de 2,8 en teora hayan obtenido ms de 3 en
problemas
4.- Analizar y establecer la posible relacin lineal entre ambas variables.
5.- Con que fiabilidad podemos pronosticar las notas de problemas conocidas las de
teora?
6.- Supongamos que la nota global de dicha asignatura (Z) se obtiene de la forma: Zi = 3X
+ 5Y
Comparar la Homogeneidad de la distribucin de la nota global en los dos casos siguientes:
6.1.- las variables X e Y estn totalmente correlacionadas
6.2.- Las variables X e Y son totalmente independientes
Solucin

145

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1 Encuestamos a 150 familias sobre el nmero de extracciones dentarias realizadas


a lo largo de 1.992 resultando que: En 15 familias, 1 extraccin, en 43, 2 extracciones, en
76 familias, 3 extracciones, en 11, 4 extracciones, y en 5 familias, 6 extracciones.
1.- Realizar la tabla estadstica completa
2.- Hallar la media y la varianza y el Coeficiente de variacin.

Solucin

1
2
3
4
6

= 2 Q=

; Q 

15
43
76
11
5

15
86
228
44
30

15
172
684
176
180







La media ser:

La varianza ser:

< <

Q 

2
6@
=

? 2 Q?

> >

; Q
1

; =

403
= 2,686 extracciones
150

1227
2,686 2 = 0,965 extracciones2
150

Que mide Dispersin en trminos Absolutos, viene expresada en unidades de la variable


al cuadrado
La desviacin tpica ser:

B =+

A 2 = 6 C = + 0,965 = 0,9825 extracciones

Que mide Dispersin en trminos absolutos, viene expresada en las mismas unidades
que la variable
Para comprobar si este promedio es representativo
Variacin

calcularemos el Coeficiente de

Que es una medida de Dispersin relativa. Indica que a mayor valor implica mayor
Dispersin y por tanto menor Homogeneidad y menor representatividad de la media.
La distribucin ser homognea cuando el coeficiente de variacin sea menor de 1
&9

0,9825
= 0,3658
2,686

Es bastante representativa la media,


bastante a 0

ya que el coeficiente de variacin se acerca

146

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1 .-Se desea analizar la relacin entre la madurez de la persona (medida por un test
porcentual) y la edad de un grupo de 120 jvenes discapacitados psquicos, despus de tres
aos de funcionamiento de un centro de salud mental, con un programa especfico.
En la tabla siguiente se recogen los datos de las dos variables:
Xi : = edad actual de los jvenes
Yj : = grado de madurez alcanzado.

Y
X
15
20
25

(2-6)

(6-8)

(8-14)

5
8
15

6
12
6

6
0
6

(1418)
4
9
3

(1824)
0
4
12

(2430)
6
12
6

1.- Analizar y establecer la posible relacin lineal entre ambas variables.


2.- Porcentaje de jvenes mayores de edad, con un grado de madurez superior a 20
3.- Analizar la distribucin del grado de madurez entre los jvenes menores de 20 y mayores de
20. En cul hay mayor homogeneidad?
4.- Podemos afirmar que la variable Y es una distribucin normal de media 13,766 y
desviacin tpica 8,65? Dar al menos dos razones
5.-Si medimos la discapacidad como Zi = 4Yi - 2Xi + 8.
Comparar el grado de dispersin de la distribucin de la Discapacidad en los siguientes casos:
5.1.- las variables X e Y son totalmente independientes
5.2.- las variables X e Y estn totalmente correlacionadas
6.- Distribuciones condicionadas:
6.1- Y/X<23
6.2.- Y/X>21
6.3.- Analizar la simetra de ambas distribuciones (no utilizar ningn coeficiente)
7.- Que grado de madurez podemos pronosticar para un joven discapacitado de 28 aos?
Con que fiabilidad?
Solucin

147

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 105.- Realizada una encuesta entre fumadores se obtuvieron los resultados, de la tabla,
sobre las variables:
X: N de cigarrillos fumados diariamente Y: Horas de sueo diarias
X
Y
4-6
6-7
7-8
8-9
total

2 -6

6 - 12

12 - 14 14 - 20 20 - 30 total

0
4
18
28
50

2
10
24
26
62

8
16
14
10
48

26
20
12
4
62

36
26
14
2
78

72
76
82
70
300

Solucin

1).- Calcular el porcentaje de personas que fuman entre 15 y 22 cigarrillos al da


D

,QWHUYDORV

4-6

6-7

6,5

7-8

7,5

8-9

8,5

5
2
26+ 36 =28,87
6
10
5
2
20+ 26 =21,86
6
10
5
2
12+ 14 =12,80
6
10
5
2
4+ 2 =3,73
6 10
67,26

28,87
50,73
63,53
67,26

67,26
= 22,42%
300
2).- Obtener el nmero mnimo de cigarrillos diarios que fuma uno de los
fumadores del 30% que ms fuma.
Percentil 70

70
300 = 210 ,QWHUYDOR(14 20)
100

70
100

70
70
1 1F
300 160
1
100
100
= /F 1 +
& F = 60 +
6 = 18,84FLJDUULOORV
QF
62

3).- Podemos pronosticar que a mayor nmero de cigarrillos fumados diariamente se


dormir ms horas. Con que fiabilidad

148

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

No ya que la covarianza es negativa, y ambas variables varan en sentido


contrario a mayor nmero de cigarrillos, pronosticaremos menos horas de sueo
con una fiabilidad del 34,34%
4).- Estimar el consumo de tabaco para una poblacin de 1.500 personas de las que son
fumadoras el 32%
32% de 1.500 = 0,32*1500=480 personas que fuman
Como la media de cigarrillos es de 14,62 es decir 15 cigarrillos por persona
El consumo de tabaco ser 480 personas a un promedio de 15 cigarrillos por persona
sern: 480 (15) = 7.200 cigarrillos/da
5).- Estimar el nmero de horas de sueo diarias para una persona que fuma 35 cigarrillos
al da.
Como la recta de regresin de Y/X es Y* = 8,3 0,1 Xi
Para un valor X = 35 aos sustituimos en la recta y obtenemos
Y* = 8,3 0,1 *35 = 4,8 horas de sueo que pronosticamos para una persona que
tiene 35 aos, pero con una fiabilidad, o bondad de 0,58 es decir del 34,34% Que
parece un poco pequea.
6).- Porcentaje de personas fumadoras que duermen entre 6 y 8 horas sabiendo que no
fuman ms de 15 cigarrillos al da

Menos de 6 horas de
sueo
Entre 6 y 8 horas de
sueo
Ms de 8 horas de
sueo

Menos de 15
cigarrillos
14,33

Ms de 15
cigarrillos
57,67

72

91,33

66,67

158

64,67

5,33

70

170,33

129,67

149

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1 .- Tomamos el nmero de pulsaciones por minuto de 15 pacientes que acuden a una
consulta y obtenemos los siguientes datos: 68 - 100 - 94 - 86 - 72 - 70 - 84 - 85 - 69 - 73 - 65 78 - 83 - 86 - 75. Hallar las Medidas de tendencia central y de dispersin.

Solucin


;

G G

Q 

; Q 

H 2 QH

1 

65
68
69
70
72
73
75
78
83
84
85
86
94
100

1
1
1
1
1
1
1
1
1
1
1
2
1
1

65
68
69
70
72
73
75
78
83
84
85
172
94
100

4225
4624
4761
4900
5184
5329
5625
6084
6889
7056
7225
14792
8836
10000

1
2
3
4
5
6
7
8
9
10
11
13
14
15








;

La media ser:

;
1

1188
= 79 , 2
15

pulsaciones por

minuto
1

(15) = 7,5 Ser el valor de la variable que ocupa el lugar


2
inmediatamente siguiente a 7,5 es decir, el valor 78 pulsaciones por minuto.

La mediana

La Moda es el valor de la variable que ms veces se repite, es decir el de mayor


frecuencia absoluta, en nuestro caso el valor 86 pulsaciones por minuto.
La varianza ser:
6

K2 =

;
1

J 2 QJ

; =

95530
79,2 2 = 96,026 pulsaciones2
15

Que mide Dispersin en trminos Absolutos, viene expresada en unidades de la


variable al cuadrado
La desviacin tpica ser:

M =+

L 2 = 6 N = + 96,026 = 9,799 pulsaciones

Para comprobar si este promedio es representativo calcularemos el Coeficiente de


Variacin

150

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

&9

9,799
= 0,12373
79,2

La distribucin ser homognea cuando el coeficiente de variacin sea menor de 1.


Y tanto ms homognea cuanto menor sea el coeficiente de variacin.
En este caso la media es bastante representativa, ya que el coeficiente de
variacin se acerca bastante a 0.

151

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1 .- A lo largo de los doce meses del ao, en un servicio de ciruga se realizan las
siguientes apendicectomas 8 - 12 - 7 - 1 - 20 - 6 - 8 - 16 - 9 - 3 - 4 - 5
Hallar: Medidas de tendencia central, cuartiles, Medidas de dispersin

Solucin

Enero
Febrero
Marzo
Abril
Mayo
Junio
Julio
Agosto
Septiembre
Octubre
Noviembre
Diciembre

8
12
7
1
20
6
8
16
9
3
4
5
99

R = 99 

Tiempo

99
=
= 8,25 
12

(ordenada)
1
3
4
5
6
7
8
9
12
16
20
99

2
S = 1145 

U2

1
1
1
1
1
1
2
1
1
1
1

1
2
3
4
5
6
8
9
10
11
12

= 12 
2

; =

1145
8.25 2 = 27,354 
12

W =

27,354 = 5,25 

&9

5,25
= 0,634 
8,25

12
=6
2
2
La mediana ser el valor de la variable, media aritmtica de los que ocupan el lugar
7+8
6 y el lugar 7, es decir, la mediana ser:
= 7,5 
2
0


0

Z Es el valor de la variable que ms veces se repite, es decir, el valor 8

152

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1

En un grupo de personas se analizan las caractersticas A y B obtenindose:

caracterstica %

Caracterstica A
SI
NO
57
32
82
91
139
123

SI
NO

89
173
262

1.- porcentaje de personas que presentan una sola de las dos caractersticas
2.- porcentaje de personas que no tienen ninguna caracterstica
3.- porcentaje de personas que teniendo la caracterstica A no tienen la caracterstica B
4.- porcentaje de personas que tienen ambas caractersticas
5.- porcentaje de personas que teniendo la caracterstica B tienen tambin la caracterstica
A
6.- porcentaje de personas que presentan alguna caracterstica
Solucin
1.2.3.4.-

82 + 32
100 = 43,51%
262
91
100 = 34,73%
262
82
100 = 58,99%
139
57
100 = 21,75%
262

5.6.-

153

57
100 = 64,04%
89
57 + 32 + 82
100 = 65,26
262

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1

Se han medido la altura de 110 jvenes obtenindose la siguiente tabla:


$OWXUD

1-yYHQHV

1,55-1,60
18
1,60-1,70
31
1,70-1,80
24
1,80-1,90
20
1,90-2,00
17
1.- Se consideran "altos" aquellos cuya altura est sobre el percentil 82. Cul es su altura mnima?
2.- En qu percentil estar un joven de altura 1,78?

Solucin

$OWXUD

1

1 

-yYHQHV

1,55-1,60
1,60-1,70
1,70-1,80
1,80-1,90
1,90-2,00

18
31
24
20
17

18
49
73
93
110



1.-

Se considera altos aquellos cuya altura est sobre el percentil 82, es decir (100-82)=18,
el 18% de los ms altos, son aquellos que se consideran altos, y su altura mnima ser el
percentil 82.
Habr que hallar el percentil 82, ya qu

82
(110) = 90,2 El percentil 82, ser aquel valor de la variable que ocupe el lugar
100
inmediatamente siguiente a 90,2 y est en el intervalo (1,80 1,90). Aplicando la
formula del percentil:
U

= /\ 1 + 100
]

100

1 \ 1

&

82
100

82
110 73
= 1,80 + 100
(0,10) = 1,886
20

Se consideran altos aquellos que miden ms de 1,886 metros


2.La altura 1,78 est en el intervalo (1,70 1,80). Tenemos que hallar el % de
valores que hay debajo del valor 1,78 luego despejaremos r de la formula del percentil:
U
T

]
100

= /\ 1 + 100

1 \ 1

1
Q

&

154

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

(T _ /^ 1 )Q ^

100 (1,78 1,70)(24)


100

100
=
+ 1 ^ 1 *
=
+ 49
= 62
0,10
110
&^
1

Por tanto

62
100

= 1,78 metros

El 62% de los reclutas miden menos de 1,78 metros luego (100 62) = 38, el 38%
restante medirn ms de 1,78 metros.

155

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1.-Se desea analizar la relacin entre la madurez de la persona (medida por un test
porcentual) y la edad de un grupo de 120 jvenes discapacitados psquicos, despus de tres
aos de funcionamiento de un centro de salud mental, con un programa especfico. En la
tabla siguiente se recogen los datos de las dos variables:
xi := edad actual de los jvenes
y j := grado de madurez alcanzado.

Y
X
15
20
25

(2-6)
5
8
15

(6-8)
6
12
6

(8-14)
6
0
6

(14-18)
4
9
3

(18-24)
0
4
12

1.- Distribucin marginal de la variable X.


2.- Segundo cuartil de la distribucin de la variable Y
3.- Covarianza entre ambas variables
4.- Coeficiente de variacin de la variable Y
5.- Percentil 27 de la variable X
6.- Valor de la variable Y que deja por encima suyo el 34% de los valores
7.- Coeficiente de correlacin entre ambas variables y su significado


Solucin



156

(24-30)
6
12
6

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1 .- Estudiamos en 60 pacientes el contenido en Hb en grs. %


y tenemos la siguiente
distribucin:

Hb %
9-10
N de pacientes
2

10-11
8

11-12
12

12-13
17

13-14
14

14-15
4

15-16
3

Construir la tabla necesaria para dibujar un histograma, y la determinacin de la media, la


mediana, la moda, cuartiles, varianza, desviacin tpica, coeficiente de variacin. Significado
de todos y cada uno de los resultados obtenidos.
6ROXFLyQ

( /` 1 /` )
Hb. gr.
9-10
10-11
11-12
12-13
13-14
14-15
15-16

Marca de clase
;

9.5
10.5
11.5
12.5
13.5
14.5
15.5

2
8
12
17
14
4
3

2
10
22
39
53
57
60

c c

; Q

19
84
138
212,5
189
58
46,5





d 2 Qd

180,50
882
1587
2656,25
2551,50
841
720,75



;

e e

; Q

747
 12,45 Hb.gr.
60

Moda Mo = Valor de la variable que ms veces se repite, estar en el


intervalo que presente mayor densidad de frecuencia, frecuencia por unidad de
intervalo, este caso al ser todos los intervalos de igual amplitud, estar en el de
mayor frecuencia, es decir, en el intervalo (12-13), que se repite 17 veces, y
dentro de el cualquier valor , aplicando la formula ser:
Q
0

g = /f 1 +

F
Qf
+1
F

f +1

f +1

f +1

Qf
1
F

f 1

F 

12 +

14
1 = 12,53+E.JU. 
14 + 12

Mediana Me = Valor de la variable que divide a la distribucin en dos partes


iguales. Valor de la variable que ocupa el lugar central. Valor de la variable que
deja por debajo de ella el 50% de los valores. Como N/2 es 30, ser el valor de la
variable que ocupa el lugar inmediatamente siguiente al 30, y que est en el
intervalo (12 13). Aplicando la formula de la mediana:

1
1
1 1h
60 22
1
2
2
0 i = /h
& h = 12 +
1 = 12,47 +E.JU.
1 +
Qh
17
157

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1
60 = 15 El 1 cuartil ser el valor de la variable que ocupe el lugar
4
inmediatamente siguiente al 15, y est en el intervalo (11-12)

1
4

1
1
1 1j
60 10
1
4
4
= /j 1 +
& j = 11 +
1 = 11,416 +E.JU.
Qj
12

2
60 = 30 El 2 cuartil ser el valor de la variable que ocupe el lugar
4
inmediatamente siguiente al 30, y est en el intervalo (12-13)

2
4

2
2
1 1k
60 22
1
4
= /k 1 + 4
& k = 12 +
1 = 12,47 +E.JU.
Qk
17

3
60 = 45 El 3 cuartil ser el valor de la variable que ocupe el lugar
4
inmediatamente siguiente al 45, y est en el intervalo (13-14)

3
4

3
3
1 1l
60 39
1
4
4
= /l 1 +
& l = 13 +
1 = 13,428 +E.JU.
Ql
14

De este modo:
El 25% de los pacientes tienen un contenido de Hb. menor de 11,416gr.
El 50% de los pacientes tienen un contenido de Hb. menor de 12,53 gr.
El 75% de los ingresados tienen un contenido de Hb. menor de 13,428 gr.
0HGLGDVGHGLVSHUVLyQ


Varianza: 6 n 2

m 2 Qm

Desviacin tpica: 6 o =

 ;

9419
12,45 2 = 1,98 Hb.gr.2
60

o 2 = 1,98 = 1,4 Hb.gr.

Coeficiente de variacin:  &9 =

1,4
= 0,1124 
12,45

Existe una pequea dispersin aceptable ya que el CV es menor de 1. Es decir bastante


homognea porque se acerca mucho a 0. Por lo que la media ser un promedio
representativo del conjunto.





158

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1

.- La tabla de frecuencias siguiente, corresponde a una variable bidimensional

;L<M

50-80
80-110
110-150
150-220
220-300
300-500











15
20
4
0
0
0

5
30
26
6
0
0

0
10
34
13
3
0

0
0
16
7
3
0

0
0
0
4
2
2

Sabiendo que:
Xi =salario mensual de 200 empleados de un hospital (miles de pesetas)
Yj = valor de los automviles de los 200 empleados del hospital (millones pesetas) Hallar:
1.- Distribuciones marginales de ambas variables. Cul es ms homognea? y por qu
2.- Por encima de que salario se sita el 70% de los empleados mejor pagados?
3.- De entre los empleados que poseen coche valorado entre 1,3 y 1,9 millones qu
porcentaje representan aquellos que cobran un sueldo inferior a 130.000?
4.- Qu porcentaje de la masa salarial total corresponde al 60% de los empleados que
ms cobran? Y al 30% que menos cobran?
5.- Podemos asegurar que empleados que cobran mayores salarios poseen automviles
ms caros
6.- Estimar, utilizando una funcin lineal, el valor del automvil de un nuevo empleado
que cobra 600.000 Fiabilidad de la estimacin
Solucin


159

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

El consumo y la renta mensual de 100 familias expresadas en 104 pesetas, son los
siguientes: C = Consumo Y = Renta.
1 

C/Y
30
40
50

15 25 35 45
10 15 -- -5 20 25 --- 15 5
5

1.- Calclese la recta de regresin del consumo sobre la renta.


2.- Consumo esperado para una renta de 60.104 Pts. y la representatividad de esta regresin.
Solucin

160

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1 .- En un hospital, los anlisis efectuados para la determinacin de urea en orina a un


grupo de 60 pacientes visitados, han dado los siguientes resultados ordenados:


1 paciente con 9,3 grs/l


1 paciente con 10 grs/l
2 paciente con10,3 grs/l
4 paciente con 10,6 grs/l
2 paciente con 10,9 grs/l
4 paciente con 11,2 grs/l
4 paciente con 11,5 grs/l
2 paciente con 11,8 grs/l
1 paciente con 12,3 grs/l
1 paciente con 13,2 grs/l

1 paciente con 9,5 grs/l


1 paciente con 10,1 grs/l
2 paciente con 10,4 grs/l
1 paciente con 10,7 grs/l
3 paciente con 11 grs/l
3 paciente con 11,3 grs/l
3 paciente con 11,6 grs/l
2 paciente con 12 grs/l
1 paciente con 12,5 grs/l

2 paciente con 9,8 grs/l


2 paciente con 10,2 grs/l
3 paciente con 10,5 grs/l
6 paciente con 10,8 grs/l
2 paciente con 11,1 grs/l
2 paciente con 11,4 grs/l
2 paciente con 11,7 grs/l
2 paciente con 12,2 grs/l
1 paciente con 12,7 grs/l

1.- Formar la tabla estadstica y a partir de ella dibujar el histograma de frecuencias


2.- Calcular: las Medidas de tendencia central y los cuartiles.


6ROXFLyQ

( /q 1 /q )

Marca de clase
;

9-9,5
9,5-10
10-10,5
10,5-11
11-11,5
11,5-12
12-12,5
12,5-13
13-13,5

9,25
9,75
10,25
10,75
11,25
11,75
12,25
12,75
13,25

1
3
8
16
13
11
5
2
1

t t

; Q

1
4
12
28
41
52
57
59
60

u 2 Qu

9,25
29,25
82
172
146,25
129,25
61,25
25,50
13,25

85,56
285,18
840,50
1849
1645,31
1518,68
750,31
325,12
175,56








v v

; Q

668
 11,13gr.
1
60
Moda Mo = Valor de la variable que ms veces se repite, estar en el
intervalo que presente mayor densidad de frecuencia, frecuencia por unidad de
intervalo, este caso al ser todos los intervalos de igual amplitud, estar en el de
mayor frecuencia, es decir, en el intervalo (10,5-11), que se repite 16 veces, y
dentro de el cualquier valor , aplicando la formula ser:

Media

Es el promedio ms utilizado

Q
0

x = /w 1 +

F
Q
F

w +1

w +1

w +1

w +1

Q
F

w 1

w 1

F 

10,5 +

13
(0,5) = 10,81JU. 
13 + 8

Mediana Me = Valor de la variable que divide a la distribucin en dos partes


iguales. Valor de la variable que ocupa el lugar central. Valor de la variable que
deja por debajo suya el 50% de los valores. Como N/2 es 30, ser el valor de la
161

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

variable que ocupa el lugar inmediatamente siguiente al 30, y que est en el


intervalo (11-11,5) aplicando la formula ser:

2
2
60 28
1 1y
1
4
4
0 z = /y
& y = 11 +
(0,5) = 11,077 JU.
1 +
13
Qy
1
60 = 15 El 1 cuartil ser el valor de la variable que ocupe el lugar
4
inmediatamente siguiente al 15, y est en el intervalo (10,5-11)

1
4

1
1
1 1{
60 12
1
4
= /{ 1 + 4
& { = 10,5 +
(0,5) = 10,6 JU.
Q{
16

2
60 = 30 El 2 cuartil ser el valor de la variable que ocupe el lugar
4
inmediatamente siguiente al 30, y est en el intervalo (11-11,5) el 2 cuartil es la
Mediana.

2
4

2
2
1 1|
60 28
1
4
4
= /| 1 +
& | = 11 +
* 0,5 = 11,077 JU.
Q|
13

3
60 = 45 El 3 cuartil ser el valor de la variable que ocupe el lugar
4
inmediatamente siguiente al 45, y est en el intervalo (11,5-12)

3
4

3
3
1 1}
60 41
1
4
= /} 1 + 4
& } = 11,5 +
(0,5) = 11,68 JU.
Q}
11

De este modo: el 25% de los pacientes tienen un contenido de Urea. menor de10,6
gr..

162

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

176
174
172
170
168

altura del hijo

166
164
162
160
158
158

160

162

164

166

168

170

172

altura del padre


Diagrama de dispersin
altura hijo = f (altura padre)

El 50% de los pacientes tienen un contenido de Urea. < de 11,077 gr.


El 75% de los ingresados tienen un contenido de Urea. < de 11,68 gr.
0HGLGDVGHGLVSHUVLyQ


Varianza: 6  2

~ 2 Q~

Desviacin tpica: 6 =

 ;

2 =

7475,25
11,13 2 = 0,5875 JU 2 .
60

0,5875 = 0,766 JU.

Coeficiente de variacin:  &9 =

0,766
= 0,0688 
11,13

Existe muy poca dispersin ya que el CV es muy pequeo, es menor de 1, y se acerca


mucho a 0. Por lo que la media ser un promedio muy representativo del conjunto. La
distribucin ser muy homognea.

163

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1.- Medimos las alturas de un grupo de 11 padres y sus respectivos hijos y obtenemos los
siguientes resultados:

altura del padre


160 165 170 168 163 164 162 166 164 166 162
altura del hijo 165 160 175 170 165 175 163 170 170 166 168
Realizar el diagrama de dispersin
Solucin

<

= D + E;

<

= 33,56 + 0,8165 ; (esta hecho con el programa SPSS.11)

altura del hijo


176
174
172
170
168
166
164
162
Observada

160
158

Lineal

158

160

162

164

166

168

170

172

altura del padre

164

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$




1 .- Treinta y cinco alumnos reciben puntuaciones en Bioqumica (X) y en


Bioestadstica (Y) del 1 al 5 reflejndose en la siguiente tabla:

 ;<
















0
1
0
0
1

1
2
3
1
1

2
1
4
0
2

2
1
3
3
4

0
2
1
0
0

1.- Hallar Las medias de las variables X e Y


2.- Hallar Las varianzas de las variables X e Y
3.- Hallar La covarianza entre X e Y
Solucin

165

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1

.- Determinamos el pulso y la temperatura de 9 pacientes del Hospital de Navarra:


PULSO
68
70
TEMPERATURA 36.5 37

71
71
37.2 36.8

73 73
74
37.3 37.5 38

1.- Establecer El diagrama de dispersin.


2.- Hallar la covarianza entre ambas variables y, su significado.

Solucin


166

75
76
37.4 38

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1 - Se conocen las ventas de agua oxigenada a hospitales y clnicas


de un cierto
nmero de empresas que son:

Ventas (millones de pts.)


Empresas

4
10

Obtener las ventas medias de este nmero de empresas.


Solucin

167

5
3

6
3

7
10

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1

.-Dados los siguientes valores:


28 - 26 - 32 - 19 - 34 - 45 - 38 - 25 - 24 - 21; 26 - 23 - 22 - 24 - 21 - 21 - 23 - 29 - 21 - 29
- 26 - 22 - 24 - 29 - 26 - 32 - 23 - 14 - 16 - 32 - 19 - 34 - 45 - 38 - 43 - 15 -27 -36 - 38 38 - 26 - 23 - 22 - 24 - 26 - 32 - 23 - 14 - 16 - 32 - 45 - 38 - 43 - 15 - 27 36.
Se pide:
1.- La tabla estadstica de valores agrupados en intervalos con una amplitud de 2, para
cada intervalo
2.- Dibujar El histograma de frecuencias
3.- Medidas de tendencia central
4.- Medidas de Dispersin
6ROXFLyQ

'$7266,1$*583$55(8(/72&21(/352*5$0$6366



9$/25(6

Vlidos

14
15
16
19
21
22
23
24
25
26
27
28
29
32
34
36
38
43
45
Total

Frecuencia Porcentaje
2
3,6
2
3,6
2
3,6
2
3,6
4
7,1
3
5,4
5
8,9
4
7,1
1
1,8
6
10,7
2
3,6
1
1,8
3
5,4
5
8,9
2
3,6
2
3,6
5
8,9
2
3,6
3
5,4
56
100,0

Porcentaje
vlido
3,6
3,6
3,6
3,6
7,1
5,4
8,9
7,1
1,8
10,7
3,6
1,8
5,4
8,9
3,6
3,6
8,9
3,6
5,4
100,0




(VWDGtVWLFRV

VALORES
N

Vlidos
Perdidos

56
0
27,68
26,00
26

Media
Mediana
Moda


168

Porcentaje
acumulado
3,6
7,1
10,7
14,3
21,4
26,8
35,7
42,9
44,6
55,4
58,9
60,7
66,1
75,0
78,6
82,1
91,1
94,6
100,0

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$





(VWDGtVWLFRV

VALORES
N
Vlidos
Perdidos
Desv. tp.
Varianza
Coeficiente variacin

56
0
8,315
69,131
0,3009


$*583$'26(1,17(59$/26'($03/,78'


LQWHUYDORV

Q 

1 

; Q 

2 Q










































































































































































































; Q

1566
= 27,96 
1
56
Moda Mo = Valor de la variable que ms veces se repite, estar en el
intervalo que presente mayor densidad de frecuencia, frecuencia por unidad de
intervalo, este caso al ser todos los intervalos de igual amplitud, estar en el de
mayor frecuencia, es decir, en el intervalo (23 25), que se repite 9 veces, y
dentro de el cualquier valor , aplicando la formula ser:
Media

Es el promedio ms utilizado

Q
0

= / 1 +

F
Q
+1
F

+1

+1

+1

Q
1
F

F 

23 +

7
(2) = 24
7+7

169

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

Mediana Me = Valor de la variable que divide a la distribucin en dos partes


iguales. Valor de la variable que ocupa el lugar central. Valor de la variable que
deja por debajo de ella el 50% de los valores. Como N/2 es 28, ser el valor de la
variable que ocupa el lugar inmediatamente siguiente al 28, y esta en el intervalo
(25 27) aplicando la formula ser:

1
1
1 1
56 24
1
2
2
0 = /
+
& = 25 +
(2) = 26,14
1
Q
7
1
56 = 14
4
El 1 cuartil ser el valor de la variable que ocupe el lugar inmediatamente siguiente
al 14, y est en el intervalo (21 23)

1
4

1
1
1 1
56 8
1
4
& = 21 +
(2) = 22,71
= / 1 + 4
Q
7

El 2 cuartil es la mediana

2
4

= T 1 = 0 = 26,14
2

3
56 = 42 El 3 cuartil ser el valor de la variable que ocupe el lugar
4
inmediatamente siguiente al 42, y est en medio de los intervalos (31- 33) y (33
35), as que uniremos ambos y formaremos un nico intervalo de (31 - 35) en el
que se encontrar el 3 percentil, y aplicando la formula tendremos:

3
4

3
3
1 1
56 37
1
4
& = 31 +
(4) = 33,857.
= / 1 + 4
Q
5+2

0HGLGDVGHGLVSHUVLyQ


Varianza: 6 2

2 Q

Desviacin tpica: 6 =

 ;

2 =

47380
27,96 2 = 64
56

64 = 8

Coeficiente de variacin:  &9 =

8
= 0,286 
27,96

Como vemos no hay demasiadas diferencias entre los resultados obtenidos con los
valores sin agrupar y con los valores agrupados en intervalos, en el segundo caso
perdemos informacin y ganamos rapidez.
170

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$


1

Dada la siguiente distribucin:

Xi ............ 1.................3 .............. 4 .................6............. 10


ni ............. 5............... 12 ............ 20 .................8............... 5
1.- Obtener Media aritmtica, mediana y moda
2.- Hallar la Desviacin tpica y el Coeficiente de variacin
6ROXFLyQ

;

Q 

1
3
4
6
10

; Q 

2 Q

5
12
20
8
5

5
36
80
48
50

5
108
320
288
500







1 

5
17
37
45
50



;

; Q
1

219
 4,38
50

Moda Mo = Valor de la variable que ms veces se repite, en este caso


el valor 4
Mo = 4
Mediana Me = Valor de la variable que divide a la distribucin en dos
partes iguales. Valor de la variable que ocupa el lugar central. Valor de la
variable que deja por debajo de ella el 50% de los valores. Como N/2 es
25, ser el valor de la variable que ocupa el lugar inmediatamente
siguiente al 25, y que es el 4
Me = 4

0HGLGDVGHGLVSHUVLyQ


2 Q

1221
4,38 2 = 5,2356 medida de dispersin
1
50
absoluta, viene expresada en unidades al cuadrado

9DULDQ]D 6

 ;

Desviacin tpica: 6 = 6 2 = 15,2356 = 2,888 medida de dispersin


absoluta, viene expresada en las mismas unidades que la variable.

6

2,288
= 0,522 medida de dispersin relativa.
4,38
;
Se considera aceptable si esta entre 0 y 1. Mide el grado de homogeneidad de la
distribucin. Y tambin el grado de representatividad de la media.

:  &9 =

&RHILFLHQWHGHYDULDFLyQ

171

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1

Determinamos el pulso y la temperatura de 10 pacientes del Hospital de Navarra:

PULSO
TEMPERATURA

74
35.5

70
37

68 77 75 66 69 75 76
37 35.8 36.3 37.8 38.7 37.7 38.4

1.- Dibujar El diagrama de dispersin.


2.- Hallar la covarianza entre ambas variables y, su significado.
3.- Analizar la dependencia y la correlacin entre ambas variables

172

69
39

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1

.- La distribucin por edades de los trabajadores de un hospital es la siguiente:

Edades..........(18 - 26)..... (26 - 36) ...(36 - 50) .... (50 - 60) .... (60 - 70)
N Empleados .... 7............... 13 ............ 20 ...............15............... 5
1.- Hallar La media aritmtica de las edades.
2.- Analizar la asimetra.
Solucin

173

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1

.- Dada la siguiente distribucin:


Xi ............ 1.................3 .............. 4 .................6............. 10
ni ............. 5............... 12 ............ 20 .................8............... 5

1.- Hallar Media aritmtica, mediana y moda


2.- Obtener Desviacin tpica, coeficiente de apertura y coeficiente de variacin
3.- Analizar la simetra de la distribucin.
4.- Significados de los resultados obtenidos.
Solucin

;
Q

10

TOTALES

12

20

50

17

37

45

50

36

80

48

50

219

2 Q

108

320

288

500

1221

; Q
;

; Q
1

219
 4,38
50

Moda Mo Valor De la variable que ms veces se repite, es decir el que presenta


mayor frecuencia absoluta
Mo = 4
Me = Valor central de la distribucin, valor de la variable que deja por debajo el 50% de
1
50
los valores
=
= 25 valor de la variable que ocupa el lugar 25
2
2
Me = 4

&9

2 Q

2 =

( )=
;

 ;

1221
(4,38) 2 = 5,2356
50

Medidas de dispersin absolutas

5,2356 = 2,228

2,228
= 0,522
4,38

Dispersin relativa

Como es menor de 1 podemos admitir que es homognea y al ser bastante cercano a


cero diremos que es bastante homognea, por lo que la media de la distribucin ser
bastante representativa del conjunto.

174

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1

Dada la siguiente distribucin:


Xi

13

14

16

21

ni

15

14

20

18

15

1.- Hallar la Media aritmtica, mediana y moda


2.- Obtener la Desviacin tpica y coeficiente de variacin
3.- Calcular el primer y el tercer cuartil
Solucin

;
Q

13

14

16

21

Totales

15

14

20

18

15

82

15

29

49

67

82

90

182

280

288

315

1155

2 Q

540

2366

3920

4608

6615

18049

; Q
;

; Q
1

&9

2 Q

2 =

( )=
;

1155
 14,085
82

 ;

18049
(14,085) 2 = 21,71
82

Medidas de dispersin absolutas

21,71 = 4,66

4,66
= 0,33
14,085

Dispersin relativa

Como es menor de 1 podemos admitir que es homognea y al ser bastante cercano a


cero diremos que es bastante homognea, por lo que la media de la distribucin ser
bastante representativa del conjunto.
Moda Mo Valor De la variable que ms veces se repite, es decir el que presenta
mayor frecuencia absoluta
Mo = 14
Me = Valor central de la distribucin, valor de la variable que deja por debajo el 50% de
1
82
=
= 41 valor de la variable que ocupa el lugar 41
los valores
Me = 14
2
2
1
82
T Valor de la variable que deja por debajo el 25% de los valores
=
= 20,5 valor
1
4
4
4
T

de la variable que ocupa el lugar 21


T

3
4

1
4

= 13

Valor de la variable que deja por debajo el 75% de los valores

valor de la variable que ocupa el lugar 62

175

3
4

= 16

3
3
82 = 61,5
1 =
4
4

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1

Dada la distribucin
Xi
450
367
965
ni
23
69
47
1.- Calcular La media, la mediana y la moda.
2.- Hallar El percentil 67
3.- Explicar el Significado de los resultados obtenidos.

146
78

349
95

Solucin

;
Q

146

349

367

450

965

Totales

78

95

69

23

47

312

78

173

242

265

312

11.388

33.155

25.323

10.350

45.355

2 Q

1.662.648 11.571.095 9.293.541 4.657.500 43.767.575 70.952.359

; Q

; Q

2 Q

125.571

125.571
 402,47
312

 ;

70.952.359
(402,47) 2 = 65.429,3
312

Medidas de dispersin
absolutas

&9

=
2

( )=
;

65.429,3 = 255,79
=

255,79
= 0,635
402,47

Dispersin relativa

Como es menor de 1 podemos admitir que es homognea y al ser bastante cercano a


cero diremos que es bastante homognea, por lo que la media de la distribucin ser
bastante representativa del conjunto.
Moda Mo Valor De la variable que ms veces se repite, es decir el que presenta
mayor frecuencia absoluta
Mo = 349
Me = Valor central de la distribucin, valor de la variable que deja por debajo el 50% de
1
312
los valores
=
= 156 valor de la variable que ocupa el lugar 156
Me = 349
2
2
1
312
T Valor de la variable que deja por debajo el 25% de los valores
=
= 78 valor
1
4
4
4
de la variable que ocupa el lugar intermedio entre el 78 y el 79
T

3
4

67
100

1
4

Valor de la variable que deja por debajo el 75% de los valores

la variable que ocupa el lugar 234


T

3
4

3
3
312 = 234 valor de
1 =
4
4

= 367

Valor de la variable que deja por debajo el 67% de los valores


T

valor de la variable que ocupa el lugar 210


176

146 + 349
= 247,5
2

67
100

= 367

67
67
1 =
312 = 209,04
100
100

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1

Dada la distribucin Bidimensional


Xi
Yj

210
70

120
65

360
58

149
52

225
69

1.- Ajstese una recta por el procedimiento de los Mnimos Cuadrados.


2.- Calclese el coeficiente de correlacin lineal y explquese su significado.
3.- Pronosticar el valor de X para Y = 73, dando una medida de la bondad del pronostico.
Solucin

177

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1

La distribucin de salarios en una clnica es la siguiente:

1 /
Q

10.000-16.000 16.000-22.000 22.000-28.000 28.000-34.000 34.000-40.000


135

215

320

225

105

1.- Determnese el salario medio.


2.- Cul es el salario que percibe un mayor nmero de personas?
3.- Puede emplearse el salario medio como representativo del conjunto de salarios?
4.- El horario no es nico para todos los trabajadores. Sabiendo que el nmero medio de horas
trabajadas por empleado es de 8 horas y su desviacin tpica es de 4,5 horas. Es lgica la
distribucin de salarios en relacin a la de horas trabajadas?
Solucin

178

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1 Un anlisis de la relacin entre el consumo de tabaco y el nmero de personas con cncer
de pulmn se resume en la siguiente recta de regresin estimada:

< 

;

en dondeU



Siendo ; el n de aos durante los cuales una persona ha fumado, e < el porcentaje de
cancergenos habidos en cada grupo de personas segn sus aos de fumador.
1.- Explquese el significado de los resultados -2 y 1,2 en la recta de regresin.
2.- Cul es la expectativa respecto a la tasa de cancergenos para personas que han fumado 30
aos?
3.- Si U hubiese sido = 1 Podramos decir que el tabaco fue la nica causa del cncer de pulmn?
Solucin


179

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1 Supongamos que el Coeficiente de variacin de una distribucin es 0,2 y su media es 30.
Hllese la desviacin tpica de la distribucin.

Solucin


180

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1

Dada la distribucin Bidimensional


Xi
Yj

10
50

20
45

30
38

40
32

1.- Ajstese una recta por el procedimiento de los Mnimos Cuadrados.


2.- Calclese el coeficiente de correlacin lineal y explquese su significado.
Solucin

181

50
29

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1.-La distribucin de las acciones de una determinada sociedad, entre sus accionistas,
segn la edad de estos, viene expresada por intervalos en la tabla siguiente:

Edad X
N Acciones
Y
0-20
20-28
28-32
32-48

menos
de 18
2
8
9
1
20

(18-26) (26-36) (36-46) (46-64)


3
1
2
2
4
3
10
7
10
16
10
5
2
1
2
2
19
21
24
16

10
32
50
8
100

Se pide: OBTENER RAZONADAMENTE, EXPLICANDO BREVEMENTE EL


SIGNIFICADO DE TODOS Y CADA UNO DE LOS RESULTADOS OBTENIDOS:
1.- Capital aproximado de la sociedad, supuesto un valor nominal para cada ttulo de
1.200. Ptas...
2.- Promedio de acciones por accionista.
3.- En el supuesto que en la Junta General de accionistas los votos se establecen en
proporcin al nmero de acciones posedas, qu mnimo de acciones debe tener un
accionista para que su poder decisorio sea mayor al de la mitad de los socios?
4.- Analizar y establecer la posible relacin entre la edad y el nmero de acciones de los
accionistas.
5.- Probabilidad de que una persona tomada al azar tenga menos de 26 aos sabiendo que
posee ms de 28 acciones
6.- Estimar el nmero de acciones que podemos esperar que posea una persona con 30
aos. Dar una media de la bondad de dicha estimacin.
7.- Distribuciones de:
1.- N acciones / edad > 35
2.- N acciones / 26 < edad < 46
Cul de las dos es ms homognea y por qu?
Solucin

182

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

N 132.- De una poblacin de 100 personas, se ha observado que 30 de ellas estn en paro.
Los padres de 11 de estas 30 tampoco tienen empleo. Estdiese si el paro es una situacin
que se reproduce dentro de las familias, teniendo en cuenta que de las 100 personas
observadas 40 tienen padres en desempleo.
Solucin

183

'(3$57$0(172'((67$'67,&$(,19(67,*$&,123(5$7,9$
(67$'67,&$'(6&5,37,9$

1.- Se han estudiado las calificaciones de 100 alumnos en dos asignaturas: Economa
(xi) y Estadstica (yj) obtenindose los siguientes datos:
;

= 110

<

= 2,5

= 10

= 0,5

Adems se sabe que el coeficiente de correlacin lineal entre ambas variables es 0,85.
Obtener razonadamente, demostrando brevemente el porqu de sus respuestas, y
explicando el significado de los resultados:
1.- Qu nota se puede esperar de un alumno que ha obtenido 125 puntos en Economa, en
la asignatura de Estadstica? Bondad de la estimacin.
2.- Se puede decir que aquellos alumnos que obtienen mayor calificacin en Economa,
sean los mismos que obtienen mayor calificacin en Estadstica
3.- Un alumno que obtiene 120 puntos en Economa y 3,5 en Estadstica En cul obtuvo
mejor calificacin relativa?
Solucin

184

You might also like