You are on page 1of 21

PROBABILIDADES Y ESTADISTICA Producto Académico N° 2

Producto Académico N° 2
Resuelva los siguientes problemas en este archivo, mostrando todos los procedimientos.

Emplee el editor de ecuaciones en el archivo de Word

Suba el archivo al aula virtual en la Unidad 1 en el link de entrega del producto académico1.

1) La tabla muestra las notas obtenidas por 20 estudiantes:

Notas fi
[00, 0 4) 1
[04, 0 8) 5
[08, 1 2) 7
[12, 1 6) 5
[16, 2 0) 2

Además se selecciona al azar las siguientes notas de 8 estudiantes:

12, 6, 7, 13, 15, 10, 18, 5

a) Calcula e interpreta la varianza y la desviación estándar tanto del grupo de 20


estudiantes, como de la muestra de 8 estudiantes.

• Realizaremos la tabla completa para los 20 estudiantes:

Notas xi fi xi*fi
[00, 04) 2 1 2
[04, 08) 6 5 30
[08, 12) 10 7 70
[12, 16) 14 5 70
[16, 20) 18 2 36
Total 20 208

• Calculo de la media para los 20 estudiantes.

∑ 𝑥 ∗ 𝑓𝑖 208
𝑀𝑒𝑑𝑖𝑎 = 𝑥̅ = = = 10,4
𝑁 20

1|Página
PROBABILIDADES Y ESTADISTICA Producto Académico N° 2

Notas X fi ̅
𝒙 ̅
x-𝒙 ̅)^2
(x-𝒙 ̅)^2
fi*(x-𝒙
[00, 04) 2 1 10,4 -8,4 70,56 70,56
[04, 08) 6 5 10,4 -4,4 19,36 96,8
[08, 12) 10 7 10,4 -0,4 0,16 1,12
[12, 16) 14 5 10,4 3,6 12,96 64,8
[16, 20) 18 2 10,4 7,6 57,76 115,52
Total 20 160,8 348,8

• Para el calcula de la varianza muestral para el grupo de 20 estudiantes:

∑(𝑥 − 𝑥̅ )2 ∗ 𝑓𝑖 (2 − 10,4)2 ∗ 1 + (6 − 10,4)2 ∗ 5 + ⋯ + (18 − 10,4)2 ∗ 2 348,8


𝑆2 = = = = 18,36
𝑛−1 20 − 1 19

• Realizamos el calculo de la desviacion estandar.

𝑆 = √(𝑆)2 = √18,36 = 4,28

INTERPRETACION: La nota obtenida de los 20 estudiantes tienen un promedio de 10,4 ±


4.28.

• Para el calculo de la media muestral para los 8 estudiantes:

12 + 6 + 7 + 13 + 15 + 10 + 18 + 5 86
𝑚𝑒𝑑𝑖𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 = 𝑥̅ = = = 10,75
8 8

• Para el calculo de la varianza de datos no agrupados.

∑(𝑥 − 𝑥̅ )2 (12 − 10,75)2 + (6 − 10,75)2 + ⋯ + (5 − 10,75)2 147,5


𝑆2 = = = = 21,071
𝑛−1 8−1 7

• Realizamos el calculo de la desviacion estandar

𝑆 = √(𝑆)2 = √21,071 = 4,59

INTERPRETACION: De la muestra de los 8 estudiantes tienen un promedio de 10,75 de


nota y tienden a dispersarse respecto a la media en 4.59 puntos.

2|Página
PROBABILIDADES Y ESTADISTICA Producto Académico N° 2

b) Calcula e interpreta el coeficiente de variación de las notas de los 20 estudiantes y de


la muestra de 8 estudiantes

• Para el calculo del CV para el dato de los 20 estudiantes:

𝑆 4,28
𝐶𝑉 =
∗ 100% = ∗ 100% = 41,15%
𝑥̅ 10,4
INTERPRETACION: El dato de las notas de los 20 alumnos son muy heterogeneos
pues su CV es de 41,15

• Para el calculo del CV, para los datos de los 8 estudiantes:

𝑆 4,59
𝐶𝑉 =∗ 100% = ∗ 100% = 0,427 = 42,7%
𝑥̅ 10,75
INTERPRETACION :

2) Se ha aplicado un test a los empleados de una fábrica, obteniéndose la siguiente tabla:

interv alos fi
[38, 4 4) 10
[44, 5 0) 12
[50, 5 6) 15
[56, 6 2) 25
[62, 6 8) 18
[68, 7 4) 12
[74, 8 0) 8

a) Calcular e interpretar el cuartil 2


• Calculamos el lugar

𝑄2 → 𝑘 = 2
Entonces:

𝑘 ∗ 𝑛 2 ∗ 100
𝐿= = = 50
4 4

• El lugar es el 50, realizamos la tabla con la frecuencia relativa acumulada Fi:

3|Página
PROBABILIDADES Y ESTADISTICA Producto Académico N° 2

intervalos fi Fi
[38, 44) 10 10
[44, 50) 12 22
[50, 56) 15 37
[56, 62) 25 62 Intervalo del Q2
[62, 68) 18 80
[68, 74) 12 92
[74, 80) 8 100
n=100

Entonces tenemos que:


𝑘∗𝑛
− 𝐹𝑖−1
𝑄𝑘 = 𝐿𝑖 + 𝐴 ( 4 )
𝑓𝑖

𝐿𝑖 = 56 𝑓𝑖 = 25 𝐹𝑖−1 = 37 𝐴 = 62 − 56 = 6

𝐿 − 𝐹𝑖−1 50 − 37
𝑄2 = 𝐿𝑖 + 𝐴 ( ) = 56 + 6 ( ) = 59,12
𝑓𝑖 25

INTERPRETAR: Se puede decir, que el 50% de los empleados tienen como máximo
un puntaje de 59,12, mientras que el 50% restante tienen puntajes mayores.

b) Calcular e interpretar el percentil 75

• Primero calculamos el lugar para:


𝑃75 → 𝑘 = 75

𝑘 ∗ 𝑛 75 ∗ 100
𝐿= = = 75
100 100

intervalos fi Fi
[38, 44) 10 10
[44, 50) 12 22
[50, 56) 15 37
[56, 62) 25 62
[62, 68) 18 80
[68, 74) 12 92
[74, 80) 8 100
n=100

4|Página
PROBABILIDADES Y ESTADISTICA Producto Académico N° 2

𝑘∗𝑛
− 𝐹𝑖−1
𝑝𝑘 = 𝐿𝑖 + 𝐴 ( 100 )
𝑓𝑖

𝐿𝑖 = 62 𝑓𝑖 = 18 𝐹𝑖−1 = 62 𝐴 = 68 − 62 = 6

Entonces:
𝐿 − 𝐹𝑖−1 75 − 62
𝑃75 = 𝐿𝑖 + 𝐴 ( ) = 62 + 6 ( ) = 66,33
𝑓𝑖 18

INTERPRETACIÓN: Se puede decir, que el 75% de los empleados tienen como


máximo un puntaje de 66,33.

3) Los niños, a diferencia de los adultos, tienden a recordar las películas, cuentos e historias
como una sucesión de acciones más que el argumento en forma global y de conjunto. En el
relato de una película, por ejemplo, utilizan con frecuencia las palabras "y entonces...". Una
psicóloga con suprema paciencia pidió a 50 niños que le contaran una determinada película
que ellos habían visto. Consideró la variable: cantidad de "y entonces..." utilizados en el
relato y registró los siguientes datos:

8 15 22 19 15 17 18 20 17 12
16 16 17 21 23 18 20 21 20 20
15 18 17 19 20 23 22 10 17 19
19 21 20 18 18 24 11 19 31 16
17 18 19 20 18 18 40 18 19 16

Como parte del mismo estudio la experimentadora obtuvo de 50 adultos el mismo tipo de
datos.
Estos fueron:

10 12 5 8 13 10 12 8 7 9
11 10 9 9 11 15 12 17 14 10
9 8 15 16 10 14 7 16 9 1
4 11 12 7 9 10 3 11 14 8
12 5 10 9 7 11 14 10 15 9

Para ambas variables:


a) Construya la tabla de frecuencias.

5|Página
PROBABILIDADES Y ESTADISTICA Producto Académico N° 2

• Realizamos el calculo del número de intervalos para ambas muestras con la regla de
Sturges:

𝑚 = 1 + 3,3 ∗ log 𝑛 = 1 + 3,3 ∗ log(50) = 6,6 ≈ 7

• Tabla de frecuencias para la muestra de 50 niños:

𝑅 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛 = 40 − 8 = 32

𝑅 32
𝐴= = = 4,57 ≈ 5
𝑚 7

Intervalos xi fi Fi hi Hi
[8, 13) 10,5 4 4 0,08 0,08
[13, 18) 15,5 13 17 0,26 0,34
[18, 23) 20,5 28 45 0,56 0,9
[23, 28) 25,5 3 48 0,06 0,96
[28, 33) 30,5 1 49 0,02 0,98
[33, 38) 35,5 0 49 0 0,98
[38, 43) 40,5 1 50 0,02 1
Total 50 1

• Tabla de frecuencias para la muestra de 50 adultos:


𝑅 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛 = 17 − 1 = 16
𝑅 16
𝐴= = = 2,29 ≈ 2,3
𝑚 7

Intervalos xi fi Fi hi Hi
[1 - 3,3) 2,15 2 2 0,04 0,04
[3,3 - 5,6 ) 4,45 3 5 0,06 0,1
[5,6 - 7,9) 6,75 4 9 0,08 0,18
[7,9 - 10,2) 9,05 20 29 0,4 0,58
[10,2 - 12,5) 11,35 10 39 0,2 0,78
[12,5 - 14,8) 13,65 5 44 0,1 0,88
[14,8 - 17,1) 15,95 6 50 0,12 1
Total 50 1

6|Página
PROBABILIDADES Y ESTADISTICA Producto Académico N° 2

b) Calcule la media, la mediana y la moda.


• Para los datos de los 50 niños:
∑ 𝑥 ∗ 𝑓𝑖 965
𝑚𝑒𝑑𝑖𝑎 = 𝑥̅ = = = 19,3
𝑛 50

𝑛
− 𝐹𝑖−1 25 − 17
𝑀𝑒 = 𝐿𝑖 + 𝐴 (2 ) = 18 + 5 ( ) = 19,43
𝑓𝑖 28

𝑑1 28 − 13
𝑀𝑜 = 𝐿𝑖 + 𝐴 ( ) = 18 + 5 ( ) = 19.88
𝑑1 + 𝑑2 (28 − 13) + (28 − 3)

• Para los datos de los 50 adultos:

∑ 𝑥 ∗ 𝑓𝑖 503,1
𝑚𝑒𝑑𝑖𝑎 = 𝑥̅ = = = 10,06
𝑛 50

𝑛
− 𝐹𝑖−1 25 − 9
𝑀𝑒 = 𝐿𝑖 + 𝐴 (2 ) = 7,9 + 2,3 ( ) = 9,74
𝑓𝑖 20

𝑑1 20 − 4
𝑀𝑜 = 𝐿𝑖 + 𝐴 ( ) = 7,9 + 2,3 ( ) = 9.32
𝑑1 + 𝑑2 (20 − 4) + (20 − 10)

c) Grafique ambas distribuciones de manera que puedan ser comparadas.


• Realizamos el agrupamiento de ambos datos, por lo cual se tiene:

𝑚 = 1 + 3,3 ∗ log 𝑛 = 1 + 3,3 ∗ log(50) = 6,6 ≈ 7


𝑅 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛 = 40 − 1 = 39

𝑅 39
𝐴= = = 5,57 ≈ 6
𝑚 7

7|Página
PROBABILIDADES Y ESTADISTICA Producto Académico N° 2

Intervalos niños adultos


[1 - 7) 0 5
[7 - 13) 4 34
[13 - 19) 22 11
[19 - 25) 22 0
[25 - 31) 0 0
[31 - 37) 1 0
[37 - 43) 1 0
Total 50 50

Gráfico de barras
Número de personas

34

22 22

11
0 5 4 0 0 0 1 0 1 0

[1 - 7) [7 - 13) [13 - 19) [19 - 25) [25 - 31) [31 - 37) [37 - 43)
Cantidad de "y entonces..."

niños adultos

d) Los puntos anteriores, ¿qué indican respecto de la conducta observada en niños y


adultos?
• Vemos que los niños son los que tienden a repetir más la palabra “y entonces…” al
momento de contar una película en comparación de los adultos, según el grafico vemos
que la frecuencia de los adultos acaba en el intervalo (13 – 19), mientras que en los
niños la frecuencia continua hasta el intervalo (37 – 43).

8|Página
PROBABILIDADES Y ESTADISTICA Producto Académico N° 2

e) Calcule la varianza y el desvío estándar.

• Varianza muestral para el grupo de niños:

∑(𝑥 − 𝑥̅ )2 ∗ 𝑓𝑖 1228
𝑆2 = = = 25,061
𝑛−1 50 − 1

Entonces, la desviación estándar poblacional será:

𝑆 = √25,061 = 5,01

• Varianza muestral para el grupo de adultos:

∑(𝑥 − 𝑥̅ )2 ∗ 𝑓𝑖 573,013
𝑆2 = = = 11,694
𝑛−1 50 − 1

Entonces, la desviación estándar poblacional será:

𝑆 = √11,694 = 3,419

f) Indique en cuál grupo los integrantes son más parecidos en cuanto a la cantidad de “y
entonces…” utilizados en el relato de una película. Justifique su respuesta.

• Para ver la homogeneidad de los datos utilizamos el coeficiente de variación.

• Para el grupo de niños:


𝑆 5,01
𝐶𝑉 = ∗ 100% = ∗ 100% = 0,259 = 25,9%
𝑥̅ 19,3

INTERPRETACION:Se puede decir, que los datos son muy variables ya que su CV es
mayor a 25%.

• Para el grupo de adultos:


𝑆 3,419
𝐶𝑉 = ∗ 100% = ∗ 100% = 0,34 = 34%
𝑥̅ 10,06

INTERPRETACION: Se puede decir, que los datos son muy variables ya que su CV es
mayor a 25%.

9|Página
PROBABILIDADES Y ESTADISTICA Producto Académico N° 2

4) Un fabricante de neumáticos ha recabado, de los diferentes concesionarios, información


sobre la cantidad de miles de kilómetros recorridos por un modelo concreto de esos
neumáticos hasta que se ha producido un pinchazo o un reventón del neumático. Los
concesionarios la han proporcionado los siguientes datos:

52,452 50,432 37,748 51,831 73,808 61,065 35,807


48,698 65,854 75,85 36,949 75,548 69,01 61,477
44,411 41,886 34,754 59,888 59,449 67,632 89,116
63,692 70,003 65,996 55,989 49,677 46,502 67,467
84,588 40,709 50,238 61,39 85,72 45,313 46,724
55,643 55,912 46,681 66,519 59,168 66,313 35,884
47,012 71,36 78,635 41,715 72,635 41,463 48,996
79,426 67,662 53,324 49,011 29,48 41,128 30,252
48,24 57,884 55,257 84,656 48,662 10,504 60,951
74,239 60,727 56,155 86,07 90,565 53,751 76,58

a) Construir una taba de frecuencias para esos datos tomando como número de intervalos
el que proporciona la fórmula de Sturgess. Interpretas la tabla.

• Calculamos el número de intervalos con la regla de Sturges:

𝑚 = 1 + 3,3 ∗ log 𝑛 = 1 + 3,3 ∗ log(70) = 7,089 ≈ 7

𝑅 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛 = 90565 − 10504 = 80061

𝑅 80061
𝐴= = ≈ 11437
𝑚 7

Intervalos xi fi Fi hi Hi
[10504 - 21941) 16223 1 1 0,014 0,014
[21941 - 33378) 27660 2 3 0,029 0,043
[33378 - 44815) 39097 11 14 0,157 0,2
[44815 - 56252) 50534 22 36 0,314 0,514
[56252 - 67689) 61971 17 53 0,243 0,757
[67689 - 79126) 73408 10 63 0,143 0,9
[79126 - 90563] 84845 7 70 0,1 1
Total 70 1

10 | P á g i n a
PROBABILIDADES Y ESTADISTICA Producto Académico N° 2

b) Construir las tablas de frecuencias acumuladas ascendente y descendente.

Tabla de frecuencias acumuladas ascendente

Intervalos Fi Hi
[10504 - 21941) 1 0,014
[21941 - 33378) 3 0,043
[33378 - 44815) 14 0,2
[44815 - 56252) 36 0,514
[56252 - 67689) 53 0,757
[67689 - 79126) 63 0,9
[79126 - 90563] 70 1

Tabla de frecuencias acumuladas descendente

Intervalos Fi Hi
[10504 - 21941) 70 1
[21941 - 33378) 63 0,9
[33378 - 44815) 53 0,757
[44815 - 56252) 36 0,514
[56252 - 67689) 14 0,2
[67689 - 79126) 3 0,043
[79126 - 90563] 1 0,014

c) Graficar el histograma de frecuencias relativas sin acumular y acumulado.


• Frecuencias relativas

Histograma de frecuencias reltivas

0.314
Frecuencias relativas

0.243

0.157
0.143
0.1
0.014 0.029

16223 27660 39097 50534 61971 73408 84845


Marcas de clase X

11 | P á g i n a
PROBABILIDADES Y ESTADISTICA Producto Académico N° 2

• Frecuencia relativas acumuladas

Histograma de frecuencias relativas


acumuladas
Frecuencias relativas

1
0.9
0.757

0.514

0.014 0.043 0.2

16223 27660 39097 50534 61971 73408 84845


Marcas de clase X

d) Calcular las principales medidas de tendencia central e interpretarlas.


∑ 𝑥 ∗ 𝑓𝑖 3994825
𝑚𝑒𝑑𝑖𝑎 = 𝑥̅ = = = 57069
𝑛 70

INTERPRETACION: Concluimos, que la media del analisis de neumaticos han recorrido


57069 km antes de un pinchazo o reventón.

𝑛
− 𝐹𝑖−1 35 − 14
𝑀𝑒 = 𝐿𝑖 + 𝐴 (2 ) = 44815 + 5 ( ) = 55732
𝑓𝑖 22

INTERPRETACION: Se puede decir, que el 50% de los neumáticos han recorrido a lo


mucho 55732 km antes de un pinchazo o reventón.

𝑑1 22 − 11
𝑀𝑜 = 𝐿𝑖 + 𝐴 ( ) = 44815 + 11437 ( ) = 52678
𝑑1 + 𝑑2 (22 − 11) + (22 − 17)

INTERPRETACION: Se puede decir, que el dato más frecuente de kilómetros recorridos


antes de un pinchazo, ha sido 52678 km.

12 | P á g i n a
PROBABILIDADES Y ESTADISTICA Producto Académico N° 2

e) Obtener las medidas de dispersión más importantes e interpretarlas.


• Desviación estándar:
∑(𝑥 − 𝑥̅ )2 ∗ 𝑓𝑖 16369307549
𝑆=√ =√ = 15402
𝑛−1 70 − 1

INTERPRETACION: Se puede decir, que los kilómetros recorridos antes de un


pinchazo tienden a dispersarse respecto a la media en 15402 km.

• Coeficiente de variación:

𝑆 15402
𝐶𝑉 = ∗ 100% = ∗ 100% = 0,27 = 27%
𝑥̅ 57069
INTERPRETACION: Se concluye que los kilómetros recorridos son datos
heterogeneos

f) Analizar la asimetría y el apuntamiento de la distribución de frecuencias resultante.


• Coeficiente de asimetría:
3(𝑥̅ − 𝑀𝑒) 3(57069 − 55732)
𝐴𝑆 = = = 0,26
𝑆 15402

Se puede decir, que los datos siguen una distribución asimétrica positiva.

• Curtosis:

Primero calculamos el lugar para:


𝑘 10
𝑃10 → 𝑘 = 10 → 𝐿 = ∗𝑛 = ∗ 70 = 7
100 100

𝑘 25
𝑃25 → 𝑘 = 25 → 𝐿 = ∗𝑛 = ∗ 70 = 17,5
100 100

𝑘 75
𝑃75 → 𝑘 = 75 → 𝐿 = ∗𝑛 = ∗ 70 = 52,5
100 100

𝑘 90
𝑃90 → 𝑘 = 90 → 𝐿 = ∗𝑛 = ∗ 70 = 63
100 100

Entonces:
𝐿 − 𝐹𝑖−1 7−3
𝑃10 = 𝐿𝑖 + 𝐴 ( ) = 33378 + 11437 ( ) = 37537
𝑓𝑖 11

13 | P á g i n a
PROBABILIDADES Y ESTADISTICA Producto Académico N° 2

𝐿 − 𝐹𝑖−1 17,5 − 14
𝑃25 = 𝐿𝑖 + 𝐴 ( ) = 44815 + 11437 ( ) = 46635
𝑓𝑖 22

𝐿 − 𝐹𝑖−1 52,5 − 36
𝑃75 = 𝐿𝑖 + 𝐴 ( ) = 56252 + 11437 ( ) = 67353
𝑓𝑖 17

𝐿 − 𝐹𝑖−1 63 − 53
𝑃90 = 𝐿𝑖 + 𝐴 ( ) = 67689 + 11437 ( ) = 79126
𝑓𝑖 10

Finalmente:
𝑃75 − 𝑃25 67353 − 46635
𝐾= = = 0,249
2(𝑃90 − 𝑃10 ) 2(79126 − 37537)

INTERPRETACION: Se puede decir, que los datos siguen una distribución mesocúrtica,
es decir que tienen una dispersión moderada.

g) Si el fabricante quiere proponer un kilometraje para realizar el cambio de neumáticos,


¿qué valor propondría para que solo 3 de cada 10 coches hayan tenido un pinchazo o
reventón antes de ese kilometraje?

• Es decir que el 30% de los neumáticos hayan sido pinchados o reventados, entonces
buscamos el percentil 30:

Primero calculamos el lugar para:


𝑘 30
𝑃30 → 𝑘 = 30 → 𝐿 = ∗𝑛 = ∗ 70 = 21
100 100

𝐿 − 𝐹𝑖−1 21 − 14
𝑃30 = 𝐿𝑖 + 𝐴 ( ) = 44815 + 11437 ( ) = 48454
𝑓𝑖 22

INTERPRETACION: Se recomienda que el fabricante propondría cambiar los


neumáticos a los 48454 km.

14 | P á g i n a
PROBABILIDADES Y ESTADISTICA Producto Académico N° 2

5) En una ciudad, analizamos el nivel de vida a través de la renta anual familiar. Se recoge
información sobre 50 familias. Los datos en miles de soles, son los siguientes:

3,2 1,3 2,3 3,2 2,6 3,6 1,7 1,3 0,9 2,3
1,1 0,8 3,4 3,2 1,6 1,3 2,9 1,8 1,1 1,6
3,3 0,4 2,8 2,6 0,9 2,7 1,2 0,8 2,1 2,2
0,2 3,8 1,7 1,1 2 2,3 2,2 2,3 1,7 1,7
2 2,6 1,2 2,4 1,8 2,3 2 1,4 1,2 2,1

Obtener medidas que indiquen la localización, la dispersión, la asimetría y la curtosis.


Repetir el problema agrupando los datos en intervalos de amplitud 0’5 y posteriormente en
intervalos de amplitud 1. Comprobar si existen grandes diferencias.

• Tomando los datos sin agrupamiento:

n=50 Mínimo=0,2 Máximo=3,8 Rango=3,8-0,2=3,6

∑ 𝑥 98,2
𝑥̅ = = = 1,964
𝑛 50

𝑑𝑎𝑡𝑜(𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 25) + 𝑑𝑎𝑡𝑜(𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 26) 2 + 2


𝑀𝑒 = = =2
2 2

𝑀𝑜 = 𝑣𝑎𝑙𝑜𝑟 𝑞𝑢𝑒 𝑚á𝑠 𝑠𝑒 𝑟𝑒𝑝𝑖𝑡𝑒 = 2,3

∑(𝑥 − 𝑥̅ )2 35,475
𝑆=√ =√ = 0,851
𝑛−1 50 − 1

𝑆 0,851
𝐶𝑉 = ∗ 100% = ∗ 100% = 43,3%
𝑥̅ 1,964

3(𝑥̅ − 𝑀𝑒) 3(1,964 − 2)


𝐴𝑆 = = = −0,127
𝑆 0,851

𝑃75 − 𝑃25 2,6 − 1,3


𝐾= = = 0,283
2(𝑃90 − 𝑃10 ) 2(3,2 − 0,9)

15 | P á g i n a
PROBABILIDADES Y ESTADISTICA Producto Académico N° 2

• Agrupando los datos en intervalos de amplitud 0,5:

Intervalos xi fi Fi xi*fi fi*(xi-media)^2


[0,0 - 0,5) 0,25 2 2 0,5 6,0552
[0,5 - 1) 0,75 4 6 3 6,1504
[1 - 1,5) 1,25 10 16 12,5 5,476
[1,5 - 2) 1,75 8 24 14 0,4608
[2 - 2,5) 2,25 13 37 29,25 0,8788
[2,5 - 3) 2,75 6 43 16,5 3,4656
[3 - 3,5) 3,25 5 48 16,25 7,938
[3,5 - 4] 3,75 2 50 7,5 6,1952
Total 50 99,5 36,62

∑ 𝑥 ∗ 𝑓𝑖 99,5
𝑥̅ = = = 1,99
𝑛 50

𝑛
− 𝐹𝑖−1 25 − 24
𝑀𝑒 = 𝐿𝑖 + 𝐴 (2 ) = 2 + 0,5 ( ) = 2,038
𝑓𝑖 13

𝑑1 13 − 8
𝑀𝑜 = 𝐿𝑖 + 𝐴 ( ) = 2 + 0,5 ( ) = 2,208
𝑑1 + 𝑑2 (13 − 8) + (13 − 6)

∑(𝑥 − 𝑥̅ )2 ∗ 𝑓𝑖 36,62
𝑆=√ =√ = 0,864
𝑛−1 50 − 1

𝑆 0,864
𝐶𝑉 = ∗ 100% = ∗ 100% = 43,4%
𝑥̅ 1,99

3(𝑥̅ − 𝑀𝑒) 3(1,99 − 2,038)


𝐴𝑆 = = = −0,167
𝑆 0,864

𝑃75 − 𝑃25 2,542 − 1,325


𝐾= = = 0,262
2(𝑃90 − 𝑃10 ) 2(3,2 − 0,875)

16 | P á g i n a
PROBABILIDADES Y ESTADISTICA Producto Académico N° 2

➢ Agrupando los datos en intervalos de amplitud 1:

Intervalos xi fi Fi xi*fi fi*(xi-


media)^2
[0,0 - 1) 0,5 6 6 3 14,2296
[1 - 2) 1,5 18 24 27 5,2488
[2 - 3) 2,5 19 43 47,5 4,0204
[3 - 4) 3,5 7 50 24,5 14,9212
Total 50 102 38,42

∑ 𝑥 ∗ 𝑓𝑖 102
𝑥̅ = = = 2,04
𝑛 50
𝑛
− 𝐹𝑖−1 25 − 24
𝑀𝑒 = 𝐿𝑖 + 𝐴 (2 ) = 2 + 1( ) = 2,053
𝑓𝑖 19

𝑑1 19 − 18
𝑀𝑜 = 𝐿𝑖 + 𝐴 ( ) = 2 +1( ) = 2,077
𝑑1 + 𝑑2 (19 − 18) + (19 − 7)

∑(𝑥 − 𝑥̅ )2 ∗ 𝑓𝑖 38,42
𝑆=√ =√ = 0,885
𝑛−1 50 − 1
𝑆 0,885
𝐶𝑉 = ∗ 100% = ∗ 100% = 43,4%
𝑥̅ 2,04

3(𝑥̅ − 𝑀𝑒) 3(2,04 − 2,053)


𝐴𝑆 = = = −0,044
𝑆 0,885

𝑃75 − 𝑃25 2,711 − 12,5


𝐾= = = 0,275
2(𝑃90 − 𝑃10 ) 2(3,286 − 0,833)

Sin intervalos Intervalo(A=0,5) Intervalo(A=1)


MEDIA 1,964 1,99 2,04
MEDIANA 2 2,038 2,053
MODA 2,3 2,208 2,077
S 0,851 0,864 0,885
CV 43,30% 43,40% 43,40%
AS -0,127 -0,167 -0,044
K 0,283 0,262 0,275

17 | P á g i n a
PROBABILIDADES Y ESTADISTICA Producto Académico N° 2

INTERPRETACION: Vemos que, mientras aumentamos el ancho de clase, la media y la


mediana aumentan ligeramente y la moda va decreciendo en menor medida. La
desviación estándar también aumenta ligeramente, el coeficiente de variación en ambos
intervalos es el mismo.
El coeficiente de asimetría, al aumentar el ancho de clase al intervalo, los datos se
vuelven más simétricos y en cuanto a la curtosis en todos los casos los datos tienen
baja dispersión.
6) Una encuesta aplicada a 24 familias respondieron a la pregunta del número de celulares que
poseen cada familia. El resultado se muestra a continuación. (Sugerencia: trabaja sin agrupar
datos)

3 5 1 4 3 1
3 2 3 3 2 1
3 2 1 3 3 2
2 4 1 2 5 4
a) Encuentra la media, mediana y moda (3p)
∑ 𝑥 63
𝑥̅ = = = 2,625
𝑛 24

𝑑𝑎𝑡𝑜(𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 12) + 𝑑𝑎𝑡𝑜(𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 13) 3 + 3


𝑀𝑒 = = =3
2 2

𝑀𝑜 = 𝑣𝑎𝑙𝑜𝑟 𝑞𝑢𝑒 𝑚á𝑠 𝑠𝑒 𝑟𝑒𝑝𝑖𝑡𝑒 = 3


b) Elabora un gráfico para representar la asimetría o simetría (1p)

GRÁFICO DE BARRAS Y LINEA DE


TENDENCIA
9 0.35
8 0.3
7
0.25
6
5 0.2
4 0.15
3
0.1
2
1 0.05
0 0
0 1 2 3 4 5 6

0 1 2 3 4 5 6

18 | P á g i n a
PROBABILIDADES Y ESTADISTICA Producto Académico N° 2

c) Comprueba la asimetría mediante la fórmula de Pearson. (1p)

3(𝑥̅ − 𝑀𝑒) 3(2,625 − 3)


𝐴𝑆 = = = −0,9304
𝑆 1,209

Los datos tienen distribución asimétrica negativa, tienen cola a la izquierda.

7) La distribución de edades del Censo Electoral para las provincias de Tarma y Oroya, es la
siguiente:
Edades TARMA Oroya
[16-18> 254 135
[18-30> 275 199
[30-50> 293 221
[50-70> 214 187
[70-90] 172 148

Compara el coeficiente de variabilidad de ambas provincias y determine cuál de las dos


provincias presenta mayor dispersión. (5 puntos)

• Para la provincia de Tarma:

Edades xi TARMA xi*fi fi*(xi-media)^2


[16-18> 17 254 4318 143391,75
[18-30> 24 275 6600 77246,23
[30-50> 40 293 11720 169,21
[50-70> 60 214 12840 79218,55
[70-90] 80 172 13760 264842,64
Total 1208 49238 564868,38

∑ 𝑥 ∗ 𝑓𝑖 49238
𝑥̅ = = = 40,76
𝑛 1208

∑(𝑥 − 𝑥̅ )2 ∗ 𝑓𝑖 564868,38
𝑆=√ =√ = 21,633
𝑛−1 1208 − 1

𝑆 21,633
𝐶𝑉 = ∗ 100% = ∗ 100% = 53,07%
𝑥̅ 40,76

19 | P á g i n a
PROBABILIDADES Y ESTADISTICA Producto Académico N° 2

• Para la provincia de Oroya:

Edades xi fi xi*fi fi*(xi-media)^2


[16-18> 17 135 2295 96872,99
[18-30> 24 199 4776 77918,59
[30-50> 40 221 8840 3170,51
[50-70> 60 187 11220 49151,19
[70-90] 80 148 11840 194077,58
Total 890 38971 421190,86

∑ 𝑥 ∗ 𝑓𝑖 38971
𝑥̅ = = = 43,788
𝑛 890

∑(𝑥 − 𝑥̅ )2 ∗ 𝑓𝑖 421190,86
𝑆=√ =√ = 21,766
𝑛−1 890 − 1

𝑆 21,633
𝐶𝑉 = ∗ 100% = ∗ 100% = 49,71%
𝑥̅ 40,76

INTERPRETACION: Los resultados para la variación, la provincia de Tarma tiene mayor


dispersión de datos en comparación con la Oroya, pero ambos tienen datos muy
heterogeneos, puesto que sus coeficientes de variación son mayores a 25%.

20 | P á g i n a
PROBABILIDADES Y ESTADISTICA Producto Académico N° 2

8) Una empresa envasadora de aceite de carros tiene los resultados de una muestra sobre la
prueba de pureza de los compuestos aditivos, los resultados se muestra en la tabla 3-18:

Calcule e interprete la curtosis.

Primero calculamos el lugar de:


𝑘 10
𝑃10 → 𝑘 = 10 → 𝐿 = ∗𝑛 = ∗ 15 = 1,5
100 100

𝑘 25
𝑃25 → 𝑘 = 25 → 𝐿 = ∗𝑛 = ∗ 15 = 3,75
100 100

𝑘 75
𝑃75 → 𝑘 = 75 → 𝐿 = ∗𝑛 = ∗ 15 = 11,25
100 100

𝑘 90
𝑃90 → 𝑘 = 90 → 𝐿 = ∗𝑛 = ∗ 15 = 13,5
100 100

Ordenando los datos ascendentemente ubicamos los valores de los percentiles:

𝑃75 − 𝑃25 0,21 − 0,14


𝐾= = = 0,194
2(𝑃90 − 𝑃10 ) 2(0,24 − 0,06)

Interpretacion: En los datos presentados poseen un reducido grado de concentración


alrededor de la media, es decir tienen alta dispersión, a esta forma de distribución se le
denomina platicúrtica.

21 | P á g i n a

You might also like