You are on page 1of 13

Taller de Consultoría

Instituto de Estadística

Integrante: Claudio Alvarado


Profesor: Patricio Videla
1. Construya un diagrama de tallo y hoja. Comente.
2. Obtenga medidas de desempeño. (Tendencia Central, Posición y Dispersión)
Comente.
3. Resuma la información en una Tabla de Frecuencias y construya el
respectivo Histograma.
Comente.
4. Obtenga las medidas de desempeño, utilizando la tabla construida por Ud.
5. Comente y compare los resultados obtenidos en los puntos 2 y 4.
6. Obtenga el porcentaje de datos, en la tabla de Frecuencias, que se encuentra
en el intervalo 𝑥̅ ± 𝑘 ∗ 𝑆, para k=1,2 y 3
7. Supongo que la variable x: “resistencia a la ruptura” sigue una distribución
normal de media  y varianza ² . Utilizando el promedio y la varianza de
los datos de la tabla, determine P (u-k*²<=X<= u+k*²) para k=1,2 y 3
Los datos de la muestra: 125 mediciones de la resistencia de cilindros

442 440 422 455 440


434 463 458 434 453
447 453 433 431 450
456 466 439 451 440
456 439 452 451 457
461 460 449 465 429
425 430 453 458 450
443 450 450 457 444
455 453 433 446 445
435 462 435 445 439
439 444 451 449 440
430 440 448 445 453
428 451 437 436 452
436 442 443 429 449
438 452 446 452 451
426 432 450 449 460
440 437 446 451 448
441 431 437 447 450
446 442 462 436 462
442 445 449 456 442
442 445 446 442 454
442 442 452 437 446
457 465 453 438 455
444 429 439 441 444
443 438 437 441 438

Los datos señalados en la tabla nos proporcionaran la información que


entregaremos mediante el presente informe
1.-Diagrama de tallo y Hoja

Frecuencia Tallo & Hoja


1,00 42. 2
6,00 42. 568999
9,00 43. 001123344
19,00 43. 5566677777888899999
25,00 44. 0000001112222222223334444
20,00 44. 55555666666778899999
24,00 45. 000000111111222223333334
11,00 45. 55566677788
7,00 46. 0012223
3,00 46. 556

El objetivo del diagrama de tallo y hojas es mostrar la frecuencia con


la que ocurren los valores dentro de un conjunto de datos. Entre más dígitos
tenga una hoja, mayor será su longitud respecto a las demás y podremos
identificar fácilmente la hoja de mayor longitud, así como la menor.
Se pude observar en este caso que la mayor cantidad se encuentra en el
grupo de resistencia con tallo 44. A raíz de este diagrama se puede identificar
una tendencia simétrica en los datos, ya que la concentración de estás se
encuentra en el centro.
Para dar mayor claridad a lo anterior se realizará una tabla de frecuencias e
histograma.
2.-Estadistica Descriptiva
Estadística
Descriptiva

Media 445,216 [lb/pulg²]


Error típico 0,845 [lb/pulg²]
Mediana 445 [lb/pulg²]
Moda 442 [lb/pulg²]
Desviación
estándar 9,45 [lb/pulg²]
Varianza de
la muestra 89,316 [lb/pulg²]
Curtosis -0,43 [lb/pulg²]
Coeficiente de
asimetría -0,011 [lb/pulg²]
Rango 44
Mínimo 422 [lb/pulg²]
Máximo 466 [lb/pulg²]

La media y la mediana, tiene un valor muy cercano, por lo que se puede


señalar que los datos tienen una tendencia simétrica.
El coeficiente de asimetría es muy pequeño, -0,011
La curtosis negativa nos entrega la información que tiene una forma
levemente achatada, por lo que es menos apuntada y con colas menos gruesas
que la normal.
El máximo y mínimo nos indica si existen valores atípicos.
La varianza muestral que existe una dispersión de 89,316 [lb/pulg²], respecto
al cuadrado de la media aritmética de este problema.
La desviación estándar se expresa en las mismas unidades de la media, por
ende, en este caso, existe una variación de 12,661 de dispersión respecto a la
media de los datos.
El coeficiente de variación es muy pequeño por lo que el promedio es
representativo.
3.-
Tabla de frecuencias:
Se realizo con la regla de sturges:
K= 1+3,322(Log N)
= 1+3,322(log 125)
= 7,965

Li: Límite inferior


LI LS xi ni fi Ni Fi
Ls: Límite superior
422 427 424,5 3 2,4 3 2,4 xi: Marca de clase
428 433 430,5 11 8,8 14 11,2 ni: Frecuencia absoluta
fi: Frecuencia relativa
434 439 436,5 21 16,8 35 28
Ni: Frecuencia acumuladas
440 445 442,5 30 24 65 52 absoluta
Fi: Frecuencia acumulada
446 451 448,5 27 21,6 92 73,6
relativa
452 457 454,5 21 16,8 113 90,4

458 463 460,5 9 7,2 122 97,6 Numero clases: 8


Valor mayor: 466
464 469 466,5 3 2,4 125 100
Valor menor: 422
Total 125 100 Amplitud: 6

La tabla de frecuencias se obtuvo mediante el programa Excel, en el cual se


desarrolló la cantidad de intervalos mediante la regla de sturges, que nos
señala que el cálculo de intervalos necesarios para realizar posteriormente un
histograma.
Histograma

35
30
25
20
Frecuencia

15
10
5
0
424.5 430.5 436.5 442.5 448.5 454.5 460.5 466.5
Resistencia [lb/pulg2]

El histograma nos muestra una clara tendencia a la simetría, esto es debido a


que los datos están ubicados en gran parte en el centro. El análisis descriptivo
nos indicaba está tendencia en especial la media, mediana y el coeficiente de
asimetría, por lo que ahora con el actual grafico se puede ver con mayor
claridad.
4.-
Medidas de desempeño según tabla de frecuencias
Formulas:
1
Media= ∑𝑘𝑖=1 𝑛𝑖 ∗ 𝑥𝑖
𝑛

(𝑛 )
−𝑁𝑖−1
2
Mediana= 𝐿𝑖−1 + 𝐴𝑖
𝑛𝑖

Δ1
Moda= 𝐿 + ( )⋅𝐴
Δ1 +Δ2

Medidas Tendencia Central


Media 445,188 [lb/pulg2]
Mediana 445,5[lb/pulg2]
Moda 444,5[lb/pulg2]
Posición
Rango 44

Dispersión
Varianza Muestral 89,103 [lb/pulg2]
Desviación Estándar 9,439 [lb/pulg2]
Coeficiente variación 0,0212 [lb/pulg2]
5.-
Comparar medidas de desempeño y tabla de frecuencia

Medidas Tendencia Medidas desempeño Tabla de Frecuencias


Central datos
Media 445,216 [lb/pulg2] 445,188
[lb/pulg2]
Mediana 445[lb/pulg2] 445,5 [lb/pulg2]
Moda 442[lb/pulg2] 444,5 [lb/pulg2]
Posición
Rango 44 44

Dispersión
Varianza Muestral 89,316[lb/pulg2] 89,103 [lb/pulg2]

Desviación Estándar 9,45[lb/pulg2] 9,439 [lb/pulg2]

Coeficiente variación -0,011[lb/pulg2]

Las medidas de desempeño para los dos casos son muy similares, el único
cambio importante que se puede visualizar es respecto a la moda, ya que en la
tabla de frecuencia se ubica en el intervalo con mayor frecuencia absoluta, que
corresponde al intervalo número 4.
Cabe destacar que los resultados obtenidos en ambos casos tienen medidas
de tendencia central muy semejantes.
Las medidas de dispersión son similares con un leve aumento en las medidas
de desempeño de los datos.
6.-

Teorema de Chebyshev

Aplicar el teorema mediante lo siguiente:


𝑥̅ ± 𝑘 ⋅ 𝑠 k=1,2,3

k Límite Inferior Limite Superior %

1 435,7485 454,627 no aplica

2 426,621 464,067 0,75

3 416,870 473,506 0,88

Teorema de chebyshev es muy importante, ya que permite determinar los


límites de probabilidades de variables sin tener que especificar sus funciones
de probabilidad. Este teorema asegura que la probabilidad de una variable
aleatoria se aleje de la media no más de K desviaciones estándar es menor
1/K2 para algún valor de k>1.
Para nuestro k=1 no se aplica ya que según la formula (1-1/k^2) nos señala que
el 56% de los datos se encuentra entre (435,7485-454,627).
Para k=2 siguiendo la misma formula nos indica que se encuentra al menos el
75% de los datos está en el intervalo (426,621-464,067).
Para k=3 nos indica que el 88% de los datos se ubica en este intervalo.
7.-

Media
445,18
Varianza
89,103
Desviación estándar
9,439

K=1
P (445,188-9,439≤x≤ 445,188+9,439)
P (435,749≤x≤ 454,627)
P ((435,749-445,188) /9,439)) ≤ x≤ (454,627-445,188) /9,439)
P(-1≤x≤1)
=0,6826

K=2
P (445,188-18.878 ≤x≤ 445,188+18.878)
P (426,31 ≤x≤ 464,066)
P ((426,31 -445,18) /9,439 ≤ x≤ (464,066-445,18) / 9,439)
P(-2≤x≤2)
=0,9544

K=3
P (445,18-28,317 ≤x≤ 445,18+28,317)
P (416,863 ≤x≤ 473,497)
P ((416,863 -445,18) / 9,439 ≤ x≤ (473,497-416,863) / 9,439)
P(-3≤x≤3)
=0,9974
Si se considera que los datos se ajustan aproximadamente como una distribución normal,
con la media y desviación estándar según la tabla de frecuencia, para k=1,2,3, ya que de
manera probabilística entre la primera desviación estándar y su respectiva media agrupa un
68% de los datos.
Para el caso de dos desviaciones estándar agrupa aproximadamente un 95% de los datos
Por último, con tres desviaciones estándar nos indica que se encuentran la totalidad de los
datos.
Para ejemplificar lo realizado, se muestran gráficos señalando las medidas de desviación
estándar.
Ver figura

You might also like