Professional Documents
Culture Documents
CHRISTIAN A. ROSERO F.
VERSIÓN: 2.1
MÓDULO 1: ESTADÍSTICA DESCRIPTIVA
MÓDULO 2: ESTADÍSTICA INFERENCIAL
MÓDULO 3: ESTADÍSTICA EXPERIMENTAL
MÓDULO 4: ESTADÍSTICA PARA LA CALIDAD
ESTADÍSTICA DESCRIPTIVA
Ejemplos………….. .................................................................................................................... 14
Resumen………. ......................................................................................................................... 14
1.6.2. Curtosis........................................................................................................................... 33
2.2.2. Diagrama...................................................................................................................... 38
PASO 3: Agrupar los valores que tengan la misma amplitud = ancho de la clase...................... 46
2.4.3. Moda............................................................................................................................... 59
1. DATOS AGRUPADOS
1.1.1. Población
“Se considera que la población es infinita cuando supera los 100 000 individuos”
1.1.2. Muestra
El mejor resultado para un proceso estadístico sería estudiar a toda la población. Pero esto
generalmente resulta imposible, ya sea porque supone un coste económico alto o porque
requiere demasiado tiempo.
Los valores “p” y “q” cuando se desconocen, se deben asumir valores de 0.5 para
cada uno.
La selección del nivel de confianza, dependerá del tipo de estudio. Cuando existen
características de difícil predicción, o a su vez, se requiere tener un nivel alto de confianza
en los datos, se debe usar un porcentaje alto, como el 99%.
Se trabaja con niveles de confianza bajos (80% - 90%) cuando se intuyen previamente
los resultados, debido a la alta posibilidad de anticipar resultados, ya existen
investigaciones previas que describen el comportamiento de las variables, se sabe que un
tamaño de muestra reducido no afectará la veracidad del estudio.
Una variable estadística es el conjunto de valores que puede tomar cierta característica de
la población sobre la que se realiza el estudio estadístico y sobre la que es posible su
medición.
Estas variables pueden ser: la edad, el peso, las notas de un examen, los ingresos
mensuales, las horas de sueño de un paciente en una semana, el precio medio del alquiler
en las viviendas de un barrio de una ciudad, etc.
Las variables estadísticas se pueden clasificar por diferentes criterios. Según su medición
existen dos tipos de variables:
1.2.1. Cualitativa
Variable cualitativa o categórica son las variables que pueden tomar como valores
cualidades o categorías.
Ejemplos:
1.2.2. Cuantitativas
Ejemplos:
Las variables cuantitativas se clasifican según el número de valores que puede tomar la
variable.
Variable dependiente: Es una variable cuyos valores dependen de los valores que
tome otra variable. Se representa en el eje de ordenadas (y).
En una función puede haber combinación de los dos tipos. Por ejemplo, el capital
invertido por una federación de una especialidad atlética de un país ante un campeonato
Ejemplos
Se realiza un estudio estadístico sobre la relación de los pacientes que tienen asma
respecto a ciertas variables también estudiadas. Suponemos que existe una variable
binaria en el estudio que indica si los individuos son o no fumadores. El investigador
puede establecer la hipótesis de que el tabaco influye en los pacientes generando el
asma. Utilizaría la variable “fumador” como variable independiente para confirmar
su relación con la variable dependiente “asma”.
En un estudio estadístico realizado en un instituto se intenta hacer ver a los alumnos
que estudiar día a día influye positivamente en las notas obtenidas. Se considera
como variable independiente (o explicativa) la variable “promedio de horas de
estudio” y como variable dependiente las “notas obtenidas por cada alumno”.
Resumen
- Variable cualitativa ordinal: Cuasi cuantitativa. No numérica pero existe orden. Ej: Oro
– plata – bronce; Sobresaliente – MB – B – R.
- Variable Discreta: Número finito de valores, entre dos valores cualesquiera de una
característica.
- Variable continua: Número infinito de valores, entre dos valores cualesquiera de una
característica.
Las medidas de tendencia central (o de centralización) son medidas que tienden a localizar
en qué punto se encuentra la parte central de un conjunto ordenado de datos de una
variable cuantitativa.
La moda (Mo(X)) es el valor más repetido del conjunto de datos, es decir, el valor cuya
frecuencia relativa es mayor. En un conjunto puede haber más de una moda.
a) 2, 3, 3, 4, 4, 4, 5, 5 Mo = 4
b) 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo = 1, 5, 9 Multimoda
a) 2, 3, 4, 4, 5, 5, 5, 6, 6 Me = 5
̅)
1.3.3. Media aritmética (𝐗
Es decir:
Todos los elementos del conjunto tienen que ser mayores que cero. Si algún elemento
fuese cero (Xi=0), entonces la MG sería 0 aunque todos los demás valores estuviesen
alejados del cero.
La media geométrica es útil para calcular medias de porcentajes, tantos por uno,
puntuaciones o índices. Tiene la ventaja de que no es tan sensible como la media a los
valores extremos.
La media armónica no tiene un uso muy extenso en el mundo científico. Suele utilizarse
principalmente para calcular la media de velocidades, tiempos o en electrónica.
Cuanto más grande sea el peso de un elemento, más importante se considera que es éste.
La media ponderada tiene numerosas aplicaciones, por ejemplo, la nota de una asignatura
donde el examen final tiene un peso mayor al de un trabajo. O en el cálculo del IPC
(Índice de Precios de Consumo). El IPC es un indicador de los precios de los bienes y
servicios básicos que consume la población. Para calcularlo, se otorga pesos a los
diferentes bienes (pan, fruta, vivienda,…) y se calcula la media ponderada.
La media aritmética es un caso particular de media ponderada, en la que todos los pesos
son uno, ya que a todos los elementos se les otorga la misma importancia.
Existe una relación de orden entre cuatro tipos de media. En esta relación se excluye la
media ponderada porque depende de los pesos. Sean:
H la media armónica
MG la media geométrica
x la media aritmética
RMS la media cuadrática
Entonces:
En esta relación, solamente se cumple la igualdad cuando todos los datos sean iguales,
es decir si: x1 = x2 = x3 =… = xN.
1.4.1. Rango
Con el IQR podremos elaborar los diagramas de caja, que es un instrumento muy visual
para evaluar la dispersión de una distribución.
La varianza (S2) mide la dispersión de los datos de una muestra respecto a la media,
calculando la media de los cuadrados de las distancias de todos los datos.
Al elevar las diferencias al cuadrado se garantiza que las diferencias absolutas respecto a
la media no se anulan entre sí. Además, resaltan los valores alejados.
Siempre se cumple que la varianza es mayor o igual que cero (S2 ≥ 0). La varianza es
cero cuando todos los datos son el mismo (ejemplo: {1, 1, 1, 1, 1}).
∑𝑁
𝑖=1(𝑥𝑖 − 𝑥̅ )
2
𝜎= √
𝑁
∑𝑁
𝑖=1(𝑥𝑖 − 𝑥̅ )
2
𝑆= √
𝑁−1
Ej. Encontrar la desviación estándar de la muestra para los datos: 5, 5, 20, 35, 40, 40, 45
a) Método directo:
(5 − 27,1429)2 + (5 − 27,1429)2 + (20 − 27,1429)2 + (35 − 27,1429)2 + (40 − 27,1429)2 + (40 − 27,1429)2 + (40 − 27,1429)2
𝑆= √
7−1
1742,8570
𝑆=√ = √290,4762 = 17,04
6
b) Método descompuesto:
N X (Xi - ̅
X) (𝑋𝑖 − 𝑋̅)2 ∑
1742,8570 1742,8570
𝑆= √ = √ = √290,4762 = 17,04
7−1 6
Para interpretar fácilmente el coeficiente, podemos multiplicarlo por cien para tenerlo
en tanto por cien.
Los cuartiles son los tres valores que dividen una serie de datos ordenada en cuatro
porciones iguales. El primer cuartil (Q1) deja a la izquierda el 25% de los datos. El
segundo (Q2) deja a izquierda y derecha el 50% y coincide con la mediana. El tercero
(Q3) deja a la derecha el 25% de valores. Los tres cuantiles son:
Consideración: Se suele hablar de cuatro cuartiles, sin embargo el último cuartil en este
caso, representaría el último dato.
Q1 Q2 Q3 Q4
25% 50% 75% 100%
D1 D2 D3 D4 D5 D6 D7 D8 D9 D10
10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
El percentil es una medida de posición no central. Los percentiles Pi son los 99 puntos
que dividen una serie de datos ordenada en 100 partes iguales, es decir, que contienen el
mismo número de elementos cada una. El percentil 50 es la mediana.
Los percentiles están pensados para conjuntos de elementos de más de cien elementos.
1.5.4. Aplicación
Ej. Dado el siguiente conjunto de datos: 22, 49, 4, 16, 49, 90, 91, 15, 17, 9. Encontrar.
Antes de resolver, ordenar los datos de menor a mayor valor. Después, se debe encontrar
la posición con la fórmula:
%
𝜌= ∗𝑁
100
Donde:
𝜌: Es la posición que se desea encontrar.
%: Es el valor porcentual que representa el cuartil, decil, o percentil buscado.
N: Número de datos.
100: Valor constante.
Paso 1: ordenar.
N 4 9 15 16 17 22 49 49 90 91
𝜌 1 2 3 4 5 6 7 8 9 10
𝑄1
𝜌= ∗𝑁
100
25
𝜌= ∗ 10
100
𝜌 = 2,5
La posición 2,5 índica que se pueden tomar las posiciones 2 o 3, sin embargo se aconseja
tomar el valor de la derecha. Para este ejemplo se tomará el valor que se encuentra en la
posición tres.
N 4 9 15 16 17 22 49 49 90 91
𝜌 1 2 3 4 5 6 7 8 9 10
Q1 = 15.
a) Decil 3
Hallar la posición:
𝐷3 30
𝜌 = 100 ∗ 𝑁 → 𝜌 = 100 ∗ 10 → 𝜌=3
N 4 9 15 16 17 22 49 49 90 91
𝜌 1 2 3 4 5 6 7 8 9 10
Hallar la posición
𝑃20 20
𝜌= ∗𝑁 → 𝜌 = 100 ∗ 10 → 𝜌=2
100
N 4 9 15 16 17 22 49 49 90 91
𝜌 1 2 3 4 5 6 7 8 9 10
𝑄3 75
Para Q3 → 𝜌 = 100 ∗ 𝑁 → 𝜌 = 100 ∗ 10 → 𝜌 = 7,5
𝐷1 10
Para D1 → 𝜌 = 100 ∗ 𝑁 → 𝜌 = 100 ∗ 10 → 𝜌=1
𝑃99 99
Para P99 → 𝜌 = 100 ∗ 𝑁 → 𝜌 = 100 ∗ 10 → 𝜌 = 9,9
N 4 9 15 16 17 22 49 49 90 91
𝜌 1 2 3 4 5 6 7 8 9 10
1.6.1. Asimetría
El coeficiente de asimetría de Bowley CAB toma como referencia los cuartiles para
determinar si la distribución es simétrica o no. Para aplicar este coeficiente, se supone
que el comportamiento de la distribución en los extremos es similar. Sea el conjunto
X=(x1, x2,…, xN), la asimetría de Bowley es:
Este coeficiente indica la cantidad de datos que hay cercanos a la media, de manera que
a mayor grado de curtosis, más escarpada (o apuntada) será la forma de la curva.
En ocasiones, se requiere trabajar con una cantidad de datos que no es fácil de analizar.
Entre más datos existen, mayor es el grado de complejidad que presentan para entender
su comportamiento. Por eso, es necesario agruparlos para simplificar su comprensión.
Las frecuencias de cada elemento se pueden expresar tanto absolutas (número total de
apariciones) como relativas (proporción de apariciones).
Si los datos provienen de una variable cuantitativa o existen muchas categorías, los datos
se suelen agrupar en clases. Cada clase, que tiene un intervalo o amplitud constante, está
representado por su marca de clase, que es el punto medio de la misma.
La frecuencia absoluta acumulada (Ni) de un valor Xi del conjunto (X1, X2,…, XN) es la
suma de las frecuencias absolutas de los valores menores o iguales a Xi, es decir:
Si se multiplica la frecuencia relativa por cien se obtiene el porcentaje (tanto por cien %).
Es una herramienta que permite ordenar los datos de manera que se presentan
numéricamente las características de la distribución de un conjunto de datos o muestra.
Los gráficos llaman la atención del lector y hacen que de un vistazo éste tenga una mayor
comprensión de los datos.
Un buen gráfico puede captar al lector para que a continuación lea todo el estudio. Si un
estudio se compone únicamente de texto y tablas, posiblemente no todos los lectores lean
el estudio.
El gráfico lineal (gráfico de líneas o diagrama lineal) se compone de una serie de datos
representados por puntos, unidos por segmentos lineales. Mediante este gráfico se puede
comprobar rápidamente el cambio de tendencia de los datos.
2.2.2. Diagrama
Según la RAE (Real Academia Española), un diagrama es un dibujo geométrico que sirve
para demostrar una proposición, resolver un problema o representar de una manera
gráfica la ley de variación de un fenómeno.
Existen diferentes tipos de diagramas, de los que se pueden destacar los siguientes:
Las barras pueden ser horizontales o verticales, según donde se reflejen los valores
de la variable.
Todas las barras deben tener el mismo ancho y no deben superponerse las unas con
las otras.
El diagrama de Pareto (también llamado diagrama ABC) fue creado por Vilfredo Pareto,
para representar datos cualitativos. El italiano comprobó que el 20% de la población
italiana acaparaban el 80% de riquezas y propiedades.
El principio de Pareto afirma que el 20% de las causas vitales originan alrededor del 80%
de los efectos. O visto desde el punto de vista matemático, que el 20% de las categorías
representan el 80% de las observaciones.
Un rectángulo (caja) delimitado por el primer y tercer cuartil (Q1 y Q3). Dentro de la
caja una línea indica dónde se encuentra la mediana (segundo cuartil Q2)
Dos brazos, uno que empieza en el primer cuartil y acaba en el mínimo, y otro que
empieza en el tercer cuartil y acaba en el máximo.
Los datos atípicos (o valores extremos) que son los valores distintos que no cumplen
ciertos requisitos de heterogeneidad de los datos.
2.2.3. Histograma
También cabe emplear variables cualitativas ordinales, siendo necesario que el número
de datos sea alto.
2.2.5. Pictograma
𝐾 = 1 + 3,33𝑙𝑜𝑔(𝑛)
Siendo:
n: Total de datos.
𝐾 = 1 + 3,33𝑙𝑜𝑔(20)
𝐾 = 5,33
Por lo tanto, se pueden usar cinco o seis clases. Para este ejemplo se crearán seis clases.
Se recomienda aproximar al siguiente valor, cuando resultan resultados con decimales,
para que el procesamiento gráfico, como histogramas o polígono de frecuencias, no
tengan pérdidas de información.
Nota: algunos autores consideran válido el cálculo de K = √𝑛, ya que se obtiene un valor
similar al de la fórmula de Sturges.
PASO 3: Agrupar los valores que tengan la misma amplitud = ancho de la clase.
Amplitud de la clase, es la diferencia entre el límite inferior y superior de la clase
(intervalo).
𝑅𝑎𝑛𝑔𝑜
𝐶=
𝑁º 𝑐𝑙𝑎𝑠𝑒𝑠
9,6
𝐶=
6
1,2 + 1,6 = 2,8 que es el valor indicado para ese intervalo. El símbolo de paréntesis se usa
dentro de los intervalos, mientras que el corchete es necesario cuando para indicar si los
valores inicial y final se incluyen o no en el ancho de la clase.
En la tabla.
Como ya se tienen construido los intervalos, se deben observar los datos del ejercicio y
comprobar a qué intervalo pertenecen los valores. Se cuenta la cantidad de datos que se
encuentran en el intervalo y se coloca ese valor en (fi).
Para el primer intervalo, se inicia en el valor 1,2 (incluido) y llega hasta 2,8 (no incluido),
por lo tanto, los valores del ejercicio que están dentro de este ancho de clase son, 1,2; 1,4;
1,5; 1,6; 1,6; 2,1; 2,7; 2,3; 2,5. Es decir, nueve valores.
Nota: el 2,8 no se incluye en el primer intervalo (clase), debido a que está colocado como
inicio del segundo intervalo (clase).
Para las demás clases (intervalos), se debe repetir el proceso de contar la cantidad de
valores que se encuentran en el intervalo analizado, y colocar el conteo en la columna
(fi).
Clase 1: 1,2; 1,4; 1,5; 1,6; 1,6; 2,1; 2,7; 2,3; 2,5 = 9 datos.
En la tabla.
Nótese que a partir del primer valor de Xi, se puede sumar la constante 1,6. Debido a que
todos intervalos tienen el mismo ancho. Esta constante se calcula del valor final – valor
inicial de cualquier intervalo. Ej.
2 + 1,6 = 3,6
8,4 + 1,6 = 10
Dando como resultado los mismos valores del anterior cálculo, demostrando que es igual
de válido.
9 + 2 = 11
11 + 3 = 14
14 + 1 = 15
15 + 1 = 16
16 + 4 = 20
Se inicia dividiendo el primer valor de la columna (fi) entre el valor final de la columna
(Fi) que representa el total acumulado. Es proceso se repite con cada valor de la (fi) divido
para siempre para el valor final de Fi.
En el ejemplo.
9 / 20 = 0,45
2 / 20 = 0,1
3 / 20 = 0,15
1 / 20 = 0,05
1 / 20 = 0,05
4 / 20 = 0,2
Se coloca el primer valor de la columna (hi) en la columna (Hi). Con este dato se suma el
siguiente valor de la columna (hi) y el resultado se coloca en la siguiente columna de (Hi).
0,8 + 0,2 = 1
El valor 1 representa el 100% de los datos. Estos valores se colocan en la columna (Hi).
Para el histograma:
El eje horizontal se construye con las marcas de clase. Estos valores determinan el ancho
de las columnas. Para el ejemplo, como el ancho de la clase calculado fue 1,6 entonces
las columnas tendrán de ancho 1,6 unidades.
Como se crearon seis clases significa que se crearán 6 columnas. Si cada columna tiene
un ancho de 1,6 unidades y todas van juntas, sin espacios entre sí, se tendrá un eje
horizontal de 1,6 * 6 = 9,6 unidades (se recomienda aumentar el eje a 10).
El eje vertical es construido con la frecuencia (fi), tomando su valor más alto como
referencia para el alto de la columna. Para el ejemplo, el mayor valor de la frecuencia
absoluta (fi) es nueve. Por lo tanto el alto del eje será de mínimo 9 unidades (se
recomienda 10).
Las recomendaciones de aumentar el tamaño de los ejes, son para que se puedan observar
las columnas completamente, sin tener problemas de escala.
El histograma está compuesto por barras juntas, mientras que el polígono de frecuencias
se muestra con la línea naranja.
HISTOGRAMA
POLÍGONO DE
FRECUENCIAS
DIAGRAMA
DE BARRAS
∑ 𝑌𝑖 ∗ 𝑓𝑖
𝑥̅ =
𝑛
n: tamaño de la muestra
Ejemplo.
PASO 1.
PASO 2.
Interpretación:
La ganancia promedio de 40 comerciantes es de 435 dólares.
2.4.2. Mediana
Para encontrar la mediana, se debe dividir 𝑛/2.
Cuando este valor no coincide con Fi, entonces aplicar la siguiente fórmula.
𝑛
− 𝐹𝑖−1
𝑀𝑒 = 𝐿𝑖 + 2 ∗ 𝑡𝑖
𝑓𝑖
Dónde:
Ejemplo:
Edad Marca de la clase Frecuencia absoluta Frecuencia Acum.
Xi fi Fi
0; 10 5 3 3
10; 20 15 6 9
20; 30 25 7 16
30; 40 35 12 28
40; 50 45 3 31
PASO 2.
Si el valor de 𝑛/2 no coincide con ningún valor de Fi, aplicar la fórmula dada.
Como el valor de 15,5 se encuentra dentro de Fi = 16, ya que este valor lo contiene dentro
de su rango, se debe considerar esta fila como fila de trabajo de la cual se tomarán los
datos para ingresar en la fórmula.
PASO 3.
Aplicar la fórmula.
𝑛
− 𝐹𝑖−1
𝑀𝑒 = 𝐿𝑖 + 2 ∗ 𝑡𝑖
𝑓𝑖
31
−9
𝑀𝑒 = 20 + 2 ∗ 10
7
𝑀𝑒 = 29,285
2.4.3. Moda
Para encontrar la moda, se debe localizar el intervalo con mayor frecuencia absoluta.
Aplicar la siguiente fórmula.
𝑓𝑖 − 𝑓𝑖−1
𝑀𝑜 = 𝐿𝑖 + ∗ 𝑡𝑖
(𝑓𝑖 − 𝑓𝑖−1 ) + (𝑓𝑖 − 𝑓𝑖+1 )
Dónde:
Li: Límite inferior del intervalo de trabajo.
fi: Frecuencia absoluta simple del intervalo de trabajo.
𝑓𝑖−1: Frecuencia absoluta simple del intervalo previo a la fila de trabajo.
𝑓𝑖+1: Frecuencia absoluta simple del intervalo posterior a la fila de trabajo.
ti: Ancho del intervalo de trabajo.
Ejemplo.
PASO 1.
Localizar la fila de trabajo. Para hacerlo, determinar el intervalo con mayor frecuencia
absoluta.
Este valor al ser el más alto de las frecuencias fi, indica que esa es la fila de trabajo.
PASO 2.
Aplicar la fórmula.
𝑓𝑖 − 𝑓𝑖−1
𝑀𝑜 = 𝐿𝑖 + ∗ 𝑡𝑖
(𝑓𝑖 − 𝑓𝑖−1 ) + (𝑓𝑖 − 𝑓𝑖+1 )
12 − 7
𝑀𝑜 = 30 + ∗ 10
(12 − 7) + (12 − 3)
𝑀𝑜 = 33,6
2.5.1. Deciles
Para calcular la posición se debe aplicar la fórmula:
𝑁∗𝐾
10
Donde:
𝑁∗𝑘
( 10 ) − 𝐹𝑖−1
𝐷𝑘 = 𝐿𝑖 + ∗ 𝑡𝑖
𝑓𝑖
Donde:
Ejemplo.
Valores fi Fi
50; 60 8 8
60; 70 10 18
70; 80 16 34
80; 90 14 48
90; 100 10 58
100; 110 5 63
110; 120 2 65
PASO 1.
Localizar la posición:
𝑁∗𝐾
10
65 ∗ 1
10
Posición: 6,5
Valores fi Fi
50; 60 8 8 (el valor 6,5 está dentro de 8)
60; 70 10 18
70; 80 16 34
80; 90 14 48
90; 100 10 58
100; 110 5 63
110; 120 2 65
PASO 2.
Aplicar la fórmula.
𝑁∗𝑘
( 10 ) − 𝐹𝑖−1
𝐷𝑘 = 𝐿𝑖 + ∗ 𝑡𝑖
𝑓𝑖
Nota: Como no existe la fila previa 𝐹𝑖−1 se debe colocar cero en la fórmula.
𝐷1 = 58,125
PASO 1: Posición
𝑁∗𝑘 65 ∗ 2
= = 13
10 10
𝑁∗𝑘
( 10 ) − 𝐹𝑖−1
𝐷𝑘 = 𝐿𝑖 + ∗ 𝑡𝑖
𝑓𝑖
𝐷2 = 65
2.5.2. Cuartiles
Para calcular la posición se debe aplicar la fórmula:
𝑁∗𝐾
4
Donde:
𝑁∗𝑘
( 4 ) − 𝐹𝑖−1
𝑄𝑘 = 𝐿𝑖 + ∗ 𝑡𝑖
𝑓𝑖
Donde:
2.5.3. Percentiles
𝑁∗𝐾
100
𝑁∗𝑘
( 100 ) − 𝐹𝑖−1
𝑃𝑘 = 𝐿𝑖 + ∗ 𝑡𝑖
𝑓𝑖
Donde:
Ejemplo.
Valores fi Fi
50; 60 8 8
60; 70 10 18
70; 80 16 34
80; 90 14 48
90; 100 10 58
100; 110 5 63
110; 120 2 65
a) Cuartil 1
Valores fi Fi
50; 60 8 8 (𝐹𝑖−1 )
60; 70 ti = 70-60=10 10 fi 18 Fi
70; 80 16 34
80; 90 14 48
90; 100 10 58
100; 110 5 63
110; 120 2 65
16,25 − 8
𝑄1 = 60 + ∗ 10
10
𝑄1 = 68,25
b) Percentil 40
𝑁∗𝑘 65 ∗ 40
= = 26
100 100
26 − 18
𝑃40 = 70 + ∗ 10
16
𝑃40 = 75