Professional Documents
Culture Documents
Una de las ramas de la Estadística más accesible a la mayoría de la población es la Descriptiva. Esta parte
se dedica única y exclusivamente al ordenamiento y tratamiento mecánico de la información para su
presentación por medio de tablas y de representaciones gráficas, así como de la obtención de algunos
parámetros útiles para la explicación de la información.
La Estadística Descriptiva es la parte que conocemos desde los cursos de educación primaria, que se
enseña en los siguientes niveles y que, por lo general, no pasa a ser un análisis más profundo de la
información. Es un primer acercamiento a la información y, por esa misma razón, es la manera de
presentar la información ante cualquier lector, ya sea especialista o no. Sin embargo, lo anterior no quiere
decir que carezca de metodología o algo similar, sino que, al contrario, por ser un medio accesible a la
mayoría de la población humana, resulta de suma importancia considerar para así evitar malentendidos,
tergiversaciones o errores.
El concepto de infinita sólo existe en teoría pues en la práctica nos encontraremos aplicación a poblaciones de
elementos infinitos: Estrellas del universo (tiempo y costo). Se elige una MUESTRA lo suficientemente
representativa de la población.
Muestreo Aleatorio
Una muestra se dice que es extraída al azar cuando la manera de selección es tal, que cada
elemento de la población tiene igual oportunidad de ser seleccionado.
Una muestra aleatoria es también llamada una muestra probabilística son generalmente preferidas
por los estadísticos porque la selección de las muestras es objetiva y el error muestral puede ser
medido en términos de probabilidad bajo la curva normal.
Los tipos comunes de muestreo aleatorio son el muestreo aleatorio simple, muestreo sistemático,
muestreo estratificado y muestreo de conglomerados.
Parámetros aleatorios
Existen medidas para realizar descripciones cuantitativas de los conjuntos de datos, o poblaciones, y
de sus muestras, diferenciándose entre ellas las que se refieren a las mismas poblaciones y a las
muestras.
Para el caso de las POBLACIONES, las medidas que las describen se denominan PARÁMETROS,
y suelen estar representadas con letras griegas (por ejemplo u y O).
Por otro lado, para el caso de aquellas medidas que describen a una MUESTRA se les llama estadísticos o
estimadores, y son representados por letras de nuestro alfabeto (por ejemplo, x o s).
3.2 Descripción de datos: Datos agrupados y datos no agrupados, Frecuencia de
clase, Frecuencia relativa, Punto medio, Límites de clases.
¿A qué se refiere esto? Cuando la muestra que se ha tomado de la población o proceso que se desea
analizar, es decir, tenemos menos de 20 elementos en la muestra, entonces estos datos son analizados sin
necesidad de formar clases con ellos y a esto es a lo que se le llama tratamiento de datos no agrupados.
TRATAMIENTO PARA DATOS AGRUPADOS.
Cuando la muestra consta de 30 o más datos, lo aconsejable es agrupar los datos en clases y a partir de
estas determinar las características de la muestra y por consiguiente las de la población de donde fue
tomada.
Antes de pasar a definir cuál es la manera de determinar las características de interés (media, mediana,
moda, etc.) cuando se han agrupado en clases los datos de la muestra, es necesario que sepamos como
se agrupan los datos.
b. Establecer el número de clases (k) en que se van a agrupar los datos tomando como base para esto la
siguiente tabla.
El uso de esta tabla es uno de los criterios que se puede tomar en cuenta para establecer el número de
clases en las que se van a agrupar los datos, existen otros para hacerlo.
Rango
C=
k
d. Formar clases y agrupar datos.
Para formar la primera clase, se pone como límite inferior de la primera clase un valor un poco menor que
el dato menor encontrado en la muestra y posteriormente se suma a este valor C, obteniendo de esta
manera el límite superior de la primera clase, luego se procede a obtener los límites de la clase siguiente y
así sucesivamente.
OTROS TEMAS PARA ENTENDER LO UTIL DE TENER DATOS AGRUPADOS Y NO AGRUPADOS,ASÍ
COMO TAMBIÉN LOS DIFERENTES TIPOS DE FRECUENCIAS.
Es aquella distribución que indica las frecuencias con que aparecen los datos estadísticos, desde el menor de
ellos hasta el mayor de ese conjunto sin que se haya hecho ninguna modificación al tamaño de las unidades
originales. En estas distribuciones cada dato mantiene su propia identidad después que la distribución de
frecuencia se ha elaborado. En estas distribuciones los valores de cada variable han sido solamente
reagrupados, siguiendo un orden lógico con sus respectivas frecuencias.
Es aquella distribución en la que la disposición tabular de los datos estadísticos se encuentran ordenados en
clases y con la frecuencia de cada clase; es decir, los datos originales de varios valores adyacentes del
conjunto se combinan para formar un intervalo de clase. No existen normas establecidas para determinar
cuándo es apropiado utilizar datos agrupados o datos no agrupados; sin embargo, se sugiere que cuando el
número total de datos (N) es igual o superior 50 y además el rango o recorrido de la serie de datos es mayor
de 20, entonces, se utilizará la distribución de frecuencia para datos agrupados, también se utilizará este tipo
de distribución cuando se requiera elaborar gráficos lineales como el histograma, el polígono de frecuencia o
la ojiva.
La razón fundamental para utilizar la distribución de frecuencia de clases es proporcionar mejor comunicación
acerca del patrón establecido en los datos y facilitar la manipulación de los mismos. Los datos se agrupan en
clases con el fin de sintetizar, resumir, condensar o hacer que la información obtenida de una investigación
sea manejable con mayor facilidad.
El centro de la clase, es el volar de los datos que se ubica en la posición central de la clase y representa todos
los demás valores de esa clase. Este valor se utiliza para el calculo de la media aritmética.
Frecuencia de clase
La frecuencia de clase se le denomina frecuencia absoluta y se le designa con las letras fi. Es el número total
de valores de las variables que se encuentran presente en una clase determinada, de una distribución de
frecuencia de clase.
Frecuencia Relativa
La frecuencia relativa es aquella que resulta de dividir cada uno de los fi de las clases de una distribución de
frecuencia de clase entre el número total de datos(N) de la serie de valores. Estas frecuencias se designan
con las letras fr; si cada fr se multiplica por 100 se obtiene la frecuencia relativa porcentual (fr %).
Frecuencias acumuladas
Las frecuencias acumuladas de una distribución de frecuencias son aquellas que se obtienen de las sumas
sucesivas de las fi que integran cada una de las clases de una distribución de frecuencia de clase, esto se
logra cuando la acumulación de las frecuencias se realiza tomando en cuenta la primera clase hasta alcanzar
la ultima. Las frecuencias acumuladas se designan con las letras fa. Las frecuencias acumuladas pueden ser
menor que (fa que) y frecuencias acumuladas mayor que (faque).
Frecuencia acumulada relativa
La frecuencia acumulada relativa es aquella que resulta de dividir cada una de las fa de las diferentes clases
que integran una distribución de frecuencia de clase entre el número total de datos (N) de la serie de valores,
estas frecuencias se designan con las letras far. Si las far se multiplican por 100 se obtienen las frecuencias
acumuladas relativas porcentuales y las mismas se designan así: far %
Se les llama medidas de tendencia central a la media aritmética, la mediana, la media geométrica, la moda,
etc. debido a que al observar la distribución de los datos, estas tienden a estar localizadas generalmente en
su parte central. A continuación definiremos algunas medidas de tendencia central y la forma de calcular su
valor.
Media aritmética (x ). También se le conoce como promedio ya que es el promedio de las lecturas o
mediciones individuales que se tienen en la muestra, se determina con la fórmula siguiente:
n
− ∑x i
x = i =1
n donde:
x = media aritmética
xi = dato i
Ejemplos:
1. Se han tomado como muestra las medidas de seis cables usados en un arnés para lavadora, las
cuales son; 15.2 cm, 15.0, 15.1, 15.2, 15.1 y 15.0, determine su media aritmética.
Solución:
G = n x1 * x2 * ...* xn Donde:
G = media geométrica
xi = dato i
Ejemplo:
1. Las siguientes temperaturas han sido tomadas de un proceso químico, 13.4oC, 12.8, 11.9, 13.6,
determine la temperatura promedio de este proceso.
Solución: G=
4
13.4 x12.8 x11.9 x13.6 = 4 27758.7968 = 12.9077 oC
Media aritmética ponderada ( xw ). Esta media se usa cuando el peso que tiene cada uno de los datos de la
muestra es diferente, se calcula de la siguiente manera:
k
∑ wi xi
xw = i =1
k
∑ wi
i =1
donde:
xi = dato i
Media armónica (H). La media armónica se define como el recíproco del promedio de los recíprocos de cada
uno de los datos que se tienen en la muestra, y
1 n
H = n
= n
1 / n∑1 / xi ∑1 / xi
i =1 i =1
Ejemplo: Determine la media armónica de los siguientes datos, 3.1, 2.8, 2.84, 3.05, 3.09
5
H = =
Solución: 1 / 3.1 + 1 / 2.8 + 1 / 2.84 + 1 / 3.05 + 1 / 3.09
5 5
= = = 2.9703
0.3226 + 0.3571 + 0.3521 + 0.3279 + 0.3236 1.6833
Mediana (xmed). La mediana es aquel valor que se encuentra en la parte central de los datos que se tienen en
la muestra una vez que estos han sido ordenados según su valor o magnitud. Para calcular la mediana se
presentan dos casos:
Ejemplo:
Los siguientes datos son las mediciones obtenidas de un circuito utilizado en un arnés de lavadora; se toman
como muestra siete circuitos y sus mediciones son: 11.3, 11.2, 11.5, 11.2, 11.2, 11.4, 11.5 cm.
Moda (xmod). La moda se define como aquel valor o valores que más se repiten o que tienen mayor
frecuencia entre los datos que se han obtenido en una muestra, la muestra de una población nos genera la
distribución de los datos una vez que estos se han graficado y en esta gráfica es posible observar la moda o
modas de la misma, es por esto que una distribución de datos puede ser amodal (carece de moda), unimodal
(tiene una sola moda), bimodal (tiene dos modas) o polimodal (tiene más de dos modas).
Medidas de Dispersión.
Cuando se tiene una muestra de datos obtenida de una población cualquiera, es importante determinar sus
medidas de tendencia central así como también es básico el determinar que tan dispersos están los datos en
la muestra, por lo que se hace necesario determinar su rango, la varianza, la desviación estándar, etc., ya que
una excesiva variabilidad o dispersión en los datos indica la inestabilidad del proceso en análisis en la mayoría
de los casos.
Cuando la muestra consta de 30 o más datos, lo aconsejable es agrupar los datos en clases y a partir de
estas determinar las características de la muestra y por consiguiente las de la población de donde fue tomada.
Antes de pasar a definir cuál es la manera de determinar las características de interés (media, mediana,
moda, etc.) cuando se han agrupado en clases los datos de la muestra, es necesario que sepamos como se
agrupan los datos.
*Determinar el rango o recorrido de los datos. Rango = Valor mayor – Valor menor
Tipos de frecuencia
Frecuencia absoluta.-La frecuencia absoluta es el número de veces que aparece un determinado valor en un
estudio estadístico. Se representa por fi. La suma de las frecuencias absolutas es igual al número total de
datos, que se representa por N.
Frecuencia relativa
La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el número total de
datos. Se puede expresar en tantos por ciento y se representa por ni.
Frecuencia acumulada
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al
valor considerado.
Muestreo
El paso siguiente que debe resolver el investigador es el del diseño y la elección de la muestra.
Ambas acciones está íntimamente unidas puesto que dependiendo del diseño que utilice el
investigador así será la elección de los sujetos de estudio. Los elementos, personas, fenómenos,
constituyen la muestra de la investigación. Estos elementos forman parte de un grupo de conceptos
básicos que conviene clarificar y que deben ser definidos en cada investigación.
Conceptos Básicos
Universo
Población
Muestra
3.9 HISTOGRAMA
El histograma es una gráfica de barras que permite describir el comportamiento de un conjunto de datos en
cuanto a su tendencia central, forma y dispersión. El histograma permite que de un vistazo se pueda tener
una idea objetiva sobre la calidad de un producto, el desempeño de un proceso o el impacto de una acción
de mejora. La correcta utilización del histograma permite tomar decisiones no solo con base en la media, sino
también con base en la dispersión y formas especiales de comportamiento de los datos. Su uso cotidiano
facilita el entendimiento de la variabilidad y favorece la cultura de los datos y los hechos objetivos
CONSTRUCCION DE UN HISTOGRAMA.
Para decidir correctamente y detectar posibles anormalidades en los datos se procede a lo siguiente para
construir un histograma:
Paso 1. Determinar el rango de datos.La diferencia entre el dato máximo y el dato mínimo.
Paso 2. Obtener el numero de clases (NC) o barras.Ninguno de ellos es exacto, esto depende de cómo sean
los datos y cuantos sean . Un criterio usado es del numero de clases, debe ser aprox. Igual a la raíz cuadrada
del numero de datos.
Paso3. Establecer la longitud de clase (LC).Se establece de tal manera que el rango pueda ser cubierto en
su totalidad por NC. Una forma directa de obtener la LC es dividiendo el rango entre el numero de clases,
LC= R/NC.
Paso 4. Construir los intervalos de clase. Resultan de dividir el rango (original o ampliado) en NC e intervalos
de longitud LC.
Paso 5. Obtener la frecuencia de cada clase. Se cuentan los datos que caen en cada intervalo de clase.
Se grafican en barras, en las que su base es el intervalo de clase y la altura sean las frecuencias de las
clases
EJEMPLO :
A una fabrica de envases de vidrio, un cliente le está exigiendo que la capacidad de cierto tipo de botella sea
de13 ml., con una tolerancia de más menos 1 ml.. La fábrica establece un programa de mejora de calidad
para que las botellas que se fabriquen cumplan con los requisitos del cliente.
Muestreo = 11,12,13,12,13,14,14,15,11,12,13,12,14,15,11,12,16,16,14,13,14,14,13,15,15
• 1. Rango : 16 –11 = 5
• 25 = 5 Clase Intervalo Frecuencia Frec. Relativa
• 3. 5/5 = 1
1 11,12 3 0,12
2 12,13 5 0,25
3 13,14 5 0,25
4 14,15 6 0,24
5 15,16 6 0,24
20 1,00