Professional Documents
Culture Documents
Introducción
Todo lo relacionado con la recolección, procesamiento, análisis e interpretación de datos
numéricos pertenece al terreno de la estadística.
La estadística es un método científico para analizar y recoger datos de un fenómeno
determinado con el fin de poder obtener conclusiones, emitir predicciones y tomar
decisiones.
Mediante la presentación ordenada de los datos observados en tabla y gráficos
estadísticos.
Reduciendo los datos observados a un pequeño número de medidas estadísticas
que permitirán la comparación entre diferentes series de datos.
Estimando la probabilidad de éxito que tiene cada una de las decisiones posibles.
El presente trabajo tiene como objetivo manejar el método estadístico, como una
herramienta para analizar y sacar conclusiones de una situación real elegida. También
comprende objetivos como manejar las técnicas y procedimientos necesarios para lograr
inferencias estadísticas, con variable aleatoria continua. Además adquirir dominio de las
técnicas específicas y mecanismos como así también la interpretación de los gráficos de
control, y control de calidad.
En el transcurso de este trabajo aplicamos las herramientas vistas durante el cursado de
la materia. En primer lugar se calcularon las medidas estadísticas, distribución normal, las
técnicas de regresión y correlación y finalmente nos introducimos en control de calidad.
1
UNIVERSIDAD NACIONAL DE CUYO
Facultad de Ciencias Aplicada a la industria-Final de estadística
Alumna: Verdugo, Lorena
Desarrollo
Conceptos básicos
2
UNIVERSIDAD NACIONAL DE CUYO
Facultad de Ciencias Aplicada a la industria-Final de estadística
Alumna: Verdugo, Lorena
h2=R(rango) / K
MUESTRA(n) 63
máximo 47,7 ºF
mínimo 22,4 ºF
rango R 25,3 ºF
Clases (k) 6,94 6
Amplitud(h2) 3,64668 5
Distribución de frecuencias
3
UNIVERSIDAD NACIONAL DE CUYO
Facultad de Ciencias Aplicada a la industria-Final de estadística
Alumna: Verdugo, Lorena
Frecuencia absoluta (ri): Es el número de veces que se presenta un determinado valor
dentro de los límites de cada intervalo. La suma total de todas las frecuencias absolutas
es el tamaño de la población (N) de elementos observados.
Frecuencia relativa (fi o yi): Es una proporción entre el número de veces que se repite un
dato y el tamaño de la población. En consecuencia, la suma de todas las frecuencias
relativas es siempre la unidad. Se obtiene dividiendo la frecuencia absoluta por el tamaño
de la población. Se representa por: fi=ri/N.
Frecuencia absoluta acumulada (Ni): es igual a la frecuencia absoluta de ese intervalo
más la suma de las frecuencias absolutas de las clases anteriores. Esta frecuencia
representa, cuando existe una relación de orden, el número de elementos de la población
que quedan por encima o por debajo del elemento cuyo valor se analiza, lo que implica
que pueden ser negativas o positivas.
Frecuencia relativa acumulada (Fi): Es igual a la suma de las frecuencias relativas de
todos los datos menores o iguales que dicho valor.
4
UNIVERSIDAD NACIONAL DE CUYO
Facultad de Ciencias Aplicada a la industria-Final de estadística
Alumna: Verdugo, Lorena
Histograma
27
FRECUENCIA ABSOLUTA
30
25 21
20
15
8
10
4
5 2 1
0
26 31 36 41 46 51
21 26 31 36 41 46
LIMITES
2- Polígono de frecuencias: Se presenta por un punto, cada par (xi, ri) o (xi, fi),
uniéndose mediante segmentos cada dos puntos consecutivos.
30
Polígono de frecuencia
FRECUENCIA ABSOLUTA
25
20
15
10
5
0
21 26 31 36 41 46 51 mayor
menor 21 26 31 36
LIMITES 41 46 51
3-OJIVAS
Una gráfica similar al polígono de frecuencias es la ojiva, pero esta se obtiene de aplicar
parcialmente la misma técnica a una distribución acumulativa.
5
UNIVERSIDAD NACIONAL DE CUYO
Facultad de Ciencias Aplicada a la industria-Final de estadística
Alumna: Verdugo, Lorena
La ojiva es una gráfica asociada a la distribución de frecuencias, en la cual en ella se
permite ver cuántas observaciones se encuentran por encima o debajo de ciertos valores,
en lugar de sólo exhibir los números asignados a cada intervalo.
La ojiva apropiada para información que presente frecuencias mayores que el dato que se
está comparando tendrá una pendiente negativa (hacia abajo y a la derecha) y en cambio
la que se asigna a valores menores, tendrá una pendiente positiva.
70
Gráfico de ojivas
60 63 61 63
60 59
frecuencia acumulada
50 52
40 38
30
25
20
10 11
2 3 4
0
26 31 36 41 46 51
21 26 31 36 41 46
limites
Medidas de distribución.
Si queremos comparar dos distribuciones de frecuencias, es necesario buscar una serie
de medidas que permitan diferenciar una distribución de otra de igual forma que un
cuerpo sólido se diferencia de otro en sus dimensiones o en cualquier otra característica
factible de medirse.
Por lo tanto la información suministrada por cada tabla puede resumirse en un conjunto de
medidas que permitan la comparación entre distribuciones de frecuencias
correspondientes a poblaciones diferentes.
Cada una de estas medidas debe cumplir la propiedad de proporcionar una única solución
para cada distribución de frecuencias.
6
UNIVERSIDAD NACIONAL DE CUYO
Facultad de Ciencias Aplicada a la industria-Final de estadística
Alumna: Verdugo, Lorena
1- Medidas de posición o tendencia central
Estas medidas permiten identificar una distribución midiendo el valor que toma la variable
en diversas posiciones singulares de la misma, es decir que proporcionan un único valor
que sustituye y puede representar a todos los valores de variable.
X
x i ri
N
Donde xim*ni es la frecuencia absoluta de cada intervalo multiplicada por la marca de la
clase.
La media es una medida apropiada de tendencia central para muchos conjuntos de datos,
pero se ve muy afectada, de manera desproporcionada, por los valores extremos de baja
frecuencia.
Otra forma de calcular la media, con los datos agrupados, es con la siguiente fórmula:
k
f i xi
X
i 1 n
Media Geométrica: De una serie de N números es la raíz enésima del producto de los
números elevados a su respectiva frecuencia y se utiliza para calcular promedios del tipo
tasa media.
Log X g
r log x i i
N
Xa
r
xi
i
º Me N (i 1)
Me Li * Ci
ri 7
UNIVERSIDAD NACIONAL DE CUYO
Facultad de Ciencias Aplicada a la industria-Final de estadística
Alumna: Verdugo, Lorena
n(i 1)
Mo Linf * Ci
n(i 1) n(i 1)
Si existen varios valores de variable con idéntica frecuencia y éstas además son las
mayores, se dirá que la distribución es PLURIMODAL.
8
UNIVERSIDAD NACIONAL DE CUYO
Facultad de Ciencias Aplicada a la industria-Final de estadística
Alumna: Verdugo, Lorena
ordenados. Ejemplo, el percentil de orden 15 deja por debajo al 15% de las
observaciones, y por encima queda el 85%.
Cuartiles: (4 partes iguales). Son los tres valores que dividen al conjunto de datos
ordenados en cuatro porciones iguales, son un caso particular de los percentiles,
correspondiendo a los percentiles 25, 50 y 75.
º Qs N (i 1) N 1 N 1
Qs Li 1 *h o
Q1 o
Q3 3 *
ri 4 4
CUARTILES
orden de cuartil qº1 16
cuartil 1 q1 40,375
orden de cuartil qº2 32
cuartil 2 q2 40,444
orden de cuartil qº3 48
cuartil 3 q3 43,407
orden de cuartil qº4 64
cuartil 4 q4 41,985
Interpretación
Q1: el 25% de los datos tienen una dureza menor a 40,375ºF y el 75% mayor a
40,375ºF.
Q3: el 75% de los datos tienen una dureza menor a 43,407ºF y el 25% mayor a
43,407ºF
2- Medidas de dispersión
Si los valores observados de la variable están muy concentrados alrededor de un
promedio, este es muy representativo, pero si aquellos valores están dispersos con
relación a un promedio este es muy poco representativo y es necesario recurrir a las
9
UNIVERSIDAD NACIONAL DE CUYO
Facultad de Ciencias Aplicada a la industria-Final de estadística
Alumna: Verdugo, Lorena
medidas de dispersión. Las diversas medidas de dispersión que se trataran son: rango,
varianza, desviación y coeficiente de variación.
Medidas absolutas
Un estudio que puede dar idea de la distribución seria conocer las desviaciones de los
valores de la variable con respecto de la media aritmética o cualquier otro promedio.
Si se sacara un promedio de todas estas desviaciones, parece que sería una buena forma
de medir la dispersión, pero existe un inconveniente y es que el valor de este promedio
sería igual a 0, según una de las propiedades de la media aritmética, (∑ (xi – X) = 0).
Para evitar este problema se pueden utilizar valores absolutos de las desviaciones o
presentarlas al cuadrado. Las desviaciones más utilizadas son: Desviación estándar,
media, mediana y la varianza.
(x 2 m2 m1
2 2
X) * ri
2
i
N 1
2
10
UNIVERSIDAD NACIONAL DE CUYO
Facultad de Ciencias Aplicada a la industria-Final de estadística
Alumna: Verdugo, Lorena
Es una medida poco precisa, pero se la utiliza para dar una idea de la variabilidad
de los datos de una forma rápida y sencilla.
Rango: 25,3 °F
Medidas relativas
Medidas de Dispersión
varianza σ2 = m2-m1^2 25,5228017
desviación o dispersión σ 5,05200967
Cv 0,12779627
3- MEDIDAS DE FORMA
Una medida de posición proporciona un valor que representa al conjunto de todos los
valores observados y el grado de representatividad de esta medida se obtiene mediante
una medida de dispersión.
Al sustituir estos valores observados por estas medidas representativas, se pierde no solo
la individualidad de los diferentes elementos de la distribución sino, también la propia
estructura de la distribución que está determinada por su representación gráfica. Esta
pérdida del conociendo de la estructura de la distribución se puede atenuar utilizando las
medidas que identifiquen la forma de su representación gráfica.
El histograma se suele sustituir por una línea curva que ajustándose a los escalones del
histograma los suaviza.
11
UNIVERSIDAD NACIONAL DE CUYO
Facultad de Ciencias Aplicada a la industria-Final de estadística
Alumna: Verdugo, Lorena
El área comprendida entre la curva y el eje de abscisas debe ser igual a la suma de las
áreas de todos los rectángulos del histograma que a su vez es igual al número de
observaciones.
Simétrica: La figura puede doblarse por su eje vertical y ambas ramas de la curva
coinciden.
Si la distribución es campaniforme, simétrica y las dos ramas son asíntotas del eje
de abscisas se la denomina distribución de Gauss o de Laplace-Gauss. Esta
distribución fue obtenida al estudiar los errores de las medidas, por eso también.
Se la conoce como curva de errores. Esta distribución es la más importante y se la
conoce como distribución normal.
Miden el grado de asimetría de una distribución con respecto a un valor central (media
aritmética o mediana).En este caso es necesario conocer que signo tiene cada valor. Por
este motivo en las medidas de asimetría se utiliza la potencia de grado tres:
m3
( xi X ) 3 * ri
N
12
UNIVERSIDAD NACIONAL DE CUYO
Facultad de Ciencias Aplicada a la industria-Final de estadística
Alumna: Verdugo, Lorena
m3=62299,68344 es asimétrica a la derecha o sesgo positivo
1
m3 * ( X im X ) * ri
3
1 1 N
3
3
X MO 3* ( X Me )
Ap1 AP 2
SX SX
En este coeficiente de asimetría si:
13
UNIVERSIDAD NACIONAL DE CUYO
Facultad de Ciencias Aplicada a la industria-Final de estadística
Alumna: Verdugo, Lorena
m4
2
4
Siendo σ=desviación típica: m4 = momento de orden 4 respecto a la media aritmética o
momento central.
Como γ2 para una distribución normal es igual a tres se suele utilizar el coeficiente de
apuntamiento o curtosis corregido, también conocido como coeficiente de exceso, que
viene dado por la expresión:
1
m4 * ( X im X ) * ri
4
k 3 k N 3
4 4
m4
( xi X ) 4 * ri
N
14
UNIVERSIDAD NACIONAL DE CUYO
Facultad de Ciencias Aplicada a la industria-Final de estadística
Alumna: Verdugo, Lorena
γ2=3 o k=0, la distribución es mesocúrtica sin exceso.
γ2>3 o k>0, la distribución es leptocúrtica con exceso.
γ2<3 o k<0, la distribución es platicúrtica achatada.
γ2=3,47 y k=0,4763 la distribución es leptocúrtica con exceso.
Según el grado de aplastamiento de una curva con respecto a la normal se clasifican en:
Mesocúrtica: tiene el mismo aplastamiento que la distribución normal
2,6 < γ2 <3,4
-0,4< k < 0,4
Leptocúrtica: es más apuntada que la distribución normal
Platicúrtica: es más achatada que la normal.
Medidas de forma
Asimetría γ1 =μ3/σ3 -0,882
Pearson Ap1= (x̅-Mo)/σ -0,017
Pearson Ap2 =((x̅-Me)/σ)*3 -0,212
Apuntamiento γ2 =μ4/σ4 4,596
curtosis K =Y2 - 3 1,596
Interpretación:
El coeficiente de asimetría de Fisher es menor a cero γ1<0, nos indica que la curva
presenta asimetría hacia la izquierda negativa, es decir que las frecuencias más altas se
dan a la derecha, lo cual concuerda con la gráfica. Además, también esto me lo indica la
asimetría de Pearson 1 (diferencia entre la media aritmética y la moda, dividido por la
desviación estándar), Ap1<0 (asimétrica a la izquierda, negativa).
15
UNIVERSIDAD NACIONAL DE CUYO
Facultad de Ciencias Aplicada a la industria-Final de estadística
Alumna: Verdugo, Lorena
La distribución normal
Una vez obtenido el histograma, y si unimos los puntos medios de los rectángulos
podemos dibujar una línea curva bastante parecida a una campana simétrica, o sea:
Esta curva obtenida empíricamente se asemeja a una curva teórica unimodal y
perfectamente simétrica que caracteriza a una distribución de probabilidad conocida como
distribución normal, Guassiana o de Laplace, o también llamada campana de Gauss .
La distribución normal presenta un valor de mayor frecuencia, a partir de él, decae hacia
ambos lados con una simetría perfecta. Esta simetría hace que a valores situados a igual
distancia del valor modal por izquierda y por derecha de la distribución, les corresponda la
misma probabilidad.
Por ser la distribución perfectamente simétrica la media coincide con la mediana y la
moda. Se encuentra en el punto del eje de abscisas que divide a la distribución en dos
partes iguales y a su vez registra el valor de la variable de mayor frecuencia.
La desviación estándar, medida de variabilidad de la distribución determina la mayor o
menor dispersión de los datos alrededor de la media. Cuando crece, la curva se achata.
Esta distribución nos da la probabilidad de que al elegir un valor, éste tenga una medida
contenida en unos intervalos definidos. Esto permitirá predecir de forma aproximada, el
comportamiento futuro de un proceso, conociendo los datos del presente.
16
UNIVERSIDAD NACIONAL DE CUYO
Facultad de Ciencias Aplicada a la industria-Final de estadística
Alumna: Verdugo, Lorena
30
25
20
observado
15
teorico
10
0
26 31 36 41 46 51
REGRESIÓN Y CORRELACIÓN
El término regresión implica encontrar una función matemática que relacione lo mejor
posible las distintas variables observadas se llama regresión al proceso matemático
mediante el cual se halla la función que aproxima a los puntos de dicho diagrama.
La correlación trata de buscar una medida matemática lo más ajustada y exacta que
determine el grado de relación entre las variables, es decir que exprese la diferencia
existente en la ecuación obtenida por regresión (valores estimados) y los valores reales
de la distribución.
Habrá una correlación perfecta cuando ambos valores (en general y e y*) coincidan. Entre
el valor que mida dicha correlación total (r=1) y la correlación nula (r=0) podemos obtener
una amplia gama de posibles relaciones que necesiten ser estudiadas.
Yk = b0 + b1 * xk
17
UNIVERSIDAD NACIONAL DE CUYO
Facultad de Ciencias Aplicada a la industria-Final de estadística
Alumna: Verdugo, Lorena
La correlación trata de buscar una medida matemática lo más ajustada y exacta que
determine el grado de relación entre estas dos variables.
Concepto y relación:
Tiene un carácter general, válido para ajustes lineales simples, múltiples y no lineales.
Cuando R^2 = 1 significa que no hay errores o residuos y, por tanto, todas las
variaciones de Y vienen explicadas por X.
Cuando R^2 =0 quiere decir que la función de regresión no explica ninguna de
las variaciones de Y, con lo que se entiende que dicha función de regresión no
es válida.
S ry S
r 1 2 r xy
S y Sx * S y
18
UNIVERSIDAD NACIONAL DE CUYO
Facultad de Ciencias Aplicada a la industria-Final de estadística
Alumna: Verdugo, Lorena
Si los valores de R^2 oscilaban entre 0 y 1, los valores de r variarían en el intervalo:
1 r 1
El coeficiente de correlación mide el grado de asociación lineal entre las variables, la
bondad o fiabilidad de la predicción, debida a una relación causal que existe entre ellas o
la influencia que en ambas ejerce una tercera.
Análisis
19
UNIVERSIDAD NACIONAL DE CUYO
Facultad de Ciencias Aplicada a la industria-Final de estadística
Alumna: Verdugo, Lorena
REGRESIÓN Y CORRELACIÓN
y = 3.286x + 17.792
180 R² = 0.9297
160
140
120
100
80
60
40
20
0
0 10 20 30 40 50
Control de calidad
Control Estadístico de Procesos
Es un conjunto de herramientas estadísticas que nos permite recopilar, estudiar y analizar
la información de procesos repetitivos para poder tomar decisiones encaminadas a la
mejora de los mismos.
Actualmente, todas las empresas modernas saben que lograr un buen nivel de calidad es
fundamental para el éxito de su gestión.
Definición de la calidad: Conjunto de cualidades que constituyen la manera de ser de
una persona o cosa propiedad o conjuntos de propiedades inherentes a algo, que
permiten juzgar su valor.
Definición de defecto: Un defecto es el incumplimiento de una característica de calidad
respecto de un límite especificado.
Función del control de la calidad: La función del control de calidad es la de determinar
si el comportamiento de un proceso se mantiene en un nivel aceptable de calidad. El
control de calidad recibe una creciente atención como herramienta de administración en la
que importantes características de un producto se observan, evalúan y comparan con
algún tipo de estándar.
20
UNIVERSIDAD NACIONAL DE CUYO
Facultad de Ciencias Aplicada a la industria-Final de estadística
Alumna: Verdugo, Lorena
21
UNIVERSIDAD NACIONAL DE CUYO
Facultad de Ciencias Aplicada a la industria-Final de estadística
Alumna: Verdugo, Lorena
Gráficos de control
La finalidad de una gráfica de control es detectar la presencia de causas asignables, y si
el comportamiento de un proceso se mantiene en un nivel aceptable de calidad.
Una gráfica de control tiene la intención de ser un dispositivo para detectar el estado
fuera de control de un proceso.
Entonces, son dos los gráficos que se realizarán: uno sobre el cual se representarán los
promedios (control de exactitud) y otro sobre el cual se representan los intervalos o las
desviaciones normales (control de precisión). En la industria se ha optado estos tipos de
gráficos por su sencillez y eficacia para pequeños tamaños de muestra.
Análisis
En este caso se realiza el análisis con respecto a la dureza tomando 15 grupos con un
tamaño de población de 4.
Observando el grafico de medias con los límites sin especificación se puede destacar que
presenta una distribución más o menos pareja entorno a la media de las medias. Si
analizamos el grafico en función de los límites con especificación en el punto 4 está muy
cerca del límite inferior y en el punto 13 se encuentra fuera del límite inferior, lo cual
puede deberse a causas asignables que puede deberse al manipuleo de muestra.
El grafico de rangos permite observar la estabilidad general del proceso. Observamos que
en grafico de rangos los primeros muestreos no se presenta mucha variación por lo que
se debe a causas no asignables pero entre los puntos 11 y 13 sobrepasa el límite superior
por lo que no es preciso.
22
UNIVERSIDAD NACIONAL DE CUYO
Facultad de Ciencias Aplicada a la industria-Final de estadística
Alumna: Verdugo, Lorena
45
40
Dureza
35
30
25
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
24.5
19.5
Rango
14.5
9.5
4.5
-0.5
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Bibliografía:
23
UNIVERSIDAD NACIONAL DE CUYO
Facultad de Ciencias Aplicada a la industria-Final de estadística
Alumna: Verdugo, Lorena
24