Professional Documents
Culture Documents
CAPITULO I
ANALISIS ESTADISTICO DE DATOS MUESTRALES
DEFINICIN DE PROBABILIDAD
Es el cociente entre la frecuencia observada del suceso y el total de
observaciones cuando el experimento se realiza un nmero grande de veces.
Dadas un conjunto de condiciones, un experimento, no siempre podemos
predecir exactamente lo que va a ocurrir. La probabilidad es la disciplina
matemtica que estudia estos experimentos.
DEFINICIN DE ESTADSTICA
El trmino estadstica tiene su raz en la palabra estado. Surge cuando se
hace necesario para sus intereses cuantificar conceptos. En la mayora de los
casos esta cuantificacin se har en funcin de unos fines econmicos o
militares. El estado quiere conocer censo de personas, de infraestructura, de
recursos en general, para poder obtener conclusiones de esta informacin.
Actualmente la estadstica es una ciencia. No es ya una cuestin reservada al
estado. Podramos decir que se encuentra en la totalidad del resto de ciencias.
La razn es clara: por una parte la estadstica proporciona tcnicas precisas
para obtener informacin, (recogida y descripcin de datos) y por otra parte
proporciona mtodos para el anlisis de esta informacin.
De ah el nombre de estadstica descriptiva, ya que el objetivo ser, a partir de
una muestra de datos (recogida segn una tcnica concreta), la descripcin de
las caractersticas ms importantes, entendiendo como caractersticas, aquellas
cantidades que nos proporcionen informacin sobre el tema de inters del cual
hacemos el estudio.
RELACIN ENTRE PROBABILIDAD Y ESTADSTICA
La probabilidad y la estadstica se relacionan en una forma muy curiosa. En
esencia, la probabilidad es el vehculo que le permite al estadstico usar la
informacin contenida en una muestra para hacer inferencias o para describir
la poblacin de la cual se ha obtenido la muestra.
1
CLASIFICACIN DE LA ESTADSTICA
La estadstica se divide en dos ramas:
La estadstica descriptiva, que se dedica a los mtodos de recoleccin,
descripcin, visualizacin y resumen de datos originados a partir de los
fenmenos en estudio. Los datos pueden ser resumidos numrica o
grficamente. Ejemplos bsicos de descriptores numricos son la media
y la desviacin estndar. Resmenes grficos incluyen varios tipos de
figuras y grficos.
2
ESTADISTICA DESCRPTIVA
CONCEPTOS BASICOS
1.- UNIVERSO
El universo es un conjunto de elementos involucrados en un
experimento aleatorio.
2.- POBLACION
Es un conjunto total de valores posibles con una caracterstica particular
correspondiente a un universo.
3
FRECUENCIA
En una muestra hay n elementos. sean x1, x2,.., xk k valores
numricos asociados a determinados resultados del experimento. Si hay:
f1
f2
fk
resultados iguales a
resultados iguales a
resultados iguales a xk
x1
x2
15
10
12
3
-------------
NA
S
B
MB
-------------
x1
x2
x3
x4
FRECUENCIA RELATIVA
fi*
fi
=
i = 1, 2, 3, , k
n
donde fi es la frecuencia de ocurrencia del resultado xi y n es el tamao dela muestra.
Para el ejemplo anterior:
15
f1* =
12
f3 * =
40
40
10
*
3
*
f2 =
f4 =
40
40
Fi =
fj* ; i = 1, 2, , k
i 1
F3 =
fj * = f 1 * + f 2 * + f 3 *
i 1
15
=
10
+
40
12
+
40
40
37
F3 =
40
F4 = 1
DISTRIBUCION EMPIRICA
Es el conjunto de parejas ( xi, fi* ) para toda i
Para el ejemplo
( NA, 15/40 ) ; ( S, 10/40 ) : ( B, 12/40 ) ; ( MB, 3/40 )
o en forma tabular:
xi
NA
S
B
MB
fi*
15 / 40
10 / 40
12 / 40
3 / 40
6
Ejemplo:
En una muestra de 25 varillas se obtuvieron las siguientes medidas:
13.02, 12.94, 12.99, 13.07, 12.91, 12.93, 13.06, 13.04, 13.05, 12.93, 12.97,
12.98, 13.10, 13.06, 12.97, 12.99, 12.90, 13.05, 12.98, 13.00, 12.96, 13.01,
12.98, 12.96, 13.03.
INTERVALO DE
CLASE
12.895 12.937
12.937 12.979
12.979 13.021
13.021 13.063
13.063 13.105
MARCA DE
CLASE (x )
12.916
12.958
13
13.042
13.084
fi
fi*
Fi
4
5
8
6
2
4 / 25
5 / 25
8 / 25
6 / 25
2 / 25
4 / 25 = 16%
9 / 25 = 36%
17 / 25 = 68%
23 / 25 = 92%
25 / 25 = 100%
fi = 25
Como la muestra son con dos cifras decimales, la fraccin que se suma y resta,
se considera tres decimales con un mltiplo del tamao de la muestra que es
25, por lo tanto para este ejemplo es 0.005
Valor mximo + 0.005 = 13.10 + 0.005 = 13.105
7
13.02
12.93
12.97
12.99
12.96
12.94
13.06
12.98
12.90
13.01
12.99
13.04
13.10
13.05
12.98
13.07
13.05
13.06
12.98
12.96
12.91
12.93
12.97
13.00
13.03
HISTOGRAMA
Cuando se trabaja con una tabla de frecuencias al conjunto de parejas ( x i , fi* ),
donde xi es una marca de clase para el i-simo intervalo, constituye la distribucin
emprica. Esta distribucin se puede representar mediante el histograma y mediante el
polgono de frecuencias.
fractil en %
fractil en 100% = 13.105
fractil en 0% = 12.895
fractil en ( 17 / 25 ) x 100% = 13.021
68
fractiles
x =
xi
i 1
xi fi
i 1
xi fi
i 1
x =
=
m
fi
i 1
En el ejemplo:
(12.916) (4) + (12.958) (5) + (13) (8) + (13.042) (6) + (13.084) (2)
x =
= 12.9949
25
x = 12.9949
1
25
x =
Xi = 12.9964 Exacto
i 1
25
2. MEDIANA
Es un valor tal que la mitad de las observaciones son menores que ese valor y la otra
mitad mayores que el mismo. Para determinar la mediana conviene ordenar los valores
observados del menor al mayor.
Ejemplos:
a) 1, 7, 8, 10, 12, 15, 17, 23, 24
Mediana = 12
f)a
]
fm
] = 12.997375
8
Mediana = 12.9974
3. MODA (O MODO)
Es el nmero que aparece ms frecuentemente.
En el ejemplo:
Moda = 12.98 es unimodal
si se repiten igual nmero de veces dos o ms nmeros se saca el promedio.
Ejemplos:
Si se trabaja con una tabla.- la moda se encuentra en el intervalo que tiene mayor
frecuencia.
HISTOGRAMA.
Moda = a + x [
d1
d2 + d1
En el ejemplo: d1 = 3 ; d2 = 2
3
Moda = 12.979 + 0.042 [
]
3+2
Moda = 13.0042
4. FRACTILES.
Establecen la localizacin de diversos valores que dividen a la muestra en grupos de
acuerdo a las frecuencias o a las observaciones.
En una tabla:
Fractil = a + x [
n x Fraccin - ( f )a
]
(f) Fractil
12
] = 12.9559
5
25 (0.50) - 9
] = 12.997375
8
25 (0.75) -17
] = 13.03325
6
25 (1) - 23
] = 13.105
2
25 (0.01) 0
] = 12.92125
4
13
5. VARIANCIA:
Es el promedio aritmtico de los cuadrados de las desviaciones de las observaciones
con respecto a su valor medio.
n
(xi - x )2
i 1
S2X =
n
Si se trabaja con una tabla:
n
( x i x )2 fi
i 1
S x=
n
donde:
x = marca de clase
k = nmero de intervalo
x i = media
fi= la frecuencia
n = nmero de observaciones
Para el ejemplo:
(12.916 12.9952)2 (4) + (12.958 x )2 (5) + + (13.084 x )2 (2)
Sx2=
25
S2x= 0.0024
Sx= Desviacin estndar =
Sx =
2
x
0.0024 = 0.048989794856
6. COEFICIENTE DE VARIACION.
Sx
C. V.=
x
14
En el ejemplo:
0.0024
C. V.=
= 0.0037
12.9952
7. COEFICIENTE DE ASIMETRIA:
Media Moda
C. A.=
12.9952 13.042
=
Sx
= - 0.9554
0.04898
15
8. COEFICIENTE DE APLANAMIENTO.
El grado de aplanamiento de una distribucin emprica se llama curtosis y se mide
por el siguiente coeficiente.
m4
Coeficiente momento de curtosis =
m22
donde:
mr .- es el momento de orden r con respecto a la media.
n
( xi x )r
i 1
mr =
n
En una tabla de frecuencias
n
(xi x )r fi
i 1
mr =
n
Observar que:
m2 = SX2
16
En A:
5 (4) + 7 (10) + 9 (5)
x=
= 7.105
19
En B:
5 (6) + 7 (7) + 9 (6)
x =
= 7
19
17
En A:
(5 7.105)2 (4) + (7 7.105)2 (10) + (9 7.105)2 (5)
m2=
= 1.8836566
19
(5 7.105)4 (4) + (7 7.105)4 (10) + (9 7.105)4 (5)
m4=
= 7.527
19
m4
7.527
Coeficiente de curtis =
= 2.122
m22
(1.8836)
En B:
(5 7)2 (6) + (7 7)2 (7) + (9 7)2 (6)
m2 =
= 2.526
19
(5 7)4 (6) + (7 7)4 (7) + (9 7)4 (6)
m4 =
= 10.105
19
m4
10.105
Coeficiente de curtis =
=
2
m2
= 1.58
2
(2.526)
TAREA:
Datos: 0, 45, 65, 80, 85, 80, 20, 45, 17, 73, 35, 62, 57, 45, 10, 67, 65, 42, 10, 40, 65, 48, 15,
65, 52, 75, 35, 100, 57, 65, 45, 57, 42, 48, 70, 35, 35, 42, 25, 38, 25, 80, 85, 100, 28, 25, 65,
85, 25, 35.
Son 50 calificaciones, de los alumnos del grupo 26 de probabilidad y estadstica.
INTERVALOS MARCAS
DE CLASE
DE CLASE
-0.1 - 19.94
19.94 39.98
39.98 60.02
60.02 80.06
80.06 100.1
fi
18
fi *
Fi
fi = 50
= 20.04
5
Calcular:
a)
b)
c)
d)
e)
f)
g)
h)
i)
j)
media
mediana
moda
fractiles C1, C2, C3, C4
variancia y desviacin estndar
coeficiente de asimetra
coeficiente de aplanamiento
histograma con polgono de frecuencias
polgono de frecuencias relativas acumuladas
coeficiente de variacin
19