You are on page 1of 19

APUNTES DE PROBABILIDAD Y ESTADISTICA

Ing. Guillermo Casar Marcos

CAPITULO I
ANALISIS ESTADISTICO DE DATOS MUESTRALES
DEFINICIN DE PROBABILIDAD
Es el cociente entre la frecuencia observada del suceso y el total de
observaciones cuando el experimento se realiza un nmero grande de veces.
Dadas un conjunto de condiciones, un experimento, no siempre podemos
predecir exactamente lo que va a ocurrir. La probabilidad es la disciplina
matemtica que estudia estos experimentos.
DEFINICIN DE ESTADSTICA
El trmino estadstica tiene su raz en la palabra estado. Surge cuando se
hace necesario para sus intereses cuantificar conceptos. En la mayora de los
casos esta cuantificacin se har en funcin de unos fines econmicos o
militares. El estado quiere conocer censo de personas, de infraestructura, de
recursos en general, para poder obtener conclusiones de esta informacin.
Actualmente la estadstica es una ciencia. No es ya una cuestin reservada al
estado. Podramos decir que se encuentra en la totalidad del resto de ciencias.
La razn es clara: por una parte la estadstica proporciona tcnicas precisas
para obtener informacin, (recogida y descripcin de datos) y por otra parte
proporciona mtodos para el anlisis de esta informacin.
De ah el nombre de estadstica descriptiva, ya que el objetivo ser, a partir de
una muestra de datos (recogida segn una tcnica concreta), la descripcin de
las caractersticas ms importantes, entendiendo como caractersticas, aquellas
cantidades que nos proporcionen informacin sobre el tema de inters del cual
hacemos el estudio.
RELACIN ENTRE PROBABILIDAD Y ESTADSTICA
La probabilidad y la estadstica se relacionan en una forma muy curiosa. En
esencia, la probabilidad es el vehculo que le permite al estadstico usar la
informacin contenida en una muestra para hacer inferencias o para describir
la poblacin de la cual se ha obtenido la muestra.
1

APUNTES DE PROBABILIDAD Y ESTADISTICA


Ing. Guillermo Casar Marcos

Los mtodos estadstico matemticos emergieron desde la teora de


probabilidad, la cual data desde la correspondencia entre Pierre de Fermat y
Blaise Pascal (1654). Christian Huygens (1657) da el primer tratamiento
cientfico que se conoce a la materia. El Ars Conjectandi (pstumo, 1713) de
Jakob Bernoulli y la doctrina de posibilidades (1718) de Abraham de Moivre
estudiaron la materia como una rama de las matemticas. 1 en la era moderna,
el trabajo de Kolmogorov ha sido un pilar en la formulacin del modelo
fundamental de la teora de probabilidades, el cual es usado a travs de la
estadstica.
Pierre-Simon Laplace (1774) hace el primer intento de deducir una regla para
la combinacin de observaciones desde los principios de la teora de
probabilidades. Laplace represent la ley de probabilidades de errores
mediante una curva y dedujo una frmula para la media de tres observaciones.
Tambin, en 1871, obtiene la frmula para la ley de facilidad del error
(trmino introducido por Lagrange, 1744) pero con ecuaciones inmanejables.
Daniel Bernoulli (1778) introduce el principio del mximo producto de las
probabilidades de un sistema de errores concurrentes.
El mtodo de mnimos cuadrados, el cual fue usado para minimizar los errores
en mediciones, fue publicado independientemente por Adrien-Marie Legendre
(1805), Robert Adrain (1808), y Carl Friedrich gauss (1809). Gauss haba
usado el mtodo en su famosa prediccin de la localizacin del planeta enano
Ceres en 1801.

CLASIFICACIN DE LA ESTADSTICA
La estadstica se divide en dos ramas:
La estadstica descriptiva, que se dedica a los mtodos de recoleccin,
descripcin, visualizacin y resumen de datos originados a partir de los
fenmenos en estudio. Los datos pueden ser resumidos numrica o
grficamente. Ejemplos bsicos de descriptores numricos son la media
y la desviacin estndar. Resmenes grficos incluyen varios tipos de
figuras y grficos.
2

APUNTES DE PROBABILIDAD Y ESTADISTICA


Ing. Guillermo Casar Marcos

La inferencia estadstica, que se dedica a la generacin de los modelos,


inferencias y predicciones asociadas a los fenmenos en cuestin
teniendo en cuenta lo aleatorio e incertidumbre en las observaciones. Se
usa para modelar patrones en los datos y extraer inferencias acerca de la
poblacin de estudio. Estas inferencias pueden tomar la forma de
respuestas a preguntas si/no (prueba de hiptesis), estimaciones de
caractersticas numricas (estimacin), pronsticos de futuras
observaciones, descripciones de asociacin (correlacin) o
modelamiento de relaciones entre variables (anlisis de regresin).
Otras tcnicas de modelamiento incluyen anova, series de tiempo y
minera de datos.

Ambas ramas (descriptiva e inferencial) comprenden la estadstica aplicada.


Hay tambin una disciplina llamada estadstica matemtica, la cual se refiere a
las bases tericas de la materia. La palabra estadsticas tambin se refiere al
resultado de aplicar un algoritmo estadstico a un conjunto de datos, como en
estadsticas econmicas, estadsticas criminales, etc.

ESTADISTICA DESCRPTIVA
CONCEPTOS BASICOS
1.- UNIVERSO
El universo es un conjunto de elementos involucrados en un
experimento aleatorio.
2.- POBLACION
Es un conjunto total de valores posibles con una caracterstica particular
correspondiente a un universo.
3

APUNTES DE PROBABILIDAD Y ESTADISTICA


Ing. Guillermo Casar Marcos

3.- TAMAO DE LA POBLACION


El nmero de valores que contiene la poblacin.
Ejemplo:
En un pas se van a considerar los habitantes que ganan entre 100 mil y
200 mil pesos mensuales.
El universo son los habitantes de ese pas.
La poblacin los habitantes que ganan entre 100 mil y 200 mil pesos.
El tamao de la poblacin, es la cantidad de gente que gana entre 100 y
200 mil pesos.
4.- MUESTRA
Es un subconjunto de la poblacin obtenida de acuerdo a una regla
determinada.
Ejemplo:
Los individuos que ganan entre 100 y 200 mil y adems viven en la
ciudad m, del pas en cuestin.
5.- TAMAO DE LA MUESTRA
Nmero de elementos de la muestra.

FRECUENCIA
En una muestra hay n elementos. sean x1, x2,.., xk k valores
numricos asociados a determinados resultados del experimento. Si hay:

APUNTES DE PROBABILIDAD Y ESTADISTICA


Ing. Guillermo Casar Marcos

f1
f2

fk

resultados iguales a
resultados iguales a

resultados iguales a xk

x1
x2

A f1, f2, ..fk se le llama frecuencia de ocurrencia de x1, x2,.,xk


respectivamente.
Ejemplo:
Se realiza un examen
NA, S, B, MB
f1
f2
f3
f4

15
10
12
3

-------------

NA
S
B
MB

-------------

x1
x2
x3
x4

FRECUENCIA RELATIVA
fi*

fi
=

i = 1, 2, 3, , k

n
donde fi es la frecuencia de ocurrencia del resultado xi y n es el tamao dela muestra.
Para el ejemplo anterior:
15
f1* =

12
f3 * =

40

40

10
*

3
*

f2 =

f4 =
40

40

APUNTES DE PROBABILIDAD Y ESTADISTICA


Ing. Guillermo Casar Marcos

FRECUENCIA RELATIVA ACUMULADA


A un valor x1 es la suma de las frecuencias relativas de todos los valores
menores o iguales a xi
i

Fi =

fj* ; i = 1, 2, , k

i 1

F3 =

fj * = f 1 * + f 2 * + f 3 *

i 1

15
=

10
+

40

12
+

40

40

37
F3 =
40
F4 = 1

DISTRIBUCION EMPIRICA
Es el conjunto de parejas ( xi, fi* ) para toda i
Para el ejemplo
( NA, 15/40 ) ; ( S, 10/40 ) : ( B, 12/40 ) ; ( MB, 3/40 )
o en forma tabular:
xi
NA
S
B
MB

fi*
15 / 40
10 / 40
12 / 40
3 / 40
6

APUNTES DE PROBABILIDAD Y ESTADISTICA


Ing. Guillermo Casar Marcos

Se tiene una muestra de tamao grande especficamente cuando el


nmero de resultados es considerable, es ms conveniente trabajar con
intervalos de clase. La amplitud de todos estos intervalos se llama rango y el
punto medio de cada intervalo de clase se llama marca de clase.
El arreglo en una tabla de los intervalos de una clase, frecuencia,
frecuencias relativas y frecuencias relativas acumuladas de llama tabla de
frecuencias.

Ejemplo:
En una muestra de 25 varillas se obtuvieron las siguientes medidas:
13.02, 12.94, 12.99, 13.07, 12.91, 12.93, 13.06, 13.04, 13.05, 12.93, 12.97,
12.98, 13.10, 13.06, 12.97, 12.99, 12.90, 13.05, 12.98, 13.00, 12.96, 13.01,
12.98, 12.96, 13.03.
INTERVALO DE
CLASE
12.895 12.937
12.937 12.979
12.979 13.021
13.021 13.063
13.063 13.105

MARCA DE
CLASE (x )
12.916
12.958
13
13.042
13.084

fi

fi*

Fi

4
5
8
6
2

4 / 25
5 / 25
8 / 25
6 / 25
2 / 25

4 / 25 = 16%
9 / 25 = 36%
17 / 25 = 68%
23 / 25 = 92%
25 / 25 = 100%

Valor mximo = 13.10


Valor mnimo = 12.90

fi = 25

Como la muestra son con dos cifras decimales, la fraccin que se suma y resta,
se considera tres decimales con un mltiplo del tamao de la muestra que es
25, por lo tanto para este ejemplo es 0.005
Valor mximo + 0.005 = 13.10 + 0.005 = 13.105
7

APUNTES DE PROBABILIDAD Y ESTADISTICA


Ing. Guillermo Casar Marcos

Valor mnimo 0.005 = 12.90 0.005 = 12.895


Rango = 13.105 12.895 = 0.21
Amplitud del Intervalo = 0.21 / 5 = 0.042

13.02
12.93
12.97
12.99
12.96

12.94
13.06
12.98
12.90
13.01

12.99
13.04
13.10
13.05
12.98

13.07
13.05
13.06
12.98
12.96

12.91
12.93
12.97
13.00
13.03

HISTOGRAMA
Cuando se trabaja con una tabla de frecuencias al conjunto de parejas ( x i , fi* ),
donde xi es una marca de clase para el i-simo intervalo, constituye la distribucin
emprica. Esta distribucin se puede representar mediante el histograma y mediante el
polgono de frecuencias.

APUNTES DE PROBABILIDAD Y ESTADISTICA


Ing. Guillermo Casar Marcos

POLIGONO DE FRECUENCIAS RELATIVAS ACUMULADAS

fractil en %
fractil en 100% = 13.105
fractil en 0% = 12.895
fractil en ( 17 / 25 ) x 100% = 13.021
68

fractiles

percentil ( 1ro , 2do , . , 100mo )


decil (1ro, 2do, .. , 10mo )
cuartil ( 1ro 25% , 2do 50% , 3ro 75% , 4to 100% )

PARAMETROS DE LAS DISTRIBUCIONES EMPIRICAS


1. MEDIA
Es el promedio aritmtico de todos los datos de la muestra:
1
n

x =

xi

i 1

APUNTES DE PROBABILIDAD Y ESTADISTICA


Ing. Guillermo Casar Marcos

Con una tabla de frecuencias


m

xi fi

i 1

xi fi

i 1

x =

=
m

fi

i 1

En el ejemplo:
(12.916) (4) + (12.958) (5) + (13) (8) + (13.042) (6) + (13.084) (2)

x =

= 12.9949
25

x = 12.9949
1
25

x =

Xi = 12.9964 Exacto

i 1

25
2. MEDIANA
Es un valor tal que la mitad de las observaciones son menores que ese valor y la otra
mitad mayores que el mismo. Para determinar la mediana conviene ordenar los valores
observados del menor al mayor.
Ejemplos:
a) 1, 7, 8, 10, 12, 15, 17, 23, 24
Mediana = 12

b) 1, 7, 8, 10, 12, 15, 17, 23, 24, 29


12 + 15
= 13.5 Mediana
2
c) 4, 5, 5, 6, 7, 7, 7, 8, 9, 9
Mediana = 7
10

APUNTES DE PROBABILIDAD Y ESTADISTICA


Ing. Guillermo Casar Marcos

Si se trabaja con intervalos de clase:


n/2 (
Mediana = a + x

f)a

]
fm

donde en la tabla de frecuencias se trabaja en el intervalo en donde la frecuencia f i rebasa


el 50%, por primera vez, entonces:
x = Es el tamao del intervalo.
a = Al extremo izquierdo del intervalo.
n = Al nmero de valores observados en el experimento.
fm = A la frecuencia correspondiente al intervalo en cuestin.
( f)a = A la suma de las frecuencias correspondientes a los intervalos anteriores.
En el ejemplo: se trabaja en el 3e intervalo
12.5 (4 + 5)
Mediana = 12.979 + 0.042 [

] = 12.997375
8

Mediana = 12.9974

3. MODA (O MODO)
Es el nmero que aparece ms frecuentemente.
En el ejemplo:
Moda = 12.98 es unimodal
si se repiten igual nmero de veces dos o ms nmeros se saca el promedio.
Ejemplos:

con dos modas (bimodal)


con tres modas (trimodal)

con varias modas (multimodal)


11

APUNTES DE PROBABILIDAD Y ESTADISTICA


Ing. Guillermo Casar Marcos

Si se trabaja con una tabla.- la moda se encuentra en el intervalo que tiene mayor
frecuencia.
HISTOGRAMA.

Moda = a + x [

d1

d2 + d1
En el ejemplo: d1 = 3 ; d2 = 2
3
Moda = 12.979 + 0.042 [

]
3+2

Moda = 13.0042

4. FRACTILES.
Establecen la localizacin de diversos valores que dividen a la muestra en grupos de
acuerdo a las frecuencias o a las observaciones.
En una tabla:
Fractil = a + x [

n x Fraccin - ( f )a
]
(f) Fractil
12

APUNTES DE PROBABILIDAD Y ESTADISTICA


Ing. Guillermo Casar Marcos

POLIGONO DE FRECUENCIA RELATIVA ACUMULADA:

Cuartiles: C1, C2, C3, C4


C1 = Fractil al 25%
En el ejemplo:
25 (0.25) 4
C1= 12.937 + (0.042) [

] = 12.9559
5
25 (0.50) - 9

C2= 12.979 + (0.042) [

] = 12.997375
8
25 (0.75) -17

C3= 13.021 + (0.042) [

] = 13.03325
6
25 (1) - 23

C4= 13.063 + (0.042) [

] = 13.105
2
25 (0.01) 0

d1= 12.895 + (0.042) [

] = 12.92125
4
13

APUNTES DE PROBABILIDAD Y ESTADISTICA


Ing. Guillermo Casar Marcos

5. VARIANCIA:
Es el promedio aritmtico de los cuadrados de las desviaciones de las observaciones
con respecto a su valor medio.
n

(xi - x )2

i 1

S2X =
n
Si se trabaja con una tabla:
n

( x i x )2 fi

i 1

S x=
n
donde:
x = marca de clase
k = nmero de intervalo
x i = media
fi= la frecuencia
n = nmero de observaciones
Para el ejemplo:
(12.916 12.9952)2 (4) + (12.958 x )2 (5) + + (13.084 x )2 (2)
Sx2=
25
S2x= 0.0024
Sx= Desviacin estndar =
Sx =

2
x

0.0024 = 0.048989794856

6. COEFICIENTE DE VARIACION.
Sx
C. V.=

x
14

APUNTES DE PROBABILIDAD Y ESTADISTICA


Ing. Guillermo Casar Marcos

En el ejemplo:

0.0024
C. V.=

= 0.0037
12.9952

7. COEFICIENTE DE ASIMETRIA:
Media Moda
C. A.=

12.9952 13.042
=

Sx

= - 0.9554
0.04898

Distribucin simtrica positiva:

15

APUNTES DE PROBABILIDAD Y ESTADISTICA


Ing. Guillermo Casar Marcos

Distribucin simtrica negativa:

8. COEFICIENTE DE APLANAMIENTO.
El grado de aplanamiento de una distribucin emprica se llama curtosis y se mide
por el siguiente coeficiente.
m4
Coeficiente momento de curtosis =
m22
donde:
mr .- es el momento de orden r con respecto a la media.
n

( xi x )r

i 1

mr =
n
En una tabla de frecuencias
n

(xi x )r fi

i 1

mr =
n
Observar que:

m2 = SX2
16

APUNTES DE PROBABILIDAD Y ESTADISTICA


Ing. Guillermo Casar Marcos

SEAN LOS HISTOGRAMAS:

En A:
5 (4) + 7 (10) + 9 (5)

x=

= 7.105
19

En B:
5 (6) + 7 (7) + 9 (6)

x =

= 7
19
17

APUNTES DE PROBABILIDAD Y ESTADISTICA


Ing. Guillermo Casar Marcos

En A:
(5 7.105)2 (4) + (7 7.105)2 (10) + (9 7.105)2 (5)
m2=

= 1.8836566
19
(5 7.105)4 (4) + (7 7.105)4 (10) + (9 7.105)4 (5)

m4=

= 7.527
19
m4

7.527

Coeficiente de curtis =

= 2.122

m22

(1.8836)

En B:
(5 7)2 (6) + (7 7)2 (7) + (9 7)2 (6)
m2 =

= 2.526
19
(5 7)4 (6) + (7 7)4 (7) + (9 7)4 (6)

m4 =

= 10.105
19
m4

10.105

Coeficiente de curtis =

=
2

m2

= 1.58
2

(2.526)

TAREA:
Datos: 0, 45, 65, 80, 85, 80, 20, 45, 17, 73, 35, 62, 57, 45, 10, 67, 65, 42, 10, 40, 65, 48, 15,
65, 52, 75, 35, 100, 57, 65, 45, 57, 42, 48, 70, 35, 35, 42, 25, 38, 25, 80, 85, 100, 28, 25, 65,
85, 25, 35.
Son 50 calificaciones, de los alumnos del grupo 26 de probabilidad y estadstica.

INTERVALOS MARCAS
DE CLASE
DE CLASE
-0.1 - 19.94
19.94 39.98
39.98 60.02
60.02 80.06
80.06 100.1

fi

18

fi *

Fi

APUNTES DE PROBABILIDAD Y ESTADISTICA


Ing. Guillermo Casar Marcos

Valor mximo = 100


Valor mnimo = 0

fi = 50

Se suma y resta: 0.1


Valor mximo + 0.1 = 100 + 0.1 = 100.1
Valor mnimo 0.1 = 0 0.1 = - 0.1
Rango = 100.1 (- 0.1) = 100.2
Amplitud del intervalo = 100.2 / 5 = 20.04
100.1 + 0.1
x =

= 20.04
5

Calcular:
a)
b)
c)
d)
e)
f)
g)
h)
i)
j)

media
mediana
moda
fractiles C1, C2, C3, C4
variancia y desviacin estndar
coeficiente de asimetra
coeficiente de aplanamiento
histograma con polgono de frecuencias
polgono de frecuencias relativas acumuladas
coeficiente de variacin

19

You might also like