You are on page 1of 17

Estadstica

Grado en Ingeniera Industrial

Cristina Varela Roa


Grado en Ingeniera Elctrica
Curso 2011/2012

Tema 1: Estadstica Descriptiva


Conceptos:
Cualitativa

Poblacin: Es el conjunto de conceptos que voy a estudiar.

Variable

Muestra: Es un subconjunto de la poblacin.

Cuantitativa

Discreta

Individuo: Es cada uno de los elementos de la poblacin.


Continua
Tipos de variables

Cualitativa
= Color del Pelo

Rubio
Moreno
Pelirrojo
Otro

57
78
36
18
189

0.30
0.41
0.19
0.10

108
147.6
68.4
36

Diagrama de rectngulos

Diferentes posibilidades de X
Cantidad de
Porcentaje de cada
Frecuencia Absoluta Acumulada
Frecuencia Relativa Acumulada
Angulo que representa cada

Diagrama de sectores

100

10%

Rubio
30%

19%

50

Moreno
Pelirrojo

0
Rubio

Moreno

Pelirrojo

Diagrama de Pareto

Pictograma

100

100

50

50

0
Moreno

Otro

41%

Otro

Rubio

Cristina Varela Roa

Pelirrojo

Otro

Moreno

Rubio

Pelirrojo

Otro

Pgina 2

Cuantitativa
Discreta

17
18
19
20
21

33
44
66
55
77
275

33
77
143
198
275

0.12
0.16
0.24
0.2
0.28
1

= Edad

0.12
0.28
0.52
0.72
1

Diagrama de barras

Diferentes posibilidades de X
Cantidad de
Porcentaje de cada
Frecuencia Absoluta Acumulada
Frecuencia Relativa Acumulada

Polgono de frecuencias

100

100

50

50

Cuantitativa
Continua

[150-160]
]160-170]
]170-180]
]180-190]
]190-200]

155
165
175
185
195

5
8
10
12
8
43

0,11
0,19
0,23
0,28
0,19
1

5
13
23
35
43

0,11
0,30
0,53
0,81
1

10
10
10
10
10

2
0,8
1
1,2
0,8

X=Altura
Histograma

Intervalo
Marca de Clase
Cantidad de
Porcentaje de cada
Frecuencia Absoluta Acumulada
Frecuencia Relativa Acumulada
Amplitud del Intervalo
Densidad del Intervalo

Polgono de frecuencias

100

100

50

50

Descripcin Numrica de una Variable


Medidas de posicin
La media
La media ( ) es un valor que se calcula con la siguiente expresin, =

, y es un valor

que puede representar por si solo a todo el conjunto.


La mediana
La Mediana ( ) es el valor que deja por debajo de l a el 50% de los datos, y por tanto tambin es
el que deja por encima al 50%.

Cristina Varela Roa

Pgina 3

La moda
La moda es el valor ms frecuente de mis datos.
Cuantiles: deciles, cuartiles y percentiles.
Son valores que dividen al conjunto en un determinado
nmero de partes iguales.
Los deciles (D) dividen al conjunto en 10 partes iguales, y
por lo tanto en cada parte encontramos un 10% de los datos
Los cuartiles (Q) dividen al conjunto en 4 partes iguales, y
por lo tanto en cada parte encontramos un 25% de los
datos
Los percentiles (P) dividen al conjunto en 100 partes
Explicacin grfica de los Cuartiles
iguales, y por lo tanto en cada parte encontramos un 1% de
los datos.
Nota: La Mediana es el mismo valor que el cuartil 2 y que el percentil 50

Medidas de dispersin
Rango
El rango (R) es la diferencia entre el dato ms alto y el ms bajo. Tambin es conocido como
recorrido
El Rango Intercuartlico ( = 3 1 ) soluciona el problema que presenta el rango cuando hay
algunos datos muy dispersos del resto.

Varianza y Desviacin Tpica


La Varianza (2 ) mide la desviacin de los datos respecto a la media.
Se calcula con la siguiente expresin: 2 =

( )2

A la raz cuadrada de la varianza se la conoce como desviacin tpica ()


Nota: Si en vez de dividir por N dividimos por N- 1, obtenemos la cuasivarianza (S) y la
cuasidesviacin tpica

Coeficiente de variacin
El coeficiente de variacin (CV), soluciona el problema que surge al comparar las varianzas de
distintos experimentos que estn en diferentes unidades. La calculamos de la siguiente forma:
=

| |

Medidas de Forma
El Coeficiente de Fisher () nos muestra numricamente si la representacin grfica de nuestros
datos es simtrica o no.
Se calcula de la siguiente forma: =

( )3
3

Si = 0 es simetrica, si es negativo es asimtrica a la izquierda o negativay si es positivo es


asimtrica a la derecha o positiva.

Cristina Varela Roa

Pgina 4

Ejemplo: Se ha hecho una encuesta a 100 personas sobre las horas que dedica semanalmente al estudio, 20 de
los encuestados dicen dedicar 3 horas, 30 dicen que 40 horas, 40 dicen que 5 y 10 dicen que 8. A partir de los datos
proporcionados calcular la media, la mediana, la moda, el Rango, la varianza, la desviacin tpica, el coeficiente de
variacin y el coeficiente de Fisher

Con los datos del enunciado podemos hacer la siguiente tabla, que nos ser de gran
utilidad para calcular lo que nos pide el enunciado.

3
4
5
8

20
30
40
10
100

20
50
90
100

0,2
0,3
0,4
0,1
1

0,2
0,5
0,9
1

Empezaremos calculando la media: =

60
120
200
80
460

460
100

180
480
1000
640
2300

( )
-81,92
-6,48
2,56
393,04
310,2

= 4,6

Para la moda, me fijamos en los y observamos que el valor ms alto es el 04, que corresponde
con 5 horas de estudio; = 5
Fijndonos en la columna podemos calcular la mediana, buscando el valor que pasa del 0,5 y
en este caso coincide con el 4, as que la mediana se encuentra entre el 4 y el 5; = 4,5
Para calcular el Rango, restamos el valor ms elevado de los y le restamos el menor; R= 8-3= 5
Para la varianza usamos la siguiente expresin: 2 =

2 =

2300
100

4,62 = 13,2 2

La raz cuadrada de la varianza es da desviacin tpica que nos da una valor de =4,3 horas
El coeficiente de variacin lo calculamos como el cociente entre la desviacin tpica y la media (en
valor absoluto); =

| |

4,3
4,6

= 0,96 96%

Para terminar, el coeficiente de Fisher lo calculamos con la expresin:


=

( )3
3

310 ,2
7950 ,7

= 0,039

Este valor nos indica que es asimtrica a la derecha, tal y como podemos comprobar en el grafico
inferior

50
40
30
20
10
0
3

Cristina Varela Roa

Pgina 5

Tema 2: Probabilidad
En un experimento aleatorio se llama espacio muestral () al
conjunto de todos los posibles resultados de este. Si un suceso
contiene todos los resultados del espacio muestral se dice que es
suceso seguro, si por el contrario no contiene ningn resultado del
espacio muestral, se dice que es suceso imposible y se denota .
Dados dos sucesos A y B, podemos realizar las siguientes operaciones:

Unin. A B Es la
unin de los sucesos
de A y B

Interseccin:
AB
Son los sucesos
comunes de A y B

Incompatibles.
Si no pueden
ocurrir a la vez,
A B=

si cualquier resultado
de B esta tambin lo
es de A, entonces
decimos que
B c A.

es el suceso
complementario de
A si ocurre siempre
que no ocurre A

Leyes de De Morgan.
=
=

Definicin Clsica de Probabilidad:


=

Propiedades:

P() = 1

P() = 1 - P(A)

0 P(A) 1

Si A c B:
P(A) P(B)

P(A B ) = P(A) +P(B) P(A B)

Probabilidad Condicionada


=
, () 0

Independencia de Sucesos
Si A es un suceso independiente de B:
P(A/B) = P(A),
Y en consecuencia:

P(A B)=P(B)P(A/B)=P(A)P(B)
Cristina Varela Roa

Pgina 6

Teorema de la probabilidad total


Me preguntan por lo segundo independientemente de lo primero
P(B)=

Teorema de la Probabilidad Compuesta


P(1 A2 An ) = 1

1 (1 A2 An1)

Teorema de Bayes
Me preguntan por lo primero sabiendo lo segundo


(/)

=
=


()

Ejemplo: Tenemos una maquina que detecta si tenemos cierta enfermedad, pero esta no es fiable al 100%. Si
tenemos la enfermedad y nos sometemos a la prueba, hay un 2% de probabilidad de que falle y si no la tenemos de
un 5%. La probabilidad de que tengamos la enfermedad es del 1%. Calcular:
a) La probabilidad de que estemos contagiados y de que la mquina de positivo

Este apartado lo resolvemos con el teorema de la probabilidad compuesta:


= = 0,01 0,98 = 0,0098
b) La probabilidad de que de positivo

En este apartado usamos el teorema de la probabilidad total


= +
= 0,01 0,98 + 0,99 0,05 = 0,0593

c) La probabilidad de que no estemos enfermos si la maquina da positivo

En este ltimo apartado utilizamos el teorema de Bayes


=

Cristina Varela Roa

0,99 0,05
= 0,83
0,01 0,98 + 0,99 0,05

Pgina 7

Tema3. Variable Aleatoria


Variable Discreta
Funcin de probabilidad P(x)
p( )=P( = ) = ,
Se ha de verificar que:
0 pi 1

= 1
Funcin de Distribucin F(x)
F()=P( ) =
Se ha de verificar que:
F(-)=0
F(+)=1
F es montona no decreciente
F es continua a la derecha, tiene lmites a
la izquierda y es constante en [1 , )

Funcin de probabilidad

Funcin de distribucin

Variable Continua
Funcin de densidad

f(x) 0,

() = 1

P(a X b) = ()

P(X=a)= () =0

Funcin de densidad

Funcin de distribucin

F(x)=P(X x)= ,
Se ha de verificar que:

F(-)=0
F(+)=1
F es montona no decreciente
F es continua
Funcin de distribucin

Cristina Varela Roa

Pgina 8

Caractersticas de la Variable Aleatoria


Esperanza(E)

Varianza( 2 )

Discreta:

Discreta:

E(x)=
Continua:
+

E(x)=

Cristina Varela Roa

2
()2

Discreta y Continua:

2 = 2 2 ()

Pgina 9

Tema 4. Algunas distribuciones importantes de probabilidad


Discretas

Binomial
La poblacin est dividida
en dos
X= Nmero de xitos
(, )
Donde:
n=Nmero de veces que hemos
repetido el experimento
p=probabilidad de xito
q=probabilidad de no xito

Poisson

P(X=K) =

E(x)=np
2

P(X=K)=

X= Nmero de
ocurrencias de un cierto
suceso por unidad de
tiempo, superficie
()

E(x)=
2 =

Continuas
Normal
Diremos que
X (, ) si X es una
Variable Aleatoria
Continua con funcin
de densidad:
f(x)=

1
2

E(x)=
= 2
2

( )2
2 2

Chi-cuadrado de
Pearson
Si 1, 2 (, )
= , , ,
t-de student

E(x)=n
2 = 2
P(T, )=

Si Z (, )

E=0
2

T=

F de Snedecor

P(M ,, )=

M=

Cristina Varela Roa

Pgina 10

Relaciones entre distribuciones

Ejemplo: Distribucin de Poisson


Se sabe que en cierto barrio malla un gato cada 5 minutos. Calcular:
X= Nmero de maullidos cada 5 minutos (1)
a) La probabilidad de que mallen 3 gatos en 5 minutos
= 3 = 3 2 =0.9810-0.9197=0,0613=6,13%
b) La probabilidad de que mallen como mximo 2 gatos
2 = 0.9197 = 91,97%
c) La probabilidad de que malle como mnimo 1 gato
1 = 1 1 = 1 0,7358 = 0,2642

Cristina Varela Roa

Pgina 11

Tema5. Introduccin a la Inferencia Estadstica.


Un estadstico es una funcin de las variables aleatorias de la muestra, en la cual no
aparecen parmetros desconocidos

m.a.s

La elipse grande representa a toda la poblacin, mientras que la pequea representa una
muestra aleatoria simple.

Dependiendo del dato de la poblacin total que queremos calcular y de los datos
conocidos de la nuestra existen diversos estadsticos:

Media

Varianza
( )

Diferencia de medias, varianzas


iguales
( ) ( )
=
+

Donde: =

Diferencia de medias, tamaos


muestrales grandes
=

( ) ( )

(, )

+( )
+

Cociente de Varianzas

=
,

Cristina Varela Roa

Proporcin

=
(, )

Diferencia de Proporciones
=

( )
(, )

+

Pgina 12

Ejemplo:

Tema6.Estimacin puntual y por intervalos de confianza


En el siguiente esquema puede observarse la utilidad de utilizar intervalos de confianza, ya que a
partir de ellos podemos calcular aproximaciones para parmetros desconocidos de la poblacin

Poblacin

De donde se extrae

Una muestra
(accesible)

(Inaccesible)
Definida mediante
Definida mediante

Uno o ms estadsticos
(Calculados)

Un parmetro
(desconocido)

A partir del cual puede calcularse


Para aproximarnos a

Un intervalo de confianza

Ejemplo del clculo de un intervalo de confianza para la media de la poblacin ():

Nuestra poblacin sigue una distribucin normal y conocemos ciertos datos de una m.a.s.
Establecemos el nivel de confianza, p , al que queremos calcular nuestro intervalo
(siempre prximo al 100%, pero nunca llegando a l, ya que entonces su IC sera
(, +) )
Calcular el nivel de significacin,
= 1 p
Como buscamos un valor aproximado para la media y esta se
encuentra centrada en el 0, se encuentra dividida en los dos
extremos de la distribucin
Calculamos los dos valores correspondientes a - 2 y 2 ,
que son los dos valores que acotan mi intervalo.

Cristina Varela Roa

Pgina 13

Intervalo de confianza para (media de una poblacin normal)

1;1
, + 1;1
2
2
Intervalo de confianza para (varianza de una poblacin normal)
( 1) 2 ( 1) 2
,
21 ; 1 2 21 ; 2
Intervalo de confianza para la proporcin
1

(1 )
, + 1

(1 )

Intervalo de confianza para la diferencia de media de dos poblaciones Normales


Independientes
Varianzas poblacionales desconocidas
Varianzas poblacionales desconocidas,
pero iguales
iguales o no con n>30
+ 2;1 2

1
1
+

2 2
+

Intervalo de confianza para el cociente de varianzas de dos poblaciones Normales


independientes
1
2
2
,

1,
1;1
2

1, 1;1 2 2
2
Intervalo de confianza para la diferencia de proporciones
( ) 1

(1 ) (1 )
+

Ejemplo: Dada una poblacin Normal de media y desviacin tpica desconocidas,


tenemos una nuestra de tamao 10 cuya media es de 3,5 y cuya desviacin tpica es de 0,2.
Calcular un intervalo de confianza con =0,05

==0,05 -> 1- =0,975


2

IC ()= 1;1

, + 1;1

=[3,59;0,975

0,2
3,5

]=[ 3,52,26

0,2
3,5

]=[3,50,129]=

= [3371 , 3629]
Creemos que la media est en este intervalo a un 5% de confianza

Cristina Varela Roa

Pgina 14

Tema8.Contraste de Hiptesis
Un contraste es una comparacin de cierta caracterstica de dos poblaciones conociendo una
muestra de ambas poblaciones
Pasos para realizar un contraste

Escribir hiptesis
Fijar nivel de significacin ( )
Estadstico
Regla de decisin
Conclusin

Contraste para la media de una


poblacin normal

=
Contraste

Contraste para la varianza

( )
=

Regin de rechazo

0 : = 0
1 : 0

1;1 2
1;1 2

0 : 0
1 : > 0
0 : 0
1 : < 0

1;1

Contraste
0 : 2 = 2 0
1 : 2 2 0
0 : 2
1 : 2
0 : 2
1 : 2

1;

20
> 20
20
< 20

Contraste para la diferencia de medias de dos


poblaciones normales Varianzas
desconocidas pero iguales

( ) ( )

Contraste
0 : = 0
1 : 0
0 :
1 :
0 :
1 :

0
> 0
0
< 0

Cristina Varela Roa

Contraste para la proporcin

Regin de rechazo
+ 2;1 2
+ 2;1 2
+ 2;1
+ 2;

Regin de
Rechazo
2

21; 2
2

2
1;1
2
2
21;1

Contraste

21;

(, )

Regin de rechazo

0 : = 0
1 : 0

2
1 2

0 : 0
1 : > 0
0 : 0
1 : < 0

Contraste para la diferencia de medias de


dos poblaciones normales, tamaos
muestrales superiores a 30

( ) ( )

(, )

+
Contraste
0 : = 0
1 : 0
0 :
1 :
0 :
1 :

0
> 0
0
< 0

Regin de rechazo
2
1 2
1

Pgina 15

Contraste para el cociente de varianzas

( )
(, )

+

Contraste
0 : 2 = 2
1 : 2 2

Regin de Rechazo
1

1, 1;1


0 : 2
1 : 2
0 : 2
1 : 2

Contraste para la diferencia de proporciones

2
> 2
2
< 2

1,
1;1

1, 1;1

1
1, 1;1

Contraste
0 : = 0
1 : 0
0 :
1 :
0 :
1 :

Regin de Rechazo
2
1 2

0
> 0
0
< 0

Ejemplo: Queremos saber si en dos fbricas de tablones de madera la variabilidad de longitud es la misma en la
fbrica A que en la fbrica B, o por el contrario es diferente. Para ello hemos tomado una muestra de las longitudes
(en cm) de 5 tablones de cada una de las fbricas.
Fabrica A
Fabrica B

120
121

121
121

119
122

120
120

118
119

Nos encontramos ante el siguiente caso si suponemos que ambas poblaciones son normales:

N(1 , 1 )

N(2 , 2 )

1 =5

2 =5

A partir del esquema anterior, decidimos el contraste que vamos a realizar, en nuestro caso
queremos comprobar si las varianzas son iguales (0 ) o no lo son (1 ):
0 : 2 1 = 2 2
1 : 2 1 2 2

Cristina Varela Roa

Pgina 16

Como el estadstico que voy a usar es el correspondiente a cociente de varianzas, expreso mi


contraste de la siguiente forma:
21
=1
22
21
1 : 2 1
2

0 :

Fijo el nivel de significacin, ya que el enunciado de mi problema no me dice nada, =0,1


La Regla de decisin en general para este tipo de casos es:

>

1, 1;1 2

1, 1;1 2

<

1, 1;1 2

1, 1;1 2

En mi caso ser:

>

1
4,4;0 95 0
4,4;0 95

1
< 4,4;0 95 0
4,4;0 95

Ahora calculo el valor de 4,4;0 95

4,4;0 95 = 639

Con este valor ya puedo expresar mi regla de decisin:


016 639 0
> 0 16 < 639 0
Ahora pasamos a calcular el valor experimental de F:
=

12
22

Para calcularlo necesito las varianzas de las muestras, que calculo con la expresin: S 2 =

( )2

Obteniendo: 12 = 104 22 = 104


El valor experimental de F es: =

12
22

=1

Segn mi regla de decisin no puedo rechazar 0


Esto quiere decir que al 95% de confianza hay evidencia muestral de que las varianzas de ambas
poblaciones son iguales.

Cristina Varela Roa

Pgina 17

You might also like