Professional Documents
Culture Documents
Variable
Cuantitativa
Discreta
Cualitativa
= Color del Pelo
Rubio
Moreno
Pelirrojo
Otro
57
78
36
18
189
0.30
0.41
0.19
0.10
108
147.6
68.4
36
Diagrama de rectngulos
Diferentes posibilidades de X
Cantidad de
Porcentaje de cada
Frecuencia Absoluta Acumulada
Frecuencia Relativa Acumulada
Angulo que representa cada
Diagrama de sectores
100
10%
Rubio
30%
19%
50
Moreno
Pelirrojo
0
Rubio
Moreno
Pelirrojo
Diagrama de Pareto
Pictograma
100
100
50
50
0
Moreno
Otro
41%
Otro
Rubio
Pelirrojo
Otro
Moreno
Rubio
Pelirrojo
Otro
Pgina 2
Cuantitativa
Discreta
17
18
19
20
21
33
44
66
55
77
275
33
77
143
198
275
0.12
0.16
0.24
0.2
0.28
1
= Edad
0.12
0.28
0.52
0.72
1
Diagrama de barras
Diferentes posibilidades de X
Cantidad de
Porcentaje de cada
Frecuencia Absoluta Acumulada
Frecuencia Relativa Acumulada
Polgono de frecuencias
100
100
50
50
Cuantitativa
Continua
[150-160]
]160-170]
]170-180]
]180-190]
]190-200]
155
165
175
185
195
5
8
10
12
8
43
0,11
0,19
0,23
0,28
0,19
1
5
13
23
35
43
0,11
0,30
0,53
0,81
1
10
10
10
10
10
2
0,8
1
1,2
0,8
X=Altura
Histograma
Intervalo
Marca de Clase
Cantidad de
Porcentaje de cada
Frecuencia Absoluta Acumulada
Frecuencia Relativa Acumulada
Amplitud del Intervalo
Densidad del Intervalo
Polgono de frecuencias
100
100
50
50
, y es un valor
Pgina 3
La moda
La moda es el valor ms frecuente de mis datos.
Cuantiles: deciles, cuartiles y percentiles.
Son valores que dividen al conjunto en un determinado
nmero de partes iguales.
Los deciles (D) dividen al conjunto en 10 partes iguales, y
por lo tanto en cada parte encontramos un 10% de los datos
Los cuartiles (Q) dividen al conjunto en 4 partes iguales, y
por lo tanto en cada parte encontramos un 25% de los
datos
Los percentiles (P) dividen al conjunto en 100 partes
Explicacin grfica de los Cuartiles
iguales, y por lo tanto en cada parte encontramos un 1% de
los datos.
Nota: La Mediana es el mismo valor que el cuartil 2 y que el percentil 50
Medidas de dispersin
Rango
El rango (R) es la diferencia entre el dato ms alto y el ms bajo. Tambin es conocido como
recorrido
El Rango Intercuartlico ( = 3 1 ) soluciona el problema que presenta el rango cuando hay
algunos datos muy dispersos del resto.
( )2
Coeficiente de variacin
El coeficiente de variacin (CV), soluciona el problema que surge al comparar las varianzas de
distintos experimentos que estn en diferentes unidades. La calculamos de la siguiente forma:
=
| |
Medidas de Forma
El Coeficiente de Fisher () nos muestra numricamente si la representacin grfica de nuestros
datos es simtrica o no.
Se calcula de la siguiente forma: =
( )3
3
Pgina 4
Ejemplo: Se ha hecho una encuesta a 100 personas sobre las horas que dedica semanalmente al estudio, 20 de
los encuestados dicen dedicar 3 horas, 30 dicen que 40 horas, 40 dicen que 5 y 10 dicen que 8. A partir de los datos
proporcionados calcular la media, la mediana, la moda, el Rango, la varianza, la desviacin tpica, el coeficiente de
variacin y el coeficiente de Fisher
Con los datos del enunciado podemos hacer la siguiente tabla, que nos ser de gran
utilidad para calcular lo que nos pide el enunciado.
3
4
5
8
20
30
40
10
100
20
50
90
100
0,2
0,3
0,4
0,1
1
0,2
0,5
0,9
1
60
120
200
80
460
460
100
180
480
1000
640
2300
( )
-81,92
-6,48
2,56
393,04
310,2
= 4,6
Para la moda, me fijamos en los y observamos que el valor ms alto es el 04, que corresponde
con 5 horas de estudio; = 5
Fijndonos en la columna podemos calcular la mediana, buscando el valor que pasa del 0,5 y
en este caso coincide con el 4, as que la mediana se encuentra entre el 4 y el 5; = 4,5
Para calcular el Rango, restamos el valor ms elevado de los y le restamos el menor; R= 8-3= 5
Para la varianza usamos la siguiente expresin: 2 =
2 =
2300
100
4,62 = 13,2 2
La raz cuadrada de la varianza es da desviacin tpica que nos da una valor de =4,3 horas
El coeficiente de variacin lo calculamos como el cociente entre la desviacin tpica y la media (en
valor absoluto); =
| |
4,3
4,6
= 0,96 96%
( )3
3
310 ,2
7950 ,7
= 0,039
Este valor nos indica que es asimtrica a la derecha, tal y como podemos comprobar en el grafico
inferior
50
40
30
20
10
0
3
Pgina 5
Tema 2: Probabilidad
En un experimento aleatorio se llama espacio muestral () al
conjunto de todos los posibles resultados de este. Si un suceso
contiene todos los resultados del espacio muestral se dice que es
suceso seguro, si por el contrario no contiene ningn resultado del
espacio muestral, se dice que es suceso imposible y se denota .
Dados dos sucesos A y B, podemos realizar las siguientes operaciones:
Unin. A B Es la
unin de los sucesos
de A y B
Interseccin:
AB
Son los sucesos
comunes de A y B
Incompatibles.
Si no pueden
ocurrir a la vez,
A B=
si cualquier resultado
de B esta tambin lo
es de A, entonces
decimos que
B c A.
es el suceso
complementario de
A si ocurre siempre
que no ocurre A
Leyes de De Morgan.
=
=
Propiedades:
P() = 1
P() = 1 - P(A)
0 P(A) 1
Si A c B:
P(A) P(B)
Probabilidad Condicionada
=
, () 0
Independencia de Sucesos
Si A es un suceso independiente de B:
P(A/B) = P(A),
Y en consecuencia:
P(A B)=P(B)P(A/B)=P(A)P(B)
Cristina Varela Roa
Pgina 6
1 (1 A2 An1)
Teorema de Bayes
Me preguntan por lo primero sabiendo lo segundo
(/)
=
=
()
Ejemplo: Tenemos una maquina que detecta si tenemos cierta enfermedad, pero esta no es fiable al 100%. Si
tenemos la enfermedad y nos sometemos a la prueba, hay un 2% de probabilidad de que falle y si no la tenemos de
un 5%. La probabilidad de que tengamos la enfermedad es del 1%. Calcular:
a) La probabilidad de que estemos contagiados y de que la mquina de positivo
0,99 0,05
= 0,83
0,01 0,98 + 0,99 0,05
Pgina 7
= 1
Funcin de Distribucin F(x)
F()=P( ) =
Se ha de verificar que:
F(-)=0
F(+)=1
F es montona no decreciente
F es continua a la derecha, tiene lmites a
la izquierda y es constante en [1 , )
Funcin de probabilidad
Funcin de distribucin
Variable Continua
Funcin de densidad
f(x) 0,
() = 1
P(a X b) = ()
P(X=a)= () =0
Funcin de densidad
Funcin de distribucin
F(x)=P(X x)= ,
Se ha de verificar que:
F(-)=0
F(+)=1
F es montona no decreciente
F es continua
Funcin de distribucin
Pgina 8
Varianza( 2 )
Discreta:
Discreta:
E(x)=
Continua:
+
E(x)=
2
()2
Discreta y Continua:
2 = 2 2 ()
Pgina 9
Binomial
La poblacin est dividida
en dos
X= Nmero de xitos
(, )
Donde:
n=Nmero de veces que hemos
repetido el experimento
p=probabilidad de xito
q=probabilidad de no xito
Poisson
P(X=K) =
E(x)=np
2
P(X=K)=
X= Nmero de
ocurrencias de un cierto
suceso por unidad de
tiempo, superficie
()
E(x)=
2 =
Continuas
Normal
Diremos que
X (, ) si X es una
Variable Aleatoria
Continua con funcin
de densidad:
f(x)=
1
2
E(x)=
= 2
2
( )2
2 2
Chi-cuadrado de
Pearson
Si 1, 2 (, )
= , , ,
t-de student
E(x)=n
2 = 2
P(T, )=
Si Z (, )
E=0
2
T=
F de Snedecor
P(M ,, )=
M=
Pgina 10
Pgina 11
m.a.s
La elipse grande representa a toda la poblacin, mientras que la pequea representa una
muestra aleatoria simple.
Dependiendo del dato de la poblacin total que queremos calcular y de los datos
conocidos de la nuestra existen diversos estadsticos:
Media
Varianza
( )
Donde: =
( ) ( )
(, )
+( )
+
Cociente de Varianzas
=
,
Proporcin
=
(, )
Diferencia de Proporciones
=
( )
(, )
+
Pgina 12
Ejemplo:
Poblacin
De donde se extrae
Una muestra
(accesible)
(Inaccesible)
Definida mediante
Definida mediante
Uno o ms estadsticos
(Calculados)
Un parmetro
(desconocido)
Un intervalo de confianza
Nuestra poblacin sigue una distribucin normal y conocemos ciertos datos de una m.a.s.
Establecemos el nivel de confianza, p , al que queremos calcular nuestro intervalo
(siempre prximo al 100%, pero nunca llegando a l, ya que entonces su IC sera
(, +) )
Calcular el nivel de significacin,
= 1 p
Como buscamos un valor aproximado para la media y esta se
encuentra centrada en el 0, se encuentra dividida en los dos
extremos de la distribucin
Calculamos los dos valores correspondientes a - 2 y 2 ,
que son los dos valores que acotan mi intervalo.
Pgina 13
1;1
, + 1;1
2
2
Intervalo de confianza para (varianza de una poblacin normal)
( 1) 2 ( 1) 2
,
21 ; 1 2 21 ; 2
Intervalo de confianza para la proporcin
1
(1 )
, + 1
(1 )
1
1
+
2 2
+
1,
1;1
2
1, 1;1 2 2
2
Intervalo de confianza para la diferencia de proporciones
( ) 1
(1 ) (1 )
+
IC ()= 1;1
, + 1;1
=[3,59;0,975
0,2
3,5
]=[ 3,52,26
0,2
3,5
]=[3,50,129]=
= [3371 , 3629]
Creemos que la media est en este intervalo a un 5% de confianza
Pgina 14
Tema8.Contraste de Hiptesis
Un contraste es una comparacin de cierta caracterstica de dos poblaciones conociendo una
muestra de ambas poblaciones
Pasos para realizar un contraste
Escribir hiptesis
Fijar nivel de significacin ( )
Estadstico
Regla de decisin
Conclusin
=
Contraste
( )
=
Regin de rechazo
0 : = 0
1 : 0
1;1 2
1;1 2
0 : 0
1 : > 0
0 : 0
1 : < 0
1;1
Contraste
0 : 2 = 2 0
1 : 2 2 0
0 : 2
1 : 2
0 : 2
1 : 2
1;
20
> 20
20
< 20
( ) ( )
Contraste
0 : = 0
1 : 0
0 :
1 :
0 :
1 :
0
> 0
0
< 0
Regin de rechazo
+ 2;1 2
+ 2;1 2
+ 2;1
+ 2;
Regin de
Rechazo
2
21; 2
2
2
1;1
2
2
21;1
Contraste
21;
(, )
Regin de rechazo
0 : = 0
1 : 0
2
1 2
0 : 0
1 : > 0
0 : 0
1 : < 0
( ) ( )
(, )
+
Contraste
0 : = 0
1 : 0
0 :
1 :
0 :
1 :
0
> 0
0
< 0
Regin de rechazo
2
1 2
1
Pgina 15
( )
(, )
+
Contraste
0 : 2 = 2
1 : 2 2
Regin de Rechazo
1
1, 1;1
0 : 2
1 : 2
0 : 2
1 : 2
2
> 2
2
< 2
1,
1;1
1, 1;1
1
1, 1;1
Contraste
0 : = 0
1 : 0
0 :
1 :
0 :
1 :
Regin de Rechazo
2
1 2
0
> 0
0
< 0
Ejemplo: Queremos saber si en dos fbricas de tablones de madera la variabilidad de longitud es la misma en la
fbrica A que en la fbrica B, o por el contrario es diferente. Para ello hemos tomado una muestra de las longitudes
(en cm) de 5 tablones de cada una de las fbricas.
Fabrica A
Fabrica B
120
121
121
121
119
122
120
120
118
119
Nos encontramos ante el siguiente caso si suponemos que ambas poblaciones son normales:
N(1 , 1 )
N(2 , 2 )
1 =5
2 =5
A partir del esquema anterior, decidimos el contraste que vamos a realizar, en nuestro caso
queremos comprobar si las varianzas son iguales (0 ) o no lo son (1 ):
0 : 2 1 = 2 2
1 : 2 1 2 2
Pgina 16
0 :
1, 1;1 2
1, 1;1 2
<
1, 1;1 2
1, 1;1 2
En mi caso ser:
>
1
4,4;0 95 0
4,4;0 95
1
< 4,4;0 95 0
4,4;0 95
4,4;0 95 = 639
12
22
Para calcularlo necesito las varianzas de las muestras, que calculo con la expresin: S 2 =
( )2
12
22
=1
Pgina 17