Professional Documents
Culture Documents
Distribuciones de Probabilidad
Las distribuciones de probabilidad son generadas por una variable aleatoria x, (se denomina variable
porque puede tomar diferentes valores, aleatoria, porque el valor tomado es totalmente al azar) la que
puede ser de dos tipos:
Variable aleatoria discreta (x), porque solo puede tomar valores enteros y un número finito de
ellos. Ejemplos:
Variable aleatoria continua (x), porque puede tomar tanto valores enteros como fraccionarios y
1
1. Distribución de probabilidad discreta.
Es generada por una variable discreta (x), que toma solo valores enteros:
X= 0,1,2,3,4,5,………, etc
p(xi)≥0 Las probabilidades asociadas a cada uno de los valores que toma x deben ser mayores o iguales a
cero.
∑ p(xi) = 1 La sumatoria de las probabilidades asociadas a cada uno de los valores que toma x debe
ser igual a 1.
Es generada por una variable continua (x), por lo tanto puede tomar tanto valores enteros como
fraccionarios.
f(x) ≥ 0 Las probabilidades asociadas a cada uno de los valores que toma x deben ser
mayores o iguales a cero. Dicho de otra forma, la función de densidad de probabilidad deberá tomar
solo valores mayores o iguales a cero.
La sumatoria de las probabilidades asociadas a cada uno de los valores que toma
x debe ser igual a 1. El área definida bajo la función de densidad de probabilidad deberá ser de 1.
2
Cálculo de la media y desviación estándar de una distribución de probabilidad Discreta
1. Media o valor esperado de x. Para determinar la media de la distribución discreta se utiliza la siguiente fórmula:
Donde:
µ= media de la distribución
E(x) = valor esperado de x
xi = valores que toma la variable
p(xi) = probabilidad asociada a cada uno de los valores de la variable x
2. Desviación estándar. La desviación estándar de una distribución discreta se obtiene con la siguiente fórmula:
Donde:
= desviación estándar
µ = media o valor esperado de x
xi = valores que toma la variable x
p(xi) = probabilidad asociada a cada uno de los valores que toma x
1. Media o valor esperado de x. Para calcular la media de una distribución de probabilidad continua se
utiliza la siguiente fórmula:
Donde:
µ = E(x) = media o valor esperado de la distribución
x = variable aleatoria continua
f(x) = función de densidad de la distribución de probabilidad
2. Desviación estándar.- La fórmula para determinar la desviación estándar de una distribución continua es
luego:
3
Algunas distribuciones de probabilidad
Discretas: Continuas:
Distribución Binomial Distribución Normal
Distribución Hipergeométrica Distribución t- Student
Distribución de Poisson Distribución Chi Cuadrado
Distribución Geométrica
Distribución F de Fisher
Distribución Binomial Negativa
4
1. Distribución Binomial. (Jakob Bernoulli: Suiza, 1654-1705)
Corresponde a la principal distribución de probabilidad discreta; proviene de experimentos que tienen dos posibles
resultados: éxito o fracaso. Por lo tanto los datos son resultado de un conteo, razón por la cual se clasifica como
distribución discreta. Específicamente consiste de varias pruebas y en cada una la probabilidad de éxito es la misma,
por lo que son independientes.
Para elaborar una distribución binomial es necesario conocer el número de pruebas que se repiten y la probabilidad
de que suceda un éxito en cada una de ellas. La fórmula que describe la distribución binomial es la siguiente:
n!
Ecuación (1)
b( x; n, p) p x (1 p ) n x
( n x )! x!
donde:
n es el número de pruebas
x es el número de éxitos
p es la probabilidad de obtener un éxito
q es la probabilidad de obtener un fracaso, que se calcula q = 1- p
b(x;n,p) representa la probabilidad de obtener x éxitos en n pruebas
Distribución Binomial
Parámetros:
n!
P ( x; n , p ) p x (1 p ) n x
( n x )! x!
n!
P ( x; n , p ) p xq n x
( n x )! x!
10
5
Distribución Binomial
Ejemplo
La probabilidad de éxito de una determinada vacuna es 0,72. Calcular la probabilidad de que una vez
administrada a 15 pacientes:
a) Ninguno sufra la enfermedad
b) Todos sufran la enfermedad
c) Dos de ellos contraigan la enfermedad
Solución: Se trata de una distribución binomial de parámetros B(n=15; p=0,72)
15!
a) P ( x 15 ) ( 0,72 )15 ( 0, 28 ) 0 0,00724
(15 15 )!15!
15!
b) P ( x 0) ( 0,72 ) 0 ( 0, 28 )15 5,097 * 10 9
(15 0 )!0!
15!
c) P ( x 13) ( 0,72 )13 (0,28 ) 2 0,11503
(15 13)!13!
11
La distribución de Poisson describe la probabilidad como un acontecimiento fortuito ocurrido en un tiempo o intervalo de
espacio bajo las condiciones que la probabilidad de un acontecimiento ocurre es muy pequeña, pero el número de intentos
es muy grande, entonces el evento actual ocurre algunas veces.
Características:
• El número medio (promedio) de eventos en el espacio temporal o región específica, se denota como µ (mu).
• El número de resultados que ocurren en un intervalo de tiempo o región específicos es independiente de el número que
ocurre en cualquier otro intervalo de tiempo o región.
• La probabilidad de que un resultado muy pequeño ocurra en un intervalo de tiempo muy corto o en una región pequeña
es proporcional a la longitud del intervalo de tiempo o al tamaño de la región.
• La probabilidad de que más de un resultado ocurra en un intervalo de tiempo tan corto, o en esa región tan pequeña es
inapreciable, que se puede asignar el cero.
12
6
Distribución de Poisson:
e x
p ( x; )
Ecuación x!
p (x /µ) = la probabilidad de que ocurran X éxitos cuando el número promedio de ocurrencia de ellos es µ.
µ media o promedio de éxitos por unidad de tiempo, área o producto e es la constante 2.7183, base de los
logaritmos naturales, en tanto que los valores de e- pueden obtenerse de tablas.
X señala un valor específico que la variable pueda tomar (el número de éxitos que deseamos ocurran).
Por definición, el valor esperado (media en el intervalo o región de interés) de una distribución de
probabilidad de Poisson es igual a la media de la distribución.
Media
La varianza del número de eventos de una distribución de probabilidad de Poisson también es igual a la media
de la distribución . De este modo, la desviación estándar es la raíz cuadrada de µ.
Varianza
13
Ejemplo:
a) p ( x 3;21)
e 21 213 2,718221 213
0,000001170
3! 123
b) p ( x 3) 1 P ( x 3)
e 21 210 e 21 211 e 21 212
b) p ( x 3) 1
0! 1! 2!
b)
p ( x 3) 1 7,58 1010 1,59 10 8 1,67 7 1,84 107
0,0000000184
14
7
2.1. Aproximación de la distribución binomial por una de Poisson
Algunas veces resulta tedioso calcular las distribuciones binomiales, sobre todo si n
es muy grande y p o q (éxito y fracaso) es muy pequeña. En este caso se puede usar
la Poisson, bajo ciertas condiciones:
a) n ≥ 30 b) np ó nq < 5
15
Ejemplo:
Cierta enfermedad tiene una probabilidad muy baja de ocurrir, p=1/100.000. Calcular
la probabilidad de que en una ciudad con 500.000 habitantes haya más de 3 personas
con dicha enfermedad.
16
8
Algunas Distribuciones de
Probabilidad Continuas
17
Las estadísticas “gaussianas” se emplean frecuentemente para determinar los “límites normales”
aplicados a las pruebas de laboratorio de análisis clínicos, que como alternativa se adopta “limites de
referencia” Aparece de manera natural en errores de medida, contenido neto, diámetros, longitud y
para distribuciones binomiales con n grande (n>30) y ‘p pequeño’ (np>5).
La distribución normal está determinada por dos parámetros, su media (µ) y su desviación estándar
(). Su función es:
18
9
19
1. La media, la mediana y la moda tienen valores parecidos, o iguales, esto implica que es simétrica respecto
a su media . Existe una probabilidad de un 50% de observar un dato mayor que la media, y un 50% de
observar un dato menor.
2. La curva normal es asintótica al eje de abscisas, cualquier valor entre - y + es teóricamente posible. El
área total bajo la curva es, por tanto, igual a 1.
3. La distancia entre la línea trazada en la media y el punto de inflexión de la curva es igual a una desviación
típica ( ). Cuanto mayor sea , más aplanada será la curva de la densidad.
4. El área bajo la curva comprendido entre 2 desviaciones estándar de la media es igual a 0.95. En concreto,
un 95% de posibilidades de observar un valor comprendido en el intervalo ( - 1,96, +1,96).
Los porcentajes de área entre ±1, ±2 y ±3 unidades de desviación estándar se presentan en la figura 2
20
10
Figura 2. Areas bajo la curva normal.
21
5. La campana depende de los parámetros y . La media indica posición, así para diferentes valores de
la gráfica es desplazada a lo largo del eje horizontal. La determina el grado de apuntamiento de la
curva. A mayor , más se dispersarán los datos en torno a la media y la curva será más plana. Un
valor pequeño de indica, por tanto, gran probabilidad de obtener datos cercanos al valor medio de la
distribución.
Como se deduce de este último apartado, no existe una única distribución normal, sino una familia de
distribuciones con una forma común, diferenciadas por los valores de su media y su varianza. De entre
todas ellas, la más utilizada es la distribución normal estándar, que corresponde a una distribución de
media 0 y varianza 1. Así, la expresión que define su densidad se puede obtener de la Ecuación 1,
resultando:
22
11
Es importante conocer que, a partir de cualquier variable X que siga una distribución N(,), se
puede obtener otra característica Z con una distribución normal estándar, sin más que efectuar la
transformación:
Esta propiedad es interesante en la práctica, ya que para la distribución N(0,1) existen tablas
publicadas (TABLA 1 DISTRIBUCIÓN NORMAL ESTANDAR) a partir de las que se puede obtener de
modo sencillo la probabilidad de observar un dato menor o igual a un cierto valor z, y que
permitirán resolver preguntas de probabilidad acerca del comportamiento de variables de las que se
sabe o se asume que siguen una distribución aproximadamente normal.
23
UTILIZAR TABLA
DE LA
PLATAFORMA
24
12
Limitaciones de la distribución:
• Los datos obtenidos son de grupos de individuos seleccionados deliberadamente porque son
sanos o “normales”
• Definir la normalidad en el 95%. Lo cual implica que podría existir una persona sana que
resulta anormal por azar.
• Todos los valores más allá de los límites establecidos son considerados anormales.
25
Ejemplo
Supongamos que se sabe que el peso de los sujetos de una determinada población sigue una
distribución aproximadamente normal, con una media de 80 Kg y una desviación estándar de 10
Kg. Lo anterior se denota por N(80,10)
a) ¿Podremos saber cuál es la probabilidad de que una persona, elegida al azar, tenga un
peso superior a 100 Kg?
Desarrollo
26
13
para poder utilizar dicha tabla. Así, la probabilidad que se desea calcular será:
Esta última probabilidad puede ser fácilmente obtenida a partir de la Tabla 1, resultando ser P(Z ≤
2)=0,9772 . Por lo tanto, la probabilidad buscada de que una persona elegida aleatoriamente de
esa población tenga un peso mayor de 100 Kg , es de 1–0.9772=0.0228, es decir,
aproximadamente de un 2.3%.
27
Existe una medición X con media µ y desviación estándar y se desea utilizar la curva normal.
Se debe transformar la escala de X de tal manera que la media se hace cero y la desviación
estándar 1.
Este re escalamiento está dado por la relación:
X
Z “desviación estándar normal”
28
14
Ejemplo.
Así:
29
¿Entre que valores, por sobre y bajo la media se ubica el 80% de los valores de glucosa en
sangre de los individuos?
X Z X 100 25 Z
Formula de referencia:
El Z para la cola de arriba + 0,68
El Z para la cola de abajo - 0,68
30
15
Ejemplos
31
• Una variable aleatoria se distribuye según el modelo de t-Student con n grados de libertad, donde n es un
entero positivo, si su función de densidad es la siguiente:
n 1
(
2
) 1
t 2 ( n 1) t ( p) x p 1e x dx siendo p0
f (t ) (1 ) 2
n n 0
( ) n
2
• La gráfica de esta función de densidad es simétrica respecto del eje de ordenadas, con
independencia del valor de n, y de forma semejante a la distribución normal.
32
16
33
Propiedades:
• Cuando los grados de libertad son altos, los valores de t coinciden con los de la normal.
34
17
Distribución “t” de Student
Definiendo el estadístico t:
x -μ
t=
s/ n
Se puede probar que siendo x de una muestra tomada de una población normal con
el promedio
media µ y varianza 2, el estadístico t es el valor de una variable aleatoria con distribución "t" de
Student y parámetro (grados de libertad) = n-1.
35
Localizamos la columna del valor de y fila del valor de (n-1). La intersección de la fila y la columna
nos dará el valor de t.
UTILIZAR TABLA
DE LA
PLATAFORMA
36
18
Distribución Ji-cuadrado
(n -1) s2
=2
2
37
38
19
Características Ji-cuadrado
39
Valores 2 para varios , Área a su derecha = . 1ª columna = 1ª fila: áreas en la cola a la derecha de 2
Cuerpo tabla son los valores de 2
UTILIZAR TABLA
DE LA
PLATAFORMA
40
20
Ejercicios
a) Calcular la probabilidad de obtener un valor mayor de 23.7 en una distribución 2 con = 14 g.d.l.
b) Calcular el valor de 2 después del cual se encuentre el 5% del área en una distribución Ji-
cuadrado con 4 g.d.l.
41
2
Definimos el estadístico F como:
F = s2 1
s2
El cual es el valor de una variable aleatoria que tiene distribución F con parámetros
1=n1-1 y 2=n2-1.
42
21
Propiedades de Distribución F
43
Tabla de Distribución F
44
22