You are on page 1of 31

1

Distribuciones de
probabilidad tericas
Bioestadstica
2
Variable aleatorias
El resultado de un experimento aleatorio
puede ser descrito en ocasiones como una
cantidad numrica.

En estos casos aparece la nocin de
variable aleatoria
Funcin que asigna a cada suceso un nmero.
Las variables aleatorias pueden ser discretas o
continuas.
3
Ejemplos variables aleatorias
Experimento aleatorio: Seleccionar una
persona al azar de una poblacin de sujetos y
registrar.
N hermanos
Variable Funcin Valores
0, 1, 2, 3+
IR+
IR+
1, 0
Sexo
Edad
Estatura
Tipo
Discreta
Continuas
Nominal
4
Funcin de probabilidad
Funcin de probabilidad de una variable
aleatoria Discreta: Relaciona los valores de las
variables con la probabilidad de ocurrencia de
ellos.

0%
5%
10%
15%
20%
25%
30%
35%
40%
0 1 2 3
Ejemplo: Nmero de caras
al lanzar 3 monedas.
5
Ejemplo funcin de probabilidades
de una v.a.d.
Evento de inters: ser fumador.
Probabilidad de ser fumador p = 0.30
Problema: Cul es la probabilidad de que
entre tres personas seleccionadas al azar en
esta sala de clases una sea fumadora?
Sea X la v.a.d.: el nmero de personas
fumadoras:

X = 0, 1, 2 3
6
Funcin de probabilidad de la v.a.d. X
Notar que: P(X=0) + P(X=1) + P(X=2) + P(X=3) =1
Persona1 Persona2 Persona3 X P(X=x) p=0.30
nf
sf
nf
nf
sf
sf
nf
sf
nf
nf
sf
nf
sf
nf
sf
sf
nf
nf
nf
sf
nf
sf
sf
sf
0
1
1
1
2
2
2
3
(1-p) (1-p) (1-p)
p(1-p) (1-p)
(1-p)p(1-p)
(1-p) (1-p)p
pp(1-p)
p(1-p)p
(1-p)pp
ppp
0.343
0.147
0.147
0.147
0.063
0.063
0.063
0.027
7
Funcin de probabilidad de la v.a.d. X
x P(X=x)
0 0.343
1 0.441
2 0.189
3 0.027
Suma 1.000
8
La funcin de densidad de una variable
aleatoria continua: Describe la distribucin de
frecuencia de dicha variable como un polgono de
frecuencia terico.
Funcin de Densidad
Ejemplo: Peso corporal de
una persona.
9
Funcin de densidad / Probabilidad
30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 105 110
10
Parmetros de variables aleatorias
Valor esperado y varianza de una variable
aleatoria X
Valor esperado o Esperanza de X
Se representa mediante E[X] =
Es el equivalente a la media

Varianza
Se representa mediante V[X] =
2

Es el equivalente a la varianza
11
Modelos importantes de variables aleatorias
Hay v.a. que aparecen con frecuencia en las
Ciencias de la Salud.
Experimentos dicotmicos (vivo/muerto,
xito/fracaso).
Bernoulli

Contar xitos en experimentos dicotmicos
repetidos:
Binomial
Poisson (sucesos raros)

Y en otras muchas ocasiones
Distribucin normal (campana gaussiana)


El resto del tema est dedicado a estudiar estas
distribuciones especiales.
12
Distribucin de Bernoulli
Tenemos un experimento de Bernoulli si al realizar un
experimentos slo son posibles dos resultados:
X=1 (xito, con probabilidad p)
X=0 (fracaso, con probabilidad q=1-p)

Lanzar una moneda y que salga cara.
p=1/2
Elegir una persona de la poblacin y que est
enfermo.
p=1/1000 = prevalencia de la enfermedad
13
Distribucin de Bernoulli
Aplicar un tratamiento a un enfermo y que ste
se cure.
p=0.95, probabilidad de que el individuo se cure

Como se aprecia, en experimentos donde el resultado es
dicotmico, la variable queda perfectamente
determinada conociendo el parmetro p.
14
Ejemplo de distribucin de Bernoulli
Se ha observado en un estudio de 2000 accidentes de
trfico con impacto frontal y cuyos conductores no tenan
cinturn de seguridad, que 300 individuos quedaron con
secuelas. Describa el experimento usando conceptos de
v.a.

Solucin.
La noc. frecuentista de prob. nos permite aproximar la
probabilidad de tener secuelas mediante
300/2000=0,15=15%

X=tener secuelas tras accidente sin cinturn es
variable de Bernoulli
X=1 tiene probabilidad p 0,15
X=0 tiene probabilidad q 0,85
15
Distribucin Binomial
Si se repite un nmero fijo de veces, n, un experimento de Bernoulli
con parmetro p, el nmero de xitos sigue una distribucin
binomial de parmetros (n,p).
Lanzar una moneda 10 veces y contar las caras.
Bin(n=10,p=1/2)

Lanzar una moneda 100 veces y contar las caras.
Bin(n=100,p=1/2)
Difcil hacer clculos con esas cantidades. El modelo
normal ser ms adecuado.

El nmero de personas que enfermar (en una poblacin de
500.000 personas) de una enfermedad que desarrolla una de
cada 2000 personas.
Bin(n=500.000, p=1/2000)
16
Distribucin Binomial
Funcin de probabilidad



Problemas de clculo si n es grande o p cercano
a 0 o 1.

Media: = E[X]= n p
Varianza:
2
=V[X]
= n p q
n n n donde
k k n
n
k
n
* ) 1 ( * ...... * 3 * 2 * 1 !
! ! ) (
!
=

=
|
|
.
|

\
|
n k q p
k
n
k X P
k n k
s s
|
|
.
|

\
|
= =

0 , ] [
17
Caractersticas distribucin Binomial
En cada ensayo u observacin slo son
posibles dos resultados, mutuamente
excluyentes. Por convencin estos
resultados se llaman xito y fracaso.
Los resultados de la serie de ensayos,
constituyen eventos independientes.
La probabilidad de un xito de cada
ensayo, indicada por p, es constante de un
ensayo a otro.
18
Ejemplo Binomial
Se sabe que una forma particular de leucemia provoca la
muerte en el 80% de los casos. En un hospital en donde se
estudian neoplasmas malignos se tratan 10 enfermos con esta
forma de leucemia. Cul es la probabilidad que:

a) Exactamente sobrevivan 7 pacientes? R: 0.000786432

b) Sobrevivan a lo ms 3 pacientes? R: 0.87912612

c) E[X] R: 2

d) V[X] R: 1.6
19
Ejemplo de grficas distribucin binomial
b(10,x,0.3)
0.00
0.30
0.60
0.90
0 1 2 3 4 5 6 7 8 9 10
X
P
(
X
=
x
)
b(10,x,0.95)
0.00
0.30
0.60
0.90
0 1 2 3 4 5 6 7 8 9 10
X
P
(
X
=
x
)
b(10,x,0.5)
0.00
0.30
0.60
0.90
0 1 2 3 4 5 6 7 8 9 10
X
P
(
X
=
x
)
20
Distribucin Poisson
Tambin se denomina de sucesos raros.
Se obtiene como aproximacin de una
distribucin binomial con la misma media, para
n grande (n>30) y p pequeo (p<0,1).
Queda caracterizada por un nico parmetro
(que es a su vez su media y varianza.)
| | | | = = = X V X E
p n = donde
. ,....... 3 , 2 , 1 , 0 ;
!
} ; { =

= = x
x
e
x
x X P

21
Caractersticas Poisson
La probabilidad que acontezca un suceso
en un intervalo es proporcional a la
amplitud del intervalo.
En principio, tericamente es posible que
suceda un nmero infinito de eventos en
un intervalo dado. No hay lmite al nmero
de ensayos.
Los sucesos ocurren independientemente
tanto en el mismo intervalo como entre
intervalos consecutivos

22
Ejemplo Poisson
Suponga que en cierta poblacin, la probabilidad de que
una persona est involucrada en un accidente motorizado
es de 0.00024 en un ao dado. Si la poblacin en cuestin
est constituida por 10.000 personas, cul es la
probabilidad de que ninguna persona est involucrada en
un accidente motorizado en:
a) Un ao? =10.000*0.00024=2.4
091 . 0
! 0
4 . 2
} 0 {
4 . 2 0
= = =

e
X P
b) En tres meses? =2.4 /4 = 0.6
P X
e
{ }
.
!
.
.
= = =

0
06
0
0549
0 0 6
23
Curva Normal Distribucin Gaussiana
Es la distribucin para variables continuas ms ampliamente usada
por la teora estadstica. Varios matemticos han contribuido a su
desarrollo, entre los que podemos contar al astrnomo-matemtico
del siglo XIX Karl Gauss. Existen dos razones bsicas por las cuales
la distribucin normal ocupa un lugar tan prominente en la
estadstica. Primero, tiene algunas propiedades que la hacen
aplicable a un gran nmero de situaciones en las que es necesario
hacer inferencias mediante la toma de muestras. Segundo, la
distribucin normal casi se ajusta a las distribuciones de frecuencias
reales observadas en muchos fenmenos, incluyendo caractersticas
humanas (pesos, alturas), resultados de procesos fsicos
(dimensiones y rendimientos) y muchas otras medidas de inters
para los administradores, tanto en el sector pblico como en el
privado.
24
Su funcin de densidad distribucin Normal
)
`

=
2
2
) (
2
1
exp
2
1
) (
o
t o
x x f
donde representa la media de la poblacin y o su
desviacin estndar. Se denota: X ~ N(, o
2
) ; E[X]= ;
V[X] = o
2
0 1 2 3 4 5 6 7 8 9 10
Media
n=30
n=10
n=50
25
Caractersticas de la distribucin normal
La curva es unimodal y tiene forma de campana.
La media de una poblacin distribuida normalmente cae
en el centro de su curva normal.
Debido a la simetra de la distribucin normal de
probabilidad, la mediana y la moda de la distribucin se
encuentran tambin en el centro; en consecuencia, para
una curva normal, la media, la mediana y la moda tienen
el mismo valor.
Los dos extremos de la distribucin normal de
probabilidad se extienden indefinidamente y nunca
tocan el eje horizontal.
26
Uso de la tabla de distribucin de
probabilidad normal estndar
Estandarizacin curva normal:
o

=
x
Z
x = Valor de la variable aleatoria X
= Media de la distribucin de la variable
aleatoria
o= Desviacin estndar de la distribucin
z = Nmero de desviaciones estndar que hay
desde x a la media de la distribucin
Observacin: En Z se cumple que: = 0 y o
2
= 1
27
Ejemplo
Para la poblacin de hombres entre 18 y 74 aos de edad, se sabe que la
presin sistlica se distribuye aproximadamente normal con media 129
mmHg y desviacin estndar de 19.8 mmHg. 1) Si se selecciona al azar
un hombre de esta poblacin, cul es la probabilidad de que su presin
sistlica sea mayor de 150 mmHg?
06061 . 1
8 . 19
129 150
150
8 . 19
129
=

= =

= z x pero
x
Z
P(X>150)=P(Z>1.06)
=0.1446
28
Aplicaciones
2) Si se selecciona al azar un hombre de esta poblacin, cul es la probabilidad de
que su presin sistlica sea menor o igual a 150 mmHg?
P(X150)=P(Z 1.06)=1-0.1446=0.8554
3) Si se selecciona al azar un hombre de esta poblacin, cul es la probabilidad de
que su presin sistlica se encuentre entre 129 y 150 mmHg?
P(129 X150)=P(0 Z 1.06)=0.5-0.1446=0.3554
4) Si se selecciona al azar un hombre de esta poblacin, cul es la probabilidad de
que su presin sistlica se encuentre entre 108 y 150 mmHg?
P(108 X150)=P(-1.06 Z 1.06)=1-2x0.1446=0.7108
5) Si se selecciona al azar un hombre de esta poblacin, cul es la probabilidad de
que su presin sistlica se encuentre entre 108 y 120 mmHg?
P(108 X120)=P(-1.06 Z -0.45)=0.3264-0.1446=0.1818
29
Aplicaciones
6) Si se selecciona al azar un hombre de esta poblacin, Entre que valores se
encuentra el 95% central de las presiones sistlicas tomadas de esta poblacin?
0.025
0.025
o
o

2
z
1291.96x19.8
[90.192 ; 167.808]
30
7) Encuentre el valor del cuartil 1
-0.67=(C
1
-129)/19.8 => C
1
= 115.73
El 25% de los hombres tiene una presin sistlica menor o igual a
115.73 mmHg
31
Referencias
1. http://campusvirtual.uma.es/est_fisio/apuntes/
2. Pagano, M. y Gauvreau, K (1993) "Principles of
Biostatistics". Editorial Duxbury Press. Belmont
California.

You might also like