You are on page 1of 20

APUNTES PARA ESTADÍSTICA II

MC NIDIA GÓMEZ DUARTE

1.1 DISTRIBUCIONES MULTIVARIADAS (Caso Discreto)


Función de probabilidad conjunta

Supongamos que realizamos el experimento siguiente: se lanzan dos dados legales. Ahora
se desea determinar cuáles son todos los posibles resultados y sus respectivas
probabilidades.

El espacio muestral está dado por:

S= { }
Y la función de probabilidad: f(x, y) =

Gráficamente:

Definición.
Si X y Y son variables aleatorias discretas, la función dada para 𝑓(𝑥, 𝑦) = 𝑃(𝑋 = 𝑥, 𝑌 =
𝑦) = 𝑃(𝑋 = 𝑥 ∩ 𝑌 = 𝑦) para cada par de valores (x, y) dentro del intervalo de (x, y) se
llama distribución de probabilidad conjunta o función de probabilidad conjunta.

Teorema.
Una función bivariada puede servir como la distribución de probabilidad conjunta de un
par de variables aleatorias discretas X y Y si y sólo si sus valores f(x, y) satisfacen las
condiciones:
 𝑓(𝑥, 𝑦) ≥ 0 para cada par de valores en su dominio
 ∑𝑥 ∑𝑦 𝑓(𝑥, 𝑦) = 1, donde la doble suma se extiende sobre todos los
posibles pares de (x, y) dentro de su dominio.
Ejemplo:
1. 2 cápsulas se seleccionan al azar de un frasco con 3 aspirinas, 2 sedantes y 4
laxantes. a. Escribe la función de probabilidad conjunta si llamamos a X como la
cantidad de aspirinas seleccionadas y a Y como la cantidad de sedantes
seleccionados.

b. Determina P(x<3, Y=2).

c. Determina P(x<3, Y<2).

2. Determina el valor de k para que f(x, y) = kxy, x = 1,2,3; y = 1,2,3 pueda


representar una función de probabilidad conjunta.

3. Tres monedas balanceadas se lanzan en forma independiente al aire. Una de las


variables de interés es X es el número de caras. Denote con Y la cantidad de dinero
ganado en una apuesta colateral en la siguiente forma. Si la primera cara aparece
en el primer tiro, usted gana $1. Si la primera cara aparece en el tiro 2 o en el 3
usted gana $2 o $3, respectivamente. Si no aparece una cara, usted pierde $1 (esto
es, gana –$1).
a. Encuentra la función de probabilidad conjunta para X y Y.

b. ¿Cuál es la probabilidad de que haya menos de tres caras y se gane $1 o


menos
1.2 DISTRIBUCIONES MULTIVARIADAS (Caso Continuo)
Función de densidad de probabilidad conjunta

Definición
Una función bivariada con valores f(x, y) definida sobre el plano XY, se llama función
de densidad de probabilidad conjunta de las variables aleatorias continuas X y Y si y sólo
si:

𝑃[(𝑥, 𝑦) ∈ 𝐴] = ∬ 𝑓(𝑥, 𝑦)𝑑𝑥𝑑𝑦


𝐴
Para cualquier región A del plano XY.

Teorema
Una función bivariada puede servir como una función de densidad de probabilidad
conjunta de un par de variables aleatorias continuas X y Y si sus valores f(x, y) satisfacen
las condiciones:
 𝑓(𝑥, 𝑦) ≥ 0; −∞ < 𝑥 < ∞ 𝑦 −< 𝑦 < ∞
∞ ∞
 ∫−∞ ∫−∞ 𝑓(𝑥, 𝑦)𝑑𝑥𝑑𝑦 = 1

Ejemplos.
𝑘(𝑥 + 𝑦) 𝑝𝑎𝑟𝑎 0 < 𝑥 < 1, 0 < 𝑦 < 2
1. Sea 𝑓(𝑥, 𝑦) = {
0 𝑝𝑎𝑟𝑎 𝑐. 𝑜. 𝑙
a) Determina el valor de k que hace a f(x, y) una función de densidad conjunta

b) Determina 𝑃(𝑋 ≤ 0.5, 𝑌 < 1.5);


c) P(y<x)

2. Si la densidad de probabilidad conjunta de X y Y está dada por:


24𝑥𝑦 𝑝𝑎𝑟𝑎 0 < 𝑥 < 1, 0 < 𝑦 < 1, 𝑥+𝑦 <1
𝑓(𝑥, 𝑦) = {
0 𝑝𝑎𝑟𝑎 𝑐. 𝑜. 𝑙
Determina:
a) 𝑃(𝑋 ≤ 0.5, 𝑌 ≤ 0.5)

2
b) 𝑃 (𝑋 + 𝑌 > 3)

c) 𝑃(𝑋 > 2𝑌).


1.3 FUNCIÓN DE DISTRIBUCIÓN DE PROBABILIDAD ACUMULADA
Sea f(x,y) una función de probabilidad, entonces la función dada por:

𝐹(𝑥, 𝑦) = 𝑃(𝑋 ≤ 𝑥, 𝑌 ≤ 𝑦) = ∑ ∑ 𝑓(𝑠, 𝑡)


𝑠≤𝑥 𝑡≤𝑦

Es la función de distribución conjunta acumulada de X y Y para el caso discreto y,


∞ ∞
𝐹(𝑥, 𝑦) = 𝑃(𝑋 ≤ 𝑥, 𝑌 ≤ 𝑦) = ∫ ∫ 𝑓(𝑠, 𝑡)𝑑𝑦𝑑𝑥
−∞ −∞

para el caso continuo.

Ejemplos.
1. La densidad conjunta de X, la proporción de la capacidad del tanque que se abastece
al principio de la semana, y Y, la proporción de la capacidad vendida durante la
semana está dada por
3𝑥 𝑝𝑎𝑟𝑎 0 ≤ 𝑦 ≤ 𝑥 ≤ 1
𝑓(𝑥, 𝑦) = {
0 𝑝𝑎𝑟𝑎 𝑐. 𝑜. 𝑙

a) Determina F(1/2, 1/3)

b) Determina la probabilidad de que la cantidad vendida sea menor que la


mitad de la cantidad comprada.
2. Suponga que p, el precio de cierta mercancía (en dólares), y s sus ventas totales (en
10,000 unidades), son variables aleatorias cuya distribución de probabilidad conjunta
se puede aproximar bastante con la densidad de probabilidad conjunta
5𝑝𝑒 −𝑝𝑠 𝑝𝑎𝑟𝑎 0.2 ≤ 𝑝 ≤ 0.2, 𝑠 > 0
𝑓(𝑥, 𝑦) = {
0 𝑝𝑎𝑟𝑎 𝑐. 𝑜. 𝑙

Encuentre las probabilidades que:


a) el precio será menor que 30 centavos y las ventas excederán 20,000
unidades;

b) el precio estará entre 25 y 30 centavos y las ventas serán de menos de


10,000 unidades.
1.4 DISTRIBUCIONES MARGINALES (Caso Discreto)
Si X y Y son variables aleatorias discretas y p(x, y) es el valor de la distribución de
probabilidad conjunta en (x, y), la función dada por:

𝑔(𝑥) = ∑ 𝑝(𝑥, 𝑦)
𝑇𝑜𝑑𝑎 𝑦

Es llamada la distribución marginal de X.

De manera análoga, la función dada por:

ℎ(𝑦) = ∑ 𝑝(𝑥, 𝑦)
𝑇𝑜𝑑𝑎 𝑥

es llamada la distribución marginal de Y.


Ejemplos:
Dada la distribución de probabilidad conjunta:
P(x, y) 0 1 2 h(y)
0 1/6 1/3 1/12
1 2/9 1/6 0
2 1/36 0 0
g(x)

Determina las distribuciones marginales de X y Y.


1.5 DISTRIBUCIONES MARGINALES (Caso Continuo)
Si X y Y son variables aleatorias continuas y f(x, y) es el valor de la densidad de
probabilidad conjunta en (x,y), la función dada por:

𝑔(𝑥) = ∫ 𝑓(𝑥, 𝑦)𝑑𝑦 𝑝𝑎𝑟𝑎 − ∞ < 𝑥 < ∞


−∞
Es llamada la densidad marginal de X.

De manera análoga, la función dada por:


ℎ(𝑦) = ∫ 𝑓(𝑥, 𝑦)𝑑𝑥 𝑝𝑎𝑟𝑎 − ∞ < 𝑦 < ∞


−∞

es llamada la densidad marginal de Y.

Ejemplos:
Dada la densidad de probabilidad conjunta:
2
𝑝𝑎𝑟𝑎 0 < 𝑥 < 1, 0 < 𝑦 < 1
𝑓(𝑥, 𝑦) = {3(𝑥 + 2𝑦)
0 𝑝𝑎𝑟𝑎 𝑐. 𝑜. 𝑙
Encuentra las densidades marginales de X y de Y.
1.6 DISTRIBUCIONES CONDICIONALES (Caso Discreto)
Si p(x,y) es el valor de la distribución de probabilidad conjunta de las variables aleatorias
discretas X y Y, y h(y) es el valor de la distribución marginal de Y en y, la función dada
por:
𝑓(𝑥, 𝑦)
𝑓(𝑥|𝑦) = ℎ(𝑦) ≠ 0
ℎ(𝑦)

para cada x dentro del intervalo de X, se llama la distribución condicional de X dado


Y=y.

En forma correspondiente, si g(x) s el valor de la distribución marginal de X de x, la


función dada por:
𝑓(𝑥, 𝑦)
𝑤(𝑦|𝑥) = 𝑔(𝑥) ≠ 0
𝑔(𝑥)

Para cada y dentro del intervalo de Y, se llama distribución condicional de Y dado X =


x.

Ejemplo.
1. Dos cápsulas se seleccionan al azar de un frasco con 3 aspirinas, 2 sedantes y 4
laxantes. Escribe la función de probabilidad conjunta si llamamos a X como la cantidad
de aspirinas seleccionadas y a Y como la cantidad de seleccionados. Determina la
distribución condicional de X dado Y = 1.
1.7 DISTRIBUCIONES CONDICIONALES (Caso Continuo)
Si f(x, y) es el valor de la densidad de probabilidad conjunta de las variables aleatorias
continuas X y Y, y h(y) es el valor de la densidad marginal de Y en y, la función dada
por:
𝑓(𝑥, 𝑦)
𝑓(𝑥|𝑦) = ℎ(𝑦) ≠ 0, 𝑝𝑎𝑟𝑎 − ∞ < 𝑥 < ∞
ℎ(𝑦)
Se llama densidad condicional de X dado Y = y.

En forma correspondiente, si g(x) s el valor de la densidad marginal de X de x, la función


dada por:
𝑓(𝑥, 𝑦)
𝑤(𝑦|𝑥) = 𝑔(𝑥) ≠ 0, 𝑝𝑎𝑟𝑎 − ∞ < 𝑦 < ∞
𝑔(𝑥)

Para cada y dentro del intervalo de Y, se llama densidad condicional de Y dado X = x.

Ejemplo.
1
Determina la densidad condicional de X dado Y=y, y úsala para evaluar 𝑃 (𝑋 ≤ 2 , 𝑌 =
1
) si
2

2
𝑝𝑎𝑟𝑎 0 < 𝑥 < 1, 0 < 𝑦 < 1
𝑓(𝑥, 𝑦) = {3(𝑥 + 2𝑦)
0 𝑝𝑎𝑟𝑎 𝑐. 𝑜. 𝑙
1.8 INDEPENDENCIA DE VARIABLES ALEATORIAS

Teorema
Si X y Y son variables aleatorias con función de probabilidad (densidad) conjunta f(x,y)
y funciones de probabilidad (densidad) marginal f1(x) y f2(y), respectivamente, entonces
X y Y son variables aleatorias independientes (v.a.i) si y sólo si,
f(x,y) = f1(x)* f2(y) para todos los pares de números reales (X,Y)

Teorema
Si s son variables aleatorias con función de probabilidad (densidad) conjunta f(X1, X2,
X3, … Xn) y funciones de probabilidad (densidad) marginal fi(Xi), respectivamente,
entonces X1, X2, X3, … Xn son v.a. independientes si y sólo si,
f(X1, X2, X3, … Xn)= f1(X1)* f2(X2)* f3(X3)…* fn(Xn) con i = 1, 2, 3, …, n

Ejemplos.
1. Lanzamos una moneda balanceada n veces (de forma que los lanzamientos son
independientes) y sea Xi el número de caras en el i-ésimo lanzamiento. Encontrar la
distribución de probabilidad conjunta.

2. Dada la distribución de probabilidad conjunta:


P(x, y) 0 1 2
0 1/6 1/3 1/12
1 2/9 1/6 0
2 1/36 0 0

Determina si las variables X y Y son variables aleatorias independientes.


3. Si X es la proporción de personas que responderán a una clase de solicitud por correo,
Y es la proporción que responderás a otra clase de solicitud por correo, y la densidad
de probabilidad conjunta de X y Y está dada por:
2
𝑝𝑎𝑟𝑎 0 < 𝑥 < 1, 0 < 𝑦 < 1
𝑓(𝑥, 𝑦) = {5(𝑥 + 4𝑦)
0 𝑝𝑎𝑟𝑎 𝑐. 𝑜. 𝑙

Determina si las variables X y Y son independientes.


1.9 VALOR ESPERADO DE FUNCIONES DE VARIABLES ALEATORIAS Y
COVARIANZA

1.9.1 CASO DISCRETO


Sea f(x,y) una función de probabilidad conjunta, entonces el valor esperado de g(x,y) está
dado por
𝐸[𝑔(𝑥, 𝑦)] = ∑ ∑ 𝑔(𝑥, 𝑦) ∗ 𝑝(𝑥, 𝑦)
𝑇𝑜𝑑𝑎 𝑌 𝑇𝑜𝑑𝑎 𝑥

1.9.2 CASO CONTINUO


Sea f(x,y) una función de densidad conjunta, entonces el valor esperado de g(x,y) está
dado por
∞ ∞
𝐸[𝑔(𝑥, 𝑦)] = ∫ ∫ 𝑔(𝑥, 𝑦)𝑓(𝑥, 𝑦)𝑑𝑦𝑑𝑥
−∞ −∞

1.9.3 PROPIEDADES
Sea c una constante, gi(x,y) funciones de X y Y; y g(x) y h(y) funciones solo de X y Y
respectivamente. Entonces,
a) E[c] = c
b) E[cg1(X,Y)] = cE[g(X,Y)]
c) E[g1(X,Y) + g2(X,Y) + … + gk(X,Y) ] = E[g1(X,Y)] + E[g2(X,Y)] + … + E[gk(X,Y)]
d) E[g(X) h(Y)] = E[g(X)]* E[h(Y)]

Teorema
Sean X y Y v.a. independientes, entonces E(X*Y) = E(X)*E(Y)

Demostración.
Ejemplos.
1. Considera que X y Y tienen una densidad conjunta dada por
2𝑦 𝑝𝑎𝑟𝑎 0 < 𝑥 < 1, 0 < 𝑦 < 1
𝑓(𝑥, 𝑦) = {
0 𝑝𝑎𝑟𝑎 𝑐. 𝑜. 𝑙
Encuentra
a) E(XY)

b) E(X)

c) E(X+Y)

2. Del proceso para producir una sustancia química industrial se obtiene un producto
que contiene dos tipos de impurezas. Para una muestra específica proveniente de este
proceso, denotemos con X la proporción de impurezas en la muestra y con Y la
proporción de impurezas del tipo I entre todas las impurezas halladas. Supongamos
que la distribución conjunta de X y Y puede ser modelada con la siguiente función de
densidad de probabilidad
2(1 − 𝑦) 𝑝𝑎𝑟𝑎 0 < 𝑥 < 1, 0 < 𝑦 < 1
𝑓(𝑥, 𝑦) = {
0 𝑝𝑎𝑟𝑎 𝑐. 𝑜. 𝑙

Encuentre el valor esperado de la proporción de impurezas tipo I de la muestra.


1.9.4 COVARIANZA
La covarianza entre dos variables es una medida de variación respecto a dos variables.
La covarianza mide la relación lineal entre las variables, un valor positivo de la
covarianza indica que conforme una variable aumenta la otra variable también aumenta,
mientras que un signo negativo indica que conforme una variable aumenta, la otra
variable disminuye. Un valor de cero en la covarianza indica que las variables aleatorias
son independientes. En el gráfico que se muestra a continuación en el gráfico a) las
variables tienen una covarianza positiva, mientras que en el inciso b) las variables no
tienen relación, no hay covarianza.

La covarianza está dada por

σXY = Cov(x,y) = E[ (X-µx) (Y- µY) ]

Teorema.

σXY = Cov(x,y) = E(X*Y) – E(X)*E(Y)

Demostración

Teorema.
Si X y Y son variables aleatorias independientes, entonces
σXY = Cov(x,y) = 0

Demostración

1.9.5 COEFICIENTE DE CORRELACIÓN


Dado que la covarianza es una medida que depende de la escala de medición, se define
el coeficiente de correlación ρ como una cantidad estandarizada de la covarianza, el cual
está dado por:
𝐶𝑂𝑉(𝑥, 𝑦)
𝜌=
𝜎1 𝜎2

El coeficiente de correlación mide la relación lineal entre dos variables de una manera
estandarizada, de modo que entre más cercano es el valor de ρ a 1, indica una relación
lineal positiva más marcada; por el contrario, entre más cercano es el valor de ρ a -1,
implica una relación lineal negativa más pronunciada. Mientras que un valor cercano a
cero indica que la relación lineal entre las variables es nula.

1.10 VALOR ESPERADO CONDICIONAL

1.10.2 VARIANZA CONDICIONAL


Dada una función de probabilidad conjunta f(x,y) (discreta o continua), la varianza
condicional de X dado y está dada por:

Var(X|Y=y) = E(X2|Y=y) – [E(X|Y=y)]2

Ejemplo

Sea 𝑓(𝑥, 𝑦) = 𝑦 2 𝑒 −𝑦(𝑥+1) cuando 𝑥 ≥ 0, 𝑦 ≥ 0. Determina Var(X|Y=y)


1.10.3 VALOR ESPERADO Y VARIANZA DE COMBINACIONES LINEALES DE
VARIABLES ALEATORIAS

Supongamos que se tiene una población de la que se mide un conjunto de características


diferentes, por ejemplo, considerando la producción de una máquina podríamos estar
interesados por el peso, el ancho, el alto, y la profundidad.
Tales características pueden ser identificadas por variables aleatorias X1, X2, X3, …, Xn.
Ahora supongamos que de éstas variables se conocen los valores esperados E(X1),
E(X2), E(X3), …, E(Xn), sus varianzas V(X1), V(X2), V(X3), …, V(Xn), así como las
covarianzas Cov(X1, X2), Cov(X1, X3), Cov(X1, X4), …, Cov(X4, Xn), etc.

Teorema.
Si X1, X2, X3, …, Xn son variables aleatorias y Y = a1X1+a2X2+a3X3+…+anXn =
∑𝑛𝑖=1 𝑎𝑖 𝑋𝑖 donde a1, a1, a2, … an son constantes, entonces:

𝐸(𝑌) = ∑𝑛𝑖=1 𝑎𝑖 𝐸(𝑋𝑖 )


y
𝑛

𝑉(𝑌) = ∑ 𝑎𝑖2 𝑉𝑎𝑟(𝑋𝑖 ) + 2 ∑ ∑ 𝑎𝑖 𝑎𝑗 𝐶𝑜𝑣(𝑋𝑖 , 𝑋𝑗 )


𝑖=1 𝑖<𝑗

Nota. Si las variables son independientes entonces


𝑛

𝑉(𝑌) = ∑ 𝑎𝑖2 𝑉𝑎𝑟(𝑋𝑖 )


𝑖=1

Ejemplo
Sean las variables aleatorias X1 y X2, el precio de la materia prima A y la prima B
necesarias para elaborar un producto respectivamente. Dado que dichos precios están
cambiando de manera anual, se estima que para el próximo año E(X1) = $53 por unidad
con desviación estándar de $3.5, y que E(X2) = $100 por unidad con desviación estándar
de $2.7. Suponga que X1 y X2 son variables aleatorias independientes. El gerente de la
empresa comprará el próximo lunes (inicio de año) 300,000 unidades tipo A y 250,000
unidades tipo B.
a) Calcula el valor esperado del gasto de la empresa

b) Calcula la desviación estándar del gasto de la empresa

Teorema
Si X1, X2, X3, …, Xn son variables aleatorias y
Y1 = a1X1+a2X2+a3X3+…+anXn = ∑𝑛𝑖=1 𝑎𝑖 𝑋𝑖 y
Y2 = b1X1+b2X2+b3X3+…+bnXn = ∑𝑛𝑖=1 𝑏𝑖 𝑋𝑖
donde a1, a2, a3, … an y b1, b2, b3, … bn son constantes, entonces:
𝑛

𝐶𝑜𝑣(𝑌1 , 𝑌2 ) = ∑ 𝑎𝑖 𝑏𝑖 𝑉𝑎𝑟(𝑋𝑖 ) + ∑ ∑(𝑎𝑗 𝑏𝑖 + 𝑎𝑖 𝑏𝑗 )𝐶𝑜𝑣(𝑋𝑖 , 𝑋𝑗 )


𝑖=1 𝑖<𝑗
1.11 DISTRIBUCIONES MULTIVARIADAS ESPECIALES
1.11.1 DISTRIBUCION MULTINOMIAL
Un experimento multinomial tiene las siguientes propiedades:
 El experimento consta de n intentos (ensayos) idénticos.
 Cada intento tiene k posibles resultados, es decir hay k clases
 Los intentos son independientes
 pi es la probabilidad de que el resultado de un intento pertenezca a la clase i
 las variables de interés son x1, x2, …, xi. (no de éxitos de cada clase)
Entonces la probabilidad multinomial de x1, x2, …, xk está dada por:
𝑛! 𝑥 𝑥 𝑥
𝑓( 𝑥1 , 𝑥2 , … ; 𝑝1 , 𝑝2 , … , 𝑝𝑘 ) = 𝑝 1 𝑝 2 … 𝑝𝑘 𝑘
𝑥1 ! 𝑥2 ! … 𝑥𝑘 ! 1 2
xi = 0, 1, 2, …, n , ∑𝑘𝑖=1 𝑥𝑖 = 𝑛 , ∑𝑘𝑖=1 𝑝𝑖 = 1

Teorema.
Si x1, x2, …, xk son variables aleatorias que tienen una distribución multinomial con
parámetros n y p1, p2, …, pk, entonces:
1.12 E(Xi) = npi, V(Xi) = npi (1-pi)
1.13 Cov(Xi,Xj) = -n pi pj , si 𝑖 ≠ 𝑗

Ejemplo
Supongamos que en las próximas elecciones federales contendrán 4 candidatos. Se estima
que el 15% de los ciudadanos tiene intención de votar por el candidato A, el 20% por el
candidato B, el 35% por el candidato C y el resto por el candidato D. Si se elige una muestra
aleatoria de 15 ciudadanos, ¿cuál es la probabilidad de que 3 de ellos manifiesten intención
de voto por el candidato A, 5 por el candidato B, 5 por el candidato C y el resto por el
candidato D.
1.12.2 DISTRIBUCIÓN HIPERGEOMÉTRICA MULTIVARIADA
Elementos de la distribución hipergeométrica multivariada:
N es el tamaño de la población
n es el tamaño de la muestra aleatoria
k es el número de clases de la población
Mi es el número de elementos de la i-ésima clase en la población, donde I = 1, 2, 3, …k
Xi es el número de éxitos de la i-ésima clase en la muestra, donde i= 1, 2, 3 … k
Entonces la distribución hipergeométrica se expresa de la forma siguiente,

(𝑀
𝑥
1
) (𝑀
𝑥
2
) … (𝑀
𝑥
𝑘
)
1 2 𝑘
𝑝(𝑋1 = 𝑥1 , 𝑋2 = 𝑥2 , … , 𝑋𝑘 = 𝑥𝑘 ) =
(𝑁𝑛)

Tal que ∑𝑘𝑖=1 𝑀𝑖 = y ∑𝑘𝑖=1 𝑥𝑖 =

Ejemplo.
En un grupo de 30 estudiantes, hay 15 originarios de Nuevo León, 10 de Coahuila y
5 de Jalisco. Supongamos que se elige al azar un comité de 5 personas. Determina la
probabilidad de que:
a) El comité se conforme dos de Nuevo León, dos de Coahuila y 1 de
Jalisco

b) El comité se conforme por al menos 4 de Nuevo León.

You might also like