Professional Documents
Culture Documents
Típicamente, (pero no siempre), una variable aleatoria se denota con una letra
mayúscula como X o Y.
Histogram
50 120.00%
45
40 100.00%
35 80.00% Frequency
Frequency
30
25 60.00% Cumulative
20 %
40.00%
15
10 20.00%
5
0 0.00%
En general, puede ver que los resultados bajos y altos son más
o menos comparables en frecuencia a los resultados de nivel
medio.
Dataset 2 Histograma
Ahora podemos examinar los resultados del Dataset 1 con 250 puntos
de datos.
- Sin embargo, el histograma se ve bastante diferente.
Histogram
70 120.00%
60 100.00%
50
80.00%
Frequency
40 Frequency
60.00% Cumulative
30 %
40.00%
20
10 20.00%
0 0.00%
0 10 20 30 40
50 60 70 80
90 100 More
Por visualización, uno podría argumentar que los dos conjuntos de datos
tienen dos distribuciones diferentes.
Variables aleatorias discretas y continuas
Los gerentes ven tres posibles "escenarios" para modelar con una
distribución.
Probability of
occurrence
0.8
0.6
0.4
0.2
20 40 60 80 Market Share
Describiendo la distribución: media y desviación
estándar
Probability
Mean = 53
0.8
0.6
0.4
0.2
20 40 60 80 Market Share
Describiendo la distribución de probabilidad:
desviación estándar
0.6
0.4
0.2 SD = 16.16
20 40 60 80 Market Share
Resultados Múltiples: pdf
¿Qué pasa si tenemos más de tres resultados?
Supongamos que hay n resultados.
o D1 con probabilidad p1
o D2 con probabilidad p2
o D3 con probabilidad p3
o ......
o Dn con probabilidad pn
y p1 + p2 + p3 + ⋯ + pn = 1
ƒ k= Prob X = Dk =pk
Resultados Múltiples: Función de Distribución
Acumulativa
CDF tiene el mismo propósito que el pdf y es solo otra forma de describir
la variable aleatoria.
Desviación Estándar=
p1 ∗ D1 — D¯ 2 + p2 ∗ D2 — D¯ 2 + ⋯ + pn ∗ Dn — D¯ 2
Resultados múltiples: ejemplo de dados
Una suerte está echada. Variable aleatoria X = Número que aparece. Hay
6 resultados posibles para la variable aleatoria X.
Desviación Estándar=
p1 ∗ D1 — D¯ 2 + p2 ∗ D2 — D¯ 2 + ⋯ + pn ∗ Dn — D¯ 2
N 2–1
Media= (N +1)/2 y Desviación Estandar =
12
Otro ejemplo de variable discreta
0.3
0.25
0.2
Probabilit
0.15
y
0.1
0.05
0 1 2 3 4 5 6 7 8 9 10
W in s Successes
Discrete Example: Binomial Distribution
4 0.111477 0.166239
Cumulative Distribution
Function: 5 0.200658 0.366897
8 0.120932 0.953643
The probability that there will 9 0.040311 0.993953
be 6 or fewer successes is
10 0.006047 1
61.77%
Binomial Cumulative Distribution Function
Representación gráfica 1
de la función de 0.9
distribución
0.8
acumulativa de la
0.7
distribución binomial
0.6
CDF
0.5
Esta es la 0.4
probabilidad de que
0.3
el número de éxitos
0.2
(variable aleatoria)
sea menor o igual 0.1
que n. 0
0 1 2 3 4 5 6 7 8 9 10
Successes
Distribución Binomial
N N!
– f n = Prob X=n = N pn(1 —p)N–n where n =
n N–n !n!
e.g. 4!=1x2x3x4=24.
A veces…
a) la variable aleatoria modelada tiene un gran número de escenarios en
cualquier pequeño intervalo de valores y
b) la probabilidad de que se realice un escenario exacto es muy pequeña
Fx =ƒ ƒ u du
–œ
Variables aleatorias continuas: media y
desviación estándar
œ
μ=EX = ƒ uƒ u du
–œ
œ
o2 = E (X —µ)2 = ƒ (u
— µ)2ƒ u du
–œ
Valores of
X
Distribución continua: Variable aleatoria
X
X1 X2
Values of X
Probability Density
Function
Probability
←— ∞→
Values of X
∞
Normal Distribution
Probability σ
density function
s
CDF F x = ƒ –œ ƒ u du En excel use normdist(x,µ,o,1)
Ejemplo 2: Distribución Uniforme
Permite que la variable aleatoria subyacente tome cualquier valor entre dos
puntos: un punto mínimo (digamos, a) hasta un punto máximo (por
ejemplo, b) y todos los resultados tienen la misma probabilidad de ocurrir.
Probability density
Function
1
pdf: f x = (b–a) ƒor a ≤ x ≤ b, and 0 otherwise
0 ƒor x € a
CDF: Fx = {(x — a)/(b — a) ƒor a ≤ x ≤
b
1 ƒor x Σ b
Otras distribuciones continuas
For example, if you have n=10 buckets and try to fit a normal
distribution with 2 parameters (mean and standard deviation),
– Degrees of freedom = 10 – 2 – 1 = 7.
Chi-Square Test
For each Chi-Square test with some degree of freedom, you can
reject the null hypothesis with some confidence.
– This could be set at 99%, 95%, etc.
Histogram
50 120.00%
45
40 100.00%
35 80.00% Frequency
Frequency
30
25 60.00% Cumulative %
20
40.00%
15
10 20.00%
5
0 0.00%
Data Set 1
Recuerde que nuestra hipótesis nula es que los datos provienen de una
distribución uniforme.
60 100.00%
50
80.00%
Frequency
40 Frequency
60.00% Cumulative %
30
40.00%
20
10 20.00%
0 0.00%
0 10 20 30 40 50 60 70 80 90 100 More
Data Set 2
Recuerde que nuestra hipótesis nula es que los datos provienen de una
distribución normal.
– Dataset1_FIT.xlsx
– Dataset2_FIT.xslx
Kolmogorov-Smirnov test (K-S test)
Conley Fisheries
Esquema General
• Motivar la necesidad de la simulación
• El problema de Conley Fisheries}
• Generadores de números aleatorios
• Muestreo de distribuciones discretas y continuas
• Simulando el problema de Conley Fisheries en
Excel (sin Crystal Ball)
• Analizando los resultados de la simulación ...
6
7
La Necesidad de una Simulación
• Considere el siguiente modelo matemático simple: ganancias =
ingresos totales - costo total
• Si conocemos los datos con certeza (como supuestamente lo
hacemos cuando preparamos estados financieros basados en
datos históricos), el cálculo de los beneficios es trivial ...
• Sin embargo, el cálculo de las ganancias futuras requiere que
consideremos las incertidumbres asociadas con los ingresos y
los costos (es decir, los ingresos y el costo son variables
aleatorias)
• Estas incertidumbres resultan en una gran cantidad de
escenarios de ganancias ...
• El solo hecho de observar una cifra de ganancia única basada
en los valores esperados ignora por completo el hecho de que
los resultados reales pueden desviarse significativamente del
valor esperado de las ganancias.
6
8
La Necesidad de una Simulación
• En general, vemos que las ganancias, P, son una función de dos
variables aleatorias: ingreso total, R y costo total, C:
P = f (R, C)
• Como P es una función de variables aleatorias R y C, entonces P
es también una variable aleatoria.
• Derivar la distribución de probabilidad para funciones de variables
aleatorias es imposible en la mayoría de los casos prácticos.
• Usando la simulación, podemos calcular empíricamente la
distribución de la variable aleatoria de interés generando una gran
cantidad de escenarios para los r.v.s. subyacentes.
• En este caso, podemos generar escenarios para P generando
valores aleatorios de R y C, y luego construir la distribución
empírica de P (tabla de frecuencias / histograma)
• La distribución de probabilidad de P nos da la información
detallada que necesitamos para responder muchas preguntas ...
6
9
Conley Fisheries Inc.: "Un problema con
el barco"
70
Distribución equivalente para Q
Cantidad (Q en lbs) Probabilidad CDF
0 0.02 0.02
1,000 0.03 0.05
2,000 0.05 0.10
3,000 0.08 0.18
3,500 0.82 1.00
E(Q)= 3240 lbs
Como P y Q son independientes, tenemos que:
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.0
0.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 8.0 9.0 10.0
X
72
Cálculo de un escenario de ganancias
1. Genera un valor aleatorio, q, para la cantidad (r.v. Q)
2. Genera un valor aleatorio, p, para el precio (r.v. P)
3. Calcular las ganancias de Rockport: qp - 10,000 ($)
1.00
.18
.15
.05
.02
.00
0 1000 2000 3000 3500 cantidad
75
Generando un valor aleatorio para P
1. Genera un valor aleatorio, v, en el intervalo [0,1] (por
ejemplo, usando Excel RAND () obtenemos v = 0.4321)
76
Un valor aleatorio para P
Cumulative Distribution Function of the Random Variable P (Price)
1.0
F(P)
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.0
77
Fuera de la vista, fuera de la mente
• Recuerde que las simulaciones son
impulsadas por la comprensión del tomador de
decisiones
• Si no considera las principales fuentes de
incertidumbre, no puede identificar sus
contribuciones
• Si no incluye ramas en su árbol de decisiones
o resultados en las sucursales, no se
considerarán en su decisión
78
Modeling Using Continuous Distributions
Recuerde que la fracción de valores de Xi, x2,. ••, x200 en la Tabla 5.10
que son menos de $ 0 es una estimación de la probabilidad p para la
cual p = P (F <$ 0). Si contamos
el número de valores de Xi, x2, •••, x200 en la Tabla 5.10 que son
menores de $ 0, obtenemos 26 de estos 200 valores son menos de $ 0.
Por lo tanto, una estimación de p = P (F <$ 0) es: 26/200 = 0.13.
Por lo tanto, estimamos que hay un 13% de probabilidad de que Conley
Fisheries pierda dinero en cualquier día si eligen vender su captura en
Rockport. Esto muestra que el riesgo de elegir Rockport no es
demasiado grande, pero tampoco es insustancial.
Modeling Using Continuous Distributions
89
Resultados
Bateria Sistema Siste Sistema Motor Mis- Otros
Students de ma de de chief
Encendi combu encendi
do stible do
Full 26% 20% 19% 14% 7% 5% 8%
91