Professional Documents
Culture Documents
Introduccin
Todo sistema tiene fuentes de aleatoriedad Manufactura: tiempo de proceso; tiempo de reparacin de mquinas Bancos: tiempo de atencin en cajas por depsitos; tiempo en otorgar un crdito
Para simular un sistema utilizando tiempos entre llegadas, tiempos de servicio, etc, se hace necesario especificar la distribucin de probabilidad Tiempos entre llegadas son IID exponencial Tiempos de servicio son uniformes
Nmero clientes que llegan por hora. Tiempo entre llegada de dos clientes sucesivos. Nmero de errores en un documento. Cantidad de cartas de crdito en una semana. Demora en tramitar un documento. Tiempo en realizar cierta tarea.
Utilizamos los datos para definir una distribucin emprica. Muestreamos desde esta distribucin emprica
Utilizamos tcnicas de inferencia estadstica standard para ajustar una distribucin terica a los datos y ejecutamos tests de hiptesis para ver la bondad del ajuste
La emprica no permite generar valores fuera del rango de los datos observados. Al ajustar una distribucin terica se pueden utilizar valores fuera del rango observado.
Es una forma compacta de representar un conjunto de valores. Si hay n datos disponibles de una distribucin continua, hay que ingresar 2n datos de una distribucin emprica (en algunos paquetes de simulacin)
Distribucin Uniforme
0,020
Min = 40
0,015
Mx = 100
Funcin Acumulada
Mx = 100
0,6
Funcin Densidad
0,2
0,0 40 46 52 58 64 70 76 82 88 94 100
Min = 40
Distribucin Uniforme
0,020
Funcin Densidad
a = min = 40 b (mx) = 100
0,015
1 f (x) = ba
a<x<b
0,010
0,005
Funcin Distribucin
40 46 52 58 64 70 76 82 88 94 100
0,000
F (x) =
1 dx ba
Funcin Densidad
Distribucin Normal
0,02 0,02 0,01 0,01 0,01 0,01 0,01 0,00 0,00 0,00 0 50 100 150 200 250 300 350
= =
200 50
Funcin Densidad
1 f (x) = e
( x )2 2
Funcin Densidad
Distribucin Poisson
Probabilidad Ocurrencia
Funcin de Masa
Nmero de Ocurrencias
Distribucin Exponencial
25
Funcin Densidad
20 15 10 5 0 0 10 20 30 40 50 60 70 80 90 minutos
f (x)=
1 e
Funcin Acumulada
x
Funcin Densidad
E(T) =
F (x ) = 1 e
Distribucin Gamma
Funcin Acumulada
x e f (x)= ( )
x>0
E(X) = V(X) =
2
Funcin Densidad
Distribucin Beta
( r + s ) r 1 f X ( x, r , s ) = x (1 x ) s 1 ( r ) ( s )
( r , s ) = x r 1 (1 x ) s 1 dx
0 1
I[ ] ( x)
0 ,1
( n ) = y n 1e y dy
0
n>0
Distribucin Beta
A good model for proportions. You can fit almost any data. However, the data set MUST be bounded!
Distribucin Weibull
Generadores en Lenguajes
Los lenguajes de simulacin -como Arena- tienen incorporados mtodos para generar hechos de acuerdo al patrn que se les indique. Es preciso estudiar cuidadosamente el patrn de comportamiento de los hechos reales para poder simularlos correctamente. Esto se logra mediante el anlisis estadstico de una serie de observaciones del mundo real.
DISTRIBUCION Uniforme Exponencial Gamma Weibull Normal Lognormal Beta Pearson Triangular
APLICACION
Utilizada como primer modelo para una cantidad que se siente que vara aleatoriamente entre a y b y de la que se conoce poco. Tiempo entre llegadas de clientes a un sistema que ocurren a tasa constante Tiempo en completar cierta tarea: atencin de un cliente o reparacin de una mquina Tiempo en completar cierta tarea, tiempo en que falla una pieza de un equipo Errores de varios tipos Tiempo en ejecutar cierta tarea Utilizada como un modelo grueso en ausencia de datos; distribucin de items defectuosos en un embarque Tiempo en ejecutar cierta tarea Utilizada como un modelo grueso en ausencia de datos
Distribuciones Empricas
Hay casos en que deseamos utilizar una distribucin emprica; en otros no se ha podido ajustar una distribucin terica. Para datos originales X1 , X2 , ..., para cada posible valor x se define una funcin de masa emprica p(x) como la proporcin de los Xi que son iguales a x
a su forma - En algunos casos se puede utilizar el conocimiento a priori dadas las caractersticas del sistema LLegada de clientes ( Poisson) Tiempos de servicio no pueden ser normales (valores negativos) Ayudas Estadsticas de resumen Histogramas Box plots
Estadsticas de Resumen
Estadstico Media Varianza
2
Frmula
N
X =
N
i= 1 Xi
N
i
( X
i =1
X )2
N 1
C = V
N
2
X
X N
3 2
1 = i =
[X i
2
]3
[ ]
Recetas
cv = 1 para la distribucin exponencial, independiente de b cv > 1 para Gamma y Weibull Para distribuciones simtricas n = 1 (skewness)
Histogramas
Un histograma es un estimador de la funcin densidad que corresponde a la distribucin de X 1 , X 2 , ... X n Histograma: se rompe el rango de valores en k intervalos adyacentes [b0 , b1), [b1 , b2 )...., [ bk-1 , bk ), todos los intervalos del mismo ancho b = bj bj-1 Para j = 1, 2, ... k sea hj la proporcin de los Xi que estn en el intervalo [bj-1 , bj ). Se define la funcin h(x) = 0 si x < b0 = h j si b j-1 x < b j para j = 1, 2, ... k = 0 si b k x
Recetas para k
Regla de Sturges k = [1 + log 2 n] = [1 + 3.322 log 10 n] Probar con diferentes valores de Db y escoger el que de una forma ms parecida a una funcin densidad conocida
tienen propiedades deseables son importantes para justificar el test de chi-cuadrado para ajustes de distribucin la idea central tiene gran sentido comn
Un test de bondad de ajuste es un test de hiptesis estadstico que se utiliza para determinar formalmente si las observaciones X1 , X2 , ... Xn son una muestra in-dependiente de una distribucin particular con funcin de distribucin F. El test se utiliza para verificar la siguiente hiptesis nula:
Test de Chi-cuadrado
Dividir el rango de la distribucin a ajustar en k intervalos adyacentes [a0 , a1) , [a1 ,a2 )...., [ak-1 ,ak) Nj = nmero de Xi s en el j-simo intervalo [aj-1 ,aj ) para j = 1, 2, 3, ... k Calcular la proporcin pj esperada de los Xi s que caern en el intervalo j si estuvisemos muestreando desde la distribucin ajustada
p j = p ( xi )
i
p j = f ( x) dx
Test de Chi-cuadrado
La estadstica es
2 =
j
( N j n pj ) 2 n pj
Como npj es el valor esperado del nmero de los n Xi s que caeran en el j-esimo intervalo, si H0 fuese verdadera 2 esperaramos que fuese pequea si el ajuste es bueno. Por 2 tanto rechazamos H0 si es grande Rechazar H0 si
2 > k21,1
Ejemplo
Se desea desarrollar un modelo de simulacin para una instalacin bancaria de banco-al-auto, recolectndose datos sobre la tasa de llegada de automviles. En un intervalo de 90 minutos llegaron 220 autos y se registr el tiempo entre llegadas entre el auto i y el i+1 para i= 1, 2, 3, ... ,219
Histograma
60 50
Frecuencia
40 30 20 10 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Clase
Ejemplo
Hiptesis: tiempos entre legadas son exponenciales F(x)=1 - e -x/0.399 k=20 intervalos; p j =1/k=0.05 npj = (219)(0.05) = 10.95
j 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 F(aj)^(-1) 0.020 0.042 0.065 0.089 0.115 0.142 0.172 0.204 0.239 0.277 0.319 0.366 0.419 0.480 0.553 0.642 0.757 0.919 1.195 inf Intervalo [0 , 0.020) [0.020 , 0.042) [0.0420 , 0.065) [0.02065 , 0.089) [0.089 , 0.115) [0.115 , 0.142) [0.142 , 0.172) [0.172 , 0.204) [0.204 , 0.239) [0.239 , 0.277) [0.277 , 0.319) [0.319 , 0.366 ) [0.366 , 0.419 ) [0.419 , 0.480 ) [0.480 , 0.553 ) [0.553 , 0.642 ) [0.642 , 0.757 ) [ 0.757 , 0.919 ) [ 0.919 , 1.195 ) [ 1.195, inf ) Nj 8 11 14 14 16 10 7 5 13 12 7 7 12 10 20 9 11 9 14 10 npj ((Nj-npj)^2)/npj 10.95 0.794749 10.95 0.000228 10.95 0.849543 10.95 0.849543 10.95 2.3290 10.95 0.08242 10.95 1.424886 10.95 3.23311 10.95 0.38379 10.95 0.100685 10.95 1.424886 10.95 1.424886 10.95 0.100685 10.95 0.08242 10.95 7.4797 10.95 0.34726 10.95 0.000228 10.95 0.34726 10.95 0.849543 10.95 0.08242 Test 22.187217
2= 22.18721
=27.204
Test Kolmogorov-Smirnoff
Comparan una funcin de distribucin emprica con la hiptesis de funcin distribucin No requieren agrupar los datos de modo que no se pierde informacin; elimina el problema de definicin del intervalo escogido Son vlidos para cualquier muestra de tamao n Tienden a ser ms poderosos que los tests de Chi-cuadrado Para definir la estadstica K-S se debe definir primero una funcin distribucin emprica F n (x) a partir de nuestros datos X1 , X 2 , ... Xn tal que:
Test Kolmogorov-Smirnoff
Fn
(x) = nmero de Xi s x / n, para todo x real
La estadstica K-S Dn es simplemente la distancia (vertical) ms grande entre Fn (x) y F(x) para todos los valores de x: Dn =sup{ | Fn (x) - F(x) | } sup de un conjunto A es el valor ms pequeo que es mayor o igual que todos los miembros de A Dn puede ser calculado del modo siguiente: Dn + = mx{ ( i/n) - F(X i ) } Dn - = mx{F(X i ) - (( i-1)/n)} Dn = mx{Dn + , Dn - }
Test Kolmogorov-Smirnoff
Si la distribucin hipottica es normal N(, 2 ) con ambos parmetros desconocidos se rechaza H0 si:
(n1/2 - 0.01 + 0.85 / n1/2 ) Dn > c1-
Si la distribucin es exponencial
e F(x) = 1 - e -x/mdia
Ejemplo
Mismo sistema banco-al-auto Para la distribucin expo(0.399) F(x)=1 - e -x/0.399 Dn + = mx{ ( i/219) - 1 - e -x/0.399 ) } Dn - = mx{1 - e -x/0.399 - (( i-1)/219)} Dn = mx{Dn + , Dn - }
Ejemplo
Test de Kolmogorov
Media Parmetro
Dn
0.53793577 0.81146923 Dn + -0.00393407 -0.00393407 -0.00393407 -0.00393407 -0.00393407 -0.00393407 -0.00393407 -0.00393407 -0.40553399 -0.41692109 -0.43028333 -0.44546569 -0.48849902 -0.50961138 -0.53336956 Dn 0.00850028 0.00850028 0.00850028 0.00850028 0.00850028 0.00850028 0.00850028 0.00850028 0.4101002 0.4214873 0.43484954 0.4500319 0.49306523 0.51417759 0.53793577
SERIE 2 0.01 0.01 0.01 0.01 0.01 0.01 0.01 0.01 1.33 1.38 1.44 1.51 1.72 1.83 1.96
Fn (X) 0.00456621 0.00913242 0.01369863 0.01826484 0.02283105 0.02739726 0.03196347 0.03652968 0.97260274 0.97716895 0.98173516 0.98630137 0.99086758 0.99543379 1.00000000
F(Xi ) 0.003980 0.003980 0.003980 0.003980 0.003980 0.003980 0.003980 0.003980 0.411607 0.423222 0.436859 0.452361 0.496353 0.517968 0.542319
Ejemplo
Dn = mx{Dn + , Dn - } = 0.5379 Estadstica ajustada: (D 219 - 0.2/219)(0.2191/2 + 0.26 + 0.5/ 0.219 1/2 ) = 0.8114 De la tabla c = 1,308 No se puede rechazar la hiptesis nula
Valores crticos modificados para estadstica K-S 0,850 0,900 0,950 0,975 0.99 1,138 1,224 1,358 1,480 1,628 0,775 0,819 0,895 0,955 1,035 0,926 0,990 1,094 1,190 1,308
A veces el sistema no existe en su forma actual y los mtodos anteriores no pueden emplearse Otras veces el tiempo disponible para recolectar informacin es pequeo o es muy caro Supongamos que la variable X de inters es continua.
X = 1 - ((1-c)(1-U))1/2