Capítulo 2 Generación de Números Aleatorios

CAPITULO 5
BONDAD
5.1
PRUEBAS DE AJUSTE DE
Introduccin
El suministro de datos es la fuerza motora para un modelo de simulacin. En la simulacin de un

sistema de colas, el suministro tpico de datos son las distribuciones del tiempo entre arribos y los
tiempos de servicios. Para la simulacin de un sistema de inventarios, el suministro de datos
incluyen la distribucin de la demanda y del tiempo de reposicin. Para la simulacin de un sistema
de confiabilidad, la distribucin de tiempo entre fallas de un componente en un ejemplo de
suministro de datos.
La determinacin de la distribucin apropiada de los datos a suministrar es la tarea principal desde
el punto de vista del tiempo y de los recursos requeridos. A pesar de lo sofisticado que quiera ser
el analista, los modelos que fallan en el suministro de datos conducirn a resultados cuya
interpretacin puede conducir a toma de decisiones (recomendaciones) errneas.
Estos son cuatro pasos en el desarrollo de un modelo til para el suministro de datos:
1.- Rena datos del sistema real de inters. Esto frecuentemente requiere un tiempo sustancial y
comprometer recursos. Desafortunadamente, en algunos casos no es posible reunir datos (por
ejemplo, cuando se esta extremadamente limitado por el tiempo, cuando el proceso de suministro
no existe an, o cuando las leyes o reglas prohben el reunir datos.) Cuando los datos no estn
disponibles, la opinin de un experto en el proceso debe considerarse para tener una sugerencia
de relevancia (educada).
2.- Identifique la distribucin de probabilidad que representa al proceso de suministro de datos.

Cuando los datos estn disponibles, este paso tpicamente inicia desarrollando la distribucin de
frecuencias, o histograma de los datos. Basado en la distribucin de frecuencias y en el
conocimiento estructural del proceso, una familia de distribuciones es elegida. Afortunadamente
varias distribuciones bien conocidas proveen prcticamente una buena aproximacin.
3.- Elija los parmetros que determinan la instancia especfica de la familia de distribuciones.
Cuando los datos estn disponibles estos parmetros pueden ser estimados de los datos.
4.- Evalu la distribucin elegida y sus parmetros asociados para realizar una prueba de ajuste de
bondad. La prueba de ajuste de bondad evala informalmente usando mtodos grficos, o
formalmente usando pruebas estadsticas. Las pruebas Chi-cuadrada, Kolmogorov-Smirnov y
Anderson-Darling son pruebas estndar de las pruebas de ajuste de bondad. Si no se esta
satisfecho con la distribucin elegida, entonces el analista regresa al paso 2, elige una familia
diferente de distribuciones, y repite el procedimiento. Se puede usar una distribucin emprica, si

despus de varias iteraciones este procedimiento fallan obtener el ajuste a una distribucin a los
datos reunidos.
Aunque en la actualidad hay programas disponibles para lograr los pasos 2,3, y 4 incluyendo
programas especficos tales como ExpertFit, y programas integrados tales como SIMAN, Stat:Fit
del ProModel, Statistica, MiniTab - es todava importante comprender el alcance de los programas,
de forma tal que se usen apropiadamente.
Desafortunadamente, no existen programas disponibles para situaciones en las que no hay datos
disponibles o en los que existe una relacin entre dos o ms variables de inters.
5.2
Estimacin de Parmetros
En muchas instancias la media de la muestra, o la media y la varianza de la muestra, son usadas

para estimar los parmetros de la distribucin hipotetizada. En los prrafos siguientes, tres
conjuntos de ecuaciones son dados para calcular la media y la varianza e la muestra. Las
ecuaciones 1 y 2 pueden ser usadas cuando un conjunto de datos discretos o continuos estn
disponibles. Las ecuaciones 3 y 4 son usadas cuando los datos son discretos y han sido
agrupados en una distribucin de frecuencias. Las ecuaciones 5 y 6 son usadas cuando los datos
son discretos o continuos y han sido ubicados en intervalos de clase. Las ecuaciones 5 y 6 son
aproximaciones y debern ser usadas nicamente cuando no hay datos disponibles.
_
Si las observaciones en la muestra de tamao n son X1,X2,,....Xn , la media de la muestra ( X ) esta

definida por
n
X=
X
i =1
y la varianza de la muestra S , esta definida por S =

2
X
i =1
2
i
nX2
n 1
Si los datos son discretos y agrupados en una distribucin de frecuencias, las ecuaciones 1 y 2
pueden ser modificadas para dar una eficiencia computacional mucho mayor. LA media de la
muestra es calculada por
k
X=
j =1
fjX j
y la varianza de la muestra por S =
2
valores de X y f j es la frecuencia observada de Xj de X.
j =1
fjX2j n X2
n 1
donde k es el numero de
Ejemplo
Los datos siguientes pueden se analizados para obtener n = 100, f1=12, X1=0,
f 2=10, X2=1,.....,, y
X
j =1
= 364
n
j =1
X 2 j = 2080
Arribos por
periodo
Arribos por
periodo
Frecuencia
Frecuencia
12
10
19
17
10
10
11
de la ecuacin 3 X =
2080 100(3.64)2
364
2
y S =
= 7.63
100
99
donde S=2.76.
Cuando los datos son dados en intervalos de clase, no es posible obtener el valor exacto de la
media y varianza de la muestra. En tal caso, la media y varianza de la muestra se calculan
aproximadamente usando las ecuaciones siguientes:
X=
fm
j =1
y S =
2
fm
j =1
2
j
nX2
n 1
donde f j es la frecuencia observada en el jvo intervalos de clase, m j es el punto medio del jvo
intervalo de clase, y c en el numero de intervalos de clase.
Ejemplo
Considere los datos de la vida de un Chip donde que son eliminados o perdidos.
Vida de Chip
Frecuencia
(das)
0 Xj < 3
23
3 Xj < 6
10
6 Xj < 9
9 Xj < 12
12 Xj < 15
15 Xj < 18
18 Xj < 21
21 Xj < 24
24 Xj < 27
27 Xj < 30
30 Xj < 33
33 Xj < 36
42 Xj < 45
57 Xj < 60
78 Xj < 81
143 Xj < 147
Para determinar los valores aproximados de X y S2 se usan las ecuaciones 5 y 6. Los siguientes
valores son determinados:
49
49
f 1=23, m1=1.5, f2=10, m2=4.5,....., y
j =1
f j m j =614
fm
j =1
=37, 226.5
Con n=50, X se obtiene de la ecuacin 5
X =
614
= 12.28 . Entonces S2 se obtiene usando la ecuacin 6 como
50
37, 226.5 50(12.28)2
S =
= 605.849
49
2
Estimadores sugeridos para distribuciones frecuentemente usadas en simulacin
Distribucin
Parmetro(s)
Estimador(es)
sugerido(s)
Poisson
=X
Exponencial
1
_
X
Uniforme sobre (0,b)
Normal
b=
Gamma
n +1
n
^
= X, 2 = S2
^
1
_
X
Weibull con
=0
X
=
S
^
j = j 1
f ( j 1 )
^
f ' ( j 1 )
Ve las ecuaciones 12
^
y 15 para f ( j 1 ) y
^
f ' ( j 1 )
Iterar
hasta
converger
que
1 n
= X i
n i =1
5.3
Pruebas de Ajuste de Bondad
Las pruebas de Ajuste de Bondad proveen una gua til para evaluar la sustentabilidad de un
modelo potencial para el suministro de datos. Sin embargo, no existe una sola distribucin en
aplicaciones reales, de las que no debers ser esclavo para el veredicto de tales pruebas. Es
especialmente importante entender el efecto del tamao de la muestra. Si muy pocos datos estn
disponibles, entonces una prueba de ajuste bondad puede rechazar a alguna distribucin
candidato; pero si hay muchos datos disponibles, entonces una prueba de ajuste de bondad puede
rechazar a todas las pruebas candidato. Por esto, fallar en rechazar una distribucin candidato
debers ser tomada como una sola pieza de evidencia a favor de esta eleccin, mientras que
rechazar un modelo de suministro de datos es nicamente una pieza de evidencia contra la
eleccin.
5.3.1 Prueba Chi-Cuadrada ( 2 )

Antes de poder usar un proceso generador en un estudio de simulacin, se debe demostrar que
los datos empricos pueden ser conocidos.
Un nmero de pruebas estadsticas puede ser
utilizado para probar la bondad de ajuste de una distribucin terica a un conjunto dado de datos.
Una de las pruebas ms frecuentemente utilizada es la Chi-cuadrada (2).
La prueba 2 es un procedimiento para probar la Hiptesis de que una muestra aleatoria de

2
tamao n de la variable aleatoria X sigue una forma distribucional especfica. La prueba sirve
para determinar si existe alguna diferencia significativa entre las frecuencias esperadas (las
basadas en la distribucin terica) y las frecuencias actuales (las representadas por los datos).
La prueba es valida para tamaos de muestra grandes, para consideraciones de ambos tipos de
distribuciones discretas y continuas, cuando los parmetros son estimados por mxima
verisimilitud.
Los pasos seguidos para probar el proceso son:
1. Establezca la prueba de hiptesis, H0 , en la que los n datos observados son

sacados de la poblacin que es descrita por una distribucin terica conocida.
2. Establezca la hiptesis alternativa, H1, en la que los n datos observados no
son sacados de la poblacin del paso 1.
3. Identificar el nivel de significacia, , en el cual la prueba ser efectuada [ (1 ) nivel de significancia de la prueba estadstica].
4. Usando la siguiente relacin matemtica
2 =
donde
2 cal
( f0 fe )2
fe
= valor calculado de x
fo
= frecuencias observadas
fe
= frecuencias tericas observadas
Calcules fei como npi , donde pi es la probabilidad terica hipotetizada asociada con el ivo intervalo.
prubese la 2 cal con 2 tabla
si 2 cal > 2 Tabla entonces rechace Ho y acepte H1
2
si 2 cal < Tabla entonces rechace H1 y acepte Ho
El valor de 2 en la tabla es encontrado en la tabla de ji-cuadrada y es definido por el nmero de

grados de libertad (g.l.). Y estos se definen para la mayora de las pruebas de bondad como;
g.l.=k-s-1
donde;
k= No. de categoras (clases)
s= No. de parmetros del la distribucin de probabilidad hipotetizada
Ejemplo: Ajustando una Distribucin Poisson Usando la Prueba de Ajuste de Bondad Chi2
Cuadrada ( )
No. de Arribos/Hora
Frecuencia
Frecuencia
(fo-fe)2
(x)
Observada
Esperada
(fo)
(fe)
fe
70
75.05
3.3398
84
75.05
1.0673
34
37.52
0.3302
12
4 o Ms
* 16
12.51
*16 .38
0.0088
2 cal =
1.7461
3.87
204
*Calculando si 2 cal , se asume que cada clase de datos tiene una fe de al menos 5, debido a que
cada valor esperado para x>4 es 3.87 observaciones, se agrupan la 3 y 4 clase.
Nmero promedio de arribos =
xf
f
204
=1
204
usando
=1 la funcin de densidad Poisson, se pueden calcular la probabilidad de los varios
como sigue ;
nmeros de clientes que entran al banco. Estos se expresan
P( x) =
Funcin de densidad de la distribucin Poisson:
(1)e 1
P( x = 0) =
= .36788
0!
P( x = 1) =
(1)e 1
= .36788
1!
P( x = 2) =
(1)e 1
= .18394
2!
( ) x e
x!
P( x = 3) =
(1)e 1
= .06131
3!
3
P( x 4) = 1 P( x < 4) = ..01899
i =0
El nmero de grados de libertad para este problema en particular es 2, debido a que existen 4
intervalos de clases de datos en el conjunto original y la distribucin Poisson tiene un parmetro,
, por lo que g.l.=4-1-1=2 .
Si probamos la hiptesis, Ho , a un nivel de confianza del 95%,
entonces =.05. Refirindose a la tabla 2 se encuentra para =.05 y g.l.=2, 2 Tabla = 5.991.
Debido a que 2 cal es menor que 2 Tabla , se rechaza H1, y se concluye que los datos pueden ser
simulados adecuadamente con el proceso generador Poisson.
El valor mnimo de fei es 5, y de obtenerse un valor menor a este valor, se combina este con los
intervalos de clase inmediatos superiores hasta que el valor combinado sea al menos 5. Lo mismo
debe hacerse con las columnas de fo y de =
2
( f0 fe )2
.
fe
La recomendacin para el nmero de intervalos de clase para datos continuos se resume en la

tabla siguiente;
Tamao de la muestra
Numero de intervalos de clase
k
20
No use la prueba Chi-cuadrada
50
De 5 a 10
100
De 10 a 20
>100
De
n hasta
n
5
Ejemplo: Ajustando una Distribucin Exponencial Usando la Prueba de Ajuste de Bondad

2
Chi-Cuadrada ( )
Realice una prueba de ajuste de bondad de los datos siguientes para una distribucin Exponencial.
Los 60 datos siguientes representan el tiempo en segundos del tiempo entre arribos de los carros
en una cierta interseccin.
12
26
18
15
44
28
44
16
19
37
29
10
18
35
17
20
31
24
15
18
30
11
28
68
19
26
25
37
46
18
14
34
26
49
16
32
23
36
19
21
22
La media es de 20.1 segundos.

La funcin de densidad de probabilidad de la distribucin exponencial esta dada por:
f ( x) =
x
1 20.1
e
, para x > 0
20.1
y su respectiva funcin acumulada de probabilidad por:
F ( x) = 1 e
x
20.1
> 0
Se realizan los clculos para obtener la frecuencia esperada de los diferentes intervalos de clase:
F (0) = 1 e
F (10) = 1 e
0
20.1
20
20.1
30
20.1
40
20.1
50
20.1
F (40) = 1 e
F (50) = 1 e
10
20.1
F (20) = 1 e
F (30) = 1 e
= 1 1 = 0
= 1 .60804 = 0.391958
= 1 0.369714 = 0.630285724
= 1 0.224801 = 0.77519839
= 1 0.136695 = 0.863304574
= 1 0.08311 = 0.916887652
F (60) = 1 e
F (70) = 1 e
60
20.1
70
20.1
= 1 0.050535733 = 0.949464266
= 1 0.0307278 = 0.969272184
p1=[F(10)-F(0)]*60 = 0.391958*60 = 23.51748

p2=[ [F(20)-F(10)]*60 = 0.238327724*60=14.29966
p3=[ [F(30)-F(20)]*60 = 0.1449698*60=8.698188
p4=[ [F(40)-F(30)]*60 = 0.088106184*60=5.286371
p5=[ [F(50)-F(40)]*60 = 0.053583078*60=3.21498468
p6=[ [F(60)-F(50)]*60 = 0.032576614*60=1.95459684
p7=[ [F(70)-F(60)]*60 = 0.019807918*60=1.188475
Ahora se elabora la tabla para el calculo de la

Celda
calculada
( Foi Fei )2
Fei
Frecuencia
Frecuencia
Observada
Esperada
Foi
Fei = npi
0-10
19
23.51748
0.8677641
10-20
16
14.29966
0.20218355
20-30
12
8.698188
1.25336601
30-40
5.286371
1.39297494
40-50
3.21498468
50-60
1.95459684
60-70
1.188475
Totales
n = 60
60
Cuando Fei = npi es menor que 5 se debe combinar con la celda inmediata superior. Lo cual
sucede para las ltimas 3 filas, resultando la tabla siguiente:
( Foi Fei )2
Fei
Frecuencia
Frecuencia
Observada
Esperada
Foi
Fei = npi
0-10
19
23.51748
0.8677641
10-20
16
14.29966
0.20218355
20-30
12
8.698188
1.25336601
30-40
5.286371
1.39297494
40-50
6.3580564
0.29007547
n = 60
58.159755
4.286658
Celda
50-60
60-70
Totales
As la 2 calculada =4.286658. Ahora se obtiene la

1=3, y con un nivel de significancia =0.05
2
Tabla,3,0.05
de la tabla, con grados de libertad igual a 5-1-
=7.81
Como la 2 calculada =4.286658 es menor que 2Tabla=7.81, se puede decir que los tiempos entre
arribos de los carros siguen comportamiento que se apega a una distribucin exponencial.
5.3.2 Prueba Kolmogorov-Smirnov

Otra prueba de ajuste de bondad que se usa frecuentemente es la prueba Kolmogorv-Smirnov
(KS). Una ventaja de esta prueba sobre la prueba Chi Cuadrada es que no requiere que los datos
sean agrupados en intervalos de clase ( en el caso de considerar una distribucin de probabilidad
continua, esta agrupacin es arbitraria) y elaborar un histograma con los datos (lo cual, debido a su
base subjetiva, puede resultar en una perdida de alguna informacin pertinente). Cuando se
cambia el nmero de intervalos de clase y el ancho del intervalo afecta el valor calculado y
tabulado de la Chi-cuadrada. Una hiptesis puede ser aceptada cuando los datos son agrupados
de una manera, pero pueden ser rechazados si se agrupan de otra. Otra ventaja de la prueba KS
es que se realiza bien an para cantidades pequeas de datos (tamaos de muestra n pequea).
La desventaja principal de la prueba KS es que se aplica nicamente a distribuciones continuas.
Tambin, la forma original de la prueba KS requiere que todos los parmetros de la distribucin
candidata bajo prueba sean conocidos (por ejemplo los parmetros no pueden ser estimados
usando los datos obtenidos). Dado que los parmetros actuales de la distribucin de los datos son
raramente conocidos, esto limita seriamente la aplicabilidad de la prueba original KS. Ms
recientemente, una nueva forma de la prueba KS ha sido desarrollada, la cual permite la
estimacin de parmetros usando los datos obtenidos., pero esta prueba reciente se aplica ms de
manera mas favorable nicamente para las distribuciones Normal , Exponencial y Weibull. Nota
que la prueba KS ha sido aplicada a otras distribuciones continuas (y tambin a distribuciones
discretas) usando parmetros que son estimados sobre la base de los datos obtenidos. Aunque
esta prctica puede resultar en que obtengamos buenos ajustes, el usuario debe ser cuidadoso
que producir una prueba conservadora en la cual la oportunidad de rechazar una distribucin
candidato puede ser mayor que lo deseado.
La prueba KS es conducida desarrollando una distribucin de probabilidad emprica acumulada
basada en los datos obtenidos y comparndola con la funcin de distribucin de probabilidad
acumulada de la distribucin terica candidato. Si X1, X2, .,Xn son datos observados ordenados
en una forma ascendente, entonces la funcin de distribucin de probabilidad emprica esta
definida como;
Fn ( x ) =
Nmero de X i x
n
Por lo tanto Fn(x) es una funcin paso tal que Fn(x) = i / n para i = 1,2,.,n.
Esta prueba esta basada en la desviacin absoluta mayor entre las fdp emprica y terica para
todo valor dado de x. Esta desviacin es comparada con los valores crticos de KS tabulados para
determinar si la desviacin puede ser atribuida a los efectos aleatorios y por lo tanto sea una
distribucin candidato a ser aceptada tener un buen ajuste a los datos observados. Ms
especficamente, la prueba tiene los pasos siguientes:
Paso 1: Ordene los datos en forma ascendente
Paso 2: Usando la fdp terica F(x), calcule
= max1i N F ( xi )
N
i 1
= max1i N F ( xi )
Paso 3: Sea D= max( D+, D- )

Paso 4: Encuentre el valor crtico de la tabla KS para un nivel de significancia y un tamao de
muestra N.
Paso 5: Si D al valor crtico, acepte la distribucin candidato como aquella que tiene un buen
ajuste a los datos observados; de otra forma rechace.
Ejemplo: Ajustando una Distribucin Uniforme Usando la Prueba de Ajuste de Bondad
Kolmogorov-Smirnov
En este ejemplo se usa la prueba KS para examinar bajo un nivel de significancia de =0.05 si un
conjunto de datos representa nmeros aleatorios (por ejemplo esta la distribucin uniforme entre 0
y 1). Suponga que cinco datos son dados: 0.53, 0.35, 0.03, 0.94, y 0.22
Solucin. Para la distribucin Uniforme la fdp es F(x)= 1/(b-a) axb
Para este caso particular a=0 y b=1. Por lo tanto F(x)=x. Ahora se ordenan los valores en forma
ascendente y se realizan los clculos relativos.
La tabla siguiente resume los clculos realizados:
i
F(xi)
i/n
i/n - F(xi)
F(xi) (i-1)/n
1
0.03
0.20
0.17
0.03
2
0.22
0.40
0.18
0.02
3
0.35
0.60
0.25
-0.05
4
5
0.53
0.94
0.80
1.00
0.27
0.06
D+= 0.27
-0.07
-.14
D-=0.14
De acuerdo a los clculos, D = max( 0.27, 0.14 ) = 0.27. El valor crtico de KS de la tabla para un
tamao de 5 y un nivel de significancia de 0.05 es 0.565. Debido a que D es menor que este valor
crtico, la hiptesis de que los datos dados pertenecen a una distribucin Uniforme es aceptada.
Kolmogorov-Smirnov
En este ejemplo se usa una prueba KS para observar bajo un nivel de significancia =0.05 si un
dado conjunto de datos observados representan a una distribucin Exponencial. Suponga que los
siguientes 10 puntos representan los tiempos entre arribos de los clientes a un cajero bancario (el
tiempo esta en minutos): 3.10, 0.20, 12.10, 1.40, 0.05, 7.00, 10.90, 13.70, 5.30, 9.10.
Los datos son obtenidos dentro de un perodo de 63 minutos. De acuerdo a la teora, si la
distribucin de los tiempos entre arribos dentro de T unidades de tiempo es exponencial, los
tiempos de arribo son uniformemente distribuidos entre 0 y T. Para encontrar los tiempos de arribo
simplemente aadimos los tiempos entre arribos. Por lo cual t1, t1+t2, t1+t2+t3, .. t1+t2+.+t10 son los
tiempos de arribo del primer al dcimo cliente. Dividiendo estos tiempos entre la longitud del
periodo de obtencin de los datos(63 en este caso), resulta un conjunto normalizado de datos los
cuales estn distribuidos entre o y 1. Entonces se procede a aplicar el procedimiento para probar el
ajuste a la distribucin uniforme.
La tabla siguiente resume los clculos realizados:
i
i
F(xi)
i/n
X i = j =1 t i
1
2
3
4
5
6
7
8
9
10
3.10
3.30
15.40
16.80
16.85
23.85
34.75
48.45
53.75
62.85
0.049
0.052
0.344
0.267
0.267
0.379
.552
0.769
0.853
0.998
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
i/n - F(xi)
F(xi) (i-1)/n
0.051
0.148
0.056
0.133
0.233
0.221
0.148
0.031
0.047
0.002
D+= 0.233
0.049
-0.048
0.044
-0.033
-0.133
-0.121
-0.048
0.069
0.053
0.098
D-=0.098
De acuerdo a la tabla anterior, D=0.233. Eligiendo un nivel de significancia de 0.05 y un tamao de

muestra de 10, el valor crtico de la tabla KS es 0.409. Debido a que el valor calculado de la
prueba estadstica es menor que el valor en la tabla KS, no existe razn para no aceptar que los
datos dados estn distribuidos de acuerdo a una distribucin Uniforme con parmetros 0 y 1.
Equivalentemente, se concluye que ellos tiempos entre arribos estn Exponencialmente
distribuidos.
Consideraciones para usar las pruebas de ajuste de bondad.
La pregunta que naturalmente nace es cuando usar la prueba Chi-Cuadrada y cuando usar la
prueba KS. Generalmente, para cantidades grandes de nmeros (mayor que 30) y distribuciones
discretas, la prueba Chi-Cuadrada es ms apropiada. Para cantidades pequeas de nmeros y
distribuciones continuas, la prueba KS es recomendada. (Tambin la prueba KS se ha aplicado
con xito en distribuciones discretas).
5.3.2.1 Otra forma de realizar la prueba

1.- Se colocan los n datos histricos en una tabla de frecuencias con m = n intervalos. Para
cada intervalo se tendr la frecuencia observada i (FOi). Se calcula la media y la varianza de los
datos.
2.- Se divide la frecuencia observada de cada intervalo por el nmero total de datos. A este
resultado para obtener la probabilidad observada i (POi).
3.- Se calcula la probabilidad acumulada observada de cada intervalo (POAi) del paso 2.
4.- Se propone una distribucin de probabilidad de acuerdo con la forma de la tabla de frecuencias
obtenida en 1.
5.- Con la distribucin propuesta se calcula la probabilidad esperada para cada uno de los
intervalos (PEi) mediante la integracin de la distribucin propuesta.
6.- Se calcula la probabilidad acumulada esperada (PEAi) para dado intervalo de clase.
7.- Se calcula el valor absoluto de la diferencia entre POAi y PEAi para cada intervalo y se
selecciona la mxima diferencia, llamndola DM.
8.- El estimador DM se compara con un valor lmite correspondiente a la tabla de la distribucin
Kolmogorov-Smirnov con n datos y a un nivel de confiabilidad de 1- . Si el estimador DM es
menor o igual a el valor lmite de la tabla, entonces no se puede rechazar que la informacin
histrica sigue la distribucin propuesta en el paso 4.
Ejemplo: Ajustando una Distribucin Uniforme Usando la Prueba de Ajuste de Bondad

Kolmogorov-Smirnov
Distribucin Uniforme a=0, b=13
F ( x) i =
1
LS i
ba
Intervalo
FO
FOA
POA
PEA
|POAPEA|
0-1
0.146
0.0769
0.0694
13
12
0.293
0.2307
0.0619
35
17
0.414
0.3846
0.0300
57
24
0.585
0.5384
0.0469
79
30
0.738
0.6923
0.0394
F ( x) i =
1
LS i
13
DM=0.0694
d5%,41=0.2123
9 11
36
0.878
0.8641
0.0319
11 - 13
41
1.000
1.0000
0.0000
como DM = 0.0694 es menor que
d5%,41 = 0.2123, entonces, los datos si siguen una
distribucin Uniforme.

Kolmogorov-Smirnov
=6
F(xi)=1-Exp(LSi /
F ( x) i = 1 e
LS i
F ( x) i = 1 e
LS i
6
Intervalo
FO
FOA
POA
PEA
|POAPEA|
03
20
20
0.3921
0.3934
0.0013
36
12
32
0.6274
0.6321
0.0049
69
39
0.7647
0.7768
0.0121
9 12
43
0.8431
0.8446
0.0215
12 15
45
0.8823
0.9179
0.0356
15 18
46
0.9019
0.9502
0.0483
>18
51
1.0000
1.0000
0.0000
como DM = 0.0483 es menor que

distribucin Exponencial.
M=0.0483
d5%,51=0.1904
d5%,51 = 0.1904, entonces, los datos si siguen una
Ejemplo: Ajustando una Distribucin Normal Usando la Prueba de Ajuste de Bondad

Kolmogorov-Smirnov
=8,
=2
Zi =
xi
Zi =
LS i
Intervalo
FO
FOA
POA
PEA
|POAPEA|
0-1
0.0
0.00023
0.000025
2 3
00.018
0.0061
0.01197
45
0.164
0.06681
0.09719
67
12
21
0.382
0.30854
0.0766
89
20
41
0.745
0.69146
0.05354
10 11
10
51
0.927
0.933319
0.00619
12 - 13
54
0.982
0.9938
0.0118
14 15
55
1.000
0.99977
0.00023
16 -17
55
1.000
1.0000
0.0000
DM= 0.09719
d5%,55 = 0.1833
como DM = 0.09719 es menor que d5%,55 = 0.1833, entonces, los datos si siguen una distribucin
Normal.
5.3.3
Prueba Anderson-Darling: Una Prueba de Ajuste de Bondad para

Muestras de tamao n Pequeo.
5.3.3.1
Introduccin
La mayora de los mtodos estadsticos asumen una cierta distribucin en la derivacin de sus
resultados. Sin embargo, cuando se asume que nuestros datos siguen una distribucin especfica,
tomamos un riesgo serio. Si nuestra consideracin es errnea, los resultados obtenidos pueden ser
no validos. Por ejemplo, los niveles de confidencia de los intervalos de confianza (IC) o las
pruebas de hiptesis implementados [2, 7] pueden estar completamente equivocados.
Las consecuencias de especificar mal una distribucin puede resultar ser muy costoso. Una forma
de tratar con este problema es verificar las consideraciones de la distribucin cuidadosamente.
Existen 2 enfoques principales para verificar la distribucin a considerar [2, 3, y 6]. Uno implica
procedimientos empricos, los cuales son fciles de entender e implementar y son basados en
intuicin y en las propiedades grficas de la distribucin que se desea probar. Los procedimientos
empricos pueden ser usados para verificar y validar la distribucin a considerar. Varias de ellas
han sido discutidas a profundidad en otros artculos [8,9, y 10].
Hay tambin otros procedimientos estadsticos ms formales para probar cierta distribucin en
referencia a un conjunto de datos. Estas son las pruebas de Ajuste de Bondad (AB). Ellas estn
numricamente interrelacionadas (convolucionadas) y generalmente requiere un programa
especfico para realizar la gran cantidad de clculos. Pero sus resultados son cuantificables y ms
confiables que los de un procedimiento emprico. Aqu, estamos interesados en aquellos
procedimientos de AB especializados para muestras pequeas. Entre ellas, estn las pruebas
Anderson-Darling (AD) y la Kolmogorov_Smirnov (KS).
Se provee un revisin general de algunos puntos importantes asociados con la implementacin de

las prueba de ajuste de bondad AD, especialmente cuando se trata de las consideraciones de las
distribuciones Exponencial, Normal y Lognormal. Estas distribuciones son ampliamente usadas en
trabajos de calidad y confiabilidad. Primero revisaremos algunas consideraciones tericas para
ayudad a entender (y aplicar) estas pruebas de AB. Entonces, desarrollaremos varios ejemplos
numricos y grficos que ilustrarn como implementar e interpretar las pruebas AB para ajustar
varias distribuciones.
5.3.3.2
Algunas Bases Estadsticas
Establecer la distribucin de un conjunto de datos ( o variables aleatoria) es crucial para el correcto

establecimiento de algunos procedimientos estadsticos. Pro ejemplo, la prueba t de muestra
pequea y el IC, para la media poblacional, requiere que la distribucin de la de la poblacin sea
Normal. Por lo que, primero se requiere establecer ( va una prueba de AB) si la distribucin
Normal aplica antes de que implementemos correctamente estos procedimientos estadsticos.
Las pruebas de AB estn especialmente basadas en dos elementos de la distribucin: la funcin
de distribucin acumulada (FDA) o la funcin de densidad de probabilidad (FDP). La prueba Chicuadrada esta basada en la FDP.
Ambas pruebas de AB, la AD y la KS usan la distribucin acumulada de probabilidad (FDA) y por lo

tanto pertenece a la clase de pruebas de distancia.
Se han seleccionado las pruebas AD y KS entre varias pruebas de distancia por dos razones.
Primero, ellas estn entre las mejores pruebas de distancia para muestras pequeas (Y tambin
pueden ser usadas para muestras grandes). Segundo, debido a que se encuentran disponibles
varios paquetes estadsticos para las pruebas Ad y KS, estos son ampliamente usados en la
prctica.
Para implementar las pruebas de distancia, seguimos una bien definida serie de pasos:
Primero, se asume una distribucin pre-especificada (ejemplo Normal). Entonces, se estiman los
parmetros de la distribucin (ejemplo la media y la varianza) de los datos o se obtienen de
experiencias previas. Tale proceso produce una distribucin hipottica, tambin llamada hiptesis
nula (o Ho), con varias partes que deben ser conjuntamente verdaderas. La negacin de la
distribucin asumida (o sus parmetros) es una hiptesis alternativa (tambin llamada H1).
Entonces se prueba la distribucin asumida (hipotetizada) usando el conjunto de datos.
Finalmente, Ho es rechazada cundo cualquiera de los datos que componen Ho no es avalada por
los datos.
5.3.3.2
Ejemplo: Ajustando una Distribucin Normal Usando la Prueba

de Ajuste de Bondad Anderson-Darling
LA prueba Anderson-Darling (AD) es ampliamente usada en la prctica. Por ejemplo, MIL-HDBKs 5

y 17 [4, 5, y 2], usan la prueba AD para probar las distribuciones Normal y Weibull. Mas adelante
se realizan dos ejemplos usando la prueba AD; Primero probando los datos para la distribucin
Normal y despus, para probar los datos para la distribucin Weibull. Si existe la necesidad de
probar los datos para la distribucin Lognormal, entonces se realiza la transformacin logartmica
de los datos originales y entonces se utiliza la prueba AD para el conjunto de datos transformado
para la distribucin Normal.
La prueba de ajuste de bondad AD para la distribucin Normal (Referencia [5] Seccin 8.3.4.1)
Tiene la siguiente forma funcional:
1 2i
n
i =1
n
AD =
{ ln ( F [ Z ]) + ln (1 F Z
0
( n +1i )
) } n;.....
(1)
Donde Fo es la distribucin asumida (Normal) con los parmetros asumidos o estimados de la

muestra (, ); Z( i ) es el ivo valor estandarizado de la muestra de tamao n, ln es el logaritmo
natural (base e) y el subndice i va de 1 a n.
La hiptesis Nula, que la verdadera distribucin es F0 con los parmetros asumidos, es entonces
rechazada (con un nivel de significancia 0.05, para una muestra de tamao n) si la prueba
estadstica AD es mayor que el valor crtico (VC). La regla de rechazo es:
Rechace si: AD > VC = 0.752 / (1 + 0.75/n + 2.25/ n2)
Se ilustra este procedimiento probando la Normalidad los datos del problema 6 de la seccin 8.3.7
de [5]. El conjunto de datos, (Tabla 1), contiene una pequea muestra de seis lotes, sacados de
forma aleatoria de la misma poblacin.
Tabla 1. Datos para la prueba de ajuste de bondad AD

338.7
308.5
317.7
313.1
322.7
294.2
Para probar la Normalidad de la muestra, primero se obtienen puntos de estimacin de los

parmetros de la distribucin Normal: media y desviacin estndar de la muestra (Tabla 2).
Tabla 2. Estadsticas descriptivas de los datos del prob. 6.
Variable
Media
Mediana
Conjunto de Datos
315.82
315.4
Bajo la consideracin de la distribucin Normal, Fo es normal ( = 315.8,
=14.9).
Entonces se implementa la estadstica AD (1) usando los datos (Tabla 1) como tambin la
probabilidad Normal y los parmetros estimados (Tabla 2). Para el elemento ms pequeo
tenemos:
294.2 315.8
P =315.8, =14.8 (294.2) = Normal
14.8
F0 ( z ) = F0 (1.456) = 0.0727
La Tabla 3 muestra los resultados inmediatos de la estadstica AD que combinamos con la formula
(1).Cada componente es mostrado en la columna correspondiente de la tabla, identificada por su
nombre.
Tabla 3. Valores inmediatos para la prueba de ajuste de bondad AD para Normalidad
AD =
i =1
F(Z)
ln F(Z)
n+1i
F(n+1-i)
1-F(n1i)
ln(1-F)
294.2
0.072711
-2.62126
0.938310
0.061690
-2.78563
308.5
0.311031
-1.16786
0.678425
0.321575
-1.13453
313.1
0.427334
-0.85019
0.550371
0.449629
-0.79933
317.7
0.550371
-0.59716
0.427334
0.572666
-0.55745
322.7
0.678425
-0.38798
0.311031
0.688969
-0.37256
338.7
0.938310
-0.06367
0.072711
0.927289
-0.07549
1 2i
6
ln F(Z)+ln F(n+1-i)
1 2i
{ln F ( Z ) + ln (1 F (n + 1 i )}
6
-1/6
-5.40689
0.90114833
-3/6
-2.30239
1.1151195
-5/6
-1.16952
1.3746
-7/6
-1.15461
1.347045
-9/6
-0.76054
1.14081
-11/6
-0.13916
0.25512666
1 2i
{ln F ( Z ) + ln (1 F (n + 1 i )} 6 , AD = 6.16992505-6 = 0.16992505
6
La estadstica AD (1) produce un valor de 0.1699 < 0.633, el cual no es significativa:
AD = 0.1699 < VC =
0.752
0.752
=
= 0.6333
0.75 2.25 1 + 0.125 + 0.0625
+
1+
6
36
As, la prueba de ajuste de bondad AD no rechaza que esta muestra haya sido sacada de una
poblacin con distribucin Normal (315.8, 14.9). Y se puede asumir Normalidad para los datos.
Los procedimientos de la prueba de ajuste de bondad AD, aplicados a este ejemplo se resume en
la tabla 4.
Finalmente, si deseamos ajustar a una distribucin Lognormal, primero obtenemos el logaritmo de

los datos y entonces implementar el procedimiento de la prueba AD de los datos transformados los
datos originales son Lognormal, entonces este logaritmo esta Normalmente distribuido, y se puede
usar la misma estadstica AD (1) para probar el comportamiento Lognormal.
Tabla 4. Resumen paso a paso para las pruebas de normalidad AD
Ordene la muestra original X ( Col. 1, Tabla 3) y estandarice Z =
Establezca la Hiptesis Nula: Asuma la distribucin Normal (, )

Obtenga los parmetros de la distribucin: =315.8; =14.9 (Tabla 2)
Obtenga la probabilidad acumulada F(Z) ( col. 2, tabla 3)
Obtenga el logaritmo de obtenido previamente ln[F(Z)] (Col. 3)
Ordene en forma descendente (n-i+1) las probabilidades acumuladas F(Z) (Cols. 4 y 5).
Encuentre los valores de 1-F(Z) para lo anterior (Col. 6).
Encuentre el logaritmo de lo anterior: ln[1-F(Z)] ( Col. 7)
Evale va (1): La prueba estadstica AD=0.1699 y VC=0.633
Como AD < VC asuma que la distribucin es Normal (315.8, 14.9)
Cuando sea posible, use un programa de computadora y use la prueba de valor p
Para problemas de pruebas de ajuste de bondad de tamao de muestra grande, frecuentemente

es mejor usar la prueba Chi-cuadrad [11]. No requiere conocer los parmetros de la distribucin
Algo de que ambas pruebas Ad y KS tericamente hacen y no afectan su potencial. Por otro lado,
la prueba Chi-cuadrada requiere que el numero de datos se suficientemente grande para la prueba
estadstica para converger a la referenciada distribucin Chi-cuadrada algo que las pruebas AD y
KS no requieren.
5.3.3.4
Ejemplo: Ajustando una distribucin Weibull usando una prueba

de Ajuste de Bondad Anderson-Darling
Ahora se desarrolla un ejemplo para probar si un conjunto de datos se apegan a una distribucin
Weibull. Se usaran los datos de la Tabla 5. Los datos consisten en seis medidas sacadas de una
poblacin Weibull ( = 10; = 2). En nuestro ejemplo, sin embargo, los parmetros son
desconocidos y sern estimados del conjunto de datos.
Tabla 5. Conjunto de datos para probar la consideracin de una Weibull.
11.7216
10.4286
8.0204
7.5778
1.4298
4.1154
Se obtienen las estadsticas descriptivas (Tabla 6). Entonces, usando mtodos grficos en [11], se
obtienen las estimaciones de los puntos de los parmetros de la distribucin Weibull asumida:
Forma = 1.3 y Escala = 8.7. Los parmetros permiten definir las hiptesis de la distribucin:
Weibull ( = 8.7; = 1.3).
Variable
Media
Mediana
Desviacin
Estndar
Mnimo
Mximo
Q1
Conjunto de
Datos
7.22
7.8
3.86
1.43
11.72
3.44
La versin Weibull de la prueba de ajuste de bondad AD es diferente de la utilizada con la

distribucin Normal, tratada con anterioridad. Esta versin para la Weibull es explicada a detalle en
[2, 5] y esta definida por:
AD = [
1 2i
n
i =1
n
{ ln (1 exp ( Z )) Z
X
Donde Z i = *i

( n +1i )
} n ]
0.2
y AD* = 1 +
AD
n
(2)
y donde el asterisco en los parmetros de la Weibull denota las estimaciones
correspondientes. La probabilidad (Valor p) del Nivel de Significancia Observado (NSO) es ahora

usado para probar las consideraciones WEIBULL. Si NSO < 0.05 entonces la consideracin de
Weibull es rechazada y el error cometido es menor del 5%. La formula para el NSO esta dada por:
NSO =
{1 + exp[0.1 + 1.24
ln( AD* ) + 4.48( AD* )]}
Para implementar la prueba de ajuste de bondad AD, primero obtenemos las probabilidades
correspondientes AD bajo la distribucin asumida H0 . Por ejemplo, el primer dato (1.4298 1.43)
X
P =8.7; =1.3 (1.43) = 1 exp( Z1 ) = 1 exp 1

1.43 1.3
= 1 exp
= 1 0.909 = 0.091
8.7
Entonces, se usan estos valores para trabajar con las formulas AD y AD* en (2). Se dan a
continuacin en la Tabla (7) los resultados inmediatos para en conjunto de datos en la Tabla 5:
Tabla 7. Valores para la prueba de ajuste de bondad AD para la distribucin Weibull

-Z(i)
vo
Fila
Conjunto
de Datos
Z(i)
Probabilidad
Weibull
e-Z(i)
1.430
0.09560
0.091176
0.685308
-2.39496
1.47336
0.64472
4.115
0.37789
0.314692
0.908824
-1.15616
1.26567
1.21092
7.578
0.83566
0.566413
0.433587
-0.56843
0.89967
1.22342
8.020
0.89967
0.593296
0.406704
-0.52206
0.83566
1.58401
10.429
1.26567
0.717949
0.282051
-0.33136
0.37789
1.06387
11.722
1.47336
0.770846
0.229154
-0.26027
0.09560
0.65242
Ln(1-e
Zn-i+1
termino
La estadstica de la prueba de ajuste de bondad AD son: : AD = 0.37936 y AD* = 1.08(.37936)=

0.409788. Los valores correspondientes para el NSO, o la probabilidad de rechazar la distribucin
Weibull (8.7;1.3) errneamente con esos resultados, es NSO = 0.3466 (mucho mayor que el error
=0l05).
Por lo que se acepta la hiptesis nula de que la distribucin en prueba es Weibull (de la poblacin
de donde los datos son obtenidos) ( =8.7; =1.3). Por lo que, la prueba AD fue capaz de
reconocer que los datos fueron Weibull. El procedimiento de la prueba de AB para este caso se
resume en la Tabla 8.
Tabla 8. resumen paso a paso de la prueba de ajuste de bondad Anderson-Darling
X
Ordene la muestra original X ( Col. 1, Tabla 3) y estandarice Z i = *i

Tabla 7)
Establezca la Hiptesis Nula: Asuma la distribucin Weibull
Obtenga los parmetros de la distribucin: = 8.7; = 1.3
Obtenga la probabilidad acumulada exp(-Z) ( Cols. 3 y 4)
Obtenga el logaritmo de obtenido previamente ln[1- exp(-Z)] (Col. 5)
Ordene Zi en forma descendente (n-i+1) (Col. 6).
Evale va (1): La prueba estadstica AD* =0.4104 y NSO =0.3466
Como NSO =0.3466 > = 0.05, asuma Weibull = 8.7; = 1.3)
(Cols. 1 y 2
Cuando sea posible use Software para la prueba AD como Stat:fit del PROMODEL y el
Minitab
Finalmente, recordemos que la distribucin Exponencial, con media , es nicamente una caso
especial de la Weibull
) donde el parmetro de forma -1. Por lo que, si se esta interesado en
la prueba de ajuste de bondad AD para considerar la Exponencialidad de los datos, ser suficiente
estimar la media ( ) y entonces implementar el procedimiento anteriormente seguido para la
Weibull para este caso especial, usando la formula (2)
Sin embargo, no existe estadsticas AD (formulas ) para todas las distribuciones de probabilidad.
Por lo que, si existe la necesidad de ajustar otras distribuciones diferentes a las ya discutidas, es
mejor usar las pruebas de ajuste de bondad Anderson-Darling [12] y la Chi-cuadrada [11].
Problemas Propuestos
1. Verifica la hiptesis de uniformidad con
0.81, 0.14, 0.05, 0.93?
2. Considrese la secuencia de
prueba Chi-Cuadrada:
0.34 0.90 0.25 0.89
0.83 0.76 0.79 0.64
0.96 0.99 0.77 0.67
0.47 0.30 0.17 0.82
0.79 0.71 0.23 0.19
0.99 0.17 0.99 0.46
=0.05 bajo el test de K-S la secuencia siguiente: 0.44,
nmeros siguiente y comprubese si verifica uniformidad segn la

0.87
0.70
0.56
0.56
0.82
0.05
0.44
0.81
0.41
0.05
0.93
0.66
0.12
0.94
0.52
0.45
0.65
0.10
0.21
0.74
0.73
0.31
0.37
0.42
0.46
0.22
0.99
0.78
0.39
0.18
0.67
0.74
0.02
0.05
0.42
0.49
3. Dada la secuencia de nmeros aleatorios uniformes 0.1306, 0.0422, 0.6597, 0.7965, 0.7696
obtener a partir de ellos una secuencia de nmeros que se ajusten a una distribucin exponencial
con =1.
4. Se ha estado contabilizando el nmero de vehculos que han llegado a una interseccin a travs
de una determinada calle entre las 7:00 AM y las 7:05 AM, obtenindose los datos siguientes:
Llegadas
0
1
2
3
4
5
Frecuencia
(das)
1
0
1
1
3
1
Llegadas
6
7
8
9
10
11
Frecuencia
(das)
2
1
5
2
5
4
Llegadas
12
13
14
15
16
17
Frecuencia
(das)
6
1
0
0
2
2
Llegadas
18
19
20
21
22
23
Frecuencia
(das)
1
0
0
0
0
1
Constryase la representacin en forma de histograma de esos datos y realice una prueba de

ajuste de bondad para determinar la distribucin de probabilidad a la que mejor se ajusta.
5. Se sabe que el tiempo de retraso desde que se cursa una orden hasta que se dispone de lo
pedido viene dado por una variable aleatoria con distribucin gamma. Se tiene la siguiente tabla de
tiempos de retraso (en das) asociados con 20 rdenes:
1 - 70.292 6 - 25.292 11 - 30.125 16 - 16.314

2 - 10.107 7 - 14.713 12 - 17.137 17 - 28.073
3 - 48.386 8 - 39.166 13 - 44.024 18 - 39.019
4 - 20.480 9 - 17.421 14 - 10.552 19 - 32.330
5 - 13.053 10- 13.905 15 - 37.298 20 - 36.547
Calcular los correspondientes parmetros de esta distribucin.
6. Se ha realizado un prueba sobre una muestra aleatoria de 50 chips de microprocesador a 1.5
veces la tensin nominal y se ha anotado su vida en das (o tiempo hasta que falla el chip),
obtenindose lo siguiente: 79.919, 3.081, 0.062, 1.961, 5.845, 3.027, 6.505, 0.021, 0.013, 0.123,
6.769, 59.899, 1.192, 340760, 5.009, 18.387, 0.141, 43.565, 24.420, 0.433, 144.695, 2.663,
17.967, 0.091, 9.003, 0.941, 0.878, 3.371, 2.157, 7.579, 0.624, 5.380, 3.148, 7.078, 23.960, 0.590,
1.928, 0.300, 0.002, 0.543, 7.004, 31.764, 1.005, 1.147, 0.219, 30217, 14.382, 1.008, 2.336, 4.562.
Se sospecha que siguen una distribucin Weibull (con
=0). Estmense los parmetros
correspondientes usando la prueba Chi-Cuadrada
7. Se ha estado observando el nmero de vehculos que han pasado por una calle durante 5
minutos a una determinada hora durante 100 das y se han obtenido los resultados que se detallan
en la siguiente tabla de frecuencia:
N de coches Frecuencia N de coches Frecuencia N de coches Frecuencia
0
12
4
10
8
5
1
10
5
8
9
3
2
19
6
7
10
3
3
17
7
5
11
1
Una vez construido el histograma parece que la variable aleatoria X={nmero de llegadas} sigue
una distribucin Poisson. Se ha procedido a la determinacin del parmetro alfa a travs del
estimador correspondiente, y se obtiene el valor 3.64. Se pide comprobar si esta suposicin de
Poisson supera la prueba Chi-Cuadrada.
8. Comprobar si la suposicin Weibull del ejercicio 6 supera la prueba Anderson-Darling.
5.4
Referencias bibliograficas
A. M. Law and D. W. Kelton. Simulation Modeling and Analysis. Industrial Engineering

and Management Science. McGraw-Hill Inc., 2nd edition, 1991.
An Introduction to Probability Theory and Mathematical Statistics, Rohatgi, V.K., Wiley, NY, 1976.
A Practical Guide to Statistical Analysis of Material Property Data, Romeu, J.L. and C. Grethlein,
AMPTIAC, 2000.
J. Banks, J. S. Carson, and B. L. Nelson. Discrete-event system simulation.
Prentice-Hall, Inc., Upper Saddle River, New Jersey 07458, 2nd edition, 1996.
Banks, J., Carson, J.S., II, and Goldsman, D., "Discrete-Event Computer Simulation," Handbook of
Statistical Methods for Engineers and Physical Scientists, 2nd ed., (H.M. Wadsworth, Ed.),
McGraw-Hill, New York, 1998.
B. Concebs, Discrete Systems Simulation, Mc Graw-Hill, 1994
Christos Alexopoulos, Andrew F. Seila, Advanced Methods for Simulation Output Analysis,
Proceedings of the 1998 Winter Simulation Conference,D.J. Medeiros, E.F. Watson, J.S. Carson
and M.S. Manivannan, eds
Ch. Harrel,B. Ghosh, yR. Borden,Simulation using ProModel,Mc Graw-Hill, 2003 Second edition
Empirical Assessment of Normal and Lognormal Distribution Assumptions, Romeu, J.L., RAC
START,Volume 9, Number 6, http://rac.alionscience.com/pdf/NLDIST.pdf.
Empirical Assessment of Weibull Distribution, Romeu, J.L., RAC START, Volume 10, Number 3,
http://rac.alionscience.com/pdf/WEIBULL.pdf.
Kolmogorov-Smirnov GoF Test, Romeu, J.L., RAC START, Volume 10, Number 6.
Lawrence Leemis, Simulation Input Modeling,Proceedings of the 1999 Winter Simulation
ConferenceP. A. Farrington, H. B. Nembhard, D. T. Sturrock, and G. W. Evans, eds.
Methods for Statistical Analysis of Reliability and Life Data, Mann, N., R. Schafer, and N.
Singpurwalla, John Wiley, NY, 1974.
MIL-HDBK-5G, Metallic Materials and Elements.
MIL-HDBK-17 (1E), Composite Materials Handbook.
Practical Statistical Tools for Reliability Engineers,Coppola, A., RAC, 1999.
S. Ross, Simulacin, Pearson, 1999 segunda edicin.
Statistical Confidence, Romeu, J.L., RAC START, Volume 9, Number 4,
http://rac.alionscience.com/pdf/STAT_CO.pdf.
Statistical Assumptions of an Exponential Distribution, Romeu, J.L., RAC START, Volume 8,
Number 2,http://rac.alionscience.com/pdf/E_ASSUME.pdf.
The Chi-Square: a Large-Sample Goodness of Fit Test, Romeu, J.L., RAC START, Volume 10,
Number 4,http://rac.alionscience.com/pdf/Chi_Square.pdf.
RAC significa (Reliability Analysis Center) por sus siglas en ingles.

Capítulo 2 Generación de Números Aleatorios

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Capítulo 2 Generación de Números Aleatorios

Uploaded by

Copyright:

Available Formats

CAPITULO 5

El suministro de datos es la fuerza motora para un modelo de simulacin. En la simulacin de un

2.- Identifique la distribucin de probabilidad que representa al proceso de suministro de datos.

diferente de distribuciones, y repite el procedimiento. Se puede usar una distribucin emprica, si

En muchas instancias la media de la muestra, o la media y la varianza de la muestra, son usadas

Si las observaciones en la muestra de tamao n son X1,X2,,....Xn , la media de la muestra ( X ) esta

y la varianza de la muestra S , esta definida por S =

valores de X y f j es la frecuencia observada de Xj de X.

143 Xj < 147

f 1=23, m1=1.5, f2=10, m2=4.5,....., y

Con n=50, X se obtiene de la ecuacin 5

Estimadores sugeridos para distribuciones frecuentemente usadas en simulacin

Pruebas de Ajuste de Bondad

5.3.1 Prueba Chi-Cuadrada ( 2 )

La prueba 2 es un procedimiento para probar la Hiptesis de que una muestra aleatoria de

Los pasos seguidos para probar el proceso son:

1. Establezca la prueba de hiptesis, H0 , en la que los n datos observados son

= frecuencias tericas observadas

si 2 cal > 2 Tabla entonces rechace Ho y acepte H1

El valor de 2 en la tabla es encontrado en la tabla de ji-cuadrada y es definido por el nmero de

Nmero promedio de arribos =

La recomendacin para el nmero de intervalos de clase para datos continuos se resume en la

Numero de intervalos de clase

No use la prueba Chi-cuadrada

Ejemplo: Ajustando una Distribucin Exponencial Usando la Prueba de Ajuste de Bondad

La media es de 20.1 segundos.

y su respectiva funcin acumulada de probabilidad por:

p1=[F(10)-F(0)]*60 = 0.391958*60 = 23.51748

Ahora se elabora la tabla para el calculo de la

As la 2 calculada =4.286658. Ahora se obtiene la

de la tabla, con grados de libertad igual a 5-1-

5.3.2 Prueba Kolmogorov-Smirnov

Paso 3: Sea D= max( D+, D- )

De acuerdo a la tabla anterior, D=0.233. Eligiendo un nivel de significancia de 0.05 y un tamao de

5.3.2.1 Otra forma de realizar la prueba

Ejemplo: Ajustando una Distribucin Uniforme Usando la Prueba de Ajuste de Bondad

como DM = 0.0694 es menor que

d5%,41 = 0.2123, entonces, los datos si siguen una

Ejemplo: Ajustando una Distribucin Exponencial Usando la Prueba de Ajuste de Bondad

como DM = 0.0483 es menor que

d5%,51 = 0.1904, entonces, los datos si siguen una

Ejemplo: Ajustando una Distribucin Normal Usando la Prueba de Ajuste de Bondad

Prueba Anderson-Darling: Una Prueba de Ajuste de Bondad para

Se provee un revisin general de algunos puntos importantes asociados con la implementacin de

Algunas Bases Estadsticas

Establecer la distribucin de un conjunto de datos ( o variables aleatoria) es crucial para el correcto

Ambas pruebas de AB, la AD y la KS usan la distribucin acumulada de probabilidad (FDA) y por lo

Ejemplo: Ajustando una Distribucin Normal Usando la Prueba

LA prueba Anderson-Darling (AD) es ampliamente usada en la prctica. Por ejemplo, MIL-HDBKs 5

Donde Fo es la distribucin asumida (Normal) con los parmetros asumidos o estimados de la

Rechace si: AD > VC = 0.752 / (1 + 0.75/n + 2.25/ n2)

Tabla 1. Datos para la prueba de ajuste de bondad AD

Para probar la Normalidad de la muestra, primero se obtienen puntos de estimacin de los

Tabla 2. Estadsticas descriptivas de los datos del prob. 6.

Bajo la consideracin de la distribucin Normal, Fo es normal ( = 315.8,

Tabla 3. Valores inmediatos para la prueba de ajuste de bondad AD para Normalidad

La estadstica AD (1) produce un valor de 0.1699 < 0.633, el cual no es significativa:

Finalmente, si deseamos ajustar a una distribucin Lognormal, primero obtenemos el logaritmo de

Tabla 4. Resumen paso a paso para las pruebas de normalidad AD

Ordene la muestra original X ( Col. 1, Tabla 3) y estandarice Z =

Establezca la Hiptesis Nula: Asuma la distribucin Normal (, )

Para problemas de pruebas de ajuste de bondad de tamao de muestra grande, frecuentemente

Ejemplo: Ajustando una distribucin Weibull usando una prueba

Tabla 5. Conjunto de datos para probar la consideracin de una Weibull.

p1=[F(10)-F(0)]60 = 0.39195860 = 23.51748