Professional Documents
Culture Documents
BONDAD
5.1
PRUEBAS DE AJUSTE DE
Introduccin
Estos son cuatro pasos en el desarrollo de un modelo til para el suministro de datos:
1.- Rena datos del sistema real de inters. Esto frecuentemente requiere un tiempo sustancial y
comprometer recursos. Desafortunadamente, en algunos casos no es posible reunir datos (por
ejemplo, cuando se esta extremadamente limitado por el tiempo, cuando el proceso de suministro
no existe an, o cuando las leyes o reglas prohben el reunir datos.) Cuando los datos no estn
disponibles, la opinin de un experto en el proceso debe considerarse para tener una sugerencia
de relevancia (educada).
3.- Elija los parmetros que determinan la instancia especfica de la familia de distribuciones.
Cuando los datos estn disponibles estos parmetros pueden ser estimados de los datos.
4.- Evalu la distribucin elegida y sus parmetros asociados para realizar una prueba de ajuste de
bondad. La prueba de ajuste de bondad evala informalmente usando mtodos grficos, o
formalmente usando pruebas estadsticas. Las pruebas Chi-cuadrada, Kolmogorov-Smirnov y
Anderson-Darling son pruebas estndar de las pruebas de ajuste de bondad. Si no se esta
satisfecho con la distribucin elegida, entonces el analista regresa al paso 2, elige una familia
Aunque en la actualidad hay programas disponibles para lograr los pasos 2,3, y 4 incluyendo
programas especficos tales como ExpertFit, y programas integrados tales como SIMAN, Stat:Fit
del ProModel, Statistica, MiniTab - es todava importante comprender el alcance de los programas,
de forma tal que se usen apropiadamente.
Desafortunadamente, no existen programas disponibles para situaciones en las que no hay datos
disponibles o en los que existe una relacin entre dos o ms variables de inters.
5.2
Estimacin de Parmetros
X=
X
i =1
X
i =1
2
i
nX2
n 1
Si los datos son discretos y agrupados en una distribucin de frecuencias, las ecuaciones 1 y 2
pueden ser modificadas para dar una eficiencia computacional mucho mayor. LA media de la
muestra es calculada por
k
X=
j =1
fjX j
y la varianza de la muestra por S =
2
j =1
fjX2j n X2
n 1
donde k es el numero de
Ejemplo
Los datos siguientes pueden se analizados para obtener n = 100, f1=12, X1=0,
f 2=10, X2=1,.....,, y
X
j =1
= 364
n
j =1
X 2 j = 2080
Arribos por
periodo
Arribos por
periodo
Frecuencia
Frecuencia
12
10
19
17
10
10
11
de la ecuacin 3 X =
2080 100(3.64)2
364
2
y S =
= 7.63
100
99
donde S=2.76.
Cuando los datos son dados en intervalos de clase, no es posible obtener el valor exacto de la
media y varianza de la muestra. En tal caso, la media y varianza de la muestra se calculan
aproximadamente usando las ecuaciones siguientes:
X=
fm
j =1
y S =
2
fm
j =1
2
j
nX2
n 1
donde f j es la frecuencia observada en el jvo intervalos de clase, m j es el punto medio del jvo
intervalo de clase, y c en el numero de intervalos de clase.
Ejemplo
Considere los datos de la vida de un Chip donde que son eliminados o perdidos.
Vida de Chip
Frecuencia
(das)
0 Xj < 3
23
3 Xj < 6
10
6 Xj < 9
9 Xj < 12
12 Xj < 15
15 Xj < 18
18 Xj < 21
21 Xj < 24
24 Xj < 27
27 Xj < 30
30 Xj < 33
33 Xj < 36
42 Xj < 45
57 Xj < 60
78 Xj < 81
Para determinar los valores aproximados de X y S2 se usan las ecuaciones 5 y 6. Los siguientes
valores son determinados:
49
49
j =1
f j m j =614
fm
j =1
=37, 226.5
X =
614
= 12.28 . Entonces S2 se obtiene usando la ecuacin 6 como
50
37, 226.5 50(12.28)2
S =
= 605.849
49
2
Distribucin
Parmetro(s)
Estimador(es)
sugerido(s)
Poisson
=X
Exponencial
1
_
X
Uniforme sobre (0,b)
Normal
b=
Gamma
n +1
n
^
= X, 2 = S2
^
1
_
X
Weibull con
=0
X
=
S
^
j = j 1
f ( j 1 )
^
f ' ( j 1 )
Ve las ecuaciones 12
^
y 15 para f ( j 1 ) y
^
f ' ( j 1 )
Iterar
hasta
converger
que
1 n
= X i
n i =1
5.3
Las pruebas de Ajuste de Bondad proveen una gua til para evaluar la sustentabilidad de un
modelo potencial para el suministro de datos. Sin embargo, no existe una sola distribucin en
aplicaciones reales, de las que no debers ser esclavo para el veredicto de tales pruebas. Es
especialmente importante entender el efecto del tamao de la muestra. Si muy pocos datos estn
disponibles, entonces una prueba de ajuste bondad puede rechazar a alguna distribucin
candidato; pero si hay muchos datos disponibles, entonces una prueba de ajuste de bondad puede
rechazar a todas las pruebas candidato. Por esto, fallar en rechazar una distribucin candidato
debers ser tomada como una sola pieza de evidencia a favor de esta eleccin, mientras que
rechazar un modelo de suministro de datos es nicamente una pieza de evidencia contra la
eleccin.
La prueba es valida para tamaos de muestra grandes, para consideraciones de ambos tipos de
distribuciones discretas y continuas, cuando los parmetros son estimados por mxima
verisimilitud.
2 =
donde
2 cal
( f0 fe )2
fe
= valor calculado de x
fo
= frecuencias observadas
fe
Calcules fei como npi , donde pi es la probabilidad terica hipotetizada asociada con el ivo intervalo.
prubese la 2 cal con 2 tabla
2
si 2 cal < Tabla entonces rechace H1 y acepte Ho
Ejemplo: Ajustando una Distribucin Poisson Usando la Prueba de Ajuste de Bondad Chi2
Cuadrada ( )
No. de Arribos/Hora
Frecuencia
Frecuencia
(fo-fe)2
(x)
Observada
Esperada
(fo)
(fe)
fe
70
75.05
3.3398
84
75.05
1.0673
34
37.52
0.3302
12
4 o Ms
* 16
12.51
*16 .38
0.0088
2 cal =
1.7461
3.87
204
*Calculando si 2 cal , se asume que cada clase de datos tiene una fe de al menos 5, debido a que
cada valor esperado para x>4 es 3.87 observaciones, se agrupan la 3 y 4 clase.
xf
f
204
=1
204
usando
=1 la funcin de densidad Poisson, se pueden calcular la probabilidad de los varios
como sigue ;
nmeros de clientes que entran al banco. Estos se expresan
P( x) =
Funcin de densidad de la distribucin Poisson:
(1)e 1
P( x = 0) =
= .36788
0!
P( x = 1) =
(1)e 1
= .36788
1!
P( x = 2) =
(1)e 1
= .18394
2!
( ) x e
x!
P( x = 3) =
(1)e 1
= .06131
3!
3
P( x 4) = 1 P( x < 4) = ..01899
i =0
El nmero de grados de libertad para este problema en particular es 2, debido a que existen 4
intervalos de clases de datos en el conjunto original y la distribucin Poisson tiene un parmetro,
, por lo que g.l.=4-1-1=2 .
Si probamos la hiptesis, Ho , a un nivel de confianza del 95%,
entonces =.05. Refirindose a la tabla 2 se encuentra para =.05 y g.l.=2, 2 Tabla = 5.991.
Debido a que 2 cal es menor que 2 Tabla , se rechaza H1, y se concluye que los datos pueden ser
simulados adecuadamente con el proceso generador Poisson.
El valor mnimo de fei es 5, y de obtenerse un valor menor a este valor, se combina este con los
intervalos de clase inmediatos superiores hasta que el valor combinado sea al menos 5. Lo mismo
debe hacerse con las columnas de fo y de =
2
( f0 fe )2
.
fe
Tamao de la muestra
k
20
50
De 5 a 10
100
De 10 a 20
>100
De
n hasta
n
5
Los 60 datos siguientes representan el tiempo en segundos del tiempo entre arribos de los carros
en una cierta interseccin.
12
26
18
15
44
28
44
16
19
37
29
10
18
35
17
20
31
24
15
18
30
11
28
68
19
26
25
37
46
18
14
34
26
49
16
32
23
36
19
21
22
f ( x) =
x
1 20.1
e
, para x > 0
20.1
F ( x) = 1 e
x
20.1
> 0
Se realizan los clculos para obtener la frecuencia esperada de los diferentes intervalos de clase:
F (0) = 1 e
F (10) = 1 e
0
20.1
20
20.1
30
20.1
40
20.1
50
20.1
F (40) = 1 e
F (50) = 1 e
10
20.1
F (20) = 1 e
F (30) = 1 e
= 1 1 = 0
= 1 .60804 = 0.391958
= 1 0.369714 = 0.630285724
= 1 0.224801 = 0.77519839
= 1 0.136695 = 0.863304574
= 1 0.08311 = 0.916887652
F (60) = 1 e
F (70) = 1 e
60
20.1
70
20.1
= 1 0.050535733 = 0.949464266
= 1 0.0307278 = 0.969272184
calculada
( Foi Fei )2
Fei
Frecuencia
Frecuencia
Observada
Esperada
Foi
Fei = npi
0-10
19
23.51748
0.8677641
10-20
16
14.29966
0.20218355
20-30
12
8.698188
1.25336601
30-40
5.286371
1.39297494
40-50
3.21498468
50-60
1.95459684
60-70
1.188475
Totales
n = 60
60
Cuando Fei = npi es menor que 5 se debe combinar con la celda inmediata superior. Lo cual
sucede para las ltimas 3 filas, resultando la tabla siguiente:
( Foi Fei )2
Fei
Frecuencia
Frecuencia
Observada
Esperada
Foi
Fei = npi
0-10
19
23.51748
0.8677641
10-20
16
14.29966
0.20218355
20-30
12
8.698188
1.25336601
30-40
5.286371
1.39297494
40-50
6.3580564
0.29007547
n = 60
58.159755
4.286658
Celda
50-60
60-70
Totales
2
Tabla,3,0.05
=7.81
Como la 2 calculada =4.286658 es menor que 2Tabla=7.81, se puede decir que los tiempos entre
arribos de los carros siguen comportamiento que se apega a una distribucin exponencial.
usando los datos obtenidos). Dado que los parmetros actuales de la distribucin de los datos son
raramente conocidos, esto limita seriamente la aplicabilidad de la prueba original KS. Ms
recientemente, una nueva forma de la prueba KS ha sido desarrollada, la cual permite la
estimacin de parmetros usando los datos obtenidos., pero esta prueba reciente se aplica ms de
manera mas favorable nicamente para las distribuciones Normal , Exponencial y Weibull. Nota
que la prueba KS ha sido aplicada a otras distribuciones continuas (y tambin a distribuciones
discretas) usando parmetros que son estimados sobre la base de los datos obtenidos. Aunque
esta prctica puede resultar en que obtengamos buenos ajustes, el usuario debe ser cuidadoso
que producir una prueba conservadora en la cual la oportunidad de rechazar una distribucin
candidato puede ser mayor que lo deseado.
La prueba KS es conducida desarrollando una distribucin de probabilidad emprica acumulada
basada en los datos obtenidos y comparndola con la funcin de distribucin de probabilidad
acumulada de la distribucin terica candidato. Si X1, X2, .,Xn son datos observados ordenados
en una forma ascendente, entonces la funcin de distribucin de probabilidad emprica esta
definida como;
Fn ( x ) =
Nmero de X i x
n
Por lo tanto Fn(x) es una funcin paso tal que Fn(x) = i / n para i = 1,2,.,n.
Esta prueba esta basada en la desviacin absoluta mayor entre las fdp emprica y terica para
todo valor dado de x. Esta desviacin es comparada con los valores crticos de KS tabulados para
determinar si la desviacin puede ser atribuida a los efectos aleatorios y por lo tanto sea una
distribucin candidato a ser aceptada tener un buen ajuste a los datos observados. Ms
especficamente, la prueba tiene los pasos siguientes:
Paso 1: Ordene los datos en forma ascendente
Paso 2: Usando la fdp terica F(x), calcule
= max1i N F ( xi )
N
i 1
= max1i N F ( xi )
4
5
0.53
0.94
0.80
1.00
0.27
0.06
D+= 0.27
-0.07
-.14
D-=0.14
De acuerdo a los clculos, D = max( 0.27, 0.14 ) = 0.27. El valor crtico de KS de la tabla para un
tamao de 5 y un nivel de significancia de 0.05 es 0.565. Debido a que D es menor que este valor
crtico, la hiptesis de que los datos dados pertenecen a una distribucin Uniforme es aceptada.
Ejemplo: Ajustando una Distribucin Exponencial Usando la Prueba de Ajuste de Bondad
Kolmogorov-Smirnov
En este ejemplo se usa una prueba KS para observar bajo un nivel de significancia =0.05 si un
dado conjunto de datos observados representan a una distribucin Exponencial. Suponga que los
siguientes 10 puntos representan los tiempos entre arribos de los clientes a un cajero bancario (el
tiempo esta en minutos): 3.10, 0.20, 12.10, 1.40, 0.05, 7.00, 10.90, 13.70, 5.30, 9.10.
Los datos son obtenidos dentro de un perodo de 63 minutos. De acuerdo a la teora, si la
distribucin de los tiempos entre arribos dentro de T unidades de tiempo es exponencial, los
tiempos de arribo son uniformemente distribuidos entre 0 y T. Para encontrar los tiempos de arribo
simplemente aadimos los tiempos entre arribos. Por lo cual t1, t1+t2, t1+t2+t3, .. t1+t2+.+t10 son los
tiempos de arribo del primer al dcimo cliente. Dividiendo estos tiempos entre la longitud del
periodo de obtencin de los datos(63 en este caso), resulta un conjunto normalizado de datos los
cuales estn distribuidos entre o y 1. Entonces se procede a aplicar el procedimiento para probar el
ajuste a la distribucin uniforme.
La tabla siguiente resume los clculos realizados:
i
i
F(xi)
i/n
X i = j =1 t i
1
2
3
4
5
6
7
8
9
10
3.10
3.30
15.40
16.80
16.85
23.85
34.75
48.45
53.75
62.85
0.049
0.052
0.344
0.267
0.267
0.379
.552
0.769
0.853
0.998
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
i/n - F(xi)
F(xi) (i-1)/n
0.051
0.148
0.056
0.133
0.233
0.221
0.148
0.031
0.047
0.002
D+= 0.233
0.049
-0.048
0.044
-0.033
-0.133
-0.121
-0.048
0.069
0.053
0.098
D-=0.098
F ( x) i =
1
LS i
ba
Intervalo
FO
FOA
POA
PEA
|POAPEA|
0-1
0.146
0.0769
0.0694
13
12
0.293
0.2307
0.0619
35
17
0.414
0.3846
0.0300
57
24
0.585
0.5384
0.0469
79
30
0.738
0.6923
0.0394
F ( x) i =
1
LS i
13
DM=0.0694
d5%,41=0.2123
9 11
36
0.878
0.8641
0.0319
11 - 13
41
1.000
1.0000
0.0000
distribucin Uniforme.
F ( x) i = 1 e
LS i
F ( x) i = 1 e
LS i
6
Intervalo
FO
FOA
POA
PEA
|POAPEA|
03
20
20
0.3921
0.3934
0.0013
36
12
32
0.6274
0.6321
0.0049
69
39
0.7647
0.7768
0.0121
9 12
43
0.8431
0.8446
0.0215
12 15
45
0.8823
0.9179
0.0356
15 18
46
0.9019
0.9502
0.0483
>18
51
1.0000
1.0000
0.0000
M=0.0483
d5%,51=0.1904
Zi =
xi
Zi =
LS i
Intervalo
FO
FOA
POA
PEA
|POAPEA|
0-1
0.0
0.00023
0.000025
2 3
00.018
0.0061
0.01197
45
0.164
0.06681
0.09719
67
12
21
0.382
0.30854
0.0766
89
20
41
0.745
0.69146
0.05354
10 11
10
51
0.927
0.933319
0.00619
12 - 13
54
0.982
0.9938
0.0118
14 15
55
1.000
0.99977
0.00023
16 -17
55
1.000
1.0000
0.0000
DM= 0.09719
d5%,55 = 0.1833
como DM = 0.09719 es menor que d5%,55 = 0.1833, entonces, los datos si siguen una distribucin
Normal.
5.3.3
5.3.3.1
Introduccin
La mayora de los mtodos estadsticos asumen una cierta distribucin en la derivacin de sus
resultados. Sin embargo, cuando se asume que nuestros datos siguen una distribucin especfica,
tomamos un riesgo serio. Si nuestra consideracin es errnea, los resultados obtenidos pueden ser
no validos. Por ejemplo, los niveles de confidencia de los intervalos de confianza (IC) o las
pruebas de hiptesis implementados [2, 7] pueden estar completamente equivocados.
Las consecuencias de especificar mal una distribucin puede resultar ser muy costoso. Una forma
de tratar con este problema es verificar las consideraciones de la distribucin cuidadosamente.
Existen 2 enfoques principales para verificar la distribucin a considerar [2, 3, y 6]. Uno implica
procedimientos empricos, los cuales son fciles de entender e implementar y son basados en
intuicin y en las propiedades grficas de la distribucin que se desea probar. Los procedimientos
empricos pueden ser usados para verificar y validar la distribucin a considerar. Varias de ellas
han sido discutidas a profundidad en otros artculos [8,9, y 10].
Hay tambin otros procedimientos estadsticos ms formales para probar cierta distribucin en
referencia a un conjunto de datos. Estas son las pruebas de Ajuste de Bondad (AB). Ellas estn
numricamente interrelacionadas (convolucionadas) y generalmente requiere un programa
especfico para realizar la gran cantidad de clculos. Pero sus resultados son cuantificables y ms
confiables que los de un procedimiento emprico. Aqu, estamos interesados en aquellos
procedimientos de AB especializados para muestras pequeas. Entre ellas, estn las pruebas
Anderson-Darling (AD) y la Kolmogorov_Smirnov (KS).
5.3.3.2
Para implementar las pruebas de distancia, seguimos una bien definida serie de pasos:
Primero, se asume una distribucin pre-especificada (ejemplo Normal). Entonces, se estiman los
parmetros de la distribucin (ejemplo la media y la varianza) de los datos o se obtienen de
experiencias previas. Tale proceso produce una distribucin hipottica, tambin llamada hiptesis
nula (o Ho), con varias partes que deben ser conjuntamente verdaderas. La negacin de la
distribucin asumida (o sus parmetros) es una hiptesis alternativa (tambin llamada H1).
Entonces se prueba la distribucin asumida (hipotetizada) usando el conjunto de datos.
Finalmente, Ho es rechazada cundo cualquiera de los datos que componen Ho no es avalada por
los datos.
5.3.3.2
1 2i
n
i =1
n
AD =
{ ln ( F [ Z ]) + ln (1 F Z
0
( n +1i )
) } n;.....
(1)
La hiptesis Nula, que la verdadera distribucin es F0 con los parmetros asumidos, es entonces
rechazada (con un nivel de significancia 0.05, para una muestra de tamao n) si la prueba
estadstica AD es mayor que el valor crtico (VC). La regla de rechazo es:
Se ilustra este procedimiento probando la Normalidad los datos del problema 6 de la seccin 8.3.7
de [5]. El conjunto de datos, (Tabla 1), contiene una pequea muestra de seis lotes, sacados de
forma aleatoria de la misma poblacin.
308.5
317.7
313.1
322.7
294.2
Variable
Media
Mediana
Conjunto de Datos
315.82
315.4
=14.9).
Entonces se implementa la estadstica AD (1) usando los datos (Tabla 1) como tambin la
probabilidad Normal y los parmetros estimados (Tabla 2). Para el elemento ms pequeo
tenemos:
294.2 315.8
P =315.8, =14.8 (294.2) = Normal
14.8
F0 ( z ) = F0 (1.456) = 0.0727
La Tabla 3 muestra los resultados inmediatos de la estadstica AD que combinamos con la formula
(1).Cada componente es mostrado en la columna correspondiente de la tabla, identificada por su
nombre.
AD =
i =1
F(Z)
ln F(Z)
n+1i
F(n+1-i)
1-F(n1i)
ln(1-F)
294.2
0.072711
-2.62126
0.938310
0.061690
-2.78563
308.5
0.311031
-1.16786
0.678425
0.321575
-1.13453
313.1
0.427334
-0.85019
0.550371
0.449629
-0.79933
317.7
0.550371
-0.59716
0.427334
0.572666
-0.55745
322.7
0.678425
-0.38798
0.311031
0.688969
-0.37256
338.7
0.938310
-0.06367
0.072711
0.927289
-0.07549
1 2i
6
ln F(Z)+ln F(n+1-i)
1 2i
{ln F ( Z ) + ln (1 F (n + 1 i )}
6
-1/6
-5.40689
0.90114833
-3/6
-2.30239
1.1151195
-5/6
-1.16952
1.3746
-7/6
-1.15461
1.347045
-9/6
-0.76054
1.14081
-11/6
-0.13916
0.25512666
1 2i
{ln F ( Z ) + ln (1 F (n + 1 i )} 6 , AD = 6.16992505-6 = 0.16992505
6
AD = 0.1699 < VC =
0.752
0.752
=
= 0.6333
0.75 2.25 1 + 0.125 + 0.0625
+
1+
6
36
As, la prueba de ajuste de bondad AD no rechaza que esta muestra haya sido sacada de una
poblacin con distribucin Normal (315.8, 14.9). Y se puede asumir Normalidad para los datos.
Los procedimientos de la prueba de ajuste de bondad AD, aplicados a este ejemplo se resume en
la tabla 4.
5.3.3.4
Ahora se desarrolla un ejemplo para probar si un conjunto de datos se apegan a una distribucin
Weibull. Se usaran los datos de la Tabla 5. Los datos consisten en seis medidas sacadas de una
poblacin Weibull ( = 10; = 2). En nuestro ejemplo, sin embargo, los parmetros son
desconocidos y sern estimados del conjunto de datos.
11.7216
10.4286
8.0204
7.5778
1.4298
4.1154
Se obtienen las estadsticas descriptivas (Tabla 6). Entonces, usando mtodos grficos en [11], se
obtienen las estimaciones de los puntos de los parmetros de la distribucin Weibull asumida:
Forma = 1.3 y Escala = 8.7. Los parmetros permiten definir las hiptesis de la distribucin:
Weibull ( = 8.7; = 1.3).
Variable
Media
Mediana
Desviacin
Estndar
Mnimo
Mximo
Q1
Conjunto de
Datos
7.22
7.8
3.86
1.43
11.72
3.44
AD = [
1 2i
n
i =1
n
{ ln (1 exp ( Z )) Z
X
Donde Z i = *i
( n +1i )
} n ]
0.2
y AD* = 1 +
AD
n
(2)
NSO =
{1 + exp[0.1 + 1.24
Para implementar la prueba de ajuste de bondad AD, primero obtenemos las probabilidades
correspondientes AD bajo la distribucin asumida H0 . Por ejemplo, el primer dato (1.4298 1.43)
X
P =8.7; =1.3 (1.43) = 1 exp( Z1 ) = 1 exp 1
1.43 1.3
= 1 exp
= 1 0.909 = 0.091
8.7
Entonces, se usan estos valores para trabajar con las formulas AD y AD* en (2). Se dan a
continuacin en la Tabla (7) los resultados inmediatos para en conjunto de datos en la Tabla 5:
vo
Fila
Conjunto
de Datos
Z(i)
Probabilidad
Weibull
e-Z(i)
1.430
0.09560
0.091176
0.685308
-2.39496
1.47336
0.64472
4.115
0.37789
0.314692
0.908824
-1.15616
1.26567
1.21092
7.578
0.83566
0.566413
0.433587
-0.56843
0.89967
1.22342
8.020
0.89967
0.593296
0.406704
-0.52206
0.83566
1.58401
10.429
1.26567
0.717949
0.282051
-0.33136
0.37789
1.06387
11.722
1.47336
0.770846
0.229154
-0.26027
0.09560
0.65242
Ln(1-e
Zn-i+1
termino
X
Ordene la muestra original X ( Col. 1, Tabla 3) y estandarice Z i = *i
Tabla 7)
Establezca la Hiptesis Nula: Asuma la distribucin Weibull
Obtenga los parmetros de la distribucin: = 8.7; = 1.3
Obtenga la probabilidad acumulada exp(-Z) ( Cols. 3 y 4)
Obtenga el logaritmo de obtenido previamente ln[1- exp(-Z)] (Col. 5)
Ordene Zi en forma descendente (n-i+1) (Col. 6).
Evale va (1): La prueba estadstica AD* =0.4104 y NSO =0.3466
Como NSO =0.3466 > = 0.05, asuma Weibull = 8.7; = 1.3)
(Cols. 1 y 2
Cuando sea posible use Software para la prueba AD como Stat:fit del PROMODEL y el
Minitab
Finalmente, recordemos que la distribucin Exponencial, con media , es nicamente una caso
especial de la Weibull
) donde el parmetro de forma -1. Por lo que, si se esta interesado en
la prueba de ajuste de bondad AD para considerar la Exponencialidad de los datos, ser suficiente
estimar la media ( ) y entonces implementar el procedimiento anteriormente seguido para la
Weibull para este caso especial, usando la formula (2)
Sin embargo, no existe estadsticas AD (formulas ) para todas las distribuciones de probabilidad.
Por lo que, si existe la necesidad de ajustar otras distribuciones diferentes a las ya discutidas, es
mejor usar las pruebas de ajuste de bondad Anderson-Darling [12] y la Chi-cuadrada [11].
Problemas Propuestos
1. Verifica la hiptesis de uniformidad con
0.81, 0.14, 0.05, 0.93?
2. Considrese la secuencia de
prueba Chi-Cuadrada:
0.34 0.90 0.25 0.89
0.83 0.76 0.79 0.64
0.96 0.99 0.77 0.67
0.47 0.30 0.17 0.82
0.79 0.71 0.23 0.19
0.99 0.17 0.99 0.46
0.44
0.81
0.41
0.05
0.93
0.66
0.12
0.94
0.52
0.45
0.65
0.10
0.21
0.74
0.73
0.31
0.37
0.42
0.46
0.22
0.99
0.78
0.39
0.18
0.67
0.74
0.02
0.05
0.42
0.49
3. Dada la secuencia de nmeros aleatorios uniformes 0.1306, 0.0422, 0.6597, 0.7965, 0.7696
obtener a partir de ellos una secuencia de nmeros que se ajusten a una distribucin exponencial
con =1.
4. Se ha estado contabilizando el nmero de vehculos que han llegado a una interseccin a travs
de una determinada calle entre las 7:00 AM y las 7:05 AM, obtenindose los datos siguientes:
Llegadas
0
1
2
3
4
5
Frecuencia
(das)
1
0
1
1
3
1
Llegadas
6
7
8
9
10
11
Frecuencia
(das)
2
1
5
2
5
4
Llegadas
12
13
14
15
16
17
Frecuencia
(das)
6
1
0
0
2
2
Llegadas
18
19
20
21
22
23
Frecuencia
(das)
1
0
0
0
0
1
5.4
Referencias bibliograficas
Christos Alexopoulos, Andrew F. Seila, Advanced Methods for Simulation Output Analysis,
Proceedings of the 1998 Winter Simulation Conference,D.J. Medeiros, E.F. Watson, J.S. Carson
and M.S. Manivannan, eds
Ch. Harrel,B. Ghosh, yR. Borden,Simulation using ProModel,Mc Graw-Hill, 2003 Second edition
Empirical Assessment of Normal and Lognormal Distribution Assumptions, Romeu, J.L., RAC
START,Volume 9, Number 6, http://rac.alionscience.com/pdf/NLDIST.pdf.
Empirical Assessment of Weibull Distribution, Romeu, J.L., RAC START, Volume 10, Number 3,
http://rac.alionscience.com/pdf/WEIBULL.pdf.
Kolmogorov-Smirnov GoF Test, Romeu, J.L., RAC START, Volume 10, Number 6.
Lawrence Leemis, Simulation Input Modeling,Proceedings of the 1999 Winter Simulation
ConferenceP. A. Farrington, H. B. Nembhard, D. T. Sturrock, and G. W. Evans, eds.
Methods for Statistical Analysis of Reliability and Life Data, Mann, N., R. Schafer, and N.
Singpurwalla, John Wiley, NY, 1974.
MIL-HDBK-5G, Metallic Materials and Elements.
MIL-HDBK-17 (1E), Composite Materials Handbook.
Practical Statistical Tools for Reliability Engineers,Coppola, A., RAC, 1999.
S. Ross, Simulacin, Pearson, 1999 segunda edicin.
Statistical Confidence, Romeu, J.L., RAC START, Volume 9, Number 4,
http://rac.alionscience.com/pdf/STAT_CO.pdf.
Statistical Assumptions of an Exponential Distribution, Romeu, J.L., RAC START, Volume 8,
Number 2,http://rac.alionscience.com/pdf/E_ASSUME.pdf.
The Chi-Square: a Large-Sample Goodness of Fit Test, Romeu, J.L., RAC START, Volume 10,
Number 4,http://rac.alionscience.com/pdf/Chi_Square.pdf.