Guia Análisis de Datos

PONTIFICIA UNIVERSIDAD CATOLICA DEL PERU FACULTAD DE CIENCIAS E INGENIERIA SIMULACIN DE SISTEMAS Gua de Anlisis de Datos con Input
Analyzer Una de las principales partes dentro del desarrollo del Trabajo Integral del curso ser la poder determinar y justificar que distribucin siguen la llegada de las entidades al sistema y los tiempos de servicio. Para ellos debemos emplear la relacin de datos tomados vinculados a los tiempos entre llegadas de las entidades y los tiempos de servicio y analizarlos en el INPUT ANALYZER del Arena. A continuacin se detalla secuencialmente como realizar este procedimiento paso a paso.
Tiempo entre llegadas Tiempo de servicio
LLEGADA
Inicio atencin
Fin atencin SALIDA
Entidad: Personas en cola
Recurso: Persona en Counter
1. Formato de los datos tomados Dadas una relacin de tiempos entre llegadas y servicios se deben ingresar en una hoja MS Excel ordenado por columnas. Imaginen que la informacin fuese la siguiente:
Los nmeros deben emplear punto para la separacin de cifras decimales y no emplear separadores de miles.
sin separador de miles
3456.6578
con PUNTO DECIMAL
Dependiendo de la versin de MS Excel que se maneje puede que ste sea el formato por default para los nmeros. De lo contrario debe cambiar los nmeros a este formato descrito. Para ello se sigue la siguiente ruta: Herramientas \ Opciones como se muestra en el screenshot inferior.
Se selecciona el tab. Internacional se quita el check del checkbox Usar separadores del sistema. Luego se procede a definir en el campo separador decimal el smbolo de PUNTO (.)
Tras este cambio los datos se hallarn con puntos decimales. Es posible ahora que sean ingresados al Input Analizer. Para esto guardamos el archivo con otro nombre. Seguimos la ruta Archivo \ Guardar como y guardamos el archivo con un nombre que permita identificar las datos que estamos guardado y el tipo de archivo ser TEXTO DELIMITADO POR TABULACIONES (Extensin .txt)
Luego aparecern una serie de ventanas de dialogo, se le da aceptar (S) a todas. Finalmente salimos del Excel y volver a aparecer las mismas ventanas de dialogo, se les da nuevamente aceptar (S) a todas. Dado que en el Trabajo Integral emplearn ms de una serie de datos identifiquen claramente cada archivo generado para que lo puedan identificar fcilmente al abrirlo con el INPUT ANALIZER y preferiblemente guarden todos en una misma carpeta o ubicacin. En el caso del ejemplo el archivo que contena los tiempos entre llegadas se esta guardando como llegadas.txt 2. Abriendo el archivo en Input Analizer de Arena El INPUT ANALYZER se instala por default en la misma carpeta del Arena. Para abrirlo se sigue la siguiente ruta Inicio \ Todos los programas \ Rockwell Software \ Arena 9.0 \ Input Analizer
Una vez iniciado el programa se mostrara la siguiente pantalla
El primer paso consiste en ir a File \ New alternativamente darle clic al icono de hoja nueva en la barra
Con lo cual se abre la ventana de la nueve hoja de trabajo
Luego se procede a vincular en esta nueva hoja de trabajo los datos de tiempos entre llegadas/tiempos de servicio que tenamos guardados en formato txt. Para estos se accede al men File \ Data File\ Use Existing damos clic en el icono superior de la barra.
Con lo cual se nos muestra la siguiente ventana:
Accedemos a la ubicacin donde guardamos el archivo con extensin txt y seleccionados en Tipo Text files (*.txt) y aparece el archivo que guardamos previamente en MS Excel con tipo texto delimitado por tabulaciones lo seleccionamos y damos clic en Abrir. Se muestra la siguiente pantalla:
El INPUT ANALYZER automticamente toma los datos y los agrupa por intervalos mostrando un histograma de frecuencias observadas en cada intervalo. Tambin presenta en la parte inferior la siguiente data: DATA SUMMARY Number of Data Points Min Data Value Max Data Value Sample Mean Sample Std Deviation HISTOGRAM SUMMARY Histogram range Number of Intervals El primer grupo resume el nmero de datos, el valor mnimo, el valor mximo la media y la desviacin estndar de la data analizada. El segundo grupo proporciona para el histograma los rangos de los intervalos y el nmero de intervalos. El Input Analyzer permite determinar ajustes a una gama de distribuciones estadsticas. Para ajustar la data a una en particular se sigue la ruta Fit y se selecciona alguna de las posibles
Se puede proceder a seleccionar alguna si se tiene una idea aproximada de a cual distribucin estadstica podran ajustar los datos, sin embargo lo ptimo es emplear la ltima opcin Fit All que selecciona entre todas las distribuciones aplicables a la data aquella que se ajuste mejor. Seleccionamos en este caso Fit All y se muestra la siguiente pantalla:
Se obtiene entonces la distribucin que mejor ajusta a los datos y en el campo inferior la siguiente informacin: DISTRIBUTION SUMMARY Distribution Expression Square error CHI SQUARE TEST Number of intervals Degrees of freedom Test statistic Corresponding p-value KOLMOGOROV-SMIRNOV TEST Test Statistic Corresponding p-value Para analizar si los datos ajustan a la distribucin mostrada podemos revisar los p-values de las pruebas. Si el valor del p-value es menor o igual al nivel de confianza (0.05) se rechaza la hiptesis nula de la prueba, caso contrario no existen evidencias de que no siga la distribucin dada. La condicin para aceptar es entonces que:
pvalue > 0.05

En el caso del ejemplo la distribucin recomendada era la beta que es una distribucin continua por lo tanto deberamos revisar los resultados de la prueba K-s que reflejan un pvalue superior a 0,15 que permite no rechazar la hiptesis nula y pasar la prueba.
--------------------------------------------------------------------------------------------------------------------------------------------OBSERVACIN. Tenga en cuenta que el Input Analyzer es una herramienta de procesamiento de datos y ejecucin de pruebas de bondad de ajuste, que si bien le facilita en gran medida el anlisis de la informacin al poder discernir si los datos ingresados son discretos o no, y en base a ello presentar el resultado de una o ambas pruebas de bondad de ajuste respectivamente, e incluso brindarle la opcin de presentar la opcin de mejor ajuste entre todas las disponibles no llega a ser completamente independiente del anlisis cuidadoso de los resultados por parte del analista. Existen limitaciones importantes. Una de ellas es que si se ingresan datos discretos si bien el Input es capaz de reconocerlos y ejecutar solamente la prueba de bondad de ajuste Chi cuadrado, al ser sta aplicable tanto a discretos como continuos, permite que se prueben como posibles candidatos de ajuste a distribuciones continuas, y en muchos casos pueden ser sugeridas como las de mejor ajuste para datos discretos, lo cual no necesariamente es coherente con los tipos de datos que se generan en la realidad, y por lo tanto emplear dichas distribuciones para simular datos sera ir en contra de los principios de representacin adecuada del sistema real que se pretende simular. Otra limitante importante que debe tener en cuenta es el hecho de que el Input Analyzer no requiere un nmero de datos mnimos y por lo tanto puede aplicar pruebas de bondad de ajuste y presentar resultados aun cuando el nmero de datos ingresados es menor a los mnimos recomendados tericamente en el caso de la prueba Chi Cuadrado. Es por ello que debe tener especial cuidado en el anlisis de los resultados y no aceptar a priori el resultado de Best Fit hallado a travs del Fit All como la respuesta absoluta inequvoca pues existira una probabilidad importante de cometer errores si se automatiza en el uso de la herramienta. --------------------------------------------------------------------------------------------------------------------------------------------El Input permite adems revisar el orden de ajuste de los datos a las diferentes distribuciones posible en funcin del error cuadrado ordenado en forma ascendente. Para ver este resumen se sigue la siguiente ruta: Window \ Fit All Summary
Obtenindose la siguiente pantalla:
Como se puede ver en este caso la siguiente distribucin con menor error cuadrado es la Beta. Se puede revisar el ajuste con una distribucin gamma para observar los p values.
Comparando los resultados de ambas pruebas observamos que en este caso bajo un ajuste a la distribucin gamma el pvalue tambin es mayor a 0,05 en la prueba KS, e incluso en la prueba Chi Cuadrado. Sin embargo como tiene un error de 0.004524 es preferible seleccionar la distribucin Beta que pasa ambas pruebas y tiene un menor error de 0.00314 que refleja un mejor ajuste por ser menores las diferencias entre los valores de la data y la curva de ajuste. Los datos entonces se pueden modelar con la expresin: BETA(0.707, 2.74645 ) Alfa= 0.707 Beta=2.74645 Offset=0 OBSERVACION El Offset es un termino constante que se suma a la distribucin que no tiene efecto sorbe la varianza slo sobre la media. En este caso es cero pero puede tomar valor positivo o negativo en otros ajustes. Lo que quiere decir que dada la data histrica ingresada se pueden simular futuros tiempo entre llegadas generados a partir de dicha distribucin con los parmetros proporcionados por el Input Analyzer En el caso de que los datos ingresados no puedan ajustarse a ninguna distribucin se procede a emplear una distribucin emprica. Para generarla se selecciona Fit y luego Empirical con lo cual el Input Analyzer genera automticamente una distribucin emprica en base a los datos del archivo.
3. Opciones del Input Analyzer El Input Analyzer ofrece una serie de opciones para modificar los parmetros que se toman en cuenta al momento de analizar los datos y tambin opciones para modificar la presentacin de los grficos. Para ingresar a las opciones se selecciona Options en la barra superior.
a) Data Fit
Permite modificar los siguientes parmetros Include KS Test Esta opcin determina si ejecuta o no la prueba Kolmogorov-Smirnov (KS) al ajustar los datos a cada distribucin. Por default, siempre esta activa cuando se carga un nuevo data file. Debido a que cuando se trabaja con data files muy grandes la velocidad de procesamiento puede disminuir, puede ser suprimido en caso de que se requiera experimentar con diferentes distribuciones de probabilidad. Esta opcin, solo funciona con data files que tienen 8192 datos o menos. Output Summary Files Esta opcin determina cuando o no un archivo de texto es generado cuando una distribucin estadstica es ajustada a la data. Por default siempre esta activa cuando se carga nueva data. Similarmente si se desea experimentar con ajustes de diferentes distribuciones para data file considerablemente grandes sera sugerible desactivar esta opcin. Auto Data Translation Esta opcin afecta slo a las distribuciones Erlang, Exponencial, Gamma, Weibull y Lognormal. Cuando esta activa, la data original, referido como xi, donde xi >= X0, son automticamente trasladados a un nuevo data file, ui, donde ui = xi xo >= 0. Adems la funcin de distribucin es ajustada al ser de los datos traslados, en lugar de los datos originales, Esta funcin asegura que estas cinco funciones sean solo ajustadas a data-no negativa como se requiere Por default, la opcin se encuentra activada al cargar un nuevo data file, y cuando la opcin se desactiva las distribuciones Erlang, Exponencial, Gamma, Weibull y Lognormal se volvern inactivas en caso de que alguno de los datos del data file sea negativo.
b) Parameters
Histogram command (Options, Parameters menu) La opcin de histograma muestra una ventana que permite cambiar el nmero de intervalos, lmite inferior (ignorando toda la data por debajo de este lmite), lmite superior (ignorando toda la data por encima del lmite). El nmero de intervalos debe ser como mnimo 5 y no mayor de 40. Adicionalmente, el lmite inferior del histograma debe ser igual o inferior al mayor entero que no excede el valor mnimo en el data file. El lmite superior, entonces, debe ser menor o igual al menor entero que iguala o excede el mximo valor en el data file.
Si los parmetros del histograma son modificados luego de que una funcin de distribucin ha sido seleccionada, automticamente se genera una nueva curva que se ajuste a los parmetros actualizados del histograma. Distribution command (Options, Parameters menu) Esta opcin es accesible cuando alguna funcin de distribucin (diferente a la Emprica) ha sido ajustada a la data. Si se selecciona esta opcin parece una ventana donde se pueden cambiar los parmetros de dicha distribucin en particular. Cuando un parmetro de la distribucin cambia, una nueva evaluacin del ajuste se efecta. Por ejemplo si se tuviera un data file con una distribucin normal ajustada la ventana que mostrara la opcin de Parameters/Distributions sera:
c) Colors
Ofrece una serie de opciones para cambiar el esquema de colores empleado en el fondo, barras, lneas y curvas de ajuste de cada histograma y ajuste efectuado.
Ing. Eduardo Carbajal L.

Guia Análisis de Datos

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Guia Análisis de Datos

Uploaded by

Copyright:

Available Formats

PONTIFICIA UNIVERSIDAD CATOLICA DEL PERU FACULTAD DE CIENCIAS E INGENIERIA SIMULACIN DE SISTEMAS Gua de Anlisis de Datos con Input

Fin atencin SALIDA

Entidad: Personas en cola

Recurso: Persona en Counter

Una vez iniciado el programa se mostrara la siguiente pantalla

Con lo cual se abre la ventana de la nueve hoja de trabajo

Con lo cual se nos muestra la siguiente ventana:

pvalue > 0.05

Obtenindose la siguiente pantalla:

Ing. Eduardo Carbajal L.

You might also like