You are on page 1of 17

U    


 
       

Inteligencia de negocios
para la empresa de servicios
de la Unin del Nquel*1
>%XVLQHVV,QWHOOLJHQFHIRU&RPSDQ\RI
6HUYLFHVWRWKH8QLRQRIWKH1LFNHO@

VLADIMIR ALBERTO TORRES TORRES2, EDGAR NEZ TORRES3, YANET MOLINA


HERNNDEZ4, DAYKENIS CABALLERO FERIA5, YANET PEA GONZLEZ6,
MAGBYS GONZLEZ ROBLEJO7, YADIRA ARGUELLES BLANCO8

5HFLER$SUREDFLyQ

Resumen
La Inteligencia de Negocios es una estrategia que ha alcanzado
un nivel elevado en la competitividad empresarial. Aplicar una
solucin de Inteligencia de Negocios parte de los sistemas de
origen de datos que posee una organizacin, apoyndose de un
conjunto de herramientas encargadas de la extraccin, depuracin
y consolidacin de los datos. Esta informacin ser almacenada en

* Modelo para la citacin de este artculo:


NEZ TORRES, dgar (2015). Inteligencia de negocio para la Empresa de Servicios de la
Unin del Nquel. En: Ventana Informtica No. 33 (jul-dic). Manizales (Colombia): Facultad
de Ciencias e Ingeniera, Universidad de Manizales. p. 39-55. ISSN: 0123-9678
1 Reporte de caso proveniente del proyecto Solucin informtica integral para geologa y
minera, ejecutado en el periodo 09.2013-08.2016, e inscrito en el grupo de investigacin
Datawarehouse y Tecnologas, del Instituto Superior Minero Metalrgico de Moa.
2 Ingeniero Informtico. Sistematizador B, Empresa de Servicios a la Unin del Nquel Camilo
Cienfuegos Gorriaran (Moa, Holgun, Cuba). Correo electrnico: vtorres@esuni.moa.minem.cu
3 Ingeniero Informtico, Magster en Informtica para la Gestin Medioambiental. Profesor,
Departamento Informtica - Facultad Geologa y Minas- Instituto Superior Minero Metalrgico
de Moa Dr. Antonio Nez Jimnez (Moa, Holgun, Cuba). Correo electrnico: enunez@
ismm.edu.cu
 ,QJHQLHUR ,QIRUPiWLFR (VSHFLDOLVWD HQ FLHQFLDV LQIRUPiWLFDV$OPDFHQHV 8QLYHUVDOHV 6$
(Moa, Holgun, Cuba).
5 Ingeniero Informtico. Especialista B en Gestin de Recursos Humanos, Empresa del Nquel
Comandante. Ernesto Che Guevara (Moa, Holgun, Cuba). Correo electrnico: dcaballero@
ecg.moa.minem.cu
6 Ingeniero Informtico, Mster en Informtica para la Gestin Medioambiental. Profesor, Instituto
Superior Minero Metalrgico de Moa (Moa, Holgun, Cuba). Correo electrnico: ypgonzalez@
ismm.edu.cu
7 Ingeniero Informtico, Mster en Informtica para la Gestin Medioambiental. Profesor, Instituto
Superior Minero Metalrgico de Moa (Moa, Holgun, Cuba). Correo electrnico: mgonzalezr@
ismm.edu.cu
8 Ingeniero en Ciencias Informticas. Profesor, Instituto Superior Minero Metalrgico de Moa
(Moa, Holgun, Cuba). Correo electrnico: yarguelles@ismm.edu.cu

39
     !" # $%&'

u( )*+* ,*-./0u1. 0 .( 201 )*+* 3*-+5 201 6u*2.1 10( u(89*9.1


PiV SHTXHxDV RULHQWDGDV D iUHDV HVSHFtFDV R XQ WHPD HQ
particular. Esta investigacin realiza el diseo e implementacin
de un Data Mart como solucin de Inteligencia de Negocios
para los servicios de alimentacin prestados por la Empresa de
Servicios a la Unin del Nquel (Esuni), radicada en Moa (Cuba).
Se emplearon las herramientas Pentaho Bussiness Intelligence,
Pentaho Data Integration 4.2.1, Pentaho Schema Workbench,
PostgreSQL 9.0 y Embarcadero ERStudio 8.0.que permitieron
la construccin del Data Mart y fue seleccionada la metodologa
Ralph Kimball para el diseo de la arquitectura y Hefesto para el
desarrollo del mercado de datos, permitiendo que la informacin
generada por los servicios gastronmicos se encuentre en un
OXJDUHVSHFtFRGHSXUDGD\FRQVROLGDGDVLUYDFRPRVRSRUWHD
la toma de decisiones en la empresa.
Palabras claves: Servicios Gastronmicos, Mercado de datos,
Pentaho.

Abstract
The Intelligence of Business is a strategy that has reached a
high level when of managerial competitiveness it is. Applying a
solution of Business Intelligence it begin with the systems data
origin that it possesses a company, leaning on a tools group in
FKDUJH RI WKH H[WUDFWLRQ SXULFDWLRQ DQG FRQVROLGDWLRQ RI WKH
data. This information will be stored in a Data Warehouse or in
'DWD0DUWZKLFKDUHVPDOOHUXQLWVJXLGHGLQWRVSHFLFDUHDVRUD
particular topic. In this investigation is carried out the design and
implementation of a Data Mart like solution of Business Intelligence
for gastronomic services for the Company of Services to the
Union of Nickel which resides in the municipality of Moa. Several
tools were used that allowed the construction of the Data Mart
and Hefesto was the methodology selected for the development
of the same. Allowing that all the information generated by
the gastronomic services is in a specific place purified and
consolidated serves like support to the taking of decisions in the
gastronomic services of the Esuni.
Keywords: Food Services, Data Mart, Pentaho

4
:;<=>?@<ABA A> CB;<DBE>@ FBGHEIBA A> J<>;G<B@ > K;L>;<>?NB

Introduccin
En la actualidad, las empresas dedican parte importante de su tiempo
y recursos (econmicos y humanos) a la informacin, en cuanto a su
obtencin, proceso y utilizacin, ya que ella juega un papel decisivo
en la empresa y se convierte en su principal patrimonio. Debe ser
FODUDSUHFLVD\TXHVHDGDSWHDODIRUPDFLyQ\SHUOGHODVSHUVRQDV
a la que va dirigida. Tiene que ser rpida y estar disponible en el
momento que se la necesite, y de una manera completa y armonizada
con otras informaciones (Martn, citado por Arrubias, 2000). As, las
organizaciones hacen uso de la informacin para el desarrollo de sus
actividades cotidianas; esta informacin es la parte fundamental de
la empresa para que pueda tener un alto nivel de competitividad y
posibilidades de desarrollo &DO]DGD $EUHX 
El desarrollo de la industria minera, se caracteriza por la trasformacin
GHODPLQHUtDHQXQSURFHVRGHSURGXFFLyQSODQLFDGDSDUDPHMRUDUODV
condiciones de vida del pueblo. En Cuba, esta industria constituye una
fuente estable de divisa, necesaria para el desarrollo econmico del pas.
(QVXSDUWHRULHQWDOHVSHFtFDPHQWHHQOD]RQD1LFDUR0RD%DUDFRD
cuenta con grandes yacimientos minerales, siendo el municipio de Moa
el de mayor concentracin. Para mantener esta industria estable se
necesitan servicios importantes donde la Empresa Servicios a la Unin
del Nquel (Esuni) presta los servicios de alimentacin, hospedaje y
transporte entre otros, a los trabajadores de tal sector. Se cuenta con
un grupo de control de los servicios gastronmicos, desarrollado por los
especialistas, siendo una tarea agotadora que puede durar das cuando
en ocasiones urgen resultados en periodos de tiempo extremadamente
cortos.
Mediante entrevistas al personal involucrado en el proceso, la revisin
de informes y reportes administrativos se determinaron algunas de las
GHFLHQFLDV TXH DWHQWDQ HQ HO SURFHVR GH JHVWLyQ GH OD LQIRUPDFLyQ
puesto que la misma procede desde varios procesos en distintos
formatos atentando contra la homogenizacin, consolidacin y
SRVWHULRU SURFHVDPLHQWR OR TXH FRQOOHYD D ODV VLJXLHQWHV GLFXOWDGHV
Descentralizacin de la informacin, Grandes cantidades de datos
almacenados en hojas de clculo Excel, Generacin de informes muy
extensos con hojas adheridas, Generacin de informes no homogneos,
Duplicidad de Informacin entre el sistema informtico y los archivos Excel,
'HVJDVWHItVLFRGHORVHVSHFLDOLVWDV'LFXOWDGHQODWRPDGHGHFLVLRQHV
y Los procesos de anlisis y elaboracin de informes consumen tiempo
excesivo.

41
QR SS T VWXYZ T [Y\Y]^_`] a bcde

fg hijklmgl nh opkijh nk qh ikokrmnhn plskijk nk pih rgqpomti mijkqmskijk


para la empresa. La tecnologa DataWarehouse (DW) parece ofrecer
una opcin interesante y bien adaptada a estas necesidades, pues se
sustenta en la integracin de datos provenientes de mltiples fuentes
H[WHUQDVTXHVRQH[WUDtGRVOWUDGRV\DOPDFHQDGRVHQXQUHSRVLWRULR
central que segn su alcance se denomina DataWarehouse o mercado
de datos(Datamart) que soporta los procesos de toma de decisiones
administrativas. A partir de las necesidades del cliente y teniendo en
cuenta las caractersticas de esta tecnologa en este trabajo se pretende
desarrollar un mercado de datos que facilite la centralizacin, anlisis y
procesamiento de la informacin para soporte a toma de decisiones en
el proceso de control de servicios de alimentacin en la Esuni.

1. Antecedentes
1.1 Inteligencia del negocios
(VWHWpUPLQRGHXVRFUHFLHQWHSXHGHGHQLUVHFRPR
- La Inteligencia de Negocios, (Business Intelligence, BI, por sus
siglas en ingls), tiene como objetivos la generacin de informacin
estratgica-gerencial e histrica, as como su despliegue y difusin
entre los usuarios. Las aplicaciones de BI son herramientas de so-
porte de decisiones que permiten en tiempo real, acceso interactivo,
anlisis y manipulacin de informacin crtica para la empresa
7KRUQWKZDLWHFLWDGRSRU9DOGpV5DPRV *yPH] 
- Un proyecto de Inteligencia de Negocios o Business Intelligen-
FHSRVHHXQDVHULHGHHWDSDVELHQGHQLGDVHPSH]DQGRSRUOD
LGHQWLFDFLyQGHORVGLVWLQWRVRUtJHQHVGHGDWRVSDUDOXHJRSDVDU
a la etapa de extraccin, transformacin y carga en el almacn de
GDWRVR:DUHKRXVHSDUDQDOL]DUFRQODH[SORWDFLyQGHODLQIRUPD-
cin mediante de una herramienta OLAP (Anlisis o Reportes)
(Krauthamer, 2011).
- Las seis etapas que comprende un proceso completo de inteligen-
FLDGHQHJRFLR,GHQWLFDUORVSUREOHPDVGHQHJRFLR\ORVGDWRV
TXHVHQHFHVLWDQSDUDWUDWDUORV,GHQWLFDUODXELFDFLyQGHWRGRV
los datos necesarios y extraerlos de sus fuentes. 3. Transformar
los datos que provienen de varias fuentes, consolidndolos y re-
solviendo las heterogeneidades (estructurales y semnticas) que
VHSUHVHQWHQPHGLDQWHHOGLVHxRGHSURFHVRV(7/HVSHFtFRV
Cargar los datos transformados dentro de una ubicacin centraliza-
da. 5. Construir el almacn de datos (DataWarehouse) o DataMart,
tomando los datos de la ubicacin centralizada. 6. Instalar en el lugar

OP
vwxyz{|x}~} }z ~wx~z| ~~} }z xzwx~| z wzwxz{~

productos comerciales o aplicaciones personalizadas que brinden


acceso a los datos 6iH] 1DUDQMR 
Las bases de datos son una herramienta fundamental de control y
manejo de las operaciones comerciales. En grandes empresas y
negocios exista considerable volumen de informacin almacenada en
diferentes fuentes, por lo que se requiri gestionarla en un nico lugar
al que solo se le incorporara aquella relevante, sobre la base de una
estructura organizada, integrada, lgica, dinmica y de fcil explotacin,
obteniendo los Almacenes de Datos o DataWarehouse.
3DUDKDFHUXQXVRHFLHQWHGHODLQIRUPDFLyQKLVWyULFDDOPDFHQDGDHQ
un DW para la ayuda a la toma de decisiones, era vital garantizar que
HVWRV GDWRV IXHUDQ IiFLOHV GH REWHQHU HVWDQGDUL]DGRV \ FRQDEOHV
Un Almacn de Datos o DataWarehouse (DW) es un almacn de
informacin temtica orientado a cubrir las necesidades de aplicaciones
de los sistemas de Soporte de Decisiones (DSS) y de la Informacin
de Ejecutivos (EIS), que permite acceder a la informacin corporativa
para la gestin, control y apoyo a la toma de decisiones (Fernndez
citado por Alba, 2009, 7).
'DWH  GHQHXQ0HUFDGRGH'DWRVFRPRun almacn de
datos especializado, orientado a un tema, integrado, voltil y variante
HQ HO WLHPSR SDUD DSR\DU XQ VXEFRQMXQWR HVSHFtFR GH GHFLVLRQHV
de administracin, cuyas caractersticas son: Temtico: Los datos
estn almacenados por materias o temas. Integrado: Todos los datos
almacenados en el DW estn integrados .No voltil: nicamente hay
dos tipos de operaciones en el DW: la carga de los datos procedentes
de los entornos operacionales y la consulta de los mismos. Histrico:
El tiempo debe estar presente en todos los registros contenidos en un
DW )HUQiQGH]HWDO 
1.2 Metodologa de Ralph Kimball para
el diseo de la arquitectura
Segn Date (2000, 710), algunas instalaciones han seguido un enfoque
de primero el datamart, donde los datamarts son creados conforme van
VLHQGRQHFHVDULRV\HOGDWDZDUHKRXVHJHQHUDOHVFUHDGRQDOPHQWH
como una consolidacin de los diversos datamarts, siendo adems
una copia de los datos transaccionales, estructurados de una forma
especial para realizar su anlisis, de acuerdo al modelo dimensional
no normalizado.
En el sistema, los procesos ETL extraen la informacin de los sistemas
operacionales y los procesan realizando posteriormente el llenado de
cada uno de los DataMart de una forma individual, aunque siempre
respetando la estandarizacin de las dimensiones. Este enfoque es

43


como se muestra en la Figura 1. Para comprender mejor qu es un
sistema de almacn de datos, es interesante considerar los procesos
que intervienen en su construccin y uso. A continuacin se describe
FDGDXQRGHHOORVVHJ~Q$FRVWD -RUJH  
Extraccin de los Datos: Se obtiene toda la informacin de las distintas
fuentes tanto internas como externas. Se cargan los datos de los
archivos dbf o excel, para el rea temporal y as adaptarlos al modelo
relacional que se ha establecido.
Transformacin y limpieza: Una vez terminado el proceso de extraccin,
se realiza la limpieza de los datos provenientes de las diferentes fuentes,
porque los mismos pueden ser incoherentes, tener errores o estar
incompletos. Con esto se busca obtener datos precisos, completos, y lo
ms accesibles posibles. Despus se efecta la integracin de los datos
FRQHOSURSyVLWRGHHOLPLQDUSUREOHPDVGHUHGXQGDQFLDHLGHQWLFDUODV
IXHQWHVPiVDEOHV/DWUDQVIRUPDFLyQ\OLPSLH]DJDUDQWL]DQHOUHVXOWDGR
QDOGHFyPRVHPXHVWUDQORVGDWRVVHDSOLFDQODVUHJODVGHOQHJRFLR
\ VH GHWHFWDQ RWUDV SRVLEOHV GHFLHQFLDV GH OD IXHQWH \ VH FRUULJHQ
Carga: Los datos son cargados al MD, organizados y actualizados, para
ser usados por el cliente de forma satisfactoria.
1.3 Metodologa Hefesto para el
desarrollo del mercado de datos
De acuerdo con Daro (2010, 85) HEFESTO es una metodologa propia,
cuya propuesta est fundamentada en una muy amplia investigacin,
comparacin de metodologas existentes y experiencias propias en
procesos de confeccin de almacenes de datos. Cabe destacar que
HEFESTO est en continua evolucin, y se han tenido en cuenta, como
gran valor agregado, todos los feedbacks que han aportado quienes
KDQXWLOL]DGRHVWDPHWRGRORJtDHQGLYHUVRVSDtVHV\FRQGLYHUVRVQHV.
Es una de las ms difundidas y utilizadas por su fcil implementacin
y aporte prctico, aunque no propone de forma explcita los artefactos
y entregables a generar en cada fase.
La metodologa presenta algunas caractersticas: - Se
basa en los requerimientos de los usuarios, por lo cual su
estructura es capaz de adaptarse con facilidad y rapidez ante
los cambios en el negocio. - Utiliza modelos conceptuales y
lgicos, los cuales son sencillos de interpretar y analizar.-
Es independiente del tipo de ciclo de vida que se emplee
para contener la metodologa.- Es independiente de las
herramientas que se utilicen para su implementacin.- Es
independiente de las estructuras fsicas que contengan el DW

y de su respectiva distribucin.- Cuando se culmina con una


fase, los resultados obtenidos se convierten en el punto de
partida para llevar a cabo el paso siguiente.- Se aplica tanto
para DataWarehouse como para DataMart (Daro, 2010, 88)
La metodologa comprende los siguientes pasos, planteados por
'DUtR  $QiOLVLVGHUHTXHULPLHQWRVTXHLPSOLFD,GHQWLFDU
SUHJXQWDV,GHQWLFDULQGLFDGRUHV\SHUVSHFWLYDV\0RGHORFRQFHSWXDO
- Anlisis de los OLTP, que abarca Conformar indicadores, Establecer
FRUUHVSRQGHQFLDV1LYHOGHJUDQXODULGDG\0RGHORFRQFHSWXDODPSOLDGR
- Modelo lgico del DW, sealado por Tipo de modelo lgico del DW,
7DEODVGHGLPHQVLRQHV7DEODVGHKHFKRV\8QLRQHVH,QWHJUDFLyQ
de datos, que comprende Carga inicial y Actualizacin.
1.4 Herramientas para la construccin
del mercado de datos
Uno de los grandes obstculos a los que se enfrenta un proceso de
implantacin de BI es el alto costo que va asociado al mismo, por lo que
cada vez ms empresas optan por una solucin de cdigo abierto frente
a las soluciones privativas. Para la implementacin de mercado de datos
se emplearon herramientas de cdigo abierto, a partir del anlisis de sus
caractersticas y el tipo de licencia de software sobre la cual se distribuye.
1.4.1 Sistema gestor de bases de datos. Los Sistemas Gestores
de Base de Datos (SGBD) fueron diseados para gestionar grandes
YRO~PHQHV GH LQIRUPDFLyQ WDQWR OD GHQLFLyQ GH HVWUXFWXUDV SDUD
el almacenamiento como los mecanismos para la gestin de los
GDWRV (VWRV SHUPLWHQ D ORV XVXDULRV GHQLU FUHDU PDQWHQHU OD %'
y proporcionar un acceso controlado en todo momento 'DQLHO 
Lpez, 2007, 9). De igual manera, sealan que el propsito principal de
proporcionar a los usuarios una visin abstracta de los datos se logra
PHGLDQWHODGHQLFLyQGHWUHVQLYHOHVGHDEVWUDFFLyQEl nivel fsico es
el nivel ms bajo de abstraccin, es el que describe cmo se almacenan
los datos, a su vez, el nivel lgico describe que datos se almacenan
realmente en la Base de Datos y que relaciones existen entre estos. El
nivel ms alto de abstraccin es el nivel de vistas, el cual slo presenta
una determinada porcin de la Base de Datos, dependiendo del tipo
de usuario que la consulta, as, el sistema puede proporcionar muchas
vistas para la Base de Datos 'DQLHO /ySH] 
3RUVXSDUWH0DWR  FRQVLGHUDTXHXQVLVWHPDJHVWRUGHEDVHV
de datos, es el software que permite la utilizacin y/o la actualizacin
de los datos almacenados en una o varias bases de datos por uno o
varios usuarios desde diferentes puntos de vista y a la vez, se denomina
sistema de gestin de bases de datos.

45

PostgreSQL es un sistema de base de datos relacional,


basado en Postgres Versin 4.2, que fue desarrollado
en la Universidad de California en Berkeley por el
Departamento de Ciencias de la computacin. PostgreSQL
es un descendiente de cdigo abierto del cdigo original de
Berkeley. Es compatible con una gran parte del estndar
SQL y ofrece las siguientes caractersticas: Consultas
complejas, Claves externas, Disparadores, Integridad de
las transacciones.
Adems, PostgreSQL puede ser ampliado por el usuario en muchos
aspectos, por ejemplo mediante la adicin de nuevos tipos de datos,
funciones, operadores, funciones de agregacin, mtodos de ndice y
lenguajes de procedimiento 3RVWJUH64/ 
1.4.2 Herramientas de integracin de datos. 3DUD1DUDQMR 6iH]
(2012), Pentaho9 proporciona un espectro completo de herramientas
de inteligencia de negocio, reportes, anlisis, dashboards, minera de
datos e integracin de datos. Ofrece adems, una serie de servicios
FUtWLFRV HQWUH ORV TXH HVWiQ OD DXWHQWLFDFLyQ SURJUDPDFLyQ GH
tareas, seguridad y servicios Web. Este conjunto de herramientas y
servicios forman una plataforma integral de inteligencia de negocio,
convirtiendo a Pentaho en el proveedor lder de soluciones BI de
cdigo abierto.
1.4.3 Tecnologa OLAP (On-Line Analytical Processing o
Procesamiento Analtico en lnea). (VWDWHFQRORJtDHVGHQLGDSRU
3HxD 6XiUH]  FRPR la tcnica que permite ver y manipular
los datos por dimensiones, que provee a los gerentes y analistas fcil
DFFHVRDODLQIRUPDFLyQFRQHOQGHVRSRUWDUHOSURFHVRGHWRPDGH
decisin. En esta tcnica de anlisis, en lugar de ejecutar mltiples
consultas, los datos son estructurados para permitir un acceso rpido y
fcil a las respuestas de las preguntas que son tpicamente formuladas.
Ibarra (2006, 16), considera que OLAP pertenece al Sistema de
Informacin para Ejecutivos, EIS, que proporcionan, al nivel estratgico,
informacin til tendiente a la toma de decisiones. En l, los datos son
FODVLFDGRVHQGLIHUHQWHVGLPHQVLRQHVTXHSXHGHQYHUVHXQDVFRQRWUDV
en cualquier combinacin y as obtener diferentes anlisis de los datos
contenidos. Adems seala que en un modelo OLAP, la informacin

 'HDFXHUGRFRQ1DUDQMR 6iH]  HOVHUYLGRUPentaho es una coleccin de programas


que trabajan en conjunto para proveer un nmero de funciones de la Suite BI Pentaho. Adems,
VXVSURJUDPDVTXHQRVRQVHUYLGRUHVSXHGHQVHUFODVLFDGRVFRPRSURJUDPDVGHHVFULWRULR
algunos de ellos solo actan como clientes y necesitan interactuar con el servidor Pentaho,
pero otros pueden ser usados de forma independiente, aprovechadas por los desarrolladores
como herramientas de diseo.

es vista en cubos, los cuales consisten de categoras descriptivas


(dimensiones) y valores cuantitativos (medidas). El modelo de datos
PXOWLGLPHQVLRQDOVLPSOLFDDORVXVXDULRVIRUPXODUFRPSOHMDVDUUHJODU
datos en un reporte, cambiar de datos resumidos a datos detallados y
OWUDURUHEDQDUHQVXEFRQMXQWRVVLJQLFDWLYRV.
/RDQWHULRUHVUDWLFDGRSRU3HxD 6XiUH]  DODVHJXUDUTXH
VX REMHWLYR IXQGDPHQWDO HV SURYHHU DO XVXDULR QDO HO IiFLO DQiOLVLV
GH ORV GDWRV FRQ OD SRWHQFLD \ FRQDELOLGDG GH XQD EDVH GH GDWRV
corporativa, y con la posibilidad de ver los datos desde diversos puntos
de vista o dimensiones. Permite vistas reformateadas y calculadas
sin el riesgo de perder o corromper los datos originales y hace que la
informacin pueda ser compartida por varios usuarios sin tener que
duplicar archivos. En la tecnologa OLAP se cuenta con herramientas
de tres tipos: ROLAP10, MOLAP y HOLAP, siendo usada en el presente
proyecto, la primera de ellas.

2. Aplicacin de Hefesto
A continuacin se describe paso a paso cada una de las fases de la
metodologa Hefesto que incluye desde el anlisis de los requerimientos,
SDVDQGRSRUODLGHQWLFDFLyQGHLQGLFDGRUHV\SHUVSHFWLYDVGLPHQVLRQHV
y medidas hasta llegar al modelo lgico.
2.1 Anlisis de los requerimientos
3ULPHUDPHQWHVHGHEHQLGHQWLFDUORVUHTXHULPLHQWRVGHOQHJRFLRDSDUWLU
GHODVSUHJXQWDVJHQHUDGDVSRUORVXVXDULRVSDUDGHQLUORVLQGLFDGRUHV
o perspectivas (dimensiones) que permiten el anlisis para el soporte
a la toma de decisiones y el diseo del DataWarehouse. Los usuarios
visualizan el resultado mediante un modelo conceptual. La investigacin
VHRULHQWDKDFLDXQGHVDUUROORDSDUWLUGHODLGHQWLFDFLyQGHLQIRUPDFLyQ
de alto nivel para cumplir los objetivos y estrategias trazadas por la
empresa. Es necesario formular preguntas complejas sobre el negocio
HQODVTXHLQX\DQYDULDEOHVGHDQiOLVLVORFXDOSRVLELOLWDUiHODQiOLVLV
profundo de la informacin en diferentes perspectivas.
Con el objetivo de obtener una visin profunda sobre las necesidades
de la empresa, se revisaron informes administrativos, se observ la
manera de realizar las tareas por los diferentes responsables, y no

10 Herramientas ROLAP (Relational On-line Analytical Process).Son herramientas OLAP que


crean vistas multidimensionales extrayendo los datos de bases de datos SQL ordinarias,
es decir, relacionales. Estas herramientas simulan los datos multidimensionales usando
VRVWLFDGDV WpFQLFDV GH LQGH[DFLyQ FDFKHV PHWDGDWD HWF $QFKDWXxD  1~xH] 
35-36).

47
  

m
m    
 

 

 

 

de mantener un control absoluto de los servicios gastronmicos. A partir


de dichas entrevistas se pudo con conformar una serie de 10 aspectos
que ayudan a conocer los requerimientos del negocio:
- Se desea conocer la cantidad de servicios de alimentacin solicitados
por clientes en un tiempo determinado.
- Se desea conocer la cantidad de servicios de alimentacin elaborados
por unidades en un tiempo determinado.
- Se desea conocer la cantidad de servicios de alimentacin prestados
por unidades y por clientes tiempo determinado.
- Se desea conocer la cantidad de recursos utilizados por servicios y
por clientes tiempo determinado.
- Se desea conocer la cantidad de recursos utilizados por servicios,
unidades y clientes tiempo determinado.
- Se desea conocer la relacin de clientes que reciben tiempo deter-
minado los mismos productos en sus servicios.
- Se desea conocer la relacin de servicios prestados por unidades
y clientes.
- Se desea conocer en qu tiempo determinado se prestan ms ser-
vicios agrupados por tipos.
- Se desea conocer el informe de un tiempo determinado por total de
servicios prestados agrupados por tipos por unidades.
- Se desea conocer el informe de un tiempo determinado por total de
servicios prestados agrupados por tipo por cliente.
Luego de haber establecido las preguntas se procedi a su
descomposicin para descubrir los indicadores que se utilizarn y las
perspectivas de anlisis que intervendrn:
- 3HUVSHFWLYDV,GHQWLFDGDV&OLHQWHV7LHPSR8QLGDGHV6HUYLFLRV
Recursos, Productos y Servicios por tipo.
- ,QGLFDGRUHV,GHQWLFDGRV&DQWLGDGGHVHUYLFLRVVROLFLWDGRV&DQWLGDG
de servicios elaborados, Cantidad de servicios prestados, Cantidad
de recursos, Relacin de clientes, Relacin de servicios y Total de
servicios prestados por tipo.
Luego, se realiz el modelo conceptual, el que engloba cada
perspectiva con los campos pertenecientes a la misma, y por otro lado
se visualizaran los indicadores y los clculos que les corresponde para
lograr consultarlos para observar con claridad cules son los alcances
del proyecto, para luego trabajar sobre ellos, adems al poseer un alto
QLYHOGHGHQLFLyQGHORVGDWRVSHUPLWHTXHSXHGDVHUSUHVHQWDGRDQWH
los usuarios y explicado con facilidad.

U  !" #$%"&  '$  ()*

2.2 Anlisis de los OLTP


El anlisis de los OLTP (Procesamiento Transaccional en Lnea),
SHUPLWHWHQHUXQDLGHDGHFyPRLGHQWLFDUORVLQGLFDGRUHV3DUDORJUDU
lo mencionado anteriormente es necesario adquirir conocimiento de
los elementos o hechos que proporcionar realizar clculos y los tipos
de operaciones que se debe aplicar a los hechos para obtener el
YDORUQDO6HUHDOL]DXQPDSHRGHORVVLVWHPDVWUDQVDFFLRQDOHV\HO
PRGHORFRQFHSWXDOSDUDHVWDEOHFHUHLGHQWLFDUODVFRUUHVSRQGHQFLDV
H[LVWHQWHVHQWUHHOORV/RVXVXDULRVVRQORVHQFDUJDGRVGHGHQLUORV
campos que integrarn cada dimensin lo que representar el nivel
de granularidad, una vez obtenida toda la informacin necesaria se
realizar una ampliacin al modelo conceptual.
Con este anlisis, se examinan los OLTP disponibles que contengan la
informacin requerida, como tambin sus caractersticas, y as poder
LGHQWLFDUODVFRUUHVSRQGHQFLDVHQWUHHOPRGHORFRQFHSWXDO\ODVIXHQWHV
de datos. La idea es, que todos los elementos del modelo conceptual
HVWpQFRUUHVSRQGLGRVHQORV2/73/DJXUDPXHVWUDORVDWULEXWRV
pertenecientes al sistema operacional objeto de estudio.

F+,-./ 01 234.35367/8+96 :3; 5+573</ =43./8+=6/;

2.3 Modelo lgico del DataMart


A continuacin, se confecciona el modelo lgico de la estructura del
DW, teniendo como base el modelo conceptual que ya ha sido creado.
3DUDHOORSULPHURVHGHQHHOWLSRGHPRGHORTXHVHXWLOL]DUi\OXHJR
se llevan a cabo las acciones propias al caso, para disear las tablas

49
@A BB C DEGHI C JHKHLMNOL P QRST

dV dWXVYZW[YVZ \ dV ]V^][Z_ `WYabXVYcVe ZV fVabWgaY baZ hYW[YVZ


pertinentes entre las tablas.
(OHVTXHPDXWLOL]DGRIXHHVWUHOOD\DTXHSURYHHEHQHFLRVFRPRVRQOD
VLPSOLFDFLyQGHOHQWHQGLPLHQWRSDUDODQDYHJDFLyQHQORVPHWDGDWRV
SRU SDUWH GHO GHVDUUROODGRU \ ORV XVXDULRV QDOHV (VWD HVWUXFWXUD HV
considerada la ms bsica y sencilla de disear con respecto a las
H[LVWHQWHV\HVWiGHQLGDSRUXQDWDEODFHQWUDORWDEODGHKHFKRV\XQ
conjunto de tablas organizadas alrededor de ella, denominadas tablas
de dimensiones, brindando la sensacin de una estrella.
En este paso se disearon las tablas de dimensiones que forman parte
GHO':&DGDSHUVSHFWLYDGHQLGDHQHOPRGHORFRQFHSWXDOFRQVWLWX\H
una tabla de dimensin. Estas tablas de dimensin contienen los
atributos de las aperturas que interesan al negocio y se pueden utilizar
FRPR FULWHULRV GH OWUR VLHQGR UHODWLYDPHQWH SHTXHxDV &DGD WDEOD
GHGLPHQVLyQVHYLQFXODFRQODWDEODGHKHFKRVSRUXQLGHQWLFDGRU
por lo que se tienen tablas dimensiones: Dim_Cliente, Dim_Producto,
Dim_Tipo_Producto, Dim_Recurso, Dim_Tiempo, Dim_Servicios,
Dim_Unidades y la tabla de hechos: Fact_Gastronomia
8QD YH] GHQLGR HQ HO QHJRFLR ODV GLPHQVLRQHV ODV PHGLGDV \ OD
granularidad, se procedi a la estructuracin del modelo lgico del
mercado de datos. En tal sentido, se puede destacar que por las
QHFHVLGDGHVDFWXDOHVGHOQHJRFLRVRORH[LVWHXQPRGHORTXHXQLFD
ODVGLPHQVLRQHVGHQLGDV\ODPHGLGDTXHVHKDHVSHFLFDGRKDVWD
HOPRPHQWR(QODJXUDVHPXHVWUDHOPRGHOROyJLFRGHQLGRSDUD
este caso.

ijklno pq rstuvs vwkjxs tuv runxots tu toysz

>?
{|}~}  |}  }|}  ||}

Luego de construido el modelo lgico, se realiz el poblado con datos,


a travs de procesos ETL, desde los sistemas operacionales que se
desean integrar. Existen varios software que facilitan estas tareas, por
lo cual se ejecut el proceso de extraccin, transformacin y carga de
los datos con la herramienta descrita anteriormente de la suite Pentaho.
Cada vez que existan jerarquas de dimensiones, se comienzo el
cargado de las tablas de dimensiones del nivel general al detallado.
Cuando se haya cargado en su totalidad el DW, se deben establecer
sus polticas de actualizacin o refresco de datos.
2.4 Integracin de datos
Para implementar el sistema primeramente debe ser poblado el mercado
de datos, que implica la aplicacin de las tcnicas de procesos de
extraccin y transformacin, para luego cargar los datos siendo estos
lo ms consistentes posible, utilizando la herramienta Pentaho Data
Integration, que permite extraer los datos de los sistemas operacionales,
transformarlos y luego cargarlos en el mercado de datos.
Una vez poblado el DataMart se hizo el diseo fsico del mismo, teniendo
en cuenta la estructura multidimensional y haciendo uso de los cubos
GH GDWRV (O VHUYLGRU 2/$3 UHTXLHUH OD HVSHFLFDFLyQ OyJLFD GH ORV
esquemas y tablas que formarn estos cubos, as como las jerarquas y
miembros que forman las dimensiones. Este diseo es elaborado con la
herramienta de modelado Pentaho Schema Workbench, la cual permite
confeccionar los cubos multidimensionales y hacer las consultas que
responden a las exigencias de los clientes, a travs de un archivo de
HVTXHPDHQ;0/$SDUWLUGHHVWHHVTXHPDHOVHUYLGRU2/$3WUDGXFH
ODVFRQVXOWDVGHOXVXDULRD64/\ODVHMHFXWD

3. Resultados
El resultado principal consiste en la implementacin de un mercado
GH GDWRV HQ 0\64/ FRPSXHVWR SRU RFKR WDEODV TXH VH HQFXHQWUD
estructurado y cargado de tal manera que pueda mediante el servidor
Pentaho responder a las preguntas del negocio formuladas (Figura 3).
Se realiz un proceso de prueba de cada consulta y procedimientos
FRQHOQGHREWHQHUUHVXOWDGRVFRUUHFWRV3DUDFRQRFHUODHFLHQFLD
de las herramientas y tcnicas empleadas se efectu una consulta,
donde su funcionamiento correcto se comprob en que los resultados
arrojados fuesen los esperados. Las entradas de las consultas fueron
0';GHYROYLHQGRDVtORVGDWRVTXHVHFRQVXOWDEDQ5HDOL]DGDODSUXHED
se observ que las respuestas a las consultas y procedimientos fueron
los correctos.

51

Para las pruebas de validacin se hizo una consulta a Gastronoma


FRQODQDOLGDGGHFRQRFHUVLORVUHVXOWDGRVHUDQFRUUHFWRV/DPHGLGD
consultada fue Cantidad de servicios utilizando el navegador OLAP
el cual presenta la informacin de los cubos y las medidas cuando
se despliegan para seleccionarlas. Luego se ejecuta un cdigo
0';SDUDFRQRFHUVLHOVLVWHPDUHVSRQGHDODFRQVXOWD\XQDYH]
ejecutada la consulta, los resultados muestran que la prueba fue
FRUUHFWD JXUD 

Consulta MDX y respuesta de consulta

4. Conclusiones
La investigacin presentada consisti en el desarrollo un mercado
de datos que facilite la centralizacin, anlisis y procesamiento de la
informacin para el soporte a la toma de decisiones en el proceso de
control de servicios de alimentacin en la Empresa de Servicios a la
8QLyQGHO1tTXHO(VXQLFRQHOQGHDSRUWDUXQDD\XGDDOSURFHVRGH
toma de decisiones a partir de datos que se almacenan en el mismo
de forma integrada y segura y posibilitan la creacin de informes,
mejorando los tiempos de anlisis y trabajo con dichos datos. Para ello
se dise el mercado de datos sobre la base de la metodologa Hefesto,
la cual fue muy cmoda de aplicar por la simplicidad y lo bien descrita
que se encuentra cada una de sus fases lo que contribuye a un mejor
entendimiento del desarrollador.
A su vez la metodologa de Kimball permiti plantear el enfoque
Bottom-up para el desarrollo del mercado de datos y en futuro su
integracin con otros en la empresa y as construir el DataWarehouse
o repositorio central. Cabe destacar que se realizaron procesos ETL
que permitieron lograr la integracin, limpieza, y consolidacin de los
datos para poderlos cargar luego al repositorio de datos. Se valid el
mercado de datos a travs de pruebas realizadas a las funcionalidades,
las que arrojaron resultados favorables, dando cumplimiento a las
necesidades y exigencias previstas para su desarrollo hasta la
etapa propuesta para esta investigacin. Adems, se investig y se
estudiaron las tendencias, tecnologas y herramientas a utilizar para
HOGHVDUUROORGHODVROXFLyQSURSXHVWDGRQGHQDOPHQWHVHRSWySRU
emplear las tecnologas libres por encontrarse libres de costo y haber
obtenido muy buena popularidad por sus potentes funcionalidades
para las comunidades de desarrollo.

5HIHUHQFLDVELEOLRJUiFDV
$&267$0e1'(=*HLG\ -25*(&+$&1'LVQD\OH  6/'0HUFDGRGH'DWRVSDUD
XQD 'LUHFFLyQ GH 6DOXG HQ &XED >HQ OtQHD@ (Q ,QIRUPiWLFD  ;9 &RQYHQFLyQ \ )HULD
,QWHUQDFLRQDO,;&RQJUHVR,QWHUQDFLRQDOGH,QIRUPiWLFDHQOD6DOXG  
/D+DEDQD &XED 0LQLVWHULRGH6DOXG3~EOLFDS,6%1KWWSZZZ
LQIRUPDWLFDVOGFXLQGH[SKSLQIRUPDWLFDVDOXGSDSHUYLHZ! >FRQVXOWD
@
ALBA MNDEZ, Ana Laura (2009). Arquitectura, Diseo, Construccin, Mantenimiento y Consulta
GHXQ$OPDFpQGH'DWRV>HQOtQHD@0RQRJUDItD /LFHQFLDGRHQ6LVWHPDV&RPSXWDFLRQDOHV
$GPLQLVWUDWLYRV  ;DODSD(QUtTXH] 9HUDFUX] 0p[LFR  8QLYHUVLGDG 9HUDFUX]DQD )DFXOWDG
GH&RQWDGXUtD\$GPLQLVWUDFLyQSKWWSFGLJLWDOXYP[ELWVWUHDP
$QD/DXUD$OED0HQGH]SGI!>FRQVXOWD@

53

  
 
de un web site e implantacin y desarrollo de datawarehousing aplicada a la gestin del Hospital
'RFHQWHGH5LREDPED>HQOtQHD@3UR\HFWRGHJUDGR ,QJHQLHURGH6LVWHPDVH,QIRUPiWLFD 
Latacunga (Ecuador): Escuela Politcnica del Ejrcito, Facultad de Ingeniera de Sistemas
e Informtica.  S  DQH[RV KWWSUHSRVLWRULRHVSHHGXHFELWVWUHDP7
(63(/SGI!>FRQVXOWD@
ARRUBIAS URRUTIA, Amaia (2000). Comunicacin en la empresa: La Importancia de la
&RPXQLFDFLyQ ,QWHUQD HQ OD (PSUHVD >HQ OtQHD@ (Q 5HYLVWD /DWLQD GH &RPXQLFDFLyQ
6RFLDO 9RO  1R  PD\ /D /DJXQD 7HQHULIH &DQDULDV (VSDxD  8QLYHUVLGDG GH /D
Laguna, Laboratorio de Tecnologas de la Informacin y Nuevos Anlisis de Comunicacin
6RFLDO,661KWWSZZZXOOHVSXEOLFDFLRQHVODWLQDDDWPDDPDLDKWPO!
>FRQVXOWD@
&$/=$'$/HWLFLD $%5(8-RVp/XLV  (OLPSDFWRGHODVKHUUDPLHQWDVGHLQWHOLJHQFLD
GHQHJRFLRVHQODWRPDGHGHFLVLRQHVGHORVHMHFXWLYRV>HQOtQHD@En: Daena: International
-RXUQDORI*RRG&RQVFLHQFH9RO1R VHS 0RQWHUUH\ 1/0p[LFR 6SHQWD8QLYHUVLW\
0H[LFRS,661;KWWSZZZVSHQWDPH[LFRRUJYQ  SGI!
>FRQVXOWD@
'$1,(/'$=0DULVRO /3(=*8=019HUyQLFD  6ROXFLRQHVGHVRIWZDUHOLEUHSDUD
HO GHVDUUROOR GH DSOLFDFLRQHV GH EDVHV GH GDWRV >HQ OtQHD@7HVLV /LFHQFLDGR HQ 6LVWHPDV
Computacionales). Pachuca (Hidalgo, Mxico): Universidad Autnoma del Estado de Hidalgo,
,QVWLWXWR GH &LHQFLDV %iVLFDV H ,QJHQLHUtD  S KWWSZZZXDHKHGXP[GRFHQFLD7HVLV
LFELOLFHQFLDWXUDGRFXPHQWRV6ROXFLRQHVGHVRIWZDUHOLEUHSDUDHO
GHVDUUROORGHDSOLFDFLRQHVSGI!>FRQVXOWD@
'$52%HUQDEHX5LFDUGR  +()(672'DWD:DUHKRXVLQJ,QYHVWLJDFLyQ\6LVWHPDWL]DFLyQ
GH FRQFHSWRV +()(672 0HWRGRORJtD SDUD OD &RQVWUXFFLyQ GH XQD 'DWD :DUHKRXVH >HQ
OtQHD@&yUGRED $UJHQWLQD /LFHQFLDGH'RFXPHQWDFLyQ/LEUHGH*18SKWWSZZZ
EXVLQHVVLQWHOOLJHQFHLQIRGRFVKHIHVWRYSGI!>FRQVXOWD@
DATE, Christopher J. (2000). Introduccin a los sistemas de bases de datos, 7 ed. Mxico (Mxico):
$GGLVRQ:HVOH\S,6%1
)(511'(= $/02'9$5 (GXDUGR *0(= 257,= 0LJXHO /3(= /3(= 4XLWHULD
025,//2%$/&=$5$OEHUWR129$/926129$/9261LFROiV 526$'248,17$1,//$
-DYLHU  )XQFLRQDOLGDG$OPDFHQHVGH'DWRV\%DVHVGH'DWRV;0/>HQOtQHD@(Q
MORAGA, Ma. ngeles (2010). Asignatura: Modelos Avanzados de Bases de Datos, curso
2009-2010. Cuenca (Espaa): Universidad de Castilla-La Mancha, Escuela Superior de
,QIRUPiWLFD  S KWWSDODUFRVLQIFUXFOPHVGRFEEGGDYDQ]DGDV)XQFLRQDOLGDG
SGI!>FRQVXOWD@
,%$55$0DUtDGHORVQJHOHV  3URFHVDPLHQWR$QDOtWLFRHQ/tQHD 2/$3 >HQOtQHD@7UDEDMR
de Adscripcin (Licenciada en Sistemas de Informacin). Corrientes (Argentina): Universidad
Nacional del Nordeste, Facultad de Ciencias Exactas, Naturales y Agrimensura, Materia de
'LVHxR \$GPLQLVWUDFLyQ GH 'DWRV  S KWWSH[DXQQHHGXDUGHSDUDUHDVLQIRUPDWLFD
6LVWHPDV2SHUDWLYRV2/$30RQRJSGI!>FRQVXOWD@
.5$87+$0(5'LHJR  9HQWDMDVGHOXVRGHKHUUDPLHQWDVGH(7/VREUH$16,64/>HQ
OtQHD@(Q9,-RUQDGDVGH'RFHQWHV8QLYHUVLWDULRVGH6LVWHPDV\7HFQRORJtDVGH,QIRUPDFLyQ
de Facultades de Ciencias Econmicas, DUTI 2011 (18-20/08/2011). Rosario (Argentina):
Asociacin de Docentes Universitarios de Sistemas y Tecnologas de Informacin de
)DFXOWDGHV GH &LHQFLDV (FRQyPLFDV '87, KWWSVGXWLOHVZRUGSUHVVFRP
NUDXWKDPHUGLHJRXDLYHQWDMDVGHOXVRKHUUDPLHQWDVHWOVREUHDQVLVTOSGI! >FRQVXOWD
@
0$72*$5&$5RVD0DUtD  6LVWHPDVGHEDVHVGHGDWRV/D+DEDQD &XED (GLWRULDO
Pueblo y Educacin. 165 p. ISBN: 978-959-13-1273-0
1$5$1-2+(511'(=(VWKHU 6(=02648(5$,QW\  3HQWDKRVRIWZDUHOtGHU
GH,QWHOLJHQFLDGH1HJRFLRGHFyGLJRDELHUWR>HQOtQHD@(Q7HOHP#WLFD5HYLVWDGLJLWDO
de las tecnologas de la informacin y las comunicaciones, Vol. 10, No. 2 (may-ago). La
Habana (Cuba): Departamento de Telemtica, Instituto Superior Politcnico. ISSN: 1729-
 KWWSUHYLVWDWHOHPDWLFDFXMDHHGXFXLQGH[SKSWHOHDUWLFOHYLHZ! >FRQVXOWD
@

U               

3(f$5,9,(5$-XDQ'DYLG 685(='$=$-HV~V$UPDQGR  8WLOL]DFLyQGHLQIRUPDFLyQ


histrica para decisiones empresariales. Trabajo de grado (Ingeniero de Sistemas). Santa F
GH%RJRWi'& &RORPELD 3RQWLFLD8QLYHUVLGDG-DYHULDQDS
3267*5(64/  :KDWLV3RVWJUH64/">RQOLQH@7RURQWR 21&$ 7KH3RVWJUH64/*OREDO
'HYHORSPHQW*URXSKWWSZZZSRVWJUHVTORUJGRFVVWDWLFLQWURZKDWVLVKWPO!>FRQVXOW
@
6(=02648(5$,QW\ 1$5$1-2+(511'(=(VWKHU/LGLD  $GLFLyQGHFDSDFLGDGHV
GH LQWHOLJHQFLD GH QHJRFLR XQ DFHUFDPLHQWR >HQ OtQHD@ (Q *L*D 5HYLVWD FXEDQD GH
FRPSXWDFLyQ1R/D+DEDQD &XED &RSH[WHOS,661;KWWSZZZ
FRSH[WHOYFFRFXLQGH[SKSVLWHPDSGHVFDUJDVQLVK! KWWSZZZFRSH[WHOFRPFX
VLWHVGHIDXOWOHVUHYLVWDV*L*$SGI!>FRQVXOWD@
9$/'e652'5*8(=<LVHO5$0260$(675(0D\ULQ *0(=52'5*8(=-DQG\0LJXHO
(2013). Mercado de datos para la direccin de cuadros de la Administracin Provincial de
$UWHPLVD>HQOtQHD@(Q5HYLVWD&XEDQDGH&LHQFLDV,QIRUPiWLFDV9RO1R HQHPDU 
La Habana (Cuba): Universidad de las Ciencias Informticas, Grupo Editorial Ediciones
)XWXUR S  H,661  KWWSUFFLXFLFXLQGH[SKSUFFLDUWLFOHYLHZ!
KWWSVFLHORVOGFXVFLHORSKS"SLG 6 VFULSW VFLBDUWWH[W!
>FRQVXOWD@

55

You might also like