You are on page 1of 26

DATA WAREHOUSE

LILIANA PAOLA TORO


CESAR DANIEL LAVACUDE

1
OBJETIVO
 Explicar la historia, los conceptos, aplicaciones y soluciones
de Data Warehouse existentes.

 Qué, cómo, cuándo, dónde y por qué de Data Warehouse.

2
ALCANCE
 Conceptos
 Definición
 Historia
 Objetivos de un Data Warehouse
 Características
 Procesos
 Arquitectura
 Data Warehouse en el entorno corporativo
 Qué son los procesos ETL?
 Paralelo entre Sistema Tradicional y Data Warehouse
 Beneficios de Data Warehouse
 Data Warehouse en la nube?
 El futuro: Big Data

3
CONCEPTOS
• OLAP (On-Line Analytical Processing o procesamiento analítico on-line)
 Análisis rápido de información multidimensional compartida.
• DSS (Decision-Support Systems o sistemas de soporte a la toma de decisiones)
EIS (Executive Information Systems o sistemas de información ejecutiva)
 Hacen alusión a las herramientas para obtener datos de nivel superior del
DW para la toma de decisiones.
• DM (Data Mining o minería de datos)
 Se emplea como parte del proceso de descubrir conocimiento
• OLTP (On-Line Transaction Processing o procesamiento de transacciones on-line)
 Los datos que una empresa utiliza como soporte a los negocios se les
denomina “operacionales”. Los sistemas usados con el fin de recogerlos u
operar con ellos reciben el nombre de OLTP.
• BI (Business Intelligence)
 Es el conjunto de tecnologías que permiten a las empresas utilizar la
información disponible en cualquier parte de la organización para hacer
mejores análisis, descubrir nuevas oportunidades y tomar mejores decisiones
estratégicas.
• Metadata
 Es la información sobre los datos que se introducen, transforman y existen
en el DW. (Datos acerca de los datos)
4
DEFINICIONES

“Un Data Warehouse es un conjunto de datos


integrados orientados a una material que varían con
el tiempo y que no son transitorios, los cuales
soportan el proceso de toma de decisiones de una
administración” Bill lnmon Es un depósito semánticamente
consistente en datos (separados y que
no interfieren con los sistemas operativos
y de producción existentes) que Ilenan
por completo los diferentes
Es un conjunto de tecnologías, requerimientos de acceso y reporte de
NO UN PRODUCTO. Debe datos
construirse, paso a paso

Es una Arquitectura cuyo


objetivo inicial es satisfacer
la demanda de los gestores
de obtener una visión
Es un proceso continuo que mezcla los datos de varias integrada de la empresa y
fuentes, para soportar la constante necesidad de su entorno
consultas estructuradas, reportes analíticos y soporte
de decisiones
5
DEFINICIONES
Integra datos recogidos de diferentes
sistemas operacionales de la
organización (y/o fuentes externas)

Fuente
de
datos2 Fuente de
BD transacional2 datos3
Almacén
de datos Fuente
de
datos1
BD transacional1
HTML

Fuentes Fuentes
internas externas
6
HISTORIA

LA PREHISTORIA – Principios de los 80

Automatizar
procesos repetitivos OLPT
o administrativos

7
HISTORIA

EDAD MEDIA: Mediados a finales de los 80

Hay mucha
información Necesidad de crear
nuevas DB centrales
con info resumida y
detallada

Centralizar la información
Cómo cargar esta información?
Cómo acceder a la información de
forma ágil y eficiente?

8
HISTORIA

REVOLUCION DE LOS DATOS: Principios de los 90

Los datos importan!


La Información es un
activo intangible de la
empresa!

Los datos son la


materia prima de la
información! Qué es una empresa
sin información?

9
HISTORIA

ACTUAL ERA DE LA INFORMACIÓN: Finales de los 90 y actualidad

Mayor
almacenamiento

Consulta de datos

Internet

SOLUCIONES

10
OBJETIVOS
 Información accesible de la organización
 Información consistente
 Información adaptable y elástica
 Protección al valor de la información
 Toma de decisiones
 Acceder al Data Warehouse con su propio
lenguaje de negocio, indicando qué información
hay y qué significado tiene.
 Ayudar a construir consultas, informes y
análisis, mediante herramientas de navegación.

 Auditoría
 Gestión de la información histórica
 Administración del Data Warehouse
 Elaboración de programas de extracción de la información
 Especificación de las interfaces para la realimentación a los
sistemas operacionales de los resultados obtenidos 11
CARACTERISTICAS
Orientado al
negocio
 Insert
X Update

Costos
Los tiempos razonables
deben ser
razonables

Debe estar preparado para


gestionar grandes volúmenes de
Diseñado para proporcionar información
información a los usuarios
12
CARACTERISTICAS
Ralph Kimball
METRICAS
 Cuánto?

DIMENSIONES
 Quién?
 Cuándo?
 Dónde?
 Cómo?
 Qué?

El modelado en estrella es altamente desnormalizado. Con ello se logra minimizar el


número de uniones y, por consiguiente, incrementar el rendimiento de las consultas 13
PROCESOS

 Alimentan información al DW Usuario


 Mayor % de esfuerzo (80%)

14
ARQUITECTURA

15
DATA WAREHOUSE EN EL ENTORNO COLABORATIVO

• Datos de toda la compañía, organizados


para facilitar las consultas mas
analíticas que transaccionales.
• Los procesos de transformación han sido
aplicados a los datos para permitir un
tiempo de respuesta mínimo a las
consultas.
• Modelo de datos multidimensional para
hacer mas fácil la navegación y
explotación de datos.
• La administración de la seguridad esta Calidad y
Consistencia Rapidez de
centralizada para garantizar la necesidad Respuesta
de
de información dependiendo del perfil de Información
usuarios.

Visualización
Intuitiva

16
APLICACIONES DATA WAREHOUSE
Análisis de
Comportamiento

• Estudiar y clasificar
el comportamiento
de los clientes y
negocios de
acuerdo a
parámetros
específicos.
Predicción de Modelado de costos
Mercado y Presupuesto

• Predecir el flujo de • Utilizando


un mercado con funciones de
información agregación y
histórica y agrupamientos, se
detección de pueden analizar los
patrones a través costos de
del tiempo. operación para
hacer mejoras en el
negocio.
17
¿QUÉ SON LOS PROCESOS ETL?
Los procesos ETL son un término estándar que se utiliza para referirse al movimiento y
transformación de datos. Se trata del proceso que permite a las organizaciones mover
datos desde múltiples fuentes, reformatearlos y cargarlos en otra base de datos.

• Identificación de los • Carga de datos.


datos que han • Realización de pruebas
cambiado. • Limpieza y transformación de calidad de la carga.
• Extracción (lectura) de datos.
de datos.
18
SISTEMA TRADICIONAL Y DATA WAREHOUSE
SISTEMA TRADICIONAL DATA WAREHOUSE
• Predomina la actualización • Predomina la consulta
• La actividad más importante es de tipo • La actividad más importante es el
operativo (día a día) análisis y la decisión estratégica
• Predomina el proceso puntual • Predomina el proceso masivo
• Mayor importancia a la estabilidad • Mayor importancia al dinamismo
• Datos en general desagregados • Datos en distintos niveles de detalle y
agregación
• Importancia del dato actual • Importancia del dato histórico
• Importancia del tiempo de respuesta de • Importancia de la respuesta masiva
la transacción instantánea
• Estructura relacional • Visión multidimensional
• Usuarios de perfiles medios o bajos • Usuarios de perfiles altos

19
DATA WAREHOUSE EN LA NUBE

 Infraestructura
flexible y dinámica.

• Fallar temprano y
recuperar más
rápido

• Capacidades
empresariales.

• Menor coste de
propiedad.

20
WAREHOUSE VS BIG DATA
BIG DATA
• Por otro lado, un data warehouse
almacena datos consolidados de diversas
fuentes o sistemas de la empresa. Se trata
de datos estructurados, que tiene como
objetivo principal ser precisos y de alta
calidad para de esta forma poder dar
soporte a la toma de decisiones de la
empresa. Se trata de conseguir tener todos
los datos juntos para después poder
dividirlos para hacer un análisis de
determinados sectores o estrategias.

• Llamamos big data a un gran volumen de


datos con una variedad, complejidad y
velocidad de crecimiento enorme y que WAREHOUSE
además tienen la característica de no ser
estructurados. Eso significa que no son
relacionales, estando además fuera del
entorno corporativo. Es un tipo de tecnología
que te permite analizar los datos en tiempo real
y puede provenir de diferentes fuentes y
formas, tales como mensajería instantánea,
redes sociales, registros de grabaciones,
imágenes, mensajes de correo electrónico, etc.

21
SOFTWARE DE DATA WAREHOUSE EXISTENTE
PRODUCTO (EMPRESA DISTRIBUIDORA) Red Brick Warehouse (Red Brick Systems)
Adabas D (Software AG) SAS System (SAS)
Advanced Pick (Pick Systems) Sybase IQ (Sybase)
DB2 (IBM) Sybase SQL Server, SQL Server MPP (Sybase)
Fast-Count DBMS (MegaPlex Software) SymfoWARE (Fujitsu)
HOPS (HOPS International) Teradata DBS (NCR)
Microsoft SQL Server (Microsoft) THOR (Hitachi)
Model 204 (Computer Corporation of America) Time Machine (Data Management Technologies,
NonStop SQL (Tandem) Inc.)
Nucleus Server (Sand Technology Systems) Titanium (Micro Data Base Systems, Inc.)
OnLine Dynamic Server (Informix) Unidata,Unidata (Inc.)
Extended Parallel Server (Informix) UniVerse (VMARK)
OpenIngres (Computer Associates) Vision (Innovative Systems Techniques, Inc.)
Oracle Server (Oracle) WX9000 (White Cross Systems, Inc.)
Rdb (Oracle) XDB Server (XDB Systems, Inc.)
Bases de datos usadas para data warehouse

22
SOFTWARE DE DATA WAREHOUSE EXISTENTE
PRODUCTO, EMPRESA DISTRIBUIDORA, TIPO InSight, Arcplan Information Services, 2
Acuity/ES, Acuity Management Systems Limited, 1 LEADER, Sterling Strategic Solutions, 1
Applixware, Applix, 1 MagnaFORUM, Forum Systems, Inc., 1
BusinessMetrics, Valstar Systems Ltd., 1 Merit, GIST, s.r.o., 1
BOARD, Pragma Inform, 1 Open EIS Pak, Microsoft, 1
COINS, Russell Consulting Limited, 1 Panorama Business Views, Panorama Business Views Inc., 1
ColumbusEIS, Jitcons YO, 1 Perspectives, Syntell, 1
Commander EIS, Comshare Inc., 1 Qbit, Zenia Software, Inc., 1
Corporate Management/ Financial Executive Information System, Reveal, CSD Software Inc., 1
Strategic Information Associates, Inc., 1 SAS System, SAS Institute, 1
CorVu, CorVu Pty Ltd., 1 Show Business EIS, Show Business Software, 1
Decision Suite, Softkit, 1 Tiler EIS++, Avoca Systems Limited, 1
Discovery EIS, Atlantic Information Systems Ltd., 1 Track, Track Business Solutions, 1
EIS, Inphase Software Limited, 1 Traffic Control EIS, Research & Planning, Inc., 3
Electronic Balanced Scorecard, ASI Financial Services, 1 VentoMap, VentoSales, Vento Software Inc., 1
Enterprise Periscope, Everyware Development Corp., 1 Virtual Headquarters Management System, vHQ LLC, 1
Eureka, European Management Systems, 1 Visual EIS, Synergistic Software, 1
ExecuSense, TLG Corporation, 1 Visual Publisher, KMA Associates International, Inc, 1
FOCUS EIS, Information Builders, Inc., 1 VITAL, Braintec Corporation, 1
Forest & Trees, Platinum Technologies, Inc., 1 Wingz, Investment Intelligence Systems Group, 1
iMonitor, BayStone Software, 1 Wired for OLAP, AppSource Corporation, 1
InfoManager, Ferguson Information Systems, 1 Xecutive Pulse EIS, Megatrend Systems, Ltd., 1
Iridon Almanac, The Great Elk Company Limited, 1

TIPO
1.- Proporciona un sistema de información ejecutivo con capacidades analíticas.
2.- Proporciona un sistema de información ejecutivo con capacidades analíticas para usuarios SAP R/3.
23
3.- Proporciona un sistema de información ejecutivo con capacidades analíticas para usuarios SAP R/2 y R/3.
SOFTWARE DE DATA WAREHOUSE EXISTENTE
PRODUCTO (EMPRESA DISTRIBUIDORA) 4S-Report (Four Seasons Software, Inc) Report Writer (Raima)
Access (Microsoft) Freequery (Dimension Software Systems) Reportoire (Synergistic Systems, Inc.)
Access+ (Sonetics) Front & Center for Reporting, Nomad (Thomson Reports (Nine to Five software Co.)
Actuate Reporting System (Actuate Software Software Products) ReporTool (Zen Software)
Corporation) GQL (Andyne) ReportSmith (Borland)
AMIS Information Server (Hoskyns Group plc) HarborLight (Harbor Software) Rocket Shuttle (Rocket Software, Inc.)
Application System (IBM) HP Information Access (Hewlett-Packard) Safari ReportWriter (Interactive Software Systems)
Approach (Lotus Corporation) Impress, SqlBuddy (Objective Technologies, Inc.) Sagent Data Mart Solution (Sagent Technology, Inc.)
ARPEGGIO (Wall Data Inc.) Impromptu (Cognos Corporation) SAS System (SAS Institute)
APTuser (International Software Group) InfoAssistant (Asymetrix) Second Wind (Anju Technologies)
AS/Access for Microsoft Access (Martin Spencer & InfoMaker (Powersoft Corporation) Select! (Attachmate)
Associates) InfoQuery (Platinum Technology, Inc.) SEQUEL (Advanced Systems Concepts)
ASK Joe (Information Management Services) InfoReports (Platinum Technology, Inc.) Snow Report Writer (Snow International Corporation)
aXcess/400 (Glenbrook Software) InformEnt Warehouse Desktop (Fiserv) Spectrum Writer (Pacific Systems Group)
BrioQuery (Brio Technology) Internet DataSpot (DTL Data Technologies Ltd.) SQLPRO Agent (Beacon Ware, Inc.)
Business Objects (Business Objects, Inc.) inSight (Williams & Partner) SQR Workbench (MITI)
Crystal Reports, Crystal Info (Seagate Software) Interactive Query (New Generation software) Strategy (ShowCase Corporation)
d.b. Express (Computer Concepts Corp.) IQ/Objects, IQ/SmartServer (IQ Software Corporation) The Reporter (Sea Change Systems, Inc)
Databoard, Dataread (SLP Infoware) Iridon Panorama (The Great Elk Company Limited) Unique XTRA (Unique AS)
DataDirect Explorer (Intersolv) Kinetix (Hilco Technologies) URSA InfoSuite (Decision Support Inc.)
DataSite (NetScheme Solutions, Inc.) LANSA/Client (LANSA USA) ViewPoint (Informix)
DB Publisher (Xense Technology Inc.) MARKIS/400 (AS Software) Viper (Brann Software)
DbPower (Db-Tech Inc.) Nirvana (Synergy Technologies) VisPro/Reports (Hock Ware)
Decision Analyzer (Decisión Technology) OR-REPORTER II (Output Reporting, Inc.) Visual Cyberquery (Cyberscience Corporation)
DECquery, DECdecision (Touch Technologies, Inc.) Oracle Reports, Browser (Oracle Corporation) Visual Dbase (Borland)
Discoverer, Discoverer/2000 (Oracle Corporation) Paradox (Borland) Visual Express (Computer Associates International)
DS Server, DS Modeler (Interweave) Platinum Report Facility (Platinum Technology, Inc) Visual FoxPro (Microsoft Corporation)
EasyReporter (Speedware Corporation) ProBit (System Builder) Visual Net (CNet Svenska AB)
Eclipse Query/Report (Cornut Informatique) Productivity Series Reports (michaels, ross & cole) Visualizer Query, Charts (IBM)
ELF (ELF Software) QBE Vision (Sysdeco) Voyant (Brossco Systems)
English Wizard (English Wizard) QMF (IBM) WebBiz (Cybercom Partners)
EnQuiry (Progress Software) QueryObject (Cross/Z International, Inc.) WebSeQueL (InfoSpace Inc.)
Esperant (Speedware) Quest (Centura Software Corporation) WinQL (Data Access Corporation)
FOCUS Six (Information Builders, Inc.) R&R Report Writer (Concentric Data Systems)
24
Xentis (GrayMatter Software Corporation)
SOFTWARE DE DATA WAREHOUSE EXISTENTE
PRODUCTO, EMPRESA DISTRIBUIDORA, TIPO Fusion, Information Builders, Inc., MDDB
Acuity ES, Acuity Management Systems Ltd., MDDB FYI Planner, Think Systems, MDDB
Acumate ES, Kenan Systems Corporation, MDDB Gentia, Planning Sciences, MDDB
Advance For Windows, Lighten, Inc., MDDB Helm, Codeworks, MDDB
AMIS OLAP Server, Hoskyns Group plc, MDDB Holos, Holistic Systems, MDDB
BrioQuery, Brio Technology, MDDB Hyperion OLAP, Hyperion Software, MDDB
Business Objects, Business Objects, Inc., Relacional InfoBeacon, Platinum technology, Inc., Relacional
Commander OLAP, Decision, Prism, Comshare Inc., MDDB Informer, Reportech, MDDB/Relacional
Control, KCI Computing, Relacional Intelligent Decision Server, IBM, Relacional
CrossTarget, Dimensional Insight, MDDB IQ/Vision, IQ Software Corporation, Relacional
Cube-It, FICS Group, MDDB Khalix, Longview Solutions, Inc., Relacional
Dataman, SLP Infoware, MDDB Lightship, Pilot Software, Inc., MDDB
DataTracker, Silvon Software, Inc., Relacional Matryx, Stone, Timber, River, MDDB
DecisionSuite, Information Advantage, Inc., Relacional MDDB Server, SAS, Relacional
Delta Solutions, MIS AG, MDDB Media, Speedware Corporation, MDDB
Demon for Windows, Data Command Limited, MDDB Metacube, Informix, Relacional
DSS Agent, MicroStrategy, Relacional MIKSolution, MIK, MDDB
DynamicCube.OCX, Data Dynamics, Ltd., Relacional MIT/400, SAMAC, Inc, MDDB
EKS/Empower, Metapraxis, Inc., MDDB MSM, Micronetics Design Corporation, MDDB
Essbase Analysis Server, Arbor Software Corporation, MDDB Muse, OCCAM Research Corp., MDDB
Essbase/400, ShowCase Corporation, MDDB OLAP Office, Graphitti Software GmbH, MDDB
Express Server, Objects, Oracle, MDDB OpenOLAP, Inphase Software Limited, Relacional
Fiscal, Lingo Computer Design, Inc., Relacional Pablo, Andyne, MDDB/Relacional
MDDB: Multidimensional DataBase. 25
REFERENCIAS BIBLIOGRAFICAS
Conceptos e historia:
• http://www.dataprix.com/que-es-un-datawarehouse
• http://www.bi.dev42.es/2011/01/25/kimball-e-inmon-y-el-diseno-de-datawarehouses/
• Título: Fundamentos de Data Warehouse
Autor: Mendez, A., Mártire, A., Britos, P. Y Garcia-Martínez, R.
Procesos y características:
• http://eltamiz.com/elcedazo/2009/06/08/el-data-warehouse-entro-en-nuestras-vidas-para-quedarse/
• http://www.dataprix.com/que-es-un-datawarehouse
Arquitectura:
• Título: Guia para la construcción de un Data Warehouse, capítulo 2.
Autor: Bernardo López Bernal
• https://www.adictosaltrabajo.com/tutoriales/datawarehouse/
Entorno corporativo:
• http://blog.powerdata.es/el-valor-de-la-gestion-de-datos/bid/312584/procesos-etl-definici-n-caracter-sticas-
beneficios-y-retos
• https://es.slideshare.net/yenifergaray7/data-warehouse-42780286
Data Warehouse en la nube
• http://blog.powerdata.es/el-valor-de-la-gestion-de-datos/beneficios-y-soluciones-para-un-data-warehouse-en-la-
nube
• http://www.informatica-hoy.com.ar/informatica-tecnologia-empresas/beneficios-data-warehousing.php
Beneficios
• http://www.powerdata.es/data-warehouse
• http://www.bi.dev42.es/2011/01/25/kimball-e-inmon-y-el-diseno-de-datawarehouses/
• http://www.powerdata.es/data-warehouse
Big Data
• http://www.b-eye-network.com/view/17017
• https://colombia.emc.com/collateral/emc-perspective/h8668-ep-cloud-big-data-analytics.pdf

26

You might also like