You are on page 1of 44

DATA WAREHOUSE

CONCEPTO
un

almacn de datos (del ingls data warehouse) es una coleccin de datos orientada a un determinado mbito (empresa, organizacin, etc.), de slo lectura y estructurada para anlisis, que ayuda a la toma de decisiones en la entidad en la que se utiliza.

Definicin

de Bill Inmon

Bill Inmon1 fue uno de los primeros autores en escribir sobre el tema de los almacenes de datos, define un data warehouse (almacn de datos) en trminos de las caractersticas del repositorio de datos: Orientado a temas Variante en el tiempo No voltil Integrado

Definicin

de Ralph Kimball

Ralph Kimball2 es otro conocido autor en el tema de los data warehouse, define un almacn de datos como: "una copia de las transacciones de datos especficamente estructurada para la consulta y el anlisis".

CARACTERISTICAS
En

un data warehouse podemos ver 4 caractersticas principales:

Orientado

a temas.- Los datos en la base de datos estn organizados de manera que todos los elementos de datos relativos al mismo evento u objeto del mundo real queden unidos entre s. Variante en el tiempo.- Los cambios producidos en los datos a lo largo del tiempo quedan registrados para que los informes que se puedan generar reflejen esas variaciones.

No

voltil.- La informacin no se modifica ni se elimina, una vez almacenado un dato, ste se convierte en informacin de slo lectura, y se mantiene para futuras consultas. Integrado.- La base de datos contiene los datos de todos los sistemas operacionales de la organizacin, y dichos datos deben ser consistentes.

ARQUITECTURA DE UN DATA WAREHOUSE


es

una tecnologa muy entendible porque puede representar mejor la estructura amplia de una empresa para administrar los datos. Para comprender una estrategia data warehousing, es esencial tener una Arquitectura Data Warehouse.

ELEMENTOS DE UNA ARQUITECTURA DATA WAREHOUSE


Base de datos operacional / Nivel de base de datos externo Nivel de acceso a la informacin Nivel de acceso a los datos Nivel de directorio de datos (Metadata) Nivel de gestin de proceso Nivel de mensaje de la aplicacin Nivel de data warehouse Nivel de organizacin de datos

BASE DE DATOS OPERACIONAL /NIVEL DE BASE DE DATOS EXTERNO


Los

sistemas operacionales procesan datos para apoyar las necesidades operacionales crticas tienen dificultad al acceder a los datos para otra gestin o propsitos informticos las organizaciones grandes adquieren datos adicionales desde bases de datos externas (INE)

NIVEL DE ACCESO A LA INFORMACIN


El

nivel de acceso a la informacin de la arquitectura data warehouse, representa las herramientas que el usuario final normalmente usa da a da. Por ejemplo: Excel, Access, etc.

NIVEL DE ACCESO A LOS DATOS


conecta

DBMS(database management system) diferentes y sistemas de archivos sobre el mismo hardware tambin a los fabricantes y protocolos de red. es responsable de la interfaces entre las herramientas de acceso a la informacin y las bases de datos operacionales.

NIVEL DE DIRECTORIO DE DATOS (METADATA)


La metadata es la informacin alrededor de los datos dentro de la empresa. mantiene una forma de directorio de datos o repositorio de la informacin metadata.

NIVEL DE GESTIN DE PROCESOS


la

programacin de diversas tareas que deben realizarse para construir y mantener el data warehouse y la informacin del directorio de datos

NIVEL DE MENSAJE DE LA APLICACIN


Es

el transporte de informacin alrededor de la red de la empresa Puede usarse para recolectar transacciones o mensajes y entregarlos a una ubicacin segura en un tiempo seguro.

NIVEL DATA WAREHOUSE (FSICO)


Es

donde se almacena la data actual, usada principalmente para usos estratgicos(datos operacionales o externos) Pueden usar plataformas cliente/servidor, pero por lo general se almacenan sobre mainframes.

MAINFRAME

Cliente /servidor

NIVEL DE ORGANIZACIN DE DATOS

Se llama tambin gestin de copia o rplica incluye todos los procesos necesarios como seleccionar, editar, resumir, combinar y cargar datos en el depsito y acceder a la informacin desde bases de datos operacionales y/o externas. Involucra tambin programas de anlisis de calidad de datos y filtros que identifican modelos y estructura de datos dentro de la data operacional existente

ESTRUCTURA DE DATOS DEL DATA WAREHOUSE


Los

data warehouses tienen una estructura distinta. Hay niveles diferentes de esquematizacin y detalle que delimitan el data warehouse que son: Detalle de datos antiguos Datos ligeramente resumidos Datos completamente resumidos Meta data

DETALLE DE DATOS ACTUALES


Refleja

las ocurrencias ms recientes, las cuales son de gran inters Es voluminoso, ya que se almacena al ms bajo nivel de granularidad. Casi siempre se almacena en disco, el cual es de fcil acceso, aunque su administracin sea costosa y compleja.

DETALLE DE DATOS ANTIGUOS


No

es frecuentemente accesada y se almacena a un nivel de detalle, consistente con los datos detallados actuales es poco usual utilizar el disco como medio de almacenamiento

DATOS LIGERAMENTE RESUMIDOS


Los

puntos en los que se basa el diseador para construirlo son:


Que la unidad de tiempo se encuentre sobre la esquematizacin hecha. Qu contenidos (atributos) tendr la data ligeramente resumida

Este

nivel del data warehouse casi siempre se almacena en disco

DATOS COMPLETAMENTE RESUMIDOS


Estos

datos son compactos y fcilmente accesibles. A veces se encuentra en el ambiente de data warehouse y en otros, fuera del lmite de la tecnologa que ampara al data warehouse

METADATA
su

contenido no es tomado directamente desde el ambiente operacional. ayuda al analista a ubicar los contenidos del data warehouse. Una gua de los algoritmos usados para la esquematizacin entre el detalle de datos actual, con los datos ligeramente resumidos y stos, con los datos completamente resumidos, etc.

CICLO DE VIDA DATA-WAREHOUSE

Definicin de objetivos:
Juegan El

un papel preponderante.

esclarecimiento de los objetivos son los pilares bsicos para el desarrollo de todo proyecto.

Alcance y planificacin del proyecto


Alcance

del proyecto: Bsicamente se trata de responder la cuestin: Que informacin queremos analizar? (Tiempo) Consiste en saber el tiempo que dispondremos para construir el Data Warehouse y que est disponible para los usuarios. Que presupuesto disponemos para gestionar los recursos?

Planificacin

Recursos

Definicin de requerimientos:
Es

fundamental involucrar a distintos usuarios de cada uno de los departamentos de la empresa que vayan a utilizar el DW. las respuestas a las cuestiones de negocio que deber responder el DW. definirn las mtricas y/o indicadores y como se medirn.

Sern

Se

Diseo Business Intelligence:


Como

interactuarn los usuarios con el sistema? de herramienta de anlisis.

Eleccin Diseo

de la capa visual que utilizar el usuario.

Modelizacin:
La entrada de esta etapa son los Requerimientos del DW. El modelo dimensional: Define las tablas dimensiones y tablas de hecho.
El

modelo fsico: Define cada una de las tablas y campos que se crearn en la base de datos elegida.

Diseo de mapeo de sistemas OLTP


Definicin

del mapeo lgico entre sistemas OLTP y las tablas dimensiones y hechos del data warehouse. de reglas de transformacin.

Definicin Diseo

ETL, incluyendo el flujo de procesos ETL.

Desarrollo
Creacin

de la base de datos del data warehouse y configuracin de la misma. de repositorios de metadatos para los procesos ETL.

Creacin

Implantacin
Instalacin

y configuracin de los procesos ETL. inicial de los sistemas OLTP.

Migracin

Instalacin

de las herramientas de anlisis en los usuarios.

Mantenimiento y gestin
Formacin
Monitorizar

y soporte a los usuarios finales.

el crecimiento de tablas de la base de datos. nuevos requerimientos en el data warehouse.

Incluir

VENTAJAS Y DESVENTAJAS

Ventajas
Proporciona

informacin clave para la toma de decisiones empresariales Proporciona un gran poder de procesamiento de informacin Permite una mayor flexibilidad y rapidez en el acceso a la informacin.

Un

Datawarehouse proporciona una informacin de gestin accesible, correcta, uniforme y actualizada. Proporciona un menor coste en la toma de decisiones, una mayor flexibilidad ante el entorno, un mejor servicio al cliente y permite el rediseo de los procesos.

Desventajas
Mantenimiento.

Tienen

un alto coste. Requieren sistemas, aplicaciones y almacenamiento especfico

Las

empresas que utilizan data warehouse son fundamentalmente aquellas que manejan grandes volmenes de datos relativos a clientes, compras, marketing, transacciones, operaciones. como lo son las empresas de telecomunicaciones, transporte, Turismo, fabricacin de bienes de consumo masivo etc.

FIN

You might also like