Professional Documents
Culture Documents
CONCEPTO
un
almacn de datos (del ingls data warehouse) es una coleccin de datos orientada a un determinado mbito (empresa, organizacin, etc.), de slo lectura y estructurada para anlisis, que ayuda a la toma de decisiones en la entidad en la que se utiliza.
Definicin
de Bill Inmon
Bill Inmon1 fue uno de los primeros autores en escribir sobre el tema de los almacenes de datos, define un data warehouse (almacn de datos) en trminos de las caractersticas del repositorio de datos: Orientado a temas Variante en el tiempo No voltil Integrado
Definicin
de Ralph Kimball
Ralph Kimball2 es otro conocido autor en el tema de los data warehouse, define un almacn de datos como: "una copia de las transacciones de datos especficamente estructurada para la consulta y el anlisis".
CARACTERISTICAS
En
Orientado
a temas.- Los datos en la base de datos estn organizados de manera que todos los elementos de datos relativos al mismo evento u objeto del mundo real queden unidos entre s. Variante en el tiempo.- Los cambios producidos en los datos a lo largo del tiempo quedan registrados para que los informes que se puedan generar reflejen esas variaciones.
No
voltil.- La informacin no se modifica ni se elimina, una vez almacenado un dato, ste se convierte en informacin de slo lectura, y se mantiene para futuras consultas. Integrado.- La base de datos contiene los datos de todos los sistemas operacionales de la organizacin, y dichos datos deben ser consistentes.
una tecnologa muy entendible porque puede representar mejor la estructura amplia de una empresa para administrar los datos. Para comprender una estrategia data warehousing, es esencial tener una Arquitectura Data Warehouse.
Base de datos operacional / Nivel de base de datos externo Nivel de acceso a la informacin Nivel de acceso a los datos Nivel de directorio de datos (Metadata) Nivel de gestin de proceso Nivel de mensaje de la aplicacin Nivel de data warehouse Nivel de organizacin de datos
sistemas operacionales procesan datos para apoyar las necesidades operacionales crticas tienen dificultad al acceder a los datos para otra gestin o propsitos informticos las organizaciones grandes adquieren datos adicionales desde bases de datos externas (INE)
nivel de acceso a la informacin de la arquitectura data warehouse, representa las herramientas que el usuario final normalmente usa da a da. Por ejemplo: Excel, Access, etc.
DBMS(database management system) diferentes y sistemas de archivos sobre el mismo hardware tambin a los fabricantes y protocolos de red. es responsable de la interfaces entre las herramientas de acceso a la informacin y las bases de datos operacionales.
programacin de diversas tareas que deben realizarse para construir y mantener el data warehouse y la informacin del directorio de datos
el transporte de informacin alrededor de la red de la empresa Puede usarse para recolectar transacciones o mensajes y entregarlos a una ubicacin segura en un tiempo seguro.
donde se almacena la data actual, usada principalmente para usos estratgicos(datos operacionales o externos) Pueden usar plataformas cliente/servidor, pero por lo general se almacenan sobre mainframes.
MAINFRAME
Cliente /servidor
Se llama tambin gestin de copia o rplica incluye todos los procesos necesarios como seleccionar, editar, resumir, combinar y cargar datos en el depsito y acceder a la informacin desde bases de datos operacionales y/o externas. Involucra tambin programas de anlisis de calidad de datos y filtros que identifican modelos y estructura de datos dentro de la data operacional existente
data warehouses tienen una estructura distinta. Hay niveles diferentes de esquematizacin y detalle que delimitan el data warehouse que son: Detalle de datos antiguos Datos ligeramente resumidos Datos completamente resumidos Meta data
las ocurrencias ms recientes, las cuales son de gran inters Es voluminoso, ya que se almacena al ms bajo nivel de granularidad. Casi siempre se almacena en disco, el cual es de fcil acceso, aunque su administracin sea costosa y compleja.
es frecuentemente accesada y se almacena a un nivel de detalle, consistente con los datos detallados actuales es poco usual utilizar el disco como medio de almacenamiento
Este
datos son compactos y fcilmente accesibles. A veces se encuentra en el ambiente de data warehouse y en otros, fuera del lmite de la tecnologa que ampara al data warehouse
METADATA
su
contenido no es tomado directamente desde el ambiente operacional. ayuda al analista a ubicar los contenidos del data warehouse. Una gua de los algoritmos usados para la esquematizacin entre el detalle de datos actual, con los datos ligeramente resumidos y stos, con los datos completamente resumidos, etc.
Definicin de objetivos:
Juegan El
un papel preponderante.
esclarecimiento de los objetivos son los pilares bsicos para el desarrollo de todo proyecto.
del proyecto: Bsicamente se trata de responder la cuestin: Que informacin queremos analizar? (Tiempo) Consiste en saber el tiempo que dispondremos para construir el Data Warehouse y que est disponible para los usuarios. Que presupuesto disponemos para gestionar los recursos?
Planificacin
Recursos
Definicin de requerimientos:
Es
fundamental involucrar a distintos usuarios de cada uno de los departamentos de la empresa que vayan a utilizar el DW. las respuestas a las cuestiones de negocio que deber responder el DW. definirn las mtricas y/o indicadores y como se medirn.
Sern
Se
Eleccin Diseo
Modelizacin:
La entrada de esta etapa son los Requerimientos del DW. El modelo dimensional: Define las tablas dimensiones y tablas de hecho.
El
modelo fsico: Define cada una de las tablas y campos que se crearn en la base de datos elegida.
del mapeo lgico entre sistemas OLTP y las tablas dimensiones y hechos del data warehouse. de reglas de transformacin.
Definicin Diseo
Desarrollo
Creacin
de la base de datos del data warehouse y configuracin de la misma. de repositorios de metadatos para los procesos ETL.
Creacin
Implantacin
Instalacin
Migracin
Instalacin
Mantenimiento y gestin
Formacin
Monitorizar
Incluir
VENTAJAS Y DESVENTAJAS
Ventajas
Proporciona
informacin clave para la toma de decisiones empresariales Proporciona un gran poder de procesamiento de informacin Permite una mayor flexibilidad y rapidez en el acceso a la informacin.
Un
Datawarehouse proporciona una informacin de gestin accesible, correcta, uniforme y actualizada. Proporciona un menor coste en la toma de decisiones, una mayor flexibilidad ante el entorno, un mejor servicio al cliente y permite el rediseo de los procesos.
Desventajas
Mantenimiento.
Tienen
Las
empresas que utilizan data warehouse son fundamentalmente aquellas que manejan grandes volmenes de datos relativos a clientes, compras, marketing, transacciones, operaciones. como lo son las empresas de telecomunicaciones, transporte, Turismo, fabricacin de bienes de consumo masivo etc.
FIN