Un Datawarehouse es una base de datos corporativa que se
caracteriza por integrar y depurar información de una o más fuentes distintas, para luego procesarla permitiendo su análisis desde infinidad de pespectivas y con grandes velocidades de respuesta. La creación de un datawarehouse representa en la mayoría de las ocasiones el primer paso, desde el punto de vista técnico, para implantar una solución completa y fiable de Business Intelligence. . 2. ¿Quién es Bill Inmon? Inmon (quien es considerado el padre del concepto de datawarehouse) nos plantea una estrategia “top-down” del problema. Lo primero que haremos a la hora de desarrollar del datawarehouse será establecer la estructura de datos en 3FN, perfectamente normalizada y limpia. Los datos que se insertarán en esta estructura generalmente procederán de un “área de carga” en la que los datos son depurados antes de pasar a la estructura normalizada del datawarehouse.
3. ¿Cuáles son las características del Data Warehouse según Bill
Inmon? El término Datawarehouse fue acuñado por primera vez por Bill Inmon, y se traduce literalmente como almacén de datos. No obstante, y como cabe suponer, es mucho más que eso. Según definió el propio Bill Inmon, un datawarehouse se caracteriza por ser: • Integrado: los datos almacenados en el datawarehouse deben integrarse en una estructura consistente, por lo que las inconsistencias existentes entre los diversos sistemas operacionales deben ser eliminadas. La información suele estructurarse también en distintos niveles de detalle para adecuarse a las distintas necesidades de los usuarios.
• Temático: sólo los datos necesarios para el proceso de
generación del conocimiento del negocio se integran desde el entorno operacional. Los datos se organizan por temas para facilitar su acceso y entendimiento por parte de los usuarios finales. Por ejemplo, todos los datos sobre clientes pueden ser consolidados en una única tabla del datawarehouse. De esta forma, las peticiones de información sobre clientes serán más fáciles de responder dado que toda la información reside en el mismo lugar.
• Histórico: el tiempo es parte implícita de la información
contenida en un datawarehouse. En los sistemas operacionales, los datos siempre reflejan el estado de la actividad del negocio en el momento presente. Por el contrario, la información almacenada en el datawarehouse sirve, entre otras cosas, para realizar análisis de tendencias. Por lo tanto, el datawarehouse se carga con los distintos valores que toma una variable en el tiempo para permitir comparaciones.
• No volátil: el almacén de información de un datawarehouse
existe para ser leído, pero no modificado. La información es por tanto permanente, significando la actualización del datawarehouse la incorporación de los últimos valores que tomaron las distintas variables contenidas en él sin ningún tipo de acción sobre lo que ya existía.
4. ¿Cuales son los procesos de conforman en Data Warehouse?
Temático: Los datos están almacenados por materias o temas. Integrado: Todos los datos integrados, frente a bases de datos operativas, pensadas sin tener en cuenta su integración, Un mismo tipo de datos puede ser expresado de distinta manera en dos bases de datos operativas distintas. No volátil: No hay actualización de datos sobre anteriores, se van acumulando datos de diferentes períodos de tiempo. Histórico: los datos almacenados permanecen más tiempo que en una base de datos operativa.
5. ¿Quién es Ralph Kimball?
Los almacenes de datos (data warehouses en inglés) toman cada día mayor importancia, a medida que las organizaciones pasan de esquemas de sólo recolección de datos a esquemas de análisis de los mismos. Sin embargo a pesar de la gran difusión de los conceptos relacionados con los almacenes de datos, no existe demasiada información disponible en castellano en cuanto a las metodologías para implementarlos. En este breve artículo intentaremos brindar una explicación general de una de las metodologías más usadas, la metodología de Kimball. 6. ¿Qué es un Data Mining? El datamining (minería de datos), es el conjunto de técnicas y tecnologías que permiten explorar grandes bases de datos, de manera automática o semiautomática, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto. Básicamente, el datamining surge para intentar ayudar a comprender el contenido de un repositorio de datos. Con este fin, hace uso de prácticas estadísticas y, en algunos casos, de algoritmos de búsqueda próximos a la Inteligencia Artificial y a las redes neuronales. De forma general, los datos son la materia prima bruta. En el momento que el usuario les atribuye algún significado especial pasan a convertirse en información. Cuando los especialistas elaboran o encuentran un modelo, haciendo que la interpretación que surge entre la información y ese modelo represente un valor agregado, entonces nos referimos al conocimiento. Vea más diferencias entre datos, información y conocimiento.
7. ¿Cuáles son las Diferencias entre el sistema tradicional y el
Data Warehouse?
SISTEMA TRADICIONAL DATA WAREHOUSE
Predomina la actualización Predomina la consulta La actividad más importante es de La actividad más importante es el tipo operativo (día a día) análisis y la decisión estratégica Predomina el proceso puntual Predomina el proceso masivo Mayor importancia a la estabilidad Mayor importancia al dinamismo Datos en general desagregados Datos en distintos niveles de detalle y agregación Importancia del dato actual Importancia del dato histórico Importancia del tiempo de Importancia de la respuesta masiva respuesta de la transacción instantánea Estructura relacional Visión multidimensional Usuarios de perfiles medios o Usuarios de perfiles altos bajos
8. ¿Por qué surgió el Data Warehouse?
Proporciona una herramienta para la toma de decisiones en cualquier área funcional, basándose en información integrada y global del negocio. 1. ¿Cuál es la función de los servicios de extracción y transformación?
Para entender la necesidad de un proceso de transformación debemos
tener en cuenta que en un proceso ETL se manejan fuentes diversas, algunas de ellas de fuera de la propia organización: información bursátil de una web ajena a la empresa, cualquier tipo de descarga de Internet, un paquete de Office, etc.Esta variedad de bases de datos, en ocasiones de varios países, con diferentes idiomas y distintas unidades de medida, imposibilita o dificulta la posibilidad de realizar comparaciones si con anterioridad no se realizan conversiones y formateos. De ahí la necesidad de los procesos de transformación. 2. Mencione los elementos clave de una Data Warehouse • Extraction, Transform and Load (ETL) • Data Mining (Minería de Datos) 3. ¿Cuál es la función de las Fuentes de Datos? La información es fundamental a la hora de tomar decisiones empresariales; lo que quiere decir que una información precisa y accesible nos ayudará a realizar una correcta elección. Por ello qué mejor manera que empezar por saber qué es lo que ocurre en nuestra propia empresa. 4. ¿Cómo se denomina el componente que ofrece servicios de seguridad (archivo, backup, recuperación) y monitorización? sistemas de backup 5. ¿Cómo están agrupados los componentes de un Data WareHouse? Almacén de datos 6. ¿Cuál es la función de las Data Marts? Un Datamart es una base de datos departamental, especializada en el almacenamiento de los datos de un área de negocio específica. Se caracteriza por disponer la estructura óptima de datos para analizar la información al detalle desde todas las perspectivas que afecten a los procesos de dicho departamento. Un datamart puede ser alimentado desde los datos de un datawarehouse, o integrar por si mismo un compendio de distintas fuentes de información. 7. ¿Cómo funciona el procesos ETT en un Data Warehouse? La extracción, transformación y transferencia de los datos de los sistemas operacionales fuente al Data Warehouse forman el proceso mejor conocido como ETT en un proyecto Data Warehouse se emplean para recuperar, manipular y analizar los datos, y para presentar
después los resultados.
1. ¿Cuáles son las ventajas del Data Warehouse?
La ventaja principal de este tipo de bases de datos radica en las estructuras en las que se almacena la información (modelos de tablas en estrella, en copo de nieve, cubos relacionales... etc). Este tipo de persistencia de la información es homogénea y fiable, y permite la consulta y el tratamiento jerarquizado de la misma (siempre en un entorno diferente a los sistemas operacionales). 2. ¿Cuáles son las desventajas de DataWarehouse? • Implementar un Data warehouse implica un alto costo y no suele ser estático necesita mantenimiento que su costo es elevado. • Incluso pueden quedar obsoletos en cualquier momento. • Se confunde con sistemas operacionales por que cumplen con algunas funciones parecidas al data warehouse pero puede resultar peor por algunas funciones son muy caras o que no se usen muy repetidamente. 3. ¿Mencione las herramientas usadas por Data Warehouse? 4. ¿Ha influido el Customer Relationship Magnament y Ecommerce en desarrollo de tecnología como DataWarehouse? Es la solución tecnológica más idónea para recoger y tratar la información operativa necesaria de los clientes con el objetivo de que la empresa desarrolle actuaciones de marketing. La información se organiza de forma histórica y se diseña para facilitar los procesos de consulta orientados a las necesidades de negocio.
5. DataWarehouse una tecnología de apoyo del: Almacenamiento de
Datos 1. ¿Cuáles son las razones para crear un DataWarehouse? Un Data Warehouse es importante ya que sirve como un sistema de apoyo a las decisiones. Además sirve para organizar la utilización de los datos para llegar a los hechos, las tendencias o las relaciones que pueden ayudarles a tomar decisiones efectivas o crear estrategias eficaces para lograr sus objetivos. 2. ¿Cuál es el proceso en el diseño de un DataWarehuse?
3 Nombre tres estructuras básicas de la Arquitectura
DataWarehouse Nivel de organización de datos: incluye todos los procesos necesarios para seleccionar, editar, resumir, combinar y cargar en el Data Warehouse y en la capa de acceso a la información los datos operacionales y/o externos. Nivel de acceso a la información: es la capa de interacción del usuario cuya finalidad es la conversión de los datos almacenados en información fácil y transparente para las herramientas de los usuarios finales. Nivel de gestión de procesos: planificación de las tareas y procesos para la construcción y mantenimiento actualizado del Data Warehouse. 4. ¿Por qué necesario tener un DataWarehouse? La creación del Data Warehouse representa la mayoría de las veces el primer paso, desde el punto de vista técnico, para implantar una solución completa y fiable de Business Intelligence y así aportar las mejores respuestas a los problemas de la organización. Cuáles son los tres factores esenciales para construir un DW? Teniendo en cuenta que los tres factores más importantes a controlar en un proyecto son: plazo, presupuesto y calidad; existen 4 factores que toda gestión de proyectos debe contemplar por ser los de mayor influencia en los resultados alcanzados. Estos factores no son excluyentes, han de tenerse en cuenta a la vez, y no son los únicos, ya que existen otros que también pueden afectar al balance de un proyecto. Sin embargo, sí son los más decisivos y por ello merecen una atención especial. Se trata de: Claridad en la definición de objetivos. Utilización de una metodología. Precisión en la planificación. Compromiso de los participantes 5. ¿Cuáles son los tres factores esenciales para construir un DW? RRHH, Tecnología y Disciplina 1. ¿Qué es OLAP? Es una tecnología que permite analizar grandes volúmenes de datos, organizándolos en forma de cubos multidimensionales. Mediante esta tecnología, se puede navegar la información en forma dinámica e intuitiva.
2. ¿Qué operaciones realizan los servidores de OLAP?
Roll Up, Drill down, Slice y Dice.
3. ¿Cuáles son los dos enfoques de OLAP?
MOLAP y ROLAP
4. ¿Cuáles son los componentes del servicio de análisis?
Análisis, analitical calculador, knowlegge studio y Forecast 5. OLAP y Procesamiento Analítico en Línea se refieren a la misma tecnología? r.- SI 6. Mencione tres características del OLAP. - Presenta una visión multidimensional lógica de los datos en el Data Warehouse. -Ofrece opciones de modelado analítico y - Tiene un motor de depósito de dato multidimensional que almacena los datos en arreglos
1. ¿El “procesamiento transaccional en línea” (OLTP – On Line
Transaction Processing), es conocido también como procesamiento operacional.? SI 2. ¿Los sistemas tradicionales de transacciones y las aplicaciones de Data Warehousing son polos opuestos en cuanto a sus requerimientos de diseño y sus características de operación? R.- SI 3. Los sistemas Data warehouse están orientados a diseño de consultas en contraposición con los procesos transaccionales. NO ES ADECUADA 4. Las aplicaciones OLAP son usadas por (a) Analistas y Gerentes que frecuentemente quieren altos grados de agregación de los datos y desde distintas perspectivas y focos Totales de ventas por región. (a) Analistas y Gerentes (b) Transacciones Bancarias (c) Otras operaciones 5. Las aplicaciones OLTP están caracterizadas por varios (b) Usuarios creando, actualizando o recuperando registros individuales. (a) Clientes (b) Usuarios (c) Tiendas 6. Las aplicaciones OLPT están orientadas (a) transacciones. (a) transacciones (b) compras (c) Conceptos
1. Una de las características más notables del MOLAP es su
funcionamiento más: a) Rápido b) Lento c) Retardado d) Analítico
2. El ROLAP, también se puede definir como:
a) Rosting Organization Large Aplicated Point. b) Sistema de acumulación de información precisa e inflexible. c) OLAP emparentado. d) Ninguna de las Anteriores. 3. La Arquitectura MOLAP usa unas bases de datos multidimensionales para: a) Transmitir datos. b) Tomar decisiones. c) Proporcionar el análisis. d) Efectuar evaluaciones.
4. Es una Arquitectura diferente para los sistemas OLAP.
a) OLAP relacionales (ROLAP). b) OLAP multidimensional (MOLAP) c) Las dos anteriores.