You are on page 1of 13

1.- ¿Qué es Data Warehouse?

Un Datawarehouse es una base de datos corporativa que se


caracteriza por integrar y depurar información de una o más
fuentes distintas, para luego procesarla permitiendo su análisis
desde infinidad de pespectivas y con grandes velocidades de
respuesta. La creación de un datawarehouse representa en la
mayoría de las ocasiones el primer paso, desde el punto de vista
técnico, para implantar una solución completa y fiable de Business
Intelligence.
.
2. ¿Quién es Bill Inmon?
Inmon (quien es considerado el padre del concepto de
datawarehouse) nos plantea una estrategia “top-down” del problema.
Lo primero que haremos a la hora de desarrollar del datawarehouse
será establecer la estructura de datos en 3FN, perfectamente
normalizada y limpia. Los datos que se insertarán en esta
estructura generalmente procederán de un “área de carga” en la que
los datos son depurados antes de pasar a la estructura normalizada
del datawarehouse.

3. ¿Cuáles son las características del Data Warehouse según Bill


Inmon?
El término Datawarehouse fue acuñado por primera vez por Bill
Inmon, y se traduce literalmente como almacén de datos. No
obstante, y como cabe suponer, es mucho más que eso. Según definió
el propio Bill Inmon, un datawarehouse se caracteriza por ser:
• Integrado: los datos almacenados en el datawarehouse deben
integrarse en una estructura consistente, por lo que las
inconsistencias existentes entre los diversos sistemas
operacionales deben ser eliminadas. La información suele
estructurarse también en distintos niveles de detalle para
adecuarse a las distintas necesidades de los usuarios.

• Temático: sólo los datos necesarios para el proceso de


generación del conocimiento del negocio se integran desde el
entorno operacional. Los datos se organizan por temas para
facilitar su acceso y entendimiento por parte de los usuarios
finales. Por ejemplo, todos los datos sobre clientes pueden ser
consolidados en una única tabla del datawarehouse. De esta forma,
las peticiones de información sobre clientes serán más fáciles de
responder dado que toda la información reside en el mismo lugar.

• Histórico: el tiempo es parte implícita de la información


contenida en un datawarehouse. En los sistemas operacionales, los
datos siempre reflejan el estado de la actividad del negocio en el
momento presente. Por el contrario, la información almacenada en
el datawarehouse sirve, entre otras cosas, para realizar análisis
de tendencias. Por lo tanto, el datawarehouse se carga con los
distintos valores que toma una variable en el tiempo para permitir
comparaciones.

• No volátil: el almacén de información de un datawarehouse


existe para ser leído, pero no modificado. La información es por
tanto permanente, significando la actualización del datawarehouse
la incorporación de los últimos valores que tomaron las distintas
variables contenidas en él sin ningún tipo de acción sobre lo que
ya existía.

4. ¿Cuales son los procesos de conforman en Data Warehouse?


Temático: Los datos están almacenados por materias o temas.
Integrado: Todos los datos integrados, frente a bases de datos
operativas, pensadas sin tener en cuenta su integración, Un mismo
tipo de datos puede ser expresado de distinta manera en dos bases
de datos operativas distintas.
No volátil: No hay actualización de datos sobre anteriores, se
van acumulando datos de diferentes períodos de tiempo.
Histórico: los datos almacenados permanecen más tiempo que en una
base de datos operativa.

5. ¿Quién es Ralph Kimball?


Los almacenes de datos (data warehouses en inglés) toman cada día
mayor importancia, a medida que las organizaciones pasan de
esquemas de sólo recolección de datos a esquemas de análisis de
los mismos. Sin embargo a pesar de la gran difusión de los
conceptos relacionados con los almacenes de datos, no existe
demasiada información disponible en castellano en cuanto a las
metodologías para implementarlos. En este breve artículo
intentaremos brindar una explicación general de una de las
metodologías más usadas, la metodología de Kimball.
6. ¿Qué es un Data Mining?
El datamining (minería de datos), es el conjunto de técnicas y
tecnologías que permiten explorar grandes bases de datos, de
manera automática o semiautomática, con el objetivo de encontrar
patrones repetitivos, tendencias o reglas que expliquen el
comportamiento de los datos en un determinado contexto.
Básicamente, el datamining surge para intentar ayudar a comprender
el contenido de un repositorio de datos. Con este fin, hace uso de
prácticas estadísticas y, en algunos casos, de algoritmos de
búsqueda próximos a la Inteligencia Artificial y a las redes
neuronales.
De forma general, los datos son la materia prima bruta. En el
momento que el usuario les atribuye algún significado especial
pasan a convertirse en información. Cuando los especialistas
elaboran o encuentran un modelo, haciendo que la interpretación
que surge entre la información y ese modelo represente un valor
agregado, entonces nos referimos al conocimiento. Vea más
diferencias entre datos, información y conocimiento.

7. ¿Cuáles son las Diferencias entre el sistema tradicional y el


Data Warehouse?

SISTEMA TRADICIONAL DATA WAREHOUSE


Predomina la actualización Predomina la consulta
La actividad más importante es de La actividad más importante es el
tipo operativo (día a día) análisis y la decisión estratégica
Predomina el proceso puntual Predomina el proceso masivo
Mayor importancia a la estabilidad Mayor importancia al dinamismo
Datos en general desagregados Datos en distintos niveles de
detalle y agregación
Importancia del dato actual Importancia del dato histórico
Importancia del tiempo de Importancia de la respuesta masiva
respuesta de la transacción
instantánea
Estructura relacional Visión multidimensional
Usuarios de perfiles medios o Usuarios de perfiles altos
bajos

8. ¿Por qué surgió el Data Warehouse?


Proporciona una herramienta para la toma de decisiones en
cualquier área funcional, basándose en información integrada y
global del negocio.
1. ¿Cuál es la función de los servicios de extracción y
transformación?

Para entender la necesidad de un proceso de transformación debemos


tener en cuenta que en un proceso ETL se manejan fuentes diversas,
algunas de ellas de fuera de la propia organización: información
bursátil de una web ajena a la empresa, cualquier tipo de descarga
de Internet, un paquete de Office, etc.Esta variedad de bases de
datos, en ocasiones de varios países, con diferentes idiomas y
distintas unidades de medida, imposibilita o dificulta la
posibilidad de realizar comparaciones si con anterioridad no se
realizan conversiones y formateos. De ahí la necesidad de los
procesos de transformación.
2. Mencione los elementos clave de una Data Warehouse
• Extraction, Transform and Load (ETL)
• Data Mining (Minería de Datos)
3. ¿Cuál es la función de las Fuentes de Datos?
La información es fundamental a la hora de tomar decisiones
empresariales; lo que quiere decir que una información precisa y
accesible nos ayudará a realizar una correcta elección. Por ello
qué mejor manera que empezar por saber qué es lo que ocurre en
nuestra propia empresa.
4. ¿Cómo se denomina el componente que ofrece servicios de
seguridad (archivo, backup, recuperación) y monitorización?
sistemas de backup
5. ¿Cómo están agrupados los componentes de un Data WareHouse?
Almacén de datos
6. ¿Cuál es la función de las Data Marts? Un Datamart es una base
de datos departamental, especializada en el almacenamiento de los
datos de un área de negocio específica. Se caracteriza por
disponer la estructura óptima de datos para analizar la
información al detalle desde todas las perspectivas que afecten a
los procesos de dicho departamento. Un datamart puede ser
alimentado desde los datos de un datawarehouse, o integrar por si
mismo un compendio de distintas fuentes de información.
7. ¿Cómo funciona el procesos ETT en un Data Warehouse?
La extracción, transformación y transferencia de los datos de los
sistemas operacionales fuente al Data Warehouse forman el proceso
mejor conocido como ETT en un proyecto Data Warehouse se emplean
para recuperar, manipular y analizar los datos, y para presentar

después los resultados.

1. ¿Cuáles son las ventajas del Data Warehouse?


La ventaja principal de este tipo de bases de datos radica en las
estructuras en las que se almacena la información (modelos de
tablas en estrella, en copo de nieve, cubos relacionales... etc).
Este tipo de persistencia de la información es homogénea y fiable,
y permite la consulta y el tratamiento jerarquizado de la misma
(siempre en un entorno diferente a los sistemas operacionales).
2. ¿Cuáles son las desventajas de DataWarehouse?
• Implementar un Data warehouse implica un alto costo y no
suele ser estático necesita mantenimiento que su costo es elevado.
• Incluso pueden quedar obsoletos en cualquier momento.
• Se confunde con sistemas operacionales por que cumplen con
algunas funciones parecidas al data warehouse pero puede resultar
peor por algunas funciones son muy caras o que no se usen muy
repetidamente.
3. ¿Mencione las herramientas usadas por Data Warehouse?
4. ¿Ha influido el Customer Relationship Magnament y Ecommerce en
desarrollo de tecnología como DataWarehouse?
Es la solución tecnológica más idónea para recoger y tratar la
información operativa necesaria de los clientes con el objetivo de
que la empresa desarrolle actuaciones de marketing. La información
se organiza de forma histórica y se diseña para facilitar los
procesos de consulta orientados a las necesidades de negocio.

5. DataWarehouse una tecnología de apoyo del: Almacenamiento de


Datos
1. ¿Cuáles son las razones para crear un DataWarehouse?
Un Data Warehouse es importante ya que sirve como un sistema de
apoyo a las decisiones. Además sirve para organizar la utilización
de los datos para llegar a los hechos, las tendencias o las
relaciones que pueden ayudarles a tomar decisiones efectivas o
crear estrategias eficaces para lograr sus objetivos.
2. ¿Cuál es el proceso en el diseño de un DataWarehuse?

3 Nombre tres estructuras básicas de la Arquitectura


DataWarehouse
 Nivel de organización de datos: incluye todos los
procesos necesarios para seleccionar, editar, resumir,
combinar y cargar en el Data Warehouse y en la capa de acceso
a la información los datos operacionales y/o externos.
 Nivel de acceso a la información: es la capa de
interacción del usuario cuya finalidad es la conversión de
los datos almacenados en información fácil y transparente
para las herramientas de los usuarios finales.
 Nivel de gestión de procesos: planificación de las
tareas y procesos para la construcción y mantenimiento
actualizado del Data Warehouse.
4. ¿Por qué necesario tener un DataWarehouse?
La creación del Data Warehouse representa la mayoría de las veces
el primer paso, desde el punto de vista técnico, para implantar
una solución completa y fiable de Business Intelligence y así
aportar las mejores respuestas a los problemas de la organización.
Cuáles son los tres factores esenciales para construir un DW?
Teniendo en cuenta que los tres factores más importantes a
controlar en un proyecto son: plazo, presupuesto y calidad;
existen 4 factores que toda gestión de proyectos debe contemplar
por ser los de mayor influencia en los resultados alcanzados.
Estos factores no son excluyentes, han de tenerse en cuenta a la
vez, y no son los únicos, ya que existen otros que también pueden
afectar al balance de un proyecto. Sin embargo, sí son los más
decisivos y por ello merecen una atención especial. Se trata de:
Claridad en la definición de objetivos.
Utilización de una metodología.
Precisión en la planificación.
Compromiso de los participantes
5. ¿Cuáles son los tres factores esenciales para construir un DW?
RRHH, Tecnología y Disciplina
1. ¿Qué es OLAP?
Es una tecnología que permite analizar grandes volúmenes de datos,
organizándolos en forma de cubos multidimensionales.
Mediante esta tecnología, se puede navegar la información en forma
dinámica e intuitiva.

2. ¿Qué operaciones realizan los servidores de OLAP?


Roll Up, Drill down, Slice y Dice.

3. ¿Cuáles son los dos enfoques de OLAP?


MOLAP y ROLAP

4. ¿Cuáles son los componentes del servicio de análisis?


Análisis, analitical calculador, knowlegge studio y Forecast
5. OLAP y Procesamiento Analítico en Línea se refieren a la misma
tecnología?
r.- SI
6. Mencione tres características del OLAP.
- Presenta una visión multidimensional lógica de los datos en el
Data Warehouse.
-Ofrece opciones de modelado analítico y
- Tiene un motor de depósito de dato multidimensional que almacena
los datos en arreglos

1. ¿El “procesamiento transaccional en línea” (OLTP – On Line


Transaction Processing), es conocido también como procesamiento
operacional.? SI
2. ¿Los sistemas tradicionales de transacciones y las aplicaciones
de Data Warehousing son polos opuestos en cuanto a sus
requerimientos de diseño y sus características de operación? R.-
SI
3. Los sistemas Data warehouse están orientados a diseño de
consultas en contraposición con los procesos transaccionales. NO
ES ADECUADA
4. Las aplicaciones OLAP son usadas por (a) Analistas y Gerentes
que frecuentemente quieren altos grados de agregación de los datos
y desde distintas perspectivas y focos Totales de ventas por
región.
(a) Analistas y Gerentes
(b) Transacciones Bancarias
(c) Otras operaciones
5. Las aplicaciones OLTP están caracterizadas por varios (b)
Usuarios creando, actualizando o recuperando registros
individuales.
(a) Clientes
(b) Usuarios
(c) Tiendas
6. Las aplicaciones OLPT están orientadas (a) transacciones.
(a) transacciones
(b) compras
(c) Conceptos

1. Una de las características más notables del MOLAP es su


funcionamiento más:
a) Rápido
b) Lento
c) Retardado
d) Analítico

2. El ROLAP, también se puede definir como:


a) Rosting Organization Large Aplicated Point.
b) Sistema de acumulación de información precisa e inflexible.
c) OLAP emparentado.
d) Ninguna de las Anteriores.
3. La Arquitectura MOLAP usa unas bases de datos
multidimensionales para:
a) Transmitir datos.
b) Tomar decisiones.
c) Proporcionar el análisis.
d) Efectuar evaluaciones.

4. Es una Arquitectura diferente para los sistemas OLAP.


a) OLAP relacionales (ROLAP).
b) OLAP multidimensional (MOLAP)
c) Las dos anteriores.

You might also like