You are on page 1of 19

DATA

WAREHOUSE
Presentador Por:
Andrs Fabin Cortes Solano
TEMARIO
1. Qu es Data Warehouse?
2. Conceptos bsicos:
a. Caractersticas
b. Aplicaciones
c. Alternativas de Diseo
d. !erra"ientas #tili$adas
e. Data"inin%
&. 'ase de Datos (ultidi"ensional
%. (etadatos
h. )rocesos de Construcci*n
i. +cnicas ,-plotaci*n
Data Warehose
Es un repositorio estructurado,
a nivel Empresa, de datos
orientados hacia reas de
negocio, que contiene datos
histricos y que est preparado
para facilitar la toma de
decisiones.
Di!eren"ias
Base de Datos Operacional Data Warehouse
Datos Operacionales Datos del negocio para Informacin
Orientado a la aplicacin Orientado al sujeto
Actual Actual + histrico
Detallada Detallada + ms resumida
Cambia continuamente Estable
Entre las principales se tiene:
Orientado al tema
Integrado
Variante en el iempo
!o voltil
Cara"ter#sti"as
Orientado al Te$a
"na primera
caracter#stica del data
$arehouse es que la
informacin se clasifica
en %ase a los aspectos
que son de inter&s para
la empresa.
E'emplo: (ara un
fa%ricante pueden ser
cliente, vendedor y
producto.
Inte%rado
)a %ase de datos
contiene los datos de
todos los sistemas
operacionales de la
organi*acin, y dichos
datos de%en ser
consistentes.
&ariante en el Tie$'o
+omo la informacin en
el data $arehouse es
solicitada en cualquier
momento ,es decir, no
-ahora mismo-., los
datos encontrados en el
depsito se llaman
/variante en el tiempo-.
(o )oltil
)a informacin no se
modifica ni se elimina,
una ve* almacenado un
dato, &ste se convierte
en informacin de slo
lectura, y se mantiene
para futuras consultas.
A'li"a"iones
0
1istemas de 2ar3eting
0
4nlisis de 5iesgo
6inanciero
0
4nlisis de 5iesgo de
+r&dito
0
+ontrol de 7estin
0
)og#stica
0
5ecursos 8umanos
Alternati)as de Dise*o
9. +reacin de varios :atamarts independientes, uno
por cada dominio o fuente de informacin, y
definicin de una +apa "suario por cada uno de
estos :atamarts.
;. +reacin de un <nico :ata$arehouse que englo%e
todos los datos, del que se e=traigan diferentes
:atamarts, uno por cada dominio o fuente de
informacin y definicin de una +apa "suario por
cada :atamart.
>. +reacin de un <nico :ata$arehouse con
definicin de una <nica +apa "suario.
?. +reacin de un <nico :ata$arehouse con
definicin de varias +apas "suario.
Herra$ientas Utili+adas
0
8erramientas para
la inteligencia empresarial.
0
8erramientas para e=traer,
transformar y cargar datos en
el almac&n de datos.
0
8erramientas para gestionar
y recuperar los metadatos.
Data$inin% ,Miner#a de Datos-
Es el con'unto de t&cnicas y tecnolog#as que
permiten e=plorar grandes %ases de datos,
de manera automtica o semiautomtica,
con el o%'etivo de encontrar patrones
repetitivos, tendencias o reglas que e=pliquen
el comportamiento de los datos en un
determinado conte=to. 8ace uso de prcticas
estad#sticas y, en algunos casos, de
algoritmos de %<squeda pr=imos a la
Inteligencia 4rtificial y a las redes
neuronales.
.ase de Datos Mltidi$ensionales
1e utili*an principalmente para crear aplicaciones O)4( y
pueden verse como %ases de datos de una sola ta%la, su
peculiaridad es que por cada dimensin tienen un campo ,o
columna., y otro campo por cada m&trica o hecho, es decir
estas ta%las almacenan registros cuyos campos son de la
forma:
,d
9
,d
;
,d
>
,...,f
9
,f
;
,f
>
,....
:onde los campos @d
i
' hacen referencia a las dimensiones de la
ta%la, y los campos @f
i
' a las m&tricas o hechos que se quiere
almacenar, estudiar o anali*ar.
Metadatos
"no de los componentes ms importantes
de la arquitectura de un almac&n de datos
son los metadatos. 1e define com<nmente
como -datos acerca de los datos-, en el
sentido de que se trata de datos que
descri%en cul es la estructura de los datos
que se van a almacenar y cmo se
relacionan.
El 2etadato documenta, entre otras cosas,
qu& ta%las e=isten en una %ase de datos,
qu& columnas posee cada una de las ta%las
y qu& tipo de datos se pueden almacenar.
Pro"esos de Constr""i/n
E) ,E=traccin, ransformacin y +arga..
Extraccin: O%tencin de informacin de
las distintas fuentes tanto internas como
e=ternas.
Transformacin: 6iltrado, limpie*a,
depuracin, homogenei*acin y agrupacin
de la informacin.
Carga: Organi*acin y actuali*acin de los
datos y los metadatos en la %ase de datos.
T"ni"as de E0'lota"i/n
)a e=plotacin del :ata Aarehouse mediante informacin de
gestin, se fundamenta %sicamente en los niveles agrupados
o calculados de informacin.
C a r % a d e . a s e d e d a t o s
E 0 t r a " " i / n 1 D e ' r a " i / n 1 F i l t r o 1 E l a b o r a " i / n
2losario
Data Warehouse: Es un repositorio estructurado, a nivel
Empresa, de datos orientados hacia reas de negocio, que
contiene datos histricos y que est preparado para facilitar la
toma de decisiones.
B Datamart: Es una %ase de datos orientada a un tema
espec#fico. En otras pala%ras es un su%con'unto del :ata
Aarehouse +orporativo.
B Capa Usuario: Es una vista usuario de la %ase de datos que
permite su aislamiento respecto de la comple'idad f#sica de la
misma. !o incluye ning<n dato f#sico. Es una agrupacin lgica
de los datos adaptada a los conocimientos y filosof#a del
"suario
OLA: ecnolog#a que permite la e=plotacin de datos en
diferentes niveles organi*acionales y periodos de tiempo.
2RACIAS POR SU
ATE(CIO(

You might also like