You are on page 1of 84

INE 5643 Data Warehouse Modelagem Dimensional

AULA 4 Prof. Jos Leomar Todesco, Dr.

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

1/84

TPICOS
O Modelo Dimensional Etapas para Construo Tcnicas Bsicas Tcnicas Avanadas A Arquitetura BUS

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

2/84

Modelagem Dimensional

Projeto e Arquitetura Tcnica


Definio dos Requisitos de Negcio

Instalao e Seleo de Produtos

Planejamento do Projeto

Modelagem Dimensional

Projeto Fsico

Desenvolvimento e Projeto da rea de Transio

Implantao e Manuteno

Especificao da Aplicao do Usurio Final

Desenvolvimento da Aplicao do Usurio Final

Administrao do Projeto
INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

3/84

Projeto de Banco de Dados

Sistemas Operacionais

OLTP - On-Line Transaction Processing => Modelagem Entidade Relacionamento

Sistemas Informacionais

OLAP - On-Line Analytic Processing => Modelagem Dimensional


INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

4/84

Modelagem Entidade Relacionamento


Surgimento na dcada de 80 para melhorar

os projetos de sistemas em bancos de dados relacionais;


nfase na eliminao da redundncia de dados,

atravs da identificao de entidades e relacionamentos e aplicao da normalizao dos dados;


Busca visualizar o relacionamento microscpico

entre os elementos de dados.


INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

5/84

Exemplo de MER

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

6/84

Problemas na MER

O MER muito simtrico - todas as tabelas

parecem iguais;
Inmeras tabelas, relacionamentos, uma teia de

junes entre as tabelas;


Baixa performance em consultas, e dificuldade para

os mecanismos de otimizao dos SGBDs para montar o melhor plano de acesso.


INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

7/84

Problemas na MER

Cenrio tpico:

Hardware e software carssimos executando menos de 50 consultas por dia; Depto de informtica em perodo integral escrevendo cdigos SQL; Consultas simples que exigem uma ou duas pginas de SQL; Usurios infelizes atacando o depto de informtica; CIO pressionado pela alta gerncia devido s constantes reclamaes.
INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

8/84

Problemas na MER

Concluso: Modelos ER so um desastre para consultas porque no podem ser entendidos pelo usurio nem navegados de forma til pelo SGBD. No podem ser utilizados para um DW (Kimball).

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

9/84

Modelagem Dimensional

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

10/84

Modelagem Dimensional
Tcnica de projeto lgico que busca apresentar os

dados em uma estrutura padronizada mais intuitiva e permite alto desempenho de acesso;
Evita-se a utilizao da tcnica de normalizao; Especfica para suportar processamento analtico -

OLAP;
Cada modelo dimensional composto de uma tabela

com mltiplas chaves, chamada de tabela de fatos e um conjunto de outras tabelas chamadas dimenses.
INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

11/84

Modelagem Dimensional
As tabelas de fatos armazenam grande quantidade

de dados e contm medies numricas do negcio;


As dimenses so menores e armazenam dados

descritivos do negcio;
Cada dimenso tem uma chave primria que

corresponde a uma das chaves na tabela de fatos;


Viso de um hipercubo com n dimenses; Estrutura freqentemente chamada esquema estrela.
INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

12/84

Modelagem Dimensional

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

13/84

Idia Fundamental do Modelo Dimensional

Todo tipo de negcio pode ser representado por um tipo de cubo de dados, onde as clulas do cubo contm valores e as arestas do cubo definem as dimenses do dado;

possvel representar muitas dimenses.

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

14/84

Modelagem Dimensional

Geralmente, os modelos dimensionais contm entre

4 e 15 dimenses;
Modelos com mais de 20 dimenses do a

impresso de que h dimenses sobrando, isto , que poderiam ser combinadas a outras dimenses e eliminadas.
INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

15/84

Fato

Representa a essncia dos dados em um processo ou negcio; Medio numrica do negcio obtida da interseco de todas as dimenses; Continuamente valorado; Aditivo; Exemplos: Vendas em Reais;
INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

Unidades Vendidas.
16/84

Dimenso

Armazena dados descritivos do negcio; Usado como fonte de restrio (filtro de seleo); Usado como cabealho de um relatrio; Geralmente constante; Exemplos: Produto; Marca; Loja.
INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

17/84

Tabelas Fatos e Dimenses de um Supermercado

DIMENSO TEMPO CHAVE_TEMPO DIA_SEMANA MS TRIMESTRE ANO FERIADO

FATO VENDAS CHAVE_TEMPO CHAVE_PRODUTO CHAVE_LOJA TOTAL_VENDA TOTAL_UNIDADES TOTAL_CUSTO

DIMENSO PRODUTO CHAVE_PRODUTO DESCRIO MARCA CATEGORIA

DIMENSO LOJA CHAVE_LOJA NOME_LOJA ENDEREO_LOJA PLANTA_LOJA


INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

18/84

Exemplo de uma Consulta


Marca Axon Framis Widged Zapper Comandos SQL: Select p.marca, sum(f.total_venda), sum(f.total_unidades) *cabealho From fato_vendas f , produto p , tempo t * tabelas Where t.feriado = Carnaval * restrio de dimenso and f.chave_produto = p.chave_produto * restrio join and f.chave_tempo = t.chave_tempo * restrio join Group by p.marca * instruo group by Order by p.marca * instruo order by
INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

Vendas R$ 780 1044 213 95

Unidades Vendidas 263 509 444 39

19/84

Dimenso TEMPO chave_tempo data dia_da_semana semana_numero ms

Fato VENDAS chave_tempo chave_produto chave_mercado total_venda unidades custo

Dimenso PRODUTO chave_produto SKU descrio marca categoria tipo_embalagem tamanho sabor

Dimenso LOJA chave_mercado nome_mercado distrito regio endereo

Distrito
Atherton Atherton Gelmont

Marca
Clean fast More power Clean fast

Total Dollars Custo Total Lucro Bruto


$ 1,233 $ 2,239 $ 2,097 $ 1,058 $ 2,200 $ 1,848 $ 175 $ 39 $ 249

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

20/84

Hierarquia marketing Hierarquia Finanas Outros atributos no relacionados a nenhuma hierarquia

Dimenso Produto chave_produto SKU descrio marketing_marca marketing_categoria finanas_marca finanas_categoria tipo_embalagem tamanho sabor

Fato Qualquer chave_produto

Pode ser interessante escolher atributos para atender a rea de Marketing e ao mesmo tempo a rea Financeira da empresa. Geralmente estas duas reas trabalham com hierarquias diferentes de produto.
INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

21/84

ETAPAS PARA CONSTRUO

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

22/84

Modelagem Dimensional: Passos do Projeto


1 Passo: Decidir qual(is) processo(s) do negcio devemos modelar, por meio da combinao do conhecimento do negcio com o conhecimento dos dados que esto disponveis; 2 Passo: Definir o gro do processo do negcio. O gro o nvel fundamental atmico de dados que representar o processo na tabela de fatos. Gros tpicos so transaes individuais, instantneos individuais dirios ou instantneos mensais;
INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

23/84

Modelagem Dimensional: Passos do Projeto


3 Passo: Escolher as dimenses que sero aplicadas a cada registro da tabela de fatos. Para cada dimenso escolhida, descrever todos os diferentes atributos de dimenso (campos) que preencham cada tabela dimensional; 4 Passo: Escolher os fatos mensurveis que iro popular cada registro da tabela de fatos. Fatos mensurveis so quantidades numricas aditivas como quantidade vendida e vendas (em espcie).
INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

24/84

Viso Geral da Metodologia

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

25/84

Exemplo: O Supermercado

Rede de supermercados composta de 500 lojas localizadas em vrios estados. Cada loja composta de vrios deptos que movimentam mais de 60 mil produtos diferentes. As principais preocupaes da administrao ficam por conta da compra, venda e lucro. O lucro resulta de cobrar o mximo possvel, reduzir custos e atrair clientes. As promoes constituem uma grande arma para o aumento das vendas.
INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

26/84

Supermercado: Definindo o Negcio

1 Passo: qual(is) processo(s) do negcio devemos modelar. Opo: movimento dirio de item. Permite acompanhar quais produtos esto sendo vendidos em que lojas, a que preo e em que dias.

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

27/84

Supermercado: Definindo o Gro

2 Passo: decidir sobre o gro do processo do negcio. Opes: 1 - A nvel de cupom fiscal; 2 - Pela identidade do cliente; 3 - Movimento mensal ou semanal dos itens; 4 - Movimento dirio dos itens por loja.

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

28/84

Granularidade

o nvel de detalhe de um banco de dados dimensional; Quanto maior o nvel de detalhe, menor a granularidade; Reflete diretamente no tamanho do banco de dados; Um dos pontos mais importantes no projeto de um DW.
INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

29/84

Granularidade
Granularidade Alta:

Economia de espao em disco; Reduo na capacidade de atender consultas.

Granularidade Baixa:

Grande quantidade de espao em disco; Aumento na capacidade de responder qualquer questo.


INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

30/84

Supermercado: Definindo as Dimenses


3 Passo: escolha das dimenses

Na escolha do gro da tabela de fatos algumas dimenses primrias surgem naturalmente; Verificar quais dimenses podem ser relacionadas ao gro sem gerar valores duplicados; Verificar se a todas as dimenses atendem ao detalhe quantificado na tabela de fatos.
INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

31/84

Supermercado: Definindo as Dimenses


DIMENSO TEMPO DIMENSO PRODUTO

FATO VENDAS

DIMENSO LOJA
INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

32/84

Supermercado: Definindo os Fatos


4 Passo: escolha dos fatos

Total de vendas Unidades Vendidas Total do Custo Total de Clientes Outros ...

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

33/84

Supermercado: Definindo os Fatos

FATO VENDAS CHAVE_TEMPO CHAVE_PRODUTO CHAVE_LOJA TOTAL_VENDA TOTAL_UNIDADES TOTAL_CUSTO TOTAL_CLIENTES


INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

DIMENSO TEMPO

DIMENSO PRODUTO

DIMENSO LOJA
34/84

Fatos Aditivos, Semi Aditivos e No Aditivos

Aditivos: faz sentido adicion-los continuamente e sobre todas as dimenses (Ex: vendas em US$ e vendas em unidades); Semi Aditivos: so adicionados em um dado perodo de tempo (Ex: nveis de estoque, contas de balano e saldo bancrio). Estes fatos so instantneos de tempo; No Aditivos : no podem ser adicionados, apenas contados ou adicionados a somente uma dimenso por vez (Ex: temperatura e condio do tempo).
INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

35/84

Normalizao
Tabelas de Fatos:

So compactas nas chaves e nos dados; No h meios para normalizar ainda mais os extremamente complexos relacionamentos muitos-para-muitos; A tabela de fatos uma estrutura dimensional de natureza altamente normalizada;
INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

36/84

Normalizao
Tabelas de Dimenso:

Normalizar uma das tabelas de dimenso em um banco de dados dimensional para ganhar espao em disco uma perda de tempo; O espao livre em disco obtido por meio da normalizao de tabelas de dimenso representa normalmente menos de 1% do espao total necessrio para a estrutura como um todo; As tabelas de dimenso normalizadas destroem a capacidade de pesquisar.
INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

37/84

Supermercado: Detalhando as Dimenses Dimenso Tempo:

Aparece em praticamente todos os DW por envolver uma srie temporal;

Geralmente definida como a primeira dimenso na ordem do banco de dados; Muitos desenvolvedores questionam a necessidade de criar uma tabela de dimenso especfica para tempo.

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

38/84

Dimenso Tempo

DIMENSO TEMPO CHAVE_TEMPO DIA_SEMANA MS TRIMESTRE ANO FERIADO PERODO_FISCAL TEMPORADA EVENTO FINAL_SEMANA FIM_DO_MES ... FATO VENDAS
CHAVE_TEMPO CHAVE_PRODUTO CHAVE_LOJA TOTAL_VENDA TOTAL_UNIDADES TOTAL_CUSTO

DIMENSO PRODUTO

DIMENSO LOJA

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

39/84

Supermercado: Detalhando as Dimenses Dimenso Produto:

Existncia de atributos nicos (cdigo do produto) e de atributos repetitivos (categoria, depto, etc); Existncia de uma ou mais hierarquias e de atributos no-integrantes das hierarquias: Departamento Categoria Subcategoria Marca Tipo Embalagem Tamanho embalagem Unidades Largura
40/84

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

Dimenso Produto
DIMENSO PRODUTO FATO VENDAS
CHAVE_TEMPO CHAVE_PRODUTO CHAVE_LOJA TOTAL_VENDA TOTAL_UNIDADES TOTAL_CUSTO

DIMENSO TEMPO
CHAVE_TEMPO DIA_SEMANA MS TRIMESTRE ANO FERIADO PERODO_FISCAL TEMPORADA EVENTO FINAL_SEMANA FIM_DO_MES ...

CHAVE_PRODUTO DESCRIO NUMERO_ID DEPARTAMENTO CATEGORIA SUBCATEGORIA MARCA TAMANHO_EMB TIPO_EMB PESO ...

DIMENSO LOJA
INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

41/84

Supermercado: Detalhando as Dimenses Dimenso Loja:

Trata-se de uma dimenso geogrfica, podendo ser considerada como um ponto no espao. Por esse motivo a hierarquia dessa dimenso pode ascender para qualquer elemento geogrfico; Por se representar uma localizao geogrfica, automaticamente encontram-se hierarquias mltiplas para navegao.
INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

42/84

Dimenso Loja
DIMENSO TEMPO
CHAVE_TEMPO DIA_SEMANA MS TRIMESTRE ANO FERIADO PERODO_FISCAL TEMPORADA EVENTO FINAL_SEMANA FIM_DO_MES ...

FATO VENDAS
CHAVE_TEMPO CHAVE_PRODUTO CHAVE_LOJA TOTAL_VENDA TOTAL_UNIDADES TOTAL_CUSTO

DIMENSO LOJA CHAVE_LOJA NOME_LOJA NUMERO_LOJA ENDERECO CIDADE ESTADO CEP REGIAO GERENTE MT2_MERCEARIA MT2_ACOUGUE...

DIMENSO PRODUTO
CHAVE_PRODUTO DESCRIO NUMERO_ID DEPARTAMENTO CATEGORIA SUBCATEGORIA MARCA TAMANHO_EMB TIPO_EMB PESO

...
INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

43/84

Disposio dos Dados


Dimenso Produto
Chave Produto 1 2 Descrio Guaran Soda ID Produto 900087 900088 Chave Tempo 100 101 Chave Loja 10 20 10 20 Departamento Bebidas Bebidas Dia Ms 01 02 05 05 Ano 2001 2001 Total Unidades 2.000 1.500 1.000 1.500
44/84

Subcategoria Refrigerante Refrigerante Feriado Dia do Trabalho

Dimenso Loja
Chave Nome Loja Cidade Loja 10 20 Beira Mar Coqueiros Florianpolis Florianpolis

Dimenso Tempo

Fato Vendas
Chave Tempo 100 100 100 100 Chave Produto 1 1 2
INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

Total Vendas 2400,00 1800,00 1000,00 1500,00

Dimensionamento do BD
Dimenso Tempo: 2 anos x 365 dias = 730 dias. Dimenso Produto: 30.000 produtos sendo 3.000 vendidos todos os dias. Dimenso Loja: 300 lojas

Nmero de registros de fatos bsicos = 730 x 3.000 x 300 = 657 milhes de registros Nmero de campos = 3 chaves + 4 fatos = 7 Tamanho bsico da tabela de fatos = 657 milhes x 7 campos x 4 bytes = 18 GB
INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

45/84

TCNICAS BSICAS

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

46/84

Freqentemente dimenses grandes

DIMENSO PRODUTO COD_PRODUTO DESCRIO NUMERO_ID DEPARTAMENTO CATEGORIA SUBCATEGORIA MARCA TAMANHO_EMB TIPO_EMB PESO ...

como Produto e Cliente sofrem alteraes ao longo do tempo


Pergunta: Como tratar estas

modificaes ao longo do tempo?

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

47/84

Dimenses de Modificao Lenta

Tcnica 1 - Rescrever o registro da dimenso com novos valores.

DIMENSO PRODUTO COD_PRODUTO DESCRIO NUMERO_ID DEPARTAMENTO CATEGORIA SUBCATEGORIA MARCA TAMANHO_EMB TIPO_EMB PESO ...

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

48/84

Dimenses de Modificao Lenta

Tcnica 2 - Criar um registro


adicional na dimenso utilizando um novo valor, com uso de uma chave seqencial ou derivada da chave original do sistema operacional.

DIMENSO PRODUTO CHAVE_PRODUTO COD_PRODUTO DESCRIO NUMERO_ID DEPARTAMENTO CATEGORIA SUBCATEGORIA MARCA TAMANHO_EMB TIPO_EMB PESO ...
49/84

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

Dimenses de Modificao Lenta

Tcnica 3 - Criar um campo velho


no registro de dimenso para guardar o valor do atributo imediatamente anterior.

DIMENSO PRODUTO COD_PRODUTO DESCRIO NUMERO_ID DEPARTAMENTO CATEGORIA_VELHA CATEGORIA_NOVA SUBCATEGORIA MARCA TAMANHO_EMB TIPO_EMB PESO ...
50/84

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

Dimenses Grandes

DW que armazena muitos detalhes, muito granular, pode requerer dimenses extremamente grandes - nestes casos ter o cuidado de manter estas dimenses grandes sob controle; - no penalizar a consulta na tabela de fatos utilizando uma grande e cara dimenso; - escolher tecnologias de indexao que suportem rpidas pesquisas (browsing).
INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

51/84

Dimenses Grandes

DIMENSO DEMOGRAFIA CHAVE_DEMOGRAFIA FAIXA_ETARIA ESTADO_CIVIL SEXO

FATO VENDAS CHAVE_TEMPO CHAVE_DEMOGRAFIA CHAVE_CLIENTE TOTAL_VENDA TOTAL_UNIDADES TOTAL_CUSTO

DIMENSO CLIENTE CHAVE_CLIENTE PRIMEIRO_NOME SOBRENOME ENDERECO CIDADE ESTADO CEP . CHAVE_DEMOGRAFIA
52/84

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

Dimenses Descaracterizadas

Nmeros de controle de documentos,como nmeros de pedidos, nmeros de fatura e outros so representados como dimenses descaracterizadas (chaves de dimenso sem uma tabela de dimenso correspondente) em tabelas de fatos em que o gro da tabela o documento propriamente dito ou uma linha de item do documento.
INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

53/84

Dimenses Descaracterizadas FATO VENDAS CHAVE_TEMPO CHAVE_PRODUTO CHAVE_LOJA NRO_PEDIDO TOTAL_VENDA TOTAL_UNIDADES TOTAL_CUSTO TOTAL_CLIENTES DIMENSO TEMPO

DIMENSO PRODUTO

DIMENSO LOJA

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

54/84

Esquema Floco de Neve

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

55/84

Esquema Floco de Neve

Desdobra-se as tabelas de dimenses removendo alguns campos para tabelas separadas conectando as mesmas com a tabela original atravs de chaves artificiais;

Geralmente no recomendado num ambiente de DW;

O excesso de chaves baixa a eficincia da consulta.


INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

56/84

Esquema Floco de Neve

No compensa usar o snowflacking para reduzir espao em disco;

Os usurios se sentem intimidados por tanto detalhes; Existem, no entanto, algumas situaes em que pode ser necessria a criao de uma minidimenso com aparncia de Snowflacking (Ex: atributos demogrficos em dimenses grandes).
INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

57/84

TCNICAS AVANADAS

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

58/84

Esquema Estrela com Vrias Tabelas de Fatos Fatos

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

59/84

Tabela de Fato como Tabela Associativa em um Esquema Estrela

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

60/84

Esquema Estrela com Tabelas Externas

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

61/84

Viso da Estrutura Hierrquica

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

62/84

Viso da Estrutura Hierrquica

A estrutura hierrquica de um modelo pode ser resolvida com um ponteiro recursivo em cada registro da dimenso cliente;

Embora seja um modo compacto e efetivo para representar uma hierarquia, este tipo de estrutura de recursividade no pode ser usado efetivamente com o SQL padro.

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

63/84

Soluo 1: Dimenso Recursiva

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

64/84

Dimenso Recursiva A funo Group by no pode ser usada para seguir a estrutura recursiva da rvore de baixo para cima para resumir o fato aditivo, como o faturamento da organizao. Isto probe conectar uma tabela de dimenso recursiva para qualquer tabela de fato.

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

65/84

Soluo 2: Dimenso Hierrquica de Relacionamento

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

66/84

Dimenso Hierrquica de Relacionamento

Capaz de adicionar resumos inteiros de uma organizao, usando SQL padro GROUP BY atravs da lgica;

Capaz de sumarizar fatos das filiais de uma empresa, restringindo o campo nvel a 1, usando SQL padro; Capaz de achar o nvel superior como tambm o topo a partir de qualquer cliente na hierarquia da organizao, usando o SQL padro atravs da lgica.

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

67/84

Dimenso Hierrquica de Relacionamento

Manter o gro original da dimenso cliente, de forma que a chave da dimenso cliente quando desejado possa ser unida diretamente tabela de fatos, podendo-se evitar a criao de qualquer bridge table (tabela ponte) para navegar a hierarquia.
INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

68/84

Dimenso Auditoria

Dimenso interessante para somar a uma tabela de fato pois a dimenso de auditoria registra os processos de cada registro da tabela de fato. A dimenso de auditoria construda durante o processo de extrao dos dados; So compactados em um nico registro de auditoria, as fases principais do processo que descrevem o ocorrido durante o processamento.
INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

69/84

Dimenso Auditoria

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

70/84

A ARQUITETURA BUS

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

71/84

Agrupando os Modelos Dimensionais: Arquitetura BUS

Como planejar a construo do DW? De forma monoltica; De forma separada por assuntos;

O mais adequado um sistema passo a passo para criar o DW completo; Uma alternativa criar o DW com a arquitetura BUS (barramento).
INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

72/84

A Crise no Planejamento
Um DW completo exige conhecimento de todos os dados legados;

Dever responder as questes mais importantes para o negcio;

A impossibilidade de construir rapidamente um DW completo deu oportunidade ao Data Mart (DM) onde uma rea especfica do negcio enfocada.
INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

73/84

A Crise no Planejamento

Se muitos Data Marts forem construdos independentes no vo representar um Data Warehouse;

Podem mostrar diferentes resultados e no consistentes para a organizao;

Relatrios de diferentes DM no podem ser comparados entre si.


INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

74/84

Data Marts e a Arquitetura BUS

Fazer um planejamento global do DW criando uma arquitetura de fundo que define o escopo e implementao;

Os padres especificados para o DW sero seguidos por todos que iro implementar os DM.
INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

75/84

Dimenses em Conformidade

Significa que uma dimenso aps definida pelos projetistas do DW sempre ser igual para qualquer tabelas de fatos em todos os DM;

Exemplos de dimenses: clientes, produtos, localizao, promoo, calendrio;

Equipe central estabelece, publica e mantm as dimenses conformadas.


INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

76/84

Dimenses em Conformidade

Uma nica tabela dimensional poder ser usada para mltiplas tabelas de fatos em um mesmo banco de dados;

Interface com usurios e contedo dos dados sero consistentes sempre que a dimenso for usada;

A interpretao dos atributos ser consistente entre os DM.


INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

77/84

Projetando as Dimenses em Conformidade

A maioria das dimenses conformadas sero definidas no maior nvel de granularidade possvel (atmica); Para a dimenso Clientes dever ser o cliente individual; Deve-se definir uma chave que no seja a chave original do sistema legado. feito em paralelo com a definio das dimenses; Definimos tabelas de fatos conformados quando usamos a mesma terminologia entre diferentes DM e quando criamos relatrios nicos, navegando diversos DM.
INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

78/84

Importncia da Granularidade

As dimenses conformadas so usualmente de Granularidade atmica pois cada linha da tabela corresponde a uma simples descrio de cliente, produto, dia, etc.;

A tabela de fatos dever ter o mesmo nvel das tabelas dimensionais.

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

79/84

Importncia da Granularidade

Uma tabela de fatos granular pode ser facilmente estendida, pela adio de novos fatos, novos atributos na dimenso ou adio de nova dimenso completa;

Mantm consultas e aplicaes antigas sem drop and reload;

Importante para Data Mining.


INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

80/84

Data Marts de Fontes Mltiplas

A recomendao comear com um DM para cada fonte de informao. Assim, para um sistema de vendas, teramos um DM de vendas;

Um DM eficiente de uma nica fonte vai fornecer informaes interessantes e em quantidade suficiente ao usurio para deix-lo feliz e quieto enquanto a equipe pode evoluir a aplicao.
INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

81/84

Quando no Necessrio Dimenses Conformadas

Quando se tem diferentes linhas de negcios onde no esto relacionados clientes de um negcio com produtos do outro negcio;

Diferentes subsidirias, uma com servios, outra industrial e mais uma financeira;

Cada uma dever ter seu prprio contexto de DM.


INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

82/84

INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

83/84

Referncias Bibliogrficas
Inmon, William H. Como Construir o Data Warehouse, 1997. Kimball, R.; Reeves, L.; Ross, M. & Thornthwaite, W. The Data Warehouse Lifecycle Toolkit: expert methods for designing, developing, and deploying data warehouses, 1998. Kimball, Ralph.Data Warehouse Tollkit, 1998. Pereira, Walter. Data Warehouse - Trabalho Individual II, http://www.inf.pucrs.br/~wpereira,1999. Poe, Vidette; Klauer, Patricia & Brobst, Stephen, Building a Data Warehouse for Decision Support, 1998.
INE 5643 - Data Warehouse Copyright 2003 Jos Leomar Todesco

84/84

You might also like