You are on page 1of 13

IV SEMEAD

OS METADADOS NO AMBIENTE DE
DATA WAREHOUSE
Gilberto de Come1

RESUMO
O desenvolvimento da tecnologia da informao tem permitido s
empresas manipularem um grande volume de dados e atingirem um alto
ndice de globalizao, com o uso de redes que viabilizam operaes a
nvel mundial. Em vez de vantagem, esse dados tornam-se um problema
quando esto espalhados e exigem um grande esforo na tentativa de
integr-los para que possam gerar informaes consolidadas que sirvam
de base para a tomada de deciso. Nos ltimos anos a tecnologia de
Data Warehouse vem oferecendo s organizaes, uma maneira flexvel
e eficiente de obter as informaes necessrias nos processos decisrios, e se caracteriza como uma funo de apoio para suporte deciso.
Porm, antes do Data Warehouse ser acessado eficientemente, necessrio saber, pelo menos, quais os dados que esto disponveis e onde
eles esto localizados, caso contrrio ser como tentar encontrar um
telefone sem o auxlio de uma lista telefnica. De forma simples podemos dizer que o significado dos dados est nos METADADOS. Os
metadados permitiro ao usurio transformar os dados "crus" em informaes que gerem conhecimento e tragam vantagem competitiva.

Mestrando em Administrao pela Faculdade de Economia, Administrao e


Contabilidade da Universidade de So Paulo. Ps-Graduado em Sistemas de
Informao pela Fundao Santo Andr (latu sensu). Bacharel em Matemtica
(Processamento de Dados) pela Fundao Santo Andr. E-mail:
gilcome@usp.br.

Outubro de 1999

O desenvolvimento da tecnologia da informao tem permitido s empresas manipularem um grande


volume de dados e atingirem um alto ndice de globalizao, com o uso de redes, viabilizando operaes em
nvel mundial. A todo instante, dados sobre os mais variados aspectos dos negcios da empresa so gerados
e armazenados, e passam a fazer parte dos recursos de informao da empresa. A princpio podemos encarar isso como um ponto a favor da empresa, mas que na verdade pode constituir um problema quando esses
dados encontram-se espalhados em diversos sistemas, e exigem um esforo grande na tentativa de integrlos para que possam ter alguma utilidade.
Na tentativa de tratar o problema, as empresas tm implantado diversos sistemas de Suporte Deciso
(DSS2) para conseguir informaes atravs de seus dados. Basicamente, o suporte deciso consiste no
processo de juntar, estruturar, manipular, armazenar, acessar, apresentar e distribuir informaes de
negcios de maneira oportuna. Nos ltimos anos a tecnologia de Data Warehouse vem oferecendo s
organizaes uma maneira flexvel e eficiente de obter informaes necessrias nos processos decisrios e
se caracteriza como uma funo de apoio para suporte deciso.
Segundo Kimball [KIMB96] Data Warehouse " o lugar onde as pessoas podem acessar seus dados". J
Wang [WANG98] tem uma definio um pouco mais completa quando diz que Data Warehouse " o processo pelo qual dados relacionados de vrios sistemas operacionais so fundidos para proporcionar uma
nica e integrada viso de informao de negcios que abrange todas as divises da empresa". Sua necessidade poderia ser percebida pelas conversas dos gerentes de grandes companhias. Em geral as declaraes
dos gerentes seriam como estas [KIMB96]:

"ns temos montanhas de dados nessa companhia mas no podemos acess-los"

"nada enlouquece mais um gerente que ter duas pessoas apresentando um mesmo resultado de
negcios com nmeros diferentes"

"ns queremos separar e analisar dados por diversas perspectivas"

"mostre-me apenas o que importante"

"todos sabem que alguns dados no so muitos bons"

Estas situaes so bastantes comuns e podem direcionar as necessidades bsicas para um Data
Warehouse. Pode-se analisar estes problemas como oportunidades declarando-as como requerimentos.
Normalmente os sistemas de informao das empresas esto literalmente "distribudos", o que dificulta o
entendimento da corporao como um todo. A maioria dos sistemas so instalados com uma viso local e
seu principal propsito resolver um problema singular e isolado, tal como finanas, vendas, engenharia,
manufatura, etc. Embora no necessariamente incorreta, esta abordagem comea a apresentar problema
quando uma viso cruzada necessria para o entendimento da dinmica da situao. A integrao desses
dados dispersos um dos desafios do Data Warehouse (Figura 1).

Decision Support System.


2

FIGURA 1 Um dos desafios de um Data Warehouse: Integrar dados

A simples integrao ainda no suficiente, pois aps a coleta, os dados devem ser analisados para determinar sua significncia. Falhas na implementao de sistemas e mtodos para anlise desses dados colocaro a empresa em "desvantagem" competitiva no mercado. Quanto mais os dados se tornam disponveis,
mais complexo se torna o processo de localizar e extrair informaes realmente importantes.
Singh [SING97] nos relata um breve fato que serve para ilustrar a necessidade de informaes confiveis no ambiente organizacional: "ao final de uma palestra, o executivo encontra um grande guru da administrao e pergunta: 'Oh guru, como eu posso garantir o sucesso para minha empresa?' O guru responde:
'Informao'. Ento o executivo faz outra pergunta: 'Oh guru, e o qu eu mais devo temer?' O guru responde: 'Dados'".
Podemos notar que os dados merecem uma ateno especial; mas o que seriam esses dados? Isoladamente os dados no significam muita coisa, pois o que interessa realmente a informao. Dessa forma
necessrio fazer uma distino entre dados e informao. Conforme Tronchin [TRON98] dados so os
componentes bsicos a partir dos quais a informao criada. Informao so dados inseridos em um contexto. Contexto a situao que est sendo analisada. A partir da informao vem o conhecimento, que
permite tomar decises adequadas, trazendo vantagem competitiva.
A figura 2 mostra o esquema bsico de um ambiente de Data Warehouse, onde temos os sistemas
legados que so acessados normalmente pelos usurios da empresa e que tambm servem de fonte de dados
para o Data Warehouse. Neste ambiente as informaes podem ser acessadas de forma simples (transao)
pelos sistemas legados ou de forma analtica pelo Data Warehouse.

FIGURA 2 O Ambiente de Data Warehouse

O Data Warehouse no simplesmente um produto, mas uma estratgia que reconhece a necessidade de
consolidar os dados armazenados em sistemas de informaes dedicados a ajudar profissionais de negcios
a tomarem decises mais rpidas e efetivas. Esta estratgia tem como objetivo principal melhorar a
performance da empresa. Quando o Data Warehouse implementado corretamente ele pode fornecer aos
seus usurios a informao que eles precisam para entender seus negcios e tomar decises buscando vantagem competitiva [SING97].
Bill Inmon [INMO97], um dos pais do Data Warehouse, prope uma definio um pouco mais tcnica,
mas que no deixa de ser interessante para uma fundamentao do tema: " um conjunto de dados orientado por assuntos, integrado, variante no tempo, e no voltil, que tem por objetivo dar suporte aos processos de tomada de deciso."
Desenvolvendo um pouco mais os termos apresentados nesta definio ns temos: Orientado por assuntos: contm informaes sobre temas especficos importantes para o negcio da empresa. Integrado:
contm dados em estado uniforme, ou seja, existe uma consistncia entre nomes, unidades das variveis,
etc. Variante no tempo: contm dados no-atualizveis que se referem a algum momento especfico. Novoltil: permite apenas a carga inicial dos dados e consultas a estes dados.
De qualquer forma, para obter as informaes, os usurios precisam entender que dados esto no Data
Warehouse e onde esses dados esto localizados, e a forma de se obter isso atravs dos "Metadados".

O que so Metadados?
De forma simples e direta, Singh [SING97] diz que os metadados so o principal componente do Data
Warehouse. A definio mais comum que se encontra na literatura sobre metadados que eles representam
"dados sobre dados". De uma forma um pouco mais completa podemos dizer que o metadado a "descrio
do dado, do ambiente onde ele reside, como ele manipulado e para onde distribudo". Uma outra forma,
mais concisa e direta, definir metadado como "documentao" [TRON98].
Metadado uma abstrao do dado. o dado de alto nvel que descreve o dado de baixo nvel. Metadado o instrumento que transforma dado "cru" em conhecimento. Pode ser til pensar em metadado como
4

uma "pina" com que se pode tratar o dado cru. Por exemplo, o metadado, na forma de definio de
campo, que informa que uma dada cadeia de bits um endereo de cliente, parte de uma imagem fotogrfica ou parte do cdigo de um programa de computador.
Como normalmente as aplicaes de mbito operacional da empresa so desenvolvidas em tempos diferentes por pessoas diferentes, no raro o surgimento de dados inconsistentes ou redundantes. Alm disso,
as organizaes costumam apresentar um outro problema comum: elas tm mltiplas fontes de dados. Cada
uma dessas fontes tem seu prprio conjunto de regras pr-definidas, convenes para nomes, e formatos de
arquivos, etc. Neste caso, praticamente impossvel para o usurio, e mesmo para o administrador, saber
que fonte de dados usar, em diferentes circunstncias.

A Importncia dos Metadados


Hurwitz [HURW96] destaca a importncia dos metadados dizendo que "quando voc est iniciando um
projeto de Data Warehouse, deve comear com os metadados". O papel dos metadados est ampliando o
modo como as organizaes desenvolvem uma estratgia de Data Warehousing3 que pode resultar na criao de arquivos de dados operacionais, Data Warehouses integrados e mltiplos Data Marts4. Os metadados devem isolar o usurio da complexidade de acessar informaes distribudas, enquanto facilita a atualizao e sincronizao de vrios bancos de dados. Se isso no funcionar, os usurios voltaro a se encontrar
com os problemas que o Data Warehouse pretendia resolver, ou seja, diferentes respostas para a mesma
questo e a resultante falta de confiana na informao obtida.
Sem uma administrao de dados efetiva, um Data Warehouse no atingir o seu objetivo de integrao
dos dados. Nesse sentido o metadado constitui o principal recurso para a administrao de dados no Data
Warehouse e constitui um componente formal extremamente importante no processo de Data Warehousing.
Sem metadados, os dados no tm significado. Sem metadados, localizar informaes contidas em um
Data Warehouse torna-se uma tarefa muito difcil, semelhante a procurar o telefone de uma pessoa sem a
ajuda de uma lista telefnica. Sem metadados, usurios de negcios sero como turistas deixados em uma
nova cidade sem qualquer informao sobre essa cidade, e os administradores do Data Warehouse sero
como os administradores da cidade que no tm idia do tamanho dessa cidade e em que velocidade ela est
crescendo. Um Data Warehouse sem metadados adequados um armrio-arquivo cheio de papis, mas sem
pastas ou etiquetas.
Metadados, no s descrevem o contedo do Data Warehouse, como tambm, fornecem ao usurio
informaes teis para o julgamento da qualidade do contedo. Tambm pode descrever cada fato contido
no Warehouse, em termos de quando ele foi atualizado pela ltima vez, a fonte do fato e como ele gerado.
A falta de uma abordagem integrada para consolidar, gerenciar e manter os metadados atualizados pode
gerar muitos riscos para a credibilidade de um projeto de Data Warehouse: informaes incorretas, qualidade dos metadados, perda de produtividade, performance inconstante, dificuldade para atualizao e crescimento.
Segundo Sataya [SATA98], os metadados tero muito mais importncia com o casamento da tecnologia
Web e o Data Warehouse. Este casamento resultar em um browser de metadados que ser o nico ponto
de acesso para as informaes de negcio, estejam elas na Intranet, no sistema operacional ou no Data
Warehouse. Metadados se tornaro um componente crtico de qualquer arquitetura global.
Metadados faltantes ou no-confiveis levam a uma situao familiar onde um departamento diz ao diretor que os lucros da empresa esto crescendo 10%, enquanto um outro diz que baixaram 15%. Cada de-

Compreende a ampla variedade de solues e produtos voltados para o gerenciamento, organizao e explorao
da base de dados corporativa, assim como sistemas de apoio deciso.
Tipo de Data Warehouse departamental destinado a atender segmentos especficos de usurios.
5

partamento est usando suas prprias cifras, coletadas de acordo com seus prprios procedimentos e interpretadas pelas suas prprias aplicaes.
No difcil chegar a concluso que os metadados so importantes em um Data Warehouse. Mas existem algumas perguntas bsicas que tambm devem ser respondidas pelos metadados:

Que tabelas, atributos e chaves o Data Warehouse contm ?

Qual a origem de cada conjunto de dados ?

Que transformao lgica foi usada na carga do dado ?

Como o metadado tem mudado ao longo do tempo ?

Quais aliases5 existem e como eles se relacionam ?

Quais so as referncias-cruzadas entre termos tcnicos e de negcios ?

Com qual freqncia os dados so carregados ?

Qual o volume de dados existente ?

Tipo de Informao Considerada Metadado


Um repositrio de metadados uma ferramenta essencial no gerenciamento de um Data Warehouse, no
momento de converter dados em informaes para o negcio. Entre outras coisas, um repositrio de metadados bem construdo deve conter informaes sobre a origem do dado, regras de transformao, nomes e
aliases, formatos de dados etc. Ou seja, este "dicionrio" deve conter muito mais do que descrio sobre
colunas e tabelas, deve conter informao que adicione valor ao dado. Metadados so utilizados normalmente como um dicionrio de informaes e sendo assim, devem incluir, entre outras coisas:
Fonte dos dados Qualquer elemento de dado necessita que sua origem seja identificada, seja ela um sistema ou um processo. importante que a fonte do dado seja nica para que no haja confuso.
Destino dos dados To importante quanto saber a origem do dados saber o seu destino, principalmente
quando esse dado usado como fonte para outras operaes. Esta informao tambm deve ser nica.
Formato dos dados O formato dos dados incluem informaes do tipo: tamanho do campo e tipo do dado.
Nomes e aliases Cada dado deve ter um nome, que deve ser um nome tcnico ou relativo uma rea de
negcios. Os aliases podem ser usados em qualquer caso. Simplicidade, consistncia e reviso constante
so chaves para a criao e manuteno de nomes. Os aliases tornam o Data Warehouse muito mais amigvel e entendvel, principalmente para os usurios de negcios, por permitir, por exemplo, que uma
tabela seja chamada de "Produtos vendidos por filial" ao invs de PR-FIL. Tambm bastante til quando
diferentes departamentos desejam usar seus prprios nomes para identificar um mesmo dado.
Definies de negcios Estas definies so o corao dos metadados. necessrio que um entendimento
de cada elemento de dado seja suportado dentro de um contexto de negcio. Tambm importante garantir
5

Nome alternativo que normalmente mais fcil de memorizar.


6

a consistncia dessas informaes, para que os usurios possam encontrar rapidamente uma definio para
a informao que precisam. As definies devem ser objetivas e devem evitar referncias a outros
metadados, a fim de facilitar seu entendimento.
Regras de transformao Estas regras so consideradas as regras de negcio de uma forma codificada.
Cada regra deve estar ligada a um elemento de metadado. Se uma regra utilizada em mais de uma aplicao, deve-se garantir que o resultado seja o mesmo em todas essas aplicaes.
Atualizao dos dados Normalmente, o histrico das atualizaes mantido pelo prprio banco de dados,
mas ter um elemento de metadado que possa, por exemplo, identificar a ltima atualizao de um dado pode
ser muito til para usurios que querem determinar o estado de atualidade desse dado ou examinar a consistncia de uma dimenso tempo em um Data Warehouse.
Requisitos de teste Metadados o local certo para manter os critrios de julgamento de um dado ou validao de uma tabela por uma rotina de teste. Deve-se manter um padro para esses procedimentos de teste.
Indicadores de qualidade Pode haver a necessidade de indicadores para indicar a qualidade de um elemento de dado. A fonte do dado, a quantidade de processamento aplicado ele e muitos outros fatores podem afetar a qualidade do dado. O uso do dado tambm pode ser considerado para a criao de indicadores
de qualidade.
Processos automticos (triggers6) comum a existncia de procedimentos automticos que procuram
manter a consistncia do banco de dados durante as atualizaes. Esses triggers devem estar liberados para
a consulta de usurios e desenvolvedores, a fim de evitar a criao de uma situao que possa "disparar"
um processo fora do seu contexto normal de utilizao.
Gesto das informaes A gesto (stewardship7) est associada com propriedade e responsabilidade sobre os dados. Deve-se ter definida e acessvel a informao de quem responsvel pelos dados e pela entrada de metadados em um Data Warehouse.
Acesso e segurana Quanto maior o acesso s informaes em um Data Warehouse, maior deve ser o
cuidado com a segurana dessas informaes. Os metadados devem conter informaes suficientes para
identificao de quem pode ler, atualizar, excluir ou inserir informaes no banco de dados. Tambm deve
haver informaes sobre quem controla esses direitos de acesso.

Quais so as Fontes de Metadados?


Basicamente, existem duas grandes fontes de metadados: a formal e a informal. Estas fontes compreendem os metadados tcnicos e de negcios de uma organizao.
As fontes de metadados formais so aquelas que j foram discutidas e documentadas. Normalmente,
estes metadados so armazenados em ferramentas ou documentos que so mantidos, distribudos e
reconhecidos por toda a organizao. Estas fontes formais de metadados alimentam tantos os metadados
tcnicos como os de negcios.
Os metadados informais consistem do conhecimento corporativo, polticas e orientaes que no esto
em um formato padro. Este o tipo de informao que as pessoas "apenas sabem" e que faz parte do "co6
7

Disparador de eventos em programas de computador.


Conduo, superviso ou gerenciamento de alguma coisa.
7

nhecimento da empresa". Embora no seja formalmente documentado, este conhecimento to importante


quanto as fontes formais de metadados.
Freqentemente, os metadados informais fornecem algumas das informaes mais importantes j que
tendem a estar relacionados aos negcios. importante notar que, normalmente, muitos dos metadados de
negcios so informais. Para se atingir um resultado, necessrio que este metadado seja capturado, documentado, formalizado e refletido no Data Warehouse, transformando, dessa maneira, um metadado
informal em um metadado formal.
Como as empresas no so iguais, muito difcil especificar onde os metadados informais podem ser encontrados, mas de maneira geral as fontes poderiam ser: gesto dos dados, regras de negcios, definies de
negcios, transformaes e sumarizaes.

Ambiente Operacional x Ambiente de Data Warehouse


No ambiente operacional, metadado principalmente valioso para desenvolvedores de software e administradores de banco de dados. Bancos de dados operacionais s podem ser acessados por aplicaes que
contm a definio dos dados embutida nelas. Os usurios finais no necessitam saber como a informao
est armazenada no banco de dados. Eles simplesmente interagem com os formulrios e telas fornecidos
pela aplicao no seu dia-a-dia de trabalho.
No ambiente de suporte deciso (onde o Data Warehouse a base) a coisa bem diferente. Aqui, analistas de dados e executivos esto procurando por fatos teis e correlaes que eles reconhecero quando as
encontrarem. Aplicaes de rotina no tem validade para eles, pois necessitam obter informaes no meio
de vrios dados, e para fazer isso eles necessitam entender sua estrutura e significado. Passageiros de um
trem no precisam de um mapa, embora um itinerrio possa ser til. Entretanto para um motorista dirigindo
em uma estrada de um outro pas, para uma vila desconhecida, seria uma tarefa muito difcil chegar ao
destino sem mapas de grande e pequena escala.
Analisando de forma simples, os metadados nada mais so do que dados, mas como j foi visto anteriormente, os dados s significam alguma coisa quando so analisados dentro de um contexto. No contexto
do ambiente operacional, os metadados so colocados ao mesmo nvel de importncia de uma documentao e acabam sendo opcionais, ao passo que no contexto do ambiente de Data Warehouse a existncia dos
metadados obrigatria, pois eles fazem a ponte entre os dados "crus" e a aplicao de suporte deciso.
Normalmente, a primeira coisa que um usurio de Data Warehouse examina, ao planejar o modo de acesso
aos dados, so os metadados.

Os Metadados nas Fases de Data Warehousing


Como todo processo, o Data Warehousing possui algumas fases bsicas que necessitam de certas informaes (metadados) para serem conduzidas de maneira correta.
Na fase de captura de dados so necessrios metadados relativos s fontes de onde os dados so extrados, ou seja, a arquitetura dos sistemas, o dicionrio de dados, as regras de negcio, etc. Como os dados
sero integrados em uma prxima fase, informaes para a "limpeza" desses dados j podem ser geradas
nessa fase e conseqentemente os dados podem receber um tratamento inicial.
A partir da integrao de dados dispe-se de um novo esquema de dados, dicionrio de dados, regras de
negcio, regras de integridade, etc., que constituem a base principal de metadados do ambiente de Data
Warehouse. Para registrar a procedncia de cada dado, necessita-se de um metadado sobre o mapeamento
do novo dado at a sua origem. Durante a fase de integrao so gerados metadados sobre as transformaes realizadas e tambm sobre o prprio dado (converses de formato, etc.).

Na manipulao de dados, os metadados disponibilizados referem-se descrio dos dados do Data


Warehouse, informando seu significado. importante tambm gerar metadados com o histrico do que vem
ocorrendo com os dados. Outras informaes geradas nessa fase referem-se s funes de agregao e desagregao, por exemplo, visando auxiliar os usurios na apresentao dos dados.
O monitoramento dos processos muito importante para uma boa gerncia do Data Warehouse. Para
isso realizam-se consultas aos metadados que foram gerados nas fases anteriores. Com base em anlises de
como os dados esto sendo acessados, com que freqncia, etc., pode-se fazer um melhor ajuste do
ambiente com a possibilidade de criar novos ndices e excluir outros que passaram a ser desnecessrios.
Nesta fase, existem tambm a gerao de metadados para uso administrativo, como por exemplo, aqueles
que definem o acesso dos usurios aos dados.

Metadados Tcnicos x Metadados de Negcios


Existem dois tipos de metadados que podem estar no repositrio: tcnicos e de negcios.
Metadados tcnicos fornecem aos desenvolvedores e usurios tcnicos de sistemas de suporte deciso,
a confiana de que o dados est correto. Alm disso, metadados tcnicos so crticos para a manuteno e o
crescimento contnuos de um Data Warehouse. Sem metadados tcnicos, a tarefa de analisar e implementar
mudanas em um DSS significativamente mais difcil e consome mais tempo.
Os metadados de negcios so a ligao entre o Data Warehouse e os usurios de negcios. Esses dados
fornecem uma espcie de mapa aos usurios para que eles possam acessar os dados, tanto no Data
Warehouse como nos Data Marts. Os usurios de negcios so basicamente executivos ou analistas de negcios e com isso tendem a ser menos tcnicos, portanto, eles precisam ter o DSS definido para eles em
termos de negcios. Os metadados de negcios mostram em termos de negcios, que relatrios, queries8, e
dados esto no Data Warehouse, localizao dos dados, confiabilidade dos dados, contexto dos dados, regras de transformao que foram aplicadas e quais as origens desses dados.
Os projetos de Data Warehouse e Data Mart necessitam ter um repositrio de metadados como parte de
seus objetivos principais, desde o incio do projeto. Esse repositrio precisa ser construdo com uma tecnologia confivel e considerando os usurios de negcios. Alm disso, os metadados necessitam de
mecanismos para os usurios no-tcnicos poderem navegar e acessar as informaes no repositrio.
O repositrio de metadados ajuda significativamente o DSS a tornar as informaes em Data
Warehouse e Data Mart mais visveis, entendveis e acessveis aos usurios. Em resumo, um repositrio
pode viabilizar ou no um Data Warehouse.
A figura 3 mostra o esquema bsico de um repositrio de metadados com a distino entre os metadados
tcnicos e os metadados de negcios.

Consulta, pesquisa.
9

FIGURA 3 Repositrio de Metadados

Metadados para Diferentes Usurios


Da mesma forma que existe uma distino entre os tipos de metadados existentes em um repositrio,
tambm existente um distino entre os usurios que se utilizam desses metadados. Como podemos ver na
figura 3, existem basicamente 3 tipos de usurios que acessam os metadados conforme suas necessidades.
Os Metadados para Usurios de Negcios mostram onde os usurios de negcio podem encontrar as informaes, como elas podem ser acessadas, quanto tempo isso levar, e qual a qualidade esperada quando
elas forem obtidas. O usurio de negcio sem acesso aos metadados sente-se como um turista em uma nova
cidade sem um mapa de orientao, nesse caso os metadados atuam com um centro de informaes tursticas que daro informaes completas sobre como proceder para chegar aos vrios lugares de interesse.
Os Metadados para Administradores de Dados podem facilitar a tarefa dos administradores atravs de
uma viso especial dos metadados que inclui, entre outras coisas, perfis e medidas de crescimento. Estas informaes so importantes para que o administrador possa assegurar que os metadados estejam atualizados
e exatos. Pela figura 3 podemos observar que os administradores tm acesso tanto aos metadados tcnicos
como aos metadados de negcios.
Os Metadados para Usurios Tcnicos afetam a habilidade dos desenvolvedores e analistas para manter
e expandir Data Warehouses. Sem esses dados atualizados, eles no sero capazes de manter e expandir
esses Data Warehouses que podem se transformar em conflitantes ilhas de informao. O analista (desenvolvedor) comea entrevistando usurios para entender suas necessidades e os metadados mostraro ao
analista como e onde encontrar as informaes necessrias para suprir essas necessidades.

Em Busca de um Padro
Segundo LeBaron [LEBA97] os padres so normalmente ignorados em um projeto de Data Warehouse
porque :

"Ns no temos tempo para nos preocuparmos com bobagens burocrticas".

"Seguir os padres apenas nos trar atrasos".


10

"Eu no sabia que tinha qualquer padro".

"Por que eu tenho que seguir os padres se ningum segue ?"

"Aqueles padres podem ter servido para os velhos mainframes, mas no mundo cliente/servidor,
ns temos que ser flexveis e ento nos livrarmos das algemas daqueles velhos padres restritivos"

"Padres so vlidos para OLTP9, mas ns, certamente no precisamos deles para o Data
Warehouse".

Os padres minimizam os esforos que cada gerente de projeto deve exercer para criar seu prprio material de trabalho. Com padres, aumentam-se muito as chances de um projeto ter qualidade e sucesso. Aumenta tambm a confiana da gerncia na habilidade do gerente de projeto em entregar um produto com alta
qualidade em um ambiente controlado.
A padronizao no tem sua validade apenas no ambiente interno das empresas. Hurwitz [HURW97]
coloca que existe uma certa confuso no mercado pelo fato que cada vendedor suporta sua prpria verso
de ferramenta. Se existe, muito pequena a interoperabilidade entre as vrias ferramentas que podem ser
usadas para construir, popular, gerenciar e acessar um grande Data Warehouse. Como os metadados so
relativamente novos, as organizaes de tecnologia da informaes ainda no tm orientaes claras. Sem a
definio de um padro as empresas, muitas vezes, ficam muito dependentes dos fornecedores.
Em julho de 1995, seis vendedores de Data Warehouse Arbor Software, Business Objects, Cognos,
Evolutionary Technology International, Platinum Technology e Texas Instruments Software anunciaram
uma nova iniciativa para definir especificaes para acesso e troca de metadados entre diferentes tipos e
classes de ferramentas para gerenciamento de dados. Esse grupo de empresas recebeu o nome de "Metadata
Council".
Durante vrios encontros o conselho desenvolveu sua misso, esboou uma estrutura preliminar de metadados e formulou o conceito conhecido como "Metadata Coalition" que representa um grupo aberto a
vendedores e usurios finais que gostariam de participar na definio dos padres de metadados. O conselho
original agora atua como o comit dirigente para a Metadata Coalition, coordenando a definio dos padres e evoluo dos processos.
Em julho de 1996, o conselho anunciou o Metadata Interchange Specification (MDIS) para abordar assuntos referentes a troca, compartilhamento e gerenciamento de metadados. O MDIS consiste de componentes que representam um conjunto mnimo comum de elementos de metadados e os pontos mnimos de
integrao que devem ser incorporados em ferramentas de banco de dados para compatibilidade. O MDIS
tambm fornece padres para componentes opcionais que so relevantes apenas para uma classe particular
de ferramentas.
O desenvolvimento de uma definio e terminologia comuns envolve dois diferentes modelos de informao. O Metamodelo de Aplicao que descreve tabelas e objetos que contm os metadados para uma aplicao em particular, e o Metamodelo de Metadados que representa o conjuntos de objetos descritos pelo
MDIS. Para que o MDIS tenha sucesso necessrio que esses dois metamodelos sejam independentes.
Como os metadados so armazenados em diferentes meios e formatos, tais como tabelas relacionais, arquivos ASCII e repositrios customizados, a metodologia de acesso do MDIS deve ser bastante flexvel.
Isso requer uma estrutura (framework) que traduza um requisio de acesso de uma determinada ferramenta
para a sintaxe e formato do MDIS.

On-Line Transaction Processing processamento de transaes on-line que caracteriza o ambiente operacional.
11

CONCLUSES
Pelo que foi exposto, verificamos que o Data Warehouse a base para um sistema de suporte deciso,
tem grande importncia para as empresas que necessitam de informao para alcanar uma vantagem
competitiva no mercado, e que os metadados desempenham um papel fundamental nesse ambiente. A manuteno e a gerncia dos metadados no uma tarefa opcional e pode ser considerada to ou mais importante quanto a dos prprios dados.
Os metadados devem ser gerados em todos os passos de um processo de Data Warehousing, visando garantir as informaes necessrias a todos os usurios envolvidos, sejam eles administradores, usurios tcnicos ou usurios de negcios. So portanto um recurso chave durante todas as fases do ciclo de vida de um
Data Warehouse, desde a construo, passando pelo acesso dos usurios at a manuteno e atualizao
dos dados armazenados.
Quanto mais as aplicaes se integram (Intranet, Sistema Operacional, Data Warehouse, etc.) mais visvel se torna a necessidade dos metadados, em outras palavras, os metadados se tornaro mais crticos
quanto mais globalizada for a arquitetura dos dados.
Hurwitz [HURW97] acredita que no perodo de 1999 a 2002 haver um interesse muito grande em
capturar e reutilizar metadados em vrios sistemas e no apenas para o Data Warehouse. Como resultado
disso, um recurso de metadados nico (provavelmente um recurso virtual e distribudo) que suporte DSS,
OLTP, sistemas internos e sistemas externos se tornar uma necessidade crucial para o projeto, desenvolvimento e gerenciamento de sistemas em larga escala.

BIBLIOGRAFIA
CAMPOS, Maria Luiza, ROCHA FILHO, Arnaldo V. Data Warehouse disponvel em
http://tartaruga.nce.ufrj.br/dw/tutorial/inicio.htm
WHAT IS METADATA Data Warehousing Tool Bulletin, January 1996 disponvel em
http://www.computerwire.com/bulletinsuk/212e_1a6.htm
GARDNER, Stephen R., The Quest to Standardize Metadata BYTE Magazine, November1997
disponvel em http://www.byte.com/art/9711/sec4/art3.htm
HURWITZ, Judit, Preparing for the Warehouse DBMS Magazine, April 1996 disponvel em
http://www.dbmsmag.com/9604d04.html
HURWITZ, Judit, The Evolution of Metadata DBMS Magazine, July 1997 disponvel em
http://www.dbmsmag.com/9707d04.html
INMON, Willian H., Como construir o Data Warehouse - 2a ed. Rio de Janeiro: Campus, 1997
KIMBALL, Ralph, The Data Warehouse Toolkit: practical techniques for building Dimensional Data
Warehouse John Wiley & Sons, Inc. 1996.
LEBARON, Mike, ADELMAN, Sid, Meta Data Standards DM Reviews Magazine, December 1997
disponvel em
http://www.dmreview.com/issues/1997/dec/articles/dec97_36.htm
MARCO, David, Managing Meta Data DM Review Magazine, March 1998 disponvel em
http://www.dmreview.com/issues/1998/mar/articles/mar98_58.htm
SATAYA P. Sachdeva, Meta Data Architeture for Data Warehouse
DM Review Magazine, April 1998 disponvel em
http://www.dmreview.com/issues/1998/apr/articles/apr98_66.htm
SINGH Harry, Data Warehousing: Concepts, Technologies, Implementations, and Management Upper
Saddle River, NJ: Prentice Hall, 1997

12

TANLER, Richard & FROME, Jim, The expanding role of enterprise meta data DM Review
Magazine, October 1997 disponvel em
http://www.data-warehouse.com/resource/articles/oct97_74.htm
TRONCHIN, Valsoir, Anlise, Modelagem e Implementao de Data Warehouses So Paulo:
Fenasoft/98 em 20/07/98
WANG, Charles B., Techno Vision II So Paulo: Makron Books, 1998

13

You might also like