You are on page 1of 7

Extracção de Tratamentos de Dados

1. Recolha de Dados (amostra);

2. Analise Estruturada de Dados (optimização);

3. Definição/Desenho da Base de Dados;

4. Armazenamento – Programação do SGBD (Sistema de Gestão de


Base de Dados);

Introdução de Dados;

1. Regras para extracção de dados

Na recolha de dados devem ser identificados todos os dados


necessários para permitir a manipulação adequada de cada
ocorrência a tratar, adicionalmente devem ser identificados os dados
suficientes para distinguir cada ocorrência distinta. A distinção não
implica apenas separar duas ocorrências diferentes, mas também
identificar a mesma ocorrência em circunstâncias distintas.

Glossário
1. Cada valor isolado – Campo

2. Conjunto de campos associados a uma ocorrência – Registo

3. Conjunto de todos os registos semelhantes (todas as ocorrências


semelhantes tratadas no mesmo contexto) – Tabela

4. Conjunto de tabelas – Base de Dados

BD

Tabelas

| Cabeçalho/ID – Entidade

Registo

|
Campo – valor isolado [Dado]

Representação gráfica de tabelas registos (linhas) e campos (colunas)

Graficamente uma tabela é representada por um rectângulo dividido


em duas partes, 1ºparte cabeçalho, nome da tabela, 2ºparte corpo,
lista de campos.

Regras de nomenclatura

Uma tabela identifica os campos de cada registo, não tem valor.


Evolução histórica de base de dados

1º Geração – File - oriented DB

Dados guardados em ficheiros;

Acesso sequencial;

Estrutura dados definidas extra-ficheiro chamado chave índex.


índex

Aplicação “índex file”  dados.

“Time shore”

Servidor “Main Frame” e “Clientes mudos”

“Domb terminals”

2º Geração – Modelo hierárquico

Ryan – Macforlan – COBOL (Common Business Objects Language)

Já era SGBD.

Aplicação  SGBD “estrutura”  base de dados “dados”.

Main frame - para a arquitectura, Cliente --> Servidor

Modelo hierárquico

1. Prescindir de informação (usar só o útil); |c1 c2 c3 | c4 c5 c6 |

2. Clientes  contas correntes (c/c)  factura

Vendas  facturas  clientes {redundância “duplicação de


informação”)

Geração em rede – utilizado pela DM o maior modelo DB2. É uma


extensão que resulta a eliminação de hierarquia unidimensional,
bidireccionais 1 para n. É mais rápido.

Tabelas mestre, são aquelas que não dependem de qualquer outra


tabela.

3º Geração

CODD
C.J.DATE

4º Geração – Base de dados orientada a objectos

Modelo relacional – (definição simplificada) baseia-se no conceito


de entidade e no conceito de relação também conhecido como E.R.
Uma entidade é um elemento caracterizado pelos dados que são
recolhidos na sua identificação, designado como tabela. Na
construção da tabela identificam-se os dados da entidade. A
atribuição de valores a uma entidade constrói um registo na tabela. A
relação determina o modo como cada registo de cada tabela se
associa a registo de outras tabelas.

Nomenclatura

Entidade é o nome dos campos de uma tabela.

Registo é a atribuição de valores a uma entidade.

A ligação entre entidades designa-se por relação.

A ligação entre registos designa-se por associação.

Os campos das tabelas e as relações têm nome próprio.

Todos os nomes são únicos e identificam de forma directa

Ao conjunto de todos os nomes chama-se dicionário de dados.

O dicionário de dados é composto por estes três elementos:

- Entidade

- Registo

- Tabelas.

Rolos

Chaves
Índices
PK – Primary Key (chave primaria)

- É uma associação de um subconjunto de atributos de campos de


uma tabela que em conjunto identificam cada uma das linhas de
forma directa e única.

Corolário

- Para todas as linhas a chave primária é diferente é única.

- Chave primária escolhesse a partir de todas as chaves candidatas


em função do contexto.

AK – Alternate Key (chave candidata)

- Todos os subconjuntos que identificam de forma única e directa


cada linha são chaves candidatas.

- Uma tabela tem varias chaves candidatas.

Regra da dependência funcional

- Todos os campos de uma tabela dependem funcionalmente da sua


chave primária, ou seja, a totalidade da linha é identificada de forma
única e directa pela sua chave.

Descrição por extenso

Chave primaria – Nome da tabela em maiúsculas, depois entre


parênteses e a chave primaria em itálico e sublinhado, tudo por
extenso.

ALUNO (…)

Chave candidata – Tudo entre parênteses, tudo por extenso.

(aluno) (…)
Principais tipos de base de dados

Sistemas de gestão de base de dados

– Os sistemas de gestão de base de dados são programas que


permitem criar e manipular bases de dados, em que dados estão
estruturados com independência relativamente aos programas de
aplicação que os manipulam.

3 Níveis de arquitectura de qualquer SGBD:

Nível físico

Os ficheiros são guardados em suportes de armazenamento


informático e, a partir daí são manipulados pelo SGBD em execução
no computador;

Nível Conceptual

Organização da informação em tabelas e relacionamentos;

Nível de visualização

Corresponde à forma como os dados são apresentados aos


utilizadores finais, através de interfaces gráficos proporcionados pelo
SGBD.

You might also like