You are on page 1of 6

Viso Geral

KDD

Knowledge Discovery Database (Descoberta de Conhecimento em Base de Dados ) o processo de transformao de dados em conhecimento. empregado para descrever todo o processo de extrao de conhecimentos dos dados, e possui varias etapas interligadas como: seleo, pr-processamento, transformao, Data-Mining e interpretao enquanto que data mining empregado somente para o estagio de descoberta do processo de KDD.

O objetivo fundamental do KDD descobrir conhecimento til, Clique para e novo estilo do subttulo mestre vlido, relevante editar o sobre uma determinada atividade atravs de algoritmos, tendo em conta as ordens de magnitude crescente nos dados .

4/29/12

KDD
Viso Geral

A extrao de conhecimento, alm das informaes empricas, possui a capacidade de detectar e colher informao mais profundas e escondidas entre os bancos de dados. Na prtica, se assemelha ao conceito do datamining (minerao de dados).

4/29/12

KDD
Tarefas de KDD

As tarefas so dependentes da aplicao e do interesse do usurio. Assim cada tarefa de KDD extrai um tipo diferente de conhecimento do BD e requer um algoritmo diferente para a extrao de conhecimento.

O KDD dividido em 3 tarefas:

Regras de Associao Classificao Clustering.

4/29/12

Tarefas de KDD

Regras de Associaao Uma tupla consiste num conjunto de atributos binrios chamados itens. Cada tupla corresponde uma transao, e um item pode assumir um valor verdadeiro ou falso, dependendo se ele est ou no presente na transao.

A transformao de uma tabela da base de dados para o formato binrio realizada substituindo um atributo de cardinalidade K por K atributos binrios. Uma regra de associao um relacionamento da forma X => Y, onde X e Y so conjuntos de itens e a interseo deles, X Y, o conjunto vazio.

Cada regra associada a um fator suporte superior (Fsup), e a um fator de confidncia (Fconf). A definio desses fatores fornece uma medida capaz de distinguir associaes interessantes, dado que as regras geradas em forma binria aumentam consideravelmente o espao de busca de qualquer algoritmo 4/29/12 minerador.

Tarefas de KDD

Classifica o Na tarefa de classificao cada tupla ou registro pertence a uma classe dentre um conjunto pr-definido de classes. As tuplas compe-se de atributos preditivos e um atributo objetivo, cujo valor definido pelo usurio indica a que classe essa tupla pertence. O atributo objetivo pode ter valores discretos como SIM ou NO, um valor pertencente a um intervalo de nmeros inteiros, etc. O propsito da tarefa de classificao descobrir algum tipo de relacionamento entre os atributos preditivos e o atributo objetivo que permita encontrar um conhecimento que possa ser utilizado para prever a classe de uma tupla ainda no classificada.

4/29/12

Tarefas de KDD
Classifica o

A anlise de pequenos conjuntos de dados normalmente realizada manualmente, mas para grandes conjuntos mais eficiente realizar um processo automtico de clustering por meio da tecnologia de minerao de dados.

Na clusterizao, classes so criadas atravs da produo de parties do banco de dados em conjuntos de tuplas com valores de atributos semelhantes. Aps a criao das classes, emprega-se um algoritmo de classificao para produzir regras para cada A qualidade da clusterizao depende da medida utilizada para uma delas. aferir a similaridade das tuplas. Um bom agrupamento possui similaridade intra-classe alta e inter-classe baixa.

Mede-se tambm a qualidade do mtodo pela sua habilidade para descobrir algum ou todos os padres escondidos.

4/29/12

You might also like