Professional Documents
Culture Documents
Equipe: Adriano Jorge da Costa Allan Braga Diego Marques do Carmo Douglas Alexandre Coelho
Agenda
Definio do Problema Base de Dados Rede Neural
Definio do Problema
O problema consiste na classificao de componentes celulares da bactria Escherichia coli utilizando Redes Neurais e rvore de deciso.
Base de Dados
Criador:
Kenta Nakai Institue of Molecular and Cellular Biology Osaka, University 1-3 Yamada-oka, Suita 565 Japan.
Nmero de Instncias:
336
Atributos:
Nome da sequncia mcg gvh Lip chg aac aml1 alm2
Base de Dados
Classes:
cp (citoplasma) im (membrana mais interna sem sequncia de sinal) pp (periplasma) imU (membrana mais interna, sequncia de sinal no clivvel ) om (membrana mais externa) omL (membrana lipoprotica mais externa) imL (membrana lipoproteica mais interna) imS (membrana mais interna, sequencia de sinal clivvel)
Base de Dados
Rede Neural
Implementao:
Matlab (nntool)
Rede Neural
Arquitetura:
Tipo da Rede: Feed-foward backpropagation Neurnios na Camada de Entrada: 7 Neurnios na Camada de Sada: 8 Neurnios na Camada Escondida: 10, 15, 20, 25 Funo de Ativao: log Sigmoide
Rede Neural
Rede Neural
Testes:
Variao do Nmero de Camadas Escondidas:
10 neurnios; 15 neurnios; 20 neurnios; 25 neurnios.
Rede Neural
Resultados:
Teste I 10 Acertos Erros 59% 41% 15 67,5% 32,5% 20 76,5% 23,5% 25 80% 20%
Teste II 10 Acertos Erros 67% 33% 15 76,5% 23,5% 20 83,5% 16,5% 25 91% 9%
rvore de deciso
O objetivo da rvore de deciso criar um modelo que prev o valor de uma varivel-alvo com base em diversas variveis de entrada. uma maneira grfica de visualizar as consequncias de decises atuais e futuras bem como os eventos aleatrios relacionados. Ela permite a conceptualizao e o controle de um bom nmero de problemas de investimentos sujeitos a riscos.
rvore de deciso
Um problema complexo decomposto em subproblemas mais simples. Recursivamente a mesma estratgia aplicada a cada subproblema. A capacidade de discriminao de uma rvore vem da:
Diviso do espao definido pelos atributos em subespaos. A cada subespao associada uma classe.
rvore de deciso
rvore de deciso
Na construo de uma rvore de deciso a ideia base : 1.Escolher um atributo. 2. Estender a rvore adicionando um ramo para cada valor do atributo. 3. Passar os exemplos para as folhas (tendo em conta o valor do atributo escolhido) 4. Para cada folha 4.1. Se todos os exemplos so da mesma classe, associar essa classe folha 4.2. Seno repetir os passos 1 a 4
rvore de deciso
A ferramenta usada na implementao de uma rvore o framework Weka:
rvore de deciso
Exemplo de cdigo:
rvore de deciso
rvore de deciso
A grande questo desta tecnologia como a rvore pode ser gerada, ou seja, como escolher as regras mais importantes e quais regras podem ser descartadas da rvore. Como regra, o ideal que a rvore tenha as regras mais importantes prximas a, ou seja, as que melhor classificam a entrada. Com isso, espera-se resolver o problema aplicando-se o menor nmero de regras.
rvore de deciso
O algoritmo heurstico mais conhecido para a escolha do melhor atributo o ID3. Ele baseado no clculo da entropia, ou seja, na escolha inicial de atributos que minimizem a entropia, a qual quantifica variao em um conjunto de exemplos em relao aos valores do atributo alvo.