You are on page 1of 19

PROJETO DE PESQUISA

DOUTORADO EM CINCIAS DA COMPUTAO E MATEMTICA


COMPUTACIONAL

PROPOSTA DE UMA FERRAMENTA PARA ANLISE DO PERFIL


VOCACIONAL ESTUDANTIL A PARTIR DA MINERAO DE
DADOS EDUCACIONAIS DO ENSINO MDIO

CANDIDATO: Valtemir de Alencar e Silva


ORIENTADOR: Prof. Dr.

SO CARLOS
MAIO/2013
SUMRIO

RESUMO 2
1. INTRODUO 3
2. JUSTIFICATIVA 3
3. CONTEXTO ATUAL
3.1. AMBIENTES VIRTUAIS DE APRENDIZAGEM
3.2. SISTEMAS TUTORES INTELIGENTES 5
3.3. MINERAO DE DADOS EDUCACIONAIS 6
4. OBJETIVOS
5. PLANO DE TRABALHO
6. METODOLOGIA 10
7. CONSIDERAES FINAIS 11
8. REFERNCIAS BIBLIOGRAFICAS 15

Esquema Projeto FAPESP


Resumo (mximo 20 linhas);
Introduo e justificativa, com sntese da bibliografia fundamental;

Objetivos;
Plano de trabalho e cronograma de sua execuo;
Material e mtodos;
Forma de anlise dos resultados.

1
RESUMO

O mundo vive na era da informao, exigindo das instituies uma gesto eficiente e, a qual
pode ser oferecida atravs de sistema de informao. De igual modo, os projetos de pesquisas
necessitam de informaes corretas para a sua execuo e obteno de resultados.
O valor atribudo s informaes depende dos resultados alcanados pelas Instituies e para
medir o valor da informao o gestor deve dispor da informao de forma que ela reduza as
incertezas encontradas no decorrer do processo decisrio, e consequentemente, aumente a
qualidade da deciso.
Uma tcnica que contribui para aumentar a qualidade das informaes a explorao da base
de conhecimento atravs de tcnicas de pesquisas denominadas minerao de dados, que
pesquisa uma grande quantidade de dados em um banco de dados que base de
conhecimento de uma empresa, de uma Instituio de Ensino e de projetos de pesquisas, como
por exemplo, em biotecnologia.
A minerao de dados ento um processo de conhecimento de estruturao de dados, onde
extrai informaes vlidas, abrangentes e at mesmo desconhecidas de uma ampla base de
dados.

Palavras-chave: Minerao de Dados Educacionais. Perfil Vocacional. Ensino Mdio.


Competncias. Integrao de Contedos.

2
1. INTRODUO

O objetivo principal deste trabalho a modelagem de uma ferramenta na rea de


minerao de dados educacionais capaz de traar um perfil vocacional para estudantes dos
mais diferentes cursos a partir da anlise dos conhecimentos adquiridos durante o processo
de ensino-aprendizagem no ensino mdio comparados s competncias exigidas pelas
diversas reas profissionais. Como objetivo secundrio, pertende-se criar uma ferramenta
do tipo painel de acompanhamento do estudante no processo de ensino atravs do
cruzamento de indicadores educacionais e comportamentais, capazes de registrar seu
desmpenho. Alm disso, outros objetivos so mapear pontos de integrao entre as
disciplinas do ensino mdio que compartilhem competncias comuns e tambm gerar um
ranqueamento destas competncias indentificando aquelas com maiores dificuldades de
assimilao.

2. JUSTIFICATIVA

Levantar se existe algum indicador de erro na escolha da profisso


Problemas de aprendizado no ensino mdio e sua situao atual
Detakhar claramente as copet~encias a serem atingidas
Poder demonstrar de forma mais clara e objetiva os problemas de aprendizagem para
os pais de alunos
Fomentar a integrao de contedos, disciplinas e atuao docente
Mostrar que h poucos trabalhos voltados para esta rea e para a situao do ensino
mdio brasileiro at pela desservio prestado pela LDB 96
Candidato coordenador dos cursos integrados atuando diretamente na rea e com
autonomia para alterar, excluir e implementar novos procedimentos de ensino e aplicao de
novas propostas pedaggicas

3
Segundo Hiragi (2008) os recursos genticos so fontes de pesquisas inesgotveis e o
seu valor imensurvel, com grande potencial para as pesquisas, mesmo com todo o avano
existente nas reas de cincias humanas, exatas e biolgicas no possvel estabelecer com
exatido e prontido aonde o conhecimento pode levar e quais combinaes entre genes so
possveis de acontecer. Para tanto uma grande caminhada ainda se deslumbra diante do
conhecimento humano, e a pesquisa de forma ordenada e correta pode estabelecer os
direcionamentos que so relevantes aos homens e diferentes pocas, e pode em muito
contribuir com o avana das pesquisas em biotecnologia. Hoje em dia a informtica aplicada
nos diversos setores da atividade humana e tem contribuindo no progresso e no bem estar do
homem. Na rea de bioinformtica tambm pode ser e uma grande aliada.
Toda a comunidade acadmica trabalha e utiliza dados para o aprimoramento de seus
trabalhos para aquisio de resultados que produzam satisfao e bem estar ao homem. Um
sistema de informao quando tem o objetivo de coletar, validar, organizar e disponibilizar
esses dados esto no nvel denominado primeiro estgio, ainda, conforme Hiragi (2008) e uma
forma de consolidar essa base de conhecimento para uma organizao e ou projetos de
pesquisa em biotecnologia e elevar essa base de conhecimento para um segundo estgio, onde
os dados e as informaes podero ser utilizados com o propsito da descoberta de novos
conhecimentos, que segundo Carit (2010)b apud Santos, um instrumento importante para
tomada de deciso. Nesse contexto ento as tcnicas de pesquisas podem contribuir em extrair
novos tipos de informao para os cientistas permitindo uma navegao em horizontes
desconhecidos, trazendo a luz do conhecimento informaes para o progresso da cincia.
Conforme Carit (2010)a, ainda h uma grande necessidade de estudos nessa rea de
explorao e de pesquisa com o objetivo de diagnsticos e de novas protenas para a sua
utilizao nos seres humanos.

3. CONTEXTO ATUAL

DEVE MOSTRAR O CENRIO ATUAL E DEMONSTRAR AS LACINAS


EXISTENTES E A POSSIBILIDADE DE CONTRIBUIO DA PESQUISA!!!
REFERNCIAS DE 5 ANOS OU MENOS!

4
Nas sees a seguir so apresentados os conceitos referentes ao projeto de pesquisa e
algumas citaes sobre a utilizao e a relevncia do uso da tecnologia em minerao de dados
na rea de biotecnologia.

6.1 INTRODUO

O mundo vive na era da informao, exigindo das instituies uma gesto eficiente
e, a qual pode ser oferecida atravs de sistema de informao. O sistema de informao
oferece recursos tecnolgicos e computacionais para a gerao de informaes, propondo
mudanas nos processos, estrutura e estratgia de negcios. Atualmente, no possvel
uma instituio competir com vantagem, sem a utilizao desses recursos oferecidos pela
tecnologia da informao.
Com a necessidade de se tomar de decises de maneira precisa e rpida, os
ambientes centralizados distribudos tem tomado fora nos ltimos anos, tendo a
necessidade de efetuar um maior controle sobre as informaes que esto disponveis, a fim
garantir a qualidade e a integridade desta, essas ferramentas demandam grande tempo de
desenvolvimento e uma enorme interao entre as partes para que possa alcanar os
objetivos desejados.
A cincia como parte de uma sociedade que vive a velocidade do instantneo
proporcionado pelo advento da Internet e programas de computadores que facilitam o
acesso a informao em qualquer lugar e a qualquer hora, precisa tambm de ferramentas
que auxiliem na pesquisa, na integrao das partes de um projeto e com outros projetos para
que o seu desenvolvimento seja feito de forma progressiva e consistente.
Para Prusak (1999), importante para o sucesso dos trabalhos ligados ao
conhecimento, que as instituies saibam definir o que so dados, informaes e
conhecimento. Eles apresentam-se como elementos em sua forma mais simples, os quais
no so suficientes para tomada de deciso. Os dados precisam passar por transformaes
para se tornarem teis. De acordo com Padoveze (1998), dado o registro puro, ainda no
interpretado, analisado e processado.
Assim, para a compreenso de um fato ou situao em uma Instituio necessrio
que os dados se transformem em informao. Ainda segundo Padoveze (1998), a

5
informao o dado que foi processado e armazenado de forma compreensvel para seu
receptor e que apresenta valor real ou percebido para suas decises correntes ou
prospectivas.
Ainda, para Oliveira (1992), a informao auxilia no processo decisrio, pois
quando devidamente estruturada de crucial importncia para a empresa, associa os
diversos subsistemas e capacita a empresa a impetrar seus objetivos.
O valor atribudo pelos gestores s informaes depende dos resultados alcanados
pela empresa. Os benefcios oferecidos pelas decises acertadas, baseadas em informaes
valiosas representam o sucesso da empresa.
Para medir o valor da informao o gestor deve dispor da informao de forma que
ela reduza as incertezas encontradas no decorrer do processo decisrio, e
consequentemente, aumente a qualidade da deciso.
Ainda, segundo Stair (1998), conjunto de dados, regras, procedimentos e relaes
que devem ser seguidos para se atingir o valor informacional ou resultado adequado do
processo est contido na base do conhecimento.
A base do conhecimento instrumento que pode facilitar e reconhecer quais
informaes til para se atingir os objetivos traados pela organizao, por um grupo de
pesquisa e em um projeto de pesquisa.
Para Laudon e Laudon (2007), conhecimento o conjunto de ferramentas
conceituais e categorias usadas pelos seres humanos para criar, colecionar, armazenar e
compartilhar a informao. As informaes so criadas a partir da transformao dos dados,
atravs da aplicao do conhecimento humano.
A informao segundo Mcgee et al. (1994) a base para competio nos setores de
servios e produo, sendo responsvel pela definio da estratgia adotada pela
organizao para conseguir conquistar mercado. A cincia entra nesse contexto, pois a
informao consistente elemento primordial para o crescimento das pesquisas de forma
que possa ser utilizada de forma segura pela sociedade.
Assim, possvel perceber o grande valor existente nos dados que transitam pela
empresa, nas Instituies de pesquisas, ento cabe direo juntamente com seus
funcionrios criarem mecanismos que garantam a integridade, e o acesso, pois segundo
Caruso et al. (1999), o bem mais valioso que no pode ser produzido e atualmente no

6
existe nenhuma organizao que no seja dependente da tecnologia da informao em
maior ou menor grau.
Assim, a construo de uma base de informao slida pode contribuir na
acelerao dos resultados das pesquisas em andamento, criao e abertura de novos
horizontes e conceitos a serem tratados dentro de cada contexto e de cada pesquisa que
esto sendo iniciadas, em andamento e em concluso.
Uma base de conhecimento pode disponibilizada atravs de uma base de dados que
segundo Albuquerque (2012) um conjunto de registros dispostos de em estrutura regular
que possibilita a reorganizao dos mesmos para produzir a informao atravs de
consultas organizadas e estruturadas, as consultas nessa base de dados produz a informao
que o resultado do processamento, manipulao e organizao, de tal forma que
represente uma modificao (quantitativa ou qualitativa) no conhecimento de um sistema
de uma empresa, em um banco de dados gentico entre outros.
A explorao dessa base de conhecimento realizada atravs de tcnicas de
pesquisas denominadas minerao de dados, que, conforme Rebouas (2010) uma anlise
projetada com o objetivo de pesquisar uma grande quantidade de dados em um banco de
dados que de suporte a base de conhecimento. Esses dados podem ser relacionados a
negcios, empresas, mercado e pesquisas cientficas, como por exemplo, na rea de
biotecnologia. Ainda, conforme Barbosa (2006) a minerao de dados busca padronizar
sistemas e subconjuntos de dados. Segue trs etapas bsicas: Explorao, Construo de
modelo, Definio de padro, Validao e verificao. Assim, considerada uma
ferramenta de gerenciamento de informao utilizada no intuito de facilitar o acesso e a
organizao s estruturas de conhecimento que auxiliem em decises de trabalho. Na
prtica uma anlise de dados exploratrios e de modelagem.
A minerao de dados ento um processo de conhecimento de estruturao de
dados, onde extrai informaes vlidas, abrangentes e at mesmo desconhecidas de uma
ampla base de dados.
Portanto, procura-se enfatizar nesse trabalho o desenvolvimento de um projeto que
possa auxiliar a anlise de dados das pesquisas desenvolvidas pela Unidade de
Biotecnologia da Universidade de Ribeiro Preto.

7
6.2 SISTEMAS DE APOIO A DECISO

Um Sistema de Apoio Deciso (SAD) uma ferramenta que procura auxiliar o


decisor na sua tomada de deciso. Em hiptese alguma ele substitui o julgamento humano e
sua deciso. Diferente dos sistemas especialistas, o objetivo do SAD no assimilar a
experincia dos indivduos para a resoluo de problemas semelhantes no futuro, mas sim
ajud-lo no uso e manipulao de dados e aplicao de heursticas.
De acordo com Sprague e Hugh (1991), Sistema de Apoio Deciso tem como
caractersticas:
- Apoiar as decises: prescinde de estruturao suficiente para que recursos
analticos ou computacionais possam fornecer apoio ao discernimento;
- Aumentar o alcance e a capacidade do decisor, assim como sua efetividade;
- Relevncia dos decisrios na criao de uma ferramenta de suporte, portanto,
no devendo objetivar automatizar o processo de deciso, predefinir objetivos
ou impor solues, mas apenas prover o seu suporte.
O processo de tomada de deciso se desenrola, portanto, atravs da interao
constante do usurio com um ambiente de apoio deciso especialmente criado para dar
subsdio s decises a serem tomadas.

6.2.1 Data Mining

A maioria das organizaes vem acumulando uma enorme quantidade de dados ao


longo do tempo, mas na realidade elas precisam mesmo de informaes que possam ser
obtidas a partir destes dados, e que sejam utilizadas para atender cada vez melhor aos seus
clientes, para alocar os seus recursos de uma maneira mais eficiente, para minimizar perdas,
para subsidiar a tomada de decises, entre outras aes.
Com o surgimento do Data Mining (DM), a principal proposta desta ferramenta
proporcionar novos processos de anlises de dados, permitindo a descoberta automtica de
padres e relacionamentos complexos entre esses dados, com vistas melhoria dos
processos de tomada de deciso. Tais anlises so geralmente efetuadas sobre grandes bases

8
de dados, incluindo a Internet, na qual os volumes de informaes excedem a capacidade de
anlise pelos mtodos tradicionais (planilhas, consultas e grficos) (HARRISON, 1998).
Nesse contexto, cada vez mais o data mining est sendo utilizado nas empresas e
nas mais variadas reas incluindo vendas, finanas, seguros e planos de sade, transporte e
medicina, como forma de marketing ou como forma de deteco de fraudes. Pelos
exemplos, pode-se observar a real importncia desse processo dentro de uma empresa. Para
isso, constitui-se em um conjunto de tcnicas mtodos e ferramentas, descendentes das
linhas de Estatsticas, Inteligncia Artificial (IA) e Machine Learning, embutindo nos
algoritmos mtodos matemticos e heursticos, aplicados com o objetivo da descoberta do
conhecimento.
A Minerao de Dados ou Data Mining a explorao e a anlise de grandes
quantidades de dados, por meio automtico ou semi-automtico, a fim de descobrir padres
e regras significativos. Tais padres e regras significativos so descritos como
conhecimento invisvel. So assim chamados porque dificilmente seriam descobertos sem o
uso de tcnicas inteligentes, pelo fato de estarem envoltos por um grande volume de dados
(BERRY et al., 2000 apud SANTOS, 2007).
No entanto, DM uma das etapas do processo de descoberta do conhecimento,
convencionado como KDD (Knowledge Discovery in Databases), ou Descoberta de
Conhecimento em Base de Dados, o processo composto por seis etapas que, segundo
Fayyad (1996), compreende a seleo dos dados, limpeza, pr-processamento dos dados, a
representao dos dados, a minerao dos dados e a interpretao dos resultados. Porm,
DM a etapa mais fascinante, pois nela que se realiza a descoberta do conhecimento.

6.2.2 Data Webhouse

Em um curto perodo, o impacto da Web transformou radicalmente a misso da


tecnologia da informao, passando de mero suporte a aplicativos de legado para as
capacidades de produo de contedo, informaes e processamento de transao, tudo isso
atravs de interfaces de navegadores. A Web muito mais que uma tecnologia para conectar

9
dispositivos de processamento distribudo, uma forma nova e menos onerosa de se
difundir a informao e permitir a comunicao.
Portanto, com o grande avano e a popularizao da Internet ocorridos nos ltimos
anos, surge a necessidade de trazer o Data Warehouse para a Web, que uma tima
estratgia devido a suas vrias vantagens.
Data Webhouse (DWH) a instanciao da Web do Data Warehouse, tem como
foco central as operaes de um negcio voltado para a Web. O casamento entre Data
Warehouse e Web originou o que se conhece por Data Webhouse (KIMBALL; MERZ,
2000).
De acordo com Kimball e Merz (2000), o data Webhouse tem papel central e crucial
nas operaes de um negcio capacitado para a Web. Todavia, para cumprir esse potencial,
ele:
Armazena e publica dados de sequncia de cliques e outros dados
comportamentais da Web que guiam uma compreenso do comportamento do
usurio;
adaptado a outros data marts distribudos no data warehouse da empresa e a
data marts para cima e para baixo na cadeia de fornecedores, de modo que todos
esses data marts podem ser utilizados em conjunto;
uma fonte adaptvel e flexvel de informaes. medida que novas perguntas
de negcio surgem e que novas origens de dados tornam-se disponveis, insiste-
se que o data Webhouse responde elegantemente novidade. Uma resposta
elegante aquela que permite que aplicativos antigos continuem sendo
executados sem interrupo e sem reprogramao, mas tambm permite que as
novas perguntas e os novos dados coexistam.
extensvel aos novos meios da Web, incluindo imagens paradas (still images),
imagens grficas, udio e vdeo.
base para as decises de converso para a Web. Novamente, o data Webhouse
deve permitir que seus usurios tomem decises sobre a Web e enquanto
estiverem utilizando a Web.

1
A atividade de trazer o Data Warehouse para a Web, significa fazer com que todas as
interfaces do Data Warehouse sejam disponibilizadas por meio de navegadores Web, mas
para que o DW seja disponibilizado na Web, devem-se seguir vrias regras. Isto se justifica,
pois a Web impe algumas regras de usabilidade e semntica que devem ser seguidas para
se obter sucesso no projeto do Data Webhouse.
Kimball e Merz (2000) descrevem estas regras da seguinte forma:
Facilidade de utilizao pelos usurios - at certo tempo, os programadores
no tinham ideia de como eram as atividades dos usurios. As novas ideias com
relao usabilidade eram pouco consideradas e as sugestes individuais dos
usurios eram tidas como insignificantes. Com o desenvolvimento da Web,
houve uma maior necessidade das ferramentas serem de fcil utilizao,
preocupando-se assim com a opinio dos usurios;
Vocabulrio fcil - a linguagem utilizada no pode ser somente tcnica, pois,
mesmo que os acessos sejam em grande parte feitos por conhecedores da rea, o
Webhouse est localizado em um ambiente de amplo acesso, no devendo
restringir-se a um nico pblico.
Velocidade no acesso aos dados - o tempo de resposta eficaz de extrema
importncia para o sucesso do projeto. Apesar de os dados no Webhouse serem
histricos e de acesso mais demorado, a modelagem deve ser efetuada de forma
que o usurio no fique indefinidamente aguardando a resposta de uma
consulta.
Natureza Multicultural da Web - as informaes dispostas no Webhouse,
tanto as contidas na interface com o usurio quanto as contidas no BD, devem
estar em padronizao internacional, tendo em vista o uso global que ter o
Webhouse.
As tecnologias de DW e Web tm objetivos similares: enquanto que a funo
primria do Data Warehouse a publicao de informaes corporativas visando a anlise,
a tecnologia Web o meio ideal para essa publicao.
Segundo Turban, Rainer e Potter (2007), a Web um meio perfeito para instalar
recursos de apoio deciso de uma maneira global.

1
Proporcionam as empresas que tm seus dados organizados pelo Data Warehouse a
divulgao pela Web, que uma tima estratgia devido a suas vrias vantagens. Permite de
uma forma bem simples que os usurios solicitem consultas e tenha acesso rpido aos
dados dos mais variados assuntos, 24 horas por dia, sete dias por semana e constantemente
atualizados.
Os sistemas baseados na Web so acessados via portal e interliga as seguintes partes:
os servios de inteligncia de negcio (BI), o Data Warehouse e os Data Marts.
Considerando que o impacto da Web to profundo que muito mais que uma aplicao,
o nosso novo ambiente, assim o data webhouse muito importante para as organizaes
que disponibilizam servios por meio da Internet.

6.2.3 Minerao de Dados em Biotecnologia

Conforme Santana (2012) o homem utiliza a Biotecnologia no seu cotidiano, sendo


relatadas na literatura as primeiras aes por volta do ano 2000 a.C. quando os humanos
aprenderam a arte de cruzar espcies de plantas e animais, assim como o desenvolvimento das
tcnicas de fermentao para produo do po e do lcool.
Ento, o homem passou a trabalhar no esforo de identificar e utilizar os micro-
organismos que podiam ter aplicao na rea de sade, como a identificao e a produo de
vacinas, remdios e antibiticos. O grande salto no uso da biotecnologia foi a identificao do
DNA e posteriormente a identificao de sua estrutura helicoidal, ainda conforme Santana
(2012) apud Larousse (1978).
Com o avano da tecnologia houve uma grande revoluo na indstria como um
todo. E nessa onda convergente a Biotecnologia possibilitou o trabalho de reestruturao e
programao de microorganismo de forma que possibilitou utilizar as propriedades desejveis
dos alimentos, animais, plantas e do homem.
Projetos de pesquisa na rea de sade, onde foram utilizadas as tcnicas de minerao
de dados com grande relevncia para o desenvolvimento da pesquisa e a sua contribuio no
processo de diagnsticos e acompanhamento de patologias decorrentes do homem, conforme
Carit (2010)b.

1
A utilizao de minerao de dados com o apoio da Inteligncia Artificial na rea de
agricultura no processamento em cluster com genes conhecidos como nif, com o apoio do
Centro Nacional para Informaes de Biotecnologia para classificao e recuperao de
informaes referentes aquele gene, segundo Gehlen (2011).
Segundo Nievola (2006) Descobrir e desenvolver novos medicamentos um
processo oneroso, demorado. O custo estimado para trazer ao mercado um medicamento
simples, de 350 a 610 milhes de dlares. Esse processo requer um tempo perto de 8 a 12
anos, e certo que a indstria farmacutica necessita de novas tecnologias para simplific-lo.
As companhias na indstria farmacutica esto com uma presso acirrada para
reduzir os ciclos de pesquisa e desenvolvimento, enquanto, no mesmo tempo, so implantadas
novas tecnologia de instrumentao, produzindo enorme quantidade de dados experimentais
(gigabytes por dia) e a implementao de um conjunto integrado de algoritmos de associao,
a serem utilizados em dados de bioinformtica, permitindo a determinao da relao entre os
diversos atributos dos dados, contribuindo com a acelerao do processo e reduo dos custos.

4. OBJETIVOS

O objetivo principal deste trabalho a modelagem de uma ferramenta na rea de


minerao de dados educacionais capaz de traar um perfil vocacional para estudantes, a
partir da anlise dos conhecimentos adquiridos durante o processo de ensino-aprendizagem
no ensino mdio comparados s competncias exigidas pelas diversas reas profissionais.
Como objetivo secundrio, pretende-se criar uma ferramenta do tipo painel de
acompanhamento do processo de ensino atravs do cruzamento de indicadores educacionais
e comportamentais, capazes de registrar seu desempenho. Alm disso, sero mapear pontos
de integrao entre as disciplinas do ensino mdio que compartilhem competncias comuns
e tambm gerar um ranqueamento destas competncias identificando aquelas com maiores
dificuldades de assimilao.

1
5. PLANO DE TRABALHO fazer como a Silvana!!!

1o ano:
Realizao dos crditos necessrios ao programa de doutoramento;
Levantamento bibliogrfico sobre Sistemas de Apoio a Deciso aplicados a
Biotecnologia;
Levantamento bibliogrfico sobre Informaes e Bases de Dados Genticas;
Levantamento bibliogrfico sobre Minerao de Dados;

2o ano:
Realizao dos crditos necessrios ao programa de doutoramento;
Levantamento e anlise de requisitos junto com os pesquisadores da Unidade
de Biotecnologia da Universidade de Ribeiro Preto para o delineamento da
arquitetura de software;
Estudo e implementao da arquitetura fsica para o desenvolvimento do
sistema proposto;
Desenvolvimento do modelo de dados e algoritmos para carga de dados na
arquitetura implementada;

3o ano:
Realizao do exame de qualificao.
Desenvolvimento e implementao dos algoritmos para realizao da
minerao de dados;
Desenvolvimento e implementao da interface para visualizao dos dados
atravs da Internet.

1
4o ano:
Testes preliminares.
Avaliao dos resultados obtidos, refinamento e ajuste dos algoritmos;
Elaborao de artigo para publicao;
Elaborao e defesa da tese.

6. METODOLOGIA

A metodologia descrita nas sees a seguir apresenta o ferramental necessrio para a


criao do mecanismo computacional para a minerao, classificao e mapeamento de dados
relacionados ao projeto proposto, de forma a cumprir os objetivos da pesquisa:
Ser estudado o conceito de sistemas de apoio a deciso, bem como suas
aplicaes na rea de biotecnologia.
Ser estudado o contexto de informaes e base de dados genticas.
Ser realizado o levantamento dos requisitos juntos aos pesquisadores da
Unidade de Biotecnologia para o desenvolvimento da arquitetura de software,
e dessa forma trabalhar no projeto fsico e lgico do sistema;
Ser desenvolvido o algoritmo de busca e pesquisa na base de dados, bem
como a construo da interface WEB para apresentao das informaes;
Ser realizado testes de validao do algoritmo no sistema para a mensurao
dos dados.

7. CONSIDERAES FINAIS

DEVE MOSTRAR O CENRIO ATUAL E DEMONSTRAR AS LACINAS


EXISTENTES E A POSSIBILIDADE DE CONTRIBUIO DA PESQUISA!!!

8. REFERNCIAS BIBLIOGRFICAS

1
ALBUQUERQUE, L.; G. O DNA da Pecuria Moderna. Disponvel em
http://www.cigeneticabovina.com.br/downloads/1d7338fa-Palestra%20-%20Crit
%C3%A9rios%20b%C3%A1sicos%20de%20um%20programa%20de%20melhoramento
%20gen%C3%A9tico...pdf, acessado em 26/07/2012

BARBOSA, D.; C.; C. Minerao de dados Usando o software WIZRule em Base de


Dados de Compras de TI. Dissertao de Mestrado. Programa de Ps-Graduao em
Administrao de Empresas. IBMEC. 2006.

CARIT E. C.; SILVA, S. S.; MORAIS, E. R. E. D. Fatores de Risco para Doena


Arterial Coronariana em Idosos: Anlise por Enfermeiros Utilizando Ferramenta
computacional Esc Anna Nery (impr.) 2010 out-dez; 14 (4):797-802. 2010. (a)

CARIT E. C.; SILVA, S. S.; MORAIS, E. R. E. D. Business Intelligence utilizando


tecnologias Web para anlise de fatores de risco na ocorrncia de doena arterial
coronariana J. Health Inform. 2010 Jan-Mar; 2(1): 7-13. 2010 (b)

CARUSO, C. A. A.; STEFFEN, F. D. Segurana em Informtica e de Informaes. 2.


ed. So Paulo: Senac. 1999.

FAYYAD, U.; PIATETSKY-SHAPIRO, G. S. From data mining to knowledge


discovery: an overview. In: Advances in Knowledge Discovery and Data Mining.
Cambrigde: MIT Press, 1996.

GEHLEN, M. A. C. Mapeamento de Genes nif Publicados no NCBI Usando Conceitos


de Minerao de Dados e Inteligncia Artificial Dissertao apresentada ao Curso de
Ps-Graduao em Bioinformtica da Universidade Federal do Paran. 2011.

HARRISON, T. H. Ferramentas e tcnicas para a utilizao do data warehouse. So


Paulo: Berkeley Brasil, 1998.

1
HIRAGI. G. O. Minerao de Dados em Base de Germoplasma. Dissertao de
Mestrado do programa de Ps-Graduao em Informtica da Universidade de Brasilia.
2008.

KIMBALL, R.; MERZ, R. Data Webhouse: Construindo o Data Warehouse para a Web.
Rio de Janeiro: Editora Campus, 2000.

LAUDON, K. C.; LAUDON, J. P. Sistemas de informao. 7. ed. Rio de Janeiro: LTC,


2007.

MCGEE, J.; PRUSAK, L. Gerenciamento Estratgico da Informao. Rio de Janeiro:


Campus, 1994.

NIEVOLA, J. C.; BASSANI T. Algoritmos de Associao para Minerao de Dados em


Bioinformtica Programa de Ps-Graduao em Informtica Aplicada ( PPGIA PUCPR).
Anais da 58 Reunio Anual da SBPC - Florianpolis, SC - Julho/2006

PADOVEZE, C. L. Sistemas de informaes contbeis: fundamentos e anlise. So


Paulo: Atlas, 1998.

PRUSAK, L. Conhecimento empresarial. Traduo de Lenke Peres. Rio de Janeiro:


Campus, 1999.

Rebouas, F. DATA MINING: Minerao de Dados. Disponvel em


http://www.infoescola.com/informatica/data-mining/, acessado em 26/05/2012.

SANTOS, R. S. Ambiente para Extrao de Informaes atravs da Minerao das


Bases de Dados do Sistema nico de Sade. 233 p. Tese (Doutorado em Cincias
Mdicas). Universidade Federal de So Paulo, Escola Paulista de Medicina, 2007.

1
SANTANA, M. F. E.; MARTINEZ, R. G.; JUNIOR, N. P.; SOUZA, A. M. Gesto do
Conhecimento Cientfico e Tendncias Cientficas em Biotecnologia na Venezuela.
Disponvel em http://www.revistacts.net/files/Volumen%207%20-%20N%C3%BAmero
%2021/Ebole_EDITADO.pdf. Acessado em 20/06/2012

SPRAGUE, R. H.; HUGH, J. W. Sistemas de Apoio Deciso. Rio de Janeiro: Campus,


1991.

STAIR, R. M. Princpios de sistemas de informao. Rio de Janeiro: LTC, 1998.

TURBAN, E.; RAINER, K.; POTTER, R. Introduo a sistemas de informao: uma


abordagem gerencial. Rio de Janeiro: Elsevier Campus, 2007.

You might also like