Professional Documents
Culture Documents
This article presents a proposal for developing an online catalog for a library based on an
ontology built from the basic bibliography of the Internet Systems Technology Course. In fact,
the difficulty of the librarians at the time of cataloging is to know which subject certain work
can be inserted in because technology and many others areas are not of their domain. Thus,
the corpus was constituted from the ontology summaries because these contain words that are
not usually included in the title of the work. The next step was to insert this ontology in
database oriented graphs, Neo4j, and develop a friendly interface for presenting this
information.
2 LINGUÍSTICA COMPUTACIONAL
2.1 ONTOLOGIA
O surgimento do conceito de ontologia remonta aos tempos de Aristóteles. Ontologia
deriva do grego e é a junção de ontos+logoi= conhecimento do ser. É a área da filosofia que trata
da natureza do ser, dos tipos e estruturas dos objetos, da existência, e outros aspectos da
realidade (WELTY e GUARINO, 2001). O conceito de ontologia pode ter significados diversos,
embora parecidos, dependendo de em que área se fizer presente. Segundo Chandrasekaran et al
(1999), “ontologia é a representação de um vocabulário, frequentemente especializado em algum
domínio ou assunto importante. Mais precisamente, não é o vocabulário que qualifica uma
ontologia, mas os conceitos que os termos do vocabulário transmitem”.
Assim, a ontologia neste trabalho, foi formada pelos dados retirados dos sumários da
bibliografia básica do Curso de Tecnologia em Sistemas para Internet. A partir da utilização dos
sumários das obras como corpus, relacionaram-se alguns conceitos da área da informática, em
específico, linguagens de programação. Dessa forma, o objetivo é auxiliar os catalogadores de
uma biblioteca a melhor definir o assunto, já que só as palavras nos títulos das obras não levam
ao conhecimento de a qual assunto a obra está relacionada. Neste trabalho, para proceder-se à
modelagem conceitual da ontologia construída, é necessária uma descrição semântica da área do
conhecimento conceituado. Por essa razão, é essencial buscar conhecimentos de Semântica
Lexical.
Linguagens de
Programação Orientada a Objetos Java
Programação
A ideia dos bancos de dados orientado grafos está ligada diretamente a um modelo de
dados estabelecido, o modelo de grafos. A ideia desse modelo é representar os dados em
esquemas de grafos dirigidos, ou estruturas que representem os conceitos de grafo. Segundo
Robinson et al (2013, p.75), “banco de dado de grafo é em mecanismo que suporta um modelo
de dados de grafo apoiado por persistência de grafo nativa, para a realização de consultas”.
Portanto, o modelo de grafos é mais interessante que outros quando “informações sobre a
interconectividade ou a topologia dos dados são mais importantes, ou tão importantes quantos os
dados propriamente ditos” (NEOTECHNOLOGY, 2012).
Dessa forma, neste trabalho, foi utilizado o banco de dados orientado a grafos Neo4j, que
é um banco NoSQL, implementado em Java. Este banco de dados, vem de encontro com
modelagem da ontologia, já que esta, nada mais é que a relação entre conceitos. Portanto, foi
possível o armazenamento da ontologia bem como sua recuperação junto à página web
desenvolvida.
SQL, C, C++, Java, PHP, Assembly, Pascal linguagem estruturada, SQL embutida
SQL dinâmica, linguagens de banco de
dados, programação, transação em SQL
linguagem, orientado a objetos
Fonte: Elaboração dos autores
Com os dados armazenados, foi feita uma aplicação web (o catálogo), na linguagem de
programação Java, que possibilitou a recuperação das informações no banco. Há duas opções na
busca textual, Busca por Livro e Busca por Relacionamento. A Busca por Livro recupera os
livros relacionados ao conceito inserido no campo buscar. No exemplo da Figura 3, o conceito
“java” é buscado, e o livros são retornados pelo banco. É importante perceber que nem sempre o
livro retornado está diretamente ligado a “java”. No exemplo mostrado, DEITEL, H. M. et. al.
XML: como programar. Porto Alegre: Bookman, 2003, é um livro de linguagem de marcação, ou
seja, uma linguagem para se trabalhar com páginas da Web, e não uma linguagem de
programação Java. Mas, de fato, há um momento no sumário da obra em que Java é mencionado,
que por sua vez dá a possibilidade de inserir Java como constituinte do assunto da obra. Essa é a
funcionalidade da ontologia e o principal objetivo deste trabalho. Já a Busca por Relacionamento
retorna tudo o que estiver relacionado ao conceito inserido no campo, como visto na Error:
Reference source not found, o exemplo com o mesmo conceito “java”. O retorno são os livros
relacionados, bem como todo tipo de relacionamento. Dessa forma, o resultado obtido pela
Busca por Relacionamento possibilita a consulta dos relacionamentos por assuntos, que é o que
caracteriza uma ontologia, bem como as obras relacionadas às palavras buscadas, que são
exemplos dos livros já catalogados. Assim sendo, pelo fato de o catálogo ser online, fica à
disposição de todos, inclusive de outros bibliotecários que necessitarem de consultar o catálogo
para definir os assuntos de uma obra, enquanto a Busca por Livro fica à disposição daqueles que
precisarem consultar o acervo da biblioteca.
Figura 3 - Busca por livro
7 RESULTADOS
simples, porém objetiva, o resultado dos relacionamentos de forma contínua, o que aumenta sua
produtividade e permite uma melhor experiência de uso.
Dessa forma, constatou-se que a ontologia armazenada auxiliará os bibliotecários a
definir o assunto de uma obra por meio de consultas no banco e também dará possibilidade de
consulta do acervo da biblioteca a partir de conceitos desejados.
8 CONSIDERAÇÕES FINAIS
Este trabalho também possibilita que novas alimentações de dados e novos estudos sejam
feitos no catálogo, tanto na parte de buscas (filtros), como na construção da estrutura interna e da
interface do protótipo proposto.
REFERÊNCIAS