You are on page 1of 30

Como construir indicadores de Cincia, Tecnologia e

Inovao utilizando Web of Science, Derwent World Patent


Index, Bibexcel e Pajek?

Terry Lima Ruas;


Luciana Pereira

Como construir indicadores de Cincia,


Tecnologia e Inovao usando Web of
Science, Derwent World Patent Index,
Bibexcel e Pajek?
Terry Lima Ruas
Mestre em Engenharia da Informao pelo
Programa de Ps-Graduao em Engenharia da
Informao da Universidade Federal do ABC.
Bacharel em Cincia da Computao e Cincia &
Tecnologia pela Universidade Federal do ABC.
Atualmente exerce a funo de Delivery Cost
Branding & Service Planner para a diviso de
Software da IBM Brasil.
Luciana Pereira
Professora do Centro de Engenharia, Modelagem
e Cincias Sociais Aplicadas da Universidade
Federal do ABC e responsvel pelo iLab@UFABC.
Realizou
pesquisas
de
Ps-Doutorado
no
Technological Change Laboratory da Universidade
Columbia e no Observatrio da Inovao e
Competitividade
do
Instituto
de
Estudos
Avanados da Universidade de So Paulo. Possui
formao interdisciplinar, tendo obtido os ttulos
de Doutora e Mestra em Engenharia de Produo
pela Escola Politcnica da Universidade de So
Paulo, com Estgio Sanduche no Instituto de
Tecnologia de Massachusetts, e de Bacharel em
Economia pela Universidade Estadual Paulista.

http://dx.org/10.1590/1981-5344/1678

O objetivo deste artigo apresentar um processo que


explique como usar softwares livres para buscar, extrair
(Bibexcel) e visualizar dados (Pajek) dos repositrios de
publicaes cientficas (Web of Science) e tecnolgicas
(Derwent World Patent Index) para construo de
indicadores de produtividade cientfica e tecnolgica.
Espera-se que este processo contribua como um guia
metodolgico para a realizao de estudos cientomtricos,
de tal modo que permita aos pesquisadores e aos
gestores de Cincia, Tecnologia e Inovao (CTI) sem
conhecimentos avanados em computao a obter
informaes de forma mais prtica, porm confiveis, dos

Perspectivas em Cincia da Informao, v.19, n.3, p.52-81, jul./set. 2014

52

Como construir indicadores de Cincia, Tecnologia e


Inovao utilizando Web of Science, Derwent World Patent
Index, Bibexcel e Pajek?

Terry Lima Ruas;


Luciana Pereira

repositrios e que, a partir delas, possam construir


indicadores e elaborar avaliaes mais precisas de CTI.
Palavras-chave:
Cientometria;
Construo
Indicadores
de
Produtividade
Cientfica
Tecnolgica;Gesto da Cincia, Tecnologia e Inovao

de
e

How to build Science, Technology, and


Innovation Indicators usingWeb of of
Science, Derwent World Patent Index,
Bibexcel, and Pajek?
The goal of this paper is to present a process to retrieve
(Bibexcel), organize, and visualize (Pajek), information
from data repositories for research publications (Web of
Science) and technological efforts (Derwent World Patent
Index) to build science and technology indicators. The
process contributes as a methodological guide for
scientometric studies in such a way that enables
researchers and managers in Science, Technology and
Innovation studies without advanced skills in computer
science how to deal with large repositories in a more
practical, yet reliable, way. The result is development of
indicators that will allow more accurate assessments of
science, technology and innovation.
Key-words: Scientometrics, Science and Technology
Indicators, Tools for Management of Science, Technology
and Innovation
Recebido em 09.12.2012 Aceito em 06.04.2014

1Introduo
Uma das principais caractersticas da sociedade da informao e do
conhecimento a velocidade com que os avanos cientficos e
tecnolgicos tm ocorrido. De acordo com Gantz e Reinsel (2012), a
produo global de dados atingiu a marca de 2,8 zettabytes (ZB) em 2012
- ou 2,8 trilhes GB, dos quais apenas 0,5% sero analisados. Uma
questo importante que por detrs dessa quantidade de informao
encontram-se
implcitos
padres
de
comportamento
e
outras
caractersticas teis para traar cenrios e antecipar tendncias sobre
aspectos sociais e econmicos da sociedade contempornea. Desse modo,
percebe-se a importncia dos instrumentos que facilitem a busca, coleta,

Perspectivas em Cincia da Informao, v.19, n.3, p.52-81, jul./set. 2014

53

Como construir indicadores de Cincia, Tecnologia e


Inovao utilizando Web of Science, Derwent World Patent
Index, Bibexcel e Pajek?

Terry Lima Ruas;


Luciana Pereira

processamento e a anlise de dados a fim de se extrair algum


conhecimento dos mesmos (MEARIAN, 2011).
Dado este cenrio, o objetivo deste artigo apresentar um processo
que permita recuperar informao em base de dados bibliogrficos e de
patentes, que so a forma que os investimentos em poltica de cincia,
tecnolgica e inovao se tornam pblicos e podem ser mensurados. Para
alcanar esse propsito, este artigo apresenta um processo que integra
diferentes softwares livres de tal forma que seja possvel capturar,
organizar e apresentar as informaes que podem ser extradas de
diferentes bases de dados bibliogrficos e de patentes. Para ilustrar os
procedimentos e a funcionalidade do processo, ao final feita uma
aplicao no campo da biofotnica no Brasil, na China e nos Estados
Unidos.
Uma base de dados bibliogrficos uma coleo digital que contm
os registros da literatura publicada, com informaes sobre o que foi
publicado (artigo de peridico, conferncia, livro), quem publicou (autor,
instituio, pais) e onde se publicou (peridico A, B ou C). Quando os
esforos de pesquisas resultam numa soluo para um problema
tecnolgico, ao invs de se publicar o resultado na forma de um artigo, ele
ser patenteado, pois se acredita que a tecnologia possa ser incorporada
num produto ou processo e, por isso, deve ser protegida. Assim como os
dados bibliogrficos, h um sistema similar que so as bases de dados de
patentes, as quais fornecem informaes sobre inventor, inveno e
prazos de validade de um invento.
O carter inovador deste artigo reside na estruturao do processo
que procura mostrar de forma didtica como utilizar ferramentas
computacionais na extrao de dados para fazer um mapeamento de um
determinado campo do conhecimento usando bases de dados
bibliogrficos e de patentes que contm milhares de informaes.
Enquanto na literatura h vrios estudos sobre modelos cientomtricos
avanados (COCCIA, 2005; GLNZEL, 2010) ou anlises que discutem
campos especficos do conhecimento, tais como os estudos sobre a
biotecnologia realizados por De Moura e Caregnato (2011) e da cincia da
informao feitos por Oliveira e Gracio (2011), no encontramos artigos
que expliquem efetivamente como o processo de recuperao de
informao das bases de dados utilizando ferramentas computacionais do
comeo ao fim.
Sendo assim, o processo de minerao e visualizao dos dados
proposto neste artigo foi elaborado para explicar os passos a serem
seguidos para extrao e filtro dos dados desejados da maneira mais
simples possvel. Com essas informaes possvel fazer anlises sobre a
evoluo de reas do conhecimento, seja dentro de um pas ou em
perspectiva comparada.
O presente artigo est organizado da seguinte maneira. A seo
introdutria apresenta a contextualizao e explicita o objetivo do artigo.
Na Seo 2 feita uma breve fundamentao terica do trabalho. Na
Seo 3 apresentada a metodologia utilizada para a execuo da

Perspectivas em Cincia da Informao, v.19, n.3, p.52-81, jul./set. 2014

54

Como construir indicadores de Cincia, Tecnologia e


Inovao utilizando Web of Science, Derwent World Patent
Index, Bibexcel e Pajek?

Terry Lima Ruas;


Luciana Pereira

pesquisa. Enquanto a seo 4 apresenta o processo e suas especificidades


de forma detalhada. A ltima seo apresenta as principais implicaes do
trabalho apresentado.

2 Como se mensura a produo cientfica e tecnolgica?


A cientometria pode ser definida como o campo do conhecimento
que se preocupa com os mtodos e ferramentas que auxiliam no processo
de mensurao e anlise das atividades de pesquisa cientfica. Os
resultados cientficos, frutos dos avanos do conhecimento, comumente
so difundidos de duas maneiras principais: i) na forma da literatura
cientfica e ii) em possveis aplicaes tecnolgicas. Em geral, se mensura
a produo literria a partir da anlise de indicadores bibliomtricos.
Enquanto que conhecimentos com potencial tecnolgico para ser aplicados
em produtos ou processos acabam por ser patenteados, que um termo
de posse de propriedade intelectual e que visa obter o monoplio daquela
aplicao com objetivos econmicos (ZITT; BASSECOULARD, 2008).
A avaliao de trabalho cientfico frequentemente medida por meio
de indicadores de produtividade cientfica. Dentre esses indicadores
cientomtricos, a bibliometria considerada o instrumento com o maior
potencial de fazer um mapeamento acurado dos desenvolvimentos dos
mais diversos campos cientficos (GLNZEL, 2012). Alguns indicadores
bibliomtricos padro incluem o nmero de artigos publicados, o impacto
medido pelo nmero total de citaes recebidas, o nmero mdio de
citaes por artigo, o nmero de artigos com contagem de citaes acima
da mdia e os valores potenciais de artigos adquiridos atravs fator de
impacto dos peridicos onde os artigos foram publicados. Enquanto que
na avaliao do status do autor, da instituio e de um pas importante
saber em quais peridicos os resultados de pesquisa foram publicados, at
que ponto eles foram notados e quem os notou, caractersticas
mensuradas pelo processo de citao.
A tcnica favorita para o mapeamento da cincia feita por meio de
citao entre os documentos, palavras-chave e descritores textuais
extrados do corpo do texto de documentos cientficos. Isso pode ser
alcanado atravs de estudos empricos em publicaes e caractersticas
de citaes, noes de qualidade cientfica, diferenas em prticas de
comunicao realizadas pelas diversas disciplinas, comparao com
julgamentos qualitativos dos pares, e outras mais. Todas essas atividades
tm como foco objetos centrais da pesquisa: a investigao da
transferncia e disseminao do conhecimento, assim como o estudo do
progresso cientfico e das mudanas em sua relao com a sociedade em
diversos aspectos (RAAN, 2000).
O status do peridico em que a pesquisa foi publicada tambm um
dos indicadores usados para avaliar cientistas e instituies, sendo obtidos
atravs do uso do fator de impacto. O fator de impacto de um peridico
uma medida da frequncia com a qual um artigo foi citado durante certo
perodo de tempo, sendo assim considerado um indicador de avaliao da

Perspectivas em Cincia da Informao, v.19, n.3, p.52-81, jul./set. 2014

55

Como construir indicadores de Cincia, Tecnologia e


Inovao utilizando Web of Science, Derwent World Patent
Index, Bibexcel e Pajek?

Terry Lima Ruas;


Luciana Pereira

qualidade de um peridico. Ele no deve ser usado para avaliar um artigo


ou cientista de forma individual.
Por sua vez, uma patente uma concesso pblica, conferida pelo
Estado, que garante ao seu titular um monoplio temporrio, de forma a
impedir que outros fabriquem, usem, ou vendam tal inovao livremente.
Em contrapartida, as informaes sobre patentes, que contm os pontos
essenciais sobre as reivindicaes que caracterizam a novidade no
invento, de domnio pblico, e, por isso, uma valiosa fonte de
informaes (JAPAN PATENT OFFICE, 2011).
Informaes sobre patentes, como a publicao de pedidos de
patentes no examinados, apresentam vrias vantagens exclusivas como
informaes tcnicas: abrange uma ampla variedade de tecnologias,
incluindo o estado-da-arte da tecnologia, bem como informaes sobre as
invenes estrangeiras no idioma nativo do leitor. Informaes sobre
patentes tambm incluem o contedo de um direito exclusivo ou um
direito de propriedade intelectual, que so, inevitavelmente, uma parte da
atividade econmica atual.
Alm disso, a informao sobre patentes uma indicao til para
as estratgias de desenvolvimento tecnolgico ou estratgias globais das
empresas
em
resposta

intensificao
da
concorrncia.
Consequentemente, as empresas, as universidades e os institutos de
pesquisa utilizam informaes sobre patentes ainda no estgio inicial de
sua P&D, a fim de identificar tendncias, para avaliar inovaes e evitar
infringir patentes em vigor, usando tais dados para gerir sua propriedade
intelectual.
Em termos de tcnicas para anlise de patentes, alguns mtodos
tm sido aplicados para reconhecer as tendncias de desenvolvimento
tecnolgico. Alguns desses mtodos utilizam tcnicas de minerao de
texto para analisar os dados textuais de documentos de patentes, como o
ttulo e resumo, outra tcnica utilizada anlise de citao de patentes,
que bastante semelhante citao bibliogrfica (MARCO, 2007).
Ao final, o objetivo das anlises bibliomtricas e de patentes
mensurar o processo de transformao e aplicao do conhecimento. A
partir do seu entendimento possvel identificar redes nacionais e
internacionais de colaborao, mapear a evoluo de novos campos da
cincia e da tecnologia, bem como conhecer a lgica interna de
desenvolvimento da cincia. Por essa razo, os mtodos cientomtricos
esto cada vez mais sendo utilizados para analisar a evoluo e as
tendncias em CTI. Apesar disso, fazer a interface entre a utilizao de
sistemas de informaes computacionais e interpretao dos dados
obtidos demanda conhecimentos interdisciplinares, que um dos
principais desafios das pesquisas nessa rea. Portanto, projetos mal
elaborados, clculos inadequados e avaliaes malfeitas de indicadores
cientomtricos influenciam negativamente a sua apreciao pela
comunidade cientfica, e, assim, prejudicam a aplicao de indicadores
cuidadosamente construdos (RAAN, 2005).

Perspectivas em Cincia da Informao, v.19, n.3, p.52-81, jul./set. 2014

56

Como construir indicadores de Cincia, Tecnologia e


Inovao utilizando Web of Science, Derwent World Patent
Index, Bibexcel e Pajek?

Terry Lima Ruas;


Luciana Pereira

Uma vez que a importncia das interaes entre os diversos campos


da CTI identificada, a necessidade do desenvolvimento de ferramentas
que descrevam empiricamente as diversas formas que essas podem tomar
fica evidente.

3 Extrao de conhecimento de base de dados


A tcnica de minerao de dados ser utilizada como procedimento
metodolgico para a realizao da pesquisa. O processo de Extrao de
Conhecimento em Base de Dados comumente chamada de KDD
(Knowledge Discovery in Databases) tem como objetivo coletar dados que
possuam uma relao de interesse por assunto e de validade para cada
dado extrado. Em outras palavras, esta tcnica utiliza-se de algoritmos de
aprendizado de mquina capazes de generalizar os fatos encontrados em
um grande repositrio de dados, na forma de regras de alto nvel
compreensveis ao ser humano e de grande valor para uma tomada de
deciso.
Quando se tenta realizar tarefas referentes ao descobrimento de
conhecimento em aplicaes do mundo real, percebe-se que as mesmas
podem ser de extrema complexidade e que a tarefa de minerao de
dados representa apenas uma poro, porm de grande importncia, do
processo global. Assim, o processo de KDD deve ser visto como sendo
composto por vrias etapas interligadas
(PONNIAH, 2001). Sob a
perspectiva de anlise de dados, a cientometria e o KDD esto fortemente
relacionados.
O processo de KDD interativo e iterativo, envolvendo diversas
etapas, sendo que cada etapa gera um conjunto de conhecimentos. Essas
etapas normalmente so realizadas de forma sequencial, ou seja,
preciso compreender o domnio de aplicao, selecionar e transformar os
dados para depois tentar encontrar padres nos dados. Por se tratar de
um processo interativo, as pessoas envolvidas na sua realizao devem
possuir um canal de comunicao que viabilize uma troca de informaes
transparente (FAYYAD, 1996).

3.1 Seleo dos dados


A escolha dos dados a se investigar uma tarefa importante tendo
em vista que, atravs deles explorar-se- o sistema social no qual se
deseja extrair algum tipo de conhecimento. A internet possui um nmero
quase que ilimitado de dados, portanto a seleo de quais dados sero
observados um pr-requisito indispensvel para esse trabalho. Graas a
grande quantidade de informaes disponveis o processamento de todo
esse repositrio seria algo computacionalmente invivel, seja por tempo
hbil ou por recursos de hardware/software.

Perspectivas em Cincia da Informao, v.19, n.3, p.52-81, jul./set. 2014

57

Como construir indicadores de Cincia, Tecnologia e


Inovao utilizando Web of Science, Derwent World Patent
Index, Bibexcel e Pajek?

Terry Lima Ruas;


Luciana Pereira

3.1.2 Domnio de aplicao


a rea do conhecimento sobre o qual se deseja estudar e do qual
sero extrados os dados que serviro de base para a gerao de
informao, que ser interpretada, transformando-se em conhecimento,
que atuar como apoio a tomada de decises. Nessa etapa preciso estar
familiarizado com o campo a ser estudado.

3.1.3 Seleo dos repositrios


Para analisar a produo cientfica (artigos) existem diversas bases
que armazenam publicaes dos ltimos anos. Dentre os mais conhecidos
citados podemos citar:
ISI Web of Science (ISI WOS)
Scopus
Google Scholar
NLMs MEDLINE
De acordo com (BARLAN, 2010), (FALAGAS, PITSOUNI, et al.,
2008), (MIKKI, 2010), essas bases no cobrem a rea cientfica da
mesma maneira. Isto , cada base possui uma caracterstica que a difere
das outras, seja pelo tipo de dado que essa possui ou pela facilidade em
exportar o contedo desejado.
Existem repositrios especializados em trabalhos publicados na rea
mdica como no caso do NLM's MEDLINE. Outros se concentram em
armazenar trabalhos acadmicos publicados nas mais diversas reas do
conhecimento, caso do Google Scholar. Algumas bases de dados, como
por exemplo, a ISI WOS, possuem tamanha complexidade e valor
agregado que o seu acesso restrito somente algumas instituies que
pagam pelo seu uso podem utiliz-las. H outras caractersticas dessa
base, tais como funcionalidade. possvel exportar dados armazenados
pela ISI WOS automaticamente. Porm, o mesmo no possvel com o
sistema Google Scholar.
No mbito das produes tecnolgicas (patentes) possvel citar
alguns repositrios mais tradicionais, conhecido como a trade:
a)Escritrio Americano de Patentes (USPTO)
b)Escritrio Europeu de Patentes (EPO)
c)Escritrio Japons de Patentes (JPO)
A Derwent World Patent Index (DWPI) que um banco de dados
que contm os pedidos e concesses de patentes tendo como fonte 44
autoridades mundiais emissoras de patentes. Tendo em vista todas as
bases de dados consideradas para o projeto, e os critrios de seleo
estudados e explorados, delimitaram-se como fontes deste estudo os
repositrios ISI Web of Science (WOS) para as publicaes cientficas e
Derwent Patent Index (DWPI) para as publicaes tecnolgicas.

Perspectivas em Cincia da Informao, v.19, n.3, p.52-81, jul./set. 2014

58

Como construir indicadores de Cincia, Tecnologia e


Inovao utilizando Web of Science, Derwent World Patent
Index, Bibexcel e Pajek?

Terry Lima Ruas;


Luciana Pereira

3.2 Coleta dos dados


Para facilitar a tarefa de processamento dos dados optou-se por
utilizar softwares gratuitos. Dentre os diversos softwares disponveis,
uma pr-seleo estabeleceu quais os programas seriam testados para
avaliao de suas funcionalidades. Tomou-se como base o artigo de Cobo
(2011) o qual elenca diversos softwares de processamento e visualizao.
Esse artigo faz uma anlise profunda levando em conta as principais
caractersticas de cada programa, analisando aspectos como: medidas de
normalizao, algoritmos de agrupamento, capacidade de eliminao de
rudos, tipos de anlise bibliomtrica, elementos de pr-processamento,
mtodos de anlises, entre outras funcionalidades. Aps consultar o
estudo apresentado, testes com cada um dos programas foram explorados
no intuito de melhor entend-los e validar as informaes. Excluiu-se a
utilizao do VantagePoint, CoPalRed e o IN-SPIRE, pois todos esses so
softwares comerciais. Apesar de muito completos, a obteno de uma
licena para seu uso fica fora do escopo financeiro desse projeto.

3.2.1Programas de processamento de dados


i)Bibexcel
O Bibexcel, embora no tenha uma interface intuitiva, permite a
construo de uma linha do tempo interessantes que mostra a relao
entre o nvel de citao entre os autores e o respectivo ano no qual isso
ocorreu. Essa informao, atrelada com os trabalhos em si, de cada autor,
faz com que seja possvel mapear um trabalho/ideia/inovao feita por um
desses autores, desde sua primeira publicao at os dias mais recentes.
Tambm possvel saber o quo importante um trabalho fora
conceituado, de modo a tornar-se referncia para futuros trabalhos. Uma
medida interessante tambm saber como trabalhos de um mesmo autor
esto
relacionados
com
as
referncias
de
outros
trabalhos
contemporneos. Com a informao do resumo possvel relacionar como
trabalhos, altamente referenciados, propiciam que novas ideias,
totalmente divergentes entre si, surjam.
Uma desvantagem desse programa que basta se equivocar em
uma etapa para que o mesmo seja encerrado sem maiores informaes.
Uma vantagem a sua flexibilidade de integrao com outras ferramentas
como Pajek, VOSViewer, Mapequation, NetDraw, Ucinet e outros. Alm
disso, ele capaz de pegar dados de diversas fontes, como Scopus e WOS
(PERSSON, DANELL; SCHNEIDER, 2009).
ii)Science of Science Tool (SciTool)
Ao primeiro contato mostra-se uma ferramenta muito bem
estruturada pedindo que seja feito um registro antes de qualquer ao. O
software apresentado em diversas conferncias e defendido por vrios
pesquisadores. Para visualizao o software atende todos os requisitos,
fazendo com que os dados processados possam ser vistos em forma de

Perspectivas em Cincia da Informao, v.19, n.3, p.52-81, jul./set. 2014

59

Como construir indicadores de Cincia, Tecnologia e


Inovao utilizando Web of Science, Derwent World Patent
Index, Bibexcel e Pajek?

Terry Lima Ruas;


Luciana Pereira

Tree View (prefuse beta), Tree Map (prefuse beta), Balloon Graph
(prefuse alpha), Radial Tree/Graph (prefuse alpha).
O
software
muito
rpido, amigvel, possui
diversas
funcionalidades, filtros, algoritmos de processamento, visualizao. No
entanto, o programa gerou muitos erros para os exemplos dados, talvez
por alguma incompatibilidade de verso do software.
Por exemplo, na visualizao dos dados pelo 'Visualization >
Networks > GUESS nenhum comando executado na aba de interpreter
parece funcionar adequadamente. Uma vantagem poder configurar
quanto de memria ser alocada para subir o programa (COBO, et al,
2011); (SCI TEAM, 2009).
iii) CiteSpace II
Dentre os programas disponveis gratuitamente esse o que oferece
mais opes quanto a anlise bibliomtrica. Essa ferramenta capaz
receber dados de diversas fontes como: WOS, PubMed, arXvid e
SAO/NASA Astrophysics Data System. Alm de tambm trabalhar com
dados de patentes como o DWPI.
possvel conduzir diferentes tipos de anlises bibliomtricas
atravs de sua utilizao como: co-autores, instituies de co-autores,
pases de co-autores, ocorrncia de categorias de assuntos, co-citao de
autores, redes de journals, entre outras. A nica caracterstica tcnica que
o difere do Bibexcel a utilizao de algumas medidas de normalizao de
dados.
Essa ferramenta possui um arcabouo completo para anlise
bibliomtrica. Ela fornece os materiais necessrios para detectar, analisar
e visualizar padres e tendncias em registros cientficos. No entanto, a
sua utilizao no intuitiva e suas documentaes so pouco detalhadas
fazendo com que o usurio precise investir mais tempo em seu estudo
(CHEN, 2003), (CHEN, 2006), (CHEN, 2004).
iv) Leydesdorffs Software
O programa desenvolvido por Loet Leydesdorff bem explorado
sendo material de estudo para diversos trabalhos no meio acadmico.
Essa ferramenta possibilita algumas anlises bibliomtricas como: copalavras, co-autores, grficos de acoplamento entre autores e peridicos,
e co-citao entre autores.
A documentao para sua utilizao confusa e disponibilizada de
maneira muito dispersa o que dificulta o entendimento do mesmo. Outro
ponto que vale a pena ressaltar que o Leydesdorffs Software, no
possui mecanismos de pr-processamento e normalizao de dados, o que
pode comprometer alguns estudos bibliomtricos dependendo do objetivo
do trabalho (LEYDESDORFF, N/A).
v)Network Workbench Tool (NWBT)
Essa ferramenta muito similar ao Science of Science Tool
(SciTool), ambas possuem os mesmos mdulos de pr-processamento e
normalizao de dados. Ambos podem ler diversos formatos de dados,
como ISI WOS, Scopus, Bibtex e EndNote Export Format.

Perspectivas em Cincia da Informao, v.19, n.3, p.52-81, jul./set. 2014

60

Como construir indicadores de Cincia, Tecnologia e


Inovao utilizando Web of Science, Derwent World Patent
Index, Bibexcel e Pajek?

Terry Lima Ruas;


Luciana Pereira

O NWBT possui um excelente manual de usurio que explica a


ferramenta em detalhes, alm de explorar a importantes aspectos do
mapeamento cienciomtrico. Tanto o NWBT quanto o SciTool so as
nicas ferramentas que investigam essa questo. No entanto, assim como
no SciTool no possvel fazer anlises completas de co-autores e cocitaes, prejudicando muito a sua escolha como um programa de anlise
bibliomtrica para objetivo desse trabalho (NWB TEAM, 2006).

3.3 Interpretao dos resultados


Os usurios envolvidos devem interpretar os padres extrados e,
para tal, podem lanar mo de ferramentas estatsticas e de visualizao
que permitam fazer uma leitura" precisa sobre os resultados. Isso
possibilitar a verificao da validade e novidade, ou mesmo, a
(ir)relevncia dos padres encontrados.

3.3.1Programa de mapeamento visual


i)VOSViewer
uma ferramenta focada na visualizao e construo de mapas
bibliomtricos. Com ele mapas podem ser criados a partir de dados de
rede, atravs das tcnicas de mapeamento VOS e agrupamento VOS. O
VOSViewer pode ser usado para explorar mapas sob diferentes
perspectivas, cada uma enfatizando uma caracterstica em especfico
como: publicaes, autores, mapas de palavras-chave, co-ocorrncia de
citaes, entre outras.
A descrio e a estrutura que suporta essa ferramenta so bem
construdas, inclusive possvel executar a ferramenta diretamente da
pgina pela qual o programa disponibilizado. Fazendo com que o mesmo
seja portvel para inmeras plataformas. O prprio programa possui um
manual que explica suas caractersticas, mas a falta de exemplos prticos
faz com que seu entendimento seja restrito a teoria apresentada. Seria
interessante se o prprio manual explorasse exemplos prticos para que o
usurio fosse capaz de validar os pontos apresentados nos manual. Vale
ressaltar que o VOSViewer no capaz de construir nenhum mapa de
redes bibliomtricas, apenas visualiz-lo (ECK e WALTMAN, 2009); (ECK e
WALTMAN, 2010).
ii)Pajek
Assim como o VOSViewer esse um programa focado apenas na
visualizao de dados bibliomtricos, ou seja, no possvel construir
qualquer tipo de mapa com ele, apenas visualiz-lo. Essa ferramenta
largamente utilizada na comunidade cientfica, tanto que na grande
maioria dos programas de anlise bibliomtrica existe a opo de exportar
os dados para serem utilizados pelo Pajek. At mesmo o VOSViewer
disponibiliza um modo que executa os mesmos arquivos utilizados pelo
Pajek (BATAGELJ e MRVAR, 2008).
A existncia de um Wiki para o programa agrega muito a sua
utilizao, pois possvel trocar informaes diretamente com os usurios
Perspectivas em Cincia da Informao, v.19, n.3, p.52-81, jul./set. 2014

61

Como construir indicadores de Cincia, Tecnologia e


Inovao utilizando Web of Science, Derwent World Patent
Index, Bibexcel e Pajek?

Terry Lima Ruas;


Luciana Pereira

da ferramenta. Devido a sua larga utilizao possvel encontrar muitos


documentos que ensinam a utiliz-lo em conjunto com outras ferramentas
e inclusive a explor-lo em detalhes.

4 Processo de integrao de um sistema de informao


para mapear Cincia, Tecnologia e Inovao
Nesta seo apresentamos um processo que integra softwares livres
que, quando acoplados, formam um sistema para obter informaes sobre
dados de CTI de um campo do conhecimento previamente escolhido. A
elaborao de um sistema modular e genrico tem como principal objetivo
torn-lo flexvel para que esse possa ser aplicado aos mais diversos
campos de conhecimento que se deseja estudar. Separando cada etapa do
sistema em um componente independente possibilita que as etapas de
extrao, processamento e visualizao de informao se adaptem s
necessidades da pesquisa.
Cada componente do sistema especializado em uma atividade e
com atribuies bem definidas. possvel agrupar inmeras tarefas em
um nico estgio, ganhando tempo, mas o sistema ficaria dependente de
uma ferramenta e/ou base de dados nica. Como essa abordagem
tornaria o processo muito limitado, optou-se pela escolha de mdulos
desacoplados. Nesse processo, cada varivel do sistema pode ser
substituda por outro, caso este desempenhe melhor a funo desejada. A
Figura 1 ilustra o fluxograma do processo.
O primeiro mdulo (1) o ponto de partida no qual se define o
estudo de caso e os repositrios de dados que possuiro os registros
extrados. Nesse mdulo aplicado o filtro de buscas, que recuperar os
dados que sero processados nas prximas etapas, aps serem extrados.
O segundo mdulo (2) tem como por objetivo processar e formatar os
dados obtidos atravs das ferramentas selecionadas. Muitas vezes, um
nico programa de processamento no suficiente para que os dados
sejam trabalhados a ponto de serem exportados para a prxima etapa do
sistema. Desse modo, programas auxiliares podem ser utilizados, no
intuito de refinar os resultados obtidos pelos softwares de processamento.
O ltimo mdulo (3) responsvel pela consolidao dos dados obtidos,
na forma de mapas e tabelas para que possam ser analisados
adequadamente.

Perspectivas em Cincia da Informao, v.19, n.3, p.52-81, jul./set. 2014

62

Como construir indicadores de Cincia, Tecnologia e


Inovao utilizando Web of Science, Derwent World Patent
Index, Bibexcel e Pajek?

Terry Lima Ruas;


Luciana Pereira

Figura 1- Processo de um sistema de informao para mapeamento da


CTI

Fonte: Elaborado pelos autores

Nas prximas sees so explicadas as etapas do processo para


especificao, obteno, coleta, pr-processamento, processamento e
visualizao dos dados para dois repositrios internacionais. O repositrio
Web of Science (WOS) foi escolhido por ser uma base bastante ampla e
uma das mais utilizadas em estudos cientomtricos. A base Derwent
World Patents Index (DWPI) um banco de dados que contm pedidos e
concesses de patentes tendo como fonte quarenta e quatro autoridades
mundiais emissoras de patentes.
A escolha do Bibexcel como programa de processamento e do Pajek
como de visualizao ilustram uma deciso da pesquisa, que teve como
base as experincias obtidas com os testes em cada software. Bibexcel e
Pajek tambm apresentaram um melhor custo/benefcio quanto a sua
facilidade de operao e com seu poder de processamento para o escopo
escolhido. Outro quesito importante no processo de seleo foi a
compatibilidade entre os softwares de processamento (Bibexcel) e de
visualizao (Pajek) e os repositrios, pois alm de serem livres se
mostraram bastante completos na funcionalidades necessrias para
realizar um mapeamento das bases WOS e DWPI.

4.1 Mdulo de definio do repositrio, campo do


conhecimento e busca de dados
Antes de coletar qualquer tipo de informao necessrio estudar o
campo do conhecimento (e.g. nanotecnologia, fsica das partculas,
biofotnica) que se deseja coletar informaes. A familiarizao com o
objeto de estudo imprescindvel para que se consiga investigar os
pontos relacionados. Para isso, v-se necessrio: analisar reas de
atuao em que esse campo se concentra, palavras chaves utilizadas
sobre o assunto, eventos relacionados rea, entre outros. Qualquer
material capaz de enriquecer o portfolio de palavras e termos de busca
deve ser considerado. Aps coletar o mximo de informaes possveis
Perspectivas em Cincia da Informao, v.19, n.3, p.52-81, jul./set. 2014

63

Como construir indicadores de Cincia, Tecnologia e


Inovao utilizando Web of Science, Derwent World Patent
Index, Bibexcel e Pajek?

Terry Lima Ruas;


Luciana Pereira

interessante adquirir sinnimos e variaes para que os resultados


encontrados na busca recuperem mais dados sobre o objeto de estudo.

4.2.1 Formulao de expresso lgica para o processo de


busca
Uma vez selecionadas as palavras e os termos interessante
construir uma expresso lgica de forma que o resultado obtido seja
relevante para o objeto desejado. Isso pode ser alcanado de diversas
maneiras, nesse trabalho optou-se pela utilizao de termos separados
por operadores lgicos com a seguinte estrutura: (<campo de busca> =
((<termo principal 1> OR <termo principal 2> OR ... <termo principal
N>) AND (<termo auxiliar 1> OR <termo auxiliar 2> OR ... <termo
auxiliar M>))) AND <delimitador 1> AND <delimitador 2> AND ...
<delimitador P>
O parmetro <campo de busca> utiliza o atributo Tpico (Topic),
que engloba quatro caractersticas dentro das publicaes cientficas no
WOS e duas no DWPI. No WOS tem-se as seguintes caractersticas
investigadas: ttulo (title), resumo (abstract), palavras chave do autor
(authors keyword), palavras chave especiais (special keywords). No DWPI
somente o ttulo e o resumo so considerados durante a varredura. Os
termos principais e auxiliares so resultados dos estudos feitos
anteriormente, no qual se especificou as principais palavras utilizadas
dentro do campo de atuao. importante ressaltar que em ambos os
repositrios a busca deve ser feita na alternativa avanada, pois essa
opo permite maior flexibilidade na confeco dos filtros de busca
(expresses lgicas) utilizadas. Na opo "bsica" de ambos os
repositrios as buscas s podem ser feitas com filtros pr-estabelecidos, o
que limita muito as opes/qualidade de busca.
Os delimitadores servem para direcionar a busca feita para algum
alvo em especfico. Um exemplo de delimitadores pode ser os pases a
serem investigados e tambm a lngua em que esses resultados devem
ser apresentados. Tanto WOS quanto o DWPI possuem delimitadores
distintos para essa tarefa. No WOS utilizou-se como delimitador o
parmetro pas, representado pela sigla CU, e o parmetro lngua,
representado pela palavra language. No DWPI utilizou-se o parmetro
de nmero de patente (Patent Number-PN) o qual o formato possui a
seguinte estrutura <XXZPTO>. Os primeiros dois caracteres representam
o cdigo do pas onde a patente foi registrada. Devido a uma restrio de
cinquenta caracteres no campo de busca no DWPI, foi necessrio
desmembrar o filtro inicial utilizado no WOS, de forma a manter sua
integridade. Em outras palavras, para um nico filtro utilizado no WOS
foram necessrios cinco filtros no DWPI, alterando-se apenas os termos
auxiliares utilizados. Isso fez mais rudos fossem gerados na amostra de
dados coletadas do DWPI.

Perspectivas em Cincia da Informao, v.19, n.3, p.52-81, jul./set. 2014

64

Como construir indicadores de Cincia, Tecnologia e


Inovao utilizando Web of Science, Derwent World Patent
Index, Bibexcel e Pajek?

Terry Lima Ruas;


Luciana Pereira

4.1.2 Selecionando o formato de exportao dos dados


importante escolher como e em que formato os resultados sero
exportados. Essa tarefa influencia todos os passos envolvendo o seu
processamento. Tanto o WOS e o DWPI possuem opes com
caractersticas especficas para exportar os seus resultados. No WOS
existem trs passos que guiam o processo de exportao dos resultados.
No primeiro escolhe-se a quantidade de publicaes a serem exportadas:
todas que se encontram na pgina, todas selecionadas ou um perodo
determinado pelo usurio. No entanto, devido a uma limitao do
repositrio somente possvel exportar 500 resultados por vez (essa
limitao tambm est presente no DWPI). No segundo passo, escolhe-se
a granularidade dos resultados, podendo variar desde algumas
informaes como ttulo, fonte e resumo, at o seu registro completo
contendo todas as informaes do resultado em adio as referncias
citadas. No ultimo passo escolhe-se o formato em que os resultados so
exportados, esses podem ser: html, bibtex, utf-8, Windows, Mac, entre
outros. Para conseguir um conjunto que pudesse ser aproveitado por
diferentes ferramentas de anlise o formato escolhido foi o de texto plano
(plain text).
A nica diferena entre o WOS e DWPI nessa etapa encontra-se no
passo dois. Para o DWPI tem-se a opo de obter os registros com o
nmero da patente, ttulo, cessionrios (assignees) e inventores em
adio ao resumo, ou o registro completo. Ao escolher salvar o resultado,
a ferramenta disponibiliza um arquivo de extenso .txt (texto) com o
seguinte nome: savedrecs.txt. Esse arquivo possui os registros obtidos
com o filtro de busca.

4.2 Pr-Processamento dos dados obtidos


A etapa de pr-processamento dos registros obtidos consiste em
preparar os dados para que esses possam ser processados de maneira
efetiva e que os rudos sejam minimizados. As operaes para contornar
esses rudos" devem compreender, entre outros, os seguintes aspectos:
i) padronizao dos valores dos atributos, ii) remoo de registros
duplicados, iii) tratamento e eliminao de rudos e iv) tratamento de
valores ausentes.

4.2.1Estruturao dos conjuntos obtidos


Cada repositrio possui um conjunto de caractersticas que
descrevem os dados armazenados neles. Todo conjunto ou subconjunto
obtido atravs da utilizao do filtro na forma de arquivos possui, para
cada registro, diversas entradas como: nome do autor, inventor, tipo de
registro, ano de publicao, referncias citadas, resumos, entre outros.
Devido limitao na exportao do conjunto de registros possvel que
se tenha inmeros arquivos, contendo diversos registros. No entanto,

Perspectivas em Cincia da Informao, v.19, n.3, p.52-81, jul./set. 2014

65

Como construir indicadores de Cincia, Tecnologia e


Inovao utilizando Web of Science, Derwent World Patent
Index, Bibexcel e Pajek?

Terry Lima Ruas;


Luciana Pereira

deseja-se consolidar todo o contedo de uma s vez. Para isso,


necessrio trabalhar com um nico arquivo, contendo todos os registros
indexados.
Desse modo, antes de inserir todos os registros em um nico
arquivo, necessrio converter esses subconjuntos em um formato que
se possa trabalhar. O intuito dessa atividade (realizada atravs software
livre Bibexcel,) transformar os arquivos com extenso .txt em arquivos
com extenso .doc, que facilita a consolidao e o processamento da
informao obtida. Uma vez aberto, dentro do programa deve-se navegar
pela estrutura de arquivos at o diretrio no qual se encontram os
arquivos savedrecs.txt obtidos. Essa atividade deve ser repetida at que
todos os sub-arquivos com os resultados possuam a extenso .doc. No
anexo A h um tutorial que explica esta tarefa.

4.2.2 Consolidao dos resultados


Dependendo do filtro de buscas utilizado a quantidade de arquivos
com extenso .doc pode ser maior do que um. Desse modo, ainda como
atividade de pr-processamento, necessrio consolidar todas as
ocorrncias em um nico arquivo. Para adicionar todos os contedos de
todos os arquivos em um nico seleciona-se os arquivos .doc desejados.
Para selecionar mais do que um arquivo, bastar manter a tecla ctrl
pressionada. Esses arquivos so mostrados no canto superior esquerdo do
programa, logo ao lado da rvore de diretrios. Em seguida, necessrio
inserir um nome e extenso para o arquivo resultado dessa operao. Isso
deve ser feito logo abaixo do campo Type new file name here no canto
direito do programa. Em seguida, clica-se em File->Append all selected
files to another, e tambm no OK que aparece aps a operao.
Essa etapa far com que um arquivo, aqui nomeado de
consolidado.doc, seja criado no diretrio raiz do programa. Esse arquivo
possuir em seu contedo todas as entradas dispostas nos arquivos
separados. Com os dados consolidados em somente um nico arquivo
necessrio edit-lo para que as entradas EF dos subconjuntos de dados
sejam excludas, mantendo somente a ultima ocorrncia. Essa entrada
delimita o fim do arquivo. Ento, deve-se mant-la somente para o ultimo
registro do conjunto total de dados. Caso contrrio pode-se ter um
processamento limitado ou deficitrio. Terminada essa etapa existe agora
um arquivo nico que pode ser explorado a fim de obter informaes
relevantes sobre os dados coletados.

4.3 Mdulo de processamento dos dados obtidos


Uma vez que o conjunto ou subconjunto estejam prontos, o
processamento de todas as informaes coletadas pode ser iniciado. Esse
processamento feito em dois grandes grupos para cada repositrio: o
primeiro chamado de referncia simples e o segundo de referncia
cruzada. No primeiro, observa-se a frequncia de um determinado
atributo em relao s ocorrncias para o conjunto de dados extrado. No
Perspectivas em Cincia da Informao, v.19, n.3, p.52-81, jul./set. 2014

66

Como construir indicadores de Cincia, Tecnologia e


Inovao utilizando Web of Science, Derwent World Patent
Index, Bibexcel e Pajek?

Terry Lima Ruas;


Luciana Pereira

segundo grupo analisa-se a correlao entre dois atributos em relao


frequncia dentre os registros obtidos. Somente o atributo referncias
citadas, do conjunto obtido pelo WOS, precisou passar por um
processamento personalizado. Essa caracterstica possui algumas
especificidades em relao utilizao do Bibexcel que necessitam de
uma tarefa de processamento personalizada.

4.3.1Extrao de referncias simples


Para analisar as caractersticas classificadas como simples dentro do
arquivo obtido pelo WOS e pelo DWPI escolheram-se os seguintes
atributos, por serem essenciais para a anlise de dados referente CTI.
WOS: Autores (AU); Referncias citadas (CR); Tipo de documento
(DT); Tipo de publicao (PT); Editores (PU); Agncias de financiamento
(FU); Categoria de assunto (SC); Nome de publicao (SO); Ano de
publicao (PY).
DWPI: Inventores (AU); Cdigo de classe Derwent- Campo de
pesquisa (DC); Cessionrios (AE); Nmero primrio de aquisio
Derwent Ano de registro (GA); Nmero de patente (PN).
Uma vez selecionado o atributo, necessrio processar o
arquivo.doc consolidado para se obter a distribuio frequncia desse
entre os registros contidos. No entanto, antes de processar a frequncia
propriamente dita uma atividade intermediria se faz necessria. Nessa,
obtm-se o segundo arquivo mais importante para o Bibexcel, de
extenso .out, que assim como o de extenso .doc, atua como base para
muitas outras sub atividades. A etapa de confeco do arquivo .out
contendo o atributo que se deseja verificar por registro a mesma, tanto
no repositrio WOS quanto no DWPI. As diferenas entre os dados de um
e de outro residem na natureza dos atributos estudados e seus valores.
H no DWPI um atributo GA, (Nmero primrio de aquisio Derwent) que
mostra o ano que a patente ou processo foi registrado. Porm, h uma
peculiaridade desse atributo que precisa ser trabalhada individualmente.
Para obter-se o arquivo base .out ver tutorial (ANEX0) B e atributo GA
(ANEXO C).

4.3.2 Extrao de referncias cruzadas


O processo de obteno das referncias cruzadas pode ser
classificado como uma tarefa mais complexa em relao s referncias
simples, que levam em considerao apenas um atributo. Nesse processo,
correlacionam-se atributos diferentes do mesmo documento entre si.
Mesmo com poucos registros, essa tarefa de difcil concluso e a ajuda
de um programa externo se mostra necessria. Tal programa pode ser
feito em qualquer linguagem que convenha ao usurio, desde que esse
consiga correlacionar informaes entre si.
Para iniciar o processo de referncias cruzadas necessrio ter os
arquivos base (.out) dos atributos que se deseja correlacionar. A ideia
transformar esses arquivos em um formato que o programa desenvolvido
Perspectivas em Cincia da Informao, v.19, n.3, p.52-81, jul./set. 2014

67

Como construir indicadores de Cincia, Tecnologia e


Inovao utilizando Web of Science, Derwent World Patent
Index, Bibexcel e Pajek?

Terry Lima Ruas;


Luciana Pereira

consiga manipul-los. Desse modo, transformou-se esses arquivos com a


extenso .out em arquivos do tipo .csv, nos quais os campos so
separados pelo caractere ;. Essa transformao pode ser feita utilizando
um editor de planilhas como: Open Office, BrOffice, Excel, etc. Uma vez
aberto o arquivo .out basta salv-lo no formato .csv usando como
separador o ;.
Em seguida, necessrio correlacionar as ocorrncias desses
registros em conjunto com o ndice dos mesmos, fazendo com que dois
atributos distintos de um mesmo registro possam ser processados. A ideia
nesse tipo de extrao de evidenciar quando dois atributos ou mais
ocorrem ao mesmo tempo.
Feito isso, o arquivo resultante, nesse artigo chamado de
br.autores.anopublicacao.txt, possui o mesmo formato base dos arquivos
com extenso .out e pode ser utilizado pelo Bibexcel no intuito de
processar a distribuio de frequncia para essa nova caracterstica.

4.3.3 Limpeza dos dados


A limpeza dos dados pode ser feita tanto no conjunto consolidado
quanto em seus subconjuntos. Os dados que esto no WOS e no DWPI j
se encontram em um formato no qual os rudos so mnimos. No entanto,
importante ter em mente que a tarefa de limpeza de dados propiciar
um resultado mais refinado e fiel, por isso sua explicao precede as
etapas seguintes. Uma vez que o arquivo .out seja obtido possvel
remover eventuais duplicadas que possam aparecer durante o
processamento dos dados e gerar um novo arquivo .out. (ANEXO E) para
realizar esse procedimento.

4.4 Programas de processamento auxiliares


Ao longo da realizao desse trabalho foram detectadas algumas
limitaes do software Bibexcel em relao ao: i) processamento de
atributos cruzados e i) formato dos registros de patentes do DWPI quanto
caracterstica nmero primrio de aquisio Derwent (GA). Para sanar
essas lacunas foram desenvolvidos dois programas na linguagem de
programao JAVA chamados de ReadWriteBuffer e FixDate.
Esses
programas foram registrados no Instituto de Propriedade Intelectual,
porm seu uso livre. Mais informaes podem ser obtidas no Anexo D.

4.5 Visualizao dos dados


A visualizao dos dados a tarefa que apresenta as informaes
extradas dos dados coletados e processados at o momento. A exibio
dos dados, nesse trabalho, feita de duas maneiras: atravs de tabelas
(contendo os detalhes sobre as caractersticas e situaes analisadas) e
atravs da construo de mapas de visualizao. As tabelas resultam
diretamente das etapas apresentadas nas sees anteriores. No entanto,
os mapas precisam de algumas etapas adicionais e programas especficos

Perspectivas em Cincia da Informao, v.19, n.3, p.52-81, jul./set. 2014

68

Como construir indicadores de Cincia, Tecnologia e


Inovao utilizando Web of Science, Derwent World Patent
Index, Bibexcel e Pajek?

Terry Lima Ruas;


Luciana Pereira

para sua construo. Nesse artigo, os mapas de visualizao tm como


objetivo ilustrar as correlaes entre as citaes referenciadas dentro dos
registros das publicaes cientificas extradas do WOS.

4.5.1Construo de mapas de visualizao


Para a visualizao dos mapas que trazem as redes de colaborao
entre os trabalhos publicados e seus autores, foi utilizado um software
livre chamado Pajek. Esse processo foi dividido em duas sub-tarefas: a
primeira concentra-se no processamento dos dados feito pelo Bibexcel e a
segunda foca na visualizao dos dados exportados para o Pajek.

4.6 Mdulo de apresentao e anlise


Essa seo apresenta de forma sinttica o tipo de informao que
ser obtida aps a aplicao do processo proposto no artigo. Embora ela
se chame anlise, no haver discusso do caso estudado por no ser
esse o escopo do artigo. Os experimentos apresentados foram realizados
para testar o processo. Os dados apresentados referem-se ao campo do
conhecimento chamado de biofotnica. Aps aplicar os filtros sob os
repositrios apresentados foi obtido um conjunto de dados representativos
para os pases em questo: Brasil, China e EUA. Para o WOS, que abrange
as publicaes cientficas, o Brasil apresentou 1595 registros, a China
7144 e os EUA 44349. Para o DWPI, no qual se encontram os dados
referentes s publicaes tcnicas, o Brasil apresentou 902 registros, a
China 9070 e os EUA 11680. A Figur 2 apresenta um resumo dos dados
obtidos.
Figura 2 - Quantidade de registros obtidos nos repositrios WOS e DWPI
para o perodo selecionado

Fonte: Elaborado pelos autores

A figura 3 apresenta o atributo simples pas e o ano de publicao.


Os dados obtidos atravs dos nmeros de registro - mostrados na Figura
2- contemplam publicaes desde 1963 at 10 de setembro de 2012, que
parcial, pois os dados foram coletados ainda no incio do terceiro quartil
do mesmo.

Perspectivas em Cincia da Informao, v.19, n.3, p.52-81, jul./set. 2014

69

Como construir indicadores de Cincia, Tecnologia e


Inovao utilizando Web of Science, Derwent World Patent
Index, Bibexcel e Pajek?

Terry Lima Ruas;


Luciana Pereira

Figura 3- Relao de quantidade de publicaes por ano entre Brasil,


China e EUA.

Fonte: Elaborado pelo autores

A figura 4 mostra um atributo simples para a base DWPI, a qual


retrata a relao da quantidade de patentes registradas nos ltimos doze
anos no Brasil, China e EUA.
Figura 4 - Quantidade de patentes por ano entre Brasil, China e EUA.

Fonte: Elaborado pelos autores

Por fim, apresentamos os mapas de visualizao para detectar as


redes de colaborao entre os autores mais citados em Biofotnica no
Brasil, China e EUA. O Anexo F mostra em detalhes as etapas necessrias
para a construo das redes de colaborao obtidas. A Figura 5 mostra
uma rede brasileira bastante esparsa chegando a apresentar at mesmo
uma sub-rede, isolada do restante dos demais.

Perspectivas em Cincia da Informao, v.19, n.3, p.52-81, jul./set. 2014

70

Como construir indicadores de Cincia, Tecnologia e


Inovao utilizando Web of Science, Derwent World Patent
Index, Bibexcel e Pajek?

Terry Lima Ruas;


Luciana Pereira

Figura 5 - Rede de colaborao entre autores e trabalhos citados em


Biofotnica no Brasil para publicaes cientficas.

Fonte: Elaborada pelo autor

Na China, o mapa construdo apresenta um perfil diferente em


relao ao Brasil. Na Figura 6 mostrada uma rede mais concentrada e
com blocos mais definidos, alm de ser evidente que o nmero de
ocorrncias por registros acompanhou o nmero de registros do pas, uma
vez que as dimenses dos crculos tambm so maiores se comparadas
com o Brasil.
Figura 6 - Rede de colaborao entre autores e trabalhos citados em
Biofotnica na China para publicaes cientficas.

Fonte: Elaborado pelos autores

Perspectivas em Cincia da Informao, v.19, n.3, p.52-81, jul./set. 2014

71

Como construir indicadores de Cincia, Tecnologia e


Inovao utilizando Web of Science, Derwent World Patent
Index, Bibexcel e Pajek?

Terry Lima Ruas;


Luciana Pereira

A Figura 7 apresenta a rede de colaborao formada pelos registros


extrados dos EUA. Pode-se visualizar que os EUA apresentaram uma
composio mais densa que Brasil e China. Enquanto que o perfil
brasileiro formado por ns pequenos, a China possui ns mesclados
(pequenos, mdios e alguns grandes), a rede norte-americana apresenta
uma distribuio mais homognea.
Figura 7 - Rede de colaborao entre autores e trabalhos citados em
Biofotnica nos EUA para publicaes cientficas.

Fonte: Elaborado pelos autores

5 Consideraes finais
A quantidade de dados que hoje produzida mostra-se muito maior
do que a capacidade de processamento dos mecanismos tradicionais. Um
dos grandes desafios de uma pesquisa cienciomtrica justamente
explorar o processo de recuperao de informao das bases de dados
atravs de ferramentas computacionais, do comeo ao fim. Por isso, o
principal objetivo deste artigo alcanado ao apresentar de forma didtica
um processo que auxilie os gestores da inovao sem conhecimento
avanados em computao a recuperar e a organizar uma grande
quantidade de dados em qualquer rea do conhecimento usando
softwares livres.
Hoje possvel identificar duas frentes principais na area da
cientometria: (i) na anlise de funcionalidades das ferramentas
bibliomtricas (programas de processamento e visualizao de dados) e
(ii) nos estudos de comportamentos e tendncias de um objeto de estudo
frente a um cenrio escolhido, mas com informaes j processadas. No
entanto, nenhum deles efetivamente explica como o processo de obteno
da informao realizado. Alm disso, embora estudos cientomtricos
tm sido construdos, os mesmos tm sido criticados por sofrerem srias
limitaes, tais como o perodo avaliado, falta de comparao seja em
relao s diferentes reas do conhecimentos, seja em relao regies

Perspectivas em Cincia da Informao, v.19, n.3, p.52-81, jul./set. 2014

72

Como construir indicadores de Cincia, Tecnologia e


Inovao utilizando Web of Science, Derwent World Patent
Index, Bibexcel e Pajek?

Terry Lima Ruas;


Luciana Pereira

ou pases, assim como as prprias especificidades do conhecimento inter e


intra reas.
Numa anlise geral, este artigo explica de forma detalhada as
principais
etapas
necessrias
para
operacionalizar
um
estudo
cienciomtrico, o que significa um avano em relao aos trabalhos
encontrados na literatura. Nessa estrutura, os procedimentos necessrios
sua aplicao foram agrupados em torno de trs elementos
constitutivos: Exportao dos Dados dos Repositrios, Processamento e
Visualizao dos Dados e Apresentao e Anlise da Informao. Para
realizar esse processo, preciso considerar uma srie de etapas. Dentre
essas podemos elencar: i) familiarizao com o estudo de caso, ii)
especificao dos repositrios de dados pertinentes, iii) extrao dos
dados, iv) limpeza, v) pr-processamento, vi) normalizao, vii)
processamento, reprocessamento, maturao dos dados, exportao, viii)
visualizao e ix) anlise dos mesmos.
Todas essas atividades foram condensadas de modo a culminarem
no processo de extrao e visualizao proposto. Atravs da pesquisa
conduzida foi possvel elaborar um processo que utiliza softwares livres de
processamento e visualizao de dados para base de dados bibliomtricos
e de patentes. Desse modo, entende-se que o processo possui atributos
capazes de dar um suporte metodolgico para queles que almejem
construir uma estrutura que permita a aplicao nas mais diversas reas
do conhecimento. O resultado ser a construo de indicadores de CTI
mais robustos. Alm disso, o processo foi elaborado de maneira a permitir
sua escalabilidade e portabilidade, dependendo do objeto de estudo
escolhido e dos componentes que o integram. Aplicado em todas as
etapas do tratamento de dados, o modelo atua como uma ponte entre os
estudos conduzidos por (i) e (ii).
Durante a pesquisa percebeu-se a necessidade de entender e
explicar cada componente do processo e como cada um corrobora para
que o resultado final possibilite uma anlise mais criteriosa. Desde a
escolha e familiarizao do objeto de estudo at a apresentao das
informaes obtidas, todas as etapas so essenciais e precisam ser
executadas de modo a possibilitarem uma concluso slida. O estudo
cienciomtrico feito tambm mostra a importncia de se analisar mais do
que um indicador e como o cruzamento de indicadores enriquecem a
pesquisa. A apresentao atravs de grficos e mapas de colaborao
ilustram de maneira sistmica como a rede se comporta e como atributos,
antes implcitos, so importantes para consolidar o conhecimento.
Em estudos futuros seria interessante contemplar outros
repositrios, alm do WOS e o DWPI, possibilitando que uma pesquisa
comparativa entre ambos. Aplicando o mesmo filtro de busca nas
diferentes bases de dados resultaria em conjuntos de dados distintos,
enriquecendo a anlise dos mesmos. De maneira anloga, esse cenrio
pode ser aplicado s ferramentas de processamento e visualizao de
dados utilizados. Processar e analisar o mesmo conjunto de dados por

Perspectivas em Cincia da Informao, v.19, n.3, p.52-81, jul./set. 2014

73

Como construir indicadores de Cincia, Tecnologia e


Inovao utilizando Web of Science, Derwent World Patent
Index, Bibexcel e Pajek?

Terry Lima Ruas;


Luciana Pereira

aplicaes distintas permitir obter resultados complementares entre si,


tornando as informaes obtidas mais robustas.
Outra oportunidade de aplicar o processo proposto seria atravs de
uma anlise de fontes de dados no estruturadas como: jornais, blogs,
portais web, sites de notcias, entre outros. Todas essas fontes no esto
sujeitas ao processo rigoroso de seleo que WOS e DWPI esto sujeitas.
Ento, conduzir um estudo cienciomtrico tendo como base repositrios
estruturados e no estruturados pode abrir novas possibilidades quanto
validade entre os contedos dos mesmos. Tendo em vista a quantidade de
informaes armazenadas nos repositrios, seria interessante estudar as
redes colaborativas entre os principais pesquisadores levando em
considerao a posio geogrfica de sua filiao e como isso influencia no
tipo e classificao de estudo conduzido.

Agradecimentos
Este artigo resultado de projetos de pesquisa financiados pelos
processos n 2011/14745-2, 2010/12119-4; 2009/10039-6 Fundao de
Amparo Pesquisa do Estado de So Paulo (FAPESP).
ANEXO A
Arquivo base .doc
Aps selecionado o arquivo .txt desejado segue-se as seguintes
instrues:
Selecionar Edit doc file->Replace line feed with carriage return .
Responder sim far com que o arquivo te extenso.txt original seja
mantido e um .txt2 seja gerado.
Misc->Convert to dialog format->Convert from Web of Science . Um
arquivo de extenso .doc ser gerado. Basta responder OK na janela
apresentada.
Essa atividade deve ser repetida at que todos os sub-arquivos com
os resultados possuam a extenso .doc.
ANEXO B
Arquivo base .out
Para obter-se o arquivo base .out segue-se as seguintes etapas:
Selecionar o .doc j convertido;
Clicar em View file;
No campo old TAG inserir o atributo que se deseja analisar (e.g.
AU, PY, DT, etc);
No campo direito, acima de the box selecione o separador que
considerado/utilizado para o atributo escolhido
Clique em Prep;
Ser gerado um arquivo com extenso .out com as ocorrncias da
old tag (atributo) escolhida em cada registro dentro do arquivo base
selecionado.
A etapa de confeco do arquivo .out contendo o atributo que se
deseja verificar por registro a mesma, tanto no repositrio WOS quanto
no DWPI.

Perspectivas em Cincia da Informao, v.19, n.3, p.52-81, jul./set. 2014

74

Como construir indicadores de Cincia, Tecnologia e


Inovao utilizando Web of Science, Derwent World Patent
Index, Bibexcel e Pajek?

Terry Lima Ruas;


Luciana Pereira

importante ressaltar que cada atributo possui uma caracterstica


especfica de formatao. Por exemplo, o nome dos autores de um artigo
publicado ou de inventores de uma patente, possuem seus nomes e
sobrenomes separados por espaos em branco. Enquanto que, os nomes
de diversos autores e inventores so separados entre si atravs de um
;. Nesse caso usar a opo de espaos em branco (Blank-separated
words (e.g. title)) como um separador (item (d)) pode no ser uma
alternativa interessante. Por outro lado, usar a opo de qualquer
caractere como separador (Any ; separated filed) pode trazer
informaes mais reais dos dados analisados.
Alm de cada atributo possuir um separador distinto importante
mencionar que para cada caracterstica analisada perguntas relacionadas
ao seu tratamento sero feitas antes que arquivo com extenso .out seja
concludo.
Aps obter o .out com as informaes de cada registro e tambm o
seu respectivo valor(es) pode-se trabalh-lo a fim de obter a frequncia
do dado atributo. Para isso seguem-se as seguintes etapas:
Selecionar o arquivo .out contendo o atributo que se deseja rastrear
a frequncia
Clicar em "View file"
Em "Frequency distribution Select type of unit" Selcionar "Whole
String"
Selecionar a opo "Sort descending" (para ordenar em ordem
decrescente);
Clicar em "Start"
Ser gerado um arquivo com extenso .cit com frequncia das
ocorrncias da old tag (atributo) escolhida e discriminada no arquivo
.out.
ANEXO C
Especificaes do atributo GA DWPI
As diferenas entre os dados de um e de outro residem na natureza
dos atributos estudados e seus valores. No DWPI existe um atributo que,
devido a seu formato caracterstico, precisou ser trabalhado
especificamente. O atributo GA (Nmero primrio de aquisio Derwent)
mostra o ano que a patente ou processo foi registrado. No entanto, esse
campo possui o seguinte formato:<ano>--<identificador>. Graas a esse
identificador no foi possvel extrair a distribuio de frequncia desse
atributo diretamente. Para tal objetivo, construiu-se um programa na
linguagem de programao JAVA, que utiliza o arquivo de extenso .out
(contendo o atributo GA e seu valor completo), o processa de maneira a
manter o nmero de registro o qual essa entrada pertence e o associa
com o ano contido no formato original. Essa tarefa faz uso de recursos
como arrays, strings e substrings a fim de ter como produto final um
arquivo similar o .out original. Esse arquivo mantm somente o <ano> do
formato original para o campo GA. Fazendo com que o valor do atributo
GA passe de <ano>--<identificador> para <ano> e assim atravs dos

Perspectivas em Cincia da Informao, v.19, n.3, p.52-81, jul./set. 2014

75

Como construir indicadores de Cincia, Tecnologia e


Inovao utilizando Web of Science, Derwent World Patent
Index, Bibexcel e Pajek?

Terry Lima Ruas;


Luciana Pereira

passos ilustrados no Anexo 2 tambm possvel processar sua


distribuio de frequncia.
ANEXO D
Programas Auxiliares
Por conta de limitaes de produto, o Bibexcel no trabalha de
maneira satisfatria quanto: (i) ao processamento de atributos cruzados e
com (ii) o formato dos registros de patentes do DWPI quanto
caracterstica nmero primrio de aquisio Derwent (GA) Ento,
construiu-se dois programas visando atuar nessas lacunas (i e ii),
chamados de ReadWriteBuffer e FixDate respectivamente.
Ambos os programas foram desenvolvidos na linguagem de
programao JAVA. Em (i) trabalha-se com dois arquivos extrados do
Bibexcel contendo apenas as entradas referentes a um determinado
atributo, e o seu respectivo ndice (que representa a qual registro esse
pertence). Em seguida esses arquivos so comparados e quando existe a
relao de igualdade entre os ndices um novo arquivo alimentado
contendo o registro do ndice comparado e o valor do mesmo, agora
representado pela combinao dos dois valores dos arquivos iniciais.
Em (ii) utiliza-se apenas um arquivo de entrada, responsvel por
armazenar todos os registros referentes ao atributo nmero primrio de
aquisio Derwent (GA), que contm a informao de quando (ano) a
patente foi registrada. Esse programa utiliza o arquivo exportado pela
ferramenta de processamento (Bibexcel), extrai somente os dados
pertinentes para que se tenha a informao desejada (data de registro da
patente) e constri um novo arquivo contendo tal informao que ser
processado normalmente.
ANEXO E
Limpeza de dados Pr processamento
As etapas seguintes ilustram uma das maneiras de refinar os dados
obtidos atravs de sua limpeza:
Selecionar o arquivo .out/oux/cap/etc desejado;
Clicar em View file;
Em "Frequency distribution Select type of unit" Selcionar "Whole
String"
Marcar as opes "Remove duplicates" e Make new out file
Clicar em "Start";
Selecionar OK na janela que ser aberta;
Ser gerado um arquivo com extenso .oux com o mesmo contedo
do arquivo .out, mas com as duplicatas removidas.
O arquivo gerado (.oux) pode ser trabalhado da mesma maneira
que o sua origem (.out). Em outras palavras, todas as funes disponveis
pelo programa Bibexcel disponveis para o arquivo .out continua
m vlidas para o arquivo .out.
ANEXO F
Redes de colaborao/ Mapas de colaborao
Para a construo das redes de colaborao utilizam-se as seguintes
etapas:

Perspectivas em Cincia da Informao, v.19, n.3, p.52-81, jul./set. 2014

76

Como construir indicadores de Cincia, Tecnologia e


Inovao utilizando Web of Science, Derwent World Patent
Index, Bibexcel e Pajek?

Terry Lima Ruas;


Luciana Pereira

Selecionar o arquivo .doc j convertido;


Clicar em View file;
No campo old TAG inserir o atributo que se deseja analisar (nesse
caso CD);
No campo direito, acima do item the box selecione o separador
que considerado/utilizado para o atributo escolhido. Para esse utiliza-se
o Any ; separated field
Clique em Prep;
Ser gerado um arquivo com extenso .out com as ocorrncias da
old tag (atributo) escolhida em cada registro dentro do arquivo base
selecionado.
Selecionar o .arquivo .out gerado;
Clicar em View file;
Em Edit out-files seleciona-se Keep only authors first initial.
gerado um arquivo com extenso .1st contendo o mesmo contedo do do
arquivo .out, mas agora mostrando apenas a primeira letra dos nomes do
atuores;
Seleciona-se o arquivo .1st gerado;
Clicar em View file;
Em Edit out-files seleciona-se Convert Upper Lower Case >
Good for Cited reference strings. gerado um arquivo com extenso
.low fazendo com que todas as entradas do arquivo .1st tenham o mesmo
padro;
Seleciona-se o arquivo .low gerado;
Clicar em View file;
Em "Frequency distribution Select type of unit" Selcionar "Whole
String"
Marcar as opes "Remove duplicates" e Make new out file
Clicar em "Start";
Selecionar OK na janela que ser aberta. Ser gerado um arquivo
com extenso .oux com o mesmo contedo do arquivo .low, mas com as
duplicatas removidas.
Selecionar o arquivo .oux contendo a correlao de atributos que se
deseja rastrear a frequncia;
Clicar em "View file";
Em "Frequency distribution Select type of unit" Selcionar "Whole
String";
Selecionar a opo "Sort descending" (para ordenar em ordem
decrescente);
Clicar em "Start". Ser gerado um arquivo com extenso .cit com
frequncia da correlao dos atributos contidos no arquivo .oux;
Selecionar o arquivo .cit gerado e clicar em "View file";
Na parte direita inferior do programa, no campo The List
selecionar as ocorrncias que deseja-se mapear. Para isso basta clicar no
registro e selecion-lo. Se for necessrio selecionar mais de uma
ocorrncia basta segurar a tecla Ctrl no teclado e escolher outras
ocorrncias. Para esse exemplo escolheu-se as primeiras 15 entradas.

Perspectivas em Cincia da Informao, v.19, n.3, p.52-81, jul./set. 2014

77

Como construir indicadores de Cincia, Tecnologia e


Inovao utilizando Web of Science, Derwent World Patent
Index, Bibexcel e Pajek?

Terry Lima Ruas;


Luciana Pereira

Clicar na opo Copy que fica a direita do campo The List;


Clicar me Clear e clicar novamente dentro do campo The List;
Clicar em Paste, que se encontra ao lado do boto Copy. Isso
far com que os registros copiados sejam colado no campo The List;
Selecionar o arquivo .oux;
Clicar em Analyze > Co-occurance > Make pairs via listbox.
Certifique-se de responder no para a pergunta que aparecer. Ser
gerado um arquivo de extenso .coc contendo as co-ocorrncias entre as
entradas selecionadas e todas as outras entradas.
Ao termino dessas etapas todos os pr-requisitos bsicos para a
preparao dos dados foram feitos. A partir desse ponto inicia-se o
processo de construo dos arquivos que sero utilizados pelo Pajek. Para
isso citam-se os seguintes passos:
Selecionar o arquivo . coc gerado;
Clicar em View file;
Em Mapping selecionar Create .net file for Pajek. Quando a
pergunta sobre arcos direcionados for exibida clique em no uma vez que
no se est utilizando esse tipo de mtrica. Na segunda pergunta sobre a
troca de valores basta responder yes. Ser gerado um arquivo com
extenso .net e um com extenso .net. A partir desse ponto j possvel
trabalhar a visualizao dos dados em si. No entanto, para um modelo
mais robusto necessrio ainda algumas tarefas;
Selecionar o arquivo de extenso .cit o qual escolheu-se as entradas
para a elaborao do arquivo com extenso .coc;
Clicar em "View file";
Em Mapping selecionar Create .vec file. Ser gerado um arquivo
de extenso .vec;
Selecionar novamente o mesmo arquivo .cit e em Edit out-files
seleciona-se Extract publication year from references. Ser gerado um
arquivo com extenso .dpy contendo as datas de publicao das entradas
do arquivo .cit;
Selecionar o arquivo .dpy gerado;
Clicar em "View file";
Em Mapping selecionar Create .clu file. Ser gerado um arquivo
de extenso .clu;
Nesse momento todos os arquivos base necessrios para a
visualizao dos dados pelo programa PAJEK foram concludos. Agora
basta import-los vec, .vet, .net e .clu) no programa para que a rede de
colaborao possa ser construda. Ainda no PAJEK na opo Networks
clicar no cone do diretrio (a esquerda do disquete) e selecionar o
arquivo de extenso .net gerado pelo Bibexcel. Em Partitions e Vectors
faa o mesmo processo, mas para os arquivos de extenso .clu e .vec
respectivamente. Em seguida na opo Draw executa-se a tarefa DrawPartition-Vector para a visualizao da rede de colaborao.

Perspectivas em Cincia da Informao, v.19, n.3, p.52-81, jul./set. 2014

78

Como construir indicadores de Cincia, Tecnologia e


Inovao utilizando Web of Science, Derwent World Patent
Index, Bibexcel e Pajek?

Terry Lima Ruas;


Luciana Pereira

Referncias
BATAGELJ, V.; MRVAR, A. Pajek Wiki, 2008. Disponivel
<http://pajek.imfm.si/doku.php>. Acesso em: 15 ago. 2012.

em:

BARLAN, J. Citations to the "Introduction to informetrics" indexed by


WOS, Scopus and Google Scholar. Scientometrics, , Budapest, Hungira, v.
82. , n. 3 , p. 495-506, 2010.
CAMPBELL, D. et al. Bibliometrics as a performance measurement tool for
researchevaluation: the case of Research Funded by the National Cancer
Institute of Canada. Disponivel em:American Journal of Evaluation, N/A,
v. 31, n. 1, p. 66-83, mar. 2010.
CHEN, C. CiteSpace. Visualizing Patterns and Trends in Scientific
Literature,
13
Setembro
2003.
Disponivel
em:
<http://cluster.cis.drexel.edu/~cchen/citespace/>. Acesso em: 20 ago.
2012.
CHEN, C. Searching for intellectual turning points: Progressive knowledge
domain visualization. In: NATIONAL ACADEMY OF SCIENCES OF THE
UNITED STATES OF AMERICA, 2004. Proceedings [S. l.]; [s. n.], 2004.
of the p. 5303-5310.
CHEN, C. CiteSpace II: Detecting and visualizing emerging trends and
transient patterns in scientific literature. Journal of the American Society
for Information Science and Technology, Publicado online,v. , n. , p. 359-377, 2006.
COBO, M.J.; LPEZ-HERRERA, A.G.; HERRERA-VIEDMA, E.; HERRERA, F.
Science mapping software tools: Review, analysis, and cooperative study
among tools. Journal of the American Society for Information Science and
Technology, New York, USA, v. 62 , n. 7 , p.1382-1402, 2011.
COCCIA, M. A scientometric model for the assessment of scientific
research performance within public institutes. Scientometrics, Budapest,
Hungira, v. 31, n. 1v. 65, n. 3, p. 307-321, 2005.
ECK, N. J. V.; WALTMAN, L. VOSviewer. Welcome to the VOSviewer web
site, 2009. Disponivel em: <http://www.vosviewer.com/>. Acesso em:
ago. 2012.
ECK, N. J. V.; WALTMAN, L. Software survey: VOSviewer, a computer
program for bibliometric mapping. Scientometrics, N/A, v. 84, n. 2, p.
523--538, 2010.
FALAGAS, M. E; PITSOUNI, E. I; MALIETZIS, G. A; PAPPAS, G.
Comparison of PubMed, Scopus, Web of Science, and Google Scholar:
strengths and weaknesses. The FASEB Journal, N/A, v. 22, n. 2 338-342,
2008.

Perspectivas em Cincia da Informao, v.19, n.3, p.52-81, jul./set. 2014

79

Como construir indicadores de Cincia, Tecnologia e


Inovao utilizando Web of Science, Derwent World Patent
Index, Bibexcel e Pajek?

Terry Lima Ruas;


Luciana Pereira

FAYYAD, U. Data Mining and Knowledge Discovery: Making Sense Out of


Data. IEEE Expert: Intelligent Systems and Their Applications, Piscataway,
USA, v. 11, n. 5, p. 20-25, Outubro 1996.
GANTZ, J.; REINSEL, D. The digital universe in 2020: Big data, bigger
digital shadows, and biggest growth in the far east. Framingham, USA ,
IDC iView: IDC Analyze the Future, 2012.
GLNZEL, .W. On reliability and robustness of scientometrics indicators
based on stochastic models. An evidence-based opinion paper. Journal of
Informetrics N/A, v. 4, n. 3, p. 313-319, 2010.
JAPAN PATENT OFFICE. Introduction to Patent Map Analysis, 2011.
Disponivel
em:
<http://www.trainingjpo.go.jp/en/uploads/text_vtr/pdf/Introduction%20to%20Patent%20Map
%20Analysis2011.pdf>. Acesso em: 25 out. 2012.
LEYDESDORFF, L. Communication and Innovation in the Dynamics of
Science & Technology, University of Amsterdam, N/A. Disponivel em:
<http://www.leydesdorff.net/software.htm>. Acesso em: ago. 2012.
MARCO, A. The Dynamics of Patent Citations. Economics Letters, N/A, v.
94, n. 2, p. 290-296, 2007.
MEARIAN, L. World's data will grow by 50X in next decade, IDC study
predicts. Compter World, N/A, junho, 2011. Disponivel em:
<http://www.computerworld.com/s/article/9217988/World_s_data_will_g
row_by_50X_in_next_decade_IDC_study_predicts>. Acesso em: 03 jul.
2012.
MOURA, A. M. M.; CAREGNATO, S. E. Co-autoria em artigos e patentes:
um estudo da interao entre a produo cientfica e tecnolgica.
Perspectivas em Cincia da Informao, Belo orizonte,Horizonte,
Horizonte, v. 16, n. 2, p. 153-167, 2011.
NWB TEAM. Network Workbench. A Workbench for Network Scientists,
N/A, 2006. Disponivel em: <http://nwb.slis.indiana.edu>. Acesso em: 15
ago. 2012.
OLIVEIRA, E.; GRACIO, M. C. Indicadores bibliomtricos em cincia da
informao: anlise dos pesquisadores mais produtivos no tema estudos
mtricos na base Scopus. Perspectivas em Cincia da Informao, Belo
Horizonte, v. 16, n. 4, p. 16-28, 2011.
PERSSON, O.; DANELL, R.; SCHNEIDER, J. W. Celebrating Scholarly
Communication Studies. A Festscrift for Olle Persson at his 60th Birthday.
[S. l.]: The Authors, 2009.
PONNIAH, P. DataWarehousing Fundamentals: A Comprehensive Guide for
IT Professionals. [S. l.]: AWiley-Interscience Publication, 2001.
RAAN, A. F. J. V. The interdisciplinary nature of science: theoretical
framework and bibliometric-empirical approach. In: WEINGART, P.;
STEHR, N. Practising Interdisciplinarity. Toronto: University of Toronto

Perspectivas em Cincia da Informao, v.19, n.3, p.52-81, jul./set. 2014

80

Como construir indicadores de Cincia, Tecnologia e


Inovao utilizando Web of Science, Derwent World Patent
Index, Bibexcel e Pajek?

Terry Lima Ruas;


Luciana Pereira

Press,
2000.
p.
66-78.
Disponivel
http://www.cwts.nl/TvR/documents/AvR-PractInterdisc.pdf. Acesso
03 jul. 2012

em:
em:

RAAN, A. F. J. V. Measurement of central aspects of scientific research:


performance, interdisciplinarity, structure. Measurement: Interdisciplinary
Research and Perspectives, Leiden, Netherlands, v. 3, n. 1, p. 1-19, 2005.
SCI TEAM. Sci Tool. A Tool for Science of Science Research & Pratice,
2009. Disponvel: ,https://sci2.cns.iu.edu/user/index.php> . Acesso em:
20 ago. 2012.
RUAS, T.L ; PEREIRA, L. "ReadWriteBuffer": Registro Programa de
Computador. Nmero: BR512014000077-0,: 31 jan. 2014, Instituto
Nacional da Propriedade Industrial.
RUAS, T.L ; PEREIRA, L. "FixDate": Registro Programa de Computador.
Nmero: BR512014000078-8, 31 jan. 2014, Instituto Nacional da
Propriedade Industrial.
ZITT, M.; BASSECOULARD, E. Challenges for scientometric indicators:
data demining, knowledge-flow measurements and diversity issues. Ethics
in Science and Environmental Politics, Luhe, Germany,v. 8, n. 1 p. 49-60,
2008.

Perspectivas em Cincia da Informao, v.19, n.3, p.52-81, jul./set. 2014

81

You might also like