Professional Documents
Culture Documents
http://dx.org/10.1590/1981-5344/1678
52
de
e
1Introduo
Uma das principais caractersticas da sociedade da informao e do
conhecimento a velocidade com que os avanos cientficos e
tecnolgicos tm ocorrido. De acordo com Gantz e Reinsel (2012), a
produo global de dados atingiu a marca de 2,8 zettabytes (ZB) em 2012
- ou 2,8 trilhes GB, dos quais apenas 0,5% sero analisados. Uma
questo importante que por detrs dessa quantidade de informao
encontram-se
implcitos
padres
de
comportamento
e
outras
caractersticas teis para traar cenrios e antecipar tendncias sobre
aspectos sociais e econmicos da sociedade contempornea. Desse modo,
percebe-se a importncia dos instrumentos que facilitem a busca, coleta,
53
54
55
intensificao
da
concorrncia.
Consequentemente, as empresas, as universidades e os institutos de
pesquisa utilizam informaes sobre patentes ainda no estgio inicial de
sua P&D, a fim de identificar tendncias, para avaliar inovaes e evitar
infringir patentes em vigor, usando tais dados para gerir sua propriedade
intelectual.
Em termos de tcnicas para anlise de patentes, alguns mtodos
tm sido aplicados para reconhecer as tendncias de desenvolvimento
tecnolgico. Alguns desses mtodos utilizam tcnicas de minerao de
texto para analisar os dados textuais de documentos de patentes, como o
ttulo e resumo, outra tcnica utilizada anlise de citao de patentes,
que bastante semelhante citao bibliogrfica (MARCO, 2007).
Ao final, o objetivo das anlises bibliomtricas e de patentes
mensurar o processo de transformao e aplicao do conhecimento. A
partir do seu entendimento possvel identificar redes nacionais e
internacionais de colaborao, mapear a evoluo de novos campos da
cincia e da tecnologia, bem como conhecer a lgica interna de
desenvolvimento da cincia. Por essa razo, os mtodos cientomtricos
esto cada vez mais sendo utilizados para analisar a evoluo e as
tendncias em CTI. Apesar disso, fazer a interface entre a utilizao de
sistemas de informaes computacionais e interpretao dos dados
obtidos demanda conhecimentos interdisciplinares, que um dos
principais desafios das pesquisas nessa rea. Portanto, projetos mal
elaborados, clculos inadequados e avaliaes malfeitas de indicadores
cientomtricos influenciam negativamente a sua apreciao pela
comunidade cientfica, e, assim, prejudicam a aplicao de indicadores
cuidadosamente construdos (RAAN, 2005).
56
57
58
59
Tree View (prefuse beta), Tree Map (prefuse beta), Balloon Graph
(prefuse alpha), Radial Tree/Graph (prefuse alpha).
O
software
muito
rpido, amigvel, possui
diversas
funcionalidades, filtros, algoritmos de processamento, visualizao. No
entanto, o programa gerou muitos erros para os exemplos dados, talvez
por alguma incompatibilidade de verso do software.
Por exemplo, na visualizao dos dados pelo 'Visualization >
Networks > GUESS nenhum comando executado na aba de interpreter
parece funcionar adequadamente. Uma vantagem poder configurar
quanto de memria ser alocada para subir o programa (COBO, et al,
2011); (SCI TEAM, 2009).
iii) CiteSpace II
Dentre os programas disponveis gratuitamente esse o que oferece
mais opes quanto a anlise bibliomtrica. Essa ferramenta capaz
receber dados de diversas fontes como: WOS, PubMed, arXvid e
SAO/NASA Astrophysics Data System. Alm de tambm trabalhar com
dados de patentes como o DWPI.
possvel conduzir diferentes tipos de anlises bibliomtricas
atravs de sua utilizao como: co-autores, instituies de co-autores,
pases de co-autores, ocorrncia de categorias de assuntos, co-citao de
autores, redes de journals, entre outras. A nica caracterstica tcnica que
o difere do Bibexcel a utilizao de algumas medidas de normalizao de
dados.
Essa ferramenta possui um arcabouo completo para anlise
bibliomtrica. Ela fornece os materiais necessrios para detectar, analisar
e visualizar padres e tendncias em registros cientficos. No entanto, a
sua utilizao no intuitiva e suas documentaes so pouco detalhadas
fazendo com que o usurio precise investir mais tempo em seu estudo
(CHEN, 2003), (CHEN, 2006), (CHEN, 2004).
iv) Leydesdorffs Software
O programa desenvolvido por Loet Leydesdorff bem explorado
sendo material de estudo para diversos trabalhos no meio acadmico.
Essa ferramenta possibilita algumas anlises bibliomtricas como: copalavras, co-autores, grficos de acoplamento entre autores e peridicos,
e co-citao entre autores.
A documentao para sua utilizao confusa e disponibilizada de
maneira muito dispersa o que dificulta o entendimento do mesmo. Outro
ponto que vale a pena ressaltar que o Leydesdorffs Software, no
possui mecanismos de pr-processamento e normalizao de dados, o que
pode comprometer alguns estudos bibliomtricos dependendo do objetivo
do trabalho (LEYDESDORFF, N/A).
v)Network Workbench Tool (NWBT)
Essa ferramenta muito similar ao Science of Science Tool
(SciTool), ambas possuem os mesmos mdulos de pr-processamento e
normalizao de dados. Ambos podem ler diversos formatos de dados,
como ISI WOS, Scopus, Bibtex e EndNote Export Format.
60
61
62
63
64
65
66
67
68
69
70
71
5 Consideraes finais
A quantidade de dados que hoje produzida mostra-se muito maior
do que a capacidade de processamento dos mecanismos tradicionais. Um
dos grandes desafios de uma pesquisa cienciomtrica justamente
explorar o processo de recuperao de informao das bases de dados
atravs de ferramentas computacionais, do comeo ao fim. Por isso, o
principal objetivo deste artigo alcanado ao apresentar de forma didtica
um processo que auxilie os gestores da inovao sem conhecimento
avanados em computao a recuperar e a organizar uma grande
quantidade de dados em qualquer rea do conhecimento usando
softwares livres.
Hoje possvel identificar duas frentes principais na area da
cientometria: (i) na anlise de funcionalidades das ferramentas
bibliomtricas (programas de processamento e visualizao de dados) e
(ii) nos estudos de comportamentos e tendncias de um objeto de estudo
frente a um cenrio escolhido, mas com informaes j processadas. No
entanto, nenhum deles efetivamente explica como o processo de obteno
da informao realizado. Alm disso, embora estudos cientomtricos
tm sido construdos, os mesmos tm sido criticados por sofrerem srias
limitaes, tais como o perodo avaliado, falta de comparao seja em
relao s diferentes reas do conhecimentos, seja em relao regies
72
73
Agradecimentos
Este artigo resultado de projetos de pesquisa financiados pelos
processos n 2011/14745-2, 2010/12119-4; 2009/10039-6 Fundao de
Amparo Pesquisa do Estado de So Paulo (FAPESP).
ANEXO A
Arquivo base .doc
Aps selecionado o arquivo .txt desejado segue-se as seguintes
instrues:
Selecionar Edit doc file->Replace line feed with carriage return .
Responder sim far com que o arquivo te extenso.txt original seja
mantido e um .txt2 seja gerado.
Misc->Convert to dialog format->Convert from Web of Science . Um
arquivo de extenso .doc ser gerado. Basta responder OK na janela
apresentada.
Essa atividade deve ser repetida at que todos os sub-arquivos com
os resultados possuam a extenso .doc.
ANEXO B
Arquivo base .out
Para obter-se o arquivo base .out segue-se as seguintes etapas:
Selecionar o .doc j convertido;
Clicar em View file;
No campo old TAG inserir o atributo que se deseja analisar (e.g.
AU, PY, DT, etc);
No campo direito, acima de the box selecione o separador que
considerado/utilizado para o atributo escolhido
Clique em Prep;
Ser gerado um arquivo com extenso .out com as ocorrncias da
old tag (atributo) escolhida em cada registro dentro do arquivo base
selecionado.
A etapa de confeco do arquivo .out contendo o atributo que se
deseja verificar por registro a mesma, tanto no repositrio WOS quanto
no DWPI.
74
75
76
77
78
Referncias
BATAGELJ, V.; MRVAR, A. Pajek Wiki, 2008. Disponivel
<http://pajek.imfm.si/doku.php>. Acesso em: 15 ago. 2012.
em:
79
80
Press,
2000.
p.
66-78.
Disponivel
http://www.cwts.nl/TvR/documents/AvR-PractInterdisc.pdf. Acesso
03 jul. 2012
em:
em:
81