Professional Documents
Culture Documents
E-CINCIA:
PARADIGMAS DA
DESCOBERTA DO
CONHECIMENTO
DANIEL CORDEIRO
KELLY R. BRAGHETTO
ALFREDO GOLDMAN
FABIO KON
71
RESUMO
ABSTRACT
DANIEL CORDEIRO
ps-doutorando
em Cincia
da Computao
no IME-USP.
KELLY ROSA
BRAGHETTO
professora
de Cincia da
Computao
do IME-USP.
ALFREDO
GOLDMAN
professor
associado de Cincia
da Computao
do IME-USP e diretor
do Centro
de Competncia
em Software Livre.
FABIO KON
professor titular
de Cincia
da Computao
do IME-USP.
73
1 Virtualizao uma
tcnica computacional que permite que
uma grande quantidade de mquinas virtuais seja criada dentro
de um nico computador. Dessa forma, os
usurios finais (cientistas) podem multiplicar a quantidade de
mquinas utilizadas
para o processamento
de seus experimentos
e compartilhar de forma segura o mesmo
conjunto de mquinas
fsicas.
2 Veja o verbete Open
science na Wikipdia:
http://en.wikipedia.
org/wiki/Open_science.
74
EVOLUO DA CINCIA
Mudanas significativas no processo
de criao de conhecimento so raras, mas
a histria mostra que elas ocorrem tanto
quando h a criao de uma nova ferramenta
conceitual que se mostra fundamental (por
exemplo, o Clculo Diferencial e Integral de
Newton), como quando uma nova ferramenta
tecnolgica (por exemplo, o microscpio eletrnico) permite a criao de novos tipos
de cincia.
Computadores desempenham um papel cada vez mais importante no processo
cientfico. Nos ltimos cinquenta anos, o
uso de ferramentas computacionais mudou
a forma como a cincia feita em reas diversas, como meteorologia e climatologia,
mecnica dos fluidos, astrofsica, qumica,
etc. No s o uso de computadores permitiu
o desenvolvimento de novos tipos de pesquisas nessas reas, como os novos desafios trazidos por elas promoveram grandes avanos
na teoria e prtica da cincia da computao.
As novas necessidades impostas pela cincia
esto promovendo uma mudana importante
no papel que a cincia da computao exerce
sobre outras reas. Gradualmente, a computao est deixando de ser apenas uma ferramenta de apoio a novas pesquisas para
se tornar uma parte fundamental das outras
reas com que interage e de seus mtodos
cientficos.
Jim Gray, vencedor do Prmio Turing de
1998, o Nobel da cincia da computao,
e um dos pioneiros em aplicaes de tcnicas computacionais para o tratamento de
grandes quantidades de dados gerados por
cientistas de outras reas, via nessa mudana uma verdadeira transformao no fazer
cincia. Em sua opinio, estaramos vivendo
o incio de um quarto paradigma, que redefinir a metodologia cientfica de diversas
reas do conhecimento (Hey et al., 2009).
O primeiro paradigma da metodologia
cientfica teria sido o empirismo. H milhares de anos, o processo de descoberta era
feito somente a partir de experimentos. Todo
o conhecimento acerca dos fenmenos natu-
75
76
E-SCIENCE HOJE
A cincia hoje, mais do que nunca, uma
atividade colaborativa. Um exemplo disso o
4 Projeto Worldwide
LHC Computing Grid:
http://wlcg.web.cern.
ch.
5 Taverna Workflow Management System:
http://www.taverna.
org.uk.
6 P
e gasus Work f low
Management System:
http://pegasus.isi.edu.
7 Projeto MyE xp eri ments: http://www.
myexperiment.org.
77
8 Projeto SETI@home:
ht tp: //setiathome.
berkeley.edu.
9 C
itizen Science Alliance: http://www.citizensciencealliance.
org.
10 Projeto Ancient Lives:
http://ancientlives.
org.
78
frequente para esse fato a falta de recursos fsicos, humanos e financeiros para criar e manter o ambiente computacional mnimo que
um requisito para a prtica da e-science. Entretanto, o surgimento de uma nova tecnologia
renovou as esperanas da comunidade cientfica em tornar a e-science mais acessvel.
Essa tecnologia a computao em nuvem.
CINCIA DA NUVEM
Plataformas de computao em nuvem revolucionaram a indstria de tecnologia da informao ao permitir que, pela primeira vez,
grandes quantidades de recursos computacionais (por exemplo, armazenamento, processamento ou aplicaes) fossem oferecidas aos
usurios como um servio sob demanda. Uma
nuvem abstrai uma estrutura computacional
complexa, tornando-a disponvel aos usurios
atravs de interfaces simples e acessveis por
uma rede (como a Internet). Outras caractersticas essenciais de uma nuvem so: compartilhamento de recursos, elasticidade (servios
podem ser alocados e liberados rapidamente,
conforme a demanda) e servio mensurado
(o que permite um uso mais eficiente dos
recursos por parte tanto dos usurios quanto dos provedores de servios de nuvem).
Atualmente, um dos grandes desafios
cientficos em computao conseguir efetivamente fazer e-science em nuvens computacionais. Antes, aplicaes que demandavam muito processamento eram executadas
em aglomerados ou em supercomputadores
paralelos (HPC, de high-performance computing). Hoje, uma tendncia clara o uso
da nuvem para o processamento de alto
desempenho. Tanto que a Amazon EC211,
um dos maiores provedores de servios de
nuvem, atualmente oferece uma plataforma
computacional especfica para HPC. Nela,
possvel comprar no apenas mquinas isoladas, mas instncias de aglomerados com as
caractersticas desejadas, como, por exemplo,
a presena de placas aceleradoras grficas
(GPUs) ou redes de alto desempenho.
Como uma forma de mostrar o poder
computacional que uma nuvem pode prover,
em 2011 foi realizado um teste de desempenho, do mesmo tipo que o usado para criar a
lista dos quinhentos supercomputadores mais
rpidos do mundo (projeto Top50012). Para o
teste, foi criada uma instncia de um aglomerado com 1.064 mquinas (17.024 ncleos)
do tipo eight extra large (que o modelo de
mquina mais caro e poderoso disponvel na
Amazon EC2). O desempenho dessa instncia foi equivalente ao de uma mquina com
240,09 TeraFLOPS13, que ficaria na posio 42
entre os maiores supercomputadores do mundo segundo a lista TOP500 de novembro de
2011. Essa mesma mquina ficaria na posio
102 da lista TOP500 de novembro de 2012.
Um dos principais interesses da e-science
relacionados s plataformas de computao
em nuvem a possibilidade de se executarem workflows cientficos. Apesar de todas
as relativas facilidades que existem hoje
para a alocao de aglomerados de mquinas, executar de forma eficiente um workflow
cientfico em um ambiente de nuvem ainda
um desafio. A execuo de um workflow
na nuvem envolve atribuir para cada tarefa
uma mquina e garantir as transferncias dos
dados para as tarefas sempre que necessrio.
Mesmo considerando as diversas garantias oferecidas por meio de contratos de qualidade de servio (SLAs, de service-level agreements), o ambiente fornecido pelas nuvens
no completamente conhecido e controlado. Por exemplo, ao se solicitarem recursos
computacionais na nuvem, no h garantia
de que os recursos fornecidos estaro alocados em uma mesma mquina fsica ou em
mquinas independentes. O desempenho de
um workflow depende de como essa alocao feita. Alm disso, quando um workflow
possui tarefas que trocam grandes quantidades de dados entre si, desejvel que essas
tarefas sejam executadas em mquinas adjacentes ou prximas (para se diminuir o tempo necessrio para a transmisso dos dados
entre as tarefas). Nos modelos tradicionais de
nuvem, no h garantia de que isso acontea.
A execuo de workflows em nuvens pode
se beneficiar do que hoje conhecido como
federao de nuvens, ou seja, nuvens forma-
79
14 Projeto Magellan
Cloud Computing for
Science: http://www.
alcf.anl.gov/magellan.
80
No incio do sculo XX, o fornecimento de energia eltrica era feito por centrais
eltricas locais, sem conexo umas com
DEMOCRATIZAO
DA E-SCIENCE
A cincia da computao deixou de ser
uma ferramenta de apoio para se tornar um
verdadeiro alicerce do processo de criao
de conhecimento em diversas cincias. As
mudanas trazidas pelo uso de seus conceitos, teoremas, tcnicas e mtodos provocaram o surgimento de um novo paradigma de
metodologia cientfica o que hoje se conhece por e-science (ou e-cincia). A coleta
e anlise de uma grande quantidade (antes
inimaginvel) de dados agora possvel com
o uso de computao. Experimentos com novos modelos podem ser realizados de forma
virtual, por meio de tcnicas como simulao. Isso possibilitou novas maneiras de se
fazer cincia. A cincia est se transformando progressivamente em e-cincia.
O uso de novas tcnicas de computao
paralela e distribuda, como a computao
em nuvem, promove a democratizao do
acesso ao poder computacional. Oportunidades de pesquisa que antes eram restritas ao
seleto grupo dos que tinham acesso a supercomputadores agora podem ser exploradas
por milhares de pesquisadores. Espera-se
que a evoluo dessas novas tecnologias,
aliada ao aumento da integrao da cincia
da computao s outras cincias, permita
que todo pesquisador tenha condies de
fazer pesquisa transformativa em qualquer
rea do conhecimento, promovendo novas
mudanas de paradigma na cincia.
B I B LI O G R AFIA
CARDELLI, Luca. Abstract Machines of Systems Biology, in Transactions on Computational Systems Biology III,
2005, pp. 145-68.
CINTHO, Mina et al. Data-intensive Analysis of HIV Mutations, in IEEE 8th International Conference on
E-Science. Chicago, 2012, pp. 1-7
EMMOTT, Stephen et al. (orgs.). Towards 2020 Science, 2006. Disponvel em: http://research.microsoft.com/
towards2020science/. Acesso em: 12/mar./2013.
HASHIZUME, Keiko. An Analysis of Security Issues for Cloud Computing, in Journal of Internet Services and
Applications, 4:5, 2013.
HEY, Tony et al. (eds.). The Fourth Paradigm: Data-Intensive Scientific Discovery, in Microsoft Research, 2009.
Disponvel em: http://research.microsoft.com/collaboration/fourthparadigm. Acesso em: 12/mar./2013.
JOHNSON, George. The World: In Silica Fertilization; All Science Is Computer Science, in The New York Times,
25/mar./2001. Disponvel em: http://www.nytimes.com/2001/03/25/weekinreview/the-world-in-silicafertilization-all-science-is-computer-science.html. Acesso em: 12/mar./2013.
KORPELA, Eric J. et al. Status of the UC-Berkeley SETI Efforts". Proc. SPIE 8152, in Instruments, Methods, and
Missions for Astrobiology XIV, 815212, 23/set./2011.
KUHN, Thomas S. The Structure of Scientific Revolutions. University of Chicago Press, 1962.
MEYER, Eric. Accessing and Using Big Data to Advance Social Science Knowledge. Oxford Internet Institute,
2013. Pgina Web do projeto de pesquisa: http://www.oii.ox.ac.uk/research/projects/?id=98. Acesso em:
12/mar./2013.
OREILLY, Tim. "The World's 7 Most Powerful Data Scientists", in Forbes, 2/nov./2011. Disponvel em: http://www.
forbes.com/sites/nicoleperlroth/2011/11/02/tim-oreilly-the-worlds-7-most-powerful-data-scientists/. Acesso
em: 12/mar./2013.
PENTLAND, Alex. Reinventing society in the wake of Big Data A Conversation with Alex (Sandy) Pentland. Edge, 30/
ago./2012. Disponvel em: http://www.edge.org/conversation/reinventing-society-in-the-wake-of-big-data.
Acesso em: 12/mar./2013.
RIMKUS, Carolina M. et al. Corpus Callosum Microstructural Changes Correlate with Cognitive Dysfunction in
Early Stages of Relapsing-Remitting Multiple Sclerosis: Axial and Radial Diffusivities Approach, in Multiple
Sclerosis International, v. 2011, 2011, pp. 1-7.
ZHANG, Qi et al. Cloud Computing: State-of-the-art and Research Challenges, in Journal of Internet Services and
Applications, 1(1), pp. 7-18, 2010.
80A
81
82
textos
REVISTA USP SO PAULO N. 97 P. 71-80A MARO/ABRIL/MAIO 2013