You are on page 1of 77

Gustavo Machado lvares de Lima

Bacharel em Cincias Fsicas e Biomoleculares

Orientador: Rafael V. C. Guido

ndice
Introduo
Importncia das estruturas 3D de protenas
Modelagem por homologia
Bases da modelagem

Funo da modelagem
Validaes bsicas
Validaes avanadas
Programas de modelagem
ViTaMIn

Estrutura De Uma Protena


Estrutura primria
Em protenas, o termo estrutura primria refere-se
sequncia linear de aminocidos que as compem.

Fonte: Bacteriology at UW-Madison - Lectures in Microbiology by Kenneth Todar

Estrutura De Uma Protena


Estrutura primria
Em protenas, o termo estrutura primria refere-se
sequncia linear de aminocidos que as compem.

A estrutura de uma protena


ditada basicamente pela
sua sequncia primria.

Fonte: Bacteriology at UW-Madison - Lectures in Microbiology by Kenneth Todar

Estrutura De Uma Protena


Estrutura secundria

-hlice
Molculas anfiflicas

Mantida devido a ligaes de


hidrognio dos grupos
carboxila nos resduos i e i+4

Estrutura De Uma Protena


Estrutura secundria

-folha
Molculas anfiflicas
Formada por -fitas
estabilizadas por ligaes de
hidrognio entre o grupo
carboxila e o grupo amida de
resduos diferentes

Estrutura De Uma Protena


Estrutura terciria
Resultado do enovelamento
de todas as estruturas
secundrias
Forma ativa da protena
A estrutura da protena
determina sua funo
cataltica

Posio Relativa Entre Os Resduos De Aminocidos

phi ngulo definido entre o


grupo amida e o carbono alfa da
unidade peptdica

psi ngulo definido entre o


carbono alfa e a carboxila da
unidade peptdica

Enovelamento
A protena teria que experimentar
todos os ngulos phi e psi para
cada ligao peptdica antes de
encontrar
o
enovelamento
correto?

Enovelamento
A protena teria que experimentar
todos os ngulos phi e psi para
cada ligao peptdica antes de
encontrar
o
enovelamento
correto?

Tempo mdio para dois ngulos


psi/phi distintos
10 Picosegundos-1 (10-13s-1)
18 ngulos/aa x 100 aminocidos
10-13s-1

18100 s
10-13

10140s

~ 10132 anos

Enovelamento
A protena teria que experimentar
todos os ngulos phi e psi para
cada ligao peptdica antes de
encontrar
o
enovelamento
correto?

Tempo mdio para dois ngulos


psi/phi distintos
10 Picosegundos-1 (10-13s-1)
18 ngulos/aa x 100 aminocidos
10-13s-1

18100 s
10-13

10140s

Idade do Universo = 1.5x1010 anos

~ 10132 anos

Enovelamento
A protena teria que experimentar
todos os ngulos phi e psi para
cada ligao peptdica antes de
encontrar
o
enovelamento
correto?

Tempo mdio para dois ngulos


psi/phi distintos
10 Picosegundos-1 (10-13s-1)
18 ngulos/aa x 100 aminocidos
10-13s-1

18100 s
10-13

10140s

~ 10132 anos

Paradoxo
de= Levinthal
Idade do Universo
1.5 10 anos
x

10

Importncia Das Estruturas 3D De Protenas


Planejamento de Frmacos
Baseado na Estrutura (SBDD)

Resduos importantes para a interao


Bolses para possveis ligantes

Carga eletrosttica da superfcie


Interao com outras protenas

Importncia Das Estruturas 3D De Protenas


Planejamento de Frmacos
Baseado na Estrutura (SBDD)

Resduos importantes para a interao


Bolses para possveis ligantes

Carga eletrosttica da superfcie


Interao com outras protenas

Entender a funo da
protena

Modelagem Comparativa por Homologia

Utiliza uma protena homloga


como molde para simular um
enovelamento
Restries so feitas de acordo
com a rotina computacional
empregada
Quanto maior o nmero de
modelos gerados, maior a
chance de encontrar um com
a energia prxima da mnima

Bases Da Modelagem Por Homologia


1. Identidade entre sequncias de aminocidos sugere semelhana
estrutural e funcional;
2. Protenas homlogas apresentam regies internas conservadas
(principalmente constitudas de elementos de estrutura secundria:
hlices- e fitas-);
3. As principais diferenas estruturais entre protenas homlogas
ocorrem nas regies externas, constitudas principalmente por alas
(loops), que ligam os elementos de estruturas secundrias.

Ala de baixa
identidade

Evoluo Das Protenas

Por que existe a necessidade


de conservao de regies
inteiras no genoma de
organismos distintos?

Conservao da Famlia SERA de Plasmodium sp.

Mercereau-Puijalon et al. Three multigene families in Plasmodium parasites: facts and questions. Int. J. Parasitol. 2002, 1323-1344

Evoluo Das Protenas

Conservao

Colunas bem
conservadas e com
alta score de
conservao

Fonte: EMBL Protein Evolution

Colunas idnticas
com o maior score
possvel de
conservao

Colunas com baixa


conservao e score
de conservao

Evoluo Das Protenas

Conservao

Colunas bem
conservadas e com
alta score de
conservao

Colunas idnticas
com o maior score
possvel de
conservao

Colunas com baixa


conservao e score
de conservao

Porque existem resduos essenciais para a atividade cataltica


Fonte: EMBL Protein Evolution

Estruturas Resolvidas Por Tcnicas

Microscopia
Eletrnica

Fonte: Protein Data Bank, Abril 2012

Dificuldades De Se Conseguir Estrutura Por Raio-x

Clonagem
e
expresso

Vetor
Solubilidade

Fonte: Invitrogen Life Technologies

Purificao

Pureza
Rendimento

Cristalizao

Cristal vivel
Alta resoluo

Dificuldades De Se Conseguir Estrutura Por Raio-x

Clonagem
e
expresso

Vetor
Solubilidade

Fonte: Invitrogen Life Technologies

Purificao

Pureza
Rendimento

Cristalizao

Cristal vivel
Alta resoluo

Dificuldades De Se Conseguir Estrutura Por Raio-x

Clonagem
e
expresso

Vetor
Solubilidade

Fonte: Invitrogen Life Technologies

Purificao

Pureza
Rendimento

Cristalizao

Cristal vivel
Alta resoluo

Funo Da Modelagem Por Homologia

Alinhamento

Molde

Funo Da Modelagem Por Homologia

Alinhamento

Molde

Modelo

Etapas Da Modelagem
1. Alinhamento das sequncias com as estruturas

2. Extrao de restries espaciais

3. Satisfao de restries espaciais

6: Otimizao
do modelo

Diagrama Da Iteratividade Da Modelagem

7: Validao
do modelo

5: Modelagem
da cadeia lateral

Modelo

8: Iterao

Sequncia

4: Modelagem
de alas

3: Criao do
esqueleto

1: Reconhecimento do
molde e alinhamento
inicial
2: Correo de
alinhamento

1: Reconhecimento Do Molde E Alinhamento Inicial


Sequncia FASTA

Fonte: NCBI website

1: Reconhecimento Do Molde E Alinhamento Inicial


Sequncia FASTA

Sequncia FASTA:
Sequncia de texto que representa ou uma sequncia de
aminocidos ou nucleotdeos, usando o cdigo de uma letra em
ambos os casos. o formato padro em bioinformtica.
A primeira linha, iniciada com o smbolo >, um identificador
da sequncia (i.e. organismo, protena/gene, cdigo no banco
de dados).
Pode ser adquirida livremente em bancos de dados como o
NCBI.

Fonte: NCBI website

1: Reconhecimento Do Molde E Alinhamento Inicial


Sequncia FASTA

Fonte: NCBI website

1: Reconhecimento Do Molde E Alinhamento Inicial


Sequncia FASTA

Alinhamento contra o
banco de dados do PDB

Fonte: NCBI website

1: Reconhecimento do molde e alinhamento inicial


Sequncia FASTA

Alinhamento contra o
banco de dados do PDB

Fonte: NCBI website

1: Reconhecimento do molde e alinhamento inicial


Sequncia FASTA

BLAST:

Alinhamento contra o
banco de dados
do PDB de busca de alinhamento local bsico (Basic Local
Ferramenta
Alignment Search Tool). um algoritmo para comparao de
sequncias biolgicas primrias (nucleotdeos ou aminocidos).
Faz a comparao com uma base de dados, extraindo dela
sequncias que tenham semelhanas com a sequncia buscada,
baseada num limite fornecido.
o programa mais usado em bioinformtica

Fonte: NCBI website

1: Reconhecimento do molde e alinhamento inicial


Sequncia FASTA

Alinhamento contra o
banco de dados do PDB

Analisar
a
%
de
identidade e o e-value

Fonte: NCBI website

1: Reconhecimento Do Molde E Alinhamento Inicial


Sequncia FASTA

E-value:

Alinhamento contra o
banco de dados
do PDB
Varivel
estatstica (valor esperado), que relaciona o valor
mdio do resultado com todos os valores que este resultado
poderia assumir.
Quanto menor o valor, maior a confiana do resultado.
Analisar
a
%
de
identidade e o e-value

Fonte: NCBI website

1: Reconhecimento Do Molde E Alinhamento Inicial


Sequncia FASTA

Alinhamento contra o
banco de dados do PDB

Analisar
a
%
de
identidade e o e-value

Fonte: NCBI website

2: Correo do alinhamento
Alinhamento inicial pode no levar em conta a necessidade de
se manter a atividade cataltica ou regies de hlices e folhas

Usar programas especficos para editar alinhamentos,


como por exemplo o JalView ou Clustal*

2: Correo do alinhamento
Alinhamento inicial pode no levar em conta a necessidade de
se manter a atividade cataltica ou regies de hlices e folhas

Usar programas especficos para editar alinhamentos,


como por exemplo o JalView ou Clustal*

3: Criao Do Esqueleto
Segunda etapa Criao do modelo:
Um esqueleto da protena em estudo gerado

4: Modelagem De Alas
Analisar o perfil de energia de cada
resduo (valor de corte de -0,03) e
identificar as regies em que a
energia excede o valor de corte.

Confirmar se estas regies esto em


regies de ala, usando uma
ferramenta
de
predio
de
estruturas secundrias (e.g. ExPASy,
PsiPred, etc)

Executar rotinas de refinamento das


alas
Fonte: Modeller website

5: Modelagem Da Cadeia Lateral

Analisar a ocupncia da cadeia


lateral dos resduos.

Avaliar a energia relativa entre as


vrias conformaes

Fonte: LNCC Priscila V. Z. C. Goliatt Predio de estrutura 3D de protenas

6: Otimizao Do Modelo
O que pode ser feito para otimizar um modelo gerado?

6: Otimizao Do Modelo

Otimizao

O que pode ser feito para otimizar um modelo gerado?

Mltiplos moldes
Combinao
mtodos
Dados externos

6: Otimizao Do Modelo

Otimizao

O que pode ser feito para otimizar um modelo gerado?

Mltiplos moldes
Combinao
mtodos
Dados externos

Modela as regies
de acordo com a
conservao em
diferentes protenas

6: Otimizao Do Modelo

Otimizao

O que pode ser feito para otimizar um modelo gerado?

Mltiplos moldes

Modela as regies
de acordo com a
conservao em
diferentes protenas

Combinao
mtodos
Dados externos

Dados de Cryo-EM
ou SAXS

7:Validaes Bsicas

1
2
3

Alinhamento

Alinhamentos
ruins
aberraes estruturais

Estrutura de molde

Molde de baixa qualidade gera


modelos de baixa qualidade

Identidade

Sequncias de baixa identidade


tem muitas regies sem molde
adequado

Pode ser necessrio fazer o refinamento do


molde usando uma ferramenta adequada
(e.g. Coot)

geram

8: Iterao

Caso o modelo final no seja


satisfatrio, ou seja, no
responda s perguntas que
levaram criao do modelo,
refazer todo o procedimento

Modelo Criado

Modelo gerado, e agora?

Validaes Avanadas

1
2
3

Energia DOPE

Discrete
Optimized
Protein
Energy (DOPE) Avalia a energia
total do modelo

Diagrama de
Ramachandran

Avalia os ngulos didricos e


do modelo

Ligantes

Fazer docagem molecular com o


substrato natural e obter um
resultado insatisfatrio* indica
um mau modelo

Diagrama de Ramachandran
0

psi

-180

180
180

phi

-180

Dados observados nas estruturas


conhecidas com alta resoluo
Fonte: Wikipedia / University Of Georgia - Tutorial On Peptide And Protein Structure

Primeiras Abordagens
Modelagem manual usando programas de refinamento de estruturas
FRODO;
Browne W.J. et al(1969) J. Mol.Biol. 42:65-86;
Warme P.K. et al(1974) Biochemistry 13:768-782;

Primeiras Abordagens

Modelo

Molde

Triagem biolgica, Qumica medicinal e Biologia estrutural


Projeto Jovem Pesquisador - Processo FAPESP 2011/08042-9

Gustavo M. A de Lima
Prof. Dr. Rafael V. C. Guido

Cana-de-acar No Mundo

Os 10 principais produtores de cana-de-acar

Mdia regional de produo de cana-de-acar (kg/ha)

2009
Fonte: Unio da Indstria de Cana-de-acar/UNICA e Ministrio da Agricultura, Pecuria e Abastecimento/MAPA.

Produo em Kg

Cana-de-acar No Brasil

88% na regio centro-sul


60% no estado de So Paulo

Fonte: Unio da Indstria de Cana-de-acar/UNICA e Ministrio da Agricultura, Pecuria e Abastecimento/MAPA.

Consumo De Combustveis No Brasil

Matriz Energtica Brasileira

EPE: Balano Energtico Nacional 2010: Ano base 2009. Rio de Janeiro

O bioetanol capaz de reduzir as emisses de


gases de efeito estufa em mais de 90%, quando
comparado com a gasolina.
A biomassa obtida dos subprodutos do
processamento da cana tem importncia
socioeconmica.

Consumo De Combustveis No Brasil

Matriz Energtica Brasileira

EPE: Balano Energtico Nacional 2010: Ano base 2009. Rio de Janeiro

O bioetanol capaz de reduzir as emisses de


gases de efeito estufa em mais de 90%, quando
comparado com a gasolina.
A biomassa obtida dos subprodutos do
processamento da cana tem importncia
socioeconmica.

Consumo De Combustveis No Brasil

Matriz Energtica Brasileira

EPE: Balano Energtico Nacional 2010: Ano base 2009. Rio de Janeiro

O bioetanol capaz de reduzir as emisses de


gases de efeito estufa em mais de 90%, quando
comparado com a gasolina.
A biomassa obtida dos subprodutos do
processamento da cana tem importncia
socioeconmica.

Fitopatologias Da Cana-de-acar

A escaldadura das folhas

Aguda

Crnica
Xanthomonas albilineans (Ashby)
Caractersticas

Gram-negativa

Flagelada

Crescimento lento

Parasitas obrigatrias

Biologia estrutural

Desenvolvimento De Um Novo Agroqumico

Microbiologia

Qumica medicinal
computacional

Alvos Moleculares

Via de biossntese de albicidinas

Essencial para o desenvolvimento


da doena
Birch et al. Physiol. Mol. Plant. 1987, 30, 199-206

Benzoato CoA Ligase

Caractersticas:

Massa 75,250KDa
Funo Promove a ligao carbonoenxofre para formar o Benzoil-CoA

696 aa
ATP

+
Benzoato

AMP
CoA

CoA-SH

Coenzima A

+
Benzoil-CoA

Difosfato

Fosfopanteteinil Transferase

Caractersticas:

Massa 29,260KDa
Funo Ativar algumas enzimas
sintetizadoras, como NRPS (Non

Ribosomal Peptide Synthetases)


278 aa
3,5-ADP

Mg2+

Apo-protena Coenzima A

Holo-protena

Benzoato CoA Ligase

Benzoato Coa Ligase

Stio de ligao do
benzoato

Benzoato Coa Ligase

Substituio no
conservativa da Lys520

Homologia
Cristalogrfico

Benzoato Coa Ligase

Substituio no
conservativa da Lys520

Homologia
Cristalogrfico

Fosfopanteteinil Transferase

Fosfopanteteinil Transferase

Stio de ligao da CoA

Fosfopanteteinil Transferase

PPT Humana

PPT Ashby

Softwares De Modelagem

Importncia Das Estruturas 3D De Protenas

Algoritmo de satisfao de restries espaciais

Obteno emprica das restries espaciais (funes densidade de


probabilidade): A partir de banco de dados contendo informaes sobre
alinhamentos entre estruturas proticas de alta resoluo.
Minimizao das violaes das restries espaciais: As restries espaciais e
os termos de energia so combinados em uma funo objetivo, sendo
submetida a mtodos de otimizao (e.g. gradiente conjugado).

ViTaMIn Visual Table Modeller Interface

Objetivos:

Dinamizar a produo de modelos por homologia;


Fornecer dados sobre a qualidade do modelo;
Integrar principais programas de modelagem e visualizao de protenas;
No impedir nenhuma interferncia do pesquisador no modelo.

ViTaMIn Visual Table Modeller Interface

Demonstrao

Dvidas

Agradecimentos
Msc. Jos Fernando Ruggiero Bachega
Lucas Assirati
Fernando Vasconcelos Maluf
Dr Fernanda Cristina Costa
Grupo de Cristalografia
Prof. Dr. Rafael V. C. Guido
Prof. Dr. Helio Jose Montassier

You might also like