You are on page 1of 49

Ferramentas da Genética Molecular Humana

(uma visão rápida do conjunto de técnicas da genética molecular aplicadas ao estudo do


genoma e das doenças genéticas)
 
Este capítulo seguirá essencialmente o assunto abordado no capítulo 4 do livro Genética
Médica (Thompson e Thompson). Em muitos pontos, entretanto, o assunto será abordado
de forma muito mais aprofundada,  adicionado para isto informações de outros livros e de
artigos científicos, ou remetendo o leitor a uma ou mais aulas do website BiolMol.
 
Um dos principais objetivos da genética médica é compreender a base molecular das
doenças genéticas. Uma vez que se compreenda o mecanismo molecular da doença,
deve ser possível desenvolver um sistema diagnóstico aperfeiçoado, voltado ao DNA ou a
RNA, e ainda intervir para a cura da doença. Após o enorme avanço do conhecimento
representado pelo Projeto Genoma Humano, passou a ser outro objetivo importante da
genética médica a compreensão do pano-de-fundo genético que determina a
susceptibilidade/ resistência a doenças, a tolerância a medicamentos e muitos outros
parâmetros indiretamente relacionados à doença, mas que estão na base da diversidade
dos seres humanos e na sobrevivência da espécie.
 
O avanço concreto na compreensão dos mecanismos moleculares que explicam os
fenômenos descritos acima foi possível graças à introdução de um grande número de
técnicas novas no estudo da genética. Neste capítulo falaremos de várias delas, com
maior ou menor profundidade de acordo com suas aplicações mais imediatas na genética
médica, procurando ao mesmo tempo evitar um detalhamento excessivo, que não
contribuiria diretamente à compreensão das aplicações das técnicas na genética médica,
razão principal do capítulo. Em muitos casos o leitor será encaminhado para a webpage
Biolmol, onde a maior parte das técnicas está discutida em detalhe (particularmente
aquelas ligadas à tecnologia do DNA recombinante, à PCR e ao sequenciamento de DNA.
 
Sumário
I. A linguagem da tecnologia do DNA recombinante
II. Clonagem gênica
1.Primeiros passos
2. Restrição e Modificação: a ferramenta escondida na bactéria
3. Ainda um pouco sobre as enzimas de restrição
4. Vetores (falta)
5. Construção de Bibliotecas
6. Biblioteca genômica: todo o genoma em pedaços...
7.  Clonagem e expressão: o problema dos introns
8. Como fazer um DNA eucarioto sem introns?
9.  Biblioteca de cDNA e características de um vetor de expressão para Escherichia coli.
10. Seleção (triagem ou screening) de clones pela expressão da proteína recombinante.
11. Que genes estão representados numa biblioteca de cDNA?
12. Proteínas recombinantes: as quimeras são desejáveis?
III. PCR: uma técnica de múltiplas aplicações
IV. Sequenciamento de DNA
 
 
*******************************************************************
I. A linguagem da tecnologia do DNA recombinante
 
Como em toda área de conhecimento espeçífica, a linguagem da genética molecular
parece impermeável ao leigo, numa primeira leitura. Entretanto, o significado de cada
termo corriqueiramente usado pro geneticistas moleculares não é complexo, mas reflete o
peso da técnica na fenomenologia estudada. Para que o leitor não se perca com um
linguajar pouco familiar, vamos inicialmente definir certos termos de uso corrente na área.
Estas definições podem ser encontradas em muitos livros e fontes na internet; aqui elas
provêm da experiência dos responsáveis pela página.
 
Glossário Geral da Genética Molecular
 
Biblioteca: Conjunto de clones (aqui   Northern blot: Transferência de RNAs
compreendidos como um hospedeiro albergando bandeados por eletroforese para uma membrana
múltiplas cópias idênticas de um determinado vetor adequada, em geral de nylon. O processo pode ser
recombinante, ou ainda o próprio vetor, quando feito por campo elétrico (os RNAs são negativos e
armazenado sem o hospedeiro, como no caso de migram para o pólo positivo) ou arraste
bacteriófagos) gerados a partir de uma fonte de hidrodinâmico. As membranas de Northern blot
informação genética (DNA ou mRNA).  As bibliotecas podem ser hibridizadas com sondas de DNA ou
feitas a partir de DNA do organismo são ditas RNA. O nome northern é uma alusão ao nome
genômicas e aquelas feitas a partir de mRNA são Southern, do inventor da transferência análoga de
ditas de cDNA (e representam apenas os genes DNA.
expressos do tecido empregado para extrair o
mRNA)
Clone: Nome empregado em várias acepções   Oligonucleotídeo: Um filamento curto de ácido
distintas. Pode significar uma molécula de DNA nucléico, em geral fita simples, que pode variar
recombinante contendo um gene ou sequência de desde poucas bases até algumas dezenas. Em
DNA de interesse. A palavra é empregada para geral são sintéticos. São chamados
designar também o hospedeiro carreando o clone (no abreviadamente de oligos (p. ex., oligodT, oligos
vetor) ou ainda qualquer organismo obtido por para sequenciamento, etc.)
propagação vegetativa de outro (esta acepção está
foram do contexto da genética molecular)
cDNA: Rigorosamente, DNA complementar. O   PCR: Sigla de polymerase chain reaction, ou
nome é empregado para designar a fita simples de reação em cadeia da polimerase. Reação de
DNA  obtida pela transcrição reversa (geralmente extensão de DNA que emprega dois primers que
parcial) de um mRNA, a partir de sua extremidade 3' hibridizam próximos um ao outro na fita de DNA
(cauda poli A). A designação é estendida para o DNA molde (ou alvo), e permitem a produção de milhões
fita dupla obtida pela síntese de uma segunda fita de de cópias do fragmento de DNA situado entre os
DNA complementar à primeira por alguma DNA dois primers
polimerase.
dNTPs/ ddNTPs: Desoxinucleotídeos   Primers: iniciadores da síntese de DNA, são
trifosfatados/ didesoxinucleotídeos trifosfatados. pequenos oligonucleotídeos sintéticos fita simples
Precursores da síntese de DNA, são empregados (de DNA). O primer vai hibridizar (ou parear) com
para a extensão de fitas simples in vitro pela ação de uma fita do DNA alvo dupla fita. Para o PCR
uma DNA polimerase, a partir de primers e DNA emprega-se em geral dois primers. Para o
moldes adicionados ao sistema. Os sequenciamento de DNA sempre um primer é
dideoxinucleotídeos, quando adicionados a uma empregado de cada vez. Tanto para PCR como
cadeia crescente, interrompem a extensão da fita, para sequenciamento os primers costumam ter
pois não oferecem a hidroxila na posição 3', entre 10 e 25 bases.
indispensável para a ligação fosfodiéster com o
nucleotídeo seguinte. Podem ser dATP. dGTP. dTTP
ou dCTP, ou seus análogos dideoxi.
Enzima de restrição: Enzimas que reconhecem   Sonda: Uma molécula de DNA ou RNA marcada
sítios específicos no DNA fita dupla (em geral com fósforo radioativo u conjugada com algum tipo
palíndromos) e cortam a dupla fita, formando de marcação que possa ser identificada
extremidades abruptas (cegas) ou desencontradas posteriormente por um ensaio bioquímico
(ou coesivas).  Os sítios reconhecidos por estas (floresceína, biotina, digozigenina, etc.). A molécula
enzimas são designados sítios de restrição e os pode ser fita simples ou fita dupla. As sondas
fragmentos de DNA gerados pela digestão de um devem ser produzidas em milhares de cópias e por
DNA com estas enzimas são conhecidos como isto em geral são segmentos clonados em
fragmentos de restrição. plasmídeo ou produtos de PCR. Entretanto, em
alguns casos, todos os fragmentos de um
determinado genoma podem ser marcados e
usados como sondas para hibridizar com outro
genoma.
Hibridização: O pareamento de duas moléculas de   Southern blot: Transferência de DNAs
DNA fita simples através da complementariedade de bandeados por eletroforese para uma membrana
bases, seguindo a regra de Chargaff (A-T, G-C). adequada, em geral de nylon. O processo pode ser
Aplica-se a mesma designação para o pareamento feito por campo elétrico (os DNAs são negativos e
RNA-DNA ou RNA-RNA. migram para o pólo positivo) ou arraste
hidrodinâmico. As membranas de Southern blot
podem ser hibridizadas com sondas de DNA ou
RNA. O nome  é uma homenagem ao inventor da
transferência.
Hospedeiro: O organismo usado para isolar e   Vetor: Qualquer unidade autoreplicativa de DNA
propagar uma molécula de DNA clonada (em geral (fita dupla ou simples) que possa servir para
num vetor qualquer). Para clones inseridos em carregar um inserto de DNA exógeno de um
plasmídeos, em geral emprega-se a Escherichia coli hospedeiro para outro (da mesma espécie ou de
como hospedeiro. Da mesma forma se bacteriófagos espécies distintas, quando o vetor ganha o nome
são usados. Células de mamíferos, de leveduras e de vetor de transferência ou shuttle vector).
de insetos são também muito empregadas. Exemplos: plasmídeos (bacterianos ou eucriotos),
bacteriófagos, vírus, cosmídeos, fagemídeos,
BACs (cromossomos artificiais de bactérias) e
YACs (cromossomos artificiais de leveduras). 
Inserção/ Inserto: Ato de inserir um DNA doador   Western blot: Transferência de proteínas
num DNA receptor/ Diz-se inserto ao DNA inserido bandeadas por eletroforese para uma membrana
(em geral num vetor, mas algumas vezes adequada, em geral de nitrocelulose. O processo
diretamente no genoma da célula transformada ou só pode ser feito por campo elétrico (os RNAs são
transfectada) negativos e migram para o pólo positivo). As
membranas de western blot podem ser
hibridizadas com sondas de anticorpos. O nome
western, como o nome northern também, é uma
alusão ao nome Southern, do inventor da
transferência análoga de DNA. O western blot é
frequentemente chamado imunoblot.
Ligação:  A união de dois segmentos de DNA fita    
simples pela ação da ligase. A enzima reconstitui a
ligação fosfodiéster 3'5' entre dois nucleotídeos
adjacentes.

II. Clonagem gênica

         Criar seres novos têm sido, por bilhões de anos, o privilégio da Natureza, através do
processo contínuo de mutação e seleção natural e por outros mecanismos de alteração
do DNA que agora começam a ser compreendidos. Mas a humanidade sempre "criou"
seus próprios seres, geralmente extraordinários. Os gregos eram particularmente
imaginativos, e a mitologia clássica é cheia de monstros como a Quimera, o cão Cérbero,
o Minotauro, a Medusa e um sem-número de outros híbridos. Como se verá mais adiante,
a palavra quimera foi tomada de empréstimo na mitologia para designar as construções
artificiais de moléculas (em geral DNA). Inicialmente a imaginação do homem atribuía a
algum deus a geração dos seres monstruosos ou, ao contrário, extraordinariamente belos.
A idéia de que estes seres podiam ser fabricados por um ser humano só veio muito
depois, mas em várias partes do mundo os homens criaram "protocolos"   para a geração
de vida a partir de material "morto", desde simples insetos até o próprio ser humano. A
partir do meio do século XVIII a ciência começou a mostrar a verdadeira face da criação e
a esclarecer a origem das ossadas que eram em parte o combustível para a imaginação
dos homens naquele tempo: a vida só podia ser criada a partir da vida e os ossos
imensos ou estranhos achados em toda a parte eram de seres extintos, mas que tinham
sido produto da Natureza, como todos os demais.

            Ainda assim, alguns seres exóticos mais "queridos"  da humanidade


permaneceram por todo o século XVIII e boa parte do século XIX e alguns passaram
"vivos" pelo século XX até hoje! O unicórnio "viveu"  feliz por todo o século XVIII, as
serpentes marinhas monstruosas alcançaram a metade do século XX e os duendes e
fadas estão muito bem de saúde, "vivendo" entre nós, civilizados. Os lobisomens e
vampiros andam mais desacreditados, mas sempre se deve esperar um retorno triunfal,
às custas do cinema ou de um livro, lançados por bons marqueteiros...

            Entretanto, a criação de híbridos de verdade é muito mais difícil do que insinua o
cinema ou pensam as pessoas, porque a maior parte das espécies têm algum tipo de
restrição para o cruzamento com uma espécie diversa. Na melhor das hipóteses o híbrido
costuma ser estéril. Esta é a regra entre animais. Os híbridos entre vertebrados, por
exemplo, são raros, e quando ocorrem, em geral são estéreis. É o caso da mula e do
burro, híbridos de cavalos e jumentos. Entre plantas, contudo, a obtenção de híbridos é
muito mais fácil e uma enorme fração das plantas que hoje cultivamos é produto de
cruzamento entre duas ou mais espécies.

            Uma abordagem mais simples à produção de novas formas de vida (ao menos em
teoria) é a clonagem de genes de um organismo e a transfecção destes para outro
organismo. A vantagem desta abordagem é que se pode selecionar da espécie doadora
apenas as marcas que interessam, evitando a introdução de genes indesejados.
Adicionalmente, ela permite (também em teoria...) total controle sobre a construção final,
contornando as recombinações que a Natureza produz durante a reprodução sexuada
(entre indivíduos da mesma espécie ou não).

            Clonar genes parece simples a princípio, mas as ferramentas para cortar DNA e
"emendar"  os fragmentos com um vetor (DNA que se replica e que desta forma conserva
o pedaço "emendado" nele, chamado inserto) não eram conhecidas até o meio da década
de 70.

1. Primeiros passos

         As primeiras tentativas de clonagem de genes foram feitas no fim da década de 70


com um vírus que infecta células de primatas (inclusive seres humanos): o SV40 (simian
virus 40). Este vírus é capaz de entrar na célula do mamífero e em alguns casos integrar-
se ao DNA cromossômico, em qualquer lugar do genoma. Ao sair, ocorre muitas vezes
uma excisão anômala, e o vírus deixa no genoma da célula hospedeira uma parte de si,
levando, ao contrário, um pequeno segmento do genoma da célula do primata. Ao invadir
uma nova célula, o segmento transportado insere-se num outro ponto do DNA da célula
hospedeira, totalmente diverso do que estava antes. Este procedimento embaralha o
genoma e pode, ao acaso, produzir uma construção interessante, mas é muito grosseiro
para permitir um avanço concreto no campo da clonagem. Adicionalmente, o SV40, assim
como o fago , do qual falaremos em outra aula, e vários outros vírus, têm uma limitação
séria quanto ao tamanho de inserto que podem carregar, pois devem ser encapsulados
para sair de uma célula e invadir a outra, e o volume do capsídeo não comporta muito
mais DNA do que o que é normal no vírus. Desta forma, vetores virais empacotados em
capsídeos devem ser previamente engenheirados de forma a que se retire um certo
número de genes dispensáveis in vitro, fazendo espaço para mais bases do inserto.

       Como não havia uma forma simples e precisa de cortar DNA numa sequência ou
posição específicas, produzindo segmentos de extremidades conhecidas, era impossível
unir de forma eficiente um segmento de DNA de doador com as extremidades de um vetor
(viral ou plasmidial, como veremos mais adiante). A falta desta tesoura molecular
restringiu durante anos o avanço da nascente "engenharia genética", nome que a mídia
deu ao que se chama nos meios acadêmicos de tecnologia do DNA recombinante. Além
disso, o fato de todos os primeiros vetores de clonagem terem sido vírus que infectam o
homem fez da engenharia genética uma tecnologia de alto risco. As legislações foram,
compreensivelmente, duríssimas no princípio, com uma opinião pública inteiramente
desfavorável, como ocorre hoje com a questão da clonagem de mamíferos. O cuidado
era, contudo, muito importante. Apesar de todo cuidado, e um pouco antes das tentativas
de se fazer engenharia genética de forma sistemática e abrangente, o SV40 acabou
sendo o protagonista de uma infecção acidental de milhões de pessoas, através da vacina
de poliomielite, nas décadas de 50 e 60. A infecção pelo SV40 não provocou, até onde se
pode saber, qualquer problema de saúde nos indivíduos infectados, apesar de
potencialmente ser possível a ação direta do vírus no organismo  ou através de sua
recombinação in vivo com o S2, um vírus humano.

            A legislação evolui bastante à medida em que a engenharia genética tornava-se


mais segura. Paralelamente, a ciência da Biossegurança emergiu da união entre
conceitos de biologia e de direito, resultando num corpo de normas e diretrizes bastante
coerente, que se atualiza continuamente através de workshops, congressos e outros
encontros técnicos entre especialistas do mundo todo (para detalhamento consulte o site
da CTNBio - Comissão Técnica Nacional de Biossegurança)

2. Restrição e Modificação: a ferramenta escondida na bactéria

            Os bacteriófagos, partículas virais que invadem e destroem bactérias, tiveram um


papel central no desenvolvimento da Biologia Molecular. Já na década de 40 uma série de
experimentos mostrou como funcionavam os genes de vários destes vírus. Uma geração
depois experimentos com fagos levaram a uma descoberta fundamental - as enzimas de
restrição. Estas "tesouras" moleculares, que a bactéria emprega para se defender dos
bacteriófagos, poderiam ser aproveitadas para a pesquisa. Elas de fato forneceram a
ferramenta há muito desejada pelos biólogos moleculares para estudar e manipular o
DNA e fundamentaram o caminho para o desenvolvimento da engenharia genética.

            A descoberta das enzimas de restrição aconteceu ao longo de mais de duas


décadas e demonstrou que as bactérias desenvolveram, durante a evolução, um eficiente
mecanismo de defesa contra vírus a DNA. Fagos que se desenvolvem bem numa certa
linhagem de bactéria, frequentemente produzem uma progênie pequena quando infectam
pela primeira vez uma outra linhagem da mesma bactéria, mas os poucos fagos
sobreviventes prosperam. O fenômeno, conhecido como restrição controlada pelo
hospedeiro, foi descrito pela primeira vez no início da década de 50. Werner Arber, um
microbiologista suíço, encontrou uma explicação molecular para o fenômeno. Ele sugeriu
que as bactérias controlam os fagos com um sistema de reações geneticamente
controladas que ele designou restrição - modificação.  A seguir analisaremos as
observações de Arber.

            Quando os bacteriófagos entram numa bactéria da linhagem A, são em sua


maioria mortos no interior da bactéria, que corta (cliva) o DNA em um ou mais pontos. Os
poucos fagos que se replicam no interior da bactéria, contudo, parecem "aprender"  a
evitar o ataque da bactéria e, numa segunda infecção, já produzem um grande número de
partículas virais novas. Quando estes fagos procuram infectar uma bactéria da mesma
espécie, porém de uma outra linhagem (digamos, B), inicialmente produz uma progênie
pequena e apenas na segunda infecção na mesma linhagem bacteriana é que se adapta
e produz um grande número de partículas virais novas. Se transportado a um tubo de
ensaio com a bactéria A original, o fenômeno se repete, como se o fago tivesse
"desaprendido"  a infectar a bactéria do tipo A. A situação está mostrada na figura abaixo.

Figura 1: A restrição controlada pela hospedeira: Fagos que se desenvolvem bem numa certa linhagem
de bactéria, frequentemente produzem uma progênie pequena quando infectam pela primeira vez uma outra
linhagem da mesma bactéria, mas os poucos fagos sobreviventes prosperam .

            Como poderia ser este "aprendizado"? Afinal, quando um fago entra na bactéria,
apenas o seu DNA subsiste e se replica, ficando o capsídeo do lado externo da
hospedeira. Então, todo o processo de adaptação teria que estar ligado ao DNA. Vejamos
a hipótese de Arber (mostrada de forma esquemática na figura a seguir):

 Inicialmente temos que admitir que a bactéria possui um sistema de proteção de


seu DNA contra a sua própria enzima de restrição (a "tesoura" molecular), que
consiste na modificação, em geral por metilação, de duas bases numa certa
sequência fita-dupla. Na figura abaixo a bactéria da linhagem A protege desta
forma as sequências marcadas em amarelo (por exemplo 5´-GAATTC-3´),
enquanto a da linhagem B protege outras sequências, marcadas em azul (por
exemplo, 5´-GGCC-3´). Esta proteção é levada a cabo pela enzima de modificação.
 Em seguida vamos admitir que a enzima de restrição que a bactéria produz cliva
(corta) o DNA fita dupla exatamente na mesma sequência que a sua própria
enzima de modificação protege.
 Agora imaginemos um fago sem qualquer modificação em seu DNA fita dupla
infectando a bactéria A. Seu DNA será clivado (restrito ou cortado) exatamente na
sequência amarela (e até em mais de uma, se houver). Entretanto, uns poucos
fagos serão replicados antes de serem clivados e imediatamente modificados pela
enzima de modificação da bactéria, que metila as sequências amarelas
independentemente de sua origem, bacteriana ou viral. Alternativamente, poderão
sobreviver porque foram metilados antes mesmo de replicarem.

 Aqui cabe uma pergunta: como a bactéria "decide" se uma sequência deve ser modificada ou restrita? As
enzimas de restrição (E.R.) estão dispersas no citosol bacteriano, mas as de modificação em geral têm uma
proximidade com o aparato de replicação do DNA. Por isso, um DNA invasor é mais provavelmente restrito
antes de ser modificado. Ao contrário, o DNA bacteriano recém sintetizado (uma fita nova, já que a outra,
velha, já está modificada) será provavelmente modificado na fita nova antes de ser restrito. Além disso, uma
hemi-metilação também confere um razoável grau de proteção contra o ataque de enzimas de restrição, o
que faz com que o DNA bacteriano seja essencialmente imune à ação da enzima de restrição da própria
bactéria. De forma equivalente, o DNA viral, que não tem nenhuma metilação, é muito mais sensível ao
corte pela E.R..

 Os poucos fagos sobreviventes terão suas duas fitas modificadas exatamente na


sequência reconhecida pela E.R da bactéria hospedeira. Consequentemente,
quando entram na próxima bactéria da mesma linhagem, seus DNAs estão imunes
ao ataque da E.R. bacteriana. Todos os fagos da progênie, igualmente
modificados, sobrevivem daí por diante nesta linhagem de hospedeira.
 Quando, na segunda parte da figura, os fagos provenientes de A penetram na
hospedeira da linhagem B, eles estão todos modificados na sequência amarela.
Mas a hospedeira agora corta o fago na sequência azul (digamos, 5´-GGCC-3´), de
forma que a proteção na sequ~encia GAATTC de nada adianta. Quase todos os
fagos terão seu DNA clivado, mas os poucos sobreviventes terão o DNA metilado
na posição correta, pela enzima de modificação da bactéria da linhagem B. A
modificação na sequência amarela vai se diluindo na população, pois a replicação
é semi-conservativa e a progênie viral muito grande (mais de 200 fagos por fago
infectante). Apos a segunda infecção na bactéria do tipo B todos os fagos estarão
agora modificados e protegidos na sequência azul, e terão "desaprendido"   a
sobreviver na bactéria do tipo A.
 O processo recomeça quando o fago tenta infectar uma bactéria da linhagem A
outra vez.

            Esta explicação molecular foi fundamental para espantar o espectro de


lamarckismo que obviamente ronda um experimento desta natureza.
Figura 2: Interpretação molecular do fenômeno da restrição pela hospedeira, de acordo com Werner
Arber. As círculos vermelhos e verdes representam as modificações.

            Era notável a especificidade destas reações e os bioquímicos ficaram bastante


esperançosos de que as enzimas de restrição pudessem ser empregadas para estudar e
clivar o DNA, se pudessem ser purificadas. Enquanto Arber trabalhava com E. coli, outros
pesquisadores experimentavam com outras bactérias, encontrando resultados similares.
As esperanças, entretanto, enfraqueceram quando a primeira das enzimas purificada
parecia cortar in vitro o DNA de forma aleatória, e não numa sequência de bases
específica (conhecida como sítio de restrição).

            As esperanças ressurgiram na década de 70, através de uma série de trabalhos


balizadores de Hamilton Smith, um biólogo molecular que trabalhava na Johns Hopkins
University School of Medicine. Ele purificou a primeira enzima sítio-específica, a enzima
Hind II, da bactéria Haemophilus influenzae. Esta descoberta crucial foi obra do acaso
(com tantas outras): incubando bactérias e fagos juntos, Smith observou que o DNA do
fago degradava aos poucos. Ele e seus colaboradores conseguiram purificar a enzima
responsável pela degradação e posteriormente identificaram a sequência de seis pares de
bases que ela reconhece e cliva, sempre na mesma posição, sempre da mesma forma!
Logo muitas outras enzimas foram descobertas e agora há mais de 3000 já descritas.
Cada enzima cliva o DNA num sítio específico e com estas enzimas foi possível manipular
o DNA como nunca antes. Um dos trabalhos mais festejados, que vieram na cola das
descobertas de Arber e Smith, foi o de Daniel Nathans com SV40, que pela primeira vez
empregou estas enzimas para mapear fisicamente o DNA. Seus experimento levaram em
1972 à primeira tentativa bem sucedida de clonagem de DNA, conseguida por Paul Berg.

            Pelas suas descobertas, Hamilton Smith recebeu o Prêmio Nobel em Fisiologia ou
Medicna em 1978, dividindo a premiação, merecidamente, com Arber e Nathan. As
palestras dos três laureados, Arber, Nathans e Smith, com uma descrição de seus
trabalhos, estão também disponíveis no site de downloads, no formato pdf.

3. Ainda um pouco sobre as enzimas de restrição

         Como vimos acima, cada bactéria possui em geral uma enzima que reconhece uma
sequência de DNA curta, com 4 a 12 pares de bases. Nas diferentes bactérias estes sítios
têm em sua maioria uma característica comum: a de terem a mesma sequência de bases
quando lidas nas duas fitas complementares. As sequências abaixo, reconhecidas pela
enzimas de restrição EcoR1 (obtida da Escherichia coli) e HindIII (obtida de Hemophilus
influenzae) exemplificam o que chamamos de sítio de restrição. Observe a sequência e
veja sua simetria. Sequências de DNA fita dupla com estas características são chamadas
palíndromos.          

Figura 3: As setas indicam a ponte fosfodiester clivada pelas enzimas EcoRI e HindIII. A linha indica o eixo
de simetria do palíndromo

         Quando uma enzima de restrição digere o DNA, ela produz um corte em cada fita,
podendo resultar em extremidades colantes ou adesivas, como as geradas pelas enzimas
acima, ou extremidades cegas, isto é, sem bases despareadas. Cada vez que elas
encontram um sítio de restrição que lhes é próprio, clivam o sítio.
Figura 4:  Ação da enzima de restrição EcoR1, com geração de extremidades colantes(ou adesivas) e
união de fragmentos de DNA de origens distintas

         Os sítios de restrição ocorrem ao acaso no DNA e tanto mais freqüentes são quanto
mais curtos. A probabilidade de se ter uma seqüência qualquer definida de seis bases é
(1/4)6, isto é 1: 4096.  Uma enzima que reconheça um sítio de restrição de 12 bases
cortará o DNA com uma freqüência muito baixa. Após a digestão de um DNA longo por
uma enzima de restrição muitos fragmentos são gerados, tanto menores quanto maior for
o sítio de restrição.

           Para finalizar: qual a vantagem para um fago ter um sítio de restrição alvo de uma
determinada enzima? Nenhuma, evidentemente, mas como os sítios ocorrem ao acaso, é
provável que um fago possa ser restrito por várias de suas potenciais hospedeiras. Por
outro lado, qual a vantagem para uma bactéria em ter uma enzima de restrição que
reconhece sítios com 10 pb? Não será muito raro encontrar um sítio destes num fago?
Provavelmente estas bactérias tem uma gama bastante restrita de fagos que lhes são
infectivos e por isso não precisam estar prontas para clivar sítios frequentes, mas apenas
aqueles que existem nos seus fagos invasores. Como a Natureza estabelece este
balanço é uma questão de estudos ainda.
4. Vetores (falta)

Finalmente podemos discutir as bases da clonagem de DNA. Para exemplificar o


procedimento empregaremos um plasmídeo como vetor de clonagem e cortaremos o
plasmídeo e o DNA a ser clonado com uma enzima de restrição que forma extremidades
coesivas. É preciso ter em mente, contudo, que existem vários outros vetores de
clonagem (dos quais discutiremos, em outro capítulo, o fago lambda e suas variantes
comerciais) e diferentes formas de fragmentar e clonar o DNA (com enzimas de restrição
que deixam extremidades cegas, com ou sem posterior encadeamento, com nebulização,
com prensa francesa, etc.). Em atualizações futuras cada uma destas técnicas será
discutida. Por enquanto, recomendamos a visita do site português sobre vetores, para
uma visão geral sobre os vários vetores de clonagem. A consulta aos livros-texto da
disciplina se impõe, evidentemente.

5. Construção de Bibliotecas

O que é uma biblioteca? É o conjunto de clones (aqui compreendidos como hospedeiros


albergando múltiplas cópias idênticas de um determinado vetor recombinante, ou ainda o
próprio vetor, quando armazenado sem o hospedeiro, como no caso de bacteriófagos)
gerados a partir de uma fonte de informação genética (DNA ou mRNA).  As bibliotecas
feitas a partir de DNA do organismo são ditas genômicas e aquelas feitas a partir de
mRNA são ditas de cDNA (e representam apenas os genes expressos do tecido
empregado para extrair o mRNA)

Clonando DNA num plasmídeo        

            O processo se inicia pela extração do DNA das células doadoras e do plasmídeo
(neste exemplo, um plasmídeo pequeno, de aprox. 2,5 kpb, da bactéria E. coli). A
extração de DNA não é um processo complexo: resumidamente, as células são lisadas
com um detergente, os restos celulares e boa parte das proteínas precipitadas por
centrifugação em presença de uma concentração elevada de sal (em geral acetato de
potássio) e o sobrenadante, transferido para outro tubo, é misturado com isopropanol. O
DNA não é solúvel neste álcool, mesmo diluído com água, e tende a precipitar. Para
acelerar o processo centrifuga-se o material a 13.000 rpm por alguns minutos e o
precipitado é ressuspenso ém água ou num tampão adequado. O DNA que se obtém
desta forma não é muito limpo, mas serve para uma boa parte das aplicações corriqueiras
de laboratório. Atualmente kits comerciais permitem a extração rápida de DNA de
praticamente qualquer tipo de célula, em quantidades e grau de pureza que satisfaçam ao
mais exigente pesquisador.

            A extração do plasmídeo é semelhante à descrita acima, mas é preciso usar um


estratagema para separar o plasmídeo do DNA bacteriano. O DNA plasmidial é muito
menor que os fragmentos de DNA cromossômico bacteriano. O truque então consiste em
adicionar à solução de lise uma certa quantidade de álcali. O pH alto desnatura o DNA.
Logo em seguida adiciona-se ácido acético gracial e acetato de potássio: o ácido
neutraliza o álcali e os DNAs tendem a renaturar. Porém, a presença de sal provoca a
precipitação de todas as moléculas que não forem muito solúveis em água. O DNA
desnaturado é pouco solúvel em água e precipita. É o caso dos fragmentos grandes de
DNA cromossômico, que não conseguem se renaturar e precipitam (por centrifugação),
junto com as proteínas da bactéria e restos celulares. O DNA plasmidial, ao contrário,
renatura-se rapidamente e torna-se muito solúvel em água, não podendo ser precipitado.
Assim, recolhendo o sobrenadante, teremos essencialmente DNA plasmidial, com uma
contaminação pequena de DNA cromossômico bacteriano.

            Uma vez com os dois DNAs disponíveis (doador e plasmidial), resta cortá-los com
a enzima de restrição escolhida e misturar os dois DNAs. A tendência será parear as
extremidades coesivas, formando construções híbridas, ou quimeras. A adição de ligase
completa a cadeia fosfodiéster em cada uma das fitas de DNA. Este passo está
representado na parte superior da figura abaixo.

Figura 5:  Esquema para a obtenção de plasmídeos recombinantes, a partir do uso de uma enzima de
restrição que cria extremidades coesivas. Para maiores detalhes veja o texto abaixo.
            Ao menos 5 produtos distintos podem ser formados a partir desta mistura. O
produto 1 é o desejado, no qual um inserto (verde) foi clonado no plasmídeo (vermelho).
Mas, lamentavelmente, outras construções também aparecem: o produto 2 é o mais
danoso ao processo, pois se trata do plasmídeo vazio, fechado sem inserto. Ele é
perfeitamente funcional e não pode ser descartado do processo. O produto 3 é a
circularização de vários fragmentos de DNA do doador, numa ordem qualquer. Este "lixo"
não é problemático, porque não contém uma origem de replicação bacteriana. É um DNA
que será perdido ao longo do tempo. O produto 4 é a união de dois (ou mais) plasmídeos
e não se replica tão rápido quando o plasmídeo vazio ou carregado com apenas um
inserto, de forma que acaba desaparecendo ao longo do tempo. O último "lixo" é o
plasmídeo carregado com vários insertos catenados (ligados em cadeia) ou com um
inserto muito grande. É uma construção instável, também, e tende a desaparecer. Assim,
excetuando o plasmídeo vazio, todos as outras quimeras "lixo", uma vez na bactéria,
tendem a desaparecer e não são um problema para o experimentador.

            Uma vez ligado o inserto com o plasmídeo (e produzidos os vários possíveis lixos,
também), é preciso introduzir estas construções na bactéria hospedeira. Isto é feito pela
entrada passiva de DNA através da membrana de bactérias previamente tratadas com
uma solução de cloreto de cálcio, ou ativamente, através de choques elétricos, num
processo chamado eletroporação. A eficiência de transformação (entrada de DNA na
bactéria) é bastante baixa (10 -3 a 10-8), mas os transformantes terão o plasmídeo dentro
deles, o que lhes deve conferir propriedades novas, que permitam uma seleção positiva.
De fato, os plasmídeos têm uma gene que confere à bactéria a resistência a um certo
antibiótico (suponhamos, ampicilina), de forma que basta adicionar ampicilina ao meio e
eliminaremos rapidamente todas as bactérias que não tiverem plasmídeo (vazio ou
carregado).

            E como se ver livre do "lixo" representado pelas bactérias que têm o plasmídeo
vazio? Não é possível, pois o plasmídeo vazio confere a mesma resistência ao antibiótico
que o plasmídeo carregado. Entretanto, é possível averiguar ao menos se, no conjunto de
plasmídeos formados, a maior parte está carregada (com inserto) ou, ao contrário, vazia.
Para tal os plasmídeos de clonagem têm uma segunda marca de resistência a antibióticos
(em geral, tetraclina), que é perdida quando o plasmídeo é aberto e o inserto é clonado.
Significa dizer que o sítio de clonagem é interno ao gene para a resistência à tetraciclina.
Significa também dizer que as bactérias que têm plasmídeos vazios são resistentes a
ampicilina e tetraciclina, enquanto as que têm plasmídeos com inserto só mostram
resistência a ampicilina. O procedimento baseia-se na obtenção de uma réplica de uma
placa de Petri contendo colônias crescidas em presença de ampicilina, que é então
carimbada sobre uma nova placa de Petri contendo tetraciclina. As colônias que
crescerem também em tetracilcina não interessam, mas podem ser contadas. A figura
abaixo mostra esquematicamente o procedimento, desenvolvido para outros fins, há
quase 50 anos, por Joshua Lederberg, que também recebeu o Prêmio Nobel pelos seus
estudos (Joshua Lederberg, George Beadle e Edward Tatum receberam o prêmio Nobel
de Fisiologia ou Medicina em 1958. Lederberg provou a existência da recombinação
genética em bactérias e contribuiu de forma importante para o conhecimento da
organização gênica de microrganismos. Beadle e Tatum mostraram que os genes agem
regulando eventos químicos definidos. As Palestras Nobel dos três pesquisadores estão
disponíveis no site de downloads).
Você pode ver uma animação da clonagem em plasmídeos neste site (é um arquivo muito
grande e exige que você tenha o QuickTime movie player instalado):
http://www.ncbi.nlm.nih.gov/books/data/mcb/pictures/ch7/ch7anim2.mov

Figura 6.  O processo conhecido como réplica, na qual um carimbo de veludo estéril, facilmente
improvisado sobre um cilindro de madeira, serve para transferir um pouco de bactérias de cada colônia de
uma placa para outra. Após 24 horas o crescimento na nova placa é avaliado. Neste caso a primeira placa
contém meio de cultura adicionado de ampicilina, enquanto na segunda o meio contém tetraciclina. Da
figura pode-se concluir que a maior parte das bactérias da amostra é sensível à tetraciclina e alberga,
portanto, plasmídeos recombinantes (quiméricos, ou com inserto).

6. Biblioteca genômica: todo o genoma em pedaços...           

O conjunto de bactérias albergando plasmídeos quiméricos ou recombinantes construídos


a partir de DNA genômico é chamado biblioteca genômica. Em princípio, se cortamos um
genoma de um organismo qualquer em pedaços com uma enzima e construímos uma
biblioteca suficientemente grande (isto é, com muitos clones, ou bactérias, diferentes uns
dos outros), teremos uma probabilidade alta de termos qualquer fragmento de DNA
desejado em algum dos clones. Esta meta, contudo, não é tão simples de ser alcançada.
As enzimas de restrição só cortam nos seus sítios específicos e as regiões ricas em
repetições muitas vezes não têm nenhum sítio de restrição. Como o DNA dos eucariotos
superiores é muito rico em regiões repetidas, o que ocorre é que uma parte relativamente
grande do genoma não pode ser clonada desta forma.

            O recurso para obter fragmentos de tamanho razoável (1 a 4 kpb) ao longo de


todo o genoma é a fragmentação do DNA por nebulização ou por outro método mecânico
qualquer e a clonagem dos fragmentos em um vetor aberto com uma enzima que produz
extremidades cegas. Desta forma pode-se obter mais facilmente uma biblioteca genômica
que represente efetivamente todo o genoma.

7.  Clonagem e expressão: o problema dos introns


            Um dos principais objetivos da clonagem é a expressão do segmento clonado. Em
geral entendemos por expressão do gene a proteína que ele codifica. Assim, se
clonarmos um gene qualquer de um mamífero, desejamos em geral que ele possa ser
expresso num outro organismo, digamos, uma bactéria, de forma que possamos obter
grandes quantidades da proteína do mamífero a partir de uma cultura bacteriana. É o que
imaginamos quando ouvimos falar na produção de insulina humana por bactérias.
Entretanto, expressar genes eucariotos em bactérias não é uma tarefa tão fácil quanto a
princípio possa parecer.

            Neste e nos próximos sub-itens vamos discutir as razões pelas quais um gene
eucarioto em geral não pode ser expresso num procarioto se clonado diretamente num
plasmídeo ou fago. Vamos discutir que estratégia pode ser adotada para contornar esta
limitação. Vamos também discutir como deve ser o desenho de um plasmídeo (ou outro
vetor) de expressão para permitir a produção de proteína a partir do gene clonado. E
veremos como deve ser a hospedeira para que o produto final seja de interesse para o
pesquisador. Por fim, vamos discutir como são as proteínas recombinantes, ou quimeras,
e como podemos nos beneficiar destas construções protéicas artificiais.

            Como mostrado na aula 2, é comum nos eucariotos que o quadro aberto de leitura
ou ORF (a região do gene que vai deste o primeiro ATG a ser traduzido até o códon de
terminação) seja interrompido por um ou mais trechos de DNA que não serão
posteriormente traduzidos, pois serão retirados do conjunto, no nível do RNA, no
processo de maturação do RNA mensageiro. Este mecanismo de retirada de segmentos
de DNA não codificantes, chamados íntrons, é conhecido como splicing.

            A figura abaixo mostra uma estrutura hipotética, genérica, de um gene eucarioto, e
a geração de um mRNA eucarioto por splicing e adição de cauda poli-A, acompanhadas
de modificação da extremidade 5´(capping). Adicionalmente, mostramos como seria a
organização de um mRNA com introns, produzido a partir do mesmo segmento gênico,
por um procarioto (por exemplo, a bactéria hospedeira de um plasmídeo recombinante).
Figura 7: Após a produção do transcrito primário, os spliceossomos aproximam o fim e o início de exons
adjacentes e formal um laço com o intron, preparando o conjunto para a retirada da região intrônica (1). O
RNA gerado após o splicing dos introns (2) ainda não é um mRNA maduro, pois terá ainda retirada uma
porção 3´ após o sinal de poliadenilação, deverá receber uma cauda poli-A e a modificação da extremidade
5´(cap 7-metil-guanosina) (3). Um procarioto não é capaz de realizar o splicing e o sistema de tradução
considerará como mRNA válido o RNA transcrito primário (4), desde que os ribossomos possam se ligar ao
RBS da sequência (nos sistemas de clonagem com expressão veremos que o RBS faz parte do vetor).

            É fácil, após a análise da figura acima, entender que um procarioto não será capaz
de produzir uma proteína igual àquela produzida pelo eucarioto, se iniciar o processo com
genes contendo introns. Na verdade, mesmo um outro eucarioto poderá não fazê-lo se o
sistema de splicing não compreender os sinais de splicing (sequências de bases) contidos
no início e no fim dos introns. Por isso, a estratégia para se clonar e expressar genes
eucariotos tem que ser distinta da apresentada na aula 5.

8. Como fazer um DNA eucarioto sem introns?

            Precisamos necessariamente partir de genes cujos introns já foram retirados


(salvo algumas exceções, quando os genes não contiverem introns, como é o caso de
muitos protozoários, por exemplo). Portanto, precisamos partir de RNAs mensageiros
(que não contêm introns) e seguir um caminho inverso, inicialmente, produzindo DNA,
para depois, então, clonar este DNA no vetor e permitir que seja traduzido de volta num
mRNA sem introns.

            Há vários procedimentos para se produzir um DNA fita dupla a partir de um


mRNA. Este DNA é chamado cDNA, pois a primeira etapa de sua construção envolve a
produção de um DNA complementar (daí o C...), como será visto na próxima figura. Neste
capítulo vamos discutir um método que permite criar um DNA fita dupla com extremidades
coesivas diferentes nas pontas 5´e 3´, de tal forma que, na hora de se clonar o segmento
no vetor, a clonagem será uni-direcional, isto é, o inserto entrará apenas num sentido.

            O processo se inicia pela extração do mRNA. Este processo é, do ponto de vista
bioquímico, semelhante ao processo de extração de DNA, porém o RNA é muito lábil,
sujeito à ação das RNAses do próprio organismo e de praticamente qualquer fluido
biológico, inclusive a água não autoclavada. Tomadas as devidas precauções (e
empregando kits comerciais, de preferência) pode-se obter uma boa quantidade de RNA
praticamente a partir de qualquer célula eucariota. Mas o que queremos é mRNA, e não
RNA total (uma mistura de RNA heterogêneo nucelar, RNA transportador, RNA
ribossomal e pequenos RNAs do núcleo, além de mRNA). Por isso, empregamos uma
segunda etapa de purificação, onde o mRNA é separado por cromatografia de afinidade
dos demais RNAs. Geralmente se usa um kit, no qual uma pequena seringa cheia de gel
de sepharose ligada a oligonucleotídeos poli-T serve de sistema de captura dos mRNAs
(pela extremidade poli-A, que vai parear com os poli-T do gel). Após lavar com tampão
tudo o que não ficou aderido, desloca-se o mRNA da coluna com uma solução de alta
força iônica e, pronto! Temos em três ou quatro gotas de tampão mRNA suficiente para
obter uma biblioteca de cDNA.
            Em seguida vamos discutir o processo de produção do DNA fita dupla a partir de
mRNA. O processo, que é todo conduzido em tubo de ensaio, se inicia pela produção de
um DNA complementar fita simples, a partir do mRNA. Como a transcriptase reversa
necessita de um primer para iniciar sua tarefa, empregamos oligonucleotídeo poli-T. No
caso mostrado na figura, detalhe (1), o oligo dT é prolongado, no sentido 5´, por um
conjunto de bases que contém o sítio de restrição para uma enzima A (neste caso, a
enzima XhoI, cujo sítio de restrição é 5´- CTCGAG - 3´). Esta é a forma de adicionarmos
ao nosso futuro DNA um sítio de restrição conhecido bem na extremidade 3´.

            Uma vez pareado, o primer vai permitir a síntese da primeira fita de DNA, que será
estendida com a ajuda da transcriptase reversa e com dNTPs (desoxirribonucleotídeos tri-
fosfato), como na síntese de DNA normal (etapa (2)). Para proteger a fita de DNA contra a
ação de enzimas de restrição (que serão empregadas mais adiante), o sistema de reação
tem, no lugar de desoxicitosina-trifosfato, um precursor metilado, a 5´-metil-citosina-
trifosfato, que vai impedir a ação das duas enzimas de restrição sobre o DNA recém
sintetizado, numa etapa posterior que já iremos comentar. A transcriptase reversa tende a
parar seu processo de síntese de DNA complementar antes de chegar ao início do mRNA
(estamos produzindo o cDNA de "trás para frente"). Esta parada é ocasionada, em parte,
por uma atividade RNásica residual da enzima, que pode degradar o RNA que ela mesma
está prestes a copiar como DNA. Nos kits modernos a transcriptase reversa recombinante
empregada tem uma atividade RNásica muito pequena, mas ainda assim se observa uma
parada da produção do cDNA antes da extremidade do mRNA, por razões ainda não
completamente compreendidas, e que acaba gerando um cDNA mais curto que o mRNA
original. Mais adiante discutiremos a importância da perda de informação genética nesta
região 5´ do cDNA.

            Para a síntese da segunda fita de DNA a maior parte dos kits comerciais usa um
artifício, denominado nick translation (tradução por cortes), que é uma denominação muito
mal encontrada pelos seus inventores para o processo de replicação de DNA descrito a
seguir. Inicialmente, com o uso da atividade endonucleásica de uma enzima adequada,
inserimos pequenos cortes na cadeia de fosfatos do RNA (os chamados nicks). Estes
cortes criam automaticamente extremidades 3´-OH, que servirão de apoio para que a
DNA polimerase (em geral o chamado fragmento Klenow da DNApol I bacteriana, que
polimerisa mas não faz revisão da síntese). Estes nicks estão mostrados na etapa (3). A
partir deles a DNApol I (ou o fragmento Klenow) sintetiza pequenos trechos de DNA,
apoiando-se nas extremidades 3´-OH criadas pelos nicks. Ao término desta etapa a DNA
pol produz uma série de fragmentos e reconstitui, em fita dupla, o sítio Xho I na
extremidade 3´ do DNA (detalhe (5)).

 
Figura 8: Síntese de cDNA para clonagem uni-direcional em vetor de expressão. Cada etapa está
discutida no texto. Os círculos vermelhos representam as bases metiladas. A seta na etapa 4 aponta para
um nick ou corte.

            Em seguida os fragmentos são ligados entre si pela ação da ligase (etapa (6)) e
eventuais saliências (overhangs) da fita são retirados pela ação de uma exonuclease
adicionada ao tubo. Esta ação é chamada de trimming (segundo detalhe (6)). A próxima
etapa é a adição de adaptadores, que são pequenos fragmentos de DNA fita dupla
contendo um sítio de restrição para uma segunda enzima (no exemplo, o sítio GAATTC,
da enzima EcoRI). Estes adaptadores são colados durante algumas horas pela incubação
do DNA 'trimado" na presença de ligase. O resultado é o que está mostrado na etapa (7).
A adição de vários adaptadores em cada extremidade é minimizada por um artifício
bioquímico, que envolve a desfosforilação de uma das extremidades 5´ dos adaptadores.

            O penúltimo passo é o corte do fragmento de DNA fita dupla com as duas enzimas
de restrição para as quais adicionamos sítios (neste caso, Xho I e Eco RI), mostrado na
etapa (8).  As duas enzimas cortam o DNA formando extremidades coesivas, isto é,
deixando bases despareadas, numa saliência (overhang) 5´. As duas enzimas não podem
cortar o DNA recém sintetizado em algum sítio de restrição interno, pois ele está protegido
pela adição das bases metiladas na primeira etapa de síntese. Os adaptadores e o sítio
XhoI, contudo, não têm esta proteção e podem ser clivados. Os fragmentos de DNA
gerados por estes cortes são eliminados de nosso tubo por uma reação de filtração ou de
precipitação e o DNA fita dupla, pronto para ser clonado unidirecionalmente, fica
disponível finalmente (etapa (9)).

9.  Biblioteca de cDNA e características de um vetor de expressão para Escherichia


coli.

               A clonagem dos insertos de cDNA em plasmídeo e a transformação de bactérias


com estes plasmídeos gera uma biblioteca de cDNA. Assim, da mesma forma que
definimos para biblioteca genômica, a biblioteca de cDNA é o conjunto de bactérias, cada
qual transportando múltiplas cópias de um plasmídeo carreando um inserto representando
um cDNA qualquer obtido do material biológico doador de mRNA. Se o plasmídeo tiver
certas características básicas que permitam a expressão do inserto clonado, será
produzida uma proteína recombinante. Como deve ser este plasmídeo?

                Inicialmente, devemos ter em mente que os cDNAs gerados pelo sistema
descrito acima nem sempre contêm toda a ORF (o quadro aberto de leitura) do gene. O
esquema abaixo mostra as várias possibilidades, fruto do fato de que a transcriptase
reversa encerra aleatoriamente seu trabalho de síntese da primeira fita . 

 
  

Figura 10:  Vários cDNAs de tamanhos diferentes são produzidos a partir do mesmo mRNA. A razão
desta variação é o abandono da síntese da primeira fita pela enzima transcriptase reversa em diferentes
momentos da síntese, provavelmente devido à clivagem do RNA mensageiro adiante dela pela ação
remanescente de RNAseH que existe naturalmente nesta enzima. O mRNA original (1) é em geral mais
longo do que qualquer um dos cDNAs gerados pela ação da trascriptase reversa. O mais curto (4) não
contém sequer um trecho da ORF. UTR = "untranslated region" ou região não traduzida.

            Como as ORFs costumam ser muito mais longas do que as UTRs (veja
proporções no alto da figura 5.10), a maior pare dos cDNAs gerados cai no caso descrito
em 3, isto é, contém uma parte da ORF e a região 3´ não traduzida (3´- UTR).

            Se clonarmos unidirecionalmente o cDNA com a estrutura mostrada em (3), Figura


5.10 num vetor de expressão, teremos que disponibilizar no vetor um promotor à
esquerda (5´) do fragmento clonado. Deveremos também adicionar um operador ao
sistema para que a hospedeira não corra o risco de se intoxicar e morrer com uma
quantidade grande de proteína recombinante (que, por não ser normalmente um produto
da hospedeira, perturba seu metabolismo, sobretudo quando está em grandes
quantidades, o que é geralmente o caso de proteínas recombinantes). Além disso, pelo
fato de que a ORF clonada é em geral incompleta e não contém o ATG inicial, precisamos
também acrescentar um ATG (e um RBS antes dele) para garantir a síntese de proteína a
partir do mensageiro. A figura abaixo mostra esquematicamente estas propriedades do
plasmídeo e a conseqüente proteína recombinante gerada pela clonagem.

 
Figura 11  Esquema representativo de um vetor de expressão que emprega parte do operon lac (muito
modificado) para garantir a expressão controlado dos insertos clonados no sítio múltiplo de restrição (MRS).
Veja o texto abaixo para detalhes. A cabeça do cavalo é a parte aminoterminal da proteína (NH2) e cauda
da tartaruga a extremidade carboxi-terminal (COOH).

            O exemplo dado na figura é bem próximo à realidade, isto é, assemelha-se a


plasmídeos comerciais que são frequentemente usados nos laboratórios de pesquisa e
desenvolvimento. Vamos analisar detalhadamente cada parte da figura.

             Observe que o local onde a clonagem será feita é chamado MRS ou sítio múltiplo
de restrição, por conter vários sítios de restrição muito próximos e únicos em todo o
plasmídeo. A vantagem deste arranjo sobre aquele que emprega uma única enzima é que
o experimentador tem muito mais liberdade de escolher a enzima de restrição que irá
empregar para contar o DNA doador. Além disso, ele pode cortar o vetor com duas
enzimas e obter extremidades diferentes à esqueda (5´) e à direita (3´), o que permitirá a
clonagem unidirecional dos fragmentos gerados com a técnica descrita na figura 5.8.

            A clonagem será feita, neste exemplo, dentro do gene lacZ. Consequentemente,
se a bactéria hospedeira for lacZ -, ela se tornará lac + quando receber o plasmídeo vazio
(sem inserto) e permanecerá lac- se receber um plasmídeo recombinante (carregando um
inserto). Mediante o uso de um indutor do sistema (no caso, um análogo de latose, o
IPTG ou isopropil-tio-galactosídeo) e um indicador da atividade da b-galactosidase (a X-
gal), é possível visualizar como colônias azuladas aquelas formadas por bactérias com
plasmídeos vazios e como colônias transparentes aquelas formadas por bactérias com
plasmídeos recombinantes. É a chamada "seleção por cor".

            Após o gene lacZ é indispensável um sinal de terminação da tradução, que


terminará a síntese do mRNA. Ele está indicado como uma pequena caixa preta, marcada
com um t. O mRNA, por sua vez, termina num grampo, seguido de um poli-U,
representado por uma pequena elipse rosa cortada por 3 Us.

            A síntese de mRNA é iniciada no promotor e está sob controle do operador.


Assim, a bactéria só irá expressar a proteína recombinante se houver indutor no meio,
evitando que ela morra intoxicada com a proteína recombinante que está fazendo.
Embora o promotor lac seja fraco na Natureza, o que se emprega para clonagem é um
promotor mutante forte.

            Como não podemos ter certeza de que o primeiro ATG da ORF original do gene
obtido do organismo doador está disponível (o que implicaria dizer que a transcriptase
reversa teria copiado toda a região 3´não-traduzida mais toda a ORF antes de parar),
convém contar com a presença de um ATG no plasmídeo, que é justamente o ATG do
gene lacZ. É indispensável também ter um RBS procarioto antes deste ATG, como
indicado pelas caixas azuis na figura, para fazer do RNA transcrito um verdadeiro mRNA.

            Na figura acima o inserto clonado contém parte da ORF do organismo doador e a
extremidade 3´ não traduzida (3´ UTR). Quando se dá a clonagem, o gene lacZ fica
interrompido. A primeira parte do gene servirá para codificar os primeiros aminoácidos da
proteína recombinante (representados pela cabeça de cavalo ao final do esquema). A
segunda metade nunca será expressa porque os ribossomos terminarão a síntese num
códon de terminação muito anterior ao início do trecho restante do lacZ. No caso
específico do exemplo da figura, o inserto contém parte da ORF (presumivelmente no
mesmo quadro de leitura do lacZ, 1a. parte) e portanto há no fim desta ORF um códon de
terminação do gene do organismo doador. Se o quadro de leitura estiver errado ou se
apenas a extremidade 3´ UTR for clonada, existe uma pequena chance de que os
ribossomos alcancem a 2a. parte do lacZ, mas provavelmente fora do quadro de leitura (2
chances em 3). De uma forma geral, podemos afirmar que a segunda parte do lacZ nunca
é traduzida.

            A partir do ATG após o RBS plasmidial, forma-se então uma ORF que termina em
geral no códon de terminação (stop) do gene doador. É necessariamente uma ORF
recombinante, que dará consequentemente origem a uma proteína recombinante, ou
quimérica. A proteína é sempre muito menor do que o mRNA sintetizado a partir do
promotor lac do plasmídeo. A "cabeça" beta-galactosidase da proteína recombinante (ou
quimérica) não é enzimaticamente ativa.

        Esgotada a discussão da figura, podemos ainda discutir outras características do


plasmídeo de clonagem e expressão. Como o exemplo de plasmídeo discutido na
construção de bibliotecas genômicas , este também deve conferir à bactéria uma marca
seletiva. Em geral, esta marca é a resistência a um antibiótico. Os plasmídeos comerciais
em geral empregam a marca de resistência à ampicilina. Por fim, o plasmídeo deve ter
uma origem de replicação autônoma e relaxada, que permita a geração de um grande
número de cópias por bactéria.

            Muitos plasmídeos apresentam outras características interessantes, mais ou


menos comuns a todos. Uma delas é a existência de sequências de bases antes e depois
do inserto que permitirão a hibridização de primers para o sequenciamento do inserto. No
capítulo seguinte falaremos em maiores detalhes sobre esta estratégia.

            Como saber se a biblioteca de cDNA que construímos tem qualidade, isto é, têm a
maior parte dos clones cheia com insertos? No exemplo dado na figura acima temos um
poderoso recurso, a seleção por cor. De fato, basta plaquear no meio indicador (contendo
IPTG e X-gal) a bactéria e poderemos em poucas horas avaliar se a porcentagem de
colônias brancas é muito maior que a de colônias azuis. Uma biblioteca razoável deve ter
ao menos 90% de colônias brancas.

    Outro aspecto importante é a representatividade de nossa biblioteca. Assim que a


construímos, podemos calcular quantos clones (uma bactéria carregando um grande
número de cópias do mesmo plasmídeo recombinante) independentes geramos no
volume total de nosso ensaio. Se a maior parte dos clones estiver com inserto, podemos
assumir que a biblioteca será representativa se tiver ao menos 500.000 clones. Mas
porque um número tão grande, se não há nenhum organismo que expresse um número
tão grande de genes? De fato, 100.000 genes é quase o limite para o número de genes
de um organismo complexo como o homem. Entretanto, devemos nos lembrar que os
genes muito expressos gerarão muitos cDNAs e, conseqüentemente, muitos clones,
enquanto que os genes pouco expressos poderão gerar apenas um clone na mistura total.
Por isso, é necessário sempre um número de clones independentes muito maior do que o
total esperado de genes expressos no material empregado para a construção da
biblioteca de cDNA.

10. Seleção (triagem ou screening) de clones pela expressão da proteína


recombinante.

            Se desejarmos encontrar em nossa biblioteca de cDNA um clone qualquer,


geralmente o que fazemos é procurar pelo clone que está expressando a proteína que
queremos. Mesmo considerando que a proteína é quimérica, ela terá ao menos uma
porção (final) da proteína de interesse. Para uma triagem voltada à proteína, geralmente
empregamos como sondas anticorpos, obtidos pela imunização de camundongos ou
coelhos com uma proteína de mesma função, purificada de outro organismo, ou mesmo
recombinante, mas de outra origem. Como os anticorpos produzidos são policlonais e
dirigidos contra múltiplos epitopos ao longo da proteína, é muito provável que reconheçam
a parte da proteína recombinante que teve origem no inserto (o corpo de tartaruga da
figura acima), mesmo que os anticorpos tenham sido feitos contra uma proteína
semelhante de outro organismo.  

            Para que os anticorpos possam encontrar as proteínas recombinantes, é essencial


que as bactérias sejam rompidas e o conteúdo protéico fixado num substrato adequado.
De forma semelhante ao que fazemos na triagem de bibliotecas genômicas, uma
membrana circular (desta vez de nitrocelulose, que adere proteínas; no caso das
bibliotecas genômicas a membrana é de nylon, que adere o DNA) é colocada sobre uma
placa de Petri quando as colônia de uma pequena alíquota da biblioteca ainda estão
pequenas. Deixa-se que as colônias cresçam algumas horas em contato com a
membrana, que é então retirada. A placa (master) deve ser mantida na geladeira. As
bactérias são lisadas, o conteúdo bacteriano é sondado pelos anticorpos, que se ligarão
às manchas protéicas onde há a proteína recombinante que eles reconhecem. O excesso
de anticorpos é lavado com tampão e os anticorpos fixados são revelados pelo uso de um
conjugado adequado (anticorpo anti-anticorpo, ligado à enzima peroxidase, por exemplo)
e de um substrato que possa ser visualizado facilmente (no caso da peroxidase, pode ser
empregada a tetrametilbenzidina como substrato cromogênico e o peróxido de hidrogênio
como doador de oxigênio reativo). As manchas reativas indicarão na placa de Petri master
a posição das colônias de interesse.

            É evidente que também podemos empregar, como fizemos para a triagem de
bibliotecas genômicas, sondas de DNA, mas os clones encontrados não necessariamente
estarão expressando os insertos na forma de proteínas recombinantes, porque os insertos
podem estar fora do quadro de leitura inicial do lacZ.

            Há muitos detalhes técnicos na triagem que não discutimos, porém a base do
processo está adequadamente esclarecida.

11. Que genes estão representados numa biblioteca de cDNA?

            Ao contrário de uma biblioteca genômica, que contém em princípio qualquer


fragmento de DNA do organismo doador, a biblioteca de cDNA contém apenas os genes
expressos pelas células empregadas na extração de mRNA, e ainda assim apenas
aqueles expressos imediatamente antes do processamento das células no laboratório.
Isto implica dizer que uma biblioteca feita com células do meristema apical de uma planta
terá muitos genes diferentes de uma outra biblioteca feita a partir de estame. Mas também
terá muitos outros iguais, pois há genes que são expressos em diferentes tecidos e
mesmo outros expressos em qualquer tecido.

12. Proteínas recombinantes: as quimeras são desejáveis?

            Ao examinarmos a proteína recombinante esquematicamente representada na


figura 11 poderíamos nos perguntar: para que serve uma proteína híbrida, parte beta-
galactosidase bacteriana e parte proteína de meu organismo de estudo? Não seria mais
sensato ter apenas a parte não bacteriana para ensaiar?

            Mesmo uma proteína quimérica pode ter aplicação imediata. Apenas como
exemplo discutimos duas aplicações rotineiras: como antígeno diagnóstico e como vacina.

            Se desejamos empregar uma proteína recombinante para diagnóstico


(suponhamos, uma proteína que se inicia com a beta-gal e termina com uma fração
carboxi-terminal da tubulina de Leishmania), podemos fixá-la aos micropoços de uma
placa de ELISA. Em seguida, o soro dos pacientes pode ser previamente misturado com
uma solução contendo extrato de Escherichia coli, de forma a imunoadsorver na fase
líquida todos os eventuais anticorpos do paciente contra proteína bacteriana, em geral, e
contra a beta-galactosidase em particular. Por fim, basta pipetar o soro imunoadsorvido
sobre os micropoços. Os anticorpos livres contra atubulina de Leishmania (presentes no
soro dos pacientes com leishmaniose) vão aderir à à parte recombinante da tubulina e
ficarão presos ao plástico. O excesso de anticorpos é lavado e a presença dos anticorpos
fixados à tubulina detectada como descrito acima para a triagem de colônias. Poder-se-ía
argumentar que os anticorpos humanos são produzidos contra a tubulina completa, e não
reconheceriam apenas parte dela. Entretanto, com dito acima, a produção de anticorpos
numa imunização e numa infecção é, em geral, policlonal, e dirigida contra muitos
epitopos, que podem estar na parte amino (não presente na nossa proteína
recombinante) ou na parte carboxi-terminal (representada pelo corpo de tartaruga da
figura 11).

            Esta abordagem é especialmente interessante quando o antígeno (uma proteína


ou uma mistura de componentes do organismo infectante) é difícil de conseguir. É o caso
da filariose bancroftiana, pois o único hospedeiro do parasita Wuchereria bancrofti é o ser
humano. Não é ético e viável obter grandes quantidades de microfilárias de um paciente
para diagnosticar os demais! A produção de uma biblioteca de cDNA também depende de
microfilárias ou vermes adultos de um paciente, mas é evento único e uma vez construída
a biblioteca não será mais necessário voltar a obter parasitas do paciente.

            No caso de desejarmos fazer uma vacina, a abordagem é semelhante: basta


inocularmos a proteína recombinante no mamífero que desejamos imunizar, com ou sem
adjuvantes. É preciso apenas ter atenção para a imunogenicidade da parte plasmidial da
proteína recombinante. A beta-galactosidase é pouco imunogênica e pode ser
empregada, mas outras construções usam polipeptídeos mais imunogênicos,  que devem
ser empregados com cautela.

                Se, por qualquer razão, não podemos de forma alguma usar uma proteína
quimérica, podemos lançar mão de vetores que têm imediatamente antes do sítio de
restrição empregado na clonagem uma sequência de bases que codifica um pequeno
peptídeo reconhecido e cortado por uma enzima adequada. Na figura 11 é como se a
cabeça de cavalo estivesse ligada ao corpo da tartaruga por uma pequena haste de
peptídeo, que pode ser cortada por uma enzima. Podemos então capturar as proteínas
recombinantes da lise bacteriana por uma coluna de cromatografia de afinidade com
anticorpos dirigidos contra a parte plasmidial da proteína recombinante (a cabeça de
cavalo). Uma vez lavada a coluna para retirar o material não fixado, adiciona-se a ela um
pequeno volume de tampão contendo a enzima que corta a união entre a cabeça e o
corpo, e recolhe-se no efluente da coluna apenas a parte que interessa (proteína do
organismo doador) da proteína quimérica.

 
III. PCR - Uma técnica de mil e uma utilidades

Esta aula é bastante longa. Por isso optamos por construir internamente links para seus
diversos temas, tabelados abaixo. Basta clicar sobre o tema de interesse.

Sinopse da aula
Primeiros passos - Introdução ao PCR
PCR na investigação de Paternidade
PCR na investigação de crimes
PCR no diagnóstico de enfermidades genéticas
PCR em tempo real - o sistema Taqman
Um pouco de história
Artigos importantes sobre PCR
 

A. Primeiros passos

Ainda na década de 60 muitos pesquisadores procuraram obter a síntese de DNA in vitro.


É evidente que obter DNA em tubo de ensaio é o primeiro passo para um universo de
experimentos em genética molecular. O primeiro a conseguir caminhar neste sentido foi
Arthur Kornberg, de quem já falamos na aula sobre replicação do DNA. Era natural, já que
Kornberg era um profundo conhecedor das DNA polimerases. A síntese de um DNA viral
in vitro foi recebida com entusiasmo por todos, inclusive a imprensa leiga, que qualificou o
feito como a criação da vida em laboratório. Esta metáfora tem sido usada pela imprensa
com insistência em várias ocasiões, sempre que se trata de manipular o DNA de um ser
vivo, e em geral provoca mal estar entre os pesquisadores, o que foi o caso de Arthur
Kornberg.

Em 1983, Kary Mullis, então pesquisador empregado na Cetus Corporation, EUA,


imaginou uma forma de fazer com que a DNA polimerase iniciasse e terminasse seu
trabalho em trechos pré-determinados do DNA. Com o sistema seria possível amplificar
milhões de vezes um pequeno trecho de um longo segmento de DNA. A idéia foi
aprimorada na Cetus e apresentada pela primeira vez em 1985, numa conferência.
Depois disso a técnica, conhecida como PCR, ganhou quase instantaneamente uma
aceitação mundial e em menos de uma década tornou-se o procedimento básico de todo
laboratório de genética molecular no mundo.

Mas, afinal, o que é a PCR?

A sigla significa "polymerase chain reaction", que em português seria reação em cadeia
da polimerase. Então, a base da técnica é a ação in vitro da DNA ´polimerase. Para
compreendermos como funciona a técnica, que é na verdade bem simples, precisamos
recordar que, para iniciar a síntese de uma fita nova, a DNA polimerase precisa de um
primer (de RNA ou de DNA), de um DNA molde e de precursores de síntese de DNA,
coletivamente chamados dNTPs (desoxinucleotídeos tri-fostato, i.e., dATP, dTTP, dCTP e
TGTP).
A idéia de Mullis era simples. Adicionava-se ao tubo de ensaio um pouco de DNA
contendo o trecho que queria amplificar, os dNTPs, a DNA pol e dois primers de DNA
feitos em laboratório, um hibridizando numa fita e "apontando" para o outro, que
hibridizava com a outra fita e "apontava" para o primeiro. A distância entre os sítios de
pareamento dos dois primers não podia ser muito grande, e foram escolhidos para testes
trechos com menos de 1000 pb. Com todos os reagentes no tubo, a reação era
inicialmente aquecida a 94 oC, para que todas as fitas de DNA se desnaturassem. Em
seguida a temperatura era reduzida para permitir o pareamento dos primers, em geral
para 50 oC. Por fim, a temperatura era reduzida ainda mais, até 37 oC, para que a DNA
polimerase de E. coli pudesse trabalhar e estender duas fitas simples de DNA, uma a
partir de cada primer, duplicando, assim, a sequência alvo escolhida. Ao se repetir o ciclo
os primers encontrariam agora dois alvos cada um, a partir do primeiro alvo replicado: um
no DNA original e outro na cópia recém sintetizada, gerando, por sua vez, ao fim do novo
ciclo, 4 cópias do alvo. É claro que a repetição do processo geraria um número de cópias
do alvo que se elevaria exponencialmente, com base 2.

Na verdade, a coisa não foi tão fácil assim: a DNA pol era termoinstável (como a maioria
das proteínas dos seres vivos) e se inativava irreversivelmente a 94 oC. Era preciso
adicionar mais DNApol no tubo a cada ciclo de extensão. Além disso, a baixa temperatura
de funcionamento da DNApol de E. coli propiciava o aparecimento de pareamentos
espúrios (sem sentido, errôneos) no sistema, gerando ao final produtos de PCR
inesperados.

A solução foi encontrada logo: a DNA pol de E. coli foi substituída por uma DNA
polimerase de um microrganismo termo-tolerante, o Thermus aquaticus. A enzima foi
batizada de Taq polimerase e permitiu, finalmente, que o PCR se tornasse uma
ferramenta extraordinariamente útil na genética molecular. Que propriedades têm a Taq
polimerase que a fazem tão útil? Ela é termoestável e sua temperatura ótima de
funcionamento é 72 oC. Com isto três problemas ficaram automaticamente resolvidos:

a) não havia mais necessidade de adicionar enzima no tubo a cada ciclo.


b) a menor temperatura do ciclo era a de hibridização, que podia ser mantida acima de 50
o
C, evitando hibridizações espúrias.
c) o DNA molde não se renaturava por completo, permitindo uma rápida desnaturação ao
se iniciar um novo ciclo.

Adicionalmente, a manutenção do tubo fechado evitava contaminação do material do


laboratório e dos estoques de reagentes com os amplicons, nome genérico dado aos
produtos de amplificação da PCR. É claro que um amplicon gerado com um par de
primers qualquer serve perfeitamente de molde para uma nova reação de PCR com os
mesmos primers. A contaminação de reagentes e pipetas com amplicons continua sendo
um problema para todos que trabalham com PCR. 

Os eventos ligados às três temperaturas que mencionamos, 94 oC, 50 oC e 72 oC, estão


esquematizados na figura abaixo. Observe que, a 94 oC, os primers e as fitas simples de
DNA alvo estão misturados, mas não podem parear. Quando a temperatura é reduzida os
primers rapidamente alcançam seus sítios de complementariedade, pois são moléculas
pequenas e, portanto, muito móveis, e porque estão em concentração muito mais elevada
que o DNA alvo. O DNA molde tende a renaturar, mas logo a temperatura é novamente
elevada para 72 oC, que permite a extensão das novas fitas a partir dos primers, sem
desparear os primers outra vez. Por fim, a temperatura volta a 94 oC, que desnatura todas
as fitas, inclusive as recém sintetizadas, recomeçando o processo.

Figura 12: Eventos relacionados às três temperaturas básicas da PCR: Desnaturação a 94 oC,
pareamento dos primers a 50 oC e extensão de novas fitas a 72 oC, supondo neste caso que a enzima
empregada seja a Taq polimerase ou outra DNA polimerase termo-estável.

O processo descrito acima gera dois tipos de fitas simples: uma de comprimento variável,
obtida a partir de um primer que tenha hibridizado com a fita de DNA original (em geral
um longo fragmento de DNA obtido diretamente de um ser vivo ou de um vírus ou
plasmídeo), e outra, de comprimento determinado, que é obtida sempre que um DNA
previamente copiado é empregado como molde em sua síntese.

Esta situação está claramente representada na figura abaixo, que mostra os três
primeiros ciclos de uma PCR. Observe que a fita estendida a partir de um primer
hibridizado com o DNA molde original não tem comprimento fixo, porque o molde é muito
longo. Seu comprimento final vai ser determinado  pelo instante em que o primer hibridizar
com o sítio de complementariedade e pela tempo de extensão total, à temperatura de 72
o
C. As duas primeiras fitas estendidas estão indicadas com a letra e à sua direita. Já as
fitas que são produzidas a partir de primers que hibridizaram em fitas previamente
copiadas têm fatalmente ser comprimento definido, já que inicia, no primer e terminam ao
fim do DNA molde, que é exatamente a e extremidade 5´do primer já incorporado na fita
molde. As fitas de comprimento definido aumentam de número exponencialmente,
formando aos poucos um imenso número d fita duplas de comprimento definido, enquanto
as fitas estendidas aumento linearmente (duas a cada ciclo, por alvo). Uma inspeção da
figura a seguir esclarecerá o leitor sobre esta questão.
Figura 13:  Produção de novas fitas a partir de um DNA alvo pela PCR. Após hibridização dos primers a
56 oC, as fitas novas são sintetizadas a 72 oC, dando origem a fragmentos estendidos (indicados no primeiro
ciclo pela letra e) e fragmentos amplificados (contornados em amarelo). Os fragmentos amplificados
acumulam exponencialmente na reação.

A visualização dos produtos de uma reação de PCR costuma ser feita através do uso da
eletroforese em gel. Pode-se usar um gel de poliacrilamida, que corre verticalmente, e
corar as bandas de DNA com nitrato de prata ou se pode optar por correr um gel
horizontal de agarose e visualizar as bandas por transiluminação UV, "corando"
previamente o DNA com brometo de etídio (esta substância se intercala entre as fitas de
DNA e nestas condições absorve o UV e fluoresce com cor alaranjada).  O produto de
PCR será sempre um DNA fita dupla e o que distingue um do outro, no gel, será apenas o
comprimento relativo. Esta situação está representada no esquema da figura seguinte.

Figura 14:  Visualização de três reações de PCR. Em a e b dois produtos são gerados, a partir de dois
pares de primers diferentes. Os dois produtos têm comprimentos de 400 e 360 pb. A migração das bandas
na eletroforese é de cima para baixo. O fragmento menor migra mais rápido e produz a banda em vermelho.
O maior se desloca mais lentamente no gel e produz a banda em verde. A coluna c é um controle negativo,
essencial em qualquer reação de PCR. A coluna d mostra os marcadores de peso molecular (neste caso,
uma escada de DNA - DNA ladder - de 100 pb). Na transiluminação ou na coloração por prata,
evidentemente, todas as bandas têm a mesma cor.

Quando fazemos um PCR, a prática aconselha a deixar o tubo com os reagentes por 5 a
10 minutos a 94 oC antes de iniciar o ciclo. Em geral 1 minuto a cda temperatura é
suficiente para as etapas do ciclo, que é repetido de 35 a 40 vezes. Por fim, ao terminar a
última extensão muitas vezes os protocolos experimentais sugerem a manutenção da
temperatura de 72 oC por mais 5 a 10 minutos. A opção de esperar 10 minutos antes de
começar o ciclo, mantendo o tubo aquecido, garante que todo o DNA alvo esteja
desnaturado antes de se iniciar o ciclo. Por outro lado, o período final a 72 oC garante que
todas as fitas terão o mesmo comprimento pois pode acontecer que, durante o ciclo,
algumas fitas copiadas não tenham atingido o fim do molde. A figura a seguir sintetiza o
ciclo da PCR.

Figura 15: Ciclo padrão de uma PCR. Antes de iniciar o ciclo o tubo com os reagentes é mantido a 94 oC
para garantir a desnaturação inicial de todo DNA alvo. Da mesma forma, ao terminar o ciclo, a manutenção
do tubo a 72 oC garante que todos as fitas tenham exatamente o mesmo número de bases.

Quando PCRs são realizadas, gerando produtos de diferentes comprimentos, e estes


produtos são analisados por transiluminação UV em gel de agarose, o resultado que se
obtém pode ser semelhante ao mostrado abaixo. O menor dos produtos migra mais
rápido e gera a banda mais em baixo no gel. Em geral o gel de agarose separa bem
fragmentos entre 150 pb e 1000 pb. Fora desta faixa pode ser necessário usar um gel de
poliacrilamida.
Figura 16:  Imagem obtida de um gel de agarose mostrando bandas correspondentes a produtos de PCR
com diferentes comprimentos (número total de pares de bases) (colunas 2 a 5). Na coluna 1 estão os
marcadores de peso molecular, fragmentos de DNA fita dupla de comprimento conhecido, obtidos por
digestão por enzima de restrição de um DNA conhecido ou sintetizados por máquinas. A coluna 6 é um
controle negativo e a pequena banda difusa no fim do gel é apenas a fronteira da eletroforese.

Nos dias de hoje uma PCR é feita numa máquina chamada termociclador. É
simplesmente um bloco aquecido, controlado por um sistema digital, que eleva e abaixa a
temperatura do material nele inserido (tubos de ensaio pequenos, micro-placas de 96
poços, etc), de acordo com a programação digitada pelo operador. Mais de duas décadas
foram necessárias para que estas máquinas pudessem atingir um grau de precisão e
confiabilidade aceitáveis, aliado a um preço razoável. Também os reagentes para PCR
reduziram de preço consideravelmente na última década, tornando o método
comercialmente atrativo. Uma reação de PCR pode, agora, ser feita por US$ 1,00.

Além do cuidado com a contaminação de amplicons, a PCR exige atenção em vários


outros detalhes. Um deles diz respeito ao pareamento dos primers: a última base da
extremidade 3´ do primer tem que estar corretamente pareada com o DNA alvo, sem o
que não ocorrerá amplificação. No restante do primer a necessidade de um pareamento
exato não existe e, na extremidade 5´podemos até mesmo adicionar um segmento fita
simples que não vai parear com o DNA alvo. Este ressalto (overhang) não atrapalha em
nada a reação e pode adicionar propriedades importantes ao nosso amplicon final. Vejam
um exemplo disso na construção da biblioteca de cDNA na aula 6!

Outro ponto importante é a questão dos erros na sequência devido à tautomeria de bases.
A Taq polimerase não faz revisão (proof reading) in vitro. Se, ao copiar pela primeira vez o
DNA alvo, ela introduzir uma base errada numa das duas fitas, 25% do produto final
estará com sua sequência diferente nesta base. As consequências deste erro podem ser
trágicas se estamos procurando fazer um diagnóstico genético (veja item
correspondente). Para evitar isto todos os testes são feitos em duplicata. A idéia é que a
probabilidade da Taq polimerase "errar" nas duas reações sempre na primeira extensão é
muito reduzida e se um resultado conflitante surgir, fica claro que num dos tubos a Taq
"errou". Se o "erro"  for cometido depois do terceiro ciclo ele já se torna praticamente
imperceptível, pois uma pequena porcentagem das fitas terá erro e não será possível
detectá-lo facilmente.
Seria ideal que pudéssemos disponibilizar em Downloads um relato de Mullis sobre o
PCR a partir da sua apresentação na Academia Nobel. Entretanto, não há na página da
Academia Sueca que coordena o Nobel (http://www.nobel.se) as palestras de Kary Mullis
e Michael Smith. Uma apresentação on-line dos trabalhos dos dois laureados Nobel em
Química, do ano de 1993 está disponível: Michael Smith (pelo aperfeiçoamento da
tecnologia da mutação sítio-dirigida) e  Kary B. Mullis (pela invenção da PCR).
 http://www.nobel.se/chemistry/laureates/1993/illpres/index.html

 para outro.

B. PCR na investigação de Paternidade

Uma das aplicações mais conhecidas da PCR é a investigação de paternidade. Técnicas


bioquímicas ou moleculares (voltadas ao DNA) já existiam muito antes da descoberta da
PCR, mas foi com o desenvolvimento de sistemas diagnósticos baseados em PCR que a
investigação de paternidade alcançou o mercado com mais abrangência, pela redução
dos custos do exame e democratização dos reagentes (pode-se realizar o teste sem
pagar royalties).

Para se compreender como funciona a técnica precisamos recordar um pouco a


organização do genoma humano ( e de muitos outros organismos complexos). Apenas
3% do nosso genoma é composto de genes. Há, ao contrário, uma enorme parte dele
composta de repetições mais ou menos longas, conforme o caso. Não sabemos ainda
porque isto ocorre, mas estas repetições podem ser usadas vantajosamente como
marcadores moleculares em muitos casos. Como não são genes, não estão sob uma
pressão seletiva tão grande e mostram muito mais variação do que as sequências de
genes propriamente ditas.

Dentre as regiões repetidas a investigação de paternidade por PCR costuma empregar


uma classe de repetições conhecidas como STR - small tandem repeats ou pequenas
repetições em tandem. São pequenas regiões de DNA com um número variável de
repetições de 3 ou 4 nucleotídeos cada, flanqueadas por regiões conservadas. Um
esquema simplificado de um STR está mostrado na figura abaixo. Como os seres
humanos e os demais mamíferos são diplóides, cada região de um cromossomo (exceto
nos machos o par XY) está presente no outro. Elas não precisam, contudo, ser
exatamente iguais. Na representação da figura abaixo chamamos alelos as duas rgiões
homólogas nos dois cromossomos, por analogia ao que fazemos com genes, embora os
STRs não sejam genes. Observe que as regiões repetidas estão flanqueadas por regiões
conservadas que se estendem à esquerda (5´) e à direita (3´) das repetições. Para
qualquer ser humano estas regiões conservadas são as mesmas, mas cada um de nós
pode ter um número diferente de repetições em cada alelo. Quanto maior o conjunto de
diferentes repetições maior será a informação colhida pela realização da análise da
região.  Assim, se o número de repetições para o caso estudado (cada caso é chamado
sistema e em geral empregam-se 8 a 16 sistemas, cada um lançando mão de um STR de
um cromossoma diferente) varia, digamos, de 3 a 15, haveria 12 possibilidades em cada
alelo. Apenas como exercício, se a probabilidade na natureza fosse a mesma para
qualquer uma das repetições (i.e., a frequência alélica fosse a mesma), a probabilidade
de um indivíduo qualquer ter o arranjo de 4 e 9 repetições mostrado abaixo seria 1/12 x
1/12 = 1/ 144.
Figura 17: Representação esquemática de um STR e sua amplificação por PCR, através de primers
dirigidos às regiões flanqueadoras conservadas. Os dois produtos gerados tem comprimentos diferentes
pois a parte interna da sequência difere de um alelo para o outro.

Quando o sistema acima é analisado em gel de agarose, duas bandas serão visíveis se o
indivíduo for heterozigoto para aquele STR. No caso de investigação de paternidade, o
filho de um casal deve herdar um cromossoma do pai e outro da mãe. Isto que dizer que,
para um sistema qualquer, o filho terá um STR (e uma banda) materno e outro paterno. A
figura abaixo retrata a situação onde um casal avalia a paternidade de dois meninos. O
primeiro (Fo.1) tem claramente uma banda de origem materna e a segunda banda está na
mesma altura da banda paterna. Portanto, o marido não pode ser excluído de ser o pai.
No segundo caso, contudo, a criança tem uma banda materna mas nenhuma que
corresponda a alguma banda paterna. Esta situação exclui o marido de ser pai do
segundo filho (Fo. 2).

Figura 18: Representação esquemática de um gel representando o resultado de um sistema de STR para
investigação de paternidade. A primeira coluna tem marcadores alélicos padrão, equivalentes aos
marcadores de peso molecular. As colunas 2, 3, 4 e 5 mostram o resultado da amplificação de um sistema
para o suposto pai, a mãe e dois filhos. A banda materna de cada filho está indicada e a banda paterna de
um deles está contornada com uma elipse. O teste exclui o suposto pai da paternidade do segundo filho.
A inclusão obrigatória da mãe em testes de paternidade evita que uma eventual troca de
recém-nascido na maternidade possa confundir os resultados. O mesmo processo
descrito acima pode ser empregado em qualquer animal que tenha reprodução sexuada.
É preciso apenas identificar os STRs candidatos e avaliar criteriosamente a distribuição
dos alelos na população em estudo. Para os seres humanos os alelos estão distribuídos
igualmente em todas as populações do globo, mas em  bovinos, por exemplo, devido ao
cruzamento controlado pelo produtor, os STRs estão distribuídos de forma muito diferente
de uma raça para outra. Ainda assim, a avaliação de pedigree em animais de raça é um
campo crescente de aplicação desta tecnologia.

Apenas como lembrete: os STRs não são os únicos alvos possíveis para investigação de
paternidade via DNA. Além disso, a investigação bioquímica e genética de paternidade já
era um método bem estabelecido muito antes da invenção do PCR. Sugerimos que o
leitor mais interessado procure informações na internet para complementar esta questão.

C. PCR na investigação de crimes

Outro campo fértil para o uso da PCR é a criminalística. A possibilidade de amplificar um


pequeno trecho de DNA milhões de vezes permite, em muitos casos, amplificar de uma
pequena amostra biológica (mancha de sangue, bulbo de cabelo, fragmentos de pele),
mesmo em um estado de conservação, suficiente DNA para uma análise de STRs como a
descrita acima. Um caso clássico é a investigação da procedência de uma mancha de
sangue no casaco da vítima (ou resto de pele sob as unhas da vítima). Supondo, para fins
deste exemplo, que o material não contivesse restos de células da própria vítima, o
procedimento para análise do caso estaria em conformidade com o mostrado na figura
abaixo.

Observe que, neste caso, cada suspeito aparece, para cada sistema com duas bandas
(aparecerá apenas uma se o indivíduo for "homozigoto" para aquele STR). Na amostra as
duas bandas do suspeito 2 estão claramente visíveis. O suspeito um tem apenas uma
banda, a outra portanto o exclui de ser a fonte da amostra. O teste exclui dois indivíduos,
mas não prova, como na paternidade, que o outro é o "dono" da amostra. A inclusão do
resultado de 5 a 8 sistemas eleva a probabilbidade de não exclusão (como no caso de
paternidade) para 99,99999999%. Isto quer dizer que não podemos excluir o suspeito
dois com uma margem de acerto de 99,99999999%.

 
Figura 19: Representação esquemática de um gel representando o resultado de um sistema de STR para
investigação criminal. Três suspeitos estão sendo investigados e uma amostra de sangue está disponível.  
A primeira coluna tem marcadores alélicos padrão, equivalentes aos marcadores de peso molecular. As
colunas 2, 3 e 4 mostram o resultado da amplificação de um sistema para os possíveis criminosos. A coluna
5 mostra o resultado do mesmo sistema para a amostra. O padrão de duas bandas é idêntico ao do
suspeito 2 e exclui os demais.

Os casos de estupro, em geral, trazem uma complicação adicional: o material colhido na


vítima (por exemplo, esperma do criminoso) está misturado com o DNA da vítima (e com
muito DNA contaminante não humano, da flora vaginal). Nestes casos o DNA dos
suspeitos é sempre misturado com o DNA das vítimas antes da amplificação dos STRs. O
resultado é feito por comparação do padrão de 4 bandas das misturas de DNA, uma a
uma, de suspeito + vítima, com o padrão obtido da amostra colhida da vítima no corpo de
delito. A figura abaixo ilustra este caso.
Figura 20: Representação esquemática de um gel representando o resultado de um sistema de STR para
investigação criminal. Três suspeitos estão sendo investigados num caso de estupor e uma amostra de
sangue está disponível.  A primeira coluna tem marcadores alélicos padrão, equivalentes aos marcadores
de peso molecular. As colunas 2, 3 e 4 mostram o resultado da amplificação de um sistema para os
possíveis criminosos, sempre em mistura com o DNA da vítima.. A coluna 5 mostra o resultado do mesmo
sistema para a amostra colhida no corpo de delito que, supostamente contendo DNA da vítima e do
criminoso. A última coluna da direita é a amplificação apenas do DNA da vítima. O padrão de quatro bandas
da amostra é idêntico ao do suspeito 3 e exclui os demais.

As aplicações forenses (na justiça) da PCR são ilimitadas, mas não há espaço aqui para
maior detalhamento.

D. PCR no diagnóstico de enfermidades genéticas e na identificação de portadores sãos


de alelos mutantes.

Doenças genéticas podem, algumas vezes, ser difíceis de diagnosticar. Adicionalmente,


no aconselhamento genético de casais é importante determinar inequivocamente se um
indivíduo é portador de um alelo mutante (portador são). A identificação de mutações em
genes pode ser feita também por PCR, em geral com a manipulação posterior do produto
de amplificação. A seguir exemplificamos duas destas aplicações. Numa delas o
nucleotídeo mutado faz parte de um sítio de restrição (se você lembrar que são mais de
600 as enzimas de restrição, cada uma com seu próprio sítio, não será muito difícil
encontrar uma que corte um sítio incluindo o nucleotídeo em estudo). Na outra um artifício
permite detectar qualquer nucleotídeo mutado, faça ele parte de um sítio de restrição ou
não.

A figura abaixo ilustra o caso em que o sítio de restrição para EcoRI, GAATTC, inclui um
nucleotídeo que está frequentemente mutado no caso da doença genética em estudo. No
alelo normal o sítio de restrição está preservado e no alelo mutante ele foi perdido, pela
troca de um par AT por um GC. Se o contrário tivesse acontecido, a técnica também
poderia ser aplicada da mesma forma, apenas com a mudança equivalente na
interpretação dos resultados. Quando o trecho de DNA em estudo é amplificado por dois
primers anelando nas regiões acima e abaixo da mutação (em princípio todo o restante do
gene é conservado), os produtos gênicos terão o mesmo tamanho, sejam provenientes do
alelo normal (wt - wild type)ou do mutante. Então, será preciso uma  intervenção nos
produtos para que uma distinção entre eles possa aparecer. Isto é feito pela ação da
enzima de restrição escolhida (no caso, a EcoRI). O produto de PCR produzido a partir do
alelo normal pode ser clivado pela enzima de restrição, dando origem a duas bandas. O
produto originado da amplificação do alelo mutante não tem mais o sítio para EcoRI e não
pode ser clivado, permanecendo do tamanho original. Assim, num indivíduo heterozigoto
(portador são de uma mutação recessiva) o sistema produzirá três bandas: a maior,
correspondente ao produto de PCR do alelo mutante, que não pôde ser clivado pela
EcoRI, e duas menores, fruto da clivagem do produto de PCR do alelo normal.

Figura 21:  Princípio da identificação de mutações pontuais através da eliminação/criação de sítios de


restrição e geração de fragmentos de digestão com polimorfismo de comprimento a partir de produtos de
PCR (PCR/RFLP). A figura representa o caso de um indivíduo heterozigoto para a marca estudada. A
mutação elimina um sítio EcoRI existente no alelo selvagem (wt). A amplificação dos dois alelos produz
fragmentos de mesmo comprimento. Entretanto, a digestão destes fragmentos com a enzima EcoRI gera
um polimorfismo de comprimentos, com o alelo mutante permanecendo não cortado, enquanto o alelo
selvagem é clivado em dois pedaços de tamanho distinto.
Na avaliação do resultado da PCR/RFLP discutida acima, o gel deve mostrar uma banda
única apenas para o indivíduo afetado (homozigoto mutante, com clínica da doença), já
que os produtos de PCR dos dois alelos não podem ser clivados pois perderam o sítio de
restrição para EcoRI. Já o homozigoto normal terá seus os produtos de PCR de dois
alelos clivados e no gel apenas duas bandas estarão visíveis. Apenas no caso já discutido
(portador são, heterozigoto wt/m) serão visíveis três bandas. A figura abaixo representa
de forma esquemática o resultado de uma análise PCR/RFLP.

Figura 22:  Resultado da investigação da presença de mutação no sítio EcoRI por PCR (PCR/RFLP). A
figura representa o caso de um indivíduo heterozigoto para a marca estudada (coluna b), um indivíduo
afetado e um normal homozigoto. A mutação elimina um sítio EcoRI existente no alelo selvagem (wt). A
amplificação dos dois alelos produz fragmentos de mesmo comprimento. Entretanto, a digestão destes
fragmentos com a enzima gera um polimorfismo de comprimentos, com o alelo mutante permanecendo não
cortado, enquanto o alelo selvagem é clivado em dois pedaços de tamanho distinto.

Em muitos casos de mutações pontuais a técnica de PCR/RFLP não pode ser aplicada,
seja porque não há sítio de restrição conhecido para o entorno da mutação, seja porque
múltiplas mutações são possíveis no gene de interesse, tornando a abordagem acima
impraticável. Uma alternativa é o mis-match PCR, ou PCR com pareamento errôneo. O
princípio desta técnica, descrito pela primeira vez por Cotton et al., em 1988, e também
conhecido com CMC - chemical mismatch cleavage - baseia-se na clivagem de DNA em
locais com pareamento errôneo pela piperidina, e está representada na figura abaixo. Um
indivíduo heterozigoto tem uma mutação pontual numa região qualquer do gene.
Podemos amplificar esta região com primers dirigidos a suas extremidades, como fizemos
na PCR/RFLP. Em seguida aquecemos o produto do PCR e deixamos esfriar
rapidamente para induzir a formação de heteroduplexes (uma fita simples de um alelo e a
complementar do outro) além dos homoduplexes (as dus fitas pareadas de volta, de um
mesmo alelo). Nas região não pareadas ou com pareamento errôneo com bases C e T
liga-se o produto hidroxilamina ou o tetróxido de ósmio, respectivamente. Uma vez
ligados, estes produtos permitem a clivagem do DNA neste local pela piperidina. Assim,
50% dos produtos de PCR serão cortados por este sistema em todo lugar onde houver
uma mutação. Em geral os fragmentos gerados pro este sistema são pequenos e devem
ser visualizados em gel de poliacrilamida. A figura abaixo mostra como funciona este
sistema.

Figura 23:  Resultado da investigação da presença de mutação em uma base desconhecida pela técnica
de PCR-mismatch. A figura representa o caso de um indivíduo heterozigoto para a marca estudada: o alelo
selvagem tem o par TA e o mutante o par GC. A amplificação por PCR do trecho onde a mutação está usa
primers que estão a alguma distância à direita e à esquerda da provável mutação. Quando o produto do
PCR é aquecido os dois tipos de fita (TA e GC) se separam, dando origem a 4 fitas simples. Quando a
mistura é rapidamente aquecida, as fitas simples se reassociam ao acaso de 4 formas distintas, pois a
diferença de uma única base não impede o pareamento das fitas quase complementares. Após o uso de um
sistema químico adequado, os pares de base errôneos são clivados e as fitas com mis-match geram dois
fragmentos no gel, ao contrário das fitas com pareamento perfeito. O heretozigoto aparece, no gel, com três
bandas (veja figura abaixo).

O resultado do experimento descrito acima está esquematicamente representado na


figura seguinte. O portador são, heterozigoto, tem uma mutação na posição descrita na
figura anterior. O primeiro afetado tem esta mutação nos dois alelos. Já o segundo
afetado tem um alelo com a mutação da figura anterior e outro alelo com uma mutação
mais a direita, como representado na barra vertical ao lado do gel.

Figura 24:  Resultado da investigação da presença de mutação pela técnica de mismatch PCR. A figura
representa o caso de um indivíduo heterozigoto para a marca estudada (coluna b), dois indivíduo afetados e
um normal homozigoto. A amplificação dos dois alelos produz fragmentos de mesmo comprimento.
Entretanto, a clivagem destes fragmentos pela piperidina gera um polimorfismo de comprimentos, com o
alelo mutante permanecendo não cortado, enquanto o alelo selvagem é clivado em dois pedaços de
tamanho distinto. No caso do primeiro afetado (homozigoto) não há mismatch interno porque os dois alelos
são idênticos. Nocaso do afetado heterozigoto cada alelo é diferente do outro em dois pontos distintos, o
que gera três fragmentos pela piperidina, mais o produto não clivado do homoduplex.

Não se deve esquecer, contudo, que a presença de um mismatch não significa


diretamente uma mutação, pois há na natureza diferenças individuais entre qualquer ser
vivo. Estad diferenças, que não significam doença mas diferenças simples entre
indivíduos são chamadas  SNPs. O teste final para o reconhecimento de presença de
uma mutação é, de fato, o sequenciamento direto do produto de PCR. Se houver
diferença entre os alelos, no lugar correspondente eletroferograma haverá duas bases
possíveis (p.ex. T ou A). (veja aula sobre sequenciamento, a seguir). A consulta num
banco de dados público de SNPs será essencial, também (ver aula de Introdução à
Bioinformática, mais adiante).

E. PCR em tempo real - o sistema Taqman


Recentemente foi desenvolvido um sistema pela empresa Applied Biosystems (fundida
com a Celera na atual Applera), para detectar o produto do PCR à medida em que esta
vai sendo sintetizado na reação. O engenhoso sistema é baseado no uso de uma sonda,
dirigida contra uma região interna da sequência que se deseja amplificar, e que tem dois
fluorocromos, um em cada extremidade da sonda (um DNA fita simples). Na extremidade
5´ há um fluorocromo que só fluoresce se estiver distante fisicamente do fluorocromo na
posição 3´. Este segundo fluorocromo funciona como capturador de energia (quencher) e
não deixa com que a energia luminosa usada para excitar a sonda chegue em quantidade
suficiente para excitar o primeiro fluorocromo. Estes dois fluorocromos estão
representados como R e Q (para quencher). Quando o primer hibridiza na região 5´, a
sonda também o faz no meio da sequência. À medida em que a Taq polimerase avança
sintetizando a  fita nova, ela vai degradando a sonda à sua frente, liberando o fluorocromo
R da sonda e permitindo que absorva energia e emita luz. A energia para a excitação dos
fluorocromos provem de um feixe de laser que atravessa a amostra e o equipamento que
faz isto chama-se PCR em tempo real (real time PCR) ou Taqman. A figura abaixo
esclarece este princípio.

Figura 25:  Princípio de funcionamento do Taqman, ou PCR em tempo real. Uma sonda fita simples com
dois florocromos é adicionada à reação de PCR. O fluorocromo Q atua com atenuador da fluorescência de
R, sendo protanto um quencher. Para isto é preciso que esteja próximo a R. A TAq polimerase separa os
dois fluorcromos à medida em que degrada a sonda quando sintetiza a fita nova. O fluorocromo R recém
liberado da sonda emite então  luz num comprimento de onda característico, diferente de Q. A excitação dos
fluorocromos é feita com laser que atravesse o tubo de reação.

A medição da radiação é feita pelo aparelho, que taça um gráfico com a absorção obtida
após cada ciclo de PCR. O ciclo em que o patamar (limite) de negatividade é ultrapassado
está diretamente relacionado à quantidade de DNA molde na mistura. Com isto, a
quantificação de DNA molde passou a ser não apenas possível, mais rápida. O sistema
ainda é bastante dispendioso mas tenderá a se tornar mais barato à medida em que
novos sistemas entrarem no mercado e um maior número de máquinas for disponível.

Figura 26:   Gráfico obtido com o Taqman. A seta indica o ciclo em que a reação ultrapassa o limite da
reação negativa. Quanto menor a quantidade de DNA molde no tubo de reação maior o número de ciclos
necessários para ultrapassar o limite da negatividade. A reação de PCR no Taqman emprega em geral
apenas duas temperaturas (94 oC para desnaturação e 60 oC, para hibridização e extensão) e o resultado da
PCR pode ser dado em menos de 30 minutos.

F.  Um pouco de história (em construção)

A reação em cadeia da polimerase foi desenvolvida a partir de uma idéia de Kary B.


Mullis.

K. Mullis nasceu em 1944 em Lenoir, Carolina do Norte, EUA. Obteve o grau de bacharel
em química em 1966 no Instituto de Tecnologia da geórgia e o PhD em Bioquímica pela
Universidade da Califórnia em Berkeley. Passou então 7 anos como pós-doutor em
Cardiologia Pediatria e Química Farmacêutica na Escola de Medicina da Universidade de
Kansas (EUA). Em seguida reebu um convite para trabalhar como técncio na Cetur
Corporation, em Emeryville, em 1978. Foi lá que teve a idéia da PCR.

Segundo ele, foi dirigindo seu carro de San Francisco para sua casa em La Jolla,
California, que ele começou a imaginar uma maneira simples de determinar uma
sequência de nucleotídeos a partir de um trecho de DNA. Ele então, como querem para si
outros cientistas, tece uma inspiração súbita: a solução não era apenas para seu
problema original, mas tinha um alcance muito maior. Ele imaginou uma forma de fazer a
DNA polimerase iniciar e terminar seu trabalho em pontos pré-determinados e,
consequentemente, pelo uso desta proipriedade, descobriu uma maneira de amplificar
exponencialmente uma sequencia de DNA num tubo de ensaio.

Mullis então levou a idéia para seus colegas da Cetus e juntos eles a colocaram para
trabalhar de verdade. Ela foi apresentada pela primeira vez ao público numa conferência
em 1985 e foi pronta e amplamente aceita pela comunidade científica. A popularidade da
técnica, assim como seu conceito, ganhou crescente popularidade ao longo dos anos
seguintes.

Em 1989 a revista Science escolheu a molécula usada na PCR, a Taq polimerase, como
a primeira  "Molécula do Ano".

Em 1991 a PCR se tornou extremamente comum em laboratórios pelo mundo afora e


referências ao uso da técnica já somavam milhares nas revistas científicas. Um ano
depois a Cetus, depois de uma reorganização corporativa, vendeu a patente da PCR para
a Hoffman - La Roche por US$ 300.000.000,00.

Devido ao alcance e popularidade da PCR Kary Mullis foi apontado e recebeu o prêmio
Nobel de Química em 1995. Esta indicação foi duramente contestada por muitos que
acreditavam que a PCR foi apenas um desenvolvimento de técnica e que sua concepção
não era suficiente para dar a Mullis o status de nobelista. Mullis argumentou a seu favor
que a união das técnicas pré-existentes no formato por ele criado fazia toda a diferença.

Para uma história um pouco mais detalhada sobre o desenvolvimento da PCR veja o site
http://usitweb.shef.ac.uk/~mba97cmh/history/history.htm

G. Artigos importantes sobre PCR

Uma seleção dos mais importantes artigos sobre PCR, tanto durante o desenvolvimento
da técnica quanto para diversas aplicações, pode ser encontrada na página específica da
Universidade de Berkeley:
http://sunsite.berkeley.edu/pcr/foundationalPCR.html#anchor1239949
Vale a pena conferir!
 
 
 
IV. Sequenciamento de DNA

Até meados da década de 70 não era nada simples obter uma sequência de DNA, fosse
ele fita simples ou dupla. De fato, trabalhar com DNA era muito mais complicado do que
com proteínas e o conhecimento sobre os ácidos nucléicos avançava de forma lenta. No
início da década de 80 uma técnica relativamente rápida de sequenciamento de DNA foi
desenvolvida, que empregava a quebra de uma cadeia de DNA com diferentes produtos
químicos e a visualização dos fragmentos gerados por eletroforese. Havia necessidade de
fazer-se a marcação radiativa das moléculas porque a quantidade de material produzida
era muito pequena e não podia ser detectada de outra forma. Mesmo com todas estas
dificuldades houve então um rápido progresso no conhecimento de sequências de DNA.
Poucos anos depois um novo avanço tecnológico foi alcançado pela introdução da técnica
de interrupção da sequência pela incorporação aleatória de um nucleotídeo modificado
(sem a hidroxila na posição 3´), que ficou conhecida como técnica de didesoxi ou dideoxi.
Esta técnica suplantou imediatamente a anterior e permitiu o desenvolvimento de
sequenciadores automáticos de DNA, sobre os quais versa este capítulo. Ainda se faz
eventualmente o sequenciamento manual, mas é muito mais trabalhoso, caro e arriscado,
pois emprega substâncias radiativas. De uma forma geral quando desejamos saber uma
sequência de bases de um fragmento qualquer de DNA, purificamos o fragmento e
enviamos para sequenciamento numa empresa prestadora deste serviço.

Mas, afinal, como produzir um DNA para sequenciamento e do que se trata a técnica de
dideoxi?

A primeira parte da pergunta é crucial: de fato, se queremos sequenciar um trecho de


DNA, temos que ter uma grande quantidade dele no nosso tubo de ensaio. Duas formas
corriqueiras de se obter grandes quantidades de uma determinada sequência de DNA são
a clonagem em plasmídeo e a PCR. Se o DNA que queremos sequenciar for o inserto de
um plasmídeo, tudo o que precisamos é crescer 200 microlitros da bactéria com o
plasmídeo e, empregando as técnicas já usuais de extração de DNA, obter o plasmídeo
purificado, que será empregado na reação de sequenciamento.  Se ainda não tivermos o
material clonado, podemos empregar a PCR e amplificar o trecho a ser sequenciado,
purificando a banda do gel e usando o material assim obtido para iniciar a reação do
sequenciamento. Neste caso, precisamos saber apenas as sequências das extremidades
do trecho a ser sequenciado. 

A segunda parte da pergunta exige uma explicação mais detalhada.

Inicialmente, temos que recordar o que seja um didesoxinucleotídeo trifosfasto, ou


ddNTP.  O precursor normal da síntese de DNA é o dNTP, ou desoxiribonucleotídeo
trifosfato, que apresenta uma hidroxila na posição 3´. É a partir desta hidroxila que a fita
nascente é estendida. Um ddNTP, entretanto, não tem esta hidroxila. Logo, se for
incorporado a uma fita de DNA, interrompe a incorporação de outros nucleotídeos a partir
dele. Se o ddNTP for marcado associado à radiação ou fluorescência, a fita interrompida
ficará radiativa ou fluorescente e poderá ser detectada mais facilmente. Para fins desta
aula vamos admitir que cada didesoxibase está marcada com uma florescência diferente.
Portanto, as fitas terminadas em A, T, G ou C vão emitir cores diferentes quando
excitadas com luz de um determinado comprimento (em geral, de um feixe laser).

Em seguida temos que entender como a reação de sequenciamento pode começar


sempre exatamente da mesma base, a partir do DNA molde que adicionamos à reação.
Para tal, basta recordarmos que uma nova fita simples só é sintetizada se tivermos um
DNA molde, uma DNA polimerase, dNTPs (e neste caso, um pouco de ddNTPs
fluorescentes) e, finalmente, um primer! É neste primer que reside o segredo do início
exato da reação de extensão: o primer sempre pareia exatamente na posição esperada,
jamais uma base antes ou uma depois, por exemplo. Por isso, todas as fitas estendidas a
partir deste primer iniciam rigorosamente na mesma base, a partir do primer e copiando a
fita molde.

Por fim, basta recordarmos que as fitas assim produzidas devem ser muito numerosas
para poderem ser detectadas. Por isso, temos que começar a reação de sequenciamento
com muito mais DNA do que uma reação de PCR. As fitas produzidas podem ser
separadas pelo tamanho em eletroforese de poliacrilamida, e a base final da sequência da
fita identificada pela fluorescência emitida quando a banda eletroforética correspondente à
fita cruza o ponto do gel que é iluminado por um feixe de laser. Neste sistema de
detecção a eletroforese não pára, as bandas passando no fim (em baixo) do gel é que são
detectadas em movimento. Com isto, podemos identificar com precisão 600 a 700 bases
a partir do primer.

Na figura abaixo exemplificamos como surgem as fitas simples estendidas a partir de um


primer (seta preta pequena) que pareia com uma sequência específica (em vermelho) do
plasmídeo (trechos em amarelo), no qual foi clonado um inserto (azul) entre os sítios de
restrição EcoRI e XhoI. Observe que o inserto pode ter um comprimento muito variável,
tipicamente entre 500 e 3000 pb. No exemplo estamos admitindo que, numa determinada
posição na sequência do inserto, uma parte dele tem uma base A e outra uma base G. É
o que ocorre se clonarmos um trecho de DNA de um alelo para o qual o doador é
heterozigoto.  Observe também que, do lado direito do inserto, há uma sequência (em
verde) na qual pode parear um outro primer, que será empregado no sequenciamento
quando quisermos vir da direita para a esquerda sobre o inserto. Jamais, contudo, os dois
primers são empregados simultaneamente, e por isto a reação de sequenciamento NÃO
É UMA PCR!!! Por isso, não temos tanta preocupação com contaminação como nas
reação de PCR: podemos fazer múltiplas reações de sequenciamento, lado a lado, numa
placa de 96 micropoços e mesmo reutilizar boa parte do material plástico empregado no
preparo do DNA ou na reação de sequenciamento, em si, bastando para isto lavar bem o
material.

Ainda na figura, podemos ver que fragmentos de diferentes tamanhos são gerados,
porém nunca (exceto no caso onde houver moldes de DNA com polimorfismo de base,
como no caso A/G mostrado) dois fragmentos de igual tamanho terminarão em bases
diferentes. Na parte de baixo da figura todos os fragmentos representados na parte de
cima estão organizados por ordem de tamanho. Observe que:

a) podem existir muitos fragmentos (fitas simples estendidas a partir do primer) do mesmo
tamanho, mas fatalmente terminarão na mesma base (exceto no caso do polimorfismo do
DNA molde);

b) podem existir fitas terminado na mesma base (afinal, só temos 4 opções, A,T,G ou C!),
com comprimentos diferentes. Não há qualquer restrição para isto.

c) há espaços mostrados na sequência, onde não havia nenhum fragmento gerado do


tamanho esperado. Isto só acontece quando a reação gera poucos fragmentos, mas uma
reação deste tipo gera centenas de milhares de fragmentos de cada tamanho e é muito
pouco provável que existam sequências não representadas de um comprimento qualquer.

d) apenas onde há polimorfismo de base do DNA molde há fragmentos do mesmo


tamanho terminando em bases diferentes (é o caso A/G).

Examine, por favor, atentamente a figura abaixo antes de continuar a leitura desta aula.
Figura 27: Fragmentos de diferentes comprimentos gerados a partir do primer, interrompidos quando um
didesoxinucleotídeo é incorporado na fita. Os didesoxinucleotídeos são marcados com substâncias
fluorescentes diferentes, conforme a base (A,T,G ou C).

Quando os fragmentos gerados numa reação de sequenciamento são separados por


eletroforese, os fragmentos menores vão à frente, seguidos dos demais, sendo a
distância entre as bandas aproximadamente igual, pois representa sempre a diferença de
uma base a mais ou a menos. A figura 8.2 mostra esquematicamente como esta
separação acontece e como a fluorescência nas bandas é identificada, à medida em que
elas atravessam um trecho do gel que é iluminado por um feixe laser (representado pela
barra verde na parte de baixo do gel).  Observe que a distância entre as bandas é regular.
Um gel pode permitir o sequenciamento de 600-700 bases para cada reação, e podemos
correr até 96 reações por gel. Há no mercado também sequenciadores de DNA de última
geração nos quais o gel foi substituído por um feixe de capilares, que são
automaticamente preenchidos por um polímero, ao invés de gel. Cada reação de
sequenciamento é separada no seu capilar e a fluorescência detectada individualmente. o
que evita uma eventual confusão entre sequências causada pelos desalinhamentos das
corridas eletroforéticas, comum nos géis. Há máquinas com feixes de 1 a 384 capilares.
As maiores são capazes de produzir mais de 2 mil sequências em 24 horas.

Examine, por favor, atentamente a figura 8.2 abaixo antes de continuar a leitura desta
aula.

Figura 28: Os fragmentos de diferentes comprimentos migram no gel, os menores na frente. São
iluminados por um feixe de laser e fluorescem quando atravessam a janela do feixe. Um gel pode resolver
96 sequências simultaneamente. Os géis têm sido substituídos por capilares preenchidos de polímero nas
máquinas mais modernas. As bandas pretas indicam ausência de material e são apenas um recurso gráfico
usado aqui para indicar o espaço aumentado entre bandas que aconteceria neste caso. Entretanto, isto não
ocorre na reação de sequenciamento finalizada, porque o número de fragmentos gerados é muito grande e
a probabilidade de uma classe de tamanho não ser representada na reação é praticamente nula.

A fluorescência emitida pela passagem de uma banda pela janela de medição é


registrada por um sistema de microcâmaras sensoras, que por sua vez transforma o sinal
num gráfico, conhecido como eletroferograma. Os picos representam as bandas, e quanto
mais altos e agudos mais qualidade têm, isto é, maior será a probabilidade de que a base
registrada seja correta. O valor de qualidade é medido por um programa chamado Phred,
que leva em conta vários parâmetros (espaçamento entre bandas, largura e altura do
pico, intensidade absoluta do sinal, ruído de fundo, etc). Geralmente emprega-se como
padrão aceitável de qualidade o valor Phred 20, que corresponde a aprox. 99% de certeza
da base indicada. A figura 8.3 abaixo mostra um eletroferograma obtido no
sequenciamento de um inserto de cDNA do parasita Leishmania chagasi. Observe que,
neste trecho, a qualidade do sequenciamento é muito alta, com espaçamento regular dos
picos (que indica espaçamento regular das bandas) e picos agudos. Não há nenhum
polimorfismo de bases, nem poderia haver, pois esta sequência foi obtida a partir de um
clone de cDNA.

Figura 29: Eletroferograma parcial de uma sequência de DNA obtida no sequenciador automático
ABI3100 Prism, da Applied Biosystems, na Unidade de Genômica do Laboratório de Genética Molecular do
Departamento de Genética da UFPE. Observe que os picos são agudos e regularmente separados, o que
indica alta qualidade do sequenciamento neste trecho

Esperamos que este texto tenha esclarecido a maior parte das questões básicas
pertinentes ao sequenciamento de DNA. Entretanto, julgamos que uma visita à nossa
sub-página de animações é essencial, pois a animação sobre sequenciamento é muito
ilustrativa do que foi dito aqui.

Em edições futuras desta aula outras questões serão abordadas e discutidas:


a) a qualidade da sequência e o aspecto do eletroferograma
b) a identificação de polimorfismos
c) a contaminação de primers e de clones
d) as limitações do sequenciamento automático de DNA

You might also like