Professional Documents
Culture Documents
Sumário
I. A linguagem da tecnologia do DNA recombinante
II. Clonagem gênica
1.Primeiros passos
2. Restrição e Modificação: a ferramenta escondida na bactéria
3. Ainda um pouco sobre as enzimas de restrição
4. Vetores (falta)
5. Construção de Bibliotecas
6. Biblioteca genômica: todo o genoma em pedaços...
7. Clonagem e expressão: o problema dos introns
8. Como fazer um DNA eucarioto sem introns?
9. Biblioteca de cDNA e características de um vetor de expressão para Escherichia
coli.
10. Seleção (triagem ou screening) de clones pela expressão da proteína recombinante.
11. Que genes estão representados numa biblioteca de cDNA?
12. Proteínas recombinantes: as quimeras são desejáveis?
III. PCR: uma técnica de múltiplas aplicações
IV. Sequenciamento de DNA
*******************************************************************
I. A linguagem da tecnologia do DNA recombinante
Glossário da Genética Molecular (tenderá a se ampliar até o final das aulas sobre este
tema)
Criar seres novos têm sido, por bilhões de anos, o privilégio da Natureza,
através do processo contínuo de mutação e seleção natural e por outros mecanismos
de alteração do DNA que agora começam a ser compreendidos. Mas a humanidade
sempre "criou" seus próprios seres, geralmente extraordinários. Os gregos eram
particularmente imaginativos, e a mitologia clássica é cheia de monstros como a
Quimera, o cão Cérbero, o Minotauro, a Medusa e um sem-número de outros híbridos.
Como se verá mais adiante, a palavra quimera foi tomada de empréstimo na mitologia
para designar as construções artificiais de moléculas (em geral DNA). Inicialmente a
imaginação do homem atribuía a algum deus a geração dos seres monstruosos ou, ao
contrário, extraordinariamente belos. A idéia de que estes seres podiam ser
fabricados por um ser humano só veio muito depois, mas em várias partes do mundo os
homens criaram "protocolos" para a geração de vida a partir de material "morto",
desde simples insetos até o próprio ser humano. A partir do meio do século XVIII a
ciência começou a mostrar a verdadeira face da criação e a esclarecer a origem das
ossadas que eram em parte o combustível para a imaginação dos homens naquele
tempo: a vida só podia ser criada a partir da vida e os ossos imensos ou estranhos
achados em toda a parte eram de seres extintos, mas que tinham sido produto da
Natureza, como todos os demais.
Uma abordagem mais simples à produção de novas formas de vida (ao menos
em teoria) é a clonagem de genes de um organismo e a transfecção destes para outro
organismo. A vantagem desta abordagem é que se pode selecionar da espécie doadora
apenas as marcas que interessam, evitando a introdução de genes indesejados.
Adicionalmente, ela permite (também em teoria...) total controle sobre a construção
final, contornando as recombinações que a Natureza produz durante a reprodução
sexuada (entre indivíduos da mesma espécie ou não).
Clonar genes parece simples a princípio, mas as ferramentas para cortar DNA
e "emendar" os fragmentos com um vetor (DNA que se replica e que desta forma
conserva o pedaço "emendado" nele, chamado inserto) não eram conhecidas até o meio
da década de 70.
1.Primeiros passos
Como não havia uma forma simples e precisa de cortar DNA numa sequência ou
posição específicas, produzindo segmentos de extremidades conhecidas, era
impossível unir de forma eficiente um segmento de DNA de doador com as
extremidades de um vetor (viral ou plasmidial, como veremos mais adiante). A falta
desta tesoura molecular restringiu durante anos o avanço da nascente "engenharia
genética", nome que a mídia deu ao que se chama nos meios acadêmicos de tecnologia
do DNA recombinante. Além disso, o fato de todos os primeiros vetores de clonagem
terem sido vírus que infectam o homem fez da engenharia genética uma tecnologia de
alto risco. As legislações foram, compreensivelmente, duríssimas no princípio, com uma
opinião pública inteiramente desfavorável, como ocorre hoje com a questão da
clonagem de mamíferos. O cuidado era, contudo, muito importante. Apesar de todo
cuidado, e um pouco antes das tentativas de se fazer engenharia genética de forma
sistemática e abrangente, o SV40 acabou sendo o protagonista de uma infecção
acidental de milhões de pessoas, através da vacina de poliomielite, nas décadas de 50
e 60. A infecção pelo SV40 não provocou, até onde se pode saber, qualquer problema
de saúde nos indivíduos infectados, apesar de potencialmente ser possível a ação
direta do vírus no organismo ou através de sua recombinação in vivo com o S2, um
vírus humano.
Figura 1: A restrição controlada pela hospedeira: Fagos que se desenvolvem bem numa certa linhagem
de bactéria, frequentemente produzem uma progênie pequena quando infectam pela primeira vez uma
outra linhagem da mesma bactéria, mas os poucos fagos sobreviventes prosperam.
Como poderia ser este "aprendizado"? Afinal, quando um fago entra na
bactéria, apenas o seu DNA subsiste e se replica, ficando o capsídeo do lado externo
da hospedeira. Então, todo o processo de adaptação teria que estar ligado ao DNA.
Vejamos a hipótese de Arber (mostrada de forma esquemática na figura a seguir):
Aqui cabe uma pergunta: como a bactéria "decide" se uma sequência deve ser modificada ou restrita?
As enzimas de restrição (E.R.) estão dispersas no citosol bacteriano, mas as de modificação em geral
têm uma proximidade com o aparato de replicação do DNA. Por isso, um DNA invasor é mais
provavelmente restrito antes de ser modificado. Ao contrário, o DNA bacteriano recém sintetizado
(uma fita nova, já que a outra, velha, já está modificada) será provavelmente modificado na fita nova
antes de ser restrito. Além disso, uma hemi-metilação também confere um razoável grau de proteção
contra o ataque de enzimas de restrição, o que faz com que o DNA bacteriano seja essencialmente
imune à ação da enzima de restrição da própria bactéria. De forma equivalente, o DNA viral, que não
tem nenhuma metilação, é muito mais sensível ao corte pela E.R..
Como vimos acima, cada bactéria possui em geral uma enzima que reconhece uma
sequência de DNA curta, com 4 a 12 pares de bases. Nas diferentes bactérias estes
sítios têm em sua maioria uma característica comum: a de terem a mesma sequência
de bases quando lidas nas duas fitas complementares. As sequências abaixo,
reconhecidas pela enzimas de restrição EcoR1 (obtida da Escherichia coli) e HindIII
(obtida de Hemophilus influenzae) exemplificam o que chamamos de sítio de restrição.
Observe a sequência e veja sua simetria. Sequências de DNA fita dupla com estas
características são chamadas palíndromos.
Figura 3: As setas indicam a ponte fosfodiester clivada pelas enzimas EcoRI e HindIII. A linha indica
o eixo de simetria do palíndromo
Quando uma enzima de restrição digere o DNA, ela produz um corte em cada
fita, podendo resultar em extremidades colantes ou adesivas, como as geradas pelas
enzimas acima, ou extremidades cegas, isto é, sem bases despareadas. Cada vez que
elas encontram um sítio de restrição que lhes é próprio, clivam o sítio.
Figura 4: Ação da enzima de restrição EcoR1, com geração de extremidades colantes(ou adesivas) e
união de fragmentos de DNA de origens distintas
Para finalizar: qual a vantagem para um fago ter um sítio de restrição alvo de
uma determinada enzima? Nenhuma, evidentemente, mas como os sítios ocorrem ao
acaso, é provável que um fago possa ser restrito por várias de suas potenciais
hospedeiras. Por outro lado, qual a vantagem para uma bactéria em ter uma enzima de
restrição que reconhece sítios com 10 pb? Não será muito raro encontrar um sítio
destes num fago? Provavelmente estas bactérias tem uma gama bastante restrita de
fagos que lhes são infectivos e por isso não precisam estar prontas para clivar sítios
frequentes, mas apenas aqueles que existem nos seus fagos invasores. Como a
Natureza estabelece este balanço é uma questão de estudos ainda.
4. Vetores (falta)
5. Construção de Bibliotecas
Uma vez com os dois DNAs disponíveis (doador e plasmidial), resta cortá-los
com a enzima de restrição escolhida e misturar os dois DNAs. A tendência será
parear as extremidades coesivas, formando construções híbridas, ou quimeras. A
adição de ligase completa a cadeia fosfodiéster em cada uma das fitas de DNA. Este
passo está representado na parte superior da figura abaixo.
Figura 5: Esquema para a obtenção de plasmídeos recombinantes, a partir do uso de uma enzima de
restrição que cria extremidades coesivas. Para maiores detalhes veja o texto abaixo.
E como se ver livre do "lixo" representado pelas bactérias que têm o plasmídeo
vazio? Não é possível, pois o plasmídeo vazio confere a mesma resistência ao
antibiótico que o plasmídeo carregado. Entretanto, é possível averiguar ao menos se,
no conjunto de plasmídeos formados, a maior parte está carregada (com inserto) ou,
ao contrário, vazia. Para tal os plasmídeos de clonagem têm uma segunda marca de
resistência a antibióticos (em geral, tetraclina), que é perdida quando o plasmídeo é
aberto e o inserto é clonado. Significa dizer que o sítio de clonagem é interno ao gene
para a resistência à tetraciclina. Significa também dizer que as bactérias que têm
plasmídeos vazios são resistentes a ampicilina e tetraciclina, enquanto as que têm
plasmídeos com inserto só mostram resistência a ampicilina. O procedimento baseia-se
na obtenção de uma réplica de uma placa de Petri contendo colônias crescidas em
presença de ampicilina, que é então carimbada sobre uma nova placa de Petri contendo
tetraciclina. As colônias que crescerem também em tetracilcina não interessam, mas
podem ser contadas. A figura abaixo mostra esquematicamente o procedimento,
desenvolvido para outros fins, há quase 50 anos, por Joshua Lederberg, que também
recebeu o Prêmio Nobel pelos seus estudos (Joshua Lederberg, George Beadle e
Edward Tatum receberam o prêmio Nobel de Fisiologia ou Medicina em 1958.
Lederberg provou a existência da recombinação genética em bactérias e contribuiu de
forma importante para o conhecimento da organização gênica de microrganismos.
Beadle e Tatum mostraram que os genes agem regulando eventos químicos definidos.
As Palestras Nobel dos três pesquisadores estão disponíveis no site de downloads).
Você pode ver uma animação da clonagem em plasmídeos neste site (é um arquivo
muito grande e exige que você tenha o QuickTime movie player instalado):
http://www.ncbi.nlm.nih.gov/books/data/mcb/pictures/ch7/ch7anim2.mov
Figura 6. O processo conhecido como réplica, na qual um carimbo de veludo estéril, facilmente
improvisado sobre um cilindro de madeira, serve para transferir um pouco de bactérias de cada colônia
de uma placa para outra. Após 24 horas o crescimento na nova placa é avaliado. Neste caso a primeira
placa contém meio de cultura adicionado de ampicilina, enquanto na segunda o meio contém tetraciclina.
Da figura pode-se concluir que a maior parte das bactérias da amostra é sensível à tetraciclina e
alberga, portanto, plasmídeos recombinantes (quiméricos, ou com inserto).
Neste e nos próximos sub-itens vamos discutir as razões pelas quais um gene
eucarioto em geral não pode ser expresso num procarioto se clonado diretamente num
plasmídeo ou fago. Vamos discutir que estratégia pode ser adotada para contornar
esta limitação. Vamos também discutir como deve ser o desenho de um plasmídeo (ou
outro vetor) de expressão para permitir a produção de proteína a partir do gene
clonado. E veremos como deve ser a hospedeira para que o produto final seja de
interesse para o pesquisador. Por fim, vamos discutir como são as proteínas
recombinantes, ou quimeras, e como podemos nos beneficiar destas construções
protéicas artificiais.
É fácil, após a análise da figura acima, entender que um procarioto não será
capaz de produzir uma proteína igual àquela produzida pelo eucarioto, se iniciar o
processo com genes contendo introns. Na verdade, mesmo um outro eucarioto poderá
não fazê-lo se o sistema de splicing não compreender os sinais de splicing (sequências
de bases) contidos no início e no fim dos introns. Por isso, a estratégia para se clonar
e expressar genes eucariotos tem que ser distinta da apresentada na aula 5.
Uma vez pareado, o primer vai permitir a síntese da primeira fita de DNA, que
será estendida com a ajuda da transcriptase reversa e com dNTPs
(desoxirribonucleotídeos tri-fosfato), como na síntese de DNA normal (etapa (2)).
Para proteger a fita de DNA contra a ação de enzimas de restrição (que serão
empregadas mais adiante), o sistema de reação tem, no lugar de desoxicitosina-
trifosfato, um precursor metilado, a 5´-metil-citosina-trifosfato, que vai impedir a
ação das duas enzimas de restrição sobre o DNA recém sintetizado, numa etapa
posterior que já iremos comentar. A transcriptase reversa tende a parar seu processo
de síntese de DNA complementar antes de chegar ao início do mRNA (estamos
produzindo o cDNA de "trás para frente"). Esta parada é ocasionada, em parte, por
uma atividade RNásica residual da enzima, que pode degradar o RNA que ela mesma
está prestes a copiar como DNA. Nos kits modernos a transcriptase reversa
recombinante empregada tem uma atividade RNásica muito pequena, mas ainda assim
se observa uma parada da produção do cDNA antes da extremidade do mRNA, por
razões ainda não completamente compreendidas, e que acaba gerando um cDNA mais
curto que o mRNA original. Mais adiante discutiremos a importância da perda de
informação genética nesta região 5´ do cDNA.
Para a síntese da segunda fita de DNA a maior parte dos kits comerciais usa
um artifício, denominado nick translation (tradução por cortes), que é uma
denominação muito mal encontrada pelos seus inventores para o processo de
replicação de DNA descrito a seguir. Inicialmente, com o uso da atividade
endonucleásica de uma enzima adequada, inserimos pequenos cortes na cadeia de
fosfatos do RNA (os chamados nicks). Estes cortes criam automaticamente
extremidades 3´-OH, que servirão de apoio para que a DNA polimerase (em geral o
chamado fragmento Klenow da DNApol I bacteriana, que polimerisa mas não faz
revisão da síntese). Estes nicks estão mostrados na etapa (3). A partir deles a
DNApol I (ou o fragmento Klenow) sintetiza pequenos trechos de DNA, apoiando-se
nas extremidades 3´-OH criadas pelos nicks. Ao término desta etapa a DNA pol
produz uma série de fragmentos e reconstitui, em fita dupla, o sítio Xho I na
extremidade 3´ do DNA (detalhe (5)).
Figura 8: Síntese de cDNA para clonagem uni-direcional em vetor de expressão. Cada etapa está
discutida no texto. Os círculos vermelhos representam as bases metiladas. A seta na etapa 4 aponta
para um nick ou corte.
Em seguida os fragmentos são ligados entre si pela ação da ligase (etapa (6)) e
eventuais saliências (overhangs) da fita são retirados pela ação de uma exonuclease
adicionada ao tubo. Esta ação é chamada de trimming (segundo detalhe (6)). A próxima
etapa é a adição de adaptadores, que são pequenos fragmentos de DNA fita dupla
contendo um sítio de restrição para uma segunda enzima (no exemplo, o sítio GAATTC,
da enzima EcoRI). Estes adaptadores são colados durante algumas horas pela
incubação do DNA 'trimado" na presença de ligase. O resultado é o que está mostrado
na etapa (7). A adição de vários adaptadores em cada extremidade é minimizada por
um artifício bioquímico, que envolve a desfosforilação de uma das extremidades 5´
dos adaptadores.
Como as ORFs costumam ser muito mais longas do que as UTRs (veja
proporções no alto da figura 5.10), a maior pare dos cDNAs gerados cai no caso
descrito em 3, isto é, contém uma parte da ORF e a região 3´ não traduzida (3´-
UTR).
Figura 11 Esquema representativo de um vetor de expressão que emprega parte do operon lac (muito
modificado) para garantir a expressão controlado dos insertos clonados no sítio múltiplo de restrição
(MRS). Veja o texto abaixo para detalhes. A cabeça do cavalo é a parte aminoterminal da proteína
(NH2) e cauda da tartaruga a extremidade carboxi-terminal (COOH).
Observe que o local onde a clonagem será feita é chamado MRS ou sítio
múltiplo de restrição, por conter vários sítios de restrição muito próximos e únicos em
todo o plasmídeo. A vantagem deste arranjo sobre aquele que emprega uma única
enzima é que o experimentador tem muito mais liberdade de escolher a enzima de
restrição que irá empregar para contar o DNA doador. Além disso, ele pode cortar o
vetor com duas enzimas e obter extremidades diferentes à esqueda (5´) e à direita
(3´), o que permitirá a clonagem unidirecional dos fragmentos gerados com a técnica
descrita na figura 5.8.
Como não podemos ter certeza de que o primeiro ATG da ORF original do gene
obtido do organismo doador está disponível (o que implicaria dizer que a transcriptase
reversa teria copiado toda a região 3´não-traduzida mais toda a ORF antes de parar),
convém contar com a presença de um ATG no plasmídeo, que é justamente o ATG do
gene lacZ. É indispensável também ter um RBS procarioto antes deste ATG, como
indicado pelas caixas azuis na figura, para fazer do RNA transcrito um verdadeiro
mRNA.
A partir do ATG após o RBS plasmidial, forma-se então uma ORF que termina
em geral no códon de terminação (stop) do gene doador. É necessariamente uma ORF
recombinante, que dará consequentemente origem a uma proteína recombinante, ou
quimérica. A proteína é sempre muito menor do que o mRNA sintetizado a partir do
promotor lac do plasmídeo. A "cabeça" beta-galactosidase da proteína recombinante
(ou quimérica) não é enzimaticamente ativa.
Mesmo uma proteína quimérica pode ter aplicação imediata. Apenas como
exemplo discutimos duas aplicações rotineiras: como antígeno diagnóstico e como
vacina.
Se, por qualquer razão, não podemos de forma alguma usar uma proteína
quimérica, podemos lançar mão de vetores que têm imediatamente antes do sítio de
restrição empregado na clonagem uma sequência de bases que codifica um pequeno
peptídeo reconhecido e cortado por uma enzima adequada. Na figura 11 é como se a
cabeça de cavalo estivesse ligada ao corpo da tartaruga por uma pequena haste de
peptídeo, que pode ser cortada por uma enzima. Podemos então capturar as proteínas
recombinantes da lise bacteriana por uma coluna de cromatografia de afinidade com
anticorpos dirigidos contra a parte plasmidial da proteína recombinante (a cabeça de
cavalo). Uma vez lavada a coluna para retirar o material não fixado, adiciona-se a ela
um pequeno volume de tampão contendo a enzima que corta a união entre a cabeça e o
corpo, e recolhe-se no efluente da coluna apenas a parte que interessa (proteína do
organismo doador) da proteína quimérica.
Esta aula é bastante longa. Por isso optamos por construir internamente links para
seus diversos temas, tabelados abaixo. Basta clicar sobre o tema de interesse.
Sinopse da aula
Primeiros passos - Introdução ao PCR
PCR na investigação de Paternidade
PCR na investigação de crimes
PCR no diagnóstico de enfermidades genéticas
PCR em tempo real - o sistema Taqman
Um pouco de história
Artigos importantes sobre PCR
A. Primeiros passos
A sigla significa "polymerase chain reaction", que em português seria reação em cadeia
da polimerase. Então, a base da técnica é a ação in vitro da DNA ´polimerase. Para
compreendermos como funciona a técnica, que é na verdade bem simples, precisamos
recordar que, para iniciar a síntese de uma fita nova, a DNA polimerase precisa de um
primer (de RNA ou de DNA), de um DNA molde e de precursores de síntese de DNA,
coletivamente chamados dNTPs (desoxinucleotídeos tri-fostato, i.e., dATP, dTTP,
dCTP e TGTP).
Na verdade, a coisa não foi tão fácil assim: a DNA pol era termoinstável (como a
maioria das proteínas dos seres vivos) e se inativava irreversivelmente a 94 oC. Era
preciso adicionar mais DNApol no tubo a cada ciclo de extensão. Além disso, a baixa
temperatura de funcionamento da DNApol de E. coli propiciava o aparecimento de
pareamentos espúrios (sem sentido, errôneos) no sistema, gerando ao final produtos
de PCR inesperados.
A solução foi encontrada logo: a DNA pol de E. coli foi substituída por uma DNA
polimerase de um microrganismo termo-tolerante, o Thermus aquaticus. A enzima foi
batizada de Taq polimerase e permitiu, finalmente, que o PCR se tornasse uma
ferramenta extraordinariamente útil na genética molecular. Que propriedades têm a
Taq polimerase que a fazem tão útil? Ela é termoestável e sua temperatura ótima de
funcionamento é 72 oC. Com isto três problemas ficaram automaticamente resolvidos:
Figura 12: Eventos relacionados às três temperaturas básicas da PCR: Desnaturação a 94 oC,
pareamento dos primers a 50 oC e extensão de novas fitas a 72 oC, supondo neste caso que a enzima
empregada seja a Taq polimerase ou outra DNA polimerase termo-estável.
O processo descrito acima gera dois tipos de fitas simples: uma de comprimento
variável, obtida a partir de um primer que tenha hibridizado com a fita de DNA
original (em geral um longo fragmento de DNA obtido diretamente de um ser vivo ou
de um vírus ou plasmídeo), e outra, de comprimento determinado, que é obtida sempre
que um DNA previamente copiado é empregado como molde em sua síntese.
Esta situação está claramente representada na figura abaixo, que mostra os três
primeiros ciclos de uma PCR. Observe que a fita estendida a partir de um primer
hibridizado com o DNA molde original não tem comprimento fixo, porque o molde é
muito longo. Seu comprimento final vai ser determinado pelo instante em que o primer
hibridizar com o sítio de complementariedade e pela tempo de extensão total, à
temperatura de 72 oC. As duas primeiras fitas estendidas estão indicadas com a letra
e à sua direita. Já as fitas que são produzidas a partir de primers que hibridizaram
em fitas previamente copiadas têm fatalmente ser comprimento definido, já que
inicia, no primer e terminam ao fim do DNA molde, que é exatamente a e extremidade
5´do primer já incorporado na fita molde. As fitas de comprimento definido
aumentam de número exponencialmente, formando aos poucos um imenso número d
fita duplas de comprimento definido, enquanto as fitas estendidas aumento
linearmente (duas a cada ciclo, por alvo). Uma inspeção da figura a seguir esclarecerá
o leitor sobre esta questão.
Figura 13: Produção de novas fitas a partir de um DNA alvo pela PCR. Após hibridização dos primers
a 56 oC, as fitas novas são sintetizadas a 72 oC, dando origem a fragmentos estendidos (indicados no
primeiro ciclo pela letra e) e fragmentos amplificados (contornados em amarelo). Os fragmentos
amplificados acumulam exponencialmente na reação.
A visualização dos produtos de uma reação de PCR costuma ser feita através do uso
da eletroforese em gel. Pode-se usar um gel de poliacrilamida, que corre
verticalmente, e corar as bandas de DNA com nitrato de prata ou se pode optar por
correr um gel horizontal de agarose e visualizar as bandas por transiluminação UV,
"corando" previamente o DNA com brometo de etídio (esta substância se intercala
entre as fitas de DNA e nestas condições absorve o UV e fluoresce com cor
alaranjada). O produto de PCR será sempre um DNA fita dupla e o que distingue um
do outro, no gel, será apenas o comprimento relativo. Esta situação está representada
no esquema da figura seguinte.
Figura 14: Visualização de três reações de PCR. Em a e b dois produtos são gerados, a partir de dois
pares de primers diferentes. Os dois produtos têm comprimentos de 400 e 360 pb. A migração das
bandas na eletroforese é de cima para baixo. O fragmento menor migra mais rápido e produz a banda
em vermelho. O maior se desloca mais lentamente no gel e produz a banda em verde. A coluna c é um
controle negativo, essencial em qualquer reação de PCR. A coluna d mostra os marcadores de peso
molecular (neste caso, uma escada de DNA - DNA ladder - de 100 pb). Na transiluminação ou na
coloração por prata, evidentemente, todas as bandas têm a mesma cor.
Quando fazemos um PCR, a prática aconselha a deixar o tubo com os reagentes por 5 a
10 minutos a 94 oC antes de iniciar o ciclo. Em geral 1 minuto a cda temperatura é
suficiente para as etapas do ciclo, que é repetido de 35 a 40 vezes. Por fim, ao
terminar a última extensão muitas vezes os protocolos experimentais sugerem a
manutenção da temperatura de 72 oC por mais 5 a 10 minutos. A opção de esperar 10
minutos antes de começar o ciclo, mantendo o tubo aquecido, garante que todo o DNA
alvo esteja desnaturado antes de se iniciar o ciclo. Por outro lado, o período final a 72
o
C garante que todas as fitas terão o mesmo comprimento pois pode acontecer que,
durante o ciclo, algumas fitas copiadas não tenham atingido o fim do molde. A figura a
seguir sintetiza o ciclo da PCR.
Figura 15: Ciclo padrão de uma PCR. Antes de iniciar o ciclo o tubo com os reagentes é mantido a 94
C para garantir a desnaturação inicial de todo DNA alvo. Da mesma forma, ao terminar o ciclo, a
o
manutenção do tubo a 72 oC garante que todos as fitas tenham exatamente o mesmo número de bases.
Figura 16: Imagem obtida de um gel de agarose mostrando bandas correspondentes a produtos de
PCR com diferentes comprimentos (número total de pares de bases) (colunas 2 a 5). Na coluna 1 estão
os marcadores de peso molecular, fragmentos de DNA fita dupla de comprimento conhecido, obtidos
por digestão por enzima de restrição de um DNA conhecido ou sintetizados por máquinas. A coluna 6 é
um controle negativo e a pequena banda difusa no fim do gel é apenas a fronteira da eletroforese.
Nos dias de hoje uma PCR é feita numa máquina chamada termociclador. É
simplesmente um bloco aquecido, controlado por um sistema digital, que eleva e abaixa
a temperatura do material nele inserido (tubos de ensaio pequenos, micro-placas de
96 poços, etc), de acordo com a programação digitada pelo operador. Mais de duas
décadas foram necessárias para que estas máquinas pudessem atingir um grau de
precisão e confiabilidade aceitáveis, aliado a um preço razoável. Também os reagentes
para PCR reduziram de preço consideravelmente na última década, tornando o método
comercialmente atrativo. Uma reação de PCR pode, agora, ser feita por US$ 1,00.
Quando o sistema acima é analisado em gel de agarose, duas bandas serão visíveis se o
indivíduo for heterozigoto para aquele STR. No caso de investigação de paternidade, o
filho de um casal deve herdar um cromossoma do pai e outro da mãe. Isto que dizer
que, para um sistema qualquer, o filho terá um STR (e uma banda) materno e outro
paterno. A figura abaixo retrata a situação onde um casal avalia a paternidade de dois
meninos. O primeiro (Fo.1) tem claramente uma banda de origem materna e a segunda
banda está na mesma altura da banda paterna. Portanto, o marido não pode ser
excluído de ser o pai. No segundo caso, contudo, a criança tem uma banda materna
mas nenhuma que corresponda a alguma banda paterna. Esta situação exclui o marido
de ser pai do segundo filho (Fo. 2).
A inclusão obrigatória da mãe em testes de paternidade evita que uma eventual troca
de recém-nascido na maternidade possa confundir os resultados. O mesmo processo
descrito acima pode ser empregado em qualquer animal que tenha reprodução sexuada.
É preciso apenas identificar os STRs candidatos e avaliar criteriosamente a
distribuição dos alelos na população em estudo. Para os seres humanos os alelos estão
distribuídos igualmente em todas as populações do globo, mas em bovinos, por
exemplo, devido ao cruzamento controlado pelo produtor, os STRs estão distribuídos
de forma muito diferente de uma raça para outra. Ainda assim, a avaliação de
pedigree em animais de raça é um campo crescente de aplicação desta tecnologia.
Apenas como lembrete: os STRs não são os únicos alvos possíveis para investigação de
paternidade via DNA. Além disso, a investigação bioquímica e genética de paternidade
já era um método bem estabelecido muito antes da invenção do PCR. Sugerimos que o
leitor mais interessado procure informações na internet para complementar esta
questão.
Observe que, neste caso, cada suspeito aparece, para cada sistema com duas bandas
(aparecerá apenas uma se o indivíduo for "homozigoto" para aquele STR). Na amostra
as duas bandas do suspeito 2 estão claramente visíveis. O suspeito um tem apenas uma
banda, a outra portanto o exclui de ser a fonte da amostra. O teste exclui dois
indivíduos, mas não prova, como na paternidade, que o outro é o "dono" da amostra. A
inclusão do resultado de 5 a 8 sistemas eleva a probabilbidade de não exclusão (como
no caso de paternidade) para 99,99999999%. Isto quer dizer que não podemos excluir
o suspeito dois com uma margem de acerto de 99,99999999%.
Figura 19: Representação esquemática de um gel representando o resultado de um sistema de STR
para investigação criminal. Três suspeitos estão sendo investigados e uma amostra de sangue está
disponível. A primeira coluna tem marcadores alélicos padrão, equivalentes aos marcadores de peso
molecular. As colunas 2, 3 e 4 mostram o resultado da amplificação de um sistema para os possíveis
criminosos. A coluna 5 mostra o resultado do mesmo sistema para a amostra. O padrão de duas bandas
é idêntico ao do suspeito 2 e exclui os demais.
As aplicações forenses (na justiça) da PCR são ilimitadas, mas não há espaço aqui para
maior detalhamento.
A figura abaixo ilustra o caso em que o sítio de restrição para EcoRI, GAATTC, inclui
um nucleotídeo que está frequentemente mutado no caso da doença genética em
estudo. No alelo normal o sítio de restrição está preservado e no alelo mutante ele foi
perdido, pela troca de um par AT por um GC. Se o contrário tivesse acontecido, a
técnica também poderia ser aplicada da mesma forma, apenas com a mudança
equivalente na interpretação dos resultados. Quando o trecho de DNA em estudo é
amplificado por dois primers anelando nas regiões acima e abaixo da mutação (em
princípio todo o restante do gene é conservado), os produtos gênicos terão o mesmo
tamanho, sejam provenientes do alelo normal (wt - wild type)ou do mutante. Então,
será preciso uma intervenção nos produtos para que uma distinção entre eles possa
aparecer. Isto é feito pela ação da enzima de restrição escolhida (no caso, a EcoRI).
O produto de PCR produzido a partir do alelo normal pode ser clivado pela enzima de
restrição, dando origem a duas bandas. O produto originado da amplificação do alelo
mutante não tem mais o sítio para EcoRI e não pode ser clivado, permanecendo do
tamanho original. Assim, num indivíduo heterozigoto (portador são de uma mutação
recessiva) o sistema produzirá três bandas: a maior, correspondente ao produto de
PCR do alelo mutante, que não pôde ser clivado pela EcoRI, e duas menores, fruto da
clivagem do produto de PCR do alelo normal.
Figura 21: Princípio da identificação de mutações pontuais através da eliminação/criação de sítios
de restrição e geração de fragmentos de digestão com polimorfismo de comprimento a partir de
produtos de PCR (PCR/RFLP). A figura representa o caso de um indivíduo heterozigoto para a marca
estudada. A mutação elimina um sítio EcoRI existente no alelo selvagem (wt). A amplificação dos dois
alelos produz fragmentos de mesmo comprimento. Entretanto, a digestão destes fragmentos com a
enzima EcoRI gera um polimorfismo de comprimentos, com o alelo mutante permanecendo não cortado,
enquanto o alelo selvagem é clivado em dois pedaços de tamanho distinto.
Na avaliação do resultado da PCR/RFLP discutida acima, o gel deve mostrar uma banda
única apenas para o indivíduo afetado (homozigoto mutante, com clínica da doença), já
que os produtos de PCR dos dois alelos não podem ser clivados pois perderam o sítio
de restrição para EcoRI. Já o homozigoto normal terá seus os produtos de PCR de
dois alelos clivados e no gel apenas duas bandas estarão visíveis. Apenas no caso já
discutido (portador são, heterozigoto wt/m) serão visíveis três bandas. A figura
abaixo representa de forma esquemática o resultado de uma análise PCR/RFLP.
Figura 22: Resultado da investigação da presença de mutação no sítio EcoRI por PCR (PCR/RFLP). A
figura representa o caso de um indivíduo heterozigoto para a marca estudada (coluna b), um indivíduo
afetado e um normal homozigoto. A mutação elimina um sítio EcoRI existente no alelo selvagem (wt). A
amplificação dos dois alelos produz fragmentos de mesmo comprimento. Entretanto, a digestão destes
fragmentos com a enzima gera um polimorfismo de comprimentos, com o alelo mutante permanecendo
não cortado, enquanto o alelo selvagem é clivado em dois pedaços de tamanho distinto.
Em muitos casos de mutações pontuais a técnica de PCR/RFLP não pode ser aplicada,
seja porque não há sítio de restrição conhecido para o entorno da mutação, seja
porque múltiplas mutações são possíveis no gene de interesse, tornando a abordagem
acima impraticável. Uma alternativa é o mis-match PCR, ou PCR com pareamento
errôneo. O princípio desta técnica, descrito pela primeira vez por Cotton et al., em
1988, e também conhecido com CMC - chemical mismatch cleavage - baseia-se na
clivagem de DNA em locais com pareamento errôneo pela piperidina, e está
representada na figura abaixo. Um indivíduo heterozigoto tem uma mutação pontual
numa região qualquer do gene. Podemos amplificar esta região com primers dirigidos a
suas extremidades, como fizemos na PCR/RFLP. Em seguida aquecemos o produto do
PCR e deixamos esfriar rapidamente para induzir a formação de heteroduplexes (uma
fita simples de um alelo e a complementar do outro) além dos homoduplexes (as dus
fitas pareadas de volta, de um mesmo alelo). Nas região não pareadas ou com
pareamento errôneo com bases C e T liga-se o produto hidroxilamina ou o tetróxido de
ósmio, respectivamente. Uma vez ligados, estes produtos permitem a clivagem do DNA
neste local pela piperidina. Assim, 50% dos produtos de PCR serão cortados por este
sistema em todo lugar onde houver uma mutação. Em geral os fragmentos gerados pro
este sistema são pequenos e devem ser visualizados em gel de poliacrilamida. A figura
abaixo mostra como funciona este sistema.
Figura 23: Resultado da investigação da presença de mutação em uma base desconhecida pela
técnica de PCR-mismatch. A figura representa o caso de um indivíduo heterozigoto para a marca
estudada: o alelo selvagem tem o par TA e o mutante o par GC. A amplificação por PCR do trecho onde a
mutação está usa primers que estão a alguma distância à direita e à esquerda da provável mutação.
Quando o produto do PCR é aquecido os dois tipos de fita (TA e GC) se separam, dando origem a 4 fitas
simples. Quando a mistura é rapidamente aquecida, as fitas simples se reassociam ao acaso de 4 formas
distintas, pois a diferença de uma única base não impede o pareamento das fitas quase complementares.
Após o uso de um sistema químico adequado, os pares de base errôneos são clivados e as fitas com mis-
match geram dois fragmentos no gel, ao contrário das fitas com pareamento perfeito. O heretozigoto
aparece, no gel, com três bandas (veja figura abaixo).
O resultado do experimento descrito acima está esquematicamente representado na
figura seguinte. O portador são, heterozigoto, tem uma mutação na posição descrita
na figura anterior. O primeiro afetado tem esta mutação nos dois alelos. Já o segundo
afetado tem um alelo com a mutação da figura anterior e outro alelo com uma mutação
mais a direita, como representado na barra vertical ao lado do gel.
Figura 24: Resultado da investigação da presença de mutação pela técnica de mismatch PCR. A
figura representa o caso de um indivíduo heterozigoto para a marca estudada (coluna b), dois indivíduo
afetados e um normal homozigoto. A amplificação dos dois alelos produz fragmentos de mesmo
comprimento. Entretanto, a clivagem destes fragmentos pela piperidina gera um polimorfismo de
comprimentos, com o alelo mutante permanecendo não cortado, enquanto o alelo selvagem é clivado em
dois pedaços de tamanho distinto. No caso do primeiro afetado (homozigoto) não há mismatch interno
porque os dois alelos são idênticos. Nocaso do afetado heterozigoto cada alelo é diferente do outro em
dois pontos distintos, o que gera três fragmentos pela piperidina, mais o produto não clivado do
homoduplex.
Figura 25: Princípio de funcionamento do Taqman, ou PCR em tempo real. Uma sonda fita simples
com dois florocromos é adicionada à reação de PCR. O fluorocromo Q atua com atenuador da
fluorescência de R, sendo protanto um quencher. Para isto é preciso que esteja próximo a R. A TAq
polimerase separa os dois fluorcromos à medida em que degrada a sonda quando sintetiza a fita nova. O
fluorocromo R recém liberado da sonda emite então luz num comprimento de onda característico,
diferente de Q. A excitação dos fluorocromos é feita com laser que atravesse o tubo de reação.
A medição da radiação é feita pelo aparelho, que taça um gráfico com a absorção
obtida após cada ciclo de PCR. O ciclo em que o patamar (limite) de negatividade é
ultrapassado está diretamente relacionado à quantidade de DNA molde na mistura.
Com isto, a quantificação de DNA molde passou a ser não apenas possível, mais rápida.
O sistema ainda é bastante dispendioso mas tenderá a se tornar mais barato à medida
em que novos sistemas entrarem no mercado e um maior número de máquinas for
disponível.
Figura 26: Gráfico obtido com o Taqman. A seta indica o ciclo em que a reação ultrapassa o limite
da reação negativa. Quanto menor a quantidade de DNA molde no tubo de reação maior o número de
ciclos necessários para ultrapassar o limite da negatividade. A reação de PCR no Taqman emprega em
geral apenas duas temperaturas (94 oC para desnaturação e 60 oC, para hibridização e extensão) e o
resultado da PCR pode ser dado em menos de 30 minutos.
Mullis então levou a idéia para seus colegas da Cetus e juntos eles a colocaram para
trabalhar de verdade. Ela foi apresentada pela primeira vez ao público numa
conferência em 1985 e foi pronta e amplamente aceita pela comunidade científica. A
popularidade da técnica, assim como seu conceito, ganhou crescente popularidade ao
longo dos anos seguintes.
Em 1989 a revista Science escolheu a molécula usada na PCR, a Taq polimerase, como a
primeira "Molécula do Ano".
Devido ao alcance e popularidade da PCR Kary Mullis foi apontado e recebeu o prêmio
Nobel de Química em 1995. Esta indicação foi duramente contestada por muitos que
acreditavam que a PCR foi apenas um desenvolvimento de técnica e que sua concepção
não era suficiente para dar a Mullis o status de nobelista. Mullis argumentou a seu
favor que a união das técnicas pré-existentes no formato por ele criado fazia toda a
diferença.
Para uma história um pouco mais detalhada sobre o desenvolvimento da PCR veja o site
http://usitweb.shef.ac.uk/~mba97cmh/history/history.htm
Uma seleção dos mais importantes artigos sobre PCR, tanto durante o
desenvolvimento da técnica quanto para diversas aplicações, pode ser encontrada na
página específica da Universidade de Berkeley:
http://sunsite.berkeley.edu/pcr/foundationalPCR.html#anchor1239949
Vale a pena conferir!
IV. Sequenciamento de DNA
Até meados da década de 70 não era nada simples obter uma sequência de DNA, fosse
ele fita simples ou dupla. De fato, trabalhar com DNA era muito mais complicado do
que com proteínas e o conhecimento sobre os ácidos nucléicos avançava de forma
lenta. No início da década de 80 uma técnica relativamente rápida de sequenciamento
de DNA foi desenvolvida, que empregava a quebra de uma cadeia de DNA com
diferentes produtos químicos e a visualização dos fragmentos gerados por
eletroforese. Havia necessidade de fazer-se a marcação radiativa das moléculas
porque a quantidade de material produzida era muito pequena e não podia ser
detectada de outra forma. Mesmo com todas estas dificuldades houve então um
rápido progresso no conhecimento de sequências de DNA. Poucos anos depois um novo
avanço tecnológico foi alcançado pela introdução da técnica de interrupção da
sequência pela incorporação aleatória de um nucleotídeo modificado (sem a hidroxila
na posição 3´), que ficou conhecida como técnica de didesoxi ou dideoxi. Esta técnica
suplantou imediatamente a anterior e permitiu o desenvolvimento de sequenciadores
automáticos de DNA, sobre os quais versa este capítulo. Ainda se faz eventualmente o
sequenciamento manual, mas é muito mais trabalhoso, caro e arriscado, pois emprega
substâncias radiativas. De uma forma geral quando desejamos saber uma sequência de
bases de um fragmento qualquer de DNA, purificamos o fragmento e enviamos para
sequenciamento numa empresa prestadora deste serviço.
Mas, afinal, como produzir um DNA para sequenciamento e do que se trata a técnica
de dideoxi?
Por fim, basta recordarmos que as fitas assim produzidas devem ser muito numerosas
para poderem ser detectadas. Por isso, temos que começar a reação de
sequenciamento com muito mais DNA do que uma reação de PCR. As fitas produzidas
podem ser separadas pelo tamanho em eletroforese de poliacrilamida, e a base final
da sequência da fita identificada pela fluorescência emitida quando a banda
eletroforética correspondente à fita cruza o ponto do gel que é iluminado por um
feixe de laser. Neste sistema de detecção a eletroforese não pára, as bandas
passando no fim (em baixo) do gel é que são detectadas em movimento. Com isto,
podemos identificar com precisão 600 a 700 bases a partir do primer.
Ainda na figura, podemos ver que fragmentos de diferentes tamanhos são gerados,
porém nunca (exceto no caso onde houver moldes de DNA com polimorfismo de base,
como no caso A/G mostrado) dois fragmentos de igual tamanho terminarão em bases
diferentes. Na parte de baixo da figura todos os fragmentos representados na parte
de cima estão organizados por ordem de tamanho. Observe que:
b) podem existir fitas terminado na mesma base (afinal, só temos 4 opções, A,T,G ou
C!), com comprimentos diferentes. Não há qualquer restrição para isto.
Examine, por favor, atentamente a figura abaixo antes de continuar a leitura desta
aula.
Figura 27: Fragmentos de diferentes comprimentos gerados a partir do primer, interrompidos
quando um didesoxinucleotídeo é incorporado na fita. Os didesoxinucleotídeos são marcados com
substâncias fluorescentes diferentes, conforme a base (A,T,G ou C).
Examine, por favor, atentamente a figura 8.2 abaixo antes de continuar a leitura
desta aula.
Figura 28: Os fragmentos de diferentes comprimentos migram no gel, os menores na frente. São
iluminados por um feixe de laser e fluorescem quando atravessam a janela do feixe. Um gel pode
resolver 96 sequências simultaneamente. Os géis têm sido substituídos por capilares preenchidos de
polímero nas máquinas mais modernas. As bandas pretas indicam ausência de material e são apenas um
recurso gráfico usado aqui para indicar o espaço aumentado entre bandas que aconteceria neste caso.
Entretanto, isto não ocorre na reação de sequenciamento finalizada, porque o número de fragmentos
gerados é muito grande e a probabilidade de uma classe de tamanho não ser representada na reação é
praticamente nula.
A fluorescência emitida pela passagem de uma banda pela janela de medição é
registrada por um sistema de microcâmaras sensoras, que por sua vez transforma o
sinal num gráfico, conhecido como eletroferograma. Os picos representam as bandas,
e quanto mais altos e agudos mais qualidade têm, isto é, maior será a probabilidade de
que a base registrada seja correta. O valor de qualidade é medido por um programa
chamado Phred, que leva em conta vários parâmetros (espaçamento entre bandas,
largura e altura do pico, intensidade absoluta do sinal, ruído de fundo, etc).
Geralmente emprega-se como padrão aceitável de qualidade o valor Phred 20, que
corresponde a aprox. 99% de certeza da base indicada. A figura 8.3 abaixo mostra um
eletroferograma obtido no sequenciamento de um inserto de cDNA do parasita
Leishmania chagasi. Observe que, neste trecho, a qualidade do sequenciamento é
muito alta, com espaçamento regular dos picos (que indica espaçamento regular das
bandas) e picos agudos. Não há nenhum polimorfismo de bases, nem poderia haver,
pois esta sequência foi obtida a partir de um clone de cDNA.
Figura 29: Eletroferograma parcial de uma sequência de DNA obtida no sequenciador automático
ABI3100 Prism, da Applied Biosystems, na Unidade de Genômica do Laboratório de Genética Molecular
do Departamento de Genética da UFPE. Observe que os picos são agudos e regularmente separados, o
que indica alta qualidade do sequenciamento neste trecho
Esperamos que este texto tenha esclarecido a maior parte das questões básicas
pertinentes ao sequenciamento de DNA. Entretanto, julgamos que uma visita à nossa
sub-página de animações é essencial, pois a animação sobre sequenciamento é muito
ilustrativa do que foi dito aqui.