You are on page 1of 16

Mtodosdesecuenciacindecidosnucleicos.

GonzaloGreif.
UnidaddeBiologaMolecular.InstitutPasteurMontevideo.

1. Unpocodehistoria
2. SecuenciacinpormtododeMaxxamyGilbert
3. SecuenciacinpormtododeSanger
a. AvancesenelmtododeSanger(19861996)
b. ProyectoGenomaHumano
4. AlgunosMtodosdesecuenciadomasivo
a. Pirosecuenciacin
b. Secuenciadoporhibridizacin(Illumina)
c. Otromtodos
d. Aplicaciones

1. Unpocodehistoria.
Pasaron 15 aos desde el descubrimiento de la estructura de doble hlice del ADN en 1953
hastaladeterminacindelaprimerasecuenciadeADNdeformaexperimental.Algunasdelas
razonesqueprovocaronestademorafueron:
1. LaspropiedadesqumicassimilaresdelasdiferentesmolculasdeADNdificultabansu
aislamiento.
2. EllargodelasmolculasdeADN,muchomayoresquelascadenaspolipeptdicasdelas
protenas,hacaninabordablelasecuenciacincompleta.
3. NoseconocanADNasasespecficas.Lasecuenciacindeprotenassebasabaeneluso
deproteasasquecortabanendeterminadosaminocidos.
Sin embargo, algunas molculas de ARN no ofrecan estas dificultades, en particular las
molculas de ARN de transferencia eran pequeas y se podan purificar individualmente.
Adems se conocan ARNasas baseespecficas y se desarrollaron mtodos anlogos a los
utilizadosparaprotenas.LaprimersecuenciadeuncidonucleicofueobtenidaporHolleyy
suscolaboradores en 1965ycorrespondaalARN de transferencia de alanina deEscherichia
coli.
Un evento importante en el desarrollo de los mtodos de secuenciacin de ADN fue el
descubrimiento de las enzimas de restriccin de tipo II en 1970. Ests enzimas reconocen y
cortanelADNensecuenciasespecficas(engeneralentre4y6basesdelargo).Estasenzimas
proporcionaron un mtodo general para fragmentar largas molculas de ADN en pequeas
piezas para luego ser separadas por electroforesis en geles de agarosa. A mediados de la
dcada del70,FrederickSangerpublicaelmtodomsmenos(plusminusmethod)que
permita la secuenciacin de fragmentos de ADN utilizando la enzima ADN polimerasa de E.
coli. A fines de esta misma dcada, Maxxam y Gilbert publican un mtodo alternativo de
secuenciacindeADN(mtodoqumico)yelmismoFrederickSangerpublicaelmtodoque
luego se convertira en el ms utilizado durante los siguientes 30 aos (mtodo enzimtico),
comoveremosenelpunto3.

Mto
odosdesecuenciacindeecidosnuclleicos. 2
Gonzalo
oGreif

2
2. Secuenciacinqumicca.
El mtodo de se
ecuenciacin
n qumica propuesto
p
po
or Maxxam y Gilbert, fue
f
publicad
do en
febreero de 1977 en el Volumen 74 (n 2) de la reevista PNAS, 10 meses antes
a
que Sanger
S
publicaraelmto
ododesecueenciacinenzzimticaqueeveremosen
nlasiguienteeseccin.
manera:Desarrollamosu
unanuevatcnica
Eneelartculodeescribenelprocedimienttodeestam
para secuenciaru
unamolculladeADN.EElprocedimientodeterm
minalasecue
encia nucleo
otdica
de un
n ADN marccado radioactivamente en
e un extrem
mo, cortndo
olo con agen
ntes qumico
os en
cada unade lasb
bases.El corrteparcialdecadabasee,generaun setdefragm
mentosmarrcados
desdee el extrem
mo marcado
o hasta la base dndee fueron clivados. Utilizando gelees de
poliaccrilamidaysseparandodichosfragmeentosportamao,espo
osibledeterm
minarlasecu
uencia
deesstamolcula.
El mtodo prop
puesto estab
ba limitado por la cap
pacidad de resolucin de los gelees de
poliaccrilamida, y en este prim
mer artculo muestran laa posibilidad
d de secuenciar 100 basses de
ADN.
El mtodoutiliizaba4reacccionesqumiicas.Unareaaccin
qumica produ
uce cortes especficame
e
ente en Cito
osinas
(18
8M hidracinaa, 2M NaCl. Una reacccin con 50
0 mM
dim
metilsulfatocortaenAdeeninasyGuaaninas;silueegode
estetratamienttoqumicosecalientalareaccina9
90Ca
pH neutro, enttonces se obtiene
o
un patrn
p
de bandas
inteensoparalassguaninasytenuesparaalasadeninaas.Por
el contrario, el
e tratamien
nto posterior a un pH cido
pro
ovocaunpattrninverso (bandasinteensasdeadeeninas
y tenues
t
de guaninas). El
E ltimo tratamiento (18M
hid
dracina)prod
duceelclivajjetantoenccitosinascom
moen
tim
minas.
En laFigura1, semuestrae
elpatrnde
ebandasobttenido
durrante la secu
uenciacin de
d un fragmento de 64 bases
(mo
ostradoeneelartculode1977).

Figu
ura 1. Se muestran
m
los cuatro carrriles del gel de

poliacrilamida con
c
cada unaa de las reaccciones de cliivaje.
Interpretacin: La secuencia se lee de abajo hacia arrriba.
Una banda inteensa en la primera
p
colum
mna y una banda
ten
nueenlasegu
undacorrespo
ondenaunaA
Adenina,mientras
queelasituacininversacorreespondeaun
naGuaninaen
nesa
possicin. Una b
banda que ap
parece en la tercera y cu
uarta
columna en la misma posicin indica una C. y una banda
nlaltimacolumnacorresp
pondeaunaTT.
slopresenteen

odosdesecuenciacindeecidosnuclleicos. 3
Mto
Gonzalo
oGreif

33. Secuenciacinenzimtica.
Endicciembrede1
1977sepublicaeltrabajodeSanger,,NicklenyCo
oulsonquep
proponeunn
nuevo
mto
odoparadetterminarlassecuenciasd
debasesen unamolculadeADN. SangeryCo
oulson
habaan ya publiccado dos aos antes, un
n mtodo de
d secuenciaacin (mtod
do msmen
nos) a
partirrdelcualhaabanlogrado
oobtenerdo
ossecuenciaasde70baseesdelbacterifagoX174.La
dificu
ultad en la interpretaci
n de los resultados y aalgunos erro
ores que pod
dan ocurrir en la
secueencia hiciero
on que Sangger y sus co
olaboradores siguieran trabajando para mejoraar los
mto
odosdesecuenciacindeecidosnucleicos.
As, eel mtodo propuesto
p
por Sanger en
e 1977 se convirti
c
en el mtodo ms utilizad
do de
secueenciacin dee cidos nuccleicos hastaa la actualid
dad. La incorporacin de mejoras en
e los
aspecctostecnolgicosymeto
odolgicos(aautomatizacin,mtodo
osdedetecciin,electrofforesis
capilaar, etc.) perrmitieron, como hito fu
undamental,, la secuencciacin del genoma humano
(finalizado en el ao 2003) por este mtodo. En 19
980 Fredericck Sanger ob
btuvo su seggundo
prem
mioNobelenQumicaporlainvencindeestemtodo(verre
ecuadro).Reecinen2005
5,con
laaparicindelo
ossecuenciadores454se
ediouncam
mbioenlate
ecnologade secuenciacinde
cido
osnucleicos.Aunas,muchasdelasn
nuevastecno
ologasdeseecuenciacinmasivautilizanel
principio de nucletidos term
minadores, descrito
d
por Sanger, com
mo veremos ms adelan
nte en
losseecuenciadoreesdeIllumin
na.
Fred
derickSange
er(1918)
Frederick Sanger naci en
n Rendcombee, Inglaterra en
e 1918. De padre mdico, se
esperabaqueeFredsiguierrasuspasos,ssinembargoeenlaUniversidaddeCambridge
decidi realiizar una carrera en Cienccias. Continu
su formacin en Cambridge
realizandoun
nPh.D.conA
AlbertNeuberger,enmetab
bolismodeam
minocidos.LLuego
continutrab
bajandoconC
C.Chibnallideentificandolossaminocidossdelainsulin
na,en
el transcurso
o de la investigacin, Sanger imagin
las formas en las culees se
ordenanlosaaminocidose
enlaprotenaa.
Fueelaprimerap
personaenob
btenerlasecuenciadeamin
nocidosdeu
unaprotena((lainsulina).P
Prob
que las protenass eran molcu
ulas ordenadaas y, por analoga, los gen
nes y el ADN que codifica estas
prottenas deberan tener un orden o secu
uencia. Por esste trabajo obtuvo su prim
mer premio N
Nobel
(195
58).
En1
1962,SangerccomienzaatrrabajarenellaboratoriodeeBiologaMolecular,tambinenCambrridge,
dn
nde Francis Crick, John Keendrew y otro
os trabajaban
n con problem
mas relacionaados con el ADN.
A
Reso
olvercomoobtenerlasecu
uenciadeADNeralaexten
nsinnatural desutrabajo
oanterior.Fueeas,
com
mo estudiando
o primero la forma
f
de secuenciar ARN (una molculla ms pequeea) logr obttener
una tcnica apliccable luego all ADN (el mttodo de secuenciacin porr dideoxinucleetidos). En 1980,
1
uvo por ello su segundo premio Nobel tambin en
e Qumica compartido
c
co
on Walter Giilbert
obtu
(mtododesecue
enciacinqumica)yPaulB
Berg(ADNreccombinante).
En1
1992,elWellccomeTrusty elMedicalResearchCoun
ncilestablecieeronelSangerrInstitute,un
node
losccentrosdeseccuenciacind
dndesellev
adelanteelp
proyectoGeno
omaHumano.
En1
1985seretirysededicap
principalmente
ealcuidadod
desujardn.
Fuen
ntes:http://www..dnaftb.org/23/bio.html/http://w
www.sanger.ac.ukk/about/people/biographies/fsan
nger.html
Lectu
urasrecomendad
das:NobelLecture(FrederickSanger,1980).

Mto
odosdesecuenciacindeecidosnuclleicos. 4
Gonzalo
oGreif

mtico de Saanger, utilizaa una ADN polimerasa


p
e
e inhibidores que finalizzan la
El mtodo enzim
caden
na de ADN que est siendo sintetizada en luggares especficos, particcularmente utiliza
dideo
oxinucletido
os(esdecirn
nucletidos queensucaarbono3no
ocontienen elgrupohid
droxilo
Figu
ura2).Laincorporacindeunabaseeconestasccaractersticaasenunmollculanacien
ntede
ADN impide que
e una nuevaa base pueda incorporasse y la snte
esis de ADN
N es interrum
mpida
(Figura3).

Figura22.Estructuradeunnucletido(ej.dATP)yundideoxinucle
tido(ddATP).

Figura3.Esquemadem
mecanismodessntesisdeADN
N(1),y(2)impo
osibilidaddecontinuarelongaccindecadenaa
nacienteeluegodelainccorporacindeeundidoxinucleetido.

En el artculo ejeemplifican, de
d forma claara, que sucede cundo utilizan did
deoxiTimina en la
reacccin:Debido
oaqueelddTnocontie
enegrupo3hidroxilo,lacadenano
opuedeconttinuar
ocurre espeecficamentee en las possiciones dnde dT
exten
ndindose, entonces
e
la terminacin
t
deberahaberseincorporado.Siuncebad
doryunmolldesonincub
badosconADNpolimeraasaen
preseencia de unaa mezcla dee ddTTP y dTTP, as co
omo los otrros tres deo
oxiribonucleo
osidos
trifossfato (uno de ellos marcado radiiactivamentee con 32p),, se obtiene un mezccla de

Mto
odosdesecuenciacindeecidosnuclleicos. 5
Gonzalo
oGreif

mentostodossconelmism
moextremo5yconresiduosddTen
nelextremo
o3.Siestam
mezcla
fragm
esfraaccionadapo
orelectroforresisdesnatu
uralizanteen
ngelesdeaccrilamidael patrndebandas
muesstraladistrib
bucindelosresiduosTTiminaenel ADNsintetizzado.Utilizan
ndoterminaadores
para cada uno de
d los cuatrro nucletidos en reaccciones indep
pendientes, y corriendo cada
mezcclaenparaleloenelgel, seobtieneu
unpatrndeebandasap
partirdelcuaalsepuedeleerla
secueenciadebasees(Figura4
4y5).

Figura 4.Estaimagen
nse encuentra enla NobelLeecturedeF.Saangerde 1980. En la misma se
s ejemplifica el
e
piodelmtododedideoxinucleetidosterminadores.
princip

Figura 5.Estaimagenco
orrespondealaasegundafiguradelartculodeSanger(PNASS,1977).
Se trata de un autorad
diografa dndee se muestra laa migracin dee las cuatro differentes
mezclas (una para cad
da dideoxinucle
etido terminaador utilizado).. A la derech
ha de la
imagenseleenlassecueenciasdeADN(enestecasou
unfragmentodelbacterifago
oX174.
Laslecturasserealizan deabajo(fraggmentosmspequeos)haciaaarriba(msggrandes),
deacuerd
doalaaparici
ndelasbandas.Laresolucin
ndelgel,permiitesepararbandasde1
nucletid
dodediferenciaaentamao.

Lasseecuenciasob
btenidasconestemtodoalcanzaban
nhasta200basesdelarggo.

odosdesecuenciacindeecidosnuclleicos. 6
Mto
Gonzalo
oGreif

nelmtododeSanger(1
19771996).
aa. Avancesyymejorasen

minadoresflu
uorescentes((dyeterminaatorsequenccing).
I..Secuenciaciinconterm

986 Hood y
y colaborado
ores, en colaaboracin con Applied Biosystems (ABI) publiccan el
En 19
primeerreportede
eautomatizaacindelassecuenciacindeADN,q
queestablece
elasecuenciacin
conterminadoressfluorescenttescomovariantedelm
mtododeSaanger.Estvaarianteutilizzauna
molculafluoresccentediferenteunidaa cadadideoxinucletido, ypermitereealizarlareaaccin
nnicotubo
o(Figura).Assimismo,lassecuenciapu
uedeserled
daatravsdeuncomputtador.
enun
Las ssecuencias obtenidas,
o
co
on esta nueeva variante eran de un
n largo de entre
e
500 y 1000
nucleetidos.

a.
b.
c.

Figura6.Enestaafiguraseejem
mplificacomoenlugarde4carriles(uno
paara cada base) (a), se corren todas las reacciones en un nico

carril
de
elgel(cadacolo
orrepresentau
unabase)(b)ysedesarrollanaalgoritmos
paaraconvertiressassealesenelectroferograamasquereprresentanla
se
ecuencia de AD
DN (c). La flech
ha a la izquierd
da indica la dirreccin de
lectura53.

III.Secuenciaccinautomttica.
La em
mpresa Appllied Biosysteems, fue la pionera
p
y ld
der en instru
umentos de secuenciacin. El
primeer secuenciaador automtico (ABI 37
70A) aparecce en 1987, y con l se logra conocer la
secueenciadelprimergenporrCraigVenteerysuscoleegasdelNationalInstitutteofHealth(NIH,
USA).Laaparicindelossecuenciadoresautomtico
ospermitilaainstalacin
ndefacilidad
desde
on6secuencciadoresABII3700.
secueenciacin.ElprimerodeeellosfueelNIH,dndeeseinstalaro
En 19
992, Venter funda el Institute for Genomic
G
Ressearch (TIGR
R) y expandee la capacidad de
secueenciacincon30equiposs.

da,se demueestra el poderde lasecuenciacinaautomticacconel


Coneestaplataforrma instalad
desarrrollodelaeestrategiaEST(expressed
dsequencettag)paraeld
descubrimien
ntodegeness.Esta
estrategia consiste en hacer copias de ADN
A
a partirr del ARN mensajero
m
ceelular (ADNcc=ADN
E 1991, con
n esta estraategia,
copiaa) y clonarlaas de forma aleatoria para luego seecuenciar. En
Venteerreporta337geneshu
umanosnoconocidos.LabasededaatosdeEST contienehoyms
de43
3millonesdeesecuenciascorrespondientesa1300organismo
osdiferentes.

Mtodosdesecuenciacindecidosnucleicos. 7
GonzaloGreif

b. ProyectoGenomahumano:

Lasecuenciacindelgenomahumanosevolviunobjetivorealizableunavezestablecidaslas
metodologas de secuenciacin de ADN. La discusin formal comenz en 1985 en Estados
Unidos.En1990,sepresentunproyectode5aosenelcongresodeEstadosUnidos(Human
Genome Project). Se estimaba que el proyecto durara 15 aos y el costo rondara los 3 mil
millones de dlares. El proyecto estableca el objetivo de mapear y secuenciar diferentes
organismos modelo adems de humano. Entre ellos E. coli, S. cerevisiae, C. elegans, D.
melanogaster y el ratn (Mus domesticus). El proyecto se convirti en un esfuerzo de
colaboracininternacionalentrediversoscentrosdesecuenciacinenEstadosUnidos,Europa
yJapn.Cadacentrosefocalizenregionesparticularesdelgenoma,quepermitieranobtener
unmapa.En1994sepublicunmapadetalladodelgenomahumanoqueincluaelmapeode
5840lociconunamediadeespaciadode0,7cM(1centiMorgan=106bases).

En 1998, el proyecto pblico, compitiendo ahora con la empresa Celera (propiedad de Craig
Venter)adoptalossecuenciadorescapilaresdeAppliedBiosystems(ABI3700).
En 1999 el proyecto Genoma humano haba secuenciado ms de mil millones de bases y se
publiclasecuenciacompletadeuncromosomahumano(elcromosoma22).

Para el mismo tiempo, Celera, comenz a Cobertura(Coverage):


secuenciarelgenomahumanoconlaestrategia
de whole genome shotgun sequencing La cobertura es el nmero promedio de
desarrollada por C. Venter (explicada ms secuencias que representan a un
adelante). La secuenciacin comenz en
determinado nucletido en la secuencia
setiembrede1999yenjuniode2000serealiz
un ensamblaje inicial de las secuencias totalreconstruida. Puede ser calculada a
obtenidas. Los datos de Celera permitieron el partirdellargooriginaldelgenoma(G),el
ensamblaje del genoma humano con una nmero de secuencias (N) y el largo
cobertura de 5X (ver Cobertura). Adems se promediodelassecuencias(L)como:
aumentlacobertura3Xconlosdatospblicos.
Cobertura=NxL/G

El 25 de junio de 2000, en la Casa Blanca, el


presidente Clinton junto a Francis Collins Ejemplo. Un genoma hipottico de 2000
(responsable del proyecto pblico, NIH) y Craig bases,secuenciadocon24secuenciasde
Venter, anunciaron pblicamente la versin 350 bases de promedio de largo tiene
borrador del genoma humano realizada tanto unacoberturade:
porelesfuerzopblicocomoprivado(Figura7).
24x(350/2000)=4,2X.
Enfebrerode2001,sepublicaronlosborradores
delconsorciopblicoydelprivadoenSciencey Este valor significa que el genoma fue
Nature(Figura8).Finalmenteenelao2004se secuenciado 4,2 veces. Cunto mayor
publiclaversinfinaldelgenomahumano.
cobertura, menor posibilidades de
erroresenlasecuenciafinal.

Mto
odosdesecuenciacindeecidosnuclleicos. 8
Gonzalo
oGreif

Figura7.Fo
otodelanzam
mientodeborrradordelgeno
oma

humanoenWashington
n(Clinton,Ven
nter,Collins).

Figura8.TapasderevisttasNatureyS
Sciencede200
01con
losborrad
doresdelgeno
omahumano.

WholegenomeSho
otgunsequen
ncingyCraigV
Venter:
ElmtododeWholeGenomeSh
hotgunconsissteenlafragm
mentacinalaazardelADN detodoelgeenoma,
nciar ambas hebras
h
(el passo de clonado
o luego fue eliminado).
e
Una vez
clonarlo en plsmiidos y secuen
nidas,lassecu
uenciassealin
neanyensam
mblanparaforrmarcontigsb
basndoseen
nlassecuenciaasque
obten
solapaan(Figura9).Elmtodofueutilizadopo
orSangeren1
1982paraenssamblarelfaggolambda(48
8,5kb),
sin em
mbargo Venter fue el prim
mero en utilizarlo para seecuenciar un genoma de mayor tama
o (H.
influeenzae,1,8Mb)yproponerlo
ocomoestrateegiaparasecu
uenciarelgenomahumano
o.

ra9.Esquema
adesecuenciaacinconlaeestrategiadeSShotgun.Secu
uenciacindefragmentos
eradosalazarryensamblajedelasecuen
nciautilizando
oprocesamien
ntoinformticco.

En1995,Venteryssugrupodecid
denutilizarnu
uevasherram
mientascompu
utacionalesasscomolosmtodos
mejorrados de seccuenciacin para realizarr la primer secuencia de
e un organissmo de vidaa libre
(Haem
mophilus influ
uenzae). En TIGR analizar ms
m de 50 geenomas micro
obianos. Ventter y alguno de
d sus
colabo
oradores, com
menzaron entonces la seccuenciacin de
d genomas de
d mayor tam
mao (mosca, rata,
ratn).
En20006sefund elJ.CraigVenterInstitutee(JCVI)porlaaunindevariasorganizacciones(TIGR, TCAG,
JCVSFF,etc.).Setratadeunaorgganizacinldeerengenmicaanivelmu
undialconmsde400cien
ntficos
trabajjando.

Mtodosdesecuenciacindecidosnucleicos. 9
GonzaloGreif

4. AlgunosMtodosdesecuenciadomasivo
Pasaron cerca de 30 aos desde la publicacin del mtodo de Sanger, hasta que apareciera
una nueva tecnologa de secuenciacin de cidos nucleicos que no fuera el mtodo de
dideoxinucleotidosterminadores.La principalcaracterstica de estas nuevasmetodologas es
la posibilidad de secuenciado masivo de forma paralela, esto significa que el nmero de
secuencias obtenidas durante una corrida supera muchas veces el mximo de 96 secuencias
porcorridaqueseobtienenconlossecuenciadorescapilaresdeltimageneracinqueutilizan
elmtododesecuenciadodeSanger.

A partir del desarrollo del mtodo de pirosecuenciacin (primer mtodo de secuenciado


masivo utilizado, 2005), surgen nuevas alternativas de secuenciacin que utilizan el mismo
principio de dideoxinucleotidos terminadores en sus protocolos, aunque con mejoras
innovadoras.

Estosnuevosmtodosdesecuenciadomasivonoofrecenlecturastanlargascomoelmtodo
clsico de Sanger, aunque en pocos aos se ha mejorado sustancialmente el largo de las
secuenciasobtenidasyenalgunoscasosalcanzanlongitudescomparablesaSanger.

a. Pirosecuenciacin:

Elprimermtododesecuenciadomasivoonextgenerationsequencing(NGS),fuepublicado
en2005enNature,yllevadoalmercadoporlaempresa454(luegoadquiridaporRoche).El
resumen de este artculo explica: Describimos un mtodo escalable, un sistema de
secuenciacin altamente paralelizable con un rendimiento significativamente mayor que los
instrumentosdeelectroforesiscapilar.Elaparatopermitesecuenciar25millonesdebases,con
99% de precisin en una corrida de 4 horas (este rendimiento es 100 veces superior a la
cantidaddebasessecuenciadasenesetiempoenunsecuenciadorde96capilares).

En el primer artculo, publican la secuenciacin de novo del genoma de Mycoplasma


genitaliumalcanzandocubrirel96%delgenomayconunaprecisinde99,96%enunacorrida.

Elmtodoconsisteen4pasos:
1. FragmentacindelADN(oARN).
2. Ligacindeoligonucletidos(adaptadores)encadaunodelosextremos.
3. Amplificacinclonal(mediantePCRenemulsin).
4. Secuenciadoporsntesisusandounprotocolodepirosecuenciacinoptimizadoenun
soporteslidoyenescaladepicolitros.

Ms en detalle, luego de fragmentar el ADN, se ligan oligonuclotidos adaptadores a cada


extremo del ADN. Estas secuencias adaptadoras comunes a todos los fragmentos sern
utilizadas,tantoparaligarcadafragmentoalasesferas,comosecuenciasdondeseunirnlos
cebadores de la PCR y adems presenta la secuencia donde se unir el cebador de
secuenciacin.Unavezligadoslosadaptadores,seliganalasbeads(esferasquecontienenel
complementarioaunodelosadaptadoresensusuperficie),porunmtododedilucinlmite,
demododeobtenerunnicofragmentounidoaunaesfera.Sebusca,entonces,obteneren
cadabeadunnicofragmentodeADN,elmismoesamplificadomediantePCRenemulsin.

Mto
odosdesecuenciacindeecidosnuclleicos. 10
Gonzalo
oGreif

PCReenemulsin(emPCR):
La PCR en emu
ulsin permite realizar en un niico tubos miles
m
de reacciones dee PCR
indep
pendientes.U
Unavezobteenidalalibreeradefragm
mentosquessernsecuen
nciados,seu
unena
esferas que conttienen uno de los adap
ptadores preesentes en los
l fragmentos, de mod
do de
ner un nico fragmento
o por esferaa. Luego la poblacin de
d esferas (cada una co
on un
obten
fragm
mentodeAD
DN)esemulssionadaenu
unamezclad
deaguayacceite,demodotaldeob
btener
micellas de aceite
e independientes cadaa uno de ello
os con una nica esferaa y con todo
os los
reacttivos necesaarios para llevar adelante la reacccin. El re
esultado finaal, son milees de
micro
oreactoresdndesellevaaadelantelaareaccindeePCRdeform
maindepend
diente(Figurra10).

Figuraa 10. Esquema de la PCR en


n emulsin. (1
1) Se liga a caada bead un fragmento
f
med
diante las secu
uencias
complementarias a uno
u de los adaaptadores que se encuentran en la superficie de las mism
mas. (2) Se realiza una
emulsin (aguaaceitte) de tal form
ma que en cadaa gota de aceitte encontremo
os una nica beead unida a un
n nico
framgeento y encontrramos adems todos los reacctivos necesario
os para llevar adelante
a
la PCR
R (dNTPs, Polim
merasa,
cofactores).(3)Luego
oserealizaunaaPCRconvencional,peroenccadatubodereeaccinserealiizansimultneaamente
miles de reacciones en paralelo. (4
4) Luego de n ciclos de reacccin, se obtiene una amplificcacin clonal de
d cada
fragmeentounidoaun
nabead.

o de finalizada esta reeaccin, se rompe la emulsin


e
y se recuperaan las beadss que
Luego
preseentaron amp
plificacin. Las
L mismas son deposittadas en la placa de seecuenciacin. Esta
placaa(picoTiterp
plate),tiene 1,6millonessdepocillos,yencadau
unodeellos slopuedeeentrar
unbeead(Figura1
11).Encadapocillosuced
derunareaaccindeseccuencia,porlocualenlaplaca
podemos decir que tenem
mos 1,6 millones de secuenciado
s
c
o 16000
1
res de 1 capilar,
de96capilareesaproximad
damente.
secueenciadoresd

Mto
odosdesecuenciacindeecidosnuclleicos. 11
Gonzalo
oGreif

Figuraa11.PicoTitreplate.Arriba:esquemadedep
posicindeesfeerasenlospociillos.Abajo:miccrografaelectrrnica
delospocillosyejem
mplodecargadeeunaplaca.

Reacccindesecuenciacin:

tidos
Este mtodo no utiliza nucle
n este caso, se realizan ciclos
terminadores. En
dndeseofrece encadapoccillounabasepor
la
vez, secuenciaalmente. Durante
incorporacin dee una base en una molcula
DN se liberaa pirofosfatto, el
nacieente de AD
pirofo
osfato liberrado se co
onvierte en
n luz
mediante dos procesos
p
enzzimticos. La
L luz
pocillo,dnd
deseincorpo
orla
emitidaencadap
or la
base ofrecida, es monittoreada po
omtrica de la liberacin del
detecccin lumino
pirofo
osfato durante la reacccin de sn
ntesis
(Figura).Unacm
maraCCDcolectalosdattosde
dacicloyencadaposici
n.
cadabase,encad
Figuraa12.Esquemadereaccindepirosecuenciaccin

omopolimero
os (tractos de
d secuenciaa con el missmo nuclettido), el larggo del
En ell caso de ho
homo
opolimeroessdeterminadoapartird
delacantidaaddepirofossfatoliberad
do(proporcio
onala
lacan
ntidaddebasesincorporrada).

Ejemplo:
o seofrece labaseA, en todos los pocillos. En aquellos qu
ue se incorpo
ora se
En el primer ciclo
ndeluz(deependiendo lacantidadd
deAincorpo
orada,serlaintensidad
ddela
obserrvalaemisi
luzem
mitida).Lueggodeobtenidaslasimgenes,sereemuevelabaase,yseofreecelabaseTTyse
obserrvanlospocillosqueinco
orporanT.Sevuelveaeliminarlabaasenoincorp
poradayseo
ofrece
labaseG,yluego
olaCparatterminarelp
primerciclo.Luegode100ciclosfinalizalacorriida.El

Mtodosdesecuenciacindecidosnucleicos. 12
GonzaloGreif

tamao promedio de cada lectura es de 400 bases y en una corrida se obtienen cerca de 1
millndesecuencias(esdecir400millonesdebases/10horasdecorrida).
b. Illumina:

La segundatecnologadesecuenciacinmasiva quesalialmercado(2006)fueladeSolexa
(luego adquirida por Illumina). En esta tecnologa, se utilizan nucletidos terminadores
marcadosconmolculasfluorescentesaligualqueenlaSecuenciacindeSanger.Ademsde
la paralelizacin masiva (es decir la capacidad de realizar millones de secuencias en cada
corrida),ladiferenciaconelmtodoconvencionaleslaposibilidaddeeliminarlafluorescencia
unavezobtenidalaimagen,ydesbloquearcarbono3demodoquepuedaaceptarunanueva
base para continuar la reaccin de secuenciacin, haciendo que la incorporacin de un
nucletidoterminadorseareversible.Enestecaso,laslongitudesobtenidassonmenoresque
lossecuenciadores454(enlaactualidadhasta150bases),sinembargolacapacidadderealizar
secuenciasenparaleloesmuchomayorqueen454(hasta250millonesdesecuencias).Como
resultadoesposibleobtenerhasta6x1012enunasolacorrida.Paradimensionarestenmero,
elgenomahumanotieneaproximadamente3x109basesdelargo.

Al igual que el mtodo de secuenciacin de Roche, los primeros pasos consisten en la


fragmentacindelADNyligacindeadaptadores.Luegohayunpasodeamplificacin(eneste
caso,laamplificacinesenunasuperficieslida:flowcell,dndetambinsedarluegola
reaccindesecuenciacin).

AmplificacinyReaccindesecuenciacin:

En el primer paso, la librera se deposita en la flow cell por complementariedad con los
adaptadores (1). Luego se produce la amplificacin en puente (2 y 3) en sucesivos ciclos
(4,5,6,7,8)hastaobtenerunclusterconlaamplificacinclonaldelfragmentoinicial(8)(Figura
13).

8
2
3
4
5
6
7

Figura13.Amplificacinenpuente.Verdescripcineneltexto.

En la reaccin de secuenciacin, se bloquea uno de los adaptadores (1), y se comienza la


reaccinde secuenciacindesdeel otroextremo (2)medianteuncebador especfico(Figura
14).

1
2

Figura14.ReaccindesecuenciacindeIllumina.

Verdescripcineneltexto.

Mtodosdesecuenciacindecidosnucleicos. 13
GonzaloGreif

Durante la reaccin, a diferencia de la pirosecuenciacin, se ofrecen los cuatro nucletidos


terminadoresmarcadoscadaunoconunfluorocromodiferente(1),aligualqueelmtodode
Sanger.Luegodeunlavado(2),seobtienenlasimgenesyseobtienelaprimerabasedecada
cluster(3).Luego,seeliminaelfluorocromoysedesbloqueaelCarbono3,permitiendoqueun
nuevo nucletido pueda extender la cadena de ADN naciente (4). Otra vez los cuatro
nucletidosterminadoresmarcadossonofrecidos alosclusters, comenzando un nuevo ciclo
(Figura15).

Figura 15. Reaccin de secuenciacin de Illumina. Primer ciclo de secuenciacin (1), incorporacin de
dideoxinucletidosmarcados(2),adquisicindeimagen(3),ylavado,desbloqueo,yeliminacindemarcado(4).

Los ltimos modelos de Illumina permiten secuenciar en paralelo ms de 3000 millones de


clustersconlargosdesde35a150bases(www.illumina.com).
c. Otrosmtodos:
Desde2005hastalafecha,otrastecnologasdesecuenciacinmasivahansidodesarrolladasy
otras se encuentran en desarrollo y constituyen una nueva generacin de secuenciadores
(Tabla1).Esimposibleenestecaptuloeldesarrolloenprofundidaddecadaunadeellas,por
lotantoenlasiguientetablasemuestranotrastecnologasylasfuentesdndeobtenermayor
informacindecadaunadeellas.
Algunasdeestastecnologas(SMRT,Helicos)proponenlasecuenciacinapartirdeunanica
molculadeADNentiemporeal.Unadeellas(PacificBiosciences)enteoranotienelmiteen
cuntoallargodelassecuenciasgeneradasyeventualmentepodrasecuenciarcromosomas
enterosenunanicalectura(www.pacificbiosciences.com).
Otras, como Oxford nanopore e Ion Torrent (recientemente lanzada al mercado) ofrecen
novedosas soluciones y no requieren marcacin fluorescente ni cmaras registradoras de
imgenes. Enparticular,Ion Torrent (ver recuadroJ. Rothberg), se basa en el registrode los
cambios de pH producidos durante la incorporacin de bases durante la sntesis de ADN. Se
trata de micropHmetros que reducen notablemente los costos de secuenciacin
(www.iontorrent.com)yprometenserherramientastilesenelreadediagnstico.

Mto
odosdesecuenciacindeecidosnuclleicos. 14
Gonzalo
oGreif

Plataforma
SOLiD(ApplieedBiosystem
m)
Genetic
G
Anaalysis Systeem
(H
Helicos)
SMRT(PacificcBiosciencess)
Io
onTorrent
OxfordNanop
O
pore

Te
ecnologa
Ligacin
n
true Siingle Moleccule
Sequencing
Single Molecule Real
R
time
Microp
pHmetros
Labelfree,electrical

Longgitudderead
ds
50basses
25a55bases

Ao
o
2007
2008

>1000bases
(enteo
orasinlmite)
>200b
bases
ND

D
ND
2011
ND
D

Web
www.ap
ppliedbiosystems.co
om
www
w.helicosbio.com

www.paacificbiosciences.com

www
w.iontorrent.com
www.nanoporetech.com

Tabla1.Informacinsobreotrasteccnologasdeseecuenciacinmaasivaenelmerrcadoocercade
esalir.

JonathanM
M.Rothbergg,Ph.D.(19
963)

FundadoryCEOdeIonTTorrent.

3enNewHaaven,Conneccticut.Segraadueninge
enieraqumicaconopci
nen
Rothbergnaacien1963
IngenieraB
Biomedicaen
nCarnegieM
MellonUniversity,yrealizzluegosum
maestraydo
octoradoenla
Universidad
ddeYale.

bergeselpiioneroeneldesarrollod
detecnologasdesecuenciacinmasiva.Segn cuentaenlaa
ElDr.Rothb
pginaweb(www.ionto
orrent.com),laprimeraid
deasobreelsecuenciado
omasivoenparalelosurgeluegoquee
o en cuidado
os intensivoss y se cuestio
onara la imp
portancia deel genoma humano en laa
su hijo fuerra internado
salud. Subssecuentemen
nte, funda 454
4 Life Scieences, lanzan
ndo al mercado el primer secuenciaador masivo
o.
Dirigilaseecuenciacindelprimerggenomahum
manodeunindividuo(secuenciandoexitosamentteelgenomaa
delDr.Wattson).Ademsinicielp
primerproyectodesecueenciadomassivodeunAD
DNantiguo((Neanderthaal
GenomePro
oject,encolaboracinco
onelDr.Paabo).

hbergalsecuenciadomaasivoincluyeeeldesarrollodelprimeersistemadeeclonadono
o
LacontribucindeRoth
bacterial(emPCR).

menz un nu
uevo negocio, a raz de un comentario de su hijo.
h
Rothberg funda Ion
n
En 2007, Rothberg com
nconpHm
metros.
Torrentydeesarrollaelcconceptodesecuenciaci
Ademsesffundadorde
eotrasempreesas,vinculaadasalatecn
nologayme
edicina.EstambinfundaadordeThe
RothbergIn
nstituteforC
ChildhoodDissease.
Fuente:http://www.ionto
orrent.com/teeam/jonathanrothberg/

Mtodosdesecuenciacindecidosnucleicos. 15
GonzaloGreif

d. Aplicaciones
La produccin de un gran nmero de lecturas a bajo costo permite la aplicacin de las
plataformas de secuenciado masivo en muchas aplicaciones, y es imposible describir todas
ellasaqu.Laprimeraaplicacinobviaeslasecuenciacindegenomas(verrecuadroGenoma
Humano y Secuenciacin masiva) y la precisa anotacin de genes (sitios de splicing,
poliadenliacin,secuencias5y3UTR,etc).Dentrodelasprimerasaplicacionesencontramos
la secuenciacin de ARN (ej. descubrimiento de ARN pequeos, nuevas variantes gnicas,
nuevos genes, etc.) y amplicones de PCR (secuenciado de ARNr16S y su aplicacin en
metagenmica como veremos en el siguiente prrafo). Asimismo, la posibilidad de
cuantificacindetranscriptosqueofreceestatecnologa(RNAseq),lavuelveunaalternativaa
losexperimentosdemicroarreglos.Lasecuenciacinparaidentificarmarcadoresepigenticos,
identificarinteraccinADNprotena,determinarestructuradecromatina(ChIPSeq,Methyl
seq,DNaseseq)sonaplicacionescadavezmsutilizadas.

LametagenmicaeselestudiogenmicodemicroorganismosporlaextraccindirectadeADN
de una comunidad microbiana. La aparicin de la secuenciacin masiva ha facilitado a los
investigadores la tarea de identificacin y caracterizacin de diferentes microogranismos, en
diferentesambientes.

En la seccin de lecturas recomendadas se ofrecen revisiones bibliogrficas de cada una de


estasaplicacionesparaqueellectorprofundiceenellas.

GenomaHumanoySecuenciacinmasiva:
Comoyavimosantes,lasecuenciadelgenomahumanasepublicen2004.Lasecuenciacindeeste
genoma tuvo un costo aproximado de 3000 millones de dlares y cerca de 20 aos de trabajo. En
octubrede2007,sepublicaelprimergenomadeunnicoindividuo(J.CraigVenter),realizadoporel
mtododeshotgunysecuenciacinSanger.Elcostodeestegenomafueaproximadamente70millones
dedlaresyunaduracinde4aos.
Elprimergenomahumanosecuenciadoconlatecnologa454fueeldelDr.JamesWatson,auncosto
de1millndedlaresyendosmeses(2008).Elcostohacontinuadobajandoysehanreportadola
secuenciacindeungenomahumanopormenosde100.000dlares.
Variosproyectostienencomoobjetivolasecuenciacindemsindividuos,entreelellosTheCancer
GenomeAtlasy1000Genomeproject.
Hacetansolo10aos,2dedoseransuficientesparacontarelnmerodegenomassecuenciados.En
2009, alcanzaban los dedos de ambas manos. Hoy, es difcil de saberlo exactamente, pero un
relevamiento realizado por la revista Nature, indica que cerca de 30.000 genomas humanos estarn
secuenciadosparafinalesde2011.

Mtodosdesecuenciacindecidosnucleicos. 16
GonzaloGreif

Lecturasrecomendadas:

1. Sanger F. Coulson R. A rapid method for determining sequences in DNA by primed


synthesis with DNA polymerase. J. Mol. Biol., 94, 441448 (1975). Mtodo msmenos
deSanger.
2. MaxamA.andGilbert.AnewmethodforsequencingDNA.PNAS,74(2),560564,(1977).
Articulodndesedescribemtodoqumicodesecuenciacindecidosnucleicos.
3. Sanger,F.,Nicklen,S.andCoulson,A.R.DNAsequencingwithchainterminatinginhibitors
4. PNAS, 74 (12), 54635467 (1977). Artculo de Sanger dnde describe el mtodo de
secuenciacinutilizandodideoxinucletidos.
5. Sanger, F. Determination of nucleotide sequences in DNA. Nobel lecture, 8 December
1980.
6. Venter, C. et al. The Diploid Genome Sequence of an Individual Human. PLOS Biology, 5
(10),(2007).PublicacindegenomadeCraigVenter.
7. International Human Genome Consortium. Finishing the euchromatic sequence of the
humangenome.Nature431,931945(2004).
8. Margulies,M.etal.Genomesequencinginmicrofabricatedhighdensitypicolitrereactors.
Nature437,376380(2005).Losautoresdescribeneldesarrollodelaprimertecnologa
de secuenciado masivo, y realizan el ensamblaje de novo del genoma de Mycoplasma
genitualiumutilizandopirosecuenciacin.
9. Bentley,D.R.etal.Accuratewholehumangenomesequencingusingreversibleterminator
chemistry. Nature 456, 5359 (2008). Artculo de los desarrolladores de Illumina,
reportandoelusodeestatecnologaparalasecuenciacindeuncromosomahumano.
10. Wang, Z., Gerstein, M. & Snyder, M. RNASeq: a revolutionary tool for transcriptomics.
Nature Rev. Genet. 10, 5763 (2009). Review sobre uso de tecnologas de secuenciado
masivoparaanlisisdetranscriptomas(RNAseq).
11. Park, P. J. ChIPseq: advantages and challenges of a maturing technology. Nature Rev.
Genet.10,669680(2009).RevisinsobreChIPseq.
12. Morozova, O.,Hirst, M., Marra, M. Applications of New Sequencing Technologies for
Transcriptome Analysis. Annu. Rev. Genomics Hum. Genet. 10,13551 (2009). Revisin
NGS.
13. Petrosino, J. F., Highlander, S., Luna, R. A., Gibbs, R. A. & Versalovic, J. Metagenomic
pyrosequencingandmicrobialidentification.Clin.Chem. 55,856866(2009).Setratade
unreviewsobremetagenmica.
14. Zhou,X.,Ren,L.,Meng,Q.,Li,Y.,Yu,Y.,Yu,J.Thenextgenerationsequencingtechnology
andapplication.ProteinCell,1(6),520536(2010).RevisinNGS.
15. Metzker, M.L. Sequencing technologies the next generation. Nature Reviews Genetics
11,3146(2010).RevisinNGS.
16. Human genome: Genomes by the thousand. Nature 467, 10261027 (2010). Revisin
secuenciadoresinstaladosygenomassecuenciados.
17. Zhanga,J.,Chiodinic,R.,Badra,A.,ZhangG.Theimpactofnextgenerationsequencingon
genomics.Genet.Genomics.38(3),95109(2011).RevisinNGS.

Otrosrecursosinteresantes:

1000GenomesProject:http://www.1000genomes.org
TheCancerGenomeAtlas:http://cancergenome.nih.gov
TheExomeProject:http://www.nhlbi.nih.gov/resources/exome.htm
HumanMicrobiomeProject:http://nihroadmap.nih.gov/hmp
PersonalGenomeProject:http://www.personalgenomes.org
CraigVenterInstitute:www.jcvi.org

You might also like