You are on page 1of 37

PROTEMICA 367

PROTEMICA
INTRODUCCIN.
ALGUNOS CONCEPTOS BSICOS
Una vez concluida la secuenciacin del genoma humano, es necesario disponer
de tcnicas que permitan comprender la relacin entre la expresin de los genes
y los problemas biolgicos. Este es precisamente el campo de la protemica,
ciencia dedicada al estudio de la expresin de las protenas y de sus cambios en
dependencia del contexto biolgico. A diferencia de las tcnicas clsicas utilizadas
en la bioqumica, la protemica se basa en la separacin y la identificacin de
muchas protenas (en el orden de mil o ms) simultneamente. Muchos de los
mtodos utilizados en protemica permiten obtener un despliegue (u ordenamiento
o arreglo) fsico de mezclas muy complejas de protenas, separadas mediante la
combinacin hbil de dos (o ms) tcnicas de separacin.
El proteoma [1] es el conjunto de protenas expresadas por un organismo (o
por una parte de l, por ejemplo un tipo de tejido) en un momento dado. La
protemica comprende tanto las tcnicas para el estudio en gran escala de las
protenas expresadas (proteoma) como las aplicaciones de estas tcnicas al
anlisis de problemas biolgicos. Mientras que el genoma de un organismo es
esencialmente constante a lo largo de la vida, el proteoma tiene un carcter
dinmico: la expresin de protenas cambia en diferentes etapas del ciclo celular
pero tambin en respuesta a acciones externas. En particular, las diferencias
entre un estado normal y uno patolgico se traducen tambin a nivel molecular
en cambios en los patrones de expresin de protenas. Es precisamente esta
variabilidad del proteoma lo que lo hace tan atractivo para la investigacin
biomdica. Recientemente, la protemica ha comenzado a dar una contribucin
importante a nuestra comprensin de la biologa y de la medicina.
Los avances logrados en genmica no se traducen directamente en nuestro
conocimiento de los respectivos proteomas: muchos genes carecen de funcin
LILA CASTELLANOS
1
, LUIS JAVIER GONZLEZ
1
Y GABRIEL PADRN
1
CAPTULO 20
1
Centro de Ingienera Gentica y Biotecnologa. Ave. 31 e/ 158 y 190, Playa. AP 6162,
CP 10600, Ciudad de La Habana, Cuba.
368 CAPTULO 20
conocida, a muchos otros se les adjudica una funcin por analoga con otros
genomas estudiados previamente. Si se extrapola la situacin encontrada con la
levadura, ms de la mitad del genoma humano no tiene una funcin conocida en
estos momentos.
La protemica incluye diversos campos de investigacin:
La identificacin de las protenas expresadas por un organismo en una
condicin dada (protemica descriptiva o estructural, todas las protenas
expresadas en un momento y en un contexto)
La identificacin de los cambios en el nivel de expresin de protenas
asociados a cambios en las condiciones del organismo (protemica
comparativa, cules protenas cambian cuando un organismo se somete a
condiciones diferentes)
La identificacin de conjuntos funcionales de protenas, es decir, grupos de
protenas que se localizan en un mismo sitio celular y que operan en mutua
interaccin (interacciones protena-protena, protemica funcional)
La identificacin de las protenas que forman un organelo (este enfoque
conduce a la elaboracin de un mapa molecular de la clula)
POR QUE LA PROTEMICA?
El dogma central de la gentica:
ADN ARN PROTENA
di lugar a uno de los paradigmas esenciales de la biologa que prevaleci durante
la segunda mitad del siglo pasado:
un gen una protena
Esta relacin aparentemente simple, no refleja sin embargo la realidad [2].
Aunque es cierto que un gen codifica una secuencia de aminocidos existen
dos eventos que incrementan considerablemente el nmero de protenas que
pueden ser originadas por un gen y estar presentes en una clula en un momento
dado y por tanto hace ms complejo el proteoma de una clula.
Uno de esos eventos es el fenmeno conocido como empalme alternativo
(splicing). En los mamferos y otros organismos superiores el gen que codifica
una protena no est constituido por una secuencia continua de nucletidos.
Una parte de la secuencia del gen est formada por regiones no codificantes
que interrumpen la secuencia codificante del gen y son llamados intrones. Las
PROTEMICA 369
regiones codificantes (y que por tanto dan lugar al ARN y posteriormente a la
protena) son conocidas como exones. Cuando se forma el ARN mensajero,
mARN, los intrones son eliminados quedando as la secuencia que codifica una
protena. El fenmeno de splicing consiste en que los exones pueden reordenarse
de varias formas y dar lugar a mas de una protena a partir de un solo gen.
El otro evento, es el hecho de que una protena puede ser modificada durante o despus
de la traduccin o sntesis de la protena con la introduccin de grupos sustituyentes,
en un proceso que se conoce como modificacin post traduccional (MPT).
Se calcula que alrededor del 10 % de los genes de mamferos codifican
protenas cuya funcin es modificar otras protenas, y que generan ms de
200 tipos de modificaciones post traduccionales tales como: glicosilacin,
fosforilacin, incorporacin de lpidos, etc. En adicin, muchas protenas
participan en las rutas metablicas que conllevan a la degradacin y finalmente
la eliminacin de protenas. Asi, en el sistema de ubiquitinacion participan 134
genes, mientras las fosfatasas son codificadas por unos 300 genes y las
protenas kinasas se estiman codificadas por ms de 1100 genes [3]. La funcin
de todas estas protenas es la modificacin de otras para modular su funcin
biolgica. El cuadro se completa con el conjunto de protenas que interviene
en la protelisis y la degradacin. En el proteosoma participan los productos
de expresin de unos 130 genes, mientras que las protenas con funcin
proteoltica estn codificadas por unos 1000 genes.
Por ello, una secuencia nica de aminocidos puede generar muchas especies
qumicas diferentes. De esta forma se estima que los aproximadamente 40 000
genes del genoma humano pueden dar lugar a mas de un milln de protenas.
Las diferencias que existen entre las poblaciones de mARN y de protenas
estn dadas, por una parte, por la amplia poblacin de especies que portan
modificaciones qumicas pero adems, intervienen otras causas importantes: el
tiempo de residencia de las molculas de protenas en el interior de una clula o
de un compartimiento celular es variable debido a la degradacin por proteasas,
a la traslocacin intra y extracelular y a la modificacin de las protenas durante
su intervencin en procesos biolgicos. Por ello la medicin de la expresin de
mARN no suministra valores confiables de los cuales se pudiera deducir la
abundancia y la presencia de las protenas traducidas.
Las diferencias que existen entre las poblaciones de mRNA y de protenas
estn dadas por una parte por la amplia poblacin de especies que portan
modificaciones qumicas pero adems, intervienen otras causas importantes: el
tiempo de vida media de las molculas de protenas en el interior de una clula
o de un compartimiento celular es variable debido a la accin de proteasas, a la
370 CAPTULO 20
traslocacin intra- y extracelular y a la modificacin de las protenas durante su
intervencin en procesos biolgicos. Por ello la medicin de la expresin de
mRNA no suministra valores confiables de los cuales se pudiera deducir la
abundancia y la presencia de las protenas traducidas. Solo el estudio directo de
las protenas, lo que es campo de la Protemica, puede dar respuesta a estas
cuestiones. Adicionalmente, una molcula de mRNA puede originar varias
secuencias de protenas, por el simple cambio del codn de iniciacin o de
terminacin, lo que origina molculas de secuencias ms cortas o ms extensas.
En resumen, al concluir el siglo XX la idea de considerar las protenas como
macromoleculas definibles por una secuencia de residuos de aminocidos
completamente determinadas por la secuencia de una molcula de ADN haba
cambiado sustancialmente: entre genes y protenas existen diferencias de complejidad
que definen la existencia de un campo de conocimiento singular, irreducible a formas
relativamente menos complejas del conocimiento: al concluir el siglo las razones
para el surgimiento de la protemica estaban solidamente establecidas.
COMO INVESTIGAR EL PROTEOMA?
Mientras que las molculas de ADN y de ARN se construyen mediante un
ordenamiento variable de solo cuatro componentes estructuralmente invariables
(desoxinucletidos y nucletidos respectivamente), las molculas de protenas
presentan una diversidad estructural extraordinaria que se manifiesta en varios
niveles de complejidad: a nivel de la estructura primaria por los posibles
ordenamientos esencialmente de 20 residuos de aminocidos a los que se suman
todas las variantes de modificaciones post traduccin posibles. Y a nivel de
estructura espacial, esta diversidad se manifiesta en muy diversas estructuras
de las que depende esencialmente la actividad biolgica. Los estudios de la
diversidad estructural tridimensional de las protenas tambin estn en curso,
mediante ensayos masivos de cristalizacin y determinacin de estructura
tridimensional haciendo uso de tcnicas de difraccin de rayos X y de resonancia
magntica nuclear, pero este tema no ser objeto de este capitulo. Nos
centraremos, por tanto en los mtodos encaminados a la investigacin de la
diversidad molecular de las protenas asociada a la existencia de diferentes
estructuras primarias (trmino que ser utilizado en nuestro texto para incluir
tambin las modificaciones post traduccin).
Podramos adelantar una formulacin del dogma central de la protemica
comparativa en los siguientes trminos:
Los cambios en un nivel superior del fenotipo de un organismo o de uno de sus
componentes est relacionado con cambios en el fenotipo molecular de la
expresin de protenas.
PROTEMICA 371
Por tanto, la idea es relacionar las caractersticas biolgicas de un sistema con
la expresin de las protenas y ms especficamente, relacionar los cambios en
las propiedades biolgicas con los cambios en la expresin de protenas.
Para ello es necesario disponer de tcnicas que permitan a) separar miles de
especies; b) identificar las especies de inters y c) cuantificar la magnitud de
los cambios en la expresin de protenas. La protemica aborda este complejo
problema tcnico con variadas herramientas.
Estas tcnicas se agrupan en dos grandes campos: las que se basan en la
resolucin de protenas intactas y que utilizan principalmente tcnicas de
electroforesis o de cromatografa de protenas y las que se basan en la conversin,
en una primera etapa, de las mezclas de protenas en mezclas complejas de sus
pptidos de degradacin proteoltica. En el primer grupo estn las tcnicas que
utilizan la electroforesis bidimensional (2DE) atendiendo a una primera separacin
por carga elctrica y una segunda separacin por talla. Tambin comprende la
combinacin de dos o tres mtodos ortogonales de cromatografa o
isoelectroenfoque en solucin seguido de cromatografa (por ejemplo, separacin
por talla seguida de separacin por hidrofobicidad; separacin por carga, por
talla y finalmente por hidrofobicidad; separacin por IEF de flujo libre seguido
de separacin por masa o por hidrofobicidad). Las fracciones obtenidas en
estas separaciones, tras mltiples etapas, pueden ser resueltas a continuacin
por 2DE o por electroforesis en geles de SDS (SDS PAGE), o alternativamente,
ser digeridas y analizadas por espectrometra de masas.
En el segundo grupo (tcnicas basadas en un primer paso de conversin de las
mezclas de protenas en mezclas de pptidos obtenidos por protelisis especfica) se
sustituye la resolucin de protenas por la resolucin cromatogrfica de las mezclas
de sus pptidos obtenidos por protelisis especfica generalmente con tripsina.
Alternativamente, se hace la seleccin de un conjunto de pptidos representativos
de la presencia de las protenas parentales atendiendo a alguna propiedad.
Si bien la electroforesis en geles de SDS es una tcnica de rutina en los
laboratorios biolgicos, la electroforesis bidimensional de alta resolucin requiere
de un laboratorio dedicado, tanto por los requisitos de reproducibilidad como por
la variedad y complejidad de los pasos del proceso. La electroforesis
bidimensional es hasta el presente, la nica tcnica que permite resolver con
alta eficiencia las isoformas que difieren en punto isoelctrico y por ello, se
sigue utilizando ampliamente. A continuacin discutiremos los aspectos esenciales
de la tcnica as como las caractersticas que deben tener las muestras para su
anlisis con estos mtodos. Los detalles experimentales estn disponibles en
excelentes manuales y artculos de revisin [4-9].
372 CAPTULO 20
ELECTROFORESIS BIDIMENSIONAL (2DE)
Los geles bidimensionales fueron introducidos en 1975 simultneamente por J.
Klose [10] en Berlin y O Farrell [11], en los Estados Unidos. Estos geles [12]
permiten obtener un arreglo o despliegue fsico en dos dimensiones de mezclas
complejas de protenas (Figura 20.1). Se basan en la combinacin de dos tcnicas
ortogonales (es decir, que no comparten principios fsicos comunes): 1) la
separacin por carga elctrica (focalizacin isoelctrica, IEF) en la que las
protenas migran en un gradiente de pH hasta alcanzar el sitio donde carecen
de carga, es decir su punto isoelctrico y 2) la separacin por tamao molecular
que se efecta en un gel de poliacrilamida en presencia de un detergente aninico
muy potente, el docecil sulfato de sodio (SDS-PAGE) .
Para los organismos cuyos genomas han sido ya secuenciados es posible calcular
el proteoma terico. Estos abarcan aproximadamente desde pI 3 hasta pI 12-13
y desde 1,000- 2,000 Da hasta aproximadamente 500 kDa. Pero la mayor parte
(posiblemente alrededor del 70 %-80 %) de las protenas estn concentradas
en una zona mas estrecha que va aproximadamente entre pI 3.5 y pI 10 y masa
entre 10 y 100 kDa. Esta es la zona que generalmente se estudia con las tcnicas
de electroforesis bidimensional.
En adicin, un tercer elemento tiene que ser considerado: el grado de
hidrofobicidad de las protenas. Este es muy variable y va desde estructuras
hidroflicas hasta estructuras muy hidrofbicas. Las protenas hidrofbicas
abundan en las membranas, y tienen regiones o dominios cuyas propiedades de
solubilidad son ms cercanas a las de los polmeros orgnicos convencionales
Figura 20.1. Electroforesis bidimensional de protenas de la fraccin nuclear de clulas de cncer
de pulmn humano (small cell lung cancer). Las protenas de la fraccin nuclear se
extrajeron con una solucin de agentes caotrpicos y detergentes. La primera
dimensin se efectu en un gel de poliacrilamida tubular con anfolinas portadoras
de rango 2 a 11. La segunda dimensin se efectu en un gel vertical de 16.5 %
poliacrilamida en presencia de SDS. Las protenas se detectaron mediante tincin
con plata (Gel confeccionado en el laboratorio de los autores).
PROTEMICA 373
que a las de las protenas globulares hidrosolubles. Las tcnicas basadas en
2DE no son especialmente buenas en el anlisis de protenas muy hidrofbicas
aunque continuamente se hacen avances tcnicos para superar esta limitacin
[13]. Por ello, generalmente las poblaciones estudiadas por 2DE estn sesgadas
hacia las molculas mas hidroflicas, mientras que las protenas hidrofbicas se
analizan preferentemente mediante combinaciones de tcnicas cromatogrficas
y de SDS-PAGE o mediante su previa conversin a mezclas de pptidos.
La Tabla 20.1 resume las etapas principales de un anlisis por 2DE seguido de
identificacin de las protenas de inters.
Tabla 20.1. Etapas en el anlisis de la expresin de protenas por 2DE e
identificacin de los cambios por espectrometra de masas
374 CAPTULO 20
Tabla 20.1 (continuacin).
PROTEMICA 375
PREPARACI N DE MUESTRAS
Cualquiera sea su origen (protenas totales o procedentes de un fraccionamiento
subcelular), las muestras biolgicas sometidas a electroforesis bidimensional
requieren de un tratamiento previo cuya funcin es liberarlas de todos los
componentes no proteicos presentes. Estos son esencialmente: lpidos, cidos
nucleicos, componentes de naturaleza orgnica e inorgnica de baja masa
molecular como vitaminas y cofactores, las sales y los iones inorgnicos. La
eliminacin de estos componentes es un arte del cual depende la calidad de la
preparacin y por ello el xito o el fracaso del experimento. Las tcnicas utilizadas
para eliminar estos componentes tienen que cumplir ciertas condiciones: a) no
pueden alterar el perfil de protenas (es decir, no es posible una tcnica que
cause la prdida irrecuperable de ciertas protenas); b) no pueden introducir
modificaciones sobre las protenas (por ejemplo, no puede trabajarse en
condiciones en que las proteasas endgenas sean activas y causen la protelisis
de componentes de la muestra [14] y c) el nmero de pasos debe ser mnimo y
su diseo concebido para que al final, la preparacin est en condiciones de ser
incorporada al gel de la primera dimensin (focalizacin) o a cualquier
procedimiento de anlisis alternativo a la 2DE. Un aspecto crtico es la presencia
de sales provenientes de tampones utilizados en la obtencin de una preparacin.
Por ejemplo, el Tris, el fosfato salino (PBS) y el HEPES que son de uso frecuente
en bioqumica, focalizan en una regin del gel si se encuentran presentes en la
preparacin final, como consecuencia esa regin aparece vaca de protenas.
El lmite de la concentracin total de iones que puede tener la muestra es de 40 mM.
Por encima de ese valor la conductividad de la muestra es elevada, lo que
provoca el sobrecalentamiento del gel y su dao.
La preparacin de muestras generalmente incluye los siguientes pasos:
1. Extraccin o solubilizacin de protenas.
2. Eliminacin de lpidos mediante extraccin con solvente orgnico.
3. Eliminacin de cidos nucleicos mediante digestin con nucleasas, co-
precipitacin con compuestos bsicos o ultracentrifugacin.
En algunos protocolos se eliminan las sales mediante el cambio del tampn de
la muestra por la solucin de focalizacin o mediante precipitacin total de
protenas con cido tricloroactico en acetona y posterior redisolucin en la
solucin de muestra.
Otro aspecto importante es la calidad del material biolgico. Las lneas celulares
tienen que ser controladas para verificar la ausencia de micoplasmas. Las
muestras provenientes de pacientes necesitan condiciones especiales de
376 CAPTULO 20
conservacin que deben quedar instrumentadas antes del inicio de la manipulacin
mdica. Las muestras provenientes de rganos o de tejidos deben ser liberadas
de materiales colaterales como tejidos de sostn y epitelio vascular. Los materiales
provenientes de biopsias tumorales deben adems liberarse de clulas normales
que hayan sido removidas conjuntamente con el tumor durante la biopsia.
Solubilizacin de protenas. Un procedimiento ideal de solubilizacin debe
cumplir varios requisitos: extraer totalmente las protenas que se desean estudiar,
de modo que su abundancia en la solucin de extraccin refleje su abundancia
relativa en la clula o el organelo, no modificar qumicamente ningn grupo
funcional presente en las protenas (por ejemplo, evitando oxidaciones de
metioninas, intercambios de puentes disulfuro, reacciones de desamidacin, de
isomerizacin entre cido asprtico y cido isoasprtico) e impedir las reacciones
de degradacin provocadas por la liberacin de proteasas al medio [14]. Para la
solubilizacin de protenas se utilizan mezclas de agentes caotrpicos, y
detergentes, a los que se adicionan otros componentes: inhibidores de proteasas,
un agente reductor y anfolinas del rango adecuado. La electroforesis
bidimensional impone requisitos rgidos en cuanto a los agentes solubilizantes
que pueden ser utilizados. Lamentablemente, el SDS, a pesar de su alta capacidad
de solubilizacin de protenas, es incompatible con la focalizacin isoelctrica
debido a su carcter inico, no obstante, se utiliza para la disolucin de los residuos
insolubles en todos los otros agentes pero estos extractos deben diluirse notablemente
con soluciones que contengan detergentes no inicos antes de aplicar a la primera
dimensin. Por igual razn se excluye el cloruro de guanidinio. Los reactivos ms
usados para la preparacin de las soluciones de solubilizacin son [8]:
Agentes caotrpicos: urea 8-9 M, mezclas de urea 5 M + tiourea 2 M
Detergentes: CHAPS 1-4 %, Triton X 100 1-2 %, NP 40 1-2 %, SB 3-10 0.5-1 %,
ASB 14 0.5-1 %
Reductores: DTT 1 %, DTE 1 %, TBP 1 %
Anfolinas del rango adecuado: 1-2 %
Inhibidores de proteasas: Mezcla comercial de inhibidores de proteasas sernicas,
asprticas y metalo-proteasas.
Adicionalmente puede incorporarse glicerol o propanol en una concentracin
de hasta unos 15 %, especialmente recomendados para el anlisis de protenas
bsicas. Recientemente se ha reportado una sustancial mejora en las separaciones
2DE de protenas hidrofbicas (integrales de membrana) mediante la
incorporacin de trifluoroetanol al 50% en la solucin de extraccin y de
rehidratacin [13].
PROTEMICA 377
La seleccin de la primera dimensin. El mtodo original propuesto de modo
independiente por O Farrell [11] y por Klose [10]en 1975 se basa en la separacin
de las protenas por su carga utilizando un gel cilndrico de poliacrilamida al cual
se le incorporan mezclas de anfolitos solubles (compuestos de bajo peso molecular
que poseen carga elctrica), presentes en una mezcla compleja de modo que sus
componentes cubran con sus pK un amplio rango de valores). Con este mtodo y
haciendo uso de la focalizacin en condiciones de no-equilibrio de pH (NEPHGE)
[15] es posible separar en un mismo gel protenas cidas y protenas bsicas
(Figura 20.1). A principios de los aos 80 se introdujo una modificacin en la
primera dimensin, que consisti en la co-polimerizacin de los anfolitos con la
matriz de acrilamida, creando en el gel un gradiente estable de carga [7]. Estos
geles estn disponibles en el mercado (IPG: Immobilized pH Gel).
Seleccin del rango de anlisis. Hay variadas opciones en cuanto al rango de
pI de separacin y la longitud de la separacin (estn disponibles comercialmente
IPG desde 7 cm hasta 24 cm). En una primera etapa frecuentemente se prefiere
realizar un gel bidimensional exploratorio de rango amplio, entre pI 3 y 10 ,
seguido de separacin por tamao en el rango de 14 a 150 kDa utilizando geles
de 12.5 % en la segunda dimensin. Esta primera etapa permite ajustar la
preparacin de la muestra y la cantidad de muestra a aplicar al gel. A continuacin
se selecciona un rango de pI mas estrecho, por ejemplo entre 4 y 7 unidades y
entre 6 y 10 unidades. De esta forma, se obtiene mucha mayor informacin, si
bien el nmero de geles (y el costo en muestra, tiempo y dinero) se duplica.
Cuando se desea incrementar la informacin sobre una regin especifica, se
utilizan separaciones en geles llamados de rango estrecho o zoom. En estos
geles es posible expandir una unidad de punto isoelctrico a lo largo de una
distancia de 18 cm.
Evidentemente, un estudio abarcador del proteoma llevara a realizar una serie
de geles que cubran con una alta resolucin desde pI 3 hasta pI 11, y desde
masas de 2 kDa hasta masas de 500 kDa. Si bien tcnicamente esto es posible,
en la prctica tal estudio resulta excesivamente costoso en muestra, tiempo y
recursos. Generalmente los extractos celulares totales (o las subfracciones
obtenidas) se analizan mediante electroforesis en geles de focalizacin isoelctrica
de rango 3 a 10 o de rango 4 a 7 y 6 a 11. Esta separacin se sigue con una
segunda separacin por tamao en un gel convencional de SDS. El mapa obtenido
tiene fsicamente dos dimensiones. Un gel de alta resolucin en el rango de pI
de 2.5 a 10 y de masas de 15 a 120 kDa permite la resolucin de 5,000 8,000
especies [16] si la deteccin es radiactiva, pero rutinariamente en este sistema
el nmero de especies detectables con tincin con plata es de unas 1500 a 2,000
(Figura 20.1). Es importante recordar que, debido a las caractersticas de la
378 CAPTULO 20
tcnica, las determinaciones de cambios en la expresin de protenas requieren
la realizacin de varias rplicas de geles (para cada muestra tres como mnimo,
pero preferiblemente un nmero mayor de geles). Por todo ello, la estrategia
ms utilizada comprende:
1. La seleccin de uno o de varios compartimientos celulares de inters.
2. La realizacin de subfraccionamiento celular.
3. El anlisis de la expresin diferencial de protenas mediante geles de rango
intermedio (generalmente de tres unidades de pI en 18 cm) seguidas de
separaciones por tamaos entre 14 y 150 kDa.
4. Anlisis de imgenes y anlisis estadstico de los cambios en la expresin.
Muchos de los aspectos que acabamos de discutir no slo son importantes para
las muestras destinadas a electroforesis bidimensional sino tambin para muestras
que se analizan mediante tcnicas no electroforticas, como las basadas en la
cromatografa lquida bidimensional seguida de espectrometra de masas.
EL RANGO DINMICO DE EXPRESIN: UN RETO A LA TECNOLOGA
Se estima que una clula de un organismo superior contiene en un instante de
tiempo unas 5 000 especies diferentes de mARN [3]. De estas 5 000 especies,
unas 4 000 existen en un nmero muy bajo de copias (una o dos molculas por
clula) y dan lugar a protenas poco abundantes o muy escasas. No obstante, se
debe recordar que la abundancia de una protena no slo depende del nmero
de copias de mARN sino tambin, del tiempo de vida de la protena sintetizada
en la clula. Se estima que una clula en un instante contiene en el orden de
mil millones de molculas de protenas, correspondientes a 5 000 secuencias de
mARN presentes. Sin embargo, el 90 % de la masa de protenas esta formado
por unas 100 especies diferentes, mientras que el 10 % restante esta formado
por una enorme diversidad de molculas. Si estimamos que una secuencia de
aminocidos puede dar lugar a unas 20 variantes moleculares o especies,
entonces concluimos que 5 000 mARN diferentes son responsables por unas
100 000 especies moleculares diversas a nivel de protenas [3]. Ese es
precisamente el campo de anlisis de la protemica y por ello han sido necesarias
herramientas muy poderosas para la separacin de especies moleculares que
difieren ligeramente y para su identificacin.
Aqu estamos ante dos problemas: primero, un gran nmero de especies a
resolver, cuantificar e identificar; segundo, un nmero muy pequeo de especies
es responsable de la mayor parte del contenido total de protenas, con lo que
existe un rango dinmico de expresin muy amplio.
PROTEMICA 379
El rango dinmico de expresin representa los rdenes de magnitud (nmero de
copias por clula o por ml de fluido) en los que se mueve la expresin de las
protenas en una clula o fluido fisiolgico [17]. El rango dinmico de expresin
en las protenas celulares es de unos 5-7 rdenes, mientras que en el plasma es
de 10-11 rdenes. Por ejemplo, la concentracin de albmina y la de glucagn
en plasma difieren en 9 rdenes de magnitud. La concentracin de la hemoglobina
es del orden de 10
11
pg/ml, mientras que las interleucinas estn en
concentraciones del orden de 1 a 10 pg/ml [18]. Ciertamente, no existe ningn
mtodo fsico o qumico de anlisis que pueda dar una respuesta lineal a lo largo
de un rango tan amplio de magnitudes. Por tanto, el anlisis de las protenas con
bajo nmero de copias es un reto tecnolgico de la protemica.
Los lmites experimentales del mtodo basado en 2DE estn dados por dos
factores: los limites de lo que podemos detectar en el gel y de lo que podemos
medir por espectrometra de masas. Aproximadamente, ambos coinciden: la
tincin con plata de alta sensibilidad permite ver protenas presentes en el orden
de 1 000 copias por clula, si en el gel se ha aplicado la masa correspondiente a
10
8
a 10
9
clulas [17]. Pero no podemos ver ni identificar protenas expresadas
en un nmero inferior de copias, a menos que primero se lleven a cabo pasos de
prefraccionamiento, encargados de incrementar la concentracin de un grupo
de componentes en la muestra a expensas de la supresin de otros.
PRINCIPALES FORMAS DE ABORDAR LOS PROBLEMAS QUE PLANTEA EL AMPLIO RANGO DINMICO
Este problema, que es esencial para un anlisis abarcador del proteoma celular,
se ha abordado con los siguientes enfoques:
a) Eliminacin selectiva de componentes mayoritarios. Para ello es necesario
que los mtodos sean altamente especficos y no eliminen simultneamente
los componentes minoritarios. Este enfoque est dirigido al estudio de un
subproteoma enriquecido en las especies menos abundantes, tras la
eliminacin de las ms abundantes. Se basa principalmente en series
sucesivas de cromatografas de inmunoafinidad con anticuerpos policlonales
inmovilizados en columnas que retienen las especies mayoritarias.
Recientemente [19] se utiliz una sucesin de 9 pasos de inmunoafinidad
para la preparacin de una muestra de plasma humano. Ello permiti
identificar 3 800 especies moleculares correspondientes a 325 genes diferentes
(es decir, que aproximadamente cada protena aparece como promedio con 11
variantes moleculares resueltas). Algunos de estos sistemas consisten en
una nica columna portadora de 6 tipos de anticuerpos policlonales dirigidos
contra las 6 protenas ms abundantes en el plasma y estn disponibles
comercialmente.
380 CAPTULO 20
b) Fraccionamiento de las protenas totales. Un fraccionamiento celular tpico
consiste en la obtencin de fracciones citoslica, microsomal, mitocondrial y
nuclear [20] (ver Figura 20.2).
El fraccionamiento subcelular por organelos permite concentrar el estudio en
un compartimiento celular de inters para investigar all la expresin de protenas
mucho ms a fondo. Alternativamente puede realizarse un subfraccionamiento
por solubilizacin diferencial (Figura 20.3), que consiste en la extraccin de la
masa celular mediante el uso de agentes solubilizantes cada vez ms enrgicos
[20] . Tras cada incubacin, el material no disuelto se separa por centrifugacin,
y el sobrenadante (fraccin soluble) se colecta por separado. El precipitado
residual se extrae con una solucin de mayor poder solubilizante. Un esquema
tpico consiste en: a) extraccin en TRIS 40 mM pH 11, b) extraccin en urea,
c) extraccin del residuo final en SDS. Recientemente han ganado popularidad
los mtodos de fraccionamiento basados en propiedades fsico-qumicas utilizando
tcnicas mltiples o en serie (por ejemplo, fraccionar por carga elctrica mediante
isoelectroenfoque en solucin, seguido de separacin por hidrofobicidad en
columnas de fase reversa o por tamao en columnas de exclusin molecular).
Estos sistemas generan una gran cantidad de fracciones, cada una de ellas se
convierte en un subproteoma y de hecho en un subproyecto de estudio.
Figura 20.2. Fraccionamiento de clulas en organelos subcelulares.
PROTEMICA 381
c) Utilizacin de tcnicas de muy alta resolucin en electroforesis bidimensional.
Una alternativa es utilizar geles de tipo zoom en la primera dimensin
(separacin por carga). Actualmente existen en el mercado geles comerciales
que expanden una unidad de punto isoelctrico a lo largo de 18 cm. En ellos
es posible aplicar una alta carga de protenas con lo que las especies poco
abundantes se hacen visibles. Ciertamente estos geles permiten ver en todo
detalle una regin del proteoma pero excluyen el resto. Por ello se utilizan
solo cuando se desea estudiar algn aspecto particular que ha sido previamente
explorado con un sistema ms abarcador aunque con menor profundidad.
Por su costo en tiempo, en material biolgico y en recursos, seria irrealizable
intentar estudiar un proteoma utilizando todas las tcnicas de enriquecimiento
mencionadas. Pero las diversas combinaciones de ellas son de gran utilidad
cuando se desea centrar el estudio en una fraccin. Por ejemplo, es posible
estudiar el subproteoma nuclear de una lnea celular, mediante el uso de geles
zoom para analizar el rango de pI 8.0 a 9.0 seguido de separaciones en geles de
tris tricina [22] de segunda dimensin que resuelven especficamente las
protenas de baja talla. Con ello veremos en detalle una parte del proteoma
celular correspondiente a las protenas bsicas de baja talla presentes en la
fraccin nuclear.
Figura 20.3. Fraccionamiento de protenas celulares segn su solubilidad en diferentes soluciones
de extraccin.
382 CAPTULO 20
CROMATOGRAFIA LI QUI DA
Como ya se mencion la electroforesis bidimensional posee algunas limitaciones
para analizar protenas hidrofbicas ya que por su escasa solubilidad estn
subrepresentadas en los mapas electroforticos bidimensionales obtenidos hasta
el momento. Por otra parte, aquellas protenas que poseen puntos isoelctricos
muy cidos o bsicos son difciles de focalizar en la mayora de los geles de
isoelectroenfoque disponibles en el mercado. El amplio rango dinmico es otro
problema no resuelto.
Por tales motivos, en los ltimos aos ha existido la tendencia a trabajar con los
pptidos en vez de las protenas tratando de solucionar las limitaciones sealadas.
La idea consiste en marcar diferencialmente con istopos estables los pptidos
generados por la protelisis de todas las protenas sintetizadas por una clula o
tejido en dos condiciones que se desean estudiar o comparar. Posteriormente,
mediante el anlisis por cromatografa lquida de fase reversa (o combinada
con otro mtodo cromatogrfico) acoplada a la espectrometra de masas se
puede realizar la identificacin de las protenas en las bases de datos de
secuencias. La cuantificacin se logra mediante un anlisis detallado de las
distribuciones isotpicas de los pptidos analizados y as se infiere la expresin
diferencial de las protenas que los contienen.
Aunque la idea parece sencilla, no deja de tener asociada una gran complejidad
pues si bien el trabajo con pptidos puede ser ms fcil en comparacin con las
protenas, no es menos cierto que ya la mezcla de protenas que se deriva de
una clula o tejido de por s es muy compleja por lo que una vez realizada la protelisis
la mezcla de pptidos que se genera debe ser mucho ms compleja an.
Por tales motivos se han empleado propiedades ortogonales para lograr la
separacin de la mezcla de pptidos obtenida. Entre estas propiedades tenemos
la talla, carga, hidrofobicidad, e interaccin biolgica o afinidad. Por lo tanto es
de esperar un sinnmero de posibles combinaciones en la cromatografa
multidimensional pero lo comn entre todas radica en que persiguen un mismo
objetivo: obtener la mejor resolucin posible para posteriormente identificar una
mayor cantidad de protenas en el anlisis por espectrometra de masas.
Entre las combinaciones ms empleadas se encuentra la cromatografa de
intercambio inico con la cromatografa de fase reversa (RP). Particularmente
en esta combinacin la utilizacin de columnas de RP en el segundo paso permite
que la mezcla a su vez sea desalada y pueda ser analizada mediante
espectrometra de masas empleando electronebulizacin (ESI). Tambin se han
reportado otras combinaciones que emplean cromatografas de exclusin por
tamao molecular (SEC) y RP [23]. Raida y colaboradores combinaron la
PROTEMICA 383
cromatografa de intercambio catinico (SCX) con RP-HPLC acoplada al
espectrmetro de masas para medir las masas de alrededor de 3000 pptidos
de un hemofiltrado humano [24]. Aunque los dos pasos cromatogrficos fueron
desarrollados en experimentos diferentes, este estudio demostr el elevado poder
resolutivo de la cromatografa multidimensional y la espectrometra de masas
para el fraccionamiento y anlisis de un gran nmero de pptidos.
Mediante la combinacin de intercambio catinico y RP-HPLC se ha publicado
quizs el ms eficiente mtodo de identificacin de protenas a partir de mezclas
complejas de pptidos. Esta tecnologa se conoce como MudPIT
(Multimensional Protein Identification Technology) [25,26]. En esta
metodologa se emplean sales voltiles para eluir por pasos los pptidos retenidos
en una matriz de intercambio catinico y separarlos posteriormente en una
columna de RP-HPLC acoplado a un espectrmetro de masas. Con la aplicacin
de esta metodologa se logr identificar protenas muy hidrofbicas con mltiples
regiones transmembranarias, protenas de pI superiores a 12 e inferiores a 4 y
protenas que el uso de codones (Codon adaptation index) de su gen deben
ser muy minoritarias.
Otros grupos han desarrollado procedimientos SCX-RP para una gran variedad
de aplicaciones [27,28]. Tambin se ha empleado la electroforesis capilar (CE)
acoplada a la cromatografa de fase reversa para separar pptidos originados
por la digestin de una protena [29] y existen reportes de cromatografas
tridimensionales
La inclusin de una cromatografa de afinidad en uno de los pasos de separacin
multidimensional de pptidos ha sido muy til pues permite retener selectivamente
pptidos o protenas basndose en interacciones especficas lo que simplifica
considerablemente la mezcla compleja de pptidos proteolticos. As por ejemplo,
en la identificacin de la fosforilacin, que es una de las modificaciones
postraduccionales ms importantes por estar involucrada prcticamente en todos
los mecanismos de transduccin de seales, las columnas de IMAC-Fe
3+
han
permitido el aislamiento de los fosfopptidos y el estudio del fosfoproteoma de
varios organismos [30-32].
La utilizacin de columnas con lectinas inmovilizadas ha permitido la captura
selectiva de glicopptidos que facilita el estudio del glicoma de los organismos
[33]. Tambin se han empleado otras variantes que incluye la derivatizacin
qumica de aminocidos para que, mediante el empleo de una cromatografa de
afinidad, sea posible el aislamiento selectivo de los pptidos modificados dentro
de todos los pptidos proteolticos generados.
Uno de los ejemplos ms creativos dirigidos a realizar protemica sin emplear
la electroforesis bidimensional es la metodologa conocida como ICAT (isotope-
384 CAPTULO 20
coded affinity tags) [34]. En esta metodologa se procede a la derivatizacin
qumica de los pptidos con un reactivo conocido tambin como ICAT que posee
un extremo que reacciona especficamente con los residuos de cistenas libres
y en el otro extremo posee biotina. Los pptidos marcados (que contienen
cistena) se aislan selectivamente, mediante una cromatografa de afinidad con
avidina, los pptidos que contienen residuos de cistenas modificadas. Este paso
de cromatografa de afinidad es esencial para simplificar las mezclas complejas
de pptidos e identificar protenas minoritarias, que de analizarse la mezcla de
pptidos cruda no pudieran ser identificadas. Adicionalmente el reactivo posee
una regin intermedia que contiene 4 grupos metilenos, con un total de 8
hidrgenos, que pueden estar sustituidos por deuterio. De esta forma se tienen
realmente dos reactivos, el ligero (con H) y el pesado (con D). La cuantificacin
de la expresin diferencial de protenas se logra al marcar una condicin con el
reactivo ligero y la segunda condicin con el reactivo pesado
Ambos extremos del reactivo ICAT se encuentran enlazados por un brazo
espaciador que en una de las variantes el ICAT ligero posee los istopos naturales
en cambio el ICAT pesado posee 8 tomos de deuterio. Cada una de las
condiciones se marcan de manera independiente isotpicamente con cada uno
de reactivos ICATy Ligeros y despus los eluatos de afinidad se mezclan en
cantidades equivalentes y la cuantificacin se realiza al determinar la intensidad
relativa de las especies ligera y pesada de los pptidos analizados por
espectrometra de masas.
A esta metodologa se le sealan las siguientes limitaciones:
1. Las protenas que no contienen residuos de cistenas quedan excluidas del
anlisis.
2. La masa molecular del reactivo ICAT, en ocasiones comparable con la masa
molecular del pptido a identificar puede causar interferencias durante la
ionizacin de los pptidos y en la interpretacin de los espectros de masas.
3. La cuantificacin puede aportar resultados errneos pues durante la
separacin por fase reversa los pptidos marcados con ICAT ligero pueden
eluir significativamente separados de los marcados con la versin pesada.
Recientemente se han introducido nuevas versiones del reactivos ICAT para
tratar de solucionar estos problemas. Por ejemplo el reactivo en fase slida
para disminuir las prdidas en la cromatografa de afinidad y se ha sustituido el
marcaje con deuterio por
13
C para evitar las diferencias en el tiempo de retencin
en RP-HPLC de los pptidos derivatizados con el ICAT ligero y pesado con lo
que se minimizan los posibles errores en la cuantificacin. Esta metodologa
tiene el gran mrito de haber sido la pionera en proponer una estrategia bien
PROTEMICA 385
estructurada y concebida para explotar las potencialidades de la espectrometra
de masas y realizar los estudios de protemica sin la necesidad del empleo de la
electroforesis bidimensional.
Gevaert y colaboradores desarrollaron un mtodo diagonal que emplea dos pasos
consecutivos de cromatografa de fase reversa, denominado COFRADIC
(combined fractional diagonal chromatography) [35]. Despus de obtener
mltiples fracciones de una mezcla compleja de pptidos mediante cromatografa
de fase reversa, a cada una de las fracciones se le realiza un tratamiento oxidativo
que transforma selectivamente a los pptidos que contienen metioninas en
metioninas sulfxido, que los convierten en especies ms hidroflicas que los
pptidos originales. Se repite la separacin por RP-HPLC con las fracciones
despus de oxidadas. Solo las fracciones que redujeron el tiempo de retencin
(y por tanto contienen las metioninas oxidadas) son colectadas y analizadas por
espectrometra de masas. De esta manera, de la mezcla compleja inicial de
pptidos solo se analizan por espectrometra de masas aquellos que contienen
residuos de metionina en su secuencia. Aunque en este reporte no se refieren
trminos cuantitativos, se sugiere que el empleo del marcaje isotpico estable
con
18
O pudiera ser utilizado para que esta metodologa suministre informacin
cuantitativa sobre la expresin diferencial de protenas. En este trabajo fueron
seleccionados e identificados pptidos (que contienen metionina) provenientes
de 800 protenas diferentes.
Espectrometria de masas (MS)
La espectrometra de masas es la herramienta empleada en los estudios de
protemica para la identificacin de las protenas. Su principio se asemeja a lo
que ocurre cuando un haz luminoso incide sobre un prisma: la radiacin
electromagntica es descompuesta o separada de acuerdo a las diferentes
longitudes de onda. En un espectrmetro de masas un haz de iones es separado
de acuerdo a la relacin masa/carga: m/z.
En un espectrmetro de masas hay dos elementos esenciales: la fuente de
ionizacin, donde son producidos los iones al suministrarle energa a la muestra
que se estudia y el analizador (un campo elctrico, un campo magntico, de
tiempo de vuelo o una combinacin de ellos), donde los iones son separados de
acuerdo a la relacin masa/carga (m/z). La energa suministrada puede ser
suficiente no solamente para ionizar la molcula y obtener el llamado in molecular
(la molcula intacta pero con una carga positiva o negativa) sino tambin para
provocar la fragmentacin de la molcula dando lugar a iones fragmentos. Los
iones producidos son caractersticos de un determinado compuesto qumico y por
tanto es posible su identificacin a partir del espectro de masas.
386 CAPTULO 20
Aunque la espectrometra de masas ya era una tcnica establecida para la
caracterizacin de los compuestos orgnicos desde finales de la dcada de los
aos 50, los mtodos de ionizacin disponibles hasta 1981 no eran aplicables a
las llamadas biomolculas (pptidos, protenas, carbohidratos y cidos nucleicos)
por cuanto exigan la evaporacin previa de la muestra. Por esta razn, para
estudiar los compuestos con elevados puntos de fusin o que se descomponen
con la temperatura haba que obtener derivados voltiles y en el caso de que
esto no fuera posible, simplemente no podan ser estudiados.
En 1981, Michael Barber y Richard Bordoli, de la Universidad de Manchester
publican la aplicacin de un mtodo de ionizacin suave, el FAB (fast atom
bombardment) al estudio de protenas [36]. El mtodo, aunque ya no se emplea
debido a su baja eficiencia de ionizacin, fue un resultado de gran importancia
pues permiti por primera vez la medicin de la masa molecular de los pptidos
y la determinacin de la secuencia sin necesidad de obtener un derivado voltil.
En 1989, John Fenn publica [37] la aplicacin de la ionizacin por electronebulizacin
(electrospray ionization, ESI) al estudio de pptidos, protenas y otras
biomolculas. Un ao antes Koichi Tanaka haba publicado un nuevo mtodo de
ionizacin conocido como MALDI (Matrix Assisted Laser Desorption
Ionization) [38]. Poco despus Michael Karas y Franz Hillenkamp publican varias
aplicaciones del MALDI en el campo de las protenas [39]. Fenn y Tanaka
recibieron el premio Nobel de Qumica en el 2002 por estos descubrimientos.
Estos dos mtodos revolucionaron completamente la aplicacin de la
espectrometra de masas a las biomolculas y en apenas diez aos la
espectrometra de masas se convirti en el mtodo ms poderoso para el anlisis
y la caracterizacin de pptidos y protenas.
El MALDI emplea un lser ultravioleta para suministrar la energa capaz de
ionizar el compuesto. Previamente la muestra es mezclada ntimamente con la
matriz. La matriz es un elemento muy importante y est constituida por
compuestos insaturados (cido sinapnico, cido 2,5 dihidroxibenzoico (DHB),
cido 4-hidroxi--cianocinmico, etc.) capaces de absorber energa a la longitud
de onda del lser. De esta forma la matriz absorbe la mayor parte de la energa
suministrada que de otra forma destruira la muestra totalmente y facilita la
ionizacin del compuesto que se desea analizar.
El ESI se haba desarrollado como un procedimiento para la interfase entre la
cromatografa lquida y la espectrometra de masas [40]. As la muestra es
transportada en solucin (puede ser desde un cromatgrafo lquido) a travs de
un capilar en cuyo extremo se encuentra un alto voltaje (entre 3-4 kV). De esta
forma se produce una nebulizacin de pequeas gotas formadas por el solvente
PROTEMICA 387
y la muestra y que portan un nmero considerable de cargas elctricas. El
solvente es eliminado con la ayuda de una corriente de gas (usualmente nitrgeno)
y finalmente queda la muestra ionizada con varias cargas.
Tanto el MALDI como el ESI son mtodos de ionizacin suave, esto es, la
energa suministrada a la muestra es relativamente baja, y los compuestos son
ionizados pero no ocurre la fragmentacin de las molculas como en el caso de
de la ionizacin por impacto electrnico, el mtodo de ionizacin ms usado
para el estudio de molculas orgnicas.
En ambos mtodos de ionizacin, MALDI y ESI, un pptido adquiere una carga
positiva o negativa por adicin o eliminacin de protones respectivamente, dando
lugar a los iones pseudomoleculares que corresponden a la masa molecular del
pptido ms (o menos en el caso de iones negativos) la masa de uno o varios
protones. Si se adiciona un protn la carga del pptido ser unitaria, y si se adicionan
varios protones se obtendrn iones multicargados. En el MALDI los iones son
fundamentalmente monocargados mientras que en el ESI los iones son usualmente
multicargados. En principio es posible estudiar los iones positivos o negativos
aunque es mucho ms frecuente la espectrometra de masas de iones positivos.
Al introducir una mezcla de pptidos en el espectrmetro de masas usando
MALDI o ESI como mtodo de ionizacin se obtiene un grupo de seales que
corresponden a los iones moleculares de cada uno de los pptidos, por cuanto
no se producen fragmentaciones de las molculas.
SECUENCIACIN DE PPTIDOS POR ESPECTROMETRA DE MASAS
Al no producirse fragmentaciones durante la ionizacin por MALDI o ESI se
obtiene solamente informacin sobre la masa molecular de un pptido pero no
es posible obtener informacin de su secuencia. Para lograr este propsito se
emplea un proceso llamado Disociacin Inducida por Colisiones (DIC) o
Disociacin Activada por Colisiones (DAC). Este consiste en introducir el haz
de iones de la muestra en una regin que contiene un gas qumicamente inerte
(usualmente argn), para que por las colisiones generadas entre ambos, una
parte de la energa cintica que poseen las molculas se transforme en energa
vibracional de sus enlaces y ocasione la disociacin en dependencia de su
fortaleza 41]. Aunque la eficiencia de la fragmentacin de un pptido est muy
influenciada por las caractersticas de su secuencia, se ha observado que tambin
depende del gas de colisin que se emplee [42].
La nomenclatura aceptada por los especialistas en este campo para clasificar los
iones fragmentos de un pptido es la que propusieron Roepstorff y Fohlmann [43].
Se plantea que la ruptura del esqueleto carbonado de un pptido puede originar
seis tipos diferentes de fragmentaciones (a
n
, b
n
, c
n
, x
n
, y
n
, z
n
) que se clasifican
388 CAPTULO 20
en series del extremo N-terminal (a
n
, b
n
, c
n
) o series del extremo C-terminal (x
n
,
y
n
, z
n
) en dependencia de cul de los dos extremos del pptido original se
conservan en sus estructuras. El subndice que acompaa cada tipo de
fragmentacin se corresponde con la cantidad de residuos aminoacdicos que
posee el in fragmento (ver Figura 20.4).
Aunque las fragmentaciones de las cadenas laterales son de gran importancia
para la diferenciacin de aminocidos que poseen igual masa (aminocidos
isobricos) y suministran ms informacin estructural, es necesario destacar
que en protemica esta fragmentaciones no resultan de utilidad para la
identificacin de las protenas pues la mayora de los espectrmetros que se
emplean actualmente realizan la disociacin inducida por colisiones de los pptidos
en un rgimen de baja energa y las fragmentaciones de las cadenas laterales estn
ausentes del espectro de masas. Sin embargo, el desarrollo reciente de los
Figura 20.4. Nomenclatura de las fragmentaciones que se obtienen por Disociacin Activada
por Colisiones en experimentos MS/MS. Los fragmentos a, b y c contienen el
extremo N-terminal y los fragmentos x, y y z conservan el extremo C-terminal. Los
subndices que acompaa cada tipo de fragmentacin se corresponden con la
cantidad de residuos aminoacdicos en el in fragmento. Ntese que los fragmentos
b y y se obtienen por ruptura del enlace peptdico y por tanto son complementarios
en la informacin sobre la secuencia. Son adems, en general, los iones mas intensos
en el espectro MS/MS.
PROTEMICA 389
espectrmetros de masas MALDI-TOF/TOF [44,45] pudiera vislumbrar una
aplicacin en el campo de la protemica al observarse fragmentaciones de las cadenas
laterales que suministran mayor cantidad de informacin estructural. Adems se
obtienen espectros de masas con muy buena calidad en el rango de los femtomoles.
La abundancia relativa de estas series N y C-terminales en el espectro est
determinada generalmente por la posicin del residuo bsico en la secuencia. As
por ejemplo, cuando residuos de Arginina estn ubicados en el extremo N o en el
extremo C del pptido, abundan en el espectro las series N o C-terminal
respectivamente. Este fenmeno es conocido en la literatura inglesa como charge
remote fragmentation [46] y plantea que la fragmentacin ocurre a lo largo de la
cadena peptdica inducida por la carga a pesar de que sta se mantiene en un
lugar fijo (alejado en muchos casos), presumiblemente en la posicin en que est
ubicado el residuo bsico. Por este motivo es usual observar que los espectros de
masas de los pptidos trpticos son abundantes en iones C-terminales (series y
n
).
Para secuenciar un pptido, cada uno de los iones fragmentos observados en el
espectro se debe clasificar de acuerdo a la nomenclatura antes mencionada,
pues de esta manera las diferencias en masas de series consecutivas de un
mismo tipo (b
5
, b
4
, b
3
, b
2
) pueden ser asignadas a uno de los veinte aminocidos
ms comunes y as obtener la secuencia peptdica. Por otra parte, un pptido se
puede secuenciar simultneamente a partir de sus dos extremos con un solo
espectro pues la informacin suministrada por las series N y C-terminales son
complementarias. Se obtienen secuencias parciales desde ambos extremos y al
superponerlas se determina una secuencia altamente confiable (ver Figura 20.5).
Figura 20.5. Esquema de un experimento MS/MS. La mezcla de pptidos proteolticos es
ionizada y se introduce en el primer analizador, donde se selecciona uno de los
pptidos que pasa a la cmara de colisiones. Aqu ocurre la interaccin con el gas
neutro (Argn) y se producen las fragmentaciones que son medidas en el segundo
analizador para obtener el espectro MS/MS y deducir la secuencia del pptido.
390 CAPTULO 20
SECUENCI ACI N DE UNA MEZCLA DE PPTI DOS. ESPECTROS MS/MS
Lo referido en el epgrafe anterior implica que debemos tener un pptido puro,
pues si tuviramos una mezcla de pptidos se produciran fragmentos de todos
ellos y sera imposible la interpretacin de los espectros. Por esta razn se
requiere aislar o seleccionar un pptido determinado para proceder a su
secuenciacin.
Esto es posible mediante la espectrometra de masas en tndem o MS/MS que
consiste en dos analizadores separados por la cmara de colisiones donde el
gas neutro provoca las fragmentaciones (ver Figura 20.6).
Cuando se introduce una mezcla de pptidos en la fuente de ionizacin, se
produce la ionizacin de todos y al penetrar en el primer analizador es posible
seleccionar solo uno de ellos, los restantes simplemente chocan con las paredes
del analizador. El pptido seleccionado pasa a la cmara de colisiones donde se
Figura 20.6. Espectro MS/MS del pptido VLFSSDGGVVK. Puede observarse que la mayora de
los iones presentes corresponden a los fragmentos y, algo frecuente en los espectros de
pptidos trpticos que poseen un aminocido bsico en el extremo C-terminal y por
tanto conservan la carga en ese residuo. En este ejemplo es posible deducir con relativa
facilidad la secuencia completa del pptido, algo que no siempre ocurre.
PROTEMICA 391
producen los fragmentos que son posteriormente analizados en el segundo
analizador con lo que se obtiene la secuencia del pptido de forma similar a la
descrita en el epgrafe anterior.
Una vez concluida esta operacin para un pptido, se selecciona otro pptido y se
procede de forma similar. Este procedimiento es rpido y automtico por lo que
se pueden medir los espectros MS/MS de varios pptidos presentes en una mezcla
en un tiempo relativamente breve y obtener sus secuencias. Esta posibilidad tcnica
tambin tiene otra repercusin importante en protemica y es que las protenas
que se van a identificar no tienen que estar totalmente puras. Es posible identificar
varias protenas en una mezcla como ocurre en ocasiones en una banda de
electroforesis donde puede existir ms de una protena.
MODIFICACIONES POST-TRADUCCIONALES
Como hemos la espectrometra de masas permite identificar una protena, y
secuenciarla lo que resulta de gran importancia aunque hay otro aspecto muy
relevante de esta tcnica que es su capacidad para identificar y localizar las
modificaciones post-traduccionales. Se conocen ms de 200 tipos de
modificaciones. La espectrometra de masas es prcticamente el nico mtodo
capaz de detectarlas y determinar su ubicacin en la cadena de aminocidos.
De la descripcin del procedimiento de secuenciacin por espectrometra de
masas resulta evidente que es posible detectar cualquier posible modificacin
por el corrimiento de masa que provoca en el aminocido donde se encuentra
localizada. Cuando al analizar un espectro MS/MS para secuenciar un pptido,
el valor de masa obtenido para alguna de las fragmentaciones no se corresponde
con ninguno de los valores de masas de los veinte aminocidos ms comunes,
es muy probable que sea debido a la presencia de una modificacin post
traduccional. Con el auxilio de tablas que reportan los corrimientos de masa
provocados por las diferentes modificaciones se puede identificar el aminocido
y la modificacin correspondiente. En la Tabla 20.2 se muestran los corrimientos
esperados para algunas de las modificaciones mas comunes. Pueden encontrarse
tablas muy completas en: http://www.abrf.org/index.cfm/dm.home o http://
www.unimod.org/
Tabla 20.2. Modificaciones post traduccionales ms comunes
m m
392 CAPTULO 20
Es conocida la repercusin de estas modificaciones en las funciones biolgicas
de las protenas, de ah la importancia de contar con un mtodo capaz de
identificarlas. Sin embargo, an es difcil poder cuantificar la fraccin de molculas
de una protena que se encuentra modificada en un sitio dado y establecer si
esa modificacin es transitoria.
ESTRATEGIAS PARA LA IDENTIFICACIN DE LAS PROTENAS
Como ya fue mencionado anteriormente (Tabla 20.1), las protenas separadas
por electroforesis bidimensional son digeridas con una enzima, usualmente tripsina,
con lo que se obtiene una mezcla de pptidos. Los pptidos son extrados del gel
e introducidos directamente en el espectrmetro de masas para su identificacin.
En la actualidad existen tres estrategias fundamentales para la identificacin de protenas
basadas en la informacin primaria suministrada por la espectrometra de masas:
La primera de las estrategias para la identificacin de protenas en las bases de
datos se basa en que la digestin proteoltica de una protena con una proteasa
altamente especfica, origina de manera reproducible un conjunto de pptidos
que es caracterstico para cada una de las protenas.
Por esta razn, es posible predecir mediante una digestin in silico el conjunto
de pptidos que se debe generar mediante el tratamiento proteoltico especfico
de cada una de las protenas almacenadas en las bases de datos de secuencias
y por lo tanto se puede calcular tericamente las masas moleculares de cada
uno de los pptidos esperados.
Tabla 20.2 (continuacin).
PROTEMICA 393
La masa molecular de cada uno de los pptidos proteolticos se puede determinar
experimentalmente mediante ESI-MS o MALDI-MS. Esta informacin se
conoce como huella de masas de los pptidos de una protena o peptide mass
fingerprint (PMF). Por tanto, la protena analizada puede ser identificada
exitosamente cuando se produce una correspondencia entre los valores
experimentales de las masas moleculares de cada uno de sus pptidos con los
valores de masas tericas esperadas para una de las protenas existentes en las
bases de datos.
Con la instrumentacin disponible en la actualidad la medicin de las masas
moleculares puede realizarse de manera rutinaria con un error inferior a los
50 ppm por lo que las identificaciones por esta metodologa son muy confiables
y es previsible que con la introduccin masiva de espectrmetros ms acuciosos
la calidad de las identificaciones sea an superior pues est directamente
relacionada con la exactitud de la medicin de las masas moleculares de los
pptidos proteolticos [47,48].
Hoy en da existen varios programas accesibles va Internet que brindan el
servicio de identificacin de protenas en lnea utilizando la estrategia del PMF
y entre los ms empleados se encuentra el MASCOT, (http://
www.matrixscience.com/cgi/search_ form.pl?FORMVER=2&SEARCH=PMF)
[49], el ProFound (http://129.85.19.192/profound_bin/WebProFound.exe) [50]
y el MS-Fit (http://prospector.ucsf.edu/ucsfhtml4.0/msfit.htm). De todas las
estrategias para la identificacin de protenas en las bases de datos de secuencia
sta fue la que inicialmente gan ms popularidad, debido a su gran sencillez
por ello, numerosos grupos de trabajo la implementaron en sus laboratorios y
desarrollaron los programas de cmputo apropiados para este propsito [51,52]
(ver Figura 20.7).
Sin embargo, cuando se digieren protenas poco abundantes en la banda de gel,
incluso empleando los protocolos optimizados, con frecuencia se obtienen bajos
recobrados de los pptidos proteolticos y es frecuente encontrar que solo
aparezcan las seales de masas correspondientes a uno, dos o tres pptidos
proteolticos. En estos casos la estrategia de PMF puede brindar resultados
ambiguos o identificaciones errneas. En tales situaciones es necesario obtener
informacin de la secuencia de los pptidos analizados.
Esta limitante fue resuelta con el surgimiento de otra estrategia conocida como
etiqueta de secuencia (sequence tag) para la identificacin de protenas. Ella
plantea que para lograr la identificacin solo es necesario extraer una pequea
secuencia parcial (3 a 4 aminocidos) del espectro ESI-MS/MS de un pptido
[53]. Este mtodo revolucion la identificacin de las protenas a partir de la
secuencia deducida de los espectros de masas por cuanto se requera una
394 CAPTULO 20
interpretacin exhaustiva del espectro MS/MS para obtener la secuencia
aminoacdica lo ms completa posible de algunos de los pptidos proteolticos
para poder identificar la protena correspondiente. El procedimiento del sequence
tag es particularmente til en los espectros ESI-MSMS de los pptidos trpticos
pues esa pequea secuencia parcial es muy fcil de extraer pues la regin de
mayor masa es muy limpia en cuanto a la relacin seal/ruido y es rica en los
fragmentos y
n
(el aminocido bsico se conserva en el C-terminal).
Aunque el mtodo es muy confiable y hay programas que extraen de manera
automtica la secuencia parcial a partir de los espectros ESI-MSMS, en algunos
casos se requiere de la intervencin del especialista, pues el xito de la
identificacin se basa en una correcta interpretacin de espectros para extraer
la secuencia parcial.
Figura 20.7. Pasos principales en la identificacin de protenas mediante la huella de masas de
los pptidos de una protena (peptide mass fingerprint). 1: las protenas se separan
en un gel bidimensional. Las protenas de inters se seccionan del gel y se digieren
con tripsina. 2. Los pptidos procedentes de la digestin trptica se analizan por
espectrometra de masas, en este caso usando la tcnica de ionizacin conocida
como MALDI. 3. Se obtienen las masas moleculares de los pptidos trpticos
obtenidos en la digestin. 4. Los valores de masas obtenidos experimentalmente se
comparan con las digestiones tericas existentes en las bases de datos de protenas
y que son accesibles va Internet. Se obtiene el resultado con la identificacin de la
protena y una evaluacin de la confiabilidad de la identificacin.
PROTEMICA 395
La ltima de las estrategias pretende minimizar la intervencin del especialista
en la identificacin de las protenas en las bases de datos de secuencias [54,55].
Esta estrategia se conoce como huella de masas del espectro MS/MS y se basa
en que cada pptido que se fragmenta mediante un proceso de disociacin
inducida por colisiones produce un espectro de iones fragmentos (MS/MS), que
es muy caracterstico de su secuencia y que lo diferencia del resto de los pptidos
almacenados en las bases de datos.
El espectro MS/MS de un pptido est mayoritariamente representado por
fragmentos originados por la ruptura del enlace peptdico (y
n
o b
n
). Si la
secuencia de la protena que contiene al pptido se conoce, es posible predecir
las masas de los fragmentos inicos que se originarn. Por ello, el programa
basa su identificacin en buscar primeramente el conjunto de todos los pptidos
(dentro de las protenas en las bases de datos) que, originados por un corte
especfico de la proteasa empleada, coincidan con la masa molecular del pptido
que se analiza. Posteriormente, a cada uno de los pptidos que posean esa
caracterstica se le calculan las masas moleculares de los iones fragmentos
posibles y se comparan con las masas moleculares de los fragmentos obtenidos
experimentalmente en el espectro MS/MS. Se selecciona el pptido con mejor
coincidencia y as queda identificada la protena (ver Figura 20.8).
Figura 20.8. Resumen de las Estrategias de Identificacin de Protenas. Las 3 principales estrategias
son: 1. Huella de masas de la protena. Se obtiene el espectro de masas de la mezcla
de pptidos proteolticos. Los valores de las masas obtenidos se comparan con las
digestiones tericas de las protenas en las bases de datos para la identificacin. 2.
Etiqueta de secuencia. Requiere de espectros MS/MS. Se seleccionan uno o varios
pptidos, se obtiene el espectro MS/MS y se determina una secuencia parcial. Es
suficiente 3-4 residuos para identificar la protena en las bases de datos. 3. Huella de
masas MS/MS. Igualmente requiere del uso de MS/MS pero a diferencia del anterior
no es necesaria la determinacin de una secuencia parcial. Se basa en que los iones
fragmentos de un pptido son caractersticos y por tanto basta para encontrar un
pptido idntico en las bases de datos e identificar la protena correspondiente.
396 CAPTULO 20
Resulta evidente que para todos estos programas mencionados es indispensable
disponer de la secuencia de las protenas en las bases de datos para una correcta
identificacin.
Particularmente para la identificacin de protenas que pertenezcan a un
organismo de genoma desconocido solo se podr obtener un resultado exitoso,
mediante la estrategia de PMF, si la protena de inters comparte una identidad
de secuencia elevada con respecto a alguna de las protenas reportadas en las
bases de datos. Mientras menor sea la identidad de secuencia, menos confiable
ser la identificacin realizada.
Si la similitud de secuencia es muy baja o si la secuencia del gen no es conocida
entonces los pptidos trpticos tienen que ser secuenciados completamente a
partir de la interpretacin manual o automtica de los espectros MS/MS de
cada pptido. La identificacin se realiza mediante el alineamiento de las
secuencias determinadas experimentalmente contra bases de datos de secuencias
conocidas, para encontrar secuencias similares. No obstante, si la secuencia de
la protena en cuestin no es muy similar a las reportadas en las bases de datos
esta estrategia puede fallar. Esto es debido a que es poco probable que la
secuencia de genes de una especie sea idntica a la otra y las sustituciones de
nucletidos pueden provocar sustituciones de aminocidos que implican cambios
en las masas de los pptidos analizados y por tanto, repercute negativamente en
la identificacin.
Los programas de alineamiento de secuencias de protenas y genes ms
empleados son el BLAST www.ncbi.nlm.nih.gov/blast y el FASTA
www.ebi.ac.uk/searches/fasta.html. La identificacin a travs de estos
programas resulta difcil, ya que ambos algoritmos se han optimizado para
comparar secuencias de protenas y nucletidos de mayor longitud que los
pptidos secuenciados por espectrometra de masas. Por otro lado, la
espectrometra de masas no permite diferenciar aminocidos isobricos ya que
presentan masas muy similares (Lys y Gln) o idnticas (Leu e Ile) y la calidad
del alineamiento puede estar determinada por cul aminocido de los antes
mencionados se introduzca en la secuencia a alinear ya que estos programas
contienen una matriz diferente para cada uno.
El auge alcanzado en la aplicacin de la espectrometra de masas a la
secuenciacin de protenas ha motivado que los programas de alineamientos
hayan sido recientemente modificados para adaptarlos al alineamiento ptimo
de secuencias cortas de pptidos. Particularmente, el FASTA modificado (FASTS)
[56] posee an una limitante pues las bsquedas son lentas y la puntuacin final
de los envos depende no slo del nmero de pptidos sino que disminuye con el
nmero de secuencias de pptidos en cada solicitud enviada.
PROTEMICA 397
Shevchenko et al., [57,58] propusieron el programa BLAST optimizado para
anlisis de pptidos secuenciados por espectrometra de masas (MS BLAST).
ste se encuentra disponible mediante un servicio web http://dove.embl-
heidelberg.de/Blast2. A diferencia del BLAST y el FASTA, el MS BLAST
permite introducir algunas modificaciones a los pptidos secuenciados que
aumentan la confiabilidad de la identificacin, como por ejemplo las puntuaciones
individuales para los aminocidos isobricos (Leu/Ile y Gln/Lys) son sustituidas
por sus valores promedios y as la puntuacin del pptido T-S-L-V-K-M es
igual a la del pptido T-S-I-V-G-M).
En marzo del 2003 surgi una nueva alternativa para la identificacin eficiente
de pptidos provenientes de organismos de genoma desconocido. Esta
herramienta es la secuenciacin mediante MultiTag [59] que constituye una
versin modificada de la estrategia de identificacin mediante etiqueta de
secuencia (sequence tag). sta permite identificar protenas de muy baja
abundancia y de las que slo se pueden secuenciar de tres a cuatro aminocidos,
cuya identificacin no sera confiable por MS BLAST.
APLICACIONES DE LA PROTEMICA
Las mltiples aplicaciones de estas tcnicas pueden agruparse en dos categoras
principales:
1. Caracterizacin del proteoma de un organismo. El propsito de este estudio
es la identificacin del mayor nmero de protenas expresadas por un
organismo en una condicin biolgica particular. En el caso de organismos
unicelulares o de clulas en cultivo, muchos trabajos se han propuesto la
separacin y la identificacin de protenas en preparaciones de protenas
totales y ya existen mapas en bases de datos para numerosos organismos.
Sin embargo, para lograr un nivel superior de informacin se prefiere
descomponer el estudio del proteoma en el estudio de subproteomas
correspondientes a organelos subcelulares (Figura 20.9). Actualmente la
Organizacin del Proteoma Humano (HUPO) tiene en curso 3 proyectos
internacionales destinados a la construccin de los primeros mapas
protemicos de rganos o tejidos. Estos son: cerebro, hgado y plasma.
2. Protemica Comparativa (Figura 20.10): consiste en evaluar los cambios en
la expresin de protenas de un organismo sometido a dos o varias condiciones
biolgicas diferentes, generalmente una de ellas es una condicin control
que se utiliza como referencia de la expresin de protenas en condiciones
normales. Este tipo de trabajo suministra informacin a nivel molecular de
los cambios causados por la accin de un agente externo (por ejemplo un
medicamento), por cambios en las condiciones de cultivo, las diferencias
398 CAPTULO 20
entre una lnea celular normal y una tumoral, la evaluacin de los cambios
producidos por un agente infeccioso, el desarrollo de los mecanismos de resistencia
a quimioteraputicos o antimicrobianos. Este tipo de investigacin es de alto
valor en ciencias biomdicas. Para los trabajos de protemica comparativa es
necesario disponer de un diseo experimental cuidadosamente planificado. Aqu
resulta de gran utilidad la existencia de una hiptesis previa que oriente la bsqueda
hacia determinado tipo de protenas que pueden ser seguidas por inmunodeteccin
con anticuerpos especficos o que se suponen localizadas esencialmente en un
organelo subcelular . Por ejemplo, algunos proyectos se orientan especficamente
hacia la identificacin de cambios en los patrones de fosforilacin de protenas.
En este caso, la deteccin del subconjunto de protenas fosforiladas puede
facilitarse mediante el uso de anticuerpos especficos.
Figura 20.9. Confeccin de un mapa bidimensional anotado. Como resultado de las identificaciones
efectuadas por espectrometra de masas, el mapa bidimensional de protenas se
enriquece con abundante informacin que incluye la identificacin de la naturaleza
de las protenas, el punto isoelctrico y la masa experimental y terica, y las
propiedades reportadas anteriormente en la literatura.
PROTEMICA 399
3. Interaccin de Protenas. En los ltimos aos ha quedado evidenciada la
importancia de identificar las interacciones entre protenas y de protenas
con otras molculas. En varias publicaciones se han reportado los resultados
de aislamiento de complejos de protenas y la posterior identificacin de las
protenas componentes. Estos resultados contribuyen significativamente al
establecimiento de mapas de interacciones y al esclarecimiento del mecanismo
de determinadas funciones biolgicas.
Es posible predecir que las herramientas que se emplean en protemica se irn
perfeccionando e incluso aparecern nuevos procedimientos y equipos que
solucionarn las principales limitaciones actuales. Sin lugar a dudas la protemica
fortalecer su posicin actual en las investigaciones mdicas, farmacuticas,
agrcolas y en otros campos y se multiplicarn sus aplicaciones.
Figura 20.10. Protemica comparativa. El esquema resume los pasos principales que permiten
la comparacin de la expresin de protenas en dos condiciones biolgicas y la
consecuente identificacin de los cambios.
400 CAPTULO 20
REFERENCIAS
1. Wasinger VC, Cordwell SJ, Cerpa-Poljak A, Yan JX, Gooley AA, Wilkins MR, Duncan
MW, Harris R, Williams KL, Humphery-Smith I. Progress with gene-product mapping of
Mycoplasma genitalium. Electrophoresis. 1995, 16:1090-1094.
2. Humphery-Smith I, Cordwell SJ, Blackstock WP. Proteome research: Complementarity and
limitations with respect to the RNA and DNA worlds. Electrophoresis I, 1997, 18, 1217-
1242.
3. Kettman JR, Coleclough C, Frey JR, Lefkovits I. Clonal proteomics: One gene-family of
proteins. Proteomics 2002, 2, 624-631.
4. 2D Gel electrophoresis tutorial. http://www.aber.ac.uk/~mpgwww/Proteome/Tut_2D.html
5. Protocols for sample preparation and 2D-PAGE. http://www.abdn.ac.uk/~mmb023/
protocol.htm
6. Technical information on 2D-PAGE. http://expasy.hcuge.ch/ch2d/technical-info.html
7. Gorg A, Obermaier GB, Boguth G, Harder A, Scheibe B, Wildgruber R, Weiss W. The current
state of two-dimensional electrophoresis with immobilized pH gradients. Electrophoresis
2000, 21, 1037-1053.
8. Westermeier R, Naven T (Editors). Proteomics in practice. Willey-VCH Verlag, Weinheim
2002.
9. Link AJ (Editor). Methods in Molecular Biology, Vol 112: 2D proteomics analysis protocols.
Humana Press, New Jersey, 1999.
10. Klose J. Protein mapping by combined isolectric focusing and electrophoresis of mouse
tissues. A novel approach to testing for induced point mutations in mammals. Humangenetik
1975, 26, 211-234.
11. OFarrell, P H. High resolution two-dimensional electrophoresis of proteins. J. Biol. Chem.
1975, 250, 4007-4021.
12. Gonzalez LJ, Castellanos-Serra L, Badock V, Diaz M, Moro A, Perea S, Santos A, Paz-Lago
D, Otto A, Muller EC, Kostka S, Wittman-Liebold B, Padron G. Identification of nuclear
proteins of small cell lung cancer cell line H82: An improved procedure for the analysis of
silver-stained proteins. Electrophoresis 2003, 24, 237-252.
13. Corthals GL. Exploitation of specific properties of trifluoroethanol for extraction and
separation of membrane proteins. Presented at the Proteomics forum 2003, September
2003, Munich, Germany.
14. Castellanos-Serra L and Paz-Lago D. The inhibition of unwanted proteolysis during sample
preparation. Its evaluation in challenge experiments. Electrophoresis 2002, 23, 1745, 1753.
15. Klose J, Kobalz U. Two-dimensional electrophoresis of proteins: An update protocols and
implications for functional analysis of the genome. Electrophoresis 1995, 16, 1034-1059.
16. Gauss C, Kalkum M, Lowe M, Lehrach H, Klose J. Analysis of the mouse proteome. (I)
Brain proteins: Separation by two-dimensional electrophoresis and identification by mass
spectrometry and genetic variation. Electrophoresis 1999, 20, 575-600.
PROTEMICA 401
17. Corthals GL, Wasinger VC, Hochstrasser DF, Sanchez JC. The dynamic range of proteins
expression: A challenge for proteomic research. Electrophoresis 2000, 21, 1104-1115.
18. Anderson NL and Anderson NG. The human plasma proteome. Molecular and Cellular
Proteomics 2002, 1, 845-867.
19. Pieper R, Gatlin CL, Makusky AJ, Russo PS, Schatz CR, Miller SS, Su Q, McGrath AM,
Estock MA, Parmar PP, Zhao M, Huang ST, Zhou J, Wang F, Esquer-Blasco R, Anderson
NL, Taylor J, Steiner S. The human serum proteomic display of nearly 3700
chromathographically separated protein spots on two-dimensional electrophoresis gel and
identification of 325 distinct proteins. Proteomics 2003, 7, 1345-1364.
20. Graham JM and Rickwood D (Editors). Subcellular fractionation: A practical Approach.
Oxford University Press 1997, New York.
21. Molloy MP, Herbert BR, Walsh BJ, Tyler MI, Traini M, Sanchez JC, Hochstrasser, DF,
Willians KL, Gooley AA. Extraction of membrane proteins by differential solubilization for
separating using two-dimensional gel electrophoresis. Electrophoresis 1998, 19, 837-844.
22. Schagger H and Von Jagow G. Tricine-Sodium Dodecyl Sulphate gel electrophoresis for the
separation of proteins in the range from 1 to 100 kDa. Analytical Biochemistry 1987:166,
368-379.
23. Opiteck, G, J and Jorgenson, J, W Two-dimensional SEC/RPLC coupled to mass spectrometry
for the analysis of peptides, Anal.Chem., 1997,69(13), 2283-2291
24. Raida M, Schulz-Knappe P, Heine G, Forssmann WG. Liquid chromatography and
electrospray mass spectrometric mapping of peptides from human plasma filtrate, J Am Soc
Mass Spectrom. 1999, 10(1), 45-54.
25. Washburn MP, Wolters D, Yates JR 3rd. Large-scale analysis of the yeast proteome by
multidimensional protein identification technology, Nat Biotechnol. 2001, 19(3), 242-247.
26. Wolters DA, Washburn MP, Yates JR 3rd. An automated multidimensional protein
identification technology for shotgun proteomics, Anal. Chem. 2001, 73(23), 5683-5690.
27. Davis MT, Beierle J, Bures ET, McGinley MD, Mort J, Robinson JH, Spahr CS, Yu W,
Luethy R and Patterson SD. Automated LCLCMSMS platform using binary ion-exchange
and gradient reversed-phase chromatography for improved proteomic analyses,
J.Choromatogr.B Biomed .Sci. Appl. 2001, 752(2), 281-291.
28. Pang JX, Ginanni N, Dongre AR, Hefta SA, Opitek GJ. Biomarker discovery in urine by
proteomics, J.Proteome Res. 2002, 1(2), 161-169.
29. Bushey,M,M and Jorgenson,J,W. Automated instrumentation for comprehensive two-
dimensional high-performance liquid chromatography of proteins, Anal Chem. 1990, 62(2),
161-167.
30. Anderson, L, and Porath J. Isolation of phosphoproteins by immobilized metal (Fe3+)
affinity chromatography, Anal. Biochem. 1986, 154(1), 250-254
31. Li, S and Dass, C. Iron(III)-immobilized metal ion affinity chromatography and mass
spectrometry for the purification and characterization of synthetic phosphopeptides, Anal.
Biochem. 1999, 270(1), 9-14
32. Ficarro SB, McCleland ML, Stukenberg PT, Burke DJ, Ross MM, Shabanowitz J, Hunt DF,
White FM. Phosphoproteome analysis by mass spectrometry and its application to
Saccharomyces cerevisiae, Nat. Biotechnol. 2002, 20(3), 301-305
402 CAPTULO 20
33. JiJ, A. Chakraborty, M. Geng, X, Zhang, A. Amini, M.Bina and F.Regnier. Strategy for
qualitative and quantitative analysis in proteomics based on signature peptides, J. Chromatogr.
2000, 745(1), 197-210.
34. Gygi, S. P., Rist, B., Gerber, S. A., Turecek, F., Gelb, M. H., and Aebersold, R Quantitative
analysis of complex protein mixtures using isotope-coded affinity tags., Nat. Biotechnol.
1999, 17(10), 994999.
35. Gevaert K, Van Damme J, Goethals M, Thomas GR, Hoorelbeke B, Demol H, Martens L,
Puype M, Staes A, Vandekerckhove J. Chromatographic Isolation of Methionine-containing
Peptides for Gel-free Proteome Analysis: Identification Of More Than 800 Escherichia Coli
Proteins. Mol .Cell Proteomics. 2002,1(11), 896-903.
36 .M. Barber, R. S. Bordoli, R. D. Sedgwick and A. N. Tyler. Fast Atom Bombardment: A New
Ion Source for Mass Spectrometry, J. Chem. Soc., Chem. Commun. 1981, 325.
37. Fenn JB, Mann M, Meng CK, Wong SF, Whitehouse CM, Electrospray ionization for mass
spectrometry of large biomolculas, Science. 1989, 246(4926), 64-71.
38. Tanaka K, Waki H, Ido Y, Akita S, Yoshida Y and Yoshida T. Protein and polymer analysis
of up to m/z 100,000 by laser ionization time-of-flight mass spectrometry, Rapid Commun.
Mass Spectrom., 1988, 2, 151153.
39. Karas M, Hillenkamp F. Laser desorption ionization of proteins with molecular masses
exceeding 10,000 daltons, Anal Chem. 1988, 60(20):2299-301.
40. Whitehouse CM, Dreyer RN, Yamashita M, Fenn JB., Electrospray interface for liquid
chromatographs and mass spectrometers. Anal Chem. 1985, 57(3), 675-9
41. Hayes, R. N.; Gross, M. L. Collision-induced dissociation, Methods Enzymol. 1990,193,
237.
42. Biemann, K. Contributions of mass spectrometry to peptide and protein structure, Biomed
Environm. Mass Spectrom. 1988, 16, 99-111.
43. Roepstorff, P.; Fohlman, J. Proposal for a common nomenclature for sequence ions in mass
spectra of peptides, Biomed. Mass Spectrom. 1984,11(11), 601.
44. Medzihradszky KF, Campbell JM, Baldwin MA, Falick AM, Juhasz P, Vestal ML, Burlingame
AL. The characteristics of peptide collision-induced dissociation using a high-performance
MALDI-TOF/TOF tandem mass spectrometer, Anal Chem., 2000, 72(3), 552-8.
45. Yergey AL, Coorssen JR, Backlund PS Jr, Blank PS, Humphrey GA, Zimmerberg J, Campbell
JM, Vestal ML. De novo sequencing of peptides using MALDI/TOF-TOF., J Am Soc Mass
Spectrom. 2002, 13(7):784-91.
46. Adams, J.; Gross, M. L. Energy requirement for remote charge site ion decompositions and
structural information from collisional activation of alkali metal cationized fatty alcohols, J.
Am. Chem. Soc. 1986, 108(22), 6915.
47. Clauser KR, Baker P, Burlingame AL. Role of accurate mass measurement (+/- 10 ppm) in
protein identification strategies employing MS or MS/MS and database searching. Anal
Chem. 1999, 71(14):2871-82.
48. Wool A, Smilansky Z. Precalibration of matrix-assisted laser desorption/ionization-time of
flight spectra for peptide mass fingerprinting. Proteomics. 2002, 2(10):1365-73.
PROTEMICA 403
49. Perkins, D. N., Pappin, D. J., Creasy, D. M., Cottrell, J. S. Probability-based protein
identification by searching sequence databases using mass spectrometry data, Electrophoresis,
1999, 20(18), 3551-3567.
50. Zhang, W., Chait, B.T. ProFound: an expert system for protein identification using mass
spectrometric peptide mapping information, Anal. Chem., 2000, 72(11), 2482-2489.
51. Mann, M.; Hojrup, P.; Roepstorff, P. Use of mass spectrometric molecular weight information
to identify proteins in sequence databases, Biol. Mass Spectrom. 1993, 22(6), 338.
52. Gevaert, K.; Verschelde, J.; Puype, M.; Van Damme, J.; Goethals, M.; De Boeck, S.;
Vandekerhove, J. Structural analysis and identification of gel-purified proteins, available in
the femtomole range, using a novel computer program for peptide sequence assignment, by
matrix-assisted laser desorption ionization-reflectron time-of-flight-mass spectrometry,
Electrophoresis. 1996, 17(5), 918.
53. Mann, M and Wilm, M. Error-tolerant identification of peptides in sequence databases by
peptide sequence tags. Anal Chem. 1994, 66(24), 4390-4399.
54. Ducret A, Van Oostveen I, Eng JK, Yates JR 3rd, Aebersold R. High throughput protein
characterization by automated reverse-phase chromatography/electrospray tandem mass
spectrometry. Protein Sci. 1998, 7(3):706-19.
55. Gatlin CL, Eng JK, Cross ST, Detter JC, Yates JR 3rd. Automated identification of amino
acid sequence variations in proteins by HPLC/microspray tandem mass spectrometry. Anal
Chem. 2000, 72(4):757-63.
56. Mackey AJ, Haystead TA, Pearson WR., Getting more from less: algorithms for rapid
protein identification with multiple short peptide sequences. Mol Cell Proteomics. 2002,
1(2):139-47.
57. Schevchenko, A., Sunyaev, S., Loboda, A., Schevchenko, A., Bork, P., Ens W., Standing K. G.
Charting the proteomes of organisms with unsequenced genomes by MALDI-quadrupole
time-of-flight mass spectrometry and BLAST homology searching, Anal. Chem. 2001, 73(9),
11917-1926.
58. Liska, A. J., Schevchenko, A. Expanding the organismal scope of proteomics: cross-species
protein identification by mass spectrometry and its implications. Proteomics. 2003, 3(1),
19-28.
59. Sunyaev, S., Liska, A. J., Golod, A., Schevchenko, A., Schevchenko, A. MultiTag: multiple
error-tolerant sequence tag search for the sequence-similarity identification of proteins by
mass spectrometry, Anal. Chem. 2003, 75(6), 1307-1315.

You might also like