You are on page 1of 69

14.

Estructura de protenas, 1

Niveles estructurales en las protenas

Estructura primaria: Secuencia de aminocidos


Estructura secundaria: Plegamiento bsico de la cadena debido a enlaces de hidrgeno entre grupos -CO- y -NHde la unin peptdica: hlices, lminas y giros Estructura terciaria: Estructura tridimensional de la protena

Estructura cuaternaria: Asociacin de distintas subunidades, siendo cada una un polipptido.

Estructura primaria
5-AAGGGTACCCAACATTTAGTT-3 3-TTCCCATGGGTTGTAAATCAA-5

DNA RNA
Protena

5-AAGGGUACCCAACAUUUAGUU-3

Lys.Gly.Ser.Gln.His.Leu.Val C

Estructura primaria de la insulina


S S S S S S

GIVEQCCASVCSLYQLENYCN

FVNQHLCGSHLVEALYLVCGERGFFYTPKA

Oxidacin de puentes disulfuro


H H O N H C C CH2 S S CH2 C N H C H O SO3H CH2 C N H C H O HCO3H O

N H C C CH2 SO3H

Reduccin y alquilacin de puentes disulfuro

N H C C H O H O CH2 S CH2 COOICH2 COOH COOCH2 S CH2 C N H C H O

N H C C CH2 S S CH2 C N H C H O DTT

N H C C CH2 SH SH CH2 C N H C H O

Determinacin del N-trmino por la reaccin de Sanger


O O2N F NO2 + H 2N R1 O O2N HN NO2 R1 C N H C N H R2 C O H N R3 O O

R2 C O

H N R3

O2N

HN NO2 R1

COOH + H 2N

R2 + COOH

H 2N R3

COOH

Tripsina ---.---.---.Lys.---.---.---

---.---.---.Arg.---.---.--Rotura enzimtica de polipptidos

---.---.---.Phe.---.---.-----.---.---.Tyr.---.---.-----.---.---.Trp.---.---.-----.---.---.Leu.---.---.---

Quimotripsina

Rotura de un pptido por bromuro de ciangeno

H N R

O C N H

R C O

H N

O C CH2 CH2 S CH3 N H

R C O

H N R

O C N H

R C O

H N R

O C

BrCN

H N R

O C N H

R C O

H N

O O H2N

R C O

H N R

O C N H

R C O

H N R

O C

Degradacin secuencial de Edman


O N C S + H 2N R1 C N H R2 C O H N R3 O C N H R4 C O

Feniltioisocianato
S H N C N O C R1

Pptido (n)
R2 N H C O H N R3 O C N H R4 C O

PTC-pptido
S NH N R1 H

cido diludo
R2 + H 2N C O H N R3 O C N H R4 C O

PTH-aminocido

Pptido (n-1)

Hoy da, la mayor parte de estructuras primarias de protenas se determina a partir de la secuencia de nucletidos en el genoma. Tcnicamente la secuenciacin de cidos nucleicos (en particular, la de DNA) es mucho ms sencilla y barata que la de protenas, estando al alcance de cualquier laboratorio.

10

20

30

40

50

60

| | | | | | PYQYPALTPE QKKELSDIAH RIVAPGKGIL AADESTGSIA KRLQSIGTEN TEENRRFYRQ 70 80 90 100 110 120 | | | | | | LLLTADDRVN PCIGGVILFH ETLYQKADDG RPFPQVIKSK GGVVGIKVDK GVVPLAGTNG 130 140 150 160 170 180 | | | | | | ETTTQGLDGL SERCAQYKKD GADFAKWRCV LKIGEHTPSA LAIMENANVL ARYASICQQN 190 200 210 220 230 240 | | | | | | GIVPIVEPEI LPDGDHDLKR CQYVTEKVLA AVYKALSDHH IYLEGTLLKP NMVTPGHACT 250 260 270 280 290 300 | | | | | | QKFSHEEIAM ATVTALRRTV PPAVTGITFL SGGQSEEEAS INLNAINKCP LLKPWALTFS 310 320 330 340 350 360 | | | | | | YGRALQASAL KAWGGKKENL KAAQEEYVKR ALANSLACQG KYTPSGQAGA AASESLFVSN

HAY

Estructura primaria de la aldolasa A humana SWISS-PROT http://www.expasy.ch

Clculos a partir de estructura primaria


- Nmero, porcentaje y fraccin molar de aminocidos
- Frmula molecular y peso molecular

- pI (punto isoelctrico) terico


- Absorbancia molar terica

- Vida media terica


- ndices de inestabilidad e hidrofobicidad

Amino acid composition: Ala Arg Asn Asp Cys Gln Glu Gly His Ile Leu Lys Met Phe Pro Ser Thr Trp Tyr Val (A) (R) (N) (D) (C) (Q) (E) (G) (H) (I) (L) (K) (M) (F) (P) (S) (T) (W) (Y) (V) 42 15 14 14 8 17 24 30 9 20 34 26 3 8 19 20 22 3 13 22 0 0 0 11.6% 4.1% 3.9% 3.9% 2.2% 4.7% 6.6% 8.3% 2.5% 5.5% 9.4% 7.2% 0.8% 2.2% 5.2% 5.5% 6.1% 0.8% 3.6% 6.1% 0.0% 0.0% 0.0%

Atomic composition: Carbon Hydrogen Nitrogen Oxygen Sulfur C H N O S 1741 2780 486 526 11

Formula: C1741H2780N486O526S11 Total number of atoms: 5544 Molecular weight: 39288.8

Asx (B) Glx (Z) Xaa (X)

ProtParam, 1 http://www.expasy.ch

Total number of negatively charged residues (Asp + Glu): 38 Total number of positively charged residues (Arg + Lys): 41 Theoretical pI: 8.39

Extinction coefficients: Conditions: 6.0 M guanidium hydrochloride 0.02 M phosphate buffer pH 6.5 Extinction coefficients are in units of M-1 cm-1 .

The first table lists values computed assuming ALL Cys residues appear as half cystines, whereas the second table assumes that NONE do. 276 nm 35630 0.907 278 nm 35508 0.904 279 nm 34945 0.889 280 nm 34190 0.870 282 nm 32880 0.837

Ext. coefficient Abs 0.1% (=1 g/l)

Ext. coefficient Abs 0.1% (=1 g/l)

276 nm 35050 0.892

278 nm 35000 0.891

279 nm 34465 0.877

280 nm 33710 0.858

282 nm 32400 0.825

ProtParam, 2 http://www.expasy.ch

Estimated half-life: The N-terminal of the sequence considered is P (Pro). The estimated half-life is: >20 hours (mammalian reticulocytes, in vitro). >20 hours (yeast, in vivo). ? (Escherichia coli, in vivo). Instability index: The instability index (II) is computed to be 34.82 This classifies the protein as stable.

Aliphatic index: 87.16 Grand average of hydropathicity (GRAVY): -0.268

ProtParam, 3 http://www.expasy.ch

Predicciones a partir de estructura primaria, 1


- Hidrofobicidad
- Estructura secundaria

- Retencin cromatogrfica en HPLC


- Residuos accesibles y ocultos

- Mutabilidad

Ala: Arg: Asn: Asp: Cys: Gln: Glu: Gly: His: Ile: Leu: Lys: Met: Phe: Pro: Ser: Thr: Trp: Tyr: Val:

1.800 -4.500 -3.500 -3.500 2.500 -3.500 -3.500 -0.400 -3.200 4.500 3.800 -3.900 1.900 2.800 -1.600 -0.800 -0.700 -0.900 -1.300 4.200

PYQYPALTPEQKKELSDIAH Valor de hidrofobicidad para la posicin n (en este caso, 8):


n+4

S bi
i = n-4

= -10.5

Escala de hidrofobicidad (segn Kyte y Doolittle)

Clculo predictivo de hidrofobicidad (Kyte & Doolittle)

Predicciones a partir de estructura primaria, 2: Homologas

(CG5432)CG5432 PROTEIN. [Drosophila melanogaster ] 376 AA Score = 398 bits (1011), Expect = e-110 Identities = 197/355 (55%), Positives = 245/355 (68%), Gaps = 2/355 (0%) Query: 2 YQYPALTPEQKKELSDIAHRIVAPGKGILAADESTGSIAKRLQSIGTENTEENRRFYRQL 61 + YP E ++EL I+ + VAPGKGILAADES + + KR Q IG ENTEENRR YRQ+ Sbjct: 5 FYYP--NKELQEELICISKALVAPGKGILAADESSAVMGKRFQLIGVENTEENRRLYRQM 62 Query: 62 Sbjct: 63 LLTADDRVNPCIGGVILFHETLYQKADDGRPFPQXXXXXXXXXXXXXXXXXXPLAGTNGE 121 L T D ++ I GVI +HETL+Q+ DDG PF + PL G+ E LFTTDPKIAENISGVIFYHETLHQRTDDGLPFVEALRKKGILTGIKVDKHFSPLFGSEDE 122

Query: 122 TTTQGLDGLSERCAQYKKDGADFAKWRCVLKIGEHTPSALAIMENANVLARYASICQQNG 181 TTQGLD L+ RCAQYKK+G FAKWRC+LKI ++TPS AI+ENANV+ARYA+ICQ Sbjct: 123 FTTQGLDDLANRCAQYKKEGCSFAKWRCILKITKNTPSPQAILENANVMARYAAICQSQR 182 Query: 182 IVPIVEPEILPDGDHDLKRCQYVTEKVLAAVYKALSDHHIYLEGTLLKPNMVTPGHACTQ 241 +VPI+ PE+L GDHDL RCQ V E +LA VYKALSDHH ++LEGTLL+P+MV PG + Sbjct: 183 LVPIISPEVLATGDHDLDRCQKVNEILLAGVYKALSDHHVFLEGTLLQPSMVMPGLQSNK 242 Query: 242 KFSHEEIAMATVTALRRTVPPAVTGITFLSGGQSEEEASINLNAINKCPLLKPWALTFSY 301 +I +ATV A+RR+VPPAV G+ F G QSEEEA+++LNAIN PL KPWA+TF++ Sbjct: 243 NHPPADIGVATVLAIRRSVPPAVMGVLFCGGAQSEEEATVHLNAINNVPLCKPWAMTFAF 302 Query: 302 GRALQASALKAWGGKKENLKAAQEEYVKRALANSLACQGKYTPSGQAGAAASESL 356 RALQ S L+ WGGKKE + AQ E +KR AN LA GKY +AA+E L Sbjct: 303 DRALQTSILRTWGGKKEQISHAQNELIKRCRANGLASIGKYVIGSVESSAATERL 357

Dependiendo del grado de homologa en su estructura primaria, las protenas se agrupan en:

- Superfamilias: homologa en torno a 30 %


- Familias: homologa superior a un 50 % y la misma funcin, por lo general. Adems, hay pequeos tractos de secuencias comunes a protenas muy diversas, y que corresponden a ciertos aspectos funcionales (como p.e. modificacin postraduccional): son los motivos secuenciales

Algunos motivos secuenciales en las protenas

N-Glicosilacin Unin a glicosaminoglicano Fosforilacin dependiente de cAMP Fosforilacin, protein kinasa C Fosforilacin, tirosin kinasa N-miristilacin Amidacin C-terminal -carboxilacin de cido glutmico Prenilacin

N-{P}-[ST]-{P} S-G-x-G [RK]-(2)-[ST] [ST]-x(2)-[RK] [RK]-x(2)-[DE]-x(3)-Y G- {EDRKHPFYW}-x(2)-[STAGCN]-{P} x-G- [RK]-[RK] x(12)-E-x(3)-E-x-C-x(6)-[DEN]-x-[LIVMFY] C-{DENQ}-[LIVM]

Predicciones a partir de estructura primaria, 3: Filogenia y Taxonoma


-8 1 10 ___.___.___.___.___.___.___.___.Gly.___.___.___.___.Gly.___.___.___.Phe. 20 ___.___.___.Cys.___.___.Cys.His.___.___.___.___.___.___.___.___.Lys.___. 30 40 Gly.Pro.___.Leu.___.Gly.___.___.___.Arg.___.___.Gly.___.___.___.Gly.___. 50 60 ___.Tyr.___.___.Ala.Asn.___.___.___.___.___.___.Trp.___.___.___.___.___. 70 80 ___.___.Tyr.Leu.___.Asn.Pro.Lys.Lys.Tyr.Ile.Pro.Gly.Thr.Lys.Met.___.Phe. 90 100 ___.Gly.___.___.Lys.___.___.___.Arg.___.___.___.___.___.___.___.___.___. 104 ___.___.___.___.

Invariantes en citocromo c

Sustituciones conservadoras en citocromo c


Posicin 13 40 46 49 81 85 90 94 95 97 Aminocidos Arg, Lys Ser, Thr Phe, Tyr Ser, Thr Val, Leu, Ile Leu, Ile Asp, Glu Leu, Ile Ile, Val Phe, Tyr

Sustituciones radicales en citocromo c


Posicin 33 44 54 60 65 83 88 89 92 Aminocidos His, Ser, Trp, Tyr, Asn Ala, Pro, Asp, Gln, Val, Glu Asn, Ala, Ser, Gln, Arg, Lys Glu, Gly, Asp, Ala, Gln, Lys, Asn Tyr, Phe, Ser, Met, Arg Pro, Ala, Val, Gly, Thr Pro, Ala, Asp, Glu, Lys, Thr Gln, Lys, Asn, Glu, Thr, Gly, Asp, Ala, Ser Ana, Asn, Asp, Gly, Glu, Val, Thr, Lys, Gln

Distancias filogenticas en citocromo c


1 2 3 4 5 6 7 8 9 __________________________________________________________________________ 1. Homo sapiens 2. Maccaca mulata 3. Sus scrofa 4. Gallus domesticus 5. Rana pipiens 6. Musca domestica 7. Bombyx mori 8. Triticum vulgare 9. Neurospora crassa 1 10 13 18 27 31 43 48 9 12 17 26 30 43 47 9 11 22 27 45 46 11 23 28 46 47 22 29 48 49 14 45 41 45 47 54 -

Y ngulos de conformacin

Representacin de Ramachandran

a-Hlice
F = -57 Y= -47

Paso de rosca: 0.54 nm Traslacin por residuo: 0.15 nm Residuos por vuelta: 3.6 Enlaces H: n a n+3

Hlice 310
F = -49 Y = -26

Paso de rosca: 0.59 nm Traslacin por residuo: 0.19 Residuos por vuelta: 3

Mioglobina

Protena globular con alto contenido en a-hlice N

Fibringeno

Protena fibrosa con alto contenido en a-hlice

Propensin estructural hacia a-hlices (Chou y Fasman)

Estabilizan
Ala: Gln: Glu: Leu: Lys: Met: Phe: 1.420 1.110 1.510 1.210 1.160 1.450 1.130

Indiferentes
Arg: 0.980 Asp:1.010 His: 1.000 Ile: 1.080 Trp: 1.080 Val: 1.060

Desestabilizan
Asn: 0.670 Cys: 0.700 Gly: 0.570 Pro: 0.570 Ser: 0.770 Thr: 0.830 Tyr: 0.690

Prolina y a-hlices

Hlice de poliprolina

Colgeno

Estructura b
F = -119 Y = 113

N
O C

N H

C O

N H

C O

N H

C O

C
H

H N C O H N C O H N C N N N

O C N H O C N H O C N C C C

H N

O C N H O C N H O C N C C C

N
O C

C
H N

O H N

N
O C

C
H N

O H N

Lmina b paralela

Lmina b paralela

Barril b paralelo

O C N H O C C O H N

H N

O C N H O C C O H N

H N

O C N H O C

N
C O H N

C N
C O

C O H N

N H O C

C O H N

N H O C

C O H N

N H O C

N C
N H

N H

C O

N H

C O

Lmina b antiparalela

Lmina b antiparalela

Lmina antiparalela

Propensin estructural hacia estructuras b (Chou y Fasman)

Estabilizan Ile: 1.600 Cys: 1.190 Gln: 1.100 Leu: 1.300 Phe: 1.380 Thr: 1.190 Trp: 1.370 Tyr: 1.470 Val: 1.700

Indiferentes Arg: 0.930 Met: 1.050

Desestabilizan
Ala: 0.830 Asn: 0.890 Asp: 0.540 Glu: 0.370 Gly: 0.750 His: 0.870 Lys: 0.740 Pro: 0.550 Ser: 0.750

Protena fibrosa con estructura b: Fibrona

Protena globular con estructura b: Concanavalina A

Giro b

Propensin estructural hacia giros b

Estabilizan
Asn: 1.560 Asp: 1.460 Cys: 1.190 Gly: 1.560 Pro: 1.520 Ser: 1.430

Indiferentes
Arg: Gln: His: Lys: Thr: Trp: Tyr: 0.950 0.980 0.950 1.010 0.960 0.960 1.140

Desestabilizan
Ala: 0.660 Glu: 0.740 Ile: 0.470 Leu: 0.590 Met: 0.600 Phe: 0.600 Val: 0.500

1ntr
Protena regulatoria

Estructuras suprasecundarias

- Hlice-vuelta-hlice - Siete hlices transmembrana y hlice anfiptica - Cremallera de leucina - Unidad bab - Meandro b - Dedo de Zn - Mano EF

Hlice-vuelta-hlice

Siete hlices transmembrana (bacteriorrodopsina)

a-hlice anfiptica

Lado hidrofbico

Lado polar

Cremallera de leucina

Motivo bab

Meandro b

Dedo de Zn

Mano EF

Determinacin experimental de la estructura secundaria

1. Mtodos fsicos:
Cristalografa Rayos X, Resonancia Magntica Nuclear (RMN, NMR) en tanto en cuanto resuelven la estructura terciaria Otras tcnicas: dicrosmo circular 2. Mtodos predictivos a partir de la estructura primaria

Propensin de un aminocido hacia una estructura dada

1. A partir de un conjunto de protenas de estructura 3D conocida, se forma la siguiente tabla:


Total Glutamato Aminocidos 282 5507 a-hlice 132 1715 Estr. b 29 1555 Giro b 43 1121

(Se ha puesto el Glutamato como ejemplo; esta tabla se prepara para todos los aminocidos)

2. A partir de la tabla anterior, se calculan las frecuencias relativas de aparicin de dicho aminocido en las tres estructuras:
a-hlice Estr. b Glutamato Aminocidos 0.470 0.311 0.104 0.282 Giro b 0.151 0.204

3. Se calcula entonces la propensin de cada aminocido hacia una estructura dada por el cociente de dividir la frecuencia relativa de cada estructura por la frecuencia relativa media de todos los aminocidos. En el caso del glutamato,
Pa = 0.470/0.311 = 1.511 Pb = 0.104/0.282 = 0.370 Pg = 0.151/0.202 = 0.748

Ala: Arg: Asn: Asp: Cys: Gln: Glu: Gly: His: Ile: Leu: Lys: Met: Phe: Pro: Ser: Thr: Trp: Tyr: Val:

1.420 0.980 0.670 1.010 0.700 1.110 1.510 0.570 1.000 1.080 1.210 1.160 1.450 1.130 0.570 0.770 0.830 1.080 0.690 1.060

PYQYPALTPEQKKELSDIAH Valor de propensin hacia a-hlice para la posicin n (en este caso, 8):
n+4

S bi
i = n-4

= 9.07

Escala de propensiones hacia a-hlice (segn Chou y Fasman)

Ala: Arg: Asn: Asp: Cys: Gln: Glu: Gly: His: Ile: Leu: Lys: Met: Phe: Pro: Ser: Thr: Trp: Tyr: Val:

0.830 0.930 0.890 0.540 1.190 1.100 0.370 0.750 0.870 1.600 1.300 0.740 1.050 1.380 0.550 0.750 1.190 1.370 1.470 1.700

PYQYPALTPEQKKELSDIAH Valor de propensin hacia estructura b para la posicin n (en este caso, 8):
n+4

S bi
i = n-4

= 8.1

Escala de propensiones hacia estructura b (segn Chou y Fasman)

Ala: Arg: Asn: Asp: Cys: Gln: Glu: Gly: His: Ile: Leu: Lys: Met: Phe: Pro: Ser: Thr: Trp: Tyr: Val:

0.660 0.950 1.560 1.460 1.190 0.980 0.740 1.560 0.950 0.470 0.590 1.010 0.600 0.600 1.520 1.430 0.960 0.960 1.140 0.500

PYQYPALTPEQKKELSDIAH Valor de propensin hacia giro b para la posicin n (en este caso, 8):
n+4

S bi
i = n-4

= 9.12

Escala de propensiones hacia giro b (segn Chou y Fasman)

You might also like