Professional Documents
Culture Documents
Estructura de protenas, 1
Estructura primaria
5-AAGGGTACCCAACATTTAGTT-3 3-TTCCCATGGGTTGTAAATCAA-5
DNA RNA
Protena
5-AAGGGUACCCAACAUUUAGUU-3
Lys.Gly.Ser.Gln.His.Leu.Val C
GIVEQCCASVCSLYQLENYCN
FVNQHLCGSHLVEALYLVCGERGFFYTPKA
N H C C CH2 SO3H
N H C C CH2 SH SH CH2 C N H C H O
R2 C O
H N R3
O2N
HN NO2 R1
COOH + H 2N
R2 + COOH
H 2N R3
COOH
Tripsina ---.---.---.Lys.---.---.---
---.---.---.Phe.---.---.-----.---.---.Tyr.---.---.-----.---.---.Trp.---.---.-----.---.---.Leu.---.---.---
Quimotripsina
H N R
O C N H
R C O
H N
R C O
H N R
O C N H
R C O
H N R
O C
BrCN
H N R
O C N H
R C O
H N
O O H2N
R C O
H N R
O C N H
R C O
H N R
O C
Feniltioisocianato
S H N C N O C R1
Pptido (n)
R2 N H C O H N R3 O C N H R4 C O
PTC-pptido
S NH N R1 H
cido diludo
R2 + H 2N C O H N R3 O C N H R4 C O
PTH-aminocido
Pptido (n-1)
Hoy da, la mayor parte de estructuras primarias de protenas se determina a partir de la secuencia de nucletidos en el genoma. Tcnicamente la secuenciacin de cidos nucleicos (en particular, la de DNA) es mucho ms sencilla y barata que la de protenas, estando al alcance de cualquier laboratorio.
10
20
30
40
50
60
| | | | | | PYQYPALTPE QKKELSDIAH RIVAPGKGIL AADESTGSIA KRLQSIGTEN TEENRRFYRQ 70 80 90 100 110 120 | | | | | | LLLTADDRVN PCIGGVILFH ETLYQKADDG RPFPQVIKSK GGVVGIKVDK GVVPLAGTNG 130 140 150 160 170 180 | | | | | | ETTTQGLDGL SERCAQYKKD GADFAKWRCV LKIGEHTPSA LAIMENANVL ARYASICQQN 190 200 210 220 230 240 | | | | | | GIVPIVEPEI LPDGDHDLKR CQYVTEKVLA AVYKALSDHH IYLEGTLLKP NMVTPGHACT 250 260 270 280 290 300 | | | | | | QKFSHEEIAM ATVTALRRTV PPAVTGITFL SGGQSEEEAS INLNAINKCP LLKPWALTFS 310 320 330 340 350 360 | | | | | | YGRALQASAL KAWGGKKENL KAAQEEYVKR ALANSLACQG KYTPSGQAGA AASESLFVSN
HAY
Amino acid composition: Ala Arg Asn Asp Cys Gln Glu Gly His Ile Leu Lys Met Phe Pro Ser Thr Trp Tyr Val (A) (R) (N) (D) (C) (Q) (E) (G) (H) (I) (L) (K) (M) (F) (P) (S) (T) (W) (Y) (V) 42 15 14 14 8 17 24 30 9 20 34 26 3 8 19 20 22 3 13 22 0 0 0 11.6% 4.1% 3.9% 3.9% 2.2% 4.7% 6.6% 8.3% 2.5% 5.5% 9.4% 7.2% 0.8% 2.2% 5.2% 5.5% 6.1% 0.8% 3.6% 6.1% 0.0% 0.0% 0.0%
Atomic composition: Carbon Hydrogen Nitrogen Oxygen Sulfur C H N O S 1741 2780 486 526 11
ProtParam, 1 http://www.expasy.ch
Total number of negatively charged residues (Asp + Glu): 38 Total number of positively charged residues (Arg + Lys): 41 Theoretical pI: 8.39
Extinction coefficients: Conditions: 6.0 M guanidium hydrochloride 0.02 M phosphate buffer pH 6.5 Extinction coefficients are in units of M-1 cm-1 .
The first table lists values computed assuming ALL Cys residues appear as half cystines, whereas the second table assumes that NONE do. 276 nm 35630 0.907 278 nm 35508 0.904 279 nm 34945 0.889 280 nm 34190 0.870 282 nm 32880 0.837
ProtParam, 2 http://www.expasy.ch
Estimated half-life: The N-terminal of the sequence considered is P (Pro). The estimated half-life is: >20 hours (mammalian reticulocytes, in vitro). >20 hours (yeast, in vivo). ? (Escherichia coli, in vivo). Instability index: The instability index (II) is computed to be 34.82 This classifies the protein as stable.
ProtParam, 3 http://www.expasy.ch
- Mutabilidad
Ala: Arg: Asn: Asp: Cys: Gln: Glu: Gly: His: Ile: Leu: Lys: Met: Phe: Pro: Ser: Thr: Trp: Tyr: Val:
1.800 -4.500 -3.500 -3.500 2.500 -3.500 -3.500 -0.400 -3.200 4.500 3.800 -3.900 1.900 2.800 -1.600 -0.800 -0.700 -0.900 -1.300 4.200
S bi
i = n-4
= -10.5
(CG5432)CG5432 PROTEIN. [Drosophila melanogaster ] 376 AA Score = 398 bits (1011), Expect = e-110 Identities = 197/355 (55%), Positives = 245/355 (68%), Gaps = 2/355 (0%) Query: 2 YQYPALTPEQKKELSDIAHRIVAPGKGILAADESTGSIAKRLQSIGTENTEENRRFYRQL 61 + YP E ++EL I+ + VAPGKGILAADES + + KR Q IG ENTEENRR YRQ+ Sbjct: 5 FYYP--NKELQEELICISKALVAPGKGILAADESSAVMGKRFQLIGVENTEENRRLYRQM 62 Query: 62 Sbjct: 63 LLTADDRVNPCIGGVILFHETLYQKADDGRPFPQXXXXXXXXXXXXXXXXXXPLAGTNGE 121 L T D ++ I GVI +HETL+Q+ DDG PF + PL G+ E LFTTDPKIAENISGVIFYHETLHQRTDDGLPFVEALRKKGILTGIKVDKHFSPLFGSEDE 122
Query: 122 TTTQGLDGLSERCAQYKKDGADFAKWRCVLKIGEHTPSALAIMENANVLARYASICQQNG 181 TTQGLD L+ RCAQYKK+G FAKWRC+LKI ++TPS AI+ENANV+ARYA+ICQ Sbjct: 123 FTTQGLDDLANRCAQYKKEGCSFAKWRCILKITKNTPSPQAILENANVMARYAAICQSQR 182 Query: 182 IVPIVEPEILPDGDHDLKRCQYVTEKVLAAVYKALSDHHIYLEGTLLKPNMVTPGHACTQ 241 +VPI+ PE+L GDHDL RCQ V E +LA VYKALSDHH ++LEGTLL+P+MV PG + Sbjct: 183 LVPIISPEVLATGDHDLDRCQKVNEILLAGVYKALSDHHVFLEGTLLQPSMVMPGLQSNK 242 Query: 242 KFSHEEIAMATVTALRRTVPPAVTGITFLSGGQSEEEASINLNAINKCPLLKPWALTFSY 301 +I +ATV A+RR+VPPAV G+ F G QSEEEA+++LNAIN PL KPWA+TF++ Sbjct: 243 NHPPADIGVATVLAIRRSVPPAVMGVLFCGGAQSEEEATVHLNAINNVPLCKPWAMTFAF 302 Query: 302 GRALQASALKAWGGKKENLKAAQEEYVKRALANSLACQGKYTPSGQAGAAASESL 356 RALQ S L+ WGGKKE + AQ E +KR AN LA GKY +AA+E L Sbjct: 303 DRALQTSILRTWGGKKEQISHAQNELIKRCRANGLASIGKYVIGSVESSAATERL 357
Dependiendo del grado de homologa en su estructura primaria, las protenas se agrupan en:
N-Glicosilacin Unin a glicosaminoglicano Fosforilacin dependiente de cAMP Fosforilacin, protein kinasa C Fosforilacin, tirosin kinasa N-miristilacin Amidacin C-terminal -carboxilacin de cido glutmico Prenilacin
N-{P}-[ST]-{P} S-G-x-G [RK]-(2)-[ST] [ST]-x(2)-[RK] [RK]-x(2)-[DE]-x(3)-Y G- {EDRKHPFYW}-x(2)-[STAGCN]-{P} x-G- [RK]-[RK] x(12)-E-x(3)-E-x-C-x(6)-[DEN]-x-[LIVMFY] C-{DENQ}-[LIVM]
Invariantes en citocromo c
Y ngulos de conformacin
Representacin de Ramachandran
a-Hlice
F = -57 Y= -47
Paso de rosca: 0.54 nm Traslacin por residuo: 0.15 nm Residuos por vuelta: 3.6 Enlaces H: n a n+3
Hlice 310
F = -49 Y = -26
Paso de rosca: 0.59 nm Traslacin por residuo: 0.19 Residuos por vuelta: 3
Mioglobina
Fibringeno
Estabilizan
Ala: Gln: Glu: Leu: Lys: Met: Phe: 1.420 1.110 1.510 1.210 1.160 1.450 1.130
Indiferentes
Arg: 0.980 Asp:1.010 His: 1.000 Ile: 1.080 Trp: 1.080 Val: 1.060
Desestabilizan
Asn: 0.670 Cys: 0.700 Gly: 0.570 Pro: 0.570 Ser: 0.770 Thr: 0.830 Tyr: 0.690
Prolina y a-hlices
Hlice de poliprolina
Colgeno
Estructura b
F = -119 Y = 113
N
O C
N H
C O
N H
C O
N H
C O
C
H
H N C O H N C O H N C N N N
O C N H O C N H O C N C C C
H N
O C N H O C N H O C N C C C
N
O C
C
H N
O H N
N
O C
C
H N
O H N
Lmina b paralela
Lmina b paralela
Barril b paralelo
O C N H O C C O H N
H N
O C N H O C C O H N
H N
O C N H O C
N
C O H N
C N
C O
C O H N
N H O C
C O H N
N H O C
C O H N
N H O C
N C
N H
N H
C O
N H
C O
Lmina b antiparalela
Lmina b antiparalela
Lmina antiparalela
Estabilizan Ile: 1.600 Cys: 1.190 Gln: 1.100 Leu: 1.300 Phe: 1.380 Thr: 1.190 Trp: 1.370 Tyr: 1.470 Val: 1.700
Desestabilizan
Ala: 0.830 Asn: 0.890 Asp: 0.540 Glu: 0.370 Gly: 0.750 His: 0.870 Lys: 0.740 Pro: 0.550 Ser: 0.750
Giro b
Estabilizan
Asn: 1.560 Asp: 1.460 Cys: 1.190 Gly: 1.560 Pro: 1.520 Ser: 1.430
Indiferentes
Arg: Gln: His: Lys: Thr: Trp: Tyr: 0.950 0.980 0.950 1.010 0.960 0.960 1.140
Desestabilizan
Ala: 0.660 Glu: 0.740 Ile: 0.470 Leu: 0.590 Met: 0.600 Phe: 0.600 Val: 0.500
1ntr
Protena regulatoria
Estructuras suprasecundarias
- Hlice-vuelta-hlice - Siete hlices transmembrana y hlice anfiptica - Cremallera de leucina - Unidad bab - Meandro b - Dedo de Zn - Mano EF
Hlice-vuelta-hlice
a-hlice anfiptica
Lado hidrofbico
Lado polar
Cremallera de leucina
Motivo bab
Meandro b
Dedo de Zn
Mano EF
1. Mtodos fsicos:
Cristalografa Rayos X, Resonancia Magntica Nuclear (RMN, NMR) en tanto en cuanto resuelven la estructura terciaria Otras tcnicas: dicrosmo circular 2. Mtodos predictivos a partir de la estructura primaria
(Se ha puesto el Glutamato como ejemplo; esta tabla se prepara para todos los aminocidos)
2. A partir de la tabla anterior, se calculan las frecuencias relativas de aparicin de dicho aminocido en las tres estructuras:
a-hlice Estr. b Glutamato Aminocidos 0.470 0.311 0.104 0.282 Giro b 0.151 0.204
3. Se calcula entonces la propensin de cada aminocido hacia una estructura dada por el cociente de dividir la frecuencia relativa de cada estructura por la frecuencia relativa media de todos los aminocidos. En el caso del glutamato,
Pa = 0.470/0.311 = 1.511 Pb = 0.104/0.282 = 0.370 Pg = 0.151/0.202 = 0.748
Ala: Arg: Asn: Asp: Cys: Gln: Glu: Gly: His: Ile: Leu: Lys: Met: Phe: Pro: Ser: Thr: Trp: Tyr: Val:
1.420 0.980 0.670 1.010 0.700 1.110 1.510 0.570 1.000 1.080 1.210 1.160 1.450 1.130 0.570 0.770 0.830 1.080 0.690 1.060
PYQYPALTPEQKKELSDIAH Valor de propensin hacia a-hlice para la posicin n (en este caso, 8):
n+4
S bi
i = n-4
= 9.07
Ala: Arg: Asn: Asp: Cys: Gln: Glu: Gly: His: Ile: Leu: Lys: Met: Phe: Pro: Ser: Thr: Trp: Tyr: Val:
0.830 0.930 0.890 0.540 1.190 1.100 0.370 0.750 0.870 1.600 1.300 0.740 1.050 1.380 0.550 0.750 1.190 1.370 1.470 1.700
PYQYPALTPEQKKELSDIAH Valor de propensin hacia estructura b para la posicin n (en este caso, 8):
n+4
S bi
i = n-4
= 8.1
Ala: Arg: Asn: Asp: Cys: Gln: Glu: Gly: His: Ile: Leu: Lys: Met: Phe: Pro: Ser: Thr: Trp: Tyr: Val:
0.660 0.950 1.560 1.460 1.190 0.980 0.740 1.560 0.950 0.470 0.590 1.010 0.600 0.600 1.520 1.430 0.960 0.960 1.140 0.500
PYQYPALTPEQKKELSDIAH Valor de propensin hacia giro b para la posicin n (en este caso, 8):
n+4
S bi
i = n-4
= 9.12