You are on page 1of 37

Problema Biolgico

Identificar genes en secuencias


de ADN

Gramtica? y Gentica?
El estudio de la gramtica y la preparacin de normas
gramaticales han sido, desde los primeros estatutos
acadmicos, un complemento imprescindible a la
elaboracin de diccionarios: en el diccionario se
de-finen las palabras; en la gramtica se explica la
forma en que los elementos de la lengua se enlazan
para formar textos y se analizan los significados de
estas combinaciones.
http://www.rae.es/obras-academicas/gramatica#sthash.msVo2Ow3.dpuf

Elementos de la Gramtica
Nueva Gramtica de la Lengua Espaola
(2009-2011).
a. morfologa, analiza la estructura de las
palabras, su constitucin interna y
variaciones.
b. sintaxis, forma en que se ordenan y
combinan.
c. fontica y fonologa, sonidos del habla y su
organizacin lingstica.

Sigo sin entender . . .


No se supone que era un electivo.

Estoy en la clase de Bioinformtica


o en la clase de Lengua Espaola

SECUENCIAS PALNDROMAS

AACGAACGACTAGCATAGATAGAGATAGACATAGACA
TAGCATCAGCATCAGCATAGCAGCAGCATAGCATCAG
CAGCAGTCTACACAGACATAGATAGATAGCATAGATAG
ATGATACGATAGACTAGAGATCAGATCAGCACTAGCAC
TACGACTAGACTAGAGAAGAAACGACTACGAGGACT
ACGACAGCATCACAC
Buscar patrones
Interpretarlos biolgicamente

Proyecto Genoma Humano


Se tuvo acceso al as letras del libro de la vida.
Pero desconocamos las reglas gramaticales
para poder descifrar la informacin.
La piedra rosseta de la biologa molecular.

Tcnicas para la Bsqueda


de Genes

http://www.geneprediction.org/book/Comparative.ppt

ATAGGACTAGACTAGCATAGATGACG
AACGTGGGAGAGAGAGGAGAGTAGCA
Podemos identificar

Genes
Limites de exones
Sitios de splicing
Inicio y fin de la traduccin

Splicing alternativo
Elementos regulatorios

Mtodos experimentales
Objetivos primarios

Mtodos computacionales
Objetivos secundarios

ESTRUCTURA DE UN GEN PROCARIOTICO

La morfologa

Seal Shine-Delgarno
5'-TATAAT-3

Promotor

Secuencia
codificante

CDS

Seal del trmino de la


secuencia codificante

Terminador

ADN genmico
transcripcin

ARNm
Imagen superior from Purves et al., Life: The Science of Biology, 4th Edition, by Sinauer Associates (www.sinauer.com) and WH Freeman
(www.whfreeman.com)

La morfologa

SEAL

CONTENIDO

RBS (secuencia Shine-Delgarno)

secuencia rica en pU,


complementaria a 16S rRNA

Codn de Inicio

ATG, (GTG, TTG)

Uso de Codn

dependiente de la especie

Tercera Posicin del Codn

preferencia por un nucletido


especfico (G,C)

Frecuencia k-mers

dependiente de la especie

Codn Termino

TGA, TAA, TAG

La morfologa

ESTRUCTURA DE UN GEN EUCARIOTICO

Arch. argent. pediatr. v.108 n.4 Buenos Aires jul./ago. 2010

La morfologa

La secuencia Kozac, facilita el reconocimiento de la secuencia de


iniciacin AUG, en el proceso de traduccin de los eucariontes.

SEAL

CONTENIDOS

Inicio Transcripcional

regiones circundantes a
Codn Start (CpG islands)
ATG, regiones circundantes
(Seq Kozak: CCGCCATGG)
dependiente de la especie
preferencia por un
nucletido especfico (G,C)
dependiente de la especie
GT(AAGT)
(Py)12NCAG
TGA, TAA, TAG
CAATAA(T/C)

Codn de Inicio
Uso de Codn
Tercera Posicin del Codn
Frecuencia k-mers
5' Splice Junction
3' Splice Junction
Codn de Termino
Seal Poly-A

Genoma
Procaritico
0.5 10 Mpb

Alta densidad gnica : >90%


regiones codificantes
Baja frecuencia de secuencias
repetitivas
ORF nico y continuo

Facilidad en el anlisis de
ORF.

No todos los ORF corresponden a genes


verdaderos.

Genes con ORF cortos y ARN no


codificantes (ARN funcionales que no son
traducidos) se ven subrepresentados.

Genoma
Eucaritico
10Mpb 670 Gpb
Baja densidad gnica : <3%
regiones codificantes
Alta frecuencia de secuencias
repetitivas y elementos
transposables
Organizacin exn intrn.

ORF

http://ghr.nlm.nih.gov/glossary=openreadingframe

http://www.kazusa.or.jp/codon/

Data source
NCBI-GenBank Flat File Release 160.0 [June 15 2007].
Data amount

35,799 organisms
3,027,973 complete protein coding genes (CDS's)

Seales Intrones / Exones

Deteccin del Sitio de Splicing

Conservacin de Secuencias en la Evolucin


Usar mltiples
genomas
incrementa la
efectividad
chicken

galago
chimpanzee human

rat

mouse
dog

human:
chimp:
cow:
dog:
galago:
rat:
mouse:

cow

AAGGGAAGACAGGTGAGGGTCAAGCCCCAGCAAGTGCACCCAG------------ACACC
AAGGGAAGACAGGTGAGGGTCAAGCCCCAGCAAGTGCACCCAG------------ACACC
AAGGGAAGACATTTACGAGTCAAGCCACAGAAAGAGCCCCTGAG-----------GTGCC
AAAGGAGGACATGTGAGGGCCAAACTACTGAAGGTTCAACCAGG-----------ATGCT
AAGGGGAGACAGGGGAGGGTCACACCATGGCAGAGG--CCAAG------------ACAGC
AAAGGAAACAATGGGAAGGTTA-TCAACTCCAAGTATGCCCAAGATCAAGGGAACCCCTT
AAAGGAAACCACTGGGAGGTTA-GAAATCACAGGTGCACCCAAGATCAAGGAA--CCCCT

Prediccin de Genes
aatgcatgcggctatgctaatgcatgcggctatgctaagctgggatccgatgacaatgcatgcggctatgc
taatgcatgcggctatgcaagctgggatccgatgactatgctaagctgggatccgatgacaatgcatgcg
gctatgctaatgaatggtcttgggatttaccttggaatgctaagctgggatccgatgacaatgcatgcggct
atgctaatgaatggtcttgggatttaccttggaatatgctaatgcatgcggctatgctaagctgggatccga
tgacaatgcatgcggctatgctaatgcatgcggctatgcaagctgggatccgatgactatgctaagctgcg
gctatgctaatgcatgcggctatgctaagctgggatccgatgacaatgcatgcggctatgctaatgcatgc
ggctatgcaagctgggatcctgcggctatgctaatgaatggtcttgggatttaccttggaatgctaagctg
ggatccgatgacaatgcatgcggctatgctaatgaatggtcttgggatttaccttggaatatgctaatgcat
gcggctatgctaagctgggaatgcatgcggctatgctaagctgggatccgatgacaatgcatgcggctat
gctaatgcatgcggctatgcaagctgggatccgatgactatgctaagctgcggctatgctaatgcatgcgg
ctatgctaagctcatgcggctatgctaagctgggaatgcatgcggctatgctaagctgggatccgatgaca
atgcatgcggctatgctaatgcatgcggctatgcaagctgggatccgatgactatgctaagctgcggctat
gctaatgcatgcggctatgctaagctcggctatgctaatgaatggtcttgggatttaccttggaatgctaag
ctgggatccgatgacaatgcatgcggctatgctaatgaatggtcttgggatttaccttggaatatgctaatg
catgcggctatgctaagctgggaatgcatgcggctatgctaagctgggatccgatgacaatgcatgcggc
tatgctaatgcatgcggctatgcaagctgggatccgatgactatgctaagctgcggctatgctaatgcatg
cggctatgctaagctcatgcgg

Gen!

You might also like