TM 11 Bioinformatika (Biologi Molekuler 2014)

TATAP MUKA 11
Learning Outcome (LO)

LO 47: menjelaskan ruang lingkup bioinformatika
LO 48: menjelaskan penggunaan komputer dalam
analisis data biologis
LO 49: menjelaskan pembuatan dan penggunaan
data biologis
LO 50: menjelaskan pangkalan data asam nukleat
LO 51: menjelaskan pangkalan data protein
What is Bioinformatics?
Bioinformatika dapat
didefinisikan secara
sederhana sebagai
penggunaan
teknologi informasi
(TI) untuk
menganalisis
kumpulan data
biologis
Bioinformatika
menghubungkan
bidang Bioscience
dan ilmu komputer.
Fig. 9.1 The core of bioinformatics is

the database. The two key supporting
branches are data input (here shown to
the left of the vertical line) and data
management (shown to the right of the
vertical line). Data management relies on
hardware and software developments,
with data input requiring the generation
of data using experimental techniques
such as DNA sequencing.
Bioinformatika tidak
hanya menggunakan
komputer untuk
melihat data sekuens.
Bioinformatika sebagai
cabang utama
bioscience modern,
dengan berbagai alat
canggih untuk
menganalisis gen dan
protein in vivo, in
vitro , dan in silico.
Elemen kunci
bioinformatika
disajikan pada Gambar.
9.1.
LO 47: menjelaskan ruang lingkup bioinformatika
The role of the computer

Komputer ideal untuk tugas
menganalisis kumpulan data
yang kompleks, seperti data
urutan untuk asam nukleat
dan protein.
1)Komputer
tidak kenal lelah
2)umumnya tidak membuat
kesalahan jika diprogram
dengan benar
3)dapat
menyimpan
sejumlah besar informasi
Istilah baru seperti
data warehouse
(toko informasi) dan
dalam
bentuk digital.
data mining (interogasi database berbagai jenis) telah
diciptakan
untuk
menggambarkan
aspek
bioinformatika, dengan text mining (interogasi database
bibliografi) memberikan peran pendukung penting.
LO 48: menjelaskan penggunaan komputer dalam
Perkembangan komputer berjalan dengan cepat:

Istilah baru
warehouse (toko informasi)
data mining (interogasi database berbagai
jenis)
text mining (interogasi database bibliografi)
Perangkat keras
desktop dan server
desktop yang relatif murah cukup kuat untuk
mengakses berbagai database
tidak ada kendala dalam mengakses dan
menggunakan informasi
Perangkat lunak
Sebagian
besar
perangkat
lunak
yang
diperlukan untuk manipulasi dan interogasi
terhadap informasi sekarang tersedia gratis
beberapa
paket
yang
tersedia
secara
komersial. penggunaan komputer dalam
LO 48: menjelaskan
Biological data sets

Bisa dikatakan bahwa bioinformatika benarbenar mulai lepas landas dengan munculnya
metode sekuensing DNA cepat pada akhir
tahun 1970.
laju akuisisi data sekuens biologis terbatas
tekanan
relatif
sedikit
untuk
mengembangkan penyimpanan umum dan
metode analisis informasi.
Ketika teknik sekuensing menjadi mapan dan
digunakan lebih luas
tingkat pembuatan data jelas meningkat
kebutuhan
manajemen
database
terkoordinasi menjadi lebih besar.
Kebutuhan ini diilustrasikan secara sederhana
menggunakan
beberapa dan
datapenggunaan
sekuens DNA
LO 49: menjelaskan
pembuatan
(c) An annotated version of the

sequence, with the three reading
frames identified as RF1, RF2, and
RF3. The numbering shows bases
from the start of the chromosome.
The region shown here is therefore
some 24 million base pairs from the
LO
49:
menjelaskan
end
of the
chromosome. pembuatan
(a) A short DNA

sequence is shown in
double-stranded
format
(b) Three different
ways
of writing the sequence
are shown: i, ii, and iii.
By convention only one
strand is listed. In (b)i
uppercase type is used
with numbering above
every 10 bases. In (b)ii
spaces are used to
separate groups of 10
bases, and in (b)iii
lowercase type is used
with separation.
Lowercase type avoids
any confusion between
G and C, as g and c are
more easily
distinguished
dan penggunaan
Persyaratan urutan basa menjadi informasi

Ditulis secara akurat dan informatif
Dipresentasikan dengan jelas dan logis
dalam format visual
Dijelaskan orientasi dan identifikasi fitur
konsistensi penggunaan anotasi
(penjelasan) oleh pengguna yang berbeda
Generation and organisation of information

Pembuatan data merupakan bagian utama
dari setiap prosedur ilmiah dan merupakan
inti dari bioinformatika.
Sekuensing
DNA
merupakan
prosedur
pertama untuk menghasilkan data dalam
jumlah cukup besar yang memerlukan
koordinasi dan organisasi database biologis
Tonggak signifikan terjadi pada penentuan
urutan basa genom:
bakteriofag phi-X174 (5 386 pasangan
basa, 1977)
lambda (48 502 pasangan basa, 1982).
Nucleic acid databases

Table 9.2. Nucleic acid sequence database
websites
Site/page
URL
Nucleic acid sequence database sites

International Nucleotide Sequence
Database Collaboration (INSDC)
http://www.insdc.org/
The European Nucleotide Archive

(ENA)
http://www.ebi.ac.uk/ena/
GenBank
http://www.ncbi.nlm.nih.gov/ge
nbank/
DNA Data Bank of Japan
http://www.ddbj.nig.ac.jp/
Genome sequencing and other database sites
LO
The Wellcome Trust Sanger

Institute
http://www.sanger.ac.uk/
Databases at the European

Bioinformatics Institute (EBI)
http://www.ebi.ac.uk/services
Databases at the National Center

http://www.ncbi.nlm.nih.gov/gui
for menjelaskan pangkalan
de/all/#databases_
88:
data asam nukleat
Fig. 9.3 Early growth of global nucleic acid sequence

database entries. Entries are
presented as gigabases of sequence data accumulating over the
LO period
88: menjelaskan
pangkalan data asam nukleat
19821994.
Fig. 9.4 Growth in the Genbank database from 1995. Total sequence
data and GenBank-derived sequence data are shown. A measure of the
use of the information is shown by the number of database searches
requested
per
day.
Modified
from
data
supplied
by
NCBI
(www.ncbi.nlm.nih.gov/Genbank), with permission.
LO 88: menjelaskan pangkalan data asam nukleat
Fig. 9.5 Growth of the EMBL nucleic acid sequence database

(EMBL-Bank) since 1995.
The release version of the database is indicated by RL, with key release
versions 52, 65, 78, 79, and 85 shown. These represent the 1, 10, and 100
gb milestones (releases 52, 65, and 85) and also a period of exceptional
growth of the database (between releases 78 and 79). The figure was
produced using data provided by the EMBL-European Bioinformatics
Institute,
UK (www.ebi.ac.uk),
with permission.
LO
88: Hinxton,
menjelaskan
pangkalan
data asam nukleat
Protein databases
Database Protein:
urutan protein ditentukan dengan metode
langsung,
urutan protein yang berasal dari database
informasi asam nukleat melalui translasi
urutan mRNA prediksi.
Salah
satu
tantangan
utama
untuk
pengembang
database
adalah
untuk
memastikan
bahwa
database
dapat
'berbicara' satu sama lain, sehingga konversi
data kompleks sedapat mungkin dihindari.
Sekuensing langsung protein dengan metode

degradasi Edman klasik pertama kali pada tahun
1950.
Namun, tingkat pertumbuhan database protein
primer kurang spektakuler dibandingkan asam
nukleat.
Hal ini sebagian besar disebabkan oleh
kesulitan dalam menentukan urutan asam amino
dari protein - sekuens asam amino yang tidak
dapat diduplikasi seperti gen, dan protein adalah
struktur tiga dimensi yang kompleks dengan
aktivitas biologis tergantung pada aspek urutan
primer.
Meskipun perkembangan terakhir dalam teknik
sekuensing protein (misalnya otomatisasi prosedur
Edman, penggunaan spektrometri massa) sangat
meningkatkan data protein, namun sekuensing DNA
terklon
selalu akan
memberikan
lebih cepat
LO 89:
menjelaskan
pangkalan
datadata
protein
Database yang tersedia saat ini merupakan sumber

tak ternilai bagi masyarakat biologis.
Database UniProt (The Universal Protein Resource)
merupakan hasil kolaborasi erat antara repositori
urutan protein utama di Eropa dan Amerika Serikat.
UniProt didirikan pada tahun 2002, dengan tiga mitra
utama yang terlibat.
The Protein Information Resource (PIR), Georgetown
University, USA
SWISSPROT, the Swiss Institute for Bioinformatics
the EBI.
Inti sentral UniProt adalah database UniParc dan

UniProt Knowledgebase (UniProt KB)
Pada tahun 2007
UniParc memiliki 7,7 juta entri
UniProt KB sekitar 3,5 juta entri.
Rincian lebih lanjut tentang UniProt dan komponen
yang terkait dapat ditemukan di situs web yang
LO 89:
menjelaskan
pangkalan
data protein
tercantum
dalam Tabel
9.3
Table 9.3. Protein sequence database

websites
Site/page
URL
Database sites
UniProt the key gateway site for
protein database information
http://www.uniprot.org/
SwissProt (the SIB protein resource http://www.expasy.org/

and part of UniProt)
The Protein Information Resource
(PIR, hosted by Georgetown
University, and part of UniProt)
http://pir.georgetown.edu/pirw
ww/
Genome sequencing and other database sites

The proteomics server (Expert
Protein Analysis System) of SIB
http://www.expasy.org/
The bioinformatics toolbox of the

EBI
http://www.ebi.ac.uk/services

TM 11 Bioinformatika (Biologi Molekuler 2014)

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

TM 11 Bioinformatika (Biologi Molekuler 2014)

Uploaded by

Copyright:

Available Formats

TATAP MUKA 11

Learning Outcome (LO)

Fig. 9.1 The core of bioinformatics is

LO 47: menjelaskan ruang lingkup bioinformatika

The role of the computer

Perkembangan komputer berjalan dengan cepat:

Biological data sets

(c) An annotated version of the

(a) A short DNA

Persyaratan urutan basa menjadi informasi

LO 49: menjelaskan pembuatan dan penggunaan

LO 49: menjelaskan pembuatan dan penggunaan

Generation and organisation of information

Nucleic acid databases

Nucleic acid sequence database sites

The European Nucleotide Archive

DNA Data Bank of Japan

Genome sequencing and other database sites

The Wellcome Trust Sanger

Databases at the European

Databases at the National Center

Fig. 9.3 Early growth of global nucleic acid sequence

LO 88: menjelaskan pangkalan data asam nukleat

Fig. 9.5 Growth of the EMBL nucleic acid sequence database

Sekuensing langsung protein dengan metode

Database yang tersedia saat ini merupakan sumber

Inti sentral UniProt adalah database UniParc dan

Table 9.3. Protein sequence database

SwissProt (the SIB protein resource http://www.expasy.org/

Genome sequencing and other database sites

The bioinformatics toolbox of the

LO 89: menjelaskan pangkalan data protein

You might also like