You are on page 1of 21

TATAP MUKA 11

Learning Outcome (LO)


LO 47: menjelaskan ruang lingkup bioinformatika
LO 48: menjelaskan penggunaan komputer dalam
analisis data biologis
LO 49: menjelaskan pembuatan dan penggunaan
data biologis
LO 50: menjelaskan pangkalan data asam nukleat
LO 51: menjelaskan pangkalan data protein

What is Bioinformatics?
Bioinformatika dapat
didefinisikan secara
sederhana sebagai
penggunaan
teknologi informasi
(TI) untuk
menganalisis
kumpulan data
biologis
Bioinformatika
menghubungkan
bidang Bioscience
dan ilmu komputer.

Fig. 9.1 The core of bioinformatics is


the database. The two key supporting
branches are data input (here shown to
the left of the vertical line) and data
management (shown to the right of the
vertical line). Data management relies on
hardware and software developments,
with data input requiring the generation
of data using experimental techniques
such as DNA sequencing.

Bioinformatika tidak
hanya menggunakan
komputer untuk
melihat data sekuens.
Bioinformatika sebagai
cabang utama
bioscience modern,
dengan berbagai alat
canggih untuk
menganalisis gen dan
protein in vivo, in
vitro , dan in silico.
Elemen kunci
bioinformatika
disajikan pada Gambar.
9.1.

LO 47: menjelaskan ruang lingkup bioinformatika

The role of the computer


Komputer ideal untuk tugas
menganalisis kumpulan data
yang kompleks, seperti data
urutan untuk asam nukleat
dan protein.
1)Komputer
tidak kenal lelah
2)umumnya tidak membuat
kesalahan jika diprogram
dengan benar
3)dapat
menyimpan
sejumlah besar informasi
Istilah baru seperti
data warehouse
(toko informasi) dan
dalam
bentuk digital.
data mining (interogasi database berbagai jenis) telah
diciptakan
untuk
menggambarkan
aspek
bioinformatika, dengan text mining (interogasi database
bibliografi) memberikan peran pendukung penting.
LO 48: menjelaskan penggunaan komputer dalam

Perkembangan komputer berjalan dengan cepat:


Istilah baru
warehouse (toko informasi)
data mining (interogasi database berbagai
jenis)
text mining (interogasi database bibliografi)
Perangkat keras
desktop dan server
desktop yang relatif murah cukup kuat untuk
mengakses berbagai database
tidak ada kendala dalam mengakses dan
menggunakan informasi
Perangkat lunak
Sebagian
besar
perangkat
lunak
yang
diperlukan untuk manipulasi dan interogasi
terhadap informasi sekarang tersedia gratis
beberapa
paket
yang
tersedia
secara
komersial. penggunaan komputer dalam
LO 48: menjelaskan

Biological data sets


Bisa dikatakan bahwa bioinformatika benarbenar mulai lepas landas dengan munculnya
metode sekuensing DNA cepat pada akhir
tahun 1970.
laju akuisisi data sekuens biologis terbatas
tekanan
relatif
sedikit
untuk
mengembangkan penyimpanan umum dan
metode analisis informasi.
Ketika teknik sekuensing menjadi mapan dan
digunakan lebih luas
tingkat pembuatan data jelas meningkat
kebutuhan
manajemen
database
terkoordinasi menjadi lebih besar.
Kebutuhan ini diilustrasikan secara sederhana
menggunakan
beberapa dan
datapenggunaan
sekuens DNA
LO 49: menjelaskan
pembuatan

(c) An annotated version of the


sequence, with the three reading
frames identified as RF1, RF2, and
RF3. The numbering shows bases
from the start of the chromosome.
The region shown here is therefore
some 24 million base pairs from the
LO
49:
menjelaskan
end
of the
chromosome. pembuatan

(a) A short DNA


sequence is shown in
double-stranded
format
(b) Three different
ways
of writing the sequence
are shown: i, ii, and iii.
By convention only one
strand is listed. In (b)i
uppercase type is used
with numbering above
every 10 bases. In (b)ii
spaces are used to
separate groups of 10
bases, and in (b)iii
lowercase type is used
with separation.
Lowercase type avoids
any confusion between
G and C, as g and c are
more easily
distinguished

dan penggunaan

Persyaratan urutan basa menjadi informasi


Ditulis secara akurat dan informatif
Dipresentasikan dengan jelas dan logis
dalam format visual
Dijelaskan orientasi dan identifikasi fitur
konsistensi penggunaan anotasi
(penjelasan) oleh pengguna yang berbeda

LO 49: menjelaskan pembuatan dan penggunaan

LO 49: menjelaskan pembuatan dan penggunaan

Generation and organisation of information


Pembuatan data merupakan bagian utama
dari setiap prosedur ilmiah dan merupakan
inti dari bioinformatika.
Sekuensing
DNA
merupakan
prosedur
pertama untuk menghasilkan data dalam
jumlah cukup besar yang memerlukan
koordinasi dan organisasi database biologis
Tonggak signifikan terjadi pada penentuan
urutan basa genom:
bakteriofag phi-X174 (5 386 pasangan
basa, 1977)
lambda (48 502 pasangan basa, 1982).
LO 87: menjelaskan pembuatan dan penggunaan

Nucleic acid databases


Table 9.2. Nucleic acid sequence database
websites
Site/page

URL

Nucleic acid sequence database sites


International Nucleotide Sequence
Database Collaboration (INSDC)

http://www.insdc.org/

The European Nucleotide Archive


(ENA)

http://www.ebi.ac.uk/ena/

GenBank

http://www.ncbi.nlm.nih.gov/ge
nbank/

DNA Data Bank of Japan

http://www.ddbj.nig.ac.jp/

Genome sequencing and other database sites

LO

The Wellcome Trust Sanger


Institute

http://www.sanger.ac.uk/

Databases at the European


Bioinformatics Institute (EBI)

http://www.ebi.ac.uk/services

Databases at the National Center


http://www.ncbi.nlm.nih.gov/gui
for menjelaskan pangkalan
de/all/#databases_
88:
data asam nukleat

Fig. 9.3 Early growth of global nucleic acid sequence


database entries. Entries are
presented as gigabases of sequence data accumulating over the
LO period
88: menjelaskan
pangkalan data asam nukleat
19821994.

Fig. 9.4 Growth in the Genbank database from 1995. Total sequence
data and GenBank-derived sequence data are shown. A measure of the
use of the information is shown by the number of database searches
requested
per
day.
Modified
from
data
supplied
by
NCBI
(www.ncbi.nlm.nih.gov/Genbank), with permission.

LO 88: menjelaskan pangkalan data asam nukleat

Fig. 9.5 Growth of the EMBL nucleic acid sequence database


(EMBL-Bank) since 1995.
The release version of the database is indicated by RL, with key release
versions 52, 65, 78, 79, and 85 shown. These represent the 1, 10, and 100
gb milestones (releases 52, 65, and 85) and also a period of exceptional
growth of the database (between releases 78 and 79). The figure was
produced using data provided by the EMBL-European Bioinformatics
Institute,
UK (www.ebi.ac.uk),
with permission.
LO
88: Hinxton,
menjelaskan
pangkalan
data asam nukleat

Protein databases
Database Protein:
urutan protein ditentukan dengan metode
langsung,
urutan protein yang berasal dari database
informasi asam nukleat melalui translasi
urutan mRNA prediksi.
Salah
satu
tantangan
utama
untuk
pengembang
database
adalah
untuk
memastikan
bahwa
database
dapat
'berbicara' satu sama lain, sehingga konversi
data kompleks sedapat mungkin dihindari.
LO 89: menjelaskan pangkalan data protein

Sekuensing langsung protein dengan metode


degradasi Edman klasik pertama kali pada tahun
1950.
Namun, tingkat pertumbuhan database protein
primer kurang spektakuler dibandingkan asam
nukleat.
Hal ini sebagian besar disebabkan oleh
kesulitan dalam menentukan urutan asam amino
dari protein - sekuens asam amino yang tidak
dapat diduplikasi seperti gen, dan protein adalah
struktur tiga dimensi yang kompleks dengan
aktivitas biologis tergantung pada aspek urutan
primer.
Meskipun perkembangan terakhir dalam teknik
sekuensing protein (misalnya otomatisasi prosedur
Edman, penggunaan spektrometri massa) sangat
meningkatkan data protein, namun sekuensing DNA
terklon
selalu akan
memberikan
lebih cepat
LO 89:
menjelaskan
pangkalan
datadata
protein

Database yang tersedia saat ini merupakan sumber


tak ternilai bagi masyarakat biologis.
Database UniProt (The Universal Protein Resource)
merupakan hasil kolaborasi erat antara repositori
urutan protein utama di Eropa dan Amerika Serikat.
UniProt didirikan pada tahun 2002, dengan tiga mitra
utama yang terlibat.
The Protein Information Resource (PIR), Georgetown
University, USA
SWISSPROT, the Swiss Institute for Bioinformatics
the EBI.

Inti sentral UniProt adalah database UniParc dan


UniProt Knowledgebase (UniProt KB)
Pada tahun 2007
UniParc memiliki 7,7 juta entri
UniProt KB sekitar 3,5 juta entri.
Rincian lebih lanjut tentang UniProt dan komponen
yang terkait dapat ditemukan di situs web yang
LO 89:
menjelaskan
pangkalan
data protein
tercantum
dalam Tabel
9.3

Table 9.3. Protein sequence database


websites
Site/page

URL

Database sites
UniProt the key gateway site for
protein database information

http://www.uniprot.org/

SwissProt (the SIB protein resource http://www.expasy.org/


and part of UniProt)
The Protein Information Resource
(PIR, hosted by Georgetown
University, and part of UniProt)

http://pir.georgetown.edu/pirw
ww/

Genome sequencing and other database sites


The proteomics server (Expert
Protein Analysis System) of SIB

http://www.expasy.org/

The bioinformatics toolbox of the


EBI

http://www.ebi.ac.uk/services

LO 89: menjelaskan pangkalan data protein

You might also like