You are on page 1of 8

Nama : Ika Setiawaty

Mata Kuliah : Sistem Teknologi Informasi


Judul : Database, Data Warehouse, and Data Mining
NIM : A062172016

1. Teknologi Database
Database adalah kumpulan catatan yang tersimpan secara sistematis. Volatile
mengacu pada fakta bahwa data terus berubah. Queries adalah permintaan penggunaan
ad hoc untuk data tertentu. Database management systems (DBMS) adalah program
computer yang digunakan untuk mengelola penambahan, pembaruan, dan
penghapusan data saat transaksi terjadi; dan mendukung kueri data dan pelaporan,
mereka adalah sistem OLTP. Sistem Online transaction processing (OLTP) dirancang
untuk mengelola data transaksi yang mudah berubah.
Ketika sebagian besar transaksi bisnis terjadi-misalnya, barang dijual atau
dikembalikan, pesanan dikirim atau dibatalkan, pembayaran atau deposit dilakukan-
perubahan segera dilakukan ke database. Lihat Gambar 3.3. Perubahan online ini
adalah penambahan, pembaruan, atau penghapusan. Database management system
(DBMS) mencatat dan memproses transaksi dalam database; dan mendukung kueri dan
pelaporan. Dengan fungsinya, DBMS disebut sebagai sistem pemrosesan transaksi
online (OLTP). OLTP adalah desain database yang memecah informasi kompleks
menjadi tabel data sederhana. Desain ini sangat efisien untuk menganalisa dan
melaporkan data transaksional yang ditangkap. Database OLTP mampu memproses
jutaan transaksi setiap detiknya.
Ada dua tipe dasar database: terpusat dan terdistribusi. Untuk kedua jenis
database, beberapa backup atau arsip data dipelihara di tempat dan di luar lokasi.
A. Centralized Database Architecture
Database terpusat menyimpan semua file terkait di lokasi fisik pusat, seperti
yang ditunjukkan pada Gambar 3.4 , Selama beberapa dekade, platform database utama
terdiri dari file database terpusat pada komputer mainframe yang besar, terutama
karena investasi modal dan biaya operasi yang sangat besar terkait dengan sistem
alternatif. Manfaat konfigurasi database terpusat meliputi:
1) Kualitas yang lebih baik. Konsistensi data lebih mudah bila data disimpan
secara fisik di satu lokasi karena penambahan data, update, dan penghapusan
dapat dilakukan dengan cara yang diawasi dan tertib.
2) Keamanan yang lebih baik. Data diakses melalui komputer host terpusat, di
mana mereka dapat dilindungi dengan lebih mudah dari akses atau modifikasi
yang tidak sah.
Kerugian utama dari database terpusat, seperti semua sistem terpusat, adalah
penundaan transmisi saat pengguna terdispersi secara geo.
A. Distributed Database Architecture
Sistem basis data terdistribusi memungkinkan aplikasi pada komputer dan
ponsel untuk mengakses data dari database lokal dan remote, seperti yang ditunjukkan
pada Gambar 3.5. Database terdistribusi menggunakan arsitektur client / server untuk
memproses permintaan informasi. Komputer dan perangkat seluler yang mengakses
server disebut klien. Database disimpan di server yang berada di pusat data perusahaan,
awan pribadi, atau awan publik
Dengan demikian, database perlu menyeimbangkan antara efisiensi
pemrosesan transaksi dan efisiensi query. Dengan fungsi ini, database tidak dapat
dioptimalkan untuk data mining, pemrosesan analisis online yang kompleks (OLAP),
dan dukungan keputusan. Keterbatasan database ini menyebabkan diperkenalkannya
teknologi data warehouse
DATABASE MANAGEMENT SYSTEM (DBMS) FUNCTIONS
Fungsi data utama yang dilakukan oleh DBMS meliputi:
1) Penyaringan dan pembuatan data: Memeriksa data kesalahan, inkonsistensi,
redundansi, dan informasi yang tidak lengkap.
2) Integritas data: Memperbaiki, standarisasi, dan memverifikasi integritas data.
3) Sinkronisasi data: Mengintegrasikan, mencocokkan, atau menghubungkan data
dari sumber yang berbeda.
4) Pengayaan data: Meningkatkan data dengan menggunakan informasi dari
sumber data internal dan eksternal.
5) Pemeliharaan data: Memeriksa dan mengendalikan integritas data dari waktu
ke waktu.

GARBAGE-IN, GARBAGE OUT


Pengumpulan data adalah proses yang sangat kompleks sehingga dapat
menimbulkan masalah mengenai kualitas data yang sedang dikumpulkan. Oleh karena
itu, terlepas dari bagaimana data dikumpulkan, mereka perlu divalidasi sehingga
pengguna tahu bahwa mereka dapat mempercayainya. ekspresi klasik yang meringkas
situasi yang “sampah masuk, sampah keluar” (GIGO) dan berpotensi berisiko “sampah,
gospel keluar.”

Tiga prinsip data umum berhubungan dengan perspektif siklus hidup data dan
membantu memandu keputusan investasi TI.

1. Prinsip Mengurangi Nilai Data. Nilai data berkurang seiring bertambahnya


usia. Ini adalah prinsip yang sederhana namun kuat. Sebagian besar organisasi
tidak dapat beroperasi pada kinerja puncak dengan blind spot (kekurangan
ketersediaan data) 30 hari atau lebih. Lembaga layanan keuangan global,
seperti BNP Paribas, membutuhkan data real time yang mendekati kinerja
puncak.
2. Prinsip penggunaan data 90/90. Menurut prinsip penggunaan data 90/90,
mayoritas data yang tersimpan, setinggi 90 persen, jarang diakses setelah 90
hari (kecuali untuk tujuan audit). Artinya, sekitar 90 persen data kehilangan
sebagian besar nilainya setelah tiga bulan.
3. Prinsip data dalam konteks. Kemampuan untuk menangkap, memproses,
format, dan mendistribusikan data dalam waktu dekat atau lebih cepat
memerlukan investasi besar dalam arsitektur data (Bab 2) dan infrastruktur
untuk menghubungkan sistem POS jarak jauh dengan penyimpanan data,
sistem analisis data, dan aplikasi pelaporan. Investasi dapat dibenarkan dengan
prinsip bahwa data harus diintegrasikan, diolah, dianalisis, dan diformat
menjadi "informasi yang dapat ditindaklanjuti". Seiring data menjadi lebih
kompleks dan volume mereka meledak, kinerja database menurun. Salah satu
solusinya adalah penggunaan data master dan master data management
(MDM) yang akan dibahas selanjutnya.
Master Data Management (MDM)
Seperangkat proses untuk mengintegrasikan data dari berbagai sumber atau
aplikasi perusahaan untuk menciptakan dan mempertahankan tampilan yang lebih
terpadu dari pelanggan, produk, atau entitas data inti lainnya yang dibagi di seluruh
sistem. Gambar 3.9 menunjukkan bagaimana data master berfungsi sebagai lapisan
antara data transaksional dalam database dan data analisis di gudang data.
Tampilan Lebih Bersatu, namun Tidak Tunggal. Meskipun vendor dapat
mengklaim bahwa solusi MDM mereka menciptakan "satu versi kebenaran," klaim ini
mungkin tidak benar. Pada kenyataannya MDM tidak dapat membuat satu versi data
bersatu karena membangun tampilan yang sama sekali terpadu dari semua data master
sama sekali tidak mungkin dilakukan.
Entitas Induk Referensi dan Entitas Induk. Secara realistis, MDM
mengkonsolidasikan data dari berbagai sumber data menjadi file referensi utama, yang
kemudian memasukkan data ke aplikasi, sehingga menghasilkan data yang akurat dan
konsisten di seluruh perusahaan.

2. Data Warehouse and Data Mart Technology


Data warehouse yang mengintegrasikan data dari database ke seluruh
perusahaan disebut Enterprise Data Warehouse (EDW). Data mart lebih kecil dan
melayani departemen atau fungsi tertentu, seperti keuangan, pemasaran, atau operasi.
Pertimbangkan database bank. Setiap deposit, withdrawal, pembayaran pinjaman, atau
transaksi lainnya menambah atau mengubah data. Ketidakstabilan yang disebabkan
oleh proses transaksi konstan membuat analisis data menjadi sulit - dan tuntutan untuk
memproses jutaan transaksi per detik menghabiskan kekuatan pemrosesan basis data.
Untuk mengatasi masalah ini, data diekstrak dari database yang ditunjuk,
ditransformasikan, dan dimasukkan ke dalam gudang data. Secara signifikan, di
gudang data, data hanya bisa dibaca; Artinya, mereka tidak dapat berubah sampai ETL
berikutnya. Tidak seperti database, data gudang tidak mudah berubah. Dengan
demikian, gudang data dirancang sebagai sistem pemrosesan analisis online (OLAP),
yang berarti data dapat dipertanyakan dan dianalisis jauh lebih efisien daripada
database aplikasi OLTP. OLAP adalah istilah yang digunakan untuk menggambarkan
analisis data kompleks dari data warehouse.
Tren ini menuju data pergudangan dan analisis data real-time-yaitu gudang data
aktif (ADW). Dulu, gudang data terutama mendukung aplikasi strategis, yang tidak
memerlukan waktu respon instan, interaksi pelanggan langsung, atau integrasi dengan
sistem operasional. ETL mungkin sudah dilakukan satu kali per minggu atau sekali per
bulan. Saat ini, bisnis semakin banyak menggunakan informasi pada saat ini untuk
mendukung interaksi pelanggan real-time. Perusahaan dengan ADW dapat berinteraksi
secara tepat dengan pelanggan untuk memberikan layanan pelanggan yang superior,
yang pada gilirannya meningkatkan pendapatan. Dengan ADW, pengecer dapat
menghilangkan terputusnya hubungan dengan meningkatkan komunikasi antar
pedagang, vendor, pelanggan, dan rekan sepanjang hari, sehingga memungkinkan
mereka merespons kejadian bisnis dalam waktu dekat

Perbandingan Database, Data Warehouses, dan Data Mart


Database adalah:
1) Dirancang dan dioptimalkan untuk memastikan agar setiap transaksi dicatat dan
disimpan segera.
2) Volatile karena data terus diperbarui, ditambah, atau diedit.
3) Sistem pemrosesan transaksi online (OLTP) karena transaksi harus dicatat dan
diproses sebagaimana adanya, yaitu secara real time.
Data warehouse dan data mart adalah:
1) Dirancang dan dioptimalkan untuk analisis dan respons cepat terhadap kueri.
2) Nonvolatile, yang berarti bahwa ketika data disimpan, mereka hanya dapat
dibaca dan tidak pernah dihapus sehingga bisa digunakan untuk perbandingan
dengan data yang lebih baru.
3) Sistem pemrosesan analitik online (OLAP).
4) Subjek yang berorientasi, yang berarti data yang ditangkap diatur agar data
serupa dihubungkan bersama.
3. Data and Text Mining
Alat data mining adalah perangkat lunak khusus yang digunakan untuk
menganalisis data untuk menemukan pola, hubungan, tren, atau hubungan bermakna
lainnya. Data mining, yang juga disebut data discovery, adalah proses menganalisis
data dari perspektif yang berbeda dan menyimpulkannya menjadi informasi yang dapat
digunakan untuk meningkatkan pendapatan, menurunkan biaya, atau keduanya.
Perangkat lunak data mining memungkinkan pengguna untuk menganalisis data dari
berbagai dimensi atau sudut, mengkategorikannya, dan menemukan korelasi atau pola
di antara bidang data warehouse.
Sampai 75 persen data organisasi adalah dokumen pengolah kata yang tidak
terstruktur, media sosial, pesan teks, audio, video, gambar dan diagram, faks dan
memo, call center atau catatan klaim, dan sebagainya. Penambangan teks adalah
kategori luas yang melibatkan interpretasi kata dan konsep dalam konteks. Setiap
pelanggan menjadi advokat atau lawan merek dengan secara bebas mengekspresikan
pendapat dan sikap yang menjangkau jutaan pelanggan saat ini atau calon pelanggan
lainnya di media sosial. Penambangan teks membantu perusahaan untuk
memanfaatkan ledakan opini pelanggan yang diungkapkan secara online. Komentar
sosial dan media sosial ditambang untuk analisis sentimen atau untuk memahami
maksud konsumen. Perusahaan yang inovatif tahu bahwa mereka bisa lebih berhasil
dalam memenuhi kebutuhan pelanggan mereka, jika mereka hanya memahaminya
dengan lebih baik. Analisis teks terbukti menjadi alat yang sangat berharga dalam
melakukan hal ini. Alat dan teknik untuk menganalisis teks, dokumen, dan konten tidak
terstruktur lainnya tersedia dari beberapa vendor.
Menggabungkan data dan text mining bisa menciptakan nilai lebih besar lagi.

4. Business Intelligence (BI) and Analytics


Perusahaan menggunakan solusi BI untuk mengetahui pertanyaan apa yang
harus diajukan dan menemukan jawabannya. Alat BI mengintegrasikan dan
mengkonsolidasikan data dari berbagai sumber internal dan eksternal dan kemudian
memprosesnya menjadi informasi untuk mengambil keputusan cerdas. Menurut The
Data Warehousing Institute (TDWI) dan Business Intelligence Journal, BI
"menyatukan data, teknologi, analisis, dan pengetahuan manusia untuk
mengoptimalkan keputusan bisnis dan pada akhirnya mendorong kesuksesan sebuah
perusahaan. Program BI biasanya menggabungkan data warehouse perusahaan dan
platform BI atau tool set untuk mentransformasikan data menjadi informasi bisnis yang
dapat diajukan dan dapat ditindaklanjuti "(TDWI, 2012).
Selama bertahun-tahun, para manajer mengandalkan analisis bisnis untuk
membuat keputusan yang lebih baik. Beberapa survei dan studi sepakat mengenai
pentingnya BI dalam menganalisis kinerja masa lalu dan mengidentifikasi peluang
untuk memperbaiki kinerja di masa depan. Kondisi bisnis yang kompleks dan
kompetitif tidak meninggalkan banyak kesalahan. Untuk meminimalkan kesalahan,
manajer mengandalkan teknologi analisis bisnis untuk memprediksi tren secara akurat
dan mengetahui bagaimana meresponsnya lebih awal.
Apa yang dimulai sebagai alat untuk mendukung departemen penjualan,
pemasaran, dan layanan pelanggan telah berkembang secara luas menjadi platform
strategis perusahaan. Sementara sistem BI digunakan dalam pengelolaan operasional
divisi dan proses bisnis, namun juga digunakan untuk mendukung pengambilan
keputusan strategis perusahaan. Perubahan dramatis yang telah terjadi dalam beberapa
tahun terakhir adalah pertumbuhan permintaan intelijen operasional di berbagai sistem
dan bisnis - meningkatkan jumlah orang yang membutuhkan akses terhadap
peningkatan jumlah data.

Arsitektur BI sedang mengalami kemajuan teknologi dalam menanggapi data


besar dan tuntutan kinerja pengguna akhir (Watson, 2012). Vendor BI menghadapi
tantangan sosial, sensor, dan jenis data baru lainnya yang harus dikelola dan dianalisis.
Salah satu kemajuan teknologi yang bisa membantu menangani data besar adalah BI di
cloud. BI dapat dihosting di awan publik atau swasta. Dengan awan publik, penyedia
layanan menghosting data dan / atau perangkat lunak yang diakses melalui koneksi
Internet. Untuk awan pribadi, perusahaan ini menyimpan data dan perangkat lunaknya
sendiri, namun menggunakan teknologi berbasis cloud.

Bagi BI berbasis cloud, pilihan populer yang ditawarkan oleh sejumlah vendor
alat BI adalah software-as-a-service (SaaS). MicroStrategy menawarkan
MicroStrategy Cloud, yang menawarkan penyebaran cepat dengan mengurangi risiko
dan biaya proyek. Pendekatan awan ini menarik bagi perusahaan kecil dan menengah
yang memiliki staf TI terbatas dan ingin mengendalikan biaya dengan hati-hati.
Kerugian potensial meliputi waktu respons yang lebih lambat, risiko keamanan, dan
risiko cadangan.

You might also like