l
Teknologi database cenderung membentuk suatu
konfigurasi sistem pengolahan data yang terpusat.
l
Secara teoretis database
dapat didistribusikan dimana datanya didistribusikan ke berbagai tipe
konfigurasi
l
Sebelum mendistribusikan database perlu
ditentukan lokasi dan mapping antara database akan ditanamkan atau dilaksanakan.
l
Jadi data dapat berada dilokasi yang jauh, lalu
sistem yang mencarinya.
Konsep Basis Data Terdistribusi
1.
Sistem Komputasi Terdistribusi adalah
l
sejumlah elemen proses yang terkoneksi melalui
jaringan komputer dan saling bekerjasama dalam melakukan suatu tugas
2.
Basis Data Terdistribusi adalah
l
kumpulan basis-basis data yang saling
berhubungan secara logika dan tersebar pada sebuah jaringan komputer
3.
Sistem Manajemen Basis Data adalah
l
sebuah sistem software yang mengelola basis data
terdistribusi
Distributed
Processing (Distributed Computing)
1.
Apa
itu Distributed Processing (Distributed Computing)?
2.
Beberapa
sinonim dari Distributed Processing:
l
Distributed
Function: Distribusi fungsi (CPU atau I/O) meskipun dalam sistem
single-processor komputer.
l
Distributed
Computing System: Interkoneksi sejumlah elemen-elemen pengolahan (computing
device yang dapat mengeksekusi program di masing-masing) dalam suatu jaringan
komputer dan bekerjasama dalam menjalankan suatu tugas.
l
Network
l
Multiprocessors
l
Timeshared
systems
3.
Apa
yang didistribusikan?
l
Processing
logic, seperti definisi dari Distributed Computing System diatas.
l
Functions,
pendelegasian ke bermacam-macam hardware/software (tergantung fungsi komputer)
l
Data,
pendistribusian data ke sejumlah site pengolahan.
l
Control,
kontrol eksekusi sejumlah task secara terdistribusi.
DEFINISI
Basis Data Terdistribusi adalah kumpulan data
logic yang saling berhubungan secara fisik terdistribusi dalam jaringan
komputer, yang tidak tergantung dari program
aplikasi sekarang maupun masa yang akan datang.
File merupakan kumpulan data yang dirancang untuk suatu
aplikasi atau sekumpulan aplikasi yang dekat hubungannya.
1. Distribusi data yang terpisah secara fisik
akan menimbulkan masalah yang tidak dijumpai ketika database ada di komputer
yang sama.
à Inilah yang membedakan antara DDBS dengan
Multiprocessor.
2. DDBS bukan merupakan sistem dimana
meskipun ada jaringan komputer, tapi databasenya hanya terletak disatu node
dari jaringan tsb.
Jaringan Komputer atau Kolesi File, tidak cukup
untuk membentuk DDBS!!!.
Contoh Basis Data Terdistribusi
l
Misalnya sebuah bank yang memiliki banyak
cabang, bahkan di sebuah kota bisa terdiri dari beberapa cabang/kantor.
l
Masing-masing lokasi memiliki jaringan lokal
sendiri, dan semua jaringan lokal itu dihubungkan satu sama lain membentuk
sebuah jaringan nasional.
Struktur Basis Data Terdistribusi
1.
Sebuah sistem basis data terdistribusi hanya
mungkin dibangun dalam sebuah sistem jaringan komputer.
2.
Topologi Jaringan
a.
Topologi Bintang (star)
b.
Topologi Cincin (ring)
c.
Topologi Bus
3.
Perbedaan utama di antara berbagai topologi di
atas terletak pada:
a.
Biaya Instalasi
Biaya
dalam membangun hubungan link antar
simpul.
b.
Biaya Komunikasi
Waktu dan biaya dalam
pengoperasian sistem berupa pengiriman data dari satu simpul ke simpula lain
c. Kehandalan
Frekuensi/tingkat kegagalan
komunikasi yang terjadi.
d. Ketersediaan
Tingkat kesiapan data yang
dapat diakses sebagai antisipasi kegagalan komunikasi.
Jenis Transaksi
l
Transaksi Lokal
Transaksi
yang mengakses data pada suatu simpul (mesin/server) yang sama dengan simpul
dari mana transaksi tersebut dijalankan.
l
Transaksi Global.
Transaksi
yang membutuhkan pengaksesan data di simpul yang berbeda dengan simpul dimana
transaksi tersebut dijalankan, atau transaksi dari sebuah simpul yang
membutuhkan pengaksesan data ke sejumlah simpul lainnya
Ciri Ciri Basis Data Terdistribusi
l
Data disimpan di sejumlah tempat
l
Prosessor pada tempat yang berbeda tersebut
dihubungkan dengan jaringan komputer
l
Sistem basis data terdistribusi bukan terdiri
dari sekumpulan file yang berada pada berbagai tempat tetapi pada sebuah basis
data di berbagai tempat
l
Setiap tempat secara mandiri memproses
permintaan user yang membutuhkan akses ke data di tempat tersebut dan juga
mampu untuk memproses data yang tersimpan di tempat lain.
Teknologi
DDBS (Distributed Database System)
1.
merupakan
gabungan dari dua pendekatan pengolahan data yang sama sekali berlawanan
:
l
Database System, dan
l
Teknologi
Jaringan Komputer.
2.
Tujuan
utama Database System
l
Mengintegrasikan
data dan sentralisasi, sehingga akses (deskripsi, manipulasi dan kontrol)
terhadap data sangat terkontrol
à Integration, not Centralization
3.
Tujuan
utama Jaringan Komputer
l
Membuat mode kerja yang
benar-benar menghindari terjadinya sentralisasi beban kerja.
4.
Teknologi
DDBS mengintegrasikan sistem database yang terdistribusi, untuk menghasilkan suatu teknologi yang powerful
dan menjanjikan
à Integration without Centralization
Keuntungan yang diberikan oleh sistem basis data
terdistribusi
l
Pembagian
dan pemakaian data dan kontrol yang tersebar
l
Pengelolaan secara transparan data yang
terdistribusi
l
Mengacu pada struktur organisasi
l
Meningkatkan untuk berbagi dan otonomi lokal
l
Meningkatkan ketersediaan data
l
Meningkatkan performasi kerja
l
Memudahkan pengembangan sistem
l
Kecepatan query
Kerugian yang diberikan sistem basis data terdistribusi
l
Kompleksitas manajemen
l
Kontrol integritas lebih sulit
l
Biaya pengembangan
l
Potensi
sumber kesalahan program (bug) yang lebih besar
l
Peningkatan
waktu proses (overhead)
l
Keamanan
l
Sulitnya standarisasi
l
Menambah kebutuhan penyimpanan
l
Lebih sulit dalam mengatur lingkungan data
Struktur dari database terdistribusi
l
Sistem database terdistribusi terdiri dari
kumpulan tempat, masing-masing memelihara sistem database lokalnya,
masing-masing tempat dapat memproses transaksi lokal.
l
Beberapa konfigurasi dari sistem database
terdistribusi:
l
Fully connected Network
l
Partially connected Network
l
Tree connected Network
l
Star network
Fully connected Network
Partially connected Network
Tree connected Network
Star Network
DESAIN BASIS DATA TERDISTRIBUSI
l Ada
beberapa pendekatan yang berkaitan dengan penyimpanan data/tabel dalam sebuah
sistem basis data terdistribusi, yaitu
1. Replikasi
2. Fragmentasi
3. Replikasi dan Fragmentasi
1. Replikasi
l Sistem
memelihara sejumlah salinan/duplikat tabel-tabel data.
l Setiap
salinan tersimpan dalam simpul yang berbeda, yang menghasilkan replikasi data
2. Fragmentasi
l Data
dalam tabel dipilah dan disebar ke dalam sejumlah fragmen.
l Tiap
fragmen disimpan di sejumlah simpul yang berbeda-beda.
l Fragmentasi
dapat berbentuk fragmentasi horizontal (pemilahan record data) atau fragmentasi
vertikal pemilahan field/atribut data)
3. Replikasi dan Fragmentasi
l Merupakan
kombinasi dari replikasi dan fragmentasi.
l Data/tabel
dipilah dalam sejumlah fragmen.
Keuntungan &
kerugian :
1.
Ketersediaan yang tinggi.
2.
Peningkatan Keparalelan (Increased paralelism)
3.
Peningkatan beban pengubahan data (Increased overhead on upate)
Fragmentasi Data
l Dapat
diterapkan operasi union ataupun operasi natural join.
l Contoh
nasabah
= (no_nas, nama_nas, alamat_nas, kota, saldo_simpan, saldo pinjam)
l Fragmentasi
Horizontal
nasabah1 = skota=‘Medan’ (nasabah)
nasabah2
= skota=‘Padang’ (nasabah)
Fragmentasi Data – Horizontal
l Akan
diperoleh 2 buah fragemen
- Fragmen Nasabah1
- Fragmen Nasabah2
l Terapkan
operasi union
nasabah
= nasabah1 È
nasabah2
l Fragmentasi
Vertikal
nasabah1
= pno_nas, nama_nas, alamat,
kota (nasabah)
nasabah2
= pno_nas, saldo_simpan
(nasabah)
nasabah3
= pno_nas, saldo_pinjam
(nasabah)
l Replikasi
dan Fragmentasi
Upaya
untuk replikasi dan fragmentasi data dapat dilakukan sekaligus pada sebuah
tabel, yaitu dengan mereplikasi fragmen-fragmen yang telah terbentuk. Misalnya,
dalam sebuah sistem terdistribusi terdapat 5 buah simpul S1, S2, S3, S4 dan S5.
Kita
dapat memilah tabel nasabah sesuai dengan kota dimana nasabah mengajukan
permohonan menjadi nasabah1, nasabah2 dan nasabah3.
Kemudian
dengan pertimbangan tertentu, fr agmen nasabah1 disimpan di simpul S1, S2 dan
S3. lalu fragmen nasabah2 disimpan disimpul S3 dan S4 dan fragmen nasabah3
disimpan di simpul S1 dan S3.
PEMROSESAN QUERY DALAM BASIS DATA TERDISTRIBUSI
l Dalam
sistem terpusat, kriteria utama untuk mengetahui cost dari sebuah strategi
query adalah jumlah/waktu akses ke disk.
l Faktor-fakor
yang perlu dipertimbangkan:
1.
Biaya/waktu untuk transmisi data
2.
Potensi peningkatan karena adanya sejumlah simpul yang dapat melaksanakan query
secara paralel.
Transformasi Query
l Jika
tabel telah direplikasi atau
difragmentasi atau sekaligus direplikasi dan fragmentasi maka kita dapat
memenuhi query tersebut dengan memilih salah satu simpul tempat suatu tabel
berada kemudian mengeksekusi qury.
l Jika
tabel tidak direplikasi atau difragmentasi, pemilihan simpul akan didasarkan
pada simpul yang memberikan ongkos transmisi data yang paling rendah.
l Jika
tabel difragmentasi dan ditempatkan di berbagai simpul yang berbeda, maka kita
harus melakukan operasi Join atau Union untuk merekonstruksi isi seluruh ini
disamping tergantung pada query, juga tergantung pada jenis fragmentasi yang
diterapkan terhadap tabel yang terlibat dalam query.
l Jika
fragmentasi yang dilakukan horizontal maka operasi Union dapat dilakukan.
l Jika
fragmentasi vertikal dan query menghendaki penayangan semua atribut maka
operasi Natural Join yang harus digunakan.
Contoh :
l Tabel
Mahasiswa
l Ekspresi
Standar dari query :
skota = ‘Bandung
(mahasiswa)
l Jika
tabel mahasiswa difragmentasi secara
horizontal di dua fragmen (diberi nama mahasiswa1 dan mahasiswa2) sehingga
tabel mahasiswa sesungguhnya merupakan hasil operasi Union dari keduanya.
mahasiswa1 È mahasiswa2
l Maka
query di atas dapat kita translasi menjadi :
skota=‘Bandung’ (mahasiswa1
È
mahasiswa2)
nice article
BalasHapusKomentar ini telah dihapus oleh pengarang.
BalasHapus