1. Overview BDT
• Apa itu sistem terdistribusi ?
Suatu kesatuan dari elemen-elemen yang saling berinteraksi secara sistematis dan teratur untuk mendistribusikan data, informasi, obyek dan layanan dari dan kepada pengguna yang terkait didalamnya
• Infrastruktur utama Sistem Terdistribusi
– Jaringan Komputer – LAN / MAN / WAN / Global
– Hardware, Software dan User yang terkait
• Tujuan Sistem Terdistribusi
– Mendukung layanan tersebar
– Mendukung sistem kerja jarak jauh
– Memudahkan kerja kelompok
• Tantangan Pengembangan Sistem Terdistribusi
– Keanekaragaman (heterogenity)
– Keterbukaan (openness)
– Keamanan (security)
– Skalabilitas (scalability)
– Penanganan masalah (error handling)
– Kebersamaan (conccurency)
– Penyembunyian (tranparency)
• Akses, lokasi, kebersamaan, replikasi, masalah
• Jenis Arsitektur Sistem Terdistribusi
– Client Server
– Tightly Coupled (Clustered)
– Peer to Peer
1. Standalone (one-tier)
CIRI-CIRI:
• Pemrosesan terjadi dalam 1 Mesin(Host)
• Tidak Proses Logic pada Client
KELEMAHAN:
Semakin banyak client
proses akan semakin berat
2. Client/Server (two-tier)
CIRI-CIRI:
• Pemrosesan terjadi di Server Dan Client
• Proses Logic pada Client &Server
• Server Penyedia data Client Pengakses Data
PEMBAGIAN LAYANAN:
• Layanan presentasi (tingkat client)
• Layanan bisnis (tingkat menengah)
• Layanan data (tingkat sumber data)
• Pemrosesan Terdistribusi/Distributed Computing Process Systemà Sekumpulan peralatan pemrosesan yang saling terhubung melalui jaringan komputer dan saling bekerjasama untuk mengerjakan tugas2 tertentu.
• Peralatan pemrosesanà peralatan komputasi yang dapat mengeksekusi sebuah program
• Macam2 peralatan pemrosesan :
1. Processing Logic/ Pemrosesan secara logik
2. Fungsi
3. Data
4. Control
• Distributed Database (DDB)/ Basis Data Terdistribusi (BDT)à sekumpulan database yang saling terhubung secara logical dan secara fisik terdistribusi pada berbagai tempat melalui jaringan komputer.
• Distributed Database Management System (DDBMS)/ Sistem Manajemen Basis Data Terdistribusi (SMBDT)à software yang mengelola BDT dan menyediakan mekanisme agar terdistribusi tersebut transparant di hadapan user.
• Distributed Database System (DDBS)/Sistem Basis Data Terdistribusi (SBDT)à DDB yang menggunakan DDBMS
Ciri-ciri untuk sistem bukan SBDT :
1. Sistem berupa sekumpulan file.
2. Berbagai arsitektur fisik berkait dengan sistem multi processor berikut ini :
a. Shared Memory Multiprocessor (disebut juga tightly couple)
Ciri-ciri SBDT :
1. Data disimpan pada sejumlah tempat. Setiap tempat secara logik terdiri dari processor tunggal.
2. Processor pada tempat yang berada tersebut dihubungkan dengan jaringan komputer.
3. SBDT bukan sekumpulan file yang berada pada berbagai tempat sebuah database pada berbagai tempat.
4. Setiap tempat mempunyai kemampuan untuk secara mandiri memproses permintaan user yang membutuhkan akses ke data di tempat tersebut dan mampu memproses data tersimpan di tempat lain.
Keuntungan SBDT :
1. Pengelolaan secara transparant data terdistribusi dan replicated.
Apa yang diharapkan dari transparani pengelolaan data??
a. Mengurangi ketergantungan data
b. Transparansi Jaringan
c. Transpirasi replikasi
d. Transparansi fragmentasi
2. Mengacu pada struktur organisasi
3. Meningkatkan kemampuan untuk berbagi dan otonomi lokal
4. Meningkatkan ketersediaan data
5. Meningkatkan kehandalan
6. Meningkatkan unjuk kerja
7. Memudahkan pengembangan sistem
Kerugian SBDT :
1. Kompleksitas manajemen
2. Kontrol integritas lebih sulit
3. Biaya pengembangan
4. Keamanan
5. Kurang standarisasi
6. Menambah kebutuhan penyimpanan
7. Lebih sulit dalam mengatur lingkungan data
8. Menambah biaya penelitian
2. SQL
MySQL adalah salah satu jenis program database server, berfungsi untuk mengolah , menyimpan dan memanipulasi data diserver.
create database ecommerce;
use ecommerce;
create table barang ( kd_bar char(7), nama_bar char(30),
jml_stok int,harga double);
desc barang;
ALTER TABLE `ecommerce`.`barang` CHANGE `jml_stok` `jml_stok` INT(6) DEFAULT NULL;
Tipe data SQL
• Identifier
digunakan untuk identifikasi objek BD, seperti nama tabel, nama view, dan kolom
• Karakter yang digunakan :
A….Z a….z 0….9 _
• Syarat :
– <= 128 karakter
– Dimulai dengan huruf
– Tidak ada spasi
Restrict : drop domain akan gagal jika domain tsb masih digunakan oleh tabel/ view yang ada
Cascade : tabel/view yang domainnya dihapus, maka nilainya sesuai default/tipe data dasar
• SQL DDL à membuat dan menghapus obyek-obyek basis data (schema, domain, tabel, view dan indeks)
• Sintaks utama SQL DDL :
CREATE SCHEMA DROP SCHEMA
CREATE/ALTER DOMAIN DROP DOMAIN
CREATE/ALTER TABLE DROP TABLE
CREATE VIEW DROP VIEW
• Beberapa DBMS mendukung : CREATE INDEX DROP INDEX
• Schema adalah kumpulan (bernama) dari obyek-obyek basis data yang saling terhubung
Tabel, view, domain, assertion, collation, translation dan himpunan karakter (satu pemilik)
CREATE SCHEMA [Nama | AUTHORIZATION CreatorId]
DROP SCHEMA Nama [RESTRICT | CASCADE]
View
Hasil dinamis dari satu atau lebih operasi relasional yang bekerja pada suatu relasi dasar untuk menghasilkan relasi lagi
• Virtual relasi sebenarnya tidak muncul secara nyata dalam basis data tetapi relasi tersebut akan dihasilkan pada saat ada permintaan
• Isi dari view ditentukan oleh query pada relasi dasar
• Dengan view resolution, suatu operasi pada view diterjemahkan dalam bentuk operasi yang bekerja pada relasi asal view tersebut diturunkan
• Dengan view materialization, suatu view disimpan sebagai tabel sementara, dengan maintain ketika relasi asal view tersebut diupdate
• Dengan view updatability, proses update pada tabel dasar akan mempengaruhi semua view yang termasuk, begitu juga sebaliknya
Privileges
• Mendefinisikan action yang boleh dilakukan user pada tabel dasar atau view :
SELECT Mendapatkan data dari suatu tabel
INSERT Menyisipkan baris baru ke tabel
UPDATE Mengubah baris pada tabel
DELETE Menghapus baris dari tabel
REFERENCES Me-refer kolom suatu tabel pada integrity constraint
USAGE Menggunakan domain, collation, himpunan karakter dan translations
3. Recovery Database
Konsep Recovery
Bila terjadi kegagalan pada transaksi basis data, maka basis data dikembalikan ke status lampau terdekat sebelum terjadi kegagalan
Untuk melakukan ini perlu disimpan informasi tentang perubahan terhadap data selama pelaksanaan transaksi di luar basis data itu sendiri. PERLU LOG!
Rollback
Mengembalikan harga suatu data item yang telah diubah oleh operasi-operasi dari transaksi ke harga sebelumnya.
Informasi pada log digunakan untuk mendapatkan harga lama dari data yang harus di rollback
Teknik-Teknik Recovery
Deferred Update
Menunda update yang sesungguhnya ke basis data sampai transaksi menyelesaikan eksekusinya dengan sukses dan mencapai titik commit.
Selama eksekusi masih berlangsung update hanya dicatat pada system log dan transaction workspace.
Setelah transaksi commit dan log sudah dituliskan ke disk, maka update dituliskan ke basis data
RDU untuk single user
Mulai dari entry terakhir pada log, baca mundur sampai ke awal dari log
Buat list dari transaksi yang sudah commit dan yang belum commit
Lakukan operasi REDO dari semua operasi write_item dari transaksi yg sudah commit, dengan urutan seperti tertulis pada log
Abaikan semua operasi dari transaksi yang belum commit à implicit rollback
Transaksi yg belum commit akan diresubmit kembali ke sistem
RDU untuk Multiuser
Sama seperti single user, hanya harus menggunakan two-phase locking protocol, dan untuk mencegah deadlock semua lock harus didapatkan sebelum transaksi dimulai, dan baru dilepas setelah transaksi mencapai titik commit. Ditambahkan juga checkpoint
Keuntungan
Transaksi tidak perlu di rollback
Tidak ada cascading rollback
Kekurangan
Bila tanpa checkpoint, proses REDO bisa panjang
Dengan two-phase locking dan mendapatkan semua lock sebelum mulai transaksi akan membatasi concurrency
Immediate Update
Update dilakukan langsung pada basis data tanpa menunggu transaksi mencapai titik commit
Operasi tetap harus dituliskan ke log (pada disk) sebelum update dilakukan pada basis data à Write-Ahead Logging protocol
RIU untuk single user
Buat list semua transaksi yang sudah commit dan list transaksi yang belum commit
UNDO semua operasi write_item dari transaksi yang belum commit
REDO semua operasi write_item dari transaksi yang sudah commit sesuai dengan urutan yang tertulis pada log
Dapat ditambahkan checkpoint
RIU untuk multiuser
Buat list dari transaksi yg sudah commit dan belum commit setelah checkpoint terakhir ditulis
Buat list transaksi yg sudah commit yang membaca data item dari transaksi yang belum commit untuk cascading rollback
UNDO semua transaksi yg belum commit dan transaksi yang harus di-rollback
REDO semua operasi write_item yang berasal dari transaksi yang sudah commit.
Keuntungan
Tidak membatasi concurency
Kerugian
Ada REDO & UNDO
Ada cascading rollback
Shadow Paging
Basis data terdiri dari sejumlah fixed-size disk
Buat page table di memory dengan jumlah entry yang sama dengan jumlah disk page
Shadow page table adalah copy dari current page table yang disimpan di disk
Selama transaksi berlangsung current page table diupdate, sedangkan shadow page table tidak dimodifikasi
Bila operasi write_item dilaksanakan, maka copy dari basis data yang akan dimodifikasi dbuat
Current page table dimodifikasi utnuk menunjuk pada disk page yang baru, sedangkan shadow page lama tetap menunjuk pada disk blok yang lama
Bila proses commit sukses, maka shadow page table akan dihapus
Bila proses commit gagal, maka status basis data sebelum transaksi bisa diperoleh dari shadow page table
Keuntungan
Proses UNDO sangat sederhana
Tidak perlu REDO
Bisa memakai log, checkpoint
Kerugian
Update pada basis data akan mengubah lokasi database page pada disk, hingga sukar untuk mengatur agar beberapa page selalu berdekatan
Bila page table besar, maka overhead untuk membuat shadow page table juga besar
Physical Recovery
Bila terjadi disk crash
Basis data dan log di backup pada tape secara periodok
Memakai mirror disk (untuk log file)
Multidatabase recovery
Transaksi multidatabse adalah transaksi yang mengakses data item pada lebih dari satu basis data, dan masing-masing basis data mungkin diimplementasikan pada DBMS yang berbeda
Perlu dua recovery manager:
Global recovery manager -> koordinator
Local recovery maneger
Protokol yang digunakan disebut TWO PHASE COMMIT PROTOCOL
4. Data Mining
Data mining adalah teknik yang merupakan gabungan metode-metode analisis data secara statistik dengan algoritma-algoritma untuk memproses data berukuran besar. Data mining merupakan proses menemukan informasi atau pola yang penting dalam basis data berukuran besar.
A part of Knowledge Discovery in Data (KDD) process.
Why?
The explosive growth in data collection
The storing of data in data warehouses
The availability of increased access to data from Web navigation and intranet
à We have to find a more effective way to use these data in decision support process than just using traditional querry languages.
On what kind of data?
Data warehouses
Transactional databases
Advanced database systems
Spacial and Temporal
Time-series
Multimedia, text
WWW
…
Data Warehouse adalah Pusat repositori informasi yang mampu memberikan database berorientasi subyek untuk informasi yang bersifat historis yang mendukung DSS (Decision Suport System) dan EIS (Executive Information System).
Tujuan
Meningkatkan kualitas dan akurasi informasi bisnis dan mengirimkan informasi ke pemakai dalam bentuk yang dimengerti dan dapat diakses dengan mudah.
Goals of Data Mining and KDD
Prediction: how certain attibutes within the data will behave in the future.
Identification: identify the existence of an item, an event, an activity.
Classification: partition the data into categories.
Clustering: cluster object.
Association: object association
Apriori Algorithm
Begin
+ compute support(ij) = count(ij)/m for each individual item, i1, i2, ..,in by scanning the database once and counting the number of transactions that item ij appears in
+ the candidate frequent 1-itemset, C1, will be the set of items i1, i2, …, in
+ the subset of items containing ij form Ci where support(ij) >= mins becomes the frequent
+ 1-itemset, L1;
+ k=1;
+ termination = false;
+ repeat
+ Lk+1 = ;
+ create the candidate frequent (k+1)-itemset, Ck+1, by combining members of Lk that have k-1 items in common; (this forms candidate frequent (k+1)-itemsets by selectively extending frequent k-itemsets by one item)
+ in addition, only consider as elements of Ck+1 those k+1 items such that every subset of size k appears in Lk;
+ scan the database once and compute the support for each member of Ck+1; if the support for a member of Ck+1; if the support for a member of Ck+1 >= min then add that member to Lk+1;
+ if Lk+1 is empty then termination = true
else k = k+1;
+ until termination
end;
Applications of data mining
Market analysis
Marketing stratergies
Advertisement
Risk analysis and management
Finance and finance investments
Manufacturing and production
Fraud detection and detection of unusual patterns (outliers)
Telecommunication
Finanancial transactions
Anti-terrorism (!!!)
Text mining (news group, email, documents) and Web mining
Stream data mining
DNA and bio-data analysis
Diseases outcome
Effectiveness of treatments
Identify new drugs
Contoh penelitian/paper
An application of data mining for marketing in telecommunication
Application of data mining to customer profile analysis in the power electric ity
Conditional Market Segmentation by Neural Networks
cluster analysis in Industrial market
marketing segmentation using support vector
Oracle Data Miner
http://www.oracle.com/technology/products/bi/odm/odminer.html
Data To Knowledge
http://alg.ncsa.uiuc.edu/do/tools/d2k
SAS
http://www.sas.com/
Clementine
http://spss.com/clemetine/
Intelligent Miner
http://www-306.ibm.com/software/data/iminer/
Conclusion
Data mining is a “decision support” process in which we search for patterns of information in data.
This technique can be used on many types of data.
Overlaps with machine learning, statistics, artificial intelligence, databases, visualization…
The result of mining may be to discover the following type of “new” information:
Association rules
Sequencial patterns
Classification trees
…
5. Tugas Project BDT
PROJECT : RANCANGAN DAN IMPLEMENTASI SISTEM INFORMASI PENJUALAN PRODUK APPAREL BERBASIS WEB MENGGUNAKAN PHP DAN MYSQL
6.Jaringan Komputer
Definisi
• Jaringan Komputer adalah Interkoneksi dari beberapa komputer.
• Dimana Komputer-komputer tersebut dapat dihubungkan dengan menggunakan berbagai macam tipe media pengkabelan dan digunakan untuk keperluan berbeda.
Topologi Jaringan
1. Bus.
Seluruh komputer berkomunikasi melalui satu jalur yang sama, yang dipergunakan bergantian.
§ Keunggulan : paling murah dan mudah diimplementasikan
§ Kelemahan : performansi paling rendah, karena pada setiap saat bus hanya dapat melayani satu transmisi.
Semakin banyak komputer yang terhubung ke jaringan, akan semakin berat beban bus sehingga performansi
semakin menurun. Keamanan juga paling rendah.
2. Ring.
Terdapat jalur berupa cincin yang terhubung, dengan arah
rotasi transmisi tertentu.
§ Keunggulan : performansi dan keamanan lebih baik
§ Kelemahan : Lebih mahal
3. Star.
Terdapat satu komputer atau hub yang berfungsi sebagai
sentral, seluruh komputer dalam jaringan terhubung
langsung ke sentral tersebut
§ Keunggulan : mudah diimplementasikan
§ Kelemahan : performansi hanya sedikit lebih baik dari Bus
4. Meshed.
Setiap komputer terhubung langsung satu sama lain
§ Keunggulan : performansi dan keamanan paling baik
§ Kelemahan : sangat mahal, jalur yang harus disediakan bertambah secara eksponensial oleh penambahan
komputer
Apa Komunikasi Data??
Komunikasi Data adalah Perpindahan encoded information berbantuan sistem transmisi listrik via lebih dari 1 jaringan data yang tergantung pada protokol.
Transmisi elektronis informasi dikodekan secara digital
Mengapa Perlu Komunikasi Data??
1. Mengirimkan/menerima data
2. Saling tukar informasi jarak jauh
Arah transmisi
1. Unicast : dari satu titik ke satu titik. Contoh : telepon
2. Multicast :dari satu titik ke beberapa titik. Contoh : server internet
3. Broadcast :dari satu titik ke semua arah. Contoh : pemancar televisi
Protokol Komunikasi
Protokol merupakan sekumpulan aturan yang memungkinkan berbagai media, platform, atau aplikasi yang berbeda-beda dapat saling berkomunikasi dengan benar. Beberapa contoh protokol komunikasi :
1. TCP/IP (Transfer Control Protocol / Internet Protocol),
merupakan protokol yang digunakan di internet. Dalam TCP/IP tersedia juga beberapa jasa, seperti HTTP (hypertext transfer protocol), FTP (file transfer protocol), e-mail, telnet (remote login), dll.
2. SPX/IPX, digunakan pada LAN sistem operasi jaringan
Novel Netware
3. X25, biasa digunakan oleh jaringan perbankan (cabang online, ATM, dll).
Tidak ada komentar:
Posting Komentar
Silahkan ketikan komentar anda disini ya.. Trims