Upload
ghema
View
295
Download
7
Tags:
Embed Size (px)
Citation preview
GHEMA NUSA PERSADA LZT4 – 1701497885 7023T – Advanced Database Systems
7023T – Advanced Database Systems Halaman 1 dari 14
7023T – TP1 – W2 – S3
Due Date : 27 September 2015
Tugas Personal ke – 1
Week 2 - Session 3
Answer these questions below and submit it before 1st personal assignment deadline.
1. What do you know about Data Warehouse and please explain based on your
understanding!
Answer
Data warehouse (DW) adalah dimaksudkan sebagai kumpulan data yang dihasilkan
untuk mendukung pengambilan keputusan, tetapi juga merupakan penyimpanan data
saat ini dan masa lampau yang secara potensial diperlukan para manajer di dalam
organisasi. Data biasanya akan tersedia secara terstruktur dalam bentuk siap untuk
kegiatan proses analisis (misalnya, pengolahan analisis secara online [OLAP], data
mining, query, pelaporan, dan aplikasi pendukung keputusan lainnya). Sebuah data
warehouse adalah kumpulan data berorientasi subyek, terpadu, varians terhadap
waktu, serta merupakan kumpulan data nonvolatile (tidak berubah) untuk mendukung
proses pengambilan keputusan para manajemen.
GHEMA NUSA PERSADA LZT4 – 1701497885 7023T – Advanced Database Systems
7023T – Advanced Database Systems Halaman 2 dari 14
7023T – TP1 – W2 – S3
2. Can we implement Data Warehouse by online? What are the advantages and
disadvantages?
Answer
Dapat digunakan secara online. Yakni dikenal dengan nama OLAP (Online Analytical
Processing). Keuntungannya :
Pengguna akhir dapat melakukan analisis yang ekstensif dalam berbagai cara
Dimungkinkan pandangan konsolidasi data perusahaan (misal, satu versi
kebenaran)
Dimungkinkan pengolahan informasi yang lebih baik dan lebih tepat waktu.
Sehingga dapat mengurangi biaya dari sistem operasional mahal ke murah -
karena itu, lebih banyak - permintaan pengguna informasi yang bias dilayani dan
dapat diproses lebih cepat
Peningkatan kinerja sistem dapat terjadi. Sebuah data warehouse membebaskan
proses produksi karena beberapa pelaporan sistem operasional dipindahkan ke
DSS
Akses data yang lebih sederhana
GHEMA NUSA PERSADA LZT4 – 1701497885 7023T – Advanced Database Systems
7023T – Advanced Database Systems Halaman 3 dari 14
7023T – TP1 – W2 – S3
Kerugian menggunakan OLAP :
Model lebih komplek dan rumit
Proses query lebih lambat
Performance yang kurang bagus
3. Do we need special hardware to implement Data Warehouse? Is it possible to
implement without special hardware? Explain your answering, please!
Answer
Tidak ada perangkat khusus untuk melakukan data warehouse, karena data warehouse
dapat dilakukan pada smua komponen komputer yang terpenting adalah memiliki
standar minimum komputer, misalnya terdapatnya prosesor, hardisk, motherboard,
ram, vga, power supply unit, monitor, keyboard, mouse. Jika salah satu komponen
tersebut tidak ada maka besar kemungkinan tidak dapat menjalankan maupun
menyimpan data warehouse.
4. Do we need special software to implement Data Warehouse? Is it possible to
implement without special software? Explain your answering, please!
Answer
Data warehouse dapat dikerjakan tanpa mengunakan software khusus, yang terpenting
orang yang mengerjakan dapat memahami dalam penederhanaan database. Tetapi
terdapat beberapa perusahaan/pengembang (Vendor) yang telah menerbitkan software
khusus untuk datawarehouse contoh : IBM, Oracle, G2 Crowd, dan masih banyak
GHEMA NUSA PERSADA LZT4 – 1701497885 7023T – Advanced Database Systems
7023T – Advanced Database Systems Halaman 4 dari 14
7023T – TP1 – W2 – S3
lagi. Hal ini bertujuan untuk membantu mempermudah seorang manager maupun
orang yang ditunjuk oleh perusahaan membuat data warehouse.
5. What is Normalized and Denormalized database? What are the differences? Explain
your answering and give example, please!
Answer
Menurut Thomas Connolly dan Carolyn Begg (2002, p376) Pengertian normalisasi
adalah suatu teknik untuk memproduksi satu set hubungan dengan kebutuhan yang
diinginkan, memberi kebutuhan data dari suatu organisasi. Dengan kata lain
normalisasi itu merupakan proses untuk mengubah suatu relasi yang memiliki
masalah tertentu ke dalam dua bauah relasi atau lebih yang tidak memiliki masalah
tersebut. Masalah yang dimaksud sering disebut juga dengan istilah anomali.
Normalisasi sering dieksekusi sebagai langkah-langkah yang berangkai atau berseri.
Bentuk normal adalah suatu aturan yang dikenakan pada relasi-relasi dalam basis data
dan harus dipenuhi oleh relasi-relasi tersebut pada tingkatan normalisasi. Suatu relasi
dikatakan berada dalam bentuk normal tertentu jika memenuhi kondisi-kondisi
tertentu. Beberapa tingkatan yang biasa digunakan pada normalisasi adalah :
1. UNF
Sebelum membahas bentuk normal yang pertama, kita mendefinisikan normal
form awal yaitu UnNormalized Form (UNF).
UNF adalah sebuah tabel yang berisi satu atau lebih grup-grup yang berulang.
GHEMA NUSA PERSADA LZT4 – 1701497885 7023T – Advanced Database Systems
7023T – Advanced Database Systems Halaman 5 dari 14
7023T – TP1 – W2 – S3
2. Bentuk normal pertama (1NF)
Sedangkan 1NF adalah hubungan dimana persimpangan dari setiap baris dan
kolom berisi satu dan hanya satu harga.
3. Bentuk normal kedua (2NF)
Bentuk normal kedua didefinisikan berdasarkan ketergantungan fungsional yang
penuh (Full Functional Dependency).
Ful Functional Dependency menandai bahwa jika A dan B adalah atribut dari
sebuah relasi , B adalah penuh secara fungsional tergantung pada A jika B adalah
secara fingsional tergantung pada A, tetapi tidak semua pada sutset dari A.
Sedangkan 2NF adalah sebuah relasi antara bentuk normal pertama dan setiap
atribut bukan primary key atau secara fungsional bergantung pada primary key.
4. Bentuk normal ketiga (3NF)
Bentuk normal ketiga didefinisikan berdasarkan ketergantungan transitif
(Trancitive Dependency). Transitive Dependency adalah sebuah kondisi dimana
A, B, dan C adalah atribut–atribut dari relasi sperti jika AB dan BC ,
kemudian C secara transitif bergantung pada A melalui B (Dengan ketentuan
bahwa A tidak secara fungsional bergantung pada B atau C). Sedangkan 3NF
adalah sebuah relasi antara bentuk pertama dan bentuk kedua, dan dimana tidak
ada atribut yang bukan primary key secara transitif bergantung pada primary key.
5. Bentuk normal Boyce-Codd (BCNF)
Menurut Thomas Connolly dan Carolyn Begg (2002, p398) suatu relasi disebut
memenuhi bentuk normal Boyce-Codd jika penentu (determian) adalah candidate
GHEMA NUSA PERSADA LZT4 – 1701497885 7023T – Advanced Database Systems
7023T – Advanced Database Systems Halaman 6 dari 14
7023T – TP1 – W2 – S3
key. BCNF merupakan bentuk normal sebagai perbaikan terhadap 3NF karena
bentuk normal ketiga berkemungkinan masih memiliki anomali sehingga perlu
dinormalisasi lebih jauh. Suatu relasi yang memenuhi BNCF selalu memenuhi
3NF, tetapi tidak untuk sebaliknya.
Bentuk normal pertama hingga ketiga merupakan bentuk normal yang umum
dipakai. Artinya, bahwa pada kebanyakan relasi bila ketiga bentuk normal
tersebut telah dipenuhi maka persoalan anomali tidak akan muncul lagi. Bentuk
normal Boyce-Codd merupakan revisi terhadap bentuk normal ketiga. Bentuk
normal 4NF dan 5NF hanya dipakai pada kasus-kasus khusus, yakni pada relasi
yang mengandung ketergantungan banyak nilai.
Gambar 1 - Contoh Normalisasi
Denormalisasi merupakan proses yang dilakukan pada database yang sudah
dinormalisasi dengan cara memodifikasi struktur tabel dan mengabaikan kerangkapan
data (yang terkontrol) untuk meningkatkan kinerja database. Denormalisasi adalah
pelanggaran aturan normalisasi atau menjabarkan suatu tataan database yang ttelah
normal untuk meningkatkan kinerja pengaksesan database.
GHEMA NUSA PERSADA LZT4 – 1701497885 7023T – Advanced Database Systems
7023T – Advanced Database Systems Halaman 7 dari 14
7023T – TP1 – W2 – S3
Tahapan denormalisasi :
Dengan membuat kolombaru pada tabel / menggabungkan kolom pada tabel satu
dengan tabel yang lainnya.
Dengan pembuatan tabel baru
Gambar 2 – contoh normalisasi
Dari data diatas jika mahasiswa akan menampilkan jumlah mata kuliah, jumlah sks
ataupun IPK maka ditambahkan atribut total_sks, total_matkul, ipk
Gambar 3 – setelah didenormalisasi
GHEMA NUSA PERSADA LZT4 – 1701497885 7023T – Advanced Database Systems
7023T – Advanced Database Systems Halaman 8 dari 14
7023T – TP1 – W2 – S3
6. What is Structured and unstructured database? Explain your answering and give
example, please!
Answer
Sistem Management Database adalah suatu aplikasi perangkat lunak yang menympan
struktur database, data itu sendiri, hubungan antar data di dalam database, maupun
formulir dan laporan yang berhubungan dengan database. Jadi stuktur database adalah
suatu kumpulan data yang terjalin satu sama lain sehingga memiliki struktur tertentu,
guna untuk memudahkan akses data.
Menurut Thomas Connolly dan Carolyn Begg (2005, p18), komponen DBMS
terdapat 5 komponen penting, yaitu :
1. Hardware
Dibutuhkan untuk menjalankan DBMS dan aplikasi-aplikasinya. Hardware
meliputi dari PC, mainframe, dan jaringan komputer.
2. Software
Meliputi software aplikasi, software DBMS, sistem operasi dan juga sistem
jaringan jika dalam penggunaannya menggunakan jaringan.
3. Data
Merupakan komponen yang terpenting dan juga merupakan penghubung antara
komponen mesin (Hardware dan Software) dan komponen human (Procedures
dan People)
GHEMA NUSA PERSADA LZT4 – 1701497885 7023T – Advanced Database Systems
7023T – Advanced Database Systems Halaman 9 dari 14
7023T – TP1 – W2 – S3
4. Prosedur
Prosedur merupakan instruksi dan aturan yang mengatur perancangan dan
penggunaan database.
5. People
Komponen ini meliputi database administrator, database designers, application
developers, dan end users.
Macam-macam struktur database
1. Struktur Database Hierarkis
Struktur Database Hierarkis (Hierarchical Database Structure), yaitu struktur
kelompok data, subkelompok data dan subkelompok yang lebih kecil lagi
menyerupai cabang-cabang pohon. Seperti cabang-cabang pohon, untuk pindah
dari suatu catatan di suatu cabang kesuatu catatan di cabang lain, system
manajemen database harus kembali ketempat asal percabangan itu. Struktur
hierarkis memanfaatkan sumber daya computer secara efisien saat sebagian besar
catatan dalam database akan digunakan dalam aplikasi.
2. Sruktur Database Jaringan
Struktur database jaringan (network database structure) memungkinkan satu
Catatan tertentu menunjuk pada catatan lain dalam database . Subkomite
Database Task Group CODASYL mengeluarkan spesifikasi struktur database
jaringan pada Tahun 1971. Jaringan memecahkan masalah keharusan untuk
kembali ke tempat asal percabangan database. Secara konseptual, tiap catatan
dalam database dapat memiliki penunjuk ke tiap catatan lain di dalam database.
GHEMA NUSA PERSADA LZT4 – 1701497885 7023T – Advanced Database Systems
7023T – Advanced Database Systems Halaman 10 dari 14
7023T – TP1 – W2 – S3
3. Struktur Database Relational
Struktur system manajemen relational merupakan system yang menyerupai
Table-tabel, dan merupakan format yang dapat dipahami secara cepat oleh
Manajer dan/atau staf professional.
Data tidak terstruktur
Data tidak terstruktur biasanya ada pada teks, file, video, email, laporan (report),
presentasi power point, pesan suara (voice mail), memo, dan citra. Data dapat
berbentuk dalam tipe apapun tanpa perlu mengikuti format, aturan atau alur tertentu.
Sebagai contoh data yang ditampilkan pada halaman web termasuk data tidak
testruktur dan tidak beraturan. Masing-masing unstructured data mempunyaibentuk
fisik dan atribut yang berbeda-beda. Atribut-atributnya dapat disimpan di
dalamrelational atau multidimensional database agar mudah untuk diolah dan adapun
contoh lainnya fuzzy.
Gambar 4 – Kerangka Kerja DSS
GHEMA NUSA PERSADA LZT4 – 1701497885 7023T – Advanced Database Systems
7023T – Advanced Database Systems Halaman 11 dari 14
7023T – TP1 – W2 – S3
7. Have you ever heard about traditional data warehouse? Explain your answering,
please!
Answer
Ya pernah mendengar, Data warehouse tradisional (TDW) digunakan untuk
pengambilan keputusan-keputusan strategis (dan terkadang taktis);
sementara RDW digunakan untuk pengambilan keputusan strategis dan taktis
(terkadang operasional), Rerata pemuktahiran data dalam TDW berkisar antara perhari
hingga perbulan, TDW hanya untuk menunjang sebagian kecil pengguna di level atas
suatu perusahaan, TDW biasanya menggunakan pelaporan yang bersifat terbatas untuk
sekedar konfirmasi keakuratan data atau pengecekan pola, Para
pengguna TDW biasanya terdiri dari orang-orang yang memegang jabatan (level atas),
para karyawan/pekerja pengetahuan (bekerja menggunakan pengetahuan, misalnya
analis, konsultan, penasihat, dll), para manajer, dan para pengguna internal lainnya
Karakteristik Traditional Data Warehouse :
1. Hanya untuk keputusan strategis
2. Hasil sulit diukur
3. Update data bersifat harian,mingguan, bulanan, laporan berupa summary
4. Sistem pelaporan sangat terbatas untuk user tertentu dan hanya melakukan
konfirmasi atau cek berbagai proses dan pola, seringkali menggunakan tabel
5. Pengguna orang yang memiliki jabatan, knowlege worker, internal users
GHEMA NUSA PERSADA LZT4 – 1701497885 7023T – Advanced Database Systems
7023T – Advanced Database Systems Halaman 12 dari 14
7023T – TP1 – W2 – S3
8. Where we can find data warehouse?
Answer
Data warehouse terdapat pada saat diperlukan pembuatan laporan dan analisa data
pada satu unit bagian atau operasi pada suatu perusahaan, atau sering disebut juga
data mart. Pada saat pembuatan menjadi OLAP [Online Analytical Processing], Data
Mining, Proses informasi executive serta pembuatan DSS dan EIS.
9. When do we need data warehouse?
Answer
Data warehouse diperlukan bagi para pengambil keputusan manajemen dari suatu
organisasi/perusahaan. Dengan adanya data warehouse, akan mempermudah
pembuatan aplikasi-aplikasi DSS dan EIS karena memang kegunaan dari data
warehouse adalah khusus untuk membuat suatu database yang dapat digunakan untuk
mendukung proses analisa bagi para pengambil keputusan.
10. Why do we need data warehouse?
Answer
Karena data warehouse memiliki manfaat langsung meliputi:
Memungkinkan end-users untuk melakukan berbagaia analisa ekstensif dalam
berbagai cara
Adanya data korporat/perusahaan yang menampilkan data yang sudah
terkonsolidai dengan baik (satu versi data yang sudah valid)
GHEMA NUSA PERSADA LZT4 – 1701497885 7023T – Advanced Database Systems
7023T – Advanced Database Systems Halaman 13 dari 14
7023T – TP1 – W2 – S3
Informasi yang lebih baik dan lebih tepat waktu. Datawarehouse memungkinkan
pemrosesan informasi untuk dipindahkan dari sistem operasional yang mahal
ke server-server yang murah, sehingga request informasi dari end-users bisa
diproses lebih cepat.
Peningkatan kinerja sistem. Data warehouse mengurangi pemrosesan di sistem
produksi karena berbagai requirements dalam pelaporan sistem operasional
dipindahkan ke sistem pendukung keputusan.
Penyederhanaan dalam akses data
Berbagai manfaat tak langsung muncul apabila end-users memanfaatkan berbagai
manfaat langsung tersebut.
GHEMA NUSA PERSADA LZT4 – 1701497885 7023T – Advanced Database Systems
7023T – Advanced Database Systems Halaman 14 dari 14
7023T – TP1 – W2 – S3
REFERENSI
Lecture notes. Decision Support and Business Intelegence Systems. Mohammad Subekti, BE,
MSc. 2015
http://www.gudangmateri.com/2010/04/data-multidimensi.html
Han, Jiawei, Micheline Kamber. Data Mining: Concepts and Techniques. 2nd edition. San
Fransisco: Morgan Kaufmann Publishers, 2006.
Inmon, Bill. Building The Data warehouse, 4th edition. New York: Wiley Computer
publishing, 2005
Connolly, Thomas M. and Carolyn E.Begg. (2005). Database system A Practical Approach,
Implementasi and Management. Fourth Edition. Addison – Wesley Publishing
Company, United States of America
http://the-simple-blogs.blogspot.co.id/2013/03/normalisasi-dan-denormalisasi-
data_6264.html
http://bangkit-kurniawan.blogspot.co.id/2012/12/struktur-database.html