Upload
others
View
14
Download
0
Embed Size (px)
Citation preview
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
NIM. M3111053
PROGRAM STUDI DIPLOMA III TEKNIK INFORMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SEBELAS MARET
SURAKARTA
2014
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
iv
ABSTRACT
DONI BAWONO. M3111053. HADOOP DISTRIBUTED FILE SYSTEM IMPLEMENTATION IN CLUSTER SERVER. Diploma of Information Engineering, Faculty of Natural Sciences and Metematika, Univertas of March, June 2014.
Nowdays, the growth of data so quickly, within a few years the amount of
data that must be managed by a leading IT firms in the world can reach the size of
Peta Byte. If the management of large data is not matched by the management of
the storage media (server) that will adequately reduce productivity.
One technology that offered to handle the data growth rate with the storage
media is HDFS (Hadoop Distributed File System) which adopts the GFS (Google
File System) with the level of effectiveness in terms of storage media and
economic factors. HDFS uses the concept of data blocks of a file are stored in
multiple machines connected together in a cluster.
Implementation of HDFS as an effective alternative storage media with a
simple infrastructure which uses commodity hardware that is relatively affordable
compared to a server with the same capabilities.
Keywords: Hadoop, HDFS, GFS, MapReduce,DFSIO
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
v
ABSTRAK
DONI BAWONO. M3111053.IMPLEMENTASI HADOOP DISTRIBUTED FILE SYSTEM DALAM CLUSTER SERVER. Diploma III Teknik Informatika, Fakultas Metematika dan Ilmu Pengetahuan Alam, Univertas Sebelas Maret, Juni 2014.
Saat ini pertumbuhan data begitu cepat, dalam beberapa tahun saja jumlah
data yang harus dikelola oleh perusahan-perusahaan IT terkemuka didunia bisa
mencapai ukuran Peta Byte. Jika pengelolaan data yang besar ini tidak diimbangi
dengan pengelolaan media penyimpanan (server) yang memadai maka akan
mengurangi produktifitas.
Salah satu teknologi yang ditawarkan untuk menangani laju pertumbuhan
data dengan media penyimpanan adalah HDFS (Hadoop Distributed File System)
yang mengadopsi GFS (Google File System) dengan tingkat efektifitas dari segi
media penyimpanan dan faktor ekonomi. HDFS menggunakan konsep blok-blok
data dari sebuah file yang disimpan dalam beberapa mesin yang saling terhubung
dalam sebuah cluster.
Penerapan dari HDFS sebagai alternative media penyimpanan yang efektif
dengan infrastruktur yang sederhana dimana menggunakan hardware komoditas
yang relative terjangkau dibandingkan sebuah server kebanyakan dengan
kemampuan yang sama.
Katakunci: Hadoop, HDFS, GFS, MapReduce, DFSIO
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
vi
MOTTO
harta. Ilmu itu penghukum (hakim) dan harta terhukum. Harta itu kurang apabila
:: Khalifah Ali bin Abi Talib ::
-besarnya, tapi bersegeralah untuk mengerjakan
sekecil-kecilnya ke
:: Mario Teguh ::
-orang sukses yang saya kenal adalah mereka yang lebih banyak
:: Bernard M Baruch ::
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
vii
HALAMAN PERSEMBAHAN
Yang Pertama dan Utama
Alhamdulillah, Segala puji hanya milik Allah S.W.T yang telah menganugerahkan kelapangan, kesempatan, dan kemampuan untuk menyelesaikan Tugas Akhir ini.
Tidak ada kata yang lebih pantas, melainkan rasa syukur dari lubuk hati hamba yang terdalam
Kedua OrangtuKu
Terimaksih untuk bapak dan ibu yang tak kenal lelah selalu menasehati dan memberikan dukungan terhadap pengerjaan Tugas Akhir ini
Kedua AdiKu
Untuk kedua adikKu dukungan dan semangat dalam menimba ilmu, semoga bisa
menjadi pelajaran berharga sebagai bekal hidup di dunia ini.
Dosen Pembimbing
Terimakasih, Bapak Rudi Hartono, S.Si atas segala bantuan dan bimbingannya selama pengerjaan laporan Tugas Akhir ini sehingga selesai pada waktunya
Sahabat Sahabatku
Terimaksih atas ceita yang telah kalian torehkan dalam catatan hidupKu yang sangat berarti dan berharga selama ini.
Doni Bawono
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
viii
KATA PENGANTAR
Puji syukur penulis panjatkan kehadirat Allah S.W.T atas limpahan
rahmatNya, sehingga penyusunan Laporan Tugas Akhir dengan judul
Implementasi Hadoop Distributed File System dalam Cluster Server ini dapat
terselesaikan pada waktunya tanpa halangan berarti.
Penyusunan laporan ini bertujuan untuk memenuhi sebagian persyaratan
mencapai derajat Diploma III Teknik Informatika Fakultas Matematika dan Ilmu
Pengetahuan Alam Universitas Sebelas Maret Surakarta.
Dalam penyusunan Laporan Tugas Akhir ini penulis mendapatkan bantuan
dan dukungan dari berbagai pihak. Oleh sebab itu pada kesempatan ini, penulis
mengucapkan terima kasih kepada semua pihak yang telah memberikan bantuan
dan dukungannya, terutama kepada:
1. Ir. Ari Handono Ramelan, M.Sc. (Hons), Ph.D selaku Dekan Fakultas
Matematika dan Ilmu Pengetahuan Alam Universitas Sebelas Maret Surakarta
yang telah memberikan kesempatan belajar di lingkungan FMIPA UNS.
2. Bapak Drs. Y. S. Palgunadi, M.Sc. selaku Ketua Program Studi Diploma III
Teknik Informatika Fakultas Matematika dan Ilmu Pengetahuan Alam
Universitas Sebelas Maret Surakarta yang telah memberikan kesempatan
belajar di program studi D3 Teknik Informatika.
3. Bapak Rudi Hartono, S.Si selaku Dosen Pembimbing Tugas Akhir yang telah
memberikan bimbingan, pengarahan, kritik, dan saran serta dukungan selama
penyusunan Laporan Tugas Akhir ini.
4. Ayah dan Ibu tercinta yang telah banyak memberikan dukungan dan masukan
yang membangun.
5. Semua pihak terkait yang tidak bisa saya sebutkan satu persatu, atas bantuan
dan dukungannya selama penulis belajar di D3 Teknik Informatika.
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
ix
Semoga Allah S.W.T memberikan balasan yang lebih baik kepada pihak-
pihak yang telah memberikan bantuan dan dukungan dari awal penulis belajar di
D3 Teknik Informatika sampai berakhirnya penyusunan Laporan Tugas Akhir ini
selesai.
Semoga dengan selesainya penyusunan Laporan Tugas Akhir ini dapat
memberikan manfaat dan kebaikan pada penulis dan pembaca sekalian.
Surakarta, 15 Juni 2014
Penulis
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
x
DAFTAR ISI
HALAMAN JUDUL ................................................................................................ i
HALAMAN PERSETUJUAN ................................................................................ ii
HALAMAN PENGESAHAN ................................................................................ iii
ABSTRACT ............................................................................................................ ii
ABSTRAK .............................................................................................................. v
MOTTO.................................................................................................................. vi
HALAMAN PERSEMBAHAN............................................................................ vii
KATA PENGANTAR ......................................................................................... viii
DAFTAR ISI ........................................................................................................... x
DAFTAR GAMBAR ........................................................................................... xiii
DAFTAR TABEL ................................................................................................. xv
BAB I PENDAHULUAN ...................................................................................... 1
1.1 Latar Belakang.......................................................................................... 1
1.2 Perumusan Masalah .................................................................................. 3
1.3 Batasan Masalah Penelitian ...................................................................... 3
1.4 Tujuan Penelitian ...................................................................................... 3
1.5 Manfaat Penelitian .................................................................................... 3
1.6 Metodologi Penelitian .............................................................................. 4
1.7 Sistematika Penulisan ............................................................................... 5
BAB II LANDASAN TEORI ................................................................................. 7
2.1 Hadoop ..................................................................................................... 7
2.2 HDFS (Hadoop Distributed File System)................................................. 9
2.2.1 Pengertian Hadoop Distributed File System ..................................... 9
2.2.1 Model data dan Struktur HDFS......................................................... 9
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
xi
2.2.1 Prosedur Menyimpan dan membaca data dalam HDFS ................. 11
BAB III ANALISA KEBUTUHAN DAN PERANCANGAN SISTEM ............. 13
3.1 Analisa Kebutuhan Sistem ..................................................................... 13
3.2 Alur Penelitian ........................................................................................ 14
3.3 Perancangan Sistem ................................................................................ 16
3.4 Cara Analisis .......................................................................................... 16
BAB IV IMPLEMENTASI DAN ANALISIS ...................................................... 20
4.1 Instalasi Komponen dasar....................................................................... 20
4.4.1 Install JDK 7 ................................................................................... 20
4.4.1 Install Openssh-Server .................................................................... 20
4.2 Menambahkan dedicated user ................................................................ 21
4.3 Konfigurasi Jaringan .............................................................................. 21
4.3.1 Setting IP Address ........................................................................... 22
4.3.2 Akses SSH ....................................................................................... 23
4.4 Cluster Overview .................................................................................... 24
4.5 Konfigurasi Hadoop ............................................................................... 25
4.5.1 Install Hadoop ................................................................................. 25
4.5.2 Konfigurasi hadoop-env.sh (semua mesin) ..................................... 26
4.5.3 Konfigurasi conf/core-site.xml (semua mesin) ............................... 26
4.5.4 Konfigurasi conf/mapred-site.xml (semua mesin) .......................... 27
4.5.5 Konfigurasi conf/hdfs-site.xml (semua mesin) ............................... 28
4.6 Analisis ................................................................................................... 28
4.6.1 Menjalankan Multi Node Cluster .................................................... 28
4.6.2 Menghentikan Multi Node Cluster.................................................. 30
4.6.3 HDFS Formating ............................................................................ 30
4.6.4 Testing HDFS Write ........................................................................ 31
4.6.5 Testing HDFS Read......................................................................... 34
4.6.6 Files and Block ................................................................................ 35
4.6.6 HDFS Benchmark (DFSIO) Write Read ......................................... 36
BAB V PENUTUP ................................................................................................ 46
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
xii
5.1 Kesimpulan ............................................................................................. 46
5.2 Saran ....................................................................................................... 46
DAFTAR PUSTAKA ........................................................................................... 47
LAMPIRAN .......................................................................................................... 48
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
xiii
DAFTAR GAMBAR
Gambar 1.1 Metodologi Penelitian ........................................................................ 4
Gambar 2.1 Arsitektur Hadoop ............................................................................. 7
Gambar 2.2 Mengakses data pada HDFS ............................................................ 10
Gambar 2.3 Menyimpan data ke dalam HDFS.................................................... 11
Gambar 2.4 Membaca data yang tersimpan dalam HDFS .................................. 12
Gambar 3.1 Skema jalannya penelitian ............................................................... 14
Gambar 3.2 Perancangan Sistem ......................................................................... 16
Gambar 3.3 Skema pembagian blok data ............................................................ 17
Gambar 3.4 Skema HDFS File Write .................................................................. 18
Gambar 3.5 Skema HDFS Files Read ................................................................. 18
Gambar 4.1 Melihat versi JDK pada sistem ........................................................ 20
Gambar 4.2 Topologi Jaringan ............................................................................ 21
Gambar 4.3 Konfigurasi IP Address NodeMaster dan DataNode 1 .................... 22
Gambar 4.4 Konfigurasi IP Address DataNode 2................................................ 22
Gambar 4.5 Konfigurasi IP Address DataNode 3................................................ 22
Gambar 4.6 Akses SSH NodeMaster ke DataNode 2 ......................................... 24
Gambar 4.7 Akses SSH NodeMaster ke DataNode 3 ......................................... 24
Gambar 4.8 HDFS Cluster Overview .................................................................. 25
Gambar 4.9 Menjalankan HDFS ......................................................................... 29
Gambar 4.10 File logs/ hadoop-hduser-datanode-slave.log ................................ 29
Gambar 4.11 JPS pada master ............................................................................. 29
Gambar 4.12 JPS pada slave................................................................................ 30
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
xiv
Gambar 4.13 Menghentikan HDFS service ......................................................... 30
Gambar 4.14 Hasil JPS setelah HDFS service dimatikan ................................... 30
Gambar 4.15 Format HDFS berhasil ................................................................... 31
Gambar 4.16 skema HDFS Write ........................................................................ 31
Gambar 4.17 Proses HDFS Write pada DataNode pertama ................................ 32
Gambar 4.18 Proses HDFS Write pada DataNode kedua ................................... 33
Gambar 4.19 Proses HDFS Write pada DataNode ketiga ................................... 33
Gambar 4.20 DFS manajemen............................................................................. 33
Gambar 4.21 Blok ID disetiap node .................................................................... 34
Gambar 4.22 Skema HDFS File Write ................................................................ 34
Gambar 4.23 HDFS File Blok Read node pertama ............................................. 35
Gambar 4.24 HDFS File Blok Read node kedua ................................................. 35
Gambar 4.25 HDFS File Blok Read node ketiga ................................................ 35
Gambar 4.26 HDFS Files and Data Block .......................................................... 35
Gambar 4.27 Grafik DFSIO Write (throughput) percobaan I ............................. 37
Gambar 4.28 Grafik DFSIO Write (throughput) percobaan II ............................ 38
Gambar 4.29Grafik DFSIO Write (time) percobaan I ......................................... 39
Gambar 4.30 Grafik DFSIO Write (time) percobaan II ....................................... 40
Gambar 4.31 Grafik DFSIO Read (throughput) percobaan I .............................. 42
Gambar 4.32 Grafik DFSIO Read (throughput) percobaan II............................. 43
Gambar 4.33Grafik DFSIO Read (time) percobaan I .......................................... 44
Gambar 4.34Grafik DFSIO Read (time) percobaan II ........................................ 45
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
xv
DAFTAR TABEL
Tabel 4.1 DFSIO Write (throughput) percobaan I ............................................... 37
Tabel 4.2 DFSIO Write (throughput) percobaan II .............................................. 38
Tabel 4.3 DFSIO Write (time) percobaan I .......................................................... 39
Tabel 4.4 DFSIO Write (time) percobaan II ......................................................... 40
Tabel 4.5 DFSIO Read (throughput) percobaan I ................................................ 41
Tabel 4.6 DFSIO Read (throughput) percobaan II ............................................... 42
Tabel 4.7 DFSIO Read (time) percobaan I ........................................................... 44
Tabel 4.8 DFSIO Read (time) percobaan II.......................................................... 45