12
MACHINE LEARNING PENGENALAN CITRA DIGITAL DIGITAL IMAGE RECOGNITION MACHINE LEARNING Andi Lukman 1 , Syafaruddin 2 , Merna Baharuddin 2 1 Program Studi Teknik Informatika, Sekolah Tinggi Multimedia dan Informatika Nusa Palapa 2 Jurusan Teknik Elektro, Fakultas Teknik, Universitas Hasanuddin Alamat Korespondensi : Andi Lukman Program Studi Teknik Informatika Sekolah Tinggi Multimedia dan Informatika (STIMED) Nusa Palapa Makassar, Sulawesi Selatan. HP : 08124255094 Email : [email protected]

MACHINE LEARNING PENGENALAN CITRA DIGITAL …pasca.unhas.ac.id/jurnal/files/1d275aa6ca3489c0f09a2fd5144168ee.pdf · Pengenalan citra digital merupakan salah satu tema ... Penelitian

Embed Size (px)

Citation preview

Page 1: MACHINE LEARNING PENGENALAN CITRA DIGITAL …pasca.unhas.ac.id/jurnal/files/1d275aa6ca3489c0f09a2fd5144168ee.pdf · Pengenalan citra digital merupakan salah satu tema ... Penelitian

MACHINE LEARNING PENGENALAN CITRA DIGITAL

DIGITAL IMAGE RECOGNITION MACHINE LEARNING

Andi Lukman1, Syafaruddin2, Merna Baharuddin2

1Program Studi Teknik Informatika, Sekolah Tinggi Multimedia dan Informatika Nusa Palapa

2Jurusan Teknik Elektro, Fakultas Teknik, Universitas Hasanuddin

Alamat Korespondensi : Andi Lukman Program Studi Teknik Informatika Sekolah Tinggi Multimedia dan Informatika (STIMED) Nusa Palapa Makassar, Sulawesi Selatan. HP : 08124255094 Email : [email protected]

Page 2: MACHINE LEARNING PENGENALAN CITRA DIGITAL …pasca.unhas.ac.id/jurnal/files/1d275aa6ca3489c0f09a2fd5144168ee.pdf · Pengenalan citra digital merupakan salah satu tema ... Penelitian

ABSTRAK Aplikasi pengenalan citra yang telah ada hanya dapat digunakan untuk kebutuhan khusus objek penelitian pengenalan citra tertentu. Penelitian ini bertujuan membangun aplikasi machine learning sebagai alat bantu bagi pengguna untuk mendapatkan algoritma klasifikasi terbaik dalam mengenali citra digital. Metode penelitian ini memanfaatkan data set citra wajah Caltech 101 yang diambil dari Computational vision Institut Teknologi California. Algoritma yang digunakan adalah algoritma klasifikasi Machine Learning WEKA yaitu: Support Vector Machine, K-Nearest Neighbor, Naïve Bayes, C4.5 Decision Tree, Logistic Regression dan Random Forest. Aplikasi dibangun menggunakan bahasa pemrograman java dimana untuk sisi client menggunakan Google Web Toolkit dan sisi server menggunakan Java Servlet. Modul/fungsi aplikasi diuji menggunakan pengujian black box. Persentasi keberhasilan pengenalan citra digital dihitung dengan membandingkan jumlah citra dikenali dengan total jumlah citra yang diberikan. Hasil penelitian memperlihatkan bahwa untuk membangun aplikasi, data set citra terlebih dahulu melalui proses filterisasi berupa normalisasi 64X64 pixel dan bag of words 16 bagian. Kemudian data set dikonversi ke bentuk ARFF agar dapat dilakukan proses pelatihan dan pengujian algoritma. Pengujian black box memperlihatkan setiap modul/fungsi aplikasi dapat berjalan sesuai keinginan. Hasil pengujian persentasi keberhasilan pengenalan citra memperlihatkan Logistic Regression mendapatkan persentase keberhasilan tertinggi yaitu 95%, 90% untuk kelas ya dan 100% untuk kelas bukan dalam mengenali wajah. Penelitian ini dapat disimpulkan bahwa aplikasi machine learning pengenalan citra digital sukses dibangun dan dapat digunakan oleh pengguna untuk mendapatkan algoritma klasifikasi terbaik dalam mengenali citra digital. Kata Kunci : Machine Learning, Pengenalan, Citra Digital, Klasifikasi

ABSTRACT Image recognition applications that already exist can only be used for specific needs particular research object image recognition. This study aims to build a machine learning applications as a tool for users to get the best classification algorithm to recognize digital images. This research method utilizing face image data sets taken from the Caltech 101 Computational Vision California Institute of Technology. The algorithm used is WEKA Machine Learning classification algorithms, namely: Support Vector Machine, K-Nearest Neighbor, Naïve Bayes, C4.5 Decision Tree, Logistic Regression and Random Forest. Applications built using the Java programming language, client side using Google Web Toolkit and server side using Java Servlet.. Modules / applications function was tested using black box testing. Percentage of the successful recognition of the digital image is calculated by comparing the total number of images identified by the image of a given number. The results showed that for building applications, data sets of image filtering first through a normalization process of 64x64 pixels and 16 piece bag of words. Then the data set is converted into ARFF form that can be use in training and testing algorithms. Black box testing shows each module / function applications can run as desired. Percentage of successful recognize image test results shows that Logistic Regression algorithm get the highest percentage of success is 95%, 90% for class yes and 100% for classes no in recognizing faces. It can be concluded that the application of digital image recognition machine learning has built successfully and can be used by users to get the best classification algorithm in recognizing digital image. Key Words: Machine Learning, Recognition, Digital Image, Classification

Page 3: MACHINE LEARNING PENGENALAN CITRA DIGITAL …pasca.unhas.ac.id/jurnal/files/1d275aa6ca3489c0f09a2fd5144168ee.pdf · Pengenalan citra digital merupakan salah satu tema ... Penelitian

PENDAHULUAN

Pengenalan citra digital merupakan salah satu tema penelitian computer vision

khususnya pattern recognition dan machine learning. Penelitian pengenalan citra sangat

bermanfaat untuk kebutuhan klasifikasi objek di berbagai bidang, seperti: kedokteran,

kelautan dan bisnis. Penelitian-penelitian sebelumnya membuat aplikasi khusus untuk

mengenal citra digital tertentu menggunakan algoritma machine learning tertentu dengan

nilai-nilai parameter optimal sesuai hasil penelitannya. Aplikasi tersebut hanya efektif

digunakan untuk citra yang telah diteliti sebagai objek penelitiannya, sehingga setiap peneliti

citra harus membangun aplikasi baru untuk objek penelitian baru. Hal ini membutuhkan

keahlian dalam pemrograman, sementara para peneliti citra berasal dari berbagai bidang ilmu

yang tidak semuanya programmer.

Dengan adanya permasalah tersebut, kami menganggap perlu melakukan penelitian

berjudul “Machine Learning Pengenalan Citra Digital”. Hasil penelitian ini diharapkan dapat

membantu para peneliti pengenalan citra tanpa harus membangun sendiri aplikasi setiap

melakukan penelitian dengan fleksibilitas dalam memilih algoritma dan dapat digunakan

untuk berbagai objek citra digital.

Beberapa penelitian yang telah dilakukan menjadi ide dasar dalam penelitan ini.

Implementasi Pengolahan Citra dan Algoritma LVQ untuk Pengenalan Pola Buku. Penelitian

ini menggunakan Algoritma Learning Vector Quantization (LVQ) untuk klasifikasi buku

sesuai sampulnya. Sebelum diolah menggunakan LVQ, citra terlebih dahulu dinormalisasi

dan dikonversi menjadi citra biner (Lukman, 2012). Breast Tissue Classification Using Gabor

Filter, PCA and Support Vector Machine. Penelitian ini menggunakan algoritma Support

Vector Machine (SVM) untuk klasifikasi citra mamografi dalam mengenali kanker payudara.

Sebelum diklasifikasi, Citra terlebih dahulu melalui proses normalisasi, ekstraksi fitur

menggunakan filter gabor dan reduksi dimensi citra menggunakan PCA (Hajare dkk., 2012).

Using the K-Nearest Neighbor Algorithm for the Classification of Lymph Node Metastasis in

Gastric Cancer. Citra terlebih dahulu melalui proses seleksi fitur untuk mereduksi dimesinya,

kemudian digunakan K-Nearest Neighbor (KNN) untuk klasifikasi. Penelitian ini

membuktikan kelayakan dan efektivitas dari metode machine learning untuk diagnosa

kelenjar getah bening metastatis pada kanker lambung menggunakan data GSI (Li dkk.,

2012). Comparing Image Classification Methods: K-Nearest-Neighbor and Support-Vector-

Machines. Penelitian ini mencoba membandingkan kemampuan klasifikasi citra metode KNN

dan SVM menggunakan model Bag of Word (BoW). Dengan menggunakan model BoW,

SVM lebih unggul dari KNN (Kim dkk., 2012). Analisis Komparasi Algoritma Klasifikasi

Page 4: MACHINE LEARNING PENGENALAN CITRA DIGITAL …pasca.unhas.ac.id/jurnal/files/1d275aa6ca3489c0f09a2fd5144168ee.pdf · Pengenalan citra digital merupakan salah satu tema ... Penelitian

Data Mining Untuk Prediksi Mahasiswa Non Aktif. Penelitian ini membandingkan 4

algoritma data maining yaitu logistic regression, decision tree, naïve bayes dan neural

network untuk mendapatkan algoritma yang paling akurat dalam memprediksi mahasiswa

non-aktif pada perguruan tinggi. Data set yang digunakan sebanyak 3861 mahasiswa

Universitas Dian Nuswantoro terdiri dari data demografi dan akademik (Hastuti, 2012).

Seleksi Fitur Menggunakan Random Forest Dan Neural Network. Penelitian ini

menggabungkan algoritma Random Forest dan Neural Network untuk kebutuhan klasifikasi,

agar data set yang mempunyai banyak fitur. Percobaan menggunakan seleksi fitur dengan

menggunakan data set iris, lung cancer dan semeion handwriting digital (Saputra dkk., 2011).

Analysis of Machine Learning Algorithms using WEKA. Penelitian ini mengimplementasikan

aplikasi WEKA untuk klasifikasi dan membandingkan performa waktu learning dan ketepatan

klasifikasi beberapa Algoritma Machine Learning (Desai dkk., 2012).

Penelitian ini bertujuan membangun aplikasi pengenalan citra digital menggunakan

algoritma machine learning untuk kebutuhan klasifikasi citra digital sebagai alat bantu bagi

pengguna dalam mendapatkan algoritma klasifikasi terbaik dalam mengenali citra digital.

BAHAN DAN METODE

Lokasi dan Rancangan Penelitian

Penelitian ini dilakukan di Laboratorium Komputer Jurusan Teknik Elektro Fakultas

Teknik Universitas Hasanuddin Makassar. Lokasi ini dipilih karena penelitian menggunakan

koneksi internet, perangkat lunak dan perangkat keras yang dapat di peroleh dari sebuah

laboratorium komputer.

Dalam penelitian ini, aplikasi Machine Learning Pengenalan Citra Digital

menggunakan algoritma-algoritma Machine learning WEKA. Untuk menjelaskan rancangan

aplikasi secara umum, digunakan diagram uses case seperti pada gambar 1. Diagram use case

menunjukkan hubungan antara use case dan aktor-aktor maupun use case dan use case lainnya

dalam sebuah sistem. Setiap use case menunjukkan fungsi yang dilakukan oleh sistem.

Sedangkan aktor mewakili pihak-pihak yang berinteraksi dengan sistem.

Terdapat 3 aktor yang berinteraksi dengan sistem yaitu peneliti citra, google app

engine (GAE) dan Machine Learning WEKA. Peneliti citra merupakan orang yang

menggunakan sistem. GAE merupakan mesin tempat mengerjakan setiap fungsi pada sistem

(Sanderson, 2013). Machine Learning WEKA merupakan sebuah library java yang

menyediakan algoritma-algoritma Machine Learning yang dibutuhkan oleh sistem (Witten

dkk., 2011).

Page 5: MACHINE LEARNING PENGENALAN CITRA DIGITAL …pasca.unhas.ac.id/jurnal/files/1d275aa6ca3489c0f09a2fd5144168ee.pdf · Pengenalan citra digital merupakan salah satu tema ... Penelitian

Garis kotak putus-putus menandakan batasan sistem yang dibangun, terlihat pada

gambar 1, setiap aktor berada di luar sistem yang dibangun. Use case – use case algoritma

Machine Learning juga berada di luar sistem yang dibangun karena mereka berasal dari

library Machine Learning WEKA yang digunakan oleh sistem. Use case – use case yang

berada di dalam yang merupakan fungsi-fungsi sistem yang dibangun dalam penelitian ini.

Instrumen Penelitian

Penelitian ini menggunakan instrumen meliputi seperangkat komputer berbasis core i3

yang kompatibel dengan perangkat lunak yang digunakan. Pemilihan perangkat keras tersebut

berdasarkan kebutuhan processor minimum agar dalam membangun aplikasi, peneliti tidak

terhambat oleh masalah akses yang lambat. Perangkat lunak yang digunakan yaitu : Java 2

SDK, Eclipse for Java EE Developer, Google Plugin for Eclipse, Google App Engine SDK,

Google Web Toolkit dan Web Browser. Alasan pemilihan perangkat lunak disebabkan karena

aplikasi yang dibangun berbasis software as a service google app engine yang membutuhkan

perangkat lunak tersebut.

Teknik Pengumpulan Data

Teknik pengumpulan data yang digunakan adalah teknik kepustakaan dengan mencari

bahan-bahan yang berkaitan dengan materi penelitian, baik dari buku, jurnal dan internet.

Data citra yang digunakan untuk data set pelatihan, pengujian dan pengenalan citra adalah

citra wajah pada direktori faces_easy Caltech 101 yaitu kumpulan objek citra digital wajah

manusia baik laki-laki maupun perempuan bertipe PNG berasal dari computational vision

Institut Teknologi California bagian penelitian yang diunduh dari url:

http://www.vision.caltech.edu/Image_Datasets/Caltech101/.

Pengujian Sistem

Kesuksesan Modul atau fungsi dari aplikasi sebagai indikator output akan diuji

menggunakan metode pengujian black box sehingga dapat diketahui apakah aplikasi sukses

berjalan sesuai yang diharapkan. Modul-modul yang akan diuji tersebut yaitu: proses login,

memasukkan/unggah data citra untuk pelatihan dan pengujian, proses normalisasi dan Bag of

Words citra digital, penyimpanan data set latih dan uji, menampilkan data set latih dan uji,

memasukkan pengaturan data set latih dan uji, proses konversi data set menjadi format ARFF,

proses pelatihan dan pengujian algoritma-algoritma machine learning yang digunakan,

menampilkan hasil pelatihan dan pengujian, memasukkan/unggah data citra yang akan

dikenali dan proses pengenalan citra digital sesuai hasil pelatihan

Indikator ouput lainnya adalah persentasi keberhasilan aplikasi dalam mengenali citra

digital sesuai data set pelatihan dan pengujian yang diberikan. Untuk menghitung persentasi

Page 6: MACHINE LEARNING PENGENALAN CITRA DIGITAL …pasca.unhas.ac.id/jurnal/files/1d275aa6ca3489c0f09a2fd5144168ee.pdf · Pengenalan citra digital merupakan salah satu tema ... Penelitian

tersebut, digunakan pengujian keberhasilan pengenalan citra digital sebagai berikut:

keberhasilan pengenalan citra digital adalah hasil perbandingan dari jumlah citra digital yang

dikenali dengan jumlah citra digital yang diberikan.

HASIL PENELITIAN

Citra digital dapat dikenali melalui beberapa tahap, yang pertama adalah penginputan

data set citra. Tahap kedua, setiap citra yang akan digunakan, terlebih dahulu melalui proses

filterisasi yaitu normalisasi dan bag of words. Normalisasi digunakan untuk mengubah ukuran

pixel citra menjadi 64X64 pixel. Hal ini dilakukan agar citra yang diinput mempunyai

keseragaman sehingga lebih mudah diolah oleh proses selanjutnya. Bag of words yang

digunakan yaitu membagi citra yang telah dinormalisasi menjadi 16 bagian. Tahap ketiga

adalah proses pelatihan dan pengujian algoritma-algoritma learning untuk mendapatkan

algoritma terbaik dalam mengenali citra sesuai model pelatihan. Sebelum memasuki tahap ini,

terlebih dahulu data set dikonversi mengikuti format ARFF agar dapat diproses oleh algoritma

klasifikasi WEKA. Setelah mendapatkan algoritma terbaik, model pelatihan akan digunakan

untuk pengenalan citra digital. Hal ini juga membutuhkan penginputan data citra yang akan

dikenali, filterisasi citra, ubah data set ke format ARFF dan aplikasi akan memberikan output

berupa hasil pengenalan.

Aplikasi machine learning pengenalan citra digital dapat diakses menggunakan web

browser dengan alamat url http://recognizeimage.appspot.com. Aplikasi terdiri dari 2 bagian

utama, bagian pertama adalah halaman login, overview dan logout. Sebelum menggunakan

aplikasi, pengguna wajib melakukan login menggunakan akun google. Gambar 2

memperlihatkan halaman yang pertamakali diakses oleh pengguna. Jika pengguna belum

login, maka halaman setting & pra-processing dan halaman training, testing & recognizing

masih non-aktif. Untuk login, pengguna menekan link Sign In, kemudian akan tampil

halaman login google. Jika pengguna berhasil login, maka halaman-halaman yang non-aktif

akan diaktifkan kemudian menampilkan link Sign Out yang akan digunakan pengguna untuk

Sign Out. Jika pengguna Sign Out, maka tampilan akan kembali seperti pada gambar 2.

Gambar 2 juga menampilkan halaman overview. Halaman ini berfungsi sebagai penjelasan

dan panduan penggunaan aplikasi. Bagian kedua adalah halaman setting & pra-processing,

Pada halaman ini dilakukan pra-proses sebelum dilakukan pelatihan, pengujian dan

pengenalan menggunakan machine learning.

Metode pengujian black box digunakan untuk menguji kesuksesan modul-modul atau

fungsi-fungsi dari aplikasi yang dibangun sebagai indikator output, sehingga dapat diketahui

Page 7: MACHINE LEARNING PENGENALAN CITRA DIGITAL …pasca.unhas.ac.id/jurnal/files/1d275aa6ca3489c0f09a2fd5144168ee.pdf · Pengenalan citra digital merupakan salah satu tema ... Penelitian

apakah aplikasi telah sukses berjalan sesuai yang diharapkan.. Hasil pengujian black box

dapat dilihat pada tabel 1. Tabel tersebut memperlihatkan bahwa setiap modul/fungsi beserta

bagian-bagian input/output sukses melewati pengujian yang menandakan bahwa modul/fungsi

tersebut sudah sesuai dengan harapan.

Citra yang akan dikenali adalah citra wajah yang diberi nama wajah sahrul. Untuk

kebutuhan pelatihan dan pengujian, citra wajah sahrul digunakan sebanyak 25 citra sebagai

data kelas ya. Data yang bukan termasuk wajah sahrul atau kelas bukan terdiri dari: 5 citra

wajah peter, 5 citra wajah sarah, 5 citra wajah mei, 5 citra wajah john dan 5 citra wajah laura.

Keseluruhan data latih dan uji sebanyak 50 citra. Gambar 3 memperlihatkan data set citra latih

dan uji. Persentasi pembagian data latih sebanyak 60% dari data set atau sebanyak 30 citra

yang terdistribusi normal menjadi 15 kelas ya dan 15 kelas bukan. Data uji sebanyak 40% dari

data set atau sebanyak 20 citra yang terdistribusi secara normal yaitu 10 untuk kelas ya dan 10

untuk kelas bukan. Tabel 2 memperlihatkan bahwa dalam mengenali citra wajah sahrul,

algoritma logistic regression memiliki tingkat keberhasilan yang tertinggi yaitu 95%, dengan

pengenalan untuk kelas ya 90% dan kelas bukan 100%.

PEMBAHASAN

Penelitian ini menunjukkan rancang bangun aplikasi machine learning pengenalan

citra digital dengan fleksibilitas dalam mendapatkan algoritma terbaik yang telah disediakan

sesuai objek penelitian masing-masing. Peneliti citra digital dapat menggunakan aplikasi ini

dengan terlebih dahulu melatih dan menguji 6 algoritma machine learning untuk mendapatkan

algoritma terbaik, kemudian menggunakan algoritma terbaik tersebut untuk mengenali citra

digital. Tahap-tahapnya yaitu normalisasi, Bag of Words, Pembuatan data set WEKA,

pelatihan, pengujian dan pengenalan citra digital.

Normalisasi merupakan proses menyeragamkan ukuran citra digital inputan menjadi

matriks ukuran M X N (Lukman, 2012). Teknik normalisasi dalam pembangunan aplikasi

menggunakan google image API (Application Programming Interface) untuk bahasa

pemrograman java. Ukuran citra ditransformasi ke ukuran 64X64 pixel. Teknik bag of words

(BoW) berfungsi untuk memperkecil field-field setiap data set namun tetap mempertahankan

posisi setiap pixel pada citra digital (Kim dkk., 2012). BoW diperoleh dari nilai rata-rata pixel

citra yang dibagi menjadi 16 bagian. Setiap pixel citra terdiri dari 3 nilai yaitu merah (red),

hijau (green) dan biru (blue) atau biasa disebut dengan RGB (Santi, 2011). Untuk

mendapatkan satu nilai untuk setiap pixel, dihitung rata-rata dari nilai RGB (Lukman, 2012).

Page 8: MACHINE LEARNING PENGENALAN CITRA DIGITAL …pasca.unhas.ac.id/jurnal/files/1d275aa6ca3489c0f09a2fd5144168ee.pdf · Pengenalan citra digital merupakan salah satu tema ... Penelitian

Data set tersimpan dalam bentuk tabel database yang terdiri dari 18 field yaitu nama

pengenalan citra, BoW 1 sampai BoW 16 dan target klasifikasi. Agar data set dapat dikenali

oleh algoritma-algoritma Machine Learning WEKA, diperlukan konversi data set ke ARFF

(Desai dkk., 2012). Konversi ini terbagi menjadi 2 bagian yaitu header dan data. Bagian

header terdiri dari nama-nama field dari data set. Bagian data digunakan untuk menyimpan isi

data set (Witten dkk., 2011).

Aplikasi ini diperuntukkan untuk mengenali citra digital. Sebelum mengenali citra,

terlebih dahulu dilakukan pengujian algoritma-algoritma machine learning yang telah

disediakan. Algoritma yang mempunyai tingkat keberhasilan tertinggilah yang akan

digunakan untuk mengenali citra digital. Algoritma logistic regression mempunyai tingkat

keberhasilan tertinggi dari setiap algoritma machine learning yang diuji. Hal ini sesuai dengan

sifatnya yang memang diperuntukkan bagi klasifikasi biner (Hastuti, 2012).

Salah satu faktor kesuksesan machine learning dalam mengenali citra digital adalah

jenis algoritma machine learning yang digunakan. Pada aplikasi ini algoritma-algoritma

machine learning yang digunakan adalah algoritma-algoritma klasifikasi Machine Learning

WEKA dengan default setting. Padahal, algoritma-algoritma tersebut masih bisa diekplorasi

dengan setting yang bervariasi, misalnya algoritma K-Nearest Neighbor, dimana nilai K dapat

bervariasi, misalnya K=2, K=3, dan sebagainya, namun pada penelitian ini hanya

menggunakan nilai K=1 (Li dkk., 2012).

Selain jenis algoritma, ada dua hal yang mempengaruhi kesuksesan sebuah algoritma

machine learning dalam mengenali citra digital yaitu jenis citra yang diberikan dan jenis

filterisasi data set (Hajare dkk., 2012). Kefokusan dan kekonsistenan citra yang diberikan

dapat meningkatkan kemampuan algoritma machine learning dalam mengenali citra digital.

Metode filterisasi data set yang berbeda juga dapat mempengaruhi tingkat keberhasilan

algoritma machine learning dalam mengenali citra digital .

KESIMPULAN DAN SARAN

Penelitian ini berhasil membangun machine learning pengenalan citra digital dengan

fleksibilitas dalam mendapatkan algoritma terbaik yang telah disediakan sesuai objek

penelitian masing-masing. Hal ini dibuktikan dengan kesuksesan aplikasi menggunakan

pengujian black box dan pengujian keberhasilan algoritma dalam mengenali citra digital.

Disarankan pada penelitian selanjutnya, machine learning dikembangkan untuk kebutuhan

klasifikasi multi kelas. Pengguna aplikasi sebaiknya menguji coba keberhasilan setiap

Page 9: MACHINE LEARNING PENGENALAN CITRA DIGITAL …pasca.unhas.ac.id/jurnal/files/1d275aa6ca3489c0f09a2fd5144168ee.pdf · Pengenalan citra digital merupakan salah satu tema ... Penelitian

algoritma yang ditawarkan untuk mendapatkan algoritma terbaik sebelum menggunakannya

dalam pengenalan citra digital.

DAFTAR PUSTAKA

Desai, Aaditya; Rai, Sunil. (2012). Analysis of Machine Learning Algorithms using WEKA. Mumbai : International Journal of Computer Applications® (IJCA).

Hajare, Pravin S.; Dixit, Vaibhav V. (2012). Breast Tissue Classification Using Gabor Filter,

PCA and Support Vector Machine. International Journal of advancement in electronics and computer engineering (IJAECE), Vol. 1 Issue 4 hal. 116-119. www.ijaece.com (diakses tanggal 24-1-2013 pukul 09.00 WITA)

Hastuti, Khafiizh (2012). Analisis Komparasi Algoritma Klasifikasi Data Mining Untuk

Prediksi Mahasiswa Non Aktif. Semarang: Seminar Nasional Teknologi Informasi dan Komunikasi Terapan (SEMANTIK), Vol. 2 No. 1, Hal. 241 – 249.

Kim, Jinho; Kim, Byung-Soo; Savarese, Silvio. (2012). Comparing Image Classification

Methods-K-Nearest-Neighbor and Support-Vector-Machines. Wisconsin : Proceedings of the 2012 American conference on Applied Mathematics, hal. 133-138.

Li, Chao, dkk. (2012). Using the K-Nearest Neighbor Algorithm for the Classification of

Lymph Node Metastasis in Gastric Cancer. Journal of Computational and Mathematical Methods in Medicine Vol. 2012. http://dblp.uni-trier.de/db/journals/cmmm/cmmm2012.html (diakses tanggal 24-1-2013 pukul 12.00 WITA)

Lukman, Andi. (2012). Implementasi Pengolahan Citra dan Algoritma LVQ Untuk

Pengenalan Pola Buku. Medan: Seminar Nasional Informatika (SNIf) Hal. 145-151. Sanderson, Dan. (2013). Programming Google App Engine, Second Edition. Sebastopal:

O’Reilly Media Inc. Santi, Candra Noor. (2011). Mengubah Citra Berwarna Menjadi Gray-Scale dan Citra Biner.

Semarang: Jurnal Teknologi Informasi DINAMIK Vol. 16 No.1 Hal. 14-19. Saputra, Wahyuni S.J; Sujatmika, Arif Rahman; Arifin, Agus Zainal. (2011). Seleksi Fitur

Menggunakan Random Forest Dan Neural Network. Surabaya: The 13th Industrial Electronics Seminar (IES), Hal. 93-97.

Witten, Ian H.; Frank Eibe; Hall Mark A. (2011). Data Mining Practical Machine Learning

Tools and Techniques, Third Edition. Burlington: Morgan Kaufmann Publishers.

Page 10: MACHINE LEARNING PENGENALAN CITRA DIGITAL …pasca.unhas.ac.id/jurnal/files/1d275aa6ca3489c0f09a2fd5144168ee.pdf · Pengenalan citra digital merupakan salah satu tema ... Penelitian

Gambar 1 Diagram Use Case Sistem

Page 11: MACHINE LEARNING PENGENALAN CITRA DIGITAL …pasca.unhas.ac.id/jurnal/files/1d275aa6ca3489c0f09a2fd5144168ee.pdf · Pengenalan citra digital merupakan salah satu tema ... Penelitian

Gambar 2 Tampilan Aplikasi

Page 12: MACHINE LEARNING PENGENALAN CITRA DIGITAL …pasca.unhas.ac.id/jurnal/files/1d275aa6ca3489c0f09a2fd5144168ee.pdf · Pengenalan citra digital merupakan salah satu tema ... Penelitian

Gambar 3 Data Set Citra Wajah

Tabel 1 Rekapitulasi Hasil Pengujian Black Box No. Jenis modul/fungsi yang diuji Jumlah

input/output Hasil

1 Proses Login 5 Sukses 2 Memasukkan/unggah data citra untuk pelatihan dan pengujian 2 Sukses 3 Proses normalisasi dan bag of words citra digital 2 Sukses 4 Penyimpanan data set latih dan uji 1 Sukses 5 Menampilkan data set latih dan uji 1 Sukses 6 Memasukkan pengaturan data set latih dan uji 2 Sukses 7 Proses konversi data set menjadi format ARFF 2 Sukses 8 Proses pelatihan dan pengujian algoritma-algoritma machine

learning yang digunakan 6 Sukses

9 Menampikan hasil pelatihan dan pengujian 1 Sukses 10 Memasukkan / unggah data citra yang akan dikenali 2 Sukses 11 Proses pengenalan citra digital sesuai hasil pelatihan 1 Sukses

Tabel 2. Hasil Pengujian Algoritma Machine Learning Dalam Mengenali Citra Wajah No Algoritma Machine Learning Kelas Ya Kelas Bukan Persentasi

Keberhasilan Benar Salah Benar Salah 1 Support Vector Machine 5 5 8 2 65 % 2 Naïve Bayes 8 2 8 2 80 % 3 C4.5 Decision Tree 7 3 9 1 80 % 4 K-Nearest Neigbours 6 4 7 3 65 % 5 Logistic Regression 9 1 10 0 95 % 6 Random Forest 9 1 4 6 65 %