38
OPTIMASI PARAMETER PADA KLASIFIKASI FUZZY OPTIMASI PARAMETER PADA KLASIFIKASI FUZZY ARTMAP BERBOBOT BERBASIS ALGORITMA GENETIKA ARTMAP BERBOBOT BERBASIS ALGORITMA GENETIKA w w w . i t s . a c . i d w w w . i t s . a c . i d Magister Magister Teknik Teknik Informatika Informatika Institut Institut Teknologi Teknologi Sepuluh Sepuluh Nopember Nopember (ITS) (ITS) Oleh Oleh : : Bain Bain Khusnul Khusnul Khotimah Khotimah Nrp Nrp . 5108201004 . 5108201004 Dosen Dosen Pembimbing Pembimbing : : Dr. Dr. Agus Agus Zainal Zainal Arifin Arifin , , S.Kom S.Kom ., ., M.Kom M.Kom . . Anny Yuniarti, S.Kom., M.Comp. Sc. Anny Yuniarti, S.Kom., M.Comp. Sc. TESIS

OPTIMASI PARAMETER PADA KLASIFIKASI FUZZY ARTMAP …

  • Upload
    others

  • View
    11

  • Download
    0

Embed Size (px)

Citation preview

Slide 1OPTIMASI PARAMETER PADA KLASIFIKASI FUZZY OPTIMASI PARAMETER PADA KLASIFIKASI FUZZY ARTMAP BERBOBOT BERBASIS ALGORITMA GENETIKAARTMAP BERBOBOT BERBASIS ALGORITMA GENETIKA
w w w . i t s . a c . i dw w w . i t s . a c . i d
MagisterMagister TeknikTeknik InformatikaInformatika InstitutInstitut TeknologiTeknologi SepuluhSepuluh NopemberNopember (ITS)(ITS)
DosenDosen PembimbingPembimbing : : Dr. Dr. AgusAgus ZainalZainal ArifinArifin, , S.KomS.Kom., ., M.KomM.Kom.. Anny Yuniarti, S.Kom., M.Comp. Sc. Anny Yuniarti, S.Kom., M.Comp. Sc.
TESIS
sebuah obyek ke kategori atau kelas tertentu Pengelompokan berdasarkan nilai attribut-attribut
atau fitur-fiturnya (Pang Ning Tang, 2005).
Algoritma pembelajaran untuk membangun model klasifikasi: Adaptive Resonance Theory (ART) merupakan jenis klasifikasi baru dari neural network
Latar Belakang
(Grossberg, 1976) - : Neurol network Back Propagation menghasilkan
model yang berasal dari hidden neuron dan fungsi aktivasi yang membutuhkan epoch untuk titik equilibrium, jumlah hidden neurons dan weight bersifat tetap dan perlu retraining sehingga stability dilemma
(Grossberg, 1987) +: ART:ART-1 dan ART-2 dapat mengatasi stability
dilemma
learning dari pola berlabel -:hal ini menimbulkan ketidakadilan terhadap
node yang memiliki jumlah pattern lebih banyak
Latar Belakang
(Baraldi, 2002) Symmetric Fuzzy ART untuk menjaga keseimbangan
fungsi match dan aktifasi yang selalu bertambah sehingga lebih toleran dalam mencari kedekatan antara cluster node output dengan pola
Mempunyai fungsi aktifasi dan match terpengaruh jumlah data di dalam node sehingga dipengaruhi size dari cluster node
-: semakin besar ukuran cluster maka jarak class didalam cluter semakin jauh
Latar Belakang (Darlis,2009): Algoritma Fuzzy ARTMAP Berbobot Mengkombinasikan antara Fuzzy ARTMAP dan symmetric Fuzzy
ART ditambah dengan pembobotan node cluster berdasarkan jumlah pola dan size node cluster tersebut Proses pembobotan dilakukan dengan sistem bobot dalam algoritma sistem koloni semut berbasis feromon Pembobotan digunakan menyesuaikan size cluster node output yang
memiliki jumlah pattern lebih banyak
-: optimization problem dipengaruhi oleh inisialisasi parameter pada saat training sehingga mempengaruhi kinerja classifier
KontribusiKontribusi PenelitianPenelitian
vigilance untuk menentukan tingkat resonansi pada saat update size cluster
Rumusan Masalah Bagaimana cara mengoptimasi parameter dengan
menentukan parameter terbaik dengan algoritma genetika pada klasifikasi fuzzy ARTMAP berbobot
Bagaimana mengukur kinerja klasifikasi GA-FAMB dibandingkan dengan klasifikasi GS-FAMB (Grid search –FAMB) menggunakan uji t berpasangan pada ten fold cross validation.
Tujuan Mendapatkan parameter yang optimal untuk
meningkatkan akurasi pada klasifikasi FAMB. Mempermudah pencarian parameter pada
klasifikasi yang dapat diaplikasikan diberbagai bidang datamining.
ALgoritma FAMB
1. Menghitung tingkat kesimetrisan fungsi aktifasi dan match
2. Menghitung fungsi aktifasi dan match masing-masing node 3. Mengurutkan fungsi aktifasi dan match berdasarkan nilai
terbesar
ALgoritma FAMB
Update node Size Cluster - Menghitung ratio perbandingan node lama dengan node baru - Menghitung evaporate - Pembobotan Pheromon intensity
Menghitung fungsi aktifasi dan match masing-masing node Mengurutkan fungsi aktifasi dan match berdasarkan nilai
terbesar yang ditambah pembobotan pheromon
Desain sistem untuk Estimasi parameter pada klasifikasi FAMB
Preprocessing
ValVal Valvv t
Langkah-langkah pada GA
pengubahan ghenotype menjadi phenotype
Kromosom pada individu mewakili parameter fungsi fuzzy ARTMAP untuk menghasilkan nilai fitness [Whitley, 1993]
Nilai fitness dihitung pada setiap populasi kromosom dan diambil nilai fitness tertinggi pada setiap populasi. Fitness yang digunakan adalah akurasi FAMB.
fitness = accuracy klasifikasi
Operasi algoritma genetika
Dilakukan mutasi untuk menghindari konvergensi prematur.
Nilai individu terbaik diperoleh pada saat fitness berada posisi optimal pada kondisi konvergen (stabil) Untuk menjaga agar individu bernilai fitness tertinggi tersebut tidak hilang selama evolusi, prosedur elitisme.
Crossover
Mutasi
2. Untuk setiap parameter hitung performansi FAMB dengan pembagian data proporsional
3. Pilih nilai terbaik, jika belum ketemu 4. Lakukan pencarian ulang pada grid
(rentang nilai) yang lebih kecil
Skenario 1
Metode Ten Fold Cross Validation Uji t-berpasangan (Pang ning Tang, 2005),
(Huang, 2006)
Tujuan Mengetahui metode manakah yang memiliki
kinerja lebih baik untuk set data tertentu pada nilai parameter terbaik pada metode GA-FAMB vs GS-FAMB.
Skenario 2
Data UCI repository dibagi menjadi 2 : 50% data testing dan 50% data testing.
Algoritma dilakukan pengujian sebanyak 10 kali dengan menggunakan parameter pada algoritma genetika dan algoritma grid search yang sama
Tujuan Untuk mengetahui tingkat kestabilan baik metode GA-
FAMB maupun GS-FAMB, dengan membandingkan rata-rata nilai akurasi yang diperoleh
HASIL UJI COBA SKENARIO 1
Hasil pembelajaran metode GA-FAMB vs GS-FAMB menggunakan ten fold cross validation
wine sonar WBCD Ionosphere
GS 90.4 71.9 95.0 89.8 GA 93.9 76.4 97.5 93.7
0.0
20.0
40.0
60.0
80.0
100.0
120.0
% )
Rekapitulasi hasil uji t berpasangan ten fold validation untuk data set UCI repository
(GA-FAMB ) - (GS-FAMB ) memiliki mean selisih akurasi positif untuk seluruh dataset pada tingkat kepercayaan 95%, kecuali WBCD pada 98%.
Secara umum metode GA-FAMB memiliki akurasi yang lebih baik dari metode GS-FAMB pada parameter optimal. Hal ini menegaskan bahwa metode GA-FAMB lebih baik dari metode GS-FAMB.
Grafik hasil keseluruhan pembelajaran akurasi metode GA-FAMB
GA (%maks) GA (%min) Wine 100 88.89 Sonar 90.48 63.64 WBCD 98.55 97.01 Ionosphere 100 91.18
60
65
70
75
80
85
90
95
100
1 2 3 4 5 6 7 8 9 10
Ak ur
GS (%maks) GS (%min)
1 2 3 4 5 6 7 8 9 10
Aku ras
Analisa Hasil Optimasi Parameter Menggunakan GA
Uji coba dilakukan hingga mencapai nilai fitness tertinggi dan nilai sama untuk setiap iterasi (konvergen). Setiap uji coba mencapai kondisi konvergen yang tidak sama Data set dengan attribut dan jumlah fitur besar cenderung mencapai konvergen pada iterasi lebih tinggi
Hasil pembelajaran menggunakan algoritma genetika optimasi fold 1
Nilai fitness dihitung pada setiap populasi kromosom dan diambil nilai fitness tertinggi pada setiap populasi (Witley, 1993).
Sonar
100
1 7 13 19 25 31 37 43 49 55 61 67 73 79 85 91 97 Fi
tn e ss
t e rb
HASIL UJI COBA SKENARIO 2 Hasil perbandingan pembelajaran metode GA-
FAMB vs GS-FAMB untuk uji 10 x
Nilai akurasi digunakan untuk mencari nilai peak yang diambil dari rata-rata akurasi.
Hal ini disebabkan dalam setiap uji coba 10 kali hasilnya berbeda-beda.
Grafik hasil keseluruhan pembelajaran akurasi metode GA-FAMB dengan uji coba 10 x
0 10 20 30 40 50 60 70 80 90
100
1 2 3 4 5 6 7 8 9 10
Ak ur
wine sonar WBCD ionosphere
GA (%maks) GA ( %min) Wine 96.67 91.11 Sonar 75.24 65.71 WBCD 97.95 96.49 Ionosphere 89.77 82.39
Grafik hasil keseluruhan pembelajaran akurasi metode GS-FAMB dengan uji coba 10 x
0 10 20 30 40 50 60 70 80 90
100
1 2 3 4 5 6 7 8 9 10
Ak ura
Perbandingan Jumlah Iterasi pada keempat set data metode optimasi algoritma genetika
Hasil pembelajaran menggunakan algoritma genetika untuk uji coba 10 x
98
98.5
99
99.5
100
Fi tn
es s
te rb
ai k
uji ke-1 uji ke-2 uji ke-3 uji ke-4 uji ke-5
uji ke-6 uji ke-7 uji ke-8 uji ke-9 uji ke-10
90 91 92 93 94 95 96 97 98 99
100
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49
Fi tn
es s
Te rb
ai k
Uji ke-1 Uji ke-2 Uji ke-3 Uji ke-4 Uji ke-5
Uji ke-6 Uji ke-7 Uji ke-8 Uji ke-9 Uji ke-10
Wine Sonar
Hasil pembelajaran menggunakan algoritma genetika untuk uji coba 10 x
97
97.5
98
98.5
99
99.5
100
1 6 11 16 21 26 31 36 41 46 51 56 61 66 71 76 81 86 91 96
Fi tn
es s
Te rb
ai k
Uji ke-1 Uji ke-2 Uji ke-3 uji ke-4 Uji ke-5
Uji ke-6 Uji ke-7 Uji ke-8 Uji ke-9 Uji ke-10
91
92
93
94
95
96
97
98
99
100
1 6 11 16 21 26 31 36 41 46 51 56 61 66 71 76 81 86 91 96
Fi tn
es s
Te rb
ai k
Uji ke-1 Uji ke-2 Uji ke-3 Uji ke-4 Uji ke-5
Uji ke-6 Uji ke-7 Uji ke-8 Uji ke-9 Uji ke-10
WBCD Ionosphere
Kesimpulan
Algoritma genetika mampu mendapatkan nilai parameter optimal secara otomatis dengan hasil yang lebih tinggi untuk set data wine sebesar 93.88%, sonar sebesar 76.35% , WBCD sebesar 97.51%, ionosphere sebesar 93.74% dibandingkan algoritma grid search untuk set data wine sebesar 90.41%, sonar sebesar 71.86% , WBCD sebesar 95.03%, ionosphere sebesar 89.80%.
Dari hasil uji t-test berpasangan, algoritma genetika menunjukkan bahwa nilai akurasi, sensitifitas dan spesifisitas rata-rata terbukti nilainya lebih besar dan rata-rata selisih akurasinya signifikan pada tingkat kepercayaan 95% dibandingkan pada algoritma grid search.
DAFTAR PUSTAKADAFTAR PUSTAKA





G. Carpenter, S. Grossberg, N. Markuzon, J. Reynolds, D. Rosen, (1992) “Fuzzy ARTMAP: A Neural Network Architecture for Incremental Supervised Learning of Analog Multidimensional Maps,” IEEE Trans. Neural Networks, vol. 3, pp. 698-713.
DAFTAR PUSTAKADAFTAR PUSTAKA




DAFTAR PUSTAKADAFTAR PUSTAKA




Terima Kasih…
Preprocessing
Operasi algoritma genetika
HASIL UJI COBA SKENARIO 1
Rekapitulasi hasil uji t berpasangan ten fold validation untuk data set UCI repository
Grafik hasil keseluruhan pembelajaran akurasi metode GA-FAMB
Grafik hasil keseluruhan pembelajaran akurasi metode GS-FAMB
Analisa Hasil Optimasi Parameter Menggunakan GA
Hasil pembelajaran menggunakan algoritma genetika optimasi fold 1
HASIL UJI COBA SKENARIO 2
Grafik hasil keseluruhan pembelajaran akurasi metode GA-FAMB dengan uji coba 10 x
Grafik hasil keseluruhan pembelajaran akurasi metode GS-FAMB dengan uji coba 10 x
Perbandingan Jumlah Iterasi pada keempat set data metode optimasi algoritma genetika
Hasil pembelajaran menggunakan algoritma genetika untuk uji coba 10 x
Hasil pembelajaran menggunakan algoritma genetika untuk uji coba 10 x
Kesimpulan