9
PENGUKURAN KEMIRIPAN-SEMANTIK CITRA DENGAN ~-' ~-'-"- . -- 'BAG OF WORDS'LOKAL FRAGMEN"--SEMANTIK CITRA ~ -'- ", -- ----- ---- ~,,,,-,~,- .,,,/ ··-·.'._w_. __ ,._.... ~ . IMAGE SEMANTIC SIMILARITY MEASUREMENT USING 'BAG OF WORDS' LOCAL IMAGE FRAGMENT YeniHerdlyeni', Rahmat Widyanto-, Belawati H. Wldjaja' 1 Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor, Kampus Darmaga, Wing 20 Level V Bogor, Jawa Barat, Indonesia. E-mail: [email protected] 2,3Fakultas Ilmu Komputer, Universitas Indonesia, Kampus Depok, Jawa Barat, Indonesia. E-mail: 2[email protected]@cs.ui.ac.id Received: 15 October 2009, Accepted for publication: 21 December 2009 INTISARI Penelitian ini mengusulkan sebuah metode baru pengukuran kemiripan citra menggunakan visual citra "bag-of- words" fragmen lokal semantik citra. Pada metode ini, citra direpresentasikan dengan sederetan fragmen lokal citra. Fragmen lokal citra adalah bagian citra yang memiliki informasi penting dan secara konsisten muncul bersama pada citra, Ekstraksi fragmen lokal citra menggunakan pembelajaran secara online. Kemiripan semantik citra diukur dengan 1) mencari korespondensi antara dua pasang deretan fragmen citra; dan 2) menghitung kemiripan antara fragmen. Uji coba dilakukan dengan menggunakan database citra benchmark dengan 2,268 citra. Hasil percobaan menunjukkan bahwa metode yang diusulkan dapat meningkatkan rataan precision sebesar 74%. Hasil percobaan menunjukkan bahwa metodologi yang diusulkan dapat digunakan untuk mengukur kemiripan semantik citra dan sesuai dengan persepsi visual manusia. Kata kunci: bag-of-words, fragmen lokal, kemiripan citra, semantik citra ABSTRACT This research proposes a new approach for measuring semantic image similarities between visual image using 'bag- of-words' semantic local image fragments. In this approach, image representation is represented using an ordered list of local image fragment. Local image fragment is apart from images which gives a significant information and appears consistently within images. Local image fragment was extracted using online learning. Image semantic similarity is measured by J) solving a correspondence problem between two ordered sets offeature; and 2) Calcu- lating similarities between matchedfeatures and dissimilarities between unmatchedfeatures. The methodology has already been tested on several benchmark image databases containing 2,268 images. The experimental results show that the proposed method can increase precision by as much as 74% in average. The proposed method ispromising that could be used to measure semantic similarity adequately to human visual similar perception. Keywords: bag-of-words, local fragment, image similarity, image semantic 1. PENDAHULUAN Dua hal penting dalam pengukuran kemiripan citra adalah representasi citra dan teknik pengukur- an kemiripan citra. Representasi citra yang baik adalah representasi citra yang mampu merepre- sentasi semantik citra dan tidak sensitif terhadap perubahan cahaya, geometris. Sedangkan teknik pengukuran citra yang baik adalah yang mampu mengukur kemiripan citra sesuai dengan persepsi manusia. Ada tiga teknik representasi citra, yaitu global (global-based), regional (region-based), dan --- -- -- ------ lokal (Local-basedv", Pada pendekatan global, citra direpresentasikan dengan seluruh bagian citra. Histogram merupakan salah satu teknik representasi citra global. Pendekatan ini sangat sensitif terhadap perubahan cahaya dan geome- tris, karena pada pendekatan ini mengabaikan informasi spasial citra. Pada pendekatan regional, citra direpresentasikan dengan beberapa regional citra hasil segmentasi. Pada pendekatan ini, di- kenai istilah Region of Interest (ROI). Kelemahan pendekatan ini adalah segmentasi yang kurang baik sehingga ROI yang dihasilkan tidak merepre- sentasikan citra yang sebenamya. Oleh karena itu, Yeni Herdiyeni dkk. I 49

PENGUKURAN KEMIIRIPAN SEMATIK CITRA DENGAN BAG OF WORDS LOKAL FRAGEMEN SEMATIK CITRA

Embed Size (px)

Citation preview

Page 1: PENGUKURAN KEMIIRIPAN SEMATIK CITRA DENGAN BAG OF WORDS LOKAL FRAGEMEN SEMATIK CITRA

PENGUKURAN KEMIRIPAN-SEMANTIK CITRA DENGAN~-' ~-'-"- . --

'BAG OF WORDS'LOKAL FRAGMEN"--SEMANTIK CITRA~ -'- ", -- ----- ---- ~,,,,-,~,- .,,,/··-·.'._w_. __ ,._.... ~ .

IMAGE SEMANTIC SIMILARITY MEASUREMENT USING 'BAG OF WORDS'LOCAL IMAGE FRAGMENT

YeniHerdlyeni', Rahmat Widyanto-, Belawati H. Wldjaja'1Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor,Kampus Darmaga, Wing 20 Level V Bogor, Jawa Barat, Indonesia. E-mail: [email protected],3Fakultas Ilmu Komputer, Universitas Indonesia, Kampus Depok, Jawa Barat, Indonesia.E-mail: [email protected]@cs.ui.ac.idReceived: 15 October 2009, Accepted for publication: 21 December 2009

INTISARI

Penelitian ini mengusulkan sebuah metode baru pengukuran kemiripan citra menggunakan visual citra "bag-of-words" fragmen lokal semantik citra. Pada metode ini, citra direpresentasikan dengan sederetan fragmen lokal citra.Fragmen lokal citra adalah bagian citra yang memiliki informasi penting dan secara konsisten muncul bersama padacitra, Ekstraksi fragmen lokal citra menggunakan pembelajaran secara online. Kemiripan semantik citra diukurdengan 1) mencari korespondensi antara dua pasang deretan fragmen citra; dan 2) menghitung kemiripan antarafragmen. Uji coba dilakukan dengan menggunakan database citra benchmark dengan 2,268 citra. Hasil percobaanmenunjukkan bahwa metode yang diusulkan dapat meningkatkan rataan precision sebesar 74%. Hasil percobaanmenunjukkan bahwa metodologi yang diusulkan dapat digunakan untuk mengukur kemiripan semantik citra dansesuai dengan persepsi visual manusia.

Kata kunci: bag-of-words, fragmen lokal, kemiripan citra, semantik citra

ABSTRACT

This research proposes a new approach for measuring semantic image similarities between visual image using 'bag-of-words' semantic local image fragments. In this approach, image representation is represented using an orderedlist of local image fragment. Local image fragment is a part from images which gives a significant information andappears consistently within images. Local image fragment was extracted using online learning. Image semanticsimilarity is measured by J) solving a correspondence problem between two ordered sets offeature; and 2) Calcu-lating similarities between matchedfeatures and dissimilarities between unmatchedfeatures. The methodology hasalready been tested on several benchmark image databases containing 2,268 images. The experimental results showthat the proposed method can increase precision by as much as 74% in average. The proposed method ispromisingthat could be used to measure semantic similarity adequately to human visual similar perception.

Keywords: bag-of-words, local fragment, image similarity, image semantic

1. PENDAHULUANDua hal penting dalam pengukuran kemiripan

citra adalah representasi citra dan teknik pengukur-an kemiripan citra. Representasi citra yang baikadalah representasi citra yang mampu merepre-sentasi semantik citra dan tidak sensitif terhadapperubahan cahaya, geometris. Sedangkan teknikpengukuran citra yang baik adalah yang mampumengukur kemiripan citra sesuai dengan persepsimanusia.

Ada tiga teknik representasi citra, yaitu global(global-based), regional (region-based), dan

--- -- -- ------

lokal (Local-basedv", Pada pendekatan global,citra direpresentasikan dengan seluruh bagiancitra. Histogram merupakan salah satu teknikrepresentasi citra global. Pendekatan ini sangatsensitif terhadap perubahan cahaya dan geome-tris, karena pada pendekatan ini mengabaikaninformasi spasial citra. Pada pendekatan regional,citra direpresentasikan dengan beberapa regionalcitra hasil segmentasi. Pada pendekatan ini, di-kenai istilah Region of Interest (ROI). Kelemahanpendekatan ini adalah segmentasi yang kurangbaik sehingga ROI yang dihasilkan tidak merepre-sentasikan citra yang sebenamya. Oleh karena itu,

Yeni Herdiyeni dkk. I 49

Page 2: PENGUKURAN KEMIIRIPAN SEMATIK CITRA DENGAN BAG OF WORDS LOKAL FRAGEMEN SEMATIK CITRA

pada pendekatan lokal, citra direpresentasikandengan bagian-bagian tertentu pada citra tanpamelakukan segmentasi.

Scale-Invariant Feature Transform (SIFT)merupakan salah satu teknik untuk merepresen-tasikan citra dengan menggunakan pendekatanIokal!". Gambar 1menunjukkan titik utama lokaldeskriptor SIFT.

Deskriptor SIFT juga digunakan untuk mem-bentuk fragmen atau 'visual words' pada temukembali citra (Gambar 2)pl. Fragmen citra di-peroleh berdasarkan titik utama (key points) citradari SIFT. Setelah diperoleh fragmen, selanjutnyadilakukan perhitungan untuk mengetahui banyak-nya jumlah fragmen pada setiap citra. Jumlahfragmen tersebut direpresentasikan dengan vektorfrekuensi fragmen (Gambar 3).

Setelah citra direpresentasikan dengan vektorfrekuensi fragmen, selanjutnya pengukuran ke-miripan citra dilakukan dengan menghitungjarakvektor. Deskriptor SIFT dapat merepresentasikanfitur dengan baik karena tidak sensitif terhadapperubahan skala, rotasi, translasi, dan perubah-an pencahayaan!", Namun, SIFT membutuhkanwaktu komputasi yang tinggi dan tidak tepat di-gunakan untuk ekstraksi citra secara real time",

Penelitian ini menyajikan algoritma untukmengukur kemiripan citra dengan menggunakan'bag-of-words' lokal semantik fragmen. Lokalsemantik fragmen diperoleh melalui prosespembelajaran dengan metode Bayes'". Setiapcitra direpresentasikan dengan beberapa frag-men semantik citra. Selanjutnya pengukurankemiripan citra dilakukan dengan menghitungj.arak vektor.

Susunan makalah ini terdiri dari enam bab. Bab1 menjelaskan pendahuluan, bab 2 menjelaskanekstraksi fragmen semantik citra, bab 3 menjelas-kan pengukuran kemiripan citra, bab 4 dan bab5 menjelaskan percobaan dan hasil percobaan.Bab 6 menjelaskan kesimpulan dan pemanfaatanalagoritma untuk sistem temu kembali citra.

2. EKSTRAKSI FRAGMENSEMANTIK CITRAEkstraksi fragmen semantik citra dilakukan

melalui pembelajaran dengan metode Bayesl".Pada pembelajaran diperlukan dua kelompok

50 I Instrumentasi, Vol. 34 No.1 January-June 2010

citra, yaitu citra kelas dan citra bukan kelas.Fragmeri citra dideteksi dengan menggunakanNormalized Cross Correlation (NCC). Teknik inibanyak digunakan untuk pencocokan template.Teknik cross-correlation dimotivasi oleh peng-ukuranjarak Euclid's' dengan formula:

d2 j,t(u, v) = ~)j(x,y) -t(x-u,y-u)]2x,y

(1)

denganfadalah citra, t adalah template (potongancitra atau fragmen), x dan y adalah posisi pikseldan u dan v adalah posisi template t.

Jika nilai korelasi antara fragmen dan citrapada bagian tertentu melebihi nilai ambang batas(threshold) tertentu yang telah ditetapkan, makaartinya pada citra tersebut terdeteksi mengan-dung fragmen. Pada penelitian ini, penentuannilai threshold berdasarkan nilai Minimum CrossEntropy (MCE)[71.Metode MCE menggunakanteori Kullback-Leibler dalam menghitung jarakD antara dua distribusi peluang. Jika diasumsikanP = {Pl,P2, ...,Pn} dan Q = {ql,n, ... .,qn} adalahdua buah distribusi peluang maka cross entropydidefinisikan dengan:

n poD(P,Q) = LPi1og-1

i=l qi(2)

Pada metode Bayes, data pengamatan (datapelatihan) dan parameter model dinamakan denganvariable peubah acakl". Data pelatihan dinyatakandalam bentuk vektor x, Xn = {xl,x2, ..... ,xn}dengan n adalahjumlah data dan parameter modeldinyatakan B=(B(l), ... , B(d)Y dengan d adalahdimensi vektor. Dengan menggunakan fungsikepekatan peluang (probability density function)dan distribusi gabungan p(x, B,Xn} dapat diketahuiparameter model p(xIB} sebagai berikut,

(3)

dan kepekatan peluang bersyarat (posterior) dariparameter B dinyatakan dengan teori Bayes,

pee I x,Xn) = p(x I e,Xn)p(e I Xn)p(x IXn) (4)

dengan p(Blx, Xs) adalah posterior, p(xIB, Xs)adalah likelihood, p(BIXn} merupakan prior, danp(xIXn} merupakan distribusi marginallkejadian.

Page 3: PENGUKURAN KEMIIRIPAN SEMATIK CITRA DENGAN BAG OF WORDS LOKAL FRAGEMEN SEMATIK CITRA

Gambar 1. Lokal deskriptor SIFT

Visual word

Visual vocabul

Gambar 2. Pembentukan fragmen dengan deskriptor SIFT

IIi

Visual vocabulary

Gambar 3. Representasi citra dengan vektor frekuensi fragmen

Yeni Herdiyeni dkk. I 51

Page 4: PENGUKURAN KEMIIRIPAN SEMATIK CITRA DENGAN BAG OF WORDS LOKAL FRAGEMEN SEMATIK CITRA

Setelah melalui tahap pembelajaran, akandiperoleh hasil seleksi beberapa potongan bagiancitra yang mampu merepresentasikan semantikcitra. Gambar 4 menunjukkan contoh beberapabagian hasil deteksi .semantik citra pada kelasmobil.

III -.••...-~'"'-~~

..~ ..••, Gambar 4. Contoh beberapa hasil deteksi bagian

semantik objek pada kelas mobil

Setelah fragmen terpilih untuk setiap kelas ci-tra melalui proses pembelajaran, tahap selanjutnyaadalah merepresentasikan setiap citra databasemenggunakan semua fragmen terpilih tersebut.Semua fragmen dideteksi pada setiap citra denganmenggunakan Normalized Cross Correlation(NCC). Setelah itu, setiap citra direpresentasikandengan vektor korelasi fragmen (Gambar 5).

0.673..101167

I

Vektnr Korebsi

Gambar 5. Representasi citra dengan vektor korelasifragmen

3. PENGUKURAN KEMIRIPANCITRAPada penelitian ini, pengukuran kemiripan di-

lakukan menggunakan metode pengukuranjarakvektor dengan nilai vektor merepresentasikannilai korelasi fragmen citra. Berikut ini adalahformula untuk mengukur jarak vektor mengguna-kan cosine similarity-":

. (~~) ItQ 1:f=l t, X Qisrm I Q = -- = r==::::::::::--'-r====

, IIIIQI I~,:,Qf J~,:, If..J L.t=l t X L.t=l t

(5)

521 Instrumentasi, Vol. 34 No.1 January-June 2010

dengan Ijmerupakan karakteristik ke- i dari sebuahcitra di basis data, sedangkan Q

jmerupakan karak-

teristik ke-i dari citra kueri.

Semakin dekat nilai cosine similarity ke nilai1 (satu) maka semakin mirip citra tersebut dengancitra kueri.

4. EVALUASI HASILPENGUKURAN KEMIRIPANCITRAPada tahap evaluasi dilakukan penilaian

kinerja sistem dengan melakukan pengukuranrecall dan precision untuk menentukan tingkatkeefektifan hasil pengukuran kemiripan citra.Recall menyatakan proporsi materi relevan yangditemukembalikan: Sementara itu, precision me-nyatakan proporsi materi yang ditemukembalikanyang relevan'?'.

IRalRecall = IRf . . IRal

Precision. =VI (6)

dengan Ra adalah jumlah citra relevan yangditemukembalikan, R adalahjumlah citra relevanyang ada di basis data, danA adalahjumlah selu-ruh citra yang ditemukembalikan.

Untuk mengevaluasi relevansi citra kueridengan hasil kueri juga dilakukan pengukuranReceiver Operator Characteristic (ROC)[I01.Peng-ukuran ROC dilakukan untuk mengetahui berapajumlah kelas positifyang berhasil dikelasifikasi-kan sejalan dengan jumlah kelas negatif yangsalah diklasifikasikan. Pada penelitian ini, hasilkueri yang sesuai dengan citra kueri dinyatakandengan kelas positif dan hasil kueri yang tidaksesuai dengan citra kueri disebut dengan kelasnegatif. Tabell menunjukkan matrik kontingensiuntuk pengukuran ROC.

Tabel 1. Matrik kontingensi

Aktual Positif Aktual Negatif

Prediksi Positif

Prediksi Negatif

TP

FN

FPTN

Berdasarkan matrik kontingensi tersebut,maka nilai recall, precision, True Positif Rate(TPR) dan False Positif Rate (FPR) dapat di-nyatakan sebagai berikut:

Page 5: PENGUKURAN KEMIIRIPAN SEMATIK CITRA DENGAN BAG OF WORDS LOKAL FRAGEMEN SEMATIK CITRA

TPRecall=---

TP+FN

TPPr ecision = ---

TP+FP

(7)

(8)

TPTruePositifRate (TPR) = ---

TP+FN. . FPFalsel'ositif Rate (FPR) = ---

FP+TN

(9)

(10)

. 5. PERCOBAAN DAN HASILPERCOBAANDatabase citra yang digunakan pada peneli-

tian ini adalah database dari Microsoft ResearchCambridge Object Recognition Image Database(MSRCORID). Pada penelitian ini ada lima ke-las objek yang digunakan, yaitu kelas kuda (171citra), mobil (423 citra), sepeda (195 citra), mo-tor (832 citra), dan domba (148 citra). Data citrauji coba yang digunakan memiliki keragamangeometris, posisi, pencahayaan dan latar belakangcitra. Hal ini dimaksudkan untuk menguji kemam-puan metode yang digunakan dalam mengukurkemiripan semantik citra. Beberapa contoh citrayang digunakan pada penelitian ditunjukkan padaGambar 6.

Gambar 6. Contoh citra database MSRCORID

5.1 EKSTRAKSI FRAGMEN SEMANTIK CITRA

Berdasarkan hasil percobaan, beberapa frag-men semantik citra ditunjukkan pada Gambar 7.

Setelah semua fragmen semantik terpilihuntuk setiap kelas, tahap berikutnya adalah men-deteksi kemunculan setiap fragmen tersebut padasetiap citra dalam database. Setelah dilakukan

pendeteksian fragmen, maka pada akhimya se-tiap citra direpresentasikan dalam bentuk vektorkorelasi.

Gambar 7. Beberapa fragmen semantik citra hasilekstraksi

5.2 PENGUKURAN KEMIRIPAN CITRA

Pada penelitian ini pengukuran kemiripancitradilakukan dengan menghitung jarak vektormenggunakan persamaan kosinus. Gambar 8menunjukkan hasil pengukuran kerniripan citrauntuk kelas sepeda ..Hasil pengukuran kemiripancitra untuk kelas mobil diperlihatkan pada Gam-bar 9. Hasil pengukuran kemiripan citra untukkelas motor ditunjukkan pada Gambar 10. Hasilpengukuran kemiripan citra untuk kelas kudadan hasil pengukuran kemiripan citra untuk kelasdomba masing-masing diperlihatkan pada Gam-bar 11 dan Gambar 12.

Gambar 8. Hasil pengukuran kemiripan citra untukkelas sepeda

Yeni Herdiyeni dkk. I 53

Page 6: PENGUKURAN KEMIIRIPAN SEMATIK CITRA DENGAN BAG OF WORDS LOKAL FRAGEMEN SEMATIK CITRA

Gambar 9. Hasil pengukuran kemiripan citra untukkelas mobil

f~~~ "·lr~Qo~.,~ it 1)1 ;")C$

_ We~~~o_€l

-,. !

!

- -.~.---..--...- -._-.-'-~--'--"'<. l)tW 'W"ill ~l*",-~----~-

~<!:!""" (;-. ~ ~® ~ 'fIKfiJc:~ ';~"

~in:n;P5 'll')i(1J:2 '1)C;g 'iQ,;<J'.\'!

~fl! ~;p ~® !#foI .• ~, ~®

1,,~-,!I-;l~ !:!BlIl' <l.it~ :7)~l'!':1 :::::Cl$Ii

,~ i!0 ~® ~~ A

Gambar 10. Hasil pengukuran kemiripan citra untukkelas motor

5.3 EVALUASI PENGUKURAN KEMIRIPAN CITRA

. Evaluasi pengukuran kemiripan citra dilaku-kan dengan menghitung tingkat rataan presisi,True Positif Rate (TPR), dan False Positif Rate(FPR). Untuk menguji kesesuaian persepsi antarahasil pengukuran kemiripan citra sistem denganpengguna. Berdasarkan hasil pengujian sistem,diperoleh tingkat rataan untuk setiap kelas citra,ditunjukan pada Tabel 2.

Gambar 13-22 menunjukkan grafik recallprecision dan kurva ROC untuk setiap kelas. Hasilpercobaan menunjukkan bahwa metode semantiklokal fragmen memiliki rataan akurasi presisi

541lnstrumentasi, Vol. 34 No.1 January-June 2010

Gambar 11.Hasil pengukuran kemiripan citra untukkelas kuda

·.:iiliiin~"=1 ljr.31i:l iQ'ro ~~;1!i>l "!IOSi!.'5.1111111111;;);~W. I'Z;~~ 1!i~375' IMl::T~ '5iOs::9

11111111~<;;W 1!)t.:mn Ii)'.:.eu ISjH3!1

11.11'1111

Gambar 12. Hasil pengukuran untuk kemiripankelas domba

sebesar 0,74. Berdasarkan hasil tersebut, makametode ini sudah cukup baik mengukur kemiripancitra berdasarkan semantik citra.

Tabel 2. Rataan presisi untuk setiap kelas citra

Kelas Citra Presisi TPR FPR

Sepeda 0,81 0,81 0,29Mobil 0,75 0,74 0,36Motor 0,86 0,85 0,15Kuda 0,64 0,63 0,37Domba 063 064 036

Gambar 13-14 menunjukkan grafik recallprecision untuk citra sepeda. Untuk kelas sepeda,rataan akurasi presisi mencapai 0,81. Hal ini juga

Page 7: PENGUKURAN KEMIIRIPAN SEMATIK CITRA DENGAN BAG OF WORDS LOKAL FRAGEMEN SEMATIK CITRA

ditunjukkan pada grafik ROC yang menyatakanbahwa jumlah kelas positif, yaitu hasil kueriyangrelevan (TPR) mencapai 0,81 sedangkan hasilkueri yang tidak relevan (FPR) mencapai 0,29.

):frecision-recall graph

0.8

0.6

:~ 0.51t

0.4

0.3

0.2

0.1

Gambar 13. Grafik Recall Precision untuk kelassepeda

roc CUNao:-~0.8/

01

~ 0.6~l°.5~ 0.4

0.3

0.2

0.1

00 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9false positive rate

Gambar 14. Grafik ROC kelas sepeda

Gambar 15-16 menunjukkan grafik recallprecision untuk citra mobil. Untukkelas mobil,rataan akurasi presisi mencapai 0,75. Hal ini jugaditunjukkan pada grafik ROC yang menyatakanbahwajumlah kelas positif, yaitu hasil kueri yangrelevan (TPR) mencapai 0,74, sedangkan hasilkueri yangtidak relevan (FPR) mencapai 0,36.

Gambar 17-18 menunjukkan grafik recallprecision untuk citra motor. Untuk kelas motor,memiliki rataan akurasi presisi yang paling tinggi,yaitu mencapai 0,86. Hal ini juga ditunjukkanpada grafik ROC yang menyatakan bahwa jumlahkelas positif, yaitu hasil kueri yang relevan (TPR)

mencapai 0,85, sedangkan hasil kueri yang tidakrelevan (FPR) mencapai 0,15.

1precision-recall graph

~

0.9

0.8

0.7

0.6

.~ ~~10.5

0.4<,

0.3 '~

0.2

0.1

00 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 ,recall

Gambar 15. Grafik Recall Precision untuk kelasmobil

00':--::-0."-1 ---="0.'::-2---="0.'::-3---="0.-:-4---="0.C:-5---='0.6=---=-'01=---=-'0.8=---=-'0.9=---'

false positive rate

roc curve

/~ 0.6 /

105 ;/i~ 0.4

!0.3 /

0.9

0.9

07

0.2

0.1

Gambar 16. Grafik ROC kelas mobil

precision-recall graph

0.9

0.8

01

0.6~o:~ 0.5

~0.4

0.3

0.2

0.1

DO 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9recall

Gambar 17. Grafik Recall Precision untuk kelasmotor

Yeni Herdiyeni dkk. I 55

Page 8: PENGUKURAN KEMIIRIPAN SEMATIK CITRA DENGAN BAG OF WORDS LOKAL FRAGEMEN SEMATIK CITRA

roc curve1

0.9

~O.S

0.7

~ 0,6~.a10.5

~ 0.4

0.3

0.2

0.1

"00 0.1 0.2 0.3 0.4 0.5 0.6 0.7 O.S 0.9 1

false positive rate

Gambar 18. Grafik ROC kelas motor

Gambar 19-20 menunjukkan grafik recallprecision untuk citra kuda. Untuk kelas kuda,memiliki rataan akurasi presisi mencapai 0,63.Hal ini juga ditunjukkan pada grafik ROC yangmenyatakan bahwa jumlah kelas positif, yaituhasil kueri yang relevan (TPR) mencapai 0,63,sedangkan hasil kueri yang tidak relevan (FPR)rnencapai 0,47. Hasil analisis menunjukkan citrakuda yang ada di dalam database memiliki variasigeometris yang paling besar sehingga hasil akurasi-nya menurun dibandingkan kelas lainnya.

precision-recall graph

0.9

O.B

0.7

0.6co.~ 0.51!Co

0.4

03

0.2

0.1

0.1 0.2 03 0.4 0.5 0.6 0.7 0.8 0.9recall

Gambar 19. Grafik recall precision untuk kelaskuda

561 Instrumentasi, Vol. 34 No.1 January-June 2010

--- ---- ------------------------------------------

roc curve

0.9

0.8

0.7

~ 0.6~.~'1 0.5

g 0.4

0.3

0.2

0.1

°0~~0~.1--0~.2--0~.3--~0.4--~0.~5--0.L6--0~.7~0~.8--0~.9~false positive rate

Gambar 20. Grafik ROC kelas kuda

Gambar 21-22 menunjukkan grafik recallprecision untuk citra domba. Untuk kelas domba,memiliki rataan akurasi presisi mencapai 0,64.Hal ini juga ditunjukkan pada grafik ROC yangmenyatakan bahwa jumlah kelas positif, yaituhasil kueri yang relevan (TPR) mencapai 0,64,sedangkan hasil kueri yang tidak relevan (FPR)mencapai 0,36. Sama seperti pada kelas kuda,hasil analisis menunjukkan citra yang ada didalam database memiliki variasi geometris yangpaling besar sehingga hasil akurasinya menurundibandingkan kelas lainnya.

precision-recall graph

0.1

0.9

0.8

0.7

0.6

s:~ 0.5ii

0.4

03

0.2

OL-~~L-~~~~~L-~~L--L~o 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9

recall

Gambar 21 Grafik recall precision untuk kelasdomba

Page 9: PENGUKURAN KEMIIRIPAN SEMATIK CITRA DENGAN BAG OF WORDS LOKAL FRAGEMEN SEMATIK CITRA

roc curve

0.9

0.8

0.7

~ 0.6~lO.5~ 0.4

0.3

0.2

0.1

00 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9false positive rate

Gambar 22. Grafik ROC untuk kelas Domba

6. KESIMPULANPenelitian ini mengusulkan metode peng-

ukuran kemiripan semantik menggunakan 'bag-of words' lokal fragmen semantik citra. Padametode ini sebuah citra direpresentasikan dengansejumlah lokal fragmen citra. Lokal fragmencitra adalah bagian dari citra yang mengandunginformasi semantik citra. Lokal fragmen citradiperoleh melalui proses pembelajaran secaraonline menggunakan teknik Bayes.

Pengukuran kemiripan semantik citra terdiridari dua tahap, yaitu: 1) Pengukuran kemi-ripan lokal fragmen citra dengan menggunakanNormalized Cross Correlation (NeC); dan 2)Pengukuran kemiripan citra menggunakan peng-ukuran jarak vektor kosinus. Berdasarkan hasilpercobaan, metode pengukuran kemiripan citra

menggunakan 'bag-ofwords' lokal fragmen se-matik citra mampu meningkatkan rataan akurasipresisi sebesar 75%. Ini menunjukkan metodeyang dikembangkan dapat mengukur kemiripancitra sesuai dengan persepsi manusia.

7. DAFTAR PUSTAKA[1]Datta, R., et al. 2007. Image Retrieval: Ideas, Influ-

ences, and Trend of the New Age. ACMTransactionon Computing Survey.

[2] Lowe. 2004. Distinctive Image Features fromScale-Invariant Keypoints. International Journalof Computer Vision.

[3] Tirilly, P., et al. 2009. A Review of WeightingSchemes for Bag of Visual Words Image Retrieval.Publications Internes de l'IRISA.

[4] Jing, F.,Li.,M., et al. 2004a.An efficient and effec-tive region-based image retrieval framework. IEEETrans. Image Processing 13, 5,699-709.

[5] Fei-Fei, L., et al. 2004.Learning Generative VisualModel from few training examples: An incrementalBayesian approach tested on 101 object categories.In IEEE CVPR Workshop of Generative ModelBased Vision (WGMBV).

[6] Lewis, J.P. 1995.Fast Normalized Cross Correla-tion. Vision Interface, p.120-123.

[7] Pal N.R. 1996. On Minimum Cross EntropyThresholding. Pattern Recognition, vol. 29, pp.575-580.

[8] Smeulders, A.W.M., et al. 2000. Content-basedImage Retrieval at The End of The Early Years.IEEE PAMI, 22(12), 1349-1380

[9] Baeza-Yates R & Berthier Ribeiro-Neto. 1999.Modern Information Retrieval. NewYork:AddisonWesley.

[10] Davis, Jesse, dan Goadrich, Mark. 2006. Pro-ceeding of 34thInternational Conference on Ma-chine Learning.

Yeni Herdiyeni dkk. 157