16
CBIR Based on Colour Fiture Extraction with Java Agus Sumarna Undergraduate Program, Faculty of Industrial Engineering, 2010 Gunadarma University http://www.gunadarma.ac.id Keywords: CBIR, Global Color Histogram, Local Color Histogram, Euclidean. ABSTRACT Text-based image retrieval techniques that exist today can not be used to represent the image that we seek in an image database, which is often obtained by the image search results that are not desirable, because we must know the right keywords in accordance with the image file name to obtain the image we want. To overcome the problem of image retrieval, one solution is to use CBIR. Content-Based Image Retrieval (CBIR) or image retrieval is an image retrieval method by doing a comparison between the query image features with image features that exist in the database (Query by Example). CBIR method is often used similarity search based on color features, shape, and texture. As for calculating the similarity of color features using Euclidean distance. On this basis the author are encouraged to conduct research and manufacture of image search application based on color feature extraction using 2 types of histograms of the Global Color Histogram (GCHs), and Local Color Histogram (LCHs). So that it can be seen comparing the search results using the method GCHs with the search results using the method LCHs or use both types of these histograms. So get a color-based image search results more accurate.

cbir (indo).pdf

Embed Size (px)

Citation preview

  • CBIR Based on Colour Fiture Extraction with Java

    Agus Sumarna

    Undergraduate Program, Faculty of Industrial Engineering, 2010

    Gunadarma University

    http://www.gunadarma.ac.id

    Keywords: CBIR, Global Color Histogram, Local Color Histogram, Euclidean.

    ABSTRACT

    Text-based image retrieval techniques that exist today can not be used to represent the

    image that we seek in an image database, which is often obtained by the image search results

    that are not desirable, because we must know the right keywords in accordance with the

    image file name to obtain the image we want. To overcome the problem of image retrieval,

    one solution is to use CBIR.

    Content-Based Image Retrieval (CBIR) or image retrieval is an image retrieval

    method by doing a comparison between the query image features with image features that

    exist in the database (Query by Example). CBIR method is often used similarity search based

    on color features, shape, and texture. As for calculating the similarity of color features using

    Euclidean distance.

    On this basis the author are encouraged to conduct research and manufacture of image

    search application based on color feature extraction using 2 types of histograms of the Global

    Color Histogram (GCHs), and Local Color Histogram (LCHs). So that it can be seen

    comparing the search results using the method GCHs with the search results using the method

    LCHs or use both types of these histograms. So get a color-based image search results more

    accurate.

  • ABSTRAKSI

    Teknik pencarian citra berbasis teks yang ada saat ini belum dapat digunakan untuk

    merepresentasikan citra yang kita cari didalam sebuah database citra, sehingga seringkali

    diperoleh hasil pencarian citra yang tidak sesuai dengan yang diinginkan karena kita harus

    mengetahui kata kunci yang tepat sesuai dengan nama file citra untuk memperoleh citra yang

    kita inginkan. Untuk mengatasi masalah pencarian citra tersebut, salah satu solusinya adalah

    dengan menggunakan CBIR.

    Content-Based Image Retrieval (CBIR) atau temu kembali citra yaitu suatu metode

    pencarian citra dengan melakukan perbandingan antara fitur citra queri dengan fitur citra

    yang ada di database (Query by Example). Metode CBIR yang sering digunakan adalah

    pencarian berdasarkan kemiripan fitur warna, bentuk, dan tekstur. Sedangkan untuk

    menghitung kemiripan fitur warna tersebut menggunakan metode Euclidean distance.

    Atas dasar itulah penulis terdorong untuk melakukan penelitian dan pembuatan

    aplikasi pencarian citra berdasarkan ekstraksi fitur warna dengan menggunakan 2 tipe

    histogram yaitu Global Color Histogram(GCHs), dan Local Color Histogram(LCHs).

    Sehingga bisa dilihat perbandingan hasil pencarian menggunakan metode GCHs dengan hasil

    pencarian menggunakan metode LCHs ataupun menggunakan kedua tipe histogram tersebut.

    Sehingga mendapatkan hasil pencarian citra berbasis warna yang lebih akurat.

    Kata kunci : CBIR, Global Color Histogram, Local Color Histogram, Euclidean.

    PENDAHULUAN

    Kebutuhan informasi dalam bentuk citra sangat berkembang pesat seiring dengan

    bertambahnya koleksi citra yang ada didalam database citra berskala besar. Informasi citra

    tersebut banyak dibutuhkan diberbagai bidang. Seperti bidang perdagangan untuk katalog

    barang, kepolisian untuk pelacakan tindak kriminalitas melalui citra wajah atau sidik jari,

    kedokteran untuk citra hasil rongent, dan masih banyak lagi pemanfaatan informasi dalam

    bentuk citra di bidang yang lainnya.

    Teknik pencarian citra berbasis teks yang ada saat ini belum dapat digunakan untuk

    merepresentasikan citra yang kita cari didalam sebuah database citra, sehingga seringkali

    diperoleh hasil pencarian citra yang tidak sesuai dengan yang diinginkan karena kita harus

    mengetahui kata kunci yang tepat sesuai dengan nama file citra untuk memperoleh citra yang

    kita inginkan.

    Untuk mengatasi masalah pencarian citra tersebut, salah satu solusinya adalah dengan

    menggunakan Content-Based Image Retrieval (CBIR) atau temu kembali citra yaitu suatu

    metode pencarian citra dengan melakukan perbandingan antara fitur citra kueri dengan fitur

  • citra yang ada di database (Query by Example). Metode CBIR yang sering digunakan adalah

    pencarian berdasarkan kemiripan fitur warna, bentuk, dan tekstur [4].

    Dalam CBIR terdapat banyak metode pencarian citra. Salah satu metode yang dipakai

    adalah pencarian citra berdasarkan ekstraksi fitur warna. Dalam CBIR berbasis warna yang

    dilihat bukan kemiripan dari citra, melainkan kemiripan dari sebaran warna pada citra yang

    diperbandingkan. Secara umum untuk CBIR berbasis warna dikenal metode histogram warna.

    Histogram warna memiliki 2 tipe yaitu Global Color Histograms (GCHs) dan Local Color

    Histograms (LCHs) [5].

    Saat ini penelitian mengenai CBIR berbasis warna dengan metode histogram warna

    masih terbuka luas. Atas dasar itulah penulis terdorong untuk melakukan penelitian dan

    pembuatan aplikasi pencarian citra berdasarkan ekstraksi fitur warna dengan menggunakan 2

    tipe histogram. Sehingga bisa dilihat perbandingan hasil pencarian menggunakan metode

    GCHs dengan hasil pencarian menggunakan metode LCHs ataupun menggunakan kedua tipe

    histogram tersebut. Sehingga mendapatkan hasil pencarian citra berbasis warna yang lebih

    akurat.

    METODE PENELITIAN

    Metode penelitian yang dilakukan terdiri dari beberapa tahap:

    Analisa dan Studi Literatur

    Mengindentifikasi masalah, mengumpulkan dan menganalisis informasi-informasi

    baik dari artikel situs web, Jurnal, dan buku-buku yang berhubungan dengan teori-

    teori dasar tentang Content-Based Image Retrieval, histogram warna,

    pemrograman Java, Netbeans, database Derby, dan tutorial JfreeChart untuk

    menampilkan histogram.

    Perancangan

    Pada tahap ini dirancang sistem retrival citra dengan menggunakan bahasa

    pemrograman Java, dan editor Netbeans. Tahap ini juga meliputi coding,

    perancangan user interface, dan merancang database yang digunakan.

    Implementasi dan Evaluasi

    Pada tahap ini dilakukan pengujian pada program untuk melihat hasil dari

    pencarian citra. Semua hasil yang diperoleh pada tahap pengujian akan dievaluasi.

  • Hasil evaluasi ini akan diambil kesimpulan yang merupakan jawaban atas

    permasalahan CBIR.

    TINJAUAN PUSTAKA

    Content-Base Image Retrieval.

    Content-Based Image Retrieval (CBIR) atau temu kembali citra adalah metode yang

    digunakan untuk melakukan pencarian citra digital pada suatu database citra. Yang dimaksud

    dengan "Content-Based" di sini adalah : objek yang dianalisa dalam proses pencarian itu

    adalah actual contents (kandungan aktual) sebuah citra. Istilah konten pada konteks ini

    merujuk pada warna, bentuk, tekstur, atau informasi lain yang didapatkan dari citra tersebut.

    Proses umum dari CBIR adalah pada citra yang menjadi query dilakukan proses

    ekstraksi fitur (image contents), begitu halnya dengan citra yang ada pada basis data citra

    juga dilakukan proses seperti pada citra query. Parameter fitur citra yang dapat digunakan

    untuk retrieval pada system ini dapat berupa histogram, susunan warna, teksture, dan shape,

    tipe spesifik dari objek, tipe event tertentu, nama individu, lokasi, emosi [4].

    Awalnya teknik yang dipakai bukan mencari fitur citra melainkan berdasarkan

    penambahan deskripsi mengenai citra dalam bentuk teks. Dengan kata lain pertama citra

    diberi teks berdasarkan citra tersebut kemudian dilakukan pencarian berdasarkan teks (text

    based) mengunakan sistem database manajemen tradisional. Namun karena pembangkitan

    teks secara otomatis, mengenai deskripsi spektrum citra, secara detail sulit untuk dilakukan

    kebanyakan aplikasi text-based image retrieval saat itu melakukan pemberian teks deskripsi

    citra secara manual.

    Penelitian dan pengembangan image retrieval dimulai pada sekitar 1970-an. Pada

    tahun 1979, sebuah konferensi mengenai Database Tehcniques for Pictorial Application

    diadakan di Florida. Sejak itu aplikasi dalam melakukan manajemen database citra menarik

    perhatian para peneliti.

  • Gambar 1. Diagram Arsitektur CBIR (Torres, 2006).

    Dalam diagram diatas. Dapat dilihat bahwa CBIR dibagi menjadi 3 bagian yaitu :

    bagian interface, bagian Query Processing Module, dan bagian Image Database. Untuk

    penjelasanya adalah sebagai berikut :

    1. Bagian pertama adalah interface yang merupakan bagian untuk interaksi antara

    pengguna dengan sistem CBIR melalui aplikasi GUI (Graphical User Interface).

    Sedangkan didalamnya terdapat sub bagian :

    Data Insertion yang digunakan user untuk memasukan citra yang akan di

    ekstraksi.

    Query Specification untuk menentukan citra yang akan dijadikan citra

    query serta menentukan metode ekstraksi fitur. Dalam penelitian ini,

    penulis menggunakan metode ekstraksi local color histogram dan global

    color histogram.

    Visualization untuk menampilkan citra query dan citra hasil pencarian.

    2. Bagian kedua adalah Query-processing module. Sedangkan didalamnya terdapat

    sub bagian :

    feature vector extraction yang digunakan untuk mengekstraksi baik citra

    yang ada didatabase citra maupun citra query.

    Similarity Computation digunakan untuk menghitung kesamaan fitur citra.

    Ranking digunakan untuk mengurutkan citra yang memiliki tingkat

    kemiripan dengan citra query.

    3. Bagian ketiga adalah Image Database. Sedangkan didalamnya terdapat sub bagian

  • Feature Vectors yang digunakan untuk menyimpan hasil ekstraksi fitur

    citra. Dan disimpan didalam database derby.

    Images merupakan database citra yang secara fisik berupa folder yang

    didalamnya terdapat kumpulan citra.

    Tipe Histogram Citra

    Histogram warna terdiri dari dua tipe, Global Color Histograms (GCHs) dan Local

    Color Histograms (LCHs). Pada penggunaan GCH, distribusi warna global suatu citra

    diambil dan digunakan sebagai metada. Jika pengguna mencari citra dengan yang dalam

    sistem databasenya hanya memperhatikan distribusi warna global suatu citra, memang, GCH

    adalah pilihan terbaik. Walaupun demikian, karena GCH hanya mengambil distribusi warna

    global suatu citra sebagai pertimbangan untuk membandingkan citra, ini bisa mengembalikan

    hasil yang tidak sesuai dengan persepsi visual.

    Misalkan ada tiga citra yang telah dikuantisasi menjadi tiga warna: hitam, abu-abu,

    dan putih (citra 4.3). Misalkan citra A adalah query image, sedangkan citra B dan C adalah

    citra-citra dalam database.

    Citra A Citra B Citra C

    Gambar 2. Tiga citra yang terkuantisasi menjadi 3 warna

    Dibawah ini adalah tabel rincian Global Color Histogram dari 3 citra diatas yaitu

    image A, image B, dan Image C :

    Tabel 1. GCHs Citra A, B, dan C

    Citra Hitam Abu-abu Putih

    A 37.5% 37.5% 25%

    B 31.25% 37.5% 31.25%

  • Sedangkan Distribusi warna (GCH) tiga citra diatas adalah seperti pada

    tabel. Maka, jarak antara citra A dengan citra B dan C adalah :

    d(A,B) = |0.375 - 0.3125| + |0.375 - 0.375| + |0.25-0.3125| = 0.125

    d(A,C) = |0.375 - 0.375| + |0.375 - 0.375| + |0.25 - 0.25| = 0

    Dari hasil pembandingan, citra C ternyata ditemukan lebih mirip daripada citra B

    (karena jarak C lebih kecil). Padahal, sesuai dengan persepsi, yang lebih mirip dengan citra A

    sebenarnya adalah citra B. Global Color Histogram merepresentasikan keseluruhan bagian

    citra dengan satu histogram. Sedangkan Local Color Histogram membagi citra menjadi

    beberapa bagian dan kemudian mengambil histogram warna tiap bagian tadi. LCH memang

    berisi lebih banyak informasi tentang citra, namun metode ini membutuhkan lebih banyak

    proses komputasi [6].

    PEMBAHASAN

    Data Citra

    Dalam penelitian ini menggunakan citra sebagai objek penelitian. Berikut adalah rincian citra

    yang penulis gunakan :

    1. Menggunakan citra berwarna RGB.

    2. Format citra yang digunakan adalah format JPEG, JPG, PNG, dan GIF.

    3. Dimensi citra berbeda-beda, namun citra disesuaikan ukuran dimensinya (sekitar

    200 x 180) agar lebih cepat dalam pemrosesan citra.

    4. Jumlah citra 30 citra yang dibagi menjadi 3 kategori.

    Pengelompokan Citra

    Dalam penelitian ini, penulis mengelompokan citra kedalam 3 (tiga) yaitu :

    C 37.5% 37.5% 25%

  • 1. Kategori citra binatang : 10 buah.

    2. Kategori citra bunga mawar : 10 buah.

    3. Kategori citra mobil bus : 10 buah.

    Gambar 3. Kategori Binatang

    Gambar 4. Kategori Bunga Mawar

    Gambar 5. Kategori Mobil Bus

    Implementasi Rancangan Aplikasi Desktop

    Berikut penulis akan menjelaskan mengenai tampilan yang terdapat pada aplikasi

    desktop dan fungsi dari menu-menu yang terdapat pada aplikasi.

    Tampilan Menu Utama

  • Gambar 6. Menu Utama Aplikasi

    Hasil Uji Coba

    Hasil Pencarian Pada Kategori Citra Binatang

    Gambar 12 Hasil Query LCHs Pada Kategori Binatang

  • Gambar 13 Hasil Query GCHs Pada Kategori Binatang

    Gambar 14 Hasil Query GCHs+LCHs Pada Kategori Binatang

    Tabel 2. Hasil Pencarian Pada Kategori Binatang

    No Nama Metode Jumlah

    Citra

    Waktu Pencarian

    (Detik)

    1 Local Color Histogram (LCHs) 6 0

    2 Global Color Histogram (GCHs) 4 0

    3 LCHs + GCHs 4 1

    Sedangkan tabel 3 dibawah ini merupakan rincian dari hasil pencarian citra menggunakan

    metode Local Color Histogram (LCHs) dengan menggunakan citra bus pada kategori binatang. Pada

    tabel dibawah terdapat data citra query, jarak Euclidean, dan histogram dari masing-masing citra.

    Jarak Euclidean dan susunan citra sudah terurut berdasarkan nilai jarak Euclidean.

  • Hasil Pencarian Pada Kategori Citra Mawar

    Gambar 15 Hasil Query LCHs Pada Kategori Bunga Mawar

    Gambar 16 Hasil Query GCHs Pada Kategori Bunga Mawar

    Gambar 17 Hasil Query GCHs+LCHs Pada Kategori Bunga Mawar

    Tabel 4 Hasil Pencarian Pada Kategori Bunga Mawar

    No Nama Metode Jumlah Waktu Pencarian

  • Citra (Detik)

    1 Local Color Histogram (LCHs) 9 0

    2 Global Color Histogram (GCHs) 5 0

    3 LCHs + GCHs 5 0

    Hasil Pencarian Pada Kategori Citra Bus

    Gambar 18. Hasil Query LCHs Pada Kategori Bus

    Gambar 19. Hasil Query GCHs Pada Kategori Bus

  • Gambar 20. Hasil Query GCHs Pada Kategori Bus

    Tabel 5 Hasil Pencarian Pada Kategori Binatang

    No Nama Metode Jumlah

    Citra

    Waktu Pencarian

    (Detik)

    1 Local Color Histogram (LCHs) 6 0

    2 Global Color Histogram (GCHs) 9 3

    3 LCHs + GCHs 6 0

    Hasil Pencarian Pada Semua Kategori

    Gambar 21. Hasil Query LCHs Pada Semua Kategori

  • Gambar 22. Hasil Query GCHs Pada Semua Kategori

    Gambar 23. Hasil Query GCHs+LCHs Pada Semua Kategori

    Tabel 6. Hasil Pencarian Pada Semua Kategori

    No Nama Metode Jumlah

    Citra

    Waktu Pencarian

    (Detik)

    1 Local Color Histogram (LCHs) 21 1

    2 Global Color Histogram (GCHs) 18 0

    3 LCHs + GCHs 15 1

    PENUTUP

    Kesimpulan

  • Setelah melalui serangkaian ujicoba dan analisis, dapat ditarik beberapa kesimpulan

    dari proses CBIR berdasarkan ekstraksi fitur warna yaitu metode Local Color Histogram,

    menghasilkan citra hasil pencarian yang jumlahnya banyak secara kuantitas, dan hasil

    pencariannya terpegaruh oleh citra geometri misalnya citra yang dirotasi. Sehingga tidak

    efektif secara kualitas. karena ada citra yang penyebaran warnanya jauh namun tetap

    ditampilkan sebagai hasil pencarian.

    Sedangkan metode Global Color Histogram, menghasilkan citra hasil pencarian yang

    lebih sedikit secara kuantitatif dibandingkan dengan hasil pencarian Local Color Histogram,

    dan hasil pencariannya tidak terpengaruhi oleh citra geometri. Sehingga lebih efektif karena

    hanya menampilkan citra yang mempunyai penyebaran warna yang mirip dengan citra query

    nya.

    Saran

    Aplikasi CBIR ini masih terdapat kekurangan, terutama saat melakukan query citra.

    Karena jika query citra yang ada didatabase citra ukuranya atau dimensinya terlalu besar,

    maka aplikasi CBIR akan berhenti melakukan query atau terjadi error. Oleh karena itu untuk

    pengembangan kedepannya harus diadakan proses resize atau perubahan ukuran citra

    database, agar proses query bisa berjalan lebih cepat.

    DAFTAR PUSTAKA

    [1] Ariesto H.S, Fajar Masya, Pemrograman Berorientasi Objek dengan Java, Graha

    Ilmu : Jakarta, 2004.

    [2] Herry Suharto, dkk, Pemrograman GUI Swing Java dengan Netbeans 5, Penerbit

    Andi : Yogyakarta, 2006.

    [3] Rafael C.Gonzales, Paul Wintz, Second Edition : Digital Image Processing, Addison-

    Wesley Publishing Company, 1987.

    [4] Sagarmay Deb, Multimedia Systems and Content-Base Image Retrieval, Idea Group

    Publishing, 2004.

    [5] Shengjiu Wang, A Robust CBIR Approach Using Local Color Histograms,

    Department of Computer Science, University of Alberta, Edmonton, Alberta, Canada,

    Tech. Rep. TR 01-13, October 2001.

  • [6] YanuWidodo,http://ilmukomputer.org/wp-content/uploads/2009/10/yanuwid-cbir.pdf,

    Penggunaan Color Histogram Dalam Image Retrieval, 12 Juni 2010.

    [7] ______, http://www.java2s.com/Tutorial/Java/0340_Database/Connectto

    Derbydatabase.htm, Connect to Derby database, 27 Juli 2010

    [8] _______, http://www.the-crankshaft.info/2010/07/content-based-image-retrieval-

    query.html, Content-Based Image Retrieval Query Paradigms , 30 Juli 2010