Upload
others
View
9
Download
0
Embed Size (px)
Citation preview
DATA MINING E-MARKETPLACE DENGAN METODE ASSOCIATION RULE MINING
PROPOSAL TESIS
Magister Teknik Informatika
Jenjang Strata II
Disusun Oleh :
AYU MEIDA, S.SI.
09042681721004
MAGISTER TEKNIK INFORMATIKAFAKULTAS ILMU KOMPUTER
UNIVERSITAS SRIWIJAYA
BAB I
PENDAHULUAN
1.1 Latar Belakang Masalah
Data adalah properti penting untuk semua orang. Sejumlah besar data tersedia
di dunia. Ada beragam repositori untuk menyimpan data ke gudang data, database,
repositori informasi, dll. Data jumlah besar ini perlu diproses sehingga kita bisa
mendapatkan informasi yang berguna. Data mining adalah teknik untuk mendapatkan
informasi tersembunyi dari koleksi data itu. Ada beberapa fungsi utama dalam
penambangan data seperti estimasi, prediksi, klasifikasi, pengelompokan dan asosiasi.
(Muhamad Brilliant, Dwi Handoko , Sriyanto, 2017).
Association Rule Mining adalah Teknik di bidang Data Mining yang sangat
penting saat ini. Association Rule Mining menemukan pola, asosiasi, korelasi, atau kausal
yang sering terjadi struktur di antara set barang atau benda dalam transaksi basis data,
basis data relasional, dan informasi repositori lainnya. (Charanjeet Kaur , 2013).
Penelitian ini menerapkan metode Association Rule Mining pada E-Marketplace,
untuk menggali lebih dalam dan memahami perilaku belanja pelanggan dan niat
perkunjungan dengan menambang data pada keranjang belanja customer. Dengan
demikian, memungkinkan pengecer untuk menyediakan layanan memuaskan pelanggan
disesuaikan dengan kebutuhan perkunjungan mereka. (Anastasia Griva, Cleopatra
Bardaki, Katerina Pramatari and Dimitris Papakyriakopoulos, 2018).
1.2 Rumusan Masalah
1. Bagaimana cara melakukan penambangan data dengan metode Association Rule
Mining pada E-Marketplace;
2. Bagaimana cara menganalisis data keranjang customer, agar menghasilkan segmen
kunjungan pelanggan untuk mengetahui daya minat produk apa saja yang akan dibeli
customer.
1.3 Batasan Masalah
1. Dataset yang digunakan adalah data keranjang belanja pada E-Marketplace;
2. Pengujian tidak dilakukan pada toko fisik.
1.4 Tujuan Penelitian
1. Menganalisis data keranjang belanja customer, untuk mengidentifikasi segmen
kunjungan pelanggan;
2. Menghasilkan grup kunjungan pelanggan berdasarkan kategori produk yang dibeli
pelanggan selama setiap kunjungan ke E-Marketplace.
1.5 Manfaat Penelitian
1. Memberikan informasi tentang layanan dan produk sering dipilih oleh konsumen
sehingga bisa dipertimbangkan untuk mengatur persediaan stok barang agar sesuai
dengan daya minat pembelian customer;
2. Agar dapat mengatur strategi penjualan, memungkinkan pengecer untuk
menyediakan layanan memuaskan pelanggan disesuaikan dengan kebutuhan
perkunjungan customer.
1.6 Sistematika Penulisan
Untuk mempermudah dalam penyusunan tesis dan memuat uraian secara garis besar isi
dari setiap bab, maka dibuatlah sistematika penulisan:
1. BAB I – PENDAHULUAN
Bab ini berisi tentang latar belakang masalah, rumusan masalah, batasan masalah, tujuan
penelitian, manfaat penelitian dan sistematika penulisan.
2. BAB II - TINJAUAN PUSTAKA
Bab ini berisi tentang seluruh penjelasan mengenai tinjauan pustaka yag berhubungan
dengan permsalahan yang dibahas pada penulisan tesis ini.
3. BAB III – METODOLOGI PENELITIAN
Bab ini berisi penjelasan secara bertahap dan terperinci tentang langkah-langkah
(metodologi) yang digunakan untuk membuat kerangka berfikir dan kerangka kerja dalam
meyelesaikan tesis.
4. BAB IV – ANALISA DAN PEMBAHASAN
Bab ini berisi tentang analisa dan pembahasan dari tiap-tiap blok diagram perencanaan rangkaian data-data hasil pengukuran.
5. BAB V – KESIMPULAN (SEMENTARA)Bab ini berisi kesimpulan tentang hasil yang telah diperoleh serta merupakan jawaban dari tujuan yang ingin dicapai pada BAB I (Pendahuluan), akan tetapi masih bersifat sementara.
BAB IITINJAUAN PUSTAKA
2.1 Penelitian Terkait
No Judul Tahun Author Metode Hasil1. Implementation of
Data Mining Using Association Rules for Transactional Data Analysis
2017 Muhamad Brilliant, Dwi Handoko, Sriyanto
Association Rule Mining, algoritma FP-
Growth
Berdasarkan analisis dan pembahasan masalah, kesimpulan dari penelitian ini adalah sebagai berikut:1. Simulasi dilakukan untuk memberikan informasi menu oleh pola pemilihan konsumen produk hiburan dan layanan.2. Aplikasi dibuat untuk membantu memberikan informasi tentang layanan dan produk sering dipilih oleh konsumen sehingga mereka bisa dipertimbangkan untuk pembentukan produk hiburan dan paket layanan bagi konsumen.
2. Market Basket Analysis to Identify Customer Behaviors by Way of Transaction Data
2018 Fachrul Kurniawan, Binti Umayah, Jihad Hammad, Supeno Mardi Susiki Nugroho, Mochammad Hariadi
asosiasi rule menggunakan algoritma apriori
Dalam pengujian dan analisis yang telah dilakukan, disimpulkan bahwa pengembangan dan implementasi analisis keranjang pasar atas mode aturan asosiasi menggunakan algoritma apriori pada data transaksi Pusat Bisnis (BC) supermarket UIN Malang, dapat berkinerja baik. Dengan nilai kepercayaan rata-rata 46,69% dari nilai dukungan 1,78% dan aturan yang dihasilkan
adalah 30 aturan. Aturan / pola transaksi data yang diambil memiliki kecenderungan asosiasi yang rendah. Data yang dimiliki Itu sudah jatuh tempo dan data yang dianalisis tidak benar-benar mendukung analisis asosiasi / relasi antar item.
3. Market Basket Analysis: Identify the changing trends of market data using association rule mining
2016 Manpreet Kaura, Shivani Kang
Association Rule Mining menggunakan algoritma apriori
Saat ini banyak
algoritma
penambangan data
telah dikembangkan
dan diterapkan
pada berbagai
masalah praktis.
Namun
penambangan
berkala adalah
pendekatan baru
dalam
penambangan data
yang telah
mendapatkan
signifikansinya hari
ini. Bidang ini
berkembang karena
kebutuhan dalam
aplikasi yang
berbeda dan
keterbatasan
penambangan data.
Ini akan
meningkatkan
kekuatan teknik
penambangan data
yang ada.
Menemukan pola-
pola karena
perubahan data itu
sendiri merupakan
bidang yang
menarik
dieksplorasi. Ini
dapat membantu
dalam x Cari tahu
pola menarik dari
sejumlah besar
data. x Secara
otomatis melacak
perubahan fakta
dari data
sebelumnya; karena
fitur ini mungkin
berguna dalam
penipuan
deteksi. x
Memprediksi aturan
asosiasi di masa
depan serta
memberi kita
metodologi yang
tepat untuk
menemukan outlier.
Penulis menyarankan bahwa, beberapa area masih ada yang perlu difokuskan. Pertama, hasil telah dipengaruhi sangat dengan nilai ambang batas manual untuk skor, sehingga diperlukan untuk mengotomatiskan nilai ambang untuk lebih baik pengakuan pencilan. Kedua, pendekatan ini
secara khusus ditargetkan pada Market Basket Data, mungkin diperluas ke area lain.
4. Retail Business Analytics: Customer Visit Segmentation Using Market Basket Data
2018 Anastasia Griva, Cleopatra Bardaki, Katerina Pramatari, Dimitris Papakyriakopoulos
k-means clustering
Tujuan utama dari penelitian ini adalah untuk menggali lebih dalam dan memahami perilaku belanja pelanggan dan niat perkunjungan, dengan demikian, memungkinkan pengecer untuk menyediakan layanan memuaskan pelanggan disesuaikan dengan kebutuhan mereka perkunjungan. Untuk mencapai tujuan itu, peneliti mengusulkan pendekatan analitik bisnis itu menggunakan teknik pengelompokan untuk mengidentifikasi segmen kunjungan pelanggan. Peneliti menganalisis data keranjang ritel dan Peneliti menghasilkan grup kunjungan pelanggan berdasarkan kategori produk yang dibeli pelanggan selama setiap kunjungan
ke toko eceran atau web fisik. Peneliti menyarankan bahwa campuran yang dihasilkan dari kategori produk yang berlaku di setiap segmen kunjungan mencerminkan niat belanja pelanggan yang memegang keranjang termasuk dalam setiap segmen kunjungan. Dengan kata lain, Peneliti menghasilkan segmen kunjungan pelanggan dan, kemudian Peneliti atribut ke setiap segmen maksud belanja di balik kunjungan.
5. A new optimization model for market basket analysis with allocation considerations: A genetic algorithm solution approach
2017 Majeed Heydari, Amir Yousefli
Association Rule Mining
Dalam tulisan ini GA
digunakan untuk
mendapatkan lokasi
optimal dari
barang di rak-rak di
mana fungsi
preferensi
pengambil
keputusan
dimaksimalkan.
Tentang kinerja dan
sifat-sifat GA yang
dikembangkan
patut untuk dicatat
bahwa di satu sisi,
pengaturan yang
tepat parameter
algoritma
evolusioner
terutama
mempengaruhi
kinerja algoritma.
Di sisi lain, tuning
evolusioner
algoritma seperti
GA sangat
bergantung pada
properti dari
pengoptimalan
matematis model.
Oleh karena itu,
orang dapat
mengharapkan
bahwa sementara
GA yang disetel
dengan baik dapat
berhasil
memperoleh solusi
optimal secara
global untuk model
matematika
tertentu,
menerapkan GA ini
untuk yang lain
masalah dapat
menghasilkan solusi
lokal dan tidak
memuaskan.
Sebagai hasilnya,
perbandingan
menyediakan GA
dengan algoritma
evolusioner lain
yang dikembangkan
pada matematika
yang berbeda
model tidak
demikian. Namun,
untuk memastikan
kinerja dari GA yang
diusulkan, kami
membandingkan
solusi optimal yang
diturunkan oleh GA
dengan GAMS
dalam skala kecil
masalah
matematika. Hasil
yang disediakan
menunjukkan
bahwa GA yang
diusulkan sudah
disepakati dan
dapat berhasil
digunakan untuk
mendapatkan solusi
optimal.
Secara ringkas,
sementara dalam
tulisan ini pengaruh
lokasi barang pada
penjualan telah
dimasukkan dan
solusi yang lebih
realistis telah
disediakan, tetapi
ada beberapa
kekurangan yang
perlu ditangani
dalam penelitian
masa depan. Dalam
makalah ini, aturan
asosiasi
diasumsikan
diketahui terlebih
dahulu sementara
orang dapat
menggunakan yang
sesuai metode dan
algoritma untuk
menemukan aturan
asosiasi juga. Dalam
model ini, itu
diasumsikan bahwa
parameter model
yang tajam dan
nilai-nilai yang
tepat dari
parameter
diketahui. Tetapi
seperti yang bisa
diharapkan, karena
ketidakpastian
lingkungan, asumsi
seperti itu tidak
valid dan
mengembangkan
matematika yang
tidak pasti model
dapat membantu
memperoleh lebih
banyak model yang
realistis dan pada
gilirannya solusi.
Mengklasifikasikan
barang,
mendefinisikan
kriteria minat yang
tepat juga mungkin
penelitian masa
depan arah.
6. Learning from other buyers: The effect of purchase history records in online marketplaces
2013 Qiang Ye a, Zhuo (June) Cheng b, Bin Fang
Historical Sales Record
Dalam analisis kami
tentang data
transaksi dari
Taobao (online
terbesar pasar di
China) dan eBay
(pasar online paling
popular di seluruh
dunia), kami
menemukan bahwa
penjualan historis
memiliki dampak
yang signifikan
pada kinerja
penjual saat ini.
Lebih spesifik,
pelanggan lebih
mungkin untuk
memilih penjual
dengan penjualan
lebih historis. Hasil
ini menunjukkan itu
pembeli mengambil
catatan riwayat
pembelian saat
memilih penjual
dan membuat
keputusan
pembelian.
Penjualan historis
secara konsisten
signifikan di
berbagai item yang
kami sampel saat
kemunduran saat
ini penjualan pada
penjualan historis
dan karakteristik
penjual lainnya.
Sebaliknya, Skor /
penilaian umpan
balik tidak
signifikan untuk
beberapa item,
seperti Produk
memori Kingston di
kedua Taobao dan
eBay. Penjelasan
peneliti untuk ini
adalah skor /
penilaian umpan
balik, yang
merupakan
peringkat
keseluruhan
penjual, mungkin
tidak terkait
langsung dengan
barang yang
dipertimbangkan
pembeli untuk
membeli. Riwayat
pembelian,
sebaliknya, secara
langsung berkaitan
dengan item dan itu
mempengaruhi
persepsi pembeli
tentang kualitas
barang. Hasil
peneliti membantu
menjelaskan
temuan campuran
pada hubungan
antara umpan balik
skor / peringkat dan
kemungkinan
penjualan,
menunjukkan
bahwa di luarskor
umpan balik /
peringkat,
pelanggan lebih
menekankan
informasi yang
lebih relevan
dengan item di
tangan. Peneliti
melengkapi empiris
investigasi dengan
eksperimen
laboratorium unik
dan konfirmasikan
bahwa pembeli
melakukannya
memperhatikan
catatan penjualan
historis lebih jauh
lagi, pembeli yang
paling
memperhatikan
penjualan sejarah
adalah yang paling
mungkin pilih
penjual dengan
penjualan historis
tertinggi.
7. A Study on Market Basket Analysis Using a Data Mining Algorithm
2013 Phani Prasad J, Murlidher Mourya
Asosiasi Rule menggunakan algoritma apriori
Paper ini
memberikan
banyak studi kasus
tentang Asosiasi
Rule dan algoritma
penambangan data
yang ada
penggunaan untuk
analisis keranjang
pasar, juga
disebutkan dengan
jelas tentang
algoritma yang ada
dan
implementasinya
dengan jelas dan
juga tentang
masalah dan
solusinya. Di masa
depan Algoritma
yang sama dapat
dimodifikasi dan
dapat diperpanjang
pekerjaan masa
depan yang juga
mengurangi
kompleksitas waktu
8. Data Mining in Market Basket Transaction: An Association Rule Mining Approach
2014 S.O. Abdulsalam, K.S. Adewole, A.G. Akintola, M.A. Hambali
asosiasi rule menggunakan algoritma apriori
Paper ini berfokus
pada memahami
bagaimana
menganalisis
keranjang pasar
dapat membantu
memberikan
pengaruh bagi
intelijen bisnis
melalui Association
rule mining. Meski,
temuan paper ini
berlaku untuk
setiap bisnis yang
terlibat dalam
penjualan barang
dan jasa, pola
penjualan
supermarket
khususnya
dianalisis pada
penelitian ini.
Database
transaksional
dibuat dan
ditambang
menggunakan
algoritma Apriori
yang
diimplementasikan
di bahasa
pemrograman Java.
Algoritma
Association rule
mining lainnya
dapat diterapkan
untuk menambang
database
transaksional untuk
tujuan
perbandingan
kinerja.
9. Market basket analysis: Complementing association rules with minimum spanning trees
2017 Mauricio A. Vallea, Gonzalo A. Ruz , Rodrigo Morrás
Asosiasi Rule Kami telah
menunjukkan
bahwa analisis
jaringan didasarkan
pada minimum
Spanning Tree
(MST) adalah
pendekatan yang
cocok untuk
keranjang pasar
analisis (MBA).
Representasi
perilaku pembelian
melalui MST mudah
ditafsirkan dan
memungkinkan
untuk dikenali
keterkaitan yang
kuat di antara satu
set produk, yang
membuat alat kerja
yang menarik untuk
manajer
pemasaran.
Kami menunjukkan
bahwa jaringan
asosiasi produk di
toko kelontong,
toko berfungsi
sebagai panduan
untuk mengarahkan
pencarian untuk
asosiasi rule (AR).
Ini sangat penting
karena AR adalah
alat MBA klasik,
tetapi memiliki
kelemahan
menghasilkan
angka yang tinggi
aturan yang mereka
butuhkan dan
karenanya hanya
memilih dari bunga
terbesar dan rasa
praktis sangat
memakan waktu.
MST dapat
dianggap sebagai
representasi yang
unik dan
disederhanakan
jaringan asosiasi
yang dapat
mengatasi masalah
data yang
berlebihan dengan
secara signifikan
membatasi ruang
pencarian untuk
AR.
Selain itu, MST
memiliki
keuntungan untuk
memungkinkan
kontrol yang lebih
besar lebih dari
hubungan palsu
dan kebisingan
(Hero & Michel,
1997; Miccichè,
Bonanno, Lillo, &
Mantegna, 2003)
dengan mengatasi
signifikansinya dari
ujung-ujungnya,
seperti yang
ditunjukkan dalam
penelitian ini. Poin
terakhir ini juga
merupakan
keuntungan lebih
dari AR, yang
biasanya
merupakan aturan
palsu (Aggarwal &
Yu, 1998; Tuzhilin &
Adomavicius,
2002).
Terlepas dari
kelebihan MST,
hampir tidak ada
literature yang
menerapkan
jaringan semacam
itu dalam
fenomena terkait
bisnis, seperti
misalnya perilaku
pembelian agregat
dari ribuan
pelanggan. Namun,
dalam disiplin lain,
MST telah berguna
dalam
menggambarkan
dan memahami
fenomena yang
berkaitan dengan
fungsi otak (Stam
dkk., 2014; Tewarie,
van Dellen,
Hillebrand, & Stam,
2015), pengolahan
gambar (Xu &
Uberbacher, 1997),
mengelompokkan
gen ekspresi (Xu,
Olman, & Xu, 2002),
pertukaran mata
uang dan saham
(Wang, Xie, Chen, &
Chen, 2013), di
antara aplikasi lain.
Studi yang
berorientasi pada
grafik dari MBA
memungkinkan
kami untuk
membuat observasi
menarik. Pertama,
grafik asosiasi
produk dapat
diungkap
interdependensi
yang kuat antara
produk dalam
kategori yang sama.
Ini bisa dikatakan,
produk yang
berbagi kategori
cenderung
terkonsentrasi di
cabang MST yang
sama. Ini artinya
pembelian produk
dalam kategori
tertentu cenderung
disertai oleh yang
lain dalam kategori
yang sama. Dengan
demikian,
dimungkinkan
untuk mendeteksi
misalnya pasang
produk dari
kategori yang sama
sangat berkorelasi,
dan karena itu
calon penawaran
yang ditargetkan
atau promosi. Ini
adalah hasil dari
sifat taksonomi
yang mengekspos
penemuan
kelompok kategori
produk yang dekat
dengan masing-
masing lainnya
(yaitu, kategori
yang ada dalam
keranjang), yang
menunjukkan
penemuan tersebut
pola keranjang
(Rammal, Toulouse,
& Virasoro, 1986).
Ini karena MST
mengungkap pohon
hierarkis dari
subdominant jarak
ultrameter (Lee &
Djauhari, 2012;
Mantegna, 1999).
Kedua, adalah
mungkin untuk
mengidentifikasi
produk-produk
utama yang
memiliki hubungan
berbeda cabang
produk dari
kategori yang
berbeda atau dari
yang sama.
Mengingat sifat
hierarkis dari MST,
node yang memiliki
akses ke berbagai
cabang secara alami
terpapar. Namun,
berurutan untuk
node ini agar masuk
akal praktis dari
pengelola ritel
sudut pandang,
mereka perlu
diperintahkan oleh
tingkat
kepentingannya.
Kami
mendefinisikan
pentingnya node
dari MST oleh: 1)
kapasitas mereka
untuk menjadi
nexus dengan node
lain yang
berdekatan di
jaringan, dan 2)
kedekatan yang
dimiliki node
dengan yang
berdekatan lainnya
node dalam
jaringan. Jadi
misalnya, sebuah
node dengan tinggi
derajat dan jarak
pendek ke simpul
yang berdekatan
lebih penting dari
yang lain dengan
tingkat yang lebih
rendah dan jarak
yang lebih jauh.
Dengan kriteria ini,
dimungkinkan
untuk mengungkap
node dengan tinggi
pentingnya sebagai
simpul akses ke
cabang-cabang
dengan jumlah
yang tinggi dari
node sangat dekat
lainnya.
Ketiga,
kesederhanaan MST
memungkinkan
dilakukannya
evaluas signifikansi
dari sekumpulan
interrelasi terbatas,
mengesampingkan
semuanya ujung-
ujungnya yang,
berada pada jarak
pendek (atau
korelasi tinggi),
tidak signifikan. Ini
merupakan
keuntungan ketika
mencari aturan
asosiasi,
menghindari
pertimbangan
aturan potensial
yang dapat dimiliki
tingkat Angkat yang
tinggi (korelasi
tinggi), tetapi yang
berubah menjadi
kesempatan (Webb,
2007). Dalam
pengertian ini, MST
memungkinkan
analis
atau pembuat
keputusan untuk
memiliki gambaran
umum tentang
bagaimana satu
produk terkait
dengan yang lain,
dan dengan
demikian untuk
menilai
kemungkinan
promosi strategi.
Dengan aturan
asosiasi, lebih sulit
untuk mendapatkan
ini pemahaman
tentang
konektivitas.
Metode kami tidak
hanya berguna
untuk menemukan
aturan dari jenisnya
{A} → {B}, tetapi
juga untuk
memandu
pencarian untuk
lebih kompleks dan
praktis aturan, dari
zona pengaruh dan
produk utama yang
ditemukan di
MST. Perpanjangan
dari penelitian ini
adalah untuk
membangun MST
berdasarkan
kondisional korelasi
(atau korelasi
parsial). Terkadang
beberapa korelasi
antara pasangan
produk dapat
diberikan karena
pengaruh dari
produk ketiga.
Mempertimbangkan
hal ini, yang
disimpulkan ujung-
ujungnya dapat
mewakili pengaruh
yang lebih langsung
antara node
(Kolaczyk & Csárdi,
2014). Dengan
demikian,
keterbatasan MST
saat ini dapat
diatasi dengan
keinginan kita untuk
meningkatkan
kompleksitas aturan
asosiasi dengan
meningkatkan
jumlah item yang
dikandungnya,
menjadi lebih sulit
untuk menemukan
aturan-aturan ini
dengan mengamati
MST secara
langsung. Namun
demikian, MST terus
menjadi panduan
yang baik. Kami
mengantisipasi
bahwa penelitian
kami dapat
memberikan titik
awal yang baik
untuk penelitian
MBA selanjutnya
menggunakan MST.
Ada banyak aplikasi
kemungkinan.
Sebagai contoh,
perbandingan MST
sebelumnya dan
setelah kampanye
promosi yang
penting bisa
mendeteksi
perubahan di tepi
yang
menghubungkan
(atau tidak
terhubung) node
yang tidak
terhubung sebelum
(atau sudah).
Dengan cara ini,
MST telah menjadi
alat untuk
mengamati dampak
dari suatu tindakan,
tidak hanya di
tingkat local dalam
jaringan produk,
tetapi juga secara
sistemik dalam
himpunan semua
item-item yang
membentuk
jaringan.
Metodologi yang
diusulkan juga akan
memungkinkan
studi tentang
perilaku pembelian
yang berbeda
cabang-cabang
rantai supermarket
di lokasi geografis
yang berbeda.
MST dapat mengidentifikasi perilaku pembelian yang khas antara cabang-cabang, yang akan memungkinkan manajer ritel untuk memilih local kampanye promosi ad-hoc untuk populasi sosiodemografi yang menggunakan cabang tertentu. Kesimpulannya, MST bersamaan dengan deteksi signifikan dan tepi-tepi pendek serta deteksi titik-titik tinggi kepentingan memfokuskan perhatian pada kelompok produk yang dikurangi, menuju dimana manajer ritel dapat mengarahkan kegiatan pemasaran yang melibatkan memasangkan seperti barang. Memasangkan bersama produk-produk yang sangat dekat satu sama lain di zona pengaruh dalam MST adalah
sebuah peluang untuk meningkatkan penjualan. Tetapi memaketkan produk yang terkait dengan simpul penting tinggi juga merupakan kesempatan lain untuk meningkatkan perputaran produk tersebut.
10. Visual Analysis of User-Driven Association Rule Mining
2017 Wei Chena, Cong Xieb, Pingping Shanga, Qunsheng Peng
Association Rule Mining
Peneliti menyajikan metode analisis visual untuk penambangan Association Rule dalam dataset kategorikal. Pendekatan kami menggabungkan tindakan dan batasan yang ditentukan oleh pengguna aplikasi yang berbeda, dan menyediakan kemampuan interaksi untuk modulasi kendala selama proses penambangan berulang. Akhirnya, dua studi kasus yang berbeda menunjukkan validitas pendekatan kita. Untuk pekerjaan di masa depan, kami berharap dapat mendukung lebih banyak metode untuk membangun struktur hirarki matriks aturan. Otomatis pendekatan untuk merekomendasikan ambang batas ukuran akan juga membantu pengguna selama eksplorasi visual. Kami juga akan
melakukannya suka fokus pada struktur temporal aturan (misalnya, urutan dari pembelian komoditas) dengan mengintegrasikan seri waktu analisis
11. Improving the accuracy of collaborative filtering recommendations using clustering and association rules mining on implicit data
2016 Maryam Khanian Najafabadi, Mohd Naz'ri Mahrin, Suriayati Chuprat, Haslina Md Sarkan
Association Rules Mining
Collaborative
Filtering (CF)
merekomendasikan
item ke pengguna
aktif berdasarkan
peringkat
sebelumnya
catatan dari
pengguna yang
berpikiran sama
(pengguna
tetangga). Karena
CF tidak bisa secara
akurat menemukan
tetangga yang
serupa ketika
peringkat diberikan
oleh pengguna
sangat jarang,
akurasi prediksi
dalam preferensi
item pengguna
akan rendah. Oleh
karena itu, hasilkan
rekomendasi
kualitas rendah. Di
dalam belajar,
untuk mengatasi
sparsity data dari
matriks usereitem,
kita punya
mmengusulkan
teknik baru untuk
rekomendasi
berdasarkan
pengguna profil
yang dibuat dari
umpan balik
pengguna implisit
yang cocok untuk
CF dengan sparsity
data. Tujuan dari
penelitian ini
adalah untuk
meningkatkan
akurasi
rekomendasi
dengan memetakan
item pengguna
secara efisien
preferensi dari
aktivitas dan tag
pengguna yang
terkait dengan item
dan
mengidentifikasi
preferensi serupa
pada kategori lagu
yang sama. Untuk
mengatasi masalah
sparsity data, kami
punya teknik
pertambangan
aturan asosiasi yang
digunakan untuk
menemukan yang
serupa pola minat
di antara pengguna
dari informasi
implisit, bukan
informasi eksplisit.
Dalam beberapa
tahun terakhir telah
terbukti bahwa
algoritma tunggal
umumnya tidak
dapat pucat
kelemahan dalam
menggunakan
dasar CF dan
mengoptimalkan
akurasi
rekomendasi. Oleh
karena itu, usulan
teknik kami telah
meningkatkan
efektivitas
rekomendasi
dengan
menggunakan
teknik analisis
pengelompokan
untuk mengurangi
ukuran data dan
dengan
menggunakan
teknik Association
Rules Mining untuk
menemukan pola
minat serupa di
antara pengguna.
Apalagi, yang
penting fitur item
ketika
merekomendasikan
preferensi
pengguna juga
telah diselidiki.
Kemudian, empat
percobaan pada
dataset lagu public
yaitu set data
Million Song
dilakukan untuk
menyelidiki akurasi
teknik yang kami
usulkan terhadap
CF dasar.
Khususnya, bahkan
ketika datanya
jarang, teknik yang
diusulkan
meningkatkan
ketepatan untuk
36% rata-rata
tingkat sparsity
yang berbeda,
meningkatkan
Recall hingga 9%
pada tingkat
sparsity yang lebih
tinggi dan
meningkatkan F-
measure hingga
17% rata-rata
dibandingkan
dengan CF dasar.
Hasil eksperimen
juga menunjukkan
bahwa teknik kami
mencapai kinerja
yang lebih baik bila
dibandingkan
dengan versi lain
dari teknik CF di
istilah Precision,
Ingat metrik.
Peningkatan ini
menghasilkan
teknik yang
diusulkan karena
keunggulan
utamanya pada
pencapaian
informasi yang
cukup tentang
preferensi
pengguna untuk
dianalisis dari
perilaku
mendengarkan
pengguna dan
menghilangkan
ketergantungannya
peringkat pengguna
dalam proses
menemukan item
yang diminati
pengguna.
12. Association Rule Mining using Apriori Algorithm: A Survey
2013 Charanjeet Kaur Association Rule Mining
Association Rule
Mining adalah topik
yang menarik dari
penelitian di bidang
penambangan data.
Kami telah
menyajikan survei
sebagian besar
kerja penelitian
terbaru. Namun
penambangan
aturan asosiasi
adalah masih dalam
tahap eksplorasi
dan
pengembangan.
Masih ada
beberapa masalah
penting yang perlu
dipelajari untuk
mengidentifikasi
Association Rule
yang berguna. Kami
berharap bahwa
penambangan data
Peneliti dapat
memecahkan
masalah ini
sesegera mungkin.
Beberapa masalah
untuk
penambangan
aturan asosiasi
disarankan
di bawah:
1. Untuk membuat
pola yang sering
menambang tugas
penting dalam data
penambangan,
banyak penelitian
diperlukan.
2. Sebagian besar
pendekatan
didasarkan pada
beberapa asumsi
yang ketat. Mereka
harus
disamaratakan
sehingga mereka
bisa lebih luas
bekas.
3. Metode yang
lebih efisien dan
skalabel untuk
Peraturan Asosiasi
penambangan
harus
dikembangkan.
4. Metode
penambangan
tunggal dan
penambangan
online seharusnya
dikembangkan.
5. Pengukuran
database-
independen
seharusnya mapan.
6. Peraturan
asosiasi tingkat
tinggi harus
diidentifikasi.
7. Teknik untuk
aturan asosiasi
pertambangan
dalam multi-
database harus
dieksplorasi.
8. Teknik yang
efektif untuk
Penambangan
Penggunaan Web
seharusnya
dikembangkan.
9. Aplikasi baru dari
penambangan
aturan asosiasi
seharusnya
dieksplorasi.
13. Analisis Kaidah Asosiasi Antar Item Dalam
2017 Adyawangkara Katon Prasidya dan Charitas
Association Rule Mining dengan
Berdasarkan hasil
analisis data
Transaksi Pembelian Menggunakan Data Mining Dengan Algoritma Apriori (Studi Kasus: Minimarket Gun Bandungan, Jawa Tengah)
Fibriani Algoritma Apriori
transaksi pembelian
pada kurun waktu
10-Oktober-2016
s/d 15-Oktober-
2016, dapat
disimpulkan bahwa
nilai support dan
confidence
berbanding lurus
dengan kuatnya
asosiasi antar item.
Frequent itemset
yang memenuhi
minimum support
dan minimum
confidence
digunakan untuk
membentuk kaidah
asosiasi. Analisis
data transaksi
pembelian
menghasilkan
beberapa kaidah
asosiasi dalam pola
pembelian item
oleh pelanggan di
minimarket Gun
Bandungan, Jawa
Tengah. Kaidah
asosiasi yang
dihasilkan dapat
digunakan
minimarket untuk
menyusun strategi
promosi
berdasarkan item-
item yang sering
dibeli secara
bersamaan untuk
mendongkrak
penjualan dengan
melakukan teknik
cross selling sebagai
ganti dari strategi
promosi dengan
mengadakan
bundling item,
melakukan
pengadaan stok
barang yang lebih
tepat guna dengan
melakukan
pengadaan stok
barang yang
berimbang pada
item-item yang
sering dibeli secara
bersamaan, dan
mengatur tata letak
item di minimarket
sesuai pola
pembelian
pelanggan untuk
menaikkan angka
penjualan dengan
cara menata item-
item yang sering
dibeli bersamaan
berdekatan.
Perhitungan data
transaksi pembelian
menggunakan
algoritma apriori
memiliki kendala,
yaitu kendala
optimisasi
algoritma dan
optimisasi waktu,
dimana algoritma
apriori
membutuhkan
penelusuran
database secara
menyeluruh untuk
mendapatkan tiap
kombinasi itemset,
terutama dalam
menganalisis data
yang berukuran
besar. Untuk
meningkatkan
algoritma apriori,
dapat digunakan
beberapa teknik,
seperti hash-based,
transaction
reduction,
partitioning,
sampling, dan
dynamic itemset
counting
2.2 Data Mining
Data mining adalah teknik untuk mendapatkan informasi tersembunyi dari koleksi
data itu. Ada beberapa fungsi utama dalam penambangan data seperti estimasi, prediksi,
klasifikasi, pengelompokan dan asosiasi. (Muhamad Brilliant, Dwi Handoko , Sriyanto,
2017)
2.3 Association Rule Mining
Association Rule Mining adalah Teknik di bidang Data Mining yang sangat penting
saat ini. Association Rule Mining menemukan pola, asosiasi, korelasi, atau kausal yang
sering terjadi struktur di antara set barang atau benda dalam transaksi basis data, basis
data relasional, dan informasi repositori lainnya. (Charanjeet Kaur , 2013)
BAB III
METODOLOGI PENELITIAN
3.1 Literature Review
Tahapan ini dilakukan dengan melakukan review dari berbagai paper yang
berhubungan dengan penelitian ini. Setelah ditemukan masalah yang belum terselesaikan
dari penelitian sebelumnya, maka dilakukan literature review untuk menemukan pemecahan
masalah yang akan diteliti.
3.2 Pengumpulan Data
Data yang akan digunakan pada penelitian ini adalah Dataset berupa data keranjang
belanja customer pada E-Marketplace.
3.3 Metode Association Rule Mining
Association Rule Mining menambang data pada E-Marketplace untuk mengetahui
data keranjang belanja customer agar menghasilkan informasi produk yang sering dipilih
oleh customer. Sehingga bisa dipertimbangkan untuk mengatur persediaan stok barang agar
sesuai dengan daya minat pembelian customer dan dapat mengatur strategi penjualan,
memungkinkan pengecer untuk menyediakan layanan memuaskan pelanggan disesuaikan
dengan kebutuhan perkunjungan customer.
3.4 Validasi dan Verifikasi
Pada tahapan ini dilakukan validasi dan verifikasi algoritma yang akan diujikan pada
penelitian ini, agar menghasilkan akurasi data yang lebih baik dari penelitian sebelumnya.
3.5 Kesimpulan dan Saran
Pada tahap ini, telah didapatkan hasil dari penelitian yang telah diuji coba. Sehingga
peneliti dapat memberikan kesimpulan dan saran dari hasil penelitian yang telah dilakukan.
3.6 Jadwal Penelitian
No Kegiatan
Bulan
Mei Juni Juli Agustus
Minggu Minggu Minggu Minggu
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
1 Pembuatan Proposal Tugas Akhir
2 Pengumpulan dataset
3 Mengolah dataset
4 Melakukan Validasi Data
5 Melakukan Verifikasi Data
6 Pembuatan Tesis I
7 Pembuatan Tesis II
DAFTAR PUSTAKA
Brilliant, Muhamad dkk. 2017. Implementation of Data Mining Using Association Rules for Transactional Data Analysis
Kurniawan, Fachrul dkk. 2018. Market Basket Analysis to Identify Customer Behaviors by Way of Transaction Data.
Kaura, Manpreet and Kang, Shivani. 2016. Market Basket Analysis: Identify the changing trends of market data using association rule mining.
Griva, Anastasia dkk. 2018. Retail Business Analytics: Customer Visit Segmentation Using Market Basket Data.
Heydari, Majeed and Yousefli, Amir. 2017. A new optimization model for market basket analysis with allocation considerations: A genetic algorithm solution approach.
Ye a, Qiang dkk. 2013. Learning from other buyers: The effect of purchase history records in online marketplaces.
Prasad J, Phani and Mourya, Murlidher. 2013. A Study on Market Basket Analysis Using a Data Mining Algorithm.
Abdulsalam, S.O. dkk. 2014. Data Mining in Market Basket Transaction: An Association Rule Mining Approach.
A. Vallea, Mauricio dkk. 2017. Market basket analysis: Complementing association rules with minimum spanning trees.
Chena, Wei dkk. 2017. Visual Analysis of User-Driven Association Rule Mining.
Khanian Najafabadi, Maryam dkk. 2016. Improving the accuracy of collaborative filtering recommendations using clustering and association rules mining on implicit data.
Kaur, Charanjeet. 2013. Association Rule Mining using Apriori Algorithm: A Survey.
Katon Prasidya, Adyawangkara and Fibriani, Charitas. 2017. Analisis Kaidah Asosiasi Antar Item Dalam Transaksi Pembelian Menggunakan Data Mining Dengan Algoritma Apriori (Studi Kasus: Minimarket Gun Bandungan, Jawa Tengah).