Upload
fridrachman
View
219
Download
0
Embed Size (px)
Citation preview
7/30/2019 Multiple Discriminant Analysis
1/7
MULTIPLE DISCRIMINANT ANALYSIS
Page 1
Tugas Kelompok Statistik Multivariat
RINGKASAN MATA KULIAH (RMK)
MULTIPLE DISCRIMINANT ANALYSIS
OLEH:
ANDI WA ODE SUASTINA
NUR ARKAM
PUSPITA HARDIANTI ANWAR
PROGRAM STUDI PASCASARJANA AKUNTANSI
FAKULTAS EKONOMI DAN BISNIS
UNIVERSITAS HASANUDDIN
MAKASSAR
2012
7/30/2019 Multiple Discriminant Analysis
2/7
MULTIPLE DISCRIMINANT ANALYSIS
Page 2
MULTIPLE DISCRIMINANT ANALYSIS
Penggunaan Analisis Diskriminan Terhadap Regresi Berganda
Multiple Discriminant Analysis adalah salah satu teknik statistic yang cocok ketika
melibatkan variable single categorical dependent dan beberapa variabel bebas
(independent) kategori metrik.
Dalam banyak kasus, variable dependent terdiri dari dua grup atau klasifikasi, contoh :
pria vs wanita, tinggi vs rendah, baik vs buruk, dan beberapa contoh yang melibatkan lebih
dari dua grup, seperti tinggi, medium, rendah, Analisis diskriminan dapat memecahkan
masalah tersebut. Hasil dari analisis diskriminan dapat membantu dalam mengidentifikasi
karakterisktik dari subyek dan memasukkan nya kedalam kelompok yang sesuai.
Variasi diskriminan adalah kombinasi linier atas dua atau lebih variabel bebas yang
akan di diskriminasi atas objek yang terbaik dalam sebuah kelompok (orang, perusahaan
dan lain sebagainya). Proses diskriminasi dilakukan dengan menghitung bobot variasi dari
setiap variabel bebas untuk memaksimalkan perbedaan antara kedua grup (varians grup
relatif atau varians grup).
Untuk melihat keunikan dari analisis diskriminan adalah bahwa banyak fungsi yang
akan dihasilkan dari setiap objek yang memiliki lebih dari satu nilai diskriminan.
Dalam memilih suatu teknik analisis yang tepat, kadang-kadang kita menghadapi
masalah yang melibatkan variabel dependen kategoris dan beberapa variabel independen
metrik. Ingat bahwa variabel dependen tunggal dalam regresi diukur metrically. Analisis
diskriminan berganda merupakan salah satu teknik statistik yang sesuai ketika masalah
penelitian melibatkan kategoris tunggal tergantung n variabel dan beberapa variabel
independen metrik. Dalam banyak kasus, variabel dependen terdiri dari dua kelompok atau
klasifikasi, misalnya, jantan dan betina, tinggi rendah dibandingkan, atau baik versus
buruk. Dalam kasus lain, lebih dari dua kelompok yang terlibat, seperti rendah, sedang,
dan tinggi analisis klasifikasi diskriminan mampu menanganinya dua kelompok atau
beberapa kelompok (tiga atau lebih) Hasil analisis diskriminan dapat membantu dalam
7/30/2019 Multiple Discriminant Analysis
3/7
MULTIPLE DISCRIMINANT ANALYSIS
Page 3
karakteristik antarkelompok dari yang subjec dan menugaskan mereka untuk kelompok-
kelompok yang sesuai.
Tipe Variabel dan Ukuran Sampel yang digunakanUntuk tipe variable, dalam menggunakan Analisis Diskriminan, Anda sebaiknya
mengidentifikasi variable dependent dan independent yang dapat di ukur. Jumlah kategori
variable dependent bisa dua atau lebih, tetapi harus eksklusif dan lengkap. Sedang kan
untuk variable independent bias dilakukan dengan dua cara :
1. Dengan mengidentifikasi variable dari penelitian sebelumnya atau dari model teoriyang melatar belakangi pertanyaan dari penelitian tersebut
2. Menggunakan pengetahuan dan intuisi dari peneliti dalam memilih variable yangtidak ada dalam penelitian atau teori terdahulu. Tetapi secara logis masih ada
hubungan dengan penentuan variable dependent.
Analisis diskriminan, seperti umum nya teknik multivariate dipengaruhi oleh banyak
nya jumlah sampel. Rasio dari 20 penelitian dari tiap variable yang di tentukan, sangat
direkomendasikan. Dikarenakan hasil penelitian akan tidak stabil jika sampel dikurangi dan
dihibingkan dengn variable independent, jumlah minimum yang direkomendasikan 5penelitian per independent variable.
Ukuran sampel terbagi dua yang pertama sampel secara keseluruhan dimana yang
dilakukan adalah mempertimbangkan hubungan sampel secara keseluruhan. Analisis
diskriminan merupakan rasio utama terhadap angka prediksi sebuah variabel. Ketika rasio
sulit untuk di praktekkan, peneliti sebaiknya mencatat hasil yang berpotensi tidak stabil dari
sebuah sampel yang bersifat relatif dari variabel bebas. Kedua ketika telah mendapatkan
ukuran sampel secara keseluruhan dilakukan pengambilan sampel per kategori. Minimal
dari kelompok yang memiliki nilai terendah dari setiap kategori serta harus melebihi nilai
dari variabel bebas. Variasi yang luas dari sebuah kelompok akan memberikan hasil
estimasi dari fungsi diskriminasi dan dilakukan klasifikasi observasi. Klasifikasi dilakukan
untuk melihat tingkatan, kelompok besar yang memiliki tingkat klasifikasi yang tidak
sebanding.
7/30/2019 Multiple Discriminant Analysis
4/7
MULTIPLE DISCRIMINANT ANALYSIS
Page 4
Asumsi Dasar Analisis Diskriminan
Asumsi utama untuk menurunkan fungsi diskriminan adalah normalitas multivariat
dari variabel independen dan tidak diketahui (tapi sama) dan matriks kovarians dispersi
untuk kelompok. Data tidak memenuhi asumsi normalitas multivariat dapat menyebabkan
masalah dalam estimasi fungsi diskriminan. Oleh karena itu, disarankan agar regresi
logistik digunakan sebagai teknik alternatif, jika memungkinkan.
Matriks kovarians yang tidak merata dapat mempengaruhi proses klasifikasi. Jika
ukuran sampel kecil dan matriks kovarians yang tidak sama, maka signifikansi statistik dari
proses estimasi terpengaruh. Tapi yang lebih mungkin adalah kasus covariances tidak
setara antara kelompok ukuran sampel yang memadai, dimana pengamatan yang
"overclassified" ke dalam kelompok-kelompok dengan matriks kovarians yang lebih besar.
Karakteristik lain dari data yang dapat mempengaruhi hasil adalah
multikolinearitas antar variabel independen. Akhirnya, suatu asumsi implisit adalah bahwa
semua hubungan yang linear. Hubungan nonlinier tidak tercermin dalam fungsi diskriminan
kecuali transformasi variabel khusus dibuat untuk mewakili efek nonlinier.
Dua Pendekatan Analisis Diskriminan1. Pendekatan Estimasi Simultan
Estimasi simultan melibatkan perhitungan diskriminan fungsi sehingga semua variabel
independen dianggap bersamaan. Dengan demikian fungsi diskriminan dihitung
berdasarkan set variabel independen keseluruhan, terlepas dari kekuatan diskriminatif
dari masing-masing variabel independen. Metode simultan sesuai jika, untuk alasan
teoritis, analis ingin memasukkan semua variabel independen dalam analisis dan tidak
tertarik melihat hasil antara didasarkan hanya pada variabel yang paling diskriminatif.
2. Pendekatan Estimasi StepwiseEstimasi Stepwise adalah sebuah alternatif untuk pendekatan simultan. Ini melibatkan
memasukkan variabel independen ke dalam satu fungsi diskriminan pada waktu atas
dasar kekuasaan diskriminatif mereka. Prosedur stepwise dimulai dengan memilih
variabel pembeda tunggal terbaik. Variabel awal kemudian dipasangkan dengan
masing-masing variabel independen lain satu per satu, dan variabel yang paling
7/30/2019 Multiple Discriminant Analysis
5/7
MULTIPLE DISCRIMINANT ANALYSIS
Page 5
mampu meningkatkan kekuatan diskriminatif dari fungsi dalam kombinasi dengan
variabel pertama dipilih. Akhirnya, baik semua variabel independen akan dimasukkan
dalam fungsi atau variabel dan mengecualikan variable yang dinilai tidak memberikan
kontribusi signifikan terhadap diskriminasi lebih jauh.
Klasifikasi Matriks
Klasifikasi matriks adalah sebuah matriks yang berisi angka-angka yang
mengungkapkan kemampuan prediktif dari fungsi diskriminan. Angka-angka pada
diagonal dari matriks tersebut merupakan jumlah dari klasifikasi yang benar, dengan
off-diagonalmewakili angka misclassifications (kesalahan klasifikasi).
Sebelum matriks klasifikasi dapat dibangun, namun, analis harus menentukan
kelompok untuk menetapkan masing-masing individu. Jika kita memiliki dua kelompok
(A dan B) dan fungsi diskriminan untuk setiap kelompok (ZA dan ZB) akan ditetapkan
setiap individu ke dalam kelompok yang memiliki skor diskriminan lebih tinggi.
Solusi optimal juga harus mempertimbangkan resiko kesalahan klasifikasi individu ke
dalam kelompok yang salah. Jika resiko dari kesalahan klasifikasi individu kurang lebih
sama, maka solusi optimal lah yang akan membuat kesalahan klasifikasi dari jumlah
individu paling sedikit dalam setiap kelompok. Jika resiko kesalahan klasifikasi yangtidak sama, solusi optimal akan menjadi salah satu yang meminimalkan biaya
kesalahan klasifikasi.
Jika analis ragu apakah proporsi yang diamati dalam sampel telah mewakili dari
proporsi populasi, maka probabilitas yang sama harus digunakan. Namun, jika sampel
acak diambil dari populasi dengan tujuan kelompok tersebut mampu memperkirakan
proporsi populasi dari masing-masing kelompok, maka estimasi terbaik dari ukuran
kelompok sebenarnya dan probabilitas sebelumnya karena tidak sama tapi,
sebaliknya, proporsi sampel.
Untuk memvalidasi fungsi diskriminan melalui penggunaan matriks klasifikasi, sampel
seharusnya secara acak dibagi menjadi dua kelompok. Salah satu kelompok (sampel
analisis) digunakan untuk menghitung fungsi diskriminan. Kelompok lain
(ketidaksepakatan, atau sampel validasi) masih dipertahankan untuk digunakan dalam
mengembangkan matriks klasifikasi. Prosedur ini melibatkan mengalikan bobot yang
dihasilkan oleh analisis sampel dengan pengukuran variabel baku dari sampel
7/30/2019 Multiple Discriminant Analysis
6/7
MULTIPLE DISCRIMINANT ANALYSIS
Page 6
ketidaksepakatan. Kemudian nilai diskriminan individu untuk sampel ketidaksepakatan
dihitung dan setiap individu diberikan kepada kelompok yang memiliki skor diskriminan
lebih tinggi.
Sebuah uji statistik untuk kekuatan diskriminatif dari matriks klasifikasi Press Q
statistik. Ini ukuran sederhana membandingkan jumlah klasifikasi yang benar dengan
ukuran sampel total dan jumlah kelompok. Nilai yang dihitung kemudian dibandingkan
dengan kritis nilai dari distribusi Chi-Square dengan 1 derajat
kebebasan. Jika nilai ini melebihi nilai kritis, matriks klasifikasi dapat dianggap statistik
lebih baik daripada kesempatan. Statistik Q dihitung dengan rumus berikut:
Dimana, N: Jumlah ukuran sampel
n: jumlah penelitian yang di klasifikasi secara benar
K: Jumlah Kelompok
Mengidentifikasi Variabel Independen dengan menggunakan Diskriminan
Terdapat 3 metode untuk menentukan kepentingan relatif antara lain :
a. Memberikan bobot standar diskriminanb. Diskriminan loading (korelasi struktur)c. Nilai F parsial
Dalam pendekatan tradisional untuk menginterpretasikan fungsi diskriminan
dilakukan pemeriksaan tanda dan besarnya jarak bobot standar diskriminan untuk
menugaskan perhitungan ke masing-masing variabel terhadap fungsi diskriminan.
Variabel bebas dengan bobot relative memberikan kontribusi lebih untuk kekuatan
fungsi diskriminan dibanding variabel yang memiliki bobot terkecil. Sebuah tanda
menunjukan variabel yang dihasilkan memiliki kontribusi bernilai positif atau negatif.
Diskriminan loading adalah peningkatan interpretasi karena adanya defisiensi
bobot pemanfaatan. Menilai korelasi linier sederhana antara masing-masing variabel
bebas dan fungsi diskriminan. Diskriminan loading menggambarkan varians atas
variabel bebas yang digabung dengan fungsi diskriminan.
7/30/2019 Multiple Discriminant Analysis
7/7
MULTIPLE DISCRIMINANT ANALYSIS
Page 7
PenggunaanPendekatan Sampel Acak Untuk Menentukan Validasi
Pembenaran untuk membagi sampel ke dalam dua kelompok adalah bahwa bias
yang semakin meningkat akan terjadi dalam akurasi prediksi dari fungsi diskriminan
jika individu yang digunakan dalam mengembangkan matriks klasifikasi yang sama
dengan yang digunakan dalam menghitung fungsi. Implikasi dari ini bias ke atas
sangat penting ketika peneliti berkaitan dengan validitas eksternal dari temuan.
Peneliti lain telah menyarankan, bagaimanapun, bahwa keyakinan yang lebih
besar dapat ditempatkan dalam validitas fungsi dengan mengikuti prosedur ini
beberapa kali. Peneliti secara acak akan membagi sampel ke analisis dan mengolah
sampel tersebut bebrapa kali, setiap kali pengujian validitas fungsi melaluipengembangan klasifikasi matriks dan menghasilkan rasio. Kemudian hasil rasio
tersebut beberapa akan dirata-ratakan untuk mendapatkan ukuran tunggal.
Pilihan lain adalah U-metode, yang didasarkan pada prinsip "leaveone-out", di
mana fungsi diskriminan dipasang untuk sampel berulang kali diambil dari populasi
asli. Sebuah dataset dengan 100 pengamatan akan melibatkan 100 analisis
diskriminan yang berbeda yang dilakukan, masing-masing pada 99 dari 100 observasi.
Setiap kali fungsi diskriminan dihitung, dan akan digunakan untuk mengklasifikasikan
pengamatan sisa yang tidak terlibat dalam perhitungan fungsi. Ini adalah metode
CROSSVALIDATE dilakukan di SAS.