Multiple Discriminant Analysis

7/30/2019 Multiple Discriminant Analysis

1/7

MULTIPLE DISCRIMINANT ANALYSIS

Page 1

Tugas Kelompok Statistik Multivariat

RINGKASAN MATA KULIAH (RMK)


OLEH:

ANDI WA ODE SUASTINA

NUR ARKAM

PUSPITA HARDIANTI ANWAR

PROGRAM STUDI PASCASARJANA AKUNTANSI

FAKULTAS EKONOMI DAN BISNIS

UNIVERSITAS HASANUDDIN

MAKASSAR

2012


2/7


Page 2


Penggunaan Analisis Diskriminan Terhadap Regresi Berganda

Multiple Discriminant Analysis adalah salah satu teknik statistic yang cocok ketika

melibatkan variable single categorical dependent dan beberapa variabel bebas

(independent) kategori metrik.

Dalam banyak kasus, variable dependent terdiri dari dua grup atau klasifikasi, contoh :

pria vs wanita, tinggi vs rendah, baik vs buruk, dan beberapa contoh yang melibatkan lebih

dari dua grup, seperti tinggi, medium, rendah, Analisis diskriminan dapat memecahkan

masalah tersebut. Hasil dari analisis diskriminan dapat membantu dalam mengidentifikasi

karakterisktik dari subyek dan memasukkan nya kedalam kelompok yang sesuai.

Variasi diskriminan adalah kombinasi linier atas dua atau lebih variabel bebas yang

akan di diskriminasi atas objek yang terbaik dalam sebuah kelompok (orang, perusahaan

dan lain sebagainya). Proses diskriminasi dilakukan dengan menghitung bobot variasi dari

setiap variabel bebas untuk memaksimalkan perbedaan antara kedua grup (varians grup

relatif atau varians grup).

Untuk melihat keunikan dari analisis diskriminan adalah bahwa banyak fungsi yang

akan dihasilkan dari setiap objek yang memiliki lebih dari satu nilai diskriminan.

Dalam memilih suatu teknik analisis yang tepat, kadang-kadang kita menghadapi

masalah yang melibatkan variabel dependen kategoris dan beberapa variabel independen

metrik. Ingat bahwa variabel dependen tunggal dalam regresi diukur metrically. Analisis

diskriminan berganda merupakan salah satu teknik statistik yang sesuai ketika masalah

penelitian melibatkan kategoris tunggal tergantung n variabel dan beberapa variabel

independen metrik. Dalam banyak kasus, variabel dependen terdiri dari dua kelompok atau

klasifikasi, misalnya, jantan dan betina, tinggi rendah dibandingkan, atau baik versus

buruk. Dalam kasus lain, lebih dari dua kelompok yang terlibat, seperti rendah, sedang,

dan tinggi analisis klasifikasi diskriminan mampu menanganinya dua kelompok atau

beberapa kelompok (tiga atau lebih) Hasil analisis diskriminan dapat membantu dalam


3/7


Page 3

karakteristik antarkelompok dari yang subjec dan menugaskan mereka untuk kelompok-

kelompok yang sesuai.

Tipe Variabel dan Ukuran Sampel yang digunakanUntuk tipe variable, dalam menggunakan Analisis Diskriminan, Anda sebaiknya

mengidentifikasi variable dependent dan independent yang dapat di ukur. Jumlah kategori

variable dependent bisa dua atau lebih, tetapi harus eksklusif dan lengkap. Sedang kan

untuk variable independent bias dilakukan dengan dua cara :

1. Dengan mengidentifikasi variable dari penelitian sebelumnya atau dari model teoriyang melatar belakangi pertanyaan dari penelitian tersebut

2. Menggunakan pengetahuan dan intuisi dari peneliti dalam memilih variable yangtidak ada dalam penelitian atau teori terdahulu. Tetapi secara logis masih ada

hubungan dengan penentuan variable dependent.

Analisis diskriminan, seperti umum nya teknik multivariate dipengaruhi oleh banyak

nya jumlah sampel. Rasio dari 20 penelitian dari tiap variable yang di tentukan, sangat

direkomendasikan. Dikarenakan hasil penelitian akan tidak stabil jika sampel dikurangi dan

dihibingkan dengn variable independent, jumlah minimum yang direkomendasikan 5penelitian per independent variable.

Ukuran sampel terbagi dua yang pertama sampel secara keseluruhan dimana yang

dilakukan adalah mempertimbangkan hubungan sampel secara keseluruhan. Analisis

diskriminan merupakan rasio utama terhadap angka prediksi sebuah variabel. Ketika rasio

sulit untuk di praktekkan, peneliti sebaiknya mencatat hasil yang berpotensi tidak stabil dari

sebuah sampel yang bersifat relatif dari variabel bebas. Kedua ketika telah mendapatkan

ukuran sampel secara keseluruhan dilakukan pengambilan sampel per kategori. Minimal

dari kelompok yang memiliki nilai terendah dari setiap kategori serta harus melebihi nilai

dari variabel bebas. Variasi yang luas dari sebuah kelompok akan memberikan hasil

estimasi dari fungsi diskriminasi dan dilakukan klasifikasi observasi. Klasifikasi dilakukan

untuk melihat tingkatan, kelompok besar yang memiliki tingkat klasifikasi yang tidak

sebanding.


4/7


Page 4

Asumsi Dasar Analisis Diskriminan

Asumsi utama untuk menurunkan fungsi diskriminan adalah normalitas multivariat

dari variabel independen dan tidak diketahui (tapi sama) dan matriks kovarians dispersi

untuk kelompok. Data tidak memenuhi asumsi normalitas multivariat dapat menyebabkan

masalah dalam estimasi fungsi diskriminan. Oleh karena itu, disarankan agar regresi

logistik digunakan sebagai teknik alternatif, jika memungkinkan.

Matriks kovarians yang tidak merata dapat mempengaruhi proses klasifikasi. Jika

ukuran sampel kecil dan matriks kovarians yang tidak sama, maka signifikansi statistik dari

proses estimasi terpengaruh. Tapi yang lebih mungkin adalah kasus covariances tidak

setara antara kelompok ukuran sampel yang memadai, dimana pengamatan yang

"overclassified" ke dalam kelompok-kelompok dengan matriks kovarians yang lebih besar.

Karakteristik lain dari data yang dapat mempengaruhi hasil adalah

multikolinearitas antar variabel independen. Akhirnya, suatu asumsi implisit adalah bahwa

semua hubungan yang linear. Hubungan nonlinier tidak tercermin dalam fungsi diskriminan

kecuali transformasi variabel khusus dibuat untuk mewakili efek nonlinier.

Dua Pendekatan Analisis Diskriminan1. Pendekatan Estimasi Simultan

Estimasi simultan melibatkan perhitungan diskriminan fungsi sehingga semua variabel

independen dianggap bersamaan. Dengan demikian fungsi diskriminan dihitung

berdasarkan set variabel independen keseluruhan, terlepas dari kekuatan diskriminatif

dari masing-masing variabel independen. Metode simultan sesuai jika, untuk alasan

teoritis, analis ingin memasukkan semua variabel independen dalam analisis dan tidak

tertarik melihat hasil antara didasarkan hanya pada variabel yang paling diskriminatif.

2. Pendekatan Estimasi StepwiseEstimasi Stepwise adalah sebuah alternatif untuk pendekatan simultan. Ini melibatkan

memasukkan variabel independen ke dalam satu fungsi diskriminan pada waktu atas

dasar kekuasaan diskriminatif mereka. Prosedur stepwise dimulai dengan memilih

variabel pembeda tunggal terbaik. Variabel awal kemudian dipasangkan dengan

masing-masing variabel independen lain satu per satu, dan variabel yang paling


5/7


Page 5

mampu meningkatkan kekuatan diskriminatif dari fungsi dalam kombinasi dengan

variabel pertama dipilih. Akhirnya, baik semua variabel independen akan dimasukkan

dalam fungsi atau variabel dan mengecualikan variable yang dinilai tidak memberikan

kontribusi signifikan terhadap diskriminasi lebih jauh.

Klasifikasi Matriks

Klasifikasi matriks adalah sebuah matriks yang berisi angka-angka yang

mengungkapkan kemampuan prediktif dari fungsi diskriminan. Angka-angka pada

diagonal dari matriks tersebut merupakan jumlah dari klasifikasi yang benar, dengan

off-diagonalmewakili angka misclassifications (kesalahan klasifikasi).

Sebelum matriks klasifikasi dapat dibangun, namun, analis harus menentukan

kelompok untuk menetapkan masing-masing individu. Jika kita memiliki dua kelompok

(A dan B) dan fungsi diskriminan untuk setiap kelompok (ZA dan ZB) akan ditetapkan

setiap individu ke dalam kelompok yang memiliki skor diskriminan lebih tinggi.

Solusi optimal juga harus mempertimbangkan resiko kesalahan klasifikasi individu ke

dalam kelompok yang salah. Jika resiko dari kesalahan klasifikasi individu kurang lebih

sama, maka solusi optimal lah yang akan membuat kesalahan klasifikasi dari jumlah

individu paling sedikit dalam setiap kelompok. Jika resiko kesalahan klasifikasi yangtidak sama, solusi optimal akan menjadi salah satu yang meminimalkan biaya

kesalahan klasifikasi.

Jika analis ragu apakah proporsi yang diamati dalam sampel telah mewakili dari

proporsi populasi, maka probabilitas yang sama harus digunakan. Namun, jika sampel

acak diambil dari populasi dengan tujuan kelompok tersebut mampu memperkirakan

proporsi populasi dari masing-masing kelompok, maka estimasi terbaik dari ukuran

kelompok sebenarnya dan probabilitas sebelumnya karena tidak sama tapi,

sebaliknya, proporsi sampel.

Untuk memvalidasi fungsi diskriminan melalui penggunaan matriks klasifikasi, sampel

seharusnya secara acak dibagi menjadi dua kelompok. Salah satu kelompok (sampel

analisis) digunakan untuk menghitung fungsi diskriminan. Kelompok lain

(ketidaksepakatan, atau sampel validasi) masih dipertahankan untuk digunakan dalam

mengembangkan matriks klasifikasi. Prosedur ini melibatkan mengalikan bobot yang

dihasilkan oleh analisis sampel dengan pengukuran variabel baku dari sampel


6/7


Page 6

ketidaksepakatan. Kemudian nilai diskriminan individu untuk sampel ketidaksepakatan

dihitung dan setiap individu diberikan kepada kelompok yang memiliki skor diskriminan

lebih tinggi.

Sebuah uji statistik untuk kekuatan diskriminatif dari matriks klasifikasi Press Q

statistik. Ini ukuran sederhana membandingkan jumlah klasifikasi yang benar dengan

ukuran sampel total dan jumlah kelompok. Nilai yang dihitung kemudian dibandingkan

dengan kritis nilai dari distribusi Chi-Square dengan 1 derajat

kebebasan. Jika nilai ini melebihi nilai kritis, matriks klasifikasi dapat dianggap statistik

lebih baik daripada kesempatan. Statistik Q dihitung dengan rumus berikut:

Dimana, N: Jumlah ukuran sampel

n: jumlah penelitian yang di klasifikasi secara benar

K: Jumlah Kelompok

Mengidentifikasi Variabel Independen dengan menggunakan Diskriminan

Terdapat 3 metode untuk menentukan kepentingan relatif antara lain :

a. Memberikan bobot standar diskriminanb. Diskriminan loading (korelasi struktur)c. Nilai F parsial

Dalam pendekatan tradisional untuk menginterpretasikan fungsi diskriminan

dilakukan pemeriksaan tanda dan besarnya jarak bobot standar diskriminan untuk

menugaskan perhitungan ke masing-masing variabel terhadap fungsi diskriminan.

Variabel bebas dengan bobot relative memberikan kontribusi lebih untuk kekuatan

fungsi diskriminan dibanding variabel yang memiliki bobot terkecil. Sebuah tanda

menunjukan variabel yang dihasilkan memiliki kontribusi bernilai positif atau negatif.

Diskriminan loading adalah peningkatan interpretasi karena adanya defisiensi

bobot pemanfaatan. Menilai korelasi linier sederhana antara masing-masing variabel

bebas dan fungsi diskriminan. Diskriminan loading menggambarkan varians atas

variabel bebas yang digabung dengan fungsi diskriminan.


7/7


Page 7

PenggunaanPendekatan Sampel Acak Untuk Menentukan Validasi

Pembenaran untuk membagi sampel ke dalam dua kelompok adalah bahwa bias

yang semakin meningkat akan terjadi dalam akurasi prediksi dari fungsi diskriminan

jika individu yang digunakan dalam mengembangkan matriks klasifikasi yang sama

dengan yang digunakan dalam menghitung fungsi. Implikasi dari ini bias ke atas

sangat penting ketika peneliti berkaitan dengan validitas eksternal dari temuan.

Peneliti lain telah menyarankan, bagaimanapun, bahwa keyakinan yang lebih

besar dapat ditempatkan dalam validitas fungsi dengan mengikuti prosedur ini

beberapa kali. Peneliti secara acak akan membagi sampel ke analisis dan mengolah

sampel tersebut bebrapa kali, setiap kali pengujian validitas fungsi melaluipengembangan klasifikasi matriks dan menghasilkan rasio. Kemudian hasil rasio

tersebut beberapa akan dirata-ratakan untuk mendapatkan ukuran tunggal.

Pilihan lain adalah U-metode, yang didasarkan pada prinsip "leaveone-out", di

mana fungsi diskriminan dipasang untuk sampel berulang kali diambil dari populasi

asli. Sebuah dataset dengan 100 pengamatan akan melibatkan 100 analisis

diskriminan yang berbeda yang dilakukan, masing-masing pada 99 dari 100 observasi.

Setiap kali fungsi diskriminan dihitung, dan akan digunakan untuk mengklasifikasikan

pengamatan sisa yang tidak terlibat dalam perhitungan fungsi. Ini adalah metode

CROSSVALIDATE dilakukan di SAS.

Documents

Multiple Discriminant Analysis