Multiple Discriminant Analysis

Embed Size (px)

Citation preview

  • 7/30/2019 Multiple Discriminant Analysis

    1/7

    MULTIPLE DISCRIMINANT ANALYSIS

    Page 1

    Tugas Kelompok Statistik Multivariat

    RINGKASAN MATA KULIAH (RMK)

    MULTIPLE DISCRIMINANT ANALYSIS

    OLEH:

    ANDI WA ODE SUASTINA

    NUR ARKAM

    PUSPITA HARDIANTI ANWAR

    PROGRAM STUDI PASCASARJANA AKUNTANSI

    FAKULTAS EKONOMI DAN BISNIS

    UNIVERSITAS HASANUDDIN

    MAKASSAR

    2012

  • 7/30/2019 Multiple Discriminant Analysis

    2/7

    MULTIPLE DISCRIMINANT ANALYSIS

    Page 2

    MULTIPLE DISCRIMINANT ANALYSIS

    Penggunaan Analisis Diskriminan Terhadap Regresi Berganda

    Multiple Discriminant Analysis adalah salah satu teknik statistic yang cocok ketika

    melibatkan variable single categorical dependent dan beberapa variabel bebas

    (independent) kategori metrik.

    Dalam banyak kasus, variable dependent terdiri dari dua grup atau klasifikasi, contoh :

    pria vs wanita, tinggi vs rendah, baik vs buruk, dan beberapa contoh yang melibatkan lebih

    dari dua grup, seperti tinggi, medium, rendah, Analisis diskriminan dapat memecahkan

    masalah tersebut. Hasil dari analisis diskriminan dapat membantu dalam mengidentifikasi

    karakterisktik dari subyek dan memasukkan nya kedalam kelompok yang sesuai.

    Variasi diskriminan adalah kombinasi linier atas dua atau lebih variabel bebas yang

    akan di diskriminasi atas objek yang terbaik dalam sebuah kelompok (orang, perusahaan

    dan lain sebagainya). Proses diskriminasi dilakukan dengan menghitung bobot variasi dari

    setiap variabel bebas untuk memaksimalkan perbedaan antara kedua grup (varians grup

    relatif atau varians grup).

    Untuk melihat keunikan dari analisis diskriminan adalah bahwa banyak fungsi yang

    akan dihasilkan dari setiap objek yang memiliki lebih dari satu nilai diskriminan.

    Dalam memilih suatu teknik analisis yang tepat, kadang-kadang kita menghadapi

    masalah yang melibatkan variabel dependen kategoris dan beberapa variabel independen

    metrik. Ingat bahwa variabel dependen tunggal dalam regresi diukur metrically. Analisis

    diskriminan berganda merupakan salah satu teknik statistik yang sesuai ketika masalah

    penelitian melibatkan kategoris tunggal tergantung n variabel dan beberapa variabel

    independen metrik. Dalam banyak kasus, variabel dependen terdiri dari dua kelompok atau

    klasifikasi, misalnya, jantan dan betina, tinggi rendah dibandingkan, atau baik versus

    buruk. Dalam kasus lain, lebih dari dua kelompok yang terlibat, seperti rendah, sedang,

    dan tinggi analisis klasifikasi diskriminan mampu menanganinya dua kelompok atau

    beberapa kelompok (tiga atau lebih) Hasil analisis diskriminan dapat membantu dalam

  • 7/30/2019 Multiple Discriminant Analysis

    3/7

    MULTIPLE DISCRIMINANT ANALYSIS

    Page 3

    karakteristik antarkelompok dari yang subjec dan menugaskan mereka untuk kelompok-

    kelompok yang sesuai.

    Tipe Variabel dan Ukuran Sampel yang digunakanUntuk tipe variable, dalam menggunakan Analisis Diskriminan, Anda sebaiknya

    mengidentifikasi variable dependent dan independent yang dapat di ukur. Jumlah kategori

    variable dependent bisa dua atau lebih, tetapi harus eksklusif dan lengkap. Sedang kan

    untuk variable independent bias dilakukan dengan dua cara :

    1. Dengan mengidentifikasi variable dari penelitian sebelumnya atau dari model teoriyang melatar belakangi pertanyaan dari penelitian tersebut

    2. Menggunakan pengetahuan dan intuisi dari peneliti dalam memilih variable yangtidak ada dalam penelitian atau teori terdahulu. Tetapi secara logis masih ada

    hubungan dengan penentuan variable dependent.

    Analisis diskriminan, seperti umum nya teknik multivariate dipengaruhi oleh banyak

    nya jumlah sampel. Rasio dari 20 penelitian dari tiap variable yang di tentukan, sangat

    direkomendasikan. Dikarenakan hasil penelitian akan tidak stabil jika sampel dikurangi dan

    dihibingkan dengn variable independent, jumlah minimum yang direkomendasikan 5penelitian per independent variable.

    Ukuran sampel terbagi dua yang pertama sampel secara keseluruhan dimana yang

    dilakukan adalah mempertimbangkan hubungan sampel secara keseluruhan. Analisis

    diskriminan merupakan rasio utama terhadap angka prediksi sebuah variabel. Ketika rasio

    sulit untuk di praktekkan, peneliti sebaiknya mencatat hasil yang berpotensi tidak stabil dari

    sebuah sampel yang bersifat relatif dari variabel bebas. Kedua ketika telah mendapatkan

    ukuran sampel secara keseluruhan dilakukan pengambilan sampel per kategori. Minimal

    dari kelompok yang memiliki nilai terendah dari setiap kategori serta harus melebihi nilai

    dari variabel bebas. Variasi yang luas dari sebuah kelompok akan memberikan hasil

    estimasi dari fungsi diskriminasi dan dilakukan klasifikasi observasi. Klasifikasi dilakukan

    untuk melihat tingkatan, kelompok besar yang memiliki tingkat klasifikasi yang tidak

    sebanding.

  • 7/30/2019 Multiple Discriminant Analysis

    4/7

    MULTIPLE DISCRIMINANT ANALYSIS

    Page 4

    Asumsi Dasar Analisis Diskriminan

    Asumsi utama untuk menurunkan fungsi diskriminan adalah normalitas multivariat

    dari variabel independen dan tidak diketahui (tapi sama) dan matriks kovarians dispersi

    untuk kelompok. Data tidak memenuhi asumsi normalitas multivariat dapat menyebabkan

    masalah dalam estimasi fungsi diskriminan. Oleh karena itu, disarankan agar regresi

    logistik digunakan sebagai teknik alternatif, jika memungkinkan.

    Matriks kovarians yang tidak merata dapat mempengaruhi proses klasifikasi. Jika

    ukuran sampel kecil dan matriks kovarians yang tidak sama, maka signifikansi statistik dari

    proses estimasi terpengaruh. Tapi yang lebih mungkin adalah kasus covariances tidak

    setara antara kelompok ukuran sampel yang memadai, dimana pengamatan yang

    "overclassified" ke dalam kelompok-kelompok dengan matriks kovarians yang lebih besar.

    Karakteristik lain dari data yang dapat mempengaruhi hasil adalah

    multikolinearitas antar variabel independen. Akhirnya, suatu asumsi implisit adalah bahwa

    semua hubungan yang linear. Hubungan nonlinier tidak tercermin dalam fungsi diskriminan

    kecuali transformasi variabel khusus dibuat untuk mewakili efek nonlinier.

    Dua Pendekatan Analisis Diskriminan1. Pendekatan Estimasi Simultan

    Estimasi simultan melibatkan perhitungan diskriminan fungsi sehingga semua variabel

    independen dianggap bersamaan. Dengan demikian fungsi diskriminan dihitung

    berdasarkan set variabel independen keseluruhan, terlepas dari kekuatan diskriminatif

    dari masing-masing variabel independen. Metode simultan sesuai jika, untuk alasan

    teoritis, analis ingin memasukkan semua variabel independen dalam analisis dan tidak

    tertarik melihat hasil antara didasarkan hanya pada variabel yang paling diskriminatif.

    2. Pendekatan Estimasi StepwiseEstimasi Stepwise adalah sebuah alternatif untuk pendekatan simultan. Ini melibatkan

    memasukkan variabel independen ke dalam satu fungsi diskriminan pada waktu atas

    dasar kekuasaan diskriminatif mereka. Prosedur stepwise dimulai dengan memilih

    variabel pembeda tunggal terbaik. Variabel awal kemudian dipasangkan dengan

    masing-masing variabel independen lain satu per satu, dan variabel yang paling

  • 7/30/2019 Multiple Discriminant Analysis

    5/7

    MULTIPLE DISCRIMINANT ANALYSIS

    Page 5

    mampu meningkatkan kekuatan diskriminatif dari fungsi dalam kombinasi dengan

    variabel pertama dipilih. Akhirnya, baik semua variabel independen akan dimasukkan

    dalam fungsi atau variabel dan mengecualikan variable yang dinilai tidak memberikan

    kontribusi signifikan terhadap diskriminasi lebih jauh.

    Klasifikasi Matriks

    Klasifikasi matriks adalah sebuah matriks yang berisi angka-angka yang

    mengungkapkan kemampuan prediktif dari fungsi diskriminan. Angka-angka pada

    diagonal dari matriks tersebut merupakan jumlah dari klasifikasi yang benar, dengan

    off-diagonalmewakili angka misclassifications (kesalahan klasifikasi).

    Sebelum matriks klasifikasi dapat dibangun, namun, analis harus menentukan

    kelompok untuk menetapkan masing-masing individu. Jika kita memiliki dua kelompok

    (A dan B) dan fungsi diskriminan untuk setiap kelompok (ZA dan ZB) akan ditetapkan

    setiap individu ke dalam kelompok yang memiliki skor diskriminan lebih tinggi.

    Solusi optimal juga harus mempertimbangkan resiko kesalahan klasifikasi individu ke

    dalam kelompok yang salah. Jika resiko dari kesalahan klasifikasi individu kurang lebih

    sama, maka solusi optimal lah yang akan membuat kesalahan klasifikasi dari jumlah

    individu paling sedikit dalam setiap kelompok. Jika resiko kesalahan klasifikasi yangtidak sama, solusi optimal akan menjadi salah satu yang meminimalkan biaya

    kesalahan klasifikasi.

    Jika analis ragu apakah proporsi yang diamati dalam sampel telah mewakili dari

    proporsi populasi, maka probabilitas yang sama harus digunakan. Namun, jika sampel

    acak diambil dari populasi dengan tujuan kelompok tersebut mampu memperkirakan

    proporsi populasi dari masing-masing kelompok, maka estimasi terbaik dari ukuran

    kelompok sebenarnya dan probabilitas sebelumnya karena tidak sama tapi,

    sebaliknya, proporsi sampel.

    Untuk memvalidasi fungsi diskriminan melalui penggunaan matriks klasifikasi, sampel

    seharusnya secara acak dibagi menjadi dua kelompok. Salah satu kelompok (sampel

    analisis) digunakan untuk menghitung fungsi diskriminan. Kelompok lain

    (ketidaksepakatan, atau sampel validasi) masih dipertahankan untuk digunakan dalam

    mengembangkan matriks klasifikasi. Prosedur ini melibatkan mengalikan bobot yang

    dihasilkan oleh analisis sampel dengan pengukuran variabel baku dari sampel

  • 7/30/2019 Multiple Discriminant Analysis

    6/7

    MULTIPLE DISCRIMINANT ANALYSIS

    Page 6

    ketidaksepakatan. Kemudian nilai diskriminan individu untuk sampel ketidaksepakatan

    dihitung dan setiap individu diberikan kepada kelompok yang memiliki skor diskriminan

    lebih tinggi.

    Sebuah uji statistik untuk kekuatan diskriminatif dari matriks klasifikasi Press Q

    statistik. Ini ukuran sederhana membandingkan jumlah klasifikasi yang benar dengan

    ukuran sampel total dan jumlah kelompok. Nilai yang dihitung kemudian dibandingkan

    dengan kritis nilai dari distribusi Chi-Square dengan 1 derajat

    kebebasan. Jika nilai ini melebihi nilai kritis, matriks klasifikasi dapat dianggap statistik

    lebih baik daripada kesempatan. Statistik Q dihitung dengan rumus berikut:

    Dimana, N: Jumlah ukuran sampel

    n: jumlah penelitian yang di klasifikasi secara benar

    K: Jumlah Kelompok

    Mengidentifikasi Variabel Independen dengan menggunakan Diskriminan

    Terdapat 3 metode untuk menentukan kepentingan relatif antara lain :

    a. Memberikan bobot standar diskriminanb. Diskriminan loading (korelasi struktur)c. Nilai F parsial

    Dalam pendekatan tradisional untuk menginterpretasikan fungsi diskriminan

    dilakukan pemeriksaan tanda dan besarnya jarak bobot standar diskriminan untuk

    menugaskan perhitungan ke masing-masing variabel terhadap fungsi diskriminan.

    Variabel bebas dengan bobot relative memberikan kontribusi lebih untuk kekuatan

    fungsi diskriminan dibanding variabel yang memiliki bobot terkecil. Sebuah tanda

    menunjukan variabel yang dihasilkan memiliki kontribusi bernilai positif atau negatif.

    Diskriminan loading adalah peningkatan interpretasi karena adanya defisiensi

    bobot pemanfaatan. Menilai korelasi linier sederhana antara masing-masing variabel

    bebas dan fungsi diskriminan. Diskriminan loading menggambarkan varians atas

    variabel bebas yang digabung dengan fungsi diskriminan.

  • 7/30/2019 Multiple Discriminant Analysis

    7/7

    MULTIPLE DISCRIMINANT ANALYSIS

    Page 7

    PenggunaanPendekatan Sampel Acak Untuk Menentukan Validasi

    Pembenaran untuk membagi sampel ke dalam dua kelompok adalah bahwa bias

    yang semakin meningkat akan terjadi dalam akurasi prediksi dari fungsi diskriminan

    jika individu yang digunakan dalam mengembangkan matriks klasifikasi yang sama

    dengan yang digunakan dalam menghitung fungsi. Implikasi dari ini bias ke atas

    sangat penting ketika peneliti berkaitan dengan validitas eksternal dari temuan.

    Peneliti lain telah menyarankan, bagaimanapun, bahwa keyakinan yang lebih

    besar dapat ditempatkan dalam validitas fungsi dengan mengikuti prosedur ini

    beberapa kali. Peneliti secara acak akan membagi sampel ke analisis dan mengolah

    sampel tersebut bebrapa kali, setiap kali pengujian validitas fungsi melaluipengembangan klasifikasi matriks dan menghasilkan rasio. Kemudian hasil rasio

    tersebut beberapa akan dirata-ratakan untuk mendapatkan ukuran tunggal.

    Pilihan lain adalah U-metode, yang didasarkan pada prinsip "leaveone-out", di

    mana fungsi diskriminan dipasang untuk sampel berulang kali diambil dari populasi

    asli. Sebuah dataset dengan 100 pengamatan akan melibatkan 100 analisis

    diskriminan yang berbeda yang dilakukan, masing-masing pada 99 dari 100 observasi.

    Setiap kali fungsi diskriminan dihitung, dan akan digunakan untuk mengklasifikasikan

    pengamatan sisa yang tidak terlibat dalam perhitungan fungsi. Ini adalah metode

    CROSSVALIDATE dilakukan di SAS.