Upload
others
View
6
Download
0
Embed Size (px)
Citation preview
CORRELATION & REGRESSION
STATISTIKA TEKNIK LNK2016
! Correlation is a statistical method used to determine whether a relationship between variables exists.
! Regression is a statistical method used to describe the nature of the relationship between variables, that is, positive or negative, linear or nonlinear.
! The purpose of this chapter is to answer these questions statistically:
! 1. Are two or more variables related? ! 2. If so, what is the strength of the relationship? ! 3. What type of relationship exists? ! 4. What kind of predictions can be made from the
relationship?
KORELASI
! Korelasi menyatakan derajat hubungan antara dua variabel tanpa memperhatikan variabel mana yang menjadi peubah.
! Karena itu hubugan korelasi belum dapat dikatakan sebagai hubungan sebab akibat
Analisis korelasi
q Analisis korelasi bertujuan untuk mengukur kekuatan asosiasi (hubungan) linear antara dua variabel.
q VARIABLE X DAN Y BERKEDUDUKAN SAMA, BISA DITUKARKAN X BISA MEMPENGARUHI Y, DAN SEBALIKNYA
q Korelasi tidak menunjukkan hubungan fungsional atau dengan kata lain, analisis korelasi tidak membedakan antara variabel dependen dengan variabel independen.
! correlation coefficient : a measure that REPRESENTS strength of the relationship between or among the variables.
! There are two types of relationships: ! simple and multiple.
! In a simple relationship, there are two variables ! —an independent variable, also called an explanatory variable or a predictor
variable, and
! -- a dependent variable, also called a response variable.
! A simple relationship analysis is called simple regression, and there is one independent variable that is used to predict the dependent variable.
! In a multiple relationship, called multiple regression, two or more independent variables are used to predict one dependent variable. This type of study involves several variables.
! Simple relationships can also be positive or negative.
! A positive relationship exists when both variables increase or decrease at the same time.
! For instance, a person’s height and weight are related; and the relationship is positive, since the taller a person is, generally, the more the person weighs.
! In a negative relationship, as one variable increases, the other variable decreases, and vice versa.
! For example, if you measure the strength of people over 60 years of age, you will find that as age increases, strength generally decreases. The word generally is used here because there are exceptions.
! Some predictions are more accurate than others, due to the strength of the relationship.
! That is, the stronger the relationship is between variables, the more accurate the prediction is.
Scatter Plots and Correlation
The possibilities include a positive linear relationship, a negative linear relationship, a curvilinear relationship, or no discernible relationship.
examples
POSITIVE RELATION-SHIP TEND TO LINEAR
Exam
ple 2
NEGATIVE RELATION-SHIP TEND TO LINEAR
Exam
ple 3
NO PATTERN NO SPECIFIC RELATIONSHIP
KOEFISIEN KORELASI
u Koefisien Korelasi à ukuran seberapa kuat hubungan antara dua variable atau lebih
u Macam Koefisien Korelasi u Pearson Product Moment (Korelasi
Pearson) : (untuk data variable berskala interval atau rasio)
u Korelasi Spearman/Korelasi Kendall : untuk data yg diolah dari hasil pengamatan/berskala nominan/ordinal
STRONG POSITIF LINEAR RELATIONSHIP è 0 TO +1 NO LINEAR RELATIONSHIP è = 0 STRONG NEGATIVE LINEAR RELATIONSHIP è 0 TO -1
COEFFICIENT CORRELATION
! Dalam analisis regresi, selain mengukur kekuatan hubungan antara dua variabel atau lebih, juga menunjukkan arah hubungan antara variabel dependen dengan variabel independen.
! Variabel dependen diasumsikan random/stokastik, yang berarti mempunyai distribusi probabilistik.
! Variabel independen/bebas diasumsikan memiliki nilai tetap (dalam pengambilan sampel yang berulang)
Korelasi Pearson
Interpretasi Koefisien Korelasi
q Nilai koefisien korelasi terletak antara -‐1 dan +1
q Semakin besar nilai absolut koefisien korelasi, maka semakin kuat hubungan liniernya
q Semakin lemah kekuatan hubungannya, maka nilai koef korelasi semakin mendekati nol
q Nilai korelasi positif artinya bila satu variable meningkat nilainya, maka variable lainnya akan ikut meningkat
q Nilai korelasi negatif artinya bila satu variable nilainya membesar, maka variable lainnya menurun.
q Koef korelasi pearson hanya ukuran kuat lemahnya hubungan. Korelasi 0 belum tentu berarti tidak ada hubungan
TARAF SIGNIFIKANSI : • Adalah suatu formasi yang ditetapkan oleh peneliti/penulis. • Disimbolkan dengan : α • Disesuaikan dengan isu/topik kajian dan tuntutan akurasi
data • Sesuai alasan pertimbangan yang rasional;
• Untuk bidang eksakta/teknik α = 5% = 0,05
bILA PROBAILITAS < α (< 5%) MAKA H0 DITOLAK DAN HA diterima
UJI HIPOTESIS
POSITIVE STRONG RELATIONSHIP
NEGATIVE STRONG RELATIONSHIP
POSITIVE WEAK RELATIONSHIP
REGRESSION
! If the value of the correlation coefficient is significant, the next step is to determine the equation of the regression line, which is the data’s line of best fit.
! (Note: Determining the regression line when r is not significant and then making predictions using the regression line are meaningless.)
! The purpose of the regression line is to enable the researcher to see the trend and make predictions on the basis of the data.
• Regresi à alat ukur yang juga digunakan untuk mengukur ada atau tidaknya korelasi antar variabelnya.
• Istilah regresi itu sendiri berarti ramalan atau taksiran.
• Persamaan yang digunakan untuk mendapatkan garis regresi pada data diagram pencar disebut persamaan regresi.
• Untuk menempatkan garis regresi pada data yang diperoleh maka digunakan metode kuadrat terkecil, sehingga bentuk persamaan regresi adalah sebagai berikut: Y’ = a + b X
ANALISIS REGRESI
! HAMPIR SAMA DENGAN ANALISIS KORELASI
! TUJUAN : MELIHAT HUBUNGAN SATU ARAH ANTAR VARIABLE YANG LEBIH KHUSUS, DIMANA VARIABLE X BERFUNGSI SBG VARIABLE BEBAS (YANG MEMPENGARUHI) DAN VARIABLE ADALAH VARIABLE TERIKAT (YANG DIPENGARUHI)
! X à VARIABLE DEPENDEN, Yà INDEPENDEN
! VARIABLE X DAN Y BERKEDUDUKAN SAMA, BISA DITUKARKAN X BISA MEMPENGARUHI Y, DAN SEBALIKNYA
! HUBUNGAN (ATAU PENGARUH) DLM ANALISIS REGRESI DITUNJUKKAN DALAM BENTUK GARIS LURUS (PLOTTING DATA VARIABEL)
! UNTUK MEYAKINKAN BAHWA MODEL PILIHAN ADALAH LINIER, TERLEBIH DAHULU BUAT SCATTER PLOT (PLOT HUB X DAN Y APAKAH CENDERUNG MEMBENTUK GARIS LURUS)
! ASUMSIKAN KENORMALAN (ERROR)-‐ TANPA UJI NORMALITAS, KARENA VARIABEL X BESARAN YG DITENTUKAN (BUKAN ACAK)
! MODEL REGRESI : PERSAMAAN : Y’ = a + b X
! ARTINYA SETIAP SATU NILAI VARIABEL X , MAKA NILAI VARIABEL Y DAPAT DIPREDIKSI MENGGUNAKAN PERSAMAAN TSB
! MODEL PILIHAN LINIER TIDAK MUTLAK. BILA SCATTER PLOT TIDAK MENUNJUKKAN KECENDERUNGAN LINIER, MAKA MODEL DENGAN POLA LAIN DAPAT DIRUMUSKAN.
PERSAMAAN REGRESI
! HUBUNGAN (ATAU PENGARUH) DLM ANALISIS REGRESI DITUNJUKKAN DALAM BENTUK GARIS LURUS (PLOTTING DATA VARIABEL)
! UNTUK MEYAKINKAN BAHWA MODEL PILIHAN ADALAH LINIER, TERLEBIH DAHULU BUAT SCATTER PLOT (PLOT HUB X DAN Y APAKAH CENDERUNG MEMBENTUK GARIS LURUS)
! ASUMSIKAN KENORMALAN (ERROR)-‐ TANPA UJI NORMALITAS, KARENA VARIABEL X BESARAN YG DITENTUKAN (BUKAN ACAK)
! MODEL REGRESI : PERSAMAAN : Y’ = a + b X
! ARTINYA SETIAP SATU NILAI VARIABEL X , MAKA NILAI VARIABEL Y DAPAT DIPREDIKSI MENGGUNAKAN PERSAMAAN TSB
! MODEL PILIHAN LINIER TIDAK MUTLAK. BILA SCATTER PLOT TIDAK MENUNJUKKAN KECENDERUNGAN LINIER, MAKA MODEL DENGAN POLA LAIN DAPAT DIRUMUSKAN.
DARI PERSAMAAN REGRESI Y’ = a + b X • Nilai konstan (a) è nilai nol untuk variable observasi x
(negatif or positif) • Bilai nilai x jauh dari 0 maka nilai tersebut hanya
merupakan ekstrapolasi (penaksiran diluar jangkauan) • Nilai (b) merupakan koefisien regresi, nilai tersebut
menunjukkan kemiringan garis lurus yang ditemukan. • Makna nilai b, setiap x bertambah satu satuan,maka y
akan bertambah menjadi b kali satuan pengukuran
• Kesamaan di antara garis regresi dan garis trend tidak dapat berakhir dengan persamaan garis lurus.
• Garis regresi (seperti garis trend dan nilai tengah aritmatika) memiliki dua sifat matematis berikut : Σ(Y – Y’) = 0 dan Σ(Y – Y’)2 = nilai terkecil atau terendah.
• Dengan perkataan lain, garis regresi akan ditempatkan pada data dalam diagram sedemikian rupa sehingga penyimpangan (perbedaan) positif titik-titik terhadap titik-titik pencar di atas garis akan mengimbangi penyimpangan negatif titik-titik pencar yang terletak di bawah garis, sehingga hasil penyimpangan keseluruhan titik-titik terhadap garis lurus adalah nol.
KOEFISIEN DETERMINASI (R2)
! R2 è PROPORSI DARI VARIAN VARIABLE DEPENDEN, BAHWA VARIABLE DEPENDEN DAPAT DIPERJELAS OLEH VARIABEL INDEPENDEN SEBESAR NILAI KOEFISIEN DETERMINASI TERSEBUT
! RUMUS KOEF KORELASI:
KOEFISIEN DETERMINASI è R2 = R * R
SIFAT SIFAT KOEFISIEN DETERMINASI
v NILAI R2 è ANTARA 0 SAMPAI DENGAN 1
v R2 = 0 à VARIABEL DEPENDEN TIDAK DAPAT DITAFSIRKAN OLEH VARIABLE INDEPENDEN
v R2 =1 (100%) è VARIABEL DEPENDEN DAPAT DITAFSIRKAN OLEH VARIABEL INDEPENDEN SECARA SEMPURNA TANPA ERROR
v UNTUK 0 < R2 < 1 è CONTOH R2 = 0,6 = 60%, ARTINYA : VARIABEL DEPENDEN (Y) DPT DITAFSIR ATAU DIJELASKAN OLEH VARIBBEL X SEBESAR 60%, DAN 40% LAINNYA TIDAK DAPAT DIJELASKAN OLEH VARIABEL X, TAPI DAPAT DIJELASKAN OLEH VARIABLE INDEPENDEN LAIN YANG TIDAK DIAMATI.
CONTOH
DATA X = KUALITAS PELAYANAN, Y = VOLUME PENJUALAN PRODUK
TENTUKAN A. Nilai korelasi dan determinasi B. Persamaan Regresi Sederhana C. Analisis dan Kesmpulan
hasil
! Given a scatter plot, you must be able to draw the line of best fit.
! Best fit means that the sum of the squares of the vertical distances from each point to the line is at a minimum.
! The reason you need a line of best fit is that the values of y will be predicted from the values of x; hence, the closer the points are to the line, the better the fit and the prediction will be.