Upload
ngongoc
View
220
Download
0
Embed Size (px)
Citation preview
19/04/2016
1
STATISTIKA INDUSTRI 2
TIN 4004
Pertemuan 10
• Outline:– Multiple Linear Regression and Correlation– Non Linear Regression
• Referensi:– Montgomery, D.C., Runger, G.C., Applied Statistic
and Probability for Engineers, 5th Ed. John Wiley & Sons, Inc., 2011.
– Walpole, R.E., Myers, R.H., Myers, S.L., Ye, K., Probability & Statistics for Engineers & Scientists , 9th
Ed. Prentice Hall, 2012.
Multiple Linear Regression
• Terdiri atas lebih dari satu independent variable
• Metode yang digunakan untuk estimasi koefisien:– Least square estimation (metode kuadarat
terkecil)
– Normal equation (Persamaan Normal)
– Matrix approach (Sistem Matriks)
Multiple Linear Regression
• Terdiri atas lebih dari satu independent variable
• Metode yang digunakan untuk estimasi koefisien:– Least square estimation (metode kuadarat
terkecil)
– Normal equation (Persamaan Normal)
– Matrix approach (Sistem Matriks)
Multiple Linear RegressionMultiple Linear Regression
Estimator of Variance
• Residual:
– the difference between the observation 𝑦𝑖 dengan nilai 𝑦𝑖
–
19/04/2016
2
Multiple Linear RegressionEstimator of Variance
• Residual:
– Contoh soal:
Multiple Linear RegressionEstimator of Variance
• Variance Estimator
Error atauResidual Sum of Squares
Multiple Linear RegressionEstimator of Variance
• Variance Estimator
Contoh soal:
𝜎2 = 𝑠2 =? ? ? ?
Interval Keyakinan Bagi pendugaB1 dan B2
SI 2 - Regresi & Korelasi Berganda
10
Pengujian menggunakan distribusi t dengan derajat bebas (db) = n – m, Dengan contoh soal sebelumnya, dgn ∝ =5%, db = n – m = n – k -1 = 10 – 2 - 1 = 7, maka:
Interval keyakinan bagi penduga B1 adalah
b1 – t(α/2, n-k-1).Sb1< B1 < b1 + t(α/2, n-k-1).Sb1
0,564 – (2,365)(0,303) < B1 < 0,564 + (2,365)(0,303)
-0,153 < B1 < 1,281
Interval keyakinan bagi penduga B2 adalah
b2 – t(α/2, n-k-1).Sb2 < B2 < b2 + t(α/2, n-k-1).Sb2
1,099 – (2,365)(0,313) < B2 < 1,099 – (2,365)(0,313)
0,359 < B2 < 1,839
Pengujian Parameter KoefisienRegresi Berganda
SI 2 - Regresi & Korelasi Berganda
11
Bertujuan untuk menentukan apakah ada sebuah hubungan linear antarvariabel tidak bebas Y dengan variabel bebas X1, X2,… ,Xk.
Ada 2 bentuk pengujian hipotesis bagi koefisien regresi berganda:1. Pengujian hipotesis serentak2. Pengujian hipotesis individual
Pengujian Hipotesis SerentakMerupakan pengujian hipotesis koefisien regresi berganda dengan B1 danB2 serentak atau secara bersama-sama mempengaruhi Y.
Pengujian Hipotesis individualMerupakan pengujian hipotesis koefisien regresi bergandadengan hanya satu B (B1 atau B2 ) yang mempengaruhi Y.
Pengujian Hipotesis Serentak
Langkah-langkah pengujian:1. Menentukan formulasi hipotesis
» H0 : B1 = B2 = 0 (X1 dan X2 tidak mempengaruhi Y)
» H1 : B1 B2 0 (X1 dan X2 mempengaruhi Y ataupaling tidak ada X yang mempengaruhi Y
2. Menentukan taraf nyata () dan nilai F tabel
» Taraf () dan nilai F tabel ditentukan dengan derajat bebas1 = k dan 2 = n - k -1
SI 2 - Regresi & Korelasi Berganda
12
F(1)(2) = …….
19/04/2016
3
Pengujian Hipotesis Serentak - lanjutan
Langkah-langkah pengujian:
3. Menentukan kriteria pengujian
H0 diterima jika F0 ≤ F(1)(2)
H0 ditolak jika F0 > F(1)(2)
4. Menentukan nilai uji statistik dengan tabel ANOVA
SI 2 - Regresi & Korelasi Berganda
13
Sumber
Variasi
Jumlah
Kuadrat
Derajat
Bebas
Rata-rata
Kuadrat
F0
Regresi
(X1, X2)
Error
JKR
JKE
k
n – k - 1
JKRk
JKEn - k -1
RKR
RKE
Total JKT n - 1
Pengujian Hipotesis Serentak - lanjutan
SI 2 - Regresi & Korelasi Berganda
14
∑ -=∑=222 YnYyJKT yxbyxbJKR 2211
( ) ( )∑ ∑-+∑ -= YXnYXbYXnYXbJKR 222111
JKE = JKT - JKR
Selain menggunakan tabel ANOVA di atas, nilai Fo dapat pula ditentukan denganmenggunakan rumus:
)3(
12
0
n
KPB
KPB
F
Dimana:KPB = (R2) = koefisien penentu atau koefisien determinasi bergandan = jumlah sampel
atau
Pengujian Hipotesis Serentak - lanjutan
KPB = (R2) = koefisien penentu atau koefisiendeterminasi berganda
5. Membuat kesimpulanMenyimpulkan apakah H0 diterima atau ditolak
SI 2 - Regresi & Korelasi Berganda
15
𝑅2 =𝑏1 𝑥1𝑦 + 𝑏2 𝑥2𝑦
𝑦2
Pengujian Hipotesis Individual
Langkah-langkah pengujian:1. Menentukan formulasi hipotesis
H0 : Bi = 0 (tidak ada pengaruh Xi terhadap Y)
H1 : Bi > 0 (ada pengaruh positif Xi terhadap Y)
Bi < 0 (ada pengaruh negatif Xi terhadap Y)
Bi ≠ 0 (ada pengaruh Xi terhadap Y)
2. Menentukan taraf nyata () dan nilai t tabel
db = n – k – 1
SI 2 - Regresi & Korelasi Berganda
16
Pengujian Hipotesis Individual - lanjutan
Langkah-langkah pengujian:3. Menentukan kriteria pengujian
H0 diterima jika t0 ≥ t (n-m)
H0 ditolak jika t0 < t (n-m)
4. Menentukan nilai uji statistik
5. Membuat kesimpulan
SI 2 - Regresi & Korelasi Berganda
17
Latihan
• Coba uji secara 2 arah parameter B1 dan B2 dengan menggunakan taraf nyata sebesar = 0,05 dari soal di atas secara individual maupunserentak!
SI 2 - Regresi & Korelasi Berganda
18
19/04/2016
4
Jawab (pengujian individual)
1. Menentukan formulasi hipotesis
H0 : B1 = 0 (tidak ada pengaruh X1 terhadap Y)
H1 : B1 ≠ 0 (ada pengaruh X1 terhadap Y)
Dan
H0 : B2 = 0 (tidak ada pengaruh X2 terhadap Y)
H1 : B2 ≠ 0 (ada pengaruh X2 terhadap Y)
2. Menentukan taraf nyata () dan nilai t tabel
∝ = 0,05
derajat bebas = 10 – 3 =7
t (0,025;7) = 2,365
SI 2 - Regresi & Korelasi Berganda
19
Jawab (pengujian individual)- lanjutan
3. Menentukan kriteria pengujianH0 diterima jika ti < t (0,025;7) = 2,365 dan ti > t (0,025;7) = - 2,365
H0 ditolak jika ti > t (0,025;7) = 2,365 dan ti < t (0,025;7) = - 2,365
4. Menentukan nilai uji statistik
Untuk uji B1 Untuk uji B2
SI 2 - Regresi & Korelasi Berganda
20
Jawab (pengujian individual)- lanjutan
5. Kesimpulan
Karena t1
1,859 < 2,365
Maka terima hipotesis H0 : B1 = 0
Karena t2
3,511 > 2,365
Maka tolak Ho : B2 = 0
Berarti:
tidak ada hubungan linier antara variabel X1 dgn Y
ada hubungan linier antara variabel X2 dgn Y
SI 2 - Regresi & Korelasi Berganda
21
Multiple Linear RegressionCorrelation
Multiple Linear RegressionCorrelation
• Coefficient of multiple determination 𝑅2
• Adjoint 𝑅2
Multiple Linear RegressionMulticollinearity
• strong dependencies among regressor variables 𝑥𝑗– The estimates of the regression coefficients are
very imprecise and affects the stability of the regression coefficients.
– To detect: • Variance inflation factors > 1
• Significant F-test of significance of regression, but tests on the individual regression coefficients are not significant
19/04/2016
5
Multiple Linear RegressionUji Hipotesa
• Uji Koefisien Subset
– Test the siginificance of a set of variables. Test contribution of new variables.
– Menggunakan uji F
Partial F-test
– Area Penolakan: 𝒇 > 𝒇𝜶(𝒗𝟏=𝒓,𝒗𝟐=𝒏−𝒑)
𝒇 =𝑺𝑺𝑹(𝜷𝒋|𝜷𝟎, 𝜷𝟏, … , 𝜷𝒋−𝟏, 𝜷𝒋+𝟏, … , 𝜷𝒌)/𝒓
𝑺𝑺𝑬/(𝒏 − 𝒑)
=(𝑺𝑺𝑹 𝜷𝟏, 𝜷𝟐, … , 𝜷𝒌 𝜷𝟎 −𝑺𝑺𝑹 𝜷𝒋 𝜷𝟎 )/𝒓
𝒔𝟐
Multiple Linear RegressionUji Hipotesa
• Uji Koefisien Subset
– Contoh: Kasus Wire Bond Strength
𝒇 =𝟑𝟑. 𝟐/𝟐
𝟒. 𝟏= 𝟒. 𝟎𝟓
NOTE: partial F-test to a single variable = t-test
General Linear Model (GLM)
• GLM is the mathematical framework used in many common statistical analysis, including multiple regression and ANOVA
– ANOVA is typically prsented as distinct from multiple regression but it IS a multiple regression
Characteristics of GLM
• Linear, pairs of variables are assumed to have linear relations
• Additive, if one set of variables predict another variable, the effect are thought to be additive
• BUT! This does not preclude testing non-linear or non additive effects (by doing some transformations)
Analysis of Variance (ANOVA)
• Appropriate when the predictors (independent variables) are all categorical and the outcome (dependent variable) is continous– Most common application is to analyze data from
randomized experiments
• More specifically, randomized experiments that generate more than 2 means– If only 2 means thes use:
• Independent t-test
• Dependent (paired) t-test
19/04/2016
6
NONLINEAR REGRESSION
Nonlinear Regression
Beberapa Jenis Nonlinear Regression:
• Polynomial Regression Models
– Bersifat curvilinear
• Logistic Regression
– For non normal distribution data, binary responses
TUGAS KELOMPOK
• Cari kasus permasalahan yang diselesaikan dengan:– Multiple Linear Regression
– Non Linear Regression
• Selesaikan dengan menggunakan software statistik
• Interpretasikan hasil output software tersebut
• Catatan:– Kasus yang digunakan tidak boleh sama antar
kelompok