Upload
phamminh
View
226
Download
0
Embed Size (px)
Citation preview
D3 Komputer dan Sistem Informasi
MODUL D3 KOMSI
Praktikum Statistika
dan
Penyajian Data
(Rahma Dewi Permana, S.Si.)
Laboratorium Komputer
D3 Komputer dan Sistem Informasi
Diploma Informatika dan Instrumentasi
Sekolah Vokasi
Universitas Gadjah Mada
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 2
DAFTAR ISI
Praktikum Statistika ................................................................................................................... 1
DAFTAR ISI .............................................................................................................................. 2
BAB I ......................................................................................................................................... 4
1.1. Pendahuluan ................................................................................................................ 4
1.2. Paket Program R.......................................................................................................... 4
1.3. Instalasi R .................................................................................................................... 5
1.3.1. Menginstal R pada sistem operasi Windows ....................................................... 5
1.3.2. Menginstal Rcommander pada sistem operasi Windows ................................... 10
BAB II ...................................................................................................................................... 13
2.1. Pendahuluan .............................................................................................................. 13
2.2. Penggunaan Rcmdr .................................................................................................... 13
2.2.1. Entry data........................................................................................................... 14
2.2.2. Menampilkan data yang sedang aktif ................................................................ 17
2.2.3. Importing data ................................................................................................... 18
2.2.4. Memilih data set yang aktif ............................................................................... 19
2.2.5. Recoding ............................................................................................................ 20
2.2.6. Compute ............................................................................................................. 21
2.2.7. Menghapus variabel pada dataset ...................................................................... 23
2.2.8. Menghapus baris pada dataset ........................................................................... 24
2.3. Latihan ....................................................................................................................... 25
BAB III .................................................................................................................................... 26
3.1. Pendahuluan .............................................................................................................. 26
3.2. Ringkasan Numerik ................................................................................................... 26
3.2.1. Contoh 1 ............................................................................................................. 26
3.2.2. Contoh 2 ............................................................................................................. 28
3.3. Penyajian Data........................................................................................................... 30
3.3.1. Diagram batang dan daun (steam and leaf plot) ................................................ 30
3.3.2. Boxplot (diagram kotak dan titik) ...................................................................... 32
3.3.3. Histogram ........................................................................................................... 34
3.4. Latihan ....................................................................................................................... 35
BAB IV .................................................................................................................................... 37
4.1. Pendahuluan .............................................................................................................. 37
4.2. Distribusi Frekuensi .................................................................................................. 40
4.3. Penyajian Data Kategori............................................................................................ 41
4.4. Latihan ....................................................................................................................... 42
BAB V ..................................................................................................................................... 44
5.1. Pendahuluan .............................................................................................................. 44
5.2. Contoh ....................................................................................................................... 46
5.3. Latihan ....................................................................................................................... 50
BAB VI .................................................................................................................................... 51
6.1. Distribusi Normal ...................................................................................................... 51
6.1.1. Membangkitkan data berdistribusi normal ........................................................ 52
6.1.2. Menghitung quantil (z tabel) .............................................................................. 52
6.1.3. Menghitung probabilitas (p-value) .................................................................... 54
6.2. Distribusi Student-t .................................................................................................... 56
6.2.1. Membangkitkan data berdistribusi student-t ...................................................... 57
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 3
6.2.2. Menghitung quantil (t tabel) .............................................................................. 57
6.2.3. Menghitung probabilitas (menghitung (p_value)) ............................................. 58
6.3. Latihan ....................................................................................................................... 59
BAB VII ................................................................................................................................... 60
7.1. Uji Proporsi Satu Populasi ........................................................................................ 60
7.2. Uji Proporsi Dua Populasi ......................................................................................... 62
7.3. Latihan ....................................................................................................................... 64
BAB VIII ................................................................................................................................. 65
8.1. Pendahuluan .............................................................................................................. 65
8.2. Inferensi Statistik untuk Mean Populasi Normal ...................................................... 65
8.2.1. Uji hipotesis ....................................................................................................... 65
8.2.2. Interval konfidensi ............................................................................................. 66
8.3. Latihan ....................................................................................................................... 68
BAB IX .................................................................................................................................... 70
9.1. Uji Hipotesis Mean 2 Populasi Independen (Uji Independen sample t test) ............. 70
9.2. Uji Hipotesis Mean 2 Populasi Dependen (Uji Paired t test) ................................... 75
9.3. Latihan ....................................................................................................................... 79
BAB X ..................................................................................................................................... 81
10.1. Pendahuluan........................................................................................................... 81
10.2. Asumsi dalam Anova............................................................................................. 81
10.3. Uji Anova Satu Arah ............................................................................................. 82
10.4. Uji Perbandingan Ganda ........................................................................................ 83
10.5. Latihan ................................................................................................................... 93
BAB XI .................................................................................................................................... 95
11.1. Pendahuluan........................................................................................................... 95
11.2. Uji Simultan ( Over all test ) dalam Regresi ......................................................... 96
11.3. Uji Koefisien regresi ( uji parsial ) ........................................................................ 96
11.4. Contoh ................................................................................................................... 97
11.5. Latihan ................................................................................................................. 103
DAFTAR PUSTAKA ............................................................................................................ 104
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 4
BAB I
PAKET PROGRAM PENGOLAH DATA
Tujuan Praktikum
a. Praktikan dapat mengenal program R (RGUI dan Rcmdr)
b. Praktikan dapat menginstal program R
1.1. Pendahuluan
Statistika merupakan salah satu ilmu penunjang ilmu-ilmu lainnya terutama dalam
merumuskan kesimpulan suatu permasalahan penelitian. Begitu juga teknologi komputer
juga merupakan penunjang utama dalam bidang-bidang ilmu lain. Seiring dengan kemajuan
teknologi komputer, paket program untuk aplikasi statistika juga semakin maju. Perhitungan-
perhitungan yang dulu memerlukan waktu yang cukup lama, sekarang dapat dikerjakan
dengan cepat, mudah, dan akurat, serta mampu menangani data dengan jumlah sampel dan
variabel yang sangat besar. Saat ini, cukup banyak paket program pengolah data statistik,
baik yang bersifat komersial ataupun bersifat free, di antaranya:
a. Komersial
SPSS dan semua produk terkait, Minitab, STATA, Microstat, SAS, BMDP, Genstat,
Statistica, Splus, dll.
General Purpose : Matlab, Maple, C/C++, Fortran, Java, dll.
Problem: Harga lisensi sangat mahal, bahkan upgrade harus mengeluarkan biaya
besar, source code bersifat rahasia dan “bug” sulit di track.
b. Open Source
SPSS-Like : Open Stat
VISTA
Splus Clone : R
Pada praktikum ini hanya akan dibahas penggunaan software R untuk analisis statistika dasar.
1.2. Paket Program R
R adalah bahasa pemrograman dan perangkat lunak untuk analisis statistika dan grafik
R. R dibuat oleh Ross Ihaka dan Robert Gentleman di Universitas Auckland, Selandia Baru,
dan kini dikembangkan oleh R Development Core Team. Bahasa R kini digunakan
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 5
statistikawan untuk pengembangan perangkat lunak statistika, serta digunakan secara luas
untuk pengembangan perangkat lunak statistika dan analisis data.
R menyediakan berbagai teknik statistika (permodelan linier dan nonlinier, uji statistik
klasik, analisis deret waktu, klasifikasi, klasterisasi, dan sebagainya) serta grafik. R,
sebagaimana S, dirancang sebagai bahasa komputer sebenarnya, dan mengizinkan
penggunanya untuk menambah fungsi tambahan dengan mendefinisikan fungsi baru.
Kekuatan besar dari R yang lain adalah fasilitas grafiknya, yang menghasilkan grafik dengan
kualitas publikasi yang dapat memuat simbol matematika.
1.3. Instalasi R
1.3.1. Menginstal R pada sistem operasi Windows
Klik dua kali file R-2.3.2-win.exe yang telah di download melalui internet. Kemudian
akan keluar tampilan sebagai berikut :
Pilih bahasa yang akan digunakan, default pada instalasi program ini adalah English,
kemudian OK.
Klik Next pada jendela dialog di atas dan akan muncul sebagai berikut :
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 6
Klik Next kemudian muncul jendela dialog sebagai berikut :
Jendela dialog di atas digunakan untuk menentukan lokasi instalasi dari R. Di sini
default lokasi instalasinya, yakni pada direktori C:\Program Files\R\R-3.0.2. Jika ingin
mengubah lokasi instalasinya dapat dengan mengklik browse kemudian pilih lokasi yang
diinginkan.
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 7
Default instalasi adalah menggunakan mode 32-bit User instalation. Anda dapat juga
memilih mode instalasi lain. Akan tetapi, mode default di atas sudah cukup untuk keperluan
praktikum kita. Terlihat instalasi mode ini membutuhkan space 75.1 MB dari hard disk.
Selanjutnya klik Next.
Pada jendela dialog di atas kita pilih default kemudian pilih Next.
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 8
Jendela dialog di atas untuk menentukan lokasi shortcut dari program R pada start
menu program. Di sini kita akan menggunakan modus default dari instalasi, yakni shortcut
akan diletakkan pada direktori R. Kemudian pilih Next dan sekali lagi pada jendela dialog
selanjutnya, maka proses instalasi akan dimulai. Silakan menunggu sampai proses instalasi
selesai.
Jika proses telah selesai kemudian akan keluar jendela dialog sebagai berikut :
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 9
Klik Finish pada jendela dialog di atas. Kemudian pada desktop windows dan start menu dari
windows akan terdapat shortcut dari R.
Shortcut dari program R pada desktop windows dapat dilihat pada gambar berikut
Klik dua kali shortcut R pada desktop atau pada start menu kemudian akan muncul tampilan
sebagai berikut :
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 10
1.3.2. Menginstal Rcommander pada sistem operasi Windows
Untuk menginstal Rcommander, pilih menu Packages > Install package(s) from local
zip files .... Kemudian pilih file Rcmdr_2.0-3.zip. Lihat seperti pada jendela dialog berikut
Klik open kemudian paket Rcmdr akan terinstal dan lihat tampilan pada Rconsole.
Tampilan Rconsole akan tampil seperti gambar di bawah ini :
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 11
Pada dialog Rconsole terdapat error dan perlu di instal paket tcltk2. Langkah untuk
menginstal paket tcltk2 sama seperti proses menginstal paket Rcmdr di atas. Kemudian
jalankan paket Rcommander yang dapat dilakukan dengan dua cara, yakni dengan
mengetikkan perintah berikut pada Rconsole :
>library(Rcmdr)
dan menekan Enter satu kali, atau dengan memilih menu Packages>Load package ... dan
memilih Rcmdr pada daftar paket library yang terinstal sebagai berikut :
Tekan OK dan akan muncul seperti ini
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 12
Agar paket Rcmdr dapat berjalan secara sempurna maka perlu diinstal paket-paket
lainnya yang telah tercantum di atas. Proses penginstalan paket-paket tersebut sama seperti
proses penginstalan paket Rcmdr.
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 13
BAB II
MANAJEMEN DATA DENGAN R-GUI
Tujuan Praktikum:
a. Praktikan dapat melakukan manajemen data menggunakan R-Gui
2.1. Pendahuluan
Data processing (entry data, editing dan exporting) merupakan suatu langkah yang
penting dalam melakukan analisis statistika. Ada banyak macam dan ukuran data yang
mampu diolah menggunakan R. Secara umum, paling tidak ada dua macam bentuk data yang
ingin kita olah, yaitu data yang sudah kita miliki yang barangkali ditulis menggunakan
program sheet lain seperti Excel, database, text ataupun program pengolahan data yang lain.
Pada bab ini akan ditunjukkan bagaimana melakukan data processing menggunakan R-Gui.
Akan dibahas cara-cara untuk melakukan entry data, editing data, importing data dan
transformasi data sederhana.
2.2. Penggunaan Rcmdr
Pertama-tama buka paket Rcmdr dengan cara sebagai berikut :
Packages>load packages
Pilih paket Rcmdr kemudian OK.
Selanjutnya akan muncul Rcommander seperti dibawah :
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 14
2.2.1. Entry data
Untuk melakukan entry data klik Data > New data set
Kemudian akan muncul jendela dialog sebagai berikut :
Ketik nama data set misal dengan nama uji1 kemudian klik OK.
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 15
Untuk entry data klik edit data set kemudian akan muncul sebagai berikut :
Sebagai latihan, lakukan entry data berikut ke Rcmdr.
Nama IPK Sks
Ivan 2.4 40
Mely 2.8 42
Rosa 3.5 46
Setia 2.7 42
Mayone 2.9 4o
Lady 3.3 42
Anita 3.1 44
Wanto 2.9 42
Heri 2.2 40
Danu 2.0 38
Keterangan
Nama : nama mahasiswa
IPK : IPK yang diperoleh
Sks : jumlah sks yang telah ditempuh
Ketikkan ketiga variabel (nama, IPK, dan Sks) pada Data editor.
Selanjutnya tampilan Data editor menjadi sebagai berikut :
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 16
Untuk pemberian nama variabel klik pada var1 maka akan muncul :
Tulis nama variabel nama kemudian close. Langkah yang sama digunakan untuk pemberian
nama variabel IPK dan Sks. Pada pemberian nama untuk IPK maka klik var2 kemudian tulis
nama variabelnya dengan IPK, dan pemberian nama untuk Sks maka klik var3 kemudian tulis
nama variabelnya dengan Sks.
Selanjutnya, nama kolom akan berubah sesuai tampilan berikut ini :
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 17
Close Data editor untuk mengakhiri proses entry data. Tampak sekarang pada jendela
Rcommander terlihat data set bernama uji1 saat ini sedang aktif.
2.2.2. Menampilkan data yang sedang aktif
Untuk menampilkan data yang sedang aktif di memori, klik tombol View data set.
Maka jendela data akan dibuka, menampilkan data yang sedang aktif di memori komputer
saat ini, yakni data uji1.
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 18
2.2.3. Importing data
Selain proses entry data, Rcommander juga dapat digunakan untuk melakukan import
data dari format data yang diberikan pada program lain, yakni data dari Excel atau Open
Office.org calc (disimpan dalam format file text/dat/csv), SPSS, MINITAB, dan STATA.
Pada praktikum kali ini, kita akan menggunakan metode importing data dari file notepad.
Entry data nama, BB, dan kalori pada notepad kemudian save dengan nama uji2.txt
dengan tampilan sebagai berikut :
Klik pada Rcommander Data > Import data > from text file, clipboard, or URL...
Kemudian akan muncul tampilan sebagai berikut :
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 19
Tulis nama data set dengan nama uji2 kemudian OK dan akan muncul sebagai berikut :
Pilih file yang akan di import dari folder yang sesuai kemudian klik open.
2.2.4. Memilih data set yang aktif
Untuk memilih data set yang aktif, gunakan menu Data>Active data set>select active
set …
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 20
Kemudian pilih data set yang akan dibuka dengan cara klik salah satu data set kemudian klik
OK.
2.2.5. Recoding
Misalkan kita akan melakukan coding terhadap variabel IPK dari data set uji1.
IPK Kode
0 – 1.9 1
2 – 2.9 2
≥3 3
Klik Data>manage variable in active data set>recode variabel.
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 21
Pilih variabel yang akan dilakukan recoding, tulis nama variabel baru dari IPK setelah
dilakukan recoding dan tulis sintax recode seperti ketentuan di atas kemudian klik OK.
Tampilannya sebagai berikut :
Hasil dapat dilihat dengan cara klik view data set pada Rcomander. Kemudian akan diperoleh
hasil sebagai berikut :
2.2.6. Compute
Misalkan saja kita ingin melakukan transformasi terhadap variabel kalori yang dimiliki
pada data set uji1 dengan cara menambahkan nilai Sks dengan 20. Untuk melakukan hal
tersebut, pertama-tama aktifkan data set uji1.
Kemudian buka menu Data>Manage variables in active dataset>Compute variable ...
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 22
Pilih variabel kalori, tulis nama variabel baru dengan nama Sks_baru, dan tulis pada
expression to compute dengan Sks+20
Hasil dapat dilihat dengan cara klik view data set pada Rcomander. Kemudian akan diperoleh
hasil sebagai berikut :
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 23
2.2.7. Menghapus variabel pada dataset
Klik Data > Manage variables in active data se t> Delete variable from data set ...
Kemudian akan tampil sebagai berikut ini :
Pilih variabel yang akan dihapus, misalkan variabel yang akan dihapus adalah variabel
IPK_kode maka klik pada IPK_kode kemudian OK.
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 24
2.2.8. Menghapus baris pada dataset
Klik Data > active data set > Remove row(s) from active data set ...
Kemudian akan muncul sebagai berikut :
Tuliskan baris ke berapa saja yang akan dihapus pada jendela dialog di atas, misal baris yang
akan dihapus adalah baris ke 2 dan 3 maka tuliskan seperti di atas dan diperoleh hasil sebagai
berikut :
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 25
2.3. Latihan
1. Berikut data nilai ujian mata kuliah statistika dari 28 mahasiswa :
59 99 55 20
80 78 68 9
39 86 60 35
78 64 84 60
67 69 90 58
59 50 63 7
68 41 77 44
a. Lakukan entry data nilai ujian mata kuliah statistika di atas.
b. Lakukan recode pada data di atas dengan kategori sebagai berikut:
Nilai Kode
0 – 20 1
21 - 40 2
41 - 60 3
61 - 80 4
81 - 100 5
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 26
BAB III
RINGKASAN DAN PENYAJIAN DATA NUMERIK
Tujuan Praktikum
a. Praktikan mampu melakukan peringkasan data numerik
b. Praktikan dapat melakukan penyajian data numerik (berupa boxplot, stem and leaf, dan
histogram)
3.1. Pendahuluan
Ringkasan Numerik merupakan ringkasan data yang berupa statistik-statistik seperti
jumlah data (N), rata-rata (mean), median, deviasi standar, standar eror, kuartil1 (Q1), kuartil3
(Q3), dan sebagainya. Ringkasan numerik memberikan gambaran data berupa ukuran pusat,
letak data dan ukuran dispersi dalam bentuk numerik. Selain itu, ringkasan numerik juga
diperlukan sebagai estimasi dari nilai-nilai karakteristik data. Sedangkan penyajian data
numerik dapat dilakukan melalui grafik dan tabel. Grafik dan tabel yang bermanfaat untuk
menggambarkan data, di antaranya adalah histogram, bar chart, box plot, stem and leaf plot,
scatter plot, dan lain-lain.
3.2. Ringkasan Numerik
3.2.1. Contoh 1
Berikut data nilai UTS mata kuliah statistika dari 21 mahasiswa :
59 99 55
80 78 68
39 86 60
78 64 84
67 69 90
59 50 63
68 41 77
Langkah – langkah membuat ringkasan numerik (menggunakan numerical summaries) :
a. Input data UTS pada notepad kemudian import ke Rcmdr
b. Setelah data dimasukkan kemudian pilih menu
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 27
Statistics > Summaries > Numerical Summaries > ok
c. Output :
Mean sd IQR 0% 25% 50% 75% 100% N
68.28571 15.46009 19 39 59 68 78 99 21
d. Langkah – langkah membuat ringkasan numerik (menggunakan Active data set):
a. Input data UTS pada notepad kemudian import ke Rcmdr
b. Setelah data dimasukkan kemudian pilih menu
Statistics > Summaries > Active data set > ok
c. Output :
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 28
>summary(UTS)
UTS
Min : 39.00
1st Qu. : 59.00
Median : 68.00
Mean : 68.29
3rd Qu. : 78.00
Max : 99.00
Dari output di atas dapat diketahui nilai ringkasan numeriknya, yaitu nilai UTS statistik
terendah adalah 39 (Min.) sedangkan yang tertinggi adalah 99 tahun (Max.), rata-rata (Mean)
nilainya 68,29 , nilai kuartil1 (1st Qu.), median, dan kuartil3 (3rd Qu.) berturut-turt 59, 68,
dan 78.
3.2.2. Contoh 2
Berikut data nilai UTS dan UAS mata kuliah statistika dari 12 mahasiswa :
UTS UAS
59 60
80 85
39 50
78 80
67 60
59 65
68 70
99 96
78 81
86 85
64 70
69 71
Langkah-langkah (menggunakan numerical summaries) :
a. Input data pada data set Rcmdr :
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 29
b. Untuk menampilkan ringkasan numerik dari nilai UTS dan UAS, pilih menu
Statistics > Summaries > Numerical Summaries > pilih UTS dan UAS > OK
c. Output :
mean sd IQR 0% 25% 50% 75% 100% N
UAS 72.75 13.08104 18.25 50 63.75 70.5 82.0 96 12
UTS 70.50 15.30003 15.75 39 62.75 68.5 78.5 99 12
Langkah-langkah (menggunakan Active data set) :
a. Input data pada data set Rcmdr :
b. Setelah data dimasukkan kemudian pilih menu
Statistics > Summaries > Active data set > ok
c. Output :
>summary(nilai)
UTS UAS
Min : 39.00 Min : 50.00
1st Qu. : 62.75 1st Qu. : 63.75
Median : 68.50 Median : 70.50
Mean : 70.50 Mean : 72.75
3rd Qu. : 78.50 3rd Qu. : 82.00
Max : 99.00 Max : 96.00
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 30
3.3. Penyajian Data
3.3.1. Diagram batang dan daun (steam and leaf plot)
Secara umum, diagram batang dan daun dapat menggambarkan bentuk visual data
dengan menggunakan data aslinya. Bagian yang berperan sebagai batang adalah angka yang
mempunyai level lebih besar daripada angka pada daun. Sebagai contoh batang adalah
puluhan, maka sebagai daun adalah satuannya. Banyaknya daun dalam satu batang dapat
lebih dari satu.
Contoh 1
Langkah-langkah:
1. Aktifkan data UTS pada data set Rcmdr.
2. Setelah data diaktifkan kemudian pilih menu Graphs > Steam-and-leaf-display... > OK
Leaf Digit dapat diganti sesuai keinginan.
3. Output (menggunakan leaf digit Automatic):
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 31
1 | 2: represents 12
leaf unit : 1
n : 21
1 3. | 9
2 4* | 1
4. |
3 5* | 0
6 5. | 599
9 6* | 034
(4) 6. | 7889
7* |
8 7. | 788
5 8* | 04
3 8. | 6
2 9* | 0
1 9. | 9
4. Keterangan output:
a. Leaf unit (unit daun/ satuan) sebesar 1 atau sepersatuan.
b. Kolom paling kiri menunjukkan frekuensi kumulatif lebih dari sama dengan
(terletak di bawah (4)) dan kurang dari sama dengan (terletak di atas (4)),
sedangkan (4) menunjukkan bahwa median dari data terletak pada baris tersebut.
c. Kolom tengah menunjukkan batang dan kolom paling kanan menunjukkan daun.
Contoh 2
Langkah-langkah:
a. Aktifkan data UTS UAS pada data set Rcmdr
b. Setelah data diaktifkan kemudian pilih menu Graphs > Steam-and-leaf-display > pilih
UTS> hilangkan check-list pada Automatic pilih Leaf Digits 1OK
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 32
c. Output :
> stem.leaf(nilai$UTS, unit=1,
na.rm=TRUE)
1 | 2: represents 12
leaf unit: 1
n: 12
1 3 | 9
4 |
3 5 | 99
(4) 6 | 4789
5 7 | 88
3 8 | 06
1 9 | 9
> stem.leaf(nilai$UAS, unit=1,
na.rm=TRUE)
1 | 2: represents 12
leaf unit: 1
n: 12
1 5* | 0
5. |
3 6* | 00
4 6. | 5
(3) 7* | 001
7. |
5 8* | 01
3 8. | 555
9* |
1 9. | 6
Beberapa keuntungan dari diagram batang dan daun adalah :
1. Dapat melihat bentuk distribusi data,
2. Melihat data aslinya,
3. Melihat adanya data ekstrem,
4. Dapat menentukan frekuensi dengan cepat dan tepat,
5. Dapat membandingkan beberapa data.
3.3.2. Boxplot (diagram kotak dan titik)
Seperti halnya diagram batang dan daun, diagram kotak dan titik juga dapat digunakan
untuk melihat bentuk distribusi data serta melihat dengan mudah adanya data ekstrem.
Contoh 1
Langkah-langkah:
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 33
a. Aktifkan data UTS pada data set Rcmdr.
b. Setelah data diaktifkan kemudian pilih menu Graphs > Boxplot... > OK
Pada output di atas terlihat bahwa boxplot UTS tersebut simetris.
Contoh 2
Langkah-langkah:
a. Misalnya ingin dibandingkan boxplot nilai UTS dan UAS.
b. Buatlah data baru berdasarkan data nilai dengan format seperti ini :
40
50
60
70
80
90
10
0
UT
S
nilai maksimum
kuartil atas (Q3)
median
kuartil bawah (Q1)
nilai minimum
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 34
c. Setelah data di atas siap, pilih menu Graphs > Boxplot.. > variable = nilai
d. Output
Dari output di atas terlihat bahwa boxplot UAS relatif lebih tinggi dibandingkan
boxplot UTS. Hal ini berarti ada kenaikan nilai mahasiswa.
3.3.3. Histogram
Contoh 1
Langkah-langkah:
1. Aktifkan data UTS pada data set Rcmdr.
2. Setelah data diaktifkan kemudian pilih menu Graphs Histogram..
UAS UTS
40
50
60
70
80
90
10
0
UTS_UAS
nila
i
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 35
Pada Option tersedia pilihan untuk menentukan jumlah interval yang diinginkan, yaitu
pada kolom Number of bins. Namun, pada praktikum ini digunakan automatic method untuk
jumlah interval (metode Sturges). Untuk scaling (harga yang ada pada histogram) digunakan
Frequency counts. Selanjutnya klik ok, maka akan ditampilkan output histogram sebagai
berikut:
Grafik histogram di atas menunjukkan data cukup simetris.
3.4. Latihan
1. Berikut ini adalah data hasil pengamatan jumlah pengunjung perpustakaan D3 Informasi
dan Intrumentasi selama Bulan Juni.
39 50 41
38 45 21
29 45 40
29 38 49
44 34 44
35 31 45
43 47 49
45 38 25
UTS
fre
qu
en
cy
30 40 50 60 70 80 90 100
01
23
45
6
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 36
Berdasarkan data tersebut, buatlah :
a. Ringkasan numeriknya,
b. Diagram Boxplot, stem and leaf dan histogramnya.
2. Perhatikan nilai ujian basis data untuk 40 orang mahasiswa berikut ini :
79 49 48 72
80 84 90 70
70 71 92 38
68 71 85 51
90 35 83 73
92 93 76 21
80 91 58 72
30 72 99 95
58 20 83 82
76 57 88 70
Berdasarkan data tersebut, buatlah :
a. Ringkasan numeriknya,
b. Diagram Boxplot, stem and leaf dan histogramnya.
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 37
BAB IV
RINGKASAN DAN PENYAJIAN DATA KATEGORI
Tujuan Praktikum
a. Praktikan mampu melakukan peringkasan data kategori
b. Praktikan dapat melakukan penyajian data kategori (berupa bar graph dan pie chart)
4.1. Pendahuluan
Adakalanya data kuantitatif ingin kita bentuk ke dalam data kualitatif (kategori), yaitu
dikelompokkan menjadi beberapa bagian. Misalnya ada data mengenai tekanan darah,
kemudian data tersebut ingin dikelompokkan menjadi tekanan darah rendah, normal, dan
tinggi. Contoh yang lain misalnya ada data IPK mahasiswa, kemudian ingin dikelompokkan
menjadi rendah, sedang dan tinggi, dan masih banyak contoh-contoh yang lain.
Contoh
Berikut data IPK dari 20 mahasiswa
1.6 3.6
2.2 3.4
2.6 3.3
3.4 2.9
3.1 2.8
2.7 3.0
2.3 2.4
2.6 1.9
2.5 2.5
2.8 2.8
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 38
Entry data sebagai berikut :
Data IPK di atas akan diubah menjadi data kualitatif dengan cara coding yaitu IPK
yang di bawah 2 termasuk IPK rendah, IPK antara 2 sampai 2.9 termasuk IPK sedang dan
IPK di atas atau sama dengan 3 termasuk IPK tinggi.
Klik Data > manage variable in active data set > recode variable
Pada view data set akan muncul sebagai berikut :
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 39
Pada view data set muncul variabel baru IPK_kode yang merupakan coding dari nilai
IPK. Variabel IPK_kode akan kita ganti untuk 1 = rendah, 2 = sedang, 3=tinggi dengan cara
klik Data > manage variable in active data set > convert numeric variables to factors. Pilih
IPK_kode. Klik OK.
Selanjutnya akan muncul peringatan. Klik Yes.
Ganti nama variabel IPK_kode dan klik OK.
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 40
Selanjutnya, view dataset akan muncul sebagai berikut :
4.2. Distribusi Frekuensi
Summaries > Frequency distribution
Output :
> .Table # counts for IPK_kode
rendah sedang tinggi
2 12 6
> round(100*.Table/sum(.Table), 2) # percentages for IPK_kode
rendah sedang tinggi
10 60 30
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 41
Dari output di atas diperoleh IPK yang rendah berjumlah 2 mahasiswa, IPK sedang
berjumlah 12 mahasiswa, dan IPK tinggi berjumlah 6 mahasiswa. Sedangkan persentase pada
masing-masing kategori yaitu IPK rendah = 10%, IPK sedang = 60%, dan IPK tinggi = 30%.
4.3. Penyajian Data Kategori
Bar Graph
Langkah- langkah penyajian data menggunakan Bar Graph adalah :
a. Graph > Bar Graph
b. Output :
Dari bar graph di atas terlihat bahwa mahasiswa paling banyak IPK-nya adalah
berkategori sedang yaitu berjumlah 12 mahasiswa, sedangkan mahasiswa yang IPK-nya
rendah hanya 2 mahasiswa dan IPK-nya tinggi berjumlah 6 mahasiswa.
Pie chart
a. Graph > Pie Chart
rendah sedang tinggi
IPK_kode
Fre
qu
en
cy
02
46
81
01
2
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 42
b. Output :
Pada pie chart terlihat bahwa bagian yang berwarna merah muda menunjukkan bagian
yang paling kecil yaitu IPK mahasiswa rendah dan bagian yang paling besar adalah berwarna
hijau yaitu IPK mahasiswa sedang.
4.4. Latihan
1. Sebuah kota disebut metropolitan, berkembang atau kecil dilihat dari jumlah penduduk
yang menempati kota tersebut. Jika jumlah penduduk di kota tersebut melebihi 100.000
penduduk maka disebut kota metropolitan. Jika kota tersebut memiliki penduduk
melebihi 30.000 penduduk dan tidak melebihi angka 100.000 maka disebut kota
berkembang. Sedangkan jika kota tersebut memiliki penduduk tidak lebih dari 30.000
penduduk maka disebut kota kecil.
126.557 113.902 14.845
37.546 87.561 30.381
30.381 13.543 41.553
29.431 109.881 254.578
98.478 9.856 98.765
rendah
sedang
tinggi
IPK_kode
IPK_kode
Fre
qu
en
cy
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 43
Berdasarkan jumlah penduduk di bawah ini, buatlah
a. Tabel distribusi frekuensi dengan kategori kota!
b. Diagram lingkaran dan diagram batangnya!
2. Perhatikan nilai ujian basis data untuk 80 orang mahasiswa berikut ini :
79 49 48 72
80 84 90 70
70 71 92 38
68 71 85 51
90 35 83 73
92 93 76 21
80 91 58 72
30 72 99 95
58 20 83 82
76 57 88 70
Jika nilai di atas dikategorikan dengan nilai huruf :
0 – 20 = E, 21 – 40 = D, 41 – 60 = C, 61 – 80 = B, 81 – 100 = A
a. Buatlah tabel distribusi frekuensi dari data di atas
b. Buatlah diagram lingkaran dan diagram batangnya!
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 44
BAB V
TRANSFORMASI DATA
Tujuan Praktikum
a. Praktikan mampu melakukan transformasi data yang sesuai pada data yang tidak simetris.
5.1. Pendahuluan
Dalam analisis statistik sering kali diperlukan asumsi data berdistribusi normal. Apabila
digambarkan dalam bentuk grafik, data yang berdistribusi normal akan berbentuk kurang
lebih sebagai berikut.
Terdapat cara yang sederhana untuk mengetahui apakah data berdistribusi normal atau
tidak, yaitu dengan menggunakan diagram kotak dan titik atau dikenal juga dengan boxplot.
Boxplot terdiri dari 5 ukuran, yaitu median, kuartil atas, kuartil bawah, maksimum, dan
minimum. Bentuk boxplot adalah sebagai berikut.
0 2000 4000 6000 8000
0.0
0.1
0.2
0.3
0.4
Index
data
_nor
mal
Maksimum
Kuartil atas
Median
Kuartil bawah
Minimum
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 45
Pada data yang berdistribusi normal, nilai median berada di tengah-tengah kotak dan
jarak antara kuartil atas dengan maksimum sama dengan jarak kuartil bawah dengan
minimum, sehingga bentuk boxplot simetris. Apabila nilai median berada di tengah-tengah
kotak tetapi jarak antara kuartil atas dengan maksimum berbeda dengan jarak antara kuartil
bawah dengan minimum, maka sudah cukup dapat dikatakan data berdistribusi normal.
Data yang tidak berdistribusi normal memiliki bentuk box plot yang tidak simetris.
Apabila median lebih dekat dengan kuartil atas, maka box plot dikatakan menjurai ke bawah.
Data mengumpul di nilai-nilai yang besar.
Apabila median lebih dekat dengan kuartil bawah, maka box plot dikatakan menjurai ke
atas. Data mengumpul di nilai-nilai yang kecil.
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 46
Untuk mengatasi data yang tidak berdistribusi normal, dapat dilakukan transformasi
data. Pemilihan transformasi yang tepat dapat dilakukan menggunakan “Tangga
Transformasi” yang dibuat oleh Tukey. Berikut tangga transformasi.
Pemilihan transformasi dilakukan berdasarkan tipe juraian, yaitu menjurai ke atas atau ke
bawah, serta kuat atau tidaknya juraian.
5.2. Contoh
Berikut data jumlah tamu yang berkunjung dalam waktu 2 bulan pada 21 hotel :
150 200 121
175 210 103
149 215 97
180 225 120
190 300 99
195 112 90
185 140 142
Untuk mengetahui data sudah berdistribusi normal atau belum, dibuat boxplot dari
data tersebut, namun sebelumnya lakukan entry data.
0.0
0.1
0.2
0.3
0.4
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 47
Selanjutnya, akan tampil sebagai berikut :
Kemudian tampilkan boxplot-nya dengan cara Graphs Boxplot..
Output :
10
01
50
20
02
50
30
0
jml_
tam
u
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 48
Pada output di atas terlihat bentuk boxplot jumlah tamu agak menjurai ke atas.
Selanjutnya akan dilakukan transformasi untuk jumlah tamu tersebut. Karena data menjurai
ke atas, akan dicoba dilakukan transformasi menggunakan x . Dibuat variabel baru yang
merupakan akar dari variabel jml_tamu.
Pilih Data > Manage variables in active dataset > Compute variable ...
Selanjutnya pada view data set akan muncul variabel baru, yaitu akar_jml_tamu.
Selanjutnya dibuat boxplot dari variabel akar_jml_tamu untuk mengetahui apakah
variabel tersebut sudah berdistribusi normal atau belum, diperoleh hasil sebagai berikut :
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 49
Terlihat data masih sedikit menjurai ke atas, maka dicoba transformasi log x.
Transformasi log x dapat dilakukan dengan cara klik Data > Manage variables in active
dataset > Compute variable ...
Pada view data set akan muncul variabel baru dengan nama log_jml_tamu.
10
12
14
16
aka
r_jm
l_ta
mu
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 50
Kemudian buat boxplot untuk variabel log_jml_tamu :
Terlihat boxplot sudah cukup simetris. Sehingga transformasi yang cocok adalah log(x).
5.3. Latihan
1. Berikut ini adalah data hasil pengamatan jumlah pengunjung perpustakaan D3
Informasi dan Instrumentasi selama Bulan Juni.
39 50 41
38 45 21
29 45 40
29 38 49
44 34 44
35 31 45
43 47 49
45 38 25
Apakah data tersebut simetris? Jika tidak, lakukan transformasi data yang sesuai!
2. Perhatikan nilai ujian basis data untuk 40 orang mahasiswa berikut ini :
79 49 48 72
80 84 90 70
70 71 92 38
68 71 85 51
90 35 83 73
92 93 76 21
80 91 58 72
30 72 99 95
58 20 83 82
76 57 88 70
Apakah data tersebut simetris? Jika tidak, lakukan transformasi data yang sesuai!
2.0
2.1
2.2
2.3
2.4
log
_jm
l_ta
mu
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 51
BAB VI
DATA RANDOM DAN DISTRIBUSI PELUANG
Tujuan Praktikum
1. Praktikan mampu membangkitkan data berdistribusi normal dan student-t.
2. Praktikan mampu menghitung kuartil distribusi normal dan student-t.
3. Praktikan mampu menghitung probabilitas pada distribusi normal dan student-t.
6.1. Distribusi Normal
Distribusi normal, disebut juga distribusi Gauss, adalah distribusi probabilitas yang
paling banyak digunakan dalam berbagai analisis statistika dan kebanyakan pengujian
hipotesis mengasumsikan normalisasi suatu data. Distribusi normal baku adalah distribusi
normal yang memiliki rata-rata nol dan simpangan baku satu. Distribusi ini juga dijuluki
kurva lonceng (bell curve) karena grafik fungsi kepekatan probabilitasnya mirip dengan
bentuk lonceng. Distribusi normal memiliki sifat simetris, yaitu mean distribusi terletak di
tengah dengan luas bagian sebelah kiri sama dengan bagian sebelah kanan (berbentuk
lonceng) sehingga total daerah di bawah kurva sebelah kiri = total daerah di bawah kurva
sebelah kanan = 0,5
dengan π = 3,14159… dan e = 2,71828
Selain beberapa konstanta yang tidak akan berubah nilainya (e, π), bentuk distribusi
kurva normal ditentukan oleh tiga variabel, yaitu:
x = nilai dari distribusi variabel
μ = mean dari nilai-nilai distribusi variabel
σ = standar deviasi dari nilai-nilai distribusi variabel
xexf
x
,2
1),;(
2
22
)(
2
2
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 52
6.1.1. Membangkitkan data berdistribusi normal
Contoh 1
1. Akan digenerate data berdistribusi normal dengan jumlah data 30, mean = 0 dan sd =1.
2. Ketikkan perintah berikut pada Rconsole
> rnorm(30,0,1)
3. Output :
[1] 0.5983855 0.7116100 17.798.840 -0.7995579 0.5873402 0.7797935
[7] -0.5498465 -0.6635432 -0.7301439 0.2039722 -0.8284992 0.2853933
[13] -0.1644072 13.300.272 14.178.972 0.1490345 0.3342537 0.8401881
[19] -0.1758526 -0.1296207 -0.1290194 -0.5588599 20.510.804 0.4010594
[25] -14.258.976 -0.2047000 0.6815185 -0.6308402 0.4461653 -0.5619954
Contoh 2
1. Akan digenerate data berdistribusi normal dengan jumlah data 20, mean = 1 dan sd =1.5
2. Ketikkan perintah berikut pada Rconsole
> rnorm(20,1,1.5)
3. Output :
[1] -0.08308384 -0.83413525 -161.502.683 256.278.227 0.09009768 0.92929601
[7] 231.988.484 -145.564.267 0.76614766 0.77806463 318.023.558 0.17707811
[13] -1.66562843 0.81019267 136.364.658 -135.878.857 -0.70399104 165.615.288
[19] -228.021.370 187.995.815
6.1.2. Menghitung quantil (z tabel)
Tentukan harga Zα, sedemikian P (Z ≤ Zα,) = α (lower tail) atau P (Z ≥ Zα,) = 1-α (upper tail)
untuk harga α berikut:
Langkah
Rcmdr > Distributions > Normal Distributions > Normal Quantiles
Contoh 1 Lower tail pada α = 0.05
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 53
Output
> qnorm(c(0.05), mean=0, sd=1, lower.tail=TRUE)
[1] -1.644854
Contoh 1 Upper tail
Output :
> qnorm(c(0.05), mean=0, sd=1, lower.tail=FALSE)
[1] 1.644854
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 54
6.1.3. Menghitung probabilitas (p-value)
Langkah :
Rcmdr > Distributions > Normal Distributions > Normal Probabilities
Contoh 1
Hitung probabilitas P (Z < 2,5)!
Output
> pnorm(c(2.5), mean=0, sd=1, lower.tail=TRUE)
[1] 0.9937903
Contoh 2
Hitung probabilitas P (Z > 2,5)!
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 55
Output
> pnorm(c(2.5), mean=0, sd=1, lower.tail=FALSE)
[1] 0.006209665
Selain menggunakan program R, perhitungan probabilitas distribusi normal juga bisa
menggunakan tabel distribusi normal, yaitu tabel yang memuat probabilitas dari berbagai
nilai variabel dalam distribusi normal. Yang menjadi masalah dalam penyusunan tabel
tersebut adalah kenyataan bahwa terdapat banyak sekali macam distribusi normal,
dipengaruhi oleh besarnya nilai mean (μ) dan standar deviasinya (σ). Untuk mengatasi hal
tersebut, maka para ahli hanya membuat satu buah tabel yaitu tabel untuk menghitung nilai-
nilai probabilitas distribusi normal standar, sedangkan jika akan menghitung probabilitas
nilai-nilai variabel distribusi normal yang tidak standar, tetap bisa menggunakan tabel
distribusi normal standar tersebut dengan memakai metode konversi. Yang dimaksud
distribusi normal standar adalah distribusi normal dengan sifat khusus, yaitu distribusi
dengan normal yang mean = 0 dan standar deviasi = 1. Namun, apabila menggunakan
program R maka bisa langsung menghitung probabilitas dengan cara menyesuaikan nilai
mean dan standar deviasinya.
Dapat dihitung menggunakan tabel Normal Standar dengan terlebih dahulu
mentransformasikan skala ke ,
Contoh
Distribusi normal dengan mean 𝜇 = 60 dan deviasi standar 𝜎 = 12, N(60,122). Akan
dihitung P(X<76).
Jawab
Melakukan transformasi X ke Z dengan cara sebagai berikut :
dxebXP
b x
2
22
)(
22
1)(
),(~ 2NX )1,0(~ NZ
XZ
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 56
maka
)33,1( ZP dicari menggunakan Rcmdr sebagai berikut :
Distribution > continuous distributions > Normal distribution > normal probabilities
Output
> pnorm(c(1.33), mean=0, sd=1, lower.tail=TRUE)
[1] 0.9082409
Jadi P(X<76) dengan mean 𝜇 = 60 dan deviasi standar 𝜎 = 12 adalah 0.91.
Langsung menyesuaikan nilai mean dan standar deviasi pada program R :
Output
> pnorm(c(76), mean=60, sd=12, lower.tail=TRUE)
[1] 0.9087888
Jadi P(X<76) dengan mean 𝜇 = 60 dan deviasi standar 𝜎 = 12 adalah 0.91.
6.2. Distribusi Student-t
Distribusi dengan variabel acak kontinu lainnya selain dari distribusi normal ialah distribusi
student atau distribusi-t. Fungsi densitasnya adalah :
33,1
12
6076
XZ
9082,0
)33,1(
)12
6076()76(
ZP
XPXP
2/12
12/
2/11);(
ttfT
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 57
6.2.1. Membangkitkan data berdistribusi student-t
Contoh 1
1. Akan digenerate data berdistribusi t dengan n = 30 derajat bebas (df) = 29
2. Ketikkan perintah berikut pada Rconsole
> rt(30,29)
3. Output
[1] -0.94589143 157.648.795 -114.010.950 -0.23615789 -0.44198098 -0.18686742
[7] 223.321.053 0.03286632 129.338.590 148.717.072 -140.589.470 -0.67482811
[13] 0.73623844 0.69210436 -131.728.576 -0.19948329 231.273.571 0.65029448
[19] 156.583.856 -0.33549403 -174.624.680 -0.42242872 -149.979.037 -0.01405696
[25] 211.386.245 165.604.664 -0.38456833 0.64421307 119.870.866 -0.91036348
Contoh 2
1. Akan digenerate data berdistribusi t dengan n = 20 derajat bebas (df) = 19.
2. Ketikkan perintah berikut pada Rconsole
>rt(20,19)
3. Output
[1] 0.79774930 -0.33928362 0.50735857 0.48591979 149.433.708 -152.215.201
[7] -0.70716824 -124.884.096 0.24890676 -0.12314463 -299.654.585 -103.572.273
[13] 182.672.652 -0.26042455 -0.07129386 -122.985.248 0.38592455 -0.32887532
[19] 0.51296267 0.22746948
6.2.2. Menghitung quantil (t tabel)
Langkah
Rcmdr > Distributions > t Distributions > t Quantiles
Contoh
Tentukan harga quantil dari distribusi t dengan α = 0.05 dan derajat bebas 9
Lower Tail
Output Lower Tail
> qt(c(0.05), df=9, lower.tail=TRUE)
[1] -1.833113
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 58
Upper Tail
Output Upper Tail
> qt(c(0.05), df=9, lower.tail=FALSE)
[1] 1.833113
6.2.3. Menghitung probabilitas (menghitung (p_value))
Contoh 1
Hitung probabilitas distribusi t dengan nilai t < 2.5 dengan db=9
Output
> pt(c(2.5), df=9, lower.tail=TRUE)
[1] 0.9830691
Jadi P(t<2.5) dengan db=9 adalah 0.9830691
Contoh 2
Hitung probabilitas distribusi t dengan nilai t > 2.5 dengan db=9
Output
> pt(c(2.5), df=9, lower.tail=FALSE)
[1] 0.01693091
Jadi P(t>2.5) dengan db=9 adalah 0.01693091
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 59
6.3. Latihan
1. Bangkitkan data berdistribusi normal dengan :
a. n = 65, mean = 10, dan sd = 3
b. n = 45, mean = 10, dan sd = 4
c. n = 100, mean = 11, dan sd = 5
2. Bangkitkan data berdistribusi t dengan :
a. n = 95, db = 94
b. n = 55, db = 54
c. n = 28, db = 27
3. Hitung nilai dari :
a. Z0.85
b. Z0.08
c. Z0.42
4. Hitung nilai dari :
a. P(Z > 2.6)
b. P(Z < -1.6)
c. P(-0.8 < Z< 1.4)
5. Hitung nilai dari :
a. t0.15;15
b. t0.8;23
c. t0.35;18
6. Hitung nilai dari :
a. P(t > 1.9) dengan db=12
b. P(t < -1.45) dengan db=15
c. P(t > -0.25) dengan db=12
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 60
BAB VII
UJI PROPORSI
Tujuan Praktikum
1. Praktikan mampu melakukan analisis data menggunakan uji proporsi 1 populasi
2. Praktikan mampu melakukan analisis data menggunakan uji proporsi 2 populasi
7.1. Uji Proporsi Satu Populasi
Uji Hipotesis. Kita ingin menguji suatu hipotesis bahwa persentase suatu populasi sama
dengan harga tertentu p0 dalam kasus n besar. Uji ini dapat dilakukan dalam langkah-langkah
sebagai berikut :
1. Merumuskan Hipotesis
a. H0 : p = p0 (uji dua sisi)
H1 : p ≠ p0
b. H0 : p ≤ p0 (uji sisi kanan)
H1 : p > p0
c. H0 : p ≥ p0 (uji sisi kiri)
H1 : p < p0
2. Menentukan tingkat signifikansi α
3. Statistik Penguji
dimana x = jumlah „sukses‟ dalam sampel atau menggunakan p-value
4. Daerah kritis : daerah dimana H0 ditulak H1 diterima
Ho ditolak jika p_value < α
5. Kesimpulan
Berdasarkan langkah 4 dan hasil hitungan statistik penguji langkah 3, diambil
kesimpulan apakah H0 ditolak atau tidak ditolak pada tingkat signifikansi α.
Langkah-langkah dengan Rconsole
Buka R, lalu pada Rconsole ketikkan perintah berikut :
> prop.test (x, n, p = NULL, alternative = c("two.sided",
"less", "greater"), conf.level = 0.95, correct = TRUE)
x : Jumlah sukses
n : Jumlah total
n
xp
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 61
p : proporsi
alternative : hipotesis alternatif
conf.level : level konfidensi / tingkat keyakinan
Contoh
Pabrik gelas “Kawung” mengklaim bahwa lebih dari 95% gelas yang diproduksinya
berkualitas baik. Sebuah penelitian dari 200 sampel gelas memperlihatkan adanya gelas yang
cacat sebanyak 18 buah. Apakah anda menerima pernyataan pabrik tersebut? Uji dengan taraf
signifikasi 5% !
Jawab
p = 0.95
n = 200
x = 182
Syntax
> prop.test(182,200,0.95,c("greater"))
Output
1-sample proportions test with continuity correction
data: 182 out of 200, null probability 0.95
X-squared = 5.9211, df = 1, p-value = 0.9925
alternative hypothesis: true p is greater than 0.95
95 percent confidence interval:
0.8681495 1.0000000
sample estimates:
p
0.91
1. Merumuskan Hipotesis
H0 : p ≤ 0.95 (gelas yang diproduksi pabrik “Kawung” kurang dari sama dengan 95%
yang berkualitas baik)
H1 : p > 0.95 (gelas yang diproduksi pabrik “Kawung” lebih dari 95% yang berkualitas
baik)
2. Menentukan tingkat signifikansi α = 0.05
3. Statistik Penguji
p-value = 0.9925
4. Daerah kritis : daerah dimana H0 ditulak H1 diterima
Ho ditolak jika p_value < α
5. Kesimpulan
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 62
p-value = 0.9925 > 0.05 maka H0 tidak ditolak jadi gelas yang diproduksi pabrik
“Kawung” kurang dari sama dengan 95% yang berkualitas baik. Dengan kata lain gelas
yang diproduksi pabrik “Kawung” tidak lebih dari 95% yang berkualitas baik sehingga
pernyataan pabrik tersebut tidak dapat diterima.
7.2. Uji Proporsi Dua Populasi
Ingin diuji suatu hipotesis bahwa selisih proporsi (persentase) dua populasi p1-p2 sama
dengan harga p0 tertentu. Dengan n1 dan n2 yang cukup besar dan dengan dasar penyusunan
inferensi yang sama seperti dalam estimasi interval, dapat disusun uji hipotesis sebagai
berikut :
1. Merumuskan Hipotesis
a. H0 : (p1-p2) = p0 (uji dua sisi)
H1 : (p1-p2) ≠ p0
b. H0 : (p1-p2) ≤ p0 (uji sisi kanan)
H1 : (p1-p2) > p0
c. H0 : (p1-p2) ≥ p0 (uji sisi kiri)
H1 : (p1-p2) < p0
2. Menentukan tingkat signifikansi α
3. Statistik Penguji
menggunakan p-value
4. Daerah kritis : daerah dimana H0 ditolak H1 diterima
Ho ditolak jika p_value < α
5. Kesimpulan
Berdasarkan langkah 4 dan hasil hitungan statistik penguji langkah 3, diambil kesimpulan
apakah H0 ditolak atau tidak ditolak pada tingkat signifikansi α.
Langkah-langkah pada Rconsole ketikkan perintah berikut :
x.total=c(x1,x2)
n.total=c(n1,n2)
prop.test(x.total,n.total,alternative=c("two.
sided","less","greater"),conf.level=0.95)
Contoh
Bagian akademik Vokasi ingin mengetahui perbandingan antara mahasiswa tahun kedua dan
mahasiswa tahun ketiga yang bekerja sebagai programmer di luar tugas kuliah. Dari 150
mahasiswa tahun kedua dan 120 mahasiswa tahun ketiga yang berhasil diwawancarai,
diketahui ada 30 mahasiswa tahun kedua dan 63 mahasiswa tahun ketiga yang bekerja
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 63
sebagai programmer di luar tugas kuliah. Jika alpa = 5%, tentukan apakah ada perbedaan
proporsi mahasiswa yang bekerja sebagai programmer di luar tugas kuliah antara mahasiswa
tahun kedua dan ketiga?
Jawab
n1 = jumlah mahasiswa tahun kedua = 150
n2 = jumlah mahasiswa tahun ketiga = 120
x1 = jumlah mahasiswa tahun kedua yang bekerja sebagai programmer = 30
x2 = jumlah mahasiswa tahun ketiga yang bekerja sebagai programmer = 63
alpa = 5%
Syntax
x.total=c(30,63)
n.total=c(150,120)
prop.test(x.total,n.total,alternative="two.sided",conf.level=0.95)
Output
2-sample test for equality of proportions with continuity correction
data: x.total out of n.total
X-squared = 29.7624, df = 1, p-value = 4.884e-08
alternative hypothesis: two.sided
95 percent confidence interval:
-0.4424117 -0.2075883
sample estimates:
prop 1 prop 2
0.200 0.525
1. Merumuskan Hipotesis
H0 : p1 = p2 (tidak ada perbedaan proporsi mahasiswa yang bekerja sebagai programmer di
luar tugas kuliah antara mahasiswa tahun kedua dan ketiga)
H1 : p1 ≠ p2 (ada perbedaan proporsi mahasiswa yang bekerja sebagai programmer di luar
tugas kuliah antara mahasiswa tahun kedua dan ketiga)
2. Menentukan tingkat signifikansi α = 0.05
3. Statistik Penguji
p-value = 4.884e-08 = 4.884 x 10-8
4. Daerah kritis : daerah dimana H0 ditolak H1 diterima
Ho ditolak jika p_value < α
5. Kesimpulan
p-value = 4.884 x 10-8
< 0.05 maka H0 ditolak jadi ada perbedaan proporsi mahasiswa
yang bekerja sebagai programmer di luar tugas kuliah antara mahasiswa tahun kedua dan
ketiga.
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 64
7.3. Latihan
1. Siti membuat jus mangga buatan sendiri untuk dijual di perpustakaan UGM. Petugas
perpustakaan menyatakan bahwa banyak pengunjung perpustakaan menyukai jus
mangga buatan Siti. Siti akan menambah jumlah produksi jika pengunjung yang
menyukai jus mangganya berjumlah lebih dari 80%. Siti pun membuat kuisioner dengan
bertanya ke 50 pengunjung perpustakaan selama seminggu, hasilnya 38 pengunjung
menyukai jus mangga buatan Siti. Dari keterangan di atas, apakah Siti jadi menambah
jumlah produksi jus mangga buatannya? Gunakan α = 5%!
2. Seorang mahasiswa KOMSI yang sedang menyelesaikan Tugas Akhir melakukan sebuah
penelitian tentang efektivitas sistem yang dibuatnya. Jika lebih dari 90% pengguna
menganggap bahwa sistemnya mudah dipelajari dan sesuai kebutuhan maka mahasiswa
ini jadi menerapkan sistemnya tersebut di instansi terkait. Mahasiswa ini menggunakan
alpa dan beta testing dan meminta beberapa orang untuk mencoba sistem dan meminta
testimoni sistem pada respondennya. Dari 110 responden yang diminta untuk mencoba
sistemnya, 85 orang menganggap bahwa sistemnya mudah dipelajari dan sesuai dengan
kebutuhan pengguna. Dari keterangan di atas, apakah mahasiswa ini jadi menerapkan
sistemnya di instansi yang membutuhkan? Gunakan α = 5%!
3. Sebuah lembaga survei ingin mengetahui berapa perbandingan antara dosen laki-laki dan
perempuan yang mempunyai pekerjaan lain di luar kampus di sebuah Universitas. Dari
670 dosen pria dan 560 dosen wanita yang berhasil diwawancarai diketahui ada 410
dosen laki-laki dan 277 dosen wanita yang mempunyai pekerjaan di luar kampus. Jika
alpa = 10%, tentukan apakah ada perbedaan proporsi dosen yang mempunyai pekerjaan
lain di luar kampus!
4. Sebuah agen penjualan notebook ingin melihat jenis merk notebook mana yang lebih
handal antara X dan Y. Untuk tujuan tersebut agen menghubungi 500 pembeli notebook
merk X dan 600 pembeli notebook merk Y yang usia notebook-nya kurang dari 2 tahun.
Setiap pembeli diberikan pertanyaan apakah mereka pernah melakukan servis berat
notebook-nya selama 1 tahun terakhir. Hasilnya 90 pembeli merk X dan 65 pembeli merk
Y pernah melakukan servis berat notebook-nya. Apakah ada perbedaan kehandalan
notebook merk X dan Y? (gunakan alpha = 0.05)!
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 65
BAB VIII
UJI HIPOTESIS MEAN SATU POPULASI NORMAL
dan VARIANSI TIDAK DIKETAHUI (UJI t)
Tujuan Praktikum
1. Praktikan mampu melakukan analisis data menggunakan uji rata-rata satu populasi
normal dan variansi tidak diketahui.
8.1. Pendahuluan
Jika dipunyai sampel random X1, X2, ..., Xn berasal dari populasi Normal dengan mean μ
dan variansi σ2 maka variabel random
Xt
sn
berdistribusi t dengan derajat bebas (n-1).
Distribusi ini digunakan untuk inferensi mean populasi normal dengan ukuran sampel
(n) kecil (n<30)dan σ tidak diketahui. Untuk n yang semakin besar maka distribusi t ini akan
mendekati distribusi Normal.
8.2. Inferensi Statistik untuk Mean Populasi Normal
8.2.1. Uji hipotesis
Ingin diketahui apakah mean (μ) dari suatu populasi Normal sama dengan μ0
(konstanta) berdasarkan sampel random berukuran n. Langkah uji hipotesisnya dapat di
urutkan sebagai berikut :
1. Hipotesis
a. H0 : μ = μ0 (uji dua sisi)
H1 : μ ≠ μ0
b. H0 : μ ≤ μ0 (uji sisi kanan)
H1: μ > μ0
c. H0 : μ ≥ μ0 (uji sisi kiri)
H1: μ<μ0
2. Diambil tingkat signifikansi α
3. Statistik penguji
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 66
Xt
sn
(jika σ tidak diketahui)
atau p_value
4. Daerah kritis: daerah dimana H0 ditolak.
a. H0 ditolak jika
t > t n−1;α/2 atau t < - tn-1:;α/2
b. H0 ditolak jika
t > t n−1;α (untuk uji kanan)
c. H0 ditolak jika
t < - t n−1;α (untuk uji kiri)
atau
d. H0 ditolak jika p_value < α (untuk semua uji)
5. Kesimpulan
Berdasarkan langkah 4 dan hasil hitungan statistik penguji langkah 3, diambil kesimpulan
apakah H0 ditolak atau tidak ditolak pada tingkat signifikansi α.
8.2.2. Interval konfidensi
Misalkan X1, X2, ..., Xn adalah sampel random yang diambil dari populasi Normal
dengan mean μ dan variansi σ2
maka maka interval konfidensi (1-α) 100% untuk μ adalah
B ≤ μ ≤ A
Karena σ2 tidak diketahui maka menurut teorema distribusi t diperoleh
1;2
1;2
n
n
sB X t
n
sA X t
n
dengan nilai 1;
2n
t
diperoleh dari tabel distribusi t.
Karena uji hipotesis dan interval konfidensi di atas menggunakan statistik t, maka sering
dinamakan uji t.
Contoh
Seorang administrator sistem informasi penjualan tiket bus antarkota ingin mengetahui
apakah data penjualan yang masuk pada satu bulan sudah memenuhi target, yaitu menjual
lebih dari 100 tiket per hari. Berikut ini data penjualan tiket dalam 30 hari :
89 53 137
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 67
60 64 69
73 117 83
66 143 75
78 58 78
112 73 83
150 63 136
65 70 162
70 78 76
72 100 60
Apakah penjualan tiket tersebut mencapai target ? Gunakan alpha 5%!
Jawab
1. Hipotesis
H0 : μ ≤ 100 (penjualan yang masuk pada satu bulan kurang dari sama dengan 100 tiket per
hari)
H1: μ > 100 (penjualan yang masuk pada satu bulan lebih dari 100 tiket per hari)
2. Diambil tingkat signifikansi α
3. Statistik penguji
t = -2.3211 dan p-value = 0.9862 yang diperoleh dari :
Statistics > Means > Single sample t-test...
Output
One Sample t-test
data: tiket$tiket
t = -2.3211, df = 29, p-value = 0.9862
alternative hypothesis: true mean is greater than 100
95 percent confidence interval:
77.65674 Inf
sample estimates:
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 68
mean of x
87.1
4. Daerah kritis :
H0 ditolak jika p_value <α
5. Kesimpulan
Karena p_value = 0,9862 > 0,05 maka H0 tidak ditolak, berarti rata-rata penjualan yang
masuk pada satu bulan kurang dari sama dengan 100 tiket per hari. Hal ini menunjukkan
bahwa target penjualan belum terpenuhi.
8.3. Latihan
1. Seorang programmer web internet marketing SEO ingin mengetahui apakah web yang
dibuat pada satu bulan sudah memenuhi target, yaitu minimal dikunjungi 50
pengunjung per hari. Lakukanlah uji hipotesis dengan alpa = 10%! Berikan
interpretasinya? Berikut data yang diperoleh selama 30 hari :
32 53 71
35 64 69
33 57 53
38 66 55
39 58 58
37 67 63
41 56 66
45 66 62
43 59 67
47 63 70
2. Seorang mahasiswa KOMSI mendapat tugas praktikum statistika untuk mengetahui
berapakah jumlah pengunjung kantin selama 20 hari kerja sudah sesuai target pemilik
kantin, yaitu 50 orang/hari. Lakukanlah uji hipotesis dengan alpa = 5%! Berikan
interpretasinya? Berikut data yang diperoleh selama 20 hari:
35 53
43 64
51 42
38 43
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 69
60 58
55 43
50 36
65 40
38 58
42 43
3. Petugas parkir kampus VOKASI menghitung jumlah mahasiswa yang memakai sepeda
ke kampus. Pengamatan dilakukan selama 20 hari kerja. Pengamatan dilakukan untuk
mengetahui apakah himbauan terhadap mahasiswa agar memakai sepeda ke kampus
sudah terpenuhi, yaitu dengan melihat apakah mahasiswa yang bersepeda sudah lebih
dari 40 mahasiswa/hari. Lakukanlah uji hipotesis dengan alpa = 5%! Berikan
interpretasinya! Berikut data yang diperoleh selama 20 hari :
27 39
33 32
31 42
38 43
38 35
40 34
42 36
36 40
37 38
41 43
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 70
BAB IX
UJI HIPOTESIS MEAN DUA POPULASI
Tujuan Praktikum
1. Praktikan mampu melakukan analisis data menggunakan uji rata-rata dua populasi
independen.
2. Praktikan mampu melakukan analisis data menggunakan uji rata-rata dua populasi
dependen.
9.1. Uji Hipotesis Mean 2 Populasi Independen (Uji Independen sample t test)
Uji rata-rata 2 sampel independen (bebas) adalah metode yang digunakan untuk
menguji kesamaan rata-rata dari 2 populasi yang bersifat independen. Independen maksudnya
adalah bahwa populasi yang satu tidak dipengaruhi atau tidak berhubungan dengan populasi
yang lain.
1. Hipotesis
a. H0 : μ1 - μ2 = 0 (uji dua sisi)
H1 : μ1 - μ2 ≠ 0
b. H0 : μ1 - μ2 ≤ 0 (uji sisi kanan)
H1 : μ1 - μ2 > 0
c. H0 : μ1 - μ2 ≥ 0 (uji sisi kiri)
H1 : μ1 - μ2 < 0
2. Tingkat signifikansi, α = 5%
3. Statistik Uji, p_value
4. Daerah kritis
Ho ditolak jika p_value < α
5. Kesimpulan
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 71
Contoh
Dipunyai data tentang pengujian ketahanan terhadap 2 merk genteng dengan anggapan data
diambil dari populasi normal. Ujilah apakah bisa dikatakan kedua kualitas genteng sama?
Genteng A Genteng B
120 115
122 120
120 118
138 130
130 135
128 126
132 127
Langkah-langkah menjawab soal di atas :
1. Input data pada dataset Rcmdr :
2. Variabel Merk_genteng akan kita ganti untuk 1=genteng A dan 2=genteng B dengan cara :
Klik Data > manage variable in active data set > convert numeric variables to factors
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 72
Pada view data set akan muncul sebagai berikut :
3. Melakukan uji Levene’s test (uji kesamaan variansi)
statistics > Variances >Levene’s test
Langkah-langkah uji hipotesis :
a. Hipotesis
H0: Variansi kedua populasi sama (σ1 = σ2)
H1: Variansi kedua populasi tidak sama (σ1 ≠σ2)
b. Tingkat signifikansi, alpha = 5%
c. Statistik Uji
Cara mencari nilai p_value dari uji Levene’s test :
statistics > Variances >Levene’s test
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 73
Output
Levene's Test for Homogeneity of Variance (center = median)
Df F value Pr(>F)
group 1 0.0048 0.946 12
Dari output di atas diperoleh nilai p_value = 0.946
4. Daerah kritis
Ho ditolak jika p_value < α
5. Kesimpulan
p_value = 0.946 > α = 0.05 maka Ho tidak ditolak.
Hal ini berarti Variansi kedua populasi sama.
6. Melakukan Uji Independen t test
a. Hipotesis
H0 : μ1 - μ2 = 0 (rata-rata ketahanan kedua genteng sama)
H1 : μ1 - μ2 ≠ 0 (rata-rata ketahanan kedua genteng berbeda)
b. Tingkat signifikansi, α = 5%
c. Statistik Uji, P_value
Cara memperoleh p_value dari uji indpenden t test :
statistics > means > Independent sample t-test
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 74
d. Alternative Hypothesis : Two-sided karena pada uji hipotesis independen t test pada
kasus di atas yang digunakan adalah uji dua sisi (H1 : μ1 - μ2 ≠ 0 )
e. Confidence Level : .95 diperoleh dari 1 – α, dan tingkat signifikansi yang digunakan α
= 0.05
f. Assume equal variances : Yes ( karena pada uji levene’s test kesimpulan yang diperoleh
kedua populasi memiliki variansi yang sama. Jika pada kesimpulan uji levene’s test
adalah kedua populasi memiliki variansi yang berbeda maka yang dipilih adalah
Nomor)
Output
Two Sample t-test
data: ketahanan by Merk_genteng
t = 0.73, df = 12, p-value = 0.4794
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-5.386425 10.814996
sample estimates:
mean in group genteng A mean in group genteng B
127.1429 124.4286
Dari output di atas diperoleh nilai p_value = 0.4794
5. Daerah kritis
Ho ditolak jika p_value < α
6. Kesimpulan
p_value = 0.4794 > α = 0.05 maka Ho tidak ditolak. Hal ini berarti rata-rata ketahanan
kedua genteng sama.
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 75
9.2. Uji Hipotesis Mean 2 Populasi Dependen (Uji Paired t test)
Uji hipotesis rata-rata 2 populasi dependen juga sering dinamakan uji rata-rata 2 sampel
berpasangan atau paired sample t test. Dalam uji ini, suatu populasi diamati/ diberi perlakuan
2 kali, sehingga dihasilkan pasangan-pasangan data untuk masing-masing anggota populasi.
Rata-rata selisih pengamatan pertama dan ke dua dinamakan μD. Misalkan dari suatu
populasi diambil sampel sebanyak n, kemudian sampel tersebut diamati dan menghasilkan
data X1, X2, ..., Xn. Selanjutnya diamati untuk yang ke dua kalinya dan menghasilkan data Y1,
Y2, ..., Yn. Dengan demikian dari sampel pertama diperoleh data (X1, Y1), dari sampel ke dua
diperoleh (X2, Y2), dan seterusnya sampai sampel ke-n diperoleh (Xn, Yn). Rata-rata selisih
pengamatan pertama dan ke dua pada sampel dinamakan 𝐷 dan standar deviasinya
dinamakan sD.
Berikut uji hipotesis untuk rata-rata 2 populasi dependen.:
1. Hipotesis
a. H0: μD = μ0 (uji dua sisi)
H1: μD ≠ μ0
b. H0: μD ≤ μ0 (uji sisi kanan)
H1: μD > μ0
c. H0: μD ≥ μ0 (uji sisi kiri)
H1: μD < μ0
2. Diambil tingkat signifikansi α
3. Statistik penguji, p_value
4. Daerah kritis:
H0 ditolak jika p_value < α (untuk semua uji)
5. Kesimpulan
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 76
Contoh
Bagian akademik ingin melakukan survei terhadap pemberian beasiswa PPA. Apakah dengan
menggunakan pemberian beasiswa PPA memberi dampak kenaikan terhadap IPK mahasiswa
penerima. Nilai α= 5% (0.05).
Dengan data berikut :
Sebelum Sesudah
3.7 3.6
3.6 3.7
3.8 3.7
3.7 3.6
3.9 3.6
3.8 3.4
3.6 3.5
3.9 3.5
Langkah-langkah menjawab soal di atas :
1. Input data pada data set Rcmdr :
2. Melakukan uji paired t test
a. Hipotesis
H0 : μD ≥ μ0
(rata-rata IPK mahasiswa sebelum menerima beasiswa PPA lebih besar atau sama
dengan rata-rata IPK mahasiswa setelah menerima beasiswa PPA )
H1: μD < μ0
(rata-rata IPK mahasiswa sebelum menerima beasiswa PPA lebih kecil dari rata-
rata IPK mahasiswa setelah menerima beasiswa PPA )
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 77
b. Diambil tingkat signifikansi α
c. Statistik penguji
Cara memperoleh nilai p_value dari uji paired t test :
statistics > means > paired sample t test
d. Alternative Hypothesis : Difference < 0 karena pada uji hipotesis paired t test pada
kasus di atas yang digunakan adalah uji sisi kiri (H1: μD < μ0)
e. Confidence Level : .95 diperoleh dari 1 – α, dan tingkat signifikansi yang digunakan α
= 0.05
Output
Paired t-test
data: ipk$Sebelum and ipk$Sesudah
t = 2.8243, df = 7, p-value = 0.9872
alternative hypothesis: true difference in means is less than 0
95 percent confidence interval:
-Inf 0.2923918
sample estimates:
mean of the differences
0.175
Dari output di atas diperoleh nilai p_value = 0.9872
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 78
3. Daerah kritis:
H0 ditolak jika p_value < α
4. Kesimpulan
p_value = 0.9872 > α = 0.05 maka Ho tidak ditolak. Hal ini berarti rata-rata IPK
mahasiswa sebelum menerima beasiswa PPA lebih besar atau sama dengan rata-rata IPK
mahasiswa setelah menerima beasiswa PPA (IPK mahasiswa setelah diberi beasiswa PPA
tidak lebih bagus dibandingkan sebelum menerima beasiswa).
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 79
9.3. Latihan
1. Sebuah perusahaan penghasil bahan bakar mobil hendak memilih satu dari dua ramuan
kimia yang akan dijadikan campuran di dalam produknya. Ramuan tersebut adalah RDX
dan DLL. Untuk memutuskannya, departemen riset perusahaan tersebut mengadakan
penelitian untuk menguji efisiensi penggunaan bahan bakar setelah diberi kedua
campuran tersebut. Dalam penelitian ini, digunakan 60 buah mobil, 30 di antaranya
diberi bahan bakar dengan campuran RDX dan 30 mobil sisanya diberi bahan bakar
dengan campuran DLL. Ketiga puluh mobil kemudian dijalankan oleh 60 orang
pengemudi dengan kemampuan mengemudi yang homogen pada suatu lintasan tertentu.
Dengan memberikan 1 liter bahan bakar untuk setiap mobil, jarak tempuh 30 mobil yang
diberi bahan bakar bercampur RDX dan 30 mobil dengan bahan bakar bercampur DLL
kemudian dicatat. Apakah terdapat perbedaan jarak tempuh antara menggunakan RDX
dan DLL?
Data jarak tempuh (dalam kilometer) disajikan pada tabel berikut :
RDX DLL
5.21 5.17 5.60 5.29
5.31 5.35 5.21 5.49
5.32 5.09 5.43 5.31
5.12 5.29 5.34 5.36
5.16 5.30 5.41 5.47
5.40 5.14 5.26 5.53
5.29 5.25 5.24 5.37
5.20 5.38 5.42 5.47
5.14 5.39 5.31 5.48
5.23 5.30 5.15 5.59
5.22 5.18 5.39 5.34
5.01 5.35 5.50 5.47
5.19 5.29 5.38 5.53
5.23 5.35 5.45 5.34
5.40 5.20 5.36 5.28
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 80
2. Suatu perusahaan menyatakan bahwa sejenis diet baru akan menurunkan berat badan
seseorang. Berikut ini dicantumkan berat badan tujuh wanita sebelum dan sesudah
mengikuti diet ini.
Wanita
ke- Sesudah Sebelum
1 58.5 60.0
2 60.3 54.9
3 61.7 58.1
4 69.0 62.1
5 64.0 58.5
6 62.6 59.9
7 56.0 54.4
Ujilah pernyataan perusahaan tersebut dengan selang kepercayaan 95%!
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 81
BAB X
ANALISIS VARIANSI SATU ARAH
Tujuan Praktikum :
1. Melakukan pengujian rata-rata terhadap lebih dari dua populasi independen.
2. Melakukan uji perbandingan ganda pada pasangan populasi yang terbentuk.
10.1. Pendahuluan
Analisis Variansi adalah suatu prosedur untuk uji perbedaan mean beberapa populasi
(lebih dari dua). Analisis variansi adalah perluasan dari uji independen t test. Pada analisis
variansi yang diuji perbedaan dari k populasi. Diketahui bahwa apabila mean di antara
populasi sangat berbeda satu dengan yang lainnya maka variansi kumpulan antar mean jauh
lebih besar daripada variansi masing-masing populasi. Prosedur anova mendasarkan
analisisnya berdasarkan fakta tersebut.
Rancangan data untuk anova satu arah dapat dilihat seperti gambar di bawah ini dengan
ketentuan bahwa banyaknya sampel tiap populasi tidak harus sama.
1 … i k
X11 Xi1 Xk1
.
. …
.
11nX kknX
1X … iX kX
2
1S … 2
iS 2
kS
10.2. Asumsi dalam Anova
1. Keindependenan data ( tidak perlu dilakukan pengujian datanya
2. Kenormalan data
Bentuk Hipotesa :
a. H0 : data berdistribusi normal
H1 : data tidak berdistribusi normal
b. Tingkat signifikansi (α)
iinX
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 82
c. Statistik uji
p-value
d. Daerah Kritis
Ho ditolak jika p-value < α
e. Kesimpulan
3. Kesamaan Variansi
Bentuk Hipotesa :
a. Ho : variansi dari semua populasi sama
H1 : minimal ada satu populasi yang mempunyai variansi tidak sama
b. Tingkat signifikansi (α)
c. Statistik uji
p-value
d. Daerah Kritis
Ho ditolak jika p-value < α
e. Kesimpulan
Catatan : jika asumsi kesamaan variansi maupun kenormalan data tidak terpenuhi maka
lakukan transformasi data, kemudian lakukan uji asumsi lagi.
10.3. Uji Anova Satu Arah
Bentuk Uji Hipotesis
1. Ho: µ1 = µ2 = ... = µk ( rata-rata antar populasi itu sama )
H1: µi ≠ µj ; min 1 pasang populasi (i,j) yg mempunyai rata-rata yang berbeda untuk i ≠ j
2. Tingkat signifikansi ( )
3. Statistik penguji:
)/(
)1/(
KNSSE
KSSTF
~FK-1, N-K
K
i
ii SnSSE1
2)1(
K
i
ii XXnSST1
2)(
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 83
Tabel anova
Source of Variation df Sum of Square Mean of Square F-rasio
Perlakuan (treatment) K-1 SST MST=SST/(K-1) MSE
MSTF
Sesatan (Error) N-K SSE MSE=SSE/(N-K)
4. Daerah kritis
Ho ditolak jika p_value < alpha atau Fhit > Ftabel
5. Kesimpulan
Catatan : Apabila HO diterima maka pekerjaan selesai, tetapi apabila Ho ditolak maka
analisa selanjutnya adalah Uji Perbandingan Ganda.
10.4. Uji Perbandingan Ganda
Uji perbandingan ganda dapat dilakukan dengan Metode FISHER. Metode ini hampir
mirip dengan uji t. Uji perbandingan ganda digunakan untuk mengetahui apakah antar
pasangan yang berasal dari kombinasi populasinya itu mempunyai rata-rata yang sama atau
tidak. Jika terdapat K perlakuan maka :
Terdapat
2
Kkombinasi pasangan H0 yang akan diuji
K : jumlah perlakuan
Bentuk Uji Hipotesanya adalah sebagai berikut :
a. Ho: µi = µj
H1: µi ≠ µj
b. Tingkat Signifikansi (α)
c. Statistik uji
p-value
d. Daerah Kritis
H0 ditolak jika p_value < alpha
e. Kesimpulan
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 84
Contoh
Diadakan penelitian untuk menentukan pengaruh nutrisi pada perhatian anak SD. Diambil 15
anak yang di acak 3 pola sarapan pagi: tanpa sarapan, sarapan ringan, dan full sarapan.
Perhatian mereka terhadap pelajaran dalam menit dicatat dalam tabel berikut :
Tanpa sarapan Sarapan ringan Full sarapan
8 14 10
7 16 12
9 12 16
13 17 15
10 11 12
11 13 13
12 14 12
Lakukan Anova One-Way untuk data di atas dengan α= 0.05!
Langkah-langkah untuk menjawab pertanyaan di atas :
1. Uji normalitas data
a. Input data pada data set Rcmdr :
b. Melakukan uji normalitas :
Statistics > Summaries > Shapiro-Wilk test of normality...
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 85
Output
Shapiro-Wilk normality test
data: anova$Full_sarapan
W = 0.9226, p-value = 0.4898
Shapiro-Wilk normality test
data: anova$Sarapan_ringan
W = 0.9654, p-value = 0.8632
Shapiro-Wilk normality test
data: anova$Tanpa_sarapan
W = 0.978, p-value = 0.9493
2. Uji hipotesis :
a. Full Sarapan
H0 : data berdistribusi normal
H1 : data tidak berdistribusi normal
Tingkat signifikansi (α)
Statistik uji
p-value = 0.4898
Daerah Kritis
H0 ditolak jika p-value < α
Kesimpulan
p-value = 0.4898 > α= 0.05 maka H0 tidak ditolak.
Hal ini berarti data pada kelompok Full Sarapan berdistribusi normal.
b. Sarapan Ringan
H0 : data berdistribusi normal
H1 : data tidak berdistribusi normal
Tingkat signifikansi (α)
Statistik uji
p-value = 0.8632
Daerah Kritis
H0 ditolak jika p-value < α
Kesimpulan
p-value = 0.8632 > α= 0.05 maka H0 tidak ditolak.
Hal ini berarti data pada kelompok Sarapan Ringan berdistribusi normal.
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 86
c. Tanpa Sarapan
H0 : data berdistribusi normal
H1 : data tidak berdistribusi normal
Tingkat signifikansi (α)
Statistik uji
p-value = 0.9493
Daerah Kritis
H0 ditolak jika p-value < α
Kesimpulan
p-value = 0.9493 > α= 0.05 maka H0 tidak ditolak.
Hal ini berarti data pada kelompok Tanpa Sarapan berdistribusi normal.
Kesimpulan pada uji normalitas :
ketiga populasi berdistribusi normal, jadi asumsi normalitas terpenuhi.
3. Uji Kesamaan Variansi
a. Input data pada data set Rcmdr :
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 87
b. Variabel Sarapan akan kita ganti untuk 1 = full sarapan , 2 = sarapan ringan dan 3 =
tanpa sarapan dengan cara :
Klik Data > manage variable in active data set > convert numeric variables to factors
Pada view data set akan muncul :
Bentuk Hipotesa :
H0 : variansi dari semua populasi sama
H1 : minimal ada satu populasi yang mempunyai variansi tidak sama
Tingkat signifikansi (α)
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 88
Statistik uji
Cara mencari nilai p_value dari uji Levene’s test :
statistics > Variances >Levene’s test
Output
Levene's Test for Homogeneity of Variance (center = median)
Df F value Pr(>F)
group 2 0.0783 0.925 18
Dari output di atas diperoleh nilai p_value = 0.925
Daerah Kritis
H0 ditolak jika p-value < α
Kesimpulan
p_value = 0.925 > α = 0.05 maka H0 tidak ditolak.
Hal ini berarti Variansi ketiga populasi sama, jadi asumsi kesamaan variansi
terpenuhi.
c. Uji Anava
Bentuk Hipotesa :
1. H0: µ1 = µ2 = µ3 ( rata-rata perhatian terhadap pelajaran (dalam menit) antara status
sarapan adalah sama )
H1: µi ≠ µj ; min 1 pasang populasi (i,j) yang mempunyai rata-rata perhatian terhadap
pelajaran (dalam menit) yang berbeda untuk i ≠ j
2. Tingkat signifikansi ( )
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 89
3. Statistik penguji:
Statistics > Means > One-way ANOVA...
Output
> summary(AnovaModel.1)
Df Sum Sq Mean Sq F value Pr(>F)
Sarapan 2 56.10 28.048 6.333 0.00827 ** Residuals 18 79.71 4.429
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
> numSummary(anova2$Perhatian , groups=anova2$Sarapan,
statistics=c("mean",
+ "sd"))
mean sd data:n
full sarapan 10.00000 2.160247 7
sarapan ringan 13.85714 2.115701 7
tanpa sarapan 12.85714 2.035401 7
Dari output di atas diperoleh nilai p_value = 0.00827
4. Daerah Kritis
H0 ditolak jika p-value < α
5. Kesimpulan
p_value = 0.00827 < α = 0.05 maka H0 ditolak. Hal ini berarti minimal ada 1 pasang
kelompok sarapan yang rata-rata perhatian terhadap pelajaran (dalam menit)
berbeda, maka perlu dilakukan pembandingan ganda.
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 90
d. Uji Pembandingan Ganda
Statistics > Means > One-way ANOVA...
Output
> summary(.Pairs) # pairwise tests
Simultaneous Tests for General Linear Hypotheses
Multiple Comparisons of Means: Tukey Contrasts
Fit: aov(formula = Perhatian ~ Sarapan, data = anova)
Linear Hypotheses:
Estimate Std. Error t value Pr(>|t|)
sarapan ringan - full sarapan == 0 3.857 1.125 3.429 0.00818 **
tanpa sarapan - full sarapan == 0 2.857 1.125 2.540 0.05120 .
tanpa sarapan - sarapan ringan == 0 -1.000 1.125 -0.889 0.65395 ---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Adjusted p values reported -- single-step method)
> confint(.Pairs) # confidence intervals
Simultaneous Confidence Intervals
Multiple Comparisons of Means: Tukey Contrasts
Fit: aov(formula = Perhatian ~ Sarapan, data = anova)
Quantile = 2.5519
95% family-wise confidence level
Linear Hypotheses:
Estimate lwr upr
sarapan ringan - full sarapan == 0 3.85714 0.98662 6.72766
tanpa sarapan - full sarapan == 0 2.85714 -0.01338 5.72766
tanpa sarapan - sarapan ringan == 0 -1.00000 -3.87052 1.87052
> cld(.Pairs) # compact letter display
sarapanringan tanpasarapan fullsarapan
"a" "ab" "b"
Bentuk Uji Hipotesanya adalah sebagai berikut :
Full sarapan dan Sarapan Ringan
H0 : µ1 = µ2 (rata-rata perhatian terhadap pelajaran (dalam menit) antara yang full
sarapan dan sarapan ringan sama)
H1: µ1 ≠ µ2 (rata-rata perhatian terhadap pelajaran (dalam menit) antara yang full
sarapan dan sarapan ringan berbeda)
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 91
Tingkat Signifikansi (α) = 0.05
Statistik uji
p-value = 0.00818
Daerah Kritis
H0 ditolak jika p_value < alpha
Kesimpulan
p_value = 0.00818 < α = 0.05 maka H0 ditolak.
Hal ini berarti rata-rata perhatian terhadap pelajaran (dalam menit) antara yang full
sarapan dan sarapan ringan berbeda.
Full sarapan dan Tanpa Sarapan
H0 : µ1 = µ2 (rata-rata perhatian terhadap pelajaran (dalam menit) antara yang full
sarapan dan tanpa sarapan sama)
H1: µ1 ≠ µ2 (rata-rata perhatian terhadap pelajaran (dalam menit) antara yang full
sarapan dan tanpa sarapan berbeda)
Tingkat Signifikansi (α) = 0.05
Statistik uji
p-value = 0.0512
Daerah Kritis
H0 ditolak jika p_value < alpha
Kesimpulan
p_value = 0.0512 > α = 0.05 maka Ho tidak ditolak. Hal ini berarti rata-rata perhatian
terhadap pelajaran (dalam menit) antara yang full sarapan dan tanpa sarapan sama.
Sarapan Ringan dan Tanpa Sarapan
H0 : µ1 = µ2 (rata-rata perhatian terhadap pelajaran (dalam menit) antara yang
sarapan ringan dan tanpa sarapan sama)
H1: µ1 ≠ µ2 (rata-rata perhatian terhadap pelajaran (dalam menit) antara yang sarapan
ringan dan tanpa sarapan berbeda)
Tingkat Signifikansi (α) = 0.05
Statistik uji
p-value = 0.65395
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 92
Daerah Kritis
Ho ditolak jika p_value < alpha
Kesimpulan
p_value = 0.65395 > α = 0.05 maka H0 tidak ditolak. Hal ini berarti rata-rata
perhatian terhadap pelajaran (dalam menit) antara yang sarapan ringan dan tanpa
sarapan sama.
Jadi kesimpulan dari uji pembandingan ganda adalah pasangan kelompok yang rata-rata
perhatian terhadap pelajaran (dalam menit) berbeda adalah antara full sarapan dan sarapan
ringan.
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 93
10.5. Latihan
1. Sampel air diambil di empat lokasi sungai untuk menentukan kualitas kebersihannya.
Diperoleh data kandungan oksigen sebagai berikut :
Sungai A Sungai B Sungai C Sungai D
5.9 6.3 4.8 6.0
6.1 6.6 4.3 6.2
6.3 6.4 5.0 6.1
6.1 6.4 4.7 5.8
6.0 6.5 5.1 6.3
Lakukan Anova One-Way untuk data di atas dengan α= 0.05!
2. Dari sebuah penelitian tentang kandungan protein yang dikonsumsi mahasiswa, ingin
diketahui apakah jenis makanan yang dikonsumsi memiliki kandungan protein yang sama
pada tingkat signifikansi 0.05?
Diperoleh data sebagai berikut :
Kangkung Wortel Susu Telur
48.3 43.7 46.8 48.2
49.8 46.8 43.7 47.3
46.7 45.5 47.8 46.4
49.3 44.4 44.8 48.5
47.5 45.3 46.6 46.1
48.7 44.8 45.3 47.6
48.5 42.8 46.2 47.9
45.1
48.3
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 94
3. Berdasarkan data sample biaya hosting penyedia layanan web online di Yogyakarta pada
September 2010 sampai Mei 2014 dengan tingkat keyakinan 95%, ingin diketahui apakah
ada perbedaan rata-rata biaya hosting web online antara kelompok usia penyedia layanan
hosting web online? Jika ada perbedaan, kelompok usia penyedia layanan hosting mana
saja yang memiliki perbedaan biaya hosting web online?
Usia
<= 3 tahun
3 tahun
< Usia <
5 tahun
5 tahun
< Usia <
7 tahun
Usia
> 7 tahun
226.000 233.000 220.000 133.000
255.000 236.000 298.000 135.000
142.000 240.000 317.000 192.000
145.000 301.000 334.000 163.000
149.000 304.000 339.000 169.000
261.000 305.000 237.000 169.000
267.000 317.000 270.000 175.000
276.000 193.000 272.000 184.000
280.000 194.000 283.000 193.000
294.000 199.000 289.000 200.000
185.000 224.000 221.000 202.000
206.000 226.000 223.000 255.000
212.000 228.000 224.000 262.000
216.000 230.000 226.000 268.000
223.000 180.000 230.000 144.000
137.000 184.000 237.000 148.000
139.000 187.000 245.000 149.000
256.000 190.000 254.000 151.000
155.000 192.000 235.000 157.000
165.000 263.000 259.000 206.000
174.000 264.000 262.000 208.000
182.000 277.000 266.000 231.000
183.000 279.000 266.000 233.000
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 95
BAB XI
ANALISIS REGRESI LINEAR SEDERHANA
Tujuan Praktikum :
1. Melakukan pengujian untuk mengetahui apakah ada hubungan linear antar dua variabel
yaitu variabel dependen dengan independen.
2. Melakukan pengujian terhadap koefisien regresi yaitu terhadap konstanta dan koefisien
dari variabel independen.
3. Menghitung besar pengaruh variabel independen terhadap variabel dependen.
4. Pembentukan persamaan regresi.
11.1. Pendahuluan
Analisis Regresi merupakan alat statistik yang bermanfaat untuk mengetahui hubungan
antara dua variabel atau lebih, sehingga salah satu variabel dapat diduga dari variabel lainnya.
Model regresi :
Keterangan :
iY adalah nilai variabel dependen pada observasi ke-i
0 dan 1 adalah parameter koefisien regresi
iX adalah konstanta yang diketahui yaitu nilai variabel independen pada observasi ke-i
i adalah error yang bersifat random dengan rata-rata E{ i }= 0 dan variansinya Var{
i }= 2 ; i dan j tidak berkorelasi sehingga nilai covariansinya Cov{ i , j }= 0
untuk semua nilai i dan j ; ji , i = 1, 2, ….. n
Model Regresi di atas dikatakan sederhana, linear dalam parameter, dan linear dalam
variabel independent. Dikatakan sederhana karena hanya ada satu variabel independent,
linear dalam parameter karena tidak ada parameter yang muncul sebagai suatu eksponen atau
hasil kali atau hasil bagi dengan parameter lain, dan linear dalam variabel independent karena
variabel ini dalam model berpangkat satu.
110 ii XY
dengan ii XYE 10)(
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 96
11.2. Uji Simultan ( Over all test ) dalam Regresi
Bentuk uji Hipotesanya adalah :
1. Ho : 0i ; 0i ( model regresi tidak layak digunakan / tidak ada hubungan linear
antara variabel independen dengan variabel dependen ).
H1 : 0i ; 0i ( model regresi layak digunakan / ada hubungan linear antara variabel
independen dengan variabel dependen ).
2. Tingkat signifikansi α
3. Statistik uji :
Dengan melihat nilai p-value
4. Daerah Kritis :
H0 ditolak jika p-value < α
5. Kesimpulan
11.3. Uji Koefisien regresi ( uji parsial )
1. Uji terhadap konstanta
Bentuk uji hipotesanya adalah sebagai berikut :
H0 : β0 = 0 ( konstanta tidak signifikan terhadap model regresi )
H1 : β0 ≠ 0 ( konstanta signifikan terhadap model regresi )
Tingkat signifikansi α
Statistik uji :
Dengan melihat nilai p-value
Daerah Kritis :
H0 ditolak jika p-value < α
Kesimpulan
2. Uji terhadap koefisien regresi dari β1
Bentuk uji hipotesanya adalah sebagai berikut :
H0 : β1 = 0 ( koefisien regresi x1 tidak signifikan terhadap model regresi / tidak ada
pengaruh variabel independen terhadap variabel dependen)
H1 : β1 ≠ 0 ( koefisien regresi x1 signifikan terhadap model regresi / ada pengaruh
variabel independen terhadap variabel dependen)
Tingkat signifikansi α
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 97
Statistik uji :
Dengan melihat nilai p-value
Daerah Kritis :
H0 ditolak jika p-value < α
Kesimpulan
11.4. Contoh
Sebuah penelitian dilakukan untuk mengetahui hubungan antara IQ mahasiswa dengan
nilai praktikum algoritma pemrograman. Apakah dapat disimpulkan bahwa IQ mahasiswa
berpengaruh terhadap nilai praktikum algoritma pemrograman?
IQ nilai alpro
114 87
115 90
120 96
105 81
118 91
97 76
107 83
110 85
119 95
Langkah-langkah penyelesaian:
1. Input data ke dalam Rcmdr
2. Buat scatter plot antara variabel independen (X) dan variabel dependen (Y)
Graph > Scatter Plot
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 98
x-variabel (pick one) : variabel independen
y-variabel (pickone) : variabel dependen
Output
Dari bentuk scatter plot di atas, apakah ada hubungan linear antara nilai IQ dan nilai alpro?
( positif atau negatifkah? )
100 105 110 115 120
80
85
90
95
IQ
nila
i_a
lpro
6
3
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 99
3. Melakukan uji regresi
statistics > fit models> linear regression
enter name for model : nama model yang akan dibentuk
response variabel (pick one) : sorot nama variabel dependen
explanatory variabel (pick one) : sorot nama variabel independen
Output
> summary(RegModel.5)
Call:
lm(formula = nilai_alpro ~ IQ, data = regresi)
Residuals:
Min 1Q Median 3Q Max
-2.0840 -0.7019 -0.1652 1.2902 1.8427
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -7.3082 7.6429 -0.956 0.371
IQ 0.8456 0.0683 12.379 5.16e-06 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 1.471 on 7 degrees of freedom
Multiple R-squared: 0.9563, Adjusted R-squared: 0.9501
F-statistic: 153.2 on 1 and 7 DF, p-value: 5.159e-06
Dari output di atas dapat dilakukan uji over all test (simultan), uji parsial, menghitung
besarnya pengaruh variabel independen terhadap variabel dependen, dan membentuk
persamaan regresinya.
4. Uji Over all test ( uji simultan )
Bentuk hipotesanya adalah sebagai berikutnya:
H0 : 0i ; 0i (model regresi tidak layak digunakan)
H1 : 0i ; 0i (model regresi layak digunakan)
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 100
Tingkat signifikansi α =0,05
Statistik uji :
p- value = 5,159 x 10-6
Daerah Kritis :
H0 ditolak jika p_value < α
Kesimpulan
p_value = 5,159 x 10-6
< α maka H0 ditolak. Jadi model regresi layak digunakan.
5. Uji parsial
a. Uji parsial terhadap konstanta β0
Hipotesanya adalah sebagai berikut:
H0 : β0 = 0 ( konstanta tidak signifikan terhadap model regresi)
H1 : β0 ≠ 0 ( konstanta signifikan terhadap model regresi )
Tingkat signifikansi α
Statistik uji :
p-value = 0,371
Daerah Kritis :
H0 ditolak jika p-value < α
Kesimpulan
p-value = 0,371 > α maka H0 tidak ditolak.
Jadi konstanta tidak signifikan terhadap model regresi.
b. Uji parsial terhadap koefisien regresi β1
Bentuk uji hipotesanya adalah sebagai berikut :
H0 : β1 = 0 ( koefisien regresi x1 tidak signifikan terhadap model regresi / tidak ada
pengaruh nilai IQ terhadap nilai alpro)
H1 : β1 ≠ 0 ( koefisien regresi x1 signifikan terhadap model regresi / ada pengaruh
nilai IQ terhadap nilai alpro)
Tingkat signifikansi α
Statistik uji :
p-value = 5,159 x 10-6
Daerah Kritis :
H0 ditolak jika p-value < α
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 101
Kesimpulan
p_value = 5,159 x 10-6
< α maka H0 ditolak.
Jadi koefisien regresi x1 signifikan terhadap model regresi / ada pengaruh nilai IQ
terhadap nilai alpro.
Pada hasil uji hipotesis di atas, karena intercept tidak signifikan dalam model regresi,
maka variabel tersebut dikeluarkan dan kemudian dilakukan regresi ulang tanpa variabel
tersebut.
Untuk mengulang analisis regresi jika ada salah satu variabel yang tidak signifikan digunakan
menu Statistics > Fit Models > Linear model…
Output
> summary(LinearModel.6)
Call:
lm(formula = nilai_alpro ~ IQ - 1, data = regresi)
Residuals:
Min 1Q Median 3Q Max
-1.9621 -0.9387 -0.4995 0.3042 2.3557
Coefficients:
Estimate Std. Error t value Pr(>|t|)
IQ 0.780369 0.004359 179 1.06e-15 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 1.463 on 8 degrees of freedom
Multiple R-squared: 0.9998, Adjusted R-squared: 0.9997
F-statistic: 3.204e+04 on 1 and 8 DF, p-value: 1.061e-15
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 102
c. Uji terhadap koefisien regresi β1
Bentuk uji hipotesanya adalah sebagai berikut :
H0 : β1 = 0 ( koefisien regresi x1 tidak signifikan terhadap model regresi / tidak ada
pengaruh nilai IQ terhadap nilai alpro)
H1 : β1 ≠ 0 ( koefisien regresi x1 signifikan terhadap model regresi / ada pengaruh
nilai IQ terhadap nilai alpro)
Tingkat signifikansi α
Statistik uji :
p-value = 1,061 x 10-15
Daerah Kritis :
H0 ditolak jika p-value < α
Kesimpulan
p_value = 1,061 x 10-15
< α maka H0 ditolak. Jadi koefisien regresi x1 signifikan
terhadap model regresi / ada pengaruh nilai IQ terhadap nilai alpro.
Sehingga diperoleh model regresinya : Nilai alpro = 0,78 (nilai IQ).
Besarnya pengaruh nilai IQ terhadap nilai alpro ( silahkan melhiat nilai dari
Multiple R-Squared ) yaitu sebesar 99,98% dan sisanya dipengaruhi oleh faktor
lain diluar pengamatan.
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 103
11.5. Latihan
1. Seorang distributor kendaraan bermotor melakukan penelitian untuk menentukan
hubungan harga dengan umur motor bekas. Data yang digunakan diperoleh untuk satu
jenis kendaraan terlihat pada tabel berikut :
Umur Harga
(tahun) (ribuan rupiah)
1 1795
4 985
10 295
2 1295
5 795
6 995
8 845
1 1625
Kesimpulan apa yang dapat Anda sampaikan dari kasus di atas?
2. Ingin diketahui hubungan antara nilai tes masuk dengan nilai akhir kuliah matematika
pada mahasiswa baru. Diperoleh data dari 20 mahasiswa yang mengikuti kuliah
matematika sebagai berikut :
Nilai Tes Nilai Akhir Nilai Tes Nilai Akhir
50 53 90 54
35 41 80 91
35 61 60 48
40 56 60 71
55 68 60 71
65 36 40 47
35 11 55 53
60 70 50 68
90 79 65 57
35 59 50 79
Kesimpulan apa yang dapat Anda sampaikan dari kasus di atas?
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 104
DAFTAR PUSTAKA
Dalgaard, Peter. 2002. Statistics and Computing: Intoductory Statistics with R.
Springer. New York.
Gunardi dan Rakhman, A. 2003. Metode Statistika. Fakultas MIPA UGM.
Yogyakarta.
NN. 2007. Modul Praktikum Analisis Data Eksploratif. Program Studi Statistika
FMIPA UGM. Yogyakarta.
Rosadi, Dedi. 2005. Praktikum Komputasi Statistika: Pengantar Analisa Statistika
dengan R. Program Studi Statistika FMIPA UGM. Yogyakarta.
Zulaela. 2004. Modul Praktikum Analisis Regresi Terapan. Program Studi Statistika
FMIPA UGM. Yogyakarta.
Zulaela. Gunardi. Rakhman, A. Utami, Herni. 2004. Program Studi Statistika FMIPA
UGM. Yogyakarta.