Praktikum Statistika dan Penyajian Data · PDF fileMenginstal R pada sistem operasi Windows ... pilih menu Packages > Install package(s) from local ... merupakan suatu langkah yang

D3 Komputer dan Sistem Informasi

MODUL D3 KOMSI

Praktikum Statistika

dan

Penyajian Data

(Rahma Dewi Permana, S.Si.)

Laboratorium Komputer

D3 Komputer dan Sistem Informasi

Diploma Informatika dan Instrumentasi

Sekolah Vokasi

Universitas Gadjah Mada

Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014) 2

DAFTAR ISI

Praktikum Statistika ................................................................................................................... 1

DAFTAR ISI .............................................................................................................................. 2

BAB I ......................................................................................................................................... 4

1.1. Pendahuluan ................................................................................................................ 4

1.2. Paket Program R.......................................................................................................... 4

1.3. Instalasi R .................................................................................................................... 5

1.3.1. Menginstal R pada sistem operasi Windows ....................................................... 5

1.3.2. Menginstal Rcommander pada sistem operasi Windows ................................... 10

BAB II ...................................................................................................................................... 13

2.1. Pendahuluan .............................................................................................................. 13

2.2. Penggunaan Rcmdr .................................................................................................... 13

2.2.1. Entry data........................................................................................................... 14

2.2.2. Menampilkan data yang sedang aktif ................................................................ 17

2.2.3. Importing data ................................................................................................... 18

2.2.4. Memilih data set yang aktif ............................................................................... 19

2.2.5. Recoding ............................................................................................................ 20

2.2.6. Compute ............................................................................................................. 21

2.2.7. Menghapus variabel pada dataset ...................................................................... 23

2.2.8. Menghapus baris pada dataset ........................................................................... 24

2.3. Latihan ....................................................................................................................... 25

BAB III .................................................................................................................................... 26

3.1. Pendahuluan .............................................................................................................. 26

3.2. Ringkasan Numerik ................................................................................................... 26

3.2.1. Contoh 1 ............................................................................................................. 26

3.2.2. Contoh 2 ............................................................................................................. 28

3.3. Penyajian Data........................................................................................................... 30

3.3.1. Diagram batang dan daun (steam and leaf plot) ................................................ 30

3.3.2. Boxplot (diagram kotak dan titik) ...................................................................... 32

3.3.3. Histogram ........................................................................................................... 34

3.4. Latihan ....................................................................................................................... 35

BAB IV .................................................................................................................................... 37

4.1. Pendahuluan .............................................................................................................. 37

4.2. Distribusi Frekuensi .................................................................................................. 40

4.3. Penyajian Data Kategori............................................................................................ 41

4.4. Latihan ....................................................................................................................... 42

BAB V ..................................................................................................................................... 44

5.1. Pendahuluan .............................................................................................................. 44

5.2. Contoh ....................................................................................................................... 46

5.3. Latihan ....................................................................................................................... 50

BAB VI .................................................................................................................................... 51

6.1. Distribusi Normal ...................................................................................................... 51

6.1.1. Membangkitkan data berdistribusi normal ........................................................ 52

6.1.2. Menghitung quantil (z tabel) .............................................................................. 52

6.1.3. Menghitung probabilitas (p-value) .................................................................... 54

6.2. Distribusi Student-t .................................................................................................... 56

6.2.1. Membangkitkan data berdistribusi student-t ...................................................... 57


6.2.2. Menghitung quantil (t tabel) .............................................................................. 57

6.2.3. Menghitung probabilitas (menghitung (p_value)) ............................................. 58

6.3. Latihan ....................................................................................................................... 59

BAB VII ................................................................................................................................... 60

7.1. Uji Proporsi Satu Populasi ........................................................................................ 60

7.2. Uji Proporsi Dua Populasi ......................................................................................... 62

7.3. Latihan ....................................................................................................................... 64

BAB VIII ................................................................................................................................. 65

8.1. Pendahuluan .............................................................................................................. 65

8.2. Inferensi Statistik untuk Mean Populasi Normal ...................................................... 65

8.2.1. Uji hipotesis ....................................................................................................... 65

8.2.2. Interval konfidensi ............................................................................................. 66

8.3. Latihan ....................................................................................................................... 68

BAB IX .................................................................................................................................... 70

9.1. Uji Hipotesis Mean 2 Populasi Independen (Uji Independen sample t test) ............. 70

9.2. Uji Hipotesis Mean 2 Populasi Dependen (Uji Paired t test) ................................... 75

9.3. Latihan ....................................................................................................................... 79

BAB X ..................................................................................................................................... 81

10.1. Pendahuluan........................................................................................................... 81

10.2. Asumsi dalam Anova............................................................................................. 81

10.3. Uji Anova Satu Arah ............................................................................................. 82

10.4. Uji Perbandingan Ganda ........................................................................................ 83

10.5. Latihan ................................................................................................................... 93

BAB XI .................................................................................................................................... 95

11.1. Pendahuluan........................................................................................................... 95

11.2. Uji Simultan ( Over all test ) dalam Regresi ......................................................... 96

11.3. Uji Koefisien regresi ( uji parsial ) ........................................................................ 96

11.4. Contoh ................................................................................................................... 97

11.5. Latihan ................................................................................................................. 103

DAFTAR PUSTAKA ............................................................................................................ 104


BAB I

PAKET PROGRAM PENGOLAH DATA

Tujuan Praktikum

a. Praktikan dapat mengenal program R (RGUI dan Rcmdr)

b. Praktikan dapat menginstal program R

1.1. Pendahuluan

Statistika merupakan salah satu ilmu penunjang ilmu-ilmu lainnya terutama dalam

merumuskan kesimpulan suatu permasalahan penelitian. Begitu juga teknologi komputer

juga merupakan penunjang utama dalam bidang-bidang ilmu lain. Seiring dengan kemajuan

teknologi komputer, paket program untuk aplikasi statistika juga semakin maju. Perhitungan-

perhitungan yang dulu memerlukan waktu yang cukup lama, sekarang dapat dikerjakan

dengan cepat, mudah, dan akurat, serta mampu menangani data dengan jumlah sampel dan

variabel yang sangat besar. Saat ini, cukup banyak paket program pengolah data statistik,

baik yang bersifat komersial ataupun bersifat free, di antaranya:

a. Komersial

SPSS dan semua produk terkait, Minitab, STATA, Microstat, SAS, BMDP, Genstat,

Statistica, Splus, dll.

General Purpose : Matlab, Maple, C/C++, Fortran, Java, dll.

Problem: Harga lisensi sangat mahal, bahkan upgrade harus mengeluarkan biaya

besar, source code bersifat rahasia dan “bug” sulit di track.

b. Open Source

SPSS-Like : Open Stat

VISTA

Splus Clone : R

Pada praktikum ini hanya akan dibahas penggunaan software R untuk analisis statistika dasar.

1.2. Paket Program R

R adalah bahasa pemrograman dan perangkat lunak untuk analisis statistika dan grafik

R. R dibuat oleh Ross Ihaka dan Robert Gentleman di Universitas Auckland, Selandia Baru,

dan kini dikembangkan oleh R Development Core Team. Bahasa R kini digunakan


statistikawan untuk pengembangan perangkat lunak statistika, serta digunakan secara luas

untuk pengembangan perangkat lunak statistika dan analisis data.

R menyediakan berbagai teknik statistika (permodelan linier dan nonlinier, uji statistik

klasik, analisis deret waktu, klasifikasi, klasterisasi, dan sebagainya) serta grafik. R,

sebagaimana S, dirancang sebagai bahasa komputer sebenarnya, dan mengizinkan

penggunanya untuk menambah fungsi tambahan dengan mendefinisikan fungsi baru.

Kekuatan besar dari R yang lain adalah fasilitas grafiknya, yang menghasilkan grafik dengan

kualitas publikasi yang dapat memuat simbol matematika.

1.3. Instalasi R

1.3.1. Menginstal R pada sistem operasi Windows

Klik dua kali file R-2.3.2-win.exe yang telah di download melalui internet. Kemudian

akan keluar tampilan sebagai berikut :

Pilih bahasa yang akan digunakan, default pada instalasi program ini adalah English,

kemudian OK.

Klik Next pada jendela dialog di atas dan akan muncul sebagai berikut :


Klik Next kemudian muncul jendela dialog sebagai berikut :

Jendela dialog di atas digunakan untuk menentukan lokasi instalasi dari R. Di sini

default lokasi instalasinya, yakni pada direktori C:\Program Files\R\R-3.0.2. Jika ingin

mengubah lokasi instalasinya dapat dengan mengklik browse kemudian pilih lokasi yang

diinginkan.


Default instalasi adalah menggunakan mode 32-bit User instalation. Anda dapat juga

memilih mode instalasi lain. Akan tetapi, mode default di atas sudah cukup untuk keperluan

praktikum kita. Terlihat instalasi mode ini membutuhkan space 75.1 MB dari hard disk.

Selanjutnya klik Next.

Pada jendela dialog di atas kita pilih default kemudian pilih Next.


Jendela dialog di atas untuk menentukan lokasi shortcut dari program R pada start

menu program. Di sini kita akan menggunakan modus default dari instalasi, yakni shortcut

akan diletakkan pada direktori R. Kemudian pilih Next dan sekali lagi pada jendela dialog

selanjutnya, maka proses instalasi akan dimulai. Silakan menunggu sampai proses instalasi

selesai.

Jika proses telah selesai kemudian akan keluar jendela dialog sebagai berikut :


Klik Finish pada jendela dialog di atas. Kemudian pada desktop windows dan start menu dari

windows akan terdapat shortcut dari R.

Shortcut dari program R pada desktop windows dapat dilihat pada gambar berikut

Klik dua kali shortcut R pada desktop atau pada start menu kemudian akan muncul tampilan

sebagai berikut :


1.3.2. Menginstal Rcommander pada sistem operasi Windows

Untuk menginstal Rcommander, pilih menu Packages > Install package(s) from local

zip files .... Kemudian pilih file Rcmdr_2.0-3.zip. Lihat seperti pada jendela dialog berikut

Klik open kemudian paket Rcmdr akan terinstal dan lihat tampilan pada Rconsole.

Tampilan Rconsole akan tampil seperti gambar di bawah ini :


Pada dialog Rconsole terdapat error dan perlu di instal paket tcltk2. Langkah untuk

menginstal paket tcltk2 sama seperti proses menginstal paket Rcmdr di atas. Kemudian

jalankan paket Rcommander yang dapat dilakukan dengan dua cara, yakni dengan

mengetikkan perintah berikut pada Rconsole :

>library(Rcmdr)

dan menekan Enter satu kali, atau dengan memilih menu Packages>Load package ... dan

memilih Rcmdr pada daftar paket library yang terinstal sebagai berikut :

Tekan OK dan akan muncul seperti ini


Agar paket Rcmdr dapat berjalan secara sempurna maka perlu diinstal paket-paket

lainnya yang telah tercantum di atas. Proses penginstalan paket-paket tersebut sama seperti

proses penginstalan paket Rcmdr.


BAB II

MANAJEMEN DATA DENGAN R-GUI

Tujuan Praktikum:

a. Praktikan dapat melakukan manajemen data menggunakan R-Gui

2.1. Pendahuluan

Data processing (entry data, editing dan exporting) merupakan suatu langkah yang

penting dalam melakukan analisis statistika. Ada banyak macam dan ukuran data yang

mampu diolah menggunakan R. Secara umum, paling tidak ada dua macam bentuk data yang

ingin kita olah, yaitu data yang sudah kita miliki yang barangkali ditulis menggunakan

program sheet lain seperti Excel, database, text ataupun program pengolahan data yang lain.

Pada bab ini akan ditunjukkan bagaimana melakukan data processing menggunakan R-Gui.

Akan dibahas cara-cara untuk melakukan entry data, editing data, importing data dan

transformasi data sederhana.

2.2. Penggunaan Rcmdr

Pertama-tama buka paket Rcmdr dengan cara sebagai berikut :

Packages>load packages

Pilih paket Rcmdr kemudian OK.

Selanjutnya akan muncul Rcommander seperti dibawah :


2.2.1. Entry data

Untuk melakukan entry data klik Data > New data set

Kemudian akan muncul jendela dialog sebagai berikut :

Ketik nama data set misal dengan nama uji1 kemudian klik OK.


Untuk entry data klik edit data set kemudian akan muncul sebagai berikut :

Sebagai latihan, lakukan entry data berikut ke Rcmdr.

Nama IPK Sks

Ivan 2.4 40

Mely 2.8 42

Rosa 3.5 46

Setia 2.7 42

Mayone 2.9 4o

Lady 3.3 42

Anita 3.1 44

Wanto 2.9 42

Heri 2.2 40

Danu 2.0 38

Keterangan

Nama : nama mahasiswa

IPK : IPK yang diperoleh

Sks : jumlah sks yang telah ditempuh

Ketikkan ketiga variabel (nama, IPK, dan Sks) pada Data editor.

Selanjutnya tampilan Data editor menjadi sebagai berikut :


Untuk pemberian nama variabel klik pada var1 maka akan muncul :

Tulis nama variabel nama kemudian close. Langkah yang sama digunakan untuk pemberian

nama variabel IPK dan Sks. Pada pemberian nama untuk IPK maka klik var2 kemudian tulis

nama variabelnya dengan IPK, dan pemberian nama untuk Sks maka klik var3 kemudian tulis

nama variabelnya dengan Sks.

Selanjutnya, nama kolom akan berubah sesuai tampilan berikut ini :


Close Data editor untuk mengakhiri proses entry data. Tampak sekarang pada jendela

Rcommander terlihat data set bernama uji1 saat ini sedang aktif.

2.2.2. Menampilkan data yang sedang aktif

Untuk menampilkan data yang sedang aktif di memori, klik tombol View data set.

Maka jendela data akan dibuka, menampilkan data yang sedang aktif di memori komputer

saat ini, yakni data uji1.


2.2.3. Importing data

Selain proses entry data, Rcommander juga dapat digunakan untuk melakukan import

data dari format data yang diberikan pada program lain, yakni data dari Excel atau Open

Office.org calc (disimpan dalam format file text/dat/csv), SPSS, MINITAB, dan STATA.

Pada praktikum kali ini, kita akan menggunakan metode importing data dari file notepad.

Entry data nama, BB, dan kalori pada notepad kemudian save dengan nama uji2.txt

dengan tampilan sebagai berikut :

Klik pada Rcommander Data > Import data > from text file, clipboard, or URL...

Kemudian akan muncul tampilan sebagai berikut :


Tulis nama data set dengan nama uji2 kemudian OK dan akan muncul sebagai berikut :

Pilih file yang akan di import dari folder yang sesuai kemudian klik open.

2.2.4. Memilih data set yang aktif

Untuk memilih data set yang aktif, gunakan menu Data>Active data set>select active

set …


Kemudian pilih data set yang akan dibuka dengan cara klik salah satu data set kemudian klik

OK.

2.2.5. Recoding

Misalkan kita akan melakukan coding terhadap variabel IPK dari data set uji1.

IPK Kode

0 – 1.9 1

2 – 2.9 2

≥3 3

Klik Data>manage variable in active data set>recode variabel.


Pilih variabel yang akan dilakukan recoding, tulis nama variabel baru dari IPK setelah

dilakukan recoding dan tulis sintax recode seperti ketentuan di atas kemudian klik OK.

Tampilannya sebagai berikut :

Hasil dapat dilihat dengan cara klik view data set pada Rcomander. Kemudian akan diperoleh

hasil sebagai berikut :

2.2.6. Compute

Misalkan saja kita ingin melakukan transformasi terhadap variabel kalori yang dimiliki

pada data set uji1 dengan cara menambahkan nilai Sks dengan 20. Untuk melakukan hal

tersebut, pertama-tama aktifkan data set uji1.

Kemudian buka menu Data>Manage variables in active dataset>Compute variable ...


Pilih variabel kalori, tulis nama variabel baru dengan nama Sks_baru, dan tulis pada

expression to compute dengan Sks+20

Hasil dapat dilihat dengan cara klik view data set pada Rcomander. Kemudian akan diperoleh

hasil sebagai berikut :


2.2.7. Menghapus variabel pada dataset

Klik Data > Manage variables in active data se t> Delete variable from data set ...

Kemudian akan tampil sebagai berikut ini :

Pilih variabel yang akan dihapus, misalkan variabel yang akan dihapus adalah variabel

IPK_kode maka klik pada IPK_kode kemudian OK.


2.2.8. Menghapus baris pada dataset

Klik Data > active data set > Remove row(s) from active data set ...

Kemudian akan muncul sebagai berikut :

Tuliskan baris ke berapa saja yang akan dihapus pada jendela dialog di atas, misal baris yang

akan dihapus adalah baris ke 2 dan 3 maka tuliskan seperti di atas dan diperoleh hasil sebagai

berikut :


2.3. Latihan

1. Berikut data nilai ujian mata kuliah statistika dari 28 mahasiswa :

59 99 55 20

80 78 68 9

39 86 60 35

78 64 84 60

67 69 90 58

59 50 63 7

68 41 77 44

a. Lakukan entry data nilai ujian mata kuliah statistika di atas.

b. Lakukan recode pada data di atas dengan kategori sebagai berikut:

Nilai Kode

0 – 20 1

21 - 40 2

41 - 60 3

61 - 80 4

81 - 100 5


BAB III

RINGKASAN DAN PENYAJIAN DATA NUMERIK

Tujuan Praktikum

a. Praktikan mampu melakukan peringkasan data numerik

b. Praktikan dapat melakukan penyajian data numerik (berupa boxplot, stem and leaf, dan

histogram)

3.1. Pendahuluan

Ringkasan Numerik merupakan ringkasan data yang berupa statistik-statistik seperti

jumlah data (N), rata-rata (mean), median, deviasi standar, standar eror, kuartil1 (Q1), kuartil3

(Q3), dan sebagainya. Ringkasan numerik memberikan gambaran data berupa ukuran pusat,

letak data dan ukuran dispersi dalam bentuk numerik. Selain itu, ringkasan numerik juga

diperlukan sebagai estimasi dari nilai-nilai karakteristik data. Sedangkan penyajian data

numerik dapat dilakukan melalui grafik dan tabel. Grafik dan tabel yang bermanfaat untuk

menggambarkan data, di antaranya adalah histogram, bar chart, box plot, stem and leaf plot,

scatter plot, dan lain-lain.

3.2. Ringkasan Numerik

3.2.1. Contoh 1

Berikut data nilai UTS mata kuliah statistika dari 21 mahasiswa :

59 99 55

80 78 68

39 86 60

78 64 84

67 69 90

59 50 63

68 41 77

Langkah – langkah membuat ringkasan numerik (menggunakan numerical summaries) :

a. Input data UTS pada notepad kemudian import ke Rcmdr

b. Setelah data dimasukkan kemudian pilih menu


Statistics > Summaries > Numerical Summaries > ok

c. Output :

Mean sd IQR 0% 25% 50% 75% 100% N

68.28571 15.46009 19 39 59 68 78 99 21

d. Langkah – langkah membuat ringkasan numerik (menggunakan Active data set):

a. Input data UTS pada notepad kemudian import ke Rcmdr


Statistics > Summaries > Active data set > ok

c. Output :


>summary(UTS)

UTS

Min : 39.00

1st Qu. : 59.00

Median : 68.00

Mean : 68.29

3rd Qu. : 78.00

Max : 99.00

Dari output di atas dapat diketahui nilai ringkasan numeriknya, yaitu nilai UTS statistik

terendah adalah 39 (Min.) sedangkan yang tertinggi adalah 99 tahun (Max.), rata-rata (Mean)

nilainya 68,29 , nilai kuartil1 (1st Qu.), median, dan kuartil3 (3rd Qu.) berturut-turt 59, 68,

dan 78.

3.2.2. Contoh 2

Berikut data nilai UTS dan UAS mata kuliah statistika dari 12 mahasiswa :

UTS UAS

59 60

80 85

39 50

78 80

67 60

59 65

68 70

99 96

78 81

86 85

64 70

69 71

Langkah-langkah (menggunakan numerical summaries) :

a. Input data pada data set Rcmdr :


b. Untuk menampilkan ringkasan numerik dari nilai UTS dan UAS, pilih menu

Statistics > Summaries > Numerical Summaries > pilih UTS dan UAS > OK

c. Output :

mean sd IQR 0% 25% 50% 75% 100% N

UAS 72.75 13.08104 18.25 50 63.75 70.5 82.0 96 12

UTS 70.50 15.30003 15.75 39 62.75 68.5 78.5 99 12

Langkah-langkah (menggunakan Active data set) :



Statistics > Summaries > Active data set > ok

c. Output :

>summary(nilai)

UTS UAS

Min : 39.00 Min : 50.00

1st Qu. : 62.75 1st Qu. : 63.75

Median : 68.50 Median : 70.50

Mean : 70.50 Mean : 72.75

3rd Qu. : 78.50 3rd Qu. : 82.00

Max : 99.00 Max : 96.00


3.3. Penyajian Data

3.3.1. Diagram batang dan daun (steam and leaf plot)

Secara umum, diagram batang dan daun dapat menggambarkan bentuk visual data

dengan menggunakan data aslinya. Bagian yang berperan sebagai batang adalah angka yang

mempunyai level lebih besar daripada angka pada daun. Sebagai contoh batang adalah

puluhan, maka sebagai daun adalah satuannya. Banyaknya daun dalam satu batang dapat

lebih dari satu.

Contoh 1

Langkah-langkah:

1. Aktifkan data UTS pada data set Rcmdr.

2. Setelah data diaktifkan kemudian pilih menu Graphs > Steam-and-leaf-display... > OK

Leaf Digit dapat diganti sesuai keinginan.

3. Output (menggunakan leaf digit Automatic):


1 | 2: represents 12

leaf unit : 1

n : 21

1 3. | 9

2 4* | 1

4. |

3 5* | 0

6 5. | 599

9 6* | 034

(4) 6. | 7889

7* |

8 7. | 788

5 8* | 04

3 8. | 6

2 9* | 0

1 9. | 9

4. Keterangan output:

a. Leaf unit (unit daun/ satuan) sebesar 1 atau sepersatuan.

b. Kolom paling kiri menunjukkan frekuensi kumulatif lebih dari sama dengan

(terletak di bawah (4)) dan kurang dari sama dengan (terletak di atas (4)),

sedangkan (4) menunjukkan bahwa median dari data terletak pada baris tersebut.

c. Kolom tengah menunjukkan batang dan kolom paling kanan menunjukkan daun.

Contoh 2

Langkah-langkah:

a. Aktifkan data UTS UAS pada data set Rcmdr

b. Setelah data diaktifkan kemudian pilih menu Graphs > Steam-and-leaf-display > pilih

UTS> hilangkan check-list pada Automatic pilih Leaf Digits 1OK


c. Output :

> stem.leaf(nilai$UTS, unit=1,

na.rm=TRUE)


leaf unit: 1

n: 12

1 3 | 9

4 |

3 5 | 99

(4) 6 | 4789

5 7 | 88

3 8 | 06

1 9 | 9

> stem.leaf(nilai$UAS, unit=1,

na.rm=TRUE)


leaf unit: 1

n: 12

1 5* | 0

5. |

3 6* | 00

4 6. | 5

(3) 7* | 001

7. |

5 8* | 01

3 8. | 555

9* |

1 9. | 6

Beberapa keuntungan dari diagram batang dan daun adalah :

1. Dapat melihat bentuk distribusi data,

2. Melihat data aslinya,

3. Melihat adanya data ekstrem,

4. Dapat menentukan frekuensi dengan cepat dan tepat,

5. Dapat membandingkan beberapa data.

3.3.2. Boxplot (diagram kotak dan titik)

Seperti halnya diagram batang dan daun, diagram kotak dan titik juga dapat digunakan

untuk melihat bentuk distribusi data serta melihat dengan mudah adanya data ekstrem.

Contoh 1

Langkah-langkah:


a. Aktifkan data UTS pada data set Rcmdr.

b. Setelah data diaktifkan kemudian pilih menu Graphs > Boxplot... > OK

Pada output di atas terlihat bahwa boxplot UTS tersebut simetris.

Contoh 2

Langkah-langkah:

a. Misalnya ingin dibandingkan boxplot nilai UTS dan UAS.

b. Buatlah data baru berdasarkan data nilai dengan format seperti ini :

40

50

60

70

80

90

10

0

UT

S

nilai maksimum

kuartil atas (Q3)

median

kuartil bawah (Q1)

nilai minimum


c. Setelah data di atas siap, pilih menu Graphs > Boxplot.. > variable = nilai

d. Output

Dari output di atas terlihat bahwa boxplot UAS relatif lebih tinggi dibandingkan

boxplot UTS. Hal ini berarti ada kenaikan nilai mahasiswa.

3.3.3. Histogram

Contoh 1

Langkah-langkah:

1. Aktifkan data UTS pada data set Rcmdr.

2. Setelah data diaktifkan kemudian pilih menu Graphs Histogram..

UAS UTS

40

50

60

70

80

90

10

0

UTS_UAS

nila

i


Pada Option tersedia pilihan untuk menentukan jumlah interval yang diinginkan, yaitu

pada kolom Number of bins. Namun, pada praktikum ini digunakan automatic method untuk

jumlah interval (metode Sturges). Untuk scaling (harga yang ada pada histogram) digunakan

Frequency counts. Selanjutnya klik ok, maka akan ditampilkan output histogram sebagai

berikut:

Grafik histogram di atas menunjukkan data cukup simetris.

3.4. Latihan

1. Berikut ini adalah data hasil pengamatan jumlah pengunjung perpustakaan D3 Informasi

dan Intrumentasi selama Bulan Juni.

39 50 41

38 45 21

29 45 40

29 38 49

44 34 44

35 31 45

43 47 49

45 38 25

UTS

fre

qu

en

cy

30 40 50 60 70 80 90 100

01

23

45

6


Berdasarkan data tersebut, buatlah :

a. Ringkasan numeriknya,

b. Diagram Boxplot, stem and leaf dan histogramnya.

2. Perhatikan nilai ujian basis data untuk 40 orang mahasiswa berikut ini :

79 49 48 72

80 84 90 70

70 71 92 38

68 71 85 51

90 35 83 73

92 93 76 21

80 91 58 72

30 72 99 95

58 20 83 82

76 57 88 70

Berdasarkan data tersebut, buatlah :

a. Ringkasan numeriknya,

b. Diagram Boxplot, stem and leaf dan histogramnya.


BAB IV

RINGKASAN DAN PENYAJIAN DATA KATEGORI

Tujuan Praktikum

a. Praktikan mampu melakukan peringkasan data kategori

b. Praktikan dapat melakukan penyajian data kategori (berupa bar graph dan pie chart)

4.1. Pendahuluan

Adakalanya data kuantitatif ingin kita bentuk ke dalam data kualitatif (kategori), yaitu

dikelompokkan menjadi beberapa bagian. Misalnya ada data mengenai tekanan darah,

kemudian data tersebut ingin dikelompokkan menjadi tekanan darah rendah, normal, dan

tinggi. Contoh yang lain misalnya ada data IPK mahasiswa, kemudian ingin dikelompokkan

menjadi rendah, sedang dan tinggi, dan masih banyak contoh-contoh yang lain.

Contoh

Berikut data IPK dari 20 mahasiswa

1.6 3.6

2.2 3.4

2.6 3.3

3.4 2.9

3.1 2.8

2.7 3.0

2.3 2.4

2.6 1.9

2.5 2.5

2.8 2.8


Entry data sebagai berikut :

Data IPK di atas akan diubah menjadi data kualitatif dengan cara coding yaitu IPK

yang di bawah 2 termasuk IPK rendah, IPK antara 2 sampai 2.9 termasuk IPK sedang dan

IPK di atas atau sama dengan 3 termasuk IPK tinggi.

Klik Data > manage variable in active data set > recode variable

Pada view data set akan muncul sebagai berikut :


Pada view data set muncul variabel baru IPK_kode yang merupakan coding dari nilai

IPK. Variabel IPK_kode akan kita ganti untuk 1 = rendah, 2 = sedang, 3=tinggi dengan cara

klik Data > manage variable in active data set > convert numeric variables to factors. Pilih

IPK_kode. Klik OK.

Selanjutnya akan muncul peringatan. Klik Yes.

Ganti nama variabel IPK_kode dan klik OK.


Selanjutnya, view dataset akan muncul sebagai berikut :

4.2. Distribusi Frekuensi

Summaries > Frequency distribution

Output :

> .Table # counts for IPK_kode

rendah sedang tinggi

2 12 6

> round(100*.Table/sum(.Table), 2) # percentages for IPK_kode


10 60 30


Dari output di atas diperoleh IPK yang rendah berjumlah 2 mahasiswa, IPK sedang

berjumlah 12 mahasiswa, dan IPK tinggi berjumlah 6 mahasiswa. Sedangkan persentase pada

masing-masing kategori yaitu IPK rendah = 10%, IPK sedang = 60%, dan IPK tinggi = 30%.

4.3. Penyajian Data Kategori

Bar Graph

Langkah- langkah penyajian data menggunakan Bar Graph adalah :

a. Graph > Bar Graph

b. Output :

Dari bar graph di atas terlihat bahwa mahasiswa paling banyak IPK-nya adalah

berkategori sedang yaitu berjumlah 12 mahasiswa, sedangkan mahasiswa yang IPK-nya

rendah hanya 2 mahasiswa dan IPK-nya tinggi berjumlah 6 mahasiswa.

Pie chart

a. Graph > Pie Chart


IPK_kode

Fre

qu

en

cy

02

46

81

01

2


b. Output :

Pada pie chart terlihat bahwa bagian yang berwarna merah muda menunjukkan bagian

yang paling kecil yaitu IPK mahasiswa rendah dan bagian yang paling besar adalah berwarna

hijau yaitu IPK mahasiswa sedang.

4.4. Latihan

1. Sebuah kota disebut metropolitan, berkembang atau kecil dilihat dari jumlah penduduk

yang menempati kota tersebut. Jika jumlah penduduk di kota tersebut melebihi 100.000

penduduk maka disebut kota metropolitan. Jika kota tersebut memiliki penduduk

melebihi 30.000 penduduk dan tidak melebihi angka 100.000 maka disebut kota

berkembang. Sedangkan jika kota tersebut memiliki penduduk tidak lebih dari 30.000

penduduk maka disebut kota kecil.

126.557 113.902 14.845

37.546 87.561 30.381

30.381 13.543 41.553

29.431 109.881 254.578

98.478 9.856 98.765

rendah

sedang

tinggi

IPK_kode

IPK_kode

Fre

qu

en

cy


Berdasarkan jumlah penduduk di bawah ini, buatlah

a. Tabel distribusi frekuensi dengan kategori kota!

b. Diagram lingkaran dan diagram batangnya!


79 49 48 72

80 84 90 70

70 71 92 38

68 71 85 51

90 35 83 73

92 93 76 21

80 91 58 72

30 72 99 95

58 20 83 82

76 57 88 70

Jika nilai di atas dikategorikan dengan nilai huruf :

0 – 20 = E, 21 – 40 = D, 41 – 60 = C, 61 – 80 = B, 81 – 100 = A

a. Buatlah tabel distribusi frekuensi dari data di atas

b. Buatlah diagram lingkaran dan diagram batangnya!


BAB V

TRANSFORMASI DATA

Tujuan Praktikum

a. Praktikan mampu melakukan transformasi data yang sesuai pada data yang tidak simetris.

5.1. Pendahuluan

Dalam analisis statistik sering kali diperlukan asumsi data berdistribusi normal. Apabila

digambarkan dalam bentuk grafik, data yang berdistribusi normal akan berbentuk kurang

lebih sebagai berikut.

Terdapat cara yang sederhana untuk mengetahui apakah data berdistribusi normal atau

tidak, yaitu dengan menggunakan diagram kotak dan titik atau dikenal juga dengan boxplot.

Boxplot terdiri dari 5 ukuran, yaitu median, kuartil atas, kuartil bawah, maksimum, dan

minimum. Bentuk boxplot adalah sebagai berikut.

0 2000 4000 6000 8000

0.0

0.1

0.2

0.3

0.4

Index

data

_nor

mal

Maksimum

Kuartil atas

Median

Kuartil bawah

Minimum


Pada data yang berdistribusi normal, nilai median berada di tengah-tengah kotak dan

jarak antara kuartil atas dengan maksimum sama dengan jarak kuartil bawah dengan

minimum, sehingga bentuk boxplot simetris. Apabila nilai median berada di tengah-tengah

kotak tetapi jarak antara kuartil atas dengan maksimum berbeda dengan jarak antara kuartil

bawah dengan minimum, maka sudah cukup dapat dikatakan data berdistribusi normal.

Data yang tidak berdistribusi normal memiliki bentuk box plot yang tidak simetris.

Apabila median lebih dekat dengan kuartil atas, maka box plot dikatakan menjurai ke bawah.

Data mengumpul di nilai-nilai yang besar.

Apabila median lebih dekat dengan kuartil bawah, maka box plot dikatakan menjurai ke

atas. Data mengumpul di nilai-nilai yang kecil.


Untuk mengatasi data yang tidak berdistribusi normal, dapat dilakukan transformasi

data. Pemilihan transformasi yang tepat dapat dilakukan menggunakan “Tangga

Transformasi” yang dibuat oleh Tukey. Berikut tangga transformasi.

Pemilihan transformasi dilakukan berdasarkan tipe juraian, yaitu menjurai ke atas atau ke

bawah, serta kuat atau tidaknya juraian.

5.2. Contoh

Berikut data jumlah tamu yang berkunjung dalam waktu 2 bulan pada 21 hotel :

150 200 121

175 210 103

149 215 97

180 225 120

190 300 99

195 112 90

185 140 142

Untuk mengetahui data sudah berdistribusi normal atau belum, dibuat boxplot dari

data tersebut, namun sebelumnya lakukan entry data.

0.0

0.1

0.2

0.3

0.4


Selanjutnya, akan tampil sebagai berikut :

Kemudian tampilkan boxplot-nya dengan cara Graphs Boxplot..

Output :

10

01

50

20

02

50

30

0

jml_

tam

u


Pada output di atas terlihat bentuk boxplot jumlah tamu agak menjurai ke atas.

Selanjutnya akan dilakukan transformasi untuk jumlah tamu tersebut. Karena data menjurai

ke atas, akan dicoba dilakukan transformasi menggunakan x . Dibuat variabel baru yang

merupakan akar dari variabel jml_tamu.

Pilih Data > Manage variables in active dataset > Compute variable ...

Selanjutnya pada view data set akan muncul variabel baru, yaitu akar_jml_tamu.

Selanjutnya dibuat boxplot dari variabel akar_jml_tamu untuk mengetahui apakah

variabel tersebut sudah berdistribusi normal atau belum, diperoleh hasil sebagai berikut :


Terlihat data masih sedikit menjurai ke atas, maka dicoba transformasi log x.

Transformasi log x dapat dilakukan dengan cara klik Data > Manage variables in active

dataset > Compute variable ...

Pada view data set akan muncul variabel baru dengan nama log_jml_tamu.

10

12

14

16

aka

r_jm

l_ta

mu


Kemudian buat boxplot untuk variabel log_jml_tamu :

Terlihat boxplot sudah cukup simetris. Sehingga transformasi yang cocok adalah log(x).

5.3. Latihan

1. Berikut ini adalah data hasil pengamatan jumlah pengunjung perpustakaan D3

Informasi dan Instrumentasi selama Bulan Juni.

39 50 41

38 45 21

29 45 40

29 38 49

44 34 44

35 31 45

43 47 49

45 38 25

Apakah data tersebut simetris? Jika tidak, lakukan transformasi data yang sesuai!


79 49 48 72

80 84 90 70

70 71 92 38

68 71 85 51

90 35 83 73

92 93 76 21

80 91 58 72

30 72 99 95

58 20 83 82

76 57 88 70

Apakah data tersebut simetris? Jika tidak, lakukan transformasi data yang sesuai!

2.0

2.1

2.2

2.3

2.4

log

_jm

l_ta

mu


BAB VI

DATA RANDOM DAN DISTRIBUSI PELUANG

Tujuan Praktikum

1. Praktikan mampu membangkitkan data berdistribusi normal dan student-t.

2. Praktikan mampu menghitung kuartil distribusi normal dan student-t.

3. Praktikan mampu menghitung probabilitas pada distribusi normal dan student-t.

6.1. Distribusi Normal

Distribusi normal, disebut juga distribusi Gauss, adalah distribusi probabilitas yang

paling banyak digunakan dalam berbagai analisis statistika dan kebanyakan pengujian

hipotesis mengasumsikan normalisasi suatu data. Distribusi normal baku adalah distribusi

normal yang memiliki rata-rata nol dan simpangan baku satu. Distribusi ini juga dijuluki

kurva lonceng (bell curve) karena grafik fungsi kepekatan probabilitasnya mirip dengan

bentuk lonceng. Distribusi normal memiliki sifat simetris, yaitu mean distribusi terletak di

tengah dengan luas bagian sebelah kiri sama dengan bagian sebelah kanan (berbentuk

lonceng) sehingga total daerah di bawah kurva sebelah kiri = total daerah di bawah kurva

sebelah kanan = 0,5

dengan π = 3,14159… dan e = 2,71828

Selain beberapa konstanta yang tidak akan berubah nilainya (e, π), bentuk distribusi

kurva normal ditentukan oleh tiga variabel, yaitu:

x = nilai dari distribusi variabel

μ = mean dari nilai-nilai distribusi variabel

σ = standar deviasi dari nilai-nilai distribusi variabel

xexf

x

,2

1),;(

2

22

)(

2

2

http://id.wikipedia.org/wiki/Distribusi_probabilitas

http://id.wikipedia.org/wiki/Statistika

http://id.wikipedia.org/w/index.php?title=Pengujian_hipotesis&action=edit&redlink=1



http://id.wikipedia.org/wiki/Rata-rata

http://id.wikipedia.org/wiki/Simpangan_baku

http://id.wikipedia.org/wiki/Fungsi_kepekatan_probabilitas


6.1.1. Membangkitkan data berdistribusi normal

Contoh 1

1. Akan digenerate data berdistribusi normal dengan jumlah data 30, mean = 0 dan sd =1.

2. Ketikkan perintah berikut pada Rconsole

> rnorm(30,0,1)

3. Output :

[1] 0.5983855 0.7116100 17.798.840 -0.7995579 0.5873402 0.7797935

[7] -0.5498465 -0.6635432 -0.7301439 0.2039722 -0.8284992 0.2853933

[13] -0.1644072 13.300.272 14.178.972 0.1490345 0.3342537 0.8401881

[19] -0.1758526 -0.1296207 -0.1290194 -0.5588599 20.510.804 0.4010594

[25] -14.258.976 -0.2047000 0.6815185 -0.6308402 0.4461653 -0.5619954

Contoh 2

1. Akan digenerate data berdistribusi normal dengan jumlah data 20, mean = 1 dan sd =1.5


> rnorm(20,1,1.5)

3. Output :

[1] -0.08308384 -0.83413525 -161.502.683 256.278.227 0.09009768 0.92929601

[7] 231.988.484 -145.564.267 0.76614766 0.77806463 318.023.558 0.17707811

[13] -1.66562843 0.81019267 136.364.658 -135.878.857 -0.70399104 165.615.288

[19] -228.021.370 187.995.815

6.1.2. Menghitung quantil (z tabel)

Tentukan harga Zα, sedemikian P (Z ≤ Zα,) = α (lower tail) atau P (Z ≥ Zα,) = 1-α (upper tail)

untuk harga α berikut:

Langkah

Rcmdr > Distributions > Normal Distributions > Normal Quantiles

Contoh 1 Lower tail pada α = 0.05


Output

> qnorm(c(0.05), mean=0, sd=1, lower.tail=TRUE)

[1] -1.644854

Contoh 1 Upper tail

Output :

> qnorm(c(0.05), mean=0, sd=1, lower.tail=FALSE)

[1] 1.644854


6.1.3. Menghitung probabilitas (p-value)

Langkah :

Rcmdr > Distributions > Normal Distributions > Normal Probabilities

Contoh 1

Hitung probabilitas P (Z < 2,5)!

Output

> pnorm(c(2.5), mean=0, sd=1, lower.tail=TRUE)

[1] 0.9937903

Contoh 2

Hitung probabilitas P (Z > 2,5)!


Output

> pnorm(c(2.5), mean=0, sd=1, lower.tail=FALSE)

[1] 0.006209665

Selain menggunakan program R, perhitungan probabilitas distribusi normal juga bisa

menggunakan tabel distribusi normal, yaitu tabel yang memuat probabilitas dari berbagai

nilai variabel dalam distribusi normal. Yang menjadi masalah dalam penyusunan tabel

tersebut adalah kenyataan bahwa terdapat banyak sekali macam distribusi normal,

dipengaruhi oleh besarnya nilai mean (μ) dan standar deviasinya (σ). Untuk mengatasi hal

tersebut, maka para ahli hanya membuat satu buah tabel yaitu tabel untuk menghitung nilai-

nilai probabilitas distribusi normal standar, sedangkan jika akan menghitung probabilitas

nilai-nilai variabel distribusi normal yang tidak standar, tetap bisa menggunakan tabel

distribusi normal standar tersebut dengan memakai metode konversi. Yang dimaksud

distribusi normal standar adalah distribusi normal dengan sifat khusus, yaitu distribusi

dengan normal yang mean = 0 dan standar deviasi = 1. Namun, apabila menggunakan

program R maka bisa langsung menghitung probabilitas dengan cara menyesuaikan nilai

mean dan standar deviasinya.

Dapat dihitung menggunakan tabel Normal Standar dengan terlebih dahulu

mentransformasikan skala ke ,

Contoh

Distribusi normal dengan mean 𝜇 = 60 dan deviasi standar 𝜎 = 12, N(60,122). Akan

dihitung P(X<76).

Jawab

Melakukan transformasi X ke Z dengan cara sebagai berikut :

dxebXP

b x

2

22

)(

22

1)(

),(~ 2NX )1,0(~ NZ

XZ


maka

)33,1( ZP dicari menggunakan Rcmdr sebagai berikut :

Distribution > continuous distributions > Normal distribution > normal probabilities

Output

> pnorm(c(1.33), mean=0, sd=1, lower.tail=TRUE)

[1] 0.9082409

Jadi P(X<76) dengan mean 𝜇 = 60 dan deviasi standar 𝜎 = 12 adalah 0.91.

Langsung menyesuaikan nilai mean dan standar deviasi pada program R :

Output

> pnorm(c(76), mean=60, sd=12, lower.tail=TRUE)

[1] 0.9087888

Jadi P(X<76) dengan mean 𝜇 = 60 dan deviasi standar 𝜎 = 12 adalah 0.91.

6.2. Distribusi Student-t

Distribusi dengan variabel acak kontinu lainnya selain dari distribusi normal ialah distribusi

student atau distribusi-t. Fungsi densitasnya adalah :

33,1

12

6076

XZ

9082,0

)33,1(

)12

6076()76(

ZP

XPXP

2/12

12/

2/11);(

ttfT


6.2.1. Membangkitkan data berdistribusi student-t

Contoh 1

1. Akan digenerate data berdistribusi t dengan n = 30 derajat bebas (df) = 29


> rt(30,29)

3. Output

[1] -0.94589143 157.648.795 -114.010.950 -0.23615789 -0.44198098 -0.18686742

[7] 223.321.053 0.03286632 129.338.590 148.717.072 -140.589.470 -0.67482811

[13] 0.73623844 0.69210436 -131.728.576 -0.19948329 231.273.571 0.65029448

[19] 156.583.856 -0.33549403 -174.624.680 -0.42242872 -149.979.037 -0.01405696

[25] 211.386.245 165.604.664 -0.38456833 0.64421307 119.870.866 -0.91036348

Contoh 2

1. Akan digenerate data berdistribusi t dengan n = 20 derajat bebas (df) = 19.


>rt(20,19)

3. Output

[1] 0.79774930 -0.33928362 0.50735857 0.48591979 149.433.708 -152.215.201

[7] -0.70716824 -124.884.096 0.24890676 -0.12314463 -299.654.585 -103.572.273

[13] 182.672.652 -0.26042455 -0.07129386 -122.985.248 0.38592455 -0.32887532

[19] 0.51296267 0.22746948

6.2.2. Menghitung quantil (t tabel)

Langkah

Rcmdr > Distributions > t Distributions > t Quantiles

Contoh

Tentukan harga quantil dari distribusi t dengan α = 0.05 dan derajat bebas 9

Lower Tail

Output Lower Tail

> qt(c(0.05), df=9, lower.tail=TRUE)

[1] -1.833113


Upper Tail

Output Upper Tail

> qt(c(0.05), df=9, lower.tail=FALSE)

[1] 1.833113

6.2.3. Menghitung probabilitas (menghitung (p_value))

Contoh 1

Hitung probabilitas distribusi t dengan nilai t < 2.5 dengan db=9

Output

> pt(c(2.5), df=9, lower.tail=TRUE)

[1] 0.9830691

Jadi P(t<2.5) dengan db=9 adalah 0.9830691

Contoh 2

Hitung probabilitas distribusi t dengan nilai t > 2.5 dengan db=9

Output

> pt(c(2.5), df=9, lower.tail=FALSE)

[1] 0.01693091

Jadi P(t>2.5) dengan db=9 adalah 0.01693091


6.3. Latihan

1. Bangkitkan data berdistribusi normal dengan :

a. n = 65, mean = 10, dan sd = 3

b. n = 45, mean = 10, dan sd = 4

c. n = 100, mean = 11, dan sd = 5

2. Bangkitkan data berdistribusi t dengan :

a. n = 95, db = 94

b. n = 55, db = 54

c. n = 28, db = 27

3. Hitung nilai dari :

a. Z0.85

b. Z0.08

c. Z0.42


a. P(Z > 2.6)

b. P(Z < -1.6)

c. P(-0.8 < Z< 1.4)


a. t0.15;15

b. t0.8;23

c. t0.35;18


a. P(t > 1.9) dengan db=12

b. P(t < -1.45) dengan db=15

c. P(t > -0.25) dengan db=12


BAB VII

UJI PROPORSI

Tujuan Praktikum

1. Praktikan mampu melakukan analisis data menggunakan uji proporsi 1 populasi

2. Praktikan mampu melakukan analisis data menggunakan uji proporsi 2 populasi

7.1. Uji Proporsi Satu Populasi

Uji Hipotesis. Kita ingin menguji suatu hipotesis bahwa persentase suatu populasi sama

dengan harga tertentu p0 dalam kasus n besar. Uji ini dapat dilakukan dalam langkah-langkah

sebagai berikut :

1. Merumuskan Hipotesis

a. H0 : p = p0 (uji dua sisi)

H1 : p ≠ p0

b. H0 : p ≤ p0 (uji sisi kanan)

H1 : p > p0

c. H0 : p ≥ p0 (uji sisi kiri)

H1 : p < p0

2. Menentukan tingkat signifikansi α

3. Statistik Penguji

dimana x = jumlah „sukses‟ dalam sampel atau menggunakan p-value

4. Daerah kritis : daerah dimana H0 ditulak H1 diterima

Ho ditolak jika p_value < α

5. Kesimpulan

Berdasarkan langkah 4 dan hasil hitungan statistik penguji langkah 3, diambil

kesimpulan apakah H0 ditolak atau tidak ditolak pada tingkat signifikansi α.

Langkah-langkah dengan Rconsole

Buka R, lalu pada Rconsole ketikkan perintah berikut :

> prop.test (x, n, p = NULL, alternative = c("two.sided",

"less", "greater"), conf.level = 0.95, correct = TRUE)

x : Jumlah sukses

n : Jumlah total

n

xp


p : proporsi

alternative : hipotesis alternatif

conf.level : level konfidensi / tingkat keyakinan

Contoh

Pabrik gelas “Kawung” mengklaim bahwa lebih dari 95% gelas yang diproduksinya

berkualitas baik. Sebuah penelitian dari 200 sampel gelas memperlihatkan adanya gelas yang

cacat sebanyak 18 buah. Apakah anda menerima pernyataan pabrik tersebut? Uji dengan taraf

signifikasi 5% !

Jawab

p = 0.95

n = 200

x = 182

Syntax

> prop.test(182,200,0.95,c("greater"))

Output

1-sample proportions test with continuity correction

data: 182 out of 200, null probability 0.95

X-squared = 5.9211, df = 1, p-value = 0.9925

alternative hypothesis: true p is greater than 0.95

95 percent confidence interval:

0.8681495 1.0000000

sample estimates:

p

0.91


H0 : p ≤ 0.95 (gelas yang diproduksi pabrik “Kawung” kurang dari sama dengan 95%

yang berkualitas baik)

H1 : p > 0.95 (gelas yang diproduksi pabrik “Kawung” lebih dari 95% yang berkualitas

baik)

2. Menentukan tingkat signifikansi α = 0.05


p-value = 0.9925

4. Daerah kritis : daerah dimana H0 ditulak H1 diterima


5. Kesimpulan


p-value = 0.9925 > 0.05 maka H0 tidak ditolak jadi gelas yang diproduksi pabrik

“Kawung” kurang dari sama dengan 95% yang berkualitas baik. Dengan kata lain gelas

yang diproduksi pabrik “Kawung” tidak lebih dari 95% yang berkualitas baik sehingga

pernyataan pabrik tersebut tidak dapat diterima.

7.2. Uji Proporsi Dua Populasi

Ingin diuji suatu hipotesis bahwa selisih proporsi (persentase) dua populasi p1-p2 sama

dengan harga p0 tertentu. Dengan n1 dan n2 yang cukup besar dan dengan dasar penyusunan

inferensi yang sama seperti dalam estimasi interval, dapat disusun uji hipotesis sebagai

berikut :


a. H0 : (p1-p2) = p0 (uji dua sisi)

H1 : (p1-p2) ≠ p0

b. H0 : (p1-p2) ≤ p0 (uji sisi kanan)

H1 : (p1-p2) > p0

c. H0 : (p1-p2) ≥ p0 (uji sisi kiri)

H1 : (p1-p2) < p0

2. Menentukan tingkat signifikansi α


menggunakan p-value

4. Daerah kritis : daerah dimana H0 ditolak H1 diterima


5. Kesimpulan

Berdasarkan langkah 4 dan hasil hitungan statistik penguji langkah 3, diambil kesimpulan

apakah H0 ditolak atau tidak ditolak pada tingkat signifikansi α.

Langkah-langkah pada Rconsole ketikkan perintah berikut :

x.total=c(x1,x2)

n.total=c(n1,n2)

prop.test(x.total,n.total,alternative=c("two.

sided","less","greater"),conf.level=0.95)

Contoh

Bagian akademik Vokasi ingin mengetahui perbandingan antara mahasiswa tahun kedua dan

mahasiswa tahun ketiga yang bekerja sebagai programmer di luar tugas kuliah. Dari 150

mahasiswa tahun kedua dan 120 mahasiswa tahun ketiga yang berhasil diwawancarai,

diketahui ada 30 mahasiswa tahun kedua dan 63 mahasiswa tahun ketiga yang bekerja


sebagai programmer di luar tugas kuliah. Jika alpa = 5%, tentukan apakah ada perbedaan

proporsi mahasiswa yang bekerja sebagai programmer di luar tugas kuliah antara mahasiswa

tahun kedua dan ketiga?

Jawab

n1 = jumlah mahasiswa tahun kedua = 150

n2 = jumlah mahasiswa tahun ketiga = 120

x1 = jumlah mahasiswa tahun kedua yang bekerja sebagai programmer = 30

x2 = jumlah mahasiswa tahun ketiga yang bekerja sebagai programmer = 63

alpa = 5%

Syntax

x.total=c(30,63)

n.total=c(150,120)

prop.test(x.total,n.total,alternative="two.sided",conf.level=0.95)

Output

2-sample test for equality of proportions with continuity correction

data: x.total out of n.total

X-squared = 29.7624, df = 1, p-value = 4.884e-08

alternative hypothesis: two.sided


-0.4424117 -0.2075883

sample estimates:

prop 1 prop 2

0.200 0.525


H0 : p1 = p2 (tidak ada perbedaan proporsi mahasiswa yang bekerja sebagai programmer di

luar tugas kuliah antara mahasiswa tahun kedua dan ketiga)

H1 : p1 ≠ p2 (ada perbedaan proporsi mahasiswa yang bekerja sebagai programmer di luar

tugas kuliah antara mahasiswa tahun kedua dan ketiga)

2. Menentukan tingkat signifikansi α = 0.05


p-value = 4.884e-08 = 4.884 x 10-8

4. Daerah kritis : daerah dimana H0 ditolak H1 diterima


5. Kesimpulan

p-value = 4.884 x 10-8

< 0.05 maka H0 ditolak jadi ada perbedaan proporsi mahasiswa

yang bekerja sebagai programmer di luar tugas kuliah antara mahasiswa tahun kedua dan

ketiga.


7.3. Latihan

1. Siti membuat jus mangga buatan sendiri untuk dijual di perpustakaan UGM. Petugas

perpustakaan menyatakan bahwa banyak pengunjung perpustakaan menyukai jus

mangga buatan Siti. Siti akan menambah jumlah produksi jika pengunjung yang

menyukai jus mangganya berjumlah lebih dari 80%. Siti pun membuat kuisioner dengan

bertanya ke 50 pengunjung perpustakaan selama seminggu, hasilnya 38 pengunjung

menyukai jus mangga buatan Siti. Dari keterangan di atas, apakah Siti jadi menambah

jumlah produksi jus mangga buatannya? Gunakan α = 5%!

2. Seorang mahasiswa KOMSI yang sedang menyelesaikan Tugas Akhir melakukan sebuah

penelitian tentang efektivitas sistem yang dibuatnya. Jika lebih dari 90% pengguna

menganggap bahwa sistemnya mudah dipelajari dan sesuai kebutuhan maka mahasiswa

ini jadi menerapkan sistemnya tersebut di instansi terkait. Mahasiswa ini menggunakan

alpa dan beta testing dan meminta beberapa orang untuk mencoba sistem dan meminta

testimoni sistem pada respondennya. Dari 110 responden yang diminta untuk mencoba

sistemnya, 85 orang menganggap bahwa sistemnya mudah dipelajari dan sesuai dengan

kebutuhan pengguna. Dari keterangan di atas, apakah mahasiswa ini jadi menerapkan

sistemnya di instansi yang membutuhkan? Gunakan α = 5%!

3. Sebuah lembaga survei ingin mengetahui berapa perbandingan antara dosen laki-laki dan

perempuan yang mempunyai pekerjaan lain di luar kampus di sebuah Universitas. Dari

670 dosen pria dan 560 dosen wanita yang berhasil diwawancarai diketahui ada 410

dosen laki-laki dan 277 dosen wanita yang mempunyai pekerjaan di luar kampus. Jika

alpa = 10%, tentukan apakah ada perbedaan proporsi dosen yang mempunyai pekerjaan

lain di luar kampus!

4. Sebuah agen penjualan notebook ingin melihat jenis merk notebook mana yang lebih

handal antara X dan Y. Untuk tujuan tersebut agen menghubungi 500 pembeli notebook

merk X dan 600 pembeli notebook merk Y yang usia notebook-nya kurang dari 2 tahun.

Setiap pembeli diberikan pertanyaan apakah mereka pernah melakukan servis berat

notebook-nya selama 1 tahun terakhir. Hasilnya 90 pembeli merk X dan 65 pembeli merk

Y pernah melakukan servis berat notebook-nya. Apakah ada perbedaan kehandalan

notebook merk X dan Y? (gunakan alpha = 0.05)!


BAB VIII

UJI HIPOTESIS MEAN SATU POPULASI NORMAL

dan VARIANSI TIDAK DIKETAHUI (UJI t)

Tujuan Praktikum

1. Praktikan mampu melakukan analisis data menggunakan uji rata-rata satu populasi

normal dan variansi tidak diketahui.

8.1. Pendahuluan

Jika dipunyai sampel random X1, X2, ..., Xn berasal dari populasi Normal dengan mean μ

dan variansi σ2 maka variabel random

Xt

sn

berdistribusi t dengan derajat bebas (n-1).

Distribusi ini digunakan untuk inferensi mean populasi normal dengan ukuran sampel

(n) kecil (n<30)dan σ tidak diketahui. Untuk n yang semakin besar maka distribusi t ini akan

mendekati distribusi Normal.

8.2. Inferensi Statistik untuk Mean Populasi Normal

8.2.1. Uji hipotesis

Ingin diketahui apakah mean (μ) dari suatu populasi Normal sama dengan μ0

(konstanta) berdasarkan sampel random berukuran n. Langkah uji hipotesisnya dapat di

urutkan sebagai berikut :

1. Hipotesis

a. H0 : μ = μ0 (uji dua sisi)

H1 : μ ≠ μ0

b. H0 : μ ≤ μ0 (uji sisi kanan)

H1: μ > μ0

c. H0 : μ ≥ μ0 (uji sisi kiri)

H1: μ<μ0

2. Diambil tingkat signifikansi α

3. Statistik penguji


Xt

sn

(jika σ tidak diketahui)

atau p_value

4. Daerah kritis: daerah dimana H0 ditolak.

a. H0 ditolak jika

t > t n−1;α/2 atau t < - tn-1:;α/2

b. H0 ditolak jika

t > t n−1;α (untuk uji kanan)

c. H0 ditolak jika

t < - t n−1;α (untuk uji kiri)

atau

d. H0 ditolak jika p_value < α (untuk semua uji)

5. Kesimpulan

Berdasarkan langkah 4 dan hasil hitungan statistik penguji langkah 3, diambil kesimpulan

apakah H0 ditolak atau tidak ditolak pada tingkat signifikansi α.

8.2.2. Interval konfidensi

Misalkan X1, X2, ..., Xn adalah sampel random yang diambil dari populasi Normal

dengan mean μ dan variansi σ2

maka maka interval konfidensi (1-α) 100% untuk μ adalah

B ≤ μ ≤ A

Karena σ2 tidak diketahui maka menurut teorema distribusi t diperoleh

1;2

1;2

n

n

sB X t

n

sA X t

n

dengan nilai 1;

2n

t

diperoleh dari tabel distribusi t.

Karena uji hipotesis dan interval konfidensi di atas menggunakan statistik t, maka sering

dinamakan uji t.

Contoh

Seorang administrator sistem informasi penjualan tiket bus antarkota ingin mengetahui

apakah data penjualan yang masuk pada satu bulan sudah memenuhi target, yaitu menjual

lebih dari 100 tiket per hari. Berikut ini data penjualan tiket dalam 30 hari :

89 53 137


60 64 69

73 117 83

66 143 75

78 58 78

112 73 83

150 63 136

65 70 162

70 78 76

72 100 60

Apakah penjualan tiket tersebut mencapai target ? Gunakan alpha 5%!

Jawab

1. Hipotesis

H0 : μ ≤ 100 (penjualan yang masuk pada satu bulan kurang dari sama dengan 100 tiket per

hari)

H1: μ > 100 (penjualan yang masuk pada satu bulan lebih dari 100 tiket per hari)


3. Statistik penguji

t = -2.3211 dan p-value = 0.9862 yang diperoleh dari :

Statistics > Means > Single sample t-test...

Output

One Sample t-test

data: tiket$tiket

t = -2.3211, df = 29, p-value = 0.9862

alternative hypothesis: true mean is greater than 100


77.65674 Inf

sample estimates:


mean of x

87.1

4. Daerah kritis :

H0 ditolak jika p_value <α

5. Kesimpulan

Karena p_value = 0,9862 > 0,05 maka H0 tidak ditolak, berarti rata-rata penjualan yang

masuk pada satu bulan kurang dari sama dengan 100 tiket per hari. Hal ini menunjukkan

bahwa target penjualan belum terpenuhi.

8.3. Latihan

1. Seorang programmer web internet marketing SEO ingin mengetahui apakah web yang

dibuat pada satu bulan sudah memenuhi target, yaitu minimal dikunjungi 50

pengunjung per hari. Lakukanlah uji hipotesis dengan alpa = 10%! Berikan

interpretasinya? Berikut data yang diperoleh selama 30 hari :

32 53 71

35 64 69

33 57 53

38 66 55

39 58 58

37 67 63

41 56 66

45 66 62

43 59 67

47 63 70

2. Seorang mahasiswa KOMSI mendapat tugas praktikum statistika untuk mengetahui

berapakah jumlah pengunjung kantin selama 20 hari kerja sudah sesuai target pemilik

kantin, yaitu 50 orang/hari. Lakukanlah uji hipotesis dengan alpa = 5%! Berikan

interpretasinya? Berikut data yang diperoleh selama 20 hari:

35 53

43 64

51 42

38 43


60 58

55 43

50 36

65 40

38 58

42 43

3. Petugas parkir kampus VOKASI menghitung jumlah mahasiswa yang memakai sepeda

ke kampus. Pengamatan dilakukan selama 20 hari kerja. Pengamatan dilakukan untuk

mengetahui apakah himbauan terhadap mahasiswa agar memakai sepeda ke kampus

sudah terpenuhi, yaitu dengan melihat apakah mahasiswa yang bersepeda sudah lebih

dari 40 mahasiswa/hari. Lakukanlah uji hipotesis dengan alpa = 5%! Berikan

interpretasinya! Berikut data yang diperoleh selama 20 hari :

27 39

33 32

31 42

38 43

38 35

40 34

42 36

36 40

37 38

41 43


BAB IX

UJI HIPOTESIS MEAN DUA POPULASI

Tujuan Praktikum

1. Praktikan mampu melakukan analisis data menggunakan uji rata-rata dua populasi

independen.

2. Praktikan mampu melakukan analisis data menggunakan uji rata-rata dua populasi

dependen.

9.1. Uji Hipotesis Mean 2 Populasi Independen (Uji Independen sample t test)

Uji rata-rata 2 sampel independen (bebas) adalah metode yang digunakan untuk

menguji kesamaan rata-rata dari 2 populasi yang bersifat independen. Independen maksudnya

adalah bahwa populasi yang satu tidak dipengaruhi atau tidak berhubungan dengan populasi

yang lain.

1. Hipotesis

a. H0 : μ1 - μ2 = 0 (uji dua sisi)

H1 : μ1 - μ2 ≠ 0

b. H0 : μ1 - μ2 ≤ 0 (uji sisi kanan)

H1 : μ1 - μ2 > 0

c. H0 : μ1 - μ2 ≥ 0 (uji sisi kiri)

H1 : μ1 - μ2 < 0

2. Tingkat signifikansi, α = 5%

3. Statistik Uji, p_value

4. Daerah kritis


5. Kesimpulan


Contoh

Dipunyai data tentang pengujian ketahanan terhadap 2 merk genteng dengan anggapan data

diambil dari populasi normal. Ujilah apakah bisa dikatakan kedua kualitas genteng sama?

Genteng A Genteng B

120 115

122 120

120 118

138 130

130 135

128 126

132 127

Langkah-langkah menjawab soal di atas :

1. Input data pada dataset Rcmdr :

2. Variabel Merk_genteng akan kita ganti untuk 1=genteng A dan 2=genteng B dengan cara :

Klik Data > manage variable in active data set > convert numeric variables to factors


Pada view data set akan muncul sebagai berikut :

3. Melakukan uji Levene’s test (uji kesamaan variansi)

statistics > Variances >Levene’s test

Langkah-langkah uji hipotesis :

a. Hipotesis

H0: Variansi kedua populasi sama (σ1 = σ2)

H1: Variansi kedua populasi tidak sama (σ1 ≠σ2)

b. Tingkat signifikansi, alpha = 5%

c. Statistik Uji

Cara mencari nilai p_value dari uji Levene’s test :



Output

Levene's Test for Homogeneity of Variance (center = median)

Df F value Pr(>F)

group 1 0.0048 0.946 12

Dari output di atas diperoleh nilai p_value = 0.946

4. Daerah kritis


5. Kesimpulan

p_value = 0.946 > α = 0.05 maka Ho tidak ditolak.

Hal ini berarti Variansi kedua populasi sama.

6. Melakukan Uji Independen t test

a. Hipotesis

H0 : μ1 - μ2 = 0 (rata-rata ketahanan kedua genteng sama)

H1 : μ1 - μ2 ≠ 0 (rata-rata ketahanan kedua genteng berbeda)

b. Tingkat signifikansi, α = 5%

c. Statistik Uji, P_value

Cara memperoleh p_value dari uji indpenden t test :

statistics > means > Independent sample t-test


d. Alternative Hypothesis : Two-sided karena pada uji hipotesis independen t test pada

kasus di atas yang digunakan adalah uji dua sisi (H1 : μ1 - μ2 ≠ 0 )

e. Confidence Level : .95 diperoleh dari 1 – α, dan tingkat signifikansi yang digunakan α

= 0.05

f. Assume equal variances : Yes ( karena pada uji levene’s test kesimpulan yang diperoleh

kedua populasi memiliki variansi yang sama. Jika pada kesimpulan uji levene’s test

adalah kedua populasi memiliki variansi yang berbeda maka yang dipilih adalah

Nomor)

Output

Two Sample t-test

data: ketahanan by Merk_genteng

t = 0.73, df = 12, p-value = 0.4794

alternative hypothesis: true difference in means is not equal to 0


-5.386425 10.814996

sample estimates:

mean in group genteng A mean in group genteng B

127.1429 124.4286


5. Daerah kritis


6. Kesimpulan

p_value = 0.4794 > α = 0.05 maka Ho tidak ditolak. Hal ini berarti rata-rata ketahanan

kedua genteng sama.


9.2. Uji Hipotesis Mean 2 Populasi Dependen (Uji Paired t test)

Uji hipotesis rata-rata 2 populasi dependen juga sering dinamakan uji rata-rata 2 sampel

berpasangan atau paired sample t test. Dalam uji ini, suatu populasi diamati/ diberi perlakuan

2 kali, sehingga dihasilkan pasangan-pasangan data untuk masing-masing anggota populasi.

Rata-rata selisih pengamatan pertama dan ke dua dinamakan μD. Misalkan dari suatu

populasi diambil sampel sebanyak n, kemudian sampel tersebut diamati dan menghasilkan

data X1, X2, ..., Xn. Selanjutnya diamati untuk yang ke dua kalinya dan menghasilkan data Y1,

Y2, ..., Yn. Dengan demikian dari sampel pertama diperoleh data (X1, Y1), dari sampel ke dua

diperoleh (X2, Y2), dan seterusnya sampai sampel ke-n diperoleh (Xn, Yn). Rata-rata selisih

pengamatan pertama dan ke dua pada sampel dinamakan 𝐷 dan standar deviasinya

dinamakan sD.

Berikut uji hipotesis untuk rata-rata 2 populasi dependen.:

1. Hipotesis

a. H0: μD = μ0 (uji dua sisi)

H1: μD ≠ μ0

b. H0: μD ≤ μ0 (uji sisi kanan)

H1: μD > μ0

c. H0: μD ≥ μ0 (uji sisi kiri)

H1: μD < μ0


3. Statistik penguji, p_value

4. Daerah kritis:

H0 ditolak jika p_value < α (untuk semua uji)

5. Kesimpulan


Contoh

Bagian akademik ingin melakukan survei terhadap pemberian beasiswa PPA. Apakah dengan

menggunakan pemberian beasiswa PPA memberi dampak kenaikan terhadap IPK mahasiswa

penerima. Nilai α= 5% (0.05).

Dengan data berikut :

Sebelum Sesudah

3.7 3.6

3.6 3.7

3.8 3.7

3.7 3.6

3.9 3.6

3.8 3.4

3.6 3.5

3.9 3.5

Langkah-langkah menjawab soal di atas :

1. Input data pada data set Rcmdr :

2. Melakukan uji paired t test

a. Hipotesis

H0 : μD ≥ μ0

(rata-rata IPK mahasiswa sebelum menerima beasiswa PPA lebih besar atau sama

dengan rata-rata IPK mahasiswa setelah menerima beasiswa PPA )

H1: μD < μ0

(rata-rata IPK mahasiswa sebelum menerima beasiswa PPA lebih kecil dari rata-

rata IPK mahasiswa setelah menerima beasiswa PPA )


b. Diambil tingkat signifikansi α

c. Statistik penguji

Cara memperoleh nilai p_value dari uji paired t test :

statistics > means > paired sample t test

d. Alternative Hypothesis : Difference < 0 karena pada uji hipotesis paired t test pada

kasus di atas yang digunakan adalah uji sisi kiri (H1: μD < μ0)

e. Confidence Level : .95 diperoleh dari 1 – α, dan tingkat signifikansi yang digunakan α

= 0.05

Output

Paired t-test

data: ipk$Sebelum and ipk$Sesudah

t = 2.8243, df = 7, p-value = 0.9872

alternative hypothesis: true difference in means is less than 0


-Inf 0.2923918

sample estimates:

mean of the differences

0.175



3. Daerah kritis:

H0 ditolak jika p_value < α

4. Kesimpulan

p_value = 0.9872 > α = 0.05 maka Ho tidak ditolak. Hal ini berarti rata-rata IPK

mahasiswa sebelum menerima beasiswa PPA lebih besar atau sama dengan rata-rata IPK

mahasiswa setelah menerima beasiswa PPA (IPK mahasiswa setelah diberi beasiswa PPA

tidak lebih bagus dibandingkan sebelum menerima beasiswa).


9.3. Latihan

1. Sebuah perusahaan penghasil bahan bakar mobil hendak memilih satu dari dua ramuan

kimia yang akan dijadikan campuran di dalam produknya. Ramuan tersebut adalah RDX

dan DLL. Untuk memutuskannya, departemen riset perusahaan tersebut mengadakan

penelitian untuk menguji efisiensi penggunaan bahan bakar setelah diberi kedua

campuran tersebut. Dalam penelitian ini, digunakan 60 buah mobil, 30 di antaranya

diberi bahan bakar dengan campuran RDX dan 30 mobil sisanya diberi bahan bakar

dengan campuran DLL. Ketiga puluh mobil kemudian dijalankan oleh 60 orang

pengemudi dengan kemampuan mengemudi yang homogen pada suatu lintasan tertentu.

Dengan memberikan 1 liter bahan bakar untuk setiap mobil, jarak tempuh 30 mobil yang

diberi bahan bakar bercampur RDX dan 30 mobil dengan bahan bakar bercampur DLL

kemudian dicatat. Apakah terdapat perbedaan jarak tempuh antara menggunakan RDX

dan DLL?

Data jarak tempuh (dalam kilometer) disajikan pada tabel berikut :

RDX DLL

5.21 5.17 5.60 5.29

5.31 5.35 5.21 5.49

5.32 5.09 5.43 5.31

5.12 5.29 5.34 5.36

5.16 5.30 5.41 5.47

5.40 5.14 5.26 5.53

5.29 5.25 5.24 5.37

5.20 5.38 5.42 5.47

5.14 5.39 5.31 5.48

5.23 5.30 5.15 5.59

5.22 5.18 5.39 5.34

5.01 5.35 5.50 5.47

5.19 5.29 5.38 5.53

5.23 5.35 5.45 5.34

5.40 5.20 5.36 5.28


2. Suatu perusahaan menyatakan bahwa sejenis diet baru akan menurunkan berat badan

seseorang. Berikut ini dicantumkan berat badan tujuh wanita sebelum dan sesudah

mengikuti diet ini.

Wanita

ke- Sesudah Sebelum

1 58.5 60.0

2 60.3 54.9

3 61.7 58.1

4 69.0 62.1

5 64.0 58.5

6 62.6 59.9

7 56.0 54.4

Ujilah pernyataan perusahaan tersebut dengan selang kepercayaan 95%!


BAB X

ANALISIS VARIANSI SATU ARAH

Tujuan Praktikum :

1. Melakukan pengujian rata-rata terhadap lebih dari dua populasi independen.

2. Melakukan uji perbandingan ganda pada pasangan populasi yang terbentuk.

10.1. Pendahuluan

Analisis Variansi adalah suatu prosedur untuk uji perbedaan mean beberapa populasi

(lebih dari dua). Analisis variansi adalah perluasan dari uji independen t test. Pada analisis

variansi yang diuji perbedaan dari k populasi. Diketahui bahwa apabila mean di antara

populasi sangat berbeda satu dengan yang lainnya maka variansi kumpulan antar mean jauh

lebih besar daripada variansi masing-masing populasi. Prosedur anova mendasarkan

analisisnya berdasarkan fakta tersebut.

Rancangan data untuk anova satu arah dapat dilihat seperti gambar di bawah ini dengan

ketentuan bahwa banyaknya sampel tiap populasi tidak harus sama.

1 … i k

X11 Xi1 Xk1

.

. …

.

11nX kknX

1X … iX kX

2

1S … 2

iS 2

kS

10.2. Asumsi dalam Anova

1. Keindependenan data ( tidak perlu dilakukan pengujian datanya

2. Kenormalan data

Bentuk Hipotesa :

a. H0 : data berdistribusi normal

H1 : data tidak berdistribusi normal

b. Tingkat signifikansi (α)

iinX


c. Statistik uji

p-value

d. Daerah Kritis

Ho ditolak jika p-value < α

e. Kesimpulan

3. Kesamaan Variansi

Bentuk Hipotesa :

a. Ho : variansi dari semua populasi sama

H1 : minimal ada satu populasi yang mempunyai variansi tidak sama

b. Tingkat signifikansi (α)

c. Statistik uji

p-value

d. Daerah Kritis

Ho ditolak jika p-value < α

e. Kesimpulan

Catatan : jika asumsi kesamaan variansi maupun kenormalan data tidak terpenuhi maka

lakukan transformasi data, kemudian lakukan uji asumsi lagi.

10.3. Uji Anova Satu Arah

Bentuk Uji Hipotesis

1. Ho: µ1 = µ2 = ... = µk ( rata-rata antar populasi itu sama )

H1: µi ≠ µj ; min 1 pasang populasi (i,j) yg mempunyai rata-rata yang berbeda untuk i ≠ j

2. Tingkat signifikansi ( )

3. Statistik penguji:

)/(

)1/(

KNSSE

KSSTF

~FK-1, N-K

K

i

ii SnSSE1

2)1(

K

i

ii XXnSST1

2)(


Tabel anova

Source of Variation df Sum of Square Mean of Square F-rasio

Perlakuan (treatment) K-1 SST MST=SST/(K-1) MSE

MSTF

Sesatan (Error) N-K SSE MSE=SSE/(N-K)

4. Daerah kritis

Ho ditolak jika p_value < alpha atau Fhit > Ftabel

5. Kesimpulan

Catatan : Apabila HO diterima maka pekerjaan selesai, tetapi apabila Ho ditolak maka

analisa selanjutnya adalah Uji Perbandingan Ganda.

10.4. Uji Perbandingan Ganda

Uji perbandingan ganda dapat dilakukan dengan Metode FISHER. Metode ini hampir

mirip dengan uji t. Uji perbandingan ganda digunakan untuk mengetahui apakah antar

pasangan yang berasal dari kombinasi populasinya itu mempunyai rata-rata yang sama atau

tidak. Jika terdapat K perlakuan maka :

Terdapat

2

Kkombinasi pasangan H0 yang akan diuji

K : jumlah perlakuan

Bentuk Uji Hipotesanya adalah sebagai berikut :

a. Ho: µi = µj

H1: µi ≠ µj

b. Tingkat Signifikansi (α)

c. Statistik uji

p-value

d. Daerah Kritis

H0 ditolak jika p_value < alpha

e. Kesimpulan


Contoh

Diadakan penelitian untuk menentukan pengaruh nutrisi pada perhatian anak SD. Diambil 15

anak yang di acak 3 pola sarapan pagi: tanpa sarapan, sarapan ringan, dan full sarapan.

Perhatian mereka terhadap pelajaran dalam menit dicatat dalam tabel berikut :

Tanpa sarapan Sarapan ringan Full sarapan

8 14 10

7 16 12

9 12 16

13 17 15

10 11 12

11 13 13

12 14 12

Lakukan Anova One-Way untuk data di atas dengan α= 0.05!

Langkah-langkah untuk menjawab pertanyaan di atas :

1. Uji normalitas data


b. Melakukan uji normalitas :

Statistics > Summaries > Shapiro-Wilk test of normality...


Output

Shapiro-Wilk normality test

data: anova$Full_sarapan

W = 0.9226, p-value = 0.4898


data: anova$Sarapan_ringan

W = 0.9654, p-value = 0.8632


data: anova$Tanpa_sarapan

W = 0.978, p-value = 0.9493

2. Uji hipotesis :

a. Full Sarapan

H0 : data berdistribusi normal


Tingkat signifikansi (α)

Statistik uji

p-value = 0.4898

Daerah Kritis

H0 ditolak jika p-value < α

Kesimpulan

p-value = 0.4898 > α= 0.05 maka H0 tidak ditolak.

Hal ini berarti data pada kelompok Full Sarapan berdistribusi normal.

b. Sarapan Ringan




Statistik uji

p-value = 0.8632

Daerah Kritis


Kesimpulan


Hal ini berarti data pada kelompok Sarapan Ringan berdistribusi normal.


c. Tanpa Sarapan




Statistik uji

p-value = 0.9493

Daerah Kritis


Kesimpulan


Hal ini berarti data pada kelompok Tanpa Sarapan berdistribusi normal.

Kesimpulan pada uji normalitas :

ketiga populasi berdistribusi normal, jadi asumsi normalitas terpenuhi.

3. Uji Kesamaan Variansi



b. Variabel Sarapan akan kita ganti untuk 1 = full sarapan , 2 = sarapan ringan dan 3 =

tanpa sarapan dengan cara :

Klik Data > manage variable in active data set > convert numeric variables to factors

Pada view data set akan muncul :

Bentuk Hipotesa :

H0 : variansi dari semua populasi sama

H1 : minimal ada satu populasi yang mempunyai variansi tidak sama



Statistik uji

Cara mencari nilai p_value dari uji Levene’s test :


Output

Levene's Test for Homogeneity of Variance (center = median)

Df F value Pr(>F)

group 2 0.0783 0.925 18


Daerah Kritis


Kesimpulan

p_value = 0.925 > α = 0.05 maka H0 tidak ditolak.

Hal ini berarti Variansi ketiga populasi sama, jadi asumsi kesamaan variansi

terpenuhi.

c. Uji Anava

Bentuk Hipotesa :

1. H0: µ1 = µ2 = µ3 ( rata-rata perhatian terhadap pelajaran (dalam menit) antara status

sarapan adalah sama )

H1: µi ≠ µj ; min 1 pasang populasi (i,j) yang mempunyai rata-rata perhatian terhadap

pelajaran (dalam menit) yang berbeda untuk i ≠ j

2. Tingkat signifikansi ( )


3. Statistik penguji:

Statistics > Means > One-way ANOVA...

Output

> summary(AnovaModel.1)

Df Sum Sq Mean Sq F value Pr(>F)

Sarapan 2 56.10 28.048 6.333 0.00827 ** Residuals 18 79.71 4.429

---

Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

> numSummary(anova2$Perhatian , groups=anova2$Sarapan,

statistics=c("mean",

+ "sd"))

mean sd data:n

full sarapan 10.00000 2.160247 7

sarapan ringan 13.85714 2.115701 7

tanpa sarapan 12.85714 2.035401 7


4. Daerah Kritis


5. Kesimpulan

p_value = 0.00827 < α = 0.05 maka H0 ditolak. Hal ini berarti minimal ada 1 pasang

kelompok sarapan yang rata-rata perhatian terhadap pelajaran (dalam menit)

berbeda, maka perlu dilakukan pembandingan ganda.


d. Uji Pembandingan Ganda

Statistics > Means > One-way ANOVA...

Output

> summary(.Pairs) # pairwise tests

Simultaneous Tests for General Linear Hypotheses

Multiple Comparisons of Means: Tukey Contrasts

Fit: aov(formula = Perhatian ~ Sarapan, data = anova)

Linear Hypotheses:

Estimate Std. Error t value Pr(>|t|)

sarapan ringan - full sarapan == 0 3.857 1.125 3.429 0.00818 **

tanpa sarapan - full sarapan == 0 2.857 1.125 2.540 0.05120 .

tanpa sarapan - sarapan ringan == 0 -1.000 1.125 -0.889 0.65395 ---

Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Adjusted p values reported -- single-step method)

> confint(.Pairs) # confidence intervals

Simultaneous Confidence Intervals

Multiple Comparisons of Means: Tukey Contrasts

Fit: aov(formula = Perhatian ~ Sarapan, data = anova)

Quantile = 2.5519

95% family-wise confidence level

Linear Hypotheses:

Estimate lwr upr

sarapan ringan - full sarapan == 0 3.85714 0.98662 6.72766

tanpa sarapan - full sarapan == 0 2.85714 -0.01338 5.72766

tanpa sarapan - sarapan ringan == 0 -1.00000 -3.87052 1.87052

> cld(.Pairs) # compact letter display

sarapanringan tanpasarapan fullsarapan

"a" "ab" "b"

Bentuk Uji Hipotesanya adalah sebagai berikut :

Full sarapan dan Sarapan Ringan

H0 : µ1 = µ2 (rata-rata perhatian terhadap pelajaran (dalam menit) antara yang full

sarapan dan sarapan ringan sama)

H1: µ1 ≠ µ2 (rata-rata perhatian terhadap pelajaran (dalam menit) antara yang full

sarapan dan sarapan ringan berbeda)


Tingkat Signifikansi (α) = 0.05

Statistik uji

p-value = 0.00818

Daerah Kritis


Kesimpulan

p_value = 0.00818 < α = 0.05 maka H0 ditolak.

Hal ini berarti rata-rata perhatian terhadap pelajaran (dalam menit) antara yang full

sarapan dan sarapan ringan berbeda.

Full sarapan dan Tanpa Sarapan

H0 : µ1 = µ2 (rata-rata perhatian terhadap pelajaran (dalam menit) antara yang full

sarapan dan tanpa sarapan sama)

H1: µ1 ≠ µ2 (rata-rata perhatian terhadap pelajaran (dalam menit) antara yang full

sarapan dan tanpa sarapan berbeda)


Statistik uji

p-value = 0.0512

Daerah Kritis


Kesimpulan

p_value = 0.0512 > α = 0.05 maka Ho tidak ditolak. Hal ini berarti rata-rata perhatian

terhadap pelajaran (dalam menit) antara yang full sarapan dan tanpa sarapan sama.

Sarapan Ringan dan Tanpa Sarapan

H0 : µ1 = µ2 (rata-rata perhatian terhadap pelajaran (dalam menit) antara yang

sarapan ringan dan tanpa sarapan sama)

H1: µ1 ≠ µ2 (rata-rata perhatian terhadap pelajaran (dalam menit) antara yang sarapan

ringan dan tanpa sarapan berbeda)


Statistik uji

p-value = 0.65395


Daerah Kritis

Ho ditolak jika p_value < alpha

Kesimpulan

p_value = 0.65395 > α = 0.05 maka H0 tidak ditolak. Hal ini berarti rata-rata

perhatian terhadap pelajaran (dalam menit) antara yang sarapan ringan dan tanpa

sarapan sama.

Jadi kesimpulan dari uji pembandingan ganda adalah pasangan kelompok yang rata-rata

perhatian terhadap pelajaran (dalam menit) berbeda adalah antara full sarapan dan sarapan

ringan.


10.5. Latihan

1. Sampel air diambil di empat lokasi sungai untuk menentukan kualitas kebersihannya.

Diperoleh data kandungan oksigen sebagai berikut :

Sungai A Sungai B Sungai C Sungai D

5.9 6.3 4.8 6.0

6.1 6.6 4.3 6.2

6.3 6.4 5.0 6.1

6.1 6.4 4.7 5.8

6.0 6.5 5.1 6.3

Lakukan Anova One-Way untuk data di atas dengan α= 0.05!

2. Dari sebuah penelitian tentang kandungan protein yang dikonsumsi mahasiswa, ingin

diketahui apakah jenis makanan yang dikonsumsi memiliki kandungan protein yang sama

pada tingkat signifikansi 0.05?

Diperoleh data sebagai berikut :

Kangkung Wortel Susu Telur

48.3 43.7 46.8 48.2

49.8 46.8 43.7 47.3

46.7 45.5 47.8 46.4

49.3 44.4 44.8 48.5

47.5 45.3 46.6 46.1

48.7 44.8 45.3 47.6

48.5 42.8 46.2 47.9

45.1

48.3


3. Berdasarkan data sample biaya hosting penyedia layanan web online di Yogyakarta pada

September 2010 sampai Mei 2014 dengan tingkat keyakinan 95%, ingin diketahui apakah

ada perbedaan rata-rata biaya hosting web online antara kelompok usia penyedia layanan

hosting web online? Jika ada perbedaan, kelompok usia penyedia layanan hosting mana

saja yang memiliki perbedaan biaya hosting web online?

Usia

<= 3 tahun

3 tahun

< Usia <

5 tahun

5 tahun

< Usia <

7 tahun

Usia

> 7 tahun

226.000 233.000 220.000 133.000

255.000 236.000 298.000 135.000

142.000 240.000 317.000 192.000

145.000 301.000 334.000 163.000

149.000 304.000 339.000 169.000

261.000 305.000 237.000 169.000

267.000 317.000 270.000 175.000

276.000 193.000 272.000 184.000

280.000 194.000 283.000 193.000

294.000 199.000 289.000 200.000

185.000 224.000 221.000 202.000

206.000 226.000 223.000 255.000

212.000 228.000 224.000 262.000

216.000 230.000 226.000 268.000

223.000 180.000 230.000 144.000

137.000 184.000 237.000 148.000

139.000 187.000 245.000 149.000

256.000 190.000 254.000 151.000

155.000 192.000 235.000 157.000

165.000 263.000 259.000 206.000

174.000 264.000 262.000 208.000

182.000 277.000 266.000 231.000

183.000 279.000 266.000 233.000


BAB XI

ANALISIS REGRESI LINEAR SEDERHANA

Tujuan Praktikum :

1. Melakukan pengujian untuk mengetahui apakah ada hubungan linear antar dua variabel

yaitu variabel dependen dengan independen.

2. Melakukan pengujian terhadap koefisien regresi yaitu terhadap konstanta dan koefisien

dari variabel independen.

3. Menghitung besar pengaruh variabel independen terhadap variabel dependen.

4. Pembentukan persamaan regresi.

11.1. Pendahuluan

Analisis Regresi merupakan alat statistik yang bermanfaat untuk mengetahui hubungan

antara dua variabel atau lebih, sehingga salah satu variabel dapat diduga dari variabel lainnya.

Model regresi :

Keterangan :

iY adalah nilai variabel dependen pada observasi ke-i

0 dan 1 adalah parameter koefisien regresi

iX adalah konstanta yang diketahui yaitu nilai variabel independen pada observasi ke-i

i adalah error yang bersifat random dengan rata-rata E{ i }= 0 dan variansinya Var{

i }= 2 ; i dan j tidak berkorelasi sehingga nilai covariansinya Cov{ i , j }= 0

untuk semua nilai i dan j ; ji , i = 1, 2, ….. n

Model Regresi di atas dikatakan sederhana, linear dalam parameter, dan linear dalam

variabel independent. Dikatakan sederhana karena hanya ada satu variabel independent,

linear dalam parameter karena tidak ada parameter yang muncul sebagai suatu eksponen atau

hasil kali atau hasil bagi dengan parameter lain, dan linear dalam variabel independent karena

variabel ini dalam model berpangkat satu.

110 ii XY

dengan ii XYE 10)(


11.2. Uji Simultan ( Over all test ) dalam Regresi

Bentuk uji Hipotesanya adalah :

1. Ho : 0i ; 0i ( model regresi tidak layak digunakan / tidak ada hubungan linear

antara variabel independen dengan variabel dependen ).

H1 : 0i ; 0i ( model regresi layak digunakan / ada hubungan linear antara variabel

independen dengan variabel dependen ).

2. Tingkat signifikansi α

3. Statistik uji :

Dengan melihat nilai p-value

4. Daerah Kritis :


5. Kesimpulan

11.3. Uji Koefisien regresi ( uji parsial )

1. Uji terhadap konstanta

Bentuk uji hipotesanya adalah sebagai berikut :

H0 : β0 = 0 ( konstanta tidak signifikan terhadap model regresi )

H1 : β0 ≠ 0 ( konstanta signifikan terhadap model regresi )

Tingkat signifikansi α

Statistik uji :


Daerah Kritis :


Kesimpulan

2. Uji terhadap koefisien regresi dari β1


H0 : β1 = 0 ( koefisien regresi x1 tidak signifikan terhadap model regresi / tidak ada

pengaruh variabel independen terhadap variabel dependen)

H1 : β1 ≠ 0 ( koefisien regresi x1 signifikan terhadap model regresi / ada pengaruh

variabel independen terhadap variabel dependen)



Statistik uji :


Daerah Kritis :


Kesimpulan

11.4. Contoh

Sebuah penelitian dilakukan untuk mengetahui hubungan antara IQ mahasiswa dengan

nilai praktikum algoritma pemrograman. Apakah dapat disimpulkan bahwa IQ mahasiswa

berpengaruh terhadap nilai praktikum algoritma pemrograman?

IQ nilai alpro

114 87

115 90

120 96

105 81

118 91

97 76

107 83

110 85

119 95

Langkah-langkah penyelesaian:

1. Input data ke dalam Rcmdr

2. Buat scatter plot antara variabel independen (X) dan variabel dependen (Y)

Graph > Scatter Plot


x-variabel (pick one) : variabel independen

y-variabel (pickone) : variabel dependen

Output

Dari bentuk scatter plot di atas, apakah ada hubungan linear antara nilai IQ dan nilai alpro?

( positif atau negatifkah? )

100 105 110 115 120

80

85

90

95

IQ

nila

i_a

lpro

6

3


3. Melakukan uji regresi

statistics > fit models> linear regression

enter name for model : nama model yang akan dibentuk

response variabel (pick one) : sorot nama variabel dependen

explanatory variabel (pick one) : sorot nama variabel independen

Output

> summary(RegModel.5)

Call:

lm(formula = nilai_alpro ~ IQ, data = regresi)

Residuals:

Min 1Q Median 3Q Max

-2.0840 -0.7019 -0.1652 1.2902 1.8427

Coefficients:


(Intercept) -7.3082 7.6429 -0.956 0.371

IQ 0.8456 0.0683 12.379 5.16e-06 ***

---

Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 1.471 on 7 degrees of freedom

Multiple R-squared: 0.9563, Adjusted R-squared: 0.9501

F-statistic: 153.2 on 1 and 7 DF, p-value: 5.159e-06

Dari output di atas dapat dilakukan uji over all test (simultan), uji parsial, menghitung

besarnya pengaruh variabel independen terhadap variabel dependen, dan membentuk

persamaan regresinya.

4. Uji Over all test ( uji simultan )

Bentuk hipotesanya adalah sebagai berikutnya:

H0 : 0i ; 0i (model regresi tidak layak digunakan)

H1 : 0i ; 0i (model regresi layak digunakan)


Tingkat signifikansi α =0,05

Statistik uji :

p- value = 5,159 x 10-6

Daerah Kritis :

H0 ditolak jika p_value < α

Kesimpulan

p_value = 5,159 x 10-6

< α maka H0 ditolak. Jadi model regresi layak digunakan.

5. Uji parsial

a. Uji parsial terhadap konstanta β0

Hipotesanya adalah sebagai berikut:

H0 : β0 = 0 ( konstanta tidak signifikan terhadap model regresi)

H1 : β0 ≠ 0 ( konstanta signifikan terhadap model regresi )


Statistik uji :

p-value = 0,371

Daerah Kritis :


Kesimpulan

p-value = 0,371 > α maka H0 tidak ditolak.

Jadi konstanta tidak signifikan terhadap model regresi.

b. Uji parsial terhadap koefisien regresi β1



pengaruh nilai IQ terhadap nilai alpro)


nilai IQ terhadap nilai alpro)


Statistik uji :

p-value = 5,159 x 10-6

Daerah Kritis :



Kesimpulan

p_value = 5,159 x 10-6

< α maka H0 ditolak.

Jadi koefisien regresi x1 signifikan terhadap model regresi / ada pengaruh nilai IQ

terhadap nilai alpro.

Pada hasil uji hipotesis di atas, karena intercept tidak signifikan dalam model regresi,

maka variabel tersebut dikeluarkan dan kemudian dilakukan regresi ulang tanpa variabel

tersebut.

Untuk mengulang analisis regresi jika ada salah satu variabel yang tidak signifikan digunakan

menu Statistics > Fit Models > Linear model…

Output

> summary(LinearModel.6)

Call:

lm(formula = nilai_alpro ~ IQ - 1, data = regresi)

Residuals:

Min 1Q Median 3Q Max

-1.9621 -0.9387 -0.4995 0.3042 2.3557

Coefficients:


IQ 0.780369 0.004359 179 1.06e-15 ***

---

Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 1.463 on 8 degrees of freedom

Multiple R-squared: 0.9998, Adjusted R-squared: 0.9997

F-statistic: 3.204e+04 on 1 and 8 DF, p-value: 1.061e-15


c. Uji terhadap koefisien regresi β1



pengaruh nilai IQ terhadap nilai alpro)


nilai IQ terhadap nilai alpro)


Statistik uji :

p-value = 1,061 x 10-15

Daerah Kritis :


Kesimpulan

p_value = 1,061 x 10-15

< α maka H0 ditolak. Jadi koefisien regresi x1 signifikan

terhadap model regresi / ada pengaruh nilai IQ terhadap nilai alpro.

Sehingga diperoleh model regresinya : Nilai alpro = 0,78 (nilai IQ).

Besarnya pengaruh nilai IQ terhadap nilai alpro ( silahkan melhiat nilai dari

Multiple R-Squared ) yaitu sebesar 99,98% dan sisanya dipengaruhi oleh faktor

lain diluar pengamatan.


11.5. Latihan

1. Seorang distributor kendaraan bermotor melakukan penelitian untuk menentukan

hubungan harga dengan umur motor bekas. Data yang digunakan diperoleh untuk satu

jenis kendaraan terlihat pada tabel berikut :

Umur Harga

(tahun) (ribuan rupiah)

1 1795

4 985

10 295

2 1295

5 795

6 995

8 845

1 1625

Kesimpulan apa yang dapat Anda sampaikan dari kasus di atas?

2. Ingin diketahui hubungan antara nilai tes masuk dengan nilai akhir kuliah matematika

pada mahasiswa baru. Diperoleh data dari 20 mahasiswa yang mengikuti kuliah

matematika sebagai berikut :

Nilai Tes Nilai Akhir Nilai Tes Nilai Akhir

50 53 90 54

35 41 80 91

35 61 60 48

40 56 60 71

55 68 60 71

65 36 40 47

35 11 55 53

60 70 50 68

90 79 65 57

35 59 50 79

Kesimpulan apa yang dapat Anda sampaikan dari kasus di atas?


DAFTAR PUSTAKA

Dalgaard, Peter. 2002. Statistics and Computing: Intoductory Statistics with R.

Springer. New York.

Gunardi dan Rakhman, A. 2003. Metode Statistika. Fakultas MIPA UGM.

Yogyakarta.

NN. 2007. Modul Praktikum Analisis Data Eksploratif. Program Studi Statistika

FMIPA UGM. Yogyakarta.

Rosadi, Dedi. 2005. Praktikum Komputasi Statistika: Pengantar Analisa Statistika

dengan R. Program Studi Statistika FMIPA UGM. Yogyakarta.

Zulaela. 2004. Modul Praktikum Analisis Regresi Terapan. Program Studi Statistika

FMIPA UGM. Yogyakarta.

Zulaela. Gunardi. Rakhman, A. Utami, Herni. 2004. Program Studi Statistika FMIPA

UGM. Yogyakarta.

Documents

Praktikum Statistika dan Penyajian Data · PDF fileMenginstal R pada sistem operasi Windows ... pilih menu Packages > Install package(s) from local ... merupakan suatu langkah yang