Analisa Data Statistik Chap 9a: Estimasi Statistik (Interval Kepercayaan Sampel Tunggal)

Preview:

DESCRIPTION

Analisa Data Statistik Chap 9a: Estimasi Statistik (Interval Kepercayaan Sampel Tunggal). Agoes Soehianie, Ph.D. Daftar Isi. Inferensi Statistik. 1- α. α /2. α /2. -Z α /2 μ Z α /2. Sampel Tunggal : Interval Kepercayaan Rata-Rata Populasi ( σ diketahui). - PowerPoint PPT Presentation

Citation preview

Analisa Data StatistikChap 9a: Estimasi Statistik

(Interval Kepercayaan Sampel Tunggal)

Agoes Soehianie, Ph.D

Daftar Isi

Inferensi Statistik

Sampel Tunggal : Interval Kepercayaan Rata-Rata Populasi (σ diketahui)

nzx

nzx

2/2/

Case1 : Diberikan sampel berukuran cukup besar (n≥30) yg diambil dari populasi dengan distribusi normal , yang memiliki variansi populasi σ2

..Jika rata-rata sampel adalah xs, maka interval keyakinan (confidence interval) 100(1-α)% untuk rata-rata populasi μ akan diberikan oleh:

1-α

α/2α/2

-Zα/2 μ Zα/2

Distribusi rata-rata sampel akan normal, dengan nilai rata-rata (populasi) μ dengan STD σ. Terdapat probabilitas (1-α)

bahwa rata-rata sampel berukuran n akan terletak antara –zα/2 dan zα/2 :

P (–zα/2<Z<zα/2) = 1-α dengan n

xz

/

Arti Interval Kepercayaan Rata-Rata Populasi

Apakah arti interval kepercayaan rata-rata populasi yg diperoleh? Sebab tiap sampel berukuran n yg kita ambil akan menghasilkan interval bagi μ yg berbeda! Sedangkan nilai μ yg sebenarnya mungkin tak pernah diketahui?

No sampel

5

4

3

2

1

μ

Taksiran Error bagi μ dan ukuran sampel

x

Teorema:

Jika dipakai sebagai taksiran untuk μ, maka kita bisa yakin (confident) dengan tingkat keyakinan (confidence level) 100(1-α)% bahwa error (E= x-μ ) yg terjadi tidak akan lebih besar dari

Teorema:

Kita bisa yakin dengan tingkat keyakinan 100(1- α)% bahwa error dalam menaksir μ dengan memakai rata-rata sampel tidak melebihi (errornya!) E (=x-μ) jikalau ukuran sampelnya:

nz

2/

x

x

2

2/

E

zn

Contoh.

x

Rata-rata konsentrasi kandungan Zinc sebuah sungai yg diambil dari 36 lokasi adalah 2.6 gr/ml. Carilah interval kepercayaan 95% dan 99% untuk menaksir nilai rata-rata konsentrasi kandungan Zinc sungai tsb, jikalau dari survei-survei sebelumnya diketahui standard deviasinya adalah 0.3 gr/ml.

Jawab.

Xs = 2.6, σ=0.3

x

Contoh.

x

Berapakah ukuran sampel yg harus dipakai, jikalau taksiran rata-rata populasi dalam contoh sebelumnya diinginkan tak lebih dari 0.05 dengan tingkat keyakinan 95%?

x

Sampel Tunggal : Interval Kepercayaan Sebelah untuk Rata-Rata Populasi

nzx

Case2 : Diberikan sampel berukuran cukup besar (n≥30) yg diambil dari populasi dengan distribusi normal , yang memiliki variansi populasi σ2

..Jika rata-rata sampel adalah xs, maka interval keyakinan sebelah (confidence interval) 100(1-α)% untuk rata-rata populasi μ akan diberikan oleh:

1-αα

μ Zα

Kasus-kasus interval kepercayaan dengan ekor tunggal seperti ini terjadi bilamana kesalahan taksiran dalam satu arah (terlalu tinggi) atau terlalu rendah penting.

nzx

1-α

α

-Zα μ

Contoh. Ekor tunggal

858.625/4645.12.6 n

zx

Dalam sebuah eksperimen psikologi untuk mengukur kecepatan waktu reaksi sesorang, dilakukan percobaan thd 25 orang secara acak. Data dari survei survei sebelumnya menunjukkan variansi waktu reaksi adalah 4 detik2 dengan distribusi waktu reaksi normal. Dari percobaan ini didapati rata-rata waktu reaksi adalah 6.2 detik. Berikanlah batas atas dengan tingkat kepercayaan 95% bagi waktu reaksi populasi.

Jawab.

n=25, σ2 = 4, xs = 6.2

Batas atas dengan tingkat kepercayaan 95% (jadi α=5%) adalah:

Ini berarti kita bisa yakin 95% bahwa rata-rata waktu reaksi sebenarnya < 6.858 detik

–tα/2

Sampel Tunggal : Interval Kepercayaan Rata-Rata Populasi (σ TAK diketahui tapi ukuran sampel n>30)

n

SZx

n

SZx 2/2/

Jika standard deviasi populasi (σ) .TAK diketahui, asalkan ukuran sampel besar maka standard deviasi sampel S bisa dipakai sebagai pengganti. Hal ini bahkan cukup baik walaupun distribusi populasinya tidak normal.

Seluruh rumus yg telah diturunkan yg melibatkan σ bisa dipakai dengan mengganti σ dengan S dari sampel.

n

SzE 2/

2

2/

E

Szn

Confidence interval untuk rata-rata

Taksiran besar Error

Ukuran sampel diperlukan

n

Stx

n

Stx 2/2/

Jika diberikan sampel berukuran kecil (n<30) tapi diambil dari populasi dengan distribusi normal , dan tidak diketahui variansi populasi, maka variansi populasi S2 bisa dipakai sebagai pengganti σ2, akan tetapi distribusi yg dipergunakan adalah distribusi student t..Jika rata-rata sampel adalah xs, maka interval keyakinan (confidence interval) 100(1-α)% untuk rata-rata populasi μ akan diberikan oleh:

1-αα/2α/2

-tα/2 μ tα/2

bahwa rata-rata sampel berukuran n akan terletak antara –tα/2 dan tα/2 :

Dengan probabilitas:

P (–zα/2<Z<zα/2) = 1-α dimana variabel t adalah:

tα/2 adalah nilai variabel t dengan luas ekor kanan α/2 nS

xT

/

Sampel Tunggal : Interval Kepercayaan Rata-Rata Populasi (σ TAK diketahui dan ukuran sampel kecil)

n

Stx

n

Stx 2/2/

n

StE 2/

2

2/

E

Stn

Confidence interval untuk rata-rata

Taksiran besar Error

Ukuran sampel diperlukan

Sampel Tunggal : Interval Kepercayaan Rata-Rata Populasi (σ TAK diketahui dan ukuran sampel kecil)

Interval untuk Prediksi

Dalam pengukuran yg dilakukan dari data yg terdistribusi normal dan rata-rata populasi tidak diketahui μ dan variansi yg diketahui σ2, maka interval prediksi nilai yg akan muncul dari 1 kali pengukuran di masa depan dengan interval kepercayaan 100(1-α)% adalah:

nzxxnzx /11/11 2/02/

Dalam pengukuran yg dilakukan dari data yg terdistribusi normal dan rata-rata populasi tidak diketahui μ dan dan variansi populasi juga tak diketahui, maka interval prediksi nilai yg akan muncul dari 1 kali pengukuran di masa depan dengan interval kepercayaan 100(1-α)% adalah:

Dengan derajat kebebasan bagi distribusi student t adalah n-1

nstxxnstx /11/11 2/02/

Problem

Seorang petugas QC meneliti sampel 29 pak daging sapi yg diklaim mengandung lemak dibawah 5%, jadi dagingnya 95%. Ternyata rata-rata sampel kandungan dagingnya 96.2%, dengan standard deviasi sampel 0.8%. Jika diasumsikan kandungan daging terdistribusi normal, buatlah interval prediksi 99% untuk hasil pengukuran kandungan daging pada 1 kali pengukuran berikutnya.

Contoh

Sampel 50 buah dari kredit yg diberikan oleh Bank FirstBank ternyata rata-rata sampel Rp. 257 300 ribu. Asumsikan standard deviasi populasi untuk besar kredit adalah Rp. 25 000 ribu. Carilah interval prediksi 95% besarnya kredit yg diinginkan oleh seorang nasabah yg akan mengajukan kredit berikutnya?

Jawab:

n=50, σ = 25 000, xs= 257 α = 0.05 dengan nilai α ini maka zα/2 = z0,.025= 1.96

Kita hitung

Dan

257 300 – 49980 < x0 < 257 300 + 49 980

nzxxnzx /11/11 2/02/

4998050/1125000*96.1/112/ nz

Sampel Tunggal : Interval Kepercayaan untuk Rata-Rata Proporsi dalam distribusi Binomial

Dalam sebuah distribusi binomial, misalnya di populasi fraksi atau proporsi yang “sukses” adalah P. Sedangkan dari sampel random n buah didapat jumlah “sukses” adalah x, maka proporsi sampel p=x/n menjadi taksiran bagi proporsi populasi P.

Jika proporsi populasi yg “sukses” P tidak terlalu dekat ke-0 atau 1 maka kita bisa mempergunakan distribusi normal untuk membuat interval kepercayaan bagi proporsi P populasi dari proporsi sampel p.

“Rata-rata” proporsi populasi = μP = P

Rata-rata sampel untuk proporsi = p dengan p+q=1

Variansi distribusi “rata-rata” proporsi σP2 = pq/n

Maka interval kepercayaan 100(1-α)% untuk sampel besar (n≥30) untuk proporsi populasi p (yg menyatakan prosentasi “sukses”) diberikan oleh

PP zpPzp 2/2/

Sampel Tunggal : Interval Kepercayaan untuk Rata-Rata Proporsi dalam distribusi Binomial

Keterangan:

Variabel normal (standardize) untuk proporsi sampel “sukses” p yg diambil dari populasi dengan proporsi “sukse” P dengan variansi σP

2 adalah :

Rumus ini berlaku untuk p atau q yg tidak terlalu dekat 0 atau 1. Sebagai patokan rumus ini dipakai bilamana pn atau qn ≥5

npq

Ppz

pqn

Ppz P

P

22

Contoh.

Sampel random 500 keluarga pemilik pesawat TV mendapati 340 berlangganan saluran HBO. Tentukan interval kepercayaan 95% bagi prosentase yg sebenarnya dari pelanggan HBO.

Jawab.

Diket. p = 340/500 = 0.68 berarti q= 1-p = 0.32 dan α = 5%

Sehingga zα/2 = Z0.025 = 1.96,

Dan σP = √(pq/n)= √(0.68*0.32/500)

Maka interval kepercayaan 95%

p - Z0.025 σP < P < p + Z0.025 σP

0.64 < P < 0.72

Sampel Tunggal : Interval Kepercayaan untuk Rata-Rata Proporsi dalam distribusi Binomial

ERROR

JIka p adalah proporsi “sukses” dalam sampel maka kita yakin 100(1-α)% bahwa error dalam menggunakan p sebagai penaksir proporsi di populasi tidak akan lebih dari Zα/2 √(pq/n)

UKURAN SAMPEL

JIka ditentukan tingkat ERROR yg ditolerir maksimum adalah E, maka kita bisa yakin proporsi sampel p sebagai penaksir proporsi populasi dengan tingkat keyakinan 100 (1-α)% jika ukuran sampel yg dipakai sekitar:

Rumus ini berlaku untuk p atau q yg tidak terlalu dekat 0 atau 1. Sebagai patokan rumus ini dipakai bilamana pn atau qn ≥5

2

22/

E

pqZn

Contoh

Bilamana dalam survei TV (HBO) sebelumnya yg memiliki proporsi yg berlangganan (p) di sampel = 0.68, berapakah ukuran sampel yg harus digunakan jikalau diinginkan dengan tingkat kepercayaan 95% taksiran terhadap prosentase pelanggan HBO (P) akurat dalam batas ±2%.

Jawab.

Kita pakai rata-rata sampel yaitu p=0.68 sebagai penaksir parameter P populasi, berarti E = 0.02, dan α=5% sehingga Zα/2 = Z0.025 =1.96

Berarti ukuran sampel dengan tingkat kepercayaan 95% adalah:

209002.0

32.0*68.0*96.122

22/ E

pqZn

Batas Atas Error dan Ukuran Sampel

Seringkali kita tak punya taksiran untuk P, sehingga dalam menentukan ukuran sampel kita pakai “worst case scenario”. Nilai pq maksimum bilamana p=1/2 dan berarti q=1/2 yaitu pq=1/4. Jadi untuk menentukan ukuran sampel n yg diperlukan agar dengan tingkat keyakinan 100(1-α)% diperoleh ketelitian hasil (error) tidak melebihi E (error margin) maka ukuran sampel yg harus digunakan adalah:

2

22/

4E

Zn

Sampel Tunggal : Interval Kepercayaan untuk estimasi Variansi

JIka sampel ukuran n diambil dari populasi dengan variansi σ2, kemudian dari sampel dihitung variansinya S2, maka taksiran interval bagi σ2 diperoleh dari distribusi variabel statistik X2

Terdapat probabilitas 1-α, maka X2 akan terletak antara χ21-α/2

dan χ2α/2 :

P(χ21-α/2

< X2 < χ2α/2) = 1-α, dimana χ2

α/2 adalah nilai variabel chi-squared dengan luas ekor kanan α/2 dan derajat kebebasan n-1.

Berarti interval kepercayaan 100(1-α)% untuk σ2 yg ditaksir berdasarkan sampel ukuran n yg diambil dari populasi dengan distribusi normal dan memiliki variansi sampel s2 adalah:

2

22 )1(

Sn

X

22/1

22

22/

2 )1()1(

SnSn

Sampel Tunggal : Interval Kepercayaan untuk estimasi Variansi

χ2χα/22

α/2

χ1-α/22

α/21-α

Contoh.

286.0)1(

12

1 1

22

n

k

n

kkk XXn

nnS

Berikut adalah bobot dari 10 sampel obat-obatan yg didistribusikan sebuah perusahaan: 46.4, 46.1 , 45.8, 47.0, 46.1 45.9 45.8 46.9 45.2 dan 46.0 kg. Asumsikan distribusi bobot adalah normal, tentukan interval kepercayaan 95% bagi variansi dari bobot obat-obatan tsb.

Jawab:

Pertama kita hitung variansi sampel:

No Xk Xk^2

1 46.4 2152.96

2 46.1 2125.21

3 45.8 2097.64

4 47 2209

5 46.1 2125.21

6 45.9 2106.81

7 45.8 2097.64

8 46.9 2199.61

9 45.2 2043.04

10 46 2116

SUM 461.2 21273.12

Sum^2212705.

4

n= 10

S^2= (nSxx- Sx^2)/(n(n-1))

Sx^2=0.28622

2

Contoh.

Interval kepercayaan 95% berarti α=5%, jumlah data n=10, berarti derajat kebebasan v=n-1= 9. Dari tabel diperoleh untuk v=9:

χ0.0252 = 19.023 dan χ0.975

2 = 2.7

Sehingga interval kepercayaan 95% bagi taksiran nilai variansi populasi σ2 adalah:

Atau 0.135 < σ2 < 0.953

22/1

22

22/

2 )1()1(

SnSn

7.2

286.0)110(

023.19

286.0)110( 2