CLUSTER SAMPLING

Preview:

DESCRIPTION

PERTEMUAN 3-MPC 2 TEORI. CLUSTER SAMPLING. Oleh : J. Purwanto Ruslam. SEKOLAH TINGGI ILMU STATISTIK. PENGANTAR. Jika jumlah elemen /unit yang menjadi populasi survei sangat besar maka sampling elemen akan sulit diterapkan . - PowerPoint PPT Presentation

Citation preview

CLUSTER SAMPLING

Oleh: J. Purwanto Ruslam

SEKOLAH TINGGI ILMU STATISTIK

PERTEMUAN 3-MPC 2 TEORI

PENGANTAR

› Jika jumlah elemen/unit yang menjadi populasi survei sangat besar maka sampling elemen akan sulit diterapkan.

› Hali ini disebabkan oleh sulitnya menyediakan kerangka sampel (frame) sampai unit/elemen.

› Selain itu, penarikan sampel secara elemen sampling akan inefisiensi dari penggunaan sumber daya survei (waktu, biaya, tenaga) jika cakupan survei sangat luas.

PENGANTAR

› Misalkan, tahun kita ingin melakukan suatu survei rumah tangga di untuk estimasi level provinsi.

› Jika ingin melakukan sampel secara elemen sampling persyaratannya adalah kita harus mempunyai Daftar seluruh rumah tangga di provinsi tsb yang lengkap dan up to date, yaitu dari rumah tangga ke-1 sampai rumah tangga ke-N.

› Hal ini sulit dipenuhi karena pembentukan frame membutuhkan biaya, waktu, dan tenaga yang besar.

› Selain itu, sifat rumah tangga yang mempunyai kecenderungan untuk pindah dari tempat yang satu ke tempat yang lain akan menyebabkan persyaratan untuk tersedianya frame yang up to date tidak terpenuhi.

› Sekalipun frame rumah tangga tersedia, penarikan sampel secara elemen sampling akan menyebabkan sampel menyebar di seluruh wilayah cakupan survei sehingga operasional lapangan akan sangat sulit dan mahal.

1.Suatu populasi yang terdiri dari M elemen-dikelompokan menjadi N kelompok (cluster-gerombol) yang selanjutnya membentuk suatu Frame:

{ U } = { U1, U2, … Ui … UN }

{ Ui } = { ei1, ei2, … eij … UiM }

2. Kaidah asosiasi antara U(nit) dan E(lemen) adalah “One-to-Many”

PENGERTIAN

› Compact cluster, adalah cluster yang dibentuk oleh elemen-elemen yang saling berdekatan (contiguous).Contoh:• R(ukun) T(etangga) dgn elemen rumahtangga

atau penduduk,• Blok Sensus dgn elemen rumahtangga atau

penduduk,• Kelas dgn elemen murid/siswa

› Non-compact cluster, adalah cluster yang dibentuk oleh elemen-elemen yang non-contiguous

Cluster:

KlasterUnit Listing/ Daftar Unit

Elemen/Unit

AnalisisAplikasi

(1) (2) (3) (4)

1. Blok SensusRumah

tanggaOrang

Estimasi banyaknya rumahtangga/ penduduk beserta karakteristiknya

2. Desa SekolahGuru/

Murid

Estimasi banyaknya guru/ murid beserta karakteristiknya

3. Sekolah Kelas MuridEstimasi banyaknya murid beserta karakteristiknya

4. Halaman

bukuBaris Kata

Estimasi banyaknya kata dalam buku

5. Bulan Hari HariEstimasi rata-rata kepadatan lalu lintas.

Klaster, Unit Listing, Elemen/Unit Analisis, dan Aplikasi

Ditinjau dari jumlah unit/elemen dalam tiap cluster:

› Cluster yang jumlah elemen yang membentuk cluster sama, selanjutnya disebut clusters of equal size.– Bungkus rokok– Plot tanaman untuk percobaan

› Cluster yang jumlah elemen yang membentuk cluster tidak sama, selanjutnya disebut clusters of unequal size

Cluster:

Penarikan Sampel Cluster

Single stage Cluster Sampling

Multistage Sampling

Single stage vs Multi stage

› Ada dua cara untuk menentukan unit yang diteliti:

1. Semua unit yang ada dalam klaster terpilih dimasukkan

sebagai anggota sampel dan informasinya dikumpulkan. Dalam

sampling, penarikan sampel ini termasuk metode sampling

klaster satu tahap (single stage/ one stage cluster sampling).

2. Sebagian unit yang ada dalam klaster terpilih, dipilih dalam

sampel dan hanya dari unit terpilih informasi dikumpulkan.

Penarikan sampel ini termasuk metode sampling klaster

bertahap (multi stage cluster sampling).

› Pengumpulan data pada unit yang berdekatan lebih mudah,

murah, cepat, dan operasi lapangan lebih memungkinkan

dibandingkan bila unit menyebar ke seluruh wilayah.

› Biaya transpor antar unit sampel mahal dan tidak sebanding

dengan biaya penelitian per unit sampel.

› Bila dihadapkan pada kesulitan penyediaan kerangka

sampel yang memuat seluruh unit sampel dalam populasi

secara lengkap dan mutahir. Biaya untuk pembuatan

kerangka sampel ini sangat mahal.

Alasan penerapan cluster sampling

› Pada umumnya tidak lebih efisien daripada

elemen sampling (variansnya cenderung

lebih besar)

› Tidak bisa digunakan untuk mengestimasi

pada level cluster (bandingkan dg strata)

Kerugian penerapan cluster sampling

I. Equal Cluster Size› Misalkan suatu populasi {O} dikelompokan menjadi N

cluster yang membentuk suatu Frame:

{ U } = { U1, U2, … Ui … UN }

• Cluster ke-i (i : 1, 2, ….N) memuat M elemen (j : 1, 2, ….M)• yij menyatakan nilai karaktristik Y pada elemen ke-j

dalam cluster ke-i• Nilai Y dapat ditata dalam catatan matriks sbb:

Populasi dan Parameter

Elemen indeks

Cluster indeks

1 2 … i … N

1 y11 y21 … yi1 … yN1

2 y12 y22 … yi2 … yN2

: : : : : : :

j y1j y2j … yij … yNj

: : : : : : :

M y1M y2M … yiM … yNM

Total y1. y2. … yi. … yN.

Matriks nilai yij

› Rataan per-elemen dalam cluster

› Rataan umum per cluster

› Rataan umum per-elemen

› Varians populasi

Populasi dan Parameter

Dekomposisi Varians Populasi

Maka:

› Misalkan suatu populasi terdiri atas N cluster, dan masing-

masing cluster berukuran sama yaitu M elemen. Satu gugus

sampel yang berukuran n cluster ditarik dari N cluster

secara SRSWOR/sistematik linear. Seluruh elemen didalam

cluster terpilih diteliti.

› Misalkan yij (j:1,2,3,…, M; i: 1,2,3,4,…,n) menyatakan nilai

kharakteristik y pada elemen ke-j dalam cluster terpilih ke-i.

Estimasi

N Populasi

SRSWOR/Sistematik n sampel

› Estimasi total bagi karakteristik Y

› Estimasi varians bagi total Y

dengan:

› Rumus estimasi varians bagi total Y dapat dijabarkan:

Keterangan:

› Estimasi rata-rata per-cluster

– Estimasi varians

› Estimasi rata2 per-elemen (lebih menarik daripada rata2 per-cluster)

– Estimasi varians

Estimasi rata-rata

› Estimasi standard error= akar estimasi varians

› Estimasi Confidence interval (1-α) 100% bagi rata2

yang sebenarnya adalah

› Seorang manager sirkulasi surat kabar ingin mengetahui rata2

banyaknya surat kabar yang dibeli oleh rumah tangga di suatu

komunitas. Dalam komunitas tersebut terdapat 400 rumah tangga

yang terdaftar 40 geographical cluster yg setiap cluster-nya

memuat 10 ruta. Satu gugus sampel yang berukuran 4 cluster

ditarik secara SRSWOR, dan semua rumah tangga dalam cluster

terpilih diwawancarai, dan hasilnya seperti tercantum pada Tabel

1. Berapa estimasi rata2 banyaknya surat kabar yang dibeli oleh

rumah tangga berikut standard error dan relative standar error-

nya !

Contoh Soal

Ilustrasi

Cluster terpilih sampel

Cluster tidak terpilih sampel

Keterangan:

: rumah tangga

Tabel 1: Jumlah surat kabar yang dibeli oleh ruta menurut cluster

No. Ruta

Nomor cluster terpilih Grand Total1 2 3 4

1 1 1 2 1

2 2 3 1 1

3 1 2 1 3

4 3 2 1 2

5 3 3 1 1

6 2 1 3 5

7 1 4 2 1

8 4 1 1 2

9 1 1 3 3

10 1 2 1 1

Total 19 20 16 20 75

Penyelesaian:

› Rata-rata banyaknya koran yang dibeli tiap rumah tangga:

› Sampling varians:

TERIMA KASIHHave A Nice Sampling

Recommended