KARAKTERISTIK PENDUGA PARAMETER
GENERALIZED ESTIMATING EQUATION (GEE)
PADA DATA LONGITUDINAL
(Skripsi)
Oleh
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS LAMPUNG
BANDARLAMPUNG
2016
NAELU RASYIDA
ABSTRACT
PARAMETER ESTIMATION’S CHARACTERISTICS OF
GENERALIZED ESTIMATING EQUATION (GEE)
ON LONGITUDINAL DATA
By
NAELU RASYIDA
Repeated measurement on longitudinal data can caused autocorrelation. The
method to modelling autocorrelation data is Generalized Estimating Equation
(GEE), since in this method the correlation is counted so that obtained more
efficient model. In this study, will be discussed about parameter estimation’s
characteristics on GEE includes unbiased and efficient. Parameter estimator on
GEE can be proved unbiased, and the efficiency depend on the best correlation
structure choosed. If there are some possibility of the correlation structures to
chosen, so the most efficient is that obtained smallest Quasi Information Criterion
value.
Keyword : longitudinal data, generalized estimating equation, unbiased, efficient
ABSTRAK
KARAKTERISTIK PENDUGA PARAMETER
GENERALIZED ESTIMATING EQUATION (GEE)
PADA DATA LONGITUDINAL
Oleh
NAELU RASYIDA
Pengukuran berulang pada data longitudinal dapat menyebabkan adanya
autokorelasi. Metode yang cocok untuk memodelkan data yang mengandung
autokorelasi adalah Generalized Estimating Equation (GEE), karena dalam metode
ini korelasi diperhitungkan sehingga menghasilkan model yang lebih efisien.
Dalam penelitian ini, akan dikaji mengenai karakteristik penduga parameter pada
GEE yang meliputi sifat takbias dan efisien. Penduga parameter pada GEE terbukti
takbias, dan keefisienannya tergantung pada pemilihan struktur korelasi yang
terbaik. Jika terdapat beberapa struktur korelasi yang mungkin untuk dipilih, maka
model yang paling efisien adalah yang menghasilkan nilai Quasi Information
Criterion terkecil.
Kata kunci : data longitudinal, generalized estimating equation, takbias, efisien
KARAKTERISTIK PENDUGA PARAMETER
GENERALIZED ESTIMATING EQUATION (GEE)
PADA DATA LONGITUDINAL
Oleh
NAELU RASYIDA
Skripsi
Sebagai Salah Satu Syarat untuk Memperoleh Gelar
SARJANA SAINS
Pada
Jurusan Matematika
Fakultas Matematika dan Ilmu Pengetahuan Alam
Universitas Lampung
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS LAMPUNG
BANDAR LAMPUNG
2016
RIWAYAT HIDUP
Penulis dilahirkan di Pringsewu pada tanggal 14 Mei 1995, anak pertama dari dua
bersaudara pasangan Bapak Sukirno dan Ibu Nurhasanah.
Penulis menyelesaikan pendidikan formal di Taman Kanak-Kanak KH. Gholib
Pringsewu pada tahun 2001, Sekolah Dasar Negeri 2 Rejosari Pringsewu pada
tahun 2007, Sekolah Menengah Pertama Negeri 1 Pringsewu pada tahun 2010,
Sekolah Menengah Atas Negeri 1 Gadingrejo pada tahun 2012, dan diterima
sebagai mahasiswa di Jurusan Matematika, Fakultas Matematika dan Ilmu
Pengetahuan Alam, Universitas Lampung pada tahun 2012 melalui jalur SNMPTN
tertulis.
Selama menjadi mahasiswa Universitas Lampung, penulis aktif dalam organisasi
kemahasiswaan yaitu sebagai anggota Himpunan Mahasiswa Jurusan Matematika
FMIPA Universitas Lampung periode 2013-2015 dan sebagai anggota Badan
Eksekutif Mahasiswa FMIPA Universitas Lampung periode 2013-2015. Penulis
juga pernah menjadi asisten mata kuliah Statistika Dasar dan Statistika Matematika
di Jurusan Matematika FMIPA Universitas Lampung.
Penulis telah melaksanakan Kerja Praktik (KP) di Dinas Peternakan dan Kesehatan
Hewan Provinsi Lampung pada tahun 2015, dan Kuliah Kerja Nyata (KKN) pada
tahun 2015 di Desa Gunung Timbul, Kec. Tumijajar, Kab. Tulangbawang Barat.
Bismillaahirrohmanirrohiim
Alhamdulillahirobbil’alamiin…
Dengan penuh rasa syukur kepada Allah SWT, kupersembahkan karya
kecilku ini untuk
Bapak dan Ibu, yang sangat aku cintai
Adikku, yang aku sayangi
Dosen Pembimbing dan Penguji, yang selalu memotivasiku
Sahabat-sahabatku, yang selalu menyemangatiku
Serta
Almamater tercinta tempatku menuntut ilmu
Hidup adalah Ibadah
Semakin Kamu Belajar, Semakin Kamu Tahu Bahwa
Kamu Tidak Tahu
Carilah Ilmu Sejak Dari Buaian Hingga Ke Liang Lahat
(Al Hadist)
SANWACANA
Puji syukur kehadirat Allah SWT yang telah melimpahkan karunia-Nya kepada
penulis sehingga penulis dapat menyelesaikan skripsi ini yang berjudul
“Karakteristik Penduga Parameter Generalized Estimating Equation (GEE)
Pada Data Longitudinal”. Tak lupa shalawat serta salam selalu tercurah kepada
Rosululloh Muhammad SAW yang selalu kita harapkan syafaatnya kelak, aamiin.
Banyak pihak yang telah membantu penulis dalam menyelesaikan laporan skripsi
ini. Oleh karena itu, penulis mengucapkan terimakasih yang sebesar-besarnya
kepada :
1. Bapak Ir. Warsono, M.S., Ph.D. selaku pembimbing pertama yang telah
memberikan ide, pengarahan, serta meluangkan waktu ditengah kesibukannya
untuk membimbing penulis.
2. Ibu Widiarti, S.Si., M.Si. selaku pembimbing kedua yang selalu membimbing
penulis dengan sabarnya dan banyak memberikan masukan serta motivasi
kepada penulis dalam menyelesaikan skripsi ini.
3. Ibu Dian Kurniasari, S.Si., M.Sc. selaku penguji yang telah banyak
memberikan masukan, kritik dan saran yang sangat membangun demi
kesempurnaan skripsi ini.
4. Bapak Drs. Suharsono S., M.S., M.Sc., Ph.D. selaku pembimbing akademik.
5. Bapak Drs. Tiryono Ruby, M.Sc., Ph.D. selaku Ketua Jurusan Matematika
FMIPA Universitas Lampung.
6. Bapak Prof. Warsito, S.Si., DEA., Ph.D. selaku Dekan FMIPA Universitas
Lampung.
7. Seluruh dosen Jurusan Matematika FMIPA Universitas Lampung.
8. Bapak Sukirno dan Ibu Nurhasanah, orang tua tercinta yang telah
membesarkan dan mendidik dengan penuh kasih sayang, selalu mendukung,
menyemangati, memotivasi dan tiada hentinya mendoakan penulis.
9. Nurul Annisa Fadila, adik yang paling menggemaskan, yang selalu
menyemangati dan mendoakan penulis.
10. Wanita-wanita rusuh (Anisa/Icha, Lina, Grita, Citra, Hana, Merda, Sella) dan
keluarga besar Matematika 2012 yang telah berjuang bersama dan banyak
memberikan semangat serta motivasi kepada penulis.
11. Aan Chumaidi Ab. yang selalu menyemangati dan memotivasi penulis.
12. Semua pihak yang terlibat dalam penyelesaian skripsi ini yang tidak dapat
penulis sebutkan satu per satu.
Penulis menyadari bahwa skripsi ini masih jauh dari kesempurnaan karena
kesempurnaan hanyalah milik Allah SWT. Penulis sangat mengharapkan kritik dan
saran yang membangun. Penulis juga berharap agar tulisan ini bermanfaat bagi
pembaca.
Bandarlampung, Oktober 2016
Penulis
DAFTAR ISI
Halaman
DAFTAR TABEL ......................................................................................... xv
I. PENDAHULUAN ..................................................................................... 1
1.1 Latar Belakang dan Masalah ................................................................. 1
1.2 Tujuan Penelitian .................................................................................. 2
1.3 Manfaat Penelitian ................................................................................. 3
II. TINJAUAN PUSTAKA ........................................................................... 4
2.1 Data Longitudinal ................................................................................. 4
2.2 Generalized Linear Model (GLM) ....................................................... 4
2.3 Generalized Estimating Equation (GEE) ............................................. 5
2.3.1 Struktur Data ................................................................................. 6
2.3.2 Pemilihan Working Correlation Matrix ........................................ 7
2.3.3 Menduga Kovarians dari Penduga Parameter................................ 10
2.4 Quasi-likelihood Information Criterion (QIC) ..................................... 11
2.5 Sifat-Sifat Penduga yang Baik .............................................................. 12
III. METODOLOGI PENELITIAN ............................................................ 14
3.1 Waktu dan Tempat Penelitian ............................................................... 14
xiv
3.2 Metode Penelitian .................................................................................. 14
IV. HASIL DAN PEMBAHASAN ............................................................... 16
4.1 Sifat Tak Bias ....................................................................................... 19
4.2 Penduga Efisien ..................................................................................... 20
V. KESIMPULAN ......................................................................................... 33
DAFTAR PUSTAKA ..................................................................................... 34
LAMPIRAN
DAFTAR TABEL
Halaman
Tabel 4.1 Respon Pengaruh Obat Pada Penderita Depresi .............................. 24
Tabel 4.2 Keterangan Syntax Program ........................................................... 26
Tabel 4.3 Struktur Korelasi Autoregressive .................................................... 27
Table 4.4 Struktur Korelasi Exchangable ........................................................ 27
Table 4.5 Struktur Matriks Varians-Kovarians Model-Based Autoregressive 28
Table 4.6 Struktur Matriks Varians-Kovarians Model-Based Exchangable .... 29
Tabel 4.7 Struktur Matriks Varians-Kovarians Empirical Autoregressive ...... 29
Tabel 4.8 Struktur Matriks Varians-Kovarians Empirical Exchangable ......... 30
Table 4.9 Dugaan Parameter Berdasarkan Struktur Korelasi .......................... 31
Table 4.10 Nilai QIC Berdasarkan Struktur Korelasi ...................................... 31
I. PENDAHULUAN
1.1 Latar Belakang dan Masalah
Analisis statistika banyak digunakan dalam berbagai bidang seperti ilmu sosial,
kesehatan, pendidikan, dan lain-lain. Dalam analisis statistika, terdapat beberapa
teknik pengamatan dalam mengumpulkan data, seperti pengamatan cross section,
time series, dan longitudinal. Pengamatan longitudinal merupakan pengamatan
yang menggabungkan antara pengamatan cross section dan time series.
Kelebihan pengamatan longitudinal dari pengamatan yang lain yaitu mampu
memberikan informasi tentang dinamika perubahan pada data cross section dari
waktu ke waktu. Namun pengukuran secara berulang pada pengamatan longitudinal
dapat menyebabkan terjadinya autokorelasi. Untuk memodelkan data yang
mengandung autokorelasi tidak bisa menggunakan model linear biasa maupun
model linear yang diumumkan atau yang biasa disebut Generalized Linear Model
(GLM). Liang dan Zeger (1986) mengusulkan metode Generalized Estimating
Equation (GEE) untuk mengatasi data yang berkorelasi.
GEE merupakan metode yang memodelkan sebuah fungsi yang diketahui dari
harapan marginal variabel dependent sebagai fungsi linear dari satu atau lebih
variabel penjelas. GEE umumnya digunakan untuk menduga parameter regresi
2
dalam model marginal dan menentukan struktur korelasinya. Pendugaan parameter
pada GEE dilakukan menggunakan metode quasi-likelihood dimana hanya
mengasumsikan hubungan antara µ dan var(Y) daripada distribusi peluang untuk Y.
Quasi-likelihood melambangkan variansnya berupa ϕvar(Y), dimana ϕ merupakan
dugaan berdasarkan perubahan yang diobservasi dalam data sampel. Pendugaan
quasi-likelihood bukanlah maximum likelihood karena metodenya tidak secara
lengkap menggunakan distribusi untuk Y, dan oleh karena itu tidak ada fungsi
likelihood.
Pendugaan parameter menggunakan metode GEE untuk kasus data longitudinal
yang berdistribusi normal telah dilakukan oleh Hedeker dan Gibbons dalam
bukunya yang berjudul Longitudinal Data Analysis (2006). Pada buku tersebut
tidak dikaji karakteristik dari penduga yang didapatkan. Karakteristik suatu
penduga perlu dievaluasi untuk mendapatkan informasi tentang sifat-sifat dari
penduganya. Berdasarkan hal tersebut, penulis tertarik untuk mengkaji karakteristik
penduga parameter dari metode GEE yang meliputi sifat tak bias dan efisien.
1.2 Tujuan Penelitian
Adapun tujuan dari penelitian ini yaitu :
1. Menentukan penduga parameter model data longitudinal menggunakan metode
GEE.
2. Mengkaji karakteristik penduga yang meliputi sifat ketakbiasan dan efisien.
3
1.3 Manfaat Penelitian
Adapun manfaat yang bisa didapatkan dari penelitian ini yaitu :
1. Menambah wawasan mengenai metode GEE.
2. Mendapat dugaan parameter model data longitudinal menggunakan metode
GEE.
3. Mengetahui karakteristik penduga parameter dengan metode GEE.
II. TINJAUAN PUSTAKA
2.1 Data Longitudinal
Menurut (Johnston, 1984) data panel biasa disebut juga data longitudinal atau data
runtun waktu silang (cross-sectional time series), di mana banyak kasus (orang,
perusahaan, negara dan lain-lain) diamati pada dua periode waktu atau lebih yang
diindikasikan dengan penggunaan data time series. Data panel dapat menjelaskan
dua macam informasi yaitu informasi cross-section pada perbedaan antar subyek,
dan informasi time series yang merefleksikan perubahan pada dimensi waktu.
Ketika kedua informasi tersebut tersedia, maka analisis data panel dapat digunakan.
2.2 Generalized Linear Model (GLM)
Menurut Agresti (2015), Generalized Linear Models (GLM) memperluas model
regresi linear dasar meliputi distribusi respon tidak normal dan kemungkinan fungsi
tidak linear dari nilai tengahnya. GLM mempunyai tiga komponen yaitu :
1. Komponen acak (random component), menetapkan variabel respon y dan
distribusi peluangnya. Suatu pengamatan 𝒚 = (𝑦1, … , 𝑦𝑛)𝑇 pada distribusinya
diperlakukan saling bebas (independent).
5
2. Prediktor linear (linear predictor). Untuk sebuah vektor parameter 𝜷 =
(𝛽1, … , 𝛽𝑝)𝑇 dan sebuah X matriks model n x p yang berisi nilai-nilai dari
variabel penjelas p untuk n pengamatan, prediktor linearnya adalah 𝑿𝜷.
3. Fungsi link (link function), yaitu fungsi g yang digunakan untuk setiap
komponen penjelas dari E(y) yang merelasikannya ke prediktor linear,
sehingga persamaan pada GLM adalah
g[E(y)]=Xβ.
Dalam model linear klasik, fungsi link bisa berupa fungsi yang identik atau
kanonik. Suatu fungsi link dikatakan fungsi link kanonik bila parameter
kanoniknya sama dengan fungsi linknya, yaitu
𝜂 = 𝜃
dimana 𝜃 adalah parameter kanonik.
Berikut fungsi link kanonik untuk beberapa distribusi :
Distribusi Fungsi link kanonik
Normal 𝜂 = 𝜇
Poisson 𝜂 = log 𝜇
Binomial 𝜂 = log (𝜇
(1 − 𝜇)⁄ )
Gamma 𝜂 = 𝜇−1
2.3 Generalized Estimating Equation (GEE)
Menurut Nelder dan Wedderburn (1972) , metode GEE adalah perluasan dari GLM
dengan tambahan :
1. Varians dari 𝑦𝑖 adalah 𝑣𝑖 = 𝑣𝑖(𝜇𝑖) dan merupakan sebuah fungsi yang
ditentukan dari nilai tengah 𝜇𝑖.
6
2. 𝑦𝑖 merupakan keluarga eksponensial. Distribusinya antara lain binomial,
poisson, gamma, dan invers Gaussian. Ketika diasumsikan distribusi dari 𝑦𝑖
adalah normal dan menetapkan fungsi link identitas g(µi) = µi, hal ini sama
dengan menyusun model sebagai GLM.
GEE digunakan untuk mengatasi data yang berkorelasi dan merupakan sebuah
perluasan dari quasi-score equation. Metode GEE memodelkan sebuah fungsi yang
diketahui dari harapan marginal variabel dependent sebagai fungsi linear dari satu
atau lebih variabel penjelas. GEE mendeskripsikan komponen acak model untuk
setiap respon marginal dengan sebuah fungsi link umum dan varians, serupa dengan
model GLM. Model GEE secara umum sama dengan model GLM yaitu
g[E(y)]=Xiβ
dimana
𝜷 = [
𝛽0
𝛽1
⋮𝛽𝑝
] 𝑑𝑎𝑛 𝑿𝑖 =
[ 1 𝑋𝑖11 𝑋𝑖12 ⋯ 𝑋𝑖1𝑝
1 𝑋𝑖21 𝑋𝑖22 ⋯ 𝑋𝑖2𝑝
⋮1
⋮𝑋𝑖𝑛𝑖1
⋮ ⋱ ⋮𝑋𝑖𝑛𝑖2
⋯ 𝑋𝑖𝑛𝑖𝑝]
Penduga GEE dari 𝜷 didapatkan dengan menyelesaikan persamaan
∑𝑫𝒊′[𝑽(�̂�)]−𝟏(𝒚𝒊 − 𝝁𝒊)
𝑁
𝑖=1
= 0
dimana �̂� adalah penduga yang konsisten bagi 𝛼 dan 𝑫𝑖 = 𝜕𝝁𝒊 𝜕𝜷⁄
2.3.1 Struktur Data
Menurut Kleinbaum (2010), persamaan untuk GEE adalah sebagai berikut
𝑌𝑖𝑗 = 𝛽0 + 𝛽1𝑋𝑖𝑗1 + 𝛽2𝑋𝑖𝑗2 + ⋯+ 𝛽𝑝𝑋𝑖𝑗𝑝 + 𝜀
7
Dimana 𝑌𝑖𝑗 melambangkan respon dari subyek ke-i pada pengamatan ke-j, untuk i
= 1, …, n dan j = 1, …, ti, 𝑋𝑖𝑗𝑝 adalah variabel penjelas ke-p pada subyek ke-i
pengamatan ke-j, 𝜀 mengandung autokorelasi akibat pengamatan yang berulang.
2.3.2 Pemilihan Working Correlation Matrix
Liang dan Zeger (1986) telah memperoleh beberapa dugaan struktur working
correlation untuk digunakan dalam pendugaan GEE. Berikut ini beberapa pilihan
untuk R dengan rumus matriks untuk t = 4.
1. Independence : R = R0 = I
𝐑 = [
1 00 1
0 00 0
0 00 0
1 00 1
]
Dalam kasus ini, penyelesaian GEE sama seperti menentukan model regresi biasa
untuk data independent, dan menghasilkan parameter dugaan yang sama. Tetapi,
galat bakunya berbeda.
2. Fixed : R = R0
Matriks korelasi fixed terjadi ketika ada determinasi bentuk dari analisis
sebelumnya. Maka langsung masukkan matriks kovariansnya.
8
3. Exchangeable
𝐶𝑜𝑟𝑟(𝑦𝑖𝑗, 𝑦𝑖,𝑗′) = {1 𝑗 = 𝑗′
𝛼 𝑗 ≠ 𝑗′}
𝐑 = [
1 𝛼𝛼 1
𝛼 𝛼𝛼 𝛼
𝛼 𝛼𝛼 𝛼
1 𝛼𝛼 1
]
�̂� =1
(𝑁∗ − 𝑝)𝜙∑ ∑ 𝑒𝑖𝑗𝑒𝑖𝑗′
𝑗<𝑗′
𝐾
𝑖=1
𝑁∗ = 0.5∑𝑛𝑖(𝑛𝑖 − 1)
𝐾
𝑖=1
Rincian struktur korelasi ini memuat konstanta korelasi-korelasi antara dua
pengukuran dalam sebuah subyek, yaitu, Rjj’ = α, untuk j ≠ j’. struktur korelasi ini
diasumsikan dalam sebuah model random effects dengan sebuah intersep acak dan
juga diketahui sebagai compound symmetry dalam literatur pengukuran berulang
ANOVA.
4. Unstructured
𝐶𝑜𝑟𝑟(𝑦𝑖𝑗 , 𝑦𝑖,𝑗′) = {1 𝑗 = 𝑗′
𝛼𝑗𝑗′ 𝑗 ≠ 𝑗′}
𝐑 = [
1 𝛼21
𝛼21 1
𝛼31 𝛼41
𝛼32 𝛼42
𝛼31 𝛼32
𝛼41 𝛼42
1 𝛼43
𝛼43 1
]
�̂�𝑗𝑗′ =1
(𝐾 − 𝑝)𝜙∑𝑒𝑖𝑗𝑒𝑖𝑗′
𝐾
𝑖=1
9
Ketika matriks korelasi tidak terinci secara lengkap, ada 𝑡(𝑡 − 1)/2 parameter
untuk diestimasi. Struktur ini menyediakan estimasi yang lebih efisien untuk β tapi
hanya digunakan ketika ada secara relative beberapa waktu observasi atau kondisi.
Sebagai tambahan, ketika ada data hilang dan/atau macam-macam jumlah observasi
tiap subyek, penduga dari struktur korelasi lengkap mungkin hasil dalam sebuah
matriks definit nonpositive dan penduga parameter mungkin tidak dihasilkan.
5. m-dependent
𝐶𝑜𝑟𝑟(𝑦𝑖𝑗 , 𝑦𝑖,𝑗+𝑠) = {1 ; 𝑠 = 0 𝛼𝑠 ; 𝑠 = 1, 2, … ,𝑚0 ; 𝑠 > 𝑚
𝐑 = [
1 𝛼1
𝛼1 1𝛼2 0𝛼1 𝛼2
𝛼2 𝛼1
0 𝛼2
1 𝛼1
𝛼1 1
]
�̂�𝑡 =1
(𝐾𝑡 − 𝑝)𝜙∑ ∑ 𝑒𝑖𝑗𝑒𝑖,𝑗+𝑡
𝑗≤𝑛𝑖−𝑡
𝐾
𝑖=1
𝐾𝑡 = ∑(𝑛𝑖 − 𝑡)
𝐾
𝑖=1
Dengan struktur m-dependent, korelasi tergantung pada jarak antara pengukuran.
Sehingga, nilainya mendekati nol untuk s > m.
6. Auto-regressive (AR-1)
𝐶𝑜𝑟𝑟(𝑦𝑖𝑗, 𝑦𝑖,𝑗+𝑠) = 𝛼𝑠 ; 𝑠 = 0, 1, 2, … , 𝑡𝑖 − 𝑗
10
𝐑 = [
1 𝛼𝛼 1
𝛼2 𝛼3
𝛼 𝛼2
𝛼2 𝛼𝛼3 𝛼2
1 𝛼𝛼 1
]
�̂� =1
(𝐾1 − 𝑝)𝜙∑ ∑ 𝑒𝑖𝑗𝑒𝑖,𝑗+1
𝑗≤𝑛𝑖−1
𝐾
𝑖=1
𝐾1 = ∑(𝑛𝑖 − 1)
𝐾
𝑖=1
Dengan sebuah struktur korelasi auto-regressive, korelasi tergantung pada jarak
antar pengukuran, semakin jauh jaraknya maka nilai korelasinya semakin kecil.
2.3.3 Menduga Kovarians dari Penduga Parameter
Setelah penduga GEE diperoleh, kemudian kovariansnya juga diduga. Penduga
model-based dari matriks kovarians untuk �̂� adalah invers dari matriks informasi
terobservasi
𝑽𝒎(�̂�) = 𝑰0−1
dimana
𝑰0 = ∑𝑫𝑖′
𝑛
𝑖=1
𝑽𝑖−1𝑫𝑖
ini merupakan penduga yang konsisten jika model dan matriks working correlation
ditentukan secara spesifik (Albert dan McShane, 1995).
Penduga empirical sandwich (robust) dari Cov(�̂�) diberikan sebagai berikut
𝑰0−1𝑰1𝑰0
−1 = 𝑽𝒆(�̂�)
Dimana
11
𝑰1 = ∑𝑫𝑖′
𝑛
𝑖=1
𝑽𝑖−1𝐶𝑜𝑣(𝒀𝑖)𝑽𝑖
−1𝑫𝑖
Cov(𝒀𝑖) diduga dengan
(𝒀𝒊 − 𝝁𝒊(�̂�)) (𝒀𝒊 − 𝝁𝒊(�̂�))′
ini adalah penduga yang tetap konsisten ketika V(µij) ≠ 𝑣(�̂�𝑖𝑗), atau ketika 𝑹𝒊(𝜶)
bukan matriks korelasi dari Yi, atau ketika korelasi sebenarnya berubah-ubah untuk
setiap subyek.
2.4 Quasi-likelihood Information Criterion (QIC)
Quasi-likelihood information criterion (QIC) merupakan modifikasi dari Akaike
information criterion (AIC) yang diterapkan pada model GEE. QIC didefinisikan
sebagai berikut
𝑄𝐼𝐶 = −2𝚀(�̂�, 𝜙) + 2𝑡𝑟𝑎𝑐𝑒[𝑽𝒎−𝟏(�̂�)𝑽𝒆(�̂�)]
Dimana 𝚀(�̂�, 𝜙) merupakan fungsi quasi-likelihood yang didefinisikan
𝚀(�̂�, 𝜙) =𝚀𝑖𝑗
𝜙
𝜙 diduga dengan
�̂� =1
𝑁 − 𝑝∑∑𝑒𝑖𝑗
2
𝑛𝑖
𝑗=1
𝐾
𝑖=1
(Pan, 2001).
McCullagh dan Nelder (1989) mendefinisikan beberapa fungsi 𝚀𝑖𝑗 untuk beberapa
distribusi sebagai berikut
12
1. Normal
𝚀𝑖𝑗 = −1
2(𝑦𝑖𝑗 − 𝜇𝑖𝑗)
2
2. Inverse Gaussian
𝚀𝑖𝑗 =(𝜇𝑖𝑗 − 0,5𝑦𝑖𝑗)
𝜇𝑖𝑗2
3. Gamma
𝚀𝑖𝑗 = − [𝑦𝑖𝑗
𝜇𝑖𝑗+ log (𝜇𝑖𝑗)]
4. Negative Binomial
𝚀𝑖𝑗 = [log Γ (𝑦𝑖𝑗 +1
𝑘) − log Γ (
1
𝑘) + 𝑦𝑖𝑗log (
𝑘𝜇𝑖𝑗
1 + 𝑘𝜇𝑖𝑗) +
1
𝑘log (
1
1 + 𝑘𝜇𝑖𝑗)]
5. Poisson
𝚀𝑖𝑗 = 𝑦𝑖𝑗 log(𝜇𝑖𝑗) − 𝜇𝑖𝑗
6. Binomial
𝚀𝑖𝑗 = 𝑟𝑖𝑗 log(𝑝𝑖𝑗) − ( 𝑦𝑖𝑗 − 𝜇𝑖𝑗) log(1 − 𝑝𝑖𝑗)
2.5 Sifat-Sifat Penduga yang Baik
Suatu penduga dikatakan penduga yang baik jika penduga tersebut memiliki sifat
tak bias dan efisien. Berikut ini akan didefinisikan sifat-sifat penduga yang baik.
1. Sifat Tak Bias
Penduga 𝑈(𝑿) dikatakan sebagai penduga tak bias bagi g(𝜽) jika
𝐸(𝑈(𝑿)) = g(𝜽), ∀𝜽 ∈ 𝛀
(Hoog and Craig, 1995).
13
2. Sifat Efisien
Setelah diketahui sifat ketakbiasan suatu penduga, selanjutnya yaitu menyelidiki
apakah penduga tersebut efisien. Suatu penduga dikatakan efisien jika variansnya
minimum. Sifat varians minimum suatu penduga didefinisikan sebagai berikut.
Jika T* merupakan penduga bagi g(𝜽), dan ada T sebarang penduga bagi g(𝜽),
maka T* dikatakan penduga dengan varians minimum jika
𝑉𝑎𝑟(𝑇∗) ≤ 𝑉𝑎𝑟(𝑇)
(Hoog and Craig, 1995).
Varians minimum suatu penduga juga dapat diketahui dengan menggunakan
pertidaksamaan Rao-Cramer dengan definisi sebagai berikut.
Misal T* merupakan penduga tak bias g(𝜽), maka untuk sebarang penduga tak bias
T bagi g(𝜽) disebut penduga yang efisien jika Var(T*) ≤ Var(T) untuk setiap 𝜽 ∈ 𝛀
dimana
𝑉𝑎𝑟(𝑇) ≥(
𝜕𝜕𝜽
𝑔(𝜽))2
𝑛. 𝐸 [𝜕𝜕𝜽
ln 𝑓(𝑿; 𝜽)]2
(Bain and Engelhardt, 1992).
III. METODOLOGI PENELITIAN
3.1 Waktu dan Tempat Penelitian
Penulis melakukan penelitian ini pada semester genap tahun ajaran 2015-2016 di
Jurusan Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam,
Universitas Lampung.
3.2 Metode Penelitian
Adapun langkah-langkah peneliti dalam melakukan penelitian ini yaitu :
1. Mengkaji jurnal-jurnal dan penelitian-penelitian terdahulu mengenai metode
Generalized Estimating Equation (GEE).
2. Melakukan estimasi parameter dari model yang didapat menggunakan metode
GEE. Menurut Stokes, Davis, and Koch (2012), langkah-langkah dalam
menduga parameter dengan metode GEE adalah sebagai berikut :
a. Merelasikan respon marginal 𝜇𝑖𝑗 = 𝐸(𝑦𝑖𝑗) dengan kombinasi linear dari
kovariat yaitu g(µij) = 𝑥𝑖𝑗′ β, dimana 𝜷 = (𝛽1, 𝛽2, … , 𝛽𝑝)′ adalah vektor p x
1 dari parameter yang tidak diketahui dan g adalah fungsi link yang
diketahui. Vektor parameter 𝜷 mengkarakteristikkan bagaimana distribusi
respon cross-sectional tergantung pada variabel penjelas.
15
b. Memilih bentuk working correlation matrix Ri(α) untuk setiap 𝑦𝑖 =
(𝑦𝑖1, 𝑦𝑖2, … , 𝑦𝑖𝑡𝑖)′, dimana ti ≤ t.
c. Mengestimasi vektor parameter 𝜷. Penduga GEE dari 𝜷 didapatkan dengan
menyelesaikan persamaan
∑𝑫𝒊′[𝑽(�̂�)]−𝟏(𝒚𝒊 − 𝝁𝒊)
𝑁
𝑖=1
= 0
dimana �̂� adalah penduga yang konsisten bagi 𝛼 dan 𝑫𝑖 = 𝜕𝝁𝒊 𝜕𝜷⁄ .
3. Mengkaji sifat tak bias penduga 𝜷.
4. Mengkaji sifat efisien penduga 𝜷.
V. KESIMPULAN
Berdasarkan penelitian yang telah dilakukan, maka diperoleh :
1. Penduga GEE untuk 𝜷 dengan distribusi marginalnya normal adalah
�̂� = [∑𝑿𝒊′[𝑽(�̂�)]−𝟏𝑿𝑖
𝑁
𝑖=1
]
−1
[∑𝑿𝒊′[𝑽(�̂�)]−𝟏𝒚𝒊
𝑁
𝑖=1
]
2. Penduga GEE merupakan penduga yang takbias karena 𝐸(�̂�) = 𝜷.
3. Penduga GEE lebih efisien jika pemilihan struktur korelasinya tepat, yaitu
struktur korelasi yang menghasilkan nilai QIC terkecil. Dalam penelitian ini,
nilai QIC terkecil dihasilkan dari struktur korelasi autoregressive yaitu
1024,8207 daripada struktur korelasi exchangeable yaitu 1024,8260.
DAFTAR PUSTAKA
Agresti, A. 2007. An Introduction to Categorical Data Analysis Second Edition.
John Wiley and Sons, Inc, New Jersey.
Agresti, A. 2015. Foundations of Linear and Generalized Linear Models. John
Wiley and Sons, Inc, New Jersey.
Albert, P. and McShane, L. 1995. A Generalized Estimating Equation Approach for
Spatially Correlated Binary Data : Application to The Analysis of
Neuroimaging Data. Biometrics.
Bain, L.J. and Engelhardt, M. 1992. Introduction to Probability and Mathematical
Statistics Second Edition. Duxbury Press, California.
Hedeker, D. and Gibbons, R.D. 2006. Longitudinal Data Analysis. John Wiley and
Sons, New Jersey.
Hogg, R.V. and Craig, A.T. 1995. Introduction to Mathematical Statistics. Prentice-
Hall, New Jersey.
Johnston, J. 1984. Econometric Methods. McGraw Hill, USA.
Kleinbaum, D.G. 2010. Logistic Regression. Springer Series in Statistics, New
York.
Liang, K.Y. and Zeger, S.L. 1986. Longitudinal Data Analysis Using Generalized
Linear Models. Biometrics.
McCullagh, P. and Nelder, J.A. 1989. Generalized Linear Model, 2th Edition.
Chapman & Hall, London.
Nelder, J.A. and Wedderburn, R.W.M. 1972. Generalized Linear Model. Journal
of The Royal Statistical.
Pan, W. 2001. Akaike’s Information criterion in Generalized Estimating Equation.
Bioimetrics.
35
Stokes, M.E., Davis, C.S. and Koch, G.G. 2012. Categorical Data Analysis Using
SAS, Third Edition. SAS Intitute Inc, Cary NL.
Swan, T. 2006. Generalized Estimating Equation When The Response Variable Has
a Tweedie Distribution : An Application For Multi-site Rainfall Modelling.
University of Southern Queensland, Toowoomba QLD.
Utami, dkk. 2014. Generalized Method of Moment’s Characteristics on Panel Data.
Journal. Sci-int, Lahore. 26 : 985-990.