38
Pendekatan Metode Classification and Regression Tree untuk Diagnosis Tingkat Keganasan Kanker pada pasien Kanker Tiroid Seminar Hasil Tugas Akhir Sri Hartati Selviani Handayani 1311106007 Pembimbing : Dr. Santi Wulan Purnami, S.Si, M.Si Jurusan Statistika - FMIPA Institut Teknologi Sepuluh Nopember Surabaya - 2014

Seminar Hasil Tugas Akhir - digilib.its.ac.id · Pendekatan MetodeClassification and Regression Treeuntuk Diagnosis Tingkat Keganasan Kanker pada pasien Kanker Tiroid Seminar Hasil

  • Upload
    ngodan

  • View
    217

  • Download
    0

Embed Size (px)

Citation preview

Pendekatan Metode Classification and Regression Tree untuk Diagnosis Tingkat Keganasan Kanker

pada pasien Kanker Tiroid

Seminar Hasil Tugas Akhir

Sri Hartati Selviani Handayani1311106007

Pembimbing :Dr. Santi Wulan Purnami, S.Si, M.Si

Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember

Surabaya - 2014

Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014

Kanker Tiroid

Indonesia

Terkadang Berlebih dalammenghasilkan hormon tiroid

Membatasi menghasilkan hormontiroid

Membatasi menyerap Yodium

KelenjarTiroid

Urutan ke-9 dariinsiden kanker yang ada di Indonesia

Hiperteriodisme

Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014

Ganas

Faktor-faktor yang mempengaruhi

timbulnya kanker tiroid

Classification and Regression Tree

Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014

Sumartini (2013), Variabel yang signifikan terhadaphasil patologi kanker tiroid yaitu usia pasien dan riwayatpenyakit keluarga pasiendengan ketepatan klasifikasisebesar 86,6%

Istichana (2013), Variabel penentu pada kankertiroid yang berpengaruh signifikan terhadap hasilpatologi yaitu hasil pemeriksaan USG dengan ketepatanklasifikasi sebesar 86,6%.

Ramdani (2013) dengan menggunakan metodeCART menyimpulkan bahwa kontribusi tertinggi darihasil Pap Smear Test berturut-turut yaitu usiapasien, riwayat keguguran, pemakaian alatkontrasepsi, usia menstruasi, dan frekuensi melahirkan

Penelitian Sebelumnya

Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014

Bagaimana karakteristik pasien kanker tiroid diRumah Sakit “X” Surabaya?

Bagaimana klasifikasi dan ketepatan klasifikasi padadiagnosis tingkat keganasan kanker berdasarkanfaktor yang mempengaruhi dengan pendekatanmetode Classification and Regression Tree ?

Apa sajakah faktor-faktor yang memberi kontribusitinggi terhadap klasifikasi pasien kanker tiroid diRumah Sakit “X” Surabaya?

Rumusan Masalah

Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014

Mengetahui karakteristik pasien kanker tiroid diRumah Sakit “X“ Surabaya.

Mengetahui klasifikasi dan ketepatan klasifikasi padadiagnosis tingkat keganasan kanker berdasarkanfaktor yang mempengaruhi hasil patologi kankertiroid dengan pendekatan metode Classification andRegression Tree

Mengetahui faktor-faktor yang memberi kontribusitertinggi pada klasifikasi pasien kanker tiroid diRumah Sakit “X” Surabaya

Tujuan

Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014

Dapat memberikan informasi kepada pihak Rumah Sakit“X” Surabaya tentang klasifikasi pasien hasil patologikanker tiroid berdasarkan variabel-variabel (faktor-faktor)yang menyebabkan timbulnya kanker tiroid setelahmelakukan pemeriksaan patologi sehingga dapatdilakukan perlakuan/pengobatan yang tepat padapenderita kanker tiroid

Manfaat Penelitian

Batasan MAsalah

Data Pasien Hasil Patologi Kanker Tiroid yang Melakukan operasi dan Pemeriksaan di rumah sakit “X” pada tahun 2011 dan 2012

Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014

Variabel Respon Hasil

Data Kontinu Model Pohon Regresi

Data Kategorik Model Pohon Klasifikasi

(Breiman dkk, 1993)

Classification and Regression Trees (CART)

Metode statistik nonparametrik yang dikembangkanuntuk klasifikasi

Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014

Langkah-Langkah Algoritma Pada Metode CART

(Breiman dkk, 1993)

PembentukanPohon Klasifikasi

PenghentianPembentukanpohon

Pemangkasanpohon Klasifikasi

PembentukanPohon KlasifikasiOptimal

1. Pemilihan Pemilah

2. Pemilihan Simpul

3. Menentukan Goodness of split

4.Penentuan Simpul Terminal

5.Penandaan Label kelas

Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014

Kanker Tiroid

(Djokomoeljanto,2009)

Kanker Tiroid merupakan penyakit yang tidakmenular yang menyerang pada bagian depan lehersedikit dibawah laring yang berbentuk kupu-kupu.

Ciri-Ciri Kanker Tiroid Jinak GanasMengganggu Fungsi Aktivitas Tubuhdan Menyebar Keseluruh Tubuhsecara sporadik Tidak YaSifat Lunak PadatNyeri pada bagian leher Tidak YaPertumbuhan Lambat Cepat

Permukaan Nodul Rata/normalBenjolan/terjadipembengkakan

Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014

Penyebab Kanker Tiroid

Terjadinya perubahan atau mutasi genetik pada seltiroid yang menjadikan sel berkembang secara cepat

(Djokomoeljanto,2009)

1. Nyeri di tenggorokan atau pada daerah leher .2. Adanya pembesaran nodul / benjolan pada leher yang

mengakibatkan terganggunya pernapasan.3. Suara serak yang tidak kunjung sembuh. 4. Pembesaran pada kelenjar getah bening yang ada di

leher.

Gejala pada Kanker Tiroid

Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014

Data yang digunakan dalam penelitian ini merupakandata sekunder pasien hasil patologi kanker tiroid yangdiperoleh dari data rekam medis di salah satu rumahsakit “X” Surabaya pada tahun 2011 dan 2012 dimanadata berjumlah 82 orang pasien.

Sumber Data

Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014

No Variabel Skala Keterangan

1 Jenis Kanker (Y) Nominal 0 : Jinak 1 : Ganas

2 Jenis Kelamin (X1) Nominal 0 : Laki-laki 1 : Perempuan

3 Usia (X2) Nominal 0: < 42 tahun1 : ≥ 42 tahun

4 Hasil Pemeriksaan USG (X3) Nominal 0 : Stuma 1 : Ca thyroid 2: Kista

5 Hasil Pemeriksaan Klinis (X4) Nominal 0 : Stuma 1 : Ca thyroid 2: Kista

6 Riwayat Penyakit Gondok (X5) Nominal 0 : Ada Keluhan 1 : Tidak Ada Keluhan

7 Riwayat Penyakit Kanker (X6) Nominal 0 : Ada Riwayat 1 : Tidak Ada Riwayat

Variabel Penelitian

Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014

Langkah Analisis

Analisis deskriptif dari data penderitaKanker Tiroid1.

2.

3.

Kombinasi atau membagi data learning dan testing

Klasifikasi data penderita KankerTiroid dengan metode CART

Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014

Langkah Analisis

Mulai

Analisis Statistika Deskriptif

Kesimpulan dan saran

Proses pembentukan Pohon Klasifikasi

CART (Classification and Regression Trees)

Penentuan data learning dan data testing

Evaluasi Ketepatan Klasifikasi

Selesai

Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014

Tahap pembentukan CART

Pemisahan data menjadi dua bagian yaitu lerningdan testing

Pembentukan Pohon Klasifikasi

Menghitung ketepatan Klasifikasi model yang dihasilkan

Penentuan Pohon Klasifikasi Optimal

Pemangkasan Pohon Klasifikasi

Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014

Analisis & PEmbahasan

Jinak67%

Ganas33%

Hasil Patologi

Analisis Deskriptif

Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014

Laki-laki Perempuan

11

448

19

Jenis Kelamin

Jinak Ganas

Analisis Deskriptif

Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014

Analisis Deskriptif

< 42 Tahun >= 42 Tahun

21

34

19

8

Usia PasienJinak Ganas

Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014

Analisis Deskriptif

Struma Ca Thyroid Kista

47

08

15

120

Hasil Pemeriksaan USG

Jinak Ganas

Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014

Analisis Deskriptif

Struma Ca Thyroid Kista

50

05

11

16 0

Hasil Pemeriksaan Klinis

Jinak Ganas

Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014

Analisis Deskriptif

Ada Riwayat Tidak Ada Riwayat

15

408

19

Riwayat Penyakit Gondok

Jinak Ganas

Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014

Analisis Deskriptif

Ada Riwayat Tidak Ada Riwayat

10

45

11

16

Riwayat Penyakit Keluarga

Jinak Ganas

Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014

Kombinasi Data Learning dan Testing

Analisis Kombinasi Pohon (CART)

Pada penelitian ini data yang digunakan sebanyak 82 pengamatan, yang akan dicoba untuk kelompok Ke-i di jadikan sebagai data testing dan banyak data pada data learning untuksetiap kelompok ke-i merupakan penjumlahan data dari data testing kelompok lainnya dimana i = 1,2,3,4,5. Ketepatanklasifikasi pada data learning dan data testing yang paling tinggiyaitu pada kelompok 1 sehingga kombinasi data ini yang akandigunakan pada analisis selanjutnya

Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014

Kemungkinan Pemilah Pada VariabelPrediktor

VariabelSkala

KatagoriJumlah

KatagoriKemungkinan

Pemilah

X1 Jenis Kelamin Nominal 2 22-1 -1= 1 Pemilahan

X2 Usia Nominal 2 22-1 -1=1 Pemilahan

X3

Hasil Pemeriksaan USG Nominal 3 23-1 -1=3 Pemilahan

X4

Hasil Pemeriksaan Klinis Nominal 3 23-1 -1=3 Pemilahan

X5

Riwayat Penyakit Gondok Nominal 2 22-1 -1=1 Pemilahan

X6

Riwayat Penyakit Keluarga Nominal 2 22-1 -1=1 Pemilahan

Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014

Pohon Klasifikasi Maksimal yang terbentuk

Variabel yang memberi kontribusi tertinggi Pada PohonKlasifikasi Maksimal

Variable ScoreHasil Pemeriksaan Klinis (X4) 100.00Hasil Pemeriksaan USG (X3) 86.63Usia (X2) 24.71Riwayat Penyakit Keluarga (X6) 16.46Jenis Kelamin (X1) 5.71Riwayat Penyakit Gondok (X5) 4.23

Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014

Pohon Klasifikasi Maksimal

Klasifikasi pohon maksimal yang terbentuk terdiri atas8 simpul terminal. Hasil klasifikasi dengan simpulterminal ini menujukkan bahwa pohon maksimalmemiliki pengertian yang kompleks sehingga perluuntuk dilakukan pemangkasan

Ketepatan Hasil Klasifikasi Pada Pohon KlasifikasiMaksimal

Observasi

Prediksi

Total Prediksi Sensitivity Specificity

Total Tingkat Akurasi Jinak Ganas

Data Learning

Jinak 36,00 4,00 40,0090,00% 92,00% 90,76%

Ganas 2,00 23,00 25,00

Data Testing

Jinak 12,00 3,00 15,0080,00 % 50,00% 76,47%

Ganas 1,00 1,00 2,00

Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014

Pemangkasan Pohon Klasifikasi Maksimal

** : Pohon Klasifikasi Optimal

Urutan Simpul Akhir

Pohon ke-4 dengan simpul ke-2 merupakan pohon optimal dengan uji kesalahanrelatif 0,500 ± 0,354 dimana Resubtition Relative Costsebesar 0,400 dan kompleksitas parameter sebesar 0,034

0.500

Relat

ive C

ost

Number of Nodes

0.10.30.50.70.91.1

0 2 4 6 8

0.700

Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014

Pohon Klasifikasi Optimal

Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014

Ketepatan Hasil Klasifikasi Pada Pohon KlasifikasiOptimal

Validasi Pohon Klasifikasi Optimal

Ketepatan klasifikasi yang dihasilkan oleh data testing tersebut maka modelklasifikasi optimal yang dihasilkan sudah baik atau layak dalam model

ObservasiPrediksi

Total Misklasifikasi/ KelsalahanJinak Ganas

Data Learning

Jinak 40,00 0,00 40,00 0%

Ganas 10,00 15,00 25,00 40,00%Tingkat Akurasi Total % 84,6%

ObservasiPrediksi

Total Misklasifikasi/ KesalahanJinak Ganas

Data Testing

Jinak 15,00 0,00 15,00 0%

Ganas 1,00 1,00 2,00 50,00%Tingkat Akurasi Total (%) 94,1%

Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014

Evaluasi Ketepatan Klasifikasi

Dari 5 kelompok kombinasi data yang dicobakan diatas dapatdilihat bahwa ketepatan klasifikasi data learning dan data testing yang paling tinggi yaitu pada kelompok 1 dengantingkat akurasi data learning sebesar 0,846 dan testingsebesar 0,941 sehingga kombinasi data kelompok 1 yang digunakan pada analisis dan rata-rata nilai akurasi dari 5 kelompok data diatas maka pada data learning sebesar 0,875 dan testing yaitu sebesar 0,839.

Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014

Variabel yang Berpengaruh pada Tiap-tiap Kelompokdi Pohon Klasifikasi Optimal

Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014

Perbandingan Hasil Penelitian

Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014

Kesimpulan & SaranKesimpulan

1.

2.

Hasil dari statistika deskriptif menunjukkan bahwa hasil patologikanker tiroid pasien yang didiagnosis kanker tiroid yang jinaksebanyak 55 orang atau 67% dan pasien yang didiagnosiskanker tiroid yang jinak sebanyak 27 orang atau 33%. Karakteristik pasien pada hasil patologi kanker tiroid mayoritasdengan pemeriksaan USG dan klinis mayoritas hasilpemeriksaannya Struma, pada riwayat penyakit gondokmayoritas tidak ada riwayat dan tidak ada riwayat penyakitkanker pada keluarga pasien.

Klasifikasi dari diagnosis tingkat keganasan pada kankertiroid dengan faktor yang berpengaruh yaitu hasilpemeriksaan klinis. Pasien hasil patologi yang beresikomenderita kanker tiroid jinak hasil pemeriksaan klinisnyayaitu struma dan kista. Sedangkan pasien yang beresikomenderita kanker tiroid ganas yaitu ca thyroid

Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014

3.

Dengan total akurasi pada pasien kanker tiroid pada datalearning sebesar 84,6%, maka dapat disimpulkan bahwa modelklasifikasi optimal yang terbentuk baik untuk menggambarkanmodel klasifikasi pohon dan ketepatan klasifikasi pada datatesting sebesar 94,1%, hal ini menyimpulkan bahwa pohonklasifikasi yang diklasifikasikan pada data baru layak dalammodel.

Faktor yang memberi kontribusi tertinggi padaklasifikasi pasien kanker tiroid dengan menggunakanmetode CART yaitu hasil pemeriksaanklinis, sedangkan pada ketiga metode yang telahditeliti sebelumnya faktor-faktor yang berpengaruhpada klasifikasi pasien kanker tiroid yaitu hasilpemeriksaan klinis, hasil pemeriksaan USG, riwayatpenyakit keluarga dan usia.

Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014

Saran

Hasil pemeriksaan klinis merupakan variabel yangsangat berpengaruh yang menyebabkan timbulnyakanker tiroid, oleh sebab disarankan bagi pihak rumahsakit atau bagi orang yang pernah melakukanpemeriksaan klinis pada kelenjar tiroid sebaiknyamemeriksakan dirinya sedinimungkin dan lebihmendalam karena bila dibiarkan akan membawadampak yang buruk bagi kesehatan

Pada penelitian selanjutnya sebaiknya melakukankonsultasi kembali dengan dokter ahli dalammelakukan riset, agar memperoleh variable-variabelprediktor baru yang menyebabkan timbulnya kankertiroid.

Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014

Daftar Pustaka

American Cancer Society. 2012. [Online]. Avaible: (http://www.thyroid.cancer.int/ ,diaksestanggal 8 Oktober 2013)Breiman L., Friedman J.H Olshen R.A & Stone C.J. (1993). Classification And Regression Tree. New York, NY: Chapman And HallDjokomoeljanto, (2009). Indonesian Society of Endocrinology, Indonesian Study Group ofThyroidology, Indonesian Society of Endocrinology Semarang Branch, The 2nd

Thyroidology Update 2009. Semarang: Badan Penerbit Undip (Di unduh tanggal 22 September 2013)Hamdani , W dan Sampepajung, D. Thyroid cancer. The diagnose and the management.

Department of Surgery Medical Faculty, Hasanuddin University, Makasarhttp://med.unhas.ac.id/jurnal/attachments/article/74/THYROID%20Ca-William%20Hamdani.pdf (Diunduh tanggal 23 September 2013)Istichana, Y. Y. (2013). Penggunaan Metode CHAID Untuk Klasifikasi Pasien HasilPatologi kanker Tiroid. Tugas Akhir Diploma III Jurusan Statistika, Surabaya, InstitutTeknologi Sepuluh November.Layla, R. D. (2013). Klasifikasi Pendekatan Diabetes Melitus Dengan Metode CHAID danCART. Tugas Akhir Sarjana Jurusan Statistika, Surabaya, Institut Teknologi Sepuluh November.Laseduw,J.(2012) Kanker Tiroid. http://kanker tiroid.wordpress.com/2013/06/21/penyebab/.

(Di unduh tanggal 18 September 2013).Lewis, M.D dan Roger, J. (2000). An Introduction to Classification and Regression Tree (CART) Analysis. Ramdani, Y. (2013). Klasifikasi Hasil Pap Smear Test Kanker Serviks berdasarkan FaktorResiko. Tugas Akhir Sarjana Jurusan Statistika, Surabaya, Institut Teknologi SepuluhNovember.Subekti, I., Aru, W., Sudoyo., B. S., Idrus, A., Marcellius, S., Sesiati, S. (2010). KarsinomaTiroid. Buku Ajaran Ilmu Penyakit Dalam. Edisi 5. Jakarta : Interna Publising. P. 2031-37Sumartini, S. H. (2013). Analisis Regresi Biner Pada Faktor Yang Mempengaruhi HasilPatologi kanker Tiroid. Tugas Akhir Diploma III Jurusan Statistika, Surabaya, InstitutTeknologi Sepuluh November.Utama, Y. D. C (2012). Nilai diagnostik Karakteristik klinis di Bandingkan dengan Biopsipatologi Anatomi dalam mendiagnosis Karsinoma Tiroid, Skripsi, fakultasKedokteran Universitas diponegoro,Semarang. (Di unduh tanggal 14 Oktober 2013)Walpole, (1995). Pengantar Statistika. Gramedia Pustaka Utama: Jakarta.