4
The Excellence Research UNIVERSITAS UDAYANA 2011 18 MEMBANGUN KORPUS KOSAKATA DAN TEKS BAHASA BALI I Gusti Made Sutjaja Fakultas Sastra, Universitas Udayana ABSTRACT The idea of grouping local languages in Indonesia into major and minor indigenous languages on the considerations of literary traditions and existence of an indigenous writing system may not relevant any longer. The main reasons for the irrelevance are twofold. The first is technological. The progress of information technology has greatly influenced on aspects of research activities and processes of comprehending linguistic interests (lexicon and text [with phonology, morphology, syntax within]). The second is the progress in cooperation within the sphere of globalization (regionally: ASEAN and internationally) which requires the disclosure of virtually all matters, including results of linguistic ventures, in an international language. English has been ranked top priority as a means of communication with regards to publishing results of academic endeavours, as outputs and outcomes. Hence with these to major considerations, constructing Balinese corpora which will cover lexical and textual domains and their respective meanings become obligatory. Keywords: corpora, lexicon, text PENDAHULUAN Tulisan ini, sebagai gambaran kegiatan kelompok peneliti, ditumpukan pada pemikiran dasar dalam usaha pengembangan korpus kosakata atau leksikon dan kosateks bahasa Bali yang didasarkan pada beragam teks hidup lisan maupun tulis. Korpus yang akan dibangun dan dikembangkan merupakan pengembangan pembentukan bandar data atau database kosakata yang bersumber pada pemecahan beragam korpus dari kosateks yang tertulis secara moderen maupun tradisi. Teks tulis bersumber pada karya cetak moderen, sedang karya tulis tradisi bersumber pada manuskrip tradisi yang ditulis pada media lontar. Pemecahan kosakata yang bersumber pada kosateks dilaksanakan lewat penggunaan program perangkat lunak yang ada, dan juga kemungkinan pembuatan prangkat lunak baru, demi kelancaran dan penunjang pelaksanaan pembuatan korpus akan menjadi tumpuan keberhasilan kerja pada tingkat-tingkat tertentu. Korpus yang dihasilkan lewat kerja ini akan terus- menerus dimutakhirkan untuk mengakomodasi kosakata yang masih belum masuk atau tercecer. Pada tahap ini perhatian akan dicurahkan pada pengumpulan kosakata pokok untuk kelas-kelas kata dasar: nomina, verba, ajektiva. Dari kelompok kosakata pokok ini akan dibuat semacam sistem untuk mengakomodasi jenis-jenis imbuhan yang berkolokasi dengan kosakata pokok. Korpus kosakata, mencakupi kata dasar pokok atau dasar, kata turunan, kata majemuk, frasa mati (petrified phrasal construction), yang dihasilkan pada tingkat tertentu bisa dianggap sebagai bandar data. Bandar data inilah yang akan menjadi sumber acuan dan kisi-kisi dalam penyusunan dan penulisan kamus pembidangan tertentu, seperti kamus dasar, kamus umum, kamus peristilahan, kamus sinonim dan antonim. Sejalan dengan kegiatan ini adalah pengambilan gambar foto benda atau kegiatan sebagai ilustrasi kata atau istilah dalam menjelaskan makna. Sedang, korpus teks, terutama ceritera dan praktek kerakyatan, dengan beragam topik ke arah vertical atau horizontal, seperti kesetiaan, pengabdian, kelicikan, penghormatan kepada lingungan. Semuannya dikelompokkan ke dalam berbagai ranah subkorpus yang nantinya bisa dirujuk lewat semacam peranti penelusur atau search engine serdehana (hyperlink) atau canggih agar terpajan keterkaitan kosakata sebagai leksikon (makna pada tataran kata) dengan penggunaan kosakata pada tataran teks. Pemaknaan pada tataran teks atau pemaknaan situasional akan ditentukan oleh bermacam perihwalan, status pelibat, ragam kosakata dan bentuk bahasa yang digunakan dalam mencapai tujuan. Keterkaitan semua inilah yang menggambarkan makna luas dalam memahami teks agar bisa berterima secara linguistik dan sosial budaya (linguistically and culturally make sense); dengan kata lain, penangkapan makna lewat apa yang disurat dan disirat oleh penghasil teks (lisan atau tulis) dan diterima kebermaknaannya oleh pembaca atau pendengar teks. Dalam usaha mengangkat harkat bahasa Bali kembali ke panggung global, pertama, pengungkapan entri atau lamman berbahasa Bali harus dibarengi dengan aksara Bali h n c r k hanacaraka yang memiliki sejarah panjang hingga ke bahasa Brahmi, yang sudah punah, di India bagian selatan. Keterkaitan ihwal kesejarahan sisi sistem tulis atau ortografi bahasa Bali, bahasa ini

MEMBANGUN KORPUS KOSAKATA DAN TEKS BAHASA …lppm.unud.ac.id/wp-content/uploads/Korpus-Kosakata-dan-Teks-Baha… · jenis-jenis imbuhan yang berkolokasi dengan kosakata ... dan kosateks

Embed Size (px)

Citation preview

Page 1: MEMBANGUN KORPUS KOSAKATA DAN TEKS BAHASA …lppm.unud.ac.id/wp-content/uploads/Korpus-Kosakata-dan-Teks-Baha… · jenis-jenis imbuhan yang berkolokasi dengan kosakata ... dan kosateks

The Excellence Research UNIVERSITAS UDAYANA 2011 18

MEMBANGUN KORPUS KOSAKATA DAN TEKS BAHASA BALI

I Gusti Made Sutjaja Fakultas Sastra, Universitas Udayana

ABSTRACT

The idea of grouping local languages in Indonesia into major and minor indigenous languages on the considerations of literary traditions and existence of an indigenous writing system may not relevant any longer. The main reasons for the irrelevance are twofold. The fi rst is technological. The progress of information technology has greatly infl uenced on aspects of research activities and processes of comprehending linguistic interests (lexicon and text [with phonology, morphology, syntax within]).

The second is the progress in cooperation within the sphere of globalization (regionally: ASEAN and internationally) which requires the disclosure of virtually all matters, including results of linguistic ventures, in an international language. English has been ranked top priority as a means of communication with regards to publishing results of academic endeavours, as outputs and outcomes. Hence with these to major considerations, constructing Balinese corpora which will cover lexical and textual domains and their respective meanings become obligatory.

Keywords: corpora, lexicon, text

PENDAHULUAN

Tulisan ini, sebagai gambaran kegiatan kelompok peneliti, ditumpukan pada pemikiran dasar dalam usaha pengembangan korpus kosakata atau leksikon dan kosateks bahasa Bali yang didasarkan pada beragam teks hidup lisan maupun tulis. Korpus yang akan dibangun dan dikembangkan merupakan pengembangan pembentukan bandar data atau database kosakata yang bersumber pada pemecahan beragam korpus dari kosateks yang tertulis secara moderen maupun tradisi. Teks tulis bersumber pada karya cetak moderen, sedang karya tulis tradisi bersumber pada manuskrip tradisi yang ditulis pada media lontar.

Pemecahan kosakata yang bersumber pada kosateks dilaksanakan lewat penggunaan program perangkat lunak yang ada, dan juga kemungkinan pembuatan prangkat lunak baru, demi kelancaran dan penunjang pelaksanaan pembuatan korpus akan menjadi tumpuan keberhasilan kerja pada tingkat-tingkat tertentu. Korpus yang dihasilkan lewat kerja ini akan terus-

menerus dimutakhirkan untuk mengakomodasi kosakata yang masih belum masuk atau tercecer. Pada tahap ini perhatian akan dicurahkan pada pengumpulan kosakata pokok untuk kelas-kelas kata dasar: nomina, verba, ajektiva. Dari kelompok kosakata pokok ini akan dibuat semacam sistem untuk mengakomodasi jenis-jenis imbuhan yang berkolokasi dengan kosakata pokok.

Korpus kosakata, mencakupi kata dasar pokok atau dasar, kata turunan, kata majemuk, frasa mati (petrifi ed phrasal construction), yang dihasilkan pada tingkat tertentu bisa dianggap sebagai bandar data. Bandar data inilah yang akan menjadi sumber acuan dan kisi-kisi dalam penyusunan dan penulisan kamus pembidangan tertentu, seperti kamus dasar, kamus umum, kamus peristilahan, kamus sinonim dan antonim. Sejalan dengan kegiatan ini adalah pengambilan gambar foto benda atau kegiatan sebagai ilustrasi kata atau istilah dalam menjelaskan makna.

Sedang, korpus teks, terutama ceritera dan praktek kerakyatan, dengan beragam topik ke arah vertical atau horizontal, seperti kesetiaan, pengabdian, kelicikan, penghormatan kepada lingungan. Semuannya dikelompokkan ke dalam berbagai ranah subkorpus yang nantinya bisa dirujuk lewat semacam peranti penelusur atau search engine serdehana (hyperlink) atau canggih agar terpajan keterkaitan kosakata sebagai leksikon (makna pada tataran kata) dengan penggunaan kosakata pada tataran teks. Pemaknaan pada tataran teks atau pemaknaan situasional akan ditentukan oleh bermacam perihwalan, status pelibat, ragam kosakata dan bentuk bahasa yang digunakan dalam mencapai tujuan. Keterkaitan semua inilah yang menggambarkan makna luas dalam memahami teks agar bisa berterima secara linguistik dan sosial budaya (linguistically and culturally make sense); dengan kata lain, penangkapan makna lewat apa yang disurat dan disirat oleh penghasil teks (lisan atau tulis) dan diterima kebermaknaannya oleh pembaca atau pendengar teks.

Dalam usaha mengangkat harkat bahasa Bali kembali ke panggung global, pertama, pengungkapan entri atau lamman berbahasa Bali harus dibarengi dengan aksara Bali h n c r k hanacaraka yang memiliki sejarah panjang hingga ke bahasa Brahmi, yang sudah punah, di India bagian selatan. Keterkaitan ihwal kesejarahan sisi sistem tulis atau ortografi bahasa Bali, bahasa ini

Page 2: MEMBANGUN KORPUS KOSAKATA DAN TEKS BAHASA …lppm.unud.ac.id/wp-content/uploads/Korpus-Kosakata-dan-Teks-Baha… · jenis-jenis imbuhan yang berkolokasi dengan kosakata ... dan kosateks

The Excellence Research UNIVERSITAS UDAYANA 2011 19

memang telah memiliki warna atau nuansa menyejagat atau global. Penguatan penyegatan yang kedua adalah pemberian padan pada korpus kosakata dan korpus kosateks dalam bahasa Inggris sebagai salah satu bahasa internasional.

Istilah yang digunakan untuk merujuk pada cara atau pendekatan dalam menganalisis bahasa; dan, sebuah korpus adalah kumpulan teks tulis atau lisan dalam satu bahasa (biasanya dua bahasa) yang umumnya mewakili lebih dari satu juta kata (Brown, 2005).

Penghantaran bahasa Bali dari sistem tulis, kosakata, dan kosateks dalam bahasa Inggris diharapkan akan mampu membangun kesetaraan pada panggung kesejagatan, seperti bahasa-bahasa etnis (indigenous language) lain, bukanlah sebuah spekulasi atau angan-angan kosong. Usaha diranah ini adalah sebuah keniscayaan akademik yang bisa dipertanggung-jawabkan seiring adanya kemajuan dan dukungan tehnologi informasi dengan berkembangnya secara pesat perangkat lunak dan keras di bidang kebahasaan.

Kegiatan untuk output dan outcome

Untuk pengembangan pembentukan korpus kosakata yang telah dan tengah dikerjakan, bentuknya nyatanya adalah korpus kosakata dengan aran bahasa Bali yang diikuti dengan aksara Bali, dengan padan bahasa Indonesia dan bahasa Inggris. Usaha ini telah dimulai pada awal 1990. Kerja seterusnya dari awal korpus kosakata Bali ini dilaksanakan berlanjut pada 2002-2003 di Centre for Languages and Cultures of Asia and Africa, Tokyo University of Foreign Studies, Tokyo. Kerja lanjutan ini banyak dibantu dengan penggunaan perangkat lunak File Maker. Namun, hasil kerja ini, sebanyak hampir 1400 halaman ukuran kertas A4, untuk beberapa lama terhenti; dan, baru dikerjakan kembali pada akhir 2010 hingga akhir Maret 2011, atas dorongan Penerbit Dian Rakyat, Jakarta (Diharapkan penerbitannya dan pemasarannya pada Agustus/September 2011). Pengerjaan penyuntingan dan pemutakhiran berhasil memperbanyak halaman hingga 2400. Harapan outcome dari output kerja akademik di bidang kosakata hampir 20 tahun akan menghasilkan Kamus Bali-Indonesia-Inggris yang memadai bagi keperluan umum di dunia akademik dan pemenuhan kebutuhan kamus umum di masyarakat.

Selama masa perjalan proses penyusunan korpus kosakata ini berlangsung telah diterbitkan anakan beragam kamus sebagai outcome (Periksa daftar buku terbitan sendiri atau bekerjasama dengan penerbit

mapan pada halaman akhir).

Sejalan penyusunan korpus kosakata, dilaksanakan pula pengumpulan beragam ceritera rakyat Bali yang berasal dari manuskrip lontar di Perpustakaan Lontar Fakultas Sastra Unud, dan sumber koleksi lontar pribadi dan lembaga resmi lain. Penulisan ulang dengan memanfaatkan perangkat lunak Bali Simbar di komputer sebagai bagian kegiatan akhir mahasiswa S2 (Magister) dan S3 (Doktor) Linguistik Pascasarjana Unud, dengan padan bahasa Indonesia dan Inggris telah menjadi masukan bagi perluasan korpus kosateks bahasa Bali.

Sumber lain untuk kebutuhan perluasan kosakata dan teks adalah dengan dari beragam tulisan di ’Bali Orti’ yang menjadi suplemen Harian Bali Post yang diterbitkan setiap hari Minggu. Pemakaian beragam kosakata dan beraneka jenis teks sangat membantu penguatan usaha pembentukan korpus bahasa Bali yang tengah dilakukan. Dukungan diberikan secara lembaga dan pribadi yang disampaikan lewat dunia maya dan langsung telah pula membuktikan keniscayaan bahwa kegiatan akademik pembentukan korpus bahasa Bali ini memang mendapat simpati akademik dan dukungan nyata kalangan bukan akademik. Sudah barang tentu outcome berupa manuskrip dan buku yang ada di toko buku, perpustakaan lokal, nasional dan internasional, merupakan bukti nyata dari usaka akdemik perkuliahan dan penelitian yang telah menghasilkan output bagi kebutuhan akademik (bisa di periksa di jalur online catalogue perpustakaan universitas dan nasional di dunia) dan kebanggaan etnis Bali, baik sebagai warga biasa maupun warga kelompok widiawan.

Pengelompokan Korpus dan karya sebagai Output dan Outcome

Perjalanan pembentukan korpus (sekaligus harapan outcome-nya) yang disajikan di bawah ini, dipilah menjadi (1) kelompok kosakata [sebagai korpus dan outcome], (2) kelompok kosateks [sebagai korpus dan outcome], (3) kelompok pemikiran tentang bahasa, budaya, dan etnis Bali.

Kelompok 1

1. Kamus Bali-Indonesia-Inggris

2. Concise Balinese Dictionary

3. Practical Balinese-English – English-Balinese Dictionary

4. Kalimat Bahasa Bali-Indonesia-Inggris

Page 3: MEMBANGUN KORPUS KOSAKATA DAN TEKS BAHASA …lppm.unud.ac.id/wp-content/uploads/Korpus-Kosakata-dan-Teks-Baha… · jenis-jenis imbuhan yang berkolokasi dengan kosakata ... dan kosateks

The Excellence Research UNIVERSITAS UDAYANA 2011 20

5. Kamus Bali-Indonesia-Inggris

6. Kamus Indonesia-Bali-Inggris

7. Kamus Inggris-Indonesia-Bali

8. Kamus Indonesia-Bali – Bali-Indonesia

9. Kosakata Basa Bali: Alus-Lumrah – Lumrah-Alus

10. Kalimat Satua Bali

11. Kamus Pelajar Bali-Indonesia: Dasar-Menengah

12. Kamus Sinonim Bahasa Bali Bali-go Go Ishu (Kosakata Bahasa Bali) bersama Hara Mayuko

13. Kruna Aran (Nomina), Kruna Kria (Verba) Kruna Kahanan (Ajektiva) Bahasa Bali

Kelompok 2

1. Kaputusan Pramana ning taru

2. Gaguritan Amad Muhamad Denpasar: Lotus Widya Suari.

3. Popular Tales From Bali (2nd. ed.)

4. Gaguritan Siti Badariah (bersama Wayan Mekarini)

5. Tiga Satua Bali

6. Gaguritan Cilinaya

7. Tales from Bali

8. I Siap Badeng

9. Gaguritan Nengah Jimbaran

10. Pasalin Gaguritan Transmigrasi ka Lunyuk Pakaryan Jro Mangku Lunas

11. Kakawin Nitisastra

Kelompok 3

1. Perkamusan Indonesia: Permasalahan dan Bahasa Bali

2. Injil Lukas Nganggé Aksara Bali

3. Bunbunan Ragragan Bali (Kumpulan artikel berbahasa Bali di Bali Post)

4. Aksara dan Ragam Teks

5. Teks dan Rekayasa Teks

6. Tales from Bali

7. Notes on the Balinese Orthography and Grammar

8. Kebudayaan Masyarakat Transmigran Bali dan Pergeseran Peran Unda-Usuk Bahasa

9. Etos Kerja dan Kosakata Bali

10. Sekar Alit dari Lunyuk

11. Balinese Transmigrants in lampung: Language change and tradition

12. Karya Macapat dalam Pembangunan

13. Parigi: Latar belakang sejarah dan bahasa

14. Bahasa Bali dan Permasalahannya

15. Bahasa dan Transmigrasi: Kasus bahasa Bali dan penuturnya di daerah transmigrasi di Sulawesi’

16. Wanagiri: Recreating Bali on foreign soil” (Bersama Liv Elise Osthus) Ihwal pemukim Bali di Sumbawa

17. Language Change: The case of Balinese in the transmigration areas of Lampung, Sulawesi, Sumbawa dan Timor

18. Perkembangan Teori M.A.K. Halliday

19. Struktur Bahasa Komodo (Bersama Margono dan Putra Yadnya)

Penguatan kegiatan

1). TUFS 2002-2003 Tokyo University of Foreign Studies. 2) Academic Recharging Program (PAR) Dikti Nop. 2009- Jan. 2010 Osaka University. 3) Seminar di Department of Psychology, Norwegian University of Science and Technology, Trondheim, April-Juni 2010.

KESIMPULAN

Setiap kegiatan penelitian seyogyanya memiliki arah akhir menuju kepada penyampaian informasi tidak saja bagi kalangan seprofesi atau profesi terkait; tetapi juga sepatutnya mampu menjangkau pembaca luas dalam bentuk bacaan umum. Dalam hal ini, seorang peneliti pada tataran kelompok peneliti senior di perguruan tinggi wajib menjadi jembatan pemikir antar lembaga tempat dia bekerja dengan pembaca umum yang mendambakan informasi. Tentulah informasi yang disajikan akan sangat jauh berbeda dari sajian kepada sejawat profesi. Ke arah inilah hasil pemikiran dari kegiatan bekerja akademik (Apakah itu berupa diskusi dalam seminar atau penelitian) dikemudikan

Page 4: MEMBANGUN KORPUS KOSAKATA DAN TEKS BAHASA …lppm.unud.ac.id/wp-content/uploads/Korpus-Kosakata-dan-Teks-Baha… · jenis-jenis imbuhan yang berkolokasi dengan kosakata ... dan kosateks

The Excellence Research UNIVERSITAS UDAYANA 2011 21

oleh pengatur kebijakan lembaga agar tujuan kegiatan menjadi jelas dan pasti arahnya: arah menuju output dan, selanjutnya, outcome. Kejelasan ini, sudah pasti, akan mampu menghantar karya apakah ke ruang arsip kelembagaan yang mengurusi dokumentasi atau penyimpanan, atau ke pajangan layanan masyarakan luas yang berbentuk kios atau toko buku, ataukah perpustakaan umum di kelompok minat tertentu di banjar, desa, kecamatan, kabupaten, provinsi, atau bahkan nasional, regional, internasional.

Yang berikut, sebagai harapan seorang akademisi peneliti yang dituntut bekerja dan memiliki tuntutan global, kerja akademik bersistem berdasarkan korpus dalam bidang kebahasan untuk masa kini telah menjadi sebuah keharusan. Keharusan keniscayaan kekinian yang harus mampu menyetarakan dalam menjejaringkan bahasa-bahasa di Nusantara masuk dalam jaringan kerja serupa di kawasan ASEAN. Usaha ini direncanakan akan mampu membangun jejaring dasar-dasar perkamusan atau leksografi regional yang kini berpusat di Bangkok (Regional Centre for Computational Linguistics). Pertanyaannya: Siap dan mampukah kita menghadapi tantangan regional ini? Jawabnya tentu harus berupa jawaban pasti yang berbentuk keharusan dengan ikutan penyiapan kiat-kiat pemikiran dan penyiapan sarana penunjang memadai secara internasional. Hanya dengan berpikir, bersiap, dan bertindak serius, dalam lingkup kerja akademik yang jelas batas-batasnya [baca: leksikografi ], saya sangat berkeyakinan, kita mampu masuk ke jejaring tataran regional maupun global.

Sebagai penyudah, penulisan ulang ceritera rakyat atau folklor Bali sangat didorong oleh kerja bersistem korpus. Dengan sistem ini kita akan dengan cepat dan mudah bisa menelusuri tema-tema yang menjadi cermin perikehidupan etnis Bali. Dalam pendalaman secara global ihwal ceritera rakyat Nusantara, hampir tidak ada kisah-kisah kerakyatan dari kawasan ini masuk dalam seri ceritera rakyat dunia. Di samping itu, pengumpulan kisah-kisah tradisi akan sangat membantu perluasan korpus kosakata Bali. Dan, yang paling utama dari semua yang dicanangkan di sini adalah bahwa Universitas Udayana mewujudkan misi kepedulian atas budaya lokal Bali sebagai sebagai bagian pencanangan nyata atas kepeduliannya ke depan pada yang ada pada tataran ideal/kebijakan. Kebijakan ke depan yang menjadikan kebudayaan sebagai acuan Pola Ilmiah Pokok (PIP) pengembangan widia, sains, dan tehnologi dalam menggali, mempelajari, memahami, dan mengembangkannya di berbagai program kajian dan studi.

DAFTAR PUSTAKA

Atkin, B.T. Sue dan M. Rundell. 2008. The Oxford Guide to Practical Lexicography Oxford: Oxford University Press.

Brown K. (Ed.) 2005. Encyclopedia of Language and Linguistics – 2nd Edition. Oxford: Elsevier.

Bunanta, M. 1998. Problematika Penulisan Cerita Rakyat untuk Anak di Indonesia. Jakarta: Balai Pustaka.

Danandjaja, J. 2002. Folklor Indonesia: Ilmu gossip, dongeng dan lain-lain. Jakarta: Grafi ti.

Jackson, H. 2002. Lexicography: An Introduction. London: Routledge.

Landau, S. 2000. Dictionaries: The Art and Craft of Lexicography. Cambridge: Cambridge University Press.

Anonimous. 2003 Rintisan dalam Kajian Leksikologi dan Leksikografi . Fakultas Ilmu Pengetahuan Budaya Universitas Indonesia bekerjasama dengan Dewan Bahasa dan Pustaka Malaysia, Sanggar Kerja tentang Leksikologi Depok, 16-17 Desember 2002

Lechner, Judith V. 2004. Anthology of Traditional Literature. Boston: Pearson.

Ramanujan, A.K. 1998. Folktales from India. New Delhi. Viking.

Tyler, Royal. 1987, Japanese Tales. New York. Pantheon Books.