8
Hakcipta Terpelihara © 2000 - Perpustakaan Negara Malaysia Hakcipta Terpelihara © 2000 - Perpustakaan Negara Malaysia PENTINGNYA PENGUASAAN BAHASA DALAM PENCARIAN MAKLUMAT Oleh Ding Choong Ming. Ph.D* Abstract The paper discusses the importance of having a good language command tor any information search to succeed. This then relates to recall and precision in a given information system. 1 ________________ _ Di sini ternyata bahawa Penguasaan bahasa adalah juga faktor yang penting dalam menentukan ketepatan maklumat. Pentingnya faktor Penguasaan bahasa di sini juga disebabkan keberkaitan maklumat yang dicari itu bergantung pada aspek linguistik, perkataan dan istilah yang digunakan dalarn pengindeksan dan pencarian, selain bahasa memang menjadi penghubungan (links) yang enting di antara sistem maklumat di satu pihak, dan juga pencari maklumat yang berkenaan di satu pihak yang lain. P encarian maklumat dengan tepat bergantung pada banyak faktor, termasuk pengindeksan maklumat itu dan juga istilah yang digunakan yang selanjutnya akan menentukan pemadanan sepenuhnya atau separu daripadanya. Sehingga kini belum lagi ada teori keberkaitan (theory of relevance) yang menerangkan keberkesanan pencarian. Namun demikian, mengukur keberkaitan dalarn sains pencarian maklumat arnat berbeza daripada sains fizikal. Sekiranya K:ita Doleh mengukur kuantiti objek itu dengan menggunakan skala. dan juga kerja itu senang kerana kita boleh menim15ang. mencampur Seb lum perbincangan ini, perlu diterangkan atau menolak angka yang didapati; tetapi, tidaklah demikian bahawa pencarian maklumat adalah akitiviti yang kita halnya dalarn pencarian maklumat. 81eh kerana keberkai ..... tan --- 1 a:KiiKan dalarn usaha cuba mendapatkan teks yang sesuai satu-satu teks itu bergantung pada pertimbangan dan dan yang berkaitan. Berjaya tidaknya usaha itu bergantung takfsiran individu, ia bukan sahaja arnat subjektif, malahan pada banyak faktor, selain keberkaitan teks itu merupakan kelihatan seolah-olah dibuat-buat. Oleh itu, sehingga kini, pertimbangan yang subjektif, kerana hanya boleh pertimbangan tentang apa yang dianggap yang 1:5erkaitan ditentukan oleh orang yang memerlukan teks itu. atau tidak teks yang sudah dicari itu dengan kehendak Sehubungan itu, amatlah sukar untuk pustakawan, individu masih merupakan perkara yang arnat subjektif misalnya, memberi penilaian sarna ada maklumat yang sifatnya. Misalnya, maklumat yang sarna boleh dianggap mereka to long carikan itu sesuai atau tidak kepada 'amal sesuai/berkaitan', 'sesuai/berkaitan', 'sedikit penggunanya. Persoalan inijuga sering mengganggu kita berkaitan', 'tidak sesuai/berkaitan', 'berguna tetapi tidak sebagai pencari dan pengguna maklumat yang sudah sesuai* dan sebagainya pada orang yang sarna tetapi pada semakin banyak diberi galakan membuat pencarian masa yang berlainan, ataupun pada orang yang berlainan maklumat itu sendiri, rnemandangkan sistem maklumat pada masa yang sarna. Kesemua pertimbangan itu tertakluk berkomputer kini sudah semakin rumah pengguna, dan kepada kehendak individu yang berbeza-beza, selain ada juga mudah didapati. Masalah di sini ialah walaupun banyak lapisan makna di sebalik konsep pemangilan semula perkembangan IT, khususnya komputer dan rangkaian dan ketepatan (recall and precision) yang akan telekomunikasi, sudah membaiki kaedah pencarian dibincangkan nanti. Antara pertimbangan itu ialah sarna maklumat di perpustakaan, pangkalan data CD-ROM, ada kit a mahu maklumat yang terperinci atau tidak. sistem maklumat atas tali an, kiosk maklumat dan juga Kehendak maklumat pelajar tadika tentang kucing, Internet, narnun proses komunikasi maklumat "dari sumber misalnya, tentunya berbeza daripada pelajar Universiti, ke Sasaran" dan masalah asas pencarian maklumat masih apatah lagi doktor haiwan. Keperluan pakar Sejarah pula tidak berubah. Yang telah banyak berubah dan yang tentunya berbeza lagi dengan pakar di bidang yang lain. diperbaiki ialah alat dan kemudahannya, iaitu daripada F aktor lain yang penting dalarn konteks ini ialah bahasa aspek mekanikal dan teknikal, tetapi bukannya masalah pengantar maklumat itu. Orang yang tidak tahu bahasa Arab daripada aspek intelek. Sekiranya masalah teknikal dan mungkin mendapati maklumat dalam bahasa itu tidak mekanikal itu mudah diatasi, kerana boleh diurus atenden berkaitan, walaupun teks itulah yang paling berwibawa. dan juru teknik setelah diberi latihan intensif dan -f. Pensyarah Fakulti Teknologi & Sains Maklumat. Universiti Kebangsaan Malaysia

PENTINGNY A PENGUASAAN BAHASA DALAM …myrepositori.pnm.gov.my/bitstream/123456789/1756/1/Sekitar_2000_30... · atau menolak angka yang didapati; ... which will not be the same as

  • Upload
    dangnhu

  • View
    218

  • Download
    0

Embed Size (px)

Citation preview

Hakcipta Terpelihara © 2000 - Perpustakaan Negara Malaysia

Hakcipta Terpelihara © 2000 - Perpustakaan Negara Malaysia

PENTINGNY A PENGUASAAN BAHASA DALAM PENCARIAN MAKLUMAT

Oleh Ding Choong Ming. Ph.D*

Abstract

The paper discusses the importance of having a good language command tor any information search to succeed. This then relates to recall and precision in a given information system. 1 ________________ _

Di sini ternyata bahawa Penguasaan bahasa adalah juga faktor yang penting dalam menentukan ketepatan maklumat. Pentingnya faktor Penguasaan bahasa di sini juga disebabkan keberkaitan maklumat yang dicari itu bergantung pada aspek linguistik, perkataan dan istilah yang digunakan dalarn pengindeksan dan pencarian, selain bahasa memang menjadi penghubungan (links) yang

enting di antara sistem maklumat di satu pihak, dan juga pencari maklumat yang berkenaan di satu pihak yang lain.

P encarian maklumat dengan tepat bergantung pada banyak faktor, termasuk pengindeksan maklumat itu

dan juga istilah yang digunakan yang selanjutnya akan menentukan pemadanan sepenuhnya atau separu daripadanya. Sehingga kini belum lagi ada teori keberkaitan (theory of relevance) yang menerangkan keberkesanan pencarian. Namun demikian, mengukur keberkaitan dalarn sains pencarian maklumat arnat berbeza daripada sains fizikal. Sekiranya K:ita Doleh mengukur kuantiti objek itu dengan menggunakan skala. dan juga kerja itu senang kerana kita boleh menim15ang. mencampur Seb lum m~lanjutkan perbincangan ini, perlu diterangkan atau menolak angka yang didapati; tetapi, tidaklah demikian bahawa pencarian maklumat adalah akitiviti yang kita halnya dalarn pencarian maklumat. 81eh kerana keberkai ..... tan---1a:KiiKan dalarn usaha cuba mendapatkan teks yang sesuai satu-satu teks itu bergantung pada pertimbangan dan dan yang berkaitan. Berjaya tidaknya usaha itu bergantung takfsiran individu, ia bukan sahaja arnat subjektif, malahan pada banyak faktor, selain keberkaitan teks itu merupakan kelihatan seolah-olah dibuat-buat. Oleh itu, sehingga kini, pertimbangan yang subjektif, kerana hanya boleh pertimbangan tentang apa yang dianggap yang 1:5erkaitan ditentukan oleh orang yang memerlukan teks itu. atau tidak teks yang sudah dicari itu dengan kehendak Sehubungan itu, amatlah sukar untuk pustakawan, individu masih merupakan perkara yang arnat subjektif misalnya, memberi penilaian sarna ada maklumat yang sifatnya. Misalnya, maklumat yang sarna boleh dianggap mereka to long carikan itu sesuai atau tidak kepada 'amal sesuai/berkaitan', 'sesuai/berkaitan', 'sedikit penggunanya. Persoalan inijuga sering mengganggu kita berkaitan', 'tidak sesuai/berkaitan', 'berguna tetapi tidak sebagai pencari dan pengguna maklumat yang sudah sesuai* dan sebagainya pada orang yang sarna tetapi pada semakin banyak diberi galakan membuat pencarian masa yang berlainan, ataupun pada orang yang berlainan maklumat itu sendiri, rnemandangkan sistem maklumat pada masa yang sarna. Kesemua pertimbangan itu tertakluk berkomputer kini sudah semakin rumah pengguna, dan kepada kehendak individu yang berbeza-beza, selain ada juga mudah didapati. Masalah di sini ialah walaupun banyak lapisan makna di sebalik konsep pemangilan semula perkembangan IT, khususnya komputer dan rangkaian dan ketepatan (recall and precision) yang akan telekomunikasi, sudah membaiki kaedah pencarian dibincangkan nanti. Antara pertimbangan itu ialah sarna maklumat di perpustakaan, pangkalan data CD-ROM, ada kit a mahu maklumat yang terperinci atau tidak. sistem maklumat atas tali an, kiosk maklumat dan juga Kehendak maklumat pelajar tadika tentang kucing, Internet, narnun proses komunikasi maklumat "dari sumber misalnya, tentunya berbeza daripada pelajar Universiti, ke Sasaran" dan masalah asas pencarian maklumat masih apatah lagi doktor haiwan. Keperluan pakar Sejarah pula tidak berubah. Yang telah banyak berubah dan yang tentunya berbeza lagi dengan pakar di bidang yang lain. diperbaiki ialah alat dan kemudahannya, iaitu daripada F aktor lain yang penting dalarn konteks ini ialah bahasa aspek mekanikal dan teknikal, tetapi bukannya masalah pengantar maklumat itu. Orang yang tidak tahu bahasa Arab daripada aspek intelek. Sekiranya masalah teknikal dan mungkin mendapati maklumat dalam bahasa itu tidak mekanikal itu mudah diatasi, kerana boleh diurus atenden berkaitan, walaupun teks itulah yang paling berwibawa. dan juru teknik setelah diberi latihan intensif dan

-f. Pensyarah Fakulti Teknologi & Sains Maklumat. Universiti Kebangsaan Malaysia

komprehensif, tetapi masalah intelek amat rumit, kerana ia melibatkan pengalaman, kreativiti dan kebolehan individu mencari, lebih-lebih lagi penguasaan bahasanya.

Ukuran tentang berkaitan teks dalam sains maklumat sudah lama dikaji daripada dua sudut: pemanggilan semula dan ketepatan. Secara umum konsep pemanggilan semula diertikan sebagai teks yang dianggap yang sesuai dan yang berkaitan yang dapat dicari, Sementara itu konsep ketepatan pula diertikan sebagai teks yang dicari itu didapati tepat dan sesuai dengan kehendak. Selayang pandang, defmisi kedua-dua konsep yang dianggap bersifat perduaan (binary) itu masih didapati terlalu umum, kerana banyak masalah, seperti kesan sampingan (fall-out) yang tidak dijangkakan (unexpected) tidak disentuh. Lahirnya masalah itu adalah akibat perbezaan antara hasil pencarian individu dengan individu yang lain, mungkin disebabkan satu atau beberapa faktur seperti yang berikut:

1. Perbezaan antara individu yang pakar dengan yang baru,

2. Perbezaan antara teori dengan amali,

3. Perbezaan antara kualiti dengan kuantiti maklumat yang dijumpai,

4. Perbezaan kaedah kajian yang digunakan sama ada yang berupa tinjauan atau kes,

5. Perbezaan antara persepsi dengan kehendak.

6. Perbezaan antara istilah yang berlainan yang digunakan.

7. Perbezaan antara pemahaman individu yang berlainan tentang konsep yang digunakan.

8. Perbezaan antara perkataan biasa yang digunakan dengan makna saintifik dan teknikal,

9. Perbezaan makna perkataan dalam konteks,

10. Perkataan yang sama digunakan dengan makna yang berlainan.

11. Perkataan yang berlainan tetapi mempunym makna yang sama, dan

12. Hiraki konsep tidak tercermin dalam hiraki istilah yang digunakan.

Daripada beberapa masalah yang disenaraikan itu, ternyata bahasa adalah faktor yang besar pengaruhnya dalam menentukan kadar atau nisbah pemanggilan semula dan ketepatan maklumat yang dicari. Walaupun kesemua faktur itu kelihatan berbeza-beza, tetapi saling kait-mengait dan saling mempengaruhi satu dengan yang lain. Bertitik tolak daripada hujaIi itulah juga, maka sayugia dinyatakan sekali lagi bahawa mencari maklumat yang betul-betul sesuai bukanlah perkara yang mudah. Masalah telah menjadi

semakin besar kini berikutan semakin banyak maklumat boleh didapati, terutamanya di Internet, tetapi sedikit sahaja daripadanya yang dikehendaki kita setiap masa. Antara maklumat yang didapati sesuai itu, berapa banyak pula yang dianggap paling sesuai berbanding dengan yang cuma sedikit yang sesuai? Walaupun pencarian maklumat sudah menjadi lebih fleksibel, sekurang-kurangnya dalam erti kata kita sudah boleh menggunakan kata tunggal dan kata kunci bahasa tabii dan menggabungkan kata itu dengan operator Boolean, tetapi pemadanan sempurna (perfect matching) yang diidam-idamkan itu jarang tercapai, sejak sistem maklumat berkomputer diperkenalkan pada 1980an. Masalah itu juga disebabkan pencarian maklumat sudah berkembang menjadi bidang kajian yang mencakupi pelbagai disiplin. Kesemua disiplin itu, termasuk logik, falsafah, linguistik, sains komputer dan sains maklumat itu didapati lengkap-melengkapkan. Tidak kira apa juga disiplinnya, perkara yang perlu diberi perhatian utama dalam mendapat pemadanan sempurnaan itu ialah term association. Di sinilah juga terletak salah satu punca kegagalan usaha pencarian maklumat, terutamanya di kalangan pengguna yang bam. Namun demikian, justifikasi kita menggunakan komputer adalah juga disebabkan teknologi itu didapati boleh mencari, memadankan dan menyamakan banyak sekali term association dengan cepat. Oleh sebab ada banyak keterbatasan komputer dalam berbuat demikian, kita sendiri perlu memainkan peranan besar tidak sahaja dalam mengenalpasti tentang subjek, dan mengubah strategi pencarian dari masa ke mas a, berpandukan maklum balas yang diterima daripada sistem walaupun setiap sistem itu menjanjikan akan mengoptimumkan pemadanan kehendak pengarang dengan pembaca. Hanya dengan berbuat demikian bamlah kita boleh mengharapkan sistem itu akan menolong kita mencari term association, untuk selanjutnya memberi sebanyak mungkin maklumat yang tepat setiap kali kita mencari maklumat di satu-satu subjek dan juga pada satu-satu masa. Masalah lain di sini ialah kaedah pencarian itu lebih popular untuk teks di bidang sains dan teknologi berbanding dengan bidang sains sosial, apatah lagi karya penulisan Sastera kreatif Di antara sebab yang umum disebutkan ialah istilah bidang sains dan teknologi itu bukan sahaja jelas maknanya, tetapi juga defmisinya memang boleh digunakan secara lang sung dalam mengindeks, kerana sudah mempunyai nilai dan sifat self-indexing. Disebaliknya. lainlah halnya dalam teks kreatif Kita mendapati sukar menyatakan permintaan dengan tepat dan j elas di bidang sains sosial, bukan sahaja kerana masalah dan sifat bahasa yang digunakan, tetapi juga sistem maklumat yang digunakan itu tidak membolehkan kita berbuat demikian. Masalah itu berlipat ganda kerana pengarang kreatif, terutamanya biasanya mempunyai banyak mesej ingin disampaikan dengan perkataan, lebih-lebih lagi penafsiran mereka, menurut rangka pengertian mereka sendiri, selain

Hakcipta Terpelihara © 2000 - Perpustakaan Negara Malaysia

Hakcipta Terpelihara © 2000 - Perpustakaan Negara Malaysia

komprehensif, tetapi masalah intelek amat rumit, kerana ia melibatkan pengalaman, kreativiti dan kebolehan individu mencari, lebih-lebih lagi penguasaan bahasanya.

semakin besar kini berikutan semakin banyak maklumat boleh didapati, terutamanya di Internet, tetapi sedikit sahaja daripadanya yang dikehendaki kita setiap masa. Antara maklumat yang didapati sesuai itu, berapa banyak pula yang

Ukuran tentang berkaitan teks dalam sains maklumat sudah dianggap paling sesuai berbanding dengan yang cuma lama dikaji daripada dua sudut: pemanggilan semula dan sedikit yang sesuai? Walaupun pencarian maklumat sudah ketepatan. Secara umum konsep pemanggilan semula menjadi lebih fleksibel, sekurang-kurangnya dalam erti kata diertikan sebagai teks yang dianggap yang sesuai dan yang kita sudah boleh menggunakan kata tunggal dan kata kunci berkaitan yang dapat dicari, Sementara itu konsep ketepatan bahasa tabii dan menggabungkan kata itu dengan operator pula diertikan sebagai teks yang dicari itu didapati tepat Boolean, tetapi pemadanan sempurna (perfect matching) dan sesuai dengan kehendak. Selayang pandang, defmisi yang diidam-idamkan itu jarang tercapai, sejak sistem kedua-dua konsep yang dianggap bersifat perduaan maklumat berkomputer diperkenalkan pada 1980an. (binary) itu masih didapati terlalu umum, kerana banyak Masalah itu juga disebabkan pencarian maklumat sudah masalah, seperti kesan sampingan (fall-out) yang tidak berkembang menjadi bidang kajian yang mencakupi dijangkakan (unexpected) tidak disentuh. Lahimya masalah pelbagai disiplin. Kesemua disiplin itu, termasuk logik, itu adalah akibat perbezaan antara hasil pencarian individu falsafah, linguistik, sains komputer dan sains maklumat itu dengan individu yang lain, mungkin disebabkan satu atau didapati lengkap-melengkapkan. Tidak kira apa juga beberapa faktur seperti yang berikut: disiplinnya, perkara yang perlu diberi perhatian utama

1. Perbezaan antara individu yang pakar dengan dalam mendapat pemadanan sempurnaan itu ialah term association. Di sinilah juga terletak salah satu punca yang baru, kegagalan usaha pencarian maklumat, terutamanya di

2. Perbezaan antara teori dengan amali, kalangan pengguna yang bam. Namun demikian, justifikasi

3. Perbezaan antara kualiti dengan kuantiti kita menggunakan komputer adalah juga disebabkan teknologi itu aiaapati boleh mencari, memadankan dan maklumat yang dijumpai, menyamakan banyak sekali term association dengan cepat.

4. Perbezaan kaedah kajian yang digunakan sama Oleh sebab ada banyak keterbatasan komputer dalam ada yang berupa tinjauan atau kes, berbuat demikian, kita sendiri perlu memainkan peranan

besar tidak sahaja dalam mengenalpasti tentang subjek, 5. Perbezaan antara persepsi dengan kehendak.

~~'---Qan mengu15ah strategi pencarian dari masa ke 6. Perbezaan antara istilah yang berlainan yang mas a, berpandukan maklum balas yang diterima daripada

digunakan. sistem walaupun setiap sistem itu menjanjikan akan mengoptimumkan pemadanan kehendak pengarang dengan

7. Perbezaan antara pemahaman individu yang pembaca. Hanya dengan berbuat demikian bamlah kita

berlainan tentang konsep yang digunakan. boleh mengharapkan sistem itu akan menolong kita mencari

8. Perbezaan antara perkataan biasa yang term association, untuk selanjutnya memberi sebanyak digunakan dengan makna saintifik dan teknikal, mungkin maklumat yang tepat setiap kali kita mencari

maklumat di satu-satu subjek dan juga pada satu-satu masa. 9. Perbezaan makna perkataan dalam konteks, Masalah lain di sini ialah kaedah pencarian itu lebih popular

10. Perkataan yang sama digunakan dengan makna untuk teks di bidang sains dan teknologi berbanding dengan yang berlainan. bidang sains sosial, apatah lagi karya penulisan Sastera

kreatif Di antara sebab yang umum disebutkan ialah 11. Perkataan yang berlainan tetapi mempunym istilah bidang sains dan teknologi itu bukan sahaja jelas

makna yang sama, dan maknanya, tetapi juga defmisinya memang boleh digunakan

12. Hiraki konsep tidak tercermin dalam hiraki istilah secara lang sung dalam mengindeks, kerana sudah yang digunakan. mempunyai nilai dan sifat self-indexing. Disebaliknya.

Daripada beberapa masalah yang disenaraikan itu, ternyata bahasa adalah faktor yang besar pengaruhnya dalam menentukan kadar atau nisbah pemanggilan semula dan ketepatan maklumat yang dicari. Walaupun kesemua faktur itu kelihatan berbeza-beza, tetapi saling kait-mengait dan saling mempengaruhi satu dengan yang lain. Bertitik tolak daripada hujaIi itulah juga, maka sayugia dinyatakan sekali lagi bahawa mencari maklumat yang betul-betul sesuai bukanlah perkara yang mudah. Masalah telah menjadi

lainlah halnya dalam teks kreatif Kita mendapati sukar menyatakan permintaan dengan tepat dan j elas di bidang sains sosial, bukan sahaja kerana masalah dan sifat bahasa yang digunakan, tetapi juga sistem maklumat yang digunakan itu tidak membolehkan kita berbuat demikian. Masalah itu berlipat ganda kerana pengarang kreatif, terutamanya biasanya mempunyai banyak mesej ingin disampaikan dengan perkataan, lebih-lebih lagi penafsiran mereka, menurut rangka pengertian mereka sendiri, selain

menggunakan kata-kata dan lenggok bahasa yang mereka gemari. Demikian menurut Foskett (1996:9):

''Authors write within their own frame of reference, which will not be the same as that of the readers. We have to try to optimize the results of any search, while accepting that we can no longer characterize the results as right or wrong. "

Setelah diteliti masalah besar di Slill bukan sahaja disebabkan setiap orang mempunyai rangka pemahamannya sendiri, tetapi juga memang tidak ada lagi standard yang boleh dipegang untuk membolehkan kita menyatakan subjek dengan tepat dan jelas. Oleh itu, amatlah sukar adanya pemadanan sempurna (peifect match) yang diidam-idamkan dalam bidang sains sosial dan penulisan karya Sastera kreatif

Strategi yang biasa digunakan untuk mencari lebih banyak maklumat di mana-mana sistem maklumat ialah kit a dinasihatkan memperluaskan skop pencarian dengan menambah kata-kata yang berkaitan, terutamanya daripada segi makna. Akan tetapi, dilema di sini ialah semakin diperluaskan skop pencarian itu, semakin banyak maklumat yang dicari itu mungkin didapati tidak sesuai. Misalnya, untuk mencari maklumat tentang kucing, kita mungkin perlu menggunakan perkataan lain yang ada kaitan dengannya, termasuk. Feline, Kitten, Moggy, Pussy. Tabby, Tom, Tomcat, Demikian juga untuk mencari maklumat tentang dance sebagai kata nama, perkataan lain yang ada kaitan dengannya dan yang mungkin boleh digunakan ialah Ball, Barn-dance, Ceillidh, Disco, Discotheque, Hop, Knees-up, Party. Senarai ini tidak termasuk jenis tarian, sepertiAerobics, Ballet, Ball-room dancing, Bolero, Break dancing, Cancan. Conga, Country dancing, Disco dancing, Fandago, Flamenco dancing, FHng, Folk dancing, Foxtrot, Gavotte, Horn-pipe, Jig, Latin-American dancing, Limbo dancing, Mazurka, Minuet, Morris dancing, Old time dancing, Polka, Pollonaise, Quadrille, Quickstep, Reel, Rumba, Square dance, Tap dancing Tango, Waltz dan sebagainya. Senarai panjang itu belum lagi diperkirakan kata seperti loget, Rumba, Tandak, Tari dalam bahasa Melayu dan yang lain-lain dalam bahasa yang lain. Selanjutnya untuk mencari maklumat dance sebagai kata kerja, mungkin perlu digunakan perkataan seperti Caper, Cavort, Frisk, Frolic, Gambol, Hop about, Jigabout, Jive, Jump about, Leap, Preance, Rock, Skip Whirl dan sebagainya.

Setakat ini banyak persoalan telah dibangkitkan. Isu penting di sini ialah selain berapa banyak maklumat yang sesuai yang dikehendaki adalah novelty ratio di antara dokumen yang lama dengan yang bam. Isu ini ditimbulkan kerana dokumen yang didapati untuk kali yang kedua itu walaupun masih berkaitan dengan kehendak, tetapi nilainya sudah berubah, iaitu menurun. Perubahan nilai itu mungkin disebabkan kerana maklumat yang terdapat dalam teks

itu telah mengubah, lantas mempengaruhi tanggapan kita tentang apa yang dianggap bersesuaian atau tidak, selain faktor bahawa penilaian yang diberi setiap kali itu berbeza-beza, maka seolah-olah dibuat-buat seperti yang disebut tadi. Perkembangan itu disebut sebagai pertinence dan utility, dua faktor lain yang memberi kepuasan daripada segi pemanggilan semula dan ketepatan. Selain permintaan yang sama "mahukan kucing Parsi" daripada dua orang biasanya bermakna maklumat yang berbeza dikehendaki mereka. Inilah juga satu lagi sebab dikatakan individu yang sama mungkin membuat keputusan yang berbeza-beza tentang maklumat yang berkaitan pada mas a yang berbeza-beza. Inilah juga sebab dikatakan pertimbangan tentang keberkaitan maklumat itu amat subjektif

Proses pemecahan (fission) dan kemudian proses penggabungan {fuss ion) yang kita alami dalam perkembangan ilmu pengetahuan manusia sejak dahulu itu sudahjuga mencetuskan masalah bam dalam komunikasi, lantaran pencarian maklumat. Sehubungan itu, Foskett (1996:5) mengatakan:

"The more remote new knowledge is from individuals' existing range of knowledge, the more difficult it becomes for them to comprehend, and incorporate it into their own store of knowledge ... Requests for data are deterministic and require no logical decisions on the part of the enquirer: the answer supplied is either right or wrong. On the other hand, request for information arc probabilistic; and may involve a series of logical decisions on the part of the enquirer; ... its usefulness is a mailer of judgment on the part of the enquirer."

Dalam proses pemecahan itu, disiplin yang baru berkembang daripada disiplin yang lama. Misalnya, sains adalah fragmen yang berkembang daripada falsafah. Demikian juga dengan fizik yang boleh disusur galurkan sebagai yang berkembang daripada sains, elektrik daripada fizik dan eletronik daripada elektrik. Isu pokok di sini ialah disiplin atau subjek yang bam yang berupa pecahan / fragmen daripada yang lama itu masih berkaitan, maIm dianggap serumpun, lantaran berbeza dan terpisah dengan disiplin yang tidak berkaitan dan yang dianggap sebagai yang bam. Isu yang ingin ditonjolkan di sini ialah masaalah pencarian maklumat pada era yang berorientasikan disiplin itu lain daripada yang dihadapi di era yang berorientasikan misi yang lahir berikutan proses pelakuran (fusion) ilmu Selepas Perang Dunia II, era yang disebut juga sebagai era yang berorientasikan masalah. Misalnya, munculnya disiplin kejuruteraan genetik, yang berupa penggabungan fizik dan biologi, dua disiplin yang dahulunya dianggap berasingan. Setelah memasuki era yang berorientasikan misi di era maklumat ini, kehendak kita terhadap maklumat dikehendaki meliputi banyak disiplin. Menyedari jumlah

Hakcipta Terpelihara © 2000 - Perpustakaan Negara Malaysia

Hakcipta Terpelihara © 2000 - Perpustakaan Negara Malaysia

menggunakan kata-kata dan lenggok bahasa yang mereka gemari. Demikian menurut Foskett (1996:9):

''Authors write within their own frame of reference, which will not be the same as that of the readers. We have to try to optimize the results of any search, while accepting that we can no longer characterize the results as right or wrong. "

Setelah diteliti masalah besar di Slill bukan sahaja disebabkan setiap orang mempunyai rangka pemahamannya sendiri, tetapi juga memang tidak ada lagi standard yang boleh dipegang untuk membolehkan kita menyatakan subjek dengan tepat dan jelas. Oleh itu, amatlah sukar adanya pemadanan sempurna (peifect match) yang diidam-idamkan dalam bidang sains sosial dan penulisan karya Sastera kreatif

itu telah mengubah, lantas mempengaruhi tanggapan kita tentang apa yang dianggap bersesuaian atau tidak, selain faktor bahawa penilaian yang diberi setiap kali itu berbeza-beza, maka seolah-olah dibuat-buat seperti yang disebut tadi. Perkembangan itu disebut sebagai pertinence dan utility, dua faktor lain yang memberi kepuasan daripada segi pemanggilan semula dan ketepatan. Selain permintaan yang sama "mahukan kucing Parsi" daripada dua orang biasanya bermakna maklumat yang berbeza dikehendaki mereka. Inilah juga satu lagi sebab dikatakan individu yang sama mungkin membuat keputusan yang berbeza-beza tentang maklumat yang berkaitan pada mas a yang berbeza-beza. Inilah juga sebab dikatakan pertimbangan tentang keberkaitan maklumat itu amat subjektif

Strategi yang biasa digunakan untuk mencari lebih banyak Proses pemecahan (fission) dan kemudian proses maklumat di mana-mana sistem maklumat ialah kit a penggabungan {fuss ion) yang kita alami dalam dinasihatkan memperluaskan skop pencarian dengan perkembangan ilmu pengetahuan manusia sejak dahulu itu menambah kata-kata yang berkaitan, terutamanya daripada sudah juga mencetuskan masalah bam dalam komunikasi, segi makna. Akan tetapi, dilema di sini ialah semakin lantaran pencarian maklumat. Sehubungan itu, Foskett diperluaskan skop pencarian itu, semakin banyak maldumat (1996:5) mengatakan: yang dicari itu mungkin didapati tid.ak-sesuai. Misalnya, "The more remote new knowledge is from untuk mencari maklumat tentang ucing, K:ita mungkin~-----i-nd-l-'v-id-u~als' existing range of knowledge, the more perlu menggunakan perkataan lain :y:ang aaaaltan diffiGult it becomesfor them to comprehend, and dengannya, termasuk. Feline, Kitten, Moggy, Pussy. Tabby, incorporate it into their own store of knowledge ... Tom, Tomcat, Demikian juga untuk mencari maklumat Re uestsfor data are deterministic and require no tentang dance sebagai kata nama, perkataan lain yang ada logical decisions on the part of the enquirer: the kaitan dengannya dan yang mungkin boleh digunakan ialah answer supplied is either right or wrong. On the Ball, Barn-dance, Ceillidh, Disco, Discotheque, Hop, otner nand, request for information arc

probabilistic; and may involve a series of logical Knees-up, Party. Senarai ini tidak termasuk jenis tarian,

decisions on the part of the enquirer; ... its sepertiAerobics, Ballet, Ball-room dancing, Bolero, Break usefulnescs is a mailer of judgment on the part of dancing, Cancan. Conga, Country dancing, Disco dancing the enquirer." Fandago, Flamenco dancing, FHng, Folk dancing, Foxtrot, Gavotte, Horn-pipe, Jig, Latin-American dancing, Limbo dancing, Mazurka, Minuet, Morris dancing, Old time dancing, Polka, Pollonaise, Quadrille, Quickstep, Reel, Rumba, Square dance, Tap dancing Tango, Waltz dan sebagainya. Senarai panjang itu belum lagi diperkirakan kata seperti loget, Rumba, Tandak, Tari dalam bahasa Melayu dan yang lain-lain dalam bahasa yang lain. Selanjutnya untuk mencari maklumat dance sebagai kata kerja, mungkin perlu digunakan perkataan seperti Caper, Cavort, Frisk, Frolic, Gambol, Hop about, Jigabout, Jive, Jump about, Leap, Preance, Rock, Skip Whirl dan sebagainya.

Setakat ini banyak persoalan telah dibangkitkan. Isu penting di sini ialah selain berapa banyak maklumat yang sesuai yang dikehendaki adalah novelty ratio di antara dokumen yang lama dengan yang bam. Isu ini ditimbulkan kerana dokumen yang didapati untuk kali yang kedua itu walaupun masih berkaitan dengan kehendak, tetapi nilainya sudah berubah, iaitu menurun. Perubahan nilai itu mungkin disebabkan kerana maklumat yang terdapat dalam teks

Dalam proses pemecahan itu, disiplin yang baru berkembang daripada disiplin yang lama. Misalnya, sains adalah fragmen yang berkembang daripada falsafah. Demikian juga dengan fizik yang boleh disusur galurkan sebagai yang berkembang daripada sains, elektrik daripada fizik dan eletronik daripada elektrik. Isu pokok di sini ialah disiplin atau subjek yang bam yang berupa pecahan / fragmen daripada yang lama itu masih berkaitan, maIm dianggap serumpun, lantaran berbeza dan terpisah dengan disiplin yang tidak berkaitan dan yang dianggap sebagai yang bam. Isu yang ingin ditonjolkan di sini ialah masaalah pencarian maklumat pada era yang berorientasikan disiplin itu lain daripada yang dihadapi di era yang berorientasikan misi yang lahir berikutan proses pelakuran (fusion) ilmu Selepas Perang Dunia II, era yang disebut juga sebagai era yang berorientasikan masalah. Misalnya, munculnya disiplin kejuruteraan genetik, yang berupa penggabungan fizik dan biologi, dua disiplin yang dahulunya dianggap berasingan. Setelah memasuki era yang berorientasikan misi di era maklumat ini, kehendak kita terhadap maklumat dikehendaki meliputi banyak disiplin. Menyedari jumlah

maklumat yang disebarkan kini sudah tidak mampu dikuasai individu, kita amat perlu membesarkan tabung ilmu pengetahuan sejajar dengan perkembangan ilmu dan teknologi. Sejak terciptanya alat cetak pada kurun yang ke 15 hingga era komputer pada abad yang ke 20, pengetahuan dunia sudah mengalami revolusi besar daripada kedua-dua proses tadi. Kini, tidak kurang daripada 1.5 hingga 2 juta artikel barn di bidang sains dan teknologi diterbitkan dan dindeks setiap tah un. Di United Kingdom sahaja, sebanyak 50.000 buah buku barn diterbitkan setiap tahun. Walaupun cuma sebahagian, barangkali 30% - 50% daripada bahan barn itu diperolehi perpustakaan dan dikongsi perpustakaan di bawah skima pinjaman antara perpustakaan, dan hanya kira-kira 10% bahan itu diperolehi pembaca individu., tetapi kita sudah tenggelam dalam lautan maklumat yang berhempas pulas di hujung dunia penerbitan dan sistem rangkaian maklumat. Oleh itu, untuk mencari maklumat tentang perubatan angkasa, misalnya, kita bukan sahaja memerlukan pengetahuan tentang perubatan, tetapi juga fizik angkasa, mekanik, diet, kesihatan dan lain-lain. Selain itu. runtuhnya halangan lama di antara disiplin seperti yang wujud di era yang lama, era yang berorientasikan masalah di era yang baru, era yang berorientaskan misi, sudah menimbulkan satu lagi masalah yang kita hadapi: semakin lama kita semakin kehilangan ketajaman (sharpness), maka menjadi semakin berbaur (diffuse) tentang pengasingan dan penggabungan ilmu. Akar masalah itu bukan sahaja pengingkatan jumlah maklumat kerana perkembangan ilmu dan teknologi dengan mendadak dalam masa sedekad dua ini, tetapi juga kebolehan kita mengurus maklumat itu.

Sehubungan itu, walaupun capaian maklumat kini semakin banyak bergantung pada komputer, tetapi kemahiran individu dalam mencarinya, lebih-lebih lagi menguasai bahasa perlu ditingkatkan. Kedua-dua kemahiran itu tidak boleh diganti dengan menu, antaramuka dan bantuan lain di skrin komputer atau tetikus ataupun kekunci komputer, Kemahiran itu perlu dipelajari: daripada latihan, pendedahan, pengalaman, lebih-lebih lagi perlu diperkuatkan dengan minat dan keperluan pendidikan tinggi. Dengan kata lain, teknologi tidak boleh dianggap lebih penting daripada kemahiran manusia. Sekalipun timbul tanggapan maklumat sukar dicari tanpa teknologi, tetapi sistem, teks dan pengguna adalah lengkap­melengkapkan, dan bukannya manusia menjadi terpisah daripada teknologi, ataupun teknologi dianggap sudah memisahkan maklumat daripada penggunanya .. Kebergantungan ketiga-tiga pihak itu boleh dilihat dalam interaksi proses seperti yang dilakarkan ini:

Sistem----Teks/Maklumat----Pengguna

Kebergantungan itu berterusan dan seharusnya dipandang sedemikian. Daripada perspektif pengguna, fokus perhatian

kita ialah pada mekanisma capaian berdasarkan kebolehan dan kemahiran kita mencari maklumat yang sesuai, dan bukannya aspek teknikal sistem maklumat itu. Pada asasnya, mekanisma pencarian maklumat bermula dengan perkataan atau istilah yang difikirkan sesuai. Oleh itu, banyak pakar sudah lama mengkaji masalah, teori dan algoritma capaian maklumat untuk meningkatkan tahap kepuasan. Sekiranya tidak berpuas hati dengan hasil pencarian kali yang pertama, kita dinasihati agar dapat mengubah strategi pencarian, sarna ada dengan menggunakan perkataan baru atau menggabungkan perkataan yang difikirkan wajar seperti yang sudah ditunjukkan tadi. Masalah di sini ada kaitan dengan masalah Penyelarasan (coordination) - satu lagi masalah linguistik yang dihadapi dalam pencarian maklumat. Maklumlah bahasa Inggeris, seperti bahasa Melayu dan lain-lain, kay a dengan sinonim, antonim. quasi-synonyms, acronyms, istilah baru, ejaan yang menjadi pilihan, selain hakikat makna kala Inggeris yang tertentu berbeza­beza di Amerika Syarikat, United Kingdom dan Australia. Contohnya, elementary school, primary school, university dan college. Memang sukar diperbezakan dengan j elas antara kindergarten dan pre-schools, economics and costs dengan finance, third world, developing countries, underdeveloped countries. Makna setengah perkataan boleh berubah bila digunakan dalam konteks perkataan yang lain. Misalnya, konsep istilah information highway berbeza daripada makna dua perkataan information dan highway yang digunakan secara berasingan.

Sehingga kini terdapat hipotesis yang mengatakan teks yang berkaitan itu biasanya mempunyai kata-kata dan juga susunannya yang sarna, dan teks seumpama itu lebih banyak persamaannya di antara satu dengan yang lain. Sehubungan itu, logik algoritma yang sudah membolehkan

;-~-- .........

\ Display ) ........ ~- -...,..

\

Retrieval ' set I

~, - --;;jJ-'

.--'-~~ /-----.......

.(-:::~.~~) ~~I

DOCUMENT ~OLLECTI9N

i

/ / Reco;d--"""'l \ .. ~~<

(Sumber: Furner; 1997:6)

Hakcipta Terpelihara © 2000 - Perpustakaan Negara Malaysia

Hakcipta Terpelihara © 2000 - Perpustakaan Negara Malaysia

maklumat yang disebarkan kini sudah tidak mampu dikuasai individu, kita amat perlu membesarkan tabung ilmu pengetahuan sejajar dengan perkembangan ilmu dan teknologi. Sejak terciptanya alat cetak pada kurun yang ke 15 hingga era komputer pada abad yang ke 20, pengetahuan dunia sudah mengalami revolusi besar daripada kedua-dua proses tadi. Kini, tidak kurang daripada 1.5 hingga 2 juta artikel bam di bidang sains dan teknologi diterbitkan dan dindeks setiap tah un. Di United Kingdom sahaja, sebanyak 50.000 buah buku bam diterbitkan setiap tahun. Walaupun cuma sebahagian, barangkali 30% - 50% daripada bahan barn itu diperolehi perpustakaan dan dikongsi perpustakaan di bawah skima pinjaman antara perpustakaan, dan hanya kira-kira 10% bahan itu diperolehi pembaca individu., tetapi kita sudah tenggelam dalam lautan maklumat yang berhempas pulas di hujung dunia penerbitan dan sistem rangkaian maklumat. Oleh itu, untuk mencari maklumat tentang perubatan angkasa, misalnya, kita bukan sahaja memerlukan pengetahuan tentang perubatan, tetapi juga fizik angkasa, mekanik, diet, kesihatan dan lain-lain. Selain itu. runtuhnya halangan lama di antara disiplin seperti yang wujud di era yang lama, era yang berorientasikan masalah di era yang baru, era yang berorientaskan misi sudah menimbulkan satu lagi masalah yang kita hadapi: semakin lama kita semakin kehilangan ketajaman (sharpness), maka menjadi semakin berbaur (diffuse) tentang pengasingan dan penggabungan ilmu. Akar masalah i bukan sahaja pengingkatan jumlah maklumat kerana perkembangan ilmu dan teknologi dengan mendadak dalam masa sedekad dua ini, tetapi juga kebolehan kita mengurus maklumat itu.

Sehubungan itu, walaupun capaian maklumat kini semakin banyak bergantung pada komputer, tetapi kemahiran individu dalam mencarinya, lebih-lebih lagi menguasai bahasa perlu ditingkatkan. Kedua-dua kemahiran itu tidak boleh diganti dengan menu, antaramuka dan bantuan lain di skrin komputer atau tetikus ataupun kekunci komputer, Kemahiran itu perlu dipelajari: daripada latihan, pendedahan, pengalaman, lebih-lebih lagi perlu diperkuatkan dengan minat dan keperluan pendidikan tinggi. Dengan kata lain, teknologi tidak boleh dianggap lebih penting daripada kemahiran manusia. Sekalipun timbul tanggapan maklumat sukar dicari tanpa teknologi, tetapi sistem, teks dan pengguna adalah lengkap­melengkapkan, dan bukannya manusia menjadi terpisah daripada teknologi, ataupun teknologi dianggap sudah memisahkan maklumat daripada penggunanya .. Kebergantungan ketiga-tiga pihak itu boleh dilihat dalam interaksi proses seperti yang dilakarkan ini:

Sistem----Teks/Maklumat----Pengguna

Kebergantungan itu berterusan dan seharusnya dipandang sedemikian. Daripada perspektif pengguna, fokus perhatian

-

::l.·~llor IIrrp~.:JI~lialln

kita ialah pada mekanisma capaian berdasarkan kebolehan dan kemahiran kita mencari maklumat yang sesuai, dan bukannya aspek teknikal sistem maklumat itu. Pada asasnya, mekanisma pencarian maklumat bermula dengan perkataan atau istilah yang difikirkan sesuai. Oleh itu, banyak pakar sudah lama mengkaji masalah, teori dan algoritma capaian maklumat untuk meningkatkan tahap kepuasan. Sekiranya tidak berpuas hati dengan hasil pencarian kali yang pertama, kita dinasihati agar dapat mengubah strategi pencarian, sarna ada dengan menggunakan perkataan baru atau menggabungkan perkataan yang difikirkan wajar seperti yang sudah ditunjukkan tadi. Masalah di sini ada kaitan dengan masalah Penyelarasan (coordination) - satu lagi masalah linguistik yang dihadapi dalam pencarian maklumat. Maklumlah bahasa Inggeris, seperti bahasa Melayu dan lain-lain, kay a dengan sinonim, antonim. quasi-synonyms, acronyms, istilah baru, ejaan yang menjadi pilihan, selain hakikat makna kala Inggeris yang tertentu berbeza­beza di Amerika Syarikat, United Kingdom dan Australia. Contohnya, elementary school, primary school, university dan college. Memang sukar diperbezakan dengan j elas antara kindergarten dan pre-schools, economics and costs dengan finance, third world, developing corlnJrtes, underdeveloped countries. Makna setengah perkataan boleh berubah bila digunakan dalam kQnteks perkataan yang lain. Misalnya, konsep istilah information highw.ay berbeza daripada makna dua perkataan informati()n dan highway yang digunakan secara berasingan.

Sehingga kini terdapat hipotesis yang mengatakan teks yang berkaitan itu biasanya mempunyai kata-kata dan juga susunannya yang sarna, dan teks seumpama itu lebih banyak persamaannya di antara satu dengan yang lain. Sehubungan itu, logik algoritma yang sudah membolehkan

- - - - - - - - - --

;-...--------...... \ Display ) '--~- _./ .

\

Retrieval ' set I

~, - ---:;;;iIi_:

'(Input -) C~tPu~~) ~---:: ... -- -~-

DOCUMENT ~OLLECTI~)N

i

//Reco;d"'" \ ...... ~eatlOn ..--/

(Sumber: Furner; 1997:6)

Rajah B: Proses Pencarian Maklumat

Melibatkan Penggunaan Bahasa

Requirements

User Input Processing

User and system interact to map user inputs terms (regarded in isolation at this stage) onto the most appropriate stored keywords.

Context Determination

Determination of term interdependecies and user feedback for the initial selection of search term qualifiers and logical connectives

Query Reformulation Broadering or narrowmg of the search

Initial User Input

Corresponding set ofDDF keywords

(Primary Search Equation)

Set of qualified search terms and logicals connectives (Final search Equation)

Optimal Search Statement

Processes Involved

1. Lexical Clustering Techniques

2. Semantic Clustering Techniques

3. Browsing

a) DDF Appendix A Browser

b) Thesaurus Browser

1. Advisory Menus

2. Query Templates

1. Term Substitution

2. Substitution of connectives

3. Substitution of qualifiers

(Sumber: Oakes & Taylor, 1998:651)

Hakcipta Terpelihara © 2000 - Perpustakaan Negara Malaysia

Hakcipta Terpelihara © 2000 - Perpustakaan Negara Malaysia

Rajah B: Proses Pencarian Maklumat

Melibatkan Penggunaan Bahasa

Requirements

User Input Processing

User and system interact to map user inputs terms (regarded in isolation at this stage) onto the most appropriate stored keywords.

Initial User Input

Corresponding set ofDDF keywords

. ___ I __ (PrimillY Search Eguation)

Context Determination------.

Detennination of tenn interdependecies and user feedback for the initial selection of search term qualifiers and logical connectives

Query Refonnulation Broadering or narrowmg of the search

Set of qualified search tenns and logicals connectives (Final search Equation)

Optimal Search Statement

Processes Involved

1. Lexical Clustering Techniques

2. Semantic Clustering Techniques

3. Browsing

a) DDF Appendix A Browser

b) Thesaurus Browser

1. Advisory Menus

2. Query Templates

1. Tenn Substitution

2. Substitution of connectives

3. Substitution of qualifiers

(Sumber: Oakes & Taylor, 1998:651)

komputer digunakan kerana kehebatan teknologi itu membuat pencarian ell banyak peringkat juga boleh dinampak dalam rajah A dan B di bawah ini. Dalam kedua-dua rajah itu ditunjukkan kehebatan komputer dalam 'comparing similarity and matching, query reformulation by relevance feedback dan follow-up connections between items on the databases' (Foskett 1996. Furner 1997, Liddy 1990 dan Oakes & Taylor 1998). Sekiranya rajah A menunjukkan kebergantungan sistem + maklumat + pengguna' yang sudah dibincangkan tadi, maka rajah B pula cuba menunjukkan strategi pencarian yang melibatkan penggunaan bahasa di banyak peringkat yang berbeza-beza.

Rajah A: Unsur Dalam Pencarian

Yang menarik ialah mekanisma pencarian maklumat berkomputer kini bukan sahaja sudah dipelbagaikan, tetapi juga menjadi lebih flesibel, dan mesra pengguna, termasuk membolehkan kita melakukan apa yang tersebut di bawah ini sama ada di OP AC, CD-ROM, pangkalan data atas talian ataupun Internet:

1. Pelayaran (navigation) yang membolehkan kita membuat keputusan yang berkaitan di setiap peringkat dalam proses pencarian,

11. Merayau-rayau (wandering) ke seluruh sistem maklumat itu tanpa tujuan,

111. Meneroka (exploring) untuk mencan takat maklumat yang bam,

IV. Mencari (searching) untuk mendapatkan maklumat yang eksplisit,

v. Menenguk (browsing) untuk membolehkan kita mencari maklumat tanpa perlunya mengenal­pastinya.

VI. Mengimbas (scanning) untuk melihat-lihat sahaja maklumat yang dipaparkan tanpa mendalam

Namun demikian, berikutan pembesaran saiz pangkalan data, dan juga bertambah kompleknya operasi pengindeksan maklumatnya dalam sistem maklumat berkomputer kini, semakin banyak maklumat perlu diurus dengan lebih cekap dan berkesan. Di sini kita wajar merakamkan terima kasih kepada kira-kira 5,000 orang pakar linguistik yang membuat penyelidikan di banyak Universiti dan Institut penyelidikan di seluruh dunia. Mereka bukan sahaja mengkaji kira-kira 4.000 bahasa yang masih hidup dan ratusan bahasa yang sudah pupus {termasuk Latin dan Sanskrit), tetapi juga masalah synonymy, hyponymy, homography, leksikal. hubungan semantik, sintaksis, lebih­lebih lagi kejuruteraan pembentukan istilah. Hasil penyelidikan mereka yang amat besar Sumbangan kepada perkembangan pencarian maklumat, itu boleh didapati

dalam dua dozen jurnallinguistik dan 700-800 jurnal yang lain. Artikel itu didominasi bahasa Inggeris, disusuli bahasa Rusia, Perancis dan German.

Masalah linguistik yang umum daripada segi pemanggilan semula dan ketepatan itu as as masalah semantik dan sintaksis. Kedua-dua masalah itu timbul kerana makna perkataan tidak terhad kepada apa yang tersurat, tetapi juga yang tersirat, apatah lagi berubah-ubah mengikut konteks. Sebahagian daripada apa yang dimaksudkan itu boleh dilihat dalam penggunaan konsep yang terdiri daripada information highway yang telah diberi. Kerumitan antara makna dengan pemahaman itu yang disebut Chomsky sebagai 'the creativity of language use' dan juga 'the connected difficulties o.f description and explanation' itu adalah juga hasil interaksi antara bahasa dan fikiran manusia sendiri. Di dalamnya terdapat empat unsur yang berlainan, tetapi saling berkaitan, iaitu

1. Kebolehan kita menggunakan bahasa itu.

11. Kebolehan kita memahami bahasa itu.

111. Kebolehan kita menggunakan dan memahami bahasa itu dalam konteks yang betul, dan

IV. Sebab apa kita menggunakan bahasa dan memahami bahasa yang digunakan itu.

Oleh sebab masalah pemanggilan semula dan ketepatan juga disebabkan apa yang disebut sebagai 'semantic and syntactic reactivity', penguasaan bahasa amatlah diperlukan dalam pencarian maklumat. Penguasaan itu biasanya diukur daripada segi sebanyak mana kit a mempunyai Perbendaharaan kata dalam bahasa yang tertentu itu, dan sebaik mana kita mengetahui semantiknya, selain mengetahui nahu bahasa itu. T anpa penguasaan bahasa dan pemilikan tabung ilmu yang banyak dilengkapi persediaan yang diperlukan itu, mencari maklumat terkadang-kadang telah berubah menjadi permainan teka­leki. Ini disebabkan usaha dikatakan penuh dengan misteri, kerana makna perkataan bergantung pada apa yang difahaminya. selain apa yang difahami orang yang membuat pengindeksan dan juga konteks perkataan itu digunakan.

Sepanjang artikel ini sudah dinyatakan bahawa berjaya tidaknya sistem maklumat dalam memenuhi kehendak pencarian maklumat kita boleh ditinjau daripada dua segi: pemanggilan semula dan ketepatan. Walaupun sistem maklumat berkomputer kini mungkin masih tidak membolehkan kita mendapat maklumat yang sesuai setiap masa dan dalam format dan bilangan yang dikehendaki, tetapi kadar kejayaannya dalam memenuhi kehendak kita sudah meningkat berbanding dengan sistem maklumat manual dahulu. Selain itu, sebab utama yang mendorong kita ghairah menggunakan sistem maklumat berkomputer

Hakcipta Terpelihara © 2000 - Perpustakaan Negara Malaysia

Hakcipta Terpelihara © 2000 - Perpustakaan Negara Malaysia

-

• ~t~Hr.[ p~r~~.11 h',~aU

komputer digunakan kerana kehebatan teknologi itu membuat pencarian ell banyak peringkat juga boleh dinampak dalam rajah A dan B di bawah ini. Dalam kedua-dua rajah itu ditunjukkan kehebatan komputer dalam 'comparing similarity and matching, query reformulation by relevance feedback dan follow-up connections between items on the databases' (Foskett 1996. Furner 1997, Liddy 1990 dan Oakes & Taylor 1998). Sekiranya rajah A menunjukkan kebergantungan sistem + maklumat + pengguna' yang sudah dibincangkan tadi, maka rajah B pula cuba menunjukkan strategi pencarian yang melibatkan penggunaan bahasa di banyak peringkat yang berbeza-beza.

Rajah A: Unsur Dalam Pencarian

Yang menarik ialah mekanisma pencarian maklumat berkomputer kini bukan sahaja sudah dipelbagaikan, tetapi juga menjadi lebih flesibel, dan mesra pengguna, termasuk membolehkan kita melakukan apa yang tersebut di bawah ini sama ada di OP AC, CD-ROM, pangkalan data atas talian

dalam dua dozen jurnallinguistik dan 700-800 jurnal yang lain. Artikel itu didominasi bahasa Inggeris, disusuli bahasa Rusia, Perancis dan German.

Masalah linguistik yang umum daripada segi pemanggilan semula dan ketepatan itu as as masalah semantik dan sintaksis. Kedua-dua masalah itu timbul kerana makna perkataan tidak terhad kepada apa yang tersurat, tetapi juga yang tersirat, apatah lagi berubah-ubah mengikut konteks. Sebahagian daripada apa yang dimaksudkan itu boleh dilihat dalam penggunaan konsep yang terdiri daripada information highway yang telah diberi. Kerumitan antara makna dengan pemahaman itu yang disebut Chomsky sebagai 'the creativity of language use' dan juga 'the connected difficulties o.f description and explanation' itu adalah juga hasil interaksi antara bahasa dan fikiran manusia sendiri. Di dalamnya terdapat empat unsur yang berlainan, tetapi saling berkaitan, iaitu

1. Kebolehan kita menggunakan bahasa itu.

11. Kebolehan kita memahami bahasa itu. ataupun Internet: ----

1. Pelayaran (navigation) yang membQlehkan kita membuat keputusan yang berkaitan di peringkat dalam proses pencarian,

11. Merayau-rayau (wandering) k€ €luruh sistem

Kebolehan kita menggunakan dan memahami ~--bahasa itu dalam konteks yang betul, dan

S-ebab apa kita menggunakan bahasa dan memahami bahasa yang digunakan itu.

maklumat itu tanpa tujuan, Oleh sebab masalah pemanggilan semula dan ketepatan ..--___ -------~juga clise15aOKaILapa yang disebut sebagai 'semantic and

111. Meneroka (exploring) untuk mencan takat syntactic reactivity', penguasaan bahasa amatlah

maklumat yang bam, diperlukan dalam pencarian maklumat. Penguasaan itu

IV. Mencari (searching) untuk mendapatkan biasanya diukur daripada segi sebanyak mana kit a maklumat yang eksplisit, memRunyai Perbendaharaan kata dalam bahasa yang

tertentu itu, dan sebaik mana kita mengetahui semantiknya, v. Menenguk (browsing) untuk membolehkan kita selain mengetahui nahu bahasa itu. Tanpa penguasaan

mencari maklumat tanpa perlunya mengenal- bahasa dan pemilikan tabung ilmu yang banyak dilengkapi

pastinya. persediaan yang diperlukan itu, mencari maklumat

VI. Mengimbas (scanning) untuk melihat-lihat sahaja terkadang-kadang telah berubah menjadi permainan teka-maklumat yang dipaparkan tanpa mendalam leki. Ini disebabkan usaha dikatakan penuh dengan misteri,

Namun demikian, berikutan pembesaran saiz pangkalan data, dan juga bertambah kompleknya operasi pengindeksan maklumatnya dalam sistem maklumat berkomputer kini, semakin banyak maklumat perlu diurus dengan lebih cekap dan berkesan. Di sini kita wajar merakamkan terima kasih kepada kira-kira 5,000 orang pakar linguistik yang membuat penyelidikan di banyak Universiti dan Institut penyelidikan di seluruh dunia. Mereka bukan sahaja mengkaji kira-kira 4.000 bahasa yang masih hidup dan ratusan bahasa yang sudah pupus {termasuk Latin dan Sanskrit), tetapi juga masalah synonymy, hyponymy, homography, leksikaL hubungan semantik, sintaksis, lebih­lebih lagi kejuruteraan pembentukan istilah. Hasil penyelidikan mereka yang amat besar Sumbangan kepada perkembangan pencarian maklumat, itu boleh didapati

kerana makna perkataan bergantung pada apa yang difahaminya. selain apa yang difahami orang yang membuat pengindeksan dan juga konteks perkataan itu digunakan.

Sepanjang artikel ini sudah dinyatakan bahawa berjaya tidaknya sistem maklumat dalam memenuhi kehendak pencarian maklumat kita boleh ditinjau daripada dua segi: pemanggilan semula dan ketepatan. Walaupun sistem maklumat berkomputer kini mungkin masih tidak membolehkan kita mendapat maklumat yang sesuai setiap masa dan dalam format dan bilangan yang dikehendaki, tetapi kadar kejayaannya dalam memenuhi kehendak kita sudah meningkat berbanding dengan sistem maklumat manual dahulu. Selain itu, sebab utama yang mendorong kita ghairah menggunakan sistem maklumat berkomputer

kini ialah 'kekurangan' kita sendiri daripada segi tabung ilmu pengetahuan, kebolehan mencari, lebih-Iebih lagi penguasaan bahasa. Isu pokok di sini bukan sahaja syarikat pangkalan data dan sistem maklumat mesti berusaha untuk memastikan sistemnya tidak mempunyai kecenderungan

binaan dalam (built-in tendency) yang boleh menambah lagi kesilapan dan kelemahan manusia di satu pihak, tetapi juga kita sendiri mesti berusaha membaiki diri di satu pihak yang lain.

Hakcipta Terpelihara © 2000 - Perpustakaan Negara Malaysia

Hakcipta Terpelihara © 2000 - Perpustakaan Negara Malaysia

kini ialah 'kekurangan' kita sendiri daripada segi tabung ilmu pengetahuan, kebolehan mencari, lebih-Iebih lagi penguasaan bahasa. Isu pokok di sini bukan sahaja syarikat pangkalan data dan sistem maklumat mesti berusaha untuk memastikan sistemnya tidak mempunyai kecenderungan

binaan dalam (built-in tendency) yang boleh menambah lagi kesilapan dan kelemahan manusia di satu pihak, tetapi juga kita sendiri mesti berusaha membaiki diri di satu pihak yang lain.

RUJUKAN

1. Ellis, David. (1996) Progress and problems in Information retrieval. London: Library Association Publishing.

2. Fidel, Raya. 'User-centered indexing. , Journal of the American Society for Information Science 45 {1994). 572-6

3. Foskett. A. C. (1996) The subject approach to information. London: Library Association Publishing.

4. Furner, Jonathan. (1997) IR on the Web; an overview. 'VINE 104 (1997),3-13

5. Green, Rebecca. (1999) 'The role of relational structures in indexingfor the humanities/ Knowledge Organiza­tion, 24:2 (1997), 72-83.

6. Liddy, E. DuRoss. (1990) 'Anaphora in natural language processing and retrieval.' Information Processing and Management, 26 (1990), 39-52.

7. Oakes. Michael P. & Taylor, Malcolm T. (1998) 'Automated assistance in the formulation of search statements to bibliographic databases,' Information Processing & Management 34:6 (1998). 645-668

Hakcipta Terpelihara © 2000 - Perpustakaan Negara Malaysia

Hakcipta Terpelihara © 2000 - Perpustakaan Negara Malaysia

RUJUKAN

1. Ellis, David. (1996) Progress and problems in Information retrieval. London: Library Association Publishing.

2. Fidel, Raya. 'User-centered indexing. , Journal of the American Society for Information Science 45 {1994). 572-6

3. Foskett. A. C. (1996) The subject approach to information. London: Library Association Publishing.

4. Furner, Jonathan. (1997) IR on the Web; an overview. 'VINE 104 (1997),3-13

5. Green, Rebecca. (1999) 'The role of relational structures in indexingfor the humanities/ Knowledge Organiza­tion, 24:2 (1997), 72-83.

6. Liddy, E. DuRoss. (1990) 'Anaphora in natural language processing and retrieval.' Information Processing and Management, 26 (1990), 39-52.

7. Oakes. Michael P. & Taylor, Malcolm T. (1998) 'Automated assistance in the formulation of search statements to bibliographic databases,' Information Processing & Management 34:6 (1998). 645-668