5
APLIKASI PENERJEMAH BAHASA INDONESIA KE DALAM BENTUK SQL DENGAN PENGGUNAAN NATURAL LANGUAGE PROCESSING Abstract Use of the program by using the database as a data processing has been very commonly used. The process is carried out must first understand the structure of SQL (Structured Query Language). NLP (Natural Language Processing), which is one of research topics from the field of artificial intelligence (artificial intelligence). Computers have the ability to process spoken language or writing used by humans in daily life. The use of NLP in this case change the format of the SQL language will be changed to the natural language of everyday language that is often used is Indonesian. In its application performed an experiment on 4 user ie every user to experiment as much as 25 input natural language sentences with the use of two training databases. The conclusions are that the total results of the input sentence in accordance with the structure of SQL as much as 54% in the first database and 57% in the second database. Low percentage is due to the use of NLP patterns are still low. So that future expansion of the types of sentences are needed in order to vary the sentences used. PENDAHULUAN Bahasa sebagai bagian yang penting dari kehidupan manusia, dalam bentuk tulis dapat merupakan catatan dari pengetahuan yang didapat oleh umat manusia dari satu generasi ke generasi berikutnya sedangkan dalam bentuk lisan merupakan sarana komunikasi antara individu dalam suatu masyarakat. Di Indonesia khususnya bahasa yang umum digunakan dan menjadi bahasa resmi adalah Bahasa Indonesia.[1] Bahasa[2] merupakan alat yang digunakan untuk berkomunikasi. Tidak hanya untuk melakukan komunikasi antara manusia dengan manusia yang lainnya, namun dalam hal ini bahasa juga menjembatani komunikasi antara manusia dengan komputer. Bahasa yang digunakan

Aplikasi Penerjemah Bahasa Indonesia Ke Dalam Bentuk SQL

Embed Size (px)

Citation preview

Page 1: Aplikasi Penerjemah Bahasa Indonesia Ke Dalam Bentuk SQL

APLIKASI PENERJEMAH BAHASA INDONESIA KE DALAM BENTUK SQL

DENGAN PENGGUNAAN NATURAL LANGUAGE PROCESSING

Abstract

Use of the program by using the database as a data processing has been very commonly used. The process is carried out must first understand the structure of SQL (Structured Query Language). NLP (Natural Language Processing), which is one of research topics from the field of artificial intelligence (artificial intelligence). Computers have the ability to process spoken language or writing used by humans in daily life. The use of NLP in this case change the format of the SQL language will be changed to the natural language of everyday language that is often used is Indonesian. In its application performed an experiment on 4 user ie every user to experiment as much as 25 input natural language sentences with the use of two training databases. The conclusions are that the total results of the input sentence in accordance with the structure of SQL as much as 54% in the first database and 57% in the second database. Low percentage is due to the use of NLP patterns are still low. So that future expansion of the types of sentences are needed in order to vary the sentences used.

PENDAHULUAN

Bahasa sebagai bagian yang penting dari kehidupan manusia, dalam bentuk tulis dapat merupakan catatan dari pengetahuan yang didapat oleh umat manusia dari satu generasi ke generasi berikutnya sedangkan dalam bentuk lisan merupakan sarana komunikasi antara individu dalam suatu masyarakat. Di Indonesia khususnya bahasa yang umum digunakan dan menjadi bahasa resmi adalah Bahasa Indonesia.[1]

Bahasa[2] merupakan alat yang digunakan untuk berkomunikasi. Tidak hanya untuk melakukan komunikasi antara manusia dengan manusia yang lainnya, namun dalam hal ini bahasa juga menjembatani komunikasi antara manusia dengan komputer. Bahasa yang digunakan manusia untuk berkomunikasi dengan komputer dikenal dengan bahasa pemrograman. Bahasa SQL merupakan bahasa pemrograman yang bergerak dalam bidang database.

Natural Language Processing (NLP) atau pengolahan bahasa alami[3] merupakan salah satu bidang ilmu Artificial Intelligence (Kecerdasan Buatan) yang mempelajari komunikasi antara manusia dengan komputer melalui bahasa alami. NLP tidak bertujuan untuk mentransformasikan bahasa yang diterima dalam bentuk suara menjadi data digital dan/atau sebaliknya pula; melainkan bertujuan untuk memahami arti dari ucapan yang diberikan dalam bahasa alami dan memberikan respon yang sesuai.

Seiring dengan perkembangan jaman yang semakin maju dan juga dengan semakin pesatnya penggunaan database maka dibutuhkan suatu aplikasi untuk mempermudah proses pengolahan data selain itu juga untuk mempercepat waktu pemprosesan data. Maka dibuatlah suatu sistem penerjemah bahasa SQL dengan penggunaan Natural Language Processing. Dengan adanya sistem

Page 2: Aplikasi Penerjemah Bahasa Indonesia Ke Dalam Bentuk SQL

ini, diharapkan dapat memberikan solusi proses pegolahan data Dimana penggunaan sistem ini menginputkan teks kalimat dalam bentuk Bahasa Indonesia yang baku, sedangkan SQLyang menjadi keluarannya berupa baris perintah dalam format SQL dan menghasilkan data yang telah inputkan sebelumnya.

TINJAUANPenelitian Sebelumnya

Dalam Penggunaan konversi bahasa SQL dengan menggunakan Bahasa Alami atau Natural Language Processing telah sebelumnya diteliti oleh beberapa peneliti diantaranya. Penelitian yang dilakukan oleh Agus Purwo Handoko (2009) yang berjudul Aplikasi Pengolahan Bahasa Alami untuk Operasi Queri Database dimana dalam penelitiannya ini dalam pengujiannya dilakukan terhadap satu buah basis data yang memiliki satu buah table yaitu tabel mahasiswa yang terdiri dari tiga field (nim, nama dan alamat). Dari Hasil penelitian ini masih melakukan queri yang sangat sederhana dimana pengerjaannya hanya menampilkan data saja dalam satu tabel. Suatu data yang ditampilkan hanya berupa penggunaan Select * from nama tabel dan dengan penggunaan kondisi where saja.[4]

Kemudian terdapat pula penelitian yang dilakukan oleh Kuspriyanto, Herry Sujani, Harry Tjahjono, Shofyan Kusuma(2005) dengan judul penelitian Perancangan Translator Bahasa Alami Ke Dalam Format SQL (structured Query Language). Dimana dalam proses translasi bahasa SQL ini dilakukan dengan cara user menginput kalimat yang dinginkan kemudian input-an kalimat tersebut terjadi penyusuaian atau pembetulan kata dimana jika terdapat kesalahan pengetikan seperti kekurangan huruf, kelebihan huruf dan kesalahan letak huruf maka secara otomatis kata tersebut akan mengalami proses pembenaran kata. Proses selanjutnya adalah proses translasi yaitu dalam pengoperasiannya nantinya terdapat pemilihan format SQL yang sesuai dengan maksud kalimat alami yang di-input-kan oleh user, dapat menentukan kriteria format SQL yang dipilih dan melengkapi kriteria tersebut. Dalam pengujiannya dilakukan terhadap tiga buah basis data. Untuk proses translasi dalam mencari data yang dilakukan terhadap tiga basis data sudah mengalami tingkat keberhasilan 86%.[5]

Tata Bahasa IndonesiaKalimat dapat dirumuskan sebagai konstruksi sintaksis terbesar yang terdiri dari dua kata atau

lebih. Hubungan struktural antara kata dan kata, atau kelompok kata dan kelompok kata lain, berbeda-beda. Antara ‘kalimat’ dan ‘kata’ terdapat dua satuan sintaksis antara, yaitu ‘klausa’ dan ‘frasa’. Klausa merupakan satuan sintaksis yang terdiri dari dua kata atau lebih, yang mengandung unsur predikasi. Unsur predikasi adalah subyek, predikat, obyek, pelengkap, atau keterangan. Frasa adalah satuan sintaksis yang terdiri dari dua kata atau lebih yang tidak mengandung unsur predikasi.[1]

Kalimat umumnya berwujud rentetan kata yang disusun sesuai dengan kaidah yang berlaku. Tiap kata dalam kalimat mempunyai tiga klasifikasi, yaitu berdasarkan (1) bentuk dan kategori kata / frasa, (2) fungsi sintaksis, dan (3) peran semantisnya.

Page 3: Aplikasi Penerjemah Bahasa Indonesia Ke Dalam Bentuk SQL

Bentuk dan Kategori Kata / FrasaKata dapat dibedakan berdasarkan kategori sintaksisnya. Artinya, kata yang mempunyai bentuk serta perilaku yang sama dimasukkan dalam satu kelompok. Kategori sintaksis sering juga disebut kategori atau kelas kata. Kelas kata yang ada dalam Bahasa Indonesia adalah:1. Verba (kata kerja)2. Nomina (kata benda)3. Adjektiva (kata sifat)4. Adverbia (kata keterangan)5. Kata tugas:a. Preposisi (kata depan)b. Konjungtor (kata sambung)c. Partikel penegasd. Artikulae. Interjeksi (kata seru)

Nomina, verba, maupun adjektiva dapat dikembangkan dengan tambahan pembatas (pewatas) tertentu menjadi sebuah frasa. Frasa adalah satuan sintaksis yang terdiri atas dua kata atau lebih yang tidak mengandung unsur predikasi. Jika dua kata atau lebih itu mengandung unsur predikasi maka satuan sintaksis tersebut disebut klausa. Kategori frasa dibedakan berdasarkan unsur utamanya, yaitu:1. Frasa Nominal (FN), contoh: gedung -> gedung sekolah, gedung bagus2. Frasa Verbal (FV), contoh: makan -> makan pelan-pelan, pergi -> sudah pergi3. Frasa Adjektival (FAdj), contoh: manis -> sangat manis4. Frasa Preposisional (FPrep), contoh: kepada -> kepada saya

SQL (Structured Query Language)SQL[6] adalah kependekan dari Structured Query Language. Dalam bahasa Inggris, SQL biasa

dibaca sebagai SEQUEL atau ES-KYU-EL. Bahasa ini merupakan standar yang digunakan untuk mengakses database rasional. Standar SQL mula-mula didefinisikan oleh ISO dan ANSI, yang dikenal dengan sebutan SQL86. Seiring dengan perjalanan waktu, sejumlah standar baru telah ditetapkan. Bahasa SQL terbagi dalam dua bagian besar, yaitu: DDL (Data Definition Language) dan DML (Data Manipulation Language) DDL mendefinisikan struktur basis data, seperti pembuatan basis data, pembuatan tabel dan sebagainya. Contoh: Create Database dan Create Table. DML merupakan bagian untuk memanipulasi basis data seperti: pengaksesan data, penghapusan, penambahan dan pengubahan data. DML juga dapat digunakan untuk melakukan komputasi data. Contoh: insert, delete, dan update. [7]

NLP (Natural Language Processing)Penelitian dalam bidang Natural Language ini adalah melakukan proses pembuatan model

komputasi dari bahasa, sehingga dapat terjadi suatu interaksi antara manusia dengan komputer dengan perantaraan bahasa alami.[1]

Dibawah ini dijelaskan bentuk - bentuk pengetahuan yang berhubungan dengan Natural Language Understanding :

Page 4: Aplikasi Penerjemah Bahasa Indonesia Ke Dalam Bentuk SQL

1. Fonetik dan fonologi : berhubungan dengan suara yang menghasilkan kata yang dapat dikenali. Bidang ini menjadi penting dalam proses aplikasi yang memakai metode speech based system.

2. Morfologi : tingkatan pegetahuan tentang kata dan komponen pembentuknya dimanfaatkan untuk membedakan satu kata dengan lainnya. Pada tingkatan ini pengolahan juga dapat memisahkan antara kata dengan elemen bahasa yang lain seperti tanda baca.

3. Sintaksis : meliputi proses pengaturan tata letak suatu kata dalam kalimat akan membentuk kalimat yang dapat dikenali. Selain itu dapat pula dikenali bagian – bagian kalimat dalam suatu kalimat yang lebih besar.

4. Semantik : mempelajari arti suatu kata dan bagaimana dari arti kata - arti kata tersebut membentuk suatu arti dari kalimat yang utuh. Dalam tingkatan ini belum tercakup konteks dari kalimat tersebut.

5. Pragmatik : pengetahuan pada tingkatan ini berkaitan dengan masing - masing konteks yang berbeda tergantung pada situasi dan tujuan pembuatan sistem.

6. Discourse Knowledge : melakukan pengenalan apakah suatu kalimat yang sudah dibaca dan dikenali sebelumnya akan mempengaruhi arti dari kalimat selanjutnya. Informasi ini penting diketahui untuk melakukan pengolahan arti terhadap kata ganti orang dan untuk mengartikan aspek sementara dari informasi.

7. Word Knowledge : mencakup arti sebuah kata secara umum dan apakah ada arti khusus bagi suatu kata dalam suatu percakapan dengan konteks tertentu.