Stemming Bahasa Tetun Menggunakan Pendekatan Rule Based

Journal Title: Teknika - Year 2019, Vol 8, Issue 2

Abstract

Stemming adalah proses yang sangat penting untuk mencari kata dasar dari sebuah kata derivatif. Inti dari proses stemming adalah menghilangkan imbuhan pada suatu kata. Stemming sangat dibutuhkan untuk proses information retrieval system. Algoritma pada proses stemming bisa berbeda-beda pada setiap bahasa di berbeda negara. Data yang digunakan adalah 176 kata dasar dalam bahasa Tetun yang merupakan bahasa asli warga negara Timor Leste. Penelitian ini bertujuan untuk merancang algoritma baru yang tepat untuk stemming bahasa Tetun. Tahap awal stemming bahasa Tetun adalah proses filterisasi untuk menghilangkan tanda baca, angka, dan kata yang tidak penting. Lalu tahap tokenisasi untuk membuat variabel yang terdiri dari satu kata. Lalu setiap kata melalui proses stemming untuk menghilangkan imbuhan awalan, akhiran, dan konfiks. Analisis dilakukan berdasarkan kasus error stemming seperti overstemming, understemming, unchanged, dan spelling exception. Hasil uji coba yang didapatkan adalah algoritma stemming bahasa Tetun menghasilkan akurasi sebesar 90.52%.

Authors and Affiliations

Anita Guterres, Gunawan Gunawan, Joan Santoso

Keywords

Related Articles

Penentuan Pembimbing Tugas Akhir Mahasiswa Jurusan Teknik Informatika Universitas Surabaya Dengan Metode Dice Coefficient

Tugas Akhir (TA) adalah sebuah karya ilmiah yang harus dibuat oleh mahasiswa jurusan Teknik Informatika, Universitas Surabaya sebagai salah satu syarat kelulusan. Dalam mengajukan topik TA, mahasiswa wajib membuat dan me...

Sistem Pendukung Keputusan Penentuan Penerimaan Raskin Menggunakan Metode Simple Additive Weighting (Studi Kasus Kelurahan Kota Uneng)

Program Beras Miskin atau Raskin merupakan salah satu program pemerintah untuk mengurangi beban pengeluaran dan perlindungan terhadap keluarga miskin melalui pendistribusian beras dengan jumlah dan harga tertentu. Dalam...

Perbandingan Kinerja Tool Data Mining Weka dan Rapidminer Dalam Algoritma Klasifikasi

Data mining merupakan ilmu yang membahas tentang bagaimana menambang pengetahuan dari sebuah data. Klasifikasi merupakan salah satu bagian dari data mining. Algoritma klasifikasi dalam data mining bermacam-macam model. K...

Implementasi Decision Tree C4.5 Untuk Menentukan Status Berat Badan dan Kebutuhan Energi Pada Anak Usia 7-12 Tahun

Decision Tree 4.5 merupakan salah satu algoritma klasifikasi yang banyak digunakan untuk memperoleh hasil klasifikasi non biner. Dibanding algoritma sejenis, Decision Tree 4.5 memiliki kelebihan pada kemampuan untuk meng...

Analisis Hasil Implementasi Konsep Context-Aware Pada Aplikasi Mobile Family Tracking Untuk Platform Android

Pada bulan Juni 2017, dilakukan survei terhadap 44 orang tua yang bekerja dan pengguna smartphone di Pekanbaru, diketahui bahwa orang tua membutuhkan aplikasi untuk memantau keberadaan anak, namun belum ada orang tua yan...

Download PDF file
  • EP ID EP666036
  • DOI 10.34148/teknika.v8i2.224
  • Views 136
  • Downloads 0

How To Cite

Anita Guterres, Gunawan Gunawan, Joan Santoso (2019). Stemming Bahasa Tetun Menggunakan Pendekatan Rule Based. Teknika, 8(2), 142-147. https://europub.co.uk/articles/-A-666036