Analisis Pengklasifikasian Dokumen dengan Pembobotan Frekuensi Kata Berbanding Logaritma Jumlah Kata Serta Fungsi Cosine

Journal Title: SENSITEK - Year 2018, Vol 1, Issue 1

Abstract

Dokumen merupakan suatu kumpulan data yang berguna sebagai referensi dalam penulisan suatu karya tulis ilmiah maupun non ilmiah yang dapat dimanfaatkan sebagai referensi tulisan. Dengan dukungan referensi yang tepat maka suatu karya dapat dikatakan kredibel dan dapat dipercaya. Namun pertumbuhan yang pesat dari jumlah dokumen informasi maka diperlukan sebuah teknik pencarian yang tepat untuk dapat menemukan dokumen sesuai kebutuhan salah satunya dengan sistem temu kembali informasi (information retrieval system/IRS). Salah satu teknik IRS yang dapat digunakan untuk merepresentasikan profil dokumen adalah model ruang vektor (vector space model). Pembobotan yang didasarkan pada term dengan teknik stemming untuk mendapatkan bentuk kata dasar dari term yang bersangkutan. Penelitian ini akan menguji aplikasi mesin klasifikasi teks bahasa Indonesia yang mengunakan algoritma stemming Nazief Adriani, algoritma K-Nearest Neighbor dan metode Vector Space Model berdasarkan pembobotan frekuensi kata berbanding logaritma jumlah kata serta fungsi cosine. Dengan penelitian ini dapat disimpulkan bahwa proses pengkategorian dokumen teks berbahasa Indonesia yang dilakukan melalui perbandingan antara dokumen uji dengan koleksi sampel pengujian mendapatkan hasil yang sesuai dengan kategori yang telah ditentukan setelah diuji dan juga telah dilakukan pengukuran precision dan recall untuk mengetahui efektifitas proses klasifikasi.

Authors and Affiliations

Krisna Adiyarta, Yohana Yohana

Keywords

Related Articles

Desain Aplikasi Pembelajaran Tarian Legu Salai Berbasis Android

Negara Indonesia memiliki keragaman budaya tari-tarian yang perlu dilestarikan. Tarian Legu Salai berasal dari Halmahera Barat dan merupakan tarian perayaan kegembiraan masyarakat saat panen padi. Penelitian ini membahas...

Perancangan Sistem Klasifikasi Tingkat Hipertensi Manusia dengan Metode Logika Fuzzy

Hipertensi atau sering dikenal dengan tekanan darah tinggi merupakan salah satu penyakit yang muncul secara diam-diam. Sulit untuk mengetahui seseorang terkena hipertensi, tanpa mengukur tekanan darah. Banyak pula mengan...

Penentuan Attribute Value Untuk Menentukan Bobot Fraud Dalam Transaksi Online

Fraud atau penipuan sering terjadi dalam transaksi online. Beberapa penelitian sebelumnya telah mengusulkan metode deteksi fraud dalam transaksi online. Namun dalam penentuan beberapa attribute value ditentukan oleh paka...

Pembuatan Sistem Pendeteksi Kemiripan Pengajuan Topic Skripsi Menggunakan Metode Rabin - Karp

Pesatnya perkembangan teknologi menyebabkan semakin banyaknya informasi yang tersedia, hal tersebut dapat mempermudah seseorang dalam melakukan penjiblakan suatu karya tulis. Perkembangan computer yang meluas dan peran c...

Analisis Pengklasifikasian Dokumen dengan Pembobotan Frekuensi Kata Berbanding Logaritma Jumlah Kata Serta Fungsi Cosine

Dokumen merupakan suatu kumpulan data yang berguna sebagai referensi dalam penulisan suatu karya tulis ilmiah maupun non ilmiah yang dapat dimanfaatkan sebagai referensi tulisan. Dengan dukungan referensi yang tepat maka...

Download PDF file
  • EP ID EP50780
  • DOI http://dx.doi.org/10.30700/pss.v1i1.394
  • Views 191
  • Downloads 0

How To Cite

Krisna Adiyarta, Yohana Yohana (2018). Analisis Pengklasifikasian Dokumen dengan Pembobotan Frekuensi Kata Berbanding Logaritma Jumlah Kata Serta Fungsi Cosine. SENSITEK, 1(1), -. https://europub.co.uk/articles/-A-50780