Analisis Pengklasifikasian Dokumen dengan Pembobotan Frekuensi Kata Berbanding Logaritma Jumlah Kata Serta Fungsi Cosine

Journal Title: SENSITEK - Year 2018, Vol 1, Issue 1

Abstract

Dokumen merupakan suatu kumpulan data yang berguna sebagai referensi dalam penulisan suatu karya tulis ilmiah maupun non ilmiah yang dapat dimanfaatkan sebagai referensi tulisan. Dengan dukungan referensi yang tepat maka suatu karya dapat dikatakan kredibel dan dapat dipercaya. Namun pertumbuhan yang pesat dari jumlah dokumen informasi maka diperlukan sebuah teknik pencarian yang tepat untuk dapat menemukan dokumen sesuai kebutuhan salah satunya dengan sistem temu kembali informasi (information retrieval system/IRS). Salah satu teknik IRS yang dapat digunakan untuk merepresentasikan profil dokumen adalah model ruang vektor (vector space model). Pembobotan yang didasarkan pada term dengan teknik stemming untuk mendapatkan bentuk kata dasar dari term yang bersangkutan. Penelitian ini akan menguji aplikasi mesin klasifikasi teks bahasa Indonesia yang mengunakan algoritma stemming Nazief Adriani, algoritma K-Nearest Neighbor dan metode Vector Space Model berdasarkan pembobotan frekuensi kata berbanding logaritma jumlah kata serta fungsi cosine. Dengan penelitian ini dapat disimpulkan bahwa proses pengkategorian dokumen teks berbahasa Indonesia yang dilakukan melalui perbandingan antara dokumen uji dengan koleksi sampel pengujian mendapatkan hasil yang sesuai dengan kategori yang telah ditentukan setelah diuji dan juga telah dilakukan pengukuran precision dan recall untuk mengetahui efektifitas proses klasifikasi.

Authors and Affiliations

Krisna Adiyarta, Yohana Yohana

Keywords

Related Articles

Klasifikasi SMS Spam Menggunakan Algoritma Support Vector Machine (SVM)

Informasi merupakan kumpulan data yang memiliki beragam konten yang dapat bersifat positif dan negative. Konten-konten yang tersebar dalam informasi tersebut dapat dengan mudah kita peroleh lewat berbagai macam jenis med...

Kriptografi Email menggunakan Algoritma Rivest Code 6 (Rc6) berbasis Java Pada PT. XYZ

Saat ini email merupakan alat komunikasi yang umum dipakai oleh banyak orang. Dengan email kita dapat begitu mudah bertukar pesan tanpa batasan jarak dan waktu. Secara umum email tidak menjamin kerahasiaan pesan yang dik...

Enterprise Architecture Planning Sistem Informasi Puskesmas Siantan Hilir

Teknologi Sistem Informasi yang berkembang semakin cepat dapat mempengaruhi perkembangan dari kegiatan usaha manusia salah satunya dalam bidang bisnis. Hal ini juga berdampak pada salah satu instansi pemerintah yang bert...

Rancang Bangun Sistem Keamanan Kendaraan Berbasis Internet Of Things Menggunakan Raspberry Pi

Modus pencurian kendaraan bermotor dari tahun ke tahun semakin beragam. Antisipasi yang dilakukan pemilik kendaraan dari tindak pencurian seperti memasang kunci stang, kunci unik, Secure Key Sutter, alarm motor dan gembo...

Analisis Sistem E-Commerce Pada Perusahaan Marketplace Mobile Shopee Indonesia

Penulisan dari paper ini memiliki tujuan untuk menganalisis mengenai system e-commerce pada aplikasi marketplace mobile yang ada di Indonesia yaitu Shopee. Analisis meliputi, kelebihan dan kekurangan dari Shopee Indonesi...

Download PDF file
  • EP ID EP50780
  • DOI http://dx.doi.org/10.30700/pss.v1i1.394
  • Views 190
  • Downloads 0

How To Cite

Krisna Adiyarta, Yohana Yohana (2018). Analisis Pengklasifikasian Dokumen dengan Pembobotan Frekuensi Kata Berbanding Logaritma Jumlah Kata Serta Fungsi Cosine. SENSITEK, 1(1), -. https://europub.co.uk/articles/-A-50780