Perbandingan Metode Web Scraping Menggunakan CSS Selector dan Xpath Selector
Journal Title: Teknika - Year 2017, Vol 6, Issue 1
Abstract
Pemanfaatan data atau berita yang tersebar di internet untuk meningkatkan peluang keberhasilan dalam sebuah usaha melalui analisa trend pasar adalah hal yang sangat umum pada saat ini. Penjelajahan Web (Crawl) dan ekstraksi data dari web (Scraping) menjadi salah satu hal yang penting, agar tidak terjadi data yang kurang sempurna, dan data yang diterima adalah data yang paling baru. CSS Selector dan Xpath merupakan salah satu metode yang umum digunakan dalam melakukan proses crawling. Terdapat perbedaan dari jumlah data yang terambil, besar file output dan waktu pemrosesan dari kedua metode tersebut, dimana Xpath memiliki keunggulan pada jumlah data yang terambil dan waktu pemrosesnya yang berakibat pada ukuran file output yang lebih besar. Sedangkan untuk penggunaan memori pada kedua metode pada proses crawling tidak memiliki perbedaan yang signifikan
Authors and Affiliations
Taufiq Rizaldi, Hermawan Arief
Peningkatan Kinerja Pencarian Dokumen Tugas Akhir Menggunakan Porter Stemmer Bahasa Indonesia dan Fungsi Peringkat Okapi BM25
Proses pencarian dokumen yang menggunakan information retrieval akan menerima query dan mengembalikan dokumen yang relevan dengan query pencarian tersebut. Relevansi diperhitungkan dari relevansi kata pada query dan kump...
Penggunaan Nilai dan Vektor Eigen Untuk Menentukan Prioritas Faktor-Faktor Penentu Pemilihan Tempat Makan (Restoran)
Dalam memilih tempat makan (restoran) banyak faktor yang harus dipertimbangkan, antara lain harga, rasa, kuantitas (porsi), dekor ruangan, jarak, kepemilikan (misal milik saudara atau teman), tempat parkir yang luas, dan...
Perancangan dan Pembuatan Aplikasi Permainan Nusantara Indonesia Berbasis Android
Game atau yang biasa disebut permainan merupakan aktivitas terstruktur atau semi terstruktur yang biasanya bertujuan untuk menghibur. Penulis mengembangkan suatu permainan berbasis android dengan judul "Nusantara Indones...
Penentuan Pembimbing Tugas Akhir Mahasiswa Jurusan Teknik Informatika Universitas Surabaya Dengan Metode Dice Coefficient
Tugas Akhir (TA) adalah sebuah karya ilmiah yang harus dibuat oleh mahasiswa jurusan Teknik Informatika, Universitas Surabaya sebagai salah satu syarat kelulusan. Dalam mengajukan topik TA, mahasiswa wajib membuat dan me...
Penerapan Metode Content Based Filtering Dalam Implementasi Sistem Rekomendasi Tanaman Pangan
Panjangnya rantai distribusi merupakan salah satu permasalahan pokok di sektor pangan yang berdampak pada mahalnya harga-harga pangan. Permasalahan ini sejalan dengan prioritas pembangunan Kabupaten Sleman tahun 2017 unt...