Informasi Umum

Kode

113071070

Klasifikasi

005.1 - Computer programming

Jenis

Karya Ilmiah - Skripsi (S1) - Reference

Subjek

Rekayasa Perangkat Lunak

Informasi Lainnya

Abstraksi

ABSTRAKSI: Web crawler merupakan salah satu komponen search engine yang berperan penting dalam melakukan penelusuran web. Berbeda dengan crawler biasa, focused crawler berusaha menjaring web yang sesuai dengan topik dengan melibatkan classifier di dalamnya. Dari beberapa crawling strategy, algoritma fish search memiliki keunggulan dalam hal akurasi. Jika proses pencarian web dianalogikan ke dalam sebuah graph, algoritma fish search bekerja dengan terlebih dahulu mengecek relevansi node awal dengan topik, kemudian dilanjutkan menelusuri node anak. Pengujian dilakukan untuk mengetahui performansi berupa akurasi, presisi, dan waktu proses. Skenario uji yang dilakukan diantaranya dengan membandingkan URL yang terjaring antara focused crawler dengan crawler biasa, mengubah komposisi dataset training, penggunaan pre-pocessing, penambahan jumlah dataset training, serta mengubah nilai depth. Dan diperoleh hasil bahwa focused crawler lebih baik dalam menjaring URL yang sesuai dengan topic, diperoleh komposisi dataset training terbaik untuk masing-masing pengujian, pre-processing meningkatkan akurasi, dan penambahan depth berbanding lurus dengan kenaikan akurasi.Kata Kunci : Focused Crawler, Fish Search, dataset training.ABSTRACT: Web crawlers are one of the components search engines, which are instrumental in doing a web search.. Unlike the usual crawler, focused crawler trying to capture the web that match the topics involving classifier in it. Of some crawling strategy, fish search algorithm has advantages in terms of accuracy. If the process is analogous to a web search in a graph, fish search algorithm works by first checking the initial node relevance to the topic, followed by child node. Tests conducted to determine the performance in the form of accuracy , precision , and processing time . Scenarios such tests conducted by comparing the URL that netted between focused crawler with ordinary crawler , changing the composition of the training dataset , the use of pre - pocessing , increasing the number of training dataset , and change the value of depth . And obtained results that focused crawler better in attracting the appropriate URL to the topic , the best of training dataset obtained by composition for each test , pre - processing increases the accuracy , and the addition of depth is directly proportional to the increase in accuracy .Keyword: Focused Crawler, Fish Search, training dataset.

Koleksi & Sirkulasi

Tersedia 1 dari total 1 Koleksi

Anda harus log in untuk mengakses flippingbook

Pengarang

Nama Dini Mardiana Sunarya
Jenis Perorangan
Penyunting Yanuar Firdaus A.W., Arie Ardiyanti Suryani
Penerjemah

Penerbit

Nama Universitas Telkom
Kota Bandung
Tahun 2014

Sirkulasi

Harga sewa IDR 0,00
Denda harian IDR 0,00
Jenis Non-Sirkulasi