Implementasi Index Compression Menggunakan Variable Byte Code

Adelino Thesaria

Informasi Dasar

ABSTRAKSI: Information Retrieval (IR) merupakan bagian dari computer science yang berhubungan dengan pengambilan informasi dari dokumen-dokumen yang didasarkan pada isi dan konteks dari dokumen-dokumen itu sendiri. Proses dalam Information Retrieval dapat digambarkan sebagai sebuah proses untuk mendapatkan relevant documents dari collection documents melalui pencarian query yang diinputkan user. Berbagai pendekatan untuk meningkatkan performansi Information Retrieval (IR) telah dilakukan. Salah satu cara untuk meningkatkan performansi tersebut adalah dengan kompresi indeks (index compression). Dua jenis teknik kompresi pada Information Retrieval System yaitu lossy compression dan lossless compression. Pada lossless compression semua informasi tetap terjaga, contohnya posting file compression.

Indeks merupakan bagian paling utama dalam Information Retrieval System. Tujuan menyimpan indeks adalah untuk mengoptimalkan kecepatan dan kinerja dalam menemukan dokumen yang relevan untuk permintaan pencarian. Tanpa indeks, mesin pencari akan memindai setiap dokumen, yang akan memerlukan banyak waktu dan daya komputasi. Namun, semakin banyaknya dokumen yang masuk semakin bertambah juga kapasitas indeks. Index Compression adalah teknik yang digunakan untuk lebih mengefisienkan indeks, baik dari kapasitas maupun performansi dari Information Retrieval System. Dengan mengkompresi indeks, dapat mengurangi kapasitas yang digunakan hingga 75%. Index Compression juga dapat meningkatkan kecepatan transfer dari disk ke memori.

Dalam tugas akhir ini, akan dilakukan implementasi Index Compression menggunakan Variable Byte Code. Variable byte code merupakan salah satu teknik dalam kompresi indeks yang diterapkan pada Information Retrieval guna mengurangi kapasitas disk yang terpakai dan pemakaian waktu pencarian yang lebih cepat. Oleh karena itu Diharapkan setelah menggunakan Index Compression menggunakan Variable Byte Code, kapasitas indeks akan berkurang dan performansi dari Information Retrieval System meningkat.Kata Kunci : Information Retrieval, Information Retrieval System, Index Compression, lossless compression, Variable Byte Code.ABSTRACT: Information Retrieval (IR) is part of computer science related to the retrieval of information from documents that are based on the content and context of the documents themselves. Processes in Information Retrieval can be described as a process to obtain relevant documents from the collection of documents through search queries entered by users. Various approaches to improve the performance of Information Retrieval (IR) has been performed. One way to improve performance is to compress the index (index compression). Two types of compression techniques on Information Retrieval System is lossy compression and lossless compression. In lossless compression of all information will be maintained, for example, posting the file compression.

Index is the most important part in the Information Retrieval System. The aim is to save the index to optimize the speed and performance in finding relevant documents for the search query. Without indexes, search engines will scan every document, which will require much time and computing power. However, a growing number of incoming documents also increases the capacity of the index. Index Compression is a technique used to minimize the index, both of capacity and performance of Information Retrieval System. By compressing the index, can reduce the capacity used up to 75%. Index Compression can also increase transfer speed from disk to memory.

In this thesis, will be implemented using Variable Compression Index Byte Code. Variable byte code is one of the techniques applied in the compression index on Information Retrieval in order to reduce the unused disk capacity and usage of a faster search time. Therefore it is expected that after using the Index Compression using Variable Byte Code, the capacity will be reduced and the performance index of the Information Retrieval System to increase.Keyword: Information Retrieval, Information Retrieval System, Index Compression, lossless compression, Variable Byte Code.


Rekayasa Perangkat Lunak


Implementasi Index Compression Menggunakan Variable Byte Code


Adelino Thesaria
Yanuar Firdaus A.W., Kusuma Ayu Laksitowening


Universitas Telkom




