ABSTRAKSI: Dengan meningkatnya jumlah dokumen yang banyak maka menimbulkan permasalahan untuk bagaimana melakukan proses indexing yang efisien. Kebanyakan index yang ada bersifat statis yang artinya hanya bisa melakukan indexing ketika tersedia banyaknya dokumen yang jumlahnya tetap. Tapi masalah yang muncul adalah ketika ada dokumen lain yang datang setelah index itu dibuat, jika menggunakan indexing yang bersifat statis maka akan dilakukan indexing ulang seluruh corpus beserta dokumen baru tersebut. Hal ini sangat tidak praktis jika jumlah dokumen telah mencapai ratusan ribu dokumen
Salah satu cara untuk menyelesaikan permasalahan ini adalah dengan menggunakan algoritma incremental update pada suatu index, sehingga ketika ada dokumen baru yang datang maka akan dilakukan indexing pada dokumen baru tersebut dan hasil indexing nya akan digabungkan dengan index yang lama. Hal ini diperlukan untuk mencapai efisiensi baik dalam perfomansi maupun mempersingkat waktu yang dihabiskan dalam pembuatan index itu.
Hasil akhir yang didapat adalah suatu index yang membesar dengan sendirinya akibat dari penggabungan beberapa index.Kata Kunci : information retrieval, incremental update, inverted listsABSTRACT: With the proliferation of many documents available in computers hence created a problem of how to do indexing properly. Most index that are existed behave more like a static one, meaning it can only index a fix sum of documents. But the problem arises when there are new documents that arrive, if we happen to use the indexing process that's static in nature then we would have to index the whole corpus all over again with the addition of those new documents. This method is impractical and not to mention redundant if the sum of documents already reaches the total of hundreds thousand of documents.
One of the way to solve this problem is to use incremental update algorithm towards an index, and inherently will done an indexing process towards new incoming documents only and the resulting index will be merge with the old one. This is necessary to achieve practicality in performance measuring and also to shortened the time it takes to build the index.
The end result that we have is an index that's grows exponentially with the total addition of new documents that arrives due to the merging process of those indexes.Keyword: information retrieval, incremental update, inverted lists