ABSTRAKSI: Proses pencarian pada umumnya menggunakan query yang singkat dan tidak ada penjelasan rinci mengenai query. Selain itu terdapat kemungkinan query yang diinputkan memiliki keambiguitas, sehingga menyebabkan hasil pencarian menjadi tidak sesuai dengan yang diharapkan. Maka diperlukan teknik untuk meningkatkan proses pencarian, salah satunya dengan query expansion.
Pada tugas akhir ini diterapkan proses concept based query expansion dengan melakukan analisis terhadap query log untuk mencari hubungan antar term melalui proses association rules. Seluruh data inputan user terhadap mesin pencarian disimpan dan diolah kembali dengan menganalogikan terhadap market based analysis dengan user session sebagai id dan query inputan sebagai item set. Selanjutnya dengan algoritma apriori dihitung association rules yang terkait dan dibentuk graf yang merepresentasikan hubungan antar term. Setelah itu dengan melihat konsep yang terbentuk system menawarkan kepada user untuk melakukan expansi dengan term berupa konsep yang terbentuk tersebut.
Dari hasil pengujian yang dilakukan, terdapat peningkatan performansi pencarian dengan meningkatnya nilai precision atau recall. Peningkatan precision terjadi pada expansion dengan pemilihan konsep spesifikasi dan peningkatan recall terjadi pada expansion dengan pemilihan konsep sinonim. Maka performansi dari query expansion tidak lepas dari tujuan user dan kontribusi user dalam pencarian.
Kata Kunci : concept based query expansion, query log, association rulesABSTRACT: Search process in general is using a short and undetailed query, therefore there is a possibility that ambiguous query is entered to the searching system, causing poor result in the end. The solution to this problem is to reformulate the query, such as query expansion.
In this final project, i use one of the data mining concept, the association rules as the method to get the concept of the query expansion process. First of all, the data retrieved from the past activity is collected and processed so we can identified the pattern as market based analysis model. Next, using apriori algorithm the data is now represented as rules representing how good is the relation between two terms. Then, after mapping the rules to graph, the concept is now can be collected and we can continue processing the expansion process using that concept.
As the results, there is an enchancement to the searching prosess seen from the precision and recall increase. Precision increase happened at the spesification concept of the expansion while recall incease happened at the synonim concept. Therefore the query expansion performance cannot be separated with the goal of the searching process itself.
Keyword: concept based query expansion, query log, association rules