ABSTRAKSI: Akhir-akhir ini, recommender system telah mendapat banyak perhatian karena kemampuannya untuk mengurangi informasi yang terlalu berlebihan dan meningkatkan kepuasan pengguna. Pada kebanyakan recommender system, metode yang digunakan adalah Collaborative Filtering atau Content-based untuk memprediksi item baru sesuai dengan keinginan user. Selain itu, banyak pula digunakan pendekatan yang menggabungkan keduanya yang bertujuan untuk mengatasi kekurangan pada kedua metode sebelumnya yang biasa disebut dengan hybrid recommender system, salah satu contohnya adalah Content-Boosted Collaborative Filtering (CBCF).
Tugas Akhir ini mengimplementasikan dan menganalisis Clustered Pearson Predictor (CPP) yang menggunakan algoritma K-Means Clustering pada Content- Boosted Collaborative Filtering (CBCF) yang merupakan recommender system yang menggabungkan antara content based filtering dengan collaborative filtering. Penerapan algoritma K-Means pada Collaborative Filtering di Content-Boosted Collaborative Filtering bertujuan untuk mencapai scalability dengan cara mengelompokkan user-user ke dalam cluster, sehingga jumlah keseluruhan data set menjadi lebih kecil. Parameter yang digunakan dalam analisis adalah jumlah cluster, jumlah neighborhood, serta sparsity rate (missing rate).
Hasil pengujian menunjukkan bahwa semakin banyak jumlah neighborhood, maka akurasi prediksi yang dihasilkan semakin menurun. Performansi terbaik terjadi pada saat cluster yang digunakan adalah nilai optimal cluster tersebut. Hasil rekomendasi pada metode CPP CBCF pada recommender system menunjukkan kesesuaian antara genre item hasil rekomendasi dengan genre item yang telah diberi rating oleh active user.Kata Kunci : recommender system, collaborative filtering, content based, content-based collaborative filtering, K-Means clusteringABSTRACT: Recently, recommender system has been gaining attention because its ability to reduce overload information and increase customer satisfaction. In recommender system, metode that mostly used is collaborative filtering or content based to predict new item based on user preference. Beside that, new method that combine two previous methods also widely used to solve the disadvantages of them that is called hybrid recommender system, one of the examples is Content-Boosted Collaborative Filtering (CBCF).
This final project implements and analyzes Clustered Pearson Predictor using K-Means algorithm in Content-Boosted Collaborative Filtering (CBCF) that combines content based filtering and collaborative filtering. The purpose of K-Means algorithm implementation in Content-Boosted Collaborative Filtering is to achieve scalability by clustering users, so that the entire data set has been reduced to a much smaller number of data. The parameters that used in testing are the number of clusters, the number of neighborhood, and sparsity rate (missing rate).
The results of testing showed that the increasing of neighborhood’s number will make the accuracy of prediction decrease. The best performance happened when using optimal value for cluster. Recommendations result using CPP CBCF method in recommender system shows the compatibility between the item genre from result of recommendation with item genre that has been rated by active user.Keyword: recommender system, collaborative filtering, content based, content-based collaborative filtering, K-Means clustering