ABSTRAKSI: Berkembangnya situs penyedia berita Indonesia yang menyediakan fasilitas Really Simple Syndication (RSS) membuat headline berita mudah dicari. Namun timbul permasalahan bagaimana mencari berita yang sesuai dengan keinginan pembaca dengan cara yang mudah. Berdasarkan hal tersebut, search engine berperan penting dalam pencarian informasi yang sesuai. Dimana search engine yang dibuat memanfaatkan teknologi RSS dan pengelompokkan hasil pencarian secara otomatis.
Penggunaan file berformat Extensible Markup Language (XML) untuk pertukaran data pada RSS memudahkan dalam pemilahan informasi. Dari hasil pemilahan tersebut, setiap headline berita dikelompokkan berdasarkan kedekatannya dengan algoritma Bi Section K Means dan K Means.
Dengan mengimplentasikan RSS dan XML search engine bisa memperbarui data setiap hari. Sedangkan dari hasil pengelompokkan dapat disimpulkan bahwa algoritma Bi section k means memiliki kualitas lebih baik dibandingkan dengan algoritma k means dilihat dari nilai Sum Squad Error (SSE) dan Sum of Squares Between group (SSB).
Kata Kunci : klustering, bi section k means, XML, RSS 2.0ABSTRACT: Indonesian news website ,which is facilitating Really Simple Syndication (RSS), make news headline easy to find. But the problem is how to find news which is appropriate as what reader want in easy way. Based on that problem, search engine using RSS technology and automatic clustering from the output has important role to find suitable information.
RSS using XML for its format to share data makes information easy to separate. From this separation, every news headline is clustered based on their proximity with Bi Section K Means and K Means algorithm.
With implementing RSS and XML, Search engine can update data every day. Beside that, from the output of clustering, the value of Sum Squad Error (SSE) and the value of Sum of Squares Between group (SSB) it can be concluded that Bi Section K Means algorithm have better quality than K Means algorithm.
Keyword: clustering, bi section k means, XML, RSS 2.0