ABSTRAKSI: Clustering adalah proses mengelompokkan objek ke dalam suatu kelompok (cluster) sehingga objek memiliki kemiripan sangat besar dengan objek lain yang berada pada cluster yang sama, tetapi memiliki ketidakmiripan yang besar dengan objek yang berada pada cluster berbeda.
Algoritma hierarchical clustering mengelompokkan objek dengan membuat suatu hirarki dimana objek yang mirip akan ditempatkan pada hirarki yang berdekatan dan objek yang tidak mirip akan ditempatkan pada hirarki yang berjauhan. Permasalahan timbul ketika algoritma hierarchical clustering yang sudah ada seperti CURE dan ROCK hanya memperhatikan informasi tentang closeness dan interconnectivity antar pasangan cluster yang akan dilakukan merge tanpa memperhatikan internal closeness dan internal interconnectivity di dalam masing-masing cluster tersebut. Selain itu dalam melakukan merging pasangan cluster, CURE hanya memperhatikan informasi closeness tanpa memperhatikan informasi interconnectivity dan ROCK hanya memperhatikan informasi interconnectivity tanpa memperhatikan informasi closeness diantara pasangan cluster tersebut. Hal ini dapat berakibat pada kesalahan pengambilan keputusan dalam melakukan merge pasangan cluster. Untuk mengatasi masalah tersebut, dalam Tugas Akhir ini akan diterapkan algoritma CHAMELEON yang melakukan klasterisasi dengan cara melakukan merge pasangan cluster dengan memperhatikan informasi tentang relative closeness dan relative interconnectivity dengan parameter nilai k (jumlah tetangga pada k-nearest neighbor), nlevel (jumlah level partisi), θRI (threshold RI), dan θRC (threshold RC).
Ditunjukkan dalam Tugas Akhir ini bahwa algoritma CHAMELEON menghasilkan kualitas cluster yang baik untuk nilai parameter nlevel yang lebih besar. Sedangkan untuk ketiga parameter lainnya, secara umum nilai optimal untuk ketiga parameter tersebut (k, θRI, dan θRC ) tidak dapat ditentukan secara pasti.Kata Kunci : clustering, chameleon, hierarchical clustering, relative closeness, relative interconnectivity, parameterABSTRACT: Clustering is the process of grouping objects into a group (cluster) so that the object has a very great similiarity with other objects that are on the same cluster, but has a great dissimiliarity with objects that are in different clusters.
Hierarchical clustering algorithms classify objects by creating a hierarchy where the object will be placed in a hierarchy similiar to the adjacent and similiar object will be placed on a distant hierarchy. Problem arise when hierarchical clustering algorithms that already exist such as CURE and ROCK considers only information about the closeness and interconnectivity without considers internal closeness and internal interconnectivity in these clusters. In addition to merging pairs in the cluster, CURE only pay attention to information regardless of the closeness and ROCK interconnectivity information only for the interconnectivity of information regardless of the closeness between the couple information clusters. This can result in the decision making errors inperforming the merge cluster pair. To overcome these problems, the final project will be implemented algorithms that perform clustering Chameleon with how to merge the cluster pair with respect to information about the relative closeness and relative interconnectivity with the parameter values of k (number of neighbors in k-nearest neighbor), nlevel (number of partition level), θRI (threshold RI), and θRC (threshold RC).
Indicated in this final project that Chameleon algorithm produce good quality clusters for parameter values greater nlevel. As for the three other parameters, in general optimal value for those parameters (k, θRI, and θRC) can not be determined exactly.Keyword: clustering, chameleon, hierarchical clustering, relative closeness, relative interconnectivity, parameter