ABSTRAKSI: Data yang akan diolah untuk keperluan mencari informasi tertentu terkadang tidak semuanya relevan. Terdapat beberapa feature yang irrelevan maupun redundan. Feature-feature tersebut perlu ditangani. Salah satu cara menanganinya adalah dengan cara feature selection. Feature selection yaitu proses mengurangi dimensi dengan menghapus feature-feature yang tidak relevan. Pada tugas akhir ini dilakukan feature selection menggunakan fuzzy clustering yaitu fuzzy c-means dengan pendekatan wrapper. Tujuan dari feature selection ini adalah struktur dari subset feature memiliki kemiripan yang hampir sama dengan struktur dari data asli yang dilihat dari cluster-cluster yang terbentuk oleh subset feature dan data asli. Kemiripan tersebut dapat dilihat dengan classification error rate, dimana semakin kecil nilainya maka semakin mirip struktur subset feature dengan data asli. Metode ini mampu memilih subset feature yang memiliki kesamaan struktur dengan dataset asli. Bahkan classification error rate dataset subset feature tidak meningkat bahkan berkurang jika subset feature yang terpilih adalah relevan.
Kata Kunci : feature selection, Fuzzy C-Means, wrapper feature selection, subset featureABSTRACT: In order to search some certain information, we don't always get all relevant data, there are some irrelevant and redundant features. This matter should be fix properly by using feature selection. Feature selection is a reducing process of dimension by deleting some irrelevant features. This final project will provide a research explanation of making feature selection using fuzzy clustering, that is fuzzy c-means, by using wrapper approach. The structure of the feature subset is identical to the real data structure from the cluster that made by feature subset and real data. This identical structure can be known from classification error rate, the smaller the value, more identical the feature from the real data. This method can selectively choose the feature subset that have identical structure with the real data set. Even the classification error rate of data set feature subset will decrease if the chosen feature subset is relevant.
Keyword: feature selection, Fuzzy C-Means, wrapper feature selection, subset feature