ABSTRAKSI: Seiring dengan perkembangan teknologi, penggunaan sistem komputerisasi dalam berbagai bidang baik itu dalam transaksi-transaksi bisnis, maupun untuk kalangan pemerintah dan sosial, telah menghasilkan data yang berukuran sangat besar. Untuk itu, diperlukan suatu cara dalam mereduksi data tanpa menghilangkan informasi penting yang terkandung didalamnya, dengan masalah utama yang terjadi adalah tingginya dimensi dari data itu sendiri. Oleh karena itu, harus dilakukan pemilihan terhadap beberapa atribut yang memiliki berpengaruh besar diantara atribut lain yaitu feature selection.
Feature selection memiliki kemampuan mengurangi dimensionalitas suatu data sehingga dapat meningkatkan efektivitas dari classifier. Ada beberapa pendekatan sebagai teknik dari implementasi feature selection. Pada penelitian kali ini, akan digunakan metode pencarian dalam keilmuan artificial intelligence yaitu simulated annealing dengan mengembangkan ukuran entropi, berdasarkan pendekatan information gain yang digunakan ID3 untuk membangun pohon.
Pada penelitian sebelumnya menggunakan macam-macam metode yaitu KBANN, BACKPROP, PEBLS, PERCEPTRON, ID3, COBWEB, dan Near. Neighbor dengan dataset yang sama. Kemudian akan dibandingan hasil pada tugas akhir ini, dilakukan feature selection dalam pemilihan atribut yang paling berpengaruh dengan menggunakan metode pencarian simulated annealing. Setelah atribut terpilih maka akan terbentuk pola aturan klasifikasi dari data training yang akan diterapkan pada data testing. Sehingga akan menghasilkan akurasi klasifikasi beserta atribut yang terpilih, semakin besar akurasi yang dihasilkan maka akan merepresentasikan atribut yang berpengaruh.Kata Kunci : feature selection, artificial intelligence, simulated annealingABSTRACT: Along with technological development, the use of computerized systems in various fields be it in business transactions, as well as for government and social circles, has produced data that are very large. For that, we need a way of reducing the data without losing important information contained in it, with the main problem that occurs is the high dimension of the data itself. Therefore, the selection must be done against some of the attributes that have great influence among other attributes of feature selection.
Feature selection has the ability to reduce the dimensionality of a data so that it can increase the effectiveness of the classifier. There are several approaches for feature selection techniques of implementation. In the present study, to be used in searching the scientific method, namely simulated annealing artificial intelligence to develop the entropic measure, based on information gain approach used ID3 to construct the tree.
In a previous study using a variety of methods that KBANN, BACKPROP, PEBLS, PERCEPTRON, ID3, COBWEB, and Near. Neighbor with the same dataset. Then be compared to the results in this thesis, carried out feature selection in the selection of the most influential attributes by using the simulated annealing search method. After the selected attributes will be formed pattern classification rules from training data that will be applied to the data testing. So will result in the classification accuracy and its attributes are selected, the greater the resulting accuracy will represent the influential attributes.Keyword: feature selection, artificial intelligence, simulated annealing