ABSTRAKSI: Data mining merupakan suatu proses ekstraksi informasi yang berguna dari sekumpulan data yang terdapat secara implisit dalam suatu basis data. Metode untuk melakukan ekstrasi informasi tersebut salah satunya adalah klasifikasi. Tujuan klasifikasi adalah untuk menganalisa data input dan membuat model yang akurat untuk setiap kelasnya berdasarkan data yang ada. Model kelas tersebut juga digunakan untuk mengklasifikasikan data tes lain. Jaringan Syaraf Tiruan (JST) merupakan salah satu algoritma yang digunakan untuk melakukan klasifikasi. Kelebihan dari JST yaitu memiliki aturan pelatihan (training rule) untuk menemukan bobot-bobot koneksi berdasarkan data latih dalam pembelajaran (learning) mengenali pola. Sehingga, JST akan dapat mengenali pola dengan akurasi tinggi jika sudah melakukan proses pembelajaran dan memiliki arsitektur yang optimal. Dalam mencari arsitektur yang optimal pada JST bukanlah hal yang mudah. Sehingga diperlukan algoritma optimasi agar dapat memperoleh arsitektur yang optimal. Pada tugas akhir ini digunakan Evolution Strategies (ES) yang merupakan algoritma optimasi berbasis evolusi. Pada tugas akhir ini digunakan dua buah data set, yaitu : data Pima Indians Diabetes dan Breast Cancer. Data-data dibagi menjadi tiga bagian menjadi data training, data validation dan data testing. Dengan gabungan metode JST dan ES dapat menghasilkan suatu sistem klasifikasi yang akurat khususnya pada saat testing dengan diperoleh fungsi fitness 81,2834 % untuk data Pima Indians Diabetes dan 98,2456 % untuk data Breast Cancer.
Kata Kunci : Data Mining, Klasifikasi, Jaringan Syaraf Tiruan, Evolution StrategiesABSTRACT: Data mining is a process of extracting useful information from data sets implicitly contained within the database. Method for extraction of such information is one of classification. The purpose of classification is to analyze the input data and create accurate models for each class based on existing data. Class model is also used to classify the data of other tests. Artificial Neural Network (ANN) is one of the algorithms used to perform classification. The advantages of ANN is a training rule to find the connection weights based on training data in learning (learning) to recognize patterns. Thus, the ANN will be able to recognize patterns with high accuracy if it is doing the learning process and have the optimal architecture. In searching for the optimal architecture of ANN is not easy. So that is needed for the optimization algorithm to obtain an optimal architecture. In this final use Evolution Strategies (ES) which is the evolution-based optimization algorithm. In this thesis used two data sets, namely: data Pima Indians Diabetes and Breast Cancer. The data is divided into three sections into training data, data validation and testing data. With the combination of ANN and ES method can yield an accurate classification system, especially at the time of testing with the fitness function obtained 81.2834% for Pima Indians Diabetes data and 98.2456% for Breast Cancer data.
Keyword: Data Mining, Classification, Artificial Neural Networks, Evolution Strategies