ABSTRAKSI: Salah satu task data mining yang paling banyak digunakan adalah task klasifikasi. Genetic Algorithms(GAs) digunakan dalam pencarian rules IF THEN. Klasifikasi merupakan suatu proses untuk menemukan sekumpulan model(fungsi) yang menggambarkan dan membedakan klas-klas atau konsep data yang bertujuan untuk memudahkan penggunaan model dalam memprediksi klas-klas objek, dimana label-label klas tidak diketahui sebelumnya. Proses-proses yang akan dilakukan sebelum sistem menghasilkan Rules tujuan adalah tehnik missing value dengan menggunakan tehnik bayessian sederhana, sedangkan preprocessing diskritisasi menggunakan tehnik Entrophy-based, kemudian tehnik pencarian Rules dengan Genetic Algirthms(GAs). Tehnik GA memiliki pengkodean kromosom yang bersifat fleksibel terhadap data, dimana masing-masing kromosom bersesuaian terhadap classification rules. Walaupun panjang kromosom adalah konstan, tetapi Rules yang dihasilkan adalah variabel.
Operator-oprator GAs yang digunakan adalah Pindah silang, Mutasi khusus, dan metode tournament selection. Algoritma GAs akan mengevaluasi ril dataset.Kata Kunci : Data Mining, Knowledge Discovery in Database Processes, Klasifikasi, genetic algorithms, diskritisasi, missing value, mutasi, pindah silang, tournament selection.ABSTRACT: One most of data mining technique is task classification. Genetc Algorithms(GAs) is used in discovery Rules IF THEN. Classification is the process of finding set of model(or function) that describe and distinguish data classes and concept, for the purpose of being able to use the model to predict the class of objects whose label is unknown. The main rules will be achieve after do many processes such as missing value technique with simple bayessian, preprocessing using enthropy-based descretization, and finally Genetic Algorithms used to discovery the rules. The porposed GAs has a flexible chromosome encoding where each chromosome corresponds to a classification rule. Although the number of genes is fixed, the number of rules conditions is variable.
The operators of GAs that used such as crossover, specific mutation, and tournament selections. The algoritma evaluated on five public domain, real world dataset.Keyword: Data Mining, Knowledge Discovery in Database Processes, classification, genetic algorithms, enthropy-based descretization, missing value, muation, crossover, tournament selection