ABSTRAKSI: Data merupakan salah satu sumber yang digunakan untuk memperoleh suatu informasi. Namun tidak semua data dapat dimanfaatkan dengan baik. Jika data tersebut memiliki struktur yang kompleks, tentu saja akan sulit dimengerti. Sebagai contoh struktur data yang kompleks yaitu microarray yang digunakan pada Tugas Akhir ini. Data tersebut memiliki struktur dimensi yang besar dan multi-label sehingga akan sulit dipahami. Oleh karena itu diperlukan suatu proses feature selection yang bertujuan memperkecil ukuran data namun tetap menghasilkan nilai accuracy yang baik dan tidak terlalu besar jika terdapat penurunan terhadap nilai accuracy pada klasifikasi data.
Pada Tugas Akhir ini dilakukan perbandingan metode feature selection yaitu Max-Relevance dengan menggunakan beberapa attribute evaluator antara lain GainRatioAttributeEval, InfoGainAttributeEval, Mutual Information, dan SymmetricalUncertAttributeEval. Metode - metode feature selection tersebut diterapkan secara filtering. Proses klasifikasi data menggunakan bantuan tools weka, teknik klasifikasi yang digunakan ialah Naïve Bayes, dimana teknik ini memperhitungkan jumlah kemunculan data. Dengan melakukan analisis perbandingan terhadap metode feature selection maka dapat diketahui metode feature selection mana yang lebih handal dalam menangani data yang memiliki dimensi yang besar khususnya data microarray. Pengukur evaluasi yang dibandingkan ialah hasil proses klasifikasi yaitu accuracy.Kata Kunci : microarray, feature selection, klasifikasi, naïve bayes, accuracyABSTRACT: Data is one of resources which used for gathering information. However, not all data working good. If the data have a complex structure, it is hard to understand. For Example, microarray which used in this final project. This data have a large dimension structure and multi-label which make it complicated. Therefore, we need feature selection process which is decreasing the data size in spite of resulting a well and sufficient accurate value if there is any accuration declining of data clasiffication.
In this final project, comparison of methods feature selection is Max-Relevance by using some attribute evaluator such as GainRatioAttributeEval, InfoGainAttributeEval, Mutual Information, and SymmetricalUncertAttributeEval. Those methods applied by filtering. Process data classification using tools weka, classification technique used is Naïve Bayes, which counting data appearation ammount. By doing comparison analysis to knowable methods we know which feature selection methods more reliable in handling data with big dimension specially microarray data. Measuring evaluation which compared to is the result of classification process, accuracy.Keyword: microarray, feature selection, classification, naïve bayes, accuracy