Abstrak
Kanker merupakan salah satu penyebab kematian manusia terbanyak di dunia. Diperkirakan penderita
kanker terus meningkat setiap tahunnya. Kanker yang dapat terdeteksi lebih dini memiliki probabilitas
lebih tinggi untuk mendapatkan penanganan yang lebih cepat dan tepat. Salah satu caranya dengan
menggunakan teknologi Microarray. Teknologi Microarray dapat menganalisis ribuan profil gene
expression dalam waktu yang bersamaan. Dengan melakukan analisa terhadap data Microarray
selanjutnya dapat diketahui apakah seseorang terkena kanker atau tidak. Namun, permasalahan dalam
data Microarray adalah jumlah atribut yang jauh lebih banyak dibandingkan sampel sehingga perlu
dilakukannya reduksi dimensi. Untuk mengatasi hal tersebut, penulis menggunakan salah satu teknik
reduksi dimensi yaitu Principal Component Analysis (PCA) dan menggunakan 2 metode klasifikasi yaitu
Naïve Bayes dan Support Vector Machine (SVM), yang selanjutnya akan dibandingkan dan dianalisa hasil
performansi dari kedua metode tersebut untuk mencari mana yang lebih baik. Akurasi dari hasil penelitian
ini menunjukkan 4 dari 5 data kanker mendapatkan akurasi sebesar 77-96% sedangkan 1 data lainnya
yaitu data breast cancer mendapatkan akurasi terkecil yaitu 54.6%.
Kata kunci : Kanker, Microarray, Reduksi Dimensi, Principal Component Analysis (PCA), Naïve Bayes,
Support Vector Machine (SVM)