Abstrak
Perkembangan android semakin pesat, sehingga mendorong pertumbuhan malware android. Data malware android memiliki dimensi tinggi, dibutuhkan algoritme untuk melakukan deteksi. Support Vector Machine (SVM) adalah algoritme pembelajaran mesin yang cocok untuk data malware android. Namun SVM memiliki keterbatasan dari segi waktu komputasi untuk data dalam jumlah besar, karena membutuhkan solusi dari masalah pengoptimalan Quadratic Programming (QP). Penelitian ini mengusulkan Parallel Support Vector Machine (PSVM) dengan metode dekomposisi Sequential Minimal Optimization (SMO) untuk melakukan deteksi atau klasifikasi malware android menggunakan dataset DREBIN. algoritme SMO yang dijamin memecahkan QP, dengan menggunakan teknik dekomposisi yaitu mendistribusikan tugas ke beberapa prosesor untuk dieksekusi secara paralel. Evaluasi berdasarkan kinerja perbandingan model Parallel SVM-SMO 4 dekomposisi dan Non-Parallel SVM-SMO dengan analisis fitur menggunakan Correlation Coefficient. Pada pengujian metrik performa dan akurasi fitur paling optimal 14 fitur dengan rata-rata akurasi 78%. Pada pengujian kinerja model, fitur paling optimal 27 fitur dengan rata-rata percepatan 9.58 dan efisiensi 2.39 pada kernel linier.
Kata kunci : DREBIN, SVM, PSVM, SMO, Dekomposisi, Koefisien Korelasi.
Abstract
Android development is accelerating, fueling the rise of Android malware. Android malware data is highly dimensional and requires algorithms to detect it. Support Vector Machines (SVM) is a machine learning algorithm well suited for Android malware data. However, because SVM requires solving a quadratic programming (QP) optimization problem, it is limited in computation time for large datasets. In this study, we propose a Parallel Support Vector Machine (PSVM) with Sequential Minimal Optimization (SMO) decomposition method for detecting or classifying Android malware using the DREBIN dataset. The SMO algorithm is guaranteed to solve the QP using decomposition techniques. H. Tasks distributed across multiple processors running in parallel. Performance comparison of parallel SVM-SMO 4-decomposition model and non-parallel SVM-SMO and evaluation based on feature analysis using correlation coefficients. When testing performance metrics and function accuracy, 14 functions are the best with an average accuracy of 78%. When testing the performance of the model, the best feature is 27 features with an average acceleration of 9.58 and an efficiency of 2.39 on the linier kernel.
Keywords: DREBIN, SVM, PSVM, SMO, Decomposition, Correlation Coefficient.