ABSTRAKSI: Missing value merupakan salah satu masalah yang sering dihadapi dalam machine learning yang merupakan hilangnya suatu informasi dari data karena alasan-alasan tertentu. Missing value dalam jumlah kecil tidak terlalu berpengaruh terhadap data, tetapi jika jumlahnya sudah cukup besar, maka dapat mengurangi akurasi informasi data. Oleh karena itu dibutuhkan suatu metode untuk mengisikan nilai missing value yang mendekati nilai sebenarnya yang disebut dengan metode imputasi. Salah satu metode imputasi yang diterapkan dalam Tugas Akhir ini adalah metode Collateral Missing Value Estimation (CMVE).
Metode ini menerapkan prinsip multiple imputation yaitu dengan estimasi dari beberapa nilai yang mungkin. Nilai estimasi dihitung dengan menggunakan Least Square Regression dan Non-Negative Least Square. Kemudian nilai hasil imputasi dari dua cara tersebut diberikan bobot kombinasi yang totalnya sama dengan satu sebagai nilai estimasi akhir. Evaluasi performansi pada sistem imputasi ini menggunakan Normalized Root Measn Square Error (NRMSE). Selain itu dilakukan juga evaluasi performansi dengan mengujikannya pada proses klasifikasi dengan parameter precision, recall, f-measure. Berdasarkan hasil pengujian metode CMVE ini mampu menghasilkan nilai imputasi yang cukup mendekati nilai sebenarnya.
Kata Kunci : imputasi, missing value, Collateral Missing Value Estimation (CMVE)ABSTRACT: Missing value is one of most common problem in machine learning which is the missing information from data for specific reasons. Missing value in small quantities does not significantly affect the data, but in a large quantities it can reduce the accuracy of data. Therefore it is necessary to fill in missing value approach to the real value,was called the imputation method. One of the imputation method that being adopted in this Final Project is Collateral Missing Value Estimation method(CMVE).
This method applies the principle of multiple imputation to estimate the possible values. The estimated value is calculated using Least Square Regression and Non-Negative Least Square. Then the value were given by combining that two method with weight equal to one as final estimated value. Normalized Root Mean Square Error (NRMSE) was used as the evaluation performance of this imputation system. Precision, recall, dan f-measure were used to evaluated the performance in classification. Based on the test CMVE method is able to generate imputation value approach to the real value.Keyword: imputation, missing value, Collateral Missing Value Estimation (CMVE)