Data Mining adalah kegiatan pengumpulan data, pemakaian data historis, untuk menemukan keteraturan pola dalam dataset yang berukuran besar dan mempunyai jumlah yang banyak. Dalam data mining terdapat data yang berbeda dari data pada umumnya yang disebut outlier. Outlier sendiri berkaitan dengan nilai ekstrem, baik ekstrem besar maupun kecil. Adanya data outlier membuat analisis terhadap serangkaian data menjadi bias, atau tidak mencerminkan fenomena yang sebenarnya. Outlier detection digunakan untuk mendeteksi ada atau tidaknya outlier dalam sebuah data. Outlier Detection dapat digunakan untuk mendeteksi data berupa categorical, numeric, maupun data teks.Principal Component Analysis (PCA) merupakan salah satu metode pendeteksian outlier berdasarkan pendekatan statistical. Objek yang dianggap sebagai outlier adalah objek yang memiliki probabilitas yang rendah sehubungan dengan model distribusi probabilitas pada data tersebut. Evaluasi yang digunakan untuk mengetahui performansi sistem yaitu : accuracy, precision, dan recall.