Analisis dan Implementasi ECODB dalam Mendeteksi Class Outlier

Melia Ajani

Informasi Dasar

138 kali
113070199
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Deteksi outlier merupakan salah satu task penting dalam data mining, bertujuan untuk mencari data yang memiliki karakteristik berbeda dengan kebanyakan data lainnya. Dari banyak metode yang sudah ada, pencarian outlier tidak memerhatikan secara khusus pada class label dalam kasusnya. Hal tersebut mengakibatkan data yang seharusnya terdeteksi sebagai outlier dalam suatu label class dianggap sebagai data yang normal. Pada deteksi class outlier dengan algoritma ECODB, pencarian data yang menyimpang dari class-nya dapat ditemukan. Dari beberapa metode pendeteksi class outlier yang ada, seluruhnya belum mampu menangani dataset yang memiliki lebih dari dua label class dan dataset yang bertipe numerik atau mixed dataset, sedangkan algoritma ECODB sudah dapat menanganinya. Algoritma ECODB ini berbasiskan pendekatan jarak, dengan memperhitungkan nilai COF yang merepresentasikan derajat suatu data termasuk dalam class outlier atau bukan. Pengujian dilakukan dengan beberapa skenario untuk mengetahui nilai akurasi, error rate, dan FPR, pengaruh pertambahan jumlah data dan pertambahan jumlah top n class outlier terhadap waktu proses. ECODB dapat mendeteksi class outlier dengan tingkat akurasi yang baik, dengan hasil yang lebih baik pada dataset bertipe numerik. Waktu proses yang dibutuhkan oleh ECODB terus meningkat secara eksponensial seiring dengan pertambahan jumlah instances, sehingga kurang baik dalam menangani dataset berdimensi besar.Kata Kunci : ECODB, class outlier, distance based approach, deteksi outlier.ABSTRACT: Outlier detection is one of the importance task in data mining to find data that has different characteristic with another data. Many existing methods to find outlier not looking closely to the class label. This thing causes the data that should be detected as outlier in class label is considered as the normal one. In class outlier detection with ECODB algorithm, data searching that deviates from its class can be found. From the existing outlier detection methods, all of them haven’t been able to handle dataset that has more than two class labels dan numeric dataset or mixed dataset, while ECODB algorithm can handle it. This ECODB algorithm is based on distance approach, by calculating COF that represents the degree of the data that categorized as class outlier or not. The testing is done with some scenarios to know the system’s accuracy, error rate, and its FPR and also how the addition of dataset number and top n class outlier number influence the process time. ECODB can detect class outlier with better accuracy, and better result in numeric dataset. The ECODB’s process time keeps increasing exponentially if we keep adding the instances number, so that it perfoms worse to handle high dimention dataset.Keyword: ECODB, class outlier, distance based approach, outlier detection.

Subjek

Rekayasa Perangkat Lunak
 

Katalog

Analisis dan Implementasi ECODB dalam Mendeteksi Class Outlier
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Melia Ajani
Perorangan
Kemas Rahmat Saleh Wiharja, Imelda Ataina
 

Penerbit

Universitas Telkom
Bandung
2011

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini