Perkembangan teknologi yang semakin meningkat pesat, menjadikan banyaknya
kebutuhan data yang diperlukan dalam penggalian informasi. Data yang
dikumpulkan pun seharusnya memiliki akurasi yang tinggi agar dapat menciptakan
sebuah informasi yang faktual, akan tetapi tidak semua dataset selalu memiliki
kondisi data yang lengkap ataupun utuh, terdapat pula beberapa dataset yang
mempunyai kondisi kosong pada beberapa kondisi dari atribut datanya yang disebut
sebagai Incomplete Dataset. Incomplete Dataset merupakan sebuah dataset yang
memiliki kekosongan kondisi atribut pada kumpulan atribut tertentu. Incomplete
Data tercipta ketika subjek di bawah pengawasan atau penelitian tidak memiliki
informasi mengenai "satu atau lebih dari variabel yang relevan". Oleh karena itu
banyak metode maupun teori mengenai pemrosesan Incomplete Dataset atau lebih
dikenal dengan Rough Set Data Processing sedang banyak dikembangkan agar data
yang memiliki kekosongan kondisi di dalamnya dapat diroses tanpa adanya
redudant data yang bisa mengakibatkan turunnya akurasi data terhadap informasi
yang diperoleh, oleh karena itu Rough Set dianggap memungkinkan untuk
melakukan perhitungan akurasi data terhadap keputusan yang diperoleh.
kata kunci: Rough Set, incomplete data, big data, dataset.