Data merupakan aspek yang sangat berharga terutama bagi sebuah organisasi. Sebuah data harus memiliki kualitas yang baik dan terjamin karena data dapat memberikan nilai bisnis sebagai penentu keputusan. Namun pada kenyataannya sekarang ini, banyak perusahaan maupun BUMN yang belum memiliki kualitas data yang baik dalam pengelolaannya. Hal ini sering disebabkan pada organisasi besar, kebutuhan data bisa jadi sangat beragam. Pada level department maupun divisi masing-masing saja memerlukan proses bisnis dan sistem IT yang berbeda, sehingga mengarahkan untuk membuat sistem aplikasi yang spesifik dengan berbagai macam platform. Keadaan tersebut menyebabkan banyaknya data yang terulang dan menjadi tidak konsisten. Untuk menanggulangi permasalahan tersebut, diperlukannya arsitektur untuk melakukan data quality management yang dapat melakuakan alur transformasi data seperti data profiling maupun data cleansing. Cara tersebut dapat dilakukan dengan berbagai macam aplikasi data quality, baik berbayar maupun tidak berbayar. Tingginya harga aplikasi berbayar ini membuat banyak perusahaan menginginkan sebuah aplikasi terbuka dalam pengelolaan integrasi data. Pada penelitian ini peneliti mengembangkan arsitektur aplikasi data quality dengan menerapkan metode pada proses integrasi data. Salah satunya adalah proses ETL yang nantinya dapat menjalankan fitur-fitur algoritma transfotmasi data seperti data profiling dan data cleansing. Hasil dari penelitian ini diharapkan dapat memenuhi kebutuhan perusahaan terhadap kebutuhan aplikasi opensource data quality management. Pada pengujian hasil penelitian ini menggunakan metode studi kasus untuk menguji berdasarkan lingkup yang spesifik.
Kata kunci : data, profiling, open source, cleansing, data integration, data quality, data quality management