ABSTRAKSI: Data yang terdapat dalam data warehouse merupakan historical data. Semakin lama data yang terkumpul dalam data warehouse akan semakin besar, sehingga kebutuhan penggunaan disk space dimasa yang akan datang menjadi pertimbangan dalam perancangan dan pembangunan suatu sistem data warehouse. Selain itu, saat ini tidak sedikit sistem data warehouse yang didesain secara terpusat akan tetapi berada pada lingkungan yang terdistribusi. Untuk itu, penerapan model distributed data warehouse pada lingkungan yang terdistribusi pastinya akan lebih sesuai.
Dalam tugas akhir ini, sistem distributed data warehouse diimplementasikan dengan dua model sistem. Pada model pertama, global server menyimpan salinan data dari seluruh local server yang terhubung. Sementara pada model kedua, global server tidak menyimpan data tersebut.
Dari hasil implementasi dan pengujian sistem, dapat di analisis mengenai kelebihan dan kekurangan dari kedua model sistem tersebut. Dilihat dari tingkat availability dan penggunaan disk spacenya, model kedua lebih unggul dibandingkan model pertama.
Kata Kunci : Distributed data warehouse, historical data, availability, disk spaceABSTRACT: Data warehouse is a historical data storage. Data in data warehouse will be bigger day by day. So, the necessity use of disk space in the future will be a consideration on designing and developing a data warehouse system. Beside that, nowadays, there is a lot of data warehouse sistem in distributed environment was developed in centralized. Because of that, implementation of distributed data warehouse system in distributed environment will be more appropriate.
In this final project, the distributed data warehouse system is implemented by two system models. First, the data on local servers are replicated by global server. Second, global server replicate nothing from local server.
From the results of implementation and system testing, it can be analyzed about the advantages and disadvantages of that two system models. In the case of availability and use of disk space, implementing the second model will be give more advantages than first model.
Keyword: Distributed data warehouse, historical data, availability, disk space