Di era yang modern seperti sekarang ini internet dan sosial media menjadi kebutuhan utama dalam kehidupan manusia, oleh karena itu kebutuhan akan aplikasi dengan kemampuan mengolah Big Data sangat dibutuhkan. Big Data dibagi menjadi beberapa tipe dan karakteristik salah satunya file system tidak terstruktur atau biasa disebut NoSQL file system. Arsitektur Cassandra di desain untuk selalu mengupdate datanya dalam struktur memori memtables dan disk SStables, dengan pendistribusian data secara merata antar nodes dalam cluster menggunakan gossip protocol. Hal tersebut menyebabkan setiap nodes selalu memiliki seluruh replika data yang dibutuhkan dan dapat bekerja secara independen walaupun salah satu node dalam cluster tersebut ada yang mati. Pada Cassandra penambahan nodes disebut dapat meningkatkan performansi karena sifatnya yang scalable secara linear, yang berarti penambahan nodes sejajar dengan peningkatan performansinya. Namun hasil pengujian hanya dapat mencapai kondisi sublinear bukan linear. Hal tersebut dapat disebabkan oleh banyak hal dan factor yang menimbulkan overhead communication yang lebih besar daripada peningkatannya.