Pengguna internet di dunia menurut Internet World Stat pada tahun 2020 mencapai 58.7% dan akan terus meningkat dari tahun ke tahun. Presentase pengguna internet diseluruh dunia dari tahun 2000 sampai tahun 2020 juga tercatat mengalami peningkatan secara signifikan, yaitu mencapai 1.167%. Hal ini membuat penyedia layanan aplikasi web harus memikirkan skalabilitas layanan dalam menerima request dari pengguna yang dapat naik secara signifikan pada waktu tertentu agar tidak terjadi overload.Aspek skalabilitas layanan pada cloud platform dapat dilakukan dengan container manajemen dengan Kubernetes Berdasarkan hal tersebut, penggunaan fitur pada Google Kubernetes Engine yaitu horizontal pod autoscaler dapat menjadi solusi. Metode yang digunakan pada pengujian ini menggunakan Load testing untuk mengukur utilisasi CPU, dan kemampuan layanan menerima request dari varian jumlah user tersebut. Pengujian pada layanan disimulasikan menggunakan platform cloud yaitu Google Cloud Platform dengan service Google Kubernetes Engine. Pada layanan CMS yang menggunakan HPA memiliki konfigurasi CPU 70%. Rata-rata penggunaan CPU dibawah 70% masih termasuk batas aman. Dari hasil analisis penerimaan request tidak ada perbedaan yang signifikan pada total request dan average response time. Namun pada parameter persentase failure layanan CMS yang menggunakan HPA, terdapat perbedaan persentase failure yang cukup tinggi. Dapat di indikasikan penggunaan HPA dapat menjadi salah satu solusi meningkatkan skalabilitas.