Industri game telah mengalami perubahan dramatis dalam beberapa dekade terakhir. Variasi permainan yang tersedia dan jumlah orang yang memainkannya telah berkembang pesat karena pertumbuhan komunitas online yang didedikasikan untuk jenis hiburan ini. Kesulitan untuk mengikuti preferensi pemain yang selalu berubah dan genre video game baru yang terus menerus adalah masalah yang menantang. Meskipun beberapa sistem rekomendasi video game telah dihadirkan, algoritma yang digunakan mengalami kesulitan untuk mencatat perubahan preferensi pengguna, yang menyebabkan pengulangan game yang direkomendasikan. Oleh karena itu, diperlukan sebuah sistem rekomendasi yang secara aktif belajar dari perilaku pengguna dan mempersonalisasi rekomendasinya. Kami mengusulkan untuk mengembangkan rekomendasi video game berdasarkan Deep Reinforcement Learning (DRL). Algoritma deep reinforcement learning menggunakan data dari platform Steam dan interaksi pengguna di masa lalu, seperti waktu bermain selamanya dan waktu bermain dalam 2 minggu terakhir, untuk memberikan hadiah di masa depan untuk rekomendasi video game. Kami membandingkan percobaan pada varians DRL dengan Singular Value Decomposition (SVD) dan Logistic Regression (LR). Hasilnya menunjukkan bahwa metode yang diusulkan secara konsisten menilai tingkat kepentingan item dan peringkat relatif berdasarkan interaksi pengguna di masa lalu.
Kata kunci : sistem pemberi rekomendasi, deep reinforcement learning, double q learning, video game, steam platform