Sistem komunikasi Device-to-Device (D2D) merupakan sistem komunikasi dimana setiap user melakukan komunikasi secara langsung tanpa harus melintasi Base Station (BS). Komunikasi D2D dilakukan dengan menggunakan kembali resource block dari Cellular User Equipment (CUE). Penggunaan resource block secara
bersamaan antara D2D dengan CUE dapat mengurangi beban trafik di BS. Namun menyebabkan interferensi dan tidak efisien daya pada komunikasi D2D.
Dengan adanya permasalahan tersebut maka pada penelitian ini, dilakukan pengalokasian resource block pada single cell dengan arah komunikasi downlink menggunakan algoritma Hungarian. Setelah melakukan pengalokasian resource block, tahap selanjutnya adalah pengalokasian daya menggunakan metode State Action Reward State Action (SARSA) berbasis Power Domain Non-Orthogonal Multiple Access (PD-NOMA). Kemudian dilakukan perbandingan performansi antara skema alokasi daya fixed dengan skema alokasi daya SARSA dengan metode PD-NOMA.
Berdasarkan simulasi yang dilakukan, skema alokasi resource block dengan alokasi daya SARSA memberikan performansi yang lebih baik dibandingkan dengan skema alokasi resource block dengan alokasi daya fixed. Dimana rata-rata sum data rate diperoleh dengan memvariasikan jumlah pasangan D2D dengan nilai 2.89×10^7 bps, power efficiency 2.89×10^5 bps/mwatt dan spectral efficiency 8.04 bps/Hz.
Kata Kunci: Device-to-device, Resource Block, Power Domain Non-Orthogonal Multiple Access.