ABSTRAKSI: GPU (Graphic Processing Unit) merupakan prosesor khusus untuk bagian grafis 3D dari microprocessor . GPU dipopulerkan oleh NVIDIA, NVIDIA juga mengembangkan sebuah teknologi yang bernama CUDA (Compute Unified Device Architecture). CUDA (Compute Unified Device Architecture) adalah sebuah arsitektur perangkat keras dan perangkat lunak untuk mengelola komputasi secara paralel pada perangkat keras GPU. Setiap perangkat GPU berkemampuan CUDA dapat bertindak sebagai sebuah perangkat komputasi data paralel secara massal dengan jumlah memori yang besar. Pada Tugas akhir ini dilakukan analisis konfigurasi fungsi kernel secara eksplisit pada GPU CUDA, dengan studi kasus: perkalian matriks, yaitu dengan pembagian proses kedalam block, thread, dan kombinasi antara block dan thread. Dari hasil analisis, didapatkan hasil bahwa tidak ada perbedaan yang signifikan antara waktu pengujian dan variabel block dan thread pada pengujian block saja dan thread saja. Sedangkan pada pengujian yang menggunakan kombinasi antara block dan thread, didapatkan hasil adanya perbedaan yang signifikan antara kedua variabel block dan thread terhadap waktu percobaan dan adanya interaksi antara variabel block dengan variabel thread pada tiap masing-masing waktu pengujian percobaanKata Kunci : GPU, CUDA, perkalian matriks, kernel.ABSTRACT: GPU (Graphic Processing Unit) is a specialized processor for 3D graphics part of microprocessor. GPUs popularized by NVIDIA, NVIDIA has also developed a technology called CUDA (Compute Unified Device Architecture). CUDA ( Compute Unified Device Architecture ) is an architecture of hardware and software to manage parallel computing on GPU hardware. Each device GPU capable CUDA can act as a computing device massively parallel data with large amount of memory. In the final project, analysis explicit configuration kernel function on GPU CUDA, with a case study: matrix multiplication, ie with devided process into block, thread and a combination of block and thread. From the analysis, showed that there was ni significant difference in the test block and thread only. While on the test that uses a combination of block and thread, showed a significant difference between of two variables block and thread the time trial and there’s interaction between the variables block and variables thread on each individual test time trial.Keyword: GPU, CUDA, kernel, matrix multiplication.