Penelitian ini menggunakan metode deep learning dengan model YOLOv8 untuk mendeteksi kepala manusia dalam bus kecil, merespon temuan sebelumnya yang menunjukkan bahwa YOLOv8 dapat meningkatkan performa deteksi objek dibanding YOLOv5. YOLOv8-p2-p6 dipilih sebagai model utama karena menunjukkan hasil terbaik dengan precision 93,5%, recall 89,2%, mAP 94,1%, dan f1-score 91,36% menggunakan tiga dataset gabungan (Scut head Part B, Casablanca, Hollywood Heads). Pengujian tambahan dengan dataset overhead juga memperkuat kinerja YOLOv8-p2-p6, mencapai precision 92,8%, recall 89,3%, mAP 94,1%, dan f1-score 91,04%. Sistem ini diimplementasikan pada NVIDIA Jetson Nano menggunakan model hasil latih dengan dataset overhead Hal ini terjadi karena pada dataset Scut head Part B, Casablanca, dan Hollywood tidak terdapat gambar dengan posisi kamera di atas kepala. Sedangkan dengan penambahan dataset overhead dapat mendeteksi kepala pada bagian atas sudut kamera karena dalam dataset overhead berisi sejumlah foto dengan pengambilan sudut kamera di atas kepala. Sistem menunjukkan akurasi deteksi penumpang masuk sebesar 69,23% dengan tingkat kesalahan 28,57%. Sedangkan, akurasi deteksi penumpang keluar mencapai 28,57% dengan tingkat kesalahan sebesar 71,43%.
Kata kunci: YOLOv8, deteksi objek, people counting, NVIDIA Jetson Nano.