Industri peternakan menghadapi tantangan dalam pengawasan hewan ternak, khususnya dalam mendeteksi dan mengidentifikasi individu hewan secara akurat di tengah berbagai kondisi lingkungan yang kompleks. Salah satu tantangan utama adalah tumpang tindih objek atau oklusi, yang dapat menyebabkan kesalahan dalam deteksi, seperti ketika beberapa hewan terdeteksi dalam satu bounding-box. Dalam penelitian ini, teknologi Computer Vision digunakan untuk mengatasi masalah tersebut melalui pelatihan model Mask R-CNN yang diterapkan pada tiga kelas hewan ternak: sapi, domba, dan kuda. Pemilihan kelas hewan ini didasarkan pada prevalensi mereka dalam industri peternakan modern. Model dilatih dan diimplementasikan pada gambar yang mengandung hewan dari kelas yang sama maupun berbeda, serta diuji dalam kondisi oklusi untuk mengevaluasi kemampuan model dalam mendeteksi dan melakukan segmentasi objek di daerah yang sulit. Hasil pelatihan menunjukkan total loss sebesar 0,822, dengan akurasi deteksi objek yang mencapai 94,73% dan akurasi segmentasi sebesar 90,1%. Evaluasi lebih lanjut dilakukan untuk mengukur kualitas prediksi model, yang menghasilkan nilai Mean Average Precision (MAP) sebesar 0,427 untuk deteksi objek dan 0,364 untuk segmentasi. Tingkat kesalahan deteksi yang rendah juga tercatat, dengan sekitar 2 dari 5 objek terdeteksi secara salah.