Diabetes melitus merupakan penyakit kronis yang prevalensinya terus meningkat, khususnya pada tipe 2 yang sering disertai dengan komplikasi. Di Indonesia, penyakit diabetes menunjukkan dampak serius, sehingga memperkuat urgensi untuk memahami dan mengatasi dampak serius yang diakibatkan oleh diabetes. Peringatan dini (early warning) terhadap penyakit ini sangat diperlukan, karena memungkinkan tindakan pencegahan dan penanganan lebih cepat. Penelitian ini bertujuan untuk mengidentifikasi hasil penerapan algoritma machine learning dalam prediksi diabetes serta mengetahui faktor-faktor yang paling mempengaruhi diabetes melitus. Penelitian ini menggunakan algoritma Gradient Boosting Machine dengan data rekam medis dari RSUD Al Ihsan Provinsi Jawa Barat yang terdiri dari dua kelas yaitu DM Type 2 dan DM Type 2 + Penyerta. Pada penerapannya, menggunakan rasio pembagian data 90:10, 80:20, dan 70:30, yang diterapkan pada teknik grid search untuk mendapatkan hasil yang optimal. Evaluasi model dilakukan menggunakan confusion matrix dan nilai AUC pada kurva ROC. Kinerja terbaik algoritma Gradient Boosting Machine dicapai dengan rasio pembagian data 80:20, dengan parameter terbaik yaitu learning rate = 0.2, number estimators = 50, dan maximum depth = 3. Hasil penelitian menunjukkan akurasi sebesar 82% dan nilai AUC pada kurva ROC sebesar 0.90. Nilai precision label 1 = 84% dan label 0 = 80%, recall label 1 = 74% dan label 0 = 88%, serta f1-score label 1 = 79% dan label 0 = 84%. Kemudian hasil visualisasi terkait faktor yang mempengaruhi peningkatan diabetes melitus pada pasien di RSUD Al Ihsan Provinsi Jawa Barat yaitu HbA1c, Random Blood Glucose (RBG), dan jumlah lekosit. Penelitian ini bermanfaat dalam mendukung diagnosis awal dan pengelolaan penyakit diabetes melitus dan sebagai early warning bagi masyarakat umum tentang pentingnya pengecekan kesehatan berkala. Dengan demikian, penelitian ini tidak hanya memberikan kontribusi akademis tetapi juga berdampak positif terhadap praktik medis dalam upaya peningkatan pengelolaan diabetes yang lebih baik.
Kata kunci—data rekam medis, diabetes melitus, Gradient Boosting Machine, machine learning