Diabetes merupakan sebuah kelainan metabolisme yang ditandai dengan meningkatnya kadar gula darah didalam tubuh manusia, hal ini bisa terjadi karena hormon insulin yang dimiliki oleh tubuh tidak bekerja secara maksimal atau memiliki beban kerja yang terlalu berat. Faktor resiko dari penyakit diabetes dapat disebabkan karena memiliki gaya hidup yang tidak sehat seperti terlalu banyak mengkonsumsi makanan dan minuman dengan kadar gula tinggi, kurangnya melakukan aktivitas dan faktor-faktor lainnya. Dalam dunia medis, diagnosa pada pasien dengan penyakit diabetes harus dilakukan oleh dokter yang berkompeten dalam bidangnya, hal ini akan memakan waktu. Pada penelitian ini akan digunakan pembelajaran mesin untuk membangun sebuah model klasifikasi dengan metode klasifikasi Logistic Resgression, dimana dataset yang digunakan merupakan gabungan dari dua dataset yaitu dataset yang dikumpulkan “Stanford Hospital” dan dataset dari “Gula Karya Medika”, dimana penggabungan dataset memanfaatkan metode Gradient Boosting Regressor untuk mengisi nilai-nilai pada dataset yang masih kosong.