Penyakit kanker merupakan salah satu penyebab kematian utama di seluruh dunia. Pada tahun 2012, sekitar 8,2 juta kematian disebabkan oleh kanker. Kanker paru, hati, perut, kolorektal, dan kanker payudara adalah penyebab terbesar kematian akibat kanker setiap tahunnya. Kasus kanker di Indonesia kini telah mencapai 4,8 juta pada 2018. Kasus terbanyak adalah payudara, serviks, dan paru. Dan perlu kita catat bahwa 43 persen kasus kanker ini dapat dicegah. Oleh sebab itu, pentingnya deteksi dini. Penelitian ini menggunakan model regresi logistik linier. Model regresi logistik linier dapat digunakan untuk dataset yang bersifat kategorik. Model yang sesuai diperoleh setelah dilakukan penaksiran parameter, uji signifikansi setiap atribut yang mempengaruhi, dan uji kecocokan model. Hal tersebut dilakukan untuk mendapatkan model prediksi dan faktor risiko pada tingkat korelasinya dari ukuran penyakit. Metode ini cukup mudah dan praktis secara konseptual, sehingga mungkin untuk diterapkan dalam diagnosa gejala awal kanker paru-paru. Hasil yang didapatkan yaitu model regresi logistik linier untuk prediksi dini penderita kanker paru-paru berdasarkan gejala, kebiasaan, dan riwayat penyakit kesehatan untuk melihat kemungkinan seseorang dengan tingkat resiko tertentu bisa menderita kanker paru-paru. Adapun faktor-faktor yang mempengaruhi seseorang menderita kanker paru-paru yaitu kesulitan menelan, batuk, penyakit kronis, kelelahan, dan umur.