Cuaca adalah keadaan terbatas udara diatmosfer pada saat waktu dan daearah tertentu yang bersifat tidak pasti atau tak tentu dan berubah. Cuaca memiliki waktu relatif sempit dengan jangka waktu yang pendek. Perkiraan cuaca di Indonesia bersifat tidak pasti, hal ini akan terjadinya perubahan waktu pada setiap minggunya. Untuk mengestimasikan dan memprediksikan cuaca serta jenis – jenis awan pada wilayah tersebut, maka diperlukan sebuah teknologi cuaca dan pemrograman yang tinggi. Maka digunakanlah machine learning (ML) dengan algoritma yaitu logistic regression (LR) agar mendapatkan sebuah hasil akurasi yang cukup baik serta akurat, untuk jenis – jenis awan yang dapat mempengaruhi cuaca.
Penelitian Tugas Akhir ini akan berpatokan kepada data Himawari-8 dan juga data awan untuk dapat melihat pola – pola awan untuk dijadikan bahan pembelajaran dari prediksi hujan ini. Selain hal yang diatas, nantinya juga akan menggunakan data dari real-time yang dapat berguna sebagai validasi dari keakuratan penelitian ini. Dataset adalah data NetCDF yang akan digunakan meliputi kurang lebih 100 data serta untuk validasi yang terdiri dari 1 data Himawari-8 dan juga data awan. Prediksi hujan menggunakan data NetCDF untuk memprediksikan jenis – jenis awan dengan menggunakan metode Logistic Regression (LR) dengan titik patokan yaitu kilometer (KM).
Pengujian telah dilakukan menggunakan hasil training data awan yang menghasilkan sebuah plot dan tingkat akurasi 40 - 80%. Melalui perbandingan 100 data didapatkannya nilai akurasi terendah 30 – 40% dan 40 – 80% sebegai nilai akurasi tertinggi, dengan model solver LR liblinear yang menghasilkan nilai akurasi yang konsisten.
Kata kunci: Prediksi Hujan, Satelit Himawari-8, Machine Learning, Cloud Type, Logistic Regression