Abstrak
Twitter merupakan salah satu media sosial yang cukup populer di Indonesia bahkan dunia. Dengan Twitter
pengguna dapat menyebarkan informasi baik itu berbentuk tulisan, video, maupun gambar. Proses difusi
informasi yang terjadi pada Twitter bergerak diantara pengguna dengan fitur retweet. Dimana semakin
besar jumlah retweet maka semakin meluas informasi yang ada. Penelitian ini bertujuan untuk membangun
sebuah model prediksi retweet menggunakan feature user-based dengan metode klasifikasi Random Forest
dengan melewati proses k-fold cross validation dengan nilai K=10. Hasil yang didapat pada penelitian ini
adalah nilai akurasi 70%, nilai precision 74%, nilai recall 63% dan nilai f1-score 67%.
Kata kunci : Twitter, retweet, Random Forest, k-fold cross validation, klasifikasi
Abstract
Twitter is one of the most popular social media in Indonesia and even the world. On Twitter, users can
disseminate information in the form of writing, videos, and images. The information diffusion process that
occurs on Twitter moves between users with the retweet feature. Where the greater the number of retweets,
the more widespread the information. This study aims to build a retweet prediction model using a user-
based feature with the Random Forest classification method by going through the k-fold cross validation
process with a value of K=10. The results obtained in this study are 70% accuracy, 74% precision, 63%
recall value and 67% f1-score value.
Keywords: Twitter, retweet, Random Forest, k-fold cross validation, classification