Teks ulasan di Google Play Store merupakan fasilitas yang digunakan untuk menuliskan pendapat dan komentar pengguna. Selain itu, pengguna juga dapat memberikan skor rating dalam rentang 1 hingga 5. Terkadang, teks ulasan yang ditulis oleh pengguna tidak selalu sesuai dengan skor rating yang diberikan. Ada situasi di mana pengguna memberikan ulasan yang positif namun memberikan skor rating yang rendah, atau sebaliknya. Hal ini membuat penilaian yang diberikan pengguna menjadi tidak konsisten: apakah pengguna benar-benar memiliki pandangan positif terhadap aplikasi tersebut atau tidak.
Untuk menangani masalah ini, dilakukan penelitian menggunakan metode Machine Learning dengan memanfaatkan model Support Vector Classifier (SVC). Penelitian ini menggunakan bahasa pemrograman Python dan melibatkan tahapan pengambilan dataset menggunakan teknik scrapping, pre-processing dataset, serta pelatihan (training) dataset yang dilatih terdiri dari 3, yaitu unigram, bigram, trigram menggunakan model N-Gram dan pengujian (testing) dataset. Dataset yang digunakan pada penelitian ini adalah dataset yang memiliki rating 1-3, rating 1-3 dianggap sebagai label negatif.
Dari hasil training dan pengujian, terdapat hasil akurasi yang berbeda yaitu unigram, yaitu 85.80% untuk bigram dan 85.80% untuk trigram. Selanjutnya, model yang sudah dilatih di deploy pada aplikasi berbasis web untuk melakukan pengujian pada dataset uji. Hasil evaluasi pada aplikasi deploy tersebut adalah adanya ketidaksesuaian antara teks ulasan dan rating. Selain hasil pengecekan evaluasi, dari dataset bigram ditemukan bahwa pengguna memiliki perhatian terhadap iklan judi, iklan pornografi,dan iklan yang berlebihan. Hal ini terlihat pada ukuran tulisan kata-kata tersebut di worcloud, yang memiliki ukuran besar dibandingan kata- kata yang lain.