Abstract-Review adalah informasi yang bersifat evaluasi dimana hal ini berkaitan dengan berbagai aspek yang melekat pada suatu film. Dari informasi yang terdapat pada review dapat disimpulkan sebagai kualitas suatu film dengan pengalaman dari para penonton film, tetapi penilaian yang tidak sesuai dengan konteks kalimat membuat penilaian film menjadi tidak bagus. Hal tersebut mendorong dilakukan penelitian ini untuk melakukan klasifikasi berdasarkan sentiment suatu film. Dalam makalah ini disajikan dengan menggunakan metode Naïve Bayes untuk klasifikasi, TF-IDF sebagai feature extraction dan Information Gain sebagai feature selection. Namun dengan menggunakan Naïve Bayes untuk mengklasifikasikan suatu kata saling bebas satu sama lain [10]. Dalam penelitian ini menggunakan TF-IDF dan Information Gain mencegah permasalahan tersebut. Dari hasil evaluasi dalam proses pengujian menghasilkan hasil performasi maksimum sebesar 84.50% untuk precision, 88.27% untuk recall dan 86.34% untuk f1 score. Dari hasil evaluasi yang dihasilkan maka dapat disimpulkan dengan menggunakan TF-IDF, Information Gain dan Naïve Bayes dapat menghasilkan nilai precision, recall dan f1 score yang cukup baik.
Kata kunci : precision, recall, f1 score, TF-IDF, Information Gain dan Naïve Bayes
Abstract—A movie review is an information that forms an evaluation relating to each aspect inherent in a movie. The information contained in the film can be concluded as the quality of a film experience from the audience, but the rating of 'inappropriate' with the context sentence makes the rating of the film 'not recommended'. This issue supports this research where a film should be classified by sentiment. This paper uses the Naïve Bayes method for classification, TF-IDF as the feature extraction, and Information Gain as the feature selection. However, the uses of Naïve Bayes to classify the word are conditionally independent of each other. This research uses TF-IDF and Information Gain to prevent this problem. From the evaluation results on the testing process, the maximum performance results are 84.50% for precision, 88.27% for precision, 88.27% for recall, and 86.34% for f1-score. From the evaluation results, it can be concluded that using TF-IDF, Information Gain, and Naïve Bayes can produce precision, recall, and f1-score value which is good enough.
Keywords—precision, recall, TF-IDF, Information Gain and Naïve Bayes