ABSTRAKSI: Perkembangan media sosial mengalami peningkatan setiap tahunnya, khususnya Twitter. Berdasarkan rangking yang dibuat oleh situs eBizMBA, twitter berada pada urutan kedua dengan jumlah penggunanya menembus angka 250 juta pada periode November 2013. Dan menurut ranking yang dilakukan situs eMarketer, Indonesia berada pada urutan pertama tingkat penambahan jumlah akun twitter. Informasi yang dapat diambil dari twitter antara lain adalah berita baru, ide, dan bahkan opini. Contoh bentuk opini adalah pendapat seseorang mengenai permasalahan kemacetan ibu kota atau review seseorang mengenai produk tertentu. Opini yang dihasilkan ini dapat berguna untuk menentukan kebijakan atau keputusan bagi organisasi atau institusi ke depannya. Kebijakan ini dibuat berdasarkan sifat opini yang berupa sentimen positif atau negatif. Oleh karena itu, diperlukan analisis lebih lanjut untuk menentukan opini tersebut termasuk kelompok sentimen positif atau negatif.
Tugas akhir ini bertujuan untuk menentukan kelas sentimen dari setiap tweets yang diklasifikasikan menjadi dua jenis yaitu sentimenpositif dan negatif. Dataset yang digunakan pada penelitian tugas akhir ini adalah tweets mengenai isu sosial yang ada di Kota Bandung. Metode yang diterapkan pada penelitian ini adalah metode Holistic Lexicon-Based. Metode ini merupakan pengembangan dari metode Lexicon-Based.Metode ini dapat menangani permasalahan multi-opini untuk setiap data tweets. Data yang telah diambil dari twitter akan dilakukan proses preprocessing terlebih dahulu agar hasil klasifikasi lebih baik. Kemudian dilakukan proses klasifikasi ke dalam jenis sentimen dengan melihat setiap orientasi opinion words.
Berdasarkan hasil pengujian, dengan metode Holistic Lexicon-Baseddapat mengidentifikasi kalimat opini dari dataset twitter dan menentukan kelas sentimen dengan rata-rata akurasi 89%. Besarnya nilai akurasi ini dipengaruhi oleh jumlah kalimat opini yang dapat diidentifikasi dan kelengkapan kamus yang dipakai.KATA KUNCI: Opinion Mining, Sentiment Analysis, Sentiment Classification, Holistic Lexicon-Based, TweetsABSTRACT: The evolution of social media is increasingevery year, especially Twitter. Based on the ranking that was created by eBizMBA site, twitter rankedin the second position with total of user exceeded 250 million on November 2013. And according to ranks that was made by eMarketer site, Indonesia ranks first on the growth of twitter account. The information that can be retrieved from twitter are hot news, ideas, even opinions. The example of opinion is someone’s opinion about traffic jam in the capital city or someone’s review about certain products. This opinion result can be useful for determine policy or decision for organizations or institutions in the future. This policy made based on opinion characteristics which is a positive or negative sentiments. Therefore, further analysis is needed to determine whether that opinion is positive or negative sentiment’s class.
This final project aim to determine sentiment class from each tweets that classified as two kind of sentiment, positive and negative. The dataset that is used in this final project are tweets about social issues in Bandung city. The method that applied in this research is Holistic Lexicon-Based method. This method is the development of Lexicon-Based method. This method can handle multi-opinion problems for each tweets. The data that has been taken from twitter, will be processed in preprocessing first so that the result of classification is preferably. Then, the data will be classified into sentiment with considering each opinion words orientation.
Based on testing result, with Holistic Lexicon-Based methodthe opinion sentence can be identified from twitter dataset and determine sentiment class with average of accuracy 89%. This accuracy is affected by the number of opinion sentence that has been identified and the completeness of the dictionary.KEYWORD: Opinion Mining, Sentiment Analysis, Sentiment Classification, Holistic Lexicon-Based, Tweets