ABSTRAKSI: Berkembangnya teknologi di dunia maya, telah melahirkan bisnis baru bernama e-commerce. Banyak situs e-commerce yang memberikan kemudahan dalam bertransaksi, dan konsumen juga dapat memberikan review atau opini terhadap produk yang dibeli. Dari opini-opini tersebut dapat dimanfaatkan baik oleh konsumen maupun oleh produsen. Pada konsumen bermanfaat untuk mengetahui keunggulan dan kelemahan dari suatu fitur dari produk. Pada produsen bermanfaat untuk menanalisa kelebihan dan kelemahan produknya sendiri maupun kompetitornya. Dari sekian banyak opini perlu penanganan tertentu agar yang membaca dapat mengetahui inti dari keseluruhan opini tersebut. Kemudian muncul adanya Review Summarization yang meringkas keseluruhan opini berdasarkan sentimen dan fitur yang terdapat didalamnya.
Dalam penelitian ini, domain yang menjadi fokus adalah mengenai digitalcamera. Penelitian ini terdiri dari empat langkah, yaitu : 1) pemberian pengetahuan sistem untuk bisa mengenali orientasi semantik 2) mengidentifikasi fitur 3) mengidentifikasi apakah opini tersebut memberikan opini positif atau negatif 4) meringkas hasilnya. Pada penelitian ini membahas metode yang digunakan antara lain Naïve Bayes untuk klasifikasi sentimen, dan ekstraksi fitur berbasis Dependencies Analysis, yaitu salah satu tools pada Natural Language Processingdan pemberian pengetahuan berbasis kamus yang untuk menangani fitur implisit. Hasil akhir adalah berupa summary yang berisi sekumpulan review berdasarkan fitur dan sentimennya. Dengan metode yang digunakan hasil akurasi yang didapat untuk klasifikasi sentimen mencapai 81.2 % untuk data uji positif, 80.2 % untuk data uji negatif, dan hasil akurasi untuk ekstraksi fitur mencapai 90.3 %.
Kata Kunci : Klasifikasi sentimen, reviews, summarization, text miningABSTRACT: Development of internet and technology, has major impact and provising new business called e-commerce. Many e-commerce sites that provide convenience in transcation, and consumers can also provide reviews or opinions on products that purchased. These opinions can be used by consumers and producers. Consumers to know the advantages and disadvantages of particular feature of the product. Procuders can analyse own strengths and weaknesses as well as it’s competitors products. Many opinions need a method that the reader can know the point of whole opinion. The idea emerged from review summarization that sumarizes the overall opinion based on sentiment and features contain.
In this study, the domain even become the man focus is on the digital camera. This research consisted of four steps 1) giving of knowledge to the system to recognize the semantic orientation of an opinion 2) indentify the features of product 3) indentify whether the opinion gives a positve or negative 4) summarizing the result. In this research, discuss the methods such as Naïve Bayes for sentiment classification, and feature extraction algortihms based Dependencies Analysis, which is one of the tools in Natural Language Processing (NLP) and knowledge based dictionary which is useful for handling implicit features. The end result of research is a summary that contains a bunch of reviews from consumers on the features and sentiment. With proposed method, accuration for sentiment classification giving 81.2 % for positive test data, 80.2 % for negative test data, and accuration for feature extraction reach 90.3 %.
Keyword: reviews, sentiment classification, summarization, text mining