Informasi Umum

Kode

23.04.2506

Klasifikasi

004 - Data Processing, Computer Science/Pemrosesan Data, Ilmu Komputer, Teknik Informatika, Hardware Komputer

Jenis

Karya Ilmiah - Skripsi (S1) - Reference

Subjek

Data Science, Data Analysis-research,

Dilihat

517 kali

Informasi Lainnya

Abstraksi

<h2>Abstrak</h2>

<h4>Penyebaran informasi melalui media sosial telah marak terjadi, terutama melalui platform Twitter. Informasi tersebut akhirnya menimbulkan berbagai opini dari para pengguna sebagai sudut pandang mereka terhadap suatu topik yang sedang dibicarakan. Opini-opini tersebut dapat dikumpulkan dan diolah dengan menggunakan analisis sentimen untuk menilai kecenderungan publik sebagai sumber pengambilan keputusan yang mendasar. Namun, prosedur ini belum cukup optimal untuk melakukan klasifikasi karena ketidakmampuannya dalam mengenali makna kata dari kalimat opini. Dengan menggunakan analisis sentimen berorientasi  <i>sentence-level granularity</i>, sistem dapat mengeksplorasi "<i>sense of words</i>" dalam setiap kalimat dengan memberikan bobot granularitas sebagai pertimbangan sistem dalam mengenali makna kata. Untuk membangun prosedur tersebut, penelitian ini menggunakan LSTM sebagai model klasifikasi yang dikombinasikan dengan TF-IDF dan IndoBERTweet sebagai ekstraksi fitur. Tidak hanya itu, penelitian ini juga melakukan metode ekspansi fitur Word2Vec yang dibangun menggunakan korpus Twitter dan IndoNews untuk menghasilkan korpus <i>similarity word</i> dan menemukan semantik kata yang efektif. Untuk memenuhi kebutuhan <i>granularity</i>, dilakukan <i>manual labeling</i> dan <i>system labeling</i> dengan mempertimbangkan weight <i>granularity</i> sebagai perbandingan performa model. Penelitian ini berhasil mendapatkan akurasi 88.97% untuk data <i>manual labeling</i> dan 97.80% untuk <i>system labeling</i> setelah menggabungkan metode-metode tersebut. Hasil eksperimen menunjukkan bahwa model analisis sentimen berorientasi <i>granularity</i> dapat mengungguli sistem analisis sentimen konvensional yang dapat dibuktikan dengan melihat tingginya performa sistem yang dihasilkan.</h4>

<p>Kata kunci: Sentiment Analysis sentence-level granularity oriented, LSTM, TF-IDF, IndoBERTweet, Word2Vec</p>

<hr /> <h2>Abstract</h2>

<p>The dissemination of information through social media has been rampant, especially on the Twitter platform. This information eventually invites various opinions from users as their points of view on a topic being discussed. These opinions can be collected and processed using sentiment analysis to assess public tendencies to obtain a fundamental source of decision-making. However, the procedure is not optimal enough due to its inability to recognize the word meaning of the opinion sentences. By using sentence-level granularity-oriented sentiment analysis, the system can explore the "sense of the word" in each sentence by giving it a granularity weight as the system's consideration in recognizing word meaning. To construct the procedure, this research utilizes LSTM as the classification model combined with TF-IDF and IndoBERTweet as feature extraction. Not only that, but this research also conducts the Word2Vec feature expansion method which was built using Twitter and IndoNews corpus to produce word similarity corpus and find effective word semantics. To be fully compliant with the granularity requirements, manual labeling, and system labeling were performed by considering weight granularity as a model performance comparison. This research succeeded in getting 88.97% accuracy for manual labeling data and 97.80% for system labeling data after combining these methods. The experimental results show that the granularity-oriented sentiment analysis model can outperform the conventional sentiment analysis system which can be seen based on the high performance of the resulting system.</p>

<h4><i>Keywords: </i>Sentiment Analysis sentence-level granularity oriented, LSTM, TF-IDF, IndoBERTweet, Word2Vec</h4>

  • CII3C3 - PEMBELAJARAN MESIN
  • CII3L3 - PEMBELAJARAN MESIN LANJUT
  • CII4G3 - PEMROSESAN BAHASA ALAMI
  • CII4I3 - PENAMBANGAN DATA
  • CII4E4 - TUGAS AKHIR
  • CII4L3 - VISUALISASI DATA

Koleksi & Sirkulasi

Tersedia 1 dari total 1 Koleksi

Anda harus log in untuk mengakses flippingbook

Pengarang

Nama NISA MAULIA AZAHRA
Jenis Perorangan
Penyunting Erwin Budi Setiawan
Penerjemah

Penerbit

Nama Universitas Telkom, S1 Informatika
Kota Bandung
Tahun 2023

Sirkulasi

Harga sewa IDR 0,00
Denda harian IDR 0,00
Jenis Non-Sirkulasi