Klasifikasi Toxic Comment Pada Twitter Menggunakan Metode SVM dan Word Embeddings

GEDE AGUS HENDRA CHRISNANTARA

Informasi Dasar

112 kali
23.04.806
C
Karya Ilmiah - Skripsi (S1) - Reference

Perkembangan teknologi yang pesat pada era modern ini, sosial media merupakan sebuah sarana untuk melakukan interasi dan mengutarakan pendapat secara online. Meskipun memiliki dampak positif, sosial media juga memiliki dampak negatif dari penggunaan sosial media salah satunya adalah cyberbullying dalam bentuk toxic comment. Toxic comment dapat dibagi menjadi banyak jenis, maka penelitian ini dilakukan untuk mengklasifikasikan toxic comment tersebut dengan menggunakan metode machine learning. Dalam penelitian ini dilakukan pengumpulan data melalui data crawling pada twitter dengan jumlah data 1.200 records. Keseluruhan data tersebut lalu diberi label secara manual dengan menggunakan 4 label, antara lain non-toxic, SARA, katakasar, dan ujaran kebencian. Algoritma yang digunakan untuk pengklasifikasian menggunakan word embeddings dengan pendekatan word2vec sebagai feature extraction dan support vector machine (SVM) sebagai classifier. Pada penelitian ini didapatkan hasil f1-score paling tinggi 96% dengan menggunakan SVM dengan kernel polynomial pada label ‘Toxic’ dan word2vec dengan dimensi 100. Hasil analisis pada penelitian ini menunjukan algoritma word embeddings dengan pendekatan word2vec dapat meningkatkan hasil f1-score dari classifier SVM.

Subjek

Machine - learning
 

Katalog

Klasifikasi Toxic Comment Pada Twitter Menggunakan Metode SVM dan Word Embeddings
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

GEDE AGUS HENDRA CHRISNANTARA
Perorangan
Adiwijaya, Mahendra Dwifebri
 

Penerbit

Universitas Telkom, S1 Informatika
Bandung
2023

Koleksi

Kompetensi

  • CII4E4 - TUGAS AKHIR

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini