Informasi Umum

Kode

25.04.2834

Klasifikasi

000 - General Works

Jenis

Karya Ilmiah - Skripsi (S1) - Reference

Subjek

Natural Language Processing

Dilihat

225 kali

Informasi Lainnya

Abstraksi

<p>Aduan masyarakat merupakan salah satu indikator penting dalam memahami</p>

<p>permasalahan publik, khususnya di bidang tranportasi dan lalu lintas. Banyaknya</p>

<p>aduan yang masuk melalui media sosial, seperti platform X (Twitter), menuntut</p>

<p>adanya sistem klasifikasi otomatis yang mampu mengelola informasi secara cepat</p>

<p>tepat dan efisien. Penelitian ini bertujuan untuk membangun model klasifikassi teks</p>

<p>aduan masyarakat pada akun media sosial X Suara Surabaya (@e100ss) dengan</p>

<p>memanfaatkan model <i>Extreme Gradient Boosting </i>(XGBoost) dan berbagai metode</p>

<p>fitur ekstrasi, yaitu <i>Term Frequency — Inverse Document Frequency </i>(TF-IDF),</p>

<p><i>Count Vectorizer, </i>dan <i>Word2vect.</i> Pengembangan sistem mengikuti tahapan <i>Cross-</i></p>

<p><i>Industry Standard Process for Data Mining</i> (CRISP-DM),<i> </i>dimulai dari</p>

<p>pengumpulan data menggunakan teknik <i>web scraping,</i> <i>preprocessing</i> teks, hingga</p>

<p>evaluasi kinerja model menggunakan metrik <i>accuracy, precision, recall,</i> <i>f1-score,</i></p>

<p><i>confusion matrix, </i>dan ROC <i>Curve. </i>Hasil penelitian menunjukan bahwa kombinasi</p>

<p>XGBoost<i> </i>dan<i> CountVectorizer </i>memberikan peforma terbaik dengan <i>accuracy </i>93%<i>,</i></p>

<p><i>precision </i>90%<i>, recall </i>86%<i>, </i>dan <i>f1-score </i>88%<i>.</i> Model ini dinilai paling seimbang</p>

<p>dalam mendeteksi teks aduan tanpa mengorbankan ketepatan klasifikasi</p>

<p>(<i>precision</i>). Model diimplementasikan dalam bentuk aplikasi website berbasis</p>

<p><i>Streamlit </i>yang bersifat interaktif dan dilengkapi dengan fitur manajemen frasa,</p>

<p>guna menambahkan frasa baru yang belum dikenali oleh model. Selain itu,</p>

<p>penerapan ambang batas prediksi sebesar 0,4 digunakan untuk meningkatkan</p>

<p>kemampuan sistem dalam menangkap aduan yang jarang muncul. Dengan</p>

<p>pendekatan ini, sistem yang dibangun diharapkan dapat mendukung peningkatan</p>

<p>kualitas pelayanan publik melalui pemanfaatan teknologi <i>machine learning</i> dalam</p>

<p>analisis teks secara otomatis.</p>

  • BBK4FBB3 - Pemrosesan Bahasa Alami
  • BBK2LAB3 - PENAMBANGAN DATA
  • BBK4HBB3 - Visualisasi Data dan Informasi

Koleksi & Sirkulasi

Tersedia 1 dari total 1 Koleksi

Anda harus log in untuk mengakses flippingbook

Pengarang

Nama IQBAL HAKAM HAFIDZ
Jenis Perorangan
Penyunting Agus Sulistya, Berlian Rahmy Lidiawaty
Penerjemah

Penerbit

Nama Universitas Telkom, S1 Sistem Informasi - Kampus Surabaya
Kota Surabaya
Tahun 2025

Sirkulasi

Harga sewa IDR 0,00
Denda harian IDR 0,00
Jenis Non-Sirkulasi