25.04.2630
000 - General Works
Karya Ilmiah - Skripsi (S1) - Reference
Natural Language Processing (nlp)
133 kali
Tingginya aktivitas masyarakat dalam membahas pemilihan Gubernur melalui media sosial menghasilkan data komentar dalam jumlah besar, namun komentar tersebut sering menggunakan bahasa informal, bahasa sehari-hari, singkatan, serta bercampur dengan bahasa daerah dan dialek lokal yang sulit dipahami. Hal ini menghambat pemrosesan data komentar untuk keperluan analisis atau tujuan lainnya. Proses normalisasi manual membutuhkan waktu dan sumber daya yang sangat banyak, terutama jika data yang diolah berjumlah besar. Normalisasi secara manual juga rentan terhadap inkonsistensi dan kesalahan manusia. Jumlah data komentar di media sosial yang terus meningkat membuat normalisasi manual semakin tidak mungkin dan tidak efisien untuk dilakukan, sehingga diperlukan solusi otomatisasi. Sistem normalisasi teks otomatis dikembangkan menggunakan pendekatan <i>Phrase-Based Statistical Machine Translation</i> dengan memanfaatkan Moses. Dataset korpus paralel dibangun dari 31.889 pasangan kalimat informal-formal, sedangkan korpus monolingual terdiri dari 1.613.381 kalimat yang diambil dari Wikipedia. Model dievaluasi menggunakan metrik <i>BLEU</i> untuk mengukur kualitas hasil normalisasi. Model terbaik mencapai skor <i>BLEU</i> 82,16 pada data test dan 81,04 pada data validasi, berhasil mengenali berbagai pola bahasa informal seperti singkatan tidak baku, kata berulang dengan angka, dan bahasa gaul. Namun, sistem memiliki keterbatasan terhadap kemampuan penanganan <i>Out-Of-Vocabulary</i>.
Tersedia 1 dari total 1 Koleksi
Nama | KAHIL AKBAR BAYU ADITYO |
Jenis | Perorangan |
Penyunting | Alqis Rausanfita, Daud Muhajir |
Penerjemah |
Nama | Universitas Telkom, S1 Informatika - Kampus Surabaya |
Kota | Surabaya |
Tahun | 2025 |
Harga sewa | IDR 0,00 |
Denda harian | IDR 0,00 |
Jenis | Non-Sirkulasi |