Informasi Umum

Kode

24.04.683

Klasifikasi

004 - Data processing, Computer science

Jenis

Karya Ilmiah - Skripsi (S1) - Reference

Subjek

Data Science

Informasi Lainnya

Abstraksi

<p>Alquran diturunkan dalam Bahasa Arab yang memiliki struktur bahasa kompleks, sistem penulisan yang unik, dan tata bahasa yang rumit sehingga menjadikannya sulit dipahami. Oleh karena itu, pemahaman dan interpretasi Alquran menjadi tujuan utama bagi umat Islam. Untuk memahami ajaran yang terkandung dalam Alquran, umat Islam membutuhkan pemahaman tentang entitas manusia yang ada di dalamnya. Namun, proses pelabelan entitas manusia dalam Alquran secara manual dapat menjadi tugas yang rumit dan menyebabkan kesalahan. Tujuan penelitian ini adalah memudahkan proses pelabelan entitas manusia dalam teks Alquran dengan membangun model yang memiliki performa yang baik.</p>

<p>RoBERTa merupakan model <em>Named Entity Recognition</em> (NER) berupa pengembangan dari BERT yang dilatih dengan metodologi pelatihan yang ditingkatkan. Penelitian ini fokus pada penggunaan model RoBERTa untuk mengidentifikasi entitas manusia dalam teks terjemahan Alquran Bahasa Indonesia. Masukan dari sistem ini berupa kalimat terjemahan Alquran yang kemudian diolah oleh model sehingga menghasilkan keluaran berupa label prediksi dari entitas kalimat tersebut. Model dibangun dengan memanfaatkan dataset dari korpus Tanzil Quran yang terdiri dari juz 1 hingga 6. Pra-pemrosesan data dilakukan dengan eksplorasi data dan <em>case folding</em>. <em>Dataset</em> dibagi menjadi data pelatihan (80%) dan data pengujian (20%). Model RoBERTa dilatih dengan <em>hyperparameter</em> berupa <em>epoch</em>, <em>learning rate</em>, dan <em>batch size</em>. Evaluasi dilakukan menggunakan perhitungan metrik <em>Precision</em>, <em>Recall</em>, dan <em>F-Score</em> pada data pengujian. Hasil evaluasi dari model RoBERTa yang dibangun memiliki nilai F-Score 52%. Nilai tersebut tidak lebih baik dibandingkan model BERT, yang menunjukkan bahwa model RoBERTa cenderung memiliki performa yang lebih buruk dalam mengidentifikasi entitas manusia pada teks terjemahan Alquran.</p>

Koleksi & Sirkulasi

Tersedia 1 dari total 1 Koleksi

Anda harus log in untuk mengakses flippingbook

Pengarang

Nama AUFA MUTIA
Jenis Perorangan
Penyunting Moch. Arif Bijaksana
Penerjemah

Penerbit

Nama Universitas Telkom, S1 Informatika
Kota Bandung
Tahun 2024

Sirkulasi

Harga sewa IDR 0,00
Denda harian IDR 0,00
Jenis Non-Sirkulasi