Sistem Ekstraksi Entitas Manusia dengan Metode CRF dan BERT pada Al-Quran Bahasa Arab dengan Transliterasi Buckwalter

MUHAMMAD FAIZ ABDURRAHMAN DJAUHAR

Informasi Dasar

142 kali
23.04.2694
006.32
Karya Ilmiah - Skripsi (S1) - Reference

Al-Quran merupakan kitab suci umat Islam dan terdiri dari surat dan ayat yang banyak serta memiliki kandungan arti yang beragam. Dengan adanya kandungan arti yang beragam memiliki struktur entitas yang banyak sehingga sulit untuk dilakukan secara manual karena memakan waktu dan usaha yang besar. Oleh karena itu dibuat sistem ekstraksi entitas manusia yang bisa berjalan secara otomatis sehingga dapat
mempermudah dan mempercepat dalam ekstraksi entitas manusia. Ekstraksi entitas manusia sendiri merupakan salah satu tugas dari Named Entity Recognition atau NER yang berfokus kepada identifikasi entitas manusia seperti nama ataupun yang memiliki makna sama dengan manusia. Contoh input dan termasuk kedalam entitas manusia bernama yaitu Al-Quran surat Al-Baqarah ayat 8 dengan bahasa arab yang sudah ditransliterasikan secara buckwalter yaituWa, mina, {l, n˜aAsi, man, yaquwlu, ’aAma, n˜aA, bi, {ll˜ahi, wa, bi, {lo, yawomi, {lo, ’aAxiri, wa, maA, hum, bi, mu&ominiyna. Dalam ayat tersebut kalimat yang termasuk entitas adalah man, yaquwlu, ’aAma, n˜aA, bi, {ll˜ahi, wa, bi, {lo, yawomi, {lo, ’aAxiri. Pada saat ini masih belum banyak yang membuat sistem ekstraksi entitas manusia dalam Al-Quran. Oleh karena itu penulis dalam Tugas Akhir ini akan mengaplikasikan sistem ekstraksi entitas manusia dengan input berupa Al-Quran Bahasa Arab Transliterasi Buckwalter. Dilakukan eksperimen yaitu membandingkan nilai F1-Score dari dua model ekstraksi entitas manusia yaitu model CRF dan BERT serta mencoba untuk memodifikasi parameter yang terdapat pada model BERT. Hasil dari eksperimen adalah model CRF menghasilkan nilai F1-Score sebesar 0.72 dan BERT sebesar 0.50. Setelah mencoba memodifikasi parameter pada BERT ternyata dapat untuk meningkatkan nilai F1-Score-nya. Kontribusi utama penulis adalah membuat sistem ekstraksi entitas manusia dari Al-Quran dengan Bahasa Arab yang sudah ditransliterasikan secara buckwalter serta menganalisa performa dari algoritma yang akan digunakan.

Subjek

NATURAL LANGUAGE PROCESSING
NEURAL NETWORKS,

Katalog

Sistem Ekstraksi Entitas Manusia dengan Metode CRF dan BERT pada Al-Quran Bahasa Arab dengan Transliterasi Buckwalter
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

MUHAMMAD FAIZ ABDURRAHMAN DJAUHAR
Perorangan
Moch. Arif Bijaksana
 

Penerbit

Universitas Telkom, S1 Informatika
Bandung
2023

Koleksi

Kompetensi

  • CII4G3 - PEMROSESAN BAHASA ALAMI

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini