Sistem Ekstraksi Entitas Manusia dengan Metode CRF dan BERT pada Al-Quran Bahasa Arab dengan Transliterasi Buckwalter

MUHAMMAD FAIZ ABDURRAHMAN DJAUHAR

Sistem Ekstraksi Entitas Manusia dengan Metode CRF dan BERT pada Al-Quran Bahasa Arab dengan Transliterasi Buckwalter

MUHAMMAD FAIZ ABDURRAHMAN DJAUHAR

Informasi Dasar

Sistem Ekstraksi Entitas Manusia dengan Metode CRF dan BERT pada Al-Quran Bahasa Arab dengan Transliterasi Buckwalter

Dilihat

421 kali

No. Katalog

23.04.2694

Klasifikasi

006.32

Jenis katalog

Karya Ilmiah - Skripsi (S1) - Reference

Abstraksi

Al-Quran merupakan kitab suci umat Islam dan terdiri dari surat dan ayat yang banyak serta memiliki kandungan arti yang beragam. Dengan adanya kandungan arti yang beragam memiliki struktur entitas yang banyak sehingga sulit untuk dilakukan secara manual karena memakan waktu dan usaha yang besar. Oleh karena itu dibuat sistem ekstraksi entitas manusia yang bisa berjalan secara otomatis sehingga dapat
mempermudah dan mempercepat dalam ekstraksi entitas manusia. Ekstraksi entitas manusia sendiri merupakan salah satu tugas dari Named Entity Recognition atau NER yang berfokus kepada identifikasi entitas manusia seperti nama ataupun yang memiliki makna sama dengan manusia. Contoh input dan termasuk kedalam entitas manusia bernama yaitu Al-Quran surat Al-Baqarah ayat 8 dengan bahasa arab yang sudah ditransliterasikan secara buckwalter yaituWa, mina, {l, n˜aAsi, man, yaquwlu, ’aAma, n˜aA, bi, {ll˜ahi, wa, bi, {lo, yawomi, {lo, ’aAxiri, wa, maA, hum, bi, mu&ominiyna. Dalam ayat tersebut kalimat yang termasuk entitas adalah man, yaquwlu, ’aAma, n˜aA, bi, {ll˜ahi, wa, bi, {lo, yawomi, {lo, ’aAxiri. Pada saat ini masih belum banyak yang membuat sistem ekstraksi entitas manusia dalam Al-Quran. Oleh karena itu penulis dalam Tugas Akhir ini akan mengaplikasikan sistem ekstraksi entitas manusia dengan input berupa Al-Quran Bahasa Arab Transliterasi Buckwalter. Dilakukan eksperimen yaitu membandingkan nilai F1-Score dari dua model ekstraksi entitas manusia yaitu model CRF dan BERT serta mencoba untuk memodifikasi parameter yang terdapat pada model BERT. Hasil dari eksperimen adalah model CRF menghasilkan nilai F1-Score sebesar 0.72 dan BERT sebesar 0.50. Setelah mencoba memodifikasi parameter pada BERT ternyata dapat untuk meningkatkan nilai F1-Score-nya. Kontribusi utama penulis adalah membuat sistem ekstraksi entitas manusia dari Al-Quran dengan Bahasa Arab yang sudah ditransliterasikan secara buckwalter serta menganalisa performa dari algoritma yang akan digunakan.