Informasi Umum

Kode

17.04.049

Klasifikasi

620.007 - Engineering research

Jenis

Karya Ilmiah - Skripsi (S1) - Reference

Subjek

Text Mining

Dilihat

326 kali

Informasi Lainnya

Abstraksi

Dalam kehidupan umat Islam, pemahaman terhadap isi Al-Qur’an sebagai pedoman hidup, adalah hal yang sangat penting. Al-Qur’an sebagai referensi utama umat Islam pada umumnya tertulis dalam bahsa Arab. Untuk melakukan proses teks, salah satu preproses awal adalah tokenisasi. Sehingga semua proses teks mensyaratkan dilakukan tokenisasi terlebih dahulu. Pada bahasa Indoensia dan bahasa Inggris tokenisasi dapat dilakukan dengan sederhana, dimana token dibatasi dengan spasi. Namun pada bahasa Arab, sebagaimana juga pada beberapa bahasa lain seperti bahasa Jepang dan Cina, spasi tidak bisa digunakan sebagai batas token. Pada Tugas Akhir ini, akan dilakukan tokensisasi untuk bahasa Arab dengan kasus untuk Al Qur’an. Sebagai baseline adalah Maximum Matching ( atau disebut juga greedy ). Pada maximum matching ini dilakukan proses matching terhadap kamus. Kata Kunci : tokenisasi, bahasa arab, Al-Qur’an.

  • CS3213 - PEMROGRAMAN ORIENTASI OBJEK
  • CDG4K3 - DATA MINING

Koleksi & Sirkulasi

Tersedia 1 dari total 1 Koleksi

Anda harus log in untuk mengakses flippingbook

Pengarang

Nama IRHAM NUR
Jenis Perorangan
Penyunting Moch. Arif Bijakasana, Arief Fathul Huda
Penerjemah

Penerbit

Nama Universitas Telkom
Kota Bandung
Tahun 2017

Sirkulasi

Harga sewa IDR 0,00
Denda harian IDR 0,00
Jenis Non-Sirkulasi