ABSTRAKSI: Character Recognition (CR) adalah sebuah sistem komputer yang digunakan untuk mengenali serangkaian karakter yang berasal dari mesin ketik, mesin cetak ataupun tulisan tangan. Dengan kata lain CR adalah proses pengalihan dokumen menjadi file teks tanpa harus pengetikan ulang, setiap karakter baik huruf, kata, kalimat dapat dikenali secara tepat dan dibaca oleh perangkat lunak yang lain.
Pada tugas akhir ini dikembangkan suatu aplikasi untuk mengidentifikasi huruf Arab (Hijaiyyah) pada suatu file gambar yang berisi karakter dan berasal dari pemindaian hardcopy (scanning) atau dari dokumen foto/gambar. Proses ekstraksi ciri menggunakan pendekatan vektor dan proses pengenalan karakter menggunakan jaringan syaraf tiruan Self-Organizing Maps. Pada proses tersebut akan ditentukan vektor penyusun garis karakter dengan cara menghubungkan titik-titik neuron yang ada pada suatu region karakter.
Pengujian dilakukan dengan mengambil sampel-sampel baik dari font yang ditraining maupun font yang tidak di training. Hasil akurasi terbaik terjadi pada ekstraksi ciri pergeseran region. Secara keseluruhan akurasi sistem yang dibuat sebesar 85.71% dengan waktu pengenalan rata-rata 0.9914-2.6504 detik per karakterKata Kunci : Arabian Character Recognition (ACR) , ekstraksi ciri , JaringanABSTRACT: Character recognition (CR) is a computer system which is used for recognizing character combination that is became from typewriter or handwriting. Other words, CR is a process document changing to text file without re-typing, each character even word, sentence, can be recognized exactly and read by other software.
In this final project, developed an application for identifying Arabic words (Hijaiyyah) in a picture file which is filled character that came from handwriting hardcopy scanned or other picture or photos document. Process characteristic extraction uses vector approach and character identifying process using artificial neuron network Self Organizing Maps. In that process, will be executed vector character line by connecting dots of neuron which are in a character region.
To evaluate performance from application that using that method, will be tested to some input samples which is source from trained font and non trained font. The best result come from region shift feature extraction. Overall, the system accuracy level is approximately 85.71% with running time at 0.9914-2.6504 seconds foe each character.Keyword: Arabian Character Recognition (ACR) , feature extraction , Self