ABSTRAKSI: Optical Character Recognition (OCR) adalah sebuah sistem komputer yang digunakan secara otomatis mengenali serangkaian karakter yang berasal dari mesin ketik, mesin cetak ataupun tulisan tangan. Dengan kata lain OCR adalah proses pengalihan dokumen teks menjadi file komputer tanpa harus pengeditan ulang, setiap karakter baik huruf, kata, kalimat dapat dikenali secara tepat dan dibaca oleh perangkat lunak yang lain, tanpa harus pengetikan ulang dan editing. Pada penelitian sebelumnya, teknik OCR dikembangkan dengan menggunakan pendekatan vektor dan region pada ekstraksi cirinya, untuk mengidentifikasi suatu file gambar (bmp) yang berisi karakter yang berasal dari pemindaian hardcopy atau dari sumber lainnya hanya sampai pada tahap pengenalan karakter yang mempunyai tingkat keakuratan karakter rata-rata sekitar 86%.
Maka pada proyek akhir ini dibuat suatu aplikasi yang dapat menambah akurasi pada proses sistem OCR yang dikembangkan dengan menggunakan pendekatan vektor dan region pada ekstraksi cirinya, dengan sistem Auto Correct. Auto Correct bekerja dengan cara mengidentifikasi susunan karakter pada artikel teks hasil sistem OCR menjadi sebuah kata. Kemudian mengoreksi ejaan kata tersebut, lalu membandingkan masingmasing kata pada database. Database merupakan kumpulan kata yang dibuat seperti kamus yang disusun berdasarkan abjad. Lalu sistem akan menghitung akurasi secara otomatis.
Untuk mengevaluasi performansi dari Auto Correct dengan menggunakan metode tersebut, dilakukan pengujian terhadap beberapa sampel masukan baik yang berasal dari dokumen hardcopy maupun yang berasal dari sumber lainnya. Hasil analisis menunjukkan bahwa sistem Auto Correct ini mampu menaikkan akurasi kata sebesar 21.53 % untuk font yang sudah dilatihkan oleh sistem OCR.Kata Kunci : OCR, autocorrect.ABSTRACT: Optical Character Recognition (OCR) is a computer system which is used automatically to recognize a part of character coming from typewriter, letterpress and or handwriting. In the other hand, OCR is a process of transferring the text document become the computer file without having to expurgation repeat, every characters such as letter, word, sentence can be recognized precisely and read by other software, without having to type repeating and editing. At the last final project, technique OCR developed using the approach of vector and region at extractions distinguish process, to identify the character at one file picture (*.bmp) which contains character from hardcopy or other source. The extractions distinguish process using the approach of vector and region only until to identify the character which have recognition rate 86 %.
Hence at this final project made an application which can add the accuration of at process of system OCR developed by using approach of vector and region of its extractions characteristic, with the Auto Correct system. Auto Correct working by identifying character formation at text article of result by system OCR become a word. Then correct the word spelling, and then compare each word at database. Database represents the word corps made by like dictionary compiled by pursuant to alphabet. Last system will calculate the accuration automatically.
To evaluate the performance of Auto Correct by using that method, conducted an examination to some input samples which is coming from document of hardcopy or other source. The result shows that this Auto Correct system able to increase recognition word rate 21.53 % in trained font by OCR system.Keyword: OCR, autocorrect.