ABSTRAKSI: Jepang merupakan negara yang menggunakan huruf yang berbeda dengan huruf Latin. Sehingga memerlukan waktu yang lama untuk mempelajari bahasa Jepang karena harus menghafal hurufnya terlebih dahulu. Tetapi dalam kenyataannya, cukup sulit untuk menghafal huruf Jepang karena bentuknya yang kompleks.
Pada tugas akhir ini dibuat sistem pembacaan huruf Jepang berupa program aplikasi yang berfungsi untuk mengidentifikasi huruf Jepang khususnya huruf Kana (Hiragana-Katakana) kemudian menerjemahkannya menjadi huruf Latin dengan menggunakan Optical Character Recognition (OCR), yaitu sebuah sistem komputer yang digunakan untuk mengenali serangkaian karakter yang berasal dari mesin ketik, mesin cetak, ataupun tulisan tangan. Serangkaian huruf Jepang yang akan diidentifikasi dalam tugas akhir ini berasal dari teks huruf Jepang yang berasal dari print-out atau huruf cetak yang kemudian gambarnya diambil oleh webcam dan diproses secara langsung untuk diterjemahkan menjadi huruf Latin.
Pada prosesnya dilakukan 5 tahapan. Pada tahap preprocessing dilakukan pengubahan warna citra menjadi citra BW, pada tahap segmentasi dilakukan pemisahan region pada tiap karakter yang akan dideteksi, dan pada tahap normalisasi dilakukan proses perubahan dimensi karakter. Selanjutnya, pada tahap ekstraksi ciri dilakukan pengambilan ciri-ciri tertentu dari tiap karakter. Dan pada tahap pengenalan karakter yang menggunakan JST Self Organizing Map (SOM) dilakukan penentuan vektor penyusun garis karakter dengan cara menghubungkan titik-titik neuron yang ada pada suatu region karakter.
Pengujian dilakukan dengan mengambil sampel-sampel baik dari font yang sudah dilatih maupun yang belum. Hasil akurasi terbaik adalah 83.33% untuk huruf Hiragana dan 77.55% untuk huruf Katakana dengan waktu proses penerjemahan rata-rata 0.256614 detik per karakter dan waktu pengambilan gambar rata-rata 1 detik.Kata Kunci : Kata kunci: huruf Kana(Hiragana-Katakana), print-out, OCR, webcam, ekstraksi ciri, Jaringan Syaraf Tiruan SOM.ABSTRACT: Japan is a country which uses different letter with Latin character. So, need more time to learn Japanese language because we must know the all of Japanese character before. But the fact, not easy to learn Japanese character because of its shape which very complex.
In this final project, designed the reading Japanese character system in the form of application program which the function is to identify Japanese character especially Kana (Hiragana-Katakana) character then translate it to Latin character by using Optical Character Recognition (OCR), a computer system which used to recognize a combination of character from typewriter, printer or handwriting. The combination of Japanese character which identified in this final project is from printed Japanese character document. Then the image of that document is captured by webcam and processed directly to translate it in Latin character.
In its process are done 5 steps. In preprocessing is done the modification of image color to BW image, in segmentation step is done the region separation at each character which will be detected, and in normalization process is done the modification of character dimension. Then, in feature extraction is done the removal of certain features of each character. And in the character recognizing character which use Self Organizing Map (SOM) artificial neural network is done the determining of vector character line by connecting the dots of neuron in a character region.
The testing process is done by taking samples of training image and not training image. The best accuracy result is 83.33% to Hiragana character and 77.55% to Katakana character with the recognizing times is 0.256614 second to each character and time for capturing image is 1 second.Keyword: Kana (Hiragana-Katakana) character, printed, OCR, webcam, feature extraction, SOM artificial neural network.