Banyaknya pertanyaan yang diajukan oleh para pengguna user terhadap suatu layanan membuat user lain tidak mendapat jawaban dengan cepat, hal ini dapat mengakibatkan tingkat kepuasan user terhadap layanan menurun. Untuk menyelesaikan permasalahan tersebut, penelitian ini membuat sebuah sistem Question Answering yang dapat memberikan jawaban yang relevan dengan lebih cepat, sesuai dengan pertanyaan yang diajukan. Metode yang digunakan adalah Question Retrieval dimana sistem akan memberikan jawaban yang paling relevan berdasarkan pertanyaan-pertanyaan tersimpan. Sulitnya memaknai dua pertanyaan dengan penggunaan kata yang berbeda namun memiliki makna sama, membuat penelitian ini menarik untuk diteliti. Selain itu dataset yang digunakan pada penelitian ini memiliki 49.66% kata pada kosakata yang baru muncul satu kali (langka), hal ini membuat besar kemungkinan adanya pertanyaan baru yang mengandung kata langka. Penelitian ini melakukan perbandingan antara penggunaan fitur satu kata penuh dengan subkata untuk mendapatkan hasil representasi kata word embedding terbaik. Hasil word embedding digunakan untuk mencari nilai cosine similarity antara pertanyaan baru query dengan pertanyaan yang tersimpan, sehingga pada akhirnya user akan menerima jawaban berdasarkan pertanyaan yang memiliki nilai cosine terbesar. Berdasarkan hasil perbandingan, disimpulkan bahwa fitur subkata tepat digunakan untuk melakukan word embedding pada dataset percakapan pendek yang digunakan.