Seiring dengan perkembangan teknologi yang begitu cepat dalam hal pengumpulan dan penyimpanan data menyebabkan tumpukan data yang sangat banyak. Dengan adanya kumpulan data yang banyak, maka muncullah suatu kebutuhan untuk bisa memanfaatkan data tersebut. Pemanfaatan data tersebut tentunya bertujuan untuk mendapatkan informasi yang penting dari pola-pola data yang terbentuk.
Data yang dapat digunakan bisa diambil di sosial media salah satunya twitter. Twitter adalah salah satu media sosial yang cukup digemari oleh seluruh kalangan, tercatat sekitar 50 juta orang di Indonesia menggunakan twitter. Dengan banyaknya pengguna twitter maka data yang dapat dimanfaatkan juga banyak.
Cara untuk mendapatkan informasi dari sebuah data bisa menggunakan metode klasifikasi. Salah satu algoritma dalam klasifikasi adalah algortima K-Nearest Neighbor Classifier. Algoritma KNN mempunyai sistem kerja dengan menghitung jarak terdekat dari record uji ke record testing dengan menggunakan metode Eucliden Distance. Hasil dari proses KNN berupa jarak terdekat dari record uji ke record testing sebanyak K yang diperlukan.