Analisis dan Implementasi Clustering Berita Berbahasa Indonesia Menggunakan Algoritma K-means

Hazmi Alfiyatur Rahmah

Informasi Dasar

113030069
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Saat ini kebutuhan akan segala jenis informasi telah menjadi suatu hal yang sangat penting. Informasi dapat berasal dari berbagai sumber elektronik maupun non-elektronik, salah satunya adalah berita. Internet merupakan sarana yang paling ampuh dalam penyebaran informasi. Berita pun kini dapat dengan mudah didapatkan melalui internet, melalui situs-situs media yang sangat beragam. Sehingga, jumlah berita yang tersedia sangat besar dan menyulitkan bagi pembaca berita untuk mendapatkan secara tepat berita yang diinginkannya.
Tugas Akhir ini berusaha untuk mengelompokkan berita berbahasa Indonesia. Clustering dokumen text dapat menjadi suatu alternatif dalam mengelompokkan berita. Document clustering merupakan suatu proses mengelompokkan dokumen-dokumen, sehingga dokumen yang memiliki banyak kemiripan (similar) masuk dalam satu kluster, dan dokumen yang berbeda (dissimilar) ke dalam kluster yang berbeda pula. Sehingga berita dengan topik yang masih berkaitan ditempatkan dalam satu kelompok (cluster). Algoritma clustering yang digunakan adalah algoritma K-means clustering.
Analisis terhadap penggunaan stemming diujicobakan juga dalam tahap preprocessing untuk melihat pengaruhnya terhadap kualitas cluster yang dihasilkan dengan menggunakan metode Purity. Dari hasil ujicoba hasil purity yang terbaik didapatkan dari proses clustering yang melalui tahap stemming.Kata Kunci : clustering,berita berbahasa Indonesia, K-means, stemming, purity.ABSTRACT: Today, needing for informations was becoming one of the most important thing. Informations come from electronic and nonelectronic source, one of this is news. Internet is a most effective medium for distributing of informations. Now news can be obtained more easily through internet, in many sites. So, the number of news which is available in become greater and it is difficult for the readers getting the right news that needed.
This final project try to group Indonesian news. Document clustering is an alternative for grouping news. Document clustering is a process to group documents, so that document which has many similarities with other document in same cluster and many dissimilarities with other document in different cluster. The algorithm that implemented in this final project is K-means clustering.
Analysis concerning to stemming that is used in preprocessing to analyse connection between stemming, and the quality of cluster by use purity. The best result from clustering is combining from stemming.Keyword: clustering, Indonesian news, K-means, stemming, purity.

Subjek

Rekayasa Perangkat Lunak
 

Katalog

Analisis dan Implementasi Clustering Berita Berbahasa Indonesia Menggunakan Algoritma K-means
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Hazmi Alfiyatur Rahmah
Perorangan
Moch. Arif Bijaksana, Kiki Maulana
 

Penerbit

Universitas Telkom
Bandung
2008

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini