ABSTRAKSI: Peringkasan teks otomatis adalah aplikasi yang mampu meringkas suatu teks dan menghasilkan peringkasan yang langsung dapat dipergunakan tanpa proses editing terhadap hasil peringkasan tersebut. Peringkasan teks merupakan salah satu bidang yang sedang dikembangkan dalam beberapa tahun ini dengan menggunakan algoritma khusus dan metode yang memungkinkan. Terdapat dua tipe dari pembuatan suatu ringkasan yang mengambil bagian terpenting dari teks aslinya, yaitu: abstrak dan ekstrak.
Dalam penelitian ini digunakan metode ekstrak dengan mengidentifikasikan bagian informasi penting dalam tulisan didasarkan pada analisis statistika penghitungan frekuensi kemunculan kata, yaitu dengan menggunakan metode Term Frequency (TF) dan LEAD. Pada penelitian ini, istilah yang muncul pada judul atau headline diperhitungkan sebagai masukan. Untuk pembangkitan peringkasan dilakukan pemilihan kalimat penting dalam dokumen berdasarkan parameter TF, LEAD dan Headline.
Perangkat lunak ini diimplementasikan dengan bahasa pemrograman VB.NET dan semua data disimpan dalam file berektensi .txt dengan metode pengaksesan B+tree. Perangkat lunak yang dibangun memiliki masukan dan keluaran dalam bahasa Indonesia. Masukan perangkat lunak berupa dokumen tunggal, yaitu suatu dokumen berformat plain text yang memuat satu sumber berita dengan satu judul dan atau satu headline.
Perangkat lunak yang dihasilkan mampu mempermudah seseorang untuk mengetahui intisari kalimat dari suatu artikel secara otomatis. Dari hasil pengujian diperoleh kesimpulan bahwa peringkasan yang dihasilkan lebih sesuai jika masukan berupa artikel berita.Kata Kunci : Peringkasan teks otomatis, ekstrak, TF, LEAD, headline.ABSTRACT: Automatic Text Summarizer is software that is able to make summary from a text which can be use directly without editing to the summary. Text Summarization is one of area which is being developed in few years by using specific algorithm and available method. There are two types of summarization which take the important part of the original text: abstract and extract.
In this research, extraction method is used with identification part of important information in article relied on enumeration frequency of word apparition statistical analysis, using Term Frequency (TF) and LEAD method. In this research, we also consider terms used in title or headline as an input. The summarizing evocation conducted by an important sentence election in document according to TF, LEAD and headline parameters.
This software is implemented using VB.NET programming language and all data are stored in .txt file using B+tree accessing method. This software has input and output text in Indonesian language. Software’s input is a single document, which is a plain text document contains a news source with a title and or a headline.
With this software, people can easily obtain the main idea of an article automatically. The evaluation of the software show that the summary result is more appropriate if the input is news article.Keyword: Automatic text summarization, extract, TF, LEAD, headline.