ABSTRAKSI: Sebagian besar dari informasi pada Web diisi di struktur obyek yang teratur, disebut dengan data record. Data record ini sangat penting karena mempresentasikan inti informasi dari halaman host-nya, misalnya daftar produk atau layanan. Me-mining data record untuk mengekstrak informasi dari halaman Web bertujuan untuk menyediakan nilai tambah suatu layanan.
Pada Tugas Akhir ini diimplementasikan metode untuk mining data record pada halaman Web secara otomatis dengan menggunakan algoritma yang disebut MDR (Mining Data Records in Web Page). Teknik ini lebih efektif karena hanya berdasarkan pada dua pengamatan penting saja, yaitu mengamati data record yang berada pada halaman Web dan algoritma pencocokan string. Pada proses me-mining data record ini ada tiga langkah yang utama yaitu, membangun sebuah tag tree HTML dari halaman Web, mining data region pada halaman Web dengan menggunakan tag tree dan pencocokan string, dan mengidentifikasi data record dari setiap data region.
Tahap analisis dan pengujian memberikan hasil bahwa algoritma MDR yang dibangun terbukti bisa mendapatkan data record pada halaman Web meskipun ada beberapa noise.Kata Kunci : Web Mining, tag tree HTML, data region, data record.ABSTRACT: A large amount of information on the Web is contained in regularly structured objects, which call data record. Data record are important because often present the essential information of it host pages, e.g, list of products and services. It is useful to mine such data record in order to extract information from web pages to provide value-added services.
In this Final project is implemented method for mining data records in web pages automatic with use algorithm is called MDR (Mining Data Records in Web Pages). This technique is more effective because just based on two important observations i.e, observe data records in Web pages and a string matching algorithm. In the process of mining data records are three main steps, i.e, building a HTML tag tree of the page, mining data regions in the Web pages using the tag tree and string comparison, and identifiying data records from each data region.
From implementation and analyse stage shown that MDR algorithm is built proved to can find out data rcords in Web pages though it is noise.Keyword: Web Mining, data mining, tag tree HTML, data region, data record.