Maximum marginal relevance berbasis boolean model pada peringkasan artikel berita pendek

Arie, Atwa Magriyanti (2021) Maximum marginal relevance berbasis boolean model pada peringkasan artikel berita pendek. Jurnal Ilmiah Teknik Informatika dan Komunikasi, 1 (3): 5. pp. 77-88. ISSN 2827-8127

[thumbnail of 2827-8127_1_3_2021-5.pdf]
Preview
Text
2827-8127_1_3_2021-5.pdf - Published Version

Download (1MB) | Preview

Abstract

Portal berita online merupakan situs yang memuat segala berita dan artikel untuk dibaca pengunjung, berisi opini dan komentar-komentar seputar politik, teknologi dan lain-lain. Ada berbagai portal berita online yang bisa kita akses, antara lain antaranews.com dan tribunnews.com. Meningkatnya jumlah portal berita online, mengakibatkan tingginya jumlah berita yang bisa dibaca masyarakat. Oleh sebab itu, kebutuhan peringkasan teks (text summarization) semakin diperlukan masyarakat untuk kemudahan dan penghematan waktu. Sistem peringkasan teks otomatis yang digunakan pada penelitian sebelumnya, menggunakan metode Maximum Marginal Relevance (MMR) berbasis Vector Space Model (VSM) dengan representasi algoritma pembobotan kata menggunakan TF-IDF-DF (Term Frequency-Inverse Document Frequency-Document Frequency). Pada algoritma ini, kata yang sering muncul memiliki jumlah yang tinggi, sehingga bobot hubungan antara sebuah kata dan kalimat rendah, sehingga metode ini cocok untuk artikel panjang yang memiliki banyak jumlah kalimat. Oleh karena itu, perlu diusulkan metode lain untuk menghitung kesamaan kata dengan menggunakan boolean model dengan representasi jaccard, dice dan cosine coefficient. Ketiga metode ini digunakan untuk mengetahui document yang paling relevan untuk kumpulan kata kunci (query) yang diberikan. Setelah proses boolean, perlu dilakukan metode ekstraksi teks yang diterapkan yaitu MMR (Maximum Marginal Relevance) untuk meringkas document tunggal dengan cara melakukan rangking, membandingkan similarity query dan document, dan similarity antar document. Dari hasil penelitian, boolean model memiliki nilai akurasi yang lebih tinggi daripada VSM, dan di antara ketiga metode boolean model, metode cosine coefficient lebih unggul dengan akurasi 59.3 %.

Item Type: Article
Uncontrolled Keywords: text summarization, Vsm, Tf-Idf-df, Bolean model, Jaccard, Dice, Cosine coefficient, Mmr, Application of technology, Application software, Computer programs
Subjects: Computers, Control & Information Theory > Control Systems & Control Theory
Computers, Control & Information Theory > Information Theory
Computers, Control & Information Theory > Applications Software
Depositing User: M. Rifky Fauzan
Date Deposited: 16 Aug 2024 02:33
Last Modified: 16 Aug 2024 02:33
URI: https://karya.brin.go.id/id/eprint/37849

Actions (login required)

View Item
View Item