Peringkasan Teks Otomatis Artikel Berbahasa Indonesia Menggunakan Algoritma Textrank

Faizah Husniah; Surya Agustian; Iis Afrianty

Penulis

Faizah Husniah Universitas Islam Negeri Sultan Syarif Kasim Riau
Surya Agustian Universitas Islam Negeri Sultan Syarif Kasim Riau
Iis Afrianty Universitas Islam Negeri Sultan Syarif Kasim Riau

Kata Kunci:

peringkasan teks otomatis, compression rate, rouge, skor kalimat, textrank

Abstrak

Banyaknya informasi yang terdapat pada media online salah satunya adalah artikel. Artikel pada umumnya berisikan kumpulan kalimat yang panjang sehingga pembaca membutuhkan waktu yang lebih banyak untuk memperoleh intisari dari artikel. Sistem peringkasan teks otomatis membantu pengguna mengetahui isi artikel tanpa harus membaca keseluruhan dokumen, sehingga dapat menghemat waktu. Penelitian ini menyelidiki algoritma textrank untuk peringkasan dokumen. Algoritma textrank akan menghitung skor dari setiap kalimat, kemudian memilih sejumlah kalimat sebagai ringkasan. ROUGE scoring digunakan untuk menghitung performa sistem berdasarkan ringkasan manual yang dibuat oleh manusia (human annotator) sebagai gold standard. Hasil pengujian dengan compression rate 50% pada pilihan ranking kalimat yang terpilih sebagai ringkasan, menghasilkan nilai pada ROUGE-1, ROUGE-2 dan ROUGE-L secara berturut-turut adalah 68.76%, 60.60%, dan 68.29%. Sedangkan untuk compression rate 30%, rata-rata pada ROUGE-1, ROUGE2 dan ROUGE-L berturut-turut adalah 45.00%, 31.62%, dan 43.59%. Hasil ini sangat kompetitif dibandingkan dengan score pada penelitian tentang sistem peringkasan dokumen lainnya.

Unduhan

Data unduhan belum tersedia.

Biografi Penulis

Faizah Husniah, Universitas Islam Negeri Sultan Syarif Kasim Riau

Fakultas Sains & Teknologi

Teknik Informatika

Surya Agustian, Universitas Islam Negeri Sultan Syarif Kasim Riau

Fakultas Sains & Teknologi

Teknik Informatika

Iis Afrianty, Universitas Islam Negeri Sultan Syarif Kasim Riau

Fakultas Sains & Teknologi

Teknik Informatika

Referensi

J. Pragantha, T. Informatika, F. T. Informasi, and U. Tarumanagara, “Penerapan Algoritma Textrank Untuk Automatic Summarization

Pada Dokumen Berbahasa Indonesia,” vol. 1, no. 1, pp. 71–78, 2017.

J. Kurniawati and S. Baroroh, “Literasi Media Digital Mahasiswa Universitas Muhammadiyah Bengkulu,” J. Komun., vol. 8, no. 2, pp. 51–66, 2016, [Online]. Available: https://journal.umy.ac.id/index.php/jkm/article/download/2069/2586

D. P. Ismi and F. Ardianto, “Peringkasan Ekstraktif Teks Bahasa Indonesia dengan Pendekatan Unsupervised Menggunakan Metode Clustering,” Cybernetics, vol. 3, no. 02, p. 90, 2020, doi: 10.29406/cbn.v3i02.2290.

Y. Yuliska and K. U. Syaliman, “Literatur Review Terhadap Metode, Aplikasi dan Dataset Peringkasan Dokumen Teks Otomatis untuk Teks Berbahasa Indonesia,” IT J. Res. Dev., vol. 5, no. 1, pp. 19–31, 2020, doi: 10.25299/itjrd.2020.vol5(1).4688.

Y. M. Sari and N. S. Fatonah, “Peringkasan Teks Otomatis pada Modul Pembelajaran Berbahasa Indonesia Menggunakan Cross Latent Semantic Analysis (CLSA),” vol. 7, no.2, pp. 153–159, 2021.

F. Kiyoumarsi, “Evaluation of Automatic Text Summarizations based on Human Summaries,”Procedia - Soc. Behav. Sci., vol. 192, pp. 83–91, 2015, doi: 10.1016/j.sbspro.2015.06.013.

M. P. Akademik and M. Pematangsiantar, “Pengenalan algortima dalam model peringkasan teks untuk mempercepat pekerjaan akademik,” vol. 1, no. 2, pp. 19–26, 2021.

M. A. Zamzam, “Sistem Automatic Text Summarization Menggunakan Algoritma Textrank,” Matics, vol. 12, no. 2, pp. 111–116, 2020, doi: 10.18860/mat.v12i2.8372.

D. Gunawan, S. H. Harahap, and R. F. Rahmat, “Peringkasan multi-dokumen dengan menggunakan Textrank dan Relevansi Marjinal Maksimal untuk Teks di Bahasa Indonesia,” 2019.

F. S. Jumeilah, “Penerapan Support Vector Machine (SVM) untuk Pengkategorian Penelitian,” J. RESTI (Rekayasa Sist. dan Teknol. Informasi), vol. 1, no. 1, pp. 19–25, 2017, doi: 10.29207/resti.v1i1.11.

M. Kannan, S., Gurusamy, V., Vijayarani, S., Ilamathi, J. & Nithya, “Preprocessing Techniques for Text Mining Preprocessing Techniques for Text Mining,” Int. J. Comput. Sci. Commun. Networks, vol. 5, no. October 2014, pp. 7–16, 2015.

M. F. Fakhrezi, M. A. Bijaksana, and A. F. Huda, “Implementation of Automatic Text Summarization with Textrank Method in the Development of Al-Qur’an Vocabulary Encyclopedia,” Procedia Comput. Sci., vol. 179, no. 2020, pp. 391–398, 2021, doi: 10.1016/j.procs.2021.01.021.

A. F. Zulfikar, “Pengembangan Algoritma Stemming Bahasa Indonesia dengan Pendekatan Dictionary Base Stemming untuk Menentukan Kata Dasar dari Kata yang Berimbuhan,” J. Inform. Univ. Pamulang, vol. 2, no. 3, p. 143, 2017, doi: 10.32493/informatika.v2i3.1443.