Peringkasan Teks Otomatis Artikel Berbahasa Indonesia Menggunakan Algoritma Textrank
Kata Kunci:
peringkasan teks otomatis, compression rate, rouge, skor kalimat, textrankAbstrak
Banyaknya informasi yang terdapat pada media online salah satunya adalah artikel. Artikel pada umumnya berisikan kumpulan kalimat yang panjang sehingga pembaca membutuhkan waktu yang lebih banyak untuk memperoleh intisari dari artikel. Sistem peringkasan teks otomatis membantu pengguna mengetahui isi artikel tanpa harus membaca keseluruhan dokumen, sehingga dapat menghemat waktu. Penelitian ini menyelidiki algoritma textrank untuk peringkasan dokumen. Algoritma textrank akan menghitung skor dari setiap kalimat, kemudian memilih sejumlah kalimat sebagai ringkasan. ROUGE scoring digunakan untuk menghitung performa sistem berdasarkan ringkasan manual yang dibuat oleh manusia (human annotator) sebagai gold standard. Hasil pengujian dengan compression rate 50% pada pilihan ranking kalimat yang terpilih sebagai ringkasan, menghasilkan nilai pada ROUGE-1, ROUGE-2 dan ROUGE-L secara berturut-turut adalah 68.76%, 60.60%, dan 68.29%. Sedangkan untuk compression rate 30%, rata-rata pada ROUGE-1, ROUGE2 dan ROUGE-L berturut-turut adalah 45.00%, 31.62%, dan 43.59%. Hasil ini sangat kompetitif dibandingkan dengan score pada penelitian tentang sistem peringkasan dokumen lainnya.
Unduhan
Referensi
J. Pragantha, T. Informatika, F. T. Informasi, and U. Tarumanagara, “Penerapan Algoritma Textrank Untuk Automatic Summarization
Pada Dokumen Berbahasa Indonesia,” vol. 1, no. 1, pp. 71–78, 2017.
J. Kurniawati and S. Baroroh, “Literasi Media Digital Mahasiswa Universitas Muhammadiyah Bengkulu,” J. Komun., vol. 8, no. 2, pp. 51–66, 2016, [Online]. Available: https://journal.umy.ac.id/index.php/jkm/article/download/2069/2586
D. P. Ismi and F. Ardianto, “Peringkasan Ekstraktif Teks Bahasa Indonesia dengan Pendekatan Unsupervised Menggunakan Metode Clustering,” Cybernetics, vol. 3, no. 02, p. 90, 2020, doi: 10.29406/cbn.v3i02.2290.
Y. Yuliska and K. U. Syaliman, “Literatur Review Terhadap Metode, Aplikasi dan Dataset Peringkasan Dokumen Teks Otomatis untuk Teks Berbahasa Indonesia,” IT J. Res. Dev., vol. 5, no. 1, pp. 19–31, 2020, doi: 10.25299/itjrd.2020.vol5(1).4688.
Y. M. Sari and N. S. Fatonah, “Peringkasan Teks Otomatis pada Modul Pembelajaran Berbahasa Indonesia Menggunakan Cross Latent Semantic Analysis (CLSA),” vol. 7, no.2, pp. 153–159, 2021.
F. Kiyoumarsi, “Evaluation of Automatic Text Summarizations based on Human Summaries,”Procedia - Soc. Behav. Sci., vol. 192, pp. 83–91, 2015, doi: 10.1016/j.sbspro.2015.06.013.
M. P. Akademik and M. Pematangsiantar, “Pengenalan algortima dalam model peringkasan teks untuk mempercepat pekerjaan akademik,” vol. 1, no. 2, pp. 19–26, 2021.
M. A. Zamzam, “Sistem Automatic Text Summarization Menggunakan Algoritma Textrank,” Matics, vol. 12, no. 2, pp. 111–116, 2020, doi: 10.18860/mat.v12i2.8372.
D. Gunawan, S. H. Harahap, and R. F. Rahmat, “Peringkasan multi-dokumen dengan menggunakan Textrank dan Relevansi Marjinal Maksimal untuk Teks di Bahasa Indonesia,” 2019.
F. S. Jumeilah, “Penerapan Support Vector Machine (SVM) untuk Pengkategorian Penelitian,” J. RESTI (Rekayasa Sist. dan Teknol. Informasi), vol. 1, no. 1, pp. 19–25, 2017, doi: 10.29207/resti.v1i1.11.
M. Kannan, S., Gurusamy, V., Vijayarani, S., Ilamathi, J. & Nithya, “Preprocessing Techniques for Text Mining Preprocessing Techniques for Text Mining,” Int. J. Comput. Sci. Commun. Networks, vol. 5, no. October 2014, pp. 7–16, 2015.
M. F. Fakhrezi, M. A. Bijaksana, and A. F. Huda, “Implementation of Automatic Text Summarization with Textrank Method in the Development of Al-Qur’an Vocabulary Encyclopedia,” Procedia Comput. Sci., vol. 179, no. 2020, pp. 391–398, 2021, doi: 10.1016/j.procs.2021.01.021.
A. F. Zulfikar, “Pengembangan Algoritma Stemming Bahasa Indonesia dengan Pendekatan Dictionary Base Stemming untuk Menentukan Kata Dasar dari Kata yang Berimbuhan,” J. Inform. Univ. Pamulang, vol. 2, no. 3, p. 143, 2017, doi: 10.32493/informatika.v2i3.1443.
Unduhan
Diterbitkan
Cara Mengutip
Terbitan
Bagian
Lisensi
Hak Cipta (c) 2023 Prosiding Seminar Nasional Teknoka
Artikel ini berlisensiCreative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.