Analisa Penggunaan K-Gram pada Karakter, Kata dan Kalimat untuk Mendeteksi Kesamaan Dokumen
Kata Kunci:
Python, Karakter K-Gram, Kata K-Gram, Kalimat K-Gram, Algoritma Winnowing, Kemiripan DokumenAbstrak
Pemanfaatan teknologi digital menjadi sebuah kebutuhan saat ini, salah satu komponennya berupa
dokumen. Pendeteksian kesamaan bisa menggunakan berbagi macam cara, diantaranya adalah metode
fingerprinting. Fingerprint memiliki prinsip kerja menggunakan teknik hashing dan K-gram. Penelitian ini
difokuskan pada model deteksi menggunakan K-gram dengan menggunakan algoritma winnowing dan
python sebagai bahasa pemrograman. Pengujian parsing k-gram menggunakan 5 buah k yaitu k=2 k=3 k=4
k=5 k=6. Hasilnya, parsing karakter mendapatkan presentase lebih besar dari presentase manual karakter.
Presentase parsing kata, memiliki presentase yang paling mendekati dari presentase manual. Sedangkan pada
kalimat, presentasenya paling rendah dari presentase manual.
Unduhan
Referensi
Kemdikbud. (2016, 22 Januari 2020). KBBI online.
P. Istiana, "Membuat Sitasi dan Daftar Pustaka," in "Materi Pelatihan Kursus Pelatihan Instruktur Literasi Informasi. ," Universitas Padjajaran Bandung, Universitas Sanata Dharma, Yogyakarta 2013, vol. 27 December 2014.
I. Widiastuti, C. Rahmad, and Y. Ariyanto, "Aplikasi Pendeteksi Kemiripan pada Dokumen Menggunakan Algoritma Rabin Karp," Jurnal Informatika Polinema, vol. 1, no. 2, pp. 13-13, 2015.
S. Sunardi, A. Yudhana, and I. A. Mukaromah, "Implementasi Deteksi Plagiarisme Menggunakan Metode N-Gram Dan Jaccard Similarity Terhadap Algoritma Winnowing," 2018.
A. Prastyanti and S. N. Endah, "Sistem deteksi kemiripan kata pada dua dokumen menggunakan algoritma Rabin-Karp," Universitas Diponegoro, 2014.
R. Y. Dillak, F. Laumal, and L. J. Kadja, "Sistem Deteksi Dini Plagiarisme Tugas Akhir Mahasiswa Menggunakan Algoritma Ngrams dan Winnowing," Jurnal Ilmiah Flash, vol. 2, no. 1, pp. 12-18, 2016.
A. Kurniawati and I. Wicaksana, "Perbandingan pendekatan deteksi plagiarism dokumen dalam bahasa inggris," in Proceeding, Seminar Ilmiah Nasional Komputer dan Sistem Intelijen (KOMMIT 2008), 2008: Gunadarma University.
N. Alamsyah, "Perbandingan Algoritma Winnowing Dengan Algoritma Rabin Karp Untuk Mendeteksi Plagiarisme Pada Kemiripan Teks Judul Skripsi," Technologia: Jurnal Ilmiah, vol. 8, no. 3, pp. 124-134, 2017.
B. Zaman, E. Hariyanti, and E. Purwanti, "Sistem Deteksi Bahasa pada Dokumen menggunakan N-Gram," Multinetics, vol. 1, no. 2, pp. 21-26, 2015.
A. Radili and S. Sanjaya, "Penerapan Metode Winnowing Fingerprint dan Naive Bayes untuk Pengelompokan Dokumen," Jurnal
CoreIT: Jurnal Hasil Penelitian Ilmu Komputer dan Teknologi Informasi, vol. 3, no. 2, pp. 69-75, 2018.
S. Niwattanakul, J. Singthongchai, E. Naenudorn, and S. Wanapu, "Using of Jaccard coefficient for keywords similarity," in Proceedings of the international multiconference of engineers and computer scientists, 2013, vol. 1, no. 6, pp. 380-384.
Unduhan
Diterbitkan
Cara Mengutip
Terbitan
Bagian
Lisensi
Hak Cipta (c) 2022 Prosiding Seminar Nasional Teknoka
Artikel ini berlisensiCreative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.