Analisa Penggunaan K-Gram pada Karakter, Kata dan Kalimat untuk Mendeteksi Kesamaan Dokumen

Penulis

  • Ida Widaningrum Universitas Muhammadiyah Ponorogo
  • Dyah Mustikasari Universitas Muhammadiyah Ponorogo
  • Rizal Arifin Universitas Muhammadiyah Ponorogo
  • Erika Diyah Cahyani Universitas Muhammadiyah Ponorogo

Kata Kunci:

Python, Karakter K-Gram, Kata K-Gram, Kalimat K-Gram, Algoritma Winnowing, Kemiripan Dokumen

Abstrak

Pemanfaatan teknologi digital menjadi sebuah kebutuhan saat ini, salah satu komponennya berupa
dokumen. Pendeteksian kesamaan bisa menggunakan berbagi macam cara, diantaranya adalah metode
fingerprinting. Fingerprint memiliki prinsip kerja menggunakan teknik hashing dan K-gram. Penelitian ini
difokuskan pada model deteksi menggunakan K-gram dengan menggunakan algoritma winnowing dan
python sebagai bahasa pemrograman. Pengujian parsing k-gram menggunakan 5 buah k yaitu k=2 k=3 k=4
k=5 k=6. Hasilnya, parsing karakter mendapatkan presentase lebih besar dari presentase manual karakter.
Presentase parsing kata, memiliki presentase yang paling mendekati dari presentase manual. Sedangkan pada
kalimat, presentasenya paling rendah dari presentase manual.

Unduhan

Data unduhan belum tersedia.

Biografi Penulis

Ida Widaningrum, Universitas Muhammadiyah Ponorogo

Departemen Teknik Informatika

Fakultas Teknik

Dyah Mustikasari, Universitas Muhammadiyah Ponorogo

Departemen Teknik Informatika
Fakultas Teknik

Rizal Arifin, Universitas Muhammadiyah Ponorogo

Departemen Teknik Informatika
Fakultas Teknik

Erika Diyah Cahyani, Universitas Muhammadiyah Ponorogo

Departemen Teknik Informatika
Fakultas Teknik

Referensi

Kemdikbud. (2016, 22 Januari 2020). KBBI online.

P. Istiana, "Membuat Sitasi dan Daftar Pustaka," in "Materi Pelatihan Kursus Pelatihan Instruktur Literasi Informasi. ," Universitas Padjajaran Bandung, Universitas Sanata Dharma, Yogyakarta 2013, vol. 27 December 2014.

I. Widiastuti, C. Rahmad, and Y. Ariyanto, "Aplikasi Pendeteksi Kemiripan pada Dokumen Menggunakan Algoritma Rabin Karp," Jurnal Informatika Polinema, vol. 1, no. 2, pp. 13-13, 2015.

S. Sunardi, A. Yudhana, and I. A. Mukaromah, "Implementasi Deteksi Plagiarisme Menggunakan Metode N-Gram Dan Jaccard Similarity Terhadap Algoritma Winnowing," 2018.

A. Prastyanti and S. N. Endah, "Sistem deteksi kemiripan kata pada dua dokumen menggunakan algoritma Rabin-Karp," Universitas Diponegoro, 2014.

R. Y. Dillak, F. Laumal, and L. J. Kadja, "Sistem Deteksi Dini Plagiarisme Tugas Akhir Mahasiswa Menggunakan Algoritma Ngrams dan Winnowing," Jurnal Ilmiah Flash, vol. 2, no. 1, pp. 12-18, 2016.

A. Kurniawati and I. Wicaksana, "Perbandingan pendekatan deteksi plagiarism dokumen dalam bahasa inggris," in Proceeding, Seminar Ilmiah Nasional Komputer dan Sistem Intelijen (KOMMIT 2008), 2008: Gunadarma University.

N. Alamsyah, "Perbandingan Algoritma Winnowing Dengan Algoritma Rabin Karp Untuk Mendeteksi Plagiarisme Pada Kemiripan Teks Judul Skripsi," Technologia: Jurnal Ilmiah, vol. 8, no. 3, pp. 124-134, 2017.

B. Zaman, E. Hariyanti, and E. Purwanti, "Sistem Deteksi Bahasa pada Dokumen menggunakan N-Gram," Multinetics, vol. 1, no. 2, pp. 21-26, 2015.

A. Radili and S. Sanjaya, "Penerapan Metode Winnowing Fingerprint dan Naive Bayes untuk Pengelompokan Dokumen," Jurnal

CoreIT: Jurnal Hasil Penelitian Ilmu Komputer dan Teknologi Informasi, vol. 3, no. 2, pp. 69-75, 2018.

S. Niwattanakul, J. Singthongchai, E. Naenudorn, and S. Wanapu, "Using of Jaccard coefficient for keywords similarity," in Proceedings of the international multiconference of engineers and computer scientists, 2013, vol. 1, no. 6, pp. 380-384.

Unduhan

Diterbitkan

2021-01-01

Cara Mengutip

Widaningrum, I., Mustikasari, D., Arifin, R., & Cahyani, E. D. (2021). Analisa Penggunaan K-Gram pada Karakter, Kata dan Kalimat untuk Mendeteksi Kesamaan Dokumen. Prosiding Seminar Nasional Teknoka, 5, 59–64. Diambil dari https://journal.uhamka.ac.id/index.php/teknoka/article/view/10233