PENERAPAN METODE N-GRAM UNTUK MEMPERBAIKI KESALAHAN PENULISAN EJAAN KATA KUNCI PADA APLIKASI PENCARIAN HADIS

Rifa'atus Shalihah, Ika Purwanti Ningrum, Adha Mashur Sajiah, Muhammad Ihsan Sarita

Abstract


Perkembangan dunia akan teknologi sangat mempengaruhi kebutuhan informasi masyarakat. Salah satunya dalam pengutipan hadis dan penyebarannya melalui aplikasi pencarian. Salah satu fitur penting pada aplikasi pencarian adalah spelling correction. Saat pengguna mengetik kata kunci, terkadang kesalahan ejaan terjadi karena ketidaktahuan penulis tentang ejaan bahasa yang benar serta pengguna yang salah menekan tombol keyboard. Akibatnya hasil pencarian salah dan informasi yang diinginkan tidak didapatkan. Metode n-gram adalah salah satu alternatif untuk menyelesaikan masalah pengkoreksian ejaan kata. Dalam penelitian ini dibangun sistem dengan menggunakan n-gram. Metode n-gram menggunakan dictionary look-up dengan cara membandingkan n-gram dari kata yang salah dengan n-gram kata di database. Setelah itu melakukan perhitungan jarak dengan metode Jaccard similarity. Dari hasil pengujian menunjukkan nilai rerata precision untuk typo karena kekurangan huruf sebesar 50%, kelebihan huruf sebesar 100%, ada huruf lain yaitu sebesar 75% dan ada huruf yang tidak tepat sebesar 40%. Rerata recall sebesar 100% untuk setiap jenis pengujian.

Kata kunci – N-Gram, Hadis, Typo, Jaccard Similarity

Full Text:

PDF

References


K. ROSYID, “Kepemimpinan Menurut Hadits Nabi Saw,” 2016.

C. Sri, K. Aditya, V. Rahmayanti, and S. Nastiti, “Sistem Temu Kembali Informasi Buku Hadits Menggunakan Pembobotan Term Frequency Inverse Document Frequency Dan Cosine,” no. 2016, pp. 124–131, 2019.

W. S. Wardhana, T. A. B. Wirayuda, and Shaufiah, “Pengoreksian Ejaan Kata Menggunakan Metode N-Gram (Studi Kasus Dokumen Teks Berbahasa Indonesia),” pp. 0–6, 2011.

F. Ahmed, E. W. De Luca, and A. Nürnberger, “Revised N-Gram based Automatic Spelling Correction Tool to Improve Retrieval Effectiveness,” Polibits, vol. 40, no. 40, pp. 39–48, 2009, doi: 10.17562/pb-40-6.

E. A. Lisangan, “Implementasi n-gram Technique dalam Deteksi Plagiarisme pada Tugas Implementasi N-Gram Technique Dalam Deteksi,” no. May, 2015.

A. Indriani, Muhammad, Suprianto, and Hadriansa, “Implementasi Jaccard Index Dan N-Gram Pada Rekayasa Aplikasi Koreksi Kata Berbahasa Indonesia,” Sebatik, vol. 22, no.21, pp. 95–101, 2018.

B. Zaman, E. Hariyanti, and E. Purwanti, “Sistem Deteksi Bahasa pada Dokumen menggunakan N-Gram,” Multinetics, vol. 1, no.2, pp. 21–26, 2015.

S. Y. Baskoro, A. Ridok, and M. T. Furqon, “Berdasarkan Kasus Menggunakan Metode Cosine Similarity Dan Latent Semantic Indexing ( Lsi ),” vol. 2, no. 2, pp. 83–88, 2015.

A. I. Fahma, I. Cholissodin, and R. S. Perdana, “Identifikasi Kesalahan Penulisan Kata ( Typographical Error ) pada Dokumen Berbahasa Indonesia Menggunakan Metode N-gram dan Levenshtein Distance,” J. Pengemb. Teknol. Inf. dan Ilmu Komput., vol. 2, no. 1, pp. 53–62, 2018.

R. R. Bintana, “Penerapan Model Okapi Bm25 Pada Sistem Temu Kembali Informasi,” pp. 273–279, 2012.

H. Bunyamin, “Algoritma Umum Pencarian Informasi Dalam Sistem Temu Kembali Informasi Berbasis Metode Vektorisasi Kata dan Dokumen,” J. Inform., vol. 1, no. 2, pp. 85–92, 2005.

A. Hamzah, “No Title,” Deteksi Bhs. Untuk Dok. Text Bhs. Indones., 2010.

S. Sunardi, A. Yudhana, and I. A. Mukaromah, “Implementasi Deteksi Plagiarisme Menggunakan Metode N-Gram Dan Jaccard Similarity Terhadap Algoritma Winnowing,” Transmisi, vol. 20, no. 3, p. 105, 2018, doi: 10.14710/transmisi.20.3.105-110.

N. P. Lestari, “Uji Recall and Precision Sistem Temu Kembali,” Univ. Airlangga, 2016.

F. W. Lancaster, “Information Retrieval System: Characteristics, Testing, and Evaluation (2 nd Editi),” New York: John Wiley, 1979


Refbacks

  • There are currently no refbacks.


Copyright (c) 2023 semanTIK

Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.


Editor's Address :

Informatics Engineering Department of Halu Oleo University, Engineering Faculty Building 3rd Floor
H.E.A. Mokodompit Street, Bumi Tridharma Green Campus, Halu Oleo University

Telp. (0401) 3196237
Fax. (0401) 3195287
Website:http://ojs.uho.ac.id/index.php/semantik/index
E-mail: semantik.informatika@uho.ac.id