METODE N-GRAM UNTUK EKSTRAKSI POLA TEKS DALAM UKURAN BESAR PADA ALGORITMA KOMPRES HUFFMAN DAN LEMPEL–ZIV–WELCH (LZW) YANG DIMODIFIKASI

Prosiding Seminar Nasional Komputer (SNIKOM 2017), ISBN: 978-602-60010-1-6

Senin, 02 April 2018 13:46 | Sudah dibaca 523 kali

Ekstraksi pola teks banyak digunakan peneliti untuk melakukan identifikasi, pencarian dokumen, klasifikasi, pencocokan pola dan Temu kembali Informasi. Salah satu dari beberapa metode yang dapat digunakan dalam tujuan untuk ektraksi pola teks adalah menggunakan metode N-gram. Metode N-gram banyak diusulkan peneliti sebagai parameter mempercepat proses ekstraksi teks. Namun untuk ekstraksi teks dalam ukuran besar membutuhkan waktu yang lama untuk proses pelatihan. Algoritma kompresi seperi Huffman dan Lempel–Ziv–Welch (LZW) dapat mengatasi permasalah proses ekstraksi teks dalam ukuran besar. Kombinasi metode N-Gram dengan algoritma kompresi diusulkan untuk memperbaiki performa ekstraksi teks dari teks ukuran besar dan memberikan informasi statistic tentang frekuensi dan panjang pola. Hasil dari pengujian pada metode yang diusulkan menunjukkan peningkatan proses akurasi waktu yang signifikan untuk ekstraksi pola teks ukuran besar.

Kata Kunci: N-Gram, Ekstraksi Pola Teks, Huffman, LZW