Perbaikan Ejaan Kata pada Dokumen Bahasa Indonesia dengan Metode Cosine Similarity

Fachrurrozi, Muhammad (2015) Perbaikan Ejaan Kata pada Dokumen Bahasa Indonesia dengan Metode Cosine Similarity. In: Seminar Nasional Rekayasa Komputer dan Aplikasinya Universitas Andalas, 8-10 October 2015, Padang, Indonesia.

[thumbnail of paper_Obets.pdf]
Preview
Text
paper_Obets.pdf

Download (592kB) | Preview

Abstract

Kesalahan ejaan kata dalam penulisan dokumen Bahasa Indonesia sering dijumpai sehingga sulit memahaminya. Penggunaan teknologi dalam memperbaiki kesalahan kata (spelling checker) telah banyak dilakukan. Pada penelitian ini dilakukan perbaikan kata pada dokumen bahasa Indonesia berbasis kemiripan kata menggunakan metode n-gram dan cosine similarity. Proses dimulai dengan melakukan pembentukan data latih dengan metode n-gram dalam pemotongan sejumlah kata. Pada proses pengujian dilakukan tahapan pra proses terlebih dahulu dan dilakukan pengecekan kata berdasarkan kamus kata dan data latih yang ada. Kata yang diasumsi salah dilakukan perbaikan kata dengan mencari kemiripan katanya dengan metode n-gram dan cosine similarity. Hasil kemiripan kata yang tertinggi disesuaikan dengan data latih, bila tidak sesuai maka kata dengan kemiripan tertinggi dianggap kata benar yang dilakukan perbaikan. Pada penelitian ini hasil percobaan dari 3 tingkatan kesalahan kata yaitu 20 %, 50 %, dan 70 % dengan masing-masing 20 dokumen menghasilkan perbaikan kata yang tepat diatas 70 %. Hasil penelitian dapat dilihat bahwa perbaikan kata sangat bergantung pada kamus kata trigram dan latih yang ada. Ini menunjukkan bahwa metode n-gram dan cosine similarity baik dalam penelitian ini.

Item Type: Conference or Workshop Item (Paper)
Subjects: Q Science > Q Science (General) > Q334-342 Computer science. Artificial intelligence. Algorithms. Robotics. Automation.
Divisions: 09-Faculty of Computer Science > 55201-Informatics (S1)
Depositing User: Dr. Muhammad Fachrurrozi
Date Deposited: 22 Sep 2019 14:26
Last Modified: 22 Sep 2019 14:26
URI: http://repository.unsri.ac.id/id/eprint/8306

Actions (login required)

View Item View Item