KLASIFIKASI TEKS MENGGUNAKAN LONG SHORT-TERM MEMORY DENGAN FITUR WORD EMBEDDING GLOVE DAN WORD2VEC

SARI, WINDA KURNIA and Rini, Dian Palupi and Malik, Reza Firsandaya (2020) KLASIFIKASI TEKS MENGGUNAKAN LONG SHORT-TERM MEMORY DENGAN FITUR WORD EMBEDDING GLOVE DAN WORD2VEC. Master thesis, Sriwijaya University.

[thumbnail of RAMA_55101_09042611822004.pdf] Text
RAMA_55101_09042611822004.pdf - Accepted Version
Restricted to Repository staff only
Available under License Creative Commons Public Domain Dedication.

Download (3MB) | Request a copy
[thumbnail of RAMA_55101_09042611822004_TURNITIN.pdf] Text
RAMA_55101_09042611822004_TURNITIN.pdf - Accepted Version
Restricted to Repository staff only
Available under License Creative Commons Public Domain Dedication.

Download (13MB) | Request a copy
[thumbnail of RAMA_55101_09042611822004_0023027804_0025047609_01_front_ref.pdf]
Preview
Text
RAMA_55101_09042611822004_0023027804_0025047609_01_front_ref.pdf - Accepted Version
Available under License Creative Commons Public Domain Dedication.

Download (1MB) | Preview
[thumbnail of RAMA_55101_09042611822004_0023027804_0025047609_02.pdf] Text
RAMA_55101_09042611822004_0023027804_0025047609_02.pdf - Accepted Version
Restricted to Repository staff only
Available under License Creative Commons Public Domain Dedication.

Download (509kB) | Request a copy
[thumbnail of RAMA_55101_09042611822004_0023027804_0025047609_03.pdf] Text
RAMA_55101_09042611822004_0023027804_0025047609_03.pdf - Accepted Version
Restricted to Repository staff only
Available under License Creative Commons Public Domain Dedication.

Download (260kB) | Request a copy
[thumbnail of RAMA_55101_09042611822004_0023027804_0025047609_04.pdf] Text
RAMA_55101_09042611822004_0023027804_0025047609_04.pdf - Accepted Version
Restricted to Repository staff only
Available under License Creative Commons Public Domain Dedication.

Download (850kB) | Request a copy
[thumbnail of RAMA_55101_09042611822004_0023027804_0025047609_05.pdf] Text
RAMA_55101_09042611822004_0023027804_0025047609_05.pdf - Accepted Version
Restricted to Repository staff only
Available under License Creative Commons Public Domain Dedication.

Download (46kB) | Request a copy
[thumbnail of RAMA_55101_09042611822004_0023027804_0025047609_06_ref.pdf] Text
RAMA_55101_09042611822004_0023027804_0025047609_06_ref.pdf - Bibliography
Restricted to Repository staff only
Available under License Creative Commons Public Domain Dedication.

Download (136kB) | Request a copy
[thumbnail of RAMA_55101_09042611822004_0023027804_0025047609_07_lamp.pdf] Text
RAMA_55101_09042611822004_0023027804_0025047609_07_lamp.pdf - Accepted Version
Restricted to Repository staff only
Available under License Creative Commons Public Domain Dedication.

Download (4MB) | Request a copy

Abstract

Klasifikasi teks multilabel adalah tugas mengategorikan teks ke dalam satu atau lebih kategori. Seperti pembelajaran mesin lainnya, kinerja klasifikasi multilabel terbatas ketika ada data kecil berlabel. Dibutuhkan teknik klasifikasi teks multilabel yang dapat mengelompokkan artikel berita. Deep Learning adalah metode yang diusulkan untuk memecahkan masalah dalam teknik klasifikasi teks multilabel. Beberapa contoh metode deep learning yang digunakan untuk pengklasifikasian teks antara lain CNN, Autoencoder, Deep Belief Networks, dan Recurrent Neural Networks (RNN). RNN merupakan salah satu arsitektur yang paling popular yang digunakan dalam Pemrosesan Bahasa Alami karena struktur recurrent cocok untuk proses teks variabel panjang. Salah satu metode deep learning yang diusulkan pada penelitian ini adalah RNN dengan penerapan arsitektur Long Short-Term Memory (LSTM). Dengan dilakukan tuning parameter LSTM menggunakan fitur GloVe dan Word2vec akan membuat model menjadi delapan model, gunanya untuk menunjukkan bahwa LSTM dengan fitur tambahan dapat mencapai kinerja yang baik dalam klasifikasi teks. Hasil penelitian menunjukkan bahwa klasifikasi teks menggunakan LSTM dengan Glove memperoleh akurasi tertinggi pada model keenam dengan 95,17% dan Word2Vec memperoleh akurasi tertinggi pada model kelima dengan 95,38%, sedangkan rata-rata nilai presisi, recall, dan F1-score adalah 95%.

Item Type: Thesis (Master)
Uncontrolled Keywords: RNN, LSTM, GloVe, Word2Vec
Subjects: T Technology > T Technology (General) > T58.6-58.62 Management information systems > T58.6 General works Industrial engineering Information technology. Information systems (General) Management information systems -- Continued
Divisions: 09-Faculty of Computer Science > 55101-Informatics (S2)
Depositing User: Users 5813 not found.
Date Deposited: 28 May 2020 05:30
Last Modified: 28 May 2020 05:30
URI: http://repository.unsri.ac.id/id/eprint/29423

Actions (login required)

View Item View Item