PENERAPAN CORPUS-BASED TEXT SIMILARITY SEBAGAI PENGUKUR KESAMAAN FITUR PADA DATA BIBLIOGRAFI UNTUK MENINGKATKAN AKURASI KLASIFIKASI KESAMAAN PENULIS

RAFANI, AZIS MULKI and Firdaus, Firdaus (2021) PENERAPAN CORPUS-BASED TEXT SIMILARITY SEBAGAI PENGUKUR KESAMAAN FITUR PADA DATA BIBLIOGRAFI UNTUK MENINGKATKAN AKURASI KLASIFIKASI KESAMAAN PENULIS. Undergraduate thesis, Sriwijaya University.

[thumbnail of RAMA_56201_09011281722034.pdf] Text
RAMA_56201_09011281722034.pdf - Accepted Version
Restricted to Repository staff only
Available under License Creative Commons Public Domain Dedication.

Download (43MB) | Request a copy
[thumbnail of RAMA_56201_09011281722034_TURNITIN.pdf] Text
RAMA_56201_09011281722034_TURNITIN.pdf - Accepted Version
Restricted to Repository staff only
Available under License Creative Commons Public Domain Dedication.

Download (6MB) | Request a copy
[thumbnail of RAMA_56201_09011281722034_ 0221017801_01_front_ref.pdf]
Preview
Text
RAMA_56201_09011281722034_ 0221017801_01_front_ref.pdf - Accepted Version
Available under License Creative Commons Public Domain Dedication.

Download (18MB) | Preview
[thumbnail of RAMA_56201_09011281722034_ 0221017801_02.pdf] Text
RAMA_56201_09011281722034_ 0221017801_02.pdf - Accepted Version
Restricted to Repository staff only
Available under License Creative Commons Public Domain Dedication.

Download (750kB) | Request a copy
[thumbnail of RAMA_56201_09011281722034_ 0221017801_03.pdf] Text
RAMA_56201_09011281722034_ 0221017801_03.pdf - Accepted Version
Restricted to Repository staff only
Available under License Creative Commons Public Domain Dedication.

Download (867kB) | Request a copy
[thumbnail of RAMA_56201_09011281722034_ 0221017801_04.pdf] Text
RAMA_56201_09011281722034_ 0221017801_04.pdf - Accepted Version
Restricted to Repository staff only
Available under License Creative Commons Public Domain Dedication.

Download (462kB) | Request a copy
[thumbnail of RAMA_56201_09011281722034_ 0221017801_05.pdf] Text
RAMA_56201_09011281722034_ 0221017801_05.pdf - Accepted Version
Restricted to Repository staff only
Available under License Creative Commons Public Domain Dedication.

Download (59kB) | Request a copy
[thumbnail of RAMA_56201_09011281722034_ 0221017801_06_ref.pdf] Text
RAMA_56201_09011281722034_ 0221017801_06_ref.pdf - Bibliography
Restricted to Repository staff only
Available under License Creative Commons Public Domain Dedication.

Download (157kB) | Request a copy
[thumbnail of RAMA_56201_09011281722034_ 0221017801_07_lamp.pdf] Text
RAMA_56201_09011281722034_ 0221017801_07_lamp.pdf - Accepted Version
Restricted to Repository staff only
Available under License Creative Commons Public Domain Dedication.

Download (22MB) | Request a copy

Abstract

Author Name Disambiguation (AND) adalah kasus ambiguitas nama penulis yang terjadi pada suatu publikasi dalam database Digital Library (DL) yang disebabkan karena kondisi Synonymity Dan Homonymity pada nama penulis (author). Dalam tugas akhir ini mengusulkan penerapan Corpus-based Text Similarity dengan menggunakan feature extraction Bag of Words (BOW) dan Term Frequency-Inverse Document Frequency (TF-IDF) dengan classifier Deep Neural Network (DNN), Support Vector Machine dan Random Forest. Dataset yang digunakan adalah Dataset DBLP Labeled Data oleh Jinseok Kim, dkk. Penelitian yang dilakukan berfokus pada ekstraksi fitur dalam pengolahan data guna menciptakan fitur yang efektif untuk digunakan dalam klasifikasi. Parameter accuracy, precision, dan recall merupakan tolak ukur untuk mengetahui tingkat keberhasilan dari metode yang digunakan untuk mengatasi permasalahan AND pada kasus author matching. Dari 2 pendekatan dan 3 classifier, hasil terbaik didapatkan pada pendekatan BOW menggunakan classifier Random Forest, yang memiliki hasil accuracy, precision dan recall sebesar 99,80%, 99,84% dan 99,95%.

Item Type: Thesis (Undergraduate)
Uncontrolled Keywords: Author Name Disambiguation, Synonym, Homonym, Bibliographic Data, Digital Library, BOW, TF-IDF, Deep Neural Network, Support Vector Machine, Random Forest
Subjects: Q Science > Q Science (General) > Q334-342 Computer science. Artificial intelligence. Algorithms. Robotics. Automation.
Divisions: 09-Faculty of Computer Science > 56201-Computer Systems (S1)
Depositing User: Azis Mulki Rafani
Date Deposited: 04 Aug 2021 07:19
Last Modified: 04 Aug 2021 07:19
URI: http://repository.unsri.ac.id/id/eprint/51544

Actions (login required)

View Item View Item