RAFANI, AZIS MULKI and Firdaus, Firdaus (2021) PENERAPAN CORPUS-BASED TEXT SIMILARITY SEBAGAI PENGUKUR KESAMAAN FITUR PADA DATA BIBLIOGRAFI UNTUK MENINGKATKAN AKURASI KLASIFIKASI KESAMAAN PENULIS. Undergraduate thesis, Sriwijaya University.
Text
RAMA_56201_09011281722034.pdf - Accepted Version Restricted to Repository staff only Available under License Creative Commons Public Domain Dedication. Download (43MB) | Request a copy |
|
Text
RAMA_56201_09011281722034_TURNITIN.pdf - Accepted Version Restricted to Repository staff only Available under License Creative Commons Public Domain Dedication. Download (6MB) | Request a copy |
|
Preview |
Text
RAMA_56201_09011281722034_ 0221017801_01_front_ref.pdf - Accepted Version Available under License Creative Commons Public Domain Dedication. Download (18MB) | Preview |
Text
RAMA_56201_09011281722034_ 0221017801_02.pdf - Accepted Version Restricted to Repository staff only Available under License Creative Commons Public Domain Dedication. Download (750kB) | Request a copy |
|
Text
RAMA_56201_09011281722034_ 0221017801_03.pdf - Accepted Version Restricted to Repository staff only Available under License Creative Commons Public Domain Dedication. Download (867kB) | Request a copy |
|
Text
RAMA_56201_09011281722034_ 0221017801_04.pdf - Accepted Version Restricted to Repository staff only Available under License Creative Commons Public Domain Dedication. Download (462kB) | Request a copy |
|
Text
RAMA_56201_09011281722034_ 0221017801_05.pdf - Accepted Version Restricted to Repository staff only Available under License Creative Commons Public Domain Dedication. Download (59kB) | Request a copy |
|
Text
RAMA_56201_09011281722034_ 0221017801_06_ref.pdf - Bibliography Restricted to Repository staff only Available under License Creative Commons Public Domain Dedication. Download (157kB) | Request a copy |
|
Text
RAMA_56201_09011281722034_ 0221017801_07_lamp.pdf - Accepted Version Restricted to Repository staff only Available under License Creative Commons Public Domain Dedication. Download (22MB) | Request a copy |
Abstract
Author Name Disambiguation (AND) adalah kasus ambiguitas nama penulis yang terjadi pada suatu publikasi dalam database Digital Library (DL) yang disebabkan karena kondisi Synonymity Dan Homonymity pada nama penulis (author). Dalam tugas akhir ini mengusulkan penerapan Corpus-based Text Similarity dengan menggunakan feature extraction Bag of Words (BOW) dan Term Frequency-Inverse Document Frequency (TF-IDF) dengan classifier Deep Neural Network (DNN), Support Vector Machine dan Random Forest. Dataset yang digunakan adalah Dataset DBLP Labeled Data oleh Jinseok Kim, dkk. Penelitian yang dilakukan berfokus pada ekstraksi fitur dalam pengolahan data guna menciptakan fitur yang efektif untuk digunakan dalam klasifikasi. Parameter accuracy, precision, dan recall merupakan tolak ukur untuk mengetahui tingkat keberhasilan dari metode yang digunakan untuk mengatasi permasalahan AND pada kasus author matching. Dari 2 pendekatan dan 3 classifier, hasil terbaik didapatkan pada pendekatan BOW menggunakan classifier Random Forest, yang memiliki hasil accuracy, precision dan recall sebesar 99,80%, 99,84% dan 99,95%.
Item Type: | Thesis (Undergraduate) |
---|---|
Uncontrolled Keywords: | Author Name Disambiguation, Synonym, Homonym, Bibliographic Data, Digital Library, BOW, TF-IDF, Deep Neural Network, Support Vector Machine, Random Forest |
Subjects: | Q Science > Q Science (General) > Q334-342 Computer science. Artificial intelligence. Algorithms. Robotics. Automation. |
Divisions: | 09-Faculty of Computer Science > 56201-Computer Systems (S1) |
Depositing User: | Azis Mulki Rafani |
Date Deposited: | 04 Aug 2021 07:19 |
Last Modified: | 04 Aug 2021 07:19 |
URI: | http://repository.unsri.ac.id/id/eprint/51544 |
Actions (login required)
View Item |