Aspect Category Classification dengan Pendekatan Machine Learning Menggunakan Dataset Bahasa Indonesia

Ulasan pelanggan merupakan opini terhadap kualitas barang atau jasa yang dirasakan konsumen. Ulasan pelanggan mengandung informasi yang berguna bagi konsumen maupun penyedia barang atau jasa. Ketersediaan ulasan pelanggan dalam jumlah besar pada website membutuhkan suatu framework untuk mengekstraks...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Syaifulloh Amien Pandega Perdana, Teguh Bharata Aji, Ridi Ferdiana
Formato: article
Lenguaje:EN
ID
Publicado: Universitas Gadjah Mada 2021
Materias:
Acceso en línea:https://doaj.org/article/d2c3e334698a48dd8df7d592bc92f6f7
Etiquetas: Agregar Etiqueta
Sin Etiquetas, Sea el primero en etiquetar este registro!
id oai:doaj.org-article:d2c3e334698a48dd8df7d592bc92f6f7
record_format dspace
spelling oai:doaj.org-article:d2c3e334698a48dd8df7d592bc92f6f72021-11-17T04:01:40ZAspect Category Classification dengan Pendekatan Machine Learning Menggunakan Dataset Bahasa Indonesia2301-41562460-571910.22146/jnteti.v10i3.1819https://doaj.org/article/d2c3e334698a48dd8df7d592bc92f6f72021-08-01T00:00:00Zhttps://jurnal.ugm.ac.id/v3/JNTETI/article/view/1819https://doaj.org/toc/2301-4156https://doaj.org/toc/2460-5719Ulasan pelanggan merupakan opini terhadap kualitas barang atau jasa yang dirasakan konsumen. Ulasan pelanggan mengandung informasi yang berguna bagi konsumen maupun penyedia barang atau jasa. Ketersediaan ulasan pelanggan dalam jumlah besar pada website membutuhkan suatu framework untuk mengekstraksi sentimen secara otomatis. Sebuah ulasan pelanggan sering kali mengandung banyak aspek sehingga Aspect Based Sentiment Analysis (ABSA) harus digunakan untuk mengetahui polaritas masing-masing aspek. Salah satu tugas penting dalam ABSA adalah Aspect Category Detection. Metode machine learning untuk Aspect Category Detection sudah banyak dilakukan pada domain berbahasa Inggris, tetapi pada domain bahasa Indonesia masih sedikit. Makalah ini membandingkan kinerja tiga algoritme machine learning, yaitu Naïve Bayes (NB), Support Vector Machine (SVM), dan Random Forest (RF) pada ulasan pelanggan berbahasa Indonesia menggunakan Term Frequency–Inverse Document Frequency (TF-IDF) sebagai term weighting. Hasil menunjukkan bahwa RF memiliki kinerja paling unggul dibandingkan NB dan SVM pada tiga domain yang berbeda, yaitu restoran, hotel, dan e-commerce, dengan nilai f1-score untuk masing-masing domain adalah 84.3%, 85.7%, dan 89,3%.Syaifulloh Amien Pandega PerdanaTeguh Bharata AjiRidi FerdianaUniversitas Gadjah Madaarticleaspect category classificationnaïve bayessupport vector machinerandom forestmachine learningulasan pelangganEngineering (General). Civil engineering (General)TA1-2040ENIDJurnal Nasional Teknik Elektro dan Teknologi Informasi, Vol 10, Iss 3, Pp 229-235 (2021)
institution DOAJ
collection DOAJ
language EN
ID
topic aspect category classification
naïve bayes
support vector machine
random forest
machine learning
ulasan pelanggan
Engineering (General). Civil engineering (General)
TA1-2040
spellingShingle aspect category classification
naïve bayes
support vector machine
random forest
machine learning
ulasan pelanggan
Engineering (General). Civil engineering (General)
TA1-2040
Syaifulloh Amien Pandega Perdana
Teguh Bharata Aji
Ridi Ferdiana
Aspect Category Classification dengan Pendekatan Machine Learning Menggunakan Dataset Bahasa Indonesia
description Ulasan pelanggan merupakan opini terhadap kualitas barang atau jasa yang dirasakan konsumen. Ulasan pelanggan mengandung informasi yang berguna bagi konsumen maupun penyedia barang atau jasa. Ketersediaan ulasan pelanggan dalam jumlah besar pada website membutuhkan suatu framework untuk mengekstraksi sentimen secara otomatis. Sebuah ulasan pelanggan sering kali mengandung banyak aspek sehingga Aspect Based Sentiment Analysis (ABSA) harus digunakan untuk mengetahui polaritas masing-masing aspek. Salah satu tugas penting dalam ABSA adalah Aspect Category Detection. Metode machine learning untuk Aspect Category Detection sudah banyak dilakukan pada domain berbahasa Inggris, tetapi pada domain bahasa Indonesia masih sedikit. Makalah ini membandingkan kinerja tiga algoritme machine learning, yaitu Naïve Bayes (NB), Support Vector Machine (SVM), dan Random Forest (RF) pada ulasan pelanggan berbahasa Indonesia menggunakan Term Frequency–Inverse Document Frequency (TF-IDF) sebagai term weighting. Hasil menunjukkan bahwa RF memiliki kinerja paling unggul dibandingkan NB dan SVM pada tiga domain yang berbeda, yaitu restoran, hotel, dan e-commerce, dengan nilai f1-score untuk masing-masing domain adalah 84.3%, 85.7%, dan 89,3%.
format article
author Syaifulloh Amien Pandega Perdana
Teguh Bharata Aji
Ridi Ferdiana
author_facet Syaifulloh Amien Pandega Perdana
Teguh Bharata Aji
Ridi Ferdiana
author_sort Syaifulloh Amien Pandega Perdana
title Aspect Category Classification dengan Pendekatan Machine Learning Menggunakan Dataset Bahasa Indonesia
title_short Aspect Category Classification dengan Pendekatan Machine Learning Menggunakan Dataset Bahasa Indonesia
title_full Aspect Category Classification dengan Pendekatan Machine Learning Menggunakan Dataset Bahasa Indonesia
title_fullStr Aspect Category Classification dengan Pendekatan Machine Learning Menggunakan Dataset Bahasa Indonesia
title_full_unstemmed Aspect Category Classification dengan Pendekatan Machine Learning Menggunakan Dataset Bahasa Indonesia
title_sort aspect category classification dengan pendekatan machine learning menggunakan dataset bahasa indonesia
publisher Universitas Gadjah Mada
publishDate 2021
url https://doaj.org/article/d2c3e334698a48dd8df7d592bc92f6f7
work_keys_str_mv AT syaifullohamienpandegaperdana aspectcategoryclassificationdenganpendekatanmachinelearningmenggunakandatasetbahasaindonesia
AT teguhbharataaji aspectcategoryclassificationdenganpendekatanmachinelearningmenggunakandatasetbahasaindonesia
AT ridiferdiana aspectcategoryclassificationdenganpendekatanmachinelearningmenggunakandatasetbahasaindonesia
_version_ 1718426019742875648