Aspect Category Classification dengan Pendekatan Machine Learning Menggunakan Dataset Bahasa Indonesia
Ulasan pelanggan merupakan opini terhadap kualitas barang atau jasa yang dirasakan konsumen. Ulasan pelanggan mengandung informasi yang berguna bagi konsumen maupun penyedia barang atau jasa. Ketersediaan ulasan pelanggan dalam jumlah besar pada website membutuhkan suatu framework untuk mengekstraks...
Guardado en:
Autores principales: | , , |
---|---|
Formato: | article |
Lenguaje: | EN ID |
Publicado: |
Universitas Gadjah Mada
2021
|
Materias: | |
Acceso en línea: | https://doaj.org/article/d2c3e334698a48dd8df7d592bc92f6f7 |
Etiquetas: |
Agregar Etiqueta
Sin Etiquetas, Sea el primero en etiquetar este registro!
|
id |
oai:doaj.org-article:d2c3e334698a48dd8df7d592bc92f6f7 |
---|---|
record_format |
dspace |
spelling |
oai:doaj.org-article:d2c3e334698a48dd8df7d592bc92f6f72021-11-17T04:01:40ZAspect Category Classification dengan Pendekatan Machine Learning Menggunakan Dataset Bahasa Indonesia2301-41562460-571910.22146/jnteti.v10i3.1819https://doaj.org/article/d2c3e334698a48dd8df7d592bc92f6f72021-08-01T00:00:00Zhttps://jurnal.ugm.ac.id/v3/JNTETI/article/view/1819https://doaj.org/toc/2301-4156https://doaj.org/toc/2460-5719Ulasan pelanggan merupakan opini terhadap kualitas barang atau jasa yang dirasakan konsumen. Ulasan pelanggan mengandung informasi yang berguna bagi konsumen maupun penyedia barang atau jasa. Ketersediaan ulasan pelanggan dalam jumlah besar pada website membutuhkan suatu framework untuk mengekstraksi sentimen secara otomatis. Sebuah ulasan pelanggan sering kali mengandung banyak aspek sehingga Aspect Based Sentiment Analysis (ABSA) harus digunakan untuk mengetahui polaritas masing-masing aspek. Salah satu tugas penting dalam ABSA adalah Aspect Category Detection. Metode machine learning untuk Aspect Category Detection sudah banyak dilakukan pada domain berbahasa Inggris, tetapi pada domain bahasa Indonesia masih sedikit. Makalah ini membandingkan kinerja tiga algoritme machine learning, yaitu Naïve Bayes (NB), Support Vector Machine (SVM), dan Random Forest (RF) pada ulasan pelanggan berbahasa Indonesia menggunakan Term Frequency–Inverse Document Frequency (TF-IDF) sebagai term weighting. Hasil menunjukkan bahwa RF memiliki kinerja paling unggul dibandingkan NB dan SVM pada tiga domain yang berbeda, yaitu restoran, hotel, dan e-commerce, dengan nilai f1-score untuk masing-masing domain adalah 84.3%, 85.7%, dan 89,3%.Syaifulloh Amien Pandega PerdanaTeguh Bharata AjiRidi FerdianaUniversitas Gadjah Madaarticleaspect category classificationnaïve bayessupport vector machinerandom forestmachine learningulasan pelangganEngineering (General). Civil engineering (General)TA1-2040ENIDJurnal Nasional Teknik Elektro dan Teknologi Informasi, Vol 10, Iss 3, Pp 229-235 (2021) |
institution |
DOAJ |
collection |
DOAJ |
language |
EN ID |
topic |
aspect category classification naïve bayes support vector machine random forest machine learning ulasan pelanggan Engineering (General). Civil engineering (General) TA1-2040 |
spellingShingle |
aspect category classification naïve bayes support vector machine random forest machine learning ulasan pelanggan Engineering (General). Civil engineering (General) TA1-2040 Syaifulloh Amien Pandega Perdana Teguh Bharata Aji Ridi Ferdiana Aspect Category Classification dengan Pendekatan Machine Learning Menggunakan Dataset Bahasa Indonesia |
description |
Ulasan pelanggan merupakan opini terhadap kualitas barang atau jasa yang dirasakan konsumen. Ulasan pelanggan mengandung informasi yang berguna bagi konsumen maupun penyedia barang atau jasa. Ketersediaan ulasan pelanggan dalam jumlah besar pada website membutuhkan suatu framework untuk mengekstraksi sentimen secara otomatis. Sebuah ulasan pelanggan sering kali mengandung banyak aspek sehingga Aspect Based Sentiment Analysis (ABSA) harus digunakan untuk mengetahui polaritas masing-masing aspek. Salah satu tugas penting dalam ABSA adalah Aspect Category Detection. Metode machine learning untuk Aspect Category Detection sudah banyak dilakukan pada domain berbahasa Inggris, tetapi pada domain bahasa Indonesia masih sedikit. Makalah ini membandingkan kinerja tiga algoritme machine learning, yaitu Naïve Bayes (NB), Support Vector Machine (SVM), dan Random Forest (RF) pada ulasan pelanggan berbahasa Indonesia menggunakan Term Frequency–Inverse Document Frequency (TF-IDF) sebagai term weighting. Hasil menunjukkan bahwa RF memiliki kinerja paling unggul dibandingkan NB dan SVM pada tiga domain yang berbeda, yaitu restoran, hotel, dan e-commerce, dengan nilai f1-score untuk masing-masing domain adalah 84.3%, 85.7%, dan 89,3%. |
format |
article |
author |
Syaifulloh Amien Pandega Perdana Teguh Bharata Aji Ridi Ferdiana |
author_facet |
Syaifulloh Amien Pandega Perdana Teguh Bharata Aji Ridi Ferdiana |
author_sort |
Syaifulloh Amien Pandega Perdana |
title |
Aspect Category Classification dengan Pendekatan Machine Learning Menggunakan Dataset Bahasa Indonesia |
title_short |
Aspect Category Classification dengan Pendekatan Machine Learning Menggunakan Dataset Bahasa Indonesia |
title_full |
Aspect Category Classification dengan Pendekatan Machine Learning Menggunakan Dataset Bahasa Indonesia |
title_fullStr |
Aspect Category Classification dengan Pendekatan Machine Learning Menggunakan Dataset Bahasa Indonesia |
title_full_unstemmed |
Aspect Category Classification dengan Pendekatan Machine Learning Menggunakan Dataset Bahasa Indonesia |
title_sort |
aspect category classification dengan pendekatan machine learning menggunakan dataset bahasa indonesia |
publisher |
Universitas Gadjah Mada |
publishDate |
2021 |
url |
https://doaj.org/article/d2c3e334698a48dd8df7d592bc92f6f7 |
work_keys_str_mv |
AT syaifullohamienpandegaperdana aspectcategoryclassificationdenganpendekatanmachinelearningmenggunakandatasetbahasaindonesia AT teguhbharataaji aspectcategoryclassificationdenganpendekatanmachinelearningmenggunakandatasetbahasaindonesia AT ridiferdiana aspectcategoryclassificationdenganpendekatanmachinelearningmenggunakandatasetbahasaindonesia |
_version_ |
1718426019742875648 |