Klasifikasi Kelas Kata (Part-Of-Speech Tagging) untuk Bahasa Madura Menggunakan Algoritme Viterbi

Bahasa manusia adalah bahasa yang digunakan oleh manusia dalam bentuk tulisan maupun suara. Banyak teknologi/aplikasi yang mengolah bahasa manusia, bidang tersebut bernama Natural Language Processing yang merupakan ilmu yang mempelajari untuk mengolah dan mengekstraksi bahasa manusia pada perkembang...

Descripción completa

Guardado en:

Detalles Bibliográficos
Autores principales:	Ilham Firmansyah, Putra Pandu Adikara, Sigit Adinugroho
Formato:	article
Lenguaje:	ID
Publicado:	University of Brawijaya 2021
Materias:	Technology T Information technology T58.5-58.64
Acceso en línea:	https://doaj.org/article/7017610eae34465d83455697b545f27c
Etiquetas:	Agregar Etiqueta Sin Etiquetas, Sea el primero en etiquetar este registro!

id	oai:doaj.org-article:7017610eae34465d83455697b545f27c
record_format	dspace
spelling	oai:doaj.org-article:7017610eae34465d83455697b545f27c2021-11-25T05:01:09ZKlasifikasi Kelas Kata (Part-Of-Speech Tagging) untuk Bahasa Madura Menggunakan Algoritme Viterbi2355-76992528-657910.25126/jtiik.2021854483https://doaj.org/article/7017610eae34465d83455697b545f27c2021-10-01T00:00:00Zhttps://jtiik.ub.ac.id/index.php/jtiik/article/view/4483https://doaj.org/toc/2355-7699https://doaj.org/toc/2528-6579Bahasa manusia adalah bahasa yang digunakan oleh manusia dalam bentuk tulisan maupun suara. Banyak teknologi/aplikasi yang mengolah bahasa manusia, bidang tersebut bernama Natural Language Processing yang merupakan ilmu yang mempelajari untuk mengolah dan mengekstraksi bahasa manusia pada perkembangan teknologi. Salah satu proses pada Natural Language Processing adalah Part-Of-Speech Tagging. Part-Of-Speech Tagging adalah klasifikasi kelas kata pada sebuah kalimat secara otomatis oleh teknologi, proses ini salah satunya berfungsi untuk mengetahui kata-kata yang memiliki lebih dari satu makna/arti (ambiguitas). Part-Of-Speech Tagging merupakan dasar dari Natural Language Processing lainnya, seperti penerjemahan mesin (machine translation), penghilangan ambiguitas makna kata (word sense disambiguation), dan analisis sentimen. Part-Of-Speech Tagging dilakukan pada bahasa manusia, salah satunya adalah bahasa Madura. Bahasa Madura adalah bahasa daerah yang digunakan oleh suku Madura dan memiliki morfologi yang mirip dengan bahasa Indonesia. Penelitian pada Part-Of-Speech Tagging pada bahasa Madura ini menggunakan algoritme Viterbi, terdapat 3 proses untuk implementasi algoritme Viterbi pada pada Part-Of-Speech Tagging bahasa Madura, yaitu pre-processing pada data training dan testing, perhitungan data latih dengan Hidden Markov Model dan klasifikasi kelas kata menggunakan algoritme Viterbi. Kelas kata (tagset) yang digunakan untuk klasifikasi kata pada bahasa Madura sebanyak 19 kelas, kelas kata tersebut dirancang oleh pakar. Pengujian sistem pada penelitian ini menggunakan perhitungan Multiclass Confusion Matrix. Hasil pengujian sistem mendapatkan nilai micro average accuracy sebesar 0,96 dan nilai micro average precision dan recall yang sama sebesar 0,68. Precision dan recall masih dapat ditingkatkan dengan menambahkan data yang lebih banyak lagi untuk pelatihan. Abstract Natural language is a form of language used by human, either in writing or speaking form. There is a specific field in computer science that processes natural language, which is called Natural Language Processing. It is a study of how to process and extract natural language on technology development. Part-Of-Speech Tagging is a method to assign a predefined set of tags (word classes) into a word or a phrase. This process is useful to understand the true meaning of a word with ambiguous meaning, which may have different meanings depending on the context. Part-Of-Speech Tagging is the basis of the other Natural Language Processing methods, such as machine translation, word sense disambiguation, and sentiment analysis. Part-Of-Speech Tagging used in natural languages, such as Madurese language. Madurese language is a local language used by Madurese and has a similar morphology as Indonesian language. Part-Of-Speech Tagging research on Madurese language using Viterbi algorithm, consists of 3 processes, which are training and testing corpus pre-processing, training the corpus by Hidden Markov Model, and tag classification using Viterbi algorithm. The number of tags used for words classification (tagsets) on Madurese language are 19 class, those tags were designed by an expert. Performance assessment was conducted using Multiclass Confusion Matrix calculation. The system achieved a micro average accuracy score of 0,96, and micro average precision score is equal to recall of 0,68. Precision and recall can still be improved by adding more data for training.Ilham FirmansyahPutra Pandu AdikaraSigit AdinugrohoUniversity of BrawijayaarticleTechnologyTInformation technologyT58.5-58.64IDJurnal Teknologi Informasi dan Ilmu Komputer, Vol 8, Iss 5, Pp 1039-1048 (2021)
institution	DOAJ
collection	DOAJ
language	ID
topic	Technology T Information technology T58.5-58.64
spellingShingle	Technology T Information technology T58.5-58.64 Ilham Firmansyah Putra Pandu Adikara Sigit Adinugroho Klasifikasi Kelas Kata (Part-Of-Speech Tagging) untuk Bahasa Madura Menggunakan Algoritme Viterbi
description	Bahasa manusia adalah bahasa yang digunakan oleh manusia dalam bentuk tulisan maupun suara. Banyak teknologi/aplikasi yang mengolah bahasa manusia, bidang tersebut bernama Natural Language Processing yang merupakan ilmu yang mempelajari untuk mengolah dan mengekstraksi bahasa manusia pada perkembangan teknologi. Salah satu proses pada Natural Language Processing adalah Part-Of-Speech Tagging. Part-Of-Speech Tagging adalah klasifikasi kelas kata pada sebuah kalimat secara otomatis oleh teknologi, proses ini salah satunya berfungsi untuk mengetahui kata-kata yang memiliki lebih dari satu makna/arti (ambiguitas). Part-Of-Speech Tagging merupakan dasar dari Natural Language Processing lainnya, seperti penerjemahan mesin (machine translation), penghilangan ambiguitas makna kata (word sense disambiguation), dan analisis sentimen. Part-Of-Speech Tagging dilakukan pada bahasa manusia, salah satunya adalah bahasa Madura. Bahasa Madura adalah bahasa daerah yang digunakan oleh suku Madura dan memiliki morfologi yang mirip dengan bahasa Indonesia. Penelitian pada Part-Of-Speech Tagging pada bahasa Madura ini menggunakan algoritme Viterbi, terdapat 3 proses untuk implementasi algoritme Viterbi pada pada Part-Of-Speech Tagging bahasa Madura, yaitu pre-processing pada data training dan testing, perhitungan data latih dengan Hidden Markov Model dan klasifikasi kelas kata menggunakan algoritme Viterbi. Kelas kata (tagset) yang digunakan untuk klasifikasi kata pada bahasa Madura sebanyak 19 kelas, kelas kata tersebut dirancang oleh pakar. Pengujian sistem pada penelitian ini menggunakan perhitungan Multiclass Confusion Matrix. Hasil pengujian sistem mendapatkan nilai micro average accuracy sebesar 0,96 dan nilai micro average precision dan recall yang sama sebesar 0,68. Precision dan recall masih dapat ditingkatkan dengan menambahkan data yang lebih banyak lagi untuk pelatihan. Abstract Natural language is a form of language used by human, either in writing or speaking form. There is a specific field in computer science that processes natural language, which is called Natural Language Processing. It is a study of how to process and extract natural language on technology development. Part-Of-Speech Tagging is a method to assign a predefined set of tags (word classes) into a word or a phrase. This process is useful to understand the true meaning of a word with ambiguous meaning, which may have different meanings depending on the context. Part-Of-Speech Tagging is the basis of the other Natural Language Processing methods, such as machine translation, word sense disambiguation, and sentiment analysis. Part-Of-Speech Tagging used in natural languages, such as Madurese language. Madurese language is a local language used by Madurese and has a similar morphology as Indonesian language. Part-Of-Speech Tagging research on Madurese language using Viterbi algorithm, consists of 3 processes, which are training and testing corpus pre-processing, training the corpus by Hidden Markov Model, and tag classification using Viterbi algorithm. The number of tags used for words classification (tagsets) on Madurese language are 19 class, those tags were designed by an expert. Performance assessment was conducted using Multiclass Confusion Matrix calculation. The system achieved a micro average accuracy score of 0,96, and micro average precision score is equal to recall of 0,68. Precision and recall can still be improved by adding more data for training.
format	article
author	Ilham Firmansyah Putra Pandu Adikara Sigit Adinugroho
author_facet	Ilham Firmansyah Putra Pandu Adikara Sigit Adinugroho
author_sort	Ilham Firmansyah
title	Klasifikasi Kelas Kata (Part-Of-Speech Tagging) untuk Bahasa Madura Menggunakan Algoritme Viterbi
title_short	Klasifikasi Kelas Kata (Part-Of-Speech Tagging) untuk Bahasa Madura Menggunakan Algoritme Viterbi
title_full	Klasifikasi Kelas Kata (Part-Of-Speech Tagging) untuk Bahasa Madura Menggunakan Algoritme Viterbi
title_fullStr	Klasifikasi Kelas Kata (Part-Of-Speech Tagging) untuk Bahasa Madura Menggunakan Algoritme Viterbi
title_full_unstemmed	Klasifikasi Kelas Kata (Part-Of-Speech Tagging) untuk Bahasa Madura Menggunakan Algoritme Viterbi
title_sort	klasifikasi kelas kata (part-of-speech tagging) untuk bahasa madura menggunakan algoritme viterbi
publisher	University of Brawijaya
publishDate	2021
url	https://doaj.org/article/7017610eae34465d83455697b545f27c
work_keys_str_mv	AT ilhamfirmansyah klasifikasikelaskatapartofspeechtagginguntukbahasamaduramenggunakanalgoritmeviterbi AT putrapanduadikara klasifikasikelaskatapartofspeechtagginguntukbahasamaduramenggunakanalgoritmeviterbi AT sigitadinugroho klasifikasikelaskatapartofspeechtagginguntukbahasamaduramenggunakanalgoritmeviterbi
_version_	1718414643958906880

Klasifikasi Kelas Kata (Part-Of-Speech Tagging) untuk Bahasa Madura Menggunakan Algoritme Viterbi

Ejemplares similares