Analisis Data Sosial Media Twitter Menggunakan Hadoop dan Spark

Big data merupakan sumber data yang memiliki volume yang besar, variasi yang banyak, dan aliran data yang sangat cepat. Contoh big data antara lain data dari media sosial dan query pencarian Google. Data tersebut mampu melacak aktivitas penyakit dan data yang ada tersedia setiap saat. Pengolahan big...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Irfan Rizqi Prabaswara, Ragil Saputra
Formato: article
Lenguaje:EN
Publicado: UIR Press 2020
Materias:
Acceso en línea:https://doaj.org/article/95ce4b3c90e8446e95d8dba095cbf2a8
Etiquetas: Agregar Etiqueta
Sin Etiquetas, Sea el primero en etiquetar este registro!
id oai:doaj.org-article:95ce4b3c90e8446e95d8dba095cbf2a8
record_format dspace
spelling oai:doaj.org-article:95ce4b3c90e8446e95d8dba095cbf2a82021-11-04T09:51:14ZAnalisis Data Sosial Media Twitter Menggunakan Hadoop dan Spark2528-40612528-405310.25299/itjrd.2020.vol4(2).4099https://doaj.org/article/95ce4b3c90e8446e95d8dba095cbf2a82020-03-01T00:00:00Zhttps://journal.uir.ac.id/index.php/ITJRD/article/view/4099https://doaj.org/toc/2528-4061https://doaj.org/toc/2528-4053Big data merupakan sumber data yang memiliki volume yang besar, variasi yang banyak, dan aliran data yang sangat cepat. Contoh big data antara lain data dari media sosial dan query pencarian Google. Data tersebut mampu melacak aktivitas penyakit dan data yang ada tersedia setiap saat. Pengolahan big data bukanlah suatu hal yang mudah, sehingga diperlukan suatu tools yang dapat membantu proses pengolahan terhadap big data. Salah satu tools tersebut adalah hadoop. Meskipun kinerja hadoop lebih unggul daripada RDBMS tradisional, akan tetapi pengolahan data menggunakan hadoop belum maksimal. Sehingga, diperlukan pengolahan data yang lebih cepat. Salah satu cara untuk meningkatkan kecepatan pengolahan data ialah menerapkan spark untuk proses pengolahan data yang ada di HDFS (Hadoop Distributed File System). Pada penelitian ini dilakukan plotting tren dan pemetaan pada data Demam Berdarah Dengue (DBD) yang berasal dari media sosial twitter. Penelitian ini bertujuan untuk membuat visualisasi data yang diperoleh dari twitter dengan menggunakan hadoop dan spark dalam memantau perkembangan DBD di wilayah Asia Tenggara. Hasil dari plotting tren menunjukkan adanya hubungan yang kuat antara data twitter, data asli kejadian DBD yang diperoleh dari WHO. Penelitian ini juga melakukan pengujian performa hadoop dan spark. Semakin besar alokasi memory executor yang diterapkan serta semakin besar dan serupa alokasi maksimal memory scheduler yang diterapkan pada tiap node, maka waktu yang dibutuhkan untuk menyelesaikan task semakin singkat. Akan tetapi, pada titik tertentu konfigurasi hadoop dan spark menemui titik puncaknya, sehingga jika alokasi diperbesar menghasilkan hasil yang sama.Irfan Rizqi PrabaswaraRagil SaputraUIR PressarticleComputer softwareQA76.75-76.765Information technologyT58.5-58.64Computer engineering. Computer hardwareTK7885-7895ENIT Journal Research and Development, Vol 4, Iss 2 (2020)
institution DOAJ
collection DOAJ
language EN
topic Computer software
QA76.75-76.765
Information technology
T58.5-58.64
Computer engineering. Computer hardware
TK7885-7895
spellingShingle Computer software
QA76.75-76.765
Information technology
T58.5-58.64
Computer engineering. Computer hardware
TK7885-7895
Irfan Rizqi Prabaswara
Ragil Saputra
Analisis Data Sosial Media Twitter Menggunakan Hadoop dan Spark
description Big data merupakan sumber data yang memiliki volume yang besar, variasi yang banyak, dan aliran data yang sangat cepat. Contoh big data antara lain data dari media sosial dan query pencarian Google. Data tersebut mampu melacak aktivitas penyakit dan data yang ada tersedia setiap saat. Pengolahan big data bukanlah suatu hal yang mudah, sehingga diperlukan suatu tools yang dapat membantu proses pengolahan terhadap big data. Salah satu tools tersebut adalah hadoop. Meskipun kinerja hadoop lebih unggul daripada RDBMS tradisional, akan tetapi pengolahan data menggunakan hadoop belum maksimal. Sehingga, diperlukan pengolahan data yang lebih cepat. Salah satu cara untuk meningkatkan kecepatan pengolahan data ialah menerapkan spark untuk proses pengolahan data yang ada di HDFS (Hadoop Distributed File System). Pada penelitian ini dilakukan plotting tren dan pemetaan pada data Demam Berdarah Dengue (DBD) yang berasal dari media sosial twitter. Penelitian ini bertujuan untuk membuat visualisasi data yang diperoleh dari twitter dengan menggunakan hadoop dan spark dalam memantau perkembangan DBD di wilayah Asia Tenggara. Hasil dari plotting tren menunjukkan adanya hubungan yang kuat antara data twitter, data asli kejadian DBD yang diperoleh dari WHO. Penelitian ini juga melakukan pengujian performa hadoop dan spark. Semakin besar alokasi memory executor yang diterapkan serta semakin besar dan serupa alokasi maksimal memory scheduler yang diterapkan pada tiap node, maka waktu yang dibutuhkan untuk menyelesaikan task semakin singkat. Akan tetapi, pada titik tertentu konfigurasi hadoop dan spark menemui titik puncaknya, sehingga jika alokasi diperbesar menghasilkan hasil yang sama.
format article
author Irfan Rizqi Prabaswara
Ragil Saputra
author_facet Irfan Rizqi Prabaswara
Ragil Saputra
author_sort Irfan Rizqi Prabaswara
title Analisis Data Sosial Media Twitter Menggunakan Hadoop dan Spark
title_short Analisis Data Sosial Media Twitter Menggunakan Hadoop dan Spark
title_full Analisis Data Sosial Media Twitter Menggunakan Hadoop dan Spark
title_fullStr Analisis Data Sosial Media Twitter Menggunakan Hadoop dan Spark
title_full_unstemmed Analisis Data Sosial Media Twitter Menggunakan Hadoop dan Spark
title_sort analisis data sosial media twitter menggunakan hadoop dan spark
publisher UIR Press
publishDate 2020
url https://doaj.org/article/95ce4b3c90e8446e95d8dba095cbf2a8
work_keys_str_mv AT irfanrizqiprabaswara analisisdatasosialmediatwittermenggunakanhadoopdanspark
AT ragilsaputra analisisdatasosialmediatwittermenggunakanhadoopdanspark
_version_ 1718444917122924544