Exploratory Data Analysis pada Kasus COVID-19 di Indonesia Menggunakan HiveQL dan Hadoop Environment

Authors

  • Tresna Maulana Fahrudin Program Studi Sains Data, Fakultas Ilmu Komputer, Universitas Pembangunan Nasional “Veteran” Jawa Timur
  • Prismahardi Aji Riyantoko Program Studi Sains Data, Fakultas Ilmu Komputer, Universitas Pembangunan Nasional “Veteran” Jawa Timur
  • Kartika Maulida Hindrayani Program Studi Sains Data, Fakultas Ilmu Komputer, Universitas Pembangunan Nasional “Veteran” Jawa Timur
  • I Gede Susrama Mas Diyasa Program Studi Sains Data, Fakultas Ilmu Komputer, Universitas Pembangunan Nasional “Veteran” Jawa Timur

DOI:

https://doi.org/10.33005/santika.v1i0.32

Keywords:

COVID-19 Indonesia, Exploratory Data Analysis, HiveQL, Hadoop Environment, Big Data

Abstract

Kasus COVID-19 menjadi pandemi dan hampir menghentikan aktifitas dan rutinitas seluruh warga negara di dunia, termasuk Indonesia. Pandemi ini telah berlangsung di Indonesia di mulai awal bulan Maret hingga saat ini. Pemerintah terus berupaya untuk mensosialisaiskan dan  menginformasikan jumlah kasus terkonfirmasi positif, kasus pasien sembuh, pasien meninggal dan pasien dalam perawatan tiap harinya. Namun, dengan seiring bertambahnya kasus tiap hari, perlu upaya para akademisi dan praktisi untuk turut membantu pemerintah untuk menemukan solusi bersama. Exploratory Data Analysis, salah satu strategi yang tepat untuk melakukan analisis data dengan didukung teknologi Big Data, semakin mempermudah untuk melakukan eksplorasi secara mendalam. Berguna untuk menemukan pola-pola tersembunyi, mengungkap informasi yang belum diketahui sebelumnya, dan memberikan dampak untuk tindak lanjut ke depannya. Untuk merealisasikan hal tersebut, pertama, mengumpulkan data kasus COVID-19 dari Badan Nasional Penanggulangan Bencana, Republik Indonesia, lalu data di-load ke dalam Hadoop Environment dan diakses menggunakan HiveQL. Hasil eksperimen menunjukkan bahwa analisis statistik deskriptif menemukan total jumlah kasus COVID-19 tiap kategori paling sedikit terjadi pada bulan Maret sedangkan paling besar terjadi di bulan September 2020. Rata-rata harian kasus COVID-19 tiap bulannya selalu bertambah, dari 50 kasus per hari di bulan Maret hingga melonjak menjadi 3.740 per hari di bulan September. Analisis PDF-CDF menunjukkan laju pertumbuhan kasus terkonfirmasi positif COVID-19 semakin meningkat, belum ditemukan tanda-tanda melandai, dan analisis korelasi menunjukkan terdapat pengaruh kuat antara pertambahan jumlah kasus terkonfirmasi positif dengan jumlah kasus pasien sembuh dan kasus pasien meninggal sebesar 0.94 dan 0.9 masing-masing.

References

[1] World Health Organization, “Critical Preparedness, Readiness and Response Actions for COVID-19,” 26 March 2020.
[2] United Nations, “Launch of Global Humanitarian Response Plan for COVID-19,” 25 March 2020.
[3] R. Djalante, J. Lassa, D. Setiamarga, A. Sudjatma, M. Indrawan, B. Haryanto, C. Mahfud, M. S. Sinapoy, S. Djalante, I. Rafliana, L. A. Gunawan, G. A. K. Surtiari and H. Warsilah, “Review and analysis of current responses to COVID-19 in Indonesia: Period of January to March 2020,” Progress in Disaster Science, vol. 6, no. 100091, pp. 1-9, 2020.
[4] Asian Development Bank, “ADB Approves $3 Million Grant to Support Indonesia's Fight Against COVID-19,” 21 March 2020.
[5] Satuan Tugas Penanganan COVID-19, “Peta Sebaran COVID-19 di Indonesia,” 2020. [Online]. Available: https://covid19.go.id/peta-sebaran. [Accessed 11 October 2020].
[6] B. Sharma, “Processing of Data and Analysis,” Biostatistics and Epidemiology International Journal, vol. 1, no. 1, pp. 3-5, 2018.
[7] P. M. Buscema, F. D. Torre, M. Breda, G. Massini and E. Grossi, “COVID-19 in Italy and Extreme Data Mining,” Physica A, vol. 557, no. 124991, pp. 1-7, 2020.
[8] P. Radanliev, D. D. Roure and R. Walton, “Data Mining and Analysis of Scientific Research Data Records on Covid- 19 Mortality, Immunity, and Vaccine Development - In The First Wave of The Covid-19 Pandemic,” Diabetes & Metabolic Syndrome: Clinical Research & Reviews, vol. 14, no. 5, pp. 1121-1132, 2020.
[9] M. Roche, “COVID-19 and Media Datasets: Period- and Location-Specific Textual Data Mining,” Data in Brief, vol. 33, no. 106356, pp. 1-3, 2020.
[10] I. Yaqoob, I. A. T. Hashem, A. Gani, S. Mokhtar, E. Ahmed, N. B. Anuar and A. V. Vasilakos, “Big Data: From Beginning to Future,” International Journal of Information Management, vol. 36, no. 6, pp. 1231-1247, 2016.
[11] A. Oussous, F.-Z. Benjelloun, A. A. Lahcen and S. Belfkih, “Big Data Technologies: A Survey,” Journal of King Saud University – Computer and Information Sciences, vol. 33, no. 4, pp. 431-448, 2018.
[12] D. Usha and A. J. A.P.S, “A Survey of Big Data Processing in Perspective of Hadoop and Mapreduce,” International Journal of Current Engineering and Technology, vol. 4, no. 2, pp. 602-606, 2014.
[13] S. Sakr, Big Data 2.0 Processing Systems: A Survey, Switzerland: Springer, 2016.
[14] H. Bansal, S. Chauhan and S. Mehrotra, Apache Hive Cookbook, Birmingham: Pack Publishing Ltd, 2016.
[15] A. Loganathan, A. Sinha, M. V. and S. Natarajan, “A Systematic Approach to Big Data Exploration of the Hadoop Framework,” International Journal of Information & Computation Technology, vol. 4, no. 9, pp. 869-878, 2014.
[16] J. T. Behrens, “Principles and Procedures of Exploration Data Analysis,” Psychological Methods, vol. 2, no. 2, pp. 131-160, 1997.
[17] K. Sahoo, A. K. Samal, J. Pramanik and S. K. Pani, “Exploratory Data Analysis using Python,” International Journal of Innovative Technology and Exploring Engineering (IJITEE), vol. 8, no. 12, p. 2019, 2019.
[18] C. Chesneau, T. Hussain and H. S. Bakouch, “A New Cumulative Distribution Function Based on m Existing Ones,” UPB Scientific Bulletin, Series A: Applied Mathematics and Physics, vol. 80, no. 3, pp. 75-82, 2018.

Downloads

Published

2020-11-01

How to Cite

Fahrudin, T. M., Riyantoko, P. A., Hindrayani, K. M., & Mas Diyasa, I. G. S. (2020). Exploratory Data Analysis pada Kasus COVID-19 di Indonesia Menggunakan HiveQL dan Hadoop Environment. Prosiding Seminar Nasional Informatika Bela Negara, 1, 115–123. https://doi.org/10.33005/santika.v1i0.32

Issue

Section

Articles

Most read articles by the same author(s)

Obs.: This plugin requires at least one statistics/report plugin to be enabled. If your statistics plugins provide more than one metric then please also select a main metric on the admin's site settings page and/or on the journal manager's settings pages.