Perbandingan Algoritma K-Means dan DBSCAN dalam Metode Clustering dengan PCA untuk Analisis Data Statistik Negara Dunia
Keywords:
K-Means, DBSCAN, Clustering, PCA, Data Statistik NegaraAbstract
Penelitian ini menganalisis penggunaan algoritma K-Means dan DBSCAN dengan PCA dalam metode clustering untuk analisis data statistik negara dunia. Tujuan utamanya adalah mengidentifikasi pola dan kelompok dalam data tersebut serta membandingkan kinerja kedua algoritma. Data yang digunakan mencakup variabel seperti child mortality, exports, health, imports, income, inflation, life expectancy, total fertility, gdp, dan gov transparency. Proses analisis melibatkan preprocessing data, eksplorasi data menggunakan grafik, feature engineering, dan analisis komponen utama (PCA) untuk reduksi dimensi. Kemudian, dilakukan clustering dengan K-Means dan DBSCAN, dan hasilnya dievaluasi menggunakan metrik evaluasi clustering yang sesuai. Hasil dan pembahasan menunjukkan bahwa kedua algoritma mampu mengidentifikasi pola dalam data, tetapi terdapat perbedaan dalam hasil clustering. Analisis ini memberikan wawasan tentang pola dan kelompok dalam data statistik negara serta membandingkan kinerja algoritma K-Means dan DBSCAN.
References
Abineno, R. T. (2022). "Clustering Dampak dan Penanganan COVID-19 se-Asia Menggunakan Metode K-Means dengan Variabel-Variabel pada Epidemiologi" (Doctoral dissertation, Universitas Atma Jaya Yogyakarta).
Adha, R., Nurhaliza, N., Sholeha, U., & Mustakim, M. (2021). Perbandingan algoritma DBSCAN dan k-means clustering untuk pengelompokan kasus Covid-19 di dunia. SITEKIN: Jurnal Sains, Teknologi Dan Industri, 18(2), 206-211.
Ashari, B. S., Otniel, S. C., & Rianto, R. (2019). "Perbandingan Kinerja K-Means dengan DBSCAN untuk Metode Clustering Data Penjualan Online Retail." Jurnal Siliwangi Seri Sains dan Teknologi, 5(2), 64-67.
Biantara, B., Rohana, T., & Juwita, A. (2023). Perbandingan Algoritma K-Means dan DBSCAN untuk Pengelompokan Data Penyebaran Covid-19 Seluruh Kecamatan di Provinsi Jawa Barat. Scientific Student Journal for Information, Technology and Science, 4(1), 88-94.
Bu'ulolo, E., & Purba, B. (2021). Algoritma Clustering Untuk Membentuk Cluster Zona Penyebaran Covid-19. Digital Zone: Jurnal Teknologi Informasi dan Komunikasi, 12(1), 59-67.
Dikarya, F., & Muharni, S. (2022). PENERAPAN ALGORITMA K-MEANS CLUSTERING UNTUK PENGELOMPOKAN UNIVERSITAS TERBAIK DI DUNIA. Jurnal Informatika, 22(2), 124-131.
Hajar, S., Novany, A. A., Windarto, A. P., Wanto, A., & Irawan, E. (2020, February). Penerapan K-Means Clustering pada ekspor minyak kelapa sawit menurut negara tujuan. In Seminar Nasional Teknologi Komputer & Sains (SAINTEKS) (Vol. 1, No. 1, pp. 314-318).
KARJAWAN, A. R. H. (2022). Penerapan Metode Fuzzy Principal Component Analysis Untuk Alternatif Pemilihan Objek Wisata Terbaik Di Provinsi Daerah Istimewa Yogyakarta.
Jatipaningrum, M. T., Azhari, S. E., & Suryowati, K. (2022). Pengelompokan Kabupaten Dan Kota Di Provinsi Jawa Timur Berdasarkan Tingkat Kesejahteraan Dengan Metode K-Means Dan Density-Based Spatial Clustering Of Applications With Noise. Jurnal Derivat: Jurnal Matematika dan Pendidikan Matematika, 9(1), 70-81.
Permata Sari, A. A. (2020). "Implementasi Metode Improved K-Means dengan Algoritma DBSCAN untuk Pengelompokan Film" (Doctoral dissertation, Universitas Islam Indonesia).
Priyono, B., & Akhmad, E. P. A. (2023). "Monograf Pengelompokan Data Ekspor Ikan Segar/Dingin Hasil Tangkap Menurut Negara Tujuan Utama Menggunakan K-Means Clustering."
Sihananto, A. N., Sari, A. P., Khariono, H., Fernanda, R. A., & Wijaya, D. C. M. (2022). "Implementasi Metode K-Means untuk Pengelompokan Kasus COVID-19 Tingkat Provinsi di Indonesia." Jurnal Informatika dan Sistem Informasi, 3(1), 76-85.
Tamba, S. P., & Kesuma, F. T. (2019). Penerapan Data Mining Untuk Menentukan Penjualan Sparepart Toyota Dengan Metode K-Means Clustering: data mining; k-means-clustering. Jurnal Sistem Informasi dan Ilmu Komputer Prima (JUSIKOM PRIMA), 2(2), 67-72.
Wulandari, R., & Yustanti, W. (2022). Analisis Text Clustering Kebijakan Pembukaan Daerah Wisata pada Masa Pandemi Berbasis Densitas Spasial (DBSCAN). Journal of Emerging Information System and Business Intelligence (JEISBI), 3(2), 1-10.
Yulianti, T. R., Siregar, K. N., Prabawa, A., & Fadhilah, N. (2022). "Identifikasi Atribut dengan Principal Component Analysis dan K-Means Clustering sebagai Dasar Penyusunan Strategi Promosi KB Pria di Indonesia." Jurnal Biostatistik, Kependudukan, dan Informatika Kesehatan, 2(2), 79-94.