Arsitektur U-Net MobileNetV2 yang Efisien dan Akurat untuk Segmentasi Buah Multi-Kelas
Keywords:
MobileNetV2, Multi-class, Segmentasi Semantik, U-NetAbstract
Sistem pertanian presisi modern, seperti robot pemanen, sangat bergantung pada kemampuan computer vision untuk segmentasi buah secara real-time. Identifikasi objek sederhana tidaklah cukup; sistem ini memerlukan pemahaman spasial tingkat piksel untuk lokalisasi yang akurat, yang hanya dapat disediakan oleh segmentasi semantik. Namun, arsitektur segmentasi semantik yang umum seperti U-Net seringkali terlalu berat secara komputasi untuk aplikasi di perangkat edge. Penelitian ini mengusulkan dan mengevaluasi arsitektur U-Net yang dioptimalkan, menggunakan backbone MobileNetV2 pre-trained 1 untuk mencapai keseimbangan antara akurasi dan efisiensi. Model ini dilatih pada dataset FruitSeg30, yang terdiri dari 30 kelas buah. Sebuah langkah pra-pemrosesan krusial dilakukan untuk mengonversi mask biner per-kelas dari dataset asli menjadi mask multi-kelas tunggal (0-30). Model menerima input gambar berukuran piksel. Untuk mengatasi class imbalance, kami menggunakan hybrid loss function yang menggabungkan Categorical Cross-Entropy dan Dice Loss 2, serta dilatih menggunakan optimizer Adam. Hasil eksperimen menunjukkan kinerja yang luar biasa: model mencapai akurasi Dice Coefficient 97,84% dengan jumlah parameter yang ringan, yaitu 11,3 Juta. Lebih penting lagi, model ini mencapai waktu inferensi rata-rata 19,80 ms per gambar (~50,5 FPS). Kinerja ini membuktikan kelayakannya untuk aplikasi segmentasi real-time di lapangan dan menawarkan solusi praktis yang menjembatani kesenjangan antara akurasi tinggi dan kebutuhan komputasi yang rendah pada perangkat edge.
References
P. Maheswari, P. Raja, O. E. Apolo-Apolo, and M. Pérez-Ruiz, “Intelligent fruit yield estimation for orchards using deep learning based semantic segmentation techniques—A review,” Frontiers in Plant Science, vol. 12, p. 684328, 2021.
Z. Xie, Z. Ke, K. Chen, Y. Wang, Y. Tang, and W. Wang, “A lightweight deep learning semantic segmentation model for optical-image-based post-harvest fruit ripeness analysis of sugar apples (Annona squamosa),” Agriculture, vol. 14, no. 4, p. 591, 2024.
I. Ulku, “ContexNestedU-Net: Efficient context-aware semantic segmentation architecture for precision agriculture applications based on multispectral remote sensing imagery,” Technical Sciences, vol. 41, no. 5, 2024.
H. Song, Y. Shang, and D. He, “Review on deep learning technology for fruit target recognition,” Transactions of the Chinese Society of Agricultural Machinery, vol. 54, no. 1, 2023.
B. C. Bag, H. K. Maity, and C. Koley, “UNet MobileNetV2: Medical image segmentation using deep neural network (DNN),” Journal of Mechanics of Continua and Mathematical Sciences, vol. 18, no. 1, pp. 21–29, Jan. 2023.
Y. Xiao, H. Wang, Y. Xu, and R. Zhang, “Fruit detection and recognition based on deep learning for automatic harvesting: An overview and review,” Agronomy, vol. 13, no. 6, p. 1625, 2023.
“Evaluation of the effectiveness of the UNet model with different backbones in the semantic segmentation of tomato leaves and fruits,” Horticulturae, 2023.

