AI Umum

Meningkatkan Segmentasi Citra Bawah Air dengan Pembelajaran Mendalam: Pendekatan Baru untuk Perluasan Dataset dan Teknik Praproses

Ringkasan

Penggabungan pemrosesan citra bawah air dengan pembelajaran mesin menawarkan potensi yang signifikan untuk meningkatkan kemampuan robot bawah air dalam berbagai tugas eksplorasi laut. Segmentasi citra, aspek penting dari visi mesin, sangat penting untuk mengidentifikasi dan mengisolasi objek yang diinginkan dalam citra bawah air. Metode segmentasi tradisional, seperti algoritma berbasis ambang batas dan berbasis morfologi, telah digunakan tetapi perlu bantuan untuk menggambarkan objek secara akurat di lingkungan bawah air yang kompleks tempat degradasi citra biasa terjadi. Para peneliti semakin banyak menggunakan teknik pembelajaran mendalam untuk segmentasi citra bawah air untuk mengatasi tantangan ini. Metode pembelajaran mendalam, termasuk segmentasi semantik dan instans, memberikan analisis yang lebih tepat dengan memungkinkan segmentasi tingkat piksel dan tingkat objek. Kemajuan terkini, seperti FCN-DenseNet dan Mask R-CNN, menjanjikan untuk meningkatkan akurasi dan kecepatan segmentasi. Namun, penelitian lebih lanjut diperlukan untuk mengatasi tantangan seperti ketersediaan dataset yang terbatas dan degradasi kualitas citra, yang memastikan kinerja yang kuat dalam skenario eksplorasi bawah air.

Metode yang Diusulkan

Untuk mengatasi tantangan yang ditimbulkan oleh dataset citra bawah air yang terbatas dan degradasi kualitas citra, sebuah tim peneliti dari Tiongkok baru-baru ini menerbitkan sebuah makalah baru yang mengusulkan solusi inovatif. Metode yang diusulkan didasarkan pada langkah-langkah berikut:

  1. Perluasan Dataset:

    • Memperluas ukuran dataset citra bawah air dengan menggunakan teknik-teknik seperti rotasi citra, pembalikan, dan Generative Adversarial Network (GAN) untuk menghasilkan citra tambahan.
  2. Praproses Peningkatan Citra:

    • Menerapkan algoritma peningkatan citra bawah air untuk memproses dataset, mengatasi masalah yang terkait dengan degradasi kualitas citra.
  3. Rekonstruksi Jaringan Pembelajaran Mendalam:

    • Merekonstruksi jaringan pembelajaran mendalam dengan menghapus lapisan terakhir dari peta fitur dengan bidang reseptif terbesar di Jaringan Piramida Fitur (FPN) dan mengganti jaringan tulang punggung asli dengan jaringan ekstraksi fitur yang ringan.

Hasil Eksperimen

Studi eksperimental menilai efektivitas pendekatan yang diusulkan dalam meningkatkan kualitas citra bawah air dan menyempurnakan akurasi segmentasi instans. Metrik kuantitatif, termasuk entropi informasi, kontras kuadrat rata-rata, gradien rata-rata, dan evaluasi kualitas citra warna bawah air, digunakan untuk mengevaluasi algoritma peningkatan citra, di mana algoritma kombinasi, terutama WAC, menunjukkan kinerja yang unggul. Eksperimen validasi mengkonfirmasi kemanjuran teknik augmentasi data dalam menyempurnakan akurasi segmentasi dan menggarisbawahi efektivitas algoritma praproses citra, dengan WAC melampaui metode alternatif. Modifikasi pada jaringan Mask R-CNN, khususnya Jaringan Piramida Fitur (FPN), meningkatkan akurasi segmentasi dan kecepatan pemrosesan. Mengintegrasikan praproses citra dengan peningkatan jaringan semakin memperkuat akurasi pengenalan dan segmentasi, memvalidasi efektivitas pendekatan dalam analisis citra bawah air dan tugas segmentasi.

Kesimpulan

Singkatnya, mengintegrasikan pemrosesan citra bawah air dengan pembelajaran mesin menjanjikan untuk meningkatkan kemampuan robot bawah air dalam eksplorasi laut. Teknik pembelajaran mendalam, termasuk segmentasi semantik dan instans, menawarkan analisis yang tepat meskipun ada tantangan lingkungan bawah air. Kemajuan terkini seperti FCN-DenseNet dan Mask R-CNN menunjukkan potensi untuk meningkatkan akurasi segmentasi. Sebuah studi baru-baru ini mengusulkan pendekatan komprehensif yang melibatkan perluasan dataset, algoritma peningkatan citra, dan modifikasi jaringan, yang menunjukkan efektivitas dalam meningkatkan kualitas citra dan menyempurnakan akurasi segmentasi. Pendekatan ini memiliki implikasi yang signifikan untuk analisis citra bawah air dan tugas segmentasi.