AI Umum

Peneliti MIT Kembangkan Dataset Gambar yang Memungkinkan Simulasi Penglihatan Perifer dalam Model Pembelajaran Mesin

Pendahuluan

Penglihatan perifer, yang merepresentasikan dunia dengan tingkat ketelitian yang menurun pada eksentrisitas yang lebih besar, memainkan peran penting dalam pemrosesan visual manusia tetapi sering diabaikan dalam sistem visi komputer. Artikel ini membahas pengembangan dataset gambar yang memungkinkan simulasi penglihatan perifer dalam model pembelajaran mesin, untuk menjembatani kesenjangan antara persepsi manusia dan mesin.

Metode

Peneliti MIT mengembangkan Model Tiling Tekstur (TTM) yang dimodifikasi menjadi Model Tiling Tekstur Seragam (uniformTTM) untuk menghasilkan gambar yang diubah untuk menangkap informasi yang tersedia dalam penglihatan perifer manusia. Dataset COCO diubah menggunakan uniformTTM untuk membuat COCO-Periph, yang berisi gambar yang disimulasikan pada berbagai eksentrisitas penglihatan perifer.

Eksperimen dan Hasil

Eksperimen psikofisika mengevaluasi kinerja manusia dan DNN dalam deteksi objek perifer. Hasilnya menunjukkan bahwa DNN yang dilatih pada COCO-Periph menunjukkan peningkatan kinerja dibandingkan model yang dilatih sebelumnya, tetapi masih berkinerja lebih rendah dibandingkan manusia, terutama dalam kepekaan terhadap kekacauan.

Implikasi

Pemodelan penglihatan perifer yang akurat dalam DNN sangat penting untuk meniru dan memanfaatkan sifat-sifat pemrosesan visual manusia. Metode yang diusulkan menggunakan uniformTTM dan dataset COCO-Periph merupakan langkah maju yang signifikan, tetapi masih ada tantangan dalam menjembatani kesenjangan kinerja antara manusia dan DNN.

Aplikasi

Penelitian ini memiliki implikasi untuk berbagai aplikasi, seperti keselamatan pengemudi, daya ingat konten, desain UI/UX, rendering foveated, dan kompresi, di mana pemodelan persepsi visual seperti manusia sangat penting untuk meningkatkan kinerja mesin.