AI Umum

Kolaborator Pemodelan: Kerangka Kecerdasan Buatan Baru yang Memungkinkan Siapa Saja Melatih Model Visi Menggunakan Interaksi Bahasa Alami dan Upaya Minimal

Pengantar

Visi komputer secara tradisional berfokus pada pengenalan konsep yang disepakati secara objektif seperti hewan, kendaraan, atau objek tertentu. Namun, banyak aplikasi praktis di dunia nyata memerlukan identifikasi konsep subjektif yang dapat sangat bervariasi di antara individu, seperti memprediksi emosi, menilai daya tarik estetika, atau memoderasi konten.

Tantangan

Misalnya, apa yang dianggap konten “tidak aman” mungkin berbeda berdasarkan perspektif individu, dan definisi “gourmet” seorang kritikus makanan mungkin tidak sesuai dengan definisi orang lain. Ada kebutuhan yang berkembang akan kerangka kerja pelatihan yang berpusat pada pengguna untuk mengatasi tantangan ini yang memungkinkan siapa saja melatih model visi subjektif yang disesuaikan dengan kriteria spesifik mereka.

Solusi: Kolaborator Pemodelan

Agile Modeling baru-baru ini memperkenalkan kerangka kerja pengguna-dalam-lingkaran untuk memformalkan transformasi konsep visual apa pun menjadi model visi. Namun, pendekatan yang ada seringkali membutuhkan upaya manual yang signifikan dan membutuhkan lebih banyak efisiensi. Misalnya, algoritme pembelajaran aktif mereka mengharuskan pengguna untuk memberi label pada banyak gambar pelatihan secara berulang, yang bisa jadi membosankan dan memakan waktu. Keterbatasan ini menggarisbawahi perlunya metode yang lebih efisien yang memanfaatkan kemampuan manusia sambil meminimalkan upaya manual.

Salah satu kemampuan utama yang dimiliki manusia adalah kemampuan untuk menguraikan konsep subjektif yang kompleks menjadi komponen yang lebih mudah dikelola dan objektif menggunakan logika orde pertama. Dengan memecah konsep subjektif menjadi klausa objektif, individu dapat mendefinisikan ide-ide kompleks dengan cara yang tidak melelahkan dan tidak membutuhkan banyak usaha kognitif. Kolaborator Pemodelan memanfaatkan proses kognitif ini.

Alat ini memberdayakan pengguna untuk membangun pengklasifikasi dengan menguraikan konsep subjektif menjadi sub-komponen penyusunnya, secara signifikan mengurangi upaya manual dan meningkatkan efisiensi. Kolaborator Pemodelan menggunakan kemajuan dalam model bahasa besar (LLM) dan model visi-bahasa (VLM) untuk memfasilitasi pelatihan. Sistem ini menyederhanakan proses mendefinisikan dan mengklasifikasikan konsep subjektif dengan memanfaatkan LLM untuk memecah konsep menjadi pertanyaan yang dapat dicerna untuk model Visual Question Answering (VQA). Pengguna hanya perlu memberi label secara manual pada set validasi kecil yang terdiri dari 100 gambar, yang secara signifikan mengurangi beban anotasi.

Keunggulan

Selain itu, Kolaborator Pemodelan menonjol dari metode zero-shot yang ada pada konsep subjektif, terutama pada tugas yang lebih menantang. Dibandingkan dengan pendekatan sebelumnya seperti Agile Modeling, Kolaborator Pemodelan tidak hanya melampaui kualitas penilai kerumunan pada konsep yang sulit tetapi juga secara signifikan mengurangi kebutuhan akan anotasi kebenaran dasar manual dengan urutan besarnya.

Dampak

Dengan menurunkan hambatan untuk mengembangkan model klasifikasi, Kolaborator Pemodelan memberdayakan pengguna untuk menerjemahkan ide-ide mereka menjadi kenyataan lebih cepat, membuka jalan bagi gelombang baru aplikasi pengguna akhir dalam visi komputer. Selain itu, dengan memberikan pendekatan yang lebih mudah diakses dan efisien untuk membangun model visi subjektif, Kolaborator Pemodelan berpotensi merevolusi pengembangan aplikasi AI.

Dengan berkurangnya upaya dan biaya manual, jangkauan pengguna yang lebih luas, termasuk mereka yang tidak memiliki keahlian teknis yang luas, dapat berpartisipasi dalam pembuatan model visi khusus yang disesuaikan dengan kebutuhan dan preferensi spesifik mereka. Demokratisasi pengembangan AI ini dapat mengarah pada munculnya aplikasi inovatif di berbagai domain, termasuk kesehatan, pendidikan, hiburan, dan banyak lagi.

Pada akhirnya, dengan memberdayakan pengguna untuk dengan cepat mengubah ide-ide mereka menjadi kenyataan, Kolaborator Pemodelan berkontribusi pada demokratisasi AI dan menumbuhkan lanskap solusi bertenaga AI yang lebih inklusif dan beragam.