AI Umum

Peneliti Huawei Memperkenalkan Fungsi Rugi Baru yang Dapat Disesuaikan secara Adaptif untuk Pengawasan yang Lemah hingga Kuat

Ketergantungan Kecerdasan Buatan pada Keahlian Manusia

Kemajuan dan perkembangan kecerdasan buatan (AI) sangat bergantung pada evaluasi, bimbingan, dan keahlian manusia. Dalam visi komputer, jaringan konvolusional memperoleh pemahaman semantik gambar melalui pelabelan ekstensif yang disediakan oleh para ahli, seperti menggambarkan batas objek dalam kumpulan data seperti COCO atau mengkategorikan gambar di ImageNet. Demikian pula, dalam robotika, pembelajaran penguatan sering kali bergantung pada fungsi hadiah yang ditentukan manusia untuk mengarahkan mesin menuju kinerja yang optimal. Dalam Pemrosesan Bahasa Alami (NLP), jaringan saraf berulang dan Transformer dapat mempelajari seluk-beluk bahasa dari sejumlah besar teks tanpa pengawasan yang dihasilkan oleh manusia. Hubungan simbiosis ini menyoroti bagaimana model AI maju dengan memanfaatkan kecerdasan manusia, memanfaatkan kedalaman dan luasnya keahlian manusia untuk meningkatkan kemampuan dan pemahaman mereka.

Konsep Superalignment

Para peneliti dari Huawei memperkenalkan konsep “superalignment” untuk mengatasi tantangan dalam memanfaatkan keahlian manusia secara efektif untuk mengawasi model AI super cerdas. Superalignment bertujuan untuk menyelaraskan model super cerdas untuk memaksimalkan pembelajaran mereka dari masukan manusia. Sebuah konsep penting dalam bidang ini adalah Generalisasi Lemah-ke-Kuat (WSG), yang mengeksplorasi penggunaan model yang lebih lemah untuk mengawasi model yang lebih kuat. Penelitian WSG telah menunjukkan bahwa model yang lebih kuat dapat melampaui kinerja model yang lebih lemah melalui pengawasan sederhana, bahkan dengan label yang tidak lengkap atau cacat. Pendekatan ini telah menunjukkan keefektifannya dalam pemrosesan bahasa alami dan pembelajaran penguatan.

Superalignment dalam Visi Komputer

Para peneliti memperluas ide mereka ke “superalignment visi,” khususnya dengan meneliti penerapan Generalisasi Lemah-ke-Kuat (WSG) dalam konteks model dasar visi. Beberapa skenario dalam visi komputer, termasuk pembelajaran beberapa bidikan, pembelajaran transfer, pembelajaran label berisik, dan pengaturan distilasi pengetahuan tradisional, dirancang dan diperiksa dengan cermat. Efektivitas pendekatan mereka berasal dari kapasitasnya untuk memadukan pembelajaran langsung dari model lemah dengan kemampuan inheren model kuat untuk memahami dan menafsirkan data visual. Dengan memanfaatkan panduan yang diberikan oleh model lemah sambil memanfaatkan kemampuan canggih dari model kuat, metode ini memungkinkan model kuat untuk melampaui batasan model lemah, sehingga meningkatkan prediksinya.

Tantangan dan Solusi

Namun, untuk mengatasi masalah model lemah yang tidak memberikan panduan yang tepat dan model kuat terkadang memberikan label yang salah, diperlukan metode yang lebih cerdas daripada sekadar mencampurkan label-label ini. Karena sulit untuk mengetahui seberapa akurat setiap label, di masa mendatang, para peneliti berencana untuk menggunakan kepercayaan sebagai ukuran untuk memilih label yang paling mungkin benar. Dengan cara ini, dengan mempertimbangkan tingkat kepercayaan, seseorang dapat memilih label terbaik secara lebih efektif, membuat prediksi model lebih akurat dan andal secara keseluruhan.