AI Umum

Peningkatan Potensi Robotika Melalui Riset AI Google DeepMind: Meningkatkan Kolaborasi Manusia-Robot dengan Model Bahasa yang Diatur dengan Baik dengan Kontrol Prediktif Model Bahasa

Pengantar

Bahasa alami merupakan antarmuka yang mudah diakses untuk mengendalikan robot dalam bidang robotika. Hal ini berpotensi memberdayakan individu dengan pelatihan terbatas untuk mengarahkan perilaku, mengungkapkan preferensi, dan memberikan umpan balik.

Studi terbaru telah menggarisbawahi kemampuan bawaan model bahasa besar (LLM), yang dilatih sebelumnya pada data internet yang luas, dalam menangani berbagai tugas robotika. Tugas-tugas ini berkisar dari merancang urutan tindakan berdasarkan perintah bahasa hingga menghasilkan kode robot.

Interaksi multi-gilir memungkinkan penggabungan umpan balik secara real-time, sehingga mendorong kemampuan beradaptasi dan pembelajaran. Namun, tantangannya terletak pada kemampuan LLM untuk mempertahankan informasi kontekstual selama interaksi yang berkepanjangan, yang menyebabkan lupa instruksi sebelumnya melampaui cakrawala tertentu.

Meningkatkan Kemampuan Mengajar LLM

Untuk mengatasi tantangan ini, upaya penelitian yang sedang berlangsung berupaya meningkatkan kemampuan mengajar LLM untuk tugas-tugas robot dengan memungkinkan mereka mempertahankan informasi kontekstual dari interaksi sebelumnya. Kemampuan mengajar menjadi titik fokus, diukur dengan rata-rata jumlah masukan manusia yang diperlukan agar robot menyelesaikan tugas dalam interaksi manusia-robot berbasis bahasa multi-gilir (HRI).

Pendekatan yang ada, seperti merangkum umpan balik atau preferensi manusia untuk referensi di masa mendatang, menghadapi keterbatasan dalam menggeneralisasi di luar tugas pelatihan.

Sebuah pendekatan baru muncul, yang bertujuan untuk meningkatkan kemampuan mengajar melalui perpaduan pembelajaran dalam konteks untuk adaptasi cepat selama interaksi dan penyetelan model untuk peningkatan jangka panjang. Pendekatan ini memperlakukan interaksi manusia-robot sebagai proses keputusan Markov yang dapat diamati sebagian (POMDP), yang memungkinkan LLM untuk memprediksi interaksi di masa mendatang dan mengintegrasikan kemampuan prediktif ini dengan teknik robotika klasik seperti kontrol prediktif model (MPC).

Kerangka kerja yang dihasilkan, yang disebut Kontrol Prediktif Model Bahasa (LMPC), memberdayakan LLM untuk mengantisipasi interaksi yang akan datang dan membuat keputusan optimal secara real-time.

Validasi Eksperimental

Validasi eksperimental yang ekstensif, yang menggabungkan evaluasi A/B buta, menggarisbawahi kemanjuran penyetelan yang baik dengan LMPC dalam meningkatkan kemampuan mengajar LLM di berbagai tugas dan perwujudan robot. LMPC mengungguli garis dasar pengambilan dan menunjukkan generalisasi yang kuat untuk tugas yang tidak terlihat dan antarmuka pemrograman aplikasi (API) robot.

Selain itu, LMPC terkondisi pengguna teratas, yang memprioritaskan data dari pengguna yang mahir, memperkuat kinerja di semua pengguna dan fungsi, menunjukkan keefektifannya dalam memanfaatkan berbagai masukan pengajaran.

Keterbatasan dan Prospek Masa Depan

Meskipun hasil yang menjanjikan, pendekatan ini menunjukkan keterbatasan yang melekat dan mendorong jalan untuk eksplorasi di masa depan. Diskusi terperinci mengenai keterbatasan dan prospek ini untuk penelitian di masa depan disediakan.

Para penulis berencana untuk merilis materi tambahan, termasuk video, kode, dan kumpulan data, untuk memfasilitasi penyelidikan lebih lanjut dan kemajuan dalam bidang interaksi manusia-robot yang sedang berkembang ini.

Kesimpulan

Mengintegrasikan pemrosesan bahasa alami dengan robotika sangat menjanjikan dalam mendemokratisasi pemrograman robot dan meningkatkan interaksi manusia-robot. Kerangka kerja LMPC yang diusulkan merupakan langkah maju yang signifikan dalam meningkatkan kemampuan mengajar LLM untuk tugas-tugas robot dengan menggabungkan adaptasi cepat selama interaksi dengan penyetelan model jangka panjang.

Seiring kemajuan penelitian di bidang ini, kemajuan dalam LMPC dan metodologi terkait berpotensi merevolusi cara robot diajarkan dan berinteraksi dengan manusia. Dengan mengatasi retensi kontekstual dan tantangan generalisasi, LMPC membuka jalan bagi kolaborasi yang lebih intuitif dan efisien antara manusia dan robot, membuka pintu ke berbagai aplikasi di seluruh industri dan domain.