AI Umum

Penilaian MAD-Bench: Mengatasi Halusinasi dan Petunjuk Menyesatkan pada Model Bahasa Besar Multimoda

Pendahuluan

Model Bahasa Besar Multimoda (MLLM) telah memberikan kontribusi luar biasa bagi kemajuan AI. Namun, MLLM menghadapi tantangan dalam memproses dan merespons informasi yang menyesatkan secara akurat, yang mengarah pada respons yang salah atau berhalusinasi. Kerentanan ini menimbulkan kekhawatiran tentang keandalan MLLM dalam aplikasi yang memerlukan interpretasi akurat terhadap data teks dan visual.

Kategori Halusinasi pada MLLM

Studi tentang halusinasi pada MLLM berfokus pada rekayasa petunjuk dan peningkatan model untuk memitigasi masalah ini. Berbagai kategori halusinasi pada MLLM meliputi:

  • Mendeskripsikan objek yang tidak ada
  • Kesalahpahaman hubungan spasial
  • Penghitungan objek yang salah

MAD-Bench: Tolok Ukur untuk Penilaian MLLM

Sebuah kelompok peneliti dari Apple telah mengusulkan MAD-Bench, tolok ukur yang dikurasi dengan 850 pasangan gambar-petunjuk, untuk mengevaluasi bagaimana MLLM menangani inkonsistensi antara petunjuk teks dan gambar. MLLM populer seperti GPT-4V dan model sumber terbuka seperti LLaVA-1.5 dan CogVLM dianalisis, mengungkap kerentanan MLLM dalam menangani instruksi yang menyesatkan.

Kategori Penipuan

Dataset ini mencakup enam kategori penipuan:

  • Jumlah Objek
  • Objek Tidak Ada
  • Atribut Objek
  • Pemahaman Adegan
  • Hubungan Spasial
  • Kebingungan Visual

Hasil

Hasil menunjukkan bahwa GPT-4V berkinerja lebih baik dalam kategori pemahaman adegan dan kebingungan visual, dengan akurasi lebih dari 90%. Model yang mendukung input dan output kotak pembatas dapat bekerja lebih baik pada tolok ukur karena mengarahkan objek yang tidak ada.

Kesimpulan

Penelitian ini menyoroti masalah penting tentang kerentanan MLLM terhadap petunjuk yang menyesatkan dan menawarkan solusi yang menjanjikan untuk meningkatkan ketahanannya. MAD-Bench meningkatkan akurasi model dan membuka jalan bagi penelitian di masa depan untuk mengembangkan MLLM yang lebih andal dan tepercaya.