AI Umum

SLIM: Model Panggilan Fungsi Khusus untuk Otomatisasi Multi-Langkah

Perusahaan ingin menerapkan LLM dalam kasus penggunaan produksi yang lebih kompleks di luar asisten pengetahuan sederhana, ada tiga kebutuhan yang saling berhubungan yang semakin dikenal:

  • Agen: Alur kerja yang kompleks melibatkan beberapa langkah dan memerlukan orkestrasi beberapa panggilan LLM.
  • Panggilan Fungsi: Model harus mampu menghasilkan keluaran terstruktur yang dapat ditangani secara terprogram, termasuk tugas-tugas utama seperti klasifikasi dan pengelompokan, yang sering kali menjadi jaringan ikat dalam alur kerja tersebut.
  • Cloud Pribadi: Model dan jalur pipa data perlu disetel dengan baik dan terintegrasi erat dengan proses dan penyimpanan data perusahaan yang sensitif.

LLMWare berupaya mengatasi ketiga tantangan ini secara unik dengan meluncurkan model bahasa kecil 1B parameter yang disebut SLIM (Structured Language Instruction Models) dan serangkaian kemampuan baru di pustaka LLMWare untuk menjalankan alur kerja agen multi-model dan multi-langkah di cloud pribadi.

SLIM bergabung dengan keluarga model khusus kecil yang ada dari LLMWare – DRAGON, BLING, dan Industry-BERT – bersama dengan kerangka kerja pengembangan LLMWare, untuk membuat serangkaian model sumber terbuka dan jalur pipa data yang komprehensif untuk mengatasi berbagai kasus penggunaan RAG perusahaan yang kompleks.

SLIM Klasifikasi dengan Keluaran Terprogram

SLIM adalah model kecil dan khusus yang dirancang untuk fungsi klasifikasi bahasa alami, dan telah dilatih untuk menghasilkan keluaran terprogram seperti kamus Python, JSON, dan SQL, bukan keluaran teks konvensional. Ada 10 model SLIM yang dirilis: Sentimen, NER (Pengenalan Entitas Bernama), Topik, Peringkat, Emosi, Entitas, SQL, Kategori, NLI (Inferensi Bahasa Alami), dan Niat.

SLIM dirancang untuk melengkapi LLM tujuan umum dalam alur kerja perusahaan yang kompleks. Dengan dibangun di atas arsitektur dekoder LLM, SLIM mendapat manfaat dari kurva inovasi dalam model LLM dasar, dengan peluncuran SLIM pertama yang berfokus secara khusus pada berbagai aktivitas klasifikasi. Visi yang lebih besar untuk model SLIM adalah mencakup fungsi dan parameter yang lebih terspesialisasi di masa mendatang.

SLIM memiliki beberapa fitur menarik untuk penerapan perusahaan:

  • Menata ulang pengklasifikasi khusus ‘hard-coded’ tradisional untuk era Gen AI – dan untuk integrasi yang mulus ke dalam proses berbasis LLM.
  • Dirancang berdasarkan metodologi pelatihan umum untuk penyetelan dan adaptasi yang baik, memungkinkan kemampuan untuk dengan mudah menggabungkan, menumpuk, dan menyempurnakan model-model ini untuk kasus penggunaan tertentu.
  • Jalankan alur kerja multi-langkah tanpa GPU dengan versi terkuantisasi dari setiap model SLIM untuk membuat agen, memuat beberapa model SLIM, dan menggunakan LLM DRAGON tanya jawab mutakhir yang terkuantisasi.

Memperluas Kepemimpinan LLMWare dalam Model Khusus Kecil

Menurut CEO Darren Oberst, “Salah satu penghambat utama untuk membuka banyak kasus penggunaan perusahaan dengan LLM adalah kemampuan untuk mengubah keluaran LLM menjadi titik keputusan yang dapat ditangani secara terprogram. Model obrolan telah dioptimalkan untuk kelancaran dan percakapan – yang cenderung panjang dan sulit untuk ditangani dalam langkah ‘jika…maka’ terprogram. Apa yang kami dengar secara konsisten dari pelanggan perusahaan kami adalah kebutuhan akan fungsi klasifikasi dan evaluasi tekstual terprogram untuk direduksi menjadi serangkaian nilai tunggal dan proses multi-langkah. Ini memungkinkan serangkaian keluaran LLM yang dapat digunakan untuk sampai pada titik keputusan dalam proses tersebut. Kami percaya bahwa SLIM adalah bagian yang hilang dalam persamaan ini.”

Dengan peluncuran model SLIM, ekosistem LLMWare adalah salah satu kerangka kerja pengembangan sumber terbuka paling komprehensif untuk alur kerja LLM yang berfokus pada perusahaan:

  • 40+ model khusus kecil sumber terbuka yang dioptimalkan untuk tugas yang berbeda, termasuk model DRAGON dan BLING yang dioptimalkan untuk tanya jawab berbasis fakta yang sangat akurat dan model penyematan Industry-BERT yang disetel dengan baik oleh industri.
  • Jalur pipa data ujung ke ujung yang menggabungkan penguraian dan integrasi berkecepatan tinggi dan berkualitas tinggi dengan penyimpanan data persisten terkemuka, seperti MongoDB, Postgres, SQLite, dan penyimpanan vektor terkemuka, seperti Milvus, PG Vector, Redis, Qdrant, dan FAISS.

Inovasi terbaru oleh LLMWare siap untuk mendorong otomatisasi LLM di perusahaan dan menandai lompatan maju yang signifikan dalam persimpangan model bahasa kecil dan sistem perusahaan.