AI Umum

Gemma: Model Bahasa Terbuka Ringan dari Google

Pengantar Gemma

Google telah memperkenalkan Gemma, serangkaian model bahasa terbuka yang dibangun berdasarkan model Gemini. Tersedia dalam dua ukuran, Gemma 2B dan 7B, model-model ini dilengkapi dengan opsi pra-latih dan penyetelan instruksi.

Kinerja Gemma

Di seluruh tolok ukur, Gemma mengungguli LLM Meta, Llama 2. Misalnya, model Gemma dengan 7 miliar parameter mengungguli Llama 2 dalam penalaran, matematika, dan kategori lainnya, dengan akurasi umum 64,3%.

Aksesibilitas Gemma

Pengguna dapat mulai bekerja dengan Gemma sekarang melalui notebook Colab dan akses gratis di Kaggle. Selain itu, pengguna pertama kali Google Cloud berhak mendapatkan kredit senilai $300. Kredit Google Cloud, yang dapat diminta oleh peneliti hingga $500.000, juga dapat digunakan untuk mempercepat penelitian.

Fitur Gemma

  • Dua varian: Gemma 2B (2 miliar parameter) dan Gemma 7B (7 miliar parameter)
  • Varian pra-latih dan penyetelan instruksi untuk setiap ukuran
  • Toolkit AI Generatif yang Bertanggung Jawab untuk pengembangan aplikasi AI yang lebih aman

Integrasi dan Implementasi

  • Toolchain inferensi dan fine-tuning terawasi (SFT) untuk Keras 3.0 asli di semua kerangka kerja utama: JAX, PyTorch, dan TensorFlow
  • Integrasi dengan alat populer seperti Hugging Face, MaxText, Nvidia NeMo, dan TensorRT-LLM
  • Notebook Colab dan Kaggle yang siap pakai
  • Penyebaran mudah di Vertex AI dan Google Kubernetes Engine (GKE)
  • Optimalisasi di berbagai platform perangkat keras AI untuk kinerja terbaik

Komersialisasi dan Distribusi

Semua organisasi, terlepas dari ukurannya, diizinkan untuk penggunaan dan distribusi komersial yang bertanggung jawab sesuai dengan ketentuan penggunaan.

Kesimpulan

Gemma mengungguli Llama 2 pada beberapa tolok ukur, menjadikannya model bahasa yang kuat dan dapat diakses. Dengan dukungan Keras 3.0, integrasi alat, dan aksesibilitas melalui Colab dan Kaggle, Gemma siap untuk adopsi yang luas.