• AI Umum

    Kerangka Kerja Pembelajaran Mesin Terpadu untuk Pembelajaran Berkelanjutan (CL)

    Pembelajaran Berkelanjutan (CL) CL berfokus pada perolehan pengetahuan dari distribusi data yang berubah secara dinamis. Teknik ini meniru skenario dunia nyata dan membantu meningkatkan kinerja model saat menemukan data baru sambil mempertahankan informasi sebelumnya. Tantangan Pembelajaran Berkelanjutan CL menghadapi tantangan yang disebut pelupaan bencana, di mana model melupakan atau menimpa pengetahuan sebelumnya saat mempelajari informasi baru. Metode untuk Mengatasi Pelupaan Bencana Peneliti telah memperkenalkan berbagai metode untuk mengatasi keterbatasan CL ini, seperti: Teknik berbasis Bayesian Solusi berbasis regularisasi Metodologi berorientasi pemutaran ulang memori Kerangka Kerja Terpadu untuk CL Dalam penelitian ini, para peneliti dari University of Maryland, College Park, dan…

  • AI Umum

    Dampak Kompresi Model pada Kekokohan Subgrup dalam Model Bahasa BERT

    Model bahasa besar (LLM) memiliki tuntutan komputasi yang tinggi, sehingga menghambat adopsi mereka di berbagai sektor. Hal ini mengalihkan perhatian ke teknik kompresi yang dirancang untuk mengurangi ukuran model dan kebutuhan komputasi tanpa mengorbankan kinerja secara signifikan. Peralihan ini sangat penting dalam Pemrosesan Bahasa Alami (NLP), memfasilitasi aplikasi dari klasifikasi dokumen hingga agen percakapan tingkat lanjut. Kekokohan Subgrup dalam Model Terkompresi Kekhawatiran yang mendesak dalam transisi ini adalah memastikan model terkompresi mempertahankan kekokohan terhadap subgrup minoritas dalam kumpulan data yang ditentukan oleh label dan atribut tertentu. Metode Kompresi Penelitian sebelumnya berfokus pada Distilasi Pengetahuan, Pemangkasan, Kuantisasi, dan Transfer Kosakata, yang…

  • AI Umum

    Peningkatan Model Bahasa OpenAI dengan Pelatihan Isi-di-Tengah: Jalan Menuju Kemampuan Isi yang Canggih

    Model bahasa berbasis transformer, seperti BERT dan T5, mahir dalam berbagai tugas tetapi kesulitan dengan pengisian—menghasilkan teks di lokasi tertentu sambil mempertimbangkan konteks sebelumnya dan sesudahnya. Meskipun model encoder-decoder dapat menangani sufiks, data pelatihan mereka biasanya mencakup wilayah isi yang lebih pendek daripada yang praktis. Namun, model berbasis decoder kausal, seperti GPT-3 dan penerusnya, unggul dalam pembuatan teks terbuka dan pembelajaran dalam konteks tanpa penyesuaian tugas khusus. Meskipun memiliki keterbatasan dalam pengisian, model-model ini banyak digunakan dalam aplikasi seperti bantuan pengkodean untuk tugas-tugas seperti pembuatan docstring atau pernyataan impor karena kesederhanaan dan efisiensinya. Peneliti OpenAI menunjukkan bahwa model bahasa autoregresif…

  • AI Umum

    Jamba: Model Bahasa Besar Hibrida SSM-Transformer Inovatif dari AI21 Labs

    Inovasi di Balik Jamba Jamba menggabungkan arsitektur Mamba dan Transformer untuk mengatasi keterbatasan masing-masing sistem sekaligus memanfaatkan kekuatannya. Tidak seperti model konvensional yang didasarkan pada arsitektur Transformer, seperti GPT, Gemini, dan Llama, Jamba menggunakan pendekatan hibrida. Jamba memiliki jendela konteks yang luar biasa sebesar 256K token, setara dengan sekitar 210 halaman teks, dan dapat memuat hingga 140K token pada satu GPU 80GB. Kemampuan ini jauh melampaui standar saat ini, seperti Llama 2 milik Meta yang hanya mengelola jendela konteks 32.000 token. Arsitektur hibrida Jamba menggabungkan lapisan Transformer, Mamba, dan campuran ahli (MoE), mengoptimalkan memori, throughput, dan kinerja. Model ini beroperasi…

  • AI Umum

    Penyesalan Agen LLM: Studi Kasus Pembelajaran dan Permainan Daring dari MIT dan University of Maryland

    Model Bahasa Besar (LLM) dan Pembuatan Keputusan LLM telah banyak digunakan untuk pembuatan keputusan (interaktif) melalui pengembangan model agen berbasis LLM. Dalam beberapa tahun terakhir, LLM telah menunjukkan keberhasilan luar biasa dalam AI yang diwujudkan, ilmu alam, dan aplikasi ilmu sosial. LLM juga menunjukkan potensi luar biasa dalam menyelesaikan berbagai permainan. Keberhasilan empiris yang menarik ini memerlukan pemeriksaan dan pemahaman yang cermat melalui lensa teoretis pembuatan keputusan. Penyesalan sebagai Metrik Kinerja Namun, kinerja agen LLM dalam pengambilan keputusan belum diselidiki secara menyeluruh melalui metrik kuantitatif, terutama dalam pengaturan multi-agen ketika mereka berinteraksi satu sama lain, skenario umum dalam aplikasi agen…

  • AI Umum

    Pengenalan Kognitiv Amplify: Alat AdTech AI Asli untuk Kampanye Lintas Saluran

    Mesin Teknologi AI yang Mendorong Kognitiv Amplify Kognitiv Amplify didukung oleh mesin AI milik Kognitiv, Kognition, yang menggabungkan ratusan model AI/ML termasuk nilai umur pelanggan, kecenderungan, churn, dan banyak lagi, untuk memberikan personalisasi satu-ke-satu dalam skala besar. Kognition mengevaluasi jutaan atribut, memprediksi perilaku pelanggan di masa mendatang, dan menetapkan interaksi sempurna untuk setiap pelanggan guna memenuhi tujuan bisnis yang telah ditentukan sebelumnya oleh merek. Peran AI dalam Memaksimalkan ROAS dan Menurunkan CPA Kognitiv Amplify menghadirkan perencanaan, eksekusi, dan optimalisasi berbasis hasil ke media berbayar dengan mendorong relevansi dan meningkatkan konversi dengan personalisasi hiper yang didukung AI, otomatisasi alur kerja lintas…

  • AI Umum

    Vonage Tingkatkan Perdagangan Percakapan dengan Kemampuan AI Generatif yang Canggih

    Bantuan Langsung dengan Dukungan AI Kemampuan baru yang didukung AI ini menyediakan bantuan dalam interaksi obrolan langsung, membantu agen menyesuaikan respons mereka dan memberikan layanan pelanggan yang lebih baik secara real-time. Dengan meningkatkan dan mempercepat respons obrolan langsung kepada pelanggan, serta menyempurnakan fungsionalitas untuk memastikan komunikasi yang tepat dengan memungkinkan agen menyempurnakan nada dan respons mereka, kekuatan AI membantu bisnis meningkatkan produktivitas agen dan efektivitas komunikasi secara keseluruhan. Templat Pemasaran WhatsApp untuk Produksi Konten Otomatis Penawaran baru ini juga mencakup generator konten, yang dirancang untuk membuat templat pemasaran berbasis WhatsApp yang memberdayakan merek untuk mempercepat dan menyederhanakan produksi konten pemasaran…

  • AI Umum

    Peningkatan Pengembangan Kendaraan Berbasis Perangkat Lunak oleh NXP dengan Platform Open S32 CoreRide

    Pendahuluan NXP Semiconductors telah meluncurkan Platform Open S32 CoreRide untuk meningkatkan pengembangan kendaraan. Ini adalah platform pertama di industri yang menggabungkan pemrosesan, jaringan kendaraan, dan manajemen daya sistem dengan perangkat lunak terintegrasi untuk mengatasi kompleksitas, skalabilitas, efisiensi biaya, dan upaya pengembangan yang diperlukan untuk kendaraan generasi berikutnya. Platform S32 CoreRide Platform S32 CoreRide menyatukan komputasi S32 yang telah mapan, jaringan, manajemen daya sistem, dan perangkat lunak siap pakai dari ekosistem mitra perangkat lunak NXP yang luas. Perusahaan juga meluncurkan solusi S32 CoreRide pertamanya untuk komputasi sentral berdasarkan keluarga prosesor super-integrasi kendaraan S32N yang baru dari NXP. Ini menawarkan kombinasi pemrosesan…

  • AI Umum

    Peningkatan AI DevOps dengan Teknologi Komputasi Terdesentralisasi GPU dan NPU Generasi Baru

    Fitur Baru yang Meningkatkan Komputasi Terdesentralisasi GPU dan NPU 0xGPU menawarkan fitur-fitur baru untuk meningkatkan komputasi terdesentralisasi GPU dan NPU. Fitur-fitur ini bertujuan untuk memanfaatkan kekuatan GPU untuk pelatihan dan inferensi AI yang dipercepat. Selain itu, proyek ini juga akan memberikan manfaat tambahan bagi pengguna yang berpartisipasi dalam ekosistem. Pendekatan Komputasi Berpusat pada GPU: Memungkinkan pemrosesan paralel tugas AI yang kompleks, mempercepat pengembangan AI untuk lembaga penelitian. Pembagian Pendapatan: Mendorong pengguna untuk mempertaruhkan token dan memperoleh penghasilan pasif sambil berkontribusi pada kekuatan komputasi jaringan. Manajemen Memori yang Efisien: Model AI dapat mengakses sumber daya yang diperlukan untuk kinerja optimal, memungkinkan…

  • AI Umum

    Sistem Operasi Agen LLM: AIOS, Otak Baru Sistem Operasi

    Kecerdasan buatan (AI) telah membawa perubahan dinamis di berbagai sektor, terutama dengan penerapan agen otonom yang mampu beroperasi dan mengambil keputusan secara mandiri. Agen-agen ini, yang didukung oleh model bahasa besar (LLM), telah memperluas cakupan tugas yang dapat diotomatisasi secara signifikan, mulai dari pemrosesan data sederhana hingga skenario pemecahan masalah yang kompleks. Namun, seiring dengan berkembangnya kemampuan agen-agen ini, tantangan yang terkait dengan penerapan dan integrasinya juga meningkat. Dalam lanskap yang terus berkembang ini, hambatan utama adalah pengelolaan agen berbasis LLM yang efisien. Masalah utama berkisar pada alokasi sumber daya komputasi, pemeliharaan konteks interaksi, dan integrasi agen dengan berbagai kemampuan…