• AI Umum

    Asisten AI Baru SAP: Joule

    Pengenalan SAP Labs France, anak perusahaan SAP, menciptakan Joule, asisten AI generatif untuk meningkatkan produktivitas perusahaan. Joule, kopilot bahasa alami, akan hadir di aplikasi rantai pasokan, pengadaan, pengalaman pelanggan, dan Platform Teknologi Bisnis SAP. Fokus Joule Joule berfokus pada saran yang disesuaikan dan relevan. Ia memahami bahasa normal dan memberikan dukungan secara real-time. Joule dengan cepat mengurutkan dan mengontekstualisasikan data dari berbagai sistem untuk mengungkap wawasan yang unggul. Pendekatan SAP terhadap AI Bisnis Pendekatan SAP terhadap AI Bisnis adalah memberikan pelanggan AI yang paling relevan, andal, dan bertanggung jawab. Melalui jalur interaktif, pengunjung akan memiliki kesempatan untuk mendalami beberapa aplikasi…

  • AI Umum

    Arsitektur Transformer yang Baru: TransformerFAM

    Pendahuluan Transformer telah merevolusi pembelajaran mendalam, tetapi kompleksitas perhatian kuadratik membatasi kemampuan mereka untuk memproses masukan yang sangat panjang. Terlepas dari keefektifannya, mereka memiliki kelemahan seperti melupakan informasi di luar jendela perhatian dan kesulitan dalam pemrosesan konteks panjang. Upaya untuk mengatasi hal ini termasuk perhatian jendela geser dan aproksimasi jarang atau linier, tetapi sering kali harus mengejar ketinggalan dalam skala besar. TransformerFAM Terinspirasi oleh ilmu saraf, khususnya hubungan antara perhatian dan memori kerja, ada solusi yang diusulkan: menggabungkan perhatian ke representasi latennya melalui loop umpan balik dalam blok Transformer, yang berpotensi mengarah pada munculnya memori kerja di Transformer. Peneliti Google…

  • AI Umum

    Pembelajaran Penguatan dari Umpan Balik Manusia: Menjelajahi Mekanisme dan Keterbatasannya

    Pendahuluan Model bahasa besar (LLM) banyak digunakan di berbagai industri, tidak hanya terbatas pada tugas bahasa dasar. Model ini digunakan di sektor-sektor seperti teknologi, kesehatan, keuangan, dan pendidikan, dan dapat mengubah alur kerja yang stabil di sektor-sektor penting ini. Metode yang disebut Pembelajaran Penguatan dari Umpan Balik Manusia (RLHF) digunakan untuk membuat LLM aman, dapat dipercaya, dan menunjukkan kualitas seperti manusia. RLHF menjadi populer karena kemampuannya untuk memecahkan masalah Pembelajaran Penguatan (RL) seperti simulasi gerak robotik dan bermain game Atari dengan memanfaatkan umpan balik manusia tentang preferensi pada perilaku yang ditunjukkan. Metode ini sering digunakan untuk menyempurnakan LLM menggunakan umpan…

  • AI Umum

    Google Mengembangkan Berbagai Proyek untuk Platform Rumah Pintar

    Pendahuluan Beberapa inisiatif baru sedang dikembangkan untuk Google Home, platform rumah pintar milik perusahaan tersebut. Salah satu yang paling penting adalah penambahan mode offline. Implementasi Google Home saat ini, seperti yang dijelaskan oleh Android Authority, melibatkan perangkat yang terlebih dahulu mengirimkan perintah melalui server perusahaan sebelum memengaruhi jaringan Anda. Hal ini dapat membuat pemilik rumah frustrasi ketika internet mereka mati karena mereka tidak dapat mengirim permintaan apa pun. Mode offline akan menyelesaikan masalah ini secara langsung dengan memungkinkan kontrol di tingkat lokal. Mungkin akan lebih bijaksana bagi tim untuk meluangkan waktu memperbaiki celah, mengingat Wyze mengalami (sekali lagi) pelanggaran keamanan…

  • AI Umum

    Zamba-7B: Model AI Inovatif Zyphra dengan Ukuran Ringkas dan Performa Luar Biasa

    Dalam perlombaan menciptakan model AI yang lebih efisien dan canggih, Zyphra telah mengungkap terobosan signifikan dengan model Zamba-7B yang baru. Model ringkas berparameter 7 miliar ini tidak hanya bersaing dengan model yang lebih besar dan intensif sumber daya, tetapi juga memperkenalkan pendekatan arsitektur baru yang meningkatkan kinerja dan efisiensi. Desain Inovatif Model Zamba-7B adalah pencapaian luar biasa dalam pembelajaran mesin. Model ini memanfaatkan struktur inovatif yang dikenal sebagai “Mamba/Attention Hybrid” yang dikembangkan oleh para ahli di Zyphra. Struktur unik ini menggabungkan efisiensi blok Mamba dengan lapisan perhatian bersama global, yang secara signifikan meningkatkan kemampuan model untuk belajar dari ketergantungan data…

  • AI Umum

    Optimalisasi Kebijakan Reset Dataset (DR-PO): Algoritma Pembelajaran Mesin yang Memanfaatkan Kemampuan Model Generatif untuk Mereset dari Data Offline guna Meningkatkan RLHF dari Umpan Balik Berbasis Preferensi

    Pendahuluan Pembelajaran Penguatan (RL) terus berkembang seiring dengan eksplorasi para peneliti untuk menyempurnakan algoritma yang belajar dari umpan balik manusia. Domain algoritma pembelajaran ini menghadapi tantangan dalam mendefinisikan dan mengoptimalkan fungsi hadiah yang penting untuk melatih model guna melakukan berbagai tugas mulai dari bermain game hingga pemrosesan bahasa. Masalah yang Dihadapi Masalah yang lazim dalam bidang ini adalah penggunaan dataset preferensi manusia yang dikumpulkan sebelumnya secara tidak efisien, yang sering diabaikan dalam proses pelatihan RL. Secara tradisional, model-model ini dilatih dari awal, mengabaikan konten dataset yang kaya dan informatif. Kesenjangan ini menyebabkan inefisiensi dan kurangnya pemanfaatan pengetahuan yang berharga dan…

  • AI Umum

    Reka Core: Model Bahasa Multimodal Generasi Terbaru yang Mampu Memahami Teks, Gambar, dan Video

    Pengantar Reka, perusahaan rintisan kecerdasan buatan yang berbasis di California, telah menetapkan standar baru dalam industri ini. Reka baru-baru ini meluncurkan produk tercanggihnya, Reka Core. Model canggih ini merupakan bukti komitmen Reka yang tak tergoyahkan terhadap inovasi dan keunggulan. Dengan kemampuan multifasetnya yang mencakup pemrosesan dan pemahaman teks, gambar, video, dan audio, Reka Core pasti akan meninggalkan kesan abadi di dunia AI. Model Bahasa Multimodal yang Mutakhir Reka Core adalah model bahasa canggih yang mengklaim sebagai model “kelas terdepan”, yang berarti memiliki kinerja dan keserbagunaan yang luar biasa. Core telah melampaui pendahulunya, Flash dan Edge, yang keduanya sudah dikenal dengan…

  • AI Umum

    CTRL-Adapter: Kerangka AI Efisien dan Serbaguna untuk Mengadaptasi Berbagai Kontrol ke Model Difusi

    Pengantar Dalam media digital, kebutuhan akan kontrol yang presisi atas pembuatan gambar dan video telah mengarah pada pengembangan teknologi seperti ControlNets. Sistem ini memungkinkan manipulasi detail konten visual menggunakan kondisi seperti peta kedalaman, tepi canny, dan pose manusia. Namun, mengintegrasikan teknologi ini dengan model baru sering kali memerlukan sumber daya komputasi yang signifikan dan penyesuaian yang rumit karena ketidakcocokan dalam ruang fitur antara model yang berbeda. Tantangan utamanya terletak pada mengadaptasi ControlNets, yang dirancang untuk gambar statis, ke aplikasi video dinamis. Adaptasi ini sangat penting karena pembuatan video menuntut konsistensi spasial dan temporal, yang ditangani oleh ControlNets yang ada secara…

  • AI Umum

    Amazon Bedrock Perluas Portofolio AI dengan Seri Claude 3 yang Inovatif dari Anthropic

    Integrasi Model Claude 3 Amazon Web Services (AWS) telah mengumumkan integrasi model Claude 3 Anthropic ke dalam layanan Amazon Bedrock-nya. Integrasi ini telah memperluas kemampuan AI secara signifikan dan kini menawarkan rangkaian lengkap model Claude 3 – Opus, Sonnet, dan Haiku – sebagai layanan terkelola bagi pelanggannya. Amazon Bedrock adalah layanan pertama dan satu-satunya yang menyediakan model ini kepada pelanggan secara umum. Kemajuan Seri Claude 3 Seri Claude 3 oleh Anthropic telah membuat kemajuan signifikan dalam teknologi AI. Model utamanya, Claude 3 Opus, dianggap sebagai model dasar berkinerja tertinggi di pasar, melampaui model terkenal lainnya seperti GPT-4 OpenAI dalam kemampuan…

  • AI Umum

    Model Rho-1: Meningkatkan Efisiensi dan Efektivitas Pelatihan Model Bahasa

    Pengantar Kecerdasan buatan, khususnya dalam pemrosesan bahasa, telah menyaksikan kemajuan yang konsisten dengan meningkatkan parameter model dan ukuran kumpulan data. Kemajuan penting dalam pelatihan model bahasa secara tradisional bergantung pada penerapan tugas prediksi token berikutnya secara ekstensif di semua token pelatihan. Meskipun teknik ini banyak digunakan, asumsi bahwa setiap token dalam kumpulan data memberikan kontribusi yang sama terhadap proses pembelajaran semakin diteliti. Ketidakefisienan yang signifikan muncul ketika model dilatih secara seragam di semua token, banyak di antaranya mungkin perlu lebih penting untuk kinerja dan efisiensi pembelajaran model. Penelitian yang Ada Penelitian yang ada mencakup pengoptimalan pelatihan model bahasa melalui pemilihan…