• AI Umum

    Google Mengembangkan Berbagai Proyek untuk Platform Rumah Pintar

    Pendahuluan Beberapa inisiatif baru sedang dikembangkan untuk Google Home, platform rumah pintar milik perusahaan tersebut. Salah satu yang paling penting adalah penambahan mode offline. Implementasi Google Home saat ini, seperti yang dijelaskan oleh Android Authority, melibatkan perangkat yang terlebih dahulu mengirimkan perintah melalui server perusahaan sebelum memengaruhi jaringan Anda. Hal ini dapat membuat pemilik rumah frustrasi ketika internet mereka mati karena mereka tidak dapat mengirim permintaan apa pun. Mode offline akan menyelesaikan masalah ini secara langsung dengan memungkinkan kontrol di tingkat lokal. Mungkin akan lebih bijaksana bagi tim untuk meluangkan waktu memperbaiki celah, mengingat Wyze mengalami (sekali lagi) pelanggaran keamanan…

  • AI Umum

    Zamba-7B: Model AI Inovatif Zyphra dengan Ukuran Ringkas dan Performa Luar Biasa

    Dalam perlombaan menciptakan model AI yang lebih efisien dan canggih, Zyphra telah mengungkap terobosan signifikan dengan model Zamba-7B yang baru. Model ringkas berparameter 7 miliar ini tidak hanya bersaing dengan model yang lebih besar dan intensif sumber daya, tetapi juga memperkenalkan pendekatan arsitektur baru yang meningkatkan kinerja dan efisiensi. Desain Inovatif Model Zamba-7B adalah pencapaian luar biasa dalam pembelajaran mesin. Model ini memanfaatkan struktur inovatif yang dikenal sebagai “Mamba/Attention Hybrid” yang dikembangkan oleh para ahli di Zyphra. Struktur unik ini menggabungkan efisiensi blok Mamba dengan lapisan perhatian bersama global, yang secara signifikan meningkatkan kemampuan model untuk belajar dari ketergantungan data…

  • AI Umum

    Optimalisasi Kebijakan Reset Dataset (DR-PO): Algoritma Pembelajaran Mesin yang Memanfaatkan Kemampuan Model Generatif untuk Mereset dari Data Offline guna Meningkatkan RLHF dari Umpan Balik Berbasis Preferensi

    Pendahuluan Pembelajaran Penguatan (RL) terus berkembang seiring dengan eksplorasi para peneliti untuk menyempurnakan algoritma yang belajar dari umpan balik manusia. Domain algoritma pembelajaran ini menghadapi tantangan dalam mendefinisikan dan mengoptimalkan fungsi hadiah yang penting untuk melatih model guna melakukan berbagai tugas mulai dari bermain game hingga pemrosesan bahasa. Masalah yang Dihadapi Masalah yang lazim dalam bidang ini adalah penggunaan dataset preferensi manusia yang dikumpulkan sebelumnya secara tidak efisien, yang sering diabaikan dalam proses pelatihan RL. Secara tradisional, model-model ini dilatih dari awal, mengabaikan konten dataset yang kaya dan informatif. Kesenjangan ini menyebabkan inefisiensi dan kurangnya pemanfaatan pengetahuan yang berharga dan…

  • AI Umum

    Reka Core: Model Bahasa Multimodal Generasi Terbaru yang Mampu Memahami Teks, Gambar, dan Video

    Pengantar Reka, perusahaan rintisan kecerdasan buatan yang berbasis di California, telah menetapkan standar baru dalam industri ini. Reka baru-baru ini meluncurkan produk tercanggihnya, Reka Core. Model canggih ini merupakan bukti komitmen Reka yang tak tergoyahkan terhadap inovasi dan keunggulan. Dengan kemampuan multifasetnya yang mencakup pemrosesan dan pemahaman teks, gambar, video, dan audio, Reka Core pasti akan meninggalkan kesan abadi di dunia AI. Model Bahasa Multimodal yang Mutakhir Reka Core adalah model bahasa canggih yang mengklaim sebagai model “kelas terdepan”, yang berarti memiliki kinerja dan keserbagunaan yang luar biasa. Core telah melampaui pendahulunya, Flash dan Edge, yang keduanya sudah dikenal dengan…

  • AI Umum

    CTRL-Adapter: Kerangka AI Efisien dan Serbaguna untuk Mengadaptasi Berbagai Kontrol ke Model Difusi

    Pengantar Dalam media digital, kebutuhan akan kontrol yang presisi atas pembuatan gambar dan video telah mengarah pada pengembangan teknologi seperti ControlNets. Sistem ini memungkinkan manipulasi detail konten visual menggunakan kondisi seperti peta kedalaman, tepi canny, dan pose manusia. Namun, mengintegrasikan teknologi ini dengan model baru sering kali memerlukan sumber daya komputasi yang signifikan dan penyesuaian yang rumit karena ketidakcocokan dalam ruang fitur antara model yang berbeda. Tantangan utamanya terletak pada mengadaptasi ControlNets, yang dirancang untuk gambar statis, ke aplikasi video dinamis. Adaptasi ini sangat penting karena pembuatan video menuntut konsistensi spasial dan temporal, yang ditangani oleh ControlNets yang ada secara…

  • AI Umum

    Amazon Bedrock Perluas Portofolio AI dengan Seri Claude 3 yang Inovatif dari Anthropic

    Integrasi Model Claude 3 Amazon Web Services (AWS) telah mengumumkan integrasi model Claude 3 Anthropic ke dalam layanan Amazon Bedrock-nya. Integrasi ini telah memperluas kemampuan AI secara signifikan dan kini menawarkan rangkaian lengkap model Claude 3 – Opus, Sonnet, dan Haiku – sebagai layanan terkelola bagi pelanggannya. Amazon Bedrock adalah layanan pertama dan satu-satunya yang menyediakan model ini kepada pelanggan secara umum. Kemajuan Seri Claude 3 Seri Claude 3 oleh Anthropic telah membuat kemajuan signifikan dalam teknologi AI. Model utamanya, Claude 3 Opus, dianggap sebagai model dasar berkinerja tertinggi di pasar, melampaui model terkenal lainnya seperti GPT-4 OpenAI dalam kemampuan…

  • AI Umum

    Model Rho-1: Meningkatkan Efisiensi dan Efektivitas Pelatihan Model Bahasa

    Pengantar Kecerdasan buatan, khususnya dalam pemrosesan bahasa, telah menyaksikan kemajuan yang konsisten dengan meningkatkan parameter model dan ukuran kumpulan data. Kemajuan penting dalam pelatihan model bahasa secara tradisional bergantung pada penerapan tugas prediksi token berikutnya secara ekstensif di semua token pelatihan. Meskipun teknik ini banyak digunakan, asumsi bahwa setiap token dalam kumpulan data memberikan kontribusi yang sama terhadap proses pembelajaran semakin diteliti. Ketidakefisienan yang signifikan muncul ketika model dilatih secara seragam di semua token, banyak di antaranya mungkin perlu lebih penting untuk kinerja dan efisiensi pembelajaran model. Penelitian yang Ada Penelitian yang ada mencakup pengoptimalan pelatihan model bahasa melalui pemilihan…

  • AI Umum

    Pendekatan AI AutoCodeRover: Otomatisasi Penyelesaian Masalah GitHub untuk Peningkatan Program Otomatis

    Representasi Program AutoCodeRover menekankan representasi program, khususnya pohon sintaks abstrak (AST). Pendekatan ini penting untuk otomatisasi teknik perangkat lunak, karena menyoroti sifat struktural kode. Pencarian Kode Pendekatan ini menggunakan teknik pencarian kode yang meniru pemikiran pemrogram. Dengan memanfaatkan struktur program seperti kelas, metode, dan cuplikan kode, LLM dapat menggunakan konteks secara lebih efektif. Efektivitas Otomatis Tim menekankan pentingnya memprioritaskan efektivitas perbaikan otomatis daripada efisiensi waktu, selama kriteria waktu yang realistis terpenuhi. AutoCodeRover mencapai efektivitas 22% dalam memperbaiki masalah GitHub dalam waktu kurang dari 10 menit, jauh lebih cepat dari rata-rata resolusi manual (2,77 hari). Integrasi Debugging Pencarian kode dalam AutoCodeRover…

  • AI Umum

    Neuroteknologi dan Penggabungannya dengan Kecerdasan Buatan

    Pendahuluan Perkembangan teknologi telah memunculkan neuroteknologi dan konvergensi kecerdasan buatan (AI) sebagai katalisator inovasi. Penggabungan ini memberikan wawasan mendalam tentang cara kerja otak manusia dan integrasinya dengan sistem cerdas. Perpaduan ini menjanjikan revolusi dalam perawatan kesehatan, komunikasi, dan augmentasi manusia, serta membuka jalan bagi kemajuan yang belum pernah terjadi sebelumnya dalam memahami dan meningkatkan kognisi dan kemampuan manusia. Neuroteknologi dan AI Neuroteknologi mencakup berbagai alat dan teknik untuk berinteraksi dengan sistem saraf. Dari metode pencitraan saraf seperti MRI fungsional (fMRI) dan elektroensefalografi (EEG) hingga antarmuka otak-komputer (BCI) dan neuroprostetik, teknologi ini memungkinkan kita untuk mengamati, memanipulasi, dan menambah aktivitas saraf…

  • AI Umum

    Pembuatan Lintasan Sintetis yang Terkendali dalam Pembelajaran Penguatan Offline

    Tantangan dalam Pembelajaran Penguatan Pembelajaran penguatan (RL) menghadapi tantangan karena inefisiensi sampel, yang menghambat penerapan di dunia nyata. Metode RL standar mengalami kesulitan, terutama di lingkungan yang eksplorasinya berisiko. Pembelajaran Penguatan Offline Namun, RL offline memanfaatkan data yang dikumpulkan sebelumnya untuk mengoptimalkan kebijakan tanpa pengumpulan data online. Namun, pergeseran distribusi antara kebijakan target dan data yang dikumpulkan menimbulkan hambatan, yang mengarah ke masalah di luar sampel. Perbedaan ini menghasilkan bias perkiraan berlebihan, yang berpotensi menghasilkan kebijakan target yang terlalu optimis. Hal ini menyoroti perlunya mengatasi pergeseran distribusi untuk implementasi RL offline yang efektif. Penelitian Sebelumnya Penelitian sebelumnya mengatasi hal ini…