• AI Umum

    Evaluasi Model Pembelajaran Mesin Terdepan untuk Kemampuan Berbahaya

    Pendahuluan Kemajuan kecerdasan buatan (AI) telah membuka pintu ke dunia potensi transformatif dan kemampuan yang belum pernah terjadi sebelumnya, menginspirasi kekaguman dan keajaiban. Namun, dengan kekuatan besar datang tanggung jawab besar, dan dampak AI pada masyarakat tetap menjadi topik perdebatan dan pengawasan yang intens. Fokusnya semakin bergeser ke arah memahami dan memitigasi risiko yang terkait dengan teknologi yang menakjubkan ini, terutama karena teknologi tersebut menjadi lebih terintegrasi ke dalam kehidupan kita sehari-hari. Kemampuan Berbahaya dalam AI Pusat dari wacana ini terletak pada kekhawatiran kritis: potensi sistem AI untuk mengembangkan kemampuan yang dapat menimbulkan ancaman signifikan terhadap keamanan siber, privasi, dan…

  • AI Umum

    Melatih Model Bahasa Besar Secara Terbalik: Metode Pelatihan Kecerdasan Buatan yang Sederhana dan Efektif untuk Mengatasi Kutukan Pembalikan

    Model Bahasa Besar dan Kutukan Pembalikan Model bahasa besar telah merevolusi pemrosesan bahasa alami, memberikan mesin kemampuan bahasa yang mirip manusia. Namun, meskipun canggih, model ini bergulat dengan masalah penting, yaitu Kutukan Pembalikan. Istilah ini menggambarkan kesulitan mereka dalam memahami reversibilitas logis, di mana mereka sering kali perlu menyimpulkan bahwa jika “A memiliki fitur B”, secara logis menyiratkan “B adalah fitur A”. Keterbatasan ini menimbulkan tantangan signifikan dalam mengejar sistem yang benar-benar cerdas. Pelatihan Terbalik: Solusi untuk Kutukan Pembalikan Di FAIR, divisi penelitian AI Meta, para ilmuwan telah menyelidiki masalah ini, menyadari bahwa Kutukan Pembalikan bukan hanya masalah akademis. Ini…

  • AI Umum

    Plugin PJRT: Plugin Antarmuka Terbuka untuk Runtime dan Kompiler Perangkat yang Menyederhanakan Integrasi Perangkat Keras dan Kerangka Pembelajaran Mesin

    Tantangan Integrasi Mengintegrasikan kerangka pembelajaran mesin dengan berbagai arsitektur perangkat keras secara efisien merupakan tantangan yang dihadapi oleh para peneliti. Proses integrasi yang ada sangatlah rumit dan memakan waktu, dan sering kali terdapat kurangnya antarmuka standar yang menyebabkan masalah kompatibilitas dan menghambat adopsi teknologi perangkat keras baru. Pengembang diharuskan menulis kode khusus untuk setiap perangkat keras. Biaya komunikasi dan keterbatasan skalabilitas membuat penggunaan sumber daya perangkat keras untuk pekerjaan pembelajaran mesin menjadi lebih sulit tanpa masalah. Solusi PJRT Tim Pengembang Google mengusulkan solusi, Plugin PJRT (Antarmuka Runtime dan Kompiler Independen Platform), yang bertindak sebagai lapisan tengah antara kerangka pembelajaran mesin…

  • AI Umum

    EMMET: Kerangka Kerja Pembelajaran Mesin Baru yang Menggabungkan Teknik Pengeditan Model Terpopuler

    Pendahuluan Kecerdasan buatan (AI) terus berkembang dan membutuhkan metode yang efisien untuk mengintegrasikan pengetahuan baru ke dalam model yang sudah ada. Pembuatan informasi yang cepat berarti model dapat dengan cepat menjadi usang, yang telah memunculkan pengeditan model. Dalam bidang yang kompleks ini, tujuannya adalah untuk menanamkan model AI dengan informasi terbaru tanpa merusak struktur dasar atau kinerja keseluruhannya. Tantangan Pengeditan Model Tantangannya ada dua: di satu sisi, diperlukan ketelitian dalam mengintegrasikan fakta baru untuk memastikan relevansi model, dan di sisi lain, prosesnya harus efisien untuk mengimbangi masuknya informasi yang terus menerus. Teknik Pengeditan Model yang Ada Secara historis, teknik seperti…

  • AI Umum

    Zigzag Mamba: Model Difusi Efisien untuk Konten Visual Resolusi Tinggi

    Pendahuluan Dalam lanskap model komputasi untuk pemrosesan data visual yang terus berkembang, pencarian model yang menyeimbangkan efisiensi dengan kemampuan menangani kumpulan data skala besar dan resolusi tinggi sangat penting. Meskipun mampu menghasilkan konten visual yang mengesankan, model konvensional berjuang dengan skalabilitas dan efisiensi komputasi, terutama saat digunakan untuk pembuatan gambar dan video beresolusi tinggi. Tantangan ini muncul dari kompleksitas kuadrat yang melekat pada struktur berbasis transformator, yang merupakan bagian penting dalam arsitektur sebagian besar model difusi. Model Ruang Keadaan dan Zigzag Mamba Model Ruang Keadaan (SSM), di mana model Mamba telah muncul sebagai model efisiensi untuk pemodelan urutan panjang. Kehebatan…

  • AI Umum

    Jan: Alternatif ChatGPT Sumber Terbuka yang Berjalan Sepenuhnya Offline di Komputer

    Pengantar Sebuah tim peneliti baru-baru ini memperkenalkan Jan, alternatif ChatGPT sumber terbuka yang berjalan secara lokal di komputer. Jan merupakan kemajuan besar di bidang Kecerdasan Buatan (AI) yang bertujuan untuk mendemokratisasi akses ke teknologi AI. Fitur Utama Menjalankan ChatGPT secara lokal di desktop Menyesuaikan model, konfigurasi, dan fungsionalitas sesuai keinginan Menggunakan kemampuan AI tanpa mengorbankan kontrol data atau privasi Pengembang dan Prinsip Panduan Jan dikembangkan dan dikelola oleh Jan Labs, perusahaan robotika perintis yang bertujuan untuk meningkatkan kemampuan manusia dengan mengintegrasikan AI secara mulus. Prinsip panduan Jan meliputi: Kepemilikan: Pengguna memiliki kontrol penuh atas Jan tanpa pelacakan atau penyimpanan data…

  • AI Umum

    Pretzel: Alternatif Berbasis AI untuk Jupyter Notebook

    Sektor kecerdasan buatan (AI) sedang mengalami lonjakan pendatang baru. Penerapan AI merevolusi teknologi di bidang seperti NLP (Pemrosesan Bahasa Alami) dan ML (Pembelajaran Mesin). Kurva belajar untuk AI juga curam, bagi mereka yang tidak antusias untuk terjun langsung. Alat tradisional, seperti Jupyter Notebook, bisa jadi sulit dan menakutkan bagi orang yang baru mengenal penelitian data. Perkenalkan Pretzel Pretzel adalah pengganti open-source untuk Jupyter Notebook yang bertujuan untuk menyamakan kedudukan dalam eksplorasi dan analisis data. Tanpa menyentuh satu baris kode pun, antarmuka grafis Pretzel yang ramah pengguna memungkinkan pengguna untuk menarik dan melepas sumber data, mengeksekusi transformasi, dan membangun visualisasi. Fitur…

  • AI Umum

    Kuantifikasi Model Pembelajaran Mendalam dengan Mudah Menggunakan Quanto

    HuggingFace memperkenalkan Quanto, sebuah perpustakaan Python untuk mengkuantifikasi model pembelajaran mendalam (deep learning) guna mengurangi biaya komputasi dan memori saat mengevaluasi model tersebut. Tantangan Kuantifikasi Menyebarkan model bahasa besar (LLM) pada perangkat dengan sumber daya terbatas membutuhkan penggunaan sumber daya komputasi dan memori yang efisien. Metode kuantifikasi PyTorch saat ini memiliki keterbatasan, seperti masalah kompatibilitas dengan berbagai konfigurasi model dan perangkat. Solusi Quanto Quanto adalah perpustakaan Python yang dirancang untuk menyederhanakan proses kuantifikasi untuk model PyTorch. Quanto menawarkan berbagai fitur di luar alat kuantifikasi bawaan PyTorch, termasuk: Dukungan untuk kuantifikasi mode aktif Penerapan pada berbagai perangkat (termasuk CUDA dan MPS)…

  • AI Umum

    Pembelajaran Struktur Terpadu untuk Pemahaman Dokumen Tanpa OCR dengan mPLUG-DocOwl 1.5

    Pengenalan Model Bahasa Besar Multimodal (MLLM) telah dikembangkan dalam beberapa tahun terakhir untuk tugas pemahaman penglihatan dan bahasa. MLLM telah menunjukkan hasil yang menjanjikan dalam memahami gambar umum dengan menyelaraskan penyandi visual terlatih sebelumnya (misalnya, Vision Transformer) dan LLM dengan modul Vision-to-Text (V2T). Namun, model-model ini masih perlu meningkatkan pemahaman dan ekstraksi teks dari gambar yang berisi informasi teks yang kaya, seperti dokumen, halaman web, tabel, dan bagan. Alasan utamanya adalah penyandi visual dan modul V2T dilatih pada pasangan gambar-teks umum dan harus dioptimalkan secara khusus untuk merepresentasikan informasi tekstual dan struktural dalam gambar yang kaya teks. Pembelajaran Struktur Terpadu…

  • AI Umum

    LLM4Decompile: Model Bahasa Besar Open-source untuk Dekompilasi dengan Penekanan pada Eksekusi dan Kompilasi Ulang Kode

    Pendahuluan Dekompilasi berperan penting dalam rekayasa balik perangkat lunak, memungkinkan analisis dan pemahaman eksekusi biner saat kode sumbernya tidak dapat diakses. Hal ini sangat berharga untuk analisis keamanan perangkat lunak, deteksi bug, dan pemulihan kode lama. Namun, teknik dekompilasi tradisional sering kali kesulitan menghasilkan kode sumber yang dapat dibaca manusia dan akurat secara semantik, sehingga menimbulkan tantangan yang signifikan. Pendekatan Tradisional Penelitian dalam dekompilasi secara tradisional menggunakan berbagai alat dan metode untuk menerjemahkan kode biner kembali ke kode sumber, meskipun dengan tingkat keberhasilan yang bervariasi. Alat-alat ini, seperti Ghidra dan IDA Pro, unggul dalam skenario tertentu tetapi sering kali perlu…