AI Umum

Penelitian Pembelajaran Mesin dari ServiceNow Mengusulkan WorkArena dan BrowserGym: Sebuah Langkah Menuju Otomatisasi Alur Kerja Harian dengan AI

Di era digital, antarmuka yang digunakan individu untuk berinteraksi dengan perangkat lunak menjadi tulang punggung interaksi dengan teknologi. Meskipun ada kemajuan signifikan menuju desain yang ramah pengguna, individu sering kali membutuhkan bantuan dalam menghadapi kompleksitas atau pengulangan tugas tertentu. Hal ini menjadi penghalang besar bagi efisiensi dan inklusivitas di ruang kerja digital, menyoroti kebutuhan kritis akan solusi inovatif untuk menyederhanakan interaksi ini, membuat teknologi lebih mudah diakses dan intuitif bagi semua orang.

Tantangan Ruang Kerja Digital

Salah satu tantangan utama ruang kerja digital adalah sistem perangkat lunak yang memprioritaskan fungsionalitas komprehensif dengan mengorbankan pengalaman pengguna. Lingkungan seperti itu sering kali menyebabkan kurva pembelajaran yang curam dan penurunan produktivitas, terutama dalam perangkat lunak perusahaan. Kebutuhan akan solusi menjadi jelas, solusi yang tidak hanya menyederhanakan pelaksanaan tugas berulang tetapi juga membuat ruang kerja digital dapat diakses oleh audiens yang lebih luas, termasuk penyandang disabilitas.

Otomatisasi Antarmuka Pengguna

Mengotomatiskan tugas dalam sistem perangkat lunak sangat bergantung pada Antarmuka Pemrograman Aplikasi (API). Meskipun API telah memfasilitasi beberapa interaksi terprogram dengan perangkat lunak, API sering kali kurang transparan dan aksesibilitas universal. Kesenjangan dalam lanskap otomatisasi ini menuntut perubahan paradigma menuju asisten otomatis yang terlibat langsung dengan antarmuka pengguna (UI), menawarkan pendekatan otomatisasi yang lebih transparan dan fleksibel.

WorkArena dan BrowserGym

Peneliti dari ServiceNow Research, Mila-Quebec AI Research Institute, Polytechnique Montreal, McGill University, dan Universite de Montreal menonjol sebagai dua platform inovatif. Mereka memanfaatkan kekuatan model bahasa besar (LLM) untuk mengotomatiskan tugas berbasis web.

  • WorkArena menetapkan standar baru dengan tolok ukurnya yang terdiri dari 29 tugas beragam pada platform ServiceNow yang banyak digunakan, menyediakan kerangka kerja yang kuat untuk mengevaluasi efektivitas asisten UI.
  • BrowserGym adalah lingkungan unik yang dirancang khusus untuk mengembangkan dan menilai agen web. BrowserGym memiliki banyak tindakan dan pengamatan multimodal untuk mendukung interaksi web yang kompleks, menjadikannya pengubah permainan di bidangnya.

Kekuatan sebenarnya dari pendekatan baru ini terletak pada manipulasi langsung asisten terhadap UI. Strategi ini tidak hanya meningkatkan transparansi dan kemampuan beradaptasi, tetapi juga menempatkan kendali di tangan pengguna. Mereka sekarang dapat menentukan tingkat otomatisasi, mulai dari bantuan sederhana hingga eksekusi tugas penuh. Tingkat fleksibilitas ini mirip dengan berbagai tingkat otomatisasi yang terlihat pada kendaraan otonom, menyoroti potensi transformatif asisten UI dalam membentuk kembali lanskap kerja berbasis pengetahuan.

Tantangan yang Dihadapi

Meskipun agen saat ini telah menunjukkan harapan dalam evaluasi awal, mencapai otomatisasi tugas yang komprehensif tetap menjadi tantangan yang berat. Kesenjangan kinerja yang disorot dalam tugas interaksi UI yang kompleks menggarisbawahi perlunya penelitian dan inovasi yang berkelanjutan. Komitmen berkelanjutan ini sangat penting untuk membuka potensi penuh asisten UI dan merevolusi cara individu berinteraksi dengan perangkat lunak perusahaan.

Kesimpulan

Mengintegrasikan asisten UI ke dalam struktur ruang kerja digital siap merevolusi interaksi dengan teknologi. WorkArena dan BrowserGym adalah dua platform inovatif yang diperkenalkan untuk memanfaatkan LLM untuk mengotomatiskan tugas berbasis web. Dengan mengotomatiskan tugas-tugas biasa, alat-alat ini menjanjikan untuk meningkatkan produktivitas, meningkatkan pengalaman pengguna, dan memastikan aksesibilitas yang lebih besar. Ringkasan ini merangkum eksplorasi penelitian terhadap tantangan, solusi yang diusulkan, dan perjalanan yang menjanjikan namun menuntut menuju ruang kerja digital yang sepenuhnya otomatis.