ChatGPT Agen: Asisten AI Baru

Era Baru Asistensi AI dengan Tools yang Mampu Bertindak Telah Dimulai

Dengan hadirnya ChatGPT Agent, dimulai fase baru pemanfaatan AI. Untuk pertama kalinya, ChatGPT dapat menyelesaikan tugas-tugas kompleks secara mandiri dan proaktif, termasuk berinteraksi langsung dengan situs web dan aplikasi.

Kemampuan ChatGPT Agent

ChatGPT Agent yang baru memperluas kemampuan ChatGPT untuk menyelesaikan tugas secara mandiri, mulai dari riset hingga tindakan nyata. Agent ini menggunakan komputer virtual dan berbagai alat khusus, misalnya untuk menganalisis jadwal kalender, membuat presentasi, membandingkan kompetitor, hingga merencanakan dan langsung melakukan pembelian.

Tugas seperti mencari berita terkait janji temu klien, merencanakan dan memesan bahan untuk sarapan Jepang, atau membuat presentasi dan tabel yang bisa diedit kini dapat diotomatisasi oleh ChatGPT. AI ini bisa mengunjungi situs, memfilter hasil, meminta login aman jika diperlukan, menjalankan kode, melakukan analisis, dan menyajikan hasil dalam format yang bisa diedit.

Kendali tetap di tangan pengguna: sebelum setiap aksi penting, akan diminta konfirmasi dan proses bisa dihentikan atau diambil alih kapan saja.

Dari Operator & Deep Research ke Agent

ChatGPT Agent menggabungkan keunggulan dua sistem yang sebelumnya terpisah: Operator yang dapat mengoperasikan situs web dan melakukan aksi seperti klik atau ketik, serta Deep Research yang fokus pada analisis dan pengolahan informasi. Pendekatan yang sebelumnya terpisah ini kini digabungkan dalam satu sistem, dilengkapi alat tambahan. Hasilnya, ChatGPT kini bisa fleksibel berpindah antara riset, interaksi, dan aksi, semua dalam satu percakapan yang mulus.

Alat dan Cara Kerja

Untuk menjalankan tugasnya, Agent menggunakan beberapa komponen khusus:

  • Visual Browser – berinteraksi secara grafis dengan situs web, layaknya manusia.
  • Text-based Browser – untuk pencarian web berbasis teks yang efisien.
  • Terminal – memungkinkan analisis kompleks dan menjalankan kode.
  • Akses API Langsung – misalnya untuk mengakses kalender, email, atau aplikasi pihak ketiga.
  • ChatGPT Connectors – integrasi ke layanan seperti Gmail atau Github untuk mengakses informasi relevan secara terarah (selengkapnya tentang Connectors).

Pengguna dapat login sendiri ke situs web dan memberikan akses lebih lanjut kepada Agent. AI akan menentukan sendiri alat mana yang paling tepat untuk setiap langkah, misalnya akses API untuk data kalender, analisis teks untuk data besar, atau interaksi visual dengan antarmuka web yang kompleks.

Semua aksi dijalankan di lingkungan virtual terisolasi yang menjaga konteks lintas alat. Dengan begitu, status pekerjaan tetap aman meski ada gangguan atau instruksi baru.

Contoh Penggunaan di Kehidupan Sehari-hari dan Pekerjaan

Kemampuan baru ini membawa ChatGPT ke level baru dalam kehidupan sehari-hari maupun pekerjaan. Berikut beberapa contoh penggunaan:

  • Mengubah screenshot atau dashboard menjadi presentasi yang bisa diedit
  • Menjadwalkan ulang dan memesan meeting secara otomatis
  • Memperbarui data keuangan di tabel tanpa mengubah format
  • Merencanakan dan memesan perjalanan atau acara
  • Mencari spesialis dan memesan janji temu

AI dapat menyelesaikan tugas secara real-time, terhubung dengan aplikasi, membuat laporan berkala secara otomatis, dan memberi notifikasi ke aplikasi pengguna saat tugas selesai.

Hasil Benchmark dan Data Performa

Performa ChatGPT Agent telah dibuktikan lewat berbagai benchmark dan pengujian realistis:

  • Pada Humanity’s Last Exam yang sangat menantang, model ini mencetak rekor baru (SOTA) dengan skor pass@1 sebesar 41,6 dan hingga 44,4 dalam mode paralel.

Humanity’s Last Exam

  • Di benchmark FrontierMath yang berisi soal matematika tingkat ahli, Agent dengan penggunaan alat mencapai akurasi 27,4%, jauh melampaui model sebelumnya.

FrontierMath

  • Pada benchmark praktis seperti DSBench (analisis data), SpreadsheetBench (pengolahan tabel), dan BrowseComp (pencarian web), ChatGPT Agent mengungguli solusi AI lain maupun nilai manusia di banyak kasus. Misalnya, saat mengedit tabel .xlsx di LibreOffice, Agent mencetak skor 45,5%, sementara Copilot di Excel hanya 20,0%.

SpreadsheetBench

  • Pada tugas kompleks di bidang investment banking, Agent juga menunjukkan hasil jauh lebih baik dibanding model sebelumnya.

Investment Banking Modeling Tasks

  • Di tes WebArena untuk tugas web nyata, Agent juga tampil lebih baik dari pendahulunya.

WebArena

Semua benchmark, metodologi, serta info dan video lain didokumentasikan secara lengkap di artikel berbahasa Inggris dari OpenAI.

Aktivasi dan Penggunaan

Fitur Agent baru dapat diaktifkan di ChatGPT untuk pelanggan Pro, Plus, dan Team langsung melalui menu dropdown “Tools” di Composer. Penggunaannya sangat mudah: deskripsikan tugas, pilih mode Agent, dan ChatGPT akan menjalankan langkah-langkahnya secara transparan. Kontrol bisa diambil alih kapan saja jika dibutuhkan.

Setelah autentikasi, Connectors juga bisa digunakan, misalnya untuk meringkas inbox email atau menganalisis entri kalender secara otomatis. Tugas berulang dapat dijadwalkan langsung, misal untuk laporan mingguan.

Langkah Keamanan dan Perlindungan Data

Dengan ruang gerak yang lebih luas, muncul juga risiko baru. ChatGPT Agent bekerja langsung dengan data pengguna, baik melalui Connectors maupun setelah login ke situs. Karena itu, mekanisme keamanan dari versi Operator telah diperluas secara menyeluruh:

  • Konfirmasi eksplisit dari pengguna sebelum setiap aksi yang berdampak di dunia nyata (misal, pembelian).
  • Pemantauan aktif (“Watch Mode”), misalnya saat mengirim email.
  • Pencegahan risiko proaktif: aksi berisiko tinggi seperti transfer bank otomatis ditolak secara mutlak.
  • : Model dilatih untuk mendeteksi dan menolak upaya manipulasi, misal lewat instruksi tersembunyi di situs web.
  • Perlindungan data: Semua data browser bisa dihapus dan sesi situs aktif diakhiri dengan satu klik. Dalam sesi “Takeover”, input sensitif seperti password tidak disimpan atau diproses.
  • Keamanan biologis dan kimia: Agent dikategorikan sebagai “High Biological and Chemical capabilities” sesuai Preparedness Framework dari OpenAI, dengan mekanisme keamanan paling komprehensif, termasuk Dual-Use-Refusal-Training dan pemantauan terus-menerus.

OpenAI bekerja sama erat dengan para ahli eksternal di bidang riset, keamanan, dan biodefense untuk terus meningkatkan perlindungan. Program Bug Bounty juga telah diluncurkan untuk mempercepat penanganan celah keamanan. Detail arsitektur keamanan tersedia di System Card OpenAI.

Ketersediaan dan Kuota

Peluncuran dimulai sekarang untuk pelanggan Pro, Plus, dan Team. Pengguna Pro mendapat 400 pesan per bulan, pelanggan berbayar lain 40 pesan per bulan, dengan opsi menambah kuota lewat paket kredit. Akses untuk perusahaan dan institusi pendidikan akan menyusul beberapa minggu ke depan. Di Uni Eropa dan Swiss, layanan ini belum tersedia, namun peluncuran sudah direncanakan.

Versi preview Operator masih bisa diakses beberapa minggu ke depan, namun akan dihentikan setelahnya. Fitur Deep Research tetap bisa dipilih lewat dropdown di Composer.

Batasan & Pengembangan Berkelanjutan

ChatGPT Agent masih dalam tahap awal pengembangan. Meski sudah bisa menangani banyak tugas, kesalahan masih mungkin terjadi. Fitur pembuatan presentasi masih dalam fase beta dan kadang hasil formatnya sederhana. Saat ekspor, bisa saja ada perbedaan antara preview dan file yang diekspor. Mengedit presentasi yang diunggah saat ini belum tersedia, namun diharapkan hadir di versi mendatang.

OpenAI terus bekerja untuk meningkatkan efisiensi, fleksibilitas, dan kemudahan penggunaan. Tujuannya adalah menyeimbangkan kontrol pengguna dan otomatisasi, agar ChatGPT Agent tetap aman sekaligus serbaguna.


Diterbitkan

dalam

oleh