OpenAI memperkenalkan Codex

Revolusi KI Baru untuk Pengembangan Perangkat Lunak Paralel di Cloud

Dengan Codex, OpenAI memperkenalkan agen perangkat lunak berbasis cloud yang inovatif, yang mengotomatisasi dan mempercepat berbagai tugas di bidang pengembangan perangkat lunak. Layanan ini sekarang tersedia untuk ChatGPT Pro, Team, dan Enterprise; pengguna Plus akan segera mendapatkan akses.

Apa itu Codex?

Codex adalah agen perangkat lunak berbasis cloud yang kuat, dikembangkan oleh OpenAI untuk membantu pengembang dalam berbagai tugas. Sistem ini dapat mengimplementasikan fitur, menjawab pertanyaan tentang basis kode, memperbaiki bug, dan mengusulkan Pull Request untuk ditinjau. Setiap tugas dijalankan dalam lingkungan cloud terisolasi yang secara otomatis dimuat dengan repository terkait.

Codex

Dasar dari Codex adalah model codex-1, varian OpenAI o3 yang dioptimalkan khusus untuk Software Engineering. Model ini dilatih dengan Reinforcement Learning pada tugas pemrograman nyata dan sangat menyesuaikan diri dengan gaya kode manusia serta preferensi Pull Request.

Cara Kerja dan Penerapan

Codex dapat diakses langsung di antarmuka ChatGPT. Tugas baru dapat dimulai dengan input teks melalui sidebar. Pertanyaan tentang kode dapat diajukan dengan “Ask”, sementara tugas pengembangan dipicu dengan “Code”. Setiap tugas berjalan secara independen dalam sandbox sendiri yang telah dikonfigurasi dengan semua file dan dependensi relevan dari repository.

Was kann Codex?

  • Desain Paralel PR GitHub: Codex dapat secara otomatis membuat Pull Request (PR) untuk perbaikan bug, pembaruan dokumentasi, atau fitur kecil dan mengelolanya secara paralel.
  • Navigasi dan Analisis Basis Kode: Codex menavigasi seluruh basis kode Anda, menemukan bug, memeriksa kode, dan memberikan saran perbaikan yang terarah.
  • Pemeriksaan Lint dan Pengujian Otomatis: Menjalankan linter, pemeriksaan tipe, serta unit dan integration test—termasuk pengaturan dependensi yang diperlukan.
  • Dukungan untuk Basis Kode Besar: Codex bekerja dengan model pemrograman baru yang sangat cocok untuk proyek besar dan basis kode kompleks.
  • Membaca dan Mengedit File: Codex dapat langsung melihat, mengubah, dan mengedit file sesuai konteks tugas.
  • Perencanaan Detail dan Manajemen Tugas: Membuat saran optimasi, merencanakan langkah kerja, dan mengatur tugas sesuai kebutuhan (misal: “Rekomendasikan 3 optimasi dan buat rencana tugas”).
  • Alur Kerja Transparan dan Progres Langsung: Durasi pengerjaan tiap tugas bervariasi tergantung kompleksitas, progres dan perubahan dapat dipantau secara langsung kapan saja.
  • Dokumentasi yang Dapat Dilacak: Semua perubahan dikomit dalam lingkungan terisolasi dan didokumentasikan secara transparan melalui log terminal dan hasil pengujian.
  • Integrasi dan Proses Review: Pengembang dapat meninjau hasil, meminta perubahan, membuka Pull Request, atau mengadopsi hasil ke lingkungan lokal.
  • Lingkungan Pengembangan yang Dapat Dikustomisasi: Lingkungan dapat disesuaikan agar semirip mungkin dengan lingkungan pengembangan nyata.

Fitur khusus adalah file AGENTS.md: File ini memberikan instruksi khusus kepada Codex tentang bagaimana sistem harus berperilaku dalam proyek—mirip README yang diperluas. Di sini, misalnya, perintah pengujian atau metode kerja spesifik dapat didefinisikan. Seperti pengembang manusia, Codex juga mendapat manfaat dari dokumentasi yang jelas dan lingkungan pengujian yang andal.

Data Pelatihan dan Performa

Codex dilatih dengan berbagai tugas pengembangan perangkat lunak nyata dan sudah mencapai tingkat solusi tinggi tanpa penyesuaian proyek spesifik. Benchmark internal menunjukkan bahwa model ini menyelesaikan tugas secara presisi sesuai standar manusia, mengikuti instruksi secara tepat, dan secara otomatis menjalankan pengujian hingga hasil positif tercapai.

Pada benchmark SWE internal OpenAI, codex-1 mencapai akurasi yang jauh lebih tinggi dibandingkan model sebelumnya. Detail dan hasil konkret dapat dibaca di artikel OpenAI (bahasa Inggris).

Keamanan dan Kepercayaan

Codex awalnya disediakan sebagai pratinjau riset. Desain sistem sangat menekankan keamanan dan transparansi: Semua aksi didokumentasikan dengan log terminal dan hasil pengujian, sehingga pengguna dapat selalu melacak cara kerja agen. Jika ada keraguan atau pengujian gagal, Codex akan memberi tahu secara eksplisit dan memberikan saran langkah selanjutnya.

Meski sudah otomatis, sangat penting untuk selalu meninjau secara manual semua perubahan yang dihasilkan Codex sebelum digabungkan atau dijalankan.

Perlindungan Penyalahgunaan dan Eksekusi Aman

Perlindungan terhadap penyalahgunaan, terutama untuk tugas seperti pengembangan malware, adalah perhatian utama. Codex dilatih untuk secara khusus menolak permintaan pengembangan perangkat lunak berbahaya dan tetap mendukung tugas yang sah—termasuk di bidang low-level engineering. Kebijakan keamanan telah diperluas dan dievaluasi secara menyeluruh, yang juga didokumentasikan dalam System Card Addendum.

Selama pengerjaan, Codex hanya bekerja dalam lingkungan container cloud terisolasi tanpa akses internet. Hanya repository yang disediakan dan dependensi yang sudah dikonfigurasi yang dapat diakses; layanan eksternal tetap tidak dapat dijangkau.

Contoh Penerapan di Dunia Nyata

Secara internal, OpenAI sudah menggunakan Codex secara intensif, misalnya untuk mengalihdayakan tugas berulang seperti refactoring, pembuatan pengujian, atau draft dokumentasi. Tim menggunakan otomatisasi untuk mempercepat pengiriman dan fokus pada tugas yang lebih menantang. Mitra eksternal juga sudah menguji Codex:

  • Cisco mengevaluasi Codex untuk pengembangan fitur yang lebih cepat dan inovasi produk strategis.
  • Temporal menggunakan Codex untuk perbaikan bug, otomatisasi pengujian, dan refaktorisasi kode.
  • Superhuman memanfaatkan Codex untuk mempercepat cakupan pengujian dan tugas integrasi kecil—bahkan manajer produk dapat berkontribusi pada perubahan kode awal.
  • Kodiak mempercepat pengembangan stack mengemudi otonom dengan Codex, misalnya melalui alat debugging dan optimasi pengujian.

Berdasarkan pengalaman ini, OpenAI merekomendasikan untuk mendistribusikan tugas yang jelas ke beberapa instansi Codex dan menguji berbagai strategi prompt untuk memaksimalkan potensi sistem.

Codex CLI dan Akses Pengembang

Bersamaan dengan solusi cloud, kini tersedia Codex CLI—agen open source ringan untuk command line. Ia mengintegrasikan model seperti o3 dan o4-mini langsung ke setup pengembang lokal. Varian baru yang dioptimalkan khusus (codex-mini-latest) dirancang untuk latensi rendah dan interaksi kode yang cepat. Model ini tersedia sebagai standar di CLI maupun melalui API dan terus dikembangkan secara berkala.

Pendaftaran Codex CLI kini lebih mudah: Tidak perlu lagi konfigurasi token API manual, cukup login dengan akun ChatGPT. Pengguna Pro dan Plus juga mendapatkan kredit API gratis sementara (hingga 50 USD) untuk memudahkan awal penggunaan.

Ketersediaan, Harga, dan Batasan

Codex mulai sekarang diluncurkan secara global untuk ChatGPT Pro, Enterprise, dan Team. Pengguna Plus dan Edu akan segera menyusul. Layanan ini awalnya dapat digunakan tanpa biaya tambahan; dalam beberapa minggu ke depan akan diperkenalkan pembatasan penggunaan dan model harga fleksibel, di mana konsumsi tambahan dapat dibeli sesuai kebutuhan.

Model codex-mini-latest tersedia untuk pengembang melalui Responses API dan dihitung 1,50 USD per 1 juta token input dan 6 USD per 1 juta token output—termasuk diskon 75% untuk prompt berulang.

Sebagai pratinjau riset, Codex saat ini masih kekurangan beberapa fitur seperti input gambar untuk tugas frontend atau kemampuan untuk langsung campur tangan selama tugas berjalan. Bekerja dengan agen jarak jauh juga bisa memakan waktu lebih lama dibandingkan pengeditan interaktif, sehingga butuh sedikit penyesuaian.

Prospek dan Pengembangan Mendatang

OpenAI sedang mengembangkan rangkaian alat lengkap yang mendukung kolaborasi real-time maupun delegasi asinkron. Visi: Pengembang menangani tugas yang ingin mereka kerjakan sendiri, dan mendelegasikan sisanya ke agen KI cerdas—untuk kecepatan dan fokus lebih tinggi. Ke depannya, pengembang juga dapat mengontrol agen Codex selama tugas berjalan, mengembangkan strategi bersama, dan menerima pembaruan status proaktif. Integrasi yang lebih dalam dengan alat yang sudah ada seperti issue tracker, sistem CI, dan ChatGPT Desktop juga direncanakan.

Integrasi agen KI seperti Codex mengubah pengembangan perangkat lunak secara fundamental dan membuka peluang baru bagi tim dan pengembang individu. OpenAI bersama mitra meneliti dampaknya pada alur kerja dan pengembangan keterampilan, dengan pendekatan yang bertanggung jawab dan iteratif.

Informasi Lebih Lanjut dan Pesan Sistem

Untuk detail dan benchmark lebih lanjut, disarankan membaca artikel OpenAI (bahasa Inggris). Untuk memahami cara kerja Codex, OpenAI juga telah merilis pesan sistem codex-1. Dokumen ini mencakup, antara lain, panduan untuk workflow Git, penggunaan file AGENTS.md, dan dokumentasi detail semua langkah kerja, sehingga pengembang dapat menyesuaikan agen dalam proses mereka sendiri.


Diterbitkan

dalam

oleh