OpenAI Luncurkan Tiga Varian GPT-5.2, Janjikan "Asisten Kerja" Mumpuni untuk Semua Profesi

Jumat, 12 Desember 2025 | 11:00:09 WIB
Ilustrasi Open AI. (Foto: Joseph Maldonado/Ilustrasi gabungan oleh Rene Ramos)

JAKARTA – OpenAI secara resmi merilis GPT-5.2, sebuah model kecerdasan buatan (AI) teranyar yang diklaim sebagai yang paling maju yang pernah ada.

Menurut Fidji Simo, Chief Product Officer OpenAI, GPT-5.2 menunjukkan keunggulan yang lebih besar dalam tugas-tugas perkantoran, mencakup pembuatan spreadsheet, presentasi, penulisan kode, pemahaman konteks yang ekstensif, hingga menghubungkan beragam alat dalam proyek yang melibatkan banyak langkah.

OpenAI juga mengklaim bahwa pengguna akan merasakan bahwa GPT-5.2 memiliki kecerdasan yang lebih tinggi untuk penggunaan sehari-hari, memiliki susunan yang lebih teratur, lebih bisa diandalkan, dan tetap menawarkan interaksi yang menyenangkan.

Model AI GPT-5.2 tersedia dalam tiga varian untuk pengguna ChatGPT berbayar dan pengembang API. Yang pertama, GPT-5.2 Instant, merupakan versi tercepat untuk pekerjaan ringan, seperti membuat tulisan, menerjemahkan, dan mencari informasi.

Kedua, ada GPT-5.2 Thinking yang dikembangkan untuk tugas-tugas yang rumit, misalnya penulisan kode, analisis dokumen yang panjang, perencanaan, dan perhitungan matematika. Ketiga, GPT-5.2 Pro hadir sebagai versi yang paling tepat dan cermat untuk penyelesaian masalah pada tingkat kesulitan yang tinggi.

Peluncuran model yang menjadi penerus GPT-5.1 ini terjadi di tengah suasana yang memanas, persis setelah adanya laporan bahwa CEO Sam Altman mengeluarkan nota "kode merah" karena adanya kekhawatiran bahwa ChatGPT mulai tertinggal dari Google Gemini.

Kinerja GPT-5.2

OpenAI menjuluki GPT-5.2 sebagai model dengan kinerja terbaik yang telah perusahaan luncurkan untuk pemakaian profesional. Klaim tersebut dibuktikan dengan capaian GPT-5.2 Thinking pada berbagai tolok ukur atau benchmark.

Contohnya, model ini disebut berhasil menduduki peringkat teratas pada SWE-Bench Pro, sebuah tolok ukur yang dipakai untuk mengevaluasi kapabilitas agen AI dalam menuntaskan tugas penulisan kode. Selain itu, model ini juga unggul di GPQA Diamond, yakni tes penalaran ilmiah yang setara dengan tingkat pascasarjana.

Kinerja GPT-5.2 juga diuji pada GDPval, sebuah evaluasi yang diperkenalkan oleh OpenAI pada awal tahun ini guna mengukur kemampuan AI dalam menyelesaikan tugas-tugas pekerjaan terstruktur pada 44 jenis profesi berbeda.

Dalam tolok ukur tersebut, GPT-5.2 Thinking berhasil melampaui atau menyamai performa para profesional di industri pada 70,9 persen dari total tugas. Tugas-tugas ini meliputi pembuatan presentasi, spreadsheet, hingga penyusunan laporan yang kompleks.

OpenAI mengeklaim bahwa model ini mampu menuntaskan tugas-tugas serupa 11 kali lebih cepat dengan biaya yang kurang dari 1 persen dibandingkan tenaga ahli.

Rentang profesi yang digunakan dalam pengujian GDPval cukup luas, dimulai dari pengembang perangkat lunak (software developer), pengacara, akuntan, perawat, analis keuangan, manajer proyek, jurnalis, hingga penyedia manufaktur dan tenaga pelayanan publik.

Dengan cakupan yang sedemikian rupa, OpenAI berpandangan bahwa GPT-5.2 Thinking mulai mendekati kriteria "asisten kerja" yang sanggup membantu berbagai jenis pekerjaan kantoran. 

Dari segi keakuratan, GPT-5.2 juga membawa peningkatan yang signifikan. Dibandingkan dengan GPT-5.1 Thinking, model ini 30 persen lebih jarang menghasilkan respons yang salah pada kumpulan pertanyaan nyata dari ChatGPT.

OpenAI menyatakan bahwa peningkatan ini sangat vital bagi para profesional yang mengandalkan AI untuk keperluan riset, analisis, penulisan, hingga pengambilan keputusan sehari-hari. Meskipun demikian, perusahaan tetap mengingatkan agar pengguna melakukan pemeriksaan ulang terhadap tugas-tugas yang sifatnya kritis.

Peningkatan paling menonjol lainnya terlihat pada kemampuan untuk bekerja dengan konteks yang panjang. Model AI GPT-5.2 Thinking memecahkan rekor baru pada MRCRv2, evaluasi yang menguji kapabilitas AI dalam menggabungkan informasi yang tersebar dalam dokumen yang sangat panjang.

Model ini menjadi yang pertama yang mencapai tingkat keakuratan nyaris 100 persen pada varian "4-needle", yang menguji pemahaman konteks hingga 256.000 token (setara dengan 180.000–200.000 kata).

Sebagai ilustrasi, novel Harry Potter and the Sorcerer's Stone (buku pertama) diperkirakan mengandung sekitar 77.000 kata. Ini berarti, GPT-5.2 mampu membaca, mengingat, dan memahami dokumen yang ketebalannya setara dengan 2,5 buku Harry Potter pertama dalam satu kali perintah (prompt).

Secara praktis, hal ini memungkinkan GPT-5.2 memproses dokumen yang sangat panjang, seperti laporan penelitian, kontrak, transkrip rapat, hingga proyek yang melibatkan banyak berkas (multi-file), sambil tetap menjaga keterkaitan dan konsistensi informasi.

OpenAI menilai bahwa kemampuan ini akan sangat bermanfaat untuk analisis mendalam, perangkuman informasi, dan alur kerja profesional yang bersumber dari banyak dokumen sekaligus.

Di lain sisi, GPT-5.2 tidak menghadirkan pembaruan pada fitur pembuatan gambar (image generation), padahal memo "kode merah" dari Altman sebelumnya menyoroti kebutuhan OpenAI untuk mengejar Google, yang menjadi viral berkat Gemini 2.5 Flash Image "Nano Banana" dan saat ini Banana Pro (atau Gemini 3 Pro Image).

Informasi bocoran menyebutkan bahwa OpenAI baru akan merilis model yang memiliki generator gambar yang lebih mutakhir, lebih cepat, dan lebih ekspresif pada bulan Januari 2026.

Terkini