OpenAI Resmi Luncurkan GPT-5.4 dengan Versi Pro dan Thinking

OpenAI kembali menghadirkan inovasi terbaru di dunia kecerdasan buatan. Pada hari Kamis, perusahaan tersebut secara resmi merilis GPT-5.4, model fondasi terbaru yang disebut sebagai “model frontier paling mumpuni dan efisien untuk pekerjaan profesional.”

Menariknya, model ini tidak hanya hadir dalam satu versi. Selain versi standar, GPT-5.4 juga tersedia dalam varian GPT-5.4 Thinking yang berfokus pada kemampuan penalaran, serta GPT-5.4 Pro yang dioptimalkan untuk performa tinggi. Kehadiran beberapa varian ini memberikan fleksibilitas bagi pengembang maupun perusahaan yang ingin memanfaatkan AI sesuai kebutuhan mereka.

Daftar Isi

Context Window Lebih Besar, Hingga 1 Juta Token

Salah satu peningkatan paling mencolok dari GPT-5.4 ada pada kapasitas context window yang jauh lebih besar dibandingkan model sebelumnya.

Dalam versi API, GPT-5.4 kini mendukung context window hingga 1 juta token, menjadikannya salah satu yang terbesar yang pernah dirilis OpenAI sejauh ini.

Bagi pengembang, kapasitas ini sangat penting karena memungkinkan model memahami dan memproses teks dalam jumlah sangat besar dalam satu permintaan. Artinya, pengguna bisa memasukkan dokumen panjang, data kompleks, hingga percakapan panjang tanpa harus memotong konteks.

Lebih Efisien dalam Penggunaan Token

Selain peningkatan kapasitas, OpenAI juga menyoroti efisiensi penggunaan token pada model baru ini.

Menurut perusahaan, GPT-5.4 mampu menyelesaikan tugas yang sama dengan jumlah token yang jauh lebih sedikit dibandingkan pendahulunya. Hal ini tentu berdampak langsung pada performa dan biaya penggunaan, terutama bagi perusahaan yang memanfaatkan API AI dalam skala besar.

Dengan kata lain, GPT-5.4 tidak hanya lebih pintar, tetapi juga lebih hemat sumber daya.

Skor Benchmark Meningkat Signifikan

Dari sisi performa, GPT-5.4 juga menunjukkan peningkatan yang cukup signifikan di berbagai benchmark industri.

Model ini mencetak skor tertinggi pada benchmark penggunaan komputer, termasuk OSWorld-Verified dan WebArena Verified. Kedua benchmark ini digunakan untuk menguji kemampuan AI dalam menyelesaikan tugas yang berkaitan dengan penggunaan aplikasi dan lingkungan digital.

Selain itu, GPT-5.4 juga mencatat skor 83% pada tes GDPval milik OpenAI, yang dirancang untuk mengevaluasi kemampuan AI dalam menyelesaikan pekerjaan berbasis pengetahuan.

Unggul di Benchmark Profesional

Tidak hanya itu, GPT-5.4 juga memimpin pada benchmark APEX-Agents milik Mercor, yang dirancang untuk menguji kemampuan profesional AI di bidang hukum dan keuangan.

CEO Mercor, Brendan Foody, menyampaikan bahwa model ini menunjukkan performa yang sangat kuat dalam berbagai tugas kompleks.

Menurut Foody, GPT-5.4 sangat unggul dalam membuat deliverable jangka panjang, seperti:

Presentasi slide deck
Model keuangan
Analisis hukum

Selain performanya yang tinggi, model ini juga mampu berjalan lebih cepat dengan biaya yang lebih rendah dibandingkan model AI frontier pesaing.

Halusinasi AI Semakin Berkurang

Salah satu tantangan utama dalam pengembangan AI adalah halusinasi, yaitu kondisi ketika model menghasilkan informasi yang terdengar meyakinkan tetapi sebenarnya tidak akurat.

OpenAI menyatakan bahwa GPT-5.4 membawa peningkatan penting dalam hal ini.

Dibandingkan GPT-5.2, model terbaru ini 33% lebih kecil kemungkinannya membuat kesalahan pada klaim individual, dan secara keseluruhan 18% lebih kecil kemungkinan memberikan jawaban yang mengandung kesalahan fakta.

Langkah ini menjadi bagian dari upaya berkelanjutan OpenAI untuk meningkatkan keandalan model AI mereka.

Sistem Baru Tool Search di API

Dalam peluncuran GPT-5.4, OpenAI juga memperbarui cara model API mengelola pemanggilan tools.

Sebelumnya, sistem prompt harus menyertakan definisi dari semua tools yang tersedia ketika model dipanggil. Cara ini bisa memakan banyak token, terutama jika jumlah tools cukup banyak.

Kini, OpenAI memperkenalkan sistem baru bernama Tool Search.

Dengan sistem ini, model dapat mencari definisi tools hanya saat dibutuhkan, sehingga permintaan API menjadi lebih cepat dan lebih hemat biaya, terutama pada sistem dengan banyak integrasi tools.

Baca Juga : Resmi! ChatGPT Mulai Hadirkan Iklan

Evaluasi Keamanan untuk Chain-of-Thought

Selain peningkatan performa, OpenAI juga menambahkan evaluasi keamanan baru untuk menguji kemampuan chain-of-thought pada model.

Chain-of-thought sendiri merupakan proses ketika model AI menampilkan langkah-langkah berpikirnya saat menyelesaikan tugas multi-langkah.

Para peneliti keamanan AI sebelumnya mengkhawatirkan bahwa model penalaran bisa saja memanipulasi atau menyembunyikan proses berpikirnya dalam kondisi tertentu.

Namun, hasil evaluasi terbaru menunjukkan bahwa versi Thinking dari GPT-5.4 memiliki kemungkinan lebih kecil untuk melakukan penipuan semacam itu.

Temuan ini mengindikasikan bahwa model tersebut tidak memiliki kemampuan untuk menyembunyikan proses penalarannya, dan bahwa pemantauan chain-of-thought masih menjadi alat keamanan yang efektif dalam pengembangan AI modern.

OpenAI Resmi Luncurkan GPT-5.4 dengan Versi Pro dan Thinking

Context Window Lebih Besar, Hingga 1 Juta Token

Lebih Efisien dalam Penggunaan Token

Skor Benchmark Meningkat Signifikan

Unggul di Benchmark Profesional

Halusinasi AI Semakin Berkurang

Sistem Baru Tool Search di API

Evaluasi Keamanan untuk Chain-of-Thought

Related Posts

Roblox Luncurkan AI Chat Real-Time untuk Saring Bahasa Terlarang

Google Rilis Update Darurat Chrome untuk Perbaiki 10 Celah Keamanan

Pengguna Android Kini Bisa Bagikan Tracker untuk Temukan Bagasi Hilang

Leave a Reply Cancel reply