Model Gemini Pro Terbaru Cetak Skor Tertinggi di Benchmark

Google kembali bikin gebrakan di dunia kecerdasan buatan. Pada Kamis lalu, raksasa teknologi ini resmi merilis versi terbaru dari model andalannya, Gemini Pro 3.1. Saat ini model tersebut masih tersedia dalam versi pratinjau (preview), namun Google memastikan perilisan secara umum akan segera menyusul dalam waktu dekat.

Kehadiran Gemini 3.1 Pro langsung mencuri perhatian. Banyak pengamat teknologi menilai model ini sebagai salah satu LLM (Large Language Model) paling powerful yang pernah dirilis Google. Bahkan, jika dibandingkan dengan pendahulunya, Gemini 3 yang meluncur pada November lalu dan sudah dianggap sangat mumpuni, versi 3.1 ini disebut sebagai lompatan besar berikutnya.

Daftar Isi

Performa Meningkat Signifikan di Berbagai Benchmark

Bukan cuma klaim sepihak, Google juga membagikan data dari sejumlah benchmark independen untuk mendukung performa terbarunya. Salah satu yang cukup menarik perhatian adalah hasil dari pengujian bernama Humanity’s Last Exam.

Dalam pengujian tersebut, Gemini 3.1 Pro menunjukkan peningkatan performa yang signifikan dibandingkan versi sebelumnya. Artinya, model ini bukan hanya sekadar pembaruan minor, tetapi benar-benar membawa peningkatan dari sisi kemampuan penalaran, pemrosesan informasi, hingga ketepatan dalam menjawab pertanyaan kompleks.

Benchmark independen seperti ini biasanya digunakan untuk mengukur sejauh mana model AI mampu memahami konteks, menyelesaikan soal berbasis logika, hingga melakukan reasoning multi-langkah. Hasil yang lebih tinggi tentu menjadi indikator bahwa Gemini 3.1 Pro semakin matang secara teknis.

Diakui oleh CEO Startup AI

Tak hanya dari sisi pengujian teknis, pujian juga datang dari pelaku industri. Brendan Foody, CEO dari startup AI Mercor, ikut memberikan sorotan terhadap model terbaru ini.

Mercor sendiri memiliki sistem benchmarking bernama APEX, yang dirancang untuk mengukur seberapa baik model AI menjalankan tugas profesional di dunia nyata. Menurut Foody, “Gemini 3.1 Pro kini berada di puncak leaderboard APEX-Agents.”

Ia juga menambahkan bahwa hasil impresif tersebut menunjukkan betapa cepatnya perkembangan agen AI dalam menangani pekerjaan berbasis pengetahuan (knowledge work) yang nyata dan kompleks. Pernyataan ini memperkuat posisi Gemini 3.1 Pro sebagai model yang tak hanya unggul di atas kertas, tetapi juga relevan untuk kebutuhan profesional.

Persaingan Model AI Semakin Memanas

Peluncuran Gemini 3.1 Pro hadir di tengah persaingan model AI yang makin sengit. Saat ini, “perang” LLM bisa dibilang sedang memasuki babak baru. Berbagai perusahaan teknologi berlomba merilis model yang lebih kuat, lebih cerdas, dan mampu melakukan agentic work serta penalaran multi-langkah dengan lebih efektif.

Nama-nama besar seperti OpenAI dan Anthropic juga telah memperkenalkan model terbaru mereka dalam beberapa waktu terakhir. Semua berlomba menghadirkan AI yang tidak hanya responsif, tetapi juga mampu berpikir lebih strategis dan menyelesaikan tugas kompleks secara mandiri.

Dengan performa benchmark yang menjanjikan dan pengakuan dari pelaku industri, Gemini 3.1 Pro tampaknya siap menjadi salah satu pemain utama dalam persaingan LLM global. Tinggal menunggu waktu hingga versi finalnya resmi dirilis secara luas.

Model Gemini Pro Terbaru Cetak Skor Tertinggi di Benchmark

Performa Meningkat Signifikan di Berbagai Benchmark

Diakui oleh CEO Startup AI

Persaingan Model AI Semakin Memanas

Related Posts

Meta Resmi Tutup Situs Web Mandiri Messenger

Hacker Manfaatkan Grok dan Copilot untuk Kendalikan Malware Secara Diam-Diam

Waspada! Penipuan Cryptocurrency di Asia Rugikan Korban hingga Miliaran

Leave a Reply Cancel reply