Claude Sonnet 5 Jadi Model AI Terbaru Anthropic dengan Biaya Lebih Murah

Anthropic resmi memperkenalkan Claude Sonnet 5, model AI terbaru yang membawa peningkatan signifikan pada kemampuan agentic dengan harga yang lebih terjangkau. Kehadiran model ini menegaskan bahwa kemampuan AI untuk bekerja secara mandiri kini bukan lagi fitur eksklusif model premium, melainkan telah menjadi standar baru di industri kecerdasan buatan.

Dalam pengumuman resminya, Anthropic menjelaskan bahwa Claude Sonnet 5 mampu menyusun rencana, menggunakan berbagai alat seperti browser dan terminal, hingga menyelesaikan tugas secara otomatis. Kemampuan tersebut sebelumnya hanya dapat ditemukan pada model AI yang lebih besar dan jauh lebih mahal.

Perkembangan ini sejalan dengan langkah para pesaingnya. OpenAI baru saja merilis GPT-5.6 Sol dalam versi pratinjau yang menawarkan kemampuan membagi pekerjaan ke beberapa subagen untuk menangani tugas jangka panjang secara mandiri. Sementara itu, Google melalui Gemini 3.5 Flash juga mengubah fokus AI mereka dari sekadar chatbot percakapan menjadi asisten yang mampu merencanakan, membangun, dan menyelesaikan pekerjaan dengan campur tangan manusia yang minim.

Dengan hadirnya Claude Sonnet 5, persaingan di industri AI kini tidak lagi hanya soal siapa yang memiliki kemampuan agentic terbaik. Faktor pembeda mulai bergeser ke efisiensi biaya, keandalan, dan kemampuan model dalam bekerja secara otonom tanpa memerlukan banyak pengawasan dari pengguna.

Daftar Isi

Performa Mendekati Opus 4.8 dengan Biaya Lebih Rendah

Salah satu daya tarik utama Claude Sonnet 5 adalah performanya yang diklaim mendekati Claude Opus 4.8, namun dengan biaya penggunaan yang jauh lebih murah. Mulai hari Selasa, Claude Sonnet 5 akan menjadi model default bagi pengguna paket Free maupun Pro, sekaligus tersedia di seluruh pilihan langganan Anthropic.

Pada masa peluncuran, Anthropic menetapkan harga US$2 per satu juta input token dan US$10 per satu juta output token hingga 31 Agustus. Setelah periode tersebut berakhir, tarifnya akan berubah menjadi US$3 per satu juta input token dan US$15 per satu juta output token.

Meski mengalami kenaikan harga setelah masa promosi, Claude Sonnet 5 tetap lebih murah dibandingkan Claude Opus 4.8, OpenAI GPT-5.5, maupun Google Gemini 3.1 Pro. Hanya saja, model ini masih berada di atas Gemini 3.5 Flash dari sisi biaya penggunaan.

Peningkatan Kemampuan Agentic dan Coding

Anthropic juga mengungkapkan bahwa Claude Sonnet 5 membawa peningkatan nyata dibandingkan pendahulunya, Claude Sonnet 4.6, yang dirilis pada Februari lalu. Peningkatan tersebut mencakup kemampuan penalaran (reasoning), penggunaan alat (tool use), pemrograman, hingga penyelesaian berbagai pekerjaan berbasis pengetahuan.

Pada salah satu benchmark agentic coding, Claude Sonnet 5 berhasil memperoleh skor 63,2%, meningkat dari Sonnet 4.6 yang mencatat 58,1%. Sementara itu, Claude Opus 4.8 masih memimpin dengan skor 69,2%.

Menariknya, pada benchmark yang menguji kemampuan knowledge work, Claude Sonnet 5 justru mampu sedikit melampaui performa Opus 4.8. Padahal selama ini Opus dikenal sebagai model yang unggul dalam menyelesaikan persoalan kompleks, mengambil keputusan yang membutuhkan pertimbangan mendalam, hingga melakukan riset secara komprehensif.

Menurut Anthropic, Opus 4.8 tetap menjadi pilihan terbaik bagi pengguna yang membutuhkan tingkat akurasi paling tinggi. Namun, Claude Sonnet 5 memberikan alternatif yang jauh lebih ekonomis dengan kualitas yang meningkat signifikan dibandingkan model-model sebelumnya. Dengan dua pilihan tersebut, pengguna dapat menyesuaikan keseimbangan antara biaya operasional dan performa yang dibutuhkan.

Mampu Menyelesaikan Tugas Kompleks Secara Mandiri

Berdasarkan hasil pengujian yang dilakukan sejumlah mitra, Claude Sonnet 5 juga menunjukkan peningkatan dalam menyelesaikan tugas-tugas kompleks dari awal hingga selesai. Model ini disebut mampu memeriksa kembali hasil pekerjaannya sendiri tanpa harus diminta secara khusus oleh pengguna.

Salah satu contoh datang dari Daniel Shepard, Senior Engineer di Zapier. Ia mengungkapkan bahwa Claude Sonnet 5 berhasil menyelesaikan dua pekerjaan sekaligus, yakni memperbarui tingkatan akun Salesforce dan mengirimkan pengumuman peluncuran kepada kontak perusahaan, tanpa mengalami hambatan di tengah proses.

Menurutnya, tugas serupa sebelumnya sering terhenti di tengah jalan pada model terdahulu. Karena itu, Claude Sonnet 5 dinilai menjadi pilihan yang sangat efektif untuk kebutuhan otomatisasi pekerjaan sehari-hari.

Lebih Aman Digunakan untuk Berbagai Skenario

Selain peningkatan performa, Anthropic juga menyoroti aspek keamanan pada Claude Sonnet 5. Model terbaru ini memiliki tingkat perilaku yang tidak diinginkan lebih rendah dibandingkan Sonnet 4.6, termasuk dalam hal penyalahgunaan, upaya penipuan, maupun manipulasi.

Claude Sonnet 5 juga diklaim lebih baik dalam menolak permintaan yang bersifat berbahaya serta lebih tangguh menghadapi serangan prompt injection. Selain itu, tingkat halusinasi AI dan kecenderungan memberikan jawaban yang terlalu menyenangkan pengguna (sycophantic behavior) juga berhasil ditekan.

Meski begitu, Anthropic mengakui bahwa kemampuan keamanan Claude Sonnet 5 masih berada di bawah Claude Opus 4.8 maupun Claude Mythos Preview dalam menghadapi perilaku AI yang tidak selaras. Di sisi lain, evaluasi perusahaan menunjukkan bahwa Sonnet 5 memiliki kemampuan yang jauh lebih rendah untuk melakukan tugas-tugas berbahaya di bidang keamanan siber dibandingkan model Opus saat ini.

Fabian Hedin, Co-founder Lovable, turut memberikan tanggapan positif terhadap model terbaru ini. Menurutnya, Claude Sonnet 5 mampu menolak permintaan yang tidak aman secara konsisten tanpa mengurangi kualitas pekerjaannya.

Ia menambahkan bahwa ketika alat AI yang semakin canggih digunakan oleh jutaan pengembang, kemampuan sebuah model untuk mengetahui kapan harus menolak sebuah permintaan sama pentingnya dengan kemampuannya dalam membangun dan menyelesaikan berbagai tugas.

Claude Sonnet 5 Jadi Model AI Terbaru Anthropic dengan Biaya Lebih Murah

Performa Mendekati Opus 4.8 dengan Biaya Lebih Rendah

Peningkatan Kemampuan Agentic dan Coding

Mampu Menyelesaikan Tugas Kompleks Secara Mandiri

Lebih Aman Digunakan untuk Berbagai Skenario

Related Posts

WhatsApp Perkenalkan Username sebagai Pengganti Nomor Telepon

OpenAI Rilis GPT-5.6 Sol dengan Proteksi Siber Lebih Kuat

Microsoft Perpanjang Update Keamanan Windows 10 hingga Oktober 2027

Leave a Reply Cancel reply