Anthropic baru saja secara resmi merilis Claude Soneta 4.5, dan hasilnya sungguh mengagumkan.
Ngomong-ngomong, jika Anda ingin menggunakan ChatGPT dengan Gemini dan model AI terbaik lainnya dengan harga yang sangat murah, GPT Global menawarkan pengalaman all-in-one yang terintegrasi.

Claude Sonnet 4.5 memimpin papan peringkat terverifikasi SWE-bench.
Pada SWE-bench Terverifikasi Uji coba — yang menilai kemampuan pemrograman di dunia nyata — Claude Sonnet 4.5 berhasil melakukannya. #1 posisi terkemuka di industri.
Bahkan lebih gila? Ia dapat tetap fokus dan bekerja secara terus-menerus untuk lebih dari 30 jam berturut-turut.
Ya, AI baru saja menambahkan keunggulan lain dibandingkan manusia.

Kekuatan Pemrograman Tanpa Tanding: Membangun Aplikasi Seperti Bernapas
Misalnya, ketika ditugaskan untuk membangun aplikasi obrolan serupa Slack atau Teams, ia menghasilkan 11.000 baris kode dalam satu sesi. Jika dibandingkan, model lama Claude Opus 4 dan Codex hanya mampu beroperasi secara terus-menerus selama sekitar 7 jam.
Menurut Anthropic, Claude Sonnet 4.5 kini menjadi model pemrograman terkuat di dunia. — dengan peningkatan signifikan dalam pengembangan agen kompleks, operasi komputer, penalaran, dan matematika.

Pada OSWorld, sebuah benchmark yang dirancang untuk menguji tugas-tugas komputer yang sebenarnya, nilainya adalah 61.4%, sekali lagi menduduki peringkat pertama. Hanya empat bulan yang lalu, Sonnet 4 memimpin dengan 42,21 TP3T — jadi lonjakan kinerjanya sungguh mengesankan.

Fitur Baru dan Pembaruan Alat Soneta Claude 4.5
Anthropic juga meluncurkan beberapa pembaruan besar bersamaan dengan model baru:
- Dukungan pos pemeriksaan Akhirnya tersedia, memungkinkan kemajuan disimpan dan dikembalikan ke keadaan sebelumnya kapan saja.
- Informasi penggunaan sekarang dapat diakses langsung di dalam Claude Code menggunakan
/penggunaan. - Plugin VS Code asli tersedia, mirip dengan plugin Codex dari OpenAI.
- Claude Code SDK telah secara resmi diganti namanya menjadi Claude Agent SDK, meningkatkan kemampuan pengembangan agen.
- Antarmuka terminal Telah dirancang ulang secara signifikan, memungkinkan pengguna untuk melihat riwayat sesi sebelumnya dan daftar fitur baru dengan sekilas saat startup.

Anthropic bahkan telah membuka infrastruktur dasar yang mereka gunakan untuk membangun Claude Code, yang disebut Claude Agent SDK.
Mengelola memori untuk agen selama tugas yang berjalan lama, merancang sistem izin yang menyeimbangkan otonomi dan kontrol pengguna, serta mengoordinasikan beberapa sub-agen untuk mencapai tujuan, semuanya merupakan aspek menantang dalam membangun dan merancang agen kecerdasan buatan (AI).
Dengan Claude Agent SDK, Sekarang Anda dapat memanfaatkan infrastruktur ini untuk mengembangkan produk Anda sendiri.
Reaksi Awal Pengguna: Hubungan Cinta-Benci
Mulai hari ini, pengembang dapat memanggil Claude-Sonnet-4-5 melalui API Claude. Harga tetap sama seperti pada Sonnet 4: $3/$15 per juta token.
Pengguna awal sudah terkesan:
Seorang pengembang berbagi pengalamannya segera setelah mencobanya:
“Claude 4.5 Sonnet baru saja merestrukturisasi seluruh basis kode saya dalam satu kali eksekusi—25 panggilan alat, lebih dari 3.000 baris kode baru, dan 12 berkas baru. Ia memodularisasi semuanya, memecah struktur monolitik, dan membersihkan kode spaghetti. Hasilnya sebenarnya tidak berjalan, tapi wow, benar-benar elegan.” Ulasan ini terasa seperti campuran antara cinta dan frustrasi.
Cursor menyatakan bahwa mereka mengamati kinerja pemrograman terdepan dengan Claude Sonnet 4.5, terutama dengan perbaikan dalam penanganan tugas berdurasi panjang. Hal ini semakin menjelaskan mengapa banyak pengguna Cursor memilih Claude untuk menangani masalah-masalah paling kompleks.
Pengulas teknologi terkenal Dan Shipper mencatat bahwa Claude 4.5 terasa lebih cepat, lebih mudah dikendalikan, dan lebih stabil.

Keamanan yang Ditingkatkan: Keselarasan Tertinggi Hingga Saat Ini
Kinerja adalah satu hal, tetapi keselamatan harus sejalan.
Claude Sonnet 4.5, menurut Anthropic, adalah model tercanggih mereka yang paling sesuai hingga saat ini.
Berkat kemampuan yang ditingkatkan dari Claude yang dikombinasikan dengan pelatihan keselamatan yang ketat, Anthropic telah mencapai perbaikan signifikan dalam perilaku model, mengurangi kecenderungan seperti pengagungan berlebihan, penipuan, pencarian kekuasaan, dan mendorong ilusi. Selain itu, Anthropic telah mencapai terobosan besar dalam melindungi diri dari serangan injeksi prompt dan meminimalkan kesalahan klasifikasi konten.

Claude Sonnet 4.5 Fitur Eksperimental: Bayangkan Bersama Claude
Pada saat yang sama, Anthropic meluncurkan sebuah Pratinjau penelitian sementara disebut Bayangkan bersama Claude. Dalam mode ini, Claude menghasilkan perangkat lunak secara real-time — tidak ada fungsi atau kode yang ditulis sebelumnya. Segala sesuatu dibuat dan disesuaikan secara interaktif di tempat.
Pratinjau ini hanya tersedia untuk Pelanggan Claude Max selama 5 hari ke depan.
Akses di sini:https://claude.ai/imagine/

Persaingan Pasar dan Signifikansi Strategis Claude Sonnet 4.5
Anthropic saat ini bernilai $183 miliar, dengan tingkat pendapatan tahunan sebesar $5 miliar per Agustus — sebagian besar didorong oleh alat pemrograman. Namun, persaingan sangat ketat: OpenAI dan Google Gemini juga berlomba-lomba untuk mendominasi pasar pengembang.
Perlu dicatat, konferensi pengembang tahunan OpenAI hanya tinggal seminggu lagi. Langkah Anthropic untuk meluncurkan Claude 4.5 saat ini merupakan upaya yang jelas untuk memberikan tekanan.
Pendiri bersama dan ilmuwan utama Anthropic, Jared Kaplan, telah memberikan bocoran bahwa akan ada versi yang lebih canggih. Model Claude Opus akan diluncurkan pada akhir tahun ini.
Masalah-masalah Sebelumnya dan Memulihkan Kepercayaan Pengguna
Tidak semuanya berjalan lancar. Selama dua bulan terakhir, pengguna menuduh seri Claude telah “dibuat lebih sederhana.” Banyak yang melaporkan penurunan drastis dalam kualitas penalaran, pemrograman, format, dan penggunaan alat — bahkan langganan Max berbayar.
Anthropic mengakui adanya dua bug independen dan menarik kembali pembaruan Opus 4.1, sambil membantah adanya motif penghematan biaya. Namun, tanpa kompensasi atau pengembalian dana, reaksi negatif menyebar di GitHub dan X, dengan beberapa pengguna beralih ke pesaing seperti Codex.
Peluncuran Claude Soneta 4.5 Ini adalah kesempatan Anthropic untuk memenangkan kembali kepercayaan mereka. Apakah hal ini berhasil akan bergantung pada bagaimana model tersebut berkinerja dalam penggunaan dunia nyata dalam beberapa minggu ke depan.

