GlobalGPT

Claude Sonnet 4.5: Kecerdasan Buatan Terkuat untuk Lebih dari 30 Jam Pemrograman Tanpa Henti

Claude-Sonnet-4-5: AI Terkuat untuk 30 Jam Pemrograman Nonstop

Anthropic baru saja secara resmi merilis Claude Soneta 4.5, dan hasilnya sungguh mengagumkan.

Ngomong-ngomong, jika Anda ingin menggunakan ChatGPT dengan Gemini dan model AI terbaik lainnya dengan harga yang sangat murah, GPT Global menawarkan pengalaman all-in-one yang terintegrasi.

Claude Sonnet 4.5 memimpin papan peringkat terverifikasi SWE-bench.

Pada SWE-bench Terverifikasi Uji coba — yang menilai kemampuan pemrograman di dunia nyata — Claude Sonnet 4.5 berhasil melakukannya. #1 posisi terkemuka di industri.

Bahkan lebih gila? Ia dapat tetap fokus dan bekerja secara terus-menerus untuk lebih dari 30 jam berturut-turut.

Ya, AI baru saja menambahkan keunggulan lain dibandingkan manusia.

Claude Sonnet 4.5 memimpin papan peringkat terverifikasi SWE-bench.

Kekuatan Pemrograman Tanpa Tanding: Membangun Aplikasi Seperti Bernapas

Misalnya, ketika ditugaskan untuk membangun aplikasi obrolan serupa Slack atau Teams, ia menghasilkan 11.000 baris kode dalam satu sesi. Jika dibandingkan, model lama Claude Opus 4 dan Codex hanya mampu beroperasi secara terus-menerus selama sekitar 7 jam.

Menurut Anthropic, Claude Sonnet 4.5 kini menjadi model pemrograman terkuat di dunia. — dengan peningkatan signifikan dalam pengembangan agen kompleks, operasi komputer, penalaran, dan matematika.

 Claude Sonnet 4.5 kini menjadi model pemrograman terkuat di dunia.

Pada OSWorld, sebuah benchmark yang dirancang untuk menguji tugas-tugas komputer yang sebenarnya, nilainya adalah 61.4%, sekali lagi menduduki peringkat pertama. Hanya empat bulan yang lalu, Sonnet 4 memimpin dengan 42,21 TP3T — jadi lonjakan kinerjanya sungguh mengesankan.

Claude Sonnet 4.5 mencapai skor 61,41 TP3T pada benchmark OSWorld untuk tugas-tugas komputer nyata.

Fitur Baru dan Pembaruan Alat Soneta Claude 4.5

Anthropic juga meluncurkan beberapa pembaruan besar bersamaan dengan model baru:

  • Dukungan pos pemeriksaan Akhirnya tersedia, memungkinkan kemajuan disimpan dan dikembalikan ke keadaan sebelumnya kapan saja.
  • Informasi penggunaan sekarang dapat diakses langsung di dalam Claude Code menggunakan /penggunaan.
  • Plugin VS Code asli tersedia, mirip dengan plugin Codex dari OpenAI.
  • Claude Code SDK telah secara resmi diganti namanya menjadi Claude Agent SDK, meningkatkan kemampuan pengembangan agen.
  • Antarmuka terminal Telah dirancang ulang secara signifikan, memungkinkan pengguna untuk melihat riwayat sesi sebelumnya dan daftar fitur baru dengan sekilas saat startup.
Fitur Baru dan Pembaruan Alat pada Claude Sonnet 4.5

Anthropic bahkan telah membuka infrastruktur dasar yang mereka gunakan untuk membangun Claude Code, yang disebut Claude Agent SDK.

Mengelola memori untuk agen selama tugas yang berjalan lama, merancang sistem izin yang menyeimbangkan otonomi dan kontrol pengguna, serta mengoordinasikan beberapa sub-agen untuk mencapai tujuan, semuanya merupakan aspek menantang dalam membangun dan merancang agen kecerdasan buatan (AI).

Dengan Claude Agent SDK, Sekarang Anda dapat memanfaatkan infrastruktur ini untuk mengembangkan produk Anda sendiri.

Reaksi Awal Pengguna: Hubungan Cinta-Benci

Mulai hari ini, pengembang dapat memanggil Claude-Sonnet-4-5 melalui API Claude. Harga tetap sama seperti pada Sonnet 4: $3/$15 per juta token.

Pengguna awal sudah terkesan:

Seorang pengembang berbagi pengalamannya segera setelah mencobanya:

“Claude 4.5 Sonnet baru saja merestrukturisasi seluruh basis kode saya dalam satu kali eksekusi—25 panggilan alat, lebih dari 3.000 baris kode baru, dan 12 berkas baru. Ia memodularisasi semuanya, memecah struktur monolitik, dan membersihkan kode spaghetti. Hasilnya sebenarnya tidak berjalan, tapi wow, benar-benar elegan.” Ulasan ini terasa seperti campuran antara cinta dan frustrasi.

Cursor menyatakan bahwa mereka mengamati kinerja pemrograman terdepan dengan Claude Sonnet 4.5, terutama dengan perbaikan dalam penanganan tugas berdurasi panjang. Hal ini semakin menjelaskan mengapa banyak pengguna Cursor memilih Claude untuk menangani masalah-masalah paling kompleks.

Pengulas teknologi terkenal Dan Shipper mencatat bahwa Claude 4.5 terasa lebih cepat, lebih mudah dikendalikan, dan lebih stabil.

Keamanan yang Ditingkatkan: Keselarasan Tertinggi Hingga Saat Ini

Kinerja adalah satu hal, tetapi keselamatan harus sejalan.

Claude Sonnet 4.5, menurut Anthropic, adalah model tercanggih mereka yang paling sesuai hingga saat ini.

Berkat kemampuan yang ditingkatkan dari Claude yang dikombinasikan dengan pelatihan keselamatan yang ketat, Anthropic telah mencapai perbaikan signifikan dalam perilaku model, mengurangi kecenderungan seperti pengagungan berlebihan, penipuan, pencarian kekuasaan, dan mendorong ilusi. Selain itu, Anthropic telah mencapai terobosan besar dalam melindungi diri dari serangan injeksi prompt dan meminimalkan kesalahan klasifikasi konten.

Claude Sonnet 4.5 Fitur Eksperimental: Bayangkan Bersama Claude

Pada saat yang sama, Anthropic meluncurkan sebuah Pratinjau penelitian sementara disebut Bayangkan bersama Claude. Dalam mode ini, Claude menghasilkan perangkat lunak secara real-time — tidak ada fungsi atau kode yang ditulis sebelumnya. Segala sesuatu dibuat dan disesuaikan secara interaktif di tempat.

Pratinjau ini hanya tersedia untuk Pelanggan Claude Max selama 5 hari ke depan.

Akses di sini:https://claude.ai/imagine/

Claude Sonnet 4.5 Fitur Eksperimental: “Bayangkan Bersama Claude”

Persaingan Pasar dan Signifikansi Strategis Claude Sonnet 4.5

Anthropic saat ini bernilai $183 miliar, dengan tingkat pendapatan tahunan sebesar $5 miliar per Agustus — sebagian besar didorong oleh alat pemrograman. Namun, persaingan sangat ketat: OpenAI dan Google Gemini juga berlomba-lomba untuk mendominasi pasar pengembang.

Perlu dicatat, konferensi pengembang tahunan OpenAI hanya tinggal seminggu lagi. Langkah Anthropic untuk meluncurkan Claude 4.5 saat ini merupakan upaya yang jelas untuk memberikan tekanan.

Pendiri bersama dan ilmuwan utama Anthropic, Jared Kaplan, telah memberikan bocoran bahwa akan ada versi yang lebih canggih. Model Claude Opus akan diluncurkan pada akhir tahun ini.

Masalah-masalah Sebelumnya dan Memulihkan Kepercayaan Pengguna

Tidak semuanya berjalan lancar. Selama dua bulan terakhir, pengguna menuduh seri Claude telah “dibuat lebih sederhana.” Banyak yang melaporkan penurunan drastis dalam kualitas penalaran, pemrograman, format, dan penggunaan alat — bahkan langganan Max berbayar.

Anthropic mengakui adanya dua bug independen dan menarik kembali pembaruan Opus 4.1, sambil membantah adanya motif penghematan biaya. Namun, tanpa kompensasi atau pengembalian dana, reaksi negatif menyebar di GitHub dan X, dengan beberapa pengguna beralih ke pesaing seperti Codex.

Peluncuran Claude Soneta 4.5 Ini adalah kesempatan Anthropic untuk memenangkan kembali kepercayaan mereka. Apakah hal ini berhasil akan bergantung pada bagaimana model tersebut berkinerja dalam penggunaan dunia nyata dalam beberapa minggu ke depan.

Bagikan Postingan:

Postingan Terkait

GlobalGPT
  • Bekerja Lebih Cerdas dengan Platform AI All-in-One #1
  • Semua yang Anda Butuhkan dalam Satu Tempat: AI Mengobrol, Menulis, Meneliti, dan Membuat Gambar & Video yang Menakjubkan
  • Akses Instan 100+ Model & Agen AI Terbaik – GPT 5.1, Gemini 3 Pro, Sora 2, Nano Banana Pro, Perplexity…