Anthropicが正式にリリースした。 クロード・ソネット4.5, そしてその結果は驚くべきものだった。.
ところで、もしChatGPTを ジェミニ をはじめとするトップAIモデルを極めて低価格で提供する、, グローバルGPT は統合されたオールインワン体験を提供する。.

クロード・ソネット4.5がSWEベンチ検証リーダーボードのトップに
について SWEベンチ検証済み クロード・ソネット4.5は、実世界でのプログラミング能力を評価するテストにおいて、以下の成績を収めた。 業界における#1スポット.
さらにクレイジー?集中力を持続させ、次の時間まで働き続けることができるのだ。 連続30時間以上.
そう、AIは人間に対する優位性をまたひとつ増やしたのだ。.

比類なきコーディング力:呼吸するようにアプリを作る
例えば、SlackやTeamsのようなチャットアプリを開発するよう命じられると、次のような結果を出した。 一度に11,000行のコード. .それに比べると、旧型のクロード・オーパス4とコーデックスは7時間程度しか持続できなかった。.
人間学によれば, クロード・ソネット 4.5は今や世界最強のコーディングモデル - 複雑なエージェントの構築、コンピューター操作、推論、数学の大幅な向上とともに。.

オン オーエスワールド, 実際のコンピュータのタスクをテストするために設計されたベンチマークで、このベンチマークは以下のスコアを記録した。 61.4%, またしても首位に立った。わずか4ヶ月前、ソネット4は42.2%で首位だった。.

新機能とツールのアップグレード クロード・ソネット4.5の
Anthropicはまた、新モデルと同時にいくつかの主要なアップグレードを展開した:
- チェックポイント・サポート これにより、進捗状況を保存し、いつでも以前の状態にロールバックできるようになった。.
- 使用情報 を使用して、クロードコード内で直接クエリできるようになりました。
/使用. - ネイティブVSコードプラグイン は、OpenAIのCodexプラグインと同様に利用できる。.
- クロードコードSDK に正式に改名された。 クロード・エージェントSDK, エージェント構築能力を高める。.
- ターミナルインターフェース は大幅にデザインが変更され、起動時に以前のセッション履歴や新機能のリストを一目で確認できるようになりました。.

Anthropicは、Claude Codeを構築するために使用している基礎的なインフラストラクチャを公開しています。 クロード・エージェントSDK.
長時間実行されるタスク中のエージェントのメモリ管理、自律性とユーザーコントロールのバランスをとるパーミッションシステムの設計、目標達成のための複数のサブエージェントの調整は、AIエージェントの構築と設計におけるすべての挑戦的な側面である。.
を持つ。 クロード・エージェントSDK, このインフラを活用して、独自の製品を開発することができる。.
初期のユーザーの反応:愛憎の関係
本日より、開発者は クロード・ソネ-4-5 クロードAPI経由。価格はソネット4から変更なし: 100万トークンあたり$3/$15.
初期のテスターはすでに感銘を受けている:
ある開発者は、試した直後の体験を語ってくれた:
“「Claude 4.5 Sonnetは、私のコードベース全体を1回でリファクタリングしてくれました。すべてをモジュール化し、モノリシックな構造を壊し、スパゲッティコードを一掃しました。その結果、実際に動くことはなかったが、いやあ、実にエレガントだった」。このレビューは、愛とフラストレーションが入り混じったような感じがする。.
Cursor社は、Claude Sonnet 4.5で最先端のプログラミング性能が確認され、特に長時間のタスク処理に改善が見られると述べている。これは、多くのCursorユーザーが最も複雑な問題に取り組むためにClaudeを選択する理由をさらに説明するものです。.
著名なレビュアーである技術系ブロガーのダン・シッパー氏は、クロード4.5の感触について次のように述べている。 より速く、よりコントロールしやすく、より安定している.

強化された安全性:これまでで最高のアライメント
パフォーマンスも大事だが、安全性もそれに追いつかなければならない。.
クロード・ソネット4.5は、アンソロピックによれば、これまでで最も完成度の高い最先端モデルだという。.
クロードの強化された能力と厳格な安全トレーニングのおかげで、Anthropicはモデルの行動を大幅に改善し、お人好し、欺瞞、権力追求、妄想を助長するような傾向を減らしました。さらに、Anthropicはプロンプトインジェクション攻撃に対する防御とコンテンツの誤分類の最小化において大きなブレークスルーを達成しました。.

クロード・ソネット 4.5 実験的機能:クロードと想像する
同時に、アンソロピックは 臨時研究プレビュー という クロードと想像してみよう. .このモードでは、クロードはリアルタイムでソフトウェアを生成します。すべてがその場でインタラクティブに作成され、調整されます。.
このプレビューは クロード・マックス加入者 向こう5日間。.
アクセスはこちらhttps://claude.ai/imagine/

クロード・ソネット4.5の市場競争と戦略的意義
アンソロピックは現在、次のように評価されている。 $183億円, その多くはコーディング・ツールによるものだ。しかし競争は激しい: OpenAIとGoogle Gemini もまた、デベロッパー市場を支配しようと競争している。.
注目すべきは、OpenAIの年次開発者会議が1週間後に迫っていることだ。Anthropicが今クロード4.5を落としたのは、圧力をかけようとする明らかな動きだ。.
Anthropic社の共同設立者でチーフ・サイエンティストのジャレド・カプランは、さらに進化した クロード・オーパスモデル は今年後半に発売される予定だ。.
過去の問題とユーザーの信頼回復
すべてが順風満帆だったわけではない。過去2ヶ月間、ユーザーたちはクロード・シリーズが “ダブった ”と非難した。多くの人が、推論、コーディング、フォーマット、ツール使用の質が急激に低下していると報告している。.
Anthropicは2つの独立したバグを認め、Opus 4.1のアップデートをロールバックし、コスト削減の動機を否定した。しかし、補償や返金もないまま、GitHubやXで反発が広がり、Codexのような競合他社に乗り換えるユーザーもいた。.
のリリースを発表した。 クロード・ソネット4.5 アンソロピックは、彼らを取り戻すチャンスなのだ。成功するかどうかは、このモデルが今後数週間の間に実使用でどのようなパフォーマンスを見せるかにかかっている。.

