GlobalGPT

克勞德十四行詩 4.5:最強大的人工智慧,實現超過30小時的無間斷編碼

克勞德十四行詩之四五:最強大的人工智慧,實現三十小時不間斷編碼

Anthropic 剛正式發布 克勞德十四行詩 4.5, 而結果令人驚嘆不已。.

順便說一下,如果您想使用 ChatGPT 與 雙子座 和其他頂級 AI 機型,而且價格非常便宜、, 全球 GPT 提供整合式多合一體驗。.

克勞德十四行詩4.5版榮登SWE-bench驗證排行榜榜首

SWE-bench 驗證 測試——該測試旨在評估真實世界的程式設計能力——克勞德十四行詩4.5版奪得 #1 產業中的地位.

更瘋狂的是?它能保持專注並持續運作長達 連續超過30小時.

是的,人工智慧剛剛又在人類身上增添了另一項優勢。.

克勞德十四行詩4.5版榮登SWE-bench驗證排行榜榜首

無與倫比的編碼實力:打造應用程式如同呼吸般自然

例如,當被要求開發類Slack或Teams的聊天應用程式時,它便能快速產出 一氣呵成寫完一萬一千行程式碼. 相較之下,較舊的克勞德Opus 4與Codex型號僅能維持約7小時的持續運作。.

根據Anthropic的說法,, 克勞德·索內特 4.5 現已成為全球最強大的編碼模型 — 在構建複雜代理、電腦操作、推理和數學方面取得重大突破。.

 克勞德十四行詩 4.5 現已成為全球最強大的編碼模型

OSWorld, 在專為測試真實電腦任務而設計的基準測試中,其得分為 61.4%, 再次奪得榜首。僅四個月前,《十四行詩4》還以42.2%領先——如此表現躍升實屬驚人。.

克勞德十四行詩 4.5 在 OSWorld 實機任務基準測試中達成 61.4% 效能

新功能與工具升級 克勞德十四行詩 4.5

Anthropic 同時也為新模型推出多項重大升級:

  • 檢查點支援 終於問世,讓進度得以隨時儲存,並可隨時回溯至先前狀態。.
  • 使用資訊 現在可直接在 Claude Code 中使用 /用法.
  • 原生 VS Code 外掛程式 已提供,類似於 OpenAI 的 Codex 外掛程式。.
  • 克勞德代碼 SDK 已正式更名為 克勞德代理商軟體開發套件, 提升代理建構能力。.
  • 終端介面 已進行重大改版,讓使用者在啟動時能立即查看先前工作階段的歷史記錄與新功能清單。.
Claude Sonnet 4.5 新功能與工具升級

Anthropic 甚至公開了他們用來構建 Claude Code 的底層基礎架構,名為 克勞德代理商軟體開發套件.

在長期運行的任務中管理代理的記憶體、設計能平衡自主性與使用者控制的權限系統,以及協調多個子代理以達成目標,這些都是建構與設計人工智慧代理時面臨的挑戰性課題。.

隨著 克勞德代理商軟體開發套件, 現在,您可以利用這套基礎架構來開發自己的產品。.

早期用戶反應:愛恨交織的關係

即日起,開發人員可呼叫 克勞德十四行詩 4-5 透過克勞德 API。定價維持與《十四行詩 4》相同: 每百萬代幣可兌換$3/$15.

早期測試者已深感驚艷:

一位開發者在試用後立即分享了他們的體驗:

“「Claude 4.5 Sonnet 剛用單次運算重構了我的整個程式碼庫——調用了25個工具,新增超過3,000行程式碼,並創建了12個全新檔案。它將所有內容模組化,拆解了單體架構,並清理了麵條式程式碼。雖然產出結果實際上無法執行,但天啊,這結構實在太優雅了。」這則評論彷彿夾雜著愛恨交織的情緒。.

Cursor 表示,他們觀察到 Claude Sonnet 4.5 展現了尖端的程式設計效能,尤其在處理長時間任務方面有所提升。這進一步解釋了為何眾多 Cursor 用戶選擇 Claude 來解決最複雜的問題。.

知名科技評論人兼部落客丹·希珀指出,Claude 4.5 給人一種 更快、更可控、更穩定.

強化安全性:迄今最高對準度

性能是一回事,但安全性必須與之同步提升。.

根據Anthropic的說法,Claude Sonnet 4.5是他們迄今為止最符合其理念的前沿模型。.

得益於克勞德增強功能與嚴謹的安全培訓相結合,Anthropic 在模型行為方面取得顯著進步,有效抑制了阿諛奉承、欺騙行為、權力追求及助長妄想等傾向。此外,該公司在抵禦提示注入攻擊及最小化內容誤分類方面亦取得重大突破。.

克勞德十四行詩 4.5 實驗功能:與克勞德共創想像

與此同時,Anthropic 推出了 臨時研究預覽 稱為 與克勞德共想. 在此模式下,克勞德會即時生成軟體——所有功能與程式碼皆非預先編寫。每項內容皆在互動過程中即時創建與調整。.

此預覽僅適用於 克勞德·馬克斯訂閱者 在接下來的5天內。.

在此處存取:https://claude.ai/imagine/

克勞德十四行詩 4.5 實驗性功能:「與克勞德共創想像」“

市場競爭與克勞德十四行詩4.5的戰略意義

Anthropic目前估值為 1兆4830億, 截至八月,其年化營收運行率達145億美元——其中大部分由編碼工具驅動。但競爭異常激烈: OpenAI 與 Google Gemini 也正爭相搶佔開發者市場主導權。.

值得注意的是,OpenAI的年度開發者大會僅剩一週之遙。Anthropic此時推出Claude 4.5,顯然是為了施加壓力。.

Anthropic的聯合創始人暨首席科學家賈里德·卡普蘭已暗示,一款更為先進的 克勞德·奧普斯模型 將於今年稍後推出。.

過往問題與重建用戶信心

這段旅程並非一帆風順。過去兩個月間,用戶紛紛指責Claude系列產品「被簡化」。許多人反映其推理、編碼、格式化及工具使用能力急遽下滑——連付費的Max訂閱用戶也不例外。.

Anthropic承認存在兩個獨立錯誤,並回滾了Opus 4.1更新版本,同時否認存在削減成本的動機。然而由於未提供補償或退款,用戶在GitHub和X平台上掀起強烈反彈,部分使用者已轉投Codex等競爭對手服務。.

的發布 克勞德十四行詩 4.5 這是Anthropic贏回用戶信任的契機。其成敗將取決於未來數週內,該模型在實際應用中的表現。.

分享文章:

相關文章

GlobalGPT