人类刚刚正式发布了 克洛德十四行诗 4.5, 结果令人瞠目。.
顺便说一下,如果您想将 ChatGPT 与 双子座 和其他顶级人工智能机型的超低价格、, 全球 GPT 提供一体化的多功能体验。.

Claude Sonnet 4.5 在 SWE-bench 验证排行榜上名列前茅
在 SWE-bench 验证 Claude Sonnet 4.5 在评估实际编程能力的测试中获得了 #1 行业中的亮点.
更疯狂的是?它可以保持专注,连续工作 连续30多个小时.
是的,与人类相比,人工智能又多了一项优势。.

无与伦比的编码能力:像呼吸一样构建应用程序
例如,当受命构建一个类似 Slack 或 Teams 的聊天应用程序时,它能输出 一口气写了 11,000 行代码. .相比之下,老式的 Claude Opus 4 和 Codex 只能持续工作约 7 个小时。.
根据人类学、, 克劳德十四行诗 4.5 是目前世界上最强大的编码模型 - 在构建复杂代理、计算机操作、推理和数学方面取得了巨大进步。.

关于 操作系统世界, 在测试真实计算机任务的基准测试中,它的得分是 61.4%, 再次获得第一名。就在四个月前,Sonnet 4 还以 42.2% 的成绩遥遥领先,因此性能的飞跃是惊人的。.

新功能和工具升级 克劳德十四行诗 4.5
Anthropic 在推出新机型的同时,还进行了多项重大升级:
- 检查点支持 终于可用了,可以随时保存进度并回滚到之前的状态。.
- 使用信息 现在可以直接在克劳德代码中使用
/使用. - 本地 VS 代码插件 与 OpenAI 的 Codex 插件类似。.
- 克劳德代码 SDK 已正式更名为 克劳德代理 SDK, 加强代理建设能力。.
- 终端接口 经过重新设计,用户可以在启动时一目了然地看到以前的会话历史和新功能列表。.

Anthropic 甚至开放了他们用来构建克劳德代码的底层基础架构,称为 克劳德代理 SDK.
在长时间运行的任务中管理代理的内存,设计兼顾自主性和用户控制的权限系统,以及协调多个子代理以实现目标,这些都是构建和设计人工智能代理所面临的挑战。.
随着 克劳德代理 SDK, 现在,您可以利用这一基础设施来构建自己的产品。.
早期用户反应:爱恨交织
从今天起,开发人员可以拨打 Claude-sonnet-4-5 通过 Claude API。价格与 Sonnet 4 相同: 每百万代币 $3/$15.
早期的试用者已经留下了深刻的印象:
一位开发人员在试用后立即分享了他们的体验:
“Claude 4.5 Sonnet 一次运行就重构了我的整个代码库--25 次工具调用、3000 多行新代码和 12 个全新文件。它将所有内容模块化,打破了单一结构,并清理了杂乱无章的代码。结果并没有实际运行,但哇,它真的很优雅。这篇评论让人感觉既爱又无奈。.
Cursor 表示,他们观察到 Claude Sonnet 4.5 的尖端编程性能,尤其是在处理长时间任务方面的改进。这进一步解释了为什么许多 Cursor 用户选择 Claude 来解决最复杂的问题。.
知名评论员科技博主 Dan Shipper 指出,克劳德 4.5 感觉 更快、更可控、更稳定.

增强安全性:迄今为止的最高调整
性能是一回事,但安全必须跟上。.
据 Anthropic 称,Claude Sonnet 4.5 是迄今为止最先进的型号。.
得益于克劳德增强的能力和严格的安全培训,Anthropic 在模型行为方面取得了重大改进,减少了谄媚、欺骗、权力追求和鼓励妄想等倾向。此外,Anthropic 还在防御及时注入攻击和减少内容错误分类方面取得了重大突破。.

Claude Sonnet 4.5 实验功能:与克劳德一起想象
与此同时,Anthropic 发起了一项 临时研究预览 人称 与克劳德一起想象. .在这种模式下,克劳德实时生成软件,没有任何功能或代码是预先编写的。所有内容都是在现场交互式创建和调整的。.
该预览仅适用于 克劳德-马克斯订户 在接下来的 5 天里。.
访问此处:https://claude.ai/imagine/

克劳德十四行诗 4.5》的市场竞争与战略意义
人类目前的估值为 $183 十亿, 截至今年 8 月,该公司的年收入已达 10 亿至 45 亿美元,其中大部分来自编码工具。但竞争非常激烈: OpenAI 和谷歌双子座 也在竞相主导开发者市场。.
值得注意的是,OpenAI 的年度开发者大会还有一周就要召开了。Anthropic 现在放弃 Claude 4.5 显然是在施加压力。.
Anthropic 的联合创始人兼首席科学家贾里德-卡普兰(Jared Kaplan)已经预言,一个更先进的 克劳德-奥普斯模型 将于今年晚些时候推出。.
过去的问题和恢复用户信心
并非一帆风顺。在过去的两个月里,用户指责 Claude 系列被 “愚弄 ”了。许多人反映推理、编码、格式和工具使用质量急剧下降,甚至连付费的 Max 订阅者也不例外。.
Anthropic 承认了两个独立的错误,并撤回了 Opus 4.1 更新,否认了削减成本的动机。但由于没有补偿或退款,用户的反弹在 GitHub 和 X 上蔓延,一些用户转而使用 Codex 等竞争对手的产品。.
发布 克洛德十四行诗 4.5 是 Anthropic 赢回他们的机会。它能否成功,将取决于未来几周该模型在实际使用中的表现。.

