克劳德-十四行诗 4.5：最强大的人工智能，30 多个小时不间断编码

2025-09-30
05:47
克劳德-麦肯齐
最后更新于 2026-06-24

Claude Sonnet 4.5 是 Anthropic 推出的 2025 版模型，专为编程、智能体、计算机应用、推理以及长期运行的软件任务而设计。.

此事之所以引发广泛讨论，是因为Anthropic将其定位为一个 领先的编码模型, 凭借在 SWE-bench 测试中表现优异、OSWorld 得分提升，以及据称在处理复杂的多步骤任务时能保持专注超过 30 小时的表现。.

顺便说一下，如果您想将 ChatGPT 与 双子座 和其他顶级人工智能机型的超低价格、, 全球 GPT 提供一体化的多功能体验。.

Claude Sonnet 4.5 与其他 AI 模型对比：编程、定价及最佳应用场景

模型	最适合	编程 / 智能体	背景/工作流程	定价说明	最佳用户
克洛德十四行诗 4.5	编程、智能体、计算机使用	非常强	长期运行的多步骤任务	通过 API，每百万个代币处理 $3 次输入 / $15 次输出	开发商和代理建筑商
克洛德十四行诗 4	常规编程和日常人工智能工作	强大	早期的第四代克劳德	优先级较低的传统选项	用户对比旧版与新版Claude
克洛德十四行诗 4.6	新一代Sonnet	当前的十四行诗选项	Anthropic列出的1M上下文窗口	查看当前服务商的定价	想要最新款 Sonnet 的用户
GPT-5	编程、推理、广泛的辅助任务	强大	广泛的生态系统支持	取决于服务提供商	用户将Claude与OpenAI进行比较
双子座 3 Pro	多模态推理与谷歌生态系统	强大	适用于多模态工作流	取决于服务提供商	需要谷歌式多模态工作的用户

Claude Sonnet 4.5 在 SWE-bench 验证排行榜上名列前茅

在 SWE-bench 验证 Claude Sonnet 4.5 在评估实际编程能力的测试中获得了 #1 行业中的亮点.

更疯狂的是？它可以保持专注，连续工作 连续30多个小时.

是的，与人类相比，人工智能又多了一项优势。.

Claude Sonnet 4.5 在 SWE-bench 验证排行榜上名列前茅

无与伦比的编码能力：像呼吸一样构建应用程序

例如，当受命构建一个类似 Slack 或 Teams 的聊天应用程序时，它能输出 一口气写了 11,000 行代码. .相比之下，老式的 Claude Opus 4 和 Codex 只能持续工作约 7 个小时。.

根据人类学、, Claude Sonnet 4.5 是目前世界上最强大的编码模型 - 在构建复杂代理、计算机操作、推理和数学方面取得了巨大进步。.

关于 操作系统世界, 在测试真实计算机任务的基准测试中，它的得分是 61.4%, 再次获得第一名。就在四个月前，Sonnet 4 还以 42.2% 的成绩遥遥领先，因此性能的飞跃是惊人的。.

Claude Sonnet 4.5 在 OSWorld 基准测试中取得 61.4% 的高分，用于执行实际计算机任务

新功能和工具升级克劳德十四行诗 4.5

Anthropic 在推出新机型的同时，还进行了多项重大升级：

检查点支持 终于可用了，可以随时保存进度并回滚到之前的状态。.
使用信息 现在可以直接在克劳德代码中使用 /使用.
本地 VS 代码插件 与 OpenAI 的 Codex 插件类似。.
克劳德代码 SDK 已正式更名为 克劳德代理 SDK, 加强代理建设能力。.
终端接口 经过重新设计，用户可以在启动时一目了然地看到以前的会话历史和新功能列表。.

Anthropic 甚至开放了他们用来构建克劳德代码的底层基础架构，称为 克劳德代理 SDK.

在长时间运行的任务中管理代理的内存，设计兼顾自主性和用户控制的权限系统，以及协调多个子代理以实现目标，这些都是构建和设计人工智能代理所面临的挑战。.

随着 克劳德代理 SDK, 现在，您可以利用这一基础设施来构建自己的产品。.

早期用户反应：爱恨交织

从今天起，开发人员可以拨打 Claude-sonnet-4-5 通过 Claude API。价格与 Sonnet 4 相同： 每百万代币 $3/$15.

早期的试用者已经留下了深刻的印象：

一位开发人员在试用后立即分享了他们的体验：

“Claude 4.5 Sonnet 一次运行就重构了我的整个代码库--25 次工具调用、3000 多行新代码和 12 个全新文件。它将所有内容模块化，打破了单一结构，并清理了杂乱无章的代码。结果并没有实际运行，但哇，它真的很优雅。这篇评论让人感觉既爱又无奈。.

Cursor 表示，他们观察到 Claude Sonnet 4.5 的尖端编程性能，尤其是在处理长时间任务方面的改进。这进一步解释了为什么许多 Cursor 用户选择 Claude 来解决最复杂的问题。.

知名评论员科技博主 Dan Shipper 指出，克劳德 4.5 感觉 更快、更可控、更稳定.

增强安全性：迄今为止的最高调整

性能是一回事，但安全必须跟上。.

据 Anthropic 称，Claude Sonnet 4.5 是迄今为止最先进的型号。.

得益于克劳德增强的能力和严格的安全培训，Anthropic 在模型行为方面取得了重大改进，减少了谄媚、欺骗、权力追求和鼓励妄想等倾向。此外，Anthropic 还在防御及时注入攻击和减少内容错误分类方面取得了重大突破。.

Claude Sonnet 4.5 实验功能：与克劳德一起想象

与此同时，Anthropic 发起了一项 临时研究预览 人称 与克劳德一起想象. .在这种模式下，克劳德实时生成软件，没有任何功能或代码是预先编写的。所有内容都是在现场交互式创建和调整的。.

该预览仅适用于 克劳德-马克斯订户 在接下来的 5 天里。.

访问此处：https://claude.ai/imagine/

克劳德十四行诗 4.5》的市场竞争与战略意义

人类目前的估值为 $183 十亿, 截至今年 8 月，该公司的年收入已达 10 亿至 45 亿美元，其中大部分来自编码工具。但竞争非常激烈： OpenAI 和谷歌双子座 也在竞相主导开发者市场。.

值得注意的是，OpenAI 的年度开发者大会还有一周就要召开了。Anthropic 现在放弃 Claude 4.5 显然是在施加压力。.

Anthropic 的联合创始人兼首席科学家贾里德-卡普兰（Jared Kaplan）已经预言，一个更先进的 克劳德-奥普斯模型 将于今年晚些时候推出。.

Claude Sonnet 4.5 现在还值得使用吗？

克劳德·索内特 4.5 是 还是值得一试 如果你主要用于编程、软件规划、技术写作或 AI 代理工作流。即使有更新的模型问世，Sonnet 4.5 仍然是一个有用的参考点，因为许多用户仍在搜索它、与之进行比较，并将其作为评估 Claude 编程性能的基准。.

如果你今天正在选择一个模型，实际的答案很简单：当你需要一个专注于编程的强大Claude模型时，就使用Claude Sonnet 4.5；而当你的任务依赖于最新的推理、多模态或上下文窗口能力时，则将其与更新版的Claude、GPT和Gemini模型进行比较。.

过去的问题和恢复用户信心

并非一帆风顺。在过去的两个月里，用户指责 Claude 系列被 “愚弄 ”了。许多人反映推理、编码、格式和工具使用质量急剧下降，甚至连付费的 Max 订阅者也不例外。.

Anthropic 承认了两个独立的错误，并撤回了 Opus 4.1 更新，否认了削减成本的动机。但由于没有补偿或退款，用户的反弹在 GitHub 和 X 上蔓延，一些用户转而使用 Codex 等竞争对手的产品。.

发布 克洛德十四行诗 4.5 是 Anthropic 赢回他们的机会。它能否成功，将取决于未来几周该模型在实际使用中的表现。.

常见问题

什么是克劳德·索内特 4.5？

Claude Sonnet 4.5 是 Anthropic 于 2025 年 9 月发布的一款人工智能模型，适用于编程、智能体、计算机操作、推理以及长期运行的软件任务。.

如何试用 Claude Sonnet 4.5？

您可以通过支持 Claude 的应用程序、Anthropic API，或提供多种 AI 模型访问权限的平台（包括 GlobalGPT 上的 Claude Sonnet 4.5 页面）来体验 Claude Sonnet 4.5。.

Claude Sonnet 4.5 适合编程吗？

是的。Anthropic 将 Sonnet 4.5 定位为一款领先的编码模型，尤其适用于多步骤代码生成、重构、调试以及基于代理的软件工作流。.

Claude Sonnet 4.5 的 API 名称是什么？

Anthropic的公告称，开发者可以使用 Claude-sonnet-4-5 通过 Claude API。.

Claude Sonnet 4.5 是免费的吗？

直接使用 API 需付费。如果目标是 克劳德十四行诗第4.5首免费试用, ，添加一段明确说明，解释GlobalGPT是否提供免费试用额度或限时试用权限，同时若该服务不可用，则不要承诺提供免费使用权限。.

克劳德 Sonnet 4.5 还是 Sonnet 系列的最新机型吗？

不。Anthropic 当前的 Sonnet 页面显示 Claude Sonnet 4.6 是最新一代的 Sonnet。请让本页面继续聚焦于 Sonnet 4.5，因为用户仍在搜索该版本，但请在页面中添加指向您 Claude Sonnet 4.6 页面的链接。.

分享帖子：