ChatGPT 5.2：3 倍智能，全面满分 - 王者归来

2025-12-12
00:14
克劳德-麦肯齐
最后更新日期 2025-12-19

经过几周的猜测, OpenAI 正式发布 GPT-5.2, GPT-5.2的更新远远超出了所有人的预期。这不仅仅是一次小小的改进--GPT-5.2 带来了 OpenAI 5 系列模型历史上最大的推理跳跃，标志着 OpenAI 模型首次达到了 人类-专家绩效 跨越现实世界的知识工作任务。.

以下是 OpenAI 今天透露的所有信息的完整分解：性能基准、新功能、版本、定价、发布时间表，以及 GPT-5.2 为何在内部被称为 “红色代码级升级”。”

GPT-5.2 正在缓慢推出，许多用户仍无法访问。GlobalGPT 已已完全集成 GPT-5.2, 让您立即只需官方价格的 30% 即可获得其全部功能. .无需等待。没有限制。.

如果您想获得 GPT-5.2 性能，又不想耽误时间或增加成本，GlobalGPT 就是您的最佳选择。最佳选择.

立即试用 GPT-5.2 >

01｜GPT-5.2 在 GDPval 上达到人类专家水平

OpenAI 使用一种名为 GDPval, 旨在测量人工智能性能在现实的工作任务中，例如

制作PPT
分析文件
生成报告
建立电子表格
复杂的写作和规划

在这些任务中，GPT-5.2 超过了 70% 优于或匹配人类专家的几率. .相比之下，之前的 GPT-5 Thinking 得分为 38.8%、, 谷歌双子座 3 Pro 达到 53.3%，Anthropic 的 Claude Opus 4.5 达到 59.6%。.

GPT-5.2 破纪录

模型	GDPval 胜率/平局率
GPT-5.2 思考	70.9%
GPT-5.2 Pro	74.1%
GPT-5 思考	38.8%
谷歌双子座 3 Pro	53.3%
克劳德作品 4.5	59.6%

OpenAI 调用 GPT-5.2：

“我们的第一个模型达到了人类专家级业绩”。”

这是一个巨大的里程碑，它改变了 “人工智能生产力 ”在日常实际应用中的含义。.

02｜ARC-AGI-2：纯推理能力的 3 倍飞跃

如果 GDPval 测试的是 “工作能力”，那么 ARC-AGI-2 基准测试 “智力”。”
它衡量的是抽象推理能力，无法通过死记硬背或蛮力解决。.

三周前，Google 的双子座 3 Pro 一经推出就震惊了人工智能世界。 31.1%.

GPT-5.2 的思维已经超越了这一点：

模型	ARC-AGI-2 评分
GPT-5.2 思考	52.9%
GPT-5.2 Pro	54.2%
GPT-5.1 思考	17.6%

在一个版本中从 17.6% 跃升到 52.9% 是前所未有的。.
这是 OpenAI 历史上最大的推理改进。.

这就是不像 GPT-6 这样的 “主要版本”--它被标记为 “次要更新”。”
OpenAI 显然是认真的。.

03｜编程、数学和多模态：处处都有巨大进步

GPT-5.2 不仅考虑得更好 - 效果更好跨领域.

✔ 编程（SWE 工作台专业版）

55.6% 关于 SWE 工作台专业人员
80% 在 SWE 工作台上验证

四种语言，更难的问题，更高的可靠性。.

✔ 数学

关于 AIME 2025（真正的美国数学竞赛）：

GPT-5.2 思维得分 100% - 满分.
它是 史上首个人工智能模型 无需工具即可实现。.

✔ 多模态理解

错误率下降了 50%, OpenAI 表示。.

CharXiv 推理： 88.7%
ScreenSpot Pro 86.3%

现在，GPT-5.2 的解释能力明显提高：

图形
科学图表
用户界面截图
技术文件

✔ 幻觉

减少 30%.

OpenAI 仍会发出警告：

“GPT-5.2并不完美。对于重要的事情，请验证答案”。”

难得的诚实，令人耳目一新。.

04｜三个版本的 GPT-5.2（全部于今日发布）

GPT-5.2 有三个专门版本：

🔥 GPT-5.2 瞬时 - 最快

针对日常聊天进行了优化
更清晰
更自然的反应
比 5.1 更快

🧠 GPT-5.2 思考--深入推理

对于需要实际结构化思考的任务：

打码
算术
规划
分析
文件理解

💎 GPT-5.2 Pro - 最智能、最慢速

OpenAI 迄今为止建立的精度最高的模型
研究、复杂推理和企业工作流程的理想之选

发布

Plus / Pro / Team / Enterprise： 今日推出
免费 & ChatGPT Go： 明天发售
GPT-5.1 成为 “遗留型号”，将在 3 个月内删除

应用程序接口定价

输入：$1.75 / 百万代币
输出：$14 / 百万代币

~40% 比 GPT-5.1 贵，但总体效率更高。.

05｜内部代号：“大蒜”

OpenAI 昨天发布了山姆-奥特曼（Sam Altman）在厨房里炒大蒜的照片。.

现在我们知道原因了：

GPT-5.2 的内部代号是 “大蒜”

OpenAI 的应用首席执行官证实了这一点：

GPT-5.2 已开发数月
但是 红色代码 帮助推动整个公司重新关注核心质量
非必要项目不再列为优先事项
OpenAI 力争在一月解除 “红色条规

人工智能的竞争显然是有史以来最激烈的。.

最终结论GPT-5.2 是迄今为止最重要的 5 系列更新

与之前的所有 5.x 版本相比，GPT-5.2 带来了

✔ 人与专家在实际工作任务中的表现
✔ 推理能力的历史性飞跃
✔ 数学满分
✔ 编码可靠性大大提高
✔ 显著提高多模态理解能力
✔ 减少幻觉
✔ 三个专业版本满足不同需求

这不是 GPT-6，但对于实际的日常工作效率来说，它可能更具影响力。.

GPT-5.2 思维和专业将改变人们的方式：

分析文件
解决数学和代码
作决定
进行研究
制作演示文稿和报告

人工智能驱动工作 “的标准已正式提高。.

分享帖子：

ChatGPT 5.2：3 倍智能，全面满分 - 王者归来