经过几周的猜测, OpenAI 正式发布 GPT-5.2, GPT-5.2的更新远远超出了所有人的预期。这不仅仅是一次小小的改进--GPT-5.2 带来了 OpenAI 5 系列模型历史上最大的推理跳跃,标志着 OpenAI 模型首次达到了 人类-专家绩效 跨越现实世界的知识工作任务。.
以下是 OpenAI 今天透露的所有信息的完整分解:性能基准、新功能、版本、定价、发布时间表,以及 GPT-5.2 为何在内部被称为 “红色代码级升级”。”
GPT-5.2 正在缓慢推出,许多用户仍无法访问。GlobalGPT 已 已完全集成 GPT-5.2, 让您立即 只需官方价格的 30% 即可获得其全部功能. .无需等待。没有限制。.
如果您想获得 GPT-5.2 性能,又不想耽误时间或增加成本,GlobalGPT 就是您的最佳选择。 最佳选择.

01|GPT-5.2 在 GDPval 上达到人类专家水平
OpenAI 使用一种名为 GDPval, 旨在测量 人工智能性能 在现实的工作任务中,例如
- 制作PPT
- 分析文件
- 生成报告
- 建立电子表格
- 复杂的写作和规划
在这些任务中,GPT-5.2 超过了 70% 优于或匹配人类专家的几率. .相比之下,之前的 GPT-5 Thinking 得分为 38.8%、, 谷歌双子座 3 Pro 达到 53.3%,Anthropic 的 Claude Opus 4.5 达到 59.6%。.
GPT-5.2 破纪录

| 模型 | GDPval 胜率/平局率 |
|---|---|
| GPT-5.2 思考 | 70.9% |
| GPT-5.2 Pro | 74.1% |
| GPT-5 思考 | 38.8% |
| 谷歌双子座 3 Pro | 53.3% |
| 克劳德作品 4.5 | 59.6% |
OpenAI 调用 GPT-5.2:
“我们的第一个模型达到了人类专家级 业绩”。”
这是一个巨大的里程碑,它改变了 “人工智能生产力 ”在日常实际应用中的含义。.
02|ARC-AGI-2:纯推理能力的 3 倍飞跃
如果 GDPval 测试的是 “工作能力”,那么 ARC-AGI-2 基准测试 “智力”。”
它衡量的是抽象推理能力,无法通过死记硬背或蛮力解决。.
三周前,Google 的双子座 3 Pro 一经推出就震惊了人工智能世界。 31.1%.

GPT-5.2 的思维已经超越了这一点:
| 模型 | ARC-AGI-2 评分 |
|---|---|
| GPT-5.2 思考 | 52.9% |
| GPT-5.2 Pro | 54.2% |
| GPT-5.1 思考 | 17.6% |
在一个版本中从 17.6% 跃升到 52.9% 是前所未有的。.
这是 OpenAI 历史上最大的推理改进。.
这就是 不 像 GPT-6 这样的 “主要版本”--它被标记为 “次要更新”。”
OpenAI 显然是认真的。.
03|编程、数学和多模态:处处都有巨大进步

GPT-5.2 不仅考虑得更好 - 效果更好跨领域.
✔ 编程(SWE 工作台专业版)
- 55.6% 关于 SWE 工作台专业人员
- 80% 在 SWE 工作台上验证
四种语言,更难的问题,更高的可靠性。.
✔ 数学

关于 AIME 2025(真正的美国数学竞赛):
- GPT-5.2 思维得分 100% - 满分.
- 它是 史上首个人工智能模型 无需工具即可实现。.
✔ 多模态理解

错误率下降了 50%, OpenAI 表示。.
- CharXiv 推理: 88.7%
- ScreenSpot Pro 86.3%
现在,GPT-5.2 的解释能力明显提高:
- 图形
- 科学图表
- 用户界面截图
- 技术文件
✔ 幻觉
减少 30%.
OpenAI 仍会发出警告:
“GPT-5.2并不完美。对于重要的事情,请验证答案”。”
难得的诚实,令人耳目一新。.
04|三个版本的 GPT-5.2(全部于今日发布)

GPT-5.2 有三个专门版本:
🔥 GPT-5.2 瞬时 - 最快
- 针对日常聊天进行了优化
- 更清晰
- 更自然的反应
- 比 5.1 更快
🧠 GPT-5.2 思考--深入推理
对于需要实际结构化思考的任务:
- 打码
- 算术
- 规划
- 分析
- 文件理解
💎 GPT-5.2 Pro - 最智能、最慢速
- OpenAI 迄今为止建立的精度最高的模型
- 研究、复杂推理和企业工作流程的理想之选
发布
- Plus / Pro / Team / Enterprise: 今日推出
- 免费 & ChatGPT Go: 明天发售
- GPT-5.1 成为 “遗留型号”,将在 3 个月内删除
应用程序接口定价
输入:$1.75 / 百万代币
输出:$14 / 百万代币
~40% 比 GPT-5.1 贵,但总体效率更高。.
05|内部代号:“大蒜”
OpenAI 昨天发布了山姆-奥特曼(Sam Altman)在厨房里炒大蒜的照片。.
现在我们知道原因了:
GPT-5.2 的内部代号是 “大蒜”
OpenAI 的应用首席执行官证实了这一点:
- GPT-5.2 已开发数月
- 但是 红色代码 帮助推动整个公司重新关注核心质量
- 非必要项目不再列为优先事项
- OpenAI 力争在一月解除 “红色条规
人工智能的竞争显然是有史以来最激烈的。.
最终结论GPT-5.2 是迄今为止最重要的 5 系列更新
与之前的所有 5.x 版本相比,GPT-5.2 带来了
✔ 人与专家在实际工作任务中的表现
✔ 推理能力的历史性飞跃
✔ 数学满分
✔ 编码可靠性大大提高
✔ 显著提高多模态理解能力
✔ 减少幻觉
✔ 三个专业版本满足不同需求
这不是 GPT-6,但对于实际的日常工作效率来说,它可能更具影响力。.
GPT-5.2 思维和专业将改变人们的方式:
- 分析文件
- 解决数学和代码
- 作决定
- 进行研究
- 制作演示文稿和报告
人工智能驱动工作 “的标准已正式提高。.

