經過數週的揣測,, OpenAI 已正式發布 GPT-5.2, 此次更新的規模遠超預期。這絕非微調——GPT-5.2 實現了 OpenAI 5 系列模型史上最重大的推理能力飛躍,更標誌著 OpenAI 模型首次達到 人類專家表現 橫跨真實世界的知識工作任務。.
以下是OpenAI今日揭露的所有內容完整解析:效能基準測試、新功能、版本、定價、發布時程,以及為何GPT-5.2在內部被描述為「紅色警戒級別升級」。“
GPT-5.2正逐步推出——許多用戶仍無法使用。GlobalGPT已 已完全整合的GPT-5.2, ,讓您立即獲得 僅需30%即可獲得其完整效能,此為官方定價. 無須等待。毫無限制。.
若您想獲得 GPT-5.2 的效能表現,卻無須忍受延遲或高昂成本,GlobalGPT 就是您的最佳選擇。 最佳替代方案.

01|GPT-5.2 在 GDPval 測驗中達到人類專家水準
OpenAI 使用一個名為 GDP值, 設計用於測量 人工智慧效能 在實際工作任務中,例如:
- 製作簡報
- 文件分析
- 生成報告
- 建立試算表
- 複雜的寫作與規劃
在這些任務上,GPT-5.2 擁有超過 70%超越或匹敵人類專家的機率. 相較之下,前代GPT-5 Thinking的得分為38.8%。, Google 的 Gemini 3 Pro 達到53.3%,而Anthropic的Claude Opus 4.5則達到59.6%。.
GPT-5.2 打破了以往的紀錄

| 模型 | GDPval 勝/和率 |
|---|---|
| GPT-5.2 思考 | 70.9% |
| GPT-5.2 Pro | 74.1% |
| GPT-5 思考 | 38.8% |
| Google Gemini 3 Pro | 53.3% |
| 克勞德作品集 4.5 | 59.6% |
OpenAI 將 GPT-5.2 命名為:
“「我們首款達到人類水平的模型——」專家級 表現。”
這是個重大的里程碑——它將改變「人工智慧生產力」在實際日常應用中的定義。.
02|ARC-AGI-2:純粹推理能力實現三倍躍進
若GDPval測試「工作能力」,則 ARC-AGI-2 基準測試「智能」。“
它測量抽象推理能力,無法透過死記硬背或暴力破解來解決。.
三週前,當Gemini 3 Pro問世時,Google震撼了整個AI界。 31.1%.

GPT-5.2 的思考已遠遠超越了那點:
| 模型 | ARC-AGI-2 得分 |
|---|---|
| GPT-5.2 思考 | 52.9% |
| GPT-5.2 Pro | 54.2% |
| GPT-5.1 思考 | 17.6% |
單一版本從17.6%躍升至52.9%的幅度前所未見。.
這是OpenAI歷史上最大的推理能力提升。.
而這正是 不是 像GPT-6這樣的「主要版本」——它被標示為「次要更新」。“
OpenAI顯然是認真的。.
03|程式設計、數學與多模態:全面性的大幅提升

GPT-5.2 不僅思考能力更優異 — 效果更好橫跨每個領域.
✔ 程式設計(SWE Bench Pro)
- 55.6% 在 SWE Bench Pro 上
- 80% 經 SWE 驗證
四種語言,更艱鉅的難題,更高的可靠性。.
✔ 數學

關於AIME 2025(一場真實的美國數學競賽):
- GPT-5.2 思考能力評分達100% — 滿分.
- 這正是 史上首個AI模型 在沒有工具的情況下達成此目標。.
✔ 多模態理解

錯誤率下降了 50%, 根據OpenAI的說法。.
- 查克斯維推理: 88.7%
- ScreenSpot Pro: 86.3%
GPT-5.2 現已顯著提升其解讀能力:
- 圖表
- 科學圖表
- 使用者介面截圖
- 技術文件
✔ 幻覺
減少了 30%.
OpenAI仍警告:
“GPT-5.2並非完美無缺。對於任何重要事項,請務必核實答案。”
罕見而令人耳目一新的誠實。.
04|GPT-5.2 三種版本(今日全面開放)

GPT-5.2 提供三種專業版本:
🔥 GPT-5.2 即時版 — 最快速
- 專為日常聊天優化
- 更清晰
- 更自然的反應
- 快於5.1
🧠 GPT-5.2 思考模式 — 深度推理
對於需要實際結構化思考的任務:
- 編碼
- 數學
- 規劃
- 分析
- 文件理解
💎 GPT-5.2 Pro — 最聰明,最慢
- OpenAI迄今為止所建構的最高精度模型
- 適用於研究、複雜推理及企業工作流程
發布
- Plus/Pro/Team/Enterprise: 今日推出
- 免費 & ChatGPT Go: 明日可供使用
- GPT-5.1 將成為「舊版模型」,並將於三個月後移除
API 定價
輸入:$1.75 / 百萬個代幣輸出:$14 / 百萬個代幣
~40% 的成本高於 GPT-5.1 —— 但整體效能更優異。.
05|內部代號:「大蒜」“
OpenAI昨日以山姆·阿特曼在廚房煎蒜的照片預告了新產品的發布。.
現在我們知道原因了:
GPT-5.2 的內部代號是 “「大蒜。」”
OpenAI執行長證實:
- GPT-5.2已開發數月
- 但是 紅色警報 協助推動整個公司重新聚焦於核心品質
- 非必要項目被降級處理
- OpenAI計劃於一月解除「紅色警戒」
人工智慧競賽的競爭程度顯然已達到空前激烈。.
最終評斷:GPT-5.2 是迄今為止最重要的 5 系列更新
相較於所有先前 5.x 版本,GPT-5.2 帶來:
✔ 在真實工作任務中展現與人類專家同等的表現
✔ 推理領域的歷史性飛躍
✔ 數學滿分
✔ 更優異的程式碼可靠性
✔ 顯著提升的多模態理解能力
✔ 減少幻覺
✔ 三種專業版本,滿足不同需求
這並非GPT-6——但就實用性與日常生產力而言,它或許更具影響力。.
GPT-5.2 Thinking and Pro 將改變人們:
- 分析文件
- 解決數學與程式碼
- 作出決定
- 進行研究
- 建立簡報與報告
「人工智慧驅動的工作」的標準門檻已正式提高。.

