GlobalGPT

雙子星3號對決ChatGPT 5.1:Google驚人躍進超越OpenAI頂尖模型

雙子座3號 vs ChatGPT 5.1

Google的新 雙子座3號專業版 這般巨大的飛躍,彷彿直接跳過整個世代——如同瞬間跨越了 2.5 Pro 並降落在某處附近 GPT‑5.1 (不是開玩笑)。.

在幾乎所有基準測試中,該模型如今都表現優於 GPT‑5.1 和 克勞德 4.5, 甚至在最嚴苛的AGI導向測試中表現出色,例如 ARC‑AGI‑2 和 “「最終人類考試。」” 在 AIME 2025 在數學基準測試中,啟用工具後獲得滿分100分,甚至打破了臭名昭著的 LiveCodeBench Pro 記錄——這項測試曾讓所有其他主要模型束手無策。.

在所有基準測試中,該模型現已超越GPT-5.1與Claude 4.5的表現

在用戶投票的人工智慧競技場排名中,情況亦是如此。. 伊隆·馬斯克的Grok 4.1 昨天才登上排行榜榜首——而今天,, 雙子座3號專業版 已經超越了它。.

在用戶投票的人工智慧競技場排名中,Gemini 3 Pro 已超越伊隆·馬斯克的 Grok 4.1

即使 山姆·奧特曼 和 馬斯克 忍不住對其表示敬意,公開點讚並祝賀Google團隊。.

就連山姆·奧特曼和馬斯克也不禁對gemini3點頭致意,兩人皆公開按讚並祝賀Google團隊。.
就連山姆·奧特曼和馬斯克也不禁對gemini3點頭致意,兩人皆公開按讚並祝賀Google團隊。.

目前,Gemini 3 Pro 僅限於 適用於 Google AI Ultra 訂閱用戶及付費 Gemini API 使用者. 但好消息是——作為一站式人工智慧平台,, GlobalGPT 已整合 Gemini 3 Pro, ,你可以 免費試用.

在 GlobalGPT 上使用 Gemini 3 Pro

從模擬作業系統介面到打造真實軟體

在內部測試期間,雙子星3號被觀察到模擬完整 WindowsmacOS, 以及 Linux 介面。起初人們以為這只是個前端設計展示——但結果證明它所產生的程式竟能實際運作。.

在一項示範中,它建構了一個完整的 樂高編輯器 從零開始,一次完成——設計介面、空間邏輯系統以及所有核心編輯功能。.

而這才只是開始。.

在另一項展示中,Google運用了 雙子座3號專業版 從零開始設計一款可遊玩的遊戲——並將其發布在YouTube上。該人工智慧實質上打造了一個迷你版本的 “「小型遊戲中心」” 獨自一人。.

更聰明的代理程式,真實世界的成果

Gemini 3 Pro 不僅是編碼強機——它在以下方面也遠勝於其他產品: 長期規劃與現實任務模擬.

在一項測試中,它模擬了經營自動販賣機業務整整一年的過程,將 $5,000 盈利 — 在所有測試型號中最高。.

自動販賣機-長凳 2:每款機型平均運行5次:Gemini 3 表現最優
由上至下: 雙子座3號專業版, 克勞德十四行詩 4.5 版,GPT-5.1,Gemini 2.5 Pro。.

以全公司規模啟動

Google宣布自今日起,將全面釋出 雙子星3系列 “「在公司規模上。」在第一天,Gemini是:

  • 完全整合於 Google 搜尋,
  • 給定一個獨立的 行動應用程式, 以及
  • 伴隨著嶄新的 人工智慧代理開發平台.

不僅如此——更強大的 雙子座3號「深思」“ 模式已然展開。.

至於如此巨大的能力躍升是如何實現的,Google研究副總裁 奧里奧爾·維尼亞爾斯 僅透露了一條線索:

“預訓練尚未完成——而後續訓練仍有大量改進空間。”

Google研究副總裁奧里奧爾·維尼亞爾斯透露,Gemini 3在訓練完成後仍有大量改進空間

雙子座的演變:從奠基到融合

回首往事, 雙子系列 宛如遊戲角色升級——每一代都修正前代的缺陷,接著為下一代重新打磨所有細節。.

  • 雙子座1號 奠定了基礎——串聯多模態理解與超長上下文。它成為首個能處理百萬詞元上下文的模型。.
  • 雙子座2號 獲得自主能力——在掌握海量資訊儲存後,它開始在知識體系中進行綜合與規劃,為真正的自主奠定基礎。 人工智慧代理程式 行為。.
  • 雙子座 2.5 聚焦於推理能力——Google新增了「思考引擎」,實現更深入的邏輯分析、連貫的思維鏈推理,以及類人化的逐步問題解決能力。.
  • 雙子座3號 是巔峰之作——不僅是粗暴的擴展,更是 深度整合 橫跨模態、推理與能動能力。其座右銘可為: “「你想像它。我讓它成真。」”

最值得注意的是,, 雙子星3號終於具備了人類感知能力 — 它「理解」你的意思,而不僅僅是你輸入的內容。.

您無需再為撰寫完美提示而焦慮。隨意拋出凌亂的請求,它便能洞悉您的意圖,讀懂上下文,並以簡潔直白的答案回應——絕無多餘贅詞。.

超速模式下的多模態能力

Gemini 3 的多模態理解能力已達全新境界。它現在能無縫整合處理文字、圖像、影片、音訊及程式碼等多元內容。.

例如,輸入完整的體育賽事影片,它便能總結戰術策略、分析球員技巧,甚至教你如何複製他們的動作。.

不難想像在不久的將來,你將能夠上傳自己的訓練影片—— 雙子座3號成為您的私人教練。.

在搜尋情境中,它不僅僅是簡單地傾倒連結。相反地,它將即時資訊組織成 互動式、可使用的內容 直接回答了你的問題。.

反重力:Google 全新代理程式優先開發平台

反重力:Google 全新代理程式優先開發平台

同步推出 雙子座3號專業版, Google 推出了一款 名為 反重力 — 一 代理優先 用於構建智能軟體系統的平台。.

其核心理念:

“「讓開發人員擺脫重複的編碼任務,賦予他們擔任高階架構師的能力。」”

在谷歌的演示過程中,反重力公司打造了一座 航班追蹤應用程式,一分鐘內即可完成.

不同於諸如 游標, 反重力技術將人工智慧代理提升至獨立運作環境,使其能全面存取 編輯終端機, 以及 瀏覽器. 代理程式能夠自主規劃、編碼、測試及驗證端到端軟體——所有操作皆代表使用者執行。.

嶄新的 經理視圖 讓使用者能同時協調多個代理程式,每個代理程式皆以半自主模式運作。.

反重力可同時協調多個代理人

Google在此展現的野心顯而易見:這不僅僅是工具——而是新一代的 人工智慧驅動的軟體工程.

開放生態系統與開發者熱潮

反重力技術不僅支援雙子星系列機型,亦相容第三方裝置如 GPT‑開源軟體 和 克勞德.

目前處於 公開預覽 和 免費使用, Gemini 3 Pro 提供「寬鬆的速率限制」。不出所料,開發者們在服務上線的瞬間便蜂擁而至,爭相「開採」免費使用額度。.

為提供背景資訊,, 克勞德·科德 已佔約 21% 佔Anthropic總收入的,以及 OpenAI 持續擴展以Codex為基礎的產品線。.

這不足為奇 人工智慧程式設計工具 正逐漸成為下一個重要戰場。.

歸根結柢

雙子星3 Pro代表著一個分水嶺時刻——這款機型不僅僅是 思考得更好, 但是 表現得更聰明. 結合反重力技術,Google顯然正昭示其意圖不僅要引領多模態競賽,更要主導智能代理時代。.

分享文章:

相關文章

GlobalGPT