已加入收藏
已取消收藏
menu
帳號頭像 帳號選單下拉箭頭
/
熱搜內容
現正閱讀
博士生等級的AI助理來了!Google Gemini 3 Pro 四大功能一次看
畫重點
段落筆記
新增筆記
「請稍等」英文別直接中翻英說please wait a minute!一次掌握,常用的電話對談英文
0
/500
不公開分類 公開分類
儲存
至頂箭頭

財經 | 產業動態

博士生等級的AI助理來了!Google Gemini 3 Pro 四大功能一次看

博士生等級的AI助理來了!Google Gemini 3 Pro 四大功能一次看
(來源:Google)
撰文者:商周編輯處 整理
商周頭條 2025/11/19
摘要

Google於11月18日正式發表Gemini 3 Pro,官方將其定義為Google有史以來最強大的AI模型。除了基礎跑分的全面提升,這次更新最關鍵的突破,在於引入了深度思考與「代理人(Agent)」能力。

如果說之前的AI競賽是在拚誰答得更快,Gemini 3 Pro要比的就是誰思考得更深。以下是新模型的四大核心亮點:

1. 數據霸榜:正面擊敗 GPT-5.1

根據Google DeepMind公布的技術報告,Gemini 3 Pro在多項關鍵基準測試中擊敗了目前的頂級對手:

LMArena Leaderboard(聊天機器人競技場):達到1501 Elo分,位居世界第一,超越長期霸榜的OpenAI GPT-5.1 和 Anthropic 的 Claude Sonnet 4.5。

廣告-請繼續往下閱讀

Humanity's Last Exam(HLE,人類最終考試):這是一個測試 AI 極限推理的超難題庫。Gemini 3 Pro得分37.5%(前一代僅 21.6%);若開啟Deep Think模式,得分更飆升至41%。

數學與科學(GPQA Diamond):得分91.9%,展現了博士級別的科學問答能力。

程式設計(SWE-Bench Verified):在解決真實GitHub軟體問題的測試中表現優異,特別是在 Agentic Coding(代理編碼) 方面有顯著突破。

2. 兩大殺手級功能:Deep Think與Vibe Coding

過去的AI容易產生幻覺,往往是因為急於預測下一個字。Gemini 3 Pro引入了類似人類「系統 2 思維」的Deep Think模式。

廣告-請繼續往下閱讀

面對複雜的數學題或邏輯陷阱時,它不會急著回答,而是先進行內部的多步驟推演、自我反駁與規劃。這種「先想再說」的機制,讓它在數學競賽題(如 AIME 2025)中的準確率高達95%,對於需要高精準度的金融分析或學術研究而言,是質的飛躍。

而對工程師與設計師來說,Vibe Coding則是本次最實用的更新。

過去用AI寫程式需要精確指令,現在Gemini 3 Pro能理解模糊的氛圍與設計感。你只需畫一個簡單草圖,或描述「我想要一個Cyberpunk 風格的 3D 儀表板」,它就能生成包含HTML、CSS、React甚至WebGL的完整程式碼,且視覺還原度極高。它不再只是寫程式碼的機器,更像是一位懂設計的資深前端工程師。

3. 從對話機器人走向「代理人 (Agent)」

Gemini 3 Pro最大的野心,在於從聊天機器人進化為Agent(代理人)。憑藉原生多模態能力,它能像人類一樣即時理解視訊串流,並主動操作工具。在開發環境中,它可以連接終端機,主動執行 git 指令查找錯誤並修復代碼。這代表AI不再只是給予建議,而是能獲得授權後,直接幫你把工作完成。

4. 百萬級上下文窗口

Gemini 3 Pro延續了100萬token起跳的上下文窗口優勢,並具備「大海撈針」能力,能在海量文件中精準提取單一資訊。

AI的「博士生特助」時代

Gemini 3 Pro對使用者來說,可能不再只是一個讀過很多書的圖書館管理員,而是一位「能深度思考、理解抽象需求、並動手解決問題的博士級特助」。

責任編輯:林易萱

OpenAI Google ChatGPT Gemini 3 Pro
商周頭條
商周頭條
商業周刊編輯部
展開箭頭

除了每個星期四,熱騰騰準時上架的《商業周刊》以外,「商周頭條」將提供你來自商周記者第一線的採訪觀察、更即時的時事話題分析,與更深度的觀點分享。

廣告-請繼續往下閱讀
FOLLOW US
加入商周LINE好友 秒懂新商業
加入好友