Google 推出了能自主推理複雜問題的「思考模型」Gemini 2.5 正式版,並展示了將速度與成本效益極大化的全新模型。
在與人工智能 (AI) 對話時,有時會突然產生這樣的疑問:「這傢伙是真的理解我問題的意圖才說話的嗎?還是只是以極快的速度拼湊出看似合理的答案?」如果說之前的 AI 較接近後者,那麼現在正開啟一個真正像人類一樣經過「思考」後再回答的時代。
Google 最近正式宣佈擴展其尖端 AI 模型 Gemini 系列的全新進化版——「Gemini 2.5」系列。據說它不僅比以前更聰明,現在還具備了在解決複雜問題前先進行深入思考的能力。這個來到我們身邊的聰明助手具體發生了哪些變化?MindTickleBytes 為您簡單親切地整理了核心內容。Gemini 2.5: Updates to our family of thinking models
為什麼這對我們很重要?
| 當我們使用智慧型手機或電腦時,最期待的是什麼?大概是「能快速、準確,且盡可能便宜地完成我交辦的工作」。這正是 Google 大規模擴展 Gemini 2.5 系列的原因。[Google DeepMind Expands Gemini AI Models to… | HARU-AI.BLOG](https://haru-ai.blog/en/daily-news-en/gemini-ai-expansion-en/) |
如果說過去的 AI 模型更傾向於展示龐大體積與複雜結構的「研究型」性質,那麼這次的 Gemini 2.5 系列則將所有焦點放在了實際的「實用性」上。企業在處理海量數據時能大幅減輕成本負擔,而開發服務的工程師則能根據情況直接調節 AI 思考的深度。打個比方,如果說之前的 AI 是性能卓越但油耗不佳的超級跑車,那麼現在它已進化成能根據情況自由調節速度與油耗的尖端油電混合轎跑。 Gemini 2.5 model family expands
輕鬆理解:AI 也需要「思考的時間」
這次發表中最受矚目的關鍵字正是「思考模型 (Thinking model)」。AI 會思考究竟意味著什麼?Gemini 2.5: Our newest Gemini model with thinking
1. 脫口而出的回答 vs 慎重沉穩的一言
請想像一下。 您正在解一道困難的數學題,旁邊的朋友連題目都還沒看完就大喊出答案。雖然有時會運氣好答對,但如果是帶有陷阱的複雜問題,答錯的機率會非常高吧?相反地,另一位朋友會先閉上眼睛仔細分析題目結構,然後再慢慢地邏輯清晰地解釋:「因為是這樣的原理,所以答案是這個。」
Gemini 2.5 就像後者那位朋友。在說出答案前,它會先經歷內部的「推理過程」。透過這種方式,它在編寫複雜的程式碼或回答需要高度邏輯能力的問題時,能給出比以前更準確、更有深度的回答。Gemini 2.5: Updates to our family of thinking models
2.名為「思考預算 (Thinking Budget)」的驚人概念
更有趣的一點是,使用者可以親自決定 AI 要思考多深。Google 將此稱為「思考預算 (Thinking Budget)」。Gemini 2.5: Updates to our family of thinking models
簡單來說,對於像「推薦今天的午餐菜單」這種輕鬆的問題,可以讓它縮短思考時間並超高速回答;而對於像「在數千行複雜代碼中尋找安全漏洞」這種重大的任務,則可以投入充足的預算(時間與資源)讓它深思熟慮。這與我們快速處理瑣碎急件,但在做人生重大決定時會熬夜思考好幾天非常相似。
現狀:Gemini 2.5 家族的成員們
Gemini 是繼 Google 之前推出的 LaMDA 和 PaLM 2 之後,Google 最強大的 AI 家族。Gemini (language model) - Wikipedia 透過這次擴展,成員們根據各自的角色進行了更細緻的劃分,讓我們來看看有哪些模型吧?
- Gemini 2.5 Pro: 這是智商最高、多才多藝的老大哥。現在已順利結束試驗運營 (Preview) 階段,進入任何人都能正式使用的狀態 (GA, General Availability)。其複雜推理與編碼能力堪稱一絕。Google’s Gemini AI family updated with stable 2.5 Pro, super-efficient …
-
Gemini 2.5 Flash: 顧名思義,像光一樣快速且高效。這是在性能與價格之間取得完美平衡的模型,在需要在短時間內處理極大量任務時最能大放異彩。[Models Gemini API Google AI for Developers](https://ai.google.dev/gemini-api/docs/models) - Gemini 2.5 Flash-Lite: 這是這次新加入的小弟模型。它是 Gemini 2.5 家族中最快且費用最低的,非常適合預算有限的個人開發者或需要重複簡單任務的場景。Gemini 2.5 model family expands
- Gemini 2.5 Flash Image: 這是專門用於繪製精美圖像而非僅僅文字的模型。每 100 萬個 token 約花費 30 美元,換算下來,生成一張照片大約只需要約 0.039 美元(約 1.3 台幣)。Introducing Gemini 2.5 Flash Image, our state-of-the-art image model
特別是所有這些模型都預設搭載了「多模態 (Multimodal,同時理解與處理文字、圖像、音訊等各種形式數據的能力)」功能,應用範圍極其廣泛。Gemini 2.5: Pushing the Frontier with Advanced Reasoning, Multimodality …
未來展望:我們將面對的明天
Google 這次的舉措不僅僅是製造性能優良的機器。Gemini 2.5 是人工智能向「代理系統 (Agentic systems,能自主設定目標並使用工具完成複雜工作的系統)」進化的核心跳板。
參考資料
- Gemini (language model) - Wikipedia
- Gemini 2.5 model family expands
-
[We’re expanding our Gemini 2.5 family of models Hanzhao…](https://www.linkedin.com/posts/magical_were-expanding-our-gemini-25-family-of-activity-7340820864948457472-Jyi6) -
[Google DeepMind Expands Gemini AI Models to… HARU-AI.BLOG](https://haru-ai.blog/en/daily-news-en/gemini-ai-expansion-en/) -
[Google unveils a next-gen family of AI reasoning models TechCrunch](https://techcrunch.com/2025/03/25/google-unveils-a-next-gen-ai-reasoning-model/) -
[Models Gemini API Google AI for Developers](https://ai.google.dev/gemini-api/docs/models) - Gemini 2.5: Our newest Gemini model with thinking
- Gemini 3 — Google DeepMind
- Introducing Gemini 2.5 Flash Image, our state-of-the-art image model
- Expanding Gemini 2.5 Flash and Pro capabilities - Google Cloud
- Gemini 2.5: Updates to our family of thinking models
- Gemini 2.5: Pushing the Frontier with Advanced Reasoning, Multimodality …
- Google’s Gemini AI family updated with stable 2.5 Pro, super-efficient …
- Gemini 2.5 Pro
- Gemini 2.5 Flash-Lite
- Gemini 2.5 Image
- 回應速度絕對會變快
- 在給出答案前經過推理過程以提高準確度
- 無需網絡連接即可運作
- 約 0.39 美元
- 約 0.039 美元
- 免費