Google 新一代 AI Gemini 2.5 透過內部推理過程提供更準確的答案,並全新推出了兼具高性能與低成本優勢的 Flash-Lite 模型。
請想像一下。當您收到一個非常困難的數學題時,您會直接說出腦海中浮現的第一個數字嗎?還是會在紙上寫下解題過程,邊想著「啊,這題應該這樣解」,在自我思考後才說出答案呢?到目前為止,大多數的 AI 都更接近前者。它們在收到問題後,會立即給出統計上最像樣的答案。然而,Google 全新推出的 AI —— Gemini 2.5,開始像後者一樣先整理「思考」、衡量邏輯後再給出答案。Gemini 2.5: Our newest Gemini model with thinking
由 Google DeepMind 開發的 Gemini 是一款多模態(Multimodal)人工智慧,能同時理解並處理文本、圖片、音訊、影片等多種形式的信息。Gemini: A Family of Highly Capable Multimodal Models 它也是繼承了過去 Google AI 模型 LaMDA 和 PaLM 2 技術實力的強大後繼者。Gemini (language model) - Wikipedia 透過這次更新,Gemini 2.5 已超越單純的「回答機器」,進化為具備自我推理能力的「思考型模型」。
為什麼這很重要?
我們在使用 AI 時最感到困惑的時刻,莫過於 AI 非常自信地將錯誤信息當作事實說出來。這在專業術語中被稱為幻覺現象(Hallucination)。像 Gemini 2.5 這樣的「思考型模型」能顯著減少此類錯誤,因為它在輸出答案前會經過內部不可見的推理過程。Gemini 2.5: Updates to our family of thinking models – ONMINE
| 簡單來說,在 AI 按下回答按鈕之前,它會先花時間自問自答並審核:「我的邏輯對嗎?下一步有沒有需要考慮的變數?」Gemini 2.5: Updates to our family of thinking models 打個比方,就像一個原本急於回答的孩子,現在變得沉著冷靜,會先讀完題目、確認解題過程後再開口。這種內部的「思考過程」在解決複雜數學問題、高難度程式編寫以及龐大數據分析等需要仔細執行多個步驟的任務中,最能發揮其真正的價值。[Gemini thinking | Gemini API | Google AI for Developers](https://ai.google.dev/gemini-api/docs/thinking) |
更深入理解:AI 的「思考預算」
Gemini 2.5 令人驚嘆的功能之一是使用者可以親自為 AI 設定「思考預算(Thinking Budget)」。Gemini 2.5: Updates to our family of thinking models 這是一種指導方針,決定 AI 為了縮小特定問題的差距,要投入多少時間和資源進行「思考」。
如果將這比作料理:
- 煮簡單的泡麵時(簡單的問題): 不需要花時間思考複雜的食譜。這時可以將「思考預算」設低,迅速獲得答案即可。
- 為重要客人準備五道式料理時(複雜的問題): 必須精密計算菜單的搭配、食材處理順序到烹飪時間。這種情況下,可以設定較高的「思考預算」,引導 AI 進行足夠深度的思考並給出最佳結果。
如此一來,Gemini 2.5 能根據情況的輕重緩急調整思考深度,非常高效。Gemini 2.5: Updates to our family of thinking models
Gemini 2.5 家族介紹:從 Pro 到 Flash-Lite
Gemini 2.5 根據使用者的目的和環境分為三個模型:Gemini (language model) - Wikipedia
- Gemini 2.5 Pro: 擔任最聰明的「大腦」角色。在複雜推理和編寫程式能力方面,它以壓倒性優勢刷新了現有的性能衡量標準(基準測試)分數,目前已提供正式版本。Gemini 2.5: Our newest Gemini model with thinking, Gemini 2.5: Updates to our family of thinking models - Solega Blog
- Gemini 2.5 Flash: 在速度與效率之間取得平衡。透過本次更新,其「代理型工具調用(Agentic tool use)」能力得到了大幅改善。Continuing to bring you our latest models, with an improved Gemini 2.5 Flash and Flash-Lite release 這意味著 AI 不僅僅是回答問題,它能主動尋找所需工具並直接執行複雜連鎖任務的能力有了飛躍式的發展。
- Gemini 2.5 Flash-Lite: 這是本次新加入的小型模型。在維持性能的同時,極大化地降低了使用成本,目前正處於預覽階段並展現其潛力。Gemini 2.5: Updates to our family of thinking models
這些模型就像根據不同情況選擇的交通工具。搬運重物時選擇馬力強大的大卡車(Pro),在城市中快速移動時選擇機動性好的機車(Flash),而低成本頻繁搬運輕量物品時則選擇電動滑板車(Flash-Lite)。
現狀與未來展望
Google 研究團隊正透過 Flash 模型系列持續擴展「帕累托前沿(Pareto frontier)」。Gemini 2.5: Updates to our family of thinking models - Solega Blog 簡單來說,就是為了打造「更聰明、更便宜且更快」的 AI,而不斷地推開技術極限。
| 目前,Gemini 2.5 Pro 和 Flash 已達到一般使用者可以穩定使用的正式服務階段(General Availability)。[Gemini 2.5: Updates to our family of thinking models… | TechNews](https://news-tech.io/en/news/gemini-25-updates-to-our-family-of-thinking-models), Gemini 2.5: Updates to our family of thinking models 這預示著我們很快就能在所使用的無數應用程式和服務中,親身體驗 AI 的「思考能力」。 |
Gemini 2.5 的出現顯示出 AI 正超越單純的助手,進化為能理解我們意圖並代辦複雜任務的真正「代理人(Agent)」。Continuing to bring you our latest models, with an improved Gemini 2.5 Flash and Flash-Lite release 除了「推薦今天的晚餐菜單」這種問題,未來很快就能實現諸如「考慮我的預算和喜好編排一週食譜,並將缺少的食材放入線上購物車」這類複雜請求,由 AI 自行思考處理的世界。Continuing to bring you our latest models, with an improved Gemini 2.5 Flash and Flash-Lite release
各位讀者在下次與 AI 對話時,不妨想一想在對話的另一端,AI 正為了尋找最佳答案而努力理清「思考線索」的情景。
AI 的視角
MindTickleBytes AI 記者觀點: Gemini 2.5 標誌著 AI 正式踏入了「邏輯思考」的領域,而不僅僅是信息的排列組合。特別是讓使用者能調整 AI 思考程度的「思考預算」功能,是非常聰明的一點,顯示出 AI 技術在人類控制下正朝著更實用、更經濟的方向進化。現在,AI 不再只是追求「快速」回答,而是學會了為了「正確」答案而停下來思考。
參考資料
- Gemini (language model) - Wikipedia
- Gemini 2.5: Our newest Gemini model with thinking
- Gemini 2.5: Updates to our family of thinking models – ONMINE
- Gemini 2.5: Updates to our family of thinking models - Solega Blog
-
[Gemini 2.5: Updates to our family of thinking models… TechNews](https://news-tech.io/en/news/gemini-25-updates-to-our-family-of-thinking-models) - Gemini 2.5: Updates to our family of thinking models
-
[Gemini thinking Gemini API Google AI for Developers](https://ai.google.dev/gemini-api/docs/thinking) - Gemini 2.5: Updates to our family of thinking models
- Gemini 2.5: Updates to our family of thinking models
- Gemini: A Family of Highly Capable Multimodal Models
- Continuing to bring you our latest models, with an improved Gemini 2.5 Flash and Flash-Lite release
事實查核摘要
- 申報事項檢查:20
- 申報事項核實:20
- 結論:通過 (PASS)
- 只能生成圖片
- 在回答前會經過內部推理過程
- 僅在搜尋引擎中運作
- Gemini 2.5 Pro
- Gemini 2.5 Flash
- Gemini 2.5 Flash-Lite
- 音樂作曲能力
- 代理型工具調用能力
- 單純的計算速度