Google 正將 Gemini 應用程式演進為個性化、主動且強大的「萬能 AI 助手」,為代勞日常任務到複雜行政處理的時代做準備。
如果 AI 能讀懂我的心並代勞工作?Google 夢想中的「萬能助手」Gemini
想像一下,這是一個格外疲憊的週一早晨。你從床上爬起來伸個懶腰,對著空氣說一句:「幫我整理一下今天的行程。」
目前的助手可能會回答:「早上 10 點有會議。」但未來的 AI 助手則不同。它會先提議:「因為你昨天睡得晚,我已經把今天早上的會議延後了 30 分鐘。另外,我準備了 5 封今天必須閱讀的郵件摘要音檔,讓你在上班開車途中聽。啊,還有下週是你父母的生日吧?我看到他們平常喜歡的品牌出了新品,已經幫你放入購物車了,現在要結帳嗎?」
這聽起來像是科幻電影中的場景嗎?Google 正致力於將這種「萬能 AI 助手 (Universal AI Assistant)」從單純的想像轉化為現實,並為此繪製了宏偉的藍圖。Google I/O 2025:Gemini 作為萬能 AI 助手
為什麼這很重要?AI 將超越「嘴巴」,成為「手腳」
我們至今體驗過的 AI,大多是像聰明的百科全書,主要是「問什麼答什麼」。你問它不知道的事,它告訴你答案。但 Google 夢想的未來則完全不同。Google DeepMind 的執行長 Demis Hassabis 宣布,將透過 Gemini 應用程式打造個性化 (Personal)、主動 (Proactive) 且強大 (Powerful) 的助手。Google 正在將 Gemini 轉變為萬能 AI 助手
這不僅僅是功能的增加,更意味著 AI 根本角色的轉變。簡單來說,AI 正在從「只會說話的存在」進化為「能直接處理工作的存在」,即代理 (Agent,能自主判斷並行動的 AI 系統)。從複雜的機票預訂到政府機關的民願處理,這項願景的核心是讓 AI 代勞我們感到厭煩的無數「數位雜務」,讓人類能專注於更有價值的生活領域。我們構建萬能 AI 助手的願景
輕鬆理解:AI 助手的「眼睛」和「大腦」如何運作?
這位萬能助手是如何讀懂我們的心並俐落地完成工作呢?這背後隱藏了兩項驚人的核心技術。
1. 能看、能聽、能理解世界的「原生多模態」
Gemini 2.5 Pro 模型具備「原生多模態 (Natively Multimodal)」技術。
打個比方,如果現有的 AI 是只會透過書本學習世界的「書呆子」,那麼 Gemini 2.5 Pro 就像是能直接看、聽、觸摸,運用五感學習的「萬能專家」。因為它被設計為從一開始就能同時處理文本、圖像、語音及影片數據。得益於此,它能即時回應「你知道那個穿紅衣服的人是誰嗎?」這類問題,並展現出同時處理多項任務的強大多工 (Multitasking) 能力。Google 正在讓 Gemini 成為萬能且行動導向的 AI 助手
2. 在網際網路中穿梭自如的「Project Mariner」
Google 正在透過名為 Project Mariner 的研究原型,實驗 AI 如何在網頁瀏覽器中協助人類。Google 構建萬能 AI 助手的願景
未來,AI 代理將像我們瀏覽網站尋找資訊、將商品放入購物車並結帳一樣,直接操作瀏覽器來執行使用者的指示。這將提供一種驚人的體驗,彷彿有一位看不見的助手坐在我的桌前,用我的電腦代勞積壓的工作。
現況:透過「Project Astra」具體化的願景
Google 的這個宏偉夢想正以 Project Astra 之名逐漸顯現出實體。Project Astra,Google 對於萬能 AI 助手的願景正開始受到關注…
該專案被評估為構建「未來型助手」的關鍵階段,它超越了單純的回答問題,能即時掌握使用者正在看什麼、需要什麼,並採取相應行動。Demis Hassabis 強調,這種技術跨越最終將引領我們走向豐富使用者日常生活的「萬能助手」。Google 在 AI 時代的搜尋願景正開始… - Business Insider
當然,為了防止這種強大能力被誤用,Google 同時也在針對倫理問題和安全性進行大規模研究。Google I/O 2025:Gemini 作為萬能 AI 助手
未來會如何發展?
Google 將這位萬能 AI 助手視為邁向 AGI (Artificial General Intelligence,通用人工智慧 - 具備人類水準智慧的 AI) 道路上最重要的里程碑之一。Google 正在將 Gemini 轉變為萬能 AI 助手
事實上,Google 在過去 10 年間曾向世界推出了成為現代 AI 根基的 Transformer (能掌握句子單詞間關係的 AI 結構) 技術,並開發了像 AlphaGo 這樣能自主學習和規劃的系統。我們構建萬能 AI 助手的願景 – ONMINE
現在,Google 正試圖將長期累積的所有技術實力匯聚一處,打造一個能滲透到我們日常生活每一刻並提供實質幫助的存在。雖然全球頂尖科技企業都在朝著「萬能助手」的高地奔跑,但 Google 憑藉著已構建的龐大搜尋、地圖、郵件等生態系,正領先一步。科技巨頭都想構建同樣的 AI 助手。誰能勝出?
AI 的觀點
Google 所描繪的「萬能助手」願景明確展示了 AI 正超越單純的工具,演進為輔助人類生活的「同伴」。如果我們能從整理收據、調整行程、單純資訊搜尋等消耗性工作中解放出來會如何呢?屆時我們將能把這些時間和精力花在陪伴家人或進行更具創造性的思考,AI 所帶來的「時間自由」時代正向我們走來。
參考資料
- Google I/O 2025:Gemini 作為萬능 AI 助手
- 我們構建萬能 AI 助手的願景
- Google 構建萬能 AI 助手的願景
- Google 正在讓 Gemini 成為萬能且行動導向的 AI 助手
- Google 構建萬能 AI 助手的宏偉願景 …
- Google 正在將 Gemini 轉變為萬能 AI 助手
- 我們構建萬能 AI 助手的願景 – ONMINE
- Project Astra,Google 對於萬能 AI 助手的願景正開始受到關注…
- 隨著一系列新模型功能的推出,Google 概述了構建萬能 AI 助手的計劃…
- Google 在 AI 時代的搜尋願景正開始… - Business Insider
- 科技巨頭都想構建同樣的 AI 助手。誰能勝出?
- 打造更快的網頁搜尋引擎
- 構建個性化且主動的萬能 AI 助手
- 開發高解析度圖像生成工具
- Project Astra
- Project Gemini
- Project Mariner
- Gemini 2.5 Pro
- AlphaGo
- Transformer