斷網也能行!我家機器人開始『自主思考』了:Gemini Robotics On-Device

展示了一台雙臂機器人正在精密地處理複雜物品,旁邊強調了作為機器人大腦的 On-Device AI 芯片的圖像。
AI Summary

Google DeepMind 公開了無需聯網即可在機器人內部直接運行的人工智能『Gemini Robotics On-Device』,開啟了無延遲、快速且精密的機器人動作時代。

斷網也能行!我家機器人開始『自主思考』了

請試著想像一下電影中的場景:一個幫你做家務的機器人正在廚房裡精巧地搬運盤子。突然,一陣雷電閃過,家裡的 Wi-Fi 斷了,或者網絡信號急劇變弱。傳統的機器人會發生什麼事?它們可能會立即停止動作,或者為了等待遙遠的巨大服務器(雲端)回應「我該怎麼辦?」而呆立在那裡。在最壞的情況下,短暫的指令傳遞延遲可能會導致昂貴的盤子掉在地板上摔碎。

但現在,這種擔憂將成為過去。Google DeepMind 向世界推出了一項創新技術,讓機器人可以在沒有互聯網這條「生命線」的情況下,也能自主觀察、理解並行動。這就是為機器人植入獨立大腦的 「Gemini Robotics On-Device」

為什麼這很重要? (Why It Matters)

我們在用智能手機玩遊戲時,短暫的「Lag(延遲)」可能只是讓人覺得煩躁,但對於在現實物理世界中搬運重物移動的機器人來說,「延遲」可能會導致致命的事故或損壞。這項技術之所以成為機器人學的遊戲規則改變者,原因非常明確:

  1. 比光速還快的反應速度:以往機器人看到眼前的物體後,會將影像傳送到遠處的服務器進行分析,再接收行動指南。這個過程中產生的幾百毫秒時差是精密作業的大敵。「Gemini Robotics On-Device」在機器人體內完成所有處理,因此延遲(Low-latency)極短 [Gemini Robotics On-Device — Google DeepMind]。
  2. 在網絡死角也無敵:在地下倉庫、通信不穩定的戶外,甚至是完全沒有網絡信號的災難現場等艱苦環境中,機器人也能聰明地執行任務。機器人不再需要圍著網絡路由器轉了 [DeepMind’s Gemini Robotics On-Device brings advanced AI to local robots]。
  3. 徹底的隱私保護:家務機器人在客廳走動拍攝的影像不會傳輸到外部服務器,這是一個巨大的優點。房屋結構或家人的隱私信息僅在機器人內部處理並即時銷毀,安全性得到了飛躍式的提升。

輕鬆理解:為機器人植入「自主大腦」 (The Explainer)

為了更容易理解這項技術,我們用「廚師」來打個比方。

  • 傳統方式(雲端機器人學):廚師每切一次洋蔥都要打電話問餐廳外的廚師長:「大廚,現在可以切了嗎?」每開一次火也要問:「大廚,現在可以開火了嗎?」如果電話斷了或通話質量差,料理就會立即中斷。
  • 新方式(裝置端機器人學):廚師完全掌握了食譜和判斷力,走進廚房。即使不聯繫外界,也能根據眼前食材的狀態立即完成料理。比喻來說,就是機器人丟掉了「對講機」,擁有了能獨立思考的「真大腦」。
Google DeepMind 於 2025 年 6 月 24 日正式發布了這款經過優化、可直接在機器人設備現場運行的模型 [Gemini Robotics - 維基百科], [[Google 推出可在本地機器人運行的全新 Gemini 模型 TechCrunch](https://techcrunch.com/2025/06/24/google-rolls-out-new-gemini-model-that-can-run-on-robots-locally/)]。該模型是 2025 年 3 月首次介紹的「Gemini Robotics」模型的輕量強大版,旨在於設備內部有限的硬件資源中發揮最高效率 [Gemini Robotics On-Device 為本地機器人設備帶來 AI — Google DeepMind]。

特別是,該模型被稱為 VLA(Vision-Language-Action,視覺-語言-行動) 模型。簡單來說,這意味著一個人工智能統一管理機器人通過攝像頭觀察世界(Vision)、理解人類下達的複雜指令(Language)以及實際移動手臂行動(Action)的所有過程 [Google DeepMind 為機器人推出裝置端 Gemini AI 模型]。

現狀:雙臂更柔順、更精密 (Where We Stand)

Google 解釋說,該模型將最新人工智能 Gemini 2.0 強大的多模態推理(Multimodal reasoning)能力帶入了物理世界。這裡的多模態推理是指能同時理解和判斷文字、圖像、聲音以及空間深度等信息的能力 [Gemini Robotics On-Device 為本地機器人設備帶來 AI — Google DeepMind]。

目前這項技術達到的水平遠超我們的想象。

未來會怎樣? (What’s Next)

Gemini Robotics On-Device 的出現堪稱機器人技術的「獨立宣言」。現在,機器人已經準備好切斷名為雲端的臍帶,走向現實中粗糙且充滿不確定性的環境。

Google 自信地表示,這是其機器人模型中「針對機器人設備本地運行進行優化的最強大 VLA 模型」 [Gemini Robotics On-Device 為本地機器人設備帶來 AI - Google DeepMind]。

讓我們描繪一下未來的日常生活吧: 不久之後,我們將見到能不停分類快遞箱的聰明物流機器人、在手術室裡不漏掉醫生一個手勢而遞上器械的醫療輔助機器人,以及終於在我們家客廳摺衣服、整理孩子玩具的家務機器人。即使網絡突然中斷,機器人也會默默地繼續工作,請放心。

網絡這一限制條件消失,能夠自主判斷情況並敏捷行動的機器人。我們以前只能在科幻電影中看到的未來,正通過 Gemini Robotics On-Device 大步來到我們身邊。


AI 的視角 (AI’s Take)

MindTickleBytes 的 AI 記者觀點: 「如果說過去的機器人是只會按照預先輸入的『指令』樂譜演奏的機器,那麼搭載了 Gemini Robotics On-Device 的機器人則更接近於能感受現場氣氛進行即興演奏的音樂家。解開了網絡連接這道枷鎖後,機器人的活動舞台將無限擴展至客廳、工廠,甚至是外太空。這不僅僅是技術上的進步,更是機器人蛻變為人類真正伴侶的重要轉折點。」


參考資料

  1. Gemini Robotics - 維基百科
  2. Gemini Robotics On-Device 為本地機器人設備帶來 AI — Google DeepMind
  3. Gemini Robotics On-Device 為本地機器人設備帶來 AI - Google DeepMind
  4. Gemini Robotics On-Device — Google DeepMind
  5. Gemini Robotics — Google DeepMind
  6. [Google 推出可在本地機器人運行的全新 Gemini 模型 TechCrunch](https://techcrunch.com/2025/06/24/google-rolls-out-new-gemini-model-that-can-run-on-robots-locally/)
  7. 全新的 Gemini 裝置端機器人學:無需網絡的 AI - SmythOS
  8. DeepMind 的 Gemini Robotics On-Device 為本地機器人帶來先進 AI
  9. Google DeepMind 為機器人推出裝置端 Gemini AI 模型
  10. DeepMind 發布新一代機器人 AI 模型:Gemini Robotics On-Device
  11. [AI 機器人學:Google DeepMind 的裝置端模型 AI Magazine](https://aimagazine.com/news/google-launches-offline-gemini-ai-model-for-robots)
  12. Google DeepMind 發布 Gemini Robotics On-Device,實現實時、雲端…
  13. DeepMind 發布新一代機器人 AI 模型:Gemini Robotics On-Device
  14. Google DeepMind 宣佈機器人基礎模型 Gemini … - InfoQ

FACT-CHECK SUMMARY

  • Claims checked: 17
  • Claims verified: 17
  • Verdict: PASS
測試你的理解
Q1. Gemini Robotics On-Device 最顯著的特點是什麼?
  • 讓機器人的外觀更漂亮
  • AI 在機器人設備內直接運行,無需聯網
  • 將機器人的電池壽命延長 10 倍
如其名『On-Device(裝置端)』,該模型的關鍵在於 AI 直接在機器人硬件本身運行,無需網絡或雲端連接。
Q2. Gemini Robotics On-Device 是基於哪款最新的 AI 模型?
  • Gemini 1.0
  • Gemini 1.5 Pro
  • Gemini 2.0
該模型將 Gemini 2.0 強大的推理能力和對世界的理解帶入了物理機器人的領域。
Q3. 這款 AI 模型特別是為哪種形式的機器人設計的?
  • 雙臂機器人
  • 僅帶輪子的機器人
  • 在空中飛行的無人機
Google DeepMind 表示,該模型是專門為雙臂(two-armed)機器人設計的基礎模型。