Wi-Fi 斷網也能摺衣服?Google 揭秘「機器人專屬人工智慧」的奧秘

兩隻機器人手臂精細地執行拉開包包拉鍊或摺衣服等家務勞動的未來展望場景
AI Summary

Google DeepMind 公開了「Gemini Robotics On-Device」,這款模型可直接在機器人硬體上運行,無需連接雲端即可執行精細任務。

如果您在家中使用過掃地機器人,可能曾經遇到過令人沮喪的情況。只要 Wi-Fi 連線稍微不穩定,機器人就會突然停在原地「發呆」,或者即使下達了開始清掃的指令,它也要磨蹭好一陣子才心不甘情不願地開始動作。

為什麼至今為止那些「聰明」的機器人會對網路如此執著呢?比喻來說,機器人的身體雖然在我們家裡,但它那龐大的大腦——人工智慧(AI)卻住在網路另一端遙遠的大型電腦伺服器(雲端)中。每當機器人看到眼前的一隻襪子並進行判斷時,都必須詢問遠在地球另一端的伺服器:「我現在看到的是什麼?」、「接下來該怎麼動?」,然後再等待回覆。

但現在,機器人即使沒有網路這條「生命線」,也能自主思考並即時反應的時代即將開啟。Google DeepMind 發佈的劃時代技術——「Gemini Robotics On-Device」正是這場變革的主角 Gemini Robotics On-Device 將 AI 帶入本地機器人裝置

這為什麼對我們的生活很重要?

想像一下,在您家的地下室或露營地等網路收訊不佳的地方,您對機器人說:「幫我打開這個包包。」結果機器人卻只是無限重複著「正在檢查連線狀態…」並傻站著,那該有多荒謬?

Gemini Robotics On-Device 是一項直接將非常聰明的「小腦袋」移植到機器人身體裡的技術 Google 推出可在本地機器人上運行的全新 Gemini 模型。這項技術將改變我們未來的原因主要有三點:

  1. 眨眼間的反應速度:由於不需要將訊號傳送到外部,反應速度快如閃電(低延遲,low-latency)。當機器人快要漏掉物品時,能夠即時加強手部力量,實現精細的即時調整 Gemini Robotics On-Device 將 AI 帶入本地機器人裝置
  2. 徹底的個人隱私保護:機器人拍攝家裡角落的影像數據不需要傳送到外部伺服器。所有的判斷都在裝置內部完成,因此可以大幅減輕對隱私洩漏的擔憂 新的 Google AI 讓機器人在沒有雲端的情況下更聰明 - 福斯新聞
  3. 隨處皆能應付自如:在網路中斷的災難現場或偏遠地區,機器人也能像連接了城市超高速網路一樣聰明地運作 Gemini Robotics On-Device 將 AI 帶入本地機器人裝置

輕鬆理解:「觀察、理解、行動」的機器人大腦

這種新型 AI 在專業術語中被稱為視覺-語言-行動模型(VLA, Vision-Language-Action model) Gemini Robotics On-Device 模型卡。聽起來可能有點複雜,但實際上它與我們日常處理物品的過程完全一樣。

  • 視覺 (Vision):透過機器人的眼睛(攝影機)「觀察」眼前堆放的凌亂衣物。
  • 語言 (Language):當人說「幫我把這件襯衫摺好」時,「理解」其意圖。
  • 行動 (Action):根據理解的內容,「決定」機器人手臂關節要移動多少度、以什麼速度移動。

這項技術是以 Google 的行動裝置用人工智慧「Gemma」為基礎,並針對機器人進行了優化 Gemini Robotics On-Device 模型卡。簡單來說,這並不是請來一位讀完圖書館數萬本書的天才學者,而是讓機器人揣著一本裝在口袋裡的「核心摘要筆記」,同時又具備無與倫比實作能力的「資深現場專家」。

令人驚訝的是,根據 Google 的說法,這個「小腦袋」模型展現出的智慧水平與使用龐大雲端系統時幾乎旗鼓相當 [Google 揭曉 Gemini Robotics:機器人裝置端 AI 的未來]。它雖然體型變小了,但實力依舊,堪稱是「小巨人」。

現狀:拉開包包拉鍊的精細手勢

至今為止,機器人最困難的課題之一就是處理「柔軟的物體」。搬運堅硬的箱子可以像數學公式一樣計算,但摺疊鬆垮的衣服或抓住包包細小的拉鍊頭並將其拉開,則需要像人類一樣細膩的感官(靈巧性,dexterity)。

Gemini Robotics On-Device 特別針對雙臂機器人(bi-arm robots)進行了設計,使其能像人類一樣精細地工作 Gemini Robotics On-Device 將 AI 帶入本地機器人裝置。在實際演示中,搭載此 AI 的機器人出色地完成了以下高難度任務 Gemini Robotics On-Device 將 AI 帶入本地機器人裝置

  • 準確找到包包的小拉鍊頭並平順地拉開
  • 將凌亂的衣物整齊地摺好
  • 聽取人類自然的語言指令,並對初次遇到的突發狀況做出快速反應

Google DeepMind 期待透過這個模型,讓機器人超越工廠裡只會重複單一工作的機器,蛻變為能在我們客廳裡處理萬般家務的「通用家務助手」 DeepMind 的 Gemini Robotics On-Device 為本地機器人裝置帶來先進 AI…

未來的機器人世界會是什麼樣子?

當然,這並不意味著從明天開始,搭載這項技術的機器人就能幫我們摺好所有的衣服。目前,Google 僅向少數選定的合作夥伴和測試人員公開此模型,以驗證其安全性 Gemini Robotics On-Device 模型卡

但專家們確信,這次發佈將成為徹底改變機器人產業格局的「遊戲規則改變者」 Gemini Robotics On-Device:Google 為本地機器人帶來 AI。因為它建立了一個標準:無需昂貴的伺服器運維成本,僅需極低功耗即可讓機器人變得聰明。

在不久的將來,如果「無需網路連接的家務機器人助手」上市,其核心技術必然源自這項 Gemini Robotics On-Device。機器人不再依賴網路,而是獨立守護在我們身邊的世界,比想像中更接近了。


MindTickleBytes 的 AI 記者視角

人工智慧剪斷了名為雲端的「臍帶」,開始在裝置內自主生存,這意味著機器人正成為真正意義上的獨立存在。現在,機器人不再是那種只會等待伺服器回應而發呆停頓的機器。它們已經準備好即時聽懂我們的話、如閃電般行動,並成為替我們分擔日常瑣事、值得信賴的夥伴。

參考資料

  1. Gemini Robotics On-Device 將 AI 帶入本地機器人裝置
  2. DeepMind 的 Gemini Robotics On-Device 為本地機器人裝置帶來先進 AI…
  3. Google 推出可在本地機器人上運行的全新 Gemini 模型
  4. Gemini Robotics On-Device 模型卡
  5. Gemini Robotics On-Device 將 AI 帶入本地機器人裝置 (AiPulseLab)
  6. Gemini Robotics On-Device:Google 為本地機器人帶來 AI
  7. Google 揭曉 Gemini Robotics:機器人裝置端 AI 的未來
  8. 新的 Google AI 讓機器人在沒有雲端的情況下更聰明 - 福斯新聞
  9. DeepMind 發佈新一代機器人 AI 模型:Gemini Robotics On-Device
  10. [AI 機器人:Google DeepMind 的裝置端模型 AI Magazine](https://aimagazine.com/news/google-launches-offline-gemini-ai-model-for-robots)

事實查核摘要

  • 查核項目:19
  • 驗證項目:19
  • 結果:通過 (PASS)
測試你的理解
Q1. Gemini Robotics On-Device 最顯著的特徵是什麼?
  • 降低機器人價格
  • 在無需網路連接的情況下,AI 直接在機器人內部運行
  • 將機器人電池壽命延長 2 倍
此模型的關鍵在於,即使沒有雲端或網路連接,AI 也能在機器人裝置本身本地運行。
Q2. 這款 AI 模型為機器人提供了哪些具體能力?
  • 超高速行駛能力
  • 拉開包包拉鍊或摺衣服等精細動作
  • 飛行功能
Gemini Robotics On-Device 旨在執行需要高度靈巧性的任務,例如拉開拉鍊、摺衣服等。
Q3. 此模型主要針對哪種類型的機器人進行了優化?
  • 裝有輪子的配送機器人
  • 擁有雙臂的機器人 (bi-arm robots)
  • 吸塵器型機器人
此模型特別針對使用雙臂的機器人 (bi-arm robots) 進行了優化。