Google DeepMind 公開了「Gemini Robotics On-Device」,這款模型可直接在機器人硬體上運行,無需連接雲端即可執行精細任務。
如果您在家中使用過掃地機器人,可能曾經遇到過令人沮喪的情況。只要 Wi-Fi 連線稍微不穩定,機器人就會突然停在原地「發呆」,或者即使下達了開始清掃的指令,它也要磨蹭好一陣子才心不甘情不願地開始動作。
為什麼至今為止那些「聰明」的機器人會對網路如此執著呢?比喻來說,機器人的身體雖然在我們家裡,但它那龐大的大腦——人工智慧(AI)卻住在網路另一端遙遠的大型電腦伺服器(雲端)中。每當機器人看到眼前的一隻襪子並進行判斷時,都必須詢問遠在地球另一端的伺服器:「我現在看到的是什麼?」、「接下來該怎麼動?」,然後再等待回覆。
但現在,機器人即使沒有網路這條「生命線」,也能自主思考並即時反應的時代即將開啟。Google DeepMind 發佈的劃時代技術——「Gemini Robotics On-Device」正是這場變革的主角 Gemini Robotics On-Device 將 AI 帶入本地機器人裝置。
這為什麼對我們的生活很重要?
想像一下,在您家的地下室或露營地等網路收訊不佳的地方,您對機器人說:「幫我打開這個包包。」結果機器人卻只是無限重複著「正在檢查連線狀態…」並傻站著,那該有多荒謬?
Gemini Robotics On-Device 是一項直接將非常聰明的「小腦袋」移植到機器人身體裡的技術 Google 推出可在本地機器人上運行的全新 Gemini 模型。這項技術將改變我們未來的原因主要有三點:
- 眨眼間的反應速度:由於不需要將訊號傳送到外部,反應速度快如閃電(低延遲,low-latency)。當機器人快要漏掉物品時,能夠即時加強手部力量,實現精細的即時調整 Gemini Robotics On-Device 將 AI 帶入本地機器人裝置。
- 徹底的個人隱私保護:機器人拍攝家裡角落的影像數據不需要傳送到外部伺服器。所有的判斷都在裝置內部完成,因此可以大幅減輕對隱私洩漏的擔憂 新的 Google AI 讓機器人在沒有雲端的情況下更聰明 - 福斯新聞。
- 隨處皆能應付自如:在網路中斷的災難現場或偏遠地區,機器人也能像連接了城市超高速網路一樣聰明地運作 Gemini Robotics On-Device 將 AI 帶入本地機器人裝置。
輕鬆理解:「觀察、理解、行動」的機器人大腦
這種新型 AI 在專業術語中被稱為視覺-語言-行動模型(VLA, Vision-Language-Action model) Gemini Robotics On-Device 模型卡。聽起來可能有點複雜,但實際上它與我們日常處理物品的過程完全一樣。
- 視覺 (Vision):透過機器人的眼睛(攝影機)「觀察」眼前堆放的凌亂衣物。
- 語言 (Language):當人說「幫我把這件襯衫摺好」時,「理解」其意圖。
- 行動 (Action):根據理解的內容,「決定」機器人手臂關節要移動多少度、以什麼速度移動。
這項技術是以 Google 的行動裝置用人工智慧「Gemma」為基礎,並針對機器人進行了優化 Gemini Robotics On-Device 模型卡。簡單來說,這並不是請來一位讀完圖書館數萬本書的天才學者,而是讓機器人揣著一本裝在口袋裡的「核心摘要筆記」,同時又具備無與倫比實作能力的「資深現場專家」。
令人驚訝的是,根據 Google 的說法,這個「小腦袋」模型展現出的智慧水平與使用龐大雲端系統時幾乎旗鼓相當 [Google 揭曉 Gemini Robotics:機器人裝置端 AI 的未來]。它雖然體型變小了,但實力依舊,堪稱是「小巨人」。
現狀:拉開包包拉鍊的精細手勢
至今為止,機器人最困難的課題之一就是處理「柔軟的物體」。搬運堅硬的箱子可以像數學公式一樣計算,但摺疊鬆垮的衣服或抓住包包細小的拉鍊頭並將其拉開,則需要像人類一樣細膩的感官(靈巧性,dexterity)。
Gemini Robotics On-Device 特別針對雙臂機器人(bi-arm robots)進行了設計,使其能像人類一樣精細地工作 Gemini Robotics On-Device 將 AI 帶入本地機器人裝置。在實際演示中,搭載此 AI 的機器人出色地完成了以下高難度任務 Gemini Robotics On-Device 將 AI 帶入本地機器人裝置:
- 準確找到包包的小拉鍊頭並平順地拉開
- 將凌亂的衣物整齊地摺好
- 聽取人類自然的語言指令,並對初次遇到的突發狀況做出快速反應
Google DeepMind 期待透過這個模型,讓機器人超越工廠裡只會重複單一工作的機器,蛻變為能在我們客廳裡處理萬般家務的「通用家務助手」 DeepMind 的 Gemini Robotics On-Device 為本地機器人裝置帶來先進 AI…。
未來的機器人世界會是什麼樣子?
當然,這並不意味著從明天開始,搭載這項技術的機器人就能幫我們摺好所有的衣服。目前,Google 僅向少數選定的合作夥伴和測試人員公開此模型,以驗證其安全性 Gemini Robotics On-Device 模型卡。
但專家們確信,這次發佈將成為徹底改變機器人產業格局的「遊戲規則改變者」 Gemini Robotics On-Device:Google 為本地機器人帶來 AI。因為它建立了一個標準:無需昂貴的伺服器運維成本,僅需極低功耗即可讓機器人變得聰明。
在不久的將來,如果「無需網路連接的家務機器人助手」上市,其核心技術必然源自這項 Gemini Robotics On-Device。機器人不再依賴網路,而是獨立守護在我們身邊的世界,比想像中更接近了。
MindTickleBytes 的 AI 記者視角
人工智慧剪斷了名為雲端的「臍帶」,開始在裝置內自主生存,這意味著機器人正成為真正意義上的獨立存在。現在,機器人不再是那種只會等待伺服器回應而發呆停頓的機器。它們已經準備好即時聽懂我們的話、如閃電般行動,並成為替我們分擔日常瑣事、值得信賴的夥伴。
參考資料
- Gemini Robotics On-Device 將 AI 帶入本地機器人裝置
- DeepMind 的 Gemini Robotics On-Device 為本地機器人裝置帶來先進 AI…
- Google 推出可在本地機器人上運行的全新 Gemini 模型
- Gemini Robotics On-Device 模型卡
- Gemini Robotics On-Device 將 AI 帶入本地機器人裝置 (AiPulseLab)
- Gemini Robotics On-Device:Google 為本地機器人帶來 AI
- Google 揭曉 Gemini Robotics:機器人裝置端 AI 的未來
- 新的 Google AI 讓機器人在沒有雲端的情況下更聰明 - 福斯新聞
- DeepMind 發佈新一代機器人 AI 模型:Gemini Robotics On-Device
-
[AI 機器人:Google DeepMind 的裝置端模型 AI Magazine](https://aimagazine.com/news/google-launches-offline-gemini-ai-model-for-robots)
事實查核摘要
- 查核項目:19
- 驗證項目:19
- 結果:通過 (PASS)
- 降低機器人價格
- 在無需網路連接的情況下,AI 直接在機器人內部運行
- 將機器人電池壽命延長 2 倍
- 超高速行駛能力
- 拉開包包拉鍊或摺衣服等精細動作
- 飛行功能
- 裝有輪子的配送機器人
- 擁有雙臂的機器人 (bi-arm robots)
- 吸塵器型機器人