구글 딥마인드가 로봇에게 인간의 '상식'과 같은 추론 능력을 부여하는 Gemini Robotics-ER 1.6을 발표하며, 산업 현장의 자율성을 한 단계 높였습니다.
우리 주변의 로봇들은 사실 생각보다 똑똑하지 않습니다. 공장의 로봇 팔은 정해진 위치로만 기계적으로 움직이고, 로봇 청소기는 가끔 낮은 문턱에 걸려 꼼꼼하게 청소하지 못한 채 꼼짝달싹 못 하기도 하죠. 이들에게 부족한 것은 바로 우리 인간이 가진 ‘상식’입니다.
“컵을 집으러 가다가 앞에 장애물이 있으면 돌아가야지” 혹은 “바닥에 물이 있으면 미끄러울 수 있으니 조심해야지” 같은 지극히 당연한 생각 말이죠. 지금까지의 로봇에게 이런 판단은 너무나 어려운 숙제였습니다.
그런데 2026년 4월 14일, 구글 딥마인드(Google DeepMind)가 로봇에게 이러한 ‘상식’을 심어줄 수 있는 새로운 뇌를 발표했습니다. 바로 Gemini Robotics-ER 1.6입니다 Gemini Robotics-ER 1.6: What Google’s New Robotics Model Does DeepMind’s Gemini Robotics-ER 1.6 Lets Spot Read Gauges - WinBuzzer. 이번 시간에는 이 인공지능이 왜 로봇 기술의 미래를 바꿀 게임 체인저로 불리는지, 우리 삶에는 어떤 변화를 가져올지 쉽고 자세하게 알아보겠습니다.
이게 왜 중요한가요?
지금까지의 로봇은 컴퓨터 코드로 짜인 정교한 ‘매뉴얼’에 따라 움직였습니다. 하지만 우리가 사는 실제 세상은 너무나 복잡하고 수많은 변수가 존재합니다. 매뉴얼에 없는 돌발 상황이 닥치면 로봇은 멈춰버리거나 엉뚱한 행동을 하기 일쑤였죠.
| Gemini Robotics-ER 1.6은 로봇에게 체화된 추론(Embodied Reasoning) 능력을 부여합니다 Gemini Robotics-ER 1.6: Powering real-world robotics tasks through enhanced embodied reasoning [DeepMinds Gemini 1.6 Gives Robots Point-and-Click … | …](https://robohorizon.com/en-us/news/2026/04/deepminds-gemini-16-gives-robots-point-and-click-reality/). ‘체화된 추론’이란 쉽게 말해 로봇이 자신의 몸과 주변 환경을 실시간으로 이해하며 스스로 판단하는 능력을 뜻합니다. |
| 비유하자면, 단순히 시키는 대로만 움직이는 기계에서 상황을 보고 “아, 지금은 이렇게 하는 게 맞겠군”이라고 판단할 수 있는 지능형 ‘요원(Agent)’으로 진화하는 것입니다 [Gemini Robotics-ER 1.6 | Gemini API | Google AI for Developers](https://ai.google.dev/gemini-api/docs/robotics-overview). 이는 공장이나 위험한 산업 현장에서 로봇이 사람의 도움 없이도 더 안전하고 완벽하게 자율적으로 일할 수 있게 된다는 것을 의미합니다 Gemini Robotics-ER 1.6: Real-World Robotics Intelligence. |
쉽게 이해하기: 로봇에게 생긴 ‘눈’과 ‘뇌’
| Gemini Robotics-ER 1.6은 시각-언어 모델(Vision-Language Model, VLM)입니다 [Gemini Robotics-ER 1.6 | Gemini API | Google AI for Developers](https://ai.google.dev/gemini-api/docs/robotics-overview). 눈으로 보는 이미지 정보와 우리가 쓰는 일상 언어를 동시에 이해하고 연결할 수 있다는 뜻이죠. 이 모델의 핵심 능력을 세 가지 비유로 설명해 보겠습니다. |
1. “지도를 머릿속에 그리는 능력” (공간 추론)
상상해보세요. 여러분이 한밤중 어두운 방에서 화장실을 갈 때, 불을 켜지 않고도 가구의 위치를 짐작해 요리조리 피해 갈 수 있는 것과 같습니다. 이 모델은 여러 대의 카메라에서 들어오는 복잡한 영상을 조합해 로봇이 서 있는 공간을 입체적으로 파악합니다(Multi-camera reasoning) Gemini Robotics-ER 1.6: Real-World Robotics Intelligence. 단순히 사진을 찍는 것이 아니라, “저 물체는 내 뒤에 있고, 이 벽은 내가 지나갈 수 있는 공간이다”라는 것을 깊이 있게 ‘이해’하는 것이죠 Gemini Robotics-ER 1.6: What Google’s New Robotics Model Does.
2. “숙제를 다 했는지 확인하는 꼼꼼함” (성공 감지)
많은 로봇이 물건을 집으라는 명령을 받으면 단순히 팔을 뻗는 동작만 수행합니다. 중간에 물건을 놓쳐도 “난 팔을 뻗었으니 임무 완료!”라고 생각하고 다음 단계로 넘어가 버리죠. 하지만 이 모델은 성공 감지(Success detection) 기능을 갖추고 있습니다 Gemini Robotics-ER 1.6: Powering real-world robotics tasks through enhanced embodied reasoning DeepMind’s Gemini Robotics-ER 1.6 pushes embodied AI into the real world. 작업을 마친 뒤 “정말로 물건이 제대로 옮겨졌나?”를 스스로 확인하고, 만약 실패했다면 다시 시도하거나 멈춥니다 Gemini Robotics-ER 1.6: What Google’s New Robotics Model Does.
3. “전문가의 눈으로 계측기 읽기” (인스트루먼트 리딩)
산업 현장에는 바늘로 된 압력계나 기름 양을 보여주는 유리관(사이트 글라스)이 아주 많습니다. 일반적인 로봇에게는 이것이 그저 복잡한 그림처럼 보일 수 있지만, Gemini Robotics-ER 1.6은 이 눈금들이 현재 무엇을 의미하는지 정확히 읽어낼 수 있습니다 DeepMind’s Gemini Robotics-ER 1.6 Lets Spot Read Gauges - WinBuzzer DeepMind’s Gemini Robotics-ER 1.6 pushes embodied AI into the real world. 마치 노련한 공장 관리자가 직접 장비를 점검하는 것과 같은 수준입니다.
현재 상황: ‘스팟’이 똑똑해졌어요
로라 그래서(Laura Graesser)와 펑 쉬(Peng Xu) 등 구글의 뛰어난 연구진이 개발한 이 모델은 이미 실제 로봇에 적용되어 놀라운 성과를 보여주고 있습니다 Gemini Robotics-ER 1.6: Powering real-world robotics tasks through enhanced embodied reasoning.
특히 보스턴 다이내믹스의 유명한 로봇 개 ‘스팟(Spot)’은 이 모델 덕분에 공장을 스스로 돌아다니며 각종 계측기를 읽고 장비 상태를 정밀하게 점검하는 업무를 수행하게 되었습니다 DeepMind’s Gemini Robotics-ER 1.6 Lets Spot Read Gauges - WinBuzzer. 이는 이전 버전인 Gemini Robotics-ER 1.5나 고성능 모델인 Gemini 3.0 Flash보다도 물리적 추론 능력(물체 가리키기, 숫자 세기, 궤적 예측 등)에서 훨씬 압도적인 성능을 보인 결과입니다 GeminiRobotics-ER1.6:Poweringreal-worldroboticstasks… GeminiRobotics: Bringing AI into the PhysicalWorld.
| 이제 로봇에게 “저기 보이는 붉은색 밸브 옆의 압력계를 확인해줘”라고 자연스럽게 말하면, 로봇은 그 의미를 완벽히 이해하고 곧바로 행동으로 옮길 수 있는 수준에 도달한 것입니다 [Gemini Robotics-ER 1.6 | Gemini API | Google AI for Developers](https://ai.google.dev/gemini-api/docs/robotics-overview). |
앞으로 어떻게 될까?
구글 딥마인드의 이번 발표는 로봇이 연구실의 울타리를 벗어나 진짜 우리 삶의 ‘현장’으로 나가는 중요한 신호탄입니다.
가까운 미래에는 사람이 들어가기 매우 위험한 방사능 시설이나 유독 가스 누출 현장에 이 모델을 탑재한 로봇이 가장 먼저 투입될 것입니다. 로봇은 단순히 현장 영상만 전송하는 역할에 그치지 않고, 현장에서 “가스 수치가 위험 수준이니 즉시 메인 밸브를 잠그겠다”는 식의 고차원적인 판단을 내리며 임무를 완수하게 될 것입니다 Gemini Robotics-ER 1.6: Real-World Robotics Intelligence.
또한, 이러한 기술은 더 범용적인 로봇 개발의 든든한 토대가 될 것입니다. 공장뿐만 아니라 우리 가정에서도 복잡한 가사 노동을 척척 돕는 ‘진짜 똑똑한 로봇 도우미’를 만나는 날이 훨씬 더 빠르게 다가올 것으로 기대됩니다 Google unveilsGeminiRoboticsfor building general purposerobots.
AI의 시선
상상해보세요. 아침에 일어나 “냉장고에 있는 우유 유통기한 좀 확인하고, 거실에 어질러진 물건들 제자리에 놔줘”라고 말하면 로봇이 알아서 집안일을 끝내는 풍경을요. 지금까지의 AI가 화면 속에서 텍스트와 이미지로만 대화하는 ‘똑똑한 비서’였다면, Gemini Robotics-ER 1.6을 통해 비로소 ‘세상을 이해하고 움직이는 몸’을 얻게 되었습니다.
로봇이 인간의 언어를 실제 물리적 행동으로 연결하는 이 놀라운 기술은, 머지않아 우리가 SF 영화에서나 꿈꾸던 ‘로봇과의 공존’을 일상적인 현실로 만들어줄 것입니다. AI가 드디어 컴퓨터 밖으로 나와 우리와 함께 걷기 시작한 셈입니다.
참고자료
- Gemini Robotics ER 1.6: Enhanced Embodied Reasoning
-
[Gemini Robotics-ER 1.6 Gemini API Google AI for Developers](https://ai.google.dev/gemini-api/docs/robotics-overview) - Gemini Robotics-ER 1.6 - The Keyword
- Gemini Robotics-ER 1.6: Real-World Robotics Intelligence
-
[DeepMinds Gemini 1.6 Gives Robots Point-and-Click … …](https://robohorizon.com/en-us/news/2026/04/deepminds-gemini-16-gives-robots-point-and-click-reality/) - Gemini Robotics-ER 1.6: What Google’s New Robotics Model Does
- DeepMind’s Gemini Robotics-ER 1.6 Lets Spot Read Gauges - WinBuzzer
- DeepMind’s Gemini Robotics-ER 1.6 pushes embodied AI into the real world
- GoogleNews- Google DeepMind unveilsGeminiRobotics-ER…
- GeminiRobotics-ER1.6:Poweringreal-worldroboticstasks…
- GeminiRobotics: Bringing AI into the PhysicalWorld
- Google unveilsGeminiRoboticsfor building general purposerobots
- Building the Next Generation of Physical Agents withGemini…
- 외국어 번역 능력
- 공간 및 물리적 추론 능력
- 음악 작곡 능력
- 성공 감지(Success Detection)
- 자동 충전(Auto Charging)
- 음성 인식(Voice Recognition)
- 커피 배달
- 산업용 게이지(계측기) 읽기
- 공장 바닥 청소