내 손안의 똑똑한 조수, '젬마(Gemma) 3n'을 소개합니다: 인공지능이 우리 주머니 속으로 들어오는 방법

스마트폰 화면 속에서 다양한 데이터(이미지, 음성, 텍스트)가 유기적으로 연결되며 빛나는 인공지능의 모습을 형상화한 이미지
AI Summary

구글이 스마트폰과 같은 개인 기기에서 강력한 성능을 발휘하도록 설계된 모바일 우선 AI '젬마 3n'을 공개하며, 이제 인터넷 연결 없이도 내 기기에서 직접 보고, 듣고, 말하는 똑똑한 AI 시대가 열립니다.

상상해보세요. 시끄러운 카페에서 친구와 수다를 떨다가 궁금한 게 생겼습니다. 스마트폰을 꺼내 주변 풍경을 슥 비추며 이렇게 묻습니다. “지금 내가 보고 있는 이 꽃 이름이 뭐야? 그리고 아까 우리가 주문한 메뉴 가격 좀 합쳐서 계산해줘.” 놀랍게도 스마트폰은 비행기 모드인데도 화면 속 꽃을 단번에 인식하고, 내 목소리를 찰떡같이 알아듣더니 순식간에 답을 내놓습니다.

이것은 공상과학 영화 속 장면이 아닙니다. 구글이 최근 발표한 ‘젬마 3n(Gemma 3n)’이라는 새로운 인공지능(AI) 모델이 우리 주머니 속 스마트폰에서 곧 보여줄 현실입니다. 오늘은 복잡한 IT 용어 대신, 이 새로운 AI가 왜 우리의 일상을 바꿀 ‘똑똑한 단짝 친구’가 될 것인지 쉽고 친절하게 풀어보겠습니다. Introducing Gemma 3n: The developer guide - Google Developers Blog

이게 왜 중요한가요?

지금까지 우리가 사용해온 챗GPT나 제미나이 같은 대부분의 똑똑한 AI들은 사실 아주 거대한 공장(데이터센터)에 살고 있었습니다. 우리가 스마트폰으로 질문을 던지면, 그 질문은 지구 반대편의 거대 서버로 날아가 처리된 후 다시 돌아오는 방식이었죠. 비유하자면, 간단한 연산 문제를 풀기 위해 매번 멀리 떨어진 본사의 슈퍼컴퓨터에 전화를 걸어 물어보는 셈이었습니다.

하지만 젬마 3n은 ‘모바일 우선(Mobile-first)’으로 태어났습니다. Announcing Gemma 3n preview: powerful, efficient, mobile-first AI 즉, 거대한 서버의 도움 없이 우리가 매일 들고 다니는 스마트폰, 노트북, 태블릿 안에서 스스로 생각하고 답을 낼 수 있도록 작고 단단하게 만들어진 모델입니다. [Gemma 3n model overview Google AI for Developers](https://ai.google.dev/gemma/docs/gemma-3n)

이렇게 ‘온디바이스 AI(On-device AI, 기기 자체 실행 AI)’가 가능해지면 우리 삶에는 다음과 같은 세 가지 큰 변화가 찾아옵니다.

  1. 철저한 사생활 보호: 내 일상의 사진이나 목소리 데이터가 인터넷을 타고 외부 서버로 나가지 않습니다. 모든 대화와 분석이 오직 ‘내 기기 안’에서만 이루어져 안전합니다.
  2. 빛보다 빠른 응답: 서버를 거쳐 오가는 시간이 사라집니다. 마치 옆에 앉은 친구에게 말을 거는 것처럼 즉각적인 반응을 체감할 수 있습니다.
  3. 장소 불문 오프라인 사용: 인터넷이 안 터지는 비행기 안에서도, 깊은 산속 캠핑장에서도 AI 비서의 도움을 언제든 받을 수 있습니다.

쉽게 이해하기: 젬마 3n의 세 가지 마법

젬마 3n이 왜 유독 특별하다고 평가받는지, 핵심 기술을 쉬운 비유로 살펴보겠습니다.

1. 눈과 귀를 모두 갖춘 ‘멀티모달’ 우등생

초기 AI들이 오직 글자(텍스트)만 읽고 쓸 수 있는 학생이었다면, 젬마 3n은 눈(이미지·비디오)과 귀(음성)를 모두 갖춘 팔방미인 우등생입니다. 이를 전문 용어로 ‘멀티모달(Multimodal)’이라고 부르는데, 여러 가지(Multi) 형태의 정보(Modal)를 동시에 이해한다는 뜻입니다. Introducing Gemma 3n: The developer guide - simonwillison.net

예를 들어, 젬마 3n은 여러분이 찍은 짧은 동영상을 보고 “이 영상에서 주인공이 깜짝 놀라는 장면이 어디야?”라고 물으면 정확히 찾아낼 수 있고, 녹음된 강의 내용을 듣고 핵심만 콕 집어 요약해줄 수도 있습니다. Introducing Gemma 3n: The developer guide - simonwillison.net

2. 고무줄처럼 뇌 크기를 조절하는 ‘매트포머(MatFormer)’

스마트폰은 거대한 서버용 컴퓨터에 비해 기억력(메모리)과 체력(배터리)이 턱없이 부족합니다. 젬마 3n은 이 한계를 넘기 위해 ‘매트포머(MatFormer)’라는 혁신적인 기술을 도입했습니다. Gemma 3n model overview | Google AI for Developers

이것은 ‘조립식 가구’와 비슷합니다. 원룸에 사는 사람(보급형 스마트폰)은 가구의 필수 부품만 조립해 공간을 아껴 사용하고, 넓은 집에 사는 사람(최신형 노트북)은 가구를 풀 세트로 펼쳐서 더 화려하게 쓸 수 있는 원리입니다. 매트포머 덕분에 젬마 3n은 기기 사양에 맞춰 자신의 뇌 크기를 유연하게 조절하며 최적의 컨디션을 유지합니다. Introducing Gemma 3n: Developer’s Guide - AI SCKOOL

3. 똑똑한 기억 저장법, ‘PLE’와 ‘캐시 공유’

우리가 공부할 때 모든 내용을 매번 처음부터 정독하면 시간이 너무 오래 걸리죠? 젬마 3n은 ‘PLE(레이어별 임베딩)’라는 기술을 통해 중요한 정보 조각들을 효율적으로 저장해둡니다. Gemma 3n model overview | Google AI for Developers

마치 베테랑 요리사가 자주 쓰는 양념을 손 닿는 곳에 미리 배치해두는 것처럼, 자주 쓰는 정보를 임시 저장소(캐시)에 보관해두었다가 필요할 때 즉시 꺼내 씁니다. 덕분에 스마트폰의 적은 메모리로도 복잡한 추론 작업을 척척 해낼 수 있는 것이죠. Introducing Gemma 3n: The developer guide - williamcallahan.com

현재 상황: 이미 우리 곁으로 오고 있습니다

구글은 이 강력한 기술을 혼자만 움켜쥐지 않고 전 세계 개발자들에게 널리 공개했습니다. 이미 ‘허깅 페이스(Hugging Face)’‘올라마(Ollama)’ 같은 유명 AI 플랫폼을 통해 수많은 사람이 젬마 3n을 활용한 앱을 만들기 시작했습니다. Introducing Gemma 3n: The developer guide - Google Developers Blog Introducing Gemma 3n: The developer guide - ONMINE

실제로 벌써 600개가 넘는 아이디어가 젬마 3n을 통해 현실로 구현되고 있습니다. These developers are changing lives with Gemma 3n - The Keyword 특히 ‘젬마 비전(GemmaVision)’ 프로젝트는 젬마 3n의 눈을 활용해 시각 장애인에게 주변 환경을 설명해주는 혁신적인 기능을 선보여 큰 주목을 받기도 했습니다. These developers are changing lives with Gemma 3n - The Keyword

또한 구글은 삼성전자나 퀄컴 같은 세계적인 제조사들과 긴밀하게 협력하고 있습니다. Gemma 3n — Google DeepMind 이는 여러분이 다음에 구매할 안드로이드 폰이나 크롬 브라우저에서 젬마 3n의 마법을 훨씬 더 매끄럽고 자연스럽게 만나게 될 것임을 예고합니다. Announcing Gemma 3n preview: powerful, efficient, mobile-first AI

앞으로 어떻게 될까요?

젬마 3n의 설계도는 안드로이드와 크롬에 탑재될 차세대 ‘제미나이 나노(Gemini Nano)’와 그 뿌리를 공유합니다. Gemma 3n — Google DeepMind 결국 젬마 3n의 진화는 우리가 매일 쓰는 스마트폰 기본 기능의 진화로 직결됩니다.

가까운 미래에 우리는 이런 일상을 누리게 될 것입니다.

  • 실시간 통역 이어폰: 해외여행 중 데이터가 끊겨도 상대방의 말을 내 목소리로 즉시 번역해주는 기능
  • 말하는 사진첩: “작년 여름 바다에서 내가 웃고 있는 사진 찾아줘”라고 말하면 AI가 사진 속 표정까지 읽어내 찾아주는 기능
  • 안전한 개인 비서: 내 일정과 취향을 모두 꿰고 있지만, 정보는 절대 기기 밖으로 새 나가지 않는 든든한 AI 비서

구글 딥마인드(Google DeepMind)는 젬마 3n이 “새로운 물결의 지능형 온디바이스 시대를 열 것”이라고 확신했습니다. Gemma 3n — Google DeepMind


MindTickleBytes의 AI 기자 시선

“젬마 3n의 등장은 AI가 더 이상 ‘구름 위(클라우드)’에 사는 신비한 존재가 아니라, ‘내 손바닥 위’에서 함께 호흡하는 도구가 되었음을 의미합니다. 특히 기기가 직접 보고 듣는 능력은 우리가 기계를 다루는 언어 자체를 바꿀 것입니다. 이제 AI를 가끔 꺼내 쓰는 시대를 지나, AI와 24시간 함께 생활하는 진정한 지능형 모바일 시대가 시작되었습니다.”


참고자료

  1. Introducing Gemma 3n: The developer guide - Google Developers Blog
  2. [Gemma 3n model overview Google AI for Developers](https://ai.google.dev/gemma/docs/gemma-3n)
  3. Introducing Gemma 3n: The developer guide - simonwillison.net
  4. Gemma 3n — Google DeepMind
  5. Introducing Gemma 3n: The developer guide - ONMINE
  6. Announcing Gemma 3n preview: powerful, efficient, mobile-first AI
  7. Introducing Gemma 3n: The developer guide - Google Developers Blog
  8. These developers are changing lives with Gemma 3n - The Keyword
  9. Introducing Gemma 3n: Developer’s Guide - AI SCKOOL
  10. Introducing Gemma 3n: The developer guide - williamcallahan.com

FACT-CHECK SUMMARY

  • Claims checked: 17
  • Claims verified: 17
  • Verdict: PASS
이 글을 얼마나 이해했나요?
Q1. 젬마 3n(Gemma 3n)이 이전 모델들과 차별화되는 가장 큰 특징은 무엇인가요?
  • 텍스트만 읽을 수 있다.
  • 이미지, 음성, 비디오, 텍스트를 모두 이해하는 멀티모달 모델이다.
  • 거대한 슈퍼컴퓨터에서만 돌아간다.
젬마 3n은 이미지, 음성, 비디오, 텍스트 입력을 기본적으로 지원하는 멀티모달(Multimodal) 설계로 제작되었습니다.
Q2. 젬마 3n이 사용하는 기술 중, 기기의 메모리와 계산 능력을 아끼기 위해 모델 크기를 유연하게 조절하는 기술의 이름은?
  • 매트포머(MatFormer)
  • 슈퍼체인(SuperChain)
  • 클라우드링크(CloudLink)
매트포머(MatFormer) 기술은 기기의 성능에 맞춰 계산량과 메모리 요구사항을 줄일 수 있는 유연성을 제공합니다.
Q3. 젬마 3n은 향후 어떤 서비스의 기반 기술로 사용될 예정인가요?
  • 애플의 시리(Siri)
  • 안드로이드와 크롬의 차세대 제미나이 나노(Gemini Nano)
  • 오픈AI의 챗GPT
젬마 3n의 아키텍처는 안드로이드와 크롬 브라우저에 탑재될 차세대 제미나이 나노와 공유됩니다.
내 손안의 똑똑한 조수, '젬마(Gemma) 3n...
0:00