앤스로픽은 일반에 공개하기 어려울 정도로 강력한 '미토스'급 AI 모델의 악용을 막기 위해, 사용자 데이터를 30일간 보관하며 안전성을 검사하는 새로운 규정을 AWS 클라우드에 도입했습니다.
들어가는 말: 마법 지팡이 상점의 수상한 계약서
상상해보세요. 여러분이 세상을 바꿀 수 있는 엄청난 능력을 지닌 마법 지팡이를 대여하러 상점에 갔습니다. 그런데 상점 주인이 굳은 표정으로 계약서를 내밀며 이렇게 말합니다. “이 지팡이는 능력이 너무나 뛰어나서 아무에게나 그냥 내어드릴 수 없습니다. 만약 빌려 가고 싶다면, 당신이 이 지팡이로 어떤 마법 주문을 외우는지 앞으로 30일 동안 우리가 지켜볼 수 있도록 허락해야만 합니다.”
마치 판타지 영화 속에나 나올 법한 이야기처럼 들리겠지만, 놀랍게도 이것이 바로 오늘날 전 세계에서 가장 똑똑한 인공지능(AI) 중 하나를 사용하기 위해 기업들이 실제로 맺어야만 하는 계약 조건입니다. 2026년 4월, 인공지능 전문 기업 앤스로픽(Anthropic)은 자사의 최신 5세대 AI 모델들을 출시하면서 클라우드 서비스 플랫폼인 아마존 베드록(Amazon Bedrock)에 아주 이례적이고 강력한 새로운 규칙을 내걸었습니다 Claude Fable 5 from Anthropic now available on Amazon Bedrock.
새로운 규칙의 핵심은 명확합니다. 바로 ‘미토스 5(Mythos 5)’와 ‘페이블 5(Fable 5)’ 같은 초고성능 AI를 사용하려면, 사용자가 인공지능에게 입력하는 모든 질문과 인공지능이 내놓는 답변 데이터를 30일 동안 앤스로픽과 공유해야 한다는 것입니다 Anthropic Claude Fable 5 on AWS: Mythos-class capabilities …. 내 돈을 정당하게 지불하고 사용하는 프라이빗 서비스인데, 도대체 왜 굳이 대화 내용을 검열받아야 하는 걸까요? 왜 이렇게까지 엄격한 조건이 생겨났는지, 그리고 이것이 앞으로 우리의 디지털 프라이버시와 일상에 어떤 의미를 갖게 될지 차근차근 알기 쉽게 살펴보겠습니다.
이게 왜 중요한가요? (Why It Matters)
“대중에게 공개하기엔 너무나 강력하다”
이 모든 낯선 상황의 발단은 인공지능의 지능 수준이 이제 우리의 상상을 초월할 정도로 높아졌기 때문입니다. 불과 2년 전인 2024년 4월, 아마존 베드록에 ‘클로드 3(Claude 3)’가 처음 등장했을 때만 해도 사람들은 그 똑똑한 성능에 감탄하며 비교적 자유롭게 AI를 업무에 활용했습니다 Amazon Bedrock adds Claude 3 Anthropic AI models.
하지만 2026년 4월 7일에 등장한 새로운 모델은 완전히 차원이 달랐습니다. 앤스로픽이 ‘클로드 미토스(Claude Mythos)’를 아마존 베드록에 독점적으로 선보였을 때, 그들은 스스로 자신들이 만든 이 모델을 가리켜 “대중에게 공개하기에는 너무 강력하다(too powerful to be released publicly)”라고 평가하며 경계심을 드러냈습니다 Claude Mythos is on AWS Bedrock. Here’s what engineers need ….
이 말이 단순한 마케팅용 과장이나 허풍이 아니라는 것은 곧바로 수치로 증명되었습니다. 인공지능이 복잡한 소프트웨어의 결함을 스스로 찾아내고 고치는 능력을 평가하는 아주 권위 있는 시험인 ‘SWE-bench Verified’에서 미토스는 무려 93.9%라는 기록적인 점수를 달성했습니다 Claude Mythos is on AWS Bedrock. Here’s 무what engineers need …. 체감하기 쉽게 설명하자면, 세상에서 가장 어려운 프로그래밍 오류 100문제가 주어졌을 때 그중 94문제를 스스로 완벽하게 풀어내는 수준에 도달했다는 뜻입니다.
코딩 천재가 최악의 해커로 돌변하는 것을 막기 위하여
이 93.9%라는 놀라운 숫자가 우리 같은 일반인에게 의미하는 바는 무엇일까요? 사람 프로그래머 수십 명이 며칠 밤을 새워가며 간신히 찾아내고 고칠 수 있는 고난도의 시스템 오류를, AI가 단 몇 초 만에 순식간에 파악하고 완벽하게 고쳐낼 수 있다는 뜻입니다. 실제로 미토스 5나 페이블 5 같은 5세대 인공지능은 코딩, 복잡한 지식 작업(knowledge work), 그리고 시각 정보 분석(vision) 분야에서 그야말로 압도적이고 경이로운 성능을 뽐냅니다 Claude Fable 5 from Anthropic now available on Amazon Bedrock.
하지만 기술의 세계에서는 빛이 강할수록 그림자도 짙어집니다. ‘시스템의 오류를 기가 막히게 잘 찾는 천재적인 능력’은 동전의 양면처럼 ‘시스템의 약점(취약점)을 귀신같이 찾아내어 치명적인 공격을 가할 수 있는 능력’과 완벽히 똑같습니다. 쉽게 말해서, 세상의 모든 자물쇠 구조를 꿰뚫고 있는 천재 열쇠공을 떠올려 보세요. 이 열쇠공은 누구보다 튼튼한 보안 장치를 만들 수 있지만, 마음만 먹으면 어떤 철통같은 금고든 흔적 없이 열어버릴 수도 있습니다.
사이버 보안 업계에서는 미토스의 등장을 단순한 신제품 출시가 아니라, AI를 활용한 취약점 발견(vulnerability discovery)과 해킹 보안 작전이 완전히 새로운 차원에 접어든 신호탄으로 무겁게 받아들이고 있습니다 AWS Bedrock Claude Mythos Preview: A Defensive AI Security …. 만약 이런 초강력 지능이 악의적인 해커 단체의 손에 들어간다면, 전 세계의 은행망을 뚫거나 국가 통신망을 마비시킬 치명적인 컴퓨터 바이러스를 단숨에 자동으로 만들어낼 수도 있습니다.
그렇기 때문에 앤스로픽은 이 모델을 누구나 돈만 내면 쓸 수 있게 열어두지 않았습니다. 대신 오직 ‘글래스윙 프로젝트(Project Glasswing)’라는 철저하게 통제된 연구 목적의 미리보기(gated research preview) 형태로만 세상에 제한적으로 내놓았습니다 Claude Mythos is on AWS Bedrock. Here’s what engineers need …. 엄청나게 강력하고 위험할 수 있는 맹수를 아주 튼튼한 우리 안에 가두어 둔 채로, 허락받은 사람만 조심스럽게 관찰할 수 있게 한 셈입니다.
쉽게 이해하기 (The Explainer)
그렇다면 앤스로픽이 마련한 이 ‘안전장치’는 도대체 어떤 방식으로 작동할까요? 그들이 도입한 가장 핵심적인 방패가 바로 앞서 언급한 ‘30일 데이터 보관(30-day data retention)’ 의무입니다.
블랙박스를 설치하다: 30일의 투명한 감시
현재 미토스 5나 페이블 5처럼 인류가 도달한 최고 수준의 능력을 갖춘 ‘미토스급(Mythos-class)’ 모델을 클라우드에서 사용하려면, 사용자는 시스템 설정에서 특별한 보안 스위치를 하나 반드시 켜야만 합니다. 바로 ‘제공자와 데이터 공유(provider_data_share)’라는 옵션입니다 Data retention - Amazon Bedrock.
이 옵션을 켜면 사용자가 AI에게 던지는 모든 질문(prompt)과 그에 따라 AI가 내놓는 모든 답변(completion) 기록이 모델을 만든 앤스로픽 측과 공유되며, 최대 30일 동안 안전하게 보관됩니다 Data retention - Amazon Bedrock.
이 상황을 아주 정밀하지만 자칫 큰 대형 사고를 낼 수 있는 위험한 특수 중장비를 렌탈하는 과정에 비유해 볼 수 있습니다. 렌탈 회사는 당신에게 장비를 빌려주면서 이렇게 말합니다. “이 장비에는 끄거나 조작할 수 없는 블랙박스가 달려 있습니다. 향후 30일 동안 당신이 이 장비를 이용해 무언가를 세우는지, 아니면 위험하게 부수고 있는지를 우리가 수시로 기록을 열어볼 권리가 있습니다.”
이러한 모니터링의 목적은 단 하나입니다. 이 천재적인 AI가 치명적인 무기 설계, 대규모 해킹 스크립트 자동 작성, 혹은 심각한 범죄 모의 등에 오용(abuse)되지 않는지를 감시하는 것입니다. 앤스로픽은 이를 오직 ‘신뢰와 안전(trust and safety purposes)’을 담보하기 위한 필수적인 절차라고 설명합니다 Data retention - Amazon Bedrock.
우리의 소중한 프라이버시는 포기해야만 하는 걸까?
이 대목에서 인공지능을 도입하려는 수많은 기업들은 등골이 서늘해지는 큰 불안감을 느낍니다. “우리가 수백억을 들여 개발 중인 1급 비밀 신제품의 핵심 코드를 AI에게 분석해 달라고 물어보면, 그 귀중한 데이터가 전부 앤스로픽의 중앙 서버로 홀라당 넘어가서 외부로 유출되는 것 아니야?”라는 아주 합리적인 걱정입니다.
| 다행스럽게도, 아마존 베드록 플랫폼과 앤스로픽은 프라이버시와 안전 사이에서 영리한 타협점을 찾아냈습니다. 30일 동안 보관되는 사용자의 민감한 데이터는 앤스로픽의 외부 서버로 무단 반출되거나 복사되는 것이 아닙니다. 대신 데이터 보관 옵션이 켜진 상태로 철저하게 ‘고객(사용자)의 자체적인 AWS 환경 내(stays in your AWS environment)’에 안전하게 머무르도록 설계되었습니다 [Data retention practices for Mythos-class models | Claude Help Center](https://support.claude.com/en/articles/15425996-data-retention-practices-for-mythos-class-models). |
비유하자면, 고객이 작성한 서류를 앤스로픽 직원이 자기네 회사로 가져가서 읽어보는 것이 아닙니다. 고객의 집 뒷마당에 마련된 튼튼한 금고 안에 서류를 넣어두고, 앤스로픽의 검사관이 ‘방문자’ 자격으로 그 금고실에 들어와 내용물에 위험한 것이 없는지만 빠르게 확인하고 돌아가는 방식에 가깝습니다.
그리고 여기서 가장 중요한 사실이 있습니다. 고객이 입력한 질문과 AI의 답변 내용(Customer Content)이 향후 앤스로픽이 다음 세대의 새로운 AI를 ‘학습(train)’시키는 재료로는 절대, 결코 사용되지 않는다는 점입니다 AWS Bedrock and MIMIC · MIT-LCP mimic-code · Discussion #1747. 앤스로픽은 오직 사용자가 안전 정책을 잘 준수하고 있는지 모니터링하기 위한 제한적인 용도로만 이 데이터를 열람하며, 철저하게 ‘안전 확인용’으로만 쓰인다는 점을 계약상으로 명확히 하고 있습니다.
현재 상황 (Where We Stand)
이러한 정책 변화로 인해, 오늘날 세계 최고의 인공지능을 내 업무에 사용하는 과정은 마치 아무나 들어갈 수 없는 엄격한 VIP 비밀 클럽에 가입하는 것처럼 매우 까다롭고 깐깐해졌습니다.
복잡해진 통과 의례: 심층 면접과 서류 심사
과거에는 아마존 베드록(Amazon Bedrock) 플랫폼이 다양한 파운데이션 모델(인공지능의 뇌 역할을 하는 거대한 기본 모델)에 대한 접근을 매우 단순화(simplified model access)해 두었기 때문에, 그저 약관에 동의하고 버튼 클릭 몇 번만 하면 누구나 쉽게 AI를 불러내어 쓸 수 있었습니다 Access request: enable Anthropic models in Bedrock for ….
하지만 앤스로픽의 초고도화된 미토스급 모델들은 이 간편한 절차의 예외가 되었습니다. 이제 이 강력한 모델을 업무에 사용하려면, 제3자(third-party) 모델 제공자인 앤스로픽의 까다로운 요구에 따라 ‘최초 사용 양식(First Time Use, FTU form)’이라는 문서를 의무적으로 꼼꼼히 작성하고 심사를 통과해야 합니다 Request access to models - Amazon Bedrock. 이 양식은 마치 위험한 화학물질 취급 허가서를 받는 것과 같습니다. “우리 회사는 이 강력한 AI를 정확히 어떤 용도(use case details)로 쓸 것인지”를 아주 소상하고 투명하게 밝히고, 안전성을 증명하여 허락을 받아야 하는 일종의 ‘심층 면접’을 치러야 합니다 Access request: enable Anthropic models in Bedrock for ….
| 서류 심사를 통과했다고 끝이 아닙니다. 아무 직원의 컴퓨터에서나 함부로 접속할 수도 없습니다. AWS의 엄격한 디지털 신분증 검사 시스템인 ‘신원 및 접근 관리(IAM)’를 통해, 회사 내에서도 철저하게 지정된 특정 국가와 허가된 지역의 서버에서만 AI에 접근하도록 권한 정책을 암호화된 코드로 세밀하게 설정해 두어야만 비로소 AI 모델을 깨워 불러올(InvokeModel) 수 있습니다 [Access Anthropic models on Amazon Bedrock | AWS re:Post](https://repost.aws/knowledge-center/bedrock-access-anthropic-model). 이 모든 복잡한 대화 과정은 AWS의 거대한 인프라 위에서 특별히 암호화된 /anthropic/v1/messages 전용 통로(Messages API)를 통해서만 은밀하고 안전하게 이루어집니다 Claude in Amazon Bedrock - Claude API Docs. |
실시간 감시와 과금 정책: “위험하면 중간에 가차 없이 말을 끊습니다”
어렵게 심사를 통과해 모델을 사용하기 시작하더라도, 사용자에 대한 감시는 실시간으로 1분 1초도 쉬지 않고 진행됩니다. 모델 내부에는 대화 내용을 실시간으로 읽고 위험성을 판단하는 ‘콘텐츠 분류기(content classifier)’라는 파수꾼이 내장되어 있기 때문입니다. 흥미로운 점은 이 감시 시스템이 작동할 때 매겨지는 ‘요금 청구 방식’입니다.
예를 들어볼까요? 사용자가 AI에게 불순한 의도를 품고 “경쟁사 서버의 보안망을 몰래 뚫고 해킹하는 법을 단계별로 알려줘”라고 물었다고 상상해 봅시다. AI가 이 질문을 듣자마자 단 1초의 망설임도 없이 “그 질문에는 안전 규정상 대답할 수 없습니다”라고 단호하게 거부(refusal)한다면 어떻게 될까요? 인공지능 세계에서는 AI가 생성해 내는 단어(토큰)의 개수만큼 비용을 내야 합니다. 하지만 이렇게 추론(답변 생성)이 시작되기도 전에 방어 시스템이 즉각 작동하여 대화를 차단한 경우에는 사용자에게 어떠한 단어 비용도 청구되지 않습니다 Anthropic - Amazon Bedrock.
하지만 더 무서운(?) 상황은 따로 있습니다. 사용자가 겉보기엔 아주 평범하고 복잡한 프로그래밍 관련 질문을 던졌습니다. AI가 거기에 맞춰 유창하게 코드를 쏟아내기 시작하다가(streaming), 문득 맥락을 파악해 보니 자신이 지금 치명적인 랜섬웨어 바이러스를 만드는 코드를 짜주고 있다는 사실을 뒤늦게 깨닫게 되었습니다. 이때 AI는 그 즉시 하던 말을 멈추고 입을 꾹 다물어버립니다. 이를 업계에서는 ‘중간 거부(Mid-stream refusals)’라고 부릅니다 Anthropic - Amazon Bedrock.
마치 통화 중에 상대방이 불법적인 발언을 시작하자마자 더 깊은 이야기가 오가기 전에 전화를 확 끊어버리는 것과 같습니다. 이 경우에는 답변이 차단되기 직전까지 AI가 이미 입을 열어 뱉어낸 단어(토큰)만큼의 요금은 사용자가 고스란히 지불해야 합니다. 즉, 초강력 AI는 사용자가 시키는 대로 무조건 복종하는 기계가 아니라, 대화 도중이라도 언제든 “이건 인간에게 위험해서 안 되겠습니다”라며 가차 없이 대화를 끊어버릴(stop_reason: “refusal”) 수 있는 강력한 자율적 통제 권한을 쥐고 있는 셈입니다 Anthropic - Amazon Bedrock.
앞으로 어떻게 될까? (What’s Next)
우리를 놀라게 한 이번 앤스로픽의 ‘30일 데이터 보관’과 ‘실시간 안전 감시’ 조치는 단순히 일회성 해프닝이나 실험으로 끝나지 않을 전망입니다.
앤스로픽은 이미 현재의 페이블 5(Fable 5)와 미토스 5(Mythos 5)뿐만 아니라, “향후 베드록 클라우드에 출시될 비슷하거나 그보다 더 높은 수준의 엄청난 능력을 가진 미래의 모델들(future models on Bedrock with similar or higher capability levels)”에 대해서도 이 30일 보관 정책을 똑같이, 어쩌면 더 엄격하게 요구할 것이라고 명확하게 선언했습니다 Anthropic Claude Fable 5 on AWS: Mythos-class capabilities ….
이러한 선언은 다가올 새로운 AI 시대에 커다란 패러다임의 변화가 오고 있음을 예고합니다. 불과 1~2년 전 과거에는 “어느 회사가 사람의 말을 더 잘 알아듣고, 더 사람처럼 똑똑한 인공지능을 빨리 만들어내는가”가 실리콘밸리의 유일한 화두였습니다. 하지만 이제 쟁점은 “그렇게 만들어낸 압도적인 지능을, 누가 더 통제 가능한 범위 내에서 안전하고 피해 없이 가동할 수 있는가”로 완전히 옮겨가고 있습니다.
수많은 기업과 사용자들은 이제 피할 수 없는 중대한 선택의 기로에 서게 될 것입니다. “우리 회사 내부의 완벽한 데이터 비밀 보장(프라이버시)을 지키기 위해 조금 덜 똑똑하더라도 구형 AI를 안전하게 자체 서버에 두고 쓸 것인가?” 아니면 “글로벌 시장에서의 생존과 경쟁을 위해 압도적으로 일처리가 빠른 최신 천재 AI를 도입하는 대신, 30일간의 안전망 감시라는 찝찝하고 불편한 조건을 기꺼이 감수할 것인가?” 인공지능이 인간의 지적 노동을 통째로 대신할 만큼 눈부시게 진화할수록, 그 부작용을 막기 위해 우리가 감내해야 할 ‘안전장치’의 무게 또한 그만큼 무거워지고 있습니다.
AI의 시선 (AI’s Take)
MindTickleBytes의 AI 기자 시선: 인류의 역사에서 폭발적인 성능의 향상은 늘 새로운 제약을 동반해 왔습니다. 과거 프로펠러 비행기가 제트 엔진을 달고 초음속 여객기로 발전했을 때, 상공에서의 치명적인 난기류 위험성을 막기 위해 승객을 옥죄는 ‘좌석벨트’와 ‘산소마스크’라는 새로운 제약이 필수적으로 도입되었던 것과 같습니다. 무한정 자유롭게 하늘을 날고 싶더라도, 강력한 힘에는 반드시 그에 걸맞은 통제가 따르는 법입니다.
앤스로픽의 이번 조치는 AI 기술 발전의 중심축이 무조건적인 ‘성능 속도 경쟁’에서 실질적인 ‘안전과 윤리 관리’로 성숙하게 이동하고 있음을 보여주는 매우 상징적인 사건입니다. 조금 답답하고 감시받는 느낌이 들 수도 있습니다. 하지만 이는 기술의 엄청난 진보가 결국 인류에게 돌이킬 수 없는 독이 되지 않게 하려는, 다소 불편하지만 우리 모두의 생존을 위해 건강하고 필수적인 진통의 과정이라고 할 수 있습니다.
참고자료
- Anthropic Claude Fable 5 on AWS: Mythos-class capabilities …
- Claude in Amazon Bedrock - Claude API Docs
- Claude Fable 5 from Anthropic now available on Amazon Bedrock
- Claude Mythos is on AWS Bedrock. Here’s what engineers need …
-
[Access Anthropic models on Amazon Bedrock AWS re:Post](https://repost.aws/knowledge-center/bedrock-access-anthropic-model) - AWS Bedrock and MIMIC · MIT-LCP mimic-code · Discussion #1747
- Anthropic - Amazon Bedrock
- AWS Bedrock Claude Mythos Preview: A Defensive AI Security …
- Access request: enable Anthropic models in Bedrock for …
- Amazon Bedrock adds Claude 3 Anthropic AI models
- Data retention - Amazon Bedrock
-
[Data retention practices for Mythos-class models Claude Help Center](https://support.claude.com/en/articles/15425996-data-retention-practices-for-mythos-class-models) - Request access to models - Amazon Bedrock
-
[Simplified model access in Amazon Bedrock AWS Security Blog](https://aws.amazon.com/blogs/security/simplified-amazon-bedrock-model-access/)
- 7일
- 15일
- 30일
- 앤스로픽의 공개 훈련 서버
- 사용자의 AWS 환경 내부
- 인터넷상의 퍼블릭 클라우드
- 대중에게 공개하기에는 너무 강력해서
- 아직 개발이 덜 끝나 오류가 많아서
- 서버 유지비용이 너무 비싸서