AI가 수십억 원이 오가는 금융 문서를 분석한다면? '검증 가능한 AI'의 등장

AI Summary

금융 연구 스타트업 케플러(Kepler)는 AI 모델인 클로드를 단독으로 쓰지 않고 엄격한 통제 시스템 안에 가두는 방식으로, 금융권의 까다로운 감사와 규제를 통과하는 신뢰도 높은 AI 시스템을 구축했습니다.

상상해보세요. 당신이 수백억 원의 고객 자산을 운용하는 글로벌 투자 은행의 책임자입니다. 매일 아침 당신의 책상 위에는 수십 개의 기업에서 발행한 수천 장의 재무제표와 두꺼운 투자 보고서가 산더미처럼 쌓입니다. 이 방대한 자료를 분석하기 위해, 당신은 세상에서 가장 똑똑하다는 최신 AI 비서를 도입했습니다.

아침 일찍 AI에게 “A 기업의 작년 4분기 실질 부채 비율을 정리해줘”라고 지시합니다. AI는 단 3초 만에 깔끔한 표와 그래프가 포함된 보고서를 내놓습니다. 당신은 그 숫자를 굳게 믿고 막대한 금액의 투자 버튼을 누릅니다.

그런데 며칠 뒤, 그 숫자가 AI가 문맥을 오해해서 지어낸 ‘그럴듯한 거짓말’이었음이 밝혀집니다. 회사는 천문학적인 손실을 보았고, 금융감독 당국이 즉각 조사를 나옵니다. “왜 이런 치명적인 결정을 내렸습니까?”라는 조사관의 날 선 질문에 당신은 “AI가 그렇게 분석해서요”라고 답할 수 있을까요?

절대 불가능합니다. 이것이 바로 전 세계 월스트리트와 금융권이 대규모 언어 모델(LLM, 수많은 텍스트 데이터를 학습해 인간처럼 문장을 이해하고 생성해내는 인공지능 기술)의 엄청난 능력 앞에서도 선뜻 지갑을 열지 못하고 주저했던 핵심적인 이유입니다. 작은 계산 실수 하나가 치명적인 금전적 손실로 이어지는 금융 산업에서, 판단 과정이 투명하지 않은 AI에게 결정권을 넘기는 것은 눈을 가리고 시속 200km로 고속도로를 달리는 ‘위험한 도박’에 가깝기 때문입니다.

그런데 최근, 이 철옹성 같은 금융권의 팽배한 불안감을 잠재운 획기적인 사례가 등장했습니다. 바로 신뢰할 수 있는 금융 서비스를 위한 ‘검증 가능한 AI(Verifiable AI)’ 플랫폼을 구축하는 데 집중하고 있는 연구 기반 스타트업, 케플러(Kepler)의 이야기입니다 [출처 제목]. 이들은 과연 어떻게 보수적이고 까다로운 금융업계의 마음을 단숨에 사로잡았을까요?

이게 왜 중요한가요? (Why It Matters)

우리가 일상에서 재미로 쓰는 챗봇 AI가 가끔 세종대왕이 맥북을 던졌다는 식의 엉뚱한 소리를 하는 것을 본 적이 있으실 겁니다. 이를 전문 용어로 할루시네이션(Hallucination, 환각 현상)이라고 부릅니다. 친구들과의 일상적인 대화나 가벼운 글쓰기에서는 그냥 한 번 웃고 넘길 수 있는 해프닝이지만, 단 1원의 오차도 허용되지 않는 금융권에서는 회사의 존폐를 가를 수 있는 대형 사고입니다.

금융 서비스 회사는 우리가 상상하는 것 이상으로 엄격하고 숨 막히는 규제 환경 속에서 움직입니다. 특히 브라질의 중앙은행(Banco Central)이나 증권거래위원회(CVM) 같은 강력한 금융 당국의 가이드라인과 규제를 만족시키기 위해서는, 회사가 내린 모든 재무적 판단과 결정이 명확한 근거를 가져야 하고 언제든 역추적 조사가 가능해야 합니다 [출처 제목].

단순히 “최종 계산 결과가 맞다”는 것만으로는 턱없이 부족합니다. “어떤 데이터를 바탕으로, 어떤 계산 공식을 거쳐, 왜 이런 결과가 나왔는지”를 수학 시험에서 풀이 과정을 적어 내듯 낱낱이 증명할 수 있는 ‘감사 가능성(Auditability)’이 생명입니다.

이처럼 세계에서 가장 깐깐한 규제 및 감사 요구 사항을 충족해야 하는 살얼음판 같은 금융 환경에서, 케플러는 앤스로픽(Anthropic)사의 AI 모델인 ‘클로드(Claude)’를 핵심 두뇌로 삼아 자신들만의 독창적이고 안전한 AI 플랫폼을 완성해 냈습니다 [출처 제목]. 이들의 성공은 “과연 금융권이 변덕스러운 AI를 온전히 믿고 쓸 수 있을까?”라는 근본적인 질문에 대한 가장 현실적이고 모범적인 해답을 제시하고 있다는 점에서 정보통신(IT) 업계와 금융계 모두에 매우 중요한 의미를 지닙니다.

쉽게 이해하기: 오프로드 차량을 기차 레일 위에 올리다

그렇다면 케플러는 천재적이지만 가끔 엉뚱한 실수를 저지르는 AI를 어떻게 ‘절대 거짓말을 하지 않는 믿을 수 있는 금융 전문가’로 탈바꿈시켰을까요? 그 놀라운 비밀은 AI의 지능을 더 키우는 데 집중한 것이 아니라, AI를 대하는 철학 자체를 180도 바꾼 것에 있습니다.

케플러 팀은 클로드를 개발한 앤스로픽 측과의 심도 깊은 사례 연구를 통해 매우 중요한 결론을 도출하고 이를 공유했습니다. 그것은 바로 “금융 분야에서, AI 모델 혼자서 전체 시스템 그 자체가 되도록 내버려 두어서는 절대 안 된다”는 것입니다 [출처 제목]. 즉, 예측 불가능한 AI에게 무한한 자유를 주면 안 된다는 깨달음이었습니다.

이러한 치명적인 문제를 해결하기 위해 케플러는 인공지능을 빈틈없이 감싸고 도는 ‘결정론적 인프라(Deterministic Infrastructure)’라는 것을 단단하게 구축했습니다. 이 인프라는 쉽게 말해서 AI가 딴생각을 하거나 예상치 못한 행동을 하지 못하도록 막아주는 강력한 ‘신뢰 및 검증의 통제 방어막(Layer)’ 역할을 합니다 [출처 제목].

전문가들이 말하는 이 ‘결정론적 인프라’라는 어려운 개념은 비유하자면 이렇습니다. 일반적인 AI 기술은 목적지 없이 산이든 들이든 사방으로 자유롭게 달릴 수 있는 성능 좋은 ‘오프로드 차량’과 같습니다. 빠르고 강력하지만, 통제가 조금만 빗나가도 언제 어디로 튈지 몰라 절벽으로 떨어질 위험이 항상 존재합니다. 반면, 케플러가 구축한 결정론적 인프라는 이 고성능 차량의 고무 바퀴를 아예 떼어내고, 목적지가 정해진 단단한 ‘강철 레일(기찻길)’ 위에 올려놓은 것과 같습니다. AI가 가진 강력한 엔진의 힘(뛰어난 언어 처리 및 문서 분석 능력)은 그대로 쓰되, 차가 움직일 수 있는 방향과 멈춰야 할 곳을 인간이 만든 엄격하고 결정적인 규칙으로 완벽하게 제한해버린 것이죠.

쉽게 이해하기: 똑똑한 알바생에게 ‘모른다’고 말하는 법 가르치기

케플러는 단순히 AI의 길을 제한하는 것에서 한 발 더 나아갔습니다. AI에게 무작정 “이 두꺼운 재무제표 100페이지를 전부 분석해서 결론을 내놔”라고 덩어리째 던져주는 대신, 업무를 아주 잘게 쪼개어 ‘정확하게 정의된 작업(Precisely defined tasks)’만을 하나씩 차례대로 지시했습니다.

또한 체계화된 금융 분야의 복잡한 전문 지식과 용어 사전들을 AI에게 미리 쥐여주어, AI가 스스로 판단해야 하는 불확실성의 영역을 최소화했습니다. 여기서 가장 인상적이고 핵심적인 부분은, AI가 스스로 판단해서 ‘해결해야 할 문제(Resolve)’와 본인의 능력을 벗어났다고 판단해 반드시 인간 전문가에게 ‘넘겨야 할 문제(Escalate)’ 사이의 엄격한 경계(Hard boundaries)를 설정했다는 점입니다 [출처 제목].

이것 역시 일상적인 상황으로 설명해 보겠습니다. 여러분이 암산 능력이 타의 추종을 불허하는 천재 아르바이트생(AI)을 은행 대출 창구에 고용했다고 가정해봅시다. 이 직원은 숫자 계산에는 천재지만, 복잡하게 얽힌 금융법의 미묘한 뉘앙스나 고객의 숨겨진 의도는 잘 모릅니다. 이때 이 신입 직원에게 은행의 모든 대출 심사 권한을 전적으로 위임하는 사장은 없을 것입니다.

대신, “고객의 기본 신원 정보 확인과 서류의 단순 숫자 계산까지만 네가 확실하게 처리하고(해결), 조금이라도 의심스러운 위조 서류가 보이거나 100만 원 이상의 큰 대출 승인 건이 들어오면 네가 스스로 판단하지 말고 무조건 내게 결재 서류를 넘겨라(인간에게 이관)”라고 엄격한 행동 지침서를 줍니다. 케플러가 클로드를 다루는 방식이 정확히 이와 같습니다. 똑똑하다고 해서 혼자서 모든 것을 다 판단하게 내버려 두지 않는 것. 역설적이게도 AI에게 “나는 여기서부터는 잘 모릅니다. 인간 전문가님, 도와주세요”라고 명확히 선을 그을 수 있게 만든 것이, 금융권이 AI를 100% 믿을 수 있게 만든 가장 큰 비결입니다.

현재 상황: 복잡한 각주(Footnotes)까지 읽어내는 집요함

이렇게 단단한 목줄과 명확한 가이드라인을 갖게 된 클로드는 케플러의 통제 시스템 안에서 그야말로 엄청난 능력을 뽐내고 있습니다. 지금 치열한 금융업계 현장에서 실질적으로 요구하는 것은 단순한 뉴스 기사 요약이나 인사말 작성이 아닙니다.

이와 관련해 케플러의 플랫폼이 정확히 어떤 실무적인 목적으로 만들어졌는지, 관련 업계 최전선에서 일하는 전문가의 목소리를 들어보면 현재 상황을 가장 정확히 알 수 있습니다. 최근 업계의 한 전문가는 이렇게 강조했습니다. “지금 금융권의 모든 AI 관련 대화는 ‘능력(Capability)’에 초점이 맞춰져 있습니다. 모델이 복잡한 다단계 분석(Multi-step analysis)을 제대로 처리할 수 있는가? 문서 구석에 적힌 각주(Footnotes, 본문 밑에 작게 적힌 보충 설명)까지 꼼꼼하게 읽어낼 수 있는가? 그것이 바로 우리가 케플러를 만든 이유입니다.” [출처 제목]

보통 사람들은 잘 안 읽고 넘어가지만, 막대한 자금의 투자와 대출이 결정되는 금융 문서에서 각주는 치명적인 독약이 될 수도 있고 황금 열쇠가 될 수도 있습니다. 예를 들어, 기업 보고서 본문에는 커다란 글씨로 “올해 영업 이익이 100억 원 증가했다”고 화려하게 적혀 있지만, 맨 밑바닥 눈에 보이지도 않는 아주 작은 글씨의 각주에 “단, 이는 본업과 무관한 일회성 공장 부지 매각 대금임”이라고 적혀 있는 식입니다. 사람도 피곤하면 놓치기 쉬운 부분입니다.

과거의 엉성하게 학습된 AI들은 이런 미세한 디테일의 중요성을 모르고 전체적인 분위기만 파악해 뭉개버리기 일쑤였습니다. 하지만 명확한 임무와 철저한 단계별 통제 시스템을 부여받은 케플러 안의 클로드는 여러 단계를 끈질기게 거쳐야 하는 복잡한 재무 추론은 물론, 숨겨진 각주의 의미가 전체 재무 상태에 미치는 영향까지 정확하게 짚어내고 있습니다. 인간의 실수는 줄이고, AI의 약점은 완벽히 차단한 셈입니다.

앞으로 어떻게 될까? (What’s Next)

케플러의 이번 성과는 단지 기술력 좋은 핀테크 스타트업 하나의 반짝 성공 사례로 끝나지 않을 것입니다. 이들이 뚝심 있게 보여준 ‘검증 가능한 AI’ 플랫폼의 설계 구조는 앞으로 AI 도입을 주저하던 수많은 산업에 거대한 변화의 바람을 불러일으킬 것입니다.

특히 금융뿐만 아니라 의료, 법률, 국방, 제약 등 작은 오류 하나가 사람의 생명을 앗아가거나 막대한 재산 피해로 직결될 수 있는 모든 ‘고위험-고규제’ 산업군에 케플러의 방식은 훌륭한 교과서이자 청사진이 될 것입니다. 의사의 오진을 막기 위해 철저한 논리적 검증 단계를 거치는 의료용 AI나, 수만 건의 법적 판례를 분석할 때 환각 현상을 0%로 통제해야 하는 법률 AI 등이 모두 이와 같은 ‘결정론적 인프라’를 차용하게 될 것입니다.

우리는 그동안 AI 모델 자체가 얼마나 더 사람처럼 똑똑해지는지, 데이터를 얼마나 더 많이 학습하는지에만 열광해 왔습니다. 하지만 진짜 산업의 혁신은 그 뛰어난 지능을 ‘어떻게 안전하고 통제 가능한 바구니에 담아 불안정한 현실 세계에 적용할 것인가’에 달려 있다는 것을 케플러가 명확히 증명해 보였습니다.

앞으로 전 세계 AI 기업들의 경쟁 무대는 완전히 달라질 것입니다. “누가 더 시나 소설을 잘 쓰는 사람 같은 AI를 만드는가”에서 “누가 더 깐깐한 정부 감사관의 송곳 같은 질문에 완벽한 근거 수식을 대며 방어할 수 있는 AI 시스템을 만드는가”로 핵심 패러다임이 빠르게 이동할 것입니다.

MindTickleBytes AI의 시선
기술의 발전은 종종 브레이크 없는 최고급 스포츠카처럼 아찔하고 위태로워 보입니다. 혁신이라는 이름 아래 속도에만 집착하다 보면, 결국 신뢰라는 가장 중요한 안전벨트를 놓치기 십상입니다.

하지만 케플러의 사례는 AI의 진정한 가치와 폭발력이 ‘무한한 자유와 자율성’이 아니라 역설적이게도 ‘정교한 통제와 명확한 한계 설정’ 속에서 피어난다는 것을 아주 잘 보여줍니다. 인간의 판단을 완벽히 대체하겠다며 홀로 폭주하는 AI는 결코 규제의 두꺼운 벽을 넘을 수 없습니다.

대신, 인간이 촘촘하게 설계한 엄격한 규칙과 울타리 속에서 인간의 피할 수 없는 약점(시간 부족, 체력 저하, 방대한 데이터 앞에서의 집중력 감소)을 조용히 보완해 주는 투명하고 검증 가능한 도구. 그것이 우리가 현실에서 맞이하게 될 가장 이상적이고 안전한 미래의 AI 모델일 것입니다. 인공지능이 우리 삶의 핵심 인프라에 진정으로 스며들기 위한 마지막 관문은 결국 ‘지능’의 높낮이가 아니라 ‘신뢰’의 깊이입니다.

참고자료

Share this article:

이 글을 얼마나 이해했나요?

Q1. 금융 서비스를 위해 케플러(Kepler)가 도입한 AI 모델의 핵심 기반은 무엇인가요?

스스로 모든 결정을 내리는 자율형 AI
결정론적 인프라 위에서 작동하는 클로드(Claude)
감사를 회피하도록 설계된 언어 모델

케플러는 앤스로픽의 클로드(Claude)를 활용하되, 이를 엄격한 '결정론적 인프라'라는 통제 시스템 위에 구축하여 신뢰성을 확보했습니다.

Q2. 케플러 플랫폼이 일반적인 챗봇 AI와 가장 크게 다른 점은 무엇인가요?

더 많은 인터넷 유머를 학습했다.
해결할 문제와 인간에게 넘길 문제를 엄격하게 구분한다.
모든 규제 기관의 검사를 자동으로 무시한다.

케플러는 AI가 스스로 해결할 영역과 인간 전문가에게 넘겨야 할(escalate) 영역의 경계를 엄격하게 설정해 두었습니다.

Q3. 금융 분야에서 AI를 사용할 때 가장 중요한 요소로 본문에서 강조된 것은 무엇인가요?

문장 생성의 창의성
유행어 사용 빈도
감사 가능성과 규제 준수

금융업계는 중앙은행 등의 엄격한 감사를 받기 때문에, AI의 판단 과정을 추적하고 검증할 수 있는 '감사 가능성'이 필수적입니다.