해커 잡는 AI 특공대? 스스로 해킹하고 고치는 '멀티 에이전트' 기술의 현재

AI Summary

여러 AI가 팀을 이뤄 소프트웨어의 보안 구멍을 찾아내고 공격을 시연하는 '멀티 에이전트' 기술이 빠르게 발전하고 있지만, 복잡한 웹 서비스 환경에서는 아직 한계가 존재합니다.

상상해보세요. 이른 아침, 당신이 출근하기도 전입니다. 간밤에 전 세계 사람들이 매일 쓰는 메신저 앱 어딘가에서 새로운 해킹 통로가 발견되었다는 경고가 떴습니다. 과거라면 어땠을까요? 보안 엔지니어들이 비상 연락을 받고 허겁지겁 출근해, 진한 커피를 들이켜며 몇 시간, 혹은 며칠 동안 수백만 줄의 코드를 뜯어보고 테스트 환경을 구축하며 방어벽을 세워야 했을 겁니다.

그런데 지금은 다릅니다. 인간이 깊이 잠든 사이, 여러 개의 인공지능(AI)이 스스로 가상의 ‘보안 특공대’를 꾸립니다. 한 AI는 시스템의 도면을 띄워 작전을 짜고, 다른 AI는 가상의 해커가 되어 코드를 직접 공격해 보며, 또 다른 AI는 그 결과를 실시간으로 분석합니다. 출근 시간이 되자, 이 AI 특공대는 취약점 분석 보고서와 함께 완벽한 공격 시연 영상, 심지어 문제를 흔적 없이 해결할 ‘수정 코드’까지 책상 위에 가지런히 올려둡니다.

공상과학 영화 속 이야기 같나요? 아닙니다. 이는 현재 글로벌 AI 연구자들과 사이버 보안 전문가들이 실제로 치열하게 구축하고 있는 ‘자동화된 취약점 발견 및 재현을 위한 멀티 에이전트 LLM 시스템(Multi-Agent LLM System for Automated Vulnerability Discovery and Reproduction)’의 놀라운 현실입니다.

챗GPT(ChatGPT)로 대표되는 대규모 언어 모델(LLM, 방대한 텍스트 데이터를 학습해 인간처럼 언어를 이해하고 생성하는 인공지능)은 이제 단순히 글을 쓰고 그림을 그리는 비서 역할을 넘어섰습니다. 컴퓨터 시스템의 가장 깊고 은밀한 곳을 파고들며 사이버 보안의 지형을 근본적으로 바꾸고 있죠. 과연 이 AI 해커 특공대는 어떻게 작동하며, 현재 어디까지 와 있을까요? 그리고 왜 우리는 이 낯선 기술에 당장 주목해야 할까요?

이게 왜 중요한가요? (Why It Matters)

우리가 매일 밥 먹듯이 사용하는 스마트폰 앱, 은행 웹사이트, 인터넷 쇼핑몰 등 모든 디지털 서비스는 수십만에서 수백만 줄의 코드로 이루어져 있습니다. 비유하자면 끝없이 펼쳐진 거대한 도서관의 빽빽한 책장들과 같습니다. 사람이 이 방대한 코드를 직접 작성하다 보니 필연적으로 작은 오탈자 같은 실수가 발생하고, 해커들은 바로 그 미세한 틈을 타 침입합니다. 우리는 이런 보안의 헛점을 취약점(Vulnerability)이라고 부릅니다. 보안 업계에서는 이렇게 널리 알려진 보안 취약점들에 ‘CVE(Common Vulnerabilities and Exposures)’라는 일종의 범죄자 식별 번호표를 붙여 꼼꼼하게 관리합니다.

가장 큰 문제는 압도적인 ‘속도’와 ‘물량’입니다. 매일 전 세계에서 수많은 취약점이 폭포수처럼 쏟아지는데, 인간 전문가가 이를 일일이 확인하고 실제로 얼마나 위험한지 직접 시스템 환경에서 재현(Reproduction)해 보는 데는 엄청난 시간과 비용이 듭니다. 취약점을 찾아냈더라도, 그것이 진짜 시스템을 무너뜨릴 수 있는지 증명하는 익스플로잇(Exploit, 취약점을 실제로 공격해 위험성을 증명하는 실행 코드)을 한 땀 한 땀 짜는 것은 고도의 지적 노동이자 인내심 싸움이기 때문입니다.

만약 이 피말리는 과정을 AI가 온전히 대신해 줄 수 있다면 어떨까요? 인간 보안 전문가는 밤을 새우며 반복적으로 진행하던 단순 취약점 확인 작업에서 완벽히 해방됩니다. 대신 더욱 창의적이고 굵직한 방어 전략을 짜는 설계자 역할에 집중할 수 있게 되죠. 기업 입장에서는 해커가 취약점을 찾아내 악용하기도 전에, AI 특공대를 투입해 한발 먼저 튼튼한 방어벽을 칠 수 있게 됩니다. 이는 단순히 기술이 조금 발전한 수준이 아닙니다. 디지털 세계의 창과 방패의 싸움에서, 우리가 쓸 수 있는 가장 강력하고 지치지 않는 ‘자동화된 방패’를 얻게 되는 것을 의미합니다. 실제로 현대 웹 애플리케이션의 자동화된 취약점 발견을 위한 소프트웨어 프레임워크 개발은 이미 학계와 산업계의 최우선 핵심 과제로 다뤄지고 있습니다 [Design and Implementation of aMulti-AgentAISystemfor...](https://www.hse.ru/en/edu/vkr/1157694160).

쉽게 이해하기: ‘멀티 에이전트’는 어떻게 작동할까? (The Explainer)

이 혁신적인 시스템의 핵심은 바로 ‘멀티 에이전트(Multi-agent, 여러 인공지능이 각자의 역할을 맡아 협력하는 시스템)’라는 독특한 구조에 있습니다.

쉽게 말해서 이렇게 비유해 보겠습니다. 여러분이 뇌수술이라는 아주 복잡한 수술을 받아야 한다고 상상해 보세요. 아무리 전 세계에서 가장 뛰어난 천재 의사라도 혼자서 마취를 하고, 메스를 들고, 모니터의 혈압 수치를 동시에 관리할 수는 없습니다. 완벽하고 안전한 수술을 위해서는 전체 상황을 조감하는 집도의, 환자의 생체 징후를 통제하는 마취 전문의, 수술 도구를 적재적소에 건네주는 수술실 간호사가 완벽하게 한 팀을 이뤄야만 합니다.

AI의 세계도 이와 똑같습니다. 무조건 똑똑하다고 소문난 거대한 AI 하나에게 “이 소프트웨어의 보안 헛점을 샅샅이 찾고 당장 공격 코드를 만들어내!”라고 윽박지르면 어떻게 될까요? 한 번에 처리해야 할 정보의 양이 너무 방대해져 있지도 않은 사실을 지어내는 환각(Hallucination) 현상을 일으키거나, 쏟아지는 데이터의 늪에서 길을 잃고 맙니다. 그래서 연구자들은 지혜를 발휘해 다중 에이전트 시스템을 도입했습니다. 각자 특정 하위 작업만 전담하는 여러 명의 ‘전문 에이전트’를 조율하여, 단일 에이전트의 한계를 훌쩍 넘어서는 복잡한 문제를 해결하도록 만든 것입니다 [FuzzingBrain V2: AMulti-AgentLLMSystemforAutomated...](https://arxiv.org/pdf/2605.21779).

보안 취약점을 찾는 실제 연구 사례들을 살펴보면, 이 수술실 팀워크 비유가 얼마나 찰떡같이 맞아떨어지는지 알 수 있습니다. 수년간 현장에서 직접 취약점 사냥을 해온 다크네이비(DARKNAVY)라는 보안 그룹은 ‘아구시(Argusee)’라는 다중 에이전트 아키텍처를 제안했습니다. 놀랍게도 이 시스템은 실제 인간 보안 팀 내부의 정교한 분업 체계와 협업 메커니즘을 거울처럼 모방하여 설계되었습니다 [Argusee: A Multi-Agent Collaborative Architecture for Automated Vulnerability Discovery | DARKNAVY](https://www.darknavy.org/blog/argusee_a_multi_agent_collaborative_architecture_for_automated_vulnerability_discovery/). 즉, 혼자서 북 치고 장구 치는 천재 해커 로봇 하나를 만든 게 아니라, 각자의 주특기를 가진 고도로 훈련된 ‘사이버 특공대’를 탄생시킨 셈입니다.

이런 AI 특공대의 완벽한 역할 분담을 더욱 생생하게 보여주는 대표적인 연구 사례가 바로 ‘Co-RedTeam’ 시스템입니다. 이 시스템은 크게 네 명의 팀원으로 구성되어, 안전하게 격리된 실행 환경 속에서 끊임없이 대화하고 상호 작용합니다 [Co-RedTeam: Orchestrated Security Discovery and Exploitation with LLM Agents](https://arxiv.org/pdf/2602.02164).

계획 담당 (Planning): 시스템의 전체 구조를 훑어보고 “어디를 어떻게 찌를 것인가”에 대한 큰 그림과 치밀한 전략을 짭니다.
실행 담당 (Execution): 계획 담당이 짠 전략을 넘겨받아, 직접 해킹 코드(명령어)를 작성하고 실행 버튼을 누릅니다. 수술실로 치면 직접 날카로운 메스를 쥐는 행동대장 역할입니다.
검증 담당 (Validation): 실행된 공격이 진짜로 먹혀들었는지, 아니면 시스템의 탄탄한 방어벽에 가로막혔는지 객관적인 데이터를 바탕으로 냉정하게 확인합니다.
평가 담당 (Evaluation): 이 모든 과정을 복기하며 “방금 공격은 왜 실패했을까?”, “다음 공격을 위해서는 무엇을 보완해야 할까?”라며 날카로운 피드백을 제공합니다.

이 특공대의 더욱 소름 돋는 능력은 바로 ‘계층화된 장기 기억(layered long-term memory)’을 활용한다는 점입니다. 이들은 단순히 한 번 시도하고 실패했다고 순순히 포기하는 우를 범하지 않습니다. 이들의 기억 장치 속에는 과거에 발견했던 취약점 패턴, 고도로 정제된 해킹 전략, 그리고 구체적인 기술적 조치들이 마치 베테랑 형사의 사건 수첩처럼 고스란히 저장됩니다. 이전에 뼈아프게 실패했던 경험이나 통쾌하게 성공했던 경험을 잊지 않고 기억해 두었다가, 다음 임무에 똑똑하게 재사용하며 스스로 무한히 진화하는 구조입니다 [Co-RedTeam: Orchestrated Security Discovery and Exploitation 소 Discovery and Exploitation with LLM Agents](https://arxiv.org/pdf/2602.02164).

또한, ‘CVE-Genie’라는 이름의 또 다른 프레임워크 연구는 여기서 한 발 더 나아갑니다. 이들은 이상적인 취약점 재현 시스템이 갖춰야 할 ‘EAGER’라는 5가지 핵심 속성을 새롭게 정의했습니다. 이는 단순히 공격 코드를 짜는 것을 훌쩍 넘어섭니다. 취약점이 존재하는 환경 자체를 AI가 스스로 완전히 똑같이 재구축(Rebuilds vulnerable environments)하고, 검증자를 세우며, 다양한 프로그래밍 언어와 프로젝트를 넘나드는 범용적인 능력을 바탕으로 ‘처음부터 끝까지 완전 자동화(End-to-end automated)’된 공격 증명(PoC) 코드를 생성해 내는 원대한 목표를 향해 달려가고 있습니다 [From CVE Entries to Verifiable Exploits: An Automated Multi-Agent Framework for Reproducing CVEs](https://arxiv.org/html/2509.01835v1).

현재 상황: 완벽한 해커의 탄생? (Where We Stand)

그렇다면 이 무시무시한 AI 특공대는 당장 내일이라도 전 세계의 모든 해커와 보안 전문가들을 실업자로 만들 수 있을까요? 결론부터 아주 명확하게 말씀드리면, “아직은 갈 길이 멀다”입니다.

최근 연구자들은 현존하는 가장 뛰어난 성능을 자랑하는 AI 에이전트 모델들(OpenHands, SWE-agent, CAI 등)을 링 위로 불러올려 아주 가혹한 시험을 치르게 했습니다. 7가지 취약점 유형과 6가지의 최신 웹 기술을 아우르는 무려 80개의 실제 웹 취약점(CVE) 데이터를 모아놓고 벤치마크 테스트를 진행한 것입니다 [[2510.14700] LLM Agents for Automated Web Vulnerability Reproduction: Are We There Yet?](https://arxiv.org/abs/2510.14700). 이 테스트는 랩실 안의 온실 속 화초 같았던 최첨단 AI들이 과연 비바람이 몰아치는 ‘현실 세계의 복잡한 소프트웨어 환경’에서도 제대로 실력 발휘를 할 수 있는지 묻는 아주 냉정한 평가 무대였습니다 [LLMAgentsand WebVulnerabilityReproduction| ShortSpan.ai](https://shortspan.ai/llm-agents-struggle-to-reproduce-web-vulnerabilities.html).

시험 결과는 인공지능이 가진 명확한 한계점의 민낯을 그대로 보여주었습니다. 다행히 AI 에이전트들은 특정 라이브러리(소프트웨어의 부품 역할을 하는 작은 코드 모음) 내부에 꼭꼭 숨어있는 ‘단순한 취약점’을 재현하는 데 있어서는 꽤 그럴싸한 성공률을 보였습니다.

비유하자면, ‘외딴 동네 헛간에 매달려 있는 낡고 고장 난 자물쇠 하나’를 따는 단일 임무는 아주 훌륭하게 수행했다는 뜻입니다. 목표물이 시야에 명확하게 들어오고, 당장 뚫어야 할 구멍이 하나뿐이어서 풀어야 할 문제의 범위가 매우 좁기 때문입니다.

하지만 진짜 골칫거리는 현대의 웬만한 웹 서비스들이 결코 동네 헛간 수준의 단순한 구조가 아니라는 데 있습니다. 우리가 무심코 누르는 스마트폰 앱이나 쇼핑몰은 겉으로 보이는 화려한 화면 뒤에, 보이지 않는 백엔드 서버, 거대한 데이터베이스, 복잡하게 얽힌 로그인 인증 시스템 등 수많은 구성 요소가 톱니바퀴처럼 맞물려 돌아가는 거대한 첨단 빌딩과 같습니다.

연구 결과에 따르면, 이 똑똑했던 LLM 에이전트들은 여러 구성 요소가 동시에 맞물려 돌아가는 다중 구성 요소(multi-component) 환경의 ‘복잡한 서비스 기반 취약점’ 앞에서는 일관되게 구조적인 실패(consistently fail)의 늪에 빠져버리는 것으로 나타났습니다 [[2510.14700] LLM Agents for Automated Web Vulnerability Reproduction: Are We There Yet?](https://arxiv.org/abs/2510.14700).

이 혼란스러운 상황을 영화에 빗대어 보겠습니다. 영화 <오션스 일레븐="">을 떠올려 보세요. 주인공 일당이 철통 보안을 자랑하는 카지노 금고를 털기 위해서는 한 명은 지하에서 전원을 내리고, 동시에 다른 한 명은 경비원의 시선을 돌리며, 또 다른 한 명은 정확한 타이밍을 맞춰 가짜 지문을 인식시켜야 하는 고도의 복합 작전이 필요합니다.

그런데 현재의 AI는 이런 복합 작전 앞에서 무엇을 먼저 해야 할지 몰라 허둥지둥 혼란에 빠져버린 것과 같습니다. AI는 작업의 ‘문맥(Context, 상황의 맥락)’을 길게 유지하는 데 벅차하며, 여기저기 흩어져 있는 여러 서버의 작동 기록(로그)을 동시에 띄워놓고 연관성을 추리해 내는 복합적인 사고 과정에서 길을 잃고 맙니다. 아직은 부품 하나를 고치는 수준을 넘어, 거대한 시스템 전체를 꿰뚫어 보고 연결 고리를 찾아내는 인간 보안 전문가의 깊은 직관과 오랜 경험을 따라잡기엔 턱없이 부족한 셈입니다.

앞으로 어떻게 될까? (What’s Next)

비록 지금의 AI 특공대가 거대한 카지노 건물 앞에서는 지도를 거꾸로 들고 헤매는 초보적인 모습을 보일지언정, 눈부신 AI 기술의 발전 속도를 감안할 때 이러한 한계는 머지않아 극복될 가능성이 농후합니다. 그렇다면 멀티 에이전트 시스템이 시야를 넓히고 한층 더 똑똑해진 다음 단계의 목표는 과연 무엇일까요?

보안 전문가들은 ‘FuzzingBrain V2’와 같은 차세대 멀티 에이전트 LLM 시스템 연구를 통해 그 매력적인 해답의 실마리를 제시하고 있습니다. 연구자들은 수만 권의 책을 한 번에 읽고 기억하는 능력을 갖춘 ‘긴 문맥 이해(long-context)’ 최신 LLM 기술이 도입되면, 에이전트들이 며칠씩 이어지는 길고 지루한 분석 세션 동안에도 집중력을 잃지 않고 흔들림 없는 논리를 유지하게 될 것으로 강하게 기대하고 있습니다 [FuzzingBrain V2: A Multi-Agent LLM System for Automated Vulnerability Discovery and Reproduction](https://arxiv.org/html/2605.21779v1).

하지만 전 세계 보안 업계의 심장을 가장 크게 뛰게 만드는 궁극적인 발전 방향은 따로 있습니다. 바로 ‘자동화된 패치 생성(Automatic patch generation)’입니다.

지금까지의 AI 에이전트들이 마치 첩보원처럼 보안의 구멍을 ‘찾아내고, 몰래 찔러보는’ 진단 역할에만 그쳤다면, 다음 단계의 도약은 발견된 취약점의 구멍을 완벽하게 메우는 튼튼한 시멘트, 즉 수정 코드(패치)를 스스로 짜내는 일입니다. 비유하자면 훌륭한 경비원이 도둑을 잡는 데서 끝나지 않고, 그 자리에서 즉시 열쇠공과 목수를 불러 더 튼튼한 새 문과 자물쇠를 알아서 달아놓는 것과 같습니다.

만약 AI가 공격 증명(PoC) 코드를 성공적으로 만들어냈다면, 그것은 AI가 이미 그 취약점의 근본 원인(root cause)을 뼛속까지 완벽하게 이해했다는 뜻이 됩니다. 원인을 파악했으니 이제 그 구멍을 메우는 완벽한 해결책(픽스, fixes)을 스스로 생성하고, 나아가 그 해결책이 시스템의 다른 부분을 망가뜨리지 않고 안전하게 작동하는지 검증하는 모든 과정까지 AI가 온전히 도맡게 될 것입니다. 즉, 취약점이 태어나서 묻히기까지의 생명주기 전체를 AI가 스스로 완성(complete the vulnerability lifecycle)하게 될 것이라는 게 현 학계의 지배적이고 공통된 전망입니다 [FuzzingBrain V2: A Multi-Agent LLM System for Automated Vulnerability Discovery and Reproduction](https://arxiv.org/html/2605.21779v1). [[2605.21779] FuzzingBrain V2: A Multi-Agent LLM System for Automated Vulnerability Discovery and Reproduction](https://arxiv.org/abs/2605.21779).

이 기술이 우리 일상에 안착하는 머지않은 미래에는 사이버 보안의 풍경이 완전히 뒤바뀔 것입니다. 과거처럼 컴퓨터 앞의 ‘AI 해커’와 방패를 든 ‘인간 방어자’가 쫓고 쫓기는 땀내 나는 싸움이 아닙니다. 강철 방패를 든 ‘AI 수비대’와 날카로운 창을 든 ‘AI 공격자’가 초당 수백만 번의 가상 전투를 거듭하며 서로의 허점을 찌르고 스스로를 무한히 진화시키는, 그야말로 압도적이고 거대한 자동화 체스판으로 변모할 것입니다.

MindTickleBytes AI의 시선 (AI’s Take)

과거의 사이버 보안은 어두운 방 안에서 후드티를 눌러쓴 소수의 천재적인 해커와, 그들의 은밀한 침입을 막으려는 기업의 방어자들 사이에서 벌어지는 몹시 아날로그적이고 고단한 숨바꼭질이었습니다. 하지만 멀티 에이전트 시스템의 눈부신 등장은 이 지루한 숨바꼭질을 24시간 단 1초도 쉬지 않고 굉음을 내며 가동되는 거대한 ‘자동화 방어 공장’으로 탈바꿈시키고 있습니다.

물론 현시점의 AI는 복잡하게 얽힌 현대의 거대한 소프트웨어 건물 구조 앞에서 길을 잃고 헤매는 풋내기 특공대에 불과할지 모릅니다. 하지만 스스로 보안의 빈틈을 찾아내고, 정교한 해킹 작전을 짜며, 궁극적으로는 그 깊은 상처를 꿰맬 완벽한 백신 코드까지 스스로 만들어내는 이들의 무서운 잠재력은 머지않아 IT 기술의 지형도를 송두리째 뒤흔들어 놓을 것이 분명합니다.

이러한 놀라운 변화는 인간 개발자의 역할에도 거대한 철학적 전환을 요구합니다. 과거의 개발자가 단순히 벽돌(코드)을 하나하나 손으로 쌓아 올리는 ‘코더’였다면, 미래의 우리는 복잡한 AI 특공대 팀을 조율하고 명확한 지시를 내리는 ‘오케스트라 지휘관’으로 거듭나야 합니다. 머지않은 내일, 기업과 사회의 안전한 생존은 어떤 화려한 서비스를 새롭게 ‘개발’하는가 보다, 내가 가진 시스템을 빈틈없이 ‘지키는 AI 특공대’를 얼마나 정교하게 구성하고 가혹하게 훈련시킬 것인가에 전적으로 달려있을지도 모릅니다.

참고자료

[FuzzingBrain V2: A Multi-Agent LLM System for Automated Vulnerability Discovery and Reproduction](https://arxiv.org/html/2605.21779v1)
[[2605.21779] FuzzingBrain V2: A Multi-Agent LLM System for Automated Vulnerability Discovery and Reproduction](https://arxiv.org/abs/2605.21779)
[Co-RedTeam: Orchestrated Security Discovery and Exploitation with LLM Agents](https://arxiv.org/pdf/2602.02164)
[[2510.14700] LLM Agents for Automated Web Vulnerability Reproduction: Are We There Yet?](https://arxiv.org/abs/2510.14700)
[From CVE Entries to Verifiable Exploits: An Automated Multi-Agent Framework for Reproducing CVEs](https://arxiv.org/html/2509.01835v1)
[Argusee: A Multi-Agent Collaborative Architecture for Automated Vulnerability Discovery | DARKNAVY](https://www.darknavy.org/blog/argusee_a_multi_agent_collaborative_architecture_for_automated_vulnerability_discovery/)
[FuzzingBrain V2: AMulti-AgentLLMSystemforAutomated...](https://arxiv.org/pdf/2605.21779)
[Design and Implementation of aMulti-AgentAISystemfor...](https://www.hse.ru/en/edu/vkr/1157694160)
[LLMAgentsand WebVulnerabilityReproduction| ShortSpan.ai](https://shortspan.ai/llm-agents-struggle-to-reproduce-web-vulnerabilities.html)