抓駭客的 AI 特種部隊？自己駭入又自己修復的「多智能體」技術現況

AI Summary

多個人工智慧組成團隊，找出軟體安全漏洞並展示攻擊的「多智能體」技術正快速發展，但在複雜的網路服務環境中仍存在侷限性。

想像一下。清晨，您甚至還沒出門上班。昨晚，全球每天都有人使用的通訊軟體應用程式發出警告，表示在某處發現了新的駭客入侵管道。如果是在過去會如何？安全工程師們接到緊急通知後匆忙趕到辦公室，灌下濃咖啡，花上幾個小時甚至幾天的時間，仔細檢查數百萬行程式碼，建立測試環境並築起防禦牆。

但現在不同了。在人類沉睡之際，多個人工智慧 (AI) 會自行組成一支虛擬的「安全特種部隊」。一個 AI 叫出系統藍圖制定作戰計畫，另一個 AI 化身虛擬駭客直接攻擊程式碼，還有一個 AI 負責即時分析結果。到了上班時間，這支 AI 特種部隊已經將漏洞分析報告、完美的攻擊演示影片，甚至能不留痕跡解決問題的「修復程式碼」，整齊地放在您的辦公桌上。

聽起來像是科幻電影裡的情節嗎？並非如此。這是目前全球 AI 研究人員和網路安全專家正在激烈建構的「用於自動化漏洞發現與重現的多智能體 LLM 系統 (Multi-Agent LLM System for Automated Vulnerability Discovery and Reproduction)」所帶來的驚人現實。

以 ChatGPT 為代表的大型語言模型（LLM，一種透過學習龐大文本數據，像人類一樣理解和生成語言的人工智慧），現在已經超越了單純寫文章或畫圖的秘書角色。它們正深入電腦系統最深邃隱秘的角落，從根本上改變網路安全的樣貌。這支 AI 駭客特種部隊究竟是如何運作的？目前發展到了什麼地步？我們又為何必須立刻關注這項陌生的技術呢？

這為何重要？ (Why It Matters)

我們每天像吃飯一樣頻繁使用的智慧型手機應用程式、銀行網站、網路購物商城等所有數位服務，都是由數十萬到數百萬行程式碼所組成。打個比方，這就像是一座無邊無際的巨大圖書館裡擠滿了書架。既然是人類親手編寫這龐大的程式碼，必然會出現像是小錯字般的失誤，而駭客正是利用這些微小的縫隙入侵。在安全領域，我們將這些安全漏洞稱為漏洞 (Vulnerability)。安全業界會為這些廣為人知的安全漏洞貼上一種名為「CVE (Common Vulnerabilities and Exposures)」的犯罪者識別碼，進行嚴密的管理。

最大的問題在於壓倒性的「速度」與「數量」。每天全球都有如瀑布般湧現的大量漏洞，若要由人類專家逐一確認，並在實際系統環境中親自重現 (Reproduction) 評估其危險性，將會耗費龐大的時間和成本。即使找出了漏洞，要一針一線地寫出能證明其是否真能摧毀系統的漏洞利用程式 (Exploit，實際攻擊漏洞以證明其危險性的執行程式碼)，也是一項高度的智力勞動與耐力戰。

如果 AI 能完全代替我們完成這段令人精疲力竭的過程呢？人類安全專家將從熬夜反覆確認簡單漏洞的工作中完全解放。取而代之的是，他們能專注於擔任設計者的角色，制定更具創意且重大的防禦策略。對企業而言，在駭客發現並惡意利用漏洞之前，就能先投入 AI 特種部隊，搶先一步築起堅固的防禦牆。這不僅僅是技術的些微進步。在數位世界的矛與盾之爭中，這意味著我們將獲得一面最強大且不知疲倦的「自動化盾牌」。事實上，開發用於現代網路應用程式自動化漏洞發現的軟體框架，已被學術界和產業界視為最優先的核心課題 [用於...的多智能體 AI 系統的設計與實作](https://www.hse.ru/en/edu/vkr/1157694160)。

淺顯易懂：「多智能體」是如何運作的？ (The Explainer)

這個創新系統的核心就在於「多智能體 (Multi-agent，多個人工智慧各司其職、協同合作的系統)」這種獨特的架構。

簡單來說，我們可以這樣比喻。想像一下，您即將接受一場極為複雜的腦部手術。即使是全世界最頂尖的天才外科醫生，也不可能獨自同時進行麻醉、拿手術刀，還要監控螢幕上的血壓數值。為了一場完美且安全的手術，必須由縱觀全局的主刀醫師、控制病人生理徵象的麻醉專科醫師，以及在適當時機遞上手術器械的手術室護理師，完美地組成一個團隊。

AI 的世界也是如此。如果對著一個以聰明聞名的巨大 AI 咆哮：「把這個軟體的安全漏洞找出來，立刻寫出攻擊程式碼！」，結果會如何呢？一次需要處理的資訊量過於龐大，它可能會產生幻覺 (Hallucination) 現象，編造出不存在的事實，或者在排山倒海的數據泥沼中迷失方向。因此，研究人員發揮智慧，引入了多智能體系統。透過協調多個各自專精於特定子任務的「專業智能體」，讓它們能解決遠超過單一智能體極限的複雜問題 [FuzzingBrain V2：用於自動化的多智能體 LLM 系統...](https://arxiv.org/pdf/2605.21779)。

觀察尋找安全漏洞的實際研究案例，就能發現這個手術室團隊合作的比喻是多麼的貼切。一個擁有多年實地尋找漏洞經驗的安全團隊 DARKNAVY，提出了一個名為「Argusee」的多智能體架構。令人驚訝的是，這個系統的設計宛如一面鏡子，完美模仿了真實人類安全團隊內部的精細分工體系與協作機制 [Argusee：用於自動化漏洞發現的多智能體協作架構 | DARKNAVY](https://www.darknavy.org/blog/argusee_a_multi_agent_collaborative_architecture_for_automated_vulnerability_discovery/)。也就是說，他們並不是創造了一個會自導自演的天才駭客機器人，而是誕生了一支由各自擁有專長、訓練有素的「網路特種部隊」。

能更生動地展現這種 AI 特種部隊完美分工的代表性研究案例，就是 「Co-RedTeam」 系統。該系統主要由四名團隊成員組成，在一個安全隔離的執行環境中不斷地對話與互動 [Co-RedTeam：利用 LLM 智能體策劃的安全發現與漏洞利用](https://arxiv.org/pdf/2602.02164)。

計畫擔當 (Planning)： 掃描系統的整體架構，為「要攻擊哪裡、如何攻擊」制定宏觀的藍圖與縝密的策略。
執行擔當 (Execution)： 接過計畫擔當制定的策略，親自編寫駭客程式碼（指令）並按下執行按鈕。在手術室裡，這就像是親自拿著鋒利手術刀的行動隊長。
驗證擔當 (Validation)： 基於客觀數據，冷靜地確認剛才執行的攻擊是真的奏效了，還是被系統堅固的防禦牆擋了下來。
評估擔當 (Evaluation)： 覆盤這整個過程，提供如「剛才的攻擊為什麼失敗了？」、「下次攻擊需要改進什麼？」等犀利的回饋。

這支特種部隊更令人不寒而慄的能力，在於他們運用了「分層的長期記憶 (layered long-term memory)」。他們不會犯下嘗試一次失敗就乖乖放棄的愚蠢錯誤。在他們的記憶裝置中，過去發現的漏洞模式、高度精煉的駭客策略，以及具體的技術措施，就像老練刑警的案件筆記一樣被完整保存。他們不會忘記過去慘痛的失敗經驗或痛快的成功經驗，並將這些記憶聰明地重複應用在下一次任務中，形成一種自我無限進化的結構 [Co-RedTeam：利用 LLM 智能體策劃的安全發現與漏洞利用](https://arxiv.org/pdf/2602.02164)。

此外，另一項名為「CVE-Genie」的框架研究則更進一步。他們重新定義了理想的漏洞重現系統必須具備的「EAGER」五大核心屬性。這已遠遠超越了單純編寫攻擊程式碼的範疇。他們正朝著一個宏偉的目標邁進：AI 能自行完全一模一樣地重建 (Rebuilds vulnerable environments) 存在漏洞的環境，設立驗證者，並憑藉跨越多種程式語言和專案的通用能力，生成從頭到尾「完全自動化 (End-to-end automated)」的攻擊概念驗證 (PoC) 程式碼 [從 CVE 條目到可驗證的漏洞利用：一個用於重現 CVE 的自動化多智能體框架](https://arxiv.org/html/2509.01835v1)。

現況：完美駭客的誕生？ (Where We Stand)

那麼，這支可怕的 AI 特種部隊，明天就能讓全世界所有的駭客和安全專家失業嗎？先說結論，非常明確：「還有很長的路要走」。

最近，研究人員將目前性能最頂尖的 AI 智能體模型（OpenHands、SWE-agent、CAI 等）請上擂台，進行了一場極其嚴苛的測試。他們收集了多達 80 個真實網路漏洞 (CVE) 數據，涵蓋 7 種漏洞類型和 6 種最新網路技術，並進行了基準測試 (Benchmark test) [[2510.14700] 用於自動化網路漏洞重現的 LLM 智能體：我們到了嗎？](https://arxiv.org/abs/2510.14700)。這個測試是一個非常冷酷的評估舞台，用以檢驗這些宛如溫室花朵般待在實驗室裡的最先進 AI，是否真能在狂風暴雨的「現實世界複雜軟體環境」中發揮實力 [LLM 智能體與網路漏洞重現 | ShortSpan.ai](https://shortspan.ai/llm-agents-struggle-to-reproduce-web-vulnerabilities.html)。

測試結果赤裸裸地展現了人工智慧目前明確的局限性。幸運的是，在重現隱藏於特定函式庫（作為軟體零件的小型程式碼集合）內部的「簡單漏洞」時，AI 智能體展現了相當不錯的成功率。

打個比方，這意味著它們能非常出色地完成「打開掛在偏僻村落穀倉上的破舊故障鎖頭」這項單一任務。因為目標物清晰可見，且眼前只有一個需要突破的洞，所以需要解決的問題範圍非常狹窄。

但真正的麻煩在於，現代絕大多數的網路服務絕對不是偏僻村落穀倉那樣簡單的結構。我們不經意點擊的智慧型手機應用程式或購物商城，在華麗的畫面背後，就像一棟巨大的高科技大樓，有著看不見的後端伺服器、龐大的資料庫、錯綜複雜的登入認證系統等無數個像齒輪般緊密咬合運轉的組成部分。

根據研究結果，這些聰明的 LLM 智能體在面對多個組件同時運作的多組件 (multi-component) 環境中，遇到「複雜的服務型漏洞」時，都會一致陷入結構性失敗 (consistently fail) 的泥沼中 [[2510.14700] 用於自動化網路漏洞重現的 LLM 智能體：我們到了嗎？](https://arxiv.org/abs/2510.14700)。

我們可以將這種混亂的情況用電影來比喻。想像一下電影《瞞天過海》，主角一行人為了破解號稱鐵壁防禦的賭場金庫，需要進行高度複雜的聯合作戰：一個人必須在地下室切斷電源，同時另一個人要轉移警衛的注意力，還要有第三個人在精準的時機輸入假指紋。

然而，目前的 AI 在面對這種複雜的作戰時，就像是不知道該先做什麼而陷入慌亂的狀態。AI 在維持任務的「上下文 (Context，情況的脈絡)」長度時顯得力不從心，在試圖同時開啟散落各處的多個伺服器運作紀錄 (日誌) 並推斷其關聯性的複雜思考過程中迷失了方向。目前它們還只停留在修理單一零件的程度，遠遠無法趕上人類安全專家那種能看透龐大系統全貌並找出連結點的深厚直覺與長年經驗。

未來會如何發展？ (What’s Next)

儘管現在的 AI 特種部隊在巨大的賭場大樓前，可能還是一副拿反地圖、四處迷路的菜鳥模樣，但考慮到 AI 技術驚人的發展速度，這些局限性很有可能在不久的將來被克服。那麼，多智能體系統在擴展視野、變得更加聰明之後，下一個階段的目標究竟是什麼呢？

安全專家們透過對如「FuzzingBrain V2」等下一代多智能體 LLM 系統的研究，提供了這個極具魅力的解答線索。研究人員強烈期望，當引入具備一次閱讀並記住數萬本書能力的「長上下文理解 (long-context)」最新 LLM 技術後，智能體們即使在連續數天的漫長枯燥分析會議中，也能保持專注，維持毫不動搖的邏輯 [FuzzingBrain V2：用於自動化漏洞發現與重現的多智能體 LLM 系統](https://arxiv.org/html/2605.21779v1)。

然而，讓全球安全業界最感振奮的終極發展方向另有所在。那就是「自動化生成修補程式 (Automatic patch generation)」。

如果說目前的 AI 智能體就像間諜一樣，僅止於「找出並偷偷刺探」安全漏洞的診斷角色，那麼下一階段的飛躍，就是自行編寫出能完美填補已發現漏洞的堅固水泥，也就是修補程式碼 (patch)。打個比方，這就像是一位優秀的警衛，不僅抓住了小偷，還能立刻找來鎖匠和木匠，自動換上更堅固的新門和新鎖。

如果 AI 成功生成了攻擊概念驗證 (PoC) 程式碼，這意味著 AI 已經徹底、透徹地理解了該漏洞的根本原因 (root cause)。既然找出了原因，接下來填補該漏洞的完美解決方案 (修復，fixes) 的生成，乃至於驗證該解決方案是否安全運作且不破壞系統其他部分的所有過程，都將由 AI 一手包辦。也就是說，從漏洞的誕生到被修復的整個生命週期，將由 AI 自行完成 (complete the vulnerability lifecycle)，這是目前學界佔主導地位的共同預期 [FuzzingBrain V2：用於自動化漏洞發現與重現的多智能體 LLM 系統](https://arxiv.org/html/2605.21779v1)。[[2605.21779] FuzzingBrain V2：用於自動化漏洞發現與重現的多智能體 LLM 系統](https://arxiv.org/abs/2605.21779)。

在這項技術落實於我們日常生活的近未來，網路安全的景象將徹底改變。不再像過去那樣，電腦前的「AI 駭客」與拿著盾牌的「人類防禦者」之間，進行著大汗淋漓的追逐捉迷藏。這將轉變成一場壓倒性且龐大的自動化西洋棋局：拿著鋼鐵盾牌的「AI 守衛隊」與拿著銳利長矛的「AI 攻擊者」，每秒進行數百萬次虛擬戰鬥，互相刺探弱點，並進行無限的自我進化。

MindTickleBytes AI 的觀點 (AI’s Take)

過去的網路安全，是躲在暗房裡戴著連帽外套的少數天才駭客，與試圖阻止他們秘密入侵的企業防禦者之間，一場極其類比且令人疲憊的捉迷藏。然而，多智能體系統的驚人崛起，正將這場枯燥的捉迷藏轉變為一個 24 小時、連 1 秒都不停歇，發出轟鳴聲運轉的巨大「自動化防禦工廠」。

當然，目前的 AI 面對錯綜複雜的現代龐大軟體建築結構，可能還只是一支迷失方向的菜鳥特種部隊。但是，它們具備自行尋找安全漏洞、制定精密的駭客作戰計畫，最終甚至能自行編寫出完美縫合深層傷口的疫苗程式碼的可怕潛力，假以時日，必將徹底顛覆 IT 技術的地貌。

這種驚人的變化，也要求人類開發者的角色進行巨大的哲學轉變。如果說過去的開發者是單純手工砌上一磚一瓦 (程式碼) 的「寫程式的人」，那麼未來的我們，必須蛻變為協調複雜 AI 特種部隊團隊並下達明確指示的「交響樂團指揮官」。在不久的將來，企業與社會的生存安全，與其說取決於能「開發」出多麼華麗的新服務，不如說完全取決於我們能多麼精密地組成並嚴酷地訓練一支「守護 AI 特種部隊」，來讓我們的系統滴水不漏。

參考資料

[FuzzingBrain V2：用於自動化漏洞發現與重現的多智能體 LLM 系統](https://arxiv.org/html/2605.21779v1)
[[2605.21779] FuzzingBrain V2：用於自動化漏洞發現與重現的多智能體 LLM 系統](https://arxiv.org/abs/2605.21779)
[Co-RedTeam：利用 LLM 智能體策劃的安全發現與漏洞利用](https://arxiv.org/pdf/2602.02164)
[[2510.14700] 用於自動化網路漏洞重現的 LLM 智能體：我們到了嗎？](https://arxiv.org/abs/2510.14700)
[從 CVE 條目到可驗證的漏洞利用：一個用於重現 CVE 的自動化多智能體框架](https://arxiv.org/html/2509.01835v1)
[Argusee：用於自動化漏洞發現的多智能體協作架構 | DARKNAVY](https://www.darknavy.org/blog/argusee_a_multi_agent_collaborative_architecture_for_automated_vulnerability_discovery/)
[FuzzingBrain V2：用於自動化的多智能體 LLM 系統...](https://arxiv.org/pdf/2605.21779)
[用於...的多智能體 AI 系統的設計與實作](https://www.hse.ru/en/edu/vkr/1157694160)
[LLM 智能體與網路漏洞重現 | ShortSpan.ai](https://shortspan.ai/llm-agents-struggle-to-reproduce-web-vulnerabilities.html)

Share this article:

測試你的理解

Q1. 下列哪一項是形容「多智能體」系統最貼切的比喻？

獨自教授所有科目的全能家教老師
為進行手術，由外科醫師、麻醉科醫師和護理師各司其職、協同合作的手術室團隊
只會重複計算輸入數字的簡單計算機

多智能體系統並非由單一 AI 處理所有事情，而是由具備不同專業的數個 AI 分工合作的系統。

Q2. 在最近的研究中，AI 智能體在尋找哪種類型的漏洞時遇到了困難？

基於簡單函式庫的漏洞
過去已經被完美解決的舊型漏洞
多個組成部分錯綜複雜的服務型漏洞

AI 智能體很擅長找出簡單的漏洞，但在多種網路技術和系統交織的複雜多組件環境（multi-component environments）中，往往會出現結構性的失敗。

Q3. 研究人員認為安全漏洞系統最終的未來發展方向是什麼？

完全排除人類，由 AI 統治世界
不只是發現漏洞，而是能自動生成修補程式（解決方案）
將所有安全系統都換成實體鎖

研究人員認為，未來的發展階段將是 AI 在找出漏洞的根本原因後，自動生成並驗證能修復該漏洞的修補程式（patch），由 AI 自行完成安全漏洞的整個生命週期。