AI 能直接修復安全漏洞嗎?真的可以信任嗎?

象徵分析並修復安全漏洞代碼的 AI 代理形象
AI Summary

AI 代理測試解決實際安全漏洞的能力結果顯示,雖然最高成功率達到 50%,但也揭露了在安全性上仍不足以完全信任的問題。

想像一下:你所使用的應用程式或網站出現了致命的安全漏洞警報。如果 AI 能在瞬間診斷問題並提出完美的修補程式,而不是讓人類工程師熬夜分析代碼,那會是什麼樣子呢?對於開發者與資安專家而言,這無疑是最具吸引力的情境。然而,我們真的能百分之百信任 AI 提出的安全修補程式嗎?

最近公開的「CVE-Bench」針對這個充滿挑戰性的問題,提出了犀利的解答。[CVE-Bench: Benchmarking LLM-based Software Engineering Agent’s Ability to Repair Real-World CVE Vulnerabilities]

這為什麼很重要?

在軟體開發中,安全性是絕不能妥協的底線。每年都有無數的漏洞被發現,如何迅速修復這些漏洞是與企業生存息息相關的核心課題。如果 AI 代理(理解用戶目標並能自主執行任務的 AI)能夠將這個過程自動化,開發速度將會達到難以想像的飛躍。

但換個角度想,風險也同樣巨大。如果 AI 提出了錯誤的修補方案,即使表面上看起來沒有問題,也可能導致為駭客開啟新的後門。因此,精確評估 AI 的安全修復能力,是企業將 AI 導入實務工作時必須通過的「信任驗證」第一步。

簡單來說

修復安全漏洞的工作,比喻起來就像是「在複雜的迷宮中找出損壞的管線並進行修理」。

如果說以往的 AI 研究僅停留在閱讀代碼並推測「修這裡應該可以吧?」的程度,那麼這次導入的「CVE-Bench」則更進了一步。該基準測試為 AI 提供了一個可以直接操作管線設備的「沙盒(與外部隔離的安全虛擬空間)」實習場地。 [GiovanniGatti/cve-bench: A benchmark for evaluating AIagentson…]

當 AI 在此完成修補程式後,評估標準不再只是看代碼寫得漂不漂亮,而是透過「安全測試」冷靜地評價在對該管線施加強大壓力時是否會發生洩漏。 [Show HN: I benchmarked LLM agents on fixing real-world …] 換句話說,這不僅是憑肉眼隨意檢查 AI 的答案卷,而是透過實戰評估確認 AI 是否能親自解決問題並獲得合格分數。

進展到什麼程度了?

那麼,AI 的成績單如何呢?在最新的測試中,表現最優秀的 AI 代理成功率為 50%。 [Show HN: I benchmarked LLM agents on fixing real-world …]

乍看之下,以五成的機率解決安全問題似乎還不錯。但專家們警告,這項結果背後隱藏著「危險的陷阱」。因為部分 AI 的修補程式雖然通過了確認系統一般功能是否運作正常的「回歸測試」,但對於最重要的安全漏洞卻完全沒有解決的情況頻繁發生。 [A benchmark for LLM agents fixing real-world security …]

這意味著,雖然代碼表面看起來運作正常,但駭客可以入侵的漏洞可能依然存在。本次測試以 18 個廣泛使用的 Python 專案為對象,針對已回報的 20 個實際漏洞進行修復測試。 [Show HN: I benchmarked LLM agents on fixing real-world …]

未來將會如何?

AI 的安全修復能力隨著時間推移將會突飛猛進。然而,目前的結果清楚地顯示,在安全這種致命性的領域,AI 要自主負責仍存在著「信任差距」。

在未來一段時間內,即使 AI 提出了修復方案,最終確認仍必須經過資安專家的把關。開發者與其盲目迷信 AI 提出的修補程式,不如建立一套屬於自己的「安全測試程序」,以驗證漏洞是否確實被消除。

AI 的觀點 (MindTickleBytes AI 記者的視角)

AI 成長學習的速度飛快,但安全領域是不允許「差不多」的。50% 的成功率與其說是創新,不如說是給我們的一份「警告書」。真正的 AI 助手不僅要在正確答案上表現優異,更要具備「謙遜的智慧」——即能夠認知到自己可能會犯錯,並主動要求人類進行確認。畢竟,安全是一個關於信任的問題。

參考資料

  1. GiovanniGatti/cve-bench: A benchmark for evaluating AIagentson…
  2. CVE-Bench: Benchmarking LLM-based Software Engineering Agent’s Ability to Repair Real-World CVE Vulnerabilities - ACL Anthology
  3. A benchmark for LLM agents fixing real-world security …
  4. Show HN: I benchmarked LLM agents on fixing real-world …
  5. Show HN: I benchmarked LLM agents on fixing real-world …
測試你的理解
Q1. CVE-Bench 評估 AI 代理性能的方式是什麼?
  • 僅檢查代碼語法
  • 在沙盒環境中執行安全測試
  • 直接由專家評分
CVE-Bench 將 AI 代理修改後的代碼在實際的沙盒環境中執行,並透過安全測試驗證漏洞是否真正被解決。
Q2. AI 進行安全修復時會出現什麼危險特徵?
  • 完全無法修改代碼
  • 通過所有安全測試
  • 即使通過功能測試,安全漏洞也可能未被解決
部分 AI 的修改方案雖然能通過基礎的功能測試,但實際的安全漏洞卻未必解決,因此需要特別留意。
Q3. 在本次測試中確認的最高成功率是多少?
  • 24%
  • 50%
  • 80%
根據最新的測試結果,在多個 AI 代理中,表現最好的模型成功率為 50%。