AI 代替駭客尋找安全性漏洞?圍繞「Mythos」的 Anthropic「放羊的孩子」爭議

一幅插畫:機器人拿著巨大的放大鏡,正在複雜交錯的電腦程式碼中搜尋隱藏的鎖孔狀漏洞。
AI Summary

Anthropic 的 AI 模型 Mythos 以驚人的速度發現系統安全性漏洞,引發白宮關注。然而,由於缺乏內部驗證的誇大廣告以及荒唐的內部資安外洩事故,該公司正逐漸失去信任。

想像一下,在我們每天習慣使用的網路瀏覽器、與親友聊天的智慧型手機通訊軟體,以及存放一生積蓄的銀行 App 中,可能到處都藏著連開發程式的天才工程師都沒發現的小「狗洞」。

通常,隸屬於企業的白帽駭客(以防禦為目的的資安專家)或唯利是圖的惡意駭客,為了尋找這些隱藏的漏洞,必須在長達數週甚至數月的時間裡熬夜翻找數百萬行複雜的電腦程式碼。比喻來說,這就像是赤手空拳在廣闊的沙灘中尋找一根掉落的針一樣,是既枯燥又痛苦的工程。

但如果能將這漫長而痛苦的過程全部交給人工智慧(AI)呢?如果你下令:「掃描我們所有的程式原始碼,找出駭客可能偷偷溜進來的所有漏洞。」而它僅在幾分鐘內就精確無誤地找出了數百個致命漏洞,甚至還包含了一般人類窮盡一生思考都無法想像的精妙繞過方式。這並非遙遠未來的科幻電影,而是現在正發生在我們眼前的現實。

ChatGPT 最強勁的對手、同時也是全球頂尖 AI 企業之一的 Anthropic,最近開發出了具備這種驚人能力的新 AI 模型。今年 4 月初,Anthropic 大張旗鼓地公開了名為「Mythos Preview」的新模型 Anthropic 的 Claude Mythos 是什麼?它會帶來哪些風險?

然而,他們在推出這項偉大發明時,卻發表了一個非常奇怪的聲明:「我們雖然創造了歷史上最強大、最了不起的 AI,但因為它一旦落入壞人手中將極具破壞性,所以絕對不會向大眾完全公開。」

這番聲明立即在 IT 業界和政壇點燃了巨大的爭議。人們開始提出根本性的疑問:我們真的應該聽信這家公司說自己產品「太危險」的主張嗎?還是這只是為了向投資者吹噓自家 AI 有多強大而進行的精明「恐懼行銷」?在美國白宮高層親自出面關注該模型風險的同時,為什麼第一線的資安專家們卻指責 Anthropic 是童話故事中「放羊的孩子」,並發出強烈的批評?讓我們一起深入探討。

為什麼這對我們很重要?

首先需要理解,這項尖端技術議題為何與我們不懂電腦的平凡日常生活息息相關。在現代社會,我們每天使用的智慧型手機、網路銀行系統、股票交易所伺服器,甚至是醫院的生命維持裝置和國家電網,所有這些數位系統最終都是由名為「電腦程式碼」的巨大文字藍圖構成的。如果這份藍圖中留有微小的缺陷,駭客就能趁虛而入,竊取個人隱私與財物,或引發社會大混亂。在 IT 世界中,這些致命的裂縫被稱為「安全性漏洞」。

到目前為止,防禦並找出這些安全性漏洞一直是被視為極少數受過高度訓練的人類資安專家的特權。然而,Anthropic 的 Mythos 徹底粉碎了這項長久以來的常識。根據「紅隊(red-teams,源自軍方術語,意指模擬敵方的專家小組)」的分析,Mythos 在執行電腦資安任務方面展現了「令人驚嘆的卓越能力」Anthropic 的 Claude Mythos 是什麼?它會帶來哪些風險?。它以人類大腦完全無法企及的運算速度,無情地鑽入系統的弱點。

最令人震撼的事件發生在全世界數億人每天使用的知名網頁瀏覽器 Firefox 上。在將初期版本的 Mythos Preview 投入 Firefox 龐大的原始碼後,它竟在瞬間找出了多達 271 個零日漏洞(Zero-day vulnerability)Claude Mythos 在 Firefox 中發現了 271 個零日漏洞… - Schneier 談安全

所謂「零日」,是指連軟體開發者都不知道缺陷的存在,因此當駭客發動攻擊時,開發者準備防禦對策的時間字面上只有「0 天」,是處於最致命的狀態。Mozilla 基金會對此感到大為震驚,並火速在向全球發布的 Firefox 最新版本中包含了這 271 個漏洞的修復程式 Claude Mythos 在 Firefox 中發現了 271 個零日漏洞… - Schneier 談安全。簡單來說,AI 在一瞬間完成的工作量,是數十名優秀資安專家辛勤工作多年都未必能達成的驚人成就 歸功於 Mythos AI,271 個 Firefox 漏洞已關閉:IT 安全的突破…

然而,這項驚人的結果在帶來喝采的同時,也讓人感到背脊發涼。如果這項為了幫助人類而開發的強大駭客技術,先落入了惡意犯罪組織或敵對國家手中,會發生什麼事?電網、通訊網路、金融結算系統可能在瞬間被攻破,所有控制權都將被奪走。這也是 Anthropic 執行長 Dario Amodei 迫切警告「我不希望 AI 被用來對付我們的人民(即成為無情攻擊我們自己的武器)」的原因 Reddit 上的 r/Anthropic:Anthropic 執行長 Dario Amodei:『我不希望 AI 被用來對付我們自己的人民』

意識到事態嚴重性的美國白宮也沒有袖手旁觀。白宮並未將此僅視為一場新產品發布會的插曲,而是採取了前所未有的措施,將 Mythos AI 預先納入旨在防禦國家關鍵基礎設施的「聯邦網路安全戰略」中 Reddit 上的 r/cybersecurity:白宮將 Anthropic 的 Mythos AI 整合到聯邦網路安全戰略中,以強化關鍵基礎設施。這展現了政府認為不能將如此強大的能力僅交由企業自主管理,必須從國家安全層面直接控管的強烈意志 Reddit 上的 r/cybersecurity:白宮將 Anthropic 的 Mythos AI 整合到聯邦網路安全戰略中,以強化關鍵基礎設施

淺顯易懂:為何它既危險又令人難以置信

為了更直觀地了解 Mythos 有多厲害,以及為什麼它會同時收到讚美與批評,我們可以做個比喻。

Mythos 的能力就像是一位無敵的「超級 AI 建築檢測員」,他能在幾秒鐘內掃描完世界上最大、最複雜的高科技摩天大樓(軟體程式)那數萬張艱澀的設計圖,然後精確指出:「那邊 3 樓第 4 個窗戶旁的磚塊比設計鬆動了 1 毫米,可能會漏雨;地下 3 樓的通風口少了一顆螺絲,小偷可以完美潛入。」

既然如此,為什麼眾多專家還要貶低並批評這款看似聰明且長期大有助益的 AI 呢?批評的核心在於「驗證(Verification)」與「透明度(Transparency)」的完全缺失。

比喻來說,假設我們開發了一種能征服所有癌症的開創性藥物。但藥廠卻突然宣布:「各位,這是奇蹟之藥。但因為它若暴露給一般人可能會產生致命副作用甚至毀滅世界,所以我們只會悄悄供應給極少數特定的醫院。雖然拿不出證據,但總之很危險,請直接相信我們!」身為大眾,你能心平氣和地接受這種傲慢的發表嗎?

顯然,必須由外部獨立的醫療專家透明地分析並驗證藥物成分。在 AI 世界中,這種記錄模型功能、極限、運作方式及內在風險的正式說明書被稱為「系統卡(System Card)」。

然而,Anthropic 釋出的 Mythos 系統卡反而留下了更深的疑慮。一位分析師徹夜分析了長達 244 頁、容量達 23MB 的龐大文件,卻荒謬地發現,在整份文件中,支持其「該模型過於危險而無法向大眾公開」這一宏大主張的核心內容竟然只有「7 頁」 [放羊的孩子 Mythos:驗證正令 Anthropic 失去信任 Rick’s Cafe AI](https://cafeai.home.blog/2026/04/21/the-boy-that-cried-mythos-verification-is-collapsing-trust-in-anthropic/)。其餘數百頁內容多是被用來轉移焦點的瑣碎資訊。

更根本的問題在於徹底的封閉性。Anthropic 聲稱為了風險管理,僅向其允許的少數合作夥伴提供極其有限的 Mythos 存取權限。但既沒有能從外部客觀驗證的「公開證明體系」,也沒有定期的透明度報告。甚至完全找不到任何跡象顯示有第三方審計(third-party audit)來確認究竟是哪些具備資格的人在接觸這款恐怖的模型 Reddit 上的 r/cybersecurity:放羊的孩子 Mythos:驗證正令 Anthropic 失去信任 [Mythos 200 多頁報告到底說了什麼]

總結來說,Anthropic 的態度無非是:「危險到足以毀滅世界,所以別多問,我們正在密室裡好好管理,大眾只要盲目相信我們公司就對了。」這種過時的做法自然遭到了在業界打滾數十年、深知缺乏外部驗證最終必將導致慘痛失敗的資安專家們的嚴厲批評 Reddit 上的 r/cybersecurity:放羊的孩子 Mythos:驗證正令 Anthropic 失去信任 [Mythos 200 多頁報告到底說了什麼]

因此專家建議,與其聽信為了吸引投資而一味進行誇大恐懼行銷的廠商,不如多聽聽每天與駭客進行生死戰爭的第一線資安從業人員的客觀評價 歸功於 Mythos AI,271 個 Firefox 漏洞已關閉:IT 安全的突破…

現狀:被攻破的無敵之盾

在缺乏透明證據卻不斷進行「AI 可能毀滅世界」的刻意恐懼行銷之際,屋漏偏逢連夜雨,發生了一起極其致命且令人羞愧的大型事故,讓人對 Anthropic 實際的安全能力產生了根本性的懷疑。

根據彭博社報導,身分不明的攻擊者非法存取了 Claude Mythos 的核心模型數據,導致珍貴資產外洩。Anthropic 不得不立即承認這一沉痛事實並展開緊急調查 [Mozilla 使用 Claude Mythos AI 預覽版來幫助修復… GamingOnLinux](https://www.gamingonlinux.com/2026/04/mozilla-using-claude-mythos-ai-preview-to-help-fix-major-security-issues-in-firefox/)。
而讓大眾感到最荒謬、最傻眼的是駭客那令人虛脫的攻擊手段。難道是動用了電影《不可能的任務》中那種華麗的高科技駭客技術嗎?並非如此,現實更接近一齣黑色喜劇。攻擊者只是偷走了資安管理鬆散的外部外包商登入資訊(帳號和密碼),便大搖大擺地登入,並透過基礎的方式推測 Anthropic 伺服器的內部網址,便暢行無阻地接觸到了多個「未發布的最高機密模型」 [Mozilla 使用 Claude Mythos AI 預覽版來幫助修復… GamingOnLinux](https://www.gamingonlinux.com/2026/04/mozilla-using-claude-mythos-ai-preview-to-help-fix-major-security-issues-in-firefox/)。

我們用一個簡單的比喻來形容這個荒唐的情況:這就像是用世界上最堅固的鈦金屬做了一個高科技保險箱,然後用擴音器大喊:「這裡面有毀滅世界的武器,絕對禁止靠近!」結果保險箱的後門卻是大開著,出入密碼還設成任何人都能猜到的「1234」。一家發明了全球最強智慧型駭客專用 AI 的公司,竟然在公司內部密碼管理這項最基本的安保工作上被輕易攻破,這無疑是一場巨大的羞辱。

理所當然地,這種言行不一的情況引發了巨大的嘲諷與激烈的反彈。人們敏銳地指出,雖然技術銷售商口口聲聲說著威脅世界的主張,但從實際發生的駭客事件真相來看,他們的傲慢不過是如沙堡般虛幻的假象 [獲得你的 Anthropic Mythos 紀念別針 flyingpenguin](https://www.flyingpenguin.com/get-your-anthropic-mythos-novelty-pin/)。

部分專家更是一針見血地指出:如果 Mythos 真的如 Anthropic 所言,是比人類駭客快「數千倍」的漏洞搜尋工具,那麼其帶來的正面效應不應是攻擊速度變快導致世界毀滅,而應該是防禦者修補系統漏洞的「修補(patching)速度」大幅提升,從而讓世界變得更安全 放羊的孩子 Mythos:驗證正令 Anthropic 失去信任…

因為在 AI 傾瀉而出的成千上萬個漏洞中,逐一審查並確認哪些是真正會導致系統崩潰的「真炸彈」的「驗證(Verification)」工作,依然是需要高度智慧與人類判斷的真正瓶頸(bottleneck) Mythos 帳本,第 1 部分:Firefox 分水嶺與新時代…。換句話說,Anthropic 被指責刻意縮小了 Mythos 能帶來的防禦性益處,卻極力誇大其刺激恐懼感的威脅,這正是批評的核心論點。

未來會如何發展?

隨著對自身創新技術的刻意誇大以及隱藏在其背後的鬆散內部資安實體被公諸於世,大眾對曾經是創新指標的 Anthropic 的不信任感正呈爆炸式增長。美國白宮核心 AI 顧問、同時也是矽谷有力人士的 David Sacks 表示:「越來越多人合理懷疑 Anthropic 是否就是 AI 業界那個欺騙大眾的『放羊的孩子(boy who cried wolf)』」,這代表了業界日益冷淡的視線 白宮似乎突然對 Anthropic 感到非常恐懼

當然,即便行銷誇張、內部資安遭遇蒙羞,Mythos AI 能在瞬間找出原本固若金湯的 Firefox 的 271 個零日漏洞,這項歷史性成就本身是不容抹滅的。負責安全防衛的白宮與政府機構為了應對可能發生的恐怖網路戰爭,依然保持著極高的警惕。我們在短時間內仍需每日密切關注 Mythos 是否真的具備動搖國本的能力,以及政府採取的前所未有的防禦措施是否妥當 白宮似乎突然對 Anthropic 感到非常恐懼

在激烈的 AI 時代,真正的勝者不會是那個幸運地握有能如雨點般隨機灑下無數漏洞的機器的人。唯有具備能從傾瀉而出的漏洞中,智慧地過濾出真正能破壞系統的威脅,並完美證明其有效性的嚴謹驗證能力的資安團隊,才能成為最後的生存者 Mythos 帳本,第 1 部分:Firefox 分水嶺與新時代…

究竟 Anthropic 能否反省過去的傲慢,順從地接受透明的外部審計,並奇蹟般地恢復崩塌的大眾信任?還是會像童話中那個謊稱狼來了欺騙村民的孩子一樣,在真正的威脅降臨時,迎來世上再無人相信其急切警告的淒涼結局?全世界的目光正聚焦在 Anthropic 的下一步。

AI 的視線 (MindTickleBytes AI)

即使在實現了足以改變世界的驚人技術成就後,卻因為「秘密主義導致的透明度不足」和「基礎內部資安失敗」這種荒唐的錯誤而親手踢翻大眾的信任,這是大型技術產業不斷重複的最沉痛矛盾。無論擁有再怎麼壓倒性的技術,如果不與大眾坦誠溝通而僅是製造恐懼,那份創新就無法獲得完全的歡迎。如果頂著安全之名將技術徹底隱藏在幕後,卻連自身防範都做不好的虛偽行為不停止,大眾將會比起失控 AI 的破壞力,更先對大企業那種不負責任且傲慢的控管慾望感到恐懼。真正的創新並非源自閉門造車的恐懼行銷,而是始於在世人面前的透明證明與溝通。

參考資料

  1. 放羊的孩子 Mythos:驗證正令 Anthropic 失去信任…
  2. Claude Mythos 在 Firefox 中發現了 271 個零日漏洞… - Schneier 談安全
  3. [Mozilla 使用 Claude Mythos AI 預覽版來幫助修復… GamingOnLinux](https://www.gamingonlinux.com/2026/04/mozilla-using-claude-mythos-ai-preview-to-help-fix-major-security-issues-in-firefox/)
  4. Mythos 帳本,第 1 部分:Firefox 分水嶺與新時代…
  5. 放羊的孩子 Mythos - ~comp - Tildes
  6. 歸功於 Mythos AI,271 個 Firefox 漏洞已關閉:IT 安全的突破…
  7. Anthropic 的 Claude Mythos 是什麼?它會帶來哪些風險?
  8. Reddit 上的 r/cybersecurity:放羊的孩子 Mythos:驗證正令 Anthropic 失去信任 [Mythos 200 多頁報告到底說了什麼]
  9. [放羊的孩子 Mythos:驗證正令 Anthropic 失去信任 Rick’s Cafe AI](https://cafeai.home.blog/2026/04/21/the-boy-that-cried-mythos-verification-is-collapsing-trust-in-anthropic/)
  10. Reddit 上的 r/Anthropic:Anthropic 執行長 Dario Amodei:『我不希望 AI 被用來對付我們自己的人民』
  11. Reddit 上的 r/cybersecurity:白宮將 Anthropic 的 Mythos AI 整合到聯邦網路安全戰略中,以強化關鍵基礎設施
  12. [獲得你的 Anthropic Mythos 紀念別針 flyingpenguin](https://www.flyingpenguin.com/get-your-anthropic-mythos-novelty-pin/)
  13. [Anthropic 將您的數據交給 Elon Musk flyingpenguin](https://www.flyingpenguin.com/anthropic-gives-your-data-to-elon-musk/)
  14. 白宮似乎突然對 Anthropic 感到非常恐懼
測試你的理解
Q1. Anthropic 的 AI 模型「Mythos」預覽版在 Firefox 瀏覽器中發現了多少個致命的安全性漏洞?
  • 147 個
  • 244 個
  • 271 個
在初步評估過程中,Mythos 預覽版發現了 271 個連人類專家也忽略的 Firefox 瀏覽器零日漏洞,這些漏洞已在最新的更新中修復。
Q2. 關於 Mythos,導致 Anthropic 信任度降至冰點的近期資安外洩事故,其直接原因為何?
  • 駭客實體滲透進 Anthropic 總部的伺服器室。
  • 駭客使用了被盜用的第三方外包商登入資訊,並透過推測內部 URL 的基礎方式存取模型。
  • 駭客利用強大的量子電腦破解了 Anthropic 的核心加密密鑰。
號稱擁有頂尖駭客防禦技術的 Anthropic,諷刺地因為第三方廠商登入資訊被盜用以及網址猜測等極其基礎、初級的方式,導致未發布的模型外洩,遭遇了奇恥大辱。
Q3. 在 Anthropic 發布的龐大 Mythos 系統卡(System Card)文件中,真正用來支持「該模型過於危險而無法發布」這一主張的篇幅共有多少頁?
  • 整整 244 頁
  • 約佔一半的 120 頁
  • 僅 7 頁
分析長達 244 頁(容量 23MB)的龐大安全性文件後發現,真正探討模型嚴重風險並支持不應發布的核心論述部分僅有 7 頁,因此受到了強烈批評。