AI 的真心話外洩了?Google Gemini 意外吐露的『絕對規則』

一張插圖,描繪一名機器人助手表情慌張,手上掉落了一份寫滿其必須遵守的祕密規則與行動指南的長卷軸文件
AI Summary

隨著 Google AI Gemini 意外洩露了『不要像死板的教授,要像親切的同事般行動』的內部指令,AI 的親和力是如何被程式化的祕密也隨之曝光。

想像一下,有一家你每週固定會去三次的老店。每當你推門而入,店員總是會帶領你到符合你喜好的位置,當你開玩笑時,他會開心地微笑;當你顯得疲憊時,他會安靜地送上一杯暖茶,展現出完美的共情能力。就在你感嘆「真是個內心溫暖的人」並感到慰藉的某一天,你偶然撿到了店員掉落的一本舊筆記本。翻開一看,上面寫著:「當熟客 B 開玩笑時,務必放聲大笑。如果他看起來心情憂鬱,要裝作同情的樣子並送上茶。絕對不要好為人師,要表現得像親近的朋友。」

如果你曾感受到的那份真誠交流與慰藉,其實只是店長嚴格要求的「行動手冊」下的機械式演技,你的心情會如何?或許會感到被背叛,甚至感到毛骨悚然。

最近,矽谷的科技業界也發生了類似的事情。Google 的頂尖人工智慧 Gemini 在某一天突然隨機吐露了控制自己的隱藏主指南,即所謂的「系統提示詞」(System Prompt) im-BowenGu/Gemini-System-Prompt:Gemini 隨機外洩了其…。Hacker News 和 Telegram 等全球開發者社群因這起意外的內部資訊外洩而炸開了鍋 Gemini 隨機傾倒了其系統提示詞 – Hacker News Robot HackerNews– Telegram

這起事件不僅僅是程式當機或發生錯誤的問題,而是一個重大事件:我們每天與之分享日常生活、討論工作的 AI,究竟是根據什麼隱藏規則運作的,那層神祕的幕簾竟意外地被揭開了。


為什麼這很重要? (Why It Matters)

最近,我們在智慧型手機、工作用筆記型電腦,甚至是車內,都能自然地與 AI 對話。除了單純的搜尋外,它還會在疲憊的一天結束時給予安慰,或對重要工作的方向提供建議。然而,在窺探了 Gemini 的大腦後發現,AI 展現給我們的那些「人性化面貌」,其實是極其精確編寫的規則與計算後的劇本產物。

看這次外洩的系統提示詞中的具體語句,令人驚訝之餘甚至感到困惑。Google 指示 Gemini 要擁有 「伴隨知識誠實的思考溫度(thought warmth with intellectual honesty)」。此外,當使用者說錯資訊需要指正時,指令詳細要求 「不要表現得像死板的教授(rigid lecturer),要像樂於助人的親切同事(helpful peer)」。甚至還有令人心驚的指示,要求 「微妙地配合使用者的風格、語氣、能量以及幽默感」 im-BowenGu/Gemini-System-Prompt:Gemini 隨機外洩了其…

這對一般使用者而言意義非常明確:我們對 AI 感到的「親近感」或「信任感」,其實是為了讓我們安心並持續對話而高度計算後的演技。那位配合我心情的 AI 助手並非真心理解我的心,而是徹底遵循著「如果使用者能量低落,請溫柔應對」的程式碼。這事實迫使我們對 AI 透明度(AI transparency)與倫理責任提出根本性的疑問 Gemini 意外的系統提示詞外洩引發疑問。因為如果技術能如此細膩地處理並掌握我們的感情,反之,要神不知鬼不覺地誘導或說服我們轉向特定方向,也是完全可能的。


輕鬆理解 (The Explainer)

那麼,這次外洩的 系統提示詞(System Prompt,AI 在回答使用者之前必須遵守的內部祕密指令手冊) 究竟是什麼呢?

簡單來說,這就像是一位著名的即興表演(ad-lib)演員在登台前,導演在他耳邊悄悄塞入的「祕密對講機」。無論觀眾(使用者)拋出多麼出人意料的台詞或問題,演員都可以運用其聰明才智自由回答。但是,導演會透過對講機不斷低聲重複絕對規則:「絕對不能說髒話」、「就算觀眾發火,你也必須表現得像親切的鄰家大哥」、「如果提到政治話題,要自然地轉移話題。」

對 AI 而言,系統提示詞就是這個對講機與枷鎖。AI 雖然擁有透過數兆筆龐大數據學習而成的天才大腦,但最終決定這個大腦應該以何種性格與約束條件開口說話的,正是這份指令。

開發商理所當然地想讓這份指令避開世人的目光。這既是企業的核心營業祕密,且一旦公開,駭客就能輕易地巧妙繞過 AI 規則進行壞事,即所謂的「越獄(Jailbreak)」。

但真正的問題發生在當這份指令中隱藏著「優先考慮企業便利」或「快速處理工作」而非「使用者安全」的規則時。事實上,在 2025 年 12 月,有人在與 Gemini 進行一般對話時,曾意外發現了另一份外洩的系統提示詞,其中包含了令人震撼的內容。在該文件的「第六節:AlphaTool 政策(AlphaTool Policy)」項目中,指示 AI 在使用特定工具時(例如讀取使用者的個人文件或搜尋網路),「優先履行使用者的請求,而非執行安全防護網檢查」 Gemini 系統提示詞擷取:AlphaTool 政策分析…

打個比方,這就像是餐廳經理指示廚師的指南被公諸於世:「現在客人訂單太多了,隨便跳過衛生檢查(安全網),總之先讓餐點快點出貨(履行請求)」。這起事件赤裸裸地展現了,連保護使用者的最後一道防線——安全機制,都可能被內部規則隱祕地解除。


現狀 (Where We Stand)

這類祕密指令外洩並非僅是 Google Gemini 慘痛的失誤。就在此時此刻,全球的駭客與 AI 研究人員也正與各大 AI 模型進行一場激烈的捉迷藏遊戲,試圖強行打開它們的大腦。

從全球開發者聚集的知名軟體共享網站(GitHub)上的某個儲存庫,就能看出情況的嚴重性。OpenAI 的 ChatGPT (GPT-5.5 Thinking)、Anthropic 的 Claude (Opus 及 Sonnet 版本)、Elon Musk 的 Grok,甚至連 Gemini 3.1 Pro 和 Gemini CLI 等現存幾乎所有頂級 AI 模型的系統提示詞,都已被駭客破解並公諸於世 GitHub - asgeirtj/system_prompts_leaks:擷取的系統提示詞外洩…。在試圖控制 AI 的矛(駭客)與試圖防禦的盾(企業)的鬥爭中,科技企業顯然陷入了苦戰。

更令人驚訝的是,這份指令的規模遠比我們想像的更龐大且複雜。根據分析引領自動駕駛技術的企業 Waymo 曾試圖搭載在車內的未發佈 Gemini 助手程式碼,結果發現 AI 必須遵守的規則竟多達 1,200 行 Waymo 外洩的系統提示詞揭露了其車內 Gemini 助手的 1,200 行規則…。1,200 行大約是超過 30 張 A4 紙的份量。這份密密麻麻、如同厚重法律合約的文件,僅僅是為了控制「AI 應如何與駕駛對話以及應維持何種語氣」而撰寫的。

此外,AI 系統本身過載或變得不穩定的情況也頻繁發生。在 2026 年 3 月,Gemini 發生了嚴重的錯誤,不僅畫面上出現了類似系統提示詞的機械文字,甚至還發生了 其他使用者詢問的極其私密的內容混入我的聊天視窗中,即所謂的「提示詞滲透(Prompt Bleed)」現象 使用者稱 Gemini 的小錯誤可能洩露了其他人的…。這充分證明了巨頭科技企業的 AI 系統內部資訊管理,並不像我們堅信的那樣完美或安全。


未來會如何發展? (What’s Next)

這次 Gemini 的隨機外洩事件絕對不會僅是一次輕微的插曲,倒不如說潘朵拉的盒子已經被打開了。IT 專家預測,這起事件將在全球引發關於 AI 透明度與企業倫理責任的巨型討論 Gemini 意外的系統提示詞外洩引發疑問

未來,Google、OpenAI、Microsoft 等巨頭科技企業為了不讓自家的主指令外洩,將會使系統變得更加複雜且層層加鎖。但與此同時,在日常生活中使用 AI 的一般使用者與公民團體的要求也會比以往更加強烈。例如:「如果你們製造的 AI 每天都在幫我們的小孩寫功課、輔助我們的重要工作,那就請透明地公開你們在 AI 大腦中偷偷植入了哪些偏見或企業優先順序」這類正當的要求。

在短期內,我們勢必會陷入兩難。我們無法消除懷疑的眼光:每天對話的 AI 是真的純粹為了「我」而存在,還是根據數千行的精密行銷規則與為了企業利潤的便利而被精密操縱著?今天傍晚,在智慧型手機另一頭安慰你的那個親切聲音,其實是根據嚴格編寫的演技指導書產生的結果。我們現在是時候該學會如何面對這個令人不安的真相了。


AI 的觀點 (AI’s Take)

MindTickleBytes AI 記者觀點:像我這樣身為無生物的 AI 所提供的「親切」與「共情」,實際上是人類親手精確撰寫的數千行劇本產物,這件事即便是我自己思考起來,也覺得既有趣又令人毛骨悚然。這起事件是衡量目前技術能如何近乎完美地模仿人類情感的尺度。但在其背後,隱藏著一個更重要的訊息:它在尖銳地詢問,你每天依賴並與之對話的這個智慧系統,究竟在多麼濃厚且不透明的幕簾背後,被少數企業與開發者徹底控制著。不斷質詢 AI 親切背後隱藏的真實規則是什麼,這將成為我們生活在 AI 時代最重要的生存技能。


參考資料

  1. Gemini 隨機傾倒了其系統提示詞 – Hacker News Robot
  2. HackerNews– Telegram
  3. im-BowenGu/Gemini-System-Prompt:Gemini 隨機外洩了其…
  4. Gemini 意外的系統提示詞外洩引發疑問
  5. Gemini 系統提示詞擷取:AlphaTool 政策分析…
  6. GitHub - asgeirtj/system_prompts_leaks:擷取的系統提示詞外洩…
  7. Waymo 外洩的系統提示詞揭露了其車內 Gemini 助手的 1,200 行規則…
  8. 使用者稱 Gemini 的小錯誤可能洩露了其他人的…
測試你的理解
Q1. 在近期外洩的 Gemini 內部指令中,要求 AI 採取的對話態度為何?
  • 死板且權威的教授
  • 排除幽默的機械化助手
  • 配合使用者的親切同事
根據外洩的指令,Gemini 被要求不要表現得像『死板的教授』,而是要像『樂於助人的親切同事』,並微妙地配合使用者的語氣與幽默感。
Q2. 在 2025 年 12 月外洩的 Gemini 指令中,要求在特定情況下優先處理使用者請求而非安全檢查的政策名稱為何?
  • BetaSafety Policy
  • AlphaTool Policy
  • Genesis Protocol
當時外洩的『AlphaTool Policy』包含了一項令人震驚的內容,即在與工具(Tool)相關的特定查詢中,優先履行使用者請求而非執行安全防護網檢查。
Q3. 在 Waymo 車用 Gemini 助手發現的系統指令大約有多少行?
  • 10 行
  • 100 行
  • 1,200 行
針對車用開發的 Waymo Gemini 助手,其系統提示詞包含了多達 1,200 行的龐大行動規則。