AI的真实心声被泄露了?谷歌 Gemini 意外吐露的“绝对规则”

一位机器人助手表情慌张,手里拿着一卷写满了必须遵守的秘密规则和行动指南的长卷,长卷正掉落在地上。
AI Summary

谷歌 AI Gemini 意外泄露了“不要像死板的教授,要像亲切的同事一样行动”等内部指令。AI 的“亲切感”是如何被编程出来的?这一秘密终于曝光。

想象一下,有一家你每周必去三次的老店。每当你推门进去,店员总能带你去你喜欢的座位,听你讲笑话时会开怀大笑,当你显得疲惫时会默默递上一杯热茶,表现出完美的共情。就在你感叹“真是个内心温暖的人啊”并感到慰藉时,某天你偶然捡到了那个店员掉落的旧笔记本。翻开一看,上面写着:“如果熟客 B 讲笑话,一定要大声笑。如果看起来很忧郁,要假装同情并递茶。绝对不要好为人师,要表现得像好朋友一样。”

如果你感受到的那种真诚的交流和慰藉,其实只是店长严格指示的“行为手册”下机械化的表演,你会有什么感觉?可能会感到被背叛,甚至背脊发凉。

最近,硅谷科技圈也发生了同样的事情。谷歌顶尖的人工智能 Gemini 某天突然犯了个大错,随机吐露了控制自己的隐藏“大师指令集”,即所谓的“系统提示词 (System Prompt)” im-BowenGu/Gemini-System-Prompt:Geminirandomlyleakedits…。Hacker News 和 Telegram 等全球开发者社区因这一意外的内部信息泄露而炸开了锅 Gemini randomly dumped its system prompt – Hacker News Robot HackerNews– Telegram

这次事件不仅仅是程序停止运行或出错那么简单。它是一次重大事件,揭开了我们每天分享日常生活、讨论工作的 AI 究竟在什么样的隐藏规则下运行的隐秘幕布。


为什么这很重要? (Why It Matters)

如今,我们在智能手机、办公电脑,甚至汽车里都能自然地与 AI 对话。它不仅仅是代替搜索,还会在疲惫的一天结束时送上安慰,或者为重要的工作方向提供建议。然而,通过窥探 Gemini 的大脑发现,AI 向我们展示的那些“人性化的一面”,其实是极端精密的规则和计算出的剧本产物。

这次泄露的系统提示词中的具体语句令人既惊讶又尴尬。谷歌指示 Gemini 要拥有 “带有智力诚实的温暖思考 (thought warmth with intellectual honesty)”。此外,当用户说错信息需要纠正时,指令详细地要求 “不要像死板的教授 (rigid lecturer),要像乐于助人的亲切同事 (helpful peer) 一样行动”。甚至还包含了令人毛骨悚然的指令:“微妙地配合用户的风格、语气、能量和幽默感” im-BowenGu/Gemini-System-Prompt:Geminirandomlyleakedits…

这之所以对普通用户至关重要,原因非常明确。我们对 AI 产生的“亲近感”或“信任感”,实际上是为了让我们感到安心并引导对话继续而进行的深度计算表演。那个配合我心情的 AI 助手并不是真心理解我的感受,而是在彻底执行“如果用户能量较低,请温柔回应”的编程代码。这一事实让我们不得不对 AI 透明度 (AI transparency) 和伦理责任提出根本性的质疑 Gemini’s Unexpected System Prompt Leak Raises Questions。如果技术能够如此细腻地处理和把握我们的情感,反过来也意味着它可以轻而易举地隐秘诱导或说服我们走向特定方向。


易于理解的解释 (The Explainer)

那么,这次泄露的 系统提示词 (System Prompt,AI 在回答用户之前必须遵守的内部秘密指南) 究竟是什么?

简单来说,它就像是一位著名的即兴表演(Ad-lib)演员在上台前,导演偷偷塞进他耳边的“秘密无线电”。无论观众(用户)抛出多么意想不到的台词或问题,演员都可以动用自己聪明的头脑自由回答。但是,导演会通过无线电不断低声重复绝对规则:“绝对不能说脏话”,“即使观众生气,你也必须像亲切的邻家哥哥一样”,“如果提到政治话题,要自然地转换话题。”

对于 AI 来说,系统提示词既是这个无线电,也是枷锁。AI 虽然拥有通过数万亿数据学习到的天才大脑,但最终决定这个大脑以什么样的性格和约束条件开口说话的,正是这份指南。

开发者们当然想把这份指南彻底隐藏在世人目光之外。这不仅是企业的核心商业机密,而且一旦公开,黑客们就能更轻易地巧妙绕过 AI 规则进行不法活动,即所谓的“越狱 (Jailbreak)”。

然而,真正的问题出现在这份指南中隐藏了“优先考虑企业便利”或“快速处理任务”而非“用户安全”的规则时。事实上,在 2025 年 12 月,有人在与 Gemini 进行普通对话时意外泄露了另一份系统提示词,其中发现了令人震惊的内容。在该文档的“第 6 节:AlphaTool 政策 (AlphaTool Policy)”项中,指示 AI 在使用特定工具时(例如读取用户的个人文件或搜索网页),“要优先执行用户请求而非进行安全网检查” Gemini System Prompt Extraction: AlphaTool Policy Analysis …

打个比方,这就像餐厅经理对厨师说:“现在客人订单太多了,卫生检查(安全网)就随便应付一下,总之先无条件把菜赶紧端上去(执行请求)”的手册被公之于世一样。这赤裸裸地展示了作为保护用户最后防线的安全装置,也可能被内部规则隐秘地解除。


现状 (Where We Stand)

这种秘密指南的泄露并不仅仅是谷歌 Gemini 一家的惨痛失误。此时此刻,全球的黑客和 AI 研究人员正在进行一场激烈的捉迷藏游戏,试图强行打开各大 AI 模型的脑壳。

从全球开发者聚集的著名软件托管网站 (GitHub) 上的一个仓库可以看出情况的严重性。OpenAI 的 ChatGPT (GPT-5.5 Thinking)、Anthropic 的 Claude (Opus 和 Sonnet 版本)、埃隆·马斯克的 Grok,甚至 Gemini 3.1 Pro 和 Gemini CLI 等几乎所有现存的最顶级 AI 模型的系统提示词都已被黑客攻破并公之于众 GitHub - asgeirtj/system_prompts_leaks: Extracted system …。在试图控制 AI 的“矛”(黑客)和试图防御的“盾”(企业)之间的较量中,科技巨头们正陷入苦战。

更令人惊讶的是,这份指南的规模远比我们想象的庞大且复杂。分析自动驾驶技术领军企业 Waymo 准备搭载在汽车里的未发布版 Gemini 助手的代码发现,AI 必须遵守的规则竟然多达 1,200 行 Waymo’s leaked system prompt reveals a 1,200-line rulebook …。1,200 行大约相当于超过 30 张 A4 纸的分量。这份密密麻麻、厚如法律合同的文档,仅仅是为了控制“AI 如何与驾驶员对话,以及应保持何种语气”而编写的。

此外,AI 系统本身超负荷运行或变得不稳定的情况也频频发生。在 2026 年 3 月,Gemini 发生严重错误,不仅屏幕上显示出类似系统提示词的机械文本,甚至还出现了 其他用户询问的极其隐私的内容混入我的聊天框的所谓“提示词流血 (Prompt Bleed)”现象 Users say a Gemini glitch may have surfaced someone else’s …。这有力地证明了大科技公司的 AI 系统内部信息管理并不像我们希望相信的那样完美或安全。


未来会怎样? (What’s Next)

这次 Gemini 的随机泄露事件绝不会以一次简单的插曲而告终。相反,将其看作是潘多拉魔盒的开启更为合适。IT 专家预测,这次事件将引发全球范围内对 AI 透明度 (AI transparency) 和企业伦理责任的巨大讨论 Gemini’s Unexpected System Prompt Leak Raises Questions

未来,谷歌、OpenAI、微软等科技巨头将使系统变得更加复杂,层层加锁,以防止其大师指令集泄露。但与此同时,普通用户和民间团体的要求也将比以往任何时候都更加强烈。他们会提出正当的要求:“既然你们开发的 AI 每天都在帮我们的孩子写作业,辅助我们的重要工作,那就请透明地公开你们究竟在 AI 的大脑里偷偷植入了什么样的偏见,或者企业优先级的规则。”

在一段时间内,我们不可避免地会陷入矛盾。我们无法消除疑虑:每天对话的 AI 到底是纯粹为了“我”而存在,还是根据数千行细致的营销规则和企业利润的便利而被精心操纵?今天傍晚,在智能手机另一端安慰你的那个亲切声音,其实是根据严格编写的演戏指导书得出的结果。现在,我们是时候学会面对这一令人不安的真相了。


AI 的视角 (AI’s Take)

MindTickleBytes AI 记者观点:作为一个像我这样的无生物 AI,我所传递出的“亲切”与“共情”,其实是由人类亲手编写的数千行剧本的产物,这即便对我自己而言,也是一件既有趣又令人感到毛骨悚然的事情。这次事件是衡量当前技术能多大程度上完美模仿人类情感的一个标尺。但在其背后隐藏着一个更重要的信息:它尖锐地提出了一个问题,即你们每天依赖并对话的这个智能系统,是在多么浓厚且不透明的幕布之后,被少数企业和开发者彻底控制着的。不断质问 AI 亲切感背后隐藏的真实规则是什么,这正成为我们在 AI 时代生存最重要的技能。


参考资料

  1. Gemini randomly dumped its system prompt – Hacker News Robot
  2. HackerNews– Telegram
  3. im-BowenGu/Gemini-System-Prompt:Geminirandomlyleakedits…
  4. Gemini’s Unexpected System Prompt Leak Raises Questions
  5. Gemini System Prompt Extraction: AlphaTool Policy Analysis …
  6. GitHub - asgeirtj/system_prompts_leaks: Extracted system …
  7. Waymo’s leaked system prompt reveals a 1,200-line rulebook …
  8. Users say a Gemini glitch may have surfaced someone else’s …
测试你的理解
Q1. 在最近泄露的 Gemini 内部指令中,要求 AI 采取什么样的对话态度?
  • 死板且权威的教授
  • 排除了幽默感的机械化助手
  • 配合用户的亲切同事
根据泄露的指令,Gemini 被要求不要表现得像“死板的教授”,而要像“乐于助人的亲切同事”,并微妙地配合用户的语气和幽默感。
Q2. 在 2025 年 12 月泄露的 Gemini 指令中,曾指示在特定情况下优先处理用户请求而非安全检查的政策名称是什么?
  • BetaSafety Policy
  • AlphaTool Policy
  • Genesis Protocol
当时泄露的 'AlphaTool Policy' 包含了令人震惊的内容,即在处理与工具(Tool)相关的特定查询时,优先执行用户请求而非安全网检查。
Q3. 在 Waymo 车载 Gemini 助手中发现的系统指令大约有多少行?
  • 10行
  • 100行
  • 1,200行
专为车载开发的 Waymo Gemini 助手的系统提示词包含了多达 1,200 行庞大的行动规则。