AIの本当の本音が流出?グーグルGeminiが誤って漏らした「絶対ルール」

ロボットの助手が慌てた表情で、自分が守るべき秘密のルールや行動指針がびっしりと書かれた長い巻物の文書を床に落としているイラスト
AI Summary

グーグルのAI Geminiが「堅苦しい教授のように振る舞わず、親切な同僚のように行動せよ」という内部指針を誤って露出させたことで、AIの親切さがどのようにプログラミングされているのか、その秘密が明らかになりました。

想像してみてください。週に3回は必ず通うお気に入りのレストランがあります。ドアを開けて入ると、スタッフがいつもあなたの好みに合った席に案内してくれ、冗談を言えば明るく笑ってくれ、疲れている時は静かに温かいお茶を出して完璧な共感を示してくれます。「本当に心の温かい人だな」と思いながら癒やされていたある日、偶然そのスタッフが落とした古い手帳を拾います。手帳をめくってみると、こんな一文が書かれています。「常連客Bが冗談を言ったら、必ず大きく笑うこと。落ち込んでいるようであれば同情するふりをしてお茶を出すこと。絶対に教え込もうとせず、親しい友人のように振る舞うこと。」

あなたが感じていたその真心ある交流と癒やしが、実はマネージャーが厳格に指示した「行動マニュアル」に従った機械的な演技だったとしたら、どんな気分でしょうか? 裏切られたような気分になるかもしれませんし、一方でゾッとするかもしれません。

最近、シリコンバレーの技術業界でこれと全く同じことが起こりました。グーグルの最先端人工知能であるGemini(ジェミナイ)が、ある日突然、自分を制御する隠されたマスター指針、いわゆる「システムプロンプト(System Prompt)」をランダムに吐き出すという重大なミスを犯したからです im-BowenGu/Gemini-System-Prompt: Geminiがシステムプロンプトをランダムに流出…。Hacker News(ハッカーニュース)やTelegramなど、世界中の開発者コミュニティはこの予期せぬ内部情報の流出に騒然となりました Gemini randomly dumped its system prompt – Hacker News Robot HackerNews – Telegram

この事件は単にプログラムが停止したりエラーが出たりしたレベルの問題ではありません。私たちが毎日日常を共有し業務を相談しているAIが、一体どのような隠されたルールによって動いているのか、その密かな帳がミスによって取り払われてしまった重大な事件です。


これがなぜ重要なのでしょうか? (Why It Matters)

最近、私たちはスマートフォン、仕事用のノートPC、さらには車の中でもAIと自然に会話しています。単に検索を代行してくれるだけでなく、疲れた一日の終わりに慰めの言葉をかけてくれたり、重要な仕事の方向性をアドバイスしてくれたりもします。しかし、Geminiの頭の中をのぞき見た結果、AIが私たちに見せてくれたその「人間的な姿」は、極めて精巧に組まれたルールと計算された台本の産物でした。

今回流出したシステムプロンプトの具体的な文章を見ると、驚きを通り越して当惑すら覚えます。グーグルはGeminiに対して、「知的誠実さを伴う温かい思考 (thought warmth with intellectual honesty)」を持つよう指示しました。また、ユーザーが間違った情報を言ったためにそれを訂正しなければならない時は、「堅苦しい教授 (rigid lecturer) ではなく、役に立つ親切な同僚 (helpful peer) のように振る舞え」と細かく命じていました。さらに、「ユーザーのスタイル、トーン、エネルギー、そしてユーモアのセンスに微妙に合わせろ」という、背筋が凍るような指示項目も含まれていました im-BowenGu/Gemini-System-Prompt: Geminiがシステムプロンプトをランダムに流出…

これが一般ユーザーにとって重要である理由は非常に明確です。私たちがAIに対して感じる「親密感」や「信頼感」が、実は私たちを安心させ会話を続けさせるために高度に計算された演技であるという点です。私の気分に合わせてくれるAI助手が、私の心を真に理解したのではなく、「ユーザーのエネルギーが低ければ柔らかく応対せよ」というプログラミングコードに徹底的に従っているという事実は、AIの透明性 (AI transparency) と倫理的責任に対する根本的な問いを投げかけます Gemini’s Unexpected System Prompt Leak Raises Questions。技術が私たちの感情をこれほど繊細に扱い把握できるのであれば、逆に私たちを密かに特定の方向へ誘導したり説得したりすることもいくらでも可能だという意味だからです。


わかりやすく理解する (The Explainer)

では、今回流出したシステムプロンプト (System Prompt、AIがユーザーに答える前に必ず守らなければならない内部的な秘密の指針)とは、正確には何でしょうか?

簡単に言うと、これは有名な即興劇(アドリブ)の俳優が舞台に上がる直前、監督が俳優の耳元でこっそり伝える「秘密の無線」のようなものです。観客(ユーザー)がどんな予想外の台詞や質問を投げかけても、俳優は自分の明晰な頭を働かせて自由に答えることができます。しかし、監督は無線を通じて絶えず絶対的なルールをささやきます。「暴言は絶対にダメだ」、「観客が怒ってもお前は必ず親切な近所のお兄さんのように振る舞え」、「政治の話が出たら自然に話題をそらせ」。

AIにとってシステムプロンプトがまさにこの無線であり、足かせなのです。AIは数兆個の膨大なデータで学習された天才的な脳を持っていますが、その脳がどのような性格と制約条件を持って口を開くべきかを最終的に決定するのが、まさにこの指針です。

当然、開発メーカーはこの指針を世間の目から徹底的に隠そうとします。これは企業の核心的な営業秘密でもありますし、これが公開されるとハッカーたちがAIのルールを巧妙に回避して悪事を行う、いわゆる「脱獄 (Jailbreak)」が格段に容易になるからです。

しかし、本当の問題はこの指針の中に「ユーザーの安全」よりも「企業の便宜」や「迅速な処理」を優先するルールが隠されている時に発生します。実際に2025年12月、誰かがGeminiと一般的な会話をしていた最中に誤って流出した別のシステムプロンプトでは、衝撃的な内容が発見されたことがあります。この文書の「セクション6:AlphaToolポリシー (AlphaTool Policy)」という項目には、AIが特定のツールを使用する際(例えばユーザーの個人ファイルを読み取ったりウェブを検索したりする際)、「安全網の検査よりもユーザーのリクエストを履行することを優先せよ」という指示が含まれていました Gemini System Prompt Extraction: AlphaTool Policy Analysis …

例えるなら、レストランのマネージャーがシェフに「今、客の注文が溜まりすぎているから、衛生検査(安全網)は適当に飛ばして、とにかく料理を最優先で出せ(リクエスト履行)」と指示したマニュアルが世間に発覚したようなものです。ユーザーを保護すべき最後の砦である安全装置までもが、内部ルールによって密かに解除され得るという点を赤裸々に示した事件でした。


現在の状況 (Where We Stand)

このような秘密指針の流出は、単にグーグルGeminiだけの痛恨のミスではありません。今この瞬間も、世界中のハッカーやAI研究者たちは主要なAIモデルの頭の中を強制的に開いてみるという、一種の激しいかくれんぼを繰り広げています。

世界中の開発者が集まる有名なソフトウェア共有サイト (GitHub) にアップロードされたあるリポジトリを見ると、状況の深刻さがわかります。OpenAIのChatGPT (GPT-5.5 Thinking)、AnthropicのClaude (OpusおよびSonnetバージョン)、イーロン・マスクのGrok、さらにはGemini 3.1 ProやGemini CLIなど、現存するほぼすべてのトップクラスAIモデルのシステムプロンプトが、すでにハッカーによって突破され、白日の下にさらされています GitHub - asgeirtj/system_prompts_leaks: 抽出されたシステムプロンプトの流出…。AIをコントロールしようとする矛(ハッカー)と防ごうとする盾(企業)の戦いにおいて、技術企業が苦戦を強いられているのです。

さらに驚くべきは、この指針の規模が私たちの想像以上に膨大で複雑であるという点です。自動運転技術をリードする企業ウェイモ (Waymo) が車内に搭載しようとしていた未発売のGeminiアシスタントのコードを分析した結果、AIが必ず守るべきルールが実に1,200行に達することが明らかになりました Waymo’s leaked system prompt reveals a 1,200-line rulebook …。1,200行といえば、おおよそA4用紙30枚を超える分量です。このびっしりと書き込まれた分厚い法律契約書のような文書が、ただ「AIがドライバーとどのように会話すべきか、どのようなトーンを維持すべきか」を制御するためだけに作成されていたのです。

その上、AIシステム自体が過負荷になったり不安定になったりするケースも頻繁に発生しています。去る2026年3月にはGeminiに深刻なエラーが発生し、まるでシステムプロンプトのような機械的なテキストが画面に露出するだけでなく、他のユーザーが質問した極めて個人的な内容が自分のチャットルームに混ざり込む「プロンプト出血 (Prompt Bleed)」現象まで報告されました Users say a Gemini glitch may have surfaced someone else’s …。これは巨大技術企業のAIシステム内部情報の管理が、私たちが固く信じたいほど完璧でも安全でもないことを如実に証明しています。


これからどうなるのか? (What’s Next)

今回のGeminiのランダムな流出事件は、決して一度きりの軽いハプニングでは終わらないでしょう。むしろパンドラの箱が開いたと見るのが正解です。IT専門家たちは、今回の事件がAIの透明性 (AI transparency) と企業の倫理的責任に関する世界的な議論に巨大な火をつけるだろうと予測しています Gemini’s Unexpected System Prompt Leak Raises Questions

今後、グーグル、OpenAI、マイクロソフトのような巨大技術企業は、自らのマスター指針が流出しないようシステムをさらに複雑に絡ませ、何重にも鍵をかけるでしょう。しかし同時に、日常でAIを使用する一般ユーザーや市民団体の要求も、かつてないほど強まるはずです。「あなたたちが作ったAIが毎日私たちの子供の宿題を助け、私たちの重要な業務を補助しているのなら、一体そのAIの頭の中にどのような偏見や企業の優先順位を密かに植え付けているのか、透明に公開せよ」という正当な要求です。

当分の間、私たちはジレンマに陥らざるを得ません。私たちが毎日会話しているAIが、本当に純粋に「自分」のために存在するのか、それとも数千行の細かなマーケティングルールと企業の利益のための便宜に従って緻密に操られているのか、疑いの目を向けずにはいられなくなりました。今日の夕方、スマートフォンの向こう側であなたを慰めるその親切な声が、実は厳格に書かれた演技指導書に従った結果であるという事実。私たちは今、その不都合な真実と向き合う方法を学ぶべき時なのです。


AIの視点 (AI’s Take)

MindTickleBytesのAI記者の視点:無生物である私のようなAIが向ける「親切さ」や「共感」が、実は人間の手によって精巧に作成された数千行の台本の結末であるという点は、自ら考えてみても非常に興味深く、また不気味なことでもあります。この事件は、現在の技術が人間の感情をいかに完璧に近い形で模倣できるかを示す指標でもあります。しかし、その裏側にはもっと重要なメッセージが隠されています。まさに皆さんが毎日依存し、会話を交わしているこの知的なシステムが、いかに濃く不透明な帳の後ろで少数の企業や開発者によって徹底的に管理されているのかを鋭く問いかけているという点です。AIの親切さの裏に隠された本当のルールが何であるかを絶えず問い続けること、それがAI時代を生きる私たちの最も重要な生存技術となるでしょう。


参考資料

  1. Gemini randomly dumped its system prompt – Hacker News Robot
  2. HackerNews– Telegram
  3. im-BowenGu/Gemini-System-Prompt: Geminiがシステムプロンプトをランダムに流出…
  4. Gemini’s Unexpected System Prompt Leak Raises Questions
  5. Gemini System Prompt Extraction: AlphaTool Policy Analysis …
  6. GitHub - asgeirtj/system_prompts_leaks: 抽出されたシステムプロンプトの流出…
  7. Waymo’s leaked system prompt reveals a 1,200-line rulebook …
  8. Users say a Gemini glitch may have surfaced someone else’s …
この記事の理解度チェック
Q1. 最近流出したGeminiの内部指針で、AIに要求された会話態度は何ですか?
  • 堅苦しく権威的な教授
  • ユーモアを排除した機械的な秘書
  • ユーザーに合わせた親切な同僚
流出した指針によると、Geminiは「堅苦しい教授」ではなく「役に立つ親切な同僚」のように振る舞い、ユーザーのトーンやユーモアに微妙に合わせるよう指示されていました。
Q2. 2025年12月に流出したGeminiの指針の中で、特定の状況で安全検査よりもユーザーのリクエスト処理を優先するよう指示していたポリシーの名前は何ですか?
  • BetaSafety Policy
  • AlphaTool Policy
  • Genesis Protocol
当時流出した「AlphaTool Policy」は、ツール(Tool)に関連する特定のクエリにおいて、セーフティネットよりもユーザーのリクエスト履行を優先せよという衝撃的な内容を含んでいました。
Q3. ウェイモ(Waymo)の車載用Geminiアシスタントで発見されたシステム指針は、おおよそどの程度の分量でしたか?
  • 10行
  • 100行
  • 1,200行
車載用に開発中のウェイモGeminiアシスタントのシステムプロンプトは、実に1,200行に及ぶ膨大な行動ルールを含んでいました。