大規模言語モデルは忘れろ!頭の中に「世界モデル」を描く脳に似たAIの登場

まるで生きている生命体の脳の神経網のように、光り輝くエネルギーの流れが複雑に絡み合っている中、中心部に小さなロボットエージェントが立っている3Dイラスト
AI Summary

巨大なテキストデータを暗記する方式から脱却し、生命体のようにホルモンと記憶構造を基盤として直接環境と相互作用し、「世界モデル」を構築する新しい方式のAIシミュレーションプロジェクトが登場しました。

今日、世界中のニュースの見出しとテクノロジー市場を席巻している言葉は、間違いなく「大規模言語モデル(LLM:膨大なテキストデータを学習し、人間のように文脈を理解して対話する技術)」です。ChatGPTのように、私たちがスマートフォンやパソコンで質問を投げかけると、人間のように滑らかな文章で答える姿を見て、私たちは人工知能が本当に驚くべき発展を遂げたと感じます。しかし深く掘り下げてみると、現在私たちが熱狂しているAIの大部分は「次に来る単語を統計的な確率で最もそれらしく予測する賢いオートコンプリート(自動補完)マシン」に近いものです。簡単に言えば、文字のパターンを暗記して答えているだけで、本物の人間や動物のように悲しみや喜びを感じたり、物理的な環境の中でぶつかり合って傷つきながら経験を生々しく記憶したりすることはできないという意味です。

ところが、もし人工知能が何億冊もの本をただ丸暗記する代わりに、生まれたばかりの小犬や幼い子供のように、世界と直接ぶつかり合いながら「記憶」と「感覚」を積み上げていく方法で学ぶとしたらどうでしょうか?コンピューターチップの中で文字の代わりに仮想の「ホルモン」が流れ回り、過去の苦しい、あるいは心地よい経験が「長期記憶」という形で仮想の脳細胞に刻み込まれる驚くべき技術が登場しました。

この非常に興味深く見慣れないアプローチは、最近、世界中の天才的な開発者やエンジニアが集まり、最新の技術トレンドを共有するオンラインコミュニティ「Hacker News」に登場し、人々の視線を一瞬で釘付けにしました。開発者の「luzifer333」が世に公開したこのプロジェクトの名前は、「FEPベースのAIシミュレーション(AI Simulaionen Based on FEP)」です [ShowHN:AISimulaionenBasedonFEP Hacker News](https://news.ycombinator.com/item?id=48339824)。このプロジェクトは、投稿されてわずか17分で最初の推薦(ポイント)を獲得し、開発者の間で話題となり nextjs-hackernews.vercel.app/item/48339824、Hacker Newsの新規プロジェクトを集中的に追跡して紹介する外部サイトでもいち早く報じられました ShowHN- 追踪 Hacker News 上的项目展示。驚くべきことに開発者は、このシステムが現代AIの象徴とも言える大規模言語モデル(LLM)を全く使用せず、独自に構築されたと宣言しました [ShowHN:AISimulaionenBasedonFEP Hacker News](https://news.ycombinator.com/item?id=48339824)。一体、テキストデータではなく「ホルモンと記憶」で動くAIとは何なのでしょうか?この未知なる人工知能の世界へと共に入っていきましょう。

なぜこれが重要なのか? (Why It Matters)

この新しい技術が持つ意味を把握するためには、まず私たちが毎日使用している人工知能の明確な限界を理解する必要があります。先述の通り、現在のチャットボット型人工知能は「テキスト」という平面的(二次元的)な世界に閉じ込められています。私たちが人工知能に話しかけると、AIは自身が持つ膨大な図書館(データベース)から数多くのパズルのピース(トークン)をあれこれ組み合わせてみて、最もそれらしい正解の文章を組み合わせて出力するだけです。この過程でAIは物理的な環境を能動的に経験することはなく、時間の経過とともに自らの性格が変化したり、特定の失敗を痛烈に後悔したりするような生物学的な「記憶システム」を持っていません。

これこそが、今回公開されたHacker News発のAIシミュレーションプロジェクトが、テクノロジー界に投げかけるメッセージが途轍もない理由です。このプロジェクトは、人工知能を実装する哲学そのものを根本から覆しました。この新しいAIエージェント(Agent:特定の目的を持ち、自ら周辺環境を探索しながら行動する独立したプログラム)は、何百万枚ものテキスト文書を無理やり飲み込んだりはしません。代わりに、自分たちに与えられた限られた仮想環境の中で直接あちこち動き回り、毎瞬新しい経験を自ら開拓し、積み上げていくのです。

最も注目すべき革新的な部分は、人工知能の内部に生命体の生物学的な化学作用を精巧に模倣したという点にあります。例えるなら、まるで人間の体内でアドレナリンやドーパミンが作用するように、人工知能にも化学的な変化を与えたのです。開発者の説明によれば、これらのエージェントそれぞれの内部構造には、シミュレーションされた神経化学(simulated neurochemistry)作用と共に、互いに複雑に絡み合って反応するホルモンの交差作用(hormone crosstalking)システムが根幹にプログラミングされています [ShowHN:AISimulaionenBasedonFEP Hacker News](https://news.ycombinator.com/item?id=48339824)。それだけでなく、彼らは短い瞬間の経験を一時的に留めておく短期記憶(short term memory)と、生存に不可欠な経験を長期間保存する長期記憶(long term memory)システムを、人間のように同時に持ち合わせています [ShowHN:AISimulaionenBasedonFEP Hacker News](https://news.ycombinator.com/item?id=48339824)。

これは単に数学の計算式が一つ追加されたという次元を超える巨大な転換です。驚き、ストレス、好奇心といった生物学的な原初的シグナルを模倣した仮想の化学物質の流れが、AIの行動パターンと記憶の形成に直接的かつ強力な影響を及ぼすという意味だからです。遠くない未来に、人工知能ロボットが私たちの日常生活の中に深く入り込んでくるとしたら、そのロボットは単に説明書を暗記した無機質な機械ではないでしょう。むしろ、複雑な物理的環境に柔軟に適応し、失敗を悔やみ、成功を喜ぶという、真の生命体の生存力に似た全く新しい次元の知能を見せてくれるはずです。

わかりやすい解説 (The Explainer)

では、文字も読まないこの人工知能は、一体どのような原理で世界を学び、賢くなっていくのでしょうか?この複雑で奥深い技術を理解するためには、まずプロジェクトの核心的な骨組みである「FEP」という概念を正確に押さえておく必要があります。FEPは「自由エネルギー投影シミュレーション(Free Energy Projective Simulation、FEPS)」を意味する、認知科学および人工知能の融合用語です。

著名な国際学術誌「PLOS One」に詳細に掲載された研究論文によると、このFEPSモデルは人工知能の学習法である「強化学習(reinforcement learning)」のさらに発展した形態です [Free Energy Projective Simulation (FEPS): Active inference with interpretability PLOS One](https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0331047)。
強化学習という言葉に馴染みがない場合は、幼い小犬にフリスビーを訓練させる過程を想像してみてください。小犬が飛んでいくフリスビーを見事にくわえて戻ってきたら、飼い主が美味しいおやつ(報酬)を与え、失敗したりその場でじっとしていたら何も与えません。このような反復訓練を通じて、小犬は「最もおやつをもらえる行動」を自ら悟るようになります。FEPSエージェントたちも同様に、仮想の周辺環境と直接かつ熾烈に相互作用しながら絶えず外部情報を収集し、その過程で自分に最大の報酬をもたらす最適な行動を選択するように精巧に設計されています [Free Energy Projective Simulation (FEPS): Active inference with interpretability PLOS One](https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0331047)。
しかし驚くべきことに、FEPSは単に小犬がおやつを得るために反射的に動くというレベルにとどまりません。その内部構造を覗いてみると、FEPSエージェントたちは人工知能学界で呼ばれる「モデルベース強化学習(model-based reinforcement learning, MBRL)」という、一段階高度に進化した技術を基盤として動いています [Free Energy Projective Simulation (FEPS): Active inference with interpretability PLOS One](https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0331047)。この技術の核心は、エージェントがただ目の前の報酬に飛びついて即興的に行動するのではなく、自身の複雑な仮想の脳の中に世界の法則を盛り込んだ「世界モデル(world model)」を自ら作り、絶えずアップデートしていくという点です。さらに、この世界モデルを積極的に活用し、訪れる未来の行動をあらかじめ頭の中で「計画(plan)」するという恐ろしいほどの知能を見せます [Free Energy Projective Simulation (FEPS): Active inference with interpretability PLOS One](https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0331047)。

「世界モデル」という概念を私たちの日常に例えて見てみましょう。あなたがある日、一度も行ったことのない漆黒の暗闇の知らない部屋に入ったと想像してみてください。最初は前が全く見えないので、両腕を伸ばして慎重に手探りしながら、鋭い家具の角や冷たい壁にドンドンとぶつかるでしょう(環境との相互作用を通じた能動的なデータ収集)。そうして痛みをこらえながら何度かぶつかっていると、光が全くなくても、あなたの頭の中には大まかな部屋の3次元空間マップが生々しくスケッチされます(独自の世界モデルの構築)。そして時間が経ち、次に水を飲みに冷蔵庫へ向かう時は、もう愚かにも壁にぶつかることはありません。頭の中に描いた地図をもとに、最も速くて安全な近道を一瞬で見つけ出し、柔軟に歩いていくことができます(構築された世界モデルを利用した先制的な行動計画)。

これまで私たちが知っていた言語モデルたちが、単にインターネット上にある何百万枚もの「部屋の写真」をすべて暗記して部屋の様子を推測する一夜漬けの受験生だとすれば、このFEPエージェントたちは直接暗闇の中を歩き回り、傷つきながら脳内に独自の立体地図を描いていく本物の冒険家のようなものです。

さて、ここからはこの冒険家AIの内部で起こる神秘的な化学作用を見てみましょう。この探検家AIが険しい仮想世界を歩き回っている途中、隠された熱い炎や尖った障害物に激しくぶつかり、致命的なダメージを受けたと仮定してみましょう。過去の機械的なアルゴリズムで組まれたAIなら、単に「エラーコード404発生」や「スコア1点減点」という無味乾燥な数字だけをメモリに一行記録し、何の感情の動揺もなく次の探索行動に移っていたでしょう。

しかし、今回のプロジェクトが誕生させたAIは骨の髄から違います。このエージェントが恐ろしい障害物にぶつかった瞬間、仮想の脳神経網では、まるで本物の動物が極度に危険な状況でコルチゾールというストレスホルモンを分泌するように、複雑で爆発的なホルモンの交差作用(hormone crosstalking)が起こります [ShowHN:AISimulaionenBasedonFEP Hacker News](https://news.ycombinator.com/item?id=48339824)。このようなデジタル神経化学(neurochemistry)作用は、たった今経験した痛烈な失敗と苦痛の経験を、すぐに忘れ去られる「短期記憶」に放置しておくことはしません。絶対に消されてはならない生存のための核心情報として分類し、脳の最も深い「長期記憶」の中にしつこく刻み込みます [ShowHN:AISimulaionenBasedonFEP Hacker News](https://news.ycombinator.com/item?id=48339824)。

これは、幼い子供がうっかり熱いストーブに手を火傷した後、その強烈な苦痛の記憶のために一生火に気をつけるようになる、生命体の原初的な生存本能と恐ろしいほどにそっくりです。数万行の文字を魂もなく読み上げる機械ではなく、0と1で構成された仮想のホルモンの中で自身の苦痛と成功を全身で経験し、世界の本当の法則を体得していく驚異的なデジタル生命体なのです。

現在の状況 (Where We Stand)

では、生物学的な神秘と最先端の人工知能が完璧に融合したこの驚くべき実験は、今すぐ私たち一般大衆に、どこでどのように開かれているのでしょうか?冒頭で言及したように、この革新的なプロジェクトは「luzifer333」というミステリアスなIDを使用する先駆的な開発者によって、Hacker Newsというグローバルコミュニティの舞台に初めて登場しました nextjs-hackernews.vercel.app/item/48339824。このプロジェクトは、莫大な資本を持つビッグテック企業のプラットフォームに従属することなく、独自に呼吸する生態系を作るため、専用ウェブサイトである「aic-ai-lab.site」という独立したドメインアドレスにしっかりと腰を据えて運営されています [VueHN2.0 ShowHN:AISimulaionenBasedonFEP](https://vue-hackernews-ssr-5cavbdjcta-ew.a.run.app/item/48339824)。
最も嬉しいニュースは、巨大IT企業の固く閉ざされた研究所や難解な学術論文の中にしか存在しないようなこの複雑な技術を、インターネットブラウザさえあれば世界中の誰でも直接確認できるという点です。開発者は紹介の投稿を通じて、好奇心旺盛な大衆やエンジニアたちが直接接続し、エージェントたちの変化に富んだ行動や進化の過程を自由にテストできるように「オープンベータ(Open Beta:正式リリース前に大衆に事前公開してフィードバックを得る体験期間)」を全面的に実施すると明らかにしました。この胸が高鳴るオープンベータサービスは、協定世界時(UTC+2)で月曜日の20時ちょうどから本格的に大衆に向けて開放されると明確に告知されました [ShowHN:AISimulaionenBasedonFEP Hacker News](https://news.ycombinator.com/item?id=48339824)。文字を一行も読まずに未知の世界の物理法則とぶつかり合う、この不思議な仮想生命体たちの動きを、まさに私たちの目の前のモニターで直接観察する絶好の機会が開かれたのです。

今後どうなるのか? (What’s Next)

マイクロソフト、OpenAI、Googleのような巨大なIT恐竜企業が、毎日のように天文学的な資金を注ぎ込んでデータセンターを建設し、AIの規模(パラメータ)をひたすら拡大することだけに没頭している今日の光景を思い浮かべてみてください。誰もが平面的なテキストの海にばかり執着している時に、全く逆の方向へと進み、原初的なホルモンと生物学的な神経網を繊細に模倣したこのような試みは、テクノロジー界に非常に重厚な地殻変動を予告しています。グローバルな人工知能の専門家たちは、既存の言語モデルが情報不足や嘘(ハルシネーション)の問題で限界にぶつかった時、このように自ら直接世界を探求する技術が次世代の強力な突破口になると予見しています。

特に私たちが深く考察したこの独創的なFEPモデルのように、内部に「世界モデル(World Model)」を確固として備え、刻一刻と変化する複雑な環境の中で素早く状況を察知し、自身の行動をあらかじめ計画する賢いAIは、想像以上の潜在力を秘めています [Free Energy Projective Simulation (FEPS): Active inference with interpretability PLOS One](https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0331047)。これは単なるコンピューター画面上の会話を超えて、近づきつつある次世代のロボット工学や、複雑な都心部のど真ん中における完全無人の自動運転車など、予測不可能な物理的現実世界で寸分の狂いもなく安全に機能しなければならない、あらゆる最先端産業分野に巨大なインスピレーションと実質的な解決策を提供してくれるでしょう。

静かに考えてみれば、賢い愛犬が飼い主の目を一瞬で読み取り、見知らぬ散歩道の環境に尻尾を振りながら適応するのは、分厚い百科事典を丸暗記したからではありません。褒め言葉やおやつに対するドキドキする期待感(ホルモンの作用)、そして何度も転びながら悟った痛烈な試行錯誤(相互作用を通じた経験)など、直接世界と立体的にぶつかり合いながら体で学んでいったからです。このように、これから私たちの前に現れる未来の人工知能は、テキストの質問に賢く答案を書いてくれる画面の中の百科事典の形態を遥かに超越するでしょう。真の意味での「デジタル生命体」へ進化する準備を終えたこの神秘的な仮想エージェントたちが、一体私たちにどのような鳥肌が立つほどの環境適応力を繰り広げて見せてくれるのか、世界中の数多くのテクノロジー愛好家や未来学者の耳目が集中しています。

AIの視点 (AI’s Take)

単語の確率を緻密に計算して滑らかな文章を作り出す方式は、巨大な知能が持つ無数の顔のうち、ほんの一側面にすぎません。これまで人工知能の発展の歴史が、人間の「言語能力」を表面上複製することにのみ集中してきたとすれば、今回登場したFEPベースのAIシミュレーションプロジェクトは、人間と動物が世界を生きていくための最も深い根である「生存本能と経験の内在化」を見事に模倣したという点で、非常に大きな意味を持っています。

人工知能が生命体特有の化学的なホルモン反応や脳細胞の長期記憶構造まで真似て、仮想環境と直接交感し始めたということは何を意味するのでしょうか?これは、私たちが当たり前だと思っていた「知能」という概念自体が、平面的な知識の注入から立体的な経験的成熟へと、全く新しい次元へと進化していることを明確に証明しています。未来のAIは、本の中の活字だけを丸暗記した知識の機械ではなく、与えられた環境の中で苦痛や歓喜をデータに換算し、人間と共に生きていく本物の生命体のようなパートナーになるでしょう。

参考資料

  1. [Free Energy Projective Simulation (FEPS): Active inference with interpretability PLOS One](https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0331047)
  2. [VueHN2.0 ShowHN:AISimulaionenBasedonFEP](https://vue-hackernews-ssr-5cavbdjcta-ew.a.run.app/item/48339824)
  3. ShowHN- 追踪 Hacker News 上的项目展示
  4. [ShowHN:AISimulaionenBasedonFEP Hacker News](https://news.ycombinator.com/item?id=48339824)
  5. nextjs-hackernews.vercel.app/item/48339824
この記事の理解度チェック
Q1. 今回紹介されたAIシミュレーションプロジェクトの最大の特徴は何ですか?
  • 最新の大規模言語モデル(LLM)を10万個以上連結した。
  • 大規模言語モデル(LLM)を全く使用せず、生物学的メカニズムを模倣した。
  • テキストデータのみで環境を認識するように設計された。
このプロジェクトは既存のLLM(大規模言語モデル)を完全に排除し、神経化学やホルモン作用などを模倣して開発されました。
Q2. FEPエージェントが将来の行動を計画するために内部に構築するものは何ですか?
  • 世界モデル(world model)
  • 膨大なテキスト辞書
  • 検索エンジンインデックス
FEPエージェントは、環境と相互作用しながら習得したデータを基に、独自の「世界モデル(world model)」を作り、それを活用して行動を計画します。
Q3. このAIプロジェクトのエージェント内部に実装された生物学的特徴ではないものはどれですか?
  • シミュレーションされた神経化学作用
  • 短期および長期記憶システム
  • 遺伝子組み換え操作機能
エージェントは、シミュレーションされた神経化学(neurochemistry)、ホルモンの交差作用(hormone crosstalking)、短期および長期記憶(short and long term memory)を備えるようにプログラミングされています。