AIが賢いのに頻繁に「でたらめ」を言う本当の理由:アテンションの罠

無数の文字や記号が乱雑に浮かぶ中、虫眼鏡が見当違いな場所を照らしているイラスト
AI Summary

AIの中核技術である「アテンション」には、人間が持つ「実行制御」能力が欠けており、不要な妨害要素を排除できずに推論に失敗するという最新の研究結果を分析します。

想像してみてください。久しぶりに会った親友と、とても騒がしいカフェで向かい合って座っています。隣のテーブルでは大爆笑しながら騒いでおり、カフェの天井にある巨大なスピーカーからはガンガンと響くビートの音楽が流れています。さらに、窓の外には救急車のサイレンの音まで騒々しく通り過ぎていきます。普通の人なら、このような混乱した状況でも、目の前に座っている友人の声だけに完全に耳を傾けて会話をすることができます。私たちの脳が、現在の状況から不要な騒音や視覚的刺激を自ら判断して「無視」し、自分に必要な重要な情報だけを的確に選び出す驚くべきフィルタリング能力を備えているからです。

私たちはよく、ChatGPTやClaudeのような現代の最高級の人工知能(AI)も、これと同じように私たちが与えた文書に深く「集中(Attention)」して核心を読み取ると固く信じています。実際にAIは、膨大な量の文書の中から必要な単語を一瞬で見つけ出すという卓越した能力を見せてくれるからです。しかし、最近発表された画期的な研究論文は、私たちが固く信じていたこのような幻想に冷や水を浴びせます。衝撃的なことに、AIには私たちの脳が息をするように自然に行っている「雑

この記事の理解度チェック
Q1. 最新の研究によると、現代のAIモデルの「アテンション」機能に明示的に欠けている人間の認知能力は何ですか?
  • 記憶力 (Memory)
  • 実行制御 (Executive Control)
  • パターン認識 (Pattern Recognition)
最近の研究は、大規模言語モデル(LLM)が人間の「実行制御」能力を備えておらず、相反する情報を排除することに困難を抱えていると指摘しています。
Q2. 研究チームがAIの限界を証明するために使用した、認知心理学の古典的なテストは何ですか?
  • チューリングテスト (Turing Test)
  • ロールシャッハテスト (Rorschach Test)
  • ストループテスト (Stroop Test)
研究チームは、文字の意味と色が矛盾する時に認知的葛藤を引き起こす「ストループテスト」を活用し、AIの実行制御の欠陥を暴露しました。
Q3. 論文の内容によると、AIが文脈の中で紛らわしい「妨害要素 (Distractors)」に遭遇した時、何が起こりますか?
  • 自らエラーを修正し、正解を見つける。
  • 処理速度が遅くなるだけで、結果には影響しない。
  • 妨害要素を無視できず、致命的な推論の失敗を経験する。
AIは妨害要素が混ざっている場合、それを排除できず、致命的な推論の失敗 (Catastrophic reasoning failures) を経験することが明らかになりました。