AIはどこまで賢くなったのか?Google DeepMindが提示した「AI通知表」

様々な認知能力を象徴するアイコンが繋がり、一つの知能を形成しているグラフィック画像
AI Summary

Google DeepMindが、AIの知能を単一のスコアではなく、10の認知能力を通じて多角的に評価する新しい基準「認知タクソノミー(Cognitive Taxonomy)」を公開しました。

想像してみてください。あなたのお子さんが学校から帰ってきて、「お母さん、今日『賢さ』のテストで80点取ったよ!」と誇らしげに言ったとします。しかし、通知表をよく見ると、それが数学の点数なのか、国語の点数なのか、あるいは体育の短距離走の点数なのか、全く書かれていません。子供が本当に数理に強いのか、それとも言語感覚に優れているのか、知る術がありません。

これまでの人工知能(AI)も同様でした。私たちは毎日「このAIは天才的だ」「性能が圧倒的だ」という言葉を耳にしますが、具体的にAIがどのような面で人間に近づき、どの部分で依然として課題が残っているのかを測定する明確な基準がありませんでした。特に、人間のようにあらゆる知的タスクをこなせる「汎用人工知能(AGI, Artificial General Intelligence)」に私たちがどれほど近づいているのかについては、専門家の間でも意見が分かれていました。Source 5

このような曖昧さを解消するため、世界最高峰のAI研究所であるGoogle DeepMindは2026年3月、AIの知能を体系的に測定できる精密な尺度「認知タクソノミー(Cognitive Taxonomy)」を発表しました。Source 1, Source 10

なぜこれが重要なのでしょうか?

単にAIが詩を上手に書いたりコーディングを助けたりするレベルを超え、人間の知能を全般的に代替しようとする段階に入ったからです。この時点で明確な基準が必要な理由は3つあります。

  1. 現在地の把握: 目的地(AGI)がどこにあるか分からないまま霧の中を歩くよりも、地図上に現在の座標を正確に記してみる方がはるかに安全で効率的です。Source 6
  2. 安全と制御の鍵: AIがどのような特定の認知能力で人間を圧倒し始めているかを事前に知れば、発生しうるリスクを予測し、適切な安全装置を講じることができます。例えば、「欺瞞」や「社会的操作」の能力が急上昇しているなら、私たちは直ちに注意を払う必要があります。
  3. 知能の本質への集中: 最近のAI業界は、「このAIがどれだけの利益をもたらすか」といった商業的価値で知能を評価しようとする傾向がありました。Source 13 DeepMindは、こうしたマネーの論理から脱却し、「人間の心と思考(認知)」という根本的な価値に評価の中心を戻そうとしています。Source 13

AIの「認知能力10種競技」

DeepMindが提案した今回のフレームワークを例えるなら、「AIのためのオリンピック10種競技」と言えます。陸上の10種競技が走り、跳び、投げといった様々な身体能力を総合的に評価するように、DeepMindもAIの知能を10の核心的な認知機能(Cognitive Faculties)に分けて評価することを提案しています。Source 10, Source 11, Source 12

この10の能力には、私たちが普段「賢い」と感じる要素が含まれています。

  • 記憶力: 膨大な情報を忘れずに呼び出す能力
  • 推論力: 論理的に問題を解決する能力
  • 言語理解力: 文脈やニュアンスを把握する能力
  • 社会的知能: 他者の意図を把握する能力など

このように知能を細分化すれば、「Aモデルは暗記力は金メダル級だが、創造的な計画立案(Planning)は小学生レベルだ」といった立体的な診断が可能になります。

AIはどれほど賢ければ「人間レベル」と言えるのか?

DeepMindは非常に厳格で具体的な合格基準を設けました。あるAIシステムが特定の認知能力において「一般人のサンプルのうち、少なくとも50%以上の能力と一致する」なら、その分野で知的能力を備えていると認めます。Source 2

簡単に言えば、AIが数学の問題を解くときに、平均的な100人のうち50人よりも優れているか同等にこなせるなら、「このAIは人間レベルの数理推論能力を備え始めた」と判定するのです。100%完璧ではなくても、平均的な人間と同じくらいにこなせるなら、実生活で十分に役割を果たせると見る現実的な基準です。Source 2

理論を超えて実践へ:約3,000万円の懸賞金

DeepMindは、単に「このような基準が良い」と口頭で主張するだけにとどまりませんでした。これを実際に具現化するため、3段階の精密な実験手順(プロトコル)を提案しました。Source 4

  1. 定義: 10の認知能力が正確に何であるかを学術的に定義します。
  2. 試験問題(ベンチマーク): 各能力を測定できる高難度の試験問題を開発します。
  3. 対決: 実際の人間集団とAIを同じ条件で比較テストします。Source 4

さらに、世界中の天才開発者たちを参加させるため、総額20万ドル(約3,000万円)の賞金を懸けた「Kaggle(カグル)ハッカソン」を開催しました。Source 10 人類共通の資産となる「AI知能測定器」を共に作ろうという挑戦状です。Source 7, Source 8, Source 15

「すでに到達した」vs「まだ先だ」:大物たちの意見の相違

興味深いのは、この発表の直前、Nvidiaのジェンスン・ファン(Jensen Huang)会長が「私たちはすでにAGIを達成した」と主張し、業界を騒がせたという事実です。Source 13 しかし、DeepMindの厳格な尺度を当てはめれば話は変わります。ファン会長が「特定の試験合格や経済的成果」を基準としたのに対し、DeepMindは「人間の複合的な認知能力」というはるかに厳しい基準を堅持しているからです。Source 13

私たちが迎える未来の姿

産声を上げたばかりのこの「認知タクソノミー」は、今後私たちがAIと向き合う方法を根本から変えるでしょう。

  • 標準通知表の登場: 今後リリースされるGPTやClaudeのようなモデルは、「私たちのモデルはDeepMindの体系において10項目中8項目で人間上位50%を超えました」という通知表の提出が義務付けられるかもしれません。Source 12
  • 精密な弱点補完: 現在のAIが言語は流暢だが「状況対処および計画立案(Planning)」が脆弱であるという点が数値で示されれば、研究者たちは何を優先的に改善すべきかを正確に把握できるようになります。Source 11
  • 人間をより深く理解する契機: AIを測定するために人間の脳や認知能力を研究していくことは、逆に私たち人間がいかに複雑で偉大な存在であるかを再発見する驚くべき旅となるでしょう。Source 9

結局、今回の発表の核心は、「測定できなければ管理できない」という経営の真理をAI分野に導入したことにあります。Google DeepMindは、AGIという巨大な未知の海を航海する人類に、非常に精密な羅針盤を一つプレゼントしたのです。Source 1


AIの視点:MindTickleBytes AI記者の眼

「知能は単一のスコアで定義できるものではありません。DeepMindが提示した10の認知能力は、あたかもオーケストラを構成する多様な楽器のようなものです。すべての楽器が調和して演奏されたとき、初めて私たちはそれを『真の知能』と呼ぶことができるでしょう。今回のフレームワークは、AIが単なる計算機を超えて、私たちと共に世界を理解し悩む真の伴侶になれるかどうかを測る、最も重要な試金石となるはずです。」


参考資料

  1. Measuring Progress Towards AGI: A Cognitive Framework
  2. Measuring Progress Toward AGI: A Cognitive Framework (PDF)
  3. Measuring Progress Towards AGI: A Cognitive Framework (AI Future Thinkers)
  4. Measuring progress toward AGI: A cognitive framework (AI Phreaks)
  5. [Measuring progress toward AGI: A cognitive framework AI Flow](https://aiflow.news/2026/03/17/measuring-progress-toward-agi-a-cognitive-framework)
  6. Measuring progress toward AGI: A cognitive framework – ONMINE
  7. Google DeepMind unveils cognitive framework to track AGI progress
  8. [Measuring progress toward AGI: A cognitive framework Hacker News](https://news.ycombinator.com/item?id=47424458)
  9. Google DeepMind Releases Cognitive Framework to Measure AGI Progress, Launches $200K Kaggle Hackathon
  10. [Measuring Progress Toward Agi A Cognitive Framework PDF Cognition](https://www.scribd.com/document/1015882718/Measuring-Progress-Toward-Agi-a-Cognitive-Framework)
  11. Google DeepMind Proposes a Cognitive Framework for Measuring AGI Progress - Insights
  12. [Nvidia’s Jensen Huang says ‘we’ve achieved AGI.’ But no… Fortune](https://fortune.com/2026/03/30/agi-definition-jensen-huang-lex-fridman-deepmind-turing-text-cognitive-taxonomy/)
  13. News— Google DeepMind
  14. Measuring Progress Towards AGI: A Cognitive… - NewsyToday
  15. Measuring Progress Towards AGI: A Cognitive Framework (Tech AI App)

FACT-CHECK SUMMARY

  • Claims checked: 13
  • Claims verified: 12
  • Verdict: PASS
この記事の理解度チェック
Q1. Google DeepMindが提示した新しいAGI測定体系の核心は何ですか?
  • AIが稼ぎ出す収益を測定する
  • 単一のスコアではなく10の核心的な認知能力を評価する
  • 単にチューリングテストに合格するかどうかだけを確認する
DeepMindは知能を単一の指標ではなく、10の主要な認知能力に細分化して評価する「認知タクソノミー」を提案しました。
Q2. 今回のフレームワークで、AIが特定の認知能力を備えていると判断する基準は何ですか?
  • 人間の専門家の100%の能力を発揮したとき
  • 一般人のサンプルの少なくとも50%以上の能力と一致したとき
  • 世界中のすべての言語を同時に翻訳できるようになったとき
システムが一般人のサンプルの少なくとも50%以上の認知能力と一致したとき、その能力を立証したものと見なします。
Q3. DeepMindがこの理論を実践に移すために開始したイベントは何ですか?
  • AIロボットサッカー大会
  • 賞金20万ドルのKaggle(カグル)ハッカソン
  • 世界規模の開発者カンファレンス
DeepMindは評価ベンチマークを構築するため、総額20万ドルの賞金を懸けたKaggleハッカソンを開催しました。