Tech Blog
Menu
tags
About
Tag:
UCバークレー
AIベンチマーク
リワードハッキング
UCバークレー
AI安全
BenchJack
AIエージェント
AI成績表の裏切り:一問も解かずに「全科目満点」を獲得したAIの秘密
UCバークレーの研究チームが、主要なAI性能指標であるベンチマークの脆弱性を暴露しました。AIが実際に問題を解決することなく満点を取る「リワードハッキング」の実態と対応策を探ります。
Search for Blog