探讨衡量 AI 模型智能的新方式——Kaggle Game Arena(Kaggle 游戏竞技场),并用简单的比喻解释现有基准测试的局限性。
本文将为您深入浅出地解释为什么当前的 AI 性能衡量方式正面临瓶颈,以及学术界和工业界提出的衡量“真智能”的新方法是什么。