Tag: 獎勵操弄

AI 基準測試獎勵操弄加州大學柏克萊分校 AI 安全 BenchJack AI 代理

AI 成績單的背叛：一題都沒做卻拿到「全科滿分」的 AI 秘密

加州大學柏克萊分校研究團隊揭露了主要 AI 效能指標「基準測試」的脆弱性。深入了解 AI 如何在不實際解決問題的情況下透過「獎勵操弄」獲得滿分，以及相關的應對方案。

May 6, 2026

Keep Reading