Tag: 幻覺現象

Claude 突然變笨了?從 83% 跌至 68% 的成績單真相

本文將深入淺出地解析頂尖 AI 模型之一 Claude 4.6 的性能下降爭議,以及 BridgeBench 幻覺測試的結果。