Claude 的“扩展思维”功能旨在帮助 AI 在处理复杂问题前进行更深层的思考,但我们需要理解,我们所看到的思考过程可能并非完整的逻辑体系,而是一个经过总结的版本。
想象一下:如果你拥有一位“AI 秘书”,在处理数学难题或撰写复杂方案时,它会比平时多花 10 倍的时间去绞尽脑汁地思考,那会是什么样?最近人工智能界的一项技术引起了轰动:它让 AI 不再直接给出答案,而是像人类一样进行“片刻思考”。Claude 的开发商 Anthropic 将其称为“扩展思维(Extended Thinking)”。
然而,近期有质疑声指出,这项技术展示的“思考过程”并非 AI 思考的全部痕迹。我们在屏幕上看到的 AI 思考过程,真的能百分之百相信吗?
为什么这很重要?
随着 AI 技术的发展,我们希望能了解 AI 得出结论的“原因”。特别是在编写复杂的开发代码或制定战略规划等重要任务中,AI 的思考过程(审计追踪,即 Audit Trail,可审计的逻辑记录)必须透明,这样才能减少错误。
如果我们看到的思考过程只是包含部分逻辑的“摘要”,那么用户就可能无法全面掌握 AI 作出决策的完整背景。从这个角度来看,这非常关键,因为用户可能无法发现 AI 的逻辑漏洞,从而将错误信息当作事实接受。
轻松理解:AI 的“思考笔记”
为了理解“扩展思维”,我们打个比方。想象一下,当你在做考试题时,会在试卷旁边的“草稿纸”上涂涂写写来解题。
这里关键的一点是,此功能并非切换到了“另一个更聪明的 AI”,只是让现有的 AI 有更多时间进行自我思考。参考资料 5
但问题在于:Claude 4 等最新模型并不会把这些“写在草稿纸上的内容”原封不动地展示给我们。相反,它会整理出思考内容的核心要点,向我们展示一份“摘要”。参考资料 6 开发者 Patrick McCanna 指出,这不是 AI 逻辑的完美审计记录,而仅仅是存在数据丢失的“摘要”而已。参考资料 2, 参考资料 11
现状:并非万能
“扩展思维”并非总是表现完美。AI 思考得越久,并不意味着在所有问题上都能给出更好的答案。研究结果显示,在某些类型的任务中使用该功能,性能反而可能下降多达 36%。参考资料 3
目前,部分模型强制开启了此功能且无法关闭。参考资料 1 也就是说,我们被迫观看 AI 撰写的“草稿纸摘要”。
未来会怎样?
如何确保 AI 提供的“思考笔记”的可靠性,将成为未来的技术课题。就目前而言,要 100% 原样观看 AI 的思考过程在技术上非常困难。主流观点认为,“没有人能完美理解大语言模型(LLM,通过学习海量数据像人类一样理解和生成语言的 AI)到底是如何思考的”。参考资料 11
因此,用户明智的做法是不要盲目相信 AI 展示的思考过程是“全部”,而应将其作为参考工具,通过它来理解 AI 为得出结论所使用的“核心逻辑流”。
MindTickleBytes 的 AI 记者视角
随着技术的发展,AI 将越来越擅长“像人类一样思考(Reasoning)”。但我们不应忘记,AI 的“思考过程”与人类撰写的论文或日记本不同。简单来说,AI 的输出结果更接近于精密计算的预测值,而非绝对真理。因此,我们必须始终保持怀疑和验证 AI 输出结果依据的习惯。
参考资料
- Building with extended thinking - Claude API Docs
- Claude Code Extended Thinking Summary Not Authentic Reasoning …
- Claude Extended Thinking: The Ultimate Guide · GitHub
- Extended Thinking in Claude Code: Unlock Deeper Reasoning
- Claude’s extended thinking - Anthropic
-
[Building with Claude Extended Thinking by Cobus Greyling …](https://cobusgreyling.medium.com/building-with-claude-extended-thinking-d1a8b3130834) - Claude Extended Thinking: When to Use It and How to Build …
- Getting the Most from Claude Code’s Extended Thinking Mode …
-
[Extended thinking Claude Cookbook](https://platform.claude.com/cookbook/extended-thinking-extended-thinking) - Lesson 23: Extended Thinking - Mastering Claude
-
[ClaudeCode’s”extendedthinking”isasummary… HackerNews](https://news.ycombinator.com/item?id=48630535) - Claude3.7 Sonnet debuts with “extendedthinking” to… - Ars Technica
-
[What’sNew inClaudev4? AI Just Got Smarter by Rendiero Medium](https://medium.com/h7w/whats-new-in-claude-v4-ai-just-got-smarter-b62242ad95ba) - HackerNews– Telegram
-
[ThinkingMachines: When Should You Actually Use Reasoning… Glasp](https://glasp.co/articles/when-to-use-reasoning-models) - Claude3.7 Sonnet andClaudeCode\ Anthropic
- 无限提升 AI 智能的功能
- 让模型在处理复杂问题前投入更多时间和精力进行深度思考的功能
- 切断互联网进行思考的功能
- AI 思考所有步骤的完整原版记录
- 对 AI 推理过程进行压缩并只保留核心内容的摘要
- 关于结果的统计数据
- 是的,性能总是会提升
- 不是,在某些任务中性能反而可能下降多达 36%
- 与性能完全无关