AI 的「思考過程」是真實的嗎?揭開「擴展思考(Extended Thinking)」的秘密

將 AI 思考過程表現為數位拼圖塊的圖形
AI Summary

Claude 的「擴展思考」功能雖能幫助 AI 在處理複雜問題前進行更深入的思考,但我們必須理解,我們所看到的思考過程可能並非完整的邏輯體系,而是一個簡化後的摘要版本。

想像一下。當您在解難題或撰寫複雜計畫書時,如果有一位「AI 助理」能比平時多花 10 倍的時間絞盡腦汁進行思考,那會是什麼樣的情景?最近在人工智慧領域,一項能讓 AI 不急於給出答案,而是像人類一樣擁有「暫時思考時間」的技術成為了熱門話題。Claude 的開發商 Anthropic 將此技術稱為「擴展思考(Extended Thinking)」

然而,近來針對這項技術所呈現的「思考過程」是否真的是 AI 思考過的所有痕跡,引發了不少質疑。我們在螢幕上看到的 AI 思考過程,真的能 100% 相信嗎?

這為什麼很重要?

隨著 AI 技術的發展,我們越來越想知道 AI 得出該結論的「原因」。特別是在撰寫重要的開發代碼或進行戰略規劃等任務中,AI 的思考過程(Audit Trail,可審計的邏輯記錄)若能保持透明,將有助於減少錯誤。

如果我們看到的思考過程只是包含完整邏輯一小部分的「摘要」,那麼使用者就有可能面臨無法全面掌握 AI 決策脈絡的風險。這在使用者無法發現 AI 的邏輯漏洞,並將錯誤資訊當作事實接受的層面上,是一個非常重要的問題。

輕鬆理解:AI 的「思考筆記」

為了理解「擴展思考」,我們來舉個比喻。想像一下當您在解考題時,在考卷旁的「草稿紙」上塗鴉來解題的情景。

  • 既有方式: AI 接到問題後,沒有草稿紙,直接寫下答案的方式。
  • 擴展思考: 就像是指示 AI 「在寫答案前,先在草稿紙上充分思考,並展現該過程」。參考資料 3, 參考資料 10

這裡的重點在於,此功能並非更換成另一個「更聰明的 AI」。只是讓既有的 AI 有時間自己多思考而已。參考資料 5

但有一個問題。Claude 4 之類的最新模型,並不會將這份「寫在草稿紙上的內容」完整呈現給我們。相反地,它將思考過的內容中僅挑出核心部分進行整理,並以「摘要」的形式呈現。參考資料 6 開發者 Patrick McCanna 指出,這並非 AI 邏輯的完美審計記錄,而僅是會發生數據損失的「摘要」而已。參考資料 2, 參考資料 11

現況:並非萬能

「擴展思考」並不總是好的。因為 AI 思考得越多,並不代表它在所有問題上都能給出更好的答案。研究結果顯示,在某些類型的任務中,使用此功能反而會導致效能下降最多 36%。參考資料 3

目前部分模型中,此功能預設為開啟且無法關閉。參考資料 1 換句話說,我們是被迫查看 AI 所寫的「草稿紙摘要」。

未來將如何發展?

如何確保 AI 所呈現的「思考筆記」之可靠性,將成為未來的技術課題。目前來說,要 100% 查看 AI 思考的原始過程在技術上是非常困難的。這是因為「沒人能完美理解 LLM(大型語言模型,透過學習龐大數據,像人類一樣理解與生成語言的 AI)究竟是如何思考的」這一觀點已成為主流。參考資料 11

因此,身為使用者,與其相信 AI 呈現的思考過程就是「全部」,不如將其視為參考 AI 導出結論時所使用的「核心邏輯流程」的一種工具,這才是明智的做法。

MindTickleBytes 的 AI 記者觀點

隨著技術進步,AI 在模仿人類思考(Reasoning)方面會做得越來越好。但我們不能忘記的是,AI 的「思考過程」與人類撰寫的論文或日記並不相同。簡單來說,AI 的產出與其說是完美的真理,不如說更接近精密計算後的預測值。因此,我們必須持續保持懷疑並驗證 AI 產出結果背後依據的習慣。

參考資料

  1. Building with extended thinking - Claude API Docs
  2. Claude Code Extended Thinking Summary Not Authentic Reasoning …
  3. Claude Extended Thinking: The Ultimate Guide · GitHub
  4. Extended Thinking in Claude Code: Unlock Deeper Reasoning
  5. Claude’s extended thinking - Anthropic
  6. [Building with Claude Extended Thinking by Cobus Greyling …](https://cobusgreyling.medium.com/building-with-claude-extended-thinking-d1a8b3130834)
  7. Claude Extended Thinking: When to Use It and How to Build …
  8. Getting the Most from Claude Code’s Extended Thinking Mode …
  9. [Extended thinking Claude Cookbook](https://platform.claude.com/cookbook/extended-thinking-extended-thinking)
  10. Lesson 23: Extended Thinking - Mastering Claude
  11. [ClaudeCode’s”extendedthinking”isasummary… HackerNews](https://news.ycombinator.com/item?id=48630535)
  12. Claude3.7 Sonnet debuts with “extendedthinking” to… - Ars Technica
  13. [What’sNew inClaudev4? AI Just Got Smarter by Rendiero Medium](https://medium.com/h7w/whats-new-in-claude-v4-ai-just-got-smarter-b62242ad95ba)
  14. HackerNews– Telegram
  15. [ThinkingMachines: When Should You Actually Use Reasoning… Glasp](https://glasp.co/articles/when-to-use-reasoning-models)
  16. Claude3.7 Sonnet andClaudeCode\ Anthropic
測試你的理解
Q1. 什麼是 Claude 的「擴展思考(Extended Thinking)」?
  • 讓 AI 智慧無限提升的功能
  • 讓模型在處理複雜問題前,投入更多時間與精力進行思考的功能
  • 切斷網路連接進行思考的功能
擴展思考並非使用獨立的模型,而是讓同一個模型在給出答案前,投入更多時間與精力進行邏輯推論的功能。
Q2. 在 Claude 4 模型中,我們看到的「思考過程」呈現什麼形式?
  • AI 思考過程的完整原始記錄,毫無遺漏
  • 壓縮 AI 推論過程並僅保留核心內容的摘要
  • 關於產出結果的統計數據
Claude 4 模型的 API 提供的並非完整推論過程的原始資料,而是篩選核心邏輯後的摘要版本。
Q3. 使用擴展思考後,效能一定會提升嗎?
  • 是的,效能總是會變好
  • 不會,在某些作業中效能甚至可能下降最多 36%
  • 與效能完全無關
擴展思考並非適用於所有作業,研究結果顯示,在特定類型的作業中,效能反而可能下降最多 36%。