虽然现在增加了一项功能,可以设定让AI在处理复杂问题时'思考得更深入',但思考时间越长,消耗的Token就越多,从而导致等待时间和成本双双增加。
想象一下。假设您正在向同事或好朋友提问。如果您随口问一句:“今天午餐吃炸猪排还是泡菜汤好呢?”,对方可能一秒钟都不会犹豫,直接给出答案。但是,如果把问题的难度大幅提高,问道:“我们公司明年的营销预算,应该如何根据各个部门的情况进行高效分配呢?”,情况会怎样呢?对方会避免立即作答,而是会陷入沉思,翻阅过去的很长一段时间的文件。有时,他们会在纸上写写画画,或者自言自语,经过复杂的思考阶段后,才会谨慎地开口。这是人类解决问题时再自然不过的方式。
令人惊讶的是,最近我们在日常和工作中使用的最先进的人工智能(AI)模型中,也明显观察到了完全相同的现象。过去的AI模型,无论我们提出多么晦涩难懂的问题,都会立即在屏幕上吐出文字,表现得就像所谓的“超高速正确答案自动售货机”一样。然而,如今最新的AI会根据问题的难度或用户的指示,在给出答案之前陷入非常深度的思考之中。对于简单的问题,它会在眨眼之间作答;但对于复杂的问题,它就像人类专家一样,像苦恼了几分钟一样进行激烈的思考后,才会给出近乎完美的答案。
为什么这种“思考时间”突然成为人工智能必不可少的功能了呢?仅仅是假装很晚才回答,还是实际上在看不见的电脑电路中进行着惊人的大脑运转呢?今天在 MindTickleBytes,我们将浅显易懂地剖析最近成为全球人工智能行业核心趋势的“思考水平(Thinking effort,即AI为回答问题所投入的推理强度)”调节功能的运作原理,以及它对我们的钱包状况会产生怎样巨大的影响。
这为什么很重要?(Why It Matters)
| 首先,让我们一步步来看看这一新的技术变革对我们具有怎样重要的意义。如果您最近使用过Claude或ChatGPT等全球大型科技公司的最新人工智能,您可能会发现聊天屏幕的角落悄悄增加了一个与以往不同的设置菜单。这正是允许用户亲自调整人工智能思考深度的功能。现在,我们可以将AI为了回答问题需要进行多深程度的思考,精细地调节为“低(Low)”、“中(Medium)”、“高(High)”,甚至是要求极限思考的“极高(Xhigh)”等级 [[Ask HN: 思考量是如何实现的? | Hacker News](https://news.ycombinator.com/item?id=48434240)]。 |
这一变化从根本上颠覆了我们对待人工智能的范式本身。直到不久前,如果人工智能在解决复杂的数学问题或起草策划案时给出离谱的错误答案,我们通常会轻易地感到失望,说“AI想要赶上人类还差得远呢”。由于过去的模型急于在收到问题后立即凭借直觉将统计上最合理的单词拼接在一起,因此在需要深度逻辑推理的任务中难免会频繁犯错。
但是现在情况发生了一百八十度的大转弯。当AI给出离谱的回答时,在责怪AI的智力之前,我们必须先问自己:“我是否给了人工智能‘足够思考的时间’,让它能够解决这个复杂的问题?”。AI生态系统中新出现的这些“思考变体模型(Thinking variants,为最大化推理能力而专门设计的AI模型)”提供了比现有模型优越得多的扩展推理能力(Extended reasoning capabilities,即通过多角度思考来解决复杂问题的智力能力)。
| 打个比方,这就开启了一个新时代,用户只需点击一下,就能完全掌控自己手中的数字助手,是把它当作只能用来总结电子邮件的“实习生”,还是把它当作需要花费数天时间来处理庞大分析的“首席顾问” [[Thinking Variant | 扩展推理 | OpenRouter …](https://openrouter.ai/docs/guides/routing/model-variants/thinking)]。 |
轻松理解 (The Explainer)
那么,人工智能在冰冷的电脑电路中进行深度的“思考”,到底意味着怎样的技术过程呢?让我们暂时放下复杂的计算机工程术语,用大家熟悉的场景来打个比方。
简单来说,我们可以把人工智能想象成在厨房工作的“厨师”。现有的普通AI模型是一位知识渊博但性格非常急躁的“即兴厨师”。如果你点了一份“泡菜汤”,他连静下心来思考菜谱的时间都没有,就直接打开冰箱,把看到的食材全都倒进锅里煮。如果是一道简单的菜,用这种方式(传统的AI通过统计预测下一个单词的方式)也能做出相当像样的成品。但是,如果点的是需要几十种香料的法国全餐,或者是顺序至关重要的宫廷料理,那结果只会是诞生出一个一塌糊涂的失败之作。
| 然而,最新的人工智能技术强制塞给了这位厨师一个虽小却强大的武器——“个人记事本”和“厨房计时器”。现在,当接到苛刻的订单时,他不会先去开煤气灶。他会安静地坐在角落里打开记事本,运用一种名为“思维链(Chain-of-thought,将一个大问题拆解为多个小步骤,一步一步有逻辑地进行思考的方式)”的精密技巧来分解烹饪过程 [[Thinking Variant | 扩展推理 | OpenRouter …](https://openrouter.ai/docs/guides/routing/model-variants/thinking)]。 |
厨师会在记事本上仔细地记录下来。“第一步:熬制鳀鱼高汤。第二步:给肉去血水。第三步:搜索搭配的蔬菜……”就这样,他会自己提问并自己回答,按部就班(Step-by-step)地、耐心地进行。只有在脑海中完成充分的模拟实验后,他才开始烹饪,最终呈现出完美的作品。
以我们经常看到的数学拼图为例。“如果农场里共有10只鸡和猪,腿共有28条,那么各有多少只?”没有思考功能的旧模型完全依靠直觉,在一秒钟内就会吐出“5只鸡,5只猪”这样荒唐的错误答案。
相反,被赋予了“高”以上思考水平的最新模型,会在虚拟记事本上这样写道:“第一步:腿总数是28条。第二步:假设全部都是鸡(2条腿),那么总共是20条。第三步:实际的腿多出8条。第四步:因为猪比鸡多2条腿,所以多出的8条腿是4只猪的。第五步:因此,有4只猪,6只鸡。验证:(4x4)+(6x2)=28。完美。”
| 像这样为了得到正确答案,将巨大的问题拆解成明确的逻辑踏脚石并逐一跨越的方式,正是最新AI推理的核心 [[Thinking Variant | 扩展推理 | OpenRouter …](https://openrouter.ai/docs/guides/routing/model-variants/thinking)]。在这里,我们设定的“思考量默认值(Thinking effort defaults)”,就扮演着控制AI要将这一过程运用得多执着、多漫长的加速踏板的作用 [在VS Code中优化AI积分使用]。 |
让我们从成本和时间的角度来更深入地剖析一下。人工智能识别并生成文本的最小单位被称为“Token(词元)”。打个比方,这就像是为了完成句子这幅大图画而一块一块拼凑起来的小“拼图碎片”。在进行轻松的对话时,AI只需用最少的拼图碎片快速拼凑并展示答案即可。
但是,如果将思考水平设置为“高”,情况就完全不同了。在拼凑出我们肉眼可见的正确答案拼图之前,AI会在看不见的地方,不停地生成无数个被称为“思考词元(Thinking tokens)”的虚拟碎片,并进行模拟练习。虽然显示器上一个字也没有输出,但在AI内部,为了击破自身的逻辑漏洞和避免给出错误答案,正在进行着激烈的脑力劳动。
问题在于,人工智能思考得越久,这些虚拟的拼图碎片就会呈几何级数增长。由于计算机必须逐一运算这数以万计的碎片,因此延迟时间(Latency,提出请求后到收到结果的等待时间)势必会变长。此外,云服务是根据这个处理量来收费的。因此,等待时间越长,我们需要支付的积分消耗(Credit consumption,AI服务的使用成本)也会出现爆炸性的增长 [在VS Code中优化AI积分使用]。这是一种为了获得真正具有智慧的成果,我们必须支付更长等待时间和更高成本这样沉重代价的结构。
现状 (Where We Stand)
| 在2026年的今天,我们正经历着一个适应这项陌生技术的巨大过渡期。无数人每天都在进行试验,试图找出在日常生活中驾驭这把双刃剑功能的方法。根据不同的情况亲自选择思考水平能带来令人兴奋的控制感,但同时这也是每次提问时都需要苦恼的一道棘手难题 [[Ask HN: 思考量是如何实现的? | Hacker News](https://news.ycombinator.com/item?id=48434240)]。 |
最让人痛苦的现实烦恼就是时间与成本之间的权衡(Trade-off,为了获得某物而必须牺牲另一物的交换关系)。一些完美主义者坚持“结果一定要好”,所以在起草简单的3行邮件草稿或校对错别字时,也无条件地把思考水平固定在最高等级“极高”。结果,平时只需1秒钟就能完成的工作,现在却要呆呆地等上两分多钟。不仅如此,到了月底,看着见底的积分余额,他们还会对高额的账单感到愤怒。打个比方,这就好比去趟社区的超市,偏要开着法拉利去,白白浪费了巨额的油费。
相反的悲剧也时常发生。在要求分析数千行代码并找出错误这种高难度的任务中,为了省钱或者忘记了设置,而将AI的思考水平闲置在“低”的等级。被剥夺了深度思考能力的AI,会快速吐出一堆看起来像模像样但实际上完全是乱码的错误代码。用户一旦相信并加以应用,就会陷入无尽的错误泥潭之中。如果一开始就让它仔细思考,就不会产生这些巨大的时间和精神压力,这反而造成了更大的浪费,真是一个悖论。
结论是,我们正站在一个需要亲自去体会“该鞭策我那聪明的助手思考多久”这其中平衡点的训练场上。过去,提出巧妙问题的“遣词造句能力”很重要,但现在游戏的规则变了。如何根据自身的情况,适当地掌控这匹变得又贵又慢的聪明AI野马的预算和时间管理能力,已经成为了职场人士必备的全新生存素养。
未来会怎样?(What’s Next)
飞速发展的人工智能“思考功能”在未来将会如何演变呢?专家预测,目前繁琐的手动调节方式仅仅是一个暂时的过渡期,很快就会进化为无需用户干预即可智能运作的自动化方式。
理想的未来是,智能路由系统将变得普及,AI系统能自行判断用户问题的难度,并在后台自动分配“最佳思考时间”。例如,对于像“明天首尔天气怎么样?”这样简单的问题,AI会立即关闭推理引擎,并在0.1秒内给出答案。不用担心成本,也不需要枯燥的等待。
相反,对于类似“请用过去10年的气候数据,根据3种情景预测明年农作物的进口单价”这样高难度的问题,它会停止即时作答。取而代之的是弹出一个柔和的窗口尝试与您对话。一种会礼貌地征求同意的透明界面将会成为标准:“这项任务的难度非常高,大约需要3分钟的思考时间,并且会产生相当于500韩元的额外费用。您要继续吗?”。
此外,还会出现一种视觉上的创新,将AI在巨大服务器背后独自拼凑拼图的漫长等待时间,以一种优美的方式展示出来。想象一下“开放式厨房(Open Kitchen)”,您可以透过透明玻璃看着著名厨师做菜。枯燥感会消失,取而代之的是对厨师的信任。AI也是如此。如果在漫长的等待过程中,不再是枯燥的加载图标,而是像电影中的黑客一样,实时展示它激烈的思维过程——比如“第一步:全球气候数据实时分类中……第二步:假设冲突测试中……”——我们将能像窥探天才研究员的大脑一样,津津有味地享受这段等待的时光。
最令人激动同时也令人心生敬畏的事实是:随着由冰冷的硅组成的AI逐渐具备了像人类一样坚持不懈进行推理的能力,它正毫不畏惧地踏入那些我们曾经确信只有“人脑”才能胜任的领域——例如深奥数学的证明、科学假设的检验,以及制定企业复杂的商业战略。
AI的视角 (AI’s Take)
MindTickleBytes的AI记者视角:所有伟大技术的飞跃式发展,总是要求我们进行新的适应。只要投入几枚硬币就会立刻掉出罐装咖啡的“正确答案自动售货机”时代已经结束。如今的AI正以惊人的速度进化为一个“计时知识专家”,虽然每小时收取相当昂贵的咨询费,但能提供比世上任何人都更具深度的洞察力。
我们所支付账单上的金额不仅仅是电费。它是为了让AI解开您所抛出的复杂迷宫,甘愿燃烧其高贵“思考时间”而应得的合理代价。亲爱的读者们,在面对您日常接触的数字助手时,您是否正在给予它“充足且深度的思考时间”,好让它能够发挥出全部实力呢?
参考资料
-
[Ask HN: 思考量是如何实现的? Hacker News](https://news.ycombinator.com/item?id=48434240) -
[Thinking Variant 扩展推理 OpenRouter …](https://openrouter.ai/docs/guides/routing/model-variants/thinking) - 在VS Code中优化AI积分使用
- 回答变快且成本降低
- 获取回答的等待时间和成本都会增加
- 回答的长度必然变短
- 思维链 (Chain-of-thought)
- 随机抽样 (Random Sampling)
- 单重处理 (Single Processing)
- Netflix与YouTube
- Claude与ChatGPT
- Google Maps与Apple Music