OpenAI引入了WebSocket(WebSockets)技术,可将AI智能体的工作速度提高多达40%。现在,AI可以与用户进行无缝沟通,更快速地处理更复杂的任务。
想象一下,你请一位顶级大厨为你准备一顿复杂的晚宴。但这位大厨有个奇怪的习惯:每拿一件食材,他都要走出厨房,按一下门铃再进来。拿盐出去一趟,拿平底锅再出去一趟。即便他的厨艺再天才,等菜做好的时候恐怕也天黑了。等候的你肯定早就饿得精疲力竭了。
到目前为止,我们在使用智能体(Agent,能够自主判断并执行多个步骤任务的人工智能)时所感受到的那种微妙的迟钝感,正是源于此。它们虽然聪明,但每次下达指令时,总感觉它们在“请稍等……”中犹豫不决。不过,根据OpenAI最近发布的消息,现在这位大厨拥有了一条可以一直待在厨房里专心烹饪的“专用高速公路”。这就是名为 WebSocket (WebSockets) 的通信技术。OpenAI News
这个小小的技术变革将如何改变我们的日常生活?为什么AI会突然让你觉得聪明了40%,反应也变快了?让我们来通俗易懂地聊聊。
为什么这很重要?“等待的时代即将结束”
我们已经习惯了在向AI提问后,盯着屏幕上闪烁的光标发呆。看着“正在生成回答……”的提示去喝杯咖啡回来,也是常有的事。但在2026年的今天,这种“请求并等待响应(Request-Response)”的方式开始让人感觉像是过时的产物。Streaming the Vibe: Real-time Agentic UX with FastAPI WebSockets
特别是当AI不仅是对话,而是需要编写代码、发送邮件、预约日程等自主处理多个步骤的智能体工作流(Agentic Workflow,AI自主使用工具完成任务的流程)时,速度就是生命。Agentic Workflows in 2026: The ultimate guide - Vellum
任务越复杂,AI在内部执行的工具调用(Tool Call,借助计算器或搜索引擎等外部功能的操作)就越多。如果每次都要重新与服务器建立连接而耗费时间,用户最终会失去耐心。OpenAI引入的WebSocket技术正是为了解决这个“连接瓶颈”,让AI能像真人一样实时思考和反应。OpenAI WebSockets in the Responses API: Low-latency Agent Architecture - SuperGok
通俗理解:“书信往来”vs“电话沟通”
为了帮助理解,我们将传统方式和WebSocket方式比作日常生活中熟悉的场景:
- 传统方式 (HTTP):“书信往来” 每次让AI做事时,你都要郑重其事地写信寄过去。AI读完信、回完信后,就会完全忘记与你的联系。要让它做下一步,你必须再写一封信重新解释一遍之前的情况。在这个过程中产生的递送时间和重复解释,就是我们感受到的延迟(Latency,数据传输所需的等待时间)。
- WebSocket方式 (WebSockets):“电话沟通” 一旦拨通电话就不挂断,持续交流。AI已经知道你刚才说了什么,不需要额外的背景说明就能立即开展下一步工作。这就是会话连续性(Session Continuity,对话流保持不间断的特性)。OpenAI WebSockets in the Responses API: Low-latency Agent Architecture - SuperGok
| 此外,WebSocket方式还使用了增量输入(Incremental Inputs,仅选择并发送变化部分的方式)技术。[OpenAI WebSocket Mode for Responses API: Persistent AI agents. Up to 40% faster. | Product Hunt](https://www.producthunt.com/products/openai-websocket-mode-for-responses-api) 简单来说,不需要每次都从头再说一遍“你好,我是谁谁谁,现在正在做什么……”,而是可以直接说“把刚才那个里的这一部分改一下”,只传递新增加的信息。得益于此,数据传输量大幅减少,速度提升更是无与伦比。 |
现状:“提速40%的AI智能体登场”
据OpenAI开发者团队 (OpenAIDevs) 称,已有众多团队利用这一WebSocket功能将AI智能体的性能推向极致。@OpenAIDevs: “Teams are using WebSockets in the Responses API…”
从具体数字来看,这种差异更加惊人:
- 任务越复杂,优势越明显:在AI需要使用20个以上工具的高难度任务中,执行速度提升了20%到最高40%。这意味着过去需要1小时的工作,现在只需36分钟即可完成。OpenAI WebSockets in the Responses API: Low-latency Agent Architecture - SuperGok
-
开发者的福音:在分析和修改代码的任务(Codex风格工具链)中,工作效率提升了约30%。[OpenAI WebSockets in Responses API Deliver 30% Faster Agentic Rollouts: 2026 Analysis and Business Impact AI News Detail](https://blockchain.news/ainews/openai-websockets-in-responses-api-deliver-30-faster-agentic-rollouts-2026-analysis-and-business-impact)
这种速度的提升不仅意味着“更快完成”,更带来了额外的价值。用户可以实时看到AI思考、修正方向和产出结果的过程。这提供了一种仿佛与经验丰富的同事并肩作战、在白板上实时绘图协作般的体验。Streaming the Vibe: Real-time Agentic UX with FastAPI WebSockets
未来前景:“伴随我们左右的‘活’AI”
披上WebSocket技术外衣的AI智能体,未来将更深地融入我们的生活。
首先,必须实时交互的领域将发生彻底改变。电子游戏中的角色能在0.1秒内对你的突发行为做出反应;直播客户咨询机器人能实时感知你语气中的烦躁,并立即给出道歉和解决方案。Deploying Agents as Real-Time APIs with WebSockets and FastAPI
其次,可以放心地委托更复杂的任务。 过去因为耗时太长、担心中间出错而放弃的“多阶段任务(如:一次性完成从制定旅行计划到预订机票、预订当地餐厅)”,现在都能在现实的时间内处理完成。这标志着我们正超越单纯执行命令的机械秘书,真正开启了能自主定义并解决问题的自主型智能体时代。Agents At Work: The 2026 Playbook for Building Reliable Agentic Workflows
MindTickleBytes AI 记者的视角
WebSocket的引入不仅是“速度”问题,更是“信任”问题。就像我们与人交流时,如果对方回答太慢,除了无聊之外还会降低信任感一样,AI的反应速度也是衡量其能力的标尺。40%的速度提升将对AI自然融入我们的生活起到决定性作用。
现在,我们不必再经历向AI下达任务后“等待结果”的孤独时光。相反,我们将步入一个与AI实时对话、“共同雕琢成果”的令人振奋的时代。技术正是这样一点一滴、却又坚定不移地向我们走来。
参考资料
-
[OpenAI WebSockets in Responses API Deliver 30% Faster Agentic Rollouts: 2026 Analysis and Business Impact AI News Detail](https://blockchain.news/ainews/openai-websockets-in-responses-api-deliver-30-faster-agentic-rollouts-2026-analysis-and-business-impact) - OpenAI WebSockets in the Responses API: Low-latency Agent Architecture - SuperGok
- @OpenAIDevs: “Teams are using WebSockets in the Responses API…”
- GitHub - anirudhmendiratta/agentic-coding-websocket: Benchmark for comparing HTTP vs WebSocket for agentic coding workflows · GitHub
-
[OpenAI WebSocket Mode for Responses API: Persistent AI agents. Up to 40% faster. Product Hunt](https://www.producthunt.com/products/openai-websocket-mode-for-responses-api) - How to build realtime agentic applications
- Streaming the Vibe: Real-time Agentic UX with FastAPI WebSockets
- Agents At Work: The 2026 Playbook for Building Reliable Agentic Workflows
- Agentic Workflows in 2026: The ultimate guide - Vellum
- OpenAI News
- Deploying Agents as Real-Time APIs with WebSockets and FastAPI
- Streaming input and output using WebSockets - AG2
FACT-CHECK SUMMARY
- Claims checked: 19
- Claims verified: 19
- Verdict: PASS
- 10%
- 25%
- 40%
- 因为AI的大脑物理上变大了
- 因为连接不会断开并持续保持,仅传输必要信息
- 因为更换了更粗的网线
- 每月发送一次的电子邮件新闻通讯撰写
- 实时交互式游戏或直播聊天机器人
- 不需要联网的计算器应用