2025 年 4 月 16 日 OpenAI 正式发布 o3 系列模型,支持在思维链中原生调用工具,并将图像理解能力融入推理过程,能够结合缩放、旋转等图像处理工具解决复杂的视觉推理问题。:
openai.com此外,o3 引入了「交错思考」(Interleaved Thinking)能力,即在推理过程中交替执行思考与行动(ReAct 模式)。该能力通过 Responses API 首次上线,支持推理摘要以及在函数调用过程中保留推理 Token,并预告将内置网页搜索、文件检索和代码解释器等工具。随后,各大厂商纷纷跟进「交错思考」技术:
1. Anthropic 正式将此模式命名为「Interleaved Thinking」,并通过特定的 Beta Header 提供 API 支持。「To enable interleaved thinking, add the beta header interleaved-thinking-2025-05-14 to your API request.」
2. MiniMax M2原生支持交错思考,模型在每轮工具交互间进行反思,根据环境反馈决定下一步行动。「M2 natively supports Interleaved Thinking, enabling it to reason between each round of tool interactions. Before every Tool Use, the model reflects on the current environment and the tool outputs to decide its next action.」
platform.minimax.io3. Kimi K2 引入了类似的 Thinking 模式。
4. Google 为 Gemini 3 Pro 带来了思维签名(Thought Signatures)功能。
ai.google.dev5. DeepSeek-V3.2 实现了将思考直接集成到工具调用中,并支持在思考与非思考模式下灵活切换。「DeepSeek-V3.2 is our first model to integrate thinking directly into tool-use, and also supports tool-use in both thinking and non-thinking modes.」
6. 新叫法:👇 agentic thinking(Agentic思考)