刚刚,千问发布并开源了Qwen3.5-397B-A17B
作为Qwen3.5 系列的第一款模型
A17B是原生视觉-语言模型,在推理、编程、智能体能力与多模态理解等全方位基准评估中表现优异,
该模型采用创新的混合架构,将线性注意力(Gated Delta Networks)与稀疏混合专家(MoE)相结合,实现出色的推理效率。
总参数量达 3970 亿,每次前向传播仅激活 170 亿参数,在保持能力的同时优化速度与成本。
Qwen3.5 还将语言与方言支持从 119 种扩展至 201 种,为全球用户提供更广泛的可用性与更完善的支持。
相对于 Qwen3 ,Qwen3.5 的 Post-training 性能提升主要来自于对各类 RL 任务和环境的全面扩展。
这个系列更加强调 RL 环境的难度与可泛化性,而非针对特定指标或狭隘类别的 query 进行优化。
图 4️⃣ 展示了在通用 Agent 能力上,模型效果随 RL Environment scaling 带来的增益。整体性能由各模型在以下基准上的平均排名计算得出:BFCL-V4、VITA-Bench、DeepPlanning、Tool-Decathlon 和 MCP-Mark。