DeepSeek V4详细的官方公告也发了:
模型参数
(a) Pro 版本:总参数 1.6T,激活参数 49B
(b) Flash 版本:总参数 284B,激活参数 13B
(c) 预训练数据量:均为 32T
模式区分(网页端与 APP)
(a) 专家模式:代表 Pro 版本
(b) 快速模式:代表 Flash 版本
测评表现
在多项测评成绩上,该模型与 Opus 4.6 持平。其中,Agent 能力显著增强,世界知识也显著提高。
技术改进
全新的注意力机制已应用于新模型中,相比传统方法,大幅降低了对计算和显存的要求。
详情:
mp.weixin.qq.com