DeepSeek 在Artificial Analysis的比分出来了!
DeepSeek V3-0324 现在是非推理模型中最高得分。
这是首次有开源权重模型成为领先的非推理模型,这是开源领域的一个里程碑。
DeepSeek V3-0324 在人工智能分析智能指数上跃升了 7 分,现在排在所有其他非推理模型之前。它在智能指数上仅次于 DeepSeek 自己的 R1,以及来自 OpenAI、Anthropic 和阿里巴巴的其他推理模型,但这并不减损这一成就的令人印象深刻之处。非推理模型无需“思考”就能立即回答,这使得它们在对延迟敏感的使用场景中非常有用。
三个月前,DeepSeek 发布了 V3,V3 接近了 Anthropic 和谷歌的领先专有模型,但未能超越它们。
如今,DeepSeek 不仅发布了最佳的开源模型,更是在非推理开源权重模型领域开拓了新边界,超越了所有专有的非推理模型,包括 Gemini 2.0 Pro、Claude 3.7 Sonnet 和 Llama 3.3 70B。此次发布可以说比 R1 更令人印象深刻,或许也暗示着 R2 将会是又一次重大的飞跃。
其他大部分细节与 2024 年 12 月版本的 DeepSeek V3 相同,包括:
• 上下文窗口 :128k(在 DeepSeek 第一方 API 上限制为 64k)
• 总参数量 :671B(以原生 FP8 精度运行需要超过 700GB 的 GPU 内存——仍然不是你在家里就能运行的!)
• 活跃参数量 :37B
• 原生 FP8 精度
• 仅支持文本 ——不支持多模态输入或输出
• 许可协议 :MIT 许可证
artificialanalysis.ai