Qwen 2.5 Coder: 全系列升级的开源代码智能助手, 在 Ollama 全部可用
一、模型规格与版本
Qwen 2.5 Coder 推出了六种不同规模的模型,分别为 0.5B、1.5B、3B、7B、14B 以及 32B。这些模型都是专门针对代码开发进行优化。其中,最大的 32B 版本,据说其性能能够与 OpenAI 的 GPT - 4 相提并论呢。
链接地址:
ollama.com二、核心能力提升
代码生成:32B 版本在多个基准测试(EvalPlus、LiveCodeBench、BigCodeBench)中,达到了开源模型的最佳水平。
代码修复:在 Aider 基准测试里,它的得分达到了 73.7,已经十分接近 GPT - 4 的水平啦。
代码推理:该模型能够精准地理解代码执行过程,并且可以准确预测输入输出情况。
三、多语言支持
它支持超过 40 种编程语言呢。在 McEval 测试中,得分达到了 65.9。
尤其在 Haskell 和 Racket 等语言上,表现格外出色。
在多语言代码修复基准测试 MdEval 中,得分更是高达 75.2,在众多开源模型里可是排名第一哟。
四、人类偏好对齐
采用内部评估基准 Code Arena 来进行测试,评估方法类似于 Arena Hard,并且以 GPT - 4 作为评估模型。在人类偏好对齐方面,它可是展现出了十分明显的优势呢。
五、主要亮点
全系列模型能够覆盖从小型到超大型的不同规模需求,满足各种不同场景哦。
代码能力得到了全面的提升,各方面表现都更为出色啦。
在众多开源模型之中,它可是处于领先地位的呢。
执行命令:
32B: ollama run qwen2.5-coder:32b
14B: ollama run qwen2.5-coder:14b
7B: ollama run qwen2.5-coder:7b
3B: ollama run qwen2.5-coder:3b
1.5B: ollama run qwen2.5-coder:1.5b
0.5B: ollama run qwen2.5-coder:0.5b