这周我在 Databricks 发表了一篇技术博客,聊了聊我们是怎么提升企业级 AI 智能体性能的。有几个核心亮点可以分享:
📈 开源模型效果再进一步
我们采用自研的 GEPA 技术(由 Databricks 与 UC 伯克利联合开发),对 gpt-oss-120b 模型做了优化。在处理典型企业文档分析任务时,它的准确率超过了 Claude Opus 4.1 约 3%,而服务成本却只有后者的近百分之一。
🔁 方法通用性强,闭源模型也适用
我们将同样的 GEPA 应用于 Claude Sonnet 4 和 Opus 4.1,这些模型的表现也进一步提升,创造了新的记录。这说明 GEPA 在不同模型之间具备良好的可迁移性。
⚖️ 对比 SFT,GEPA 效果更好、成本更低
我们将 GEPA 与传统的监督微调做了对比:GEPA 不仅效果更优,服务成本也进一步降低 20%。而把两种方法结合使用时,效果更佳。
💸 全生命周期成本优势显著
我们还从实际部署的角度,估算了模型优化与推理的整体成本。GEPA + 开源模型方案在长期运行中成本显著更低。当业务请求量超过 10 万次之后,前期投入的优化成本被摊平到可以忽略不计。
基于这些实验结果,我们认为 GEPA + 开源模型是一个非常适合企业实际落地的技术组合。
写这篇文章的过程中,Databricks CTO Matei Zaharia 给了很多个关注,从他那里获得了很多中肯和有用的建议。文章发表之后,Matei 在社交媒体上帮忙大力推荐这篇文章,所以特别感谢 Matei!
欢迎阅读完整博客:
www.databricks.com