1 月字节发豆包 1.5 Pro 时,博客中写到:
“字节依托在推荐、搜索和广告领域的 AB Test (AB 测试)经验,研发了基于用户反馈的高效 PostTraining(后训练)全流程,基于豆包的大规模用户反馈,构建了从问题发现、数据挖掘、人机结合标注到快速迭代的闭环优化系统,通过【用户数据】飞轮持续提升【模型的实际使用体验】。”
字节用了 “模型的实际使用体验” 而非 “模型性能” 来描述正向循环的一环。一方面与当前主流认知不冲突,一方面也显示字节似乎希望在大模型上找到能滚起来的 “雪球”。
如果雪球真的存在,字节的哪些积累是杀器?
以及怎么知道雪球是雪球,还是陷阱了?