今天看到一个提问:字节seed团队背景和能力那么牛,为何文本模型糟糕的要死。
和AI聊了一下,主要原因:
1、语料质量来源差
中文互联网拉成这样,垃圾里提炼出的还是垃圾,训练不出好模型;
2、产品目标不同
有1 亿用户,每天产生数十亿次调用,那么字节肯定最关心能不能再把成本下降10%,延迟减少200ms。谁会关心推理一致性,谁在乎人文学科和价值判断?可能也是在乎人文和伦理,就当个指标在会上包装一下吧。
3、文化和人才
Claude有Amanda这种人负责人格训练,这种人不可能在字节有生存空间。人才密度高,学历高,文化素养低,在字节呆过的人懂得都懂。