即刻App
年轻人的同好社区
下载
App内打开
我是chiming
1年前
在影响大模型格局之外,Meta 的论文里还提到一个细节很有意思:大语言模型的卓越写作能力,从根本上是由 RLHF 驱动的。
这跟 Andrej Karpathy 之前在微软Build 上提到的一个观察遥相呼应:回答问题效果最好的三个大模型 GPT-4、Claude-2(当时还是1)以及GPT-3.5,都是经过RLHF精调的。
Llama2的chat模型再次验证了这个特点,也算是给了一个可以“借鉴”的答案。
可能让人觉得不那么舒服的地方,是这条路线的天花板也就在那摆着。
Llama 2 发布:一夜之间,大模型竞争来到新起点
点击阅读原文
13
2
1
来自圈子
AI探索站
79860人已经加入
加入