即刻App年轻人的同好社区
下载
App内打开
我是chiming
1年前
在影响大模型格局之外,Meta 的论文里还提到一个细节很有意思:大语言模型的卓越写作能力,从根本上是由 RLHF 驱动的。

这跟 Andrej Karpathy 之前在微软Build 上提到的一个观察遥相呼应:回答问题效果最好的三个大模型 GPT-4、Claude-2(当时还是1)以及GPT-3.5,都是经过RLHF精调的。

Llama2的chat模型再次验证了这个特点,也算是给了一个可以“借鉴”的答案。

可能让人觉得不那么舒服的地方,是这条路线的天花板也就在那摆着。

Llama 2 发布:一夜之间,大模型竞争来到新起点

点击阅读原文
21

来自圈子

圈子图片

AI探索站

79860人已经加入