最近火出圈的ChatGPT到底是啥？
专业解答，​一文看懂
​👍

之前的InstructGPT模型，是给一个输入就给一个输出，再跟训练数据对比，对了有奖励不对有惩罚；现在的Chatgpt是一个输入，模型给出多个输出，然后人给这个输出结果排序，让模型去给这些结果从“更像人话”到“狗屁不通”排序，让模型学习人类排序的方式…感谢转发❤️❤️❤️比一万个心

从GPT-1到GPT-4看ChatGPT的崛起

💻科技工作者➡️国际文艺工作者&传播学（英/阿）  ✍️正在研究如何成为一个作家  📖内地香港中东三地跑  ❤️历史&美景美食&思考

来自圈子