本周比较忙,看的论文不多,周五抽空看了下,我觉得有几个值得分享的。
① OpenAI 的 Let’s Verify Step by Step
链接:
cdn.openai.com简单说来,就是在训练 AI 做复杂问题的时候,让 AI 一步一步地生成结果,然后在每个步骤上给予奖励,而不是在结尾处给予单一奖励。比如让 AI 做一道数学题,步骤经过 ABC,最后结果算出来是 D,此时不应该在 D 处奖励 AI 算对了,而是在 ABC 中奖励。这样训练出来的模型,在数学相关的问题上,回答的准确性会更高。
我觉得这个训练过程,在教育人上也非常值得参考,学习不应该只判断最后的对错,而是要看步骤,奖励步骤,不断地给学生正反馈。
② 第二个是 OpenAI Sam 在一个大会上的演讲
链接:
humanloop.com演讲新闻稿,不知道为啥页面 404 了。我总结几个值得关注的点:
1. 接下来最高优的事情是让 GPT-4 更便宜,更快。
2. 今年可能会继续放开 Token 限制,可能会到 100K 甚至 1M Tokens。
3. Fine-Tuning API 将拓展到最新的模型。
4. 支持对话状态 API,意味着不需要反复传递信息,Token消耗应该也会少很多。
5. ChatGPT 目标是成为超级智能工作助手,open-air 会避免与客户竞争。另外,目前 ChatGPT 的插件还没有达到 PMF。
③ SnapFusion模型
链接:
arxiv.org这个模型是一个 Text-to-Image 模型,特点是可以部署在手机上,并且最快 2秒钟就能生成一张图片。
④ Is GPT-4 a Good Data Analyst?
链接:
arxiv.org最后这篇论文我觉得非常值得阅读。论文作者设计了一个框架,提示GPT-4使用来自各个领域的数据库进行端到端的数据分析,并使用经过精心设计的任务特定评估指标,将其结果与几位专业的人类数据分析师进行比较。结果和分析表明,GPT-4 可以生成与人类相当的结果。不过论文最后,还是保守了一些,提到 AI 是否能替代数据分析师,还有待验证。