即刻App年轻人的同好社区
下载
App内打开
曲凯
8月前
理解 RL 应该是今年做 AI 的必修课,这期就深入浅出的聊明白了 RL,聊的过程中也第一次让我完全理解了 RL LLM 的关系及来龙去脉。

以及!我特别喜欢吴老师提到的一句话:人生也是一个强化学习的过程,区别是强化学习有明确的奖励函数,而人生没有。

一堂「强化学习」大师课|对谈清华叉院助理教授吴翼

42章经

26

来自圈子

圈子图片

AI探索站

101242人已经加入