即刻App
年轻人的同好社区
下载
App内打开
曲凯
8月前
理解 RL 应该是今年做 AI 的必修课,这期就深入浅出的聊明白了 RL,聊的过程中也第一次让我完全理解了 RL 和 LLM 的关系及来龙去脉。
以及!我特别喜欢吴老师提到的一句话:人生也是一个强化学习的过程,区别是强化学习有明确的奖励函数,而人生没有。
您的浏览器不支持 audio 标签。
一堂「强化学习」大师课|对谈清华叉院助理教授吴翼
42章经
50
2
6
来自圈子
AI探索站
101242人已经加入
加入