即刻App年轻人的同好社区
下载
App内打开
宝参
253关注58被关注0夸夸
投行民工/投行科技
gmz666.com
宝参
19天前
金证股份投行事业部招聘产品经理,base上海
00
宝参
1月前
最近了解到的有趣人物,有待进一步研究

​Andy Rachleff
Alex Krizhevsky
Robert Duggan
Uri Levine
Andy Matuschak
00
宝参
2月前
00
宝参
2月前

西元Levy: Deepseek这一波真的有一点两年前那会儿信息追不过来的感觉了,但也更让我意识到,在信息过载的时候,2~3个优质的信息源足矣。如果是非技术背景的小伙伴,想要了解最近到底发生了什么,推理模型是怎么一回事,大家在说的RL是什么,阅读以下内容应该就够了👇🏻 优先推荐@hidecloud 激情澎湃的Deepseek-R1赏析,从去年11月20日的时间线开始梳理,一步一步讲解发生的故事以及背后的技术原理:https://mp.weixin.qq.com/s/_XGBipbywCOtcKu13QDW5Q 在这个视频中推荐了两个非常重要的信息源,一个是@Kimi智能助手 官方复盘用k1.5复现o1的思考过程,研究员把自己的碳基生物cot毫无保留的分享了出来,还遥相呼应了一发隔壁友商:https://mp.weixin.qq.com/s/8_gK2gJ4OYrKc5dUO_27fA 另一个则是Sebastian的《Understanding Reasoning LLMs》了,这个Blog最大的价值是用清晰的流程图梳理了Deepseek V3、R1-Zero与R1的关系与关键训练节点 英文版:https://magazine.sebastianraschka.com/p/understanding-reasoning-llms 中文版:https://blog.csdn.net/m0_59164520/article/details/145501601 还有一篇我个人觉得非常不错的是Ke Fang的《Deepseek R1可能找到了超越人类的办法》,对于RL为什么能够work,为什么对AGI甚至ASI影响深远有着更深入的讨论:https://mazzzystar.com/2025/01/30/chatgpt-to-deepseek-r1-zh/?continueFlag=4049bc6c95c07f06d8f4ff53fa6c054f 如果想要更深入的了解Deepseek、kimi1.5以及OpenAI o1的技术报告,推荐收听@张小珺 和UC Berkeley PhD 潘家怡的播客:https://www.xiaoyuzhoufm.com/episode/67a1b697247d51713c868367 最后,上升到一个更大更全面的视角,则推荐阅读@Tao水木八公 的《DeepSeek 三重门:小天才们,军团平推,和哲学式思想》: https://mp.weixin.qq.com/s/w_dMKtYPtCbyu7giulywOQ 以及Lex Fridman的5小时播客文字稿(@葬花达人鲁智深 翻译,Founder Park整理):https://mp.weixin.qq.com/s/eIaQxgCo9KivZ0qoBaS8YQ 以上,就是我个人推荐的全部内容。当然,如果想要对于LLM的原理有更深刻的了解以能够从更底层的视角消化与融会贯通上面的内容,还是非常非常非常建议抽时间看一看Andrej Karparhy最新的三个半小时视屏,其中最后一个半小时也在通过Deepseek的例子讲解RL与RLHF的区别 油管传送门:https://www.youtube.com/watch?v=7xTGNNLPyMI&t=1s B站传送门:https://www.bilibili.com/video/BV1WnNHeqEFK/?spm_id_from=333.337.search-card.all.click&vd_source=a0a4cdd7ac6e2fa2f57541f23c684547 AI寒武纪整理的文字稿:https://mp.weixin.qq.com/s/Dca3r8uWsnZPNNESwtzRFg Enjoy~ 希望大家也能收获和我一样“豁然开朗”的畅快感

00