即刻App
年轻人的同好社区
下载
App内打开
stevending1st
116
关注
137
被关注
0
夸夸
别关注,我有病。
言论仅代表个人。
求求你,你吸烟,别影响我。
stevending1st
00:33
瓣,你真棒
0
0
0
stevending1st
2天前
无聊的蚊子: 腾讯真他妈畜牲啊 以前我用的是魔改的微信,基本上没刷到过朋友圈广告 现在用的安卓,不root用不了魔改的,不然就一只被风控检测 今天刷朋友圈,跳出了个奥迪的朋友圈广告 本来没太在意,突然发现有个高中同学在那个奥迪广告下面评论:奥迪车好,将来一定要买一辆 妈的,腾讯那傻逼可能不知道我这高中同学,高三下晚自习被一辆醉驾的奥迪车直接撞走了
0
0
0
stevending1st
19天前
这期播客提到了古思维的那期播客,突然想起来听那期的时候我正走在安吉的小路上,现在我正走在梅林的小路上。
您的浏览器不支持 audio 标签。
Ep 52. 没有失败,只有反馈
捕蛇者说
1
0
0
stevending1st
22天前
不互道端午快乐的群才是真朋友群
2
0
0
stevending1st
22天前
不如不见 (2007 Live) - 陈奕迅 - 单曲 - 网易云音乐
0
0
0
stevending1st
23天前
Who is my pretty sunshine?
My Sunshine(电视剧《何以笙箫默》片头曲) - 张杰 - 单曲 - 网易云音乐
0
0
0
stevending1st
24天前
1
0
0
stevending1st
26天前
今日日出
2
0
0
stevending1st
1月前
不错的大模型科普~
您的浏览器不支持 audio 标签。
#134. 大模型
牛油果烤面包
1
0
0
stevending1st
1月前
两个青铜:
www.xiaoyuzhoufm.com
【万字深度解析:哲学视角下的deepseek-哔哩哔哩】
b23.tv
Roxane: 一些个人认为适合非技术背景同学入门RL的材料不完全整理: 1️⃣青铜级 (都是播客) 《一堂「强化学习」大师课》——42章经 《与马毅聊智能史:“DNA 是最早的大模型”,智能的本质是减熵》——晚点聊LateTalk 《我是这样用 RL + LLM 做 Agent 的|对谈 Pokee AI 创始人朱哲清 Bill》——42章经 《走向强化学习:Agent 还是应用公司的机会吗?对话 Pokee.ai 创始人》——硅基觉醒 《Agent 开发的上半场:环境、Tools 和 Context 如何决定 Agent》——42章经 《强化学习的前世今生》——科技慢半拍 (以下是一些发布时间较早,但是我认为仍有价值所以保留推荐的⬇️) 《AGI 范式大转移:和广密预言草莓、OpenAI o1 和 self-play RL》——张小珺Jùn|商业访谈录 《逐句讲解 DeepSeek-R1、Kimi K1.5、OpenAI o1 技术报告 ——“最优美的算法最干净”》——张小珺Jùn|商业访谈录 《对话 Google Deepmind 研究员:OpenAI o1 及LLM+RL 新范式》——OnBoard! 2️⃣白银 Andrej Karpathy《Deep Dive into LLMs like ChatGPT》(视频)(不是专门讲RL的,但是建议先看,系统了解) Sam Lehman《The World's RL Gym》 Sutton与Deepmind《Welcome to the Era of Experience》 《Richard Sutton on Pursuing AGI Through Reinforcement Learning》(视频) 3️⃣黄金 OpenAI o1 技术报告《Learning to reason with LLMs》 Deepseek官方论文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》 Sebastian Raschka《The State of Reinforcement Learning for LLM Reasoning》 4️⃣翡翠 《Transformer原作、斯坦福、清华交大三篇论文共识:基座模型边界锁死RL能力上限》(一篇公众号的概述,建议阅读原文) 《OpenAI's o3: Over-optimization is back and weirder than ever》 5️⃣钻石 Sutton and Barto《Reinforcement Learning: An Introduction》 (坦白说还没学到这个层次,欢迎大佬们补充...) 其实还有很多优质的资料,但我还没读的就不冒昧推荐了,欢迎在评论区安利🥹 🎊扩展阅读 《A biref history of intelligence》
1
0
0