即刻App年轻人的同好社区
下载
App内打开
async小胡
621关注360被关注1夸夸
00后大模型科研,想做一点自己的事情
从零训练过比肩Qwen的小模型YuLan-Mini
热带水果爱好者
async小胡
6月前
sora邀请码
D1KZ5G
需要的uu自取
用完评论区放上你的邀请码接力呀~
301
async小胡
8月前
分析了一下 Claude Code 每次发给模型的数日和输出,发现了一些有意思的东西

比如cc最常用的三个工具是 Read, Edit 和 Todo,阅读代码时的行号(好奇预训练的时候有没有加行号),随处可见的system-remainder等

↓可以看看自己的cc都发送了哪些请求
zhuanlan.zhihu.com
01
async小胡
8月前
ACL 2025
00
async小胡
9月前
第三遍了完全无法集中精力听你在说什么......感觉很重要
00
async小胡
11月前
注册费半天交不上,最后还是注册了张bybit card。。。。
00
async小胡
12月前
在看iclr的论文,真瞎眼
10
async小胡
12月前
fellou太牛逼了,已经设为默认浏览器了
00
async小胡
12月前
暴论一下,混合模型/线性模型一定占有一席之地

未来一年的范式,将会是借助RL定点提升特定能力,比如写triton算子/长文本对齐/RAG等等奇奇怪怪的能力,效率越快rollout得越多,RL的效果越好

未来最顶级的模型未必一定用线性模型,但可以从线性模型蒸馏特定能力,且在解决了线性模型的固有缺陷后,也可能为了更快的decode选择线性模型
00
async小胡
1年前
一起来做预训练吧~

97. 25年Q1大模型季报:和广密聊当下最大非共识、AGI的主线与主峰

张小珺Jùn|商业访谈录

10
async小胡
1年前
文生图
20