即刻App年轻人的同好社区
下载
App内打开
破锣锅
131关注55被关注0夸夸
美团,ex阿里,零售+科技
光线若要万分明亮,必须射进黑暗的世界。
👨🏻‍💻 INTJ / Engineer / Web3 / LLM
破锣锅
14天前
耗时26分钟,利用不足50美元的云计算费用(16 NVIDIA H100 GPUs),在数学推理任务上超越了 OpenAI o1-preview!新出炉的s1论文中提出的Budget Forcing本质上是基于Test-Time Scaling的一种高效激活预训练模型推理能力的SFT方法,核心思想是在尽可能小的高质量数据集上,通过最小化的成本,最大化模型的推理能力。
00
破锣锅
18天前
抽时间读了DeepSeek的五篇论文,也在RTX 3090上实际体验了本地推理效果,再次感叹开源精神和团队技术创新能力的重要性。DeepSeek通过MoE架构优化,降低了大规模训练成本;采用GRPO的强化学习(RL)减少了对 SFT数据和过程的依赖;结合MLA和模型蒸馏,降低了部署成本并提升了推理性能。
00:16
00
破锣锅
19天前
铁锈蔓延于窗棂,
冰影凝固在石径;
寒风拍打落叶,
落叶执念春曦;

孤独的年轮,
在无声的夜色中悄然生长;
当春风穿透沉寂,
每一片飘零的叶,都将化作
明日春暖花开的顽强注解。
00
破锣锅
24天前
读了DeepSeek的Paper,感觉核心是它的训练方法,不需要标注数据,而且弱依赖SFT,并且基于计算成本更低的GRPO的(无监督)强化学习和少量冷启动数据让R1的推理能力能够接近o1,然后生成高质量数据蒸馏出来参数量更小的模型。
00
破锣锅
26天前
00
破锣锅
2月前
2025黑珍珠年度菜品奖完整名单。
00
破锣锅
2月前
小米SU7 Pro雅灰紫内加装电动尾翼已锁单。
111
破锣锅
2月前
这个元旦有点难忘,一碗泡面撑到现在,多XX项目线上遇到多个问题,晚上协助进行跨团队沟通和处理,处理完问题继续整理规划和OKR(节后第一天临时要对且第一天日程太满)。最后因为跨年,出公司车库提示车位已到期,联系物业才得以解决,现在终于到家,但吃完饭估计得四点多了,明天一早还预约了得去试驾。😳
40
破锣锅
2月前
换手机已经一个半月了,从iPhone 15 Pro Max切到了HUAWEI Mate 60,目前使用感受良好,除了交互体验细腻程度上有所下降之外,整体幸福指数略有提升,可以使用Termux进行部分文件操作的自动化,只不过手腕上的Apple Watch Ultra 2现在显得有些尴尬了。
50
破锣锅
2月前
直至保安把灯熄灭,才发现自己不知不觉在公司已经度过了平安夜,大家圣诞快乐。🎄😂
40