即刻App年轻人的同好社区
下载
App内打开
破锣锅
137关注62被关注0夸夸
美团,ex阿里,零售+科技
光线若要万分明亮,必须射进黑暗的世界。
👨🏻‍💻 INTJ / Engineer / Web3 / LLM
破锣锅
2月前
小米SU7 Pro今天顺利提车了!
20
破锣锅
2月前
OpenAI released GPT-4.1 models with better coding, instruction following, and 1M-token context—faster, smarter, and cheaper than before.
00
破锣锅
3月前
技术的浪潮不断翻涌,但真正深刻的变革不在于系统如何更迭,而在于人与世界如何相处——从占有信息,到被理解;从机械操作,到唤醒创造。
00
破锣锅
4月前
耗时26分钟,利用不足50美元的云计算费用(16 NVIDIA H100 GPUs),在数学推理任务上超越了 OpenAI o1-preview!新出炉的s1论文中提出的Budget Forcing本质上是基于Test-Time Scaling的一种高效激活预训练模型推理能力的SFT方法,核心思想是在尽可能小的高质量数据集上,通过最小化的成本,最大化模型的推理能力。
10
破锣锅
5月前
抽时间读了DeepSeek的五篇论文,也在RTX 3090上实际体验了本地推理效果,再次感叹开源精神和团队技术创新能力的重要性。DeepSeek通过MoE架构优化,降低了大规模训练成本;采用GRPO的强化学习(RL)减少了对 SFT数据和过程的依赖;结合MLA和模型蒸馏,降低了部署成本并提升了推理性能。
00:16
00
破锣锅
5月前
铁锈蔓延于窗棂,
冰影凝固在石径;
寒风拍打落叶,
落叶执念春曦;

孤独的年轮,
在无声的夜色中悄然生长;
当春风穿透沉寂,
每一片飘零的叶,都将化作
明日春暖花开的顽强注解。
00
破锣锅
5月前
读了DeepSeek的Paper,感觉核心是它的训练方法,不需要标注数据,而且弱依赖SFT,并且基于计算成本更低的GRPO的(无监督)强化学习和少量冷启动数据让R1的推理能力能够接近o1,然后生成高质量数据蒸馏出来参数量更小的模型。
00
破锣锅
5月前
00
破锣锅
5月前
2025黑珍珠年度菜品奖完整名单。
00
破锣锅
6月前
小米SU7 Pro雅灰紫内加装电动尾翼已锁单。
111