假期结束 欢迎回来
分享4篇过去7天有意思的文章,点击下方链接立刻上车
· Apriel-1.5-15B-Thinker:depth叠加+分阶段预训练+精选指令 = 15B效果>670B效果
· Paper2Video:PPT+Video赛道下的极致细分赛道,不想“读”paper的可以“刷”paper了
· LRMs Learn Better Alignmentfrom Flawed Thinking:用 RL保持安全性的同时,修复推理 Bug。。。
· MemGen:模型的第三种memory实现方式隐式记忆法,非常像我们人脑的“联想+整合”