即刻App年轻人的同好社区
下载
App内打开
决明子18
492关注3k被关注54夸夸
👧🏻祝你早安,午安,晚安💤
🥽非典型INTP-A
📖年度书单5/10ing
置顶
决明子18
29天前
10
决明子18
1天前
大多数国人都有“回乡创伤综合症”,集中爆发在年三十和初几这几天,过一段时间就好了。
50
决明子18
3天前
新年快乐🎈即友们,2025平安喜乐,身心健康哦🎉
40
决明子18
3天前
看完对我司的算法团队有了更大的信心,公司为算法团队提供了宽松的环境,无职级评比、不打卡、高于大厂平均薪资的待遇,他们也是极为高素质的人才,大多来自复旦和南京大学、牛津大学,其中有复旦退学的小伙伴来就是为了实现个人价值追求。以年为单位,年前模型生成质量也上了一个很大的台阶,我们是做Ai生成3D相关的,期待未来会有deepseek这样的成就

于冬琪: 最近看了一些对DeepSeek梁文锋的采访,看到他讲DeepSeek创新能力的来源,让我想起了字节和华为。 不同的是, 会在DeepSeek发生的创新,却更难在字节发生。 华为和DeepSeek解决的创新机制问题,恰恰是曾经导致字节差点错过了大模型的问题。 1、 在梁文锋的讲述中,DeepSeek喜欢的人有三个核心标准。 他自己说出来的有“热爱”和“好奇”。 他自己没直接说,但是明显在照着招人的,是“高素质”。 大多数人的热爱和好奇心,会随着年龄磨灭,因此,他喜欢招没什么工作经验的年轻人。 高素质则直接体现为考试成绩,所以,他选择的年轻人几乎一水是清北等名校学霸。 这样的用人标准,和华为、字节实在是很像。 年轻、学霸。 这样的人,在选择工作时,会更容易被一个在解决有挑战难题、和有使命的环境所吸引。 DeepSeek、华为和字节,也都提供了这样的环境。 2、 但是,不同的是,字节也拥有大量符合DeepSeek标准的人才,历史上,却不要说大模型的架构创新,甚至于在2023年,ChatGPT一鸣惊人之前,字节都没有注意到通用大模型的机会。 在各个大厂跟进通用大模型时,字节几乎是启动最慢的一家。 为什么拥有同样的人才,创新能力会表现出这么大的差别呢? 23年时,我和一位字节的算法同学有过深度交流,他描述了他的处境。 他在加入字节前,就一直在做前沿算法研究。 当时之所以加入字节,是因为看到算法在字节,有着远远领先于其他大企业的应用范围和应用深度——他当然渴望自己的技术能够有机会改变世界,就去了字节。 不过实际加入之后,却发现和想象中很不一样。 因为字节有着2-3个月一次的OKR压力。 如果连续两个OKR周期,他交不出能影响数据的产出,他会有麻烦、他的leader也会有麻烦。 他想做的类似DeepSeek那样的改造到架构层、甚至于到科学层的很多研究,最大的问题就是“周期长”,常常需要以年计的时间,短期内根本不可能看到效果。 见效周期漫长,也是很多大一点的创新共同的特点。 那好,周期长的项目,有没有可能先做个论证,把大项目拆小,拆出几个过程节点和过程指标呢? 如果这些过程节点和过程指标得到公司的认可,到了OKR周期,他只需要交付过程指标,也能过关。 这也是长周期项目常见的解决方式——做个论证,拆一下过程。 但是,他试了一下会发现,越是重大的创新,越难论证明白。 也不难理解,很多创新之所以重大,就是因为超出大多数人的想象、大多数人并不能理解,更不敢相信。 最后的结果是,他自己和周围的小伙伴,必须花80%的精力做那些确定能在OKR周期内交出数据的项目。 至于自己想做的科研,不好意思,只能自己挤时间、作为兴趣做。 而字节的工作压力越来越大,慢慢这样的业余时间也不复存在了。 结果就是,同样高素质、有热爱和好奇的人才,在字节和在DeepSeek交出了不同的结果。 3、 我意识到,背后其实反映了一个字节缺失的创新要素,就是“信任”。 字节无处不在的竞争,传递的是对员工的“不信任”。 在竞争压力下,管理者对员工的管控、不敢让员工探索太激进和周期长的方向,一样是“不信任”。 还有当他加入字节时,字节已经有了精细化的分工——虽然精细分工的出发点可能是为了专注。 但是当权限分散、一个创新者要说服一个又一个资源方才能获取资源时,不是每个资源方都能理解创新者的构想,创新者的想法也很难符合每个资源方的利益——从资源方的反馈中,创新者能感受到的,还是“不信任”。 不信任成为了阻碍创新发生的阻力。 所以,字节在很长时间里,容易推动的只有“快速见效的微创新”,或者“领导者已经意识到价值的创新”。 那位字节的朋友说: 他周围的小伙伴们,很多人是喜欢看论文、喜欢做研究的,有人很早就注意到了通用大模型相关的论文和进展。 很可能也有人想尝试。 但是,碍于竞争压力,自己想生存,不能做;又说服不了管理者,无法完成对效果的论证;同时也几乎不可能攒出实现需要的大量资源。 就只能当没看到。 结果就是字节大模型一度的落后。 4、 这个问题,在DeepSeek和华为是怎么解决的呢? DeepSeek给了团队巨大的信任和授权。 梁文锋说: DeepSeek每个人对卡和人的调动是不设上限的。 有想法就可以做,不用审批。 也没有层级和部门,任何一件事儿,只要两个人都有兴趣就能一起做。 华为也同样,给了科研人员巨大的信任。 在华为,绝大多数人还是要做实施和工程,没有管控和压力不现实。 所以,华为的选择是将科研和实施分开。 有一批科学家——分布在世界各地,大量不同的实验室——会提前8-10年做研发。 在8-10年的时间跨度下,不要说改造架构,很多基础科学的研究都有可能完成。 对这些科学家,华为没有指标、没有考核,给了钱就交给科学家自己管理和决策。 这些科学家,拥有着华为几乎无条件的信任。 信任的给予,导致了创新,特别是高风险、长周期创新可能发生。 因此,很多科学家们自己想做的创新,会在华为变成现实,也帮助华为一点点建立了技术优势。 那问题就来了:我万一信错了人怎么办?怎么挑选出值得我信任的对象? 华为会在信任之前,进行面谈和考察。 如果是重要一点的人,要任正非自己面试。 虽然不知道华为的考察点。 不过我相信“热爱”和“能力”肯定同样不可或缺。 而且,也因为华为和DeepSeek有稳定的、渴望实现的愿景, 这个愿景给了他长期专注的方向。 在这个方向里,整个组织会越来越懂、领导者也会越来越懂。 如果遇到需要论证的情况,因为懂,更容易建立信任和被说服。 5、 这也是我意识到的能做出突破式创新的三个要素: 第一,热爱、好奇、高素质的人才。 第二,对人才充分的信任。 第三,明确的愿景与组织专注的方向。 这三个要素,特别是前两个要素缺一不可。 国内很多企业,不能理解曾经Google让员工拥有大比例的空闲时间、可以做自己感兴趣的任何事儿。 乍一看,这会导致巨大的浪费。 但这恰恰是对人才的信任投资,也是Google早期创新能力的来源。 后来为啥Google这个做法玩儿不转了呢? 因为人才上放水了,随着人才标准的降低,越来越多的人利用公司的信任摸鱼、而非创新,这个时候整个组织的创新氛围也就难以维系了。 说回字节,字节在通用AI表现上的转变,关键点之一是张一鸣亲自下场。 因为只有他,才在字节拥有着绝对的被信任。 不过,重大的创新不可能仅仅靠老板一个人完成。 此刻,我不知道字节还有多少可被赋予这样的、接近绝对的信任的人。 只有这些人,才会成为驱动字节重大创新发生的可能力量。 而对于手握如此巨大预算的字节,我觉得,比起把钱花在增长、薪资上,对于通用大模型,可能更应该把钱花在“信任”上。 6、 对于创始人来说,给出这样的信任始终是难的,需要先建立一个标准,去筛选那些可被信任的对象。 所以小米才会给DeepSeek的员工开出千万年薪。 因为毕竟她在DeepSeek证明过自己,给了小米信任的基础。 不过, 我一直觉得,这个选择信任对象的标准中,通常最内核的,就是梁文峰的三个要素:热情、好奇心、基础素质。 7、 人才、信任、愿景,这三个要素,恰恰也是我看到DeepSeek具备的要素。 用梁文锋的话说: 国内的优秀人才是被严重低估的。 这些人才主要的追求也不是钱。 在我看来,这些被低估人才最渴望得到的“报酬”,不是薪资,而是“对自己的信任”和“能支撑自己实现梦想的资源”。 不过,对于企业来说,这也是比工资更大的代价——毕竟工资有上限,信任的风险常常没有上限。 信任,也是优秀人才最渴望获得的对价。

50
决明子18
5天前
今天妈妈问:“你什么领男朋友回家来?”
我:“明年就给你领回来”
她:“你该不会像网上说的那样租个人回来应付我吧?”
😯“人与人之间的信任就这么脆弱吗?不至于不至于”
140
决明子18
5天前
备好压岁钱🧧🧧🧧
70
决明子18
5天前
吨吨吨…
10
决明子18
6天前
要被小猫🐱萌化了,刚认识就往人家被窝钻
10
决明子18
7天前

Vol.28 和当下最酷的AI硬件们,一起聊聊2025年什么方向值得做?

AI局内人 | AGI Insider

00
决明子18
11天前
00