即刻App年轻人的同好社区
下载
App内打开
大木鸟
885关注280被关注9夸夸
🅙情不知所起,一往情深。🅹
飞则不坠地,落则木成森.
爱你哟我的宝贝@凤凤宝
大木鸟
1天前
陪对象看完这两部,孤独又灿烂的鬼怪,穿普拉达的女王。

所谓“孤独又灿烂”,
是历经漫长荒芜,仍有为人拔剑的孤勇。

她说我像他。
也许是因为,我眼里的光,
只在望向唯一的人时,才会有如初雪般的仪式感。

不求长生,只求在有限的余生里,
做一个只为你而留的奇迹。

米兰达与安德丽亚:
并非强者对弱者的驯化,而是灵魂镜像的殊途同归。

一个选择了高处的寒冷,一个选择了地面的自由。
她们在彼此身上看到了自己,然后带着那种“傲慢”的敬意,各奔东西。

最好的欣赏,不是成为你,
而是我看懂了你的巅峰,也守住了我的边界。
00
大木鸟
29天前
Qwen 往事:一个天才的离场与一座孤岛的沉没

说真的,看到林俊旸(Junyang Lin)在 X 上发那句“Bye my beloved Qwen”的时候,我心里咯噔了一下。这种感觉,特别像你追了很久的一部独立电影,导演拍完最惊艳的第一部后,被大制片厂收编去拍合家欢商业大片了。你不能说商业片不好看,但那种扎人的、叛逆的、闪着灵光的东西,大概率是要丢了。

1. 实验室里的“刺头”与玫瑰

很多人把俊旸捧成“千问之父”,我觉得这评价其实挺招黑的。他在阿里内部更像是一个带着“厌蠢症”的技术极客。你去看他的背景,应用语言学出身,这在满大街都是计算机视觉和纯工程背景的研究员里,简直是个异类。

为什么 Qwen 2.5 之前那么好用?因为俊旸这帮人没把语言当成一串冷冰冰的概率序列。他们懂语义组合,懂语用推理,甚至懂怎么在模型里注入一种“活人感”。他在直播里偶尔的毒舌,下台后那句“你问得够骚啊”,这种鲜活的碳基生命气息,才是 Qwen GitHub Hugging Face 上圈粉无数的底色。那时候的 Qwen,是通义实验室伊甸园里的玫瑰,虽然缺卡、缺资源,甚至在阿里内部都不怎么受待见,但它有一股子“老子就是要用最少的算力做出最顶尖模型”的傲气。

2. 当玫瑰变成了“印钞机”

事情是什么时候开始起变化的?大概就是 Qwen 真正火遍全球,连硅谷那帮人都开始感叹“Chinese models are coming”的时候。

阿里毕竟是个商业帝国,它不是 DeepMind。当一个项目在外部挣够了面子,内部自然就要开始要“里子”了。Qwen 很快被拎出了实验室,穿上了西装,走进了阿里的商业战壕。它得去给阿里云拉 token 消耗,得去支持千问 App 订奶茶、订机票,得去配合春节那 30 亿的红包雨。

这一刻,Qwen 就不再是那个纯粹的技术理想国了。它变成了基础设施,变成了印钞机。你见过哪台印钞机是有个性的?印钞机只需要稳定、高效、流水线化。于是,原本那个扁平、高效、为了技术突破可以随时推倒重来的特种部队,被拆成了横向的职能部门。预训练的归预训练,微调的归微调,大家各司其职,像工厂零件一样精准耦合。管理上是进步了,但灵气呢?那种搞语言学的人一眼就能看出的“模型缺陷”,在层层汇报的 PPT 里,早就被磨平了。

3. 失落,但不可惜

很多人为俊旸的离开惋惜,觉得阿里“亏待”了功臣。但我反而觉得,这可能是他最体面的结局。

一个天才的使命是“破局”,而一个组织的使命是“守成”。让一个喜欢在 Panel 上谈论“符号系统底层语法”的人,去天天对齐怎么提高外卖订单的转化率,这对他来说本身就是一种折磨。他带着那只花 50 块钱找人设计的卡皮巴拉(Qwen 吉祥物)离开了,其实是保全了那份纯粹。

Qwen 未来会变弱吗?大概率不会。阿里有的是算力,有的是数据,有一万种方法堆出一个性能霸榜的模型。它会变得更“好用”、更“全能”、更“便宜”。但它会变得平庸。它会从一个“带头大哥”变成一个“顶级追随者”。它会精准地跟在 GPT Gemini 后面,做出一系列评分极高、但毫无意外惊喜的产品。它会失去那种能让开发者在深夜敲完代码后感叹一句“卧槽,这模型懂我”的瞬间。

4. 时代的脚本,各人的退场

这事儿像极了当年的钉钉。无招(陈航)当年也是带着团队躲在湖畔花园,像个疯子一样做出了钉钉。后来呢?“云钉一体”,无招离场。

在阿里的基因里,没有所谓的“技术理想国”,只有“生意经”。这不是贬义词,这就是商业社会的现实。Qwen 已经完成了它最光彩夺目的历史使命——让全球 AI 社区看到了中国团队的原创力。至于下半场,那是属于职业经理人和销售精英的,那是关于如何让 14 亿人无缝使用 AI 的宏大叙事。

俊旸走了,可能会去字节,可能会去硅谷,也可能会自己拉个山头。这正是 AI 时代最有意思的地方:灵魂是会流转的。 那个在阿里体系外野蛮生长的、不被看好的、却最终翻盘的“下半场脚本”,可能正在某个租来的民房里重新排练。

我们失落,是因为那个有趣的 Qwen 时代结束了。
我们不可惜,是因为这片江湖总会有新的“疯子”冒出来。

再见,卡皮巴拉。再见,那个曾经会说“人话”的 Qwen。
00
大木鸟
1月前

凯文冲冲冲: Claude Code作者Boris访谈中说到,自从 opus 4.5 以来,他再也没写过一行代码了。 今天主要聊一下最近关于Claude Code作者Boris的一次访谈。看完他的采访视频后,我觉得有一些信息非常有启发性。 首先,Boris提到自从他开发出Claude Code之后,从Oppo 4.5版本开始,Claude Code的90%甚至接近100%的代码,都是由Claude Code自己生成的。也就是说,它已经达到了自我生成的阶段。由于 Claude Code已经完全用Claude Code来生成,这也导致所有代码都被反复重写过无数次。现在你看到的任何一个版本,都已经不是六个月前的任何一行代码了,所以迭代速度非常快。 这也解释了为什么以前我升级Claude Code时,可能很久才需要更新一次版本,但现在只要两三天不更新,等你再更新时,已经迭代了十几二十个小版本,速度非常快。 另外一个有启发的点是,关于什么是AGI,Boris以及Anthropic团队对AGI的理解也很值得关注。 AGI的实现路径,应该是先教会模型学习编程,然后再教会它使用工具,最后再教它使用电脑。这样子的话,就能够真正实现AGI,但同时又能够保证它的安全性。因为对于编程来讲,你是可以去限制它的,它是比较容易去限制的,就像是现在我们把程序放在一个完全独立的沙盒里面跑一样。你是很容易地限制它的网络、限制它的数据流通等方面,或者是限制它的一些权限的。所以这是Anthropic认为实现AGI最正确的一条路径,所以他们一直押注在编程上面。 关于使用工具,是很神奇的一点。他提到,之前在刚刚发布Claude Code、模型刚学会使用工具的时候,他就尝试了用集成的Bash工具。一旦集成了Bash工具,这是一个最纯粹的、最原始也最强大的一个模型了。因为Bash基本上能做任何事情,而且它长期以来已经积累了非常多的数据,准确度非常高。它能够写文件、读文件,能够执行各种Bash的命令来安装各种包,然后能够运行程序。所以模型加上Bash,就已经是一个非常强大的Agent了。 所以,当时在刚刚发布完工具以后,他有一天就集成了Bash工具,让模型来使用这个Bash工具。这时,他就随便问了一个问题,比如“我正在听什么音乐?”,他发现模型竟然能够写出一段脚本,然后去操纵他的Mac,查到他正在播放的是什么音乐。所以他认为,那是他第一个瞬间感觉到“这就是AGI”的时刻,一个“Aha moment”。 第三点启发是,我们经常说需要在`claudecode.md`文件里写上一些需要让模型关注的事情。但他自己的文件里,全部就两行,主要是针对PR的。他把大部分工程上的要求,可能都写到了一个整个团队的`claudecode.md`文件里。但对他个人的`claudecode.md`文件,实际上就两行: 1. 提交了PR就能够自动合并。 2. 提交了PR以后,它能够直接发布到内部的一些通讯工具,方便那边的同事快速审批,这样他就不用一直等待或者被卡住。 另外一点,我觉得这对于所有人来说可能都是比较愿意听到的:哪怕他是Claude Code 的创建者,哪怕他用的是最强大的模型Claude Opus,但他发现他还是需要不断地学习。 因为有时候他发现在做事时,由于思维惯性,还是会习惯性地用传统的软件开发方式去处理。他的思维有时还停留在六个月前。他在这篇访谈中反复提到“6个月”这个时间点,例如模型大概每6个月就会发生一次巨大的变化。所以,很多工作你做了,实际上6个月后可能会失效。这也有可能是他们内部模型发生巨大变化的一个迭代周期(目前是6个月,这是我猜测的)。 上次也讲到,未来可能没有“软件工程师”这种特定角色了,因为每个人都是一个“建造者”(builder),都能够创建任何产品和软件。 那么,对于技术人来说,最重要的技能是什么? 1. **保持初心**:要拥有“初学者心态”(beginner’s mindset),保持好奇,持续学习。 2. **保持谦逊**:因为模型会成长发展到远远超出你的地步,你在它面前可能会感到非常沮丧。这时就需要保持谦逊。接受自己不懂。 3. **从错误中学习**:我隐约觉得,他们现在内部开发过程中,都不是让系统完全自动化运行,而是在不断迭代。你发现错误,就能返回来重新修改。以这样的方式去构建软件,才是正确的。 另外,他们最后还提到,因为现在大家比较经常使用“计划模式”(Plan Mode)。用户每次让模型去构建的软件描述都太简单了,只有一两句话。但整个软件其实包含很多细节,包括用户流程、数据存储以及一些特殊需求。这些细节都隐藏在需求里,所以他们才开发出这个“计划模式”,希望用户在使用模型开发软件之前,能够先构思好方案。 但他自己也提出,这个模式未来可能不再需要了。在后续的模型迭代中,模型自己可能就能处理得很好,用户就不需要在模型和计划模式之间来回沟通了。我对这点还蛮期待的,但不太确定:如果很多细节都由模型按照其最佳实践自行实现,会不会丧失掉一些个性化的需求? 最后他也提到,自Claude Code 发布以来,基本上Anthropic(的功能)让每个人的效率提升了150%。结合我之前看到的,昆仑万维(国内一家公司)对其所有研发人员的要求是,无论从CTO到初级程序员,使用这类工具的效率提升目标都要达到50%,这是一个全员提升,非常吓人的一个数字。 他提到,自从有了 Claude Code 以来,他基本上已经把所有开发工具都卸载掉了,只保留了 Claude Code 这个终端工具。他自己也没有再亲手写过一行代码。 未来的开发就应该是这样。

00
大木鸟
2月前
被富婆包养的一天✧٩(ˊωˋ*)و✧
20
大木鸟
6月前
谁能料到芙洛拉的花,那滴人类的眼泪是敲开 seed 的钥匙呢。

哇哇大哭。°(°¯᷄◠¯᷅°)°。,她失去了他,我感同身受。
01:14
10
大木鸟
7月前
在团队讨论或群体决策中,我们偶尔会遇到一些人,他们可能缺乏沟通技巧、不善于把握讨论重点,或习惯性地带入主观情绪及无关话题。这类发言往往干扰集体思考的方向,导致讨论偏离核心目标,降低决策效率,甚至可能引发群体思维偏差,如“群体盲思”或“趋同效应”,使团队无法客观评估不同方案。

适时引导或暂停这类无效发言,对于保障议题顺利推进、促成有效协作至关重要。要让这类人“闭嘴”(即暂时停止其干扰性发言),并不是粗暴地打断或压制,而是需要运用恰当的策略,​重定向讨论焦点,从而让解决问题的过程真正回归正轨。
00
大木鸟
7月前
非前端叠甲,记录和分享下web网页中前后端要做什么
00
大木鸟
7月前
dark♂
00
大木鸟
7月前
# 斯坦福教授揭秘!软件设计核心就这招

提到软件设计,不少人会觉得是高深的技巧集合——要记设计模式、懂各种语言特性。但斯坦福教授John Ousterhout,这位Tcl语言的发明者,在《软件设计的哲学》里,却把这件事讲得特别通透:软件设计的核心,从来不是炫技,而是**降低复杂性**。

这本书没有纠结某类语言的细节,也没堆砌晦涩的理论,而是用作者25万行代码的实战经验,加上斯坦福CS190课程的教学沉淀,把通用设计原则揉进了软件生命周期的每一步。

比如他戳中很多开发者的痛点:“工作的代码不够好”。很多人做项目时,总想着“先实现功能再说”,走“战术编程”的捷径——比如重复写相似代码、忽略模块封装,结果代码越堆越乱,后期改一个小功能,要牵动好几个文件。而作者推崇的“战略编程”,是愿意花10%-20%的时间打磨设计:比如把文件读写的逻辑封装成深模块,接口只留简单的“读”“写”调用;比如给变量起精准的名字,避免“block”既指磁盘块又指文件块的混乱。短期看慢一点,长期却能让系统越用越顺。

书里“模块要深”的说法特别形象。好的模块该像一口深井:接口简单到一眼看懂,底下却藏着复杂的实现。就像Unix的I/O系统,几个简单的调用背后,藏着磁盘管理、权限控制、缓存策略的复杂逻辑。反过来,那些接口又多又杂、功能却单薄的“浅模块”,比如Java I/O里要手动创建缓冲流,只会给开发者添负担。

还有很多落地的小方法特别实用:“先写注释再写代码”,注释不是事后补的说明,而是帮你理清设计思路的工具——写注释时想清楚“这个模块要解决什么问题”,代码自然不容易走偏;“设计它两次”,别抱着第一个想法不放,多试一种方案,比如文本编辑器的模块,先想面向行的接口,再想面向字符的接口,往往能发现更简洁的路径;“定义错误不存在”,就像Unix删除文件,即使文件被占用也不抛异常,而是默默处理后续,把复杂的异常逻辑藏在底层,不让用户头疼。

作者没把这些原则当“铁律”,反而常提醒“别太过火”。比如一致性很重要,但硬把不同功能套同一模式,反而会添乱;信息隐藏要做,但该暴露的配置参数也不能藏着。这种务实的态度,让书里的道理不空洞——刚学编程的新人能靠它避开“写烂代码”的坑,维护大型系统的老手能借它梳理混乱的架构。

说到底,这本书最珍贵的不是教你“怎么做”,而是帮你建立“以降复杂性为核心”的思维。有了它,你再看代码时,眼里不只是一行行指令,而是整个系统的脉络:哪里该封装、哪里要简化、哪里能藏起复杂逻辑。原来好的软件设计,不是把简单的事搞复杂,而是让复杂的系统,变得清晰又好维护——这大概就是设计哲学的力量,能让纷乱的代码世界,变得简单又可控。
00
大木鸟
7月前
惊!这本书竟这样揭示我们饮食的秘密​

在信息爆炸的时代,我们每天都会接触到大量文章,这些文章的观点真的都站得住脚吗?今天,让我们从《我们为什么吃 (太多): 食欲的新科学》这本书出发,学会检视文章论述是否存在 “维度坍缩” 现象。​
从空间维度看,不少研究存在以偏概全。在探讨饮食与健康时,有的研究仅选取了有限地区、特定人群作为样本,却将结论推广到全体人类。比如在研究某种食物对心血管疾病的影响时,若只选取了某个特定国家或地区的人群,就忽略了不同地区人群在基因、生活习惯、环境等方面的巨大差异。就像书中提到,安塞尔・基斯在研究 “饮食 心脏假说” 时,他的 “七国研究” 只考察了他认为能证明自己理论的 7 个国家,而最初他研究的是 22 个国家,像法国和德国等不符合其论点的国家被排除在外。如果是 “二十二国研究”,结论或许会截然不同,这就是将有限样本特征投射到整个群体的典型,推广边界模糊,忽略异质性带来极大偏差。​
时间维度上,很多观点暗含 “永恒不变” 假设。曾几何时,人们坚信脂肪是导致心脏病的罪魁祸首,这一观点长期主导着大众认知。但随着时间推移、研究深入,发现这一观点在不同时代背景下存在局限性。在过去几十年,人们生活方式、饮食结构发生巨大变化,仅仅依据过去研究,不考虑当下环境,结论可能失效。几十年前,人们体力劳动多,食物相对匮乏,如今生活便捷、食物丰富,简单沿用旧观点指导饮食显然不合理。​
因果维度同样陷阱重重。一些文章常把共现关系简化为因果关系。例如,看到某些地区肥胖人群多,且这些地区快餐消费量高,就得出快餐导致肥胖的结论,却忽略了可能存在的中介变量,像这些地区人们运动习惯、工作压力等因素。也许是因为工作繁忙没时间运动,同时又常选择快餐,才导致肥胖,而非快餐直接导致。​
本质维度,表面相似易掩盖深层差异。在饮食领域,有人将一些口感相似的食物归为一类,认为营养功效也相同。比如把红薯和土豆都当作普通碳水,忽略了红薯富含膳食纤维、维生素等,与土豆在营养成分上的关键差异,类比有效边界模糊,遗漏关键属性。​
那么,作者们为何会犯这些错误呢?可能是认知负荷过重,难以全面考量复杂因素;也可能立场先行,为了证明既定观点而选择性忽视其他因素;语言局限使一些概念难以精准表达,造成误解;思维惯性让作者沿用旧有模式思考,难以突破。​
《我们为什么吃 (太多): 食欲的新科学》这本书,通过对饮食与食欲的深入剖析,为我们揭示了很多被忽视的真相,也为我们在审视各类文章观点时提供了宝贵的思考角度,让我们在信息洪流中,能更理性地辨别是非,不再轻易被片面观点误导。​
00