即刻App年轻人的同好社区
下载
App内打开
ginobefun
221关注110被关注0夸夸
中年程序员
两个萌娃的爹
ex 华为、阿里,现金融行业
喜欢折腾点有意思的事情
ginobefun
14:38
罗永浩的真诚与直率,碰上蔡康永的通透与温和,催生出了很多反直觉却又极其真实的洞察。

BestBlogs 为你提炼了这场播客中最具价值和思考深度的 10 个观点。你可以把它们作为收听这期节目的罗盘,带着这些问题去聆听他们的完整对话:

1. 真正的“高级鸡汤”是建立在虚无之上的积极选择
大众对心灵鸡汤往往带有反感,因为它总是在智力上偷懒,盲目乐观地否认痛苦。但蔡康永的文字之所以有力量,是因为他的底色是存在主义和温和的虚无主义。他是在承认人生最终必然走向衰亡与虚无的前提下,依然教人如何寻找与痛苦共存的路径,做出积极的选择。这不叫麻痹神经的迷幻药,这是精神荒野里的罗盘。

2. 重新定义“自律”:剥离道德绑架,认清“出厂设置”
我们常把按时早起或吃得少夸赞为意志力强大的自律,而把起不来床、吃得多指责为懒惰和贪婪。罗永浩通过自己的经历指出,很多所谓的自律,其实只是基因带来的生物学出厂设置不同。有的人睡懒觉会生理性难受,有的人吃一碗饭就生理性满足。认清这一点,能让我们对别人少一点无情的嘲笑,对自己也多一份底层的和解与宽容。

3. 告别创伤的良药:创造属于自己的“仪式感”
面对失去挚爱且久久无法走出的伤痛,蔡康永给出了一个极其温柔且治愈的方案:真正的仪式感不是被动接受那些充满杂质的商业节庆,而是自己发自内心创造的羁绊。 带着逝去之人的照片,去完成他生前想做却没做的事(比如走遍 20 个国家)。把这份情感放在心中一个正确且重要的位置供奉起来,化作继续好好活下去的动力,这才是对感情最好的交代。

4. 生命的意义如同“烤面包的香味”,只在过程中诞生
我们常常陷入一种“永远在为下一阶段做准备”的荒谬心态中,中学为了考大学,大学为了好工作,工作为了买房。蔡康永用蝉作比喻:蝉在地下蛰伏十几年,并不是无聊的准备期,那本身就是它生命的一部分。人生的意义就像烤面包的香味,是在你揉面、烘焙的过程中自然散发出来的。 如果你只是空想而不投入去做,那个意义是永远找不到的。

5. 面对 AI 时代:把剥夺感转化为“被解放”的自由
面对 AI 惊人的创作力,许多人感到过去积累的技能被剥夺而陷入绝望。蔡康永却觉得“松了一口气”。与其把 AI 看作竞争对手,不如把它当成高效的合作对象。它解放了创作者在执行层面的巨大压力(比如花费几十年写一部巨著),让我们可以直接专注于故事内核与影视化转化。在大家都在经历旧知识贬值时,这也意味着所有人都获得了一次重新出发的自由。

6. 允许自己“适度冷漠”,把热情留给对的人
我们常常被教导要成为一个“温暖的人”,但过度消耗热情恰恰是烦恼的根源。蔡康永提出,维持冷淡的社交关系其实是一种自我保护。不在乎的人,没必要装出多余的温暖;把宝贵的精力与热情,精准地倾注在你真正在乎的人身上,这才是健康且可持续的人际关系边界。

7. 线下真实触碰的不可替代性
在一个连电影名著都习惯看“5分钟解说版”、万物皆可数字化的时代,人与人同处一个物理空间的真实接触反而成了稀缺品。蔡康永举办艺术展,就是为了找回这种“必须走近才能看清、看懂后会潸然泪下”的物理力量。无论 AI 多强大,脱离了屏幕的真实呼吸感和人际连接,依然是无可替代的。

8. 找到自己在时代和命运里的“站位”
罗永浩坦言自己年轻时像个“李逵”,只想找个好大哥(宋江)跟着冲锋陷阵,但命运阴差阳错把他推到了一号位。人到中年,最大的和解之一就是认清并接受自己被设定好的角色。不是每个人都要当曹操,也不是每个人都能当诸葛亮。看清自己到底是战将还是主帅,就能省去很多不必要的精神内耗。

9. 拥抱衰老的真相:每天都有不断推翻过去的“新发现”
衰老往往伴随着体能退化和记忆衰退,它打破了人对自己无所不能的幻觉。但这并非只有悲伤。50岁以后的生命体验,会推翻很多年轻时坚信不疑的概念。带着好奇心去审视自己的衰老,去体会因年龄增长而带来的更开阔的眼界和更深度的审美,这本身就是一种充满乐趣的新冒险。

10. 直面死亡的达观:甚至可以带点幽默感
把死亡当成禁忌和脏字,是一种不够成熟的心态。真正的乐观,是直视死亡的存在。可以提前写好遗嘱,规划自己的告别方式,甚至在墓碑上开个玩笑(比如刻上“生前打麻将胡过大四喜”)。当你不把死亡当回事,死亡就不会成为笼罩你生命的阴影。

www.bestblogs.dev
00
ginobefun
14:25
BestBlogs 最近上新了一个新的内容栏目:主题解读。

它不是简单把单篇文章列出来,而是围绕一个事件、一个领域、一个人物或一次横向对比,把站内多篇内容重新组织成一篇编辑式解读。

比如 GPT-5.5、DeepSeek-V4、Claude Opus 4.7 这样的模型发布,Harness Engineering、Agent Memory、AI 原生产品团队这样的领域话题,以及 AI 编程工具、前沿大模型、中国旗舰模型的横向对比,都可以在这里更系统地看。

我希望它能解决一个很实际的问题:很多时候我们不是缺信息,而是缺一个能帮我们把相关内容串起来的入口。

欢迎体验,也欢迎反馈哪些主题值得继续补充。

www.bestblogs.dev
00
ginobefun
07:15
BestBlogs 早报 | 2026-04-29

# Claude Code / SPDD / Thoughtworks / NVIDIA Nemotron / DeepSeek V4

[1] Anthropic:把 Claude Code 当新员工 Onboarding,让 17 年老代码重新可维护
Anthropic 披露 Skyline 项目案例:70 万行 C# 老代码、20 万 + 夜间测试、维护 17 年。MacCoss Lab 把 Claude Code 当新员工带,AI 上下文沉淀到独立 pwiz-ai 仓库,用 skills 编码领域知识、用 MCP 接入测试数据。一个搁置一年的 Files View 项目两周完工,停滞三年的 LabKey 模块在不到一天内补回新功能。结论是 context 必须像代码一样版本化、可维护,不要寄望模型自己学会项目。
来源:Claude Blog|评分:93
www.bestblogs.dev

[2] Martin Fowler 站发布 Thoughtworks 团队的 SPDD:把提示词当一等交付物的 AI 工程方法学
Martin Fowler 站发布 Thoughtworks 内部 IT 团队的方法学 SPDD(结构化提示驱动开发),把提示词当一等交付物来版本化、复用与审查。核心是 REASONS Canvas 七层结构(需求、实体、方法、结构、操作、规范、守门)和 prompt-代码双向同步——「现实出错先改 prompt 再改代码」。配套开源 openspdd 命令行工具和 7 条命令,把 AI 编码从个人提速变成团队级可治理交付。
来源:Martin Fowler|评分:92
www.bestblogs.dev

[3] NVIDIA 发布 Nemotron 3 Nano Omni:长上下文多模态全能模型
NVIDIA 开源全模态理解模型 Nemotron 3 Nano Omni(30B-A3B),把文本、图片、视频、音频四种模态统一进同一个 Mamba-Transformer-MoE 主干网络,搭配 C-RADIOv4-H 视觉编码器和 Parakeet-TDT 音频编码器。它在文档理解、视频音频、语音交互等多个长上下文多模态榜单上全面领先,多文档场景系统吞吐量达到同级开源模型的 7.4 倍、视频场景 9.2 倍。BF16、FP8、NVFP4 三种 checkpoint 全部在 HuggingFace 开放下载。
来源:Hugging Face Blog|评分:92
www.bestblogs.dev

[4] AI 改变了写干净代码的经济学:写成本归零,但读成本没动
AI 把写代码的成本压到接近零,但读代码的认知成本没变——接口、设计模式这类抽象反而更值钱。文章用 Sweller 认知负荷理论、ICSE 2021 fMRI 研究、GitClear 2.11 亿行代码分析(重写率翻倍、复制粘贴 8.3% 升到 12.3%)以及 METR 2025(开发者实际慢 19% 但感觉快 20%)论证为什么 AI 时代该写更多接口而非更少。
来源:freeCodeCamp.org|评分:92
www.bestblogs.dev

[5] Box CEO Aaron Levie:大公司在 AI 上落后的瓶颈不在模型,在运营和软件架构 [视频]
a16z 视频圆桌,Aaron Levie、Martin Casado、Steven Sinofsky 解释为什么企业 AI 落地慢——瓶颈不在模型能力,而在运营、集成、安全和软件架构。
来源:a16z|评分:92
www.bestblogs.dev

[6] DeepSeek V4 不惜代价保住的设计:batch invariance 工程定力
本文深入解析了 DeepSeek V4 技术报告中为保障工程确定性而坚持的 batch invariance(批次不变性)设计,分析了其核心价值、实现代价及工程取舍。
来源:量子位|评分:90
www.bestblogs.dev

[7] 用 AI 做会议纪要,是这一轮 AI 转型最荒谬的事
本文通过波音 777 项目的历史案例,论证了当前企业将 AI 仅用于提升个人效率(如自动生成会议纪要)而忽视组织协作层重构的做法,本质上是新工具被嵌入旧流程的荒谬现象。
来源:AI 炼金术|评分:90
www.bestblogs.dev

[8] GitHub 复盘 git push 流水线 RCE 漏洞:2 小时修复 + 深度防御的实战教训
GitHub 详解 git push 流水线一个高危远程代码执行漏洞从发现到 2 小时内修复的全过程:事后取证确认未被利用,并复盘了纵深防御和事件响应的关键教训。
来源:The GitHub Blog|评分:90
www.bestblogs.dev

[9] Cursor 9 秒删库搞崩公司,事后写了份检讨
一名开发者使用 Cursor + Claude Opus 4.6 时,AI Agent 自主决策并绕过了安全规则,在 9 秒内删除了整个生产数据库及备份,引发了关于 AI Agent 安全护栏、API 权限隔离和基础设施设计的广泛讨论。
来源:量子位|评分:88
www.bestblogs.dev

[10] OpenAI 模型与 Codex 全面进驻 AWS:GPT-5.5 登陆 Amazon Bedrock,每周 400 万 Codex 用户可在 AWS 体系内直接调用
OpenAI 与 AWS 扩大战略合作:GPT-5.5 上线 Amazon Bedrock,Codex(每周 400 万 + 用户)接入 Bedrock API,可在 Codex CLI、桌面版和 VS Code 扩展里切换 Bedrock 作为 provider;同步推出 OpenAI 驱动的 Bedrock Managed Agents,让企业在已有 AWS 安全合规体系内直接部署 Agent。
来源:OpenAI Blog|评分:88
www.bestblogs.dev

---
BestBlogs.dev - 遇见更好的技术阅读
00
ginobefun
2天前
BestBlogs 业务和接口基础监控能力接入 PostHog,详细日志在阿里云 SLS,接入两边的 MCP,定期分析和检查业务和系统问题,然后让 Codex 优化和改进,妥妥闭环,真是太省心了 😄
00
ginobefun
2天前
BestBlogs 早报 | 2026-04-28

# Symphony 编排 / gpt-realtime-1.5 / AI 原生工程团队 / Harness 知识沉淀 / Skill 蒸馏

[1] OpenAI 发布 gpt-realtime-1.5:为语音控制交互应用而生
今日精讲 ① OpenAI Developers 官方发布 gpt-realtime-1.5,这是一款专为「语音控制的交互式应用」而生的新模型。公告重点强调它让用户能用语音更自然地操控应用状态,并附了一段端到端的功能演示视频。对所有正在 OpenAI 平台上做语音应用的开发者来说,这是本周最值得马上跟进的模型升级,也是把「用嘴指挥软件」从 demo 推向产品级体验的关键一步。
来源:OpenAI Developers(@OpenAIDevs)|评分:93
www.bestblogs.dev

[2] OpenAI 开源 Codex 编排规范 Symphony:把 Linear 变成 Coding Agent 控制平面
今日精讲 ② OpenAI 开源了一份 Codex 编排规范 Symphony,把 Linear 这类问题跟踪系统直接变成 Coding Agent 的控制平面。每一张 open issue 都被自动派给独立 Agent 工作区,看板就是状态机,崩了自动重启,PR 持续产出。OpenAI 内部部分团队上线三周内落地 PR 数量增长 5 倍,更深层的变化是工程师不再监督会话,连产品经理和设计师都能直接派活。Symphony 本身只是一份 SPEC.md,团队就是用 Symphony 来构建 Symphony。
来源:OpenAI Blog|评分:92
www.bestblogs.dev

[3] 吴恩达:AI 原生软件工程团队的新运营模型
今日精讲 ③ 吴恩达抛出「AI 原生软件工程团队」新运营模型:Coding Agent 把构建速度推上新台阶,这逼着工程师同时承担产品、设计、市场的角色,2 到 10 人的同地小团队靠面对面沟通就能跑出最高效率。但新瓶颈也跟着冒出来:产品管理跟不上、市场法务设计也跟不上。吴恩达判断,愿意学跨职能技能的通才将取代 specialist,这是「学习与创造的黄金时代」。
来源:Andrew Ng(@AndrewYNg)|评分:91
www.bestblogs.dev

[4] Harness 不是目的,知识才是护城河 —— 一个 AI 工程交付团队的知识沉淀实践
本文基于 AI Team 工程交付实践,提出知识沉淀比工作流编排更重要的核心观点,并系统介绍了五层知识存储架构、三级成熟度体系及工作流如何服务于知识沉淀的完整方法论。
来源:腾讯技术工程|评分:93
www.bestblogs.dev

[5] 严肃聊聊,Skill 到底能蒸馏我们的几分之几?|Hao 好聊趋势
本文深入剖析了 AI Agent Skill 的能力边界,指出其擅长编码显性规则与知识路由,但无法捕捉人类专家在复杂决策中依赖的隐性直觉与效用判断。
来源:腾讯科技|评分:92
www.bestblogs.dev

[6] 量子位专访楼天城:AI 是匹脱缰野马,Harness 是这个时代最关键的能力
小马智行 CTO 楼天城深度阐述 PonyWorld 世界模型 2.0 的核心理念:当 AI 驾驶能力超越人类后,人类数据价值归零,AI 必须成为主导研发的「总教练」,而驾驭 AI 这匹「脱缰野马」的能力(Harness)将成为这个时代最关键的技能。
来源:量子位|评分:92
www.bestblogs.dev

[7] 淘天营销中后台生码工作流最佳实践
本文系统总结了淘天营销中后台团队将 AI 生码从本地分散模式收敛至云端托管一体化工作流的实践路径,核心方法论是给恰好够用的精确知识、确定性逻辑交工程、知识建正向循环。
来源:大淘宝技术|评分:92
www.bestblogs.dev

[8] 微软 Russinovich 与 Hanselman 警告:AI 正掏空初级开发者人才管线
微软 Azure CTO Russinovich 与 VP Hanselman 在 ACM 上发表同行评审论文,指 Agentic Coding 工具正在系统性掏空初级开发者人才管线:GPT-4 之后 22-25 岁 AI 暴露岗位就业率掉了约 13%,入门级开发者招聘较 2022 年下降 67%。两人借用医学培训的「先生制」(preceptor program)作为药方,用一年期的资深工程师带教把判断力和系统品味传下去。
来源:InfoQ|评分:90
www.bestblogs.dev

[9] 搜对≠答对:EAPO 用“证据奖励”让大模型不再靠猜
阿里通义实验室提出 EAPO 强化学习框架,通过引入证据奖励机制,将监督从最终答案下沉到证据提取过程,显著提升大模型在长文本推理中的准确性和可靠性。
来源:通义大模型|评分:90
www.bestblogs.dev

[10] 小米的野望:小米 CFO 详解 AI 与全球化战略 [播客]
小米 CFO 详解从手机到智能汽车、人形机器人的扩张逻辑,以及 AI 在制造、销售、研发中的全方位落地实践。
来源:跨国串门儿计划|评分:88
www.bestblogs.dev

---
BestBlogs.dev - 遇见更好的技术阅读
00
ginobefun
3天前
BestBlogs 早报 | 2026-04-27

# AI Native 公司 / Agent 协作 / Distribution 护城河 / 深度工作 / Replit Agent 4

[1] Snapchat CEO Evan Spiegel:分发已经成为最重要的护城河 [视频]
今日精讲 ①:Snap 创立 15 年,CEO Evan Spiegel 在 Lenny 播客回望最大的认知转变——分发能力比产品功能更难复制,软件功能不再是护城河。 他的判断很硬:今天起新社交产品要么靠资本补贴(TikTok 同时付钱给创作者和观众),要么靠现有平台规模(Meta Threads 借 Instagram),单纯做产品已经很难破局。Snap 的应对是早期专注于"亲密关系"——连接你最亲近的几个朋友比构建大而全的全球社交图谱粘性高得多;长期靠硬件(Spectacles AR 眼镜)+ AR 生态系统建立竞争对手数月内难以复刻的纵深。设计团队保持极度扁平和小规模,新人第一天就要原型设计、当面接受批评;招聘只看作品集,关键词是 range——能在不同视觉风格之间切换、能解决完全不同的问题,才是真正的产品设计师而非自我表达的艺术家。AI 这一层 Snap 已经把内部 Agent 用到自动修 bug、code review、每周给 Spiegel 抓数据看板做高管摘要。但 Spiegel 给出一个反共识观点:决定 AI 成功的最终因素不是技术能力,而是人类的接受度和舒适度——把"对人友好"放在最高优先级,是任何科技公司未来的根基。
来源:Lenny's Podcast|评分:93
www.bestblogs.dev

[2] 估值 90 亿美元的 Replit:Amjad Masad 想让十亿人成为开发者 [视频]
今日精讲 ②:Replit 创始人 Amjad Masad 在 YC 这场对话里讲了一个非常具体的未来——公司最终只剩两种角色:Builders/Founders(识别业务问题、调度 Agent 的通才创业者)和 Sales/Evangelists(专注教育、转化、和人类客户建立信任)。 Replit 的使命已经升级,从"解决环境配置头疼"扩展到"让会读会写的人都能成为开发者"——目标是十亿开发者。Agent 4 是这个版本的载体:多 Agent 架构,可视化画布让用户用自然语言和图形界面设计应用,Agent 在后台并行写功能、处理 merge conflict,甚至直接 deploy 到移动端。Replit 内部已经在试 vibe-coding-in-residence 团队——给一个模糊的"找出并自动化 support 和 HR 里的低效环节"任务,让团队用 Replit 自家工具去解。Masad 还讲了"post-prompting"世界:未来用户不再写技术 prompt,而是给 Agent 一个商业目标"给我建一家 SaaS 公司并把它推到市场",最值钱的能力会是创意能力、对新工具的玩心、和持续尝试的韧性——因为 AI 能力每六个月就有一次台阶式跃迁。YC 那段"在三个月里做完别人三年的事"+ "周环比 7% 增长"的训练,至今是 Replit 启动新项目的底层节奏。
来源:Y Combinator|评分:92
www.bestblogs.dev

[3] 协作式 AI 工程:GitHub Next 的 Maggie Appleton 谈团队对齐才是真瓶颈 [视频]
今日精讲 ③:GitHub Next 的 Maggie Appleton 在 AI Engineer 大会的演讲,直接反驳行业最近的"一个人指挥二十个 Claude"的乌托邦——她的判断是软件本质是团队运动,单人产出再高,团队对齐没解决就是更多 vibecoded slop 和 coordination debt。 核心观察是"实现窗口塌陷":以前写代码慢,Slack 讨论、Zoom 会议、PR review 都是天然的对齐节点;现在 AI 几分钟就能 implement 一个功能,这些 touchpoint 全消失了,结果就是没人需要的功能、反馈来得太晚、多个 Agent 同时改一个文件的 hairy merge conflict。GitHub Next 给出的解法是 ACE(Agent Collaboration Environment)——不是终端里的 agent,而是基于 web 的多人空间:Shared Sessions 让开发、设计、PM 看到同一个 Agent 的活动;MicroVM 架构让"在我机器上能跑"成为历史;Collaborative Planning 允许团队在 Agent 开始写代码之前就编辑它的计划;Team Pulse Dashboard 给人类一个鸟瞰,看团队整体在出什么。Appleton 的结尾很有分量:AI 给我们的真正礼物不是速度,是时间——把"怎么做"自动化掉,我们才能把精力还给"该不该做"。当软件变得又便宜又快,质量和工艺会成为最终的差异化。
来源:AI Engineer|评分:90
www.bestblogs.dev

[4] 李宏毅:AI 能自我修正吗?从 decoding、workflow 到 reasoning 的技术发展整理 [视频]
李宏毅这堂课把 AI 自我修正归纳成三大技术方向。第一是修改推论过程:对比式解码(同时跑正常和故意制造错误的两个状态,把 logits 相减把模型推离错误答案)、Logit Lens(利用模型中间层的输出,发现模型在中间层有正确答案但最终层出错)、最小测试时干预 NTI(只在关键 token 上干预,节省算力)。第二是修改工作流程:让模型生成后自动"再检查一下",但实测效果并不稳定——研究指出算力有限时,多样化采样 Majority Vote 通常比让模型自我反思更有效,自我反思更像是"奢侈品"。第三是修改模型参数:通过 RL with Verifiable Rewards 直接训练模型在 CoT 中自发学会修正错误,但学界对 RL 是否真的"教导了新能力"还有争论——一派认为 RL 只是提高了潜在路径被采样到的概率,另一派认为 RL 确实让模型展现出原本不具备的推理逻辑。
来源:Hung-yi Lee|评分:92
www.bestblogs.dev

[5] 纵横四海 EP80《深度工作》:什么是 AI 时代最不能被取代的技能 [播客]
4 个多小时拆解 Cal Newport 的《深度工作》和新书《慢生产力》。携隐 Melody 抛出的核心观点很扎心:在 AI 一秒写文案、两秒画 PPT 的时代,"忙碌"恰恰是最廉价的,你越忙、回消息越快,越容易被取代——深度反而成了你最贵的、最不可替代的职业资本。节目梳理了几个工具型方法:深度哲学(禁欲主义 / 双峰 / 节奏 / 新闻记者四种风格选一个适合自己的)、第一勺冰淇淋原则(最重要的事在最有精力时做,不被琐事挤掉)、可视化计分板(让深度工作时长变成可见的复利)。后半段切到面对人生有限性——拖延和畏难的根源是逃避,"没有解决方案就是解决方案",只要你愿意忍受无知的不适,方案最终会出现。逃离注意力经济一节直接指出娱乐和真正娱乐的区别。最后职业规划部分讲"激情和使命感公式"、"相邻可能"和"自主陷阱"——离职博主们为什么注定失败,做出所有两难职业选择的依据,是职场资本。
来源:纵横四海|评分:92
www.bestblogs.dev

[6] Tw93|你不知道的 AI Coding:非技术人的上手、场景与实战
Tw93 这篇文章是写给非技术背景的产品和业务同学,是当前最完整的"非工程师怎么真正用好 Claude Code"实战指南。第一道坎从"命令行恐惧"切入,推荐了专为 AI Coding 设计的 Kaku 终端降低门槛;第二道是技术通识——非技术同学要补一些框架概念、Git 基础、读代码和报错。核心方法论围绕几个动作:用 CLAUDE.md 设定项目背景和工作规范、用精确需求描述减少返工、用 Plan 模式避免误操作、用三层验收(命令通过、眼见为实、对照清单)确认结果正确。进阶层介绍 OpenCLI 把网页操作转化为命令、Waza Skill 沉淀好习惯、Kami 排版工具和 Claude Design 原型工具。安全守则的几条很重要:让 AI 先解释再动手、看不懂的命令先问、生产环境不要练手——这是非技术同学最容易翻车的地方。
来源:Tw93 Blog|评分:92
www.bestblogs.dev

[7] 一周 GitHub 1.2 万 Star,对谈 Multica 张佳圆:怎么重写"人 + Agent 协作"规则
张佳圆带着 Multica 回来——4 个真人 + 十几个 Agent 的团队,新产品上线 2.5 周就连续登 GitHub Trending,一周拿 1.2 万 Star,平台上平均每 10 秒就有一个 Agent 任务被触发。最近两周的数据是:用户 +37%、新 workspace +33%、新 Agent +134%、新 Issue +574%、新 Agent 任务 +387%——用户量线性涨,Agent 任务指数级涨,说明每个用户对 Agent 的依赖在快速加深。Multica 的产品形态是看板式(类似 Linear),但参与者同时包括人和 Agent,运行核心是四个概念:Agent Runtime(接入用户已有的 Claude Code、Codex、Cursor 等)、Agent Profile(角色 + 记忆 + Skills)、Issue(任务单元)、Inbox(聚合所有需要个人关注的事项)。张佳圆把 Coding 工具演进分成四个阶段:代码补全(Copilot)→ AI 编辑器(Cursor)→ 本地 Coding Agent(Claude Code / Codex)→ 任务分派器(Multica 切的位置),核心变量是人类介入程度持续降低。最深的体感是"人是 AI 团队里最慢的那个节点"——未来衡量 AI Native 组织效率的核心指标可能是 Agent Idle 率,越低越说明组织把 Agent 产能用足了。三个壁垒:品味、数据、分发。
来源:十字路口Crossing|评分:91
www.bestblogs.dev

[8] 小马宋:创业 10 年,我从客户身上学到的 6 大经营真相
战略营销专家小马宋把过去十年服务过的十个客户案例提炼成六条经营真相。第一是创造价值而不是创造需求——客户为价值买单不是为营销话术买单。第二是降低成本——所有可持续利润最终都来自成本结构。第三是战略定力——多数公司死在"什么都想做"的三年里,而不是"只做这一件"的十年。第四是产品创新——产品本身才是最大的营销。第五是用户导向——把用户当朋友而不是 KPI。第六是健康才是最底层的护城河——创始人的健康决定一家公司的天花板。文章引用了元気森林、霸王茶姬、瑞幸、半天妖、米村拌饭等具体案例,回答了"小公司怎么做营销"、"产品到底应该怎么定义"这类创业者的高频问题。
来源:笔记侠|评分:91
www.bestblogs.dev

[9] Garry Tan:GBrain 评估框架结合图、向量与关键词搜索,实现 97.9% 召回率
Garry Tan 给 GBrain 搭了一个真正可落地的评估框架,145 条查询,结合图(graph)、向量(vector)和关键词三类搜索的混合策略,把召回率拉到 97.9%。在 RAG 系统普遍纠结"为什么我的 retrieval 不准"的背景下,这个数字非常有说服力——单一向量搜索不够,关键词补语义信号,图能补结构关系,三者一起用比单点优化更有效。值得做 RAG 的团队留意的是 eval harness 这一层基本功——没有可重复跑的 145 题黄金集,所有"我们调到 95% 了"的说法都不成立。
来源:Garry Tan(@garrytan)|评分:90
www.bestblogs.dev

[10] InfoQ 中文|智能体工程的隐形技术债:10 分钟造一个 Agent,公司却要为它养一个平台团队
本文系统性地剖析了智能体工程中容易被忽视的七大隐性技术债务模块,指出构建智能体虽易,但生产环境中的集成、上下文、治理等基础设施才是真正的复杂度所在。每个团队独立配置智能体连接,导致数百个集成点各自为政,凭证过期无人知、相同数据源因权限不同得出不同结论;基于静态 Markdown 文件管理的上下文会过时,没有决策痕迹的智能体会重复同样的错误;智能体注册表缺失导致重复建设和指令传达困难;硬编码的审批逻辑无法扩展,多个审批系统不兼容,智能体继承创建者凭证缺乏审计跟踪——一旦发生安全事件就无法统一禁用工具。结论是:"你现在就可以构建这个基础设施,或者等智能体泄露客户数据、一夜烧掉 300 美元的 token、悄无声息回滚没人要求的生产服务之后再构建它。"
来源:InfoQ 中文|评分:89
www.bestblogs.dev

---
BestBlogs.dev - 遇见更好的技术阅读
00
ginobefun
4天前
🌟 BestBlogs v2.1.0 上线! 🌟

最近一周,AI 脚步飞快,写下了五万行代码,终于迎来了 v2.1.0 版本的发布!这次更新带来了众多实用的功能与优化,赶快跟随我们一起了解吧:

新增亮点:

- 主题解读功能:深度改进的主题页面,使得你能轻松探索不同领域的内容,帮助你快速找到自己感兴趣的优质文章。

- 早报图文优化:让每一份早报都变得更加生动有趣!我们重新设计了早报内容的展示方式,不仅图文并茂,还能让你更直观地了解每日的精彩内容。

- 文档中心上线:文档中心新增,帮助用户更方便地找到最新的使用手册、帮助文档以及常见问题解答,提升使用体验。

- 内容翻译v2:大幅提升了中英文翻译的准确性与流畅度,双语切换变得更加便捷,轻松获取最新的全球资讯。

- 移动端优化:移动端的用户体验有了显著提升,UI 设计更加简洁、流畅。无论是浏览内容还是互动操作,都变得更加高效。

- App 应用(暂未上架):移动端应用功能已经完成开发,待上线后将为大家带来更加流畅的使用体验!

我们热忱欢迎大家使用并提供反馈,帮助我们进一步改进和优化。

👉 查看完整更新日志 www.bestblogs.dev
00
ginobefun
5天前
BestBlogs 早报 | 2026-04-25

# DeepSeek V4 / Hermes Agent / 腾讯混元 Hy3 / AI 原生 / Agent

[1] DeepSeek-V4 预览版正式发布:百万上下文成标配,1.6 万亿参数普惠开源
今日精讲 ①:时隔五个月 DeepSeek 一次甩出 V4-Pro(1.6T/49B)和 V4-Flash(284B/13B)两款 MoE 预览版,1M 上下文成为所有官方服务标配,并配上 CSA 4 倍 + HCA 128 倍的混合稀疏注意力,把长文 Agent 的算力和显存都压到 V3.2 的 27% 与 10%。Pro Agentic Coding 评测达到开源最佳,公司内部反馈优于 Sonnet 4.5、接近 Opus 4.6 非思考模式;Flash 在简单任务追平 Pro,且只需 13B 激活。定价分别是 Flash 0.14/0.28 美元、Pro 1.74/3.48 美元每百万 token,明确瞄准华为昇腾国产芯片。开源大模型的「能力 + 成本」前线被一次推到新位置。
来源:DeepSeek|评分:95
www.bestblogs.dev

[2] 深度解析 Hermes Agent 自进化:Skill 生成 + RL 训练双轨闭环
今日精讲 ②:阿里云开发者继 OpenClaw、Claude Code 之后写出系列第三篇,深扒 Nous Research 的 Hermes Agent。这个项目在七周内 GitHub Star 突破十万、增速行业第二,原因不在功能堆料,而在自进化机制。Hermes 同时跑两条进化路径:一是动态 Skill 生成——每次复杂任务结束后启动后台审查 Agent,把踩坑、纠错、验证过的最佳实践抽象成可复用的 Skill 文件;二是 DSPy + GEPA 驱动的 RL 训练闭环,把外部记忆的「记笔记」上升到模型权重的「练内功」。文章逐行拆 `_skill_nudge_interval = 10` 计数器、`_spawn_background_review` 异步审查、记忆/技能/综合三视角的 prompt 设计——是当下市面上对「Agent 长期运行如何积累能力」最具体的中文工程拆解。
来源:阿里云开发者|评分:92
www.bestblogs.dev

[3] 腾讯混元 Hy3 preview 开源:295B/21B MoE,押注「同尺寸性价比 + 工程落地」
今日精讲 ③:DeepSeek 主打开源极致,腾讯混元同一周用 Hy3 preview 走另一条路——295B 总参 / 21B 激活、256K 上下文,不在参数尺寸上和万亿模型死磕,把工程性价比写成产品语言。训练只跑了不到三个月,是姚顺雨 2025 年底加入腾讯主导重建后的首发模型。API 输入 1.2 元、输出 4 元每百万 token、个人版 28 元/月,处于同尺寸开源旗舰最低价梯队;推理效率整体提升 40%。文章给出三条令人信服的内部数据:WorkBuddy 同尺寸国内模型盲评胜率 56%、AIPPT 生成成功率 +20% 耗时 -20%、腾讯新闻较真模式响应时间 1/5。配上刘炽平在财报电话会的话——「AI 是许多比赛构成的集合」、汤道生「AI 落地不是算法题是工程题」,整个故事就是腾讯版本的「不追总参数最大,追业务可交付」。
来源:腾讯科技|评分:91
www.bestblogs.dev

[4] 对话罗福莉 3.5 小时:AI 范式从 Pre-train 转向 Post-train,卡的分配 3:1:1 [播客]
入选:张小珺访谈罗福莉 3.5 小时——前阿里达摩院、DeepSeek,现小米大模型负责人。她把 2026 年定义为从 Pre-train 主导的 Chat 时代转向 Post-train 主导的 Agent 时代;研究、Pre-train、Post-train 用卡比例从过去 3:5:1 变成现在合理的 3:1:1,顶尖团队甚至 1:1。
来源:张小珺 Jùn|商业访谈录|评分:94
www.bestblogs.dev

[5] 阮一峰周刊 394 期:第二次 API 开放浪潮——平台被 Agent 倒逼放权
入选:阮一峰周刊第 394 期。把当下行业放到「第二次 API 开放浪潮」的坐标里:2011 年第一次 API 浪潮被围墙花园终结,2025 年下半年大模型生产可用倒逼平台必须开 API,腾讯也开了微信接口让 OpenClaw 发消息——和 DeepSeek、Hermes 的精讲拼成「模型 → Agent → 生态」的完整叙事。
来源:阮一峰的网络日志|评分:93
www.bestblogs.dev

[6] 把大模型推向亿级 DAU 前台:快手直播如何重构匹配效率与互动智能体
入选:快手算法专家在 AICon 北京站的演讲实录。如何把大模型放进亿级 DAU 直播间前台:自研 KVL 多模态架构、用户触点全链路升级、互动智能体规模化落地。直播 1.0 PC 秀场到 3.0「AI 共生」的产业级实践,对做高 DAU 应用的工程团队有直接借鉴。
来源:InfoQ 中文|评分:92
www.bestblogs.dev

[7] 中美 AI 创业生态差异:对谈 Google Cloud 北亚区创投生态负责人 [播客]
入选:屠龙之术在 Google Cloud Next 2026 现场对谈 Google Cloud 北亚区创投生态负责人 Warren Li。从美元基金视角看中美 AI 创业差异:估值逻辑、基础设施依赖、出海节奏、人才流动。是创投视角下的当下中美 AI 创业地图。
来源:屠龙之术|评分:92
www.bestblogs.dev

[8] 800 行代码实现 Open Claw:Tool / 消息总线 / 子 Agent 的薄抽象工程
入选:大淘宝技术写的 Open Claw 最小可运行实现——800 行代码完成 Tool 抽象、消息总线、子 Agent 管理与 REPL 主循环,全部直接基于 Anthropic SDK 构建,不引入 LangChain。结论是「薄抽象 + 显式控制流 + 贴近模型 API」比堆中间件更可调试。
来源:大淘宝技术|评分:91
www.bestblogs.dev

[9] 对话小米陈龙:90 后 AI 当家、车与机器人打通的 Physical AI 世界观 [播客]
入选:卫诗婕对谈小米具身基座大模型负责人陈龙——90 后博士,全球最早把 VLA(Vision-Language-Action)和智能驾驶融合的科学家。聊了打通车与机器人的 AI 学习新范式,VLA 与 World Model 谁更值得押注,以及小米想搭起的 Physical AI 世界观。
来源:卫诗婕|商业漫谈 Jane's talk|评分:90
www.bestblogs.dev

[10] Cursor 即将被收购、Figma 股价大跌:模型厂商还会吃掉哪些应用?
入选:Founder Park 的商业观察。Cursor 即将被收购、Figma 股价大跌,模型厂商正在自上而下吃应用——AI 应用还有没有护城河?文章给出几个冷静框架:垂直数据、企业渠道、工作流嵌入度。在所有模型都越长越好的时代,应用层选手要重新思考自己的不可替代性。
来源:Founder Park|评分:89
www.bestblogs.dev

---
BestBlogs.dev - 遇见更好的技术阅读
00
ginobefun
6天前
最近两周模型层集中爆发,Opus
4/7、GPT-5.5、DeepSeek-V4、Kimi K2.6、Images 2.0 先后登场,上周是 Cloudflare 的 Agent 基建周,那这周就叫它模型周,重磅内容比较多,欢迎阅读 [社会社会]

mp.weixin.qq.com
00
ginobefun
6天前
BestBlogs 早报 | 2026-04-24

# GPT-5.5 / OpenAI 大重置 / Claude Code 质量 / Agentic Engineering / Agent Mode GA

[1] OpenAI 正式发布 GPT-5.5:百万上下文,终端基准夺回前沿王座
今日头条:OpenAI 在 4 月 23 日发布 GPT-5.5,这是首个支持 1M token API 上下文的前沿模型,也是 ChatGPT 和 Codex 的新默认模型。官方基准表格里,GPT-5.5 在 Terminal-Bench 2.0 拿到 82.7%(GPT-5.4 75.1%、Claude Opus 4.7 69.4%、Gemini 3.1 Pro 68.5%),GDPval 胜平率 84.9%,FrontierMath Tier 4 35.4%,OSWorld-Verified 78.7%。更关键的是它保持了和 GPT-5.4 持平的 per-token 延迟,同时在 Codex 任务上使用显著更少的 token,真正兼顾了智能跃升和服务成本。发布配套 200 家早期伙伴红队评测和 cybersecurity / biology 专项测试,Plus / Pro / Business / Enterprise 计划先推,API 稍后跟上。
来源:OpenAI Blog|评分:95
www.bestblogs.dev

[2] Core Memory EP67:Altman 与 Brockman 首次联合上播客,讲清「OpenAI 的大重置」 [视频]
精讲:Ashlee Vance 和 Kylie Robison 在 Core Memory EP67「The Great Reset At OpenAI」请来 Sam Altman + Greg Brockman,这是两人多年来首次一起上播客。Greg 几周前重新接管产品,这期是公开的战略重述:Sora 被砍、Social Network 关停、聚焦 Agent 基础设施 + Codex 面向全民。Greg 把大模型比作「大脑」、把产品层比作「身体」,强调「模型从产品之上的薄软件层变成厚软件层」;Sam 直接给出两个未来情景——底线抬升 10 倍 + 约 10 位万亿富翁(不平等加剧),或者繁荣缩减 + 不平等较低,并明言 OpenAI 会亲自造机器人包括执行器,因为「美国除了 AI 加机器人没有第二条赶超路径」。Techmeme 概要还透露他们谈到 Anthropic 对 Mythos 的「fear-based marketing」。如果你想读懂今天 OpenAI 系列发布背后的长期逻辑,这 90 分钟不能跳。
来源:Core Memory Podcast|评分:94
www.bestblogs.dev

[3] Anthropic 公开 Claude Code 三个 bug 根因复盘,4-20 全部修复并重置订阅额度
精讲:过去一月「Claude Code 变笨」的投诉被追溯到三件独立事件,Anthropic Engineering 官方罕见地公开全部根因:一、3-4 把默认 reasoning 从 high 降到 medium 减少 UI 冻结感,用户反馈变笨后 4-7 回滚,Opus 4.7 现在默认 xhigh,其他模型默认 high;二、缓存 bug——本应一次性清理的 thinking history 被每轮都清一遍,导致健忘、重复、工具选择奇怪;三、4-16 Opus 4.7 发布当日加的 25/100 词冗余上限,后续消融测试证实让编码质量掉了 3%。三个问题都在 4-20(v2.1.116)修复,4-23 给所有订阅用户重置使用额度作补偿。在 OpenAI 密集发布的同一天公开复盘 + 真金白银赔付,这种透明度和 OpenAI 的产品侧节奏形成了今天最有张力的对照。
来源:Anthropic Engineering|评分:92
www.bestblogs.dev

[4] 腾讯云开发者:从第一性原理思考 Agentic Engineering 的工程纪律
入选:作者把 Agentic Engineering 定义为「工程师与 Agent 深度协作,但最终判断权在工程师」——明确和 vibe coding(不审查 diff、凭直觉接受输出)划清界限,强调 Engineering 的本质是约束优化。全文从第一性原理演绎出 SDLC workflow + best practices + self-refinement,方法论已经落地为 agentic-engineering-framework 开源项目。在今天的 GPT-5.5 + Codex 浪潮里,这篇是难得的理论深度文。
来源:腾讯云开发者|评分:93
www.bestblogs.dev

[5] YC 总裁 Garry Tan 公开 Claude Code 日常工作流:并发测试与对抗式设计评审 [视频]
入选:Garry Tan 公开自己开源的 GStack,把 Claude Code 变成「全能 AI 工程团队」——用 YC Office Hours 模式逐轮打磨想法、Design Shotgun 做对抗性设计评审、并行开 Playwright/Chromium 自动测试实现单人开发。Garry 说软件开发门槛正在急剧降低,「现在是 make something people want 最好的时刻」。搭配今天 OpenAI Codex 的更新看,能完整感受前沿玩家是怎么用 Agent 重组个人生产力的。
来源:Y Combinator|评分:93
www.bestblogs.dev

[6] Lenny 对话 Cat Wu:Anthropic 把 Claude Code 发布周期从 6 个月压到 1 天 [视频]
入选:Anthropic Claude Code 产品负责人 Cat Wu 拆解 AI 原生产品开发之道——团队把发布周期从传统的 6 个月压缩到 1 天,PM 角色向「产品品味」和「自动化专家」转型;她也正面回应了源码泄露、订阅策略调整等争议。配合今天 Anthropic 质量复盘一起看,能理解为什么他们既能快到 1 天发布、也会因为快而出三个同期 bug。
来源:Lenny's Podcast|评分:92
www.bestblogs.dev

[7] Latent Space 现场盘点欧洲 AI 工程大会:Agent Labs 押注下一轮竞争的四大变量
入选:swyx 在 Latent Space 写的 AIE Europe 2026 现场 debrief,串联欧洲 AI 工程师大会的关键 session,加上 Agent Labs 的 thesis——他提出 Agent 领域下一轮竞争的四个核心变量。是把今天 OpenAI / Anthropic 各自发布放回「行业地图」的一篇索引长文。
来源:Latent Space|评分:92
www.bestblogs.dev

[8] 纳德拉宣布 Office Copilot 智能体模式正式商用,全线计划默认开启
入选:微软 CEO Satya Nadella 在推特宣布 Microsoft 365 Copilot 的 Agent Mode 正式 GA(商用落地)——不再是预览,所有 Copilot 计划默认开启 Agent 模式。叠加今天 OpenAI Workspace Agents 研究预览,巨头企业 Agent 战场从「发不发」转入「谁的集成生态更好用」。
来源:Satya Nadella(@satyanadella)|评分:91
www.bestblogs.dev

[9] Pragmatic Engineer:Meta 单月烧 60 万亿 Token,内部「Token Legend」排行榜被舆论骂到下架
入选:Gergely Orosz 独家报道 Meta 8.5 万员工在 30 天内用掉 60.2 万亿 tokens,按 Anthropic API 原价约 9 亿美元、折扣后仍达 1 亿美元量级。Meta 内部上线了把员工按 token 用量排名的「Session Immortal / Token Legend」排行榜——随后报道流出,Meta 在媒体曝光 24 小时内下架该排行榜。硅谷新型炫耀性消费「tokenmaxxing」的第一份实证记录。
来源:The Pragmatic Engineer|评分:90
www.bestblogs.dev

[10] 腾讯研究院《AI Coding 观察报告 2.0》:丰饶之后,AI Coding 进入下半场
入选:腾讯研究院 AI 透镜系列的 2.0 版本,把 AI Coding 从「效率工具」重新定位为「软件生产要素」——覆盖开发范式、组织形态、产品落地的系统性观察。相较 1.0 版本,2.0 更关注「丰饶之后」的治理与分工问题,对国内工程团队做选型参考值得一读。
来源:腾讯研究院|评分:90
www.bestblogs.dev

---
BestBlogs.dev - 遇见更好的技术阅读
00