即刻App年轻人的同好社区
下载
App内打开
ginobefun
222关注117被关注0夸夸
中年程序员
两个萌娃的爹
ex 华为、阿里,现金融行业
喜欢折腾点有意思的事情
ginobefun
2天前
BestBlogs 早报 · 06-09

# Claude Code Agent 工作流 / 循环工程 Loop Engineering / 阳萌安克创新 / Agent 上下文压缩 / 硅谷 AI 软件转型

[1] ★ 精讲|Claude Code 一周年复盘:从辅助写代码到自主智能体工作流 [视频]
Anthropic 官方 Claude Code 一周年复盘视频文字稿,由团队工程师一手呈现。一年间,Claude Code 从处理独立小任务演进为数千 Agent 动态协作的庞大网络。文章聚焦三个核心转变:验证从单元测试升级为 Agent 在沙箱中自启环境、通过 Computer Use 自我修正的完整运行时循环;Claude 4.6/4.7 推出「Auto Mode」,以安全分类模型替代人工逐条审批权限;PM、设计师乃至数据团队已开始独立提交代码,组织边界加速消融。理解 AI 工程范式转移的第一手权威视角。
来源:Claude
www.bestblogs.dev

[2] ★ 精讲|循环工程
Elevate 技术博主 Addy Osmani 系统阐述「Loop Engineering」新范式:工程师职责正从「持续提示 Agent」转变为「设计运行 Agent 的系统」。Claude Code 负责人 Boris Cherny 原话:「我不再直接提示 Claude,我的工作是写循环。」文章拆解五要素——定时自动化、并行 Worktrees、Skills 知识沉淀、MCP 连接器、制作者与验证者分离的 Sub-agents——并警示:验证责任仍在人,「认知投降」会让循环反而侵蚀工程质量,值得深思。
来源:Elevate
www.bestblogs.dev

[3] ★ 精讲|对阳萌的 4 小时访谈:消费电子死与生、第三类公司、AI 变量、产品方法、打游戏的模式选择 [播客]
张小珺「商业访谈录」对安克创新创始人兼 CEO 阳萌的 4 小时深度访谈,罕见系统复盘 15 年创业历程。从充电品类切入,在消费电子「速生速死」战场完成多品类扩张;从依赖直觉的「浅海战略」转向系统化「深海」作战;从「五星品质、适度溢价」攀向「七系极致创新」。对于 AI,他着重探讨打造「AI 原生组织」、重塑人才与价值分配体系,并提出「第三类公司」与「创造者平台」的长远愿景。
来源:张小珺 Jùn|商业访谈录
www.bestblogs.dev

[4] 横向拆解 Claude Code、Codex 等六大 Agent 上下文压缩策略后,我们做了第 7 个
本文横向拆解 Claude Code、Codex CLI 等六大 Agent 的上下文压缩策略,提炼出分层渐进、成本递增、增量摘要等共识原则,并介绍了作者团队面向云端多用户场景落地的四级水位线方案及存储分离、跨轮缓存等特化设计。
来源:腾讯技术工程
www.bestblogs.dev

[5] Vol.121|硅谷 AI 大转弯,软件正在死去,创业者的真机会在哪里?|2026 年中特辑 [播客]
锦秋基金两位合伙人深度复盘 2026 上半年 AI 行业,从泡沫本质、模型战争到具身智能路线之争,为创业者提供一套在中美市场、模型与应用间抉择的务实决策指南。
来源:开始连接 LinkStart
www.bestblogs.dev

[6] 对话凯文·凯利:人类将如何与 AI 一起走向 2049?丨首席评论 [播客]
凯文·凯利深度对谈:AI 将重塑工作与价值,但人类的责任感、学习能力和「突破性创造力」仍无可替代。
来源:第一财经
www.bestblogs.dev

[7] 为广泛利益而建:我们的计划
OpenAI 概述了其 AGI 第三阶段愿景:构建自动化 AI 研究员、加速经济发展、为每个人提供个人 AGI,其根本原则是广泛分配权力与利益。
来源:OpenAI News
www.bestblogs.dev

[8] 开源两个月 16k+ star!我把 Huashu-Design 推翻重写了
作者将开源项目 Huashu-Design 从 v1 重写为 v2,通过三套并行设计逻辑、图片前置与事实验证,解决了 AI 设计工具输出单调、内容空洞与事实错误三大核心问题。
来源:花叔
www.bestblogs.dev

[9] 小米 MiMo,探索与热爱
小米 MiMo 与 TileRT 通过极致的模型-系统协同设计,包括 FP4 量化和 DFlash 推测解码,在商用 GPU 上实现了 1 万亿参数模型每秒 1000+ token 的推理速度。
来源:Hacker News
www.bestblogs.dev

[10] #575.杰弗里·辛顿:如何面对 AI 失控焦虑,超级智能临近下的人类位置之争 [播客]
AI 教父 Hinton 坦率分享其对 AI 理解、意识、超级智能风险的深度担忧,探讨了人类在更聪明存在面前的失控风险、自我保存子目标、信息崩塌及安全监管困境。
来源:跨国串门儿计划
www.bestblogs.dev

---
BestBlogs.dev · 发现真正适合你的高质量内容
根据你感兴趣的来源和兴趣标签,每天为你生成一份专属的「我的早报」。立即体验:bestblogs.dev
01
ginobefun
2天前
现在回头看 Claude Code 这一年,最大的感受就是:变化来得真快。

一年前可能还觉得 AI 写代码只是辅助一下,现在已经能明显感觉到,它正在改变很多人的开发习惯。

今天,它已演进为一个由数千个自主 Agent 动态协作、形成深度组织树状结构的庞大生态系统。推荐阅读 Anthropic 工程团队的第一手复盘,思考这场转变背后最关键的三个维度。

mp.weixin.qq.com
00
ginobefun
4天前
继续整理 BestBlogs 的订阅源,这次是第二波:播客和视频。

一共整理了 57 个小宇宙播客和 119 YouTube 频道,覆盖 AI、编程、商业科技、投资财经、产品设计、效率成长、媒体资讯、生活文化等方向。

我越来越觉得,播客和视频其实是被低估的信息源。

很多真正有密度的内容,比如技术演讲、创业者访谈、产品复盘、行业趋势判断、学术解释和创作者经验,并不会第一时间变成文章,而是先出现在播客和 YouTube 频道里。

但音视频内容也有明显的问题:太长、太散、太难筛。

所以这次把 BestBlogs 里持续更新、质量相对稳定的音视频源整理出来,一方面方便 RSS 用户导入 OPML,另一方面也方便做 Agent、内容管理、自动化简报的朋友,把它当成一份高质量信息源目录。

也欢迎直接在 BestBlogs 上使用,在「我的关注」里添加感兴趣的小宇宙播客或 YouTube 频道,让它帮你筛选、排序、摘要和评分。

好的阅读工作流,不是订阅更多,而是更稳定地看到真正值得看的内容。

OPML 下载地址见文章内部。

BestBlogs 订阅源分享第二波:播客与视频篇 - Gino Notes

10
ginobefun
5天前
整理了一份 375 个微信公众号 RSS 源,已经开源成文章和 OPML。

微信公众号其实是中文互联网里内容质量很高的地方,很多 AI 公司、技术团队、财经机构、媒体栏目、文化品牌和个人作者都会在这里发布内容。

但它也比较封闭,不太适合 RSS 阅读器、Agent 和自动化内容工作流。

所以这次先把这批仍在更新的来源整理出来,覆盖 AI、编程、商业科技、投资财经、产品设计、个人成长、媒体资讯、生活文化、体育运动等方向。

RSS 爱好者可以直接导入 OPML。

Agent、内容管理、自动化简报的朋友,也可以把它当成一份中文高质量信息源目录。

也欢迎直接在 BestBlogs 上使用:在「我的关注」里添加感兴趣的公众号来源,让它帮你筛选、排序和整理内容,生成个性化早报。

好的阅读工作流,不是订阅更多,而是更稳定地看到真正值得看的内容。

BestBlogs/opml/bestblogs_wechat2rss_opml_all.opml at main · ginobefun/BestBlogs

00
ginobefun
9天前
BestBlogs 早报 · 06-02

# MiniMax M3 / AI Coding 规范 / 视频 Agent / 语音智能体 / RAG 工程化

[1] ★ 精讲|MiniMax M3:前沿 Coding 能力、1M 上下文、原生多模态,一个模型全给你
MiniMax 发布国内首个集前沿 Coding、1M 超长上下文、原生多模态三项能力于一体的开源模型 M3。Coding 方面 SWE-Bench Pro 得分 59.0%,超过 GPT-5.5 和 Gemini 3.1 Pro;自研 MSA 稀疏注意力让 1M 窗口每 token 计算量仅为上代 1/20,prefill 阶段加速 9 倍。实测 24 小时内自主完成 145 次 CUDA 算子迭代,硬件利用率从 7.6% 升至 71.3%。三项能力国内首次齐备且开源,benchmark 数据之外,复现论文与让模型训模型的实测更能说明问题。
来源:MiniMax 稀宇科技
www.bestblogs.dev

[2] ★ 精讲|深入解析 Chromium 的 AI Coding 开发体系
Chromium(3500 万行代码)不只是「用 AI 写代码」,而是构建了完整的 AI Coding 基础设施:四层分层提示词体系(核心指令 → 完整工作流 → 平台模板 → 任务提示词)、18+ 个按需激活的可复用技能系统,以及三层 Agentic 工作流编排。AI 使用政策同样严格:无论是否使用 AI,人类开发者对每一行代码负全责;提交未经理解的 AI 代码将被剥夺 Committer 权限。这是目前见到的最完整的大型工程团队 AI Coding 规范实践,实战参考价值高。
来源:腾讯技术工程
www.bestblogs.dev

[3] ★ 精讲|为什么视频智能体模型是下一个前沿——Ethan He,xAI Grok Imagine 负责人
xAI Grok Imagine 前负责人 Ethan He 给出一个反直觉判断:视频模型的智能主要来自 LLM 而非视频训练数据本身,这意味着视频生成的上限跟着 LLM 走。他的预测:下一个 Sora 不会是更好的视频模型,而是视频 Agent,类比 Coding 从单次输出进化到能规划、编辑、测试、提 PR 的 Agent 系统。Grok Imagine Agent 模式(规划 → 生成 → 编辑 → 迭代)正是这一路径的率先验证。延伸判断:生成式 UI 最终可能替代 HTML/CSS,世界模型需要实时、交互、长时域。
来源:Latent.Space
www.bestblogs.dev

[4] 工程化语音智能体:低延迟、高质量与规模化生产实践 [视频]
Rishabh Bhargava 解释了生产级语音智能体如何围绕亚秒级延迟预算、级联 STT-LLM-TTS 流水线、基础设施共址、guardrails,以及向原生 speech-to-speech 系统的迁移来工程化落地。
来源:AI Engineer
www.bestblogs.dev

[5] 面向 LLM 的架构设计:什么是真正的 AI Friendly 架构?
本文系统阐述了从传统工程架构向 AI Friendly 架构演进的三范式(确定性→概率性、结构化→语义化、静态→动态),并结合淘宝秒杀业务中的 AI 审核与答疑系统实战,详细讲解了 Multi-Agent、Context Engineering、AI Friendly API 及 AI 可观测等核心能力的实现方法。
来源:大淘宝技术
www.bestblogs.dev

[6] 黄仁勋的“Agent 工厂”里,装了什么新故事?
英伟达在 COMPUTEX 2026 上发布 Vera Rubin 平台、DSX 工厂操作系统、Cosmos 3 世界模型等全栈产品,围绕 Agent 生态重构从芯片到机器人的技术体系。
来源:腾讯科技
www.bestblogs.dev

[7] RAG 不是机器学习,ML 工具包解决的是错误的问题
本文认为 RAG 系统本质上是搜索和工程问题,而非机器学习问题;引入超参数优化、训练/测试评估和可解释性框架等 ML 工具会误导工作方向,并掩盖真正的失败模式。
来源:Towards Data Science
www.bestblogs.dev

[8] Rippling 如何在 6 个月内借助 Deep Agents 和 LangSmith 构建生产级 AI
Rippling 使用 LangChain Deep Agents 和 LangSmith,在 6 个月内构建了一个生产级的多智能体 AI 系统,解决了跨数千张表的庞大本体进行跨领域推理的难题。
来源:LangChain Blog
www.bestblogs.dev

[9] AI 现场部署工程师的崛起与 AI 工程角色的未来
吴恩达探讨了 AI 现场部署工程师角色的复兴,将其与更广泛的 AI 工程师角色进行对比,并预测了未来 AI 工程领域的专业化分工。
来源:Andrew Ng(@AndrewYNg)
www.bestblogs.dev

[10] 从 Token 无上限到全员 Agent:MiniMax 的 AI Native 组织进化实践
MiniMax 分享了其作为 AI Native 公司,通过全员不限 Token、Agent 实习生计划等实践,推动组织扁平化与效率提升的经验,并认为 AI 将深度改变商业模式与组织构成。
来源:量子位
www.bestblogs.dev

---
BestBlogs.dev · 发现真正适合你的高质量内容
根据你感兴趣的来源和兴趣标签,每天为你生成一份专属的「我的早报」。立即体验:bestblogs.dev
11
ginobefun
13天前
BestBlogs 早报 · 05-29

# Claude Opus 4.8 / 动态工作流 / Anthropic H 轮融资 / 并行子智能体 / 脑机接口

[1] ★ 精讲|Claude Opus 4.8 发布
Anthropic 旗舰模型 Claude Opus 4.8 在编程、智能体、推理、知识工作四类基准中全面超越 Opus 4.7,尤其在「诚实度」上大幅提升——对自身代码缺陷视而不见的概率降低约四倍。同步推出三项新功能:Claude Code 动态工作流(并行子智能体处理超大任务)、claude.ai 努力控制(可调思考深度)、API 支持任务执行中实时更新指令。Databricks、Devin 等早期测试者验证判断力与可靠性显著改善,售价维持不变。
来源:Anthropic News
www.bestblogs.dev

[2] ★ 精讲|动态工作流功能发布 | Claude
Claude Code 正式推出动态工作流:单次会话内可动态编写编排脚本、运行数十至数百个并行子智能体,专为全代码库漏洞排查、大规模迁移、独立验证等传统单智能体无法胜任的复杂任务而设计。新增「ultracode」模式让 Claude 自动判断何时启用工作流。目前以研究预览形式上线 CLI、桌面版、VS Code 扩展及各主要云 AI 服务,Token 消耗远高于普通会话,建议从范围明确的任务起步。
来源:Claude Blog
www.bestblogs.dev

[3] ★ 精讲|Anthropic 完成 650 亿美元 H 轮融资,投后估值达 9650 亿美元
Anthropic 完成 650 亿美元 H 轮融资,投后估值 9650 亿美元,由 Altimeter、Sequoia、Dragoneer 领投;年化经常性收入已突破 470 亿美元。本轮含超大规模云厂商出资 150 亿,亚马逊单独贡献 50 亿,Micron、三星、SK 海力士以战略投资者身份参与。资金将用于推进安全与可解释性研究、扩充与 AWS/Google/Broadcom/SpaceX 的算力合作,以及规模化 Claude Code 和 Cowork 产品。Claude 由此成为首个同时登陆 AWS、Google Cloud 和 Microsoft Azure 的前沿模型。
来源:Anthropic News
www.bestblogs.dev

[4] 异步智能体时代 — Cognition 的 Walden Yan 与 OpenInspect 的 Cole Murray
Cognition CPO Walden Yan 与 OpenInspect 创始人 Cole Murray 探讨了后台智能体的兴起、2025 年 12 月的模型拐点,以及从本地编码工具到自主云端智能体系统的架构转变。
来源:Latent.Space
www.bestblogs.dev

[5] Dubbing v2 发布:革命性的全新配音模型
ElevenLabs 推出 Dubbing v2,一款全新的 AI 配音模型,可在 90 多种语言中保留原说话者的情感、语调和节奏,实现更自然的 multilingual 视频本地化。
来源:ElevenLabs Blog
www.bestblogs.dev

[6] Neuralink 联合创始人 DJ Seo:脑机接口与 AI 融合的竞赛内幕 [视频]
Neuralink 联合创始人 DJ Seo 揭示了公司如何将脑机接口从实验室研究推向产业化现实,展示在瘫痪患者治疗上的成功以及即将推出的视觉恢复技术,并构建高带宽 AI-大脑融合的未来愿景。
来源:Sequoia Capital
www.bestblogs.dev

[7] Harness 的尽头不是缰绳,是镜子:AI 时代最沉默的那场革命
本文提出「显形」概念,认为 AI 的真正价值不在于替代人类工作,而在于迫使我们将隐性知识、判断标准和团队品味首次文本化,这是一场不可逆转的认知革命。
来源:腾讯技术工程
www.bestblogs.dev

[8] 从语言涌现到协作涌现:如何让 AI 产生高质量决策
本文提出 Agent Room 概念,通过将多个 AI 智能体置于共享上下文场中,实现从流程自动化到协作涌现的跨越,从而产生更高质量的集体决策。
来源:阿里技术
www.bestblogs.dev

[9] 143. 对何小鹏的第二次访谈:更大赌注、人形机器人 Iron 诞生、那场意外、技术剧变下 CEO、GX 和缝合怪 [播客]
小鹏汽车董事长何小鹏深度分享公司从智能电动汽车向物理 AI 企业的战略转型,包括放弃旧自动驾驶体系、下注人形机器人 Iron,以及面对技术剧变的焦虑与决策。
来源:张小珺 Jùn|商业访谈录
www.bestblogs.dev

[10] 浪费 Token,节省时间:Naval 与三位前沿创始人谈 AI 如何重塑软件工程 [视频]
Naval 与三位前沿创始人探讨 AI 智能体如何将软件工程从手动编码转变为构建软件工厂,倡导浪费 token 来节省人力时间,同时质疑纯软件护城河的未来。
来源:Naval
www.bestblogs.dev

---
BestBlogs.dev · 发现真正适合你的高质量内容
根据你感兴趣的来源和兴趣标签,每天为你生成一份专属的「我的早报」。立即体验:bestblogs.dev
10
ginobefun
14天前
BestBlogs 早报 · 05-28

# Claude Code / Composer 2 / 分布式 RL 训练 / SaaSpocalypse / Software 3.0

[1] ★ 精讲|Anthropic 设计负责人谈 Claude Code:一年拿下 51% 市场份额的产品路径 [视频]
Anthropic 设计负责人 Megan 揭秘:Claude Code 从 12 人 CLI 实验起步,首年拿下 51% 市场份额、$25 亿收入。背后是 AI 原生组织基因——流动 Pod(设计师写生产代码、工程师做 UX 决策)、用运行时行为替代 PRD 做质量门控、Bottom-up 企业采用而非自上而下销售。核心度量从 Token 用量转向用户留存与管道营收,管理层须亲自操刀 Repo 才能保持迭代弹性。
来源:Product School
www.bestblogs.dev

[2] ★ 精讲|Cursor 与 Fireworks 如何用分布式 RL 基础设施训练 Composer 2 编码智能体 [视频]
Cursor 与 Fireworks 公开 Composer 2 训练内幕:以 1 万亿参数 MoE(Kimi 2.5,30B 活跃参数)为基础,用异步 RL 流水线让推理与权重更新同步进行、GPU 全程满负荷;Delta 权重压缩将全球同步流量降低 20 倍;Router Replay Tracking 解决稀疏 MoE 的数值漂移;自摘要上下文压缩让智能体在百万 Token 长轨迹中保持推理连贯——把记忆管理训练成模型的内生能力。
来源:Sequoia Capital
www.bestblogs.dev

[3] ★ 精讲|2026:软件的末日、工程师的陨落、平庸的消失
2026 年 1 月,美国软件股单月跌 15%,华尔街称之为「SaaSpocalypse」。本文拆解背后逻辑:AI Agent 绕过 SaaS 界面层直接调 API,让依赖用户习惯维持转换成本的中间层首当其冲(Thomson Reuters 单日跌 16%);而深嵌合规审计的底层系统仍然牢固。对工程师而言,角色正从「写代码」迁移向 Software 3.0——设计评估体系与奖励环境,平庸产出将加速消失。
来源:十字路口 Crossing
www.bestblogs.dev

[4] 🔬ESMFold2:蛋白质领域的“苦涩教训”——Alex Rives 与 BioHub
BioHub 团队推出的开源蛋白质结构预测模型 ESMFold2 表明,在多样化数据上扩展简单的 BERT 类 Transformer,能够在蛋白质相互作用(尤其是抗体)方面超越 AlphaFold3 等专用模型,这标志着计算生物学迎来了“苦涩教训”时刻。
来源:Latent.Space
www.bestblogs.dev

[5] Lyft 如何使用 LangGraph 和 LangSmith 构建自助式 AI 智能体平台
Lyft 利用 LangGraph 和 LangSmith 构建了一个自助式 AI 智能体平台,使非技术领域的专家能够在数周而非数月内开发和迭代客户支持智能体。
来源:LangChain Blog
www.bestblogs.dev

[6] VibeSec 的清算时刻
本文详细介绍了在扩展一个“氛围编码”原型时发现的安全风险,并论证了 AI 生成的代码需要确定性的护栏,而不仅仅是提示词,才能达到生产环境的安全标准。
来源:Martin Fowler
www.bestblogs.dev

[7] 万字入门 AI Infra:深入理解大模型中的数学与 Infra 优化
本文从数学原理和工程优化两个维度,深入拆解了大模型推理中 RMSNorm、Softmax、Causal Mask 等核心操作的底层逻辑,揭示了 AI Infra 优化的本质是用数学等价变换和精度妥协换取硬件效率。
来源:腾讯云开发者
www.bestblogs.dev

[8] Airtable 如何为 AI 功能构建搜索层
Airtable 工程团队通过选择 Milvus 并采用每库分区、HNSW 索引和冷热数据策略,为其 AI 功能构建了语义搜索层,这一切都源于一个观察:在任何一周内,75% 的客户数据库都处于空闲状态。
来源:ByteByteGo Newsletter
www.bestblogs.dev

[9] 别再盯着 AI 智能体干活:构建运行时上下文引擎 [视频]
Brandon Walsenuk 认为,可靠的自主编码智能体需要运行时上下文引擎,理解组织知识、协作关系、权限边界和实时架构冲突,而不只是更长的提示词或更多工具权限。
来源:AI Engineer
www.bestblogs.dev

[10] [AINews] AI 基础设施新晋独角兽:Fireworks、Baseten(OpenRouter 紧随其后)
本期 AI 新闻汇总涵盖了 AI 基础设施独角兽 Fireworks 和 Baseten 的崛起,以及智能体编排工程、长程推理、模型架构更新和生产工具方面的关键进展。
来源:Latent.Space
www.bestblogs.dev

BestBlogs Pro 早鸟内测开放:关注你感兴趣的来源、配置兴趣标签,每天收到一份属于自己的「我的早报」。欢迎体验:bestblogs.dev

---
BestBlogs.dev · 发现真正适合你的高质量内容
11
ginobefun
15天前
BestBlogs 早报 · 05-27

# Anthropic 隔离架构 / AgentScope 2.0 / 腾讯云 Token 压缩 / 上下文卸载策略 / Agent 稳定性工程

[1] ★ 精讲|我们如何在多个产品中约束 Claude
Anthropic 首度披露跨产品约束 Claude 的三种工程架构(临时容器 / HITL 沙盒 / 可信工作空间),并揭示关键教训:93% 的权限弹窗被无脑通过,自建代理层是最薄弱环节。核心结论:随 Agent 能力膨胀,靠环境隔离压缩爆炸半径比依赖人工审批更可靠。
来源:Anthropic Engineering
www.bestblogs.dev

[2] ★ 精讲|从透明开发到系统工程:AgentScope 2.0 发布
AgentScope 2.0 从「可见调试」升级为生产级系统工程:引入权限系统(静态规则 + 动态审批)、稳定的模型重试与备用机制、结构化上下文管理、Middleware 扩展点以及统一 Workspace 抽象。阿里通义团队的核心判断:让 Agent 稳定跑完真实长链路任务,比能调用更多模型更重要。
来源:通义大模型
www.bestblogs.dev

[3] ★ 精讲|腾讯云 Agent Memory 节省 61% Token 提升 52%成功率的诀窍:Mermaid 无限画布×上下文卸载
腾讯云提出「上下文卸载 × Mermaid 无限画布」组合策略:完整任务信息卸载到外部文件系统,关键状态以结构化图谱形式高密度留存上下文。在超长 Session 实验中,最高节省 61% Token,任务通过率从 33% 提升至 50%(相对 +52%)。纯工程侧优化,无需微调模型。
来源:腾讯云开发者
www.bestblogs.dev

[4] Vercel 如何将构建等待时间从 90 秒缩短至 5 秒
Vercel 通过构建基于 AWS Firecracker 微虚拟机的自定义基础设施平台 Hive,将构建预置时间从 90 秒缩短至 5 秒。该平台为多租户构建提供了强大的对抗性隔离,并支持快速启动、预热池和快照等优化。
来源:ByteByteGo Newsletter
www.bestblogs.dev

[5] Faire 通过 Cursor 云智能体将 PR 吞吐量翻倍 · Cursor
Faire 利用 Cursor 的云智能体实现规模化并行和自主任务执行,将每周 PR 吞吐量翻倍,并将原本需要 18 个月的迁移工作缩减至由一名工程师完成。
来源:Cursor Blog
www.bestblogs.dev

[6] 我用 7 天把 AI Agent 的 Token 账单砍掉 87%(附代码)
本文提供了一套详细的 7 天行动手册,通过可观测性审计、提示缓存、上下文压缩、模型路由、重试控制、缓存验证和告警设置,将 AI Agent 的月度 API 账单从 4800 美元降至 620 美元,节省 87%。
来源:高可用架构
www.bestblogs.dev

[7] 用括号来监管是一种糟糕的方式 — LessWrong
本文认为,使用离散的括号来监管连续的分布从根本上说是低效的,并提出使用数学公式作为更优的替代方案。
来源:LessWrong
www.bestblogs.dev

[8] Token 生意在重新洗牌
本文从经济学视角系统分析 Token 作为 AI 时代新型生产要素的定价逻辑、市场结构、商业模式演化及未来趋势,揭示寡头与开源、全球化与本地化等多重张力下的 Token 经济图景。
来源:腾讯研究院
www.bestblogs.dev

[9] 刚刚,国产 AI 自己造了 AI,全球首例!
面壁智能发布全球首个由 AI 编写的生产级大模型预训练框架 ForgeTrain,性能超越英伟达 Megatron,并用其训练出 MiniCPM5-1B 端侧模型,提出 Forge Engineering 新范式。
来源:量子位
www.bestblogs.dev

[10] AI 就业恐慌的现实检验
尽管普遍担忧 AI 会引发白领工作末日,但当前经济数据显示劳动力市场并未出现大规模混乱,不过 AI 相关领域的年轻入门级工作者已开始感受到影响。
来源:MIT Technology Review
www.bestblogs.dev

BestBlogs Pro 早鸟内测开放:关注你感兴趣的来源、配置兴趣标签,每天收到一份属于自己的「我的早报」,欢迎体验。

---
BestBlogs.dev · 发现真正适合你的高质量内容
10
ginobefun
16天前
BestBlogs 早报 · 05-26

# Claude Code / AI 自动化悖论 / 百川医疗 AI / Agent Harness / Karpathy Anthropic

[1] ★ 精讲|AI 悖论:越自动化,越需要人,活反而越多 [视频]
Every CEO Dan Shipper 以亲身数据颠覆主流叙事:深度拥抱 AI 的 Every 团队一年内从 15 人扩至近 30 人。原因是自动化将通用技能商品化,同时激发更多需求、产生隐形管理层。他判断企业软件不会消失,AI Agent 直接调 API 反而推高了软件支出。最大受益者:能独立驱动全产品周期的产品经理,以及直接将设计稿推 PR 的全栈设计师。
来源:Lenny's Podcast
www.bestblogs.dev

[2] ★ 精讲|Anthropic 内部如何使用 Claude Code:HTML 规格说明、让模型来采访你,以及智能体原生 DOM 验证框架 [视频]
Anthropic Applied AI 架构师 Ara 分享三项反直觉内部实践:① 规格说明从 Markdown 升级为 HTML,提供视觉可检查的结构化基线,避免长上下文代理走偏;② 借鉴《The Bitter Lesson》——让 Claude 用 ask_user_question 主持需求采访,而非人工填写约束;③ 组件主动向 DOM 发布数据契约,Playwright MCP 直读结构层做验证,贯通人工看板、Opus 4.7 无头浏览器、CI/CD 三套测试环境。
来源:Claude
www.bestblogs.dev

[3] ★ 精讲|对话王小川:离开通用人工智能的主干道之后
百川智能创始人王小川深度对话:All in 医疗的底层逻辑是「造医生而非复制医生」——用强化学习训练提问与推理能力,而非模仿单个专家的病例。新发 M4 医疗大模型在 OpenAI HealthBench Hard/Professional 双子集排首位;在北京儿童医院与专家会诊吻合率达 95%,已向河北 150 余家县级医院下沉;团队压缩至不超过 300 人,代价是多位合伙人离开。
来源:智能涌现
www.bestblogs.dev

[4] Harness、Scaffold 以及值得厘清的 AI 智能体术语
本文提供了一个清晰实用的 AI 智能体关键术语词汇表——模型、scaffolding、harness、智能体、上下文工程、策略、工具使用、技能、子智能体和训练概念——以解决常见混淆并建立共享的心智模型。
来源:Hugging Face Blog
www.bestblogs.dev

[5] 异构智能如何成为 AI 推理扩展的下一种范式 [视频]
Adrian Bertagnoli 认为,AI 扩展正在从单一模型和同质算力,转向由模型、智能体、工作流和专用芯片共同路由的异构系统,以实现更快、更低成本的推理。
来源:AI Engineer
www.bestblogs.dev

[6] Google DeepMind 如何大规模运行智能体系统 [视频]
Google DeepMind 工程师解释了他们如何在企业级规模运行智能体系统,涵盖 Anti-Gravity 编排、基于浏览器的测试、token 配额、轨迹存储、技能机制和自动化代码评审。
来源:AI Engineer
www.bestblogs.dev

[7] 164 倍 ROI,SaaStr 把自己活成了最激进的 AI 实践|SaaStr AI Annual2026 实录
本文深度解析了 SaaStr AI Annual 2026 第二天的核心内容,通过 Jason Lemkin 的亲身实验、Canva 的生态策略和 Monaco 的 GTM 洞察,揭示了 AI 时代 B2B 公司的生存法则:成为 Agent 主动选择的工具,而非被绕过的 legacy 产品。
来源:随机小分队
www.bestblogs.dev

[8] Andrej Karpathy 加入 Anthropic 的真正原因:从 AutoResearch 原型看递归自我改进的战略布局 [视频]
Wes Roth 分析了 Andrej Karpathy 加入 Anthropic 预训练团队如何代表着 AI 开发向递归自我改进的战略转向,这一转向由他成功的 AutoResearch 原型驱动,该原型通过自主优化循环实现了 11% 的训练加速。
来源:Wes Roth
www.bestblogs.dev

[9] Agent 公司的对手是工资单,不是 SaaS 预算|SVTR Signal #017
AI Agent 公司的真正竞争对手是企业的工资单而非 SaaS 预算,其增长逻辑、估值锚点和资本曲线已与传统 SaaS 出现系统性脱钩。
来源:硅谷科技评论
www.bestblogs.dev

[10] Cursor Composer 2.5 如何用更快、更便宜的编码模型挑战 Claude Code [视频]
Theo 分析了 Cursor Composer 2.5 作为一款快速、低成本、高度专注编码场景的模型,解释了它的价格优势、后训练方法、SpaceX 算力传闻、现实限制与生态锁定。
来源:Theo - t3․gg
www.bestblogs.dev

BestBlogs Pro 早鸟内测开放:关注你感兴趣的来源、配置兴趣标签,每天收到一份属于自己的「我的早报」。欢迎体验,把反馈发回给我们:bestblogs.dev

---
BestBlogs.dev · 发现真正适合你的高质量内容
10
ginobefun
18天前
BestBlogs 早报 · 05-24

# Project Glasswing / Skill 反直觉 / DeepSeek Harness / Context Engineering / Multi-Agent

[1] ★ 精讲|快模型需要慢开发者:超高速 AI coding 时代的工程纪律 [视频]
Cerebras 与 OpenAI 联合开发的 Codex Spark 可达每秒 1,200 tokens——传统推理速度的约 20 倍。Sarah Chieng 论证,速度越快反而要求开发者越慢:需实时监督、每次 agent 运行后即刻微验收测试,并用持久上下文文件保持上下文完整性。高速 AI coding 的核心纪律不是「相信模型」,而是「信任但验证」。
来源:AI Engineer
www.bestblogs.dev

[2] ★ 精讲|Claude Mythos 护网计划:一月发现超 1 万个高危漏洞
Anthropic 联合约 50 家合作伙伴,用 Claude Mythos Preview 在一个月内发现超过 10,000 个高危或严重漏洞——Cloudflare 一家就找到 2,000 个,假阳率低于人工测试员。开源代码扫描超 1,000 个项目,估算 6,202 个高危漏洞。修补瓶颈已从「发现」转移到「修补」:安全 patch 的生产速度正在超过人类的核查与部署能力。
来源:Anthropic Research
www.bestblogs.dev

[3] ★ 精讲|我们用 150 个任务测试了 30 个 skill,跑出 7 个反直觉结论
腾讯玄武实验室用 150 组对照实验评测 30 个 AI Skill,结果令人意外:Skill 组仅以 41.3% vs 36.7% 微弱领先裸模型,且 token 消耗平均增加 48%、耗时增加 19%。还有「虹吸」现象:13.3% 本应不触发 Skill 的请求被错误召回。有效 Skill 的共同特征是提供外部工具或约束性输出结构,而非只对模型现有能力做 Markdown 包装。
来源:腾讯科技
www.bestblogs.dev

[4] Multi-Agent 火了,但 AI 的组织病还没人治|Hao 好聊趋势
本文深入剖析了多智能体系统在工程架构(Harness)成功解决外部协作问题后,内部浮现的群体认知病与个体解离病,指出当前主流对齐技术可能加剧而非解决这些深层问题。
来源:腾讯科技
www.bestblogs.dev

[5] 会记忆的智能体:Memory Stores 与 Dreaming 如何支撑长期上下文 [视频]
这场 workshop 介绍 Anthropic 的 Agent Memory Stores 与 Dreaming,展示如何用文件系统式记忆和后台整理任务实现跨会话连续性。
来源:Claude
www.bestblogs.dev

[6] [AINews] 所有模型实验室都变成了智能体实验室
本期 AI 新闻回顾涵盖了行业从模型实验室向智能体实验室的转变,OpenAI、AI21 和 DeepSeek 纷纷转向智能体产品,同时还有重大的定价变动、协议更新和研究突破。
来源:Latent Space
www.bestblogs.dev

[7] C++之父开撕 AI Coding:资深开发者宁愿退休也不愿伺候 AI 生成的代码
C++ 之父 Bjarne Stroustrup 在播客中尖锐批评 AI 生成代码的质量与验证难题,并系统回顾了 C++ 语言的设计哲学、标准化历程与工程实践。
来源:InfoQ 中文
www.bestblogs.dev

[8] Google Anti-gravity 2.0:以智能体为中心的开发平台和 OS 演示 [视频]
Google Anti-gravity 2.0 被定位为智能体优先的开发平台,由 Gemini 3.5 Flash 协调子智能体、hooks、异步任务和大型自动编码流程。
来源:Google
www.bestblogs.dev

[9] 模型之外,皆属 Harness!DeepSeek 终于出手:招人、组队、从零造一个中国版 Claude Code
DeepSeek 组建 Harness 团队,从零构建对标 Claude Code 的代码智能体产品,标志着 AI 编程竞争从模型层转向模型外层的工程系统。
来源:AI 前线
www.bestblogs.dev

[10] Context Engineering:AI Agent 上下文工程的完整指南
本文系统梳理了 AI Agent 上下文工程(Context Engineering)的完整方法论,涵盖上下文腐烂机制、四大核心策略(写入、选择、压缩、隔离)、四种失败模式及主流平台实践对比。
来源:王俊博客
www.bestblogs.dev

BestBlogs Pro 早鸟内测开放:关注你感兴趣的来源、配置兴趣标签,每天收到一份属于自己的「我的早报」。欢迎体验,把反馈发回给我们:bestblogs.dev

---
BestBlogs.dev · 发现真正适合你的高质量内容
10