BestBlogs 早报 · 05-20
# Google I/O 2026 / Gemini 3.5 / Antigravity CLI / WebMCP / Karpathy 加入 Anthropic
[1] ★ 精讲|Google I/O 2026 开发者主题演讲全览
Google I/O 2026 把过去一年的 AI 押在「智能体」上:Gemini 3.5 系列模型登场,Antigravity 2.0 和全新 Antigravity CLI 让一个开发者就能调度多个子智能体并发处理工作流,内建跨平台终端沙箱、凭据掩码与 Git 策略;Android CLI 把 Android Studio 的能力封装成任意 LLM 都能调用的工具,WebMCP(Chrome 149 起 Origin Trial)让浏览器内智能体直接消费网页结构化能力。比起任何一条单独的模型 / 产品,更值得关注的是 Google 这次把「构建—运行—交付智能体」整条工程链路一次性补齐。
来源:Google Developers Blog
www.bestblogs.dev[2] ★ 精讲|Karpathy 重返一线研发:宣布加入 Anthropic
Karpathy 在 X 上官宣加入 Anthropic,是近一两年最具信号意义的 AI 人才流动。从 OpenAI 创始成员、特斯拉 AI 总监,到独立做 nanoGPT 与 zero-to-hero 教学的「学者—工程师」代表,他选择重返前沿研发岗位本身就是对 Anthropic 未来几年 LLM 路线最强的背书;同时他强调会继续教育方向的投入,意味着头部 AI 公司开始为「长期影响力型研究者」预留位置,而不是把高杠杆人才当成纯生产资源消耗。可以预期未来几个季度其他实验室的招聘与研究文化都会被这条信号轻微改写。
来源:Andrej Karpathy(@karpathy)
www.bestblogs.dev[3] ★ 精讲|Claude Managed Agents 新功能:自托管沙箱与 MCP 隧道 | Claude
Anthropic 把 Managed Agents 推向真正的企业级形态:自托管 Sandbox(公测)让工具执行落在企业自己的基础设施,或落到 Cloudflare、Daytona、Modal、Vercel 这类合作 Sandbox,仅把 agent loop 留在 Anthropic 侧;MCP Tunnels(研究预览)让智能体通过单条出向连接安全访问内网 MCP 服务器、内部数据库与工单系统,不再需要把内网 API 暴露公网。这两件事拼出了 enterprise agent 商业化的两块关键拼图:「在企业安全边界内执行任务」与「合规连接私有数据」。
来源:Claude Blog
www.bestblogs.dev[4] 面向编码智能体的可维护性传感器
本文探讨了如何通过为 AI 编码智能体提供自定义指导的静态代码分析传感器,借助快速反馈和智能体自我纠正能力,来维护代码库的可维护性。
来源:Martin Fowler
www.bestblogs.dev[5] 别构建垃圾:AI 智能体成熟度的四个层级 [视频]
Cline 的 Ara Khan 提出一套务实的四级 AI 智能体成熟度框架,涵盖状态机建模、精简提示词、伪强化学习管线、架构纪律与前沿 API 行为等五条核心工程准则。
来源:AI Engineer
www.bestblogs.dev[6] 让 Skill 自己训练自己:8 阶段 Loop、3 层评测、5 维 AND 门控,从此实现自进化
本文提出并实现了一个名为 skill-evolver 的自进化框架,通过融合 Karpathy autoresearch 的外循环、Anthropic skill-creator 的评测引擎和 Stanford Meta-Harness 的 trace 诊断思想,让 AI Skill 能够像训练模型一样自主迭代、评测、回滚和选优,并以 19 轮零回滚的自我进化和真实业务场景验证了其可行性。
来源:腾讯云开发者
www.bestblogs.dev[7] Project Glasswing:Mythos 漏洞研究模型给我们的启示
Cloudflare 分享了使用 Anthropic 的 Mythos Preview 模型进行漏洞研究的经验,强调了该模型在漏洞链利用和 PoC 生成方面的能力,同时指出需要专门的工具来管理噪音并扩展流程。
来源:The Cloudflare Blog
www.bestblogs.dev[8] 使用 LiteRT-LM 实现超快速的端侧 GenAI
LiteRT-LM 是 Google 用于在端侧部署 Gemma 4 的跨平台运行时,通过 GPU/NPU 加速、多 Token 预测和高级会话管理,提供了业界领先的性能。
来源:Google Developers Blog
www.bestblogs.dev[9] LLM 时代的个性化推荐:Spotify 生成式推荐引擎的三大技术支柱 [视频]
Spotify 技术负责人详解如何以统一 LLM 驱动的生成式推荐引擎取代碎片化的传统推荐流水线,核心支撑三大支柱:用户基础嵌入、语义 ID 目录分词与软分词实时个性化。
来源:AI Engineer
www.bestblogs.dev[10] 五分钟回顾 LLM 的最近六个月
Simon Willison 在 PyCon US 2026 上的闪电演讲总结了 LLM 最近六个月的发展,重点指出 2025 年 11 月是一个转折点,编码智能体变得可靠实用,本地模型的表现也开始远超预期。
来源:Simon Willison's Weblog
www.bestblogs.devBestBlogs Pro 早鸟内测开放:关注你感兴趣的来源、配置兴趣标签,每天收到一份属于自己的「我的早报」。欢迎体验,把反馈发回给我们:
bestblogs.dev---
BestBlogs.dev · 发现真正适合你的高质量内容