当 AI 构建自己
Anthropic 官方博客日前发表了一篇文章 When AI builds itself,回顾了历代 Claude 的开发时间线,并借由内部员工的现身说法,道出了一个事实:Anthropic 正把越来越多的研发工作交给 AI 系统本身,而且步伐不断加快——快到很可能催生出能够完全自主设计下一代 AI 系统的 AI。
一、从外部数据看,模型能力的提升正在加速。 AI 能够可靠、独立完成任务的时长,如今大约每 4 个月翻一番(此前是每 7 个月)。举例来说,2024 年 3 月的 Claude Opus 3 可以完成人类耗时约 4 分钟的任务;一年后,Claude Sonnet 3.7 能胜任 1.5 小时的任务;再一年后,Claude Opus 4.6 已能完成长达 12 小时的任务。
二、从 Anthropic 内部数据看,AI 正被越来越多地用于工程与研究。 如今,Anthropic 工程师每季度产出的代码量约为 2021 年至 2025 年间的 8 倍;截至 2026 年 5 月,合入 Anthropic 代码库的代码已有逾 80% 出自 Claude 之手。与此同时,代码质量也在提升:人类纠正或接管 Claude 的比例持续下降;在最具开放性的任务上,Claude 的成功率于 2026 年 5 月达到 76%,半年内提升了 50 个百分点。多数员工认为,Claude 写的代码在 2025 年底还略逊于人类,如今已大致持平,并预计一年内将超越人类。
三、Anthropic 未来的工作会是什么样子? 人类的角色正在每一步被不断压缩。一旦人机代码质量持平,人类将不再亲自写代码,而只负责审查;可一旦审查速度跟不上 Claude 的生成速度,人类审查本身又会成为瓶颈。人类眼下的优势,暂时集中在研究品味(research taste)与判断力上——决定该研究哪些问题、该相信哪些结果、该选择哪条路径。
四、如果我们判断错了呢? 一种常见的反驳是:真正不可替代的,是握在人类手中的"研究品味与判断力",而 Claude 也许永远训练不出优秀的研究品味。然而现有证据表明,AI 的判断力同样在稳步提升。
五、几种可能的未来
Anthropic 给出了三种前景:
1. 趋势停滞,但现有能力广泛扩散。 这种可能性最低。
2. AI 实验室持续获得复利式的效率提升。 AI 开发被大幅自动化,但人类仍负责定方向、判结果;百人规模的公司能干出上万乃至十万人的活。可能性最高。
3. AI 实现完全的递归自我改进,开始构建自己的继任者。 进化速度几乎只取决于算力,人类则主要转向监督与验证。
六、如果真能切实放慢这项技术的脚步,为研究对齐等问题争取更多时间,这或许是件好事。