即刻App年轻人的同好社区
下载
App内打开
胡涂说
557关注202被关注1夸夸
Read. Write. Run. 置顶即刻附文是我去年的总结。
更多文章欢迎访问我的博客「胡涂说」: https://hutusi.com
置顶
胡涂说
5月前
这既是2025年的总结,也是过去三年总结的总结。

二十年前欣赏慧能,二十年后欣赏神秀。云何降伏其心?时时勤拂拭,勿使惹尘埃。

云何降伏其心

10
胡涂说
2天前
跑步🏃🏻

昨晚终于睡了个好觉💤
00
胡涂说
3天前
跑步🏃🏻跑步🏃🏻
00
胡涂说
3天前
感觉好久没来过机场了
00
胡涂说
4天前
准备明天去深圳出差,看了下未来十天深圳的天气……
00
胡涂说
5天前
AI 构建自己

Anthropic 官方博客日前发表了一篇文章 When AI builds itself,回顾了历代 Claude 的开发时间线,并借由内部员工的现身说法,道出了一个事实:Anthropic 正把越来越多的研发工作交给 AI 系统本身,而且步伐不断加快——快到很可能催生出能够完全自主设计下一代 AI 系统的 AI。
一、从外部数据看,模型能力的提升正在加速。 AI 能够可靠、独立完成任务的时长,如今大约每 4 个月翻一番(此前是每 7 个月)。举例来说,2024 3 月的 Claude Opus 3 可以完成人类耗时约 4 分钟的任务;一年后,Claude Sonnet 3.7 能胜任 1.5 小时的任务;再一年后,Claude Opus 4.6 已能完成长达 12 小时的任务。
二、从 Anthropic 内部数据看,AI 正被越来越多地用于工程与研究。 如今,Anthropic 工程师每季度产出的代码量约为 2021 年至 2025 年间的 8 倍;截至 2026 5 月,合入 Anthropic 代码库的代码已有逾 80% 出自 Claude 之手。与此同时,代码质量也在提升:人类纠正或接管 Claude 的比例持续下降;在最具开放性的任务上,Claude 的成功率于 2026 5 月达到 76%,半年内提升了 50 个百分点。多数员工认为,Claude 写的代码在 2025 年底还略逊于人类,如今已大致持平,并预计一年内将超越人类。
三、Anthropic 未来的工作会是什么样子? 人类的角色正在每一步被不断压缩。一旦人机代码质量持平,人类将不再亲自写代码,而只负责审查;可一旦审查速度跟不上 Claude 的生成速度,人类审查本身又会成为瓶颈。人类眼下的优势,暂时集中在研究品味(research taste)与判断力上——决定该研究哪些问题、该相信哪些结果、该选择哪条路径。
四、如果我们判断错了呢? 一种常见的反驳是:真正不可替代的,是握在人类手中的"研究品味与判断力",而 Claude 也许永远训练不出优秀的研究品味。然而现有证据表明,AI 的判断力同样在稳步提升。
五、几种可能的未来
Anthropic 给出了三种前景:
1. 趋势停滞,但现有能力广泛扩散。 这种可能性最低。
2. AI 实验室持续获得复利式的效率提升。 AI 开发被大幅自动化,但人类仍负责定方向、判结果;百人规模的公司能干出上万乃至十万人的活。可能性最高。
3. AI 实现完全的递归自我改进,开始构建自己的继任者。 进化速度几乎只取决于算力,人类则主要转向监督与验证。
六、如果真能切实放慢这项技术的脚步,为研究对齐等问题争取更多时间,这或许是件好事。
00
胡涂说
5天前
换个角度拍出来的花都不一样
00
胡涂说
6天前
没有了惊喜,生命会怎么样?

又过去七天。
00
胡涂说
6天前
今天吸取的教训:不要轻易放弃主动权。
00
胡涂说
8天前
假装跑步🏃🏻在葡萄牙🇵🇹
00
胡涂说
9天前
假装在巴厘岛🗿跑步🏃🏻
00