【七十年编程时代永久终结,软件开发进入自然语言时代】
2025年12月,人类亲手写代码的时代结束了。
一、真香
2025年7月,DHH坐在Lex Fridman的播客里,花了六个小时解释他为什么永远不会让AI写代码。
DHH是Ruby on Rails的创造者,撑起了早期Twitter、GitHub、Shopify的编程框架。在程序员圈子里,他说一句话大概相当于巴菲特在投资圈说一句话。
他说的原话是:"在永久把键盘交出去之前,我宁愿退休。"
他试遍了所有AI编程工具。结论:改写AI输出比自己从头写还慢。他管这叫"AI炒作的顶峰",说AI连大多数初级程序员都不如。
五个月后,12月底,DHH在X上发帖:
"就在去年夏天我还和Lex聊不让AI写代码,但事实证明一半的抵触只是因为模型还不够好。现在完全翻转了。"
经典真香。
但一个人的真香不叫新闻。整个行业的集体真香才叫。
二、24天,三声枪响
2025年11月18日到12月11日。24天,三家公司,三款模型,编程作为人类手艺的历史在这里画了句号。
11月18日,Google Gemini 3 Pro。 万年老二这次真的发力了。AI全球擂台赛排名第一,20项基准赢了19项,OpenAI内部直接拉响红色警报。
11月24日,Anthropic Claude Opus 4.5。 这是真正的分水岭。SWE-bench Verified(给AI出真实世界编程考题:修GitHub上真实的bug,写能跑通测试的代码)得分从一年前的约50%跳到了81%。配合终端工具Claude Code,它可以连续自主工作30小时以上,中间不需要人类干预。
12月11日,OpenAI GPT-5.2。 40万token上下文窗口(约等于同时"记住"一整本《战争与和平》加三本技术手册),SWE-bench同样80%+。一周后追加发布了编程专用的GPT-5.2-Codex。
但数字只是表象。真正改变一切的是:这些模型学会了自己干活。
以前的AI编程像坐在你旁边的实习生,你写一行它接一行。现在的AI agent像你微信发了句"把这个功能做了"的远程工程师:自己开文件、写代码、跑测试、没过自己debug、改完再跑,循环到交付。
DHH在2026年1月的博文里挑明了:让他投降的就是这个转变。从"帮你补全"到"自己干完找你审核",性质完全变了。
三、先知也懵了
Andrej Karpathy,斯坦福博士,OpenAI创始成员,前特斯拉AI总监。2025年2月发明了"vibe coding"这个词,火遍全球。
同年10月,他在播客上管AI编程工具叫"slop"(烂货),说行业在"假装这很惊艳,其实远远不是"。
两个月后,12月27日,360万人看到了他的X帖子:
"作为程序员我从未感到如此落后。这个职业正在被剧烈重构。我感觉只要把过去一年涌现的工具正确串联起来就能强大10倍,而没能抓住这个提升明确感觉是一个skill issue。"
他管这叫**"9级地震"**。
到1月底他给了具体数字:从11月的80%手写、20% agent,变成了80% agent、20%润色。他说这是*"二十年编程生涯中最大的变化",模型在12月前后跨越了"某种连贯性门槛,导致了软件工程的相变"*。
2月4日,他正式把自己发明的"vibe coding"退役了,改叫**"agentic engineering"**。
理由:这已经不是随便玩玩的"氛围"了。
四、一小时 vs. 一年
2026年1月2日,Google首席工程师Jaana Dogan发帖。880万浏览量。
"我没开玩笑。我们在Google从去年就一直在尝试构建分布式agent编排系统。各种方案,意见不统一。我给了Claude Code一段问题描述,它在一小时内生成了我们花一年才建成的东西。"
Google工程师,公开赞美竞争对手Anthropic的工具,说它60分钟复制了Google一年的内部成果。这种事在硅谷史上几乎没有先例。
两周后,OpenAI的CEO Sam Altman也绷不住了。他在X上写了段话(340万浏览量),说自己用Codex做了个应用,然后让它提出新功能建议,"其中至少有几个比我想到的更好。我觉得自己有点没用了。"
连造出这个工具的人,都觉得被它淘汰了。
五、圣诞节觉醒
这些故事的共同催化剂是**"Claude圣诞节"**。
Claude Code是Anthropic的终端编程agent,2025年5月正式开放,到11月年化收入已达10亿美元,比ChatGPT更快达到这个里程碑。圣诞前夕Anthropic搞了个促销:假期一周使用限额翻倍。放假的程序员们有了大把时间,又赶上Opus 4.5刚发布,于是数百万人集中体验了"让AI自己写代码"到底是什么感觉。
旧金山标准报后来写道:"许多人从假期归来后深感不安,因为他们亲眼看着这个工具自主构建了原本需要花数周手写的项目。"
Claude Code创造者Boris Cherny在12月27日发帖(440万浏览量):过去30天提交了259个PR、497个commit,每一行代码都由AI生成,一次没打开过传统IDE。后来他上播客说了句话被全网转发:"今天,编程实际上已经被解决了。软件工程师这个头衔会消失,变成'builder'或者'产品经理'。"
到2026年2月,Claude Code写了GitHub上4%的公开代码。年化收入25亿美元。企业编程工具市占率54%,OpenAI只有21%。
六、大佬们的集体真香
Claude圣诞节引爆的不止普通开发者。2025年12月到2026年2月,一份魔幻现实主义名单浮出水面。
antirez,Redis创造者。Redis是全球用得最广的内存数据库,你用过的每个互联网产品背后基本都有它。antirez是那种对代码洁癖到极致的老派C程序员,信条是"极简、手工打磨、每行都有人类痕迹"。
2025年7月,他博客原话:不要用agent,永远留在循环里。但他加了一句:"如果agent的工作真的出色到无可挑剔,我会第一个切换。"
2026年1月11日,他兑现承诺。博文标题:《不要掉进反AI的炒作陷阱》。Hacker News 850条评论,48万浏览。他用Claude Code在5分钟写出700行纯C的BERT推理库(只比PyTorch慢15%),20分钟复现了他花数周重构的Redis Streams,还自动修了一个多年没解的瞬态测试故障。1月18日发布了flux2.c,README写着:"这是我第一个自己没写一行代码的开源项目。"
他的自白令人动容:"我热爱逐行写软件,整个职业生涯就是一场持续的努力去创造有人类触感的代码。但如果我的软件观损害了判断力,我不会尊重自己的智识:事实就是事实。"
Peter Steinberger,PSPDFKit创始人(约一亿美元退出),iOS社区传奇。休息三年后用AI编程工具从零构建了OpenClaw,到1月底拿了14万GitHub星,史上增长最快的仓库,一个月6,600+次commit。
在OpenAI播客上他说:"他们管这叫vibe coding。我认为这是一种侮辱。他们不理解这是一种技能。" 关于发布不逐行审阅的代码:"大部分代码是无聊的。" 他的顿悟时刻:半成品项目丢给AI生成规格文档,再拖进Claude Code输入"build",一小时后跑通了。"那一刻我起了鸡皮疙瘩。" 2月14日,他加入OpenAI。Sam Altman称他为"genius"。
Linus Torvalds,Linux创造者,Git发明者。全球90%+服务器、所有安卓手机、整个云计算基础设施跑在他写的内核上。在程序员的世界里他大概相当于物理学的牛顿。
他用Google的AI工具给业余项目写代码,README写:"以前我是谷歌搜索然后照猫画虎,后来我把中间人砍掉了。那个中间人就是我自己。" 补了一句:"这比我手写的好吗?当然好。"
当牛顿开始用计算器,你还能说计算器是玩具吗?
Eric S. Raymond,68岁,开源运动教父,《大教堂与集市》作者(这本书直接催生了开源软件运动)。写了40年代码。2026年2月17日在X上:"手写编程正在走向马鞭和手摇钻的命运。"
然后是一句让人沉默的话:"我开始意识到,我一直首先是一个系统设计师,代码只是手段。我在此之前居然不知道自己是这样的人。"
写了40年代码才发现自己其实不是写代码的。
John Carmack转发了ESR这条帖子。Doom和Quake的缔造者,活着的程序员里经常被认为是技术天花板。他早在2024年就写过*"'写代码'从来都算不上价值的来源"*。转发即同意。编程之神投了赞成票。
Spotify联合CEO Gustav Söderström,2月10日Q4财报电话会:"最资深的工程师说从12月起没写过一行代码了。他们只生成代码,然后监督。" Spotify内部系统"Honk":工程师在通勤地铁上通过手机Slack向Claude Code发指令修bug。
Steve Yegge,前Google/Amazon工程师,写了40年代码。2月11日发表《AI吸血鬼》:"AI编程在2025年11月24日越过了事件视界。这是真的。" 他确认了10倍生产力,但也警告:"我们对一种新药物上瘾了。" 建议新的工作日应该是三到四小时。
Redis创造者、Linux创造者、开源教父、Doom缔造者、GitHub增长最快项目作者、Spotify、40年的Google老兵。两个月窗口,同一个结论。这早已超越个人选择,这是地质运动。
七、AI写的代码确实更烂。那又怎样?
到这里你可能会问:既然AI编程这么香,反对的声音是怎么回事?
因为AI代码确实更烂。经过严格测量的那种烂。
CodeRabbit分析了GitHub上470个真实项目:AI代码平均缺陷1.7倍于人类。XSS漏洞多2.74倍,密码处理不当多1.88倍。Opsera分析25万开发者:AI代码多15-18%安全漏洞。Black Duck年度报告:每个代码库平均漏洞同比飙升107%。
还有一个现场打脸。Cursor CEO Michael Truell(Cursor是最火的AI编辑器,百亿美元估值)在2025年12月公开警告:"闭上眼让AI在摇摇欲坠的地基上盖楼,最终一切都会坍塌。" 五周后他自己的公司用数百个agent花168小时从零建了个浏览器FastRender,300万行代码,编译都过不了。可维护性评分1.3/5,最低5%。
Truell先预言了灾难,然后亲手造了一个。
但烂归烂,没人愿意回去。
METR(研究AI对开发者生产力影响的机构)想用新模型做后续实验,需要开发者在不用AI的情况下完成任务作对照组。2026年2月实验被迫放弃:开发者拒绝不用AI工作,每小时付50美元也不行。
经济学管这叫"显示性偏好":别听人嘴上说什么,看他实际选什么。程序员宁可放弃50美元/小时也不放弃AI,争论结束。
想想早期福特T型车。比马车颠、爱抛锚、经常陷泥里。1910年做"汽车vs马车质量报告",马车赢麻了。但人们选了汽车。速度带来的结构性优势让质量问题变成了"等待被解决的工程题",而非"回头的理由"。
AI编程一模一样。卡内基梅隆研究:用AI后代码产出量第一个月暴增281%。就算质量打折,净效率还是正的。何况代码质量有明确的技术解决路径:更好的测试框架、更强的AI审查工具、更规范的治理。"用自然语言替代手写代码"这件事一旦发生就没有回头路。
但故事还有更深一层:那些"AI代码差"的数据,掩盖了一个残酷得多的真相。
2026年2月9日,Science(全球顶级学术期刊)发表了对GitHub上3000万次提交、16万名开发者的大规模分析。结论:AI对资深开发者收益显著,产量提升,还能拓展到新领域。对初级开发者,收益为零。 同一把锤子,老木匠敲出榫卯,新手砸手指。
Anthropic的随机对照实验也验证了:52名工程师学新库,完全把代码委托给AI的人得分低于40%,用AI做概念咨询、自己写代码的人超过65%。决定结果的从来都是人。
回头看那些质量灾难数据就清楚了:CodeRabbit的1.7倍缺陷率是所有使用者的平均数。FastRender的300万行烂代码是没有资深工程师把关架构的实验。这些是把antirez和第一次用Cursor做SaaS的新手扔进同一个池子算出来的均值。
而池子里的方差才是真正的故事。
antirez用Claude Code五分钟写出700行纯C的BERT推理库,输出和PyTorch一致,只慢15%。同一周,一个独立开发者庆祝"我的SaaS全是Cursor写的零行手写",几周后哀嚎:"API密钥被刷爆了,用户绕过了订阅,数据库里冒出来一堆垃圾。"
差距在哪?antirez有40年系统编程的专家判断力,知道该让AI做什么、不该做什么、输出里哪些地方要查。那个SaaS开发者什么都不知道。同一把工具,一个拿到可以直接发布的开源项目,一个拿到安全灾难。
Steinberger把这个点说得最准:"他们管这叫vibe coding。我认为这是一种侮辱。他们不理解这是一种技能。" 他把AI编程比作学吉他:谁都能拨弦,弹出好东西需要训练。他敢发不逐行审阅的代码,因为背后有一亿美元退出的iOS经验做判断基底。OpenClaw的14万星是20年积累通过AI获得了百倍杠杆。
HashiCorp创始人Mitchell Hashimoto走得更远,直接把技能差距工程化了。他提出"harness engineering"(缰绳工程):每次agent犯错,就构建一个解决方案确保永不再犯。他维护一个AGENTS.md文件,每行对应一个过去的agent失败。OpenAI二月直接采纳了这个术语发布方法论,Martin Fowler随即跟进分析。顶级开发者在主动驯服AI。缺陷率数据反映的是没缰绳的马在乱跑,马本身完全跑得了。
极限编程之父Kent Beck的框架最精炼:AI淘汰语法记忆和API知识,放大视野、策略和架构品味。Google的DORA报告说了同样的话:"AI既是镜子又是放大器。基础好的团队更好,基础差的团队更差。"
所以那些质量数据证明的并非"AI编程不行",而是:AI是能力放大器,方向取决于你本来有多少能力可以被放大。 顶尖开发者拿到10倍乃至100倍杠杆,新手拿到一个更快犯更多错误的方法。两者的平均值就是报告里那个1.7倍缺陷率。
cURL创建者Daniel Stenberg在2月的FOSDEM大会上预言:"2026年底每个人都会意识到自己给自己建了什么负担。"
他可能完全正确。但"意识到负担"和"回去手写代码"之间隔着一道永远不会被跨过的墙。就像人们意识到社交媒体的负担后,没人回去写信。
八、跟你有什么关系?
全文到这里都在讲程序员。一个合理的问题是:关我什么事?
答案藏在Vercel CTO的一句话里:"软件生产的成本正在趋近于零。"
想想这意味着什么。你打车、点外卖、挂号、报销、排班、管客户,全在软件上。整个现代社会跑在软件上面。而直到现在,造软件需要一群掌握特殊语言的专业人士,年薪50万到200万,全球缺口数百万人。
现在,造软件的成本正在坍缩。
最接近的历史类比是印刷术。古登堡之前,造一本书需要僧侣手抄几个月。书是奢侈品,知识垄断在极少数人手里。印刷机没有消灭写作,但永久消灭了"手抄"这个职业,把知识创造权从僧侣释放给了所有识字的人。后来的事叫文艺复兴、科学革命、启蒙运动。
相机同理。造一张人物肖像曾需要画家几天到几周。柯达没有消灭视觉创作,但消灭了"肖像画师"这个大众职业,把图像创造权释放给了所有人。后来的事叫新闻摄影、电影、Instagram。
编程正在经历同一个转折。70年来,软件制造权被锁在一个掌握特殊语法的祭司阶层手里。你有个想法,要么花钱请他们翻译成机器指令,要么自己花几年入伙。
这个瓶颈正在消失。当一个餐厅老板可以对AI说"帮我做个排队等位系统,客人扫码取号,快到了微信提醒",然后一下午拿到能用的系统,造软件就不再需要程序员了,就像造照片不再需要画家。
这已经在发生。Steinberger把半成品丢给AI输入"build",一小时跑通。Karpathy在地铁上用手机通过Claude Code提交生产代码。一个胸外科医生在Stack Overflow评论区写:"我是自学编程的医生。67次agent会话后,我发布了一个全栈平台。"
胸外科医生在做全栈开发。12个月前这完全无法想象。
1954年,Fortran诞生,人类开始用代码指挥机器。此后70年,"会写代码"是数字世界的入场券。你不会写,就只能用别人造的软件,按别人设计的逻辑生活。这个时代制造了一个空前的祭司阶层:全球三千万开发者,薪资远超多数行业,在硅谷权力结构中占据核心。
这个阶层的历史使命正在完成。代码不会消失,软件不会消失,构建需求只会暴增。但"人类一个字符一个字符敲代码"作为软件开发的核心活动,正在被自然语言永久替代。就像手抄在印刷术之后没有消失(书法至今是艺术),但不再是生产方式。
70年的编程时代是人类和机器之间的一个临时翻译层。现在机器学会了听懂人话。翻译层正在消融。
你可以兴奋,可以恐惧,可以像Stenberg一样警告负担,可以像Altman一样怀旧。
但你不能假装它没有发生。而它跟你的关系,比你以为的近得多。