把OpenAI的这个实践应用到自己的项目里,可能是各个工程团队26年最需要做的改造了。
Humans steer. Agents execute.
目标是让AI编写100%代码,人类只做这些
环境设计:构建反馈循环让 AI 能自主验证,即使AI操作UI比人类慢很多,但它可以在你睡觉的时候工作,忙不过来的时候,你也可以随时Hire一个新的Agent
架构约束:用 linter/CI 机械化执行规则,而不是靠脆弱的文档指令
知识管理:通过AGENTS.md等文档沉淀知识,而不是分散在代码,甚至slack讨论里
可观测性:让 AI 能看到 UI 截图、日志、metrics,自己验证自己的工作
很多人可能会担心AI写的代码出错了怎么办,人类Review变成了瓶颈。OpenAI的哲学是:当 correction 的成本极低时,blocking merge gate 就不必要了,前提是你得有 CI 告诉 AI 哪里坏了,AI 才能自己修。
随着时间的推移和AI代码量的积累,整个仓库会趋于熵增,产生越来越多的垃圾。
人类维护的仓库如果不做重构也会这样,导致更容易出错,影响迭代效率(工程师经常要向产品经理解释为什么重构很重要),但AI产生垃圾的效率也远高于人类,重构的频率也需要提升。
重构的方向很难完全由AI决定,必须由人类设定目标,以后有代码和架构品味的,擅长重构的工程师价值会变得更大。但也需要这些工程师放下偏见,学会与AI协作,而不是觉得AI做不好就得自己上。