目前AI确实有“awesome”时刻,但是其也有着非常明显的能力上限
目前主流的模型就是御三家:opus、gpt-5.2、gemini-3
opus的优势是通人性,弊端是上下文达到一定体量时犯糊涂,忘事。
gpt-5.2的优势是自动压缩不会破坏上下文表达出来的语义信息,弊端是需要有明晰的任务要求或者是非常明晰的任务文档。
gemini-3的优势是较为明显的审美优势,劣势是pro少到可怜的50k有效上下文,flash的话能力没有较高的统治地位表现。
目前AI Coding适合做的东西:
1. 语料足的东西:文字内容
2. 上下文长度友好的任务:opus处理文字没问题,你要是让opus读2张4k图,你看他脑子还正不正常
3. 有特别明晰的任务指引的东西:几乎手把手教,且要保证无歧义
4. 能凑活的东西,能动就是100分
5. 纯文字辅助工作
AI Coding目前很难搞的东西:
1. 审美:目前opus和gpt-5.2的识图是达到了“看图识字会写作文”和“照猫画虎”的情况,你要让他创造艺术基本不可能。gemini-3生态的nano banana的话确实是让模型在审美上有了飞跃,但他目前的评价是"趋近人类期望"而不是替代。
就像你在路边看到的照相馆宣传图,一看哎呦挺好看,你进去拍完拉垮的不行。一问店长,店长说不是有差距,而是"你描述的不好"。我觉得相比"佳能XX,倾斜角度,蓝天白云,开心,白色背景,伟大的作品"的提示词反思,直接给店长一拳应该是最正确且高效率的做法。
2. 创新的东西:如果你让AI CLI去从0开始都给你做完了,那只有两个原因,第一个是你这个太简单,第二个是你这个别人做烂了。
为啥商城从0到1可以出,因为太简单因为做烂了,淘淘商城都可以写到近代开发JAVA编年史当作石碑纪念了;
为什么现在从0开始做游戏不是小车WASD就是贪吃蛇,因为太简单因为做烂了,做简历demo的人手一个贪吃蛇,r3f应用demo遍地开花;
如果你把你思想甩到破圈的交流论坛,如果有人能从被窝里爬起来,给你表演1h被窝黑客松的话,那可能确实是比较危险了,但如果没有的话就说明你思想没问题,放轻松。
3. 较为复杂,且想一口成:刚才说了opus有上下文长了就呆傻的症状,gpt-5.2有专注到斗鸡眼的症状。
想一想吧朋友们,如果你说现在有个外包,做个石头剪刀布可能没问题。你要是让他做魔兽世界?那可有意思了。
opus:"哦对了第三章了我记得吉安娜的妹妹应该是安度因"。
gpt-5.2:“哦你说移动系统啊,做完了,什么?移动到石头里面不是很正常吗”
opus的话你就得每次都得走一步重新/new,走一步提醒一下
gpt-5.2的话你就得每次都得说"不对不对,移动不是这样的,移动不能穿墙的"
如果真想做的话:
1. 拆分小小模块,制作一小部分,尽可能保持背景信息独立(我就让她说人物A和人物B的交互)
2. 看看vibe在任务对应领域能力是否ok:如果是SDK不懂就让他去读文档(context7 MCP)如果是某标准规范他不懂就让他调用浏览器去读网页(Chrome devtools MCP)
3. 做好备份:特别是opus,一招毁坏一座城的概率还是很大的。
4. 管理好上下文:如果是opus,前半部分上下文阈值可以干高要求工作,后面最好少干重活,勤保存状态/new,不要用自带的自动压缩,很垃圾,让他总结过程文档,/new后再读取继续干。
5. 有详细的规划,如果不详细可以和cc交流,让他调用askUserQuestion给你提供旮旯game选项(不是),或者是直接和他交流,如果你担心歪,就说'请说出你的理解',交流没问题如果上下文满了总结交流文档开新会话执行,如果没满直接开干。
6. 慎用他人方案,要测试其是否真正适合自己,openspec+bmad一甩,我觉人应该比AI先犯迷糊。
AI Coding的火我认为不是其能给你创新,而是给你提供一个'智能补全',它能基于经验给你提供目前市面上可能的解决方案或实现,但是实现毕竟是实现,它不是一个“精品”,"精品"还是要依靠人的。
就这么说,AI能完全实现《忍者明》的方式只有一个:"偷走全部源码"+“学会工具使用方式”+“借助Engram问的时候直接逐字逐句摘抄”。
你说让他一口气实现你的思路+你的交互+调试工具+个人智慧+美术绘制。怎么可能呢。他目前能干一个环节就很不错了。
AI Coding就是"码二代",吃满了家里老资历的代码经验,确实有东西,但是你说让他去替代目前前沿技术创新和思想创新的人,那我觉得还是太不尊重了。
全即刻能vibe出XX系统的人漫山遍野,但是全即可能做出《忍者明》的只有一位(应该没团队的吧?我母鸡啊,如果有的话再加几位)。
还有目前我觉得skill目前替代可行性最高的人群,并不是码农、开发者,而是以“再不学你就out”这种AI泔水自媒体。
目前已经开发出可以实现类似方法的工作流了,但是公司原因暂不方便公开,这些b自媒体再散播焦虑+卖课,正经东西都不发的人你们等着吧,再让我杰克老师
@杰克有茶 焦虑我就把你们都取缔了!(遇敌时投降)
---
【插一句】为啥现在skill混成了command的样子,就是因为他无法做到像人类真正好好运用自己的"skill",还是得靠自己触发。Claude.md是可以从身份上去进行灵活运用,但是能用几个?Claude.md能不能覆盖到?这就很难了,现在skill火我个人觉得就是command生不逢时,之前command太好用也没人提,A社提出skill概念但是自己模型玩不转又回撤到command地位。