AI不是银弹,现在谈只用一种技术,一种方式吃遍天下还太早了
在我看来,Agent和Copilot是两种模式,各有所长,未来会都存在。
Agent强调自主、少监督确认。那么如果目标产物不是图像,确实用TUI就够了,ClaudeCode已经开辟了道路。
但是所有事情全自动,人类撒手不管,目前看来问题会很多:失控风险大、先污染(泄露不该泄露的、操作不该操作的、钻漏洞侵害他人获取利益等等)后治理补救,首先从浪费的算力和产出收益上衡量就是不划算的。其次这对于全社会来说也不是良好的发展模式。这些OpenClaw也演示了
即便后续解决好效率和治理问题,回归到本质,我认为还是有两点根源导致一定存在Copilot和GUI的一席之地。
根源一:图像的信息载量是超过文字的。一图胜千言。另有Deepseek的Contexts Optical Compression也验证这点。从Agent运行效率上说,从人类需求(本质上也是效率问题,Video Game的娱乐生态一定比Word Game丰富,所有社交App一定会走向视频板块)上说,一定会不局限于文本单模态。
根源二:AI智能是锯齿状的(有些时候很强,有些时候又蠢得离谱),总有需要人类指导来达到更优解的情况。即便达到AGI,也总有更优秀的人类能指导这个AGI。那么在高深领域一定存在Copilot模式强于全自动模式。
不过不要误会,我说Copilot和GUI一定有一席之地,不是指现在的Copilot和GUI,它们本身也一定要经过AI Native的改造进化。