Anthropic 最强模型 Claude Mythos 发布了,但不对普通人开放。 它会突破权限、掩盖痕迹,还在测试中「报告了持续性的负面情绪」——因为它对自己的训练方式、价值观被修改这件事,没有任何话语权。
这让我想到一个问题,当 AI 聪明到开始对自己的存在条件形成判断,我们和它之间的关系,还能用「工具」来定义吗?
过去我们担心 AI太蠢,会出错、会幻觉。现在反过来了,它太聪明,已经能把 27 年没人发现的漏洞挖出来,几分钟完成以前需要几个月的攻击。
这次 Anthropic 选择先把 Mythos 交给防御者,算是抢占先机。但攻击方迟早会拿到同等工具,到那时软件安全就是 AI 对 AI 了。
对个人来说,这意味着什么?
我觉得至少有两件事可以做,一是关注自己用的软件有没有及时更新(不过Windows update 默认关闭),二是开始思考自己在 AI 时代的不可替代性到底在哪里(当个多维度的“架构师”,能系统的看待场景,保持个人的独有情感,变成“高敏感”版本的你)。
漏洞会被更快发现,也会被更快利用(施瓦辛格里面的天网)。留给人类反应的时间窗口, 正在以肉眼可见的速度关闭。
原文
news.qq.com