Anthropic 公开最新模型信息了,强到自己不敢发。
它的官网公布了该模型的信息,但只敢讲安全故事。
但 benchmark 数据藏不住:这是一次全面的代际智能跃迁。编码、推理、规划能力全线飙升。真正的冲击是,所有白领工作都在射程内。
Claude Mythos Preview,Anthropic 内部最新前沿模型,没有公开发布。拉了 AWS、Apple、Google、Microsoft 等 12家巨头搞了个 Project Glasswing,对外说保护全球网络安全。
官方叙事很漂亮。找到 OpenBSD 里藏了 27 年的漏洞。自动写出完整远程攻击链拿到 root 权限。没安全背景的普通工程师,睡前让它跑,第二天早上收到一个可用的 exploit。
但去看 benchmark 数据,才知道真正发生了什么。
SWE-bench 编码测试,上一代 53%,这一代 78%。多语言编码 27%翻到 59%。Terminal-Bench 81% 到 94%。HLE 推理 40% 到 57%。每一个维度都在跳涨。编码、推理、多语言、工具使用、多模态。不是某一项突破,是全面拉升。
找漏洞只是这个跃迁最容易讲的故事。
想想找到 27 年老漏洞意味着什么。几十万行代码,无数安全专家审计过,500 万次自动化测试跑过。全没发现。它看出来了。不是暴力搜索,是真正读懂了代码运行时会发生什么。
再想想把 4个独立漏洞串成浏览器逃逸链意味着什么。同时理解 JIT 编译器、渲染器沙箱内存布局、内核权限模型,然后规划出一条跨越所有层级的攻击路径。每一步依赖上一步,任何一步错了链就断。
这不是"会写代码"。是深层系统理解加长程多步规划。
而这套能力的应用范围远远不止安全。
这次是真正的临界点。
写行业研报:理解大量材料,提取信号,推导趋势。
建财务模型:处理业务逻辑和多变量交叉。
策划产品方案:权衡路径,分步落地。底层全是同一种能力。找 zero-day 是难度最高的。最难的做到了,其他全是降维打击。
所以为什么只讲安全?不是只会这个。
恰恰相反,因为什么都会,会得太好了。
安全是唯一能正当化这种能力的叙事。保护全球基础设施,谁会反对?1 亿美元额度,12 家巨头站台,PR 无懈可击。
但没人点破那个显而易见的推论。
去年 5 月 Dario Amodei 对 Axios 说,AI 可能在 5 年内消灭一半入门级白领工作。今年 1 月写了 2 万字长文加码,警告"失业或极低工资的底层阶级"。微软Mustafa Suleyman 更狠:不用 5 年,12 到 18 个月。
说这些话的时候手里已经有内部模型的能力曲线。不是预测。是描述已经看到的东西。
纯编码,结束了。零安全背景的人让它跑一晚拿到 root exploit,顶尖内核研究员的活它也干,成本不到 50 美元。编码只是第一个倒下的。往下推:所有"理解信息、做推理、产出结构化成果"的工作都在射程线上。
Anthropic 选择只讲安全漏洞的故事。漏洞修了就修了。白领岗位消失之后,没有补丁可以打。
模型能力的提升不是线性的,是阶梯式的。
上一代还在"辅助人类写代码",这一代已经在"独立完成人类做不到的事"。这个跳变发生得比所有人预想的都快。
接下来大概率会发生的事:更多公司会训出类似能力的模型,能力扩散不可逆。
白领工作不会一夜消失,但会在未来一到两年内被系统性地重新定义。
重复性的智慧型劳动会被大幅压缩,能驱动 AI 的人和不能的人之间的生产力差距会拉到十倍甚至百倍。
不是世界末日,但格局确实在变。
变化的速度取决于模型发布的节奏,而不是我们准备好了没有。