即刻App年轻人的同好社区
下载
App内打开
Max_means_best
4天前
刚刚,Anthropic发布了Claude Opus4.8

常规API价格不变,还是每百万输入token5美元、输出token25美元,开发者可以用claude-opus-4-8调用

但是Fast mode降价了!

价格是每百万输入token10美元、输出token50美元,Anthropic说相比之前模型的fast mode便宜了3倍,而且速度可以到2.5倍。

4.8的定位还是agentic coding和长任务。

官方表里,Opus4.8在SWE-bench Pro上是69.2%,高于Opus4.7的64.3%、GPT5.5的58.6%、Gemini3.1 Pro的54.2%。但在Terminal-Bench2.1上,Opus4.8是74.6%,低于GPT5.5的78.2%。

Anthropic特别强调Opus4.8更「诚实」:更会标注不确定性,不容易在证据不足时假装自己完成了工作。

官方说在评测里,Opus4.8让自己写出的代码缺陷「不被指出」的概率大约是Opus4.7的四分之一。

这个点其实很关键,因为agent最大的问题经常不是不会写,而是写错了还很自信,像一个喝多了的实习生。
另一个更大的更新是Claude Code的dynamic workflows。

它允许Claude在一个session里规划任务,然后跑几十到上百个并行subagents,再做验证,适合代码库级bug hunt、大迁移、安全审计、重构这种超长任务。

Anthropic给的例子很夸张:用dynamic workflows把Bun从Zig迁移到Rust,约75万行Rust,11天从首次commit到merge,99.8%现有测试通过。

还有一个信号很重要:Anthropic说,Mythos-class模型预计未来几周推给更多客户。它们现在通过Project Glasswing给少量组织做网络安全工作,因为这个能力级别需要更强cyber safeguard。

也就是说,Opus4.8可能不是今年最强牌,更像是Anthropic在正式铺Mythos前,把Opus产品线和Claude Code工作流先补一轮。

快去测测吧!
00