刚刚Anthropic发布了Claude Opus 4.7
这是继Opus 4.6之后的重要升级
新模型在高级软件工程任务上表现显著提升
它能严谨、一致地处理复杂的长程任务
精确遵循指令并在汇报结果前
主动设计验证方案
特别是在最困难的编程任务上进步明显
同时视觉能力大幅增强
支持更高分辨率图片处理
在完成专业任务时更有品味和创意
能产出更高质量的界面、幻灯片和文档
虽然整体能力不如最强大的模型Mythos Preview
但在多项基准测试上都优于Opus 4.6
Opus 4.7在遵循指令方面有显著提升
这意味着用之前的prompt会产生意外结果
之前的模型会宽松解读指令或跳过部分内容
而Opus 4.7会严格按字面执行
用户应相应调整prompt和harness(要改prompt了
Opus 4.7对图片可接受像素是之前模型的三倍多
这开启了大量依赖精细视觉细节的多模态应用
读取密集截图的计算机使用Agent
从复杂图表提取数据
需要像素级精确参考的工作
内部测试显示Opus 4.7是更有效的金融分析师
能产出严谨的分析和模型
更专业的演示文稿
跨任务更紧密的整合
Opus4.7在 [GDPval-AA]上也是最先进的
这是评估金融、法律等领域经济价值知识工作的第三方评测
Opus 4.7更擅长使用基于文件系统的记忆
它能在长程、多会话工作中记住重要笔记
并利用它们推进到新任务
从而减少前期上下文需求
Opus 4.7是Opus 4.6的直接升级
但有两个变化值得提前规划
因为它们会影响token使用
首先Opus 4.7使用更新的分词器
改进了文本处理方式
代价是相同输入可能映射到更多 token
根据内容类型大约1.0–1.35倍
其次Opus 4.7在更高effort级别会思考更多
特别是在Agent场景的后续轮次
这提高了难题上的可靠性
但也意味着产生更多输出token(翻译:更贵了
用户可以通过多种方式控制token使用
使用effort参数、调整任务预算
或提示模型更简洁
Opus 4.7今天起在所有Claude产品、 API上线
定价与 Opus 4.6相同:
每百万输入token5美元
每百万输出token25美元
开发者可通过Claude API 使用claude-opus-4-7
PS:实测强了很多,但是好贵啊。。。