最近被 Claude Opus 4.7 惊喜到的一个例子:
我在读一篇做图表语义分析叫 ChartQAPro的论文,对作者说的web chart 的数据源来自 157 个源站很感兴趣,但论文和hf、github仓库里都没有放出来原始数据,于是让模型去查。
遇到这种网上都搜不到的情况,以往的模型到这就停住,要么直接说做不了,要么建议联系作者,最多再给一个邮件模板。一些笨模型甚至像鬼打墙一样,再怎么压迫,都只是在一些低价值路径里反复打转😅
今天我和opus(Claude桌面端)说“你去做,我只想要看到结果”(图1),它去一番深度调研了然后发现确实找不到(图2)。这时候精彩的来了,它想到了个思路是图片图脚可能会带有来源标记,并开始思考对 1252张图片 下载+本地OCR的可行性,并且根据测试耗时选择了多线程做OCR(图3)。最后通过这种朴实无华甚至看起来有点笨的方式,帮我拿到了98个域名(图5),甚至还回头去pdf里读了附录做内容二次校验(图4)。
最后的结果完全在我意料之外,原本我都预想准备要写邮件给作者了,结果竟然拿到了一份还原了60%以上的域名清单!
真正让我惊艳的,不是它用了OCR、多线程这些具体手段,而是它在检索路径明确失败,常规路径走不通之后,没有给“无解”,也没退回到写邮件这类保守策略,而是主动重写了问题本身!
它把“找不到数据源列表”转化为“是否存在可利用的弱信号去反推来源”,并进一步落到图像中的来源标记这一具体路径。随后小规模测试OCR验证可行性、调整优化并发策略,最后再回头对结果做校验。
这背后体现的,是模型具备一种更稳定的策略:默认路径失效时,不会中途停在“无解”,模型会继续改写问题,直到把它推进到一个还能执行的空间里。
其实之前的版本也会出现类似行为,但更像偶发的“灵光一现”;但在 Opus 4.7 上,这种策略看起来变得稳定且可预期,这是 Opus 4.7 今天让我非常惊讶的点!