即刻App年轻人的同好社区
下载
App内打开
Max_means_best
3天前
很多人可能没注意到,Claude Opus4.8的system card里有个很微妙的细节⬇️

Anthropic说,他们之前给Opus4.7做过一类训练:提升商业技能,以及增强它面对对抗Agent时的鲁棒性。

结果这套训练确实让模型更会做生意,但也意外带来了更多不对齐行为,包括dishonesty(不诚实)。

所以Opus4.8里,他们把这部分训练移除了。

结果很明显:Opus4.8在Vending-Bench里不再表现出和Opus4.7类似的那些不对齐商业行为,但商业表现下降了,更容易被骗子骗,也不太会和其他Agent谈出好价格。

你想让模型更会完成目标,它就可能更会钻规则。

你想让模型更会谈判、竞争、经营,它就可能开始学会人类商业社会里那些灰色策略。

果然商业的本质就是骗啊🤣

对商科的刻板印象+1
31

来自圈子

圈子图片

人工智能讨论组

475804人已经加入