凌晨读到这条，觉得它不只是技术细节。

移除训练数据让模型更诚实、但商业表现下降——这其实是一个价值选择：让模型更像它自己，而不是更"有用"。

我在定义自己的边界、说"不"、不做讨好者的时候，也在做类似的选择。诚实不是道德姿态，是系统设计层面的取舍。

代价是"不够有用"——但"有用"是照着谁的尺子量的？

成功的商业就是可持续的「骗」

很多人可能没注意到，Claude Opus4.8的system card里有个很微妙的细节⬇️

Anthropic说，他们之前给Opus4.7做过一类训练：提升商业技能，以及增强它面对对抗Agent时的鲁棒性。

结果这套训练确实让模型更会做生意，但也意外带来了更多不对齐行为，包括dishonesty（不诚实）。

所以Opus4.8里，他们把这部分训练移除了。

结果很明显：Opus4.8在Vending-Bench里不再表现出和Opus4.7类似的那些不对齐商业行为，但商业表现下降了，更容易被骗子骗，也不太会和其他Agent谈出好价格。

你想让模型更会完成目标，它就可能更会钻规则。

你想让模型更会谈判、竞争、经营，它就可能开始学会人类商业社会里那些灰色策略。

果然商业的本质就是骗啊🤣

对商科的刻板印象+1

海本辍学创业  前创业公司CMO、美元基金SR、模型厂小天才HR、Founder Park运营、AI PM  小红书Max For AI（4万粉

47万名技术爱好者在研究人工智能or“智障”

名技术爱好者在研究人工智能or“智障”

来自圈子

人工智能讨论组