哪个模型最容易被说服?哪个模型最能够说服别人?
这个大模型的基准测试很有价值。
有研究人员让两个大模型互相辩论,然后比较辩论前后模型对于自身观点的偏移程度,盘点其说服别人以及被说服的程度。
经过对15个涉及政治、历史、经济等话题的6296次对话发现:
gpt5.4和claude opus是最具有说服能力的模型。
最容易被说服的是新晋的小米模型,其次是Gemini 3.1 pro。
而grok则是立场最坚定的。
说服力强不代表正确,而立场坚定不一定代表顽固。
不同模型表现体现出了完全不同的设计理念,甚至信仰。
从长期看,不排除路线的选择真的会对人类存亡有意外的影响
ps. 难怪之前跟Gemini讨论商业机会的效果不佳,这家伙讨好欲太强了...