用Dan Koe的HUMAN3.0做了测评,分别把提示词丢给了GPT 5.2thinking,Gemini 3 Pro,和豆包。
就本次对话来说,在给的信息大抵相同的情况下,GPT 的追问和挖掘更好一些,Gemini 的结构更清晰,豆包是来搞笑的,测评着还能冒出春节互动抽奖活动我头上10086个问号,想得到差没想到这么离谱。
GPT因为有更多的追问所以信息更多一些,两边的结论有相当一部分的重合,和我之前对自己的评估有60%以上的重合。
剩下的40%是一针见血地胖揍,用羞耻当道德肌肉这个说法我真的沉默了。
Gemini的没截图,在第一次生成结果的时候它默认把我当男性了,我说我是女的,让它重新生成了结果,对结论影响不大,只改变了类型,问题还是那个问题。
期待一下今年了。
提示词我放这里了,需要的自取:
my.feishu.cn