即刻App年轻人的同好社区
下载
App内打开
鲁彼特
6月前
人和人的关系,想要正向长久,就要学会正确发送/获取正负反馈。

​每个人本质上都是智能体,终其一生都在训练自己这个大模型。训练方式是:通过知识的灌入(深度学习),与环境/他人的互动(强化学习),来提高自己的性能。

和AI一样,训练数据对我们的成长扮演着关键作用。在深度学习部分,我们需要选取优质的信息源。在强化学习部分,我们需要获取优质的反馈数据。

​举个例子,你精心做出来的东西被上级否定了。他并不懂业务,他否定你的原因仅仅是怕你表现太过亮眼,对他产生威胁。于是向你发送了一个错误的反馈数据。

你按照对方的要求反复修改,但很快发现,对方给的意见经常自相矛盾,于是,你产生了混乱,不知道怎么改了。

后来,你在某些前辈的指点下,发现经常拍马屁,上级给否定意见的频率少了很多,有时甚至一字不改都能过。

你的上级不能对你的错误施加负反馈,对你的成绩施加正反馈,从而帮助你成长。他向你施加反馈的方向,是有误导性的,这种情况下,你最好离开这样的训练环境。

当然,有时候,并不是你的上级刻意否定你,而是任务的难度系数不适合现阶段的你,还不能容错,也建议更换环境。

​再举一个例子,有些女同学在面对自己喜欢的人时,担心自己表现太主动了,显得不够矜持,会处于劣势。因此会隐藏自己的真实心理,发送一些错误的信号。

接到这些错误信号的男同学,大概率会认为对方对自己没有兴趣而停止接触。

如果他经验丰富,或者根本不在意对方,可能会选择继续,甚至加入到这个信号操纵游戏中。

最后的结果,姑娘伤心,其实我对他还蛮有好感的,为什么他追着追着就不追了?或者劣币驱逐良币,逆向筛选出了海王。

还有一种心理是风险控制,担心自己投入过早,受到伤害,所以刻意控制正反馈的发送。有这种心理,本质是在之前模型训练的过程中,收到了太多真真假假的反馈数据,久而久之,失去了判断能力,造成了过拟合。

解决过拟合的办法是扩大样本数据,重新训练模型,使之能够正确识别真假信号。

我们所处的东亚社会,是一个高语境社会。换句话说,人际交往中,充斥着大量噪声、假信号。

结果是,大部分人不具备区分真假信号的能力,同时自己也忍不住给别人乱发信号。

这就是为什么严嵩、和珅型人才能够在这种环境中格外吃香,因为只有他们才能够从领导大量晦涩模糊相互矛盾的指令中,识别出对方的真实意图。

结果就是,整个国家的创新为此付出了惨痛代价,几千年的封建社会几乎没有什么科技进步。

在我看来,什么是好的领导,搭档,伴侣?就是能够给你发送真实、准确、合适、高质量的反馈数据,最终帮助你提高自己这个大模型的性能,实现终身成长。

(注意,这里有一个“合适”的限定,意思就是一些情况下,善意的谎言是ok的。)

什么是差的工作环境?就看这个环境里,人和人发送的信号,是不是充斥着大量虚假泡沫,同时信息量极低?你不但无法取得进步,还必须仰仗一些老员工的指点,才能生存下去。

如果你已经深受这种低劣反馈数据之害,怎么脱离这样的恶性循环呢?你可以:

1)在求职、社交中,一开始就告诉别人,你希望被怎么对待,你想获得怎么样的反馈方式。通过主动打直球,带动别人打直球。

2)如果对方还是给你发送会引起混乱的信号,不要花时间纠结,把它们当作脏数据从训练集中剔除,花时间去寻找更优质的训练数据。

3)敢于更换训练环境,如果一个环境持续生产低劣的反馈信号,请毫不犹豫离开它。

4)尽量帮助和你一样的人,本着帮助对方脱离劣质反馈信号的初心,去互动。负反馈视对方需求来提供,但正反馈请不吝向对方发送。

一个人找到了合适的反馈数据和训练环境,对不符合自身实际的赞赏是会排斥的,因为这会误导自己。

如果你觉得对方被夸多了飘了,本质上他还是活在虚假的信号中。


1855

来自圈子

圈子图片

浴室沉思

100万+人已经加入