“个体必须充分 利用 它既有经验以获得收益,但它也必须探索,以便在未来做出更好的动作选择。
困境在于,任何探索和利用都难以避免失败。
个体必须尝试各种动作,逐步地选择那些看起来最好的动作。
在随机任务中,每一个动作必须经过多次尝试才能得到可靠的预期收益。”
摘录来自
强化学习导论
Richard S. Sutton,Andrew G. Barto
ps.
在学习中,我们针对书本考试在经过大量的尝试和实践后,“应试”这样能力逐渐养成,逐渐形成了应试模式下的“最佳路径”或者应对方法。
那么,面对职场呢?在学校的学生个体缺乏真实的职场环境或者高度仿真的职场环境,那么各种尝试最后容易变成传统理论考试的变体,积累了经验,但却不是求职择业需要的经验。积累了大量技能,但和实际的求职技能又不一样。
面对就业,过往好不容易积累的经验难以迁移和获得收益,就业的动作又得通过不断尝试,才能找到有效的动作,进而再重新积累属于自己的经验,并利用这些经验,应对一次又一次的求职。
当然,这样的经验,也会随着职场经历丰富。不断强化,升级。不断跳槽,可能就是最直接的强化学习形式之一了吧。