为什么现在的生成式AI笑话说不好?
刚想到一个可能的原因是∶有效训练数据不足
笑话之所以好笑的原因,是几乎不会在互联网留痕的,所以机器没有有效学习的语料,不能连起来其中的好笑逻辑,无从训练所以无从推理。
特定文化的笑话,各种meme各种梗,作为context已经在用户的大脑里了,看到相关的笑话才会好笑,但是大家文字回复互联网留痕的互动都是哈哈哈哈哈,很少会有人说,太搞笑了吧,因为xxxx。人类跨文化的笑话也很难理解,跨群体的笑话也很难破圈(老外肯定听不懂"鸡你太美")。
并且笑话的context和通用常识还不一样,常识虽然大家平时有默认在场景中不会说,但是大体还是有对应的学科系统性知识,针对性或者全面性补全对常识提升应该是有帮助。
所以如果想要提升AI的笑话能力,需要有个全面的跨文化的跨人群的"梗百科"🤭