即刻App年轻人的同好社区
下载
App内打开
成荫
66关注837被关注1夸夸
抖音产品经理 |ex 阿里
最近在关注AI 方面的机会,希望认识新朋友~
vx:yao1024512833
成荫
2月前
笑死 我把这篇关于“推荐系统如何与大模型结合”m.okjike.com 的贴子发给男友,他先是一顿夸夸(虽然我猜他没看懂多少,因为他不是互联网人),然后说很开心看到我说我正在谈婚论嫁🤣 (可能让他觉得可以求婚了
10
成荫
2月前
推荐系统如何结合大模型,这个话题很有意思。尝试从产品角度回答一下。没想到写起来刹不住车,有上千字,全贴在这里,大家自取~

推荐可以理解为一种匹配,把内容和用户匹配起来。在匹配时候,要理解双方分别是什么。即:内容理解和用户理解。

不要小瞧内容理解,特别是在视频领域。文本内容的理解相对容易,因为信息都是文字,可以相对容易的刻画一篇文章在讲什么。但在视频领域,内容理解一下就复杂起来,因为信息更多存在于图面中。现在短视频平台上很多视频,只有背景音乐,没有文字描述,怎么把这个视频的信息刻画出来,是一件有挑战的事情。比如一个视频是小姐姐在跳舞,这个小姐姐穿了什么在跳舞,在跳什么舞,跳的好不好,在哪里跳,这些要素都会显著影响一个视频的特点和受众。视频的类型又很多,颜值、音乐、舞蹈、历史、财经、科技、科普、法律、医疗等等等等,每类内容,都是生活里的一个缩影。因为我们只生活在自己小世界的局部,我们可能意识不到,大千世界各种要素叠加在一起,量级至少是百万级的。

我们知道,当前推荐系统非常依赖于协同过滤,它的主要思想是把和你有相似偏好的人的内容,推荐给你。这种相似偏好,纯粹是内容ID上的相似度,不是特征上的相似度。不知道大家有没有思考过,为什么推荐系统走了这样一条有点绕的路径?它为什么不直接把你喜欢的内容推荐给你?答案其实是,它不知道这个内容是什么,它不知道前面例子的视频是小姐姐在随便扭扭还是认真在跳拉丁舞。或许你会疑惑,即使没有大模型,现在的小模型也能识别小姐姐、小姐姐衣服的类型、跳的舞种。没错,现在的模型已经能在单点任务上做到80分了。但前提是,需要大量的人工标注样本,喂给小模型,小模型才能做到。但小模型最大的问题是,无法泛化,所以每个特征都要单独做标注、训练。上百个特征的人工标注成本,对抖音这样的平台还能承担,但百万级呢,成本和效率是完全打不住的。

好,接着大模型这个明星闪耀出场了。大模型带来的最大变量是,它有了通用性,这种通用在于,它像一个百科全书,知道人生活的方方面面。大模型能看出来,“这个视频里,有个人,这个人是个小姐姐,小姐姐长着黄棕色头发,蓝色眼睛,看着像是个欧洲人,她穿着一条黄色长裙,在跳拉丁舞,她在一个广场上,广场后面是巴黎圣母院。天空很蓝,漂浮着棉花一样的白云。过了一会儿,慢慢有路人围观过来....” 。前面这段简单的描述,对人来说一眼便知,看起来稀疏平常,但这里面的很多要素,要很多小模型才能做到,现在仅仅一个大模型,有很大希望就能做到了。这种改变是巨大的,它会把内容理解提升到一个崭新的高度。

如果模型能充分地理解内容,现在推荐的交互形态,很可能会发生变化。一个可能的变化是,你可以自定义你的推荐流。比如你很关注AI,你可以定义告诉平台,“我想看AI方面的最新进展,只要相对可靠真实的,不要标题党”。自定义频道,它可以让你从被动接受推荐系统模糊猜测、众多干扰信息中的推荐流中解放出来,只看你关心的内容。至于自定义频道和当前的搜索、推荐、关注的关系,有机会再展开讨论。

接着到下一个关键点上:用户理解。“微信调 LLM API 读你实时聊天记录判断你目前的关注点给你做相关内容的推荐”,这个想法很好,在不考虑隐私问题的前提下。这里我们先不考虑隐私问题,单纯从产品角度讨论下。用户理解可以拆分成两个层面:一是人的社会经历和性格特质,二是人对经历的反应,这其中又包含长期偏好和短期反应。

先说第一点,社会经历比较好理解,比如我是一个女性(那么我很可能对女性向内容感兴趣),在北京工作,在互联网公司上班,是一名基层打工人(我可能对互联网打工、社畜生活内容感兴趣),我有个男朋友,正在谈婚论嫁(我可能对两性关系内容感兴趣)等等。性格特质也无需多言,由先天基因和后天经历共同塑造。这两个对于现在的推荐系统来讲,都是非常难以明确刻画的,因为缺少信息。
第二大点,人对经历的反应,是人在经历过种种事情后,形成的生活态度、情绪反应,分为短期和长期。长期偏好,包括喜欢什么样的对象、买东西时追求性价比还是享受高消费的快感、喜欢什么运动等等。短期反应,比如今天要聊绩效了,内心很忐忑或者很有信心。在内容领域,用户对内容的偏好,既有长期偏好也有短期兴趣,可以通过与推荐系统的交互逐渐反映出来。但存在一个问题是,只有逐渐的调教推荐系统,系统才会知道。

这里的问题点在于,当用户对某类内容开始感兴趣时,一定是先在生活中发生了什么变化,经历了什么事情。比如我找男友时,我需要的是怎么找到合适的男友这类内容,等我找到男友时,我就不需要前面的内容了,我开始想看如何和对象融洽相处这样的内容。所以微信聊天记录非常有用,因为只要是生活中的大事,一般肯定会在微信里跟朋友提到,而且是发生之后很快会跟朋友分享。微信聊天记录人经历了什么事情,对这些事情有什么反应,是一个人「生活变化的缩影」。注意这里,关键是“变化”。

然而,我们知道,我们并不会什么事都在微信里说。在海边看到大海,在林间听到鸟鸣,在餐厅尝完一顿美食,在花园里闻花香,在家里抚摸宠物猫猫...我们所看到的、听到的、尝到的、闻到的、触摸到的,要比微信里提到的事情丰富太多。按照「记录经历」的角度推演,有什么能记录这一切吗?之前很多的VR智能眼镜,算是提供了一种实时记录 看和听 的途径,还没有把味觉、嗅觉、触觉,补充完整。除了这些经历,还有我们的反应。如果我们用「语言」表达了自己的感受,那一个能方便佩戴、实时记录五官感受和语言的设备,几乎就知道我们的全部了。就相当于有一个“Her”,跟着我们一起经历着一切。

还没有结束。我们都曾经历无言的时刻,那些语言无法表达了我们感受的时刻。人的大脑有860亿个神经元,平均每个神经元有3000个连接,时时刻刻都在产生无数脑电波。人类的语言把这些脑电波凝练表达了出来,实现了人与人之间基本的沟通。我们有时候会不知道自己在想什么,其实更多是在说:不知道该怎么用语言表达所想的。用计算机术语来讲,可能「语言是人类脑电波的Transformer」。真正地理解一个人,应该是去理解它的脑电波。如何理解脑电波,很重要的方式是用脑机接口了。我第一次想到这里的时候,不得不佩服马斯克重金投入脑机接口公司,又是一个多么从第一性原理出发的决定。

好了,这次到这里就结束了。没想到开写之后,竟牵扯出这么多内容。关于推荐系统,如果你还有什么话题想讨论,欢迎在评论区留言!最近打算输出一下,也算是对做推荐产品以来收获的总结。

Yuaaan.: 推荐系统可以如何结合 LLM? 如果只是用 LLM 给内容自动化打标,就显得有点蠢。 但我觉得是不是有些 in-app 跨场景/跨功能联动的可能性,例如微信调 LLM API 读你实时聊天记录判断你目前的关注点给你做相关内容的推荐? 或者我们这么想:现在公域内容的信息分发是搜索+推荐,似乎搜索满足了你更即时的 intention,推荐满足了你更长期的 intention。那有没有可能做更及时的推荐?

1522
成荫
2月前
产品经理真的做不符合自己日常偏好的产品吗,比如我很少刷信息流,我还在做信息流。恐怕是不能。

其实这个道理,两年前就想明白过,最后还是为了生活的安稳,选了这份只是因为工资高的工作。

说到底是没有看清自己的性格,明明非常看中意义感,却做了一件自己觉得没有太大意义的事情。

拿时间换钱,拿钱换时间,怪什么呢,只能怪自己没想清楚啊。

希望未来时时以史为鉴,充满勇气和信念。
30
成荫
4月前
B 站的商业化不强,不是因为它现有条件找不到商业化方式,是 b 站本身管理层的问题。
b 站对部分高知高线吸引力更强,主要满足的是偏干货、获得感的需求。
抖音大部分时候满足的是简单的快乐的需求,更偏娱乐和生活(其实抖音也有大量知识干货类内容,这里暂且不提)。这种简单的快乐,在我去抖音做产品之前,也没有切身的感受,当我去了之后,才发现这种需求广泛且重要。
内容偏好的个性化程度,超乎想象。

Yuaaan.: 其实很好奇公司/产品的商业化和社会影响之间的gap,比如B站带给我的影响远远大于抖音,但B站的收入却远远不及抖音。 当然我是个例,但我确实觉得B站比抖音更能让人变好,当然我有偏见。

12
成荫
4月前
第一次面即,两只潜入字节的即友卧底@一块曲奇饼

不过 u1s1, 这个面即功能有点不好使啊
41
成荫
5月前
最近自己在探索AI方向的过程中有一种感受,刚好今天早上听杨天真的播客时,她也提到了相似的方法,想要快速且准确的了解一个方向该怎么做,最好的办法是:
找这个方向最资深的人聊。

杨天真说她刚开始想做播客时,不知道该怎么做,就去找做播客的很成功的人,还有小宇宙的人,了解做播客的基本逻辑。她把这些她觉得做播客简单的聊完之后,提取了一些方法论:播客是一个沉浸式的陪伴式的内容,在这个内容里面你说出你自己最想表达的部分。有个人建议说就说她自己的人生故事就好了,她的故事是很多人想听的。听到这里,我去翻了翻杨天真的播客,看到第一集就是讲自己的创业故事,拉来几个合伙人,非常真实地在讲创业过程。然后我又看了下播放量,好家伙,30万+。这在小宇宙的单集播放上绝对是数一数二了。

除了去找最资深的人聊,还有一个快速高效的方式是:
读这个方向最资深的人出版的书。
读书可能已经被大家说烂了,但最近还是给了我很大冲击。我最近在探索AI,想了解AI的基本原理,看到大牛李飞飞出版了一本书《我看见的世界》,便买来一本读了读。虽然这本书没有涉及深度学习、大模型的细节构造,但却以一种我从来没有见到过的方式,讲了机器学习的基本思想:像生物的进化一样,观察示例-总结规律-演绎归纳。所以,这也解释了为什么在训练大模型时,示例那么重要。

相比之下,在获取信息方面,最低优的是在网上看碎片化的资料了。要知道,很多前沿信息,都不是公开的。网上公开的,又没有书讲得那么系统。
01
成荫
5月前
有没有朋友了解深言科技,目前面试比较顺利,估计会拿到了 offer ,想提前了解一下现状~
20
成荫
5月前
●想要申请某个岗位,最好的办法是做过类似的工作,并做出了成绩。类似的工作怎么定义呢?
做过相同的应用场景,有相同的工作流技能。比如在抖音做视频推荐策略产品,去小红书做图文内容的推荐策略产品,可以认为是相同的应用场景+相同的工作技能点。
次优是相似的应用场景+相同的工作流技能。比如在抖音做视频推荐策略产品,再转做电商内容的推荐策略,找起来也会比较容易,因为推荐策略的基本流程是相似的。
再者是相同的应用场景+相似的工作流技能,比如都是视频内容消费,从视频推荐转到视频搜索产品,转换相对丝滑。但视频推荐和用户增长策略,两个的工作流就不太一样。
最难的是不同的应用场景、不同的工作技能点。在目前大厂的招人标准来看,从推荐策略产品转做功能产品,是非常困难的,除非是在公司内部同一个老板下面,还有一些可能。

在大厂里面,由于分工的精细化,一个人往往只能做某个细分方向,导致工作流技能非常单一,如果想要将来独立做一款产品,最好是在某个细分方向成为长板后,去到小公司,小公司需要一个人负责更大的范围。
10
成荫
10月前
在讨论业务目标时候,很容易陷入到概念里而非具体的目标中。比如,在内容平台中,会经常涉及作者教育的话题,希望作者能了解平台倡导的方向,发布优质内容。如果只停留在作者教育这个层面,就无法继续拆解下去,其实这里面有几层:
1. 少发低质的内容
2. 不管低质内容,只关心优质内容增量
3. 既少发低质内容,又多发优质内容。

我们往往会觉得,难道第3点不是显而易见的业务目标吗?但在资源有限的情况下,第3这个理想态并不那么容易一步达到,1、2、3,对应的方案是不同的,往往是先实现1或者2,再实现3.

再比如,我们希望更多用户来购买我们的商品,这是个愿景,并不是具体的业务目标。

具体一点,我们希望用户因为什么来购买我们的商品?低价、优质、一流的服务体验?
1. 低价该怎么衡量?商品价格相对于其他平台价格的高低
2. 优质该怎么衡量?优质和低价不一样,优质是个性化的,想要的优质是哪些用户心中的优质?是三四线还是一二线用户?
3. 一流的服务体验该怎么衡量?商家的回复态度?收货时长?退换货的方便程度?体验也是个性化的,对于同样的服务,不同用户的感受是不同的。要着重看哪些用户的感受?

单纯的概念,是无法指导工作的。只有具体到某个指标,才算是把业务目标拆清楚了。
01
成荫
10月前
最近北大出校不用刷脸了,之前是不管进校还是出校都要刷脸验证的。这个改变的动因是学生们反馈出校时大家排队刷脸太浪费时间了,既然能进校,就应该能出校。从学校安保的角度呢,自然是身份验证多一层更好,不排除有些人在进校时钻空子。但这种情况发生的比例很低,可能千分之一不到。为了降低千分之一的风险,浪费千分之999人的时间,确实不太合理。

对这件事有感触并不是因为北大学生敢说敢改变的风格,在学校念书时候,早对这种风格习以为常,学生推动学校改革的例子数不胜数。

感触的是,这件事和前不久工作中发生的另一件事神似。场景是要通过比对A类视频和B类视频,判断B类视频是否违规。而判断B视频是否违规的前提是,要对A视频有个准确的结论。但在那个视频场景下,A视频没有参考视频可以进行比对,只看A视频本身,看出问题的比例很低。那在人力有限的情况下,其实不必要再对A视频都看一遍,不然就是为了降低千分之一的风险,浪费千分之999的人力。毕竟最终的目的是判断B视频是否违规。所以当时我拍板不用看A视频了。

工作中的这个事过去后,当听到北大出现不刷脸的新闻时,我一下觉得两件事不一模一样吗,才发现自己对ROI评估变得这么敏感了hhh
71