即刻App年轻人的同好社区
下载
App内打开
Arielle_Gao
88关注352被关注0夸夸
大家都好优秀喔,欢迎约Coffee
ex TikTok M10N、现阿里打好几份工的牛马、攒够100个想法去创业、的AI产品经理
置顶
Arielle_Gao
2月前
关于我:做过投资、战略、商分、产品,现在是普通AI产品经理一枚,喜欢学习常识、分享观点、健身和小提琴。

话题围绕AI展开,希望可以吸引到更多有趣的灵魂。如果你想了解更多可以点击:

一、精神境界
1.1 用户-产品-方案的稳定才可以商业化m.okjike.com
1.2 什么是一个要解决的问题m.okjike.com
1.3 什么是边界 m.okjike.com
1.4 原子生意和比特生意 m.okjike.com
1.5 如何看待热点(openclaw 死了么)和成长型内容博主m.okjike.com

二、实战
**成品
2.1 第一个agent,比较纯react和plan-execute下不同编排的性能m.okjike.com
2.2 第二个手搓,给一些营销用的监控面板,需要结合业务场景做营销策略和物料适配m.okjike.com
2.3 第一个手搓app,给自己用的健康诊断m.okjike.com
**在做ing
2.4 微调个人模型 m.okjike.com
2.5 A2A架构 m.okjike.com
**Idea
2.6 信息筛选机制设想 m.okjike.com
2.7 模拟人生App设想 m.okjike.com

三、调研向
3.1 播客类产品Huxe m.okjike.com
3.2 交互视频类产品 m.okjike.com
3.3 Kimi agent集群 m.okjike.com
3.4 Suno m.okjike.com
3.5 用户访谈类产品 m.okjike.com

四、产品向
4.1 产品的用户阻力 m.okjike.com
4.2 微信的社交m.okjike.com

五、交互向
5.1 交互和场景需要适配m.okjike.com
5.2 Taste、设计m.okjike.com
5.3 内容产品的UI m.okjike.com

六、技术向
6.1 Agent模式下的想和做分离m.okjike.com
6.2 Agent框架和一些OPC判断m.okjike.com
6.3 区分replan和router m.okjike.com
6.4 设计记忆系统m.okjike.com
6.5 chatbot-react-plan的区别m.okjike.com
6.6 Accio m.okjike.com
22
Arielle_Gao
2天前
现在的问题未必是以后的问题,但从解决现在的问题中学习到的know how可以用于解决以后的新问题
00
Arielle_Gao
2天前
这一期真的不错,讲数据相关的内容,有了一些实践之后对嘉宾说的理解更深刻了
张小珺 谢晨 数据综述
www.xiaoyuzhoufm.com
00
Arielle_Gao
4天前
有些真是痛的领悟,这两天训了2%的数据才知道,为什么会吐一堆废话,为什么会逻辑混乱,知识为什么要做成图谱,为什么模型会不学好,prompt到底有什么用和限制,架构到底是用来干什么的,以及训到最后可预见的终局是什么……
90
Arielle_Gao
4天前
微信输入法,以后是不是可以在用户授权的情况下,读取聊天记录帮你回复
40
Arielle_Gao
4天前
训自己的模型有感:能让模型发挥作用的前提是没有模型也有生态位,不然什么工具都没用。最终最有护城河的就是一些常识,是一些需要精雕细琢的古法,是时间的复利,至于技术、资金、做通用工具可能这些词都不在长期护城河范畴,有交叉但大部分不能。
00
Arielle_Gao
5天前
有个神奇的观察,好像上一代的老大在新一代还能是老大或者老二的位置,但是再下一代就不一定了。但想要不被新一代冲击掉生意成立的前提条件,在不追求利润的时候去做重构是很难的事情
00
Arielle_Gao
5天前
今天是深度和大模型抗争,训练小模型的一天(蒸馏把我蒸出幻觉了)
00
Arielle_Gao
5天前
一个古老又有趣的思路:挑选了几篇自己觉得还不错的思考,整理成instruction-output格式,构建virtual me的数据集,等数据积累够了再拿去给小模型微调,或许就能变成一个我在某一个特定方向的plus。

在这件事情上其实没有完全相通,但认识到,其实不是每一件事情都能完全想通了才能干,有时候就是一边探索、一边寻找意义。于是我想,是不是可以把自己写过的思考沉淀下来,尝试看看能做什么事情。

一些简略的思路:
1. 从牌桌角度,这个事情如果大厂做就要求规模化、要求快,但我拿10篇文章洗了几轮数据之后发现,要想让模型学到精髓就必须要确保提供的样例精准,是个精耕细作的过程,大厂可能不会去做。同时这个事情如果个人去做,那么也要要求长期沉淀、有耐心孵化。

2. 从成本角度,最大的成本就是时间成本,前期产出数据的工作可能比较重,要积累到可以微调级别的数据量可能需要一年。如果积累成功后,再租服务器的成本相对可控,且小模型大概率就能调出一个版本,避免了大模型token费和搭建复杂的架构。不过不管是大模型+架构,还是小模型微调,都是需要对数据进行预处理,比如文章中的口水词、不客观理性的表达、主观偏见,都要先提前处理掉。

3. 从订阅角度,随着生命周期的拉长,新的产出会纳入到个人数据库,可以通过定期训练模型或者短期RAG的方式给用户提供新内容,避免一次性购买下产品无法迭代进而导致用户兴趣度下降的问题,同时更新机制也能防止数据被抄袭。

4. 从数据角度,在数据中加入逻辑链,让模型学会推理而不只是背答案。要避免逻辑冲突、短期高估自己的产出效果、碎片化信息稀释专业度、不同类别要分开等。但坦白这个过程极其繁琐,因为每一篇文章的逻辑交叉,导致有可能大模型的注意力发生偏移,所以需要对同一篇内容反复提取、并对出来的精华再对比,才能和我的逻辑对齐。
10
Arielle_Gao
6天前
在想乔布斯说的The doers are the major thinkers. The people that really create the things that change this industry are both the thinker and doer in one person. 貌似做agent交付这个道理更突显了,也就是要留有一定时间做一线执行工作,也要有一定时间思考价值和方向,成为thinker&doer,仅思考不做就会陷入幻觉、不够落地、没法知道具体怎么做、也更不知道沉淀的know how怎么复用,要深度思考和动手
40
Arielle_Gao
6天前
Agent-to-agent架构

最近将多渠道营销项目升级成了 A2A 架构,其实坦白讲不确定这是一条能跑通的路,而且在灰度这段时间总是出各种各样奇怪的问题。

至今有一点跑通了,就是如何定义大脑 agent subagent 的边界,subagent 接收来自大脑agent 的主题,然后由 subagent 在主题内进行发挥。这样做的原因是,不同渠道所适配的内容是不一样的,同时隔离上下文减少错误输出。但这样可能带来的问题是,一个错误的大脑决定会在执行层面放大,要落地所需要的工程量就会比较大。

不过也同时在启动做类似 agent evolver 的概念,看能不能将 executor->evaluator->evolver 串联起来,直接让系统自己进化。
00