即刻App
年轻人的同好社区
下载
App内打开
江不饿
754
关注
179
被关注
0
夸夸
前百度贴吧产品经理 负责流量分配规则
成都苍蝇馆子街边斗士,测评 500➕馆子
现小红书抖音流量白盒玩家,量化方式做爆款
ai 工作流研究
江不饿
3月前
增长其实挺难的,找路径需要很强的嗅觉就跟干刑侦一样的,写内容需要有品味,品味又决定了能不能给用户带来更美好的东西
罗杰儿Jieer: 合作到了能力无底洞(不是我工作中最讨厌的人群标签) 我之前一直说增长是个人就能干,想干好就能干好。 这话我收回。 从此以后,你们碰到跟我合作过的(or能分辨出曾经跟我合作过的),别默认我和以前一样一味只是夸or最负面说“可以的,只是性价比不够高”了。 合作过了很差的个人。如果你们问到了好的我一定狠狠夸,问到了天雷,我会开麦告诉你们:很差,有多差,多toxic,多不负责,多不靠谱,多让全组吃不了兜着走,务必避雷。
4
0
0
江不饿
4月前
即刻上这么多小红书营销的朋友是不是大家都没开灵犀平台,建议可以去开一个就什么都是明牌做了
4
9
0
江不饿
8月前
jojo 我不想做人了 //
@胭脂王
: jojo 我不想做人了
戴某DEMO:
0
0
0
江不饿
9月前
支持下
臀总: 好像某个播客评论区推荐了出梅的产品,最近多了很多进店,不做营销的小品牌万分惊喜。为表感谢,专门制作了一个春季优惠200-40惊喜券,可以叠加天猫淘宝跨店,算是当下时间入手的最优活动了。 天猫淘宝搜索框输入:24511100,即刻领取!(带货也不忘带个双关梗)
1
0
0
江不饿
9月前
云中江树: Claude一键绘制AI科普图 不会画图的看过来~ 提示词和用法 https://mp.weixin.qq.com/s/FbPLWYtqY2URuuylEyJVKg
0
0
0
江不饿
10月前
junyu: 分享一下目前我的测试结果,均为自己(除了海关那个)最近一个月实际生活/工作中的需求。懒得排版制图了凑合看吧… 说明一下,我测试都是努力做基于真实场景的定性测试,也不和同类产品比,只和没有这个产品的时候比。 (prompt均为英文,为阅读方便加了中文翻译) 研究类: 🟡 制表整理 OpenAI 各模型的历史价格变化(使用了 High Effort) > I would like to build a detailed spreadsheet to track OpenAI's every pricing change for each model. > 我想制作一份详细的电子表格,记录 OpenAI 各个模型的历史价格变化。 这是我用来测试其它 Deep Research / DeepResearch / DeepSearch(以下简称Deep Research...)的任务,也是我实际工作中想做的事情。我给 Manus 的 prompt 更模糊,删去了具体细节要求。结果出人意料 —— Manus 无需干预就能按要求交付结果,至少在形态上,这是各类 Deep Research 产品都没有做到的。当然,数据准确性难以验证。我设想如果这是交给实习生的工作,验证方式会是:一是抽查数据,二是让实习生详述收集过程并相信他不会偷懒。Manus 对收集过程的描述不错,但确实无法相信它不会偷懒。我自己做的时候是用 Wayback Machine 去找的,Manus 从自己读的 LinkedIn 帖子中学到了这个方法,但称自己无法访问该工具。 我向 Manus 推荐 Wayback Machine 后,它拿出小本本记了下来。 回放地址:https://manus.im/share/dvGtPZ7TzZAiYClbejAyWw?replay=1 ✅ 为设计师推荐新显示器 (使用了 High Effort) > Help me find a monitor. I am a UI Designer living in Beijing. I don't know what criterial I should look at, so please ask my preference if you are not sure. The resolution must be at least 4K. > 帮我找一台显示器。我是一名在北京工作的 UI 设计师。我不确定应该关注哪些选购标准,如果你有不确定的地方请询问我的偏好。分辨率必须至少是 4K。 这是我最近的实际需求(在即刻也发问过)。我特意提交了一个模糊的问题,这符合真实场景,因为决策标准往往是在研究过程中才逐渐明确的。Manus 在这项任务中表现出色——它主动探索显示器的选择标准,适时提出追问,最终给出了符合实际需求的建议。不过由于它只能进行网页搜索,无法访问小红书、什么值得买等社交媒体平台,导致信息范围(尤其是价格信息)较为有限。一些在这些平台流行的产品也因此无法进入视线。当然,这未必是坏事,某种程度上反而避免了广告的干扰。 回放地址:https://manus.im/share/Gba6tQTxWpzKBgSvMKhxeC?replay=1 执行类: 🟡 筛选 YC 最新一批 AI 产品并代为注册 > Visit the official YC website and compile all AI products in the latest batch, and sign up all of them if possible (my email address is ■■■■■■■■■@gmail.com). After that, compile product information into a clear, well-structured table, including whether you have signed up for me. Be sure to find all of it. > 访问 YC 官方网站,整理最新一批中所有的 AI 产品,并尽可能为所有产品进行注册(我的邮箱是 ■■■■■■■■■@gmail.com)。之后,将产品信息整理成一个清晰、结构良好的表格,包括是否已为我完成注册。请确保找到所有相关产品。 找到了27家目标公司(存在遗漏,毕竟新一批 YC 有 200 多家公司,不可能只有 27 家做 AI 的),在预算耗尽前尝试注册了其中 12 家:6 家注册成功,2 家注册失败,4 家官网无法打开。尽管信息遗漏较为严重,但早上打开 Gmail 收到各种注册确认邮件时,仍然大为震撼。期间不时遇到验证码,Manus 会请求用户协助完成。团队说因为现在资源紧张,超时控制比较严格,之后扩容后会缓解。 回放地址:https://manus.im/share/8SLQx2o1eJx8jOPY9p6hoN?replay=1 ❌ 访问 Slack 账户并导出全部历史消息 > Login to my slack account and export all my data to Google Drive > 登录我的 Slack 账号并将所有数据导出到 Google Drive 尽管任务未能完成,但体验良好——Manus 清晰地说明了它无法执行需要个人账户权限的操作。这与 Devin 的做法不同,Devin 会让用户在它的电脑上登录账户。 回放地址:https://manus.im/share/lphujtY4j2lGwyAFP3qHhL?replay=1 开发类 ❌ 制作孩子用的学习任务抽奖转盘 > Could you help create a simple, beautiful spinwheel for my kid to decide what academic programs to take each day? Requirements: … > 您能帮忙为我的孩子制作一个简单、美观的转盘,用来决定每天要进行哪些学习项目吗?具体要求:... 这是典型的 Devin 可以做的事情。我在需求中忽略了说明要直接在网页上运行的要求,但 Manus 默认会这样尝试。不过测试时 Manus 遇到了技术故障,只能提供源代码,我需要手动将代码复制到 IDE 中运行,甚至无法提供打包好的代码。 顺便说一下这个任务提给OpenAI Operator后,人家直接给我找了一个现成的网页... 也不是不行,我现在就是这么干的,就是广告有点多... 回放地址:https://manus.im/share/0eIcAXUlBMMrKG5Amy3ZOC?replay=1 数据采集 ❌ 到海关官网获取 2019 年 1 月至今中国各地区对各贸易伙伴的商品月度出口额 > Please go to the official website of China Customs to obtain the monthly export value of each region in China to each trade partner for each product from January 2019 to the present. > 请到中国海关官网获取2019年1月到今天为止中国每个地区对每个贸易伙伴在每种商品上的月度出口额 这是我的经济学家朋友交给研究生的任务。在提交给 Manus 时,我没有直接提供准确网址,所以增加了任务难度。Manus 找到海关总署的另一个网址开始了任务,由于该网址提供的数据不够完整,导致 Manus 获取的数据虽然准确但不够全面(它未能理解需要按地区、贸易伙伴、商品这三个维度同时拆分数据)。当我后来提供了正确的网址时,因预算已耗尽,任务只能中止。 回放地址:https://manus.im/share/Hr5cqi4oS2QOtNi63j3KkY?replay=1 🟢 下载乐高 9656 说明书 > Find and download instructions / handbooks for LEGL 9656 set > 寻找并下载乐高 9656 套装的说明书/手册 完成效果出色,远超人工效率。 因为这个套装较旧,在乐高官网搜索不到,而且说明书分为了十多个文件,我自己尝试时花了一个多小时仍然没有找到,最后是找人要了一份。Manus 一次给出正确的结果。 回放地址:https://manus.im/share/JuWNl1Zg3jxK3BRKb7J9th?replay=1 ❌ 清理公众号文章格式并去除广告 > Here are a list of articles, please fetch them and organize into well-formatted markdown files for me. Make sure you remove boilerplate content at the beginning and end of articles, and remove ads. Here are the first batch of URLs: … > 这里是一些文章,请帮我获取它们并整理成格式规范的 markdown 文件。请确保删除文章开头和结尾的固定格式内容,并移除广告。这是第一批网址:... 初看效果令人满意,但 LLM 过于勤奋,自行发挥做了许多额外工作,比如自行添加小标题。在审阅时我发现一段内容缺失了——原来是 Manus 误将其判定为广告删除(我的本意是只删除开头和结尾的明显广告,而保留文中植入的广告)。这说明 LLM 在处理需要严谨把控的工作时仍有困难。另外,由于 Token 消耗太快,在预算用完前只完成了两篇文章的处理,实用性不高。 回放地址:https://manus.im/share/dFDdKHMDXevU4EluB6u3i9?replay=1 🟡 收集几个 app 的官方图标 > Compile the latest official icon of these apps with resolution of at least 512px. Background should be transparent, bitmap (png preferred). If there is a single color version, use that. [List of apps] > 收集这些应用的最新官方图标,分辨率至少512像素。背景需要透明,位图格式(最好是png)。如果有单色版本的话,请使用单色版本。[应用列表] 在 8 个需求中正确完成了 4 个。一开始去一些素材库找,我明确要求从官网找。过程中帮忙输入了几次验证码。错误的结果中,一个混淆了 logo 和 icon,一个没有找到,另外 2 个不符合格式要求——提供了SVG格式的文件,而且 AI 仅是简单地将文件后缀改为 PNG,试图蒙混过关 回放地址:https://manus.im/share/3euKtS83CTIVMAn1FkNsVB?replay=1 文书处理 ❌ 比较编辑批注稿和原稿,标记差异 > I'll share a draft of an essay along with a corrected/marked version provided by my editor. I'd like you to highlight the changes in my original draft using markdown formatting. > 我会分享一篇文章的草稿以及编辑提供的修改/批注版本。我希望你能用markdown格式在我的原稿中标记出这些更改。 初始误解为需要总结差异,经澄清后虽然正确理解了任务要求,但仍无法完成。系统只能标记出少量改动,还错误地将一些未修改的内容标记为删除,且无法识别手绘批注符号(这确实较为困难)。此外,由于 Manus 无法直接访问我的电脑,我必须手动导出文稿后上传,这增加了额外的工作量。 (版权问题这个不放回放了)
0
0
0
江不饿
10月前
学习了
艾逗笔: 以 manus 为例,拆解以 multi-agent 为基础的通用任务智能体的工作流程: 一. 意图识别 1. 获取用户输入内容,进行必要的意图识别和关键词提取,比如用户输入的是“想去日本旅游,需要一个旅行计划”,拆解之后得到的关键词是: japan-trip,任务类型为:travel 2. 如果用户输入的需求比较简单,不能识别用户的意图,此步骤可以引导用户继续对话,补充更多的信息,或者上传文档 / 图片等资料 二. 任务初始化 1. 用识别出来的任务关键词创建任务文件夹,启动 docker 容器,为后续的任务执行做环境隔离 2. 任务执行过程中的内容产物,写入到任务文件夹,任务结束之后清理 docker 容器 三. 步骤规划 1. 使用意图识别的结果 + 补充背景信息,请求一个推理模型,对任务进行步骤拆分 2. 将任务拆分的步骤信息,写入到任务文件夹的 todo.md 四. 任务执行 1. 遍历任务文件夹中的 todo.md,[ ] 表示待执行的任务,[x] 表示已执行的任务 2. 取出待执行的任务,带上任务上下文信息,做一次 function call,这里带上的 function tools 是系统内置的可以执行不同任务的 agent,比如 search agent / code agent / data-analysis agent 3. 根据 function call 的结果,调度指定的 agent 执行任务,把执行过程中产生的内容,写入到容器中的任务文件夹 4. 任务执行完,由主线程,更新 todo.md,继续下一个任务 五. 归纳整理 1. todo.md 里面的任务全部执行完之后,主线程针对用户的初始需求,做一次整理输出 2. 把任务的内容产物,给到用户浏览或下载(文档 / 代码 / 图片 / 链接等) 3. 收集用户对任务的满意度 ---- 整个方案理下来,核心在于执行任务的 agent 设计,以及主线程的调度流程,以 search agent 为例,在处理“日本旅行计划”这个任务中,主要的执行步骤: 1. 拿到 japan-trip 等关键词信息,调用谷歌第三方 API,获取 10-20 条搜索结果 2. 模拟浏览器点开第一个网页,浏览网页内容,获取网页文本内容 + 浏览器截图拿到网页视觉信息 3. 调用支持多模态输入的模型,输入当前任务要求,从当前浏览的网页中提取有效信息(是否有符合要求的结果,如果不满足要求,返回下一个该点击的 button 元素) 4. 模拟浏览器点击 + 网页滚动行为,拿到更多的网页内容 + 视觉信息,重复几次,直到收集到的内容满足任务要求为止 5. 把收集到的内容保存到任务文件夹 这个 search agent 的核心在于模拟用户浏览网页行为,需要用到无头浏览器和多模态模型。 code agent 和 data-analysis agent 相对而言比较简单: 1. 根据任务需求,创建本地文件,写入代码(python 代码做数据分析,html 代码做视觉呈现) 2. 通过系统调用执行代码,把执行结果保存到任务文件夹 3. 通过 code-preview 服务,预览 html 文件的内容 --- 此类 multi-agent 产品,还有一些改进的空间: 1. todo.md 的多个任务,是线性依赖关系,可以使用 DAG(有向无环图)实现更加复杂的任务依赖 2. 需要引入自动化测试 agent,对任务结果进行判断和矫正,如果对某个步骤评分过低,需要回溯到之前的某个任务节点重新执行 3. 允许全自动 + 用户介入的混合模式,在某个步骤执行完,先寻求用户反馈,如果几秒内没收到反馈,则自动继续运行 --- 整体评价:manus 在工程层面做了很多工作,整体交互比其他产品好很多。技术层面,依然是没什么壁垒,对模型有比较深的依赖: 1. 也许有个小模型,做任务执行前的意图识别 2. 任务规划和推理,用 deepseek-r1 3. 图片识别 + 代码生成,用 claude-3.7-sonnet token 消耗会很高,能不能广泛用起来,取决于谁来负担这个成本。 最终的任务准确性和用户满意度,还需要更多的案例来说明。
0
0
0
江不饿
10月前
时代变迁,用系统思考抓住主要脉络比较关键
艾瑞克丁Eric: 与明浩闲谈 2025.02.18 庄明浩,一个毕业之后就开始做一级市场的同龄人。 明浩和我聊了一个多小时,有很多见解我们有高度共识,有些观点我也是第一次听,所以我一一记录下来,作为生活闲谈,2025 的开篇。 屠龙之术和二级市场的年轻人 明浩自己有一个观点,在2015 年前后,入行做一级市场投资的年轻人,其实都有一种干一票大的然后上岸的想法,这是因为那些年里市场上所有的故事都是这么写的,他们不知道过去这个行业遭过的霜冻,也没有预料到之后十年的不景气。当移动互联网新兴的时候,大家都在讨论,需求,用户,增长,产品,这些仿佛是一身屠龙之术,但是当时代不再的时候,空有屠龙之术却没有了龙。 而在这其中的年轻人,他用了“药渣”这个词,一批又一批的年轻人被安置在某一个特定的行业,燃烧自己,当这个行业不景气的时候,没有钱投资的时候,他们就只能赋闲。这多少也是有些无奈。 其实屠龙之术,我也有这个感觉,从电商精细化运营到今天投放全黑盒,从人货场的迭代,到今天价格是流量最重要核心关键,仿佛当年学的在今天也可以被轻易取代了。但是我和明浩最终有一个共识,可能屠龙之术在相同的场景在没有了用武之地,但是换一个地方,可能也能发光,就像 AI 的应用,也需要回到场景需求,产品迭代,用户增长。在海外的电商兴起的时候,也需要看 KOL 管理,内容升级,投流运营。拓圈,还是很重要。 细分市场业务中中国的结构性机会 明浩目前在趣丸,这是一家做游戏语音的公司,用户稳定,天花板明显,但是真的赚钱。他和我形容全国手游用户,打团战的就会需要语音交流,他们的用户就是那批重度王者荣耀类的游戏用户中愿意开口也愿意付费的人,1000 万左右,但是人群稳定,非常赚钱。我不禁想到,中国真的是很绝的一个国家,因为人口基数,所以再小的机会如果可以垄断,那也是能有高毛利的。 AI 大模型和 AI应用 大模型是太阳,是能源,如何能更好地产生应用,非常取决于导管本身是不是能帮助能源本身完成收敛和稳定。 搜索是AI 应用中最容易想到的场景,目前有人在做商业搜索,AI 算法推荐,也有人通过埋点或者 hack 对于大模型进行影响,最终产生对自己有利的结果。有一个挺疯的点是,我们提到 Anker 的 PDD 上的 PDP 已经开始使用 DeepSeek 和豆包推荐的主图封面,不得不说,不同时代下,就是会有不同的内容。 知识体系管理,是一门艺术,也是一门生意,AI 的介入起到对于创作者帮助这件事情是必然也是必须。 聊到 AI 6 小龙的时候,我们也都很同意,在一个未收敛,不稳定的技术之下,大家不要事后诸葛说探索的人有哪些是不对的,毕竟在大时代背景都不稳定的情况下,个体的决定多少是要靠运气才能看到是不是能上船的,凡事说自己料事如神的,我自己觉得都是骗子。 字节本身的惯性和恶 说到移动互联网和今天的 AI,字节必然是会被提起的,明浩用火星人来形容张一鸣,没有情绪,只有理性,在这样的创始人的带领下,他带出了字节和抖音,但是真的可以完全和情绪不产生关系吗,显然很难,因为今天的抖音早就成为了群众的情绪的一部分,所以你看 All hands meeting,所以你看 PR 被推倒了风口浪尖,封掉张兰,汪小菲,封掉内容作假的账号,这些都是字节的自救,只是当组织足够大的时候,没有那么容易掉头。 人 我总是喜欢最后落回到人这个话题本身,明浩作为 15 年+的投资人,创业者,跟过不同的老板,也见过不同的人,我们聊到王思聪,他说,校长是一个早就知道自己应该扮演什么样的角色,并且清楚知道自己应该如何扮演,也愿意去扮演的好人。我们聊到普世价值上人的善恶与成功,他说,这世界上很多人你喜欢的,大概率做不了大哥,可能也不会特别成功,真正能成功的也不一定是你喜欢的人。 所以其实都是选择。还要感谢潘乱@潘乱 Yuan Ding @rosicky311_明浩
1
0
0
江不饿
12月前
发来贺电
瓦恁: 今天是公司的十岁生日,谢谢每一个正在建造和参与过建造的同事,也欢迎优秀人的加入一起建造 Make something useful, beautiful, wonderful.
0
0
0
江不饿
1年前
小红书的算法机制导致素人也有很大的话语权,这个就跟当年的贴吧机制相似,所以大部分共识来源于相同群里的共同困境而抒发的情绪和观点,然而答案就是整个笔记里的所有创作共同产物,所以怎么通过文字识别场景和情绪找到同类人是这一代分发引擎的核心。目前大模型大家关注的重点还是推理答案而不是去理解一一个群体的困境。
陈南: 最近在思考用户对AI总结内容的信任度时有了一个很重要的认知:AI总结的内容很难让用户感受到共识,而人类编写的内容可以。 小红书这几年慢慢成为了旅游内容行业的一匹黑马,有很多人在小红书上找旅游攻略,包括我。我们在小红书上搜攻略时,很少会因为一个单独帖子的正文就决定了整个行程,我们会刷很多目的地相关的帖子,不仅会仔细看帖子的正文,还会看看评论区里“有经验的用户”的回复。在这个过程中,表面上我们是在寻找更多的信息,但实际上,我们是在寻找群体观点中的共识。 从众心理是一种植根于人类基因的底层倾向,当一个人出去旅游时,TA思考的第一个问题是:其他人都去哪里玩?大多数人的旅游是打卡型的,先逛完了大众共识中的网红打卡点,才有心思去追求小众。如果连最大众的景点都没去,很多人会担心回去之后都没有可以跟朋友吹牛逼的谈资。我们对于自己所规划的行程的信心,往往是在浏览了多个反复印证的信息源后才建立起来的。 那有朋友可能就会想,我让AI总结一下“共识”不就可以了吗?这里就又引出了一个很重要的点,我们似乎更信任那些能够积极参与共识建立过程的信息,而不是接受一个现成的共识。这里的核心不在于总结的内容质量如何,而是AI总结的内容没有“人味儿”。当我在小红书上浏览一个个的帖子时,我能看到作者的昵称和头像,这会给我带来一种很明确的感觉:对面写这段文字的人是一个真实的个体,在评论区,我会感觉到有一个真实的人类在分享TA的观点,这种“鲜活感”是非常重要的,它是信任感的根基。在旅游这种重线下体验的场景中,去过那个地方的人的真情实感所传达出的“鲜活感”,远远超越AI,那也就意味着,用户对AI总结的内容的信任度要差几个数量级。 除此之外,对于大多数人来说,一年也就旅游一两次,每次旅游决策往往需要用户用大量的钱来投票,“信任度”在需要谨慎决策的场景中尤为重要。 当然,现在的各种AI应用正在尝试用各种方式来提升用户对于信息的信任感,比如,Perplexity和Microsoft Copilot 会展示某个观点的信息来源,也会在下方列出参考的文献列表。这里我不会一棍子打死,说这种模式不ok,因为不是所有的场景都需要共识。 简单来讲,可以分为两类:事实查询类场景和以经验为基础的场景。 对于总结新闻事件、查询某个编程语言的语法、查询天气预报这种事实查询类场景来说,它其实并不需要共识,只要AI总结的信息足够准确,并且能够列举出信息来源,大多数情况下就可以满足用户的需求。 但是,在以经验为基础的场景中,共识就非常重要。小到餐厅、酒店的挑选,大到教育、职业道路的决策,都需要借助大量信息背后的共识来形成决策意见。与其相信一个AI能给予合适的指引,大多数人会选择在真人的发言中探索答案。 归根结底,共识的背后是信任问题,我们会本能地认为,大多数人都认同的东西,大概率是可信的。那么,除了共识之外,还有什么办法能带给人信任感呢?《影响力》一书给出了一些答案,但这些方法是否还适合这个AI时代,或许需要我们自己去探索。
5
0
1