即刻App年轻人的同好社区
下载
App内打开
许涵之
51关注2k被关注5夸夸
AI 产品经理
前腾讯产培
置顶
许涵之
11天前
vibe coding 了一个练手的小游戏,网址如下www.tenchess.xyz。规则很简单,但玩起来还是挺难的。

分享给几个朋友试了下,如果不靠蒙的话,甚至没有人在 10分钟之内能赢过 AI。感兴趣的朋友可以试一下🤪

TenChess

112
许涵之
3天前
AI 极大地降低了内容的生产门槛,但这反而让“人”的介入变得更重要。AI能一分钟做出一个视频,但如果它和我没有关系,那就意味着别人也能创造出来。我其实没有向别人展示的欲望。它得是一个"没有我就没有"的东西,我才敢向别人炫耀——因为你做不出来,只有我能做出来。

哈佛商学院曾做过一项经典研究,发现人们对自己投入劳动组装的家具(哪怕只是拧了几颗螺丝),出价意愿比非自己组装的高出 63%。

我和 AI 之间的桥梁如果只是一句 prompt,信息熵被急剧压缩又被扩展,然后 AI 用自己的“默认世界观”去补全,那个作品和我的关系就太弱了。我和 AI 之间得是个比较宽的桥梁,我通过输入、拣选、甚至个人偏见去影响了 AI 创作的结果,这个作品和我的关系才能密切,也才能具备打动人心的力量。

现在的 AI 创作就像 19 世纪的摄影,那时的画家也会嘲笑摄影师:“你只是按了一下快门,光影是物理学画的,不是你画的。”但随着摄影本身的发展,决定“何时、何地、对着什么”按快门,也成了一门艺术。

不过如果矫枉过正,人的介入太深,又会损失 AI 创作降低门槛的便利性。恰到好处的产品设计可以让 AI承担繁琐工作和提供灵感火花,而人类则注入独特见解和价值取向。唯有如此,既充分利用AI降低门槛的便利,又确保“没有我就没有”的人文精神,才能创造出既高效丰富又富有灵魂的作品。

好像还没用到过能够尽可能获取我的上下文,尽可能让我指导创作,但同时又能把这种介入关系处理得恰到好处的 AI 创作工具,可能是我孤陋寡闻了,大家有觉得符合这个理念的产品不?
10
许涵之
5天前
一开始觉得 Claude Skills 并不是一个特别神奇或能惊艳到我的东西,后来也逐渐感受到它的一些厉害之处。

它的本质其实是一个(由AI agentic 地)按需加载系统提示词(含可用工具及其描述)的范式,这种范式很多产品可能都在同步探索,只是没有公布出来(比如 ChatGPT、Gemini 都一定是有做的)。

很多产品在用户选择不同开关(如“快速回复”或“深度思考”)时,其系统提示词是不一样的。LangChain RouterChain 也依赖外部的分类模型(Classifier)或 Embedding 检索来决定加载哪个 Prompt。但这些都并非按需加载,而是“隐式工程路由”。

随着模型能力的提升和用户需求复杂度的提高,之前为了提高模型智能上限而采用的工程方法,反而开始制约模型的智能,为了更好发挥模型 Agentic 的能力,由 AI 按需加载提示词的理念其实迟早会被提出来成为共识和落地实践。

比如 Manus Langchain 9 月份分享的上下文工程五大策略中其实就已经隐含了这种理念。

Manus 后来升级到 1.5 版本之后,把 Ask、Agent Auto 模式以及对质量、速度的选择都取消了。这些模式背后可能涉及不同的模型、系统提示词、AI 可用工具和行动空间,任务的首次选择与后续切换,背后必然有一套 Agentic 的路由方式,这实际上就是“按需加载”理念的实践。

回到 Claude,观察之前 Claude 3.5 3.7 被公开泄露的提示词可以发现,其中大量关于 Artifacts 的内容是常驻在提示词里的,当时还并没有做按需加载。

再后来,Claude 推出编辑文档、PPT Excel 的能力时,我发现AI每次做这些操作都得先读几个文档学习一下。当时我觉得很奇怪,甚至觉得这种处理方式有点丑陋。为什么要这么搞?这些知识不应该直接预置在提示词之内吗?为什么每次都要重新学习一下,不是显得很愚蠢、很多余吗?

那时候我不明白,现在才理解,其实他们在那个时间点可能就在做 Skills 的原型。

这说明他们也有一个演进的过程。

因为我也处于这样的认知演变过程之中,所以并没有觉得惊艳。

我觉得真正厉害的是,Claude 作为一个模型厂商,拥有一个更通盘的视角,把这件事情做成了一个生态。

Skills 本身是有许多缺陷的,比如它只能增加提示词但不能卸载提示词,随着任务复杂度和 Skills 加载量的提升,模型能力还是会下降,比如它没有增加可调用工具的空间,更多是领域知识的指导(这部分 MCP 其实可以补足一些)。但这种复杂度的牺牲换来的是可拓展性的提高。

Manus 更多是在做自己的事情,虽然有相关的技术分享,但没有将其做成一个所有用户和开发者都可以复用和传播的生态。而 Claude 不一样,他们做的 Skills 是一种非常简洁、通用、易于理解的能力,同时具有极大的拓展性,并且大概率在模型层面上做了优化,让模型能更好地理解和调用 Skills,将一种内部的工程最佳实践转化为行业的互操作标准

看到很多人都在宣传和传播这种使用方式,我觉得这才是它真正厉害的地方。
13
许涵之
5天前
思考题,你选哪个和哪个?为什么?
10
许涵之
5天前
转给女朋友试用了一下,有几个正面和负面的反馈点:

1. 正面反馈:
(a) 作为女孩子,她觉得这个产品对她有很大帮助。她之前其实想过几次发年度照片,但一直没有行动,这个产品让她行动起来了,她刚刚已经把朋友圈发了
(b) 如果是她自己选照片,顶多只会选几张组个九宫格,但 AI 的总结能够把更多维度的信息呈现出来

2. 负面反馈:
(a) 一键整理的效果还是不够好,她不敢使用
(b) 年度报告里有很多页面比较重复,比如好几个页面都在展示年度精选照片
(c) 手工替换年度照片之后没有被保存下来,她还得再重新替换一次

总之,瑕不掩瑜,十分推荐👍

Alchian花生: 新app「小猫相册」上架后,我又花了一整天时间收集反馈,用Claude Code迭代优化产品。 第二个版本已提交,相册整理功能和年度回顾的城市准确度大幅提升。 我让cc算了下代码量,总共4万行。又让他预估下如果人类手写的话需要的开发时间,他预计5人开发团队大概也需要3-4个月。 我实际是大概全情投入了一周多一些的时间。做新项目时,用AI开发20倍+的效率提升是问题不大。

21
许涵之
6天前
所以我一直说,NotebookLM 做 PPT 这么火,其实并不是在切换存量的场景,而是在创造增量的场景。

PPT 本身是一种视觉主导、分镜式、多步节奏控制的表达方式,其实是所有人都希望消费的。只是过去创造它的门槛太高了,所以在非办公场景下,这种创作需求之前被压制了。m.okjike.com

rosicky311_明浩: 这几天遇到好几篇长文内容都看起来很累 因为是自己所关注的方向,又是前沿的探索,所以只能逼着自己读,读的过程中就在想要是能做成可视化表达就好了…… 然后就都交给了notebooklm,结果是真的好,感谢AI……

01
许涵之
8天前
试着把反问变成疑问,反问是情绪的起点,疑问是思考的起点。
00
许涵之
15天前
Google AI Studio 建了一个网站,想绑定到自己买的域名上。

起初的尝试并不顺利:
1. Firebase 发现无法同步某些变更到 GitHub
2. Vercel 发现部署始终不成功
3. GitHub Page,预览显示不出来

最后才发现,原来 Google Cloud 自己就有映射网域的服务。直接在 AI Studio 部署到 Google Cloud,再映射到自己买的域名上就可以了,而且操作还更简便。

这一瞬间突然感觉到了谷歌的强大之处,现有的生态实在太成熟了,好像没有哪家公司能同时做到?
82
许涵之
29天前
@Gavin_C. 面即,他说“宣传 AI 能将效率提升20-30%,在我看来有点保守。这有点像给坐绿皮火车的人一个高铁。但对我来说完全不一样——是火箭。原来所有人想的是从上海怎么更快来深圳,而我现在想的是能去火星。”

我深以为然,我们都知道用户价值 = 新体验 - 旧体验 - 替换成本,有时候旧体验和替换成本都太大了,以至于好几倍的新体验都难以 PMF。但如果要做的这个事情就没有旧体验呢?我只要有一点新的体验,就可以带来很大的价值。

当出现一种新技术的时候,与其思考怎么用它优化现在的需求,不如去想怎么用它发掘潜在更广泛的需求。探索增量市场,而非竞争存量市场。

Adobe Photoshop 是给专业设计师(存量)用的,但 Canva 没有切走 Adobe 的高端蛋糕,而是让全球 2亿+ 月活用户(行政、老师、个体户)拥有了设计能力。

另一个案例是马戏团行业被 Cirque du Soleil 彻底重塑:后者并未与传统马戏团肉搏,而是融合戏剧创造了“成人看得起”的全新体验,结果吸引了原本从不过来看马戏的新客户群,票价溢价数倍仍大获成功。

真正的技术红利往往来自"做以前做不了的事",而非"把以前的事做得更好一点"。

就像 NotebookLM 做PPT火了,确实肉眼可见地看到很多人在传播。

还看到有些人把 NotebookLM 做的 PPT 导出成 PDF,再用 WPS 转成PPT 编辑修改,或者用 Lovart 的图层编辑和新出的 Touch Edit 功能进行修补。

Nano Banana Pro 加 NotebookLM 做PPT的效果实在太好,也有一些声音说AI PPT厂商都完蛋了,过去依赖的HTML的技术方案要失效。AI生图的方案更符合直觉,上限更高。当然,这是后话,大多数人是看到效果才会有这种声音。

但我其实看到关于 NotebookLM 做 PPT 的分享,更多的时候是用户在这些场景本来不会做 PPT 分享的。

要思考一件事情,PPT的本质是什么?是那个PPTX的文件格式吗?并不是。PPT 本质上是一种分镜式、多步节奏控制、视觉主导的表达方式,比长文更符合现代人的认知习惯。在 LinkedIn 上,Carousel 格式的互动率通常是纯文本或单图的 3倍以上。小红书本质上就是“手机上的竖版 PPT”。

它过去大量存在于工作中,是因为这种呈现方式的制作成本还是太高了,传统 PPT 制作需要:设计审美、排版技能、大量时间。这三个门槛叠加起来,把 PPT 这种呈现形式"锁"在了高价值商业场景里。

我为了让客户更好地了解我们的产品,所以我做一个PPT,虽然费时费力,但我能拿到客户的钱,所以我会去做。

但是这并不意味着日常生活中接收信息的时候,我们不需要这种呈现形式。只是因为我们日常生活中接收信息,比如我们读一篇公众号的时候,我们所能给创作这个信息的人带来的收益,不足以支撑他切换一种更复杂的呈现形式的成本。

AI 工具(如 NotebookLM 和 Nano Banana Pro)的出现,通过消除这些障碍,实际上创造了一个全新的市场。它们允许用户仅通过自然语言描述或上传文档,就生成具有专业外观的视觉材料 。这种能力的下放使得 PPT 从一种“企业汇报工具”转变为一种“大众视觉语言”。这就是“火箭”——它不仅仅是让原有任务变快,而是让原先不可能的任务变得可能。

大众本来就渴望用“PPT模式”来阅读(认知负担低),只是以前生产端跟不上(排版太难)。AI 解决了供给侧的问题。这不仅是效率提升,这是 “媒介平权”。

你看到现在更多比例的传播用 NotebookLM 做PPT的场景,并不是替代现在现实生活中用传统软件做PPT的场景,而是创造了新的场景,就是更好的科普、更好的宣传。其实就是让PPT这种呈现形式,以更低的成本扩展到更广泛的市场。

经济学里有个杰文斯悖论 (Jevons Paradox),是指当某种资源的效率提高(成本趋近于 0)时,总消耗量会急剧增加。当制作 PPT 的时间从 4 小时变成 4 分钟,人类不会“省下时间去喝咖啡”,而是会“生产出 100 倍数量的微型 PPT”。未来的读书笔记、会议纪要、甚至复杂的微信聊天记录总结,可能都会以 5 页 Slide 的形式存在。

如果想抓住 Nano Banana 做PPT这种技术市场机会,可能并不是让它去和用户已经习惯的PPT软件竞争。而是面向那些自身其实存在以多页横版呈现信息的需求,但是由于之前的各种制作方式成本过高,所以一直没有过这种尝试的用户,那才是更大的增量市场。

比如,移动互联网是竖屏的天下。手机上竖向滑动比横向翻页更顺滑。NotebookLM 生成的如果是传统的 16:9 横版 PPT,在手机上阅读体验其实是“反人性”的(字太小、需横屏或不断左右滑)。如果能原生输出“竖版卡片”,体验会不会更好一些呢?

再比如,NotebookLM 现在视频概览的效果其实没有它做PPT的效果好。它的视频中的每一副图的信息量是很稀疏的,而且底图和文字不和谐。随着它能做出更长、更好的PPT之后,会不会反过来让它的视频效果也变得更好呢?会不会迎来短视频更大的传播机会?

关注增量不等于放弃现有用户,而是在为未来的主流人群提供他们尚未意识到但会深受其益的新体验。这样的战略眼光,一旦押对了方向,回报将是旧市场中任何微调都无法企及的。新技术赋予的“去火星”机会,也许开始时看似小众,但有潜力成长为新的大陆;提早探索并满足这些潜在需求的团队,将成为明日的领航者。

以及,当火箭技术足够成熟时,它也会被用来改良高铁。当 AI 在增量市场(个人科普)打磨成熟后,最终可能会反攻存量市场(商业汇报),完成彻底的替代。这样的故事过去也屡见不鲜。

https://mp.weixin.qq.com/s/aGe8iMeboZDEb-LW0YuRQg

510