即刻App年轻人的同好社区
下载
App内打开
陈南
150关注1k被关注1夸夸
🌊 高强度探索AI应用层ing
🤔 Curious 24/7
🔍 关注人性、产品与商业
🤖 AI应用产品经理 & 全栈开发者
置顶
陈南
1月前
LLM的三个基本特点和对应的应用层思考方向:
1.类人级的智能(之前需要人参与才能进行的流程,现在能不能让AI来做?)
2.超越人类的信息吸收速度(之前人做不了的事情,现在有了AI,还能不能做?)
3.低廉的边际复制成本(之前用人来做太贵的事情,现在能不能用AI取得指数级别的成本降低?)
00
陈南
1天前
这里所说的情绪价值,换个说法是:让用户深切感受到了自我权力的变化。

陈南: 最近回顾过去一两年的各种AI产品后,我发现一个现象:那些获得了普遍认可的C端应用,大多数都让用户感受到了人生的另一种可能性,提供了巨大的情绪价值。 我们先来说说LLM。 2022年的年底,当ChatGPT刚出现的时候,大多数人(包括我)都仅仅认为LLM是一个更高级、更智能的知识库,认为它是一个新时代的搜索引擎。但是,随着对它能力的进一步挖掘以及模型的迭代,我们慢慢发现,比知识库更重要的是,它还是一个推理引擎(Reasoning Engine)。在“涌现”的推理能力加持下,LLM展现出了强大的泛化能力,它不仅能够处理训练集中见过的问题,还能够解决一部分从未见过的问题。自此,新世界的大门打开了。 前些年有一个梗,说有些人在创业找程序员的时候,经常画的一个饼是:“我们有一个非常好的 idea,就缺程序员。”以前,不具备编码能力的人想要打造一个产品,门槛相当高,不仅需要找到合适的人,还需要想尽办法吸引其他人入伙,承担起沉重的创始人责任。但是如今,有些人发现,TA现在有了一个很好的idea,好像不需要程序员也行,自己借助Cursor就可以开干。在不需要组建一个团队的情况下,就能进行初始idea的验证,这相比于之前创业,门槛低了好几个数量级。 这个时候,很多人会发觉,LLM已经为自己的人生开启了一种新的可能性。相比于在原来的岗位上,需要借助其他人的技能互补才能完成一个东西的落地,LLM提供了一个专业的开发团队,自己只要想清楚要做什么,剩下的问题不再是那么难以解决。 接下来,我们来看看Midjourney和Sora。 人类是视觉动物,相较于文字和声音,图片、视频往往更容易引起更大的心理触动。以往,创作优秀的艺术画作、摄影、插画往往是只有少数人具备的能力,大多数人是消费者,而不是生产者,哪怕在看到有意思的作品,产生了新的灵感之后,大多数人也只能在心里默默地想象一下,或者跟朋友分享一下自己的想法,但没有机会把想法变成现实。但是,Midjourney这类文生图产品出现之后,我们会发现,那些可能潜藏在内心多年的艺术灵感,在AI的帮助下终于变得具体。我们可以用写实的风格,让AI呈现出一个科幻的世界,也可以让AI把手机、电脑、APP icon变得毛茸茸,也可以像妙鸭一样,让AI来想象不同角色的自己。 在文生图模型的帮助下,很多人意识到,人生具有了新的可能性,自己也可以是一个艺术家。 一部制作精良的影视作品往往需要耗费大量的资源,这种庞大的系统工程,在之前只有非常少数的人才能推动落地,这使得每年的电影、剧集产量都非常有限。但是,在Sora出现之后,我们惊喜地发现,不需要一个庞大的制作团队、演员团队,一个人也可以创作具有宏大场景的视频片段,哪怕只有十来秒。随着文生视频模型能力的进一步提升,将来,一个人也可以制作一部电影,自己也可以是导演。 过去,我们定义一个人时,经常会有一个固定的角色,“这个人是一名工程师,那个人是一位歌手”。但是,随着AI为每个人开启的可能性越来越多,一个人的角色或许会变得没那么清晰,当大多数人成为了“斜杠青年”时,将会迸发出巨大的创造力。 换个角度讲,什么是这里所说的人生的另一种可能性?其实很简单,就是让用户感到自己拥有了其他人的能力,这种感觉,非常爽。 那么,新的产品可以尝试从哪里寻找机会?看看某一个人群的能力是否可以嫁接到另一群人,能力的移植往往能产生超出预期的新体验。

00
陈南
3天前
最近回顾过去一两年的各种AI产品后,我发现一个现象:那些获得了普遍认可的C端应用,大多数都让用户感受到了人生的另一种可能性,提供了巨大的情绪价值。

我们先来说说LLM。

2022年的年底,当ChatGPT刚出现的时候,大多数人(包括我)都仅仅认为LLM是一个更高级、更智能的知识库,认为它是一个新时代的搜索引擎。但是,随着对它能力的进一步挖掘以及模型的迭代,我们慢慢发现,比知识库更重要的是,它还是一个推理引擎(Reasoning Engine)。在“涌现”的推理能力加持下,LLM展现出了强大的泛化能力,它不仅能够处理训练集中见过的问题,还能够解决一部分从未见过的问题。自此,新世界的大门打开了。

前些年有一个梗,说有些人在创业找程序员的时候,经常画的一个饼是:“我们有一个非常好的 idea,就缺程序员。”以前,不具备编码能力的人想要打造一个产品,门槛相当高,不仅需要找到合适的人,还需要想尽办法吸引其他人入伙,承担起沉重的创始人责任。但是如今,有些人发现,TA现在有了一个很好的idea,好像不需要程序员也行,自己借助Cursor就可以开干。在不需要组建一个团队的情况下,就能进行初始idea的验证,这相比于之前创业,门槛低了好几个数量级。

这个时候,很多人会发觉,LLM已经为自己的人生开启了一种新的可能性。相比于在原来的岗位上,需要借助其他人的技能互补才能完成一个东西的落地,LLM提供了一个专业的开发团队,自己只要想清楚要做什么,剩下的问题不再是那么难以解决。

接下来,我们来看看Midjourney和Sora。

人类是视觉动物,相较于文字和声音,图片、视频往往更容易引起更大的心理触动。以往,创作优秀的艺术画作、摄影、插画往往是只有少数人具备的能力,大多数人是消费者,而不是生产者,哪怕在看到有意思的作品,产生了新的灵感之后,大多数人也只能在心里默默地想象一下,或者跟朋友分享一下自己的想法,但没有机会把想法变成现实。但是,Midjourney这类文生图产品出现之后,我们会发现,那些可能潜藏在内心多年的艺术灵感,在AI的帮助下终于变得具体。我们可以用写实的风格,让AI呈现出一个科幻的世界,也可以让AI把手机、电脑、APP icon变得毛茸茸,也可以像妙鸭一样,让AI来想象不同角色的自己。

在文生图模型的帮助下,很多人意识到,人生具有了新的可能性,自己也可以是一个艺术家。

一部制作精良的影视作品往往需要耗费大量的资源,这种庞大的系统工程,在之前只有非常少数的人才能推动落地,这使得每年的电影、剧集产量都非常有限。但是,在Sora出现之后,我们惊喜地发现,不需要一个庞大的制作团队、演员团队,一个人也可以创作具有宏大场景的视频片段,哪怕只有十来秒。随着文生视频模型能力的进一步提升,将来,一个人也可以制作一部电影,自己也可以是导演。

过去,我们定义一个人时,经常会有一个固定的角色,“这个人是一名工程师,那个人是一位歌手”。但是,随着AI为每个人开启的可能性越来越多,一个人的角色或许会变得没那么清晰,当大多数人成为了“斜杠青年”时,将会迸发出巨大的创造力。

换个角度讲,什么是这里所说的人生的另一种可能性?其实很简单,就是让用户感到自己拥有了其他人的能力,这种感觉,非常爽。

那么,新的产品可以尝试从哪里寻找机会?看看某一个人群的能力是否可以嫁接到另一群人,能力的移植往往能产生超出预期的新体验。
26
陈南
5天前
晚点采访里提到的Minimax“低调测试中”的信息获取新产品,是不是这两天在小红书上推广的「万物追踪」?
1611
陈南
12天前
最近做一个内部分享,用即梦做了点PPT,没想到效果很惊艳,能实现海报级的质感,下面我贴了一些例子,可以看看效果。
顺便分享下让Claude帮我生成文生图prompt的提示词,只需要给一个关键词,就可以根据关键词为你生成一个优质文生图prompt,贴到即梦里就可以生成PPT啦。
—————————分割线———————
我正在使用一个Text-Image模型生成16:9比例的图片,你的任务是根据我提供的关键词,编写一个用于生成图片的prompt。请确保以下要求:
1. 关键词必须出现在图片中,并用双引号括起来(如:“关键词”)。图片中不能包含除关键词外的任何文字。
2. prompt需以中文撰写。
3. 图片需达到专业级电影海报的水准。你需要以专业电影海报设计师的视角,根据关键词的主题设计画面。
4. 请对图片的细节和艺术风格进行非常详细的描述,包括背景、主体、光影效果、构图等,以确保生成的图片具有视觉冲击力和艺术性。
5. 不需要在prompt中提及图片比例。
6. 请详细设计海报中文字的样式和风格,尽可能采用艺术字体,确保文字位于图片的正中间,并与背景完美融合,达到整体协调的效果。
7. 图片应采用彩色油画风格,具有强烈的艺术表现力。
8. 请充分发挥你的美学功底,确保图片达到极高的技术水准和美学质量。
请严格按照以上要求编写prompt,力求精准和艺术性兼备。
Think deeply first, output your thinking process, then show me the output.
Here is an output example:
```
<thinking_process>
{your_thinking_process}
</thinking_process>
<result_prompt>
超高清电影海报风格,富有艺术感的彩色油画质感。画面的上半部分是深邃的漩涡状混沌,由深紫色、深蓝和墨黑色的浓重笔触构成,展现出思维的复杂与纷乱。漩涡中缠绕着模糊的符号和不完整的文字碎片,象征混沌的思绪。
画面正中央,"想清楚,说明白"的文字呈现出转变效果:上方的"想清楚"由模糊渐变到清晰,笔画从墨色渐变为璀璨的金色;下方的"说明白"采用清透的水晶质感字体,散发出柔和的光晕。每个字都经过精心设计,展现出从混沌到清晰的视觉效果。
一道璀璨的光带从文字中央横贯画面,像一道闪电般划破混沌。光带由细腻的金色和白色笔触构成,展现出油画质感的光泽。光带周围漂浮着清晰的几何图形和完整的符号,象征思维开始变得清晰。
画面的下半部分豁然开朗,呈现出晴空般的澄澈。这里由明亮的天蓝色和纯白色调构成,点缀着闪耀的光点。几个半透明的水晶般的几何体悬浮其中,折射出绚丽的光芒,象征清晰的思维结构。整个画面通过油画的细腻笔触展现出丰富的层次感,光影交错,既有混沌的深邃,又有明晰的澄澈。远景中若隐若现的星云和光带增添了画面的纵深感,营造出思维广阔的意境。
</result_prompt>
```
第一个关键词:体现对世界的洞察
1752
陈南
1月前
智能指数上升
00
陈南
1月前
回顾这两年的AI应用层发展,AI在高思考成本场景下的价值已经得到验证,低思考成本的场景呢?

或许是AI技术发展得太快,总感觉ChatGPT的出现已经过了好久。但是仔细一想,距离2022年11月份也就2年时间。2年前,人类第一次感受到,有一种技术,能够以如此高的相似性模仿人类的表达过程,这种突如其来的眩晕感大面积扩散,形成了一种集体眩晕,引起了非常多的宏观叙事。宏观叙事越多,人们越倾向于看转折性的大机会,习惯于开始讲“未来应该是什么样”,而不是“用户的需求可以怎样更好地被满足”。

诚然,跨跃性的技术往往会对很多领域带来降维打击,比如“AI绘画”之于“视觉设计师”,“大模型”之于“翻译”,但当这些AI应用领域“低垂的果实”被采摘之后,我们往往会发现,在ChatGPT出现的两年后,大多数人的生活并没有感知到AI带来的改变。

AI总结的评论在大多数的购物、团购应用里出现,但用户是否真的买AI总结的“帐”,据我所知,微乎其微。很多应用推出了AI对话功能,就连一嗨租车都推出了一个AI助手,想要帮助用户解答租车中的各种问题,但我们也都很清晰地看到,Chatbot的交互成本远远大于“直接在UI上点点点”,AI在大多数现有业务场景下所带来的便利性,远远不能抵消交互成本的增量,按照俞军老师的用户价值公式(用户价值= 新体验– 旧体验– 替换成本),用户价值甚至是负的。

我观察到一种现象,AI应用目前在高思考成本的场景中广受好评,比如说总结一篇长文、编写代码、优化文章,但是在低思考成本的环节目前没有看到太惊艳的表现。仔细一想,原因也很明显,在前一种场景中,AI所带来的收益,远远大于交互成本的增量。以写代码为例,花个2分钟时间详细描述一下自己想要什么样的功能,就能在1分钟内得到想要的代码,比花1个小时慢慢去搜Google、写代码成本低太多了。但如果我想要在AI助手中挑个外卖,交互成本远远大于打开外卖应用、点点点几下完成下单。

问题可能不是出在AI上,而是出在,大多数人的生活,不需要太多的高强度思考。无论是国外还是国内,从社交媒体上就可以观察到,各种AI助手类应用的用户主要还是学生和白领,因为他们经常要进行各种高思考成本活动,对无论是横向还是纵向提升自己能力都有比较大的诉求。但如果回到大多数人都熟悉的Super App们涉及的领域(微信、抖音、淘宝、美团等),就会发现,这些应用已经尽可能将用户使用APP的思考成本降到了很低,如果想要基于这些应用做进一层的“效率提升”,恐怕没有太大的空间。

让我们换个角度看,以《创新者的窘境》中的理论,颠覆性科技的发展分为两种,增强(Enhancement)或替换(Replacement)。

在高思考成本的场景下,「增强」和「替换」都在发生,一方面让用户做得更快、做得更好,另一方面也在替代一部分的职业。但是, 在面向大多数人群的低思考成本的场景下,根据前文中的推理,「增强」则显得没那么容易,而「替代」却看到了一丝端倪,比如说Character.ai类AI陪伴型应用,有替代互动式游戏的趋势。

随着模型能力提升,在高思考成本的场景下,AI能做的会越来越多。但是,在低思考成本的场景下,即使AI在可预见的时间范围内会变得如此强大,也要对“拿着锤子找钉子”保持警惕,从用户实际需求出发探寻机会。
37
陈南
2月前
最近在思考用户对AI总结内容的信任度时有了一个很重要的认知:AI总结的内容很难让用户感受到共识,而人类编写的内容可以。

小红书这几年慢慢成为了旅游内容行业的一匹黑马,有很多人在小红书上找旅游攻略,包括我。我们在小红书上搜攻略时,很少会因为一个单独帖子的正文就决定了整个行程,我们会刷很多目的地相关的帖子,不仅会仔细看帖子的正文,还会看看评论区里“有经验的用户”的回复。在这个过程中,表面上我们是在寻找更多的信息,但实际上,我们是在寻找群体观点中的共识。

从众心理是一种植根于人类基因的底层倾向,当一个人出去旅游时,TA思考的第一个问题是:其他人都去哪里玩?大多数人的旅游是打卡型的,先逛完了大众共识中的网红打卡点,才有心思去追求小众。如果连最大众的景点都没去,很多人会担心回去之后都没有可以跟朋友吹牛逼的谈资。我们对于自己所规划的行程的信心,往往是在浏览了多个反复印证的信息源后才建立起来的。

那有朋友可能就会想,我让AI总结一下“共识”不就可以了吗?这里就又引出了一个很重要的点,我们似乎更信任那些能够积极参与共识建立过程的信息,而不是接受一个现成的共识。这里的核心不在于总结的内容质量如何,而是AI总结的内容没有“人味儿”。当我在小红书上浏览一个个的帖子时,我能看到作者的昵称和头像,这会给我带来一种很明确的感觉:对面写这段文字的人是一个真实的个体,在评论区,我会感觉到有一个真实的人类在分享TA的观点,这种“鲜活感”是非常重要的,它是信任感的根基。在旅游这种重线下体验的场景中,去过那个地方的人的真情实感所传达出的“鲜活感”,远远超越AI,那也就意味着,用户对AI总结的内容的信任度要差几个数量级。

除此之外,对于大多数人来说,一年也就旅游一两次,每次旅游决策往往需要用户用大量的钱来投票,“信任度”在需要谨慎决策的场景中尤为重要。

当然,现在的各种AI应用正在尝试用各种方式来提升用户对于信息的信任感,比如,Perplexity和Microsoft Copilot 会展示某个观点的信息来源,也会在下方列出参考的文献列表。这里我不会一棍子打死,说这种模式不ok,因为不是所有的场景都需要共识。

简单来讲,可以分为两类:事实查询类场景和以经验为基础的场景。

对于总结新闻事件、查询某个编程语言的语法、查询天气预报这种事实查询类场景来说,它其实并不需要共识,只要AI总结的信息足够准确,并且能够列举出信息来源,大多数情况下就可以满足用户的需求。

但是,在以经验为基础的场景中,共识就非常重要。小到餐厅、酒店的挑选,大到教育、职业道路的决策,都需要借助大量信息背后的共识来形成决策意见。与其相信一个AI能给予合适的指引,大多数人会选择在真人的发言中探索答案。

归根结底,共识的背后是信任问题,我们会本能地认为,大多数人都认同的东西,大概率是可信的。那么,除了共识之外,还有什么办法能带给人信任感呢?《影响力》一书给出了一些答案,但这些方法是否还适合这个AI时代,或许需要我们自己去探索。
2577
陈南
2月前
在用AI生成前端页面时,有个小技巧可以分享,如果想让UI更好看,可以直接告诉它,make UI Apple style and follow Apple Human Interface Guidelines,效果极佳,谁用谁知道😉
15
陈南
2月前
AI价值新视角—从“提效”到“降维”

最近在读《乔布斯传》,有一个点很触动我。乔布斯说,自行车可以让人跑得比秃鹫还快,电脑是我们迄今为止最了不起的工具,它就像是我们思维的自行车。
那么,自行车让人类移动得更快,电脑让人类的思考更高效,AI呢?在我看来,AI能让复杂的事情变简单。

我们先来回顾下这两个例子,自行车加快了人类使用体力移动的速度,电脑加快了人类进行脑力活动的速度,这两项技术都是在“速度”这个维度做提升。粗看之下,AI也能提升我们做各种事情的效率,但是仔细想想却不止如此,它不仅让我们做事变得更快,还让我们在很多事情上更加从容,把之前复杂到只有专业人员才能做的事情,或者需要费很多精力才能做的事情简单化,大大降低我们的心智压力。

自行车和电脑主要是增强我们已有的能力(分别是身体运动和认知处理速度),AI将技术对人类的提升,从“速度”这个维度转变为了“抽象”维度。它让我们可以在更抽象的层面与复杂系统互动,从而减少我们需要处理的认知复杂性。这和提升速度是有根本性不同的,更重要的是任务本身的转变。

最简单的一个例子就是编程,在LLM出现之前,编程实际上是一件非常耗费精力的事情。想出一个idea是比较容易的,但真正到了落地的时候,就会发现细节是魔鬼,不仅要求逻辑严丝合缝,而且需要确保语法、算法和系统架构都没有差错,对人的要求相当高。但是近一段时间Cursor、Bolt这些产品的出现,让人很明显地能感知到,我们不再需要过于关注那些实现的细节了,任务本身已经发生了转换,从“写准确的语法”变成了“描述你想要实现的目标”。

就拿最近的一个例子,我作为产品经理,用20分钟的时间,就请AI基于之前写的需求Demo,帮我写了一套简易版的投票系统,让同事们能够对某个需求的对比效果进行盲评,快速进行需求验证。而我所做的,也只是提供背景信息,剩下的都交给了Cursor,我只负责验收系统效果,并提出改进意见。

第二个例子我想聊一聊AI绘画,能画出优秀的绘画作品本身是一件门槛极高的事情,不仅要求作者有多年的绘画训练,还要有一定的天赋。但自打几年前AI绘画开始兴起之后,我们会发现,整个绘画的任务本身已经发生了转换,从“如何画”变成了“如何想象和描述”。

我从小是一个没有绘画天赋的人,只会画蓝天白云和苹果树。但凭借着多年的科幻片和科幻小说的观看经验,脑子里经常会有一些奇思妙想的场景。在AI绘画出现之前,这些场景只能在脑子里一直回荡。去年,我体验了Midjourney之后,突然感觉自己禁锢多年的创作欲被释放,连续画了好长时间,还给自己搞了一个“AI画廊”。

最后一个例子我想聊聊自动驾驶。一直以来,开车都是一件需要耗费大量精力的事情。我们不仅需要操控方向盘、油门刹车、换挡杆,还需要花费大量的精力来观察路况、预测可能发生的情况、提前做出行动。在特斯拉的FSD出现之前,我们很难想象一个汽车竟然能开得如此像一个真人。在FSD的帮助下,开车本身已经发生了转换,从“如何驾驶”变成了“何时接管AI驾驶”,再往后走,这个任务会演化为更简单的“如何设置目的地”。

我最近开着理想汽车搞了几次长途自驾游,很明显的感受是,高速NOA是一个用了回不去的功能。之前,我在开高速的时候,需要紧盯着路面,时刻关注旁边的来车,有时需要超车好几次才能绕过龟速区域,精神高度紧张,开两个小时下来,整个人就已经累得不行。但是,在开启了NOA之后,我只需要观察眼前的路面,它会自动加减速、切换到更快的车道、进闸道,我开车的精力消耗减少了80%以上。这也导致我现在租车基本上都只租有辅助驾驶的汽车,心智压力的降低对消费意愿的改变就是如此明显。

通过上面几个例子,我们可以很明显的感觉到,AI带来的从“速度”维度到“抽象”维度的转变,已经给我们带来了极大的体验优化,而这也只是日常生活中的几个场景而已。期待我们能顺着这个思路,转变越来越多的任务,在进一层的抽象中,体验更美好的生活。
812