陈南的个人主页

即刻App年轻人的同好社区

下载

App内打开

陈南

150关注1k被关注1夸夸

🌊 高强度探索AI应用层ing
🤔 Curious 24/7
🔍 关注人性、产品与商业
🤖 AI应用产品经理 & 全栈开发者

置顶

陈南

1月前

LLM的三个基本特点和对应的应用层思考方向：
1.类人级的智能（之前需要人参与才能进行的流程，现在能不能让AI来做？）
2.超越人类的信息吸收速度（之前人做不了的事情，现在有了AI，还能不能做？）
3.低廉的边际复制成本（之前用人来做太贵的事情，现在能不能用AI取得指数级别的成本降低？）

11 00

陈南

1天前

这里所说的情绪价值，换个说法是：让用户深切感受到了自我权力的变化。

陈南: 最近回顾过去一两年的各种AI产品后，我发现一个现象：那些获得了普遍认可的C端应用，大多数都让用户感受到了人生的另一种可能性，提供了巨大的情绪价值。我们先来说说LLM。 2022年的年底，当ChatGPT刚出现的时候，大多数人（包括我）都仅仅认为LLM是一个更高级、更智能的知识库，认为它是一个新时代的搜索引擎。但是，随着对它能力的进一步挖掘以及模型的迭代，我们慢慢发现，比知识库更重要的是，它还是一个推理引擎（Reasoning Engine）。在“涌现”的推理能力加持下，LLM展现出了强大的泛化能力，它不仅能够处理训练集中见过的问题，还能够解决一部分从未见过的问题。自此，新世界的大门打开了。前些年有一个梗，说有些人在创业找程序员的时候，经常画的一个饼是：“我们有一个非常好的 idea，就缺程序员。”以前，不具备编码能力的人想要打造一个产品，门槛相当高，不仅需要找到合适的人，还需要想尽办法吸引其他人入伙，承担起沉重的创始人责任。但是如今，有些人发现，TA现在有了一个很好的idea，好像不需要程序员也行，自己借助Cursor就可以开干。在不需要组建一个团队的情况下，就能进行初始idea的验证，这相比于之前创业，门槛低了好几个数量级。这个时候，很多人会发觉，LLM已经为自己的人生开启了一种新的可能性。相比于在原来的岗位上，需要借助其他人的技能互补才能完成一个东西的落地，LLM提供了一个专业的开发团队，自己只要想清楚要做什么，剩下的问题不再是那么难以解决。接下来，我们来看看Midjourney和Sora。人类是视觉动物，相较于文字和声音，图片、视频往往更容易引起更大的心理触动。以往，创作优秀的艺术画作、摄影、插画往往是只有少数人具备的能力，大多数人是消费者，而不是生产者，哪怕在看到有意思的作品，产生了新的灵感之后，大多数人也只能在心里默默地想象一下，或者跟朋友分享一下自己的想法，但没有机会把想法变成现实。但是，Midjourney这类文生图产品出现之后，我们会发现，那些可能潜藏在内心多年的艺术灵感，在AI的帮助下终于变得具体。我们可以用写实的风格，让AI呈现出一个科幻的世界，也可以让AI把手机、电脑、APP icon变得毛茸茸，也可以像妙鸭一样，让AI来想象不同角色的自己。在文生图模型的帮助下，很多人意识到，人生具有了新的可能性，自己也可以是一个艺术家。一部制作精良的影视作品往往需要耗费大量的资源，这种庞大的系统工程，在之前只有非常少数的人才能推动落地，这使得每年的电影、剧集产量都非常有限。但是，在Sora出现之后，我们惊喜地发现，不需要一个庞大的制作团队、演员团队，一个人也可以创作具有宏大场景的视频片段，哪怕只有十来秒。随着文生视频模型能力的进一步提升，将来，一个人也可以制作一部电影，自己也可以是导演。过去，我们定义一个人时，经常会有一个固定的角色，“这个人是一名工程师，那个人是一位歌手”。但是，随着AI为每个人开启的可能性越来越多，一个人的角色或许会变得没那么清晰，当大多数人成为了“斜杠青年”时，将会迸发出巨大的创造力。换个角度讲，什么是这里所说的人生的另一种可能性？其实很简单，就是让用户感到自己拥有了其他人的能力，这种感觉，非常爽。那么，新的产品可以尝试从哪里寻找机会？看看某一个人群的能力是否可以嫁接到另一群人，能力的移植往往能产生超出预期的新体验。

1 00

陈南

3天前

最近回顾过去一两年的各种AI产品后，我发现一个现象：那些获得了普遍认可的C端应用，大多数都让用户感受到了人生的另一种可能性，提供了巨大的情绪价值。

我们先来说说LLM。

2022年的年底，当ChatGPT刚出现的时候，大多数人（包括我）都仅仅认为LLM是一个更高级、更智能的知识库，认为它是一个新时代的搜索引擎。但是，随着对它能力的进一步挖掘以及模型的迭代，我们慢慢发现，比知识库更重要的是，它还是一个推理引擎（Reasoning Engine）。在“涌现”的推理能力加持下，LLM展现出了强大的泛化能力，它不仅能够处理训练集中见过的问题，还能够解决一部分从未见过的问题。自此，新世界的大门打开了。

前些年有一个梗，说有些人在创业找程序员的时候，经常画的一个饼是：“我们有一个非常好的 idea，就缺程序员。”以前，不具备编码能力的人想要打造一个产品，门槛相当高，不仅需要找到合适的人，还需要想尽办法吸引其他人入伙，承担起沉重的创始人责任。但是如今，有些人发现，TA现在有了一个很好的idea，好像不需要程序员也行，自己借助Cursor就可以开干。在不需要组建一个团队的情况下，就能进行初始idea的验证，这相比于之前创业，门槛低了好几个数量级。

这个时候，很多人会发觉，LLM已经为自己的人生开启了一种新的可能性。相比于在原来的岗位上，需要借助其他人的技能互补才能完成一个东西的落地，LLM提供了一个专业的开发团队，自己只要想清楚要做什么，剩下的问题不再是那么难以解决。

接下来，我们来看看Midjourney和Sora。

人类是视觉动物，相较于文字和声音，图片、视频往往更容易引起更大的心理触动。以往，创作优秀的艺术画作、摄影、插画往往是只有少数人具备的能力，大多数人是消费者，而不是生产者，哪怕在看到有意思的作品，产生了新的灵感之后，大多数人也只能在心里默默地想象一下，或者跟朋友分享一下自己的想法，但没有机会把想法变成现实。但是，Midjourney这类文生图产品出现之后，我们会发现，那些可能潜藏在内心多年的艺术灵感，在AI的帮助下终于变得具体。我们可以用写实的风格，让AI呈现出一个科幻的世界，也可以让AI把手机、电脑、APP icon变得毛茸茸，也可以像妙鸭一样，让AI来想象不同角色的自己。

在文生图模型的帮助下，很多人意识到，人生具有了新的可能性，自己也可以是一个艺术家。

一部制作精良的影视作品往往需要耗费大量的资源，这种庞大的系统工程，在之前只有非常少数的人才能推动落地，这使得每年的电影、剧集产量都非常有限。但是，在Sora出现之后，我们惊喜地发现，不需要一个庞大的制作团队、演员团队，一个人也可以创作具有宏大场景的视频片段，哪怕只有十来秒。随着文生视频模型能力的进一步提升，将来，一个人也可以制作一部电影，自己也可以是导演。

过去，我们定义一个人时，经常会有一个固定的角色，“这个人是一名工程师，那个人是一位歌手”。但是，随着AI为每个人开启的可能性越来越多，一个人的角色或许会变得没那么清晰，当大多数人成为了“斜杠青年”时，将会迸发出巨大的创造力。

换个角度讲，什么是这里所说的人生的另一种可能性？其实很简单，就是让用户感到自己拥有了其他人的能力，这种感觉，非常爽。

那么，新的产品可以尝试从哪里寻找机会？看看某一个人群的能力是否可以嫁接到另一群人，能力的移植往往能产生超出预期的新体验。

18 26

陈南

5天前

晚点采访里提到的Minimax“低调测试中”的信息获取新产品，是不是这两天在小红书上推广的「万物追踪」？

20 1611

陈南

12天前

最近做一个内部分享，用即梦做了点PPT，没想到效果很惊艳，能实现海报级的质感，下面我贴了一些例子，可以看看效果。
顺便分享下让Claude帮我生成文生图prompt的提示词，只需要给一个关键词，就可以根据关键词为你生成一个优质文生图prompt，贴到即梦里就可以生成PPT啦。
—————————分割线———————
我正在使用一个Text-Image模型生成16:9比例的图片，你的任务是根据我提供的关键词，编写一个用于生成图片的prompt。请确保以下要求：
1. 关键词必须出现在图片中，并用双引号括起来（如：“关键词”）。图片中不能包含除关键词外的任何文字。
2. prompt需以中文撰写。
3. 图片需达到专业级电影海报的水准。你需要以专业电影海报设计师的视角，根据关键词的主题设计画面。
4. 请对图片的细节和艺术风格进行非常详细的描述，包括背景、主体、光影效果、构图等，以确保生成的图片具有视觉冲击力和艺术性。
5. 不需要在prompt中提及图片比例。
6. 请详细设计海报中文字的样式和风格，尽可能采用艺术字体，确保文字位于图片的正中间，并与背景完美融合，达到整体协调的效果。
7. 图片应采用彩色油画风格，具有强烈的艺术表现力。
8. 请充分发挥你的美学功底，确保图片达到极高的技术水准和美学质量。
请严格按照以上要求编写prompt，力求精准和艺术性兼备。
Think deeply first, output your thinking process, then show me the output.
Here is an output example:
```
<thinking_process>
{your_thinking_process}
</thinking_process>
<result_prompt>
超高清电影海报风格，富有艺术感的彩色油画质感。画面的上半部分是深邃的漩涡状混沌，由深紫色、深蓝和墨黑色的浓重笔触构成，展现出思维的复杂与纷乱。漩涡中缠绕着模糊的符号和不完整的文字碎片，象征混沌的思绪。
画面正中央，"想清楚，说明白"的文字呈现出转变效果：上方的"想清楚"由模糊渐变到清晰，笔画从墨色渐变为璀璨的金色；下方的"说明白"采用清透的水晶质感字体，散发出柔和的光晕。每个字都经过精心设计，展现出从混沌到清晰的视觉效果。
一道璀璨的光带从文字中央横贯画面，像一道闪电般划破混沌。光带由细腻的金色和白色笔触构成，展现出油画质感的光泽。光带周围漂浮着清晰的几何图形和完整的符号，象征思维开始变得清晰。
画面的下半部分豁然开朗，呈现出晴空般的澄澈。这里由明亮的天蓝色和纯白色调构成，点缀着闪耀的光点。几个半透明的水晶般的几何体悬浮其中，折射出绚丽的光芒，象征清晰的思维结构。整个画面通过油画的细腻笔触展现出丰富的层次感，光影交错，既有混沌的深邃，又有明晰的澄澈。远景中若隐若现的星云和光带增添了画面的纵深感，营造出思维广阔的意境。
</result_prompt>
```
第一个关键词：体现对世界的洞察

105 1752

陈南

1月前

智能指数上升

2 00

陈南

1月前

回顾这两年的AI应用层发展，AI在高思考成本场景下的价值已经得到验证，低思考成本的场景呢？

或许是AI技术发展得太快，总感觉ChatGPT的出现已经过了好久。但是仔细一想，距离2022年11月份也就2年时间。2年前，人类第一次感受到，有一种技术，能够以如此高的相似性模仿人类的表达过程，这种突如其来的眩晕感大面积扩散，形成了一种集体眩晕，引起了非常多的宏观叙事。宏观叙事越多，人们越倾向于看转折性的大机会，习惯于开始讲“未来应该是什么样”，而不是“用户的需求可以怎样更好地被满足”。

诚然，跨跃性的技术往往会对很多领域带来降维打击，比如“AI绘画”之于“视觉设计师”，“大模型”之于“翻译”，但当这些AI应用领域“低垂的果实”被采摘之后，我们往往会发现，在ChatGPT出现的两年后，大多数人的生活并没有感知到AI带来的改变。

AI总结的评论在大多数的购物、团购应用里出现，但用户是否真的买AI总结的“帐”，据我所知，微乎其微。很多应用推出了AI对话功能，就连一嗨租车都推出了一个AI助手，想要帮助用户解答租车中的各种问题，但我们也都很清晰地看到，Chatbot的交互成本远远大于“直接在UI上点点点”，AI在大多数现有业务场景下所带来的便利性，远远不能抵消交互成本的增量，按照俞军老师的用户价值公式（用户价值= 新体验– 旧体验– 替换成本），用户价值甚至是负的。

我观察到一种现象，AI应用目前在高思考成本的场景中广受好评，比如说总结一篇长文、编写代码、优化文章，但是在低思考成本的环节目前没有看到太惊艳的表现。仔细一想，原因也很明显，在前一种场景中，AI所带来的收益，远远大于交互成本的增量。以写代码为例，花个2分钟时间详细描述一下自己想要什么样的功能，就能在1分钟内得到想要的代码，比花1个小时慢慢去搜Google、写代码成本低太多了。但如果我想要在AI助手中挑个外卖，交互成本远远大于打开外卖应用、点点点几下完成下单。

问题可能不是出在AI上，而是出在，大多数人的生活，不需要太多的高强度思考。无论是国外还是国内，从社交媒体上就可以观察到，各种AI助手类应用的用户主要还是学生和白领，因为他们经常要进行各种高思考成本活动，对无论是横向还是纵向提升自己能力都有比较大的诉求。但如果回到大多数人都熟悉的Super App们涉及的领域（微信、抖音、淘宝、美团等），就会发现，这些应用已经尽可能将用户使用APP的思考成本降到了很低，如果想要基于这些应用做进一层的“效率提升”，恐怕没有太大的空间。

让我们换个角度看，以《创新者的窘境》中的理论，颠覆性科技的发展分为两种，增强（Enhancement）或替换（Replacement）。

在高思考成本的场景下，「增强」和「替换」都在发生，一方面让用户做得更快、做得更好，另一方面也在替代一部分的职业。但是，在面向大多数人群的低思考成本的场景下，根据前文中的推理，「增强」则显得没那么容易，而「替代」却看到了一丝端倪，比如说Character.ai类AI陪伴型应用，有替代互动式游戏的趋势。

随着模型能力提升，在高思考成本的场景下，AI能做的会越来越多。但是，在低思考成本的场景下，即使AI在可预见的时间范围内会变得如此强大，也要对“拿着锤子找钉子”保持警惕，从用户实际需求出发探寻机会。

29 37

陈南

2月前

最近在思考用户对AI总结内容的信任度时有了一个很重要的认知：AI总结的内容很难让用户感受到共识，而人类编写的内容可以。

小红书这几年慢慢成为了旅游内容行业的一匹黑马，有很多人在小红书上找旅游攻略，包括我。我们在小红书上搜攻略时，很少会因为一个单独帖子的正文就决定了整个行程，我们会刷很多目的地相关的帖子，不仅会仔细看帖子的正文，还会看看评论区里“有经验的用户”的回复。在这个过程中，表面上我们是在寻找更多的信息，但实际上，我们是在寻找群体观点中的共识。

从众心理是一种植根于人类基因的底层倾向，当一个人出去旅游时，TA思考的第一个问题是：其他人都去哪里玩？大多数人的旅游是打卡型的，先逛完了大众共识中的网红打卡点，才有心思去追求小众。如果连最大众的景点都没去，很多人会担心回去之后都没有可以跟朋友吹牛逼的谈资。我们对于自己所规划的行程的信心，往往是在浏览了多个反复印证的信息源后才建立起来的。

那有朋友可能就会想，我让AI总结一下“共识”不就可以了吗？这里就又引出了一个很重要的点，我们似乎更信任那些能够积极参与共识建立过程的信息，而不是接受一个现成的共识。这里的核心不在于总结的内容质量如何，而是AI总结的内容没有“人味儿”。当我在小红书上浏览一个个的帖子时，我能看到作者的昵称和头像，这会给我带来一种很明确的感觉：对面写这段文字的人是一个真实的个体，在评论区，我会感觉到有一个真实的人类在分享TA的观点，这种“鲜活感”是非常重要的，它是信任感的根基。在旅游这种重线下体验的场景中，去过那个地方的人的真情实感所传达出的“鲜活感”，远远超越AI，那也就意味着，用户对AI总结的内容的信任度要差几个数量级。

除此之外，对于大多数人来说，一年也就旅游一两次，每次旅游决策往往需要用户用大量的钱来投票，“信任度”在需要谨慎决策的场景中尤为重要。

当然，现在的各种AI应用正在尝试用各种方式来提升用户对于信息的信任感，比如，Perplexity和Microsoft Copilot 会展示某个观点的信息来源，也会在下方列出参考的文献列表。这里我不会一棍子打死，说这种模式不ok，因为不是所有的场景都需要共识。

简单来讲，可以分为两类：事实查询类场景和以经验为基础的场景。

对于总结新闻事件、查询某个编程语言的语法、查询天气预报这种事实查询类场景来说，它其实并不需要共识，只要AI总结的信息足够准确，并且能够列举出信息来源，大多数情况下就可以满足用户的需求。

但是，在以经验为基础的场景中，共识就非常重要。小到餐厅、酒店的挑选，大到教育、职业道路的决策，都需要借助大量信息背后的共识来形成决策意见。与其相信一个AI能给予合适的指引，大多数人会选择在真人的发言中探索答案。

归根结底，共识的背后是信任问题，我们会本能地认为，大多数人都认同的东西，大概率是可信的。那么，除了共识之外，还有什么办法能带给人信任感呢？《影响力》一书给出了一些答案，但这些方法是否还适合这个AI时代，或许需要我们自己去探索。

140 2577

陈南

2月前

在用AI生成前端页面时，有个小技巧可以分享，如果想让UI更好看，可以直接告诉它，make UI Apple style and follow Apple Human Interface Guidelines，效果极佳，谁用谁知道😉

42 15

陈南

2月前

AI价值新视角—从“提效”到“降维”

最近在读《乔布斯传》，有一个点很触动我。乔布斯说，自行车可以让人跑得比秃鹫还快，电脑是我们迄今为止最了不起的工具，它就像是我们思维的自行车。
那么，自行车让人类移动得更快，电脑让人类的思考更高效，AI呢？在我看来，AI能让复杂的事情变简单。

我们先来回顾下这两个例子，自行车加快了人类使用体力移动的速度，电脑加快了人类进行脑力活动的速度，这两项技术都是在“速度”这个维度做提升。粗看之下，AI也能提升我们做各种事情的效率，但是仔细想想却不止如此，它不仅让我们做事变得更快，还让我们在很多事情上更加从容，把之前复杂到只有专业人员才能做的事情，或者需要费很多精力才能做的事情简单化，大大降低我们的心智压力。

自行车和电脑主要是增强我们已有的能力（分别是身体运动和认知处理速度），AI将技术对人类的提升，从“速度”这个维度转变为了“抽象”维度。它让我们可以在更抽象的层面与复杂系统互动，从而减少我们需要处理的认知复杂性。这和提升速度是有根本性不同的，更重要的是任务本身的转变。

最简单的一个例子就是编程，在LLM出现之前，编程实际上是一件非常耗费精力的事情。想出一个idea是比较容易的，但真正到了落地的时候，就会发现细节是魔鬼，不仅要求逻辑严丝合缝，而且需要确保语法、算法和系统架构都没有差错，对人的要求相当高。但是近一段时间Cursor、Bolt这些产品的出现，让人很明显地能感知到，我们不再需要过于关注那些实现的细节了，任务本身已经发生了转换，从“写准确的语法”变成了“描述你想要实现的目标”。

就拿最近的一个例子，我作为产品经理，用20分钟的时间，就请AI基于之前写的需求Demo，帮我写了一套简易版的投票系统，让同事们能够对某个需求的对比效果进行盲评，快速进行需求验证。而我所做的，也只是提供背景信息，剩下的都交给了Cursor，我只负责验收系统效果，并提出改进意见。

第二个例子我想聊一聊AI绘画，能画出优秀的绘画作品本身是一件门槛极高的事情，不仅要求作者有多年的绘画训练，还要有一定的天赋。但自打几年前AI绘画开始兴起之后，我们会发现，整个绘画的任务本身已经发生了转换，从“如何画”变成了“如何想象和描述”。

我从小是一个没有绘画天赋的人，只会画蓝天白云和苹果树。但凭借着多年的科幻片和科幻小说的观看经验，脑子里经常会有一些奇思妙想的场景。在AI绘画出现之前，这些场景只能在脑子里一直回荡。去年，我体验了Midjourney之后，突然感觉自己禁锢多年的创作欲被释放，连续画了好长时间，还给自己搞了一个“AI画廊”。

最后一个例子我想聊聊自动驾驶。一直以来，开车都是一件需要耗费大量精力的事情。我们不仅需要操控方向盘、油门刹车、换挡杆，还需要花费大量的精力来观察路况、预测可能发生的情况、提前做出行动。在特斯拉的FSD出现之前，我们很难想象一个汽车竟然能开得如此像一个真人。在FSD的帮助下，开车本身已经发生了转换，从“如何驾驶”变成了“何时接管AI驾驶”，再往后走，这个任务会演化为更简单的“如何设置目的地”。

我最近开着理想汽车搞了几次长途自驾游，很明显的感受是，高速NOA是一个用了回不去的功能。之前，我在开高速的时候，需要紧盯着路面，时刻关注旁边的来车，有时需要超车好几次才能绕过龟速区域，精神高度紧张，开两个小时下来，整个人就已经累得不行。但是，在开启了NOA之后，我只需要观察眼前的路面，它会自动加减速、切换到更快的车道、进闸道，我开车的精力消耗减少了80%以上。这也导致我现在租车基本上都只租有辅助驾驶的汽车，心智压力的降低对消费意愿的改变就是如此明显。

通过上面几个例子，我们可以很明显的感觉到，AI带来的从“速度”维度到“抽象”维度的转变，已经给我们带来了极大的体验优化，而这也只是日常生活中的几个场景而已。期待我们能顺着这个思路，转变越来越多的任务，在进一层的抽象中，体验更美好的生活。

41 812