画图这个事情自己试了以后确实感觉不一样。从我“语言中心”的角

即刻App年轻人的同好社区

下载

YiqinFu

2年前

画图这个事情自己试了以后确实感觉不一样。从我“语言中心”的角度看，语言能力强（这里特指创意语言，例如想象力、描述丰富）未来的回报可能会大幅提高，因为语言就能生成音频、图片、视频这些对观众冲击更大、商业价值更高媒介的内容。以前语言强的人能触及的观众群体有限，必须通过视听表达强的人才能打开市场。以后，语言 --> 画面 --> 视频的过程哪怕不全自动，成本也大幅降低。

举个例子，现在所有配静态图片的科普视频、商业分析视频、娱乐八卦视频，以后可以基于文字稿直接生成了，时间轴都可以自动对上。往更远了说，有了剧本就可以直接做电影（或者说至少成本大幅下降）。

语言到画面、声音，其实是降了很多维的，这也是为什么电影总比小说难看。语言到语言的沟通总是最美好的。但视觉对人的冲击比文字大太多，所以商业社会就是往视频这个方向发展。

仔细想想真的很有趣：19 世纪前都是说书人/连载故事家得名得利。但 20 世纪的技术进步让电影、电视、偶像团体大幅降低了故事本身的市场价值，只要酷炫、人美就行。21 世纪，技术又即将让“视觉”这个它引入的部分变成无差异的廉价商品，特效、偶像都可以一键生成。那么故事和会讲故事的人会变得更有市场价值吗？

下面是我画的一些图。图一是真实世界的一张专辑封面（我恰好看到，没有特意选择）。图二是我看着图一的照片，想了用一段话，放进 Midjourney 生成的图片。图三是我前几年写歌的时候心里想的一个画面，我用文字表达出来、放进 Midjourney 后，发现得到的图跟我心里的完全一致。图四是我在超市买了一张贺卡，看到它之后在电脑上试图还原，我觉得完全成功了。图五也是我看一本书的时候心里想的画面，也基本还原了。图六是网友生成的公司 logo，目前所有模型画具体字符都还表现很差。我觉得这个领域，“finetune 生成 logo“ 肯定是一个直接变现、大幅提高生产力的细分赛道，不过赛道应该也比较拥挤就是了。图七是网友画的 Homer 在阁楼交易外汇。如果模型能结合自己拥有版权的人物形象，文字生成电影、虚拟偶像、虚拟恋人不是梦。

生成这些图的时候，我最大的感受是创意文字能力特别重要（观察、同情心、新奇类比的能力），写得好，生成的视觉就好。我不知道语言和想法到底是不是同一个东西，但语言肯定是先于其他很多表达的，在大模型的加持下尤其如此。

62 46

来自圈子

AI探索站

78009人已经加入