即刻App年轻人的同好社区
下载
App内打开
YiqinFu
2年前
画图这个事情自己试了以后确实感觉不一样。从我“语言中心”的角度看,语言能力强(这里特指创意语言,例如想象力、描述丰富)未来的回报可能会大幅提高,因为语言就能生成音频、图片、视频这些对观众冲击更大、商业价值更高媒介的内容。以前语言强的人能触及的观众群体有限,必须通过视听表达强的人才能打开市场。以后,语言 --> 画面 --> 视频的过程哪怕不全自动,成本也大幅降低。

举个例子,现在所有配静态图片的科普视频、商业分析视频、娱乐八卦视频,以后可以基于文字稿直接生成了,时间轴都可以自动对上。往更远了说,有了剧本就可以直接做电影(或者说至少成本大幅下降)。

语言到画面、声音,其实是降了很多维的,这也是为什么电影总比小说难看。语言到语言的沟通总是最美好的。但视觉对人的冲击比文字大太多,所以商业社会就是往视频这个方向发展。

仔细想想真的很有趣:19 世纪前都是说书人/连载故事家得名得利。但 20 世纪的技术进步让电影、电视、偶像团体大幅降低了故事本身的市场价值,只要酷炫、人美就行。21 世纪,技术又即将让“视觉”这个它引入的部分变成无差异的廉价商品,特效、偶像都可以一键生成。那么故事和会讲故事的人会变得更有市场价值吗?

下面是我画的一些图。图一是真实世界的一张专辑封面(我恰好看到,没有特意选择)。图二是我看着图一的照片,想了用一段话,放进 Midjourney 生成的图片。图三是我前几年写歌的时候心里想的一个画面,我用文字表达出来、放进 Midjourney 后,发现得到的图跟我心里的完全一致。图四是我在超市买了一张贺卡,看到它之后在电脑上试图还原,我觉得完全成功了。图五也是我看一本书的时候心里想的画面,也基本还原了。图六是网友生成的公司 logo,目前所有模型画具体字符都还表现很差。我觉得这个领域,“finetune 生成 logo“ 肯定是一个直接变现、大幅提高生产力的细分赛道,不过赛道应该也比较拥挤就是了。图七是网友画的 Homer 在阁楼交易外汇。如果模型能结合自己拥有版权的人物形象,文字生成电影、虚拟偶像、虚拟恋人不是梦。

生成这些图的时候,我最大的感受是创意文字能力特别重要(观察、同情心、新奇类比的能力),写得好,生成的视觉就好。我不知道语言和想法到底是不是同一个东西,但语言肯定是先于其他很多表达的,在大模型的加持下尤其如此。
46

来自圈子

圈子图片

AI探索站

79862人已经加入