驱动LLM进行工作辅助 在当下已经是司空见惯的事情 对于大部分具备基本逻辑思维和语言表达能力的人来说这门槛很低了稍加训练就可以做的很高效
但当我面对一个生图diffusion模型,我却经常感到无从下手。我很难把我想要的画面,风格,细节准确的描述给ai,我在阅读生图的prompt时也常常感到一头雾水。因为对于图像生成来说你需要做信息的有损压缩,把画面转换成文字,如果你不懂如何用高效的用专业化的语言去描述一幅画就会在信息压缩中丢失关键的部分或者搞错了重点。AI说这个叫视觉自觉的逆向编译能力。
AI时代,艺术创作的门槛依然很高, 除了审美水平这个存在巨大差距的变量之外,你还得学会如何对抗模型的默认审美, 模型被喂了足够多精美画面呈现给你的东西都是那一套固定模式,如何把你的审美风格用语言转换成图像或者音乐,这是一个和你自己创作一样有难度的事情。