当你希望能在商业场景中用上 AI 绘画的能力时,通常会在 midjourney 和 stable diffution 中摇摆。
midjourney 的优势在于生成的图片极其精美,劣势在于可控性并不高;
stable diffution 的优势在于生成的图片可控性较强,劣势在于生成一张精美的图片的操作难度较高。
那么,有没有办法集二者之所长呢?
在帮宝可梦做 AI 行业解决方案时,我想到了一个办法!
可以用 midjourney 批量生成某种特定风格的图片,然后用这些图片去训练 stable diffution 的模型!这样问题就解决啦。
既能用简单的提示词生成精美的图片,又能保证生成质量的可控性,非常适合在商业场景中使用。
这个逻辑就和用 GPT 4 生成的数据集去训练别的模型一样。
希望能帮到各位即友。