这种finetuning方式存在核心障碍：finetunning的效果非常依赖于训练集的质量，质量包括多样性、图片大小。在很多情况下还依赖于数量，而mj的“批量生成”在图片大小和多样性上均有限制，所以如果这么做很难得到预期的效果。而sd的强大和可控性有赖于其插件生态，如此，lora+cn的方案比直接用mj的图finetuning sd可能更为有效。

其实用finetune生成的图再经过人工挑选去重训练，可以很大程度上摆脱原始数据集泛化性的局限。

有个产品叫吐司，模板化+loRa，做的就是泛函说的事情，且免费🆓

已收录至：https://m.okjike.com/originalPosts/63ee0844898c23cdb298717a?s=eyJ1IjoiNjE4ZTlhMTgxODE5MDYwMDEwMjU3MjdlIn0%3D

m.okjike.com

一样的想法，已经在实践，解决了数据不足的问题🤛

当你希望能在商业场景中用上 AI 绘画的能力时，通常会在 midjourney 和 stable diffution 中摇摆。

midjourney 的优势在于生成的图片极其精美，劣势在于可控性并不高；

stable diffution 的优势在于生成的图片可控性较强，劣势在于生成一张精美的图片的操作难度较高。

那么，有没有办法集二者之所长呢？

在帮宝可梦做 AI 行业解决方案时，我想到了一个办法！

可以用 midjourney 批量生成某种特定风格的图片，然后用这些图片去训练 stable diffution 的模型！这样问题就解决啦。

既能用简单的提示词生成精美的图片，又能保证生成质量的可控性，非常适合在商业场景中使用。

这个逻辑就和用 GPT 4 生成的数据集去训练别的模型一样。

希望能帮到各位即友。

👋 CMO@ Bonjour!  😎 奇绩 S25 | 数字名片产品  👩‍❤️‍👨 女朋友是我最好的朋友@小溢  🛰 微信：FH01x

来自圈子

AI探索站