有意思~用阿里的Wan 2.1 视频模型生成高清图像~有种MJ的质感~！🥹
Wan 2.1 txt2img is amazing!
🧐 Reddit 用户分享了用 Wan 2.1 生成高质量电影感单帧图像的实验结果，展示了它作为 txt2img 模型的惊艳表现和不同采样器的效果差异。
➡️链接：https://www.reddit.com/r/StableDiffusion/comments/1lu7nxx/wan_21_txt2img_is_amazing/
➡️comfyui工作流下载：https://drive.google.com/file/d/1WeH7XEp2ogIxhrGGmE-bxoQ7buSnsbkE/view

✨重点

● 🎥 核心发现：虽然 Wan 2.1 本是视频生成模型，但用于生成单帧 txt2img 时也能产生惊艳的高质量、电影感画面。
● ⏱️ 性能表现：在 RTX 4080（16GB VRAM）上生成一张 1920×1080 图像大约需要 42 秒，使用 GGUF 格式的 Q5_K_S 模型，尝试 Q3_K_S 也保持了很好的画质。
● 🖼️ 后期处理：作者只在生成后加了胶片颗粒（film grain），使图像更有氛围感，效果明显提升。
● 🧪 采样器对比：
前 5 张图用了 euler + beta scheduler，颜色鲜艳、视觉冲击力强。
后 3 张图用了 ddim_uniform，整体更柔和但依然耐看，各有特色。
● 📄 工作流分享：作者贴出了完整的工作流和可下载的模型链接，便于其他人复现实验结果。
● 🖌️ 高效模型选择：实验显示低精度的 GGUF 模型在视觉效果上依然表现优秀，且推理速度可接受。

🧐躺平AI创作者，跨领域研究者，PhD  ‍💼UCL🇬🇧 | 中国美院🇨🇳 | UIBK🇦🇹 外聘导师

47万名技术爱好者在研究人工智能or“智障”

名技术爱好者在研究人工智能or“智障”

来自圈子

人工智能讨论组