有意思~用阿里的Wan 2.1 视频模型生成高清图像~有种MJ的质感~!🥹
Wan 2.1 txt2img is amazing!
🧐 Reddit 用户分享了用 Wan 2.1 生成高质量电影感单帧图像的实验结果,展示了它作为 txt2img 模型的惊艳表现和不同采样器的效果差异。
➡️链接:
www.reddit.com➡️comfyui工作流下载:
drive.google.com✨重点
● 🎥 核心发现:虽然 Wan 2.1 本是视频生成模型,但用于生成单帧 txt2img 时也能产生惊艳的高质量、电影感画面。
● ⏱️ 性能表现:在 RTX 4080(16GB VRAM)上生成一张 1920×1080 图像大约需要 42 秒,使用 GGUF 格式的 Q5_K_S 模型,尝试 Q3_K_S 也保持了很好的画质。
● 🖼️ 后期处理:作者只在生成后加了胶片颗粒(film grain),使图像更有氛围感,效果明显提升。
● 🧪 采样器对比:
前 5 张图用了 euler + beta scheduler,颜色鲜艳、视觉冲击力强。
后 3 张图用了 ddim_uniform,整体更柔和但依然耐看,各有特色。
● 📄 工作流分享:作者贴出了完整的工作流和可下载的模型链接,便于其他人复现实验结果。
● 🖌️ 高效模型选择:实验显示低精度的 GGUF 模型在视觉效果上依然表现优秀,且推理速度可接受。