即刻App年轻人的同好社区
下载
App内打开
歸藏
3年前
Midjourney V5 深度剖析与测评
主要想详细介绍一下V5升级之后如何使用以及一些使用的注意事项。同时对V5在各个方面的能力做了详细的测试总结了一些要点。原文提供了流动金属的8K壁纸下载和图片的详细提示词。详细的内容在这里:mp.weixin.qq.com
下面是量子速度版本:

如何使用V5版本🔧
一种是直接在提示词后面加上 --v 5 命令;
另一种是通过输入 命令回车后,选择MJ version V5的模型版本

V5的新功能📰
更广泛的风格范围:以前实现不了的一些风格V5会支持,比如非常明显的一个改变,以前V4版本在绘制照片风格的图片时总是有很明显的涂抹感现在生成的图片会更加逼真。

更具响应性的提示:第一个就是官方在公告里说的这次测试的是V5的专业模式对提示词的输入非常敏感,简短的提示可能效果不佳。第二个是V5貌似可以更好的理解自然语言,自然语言书写的提示词会比原来V4的关键词分割效果更好。另一个提示词理解能力的提升可以很好的理解数学概念和空间关系。

更高质量的图像:V5生成的图片在2倍分辨率放大时拥有更高的分辨率,这个因为目前 V5 的upsampler功能还没有开放。

动态范围改善:当你拍摄的图像在光线上有巨大的差异时,更大的动态范围就能获得更大的影调空间。涉及到从室外拍摄室内的内容的时候如果动态范围不足的时候图片就很容易特别黑细节不足,V5就表现的很好。

图像更详细:V5对于图像相关内容的细节会更加丰富,不需要加诸如“详细的”这类关键词,也可以生成正常的细节比如下面的图。

改进了图像提示性能:性能上的明显感觉V5发送完提示词以后相应更快了,之前V4发送完会等待模型理解提示词才会开始生成图片,V5几乎是发送完立刻就会开始生成图片。

支持无缝平铺:具体表现就是在提示词后加上--tile 参数后可以生成无缝的纹理贴图。

支持大于 2:1 的纵横比:代表着你可以输出4:1甚至5:1的超宽屏图像或者全景图。

支持权衡图像提示与文本提示:在提示词后面输入 --iw 加数字命令。数字越大生成的图片就会跟原图越像,数字越小就会跟原图差异越大。

V5我发现的新特性🤔
画手的成功率大幅提升:不只是张手这种简单的手势不会出问题,握手、OK之类的手势出问题的现象也变得很少。

光线的折射和反射处理非常强:具体的表现比如光线照射在液体上的反光,以及物品在镜面物体或者液体上的倒影,或者阳光穿过树木的丁达尔效应。

亚洲人像的生成更加自然:之前Midjourney生成的亚洲人像充满了欧美的刻板印象,五官非常的扁平,同时眼睛非常小,这次V5升级以后对于亚洲人或者中国人的人像不在是之前非常扁平的形象。

体积效果更加逼真:V5在生成体积效果时不再象是通过绘制出来的画面,反而像真的在一些3D或者特效软件通过运算生成的,非常的自然。

更好的生成地标建筑:现在V5能够很好的还原现实中的地标建筑和相关景色,比如下面这张图里的纽约中央公园和的帝国大厦。

对一些热门产品的还原非常好:对于现实中存在的一些热门的产品比如独特版式服饰、汽车等还原的非常好。

非常好的还原航拍场景:V5对于航拍场景下地面内容的细节还原的也非常好,跟其他照片的表现类似涂抹感大幅减少。

不同角度的同一个人像肖像还原的非常好:顾名思义,V5现在可以生成非常连续的同一个人不同角度的照片,我们直接看照片吧。

对于不同材质的细节处理更加好:现在V5能够准确理解对于不同材质的描述,从而非常好的还原各种材质的形状和表面特点,以及与环境交互的变化。

由于这个模型刚刚发布肯定还有很多没有来得及发现的新特性。也欢迎大家将自己发现的相关特性跟我沟通。
1120

来自圈子

圈子图片

AI探索站

101267人已经加入