Midjourney在今天早上6点终于发布了众多人期待已久的角色一致性功能。 这一功能同时支持MJ V6和Niji V6。 与之前的风格一致性功能相似,命名也基本保持一致,使用--sref参数和--cref参数。 坦率地说,风格一致性、角色一致性和场景一致性在生产管线中非常重要。它们的实现难度由低到高递增。 在进行MJ的故事创作时,这些一致性功能无疑是必不可少的。如果没有一致性,角色可能会频繁变化,观感会非常差。有时候角色的发型、脸型等会不断变化,让人怀疑是否在看一个异世界故事。 之前,朋友们在群里对这些功能进行了讨论: "风格一致性已经通过--sref命令很好地解决了,而角色一致性功能今早也终于放出来了。说实话,它可以节省一半的工作时间hhhhh。" 在使用--cref参数时,背后的--cw值可以从0设定到100,默认为--cw 100。在--cw 100的情况下,生成的图像会参考原始图像的脸部、头发和衣服,但可能会过于依赖输入的提示文本。将--cw设定为0时,只会参考脸部特征,相当于进行换脸操作。 最近,《沙丘2》非常火爆,让我给大家举个小例子。 原始图片如下: 使用--cref参数后的效果: 明显可以看出区别。当--cw设定为100时,人物的头饰和衣服基本保持一致;当--cw设定为0时,发型和衣服发生了改变。 关于用法,我比较习惯使用MJ的网页版,但实际体验并不太好,网址在这里:https://xinshuju.net 登录后,上传一张图片,你会注意到图片右下角有一个小图标,将鼠标悬停在上面后,会出现三个图标,最左边的人物图标用作角色参考,中间的链接图标用作风格参考,最右边的图标仅作为图片提示,类似于传统意义上的图像生成。 当然,你也可以按住Shift键,点击这三个按钮,将它们全部点亮,形成cref + sref + 图片prompt的超级组合拳... 官方还提供了一些关于角色一致性的简单提示。 对于真实人物和照片,这是最困难的,因为需要关注的细节太多,而且"神韵"是非常神秘的东西,有时候明明五官一样,却不像... 对于2D和3D角色来说,情况会好得多,因为只需要抓住几个主要特征即可。从功能本身来看,可以猜测Niji V6在角色一致性方面的表现肯定比MJ V6要好很多。 因此,我将以真实人物、2D和3D人物以及动物这三个维度做一些案例,分享一些我摸索出来的小技巧,让大家直观地感受这些功能的用法和未来可能性。 一. 真实人物 实话实说,我尝试了很多案例,直接使用真实人物照片作为参考效果确实不太好,只能保证相对一致性,但绝对的完全一致是不可能的。 官方也非常明确: "It's not designed for real people / photos" 我放了几个使用真实人物照片作为参考的案例,你们看一下相似度,就会明白。 达到了近乎剪刀手的程度。 但如果直接使用MJ生成的图像作为参考,一致性会好一些,但仅仅相对而已。 当然,还有一个很有趣的用法,将2D角色转化为真实人物。比如,我将一个二次元女生放进去,然后使用MJ V6生成的图像,让她在舞台上穿着皮衣弹吉他,效果意外地不错。 在真人方面,总体而言,这个功能对于节省制作滚动图所需的时间是有帮助的,但达不到完美或摄影级水平。当然,这只是第一步,真人一致性肯定是最困难的,期待MJ的后续优化。 二. 2D和3D角色 处理非真实人物,比如2D和3D角色时,我感到非常惊喜。 我认为最佳解决方案是Niji 6 + cref + sref的组合拳。 提示文本的写法也很简单,角色描述+角色动作+cref。 举个例子,我随便尝试了一个改变衣服的人造人18,然后删除了提示文本直接使用图片作为提示。可以看到,角色一致性得到了完美保持,无论是面部、发型、颜色、衣服,甚至身材,都能完美重现。 如果换成--cw 0,再写一个运动服。可以看到衣服全变了,但是面部和头发都不变,用吉川的话说:头发才是二次元的本体。 如果将--cw设定为0,再写一个运动服的描述。可以看到,衣服全面变化,但面部和头发保持不变,用吉川的话说:头发才是二次元的本体。 再举个例子,使用之前的橙头发妹子,直接生成了一个穿皮衣弹吉他的图像。 当然,她还可以做很多其他的事情。 对于3D角色也是同样的道理,比如经典的泡泡玛特风格的IP。 三. 动物 动物的一致性比我想象的要好得多。我一直以为MJ的角色一致性只适用于人物角色,但试了一下动物,结果意外地不错。 比如,以《山海奇镜》中的狼为例,将其作为图片提示,让它去抓兔子。 原始图片如下: 让它去抓兔子后,效果出乎意料地非常好。 Midjourney的角色一致性功能同时支持MJ V6和Niji V6。 比如,将朋友的狗作为提示,也能得到相似的效果。 怪物也是如此,效果非常棒。 这样的精度足够用于制作绘本了。 最后 在角色一致性方面,Midjourney迈出了坚实的一步。 首先受益的肯定是所有非真实人物领域,比如游戏、漫画、动漫和绘本等。 Midjourney的角色一致性精度是一个很棒的利器。 尽管它可能还没有达到绝对一致性的标准,但对于70~80%的工作来说,效率提升是巨大的。 同时,它不需要像SD那样进行高门槛、高成本的LoRA训练,只需要一张图片。 具备高可用性、优秀的用户体验和不错的效果。 我相信它在商业领域和专业工作流中有着重要的地位。 |