1327522.jpg

Ridley

GF  2024-02-18 12:26
(空的)

浅尝AnimagineXL v3,Novelai v3 与 Pony Diffusion V6 XL(发点荧妹)

站里好多人在推荐NAI3,但就是没什么人发可本地运行的animagine。在我看来这两个模型包括最近也很热门的Pony Diffusion V6 XL,它们只是侧重方向不同,各有千秋。

我先结合两周的使用体验简单讲讲这三个模型的优缺点把。

AnimagineXL V3
https://civitai.com/models/260267?modelVersionId=293564

优点:上手简单,画风讨喜,支持多位画师的画风,对训练集的近3000个acg角色极致还原(https://huggingface.co/datasets/Zuntan/Animagine_XL_3.0-Character/tree/main),不断有新的大量lora支持。

缺点:更倾向于生成portrait,对于较复杂的提示词容易崩坏,也就是nsfw能力略逊于其他两个模型(当然其他sdxl模型连这三个的脚底都摸不到)。

Pony Diffusion V6 XL
https://civitai.com/models/257749/pony-diffusion-v6-xl

优点:极致的小马宝莉福瑞控的福音,西式画风,优越的nsfw能力,对nsfw的敏感程度高于NAI3,有各种lora支持。

缺点:使用难度高,需要各种正负面提示词控制质量与画风,错误地使用提示词有时会导致全图崩坏。西式画风不对胃口。

NovelAI V3
https://novelai.net/image

优点:支持大量画师的画风并非常还原,可以组合出非常优秀的效果(值得注意的是大量的前置画风提示词会极大削弱后面提示词的效果),线上运行。

缺点:使用难度较高,收费,不支持lora和本地webui的各种功能(据说有api但目前没有完全开放),基础画风堪忧,需要提前规划画风提示词。


animagine和ponydiffusion也有各自的微调大模型,以弥补它们在其他领域的短板,比如BArtstyleDB (https://civitai.com/models/212253/bartstyledb-or-xl-or-blue-archive-art-style-fine-tuned-model-base-on-animagine-xl-v3-or-or)更专注于碧蓝的平涂风格,Js2Prony (https://civitai.com/models/280321/js2prony)很大程度上弥补了ponydiffusion在使用难度与二次元画风上的缺憾。

除此之外,它们也可以用lcm加速出图,我尝试了animagine的lcm (https://huggingface.co/furusu/SD-LoRA/blob/main/lcm-animagine-3.safetensors),在高清放大时可以有效提升出图速度


以下分享一下nai3和animagine的图画对比,尽量使用相似提示词。

NovelAI V3





AnimagineXL V3





我画的是在温泉穿着浴巾的荧妹,可以明显看到在前置一串画风提示词(来自坛友https://summer-plus.net/read.php?tid-2094026.html)后,nai3已经对角色几乎做不到控制,但对画风的把控应该是更强的,animagine则始终摆脱不了它的基础画风,当然至于哪个画风更优秀就见仁见智了。

对我而言(我只想看荧妹涩涩),NAI3实际使用体验是不如本地animagine和ponydiffusion的,但是坛友一直在夸nai3却只字不提其他两个模型,我只能出来现身说法一下。期待未来能有将这三个模型优点集合在一起的“终极模型”。


最后再分享几张animagine随手跑的图。

















1327522.jpg

Ridley

B1F  2024-02-18 12:31
(空的)

回 1楼(板烧鸡腿堡) 的帖子

不是,我这里也是直接抄坛友的

1327522.jpg

Ridley

B2F  2024-02-19 08:25
(空的)

回 6楼(ppkkmoon ) 的帖子

pony衍生都没法像nai3那样更改画风

1327522.jpg

Ridley

B3F  2024-02-19 14:27
(空的)

回 8楼(ppkkmoon ) 的帖子

我没注意,原来是作者本人啊,失敬失敬
首先感谢你的模型,我一直都在用

我的意思是pony系使用下来没有能像nai3那样通过画风串达到amazing的效果,可能是融入了太多西式画风,毕竟审美还是偏日系的,我看pony本体大多数人也还是靠lora在微调画风。回头我再去组合一下试试。

1327522.jpg

Ridley

B4F  2024-02-24 20:27
(空的)

回 19楼(榴半仙) 的帖子

我不知道sdxl的lora训练跟SD1.5的有什么区别,不过就我炼SD1.5的经验来说(之前的炼丹帖图寄了),单纯提高泛化性还是有很多方法的,除了调几个超参和分层训练外,拿lora跑的图继续放进训练集里(但降低迭代次数)也是可以尝试的手段。

话说你这张是跑的恶魔酱么,看起来很不错

1327522.jpg

Ridley

B5F  2024-02-24 20:31
(空的)

回 17楼(5eda2a4f) 的帖子

多人稳定和构图多样化也包括在我所说的“nsfw能力"中,在这一点上我不觉得NAI3有完全碾压社区模型

1327522.jpg

Ridley

B6F  2024-02-24 20:44
(空的)

回 18楼(抽刀断水) 的帖子

你截个图看看,我用下来纯文生图没有遇到过什么报错

1327522.jpg

Ridley

B7F  2024-02-24 21:06
(空的)

回 25楼(抽刀断水) 的帖子

破案了,sdxl模型文生图,宽高请调成1024*1024或者差不多分辨率的