AI 画像生成

【Stable Diffusion】細かな背景が魅力的な高性能モデル「Counterfeit-V2.5」

またまた高性能なモデルが出てきましたので紹介します

普段使っているanything系(最近はv4.5)に比べると少し遠目から描写されているような感じがします

1番の特徴は背景が細かいといったところでしょう
別にanything系も背景が悪いというわけでは無いんですけど、比べるとこちらの方がより細かいです

背景が細かいモデルはEimisAnimeDiffusion(アニメより)がありますけど
こっちは中韓のソシャゲっぽい感じがしますね

今回はanything_v4.5と比較してみました
どっちも良いモデルなので、好みで選んでもらえればOKだと思います

モデルダウンロード

https://huggingface.co/gsdf/Counterfeit-V2.5

容量が大きければ良いという訳では無いらしいので
軽いCounterfeit-V2.5_fp16.safetensorsを使いました

必要があるかわかりませんけど、VAEはモデルに合わせてリネームしています

ちなみにセキュリティ的にも.safetensorsファイルが良いらしいです

txt2img画像生成

まずは普通の画像生成から

green tracksuit

(((masterpiece))), (((best quality))), ((ultra-detailed)), (digital art), (detailed light),((an extremely delicate and beautiful)),messy Bedroom,listless,1 girl,(green tracksuit),sleepy,short hair,bob cut,black hair,yellow eyes,gray scale,((shaded area)),bright skin,(tiny breasts),fish eye,looking at viewer,from below,[extremely_detailed_eyes_and_face]<hypernet:furry:1.0>
Negative prompt: lowres, bad hands, text,error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts,signature, watermark, username, blurry, artist name,fat,red face,nude,large breasts
Steps: 40, Sampler: DPM++ 2M Karras, CFG scale: 12,Face restoration: GFPGAN, Size: 704x512,Denoising strength: 0.6, Clip skip: 2, Hires upscale: 1.6, Hires upscaler: Latent

VAEはanything-v4.0.vaeとCounterfeit-V2.5

左がanything_v4.5で右がCounterfeit-V2.5になっています

seed値は同じハズなんですけど、これだけ違うと正直自信がが無いですね
1枚目は同じっぽいかな?

比べてみるとanithingは人物をメインにしているのに対して
Counterfeitは人物と背景が5:5くらいってところでしょうか?
わずかに人物の方に傾いているような気がしますけど
正直どう表現すればよいのかわかりません、カメラが遠いとか画角が広いとか?そんな感じですか?

Counterfeitはbright skinを使うと顔が白塗りのようになってしまいがちなので
無くした方が良いと思います

他に気になる所は載せてい画像だと1枚だけですけど
自然な感じで腹ポケットに手を入れている画像が割りと出来やすい印象でした

後は短パンが多め

red tracksuit(ケモノ)

やはりケモノも気になるところ

(((masterpiece))), (((best quality))), ((ultra-detailed)), (digital art), (detailed light),((an extremely delicate and beautiful))),((single girl)),nanachi,((very short and stout body)),short stature,bed room,furry girl,((red tracksuit)),rabbit ear,Yellow eyes,blown hair,short hair,bright skin,looking at viewer,[extremely_detailed_eyes_and_face]<hypernet:furry_kemono:1>
Negative prompt: nsfw,lowres, bad hands, text,error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts,signature, watermark, username, blurry, artist name,fat,red face,nude,long body
Steps: 40, Sampler: DPM++ 2M Karras, CFG scale: 12,Face restoration: GFPGAN, Size: 704x512, Denoising strength: 0.6, Clip skip: 2, Hires upscale: 1.6, Hires upscaler: Latent

昔の記事で等身が低いケモノはdwarfが良いのでは?と書いてありますけど
普通にvery short and stout body、short statureでも問題無さそうです
むしろdwarfは服装がカッチリし過ぎる感じもあるのでこっちの方が良いかも

後ケモノ系の画像はnanachiを入れると可愛い画像になる確率が上がります
可愛いから仕方ないですね

ケモノはCounterfeitの方が顔が崩れやすい印象です

後は全体的に手足が細く毛が少ないような気もしますね
服装もちょっとスタイリッシュになりやすいようです

背景はやっぱり細かいですね
しっかりと寝室になっています

人間は正直どっちも良いかなーって思いますけど
ケモノはCounterfeitの方が僕は好きですね
例え顔が崩れやすくても

ControlNetで比較

ControlNetでも比較してみますが、あんまり出来は良く無かったです

OpenPose Editor

openposeで使えるカラフル棒人間が簡単に作れる拡張機能が出来ていたので紹介します

といってもExtensionsから追加出来るので非常に簡単です
openpose-editorをインストールすればOK

こんな感じの画面になります
Addで複数人も可能

ControlNetで使うカラフル棒人間を簡単に作れる Blenderアドオン 導入&使用方法紹介
で紹介している方法よりも簡単に使えますが
Blenderの方が3Dでイジれるので感覚的にわかりやすいかなと思います

openpose画像比較

使用するopenpose画像はopenpose-editorで作ったこれです

サタデー・ナイト・フィーバーをイメージしました

ポーズは割と良い感じになりました
やっぱりCounterfeit-V2.5の方がスタイリッシュな服装になりやすいですね

今まで気にして無かったんですけど、つま先とか向きを指定するのって難しく無いですか?

-AI, 画像生成