AI 画像生成

【Stable Diffusion】CLIP model毎の違いとステップ＆スケール

2023-03-20

CLIP modelを変更するとseed等の数値が全て同じでも別の画像
というか画風が結構変わることがわかりました

なので今回はCLIP model毎の違いをまとめてみました

ついでにステップとスケールの最小から最大までの違いも試してみました
正直最小は使う必要は無いです

条件

まずは今回使う画像の条件から

masterpiece, best quality, masterpiece,Face close-up,a girl ,beautiful face,moist eyes,black short hair,Tears,middy uniform,Embarrassed
Negative Prompt/lowres, bad anatomy, bad hands, text error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts,signature, watermark, username, blurry, artist name,fat

Sampling Steps:28
Sampling method:Euler
CFG Scale:12

CLIP model毎の違い

１～９までは結構好みなのかなって感じですけど
10～12は何だか全然違う画像になりましたね

text的には１～５までは割と正確なんですけど
それ以降はちょっと無視されています

なので基本的に１～５までを使って画像を生成するのが良いかもしれません

個人的には３と４が好きですね

ちなみに良く見かける画像のテイストに近いのは２が１番多いと思います

Sampling Steps

次はSampling Stepsの違いを比べてみます

最小：１
デフォルト：２０
最大：１５０

僕がよく使うのが３０前後ですね

大体２０～１１０くらいが良いと言われています

今回は上３つを比べてみました

ちなみにCLIP modelは３です

1は流石に論外ですけど２０と１５０でそこまでの違いが無いかなって気がします

確かによく見ると１５０の方が解像度が高いと言うかキレイなんですけど
かかる時間を考えるとちょっと微妙かなって感じです

まあでも２０はちょっとかすれ過ぎですかね

高ければ良い画像が必ず出来る訳でもありませんからこの辺のチョイスは難しいですね

CFG Scale

次はCFG Scaleの違いです

最小：１
デフォルト：７
最大：３０

Sampling Stepsは２８
CLIP modelは３です

こちらは７～１２程度が良いらしいです

やはり１はダメみたいですね

７と３０だと確かに３０の方が色々と書き込みが多い感じがします

ただ個人的には結構７ぐらいのほうが好きだったりします

まあこの辺も好みですかね

ただ無理に最大値の３０で作る必要は無いかなって思いました

おまけ

今回使った画像でseedを固定すると結構遊べます

例えばOpen mouthを追加してみると

こんな感じになります

元の画像と比べるてそこまで変化が無い画像が出力出来ます

ただもっと視点を下げようとすると

ちょっと違う人物になってしまいますね

この辺りが課題かなって感じです

ポーズや表情を変えなければ衣装差分のような画像は作れます

あとがき

同じseed値を使ってもクリップやスケール等を変えると全然違った画像になるので
色々試してみると面白いと思います

ただ全く同じ人物をポーズや視点を変えて出力するのはseed値を固定していても難しいです

たまに似たような人物の画像が出来ることもありますけどね

現状は服装を変更するくらいですね

こんかいはここまでです

以上

-AI, 画像生成

関連記事

: 【Stable Diffusion】可愛いケモノ画像が作れる呪文（nanachi）

以前別の記事でも書いているんですけど
ケモノ画像を作る際にnanachiをプロンプトに組み込むと
可愛らしい画像が高確率で作れるので紹介します

AI 画像生成

: Stable Diffusion 2.1をweb UIで使用する方法

少し前ですけどStable Diffusionがバージョンアップされていたのでweb UIで使えるようにしました

AI 画像生成

: 【Stable Diffusion】最新モデル「Stable Diffusion XL ベータ版」

Stable Diffusionの最新モデル　「Stable Diffusion XL」のベータ版が
webサービス「DreamStudio」で試す事が出来るということで試してみました

AI 画像生成

: 【Stable Diffusion】同時に複数のHypernetworkが使える拡張機能【web UI】

１枚の画像に複数のHypernetworkを使う事が出来る拡張機能「Multiple Hypernetworks」を紹介します

AI 画像生成

: 【Stable Diffusion】表情も検出してくれるようになった「ControlNet 1.1」

ControlNetがアップデートされて画像の表情も検出してくれるようになったようです
顔のランドマークってやつみたいですね

AI 画像生成

【Stable Diffusion】 web UI(AUTOMATIC1111)のアップデートとついでにWaifu diffusion v1.3

【Stable Diffusion】Sampling method毎の違いとプロンプトの探し方