【Stable diffusion】Stable diffusion UIの使い方

こんにちは、りょうです

今回はStable diffusion UIの使い方を簡単に解説します

いつものようにGoogleColabで動かしていきます

各種機能

まずは各種機能の紹介です

txt2img・・・文字から画像を生成する機能です
img2img・・・画像から画像を生成する機能です
Extra・・・アップスケーリングをする機能です
PNG info・・・画像のメタデータを見れる機能です
Settings・・・設定です、英語なのでよくわかりません

画像を生成する機能は２つですね

どちらが良いというわけでは無く目的によって使い分ける感じですね

例えばホント落書きみたいな絵をimg2imgで良い感じにすることも出来ます

絵を描く人の中には下書きをimg2imgにブチ込んで何か色々しているらしいです

その他の機能はまあ便利なんですが僕は使って無いですね

アップスケーリングは別のソフトでやっているし

PNG infoはそもそもデータはブログでメモってるので必要無いですね

もし人が作った画像のデータが気になる時とかに使うと良いかもしれませんね

txt2img

実際に画像を作ってみます

今回は各値もイジってみます

このあたりが簡単にイジれるのは良いですね

今回イジるのはこれ↓

Sampling Steps・・・数字が高い方が画像の精度が良くなります、ただ動作が重くなるしそもそも数字が高くても良いもが出来るとは限らない困ったちゃん、最大でも１１０くらいらしい
Restore faces・・・顔の補正をしてくれます、左右対処になるようにしてくれるらしい
Batch count・・・画像の出力枚数、正確には違うけど僕はこう認識しています
CFG Scale・・・数字が多き方がプロンプトに忠実だけど崩れやすくなるらしい、７～１１くらいが良いらしい
seed・・・この値を合わせると同じような画像になりやすいらしい、－１はランダム

呪文は今までで１番可愛い画像が出来たもの使ってみます

"kawaii elf girl blonde Hair 
white dress,beautiful face,fantasy,anime,rim light,high resolution,4k,8k"

Steps110,count3,Scale9,seed10

まあ構図は似ていると思いますが

特に再現性は高く無いですね

試しにseedを９に変えてみました

１枚だけ変わりました

ホントにしっかり動いているのかちょっと怪しいです

もう１度seedを変えてみます

何か１枚ずつ変わってるみたいです

恐らくちゃんと動いていると思います

img2img

次はimg2imgで画像を作ってみます

値はtxt2imgと同じですね

さっき出来た画像を早速使って画像を作りたいと思います

使う画像はこれ

顔だけちょっと出来が悪いですね

何かお面みたいになってます

ちょっと時間がかかるのでcountを２にしました

１枚目はかなり近い画像になりました

２枚目はまあ顔の感じは近いけど多分ガタイめっちゃ良い

ちょっとLoopbackなる機能も試してみます

スクリプトのドロップダウンリストにあります

詳しい事はわかりませんが

GitHubの説明では

「img2img のチェックボックスで、出力された画像を次のバッチの入力画像として自動的に送り出すことができます。出力画像を保存し、入力画像をそれに置き換えるのと同じことです。バッチ回数の設定は、この処理を何回繰り返すかを制御します。
通常、これを行う場合、次の反復のための多くの画像の1つを自分で選択することになるので、この機能の有用性は疑問かもしれませんが、私はこの機能を使って、他の方法では得られない非常に素晴らしい出力を得ることができました。」

って事らしいです