AI 画像生成

【Stable diffusion】Stable diffusion UIの使い方

こんにちは、りょうです

今回はStable diffusion UIの使い方を簡単に解説します

いつものようにGoogleColabで動かしていきます

各種機能

まずは各種機能の紹介です

  • txt2img・・・文字から画像を生成する機能です
  • img2img・・・画像から画像を生成する機能です
  • Extra・・・アップスケーリングをする機能です
  • PNG info・・・画像のメタデータを見れる機能です
  • Settings・・・設定です、英語なのでよくわかりません

画像を生成する機能は2つですね

どちらが良いというわけでは無く目的によって使い分ける感じですね

例えばホント落書きみたいな絵をimg2imgで良い感じにすることも出来ます

絵を描く人の中には下書きをimg2imgにブチ込んで何か色々しているらしいです

その他の機能はまあ便利なんですが僕は使って無いですね

アップスケーリングは別のソフトでやっているし

PNG infoはそもそもデータはブログでメモってるので必要無いですね

もし人が作った画像のデータが気になる時とかに使うと良いかもしれませんね

txt2img

実際に画像を作ってみます

今回は各値もイジってみます

このあたりが簡単にイジれるのは良いですね

今回イジるのはこれ↓

  • Sampling Steps・・・数字が高い方が画像の精度が良くなります、ただ動作が重くなるしそもそも数字が高くても良いもが出来るとは限らない困ったちゃん、最大でも110くらいらしい
  • Restore faces・・・顔の補正をしてくれます、左右対処になるようにしてくれるらしい
  • Batch count・・・画像の出力枚数、正確には違うけど僕はこう認識しています
  • CFG Scale・・・数字が多き方がプロンプトに忠実だけど崩れやすくなるらしい、7~11くらいが良いらしい
  • seed・・・この値を合わせると同じような画像になりやすいらしい、-1はランダム

呪文は今までで1番可愛い画像が出来たもの使ってみます

"kawaii elf girl blonde Hair 
white dress,beautiful face,fantasy,anime,rim light,high resolution,4k,8k"

Steps110,count3,Scale9,seed10

まあ構図は似ていると思いますが

特に再現性は高く無いですね

試しにseedを9に変えてみました

1枚だけ変わりました

ホントにしっかり動いているのかちょっと怪しいです

もう1度seedを変えてみます

何か1枚ずつ変わってるみたいです

恐らくちゃんと動いていると思います

img2img

次はimg2imgで画像を作ってみます

値はtxt2imgと同じですね

さっき出来た画像を早速使って画像を作りたいと思います

使う画像はこれ

顔だけちょっと出来が悪いですね

何かお面みたいになってます

ちょっと時間がかかるのでcountを2にしました

1枚目はかなり近い画像になりました

2枚目はまあ顔の感じは近いけど多分ガタイめっちゃ良い


ちょっとLoopbackなる機能も試してみます

スクリプトのドロップダウンリストにあります

詳しい事はわかりませんが

GitHubの説明では

「img2img のチェックボックスで、出力された画像を次のバッチの入力画像として自動的に送り出すことができます。出力画像を保存し、入力画像をそれに置き換えるのと同じことです。バッチ回数の設定は、この処理を何回繰り返すかを制御します。
通常、これを行う場合、次の反復のための多くの画像の1つを自分で選択することになるので、この機能の有用性は疑問かもしれませんが、私はこの機能を使って、他の方法では得られない非常に素晴らしい出力を得ることができました。」

って事らしいです

1枚目は変わって無いみたいですね

うーんどうなんだろう?

まだちょっと有効な使い方がわかりません

アウトペインティング

アウトペインティングは多くの人が1番期待しいる機能だと思います

簡単に言うと元の画像に加筆してくれる感じの機能ですね

基本的に呪文や値は元画像と同じ方が良いらしいです

使いかたはスクリプトのドロップダウンリストから「Outpainting mk2」を選択して下さい

元画像はこちらです

こちらはfullで出力したものです

頭と胸の下が追加されました

境がちょっと目立つかなって感じですけど

途切れている所をしっかりと追加してくれていますね

これはoriginalです

わけわかりませんね

何か合体しているみたいです

次はlatent noiseです

何かやけにデカくなりましたね

これは悪く無いと思います

最後はlatent nothingです

1番自然な感じになりましたね

ファンタジーで稀に見かける謎ヒモが追加されました

左側に何か人が追加されている気がしますが

まあ許容範囲内でしょう

あとがき

Stable diffusion UIはシード値やスケール

今回は変えてませんが画像の大きさ等を簡単に変えられるので非常に便利です

画像生成するだけならGoogleColabで簡単に出来ますが

値を変えたりはちょっと知識がないと出来ませんからね

セッションが切れるのがちょっと面倒なので出来ればローカルで動かしたいですけどね

こんかいはここまでです

以上

-AI, 画像生成