AI 画像生成

【Stable diffusion】Google Colabでの使い方

こんにちは、りょうです

最近ちょっと話題になっている画像生成AIの「Stable diffusion」を試してみました

ホントはローカルで環境構築したかったんですけど失敗、Google Colabで試してみることにしました

Colabのほうは無事に成功しました

色々とワードを変えて遊んでるんですけど、なかなか良い画像を作るのは難しいです

ローカル環境構築失敗

必要なものをダウンロードしてなんとか頑張ってみたんですけど

どうやってもGPUを認識してくれないので諦めました

残念ながら理解が足りなかったようです

これを機に勉強してみようかな?

pythonで良いのかな?

そもそも僕の「GTX1660super」で出来るのかも怪しいですけどね

結構GPU性能必要らしいですし

Google Colab

どうやらGoogleの提供するサービスでも使えるらしいのでこっちで試すことにしました

こっちならNVIDIAのGPUも必要無いですし、低スペックのPCで動くのでこっちのほうが一般的ですかね

とりあえず簡単にColabで「Stable diffuion」を動かす方法をまとめておきます

  1. Hugging faceでアカウントを作ってアクセストークンを作る
  2. Goole ColabにアクセスしてGoogleアカウントでログイン
  3. ノートブックを新規作成
  4. 編集→ノートブックの設定
  5. ハードウェアアクセラレータの欄でGPUを選択

これでColabでGPUが使えるようになります

次にコード入力です

何か再生ボタンみたいなアイコンの右側にコードを入力出来ます

まずは

pip install diffusers==0.2.4 transformers scipy ftfy

再生ボタンをクリックします

次に

YOUR_TOKEN="トークン"

トークンの部分にHugging faceのトークンを入力します

from diffusers import StableDiffusionPipeline
pipe = StableDiffusionPipeline.from_pretrained("CompVis/stable-diffusion-v1-4", use_auth_token=YOUR_TOKEN)

僕はここでエラーが出ました

コードは覚えてないですけど、URLのリンクでHugging faceへ飛んで承認したら通りました

pipe.to("cuda")

ラスト!

prompt = "画像の説明"
image = pipe(prompt)["sample"][0]
image.save(f"ファイル名.png")

promptに生成したい画像の説明、ファイル名の部分に入力した名前が画像の名前になります

これで準備は完了です

画像生成

早速画像を生成してもらいます

とりあえずサイバーパンクなら外さないと思うので、サイバーパンク風の画像を作ります

prompt = "cyberpunk,rainy city,anime,rim light ,high resoliution"

こんな感じで

なんかいい感じになるらしいrim lightと高画質って意味らしいhigh resoliutionwoを追加

あとanimeを入れておかないと実写ぽい感じになるのでanimeも追加

英語はわからないのでDeepL翻訳で

で、出来た画像が

サムネで使った画像です

雰囲気は嫌いじゃないです、真ん中の意味不明な人影みたいなのもgood

ただ雨の街並みを指定したけど、雨上がりっぽいです

あとあんまサイバーパンク感があんまり無いですかね

ちょっと変更

"cyber-punk,fisheye lens,rainy city,girl front,anime,rim light ,high resoliution"

魚眼レンズと女の子を追加しました

女の子か?ちょっとホラーっぽくなりましたね

鼻と口いがいは結構好きかも

同じコードでもう一回

顔は無いけど、まあ女の子かな?

うーんあんま面白く無いですね

後はちょっとコード忘れちゃったけど大体似たようなコード出来たお気に入り

顔と手が苦手な感じですかね

再現性は悪いけど、似たような構図にはなるかな?

もっと細かく指定すれば再現性も良くなるかも?

KAWAIIは難しい

KAWAIIって指示を入れるとかわいい画像が出来るらしいですけどちょっと難しい気がしました

 "cyber-punk,fisheye lens,rainy city,kawaii girl front,anime,rim light ,high resoliution"

kawaiiを追加して画像を生成してもらったんですけど・・・

どうよこれ?

流石にキツイです、ちょっと努力は見えますけど

kawaiiでかわいいを作るのは、もう少し詳しく指定しないと難しいのかもしれません

これもなかなかキツイけど、ゾワゾワするような画像が出来た事もあります

保存はしたく無いレベルでした

kawaiiを使うのは要注意です

もっと良い感じが出来るように色々と試してみます

こんかいはここまで

以上

-AI, 画像生成