秋葉原に住むIT技術者の単なる雑記帳

【私的メモ】「Stable Diffusion」を扱う上で参考となる記事群

私は、8月に「Stable Diffusion」の存在を知ってから、まずはデモサイトで、そして9月に入ってからは自分のPCに「Stable Diffusion UI」や「NMKD Stable Diffusion GUI」を導入し、毎日のように画像を生成しております。

 しかし、これだけ長期間毎日のようにPCをぶん回し続けていても、なかなか自分の思い通りの画像は生成されないものです。

 英語のテキストで指示を出せばとりあえずそれに沿った画像を生成してくれるのですが、なかなかそれに完全に準拠した画像を生成してくれません。たまに、既存の画像から別の画像を錬成したりもしているのですが、それでもです。

 近頃は、「呪文」を書くときに、下記の記事群を参考にし始めております(順不同)。

 これらはすべてネットで検索して見つけたものですが、ほかにも、呪文詠唱、特に人物に特定のポーズを取らせる上で参考となる記事があれば、教えていただきたいと思います。


余談

 実は自分が毎日のようにPCをぶん回して、しかも外付けグラフィックボードまで導入してこんなことをしているのには理由があります。

 以前にも少し申し上げておりますが、特定の特徴を持った人物画像を取得したいわけです。とは言いましても、別にそれで何かするわけではなく、個人的にまあいろいろと妄想したいだけではありますが(ぉぃ)。

 以前この記事で触れた内容から若干変更はあるものの、その特徴とは下記の通り。自分の趣味全開です。

 Seed値ガチャを繰り返したり、時には画像錬成を繰り返したりしながら、ようやく自分の中では理想型に近い画像を得ることができました。

a full body portrait of a tall Japanese large-hipped short-haired intelligent beautiful girl in white room, wearing "dark green headband", "white knickers", "dark green tank tops", "white boots"., CGI

This image is created by Stable Diffusion.

 なお、この画像にあるような緑ヘッドバンドを着けた少女の画像、なかなか生成されないのですね。呪文でそれ(dark green headband)を指示しても、ヘッドバンドの色が白くなるのはまだいいほうで、妙な冠り物をしたりリボンを付けたり、髪の色が変わったり、なんてことが非常に多いです。

 それ以前に、「緑タンクトップ」+「白ホットパンツ(もしくは白ブルマー)」+「白ブーツ」を指示してもその通りの画像が生成されることは極めてまれで、本来緑色にして欲しくないところが緑色になったり、指示した覚えのない色になったりすることのほうが圧倒的に多いのです。

 ですので、この画像を得るまでには本当に試行錯誤と画像錬成の繰り返しでした。錬成の過程で、一度だけ私が画像編集ソフトで加工をしたりもしています。

 ところが、こうして苦労して得たこの画像を元にさらに別の画像を錬成しようとすると、まるで別物の画像が生成されてしまいます。下手すると性別すら変わってしまうことも。

 一応、この画像の錬成元となった画像も保持しておりますので、その画像とSeed値を元にキーワードを少し変えて、後ろを向かせたりポーズを取らせたりといったことは一応可能なのですが、なかなか思い通りの画像に仕上がってくれません。特に、着衣が普通あり得ない場所で切れて肌が露出していたりするのには萎えました…。

 もうそろそろ、欲しい画像を得てこの不毛な作業を終わらせて、別の(主に時事ネタ系の)画像の錬成に取りかかりたいです…。

#2022年 #2022年10月 #2022年10月2日 #StableDiffusion #StableDiffusionUI #NMKDStableDiffusionGUI #AI #PC #Windows