Honey32 Bear Web Apps

Updated at: Created at: 

DreamStudio (StableDiffusion) で OGP サムネイル画像を作成しました

カラーモード: システム

いっさい画像が無くて、さすがに殺風景すぎたので、 DreamStudio (Stable Diffusion の公式アプリ) を使って OGP サムネイル画像を生成してみました。はじめての挑戦です。

記事画面に表示するのはもちろん、投稿一覧画面 でも、サムネイルをさりげなく活かしたデザインにしました。

この記事のサムネ

この記事の OGP 画像 (サムネイル)は、

medieval city centre, Europe, diorama, night

というプロンプトで生成したものです。

思い通りに行かないところ

やはり、「この概念は英語で何と言うのか?」と単語を調べたり考えりするのが難しくて、なかなか思い通りの画像を作るのが難しいです。学校では画像的な場面説明のための表現をあまり訓練されないので仕方ないですが。

予想ですが、英語では区別されない事象をちゃんと区別できない、という問題もあるかも知れません。

また、風景に対する指示と、群衆の属性についての指示が混ざりやすい、というのも下馬評の通り(?)でした。 東洋への分解能の低さもあいまって、日本人のサラリーマンを登場させようとすると建物が全体的に中国っぽい赤い木造になってしまったりします。

不完全・破壊にも弱そうでした。 とくに low poly スタイルを指定したときなど、崩れた建物や、建築途中の様子を上手く描くことが出来ていません。どうしても完成した建物、「工事中っぽいデザインの建物」が出力されがちです。

得意なこと

線路や道路の白線や通行人のように、少しでも崩れるとおかしくなるモノは生成 AI の弱点と言われていますが、 watercolor (水彩画) と指定すると、そのディテール部分が省略されて、いい感じに味のある絵ができます。(もともと細部を省略して描かれやすい分野だからだと思います。)

diolama もいい感じです。Medieval Europe (中世ヨーロッパ風) と組み合わせたりすると、模型風でカワイイ画像が作れます。

Comic (アメリカンコミック風?)もいい感じでした。「崩壊する塔と混乱する人々」のようなプロンプトに対して、迫力がある力強い画像を生成してくれます。 Anime (日本アニメ風)はそういう分野では片手落ちでした。どうしてもゆるい雰囲気、カメラ目線になってしまう...

今後の展望(適当)

写真を撮ったり絵を描いたり出来るわけじゃないし、言葉で AI の類でうまく仕事できると嬉しいので、「ブログの OGP 画像」という手頃な課題をゲットしたと思って練習していこうと思います。

僕は基本的に一人で考えて答えを出すタイプで、他者とコミュニケーションを取りながら協働するのが不慣れなのですが、そっちの能力にも良い影響があるといいなーと思っています (どちらかというとチャット AI 側の話だけど)