ここではStable Diffusionのプロンプトの使い方を初心者にもわかりやすくご紹介します。
プロンプトの基本から応用テクニックまで、この記事があなたの疑問を解消します。
記事を読むことで得られる具体的な内容は次の通りです。
- 画像生成するためのプロンプトについての基礎知識
- プロンプト入力のテクニック
- 画像生成におけるプロンプトの要素について。
これからAI画像生成を始めたい方のお役に立てばうれしいです。
Stable Diffusionとは
まずStable Diffusionについて簡単に説明します。
Stable Diffusionは、AIを使って画像を生成するツールです。この技術を使うことで、ユーザーは独自の画像を作成できます。特に、文章を入力するだけで、その内容に基づいた画像が生成されるのが大きな特徴です。
Stable Diffusionをさらに詳しく知りたい方は、下記の記事も参考にしてください。
プロンプト(呪文)とは?
プロンプトは、Stable Diffusionにどのような画像を生成してほしいかを教えるための「指示書」のようなものです。
文字通り、AIに対する「呪文」のように機能し、入力されたテキストに基づいて画像が作成されます。
単語を並べて書いていくことが基本となり、単語は英語で入力し「,」と「半角スペース」で区切って入力していきます。
文法は特に気にする必要はありませんので、英語が苦手な人でも問題ありません。翻訳ツールを使って誰でも作れます。
また、最初に書かれた単語ほど優先してイラストに反映されます。単語の順番も工夫することも重要です。
例えば、「青い空の下で花が咲く風景」のイラストを生成したい場合、と入力すると、その描写に合った画像をAIが生成します。試しに生成してみましょう。
生成AIは基本的に英語でプロンプトを入力します。
DeepL翻訳やGoogle翻訳などを使って「青い空の下で花が咲く風景」を翻訳してみましょう。翻訳された「Scenery of flowers blooming under the blue sky」で生成してみます。
- 文章:Scenery of flowers blooming under the blue sky
- 単語:biue sky, flowers,
下の画像が生成されたイラストです!2枚生成してみました。
「青い空の下で花が咲く風景」イラストが生成されました。
このようにプロンプトを追加することで、自分のイメージしたイラストに近づけていくことができます。
人物を生成する場合は、「一人の女性、笑顔」というようにプロンプトを入れると生成されます。こまかいさらに生成したいイメージに近づけるにはさらに細かいプロンプトを入力してあげればOKです。
「被写体はなにか(何人か)、どんな構図かどんな見た目か、どこで何をしているか、どんな画風か」を指定するのがポイントです。
ある程度のプロンプトを入力してあげれば認識しますので、ざっくりと入力してどのようなイラストが生成できるかやってみましょう。
どんなイラストが欲しいかを考えて、どのような単語を入力すれば、そのイラストが生成されるかを考えましょう。あわせて見当違いの画像が生成されないようにするかも考えながらプロンプトをいれるのもポイントです。
プロンプトの基本構造と使い方
Stable Diffusionを使いこなすためには、プロンプトの基本構造とその使い方を理解することが重要です。
プロンプトは、AIにどのような画像を生成してもらいたいかを指示するためのテキスト入力であり、その書き方にはいくつかの基本があります。
プロンプトの入力方法
プロンプトの入力方法は、まずシンプルな記述から始めることが基本です。例えば、「夕日が沈むビーチ」の画像を生成したい場合、「sunset, beach」と入力すると、AIはその情景を想像して画像を生成します。
さらに、より具体的な画像を得るためには、詳細を追加することが効果的です。
「白い帆船がある、夕暮れのビーチ」と具体化すると、AIはその追加された要素を含めた画像を生成しやすくなります。
試しに生成してみましょう。
【プロンプト:sunset, beach】
【プロンプト:sunset, beach, white sailboa,】
このように生成したい画像のイメージをプロンプトに追加することで、追加した要素が加えられます。自分のイメージしている画像の要素を、プロンプトで追加して画像を生成しましょう。
ネガティブプロンプトとは?
ネガティブプロンプトは、画像生成時に除外したい要素を指定するために使います。
例えば、先ほどのイラストで桜の木を描きたくない場合、ネガティブプロンプトに「Cherry tree」と指定すると、桜の木が含まれない風景画を生成することができます。
下のイラストが実際に生成したイラストです。
このようにネガティブプロンプトには、除外したい要素をしてイラストに反映されないようにしていきます。
あわせて低画像などの要素を追加して、質の低いイラストを生成させることを防ぐために利用します。
下におすすめの除外プロンプトを置いておきますので、参考にしてください。
Poor drawing skills, not drawn in detail, unrefined, nsfw (Not Safe For Work), bad hands, worst quality, low quality, standard quality, poor promotion, out of focus, anatomically incorrect, exaggeration.watermark,signature,username,artist name
Mutation of hands and fingers, frame-out, blurred, poor anatomy, twisted anatomy, worst quality, low quality, standard quality, extra limbs, deformed hands, fused fingers, long neck, poorly drawn face, two hands, two heads, incorrect posture, crossed eyes, bad eyes, unbalanced fingers, unbalanced chest, close-up, poorly drawn face, bad proportions, blind, bad eyes, ugly eyes, lifeless eyes, vignette, out of the shooting, range,watermark,signature,username,artist name,text,
プロンプトの順序
プロンプトの単語の順序は、最初に書いたキーワードほど優先されると言われています。
AIはプロンプトを左から右に処理するため、最も重要な情報をプロンプトの始めに置くことが一般的です。
たとえば、「冬の夜明け、静かな湖の風景」よりも「静かな湖の風景、冬の夜明け」とすることで、湖の風景を主要なテーマとして強調できます。
プロンプトを効果的に使うためのテクニックとコツ
Stable Diffusionでプロンプトを用いる際、いくつかのテクニックとコツがあります。
これらを理解し適用することで、より簡単かつ効率的に高品質な画像を生成することが可能になります。
強調の値調整
プロンプトにおいて特定の要素を強調したい場合、その要素の重要度を調整することが可能です。
例えば、「明るい色の花々が目立つ森」というプロンプトでは、「明るい色」と「目立つ」を強調することで、AIが花を特に明るく、目を引くように生成します。
この技術を使うことで、生成したい画像の細かいニュアンスをコントロールすることができます。
強調する方法は、キーワードを係数で強調します。
逆に係数を1以下にして弱めることもできます。
係数を指定する
(キーワード:係数)
例:「(キーワード:1.1)」
(flower:1.1)
(flower:1.2)
(flower:1.3)
(flower, red:1.1) …
という構文でキーワードの重みを調整します。これを使ってキーワードを強調できます。
係数が1未満の場合、重要度は下がり、1を超えると重要度があがります。
数値は、0~2の間で指定します。
BREAK構文とは
BREAK構文は、プロンプト内で特定の部分に「中断」を入れ、BREAKの次に来るトークンが強調されます。
トークンについて
Stable Diffusionにおける「トークン」とは、プロンプトに入力する文字列(英単語)のことです。1単語は1トークンとしてカウントされ、区切りに使われるカンマ(,)も1トークンとみなされます。書き込んだトークンの数は、プロンプト入力ボックスの右上で確認できます。
- トークンとはプロンプトの文字列(英単語)
- 1単語は1トークン
- カンマも1トークン
- トークン数はプロンプト入力ボックスの右上で確認
プロンプトは75単語で1グループ
Stable Diffusionのプロンプトは、75トークンで1グループとなります。
グループ内では1番目のトークンが最も強く、75番目のトークンが最も弱い指示になります。
また、1グループ目の75番目のトークンよりも、2グループ目の1番目のトークン(全体で76番目のトークン)の方が強い指示となります。
- 75トークンで1グループ
- グループ内で序列あり
- グループ間でも序列あり
『Break』でグループを区切る
プロンプト内に「Break」を入れると、強制的にグループの区切りを作ります。Breakの次に来るトークンが擬似的に1番目のトークンとなり、優先順位が高くなります。
- Breakでグループ分け
- Break後のトークンは優先順位が高い
AND構文とは
AND構文は、複数の要素を同時に指定する際に用います。例えば、「赤いリンゴ AND 青い空」は、赤いリンゴと青い空の両方が含まれる画像をAIに要求することを意味します。
プロンプトの入力を効率化する方法
効率的なプロンプトの入力を実現するためには、テンプレートの活用が有効です。
事前によく使うフレーズやスタイルをテンプレートとして保存しておくことで、同じタイプの画像を生成する際に時間を節約できます。
たとえば、「青空の下の緑豊かな風景」というプロンプトをテンプレートとして設定し、必要に応じて細部を調整するだけで異なるシナリオの画像を迅速に生成することが可能です。
DreamStudioのプロンプトガイドライン
Stable Diffusion(Stability AI社)が運営するDream Studioでは、プロンプトガイドラインが公開されています。
DreamStudioのプロンプトガイドラインでは、次のポイントが重要です。
- 具体的にする: 明確な指示を与えると、期待通りの結果が得られやすいです。
- 詳細を追加: カラー、スタイル、背景などを指定して、画像の特徴を具体化します。
- 短く簡潔に: 短いプロンプトでも効果的です。
- 実験する: さまざまなプロンプトを試して最良の結果を見つけることが推奨されます。
詳細はこちらをご覧ください。
公開されているガイドラインをまとめましたのでご紹介します。以下のポイントに注意することで、より正確で魅力的な画像を生成できます。
1. 具体的にする
プロンプトは具体的であるほど、AIが意図を理解しやすくなります。
明確な指示を与えると、期待通りの結果が得られやすいです。
例:
- 悪い例: “犬”
- 良い例: “緑の草原で走るゴールデンレトリバー”
2. 詳細を追加
色、スタイル、背景などの詳細を指定することで、画像の特徴を具体化します。これにより、より望むイメージに近づけることができます。
例:
- 「赤いドレスを着た女性、夕日の下で立っている」
- 「未来的な都市、ネオンの光が輝いている夜景」
3. 短く簡潔に
プロンプトは短くても効果的です。必要な情報を簡潔に伝えることが重要です。
ポイント:
- 簡潔で明確な指示を心がける
- 不要な情報を省く
4. 実験する
さまざまなプロンプトを試して最良の結果を見つけることが推奨されます。異なる表現や詳細を追加して、生成される画像の違いを観察しましょう。
例:
- 同じテーマでも異なるスタイルや背景を試す
- 小さな変更を加えてみる
これらのガイドラインを活用することで、DreamStudioを使った画像生成がよりスムーズで効果的になります。興味のある方は、公式ガイドを参考にしてさらに詳しい情報を確認してください。
画像生成AIでイラストを作成するためのプロンプトの要素
画像生成AIを使って魅力的なイラストを作成するためには、プロンプト(指示文)の構成要素を理解することが重要です。以下に、プロンプトに含めるべき主な要素について説明します。
1. 品質 (Quality)
品質は、生成される画像の解像度やディテールのレベルを指します。高品質な画像を求める場合、プロンプトに「高解像度」や「リアルなディテール」といった表現を含めると良いでしょう。
- 高解像度
- リアルなディテール
2. コアプロンプト (Core Prompt)
コアプロンプトは、生成する画像の主要なテーマや主題を示します。この要素は最も重要で、画像生成AIが何を描くべきかを明確に伝えます。
- 緑の森の中で鹿が立っている
- 海辺で日没を眺めるカップル
3. 追加要素 (Additional Elements)
追加要素は、コアプロンプトに補完的な要素を追加します。これにより、画像に深みと詳細を加えることができます。
- 周りに小鳥が飛んでいる
- 森の中に小川が流れている
4. 背景 (Background)
背景は、主要なテーマの後ろにある環境や風景を指します。背景を具体的に指示することで、画像全体の雰囲気をコントロールできます。
- 青空
- 星空
- 霧がかかった山々
5. スタイル (Style)
スタイルは、画像のアートスタイルや美術的な方向性を決定します。特定のアートスタイルを指定することで、生成される画像の見た目が大きく変わります。
- アニメ風
- 油絵風
- サイバーパンク
6. 構図 (Composition)
構図は、画像の要素の配置や視覚的なレイアウトを指します。構図を指定することで、視覚的に魅力的な画像を生成する手助けになります。
- 中央に配置
- 斜めの視点
- パノラマ
7. 照明・フィルタ (Lighting and Filters)
照明やフィルタは、画像の光の強さや方向、フィルタの適用を指定します。これにより、画像の雰囲気やトーンを大きく変えることができます。
- 夕日の光
- ソフトな光
- モノクロフィルタ
8. カラーパレット (Color Palette)
カラーパレットは、使用する主要な色や色のトーンを指定します。特定のカラーパレットを指定することで、画像の統一感と雰囲気を強調できます。
- パステルカラー
- モノクローム
9. ムード (Mood)
ムードは、画像が伝える雰囲気や感情を示します。ムードを明確にすることで、視覚的なストーリーテリングを強化できます。
- 神秘的
- 陽気な
- 恐怖
10. 特定のディテール (Specific Details)
特定のディテールは、特定の小さなディテールやアクセントを指します。これにより、画像にユニークな特徴を加えることができます。
- キャラクターの眼鏡
- 動物の模様
これらの要素を組み合わせることで、より具体的で効果的なプロンプトを作成し、AIが生成する画像の精度や質を向上させることができます。
まとめ
本記事を通じて、Stable Diffusionを用いた画像生成のためのプロンプトについて学びました。プロンプトの基本を理解することは重要ですが、素晴らしいイラストを生成するには実際に様々なプロンプトを試してみること、そして他のAIアートクリエイターのプロンプトから学ぶことが不可欠です。
この知識を活かして、自分だけのユニークな画像を生成してみましょう。Stable Diffusionは無限の可能性を秘めています。AIを使って、創造性を解き放ち、楽しく画像を作成してみてください。それでは、Stable Diffusionの世界を存分にお楽しみください!
AIを使って楽しく好きなことを!