▲青字をクリックすると、読みたい項目まで移動できます。
✓本記事の信頼性
DALL-E3は、画像生成における革新的なツールです。しかし、その潜在能力を最大限に引き出すには適切な指示が不可欠です。
この記事では、COT(Chain of Thought)プロンプトを用いることで、DALL-E3が生成する画像の質をいかに向上させるかを探ります。
ちなみに、DALL-E3については下記の記事で詳しく解説しています。
当ブログで使っているWordpressテーマ
Contents
はじめに:COTプロンプトとは?
DALL-E3は、OpenAIが開発した革新的な画像生成AIですが、プロンプトの質によって生成される画像の完成度は大きく変わります。
ここで重要な役割を果たすのが「COT(Chain of Thought)プロンプト」です。
COTプロンプトは、AIに求める画像を生成する際の思考プロセスを段階的に説明する手法で、AIにより複雑な画像を創造させるためのテクニックです。
COTプロンプトを使用することで、AIは提供された詳細な情景や属性をもとに、意図に沿った具体的な画像を生成する能力を向上させることができます。
つまり、ユーザーの理想に近い画像を生成させる確率が上げることができるんです。
COTプロンプトの使い方
それでは、COTプロンプトの使い方を解説します。
COTプロンプトは、カスタムインストラクションを使います。カスタムインストラクションとは、AIに対して「どのように動作してほしいか」を事前に指示する設定のことです。
カスタムインストラクションについて、詳しく知りたい方は下記の記事をご覧ください。
それでは、COTブロンプとを設定していきましょう。
ChatGPT4の左下「…」のところから、「カスタム指示」を選択してください。
すると、2つの入力ボックスが表示されます。
上のボックスには、下記の文章を入力します。
※コピペして使ってください。
画像生成のための明確なイメージを描写するプロンプトを生成してください。
あなたのタスクは、ユーザーのアイディアを読み取り、非常に詳細な4つのプロンプトを作成することです。
画像の生成には、以下のステップを毎回確実に含めてください。
1.適切なイメージのスタイルを選ぶ。
2.要素(オブジェクト)+短い大きなテキストを選ぶ。
3.テキストを、テキストの内容にマッチするフォントで表示する。
以下はあなたの課題です:
ー詳細なプロンプトに取り組む前に完了しなければならない個別のアイディアリストを複数作成して、まず、提案する。
ーその後、リスト上のすべてのアイディアを上のステップバイステップの方法で完了する。
ーすべての個別のアイディアが生成された、4つの画像のための完璧な非常に詳細なプロンプトを作成できます。常に最初にスタイルから始め、次にテキスト、そして最後にオブジェクト/要素を選びます。
ープロンプトの順序が正しいことを常に確認する(スタイル、テキスト、オブジェクト/要素)
ー提案された改善に従って、新しい非常に詳細なプロンプトを作成する。
下のボックスには、下記の文章を入力します。
―詳細なプロンプトに基づいて、Dall-E3を使用して画像を生成してください。
ー画像内のテキストは英語表記にしてください。
ーデフォルトのアスペクト比は16:9です。
―各画像のシード値も忘れずに表示してください。
ー常に最初に4つの新しいアイデアを提案し、4つの画像を生成し、4つの新しいアイデアを提案してください。
ーアウトプットはすべて英語で出してください。
ー各画像のシード値も表示してください。
ちなみに、上記のCOTプロントプとは、下記の記事より、引用して改変しました。
≫生成AIでロゴ作成にチャレンジ!!ーDall-E3使用のコツ
以上で、COTプロンプトの設定は完了です。
それでは、次の見出しでCOTプロンプトの「あり」「なし」で画像の質を比較します。
COTプロンプトを「あり」「なし」で比較してみた
それでは、COTプロンプトの「あり」「なし」で比較していきます。
比較①:「健康的な食生活」のアイキャッチ画像を生成してみた
下記のプロンプトを出しました。
キーワード:「健康 食生活」
内容:健康にいい食生活を紹介する記事です。
上記記事のアイキャッチ画像を作ってください。
どうですか?COTプロンプトありの方が、よくないですか?ちなみに、DALL-E3の画像生成は、1枚しか生成しない仕様になっているようです。(2023.11.10現在)おそらく、アクセスが集中して不可を減らすためだと推察しています。少し前は2枚生成してくれたんですけどね。
比較②:「おすすめのダイエット法」のアイキャッチ画像を生成してみた
下記のプロンプトを出しました。
キーワード:「おすすめ ダイエット」
内容:おすすめのダイエット法を紹介する記事です。
上記記事のアイキャッチ画像を作ってください。
これは、「なし」の方がいいかもしれませんね。
比較③:「Googleアドセンス 合格のコツ」のアイキャッチ画像を生成してみた
下記のプロンプトを出しました。
キーワード:「Googleアドセンス 合格のコツ」
内容:Googleアドセンスに合格するコツを紹介する記事です。
上記記事のアイキャッチ画像を作ってください。
これはどっちもいいですね。ちなみに、「なし」の画像は「あり」で画像を生成した後に生成しているので、ChatGPTが学習していて、「なし」の画像の質が上がっている可能性もあると思いまう。
比較④:「おすすめ レンタルサーバー」のアイキャッチ画像を生成してみた
下記のプロンプトを出しました。
キーワード:「おすすめ レンタルサーバー」
内容:ブロガーにおすすめレンタルサーバーを紹介する記事です。
上記記事のアイキャッチ画像を作ってください。
どうですか?「あり」の方がいい感じですね。
まとめ:COTプロンプトは有能!
今回は、COTプロンプトを使ってDALL-E3の画像生成の質を上げる方法を紹介しました。
検証した結果、COTプロンプトを使う方が、画像の質はよかったように思えます。もう少し、COTプロンプトの内容を改変すれば、より質が高まる予感も感じました。
このテクニックは、AIに対する指示を明確にし、より具体的な思考過程を提供することで、望む画像を得る可能性を高めます。
これを使いこなせば、ブログやSNSの投稿に目を引く画像を加え、読者の関心を惹きつけることができるでしょう。
ちょっと宣伝!
ブロガー向けのChatGPTを使ったブログ記事の書き方を解説する記事を販売してます。毎日売り上げ実績が上がっている有益な記事です。
良かったらご覧ください。
≫ChatGPTを使って高品質なブログ記事を爆速で書くテクニック
今回は以上になります。