ChatGPTを使って画像を生成したい
ChatGPTを使っている人なら、ChatGPTでリアルな画像を生成したいと考えることでしょう。しかし、ChatGPTは直接画像を生成することはできません。
「では、結局ChatGPTで画像は生成できないの?」
と思うかもしれませんが、ChatGPTの機能を活用することで間接的に画像を生成することは可能です。
この記事では、どのようにChatGPTを使って画像生成するのか、ChatGPTを使って画像生成する際のおすすめツール、画像生成する際に注意すべき点などを解説していきます。

ChatGPTは画像を直接生成する機能は備わっていませんが、画像生成AIで画像を生成するためのプロンプトを精度高く作ることが可能です。
ぜひ、ChatGPTと他の画像生成AIを活用して画像生成を楽しんでください。
ChatGPTで画像生成はできない
結論、ChatGPTで画像を生成することはできません。というのも、ChatGPT自体はテキストベースであり、画像生成は直接的にはサポートされていないからです。
例えば、あなたがChatGPTに「春の森の描写をしてください」と指示したとき、ChatGPTは詳細なテキスト描写を生成しますが、具体的な画像を作り出すことはできません。
しかし、これはChatGPTが画像生成の可能性を全く持っていないわけではなく、他のツールやプラグインと組み合わせることで画像生成AIで画像生成をする際のプロンプトを作成してくれたりなど、間接的に画像生成を実現することが可能です。それについては後のセクションで詳しく説明します。
ChatGPTで画像の読み込み・編集はできない
ChatGPTは基本的にはテキストからテキストへの変換モデルであり、画像や他のメディア形式を直接扱うことはできません。そのため、もし画像生成や編集が必要な場合、その目的に適した他のAIツールを検討する必要があります。
ただし、最近ではChatGPTを拡張して画像を扱うためのプラグインも出てきています。これらはあくまで補助的なものであり、それ自身が画像を生成や編集する機能を持つわけではありませんが、ChatGPTと併用することでよりリッチなコンテンツ作成が可能になります。具体的な使用方法やその効果については、別途詳しく紹介します。
プラグイン”SceneXplain”を使えば画像は読み込める
ChatGPTが元々画像生成や編集には対応していない中、プラグイン”SceneXplain”はそのギャップを埋めてくれます。このプラグインは、ChatGPTが画像を認識し、それについての詳細な説明を生成することを可能にします。
まず、”SceneXplain”をChatGPTに組み込むためには、適切な設定とアクティベーションが必要です。
SceneXplainは、ChatGPTの有料プランでのみ利用可能なプラグイン機能のひとつです。最初にChatGPTの有料プラン「ChatGPT Plus」に登録する必要があります。
以下が有料プランの登録フローです。
- ChatGPT (無料版) 画面に接続し、通常のチャット画面を表示
- 画面左下の「Update to Plus」をクリック
- 既に登録している無料版と有料版の詳細を簡易的に比較した画面が表示されるので、「Upgrade plan」をクリック
- 支払い方法入力欄と「申し込む」というボタンが表示されるので、必要情報を入力し、「申し込む」をクリック
- 登録完了
以下の記事はChatGPTの有料版について解説していますので、併せてご覧ください。
ChatGPTの有料プラン「ChatGPT Plus」に登録後、GPT-4を選択します。
「Plugins」から「Plugin store」に移動し、”SceneXplain”と検索します。SceneXplainがでてくるのでインストールすれば準備完了です。
実際にSceneXplainを使ってみます。
GPT-4の画面からSceneXplainにチェックを入れ、SceneXplainを有効化します。
SceneXplainは、画像のURLから画像を解析し、テキスト化します。
実際に、以下の金閣寺の画像を解析してみました。
飼い猫の話は謎ですが、だいたい合ってます。
ただし、このプラグインはあくまで画像認識と説明生成の機能を持つものであり、画像の生成や編集そのものは行えません。それらの作業には、別途専門のツールやAIを使用する必要があることをご了承ください。
ChatGPTを画像生成に活用する3つの方法
ChatGPTを画像生成に活用するのに、以下3つの方法があります。
- 画像生成AI用のプロンプトを作成する
- ChatGPT以外の画像生成AIツールを使う
- 画像生成に特化したChatGPTのプラグインを使う
それぞれ見ていきましょう。
画像生成AI用のプロンプトを作成する
ChatGPT自体では画像を生成することはできませんが、
画像生成AIで入力する際のプロンプトを作成することは可能です。
画像生成AIは、海外で開発されたものが大半です。入力する際のプロンプトは英語のほうが精度の高い画像を生成することが可能です。また、指示も詳細であるほど、イメージに沿った画像を作成することが可能です。
そこでChatGPTを使うと、日本語の指示を詳細な英語のプロンプトに変換することが可能です。生成方法は、ChatGPTに「画像生成用のプロンプトを英語で作ってください」と指示するだけです。
ChatGPT以外の画像生成AIツールを使う
ChatGPT以外にも、画像生成に特化したAIツールは多数存在します。以下に、その中でも特におすすめの4つを紹介します。
- BingAI
- Bing Image Creator
- AIイラストくん
- Visual ChatGPT
これらのツールはそれぞれ特性が異なりますので、用途に合わせて使い分けると良いでしょう。
BingAI
Bing AIとは、マイクロソフトが開発した人工知能技術の一つで、検索エンジン「Bing」に搭載されています。ユーザーが入力したキーワードや疑問文に対して、最適な情報を即時に提供します。テキストから画像を生成することも可能です。
また、画像を解析することも可能で、画像が何であるかをテキストで答えてくれます。
Bing AIは言語モデルにChatGPTの有料版と同様の言語モデルであるGPT–4を利用しています。
そのため、Bing AIもChatGPTの有料版と同様に画像を解析することが可能なのです。
Bing Image Creator
Bing Image Creatorは、Microsoft社が運営している画像生成AIツールです。ChatGPTの運営元であるOpenAIが開発した「DALL·E2」を使用しており、作成したい画像をイメージしたプロンプトを入力することで、プロンプトに沿った画像を4枚作成することが可能です。
Bing Image Creatorは、Microsoftアカウントを保有していれば誰でも無料で利用可能です。
AIイラストくん
AIイラストくんは、LINEに追加するだけで画像を生成できるツールです。英語だけでなく日本語も対応しており、クオリティの高い画像を簡単に生成することが可能です。
イラスト/人物/風景で生成する画像のテイストを選ぶこともできるので、気軽に画像を生成したい人にはぴったりでしょう。
Visual ChatGPT
Visual ChatGPTは、ChatGPTをもとにして開発された画像生成AIツールです。現在はオープンソース化されており、無料で利用することが可能です。Visual ChatGPTの「公式サイト」にアクセスし「Stable Diffusion」をクリック。
テキスト入力欄に英語のプロンプトを入力して、「Generate image」を押すことで画像を生成できます。
画像生成に特化したChatGPTのプラグインを使う
ChatGPTは、自然言語処理で優れたパフォーマンスを発揮しますが、直接的な画像生成はサポートしていません。しかし、Argil AI、MixerBox ImageGenなど特定のプラグインを利用することで間接的に画像生成を行うことが可能になります。
まだプロンプト生成の精度はイマイチなところはありあますが、ChatGPTのプラグインを利用することで、画像生成AIツールで利用できる詳細なプロンプトを作成することができます。
しかし、プラグインに関してはChatGPT無料版では利用できません。プラグインを利用する場合、ChatGPT有料版にプランをアップグレードする必要があります。
ChatGPTの おすすめプラグインについては以下の記事でも解説しています。
ChatGPTのプラグイン”Photorealistic”を使う
ChatGPTには”Photorealistic”というプラグインがあり、これを用いることでリアルな画像を生成するためのプロンプトをつくることができます。Photorealisticは画像生成AI「Midjourney」で利用するプロンプトの作成に特化しているプラグインです。
プラグインなので、ChatGPTの有料機能になります。
ChatGPTの有料版にアップグレードし、プラグインをインストールして利用できます。
ChatGPTの有料プラン「ChatGPT Plus」に登録後、GPT-4を選択します。
「Plugins」から「Plugin store」に移動し、”Photorealistic”と検索します。Photorealisticがでてくるのでインストールすれば準備完了です。
実際にPhotorealisticを使ってみます。
GPT-4の画面からPhotorealisticにチェックを入れ、Photorealisticを有効化します。
Photorealisticがセットされるので、テキストボックスに指示を打ち込みます。
以下のテキストを打ってみました。
ミッドジャーニー(Midjourney)用のリアルな日本刀を持った日本人女性のプロンプトを5個書いてください。英語でお願いします。 |
すると、ChatGPTがMidjourneyで利用できるプロンプトを5つ作成してくれました。
実際のテキストはこちらです。
①
A Japanese woman in traditional kimono holding a katana, standing in a serene bamboo forest.Medium: High-resolution digital photographyStyle: Influenced by the works of Japanese photographer Daido Moriyama, with a touch of Akira Kurosawa's cinematic flairLighting: Soft, natural lighting filtering through the bamboo leaves, creating dappled shadows on the subjectColors: Earthy tones, with pops of vibrant red and indigo from the kimonoComposition: Shot with a Canon EOS-1D X Mark III, EF 70-200mm f/2.8L IS III USM lens, Resolution 20.1 megapixels, ISO 100, Shutter speed 1/200 second--ar 16:9 --v 5.1 --style raw --q 2 --s 750
②
A Japanese woman in modern attire, holding a katana over her shoulder, set against the Tokyo skyline at dusk.Medium: High-resolution digital photographyStyle: A blend of contemporary Japanese street photography and cyberpunk aestheticsLighting: Neon lights from billboards and signs illuminating the subjectColors: High contrast, with a palette dominated by neon blues, pinks, and purplesComposition: Shot with a Sony Alpha 1, FE 24-70mm f/2.8 GM lens, Resolution 50.1 megapixels, ISO 400, Shutter speed 1/60 second--ar 16:9 --v 5.1 --style raw --q 2 --s 750
③
A Japanese woman in a samurai armor, holding a katana, standing in front of an ancient Japanese castle.Medium: High-resolution digital photographyStyle: Reminiscent of classic Japanese woodblock prints, with a modern twistLighting: Golden hour lighting, casting a warm glow on the subject and the castleColors: Rich, saturated colors with a focus on golds, blacks, and redsComposition: Shot with a Nikon D850, AF-S NIKKOR 85mm f/1.4G lens, Resolution 45.7 megapixels, ISO 64, Shutter speed 1/250 second--ar 16:9 --v 5.1 --style raw --q 2 --s 750
④
A Japanese woman in casual clothing, holding a katana, standing in a modern Japanese apartment with minimalist design.Medium: High-resolution digital photographyStyle: Inspired by the minimalism of Japanese interior design magazinesLighting: Soft, ambient lighting from floor lamps and natural light from windowsColors: Neutral palette with whites, grays, and natural wood tonesComposition: Shot with a Fujifilm GFX 100, GF 32-64mm f/4 R LM WR lens, Resolution 102 megapixels, ISO 100, Shutter speed 1/125 second--ar 16:9 --v 5.1 --style raw --q 2 --s 750
⑤
A Japanese woman in a white ceremonial kimono, holding a katana, standing in a Shinto shrine.Medium: High-resolution digital photographyStyle: Evokes the ethereal beauty found in traditional Japanese paintingsLighting: Soft, diffused lighting to create a mystical atmosphereColors: Whites and soft pastels, with gold accentsComposition: Shot with a Leica M10-R, Summilux-M 50mm f/1.4 ASPH lens, Resolution 40.89 megapixels, ISO 100, Shutter speed 1/60 second--ar 16:9 --v 5.1 --style raw --q 2 --s 750
⑥
A Japanese woman in a Yakuza-inspired tattoo bodysuit, holding a katana, in a dimly lit underground bar.Medium: High-resolution digital photographyStyle: A gritty, Tarantino-esque atmosphereLighting: Low-key lighting with dramatic shadowsColors: Dark, moody tones with splashes of red and neonComposition: Shot with a Panasonic Lumix S1R, Lumix S 50mm f/1.4 lens, Resolution 47.3 megapixels, ISO 800, Shutter speed 1/80 second--ar 16:9 --v 5.1 --style raw --q 2 --s 750
ChatGPTが作ったプロンプトで実際に画像生成してみた
midjourney
最初に、midjourneyで画像を生成するために必要なプロンプトをChatGPTで作成します。
ChatGPTに対して以下の指示を行いました。
ミッドジャーニー(Midjourney)用のリアルな赤いスーパーカーを運転している日本人女性のプロンプトを5個書いてください。英語でお願いします。 |


以下が、ChatGPTが作成したプロンプトのテキストです。
Yumi, a Japanese woman in her early 30s, has always been fascinated by speed and engineering. She finally gets the opportunity to drive a red supercar on the famous Hakone Turnpike. As she navigates the winding roads, she receives an urgent call that her childhood friend is in trouble. Describe her high-speed journey back to Tokyo, balancing the thrill of the drive with the weight of her friend's situation.
Saki, a renowned Japanese automotive journalist, is given the task to review a brand-new red supercar for her magazine. She decides to take it on a road trip from Osaka to Kyoto, documenting her experience. Along the way, she encounters a mysterious traveler who seems to know a lot about her and the car. Who is this person, and how do they change the course of Saki's "Midjourney"?
Keiko, a Japanese entrepreneur, has just closed a major deal and decides to celebrate by renting a red supercar for the weekend. She embarks on a journey to Mount Fuji. However, her trip takes an unexpected turn when she discovers a hidden village that doesn't appear on any map. What secrets does this village hold, and how does her supercar play a role in uncovering them?
Mika, a Japanese race car driver, is on a hiatus from her career. She takes her red supercar on a journey to find inspiration. Along her "Midjourney," she meets a young boy who dreams of becoming a racer but lacks the resources. Describe how Mika mentors the boy and rediscovers her own passion for racing.
Naomi, a Japanese architect, is driving her red supercar to a secluded retreat to work on her latest project. On her way, she encounters a series of natural obstacles like landslides and floods. Describe her journey as she uses the advanced features of her supercar to navigate through these challenges, all while contemplating the relationship between technology and nature.
こんな感じでプロンプトを5つ作成することができました。このプロンプトをmidjourneyに打ち込むと、このような画像を生成できました。


Stablediffusion
まず、ChatGPTでプロンプトを作成します。
ChatGPTで、以下の指示を入力してみました。
【ルール】 AIに画像生成の指示を出すプロンプトを作成します。 これから入力するテキストを、形容詞・動詞・名詞のみを使用してキーワードリストを作成してください。 英語のキーワードにしてください。 キーワード数は10個以上、30個以内にしてください。 その他の情報は必要ありません。 【フォーマット】 keyword, keyword, keyword, (以下ループ) |
実際にChatGPTが出力したプロンプトがこちらです。
和訳すると、こんな感じです。
夕焼け, 海, ヤシの木, シルエット, 鮮やか, 反射, ヨット, カモメ, 静か, 黄金の空, 波, トロピカル, 水平線, 雲, 揺らめき, 遠く, 光る, 平和, 流木, 足跡 |
こちらのプロンプトを使い、Stablediffusionで画像を生成してみます。
Stablediffusionが無料で利用できる、Hugging Faceを使ってこのプロンプトを打ち込み、画像を作ってみました。
結果的に、こちらの画像が生成できました。
流木はないですが、だいたいイメージ通りの画像ができました。
ChatGPTで作成した画像の著作権について
ChatGPTで作成した画像の著作権については、プロンプト作成者と生成元のデータに基づく権利者の間で分けられます。
具体的には、ChatGPTで生成した文章を元に作成した画像の著作権は基本的に作成者にあります。しかし、生成する画像に特定のキャラクターや著作物を含む場合、その権利は当該キャラクターや著作物の著作権保有者に帰属します。
ChatGPTの商用利用は可能
ChatGPTは、自然言語処理のAI技術を用いた文章作成ツールであり、その商用利用は確かに可能です。しかし、具体的な使用方法や利用範囲については、公式の「OpenAI利用規定」を参照することが推奨されます。
「OpenAI利用規定」には以下の通りの記載があります。
(a) Your Content. You may provide input to the Services (“Input”), and receive output generated and returned by the Services based on the Input (“Output”). Input and Output are collectively “Content.” As between the parties and to the extent permitted by applicable law, you own all Input. Subject to your compliance with these Terms, OpenAI hereby assigns to you all its right, title and interest in and to Output. This means you can use Content for any purpose, including commercial purposes such as sale or publication, if you comply with these Terms. OpenAI may use Content to provide and maintain the Services, comply with applicable law, and enforce our policies. You are responsible for Content, including for ensuring that it does not violate any applicable law or these Terms. |
ChatGPTに和訳させてみました。
(a) あなたのコンテンツ。あなたはサービスに入力(「入力」)を提供することができ、その入力に基づいてサービスによって生成され返される出力(「出力」)を受け取ることができます。入力と出力は合わせて「コンテンツ」とします。当事者間および適用可能な法律が許す範囲で、あなたはすべての入力を所有します。これらの利用規約に従っている限り、OpenAIは出力に対するすべての権利、所有権、および利益をあなたに譲渡します。これは、これらの利用規約に従っている場合、あなたがコンテンツを販売や出版などの商用目的を含む任意の目的で使用できることを意味します。OpenAIは、サービスの提供と維持、適用可能な法律の遵守、および私たちのポリシーの施行のためにコンテンツを使用することがあります。あなたはコンテンツに対して責任を持ち、それが適用可能な法律またはこれらの利用規約に違反しないように確保する責任があります。 |
なお、ChatGPTを使った商用利用の一例として画像生成のほか、ブログ記事作成、メール作成、広告コピー作成などがあります。これらの活用例は、時間を節約し、より効率的に作業を進めることができる点で、多くのビジネスパーソンにとって有用です。
ただし、ChatGPTの出力したテキストや生成した画像については、その著作権や使用許可に関する注意が必要です。
画像の無断使用は著作権侵害に当たる
ChatGPTを用いて画像生成をする際、一つ明確に理解しておくべき点があります。それは「画像の無断使用は著作権侵害に当たる」という事実です。
たとえば、あるアーティストが作成した画像を、そのアーティストの許可無くChatGPTを使って変更したり、利用したりすることは、そのアーティストの著作権を侵害する行為となります。
ChatGPTで画像を生成する際には、これらの著作権のルールをきちんと理解し、適切な使用が必要となります。
ChatGPTで画像を作成する際には著作物の権利者を確認しよう
ChatGPTを使って画像生成を行う際、著作物の権利を侵害しないよう注意が必要です。具体的には、以下の2点に気をつけましょう。
- 使用する素材の著作権: もし画像生成に既存の画像やイラストを素材として使用する場合は、その使用許諾を確認してください。著作権は制作者にあり、その許諾なく商用利用すると侵害となります。フリー素材の使用も一つの手段です。
- 生成された画像の著作権: AIが生成した画像の著作権は、一般的にはAIの開発者または使用者にあります。ただし、AIの利用規約により異なる場合があるので、必ず確認しましょう。
以上の点を踏まえ、ChatGPTでの画像生成は、いつでも著作権に配慮した上で行うべきです。
まとめ|ChatGPTのプラグイン機能と他の画像生成AIを組み合わせることで画像生成能
本記事では、ChatGPTで画像生成が可能かという問いについて詳しく探求しました。結論としては、ChatGPT自体は直接的な画像生成はできませんが、プラグインや他のAIツールを併用して間接的に画像生成を行うことが可能です。
ぜひ、ChatGPTを介した画像生成の新たな可能性に挑戦してみてください。ただし、生成した画像の商用利用には注意が必要であり、著作権侵害にならないように配慮することが重要です。