AI画像生成プロンプトの書き方｜Midjourney・DALL-Eで狙い通りの画像を作るコツ

2026年4月13日2026年6月10日

「AIで画像を作ってみたけど、なんかイメージと違う……」——そう感じたことはありませんか？

AI画像生成ツールは誰でも使えますが、「思い通りの画像」を出すには、プロンプト（指示文）の書き方にコツがあります。同じツールを使っていても、プロンプト次第で出力の品質はまったく変わります。

この記事では、Midjourney・DALL-E・Stable Diffusionなど主要なAI画像生成ツールで使える「プロンプトの書き方」を、コピペで試せる具体例付きで解説します。デザイン経験がなくても、7つのポイントを押さえれば、仕事で使えるレベルの画像が作れるようになります。

AI画像生成プロンプトとは？なぜ書き方で結果が変わるのか

AI画像生成のプロンプトとは、AIに「こういう画像を作ってほしい」と伝える指示文のことです。テキストを入力すると、AIがその内容を解釈して画像を生成します。

ただし、AIは人間のように「空気を読む」ことができません。「かっこいいビジネスの画像」と書いても、AIにとっては情報が足りず、意図とかけ離れた画像が出てきます。

逆に、具体的な要素を指定してあげると、驚くほど意図に近い画像が生成されます。

プロンプトの書き方	出力結果の傾向
曖昧な指示（例: かっこいい画像）	AIが勝手に解釈し、意図と異なる画像になりがち
具体的な指示（被写体・構図・スタイルを指定）	狙い通りの画像に近づく
具体的＋否定語（「〇〇は含めない」を追加）	不要な要素が排除され、さらに精度が上がる

プロンプトの書き方を知っているかどうかで、AI画像生成の実用度が大きく変わります。ここからは、実践で使える7つのポイントを順番に解説します。

AI画像生成プロンプトの基本構造｜5つの要素を押さえる

AI画像生成プロンプトには、押さえるべき基本構造があります。以下の5つの要素を順に組み立てると、安定して意図に近い画像が出力されます。

5要素のフレームワーク

#	要素	役割	例
1	被写体（Subject）	何を描くか	a business woman, a coffee cup, a city skyline
2	スタイル（Style）	どんなテイストか	flat illustration, watercolor, photorealistic
3	構図（Composition）	どう配置するか	close-up, bird’s eye view, centered
4	背景（Background）	周囲の環境	white background, modern office, gradient blue
5	雰囲気（Mood/Lighting）	印象と光の方向	warm lighting, professional, minimalist

この5要素をすべて含める必要はありません。ただ、「被写体」と「スタイル」の2つだけでも明示するだけで、出力の安定感が格段に上がります。

実際にこのフレームワークで書いたプロンプト例を見てみましょう。

# 曖昧なプロンプトビジネスの画像を作って # 5要素を含めたプロンプト A business woman giving a presentation in a modern conference room, flat illustration style, wide shot composition, bright office background with large windows, warm and professional lighting

後者は被写体（ビジネスウーマン）・スタイル（フラットイラスト）・構図（ワイドショット）・背景（明るいオフィス）・雰囲気（温かくプロフェッショナル）がすべて含まれています。AIが迷う余地が減り、安定した出力になります。

【コツ1】被写体は「名詞＋形容詞＋行動」で具体化する

プロンプトの核となる被写体は、ただ名詞を書くだけでは不十分です。「誰が・どんな状態で・何をしているか」まで指定すると、AIの解釈のブレが減ります。

抽象的な指定	具体的な指定
a man	a young Asian business man in a navy suit, smiling
a cat	a fluffy orange tabby cat sleeping on a windowsill
a building	a modern glass office tower reflecting sunset light

ポイントは3つです。

・属性を足す: 年齢・服装・色・素材などの形容詞を加える
・動作を加える: 「座っている」「プレゼンしている」「歩いている」など、何をしているかを書く
・数量を明示する: 「3人のチーム」「2台のモニター」のように、数を指定すると構図が安定する

ただし、詰め込みすぎると逆効果です。1つのプロンプトで指定する被写体の情報は3〜5個の形容詞程度に収めるのが実用的です。

【コツ2】スタイル指定で「テイスト」をコントロールする

同じ被写体でも、スタイルの指定で出力の印象がまったく変わります。ビジネス用途で使う頻度が高いスタイル指定をまとめました。

スタイル指定	出力の傾向	向いている用途
flat illustration	シンプルなベクター風イラスト	ブログのアイキャッチ、スライド資料
photorealistic	写真のようにリアルな画像	広告バナー、SNS投稿
watercolor painting	水彩画タッチの柔らかい表現	ブランディング素材、招待状
isometric illustration	斜め上から見下ろした立体図	サービス説明図、インフォグラフィック
minimalist vector	要素を極力削ったシンプルなベクター	アイコン、ロゴ素材
3D render	立体的でツヤのあるCG風	プロダクト画像、モックアップ

プロンプトの実例です。同じ被写体に異なるスタイルを指定した場合の違いを確認してみてください。

# フラットイラスト版 A team of 4 people working around a desk with laptops, flat illustration style, white background, bright colors # フォトリアリスティック版 A team of 4 people working around a desk with laptops, photorealistic, natural window light, shallow depth of field # アイソメトリック版 A team of 4 people working around a desk with laptops, isometric illustration, pastel colors, clean white background

スタイル指定は1つに絞るのが基本です。「flat illustration and watercolor」のように複数指定すると、AIが混乱して中途半端な出力になることがあります。

【コツ3】「ネガティブプロンプト」で不要な要素を排除する

プロンプトで「何を描くか」を指定するのと同じくらい重要なのが、「何を描かないか」を伝えることです。これをネガティブプロンプトと呼びます。

ネガティブプロンプトの指定方法はツールによって異なります。

ツール	ネガティブプロンプトの書き方
Midjourney	–no text, –no watermark のようにパラメータで指定
DALL-E（ChatGPT経由）	プロンプト内に「do not include text or watermarks」と自然言語で記述
Stable Diffusion	専用の「Negative prompt」入力欄に指定

ビジネス用途で特によく使うネガティブプロンプトを紹介します。

# よく使うネガティブプロンプト（Stable Diffusion形式） text, watermark, logo, signature, blurry, low quality, extra fingers, deformed hands, distorted face # Midjourney形式 --no text, watermark, logo, blurry, extra fingers # DALL-E形式（本文に含める） Do not include any text, watermarks, logos, or signatures in the image.

特に「text」と「watermark」は必ず入れることをおすすめします。AI画像生成は意味不明な文字列やロゴのようなものを勝手に描き込む癖があり、ビジネス資料に使う際の大きな障害になります。

また「extra fingers（余分な指）」「deformed hands（変形した手）」は、AI画像生成の代表的な弱点です。人物画像を生成する場合は、これらをネガティブプロンプトに入れておくと品質が安定します。

【コツ4】構図とカメラアングルを指定する

プロンプトに構図やカメラアングルの指示を加えると、画像のレイアウトをコントロールできます。これはブログのアイキャッチやSNSバナーなど、テキストを重ねる前提の画像を作るときに特に重要です。

構図の指定	効果	使いどころ
close-up shot	被写体を大きく映す	人物のポートレート、商品詳細
wide shot	全体を広く映す	オフィス風景、チーム作業の全体像
bird’s eye view	真上から見下ろす	デスク上のアイテム配置、フラットレイ
low angle	下から見上げる	建物の迫力、人物の威厳を強調
centered composition	被写体を画面中央に配置	アイキャッチ画像、シンボル的な表現
rule of thirds	三分割法で被写体を配置	自然なバランスの風景・人物写真

実務で使える具体例です。ブログのアイキャッチ画像を作る場合を想定しています。

# アイキャッチ画像向け（テキストを載せる余白を確保） A laptop on a clean desk with a cup of coffee, flat illustration style, bird's eye view, large empty space on the right side for text overlay, soft pastel background, minimalist # SNSバナー向け（横長でインパクト重視） A futuristic AI robot hand reaching toward a human hand, photorealistic, close-up shot, dramatic lighting, dark background, 16:9 aspect ratio

テキストを重ねる予定がある画像では、「large empty space on the right side」のように余白の位置を指定するのが実用的なテクニックです。

【コツ5】アスペクト比とサイズを指定する

用途に合ったアスペクト比を指定することで、トリミングの手間を省き、そのまま使える画像を生成できます。

アスペクト比	用途	Midjourneyでの指定
16:9	ブログアイキャッチ、YouTube サムネイル、OGP画像	–ar 16:9
1:1	Instagramフィード、プロフィール画像	–ar 1:1
9:16	Instagram Stories、TikTok	–ar 9:16
4:3	プレゼン資料（横向き）	–ar 4:3
3:4	ポートレート、縦長バナー	–ar 3:4

ツールごとのアスペクト比の指定方法です。

# Midjourney A modern office workspace, flat illustration --ar 16:9 # DALL-E（ChatGPT経由） Create a 16:9 horizontal image of a modern office workspace in flat illustration style. # Stable Diffusion（設定画面で指定） Width: 1920, Height: 1080（16:9の場合）

ブログやWebサイトで使う画像は16:9、SNS投稿は各プラットフォームの推奨サイズに合わせて生成するのが基本です。最初から正しいアスペクト比で生成しておけば、後からトリミングして構図が崩れるリスクを避けられます。

【コツ6】「参考スタイル」を伝える表現を活用する

具体的なアーティストの名前を指定する方法は著作権上のリスクがあるため、避けるのが安全です。代わりに、スタイルの特徴を言葉で伝える表現を使います。

伝えたいスタイル	プロンプトでの表現方法
ジブリ風の温かみ	warm hand-drawn anime style, soft natural lighting, detailed nature backgrounds
Apple風のミニマルデザイン	minimalist product photography, clean white background, subtle shadows, premium feel
レトロポスター風	vintage travel poster style, bold colors, art deco typography layout, grain texture
サイバーパンク風	neon-lit cyberpunk city, dark atmosphere, glowing purple and blue lights, rain reflections

スタイルの特徴を分解して言語化するのがポイントです。「〇〇風」という曖昧な表現ではなく、色・質感・光・構成要素を具体的に書きます。

# 企業ブログで使いやすい「クリーンなテック系」スタイル A person using a tablet to analyze data charts, clean corporate illustration style, soft gradient background in blue and white, flat vector elements, professional and modern feel, no text or logos # 温かみのある「手描き風」スタイル A cozy home office with plants and books, hand-drawn illustration with soft watercolor textures, warm earth tones, natural window light, slightly rough brush strokes, inviting atmosphere

ビジネスで安全に使えるスタイル表現を自分のテンプレートとして持っておくと、毎回ゼロからプロンプトを考えずに済みます。

【コツ7】ツール固有のパラメータを使いこなす

Midjourney・DALL-E・Stable Diffusionには、それぞれ固有のパラメータがあります。基本のプロンプトに加えて、これらのパラメータを使うことで出力品質をさらに引き上げられます。

Midjourneyの主要パラメータ

パラメータ	機能	使い方の例
–ar	アスペクト比	–ar 16:9
–v	モデルバージョン	–v 6（最新版を指定）
–s	スタイライズ（芸術性の度合い）	–s 250（デフォルト）〜 –s 750（芸術的）
–no	ネガティブプロンプト	–no text, watermark
–q	画質	–q 2（高品質）

# Midjourneyのパラメータ活用例 A professional business team in a meeting room, flat illustration, warm lighting, modern interior --ar 16:9 --v 6 --s 100 --no text, watermark, logo

スタイライズ値（–s）は、低いほどプロンプトに忠実で、高いほどAIの芸術的な解釈が強くなります。ビジネス用途では –s 50〜150 程度に抑えるとコントロールしやすくなります。

DALL-E（ChatGPT経由）のコツ

DALL-Eはパラメータ形式ではなく、自然言語でリクエストします。ChatGPT経由で使う場合のコツは以下の通りです。

・サイズを明示する: 「1792×1024の横長画像で」のように具体的に指定する
・スタイルを具体的に書く: 「digital illustration」「photorealistic photograph」など明確に
・やり取りで追い込む: 1回の生成で完璧を目指さず、「もう少し明るく」「人物を左寄りに」と調整する

Stable Diffusionの主要設定

Stable Diffusionはローカル環境やWebUIで使う場合、以下の設定が出力品質に大きく影響します。

・サンプリングステップ数: 20〜30が実用的な範囲。少なすぎると粗く、多すぎると時間がかかる
・CFGスケール: 7〜12がバランスの良い範囲。低いとAIの自由度が高く、高いとプロンプトに忠実
・シード値: 気に入った画像のシード値を記録しておくと、同じ構図で微調整ができる

業務シーン別プロンプトテンプレート｜コピペで即使える

ここまでのコツを踏まえて、よくあるビジネスシーン向けのプロンプトテンプレートを用意しました。そのままコピーして使えます。

ブログのアイキャッチ画像

[メインの被写体を記入] on a clean workspace, flat illustration style, centered composition, dark gray (#333333) background, professional and modern feel, 16:9 aspect ratio, no text or watermarks

SNS投稿用の目を引く画像

[メインの被写体を記入], vibrant and eye-catching colors, bold composition, clean background with gradient, modern digital illustration style, 1:1 aspect ratio, no text or logos

プレゼン資料のイメージ図

[概念やプロセスを記入], isometric illustration style, clean white background, soft pastel colors, simple and clear layout, corporate and professional feel, 4:3 aspect ratio, no text

商品・サービスのイメージ画像

[商品/サービスの利用シーンを記入], photorealistic style, soft natural lighting, shallow depth of field, warm color tone, premium and trustworthy atmosphere, 16:9 aspect ratio, no watermarks or text

テンプレートの[メインの被写体を記入]部分を差し替えるだけで、統一感のある画像が作れます。チームで画像を量産するときに、プロンプトテンプレートを共有しておくと品質のバラつきを防げます。

うまくいかない時の対処法｜よくある失敗と改善策

AI画像生成でプロンプトを書いても、最初から完璧な画像が出ることはまれです。よくある失敗パターンと、その改善策を紹介します。

失敗1: 意味不明な文字が画像に描き込まれる

・原因: AIは文字を「模様」として描く傾向がある
・対策: ネガティブプロンプトに「text」「letters」「words」を追加する。Midjourneyなら –no text

失敗2: 人物の手や指が不自然

・原因: AI画像生成は指の本数や関節の曲がり方を正確に再現するのが苦手
・対策: ネガティブプロンプトに「extra fingers, deformed hands」を追加。手を写さない構図（上半身のみ、後ろ姿）にする方法も有効

失敗3: スタイルが混ざって中途半端になる

・原因: 複数のスタイル指定（例: watercolor and photorealistic）が競合している
・対策: スタイル指定は1つに絞る。どうしても混ぜたい場合は、割合を指定する（例: 「80% flat illustration with subtle watercolor textures」）

失敗4: 構図が意図と違う

・原因: 構図やカメラアングルの指示が不足している
・対策: 「close-up」「wide shot」「bird’s eye view」などの構図指定を必ず加える

失敗5: 画像が暗い・色味が地味

・原因: 照明や色の指定がないとAIの判断任せになる
・対策: 「bright and vivid colors」「warm studio lighting」「high key lighting」などを追加

共通するポイントは、「うまくいかなかった要素を特定して、その要素だけを修正する」ことです。プロンプト全体を書き直すのではなく、1〜2語の追加・変更で改善することがほとんどです。

AI画像生成の注意点｜著作権とビジネス利用のルール

AI画像生成を業務で使う際に必ず把握しておくべき注意点があります。

著作権の現状（2026年4月時点）

・日本の法制度: 現時点で明確な判例は少なく、AI生成画像の著作権の扱いは議論が続いている。「人間の創作的な関与」がなければ著作物として認められない可能性がある
・実務上の対応: AI生成画像をそのまま著作物として登録・権利主張するのは避け、素材として使う（加工・編集を加える）のが安全
・他者の著作物との類似: 既存の作品と酷似した画像を生成・利用するとトラブルになるリスクがある

各ツールの商用利用規約（2026年4月時点）

ツール	商用利用	条件
Midjourney	有料プランで可能	年間収益100万ドル以上の企業はPro/Mega Planが必要
DALL-E（ChatGPT経由）	可能	有料・無料プラン問わず商用利用可（OpenAI利用規約に準拠）
Stable Diffusion	可能	オープンソースモデルは基本的に商用利用可（ライセンスはモデルによる）

利用規約は頻繁に更新されるため、業務で本格的に使い始める前に最新の規約を確認してください。

社内利用のルール整備

・用途の線引き: 社内資料には自由に使う、社外公開物にはレビューを通す——といった運用ルールを決めておく
・クレジット表記: 「AI generated image」等の表記を入れるかどうか、社内で方針を統一する
・素材の管理: 誰がどのプロンプトで生成した画像かを記録しておくと、後からトラブルがあった際に対応しやすい

本記事のまとめ

ポイント	内容
プロンプトの基本構造	被写体・スタイル・構図・背景・雰囲気の5要素を押さえる
被写体の具体化	名詞＋形容詞＋行動で、AIの解釈のブレを減らす
スタイル指定	flat illustration, photorealistic等を1つに絞って指定する
ネガティブプロンプト	text, watermarkは必ず除外。人物画像ではextra fingersも追加
構図・アスペクト比	用途に合った構図とサイズを最初から指定し、後からのトリミングを避ける
ツール固有パラメータ	Midjourney –ar/–s/–no、Stable Diffusion CFGスケール等を使いこなす
著作権・商用利用	ツールの利用規約を確認し、社内運用ルールを整備する