Skip to content

图像生成 Prompt

AI 图像生成的质量,70% 取决于 Prompt 的质量。不同模型有不同的"语言习惯",掌握正确的写法能让出图质量翻倍。

Prompt 基本结构

一个完整的图像 Prompt 通常包含 5 个层次:

[主体] + [场景/环境] + [风格/媒介] + [光线/氛围] + [构图/视角]

各层次详解

层次说明示例
主体画面中心是什么一只橘猫、一位女性、一栋建筑
场景在哪里、什么环境在咖啡馆窗边、雨后的东京街头
风格什么画风、什么媒介水彩风、赛博朋克、产品摄影
光线什么光照氛围金色夕阳、柔和的工作室灯光、霓虹灯
构图什么角度和画面比例特写、俯视、广角、居中对称

各模型的 Prompt 风格差异

GPT Image 2 — 自然语言描述

GPT Image 理解完整的自然语言句子,适合用"讲故事"的方式描述。

一张产品宣传图:一副无线降噪耳机放在大理石桌面上,
旁边有一杯拿铁和一本打开的书。
柔和的自然光从左侧窗户照入,背景虚化。
风格:极简产品摄影,干净的白色调。
图中包含文字 "SoundPro X1" 在耳机下方,字体现代简洁。

GPT Image 的独特优势:文字渲染

设计一张社交媒体封面图:
- 背景:渐变色(深蓝到紫色)
- 主标题:"AI 模型怎么选?" 白色粗体,居中
- 副标题:"5分钟搞懂" 浅灰色小字,在主标题下方
- 右下角小字:"MetaChat 出品"
- 整体风格:科技感、简洁、专业

Midjourney — 关键词堆叠 + 参数

Midjourney 更适合用关键词组合,用逗号分隔,重要的放前面。

portrait of a cyberpunk samurai, neon-lit Tokyo alley,
rain reflections, dramatic lighting, cinematic composition,
detailed armor with glowing circuits, moody atmosphere,
8K, ultra detailed --ar 16:9 --style raw --v 7

Midjourney 参数速查:

  • --ar 16:9 画面比例
  • --style raw 减少 MJ 默认美化,更忠实于 prompt
  • --chaos 30 增加随机性和多样性(0-100)
  • --no text, watermark 排除不想要的元素

Nano Banana 2 (Gemini 3.1 Flash Image) — 平衡型

兼顾自然语言和关键词,速度快,适合快速迭代。

一位年轻女性程序员在现代办公室里工作,
面前有两个显示器显示代码,桌上有咖啡和多肉植物。
自然光从落地窗照入,氛围温暖专注。
风格:生活方式摄影,浅景深,暖色调。

Nano Banana Pro (Gemini 3 Pro Image) — 精确控制

对复杂约束的遵循度最高,适合有多个具体要求的场景。

画面中有三只猫,从左到右分别是:
1. 一只橘猫,坐着,戴蓝色领结
2. 一只黑猫,站着,尾巴翘起
3. 一只白猫,趴着,闭眼睡觉

场景:阳光明媚的窗台,有绿植
风格:温馨的插画风格,柔和色彩

场景化模板

产品展示图

[产品名称] 产品摄影:
- 产品放置在 [材质] 表面
- 背景:[纯色/渐变/场景]
- 光线:[工作室灯光/自然光/戏剧性光线]
- 角度:[45度俯视/正面/侧面特写]
- 氛围:[高端/活力/温馨]
- 画面中其他元素:[搭配物品]

社交媒体配图

为以下内容配一张图:
主题:[文章/帖子的核心主题]
情绪:[积极/思考/紧迫/轻松]
风格:[扁平插画/3D渲染/摄影/手绘]
色调:[品牌色/暖色/冷色]
是否需要文字:[是/否,如果是写明内容]
比例:[1:1 方形/16:9 横版/9:16 竖版]

概念设计 / 插画

[场景描述],[艺术风格] 风格。
参考艺术家/作品:[如 Studio Ghibli / Moebius / 新海诚]
色彩方案:[暖色调/冷色调/高对比/柔和]
细节程度:[极简/中等/超精细]
氛围关键词:[梦幻/史诗/温馨/诡异]

进阶技巧

1. 权重控制

重要元素放在 Prompt 开头,AI 对前面的描述关注度更高。

2. 负面提示

明确排除不想要的元素:

画面中不要出现:文字水印、多余的人物、变形的手指、模糊的背景

3. 迭代优化法

第一轮:用简短 prompt 快速出图,确定大方向
第二轮:在满意的方向上增加细节描述
第三轮:微调光线、色调、构图等细节

4. 风格混搭

将 [风格A] 和 [风格B] 融合:
例如:"赛博朋克 + 浮世绘风格的东京夜景"
例如:"极简主义 + 蒸汽波配色的产品图"

5. 用参考图(支持图生图的模型)

当文字难以描述你想要的效果时,上传一张参考图 + 文字说明:

参考这张图的构图和光线氛围,但把场景改为 [新场景],
风格改为 [新风格]。

视频生成 Prompt 要点

视频 Prompt 在图像基础上需要额外描述运动和时间

镜头从远景缓缓推近到特写,
一位女性走在樱花飘落的小路上,
微风吹动头发和裙摆,
她转头微笑,阳光在发丝间闪烁。
风格:电影感,浅景深,暖色调。
运镜:慢速推进,约 5 秒。

视频 Prompt 额外要素:

  • 运镜方式(推/拉/摇/移/跟)
  • 运动速度(慢动作/正常/快速)
  • 时长预期
  • 转场(如果是多镜头)

推荐模型速查

需求推荐模型
图中要有精确文字GPT Image 2
艺术创作、美学优先Midjourney V7 / V8.1
快速出图、通用场景Nano Banana 2
复杂约束、精确控制Nano Banana Pro
二次元 / 动漫NIJI-7
中文场景视频Seedance 2.0
高画质视频Sora 2

MetaChat 元语 — 一站式 AI 模型聚合服务平台