Appearance
图像生成 Prompt
AI 图像生成的质量,70% 取决于 Prompt 的质量。不同模型有不同的"语言习惯",掌握正确的写法能让出图质量翻倍。
Prompt 基本结构
一个完整的图像 Prompt 通常包含 5 个层次:
[主体] + [场景/环境] + [风格/媒介] + [光线/氛围] + [构图/视角]各层次详解
| 层次 | 说明 | 示例 |
|---|---|---|
| 主体 | 画面中心是什么 | 一只橘猫、一位女性、一栋建筑 |
| 场景 | 在哪里、什么环境 | 在咖啡馆窗边、雨后的东京街头 |
| 风格 | 什么画风、什么媒介 | 水彩风、赛博朋克、产品摄影 |
| 光线 | 什么光照氛围 | 金色夕阳、柔和的工作室灯光、霓虹灯 |
| 构图 | 什么角度和画面比例 | 特写、俯视、广角、居中对称 |
各模型的 Prompt 风格差异
GPT Image 2 — 自然语言描述
GPT Image 理解完整的自然语言句子,适合用"讲故事"的方式描述。
一张产品宣传图:一副无线降噪耳机放在大理石桌面上,
旁边有一杯拿铁和一本打开的书。
柔和的自然光从左侧窗户照入,背景虚化。
风格:极简产品摄影,干净的白色调。
图中包含文字 "SoundPro X1" 在耳机下方,字体现代简洁。GPT Image 的独特优势:文字渲染
设计一张社交媒体封面图:
- 背景:渐变色(深蓝到紫色)
- 主标题:"AI 模型怎么选?" 白色粗体,居中
- 副标题:"5分钟搞懂" 浅灰色小字,在主标题下方
- 右下角小字:"MetaChat 出品"
- 整体风格:科技感、简洁、专业Midjourney — 关键词堆叠 + 参数
Midjourney 更适合用关键词组合,用逗号分隔,重要的放前面。
portrait of a cyberpunk samurai, neon-lit Tokyo alley,
rain reflections, dramatic lighting, cinematic composition,
detailed armor with glowing circuits, moody atmosphere,
8K, ultra detailed --ar 16:9 --style raw --v 7Midjourney 参数速查:
--ar 16:9画面比例--style raw减少 MJ 默认美化,更忠实于 prompt--chaos 30增加随机性和多样性(0-100)--no text, watermark排除不想要的元素
Nano Banana 2 (Gemini 3.1 Flash Image) — 平衡型
兼顾自然语言和关键词,速度快,适合快速迭代。
一位年轻女性程序员在现代办公室里工作,
面前有两个显示器显示代码,桌上有咖啡和多肉植物。
自然光从落地窗照入,氛围温暖专注。
风格:生活方式摄影,浅景深,暖色调。Nano Banana Pro (Gemini 3 Pro Image) — 精确控制
对复杂约束的遵循度最高,适合有多个具体要求的场景。
画面中有三只猫,从左到右分别是:
1. 一只橘猫,坐着,戴蓝色领结
2. 一只黑猫,站着,尾巴翘起
3. 一只白猫,趴着,闭眼睡觉
场景:阳光明媚的窗台,有绿植
风格:温馨的插画风格,柔和色彩场景化模板
产品展示图
[产品名称] 产品摄影:
- 产品放置在 [材质] 表面
- 背景:[纯色/渐变/场景]
- 光线:[工作室灯光/自然光/戏剧性光线]
- 角度:[45度俯视/正面/侧面特写]
- 氛围:[高端/活力/温馨]
- 画面中其他元素:[搭配物品]社交媒体配图
为以下内容配一张图:
主题:[文章/帖子的核心主题]
情绪:[积极/思考/紧迫/轻松]
风格:[扁平插画/3D渲染/摄影/手绘]
色调:[品牌色/暖色/冷色]
是否需要文字:[是/否,如果是写明内容]
比例:[1:1 方形/16:9 横版/9:16 竖版]概念设计 / 插画
[场景描述],[艺术风格] 风格。
参考艺术家/作品:[如 Studio Ghibli / Moebius / 新海诚]
色彩方案:[暖色调/冷色调/高对比/柔和]
细节程度:[极简/中等/超精细]
氛围关键词:[梦幻/史诗/温馨/诡异]进阶技巧
1. 权重控制
重要元素放在 Prompt 开头,AI 对前面的描述关注度更高。
2. 负面提示
明确排除不想要的元素:
画面中不要出现:文字水印、多余的人物、变形的手指、模糊的背景3. 迭代优化法
第一轮:用简短 prompt 快速出图,确定大方向
第二轮:在满意的方向上增加细节描述
第三轮:微调光线、色调、构图等细节4. 风格混搭
将 [风格A] 和 [风格B] 融合:
例如:"赛博朋克 + 浮世绘风格的东京夜景"
例如:"极简主义 + 蒸汽波配色的产品图"5. 用参考图(支持图生图的模型)
当文字难以描述你想要的效果时,上传一张参考图 + 文字说明:
参考这张图的构图和光线氛围,但把场景改为 [新场景],
风格改为 [新风格]。视频生成 Prompt 要点
视频 Prompt 在图像基础上需要额外描述运动和时间:
镜头从远景缓缓推近到特写,
一位女性走在樱花飘落的小路上,
微风吹动头发和裙摆,
她转头微笑,阳光在发丝间闪烁。
风格:电影感,浅景深,暖色调。
运镜:慢速推进,约 5 秒。视频 Prompt 额外要素:
- 运镜方式(推/拉/摇/移/跟)
- 运动速度(慢动作/正常/快速)
- 时长预期
- 转场(如果是多镜头)
推荐模型速查
| 需求 | 推荐模型 |
|---|---|
| 图中要有精确文字 | GPT Image 2 |
| 艺术创作、美学优先 | Midjourney V7 / V8.1 |
| 快速出图、通用场景 | Nano Banana 2 |
| 复杂约束、精确控制 | Nano Banana Pro |
| 二次元 / 动漫 | NIJI-7 |
| 中文场景视频 | Seedance 2.0 |
| 高画质视频 | Sora 2 |