AI 图片生成工作流教程:提示词、参考图、局部重绘和批量出图

绘画

面向设计、运营和内容团队的 AI 图片生成教程,讲清如何从需求拆解、提示词模板、参考图控制、局部重绘到批量生成稳定视觉资产。

AI 图片生成已经不只是“写一句提示词抽卡”。真正用于工作时,你需要稳定风格、控制构图、修改局部、批量输出,并让图片符合品牌和场景。本文用“为一篇 AI 工具文章制作封面和配图”作为案例,讲一套可重复的工作流。

创意设计工作台
创意设计工作台

适用人群

适合内容运营、设计师、独立站站长、电商团队和自媒体作者。如果你只是偶尔生成头像,随便用一个工具就够了;如果你要持续为文章、产品页、广告、社媒生成图片,就需要流程化。

第一步:先拆需求,不急着写提示词

一张可用图片至少要明确五件事:用途、尺寸、主体、风格、禁区。用途决定信息密度,文章封面要清楚表达主题,社媒图要更抓眼,产品图要准确展示物体。尺寸决定构图,横版 16:9 和竖版 9:16 的提示词不一样。禁区包括不能出现真实品牌、不能出现乱码文字、不能出现不相关人物。

比如需求是“AI Agent 教程封面”,不要只写“AI agent illustration”。更好的拆解是:横版封面、主体是流程节点和工具连接、风格现代科技但不暗黑、避免机器人脸和复杂文字。

第二步:写结构化提示词

推荐提示词结构:主体 + 场景 + 构图 + 风格 + 光线 + 细节 + 排除项。中文或英文都可以,关键是稳定。示例:

“A clean editorial cover image about AI agent workflow, connected nodes, laptop dashboard, team planning board, modern technology style, bright office lighting, high clarity, no text, no logo, no robot face, 16:9.”

如果工具支持负面提示词,把 watermark、text、logo、blur、deformed hands 等常见问题放进去。文章配图通常不要让模型生成文字,因为大多数模型仍容易生成乱码。

图片编辑与视觉素材
图片编辑与视觉素材

ComfyUI / Flux 工作流思路

如果你用 ComfyUI,可以按这个最小节点链路搭:

Load Checkpoint
  → CLIP Text Encode (Positive Prompt)
  → CLIP Text Encode (Negative Prompt)
  → Empty Latent Image
  → KSampler
  → VAE Decode
  → Save Image

常用参数可以先这样设:

size: 1344x768
steps: 28
cfg: 3.5-7
sampler: dpmpp_2m
seed: fixed for series images
negative: text, watermark, logo, blurry, low quality

界面验收图要包含 ComfyUI 节点图、生成候选图四宫格、局部重绘前后对比。图片教程没有前后对比,会很像提示词清单而不是教程。

第三步:用参考图控制风格

只靠文字很难稳定风格。参考图可以控制颜色、构图、人物姿态、产品角度。Midjourney、Stable Diffusion、Flux 工作流、Firefly、Runway 等工具都支持不同形式的图像参考。企业团队可以整理一组品牌参考图:色彩、空间、人物、产品、图标风格各几张。

使用参考图时要注意版权和肖像权。不要上传不允许二次使用的商业摄影作为生成基础,更不要用真实人物照片生成敏感内容。做公开内容时,优先使用自有素材、授权素材或纯生成图。

第四步:局部重绘解决小问题

生成图常见问题是:手部奇怪、屏幕文字乱码、背景多余物体、人物表情不合适。不要因为一个小问题整张重抽,可以用局部重绘。圈出问题区域,提示“remove text on screen”“fix hand shape”“replace background with clean office wall”。

局部重绘的关键是提示要短,只描述局部要改什么。提示太长,模型可能把整张图风格带偏。每次只改一个问题,改完再处理下一个。

第五步:批量出图与命名

内容团队最需要的是批量稳定输出。建议建立图片模板表:文章类型、尺寸、主体关键词、风格关键词、负面词、保存路径。每次生成 4 到 8 张候选,选一张做封面,再派生不同尺寸。

文件命名也要规范,例如 ai-agent-workflow-cover.webpai-agent-tool-calling-step.webp。这对 SEO、归档和二次复用都有帮助。图片 alt 文案也要具体,不要写“图片1”。

批量图片筛选与内容排版
批量图片筛选与内容排版

团队资产管理

如果多个人一起做图,建议建立一个轻量资产库。每张最终采用的图片都记录:使用场景、生成工具、提示词、参考图来源、授权状态、生成日期、负责人。这样做不是形式主义,而是为了以后改版、复用和版权排查。尤其是商业页面、广告投放和应用商店素材,来源记录非常重要。

品牌团队还可以维护“允许风格”和“禁止风格”。允许风格包括色彩、光线、构图、人物类型;禁止风格包括过度科幻、暗黑背景、夸张表情、乱码文字、和品牌无关的装饰元素。AI 图片生产一旦规模化,风格治理比单张图的好看更重要。

常见坑

| 现象 | 原因 | 修法 | |------|------|------| | 每张图风格都不一样 | seed、尺寸、风格词都在变 | 固定 seed 和模板,只改主体词 | | 图片里出现乱码文字 | 让模型直接生成 UI 或海报字 | 文字后期用 Figma / Canva 叠加 | | 人物手部崩坏 | 人物动作太复杂 | 用局部重绘,只修手部区域 | | 网站加载变慢 | 原图太大 | 导出 WebP,封面控制在 200KB 左右 | | 版权说不清 | 参考图来源没记录 | 资产表记录提示词、参考图、工具和授权状态 |

批量命名建议:

article-slug-cover.webp
article-slug-step-01.webp
article-slug-before-after.webp

替代方案

如果你需要真实产品图,优先拍摄或使用官方素材。如果你需要图标和简单示意图,SVG 或 Figma 手工绘制更可控。如果你需要大规模广告创意,可以使用 Canva、Adobe Express、Firefly、Photoroom 等带模板和品牌资产管理的工具。

小结

AI 图片生成的专业用法,是把随机创意变成可复用流程:先拆需求,再写结构化提示词,用参考图稳住风格,用局部重绘修问题,最后批量导出和命名。这样生成图才能真正进入内容生产,而不是停留在好玩的尝试。