AI 绘画领域的"新标杆"这个词被用烂了，但 Flux.1 出来之后，连 Midjourney 和 SDXL 的用户都开始认真对待它。2024 年 8 月，Black Forest Labs——一家由 Stable Diffusion 核心开发团队成员创立的公司——发布了 Flux.1 系列模型，凭借惊人的图像质量和对提示词的精准理解，迅速在 AI 绘画圈引发震动。

Flux.1 是什么

Flux.1 是 Black Forest Labs 开发的文生图模型系列，基于 120 亿参数的规模训练，在图像质量、人体解剖结构、细节渲染等方面相比前代模型有显著提升。更重要的是，它对提示词的理解能力远超 SDXL——你说"左手拿苹果，右手拿手机"，它真的会按你说的画，而不是给你两只手都拿苹果或者随机分配。

Black Forest Labs 的核心成员来自 Stability AI（Stable Diffusion 的母公司），包括 Robin Rombach 等关键研究者。可以理解为：做出 SD 的那批人，又做了一个更强的模型。

三个版本，适合不同需求

Flux.1 不是单一模型，而是按使用场景分了三个版本：

Flux.1 Pro 旗舰商业版本，只通过 API 提供，无法本地部署。图像质量最高，特别是人物细节、光影处理、复杂构图方面表现突出。按次计费，适合对质量要求最高的商业场景。API 可以通过 Replicate、fal.ai 等平台接入。

Flux.1 Dev 开源研究版本，参数和 Pro 相近，质量略低但差距不大。可以本地部署，可以在 ComfyUI、AUTOMATIC1111 等平台上跑，也可以商业使用（需遵守 Flux Non-Commercial License）。这是目前社区使用最广泛的版本，也是大量基于 Flux 的微调模型的基础。

Flux.1 Schnell 速度优先版本，"Schnell"在德语里是"快"的意思。在消费级 GPU 上生成一张图只需要几步，速度比 Dev 快好几倍，质量相对低一些，但已经远超很多其他模型。这个版本是完全开源的，Apache 2.0 协议，可以自由商用。

为什么让圈子震动

提示词跟随能力

这是 Flux.1 最被反复提及的优点。之前用 SDXL 画图，有时写了很详细的描述，出来的结果却只实现了一部分；Flux.1 在这方面有质的改进，复杂的场景描述、具体的细节要求，它的还原度明显更高。尤其是文字渲染——让 AI 在图片里准确写出指定文字，一直是老大难问题，Flux.1 在这方面有突破性进展，能够相当准确地渲染英文字母（中文支持还在改进中）。

人体结构

"AI 画手"曾经是个梗，因为早期模型在人物手部、手指数量上经常出错。Flux.1 在人体解剖结构上的准确性有显著改善，虽然仍然不完美，但对比之前的模型是明显的进步。

真实感和细节

皮肤纹理、布料质感、光影变化——这些细节的渲染质量，让 Flux.1 生成的图片在"真实感"上有一个台阶的提升。即便是 Schnell 这个速度优先版本，出图质量也让很多人惊讶。

怎么用 Flux.1

在线体验，无需部署

Replicate.com：直接在网页上用 Flux.1 Pro 和 Dev，按次收费，不需要自己准备 GPU
fal.ai：同样提供在线接口，速度快，支持 Flux 系列
Hugging Face Spaces：有不少免费部署的 Flux.1 Schnell 演示，速度慢一些但不花钱

ComfyUI 本地部署 ComfyUI 是目前使用 Flux.1 最主流的本地方案。需要：

至少 12GB 显存的 NVIDIA GPU（Flux.1 Dev 完整版）
或者 8GB 显存跑 4-bit 量化版本
从 Hugging Face 下载模型权重，在 ComfyUI 里安装对应的工作流

ComfyUI 社区里有大量现成的 Flux.1 工作流可以直接导入，不需要从零搭建。

AUTOMATIC1111 / Forge Stable Diffusion WebUI（A1111）的 Forge 分支对 Flux.1 有较好的支持，界面更友好，适合不想折腾 ComfyUI 节点的用户。

API 接入 开发者可以通过 Replicate API、fal.ai API 调用 Flux.1，集成到自己的应用里，不需要管理 GPU 基础设施。

和其他模型的比较

vs SDXL：Flux.1 在几乎所有指标上都胜出——提示词跟随、细节质量、人体结构。SDXL 的优势在于社区积累的海量 LoRA 和微调模型，这方面 Flux 正在快速追赶。

vs Midjourney：Midjourney 在艺术感和构图上依然有自己的风格，特别是 MJ v6 的画风很多用户喜欢。Flux.1 Pro 的真实感和细节渲染可以和 MJ 竞争，而且 Flux 可以本地运行，不依赖 Discord，给了更多控制权。

vs DALL-E 3：DALL-E 3 集成在 ChatGPT 里，使用简便，提示词理解也不错。但图像风格偏"干净"，有时候过于卡通化；Flux.1 的真实感和风格多样性更强。

vs Stable Diffusion 3：SD3 是 Stability AI 在 Flux.1 发布前不久推出的，被广泛认为表现不如预期，而 Flux.1 恰好填补了这个空缺。

基于 Flux 的微调模型

Flux.1 开源之后，社区迅速产生了大量微调模型，覆盖各种风格：

写实摄影风格：模拟电影胶片感、专业摄影棚打光
动漫二次元：在 Flux 基础上训练的动漫风格 LoRA
特定艺术家风格：模拟各种绘画流派
产品渲染：商业产品摄影风格

Civitai 等平台上已经积累了相当数量的 Flux 系列 LoRA 和微调模型，可以直接下载使用，和 ComfyUI 结合效果很好。

适合哪些人

AI 绘画发烧友：如果你一直在跟进 AI 绘画的进展，Flux.1 是现在必须了解的模型。

有 GPU 的本地部署用户：12GB 显存以上的 NVIDIA 显卡，装好 ComfyUI，Flux.1 Dev 的效果会让你觉得物有所值。

对提示词精准度有要求的创作者：不想每次都靠"抽卡"出图，需要比较准确地实现自己脑子里的画面，Flux.1 的提示词跟随能力更可靠。

商业项目需要 AI 生图：Flux.1 Schnell（Apache 2.0）可以直接商用，不存在许可证问题。

局限性

Flux.1 不是没有缺点。中文文字渲染仍然是弱项，英文强很多但复杂排版也会出错。在某些高度风格化的场景里，Midjourney 的艺术感还是有独特的味道。Flux.1 Dev 和 Pro 的完整版对显存要求不低，没有高端 GPU 的用户只能依赖在线服务或者量化版本。

另外，对于 SDXL 深度用户来说，积累多年的 LoRA 库暂时还没法直接用在 Flux 上，需要重新训练或者找对应的 Flux 版本。

Flux.1 代表了开源文生图模型的一个重要里程碑。在它之前，开源模型和闭源商业服务之间有一道明显的质量鸿沟；Flux.1 Pro 出来之后，这道鸿沟变窄了很多。对于想在本地运行高质量 AI 绘画的用户，这是目前最值得投入时间去学习的模型。