Flux.1

开源文生图新标杆,本地部署友好,社区生态活跃

热度AI绘画免费
Flux.1 预览

AI 绘画领域的"新标杆"这个词被用烂了,但 Flux.1 出来之后,连 Midjourney 和 SDXL 的用户都开始认真对待它。2024 年 8 月,Black Forest Labs——一家由 Stable Diffusion 核心开发团队成员创立的公司——发布了 Flux.1 系列模型,凭借惊人的图像质量和对提示词的精准理解,迅速在 AI 绘画圈引发震动。

Flux.1 是什么

Flux.1 是 Black Forest Labs 开发的文生图模型系列,基于 120 亿参数的规模训练,在图像质量、人体解剖结构、细节渲染等方面相比前代模型有显著提升。更重要的是,它对提示词的理解能力远超 SDXL——你说"左手拿苹果,右手拿手机",它真的会按你说的画,而不是给你两只手都拿苹果或者随机分配。

Black Forest Labs 的核心成员来自 Stability AI(Stable Diffusion 的母公司),包括 Robin Rombach 等关键研究者。可以理解为:做出 SD 的那批人,又做了一个更强的模型。

三个版本,适合不同需求

Flux.1 不是单一模型,而是按使用场景分了三个版本:

Flux.1 Pro 旗舰商业版本,只通过 API 提供,无法本地部署。图像质量最高,特别是人物细节、光影处理、复杂构图方面表现突出。按次计费,适合对质量要求最高的商业场景。API 可以通过 Replicate、fal.ai 等平台接入。

Flux.1 Dev 开源研究版本,参数和 Pro 相近,质量略低但差距不大。可以本地部署,可以在 ComfyUI、AUTOMATIC1111 等平台上跑,也可以商业使用(需遵守 Flux Non-Commercial License)。这是目前社区使用最广泛的版本,也是大量基于 Flux 的微调模型的基础。

Flux.1 Schnell 速度优先版本,"Schnell"在德语里是"快"的意思。在消费级 GPU 上生成一张图只需要几步,速度比 Dev 快好几倍,质量相对低一些,但已经远超很多其他模型。这个版本是完全开源的,Apache 2.0 协议,可以自由商用。

为什么让圈子震动

提示词跟随能力

这是 Flux.1 最被反复提及的优点。之前用 SDXL 画图,有时写了很详细的描述,出来的结果却只实现了一部分;Flux.1 在这方面有质的改进,复杂的场景描述、具体的细节要求,它的还原度明显更高。尤其是文字渲染——让 AI 在图片里准确写出指定文字,一直是老大难问题,Flux.1 在这方面有突破性进展,能够相当准确地渲染英文字母(中文支持还在改进中)。

人体结构

"AI 画手"曾经是个梗,因为早期模型在人物手部、手指数量上经常出错。Flux.1 在人体解剖结构上的准确性有显著改善,虽然仍然不完美,但对比之前的模型是明显的进步。

真实感和细节

皮肤纹理、布料质感、光影变化——这些细节的渲染质量,让 Flux.1 生成的图片在"真实感"上有一个台阶的提升。即便是 Schnell 这个速度优先版本,出图质量也让很多人惊讶。

怎么用 Flux.1

在线体验,无需部署

  • Replicate.com:直接在网页上用 Flux.1 Pro 和 Dev,按次收费,不需要自己准备 GPU
  • fal.ai:同样提供在线接口,速度快,支持 Flux 系列
  • Hugging Face Spaces:有不少免费部署的 Flux.1 Schnell 演示,速度慢一些但不花钱

ComfyUI 本地部署 ComfyUI 是目前使用 Flux.1 最主流的本地方案。需要:

  • 至少 12GB 显存的 NVIDIA GPU(Flux.1 Dev 完整版)
  • 或者 8GB 显存跑 4-bit 量化版本
  • 从 Hugging Face 下载模型权重,在 ComfyUI 里安装对应的工作流

ComfyUI 社区里有大量现成的 Flux.1 工作流可以直接导入,不需要从零搭建。

AUTOMATIC1111 / Forge Stable Diffusion WebUI(A1111)的 Forge 分支对 Flux.1 有较好的支持,界面更友好,适合不想折腾 ComfyUI 节点的用户。

API 接入 开发者可以通过 Replicate API、fal.ai API 调用 Flux.1,集成到自己的应用里,不需要管理 GPU 基础设施。

和其他模型的比较

vs SDXL:Flux.1 在几乎所有指标上都胜出——提示词跟随、细节质量、人体结构。SDXL 的优势在于社区积累的海量 LoRA 和微调模型,这方面 Flux 正在快速追赶。

vs Midjourney:Midjourney 在艺术感和构图上依然有自己的风格,特别是 MJ v6 的画风很多用户喜欢。Flux.1 Pro 的真实感和细节渲染可以和 MJ 竞争,而且 Flux 可以本地运行,不依赖 Discord,给了更多控制权。

vs DALL-E 3:DALL-E 3 集成在 ChatGPT 里,使用简便,提示词理解也不错。但图像风格偏"干净",有时候过于卡通化;Flux.1 的真实感和风格多样性更强。

vs Stable Diffusion 3:SD3 是 Stability AI 在 Flux.1 发布前不久推出的,被广泛认为表现不如预期,而 Flux.1 恰好填补了这个空缺。

基于 Flux 的微调模型

Flux.1 开源之后,社区迅速产生了大量微调模型,覆盖各种风格:

  • 写实摄影风格:模拟电影胶片感、专业摄影棚打光
  • 动漫二次元:在 Flux 基础上训练的动漫风格 LoRA
  • 特定艺术家风格:模拟各种绘画流派
  • 产品渲染:商业产品摄影风格

Civitai 等平台上已经积累了相当数量的 Flux 系列 LoRA 和微调模型,可以直接下载使用,和 ComfyUI 结合效果很好。

适合哪些人

AI 绘画发烧友:如果你一直在跟进 AI 绘画的进展,Flux.1 是现在必须了解的模型。

有 GPU 的本地部署用户:12GB 显存以上的 NVIDIA 显卡,装好 ComfyUI,Flux.1 Dev 的效果会让你觉得物有所值。

对提示词精准度有要求的创作者:不想每次都靠"抽卡"出图,需要比较准确地实现自己脑子里的画面,Flux.1 的提示词跟随能力更可靠。

商业项目需要 AI 生图:Flux.1 Schnell(Apache 2.0)可以直接商用,不存在许可证问题。

局限性

Flux.1 不是没有缺点。中文文字渲染仍然是弱项,英文强很多但复杂排版也会出错。在某些高度风格化的场景里,Midjourney 的艺术感还是有独特的味道。Flux.1 Dev 和 Pro 的完整版对显存要求不低,没有高端 GPU 的用户只能依赖在线服务或者量化版本。

另外,对于 SDXL 深度用户来说,积累多年的 LoRA 库暂时还没法直接用在 Flux 上,需要重新训练或者找对应的 Flux 版本。

Flux.1 代表了开源文生图模型的一个重要里程碑。在它之前,开源模型和闭源商业服务之间有一道明显的质量鸿沟;Flux.1 Pro 出来之后,这道鸿沟变窄了很多。对于想在本地运行高质量 AI 绘画的用户,这是目前最值得投入时间去学习的模型。