2025年11月,Black Forest Labs(黑森林实验室)正式发布FLUX.2,这个由Stable Diffusion原班人马打造的第二代图像生成模型,一出场就震动了整个AI绘画圈。
320亿参数、Flow Matching架构、统一生成与编辑、最高4MP分辨率输出——这不是简单的版本迭代,而是从底层架构开始的全面重构。
从Stable Diffusion到FLUX.2:核心团队的技术野望
Black Forest Labs由Stable Diffusion的核心开发者创立。他们离开Stability AI后,先推出了FLUX.1系列,验证了Flow Matching架构的可行性。FLUX.2则是在这个方向上的一次质变。
最关键的技术突破在于统一生成与编辑架构。FLUX.1时代,文生图和图像编辑是两套独立的系统;FLUX.2用一个模型同时完成了Text-to-Image、单参考图编辑和多参考图编辑三个任务,端到端处理,不需要中间步骤的切换。
三大模型矩阵:从轻量到旗舰
FLUX.2提供了完整的模型家族,覆盖从本地运行到企业部署的全场景:
FLUX.2 [klein] 4B(Apache 2.0开源,可商用)
参数量40亿,仅需8GB显存(RTX 3090即可运行),4步蒸馏实现亚秒级生成。这是给普通开发者和个人用户准备的版本,支持文生图、单参考编辑、多参考编辑全部能力,而且Apache 2.0协议意味着你可以自由商用和微调。
FLUX.2 [klein] 9B(非商用开源)
90亿参数,质量显著提升,适合研究和实验。还有专门的KV Cache变体(9B KV),利用缓存加速多参考图编辑,延迟比4B版本更低。
FLUX.2 [dev] 32B(非商用开源,320亿参数)
旗舰模型,需要在H100级别的GPU上运行。好在官方提供了量化版本,RTX 4090配合远程文本编码器也能跑起来。使用Mistral-Small-3.2-24B作为文本编码器,对提示词的理解能力大幅提升。
值得一提的是,每个尺寸都有Distilled(蒸馏版,追求速度)和Base(基础版,追求多样性和微调潜力)两个版本,开发者可以根据实际需求灵活选择。
实际体验:文字渲染和多参考合成的惊喜
FLUX.2在日常使用中有两个特别突出的能力:
文字渲染。之前的AI绘图工具在生成包含中文或英文文字的图片时,经常出现乱码或拼写错误。FLUX.2在这方面的表现接近可用级别——生成海报、UI设计稿、营销素材中的文字基本准确,这对于设计师来说是一个巨大的实用价值。
多参考图像合成。最多支持10张参考图像同时输入,并且能保持风格、构图和角色的一致性。这意味着你可以输入几张不同角度的角色参考图,让AI生成新的动作和场景,同时角色形象不会崩坏。对于做品牌视觉、IP设计的人来说,这个能力直接省去了大量的手动调整工作。
开源生态:不止是一个模型
FLUX.2的开源策略值得点赞:
- 推理代码和自编码器采用Apache 2.0协议,完全自由
- 4B模型权重同样Apache 2.0,可以直接商用
- 官方提供了完整的量化指南,Hugging Face diffusers库原生支持
- 支持不可见水印嵌入和C2PA元数据标记,满足商业合规需求
如果你不想自己部署,Black Forest Labs也提供了官方的在线平台flux2.design,订阅价格从每月14.9美元(年付)到53.9美元不等,还支持按量付费和团队协作。
谁适合用FLUX.2?
设计师和创意工作者:文字渲染和多参考合成能力让它在商业设计场景中实用性极高。如果你的工作涉及品牌视觉、海报设计、UI设计,FLUX.2值得一试。
AI开发者和研究者:Apache 2.0开源的4B模型让你可以在自己的项目中自由集成和微调,不需要担心授权问题。
普通爱好者:通过flux2.design在线平台,即使不懂技术也能体验旗舰模型的效果。新用户有免费试用额度,可以先体验再决定是否付费。
如果你对AI绘画工具感兴趣,也可以看看:AI绘画新势力横评:5款免费AI绘图工具谁更强?
小结
FLUX.2不是第一个开源AI绘画模型,但它可能是目前综合能力最强的。320亿参数带来的画质提升、统一架构带来的流畅体验、Apache 2.0带来的商用自由,加上Black Forest Labs团队的持续迭代,让它在开源和闭源模型之间找到了一个很平衡的位置。如果你还没试过,建议从Hugging Face上的4B量化版本开始,8GB显存就能跑。
工具信息
开源地址:https://github.com/black-forest-labs/flux2
中文支持:模型本身不限定语言,文字渲染支持中英文
适用平台:Web在线 / 本地部署(需GPU)
