最新模型 Flux AI 诞生于 Black Forest Labs,该实验室是开创性 Stable Diffusion 的创造者。这款全新的文本转图像 AI 拥有 120 亿个参数,为开源视觉生成领域树立了新标杆。Flux 不仅能与 Midjourney 等竞争对手的艺术实力相媲美,而且有望超越市场上的其他模型,无论其是否为专有模型。
Flux AI 有三种不同的版本,可满足不同的用户需求。对于爱好者和开发者,Flux Dev 提供非商业许可证。这是一个适合社区驱动增强的环境。那些追求速度而不影响效率的人可以转向 Flux Schnell,这是一种精简的迭代,在灵活的 Apache 2 许可证下,可提供高达十倍的速度提升结果。对于专业级应用程序,Flux Pro 通过复杂的 API 提供独家访问,以满足高需求的商业项目。
如何尝试 Flux AI?
可用性无缝,Flux Dev 和 Flux Schnell 可供下载 拥抱脸并通过 ComfyUI 提供集成支持,以简化本地运营。上周四宣布的此次发布彰显了 Black Forest Labs 致力于开拓生成 AI 媒体技术前沿的承诺。
该团队表示:“我们的创新包括创建 VQGAN 和潜在扩散、用于图像和视频生成的 Stability AI 稳定扩散模型(稳定扩散 XL、稳定视频扩散、整流流变压器)以及用于超快速实时图像合成的对抗性扩散蒸馏。”
在行业巨头 Andreessen Horowitz 牵头、Brendan Iribe、Michael Ovitz 和 Garry Tan 等有影响力的投资者的支持下,Black Forest Labs 获得了 3100 万美元的种子轮融资,随后宣布推出 Flux。这笔资金的注入推动了这项如今被誉为人工智能驱动图像合成领域突破性成就的开发。
在严格的基准评估中,Flux AI 不仅达到甚至超越了以下成熟模型的能力: 中途旅程 v6.1、DALL-E 3 和 SD3 Ultra 在多个标准上进行了测试,包括视觉质量、对提示的遵守、尺寸和长宽比的灵活性、排版能力以及输出的多样性。根据 Black Forest 的数据,Flux 的 Pro 和 Dev 迭代现在是图像生成技术的巅峰,Schnell 模型的表现也值得称赞,在能力方面处于 Midjourney v5 和 Ideogram 之间。
尽管取得了这些进展,但对于硬件性能较弱的用户来说,还是有一个需要注意的地方。开源模型的体积很大, 约 23GB,需要近 24GB 的 VRAM 才能有效运行,直到可能更轻量化的版本问世。这一要求可能会疏远那些拥有仅 6 到 8 GB VRAM 的 GPU 的用户,从而削弱他们参与最新 AI 探索的能力。
尽管如此,Black Forest Labs 还是与 Auraflow 模型的创建者 Fal AI 合作制定了一个解决方案,以促进 基于云的图像生成。此次合作确保即使没有最新硬件的用户也能体验 Flux。这些模型可在 Replicate.com 上进行初步免费试用,在达到每日免费配额后,它们可提供经济高效的图像生成,只需 1 美元即可从 Flux Pro 获取 33 张图像,或从 Flux Schnell 获取 333 张图像。
Flux 与 Midjourney
我们对 Flux 和 Midjourney 进行了测试,看看它们的对比情况。
查看并排比较并亲自查看结果:
日落时分的宁静海滩,海浪轻轻拍打着海岸,一棵孤独的棕榈树在微风中摇曳,一艘帆船的轮廓映衬在鲜艳的橙色和粉红色天空中
通量人工智能:
旅途中:
冬天,树林里舒适的小屋,烟囱里袅袅升起,周围是白雪覆盖的树木,窗户里透出温暖诱人的灯光
通量人工智能:
旅途中:
蒸汽朋克风格的城市景观,有精密的机械、漂浮的飞艇,还有穿着维多利亚时代服装、带有机械增强装置的人们
通量人工智能:
旅途中:
一位老妇人的特写,她满脸皱纹,眼神睿智,戴着一顶风化的帽子,穿着法兰绒衬衫,站在一座古老的木制谷仓前
通量人工智能:
旅途中:
注意 虽然我们对 Flux 和 Midjourney 的初步比较表明 Midjourney 通常能产生更出色的视觉效果,但需要注意的是,我们在这些测试中使用了基于云的 Flux 版本。为了进行真正公平的评估,需要下载 Flux 并将其本地部署在高性能 GPU 上。这种方法可能会充分发挥 Flux 的功能,这可能与我们的初步发现有很大不同。
对于那些有兴趣深入了解的人,我们也鼓励他们探索一系列社区生成的视觉效果:
一种新的开源图像生成模型突然出现,而且实际上非常好??
FLUX.1 由 @bfl_ml pic.twitter.com/K89GHoh3PQ
— 彼得罗·斯基拉诺 (@skirano) 2024 年 8 月 1 日
特色图片来源: 凯雷姆·葛兰/Flux