大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,专注于分享AI全维度知识,包括但不限于AI科普,AI工具测评,AI效率提升,AI行业洞察。关注我,AI之路不迷路,2024我们一起变强。
几天前,Poe AI新增了一个文生图的模型,在给用户发放的邮件通知中,Poe形容这个文生图模型是“the best image generator”,它便是FLUX。
说起FLUX模型,可能很多小伙伴都没听说过。这并不奇怪。FLUX是由Black Forest Labs(黑森林实验室)推出的一款最新的文本生成图像模型。而Black Forest Labs今年8月1日,也就是大约两周前,才在官网宣布了Black Forest Labs的启动。
Black Forest Labs是由Stable Diffusion原班人马创立的新公司,专注于开发先进的生成式深度学习模型,并致力于建立新的行业标准。该公司由Robin Rombach领导,他是Stable Diffusion的作者之一。Black Forest Labs的核心使命是通过开发强大且易于访问的生成式AI工具,使得高质量的生成式AI技术普及化。Black Forest Labs认为开放的访问权限和广泛的研究社区合作对AI技术的负责任发展至关重要。这一理念体现在他们发布的模型中,这些开源模型供非商业用途使用,同时他们也提供适用于商业应用的更强大版本。
Black Forest Labs公布了它在生成式AI领域取得的一系列技术突破。
-
VQGAN技术:这是一种结合了生成对抗网络(GAN)和向量量化变分自编码器(VQ-VAE)的创新模型,它能够生成高清晰度的图像。
-
潜在扩散模型:这些模型通过在潜在空间中进行操作,显著提升了图像生成的效率和质量。
-
稳定扩散模型:以其出色的效率而闻名,能够在较低的计算成本下生成高质量的图像。
在融资和未来发展方面,Black Forest Labs于本月(2024年8月)成功完成了3100万美元的种子轮融资,由Andreessen Horowitz领投,其他知名投资者如Brendan Iribe、Michael Ovitz、Garry Tan、Timo Aila和Vladlen Koltun也参与了投资。这笔资金将助力实验室在全球范围内推广其尖端AI技术。展望未来,Black Forest Labs计划将其技术扩展到文本到视频生成领域,利用其在扩散模型方面的专长,开发能够快速、精确地创建和编辑视频的工具。这一发展将进一步加强Black Forest Labs在生成式媒体技术领域的领先地位。
关于FLUX.1模型
FLUX模型全名为FLUX.1
,是Black Forest Labs最近推出的文本生成图像的AI模型。
FLUX.1
模型包含三个版本:FLUX.1 [pro]、FLUX.1 [dev]和FLUX.1 [schnell],分别针对不同的使用场景和需求。其中,FLUX.1 [pro]是闭源模型,提供最佳性能,而FLUX.1 [dev]和[schnell]则是开源模型,[dev] 版本不可商用,[schnell]版本则专为本地开发和个人使用设计,具有最快的生成速度和最小的内存占用。
-
FLUX.1 [pro]: 这是FLUX.1的最强版本,专为商业用途设计,提供最先进的图像生成性能,包括顶级的提示词遵循、视觉质量、图像细节和输出多样性。目前可以通过API获取FLUX.1 [pro]的访问权限。
-
FLUX.1 [dev]: FLUX.1 [dev]是一个开源的引导蒸馏模型,适用于非商业应用。直接从FLUX.1 [pro]蒸馏而来,FLUX.1 [dev]获得了类似的质量和提示词遵循能力,同时比同等大小的标准模型更高效。
-
FLUX.1 [schnell]: 响应速度最快的模型,专为本地开发和个人使用量身定制。FLUX.1 [schnell]可在Apache 2.0许可下公开获取。与 FLUX.1 [dev]类似,权重可在Hugging Face上获取,代码可以在GitHub和HuggingFace的Diffusers中找到。
目前发布的FLUX.1
模型均采用了一种创新的混合架构,融合了多模态处理能力和并行扩散机制的Transformer技术,并将其扩展至高达120亿个参数。这些模型在训练生成模型的方法上采用了流匹配技术,这种方法不仅通用性强,而且概念简洁,特别适用于包括扩散过程在内的各种情况。
根据Black Forest Labs官方的测试对比图,FLUX.1 [pro]和[dev]版本在多方面超越了市场上的主流文生图模型,包括Midjourney v6.0、DALL·E 3 (HD)和SD3-Ultra。这些方面包括视觉质量、对提示词的精准遵循、尺寸和比例的多样性、排版能力以及输出的多样性。
FLUX.1模型生成图片样例
FLUX.1模型体验地址
FLUX.1 [pro]: https://fal.ai/models/fal-ai/flux-pro
FLUX.1 [dev]: https://fal.ai/models/fal-ai/flux/dev
FLUX.1 [schnell]: https://fal.ai/models/fal-ai/flux/schnell
精选推荐
-
超越Claude 3.5 Sonnet,GPT-4o mini夺得第二名!
-
全民进入GPT-4时代:OpenAI强势推出GPT-4o mini!彻底取代GPT-3.5!
-
GPT-4o mini可能没那么强,但也绝对不弱!
都读到这里了,点个赞鼓励一下吧,小手一赞,年薪百万!😊👍👍👍。关注我,AI之路不迷路,原创技术文章第一时间推送🤖。