当前位置:首页 > Deepseek最新资讯 > 正文内容

FLUX.2开源!AI生图“DeepSeek”能否平替谷歌Nano Banana

7个月前 (11-26)Deepseek最新资讯149

  智东西11月26日报道,昨晚deepseek,德国AI图像模型独角兽黑森林实验室发布了最新一代图像生成模型家族FLUX.2。FLUX.2的核心目标是

  FLUX.2可同时参考多达10张图片,并保持字符、产品和风格的一致性。下图这张逼真的模特图,其实就是由10张不同图片的元素组合而来的。

  其图像细节和真实感也有提升,能生成更丰富的细节、更清晰的纹理和更稳定的光照,适用于产品拍摄、可视化和模拟摄影的用途。

  文本渲染方面,复杂的排版、信息图表、表情包和带有清晰文本的UI Demo,如今都能被可靠地生成。

  FLUX.2对复杂、结构化指令的遵守能力得到提升,包括多部分提示和组成限制,并支持了最高4百万分辨率的图像编辑和更灵活的输入、输出比例。模型还能更好地遵循现实世界的知识、光照和空间逻辑,从而产生更加连贯的场景和预期的行为。

  FLUX.2系列本次一共发布3款模型,涵盖了从完全托管、可用于生产环境的API到开发者可以自行运行的开放式检查点等一系列模型产品。性能较强的FLUX.2 [pro]、FLUX.2 [flex]并未开源,FLUX.2 [dev]则是开源的。

  FLUX.2 [pro]、FLUX.2 [flex]版本目前仅以API方式对外提供服务,前者可提供媲美顶级闭源模型的图像质量,而后者允许用户控制步数和引导比例等模型参数。

  FLUX.2 [dev]则是一款基于FLUX.2基础模型的32B参数量开放权重模型,这是目前最强大的开源图像生成和编辑模型,将文生图、图生图和多图输入功能相结合。

  未来,黑森林实验室还计划发布开源的FLUX.2 [klein]模型,它基于FLUX.2基础模型精简而来,与同等规模的从零开始训练的模型相比,它功能更强大,对开发者更友好,并具备与其教师模型相同的诸多功能。

  FLUX.2基于潜在流匹配架构,将图像生成和编辑集成在单一架构中。该模型将欧洲本土AI创企Mistral自研的Mistral-3 24B视觉语言模型(VLM)与整流流式(Rectified Flow)Transformer结合。VLM带来了现实世界的知识和上下文理解,而Transformer则捕捉了早期架构无法实现的空间关系、材料属性和组合逻辑。

  新一代可学习潜空间编码器FLUX.2 – VAE,也就是所有FLUX.2模型的流式主干网络,已经依照Apache 2.0协议开源,可独立使用。

  与日前发布的Nano Banana Pro相比,FLUX.2的表现究竟如何?智东西进行了对比体验。我们首先尝试让两款模型根据以下提示词生成图片:

  翻译:办公楼楼梯间的监控画面:成堆的椅子被不可能地垒到数层楼高,有个人正从楼梯上经过这些椅子旁,场景中带有应急照明、鱼眼镜头畸变,以及明显违背建筑结构逻辑的异常感。

  模型需要生成看似真实但逻辑上错误的空间,既不能崩坏,也不能被自动纠正成正常结构,这对其世界知识和提示词遵循能力提出了挑战。

  FLUX.2 [pro]给出的生成结果如下,可以看到其较好地还原了鱼眼镜头畸变效果和提示词中的异常感,不过遗漏了“应急照明”这个要素。

  Nano Banana Pro的生成结果如下,可以看到,为了还原监控镜头的感觉,Nano Banana Pro加上了时间戳和监控编号等要素,应急照明灯的效果也比较逼真,整个画面有更强的大片感。

  在这题上,FLUX.2 [pro]在风格还原上做得更好,无论是闪光灯效果还是画质的特点,都更为接近CCD相机的拍摄效果。

  Nano Banana Pro生成的结果在画面内容上并无明显错误,但是其风格还原度与FLUX.2 [pro]相比还有些差距。

  为考察两款模型的实用性,我们试着让它们打造了一张科普用途的简易插图,解释德国城市弗赖堡的阳光为何如此充足。图中的所有文字都是提示词提供的,但画面内容主要由模型自行发挥。

  由于Nano Banana Pro每天仅允许三次免费使用,我们并未进行更多对比实测。不过,此前我们已在测试中发现Nano Banana Pro的中文渲染能力还是不错的。

  但当我们用中文向FLUX.2 [pro]发送指令,要求其解释伯努利现象时,其输出的画面中全是乱码,应该暂时还不支持中文的渲染。

  近期,各大图像模型的头部玩家,都不约而同地选择将升级方向定为实用性、可靠性,这也显示出AI图像生成技术正从演示和娱乐工具,向产业化应用加速迈进。原文出处:FLUX.2开源!AI生图“DeepSeek”能否平替谷歌Nano Banana?附一手实测,感谢原作者,侵权必删!

标签: deepseek

“FLUX.2开源!AI生图“DeepSeek”能否平替谷歌Nano Banana” 的相关文章

DeepSeek预测:尤文图斯vs那不勒斯!伊尔迪兹VS霍伊伦,谁将主宰这场意甲

DeepSeek预测:尤文图斯vs那不勒斯!伊尔迪兹VS霍伊伦,谁将主宰这场意甲

  北京时间1月26日凌晨1点,意甲第22轮将迎来一场焦点大战,尤文图斯坐镇主场迎战那不勒斯。目前尤文图斯以39分排名第5,而那不勒斯以43分排名第3,两队都处于欧战区,这场比赛对双方的排...

DeepSeek预测:巴黎圣日耳曼VS欧塞尔!姆巴佩接班人巴尔科拉能否率队狂胜?

DeepSeek预测:巴黎圣日耳曼VS欧塞尔!姆巴佩接班人巴尔科拉能否率队狂胜?

  法甲第6轮焦点战将在王子公园球场上演,领头羊巴黎圣日耳曼(12分)迎战中游球队欧塞尔(6分)。上轮0-1爆冷输给马赛后,恩里克的球队急需用胜利稳固欧冠席位,而升班马欧塞尔则希望延续上轮...

1月7日DeepSeek预测:骑士vs步行者,米切尔缺阵骑士仍有望客场取胜

1月7日DeepSeek预测:骑士vs步行者,米切尔缺阵骑士仍有望客场取胜

  北京时间1月7日8:00,NBA常规赛将迎来骑士客场挑战步行者的对决。目前骑士以20胜17负排名东部第8,胜率54.1%;而步行者仅6胜30负排名东部垫底,胜率16.7%。此役对骑士冲...

学会用AI,也能安全用AI——深企十方融海以“养虾+护虾”实践诠释科技向善

学会用AI,也能安全用AI——深企十方融海以“养虾+护虾”实践诠释科技向善

  近日,由深圳湾创业广场党群服务中心主办的“数字新技能——养好AI龙虾——OpenClaw职场助理培育沙龙”公益科普活动在深圳湾创业广场举办,特别邀请园区国家高新技术企业深圳十方融海科技...

和讯投顾李诗园:国产AI王炸!DeepSeek两款新模型追平GPT

和讯投顾李诗园:国产AI王炸!DeepSeek两款新模型追平GPT

  国产AI圈今天出了王炸,DeepSeek同时发布了两个正式版模型——DSV3.2和Spatula。这可不是普通的更新,而是开源冲闭源的顶流。   开发者deepsee...

DeepSeek预测:多特蒙德VS国际米兰!劳塔罗能否终结大黄蜂主场不败神话?

DeepSeek预测:多特蒙德VS国际米兰!劳塔罗能否终结大黄蜂主场不败神话?

  欧冠36强联赛第8轮即将迎来德意大战!多特蒙德坐镇伊杜纳信号公园迎战国际米兰,目前阿森纳以21分领跑积分榜,拜仁18分紧随其后,而本场两队分别积11分和12分,距离前八的直接晋级区仅一...