今天凌晨,谷歌在官网发布了最新图像模型Gemini 2.5 Flash Image,目前国外爆火Nano Banana生成的图片使用的就是这个模型。
Gemini 2.5 Flash Image能生成图像、编辑、融合,尤其是在保持图像一致性和文本语义理解方面非常非常强,例如,你上传一张图片,只想改变某个区域,图像其他区域一切都不变,它可以很好的做到这一点。或者上传两张图片直接融合在一起。
“AIGC开放社区”会在下面的案例中为大家展示这些强大功能,简单来说,这就是一个只用文本提示就能实现PS功能的图像生成、编辑神器,并且现在是免费使用的支持中文。

免费使用地址:https://gemini.google.com/app
根据谷歌公布的数据显示,Gemini 2.5 Flash Image在Overall Preference、Character Creative、Infographics、Object和Environment测试中,全部领先OpenAI的GPT image 1最高版本,黑森林实验室的FuUXI Kontent MAX版,以及阿里巴巴最新开源的image Edit,成为目前最强的图像模型。

图像编辑案例
先为大家展示一下它最强的图像编辑功能,就是上面说的只改变某个区域,其他一切不变。
打开谷歌Gemini应用,选择最新的Gemini 2.5 Flash Image模型,上传一张著名足球员卡洛斯的图片。


然后输入提示词:帮我把这个足球员的头部,P成香蕉人,要求脸部有眼睛、鼻子和嘴巴,其他一切不变。

Gemini 2.5 Flash Image给出的结果,非常非常完美,除了改变头部其他一切区域没有发生任何变化。就连足球员手部原图变形这一点,也很好的继承下来~

我们继续输入提示词来编辑图像,可以把足球换成是一颗巨大的钻石吗?其他一切不变。
依然非常完美,足球变成了钻石。当然,如果你对钻石的形状,颜色不满意,可以继续进行多轮对话调整到你满意为止。

我们再把这张图转换成,前段时间GPT-4o爆火的吉卜力风格吧。输入提示词:可以帮我把这张图片转换成吉卜力风格吗?
这次出现了点意外,居然人物和地上的钻石没转换,不过抠图是真干净,用PS的钢笔、图层方法来抠图也不过如此吧~
所以,用这个模型来扣图像那是相当好用。

我们继续修改,输入提示词:把人物和地上的钻石也变成吉卜力风格。
Gemini还嘴硬说之前的图片我已经将人物和地上的钻石也变成了吉卜力风格。我说,那个是写实风格,帮我变成吉卜力卡通风格。
后来Gemini觉悟了,帮我重新生成了,真的挺人性化的有点意思。

最终输出的转换图像

图像融合案例
这位小帅哥表情很严肃好像不高兴,用Gemini让他开心一下。输入提示词:可以让这位小男孩,开心的笑起来吗?

输出结果,笑的毫无违和感不错~

手里有点空,让小男孩拿个毛茸茸玩具吧。输入提示词:让他手里拿着一个毛茸茸的玩具。
很完美,手指也没变形。

我们还以上面小男孩为案例,让他和另外一位小朋友手牵手。别说用AI图像编辑了,用PS都很难做到,即便能做也是超复杂流程。下面见证奇迹吧。
上传下面这两张图片,然后输入提示词:让这两位小朋友 手牵手在一起吧。




小男孩和小女孩笑,是因为我在之前微笑基础上编辑的,所以AI应该是记住了。这个牵手相当惊艳了。
上面只是简单的基础图像编辑案例,结合Gemini 2.5 Flash Image超强的图像编辑、融合功能,还能玩出更多的花样,小伙伴们可以试试。
图像生成
下面再展示下Gemini 2.5 Flash Image的图像生成功能。
帮我生成一张图片,2077 年的深海科研基地,圆形观测舱外游过发光的巨型乌贼,舱内科学家通过全息投影分析海底热泉数据,金属舱壁上布满蓝色指示灯,地面有轻微积水反射灯光,整体氛围科幻且静谧。


效果还行整体氛围感不错。
一片神秘的热带雨林,高大的树木遮天蔽日,树冠层中透出斑驳的阳光,空气中弥漫着湿润的泥土气息和植物的清香,各种奇花异草在林间生长,色彩鲜艳的鹦鹉在树枝间跳跃,远处传来瀑布的轰鸣声,一条清澈的小溪从林间穿过,溪水在石头间跳跃,发出清脆的声响,周围的一切都显得生机勃勃。


一片宁静的沙漠,金黄色的沙丘起伏连绵,阳光洒在沙面上,闪烁着耀眼的光芒,远处的地平线上,天空与沙漠相接,呈现出一种壮阔的景象,偶尔可以看到几株耐旱的仙人掌顽强地生长在沙丘之间。


说实话Gemini 2.5 Flash Image的图像生成没有编辑功能那么惊艳,但也属于top级的了,最起码在文本语义还原、构图、光线等方面不错。
可能很多小伙伴不知道国外爆火的香蕉人图梗,谷歌CEO Sundar Pichai在昨天深夜只发了三个香蕉图标,这个推文的浏览量将近300万,评论超过2500,你就知道香蕉图多火了。

网友表示,很有意思。更快的图像生成速度固然有用,但精准的控制能力与细腻的输出效果,才是真正提升用户体验的关键。

Nano Banana这个名字比Gemini 2.5 Flash Image好多了。这条建议请转达给你们的市场部。

这项创新太惊艳了!它为无限的创意可能打开了大门。

非常疯狂的技术进步。

尊敬的谷歌人工智能团队,祝贺你们👏👏👏👏👏👏👏!这一成果太出色了。非常感谢你们所付出的努力与取得的卓越成就,请继续蓬勃发展、再创佳绩!顺祝商祺。