夕小瑶科技说 08月28日
Gemini 2.5 Flash Image 图像编辑模型实测
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

最新发布的 Gemini 2.5 Flash Image 模型在 AI 图像编辑领域表现亮眼,凭借其快速的生成速度、低廉的价格以及更新至2025年6月的知识库,成为性价比之王。该模型在角色一致性、图片编辑能力(如修正多余手指、添加纹身)、风格迁移(从3D转现实、油画、动漫等)方面均有出色表现。实测显示,它能自然地调整人物表情和姿势,实现逼真的P图效果。但模型在处理复杂的多要素编辑场景时稳定性稍显不足,需要多次尝试才能获得满意结果。此外,其创意生成能力也令人印象深刻,能将照片转化为完整的3D手办场景。总体而言,Gemini 2.5 Flash Image 是一个强大且具有潜力的图像编辑工具,尤其适合创意内容生成。

✨ **出色的角色一致性与情感表达**:Gemini 2.5 Flash Image 在保持人物原有特征的同时,能够自然地调整表情和姿势,例如让严肃的人物露出自然的笑容,或将陌生人合成为情侣,表现出极高的真实感,评分高达4.5星,适合需要高保真角色交互的场景。

🌟 **强大的图片编辑与修复能力**:该模型在图片编辑方面表现出众,能够精确修复图像中的瑕疵,如移除多余的手指,并能将图案(如纹身)自然地转移到身体的其他部位,实现无痕融合,实用性极高,获得5星评价。

🎨 **多样的风格迁移与创意转换**:Gemini 2.5 Flash Image 能够将图像转换为不同的艺术风格,如3D转现实、古典油画、动漫风格,并能创造出具有独特氛围的像素风和玩具风效果。其创意生成能力尤为突出,可将照片转化为完整的3D手办包装场景,为创意内容生产提供了新思路。

⚠️ **多要素编辑的稳定性有待提升**:尽管在许多方面表现出色,但模型在处理涉及多项编辑指令(如同时更换服装、场景和动作)的复杂任务时,稳定性略有不足,可能需要多次尝试才能获得理想的输出结果,在这一维度评分为2.5星。

原创 R.Zen 2025-08-27 19:23 北京

昨天晚上,爆火了一周的图像生成与编辑模型 nano-banana 终于揭开了真面目。

其官方名称为 Gemini 2.5 Flash Image,在 LMArena 基准测试中一举登顶,成为当前 AI 图像编辑模型的冠军。

当前的 preview 版本已经上线 Google AI Studio、Gemini APP、Gemini API 和 Vertex AI, 大家可以免费试用。

地址:https://aistudio.google.com/

Gemini 2.5 Flash Image 不光生成快(每分钟最多调 500 次),还特别省钱(文本输入/输出 2.50、图像生成 30.00), 知识 update 到 2025 年 6 月。速度、价格、更新都拉满,妥妥的图像模型性价比之王。

基础知识介绍的差不多了,实力到底怎么样?

我们直接上实测和玩法总结。

维度一:角色一致性

这个可以说是 banana 最擅长的维度。人物的表情、姿势都很不错非常自然,几乎没有「AI 味」,4.5 星。

比如说这张特朗普和施瓦布在世界经济论坛上的合影。俩人站在台上,表情严肃得像是刚刚在心里背完一整段联合声明,全场空气都被他们的姿态冻住了。

我把这张图扔进 AI Studio 里,第一件事就是:让他们笑

特朗普笑得满脸褶子、嘴角上扬得都快压到领带上了,施瓦布的眼角甚至带了一点笑到有点眯眼的神态。整个场面一秒从高冷发言台,切换成老朋友重逢的合影现场。

也可以让特朗普激情开麦的时候,施瓦布在旁边认真聆听。

真的好真实,不知道的还以为是记者拍到的原图。

拿了两张陌生人的独照,想看看 banana 能不能硬拉成一对情侣。

结果还真行,我把他们安排到了巴黎街头,AI 不仅把两人姿势拼得很顺,还补了点气氛滤镜。

人物角色的神态和穿搭都衔接得不错,表情也没出戏,就是背景太像 Unsplash 网图,略微掉点氛围感。

然后试了张海边度假的场景。也很般配,唯一的 bug 是——

大模型迷惑行为之带两个墨镜。。

维度二:图片编辑能力

这里我必须拿出我珍藏多年的经典素材——某国际机场广告上那张离谱的“六根手指图”。

prompt 非常简单: Keep everything the same but remove one extra finger from her hand.

不画框、不涂抹、不指哪打哪,就这么一句话。

轻轻松松变成正常人。

当然,这只是功能上的补漏。你还可以试着把一切看到的东西往身上装。

有没有朋友跟我一样,小时候偷偷在手上画纹身贴纸,长大了想纹真,但又怕被家里长辈骂?

现在终于可以无痛上身,而且还不留痕。

prompt 我给出大家:

Take the butterfly tattoo design from the woman’s upper arm in the reference image and place it on the collarbone and neck area of the short-haired woman. Keep the pose, lighting, and overall aesthetic the same. The tattoo should blend naturally with the skin, as if it’s real.

纹身店发的效果图这不就来了。

整体能力还是不错的,这个维度很实用,可以打出 5 星,大家可以自己上手玩一玩。

维度三:风格迁移能力

这个维度中规中矩,完成度普遍在线,综合也是 4.5 星。我们拿一个 case 做一些演示:

先从一个 3D 半身像变成现实人像。光线还是很不错的,杯子中的水反射的细节也注意到了。

让它变成古典油画风,也能画出油彩肌理和巴洛克光影,审美上确实有点意思。

动漫风也不拉胯,干净的线条配色够梦幻,虽然稍微有点绘圈感。

但到了像素风和玩具风,完成度就明显不如前几个了,像素块太含糊,玩具风我只想说,第五人格启动!

维度四:多图融合能力

咱们也来说说缺点。

实话实说,这个模型在复杂任务处理的稳定性,尤其是多要素编辑的场景,目前来看并没有很好。有时候你以为它应该轻松搞定的事,结果还真不一定稳,2.5 星表现。

比如说最常见的换衣操作。

我用的是一个非常基础的 prompt,只是想让模特从 T 恤换成黑色吊带裙,其他都保持不变。结果 roll 了三次,才终于 roll 到一张比较像回事的版本。

而一旦你把要素拉高一些,比如:换衣 + 场景转换 + 动作改变——也就是同时调整角色、环境和行为,banana 的稳定性就开始明显下滑了。

Keep the model’s body and face unchanged, change her outfit to match the full white outfit from the reference image, and place her in a dynamic baseball scene — like she’s just hit the ball or ready to swing, with a stadium background.

上衣完全不一样,身后的英文字母也有许多外星文。

所以想要完美的图,还是得大力出奇迹,多试几轮。

维度五:创意生成能力

最后的最后,我们来玩点花的。

这个玩法最近在社交媒体上超级火,核心思路就是:用一句 prompt,把一张真人或角色照片,变成一个完整包装的 Blender 3D 手办场景。

turn this photo into a character figure. Behind it, place a box with the character’s image printed on it, and a computer showing the Blender modeling process on its screen. In front of the box, add a round plastic base with the character figure standing on it. set the scene indoors if possible

超级可爱!

而且根据这个思路,我还玩出了几个变种:

case1:油画风展示

turn this character into a classical bust figure in oil painting style. Place the bust on a marble pedestal, add a gold nameplate, and display it in an art gallery setting with soft lighting.

case2:游戏角色盒装

prompt:_create a retro-style pixel art game figure from this character, displayed as a collectible item. Include a pixelated toy box with 8-bit graphics, a pixel game console screen behind showing the modeling interface, and a label tag with “limited edition”._

以上,就是本次 Gemini 2.5 Flash Image 的全维度实测内容啦!

一句话总结:Gemini 2.5 Flash Image 确实有点东西,特别适合这种创意场景生成。但必须提醒一句,它的出图质量不算稳定,有时候细节会糊、人物脸会变,需要你多 roll 几次挑出满意图。但比起 GPT-4o,那是稳稳胜出。

ps:以图生图为主(因为这次主要的更新点都在图片编辑这边 ~)。东西确实有点多,给坚持到这里的小朋友们小花花。

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Gemini 2.5 Flash Image AI图像编辑 图像生成 模型评测 AI艺术 Gemini AI AI Image Editing Image Generation Model Review AI Art
相关文章