智源社区 2024年12月17日
Gemini 2.0成P图神器,各种P图只需一句话的事儿,可把网友馋哭了
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Gemini 2.0的图像编辑功能引起广泛关注,用户只需通过文字指令即可实现对图像的修改。例如,将汽车改为敞篷车或添加海滩用品,其多模态能力类似于“多模态版o1”。Gemini 2.0能理解并执行复杂指令,如逐步改变颜色、添加元素,并能同时处理图片中的多个元素,甚至将一个物件转换为另一个。用户还可通过结合不同图片进行编辑,如将猫和抱枕结合成猫抱枕,或将猫与滑板结合。此外,Gemini 2.0还具备更强的想象力,能将箱子打开或将汽车变成飞车,还能理解用户在图像中圈出的区域并进行编辑。该功能预计明年年初更广泛地推出。

🚗Gemini 2.0通过文字指令实现一键P图,能够快速将汽车改为敞篷车,并保持其他元素不变,展示了其强大的图像编辑能力。

🎨Gemini 2.0具备多模态能力,能根据指令逐步修改图像,例如将车身颜色改为夏日色调,并在车内添加海滩用品,图文并茂地进行推理生成。

🖼️Gemini 2.0不仅能编辑单一元素,还能同时处理图片中的多个元素,如将夹克变成枕头、移除毯子,或结合不同图片生成新的图像,如猫猫抱枕和猫猫滑板。

✨Gemini 2.0还展现出超强的想象力,能够将箱子打开,或将汽车变成飞车,甚至理解用户在图像中圈出的区域并执行编辑指令,如“Open this”。

Gemini 2.0说说话就能一键P图的功能爆火,把玩不了的大伙儿都馋哭了!

比如一辆小车车:

输入指令“把这辆车改装成敞篷车”,它就能立马将文字指令和图片结合起来,完成一键P图。

让我们来找茬儿,发现除了车变成了敞篷的,其它元素木有变化,很好地保持了一致性

不仅于此,Gemini 2.0还有点“多模态版o1”那味儿。

继续输入指令:想象一下,这辆车内装满了海滩用品。接着,将车身颜色改为一种令人联想到夏日的颜色,并在改变过程中进行说明。

然后Gemini 2.0就开始图文并茂地一步步推理生成了,先把车变成了明亮的黄色,接着又再车里装满了遮阳伞等海滩用品

这就是Gemini 2.0系列的原生图像输出能力。

评论区底下,一水儿都是求具体上线时间的:

被谷歌挖走的OpenAI大将Logan Kilpatrick回应,大伙儿别急,明年年初将更广泛地推出。

各种P图都是一句话的事儿

除了上面展示的简单P图,你甚至可以同时P图片中的多个元素,还能把一个物件变成另一个

比如,把蓬松的夹克变成一个小枕头,并且拿掉毯子:

这还没完,结合不同的图来P也行。

猫和抱枕结合,就得到了一个很有质感的猫猫抱枕:

把猫猫和滑板结合就得到了猫猫代言滑板。

遵从文字指令,Gemini 2.0成功将猫猫变成了插画贴纸形态。

除此之外,Gemini 2.0 P图时还能更有想象力

比如一个箱子,把箱子打开就变成了酱婶儿:

开头展示的小车车,也能变成“飞车”:

另外,还有一种玩法。

在图像中圈出需要P的区域,只需“Open this”,Gemini 2.0可以直接结合文字指令理解图像,知道“this”的指代:

不得不说,那些有内测资格的玩家,可算了把大伙儿馋坏了。

参考链接:https://x.com/OfficialLoganK/status/1868364831948251419

—  —

点这里?关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

内容中包含的图片若涉及版权问题,请及时与我们联系删除

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Gemini 2.0 一键P图 多模态 图像编辑 AI
相关文章