谷歌新一代AI图像模型Nano Banana 2的早期预览样本意外泄露,展示了其强大的图像生成与编辑能力。该模型在提升低质量图片清晰度(图像修复)和执行复杂的色彩编辑指令方面表现出色。Nano Banana 2的主要改进包括解决与物理逻辑相关的视觉任务,例如准确绘制小球运动轨迹,以及在文本渲染方面极为出色,能根据自然语言提示在白板等介质上绘制字体一致且排列精确的复杂文字。这些进步表明该模型集成了更深层次的世界知识,能够理解并执行更复杂的、包含逻辑关系的指令,为设计、媒体内容制作和自动化工作流等领域开辟了新的可能性。
✨ **强大的图像修复与编辑能力**:Nano Banana 2 在提升低质量图片清晰度方面表现出色,能够有效修复模糊或损坏的图像。同时,它还能精确执行复杂的色彩编辑指令,满足多样化的视觉调整需求。
🧠 **物理逻辑理解与执行**:该模型的一项重大突破是能够解决与物理逻辑相关的视觉任务。例如,通过“图生图”技术,它能准确模拟和绘制出物理世界中的运动轨迹,这是当前许多AI模型难以达到的复杂能力。
✍️ **卓越的文本渲染表现**:Nano Banana 2 在图像内生成清晰、一致且排列精确的文本方面取得了显著进展。它能够根据自然语言提示,在白板等介质上准确绘制出复杂的字体和文字布局,有效解决了以往模型在文本生成上的痛点。
💡 **深层世界知识集成**:视觉保真度和指令遵循能力的飞跃表明,Nano Banana 2 在模型内部集成了更深层次的世界知识。这使其不再局限于简单的图像生成,而是能够理解并执行更复杂的、包含逻辑关系的指令,为内容创作带来更多可能性。
IT之家 11 月 11 日消息,科技媒体 testingcatalog 昨日(11 月 10 日)发布博文,报道称谷歌新一代 AI 图像模型 Nano Banana 2 的早期预览样本意外泄露,展示了其强大的图像生成与编辑能力。
Nano Banana 2 的预览版本在 Media.ai 平台短暂上线后被迅速撤下,但其生成的图像样本已在社交媒体上广泛传播,其在提升低质量图片清晰度(图像修复)和执行复杂的色彩编辑指令方面,展现出强大的技术实力。
根据泄露的资料,Nano Banana 2 主要带来 2 项改进,其一是能够解决与物理逻辑相关的视觉任务。例如,在一张泄露的图片中,模型通过“图生图”(img2img)技术,准确绘制出了小球运动的物理轨迹,这是当前其他模型难以完成的复杂任务。

其二,该模型在文本渲染方面表现极为出色,能够根据自然语言提示,在白板等介质上绘制出字体一致且排列精确的复杂文字,有效解决了以往模型在图像内生成清晰文本的难题。


该媒体还指出,Nano Banana 2 在视觉保真度和指令遵循能力上的飞跃,表明其模型内部集成了更深层次的世界知识。这一进步使其不再局限于简单的图像生成,而是能够理解并执行更复杂的、包含逻辑关系的指令。IT之家附上相关图片如下:






这些高级能力为设计、媒体内容制作和自动化工作流等领域开辟了新的可能性。例如,企业未来或许可以通过 API 接口,程序化地调用该模型,快速生成符合要求的营销海报或社交媒体视觉素材,从而大幅提升内容生产效率。