掘金 人工智能 11月12日 17:56
Google DeepMind Nano Banana:强大的图像编辑利器
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Google DeepMind推出的Nano Banana(Gemini 2.5 Flash Image系列)是一款功能强大的图像生成与编辑子模型,尤其擅长在保持主体一致性的前提下对已有照片进行复杂改造。其核心优势在于能够实现单张/多张图像编辑、one-shot风格替换、以及持续迭代保持角色一致性。Nano Banana还可以将照片转化为风格化的3D小模型或摆件,并支持与Photoshop等工具集成,为用户提供了从创意到实现的全面解决方案。教程详细介绍了其功能、使用步骤、Prompt工程技巧以及多种实际应用案例。

✨ **强大的图像编辑能力**:Nano Banana(Gemini 2.5 Flash Image)以其一步/迭代的图像编辑能力著称,能够对已有照片进行复杂改造,例如将真人转化为微型摆件、替换背景、更换服装,以及生成连贯的人物系列编辑。其核心优势在于能有效保持主体的一致性,使其在图像编辑领域具有突出表现。

🎨 **多样的编辑功能与应用场景**:该模型支持单张/多张图像编辑、one-shot风格替换,并能持续迭代以保持角色的一致性。此外,它还能将照片生成风格化的3D/半3D小模型或摆件,并可与Photoshop等专业设计工具集成,广泛应用于社交媒体、商业设计、影视概念及个人创作等多种场景。

📝 **结构化Prompt工程技巧**:为实现成功的图像编辑,Nano Banana建议采用“分层、简洁、指向明确”的Prompt结构。关键要素包括主体描述、动作姿态、风格/细节、光照/环境、材质/纹理、保留或限制项,以及输出格式与修饰。通过遵循此结构,用户可以更精确地指导模型生成期望的图像效果,并提供了将自拍转化为太空宇航服风格的详细示例。

💡 **实用的使用方式与策略**:Nano Banana提供了多种使用方式,包括通过Google Gemini/AI Studio官方渠道、第三方应用/插件(如Photoshop集成)、CLI/SDK/自建前端调用模型API,以及利用中转API(如神马中转API)。教程详细阐述了每种方式的操作步骤,并提供了常见问题解答和可复用策略,如保持人物一致性、微调Prompt、利用Mask精确控制修改区域等,以帮助用户高效利用该模型。

Nano Banana,大香蕉模型小名“纳米香蕉”是 Google/DeepMind 推出的图像生成/编辑子模型(Gemini 2.5 Flash Image 系列的俗称),以强大的一步/迭代图像编辑能力著称,特别擅长在保持主体一致性的前提下对已有照片进行复杂改造(如把真人变成微型摆件、换背景、服装替换、连贯的人物系列编辑等)。

单张/多张图像编辑、one-shot 风格替换、持续迭代保持角色一致、从照片生成风格化3D/半3D小模型/摆件、与 Photoshop等工具集成等。

下面给你一份 详尽的 Nano-banana(即 Google Gemini 的 “Nano Banana / Gemini 2.5 Flash Image”)使用教程,包含:功能概览、逐步上手教程、Prompt 工程与技巧、10 个「神级玩法」案例(含提示词与步骤)、以及如何通过 神马中转 API 直接使用和配置并调用 Nano-banana(含示例代码)。

1. Nano Banana提示词Prompt工程(实战要点)

成功的图像编辑 prompt 通常要“分层、简洁、指向明确”——建议使用下面结构化模板(可复制粘贴改写),也可以直接复制下一部分提示词的示例直接快速上手:

主体描述(谁 / 物);动作或姿态(在做什么);风格/细节(写明风格:写实 / 插画 / 纸雕 / 3D 小摆件);光照/环境(时间/光源/相机角度);材质/纹理(例如陶瓷、塑料、金属、迷你木雕);保留或限制(“保留面部表情/不要改变背景中 XX”);输出格式与修饰(“高细节、4k、自然阴影、无文字”)。

示例(将自拍变成太空宇航服风格):

主体:正面自拍,微笑,年约25岁女性;动作:面向镜头,头戴透明头盔,身体穿宇航服;风格:科幻写实,细节丰富;环境:太空背景,地球在远处,可见星云光晕;光照:来自右上方的冷色主光,柔和反射;保留:保留眼睛和面部特征;输出:可用于头像,裁剪为方形

实用技巧

2. 10 个 Nano-banana「神级玩法」与示例提示词(每条含操作步骤与提示词)

下列玩法兼顾创意与可实现性,适用于社交媒体、商业设计、影视概念、个人创作等场景。

微型摆件 / 人像“摆件化”

思路:把真人照片转成桌面小摆件(mini figurine)风格,保留面部特征且做出“塑料/陶瓷”质感。

示例 prompt

把主体变为一个桌面微型摆件,类似精致陶瓷人偶,头部细节保留,面部光滑有微光,底座木质,尺寸迷你,浅景深相机镜头,柔和环境光,背景为书桌模糊。保持面部表情不变。

步骤:上传清晰正面照 → 指定 mask(身体或背景)→ 选择“塑料/陶瓷”质感 → 迭代调整材质和阴影。

更换多种发型

输入: 需上传一张需要更换发型的人像图片

提示词:

以九宫格的方式生成这个人不同发型的头像

电影海报级别场景重塑

示例 prompt

把这张城市街拍重制为赛博朋克电影海报风格:霓虹灯、雨滴反射、冷暖对比、宽银幕构图、加深阴影、电影颗粒,保留主体姿态。

步骤:上传原图 → 指定 “风格:赛博朋克” → 要求“宽银幕构图+高对比”。

电影分镜

思路:需上传参考图像

提示

用这两个角色创作一个令人上瘾的12部分故事,包含12张图像,讲述经典的黑色电影侦探故事。故事关于他们寻找线索并最终发现的失落的宝藏。整个故事充满刺激,有情感的高潮和低谷,以精彩的转折和高潮结尾。不要在图像中包含任何文字或文本,纯粹通过图像本身讲述故事在这张模特图上尝试三种未来感服装:1) 轻质反光外套 2) 高腰结构连衣 3) 层叠功能性战术装。每个输出保持模型脸部与姿态一致。

人物姿势修改

提示

让图片中的人直视前方

线稿图生成图像

提示

将图一人物换成图二姿势,专业摄影棚拍摄

物品包装生成

思路:需上传一张物品参考图像和一张包装参考图片

提示

把图一贴在图二易拉罐上,并放在极简设计的布景中,专业摄影

动漫转真人Coser

输入: 需上传一张插画图像

提示词:

生成一个女孩cosplay这张插画的照片,背景设置在Comiket

生成角色设定

输入: 需上传一张角色参考图像

提示词:

为我生成人物的角色设定(Character Design)比例设定(不同身高对比、头身比等)三视图(正面、侧面、背面)表情设定(Expression Sheet) → 就是你发的那种图动作设定(Pose Sheet) → 各种常见姿势服装设定(Costume Design)

OOTD穿搭

输入: 需上传一张人物图片和服装图片

提示词:

选择图1中的人,让他们穿上图2中的所有服装和配饰。在户外拍摄一系列写实的OOTD风格照片,使用自然光线,时尚的街头风格,清晰的全身镜头。保持图1中人物的身份和姿势,但以连贯时尚的方式展示图2中的完整服装和配饰

3. Nano-banana怎么用:四种常见使用方式(含操作步骤)

下面给出最常见的四种上手方式(带具体步骤)——如果你已经有图像,直接按其中一种走即可。

方式 A:在 Google Gemini / AI Studio 中使用(官方渠道)

    打开 Gemini Image 编辑页面或 AI Studio(gemini.google / AI Studio)。选择 Gemini 2.5 Flash Image / Nano-banana 模型(有时称“Nano-banana”或“gemini-2-5-flash-image”)。

    上传你的原图(单张或多张参考图)。

    在文本框输入你的编辑提示(prompt)。可分句写清楚要点:主体、动作/表情、风格、背景、光照、材质、要保留/删除的元素。

    若支持 mask(蒙版),可用画笔圈出希望变动的区域,或标注需保留细节(例如“保留左耳环细节”)。

    生成后使用“迭代”或“变体”功能微调;每轮在 prompt 里加上“更强的光照/更逼真的阴影/保留脸部特征”等指示。

备注:通过官方界面通常能得到最佳一致性与合规性(并可能带有不可见的 SynthID 水印用于标识 AI 生成图像)。

方式 B:通过第三方应用或插件(例如 Photoshop 集成)

方式 C:通过 CLI / SDK / 自建前端 调用模型 API

方式 D:使用神马中转API调用Nano-banana:配置与示例

说明:国内常用的「中转 / 聚合」服务(例如“神马中转 API(api.whatai.cc)等”)通常作为代理,把你对 OpenAI / Gemini / 其它模型的调用统一转发处理。下面给出神马中转API可视化和文生图示例

神马中转API可视化操作

神马中转API上方菜单-聊天-Nano Banner画图-输入提示词、上传参考图、生成保存图片

Python文生图示例

Dalle 格式介绍
Generations 通用 (图生图 & 文生图)
用途:用文字或文字+图片来生成一张全新的图片。

import http.clientimport jsonconn = http.client.HTTPSConnection("")payload = json.dumps({   "prompt": "cat",   "model": "nano-banana"})headers = {   'Authorization': 'Bearer {{YOUR_API_KEY}}',   'Content-Type': 'application/json'}conn.request("POST", "/v1/images/generations", payload, headers)res = conn.getresponse()data = res.read()print(data.decode("utf-8"))

4. 常见问题与可复用策略

5. 快速贴士清单(10 条)

    用短句分层写 prompt。

    首轮先要广,后续再微调细节。

    用参考图胜过长篇风格描述。

    用 mask 精确改动区域。

    保存每次 prompt 便于复现。

    若要一致性,提供多张参考角度的原图。

    避免在 prompt 中加入模棱两可的词。

    使用神马中转API时先做小尺寸测试再放量。

    尊重被摄者权限和版权。

    关注模型输出中的合规信息(如 SynthID)。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Nano Banana Google Gemini 图像编辑 AI图像生成 Prompt工程 Gemini 2.5 Flash Image Image Editing AI Image Generation Prompt Engineering
相关文章