Google Gemini 2.5 Flash Image模型进入生产阶段，功能升级

AI & Big Data 10月03日

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

Google正式宣布，代号为Nano Banana的图像生成模型Gemini 2.5 Flash Image已进入生产阶段。该模型能够同时理解文字与图像，并可以直接修改用户上传的照片。与之前的AI图像工具相比，Nano Banana具备更深层的影像理解能力，能够理解自然语言命令，并保持角色一致性，生成速度快。正式版模型除了开放商业授权并开始收费外，还新增了10种长宽比支持，包括电影级横幅、方形社群贴文和直式短影音封面等。此外，它还支持批次处理，可一次生成多张图像，显著提升工作效率，适用于营销、商品图或游戏角色的批量制作。用户可通过Gemini App、Google AI Studio、Gemini API或Vertex AI访问该模型，其中Gemini App和Google AI Studio仍提供免费体验额度。

🚀 **Gemini 2.5 Flash Image模型已正式投入生产**：代号为Nano Banana的图像生成模型现在已从预览阶段转为可安全应用于生产环境的正式产品。这意味着用户和开发者可以将其集成到实际业务流程中，并受到商业条款的保护。

💡 **强大的图像理解与编辑能力**：与许多仅依赖文本生成的AI图像工具不同，Nano Banana能够同时理解文字描述和图像内容。它不仅能根据文本指令生成图像，还能直接修改用户上传的照片，例如执行“让狗的嘴巴闭起来”这类自然语言指令，并能保持生成角色的视觉一致性。

📏 **多样化的输出比例与高效的批量处理**：正式版模型提供了10种不同的长宽比选项，从16:9到1:1，再到垂直的9:16，极大地增强了用户在不同平台和用途上的灵活性。同时，新增的批次处理功能允许一次生成多张图像，显著提高了营销、产品展示和游戏角色设计等场景下的工作效率。

🛠️ **易于使用的开发与应用方式**：用户和开发者可以通过Gemini App、Google AI Studio、Gemini API或Vertex AI访问Nano Banana。特别值得一提的是，通过Gemini App或Google AI Studio，用户仅需输入一句提示语，即可生成完整的AI图像应用，无需编写代码，例如创建具有滤镜功能的图片编辑App，或像PictureMe、Bananimate、Fit Check这样能自动生成风格化照片、GIF动画或穿搭预览的应用。

Google周四（10/2）宣布，代號為奈米香蕉（Nano Banana）的圖像生成模型Gemini 2.5 Flash Image正式進入生產階段，並新增10種長寬比、支援批次處理，也開始提供商業授權。

過去的AI圖像工具大多只靠文字生成，缺乏對影像的深層理解，而Nano Banana可同時理解文字與圖像，能夠直接修改使用者上傳的照片，也能理解自然語言命令，還能保持角色的一致性，再加上生成速度快（少於10秒），讓它在8月底開放預覽之後迅速形成風潮。根據Google的統計，這段期間光是Gemini程式中的Nano Banana就被用來創作超過50億個作品。

本周的宣布代表Gemini 2.5 Flash Image模型已從預覽階段轉為正式產品，可安全地應用於生產環境中，受到商業條款的保護，也會開始收費，價格為每100萬個輸出Token的費用為30美元，由於每張圖平均會用上1,290個Token，所以每張圖的生成費用為0.039美元。

正式版除了開放商用與收費之外，也同步帶來多項升級。預覽時的Nano Banana只能生成16:9的固定比例圖像，而正式版則支援21:9、16:9、4:3、3:2、1:1、9:16、3:4、2:3、5:4、4:5等10種比例，讓使用者可更靈活地針對不同平臺與用途生成內容，包括電影級橫幅、方形社群貼文，或是直式短影音封面等。

其次它支援批次處理，可一次生成多張圖像，大幅提升工作效率，以支援行銷、商品圖或遊戲角色的大量製作。

Google亦提供了Nano Banana的4個使用技巧，包括利用它能保持角色一致性的特色來建立虛擬形象或公仔化自拍；利用自然語言來修改圖像中的特定細節，如「讓狗的嘴巴閉起來」；利用簡單且口語化的命令來探索Nano Banana的創意潛力；以及利用Gemini App的Canvas 模式或Google AI Studio來建立新應用程式。

其中，最後一點允許使用者或開發人員完全不必撰寫程式，只要輸入一句提示語，就能生成一個完整的AI圖像應用程式，例如：「幫我建立一個可以上傳照片並套用濾鏡的影像編輯App」。Google團隊示範了許多應用，其中的PictureMe讓使用者上傳一張照片，選擇「80年代商場寫真」主題，系統就會自動生成6張風格不同的照片；或是可將圖片變成GIF動畫的Bananimate；以及能夠預覽不同穿搭效果的Fit Check。

使用者或開發人員可以透過Gemini App、Google AI Studio、Gemini API或Vertex AI存取Nano Banana模型，當中的 Gemini App與Google AI Studio目前仍提供少量免費體驗額度。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签