钛媒体:引领未来商业与生活新知 09月28日 08:18
谷歌Nano Banana引领AI图像生成新浪潮
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

谷歌旗下Nano Banana迅速走红,上线两周生成超2亿张图片,引发AI圈巨震。该工具以其快速响应和自然交互方式,颠覆了传统AI图像生成模式,让创作过程更像实时对话。英伟达CEO黄仁勋盛赞其为忠实粉丝,并带动Gemini App用户激增。Nano Banana的出现,促使OpenAI收购Statsig以应对冲击,国内字节跳动也快速跟进。然而,垂类应用如美图面临挑战,其股价波动反映了资本市场对通用模型吞噬垂类应用的担忧。文章探讨了通用模型与垂类应用的关系,以及未来AI发展的趋势。

🍌 **Nano Banana颠覆AI图像生成交互模式:** Nano Banana通过其快速响应和自然语言交互,将AI图像创作从繁琐的提示词调试转变为类似实时对话的体验,极大地降低了创作门槛,并实现了高度一致性的图像编辑,展现出类Agent的能力,这是其搅动AI圈的核心原因。

🚀 **通用大模型冲击与垂类应用应对:** Nano Banana的崛起引发了对垂类AI应用生存空间的讨论。美图等公司面临股价波动和市场对其未来判断的挑战。文章指出,垂类应用的出路在于深耕用户精细化理解和特定场景的know-how,而非与大模型直接竞争参数算力。

💡 **场景赋能是AI应用的关键:** 无论是通用大模型还是垂类应用,最终的胜负手在于能否将技术转化为用户愿意付费的服务。美图整合Nano Banana技术并深耕“AI试衣”等场景化服务,以及与阿里巴巴的合作,为国产垂类AI提供了“用大模型赋能场景”的破局方向,强调了将技术转化为用户价值的重要性。

🌐 **AI时代加速与长期主义:** AI行业的演化速度远超移动互联网,机会稍纵即逝。创业者需要具备长远眼光,寻找与大厂保持差异化竞争、可持续发展的机会,而非仅仅跟随技术热点,最终目标是解决用户真实的付费需求。

文 | 科技新知 前沿科技组,作者丨樱木,编辑丨江蓠 九黎

最近,一根香蕉打破了AI圈的平静。

最初可能只是朋友圈病毒式传播的手办图,但随后事情似乎向着疯狂的方向发展,上线不到两周,谷歌旗下的Nano Banana已在全球生产超2亿张图片,亚太地区用户热情度居首。而英伟达CEO黄仁勋成了它的忠实用户,在伦敦,他面对一众记者,公开宣称自己是Nano Banana的忠实粉丝。

疯狂的流行带来了另一个好处,就是直接带动了Gemini App的用户增长。在短时间内,Nano Banana为Gemini App带来了超过1000万新用户。而在前不久,Nano Banana更是帮助谷歌Gemini超越了霸榜苹果应用榜很久的ChatGPT。

相关的连锁反应也在进一步加深,在海外,有报道显示,为了应对nano Banana带来的冲击,openAI以约11亿美元的全股票交易方式,收购产品实验平台Statsig。伴随此次收购,Statsig的创始人兼首席执行官Vijaye Raji将加入OpenAI,担任新设立的“应用部门首席技术官”。

在国内,字节快速跟进推出了seedream4.0,试图通过这一方式强化豆包和即梦的用户心智。而另一边,垂类应用美图,则遭遇了危机,通用模型吞噬垂类应用的故事,影响着资本市场对其未来的判断,股价经历了巨量波动。

虽然外资投行,依然为美图站台,但通用模型的势能仍好像“达摩克利斯之剑”影响着公司。

一时间,AI世界的变化,开始围绕着这一超级应用泛起波澜。其实类似的波动,让人总会想起,GPT-4o带来的吉卜力画风的时刻,而与之相对应的则是,通用模型是否会代替掉垂类AI应用的探讨。

前OpenAI研究员姚顺雨曾在播客中表达,创业公司对比大模型公司最大的机会在于能不能设计出不同的interface(交互方式),可能模型的能力会产生beyond chatgpt的交互方式,变成superAPP。

但从另一个维度来看,主流研究员则认为,长期耕耘C端业务的垂类应用,有着对用户精细化的理解,而在B端,特定场景的know-how也能为垂类应用公司垒起一定的护城河。无疑nano Banana像是一场突如起来的变革,搅动着AI圈的神经,而到到底是促增长的功能,还是抢地盘的入侵,似乎值得一番拆解。

谷歌“香蕉”搅动AI圈

如果顺着姚顺雨的思路来看,Nano Banana确实正在颠覆图片创作的逻辑。

在以往,大模型如果要生成图片,prompt提示词非常关键,用户需要学习结构化的提示词才能获取较好的效果。甚至在一些场景中,需要专业的提示词才能达到应有的效果。

后续的修改,无论是通过Midjourney的“Vary”功能还是DALL-E的局部重绘,都感觉像是独立的、离散的操作。

而现在,Nano Banana的快速响应和自然度,让创作更像实时对话,而不是反复抽卡。这也是许多人第一次感到,AI图像生成变得像实时创作。用户不再需要反复调试结构化的咒语,而是通过简单的自然语言对话,就能对图像进行精确修改。

Nano Banana继承了Gemini大模型的“原生世界知识”,这意味着它不仅仅是一个图像生成器,更是一个具备常识和推理能力的系统。它能够理解和生成具有深层语义准确性的图像.在罗永浩与周鸿祎最新的对谈中,也提到了,语言对于AI帮助的核心价值。

根据报道,这一切让Nano Banana在风格一致性、多图融合、精准的逐步编辑以及设计与风格迁移等多个方面上,有了出色的表现。

Nano Banana通过更精确的理解和更细致的任务拆分,实现了高度一致性的图像编辑。某种程度上,这是通过模型定义实现的一种更近似Agent的能力。

从这个角度来看,其颠覆感正如姚顺雨所说,正在改变交互的方式,这也是它为何能够震动AI圈的原因。在此基础上,Nano Banana也做到了成本低、速度快。在Google的介绍中,Nano Banana的定价为30美元/百万token,每张图片生成所需的token在1290个左右,成本约合0.039美元。

而从另一个视角来说,Nano Banana的实现路径,似乎很难复制,在团队的访谈和公开分享里,Nano Banana的几个方向被反复提及:文字渲染、交错生成、速度哲学,以及世界知识的引入。这些关键词组成的其实是,背后强大的模型能力所带来的降维打击。

那么,另一个问题就非常值得关注了,面对如此强大的工具,以及国内已经逐渐明朗的大模型厂商格局,是否意味着,如果按照Nano Banana的思路,就可以成功颠覆垂类的AI应用呢?

美图们的护城河在哪儿?

在美图暴跌之后,相关券商的调研也相继出炉。9月2日,摩根士丹利研报指出,美图的增长轨迹并未受到AI模型Nano Banana的影响,其真正的价值在于提供了基础AI模型无法企及的“最后一公里”解决方案。

报告强调美图凭借其在垂直领域的深厚积累、专有数据以及对核心付费功能的专注,构筑了坚实的护城河。此外,公司对所有AI模型保持开放和中立,并已将Nano Banana等新技术无缝整合进产品中。

而与此同时,也有业内人士表达,美图的C端业务主要优势在于对美颜美体的精细化理解,目前看nano的手办模型只是一种新的玩法,并不威胁C端主业。而美图的B端业务主要是围绕商拍等核心功能服务大C小B的客户,优势在于对于特定场景的know-how、在商拍环节,nano主要聚焦商品多角度复制性以适应不同社交平台模板,而美图产品则聚焦商品高匹配背景及模特,这个赛道国内海外目前确实涌现出了许多创业公司,但是大家在一块全新的市场,目前的玩法、打法都不甚相同,还没有到存量竞争的状态。

尽管如此,从叙事来看,美图做为垂类应用,AI仍是其转型的关键。从2022年开始,美图率先在旗下产品Wink中上线视频画质修复技术,并逐步延伸出画质优化、视频分辨率提升、人像增强等一系列细分功能,形成完整的画质修复能力矩阵。进入2023年,美图进一步丰富了AI功能版图,同时正式切入B端市场,为美业领域量身打造AI测肤解决方案,开启ToB业务的探索。

随后2024年,与阿里巴巴达成2.5亿美元(约合人民币18亿元)战略投资,双方明确将在电商平台、AI技术、云计算三大核心领域展开深度合作。其中在电商合作层面,双方重点推进两大方向:一是计划联合推出“AI试衣”功能——依托美图成熟的AI试衣技术,结合阿里巴巴平台丰富的商家服装资源,从根本上优化线上购物的体验痛点;二是美图设计室将向淘天商家后台开放部分核心能力,例如“AI商品图”生成功能,帮助商家高效提升商品视觉呈现效果。

从以上可以看出,美图的位置非常微妙,在c端,它通过AI技术进行自我迭代与升级,在b端,则通过自身技术赋能电商用户,而无论哪一个业务,似乎都还是技术沉淀过后的串联与精细化。

从某种程度来说,美图更多的优势在于用户心智、用户经验以及精细化,而这些是否能够让其保持现有的业务模型不受干扰,似乎需要时间验证。

而另一方面,按照之前的逻辑,美图围绕着美图秀秀等垂类赛道的superapp进行着业务进行,从某种程度来说,似乎需要更大层面的交互方式的变化,才能占住更强的心智。同时,如国内头部模型厂商开始进入到这一赛道之后,对其是否有更强的颠覆,值得一番思考。

美图是AI变革下的一个典型代表,每一次当巨头模型公司发生技术溢出时,垂类AI应用就将经历考验,而这种不确定性,则会成为公司需要长期面对的命题。

场景赋能是终极胜负手

从硅谷的经验来看,其实大模型公司与垂类AI公司的竞争,从来都是一个经久不衰的话题,比如,anthopic旗下的cloude code与编程垂类应用cursor,其追赶的速度都是超乎寻常。而面对这方面的竞争,似乎垂类AI的办法,并没有想象的多。

投资人朱啸虎曾在采访中坦言:AI Coding我一开始就不敢投,我觉得这肯定是大厂的天下。今年特别有意思,中国在补贴外卖,美国在补贴AI Coding,几乎都是负毛利。你收几十美金一个月的订阅费,消耗的Token可能都是几百美金,这都是拿投资人的钱在补贴程序员。而程序员这个群体是最没有忠诚度的,哪个API好用、哪个便宜,他们就用哪个。

回归到这次事件的主角,美图在此前的计划重心是在出海。在大摩的报告中,公司设定的首个里程碑是,在三年内(2025-2028年)将整体付费率提升至8-10%——这是在2024年4.7%基础上的巨大飞跃;长期来看,其目标更指向休闲类产品付费率10%以上、生产力工具付费率20%以上的更高天花板。

但要实现这一系列聚焦“用户付费转化”的目标,美图首先要应对的,正是Nano Banana所代表的通用大模型冲击:当“对话式创作”重构了用户对图像AI的交互期待,垂类应用若仍困守传统功能,此前的付费率规划便可能沦为空谈。

而美图的应对逻辑——将Nano Banana技术整合进自身产品,同时联合阿里深耕“AI试衣”这类场景化服务,恰恰为国产垂类AI指明了破局方向:这场看似“巨头碾压垂类”的博弈,实则已被撕开转机的裂缝。

危机从不是大模型的技术溢出,而是垂类对自身价值的误判——误将“工具能力”等同于“用户价值”;转机也从不是与大模型比拼参数算力,而是成为大模型落地现实场景的“场景翻译官”与“价值放大器”。毕竟大模型提供的只是“通用能力底座”,而垂类沉淀的用户心智(如美图之于“美”的认知)、场景know-how(如商拍中的背景匹配逻辑)、B端服务闭环(如对接电商的商家需求),才是把技术转化为“用户愿付费的服务”的关键,也是决定AI能否真正解决痛点的“最后一块拼图”。

对国产垂类AI而言,真正的突破点从不是“造一个更好的香蕉”,而是跳出“与大模型对抗”的思维定式,像美图锚定付费率目标那样,聚焦“用大模型赋能场景”:当通用技术与垂类场景深度绑定,所谓的“危机”便会转化为“差异化竞争”的转机——毕竟AI的终极战场从不是技术榜单,而是能否击中用户愿意买单的真实需求。

也许,正如朱啸虎所说,AI时代的演化速度可能是移动互联网的三倍速,甚至更快,所以很多机会也会更快被证伪。当年移动互联网的很多工具App还能有不错的退出,但在三倍速的AI时代,退出可能会难很多。所以创业者要用十年、二十年的眼光来看,什么东西是更可持续的,要去离大厂不只是一条马路,而是两条马路、三条马路之外寻找机会。

资料来源:锌刻度,《押注AI,美图就能夺回失去的一切?》硅星人pro,《Nano Banana有点ChatGPT时刻的味儿了》

智百道,《深度体验谷歌Nano Banana后,我们发现了它的AB面》硬AI,《AI吞噬软件又一案例?谷歌Nano Banana走红,美图股价重挫》

美股IPO,《大摩:美图的“增长战略”,AI提升付费率,海外拉动用户增长》

硅星人pro,《对话朱啸虎:搬离中国,假装不是中国AI创业公司,是没有用的》

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Nano Banana AI图像生成 通用大模型 垂类AI 美图 Gemini AI交互 场景赋能 科技前沿 Nano Banana AI Image Generation Large Language Models Niche AI Meitu Gemini AI Interaction Scenario Empowerment Tech Frontier
相关文章