2025-10-21 09:49 北京
1

🧰 Gemini 3.0 的两个“马甲”身份 lithiumflow (Gemini 3.0 Pro) 和 orionmist (Gemini 3.0 Flash) 在 LMArena 竞技场被曝光,预示着谷歌新一代旗舰模型的发布临近。这种通过“马甲”进行测试和造势是AI模型上线前的常见做法,旨在通过实际性能展示模型实力。
⏰ 在AI识别钟表这一难题上,Gemini 3.0 Pro(lithiumflow)展现出显著进步,能够精确识别小时、分钟和秒,远超GPT-5 Thinking和Gemini 2.5 Pro在此类测试中的表现,标志着AI在理解复杂视觉信息方面取得了突破。
🎨 Gemini 3.0 Pro 在SVG图像生成方面表现出色,其画面表现能力较以往模型有显著提升,甚至带有抽象艺术风格,尤其在绘制自行车方面细节令人印象深刻。尽管“骑自行车的鹈鹕”已成为AI测试的梗,Gemini 3.0的SVG作品依然在水准之上。
🎵 Gemini 3.0 Pro 的一项重大更新是其作曲能力,能够模仿不同音乐风格,长时间保持节奏的稳定,并能引入活力和变奏,为AI在内容创作领域开辟了新的可能性,尤其是在多模态创作方面。
🤔 尽管Gemini 3.0展示了强大的新功能,但AI模型的评测方式似乎陷入套路化,包括传闻、竞技场测试、撞马甲、SVG测试等环节。文章作者呼吁未来AI模型的评测方式能够创新,不只是模型本身更强,评测方式也要与时俱进。
2025-10-21 09:49 北京
1
1
1
第一个相当体面的作曲模型另外一个大更新就是Gemini 3 Pro可以作曲了。能模仿音乐风格,能长时间保持节奏,并带来一些活力和变奏。你觉得这个音乐效果如何?目前大部分实测还是在LMArena碰运气。(顺便吐槽一下,跑了快100个提示了,还是没碰到Gemini 3)那为什么判断这两个马甲就是Gemini 3的实测代号呢?有人说「Orion」本身可能和Gemini 3有关,而且「orionmist」这种两个单词合成方法是谷歌会使用的。此前,Gemini 3没上LMArena时,就有各种内测觉得这个很厉害。甚至可以一个HTML符合整个MacOS、Windows系统的UI交互。甚至只有1分钟,Gemini 3 Pro就能用SVG做出一整个风格动画。截取了部分动画,这个效果看起来还是挺「唬人」的。不过,也有部分人遇到的实测效果并不理想。谷歌的Gemini 2.5发布也快一年,目前各个大科技厂都盯着OpenAI的动作。在OpenAI打出GPT-5和新版Sora 2两张牌以后,谷歌只跟了一张Veo 3.1。这波上线LMArena的估计是发布前的试水了,Gemini 3应该很快了!总的来说,虽然模型确实强了不少,能看表、能画SVG、还能作曲,但整个AI圈的「传统艺能」也越来越固定了——先传风声、再上LMArena、然后一堆人去撞马甲、测SVG、看谁更像真货。 看多了也不免有点腻。毕竟,无论是Gemini 3、GPT-5还是Claude新版本,最后都还是那一套「实测截图+prompt对比+看图说话」。 模型越来越聪明,但我们的评测方式似乎还停在老套路上。 希望下一次,不只是模型更强,而是真的能玩出点新花样。参考资料:https://x.com/synthwavedd/status/1979969871921225881https://x.com/ai_for_success/status/1979980654713696340https://x.com/scaling01/status/1979996937743954101https://x.com/scaling01/status/1979996937743954101
AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。
鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑