2025-09-19 17:01 北京
01 两度行业首发,产品体验再度升级
▍从“定格画面”到“鲜活瞬间”:动态呈现重构锁屏生命力
过去,锁屏壁纸始终被困在 “定格画面” 的局限中 —— 无论是宠物的萌态、生活里的美好互动,还是精心挑选的场景,都只是静态的像素组合。草地上嬉戏的宠物、阳光下伸展的姿态、沙滩上分享的欢乐,这些现实世界中充满呼吸感的动态,始终与静态壁纸绝缘。就像一张压在玻璃下的照片,它能留存记忆,却无法传递 “动态瞬间” 的生命力。
2024 年小米澎湃OS 2发布的 AI 动态壁纸,实现了从 “定格画面” 到 “鲜活瞬间” 的跨越。它不再是简单的画面动起来,而是基于现实逻辑与场景氛围,构建出完整的动态生态。
在 AI 动态壁纸的加持下,狗狗会欢快地摇着尾巴,周围的泡泡慢悠悠地飘浮、破裂,仿佛下一秒就要蹦跳着奔向你。再比如那张记录孩童在沙滩上孩子的照片,动态效果不仅能让背景的海浪轻轻翻涌,沙滩上的水果似乎也带着夏日的气息微微晃动,孩子们的笑脸在阳光下更显生动,让原本静止的场景变成了有温度、有欢乐的 “动态小片段”。
这种动态呈现,让锁屏不再是冰冷的界面,而是充满生命力的 “美好载体”,每一次点亮屏幕,都能重温那鲜活的瞬间。
*视频由AI生成
▍ AI 风格化动态解锁无限创意:打破场景与美学的边界
如果说 “鲜活瞬间” 是让画面 “活起来”,那么 AI 风格化动态则是让画面 “美出无限可能”。传统动态壁纸即便能实现动态效果,也始终局限于原图的场景与风格 —— 海边照片只能是写实的海边动态,城市夜景也只能是写实的夜景流动,创意空间被牢牢锁定在 “复刻现实” 的框架里。
小米澎湃OS 3的 AI 风格化动态,通过 AI 算法的赋能,打破了这一框架,让 “一张照片解锁 N 种美学风格” 成为现实。它以用户的个人照片为核心,结合 AI 风格迁移与动态逻辑重构,让同一张照片能演绎出截然不同的艺术质感。
这种风格化动态的创新之处,在于它将 “个人记忆” 与 “艺术想象” 深度融合。用户可以把宠物的照片转化为 “手绘卡通” 风格,让可爱的柯基变成萌萌的卡通形象,周围的泡泡也带上卡通特效;也能把孩子的照片转化为 “水彩童话” 风格,让沙滩、水果都晕染出水彩的柔和质感,孩子们的互动更显童话般的美好。
每一种动态效果都不是简单的滤镜叠加,而是深度结合风格特点的全新创作,让普通照片变成独一无二的动态艺术作品,解锁了锁屏美学的无限创意。
02 技术赋能,生命感动态焕新
视频生成技术是大模型时代的一个重要分支,是构建世界模型的基础。近年来,视频生成能力取得了显著进步,但想要生成稳定、可控、多场景、多风格的高分辨率视频还是存在不小挑战。
团队洞察到手机用户对于风格化的动态壁纸有迫切需求,而传统的动态壁纸制作需要专业工具,门槛高、耗时长。针对这一痛点,研发人员研发了自研核心算法架构,精准解决了用户不同风格、不同场景的动态壁纸生成难题,做到一键多风格的动态化。
小米自研风格化视频生成大模型充分利用了视觉理解模型的能力,通过对场景的理解自适应生成符合当前主体与环境的动态描述提示词,同时对不同的专家 LoRA 分配合理的权重来生成最佳动态。
此外,团队自研了一套鲁棒性较高的效果与性能优化体系,解决了视频生成稳定性差、资源消耗高等行业难题。在效果优化方面,通过 SFT+RL 的组合优化方案对视频画面、动态效果进行稳步提升。
▍场景自适应处理:多专家 LoRA 融合与离线权重标定策略
考虑到适配不同场景的自然动态,比如人像、动物场景适配更多主体运动,而风景、静物等场景适配更多运镜动效。在监督微调侧,通过多专家 LoRA 融合策略进行自适应处理,在上线前,使用了离线标定的策略来确定各风格和场景的专家融合权重,使用混合样本动态搜索最佳权重系数。
▍强化学习再提质量:创新 Video DPO 后训练方案
在强化学习训练阶段,我们设计了如下的 Video DPO 视频后训练流程,解决了视频生成模型显存占用过大、视频评测主客观标准难以对齐的问题。
在强化学习数据准备过程中,团队结合客观指标和主观筛选最终得到一定量的高质量偏好数据对,同时将离线 DPO 改为工程上的迭代在线的方式进行训练,提高模型泛化能力。
▍小米视频生成体验再升级:多技术并用实现 16X 加速、分钟级 2K 输出
视频生成往往需要占用较多资源,这也是整个行业的难题。而扩散模型想要达到最佳效果不可避免的需要多步迭代采样,为了让小米用户有更好的使用体验,团队在性能和效果上达到了极致平衡。团队使用了多种扩散模型蒸馏策略进行组合优化,最终将采样步数从上百步减少到数步,同时通过盲评来保持效果损失在可接受范围内。
此外我们也结合特征缓存、算子量化等进一步优化方案,最终实现了 10 倍以上的加速,将 2K 视频生成的耗时降至一分钟以内,达到了行业领先水平,大幅提升了用户体验。
在软件层面,研发团队通过端侧 AI 模型的轻量化重构与音频处理算法的深度效能优化,在保持核心识别精度不下降的前提下实现了能耗的精准压缩。依托软硬件协同的深度优化策略,小米 AI 眼镜的典型使用续航时长达到 8.6 小时,可全面覆盖日常通勤、办公协作及户外出行等多场景使用需求,有效缓解用户的 “电量焦虑” 问题。
03 未来已来,人人都能拥有专属艺术动态空间
小米澎湃OS 3发布会上推出的 AI 风格化动态壁纸,以“鲜活瞬间”与“艺术化风格迁移”为核心突破,让用户一键将静态照片转化为兼具生命力与美学表达的动态艺术。通过小米自研大模型与创新算法,引入多场景自适应动态逻辑,优化视频质量,实现了分钟级生成 2K 高清视频,大幅降低创作门槛。
