小米大模型团队 2025-08-14 17:01 北京
在日益普及的汽车应用中,驾驶安全与便利性一直是关注的重点,随着汽车智能化的提升,通过摄像头升级等方案解决泊车困难、窄路会车危险等场景的技术也应用而生,这就是汽车行业俗称的 AVM 功能。
AVM 环视(也称 360 全景影像)系统通过对四个环视摄像头进行图像拼接处理呈现出 360 的环视视野,让驾驶者能够看到车周的环境,提升行车安全性,市场上常见的 AVM 环视功能一般提供 360°视野,通过拼接获得平面鸟瞰图。
AVM 最早应用于卡车上,用来弥补卡车盲区视野;在乘用车的应用首次出现在 2008 年,2017 年后,随着电动汽车的兴起,AVM 也迎来了从小众功能到逐渐普及接受的过程。
传统的 AVM 一般仅支持 360°效果,且画质往往存在色差、噪点、模糊等问题,在车身四周也有比较大的盲区,随着汽车本身的使用,AVM 拼接的准确度会逐渐发生漂移,越来越不准确,种种原因导致了传统的 AVM 功能普及率很高,使用意愿与满足率偏低的尴尬现状。
小米YU7 支持 540°全景影像技术,通过核心算法、技术流程的全面自研,打磨了一套精准、简洁、有效的产品设计,提升用户使用 AVM 系统的体验。小米全栈自研技术将 360°全景影像与 180°底盘透视功能相结合,不仅继承了 360°全景影像的实用性,还进一步强化了驾驶体验。通过车身摄像头,360°全景影像可实时呈现车辆周边状况;而新增的 180°底盘透视功能,则将底盘下的路况实时传输至中控屏幕,从而显著提高驾驶的安全性与便捷性。
小米YU7 支持实时动态标定功能,以确保全景画面的稳定拼接效果。当车辆负载变化或悬架高度发生改变时,摄像头相对于地面的位置会随之变化,可能导致四路画面拼接出现错位问题。为了解决这一情况,全景系统会根据车辆实时相机位置变化,自动调整摄像头的参数进行校正,从而保证画面的精准对齐,提升用户的整体体验。
01
车载全景环视介绍
▍什么是车载全景
车载全景影像技术是一种基于多摄像头协作和图像处理算法的高级驾驶辅助工具,旨在解决驾驶过程中盲区监控难题,提高行车的安全性和便利性。
全景系统通常配备前、后、左、右四个超广角摄像头,能够全面覆盖车辆周围的 360°视角,从而将周边环境尽收眼底。系统通过先进的图像处理算法,对摄像头采集的广角画面进行畸变校正,精准还原真实图像,同时将多个摄像头的画面无缝拼接,生成一张完整的 360°鸟瞰图。该俯视画面与其他视角画面会实时显示在中控屏幕上,为驾驶者提供直观清晰的环境观察体验。这一技术不仅有效解决了行车过程中的视野盲区问题,还极大提升了驾驶的安全性与操作便利性。
▍车载全景有哪些视角
1/全景俯视图:
全景俯视图由车辆前、后、左、右四个摄像头采集的影像经过畸变校正后拼接生成,最终呈现出完整的全景俯视图,可全面消除驾驶盲区。
此外,通过先进的软件算法,全景俯视图还支持 180°底盘透视功能,从而实现综合视角覆盖的 540°全景影像。透明车底的实现原理是基于车辆的运动信息,通过构建运动模型来实现底盘透视效果。系统利用实时速度、车辆转角、车身尺寸等数据,估算出车辆的运动模型,并由此计算出相邻帧之间的位姿变换矩阵。随后,系统使用历史帧中的图像数据对当前帧的车底区域进行填充,逐步实现真实的底盘透视效果,直观呈现底盘下的路面情况。
该视图为泊车、狭窄路况行驶、复杂地形行驶提供了更加清晰直观的视野支持,大幅提升用户体验以及驾驶的安全便利性。
2/前后单视图:
利用虚拟 3D 方式实现单视图,在保证物体基本形态的基础上,既保证足够的天空占比,又保证了最小的视野盲区。前后视图中适当保留小部分车身作为参照,最大限度地展示盲区范围。这种设计为行驶或泊车时提供了更直观的参照,从而提升操作的安全性与便利性。
3/左右轮毂视图:
左右轮毂视图有两种视图 UI:前左轮+前右轮、后左轮+后右轮,分别为前进和倒车提供视图辅助。通过专门聚焦车轮及周围区域的显示,为驾驶者提供更细致的视角支持。这一功能在复杂路况、狭窄空间行驶以及停车操作中表现出诸多优势。
02
小米全自研 540°全景环视技术解密
▍AVM 全景系统整体实现
该系统包含三种视图的实现,采用 3 个独立线程进行处理,架构设计灵活,能够方便地实现视图的多种组合。
▍remap 映射原理
三种视图(BEV、前后视图、轮毂视图)的实现均基于虚拟相机的针孔成像原理。其核心流程可分为三步:首先通过针孔相机模型将屏幕坐标映射至世界坐标系;其次利用相机外参(旋转矩阵与平移矩阵)转换至相机坐标系并生成映射图;最后根据内参模型计算鱼眼图像的对应坐标。
三者的主要差异体现在世界坐标的计算环节。由于屏幕坐标到世界坐标的转换是 2D 至 3D 的映射过程,3D 模型的几何设计成为关键:
1.BEV 视图:采用与地平面完全重合的平面模型,确保地面物体(如车道线)无透视变形;
2.前后视图:使用底部对齐摄像机位置的半球模型,通过调整半球半径控制天空占比与盲区范围;
3.轮毂视图:同样采用半球模型,但球心正对摄像机,通过虚拟相机位姿调整实现车轮等局部特征的精准显露。
▍性能优化控制
在性能优化和资源控制方面,主要通过以下方式进行改进:
1.多线程 GPU 并行渲染:视图的渲染绘制通过多线程 GPU 并行实现,大幅提升图像处理效率。同时,其他复杂的图像计算任务也交由 GPU 并行执行,最大限度地减少对 CPU 资源的占用,从而保障系统的整体性能。
2.GPU 内存池管理:建立 GPU 内存池,按照任务需求动态分配内存。在确保满足内存使用要求的前提下,优化内存资源的调度策略,减少内存分配导致的额外耗时,从而提高 GPU 处理任务的效率和流畅度。
通过以上优化措施,全景系统能够充分利用 GPU 的渲染和并行计算能力,在保证高性能运行的同时,显著减少 CPU 与 GPU 的资源竞争,提升视图渲染的实时性和稳定性,带来更优质的用户体验。
03
瞄准使用痛点,技术升级拉高体验
▍独特的建模方式,解决视野盲区与畸变
在车载环视系统的前后单视图设计中,车底盲区、天空占比与物体畸变控制一直是相互制约的技术难点。传统方案往往难以兼顾三者:若优先消除车底盲区,则天空占比会显著压缩;反之,若扩大天空视野,又会导致盲区增大或物体形变加剧。
小米汽车方案通过不规则 3D 球面建模技术突破了这一瓶颈:
1.深度拉伸设计:在对球面模型进行非均匀深度拉伸,在减小物体畸变的基础上,也能提升天空占比;
2.动态球心调节:通过动态调整球心纵向位置,平衡天空视野与车底覆盖范围,实现零盲区(漏出部分车身)与舒适视野(天空占大于视图 1/3)的兼容。
▍实时动态标定,持续保障画面拼接准确性
当车辆负载变化或悬架高度发生改变时,摄像头相对于地面的位置会随之变化,从而可能导致四路画面拼接出现错位问题。针对这一情况,小米汽车支持实时动态标定功能,有效解决画面错位的问题。
小米汽车自主研发的动态标定系统,集成了两种标定模式,会根据需要自适应地选择最优方式进行调整:
1.悬架高度动态补偿:系统能够根据车辆悬架高度变化,实时调整摄像头参数进行校正。通过动态补偿悬架高度的影响,确保摄像头视角的精准性,从而保证全景画面的稳定拼接对齐,消除因车身高度改变导致的画面拼接误差。
2.基于车道线的动态标定:通过检测外部环境中的车道线信息,实时优化摄像头的外参校准。此方式能够确保车道线在全景画面中的连续性和准确性,避免因摄像头位置相对变化引发的画面错位问题。
综上,通过实时动态标定功能,小米汽车在车辆状态变化时仍能保持全景画面的观感流畅和精准呈现,进一步提升了用户体验和驾驶安全性。
-
全景环视系统技术的全栈自研,保障了小米YU7 优秀的行泊车体验,为用户在低速下观察车辆周边态势、寻找合适的泊车方案等提供了极大的视角便利,让狭窄区域泊车等更具备掌控性。通过对影像画质、拼接畸变、动态实时适应等的细致打磨,小米YU7 的全景环视影像能力在实用性、高级感与复杂度上寻找到了平衡,配合流畅顺滑的车机系统,相信能为广大小米YU7 用户带来更好的窄路会车与复杂场景泊车体验。
END
