大华股份取得KITTI Sceneflow排行榜第一名:
(图片来源自网络,如有侵权,请联系删除。)
大华股份取得KITTI Flow排行榜第一:
(图片来源自网络,如有侵权,请联系删除。)
关于KITTI:KITTI数据集由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办,是目前国际上最大的计算机视觉算法评测数据集之一。数据集用于评测立体匹配(stereo)、光流(flow)、场景流(sceneflow)、视觉里程计(visual odometry)、物体检测(object detection)和跟踪(tracking)、道路分割(road)、语义分割(semantics)等计算机视觉技术的性能。KITTI包含市区、乡村和高速公路等场景采集的真实图像数据,每张图像中最多包含15辆车和30个行人,且存在不同程度的遮挡与截断。
场景流与光流:
场景流算法能够同时估计场景中物体的三维位置与三维运动矢量,是感知环境空间几何结构的核心算法,与感知语义信息的算法结合后,能够全面地理解环境。三维场景流的估计结果能够进一步分解为立体匹配结果与光流匹配结果,可以认为,光流是场景流映射到二维图像坐标系的投影。
在本次比赛中,大华股份AI团队为提升场景流估计精度,增加了一系列算法模块。首先,基于Mask-RCNN网络进行实例分割,从场景中分割出行人、车辆、自行车等前景目标。接下来,基于GC-Net计算初始视差图,使用分段多权重loss函数、利用实例分割结果和多尺度特征图优化初始视差结果,得到更加精细的视差图,进而改善了初始的proposal NRT集合。最后,引入移动前景目标的刚体运动一致性约束,针对场景流不连续区域,采用多阈值融合的策略,优化场景流估计结果。
在评测中,采用场景流和光流算法的效果和计算结果如下所示:
(图片来源自网络,如有侵权,请联系删除。)
输入图像
(图片来源自网络,如有侵权,请联系删除。)
T0时刻视差图
(图片来源自网络,如有侵权,请联系删除。)
经光流反向映射后的T1时刻视差图
(图片来源自网络,如有侵权,请联系删除。)
T0时刻到T1时刻的光流图
在大华实际产品和未来产品中的应用
本次竞赛中使用的技术已在大华股份的双目摄像机、全景摄像机等产品上得到应用,提升多目摄像机的捕获目标深度数据、目标分离等算法性能。同时,该技术也成功应用于AR融合应用,实现单个与多个摄像机图像的AR语义融合,极大提升行业解决方案的用户体验。
双目摄像机立体匹配应用场景
以下为致密物体堆积下立体匹配的效果:
(图片来源自网络,如有侵权,请联系删除。)
双目图像左图
(图片来源自网络,如有侵权,请联系删除。)
视差图估计结果
AR语义融合应用场景
以下为路面图像的AR语义融合效果,可供增强的信息:目标类别、位置、运动矢量等
(图片来源自网络,如有侵权,请联系删除。)
真实图像
(图片来源自网络,如有侵权,请联系删除。)
AR语义融合后的效果