1. SVAC 2.0的高效压缩技术
SVAC 2.0标准主要技术特点包括:支持高精度视频数据编码,支持多样化的帧内及帧间预测、变换量化、二进制算术编码等技术,支持感兴趣区域(ROI)变质量编码、可伸缩性视频编码(SVC)技术,支持代数码书激励线性预测(ACELP)和变换音频编码(TAC)切换的双核音频编码,支持声音识别特征参数的编码,支持绝对时间参考信息、智能分析信息等监控专用信息,支持数据安全保护,支持视频数据加密、认证功能。
具体来说,SVAC 2.0的图像空间分割不再支持多条带,而支持编码片(Tile)的划分,如图1(a)一幅图像可以从水平和垂直方向上分割为若干个Tile区域,而这些Tile由一系列的CTU(Coding Tree Unit,树形编码单元)组成。据此,SVAC 2.0增加并行运算支持,多Tile同时编码,加快了编码速度。SVAC2.0的基本运算单元尺寸由之前的16X16提升为128X128,并可进一步划分为预测单元(PU)和变换单元(TU),划分方式由编码树决定。帧内预测模式由SVAC 1.0的5种增加至37种,如图1(b)细化预测方向,更好地适应视频内容不同方向的纹理,使预测更为准确。同时,提升了运动搜索插值精度为1/8像素精度,如图1(c)采用8抽头滤波器进行插值,优化了插值结果。SVAC2.0加入4种尺寸的离散正弦变换(DST),并增大原有的离散余弦变换尺寸至最大32X32,进一步提高了压缩性能。
图1 SVAC2.0 改进技术
2.SVAC2.0智能分析数据支持
时代与科技的发展使越来越多的新技术应用在摄像机中,随着深度学习、人工智能以及高性能计算等技术的逐渐推广,越来越多的智能算法应用于前端设备。为保证智能信息统一管理,SVAC2.0在保证实时视音频编解码的前提下,结合智能分析技术,细化智能信息并整理分类,加入智能分析专用信息,提供了对智能视频处理信息的结构化支持。
在支持前端嵌入式智能分析数据应用方面,如图2所示,SVAC2.0主要从图像分析规则、目标检测与特征分析、目标识别、行为分析、目标数量统计等方面对智能数据进行规范化格式定义,增加地理位置信息,规定了常用前端智能分析信息的数据格式和携带方式,最终通过专门的语法将分析结果以及产生的相关报警信息等,随视频码流同步传输和存储,如此可以节省资源,规范管理,便于快速检索、分类查询、视音频同步和监控数据的综合应用。
图2 SVAC2.0智能分析数据描述
3. SVAC2.0边缘计算智能数据的携带方式
SVAC2.0对边缘计算智能信息和常用的智能分析结果规定了具体的携带方式。在监控扩展数据单元中增加智能分析信息扩展语法,对监控视频进行智能分析算法得到的结果编码进入视频流中的方式做了定义。以此将中心与编码端的数据智能分析过程相分离,视频编码端将智能分析得到的结果携带到码流中并传输,中心只需要读取边缘计算后智能分析的结果,然后进行综合比对、碰撞,大大地减轻中心分析数据的压力,对监控视频大数据分析应用提供了技术支持。
在码流结构方面,如图3所示,SVAC2.0采用了类似于SVAC1.0的分层结构,将属于GOP层、Tile层中共用的大部分语法游离出来,组成序列参数集SPS(Sequence Parameter Set)、图像参数集PPS(Picture Parameter Set)、安全参数集SePS(Security Parameter Set)和扩展参数集EPS(Extension Parameter Set)。其中,序列参数集的内容大致包括解码相关信息,如档次级别、分辨率、某档次中编码工具开关标识和涉及的参数、时域可分级信息等。图像参数集的内容大致包括一帧图像所用的公共参数集,如量化参数、Tile相关语法元素、去方块滤波相关语法元素等。安全参数集包含了解码所需的加密与认证的开关以及视频密钥加密密钥版本号等安全参数信息,扩展参数集主要用来记录监控专用信息,如绝对时间信息、OSD信息等。
图3 SVAC2.0的码流结构
由图3可知,经过网络传输后重新组合载荷包,经过PS解封装后可以得到ES视频流,当解析至nal_unit_type=5的数据单元时,解码器将其解析为监控专用数据单元。SVAC2.0细化了此单元的内容,根据Extension_id的不同可以分为绝对时间扩展信息(004)、地理信息扩展(010)、智能分析信息扩展(011)和OSD信息扩展(012)四种监控专用信息。
图4 智能分析数据analysis_id[i]与智能特征的对应关系
SVAC2.0充分考虑了与公共安全息息相关的视频特征,这些特征在公安办案、监控舆情、维护社会治安等方面起着非常重要的作用,支持对图像分析规则、目标检测与特征分析、目标识别、行为分析、目标数量统计的主要数据进行了规范性格式化定义。图4中展示的是这些特征与语法元素analysis_id[i](第i项分析结果的分析功能标识)的映射关系,在一段视频流中可以携带0个、1个或多个智能分析结果,结果的数量可以用语法元素analysis_num表示,每个分析结果的表示形式也定义了结构化规范格式,通过值description_type[i]可知第i项分析结果的描述形式,当为002时厂家可自定义描述形式,当为003时则必须遵循国标中对结构化描述的规定。同时,SVAC2.0还具有极强的兼容性和可扩展性,在analysis_id的值中保留00E~0FF的值为更加细化视频特征做好铺垫,保留description_type值为000和003的描述形式,兼容更多的描述结构。在视频流中可以清晰的知道当前视频流所携带的智能分析结果的数量以及分别代表哪项识别功能。