人脸识别在2018年已成为全球在视频智能应用技术的主流,不少机场及车站也大量采用人脸识别通关检查系统,让人脸识别技术受到各行业的高度关注。据MarketsandMarkets预估,人脸识别全球市场产值将从2017年的40.5亿美元,成长至2020年的77.6亿美元,可以预期市场的快速成长将带动并加速各种行业在人脸识别的应用发展。
台湾人脸识别技术的研究始于90年代末期,但直到2005年后期一些安全应用的人脸识别系统才开始进入市场。人脸识别核心技术的发展对台湾安防产业来说算是一个相当重要的技术发展环节,虽然现在人脸识别率已达到90%以上,但周边环境的变化依然是技术应用的最大问题。
3D感测成主流技术
2D人脸识别技术已经走到瓶颈,这两年3D人脸识别技术开始冒出,目前较常见的3D感测技术有下列四种:
1、立体视觉(Stereo Vision)
透过2个相机模块拍摄影像,进行三角测量法等运算取得物体距离,是四者中唯一只需RGB相机模块而不用IR(红外线)模块的技术。由于需进行影像运算,通常需要一个额外影像运算芯片辅助,因此有些芯片厂商会推动这项技术。
2、结构光(Structured Light)
原理是对目标打出光条纹,再透过打出去的光纹变化来计算形状和距离,较常见于工业检测和研究用途。随着IR发展,Structured Light技术也能透过IR发射光纹,所以基本零组件包括IR发射器、IR相机模块与RGB相机模块。
3、光斑图案编码(Light Coding)
曾被微软应用在第一代Kinect体感摄影机,其原理是IR雷射发射后会经过光栅,将光平均分布在测量空间中,再透过IR相机记录每个空间的雷射散斑,设备上需要IR发射器、IR相机模块与RGB相机模块。
4、飞行时间测距(Time of Flight,简称TOF)
为微软并购的3DV Systems,也是第二代Kinect采用的技术。其原理是透过IR雷射发射,获得空间中每一点达到观测点的时间,进而推算出距离,得出3D景深图。因此需要IR发射器和接收器,并配合RGB相机模块和感光组件或感应数组。
Stereo Vision和Structured Light都需要图像分析运算,但Stereo Vision的软件运算较繁杂,不适合大量多点感测,且光源和镜头间的基线长度也得拉长,整体而言并不适合用于3D感测。
相对地,TOF可记录每个观测点的时间数据后再进行计算,Light Coding也只需转换各区域散斑以计算距离,复杂度较低;不过这两项技术均需IR发射和接收器,也另外需要内存甚至操作数件,故成本较高。此外,两者的运算原理不同,TOF单点IR只需记录时间,理论上会比Light Coding先分析散斑图形再运算来得简易;而Light Coding是将整个画面切割测距,要得到概略景深图较容易。整体而言,TOF的反应速度和精准度最佳,而Light Coding在不需要精细景深图时的表现较平均,Stereo Vision的成本则较低。
双技术结合 各有利弊
近年许多人脸识别软件公司纷纷提出人脸识别结合RFID或Beacon、指纹等相关技术,利用双重关卡防止误判或提升辨识速度,但却忽略了使用人脸识别的主要初衷──原就是不需再携带其他身分验证装置,故各有利弊。以目前手机App广泛使用人脸侦测(Face Detection)及特征撷取(Feature Extraction)这两类服务来说,最常见的就是修图软件或是影片屏蔽的应用,许多公司都有提供在线的Web API供大家开发,在行动装置上亦提供iOS及Android系统的SDK,算是非常普遍的技术支持。