当前情感技术正处于发展中,目前较为常见的情感识别有以下三种:
一是基于人的脸部特征的微表情识别,通过输入人脸图像或者视频流进行检测,通过心理学面部行为识别符号来映射人像的内心活动,与一般监控视频抓拍不同,微表情的识别对象是0.2秒内发生的瞬间标签,同时需要采集的数据点也相对较多,例如除了脸部肌肉数据点之外,还会对皱纹纹路等细微数据进行采集,当前国内已经有不少有成熟的企业,如希亚斯、平安科技等,主要应用在于教育、金融、社区安防领域;
二是基于人工智能语音情感识别技术的语音情绪分析系统,该技术已经在国外尝试并开展应用,但由于中文发音的特殊性,导致相关的情感算法对中文识别的准确率偏低,同时在针对真是业务环境的场景复杂性、信号高噪性和快速响应等都是需要克服的难题。据网上报道称,国内已经研发出中文语音情感识别算法,并在国内成功应用,如阳光保险客户中心语音情绪分析系统,让计算机对每天的全部通话进行全面自动化机器质检,标记座席及客户的负面情绪,协助质检人员对座席的服务质量进行把关;
三是基于生理心理学,通过人类生理细微变化,观察多种情绪的特定波动变化的模式(如心电图、电皮肤活动等),识别人们思想情绪的变化。例如当人们感受到压力而紧张或有不良企图以致情绪亢奋时,身体交感神经就会启动相关必要的机能,例如心跳加速、血压上升、呼吸变快、体温增高,乃至于肌肉皮肤颤动等生理变化。
以下重点分析是第三种情感识别方式。据《识破潜在隐藏讯息的VI情绪辨识技术》提到:
当人紧张焦虑时,无法被意识控制的前庭情感反射(VER),会透过头部与身体的细微振动(物理上做功),以取得人体热力学能量守恒定律的平衡;肌肤细微振动产生的光点变化,则可透过特殊的摄影机观察记录。因此技术是透过量测及演算振动(Vibration)在影像(Image)的变化,比对出相对应的潜在情绪, 故被称为VibraImage(VI)。在每秒30帧图像中,分析每张影像中人物的脸部皮肤、眼球、嘴角、眼皮、身体振动的次数,并计算振幅与振动周期, 运算包括头部及身体的三维振动频率、振幅、对称性,以及振动过程总计45个参数,将像素振动速率映像出相关人的隐藏状态,以判断出有无紧张、攻击性、焦躁等精神状态。
据悉,俄罗斯通过训练及试用,已经成功应用在世界峰会G7、G20、奥运会等全球最高维安等级的场合,同时也在机场、高铁站、大型零售商场等公共场所,美国德州也在市区街道导入该技术进行预防犯罪。
应对层出不穷的公共安全挑战,人脸识别当前已经成为有效应对的手段,但仅仅依赖人脸识别仍然有不少盲点不能处理到,同时该技术也存在不少的误报率,情感识别或许可以成为有效的辅助手段。未来无论是摄像机与情感识别软件的结合,还是情感识别的测谎方式,都能有效减少城市管理人员的工作,提高效率,也会对社会治安带来新的帮助。