五大趋势总结带你看清声纹识别技术研究方向

2019-10-30 1970

核心提示：走出实验室的声纹识别技术因其广阔的应用场景和价值，从特定领域到民用领域，在国内外正迎来第一波商用化浪潮。而与此同时，关

走出实验室的声纹识别技术因其广阔的应用场景和价值，从特定领域到民用领域，在国内外正迎来第一波商用化浪潮。而与此同时，关于声纹识别技术研究的成熟度以及安全可靠性，一直是应用领域讨论的重点，本文基于时下声纹识别技术研究的前沿观点，总结出五大发展趋势：

　　1、声纹识别研究朝着深度学习和端到端方向发展

　　语音作为语言的声音表现形式，不仅包含了语言语义信息，同时也传达了说话人语种、性别、年龄、情感、信道、嗓音、病理、生理、心理等多种丰富的副语言语音属性信息。以上这些语言语音属性识别问题从整体来看，其核心都是针对不定时长文本无关的句子层面语音信号的有监督学习问题，只是要识别的属性标注有不同。

　　近年来，声纹识别的研究趋势正在快速朝着深度学习和端到端方向发展，其中最典型的就是基于句子层面的做法。在网络结构设计、数据增强、损失函数设计等方面还有很多工作去做，还有很大的提升空间。

　　2、提升声纹识别系统的短时语音情况

　　在实际应用中，由于对基于语音的访问控制需求的不断增长，提升声纹识别系统在短时语音情况下的性能变得尤为迫切。短时语音中说话人信息不足以及注册和测试语音的文本内容不匹配，对于主流的基于统计建模的声纹识别系统是一个严峻的挑战。

　　3、改进现有的深度说话人学习方法

　　目前采用的深度说话人识别方法首先利用神经网络提取前端的帧级特征，然后通过池化映射获得可以表示说话人特性的段级向量，最后采用 LDA/PLDA 等后端建模方法进行度量计算。

　　相对于传统的 i-vector 生成过程，基于深度学习的说话人识别方法优势主要体现在区分性训练和利用多层网络结构对局部多帧声学特征的有效表示上。如何进一步改进现有的深度说话人学习方法是现阶段的一个研究热点。

　　4、深度对抗学习在声纹识别技术中的应用

　　生成式对抗网络 (GAN) 的主要目的是用在数据生成、降噪、等很多场景里面。它还被用在领域自适应里面，形成一个新的分布。第三个广泛的应用是生成对抗样本，这会对分类系统产生大的困扰。很多研究者用对抗样本攻击机器学习的系统，在原始数据上增加一些扰动，生成样本，经过神经网络之后就有可能识别成完全不同的结果。这个思想在图像处理领域非常活跃，会造成错误识别，引起了自动驾驶，安全等领域的研究人员的广泛关注。

　　在语音领域，GAN 可以用在语音识别、口音自适应上，通过多任务学习和梯度反转层来进行口音或信道的自适应，然后加上其他方法可以得到较好的效果。声纹识别也存在各种不匹配的问题，在声纹识别上也可以使用这一思想。同样的思想也用在了 TTS 语音合成领域，目的是把不同的音素解耦成说话人，风格等，去除噪声对建模的影响。

　　5、深度嵌入学习是进行声纹识别和反欺骗的一个重要途径

　　说话人识别和欺骗检测近年来受到学术界和业界的广泛关注，人们希望在实际应用中设计出高性能的系统。基于深度学习的方法在该领域得到了广泛的应用，在说话人识别和反欺骗方面取得了新的里程碑。然而，在真实复杂的场景下，面对短语音、噪声的破坏、信道失配、大规模等困难，开发一个鲁棒的系统仍然是非常困难的。深度嵌入学习是进行说话人识别和反欺骗的一个重要途径，在这方面已有一些著名的研究成果。如之前的 d-vector 特征和当前普遍使用的 x-vector 特征。

　　结语：目前，指纹识别、人脸识别已经被大众所熟知，但同样作为生物识别的声纹识别，还处于技术挑战的前沿地带。据声纹识别企业快商通分析，当下全球生物识别产业规模庞大，仅声纹识别这一细分方向的市场规模就将近百亿美元，预计2020年更是有望超过200亿美元(合1346亿元人民币)，占整个生物识别市场的22.4%。

　　以国内公共安全领域为例，公安部面向全国推广声纹技术，与指纹库、DNA库类似，声纹库建设是一项有着重要实战价值的工作，具体表现在声纹特征具有非接触式采集的优点，和已有DNA库、指纹库相结合，可形成立体生物特征库，建成后直接为多警种服务，是利用高科技手段在侦破案件和诉讼活动中应用的一个新的增长点，将能有效提高公安机关侦查破案的效率和能力，成为落实科技强警的重要实践之一。目前，公安部已在声纹库建设方面进行了重点布局，并选择快商通等通过公安部标准检测的厂商作为声纹采集设备提供方，力求双发共同完成这项专业技术性强、应用领域广、建设难度大的系统工程。

劳保用品网防护用品网声纹识别

点赞 0举报收藏 0打赏 0评论 0

免责声明

•: 本文为小编互联网转载作品，作者: 小编。欢迎转载，转载请注明原文出处：https://www.1elephant.com/news/show-21070.html 。本网站部分内容来源于合作媒体、企业机构、网友提供和互联网的公开资料等，仅供参考。本网站对站内所有资讯的内容、观点保持中立，不对内容的准确性、可靠性或完整性提供任何明示或暗示的保证。如果有侵权等问题，请及时联系我们，我们将在收到通知后第一时间妥善处理该部分内容。582117289@qq.com。

更多>同类防护头条

admin
加关注0
~~没有留下签名~~~~

推荐图文

烟台将建设紧密型城市	我国将做好基本医疗保
淄博在崛起\|“你平安	金昌市消防救援支队金

推荐防护头条

点击排行

手机扫一扫

快速投稿

你可能不是行业专家，但你一定有独特的观点和视角，赶紧和业内人士分享吧！

我要投稿

投稿须知

• 完善综合交通运输系统，加快建设交通强国——新	• CAME2021常熟@智缝时代
• 西北最大交通展—2021新疆国际交通产业博览会	• 重磅！应急管理工作干得好有奖励！
• 河北建支铸造--实力牛企，再次邀您相聚CZFE2021	• 世卫组织更新口罩使用指南
• 澳政府斥巨资开发新冠追踪APP，原来是为了收集	• 吴尊友：喀什疫情源头是境外集装箱，无症状感染
• 国药集团已提交新冠疫苗上市申请钟南山：国产	• 你是在减脂，还是减寿？

VIP

推广服务

增值服务

五大趋势总结带你看清声纹识别技术研究方向

VIP

推广服务

增值服务

五大趋势总结 带你看清声纹识别技术研究方向

五大趋势总结带你看清声纹识别技术研究方向