10月29日,在CPSE安博会高端访谈的现场,围绕人工智能和安防等相关问题进行了探讨。此次会谈由CPS中安网总经理杨儒主持,邀请的嘉宾有:触景无限科技(北京)有限公司CEO肖洪波、商汤科技南区销售总监陈治华、深圳云天励飞技术有限公司产品总监程冰、北京旷视科技有限公司解决方案总监安洋、苏州科达科技股份有限公司智能事业部总经理晋兆龙(以上排名不分先后)。
以下内容,在不影响嘉宾意思的语境下,有所更改。
主持人:大家怎么理解AI和安防落地相比其它行业会更快?
晋兆龙:我们在安防行业耕耘了很多年,对此有一个深切的体会。从原来传统的智能算法开始,安防行业对于智能的需求是非常迫切的,也是一直存在的,只是原来的算法没法满足这种高端的需求,包括到现在深度学习出来之后,其实还有很多用户关于智能方面的应用需求还是被压制的。随着技术的前进,包括我们对行业应用深刻的理解,从数据量的爆发到运算平台的成熟,到客户对这个应用理解不断地深入,包括很多现在技术上无法完美解决的东西,客户也能通过他自身的不断认识提升,能够得到一些容忍或者说一些变通的处理方法。
总体上来讲,智能或者AI为安防行业的应用赋能了很多东西,从这个角度上来讲,加快了智能的发展和演进。同时,本身安防行业大量的视频监控也具备大数据应用的基础,我觉得这是两个相辅相成的促进。
安洋:首先为什么人工智能在安防行业落地很快,我认为它有基础,现在全国已经有2500万+的摄像机,这些摄像机都不需要再改造,大部分就可以用来做人脸识别,所以它可以很快的落地,因为它不需要很多的基础建设。第二是有需求,原因是现在公安的很多传统的老三样的手段,比如说敲门、查身份证、蹲点,这些手段已经无效了,所以急需一些基于人脸、基于人形的方法来帮助他提高破案率,所以是有强烈需求的。第三就是技术的成熟和规模化的应用,现在这么多的摄像机,技术也成熟到了一定程度,机器视觉的识别率已经高于人类的识别率,所以在这种大数据的情况下,人工本来就看不过来,机器又比人看得准。所以我们一直有一个理念,越来越多的摄像机不是给人看的,是给机器看的,而在见效快、有基础、有需求的情况下,所以AI落地安防很快。
程冰:刚才各位都提到了现在的摄像头数非常多,比较适合应用人工智能技术,我觉得这是其中一个方面。其实需求是从十几年前一直都存在的,包括以前大家也有做人脸识别,也有做各种生物识别的,这几年才非常火。我们觉得有三个方面的因素,第一方面是算法性能的提升,这两三年做AI的公司基本上都采用深度学习的技术,这个技术比以前的算法提升了10%到20%。第二,我们觉得是算力的提升,包括这几年的GPU、FPGA这些在计算加速方面得到了大面积的推广,成本也做得比较低,也便于一些AI公司做数据的训练,所以算力也让技术得到了快速的进步。第三,客户的认知的改变,以前客户觉得你的准确性要非常高,大数据也是这几年普及的,我们把AI和大数据融合之后,从大数据里面能找到目标的概率提升,这样就能帮助客户解决他切身需要的问题,所以他的认知度有一个提升。
陈治华:这件事情我觉得首先要感谢领导,他们在很多的大会上都讲到人工智能,尤其是在去年6月15号,在百万公安干警大会上,当时都讲到了人工智能,我们公安部门应该用人工智能手段提升我们的侦查破案的效率,解决当前警力不足的问题,这是开启了大规模应用的一个点,这是我最明确的感受。这个点结束之后,我再去拜访公安局的时候就非常受欢迎,他们主动找我跟他们交流,我觉得这是很重要的一个点。包括今年十九大的会议上也提到了人工智能。
另外一点就是算法的突破,这个算法的突破为我们打开了一个瓶颈,深度学习为什么这么火?因为它是一种明确的方法,在人工智能领域发展了几十年,为什么人工智能一直进步很慢,可能就是大家没有找到打开这个门的钥匙,这个钥匙就是深度学习,商汤在2010年的时候,我们的创始人就用深度学习的方法在视觉领域进行突破,这是很重要的一点。
还有一点就是算法的提升,其实这种规模化的应用,云计算在公安的落地也就变成可能。今天算法突破之后,它就是一个二进制的数据,就不再是一张张的人脸,它可能是一个数据集,这些数据集就可以分析和应用。因为是数据,它不再是传统的非结构化数据,结构化数据是可以分析和利用的,这时候就可以产生很多有意思的事情,比如说布控、检索、轨迹还原、同型高频,这都是数据应用的一种。这么大的应用就需要很大的运算能力,所以需要云计算。所以我觉得云计算这样一个概念在公安的大规模应用,就把安防的产业有很大的提升,这种大规模应用一定会带来安防产业从平安城市到智慧城市的升级,我非常看好未来整个安防落地的情况。
肖洪波:主要有几个方面促进了现在人工智能的发展:
一、不仅仅在安防行业,现在很多其他行业都在做和人工智能的结合。我记得去年我参加EVS(全球嵌入式智能会议),大家还在讨论要不要在前端做人工智能,但今年大家都不讨论了,今年讨论的是怎么在前端做人工智能。
二、深度学习的出现,某种程度上降低了图象算法研究的门槛。我记得我当时在UIUC的研究所里面做图象搜索,大家要定义它的特征,做PCA分析,再做底层的搜索,我们大概花了两三年的时间,做出来一个觉得还不错的算法。但是现在你找一个实习生,他只要有比较好的数据,他可以很快地做出来比我们当时几个很顶级的博士做出来的效果还要好的模型。所以说它从某种程度上降低了算法进入的门槛。
三、算法的提升。2014年,我们和英特尔合作,基于它的平台做的前端处理,完全可以做到1080P的图象全帧率的处理,而且功耗在5瓦以内,它的前端的运算力得到了极大的提升。你只要把这个模型做有效的压缩和优化,你在前端也可以跑得很快。
主持人:大家刚才聊的自己的产品或方案,我们聊具体一点,这些能帮用户解决哪些场景的问题?能帮他们解决哪些痛点?
肖洪波:我们关注的主要是在嵌入式这一端,另外我们也是一个中间提供商,我们并不做最终的产品,我们提供的主要是模组的解决方案。所以我们的客户更多的是摄像头的企业,我们提供解决方案给他。整个产业链的发展一定是大家关注在自己更核心的点上,大家进行合作。
我们非常愿意和大家展开这种合作,我们解决的问题是什么呢?我们的摄像头以前在出厂的时候没有针对场景进行优化,后来,我们就开始在数据的源头这一块做人工智能。根据这个场景可以优化、调节前端的抓拍,这样可以根据你关注的目标,通过最前端这一块给你做优化,这是我们关注的点。我们只是在嵌入式这个环节去用人工智能帮助我们的客户能够把前端的图象非常优化、非常清晰地给它抓下来。
以前很多时候并不是我们识别这些算法不好,而是说我们的图象质量有问题。因为它中间还有通过网络的传输、压缩,我们希望在那个压缩之前就把检测的这些图象提取出来,这是我们的切入点。所以我们也是非常希望和广大的厂商一起合作,这是我们的出发点。
陈治华:商汤在市场上主要是两大部分,一个部分就是在规模化应用,面对集成商这个部分,我们会提供端到端的解决方案,比如说大规模应用上,结合了我们的人工智能、云计算技术,加上我们的数据处理技术,可能提供一个完整的后端解决方案,这是我们在大规模应用上,可以和广大集成商一起做的事情。
另外一个部分,我们会把这些能力跟广大的厂商合作,我们在后端会给很多合作伙伴提供一些后台的引擎。我们可以把高性能的GPU的服务器和算法结合好的产品提供给合作伙伴,让他们在更多的领域做垂直化的应用,因为我们不可能做很多的领域,所以我们会在垂直化的领域做一些应用。
还有一个是前端的产品,我们也会前置到芯片里面,我们也会开发出一些FPGA的芯片,提供给一些硬件厂商,比如说不仅仅是在安防领域,可能还在辅助驾驶、机器人等等领域。
程冰:现在AI确实帮助客户解决了很多的问题,一个是解决了效率的问题,原来我们的客户要在视频里面找什么东西,需要大量的人力,包括国内一些典型的案件,要花费上百人从视频里面寻找线索。
第二个是准确度的提升,在以前我们要辨认一个人和另外一个人是不是相似,其实你拿着两张照片,很难通过人工就辨认得清楚。但其实有的时候,机器在这种准确性上还超过了人眼,它能够给到你一个相似度的阈值,这个阈值到达一定程度之后,就可以给人眼一个参考。
第三是在节省人力方面,例如现在有巡逻机器人、安保机器人,人工智能通过物体检测、人的检测,大大节省了保安的人力和物力。
安洋:刚才各位伙伴也提到了,现在用户分两类,一类叫做懂人脸,一类叫做不懂人脸,从仪式上、应用上帮助那些没那么懂人脸的用户更了解人工智能,这是一个方向。第二个方向是从公安的角度来看,我认为它有三个方向要掌握,一是他要知道要保护哪些人,我们在大城市级的应用里面找到好人,二是要知道防范哪些人,这些人我不知道是好人还是坏人,我要把他防起来,三是要打击坏人,对已经知道的坏人我要快速抓捕掉。现在的发展阶段是倒着来的,我们现在抓了好多坏人,旷视试图提供这种大的解决方案,帮助他找到哪些需要防范的人,哪些是需要确定保护的人,这是一个方面。
另外一个方面,现在大面积的人工智能、人脸识别上了之后,对算法和云计算等等厂家来说都是面临一个巨大的挑战,因为不仅仅是你是亿级库,现在可能已经到了千亿级的水平,旷视希望基于现有的网络和前端计算力把算法前置化,这样能大规模的节省用户的基础投资,最快速的见效,让现有的摄像机和即将上马的摄像机具有智能化的能力,这是解决他的两个痛点问题。
第三个问题是随着计算力的提升,他的硬件成本也在不断地下降,有了深度学习之后,我们的门槛其实是在降低,在这两个环境条件下,可以支持用户更大规模的去做,这样能回应到我提的第一个问题,就是说在整个城市级、国家级的层面上,我们要知道保护谁、防范谁、打击谁。
晋兆龙:科达为什么在2014年提出实施前端智能?就是意识到光靠后端智能是无法解决很多问题的,这是一方面。第二方面,我们在端到端的智能解决方案中会碰到很多问题,比如说我们的深度学习出来之后,它要凌驾在什么样的平台上运行,总是要有一个载体的,这种载体是不是通过通常的载体就能实现?我觉得可能不是很完美的解决,科达可以推出深度学习的计算平台,跟这个算法做完美的切合。
另外我们随着深度学习发展之后,它会产生大量的数据,我们是不是单一的解决这样一个点的问题?比如说我们是不是只关注人脸,只关注车牌,只关注车型?这些都不是,我们最终从用的角度上来讲,我们是要把人、车这些有效的元素用到实际的工作当中去,比如说公安行业,最实在的就是案件,我们如何把人、车和案件关联,这里面会涉及到一些数据的应用问题。另外这些数据的元素很多,我们需要有专门的方案解决问题,这是从端到端解决问题。
大数据出来之后,数据是海量的,如何进行千亿级或者更大规模的数据的碰撞分析,涉及到数据的存储、使用、访问、快速的检索。并且公安行业里面有一个很特殊的存在,就是这些目标的快照都是一些小文件,这些半结构化的数据都是一些二进制的数据,这都是一些语义数据,如何把这些元素混杂在一起做综合的碰撞,综合分析,这是非常大的挑战。不光规模大,而且数据种类元素多,所以科达会提出分布式的数据库,这个数据库会有效地解决问题,最终为了更好地解决问题,这是一个比较系统的东西。
反过来讲,我们如何来满足客户的需求,可能每个点都要做深入的深耕,但是我们觉得更重要的是,你如何全系统地、一系列地从端到端的推出这么一个完整解决方案,每个解决方案都可以解决其中一部分问题。
主持人:如果AI要推动监控行业变革的话,还会遇到哪些困难?简单的举一两个点。
晋兆龙:我觉得AI现在具备了一个大规模应用的基础,这个基础包含两部分,一部分就是我们的物质基础已经存在了,比如说大规模的视频监控、算法、各种资源,这是一个物质基础。还有一个是我们的客户应用基础,客户已经对这个东西有深刻的认识,并且他认为是可以帮助他落地的,我觉得这两个技术的存在,对我们推进智能化的发展是至关重要的。
安洋:谈到这个话题,我觉得有两个方向,一个方向是,现在不管人脸还是结构化,这些信息能够提高识别率,帮助他解决一个点的问题。能不能解决他真正的业务问题,可能未必。比如说在地铁,在社会面上,是不是我把这个人认出来了我就能抓到他?其实不是,我们应该在这个方向上跟客户一起努力打造基于他的人工智能的战法和部署,实现精准警务,这是一个方面。
第二个方向是大规模的应用了之后,这些大数据应该怎么用,它们之间建立的关系应该是什么。很多人抓了车、抓了脸、抓了背影、抓了屁股,这些人、物体怎么连起来,我觉得这也是一个很大的挑战。
程冰:谈瓶颈我觉得还谈不上,发展空间还非常大,困难也是有一些的,像我们从人脸切换到人像特征等等,这个过程中深度学习很火,但是数据还是非常难,投入成本也非常高,目前也没有非常好的标准,包括国外的测试库,数据量还是非常少的,LFW也就6000多组,所以我们觉得数据非常难。
第二个就是在算法的实际的水平和落地的能力上面,我们自身也在做一些服装、人像的特征,我们还在做一些步态的识别,我们觉得在这个推广的过程中确实还是挺困难的,它的准确度还很难达到一个客户想要的水平。就像我们前几年非常火的一个谷歌眼镜,他们最后也是承认了一个错误,觉得它推出的时间节点过早,当前客户想要的更多,这个产品还无法满足客户想要的东西。
其实我们在AI上也有这样的问题,我们觉得很多技术都开始起步了,其实能落地的技术确实还要一个过程,客户的认知也有一个过程,太早的推出市场,可能就像10年你去推人脸识别一样,可能客户最后直接给你一个闭门羹,认为你是骗子。
陈治华:这个问题我的感受比较深刻。第一个部分是难点在算法精度部分,刚才我们也听到几位同行在聊算法的门槛低了,但是里面的难点就更多了,也就是精度的部分还有问题。比如说我们今天的人脸布控,我们可能在做1比N(N值在20万、30万),商汤正在挑战N值千万级的人脸布控,就是我要把人脸做到千万级,做实时的比对,可能算法的精度差一两个点,可能就找不到了,这是第一个部分的难点。第二个难点就是抓拍库的问题,以深圳市局为例,可能是2万路的建设规模,未来是千亿级的数据,就算是热数据三个月,可能也是百万级以上的数据搜索,这个时候精度如果差两三个点,可能也找不到了。算法精度的提升是永无止境的,这是第一个部分。
第二个部分是我们正在挑战那些低像素的,它的像素已经低到20×20以下,到10×10的情况,这样一些领域的图片的还原,比如说我们公安有一些画像大师,通过一点点的像素能把人像还原出来,商汤正在挑战这个领域,可能这个像素只有几个点,但是我往往发现我跟你认识,但是拍得再模糊的照片,我也能大概认出是你,目前机器是做不到的,商汤正在挑战这种超分辨率的技术,在这个方面把他还原出来。
第三个部分,我跟很多公安局聊,往往一些不太明显的信息是破案的线索,比如说在视频结构化这个领域,很多边缘的影像,它反倒会影响破案,这个部分也是算法的挑战,所以我觉得算法挑战是一个永无止境的话题。
另外一个方面是人工智能的应用,刚才我说人工智能的应用是把小麦加工成面粉,原来可能是小打小闹,我们搞几个机器就够了,现在一个城市要做几万路摄像头,它的并发可能是几百、几千个并发,这种运算就很惊人了。原来CPU超算中心解决的是文本的数据,今天面对非结构化的数据,可能需要GPU的超算中心,商汤自己本身就有4个超算中心,同时我们也在跟一些公安局在建设GPU超算中心,解决运算的问题。因为要解决几万人同时吃面条的问题,如果几万人都要吃面条的时候,其实是一个很大的工程问题,我觉得这个问题也是一个巨大的挑战。
肖洪波:每一项新的技术出来的时候,我们往往在近期之内会高估它的作用,而在长期又忽略它的作用。其实我觉得有一天我们不再谈论人工智能的时候,可能那时候就是人工智能真的落地了。刚才晋总说得特别好,人工智能什么时候能可运营化是最重要的。人工智能可运营化之后对你的业务会产生很大的影响,你的业务流程、职责设定甚至新业务的形态都会受到影响。
另外一点,刚才几位也都提到了,我们算法的发展还是在不断向前的,包括深度学习,其实它的理论现在也没有特别成熟,还有非常多的新理论出来,我觉得我们大家也会一起努力,把这些人工智能的技术能够真正帮助我们的客户去做一些业务方面的创新,这是最重要的。