从这个角度看,2018年应用机器学习为中国人工智能市场带来的规模达100亿元人民币。单就商业化机器学习开发平台而言,2018年包括硬软服在内的中国机器学习市场达到10亿元人民币,预计2018-2023年五年复合增长率将达到62.0%。在机器学习开始广泛渗透、应用场景拓展翻新的起步阶段,IDC逐步深入开展机器学习开发平台厂商评估这一研究。
市场现状
当前的技术应用现状:当前的机器学习开发平台基本可以提供30种以上的经典机器学习算法;基本已支持TensorFlow, PyTorch,Caffe等主流框架。不仅是机器学习、深度学习,图算法也开始走向市场,现阶段应用普及的是经典机器学习。领先的厂商在兼顾机器学习创新应用的同时,还能够针对机器学习类工作负载对底层硬件做深度优化,为用户提供高效灵活的软硬一体化产品。
应用落地现状:目前商业化机器学习产品已经落地的行业及应用包括金融行业反欺诈、信用模型评估,跨行业的产品推荐、精准营销,1-2年内正在落地的应用包括能源(尤其是电力)、军工、制造行业。
市场格局:
1.以云服务商为代表的平台级公司主推公有云机器学习,帮助用户在云上快速搭建机器学习模型,这些云服务商在已有的客户群体中积累了大量机器学习应用实践。该类厂商的优势在于有庞大的用户基数,可以快速转化为机器学习产品的用户。
2.以第四范式、探智立方为代表的创业公司以前沿创新的技术如联邦迁移学习、完全自动化的AutoML等技术/产品趋势。该类厂商的优势在于技术。
3.大数据平台公司也在推出机器学习组件以帮助用户在大数据平台上实现预测分析能力,例如新华三、东软、星环科技等。该类厂商则需要同时在技术和市场方面追赶领先者。
自动化机器学习、机器学习建模工程师、数据资源质量与市场的不确定性:当前算法工程师仍处于稀缺状态,一定程度上制约了机器学习的推广落地。面向应用场景的数据资源匮乏,也是影响机器学习推广的制约因素。自动化机器学习可以缓解对于专业算法工程师的需求,成功的自动化机器学习产品可以使业务人员经过培训即可以建模。总体来看,企业用户对机器学习产品交付方式的偏好、算法工程师的供需关系,都将影响机器学习市场的发展趋势。
值得关注的前沿领域:领先的厂商于2019年着力研发自动化机器学习、智能数据标注、可解释深度学习、界面可视化、图算法、批数据处理等。
典型厂商
在本次研究中,IDC中国选择了主流的13家厂商进行研究,分别是(排名不分先后,按照首字母排序):阿里云、AWS、百度、东软、第四范式、金山云、九章云极、美林数据、腾讯云、探智立方、微软、星环科技、新华三、IBM。本文仅选取5家典型厂商进行分析。
互联网平台级厂商代表:百度
百度在机器学习领域拥有深厚的技术积累,在国内最早推出深度学习开源框架飞桨PaddlePaddle,在近1-2年内下载量以及活跃用户量都保持高速增长。百度也是国内较早推出自动化机器学习产品的厂商,其EasyDL产品目前拥有较高的市场认知度。在商业化方面,依托百度云的客户积累及市场拓展能力,百度能够将机器学习能力快速输出并不断迭代。
创新创业公司代表:第四范式
既能专注AI算法开发又能兼顾软硬件一体化的高度优化;成熟的企业级产品;快速落地的商业化能力,成为第四范式从诸多企业中脱颖而出且快速扩张的重要因素。
数据科学、大数据时代的创新厂商:美林数据、九章云极
西安美林数据在本次评估中处于领导者象限。美林数据拥有数十年的企业数字化服务经验,在机器学习市场,其TempoAI产品已在多个行业中得到实际应用,且深受工业、能源等行业用户认可。成熟稳定的产品、广泛深入的用户案例,是美林数据位于领导者象限的重要原因。
处于“主要厂商/主要玩家”象限的九章云极当前主要服务金融行业,在特定的应用场景如反欺诈、用户画像等领域积累了丰富的实践,在政府、制造业等领域,也与客户共同打造了诸多机器学习的创新应用案例。
值得关注的国际厂商:AWS
AWS在全球机器学习市场取得了令人瞩目的成绩,根据其内部调研数据,约80%的TensorFlow部署在AWS的云服务上。在中国市场,AWS凭借自动化机器学习Sagemaker快速获得较高的市场认知度,依托云服务的客户积累其机器学习产品也得以快速部署。AWS较早推出机器学习推理芯片Inferentia,也参与了onNX(开放神经网络模型格式转换)项目的建设与推广。在加强自主研发的同时,AWS也始终以开放的态度为用户提供灵活的机器学习选择。
提供给技术买家的建议
应用场景的成熟度总结:成熟度高的应用场景包括产品推荐、用户画像、反欺诈,简单的证件识别类光学字符识别技术(OCR)。
正在探索的应用场景:设备预测性维护、基于产品外观的质量检测、交通轨道火花分析等。(由于本次的研究对象是面向开发人员的机器学习开发平台,未包括人脸识别、声纹识别、短语音识别等应用场景)。
合作伙伴的选择:
1. 首先明确当前的业务场景是否能用机器学习的方式解决,此问题可与供应商共同探讨。考虑企业现阶段是否具备机器学习模型开发能力,如无模型开发能力,可以选择自动化程度较高的机器学习产品。如有充足的开发能力,也可以尝试采用开源技术自主搭建机器学习平台。
2. 产品层面,选择高度灵活、容易上手的产品,考虑模型的丰富程度的同时考虑提供的模型是否符合企业内部的应用需求。
3. 考虑采用高度自动化的机器学习产品,培养业务分析师向数据科学家转型。
应用机器学习、人工智能,重要的一点在于具备建模所需数据。很多机器学习项目失败的原因也是因为数据不足导致模型预测准确度不能满足业务上线需求。长期来看,企业需要考虑能够增强内部数据能力的产品/服务,尽早建设可以输入人工智能模型的核心智能数据平台。
IDC倡导在采用机器学习、人工智能解决方案时,企业不能过度关注硬件和算力平台而忽视了软件及应用。为短期内的AI工作负载选择适配的底层架构,为中长期的AI工作负载做好算力规划。更重要的是,重视将机器学习、深度学习的价值大化,真正以业务需求为导向,实现智能化。
IDC中国人工智能高级研究经理卢言霞表示,尽管深度学习算法的创新速度变缓,但我们相信机器学习的应用将稳步渗透到各行各业的生产系统中。纯技术的创新速度有所放缓,但从技术到产品到商业化应用落地的速度在加快。未来,自动化机器学习也将降低行业用户采用AI的门槛,加速行业企业实现高级别的自动化、智能化。