值得关注的是,这两家人工智能领域的巨头公司,都不谋而合地率先开放了图像定制平台或工具。用户通过简单的界面,上传定制训练数据,进行少量标注,系统就可自动生成特定图像识别的AI模型,从而惠及更多的开发者,促进AI技术的推广使用。而这或许也意味着人工智能机器视觉技术的发展,已经进入了一个全新的阶段。
机器视觉一直以来被认为是人工智能的关键基础能力,图像识别则是机器视觉的核心研究方向之一,也被视为人工智能最具应用前景的技术之一。然而,目前的行业现状是图像识别技术门槛较高,研发难度大,不仅需要AI专家、AI工程师们投入大量的时间与精力去搭建模型,而且成本极其昂贵。百度、谷歌能够相继构建并开放“傻瓜式”的图像识别技术平台,无疑具有深刻的意义。
利用百度定制化图像平台或谷歌AutoML Vision,每个开发者、企业、普通个人用户都能够在自己的电脑上通过鼠标点击、在线上传照片等行为,根据自己的需求定制专属的图像模型,识别特定领域的图片内容,不需要编写一行代码,几乎零成本获取百度、谷歌的图像识别能力。
公开信息显示,百度图像识别技术处于国际领先水平,基于深度学习及大规模图像训练,能够准确识别图片中的物体类别、位置、置信度等综合信息,并在多个领域率先应用,比如和中国食品药品检定研究院合作,实现了对40多种易混淆中药材及饮片的区分,识别准确率达95%以上,超过人工识别的准确度,能够有效协助检验人员快速鉴别中草药。除此以外,百度图像识别技术有望帮助科研机构进行动植物物种的识别和分类,协助科研人员进行多样性的研究。去年11月,百度正式推出定制化图像开放平台,在行业内率先向所有用户开放定制化图像识别能力。定制化图像开放平台是真正的从数据到服务的一站式平台,开发者可在1-2天时间内快速获得属于自己的定制图像识别服务和调用API,其简便的操作和强大的性能广受好评。上线后,定制化图像开放平台至今已经沉淀上千个模型,用户覆盖工业、农业、零售、金融、安防、医疗等多个行业和场景。
同样的,谷歌Cloud AutoML Vision的基础是Google领先的图像识别方法,包括迁移学习和神经结构搜索技术(neural architecture search technology)。李飞飞提到,谷歌图像识别技术AI模型可应用于医疗领域,医生可以通过AutoML建立的AI模型来解决罕见疾病和特殊案例的识别、判断等。不过,目前Cloud AutoML还处在Alpha免费测试阶段。
据知名咨询公司德国罗兰贝格发布《中国人工智能创新应用白皮书》预测,到2030年,人工智能将在中国产生10万亿元的产业带动效益。人工智能技术商业爆发潜力巨大,百度、谷歌选择开放人工智能图像识别技术,不仅带动AI产业的发展,也将加速人工智能技术落地速度,让AI技术真正“飞入寻常百姓家”。