2016年,中星微发布首款深度学习芯片星光智能一号,核心技术为内置专为卷积神经网络优化的神经网络处理单元(NPU)。星光智能1号是中国首款量产的人工智能芯片,目前已经在9大领域落地开花去的应用成果。同时星光智能1号在2017年获北京科技进步奖,是神经网络处理器获得的第一个奖。
张韵东介绍,第二代NPU的运算能力达到1080P@30fps实时分类检测的需求,是第一代NPU的16,采用了独特的网络精简技术,大幅地降低了数据吞吐量,进一步提升了芯片的能耗比和效率。
此外,第二代NPU大幅度增加了片上SRAM的容量,减少了内存带宽上的压力,整体效率比第一代有大幅度的提升,在低功耗性能上有了明显的改善,通过改变微构架和动态控制内存以及运算单元的方式来降低芯片的整体功耗。
同时,也扩展了更多的神经网络算法,软件可以容易地编程并灵活使用。采用了分布式结构和并行计算的方式,可以实现更为灵活的硬件方案。
此款NPU针对CNN算法特点进行优化设计,采用全新的“数据驱动”的计算机架构,彻底颠覆了传统的冯诺依曼架构。NPU针对神经网络架构进行优化,可以灵活配置网络结构,支持AlexNet、GoogLeNet等各类神经网络。支持CAFFE和TENSORFLOW等主流深度学习软件开发框架,可以轻松将深度学习算法应用于嵌入式产品。