2016年宋渔,中星微發(fā)布首款深度學(xué)習(xí)芯片星光智能一號(hào),核心技術(shù)為內(nèi)置專為卷積神經(jīng)網(wǎng)絡(luò)優(yōu)化的神經(jīng)網(wǎng)絡(luò)處理單元(NPU)辜限。星光智能1號(hào)是中國首款量產(chǎn)的人工智能芯片皇拣,目前已經(jīng)在9大領(lǐng)域落地開花去的應(yīng)用成果。同時(shí)星光智能1號(hào)在2017年獲北京科技進(jìn)步獎(jiǎng)薄嫡,是神經(jīng)網(wǎng)絡(luò)處理器獲得的第一個(gè)獎(jiǎng)氧急。
張韻東介紹,第二代NPU的運(yùn)算能力達(dá)到1080P@30fps實(shí)時(shí)分類檢測的需求毫深,是第一代NPU的16吩坝,采用了獨(dú)特的網(wǎng)絡(luò)精簡技術(shù),大幅地降低了數(shù)據(jù)吞吐量径以,進(jìn)一步提升了芯片的能耗比和效率姐硬。
此外,第二代NPU大幅度增加了片上SRAM的容量夺疹,減少了內(nèi)存帶寬上的壓力柄豹,整體效率比第一代有大幅度的提升,在低功耗性能上有了明顯的改善应康,通過改變微構(gòu)架和動(dòng)態(tài)控制內(nèi)存以及運(yùn)算單元的方式來降低芯片的整體功耗橱狗。
同時(shí),也擴(kuò)展了更多的神經(jīng)網(wǎng)絡(luò)算法宠宗,軟件可以容易地編程并靈活使用饮协。采用了分布式結(jié)構(gòu)和并行計(jì)算的方式秦物,可以實(shí)現(xiàn)更為靈活的硬件方案瓣硼。
此款NPU針對(duì)CNN算法特點(diǎn)進(jìn)行優(yōu)化設(shè)計(jì),采用全新的“數(shù)據(jù)驅(qū)動(dòng)”的計(jì)算機(jī)架構(gòu),徹底顛覆了傳統(tǒng)的馮諾依曼架構(gòu)聂映。NPU針對(duì)神經(jīng)網(wǎng)絡(luò)架構(gòu)進(jìn)行優(yōu)化起便,可以靈活配置網(wǎng)絡(luò)結(jié)構(gòu),支持AlexNet窖维、GoogLeNet等各類神經(jīng)網(wǎng)絡(luò)榆综。支持CAFFE和TENSORFLOW等主流深度學(xué)習(xí)軟件開發(fā)框架,可以輕松將深度學(xué)習(xí)算法應(yīng)用于嵌入式產(chǎn)品铸史。