作為國(guó)產(chǎn)CPU的代表之一,龍芯這兩年已經(jīng)將架構(gòu)轉(zhuǎn)向自研的LoongArch指令集,號(hào)稱100%自主,現(xiàn)在還在不斷擴(kuò)展LoongArch的應(yīng)用領(lǐng)域,今天龍芯宣布支持了NCNN神經(jīng)網(wǎng)絡(luò)計(jì)算框架,各項(xiàng)性能比通用實(shí)現(xiàn)普遍提升一倍以上。
據(jù)龍芯介紹,近期經(jīng)過龍芯中科與NCNN社區(qū)的共同努力,在NCNM中使用龍架構(gòu)(LoongArch)向量?jī)?yōu)化實(shí)現(xiàn)了大部分算子,得益于龍架構(gòu)向量的高效實(shí)現(xiàn),優(yōu)化后NCNN在平臺(tái)上各項(xiàng)性能測(cè)試比通用實(shí)現(xiàn)普遍提升一倍以上。
基于龍架構(gòu)向量?jī)?yōu)化開啟前后的NCNN各項(xiàng)性能對(duì)比
(豎軸為耗時(shí)高度,越高耗時(shí)越久,性能越低)
NCNN作為業(yè)界首個(gè)為移動(dòng)端優(yōu)化的神經(jīng)網(wǎng)絡(luò)前向計(jì)算框架,在2017年首次開源,是騰訊優(yōu)圖實(shí)驗(yàn)室第一次對(duì)外公開深度學(xué)習(xí)的研究成果。
目前多應(yīng)用在圖像方面,例如人像自動(dòng)美顏,照片風(fēng)格化,超分辨率,物體識(shí)別等等。NCNN計(jì)算框架,因其高性能、無(wú)第三方依賴、跨平臺(tái)支持大部分常見CNN網(wǎng)絡(luò)的特點(diǎn),是許多開發(fā)者在移動(dòng)端、嵌入式設(shè)備上部署深度學(xué)習(xí)算法的首選框架。
本次優(yōu)化共產(chǎn)出3萬(wàn)多行代碼,成果將應(yīng)用于龍芯AI邊緣計(jì)算場(chǎng)景,完成基于龍架構(gòu)平臺(tái)的特征識(shí)別、圖像處理、人臉識(shí)別等模型的部署和推理,如門禁系統(tǒng)、手勢(shì)識(shí)別、口罩檢測(cè)等等。
依托于NCNN計(jì)算框架優(yōu)秀的低耦結(jié)構(gòu),開發(fā)者只需關(guān)注算子在龍架構(gòu)平臺(tái)上的高效實(shí)現(xiàn),無(wú)需考慮整個(gè)系統(tǒng)結(jié)構(gòu)問題,實(shí)現(xiàn)更高效的開發(fā)與部署工作。
前期,NCNN與龍芯CPU進(jìn)行了較為全面的適配和性能優(yōu)化,共同打通了AI應(yīng)用和國(guó)產(chǎn)CPU硬件間的壁壘。
可搭載NCNN框架的龍芯AI邊緣計(jì)算場(chǎng)景
龍芯表示將與NCNN社區(qū)保持密切合作,繼續(xù)根據(jù)龍架構(gòu)平臺(tái)向量特點(diǎn)不斷優(yōu)化算子,推進(jìn)龍架構(gòu)生態(tài)成果落地更多場(chǎng)景、服務(wù)更多領(lǐng)域、歡迎社區(qū)廣大開發(fā)者與龍芯中科一道共建自主開放的龍架構(gòu)生態(tài)體系。
本文鏈接:http://www.www897cc.com/showinfo-119-3513-0.html100%自研指令集 國(guó)產(chǎn)CPU龍芯支持NCNN框架:性能輕松翻倍
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com