作為國產CPU的代表之一,龍芯這兩年已經將架構轉向自研的LoongArch指令集,號稱100%自主,現在還在不斷擴展LoongArch的應用領域,今天龍芯宣布支持了NCNN神經網絡計算框架,各項性能比通用實現普遍提升一倍以上。
據龍芯介紹,近期經過龍芯中科與NCNN社區的共同努力,在NCNM中使用龍架構(LoongArch)向量優化實現了大部分算子,得益于龍架構向量的高效實現,優化后NCNN在平臺上各項性能測試比通用實現普遍提升一倍以上。
基于龍架構向量優化開啟前后的NCNN各項性能對比
(豎軸為耗時高度,越高耗時越久,性能越低)
NCNN作為業界首個為移動端優化的神經網絡前向計算框架,在2017年首次開源,是騰訊優圖實驗室第一次對外公開深度學習的研究成果。
目前多應用在圖像方面,例如人像自動美顏,照片風格化,超分辨率,物體識別等等。NCNN計算框架,因其高性能、無第三方依賴、跨平臺支持大部分常見CNN網絡的特點,是許多開發者在移動端、嵌入式設備上部署深度學習算法的首選框架。
本次優化共產出3萬多行代碼,成果將應用于龍芯AI邊緣計算場景,完成基于龍架構平臺的特征識別、圖像處理、人臉識別等模型的部署和推理,如門禁系統、手勢識別、口罩檢測等等。
依托于NCNN計算框架優秀的低耦結構,開發者只需關注算子在龍架構平臺上的高效實現,無需考慮整個系統結構問題,實現更高效的開發與部署工作。
前期,NCNN與龍芯CPU進行了較為全面的適配和性能優化,共同打通了AI應用和國產CPU硬件間的壁壘。
可搭載NCNN框架的龍芯AI邊緣計算場景
龍芯表示將與NCNN社區保持密切合作,繼續根據龍架構平臺向量特點不斷優化算子,推進龍架構生態成果落地更多場景、服務更多領域、歡迎社區廣大開發者與龍芯中科一道共建自主開放的龍架構生態體系。
本文鏈接:http://www.www897cc.com/showinfo-119-3513-0.html100%自研指令集 國產CPU龍芯支持NCNN框架:性能輕松翻倍
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com