當前位置：首頁 > 科技 > 手機

安謀科技下代“周易”NPU成功部署DeepSeek-R1：速度高達40 tokens/s

來源：責編：時間：2025-02-15 15:50:16 89觀看

導(dǎo)讀快科技2月14日消息，安謀科技宣布，搭載新一代“周易”NPU處理器的硬件平臺，已經(jīng)成功在端側(cè)部署并運行DeepSeek-R1系列模型，而且性能卓越、成本優(yōu)異。新款“周易”NPU采用專為AI大模型特性優(yōu)

快科技2月14日消息，安謀科技宣布，搭載新一代“周易”NPU處理器的硬件平臺，已經(jīng)成功在端側(cè)部署并運行DeepSeek-R1系列模型，而且性能卓越、成本優(yōu)異。

新款“周易”NPU采用專為AI大模型特性優(yōu)化的架構(gòu)設(shè)計，Beta測試版本已在2024年底向早期用戶開放評估測試，預(yù)計今年上半年正式發(fā)布亮相。

DeepSeek-R1 1.5B、7B蒸餾版本推出后，安謀科技新一代“周易”NPU在很短的時間內(nèi)，就在Emulation平臺上完成了部署與優(yōu)化，并在FPGA平臺上成功實現(xiàn)了端到端應(yīng)用的演示。

測試顯示，在標準單批次輸入、上下文長度為1024的測試環(huán)境中，新款“周易”NPU在首字計算階段的算力利用率突破40％，解碼階段的有效帶寬利用率超過80％。

帶寬利用率呈現(xiàn)高線性特性，能夠靈活適配16GB/s至256GB/s的系統(tǒng)帶寬需求。

7B版本、1024上下文長度的場景下，保障模型應(yīng)用精度的同時，新款“周易”NPU的高處理速度可達每秒40 tokens，并支持動態(tài)長度的模型推理輸入。

安謀科技下代“周易”NPU成功部署DeepSeek-R1：速度高達40 tokens/s

這也展現(xiàn)了安謀科技軟件棧對大模型的成熟支持、深度優(yōu)化，包括動態(tài)推理優(yōu)化和硬件算力潛力的挖掘，從而顯著提升推理速度和吞吐量。

目前，軟件棧已支持Llama、Qwen、DeepSeek、ChatGLM、MiniCPM等多種主流大模型，并提供與Hugging Face模型庫的對接工具鏈，方便直接部署主流模型。

硬件層面，新一代“周易”NPU采用7nm工藝制造，單Cluster算力高可達80 TOPS(每秒80萬億次計算)，能夠輕松應(yīng)對超過16K上下文長度的大模型部署需求，同時對外帶寬提高至256GB/s，解決大模型計算的帶寬瓶頸問題。

它還全面支持FP16數(shù)據(jù)精度計算，完整支持INT4軟硬量化加速，還支持多核算力擴展，滿足端側(cè)模型的低首字延遲需求。

它還具備強大的多任務(wù)并行處理能力，通過細粒度的任務(wù)調(diào)度和優(yōu)先級資源分配，實現(xiàn)多任務(wù)靈活切換，確保傳統(tǒng)語音、視覺業(yè)務(wù)、大模型應(yīng)用的高效協(xié)同。

本文鏈接：http://www.www897cc.com/showinfo-22-130640-0.html安謀科技下代“周易”NPU成功部署DeepSeek-R1：速度高達40 tokens/s

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇： iPhone 17 Pro渲染圖出爐：神似小米11 Ultra 工業(yè)設(shè)計煥然一新

下一篇：女生刷同一視頻6小時后手機燒屏：畫面超崩潰再也抹不掉了

標簽：

熱門焦點

盧偉冰長文解析K60至尊版對Redmi有著里程碑式的意義

在今天的Redmi后性能時代戰(zhàn)略發(fā)布會結(jié)束之后，Redmi總經(jīng)理盧偉冰又帶來了一篇長文，詳解了為什么 Redmi 要開啟后性能時代？為什么選擇和 MediaTek、Pixelworks 深度合作？以及后性
紅魔電競平板評測：大屏幕硬實力

前言：三年的疫情因為要上網(wǎng)課的原因激活了平板市場，如今網(wǎng)課的時代已經(jīng)過去，大家的生活都恢復(fù)到了正軌，這也就意味著，真正考驗平板電腦生存的環(huán)境來了。也就是面對著這種殘酷的
6月iOS設(shè)備好評榜：第一蟬聯(lián)榜首近一年

作為安兔兔各種榜單里變化最小的那個，2023年6月的iOS好評榜和上個月相比沒有任何排名上的變化，僅僅是部分設(shè)備好評率的下降，長年累月的用戶評價和逐漸退出市場的老款機器讓這
一年經(jīng)驗在二線城市面試后端的經(jīng)驗分享

忠告這篇文章只適合2年內(nèi)工作經(jīng)驗、甚至沒有工作經(jīng)驗的朋友閱讀。如果你是2年以上工作經(jīng)驗，請果斷劃走，對你沒啥幫助~主人公這篇文章內(nèi)容來自「升職加薪」星球星友的投稿，坐
深度探索 Elasticsearch 8.X：function_score 參數(shù)解讀與實戰(zhàn)案例分析

在 Elasticsearch 中，function_score 可以讓我們在查詢的同時對搜索結(jié)果進行自定義評分。function_score 提供了一系列的參數(shù)和函數(shù)讓我們可以根據(jù)需求靈活地進行設(shè)置。近期
最“俊美”淘寶賣家，靠直播和短視頻圈粉，上架秒光，年銷3000萬

來源 | 電商在線文｜易琬玉編輯｜斯問受訪店鋪：Ringdoll戒之人形圖源：微博@御座的黃山、“Ringdoll戒之人形”淘寶店鋪有關(guān)外貌的評價，黃山已經(jīng)聽累了。生于1985年的他，哪
疑似小米14外觀設(shè)計圖曝光：后置相機模組變化不大

下半年的大幕已經(jīng)開啟，而誰將成為下半年手機圈的主角就成為了大家關(guān)注的焦點，其中被傳有望拿下新一代驍龍8 Gen3旗艦芯片的小米14系列更是備受大家矚
國行版三星Galaxy Z Fold5/Z Flip5發(fā)布售價7499元起

2023年8月3日，三星電子舉行Galaxy新品中國發(fā)布會，正式在國內(nèi)推出了新一代折疊屏智能手機三星Galaxy Z Fold5與Galaxy Z Flip5，以及三星Galaxy Tab S9
引領(lǐng)旗艦級影像能力向中端機普及 OPPO K11 系列發(fā)布 1799 元起

7月25日，OPPO正式發(fā)布K系列新品—— OPPO K11 。此次 K11 在中端手機市場長期被忽視的影像板塊發(fā)力，突破性地搭載索尼 IMX890 旗艦大底主攝，支持 OIS

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

安謀科技下代“周易”NPU成功部署DeepSeek-R1：速度高達40 tokens/s

盧偉冰長文解析K60至尊版對Redmi有著里程碑式的意義

紅魔電競平板評測：大屏幕硬實力

6月iOS設(shè)備好評榜：第一蟬聯(lián)榜首近一年

一年經(jīng)驗在二線城市面試后端的經(jīng)驗分享

深度探索 Elasticsearch 8.X：function_score 參數(shù)解讀與實戰(zhàn)案例分析

最“俊美”淘寶賣家，靠直播和短視頻圈粉，上架秒光，年銷3000萬

疑似小米14外觀設(shè)計圖曝光：后置相機模組變化不大

國行版三星Galaxy Z Fold5/Z Flip5發(fā)布售價7499元起

引領(lǐng)旗艦級影像能力向中端機普及 OPPO K11 系列發(fā)布 1799 元起

最新推薦

猜你喜歡

熱門推薦

相關(guān)資訊