日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 手機

華為與DeepSeek聯手會發生什么:算力已達英偉達60%、CANN取代CDUA架構

來源: 責編: 時間:2025-02-05 15:43:37 86觀看
導讀 快科技2月5日消息,華為(昇騰+CANN)+Deepseek,能解決英偉達GPU+CUDA的“卡脖子”嗎?據tomshardware等多家媒體報道,華為新的AI處理器昇騰910C(Ascend 910C)的推理性能已達NVIDIA H100 GPU的六成。根據Deep

快科技2月5日消息,華為(昇騰+CANN)+Deepseek,能解決英偉達GPU+CUDA的“卡脖子”嗎?xkh28資訊網——每日最新資訊28at.com

據tomshardware等多家媒體報道,華為新的AI處理器昇騰910C(Ascend 910C)的推理性能已達NVIDIA H100 GPU的六成。xkh28資訊網——每日最新資訊28at.com

華為與DeepSeek聯手會發生什么:算力已達英偉達60%、CANN取代CDUA架構xkh28資訊網——每日最新資訊28at.com

根據DeepSeek 研究人員的測試,在推理任務中,昇騰910C性能可達H100的60%。據悉,升騰910C采用chiplet封裝,第二代7nm級(N+2)工藝,整合約530億個晶體管。 xkh28資訊網——每日最新資訊28at.com

雖然昇騰910C并非當前強AI芯片,但它有助于降低中國對NVIDIA GPU的依賴。xkh28資訊網——每日最新資訊28at.com

此外,通過手動優化CANN內核,其效率可以進一步提高。DeepSeek對昇騰處理器及其 PyTorch存儲庫的原生支持允許以小的的資源代價,實現CUDA到CANN的無縫轉換,從而更容易將華為的硬件集成到AI工作流程中。xkh28資訊網——每日最新資訊28at.com

華為與DeepSeek聯手會發生什么:算力已達英偉達60%、CANN取代CDUA架構xkh28資訊網——每日最新資訊28at.com

據了解,DeepSeek的支持為華為芯片帶來了關鍵優勢:從第一天起就支持華為昇騰芯片,自主維護PyTorch倉庫,只需一行代碼就能將CUDA轉換為CANN;而且性能優化潛力巨大,通過定制優化可達到更高性能。xkh28資訊網——每日最新資訊28at.com

據華為官網介紹,CANN(Compute Architecture for Neural Networks)是昇騰針對AI場景推出的異構計算架構,對上支持多種AI框架,對下服務AI處理器與編程,發揮承上啟下的關鍵作用,是提升昇騰AI處理器計算效率的關鍵平臺。同時針對多樣化應用場景,提供高效易用的編程接口,支持用戶快速構建基于昇騰平臺的AI應用和業務。xkh28資訊網——每日最新資訊28at.com

華為與DeepSeek聯手會發生什么:算力已達英偉達60%、CANN取代CDUA架構xkh28資訊網——每日最新資訊28at.com

據了解,CANN分社區版和商用版。前者是快速提供新特性的體驗版,供開發者提前試用;而后者是滿足商用標準的穩定版本。xkh28資訊網——每日最新資訊28at.com

目前,CANN社區版已經來到了8.0.0.alpha003版本,針對Ascend C進行了特性增強。而商用版CANN 8.0.RC3版本也已經發布,新增適配7個操作系統,簡化了CANN安裝流程。xkh28資訊網——每日最新資訊28at.com

華為與DeepSeek聯手會發生什么:算力已達英偉達60%、CANN取代CDUA架構xkh28資訊網——每日最新資訊28at.com

DeepSeek的Yuchen Jin表示,長期訓練可靠性是中國處理器的一個關鍵弱點。xkh28資訊網——每日最新資訊28at.com

主要是NNVIDIA硬件和軟件生態系統的深度集成,該生態系統已經發展了二十多年。雖然推理性能可以優化,但持續的訓練工作負載需要華為的硬件和軟件堆棧進一步改進。xkh28資訊網——每日最新資訊28at.com

而隨著AI模型架構向Transformer收斂,CUDA和PyTorch編譯器的重要性將降低。DeepSeek團隊的加入將顯著降低對NVIDIA的依賴,大幅節省成本。xkh28資訊網——每日最新資訊28at.com

華為與DeepSeek聯手會發生什么:算力已達英偉達60%、CANN取代CDUA架構xkh28資訊網——每日最新資訊28at.com

無獨有偶。此前有消息稱,DeepSeek開發的大語言模型繞過了英偉達的CUDA框架,正為未來兼容國產GPU芯片做準備。xkh28資訊網——每日最新資訊28at.com

新發現顯示,DeepSeek使用英偉達的H800芯片訓練時,使用英偉達底層硬件指令PTX(Parallel Thread Execution)語言,而非高級編程語言CUDA。xkh28資訊網——每日最新資訊28at.com

這樣意味著DeepSeek繞過了CUDA,使用更底層的編程語言做優化。xkh28資訊網——每日最新資訊28at.com

對于程序開發人員來說,CUDA是一種更加友好的高級語言,開發者只需要專注于程序和算法相關的運行邏輯,而不太需要考慮具體的程序是如何在GPU等硬件上具體如何執行計算的,從而能夠降低開發難度。xkh28資訊網——每日最新資訊28at.com

而PTX在接近匯編語言的層級運行,允許進行細粒度的優化,如寄存器分配和Thread / Warp級別的調整。這種編程非常復雜且難以維護,所以行業通用的做法是使用CUDA這樣的高級編程語言。xkh28資訊網——每日最新資訊28at.com

換句話說,DeepSeek把優化做到了極致。xkh28資訊網——每日最新資訊28at.com

北京航空航天大學副教授黃雷表示,繞過CUDA可以直接根據GPU的驅動函數做一些新的開發,從而實現更加細粒度的操作。xkh28資訊網——每日最新資訊28at.com

這也說明DeepSeek擁有一些擅長寫PTX語言的內部開發者。假如它之后使用國產GPU,其在硬件適配方面將會更得心應手,其只要了解這些硬件驅動提供的一些基本函數接口,就可以仿照英偉達GPU硬件的編程接口去寫相關的代碼,從而讓自家大模型更加容易適配國產硬件。xkh28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-22-128723-0.html華為與DeepSeek聯手會發生什么:算力已達英偉達60%、CANN取代CDUA架構

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: OPPO Find N5官宣:全球薄折疊屏 兩周后亮相

下一篇: 小米手機官方換電池限時8折:79.2元起!覆蓋38款機型

標簽:
  • 熱門焦點
  • 中興AX5400Pro+上手體驗:再升級 雙2.5G網口+USB 3.0這次全都有

    2021年11月的時候,中興先后發布了兩款路由器產品,中興AX5400和中興AX5400 Pro,從產品命名上就不難看出這是隸屬于同一系列的,但在外觀設計上這兩款產品可以說是完全沒一點關系
  • 十個可以手動編寫的 JavaScript 數組 API

    JavaScript 中有很多API,使用得當,會很方便,省力不少。 你知道它的原理嗎? 今天這篇文章,我們將對它們進行一次小總結。現在開始吧。1.forEach()forEach()用于遍歷數組接收一參
  • 一年經驗在二線城市面試后端的經驗分享

    忠告這篇文章只適合2年內工作經驗、甚至沒有工作經驗的朋友閱讀。如果你是2年以上工作經驗,請果斷劃走,對你沒啥幫助~主人公這篇文章內容來自 「升職加薪」星球星友 的投稿,坐
  • 三言兩語說透設計模式的藝術-單例模式

    寫在前面單例模式是一種常用的軟件設計模式,它所創建的對象只有一個實例,且該實例易于被外界訪問。單例對象由于只有一個實例,所以它可以方便地被系統中的其他對象共享,從而減少
  • 一篇聊聊Go錯誤封裝機制

    %w 是用于錯誤包裝(Error Wrapping)的格式化動詞。它是用于 fmt.Errorf 和 fmt.Sprintf 函數中的一個特殊格式化動詞,用于將一個錯誤(或其他可打印的值)包裝在一個新的錯誤中。使
  • 重估百度丨“晚熟”的百度云,能等到春天嗎?

    ©自象限原創作者|程心排版|王喻可2016年7月13日,百度云計算戰略發布會在北京舉行,宣告著百度智能云的正式啟程。彼時的會場座無虛席,甚至排隊排到了門外,在場的所有人幾乎都
  • 華為開發者大會2023日程公開:開設鴻蒙HarmonyOS 4體驗區

    IT之家 7 月 31 日消息,華為今日公布了 HDC.Together 開發者大會 2023 的詳細日程。整場大會將于 8 月 4 日-6 日之間舉行,屆時將發布最新一代鴻蒙 H
  • 三星電子Q2營收60萬億韓元 存儲業務營收同比仍下滑超過50%

    7月27日消息,據外媒報道,從三星電子所發布的財報來看,他們主要利潤來源的存儲芯片業務在今年二季度仍不樂觀,營收同比仍在大幅下滑,所在的設備解決方案
  • 榮耀Magic4 至臻版 首創智慧隱私通話 強勁影音系統

    2022年第一季度臨近尾聲,在該季度內,許多品牌陸續發布自己的最新產品,讓大家從全新的角度來了解當今的手機技術。手機是電子設備中,更新迭代十分迅速的一款產品,基
Top 主站蜘蛛池模板: 武汉市| 商河县| 伊川县| 山东省| 百色市| 陇川县| 霞浦县| 海盐县| 武乡县| 涞源县| 南开区| 永州市| 孟州市| 荃湾区| 大石桥市| 通辽市| 玉龙| 木兰县| 鄯善县| 晋江市| 涪陵区| 涞源县| 锦州市| 突泉县| 平远县| 梧州市| 兰西县| 双流县| 诸城市| 克什克腾旗| 靖州| 新宾| 大悟县| 马鞍山市| 教育| 旬阳县| 鸡东县| 哈尔滨市| 夹江县| 新余市| 天水市|