日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當(dāng)前位置:首頁 > 科技  > 軟件

大模型首選AI框架——昇思MindSpore2.3.RC1版本上線開源社區(qū)

來源: 責(zé)編: 時(shí)間:2024-04-25 17:40:55 157觀看
導(dǎo)讀經(jīng)過社區(qū)開發(fā)者們幾個(gè)月的開發(fā)與貢獻(xiàn),現(xiàn)正式發(fā)布昇思MindSpore2.3.RC1版本,通過多維混合并行以及確定性CKPT來實(shí)現(xiàn)超大集群的高性能訓(xùn)練,支持大模型訓(xùn)推一體架構(gòu),大模型開發(fā)訓(xùn)練推理更簡、更穩(wěn)、更高效,并在訓(xùn)推一體框架的

經(jīng)過社區(qū)開發(fā)者們幾個(gè)月的開發(fā)與貢獻(xiàn),現(xiàn)正式發(fā)布昇思MindSpore2.3.RC1版本,通過多維混合并行以及確定性CKPT來實(shí)現(xiàn)超大集群的高性能訓(xùn)練,支持大模型訓(xùn)推一體架構(gòu),大模型開發(fā)訓(xùn)練推理更簡、更穩(wěn)、更高效,并在訓(xùn)推一體框架的基礎(chǔ)上通過多樣的大模型推理優(yōu)化技術(shù),進(jìn)一步降低大模型推理成本;通過使能kernel by kernel調(diào)度執(zhí)行,進(jìn)一步提升靜態(tài)圖調(diào)試調(diào)優(yōu)能力;持續(xù)升級MindSpore TransFormers大模型套件和MindSpore One生成式套件,全流程開箱即用,一周即可完成大模型全流程的開發(fā)、驗(yàn)證;創(chuàng)新AI+科學(xué)計(jì)算(科學(xué)智能)范式,孵化科學(xué)領(lǐng)域基礎(chǔ)大模型;下面就帶大家詳細(xì)了解下2.3.RC1版本的關(guān)鍵特性。VWS28資訊網(wǎng)——每日最新資訊28at.com

大模型訓(xùn)練:細(xì)粒度多副本并行,有效提升計(jì)算通信并發(fā)度,顯著提升大模型訓(xùn)練性能

大模型訓(xùn)練下,為了降低顯存開銷,廣泛的使用算子級并行技術(shù),其中引入了大量的模型并行的通信,極大地影響了大模型的訓(xùn)練效率。模型并行的通信,從網(wǎng)絡(luò)的結(jié)構(gòu)上來看,其處于正反向計(jì)算過程中,阻塞正反向計(jì)算,無法與正反向的計(jì)算進(jìn)行互相掩蓋。為了解決模型并行通信的掩蓋問題,MindSpore提出了多副本并行技術(shù)。VWS28資訊網(wǎng)——每日最新資訊28at.com

在舊版本的MindSpore上通過將網(wǎng)絡(luò)從數(shù)據(jù)開始進(jìn)行拆分,如下圖所示,在單張卡內(nèi),通過slice算子將Batch維度進(jìn)行拆分,進(jìn)而產(chǎn)生多個(gè)分支,這多個(gè)分支的計(jì)算與通信互相之間沒有依賴,存在并發(fā)的空間,通過執(zhí)行序調(diào)度算法,控制多個(gè)分支的計(jì)算與通信進(jìn)行并發(fā)。VWS28資訊網(wǎng)——每日最新資訊28at.com

VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com

隨著網(wǎng)絡(luò)規(guī)模的增大,受限于顯存限制,當(dāng)一張卡內(nèi)的BatchSize僅支持為1時(shí),上述對整網(wǎng)進(jìn)行Batch拆分的方案不再可行。因此,考慮到模型并行通信的位置,思MindSpore2.3.RC1版本將Transformer模型中的AttentionProjection層以及FFN層進(jìn)行拆分,產(chǎn)生多個(gè)分支,通過執(zhí)行序調(diào)度算法控制細(xì)粒度的多分支的并行其中拆分從AttentionProjection開始,到下一個(gè)Layer的QKV計(jì)算前結(jié)束。VWS28資訊網(wǎng)——每日最新資訊28at.com

VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com

上圖描述了序列并行場景下的細(xì)粒度多副本拆分與掩蓋基本思路,拆分為兩個(gè)副本,在正向可以達(dá)成50%+的通信掩蓋;而在反向,結(jié)合計(jì)算梯度的分支的計(jì)算與TP通信的掩蓋,可達(dá)成90%的通信的掩蓋。當(dāng)前細(xì)粒度多副本并行僅在MindSpore Transformers的LLAMA網(wǎng)絡(luò)進(jìn)行了實(shí)現(xiàn),需要對模型結(jié)構(gòu)進(jìn)行手動改造為多個(gè)副本。后續(xù)版本昇思MindSpore將集成自動拆分副本的邏輯,達(dá)成更易用的細(xì)粒度多副本并行。VWS28資訊網(wǎng)——每日最新資訊28at.com

參考鏈接:https://www.mindspore.cn/tutorials/experts/zh-CN/master/parallel/multiple_copy.htmlVWS28資訊網(wǎng)——每日最新資訊28at.com

大模型推理全棧升級

大模型大規(guī)模商用之后,推理消耗的算力規(guī)模將十分龐大,相應(yīng)地帶來高昂的成本,商業(yè)閉環(huán)依賴推理規(guī)模突破。在降低大模型推理的成本的同時(shí),要兼顧模型精度和計(jì)算時(shí)延,不能影響用戶的體驗(yàn)。昇思MindSpore 2.3.RC1版本,從最上層推理服務(wù)到模型腳本優(yōu)化到推理引擎LLM Serving,為用戶提供端到端的高效推理解決方案。VWS28資訊網(wǎng)——每日最新資訊28at.com

訓(xùn)推一體:大模型訓(xùn)/推統(tǒng)一腳本,大幅簡化部署流程,提高效率

模型腳本默認(rèn)使能了增量推理、FlashAttention/PagedAttention等推理加速技術(shù),避免了模型導(dǎo)出、切分、推理腳本開發(fā)等一系列工作,訓(xùn)練到推理加速平滑遷移,部署周期下降到天級。VWS28資訊網(wǎng)——每日最新資訊28at.com

極致性能:持續(xù)提升融合大算子、并行推理、模型小型化的關(guān)鍵能力

融合大算子:新增10+業(yè)界最新的推理融合大算子接口,模型開發(fā)人員可以快速使能推理融合算子實(shí)現(xiàn)加速。VWS28資訊網(wǎng)——每日最新資訊28at.com

并行推理:訓(xùn)練推理并行策略接口一致,提供訓(xùn)練并行到推理并行ckpt重切分接口,支持動態(tài)shape模型切分。VWS28資訊網(wǎng)——每日最新資訊28at.com

模型壓縮:思MindSpore金箍棒升級到2.0版本,提供了針對大模型的業(yè)界SOTA以及華為諾亞自研的量化、減枝等算法,實(shí)現(xiàn)千億大模型10倍+壓縮。VWS28資訊網(wǎng)——每日最新資訊28at.com

以上技術(shù)均可泛化的應(yīng)用于Transformer結(jié)構(gòu)的大模型中,經(jīng)過驗(yàn)證,在盤古、Llama 2的8卡模型推理中,首token時(shí)延做到百ms級,平均token時(shí)延小于50ms,保持業(yè)界領(lǐng)先水平。VWS28資訊網(wǎng)——每日最新資訊28at.com

VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com

服務(wù)化高吞吐

通過連續(xù)批調(diào)度、Prefill/Decoding混合部署等手段,盡可能的消除掉冗余計(jì)算,確保算力不閑置,實(shí)現(xiàn)大模型推理吞吐提升2倍+。VWS28資訊網(wǎng)——每日最新資訊28at.com

參考鏈接:https://www.mindspore.cn/lite/docs/zh-CN/r2.3.0rc1/use/cloud_infer/runtime_distributed_python.htmlVWS28資訊網(wǎng)——每日最新資訊28at.com

靜態(tài)圖優(yōu)化:支持O(n)多級編譯,使能kernel by kernel調(diào)度執(zhí)行,提升靜態(tài)圖調(diào)試調(diào)優(yōu)能力

整圖下沉執(zhí)行性能最優(yōu),但大模型的規(guī)模和參數(shù)量發(fā)展得更為龐大,整圖下沉執(zhí)行方式在整圖編譯過程中耗時(shí)較長,一個(gè)千億級別的大模型的編譯時(shí)間為30分鐘-60分鐘,調(diào)試調(diào)優(yōu)效率低下。為解決上述問題,昇思MindSpore2.3.RC1版本中,提供了多級編譯技術(shù),O0原生構(gòu)圖不優(yōu)化、O1增加自動算子融合優(yōu)化、O2整圖下沉執(zhí)行優(yōu)化。在O0的編譯選項(xiàng)下,通過原生圖編譯和kernel by kernel(KBK)的執(zhí)行技術(shù),可以將編譯時(shí)間提升到15分鐘以內(nèi),同時(shí)我們在新版本中還開發(fā)了DryRun技術(shù),用戶可以直接在離線的情況進(jìn)行內(nèi)存瓶頸分析和并行策略調(diào)優(yōu),結(jié)合這兩大技術(shù)可以使得大模型調(diào)試效率倍增。在O0這種編譯條件下,我們使能了SOMAS/LazyInline/控制流Inline來提升內(nèi)存復(fù)用率,使能了多流并行/流水異步調(diào)度,可以提升執(zhí)行性能;在O1這種編譯條件下,通過使能算子融合技術(shù),KBK執(zhí)行模式下可以有更好的執(zhí)行性能。VWS28資訊網(wǎng)——每日最新資訊28at.com

VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com

參考鏈接:https://www.mindspore.cn/docs/zh-CN/r2.3.0rc1/api_python/mindspore/mindspore.JitConfig.html?highlight=jitconfigVWS28資訊網(wǎng)——每日最新資訊28at.com

JIT兼具易用性和性能,動靜統(tǒng)一,提供靈活高效開發(fā)

思MindSpore支持圖模式(靜態(tài)圖)和PyNative模式(動態(tài)圖)兩種運(yùn)行方法。動態(tài)圖易于調(diào)試,開發(fā)靈活,易用性好;靜態(tài)圖語法支持有限,但執(zhí)行性能好。JIT兼顧性能和易用性,通過對Python字節(jié)碼進(jìn)行分析&調(diào)整、執(zhí)行流進(jìn)行圖捕獲&圖優(yōu)化,支持入圖的Python代碼做靜態(tài)圖方式執(zhí)行,不支持的進(jìn)行子圖切分以動態(tài)圖方式執(zhí)行,自動地做到動靜統(tǒng)一,實(shí)現(xiàn)方法如下圖所示。VWS28資訊網(wǎng)——每日最新資訊28at.com

VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com

參考鏈接:https://www.mindspore.cn/docs/zh-CN/r2.3/design/dynamic_graph_and_static_graph.html#%E5%8A%A8%E6%80%81%E5%9B%BE%E8%BD%AC%E9%9D%99%E6%80%81%E5%9B%BE%E6%8A%80%E6%9C%AFVWS28資訊網(wǎng)——每日最新資訊28at.com

MindSpore Elec:新增大地電磁智能反演模型

MindSpore Elec電磁仿真套件升級至0.3版本,聯(lián)合清華大學(xué)李懋坤教授團(tuán)隊(duì)、華為先進(jìn)計(jì)算與存儲實(shí)驗(yàn)室共同打造了基于昇思MindSpore的大地電磁(Magnetotelluric,MT)智能反演模型。該模型通過變分自編碼器(VAE)靈活嵌入了多物理先驗(yàn)知識,達(dá)到了業(yè)界SOTA。該成果已被國際頂級勘探地球物理期刊《Geophysics》收錄,同時(shí)也在昇思人工智能框架峰會2024上發(fā)布亮相。VWS28資訊網(wǎng)——每日最新資訊28at.com

(1)基礎(chǔ)MT反演:反演區(qū)域水平長度為10km,深度為1km。下圖1中目標(biāo)電阻率分布(第一列)與傳統(tǒng)大地電磁反演(第二列)、大地電磁智能反演(第三列),可以看出大地電磁智能反演相比傳統(tǒng)反演精度顯著提升(前者殘差為0.0056和0.0054;后者為0.023和0.024 );下圖2中,大地電磁智能反演性能也優(yōu)于傳統(tǒng)反演方法(前者收斂步數(shù)為4和4;后者為6和4)。VWS28資訊網(wǎng)——每日最新資訊28at.com

目標(biāo)電阻率VWS28資訊網(wǎng)——每日最新資訊28at.com

傳統(tǒng)方法VWS28資訊網(wǎng)——每日最新資訊28at.com

我們的工作VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com

VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com

VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com

VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com

VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com

VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com

VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com

VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com

VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com

VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com

VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com

VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com

VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com

1 大地電磁反演精度對比VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com

VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com

VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com

VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com

2 大地電磁反演收斂速度對比(Pixel-based:傳統(tǒng)反演;Feature-based:我們的工作)VWS28資訊網(wǎng)——每日最新資訊28at.com

(2)南部非洲MT反演:大地電磁智能反演模型也在南部非洲開源數(shù)據(jù)集(SAMTEX)上做了驗(yàn)證。該反演區(qū)域位于南部非洲西海岸附近,長度約為750km,深度選定為80km。該測區(qū)顯著特征為在水平方向100km至400km之間,深度20km以淺的區(qū)域存在的高導(dǎo)結(jié)構(gòu)。由于低頻電磁波在導(dǎo)體結(jié)構(gòu)中的衰減,MT方法對高導(dǎo)結(jié)構(gòu)下部區(qū)域的敏感度很低, 因此無先驗(yàn)知識約束的傳統(tǒng)MT反演難以準(zhǔn)確重建高導(dǎo)地層的下邊界位置。大地電磁智能反演對高導(dǎo)地層的下邊界重建較為清晰準(zhǔn)確,較好地將地層厚度的先驗(yàn)知識融入了反演。VWS28資訊網(wǎng)——每日最新資訊28at.com

VWS28資訊網(wǎng)——每日最新資訊28at.com

VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com

VWS28資訊網(wǎng)——每日最新資訊28at.com


VWS28資訊網(wǎng)——每日最新資訊28at.com

圖3 南部非洲MT反演示例圖(上圖:傳統(tǒng)反演;下圖:我們的工作)VWS28資訊網(wǎng)——每日最新資訊28at.com

參考鏈接:https://gitee.com/mindspore/mindscience/tree/master/MindElecVWS28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-26-85543-0.html大模型首選AI框架——昇思MindSpore2.3.RC1版本上線開源社區(qū)

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com

上一篇: 如何處理好微服務(wù)之間千絲萬縷的關(guān)系?到BFF大顯身手了

下一篇: 揭露 FileSystem 引起的線上 JVM 內(nèi)存溢出問題

標(biāo)簽:
  • 熱門焦點(diǎn)
  • 紅魔電競平板評測:大屏幕硬實(shí)力

    前言:三年的疫情因?yàn)橐暇W(wǎng)課的原因激活了平板市場,如今網(wǎng)課的時(shí)代已經(jīng)過去,大家的生活都恢復(fù)到了正軌,這也就意味著,真正考驗(yàn)平板電腦生存的環(huán)境來了。也就是面對著這種殘酷的
  • 2023年Q2用戶偏好榜:12+256G版本成新主流

    3月份的性能榜、性價(jià)比榜和好評榜之后,就要輪到2023年的第二季度偏好榜了,上半年的新機(jī)潮已經(jīng)過去,最明顯的肯定就是大內(nèi)存和存儲的機(jī)型了,另外部分中端機(jī)也取消了屏幕塑料支架
  • 6月安卓手機(jī)好評榜:魅族20 Pro蟬聯(lián)冠軍

    性能榜和性價(jià)比榜之后,我們來看最后的安卓手機(jī)好評榜,數(shù)據(jù)來源安兔兔評測,收集時(shí)間2023年6月1日至6月30日,僅限國內(nèi)市場。第一名:魅族20 Pro好評率:95%5月份的時(shí)候魅族20 Pro就是
  • 消息稱迪士尼要拍真人版《魔發(fā)奇緣》:女主可能也找黑人演員

    8月5日消息,迪士尼確實(shí)有點(diǎn)忙,忙著將不少動畫改成真人版,繼《美人魚》后,真人版《白雪公主》、《魔發(fā)奇緣》也在路上了。據(jù)外媒消息稱,迪士尼將打造真人版
  • 一篇文章帶你了解 CSS 屬性選擇器

    屬性選擇器對帶有指定屬性的 HTML 元素設(shè)置樣式??梢詾閾碛兄付▽傩缘?HTML 元素設(shè)置樣式,而不僅限于 class 和 id 屬性。一、了解屬性選擇器CSS屬性選擇器提供了一種簡單而
  • 為什么你不應(yīng)該使用Div作為可點(diǎn)擊元素

    按鈕是為任何網(wǎng)絡(luò)應(yīng)用程序提供交互性的最常見方式。但我們經(jīng)常傾向于使用其他HTML元素,如 div span 等作為 clickable 元素。但通過這樣做,我們錯過了許多內(nèi)置瀏覽器的功能。
  • 使用AIGC工具提升安全工作效率

    在日常工作中,安全人員可能會涉及各種各樣的安全任務(wù),包括但不限于:開發(fā)某些安全工具的插件,滿足自己特定的安全需求;自定義github搜索工具,快速查找所需的安全資料、漏洞poc、exp
  • 重估百度丨大模型,能撐起百度的“今天”嗎?

    自象限原創(chuàng) 作者|程心 羅輯2023年之前,對于自己的“今天”,百度也很迷茫。“新業(yè)務(wù)到 2022 年底還是 0,希望 2023 年出來一個(gè) 1。”這是2022年底,李彥宏
  • 聯(lián)想YOGA 16s 2022筆記本將要推出,屏幕支持觸控功能

    聯(lián)想此前宣布,將于11月2日19:30召開聯(lián)想秋季輕薄新品發(fā)布會,推出聯(lián)想 YOGA 16s 2022 筆記本等新品。官方稱,YOGA 16s 2022 筆記本將搭載 16 英寸屏幕,并且是一
Top 主站蜘蛛池模板: 德兴市| 宽甸| 宜昌市| 玉屏| 慈溪市| 九龙县| 施秉县| 昌黎县| 淮南市| 上杭县| 留坝县| 龙岩市| 读书| 十堰市| 威远县| 南皮县| 武胜县| 新巴尔虎左旗| 金华市| 秦安县| 和硕县| 上思县| 西乌| 青岛市| 阳谷县| 洛隆县| 延川县| 临洮县| 丹凤县| 增城市| 麻城市| 湖南省| 万州区| 浦江县| 张家口市| 阜康市| 北安市| 任丘市| 县级市| 托克逊县| 七台河市|