日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當(dāng)前位置:首頁 > 科技  > 知識百科

霸榜GitHub熱門第一多日后,Colossal-AI正式版發(fā)布

來源: 責(zé)編: 時間:2023-08-07 16:30:08 294觀看
導(dǎo)讀 本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。大規(guī)模并行AI訓(xùn)練系統(tǒng)Colossal-AI,旨在作為深度學(xué)習(xí)框架的內(nèi)核,幫助用戶便捷實(shí)現(xiàn)最大化提升AI部署效率,同時最小

本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。jeq28資訊網(wǎng)——每日最新資訊28at.com

大規(guī)模并行AI訓(xùn)練系統(tǒng)Colossal-AI,旨在作為深度學(xué)習(xí)框架的內(nèi)核,幫助用戶便捷實(shí)現(xiàn)最大化提升AI部署效率,同時最小化部署成本。jeq28資訊網(wǎng)——每日最新資訊28at.com

jeq28資訊網(wǎng)——每日最新資訊28at.com

開源地址:https://github.com/hpcaitech/ColossalAIjeq28資訊網(wǎng)——每日最新資訊28at.com

Colossal-AI一經(jīng)開源便受到廣泛關(guān)注,連續(xù)多日登頂GitHub熱榜Python方向世界第一,與眾多已有數(shù)萬star的明星開源項(xiàng)目一起受到海內(nèi)外關(guān)注!jeq28資訊網(wǎng)——每日最新資訊28at.com

經(jīng)過開發(fā)者們的不斷努力,Colossal-AI在數(shù)月的密集測試后迎來正式版!此版本由300多次commits組成。jeq28資訊網(wǎng)——每日最新資訊28at.com

jeq28資訊網(wǎng)——每日最新資訊28at.com

本次正式版更新重點(diǎn)優(yōu)化了分布式訓(xùn)練性能及開發(fā)者的易用性,主要亮點(diǎn)包括:jeq28資訊網(wǎng)——每日最新資訊28at.com

重構(gòu)ZeRO以改善性能和易用性;添加細(xì)粒度Profiler TensorBoard監(jiān)控插件,監(jiān)測訓(xùn)練過程中內(nèi)存、網(wǎng)絡(luò)等狀態(tài);更靈活的checkpoint策略,可擴(kuò)展的pipeline模塊;開源蛋白質(zhì)預(yù)測FastFold等豐富行業(yè)解決方案;添加中文教程,MOE、BERT等實(shí)例,開放用戶社群及論壇。專業(yè)助力大模型訓(xùn)練jeq28資訊網(wǎng)——每日最新資訊28at.com

近年來,隨著深度學(xué)習(xí)的興起及大模型橫掃各大性能榜單,前沿AI模型的大小在短短幾年內(nèi)便已增大萬倍,遠(yuǎn)超硬件數(shù)倍的緩慢增長。前沿AI大模型不僅遠(yuǎn)超單個GPU的容納能力,所需算力也往往需要單個GPU運(yùn)行數(shù)百甚至上千年。jeq28資訊網(wǎng)——每日最新資訊28at.com

因此,如何提升單個GPU的容納能力,如何高效利用分布式技術(shù),聯(lián)合多個GPU低成本實(shí)現(xiàn)并行訓(xùn)練加速已成為AI大模型的關(guān)鍵痛點(diǎn)。jeq28資訊網(wǎng)——每日最新資訊28at.com

jeq28資訊網(wǎng)——每日最新資訊28at.com

針對現(xiàn)有方案并行維度有限、效率不高、通用性差、部署困難、缺乏維護(hù)等痛點(diǎn),Colossal-AI通過高效多維并行、顯存優(yōu)化、大規(guī)模優(yōu)化庫、細(xì)粒度監(jiān)測等方式,讓用戶僅需極少量修改,即可高效快速部署AI大模型訓(xùn)練。jeq28資訊網(wǎng)——每日最新資訊28at.com

多維并行jeq28資訊網(wǎng)——每日最新資訊28at.com

相比現(xiàn)有方案中并行維度僅包括數(shù)據(jù)并行、一維張量并行、流水并行三種方案,Colossal-AI進(jìn)一步提供2/2.5/3維張量并行和序列并行,以及便捷的多維混合并行解決方案。jeq28資訊網(wǎng)——每日最新資訊28at.com

jeq28資訊網(wǎng)——每日最新資訊28at.com

△ViT張量并行為64時,可提升14倍批大小和5倍訓(xùn)練速度jeq28資訊網(wǎng)——每日最新資訊28at.com

其中,高維張量并行能極大減輕顯存消耗,提升通信效率,使得計(jì)算資源利用更加高效。jeq28資訊網(wǎng)——每日最新資訊28at.com

jeq28資訊網(wǎng)——每日最新資訊28at.com

△序列并行幫助BERT提升2倍訓(xùn)練速度,或1.5倍序列長度jeq28資訊網(wǎng)——每日最新資訊28at.com

而序列并行針對大圖片、視頻、長文本、長時間醫(yī)療監(jiān)測等數(shù)據(jù),可以幫助突破原有機(jī)器能力限制,直接處理長序列數(shù)據(jù)。jeq28資訊網(wǎng)——每日最新資訊28at.com

顯存優(yōu)化jeq28資訊網(wǎng)——每日最新資訊28at.com

Colossal-AI綜合了多重顯存優(yōu)化技術(shù),包含多維并行,ZeRO冗余內(nèi)存消除,CPU offload,Gradient Checkpoint,自動混合精度(AMP)等前沿技術(shù),最大限度幫助用戶避免顯存瓶頸,降低訓(xùn)練的硬件需求。jeq28資訊網(wǎng)——每日最新資訊28at.com

jeq28資訊網(wǎng)——每日最新資訊28at.com

△GPT-2使用Colossal-AI,同樣硬件下提升24倍可訓(xùn)練模型大小,或3倍訓(xùn)練速度jeq28資訊網(wǎng)——每日最新資訊28at.com

靈活易用jeq28資訊網(wǎng)——每日最新資訊28at.com

Colossal-AI接口設(shè)計(jì)與PyTorch風(fēng)格保持一致,降低學(xué)習(xí)和使用成本,僅需極少量修改,便可將已有項(xiàng)目與Colossal-AI結(jié)合,便捷擴(kuò)展至大規(guī)模并行。此外,該系統(tǒng)還保持了優(yōu)秀的擴(kuò)展性,便于根據(jù)需求添加新功能,與已有功能模塊兼容。jeq28資訊網(wǎng)——每日最新資訊28at.com

細(xì)粒度監(jiān)測:細(xì)粒度Profiler TensorBoard插件,相較于PyTorch僅能以iteration為單位進(jìn)行記錄訓(xùn)練過程,Colossal-AI能夠監(jiān)測iteration內(nèi)的網(wǎng)絡(luò)、通信、內(nèi)存等狀態(tài),方便開發(fā)者進(jìn)行精確分析和調(diào)試,提高開發(fā)效率。jeq28資訊網(wǎng)——每日最新資訊28at.com

大規(guī)模優(yōu)化庫:Colossal-AI提供大規(guī)模并行優(yōu)化器LAMB、LARS等,首次將訓(xùn)練batch size擴(kuò)展到65536。Colossal-AI還與PyTorch自帶各類optimizer兼容,并不斷探索添加最新前沿優(yōu)化技術(shù),滿足各類模型需求。jeq28資訊網(wǎng)——每日最新資訊28at.com

豐富的行業(yè)解決方案jeq28資訊網(wǎng)——每日最新資訊28at.com

Colossal-AI目前已與自動駕駛、云計(jì)算、零售、醫(yī)藥、芯片等行業(yè)知名廠商達(dá)成合作,與AI領(lǐng)域頂級開源組織Hugging Face等建立合作。jeq28資訊網(wǎng)——每日最新資訊28at.com

蛋白質(zhì)結(jié)構(gòu)預(yù)測加速方案:FastFoldjeq28資訊網(wǎng)——每日最新資訊28at.com

AlphaFold因強(qiáng)大的AI預(yù)測蛋白質(zhì)結(jié)構(gòu)能力被Science和Nature評選為2021年十大科學(xué)突破之首,但存在訓(xùn)練時間長、成本高等問題。jeq28資訊網(wǎng)——每日最新資訊28at.com

jeq28資訊網(wǎng)——每日最新資訊28at.com

△圖片來源:https://arxiv.org/pdf/2203.00854.pdfjeq28資訊網(wǎng)——每日最新資訊28at.com

基于Colossal-AI的加速方案FastFold,將GPU優(yōu)化和大模型訓(xùn)練技術(shù)引入AlphaFold的訓(xùn)練和推理,成功超越谷歌和哥倫比亞大學(xué)的方案,將AlphaFold訓(xùn)練時間從11天減少到67小時,且總成本更低,在長序列推理中也實(shí)現(xiàn)9.3~11.6倍的速度提升。jeq28資訊網(wǎng)——每日最新資訊28at.com

jeq28資訊網(wǎng)——每日最新資訊28at.com

△長序列推理性能對比jeq28資訊網(wǎng)——每日最新資訊28at.com

半數(shù)GPU訓(xùn)練GPT-3jeq28資訊網(wǎng)——每日最新資訊28at.com

jeq28資訊網(wǎng)——每日最新資訊28at.com

對于超大AI模型,如GPT-3,相比英偉達(dá)方案,Colossal-AI僅需一半的計(jì)算資源,即可啟動訓(xùn)練;若使用相同計(jì)算資源,則能提速11%,可降低GPT-3訓(xùn)練成本超百萬美元。jeq28資訊網(wǎng)——每日最新資訊28at.com

Colossal-AI注重開源社區(qū)建設(shè),提供中文教程,開放用戶社群及論壇,對于用戶反饋進(jìn)行高效交流與迭代更新,不斷添加MoE等前沿應(yīng)用。jeq28資訊網(wǎng)——每日最新資訊28at.com

項(xiàng)目團(tuán)隊(duì)jeq28資訊網(wǎng)——每日最新資訊28at.com

潞晨技術(shù)團(tuán)隊(duì)的核心成員均來自美國加州大學(xué)伯克利分校,斯坦福大學(xué),清華大學(xué),北京大學(xué),新加坡國立大學(xué),新加坡南洋理工大學(xué)等國內(nèi)外知名高校;擁有Google Brain、IBM、Intel、 Microsoft、NVIDIA等知名廠商工作經(jīng)歷。公司成立即獲得創(chuàng)新工場、真格基金等多家頂尖VC機(jī)構(gòu)種子輪投資。jeq28資訊網(wǎng)——每日最新資訊28at.com

jeq28資訊網(wǎng)——每日最新資訊28at.com

△潞晨科技創(chuàng)始人尤洋教授:加州大學(xué)伯克利分校博士、IPDPS/ICPP最佳論文、ACM/IEEE George Michael HPC Fellowship、福布斯30歲以下精英(亞洲 2021)、IEEE-CS超算杰出新人獎、UC伯克利EECS Lotfi A. Zadeh優(yōu)秀畢業(yè)生獎jeq28資訊網(wǎng)——每日最新資訊28at.com

jeq28資訊網(wǎng)——每日最新資訊28at.com

△潞晨CSO Prof. James Demmel:加州大學(xué)伯克利分校杰出教授、ACM/IEEE Fellow,美國科學(xué)院、工程院、藝術(shù)與科學(xué)院三院院士jeq28資訊網(wǎng)——每日最新資訊28at.com

傳送門jeq28資訊網(wǎng)——每日最新資訊28at.com

論文地址:https://arxiv.org/abs/2110.14883jeq28資訊網(wǎng)——每日最新資訊28at.com

項(xiàng)目地址:https://github.com/hpcaitech/ColossalAIjeq28資訊網(wǎng)——每日最新資訊28at.com

文檔地址:https://www.colossalai.org/jeq28資訊網(wǎng)——每日最新資訊28at.com

 jeq28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-119-2261-0.html霸榜GitHub熱門第一多日后,Colossal-AI正式版發(fā)布

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 使用Linode引擎實(shí)現(xiàn)Kubernetes自動縮放的優(yōu)秀實(shí)踐 譯文

下一篇: 使用 Howdy 為 Linux 增加人臉識別登錄

標(biāo)簽:
  • 熱門焦點(diǎn)
  • Find N3入網(wǎng):最高支持16+1TB

    OPPO將于近期登場的Find N3折疊屏目前已經(jīng)正式入網(wǎng),型號為PHN110。本次Find N3在外觀方面相比前兩代有很大的變化,不再是小號的橫向折疊屏,而是跟別的廠商一樣采用了較為常見的
  • 5月安卓手機(jī)好評榜:魅族20 Pro奪冠

    性能榜和性價(jià)比榜之后,我們來看最后的安卓手機(jī)好評榜,數(shù)據(jù)來源安兔兔評測,收集時間2023年5月1日至5月31日,僅限國內(nèi)市場。第一名:魅族20 Pro好評率:97.50%不得不感慨魅族老品牌還
  • 三言兩語說透柯里化和反柯里化

    JavaScript中的柯里化(Currying)和反柯里化(Uncurrying)是兩種很有用的技術(shù),可以幫助我們寫出更加優(yōu)雅、泛用的函數(shù)。本文將首先介紹柯里化和反柯里化的概念、實(shí)現(xiàn)原理和應(yīng)用
  • 這款新興工具平臺,讓你的電腦效率翻倍

    隨著信息技術(shù)的發(fā)展,我們獲取信息的渠道越來越多,但是處理信息的效率卻成為一個瓶頸。于是各種工具應(yīng)運(yùn)而生,都在爭相解決我們的工作效率問題。今天我要給大家介紹一款效率
  • 花7萬退貨退款無門:誰在縱容淘寶珠寶商家造假?

    來源:極點(diǎn)商業(yè)作者:楊銘在淘寶購買珠寶玉石后,因?yàn)楸WC金不夠賠付,店鋪關(guān)閉,退貨退款難、維權(quán)無門的比比皆是。“提供相關(guān)產(chǎn)品鑒定證書,支持全國復(fù)檢,可以30天無理由退換貨。&
  • 品牌洞察丨服務(wù)本地,美團(tuán)直播成效幾何?

    來源:17PR7月11日,美團(tuán)App首頁推薦位出現(xiàn)“美團(tuán)直播”的固定入口。在直播聚合頁面,外賣“神槍手”直播間、美團(tuán)旅行直播間、美團(tuán)買菜直播間等均已上線,同時
  • 華為Mate 60保護(hù)殼曝光:碩大后置相機(jī)模組 凸起程度有驚喜

    這段時間以來,關(guān)于華為新旗艦的爆料日漸密集。據(jù)此前多方爆料,今年華為將開始恢復(fù)一年雙旗艦戰(zhàn)略,除上半年推出的P60系列外,往年下半年的Mate系列也將
  • 7月4日見!iQOO 11S官宣:“雞血版”驍龍8 Gen2+200W快充加持

    上半年已接近尾聲,截至目前各大品牌旗下的頂級旗艦都已悉數(shù)亮相,而下半年即將推出的頂級旗艦已經(jīng)成為了數(shù)碼圈爆料的主流,其中就包括全新的iQOO 11S系
  • 2299元起!iQOO Pad開啟預(yù)售:性能最強(qiáng)天璣平板

    5月23日,iQOO如期舉行了新品發(fā)布會,除了首發(fā)安卓最強(qiáng)旗艦處理器的iQOO Neo8系列新機(jī)外,還在發(fā)布會上推出了旗下首款平板電腦——iQOO Pad,其搭載了天璣
Top 主站蜘蛛池模板: 商南县| 孝昌县| 灵璧县| 鱼台县| 平乡县| 西青区| 融水| 周至县| 仙桃市| 修水县| 天全县| 濉溪县| 仁寿县| 建昌县| 平遥县| 丹阳市| 永顺县| 萨嘎县| 包头市| 黎城县| 太仓市| 凤城市| 瑞金市| 石景山区| 昌黎县| 宁晋县| 会泽县| 府谷县| 普定县| 武宁县| 宁明县| 奉贤区| 清河县| 淅川县| 宁波市| 定结县| 方正县| 洛隆县| 厦门市| 康马县| 沙河市|