當(dāng)前位置：首頁(yè) > 元宇宙 > AI

俄羅斯科技巨頭 Yandex 宣布開(kāi)源“YaFSDP”大語(yǔ)言模型訓(xùn)練工具：大幅提升 GPU 利用率，對(duì) Llama 3 可實(shí)現(xiàn) 26% 加速

來(lái)源：責(zé)編：時(shí)間：2024-06-14 08:44:21 212觀看

導(dǎo)讀 6 月 11 日消息，俄羅斯科技巨頭 Yandex 推出了一款開(kāi)源的大語(yǔ)言模型訓(xùn)練工具 ——YaFSDP，號(hào)稱(chēng)與現(xiàn)有工具相比速度最高可提升 26%。據(jù)介紹，YaFSDP 在訓(xùn)練速度方面優(yōu)于傳統(tǒng)的 FSDP 方法，尤其適用于大型模型。在預(yù)訓(xùn)

6 月 11 日消息，俄羅斯科技巨頭 Yandex 推出了一款開(kāi)源的大語(yǔ)言模型訓(xùn)練工具 ——YaFSDP，號(hào)稱(chēng)與現(xiàn)有工具相比速度最高可提升 26%。

據(jù)介紹，YaFSDP 在訓(xùn)練速度方面優(yōu)于傳統(tǒng)的 FSDP 方法，尤其適用于大型模型。在預(yù)訓(xùn)練 LLM 方面，YaFSDP速度提高了 20%，并且在高內(nèi)存壓力條件下表現(xiàn)更佳。

例如，YaFSDP 對(duì)具有 700 億參數(shù)的 Llama 2 可以實(shí)現(xiàn) 21% 的效率提升，對(duì)具有同級(jí)參數(shù)的 Llama 3 也實(shí)現(xiàn) 了 26% 的效率提升。附官方數(shù)據(jù)一覽：

模型gpu-countseq-lennum-ckpt-layersspeedupLlama 2 7B64204809.92%Llama 2 7B64409603.43%Llama 2 7B64819202.68%Llama 2 7B128204809.57%Llama 2 7B128409602.42%Llama 2 7B128819202.32%Llama 2 13B1282048012.10%Llama 2 13B128409603.49%Llama 2 34B1282048020.70%Llama 2 34B2562048021.99%Llama 2 34B256409658.35%Llama 2 70B25620481021.48%Llama 2 70B2564096507.17%Llama 3 8B642048011.91%Llama 3 8B64409607.86%Llama 3 70B25620482026.60%

Yandex 表示，通過(guò)優(yōu)化 GPU 使用率，YaFSDP 可以為開(kāi)發(fā)者和公司節(jié)省大量資金 —— 每月可能節(jié)省數(shù)十萬(wàn)美元。

Yandex 的資深開(kāi)發(fā)人員、YaFSDP 團(tuán)隊(duì)成員之一 Mikhail Khruschev 還提到，“目前，我們正在積極嘗試各種模型架構(gòu)和參數(shù)大小，以擴(kuò)展 YaFSDP 的通用性” 。

參考資料：

《Яндекс открывает YaFSDP — инструмент для ускорения обучения больших языковых моделей и сокращения расходов на GPU / Хабр》

《GitHub - yandex/YaFSDP: YaFSDP: Yet another Fully Sharded Data Parallel》

本文鏈接：http://www.www897cc.com/showinfo-45-4591-0.html俄羅斯科技巨頭 Yandex 宣布開(kāi)源“YaFSDP”大語(yǔ)言模型訓(xùn)練工具：大幅提升 GPU 利用率，對(duì) Llama 3 可實(shí)現(xiàn) 26% 加速

聲明：本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí)，若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。郵件：2376512515@qq.com

上一篇：蘋(píng)果高管：正努力將“Apple Intelligence”引入中國(guó)市場(chǎng)

下一篇： Copilot Pro 訂閱魅力下降，微軟 7 月 10 日下線用戶自建 GPT 服務(wù)

標(biāo)簽：

熱門(mén)焦點(diǎn)

拯救XR，蘋(píng)果力不從心

來(lái)源 | 光子星球撰文 | 文燁豪編輯 | 吳先之蘋(píng)果終于呈上了它的“答卷”。北京時(shí)間6月6日凌晨，蘋(píng)果2023年全球開(kāi)發(fā)者大會(huì)（WWDC）如期舉行。作為蘋(píng)果CEO庫(kù)克口中&ld
25萬(wàn)虛擬er在“元宇宙”追星

“默嘰默嘰，我是默默醬，我是在真元宇宙也有頭有臉的人。”12月11日晚20：00，虛擬偶像@默默醬的首場(chǎng)個(gè)人元宇宙演唱會(huì)《以夢(mèng)為馬，抵達(dá)繁星》在大有空間APP
元宇宙將會(huì)如何塑造未來(lái)的工作方式？

科幻小說(shuō)家尼爾·斯蒂芬森 (Neal Stephenson) 在1992年就創(chuàng)造了“元宇宙”一詞，但事實(shí)上，在Facebook將其更名為Meta以反映其將這一科幻愿景變?yōu)楝F(xiàn)實(shí)的戰(zhàn)略重點(diǎn)之
中國(guó)虛擬數(shù)字人如何橫向拓展市場(chǎng)需求，探索發(fā)展場(chǎng)景?

通過(guò)5G、AI等新技術(shù)更新?lián)Q代，虛擬數(shù)字人為諸多下游行業(yè)帶來(lái)新的發(fā)展機(jī)會(huì)。虛擬數(shù)字人技術(shù)以其簡(jiǎn)化性和精品性持續(xù)拓展泛娛樂(lè)、金融、教育、政務(wù)、醫(yī)療、零售等
江西將探索成立元宇宙聯(lián)盟，韓國(guó)將加強(qiáng)對(duì)NFT和元宇宙的監(jiān)管

《元宇宙新鮮事》有：江西將探索成立元宇宙聯(lián)盟，支持南昌規(guī)劃建設(shè)元宇宙試驗(yàn)區(qū)；韓國(guó)金融監(jiān)督局將加強(qiáng)對(duì)NFT和元宇宙的監(jiān)管；任天堂社長(zhǎng)表示暫時(shí)不打算加入元宇宙。【
Niantic與索尼在音頻AR領(lǐng)域達(dá)成合作；?蘋(píng)果為Apple Park申請(qǐng)形象化商標(biāo)

今日熱點(diǎn)：迪士尼任命新高管負(fù)責(zé)元宇宙業(yè)務(wù)；iFixit成為Valve Index VR頭顯和Steam Deck首家零件銷(xiāo)售商；Niantic與索尼達(dá)成合作，將為AR游戲《Ingress》帶來(lái)音頻體驗(yàn)；V
2022年6款最佳的NFT稀有度查詢工具

NFT正在風(fēng)靡全球，但擁有一個(gè)你自認(rèn)為看起來(lái)很酷的 NFT 是不夠的，因?yàn)樗€應(yīng)該是稀有的，稀有度會(huì)影響每個(gè) NFT 的價(jià)值。因此，如果您打算投資 NFT，則需要使用 NFT 稀
2022年最具關(guān)注的9個(gè)頭像NFT項(xiàng)目

什么是 PFP NFT 項(xiàng)目？PFP NFT （個(gè)人資料圖片NFT）是一組獨(dú)特的數(shù)字收藏品，人們用來(lái)在互聯(lián)網(wǎng)平臺(tái)上代表自己。這些數(shù)字藝術(shù)作品通常是一系列可作為頭像的角色，在 Twit
76億美金估值、2022年最具創(chuàng)新力公司，Dapper Labs如何做到？

“元宇宙的開(kāi)拓者”是我們針對(duì)元宇宙的發(fā)展而設(shè)立的專(zhuān)欄，主要面向那些深挖元宇宙產(chǎn)業(yè)或者在元宇宙進(jìn)行“淘金”的從業(yè)者，分享這些企業(yè)或者創(chuàng)業(yè)者們的故事，以獨(dú)特

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁(yè)

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

俄羅斯科技巨頭 Yandex 宣布開(kāi)源“YaFSDP”大語(yǔ)言模型訓(xùn)練工具：大幅提升 GPU 利用率，對(duì) Llama 3 可實(shí)現(xiàn) 26% 加速

拯救XR，蘋(píng)果力不從心

25萬(wàn)虛擬er在“元宇宙”追星

元宇宙將會(huì)如何塑造未來(lái)的工作方式？

中國(guó)虛擬數(shù)字人如何橫向拓展市場(chǎng)需求，探索發(fā)展場(chǎng)景?

江西將探索成立元宇宙聯(lián)盟，韓國(guó)將加強(qiáng)對(duì)NFT和元宇宙的監(jiān)管

Niantic與索尼在音頻AR領(lǐng)域達(dá)成合作；?蘋(píng)果為Apple Park申請(qǐng)形象化商標(biāo)

2022年6款最佳的NFT稀有度查詢工具

2022年最具關(guān)注的9個(gè)頭像NFT項(xiàng)目

76億美金估值、2022年最具創(chuàng)新力公司，Dapper Labs如何做到？

最新推薦

元媧2.7上線：虛擬人視頻制作速度瘋狂翻倍！

現(xiàn)在的元宇宙：一款低配版的科幻游戲

城市數(shù)字孿生標(biāo)準(zhǔn)化白皮書(shū)（2022版）

上海虹口成立10億元元宇宙基金，香港首只元宇宙ETF擬上市

從NFT頂級(jí)公鏈到Web3.0基礎(chǔ)設(shè)施：帶你了解不一樣的Flow

元宇宙是數(shù)字共識(shí)生態(tài)的集成邏輯表達(dá)

猜你喜歡

熱門(mén)推薦

相關(guān)資訊

俄羅斯科技巨頭 Yandex 宣布開(kāi)源“YaFSDP”大語(yǔ)言模型訓(xùn)練工具：大幅提升 GPU 利用率，對(duì) Llama 3 可實(shí)現(xiàn) 26% 加速

最新推薦

猜你喜歡

熱門(mén)推薦

相關(guān)資訊

俄羅斯科技巨頭 Yandex 宣布開(kāi)源“YaFSDP”大語(yǔ)言模型訓(xùn)練工具：大幅提升 GPU 利用率，對(duì) Llama 3 可實(shí)現(xiàn) 26% 加速