日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

俄羅斯科技巨頭 Yandex 宣布開源“YaFSDP”大語言模型訓練工具:大幅提升 GPU 利用率,對 Llama 3 可實現 26% 加速

來源: 責編: 時間:2024-06-14 08:44:21 183觀看
導讀 6 月 11 日消息,俄羅斯科技巨頭 Yandex 推出了一款開源的大語言模型訓練工具 ——YaFSDP,號稱與現有工具相比速度最高可提升 26%。據介紹,YaFSDP 在訓練速度方面優于傳統的 FSDP 方法,尤其適用于大型模型。在預訓

6 月 11 日消息,俄羅斯科技巨頭 Yandex 推出了一款開源的大語言模型訓練工具 ——YaFSDP,號稱與現有工具相比速度最高可提升 26%。g2I28資訊網——每日最新資訊28at.com

g2I28資訊網——每日最新資訊28at.com

據介紹,YaFSDP 在訓練速度方面優于傳統的 FSDP 方法,尤其適用于大型模型。在預訓練 LLM 方面,YaFSDP速度提高了 20%,并且在高內存壓力條件下表現更佳。g2I28資訊網——每日最新資訊28at.com

例如,YaFSDP 對具有 700 億參數的 Llama 2 可以實現 21% 的效率提升,對具有同級參數的 Llama 3 也實現 了 26% 的效率提升。附官方數據一覽:g2I28資訊網——每日最新資訊28at.com

模型gpu-countseq-lennum-ckpt-layersspeedupLlama 2 7B64204809.92%Llama 2 7B64409603.43%Llama 2 7B64819202.68%Llama 2 7B128204809.57%Llama 2 7B128409602.42%Llama 2 7B128819202.32%Llama 2 13B1282048012.10%Llama 2 13B128409603.49%Llama 2 34B1282048020.70%Llama 2 34B2562048021.99%Llama 2 34B256409658.35%Llama 2 70B25620481021.48%Llama 2 70B2564096507.17%Llama 3 8B642048011.91%Llama 3 8B64409607.86%Llama 3 70B25620482026.60%

Yandex 表示,通過優化 GPU 使用率,YaFSDP 可以為開發者和公司節省大量資金 —— 每月可能節省數十萬美元。g2I28資訊網——每日最新資訊28at.com

Yandex 的資深開發人員、YaFSDP 團隊成員之一 Mikhail Khruschev 還提到,“目前,我們正在積極嘗試各種模型架構和參數大小,以擴展 YaFSDP 的通用性” 。g2I28資訊網——每日最新資訊28at.com

參考資料:g2I28資訊網——每日最新資訊28at.com

《Яндекс открывает YaFSDP — инструмент для ускорения обучения больших языковых моделей и сокращения расходов на GPU / Хабр》g2I28資訊網——每日最新資訊28at.com

《GitHub - yandex/YaFSDP: YaFSDP: Yet another Fully Sharded Data Parallel》g2I28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-4591-0.html俄羅斯科技巨頭 Yandex 宣布開源“YaFSDP”大語言模型訓練工具:大幅提升 GPU 利用率,對 Llama 3 可實現 26% 加速

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 蘋果高管:正努力將“Apple Intelligence”引入中國市場

下一篇: Copilot Pro 訂閱魅力下降,微軟 7 月 10 日下線用戶自建 GPT 服務

標簽:
  • 熱門焦點
  • ChatGPT訪問量增速下滑,AI真的是一場泡沫嗎?

    來源:首席商業評論2023年,最火的莫過于ChatGPT,席卷全球的同時也引發了生成式AI(人工智能)的投資熱潮。在美股,ChatGPT相關概念股飆漲,以AI算力龍頭英偉達為例,其股價年內一度累計上
  • 這一超級富豪“逆襲”,身價大增4330億

    來源:侃見財經互聯網的突圍沒有“終點”。在快節奏的商業環境下,不斷的試錯成了互聯網企業的標配,一年一個風口,一個風口造就一個熱點,但是回頭來看,最終受益的還是身處
  • 在數字世界再造世界杯,元宇宙體育正變得越來越豐滿

    撰文/ 蔥鮪魚本屆世界杯可能不是最精彩的一屆,卻絕對是看點十足的一屆:后疫情時代的首屆世界杯、耗資2200億美元打造的“史上最貴”世界杯、足壇黃金
  • 元宇宙時代NFT的價值衡量

    有人認為NFT的高昂價格只是炒作的產物,并不具有其對等的價值,但其實NFT并不是空中樓閣,只是區塊鏈數字分類賬中的一種形式。誠然,目前的NFT仍處于灰色地帶,相關的法
  • 「國產良心」NFT嘲諷了誰?

    2月23日,一個名為「國產良心」的NFT項目被許多活躍的加密用戶注意到。該項目的官網風格尤為「不正經」,它絲毫沒有避諱自己的小作坊出身,還將「中國人不騙中國人
  • 重溫 1602 年:DAO 是新的企業范式嗎?

    作者:Andrew Singer“ 將你的選票委托給行業有能力的專家,將使所有者在這些公司的管理中擁有更強大、更清晰的話語權 。”1602 年,荷蘭東印度公司成立,許多人認為
  • NFT 技術將傳世之作帶入博物館

    意大利四大博物館已與一個項目合作,該項目將展示和銷售達芬奇、卡拉瓦喬、拉斐爾和莫迪利亞尼等人的杰作的 NFT復制品。該計劃采用了 科技公司Cincello的國際專
  • NFT教育要從娃娃抓起!這些青少年藝術家已經賺取了幾千萬美金

    一些藝術家通過將他們的創作作為NFT出售而獲得了巨大收益。令人驚訝的是,許多賺取了數百萬美元的藝術家們仍在讀高中。這可能有點讓人難以置信。然而,請記住,在短
  • 元宇宙專題二:GameFi 深度解析,元宇宙內容雛形顯現

    GameFi=Game(游戲)+DEFI(去中心化金融),核心特點為“Play to Earn”。通過技術與去中心化價值觀賦能,GameFi 游戲資產化身為NFT 和代幣上鏈,具備了可驗證性和流通性;開
Top 主站蜘蛛池模板: 鹤峰县| 蓝田县| 红原县| 罗江县| 淄博市| 叙永县| 温宿县| 昌宁县| 乌兰浩特市| 北流市| 芦山县| 永定县| 明星| 玉林市| 永丰县| 嘉黎县| 东宁县| 商城县| 太保市| 郎溪县| 湘潭县| 澄城县| 牟定县| 屏东县| 南阳市| 龙井市| 万源市| 东乡族自治县| 海淀区| 开江县| 沧源| 平江县| 甘洛县| 乡宁县| 仁怀市| 墨竹工卡县| 西林县| 西乌珠穆沁旗| 合江县| 中牟县| 保康县|