日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

“全球首創”單臺 RTX 4090 服務器推理,昆侖萬維開源 2 千億稀疏大模型天工 MoE

來源: 責編: 時間:2024-06-06 17:36:32 217觀看
導讀 6 月 3 日消息,昆侖萬維今日宣布開源 2 千億稀疏大模型 Skywork-MoE,基于之前昆侖萬維開源的 Skywork-13B 模型中間 checkpoint 擴展而來,號稱是首個完整將 MoE Upcycling 技術應用并落地的開源千億 MoE 大模型,

6 月 3 日消息,昆侖萬維今日宣布開源 2 千億稀疏大模型 Skywork-MoE,基于之前昆侖萬維開源的 Skywork-13B 模型中間 checkpoint 擴展而來,號稱是首個完整將 MoE Upcycling 技術應用并落地的開源千億 MoE 大模型,也是首個支持用單臺 RTX4090 服務器(8 張 RTX 4090 顯卡)推理的開源千億 MoE 大模型。VAL28資訊網——每日最新資訊28at.com

據介紹,本次開源的 Skywork-MoE 模型隸屬于天工 3.0 的研發模型系列,是其中的中檔大小模型(Skywork-MoE-Medium),模型的總參數量為 146B,激活參數量 22B,共有 16 個 Expert,每個 Expert 大小為 13B,每次激活其中的 2 個 Expert。VAL28資訊網——每日最新資訊28at.com

天工 3.0 還訓練了 75B (Skywork-MoE-Small) 和 400B (Skywork-MoE-Large)兩檔 MoE 模型,并不在此次開源之列。VAL28資訊網——每日最新資訊28at.com

根據官方測試,在相同的激活參數量 20B(推理計算量)下,Skywork-MoE 能力接近 70B 的 Dense 模型,使得模型的推理成本有近 3 倍的下降。同時 Skywork-MoE 的總參數大小比 DeepSeekV2 的總參數大小要小 1/3,用更小的參數規模做到了相近的能力。VAL28資訊網——每日最新資訊28at.com

VAL28資訊網——每日最新資訊28at.com

Skywork-MoE 的模型權重、技術報告完全開源,免費商用,無需申請,附鏈接如下:VAL28資訊網——每日最新資訊28at.com

模型權重下載:VAL28資訊網——每日最新資訊28at.com

https://huggingface.co/Skywork/Skywork-MoE-baseVAL28資訊網——每日最新資訊28at.com

https://huggingface.co/Skywork/Skywork-MoE-Base-FP8VAL28資訊網——每日最新資訊28at.com

模型開源倉庫:https://github.com/SkyworkAI/Skywork-MoEVAL28資訊網——每日最新資訊28at.com

模型技術報告:https://github.com/SkyworkAI/Skywork-MoE/blob/main/skywork-moe-tech-report.pdfVAL28資訊網——每日最新資訊28at.com

模型推理代碼:(支持 8 x 4090 服務器上 8 bit 量化加載推理)https://github.com/SkyworkAI/vllmVAL28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-4513-0.html“全球首創”單臺 RTX 4090 服務器推理,昆侖萬維開源 2 千億稀疏大模型天工 MoE

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: OpenAI 把 GPT-4 原始版給了瑞士洛桑聯邦理工團隊:研究不微調只靠提示詞能走多遠

下一篇: 振興鄉村發展 助力青少年教育 中國三星連續十一年蟬聯企業社會責任榜外企第一

標簽:
  • 熱門焦點
  • 新周期,誰在堅守窄門?

    來源:錦緞今日的投資者恐怕已經忘記了,在OpenAI創造出ChatGPT這一殺器的前夜,生成式AI也曾經是一道窄門,窄到連馬斯克都差點失去了信心。在當時的輿論眼中,AGI的道路不夠性感,不夠
  • 雷克薩斯高管,“受賄”5000萬?

    來源:毒舌科技作者:潘磊雷克薩斯的高管,好像出事了。五六家日本小媒體,突然曝出了一個與中國市場有關的大新聞——雷克薩斯中國區一個高管受賄10億日元(約合人民幣5000
  • 搶先推出“元宇宙”飲料,可口可樂贏麻了

    試圖傍上元宇宙的品牌千千萬,但像可口可樂玩得這么花的,屬實不多。01 可口可樂盯上元宇宙1886年,可口可樂誕生于美國喬治亞州亞特蘭大市,至今已擁有136年的悠久歷
  • 元宇宙帶來沉浸式智能登錄?你學會了嗎?

    備受資本市場寵愛的元宇宙概念,正掀起一番番波瀾。元宇宙作為虛實相融的互聯網應用和社會形態,與沉浸式體驗緊密相關。 多重路徑,打造無感知沉浸式智能登錄《設計
  • 【申萬宏源】必然的碎片化AI落地,哪種路徑可能勝出? | 元宇宙Meta洞見

    大規模預訓GPT(Generative PreTraining)是OpenAI在2018年提出的模型,大規模預訓練模型(大模型)漸漸成為了AI算法領域的熱點。AI產業鏈:從算力到應用工作流程視角?
  • 英特爾首款加密芯片將于今年上市|國際動態

    No.1 英特爾首款加密芯片將于今年上市2月13日消息,英特爾首款名為“區塊鏈加速器”的加密芯片將于今年晚些時候上市。目前,已經有兩家公司預訂了這項技術,分別是G
  • 智能人機交互技術的春晚大考

    1月初的一個早晨,京東智能客戶服務產品部緊急開會,進行關于尚未對外公布的“X項目”的初討論。1月5日,這個神秘的X項目對外公布,京東成為央視2022年春晚獨家互動合
  • 虛擬數字人:元宇宙的主角破圈而來

    虛擬數字人市場逐步進入成熟期,商業化進程加速。1982年世界第一位虛擬歌姬林明美誕生,虛擬數字人行業經歷了萌芽、探索、初級和成長四個階段。隨技術逐年突破,制
  • 盤點9個主流元宇宙平臺,你都知道哪些?

    隨著NFT的持續升溫,它也加入了現在的元宇宙浪潮。本文介紹元宇宙的基本概念以及 九個最流行的元宇宙NFT平臺,如Decentraland、sandbox等。用熟悉的語言學習 以太
Top 主站蜘蛛池模板: 红桥区| 都江堰市| 进贤县| 高安市| 肇庆市| 西昌市| 防城港市| 颍上县| 锡林浩特市| 武川县| 乌兰浩特市| 蓬安县| 公主岭市| 玉林市| 澜沧| 龙井市| 称多县| 长春市| 太和县| 巴东县| 综艺| 东丰县| 原阳县| 平邑县| 攀枝花市| 宝山区| 荆门市| 南昌市| 铁岭市| 庄河市| 白山市| 永胜县| 东方市| 台中市| 麻栗坡县| 邵阳县| 林西县| 茂名市| 双江| 宜都市| 崇左市|