日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

元象發(fā)布中國最大 MoE 開源大模型:總參數(shù) 255B,激活參數(shù) 36B

來源: 責編: 時間:2024-09-18 08:56:41 85觀看
導讀 9 月 13 日消息,元象 XVERSE 發(fā)布中國最大 MoE 開源模型 XVERSE-MoE-A36B。該模型總參數(shù) 255B,激活參數(shù) 36B,官方號稱效果能“大致達到”超過 100B 大模型的“跨級”性能躍升,同時訓練時間減少 30%,推理性能提升 1

9 月 13 日消息,元象 XVERSE 發(fā)布中國最大 MoE 開源模型 XVERSE-MoE-A36B。kIU28資訊網(wǎng)——每日最新資訊28at.com

該模型總參數(shù) 255B,激活參數(shù) 36B,官方號稱效果能“大致達到”超過 100B 大模型的“跨級”性能躍升,同時訓練時間減少 30%,推理性能提升 100%,使每 token 成本大幅下降。kIU28資訊網(wǎng)——每日最新資訊28at.com

MoE(Mixture of Experts)混合專家模型架構(gòu),將多個細分領(lǐng)域的專家模型組合成一個超級模型,在擴大模型規(guī)模的同時,保持模型性能最大化,甚至還能降低訓練和推理的計算成本。谷歌 Gemini-1.5、OpenAI 的 GPT-4 、馬斯克旗下 xAI 公司的 Grok 等大模型都使用了 MoE。kIU28資訊網(wǎng)——每日最新資訊28at.com

在多個評測中,元象 MoE 超過多個同類模型,包括國內(nèi)千億 MoE 模型 Skywork-MoE、傳統(tǒng) MoE 霸主 Mixtral-8x22B 以及 3140 億參數(shù)的 MoE 開源模型 Grok-1-A86B 等。kIU28資訊網(wǎng)——每日最新資訊28at.com

kIU28資訊網(wǎng)——每日最新資訊28at.com

附相關(guān)鏈接:kIU28資訊網(wǎng)——每日最新資訊28at.com

Hugging Face:https://huggingface.co/xverse/XVERSE-MoE-A36BkIU28資訊網(wǎng)——每日最新資訊28at.com

魔搭:https://modelscope.cn/models/xverse/XVERSE-MoE-A36BkIU28資訊網(wǎng)——每日最新資訊28at.com

Github:https://github.com/xverse-ai/XVERSE-MoE-A36BkIU28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-7301-0.html元象發(fā)布中國最大 MoE 開源大模型:總參數(shù) 255B,激活參數(shù) 36B

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: “AI 教母”李飛飛為新公司融資 2.3 億美元,創(chuàng)業(yè)方向瞄準“空間智能”

下一篇: 美國銀行談 AI 熱潮:當前仍處早期階段,才相當于互聯(lián)網(wǎng)的 1996 年

標簽:
  • 熱門焦點
    SQL Error: select * from ***_ecms_news13 where id in(191,282,84,112,151,246,,239,98) limit 9
Top 主站蜘蛛池模板: 怀化市| 洮南市| 怀化市| 鄱阳县| 三亚市| 东山县| 涟水县| 武夷山市| 新蔡县| 施秉县| 宜昌市| 玉环县| 徐水县| 顺平县| 涟源市| 乌鲁木齐市| 宝应县| 三门峡市| 科技| 资源县| 台东市| 邹平县| 安顺市| 龙井市| 枣阳市| 丘北县| 华亭县| 平昌县| 新宁县| 大荔县| 东丽区| 高雄市| 类乌齐县| 大城县| 明溪县| 佛坪县| 湟中县| 洛浦县| 都匀市| 兖州市| 宜黄县|