日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

Meta 發布 Llama 4 系列 AI 模型,引入“混合專家架構”提升效率

來源: 責編: 時間:2025-04-08 10:04:50 71觀看
導讀 4 月 6 日消息,Meta現已發布旗下最新Llama 4 系列AI 模型,包含 Llama 4 Scout、Llama 4 Maverick 和Llama 4 Behemoth,Meta 透露相應模型都經過了“大量未標注的文本、圖像和視頻數據”的訓練,以使它們具備“廣泛

4 月 6 日消息,Meta現已發布旗下最新Llama 4 系列AI 模型,包含 Llama 4 Scout、Llama 4 Maverick 和Llama 4 Behemoth,Meta 透露相應模型都經過了“大量未標注的文本、圖像和視頻數據”的訓練,以使它們具備“廣泛的視覺理解能力”。erQ28資訊網——每日最新資訊28at.com

erQ28資訊網——每日最新資訊28at.com

目前,Meta 已將系列模型中的 Scout 和Maverick 上架到Hugging Face(點此訪問),而 Behemoth 模型則還在訓練中。其中 Scout 可以在單個英偉達H100 GPU 上運行,而Maverick 則需要英偉達H100 DGX AI 平臺或“同等性能的設備”。erQ28資訊網——每日最新資訊28at.com

Meta 表示,Llama 4 系列模型是該公司旗下首批采用混合專家(MoE)架構的模型,這種架構在訓練和回答用戶查詢時的效率更高,所謂“混合專家架構”基本上是將數據處理任務分解為子任務,然后將它們委派給更小的、專門的“專家”模型。erQ28資訊網——每日最新資訊28at.com

erQ28資訊網——每日最新資訊28at.com

例如,Maverick 總共有4000 億個參數,但在128 個“專家”模型中只有170 億個活躍參數(參數數量大致與模型的問題解決能力相對應)。Scout 有170 億個活躍參數、16 個“專家”模型以及總計1090 億個參數。erQ28資訊網——每日最新資訊28at.com

erQ28資訊網——每日最新資訊28at.com

不過值得注意的是,Llama 4 系列中沒有一個模型是像OpenAI 的o1 和o3-mini 那樣真正意義上的“推理模型”。作為比較,“推理模型”會對其答案進行事實核查,并且通常能更可靠地回答問題,但因此也比傳統的“非推理”模型花費更長的時間來給出答案。erQ28資訊網——每日最新資訊28at.com

Meta 內部測試顯示,Maverick 模型最適合用于“通用AI 助手和聊天”等應用場景,該模型在創意寫作、代碼生成、翻譯、推理、長文本上下文總結和圖像基準測試中表現超過了OpenAI 的GPT-4o 和谷歌的Gemini 2.0 等模型。然而 Maverick 與谷歌的 Gemini 2.5 Pro、Anthropic 的Claude 3.7 Sonnet 和OpenAI 的GPT-4.5 等功能更強大的最新模型相比仍有一定進步空間。erQ28資訊網——每日最新資訊28at.com

erQ28資訊網——每日最新資訊28at.com

而 Scout 的優勢則是總結文檔、基于大型代碼庫進行推理。該模型支持 1000 萬個詞元(“詞元”代表原始文本的片段,例如單詞“fantastic”可拆分為“fan”、“tas”和“tic”),因此一次可以處理“多達數百萬字的文本”。erQ28資訊網——每日最新資訊28at.com

注意到,Meta 還進一步預告了其 Behemoth 模型,據該公司稱,Behemoth 有2880 億個活躍參數、16 個“專家”模型,總參數數量接近2 萬億個。Meta 的內部基準測試顯示,在一些衡量解決數學問題等科學、技術、工程和數學(STEM)技能的評估中,Behemoth 的表現優于GPT-4.5、Claude 3.7 Sonnet 和Gemini 2.0 Pro,但不如Gemini 2.5 Pro。erQ28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-12016-0.htmlMeta 發布 Llama 4 系列 AI 模型,引入“混合專家架構”提升效率

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: OpenAI 遭實錘:研究稱其 AI 模型“記住”了受版權保護的內容

下一篇: 消息稱谷歌 Gemini AI 部門高層調整:掌門人 Sissie Hsiao 下臺、原 Google Labs 主管上位

標簽:
  • 熱門焦點
  • B端難做:留給魔琺科技的時間不多了

    來源:零態LT元宇宙泡沫正在碎裂,進入2023年后這一賽道熱度一直在遞減。今年2月,微軟解散了成立僅四個月的工業元宇宙部門;今年3月,該公司2017年收購的虛擬現實社交平臺AltspaceVR
  • 元宇宙里掀起回憶殺?這波虛擬懷舊營銷主打一個極限反差

    來源:首席品牌官從被稱為“元宇宙元年”的2021年開始,幾乎所有品牌都在迫不及待地“入駐”元宇宙。而一提及品牌們的元宇宙玩法,相信多數人腦海里首先浮現
  • 保時捷推出虛擬超跑,車企元宇宙營銷這么香?

    保時捷又出超跑了,不過這次不是在現實世界,而是在虛擬世界。這款Vision Gran Turismo概念車,由保時捷和日本視頻游戲開發工作室Polyphony Digital聯合打造,將于202
  • 2022開年最熱投資賽道竟是虛擬人,背后隱藏了什么商業價值?

    在剛剛結束不久的2021年江蘇衛視跨年演唱會上,虛擬鄧麗君與歌手周深同臺聯唱,實現了跨時代合作,而這還不只是“鄧麗君”,嗶哩嗶哩、東方衛視等多家跨年晚會都出現
  • Layer1的新以太坊,更好的以太坊?

    以太坊作為區塊鏈基礎設施地位看起來已不可動搖,但也面臨著費用高、效率低、偏離去中心化初衷等問題。平臺上既得利益群體的形成和固化也逐漸讓革新變得困難。
  • 冰墩墩的NFT暴漲千倍?真相則是價格暴跌、成交遇冷

    《區塊鏈日報》記者查證,近日來冰墩墩數字藏品交易數量出現大幅下滑,而所謂的暴漲千倍更是有價無市的自嗨。昨日,北京冬奧會正式閉幕。在這屆冬奧會上,吉祥物“冰
  • “我沒搞懂元宇宙,但一天能賺9w塊”

    作者:鄭宇軒最近幾個月,“元宇宙”爆火,除了 Facebook 改名為 Meta 高調進軍元宇宙外, BAT 為代表的大廠紛紛著手“元宇宙”新業務。剎那之間,元宇宙成為新風口,除了
  • Meta 在衰落嗎?

    扎克伯格已經很久沒有出現在公眾視野里了,近日,他罕見的接受播客采訪,在兩個小時的時間里暢談了Meta、Facebook、Instagram、元宇宙的未來。正方觀點:是的阿倫·達
  • Steam 禁止NFT和加密貨幣原因曝光

    近日,Valve(V社)總裁Gabe Newell接受PC Gamer采訪時解釋了該平臺禁止NFT和加密貨幣的原因。早在2021年10月18日,PC Gamer就報道Steam推出的新規:使用區塊鏈或允許交
Top 主站蜘蛛池模板: 霍林郭勒市| 吴堡县| 芦溪县| 曲周县| 商南县| 调兵山市| 侯马市| 屯门区| 行唐县| 辉县市| 葫芦岛市| 固始县| 屏边| 宾阳县| 宝清县| 博爱县| 柘荣县| 成都市| 朝阳区| 黎城县| 肇东市| 宝坻区| 光山县| 郸城县| 舒兰市| 辛集市| 宝清县| 扶风县| 巴塘县| 姚安县| 当阳市| 凤冈县| 长宁区| 灵丘县| 永川市| 高雄县| 荥阳市| 铜川市| 屯留县| 张家港市| 尖扎县|