日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

非 Transformer 架構 AI 模型 Liquid 問世,號稱性能“凌駕 Meta Llama 微軟 Phi”

來源: 責編: 時間:2024-10-05 19:24:56 82觀看
導讀 10 月 2 日消息,去年剛成立的 Liquid AI 公司于 9 月 30 日發布了三款 Liquid 基礎模型(Liquid Foundation Models,LFM),分別為 LFM-1.3B、LFM-3.1B 和 LFM-40.3B。這些模型均采用非 Transformer 架構,號稱在基準測

10 月 2 日消息,去年剛成立的 Liquid AI 公司于 9 月 30 日發布了三款 Liquid 基礎模型(Liquid Foundation Models,LFM),分別為 LFM-1.3B、LFM-3.1B 和 LFM-40.3B。這些模型均采用非 Transformer 架構,號稱在基準測試中凌駕同規模的 Transformer 模型。vCp28資訊網——每日最新資訊28at.com

vCp28資訊網——每日最新資訊28at.com

注意到,目前業界在深度學習和自然語言處理方面主要使用 Transformer架構,該架構主要利用自注意力機制捕捉序列中單詞之間的關系,包括 OpenAI 的 GPT、Meta 的 BART 和谷歌的 T5 等模型,都是基于 Transformer 架構。vCp28資訊網——每日最新資訊28at.com

而Liquid AI 則反其道而行之,其 Liquid 基礎模型號稱對模型架構進行了“重新設想”,據稱受到了“交通信號處理系統、數值線性代數”理念的深刻影響,主打“通用性”,能夠針對特定類型的數據進行建模,同時支持對視頻、音頻、文本、時間序列和交通信號等內容進行處理。vCp28資訊網——每日最新資訊28at.com

vCp28資訊網——每日最新資訊28at.com

Liquid AI 表示,與 Transformer 架構模型相比 LFM 模型的RAM用量更少,特別是在處理大量輸入內容場景時,由于 Transformer 架構模型處理長輸入時需要保存鍵值(KV)緩存,且緩存會隨著序列長度的增加而增大,導致輸入越長,占用的RAM越多。vCp28資訊網——每日最新資訊28at.com

而 LFM 模型則能夠避免上述問題,系列模型能夠有效對外界輸入的數據進行壓縮,降低對硬件資源的需求,在相同硬件條件下,這三款模型相對業界競品能夠處理更長的序列。vCp28資訊網——每日最新資訊28at.com

參考 Liquid AI 首批發布的三款模型,其中 LFM-1.3B 專為資源受限的環境設計,而 LFM-3.1B 針對邊緣計算進行了優化,LFM-40.3B 則是一款“專家混合模型(MoE)”,該版本主要適用于數學計算、交通信號處理等場景。vCp28資訊網——每日最新資訊28at.com

這些模型在通用知識和專業知識的處理上表現較為突出,能夠高效處理長文本任務,還能夠處理數學和邏輯推理任務,目前該模型主要支持英語,不過也對中文、法語、德語、西班牙語、日語、韓語和阿拉伯語提供有限支持。vCp28資訊網——每日最新資訊28at.com

根據 Liquid AI 的說法,LFM-1.3B 在許多基準測試中擊敗了其他 1B 參數規模的領先模型,包括蘋果的 OpenELM、Meta 的 Llama 3.2、微軟的 Phi 1.5 以及 Stability 的 Stable LM 2,這標志著首次有非 GPT 架構的模型明顯超越了 Transformer 模型。vCp28資訊網——每日最新資訊28at.com

而在 LFM-3.1B 方面,這款模型不僅能夠超越了 3B 規模的各種 Transformer 模型、混合模型和 RNN 模型,甚至還在特定場景超越上一代的 7B 和 13B 規模模型,目前已戰勝谷歌的 Gemma 2、蘋果的 AFM Edge、Meta 的 Llama 3.2 和微軟的 Phi-3.5 等。vCp28資訊網——每日最新資訊28at.com

LFM-40.3B 則強調在模型規模和輸出質量之間的平衡,不過這款模型有所限制,雖然其擁有 400 億個參數,但在推理時僅啟用 120 億個參數,Liquid AI 聲稱進行相關限制是因為模型出品質量已經足夠,在這種情況下對相應參數進行限制“反而還能夠提升模型效率、降低模型運行所需的硬件配置”。vCp28資訊網——每日最新資訊28at.com

vCp28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-8028-0.html非 Transformer 架構 AI 模型 Liquid 問世,號稱性能“凌駕 Meta Llama 微軟 Phi”

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: PyTorch 架構優化庫 torchao 正式發布,可大幅提升 AI 模型效率

下一篇: OpenAI 引領 AI 浪潮:o1 模型可處理 5 小時任務,顛覆營銷思維和模式

標簽:
  • 熱門焦點
  • B端難做:留給魔琺科技的時間不多了

    來源:零態LT元宇宙泡沫正在碎裂,進入2023年后這一賽道熱度一直在遞減。今年2月,微軟解散了成立僅四個月的工業元宇宙部門;今年3月,該公司2017年收購的虛擬現實社交平臺AltspaceVR
  • 關于ChatGPT的10點思考

    作者:晏濤三壽近日ChatGPT又有大動作。5月19日,OpenAI在官網宣布正式發布App應用,并登錄蘋果應用商店。與網頁版的聊天機器人相比,iOS應用程序的發布有望讓更多人接觸到ChatGPT
  • “元宇宙”里過大年,《迷你世界》在做一場怎樣的實驗?

    2021年是游戲行業不確定性急劇上升的一年。一方面游戲正風光無限,騰訊等大廠更加密集地投資動作,讓游戲創投市場異常火熱,"元宇宙"概念的大放異彩,更是吸引了Netfl
  • 百度元宇宙希壤是什么?(附下載)

    百度元宇宙希壤是什么,最近很多人關注。還有很多人問希壤怎么下載、百度希壤怎么進入?今天小編帶你來全面了解一下。“希壤”是百度于2021年12月27日于百度AI開
  • “我沒搞懂元宇宙,但一天能賺9w塊”

    作者:鄭宇軒最近幾個月,“元宇宙”爆火,除了 Facebook 改名為 Meta 高調進軍元宇宙外, BAT 為代表的大廠紛紛著手“元宇宙”新業務。剎那之間,元宇宙成為新風口,除了
  • 暴漲100倍的NFT worlds 會是未來元宇宙的雛形嗎?

    NFT Worlds 系列產品于 2021 年 10 月 5 日免費鑄造,該NFT系列是將傳統的中心化電子游戲minecraft 與去中心化資產相結合。傳統游戲Minecraft 對用戶定制非常開
  • 下一個黃金賽道?NFT的碎片化!

    碎片化可能是我們一生中最重要的一個投資趨勢,碎片化本身并不新鮮。它已經存在了400年之久。早在1602年,荷蘭東印度公司是歷史上第一家在公共證券交易所上市的公
  • Meta 在衰落嗎?

    扎克伯格已經很久沒有出現在公眾視野里了,近日,他罕見的接受播客采訪,在兩個小時的時間里暢談了Meta、Facebook、Instagram、元宇宙的未來。正方觀點:是的阿倫·達
  • 音樂家如何利用NFTs來提高歌迷參與度

    "音樂是一種語言,不以特定的文字說話。它用情感說話,如果它在骨子里,它就在骨子里。" - Keith Richards音樂激勵著我們,使我們流淚,使我們充滿狂喜,并撫慰我們的靈魂
Top 主站蜘蛛池模板: 雅江县| 铜鼓县| 南皮县| 宜良县| 明水县| 乐安县| 东平县| 博野县| 青河县| 台湾省| 兴义市| 龙泉市| 平谷区| 襄城县| 张掖市| 闸北区| 五河县| 万盛区| 广安市| 安宁市| 醴陵市| 车致| 三原县| 年辖:市辖区| 衡水市| 曲麻莱县| 德格县| 华阴市| 顺义区| 万全县| 滨海县| 子长县| 巴塘县| 九龙坡区| 依安县| 西乌珠穆沁旗| 宁波市| 吕梁市| 济南市| 安远县| 沭阳县|