日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

非 Transformer 架構 AI 模型 Liquid 問世,號稱性能“凌駕 Meta Llama 微軟 Phi”

來源: 責編: 時間:2024-10-05 19:24:56 105觀看
導讀 10 月 2 日消息,去年剛成立的 Liquid AI 公司于 9 月 30 日發布了三款 Liquid 基礎模型(Liquid Foundation Models,LFM),分別為 LFM-1.3B、LFM-3.1B 和 LFM-40.3B。這些模型均采用非 Transformer 架構,號稱在基準測

10 月 2 日消息,去年剛成立的 Liquid AI 公司于 9 月 30 日發布了三款 Liquid 基礎模型(Liquid Foundation Models,LFM),分別為 LFM-1.3B、LFM-3.1B 和 LFM-40.3B。這些模型均采用非 Transformer 架構,號稱在基準測試中凌駕同規模的 Transformer 模型。eXK28資訊網——每日最新資訊28at.com

eXK28資訊網——每日最新資訊28at.com

注意到,目前業界在深度學習和自然語言處理方面主要使用 Transformer架構,該架構主要利用自注意力機制捕捉序列中單詞之間的關系,包括 OpenAI 的 GPT、Meta 的 BART 和谷歌的 T5 等模型,都是基于 Transformer 架構。eXK28資訊網——每日最新資訊28at.com

而Liquid AI 則反其道而行之,其 Liquid 基礎模型號稱對模型架構進行了“重新設想”,據稱受到了“交通信號處理系統、數值線性代數”理念的深刻影響,主打“通用性”,能夠針對特定類型的數據進行建模,同時支持對視頻、音頻、文本、時間序列和交通信號等內容進行處理。eXK28資訊網——每日最新資訊28at.com

eXK28資訊網——每日最新資訊28at.com

Liquid AI 表示,與 Transformer 架構模型相比 LFM 模型的RAM用量更少,特別是在處理大量輸入內容場景時,由于 Transformer 架構模型處理長輸入時需要保存鍵值(KV)緩存,且緩存會隨著序列長度的增加而增大,導致輸入越長,占用的RAM越多。eXK28資訊網——每日最新資訊28at.com

而 LFM 模型則能夠避免上述問題,系列模型能夠有效對外界輸入的數據進行壓縮,降低對硬件資源的需求,在相同硬件條件下,這三款模型相對業界競品能夠處理更長的序列。eXK28資訊網——每日最新資訊28at.com

參考 Liquid AI 首批發布的三款模型,其中 LFM-1.3B 專為資源受限的環境設計,而 LFM-3.1B 針對邊緣計算進行了優化,LFM-40.3B 則是一款“專家混合模型(MoE)”,該版本主要適用于數學計算、交通信號處理等場景。eXK28資訊網——每日最新資訊28at.com

這些模型在通用知識和專業知識的處理上表現較為突出,能夠高效處理長文本任務,還能夠處理數學和邏輯推理任務,目前該模型主要支持英語,不過也對中文、法語、德語、西班牙語、日語、韓語和阿拉伯語提供有限支持。eXK28資訊網——每日最新資訊28at.com

根據 Liquid AI 的說法,LFM-1.3B 在許多基準測試中擊敗了其他 1B 參數規模的領先模型,包括蘋果的 OpenELM、Meta 的 Llama 3.2、微軟的 Phi 1.5 以及 Stability 的 Stable LM 2,這標志著首次有非 GPT 架構的模型明顯超越了 Transformer 模型。eXK28資訊網——每日最新資訊28at.com

而在 LFM-3.1B 方面,這款模型不僅能夠超越了 3B 規模的各種 Transformer 模型、混合模型和 RNN 模型,甚至還在特定場景超越上一代的 7B 和 13B 規模模型,目前已戰勝谷歌的 Gemma 2、蘋果的 AFM Edge、Meta 的 Llama 3.2 和微軟的 Phi-3.5 等。eXK28資訊網——每日最新資訊28at.com

LFM-40.3B 則強調在模型規模和輸出質量之間的平衡,不過這款模型有所限制,雖然其擁有 400 億個參數,但在推理時僅啟用 120 億個參數,Liquid AI 聲稱進行相關限制是因為模型出品質量已經足夠,在這種情況下對相應參數進行限制“反而還能夠提升模型效率、降低模型運行所需的硬件配置”。eXK28資訊網——每日最新資訊28at.com

eXK28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-8028-0.html非 Transformer 架構 AI 模型 Liquid 問世,號稱性能“凌駕 Meta Llama 微軟 Phi”

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: PyTorch 架構優化庫 torchao 正式發布,可大幅提升 AI 模型效率

下一篇: OpenAI 引領 AI 浪潮:o1 模型可處理 5 小時任務,顛覆營銷思維和模式

標簽:
  • 熱門焦點
  • 上、中、下游加深融合,搭建元宇宙產業全景

    元宇宙產業鏈涉及多種技術和多個領域。在上游,聚集著大量的技術廠商,提供元宇宙相關的硬件和軟件支持;在中游,內容運營與分發領域也吸引著越來越多的企業以VR內容
  • 冰墩墩NFT遇冷,價格跌80%,日成交僅3筆。

    “兩日上漲千倍”并不存在,且冰墩墩NFT的市場熱度遠不及社交媒體所稱的那樣高。2月11日,獲得國際奧委會授權的2022冬奧會吉祥物冰墩墩相關NFT產品在nWayPlay上線
  • 百度元宇宙希壤是什么?(附下載)

    百度元宇宙希壤是什么,最近很多人關注。還有很多人問希壤怎么下載、百度希壤怎么進入?今天小編帶你來全面了解一下。“希壤”是百度于2021年12月27日于百度AI開
  • 區塊鏈產業人才發展報告

    工業和信息化部作為工業和信息化行業主管部門,正在著力推進“兩個強國”建設,加快推動以區塊鏈為代表的新興技術與實體經濟深度融合。我國區塊鏈技術和應用想要
  • 字節覓《原神》,騰訊元宇宙,游戲新王戰舊神?

    文 | 陳橋輝陳奕迅的《紅玫瑰》中有一句歌詞,“得不到的永遠在騷動”,這句話用到如今國內頭部游戲平臺再合適不過。隨著《原神》的異軍突起,使得頭部游戲大廠感受
  • 紐約證券交易所母公司ICE收購tZero股份以探索代幣化股票

    2 月 22 日,紐約證券交易所 (NYSE) 的母公司洲際交易所 (ICE) 宣布,它將持有私人數字證券市場 tZERO 的所有權。根據公告,ICE 將成為 tZero 的“重要”少數股東,但
  • 就業年齡歧視如何解決?來Web3看看

    上周,我突然想到我的第一份工作實際上是在為一家失敗的航空公司制定破產退出計劃,那年我們的協議實習生剛出生。在一陣恐慌后,我又花了一點時間反思我這個擁有近1
  • 新聞業在元宇宙的現狀和未來

    “美聯社有毛病吧,這真的過分了!”,一位媒體編輯在推特中憤怒地表示。這是針對一款視頻NFT的批評言論之一,之后取消了此次銷售,因為該視頻呈現了移民穿越地中海的苦
  • FTX 加密貨幣交易所開始向游戲公司提供加密服務

    據媒體報道,業內領先的加密貨幣交易所FTX宣布將涉足游戲領域。該公司表示,計劃推出自己的游戲部門作為中介,專注于為傳統游戲公司提供加密相關服務。此舉將有助于
Top 主站蜘蛛池模板: 平凉市| 乐至县| 石嘴山市| 舟曲县| 永和县| 临江市| 潮安县| 青阳县| 富阳市| 乌拉特后旗| 精河县| 万年县| 铜梁县| 黄山市| 宁明县| 合肥市| 资兴市| 和政县| 永胜县| 扎鲁特旗| 龙游县| 涟源市| 太湖县| 安吉县| 乐平市| 枣庄市| 广平县| 湟中县| 巴中市| 平度市| 拜城县| 富宁县| 昌图县| 祥云县| 太湖县| 平武县| 康平县| 安义县| 丽江市| 浑源县| 佛冈县|