日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

開源版 OpenAI 再出神作:小模型吊打 Meta Llama 3,Ministral 系列開啟邊緣 AI 革命

來源: 責編: 時間:2024-10-26 15:13:49 56觀看
導讀 Mistral 7B 誕生一周年之際,法國 AI 初創公司 Mistral 再次連發兩個輕量級模型 Ministral 3B 和 Ministral 8B,性能趕超 Llama 3 8B。Mistral 7B 僅僅發布一周年,法國 AI 初創小模型「les Ministraux」就打敗它

Mistral 7B 誕生一周年之際,法國 AI 初創公司 Mistral 再次連發兩個輕量級模型 Ministral 3B 和 Ministral 8B,性能趕超 Llama 3 8B。8dH28資訊網——每日最新資訊28at.com

8dH28資訊網——每日最新資訊28at.com

Mistral 7B 僅僅發布一周年,法國 AI 初創小模型「les Ministraux」就打敗它了。它堪稱是,世界上最好的邊緣模型。8dH28資訊網——每日最新資訊28at.com

8dH28資訊網——每日最新資訊28at.com

Ministral 3B 和 Ministral 8B 這兩款輕量級模型,專為邊緣設備打造。截至目前,它們正式加入 Mixtral、Pixtral、Codestral、Mathstral 行列,成為 Mistral 一員。8dH28資訊網——每日最新資訊28at.com

8dH28資訊網——每日最新資訊28at.com

別看僅有 30 億參數,在指令跟隨基準上,完全超越了 Llama 3 8B,以及前輩模型 Mistral 7B。而且 Ministral 3B 和 Ministral 8B 在大模型競技場中的測試,均拿下了媲美 Gemma 2、Llama 3.1 開源模型的成績。8dH28資訊網——每日最新資訊28at.com

8dH28資訊網——每日最新資訊28at.com

世界上最好的邊緣模型

Ministral 3B 和 Ministral 8B 都支持高達 128k 上下文(目前在 vLLM 上為 32k)。8dH28資訊網——每日最新資訊28at.com

在知識、常識、推理、函數調用、效率等方面,為低于 10B 參數模型設立了新標桿。8dH28資訊網——每日最新資訊28at.com

而且,Ministral 8B 還有配備了滑動窗口注意機制(sliding-window attention),以實現更快和內存高效的推理。8dH28資訊網——每日最新資訊28at.com

不論是管理復雜的 AI 智能體工作流,還是創建專門的任務助手,它們均可以被微調到各種用例中。8dH28資訊網——每日最新資訊28at.com

8dH28資訊網——每日最新資訊28at.com

趕超開源模型,擊敗 Mistral 7B

研究人員在多項基準測試中,評估了 Les Minimrau 的性能。8dH28資訊網——每日最新資訊28at.com

其中包括知識與常識、代碼、數學、多語言四大方面。8dH28資訊網——每日最新資訊28at.com

預訓練模型

如下圖所示,與 Gema 2 2B、Llama 3.2 3B 相比較,Minstral 3B 在以上基準上,取得了最優成績。8dH28資訊網——每日最新資訊28at.com

在與 Llama 3.1 8B、Mistral 7B 相比較過程中,僅有代碼能力,Minstral 8B 還有些差距,其余放方面均是性能最高的模型。8dH28資訊網——每日最新資訊28at.com

8dH28資訊網——每日最新資訊28at.com

如下是,更加直觀可視化柱狀圖,Minstral 8B 在各項評測中,占據首位。8dH28資訊網——每日最新資訊28at.com

8dH28資訊網——每日最新資訊28at.com

指令模型

再來看微調后的指令模型,性能比較的結果。8dH28資訊網——每日最新資訊28at.com

在大模型競技場中,Minstral 3B 在不同基準上,實現了最優。Minstral 8B 僅在 Wild bench 上,略遜于 Gema 2 9B。8dH28資訊網——每日最新資訊28at.com

另外,在代碼、數學、函數調用方面,兩款新模型性能大幅超越其余模型。8dH28資訊網——每日最新資訊28at.com

8dH28資訊網——每日最新資訊28at.com

下圖,可以直觀看出指令微調后的 Minstral 3B 比更大的 Mistral 7B 的改進。8dH28資訊網——每日最新資訊28at.com

8dH28資訊網——每日最新資訊28at.com

如下是指令微調后的 Minstral 8B 模型,與其他模型的性能對比直觀圖。8dH28資訊網——每日最新資訊28at.com

8dH28資訊網——每日最新資訊28at.com

邊緣計算皆可用,0.1 美金百萬 token

如今,大模型在實際落地中,不如小模型來的更切實際。越來越多的用戶,希望對關鍵應用程序能夠進行本地優先推理,比如設備上翻譯、不用聯網智能助理,自動機器人等等。8dH28資訊網——每日最新資訊28at.com

正如官博所述,Les Minimraux 正為這些場景,提供了高計算效率、低延遲的解決方案。8dH28資訊網——每日最新資訊28at.com

當與 Mistral Large 等更大的模型結合使用時,les Ministraux 還可以作為多步智能體工作流中,進行函數調用的高效中介。8dH28資訊網——每日最新資訊28at.com

通過微調,它們能以極低的延遲和成本基于用戶意圖,跨多個上下文處理輸入解析、任務路由和調用 API。8dH28資訊網——每日最新資訊28at.com

價格

根據官方公布的價格所示,Minstral 8B 輸入輸出價格為百萬 token,0.1 美元。Minstral 3B 則為百萬 token0.04 美元。8dH28資訊網——每日最新資訊28at.com

8dH28資訊網——每日最新資訊28at.com

開源版 OpenAI,不再 Open

自去年成立以來,Mistral 曾以磁力鏈方式開源了多款媲美 OpenAI 的模型,一路走紅得到 AI 社區的認可。8dH28資訊網——每日最新資訊28at.com

這家總部位于巴黎的 Mistral,由 Meta、谷歌 DeepMind 前員工創立。8dH28資訊網——每日最新資訊28at.com

8dH28資訊網——每日最新資訊28at.com

幾個月前,它以 60 億美金估值,完成 6.4 億美元新一輪融資,并隨之推出了一款 GPT-4 級別的模型 ——Mistral Large 2。8dH28資訊網——每日最新資訊28at.com

此外,他們在今年,還推出了一個專家混合模型 Mixtral 8x22B。8dH28資訊網——每日最新資訊28at.com

它包含了一個編碼模型 Codestral,以及一個數學推理和科學發現的模型。8dH28資訊網——每日最新資訊28at.com

8dH28資訊網——每日最新資訊28at.com

不過,今年這家明星公司陷入了巨大爭議,因為它變得不再那么 open。8dH28資訊網——每日最新資訊28at.com

8dH28資訊網——每日最新資訊28at.com

年初,有消息爆料稱,微軟宣布將收購 Mistral 一些股份,并對其投資,意味著它的模型將在 Azure AI 進行托管。8dH28資訊網——每日最新資訊28at.com

甚至,還有 Reddit 網友發現,Mistral 已從官網中,移除了致力于開源的承諾。8dH28資訊網——每日最新資訊28at.com

8dH28資訊網——每日最新資訊28at.com

在一些模型的調用上,Mistral 也開啟了收費模式,包括這次同樣如此。8dH28資訊網——每日最新資訊28at.com

有網友就此吐槽,不是開源的。8dH28資訊網——每日最新資訊28at.com

8dH28資訊網——每日最新資訊28at.com

要知道,對于一家初創公司來說,一直堅持開源代碼是一個巨大的挑戰。就比如反面教材 Stability AI,完全放棄了開源的商業模式,也轉向了收費策略。8dH28資訊網——每日最新資訊28at.com

對于 Mistral 也是如此,若要持續打造優秀的模型,只有這一種選擇。8dH28資訊網——每日最新資訊28at.com

參考資料:8dH28資訊網——每日最新資訊28at.com

https://x.com/dchaplot/status/18465753847181724488dH28資訊網——每日最新資訊28at.com

https://x.com/GuillaumeLample/status/18465668176506799668dH28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-9255-0.html開源版 OpenAI 再出神作:小模型吊打 Meta Llama 3,Ministral 系列開啟邊緣 AI 革命

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 華為Mate X6蓄勢待發,11月前后或將驚艷登場?

下一篇: 華為智駕+座艙,高端MPV市場迎新變局?

標簽:
  • 熱門焦點
  • 這一超級富豪“逆襲”,身價大增4330億

    來源:侃見財經互聯網的突圍沒有“終點”。在快節奏的商業環境下,不斷的試錯成了互聯網企業的標配,一年一個風口,一個風口造就一個熱點,但是回頭來看,最終受益的還是身處
  • 在元宇宙賣酸奶,這波聯動燃爆了!

    來源:品牌頭版 或許,每個人心中都住著一個小饞孩。可能是童年時百吃不厭,覺得新奇又有趣的跳跳糖;可能是味道香甜,咬下一口嘎嘣脆的扁桃仁;還有可能,是某種不知為什么,就是很愛吃的
  • 元宇宙步入暗夜

    撰文 | 文燁豪元宇宙的故事,似乎講不通了。 當下,刮起元宇宙熱潮的Roblox股價已跌去大半,帶頭大哥Meta也正因元宇宙虧損深陷泥潭。 再看國內,從字節“派對島&
  • 上海虹口成立10億元元宇宙基金,香港首只元宇宙ETF擬上市

    區塊鏈日報17日訊 今日《元宇宙新鮮事》有:上海虹口將成立總額約10億元的元宇宙產業基金;香港市場首只元宇宙主題ETF擬于2月21日上市;元宇宙平臺Roblox出現違禁游
  • 以太坊升級將會帶來的5個改變

    以太坊自2015年誕生以來就廣受歡迎,但最近其昂貴的交易費用和低可擴展性對執行復雜的應用程序產生了負面作用,用戶對以太坊改進的需求也日益急迫。以太坊2.0已進
  • 索尼公布PSVR 2頭顯渲染圖;社區開發者發布Quest版《我的世界》

    近日熱點:索尼正式公布PSVR 2頭顯及控制器官方渲染圖;入局元宇宙,鴻海科技與XRSPACE簽訂合作備忘錄;研究人員表示面部追蹤可增強VR操控體驗;社區開發者QuestCraft發
  • 參加元宇宙里的招聘會是什么樣一種體驗?

    求職者可以在活動中走動,就像他們在現實生活中一樣。長話短說看亮點:招聘公司Hirect為Y-combinator支持的初創公司舉辦了一場元宇宙招聘會。這里有一個大廳、一
  • 又一家數字營銷公司入局元宇宙,國內首個藝術元宇宙社區“Meta彼岸”上線

    作者:董宇佳2月28日,智度股份在北京舉辦產品發布會,宣布其與國光電器聯手打造的國內首個藝術元宇宙社區——“Meta彼岸”在VR端和移動端正式公測。從科技巨頭布局
  • 全球十大元宇宙概念游戲

    A股市場中,不少游戲公司早早搭上了元宇宙概念。舉例,中青寶宣稱將發布一款元宇宙概念的模擬經營類游戲,盡管游戲尚在研發中,這一消息已經讓中青寶的股價在51個交易
Top 主站蜘蛛池模板: 库尔勒市| 鹿邑县| 和政县| 浏阳市| 铜山县| 濮阳市| 永城市| 阳曲县| 大化| 庆云县| 新民市| 江永县| 前郭尔| 米泉市| 怀化市| 密云县| 玉树县| 唐山市| 门头沟区| 公安县| 金寨县| 萨迦县| 马龙县| 芦溪县| 拉孜县| 肥城市| 龙陵县| 两当县| 灌云县| 泸州市| 福海县| 柳州市| 太仓市| 柳河县| 宝鸡市| 巴青县| 河曲县| 阜平县| 广宗县| 吴江市| 屏东市|