新智元報(bào)道
編輯:編輯部
【新智元導(dǎo)讀】成立 9 個(gè)月,當(dāng)初那個(gè)「6 人團(tuán)隊(duì),7 頁(yè) PPT,8 億融資」的公司不斷締造傳奇。Mistral AI 今日發(fā)布的 Mistral Large 模型性能已經(jīng)直逼 GPT-4,同時(shí)和微軟官宣合作。「下一個(gè) OpenAI」的爆相,已經(jīng)越來越明顯了。
下一個(gè) OpenAI 來了?
開源社區(qū)的另一個(gè)中心 Mistral AI,剛剛發(fā)布了最強(qiáng)力的旗艦?zāi)P?Mistral Large,性能直接對(duì)標(biāo) GPT-4!(但可惜的是沒有開源)
Mistral Large 具備卓越的邏輯推理能力,能夠處理包括文本理解、轉(zhuǎn)換以及代碼生成在內(nèi)的復(fù)雜多語(yǔ)言任務(wù)。
在眾多主流基準(zhǔn)測(cè)試中,Mistral Large 力壓 Anthropic 的 Claude 2 和谷歌的 Gemini Pro,成績(jī)僅次于 GPT-4!
LLM 領(lǐng)域,格局再次改變。
同時(shí),就在今天,AI 圈又一重磅消息曝出:繼 OpenAI 之后,微軟將 Mistral 也納入麾下!
Mistral 從誕生之初,就充滿傳奇的光環(huán)。成立 4 周,6 人團(tuán)隊(duì),7 頁(yè) PPT,8 億融資(1.05 億歐元),簡(jiǎn)直堪稱爽文走進(jìn)現(xiàn)實(shí)。
創(chuàng)始人 Arthur Mensch 是 1993 年出生的法國(guó)小伙,在谷歌工作 3 年后,在自己 31 歲時(shí)離開谷歌,拉攏了兩位 Llama 模型的開發(fā)者,一起創(chuàng)立了這個(gè)日后可以和 OpenAI、Anthropic 分庭抗禮的公司。
幾個(gè)人的團(tuán)隊(duì),極少的融資,做出的模型卻可以和 GPT-4 掰手腕。如今再加上金主爸爸微軟的撐腰,Mistral 「下一個(gè) OpenAI」的名頭,是坐實(shí)了。
現(xiàn)在,正處于全世界聚光燈下的 Mistral,一舉一動(dòng)都十分引人注目。有網(wǎng)友發(fā)現(xiàn) Mistral 修改了網(wǎng)站內(nèi)容,刪除了所有提及開源社區(qū)義務(wù)的內(nèi)容,這立馬引發(fā)了恐慌!
不過,大家目前還不需要太過擔(dān)心。
根據(jù)外媒對(duì) Mistral CEO 的采訪,未來他們依然會(huì)堅(jiān)持開源理念,但是同時(shí)也會(huì)推出性能最為強(qiáng)大的閉源模型參與商業(yè)競(jìng)爭(zhēng)。
現(xiàn)在他們已經(jīng)完成了以規(guī)模命名的開源模型:Mistral 7B 和 Mistral 8 x 7B 回饋社區(qū),以「大中小」命名的閉源模型賺錢的產(chǎn)品線搭建。
話說回來,這次發(fā)布的 Mistral Large,可以說是最適合歐洲人體質(zhì)的大模型。
簡(jiǎn)單來說:
- Mistral Large 能夠母語(yǔ)般流利地使用英語(yǔ)、法語(yǔ)、西班牙語(yǔ)、德語(yǔ)和意大利語(yǔ),深刻理解各自的語(yǔ)法規(guī)則和文化背景。
- Mistral Large 能夠處理 32K Token 的上下文內(nèi)容,使其能夠從龐大的文檔中精確快速地提取信息。
- Mistral Large 在執(zhí)行具體指令方面異常精準(zhǔn),這讓開發(fā)人員可以根據(jù)自己的需求定制內(nèi)容審查政策 —— 例如,Mistral AI 利用它來進(jìn)行了 le Chat 的系統(tǒng)級(jí)別審查。
- Mistral Large 原生支持函數(shù)調(diào)用。這個(gè)特性,結(jié)合 Mistral AI 在 la Plateforme 上實(shí)施的輸出內(nèi)容限制模式,極大地促進(jìn)了應(yīng)用程序的開發(fā)和技術(shù)棧的現(xiàn)代化。
目前,Mistral AI 的這個(gè)新旗艦?zāi)P蛢H在 Azure AI 和 Mistral AI 平臺(tái)上可用。
其中,在 Azure AI 上的定價(jià)如下:輸出為 0.024 美元 / 1000 token,輸入為 0.008 美元 / 1000 token。
要說 Mistral Large 最令人印象深刻的,還是超強(qiáng)的推理能力。
作為旗艦?zāi)P停琈istral Large 在常識(shí)、推理以及知識(shí)方面,都展現(xiàn)出了令人矚目的實(shí)力。
雖然和 GPT-4 還有不小的差距,但 Claude 2 和 Gemini Pro 1.0 基本上已經(jīng)是手下敗將了。
作為一款歐洲人自己的大模型,Mistral Large 在法語(yǔ)、德語(yǔ)、西班牙語(yǔ)和意大利語(yǔ)上的表現(xiàn),均優(yōu)于 Llama 2 70B 模型。
同時(shí),也強(qiáng)過自家更小規(guī)模的模型。
在編程和數(shù)學(xué)方面,Mistral Large 的能力也非常突出。
不僅相比自己其他模型有了大幅的提升,而且在主流的測(cè)試基準(zhǔn)上都取得了不俗的成績(jī)。
相比之下,規(guī)模更小的 Mistral Small,則更加專注于對(duì)延遲和成本的優(yōu)化。
相較于 Mixtral 8x7B,Mistral Small 展現(xiàn)出更優(yōu)異的性能和更低的延遲,是介于 Mistral AI 開源模型和旗艦?zāi)P椭g的解決方案。
與 Mistral Large 類似,Mistral Small 同樣采用了在 RAG 和函數(shù)調(diào)用方面的創(chuàng)新技術(shù)。
此外,Mistral 還優(yōu)化了自家的服務(wù)接口:
- 提供競(jìng)爭(zhēng)力價(jià)格的開放權(quán)重端點(diǎn),包括 open-mistral-7B 和 open-mixtral-8x7b。
- 推出新的優(yōu)化模型端點(diǎn),包括 mistral-small-2402 和 mistral-large-2402,同時(shí)繼續(xù)提供未更新的 mistral-medium。
除了宣布模型之外,Mistral AI 還官宣了和微軟的深度合作。而這也是微軟繼 OpenAI 之后,再次「真金白銀」地入股 AI 圈的另一家頂流模型公司。
雖然 2023 年 4 月才成立,Mistral AI 已經(jīng)對(duì)歐洲的 AI 領(lǐng)域產(chǎn)生了重大影響。開源模型 Mistral 7B 和 Mixtral 的發(fā)布,驚艷了一眾開發(fā)者,在 AI 社區(qū)掀起了軒然大波。
如今微軟的支持,讓更多人堅(jiān)信:Mistral 就是下一個(gè) OpenAI。
Mistral AI 是法國(guó)的 AI 初創(chuàng)公司,微軟與它的合作,無疑讓微軟在歐洲也建立起了自己的 AI 影響力。
兩家公司的合作,目標(biāo)是彌補(bǔ)基礎(chǔ) AI 研究與實(shí)際解決方案之間的差距。如果在未來建立多年的合作伙伴關(guān)系,Mistral AI 就可以訪問微軟 Azure 的 AI 基礎(chǔ)設(shè)施了。
微軟的加持對(duì) Mistral AI 意味著什么,不言而喻。
不光 Mistral AI 下一代 LLM 的開發(fā)和部署會(huì)大大加速,并且會(huì)開辟出新的商機(jī)。以歐洲為基礎(chǔ),Mistral AI 會(huì)向全球市場(chǎng)擴(kuò)張自己的影響力!
具體來說,微軟和 Mistral AI 之間的合作集中在以下三個(gè)關(guān)鍵領(lǐng)域 ——
超算基礎(chǔ)結(jié)構(gòu):微軟將通過 Azure AI 超算基礎(chǔ)結(jié)構(gòu)支持 Mistral AI,用于 AI 訓(xùn)練和推理工作負(fù)載。
擴(kuò)展市場(chǎng):微軟和 Mistral AI 將通過 Azure AI Studio 中的 MaaS 和 Azure 機(jī)器學(xué)習(xí)模型目錄,向客戶提供 Mistral AI 的高級(jí)模型。
AI 研發(fā):微軟和 Mistral AI 將探索合作,為指定的客戶開發(fā)專有模型,甚至包括歐洲公共部門的工作負(fù)載。
目前,兩家公司還沒有透露財(cái)務(wù)細(xì)節(jié)。
最近,Mistral AI 以近 20 億美元的估值,籌集了 4.5 億歐元,由科技投資者 Andreessen Horowitz 領(lǐng)投。
不過,跟它在美國(guó)的競(jìng)爭(zhēng)者比,Mistral AI 所獲得的資金顯然并不算多。
要知道,OpenAI 僅從微軟就獲得了超過 100 億美元的投資,而 Anthropic 從谷歌和亞馬遜獲得的資金,也高達(dá) 60 億美元。
據(jù)《華爾街日?qǐng)?bào)》報(bào)道,去年 10 月,谷歌承諾向 Anthropic 投資 20 億美元因此,此項(xiàng)合作一出,Mistral AI「歐洲版 OpenAI」的名頭,更加坐實(shí)了。
而對(duì)于微軟來說,這項(xiàng)投資也是好處多多 —— 這是它在歐洲 AI 領(lǐng)域站穩(wěn)腳跟的機(jī)會(huì)。
本來,作為 Azure 云中歐盟服務(wù)器上 OpenAI 模型的唯一提供商,微軟已經(jīng)在歐洲的 AI 競(jìng)賽中處于領(lǐng)先地位。
不過 AI 在歐洲所受的待遇,并不像在美國(guó)那樣備受支持。歐洲許多國(guó)家對(duì)于 AI 的態(tài)度偏保守,他們持的是批判性的態(tài)度,尤其是在數(shù)據(jù)保護(hù)方面。而如果是歐洲服務(wù)器商的歐洲 AI 模型,或許能讓人放心,不失為一種不錯(cuò)的補(bǔ)救措施。
成立 9 個(gè)月的傳奇 AI 初創(chuàng)企業(yè),挑戰(zhàn)硅谷巨頭Mistral 在種子輪融資時(shí)「6 人團(tuán)隊(duì),7 頁(yè) PPT,8 億融資」的故事,值得好好講一講。
2023 年初,還在谷歌工作的 Arthur Mensch,剛剛 30 歲。
一年之后,他離開谷歌創(chuàng)立自己的公司,只用了 9 個(gè)來月的時(shí)間,就已經(jīng)估值 20 億美元!
Mensch 于 2020 年初加入了谷歌,成為 DeepMind 的研究員,他的研究方向是提高 AI 和機(jī)器學(xué)習(xí)系統(tǒng)的效率。那時(shí)他 27 歲。
后來,他和兩位之前一起參與了 Llama 模型研發(fā)的年輕人 Timothée Lacroix 和 Guillaume Lample 一起,決定成立一家公司,通過更加高效的方法構(gòu)建和部署 AI 模型。
他們相信,小團(tuán)隊(duì)能力在靈活性上超越硅谷的大公司,而開源模型就是他們實(shí)現(xiàn)這一目標(biāo)的利器。
雖然已經(jīng)從各路投資者那里籌集了超過 5 億美元,他的公司 Mistral AI 相比于微軟支持的 OpenAI,谷歌,乃至 Anthropic,依然顯得有些「微不足道」。
這些巨頭,以及巨頭重金支持的巨型獨(dú)角獸投入了幾十億美元來構(gòu)建全世界最先進(jìn)的 AI 系統(tǒng)。
但 Mensch 并不擔(dān)心與這些龐然大物競(jìng)爭(zhēng)。
「我們的目標(biāo)是成為 AI 領(lǐng)域中最節(jié)省資本的公司,」Mensch 表示。「這是我們成立的初衷。」
對(duì)于剛剛推出的 Mistral Large 模型,他認(rèn)為,這款模型在執(zhí)行某些推理任務(wù)上能夠與 OpenAI 最先進(jìn)的語(yǔ)言模型 GPT-4 和谷歌的新模型 Gemini Ultra 相匹敵。
Mensch 透露,開發(fā)這款新模型的成本不到 2000 萬歐元(約合 2200 萬美元)。
相比之下,OpenAI 的首席執(zhí)行官 Sam Altman 曾在去年發(fā)布 GPT-4 時(shí)表示,訓(xùn)練他們公司的大型模型的成本接近 1 億美元。
而且隨著他們用行業(yè)內(nèi)最為高效的開源模型不斷震驚業(yè)界,他們也獲得了微軟,英偉達(dá)和 Salesforce 等大公司的背書。
巨頭們也通過現(xiàn)金或者算力的支持,獲取了 Mistral AI 的少量股份。伴隨著 Mistral Large 的發(fā)布,9 個(gè)月前他們用 7 頁(yè) PPT 吹下的牛,已經(jīng)完全兌現(xiàn)了。
這六個(gè)人的團(tuán)隊(duì),是這樣組成的。
Arthur Mensch 在巴黎綜合理工學(xué)院和巴黎高等師范學(xué)院學(xué)習(xí)期間,結(jié)識(shí)了另兩位創(chuàng)始人 ——Timothée Lacroix 和 Guillaume Lample。
兩人都是 Meta AI 團(tuán)隊(duì)的,Lample 甚至領(lǐng)導(dǎo)了 LLaMA 的開發(fā)。
幾個(gè)三十出頭的年輕人,在 LLM 開發(fā)領(lǐng)域已經(jīng)有不少經(jīng)驗(yàn)。
在當(dāng)時(shí),即使在全世界范圍內(nèi),具備構(gòu)建、訓(xùn)練和優(yōu)化 LLM 專業(yè)經(jīng)驗(yàn)的人,也不超過 100 人。
而另外三位,分別是來自法國(guó)巴黎健康初創(chuàng)公司 Alan 的 CEO Jean-Charles Samuelian 和 CTO Charles Gorintin,以及前法國(guó)數(shù)字事務(wù)國(guó)務(wù)秘書 Cédric O。
AI 科學(xué)家,如何創(chuàng)立自己的獨(dú)角獸公司Mensch 個(gè)頭高大,一頭濃密的深色頭發(fā),他既不像典型的科技極客,也不像常見的 CEO。
他的朋友和同事們說,他總是一邊喝啤酒一邊輕松地和朋友開玩笑。
作為一名運(yùn)動(dòng)愛好者,他在 2018 年提交博士論文前的幾個(gè)月,以不到三小時(shí)半的時(shí)間跑完了巴黎馬拉松。
Mensch 從小就在學(xué)術(shù)追求與創(chuàng)業(yè)之間徘徊。他出生在巴黎西郊,母親是物理老師,父親擁有一家小型科技公司。
這位未來的 CEO 畢業(yè)于法國(guó)頂級(jí)的數(shù)學(xué)和機(jī)器學(xué)習(xí)院校。他的導(dǎo)師們將他描述為一個(gè)熱情投入、能夠迅速掌握自己幾乎沒有基礎(chǔ)的項(xiàng)目的學(xué)生。
「我確實(shí)熱愛探索新事物,」Mensch 表示。「我很容易感到厭倦。」
在攻讀博士期間,Mensch 的研究方向是優(yōu)化軟件,分析核磁共振圖像(fMRI)系統(tǒng)的三維大腦圖像,讓軟件能夠處理高達(dá)數(shù)百萬的圖像量。
2020 年底,Mensch 加入了 DeepMind,在那里他參與開發(fā)了大語(yǔ)言模型。
到了 2022 年,他以主要作者的身份發(fā)表了著名的「Chinchilla 論文」。
這項(xiàng)研究重新定義了人們對(duì) AI 模型的大小、訓(xùn)練它所需的數(shù)據(jù)量以及其性能之間關(guān)系的認(rèn)識(shí),被稱為 AI 縮放法則。
隨著 2022 年 AI 競(jìng)賽的升溫,Mensch 對(duì)于大公司的 AI 實(shí)驗(yàn)室減少了關(guān)于大語(yǔ)言模型研究成果的發(fā)表,減少了與研究社區(qū)的分享這一情況表示失望。
ChatGPT 發(fā)布后,谷歌決定加速追趕。
Mensch 所在的團(tuán)隊(duì)從一個(gè) 10 人的小團(tuán)隊(duì)變?yōu)?30 人,最后擴(kuò)充成為了一個(gè) 70 人的大團(tuán)隊(duì)。
「我覺得我在事情變得過于官僚化之前應(yīng)該離開了,」Mensch 說。「我不想在大型科技公司中開發(fā)那些不透明的技術(shù)。」
Mistral 在 2023 年春天向投資者提出的最初方案中,批評(píng)了由美國(guó)公司主導(dǎo)的「正在形成的寡頭壟斷」,這些公司開發(fā)的是專有閉源模型。
對(duì)于 Mensch 和他的合伙人來說,將他們的初始 AI 系統(tǒng)作為開源軟件發(fā)布,允許任何人免費(fèi)使用或修改,這是一個(gè)重要的原則。
這也是吸引開發(fā)者和潛在客戶的一種方式,他們希望每個(gè)人對(duì)自己使用的 AI 有更多的控制權(quán)。
盡管 Mistral 現(xiàn)在的最先進(jìn)模型 Mistral Large 并不開源,但 Mensch 表示:
「在構(gòu)建商業(yè)模式和堅(jiān)持我們的開源價(jià)值觀之間找到一個(gè)平衡點(diǎn)是非常微妙的。我們希望創(chuàng)造新的事物、新的架構(gòu),但是還想向我們的客戶提供一些額外的產(chǎn)品和服務(wù)。」
參考資料:
https://www.wsj.com/tech/ai/the-9-month-old-ai-startup-challenging-silicon-valleys-giants-ee2e4c48?st=htctyj5gooqlcll
https://mistral.ai/news/mistral-large/
https://old.reddit.com/r/LocalLLaMA/comments/1b0o41v/top_10_betrayals_in_anime_history/?continueFlag=e442fb10c2502e2fe0c601afe6270309
本文來自微信公眾號(hào):新智元 (ID:AI_era)
本文鏈接:http://www.www897cc.com/showinfo-45-3500-0.html下一個(gè) OpenAI 來了?Mistral 超大杯模型直逼 GPT-4,93 年創(chuàng)始人 6 人公司被微軟認(rèn)領(lǐng)
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com
上一篇: 大模型 + 智能城市 = 城市通用智能,港科大(廣州)發(fā)布最新“城市基礎(chǔ)大模型 UFM”綜述與方案