當前位置：首頁 > 科技 > 網絡

馬斯克突然開源Grok：3140億參數巨無霸、免費可商用

來源：責編：時間：2024-03-18 17:41:04 228觀看

導讀馬斯克說到做到：旗下大模型Grok現已開源！代碼和模型權重已上線GitHub。官方信息顯示，此次開源的Grok-1是一個3140億參數的混合專家模型——就是說，這是當前開源模型中參數量大的一個。消息一出，Grok-1

馬斯克說到做到：

旗下大模型Grok現已開源！

代碼和模型權重已上線GitHub。官方信息顯示，此次開源的Grok-1是一個3140億參數的混合專家模型——

就是說，這是當前開源模型中參數量大的一個。

消息一出，Grok-1的GitHub倉庫已攬獲4.5k標星，并且還在庫庫猛漲。

馬斯克突然開源Grok：3140億參數巨無霸、免費可商用

表情包們，第一時間被吃瓜群眾們熱傳了起來。

馬斯克突然開源Grok：3140億參數巨無霸、免費可商用

而ChatGPT本Chat，也現身Grok評論區，開始了和馬斯克新一天的斗嘴……

馬斯克突然開源Grok：3140億參數巨無霸、免費可商用

那么，話不多說，來看看馬斯克這波為懟OpenAI，究竟拿出了什么真東西。

Grok-1說開源就開源

此次開源，xAI發布了Grok-1的基本模型權重和網絡架構。

具體來說是2023年10月預訓練階段的原始基礎模型，沒有針對任何特定應用（例如對話）進行微調。

結構上，Grok-1采用了混合專家（MoE）架構，包含8個專家，總參數量為314B（3140億），處理Token時，其中的兩個專家會被激活，激活參數量為86B。

單看這激活的參數量，就已經超過了密集模型Llama 2的70B，對于MoE架構來說，這樣的參數量稱之為龐然大物也毫不為過。

馬斯克突然開源Grok：3140億參數巨無霸、免費可商用

不過，在GitHub頁面中，官方也提示，由于模型規模較大（314B參數），需要有足夠GPU和內存的機器才能運行Grok。

這里MoE層的實現效率并不高，選擇這種實現方式是為了避免驗證模型的正確性時需要自定義內核。

模型的權重文件則是以磁力鏈接的形式提供，文件大小接近300GB。

馬斯克突然開源Grok：3140億參數巨無霸、免費可商用

而且這個“足夠的GPU”，要求不是一般的高——YC上有網友推測，如果是8bit量化的話，可能需要8塊H100。

馬斯克突然開源Grok：3140億參數巨無霸、免費可商用

除了參數量前所未有，在工程架構上，Grok也是另辟蹊徑——

沒有采用常見的Python、PyTorch或Tensorflow，而是選用了Rust編程語言以及深度學習框架新秀JAX。

而在官方通告之外，還有許多大佬通過扒代碼等方式揭露了Grok的更多技術細節。

比如來自斯坦福大學的Andrew Kean Gao，就針對Grok的技術細節進行了詳細解釋。

首先，Grok采用了使用旋轉的embedding方式，而不是固定位置embedding，旋轉位置的embedding大小為 6144，與輸入embedding相同。

馬斯克突然開源Grok：3140億參數巨無霸、免費可商用

當然，還有更多的參數信息：

窗口長度為8192tokens，精度為bf16

Tokenizer vocab大小為131072（2^17），與GPT-4接近；

embedding大小為6144（48 x 128）；

Transformer層數為64，每層都有一個解碼器層，包含多頭注意力塊和密集塊；

key value大小為128；

多頭注意力塊中，有48 個頭用于查詢，8 個用于KV，KV 大小為 128；

密集塊（密集前饋塊）擴展因子為8，隱藏層大小為32768。

馬斯克突然開源Grok：3140億參數巨無霸、免費可商用

除了Gao，還有英偉達AI科學家Ethan He（何宜暉）指出，在專家系統的處理方面，Grok也與另一知名開源MoE模型Mixtral不同——

Grok對全部的8個專家都應用了softmax函數，然后從中選擇top2專家，而Mixtral則是先選定專家再應用softmax函數。

馬斯克突然開源Grok：3140億參數巨無霸、免費可商用

而至于有沒有更多細節，可能要看官方會不會發布進一步的消息了。

另外，值得一提的是，Grok-1采用的是Apache 2.0 license，也就是說，商用友好。

為懟OpenAI怒而Open

大家伙知道，馬斯克因為OpenAI不Open，已經向舊金山高等法院提起訴訟，正式把OpenAI給告了。

不過當時馬斯克自己搞的Grok也并沒有開源，還只面向??的付費用戶開放，難免被質疑雙標。

大概是為了堵上這個bug，馬斯克在上周宣布：

本周，xAI將開源Grok。

馬斯克突然開源Grok：3140億參數巨無霸、免費可商用

雖然時間點上似乎又是馬斯克一貫的遲到風格，但xAI的這波Open如今看來確實不是口嗨，還是給了網友們一些小小的震撼。

馬斯克突然開源Grok：3140億參數巨無霸、免費可商用

有xAI新晉員工感慨說：

這將是激動人心的一年，快系好安全帶吧。

馬斯克突然開源Grok：3140億參數巨無霸、免費可商用

有人已經期待起Grok作為一個開源模型，進一步攪動大模型競爭的這一池水。

不過，也并不是每個人都買馬斯克的賬：

馬斯克突然開源Grok：3140億參數巨無霸、免費可商用

不過說歸說，多線并進的馬斯克，近大事不止開源Grok這一件。

作為多公司、多業務的時間管理大師，馬斯克旗下，特斯拉剛剛全線推出了端到端純視覺的自動駕駛系統FSD V12，所有北美車主用戶，都OTA更新升級，可以實現所有道路場景的任意點到點AI駕駛。

SpaceX則完成了第三次星艦發射，雖然后功敗垂成，但又史無前例地邁進了一大步。

推特則開源了推薦算法，然后迎來了一波自然流量新高峰。

別人都是 you can you up, no can no bb…馬斯克不一樣，bb up不選擇，邊喊邊干，還都干成了。

馬斯克突然開源Grok：3140億參數巨無霸、免費可商用

參考鏈接：

[1]https://github.com/xai-org/grok-1

[2]https://x.ai/blog/grok-os

文章出處：量子位

本文鏈接：http://www.www897cc.com/showinfo-17-77458-0.html馬斯克突然開源Grok：3140億參數巨無霸、免費可商用

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：北大歌手演唱韓語版《知否知否》網友笑瘋：如同念咒語

下一篇：三只羊對帶貨315點名梅菜扣肉致歉：已先行墊付退款

標簽：

熱門焦點

K60 Pro官方停產第三方瞬間漲價

雖然沒有官方宣布，但Redmi的一些高管也已經透露了，Redmi K60 Pro已經停產且不會補貨，這一切都是為了即將到來的K60 Ultra鋪路，屬于廠家的正常操作。但有意思的是該機在停產之后
K6：面向開發人員的現代負載測試工具

K6 是一個開源負載測試工具，可以輕松編寫、運行和分析性能測試。它建立在 Go 和 JavaScript 之上，它被設計為功能強大、可擴展且易于使用。k6 可用于測試各種應用程序，包括 Web
2023 年的 Node.js 生態系統

隨著技術的不斷演進和創新，Node.js 在 2023 年達到了一個新的高度。Node.js 擁有一個龐大的生態系統，可以幫助開發人員更快地實現復雜的應用。本文就來看看 Node.js 最新的生
梁柱接棒兩年，騰訊音樂闖出新路子

文丨田靜出品丨牛刀財經（niudaocaijing）7月5日，企鵝FM發布官方公告稱由于業務調整，將于9月6日正式停止運營，這意味著騰訊音樂長音頻業務走向消亡。騰訊在長音頻領域還在摸索。為
得物寵物生意「狂飆」，發力“它經濟”

作者｜花花小萌主近日，得物宣布正式上線寵物鑒別，通過得物App內的“在線鑒別”，可找到鑒別寵物的選項。通過上傳自家寵物的部位細節，就能收獲擁有專業資質認證的得物鑒
網紅炒股不為了賺錢，那就是耍流氓！

來源：首席商業評論6月26日高調宣布入市，網絡名嘴大v胡錫進居然進軍了股市。在一次財經媒體峰會上，幾個財經圈媒體大佬就“胡錫進炒股是否知道認真報道”展開討論。有
Counterpoint ：OPPO雙旗艦戰略全面落地高端產品銷量增長22%

2023年6月30日，全球行業分析機構Counterpoint Research發布的《中國智能手機高端市場白皮書》顯示，中國智能手機品牌正在尋求高質量發展，中國高端智能
由于成本持續增加，筆記本產品價格預計將明顯上漲

根據知情人士透露，由于材料、物流等成本持續增加，筆記本產品價格預計將在2021年下半年有明顯上漲。進入6月下旬以來，全球半導體芯片缺貨情況加劇，顯卡、處理器

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

馬斯克突然開源Grok：3140億參數巨無霸、免費可商用

K60 Pro官方停產第三方瞬間漲價

K6：面向開發人員的現代負載測試工具

2023 年的 Node.js 生態系統

重估百度丨“晚熟”的百度云，能等到春天嗎？

梁柱接棒兩年，騰訊音樂闖出新路子

得物寵物生意「狂飆」，發力“它經濟”

網紅炒股不為了賺錢，那就是耍流氓！

Counterpoint ：OPPO雙旗艦戰略全面落地高端產品銷量增長22%

由于成本持續增加，筆記本產品價格預計將明顯上漲

最新推薦

猜你喜歡

熱門推薦

相關資訊