日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 網絡

馬斯克突然開源Grok:3140億參數巨無霸、免費可商用

來源: 責編: 時間:2024-03-18 17:41:04 228觀看
導讀 馬斯克說到做到:旗下大模型Grok現已開源!代碼和模型權重已上線GitHub。官方信息顯示,此次開源的Grok-1是一個3140億參數的混合專家模型——就是說,這是當前開源模型中參數量大的一個。消息一出,Grok-1

馬斯克說到做到:Nba28資訊網——每日最新資訊28at.com

旗下大模型Grok現已開源!Nba28資訊網——每日最新資訊28at.com

馬斯克突然開源Grok:3140億參數巨無霸、免費可商用Nba28資訊網——每日最新資訊28at.com

代碼和模型權重已上線GitHub。官方信息顯示,此次開源的Grok-1是一個3140億參數的混合專家模型——Nba28資訊網——每日最新資訊28at.com

就是說,這是當前開源模型中參數量大的一個。Nba28資訊網——每日最新資訊28at.com

消息一出,Grok-1的GitHub倉庫已攬獲4.5k標星,并且還在庫庫猛漲。Nba28資訊網——每日最新資訊28at.com

馬斯克突然開源Grok:3140億參數巨無霸、免費可商用Nba28資訊網——每日最新資訊28at.com

表情包們,第一時間被吃瓜群眾們熱傳了起來。Nba28資訊網——每日最新資訊28at.com

馬斯克突然開源Grok:3140億參數巨無霸、免費可商用Nba28資訊網——每日最新資訊28at.com

而ChatGPT本Chat,也現身Grok評論區,開始了和馬斯克新一天的斗嘴……Nba28資訊網——每日最新資訊28at.com

馬斯克突然開源Grok:3140億參數巨無霸、免費可商用Nba28資訊網——每日最新資訊28at.com

那么,話不多說,來看看馬斯克這波為懟OpenAI,究竟拿出了什么真東西。Nba28資訊網——每日最新資訊28at.com

Grok-1說開源就開源Nba28資訊網——每日最新資訊28at.com

此次開源,xAI發布了Grok-1的基本模型權重和網絡架構。Nba28資訊網——每日最新資訊28at.com

具體來說是2023年10月預訓練階段的原始基礎模型,沒有針對任何特定應用(例如對話)進行微調。Nba28資訊網——每日最新資訊28at.com

結構上,Grok-1采用了混合專家(MoE)架構,包含8個專家,總參數量為314B(3140億),處理Token時,其中的兩個專家會被激活,激活參數量為86B。Nba28資訊網——每日最新資訊28at.com

單看這激活的參數量,就已經超過了密集模型Llama 2的70B,對于MoE架構來說,這樣的參數量稱之為龐然大物也毫不為過。Nba28資訊網——每日最新資訊28at.com

馬斯克突然開源Grok:3140億參數巨無霸、免費可商用Nba28資訊網——每日最新資訊28at.com

不過,在GitHub頁面中,官方也提示,由于模型規模較大(314B參數),需要有足夠GPU和內存的機器才能運行Grok。Nba28資訊網——每日最新資訊28at.com

這里MoE層的實現效率并不高,選擇這種實現方式是為了避免驗證模型的正確性時需要自定義內核。Nba28資訊網——每日最新資訊28at.com

模型的權重文件則是以磁力鏈接的形式提供,文件大小接近300GB。Nba28資訊網——每日最新資訊28at.com

馬斯克突然開源Grok:3140億參數巨無霸、免費可商用Nba28資訊網——每日最新資訊28at.com

而且這個“足夠的GPU”,要求不是一般的高——YC上有網友推測,如果是8bit量化的話,可能需要8塊H100。Nba28資訊網——每日最新資訊28at.com

馬斯克突然開源Grok:3140億參數巨無霸、免費可商用Nba28資訊網——每日最新資訊28at.com

除了參數量前所未有,在工程架構上,Grok也是另辟蹊徑——Nba28資訊網——每日最新資訊28at.com

沒有采用常見的Python、PyTorch或Tensorflow,而是選用了Rust編程語言以及深度學習框架新秀JAX。Nba28資訊網——每日最新資訊28at.com

而在官方通告之外,還有許多大佬通過扒代碼等方式揭露了Grok的更多技術細節。Nba28資訊網——每日最新資訊28at.com

比如來自斯坦福大學的Andrew Kean Gao,就針對Grok的技術細節進行了詳細解釋。Nba28資訊網——每日最新資訊28at.com

首先,Grok采用了使用旋轉的embedding方式,而不是固定位置embedding,旋轉位置的embedding大小為 6144,與輸入embedding相同。Nba28資訊網——每日最新資訊28at.com

馬斯克突然開源Grok:3140億參數巨無霸、免費可商用Nba28資訊網——每日最新資訊28at.com

當然,還有更多的參數信息:Nba28資訊網——每日最新資訊28at.com

窗口長度為8192tokens,精度為bf16Nba28資訊網——每日最新資訊28at.com

Tokenizer vocab大小為131072(2^17),與GPT-4接近;Nba28資訊網——每日最新資訊28at.com

embedding大小為6144(48 x 128);Nba28資訊網——每日最新資訊28at.com

Transformer層數為64,每層都有一個解碼器層,包含多頭注意力塊和密集塊;Nba28資訊網——每日最新資訊28at.com

key value大小為128;Nba28資訊網——每日最新資訊28at.com

多頭注意力塊中,有48 個頭用于查詢,8 個用于KV,KV 大小為 128;Nba28資訊網——每日最新資訊28at.com

密集塊(密集前饋塊)擴展因子為8,隱藏層大小為32768。Nba28資訊網——每日最新資訊28at.com

馬斯克突然開源Grok:3140億參數巨無霸、免費可商用Nba28資訊網——每日最新資訊28at.com

除了Gao,還有英偉達AI科學家Ethan He(何宜暉)指出,在專家系統的處理方面,Grok也與另一知名開源MoE模型Mixtral不同——Nba28資訊網——每日最新資訊28at.com

Grok對全部的8個專家都應用了softmax函數,然后從中選擇top2專家,而Mixtral則是先選定專家再應用softmax函數。Nba28資訊網——每日最新資訊28at.com

馬斯克突然開源Grok:3140億參數巨無霸、免費可商用Nba28資訊網——每日最新資訊28at.com

而至于有沒有更多細節,可能要看官方會不會發布進一步的消息了。Nba28資訊網——每日最新資訊28at.com

另外,值得一提的是,Grok-1采用的是Apache 2.0 license,也就是說,商用友好。Nba28資訊網——每日最新資訊28at.com

為懟OpenAI怒而OpenNba28資訊網——每日最新資訊28at.com

大家伙知道,馬斯克因為OpenAI不Open,已經向舊金山高等法院提起訴訟,正式把OpenAI給告了。Nba28資訊網——每日最新資訊28at.com

不過當時馬斯克自己搞的Grok也并沒有開源,還只面向??的付費用戶開放,難免被質疑雙標。Nba28資訊網——每日最新資訊28at.com

大概是為了堵上這個bug,馬斯克在上周宣布:Nba28資訊網——每日最新資訊28at.com

本周,xAI將開源Grok。Nba28資訊網——每日最新資訊28at.com

馬斯克突然開源Grok:3140億參數巨無霸、免費可商用Nba28資訊網——每日最新資訊28at.com

雖然時間點上似乎又是馬斯克一貫的遲到風格,但xAI的這波Open如今看來確實不是口嗨,還是給了網友們一些小小的震撼。Nba28資訊網——每日最新資訊28at.com

馬斯克突然開源Grok:3140億參數巨無霸、免費可商用Nba28資訊網——每日最新資訊28at.com

有xAI新晉員工感慨說:Nba28資訊網——每日最新資訊28at.com

這將是激動人心的一年,快系好安全帶吧。Nba28資訊網——每日最新資訊28at.com

馬斯克突然開源Grok:3140億參數巨無霸、免費可商用Nba28資訊網——每日最新資訊28at.com

有人已經期待起Grok作為一個開源模型,進一步攪動大模型競爭的這一池水。Nba28資訊網——每日最新資訊28at.com

不過,也并不是每個人都買馬斯克的賬:Nba28資訊網——每日最新資訊28at.com

馬斯克突然開源Grok:3140億參數巨無霸、免費可商用Nba28資訊網——每日最新資訊28at.com

不過說歸說,多線并進的馬斯克,近大事不止開源Grok這一件。Nba28資訊網——每日最新資訊28at.com

作為多公司、多業務的時間管理大師,馬斯克旗下,特斯拉剛剛全線推出了端到端純視覺的自動駕駛系統FSD V12,所有北美車主用戶,都OTA更新升級,可以實現所有道路場景的任意點到點AI駕駛。Nba28資訊網——每日最新資訊28at.com

SpaceX則完成了第三次星艦發射,雖然后功敗垂成,但又史無前例地邁進了一大步。Nba28資訊網——每日最新資訊28at.com

推特則開源了推薦算法,然后迎來了一波自然流量新高峰。Nba28資訊網——每日最新資訊28at.com

別人都是 you can you up, no can no bb…馬斯克不一樣,bb up不選擇,邊喊邊干,還都干成了。Nba28資訊網——每日最新資訊28at.com

馬斯克突然開源Grok:3140億參數巨無霸、免費可商用Nba28資訊網——每日最新資訊28at.com

參考鏈接:Nba28資訊網——每日最新資訊28at.com

[1]https://github.com/xai-org/grok-1Nba28資訊網——每日最新資訊28at.com

[2]https://x.ai/blog/grok-osNba28資訊網——每日最新資訊28at.com


文章出處:量子位

本文鏈接:http://www.www897cc.com/showinfo-17-77458-0.html馬斯克突然開源Grok:3140億參數巨無霸、免費可商用

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 北大歌手演唱韓語版《知否知否》 網友笑瘋:如同念咒語

下一篇: 三只羊對帶貨315點名梅菜扣肉致歉:已先行墊付退款

標簽:
  • 熱門焦點
  • K60 Pro官方停產 第三方瞬間漲價

    雖然沒有官方宣布,但Redmi的一些高管也已經透露了,Redmi K60 Pro已經停產且不會補貨,這一切都是為了即將到來的K60 Ultra鋪路,屬于廠家的正常操作。但有意思的是該機在停產之后
  • K6:面向開發人員的現代負載測試工具

    K6 是一個開源負載測試工具,可以輕松編寫、運行和分析性能測試。它建立在 Go 和 JavaScript 之上,它被設計為功能強大、可擴展且易于使用。k6 可用于測試各種應用程序,包括 Web
  • 2023 年的 Node.js 生態系統

    隨著技術的不斷演進和創新,Node.js 在 2023 年達到了一個新的高度。Node.js 擁有一個龐大的生態系統,可以幫助開發人員更快地實現復雜的應用。本文就來看看 Node.js 最新的生
  • 重估百度丨“晚熟”的百度云,能等到春天嗎?

    ©自象限原創作者|程心排版|王喻可2016年7月13日,百度云計算戰略發布會在北京舉行,宣告著百度智能云的正式啟程。彼時的會場座無虛席,甚至排隊排到了門外,在場的所有人幾乎都
  • 梁柱接棒兩年,騰訊音樂闖出新路子

    文丨田靜 出品丨牛刀財經(niudaocaijing)7月5日,企鵝FM發布官方公告稱由于業務調整,將于9月6日正式停止運營,這意味著騰訊音樂長音頻業務走向消亡。騰訊在長音頻領域還在摸索。為
  • 得物寵物生意「狂飆」,發力“它經濟”

    作者|花花小萌主近日,得物宣布正式上線寵物鑒別,通過得物App內的“在線鑒別”,可找到鑒別寵物的選項。通過上傳自家寵物的部位細節,就能收獲擁有專業資質認證的得物鑒
  • 網紅炒股不為了賺錢,那就是耍流氓!

    來源:首席商業評論6月26日高調宣布入市,網絡名嘴大v胡錫進居然進軍了股市。在一次財經媒體峰會上,幾個財經圈媒體大佬就“胡錫進炒股是否知道認真報道”展開討論。有
  • Counterpoint :OPPO雙旗艦戰略全面落地 高端產品銷量增長22%

    2023年6月30日,全球行業分析機構Counterpoint Research發布的《中國智能手機高端市場白皮書》顯示,中國智能手機品牌正在尋求高質量發展,中國高端智能
  • 由于成本持續增加,筆記本產品價格預計將明顯上漲

    根據知情人士透露,由于材料、物流等成本持續增加,筆記本產品價格預計將在2021年下半年有明顯上漲。進入6月下旬以來,全球半導體芯片缺貨情況加劇,顯卡、處理器
Top 主站蜘蛛池模板: 杭州市| 井陉县| 长治市| 辽宁省| 潼关县| 漾濞| 白沙| 宽城| 凤山县| 明水县| 灵台县| 漳州市| 汶川县| 麻阳| 手游| 崇礼县| 习水县| 彭阳县| 太谷县| 北流市| 清苑县| 辽宁省| 灌南县| 西乌珠穆沁旗| 邹平县| 丹东市| 苗栗市| 曲阳县| 甘谷县| 龙口市| 丹阳市| 麻阳| 田林县| 阳泉市| 崇左市| 扎兰屯市| 措勤县| 呼玛县| 益阳市| 广宗县| 安仁县|