日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當(dāng)前位置:首頁(yè) > 科技  > 網(wǎng)絡(luò)

馬斯克Colossus AI超算集群內(nèi)部首曝:足足10萬(wàn)英偉達(dá)H100 GPU

來(lái)源: 責(zé)編: 時(shí)間:2024-10-30 15:57:24 112觀看
導(dǎo)讀 10月29日消息,YouTube視頻博主 ServeTheHome 首次曝光了埃隆·馬斯克 (Elon Musk)旗下人工智能企業(yè)xAI的Colossus AI 超級(jí)計(jì)算機(jī)集群,其集成了100000個(gè)英偉達(dá)(NVIDIA)H100 GPU,號(hào)稱是目前全球強(qiáng)大的AI超級(jí)

10月29日消息,YouTube視頻博主 ServeTheHome 首次曝光了埃隆·馬斯克 (Elon Musk)旗下人工智能企業(yè)xAI的Colossus  AI 超級(jí)計(jì)算機(jī)集群,其集成了100000個(gè)英偉達(dá)(NVIDIA)H100 GPU,號(hào)稱是目前全球強(qiáng)大的AI超級(jí)計(jì)算機(jī)集群。FAd28資訊網(wǎng)——每日最新資訊28at.com

馬斯克Colossus AI超算集群內(nèi)部首曝:足足10萬(wàn)英偉達(dá)H100 GPUFAd28資訊網(wǎng)——每日最新資訊28at.com

早在今年7月下旬,馬斯克就在“X”平臺(tái)上宣布,自己已經(jīng)啟動(dòng)了“世界上強(qiáng)大的 AI 集群”。這座AI集群從開始建設(shè)到完成組裝僅花了122天就完成了,目前已經(jīng)上線運(yùn)行了約3個(gè)月。FAd28資訊網(wǎng)——每日最新資訊28at.com

根據(jù)ServeTheHome曝光的信息來(lái)看,龐大的Colossus  AI超級(jí)計(jì)算機(jī)集群采用的是超威電腦(Supermicro)的服務(wù)器,其基于NVIDIA HGX H100方案,每個(gè)服務(wù)器中擁有8個(gè)H100 GPU,封裝在 Supermicro 的 4U 通用 GPU 液冷系統(tǒng)內(nèi),為每個(gè) GPU 提供簡(jiǎn)單的熱插拔液冷。FAd28資訊網(wǎng)——每日最新資訊28at.com

這些服務(wù)器裝載在機(jī)架內(nèi),每個(gè)機(jī)架可容納 8 臺(tái)服務(wù)器,也就是說(shuō)每個(gè)機(jī)架內(nèi)有 64 個(gè) GPU。1U 歧管夾在每個(gè) HGX H100 之間,提供服務(wù)器所需的液體冷卻。每個(gè)機(jī)架的底部是另一個(gè) Supermicro 4U 單元,這次配備了冗余泵系統(tǒng)和機(jī)架監(jiān)控系統(tǒng)。FAd28資訊網(wǎng)——每日最新資訊28at.com

馬斯克Colossus AI超算集群內(nèi)部首曝:足足10萬(wàn)英偉達(dá)H100 GPU△四組 xAI 的 HGX H100 服務(wù)器機(jī)架,每組可容納八臺(tái)服務(wù)器。(圖片來(lái)源:ServeTheHome)FAd28資訊網(wǎng)——每日最新資訊28at.com

馬斯克Colossus AI超算集群內(nèi)部首曝:足足10萬(wàn)英偉達(dá)H100 GPU△xAI Colossus GPU 服務(wù)器的后部訪問(wèn)。每臺(tái)服務(wù)器有 9 根以太網(wǎng)電纜,每臺(tái)服務(wù)器有 4 個(gè)電源。電源和液體冷卻軟管也可見。(圖片來(lái)源:ServeTheHome)FAd28資訊網(wǎng)——每日最新資訊28at.com

這些機(jī)架以 8 個(gè)為一組配對(duì),每個(gè)陣列有 512 個(gè) GPU。每臺(tái)服務(wù)器都有四個(gè)冗余電源,GPU 機(jī)架的后部露出三相電源、以太網(wǎng)交換機(jī)和一個(gè)提供所有液體冷卻的機(jī)架大小的歧管。FAd28資訊網(wǎng)——每日最新資訊28at.com

Colossus 集群中有超過(guò) 1500 個(gè) GPU 機(jī)架,或近 200 個(gè)機(jī)架陣列。據(jù)英偉達(dá)首席執(zhí)行官黃仁勛稱,這 200 個(gè)陣列的 GPU 僅用了三周時(shí)間就完成了安裝。FAd28資訊網(wǎng)——每日最新資訊28at.com

由于 AI 超級(jí)集群不斷訓(xùn)練模型的高帶寬要求,xAI 在其網(wǎng)絡(luò)互連性方面提供了超大的帶寬。FAd28資訊網(wǎng)——每日最新資訊28at.com

目前每個(gè)顯卡都有一個(gè) 400GbE 的專用 NIC(網(wǎng)絡(luò)接口控制器),每臺(tái)服務(wù)器還有一個(gè)額外的 400Gb NIC。這意味著每臺(tái) HGX H100 服務(wù)器都有每秒 3.6 TB 的以太網(wǎng)速率。整個(gè)集群都在以太網(wǎng)上運(yùn)行,而不是 InfiniBand 或其他在超級(jí)計(jì)算領(lǐng)域標(biāo)配的連接。FAd28資訊網(wǎng)——每日最新資訊28at.com

馬斯克Colossus AI超算集群內(nèi)部首曝:足足10萬(wàn)英偉達(dá)H100 GPU△仰望一大片的黃色以太網(wǎng)電纜,將 xAI Colossus 集群連接在一起。多層過(guò)寬的電纜線路嵌入天花板中。(圖片來(lái)源:ServeTheHome)FAd28資訊網(wǎng)——每日最新資訊28at.com

馬斯克Colossus AI超算集群內(nèi)部首曝:足足10萬(wàn)英偉達(dá)H100 GPU△xAI 的 Colossus CPU 計(jì)算服務(wù)器,看起來(lái)與該站點(diǎn)中也廣泛使用的 Supermicro 存儲(chǔ)服務(wù)器完全相同。(圖片來(lái)源:ServeTheHome)FAd28資訊網(wǎng)——每日最新資訊28at.com

當(dāng)然,像 xAI 旗下Grok 3 聊天機(jī)器人這樣基于訓(xùn)練 AI 模型的超級(jí)計(jì)算機(jī)需要的不僅僅是 GPU 才能運(yùn)行。FAd28資訊網(wǎng)——每日最新資訊28at.com

Colossus集群當(dāng)中的存儲(chǔ)和 CPU 計(jì)算機(jī)服務(wù)器的詳細(xì)信息仍未曝光,不過(guò)這些服務(wù)器也大多采用 Supermicro 機(jī)箱。一波又一波的 NVMe 轉(zhuǎn)發(fā) 1U 服務(wù)器內(nèi)部帶有某種 x86 平臺(tái) CPU,可容納存儲(chǔ)和 CPU 計(jì)算,還具有后入式液體冷卻功能。FAd28資訊網(wǎng)——每日最新資訊28at.com

另外,在該超級(jí)計(jì)算機(jī)集群的外面,還可以看到一些大量捆綁的特斯拉 Megapack 電池(每個(gè)多可容納 3.9 MWh)。FAd28資訊網(wǎng)——每日最新資訊28at.com

該電池陣列的是為了應(yīng)對(duì)突發(fā)停電的臨時(shí)備用電源,其可以在毫秒之間快速提供供電,相比柴油發(fā)電機(jī)反應(yīng)要快得多,可以使得有足夠時(shí)間去啟動(dòng)其他備用電源。FAd28資訊網(wǎng)——每日最新資訊28at.com


文章出處:芯智訊

本文鏈接:http://www.www897cc.com/showinfo-17-125045-0.html馬斯克Colossus AI超算集群內(nèi)部首曝:足足10萬(wàn)英偉達(dá)H100 GPU

聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com

上一篇: 別再隨意扔掉!二手家電紙箱竟賣到數(shù)百元:買家究竟是誰(shuí)

下一篇: 菜鳥全面接入京東非自營(yíng)平臺(tái):提供電商快遞和大件服務(wù)

標(biāo)簽:
  • 熱門焦點(diǎn)
Top 主站蜘蛛池模板: 石渠县| 淮阳县| 亳州市| 肥城市| 黄山市| 武乡县| 汝南县| 靖宇县| 客服| 克什克腾旗| 南安市| 改则县| 蒙城县| 丹江口市| 苏州市| 武穴市| 嵩明县| 聂荣县| 涿州市| 兴和县| 延寿县| 淳安县| 雷波县| 潼南县| 无棣县| 诸暨市| 托克托县| 洛南县| 昭通市| 邵阳市| 望都县| 子洲县| 开平市| 许昌县| 灵石县| 双牌县| 霸州市| 花垣县| 邢台县| 无锡市| 成都市|