摩爾定律原來的解讀是“芯片性能每18個(gè)月翻一倍”,后來由于工藝微縮遇到瓶頸,改變成“24個(gè)月翻一倍”。同時(shí),內(nèi)存墻、IO墻、功耗墻等系一系列短期內(nèi)無法徹底解決的問題,讓數(shù)據(jù)中心從一切以CPU為核心,逐步走向DSA異構(gòu)化,DSA的黃金時(shí)代被開啟。
微服務(wù)和云原生,帶來了Serverless;高性能、低CPU開銷網(wǎng)絡(luò),帶來了Diskless;SoC片內(nèi)總線和DC網(wǎng)絡(luò)融合,讓MemLess成為可能(如CXLFabric),DatacenterasaComputer更近一步……縱觀英偉達(dá)產(chǎn)品的路標(biāo),從DGX-1、DGX-Z的演進(jìn)路線圖發(fā)現(xiàn),很多時(shí)候是在通過堆GPU的方式擴(kuò)展HBM。而HBM是通過高級封裝的方式達(dá)到大帶寬,這意味著我們現(xiàn)在買了很多英偉達(dá)的GPU,實(shí)際上是買了HBM,因此MemLess是下一個(gè)重點(diǎn)方向。
“我今年參加了三次RISC-V相關(guān)的峰會(huì),發(fā)現(xiàn)目前很多從業(yè)者對于RISC-V的印象還是停留在MCU或是偏終端的產(chǎn)品領(lǐng)域。”在8月28日舉辦的第三屆滴水湖中國RISC-V產(chǎn)業(yè)論壇上,蘇州庫瀚信息科技有限公司系統(tǒng)工程副總裁劉亞南重點(diǎn)談了目前整個(gè)數(shù)據(jù)中心領(lǐng)域的需求、趨勢及其中RISC-V架構(gòu)的現(xiàn)狀。
蘇州庫瀚信息科技有限公司系統(tǒng)工程副總裁劉亞南
如今,在摩爾定律瀕臨消亡之際,以生成式人工智能(AIGC)為代表的新型數(shù)字經(jīng)濟(jì),正點(diǎn)燃數(shù)據(jù)中心新一輪軍備競賽。劉亞南認(rèn)為,RISC-V相關(guān)技術(shù)目前在應(yīng)用生態(tài)及算力層面仍在成長階段。“隨著AI大模型等技術(shù)的快速發(fā)展,數(shù)字經(jīng)濟(jì)涌現(xiàn)新場景,對底層軟硬件系統(tǒng)提出新要求,RISC-V開源指令集具備低碳低功耗、模塊化、精簡開放等優(yōu)勢,應(yīng)用生態(tài)較為簡單、算力要求相對低的數(shù)據(jù)中心I/O場景將會(huì)是RISC-V大芯片的首個(gè)爆發(fā)式應(yīng)用。”
據(jù)介紹,庫瀚基于RISC-V指令集自研基礎(chǔ)設(shè)施服務(wù)芯?庫瀚eSPU,實(shí)現(xiàn)存算?I/O聚合設(shè)計(jì),在單顆芯片中實(shí)現(xiàn)PCIeSwitch、智能網(wǎng)卡以及CPU的I/O互聯(lián)能力,精簡存儲(chǔ)、?絡(luò)數(shù)據(jù)I/O通路,優(yōu)化現(xiàn)有以通?CPU為核心的專用服務(wù)器架構(gòu)中不必要的軟硬件系統(tǒng)算力冗余及?昂的基礎(chǔ)設(shè)施投資、運(yùn)維、能耗成本(如存儲(chǔ)服務(wù)器、AI服務(wù)器)。
在系統(tǒng)架構(gòu)上,庫瀚采用三種不同的RISC-V架構(gòu)。控制面采用一些Hybrid的大核和中核,來運(yùn)行一些FDX(軟件定義存儲(chǔ))軟件棧,利用混合的高性能RISC-V做軟件處理。數(shù)據(jù)面(DataPlane)的前端網(wǎng)絡(luò)會(huì)利用400G的總帶寬,做一些PacketBuffer和ProtocolEngine處理。
在SDS存儲(chǔ)服務(wù)器形態(tài)上,一顆eSPU芯片就能替代CPU(x86/ARMARM)、PCIeSwitch、RDMA網(wǎng)卡,網(wǎng)絡(luò)與存儲(chǔ)數(shù)據(jù)面直通,大幅度降低TCO、提升能效比。如下框圖,左邊是傳統(tǒng)的SDS存儲(chǔ)服務(wù)器的典型配置,中間是x86或ARMCPU。而eSPU的存儲(chǔ)服務(wù)器(下圖右)直接通過光模塊輸入后,通過處理直接連到存儲(chǔ)后端。
在Diskless解決方案上,庫瀚方案可以無縫對接開源框架(DPDK)和分布式存儲(chǔ)生態(tài)(DAOS/Ceph/伙伴SDS),實(shí)現(xiàn)遷移最小化、效益最大化。
下圖左邊展示了其方案優(yōu)勢、生態(tài)融合的特點(diǎn),右邊則是大致的集群拓?fù)洹Mㄟ^數(shù)據(jù)中心的以太網(wǎng)交換機(jī),連到下面的存儲(chǔ)集群,存儲(chǔ)集群二次拉遠(yuǎn),形成eSPU存儲(chǔ)節(jié)點(diǎn)。
無狀態(tài)x86節(jié)點(diǎn),負(fù)責(zé)存儲(chǔ)協(xié)議解析、數(shù)據(jù)服務(wù)、空間和Cache管理等。eSPU存儲(chǔ)節(jié)點(diǎn),則承載全局FTL、硬件EC、數(shù)據(jù)縮減等數(shù)據(jù)面功能。
eSPU方案的第三部分就是AIHub。與Diskless類似,eSPUAI服務(wù)器形態(tài),用一顆eSPU芯片替代PCleSwitch、高性能網(wǎng)卡,大幅度降低國產(chǎn)AI服務(wù)器的IO成本(網(wǎng)絡(luò)和存儲(chǔ))。
eSPUAI服務(wù)器對比傳統(tǒng)AI服務(wù)器的競爭優(yōu)勢
PCIeSwitch和RDMA高性能網(wǎng)絡(luò),通過eSPU片上NonBlocking網(wǎng)絡(luò),實(shí)現(xiàn)DataPlane數(shù)據(jù)直通,避免CPU參與的DMA兩次搬運(yùn),提升有效數(shù)據(jù)帶寬和能效比。
據(jù)介紹,庫瀚eSPU可以以100W功耗實(shí)現(xiàn)1000萬IOPS讀寫性能、400GbpsRDMA網(wǎng)絡(luò)帶寬,面向I/O互聯(lián)場景下對性能、功耗有極致追求的智算中?、云數(shù)據(jù)中?及企業(yè)專業(yè)?戶。
同時(shí)劉亞南表示,基于軟硬件融合技術(shù)儲(chǔ)備及設(shè)計(jì)能?,庫瀚支持與客戶開展?度靈活的AI系統(tǒng)、存儲(chǔ)系統(tǒng)、?絡(luò)系統(tǒng)前沿技術(shù)聯(lián)合開發(fā)與定制,以?能效存力、運(yùn)力解決?案幫助客戶成功。
庫瀚科技由高層次海歸人才/前海力士美國存儲(chǔ)解決方案CTO兼高級副總裁楊國華博士攜工業(yè)界精英團(tuán)隊(duì)聯(lián)合創(chuàng)辦,公司從事高能效數(shù)據(jù)I/O管理/存儲(chǔ)/網(wǎng)絡(luò)基礎(chǔ)設(shè)施芯片設(shè)計(jì)及解決方案產(chǎn)業(yè)化,扎根中國本土,技術(shù)創(chuàng)業(yè)團(tuán)隊(duì)專業(yè)范疇覆蓋存儲(chǔ)/網(wǎng)絡(luò)I/O核心芯片及固軟件架構(gòu)設(shè)計(jì)領(lǐng)域,優(yōu)勢領(lǐng)域包括分布式存儲(chǔ)、數(shù)據(jù)庫、AI訓(xùn)練數(shù)據(jù)I/O管理,致力于打造全RISC-V架構(gòu)的低碳高性能數(shù)據(jù)中心IT基礎(chǔ)設(shè)施生態(tài)。
本文鏈接:http://www.www897cc.com/showinfo-27-6935-0.html庫瀚信息:DSA黃金時(shí)代,RISC-V要在數(shù)據(jù)中心應(yīng)用中找準(zhǔn)定位
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com
上一篇: 美光科技人事變動(dòng)!