11月1日,在2023云棲大會上,阿里巴巴平頭哥發布旗下首顆SSD主控芯片鎮岳510。
該芯片為云計算場景深度定制,實現4μs超低時延,比業界主流降低30%以上 ,誤碼率低至10^-18,比業內標桿領先一個數量級。
鎮岳510將率先在阿里云數據中心部署,可應用于AI、在線分析、在線交易、大數據分析、高性能數據庫等業務場景。
為何要自研SSD主控芯片?云計算對存力提出了更高的需求
云計算符合馮諾依曼架構:數據從存儲設備中取出,通過網絡傳送到計算單元,運算結果通過網絡傳輸至存儲設備中保存。
算力、網力、存力,共同構筑了云計算的基礎。
為了滿足云上業務的迅猛發展,以CPU為代表的通用算力,以GPU、NPU為代表的的AI算力,以指數級迅速增加;而網絡也從25GE、100GE、200GE快速演進,并將進入400GE、800GE時代。
以SSD為代表的存力,同樣面臨了新的挑戰和訴求。
●極致的性能。
SSD是計算數據的來源與結果數據的目的地,其讀寫吞吐速率的高低,將制約整個計算系統的性能。
●復雜負載下的穩定時延。
時延是SSD從收到命令到返回命令響應的耗時。云上為了提高并發能力,業務請求通常會被拆分為多筆子請求分散到眾多SSD并發執行。任何一塊SSD的時延發生抖動,都會造成整個業務請求的延遲。
●更優的TCO。
綠色、減碳是云數據中心的一貫追求。如何提升能效,以更低的功耗,提供更高的性能,是SSD的重要挑戰。
●更高的存儲密度。
提高數據中心資源利用率是云的核心訴求。提高SSD的存儲密度,在單塊SSD內提供更大的存儲容量,可以有效減少所需部署的服務器數量、交換機/路由器數量。
隨著云技術進入深水區,云開始與底層芯片全方位融合聯合設計,提供更好的用戶體驗。
第一:消除SSD接口稅。通過存儲軟件與NAND特性完美契合,達到數據排布的優化,后臺操作的小化。
第二:全鏈路QoS優化。延遲敏感型與帶寬敏感型IO實現了精細化區分處理,提升延遲敏感型IO的SLA。
第三:智能卸載。可靠性計算卸載至SSD,實現全路徑存儲語義校驗,同時也減輕了服務器主機算力開銷。
隨著這一系列云計算對存力提出的新的需求的出現,也使得對于SSD主控芯片的能力的要求也越來越高。基于此,平頭哥選擇自研了更符合“云計算需求”的SSD主控芯片鎮岳510。
鎮岳510發布:內置玄鐵910 RISC-V多核CPU,誤碼率領先業界標桿一個數量級
和CPU一樣,SSD是計算機系統的核心部件,主控芯片作為SSD的「大腦」,負責主機交互、協議解析與執行、數據讀寫、數據糾錯、數據管理等核心任務,不僅直接影響整個系統的性能,還保障了業務的安全與穩定。
鎮岳510則是平頭哥旗下第一顆SSD主控芯片。
鎮岳510支持先進的PCIe 5.0接口,支持DDR 5.0技術,內置玄鐵910 RISC-V多核CPU,采用平頭哥自研緊耦合芯片架構,對SSD任務進行高度抽象,可固化任務硬化為加速算子以提升性能,FTL關鍵任務則運行于玄鐵910CPU以保持靈活性。
鎮岳510每秒可處理高達340萬筆IO,一枚鎮岳510的性能,相當于1萬塊高性能HDD的性能總和。
此外鎮岳510擁有極高的能效比,每瓦功耗可提供42萬筆IO訪問
。以一個部署了10萬塊SSD的數據中心為例,相比目前主流的PCIe 4.0SSD,鎮岳510在相同的性能下,僅主控芯片即每年節省260萬度電.
按照一度電排放0.785千克二氧化碳計算,每年可減少二氧化碳排放2千噸。
鎮岳510內置創新的IO自動化處理機制,前端IO解析與處理,由專用硬件模塊自動完成,實現了業界領先的超低的時延(4μs),可以帶給應用極佳的體驗,比業界SSD降低30%以上。
不僅如此,鎮岳510芯片內實現了IO/SYS/GC的全鏈路隔離,極大的降低這些任務之間的相互干擾,提供了既低又穩定的時延表現。
鎮岳510內置了平頭哥自研的高性能LDPC糾錯算法,編碼效率逼近香農極限,同時ErrorFlow相比業內SSD更優一個數量級;
同時借助平頭哥自研閃存電壓預測算法,可以在各種閃存的不同工況、壽命、溫度等條件下,準確預測閃存電壓漂移,進一步降低LDPC解碼器的輸入誤碼率。
它實現了低至10^-18的UBER,相當于每讀取百億億筆數據,才可能有一筆數據糾錯失敗。
鎮岳510做了哪些定制?
鎮岳510不僅具備更強存力、更高可靠等特點,還通過為云定制,帶來更優秀的存儲體驗。
在傳統的系統方案中,SSD與存儲系統分離設計。
SSD負責底層閃存數據排布,但無存儲語義而無法達到佳排布;SSD負責后臺任務,但無法判斷佳啟停時機;而存儲系統有存儲語義卻無法排布閃存數據,有佳時機卻無法啟停SSD后臺任務。
上下的割裂給整個存儲系統的性能與壽命帶來了額外消耗,這被稱為“SSD接口稅”。
因此ZNS協議被發展出來,通過將盤內FTL層上移至存儲系統,達到了存儲系統與閃存特性的完美匹配,消減了“SSD接口稅”。
2021年5月,ZNS協議被收入NVMe規范2.0版本中,并得到了SPDK、Linux以及各設備商的支持。
鎮岳510完美實現了ZNS協議,通過靈活的硬件表項加速保持了高IO性能,而Zone分區狀態則交由玄鐵910CPU維護,保留了對新協議的靈活性。
此外,鎮岳510定制了Last Sector 隨機寫功能,實現了小報文的多次反復下盤,簡化了ZNS的應用難度。
數據請求可以分為帶寬敏感型與時延敏感型,不同的請求應予以不同的處理策略,才能達到業務佳SLA。
NVMe規范中制定了以隊列為粒度的標準SQ調度機制,但其靈活性較差,對于業務種類復雜、追求靈活可配的云存儲系統來說,它并不是佳選擇。
鎮岳510在支持NVMe標準的SQ調度機制的同時,額外定制了基于IO粒度的優先級調度機制,允許系統按IO打標,優先級種類多達8級,結合云存儲系統,能夠更好的保障延遲敏感型業務的服務質量。
云存儲系統的完整數據鏈路 ,從計算端開始,通過網絡到存儲服務器,再通過內部互聯到達SSD。
為了保障數據的高可靠,全鏈路應采用語義一致的完整性校驗。
但NVMe規范只規定了以Sector為單位按照T10 DIF/DIX的校驗機制,與存儲系統的語義并不相同,因此SSD的校驗與存儲系統的校驗產生了差異。
鎮岳510以IO為粒度,遵循上層存儲語義進行校驗,補齊了整個存儲系統的數據鏈路校驗的后一環。
不僅如此,鎮岳510還支持以存儲語義對內部數據進行后臺巡檢,而無需再讀出至服務器,節省了寶貴的PCIe帶寬、服務器內存帶寬與CPU算力。
據介紹,鎮岳510將率先在阿里云數據中心部署,可應用于AI、在線分析、在線交易、大數據分析、高性能數據庫等業務場景。
得益于基于鎮岳510的SSD與阿里云數據存儲底座——飛天盤古平臺的軟硬協同設計,提升了數據可靠性、SLA以及存儲效能,構建了從芯片到系統的全棧自研分布式存儲。
此外,鎮岳510提供的ZNS能力與飛天盤古存儲引擎協同,增強了云存儲的靈活性,推進了數據中心往軟件定義閃存方向發展。
小結:
過去5年,平頭哥已推出多款算力芯片,其云原生處理器芯片倚天710已在阿里云數據中心規模化部署,算力性價比提升超30%,已服務數千家電商、短視頻、在線教育等領域客戶。
此次鎮岳510的問世,意味著平頭哥的芯片產品家族從算力擴展到了存力領域,進一步為云計算行業提供高性價比的技術底座。
平頭哥產品總監周冠鋒也表示:“算力、網力、存力共同構筑了云計算的基礎,算力和網絡在過去幾年已實現快速演進,以SSD為代表的存儲技術也必須與云計算軟件系統融合設計,為企業用戶帶來更優秀的存儲體驗。”
本文鏈接:http://www.www897cc.com/showinfo-24-16459-0.html阿里平頭哥發布首顆SSD主控鎮岳510:誤碼率領先業界標桿1個數量級
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com