8月10日消息,壁仞科技在上海發布了首款通用GPU芯片BR100,其INT8算力達2048 TOPS,BF16算力達1024 TFLOPS,TF32+算力達512 TFLOPS,FP32算力達256 TFLOPS。
除了廣受關注的BR100通用GPU芯片之外,壁仞科技還正式發布了自主原創架構——壁立仞、創造全球性能紀錄的OAM服務器——海玄,以及OAM模組——壁礪100,PCIe板卡產品——壁礪104,以及自主研發的BIRENSUPA軟件平臺。
壁仞科技創始人、董事長、CEO張文介紹稱,BR100是國內率先采用Chiplet技術、率先采用新一代主機接口PCIe 5.0、率先支持CXL互連協議的通用GPU芯片。
發布會上,壁仞科技聯合創始人、CTO洪洲,詳細介紹了原創架構——壁立仞。洪洲說,壁立仞架構以數據流為中心,對數據流進行深度的優化,通過六大技術特性,比較完整地解決了數據搬移的瓶頸和并行度不足的問題,使得BR100芯片在給定的工藝下實現了性能和能效的跨越式進步。
洪洲介紹,BR100采用了Chiplet設計理念,讓芯片總面積可以突破光罩尺寸對單芯片面積的限制,集成更多的算力和通用性邏輯;此外,通過縮小單個計算芯粒的面積,還可以同時提升產能與良率,進而極大地降低硅片的成本,并支持更靈活的產品策略。
洪洲還現場發布了壁仞科技BR100系列的另一款產品BR104,該款芯片同樣基于壁立仞架構,擁有1個計算芯粒,性能約為BR100的一半,同樣超越了國際廠商的在售旗艦產品。“Chiplet設計讓我們可以通過一次流片,同時得到兩種芯片,大大加快了迭代速度,同時覆蓋不同層級的市場。”洪洲說。
發布會上,壁仞科技聯合創始人、總裁徐凌杰和浪潮信息副總裁、AI&HPC產品線總經理劉軍,共同揭幕OAM服務器——海玄。徐凌杰介紹,該服務器可以提供高達8PFLOPS(8000萬億次每秒)的浮點峰值算力,超過了此前的任何一臺8卡加速計算設備的能力。
與此同時,壁仞科技還發布了基于BR104的主流產品壁礪104,基于標準PCIe形態,功耗控制在300W以內,其形態較為緊湊,部署廣泛、適應性強,可以適配多種2-4U的服務器,與客戶現有的基礎設施做到高度的兼容。
徐凌杰介紹,從芯片到板卡模組到服務器,以壁礪100和壁礪104為底座,壁仞科技形成了一條完整的數據中心加速計算產品線。壁礪104已經對部分用戶開放了邀測,即將量產出貨;海玄OAM服務器目前正在進行緊鑼密鼓的內部測試,預計今年第四季度開放邀測。
壁仞科技在創始之初,除了研發大算力芯片之外,還著力于以客戶需求為出發點,提供軟硬一體的解決方案,幫助客戶實現價值最大化。
發布會上,壁仞科技聯席CEO李新榮詳細介紹了壁仞科技自主研發的BIRENSUPA軟件平臺,該平臺構建在BR100系列產品的底層硬件之上,由驅動層、編程平臺、框架層、應用解決方案構成,支持各類應用場景。BIRENSUPA編程平臺位于軟件棧的中心位置,包括BIRENSUPA編程模型、加速庫、工具鏈、編譯器等組件。開發者可以通過這些組件,釋放BR100系列硬件的強大算力,并開發各種應用。
BIRENSUPA平臺支持主流的深度學習框架,發布會上,壁仞科技聯席CEO李新榮與百度飛槳訓練芯片適配技術負責人李琦共同宣布,壁仞科技加入由百度飛槳發起的硬件生態共創計劃。
本文鏈接:http://www.www897cc.com/showinfo-119-2580-0.html壁仞科技發布首款通用GPU芯片BR100 其BF16算力達1024TFLOPS
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com