在第四屆828 B2B企業節盛大開幕之際,華為云宣布了一項重大技術進展:其Tokens服務已成功融入CloudMatrix384超節點,借助創新的xDeepServe架構,實現了單芯片2400TPS的超高吞吐量和50ms的極低時延,這一性能表現遠超當前業界標準。
面對中國AI算力需求的急劇增長,華為云積極應對挑戰,推出了基于MaaS的Tokens服務。從最初按卡時計費的模式,到如今提供包括在線版、進線版、離線版及尊享版在內的多樣化服務規格,這一轉變不僅滿足了不同應用和場景的性能需求,更為AI工具如大模型和Agent智能體等提供了更為靈活、高效且成本友好的算力支持。
此次Tokens服務與CloudMatrix384超節點的結合,是華為云算力構建策略的重要里程碑。通過384原生的xDeepServe框架,服務吞吐量實現了從年初的1920TPS到2400TPS的顯著提升,同時保持了極低的時延。這一成就得益于華為在硬件、軟件、算子、存儲、推理框架及超節點等各個層面的全棧創新能力。

CloudMatrix384超節點以其革新的計算架構,打破了性能瓶頸,為澎湃算力奠定了堅實基礎。而CANN昇騰硬件使能則通過優化算子和高效通信策略,確保云端算力得以最高效地調用和組合。EMS彈性內存存儲技術更是突破了AI內存墻,實現了“以存強算”,讓每顆芯片的算力得到徹底釋放。xDeepServe分布式推理框架則以其Transformerless的極致分離架構,進一步提升了超節點的算力效率。
xDeepServe通過將MoE大模型拆分為可獨立伸縮的Attention、FFN、Expert微模塊,實現了在CloudMatrix384上的高效并行處理。這些微模塊被分配到不同的NPU上同步執行任務,并通過基于內存語義的微秒級XCCL通信庫與FlowServe自研推理引擎重新組合,形成了一條超高吞吐量的LLM服務平臺,即Tokens的“超高速流水線”。
作為專為超節點上的大語言模型服務設計的高性能通信庫,XCCL充分發揮了CloudMatrix384擴展后的UB互聯架構潛力,為Transformerless的全面分離提供了堅實的帶寬與時延基礎。而FlowServe作為被重構的“去中心”式分布式引擎,則將CloudMatrix384劃分為完全自治的DP小組,每個小組都能自給自足,確保了即使千卡并發也不會出現擁堵現象。
華為云MaaS服務目前已支持DeepSeek、Kimi、Qwen、Pangu、SDXL、Wan等主流大模型及versatile、Dify等主流Agent平臺。通過積累的大量模型性能優化和效果調優技術,華為云實現了“源于開源,高于開源”,讓更多大模型在昇騰云上展現出更快的運行速度和更好的性能表現。以文生圖大模型為例,在輕微損失畫質的情況下,通過Int8量化和旋轉位置編碼融合算子等方式,華為云MaaS平臺實現了出圖速度的兩倍提升,最大尺寸支持達到2K×2K。而在文生視頻大模型上,通過量化提速和通算并行等方式,視頻生成速度相較于友商實現了3.5倍的性能提升。
在應用層面,華為云已與超過100家合作伙伴攜手,深入行業場景,共同構建了豐富的Agent,廣泛應用于調研分析、內容創作、智慧辦公、智能運維等領域,解決了眾多產業難題。例如,基于MaaS平臺推出的今日人才數智員工解決方案,集成了先進的自然語言處理、機器學習和深度學習技術,能夠智能交互并處理任務,顯著提升了服務效率與客戶滿意度。而北京方寸無憂科技開發的無憂智慧公文解決方案,則有效提升了公文處理效能,推動了政企辦公的智能化轉型。
隨著以Token為動力的智能社會的到來,華為云憑借其系統級創新能力和全新的Tokens服務,正構筑起先進算力,助力各行各業加速落地AI,推動智能化進程。
舉報 0收藏 0打賞 0評論 0分享 0 更多>同類資訊
超六成iPhone用戶意向購買iPhone 17系列,電池續航成升級主因快科技9月2日消息,智能手機比價平臺SellCell發布iPhone用戶調查:超六成計劃購入iPhone 17,電池續航成首要升級因素。據悉,SellCell 8月份針對2000余名美國iPhone用戶展開…09-03
8月A股定增市場升溫,TCL科技、*ST松發領銜募資榜以首次披露預案公告日統計,2025年8月A股上市公司披露的定增預案(同一定增預案下的募資及配套募資合并統計,下同)共計44起,擬募資規模合計約352.78億元,同比上升112%、環比上升24%。 從單家公司…09-02
北大計算機學院&中國電信云研究院聯袂招生:計算機視覺方向聯培博士計算機學院同國內外多所大學、研究機構建立密切的學術聯系和學生交換項目,如美國麻省理工學院(MIT)、卡耐基梅隆大學(CMU)、康奈爾大學(Cornell)、加州大學洛杉磯分校(UCLA),英國愛丁堡大學,日…09-02LayerX:日本AI新星獲1億美元融資,引領企業后臺自動化革命09-02Prime Intellect發布“環境中心”平臺,旨在打破AI強化學習封閉生態09-02DeepSeek標識AI生成內容,提升用戶認知與信息安全09-02新加坡初創公司推出層次推理模型HRM,實現AI推理速度百倍提升09-02Meta超級智能實驗室動蕩:內訌、人才風波挑戰超級智能夢09-02蘇寧易購引領國產AI突破:靈思大模型攜手寒武紀,成本大降效率飆升09-02OpenAI擬在印度建大型數據中心,加速亞洲AI基礎設施布局09-02Salesforce采用AI代理系統,精簡4000人力,加速業務效率提升09-02馬斯克xAI公司起訴前工程師,涉嫌竊密跳槽至競爭對手OpenAI09-02臺積電二季度晶圓代工市場份額再創新高,占比超七成09-02超六成iPhone用戶欲換iPhone 17,電池續航成換機最大誘因09-02
華為若上市,市值能否超越數十個寒武紀?最近,一些板塊漲瘋了,市值動輒數百倍,有的上千倍,一些營收不多、常年虧損的公司,股價高達數百億,一兩年時間股價漲了數倍,甚至漲了上十倍。 但上市公司就不同了,在研發投入尤其是基礎研發投入方面,決策可能會受股東…09-02點擊查看更多 +全站最新
本田CB500SF或將亮相摩博會,復古街車新風采引期待
蔚來李斌透露新車規劃:四季度沖刺月銷5萬,加速產能提升
寶馬發布全新電動踏板概念車Vision CE“夢幻CE”,配備防護架引關注
福特Mustang GT500即將重啟,偽裝原型車動力強勁引期待
方程豹鈦7將于9月9日上市,預計起價低于25萬,高配配智能無人機
騰勢汽車8月銷量破萬,D9至尊版領銜成都車展,加速全球豪華市場布局熱門內容
超六成iPhone用戶意向購買iPhone 17系列,電池續航成升級主因
8月A股定增市場升溫,TCL科技、*ST松發領銜募資榜
北大計算機學院&中國電信云研究院聯袂招生:計算機視覺方向聯培博士
華為若上市,市值能否超越數十個寒武紀?
智慧家庭新時代:網絡萬兆升級,AI交互革新,服務機器人引領終端變革
谷歌Pixel 10內存新設計:AI專用內存引發用戶關注
本文鏈接:http://www.www897cc.com/showinfo-45-27247-0.html華為云Tokens服務接入384超節點,算力突破至2400TPS引領AI創新
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com