在第四屆828 B2B企業(yè)節(jié)盛大開幕之際,華為云宣布了一項(xiàng)重大進(jìn)展:其Tokens服務(wù)已成功整合至CloudMatrix384超節(jié)點(diǎn)系統(tǒng)。通過引入創(chuàng)新的xDeepServe架構(gòu),該系統(tǒng)在單芯片上實(shí)現(xiàn)了前所未有的性能突破,達(dá)到2400TPS的交易處理速度及50ms的超低時延,遠(yuǎn)超當(dāng)前行業(yè)標(biāo)準(zhǔn)。
面對中國AI算力需求的爆炸式增長,華為云憑借其獨(dú)特的“綜合優(yōu)勢”,正系統(tǒng)性地構(gòu)建強(qiáng)大的計(jì)算能力。數(shù)據(jù)顯示,從2024年初至今年6月底,中國日均Token消耗量從1000億激增至30萬億,這一300多倍的增長不僅彰顯了AI應(yīng)用的迅速擴(kuò)張,也對算力基礎(chǔ)設(shè)施提出了更高要求。
今年3月,華為云推出了基于MaaS(模型即服務(wù))的Tokens服務(wù),該服務(wù)不僅提供了多種計(jì)費(fèi)模式,還根據(jù)應(yīng)用場景和性能需求,推出了在線版、進(jìn)線版、離線版及尊享版等多種服務(wù)方案。這一創(chuàng)新舉措為大模型和智能體等AI工具提供了更加靈活、經(jīng)濟(jì)高效的算力支持。
此次,Tokens服務(wù)的全面接入CloudMatrix384超節(jié)點(diǎn),標(biāo)志著華為云在算力領(lǐng)域邁出了關(guān)鍵一步。借助384超節(jié)點(diǎn)的原生xDeepServe框架,系統(tǒng)吞吐量從年初的1920TPS躍升至2400TPS,同時保持了50ms的低時延。這一成就得益于從硬件到軟件、從算子到存儲、從推理框架到超節(jié)點(diǎn)的全方位技術(shù)創(chuàng)新。
CloudMatrix384超節(jié)點(diǎn)通過革新計(jì)算架構(gòu),打破了性能瓶頸,為澎湃算力奠定了堅(jiān)實(shí)基礎(chǔ)。而CANN(昇騰計(jì)算架構(gòu))硬件使能技術(shù),通過優(yōu)化算子和通信策略,確保了云端算力的高效調(diào)度與組合。EMS彈性內(nèi)存存儲技術(shù)打破了AI內(nèi)存墻,實(shí)現(xiàn)了“以存強(qiáng)算”,充分釋放了芯片潛能。xDeepServe分布式推理框架則通過Transformerless架構(gòu),將大模型拆解為可獨(dú)立擴(kuò)展的微模塊,實(shí)現(xiàn)了超高效算力。
xDeepServe的極致分離架構(gòu),如同將大模型拆解為“積木”,分派至不同NPU同步處理,再通過高性能通信庫XCCL和自研推理引擎FlowServe重新組合,構(gòu)建了一條超高速的Tokens處理流水線。這一創(chuàng)新不僅提升了單卡吞吐量至2400tokens/s,還為AI推理的線性擴(kuò)展提供了可能。
作為硬件加速的中間層,CANN包含了算子庫和高性能通信庫XCCL等組件,共同支撐了AI模型的高效運(yùn)行。XCCL專為超節(jié)點(diǎn)上的大語言模型(LLM)服務(wù)設(shè)計(jì),充分利用了CloudMatrix384的UB互聯(lián)架構(gòu)潛力,為Transformerless架構(gòu)的全面分離提供了堅(jiān)實(shí)的硬件基礎(chǔ)。
FlowServe引擎則采用了“去中心化”設(shè)計(jì),將CloudMatrix384切割為完全自治的DP小組,每個小組具備完整的處理能力,確保了即便在千卡并發(fā)的情況下也能保持流暢運(yùn)行。
在模型支持方面,華為云MaaS服務(wù)已涵蓋了DeepSeek、Kimi、Qwen、Pangu、SDXL、Wan等主流大模型,以及versatile、Dify等主流Agent平臺。通過大量的模型優(yōu)化和技術(shù)積累,華為云實(shí)現(xiàn)了“源于開源,高于開源”的目標(biāo),使得大模型在昇騰云上能夠更快、更好地運(yùn)行。
以文生圖大模型為例,華為云通過量化技術(shù)和算子融合,在輕微犧牲畫質(zhì)的前提下,實(shí)現(xiàn)了兩倍于業(yè)界主流平臺的出圖速度,并支持最大2K×2K尺寸。在文生視頻大模型方面,通過量化和通算并行等技術(shù),大幅降低了延遲和顯存占用,實(shí)現(xiàn)了3.5倍的性能提升。
在應(yīng)用層面,華為云已與超過100家合作伙伴攜手,深入行業(yè)場景,共同開發(fā)了豐富的Agent應(yīng)用。這些應(yīng)用涵蓋了調(diào)研分析、內(nèi)容創(chuàng)作、智慧辦公、智能運(yùn)維等多個領(lǐng)域,有效解決了產(chǎn)業(yè)難題,加速了企業(yè)的AI創(chuàng)新進(jìn)程。
例如,基于MaaS平臺推出的今日人才數(shù)智員工解決方案,集成了先進(jìn)的NLP、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)技術(shù),實(shí)現(xiàn)了智能交互和任務(wù)處理,顯著提升了服務(wù)效率與客戶滿意度。而北京方寸無憂科技開發(fā)的無憂智慧公文解決方案,則通過智能化手段提升了公文處理效率,推動了政企辦公的智能化轉(zhuǎn)型。
舉報(bào) 0收藏 0打賞 0評論 0分享 0 更多>同類資訊馬蜂窩陳罡:AI成旅游業(yè)變革核心,推動服務(wù)向全程智能化躍遷08-27
榮耀端側(cè)AI語音技術(shù)突破,入選國際頂會,引領(lǐng)智能翻譯新時代榮耀MagicOS副總裁孫建發(fā)表示,此次研究成果入選 INTERSPEECH,是對榮耀技術(shù)創(chuàng)新的鼓勵,同樣印證了“從用戶需求出發(fā)”的研發(fā)理念,讓每位用戶在無網(wǎng)絡(luò)環(huán)境下也能享受精準(zhǔn)、實(shí)時的多語種翻譯,這才是端側(cè)…08-27
蘋果AI布局加速,或?qū)⒊饩拶Y收購歐洲兩大AI初創(chuàng)企業(yè)IT之家 8 月 26 日消息,The Information 今晚報(bào)道稱,蘋果高管已就收購歐洲最大 AI 初創(chuàng)公司 Mistral 或Perplexity AI 相關(guān)事宜展開討論,其中 Eddy Cue …08-27人工智能板塊火熱,AIETF(515070)近一年漲幅超110%,持倉股表現(xiàn)亮眼昨日高層印發(fā)“人工智能+”行動意見引爆科技賽道,人工智能AIETF(515070)持倉股中樂鑫科技20CM漲停、中科創(chuàng)達(dá)、瑞芯微、科大訊飛。 消息方面,摩根大通認(rèn)為,鑒于杠桿率和估值仍處于適度水平,料中國股…08-27AI初創(chuàng)Anthropic與作家達(dá)成和解,版權(quán)爭議風(fēng)波暫告一段落08-27抖音副總裁李亮駁斥“人均7月離職”傳聞:指其內(nèi)容多為AI不實(shí)創(chuàng)作08-27谷歌AI模型精準(zhǔn)預(yù)測大西洋颶風(fēng)艾琳,展現(xiàn)氣象預(yù)報(bào)新潛力08-27蘋果加速AI布局,或收購兩家法國AI初創(chuàng)企業(yè)08-27AI聊天機(jī)器人涉16歲少年自殺案,OpenAI面臨首例非正常死亡訴訟08-27賓州州立大學(xué)首推人工智能工程學(xué)士,打造未來科技人才搖籃08-27AI醫(yī)療助手成投資新寵,Assort Health估值4月飆升3倍08-27Meta超級智能實(shí)驗(yàn)室人才流失,AI領(lǐng)域追趕之路遇阻08-27GPT-5寶可夢對戰(zhàn)大獲全勝,9517步新紀(jì)錄彰顯AI高效實(shí)力08-27AIETF富國(589380)收盤下跌3.20%,重倉股曝光,最新規(guī)模達(dá)2.01億元AIETF富國(589380)成立于2025年6月20日,基金全稱為富國上證科創(chuàng)板人工智能交易型開放式指數(shù)證券投資基金,基金簡稱為富國上證科創(chuàng)板人工智能ETF。殷欽怡自2025年6月20日管理(或擬管理)該…08-27寒武紀(jì)上半年業(yè)績飆升43倍,股價創(chuàng)新高突破1400元大關(guān)寒武紀(jì)科技發(fā)布2025上半年財(cái)報(bào),業(yè)績實(shí)現(xiàn)驚人飛躍,營收激增43倍,凈利潤突破十億大關(guān)。這家專注于人工智能芯片研發(fā)的企業(yè),以其卓越的產(chǎn)品線和市場表現(xiàn),再度吸引了業(yè)界的廣泛關(guān)注。財(cái)報(bào)數(shù)據(jù)顯示,寒武紀(jì)在2025年上半年實(shí)現(xiàn)了28.81億元的營業(yè)收入,與去年同期相比,這08-27點(diǎn)擊查看更多 +全站最新
企業(yè)局域網(wǎng)監(jiān)控全攻略:精選軟件助您高效管理員工電腦行為
逆市飛揚(yáng)!僅兩家航司A380航班量超越疫情前水平
智慧火電“透視眼”,實(shí)時監(jiān)控與預(yù)測維護(hù)引領(lǐng)行業(yè)新變革
物聯(lián)網(wǎng)連接新選擇:NB-IoT、Cat.1、eSIM各領(lǐng)風(fēng)騷
Switch連接錯誤怎么辦?實(shí)用方法助你快速恢復(fù)游戲體驗(yàn)
智匯云舟視頻孿生:重塑數(shù)字世界,賦能行業(yè)智慧轉(zhuǎn)型實(shí)踐熱門內(nèi)容
榮耀端側(cè)AI語音技術(shù)突破,入選國際頂會,引領(lǐng)智能翻譯新時代
蘋果AI布局加速,或?qū)⒊饩拶Y收購歐洲兩大AI初創(chuàng)企業(yè)
算力產(chǎn)業(yè)邁向高質(zhì)量,布局政策體系持續(xù)完善促發(fā)展
85后科學(xué)家企業(yè)家陳天石:寒武紀(jì)股價飆升,身價突破1500億
國聯(lián)股份等巨頭廣州聯(lián)手,跨境智運(yùn)新公司成立,注冊資本達(dá)千萬
IOTE深圳物聯(lián)網(wǎng)展明日啟幕,AI+IoT全產(chǎn)業(yè)鏈年度盛會邀您共襄盛舉
本文鏈接:http://www.www897cc.com/showinfo-45-27045-0.html華為云Tokens服務(wù)性能飛躍:全面接入384超節(jié)點(diǎn),吞吐量飆升至2400TPS
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 昆侖萬維2025上半年財(cái)報(bào):虧損8.59億,短劇平臺DramaWave單月流水破2千萬美元