當(dāng)前位置：首頁(yè) > 科技 > 軟件

焱融存儲(chǔ) YRCloudFile 發(fā)布面向 AI 推理的分布式 KV Cache 特性

來(lái)源：責(zé)編：時(shí)間：2025-03-19 09:41:27 86觀看

導(dǎo)讀 AI 存儲(chǔ)廠商焱融科技宣布，其自主研發(fā)的分布式文件存儲(chǔ)系統(tǒng)YRCloudFile已成功支持大模型推理場(chǎng)景的 KV Cache 特性，為 AI 推理帶來(lái)顯著價(jià)值提升。 KV Cache 通過(guò)高效緩存機(jī)制加速數(shù)據(jù)讀取，顯著提升推理性能，

AI 存儲(chǔ)廠商焱融科技宣布，其自主研發(fā)的分布式文件存儲(chǔ)系統(tǒng)YRCloudFile已成功支持大模型推理場(chǎng)景的 KV Cache 特性，為 AI 推理帶來(lái)顯著價(jià)值提升。

KV Cache 通過(guò)高效緩存機(jī)制加速數(shù)據(jù)讀取，顯著提升推理性能，突破 GPU 顯存瓶頸，大幅提升推理 GPU 效率和并發(fā)處理能力。這意味著用戶可以在不增加 GPU 資源的情況下，實(shí)現(xiàn)更高并發(fā)的推理請(qǐng)求，大幅降低 GPU 資源消耗與投入成本。同時(shí)，它還能夠降低推理的首個(gè) Token 耗時(shí)和 Token 間耗時(shí)延時(shí)，提升用戶使用體驗(yàn)。

此外，焱融科技實(shí)現(xiàn)了DeepSeek級(jí)架構(gòu)，構(gòu)建與DeepSeek一致的推理場(chǎng)景存算參考架構(gòu)。用戶在使用支持 KV Cache 的焱融存儲(chǔ)時(shí)，能夠享受到與DeepSeek同等架構(gòu)帶來(lái)的優(yōu)質(zhì)體驗(yàn)。在相同規(guī)模和推理速度下，焱融存儲(chǔ)支持更長(zhǎng)的上下文處理和更多查詢請(qǐng)求，為大模型推理提供更優(yōu)的性價(jià)比。

焱融存儲(chǔ)支持 KV Cache 技術(shù)新優(yōu)勢(shì)

優(yōu)勢(shì)一｜焱融 AI 推理存儲(chǔ)優(yōu)化實(shí)時(shí)交互性能

在實(shí)時(shí)交互場(chǎng)景中，用戶對(duì) AI 服務(wù)的響應(yīng)速度要求極高。焱融存儲(chǔ) KV Cache 技術(shù)，大幅縮短大模型推理的首個(gè) Token 耗時(shí)（Time To First Token）和 Token 間耗時(shí)（Time Between Token），顯著提升復(fù)雜場(chǎng)景的響應(yīng)效率。該方案采用 NVMe SSD 加速與高性能網(wǎng)絡(luò)，實(shí)現(xiàn)微秒級(jí)推理延遲，提升 Token 處理速度，減少資源占用，支持更多并發(fā)訪問(wèn)，優(yōu)化業(yè)務(wù)成本。同時(shí)，通過(guò) GPUDirect Storage 與 RDMA 網(wǎng)絡(luò)的結(jié)合進(jìn)一步優(yōu)化數(shù)據(jù)傳輸效率，提升用戶體驗(yàn)。

優(yōu)勢(shì)二｜顯存資源動(dòng)態(tài)優(yōu)化與推理加速

焱融存儲(chǔ) KV Cache 技術(shù)，突破顯存容量對(duì)上下文長(zhǎng)度的限制，實(shí)現(xiàn) GPU 資源動(dòng)態(tài)調(diào)度，提升單卡并發(fā)推理能力。這意味著用戶可以在不增加 GPU 資源的情況下，實(shí)現(xiàn)更高并發(fā)的推理請(qǐng)求，大幅降低 GPU 資源消耗與投入成本。目前，該技術(shù)已應(yīng)用于多模態(tài)大模型、實(shí)時(shí)交互等高算力需求場(chǎng)景，為 AGI 時(shí)代規(guī)模化 AI 落地提供高性價(jià)比的算力底座。

優(yōu)勢(shì)三｜DeepSeek級(jí)架構(gòu)體驗(yàn)

針對(duì)當(dāng)前企業(yè)廣泛采用的 DeepSeek 等主流大模型，焱融存儲(chǔ) KV Cache 技術(shù)進(jìn)一步降低企業(yè)使用成本的同時(shí)，提升推理場(chǎng)景下的響應(yīng)效率。可靈活適配從百億級(jí)參數(shù)模型到萬(wàn)億級(jí) MoE 混合專(zhuān)家模型，滿足政務(wù)、金融等高安全要求場(chǎng)景的數(shù)據(jù)本地化需求，同時(shí)支持國(guó)產(chǎn)與海外芯片的異構(gòu)算力環(huán)境，為企業(yè)提供自主可控的技術(shù)路徑。

此次技術(shù)突破正值國(guó)內(nèi)企業(yè) AI 私有化部署浪潮，焱融科技以存儲(chǔ)技術(shù)創(chuàng)新推動(dòng)算力資源的高效利用，為 AI 規(guī)模化應(yīng)用提供了關(guān)鍵基礎(chǔ)設(shè)施支撐。隨著多模態(tài)與實(shí)時(shí)交互場(chǎng)景的普及，存儲(chǔ)與計(jì)算的協(xié)同優(yōu)化，KVCache“以存換算”將成為企業(yè)降本增效的核心競(jìng)爭(zhēng)力。

本文鏈接：http://www.www897cc.com/showinfo-26-137834-0.html焱融存儲(chǔ) YRCloudFile 發(fā)布面向 AI 推理的分布式 KV Cache 特性

聲明：本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí)，若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。郵件：2376512515@qq.com

上一篇：大尺寸面板需求向好，TCL 科技收購(gòu)樂(lè)金顯示股權(quán)完成工商變更

下一篇：宏碁 AIPC Yes！多款產(chǎn)品亮相 AMD AIPC 創(chuàng)新峰會(huì)

標(biāo)簽：

熱門(mén)焦點(diǎn)

6月安卓手機(jī)性價(jià)比榜：Note 12 Turbo斷層式碾壓

6月份有一個(gè)618，雖然這是京東周年慶的日子，但別的電商也都不約而同的跟進(jìn)了，反正促銷(xiāo)沒(méi)壞處，廠商和用戶都能滿意。618期間一些產(chǎn)品也出現(xiàn)了歷史低價(jià)，那么各個(gè)價(jià)位段的產(chǎn)品性價(jià)比
5月iOS設(shè)備好評(píng)榜：iPhone 14僅排第43？

來(lái)到新的一月，安兔兔的各個(gè)榜單又重新匯總了數(shù)據(jù)，像安卓陣營(yíng)的榜單都有著比較大的變動(dòng)，不過(guò)iOS由于設(shè)備的更新?lián)Q代并沒(méi)有那么快，所以相對(duì)來(lái)說(shuō)變化并不大，特別是iOS好評(píng)榜，老款設(shè)
CSS單標(biāo)簽實(shí)現(xiàn)轉(zhuǎn)轉(zhuǎn)logo

轉(zhuǎn)轉(zhuǎn)品牌升級(jí)后更新了全新的Logo，今天我們用純CSS來(lái)實(shí)現(xiàn)轉(zhuǎn)轉(zhuǎn)的新Logo，為了有一定的挑戰(zhàn)性，這里我們只使用一個(gè)標(biāo)簽實(shí)現(xiàn)，將最大化的使用CSS能力完成Logo的繪制與動(dòng)畫(huà)效果。新logo
三言兩語(yǔ)說(shuō)透柯里化和反柯里化

JavaScript中的柯里化(Currying)和反柯里化(Uncurrying)是兩種很有用的技術(shù)，可以幫助我們寫(xiě)出更加優(yōu)雅、泛用的函數(shù)。本文將首先介紹柯里化和反柯里化的概念、實(shí)現(xiàn)原理和應(yīng)用
使用AIGC工具提升安全工作效率

在日常工作中，安全人員可能會(huì)涉及各種各樣的安全任務(wù)，包括但不限于：開(kāi)發(fā)某些安全工具的插件，滿足自己特定的安全需求；自定義github搜索工具，快速查找所需的安全資料、漏洞poc、exp
10天營(yíng)收超1億美元，《星鐵》比《原神》差在哪？

來(lái)源：伯虎財(cái)經(jīng)作者：陳平安即便你沒(méi)玩過(guò)《原神》，你一定聽(tīng)說(shuō)過(guò)的它的大名。恨它的人把《原神》開(kāi)服那天稱作是中國(guó)游戲史上最黑暗的一天，有粉絲因?yàn)樗髂嵩赑S平臺(tái)上線《原神》，怒而
“又被陳思誠(chéng)騙了”

作者｜張思齊出品｜眾面（ID：ZhongMian_ZM）如今的國(guó)產(chǎn)懸疑電影，成了陳思誠(chéng)的天下。最近大爆電影《消失的她》票房突破30億斷層奪魁暑期檔，陳思誠(chéng)再度風(fēng)頭無(wú)兩。你可以說(shuō)陳思誠(chéng)的
東方甄選單飛：有些鳥(niǎo)注定是關(guān)不住的

作者：彭寬鴻來(lái)源：華爾街科技眼&zwj;&zwj;&zwj;&zwj;&zwj;&zwj;&zwj;&zwj;&zwj;&zwj;東方甄選創(chuàng)始人俞敏洪帶隊(duì)的“7天甘肅行”直播活動(dòng)已在近日順利收官。成立后一
OPPO K11采用全方位護(hù)眼屏：三大護(hù)眼能力減輕視覺(jué)疲勞

日前OPPO官方宣布，全新的OPPO K11將于7月25日正式發(fā)布，將主打旗艦影像，和同檔位競(jìng)品相比，其最大的賣(mài)點(diǎn)就是將配備索尼IMX890主攝，堪稱是2000檔位影像表

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

焱融存儲(chǔ) YRCloudFile 發(fā)布面向 AI 推理的分布式 KV Cache 特性

6月安卓手機(jī)性價(jià)比榜：Note 12 Turbo斷層式碾壓

5月iOS設(shè)備好評(píng)榜：iPhone 14僅排第43？

CSS單標(biāo)簽實(shí)現(xiàn)轉(zhuǎn)轉(zhuǎn)logo

三言兩語(yǔ)說(shuō)透柯里化和反柯里化

使用AIGC工具提升安全工作效率

10天營(yíng)收超1億美元，《星鐵》比《原神》差在哪？

“又被陳思誠(chéng)騙了”

東方甄選單飛：有些鳥(niǎo)注定是關(guān)不住的

OPPO K11采用全方位護(hù)眼屏：三大護(hù)眼能力減輕視覺(jué)疲勞

最新推薦

猜你喜歡

熱門(mén)推薦

相關(guān)資訊