日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

CPU,正在被AI時代拋棄?

來源: 責編: 時間:2024-07-11 17:28:19 111觀看
導讀在某三甲醫院的門診中,匯集了來自各地的病患,醫生們正在以最專業的能力和最快的速度進行會診。期間,醫生與患者的對話可以通過語音識別技術被錄入到病例系統中,隨后大模型AI 推理技術輔助進行智能總結和診斷,醫生們撰寫病

在某三甲醫院的門診中,匯集了來自各地的病患,醫生們正在以最專業的能力和最快的速度進行會診。期間,醫生與患者的對話可以通過語音識別技術被錄入到病例系統中,隨后大模型AI 推理技術輔助進行智能總結和診斷,醫生們撰寫病例的效率顯著提高。AI 推理的應用不僅節省了時間,也保護了患者隱私;Hmi28資訊網——每日最新資訊28at.com

在法院、律所等業務場景中,律師通過大模型對海量歷史案例進行整理調查,并鎖定出擬定法律文件中可能存在的漏洞;Hmi28資訊網——每日最新資訊28at.com

……Hmi28資訊網——每日最新資訊28at.com

以上場景中的大模型應用,幾乎都有一個共同的特點——受行業屬性限制,在應用大模型時,除了對算力的高要求,AI訓練過程中經常出現的壞卡問題也是這些行業不允許出現的。同時,為確保服務效率和隱私安全,他們一般需要將模型部署在本地,且非??粗赜布然A設施層的穩定性和可靠性。一個中等參數或者輕量參數的模型,加上精調就可以滿足他們的場景需求。Hmi28資訊網——每日最新資訊28at.com

而在大模型技術落地過程中,上述需求其實不在少數,基于 CPU的推理方案無疑是一種更具性價比的選擇。不僅能夠滿足其業務需求,還能有效控制成本、保證系統的穩定性和數據的安全性。但這也就愈發讓我們好奇,作為通用服務器,CPU在 AI 時代可以發揮怎樣的優勢?其背后的技術原理又是什么?Hmi28資訊網——每日最新資訊28at.com

1、AI時代,CPU 是否已被被邊緣化?Hmi28資訊網——每日最新資訊28at.com

提起 AI 訓練和 AI 推理,大家普遍會想到 GPU 更擅長處理大量并行任務,在執行計算密集型任務時表現地更出色,卻忽視了 CPU在這其中的價值。Hmi28資訊網——每日最新資訊28at.com

AI 技術的不斷演進——從深度神經網絡(DNN)到 Transformer 大模型,對硬件的要求產生了顯著變化。CPU不僅沒有被邊緣化,反而持續升級以適應這些變化,并做出了重要改變。Hmi28資訊網——每日最新資訊28at.com

AI 大模型也不是只有推理和訓練的單一任務,還包括數據預處理、模型訓練、推理和后處理等,整個過程中需要非常多軟硬件及系統的配合。在 GPU興起并廣泛應用于 AI 領域之前,CPU 就已經作為執行 AI推理任務的主要硬件在被廣泛使用。其作為通用處理器發揮著非常大的作用,整個系統的調度、任何負載的高效運行都離不開它的協同優化。Hmi28資訊網——每日最新資訊28at.com

此外,CPU 的單核性能非常強大,可以處理復雜的計算任務,其核心數量也在不斷增加,而且 CPU 的內存容量遠大于 GPU 的顯存容量,這些優勢使得 CPU能夠有效運行生成式大模型任務。經過優化的大模型可以在 CPU 上高效執行,特別是當模型非常大,需要跨異構平臺計算時,使用 CPU反而能提供更快的速度和更高的效率。Hmi28資訊網——每日最新資訊28at.com

而 AI 推理過程中兩個重要階段的需求,即在預填充階段,需要高算力的矩陣乘法運算部件;在解碼階段,尤其是小批量請求時,需要更高的內存訪問帶寬。這些需求CPU 都可以很好地滿足。Hmi28資訊網——每日最新資訊28at.com

以英特爾舉例,從 2017 年第一代至強? 可擴展處理器開始就利用英特爾? AVX-512 技術的矢量運算能力進行 AI 加速上的嘗試;再接著第二代至強?中導入深度學習加速技術(DL Boost);第三代到第五代至強? 的演進中,從 BF16 的增添再到英特爾? AMX 的入駐,可以說英特爾一直在充分利用 CPU資源加速 AI 的道路上深耕。Hmi28資訊網——每日最新資訊28at.com

在英特爾? AMX 大幅提升矩陣計算能力外,第五代至強? 可擴展處理器還增加了每個時鐘周期的指令,有效提升了內存帶寬與速度,并通過 PCIe 5.0實現了更高的 PCIe 帶寬提升。在幾個時鐘的周期內,一條微指令就可以把一個 16×16 的矩陣計算一次性計算出來。至強? 可擴展處理器可支持 HighBandwidth Memory (HBM) 內存,和 DDR5 相比,其具有更多的訪存通道和更長的讀取位寬。雖然 HBM的容量相對較小,但足以支撐大多數的大模型推理任務。Hmi28資訊網——每日最新資訊28at.com

可以明確的是,AI 技術的演進還遠未停止,當前以消耗大量算力為前提的模型結構也可能會發生改變,但 CPU作為計算機系統的核心,其價值始終是難以被替代的。Hmi28資訊網——每日最新資訊28at.com

同時,AI 應用的需求是多樣化的,不同的應用場景需要不同的計算資源和優化策略。因此比起相互替代,CPU 和其他加速器之間的互補關系才是它們在 AI市場中共同發展的長久之道。Hmi28資訊網——每日最新資訊28at.com

2、與其算力焦慮,不如關注效價比Hmi28資訊網——每日最新資訊28at.com

隨著人工智能技術在各個領域的廣泛應用,AI 推理成為了推動技術進步的關鍵因素。然而,隨著通用大模型參數和 Token數量不斷增加,模型單次推理所需的算力也在持續增加,企業的算力焦慮撲面而來。與其關注無法短時間達到的算力規模,不如聚焦在“效價比”,即綜合考量大模型訓練和推理過程中所需軟硬件的經濟投入成本、使用效果和產品性能。Hmi28資訊網——每日最新資訊28at.com

CPU 不僅是企業解決 AI算力焦慮過程中的重要選項,更是企業追求“效價比”的優選。在大模型技術落地的“效價比”探索層面上,百度智能云和英特爾也不謀而合。Hmi28資訊網——每日最新資訊28at.com

百度智能云千帆大模型平臺(下文簡稱“千帆大模型平臺”)作為一個面向開發者和企業的人工智能服務平臺,提供了豐富的大模型,對大模型的推理及部署服務優化積攢了很多作為開發平臺的經驗,他們發現,CPU的 AI 算力潛力將有助于提升 CPU 云服務器的資源利用率,能夠滿足用戶快速部署 LLM 模型的需求,同時還發現了許多很適合 CPU 的使用場景:Hmi28資訊網——每日最新資訊28at.com

●SFT 長尾模型:每個模型的調用相對稀疏,CPU 的靈活性和通用性得以充分發揮,能夠輕松管理和調度這些模型,確保每個模型在需要時都能快速響應。Hmi28資訊網——每日最新資訊28at.com

●小于 10b 的小參數規模大模型:由于模型規模相對較小,CPU 能夠提供足夠的計算能力,同時保持較低的能耗和成本。Hmi28資訊網——每日最新資訊28at.com

●對首 Token 時延不敏感,更注重整體吞吐的離線批量推理場景:這類場景通常要求系統能夠高效處理大量的數據,而 CPU的強大計算能力和高吞吐量特性可以很好地滿足要求,能夠確保推理任務的快速完成。Hmi28資訊網——每日最新資訊28at.com

英特爾的測試數據也驗證了千帆大模型平臺團隊的發現,其通過測試證明,單臺雙路 CPU 服務器完全可以輕松勝任幾 B 到幾十 B參數的大模型推理任務,Token 生成延時完全能夠達到數十毫秒的業務需求指標,而針對更大規模參數的模型,例如常用的 Llama 2-70B,CPU同樣可以通過分布式推理方式來支持。此外,批量處理任務在 CPU 集群的閑時進行,忙時可以處理其他任務,而無需維護代價高昂的 GPU集群,這將極大節省企業的經濟成本。Hmi28資訊網——每日最新資訊28at.com

也正是出于在“CPU 上跑 AI”的共識,雙方展開了業務上的深度合作。百度智能云千帆大模型平臺采?基于英特爾? AMX 加速器和大模型推理軟件解決方案xFasterTransformer (xFT),進?步加速英特爾? 至強? 可擴展處理器的 LLM 推理速度。Hmi28資訊網——每日最新資訊28at.com

3、將CPU 在 AI 方面的潛能發揮到極致Hmi28資訊網——每日最新資訊28at.com

為了充分發揮 CPU 在 AI 推理方面的極限潛能,需要從兩個方面進行技術探索——硬件層面的升級和軟件層面的優化適配。Hmi28資訊網——每日最新資訊28at.com

千帆大模型平臺采用 xFT,主要進行了以下三方面的優化:Hmi28資訊網——每日最新資訊28at.com

系統層面:利用英特爾?AMX/AVX512 等硬件特性,高效快速地完成矩陣 / 向量計算;優化實現針對超長上下文和輸出的 Flash Attention/Flash Decoding等核心算子,降低數據類型轉換和數據重排布等開銷;統一內存分配管理,降低推理任務的內存占用。Hmi28資訊網——每日最新資訊28at.com

算法層面:在精度滿足任務需求的條件下,提供多種針對網絡激活層以及模型權重的低精度和量化方法,大幅度降低訪存數據量的同時,充分發揮出英特爾?AMX 等加速部件對 BF16/INT8 等低精度數據計算的計算能力。Hmi28資訊網——每日最新資訊28at.com

多節點并行:支持張量并行(TensorParallelism)等對模型權重進行切分的并行推理部署。使用異構集合通信的方式提高通信效率,進一步降低 70b 規模及以上 LLM推理時延,提高較大批處理請求的吞吐。Hmi28資訊網——每日最新資訊28at.com

第五代至強? 可擴展處理器能在 AI 推理上能夠取得如此亮眼的效果,同樣離不開軟件層面的優化適配。為了解決 CPU 推理性能問題,這就不得不提 xFT開源推理框架了。Hmi28資訊網——每日最新資訊28at.com

xFT 底層適用英特爾 AI 軟件棧,包括 oneDNN、oneMKL、IG、oneCCL等高性能庫。用戶可以調用和組裝這些高性能庫,形成大模型推理的關鍵算子,并簡單組合算子來支持 Llama、文心一言等大模型。同時,xFT 最上層提供 C++ 和Python 兩套便利接口,很容易集成到現有框架或服務后端。Hmi28資訊網——每日最新資訊28at.com

xFT采用了多種優化策略來提升推理效率,其中包括張量并行和流水線并行技術,這兩種技術能夠顯著提高并行處理的能力。通過高性能融合算子和先進的量化技術,其在保持精度的同時提高推理速度。此外,通過低精度量化和稀疏化技術,xFT有效地降低了對內存帶寬的需求,在推理速度和準確度之間取得平衡,支持多種數據類型來實現模型推理和部署,包括單一精度和混合精度,可充分利用 CPU的計算資源和帶寬資源來提高 LLM 的推理速度。Hmi28資訊網——每日最新資訊28at.com

另外xFT 通過“算子融合”、“最小化數據拷貝”、“重排操作”和“內存重復利用”等手段來進一步優化 LLM的實現,這些優化策略能夠最大限度地減少內存占用、提高緩存命中率并提升整體性能。通過仔細分析 LLM的工作流程并減少不必要的計算開銷,該引擎進一步提高了數據重用度和計算效率,特別是在處理 Attention機制時,針對不同長度的序列采取了不同的優化算法來確保最高的訪存效率。Hmi28資訊網——每日最新資訊28at.com

目前,英特爾的大模型加速方案 xFT 已經成功集成到千帆大模型平臺中,這項合作使得在千帆大模型平臺上部署的多個開源大模型能夠在英特爾至強?可擴展處理器上獲得最優的推理性能:Hmi28資訊網——每日最新資訊28at.com

●在線服務部署:用戶可以利用千帆大模型平臺的 CPU資源在線部署多個開源大模型服務,這些服務不僅為客戶應用提供了強大的大模型支持,還能夠用于千帆大模型平臺 prompt 優化工程等相關任務場景。Hmi28資訊網——每日最新資訊28at.com

●高性能推理:借助英特爾? 至強? 可擴展處理器和 xFT推理解決方案,千帆大模型平臺能夠實現大幅提升的推理性能。這包括降低推理時延,提高服務響應速度,以及增強模型的整體吞吐能力。Hmi28資訊網——每日最新資訊28at.com

●定制化部署:千帆大模型平臺提供了靈活的部署選項,允許用戶根據具體業務需求選擇最適合的硬件資源配置,從而優化大模型在實際應用中的表現和效果。Hmi28資訊網——每日最新資訊28at.com

4、寫在最后Hmi28資訊網——每日最新資訊28at.com

對于千帆大模型平臺來說,英特爾幫助其解決了客戶在大模型應用過程中對計算資源的需求,進一步提升了大模型的性能和效率,讓用戶以更低的成本獲取高質量的大模型服務。Hmi28資訊網——每日最新資訊28at.com

大模型生態要想持續不斷地往前演進,無疑要靠一個個實打實的小業務落地把整個生態構建起來,英特爾聯合千帆大模型平臺正是在幫助企業以最少的成本落地大模型應用,讓他們在探索大模型應用時找到了更具效價比的選項。Hmi28資訊網——每日最新資訊28at.com

未來,雙方計劃在更高性能的至強?產品支持、軟件優化、更多模型支持以及重點客戶聯合支持等方面展開深入合作。旨在提升大模型運行效率和性能,為千帆大模型平臺提供更完善的軟件支持,確保用戶能及時利用最新的技術成果,從而加速大模型生態持續向前。Hmi28資訊網——每日最新資訊28at.com

更多關于至強? 可擴展處理器為千帆大模型平臺推理加速的信息,請點擊英特爾官網查閱。Hmi28資訊網——每日最新資訊28at.com

舉報 0收藏 0打賞 0評論 0
 
 
更多>同類資訊
點擊查看更多 +
全站最新
蘋果AI技術成關鍵推手:iPhone 16系列出貨量目標上調,預計超9000萬部
蘋果AI技術成關鍵推手:iPhone 16系列出貨量目標上調,預計超9000萬部
蘿卜快跑10公里3.9元引熱議,官方:暫未定性為營運
蘿卜快跑10公里3.9元引熱議,官方:暫未定性為營運
IDC:華為擎云商用平板登頂中國市場出貨量榜首
IDC:華為擎云商用平板登頂中國市場出貨量榜首
郭明錤曝光蘋果 iPhone 16-19 系列相機路線圖:四重棱鏡普及,水晶光電成最大贏家
郭明錤曝光蘋果 iPhone 16-19 系列相機路線圖:四重棱鏡普及,水晶光電成最大贏家
換機周期越來越長,iPhone超71%的用戶使用舊機兩年以上
換機周期越來越長,iPhone超71%的用戶使用舊機兩年以上
思看科技3D掃描技術:引領文化遺產數字化保護新篇章
思看科技3D掃描技術:引領文化遺產數字化保護新篇章
熱門內容
  • 2024歐洲杯賽程時間出爐,用當貝D6X Pro享受“身臨其境”的觀賽體驗
  • 2024歐洲杯直播在哪看?在哪個軟件可以看比賽直播、回放
  • 破土而出:Hamster Kombat和TON區塊鏈的雙重沖擊
  • 父親節送什么禮物好?送一臺當貝F6更貼心!
  • 2024年歐洲杯賽程出爐!當貝X5S投影儀讓你最直觀體驗賽場!
  • 重磅官宣!宏碁暗影騎士·擎6成無畏契約冠軍巡回賽虎牙直播合作伙伴
  • 重塑兒童智能陪護體驗 躍然創新推出全球首款AI玩具BubblePal
  • 深信服牽頭!立項制定《網絡安全運營大模型參考架構》技術規范
  • 億達中國大連軟件園引入日本知名企業星崎集團,在中國成立首家獨立海外研發中心
  • 值得推薦的3000元左右家用投影儀:當貝D6X Pro輕薄便攜體驗超贊
  • 洞察智能化趨勢,筑牢金融安全基石:BCS第五屆金融業網絡安全論壇成功舉辦
  • 小笨智能:機器人靈活運動的秘密,就藏在SLAM技術里
  • 618驚喜價格 三星Galaxy S24系列限時加贈Galaxy Buds2 Pro
  • 京東3C數碼企業及商采618戰報來襲 奔圖品牌成交額同比增長60%
  • 2024年618性價比最高的4K投影儀!為什么說當貝X5S Pro性價比最高
本欄最新
思看科技3D掃描技術:引領文化遺產數字化保護新篇章
思看科技3D掃描技術:引領文化遺產數字化保護新篇章
三維掃描案例分享:思看科技3D掃描儀助力水電站檢測與維護!
三維掃描案例分享:思看科技3D掃描儀助力水電站檢測與維護!
干衣機迎來革命性創新,小天鵝與Askoll強強聯手引領
干衣機迎來革命性創新,小天鵝與Askoll強強聯手引領
折疊屏體驗新標桿 三星Galaxy Z Fold6創新AI解鎖高效生產力
折疊屏體驗新標桿 三星Galaxy Z Fold6創新AI解鎖高效生產力
Galaxy AI賦能大視野智能外屏 三星Galaxy Z Flip6開啟折疊屏新時代
Galaxy AI賦能大視野智能外屏 三星Galaxy Z Flip6開啟折疊屏新時代
打破傳統生活方式,三星Galaxy Z Fold6以Galaxy AI迎接未來
打破傳統生活方式,三星Galaxy Z Fold6以Galaxy AI迎接未來

本文鏈接:http://www.www897cc.com/showinfo-45-5964-0.htmlCPU,正在被AI時代拋棄?

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 微軟對“中國區員工必須使用iPhone”回應:為員工提供訪問必要應用的途徑

下一篇: 紫光閃存京東品牌煥新日來襲!多重福利精彩放送

標簽:
  • 熱門焦點
  • VR/AR迷失元宇宙“硝煙”

    不溫不火的VR/AR可穿戴設備因元宇宙崛起火了一陣,又隨著元宇宙回歸平靜。1月份,微軟在 Surface 設備、HoloLens 混合現實硬件和 Xbox 等部門裁員,其中負責混合現實硬件(MR)的Holo
  • 25萬虛擬er在“元宇宙”追星

    “默嘰默嘰,我是默默醬,我是在真元宇宙也有頭有臉的人。”12月11日晚20:00,虛擬偶像@默默醬的首場個人元宇宙演唱會《以夢為馬,抵達繁星》在大有空間APP
  • Meta證實Quest 2無法實現全身追蹤,未來將為虛擬化身配備“假腿”

    上周,外媒UploadVR在Quest 2開發者文檔中發現了從未被公布過的“身體追蹤支持”選項,暗示Meta VR頭顯或支持全身追蹤。而在最近的Instagram問答環節中,Meta Reali
  • 百度元宇宙希壤是什么?(附下載)

    百度元宇宙希壤是什么,最近很多人關注。還有很多人問希壤怎么下載、百度希壤怎么進入?今天小編帶你來全面了解一下?!跋H馈笔前俣扔?021年12月27日于百度AI開
  • 摩根大通:元宇宙市場預計每年收入超1萬億美元

    今日《元宇宙新鮮事》有:香港首屆元宇宙藝博會將于5月舉辦;NH-Amundi Asset Management上市其第二支元宇宙ETF;Meta虛擬現實平臺Horizon Worlds月活躍用戶在三個
  • 本周NFT領域重要資訊回顧

    NFT在蘇富比拍賣是一波三折的嗎?其實不完全如此,但本周在蘇富比拍賣行發生了一系列有趣的事。與此同時,美聯社因其最新的NFT銷售被推到了風口浪尖,而Opensea正面臨
  • 頭頂光環無數卻估值極低,以太坊這位&——quot;最強殺手&——quot;有望涅槃重生?

    作者:五火球教主提起Dfinity(ICP),你的第一感覺可能與我一樣,這是一個讓人十分糾結的項目。之所以糾結,一方面他的團隊陣容強大,各種來自前英特爾、IBM、coinbase、fa
  • 解決NFT流動性問題:一文了解Floor DAO

    流動性是證券市場上的一個術語,流動性是指資產在不影響其市場價格的情況下可以轉換為現成現金的效率,流動性最強的資產是現金本身。現在讓我們試著從流動性的角
  • 從4個方面解析2022年加密行業趨勢

    作者:去月球基礎設施瓶頸仍然存在盡管2021年公鏈基礎設施之間的競爭顯著升溫,但關鍵瓶頸仍需解決。例如,以太坊作為DApp開發的頂級公鏈,仍然遭受網絡擁塞和高額交

最新推薦

猜你喜歡

熱門推薦

相關資訊

Top 主站蜘蛛池模板: 景东| 巫山县| 亚东县| 百色市| 陕西省| 桓仁| 锡林浩特市| 岫岩| 淮阳县| 井冈山市| 盐亭县| 缙云县| 肥西县| 昭觉县| 嘉兴市| 区。| 江门市| 临西县| 石狮市| 南雄市| 新和县| 苍山县| 尼木县| 孝义市| 新昌县| 淮南市| 漾濞| 满洲里市| 呼玛县| 巴彦县| 阿鲁科尔沁旗| 桓台县| 牡丹江市| 阿坝| 巴塘县| 开封市| 商洛市| 永丰县| 玉田县| 隆安县| 兴隆县|