如今 AI 的生意越做越大,從出圈爆火,到千行百業(yè)都開始擁抱 AI,越來越多的企業(yè),都會將 AI 導(dǎo)入到他們的生意模式當(dāng)中。預(yù)計到 2026 年有超過 3000 億美金將投入到生成式 AI 當(dāng)中,這其中包括硬件、軟件、解決方案等。50% 以上的邊緣應(yīng)用也會采用 AI 技術(shù)。到 2028 年有 80% 以上的 PC 都會轉(zhuǎn)換成 AI PC,通過 AI 可以提升大家在 PC 上的生產(chǎn)力。還有 80% 以上的公司,也會在 2026 年之前會導(dǎo)入某種程度的生成式 AI 以提高企業(yè)生產(chǎn)力。
各行各業(yè)都在積極的擁抱 AI,這離不開強(qiáng)大的算力支持,英特爾在去年 AI 風(fēng)頭正勁的時候推出了第五代英特爾至強(qiáng)可擴(kuò)展處理器,為云端 AI 能力帶來了全新的體驗。
第五代至強(qiáng)最多擁有 64 個核,并引入了諸多 AI 特性,如 AMX、AVX-512 指令集等,并通過性能的提升,對生成式 AI 應(yīng)用帶來更快的體驗。第五代至強(qiáng)可擴(kuò)展處理器內(nèi)存達(dá) 5600MT/s,三級緩存進(jìn)一步提升,加速處理器的數(shù)據(jù)交換。在軟件生態(tài)上英特爾也進(jìn)行了很大投入,目前,英特爾上傳了 300 個以上的深度學(xué)習(xí)模型到社區(qū),也支持了 50 個以上的基于機(jī)器學(xué)習(xí)的、且基于第五代至強(qiáng)優(yōu)化過的模型,這些開發(fā)者都可以調(diào)用。針對開發(fā)者,英特爾同步更新了其 AI 開發(fā)軟件,可以在第五代至強(qiáng)上的應(yīng)用做到較大優(yōu)化,針對主流大模型、生成式 AI 模型的框架,如 PyTorch 和 TensorFlow,可以無縫拓展至英特爾至強(qiáng)可擴(kuò)展處理器上。
針對第五代至強(qiáng)可擴(kuò)展處理器的諸多變化,英特爾市場營銷集團(tuán)副總裁、中國區(qū)數(shù)據(jù)中心銷售總經(jīng)理兼中國區(qū)運營商銷售總經(jīng)理莊秉翰表示,“基于硬件和軟件的優(yōu)化,第五代至強(qiáng)和第四代至強(qiáng)相比,在 AI 訓(xùn)練、實時推理、批量推理上,基于不同的算法,都可以看到不同性能的提升,最高可提升 40%?!?span style="display:none">PRU28資訊網(wǎng)——每日最新資訊28at.com
莊秉翰表示,“對新興的,尤其是基于云原生的設(shè)計,我們提供能效核,每瓦性能可以做到相對極致,而且因為它的核比較精簡,可以放更多高密度的核數(shù)到每一款的 CPU 和服務(wù)器,所以它會支持面向云的高密度超高能效的運算進(jìn)行能效的優(yōu)化。在近期對于產(chǎn)品淘汰換新的要求中,有一個重要考量因素就是能效比,而我們在今年推出的能效核,也是符合國家對設(shè)備淘汰換新的要求。”
?第五代至強(qiáng)大調(diào)整,性能更強(qiáng)功耗控制更好第五代英特爾至強(qiáng)可擴(kuò)展處理器帶來了五項升級,在制程工藝方面,第五代至強(qiáng)采用 Intel 7 制程,從第四代至強(qiáng)到第五代至強(qiáng),英特爾也關(guān)鍵的技術(shù)指標(biāo)做了改進(jìn),特別是在系統(tǒng)的漏電流控制和動態(tài)電容方面,這兩方面的指標(biāo)都對整個晶體管的性能表現(xiàn)有比較大的影響。通過這些調(diào)整,整體上第五代至強(qiáng)在同等功耗下的頻率可以提升 3%。
芯片布局方面,通過把四片芯片改成兩片芯片的設(shè)計,可以更好的對芯片的面積進(jìn)行控制。通過 MDF 和 SCF 連接,在第五代至強(qiáng)可進(jìn)一步實現(xiàn)芯片之間的高效互連。
在關(guān)鍵表現(xiàn)上,第五代至強(qiáng)做了如下調(diào)整:
?升級到 Raptor Cove 核心。
?核心數(shù)增加,從最多的 60 核升級到 64 核。
?LLC 大小從 1.875MB 增加到 5MB。
?DDR 速度從 4800MT/s提升到了 5600MT/s。
?UPI 速度從 16GT/s提升到 20GT/s。
?SoC 芯片拓?fù)浣Y(jié)構(gòu)更改,4 芯片封裝改為 2 芯片封裝。
?待機(jī)功耗降低。
待機(jī)功耗下降是通過英特爾全集成供電模塊(FIVR),實現(xiàn)不同場景下節(jié)電優(yōu)化。在性能能效方面,與第四代至強(qiáng)相比,第五代至強(qiáng)有兩個數(shù)據(jù)提升比較明顯,一個是常規(guī)的整數(shù)計算,第五代至強(qiáng) SPEC integer 和整數(shù)相關(guān)的一系列的性能評價指標(biāo)有 21% 的提升。針對 AI 負(fù)載,性能提升更多達(dá)到 42%。
為了達(dá)到這一性能提升,英特爾引入了新的 Raptor cove 核心并將四芯片封裝改成兩個芯片,這樣可以減少芯片間的功耗,把更多功耗放在處理器的性能提升上。另外,DDR 的頻率以及 LLC 的提升,這些都是和內(nèi)存帶寬相關(guān)的業(yè)務(wù),有更好的性能表現(xiàn)。
在三級緩存上,第五代至強(qiáng)每個模塊的三級緩存容量達(dá)到了 5MB,所以這款芯片有高達(dá) 320MB 緩存,如果數(shù)據(jù)集不是很大,大部分的數(shù)據(jù)都可以放在 LLC 緩存當(dāng)中,大量減少對內(nèi)存的訪問。而在數(shù)據(jù)停留在緩存里面和到內(nèi)存去訪問,能帶來的性能收益是比較大的。第五代至強(qiáng)在設(shè)計上做到同頻同延遲下密度提升 30%。
內(nèi)存方面,第五代至強(qiáng) DDR 速度從 4800MT/s提升到 5600MT/s,英特爾做了很多優(yōu)化,包括一些 MIM 的內(nèi)存、基板上走線的提升以及片上的低噪聲的供電措施等,還通過 DFE 功能盡可能的減少碼間干擾(ISI)。
軟件解決方案發(fā)展迅速,充分利用第五代至強(qiáng)性能如今數(shù)字化又有了新的需求,英特爾通過新的計算范式支持新的數(shù)字化需求。云計算是 AI 時代離不開的話題,AI 時代下,存在三個瓶頸,一是算力,二是數(shù)據(jù),三是工程化能力。到了 AI 時代,數(shù)據(jù)中心的耗電量問題,也是擺在企業(yè)面前的一座大山。如何提升能效?英特爾的技術(shù)專家提出兩種方式,一是為前端客戶提供智能,二是自身的底層設(shè)施智能化。在過去的 10 年,英特爾致力于構(gòu)建一個完備的生態(tài),通過軟、硬件結(jié)合幫助生態(tài)合作伙伴們充分挖掘和利用底層 CPU 能力。
第五代至強(qiáng)可擴(kuò)展處理器在 AI 推理訓(xùn)練上最高提升了 14 倍,基礎(chǔ)架構(gòu)的存儲能夠達(dá)到 2.8 倍,網(wǎng)絡(luò)邊緣可以達(dá)到 3.2 倍,高性能計算能達(dá)到 3 倍,數(shù)據(jù)分析可以達(dá)到 3.7 倍,這些綜合起來可以獲得了多維度的提升,L3 緩存增加,受益最大的是數(shù)據(jù)庫,AI 和大數(shù)據(jù)分析也會從 L3 的提升中受益。核數(shù)增加之后,“紅利”最大的是科學(xué)計算和大數(shù)據(jù)。核之間 UPI 總線也會越來越快,所以核數(shù)多少對于 AI / 大數(shù)據(jù)比較重要。當(dāng)然若是底層主頻高了,內(nèi)存帶寬大了,4800MT/s提升至 5600MT/s了,那么大家都能獲益。在 AI 當(dāng)中,通過英特爾 AMX 加速器專門針對矩陣運算,性能便會大幅提升。
英特爾在第五代至強(qiáng)產(chǎn)品上充分挖掘 CPU 的能力,通過不同層次的深度挖掘,讓 CPU 更適合 AI 場景,成為 AI 時代全能的大俠。
第五代至強(qiáng)可擴(kuò)展處理器將持續(xù)保持至強(qiáng)平臺性能的領(lǐng)先地位,與第四代至強(qiáng)可擴(kuò)展處理器相比,其 AI 推理的高性能提升高達(dá) 42%,通用計算性能增益 21%。
英特爾擁有開放的生態(tài),也幫助行業(yè)伙伴直接使用,并很好帶動整個生態(tài)的發(fā)展。英特爾始終致力于在 CPU 上部署 AI,并基于 OpenVINO 對整個模型進(jìn)行優(yōu)化、量化。包括推薦、語音識別、圖像識別、基因測序等,英特爾均做了大量的優(yōu)化,尤其是推薦系統(tǒng),其模型非常大,當(dāng) GPU 無法運行的時候,用 CPU 反而是主流的。因為 GPU 不夠的時候,就意味著需要跨 GPU,或者說和 CPU 有頻繁交互。那么,跟主存有頻繁交互的時候,實際上使用 CPU 會更快。因此,對于推薦系統(tǒng)、大模型、稀疏矩陣等,用 CPU 效率更高。
對于通用的 AI 工作負(fù)載,英特爾采用 AMX 和 AVX-512 兩個指令集,基于 OpenVINO 進(jìn)行優(yōu)化。在推理的過程中,指令集上可以進(jìn)行切分,通過加速器定向加速某一部分,整個效果替代傳統(tǒng)的基于 GPU 的 AI 模型。
依靠第五代英特爾至強(qiáng)可擴(kuò)展處理器的硬件特性包括對 AI 的支持及內(nèi)存帶寬和吞吐量的提升使得 AI 推理能力也得到了增強(qiáng),對于最終企業(yè)客戶而言帶來了整體性能的提升。配合軟件優(yōu)化使得在 CPU 上進(jìn)行大模型推理成為可能。CPU 在推理能力上可以與 GPU 媲美,通過 oneCCL 的加持,甚至可以支持 700 億參數(shù)的模型推理,延遲在 100ms 以內(nèi)。
本文鏈接:http://www.www897cc.com/showinfo-26-78151-0.html生成式 AI 算力新臺階,第五代至強(qiáng)可擴(kuò)展處理器詳解
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com