當(dāng)前位置：首頁(yè) > 科技 > 軟件

CPU 也可以完美運(yùn)行大模型英特爾第五代至強(qiáng)重磅發(fā)布

來(lái)源：責(zé)編：時(shí)間：2023-12-23 17:26:08 287觀看

導(dǎo)讀大語(yǔ)言模型 (LLM) 已經(jīng)在多個(gè)領(lǐng)域展示出了卓越的性能和巨大的潛力，然而，要想真正發(fā)揮出這些模型的強(qiáng)大能力，需要強(qiáng)大的算力基礎(chǔ)設(shè)施，而芯片是關(guān)鍵。千呼萬(wàn)喚始出來(lái)，第五代英特爾 ??至強(qiáng) ??可擴(kuò)展處理器，它來(lái)了!若是

大語(yǔ)言模型 (LLM) 已經(jīng)在多個(gè)領(lǐng)域展示出了卓越的性能和巨大的潛力，然而，要想真正發(fā)揮出這些模型的強(qiáng)大能力，需要強(qiáng)大的算力基礎(chǔ)設(shè)施，而芯片是關(guān)鍵。

千呼萬(wàn)喚始出來(lái)，第五代英特爾 ??至強(qiáng) ??可擴(kuò)展處理器，它來(lái)了!

若是用一句話來(lái)概括它的特點(diǎn)，那就是 ——AI 味道越發(fā)得濃厚。

以訓(xùn)練、推理大模型為例:

?與第四代相比，訓(xùn)練性能提升多達(dá) 29%, 推理性能提升高達(dá) 42%;

?與第三代相比，AI 訓(xùn)練和推理性能提升高達(dá) 14 倍。

什么概念?

現(xiàn)在若是將不超過(guò) 200 億參數(shù)的模型“投喂”給第五代至強(qiáng) ??可擴(kuò)展處理器，那么時(shí)延將低到不超過(guò) 100 毫秒!

也就是說(shuō)，現(xiàn)在在 CPU 上跑大模型，著實(shí)是更香了。

而這也僅是英特爾在此次發(fā)布中的一隅，還包括打破自家“祖制”、被稱(chēng)為四十年來(lái)最重大架構(gòu)轉(zhuǎn)變的酷睿??Ultra。

此舉亦是將 AI 的 power 注入到消費(fèi)級(jí) PC 中，用于加速本地的 AI 推理。

除此之外，具體到英特爾長(zhǎng)期在各行各業(yè)扎根的 AI 實(shí)戰(zhàn)應(yīng)用，包括數(shù)據(jù)庫(kù)、科學(xué)計(jì)算、生成式 AI、機(jī)器學(xué)習(xí)、云服務(wù)等等，也隨著第五代至強(qiáng) ??可擴(kuò)展處理器的到來(lái)，在其內(nèi)置的如英特爾 ??AMX、英特爾 ??SGX / TDX 等其他內(nèi)置加速器的幫助下，得到了更大的降本增效。

總而言之，縱觀英特爾此次整場(chǎng)的發(fā)布，AI 可謂貫穿始終。

##最新英特爾處理器，AI 更 Power 了

我們先來(lái)繼續(xù)深入了解一下第五代至強(qiáng) ??可擴(kuò)展處理器披露的更多細(xì)節(jié)。

例如在性能優(yōu)化方面，英特爾將各種參數(shù)做了以下提升:

?CPU 核心數(shù)量增加到 64 個(gè)，單核性能更高，每個(gè)內(nèi)核都具備 AI 加速功能

?采用全新 I / O 技術(shù) (CXL、PCIe5),UPI 速度提升

?內(nèi)存帶寬從 4800 MT/s提高至 5600 MT/s

我們?cè)賮?lái)縱向，與英特爾前兩代產(chǎn)品做個(gè)比較，那么性能提升的結(jié)果是這樣的:

?與上一代產(chǎn)品相比，相同熱設(shè)計(jì)功耗下平均性能提升 21%; 與第三代產(chǎn)品比，平均性能提升 87%。

?與上一代產(chǎn)品相比，內(nèi)存帶寬提升高達(dá) 16%, 三級(jí)緩存容量提升至近 3 倍之多。

不難看出，第五代至強(qiáng) ??可擴(kuò)展處理器與“前任們”相比，在規(guī)格與性能上著實(shí)是有了不小的提升。

但英特爾可不僅僅是披露，而是已經(jīng)將第五代至強(qiáng) ??可擴(kuò)展處理器用起來(lái)，并把實(shí)打?qū)嵉氖褂眯Ч故玖顺鰜?lái)。

例如在大模型的推理方面，京東云便在現(xiàn)場(chǎng)展示了搭載第五代至強(qiáng) ??可擴(kuò)展處理器的新一代自研服務(wù)器所呈現(xiàn)的能力 ——

全部以超過(guò) 20% 的性能提升“姿勢(shì)”亮相!

具體而言，京東云與上一代自研服務(wù)器有了如下的性能提升:

?整機(jī)性能提升達(dá) 123%;

?AI 計(jì)算機(jī)視覺(jué)推理性能提升至 138%;

?Llama 2 推理性能提升至 151%。

這也再一次證明了在五代至強(qiáng) ??上搞大模型，是越發(fā)得吃香了。

而除了大模型之外，像涉及 AI 的各種細(xì)分領(lǐng)域，如整機(jī)算力、內(nèi)存寬帶、視頻處理等等，也有同樣的實(shí)測(cè)結(jié)果。

這份結(jié)果則是來(lái)自采用了第五代英特爾 ? 至強(qiáng) ? 可擴(kuò)展處理器的火山引擎 ——

其全新升級(jí)的第三代彈性計(jì)算實(shí)例，整機(jī)算力提升 39%; 應(yīng)用性能最高提升 43%。

而且在性能提升的基礎(chǔ)上，據(jù)火山引擎透露，通過(guò)其獨(dú)有的潮汐資源并池能力，構(gòu)建了百萬(wàn)核彈性資源池，能夠用近似包月的成本提供按量使用體驗(yàn)，上云成本更低了!

這是由于使用內(nèi)置于第五代至強(qiáng) ??可擴(kuò)展處理器中的加速器時(shí)，可將每瓦性能平均提升 10 倍；在能耗低至 105W 的同時(shí)，也有已針對(duì)工作負(fù)載優(yōu)化的高能效 SKU。

可以說(shuō)是實(shí)打?qū)嵉慕当驹鲂Я恕?span style="display:none">Eza28資訊網(wǎng)——每日最新資訊28at.com

在云計(jì)算和安全性方面，亮出實(shí)測(cè)體驗(yàn)的同樣是來(lái)自國(guó)內(nèi)的大廠 —— 阿里云。

在搭載第五代英特爾 ? 至強(qiáng) ? 可擴(kuò)展處理器及其內(nèi)置的英特爾 ?AMX、英特爾 ?TDX 加速引擎后，阿里云打造了“生成式 AI 模型及數(shù)據(jù)保護(hù)“的創(chuàng)新實(shí)踐，使第 8 代 ECS 實(shí)例在安全性和 AI 性能上都獲得了顯著提升，且保持實(shí)例價(jià)格不變，普惠客戶。

包括推理性能提高 25%、QAT 加解密性能提升 20%、數(shù)據(jù)庫(kù)性能提升 25%, 以及音視頻性能提升 15%。

值得一提的是，內(nèi)置的英特爾 ??SGX / TDX 還可以為企業(yè)分別提供更強(qiáng)也更易用的應(yīng)用隔離能力和虛擬機(jī) (VM) 層面的隔離和保密性，為現(xiàn)有應(yīng)用提供了一條更簡(jiǎn)便的向可信執(zhí)行環(huán)境遷移的路徑。

以及第五代英特爾 ? 至強(qiáng) ? 可擴(kuò)展處理器在軟件和引腳上是與上一代兼容的，還可以大大減少測(cè)試和驗(yàn)證工作。

總的來(lái)說(shuō)，第五代至強(qiáng) ? 可擴(kuò)展處理器可謂“誠(chéng)意滿滿”、表現(xiàn)非常亮眼，而它背后所透露出來(lái)的，正是英特爾在 AI 領(lǐng)域一直都非常重視落地的態(tài)度。

##背后是一部 AI 落地史

事實(shí)上，作為服務(wù)器 / 工作端芯片，英特爾 ? 至強(qiáng) ? 可擴(kuò)展處理器從 2017 年第一代產(chǎn)品開(kāi)始就利用英特爾 ??AVX-512 技術(shù)的矢量運(yùn)算能力對(duì) AI 進(jìn)行加速上的嘗試；而 2018 年在第二代至強(qiáng) ??可擴(kuò)展處理器中導(dǎo)入深度學(xué)習(xí)加速技術(shù) (DL Boost) 更是讓至強(qiáng)成為“CPU 跑 AI”的代名詞；在之后第三代到第五代至強(qiáng) ??可擴(kuò)展處理器的演進(jìn)中，從 BF16 的增添再到英特爾 ??AMX 的入駐，可以說(shuō)英特爾一直在充分利用 CPU 資源的道路上深耕，以求每一代處理器 CPU 都能支持各行各業(yè)推進(jìn) AI 實(shí)戰(zhàn)。

起先是在傳統(tǒng)行業(yè)。

例如第二代至強(qiáng) ??就發(fā)力智能制造，幫助企業(yè)解決海量實(shí)時(shí)數(shù)據(jù)處理挑戰(zhàn)，提升生產(chǎn)線系統(tǒng)效率，完成“肉眼可見(jiàn)”的產(chǎn)能擴(kuò)展。

隨后，至強(qiáng) ? 可擴(kuò)展處理器開(kāi)始在大模型界大展身手。

在 AlphaFold2 掀起的蛋白質(zhì)折疊預(yù)測(cè)熱潮之中，第三代和第四代至強(qiáng) ? 可擴(kuò)展處理器連續(xù)接力，不斷優(yōu)化端到端通量能力。實(shí)現(xiàn)比 GPU 更具性價(jià)比的加速方案，直接拉低 AI for Science 的入場(chǎng)門(mén)檻。

這其中就有從第四代開(kāi)始內(nèi)置于 CPU 中，面向深度學(xué)習(xí)應(yīng)用推出的創(chuàng)新 AI 加速引擎 —— 英特爾 ?AMX 的功勞。作為矩陣相關(guān)的加速器，它能顯著加速基于 CPU 平臺(tái)的深度學(xué)習(xí)推理和訓(xùn)練，提升 AI 整體性能，對(duì) INT8、BF16 等低精度數(shù)據(jù)類(lèi)型都有著良好的支持。

與此同時(shí)，在大模型時(shí)代的 OCR 技術(shù)應(yīng)用，也被第四代至強(qiáng) ? 可擴(kuò)展處理器賦予了新的“靈魂”，準(zhǔn)確率飆升、響應(yīng)延遲更低。

同樣，就在不久之前，借助第四代至強(qiáng) ??可擴(kuò)展處理器在 NLP 上的優(yōu)化，專(zhuān)攻醫(yī)療行業(yè)的大語(yǔ)言模型也成功以較低成本在醫(yī)療機(jī)構(gòu)部署落地。

在 AI 技術(shù)越來(lái)越深入各行各業(yè)的大趨勢(shì)之下，至強(qiáng) ? 可擴(kuò)展處理器讓我們看到，它所代表的 CPU 解法完全能夠有所作為、能夠讓不少 AI 應(yīng)用在部署更為廣泛、獲取更加容易、應(yīng)用門(mén)檻也更低的 CPU 平臺(tái)上獲得實(shí)實(shí)在在的落地開(kāi)花。

第五代至強(qiáng) ? 可擴(kuò)展處理器的發(fā)布，則讓這個(gè)進(jìn)程更進(jìn)一步。

當(dāng)然 ——

這一成績(jī)的背后，確實(shí)是因?yàn)榇蠹覍?duì)“在 CPU 上跑 AI”這件事上有需求，以及它本身也有極其深厚的價(jià)值和優(yōu)勢(shì)。

先說(shuō)需求，無(wú)論是傳統(tǒng)企業(yè)推進(jìn)智能化改造，還是 AI for Science、生成式 AI 等新興技術(shù)的蓬勃發(fā)展，都需要強(qiáng)大的算力來(lái)驅(qū)動(dòng)。

但大家面臨的局勢(shì)卻是: 專(zhuān)門(mén)的加速芯片供不應(yīng)求，采購(gòu)難不說(shuō)，成本也十分高昂，因此還遠(yuǎn)遠(yuǎn)不夠普及。

于是一部分人自然將目光投向 CPU:

這個(gè)現(xiàn)實(shí)中最為“觸手可及”的硬件，如果直接加以利用，豈不是事半功倍?

這就引出 CPU 的價(jià)值和優(yōu)勢(shì)。

就拿當(dāng)下熱門(mén)話題生成式 AI 來(lái)說(shuō)，如果想在生產(chǎn)環(huán)境中普及這一能力，就得盡可能地控制成本。

相比訓(xùn)練來(lái)說(shuō)，AI 的推理對(duì)算力資源需求沒(méi)有那么夸張，交給 CPU 完全能夠勝任 —— 不僅延遲更低，能效也更高。

像一些行業(yè)和業(yè)務(wù)，推理任務(wù)沒(méi)有那么繁重，選擇 CPU 無(wú)疑更具性價(jià)比。

此外，利用 CPU 直接進(jìn)行部署還能讓企業(yè)充分利用既有 IT 基礎(chǔ)設(shè)施，避免異構(gòu)平臺(tái)的部署難題。

以上，我們也就能夠理解: 在傳統(tǒng)架構(gòu)中引入 AI 加速，就是 CPU 在這個(gè)時(shí)代的新宿命。

而英特爾做的，就是竭盡全力幫大家挖掘、釋放其中的價(jià)值。

##駕馭整個(gè) AI 管線，且不止 CPU

最后，我們?cè)倩氐浇裉斓闹鹘? 第五代英特爾 ? 至強(qiáng) ? 可擴(kuò)展處理器。

實(shí)話說(shuō)，如果和專(zhuān)門(mén)的 GPU 或 AI 加速芯片相比，它可能確實(shí)還不夠炫，但主打親民、易用 (開(kāi)箱即用，配套的軟件和生態(tài)越發(fā)完善)。

更值得我們注意的是，就算在有專(zhuān)用加速器的場(chǎng)合，CPU 無(wú)論是從數(shù)據(jù)預(yù)處理，還是模型開(kāi)發(fā)和優(yōu)化，再到部署和使用，也可以成為 AI pipeline 的一部分。

其中尤其在數(shù)據(jù)預(yù)處理階段，它已可以稱(chēng)得上是主角的存在。

無(wú)論是以 GB 還是 TB 計(jì)，甚至更大的數(shù)據(jù)集，基于至強(qiáng) ? 可擴(kuò)展處理器所打造的服務(wù)器，都能通過(guò)支持更大內(nèi)存、減少 I / O 操作等優(yōu)勢(shì)，提供高效的處理和分析，節(jié)省 AI 開(kāi)發(fā)中這一最瑣碎耗時(shí)任務(wù)的時(shí)間。

基于以上，我們也不得不感嘆，如今英特爾在談 AI 時(shí)，話題更多樣化了。

再加上它在 GPU 和專(zhuān)門(mén)的 AI 加速芯片上也有布局，“武器庫(kù)”里的選擇也更多了，火力覆蓋的能力也更全面了。

毫無(wú)疑問(wèn)，這一切，都指向英特爾全面加速 AI 的決心。

即用一系列具有性價(jià)比的產(chǎn)品組合來(lái)快速滿足不同行業(yè)的 AI 落地需求。

AI 落地時(shí)代開(kāi)始了，英特爾的機(jī)會(huì)也來(lái)了?

本文鏈接：http://www.www897cc.com/showinfo-26-52926-0.htmlCPU 也可以完美運(yùn)行大模型英特爾第五代至強(qiáng)重磅發(fā)布

聲明：本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí)，若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。郵件：2376512515@qq.com

上一篇：黑鯊：正在籌備智能魔方產(chǎn)品功能的完整回歸，現(xiàn)招募創(chuàng)作者

下一篇：來(lái)京東參與榮耀 90 GT“先人一步”計(jì)劃新品現(xiàn)貨提前開(kāi)搶

標(biāo)簽：

熱門(mén)焦點(diǎn)

一加Ace2 Pro官宣：普及16G內(nèi)存引領(lǐng)24G

一加官方今天繼續(xù)為本月發(fā)布的新機(jī)一加Ace2 Pro帶來(lái)預(yù)熱，公布了內(nèi)存方面的信息?！疤蕴?8GB ，12GB 起步，16GB 普及，24GB 引領(lǐng)，還有呢？#一加Ace2Pro#，2023 年 8 月，敬請(qǐng)期待?！蓖瑫r(shí)
消息稱(chēng)迪士尼要拍真人版《魔發(fā)奇緣》：女主可能也找黑人演員

8月5日消息，迪士尼確實(shí)有點(diǎn)忙，忙著將不少動(dòng)畫(huà)改成真人版，繼《美人魚(yú)》后，真人版《白雪公主》、《魔發(fā)奇緣》也在路上了。據(jù)外媒消息稱(chēng)，迪士尼將打造真人版
一加首款折疊屏！一加Open渲染圖出爐：罕見(jiàn)單手可握小尺寸

8月5日消息，此前就有爆料稱(chēng)，一加首款折疊屏手機(jī)將會(huì)在第三季度上市，如今隨著時(shí)間臨近，新機(jī)的各種消息也開(kāi)始浮出水面。據(jù)悉，這款新機(jī)將會(huì)被命名為“On
企業(yè)采用CRM系統(tǒng)的11個(gè)好處

客戶關(guān)系管理（CRM）軟件可以為企業(yè)提供很多的好處，從客戶保留到提高生產(chǎn)力?！　RM軟件用于企業(yè)收集客戶互動(dòng)，以改善客戶體驗(yàn)和滿意度?！　RM軟件市場(chǎng)規(guī)模如今超過(guò)580
品牌洞察丨服務(wù)本地，美團(tuán)直播成效幾何？

來(lái)源：17PR7月11日，美團(tuán)App首頁(yè)推薦位出現(xiàn)“美團(tuán)直播”的固定入口。在直播聚合頁(yè)面，外賣(mài)“神槍手”直播間、美團(tuán)旅行直播間、美團(tuán)買(mǎi)菜直播間等均已上線，同時(shí)
國(guó)行版三星Galaxy Z Fold5/Z Flip5發(fā)布售價(jià)7499元起

2023年8月3日，三星電子舉行Galaxy新品中國(guó)發(fā)布會(huì)，正式在國(guó)內(nèi)推出了新一代折疊屏智能手機(jī)三星Galaxy Z Fold5與Galaxy Z Flip5，以及三星Galaxy Tab S9
OPPO K11采用全方位護(hù)眼屏：三大護(hù)眼能力減輕視覺(jué)疲勞

日前OPPO官方宣布，全新的OPPO K11將于7月25日正式發(fā)布，將主打旗艦影像，和同檔位競(jìng)品相比，其最大的賣(mài)點(diǎn)就是將配備索尼IMX890主攝，堪稱(chēng)是2000檔位影像表
最薄的14英寸游戲筆記本電腦 Alienware X14已可以購(gòu)買(mǎi)

2022年1月份在國(guó)際消費(fèi)電子展(CES2022)上首次亮相的Alienware新品——Alienware X14現(xiàn)在已經(jīng)可以購(gòu)買(mǎi)了，這款筆記本電腦被譽(yù)為世界上最薄的 14 英寸游戲筆
親歷馬斯克血洗Twitter，硅谷的苦日子在后頭

文/劉哲銘　　編輯/李薇　　馬斯克再次揮下裁員大刀?！　∶绹?guó)時(shí)間11月14日，Twitter約4400名外包員工遭解雇，此次被解雇的員工的主要工作為內(nèi)容審核等。此前，T

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

CPU 也可以完美運(yùn)行大模型英特爾第五代至強(qiáng)重磅發(fā)布

一加Ace2 Pro官宣：普及16G內(nèi)存引領(lǐng)24G

消息稱(chēng)迪士尼要拍真人版《魔發(fā)奇緣》：女主可能也找黑人演員

一加首款折疊屏！一加Open渲染圖出爐：罕見(jiàn)單手可握小尺寸

企業(yè)采用CRM系統(tǒng)的11個(gè)好處

品牌洞察丨服務(wù)本地，美團(tuán)直播成效幾何？

國(guó)行版三星Galaxy Z Fold5/Z Flip5發(fā)布售價(jià)7499元起

OPPO K11采用全方位護(hù)眼屏：三大護(hù)眼能力減輕視覺(jué)疲勞

最薄的14英寸游戲筆記本電腦 Alienware X14已可以購(gòu)買(mǎi)

親歷馬斯克血洗Twitter，硅谷的苦日子在后頭

最新推薦

猜你喜歡

熱門(mén)推薦

相關(guān)資訊

CPU 也可以完美運(yùn)行大模型 英特爾第五代至強(qiáng)重磅發(fā)布

最新推薦

猜你喜歡

熱門(mén)推薦

相關(guān)資訊

CPU 也可以完美運(yùn)行大模型英特爾第五代至強(qiáng)重磅發(fā)布