日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 數碼

AMD Zen5架構深入解讀:頻率降低、性能卻飛升的秘密找到了!

來源: 責編: 時間:2024-08-09 08:47:03 338觀看
導讀 之前趁著參加AMD Zen5技術日活動,我們和大家分享過Zen5的架構設計特性,但和以往不同,當時公布的資料并不多,并未涉及到架構底層細節,也缺乏和Zen4的全面對比。近,AMD更新了Zen5架構技術文檔,終于公布了我們想要的

之前趁著參加AMD Zen5技術日活動,我們和大家分享過Zen5的架構設計特性,但和以往不同,當時公布的資料并不多,并未涉及到架構底層細節,也缺乏和Zen4的全面對比。3qI28資訊網——每日最新資訊28at.com

近,AMD更新了Zen5架構技術文檔,終于公布了我們想要的大量細節,包括各個微架構模塊的具體變化,包括桌面端、移動端的異同,包括Zen5、Zen5c的新理念,包括同樣升級的RDNA 3.5 GPU、XDNA 2 NPU。3qI28資訊網——每日最新資訊28at.com

AMD Zen5架構深入解讀:頻率降低、性能卻飛升的秘密找到了!3qI28資訊網——每日最新資訊28at.com

AMD Zen5架構深入解讀:頻率降低、性能卻飛升的秘密找到了!3qI28資訊網——每日最新資訊28at.com

任何工作都要有目標,CPU架構設計當然也是如此。3qI28資訊網——每日最新資訊28at.com

Zen5的目標就很簡單,核心就是繼續大幅提升單核、雙核性能,為未來奠定新的基礎,同時實現滿血版AVX-512,支持可配置的256/512位浮點數據路徑,有助于大大提升AI能力。3qI28資訊網——每日最新資訊28at.com

令人唏噓的是,Intel 12代酷睿開始采用異構混合架構,其中E核不支持AVX-512,導致整體不得不放棄。3qI28資訊網——每日最新資訊28at.com

Zen5還有一個重要使命就是進一步普及緊湊版核心,也就是Zen5c,包括移動端和服務器端。3qI28資訊網——每日最新資訊28at.com

上一代其實就有了Zen4、Zen4c,并在數據中心端大放異彩,而在移動端只是非常低調地小試牛刀,這次要大面積普及。3qI28資訊網——每日最新資訊28at.com

不過AMD明確表示,Zen5c這種設計在桌面端不會使用,原因后邊再講。3qI28資訊網——每日最新資訊28at.com

另外,更靈活、更高的能效,4/3nm工藝支持,ISA指令集增強,也是Zen5的主要任務。3qI28資訊網——每日最新資訊28at.com

AMD Zen5架構深入解讀:頻率降低、性能卻飛升的秘密找到了!3qI28資訊網——每日最新資訊28at.com

Zen5微架構總覽,從前端到后端,從整數到浮點,從緩存到帶寬,都進行了全面升級,后邊會一一講述。3qI28資訊網——每日最新資訊28at.com

緩存部分是大家經常見到也比較容易理解的。3qI28資訊網——每日最新資訊28at.com

Zen5的一級指令緩存容量還是32KB,8路關聯,每時鐘周期兩組32B拾取;3qI28資訊網——每日最新資訊28at.com

一級數據緩存容量增至48KB,12路關聯,每時鐘周期4個內存操作。3qI28資訊網——每日最新資訊28at.com

還有個特殊的操作緩存(Op-Cache),支持6個指令,每時鐘周期支持兩組6個寬度的拾取。3qI28資訊網——每日最新資訊28at.com

二級緩存容量還是1MB,16路關聯。3qI28資訊網——每日最新資訊28at.com

AMD Zen5架構深入解讀:頻率降低、性能卻飛升的秘密找到了!3qI28資訊網——每日最新資訊28at.com

分支預測與拾取部分做了極大的優化提升,比如支持“零泡沫”(zero-bubble)條件分支,意味著分支預測器在訪問BTB(分支目標緩沖)時無需付出任何代價。3qI28資訊網——每日最新資訊28at.com

L1、L2 BTB也提升了容量(1.5K/7K來到16K/8K)和精度,并增大了TAGE,這對有條件的間接分支都很關鍵。3qI28資訊網——每日最新資訊28at.com

另外,每時鐘周期拾取和解碼指令數從32B翻番到64B,返回尋址堆棧從32個變為52個,每時鐘周期支持多3個預測窗口,指令緩存的延遲和帶寬也都有所改善。3qI28資訊網——每日最新資訊28at.com

AMD Zen5架構深入解讀:頻率降低、性能卻飛升的秘密找到了!3qI28資訊網——每日最新資訊28at.com

新的指令解碼系統,配備了雙解碼流水線,可以獨立并行處理指令流,每條每時鐘周期4條指令。3qI28資訊網——每日最新資訊28at.com

操作緩存(OpCache)關聯路數增加1/3達到了16路,可存儲多6條指令,配合雙流水線,每時鐘周期就是12條指令。3qI28資訊網——每日最新資訊28at.com

在開啟SMT多線程的時候,每個線程都是一條流水線。3qI28資訊網——每日最新資訊28at.com

另外還很關鍵的是,通往整數和浮點單元的分派隊列寬度從6個增至8個宏操作(macro-op),并支持操作融合,可以讓來自某些指令的兩個宏操作作為一個來處理。3qI28資訊網——每日最新資訊28at.com

AMD Zen5架構深入解讀:頻率降低、性能卻飛升的秘密找到了!3qI28資訊網——每日最新資訊28at.com

整數單元本就是Zen架構的強項,現在更加“膨脹”,分派、重命名、引退達到了8個寬度。3qI28資訊網——每日最新資訊28at.com

ALU整數邏輯單元從4個增至6個,包括3個乘法單元和3個分支單元,ALU調度器也從24個大幅增至88個。3qI28資訊網——每日最新資訊28at.com

AGU地址生成單元從3個增至4個,每時鐘周期可執行4次內存尋址,AGU調度器從48個獨立、24個與ALU共享變為獨立的56個。3qI28資訊網——每日最新資訊28at.com

可以說,整數單元的大大強化,是銳龍9000系列在加速頻率微增或不動、基準頻率降低情況下取得性能大幅提升的關鍵所在。3qI28資訊網——每日最新資訊28at.com

AMD Zen5架構深入解讀:頻率降低、性能卻飛升的秘密找到了!3qI28資訊網——每日最新資訊28at.com

矢量和浮點能力也顯著增強,尤其是AVX-512指令集終于可以支持完整的512位數據路徑,同時保留256位,非常靈活,可以兼顧高性能、高效率,也不至于讓功耗失控。3qI28資訊網——每日最新資訊28at.com

整個浮點執行單元的帶寬和延遲都做了升級,包括4條浮點執行流水線(Zen4 3條)、3×38個浮點調度器(Zen4 2×32個)、2條載入存儲與整數寄存器流水線、每時鐘周期2個512位載入和1個512位存儲、雙循環FADD,等等。3qI28資訊網——每日最新資訊28at.com

AMD Zen5架構深入解讀:頻率降低、性能卻飛升的秘密找到了!3qI28資訊網——每日最新資訊28at.com

一二級緩存部分的數據帶寬全面擴充,尤其是一級數據緩存來到了12路48KB,4條載入/存儲流水線每時鐘周期可以執行4個載入(Zen4還是3個)和2個存儲,4條整數載入流水線可以合并為2條。3qI28資訊網——每日最新資訊28at.com

外還全面涉及TLB、實時窗口、數據預取等等部分。3qI28資訊網——每日最新資訊28at.com

AMD Zen5架構深入解讀:頻率降低、性能卻飛升的秘密找到了!3qI28資訊網——每日最新資訊28at.com

指令新增加的不算很多,AVX-512仍是重點,包括拓展至VEX編碼的VNNI/VEX、矢量配對為一對掩碼寄存器的VP2INTERSECT[DQ]。3qI28資訊網——每日最新資訊28at.com

另外就是PMC虛擬化,可為客戶機提供更好的安全保障,以及異構拓撲,顯然是為Zen5、Zen5c的組合準備的。3qI28資訊網——每日最新資訊28at.com

AMD Zen5架構深入解讀:頻率降低、性能卻飛升的秘密找到了!3qI28資訊網——每日最新資訊28at.com

Zen5、Zen4技術規格細節對比,也是對上邊所講的一個概括。3qI28資訊網——每日最新資訊28at.com

注意所有列出的參數都變了,從前端到執行單元到緩存,因此可以說Zen5是一次全面性的架構翻新,即所謂的“大改”,這才有了頻率下來了但性能上去了的神奇結果。3qI28資訊網——每日最新資訊28at.com

AMD Zen5架構深入解讀:頻率降低、性能卻飛升的秘密找到了!3qI28資訊網——每日最新資訊28at.com

Zen5、Zen5c二者架構設計、IPC性能、ISA指令集都是完全相同的,也都支持多線程,對于操作系統和應用軟件而言是透明和等價的,基本上不需要特別考慮調度問題,這和Intel的異構大小核天然不同。3qI28資訊網——每日最新資訊28at.com

Zen5的追求是盡可能高的單核頻率與單核性能,還有足夠大的三級緩存。3qI28資訊網——每日最新資訊28at.com

Zen5c則降低了頻率,提高了能效,同時精簡了部分三級緩存。3qI28資訊網——每日最新資訊28at.com

AMD Zen5架構深入解讀:頻率降低、性能卻飛升的秘密找到了!3qI28資訊網——每日最新資訊28at.com

Zen5 CCX模塊的核心與緩存體系結構圖。3qI28資訊網——每日最新資訊28at.com

一級指令緩存基本沒變,還是32KB容量,8路關聯。3qI28資訊網——每日最新資訊28at.com

一級數據緩存容量增大一半來到48KB,12路關聯也增多了一半,并且帶寬翻番,與CPU核心之間每時鐘周期支持4個載入與2個存儲。3qI28資訊網——每日最新資訊28at.com

二級緩存容量還是每核心1MB,但是關聯路數翻了一番達到16路,帶寬也翻了一番,與一級緩存之間是每時鐘周期翻番到64B,與三級緩存之間是每時鐘周期32B,雙向都是如此。3qI28資訊網——每日最新資訊28at.com

三級緩存每CCX 16MB,16路關聯,但是降低了延遲,提高了命中率。3qI28資訊網——每日最新資訊28at.com

AMD Zen5架構深入解讀:頻率降低、性能卻飛升的秘密找到了!3qI28資訊網——每日最新資訊28at.com

Zen5架構在桌面臺式機、移動筆記本、服務器數據中心三大領域采取了不同的產品設計和試實現方式,都非常有針對性。3qI28資訊網——每日最新資訊28at.com

桌面上,經典chiplet設計,一個或兩個CCD(等同于CCX),外加完全延續上代設計的IOD,架構上是純粹的Zen5,不會用Zen5c。3qI28資訊網——每日最新資訊28at.com

筆記本上,繼續單芯片,雙CCX組合成一個CCD。全部是Zen5、Zen5c的組合,多分別4個、8個。3qI28資訊網——每日最新資訊28at.com

服務器上(包括嵌入式),設計更加靈活,CCX有的更大有的更小,Zen5、Zen5c都會有,但應該會和Zen4、Zen4c一樣發展各自的產品線,不會混合使用。3qI28資訊網——每日最新資訊28at.com

AMD Zen5架構深入解讀:頻率降低、性能卻飛升的秘密找到了!3qI28資訊網——每日最新資訊28at.com

AMD Zen5架構深入解讀:頻率降低、性能卻飛升的秘密找到了!3qI28資訊網——每日最新資訊28at.com

代號Granite Ridge的桌面版銳龍9000系列的裸片、核心布局圖。3qI28資訊網——每日最新資訊28at.com

和之前基本一致,每一組CCX/CCD里有8個核心、8MB二級緩存、32MB三級緩存,但注意兩種CCX/CCD是不互通的,所以哪怕12/16核心型號有64MB三級緩存,但每個核心多也只能訪問自己所在CCX/CCD里的32MB。3qI28資訊網——每日最新資訊28at.com

當然理論上可以通過IF總線跨越訪問,但是帶寬太低、延遲太高,沒法用。3qI28資訊網——每日最新資訊28at.com

IOD部分和銳龍7000系列上是一樣的,因此同樣有2個RDNA2架構的GPU CPU單元、128位雙通道DDR5-5600內存控制器、28條PCIe 5.0總線、5個USB接口、四組顯示輸出。3qI28資訊網——每日最新資訊28at.com

AMD Zen5架構深入解讀:頻率降低、性能卻飛升的秘密找到了!3qI28資訊網——每日最新資訊28at.com

AMD Zen5架構深入解讀:頻率降低、性能卻飛升的秘密找到了!3qI28資訊網——每日最新資訊28at.com

代號Strix Point的移動版銳龍AI 300系列的裸片、核心布局圖。3qI28資訊網——每日最新資訊28at.com

變化還是挺大的,上一代Zen4、Zen4c組合只在兩款低端型號上低調嘗試,這次變成了標準的Zen5、Zen5c組合。3qI28資訊網——每日最新資訊28at.com

注意看左上角,分了兩個黃色框圖,4個Zen5核心和對應的16MB三級緩存是一組,8個Zen5c核心和對應的8MB是另一組,也就是和桌面上類似甚至更極端,Zen5、Zen5c三級緩存各用各的,沒法互通,24MB也只是個總容量。3qI28資訊網——每日最新資訊28at.com

GPU部分是RDNA3.5架構,8組WGP也就是16個CU,1024個流處理器。NPU部分是48陣列的XDNA 2架構。這倆大家都很熟悉了。3qI28資訊網——每日最新資訊28at.com

IO部分,支持128位LPDDR5X-7500/DDR5-5600內存、16條PCIe 4.0、8個USB接口,包括兩個USB4。3qI28資訊網——每日最新資訊28at.com

AMD Zen5架構深入解讀:頻率降低、性能卻飛升的秘密找到了!3qI28資訊網——每日最新資訊28at.com

RDNA 3.5架構的GPU在紋理子系統、著色器子系統、光柵子系統、顯存/內存子系統等各個方面做了優化和增強,采樣率等部分指標性能翻番,可以和LPDDR5X內存更好地搭配,壓縮率也更高。3qI28資訊網——每日最新資訊28at.com

當然規模也增大了,12個CU變16個CU,4個渲染后端(RB+),高頻率提升至2.9GHz,理論性能提升了大約30%,只是由于驅動還不到位,目前在游戲性能上還沒釋放出來。3qI28資訊網——每日最新資訊28at.com

AMD Zen5架構深入解讀:頻率降低、性能卻飛升的秘密找到了!3qI28資訊網——每日最新資訊28at.com

XDNA2架構的NPU AI引擎,號稱第一個為“Win24”做好準備的x86處理器NPU,不過現在能用到NPU的應用還是太少了,無論AMD還是Intel。3qI28資訊網——每日最新資訊28at.com

AMD Zen5架構深入解讀:頻率降低、性能卻飛升的秘密找到了!3qI28資訊網——每日最新資訊28at.com

總的來說,Zen5作為一次大規模的架構升級,從目前表現來看是相當成功的,無論筆記本上的銳龍AI 300系列,還是桌面上的銳龍9000系列,性能、能效都提升巨大、可圈可點,服務器上的第五代EPYC同樣值得期待。3qI28資訊網——每日最新資訊28at.com

Intel方面即將拿出對位的Arrow Lake,錯失一代之后終于回歸高性能之爭,又一場好戲開始了!3qI28資訊網——每日最新資訊28at.com

AMD Zen5架構深入解讀:頻率降低、性能卻飛升的秘密找到了!3qI28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-24-106638-0.htmlAMD Zen5架構深入解讀:頻率降低、性能卻飛升的秘密找到了!

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 蘋果擬推出迄今小臺式電腦:Mac mini首次改變設計

下一篇: 不止華為!WIKO AMD外置顯卡兼容聯想ThinkBook16、LG Gram

標簽:
  • 熱門焦點
Top 主站蜘蛛池模板: 景德镇市| 余江县| 化德县| 宁都县| 福泉市| 巩留县| 叶城县| 剑阁县| 佛冈县| 天柱县| 白山市| 黔西| 古丈县| 伊川县| 太保市| 普安县| 繁峙县| 灵川县| 河间市| 冕宁县| 右玉县| 南丰县| 东平县| 安多县| 嵩明县| 宾川县| 甘谷县| 资中县| 津市市| 东明县| 丰台区| 水富县| 青川县| 乌拉特前旗| 太谷县| 深圳市| 甘德县| 靖江市| 云林县| 定襄县| 博爱县|