來源:科技新報(臺)作者:癡漢水球
8 核心,采用某種RISC指令集(也許是RISC-V)。
總計528條線程,代表一個核心高達66條。
8 核心處理器與四個硅光(Silicon Photonics)組件,借助2.5D 封裝技術 EMIB 封裝在一起。
每個處理器通過32個光學傳輸接口連結其他處理器,16個處理器組成一個OCP(Open Compute Platform)抽屜,再一路堆成計算機架。
如果直接搜尋「Silicon Photonics」,可能會先看到一堆英特爾銷售的光學收發器(Optical Transceiver),以及「結合20 世紀兩項最重要的發明:硅晶集成電路和半導體激光」。2016 年開始,英特爾銷售數百萬個 100G 和更高帶寬的光學收發器(800G 也即將登場),用于各種數據通信,特別是數據中心交換器光學互連,替英特爾創造十幾億美元業績。或也會找到英特爾將交換機芯片直接和光學收發器封裝在一起的應用案例(Co-Packaged Optical Switch)。
▲ 隨著數據中心網絡帶寬激增,網絡交換機芯片在電路板上的銅線,將電子訊號傳遞到可抽換式光學收發器(如 10 / 40GbE 的 SFP+ 和 QSFP+,以及用于 25 / 100GbE 的 SFP28 / QSFP28)進行光電轉換的「傳統」方法,導致訊號處理難度水漲船高,將光學收發器直接和交換機芯片「送做堆」也自然而生,且可大幅降低制造成本與耗電量, 實現更高密度的網絡端口數量。 但英特爾對Silicon Photonics的期待和野心遠不只此,早在本世紀初就試圖挖掘硅晶圓上制造光學傳輸組件的商業價值和應用潛力。硅晶圓的巨大量產能力,會大幅降低光纖通信設備的價格,更有助半導體元件和光學傳輸元件整合,因只要是金屬導線(銅為主)都會產生電子交互作用問題,電流流通衍生的電阻會導致發熱,導線隔絕層也造成許多技術困難,無論處理器和電腦系統,由內到外,都被聯系每個功能組件的導線材料重重限制,但用光信號通信就不用這么麻煩。 假若以「光連線」取代「電連線」,不限芯片和系統通信,甚至連芯片內都比照辦理,以上障礙將統統迎刃而解,會劇烈沖擊既有計算機架構設計,尤其并行化系統。更有甚者,過去「運算」和「通信」是兩個不同產業,但「Silicon Photonics」可能推動兩者整合。 英特爾早在20幾年前就投入「Silicon Photonics」研究,2004年2月春季IDF(Intel Developer Forum)首度公布硅晶圓光調制器(Optical Modulator),并同步發表于權威科學期刊《自然》(Nature),英特爾之前,其他使用硅晶圓生產的光學調變器,最高速度僅20MHz,英特爾卻一口氣推上 1GHz。那時光調制器和其他光學功能組件,大部分以砷化鎵(GaAS)的III-V族半導體及氧化鋰鈮(Lithium Niobate)為主要材料,制造成本相當高昂,英特爾就造成半導體制程巨大突破。 2006 年 9 月,英特爾宣布與加州大學圣芭疤拉分校研究員,一同找出可制造低價激光硅芯片的方法,混合硅和磷化銦(Indium Phosphide)兩種材質結合成單一芯片,讓芯片在電腦中可透過激光光傳輸資料,速度比銅線快許多,也奠定了今日英特爾硅光學元件的基礎。 2008 年 12 月,發布硅晶圓累崩光電偵測器(APD,Avalanche Photodetector),可應用數十公里長、40Gbps 以上遠距離傳輸,也超越更昂貴的銦(indium)。 2010 年 8 月,英特爾混合硅晶激光(Hybrid Silicon Laser)達 50Gbps,等于每秒傳送一部高畫質電影。 2016 年 8 月 IDF,英特爾宣布「Silicon Photonics」量產供貨并推出多款 100GbE 光學收發器,象征硅晶圓光學元件商業化。 談完「Silicon Photonics」,現在知道英特爾這顆實驗性處理器是經光學網絡傳輸互連,而如此夸張的「528 線程」數量又是怎么回事?
英特爾是為了DARPA(Defense Agencies Research Program Agency,美國國防高等研究計劃署)的HIVE(Hierarchical Identify Verify Exploit)圖像分析處理器做出這東西,目標要比現在技術快千倍。當英特爾分析工作負載時,發現是大規模平行處理,快取內存利用率很差,大而無當的非循序(Out-Of-Order Execution)指令執行流水線則根本派不上用場。
接著就好好瞧瞧英特爾的簡報。
▲ 研究案背后關鍵動機是 DARPA HIVE 計劃的超稀疏資料,讓「傳統」處理器微架構發揮不了作用。
▲ 快取內存和非循序指令執行流水線都沒有好好利用。
▲ 核心:66 條硬件線程 192kB 快取內存(指令加數據)4MB 專屬 SRAM 處理器腳座:8 核心32個光學I/O端口(個別單向32GB/s帶寬)32GB DDR5-4400內存 OCP抽屜:16 顆處理器16TB/s 總單向傳輸帶寬0.5TB 容量 DRAM
▲ 每核心有四個多 16 條執行程流水線和兩個單線程流水線,66 這數字就是這么來的。
▲ 連接芯片所有核心的路由器架構,總計 10 端口。
5GRgicGcb91clt6qhvLD6lZvnCEXOxnymwMriceohpsNACHNw/640?wx_fmt=png" data-w="1080" data-index="8" _width="100%" crossorigin="anonymous" alt="圖片" data-fail="0" style="margin: 0px; padding: 0px; outline: 0px; max-width: 100%; box-sizing: border-box; overflow-wrap: break-word !important; vertical-align: middle; height: auto !important; width: 677px; visibility: visible !important;"/>
▲ 單一處理器內部有 16 個路由器組成內網,一半是為了提供更多高速 I/O 帶寬。
▲ 處理器之間都是硅光學元件組織的 HyperX 拓樸網絡,即使處理器并不在同一個 OCP 抽屜,無須添加交換機和網卡也能互連。
▲ 使用 2.5D 封裝技術 EMIB,包入一顆主要運算芯片和四顆硅光收發器。
▲ 光學傳輸性能,含理論帶寬和延遲。
▲ 總功耗約 75W,59% 為硅光元件使用,運算核心僅占 21%。
▲ 模擬到測量的工作負載延展性。
▲▲ 運算芯片的物理規格,制程是臺積電7納米,276億晶體管,316平方毫米。單一核心 12 億晶體管,9.3 平方毫米。
▲ 芯片封裝和測試用主板,可清楚看到處理器拉出來的光纖。
▲ 計劃概要,總之英特爾還在實驗,理論上 HyperX 拓樸網路可延伸超過 10 萬個 OCP 抽屜和 100 萬個處理器,一個 16 處理器的 OCP 抽屜僅 1200W 功耗,是非常驚人的成就,難以想象換成銅線會是怎樣。 歷經「20 年磨一劍」發展,英特爾「Silicon Photonics」總算看似開花結果,巨大多處理器系統造成革命性進展,更讓人不得不好奇,講了這么多年,英特爾何時會在一般商業產品,導入這些驚世駭俗的成果,搞不好有機會一舉扭轉現在劣勢。
本文鏈接:http://www.www897cc.com/showinfo-27-9423-0.html一款非常神奇的處理器
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 黃仁勛套現