在近日舉行的Google Cloud Next 25大會上,谷歌正式發布了第七代張量處理單元(TPU)Ironwood。作為谷歌迄今為止性能最強、可擴展性最高的定制AI加速器,Ironwood專為推理任務設計,標志著AI計算領域的重要進展。
性能與能效的飛躍
Ironwood是谷歌TPU系列的最新成員,其性能和能效較上一代產品顯著提升。據谷歌介紹,Ironwood的每瓦性能是第六代TPU Trillium的兩倍,能效更是2018年首款云TPU的近30倍。這種提升得益于先進的液冷解決方案和優化的芯片設計,使其在持續高負載下仍能保持穩定運行。
此外,Ironwood在高帶寬內存(HBM)容量和帶寬方面也實現了突破。每芯片的HBM容量高達192GB,是Trillium的6倍,單芯片HBM帶寬達7.2TB/s,是前代產品的4.5倍。這些改進使得Ironwood能夠處理更大規模的AI模型和數據集,同時減少頻繁的數據傳輸需求。
芯片設計與架構創新
Ironwood采用了雙芯片組設計,與之前的單片式TPU不同。據nextplatform報道,這是谷歌首款支持FP8計算的TPU,此前的TPU僅支持INT8和BF16格式。此外,Ironwood還配備了第三代SparseCore加速器,最初用于推薦模型,如今擴展至金融和科學計算領域。
Ironwood的芯片間互連(ICI)帶寬也得到顯著提升,雙向帶寬達1.2Tbps,是Trillium的1.5倍。這使得芯片間通信更高效,為大規模分布式訓練和推理提供了支持。每個Ironwood封裝包含8個HBM內存組,推測為HBM3E,總容量達192GB。
推理時代的突破
據谷歌表示,Ironwood專為支持“思維模型”而設計,這些模型涵蓋大型語言模型(LLM)、混合專家模型(MoE)和高級推理任務。Ironwood的低延遲、高帶寬ICI網絡確保了大規模張量操作的高效執行,同時最大限度地減少了芯片上的數據移動和延遲。
谷歌強調,Ironwood的推出將為AI計算帶來新的可能性。無論是超大規模密集LLM還是具有訓練和推理能力的MoE模型,Ironwood都能提供強大的并行處理能力和高效的內存訪問支持。
本文鏈接:http://www.www897cc.com/showinfo-27-143301-0.html谷歌發布第七代TPU Ironwood:性能與能效雙提升
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 關稅風暴下,芯片供應鏈5月恐陷“砍單潮”
下一篇: 長城電源攜手英諾賽科推出高效氮化鎵鈦金電源
標簽: