AMD
在美國舊金山舉行的AMD Advancing AI全球發表會中,AMD發表資料中心CPU、GPU、網路及AI PC最新產品,其中資料中心CPU發表了代號為Turin的第5代EPYC處理器9005系列,新的伺服器專用處理器採用Zen 5架構,核心數從8到192核心,搭載新處理器的伺服器預計2025年第1季推出。同場發表的還有AI資料中心專用GPU,Instinct系列加速器,包括Insinct MI325X及明年將推出的MI350系列。
AMD執行長蘇姿丰在發表會中表示,在快速發展的AI應用,AI正從分析式AI應用到生成式AI應用,並向代理型的AI應用發展,AMD的策略是在企業的各種AI工作負載提供對應的運算引擎,包括AMD EPYC處理器,以及Instinct系列加速器。
首先在資料中心伺服器,蘇姿丰指出,AMD EPYC處理器的市場營收佔比不斷增加,從2018年營收佔比只有2%,目前營收佔比已達到34%,目前仍在成長中,迄今已有超過350款OEM平臺,超過950個雲端執行個體採用EPYC處理器。
AMD正式發表代號Turin的第5代EPYC伺服器專用處理器,採用3奈米及4奈米製程,內含1,500億個電晶體,核心數從8個核心到最多192個核心,功耗從最低155瓦到500瓦,時脈達5GHz;新一代EPYC處理器相容於第4代EPYC處理器Genoa的SP5平臺,並支援12Ch DDR5-6400記憶體,在I/O方面,採用trusted I/O技術,支援機密運算。
第5代EPYC處理器支援Scale-up向上擴充及Scale-out橫向,其中Scale-up版本內建16個Zen 5 CCDs,擁有128個核心、256個執行緒,而Scale-out版本內建12個Zen 5c CCDs,雖然CCDs數量比較少,但是最多有192個Zen 5c核心、384個執行緒。
回顧EPYC處理器從2017年的第1代EPYC,到2024年的第5代,處理器內的CPU核心數從最初的32個核心,到現在的192個核心,核心數增加6倍,效能方面,第5代EPYC處理器比第1代EPYC提升11倍的效能。
AMD從不同角度來看新一代EPYC處理器帶來的效益,以虛擬化的軟體授權成本為例,同樣64個核心的第5代EPYC處理器9575F,與第4代EPYC的9554、英特爾第5代Xeon 8592+三款處理器相比,第4代EPYC 9554在單一核心效能上比英特爾處理器高出1.2倍,而第5代EPYC處理器9575F則是高出1.6倍,代表在相同核心數的虛擬化軟體授權成本之下,第5代EPYC處理器9575F的單核效能要比英特爾處理器高出60%。
在AI及推論效能方面,相同處理器在機器學習及端到端AI,第5代EPYC和競爭對手相比擁有3倍、3.8倍的AI效能。
第5代EPYC處理器更多的CPU核心,在資料中心有限的空間、供電下,可減少伺服器數量,AMD以1000臺老舊的2P英特爾Xeon Platium 8280伺服器為例,如果汰換為現代伺服器,採用第5代EPYC處理器的伺服器,伺服器數量可減少至131臺,相當於7:1伺服器數量整併比例,減少伺服器數量,意謂著降低TCO總持有成本,減少伺服器用電。
同步發表Instinct MI325X加速器,明年下半年再推MI350
在資料中心專用GPU方面,去年夏天AMD發表Instinct MI300系列,包括APU設計的MI300A,以及MI300X,AMD也推廣ROCm開放軟體平臺,擴大ROCm對AI函式庫的支援,向開發社群招手,擴大Instinct加速器的生態系。
蘇姿丰表示,ROCm經過不斷的調整,在推論及訓練效能已提升2倍效能,支援的模型數量上,透過和Hugging face深化合作,現在支援的模型數量已超過1百萬個。此外,也和AI開發社群、新創深化合作,例如PyTorch、ONNX、TensorFlow,擴大AI生態系統。
今年AMD更新Instinct系列加速器,發表MI325X加速器,採用CDNA 3架構,內建更大的256GB HBM3E記憶體,記憶體頻寬提高到每秒6TB,FP16效能測試下,可達到1.3PF,在FP8效能測試下,可達到2.6PF。
AMD 以MI325X和Nvidia H200 HGX相比,MI325X最大可支援2TB HBM3E,為H200HGX的1.8倍記憶體容量,記憶體頻寬最多可每秒48TB,為H200的1.3倍,在AI模型訓練及推論效能也有所提升。MI325X並未公布價格,但將在今年第4季開始生產,相關系統將在明年第1季推出,根據AMD公布的資料,Dell、技嘉、HPE、Lenovo、Supermicro將會採用。
根據AMD的Instinct系列產品規畫,明年下半年將會發表MI350系列,MI350將會採用3奈米製程,支援FP4及FP6資料類型,並且有別於先前採用的CDNA 3架構,MI350開始採用新的CDNA 4架構,和舊架構相比,推論效能可望達到35倍之多。
AMD展示Instinct MI355X在FP16及FP8測試下,其效能表要比MI325X高出1.8倍,在FP6及FP4,可達到9.2PF。
看好資料中心AI加速器市場持續成長,年複合成長率超過6成,可望從2023年450億美元成長到2028年的5,000億美元,AMD展現持續投入資料中心GPU市場的決心,除了明年下半年的MI350系列,先預告2026年將推出MI400系列,採用下一代CDNA架構。
因應資料中心處理AI工作負載的需求增加,除了發表新一代EPYC處理器,以及Instinct系列AI加速器,資料中心網路產品方面,AMD發表第3代P4引擎,每秒處理多達1.2億個封包,400GB/s傳輸速度。
今天發表採用新的P4引擎資料中心DPU產品,包括AMD Pensando Salina 400,以及另一款也採用P4引擎的Pensando Pollara 400,Pollara支援Ultra Ethernet Consortium聯盟即將推出的UEC1.0標準,支援可編程的硬體Pipeline,提供最高6倍效能加速。
熱門新聞
2024-12-03
2024-11-29
2024-12-02
2024-12-02
2024-12-03