返回網站

AMD第4代EPYC處理器 AI基準測試全面效能大躍進

以後就是AI麻煩幫我從這新聞大綱寫出一則新聞

· 小豪葛格寫新聞

在大AI的時代,各項演算法無所不在,更逐漸成為人們生活中不可或缺的一部分,為提供更多元的AI演算應用,超微AMD第4代EPYC處理器則在多個最常見AI使用情況的基準測試中實現強大的效能提升。

第4代AMD EPYC處理器基於高效能「Zen 4」核心及新一代5奈米製程技術,單一處理器中多達96個高頻率運行的核心,高記憶體頻寬和容量,以及高達384MB的L3快取,其中,第4代AMD EPYC處理器支援對於人工智慧與機器學習應用至關重要的DDR5記憶體與PCIe Gen5介面,包括支援12條高效能DDR5 DIMM、支援AVX-512指令以及128通道(單插槽)或多達160條高速PCIe Gen 5 I/O通道(雙插槽)。

broken image

超微AMD第4代EPYC處理器在多個代表著最常見AI使用情況的AI基準測試中實現強大的效能提升。超微/提供

同時,第4代AMD EPYC處理器提供高達2.8倍的效能提升、降低多達54%的功耗,而AMD EPYC處理器更已創下超過300項世界紀錄,同時廣受完整軟體與硬體產業體系的支援,支援的工作負載橫跨資料庫、虛擬化、AI/ML、高效能運算等領域。此外,第4代AMD EPYC處理器的高效能和可擴展性可加快實現價值的速度,同時AMD Infinity Guard協助保護資料安全。以下則為超微日前公布的第4代 AMD EPYC處理器於AI工作負載的效能表現。

圖像分類(ResNet-50)

ResNet為一種用於圖像分類的人工類神經網路(ANN)和/或專門用於電腦視覺的卷積神經網路(CNN)。相較於第3代AMD EPYC處理器,第4代AMD EPYC處理器在ResNet-50圖像分類測試帶來2.1倍的效能。

自然語言處理(BERT-Large)

BERT是一種用於各種自然語言處理任務的深度學習模型。BERT-large是BERT的變體,具有3.4億個參數,使用海量未標記文字材料進行預先訓練,並需要針對特定任務進行額外調整,其文字材料來自整個維基百科和圖書語料庫。相較於第3代AMD EPYC處理器,第4代AMD EPYC處理器在BERT-Large自然語言處理測試帶來1.83倍的效能。

深度學習推薦引擎(DLRM)

DLRM是Meta的開源模型,使用具有輸入層、隱藏層和輸出層的多層感測器,同時支援PyTorch和Caffe2框架,為廣受歡迎的MLPerf 基準測試其中一部份。這個來自Meta的推薦引擎基於Facebook的研究來使用機器學習提出推薦。相較於第3代AMD EPYC處理器,第4代AMD EPYC處理器在DLRM深度學習推薦引擎測試帶來1.83倍的效能。

端對端AI工作流程(TPCx-AI)

模擬與當今資料中心和雲端環境相關的AI工作負載行為。搭載第4代AMD EPYC處理器的系統在TPCx-AI創下5項新世界紀錄,分別在標度因子SF3、SF10、SF30、SF100以及SF300,其中SF3、SF30、SF100和SF300是業界首創成績,SF10則是業界最好成績。這些紀錄代表了第4代AMD EPYC處理器為AI市場帶來的領先效能。