Gen Xeon Famill, Sapphire Rapids, huet e puer iwwerraschend Resultater géint AMD’s EPYC Genoa Opstellung an AVX-512 Workloads gewisen.
AVX-512 Performance Benchmarks ofgeschloss op AMD Genoa, Intel Sapphire Rapids, an Ice Lake CPUs
Déi lescht Woch huet Intel déi véiert Generatioun Xeon Scalable Prozessoren lancéiert, och bekannt als Sapphire Rapids, verspriechen eng verstäerkte Leeschtung fir déi Server-baséiert Prozessoren. Si hunn e fuschneie ISA agefouert, Advanced Matrix Extensions, a méi fir mat der Erweiderung vun der Verbesserung vun der kënschtlecher Intelligenz a Maschinnléieren ze hëllefen.
Wéi och ëmmer, mam AVX-512 Extensiounsset, deen och Benotzung an AI, HPC, a ML huet, muss et méi Informatioun beim Start ginn iwwer d’Verbesserungsgewënn fir de skalierbare Prozessoren. De Michael Larabel, Linux Analyst, an Editeur vun der Linux Hardware Websäit Phoronix, huet den neie Prozessor duerch vill Benchmarks gesat. Si hunn et géint säi Virgänger Ice Lake an AMD’s nei Genoa Prozessoren gesat an d’Resultater schwätzen fir sech selwer.
De Larabel huet e puer Tester initiéiert duerch Phoronix Test Suite, Phoromatic, & d’OpenBenchmarking Websäit, an där hien de Lead Entwéckler op all Projeten ass. D’Tester, déi op den dräi CPUs gemaach goufen, waren all baséiert op Testen vun der AVX Leeschtung an Aarbechtslaaschten wéi:
- Neural Magic DeepSparse – Eng CPU Runtime déi Sparsitéit benotzt, déi an neuralen Netzwierker fonnt gëtt, féiert zu engem Nebenprodukt fir d’Rechenzäit ze reduzéieren.
- LCzero – Och bekannt als Leela Chess Zero, implementéiert dës Schachsoftware UCI Protokoll, erfuerdert e Schach-GUI ähnlech wéi Arena Chess GUI, BanksiaGUI, Cutechess, Nibbler, a Chessbase.
- embryo- erstallt vum Intel, Embree ass e Set vu Ray Tracing Kernels fir Grafikapplikatiounsingenieuren ze hëllefen d’Performance vu photorealistesche Rendering-Applikatiounen ze verbesseren.
- OpenVKL – och vun Intel erstallt, Open VKL ass mat Open Source Software entworf, déi Daten, déi mat Open VDB gespäichert sinn, versteet an et ouni Konversioun zougräifen.
- Open Image Denoise – Intel Open Image Denoise baut op der Intel oneAPI Deep Neural Network Library, och bekannt als oneDNN. An Echtzäit exploitéiert et modern Instruktiounssets wéi Intel SSE4, AVX2, an AVX-512. Dëst gëtt gemaach fir datt d’Exploit eng héich denoising Leeschtung erreechen.
- OSPRay (Studio) – Intel’s OSPRay Studio ass en Open-Source, interaktive Ray Tracing a Visualiséierungsprogramm.
- oneDNN – D’Intel oneAPI Deep Neural Network Library (oder oneDNN) liwwert optimiséiert Deep Learning Building Block Performance.
- cpuminer-opt – Cpuminer-opt ass eng CPU-Mining-Software, déi an zwou getrennte Versioune geformt gëtt -Cpuminer-opt a Cpuminer-gr, déi fir Raptoreum cryptocurrency benotzt gëtt.
- OpenVINO – D’Open Visual Inference and Neural Network Optimization ass e gratis Toolkit deen hëlleft mat der Optimisatioun vun Deep Learning Modeller aus engem eenzege Kader an ofsetzt se mat engem Inferenzmotor op Intel Hardware, mat Intel d’Firma déi den Toolkit erstallt huet.
- miniBUDE – eng Kär Berechnung vun der Bristol University Docking Engine fonnt an anere HPC programméiere Modeller.
- SMHasher – SMHasher ass “eng Testsuite entwéckelt fir d’Verdeelung, d’Kollisioun an d’Leeschtungseigenschaften vun net-kryptographeschen Hashfunktiounen ze testen.”
D’AVX-512 Extensiounen, déi an de meeschten Tester aktiv sinn, hunn gutt Gewënn fir all CPUs gewisen, awer Sapphire Rapids Xeon CPUs hunn de gréisste Gewënn mat AVX-512 vu bis zu 44% gesinn, wärend EPYC Genoa e Gewënn vun 21% gesinn huet.
Iwwerraschend huet Intel net nëmmen e gréissere Leeschtungsgewënn geliwwert, awer och déi bescht Effizienz mat AVX-512 geliwwert, wat gutt bedenkt datt AMD schwéier gaang ass fir AVX-512 fir EPYC Genoa Chips ze vermarkten, wärend Intel net vill iwwer AVX-512 op sengem Saphir geschwat huet. Schnell Chips. Mat AVX-512 aktivéiert, konnten d’Intel Sapphire Rapids CPUs d’Genua-Deeler passen oder iwwerpréiwen & nëmme mat AVX-512 waren d’EPYC-Chips fäeg de Boost Uplift ze liwweren. Folgend ass wat de Phoronix iwwer hir Erkenntnisser ze soen huet:
De geometresche Mëttel weist och wéi wichteg den AVX-512 ass fir den Erfolleg vun der 4. Huet den Zen 4 net AVX-512 bäigefüügt, sinn d’EPYC 9654 2P AVX-512-behënnerte Resultater just hannert dem Xeon Platinum 8490H 2P mat AVX-512 aktivéiert erauskomm. A Zen 4 Server Prozessor ouni AVX-512 wier eng Hals-an-Hals Rennen tëscht Sapphire Rapids a Genua a méi Aarbechtslaaschten gewiescht. Awer amplaz koum den EPYC 9654 2P mat AVX-512 19% méi séier eraus wéi d’Xeon Platinum 8490H Prozessoren an dësem Set vu Benchmarks.
Ech sinn zimlech iwwerrascht datt Intel hir AVX-512 Verbesserunge mat 4. dat war mat fréiere Generatioune vun AVX-512 Prozessoren gesinn. Dëst kann direkt profitéieren fir vill existéierend Software dobaussen am Verglach mat der Upassung fir AMX an déi nei Beschleuniger ze benotzen. Hoffentlech wäert dës méi effizient AVX-512 mat Sapphire Rapids gepaart mat AMD Zen 4 CPUs elo mat AVX-512 féieren zu méi Softwareentwéckler déi AVX-512 Optimisatiounen fir hir Software berücksichtegen.
iwwer Phoronix
De Larabel anticipéiert datt d’Entwéckler d’AVX-512 kompatiblen Software déi schonn um Maart benotzt ginn an d’Belaaschtung vun der Adaptatioun un den neien AMX Extensiounsset reduzéieren, wou méi rezent Acceleratore weider Léieren a Verständnis vun Entwécklungsteams brauchen.