EPYC battle – HPE DL325 Gen10 – frissítve

A HPE Magyarország Kft. jóvoltából teljesült egy, a “Karácsonyra kérem” tétel, felajánlottak egy HPE Proliant DL325 Gen10 szervert, tesztelésre. Mondanom sem kell, már mentem is érte, majd dobozából két perc alatt kivéve már bent is volt a rack-ben.

A szerver specifikációja igen alap, tényleg nincs benne semmi különleges:

  • 1 x AMD EPYC 7351P 16-Core Processor (16 core, 32 thread, 2,4Ghz (2.9 Ghz turbo)
  • 4 x 32GB 2400 Mhz RDIMM
  • 2 x 300GB SAS 10K SFF
  • HPE Smart Array P408i-a SR Gen10
  • HPE Eth 10/25Gb 2p 640FLR-SFP28 Adptr (Embedded ALOM)
  • HPE Ethernet 1Gb 4-port 331i Adapter – NIC (Embedded LOM)

Korábban írtam az architektúráról és felnyitva a tetejét rögtön látszik, hogy miben erős igazán a Zen. A rendszermemória puszta mennyiségében, mivel a nyolccsatornás memóriavezérlőt, csatornánként két DIMM modult képes használni. Ezért szemkápráztatóan sok fekete-fehér foglalat van benne, balra is nyolc és jobbra is ugyanennyi.

Itt a javára is írható a tény, hogy ebben az egy CPU-s rendszerben is használható akár 2TB memória. Az Intel Scalable Line processzorok, foglalatonként 768 GB-ot – az M jelölésű processzorok 1,5TB-ot – tudnak kezelni (fakad abból hogy hatcsatornás a vezérlő és szintén két DIMM-et tud használni). Ezáltal akinek egyutas vagy kétutas szerverben szüksége van 2 vagy 4 TB memóriára, az a költségek mentén, biztosan jobban jár az EPYC géppel, mivel nincs szükség a borsos árú M osztályú processzorokra.

A tesztelés során VMware vSphere ESXi 6.7.0 Build 10302608-et használtam, illetve az ezen futó virtuális gépekben elérhető teljesítményt és annak skálázódását mértem. A tesztek során a PassMark és GeekBench szoftvereket használtam. Nem tartottam lényegesnek, hogy egyéb szoftverekkel is lemérjem azt, amit már igen sokan megtettek különböző fórumokon. Nem tesztelek disk és network IO-t sem. Elsőt azért nem, mert nagyban függ a lemezektől és azok szervezésétől, utóbbit azért nem, mert az opciók száma igazán nagy, nem lehetne mindet tesztelni, illetve nem gondolom, hogy nagyságrendi különbség lenne a throughput-ban vagy latency-ben.

A mérleg másik nyelvén egy HPE Synergy SY480 Gen10 szerver van a következő konfigurációval:

  • Intel(R) Xeon(R) Gold 5115 CPU @ 2.40GHz (10 core, 20 thread 2,4 Ghz)
  • 8 x 32 GB 2400 Mhz RDIMM

A magok számából következő eltérést úgy próbálom meg orvosolni, hogy minden mérést három konfigurációjú virtuális gépben futtatok le háromszor és ezek átlagát veszem:

  • 1 vCPU-val (magra eső teljesítmény érdekében)
  • 10 vCPU-val (ezt azért mert az Intel processzoros szerverben 10 fizikai mag van).
  • 16 vCPU-val (ezt a költségek összehasonlíthatósága és a teljes teljesítmény érdekében)

Fontos tényező az EPYC esetén a NUMA méret, ami a 7351 esetén:

Meglepő lehet annak, aki nem olvasta a korábbi posztomat az EPYC processzorokról, mivel egy foglalatos szerverről van szó és mégis ez az egy foglalat, négy NUMA node-ra oszlik.

A tesztre használt virtuális gép ezáltal így néz ki a mérések során:

vCPURAMSCSI controllerHDD
1. teszt1 – 1 socket, 1 core64 GBPVSCSI40 GB
2. teszt8 – 2 socket, 4 core64 GB PVSCSI 40 GB
3. teszt16 – 4 socket, 4 core64 GB PVSCSI 40 GB

Ezzel szemben az ESXi a 8vCPU esetén kettő, a 16 vCPU esetén viszont négy NUMA node-ra osztja szét. Ezt teszi azért, mert az EPYC processzor, négy magból álló “szeletekből” áll, és ezekből négy kerül egy tokozásba, ez alkot egy fizikai foglalatot. Minden ilyen négy magból álló csoport, két memória-foglalatot “kezel”.

Az Intel Xeon 5115 esetén a virtuális gép minden esetben 1 foglalatos kiépítésben, de annak megfelelően 1 és 8 maggal került tesztelésre.

A kék szín jelzi az AMD, a narancs az Intel processzort.

PassMark CPU


Geekbench

Értékelés

A kiértékelés során figyelembe kell venni az ár/érték arányt és azt, hogy bizonyos felhasználási módok esetén a licenszelés módja foglalat alapon történik. Ilyen például a VMware vSphere ESXi, ezek kapcsolódó termékei mint a VSAN vagy az NSX. Ezeknél nagyon sokat lehet megtakarítani, ha nem kettő, hanem egy processzorra kell megvenni a terméket és a támogatást.

Nehéz almát, almával hasonlítani ezért inkább annak tükrében érdemes értelmezni a mért dolgokat, hogy milyen listaáron kapható a több processzor.

AMD EPYC 7351Intel Xeon-G 5120Intel Xeon-G 5115
Core16C/32T16C/32T10C/20T
Speed2,4Ghz2,2Ghz2,4Ghz
Price1700 USD2400 USD2000 USD
Price/core106,25 USD150 USD200 USD

Legtöbbször kikap a bizonyos mérésekben, de például Integer-ben mind 1 maggal, mind 10-el legyőzni a Xeon-t. Floating Point-ban csak egy szállal tud jobban teljesíteni, ott valamiért a több mag inkább a hátrányára fordul.

Itt látszik az egyik legkomolyabb hátrány, mármint a RAM elérésének késleltetése, többszöröse a Xeon-nál tapasztalhatónak bizonyos esetekben. Ez egyébként szintetikus mérés, ezért ennek valós életben érzékelhető különbségét nem érezni ilyen sarkosan. Ezt egyébként sok helyen látni, pl az Anandtech-en (link) is, illetve a Passmark teszt ezt sarkallatosan ki is hozza.

Az alábbit nézegessük kicsit. 8 vCPU-ig több mérési pontban az Xeon előtt vagy azzal közel azonosan teljesít. Ahol nagyon visszaesik az az ennél több vCPU-val kofigurált gép, mivel ekkor már nem 2 NUMA node-ra kell szétteríteni a VM-et, hanem akár 4-re. Ekkor már az MCM felépítésből adódóan az Intel single die processzora előnybe kerül.

Javasolt felhasználási területek

Virtualizáció

Hypervisor futtatására, olyan terhelés alá, amely semmiképp sem igényel wide-VM kiépítést, azaz olyan méretű virtuális gépet, amely egy foglalaton összes magjánál vagy egy foglalathoz tartozó RAM-nál többet igényel. Még jobb az, ha 8 vCPU-nál többet nem használ egyetlen VM sem magában. Tapasztalataim szerint igen kevés virtuális gép hajtja ki a processzorait egyébként akár 80%-ra, ezért az single thread teljesítmény maximuma, illetve a multi thread teljesítmény, bármelyik vele egy árban lévő Xeon esetén nem jelent plafont.

Ehhez kapcsolódóan például VSAN alá is jó lehet, mivel a DL385 (2U) kiépítésben ebbe is beletehető 30db 2,5″-os meghajtó.

Nagyobb ügyfelek, ahol létezik a branch office kifejezés az adatközponti terminológiában, elgondolkodhatnak hogy ha jelenleg többprocesszoros szervert használnak az ilyen kihelyezett számítóközpontokban, akkor cserélhető esetleg AMD EPYC-re, ezzel is licensz-, áram-költséget, illetve hűtési igényt takaríthatnak meg.

HPC

A foglalatonként használható 2TB memória és a processzoronkénti 128 PCI-E lane, magáért beszél. 4 TB RAM / szerver már igen szép mennyiség, amit a sok a sok PCI-E csatorna egyébként I/O-val képes is kiszolgálni. Külön izgalmas, hogy három darab dupla széles vagy öt szimpla széles GPU is beletehető.

No Meltdown

Mindenki aki megrémült a Meltdown sebezhetőségtől. Nekik jó hír hogy az AMD állítása szerint az EPYC processzoraik nem értintettek.

Általános felhasználásra

Végre van választási lehetőség és nem feltétlen kell Intel Xeon-t venni egy fizikai tartományvezérlő/fájlszerver/webszerver esetén. Legalább egy jó opció előáll az EPYC megjelenésével.

VDI

Hazánk nem a VDI országa, de a nagy RAM kapacitás, illetve a RAM/mag arány miatt – nem beszélve a GPU-ról – magas user/szerver szám érhető el.

Kérdések

  • Láhtató lesz-e EPYC processzor a Synergy vonalban? Nem látok rá sok esélyt, bár a c7000-ben régen volt AMD processzoros szerver. Gondolom a HPE kivár, hogy lesznek-e EPYC eladások és annak fényében dönt arról, hogy lesz-e ilyen modell
  • Megjelenik-e a Simplivity-ben az AMD? Majdnem biztosan merem állítani, hogy nem. Bár a HCI pont egy olyan terület, ahol csilloghat az AMD, de szerintem egy összecsiszolt rendszert nem fog megváltoztatni a HPE.

Végszó

Nagyon szimpatikus az EPYC processzoros gép, a HPE DL325 Gen10 különösen az, mert 1U méretben igen ütős kis gép építhető belőle. A processzor teljesítménye az árának arányában, az Intel Xeon processzorok fölé emeli. Már csak a RAM iszonyatos árát kell belealkudni a kasszánál, a processzoron nem fog múlni. Én javasolni fogom az ügyfeleinknek, hogy tegyenek egy próbát, akár egy demo gép beállításával. Nem fognak csalódni.

Közben Frank Denneman is leírta jóval részletesebben a NUMA méretezés EPYC-kel kapcsolatos részleteit. Lényegében megerősíti a következtetésemet.

Minden a cikkben látható kép saját tulajdon, felhasználásuk engedélyköteles!

Kirakott HPE-ban