HPE Synergy – első rész

Már régen várat magára ez a kis összefoglaló, mivel lassan egy éve nyúzzuk a saját HPE Synergy-nket csak eddig nem bírtam rávenni magam a gépelésre. Régóta foglalkozom HPE szerverekkel – ex HP alkalmazottként – és korábban Dell szerverekkel – ex EDS dolgozóként, ezért alapszintű összehasonlítási alapom azért talán akad, hogy egy picit objektívebben tudjak nyilatkozni.

Az Intel processzorok fejlődése kapcsán egyre több kérdés merül fel, többek között az architektúra, a magok száma, szervezése és TDP-je kapcsán. Ez nem csak az én dolgom bonyolítja a tervezések során (VMware stb) de a gyártókét is. Ezek közül a szerverek – közvetve alaplapok – tervezése kapcsán a legérdekesebb talán az áramfelvétel és az elfűtött hő hatékony elvezetése a processzorról.

Az Intel Scalable Xeon-ok megjelenésével a TDP akár 205W is lehet – Xeon 8168/8180(M). Egy kétutas szerverbe két ilyen processzort beszerelve, melléjük pár memóriamodult helyezve, plusz RAID vezérlőt/diszkrét GPU-t is használva, a szükséges áram és egyáltalán a szerver hűtése olyan bonyolult, hogy a nagysűrűségű pengeszerverek keretei nem képesek bizonyos korlátozások nélkül ellátni azt. Az áramfelvétel miatt maga a midplane is elég komoly méretezést igényel, a hűtés pedig átdolgozásra szorul, hogy hatékonyan tudja kiszívni a hőt – a 10 darab hűtő a keret eleje irányából szívja át a hideg levegőt a merevlemezeken, processzorokon és RAM modulokon, majd a mezzanine kártyákon, az interconnect modulokon.

Tetézi a problémát az, hogy a processzorok fizikai mérete is megnövekedett, továbbá a korábbi négycsatornás, de csatornánként 3 DIMM helyet használni képes processzorok helyett immáron hatcsatornássá vált, csatornánként 2 DIMM modullal. Egyszerűen kell a 24 slot-nak a hely.

Régebben a méretezéseknél figyelembe kellett venni, hogy amennyiben a harmadik modulhelyre is kerül memória, akkor a memória órajele korlátozásra került, tipikusan 1866 Mhz-en. Na ennek vége, itt teljes kiépítésben is lehetséges a maximális sebesség használata.

Akad olyan gyártó, amelyiknél csak a Gold processzorok fölött, maximum háromféle Xeon Platinum processzorral (8160/8160M/8176) lehet konfigurálni a kétutas szerverüket, továbbá a lehetséges, processzoronkénti 12 modul helyett, csak 8 modulnak van helye. Mint látható, a konfigurációs szabadság és alapvetően az elérhető teljesítmény is korlátozott.

A fenti bekezdés részben illik a HPE c7000-be tehető BL460 szerverekre is, amikbe maximum 150 W TDP-vel rendelkező processzorok tehetőek, ugyanakkor a processzor által támogatott RAM mennyisége mégcsak ki sem használható mert a DIMM slot-ok száma korlátozza azt 768GB-ra processzoronként. Így körülbelül semmi értelme nem lenne az M kategóriájú Xeon processzoroknak – ezért pléldául nem is árulják a BL460 Gen10-eket ezekkel.

Felmerül a kérdés, hogy ki vásárol ilyen teljesen kitömött szervereket? Nyilván sokan nem, de azért gyakran látni Xeon Platinum processzorokkal működő gépeket, teljesen kitöltött RAM kapacitást kevésbé, viszont előfordul és egyre többször.

Aztán a HPE átgondolta és lett a HPE Synergy

A méret igazából maradt 10U, de maguk a szerverek picit nőttek, szélesebbek és magasabbak is lettek. Így már elfér a több DIMM slot, nagyobb hűtő és optimalizálható a hűtés iránya. Felmerül a kérdés, hogyha a bennfoglaló méret azonos és a kiszolgálók dimenziója nőtt, akkor tehető-e bele ugyanannyi szerver….nem tehető bele a megszokott 16, hanem csak 12. Ez a 12 azonban lehet komolyabb processzorral, több memóriával szerelt is.

Azonban itt nem állt meg a gyártó és alaposan átdolgozta a menedzsmentjét, a hátsó traktus – interconnect modulok – működését, a tápegységek és hűtők helyzetét. A bizonyára sokak által ismert HPE Oneview egy appliance formájában bekerült a keretbe, amely akár egy frame-ben is elhelyezhető redundánsan. A Virtual Connect Manager a múltba vész, az Onboard Administrator felülete is már csak emlék, mindent a Oneview felületéről lehet vezérelni – vagy hozzá kapcsolódva RestAPI használatával.

A skálázhatóság a c7000-nél probléma volt, azaz lényegében minden egyes megvásárolt kerethez kellett interconnect module. Ha az ügyfél Flex-10/FlexFabric-ot használt, akkor keretenként kellett kettő. Természetesen Onboard Administrator is kellett és ebből is kettő a redundancia miatt – itthon kevés redundáns OA-t láttam. Így azért látható, hogy kábelekben ez elég magas szám, az implementáció és üzemeltetés ténylegesen több erőforrást igényel, illetve rugalmasságban nem ad túl magas fokú szabadságot. Az OA-k bekötése nagyobb számú keretnél régebben egész switch-eket vitt el csak az OOB hálózat. Itt nem az OA-kat kell bekötni, hanem speciális, úgynevezett Frame Link modulokat, sőt mi több ezeket egymásra kell felfűzni, gyűrűben.

Három keretnél a Oneview appliance redundanciája megköveteli, hogy a Composer Modulok ne egy keretben legyenek. A szükséges OOB portok száma kettőre csökken, szemben a c7000-nél tapasztalt hattal szemben.

A Synergy architektúrája pont ezen változtat, azon hogy a Day 0 és Day 1 operációk során milyen lehetőségekkel könnyíti meg a dolgunkat. Teszi ezt úgy, hogy a Oneview – HPE Synergy Composer – mellett, megjelenik egy – opcionális – HPE Synergy Streamer – modul is.

Mi több, megjelenit két új interconnect modul is, a HPE Synergy 20Gb Interconnect Link és a HPE Synergy 10Gb Interconnect Link is. Ezekkel a skálázhatóság javul, több keret esetén nem szükséges mindegyikbe VC modult venni. Egy keretnél ez nyilván semmit sem jelent, de kettőnél, háromnál vagy ötnél már jelentős segítség. Ezzel együtt az interconnect helyek száma csökkent az eddigi nyolcról hatra, méretük pedig duplázódott, teljes szélességet foglalnak a keret hátuljában. A tápegységek is hátra kerültek, hármasával, két sorba. Így lehet rövidebb a midplane-en a tápvezeték és lehet optimálisabb a hűtés – a c7000-nél minden táp lent volt, előről betéve.

Három keretnél egyszerűen az két keretbe teszünk egy-egy VC modult és egy-egy Satellite modult, a harmadikba pedig csak Satellite modult. Így tehát két VC modullal szolgálhatunk ki 36 szervert, szerverenként továbbra is biztosítva a 2x20Gbit sávszélességet. c7000-nél ez még mindig 3 kerettel és 6 VC modullal lenne lehetséges.

Korábban folgalkoztam Citrix XenApp/XenDesktop implementációval és ott a streaming azt jelenti – PVS – hogy van egy base image, amiből példányosítható akármennyi szerver és azok erről a base image-ről indulnak el, perszonalitásuk egy diff lemezen tárolódik. Én elsősorban ezt virtuális gépek kapcsán használtam, de a Streamer modul éppen ezt valósítja meg, a fizikai gépekkel. Eddig is lehetséges volt stateless szerverek használata, legalább a WWN-ek és MAC-ek szintjén valamilyen külső forrásból történő rendszerindítással, de ezt most kereten belül meg tudjuk tenni, az szerver perszonalitását is a profilba helyezve. Mi több a fenti módon összekötött keretek bármelyikében képes vagyok ilyen profilokat használni, még akkor is ha egyébként abban a keretben nincs Streamer modul. Két Streamer modullal redundánssá tehető a megoldás.

Téves az a nézet, hogy a maximumokkal kell versenyezni, itt a több keretből álló rendszer egyszerűsítése ami kecsegtető, mind a költségekre számolva, mind az időtállóságra vizsgálva, nem is beszélve a rugalmasságról amit a rendszer önmagába építve ad.

Oké, oké de mi van még?

Bekerült a kínálatba egy önállóan használható Storage Module – HPE D3940 Storage Module – is, ami eddig nem volt. Hozzá kell tenni, hogy használatához szükséges egy, de inkább kettő SAS interconnect modul is, illetve azokba a szerverekbe amelyeknek kapacitást kívánunk adni, SAS mezzanine kártyákra is. A modulból képesek vagyunk a profilhoz kötve adni HDD/SSD-ket, de ezt dedikált módon tehetjük, tehát shared módon nem adható oda több szervernek. Szintén korlátozás, hogy csak abban a keretben lehet tárterületet kiosztani, amelyben a storage modul, az SAS interconnect(ek) vannak.

GPU opciók kapcsán választható a szokásos MXM formátumú Nvidia Tesla vagy Quadro a szerverben vagy MXM bővítővel Nvidia Tesla, Nvidia Quadro és AMD Fire Pro is. Például 4 Nvidia Tesla P6 MXM belemegy egy SY460 Gen10-be. PCIe bővítővel kettő Tesla M60 vagy P40 vagy két darab M10 quad is használható.

A VDI nem lehet akadály, itthon kevés implementációt láttam, még kevesebbet diszkrét GPU-val, tipikusan azért mert olcsóbb egy workstation kategóriájú számítógép a felhasználó asztalán, mint egy szerver, bele egy kártya, licenszek stb a prezentációhoz (Horizon, XenApp/XenDesktop stb). Van olyan eset, hogy elegendő felhasználónak kell diszkrét GPU, előállhat olyan eset, hogy a VDI olcsóbb, de hamarabb nyerem meg a lottót.

Ki gondolta még át?

Sokan nem, de én személy szerint kíváncsian várom mivel jön elő a többi gyártó.

Forrás:

https://software.intel.com/en-us/articles/intel-xeon-processor-scalable-family-technical-overview
http://h20628.www2.hp.com/km-ext/kmcsdirect/emr_na-c05348240-2.pdf
https://www.hpe.com/h22228/video-gallery/us/en/products/471be425-9655-48cb-9a17-28ef49772b6d/hpesynergyforthesoftwaredefineddatacenter/video/