HPE Primera – amit eddig tudni lehet(szabad) róla

Több fórumon lehetett már hallani és igazából akár már Youtube-on is található némi információ a HPE új tárolójáról, a Primera-ról. A héten picit közelebbről volt lehetőségem megismerni a gyártó új Tier 0 tárolóját.

Azért mondom, hogy új, mert eddig is volt ebben a kategóriában megoldása, méhhozzá az XP. Ez utóbbi marad továbbra is, pontosan úgy, ahogyan a 3PAR vonal is.

Felmerülhet a kérdés, hogy a 3PAR nagyobb modelljei, a 9450-es és a 20840/20850 modelljei vajon nem Tier 0 tárolók? Részben azok, de elsősorban a 3PAR teljes skálája arra épült annó, hogy egy kóddal, bizonyos mértékig azonos architektúrával képes legyen lefedni minden igényt. Ezért alapjában véve nem nem T0 tároló, mivel elég alacsony szintről kell indulni a Tier 1 szintén és felérnie a T1/T0 határáig.

Aki csak azért jött, hogy megtudja hogy ez egy 3PAR-e, annak megválaszolom ezt, egy kis történettel. A EMC/DellEMC tárolóival foglalkozó kollégák biztosan emlékeznek a Symmetrix eszközökre, amikből később DMX lett, amiből aztán VMAX, majd most PowerMax-nak hívják őket. Ezek nevezhetők egyenesági rokonnak, viszont mindegyik utódnál volt valami, ami legalább egy kicsit másképp volt benne, nem számítva az kontrollerekben található x86 Xeon cseréjét több magot tartalmazó/gyorsabb verzióra, több RAM-ra vagy a HBA-k sebességére.

Szóval hívható-e a Primera egy átcimkézett 3PAR-nak? Nem.

A HPE szerint nem, és igazából osztom ezt a véleményt azok után, hogy azért az utóbbi hetem azzal telt, hogy a motorháztető alatt turkáltam. A 3PAR egy elég jó gyártó és brand és annó ez jó üzlet volt a HP/HPE-nek. Amit azóta beletettek és amennyi eszközt eladtak, mind-mind azt bizonyítja, hogy tényleg hozza amit állít és méltán van helye a piacon. Na ennek a 3PAR-nak az öröksége a Primera. Mindent amit a 3PAR-t megkülönbözteti a piacon a többi hasonló terméktől, azt megőrizték, sőt sok helyen inkább még jobban kicsiszolták azt. Ezzel szemben mindent ami nem volt jó, kivették – ezért nincs és nem is lesz például adaptive optimization a Primera-ban.

Hová illeszkedik?

Elsősorban tényleg Tier 0, de inkább úgy fogalmaznék, olyan ügyfelek számára, akiknek olyan tároló kell, ami képes a 100% elérhetőséget biztosítani, kritikus környezetekbe, olyan helyeken ahol az úgynevezett efficiency másodlagos, inkább resiliency a fontos. Ez nem jelenti azt, hogy egy hibrid modell belőle nem Tier 0, viszont ez elsődlegesen egy full flash platform és amennyiben valaki teheti, mást ne válasszon. Egyesíti a 3PAR képességeit, a Nimble könnyen fogyaszthatóságával és a már elég sok HPE terméket átható Infosight tudásával.

És a 3PAR-ral mi lesz?

A 3PAR marad és továbbra is a Tier 1 szinteket hozza, de alapvetően a Primera egy picivel magasabb dobogón áll.

És a Nimble?

Szintén marad és továbbra is a midrange kategória jeles képviselője. Egyszerűen használható, karbantartható rendszer és ennek igen nagy jelentősége van. A teljesítménye a 3PAR mellé helyezi, az egyszerű felülete és kezelhetősége pedig egy faék mellé. Amit a gyártó mond, azt a sebességet és hibatűrést hozza, de nem kell és nem is lehet szofisztikálni a RAID szinteket például.

De akkor hogy döntsünk Nimble/3PAR/Primera között?

Amit szerintem tényleg fontos megérteni, hogy vannak active/standy és active/active tárolók és ezekhez kapcsolódóan lehet megérteni melyiknek hol a helye. A Nimble az első kategóriába esik és csak kettő és csakis kettő kontroller lehet egy tömbben. Egy ilyen tömbben egy kontroller aktív, a másik alapvetően csak az írásokat fogadja a saját cache-ében. Ha az akív kontroller megáll, akkor az addig standby átveszi a kötet kezelését és kezdi el kiszolgálni a frontend-ed és nyilván kezeli a backend-et. Egy ilyen aktív váltás eltarthat 25 másodpercig is, ami bár még a 30 másodperces SCSI timeout-on belül van, de lényegében annyit jelent, hogy 25 hosszú másodpercig a frontend-nem szolgál ki. Amennyiben ez nem elfogadható egy bizonyos workload esetén, akkor aktív/aktív tároló kell. Na itt jön képbe a 3PAR és a Primera. Mindegyik kapható 2/4, a 3PAR pedig 8 kontrolleres kiépítésben, amiből minden kontroller aktív.

Mitől más egy Primera?

Egyszerűen azért, mert sok esetben azt tapasztalta a HPE, hogy konfigurációs problémák, nem megfelelő karbantartás – firmware nem frissítése – miatt keletkezik a tárolóra visszavezethető kiesések jelentős része és amennyiben ezt ki lehet küszöbölni, akkor meg is teszik. Ezáltal a Primera RAID6-tal dolgozik és csak azzal. A RAID set size-t a rendszer automatikusan állítja be, akár bővítések után is átállítva azt ha szükséges. Az Infosight figyelmeztet az újabb firmware-ek elérhetőségére és amennyiben valaki szeretne a “100% availability” garanciával élni, akkor elvárt tőle az, hogy a kritikus javításokat 10 napon belül, a többit pedig 30 napon belül telepítse.

Hogy megkönnyítsék a telepítéseket, lényegében kivették a kernelből a tároló kódját és ezáltal lehetségessé vált akár a bizonyos funckiókat ellátó szervizek egyedi újraindítása. Ha valami probléma van a remote copy-val, akkor például nem az egész kontrollert kell újraindítani, hanem csak azt a szolgáltatást. Ez önmagában is sokat segít a 100% elérhetőségben.

Mélyen átdolgozták a kontroller felépítését is, illetve azt hogy a 3PAR speciális ASIC-je is kicsit máshogy került bele.

A 3PAR-ban a Xeon processzor(ok) mellett volt a RAM – control cache-, illetve az ASIC-ok mellett is volt egy réteg memória – data cache. Ez érthető módon a kód fejlesztésében, illetve az Xeon processzorok fejlődése mentén komoly kihívás elé állította a fejlesztőket, mivel mindegy egyes CPU fejlesztésnél újra és újra ki kellett alakítani az integrációt.

Na ennek így vége és immáron csak a Xeon processzor mellett van memória és a közösen data és control célra is használt. Ezáltal a jövőbeni Xeon generációk is könnyen bevonhatók, nem kell hosszú tesztekkel bajlódni.

Fentebb látható egy 650/670-es kontroller kivonatolt ábrája – hiányzik a második processzor a képről – de annyi világos, hogy 4 ASIC kerül a 650/670 modellekbe, 1 ASIC a 630-as Primera-ba. A Xeon processzor mellett az ASIC-ok vehetnek át feladatokat így a XOR,SHA256 és a node-ok közötti kommunikációt is elvégezhetik, ezzel is tehermentesítve az x86 processzort.

Az architektúra ilyen mértékű módosítása azért volt szükséges, mert a küszöbön toporog már az NVMe – ugyanakkor jelenleg pontosan a szabvány, illetve az a média hogy miképpen lesz ez megvalósítva még nem tisztázott – és ahhoz minden gyártónak igen mélyen bele kell nyúlnia a saját termékébe, hogy ki is tudja aknázni a képességeit. Gondoljunk csak bele, hogy már a mai SAS SSD-s világban is elegendő 4-8 SSD, az NVMe SSD körökben pedig 2-3 is ahhoz, hogy egy kontroller teljes kapacitását kihajtsa. Ezért olyat kell alkotni, ami képes legalább egy nagyságrenddel többet kipréselni magából és ezt legalább olyan hatékonyan is tudja majd nyújtani. Az end to end nvme az véleményem szerint amúgy erősen utópia. Nem elég, hogy a tároló maga a back-end egy részén NVMe-t használ, fontos hogy mind a fabric, mind a hoszt oldal is képes legyen arra. Ez például VMware esetében egyáltalán nem lehetséges, Windows esetén én nem tudok róla hogy pl NVMe-OF például működne. Csak akkor van értelme erről beszélni ha tényleg az egész szerver<->tároló vonalon mindenhol lehet NVMe-t használni, addig nem.

Amennyiben valaki márkahű, akkor könnyen lehet, hogy ez az utolsó tároló amit valaha venni fog, tekintve hogy van Timeless storage opció is, azaz minden harmadik évben kap újabb, gyorsabb és fejlettebb kontroller-eket a tárolóba – vagy bizonyos formában akár bővítheti is a tárolót, de erről még többet kell megtudnom. Az az elképesző hogy 4U-ba beletehető picivel több mint fél petabyte használható, 8U-ba pedig már 1 PB használható terület (1:2). Az is alátámasztja ezt, hogy in place lehetséges lesz majd 630-ból (4N chassis) esetén 650-re majd 670-re váltani, leállás nélkül.

Korábbi bejegyzésem a témában:

A Hewlett Packard Enterprise gyár – Kutna Hora

Volt lehetőségem meglátogatni azt a gyárat, amelyben a Gen 8 Proliant ideje óta minden szerver, 3PAR tároló, Moonshot készül.

Beöltözés és ESD szalag felvétele után az üzemben nagyon tiszta környezetben – 95%+ tisztaság – mellett szerelik össze a rendszereket, igen nagy precizitással és a végletekig optimalizálva a folyamatot. Minden lépésnél, minden kézre is esik az operátoroknak, amit lehet az automatizálnak. Minden szervert, tárolót még a gyárban igen komoly tesztek alá vetik, annyi villogó leded még életemben nem láttam egyszerre, mint ezekben a sorokban. Ha valami nem megy át a teszten, akkor azt az eszközt mérnökök ellenőrzik és újra tesztelik a hiba javítása után. Semmi nem hagyhatja el a gyárat, ha nincs rendben minden szempontból, a doboz nem tartalmazza a szükséges kiegészítőket, utasításokat. Nem gondoltam, hogy ez tényleg ennyire komplex, de rá kellett döbbennem, hogy ez azért itt elég komoly üzem, elég komoly számú napi kiviteli számokkal.