HPE Nimble és az Infosight – első rész

Talán nem lesz új senki számára az a tény, hogy a HPE felhős alapokon nyugvó menedzsment platformját Infosight-nak hívják. Már pár éve elérhető és az elmúlt időszakban a gyártó azon dolgozott és dolgozik, hogy a portfóliójának lehető legjöbb elemét is bevonja alá. Így a 3PAR mellé, a Nimble, a Proliant vonal, a Simplivity és a Primera is odaírható – utóbbi új termék szóval igazából ez alap. Az indíttatás érthető, mivel a szigetszerű menedzsment, az izolált rendszerek kora ilyen szinten egészen biztos lejárt. A HPE ezernyi eladott eszközt szállít világszerte, miért ne járulhatna hozzá minden ilyen eszköz a közös tudás kialakításához? Nem egyedi a dolog, gondoljunk csak a Tesla autóira. Minden egyes modell igazából shadowing-ban működik, azaz akkor is szimulálják az önvezetést, ha egyébként az ember vezeti az adott szakaszon az autót. Ha valamit a sofőr másképp csinál mint a számítógép szimulálta, akkor ezt elküldi a Tesla felhőjébe további elemzésre. Olyan is van, hogy ha egy Tesla egy adott útvonalat először tesz meg, akkor ennek tudása is visszakerül a közös tudásba és ha legközelebb arra jár egy másik autó, akkor magabiztosabban teszi majd meg ezt a szakaszt. Ezt nevezik fleet learning-nek.

Pont ez amit a HPE Infosight alkalmaz és ebben a cikkben a Nimble tárolón keresztül mutatom be. Ez egy opcionális dolog, nem kötelező használni, viszont a cikk végére remélem meggyőzöm az olvasót arról, hogy ez nem opcionális hanem igazából kihagyhatatlan funckió.

Egyetlen kapcsoló jelenti a nem és az igen közötti különbséget a Nimble UI-n.

Mi kerül fel Infosight-ba?

Kezdjük a legfontosabbal: Semmiféle adat nem kerül elküldésre a kiajánlott volume-ok adatterületéről. Csak konfigurációs és statisztikai adatok.

A Nimble tárolók – pont mint a 3PAR/Primera és Proliant Gen10 szerverek – tele vannak szenzorokkal – Sea of Sensors rémlik? – és ezekből rengeteg mérési eredmény keletkezik, ezek bizonyos része kerül be Infosight-ba, függően azok természetétől:

  • az alert-ek azonnal feltöltésre kerülnek – hogy a Nimble Support küldhesse a hibás lemez cseréjét stb.
  • a heartbeat minden ötödik percben – hogy a Nimble Support hívhasson ha éppen megállt a tároló.
  • performancia és statisztika minden tizedik percben.
  • diagnosztikai adatok naponta egyszer. Ez tulajdonképpen a tároló teljes konfigurációja, a group kapacitása és beállításai.
  • VM statisztikák. A Nimble tárolóba beregisztrálható – igazából ez kétirányú – egy vagy több vCenter Server is, így tényleg a mélyére képes látni a virtualizációnak, ezzel lehetővé téve a Cross Stack analízist.

Infosight alapok

Mielőtt belekezdünk, jelentkezzünk be a https://infosight.hpe.com oldalra. Ha ez megvan – és mivel most Nimble-ről tárgyalunk – akkor az Infrastructure -> Nimble Storage -> Arrays részt válasszuk.

Az esetemben egy darab Nimble tároló látszik, ami egy korábbi generációból származik, egy AF1000. A képre ránézve egyből látszik a telepített Nimble OS verzió, az eszköz állapota, nyers és használható teljes és szabad kapacitása és az interfészek.

Kattintsunk rá a tárolóra magára. Ez egy kicsit részletesebb nézetet nyit meg. Megmondja melyik az aktív kontroller, mikor kommunikált az Infosight-tal utoljára. Ez a tároló nálam mindig a legfrissebb NimbleOS szinten van tartva, ezért újabb firmware-et nem ír hozzá. Az érdekesebb rész az a “Hardware recommendations”. A tároló már majdnem tele van, 80% felett van a foglaltsága. Ebben az AF1000 modellben 24 darab 240GB-os SSD-van. Mindegy egyes dual flash carry-ben (DFC) két ilyen SSD lehet, nálam csak egy van bennük. Az Infosight ezért javasolja is, hogy bővítsek kapacitást a DFC bay B populálásával. Korrekt.

Ha a tárolót erősen megterhelnénk és ezzel szaturálódna, akkor arra is javaslatot tenne, hogy milyen kontrollerre lenne javasolt upgrade-elni, például AF3000-re.

Válasszuk ki a “Volumes” tab-ot. Megjeleníti a kiadott volume-okat, a foglaltságot – deduplikáció és tömörítés előtt – a fizikai foglaltságot, exportált méretet, IO per hét értéket (!!) és a védelem szintjét. Lentebb például a Nimble-VMFS2 esetében látszik hogy 1,5TiB használt, ami DECO után 870,2GiB-et foglal csak. 4.1 millió IOPS-ot generált a héten.

Kattintsunk rá erre a volume-ra. Ez erre vonatkozóan még mélyebb képet tár elénk.

De pontosan mi is látszik alább?

  • 2 TiB exportált és ebből 1.5TiB folgalt – ennyit látni például VMware-ben ha ezt a datastore-et nézzük. Ez 1%-ot növekedett az utóbbi 60 napban, de 30 napja stagnál a kihasználsága. Deco miatt 870.1 GiB a foglaltság.
  • A heti IOPS átlag 573,3, az átlag throughput pedig 9 MiB/sec. Az átlagos olvasás 0,8 az átlagos írás pedig 0,1 ms.
  • A diagram a késleltetést, IOPS és throughput értékeket mutatja a heti nézetben, de módosítható más időszakra is.

A “Capacity” tab majdnem hasonlókat mutat de ebben a nézetben látható az, hogy pontosan mikor fog majd várhatóan kifutni a kapacitásból ez a volume. Nálam soha, mivel korábban láttuk, hogy 1%-ot nőtt az elmúlt 30-60 napban.

Riportok

Ez a menü egy helyen koncentrálja az Infosight account-hoz kötött tárolók összességét. Mutatja a Nimble OS verziót, a javaslatokkal ha vannak. Gyanítom ez végfelhasználók számára nem érhető el.

Az “Operational” oldal az ügyfelek számára az elsődleges. Mint fentebb látható, négy demó és két igazi rendszer van regisztrálva esetemben – az alsó is demó, viszont fizikai rendszer. Az alsóbb kép egy teljesítménnyel kapcsolatos diagramot mutat, amin úgynevezett “potential impact” súlyozást is megjelenít. Ez egyszerű – bár kikalkulálni bonyolult – az IOPS és késleltetési értékek alapján kiszámolja a tároló teljesítményét és ezek alapján az alkalmazások értintettségét a magasabb értékek esetén. A skála 1-től 10-ig tart és a 10-es az körülbelül az, amikor használhatatlanul lelassul minden.

Ha ráviszem az egeret a diagramon egy ilyen kis oszlopra, akkor részletesebb képet at. Mint látható, nincs érintettség, ha lenne akkor amúgy is színes lenne.

Na merüljünk mélyre a a tároló lelkébe, igazán komolyan használható információk után kutatva. Korábban megmutattam egy volume-ra vonatkozóan egy riportot, de itt most a teljes tárolóra nézve tehető meg hasonló. Alább látszik, hogy két hét múlva valószínű, hogy ki fog futni a kapacitásból ez a konkrét eszköz. Látható a piros pontozott vonal, ami a 90%-os felhasználást jelzi. Ez az a szint, miután a tároló lelassulásával lehet számolni. Láthatóak ilyen kis csavarkulcsok is az események vonalában. Ezek jelnzik a z újabb firmware-ek telepítésének időpontját. A CPU terhelés megnyugtató, mert tisztán látszik, hogy nincs CPU szaturáció. Ha lenne vagy éppen magasabb lenne és replikációt terveznék bekapcsolni, akkor érdemes lenne nagyobb teljesítményő kontrollerre váltani, azokban több és nagyobb Xeon processzor van.

A “Performance” tab pont azt adja, amit a neve is sugall. Részletesen az IOPS értékek, külön read és write, késleltetések és throughput. Látszik, hogy október 23-án magasabb terhelés volt a tárolón, egyszerre nagy méretben történt olvasás és írás is és ez kapott egy 3-as értéket a “Potential impact” skálán.

Ugorjunk vissza a “Dashboards -> Executives” oldalra. Ez nem annyira mély mérnököknek van, hanem inkább menedzsereknek. Magáért beszél ismét amit látunk. Ha replikálnék volume-okat egy másik tárolóra és az néhány esetben nem teljesítené az RPO értékeket, akkor itt meg is mondaná jól láthatóan. Úgy értsd ezt, hogyha óránként replikálnék egyszer, és az az átvitel mondjuk 1,5 óráig tartana, akkor nyilván sérül az 1 órás érték. A korábban is látott bővítési javaslatot itt is mutatja, illetve a nyitott és lezárt támogatásni ügyeket is skálán mutatja – látható, hogy volt pár jegyem, de az azért van, mert költözött az adatközpontunk és elfelejtettem maintenance-ba tenni a tárolót. Na amint ki lett kapcsolva, automatikusan nyílt is jegy a leállásra és hívott is a Nimble support, hogy minden rendeben van e. Korrekt!

Konklúzió

Remélem ez az első rész is képes volt arra, hogy meggyőzzön arról, hogyha van már egy Nimble tárolód vagy vásárolnál egyet – többet – akkor használd hozzá az Infosight-ot. Ingyen van és elég sok jó információt at.

A következő részben egy “Cross stack” analízist mutatok be és kivesézzük a “Labs” menüben található őrült riportok lelki világát.