Modern(ebb) tárolók méretezése

Az év végi hajrában volt pár olyan kiírás és ajánlatkérés, ahol bár első olvasatra a megajánlásra kerülő tároló paraméterei simán teljesíthetők voltak, mégis nagyon erős félreértésbe torkolltak az ajánlatok az ügyfél részén. Olyan kérédésekkel találkoztunk, amelyek teljesen irrelevánsak a tároló kapacitása vagy teljesítménye tekintetében. Nem most jöttem a 6:20-assal, világos hogy ha az ügyfél X gyártó Y termékét akarja, akkor beleírja annak valamilyen elborultan specifikus tulajdonságát.

Ha objektíven nézzük, akkor hogy kellene tárolóra ajánlatot kérni? Leginkább úgy, hogy az alábbiakat tesszük a kérésbe:

  • használni kívánt kapacitás
  • a kívánt performancia tételes bontásban – pl 70/30 read-write 100% random mellett stb.
  • milyen protokoll-on szeretném használni
  • szeretnék-e szinkron replikálni – ha igen, akkor milyen kapcsolatom van az adatközpontjaim között
  • bővíthetőség

Tehát meglepő volt, csak olyan tárolóval lehet ajánlatot tenni, aminek vezérlőjében 256GB RAM van. A fenti igények kiszolgálásában teljesen lényegtelen, hogy a kontrollerben mennyi memória van – kivéve ha DellEMC Powerstore X modellről beszélünk – mivel attól, hogy több RAM van benne, nem lesz gyorsabb vagy lassabb. Körülbelül a tároló architektúrája határozza meg, hogy mennyi RAM kell bele, mert tetszik vagy sem, ezeken is valamilyen szofver fut és az alapműködéshez kell neki memória.

Mennyi kapacitás kell?

Már az első bekezdésben tisztázni kell a fogalmakat. Egy modern tárolót, amiben kis túlzással kikapcsolhatatlan a deduplikáció és/vagy tömörítés nincs értelme ténylegesen, fizikailag benne lévő tárkapacitásra méretezni. A HPE Nimble/Alletra, DellEMC Powerstore stb tárolók kifejlesztésekor az all flash korszakban, a dedup, a tömörítés és a thin provisioning a DNS-ükbe épültek.

Tehát ha kell 100TB tárhely, akkor azt biztosan nem 100TB szállításával illik lefedni. Ha mégis, akkor költséghatékonyságról nem beszélünk. Ha olyan adatot szeretne rátenni az ügyfél, ami már deduplikált, tömörített és még titkosított is, akkor pedig azt jó előre tudja, nem ráköltözéskor derül ki hogy 0,9:1 a dedup arány, a mondjuk 3:1 helyett.

Ott tartottam, hogy kell 100TB hely. A méretezéshez, jó tudni, milyen és melyikből mennyi adat kerülne rá a tárolóra, mivel a való életből a gyártók végtelen mennyiségű méréssel rendelkeznek – a tárolók komoly része küld analitikát a gyártóknak. Ha még pontosabbak akarunk lenni, akkor akár a teljes adatmennyiségen is át lehet kergetni egy szoftvert, ami adott tároló DECO algoritmusával konkrétan megnézi, mennyire csökkenthető le az igényelt tárkapacitás.

Tételesen:

Alkalmazás/adat fajtájaJelenleg foglalt kapacitás (TB)DECO arány
File Server42.4:1
Oracle103.5:1
Virtual Desktop28.3:1
SQL Server33.6:1
Other803.0:1
Not reducible – pl titkosított11.5:1
Összesen ez 3:1 arányt tesz ki, tehát a fenti 100TB adatot a tároló 33TB-on képes tárolni, de akkor nyilván teljesen megtelik. Mint említettem a fentieket finomítani is lehet akár a teljes adatmennyiségen végzett vagy élő adatokkal, de alacsonyabb mennyiséggel, de összetételben azonossal.

Nézzük meg a fogalmakat újra, bár ezek minden gyártónál kicsit másképp hangzanak:

  • raw capacity: a médiák száma x azok kapacitásával. Kb azt hogy fizikailag mennyi van benne – pl egy HPE Alletra modellben 1920GB x 24 = 46TB.
  • usable capacity: a mindenféle formázási veszteség, redundancia igény után mennyi használható belőle. Az előző sorban említett modellnél ez 32.37TB. Ez a szám azt is jelenti, hogyha a rajta elhelyezni kívánt adat semmiféle módon sem deduplikálható,tömöríthető és thin provisioning sincs, akkor ennyinél kiírná a tároló, hogy megtelt.
  • effective capacity: a deduplikáció/tömörítés/thin provisioning segítségével ennyi kapacitás lesz ténylegesen elérhető a tárolón. A kalkuláció alapján ez 97.11TB.

Feltűnhet, hogyha nem effective kapacitásra kérek ajánlatot, hanem usable-re, akkor igazából háromszor akkora tárolóm lesz, mint amit szerettem volna és könnyen lehet több mint háromszon annyiba is fog kerülni. Érhető, hogy sokan nem tudják mennyi és milyen adattal rendelkeznek, ezért a „safe side” technikát követik, de ezzel extrémen elszállnak a költségek és sok felesleges kapacitással lesz ellátva.

Lényeg a lényeg, tudni kell mennyi és milyen adattal rendelkezünk. Ha ez nincs meg, akkor találgatás az egész, lehúzott redőnynél, lekapcsolt lámpa mellett akarunk befűzni a cérnát egy tű nyakába.

Mennyi teljesítmény kell?

Még nehezebb tétel, mert ehhez nem elég becsülni, mérni kell. Jó esetben valamilyen tároló már van üzemben, aminek ha van ilyen mérési képessége, akkor az alapján meghatározható mennyi performancia az ami jelenleg kielégítené azonos szinten az igényeket.

Említettem, hogy ezen a ponton senki sem kell érdekelnie, hogy hány CPU és mennyi RAM van a kontrollerben. Tényleges mérések alapján tegyük fel kiderül, hogy 45000 IOPS is mérhető 8K mellett, 100% random, 60/40% read-write mellett.

Ez alapján már kiválaszható, milyen tároló kell – több esetben igazából csak az hogy milyen kontroller kell. Hogy maradjak a fenti példánál, ez egy HPE Alletra 6010-es modell lesz akkor, 42TB-os kiépítésben.

Milyen kapcsolatok kellenek?

FC-n vagy ethernet-en akarom használni, esetleg mindkettőn? Ethernet esetében iSCSI/NFS vagy sima NAS-ként? Ezzel kizárható pár gyártó és modell egy az egyben.

Szeretnék-e szinkron replikálni – ha igen, akkor milyen kapcsolatom van az adatközpontjaim között?

Modellje válogatja, de van olyan ami FC-n és IP-n is tud replikálni szinkron vagy aszinkron módon. Ha most nincs is ilyen igényem, de mondjuk 2 év múlva majd könnyen lehet, hogy lesz, akkor érdemes vele tervezni.

Bővíthetőség?

A jövőbe látni biztosan nem tud senki, de felkészülhetünk rá bizonyos mértékig. Én vagyok a CIO és maradok a példánál, mondjuk a HPE Alletra 6010-es modell tetszik nekem. Mindenben teljesíti az igényeimet, imádom a HPE-t, az Infosight a kezdőlapom. Megveszem és fél év múlva bejön a CEO, hogy megvett egy vállalatot és annak teljes IT-ját be kell integrálni. Mondjuk 50TB adatról van szó. Az Alletra-n még van 20TB hely, de látom, hogy ez nem fog beférni, tehát bővítenem kell.

A HPE Alletra-mban 24 darab SSD van, tele van, nem tehető bele több. Vásárolhatok egy shelf-et, amibe a kívánt 50TB effektív igényt ki tudom szolgálni. Ez újabb 4U a rack-ben. Ha ez nem vonzó, akkor nem HPE Alletra-t ajánlunk, hanem mondjuk DellEMC Powerstore-t, ott nem 24 SSD a bővítési lépcső. Ezzel nem azt akarom mondani, hogy a HPE Alletra rossz, csak ha a bővítés során nem elfogadható, hogy újabb 4U kerül felhasználásra, akkor mást fogunk ajánlani.