Egy élő környezetben találkoztam a problémával először, méghozzá úgy hogy a vCenter Server egy az egyben megállt. Szokásos hibakeresés megkezdése után SSH-n keresztül látszott hogy a /storage/seat kötet betelt.
Ennek mérete a VCSA méretezésétől függ, de álatlában a 25GB az általános. A “SEAT” nem más mint a Stats,Events,Actions,Tasks meghajtója. Na ezen lemezen tárolja a Postgre ezeket az eseményeket.
És pont az okozza a problémát, hogyha a megőrzési idő alatt több ilyen log keletkezik, mint amennyi elfér a 25 GB-on. 95%-os foglaltságnál a vCenter szolgáltatás leáll.
Kit érint?
VMware szerint csak a vSphere ESXi 6.7 U3 build-14320388 érintett, de láttam már ennél alacsonyabb build esetén is előfordulást. Számít az, hogy mennyi hoszt van ilyen érintettséggel. Saját példa, hogy négy ESXi-nél még éppen a log rotate alatt nem telt meg, de 16 hosztnál már betelt.
Vagy úgy vehető észre hogy megáll a VCSA vagy korai fázisban a hosztok vizsgálatával. Ha érintett az adott ESXi, akkor ez látszik az Event-ek között:
Hogy lehet megoldani a VCSA problémáit?
Ha már megtörtént a baj, akkor gyors megoldás a következő:
- SSH-n be kell lépni a VCSA-ra
- shell
- df -h, hogy melyik lemez van tele
- com.vmware.appliance.system.storage.list – ezzel be lehet határolni, hogy melyik vmdk az
- Az adott VMDK kibővítése
- A kövektező parancs kiadásával a megnövelt lemezen kiterjesztjük a partíciót “com.vmware.appliance.system.storage.resize”
Hogyan lehet elkerülni, hogy újra megteljen?
Jelenleg csak workaround van, méghozzá hogy ki kell kapcsolni a WBEM-et a hosztokon. Minden érintett ESXi-n ki kell adni a következő parancsot ” esxcli system wbem set –enable false”
További teendők
A lenti KB-t rendszeresen nézegetni és ha lesz végre egy javítás ami vélhetően egy patch formájában fog érkezni, akkor azt telepíteni, majd újra engedélyezni a WBEM-et a hosztokon a “esxcli system wbem set –enable true” parancs kiadásával.
Hivatalos KB: https://kb.vmware.com/s/article/74607