Ugrás a lényegre

A Wadon leállások és ami mögötte van

· 3 perc olvasmány

Az utóbbi időben feltűnhetett nektek, hogy a KSZK webszervere nem épp a rendelkezésre állás mintapéldánya. Ennek okairól és hátteréről szeretnénk egy kicsit írni.

A KSZK körök által használt webszervere – a wadon – egy 2400 MHz-es Opteron alapú szerver, 2 giga memóriával és eredetileg 2 darab 250 gigás HDD-vel. Az adatbiztonság érdekében ez a 2 darab disk RAID1-be volt kötve, azonban így csak 250 giga maradt a használható terület. A szaporodó virtualhostok (a wadon jelenleg több, mint 300 oldalt hostol) és a wiki.sch növekvő tárhelyigénye miatt ez a tárterület 1,5-2 évvel ezelőtt szűkössé kezdett válni.

Eleinte egy külső storage-t alkalmaztunk kiegészítésül ISCSI-n mountolva, azonban ez sem megbízhatóság, sem pedig sebesség terén nem felelt meg az igényeinknek. Ezért 2011. elején úgy döntöttünk, hogy az addigi 250 gigás példányokat lecseréljük egy-egy 1 terabyte kapacitású HDD-re. Mivel a wadonnak sosem az IO terheléssel volt gondja, így nem fordítottunk kellő figyelmet a HDD kiválasztására és a választás a WD Green Caviarjára esett. Ezzel alapvetően nem is lett volna gond, a márka árnyoldala használat közben derült ki.

A Green Caviarról tudni kell, hogy egy energiatakarékos alfaja a WD vinyóknak és bizonyos idejű tétlenség után standby-ba rakja az eszközt. Normál esetben ezzel nem volna probléma, azonban a wadon elég durva IO peakeket kap időnként, amiket azonban a HDD-nek tudnia kéne kezelnie. A gond ott van, hogy ha egy ilyen peak épp standby állapotú vinyóval kapja el a gépet, akkor a diszk nem tud időben magához térni és az egész rendszer gyakorlatilag annyira belassul, hogy kívülről úgy tűnik, lefagyott. Próbáltuk ezt a funkciót firmware frissítéssel kiiktatni (amit amúgy csak msdosból lehet, 2011-ben ez igazán vállalható), azonban a hibás(?) firmware miatt ez nem működött. Az egyetlen eredmény amit el tudtunk vele érni az az volt, hogy azt az időt, mielőtt elteszi magát standby-ba, valamennyire meg tudtuk növelni.

Mit is szándékozunk tenni ez ellen? Mivel a wadon szolgáltatásai amúgy is kezdik kinőni a gépet (a cpu szinte folyamatosan 100%-on pörög), így az új HDD-k vásárlása helyett a költöztetés mellett döntöttünk. Mivel a világban és nálunk is egyre nagyobb teret nyer a virtualizáció, így a wadont kettébontjuk és mindkét fele virtualizálva lesz. Az egyik fele a lothlorien, ami gyakorlatilag már készen van, és innen fut a wiki.sch és még néhány fontosabb oldal. A másik, jelenleg telepítés alatt álló rendszer a jelenlegi wadonnak megfelelő funkcionalitású lesz, a különbség hogy több erőforrással fog rendelkezni. Ha egyszer elkészül, akkor megszűnnek a leállások, belassulások és reményeink szerint a wadon ismét olyan stabil lesz, mint az egész mizéria előtt.