Van egy olyan Linuxos problémám, hogy néha felugrik a load 50 körülre, cpu használat meg lent van 5-10% körül. Van valakinek ötlete, miért lehet ilyen? VPS-en fut a szerver, és arra gondoltam, hogy az IO fogja meg. Mivel közös a tároló, az is lehet, hogy másik VPS épp akkor nagyon használja a vinyót. Más oka lehet esetleg? Hátha van valami ötletetek. Köszi.
Balazs Nadasdi Csaba Sári
Io simán lehet. Amúgy a load a processek számától függ. Ha pl sok a zombi akkor is magas lesz a load. Vpsnél a legtöbb esetben az io a hibás. Érdemes ránézni a processekre és keresni uninterruptible sleep [D], sleep [S] és zombi [Z] állapotúakat.
VálaszTörlésps o state,command axh | grep "^[SDZ]"
Milyen VPS? VZ vagy libvirt-es, vagy valami VMWare? Simfs a fájlrendszer? Ha simfs, akkor csak 3-as kernel felett van esélyed kimonitorozni. 50-es load mindenképpen bottleneck, ráadásul network nem nagyon okoz ilyet - inkább az io lehet. Még memóriát érdemes nézni, hogy hátha swap-ol vadul. Jó esetben a tied, rossz esetben másé. Én ilyenkor mindig addig ütöm a supportot, hogy vagy engem, vagy a nagy loadot okozó szervert tegyék másik node-ra. Mi fut rajta?
VálaszTörlésIostat-ot érdemes azért megpróbálni, meg valami alap monitoringot (pl. Monit, vagy munin-node), csak azért, hogy legyen timestamp az időpontokról. Ha kell remote munin-server, akkor azt tudok adni, aki rrd-t rajzol.
VálaszTörlésBocsi a vége lemaradt :D szóval visszaírtam a többit is.
VálaszTörlésEgy példa:
VálaszTörlés~ yitsushi@app1
❯ ps o state,command axh | grep "^[DZ]" | wc
193 579 12864
~ yitsushi@app1
❯ uptime
21:55:00 up 482 days, 12:28, 2 users, load average: 194.28, 194.32, 194.40
itt a sok a zombi (bár D jelzést kaptak) egy elbaszott nfs csatolás után. A rendszer erről függetlenül még zökkenőmentes, mert írásra/olvasásra olyan kötegre várnak, ami nem létrezik. Reboot megoldaná, de nem merem újraindítani :D
Balazs Nadasdi nálunk 5 zombi már critical a nagiosban :-)... ez kemény
VálaszTörléstop parancs megmondja nem?
VálaszTörlésBalazs Nadasdi Zombik nem voltak, processz volt sok, de gondolom azért, mert feltorlódtak. Aztán egyszer csak helyre jött magától, azért is gondolom, hogy tőlem független. Egy 2 órás időintervallumban volt ez, hogy felment a load, és rettenetesen belassult.
VálaszTörlésCsaba Sári Webszerver amúgy, Xen, és valami közös tárolón ilyen egybe fájlokban vannak a virtuális meghajtók. Memem még volt szabad, szal nem swappel. Ez benne az idegesítő, hogy van elég CPU, tárhely, mem, minden, és mégis akad. Most raktam fel iotop-ot, nemtom az mennyi infót ad. Meg kérdés, hogy mikor jön elő megint.
De lehet akkor járok legjobban, ha VPS-ről bérelt szerverre váltok. Csak azt eggyel macerásabb karbantartani.
Robert Cartman Megmondja, de nálam nem voltak zombik.
VálaszTörlésBalazs Nadasdi 194-es load, én meg 50-en problémázok. :) Mondjuk nálam tényleg be is volt lassulva az egész kóceráj.
VálaszTörlésA 194-es average nekem is kicsapta a biztit :-)
VálaszTörlésLaszlo Fazekas sztem az iotop kevés, mert az pillanatnyi. Én az iostat-ot ajánlom, lesz history-d is
VálaszTörlésköszi, felraktam, ez miből csinálja a history-t? mert külön monitorozó service-t nem indít
VálaszTörlésNem túl bonyolult, én nemrég ezt alkalmaztam:
VálaszTörléshttp://www.admin-magazine.com/HPC/Articles/Monitoring-Storage-with-iostat