2014. november 5., szerda

Van egy olyan Linuxos problémám, hogy néha felugrik a load 50 körülre, cpu használat meg lent van 5-10% körül.

Van egy olyan Linuxos problémám, hogy néha felugrik a load 50 körülre, cpu használat meg lent van 5-10% körül. Van valakinek ötlete, miért lehet ilyen? VPS-en fut a szerver, és arra gondoltam, hogy az IO fogja meg. Mivel közös a tároló, az is lehet, hogy másik VPS épp akkor nagyon használja a vinyót. Más oka lehet esetleg? Hátha van valami ötletetek. Köszi.

Balazs Nadasdi Csaba Sári

14 megjegyzés:

  1. Io simán lehet. Amúgy a load a processek számától függ. Ha pl sok a zombi akkor is magas lesz a load. Vpsnél a legtöbb esetben az io a hibás. Érdemes ránézni a processekre és keresni uninterruptible sleep [D], sleep [S] és zombi [Z] állapotúakat.

    ps o state,command axh | grep "^[SDZ]"

    VálaszTörlés
  2. Milyen VPS? VZ vagy libvirt-es, vagy valami VMWare? Simfs a fájlrendszer? Ha simfs, akkor csak 3-as kernel felett van esélyed kimonitorozni. 50-es load mindenképpen bottleneck, ráadásul network nem nagyon okoz ilyet - inkább az io lehet. Még memóriát érdemes nézni, hogy hátha swap-ol vadul. Jó esetben a tied, rossz esetben másé. Én ilyenkor mindig addig ütöm a supportot, hogy vagy engem, vagy a nagy loadot okozó szervert tegyék másik node-ra. Mi fut rajta?

    VálaszTörlés
  3. Iostat-ot érdemes azért megpróbálni, meg valami alap monitoringot (pl. Monit, vagy munin-node), csak azért, hogy legyen timestamp az időpontokról. Ha kell remote munin-server, akkor azt tudok adni, aki rrd-t rajzol.

    VálaszTörlés
  4. Bocsi a vége lemaradt :D szóval visszaírtam a többit is.

    VálaszTörlés
  5. Egy példa:

    ~ yitsushi@app1
    ❯ ps o state,command axh | grep "^[DZ]" | wc
        193     579   12864

    ~ yitsushi@app1
    ❯ uptime
     21:55:00 up 482 days, 12:28,  2 users,  load average: 194.28, 194.32, 194.40


    itt a sok a zombi (bár D jelzést kaptak) egy elbaszott nfs csatolás után. A rendszer erről függetlenül még zökkenőmentes, mert írásra/olvasásra olyan kötegre várnak, ami nem létrezik. Reboot megoldaná, de nem merem újraindítani :D

    VálaszTörlés
  6. Balazs Nadasdi nálunk 5 zombi már critical a nagiosban :-)... ez kemény

    VálaszTörlés
  7. Balazs Nadasdi Zombik nem voltak, processz volt sok, de gondolom azért, mert feltorlódtak. Aztán egyszer csak helyre jött magától, azért is gondolom, hogy tőlem független. Egy 2 órás időintervallumban volt ez, hogy felment a load, és rettenetesen belassult.

    Csaba Sári  Webszerver amúgy, Xen, és valami közös tárolón ilyen egybe fájlokban vannak a virtuális meghajtók. Memem még volt szabad, szal nem swappel. Ez benne az idegesítő, hogy van elég CPU, tárhely, mem, minden, és mégis akad. Most raktam fel iotop-ot, nemtom az mennyi infót ad. Meg kérdés, hogy mikor jön elő megint.

    De lehet akkor járok legjobban, ha VPS-ről bérelt szerverre váltok. Csak azt eggyel macerásabb karbantartani.

    VálaszTörlés
  8. Robert Cartman Megmondja, de nálam nem voltak zombik.

    VálaszTörlés
  9. Balazs Nadasdi 194-es load, én meg 50-en problémázok. :) Mondjuk nálam tényleg be is volt lassulva az egész kóceráj.

    VálaszTörlés
  10. A 194-es average nekem is kicsapta a biztit :-)

    VálaszTörlés
  11. Laszlo Fazekas sztem az iotop kevés, mert az pillanatnyi. Én az iostat-ot ajánlom, lesz history-d is

    VálaszTörlés
  12. köszi, felraktam, ez miből csinálja a history-t? mert külön monitorozó service-t nem indít

    VálaszTörlés