Cześć,
borykam się z problemem zacinającej się pracy zadań. Supervisor ma ustawione 2 procesy powielone do x20 które uruchamiają worker’y Gearman’a.
Problem polega na tym że po kilkunastu godzinach pracuje tylko 1 worker, natomiast lista uruchomionych procesów “ps aux” wskazuje że wszystkie workery są uruchomione. Po zrestartowaniu supervisor wszystko wraca do normy. Najgorsze jest to że nie wiem czy to wina supervisor czy gearman’a. Jak mogę to zdiagnozować skoro wszystko w systemie wygląda na działające, kolejka w gearman działa, wpisy uruchomionych procesów przez supervisor są w porządku a realnie tylko 1 z 20 worker’ów wykonuje swoją prace… a wnioskuję po tym że każdy worker wewnątrz uruchamia inny proces związany z nodejs’sem, więc lista procesów “ps aux” przy poprawnym działaniu pokazuję mi te uruchomione procesy przez worker’y.
Dodam też że wszystko jest na timeout’ach więc wykluczam taką opcje że worker się zacina i nie może skończyć zadania.
Za co się mogę zabrać ?