Hyper-v Maszyna zawiesza się - brak błędów


(Mariusz1602) #1

Witam.

Szukam pomysłu co może powodować problem.

System fizyczny Windows Server 2012 R2.
na nim Hyper-V i kilka VM.
Dwie z nich Windows 7 Pro oraz Windows 7 Ultimate . 2 -3 razy w tygodniu zawiesza się objawy:
- w menadżer funkcji Hyper-V jest uruchomiona, użycie procesora ponad 40%
- nie odpowiada na PING, RDP, SMB
- przy próbie połączenia z menadżera "opcja połącz" widać czarny ekran i kursor
- pomaga jedynie wyłączenie maszyny wirtualnej - opcja zamknij tez nie działa

  • czas zawieszania nie jest powtarzalny za każdy razem inny dzień inna godzina

Co sprawdzałem?
- podgląd zdarzeń na VM jak i na fizycznym - brak błędów 2 godziny przed zdarzeniem
- VM  -sfc / scannow - brak błędów
- VM - chkdsk /f - brak błędów
- VM - reinstalacja pakietu integracji
- awaria nie jest skorelowana z żadnym skryptem do kopii zapasowych
- wyłączyłem dynamiczną pamięć i w tej chwili jest na stałe przypisane 8GB RAM - bez zmian

Co jest na VM?
- sql 2012 dla płatnik
- baza danych firebird dla PC Biznes

druga VM tylko SQL

Miał ktoś podobny przypadek?
Szukam jakiegoś punktu zaczepienia w czym tkwi problem.
Pozostałe VM 2 x WS 2012 R2,  i ubuntu działała bez problemu.

Pozdrawiam.
Mariusz

      


(eskimosek) #2

Może sprawdż dysk.Pada dysk i robi zwieszki całkiem możliwe.


(bachus) #3

Napisz coś więcej o sprzęcie hypervizora. Pewny jesteś że konfiguracja VM nie jest jakaś inna (tj. niestandardowe przypisanie do innych kart sieciowych, inne zasoby dyskowe (np. iSCSI)? Zaktualizowałeś ‘integration services’? Po którejś ostatniej akutalizacji miałem mocne problemy z VMami, sypały się backupy itd. i pomogła właśnie aktualizacja, było to powiązane z “wyskakującymi” snapshotami. 


(Mariusz1602) #4

Dzięki za zainteresowanie tematem.

 

Dla rozróżnienia - aby zweryfikować czy to nie dany RAID - jedna VM jest na RAID 1 SAS dyski 15 k od DELL, drugi przerzuciłem na na RAID 1 dyski SSD Plextor.

Nic nie zmieniło - wciąż są zawieszenia.

Podczas normalnej pracy zmiana na SSD + dodanie RAM - dział kadr zadowolony - operacje na bazie danych przyśpieszyły, komfort pracy się poprawił ale …są te zawiechy.

 

Sprzęt:

Dell PowerEgde T420.

3 x 16 GB RAM - od DELL

 

iSCSI - nie używam obecnie

 

Software:

Windows Server 2012 R2 standard

na nim HYPER-V, windows backup, Altaro Backup - do niezależnej kopii VM na Synology - tylko to.

 

po kontakcie z DELL - naprawdę pomoc techniczna stara się ale też nie wiedzą -

  • za pomocą płyty bootable ISO od DELL zaktualizowałem dwoma przebiegami wszystkie możliwe firmware

  • w Windows Server zaktualizowane wszystkie sterowniki jakie Dell podpowiedział

  • zaktualizowany w pełni Windows Server hypevizor

  • zaktualizowane usługi integracji

  • zaktualizowane w pełni obie VM z Windows 7 - mam server WSUS na DC

  • mam 2 karty sieciowe - jedna dla fizycznej maszyny druga do dyspozycji wszystkich VM - pozostałe dwie VM kontroler domeny DC (WS 2012 R2, ten sam RAID 1 SAS 15 K) i server działu księgowości SRV1 (WS 2012 R2, ten sam RAID 1 SSD) działają bez zarzutu.

  • monitoring serwerów za pomocą PRTG- stąd wiem dokładnie kiedy wzrasta obciążenie CPU, przestają działać usługi - mam alert. Niestety nic nie ma w podglądzie zdarzeń albo coś wciąż przegapiam :confused:

 

Jak myślicie iść tropem zwiększonego obciążenia CPU? coś to powoduje - według menadżera funkcji Hyper-V maszyna działa prawidłowo, puls ok, pamięć ok - tylko brak reakcji

 

 

 

 


(bachus) #5

@mariusz1602: pamiętaj o zaktualizowaniu samego wirtualnego hosta (integration services) - to może być kluczowe (https://www.youtube.com/watch?v=MuJKdD35a34)

Podaj też koniecznie jakie masz karty sieciowe w tym serwerze.

 

@eskimosek: generujesz na forum wyjątkowo dużo niepotrzebnej treści. 


(Mariusz1602) #6

@eskimosek Dziękuje za Twoją opinie, jak nie masz nic do dodania w temacie wątku to skończ już proszę.

 

@bachus Usługi integracji mam aktualne - przeinstalowałem je - niedawno na wszelki wypadek.

Karta sieciowa x 2 - PCI\VEN_14E4&DEV_165F Broadcom NetXtreme Gigabit Ethernet BCM5720 A0, sterowniki z 2013 roku.

Tego nie aktualizowałem - robiłem aktualizacje firmware - ma sieciówka najnowszy - driver starszy. Wieczorem zaktualizuje - teraz nie mogę przerwać pracy.

 

Problem mam od 3 miesięcy, update firmware robiłem tydzień temu.


(bachus) #7

Nieszczęsny Broadcom. Poza spowolnieniem (praktycznie do 10Mbit) powoduje też właśnie sypanie się serwerów. Wyłącz dla maszyn wirtualnych VMQ. Jak będziesz miał z tym jakieś pytania, pytaj (Google powinno dać sporo podpowiedzi przy zapytaniu: Hyper-V Broadcom vmq).


(Mariusz1602) #8

Zaktualizowałem sterowniki Broadcom do najnowszej wersji z czerwca 2016 - z strony Dell.

Wyłączyłem funkcje VMQ.

Poszukałem w swojej bazie wiedzy - wrzucam tam jakieś rozwiązane problemy- okazało się, że miałem taki przypadek w serwerze HP 2 lata temu. Nie skojarzyłem zupełnie.

Przydaje się takie spojrzenie na problem na sucho z boku :slight_smile: Dzięki za podpowiedź, jak nic nie napisze w ciągu tygodnia to znaczy, że zadziałało :slight_smile:

Pozdrawiam.


(bachus) #9

Walcz, powodzenia. Najmocniej ten problem się chyba ujawnia, jak karty sieciowe są w ‘teamingu’.