Witam,
Posiadam w firmie sprzęt serwerowy na którym ustawiony jest raid 1 z dwoma HDD. Po odłączeniu pierwszego dysku, przy uruchomieniu serwera mam sygnalizację, że jednego brakuje, że mam przeprowadzić “dochodzenie” ale cały sprzęt się normalnie uruchamia, systemy pracują. Jeżeli podłączę w/w dysk, a odłączę drugi to sygnalizuje że brak urządzenia do bootowania. W konfiguracji widzi jeden dysk i jest ustawiony jako inactive. Czy to jest ok? Czy faktycznie powinien się raid1 tak zachowywać?
Wszystko jest OK. Przed fizycznym odłączeniem dysku powinno go się odłączyć logicznie od RAID 1 w jakimś programie konfigurującym i wtedy nie będzie żadnych alarmów. W RAID 1 jeden z dysków ustawiony jest jako nadrzędny - jak go odłączysz system nie zabootuje się.
Dzięki. Co w przypadku gdy primary dysk padnie?
A jak odłączasz ten drugi to wcześniej odbyła się pełna rekonstrukcja RAID? Druga sprawa, jesteś pewny, że masz tam RAID1? Jaki sprzęt/kontroler, oraz czy RAID jest realizowany na poziomie kontrolera (tzw. sprzętowy z własnym BIOSem), czy programowy (na poziomie systemu operacyjnego)?
Kolejna rzecz, czy ten test wykonujesz po pełnej rekonstrukcji RAID1? Jak śledzisz co się dzieje w RAID - oprogramowanie na poziomie systemu operacyjnego?
Odpowiedz najpierw na moje pytania.
Podczas startu komputera wchodzisz do BIOSu kontrolera dyskowego (trzeba znać sekwencję klawiszy) i “rozłączasz” RAID 1. Jeśli potem komputer nie zabootuje się to bootujesz go z pendrive/płyty instalacyjnej i wchodzisz w opcję naprawy.
Nadal nie rozumiem co to ten dysk primary w RAID, po co rozłączanie RAID itd.
Dysk primary w RAID 1 to ten, z którego bootuje się system i używany jako podstawowy. Kopią zapasową jest secondary. Tylko dysk primary posiada prawdziwy bootsector dlatego gdy padnie trzeba zastosować procedurę naprawy dla secondary. Rozłączanie logiczne RAID robi się po to aby nie oglądać ciągłych komunikatów ostrzegawczych - dysk będzie widziany jako część uszkodzonej RAID 1. Pod Windowsem dobrym narzędziem jest
Nigdy bym się nie spodziewał, że ktoś na produkcji używa programowego RAID wbudowowanego w Windows, jest to lekko nieracjonalne.
RAID 1 polega na tym jeśli jeden dysk padnie to system działa nadal. Nie ma co kombinować i słuchać komentarzy ludzi bez wiedzy w tym temacie. Dokładasz drugi dysk i RAID1 sa się odbuduje.
RAID1 programowy w Windows jest nieracjonalny.
Nie rozumiem trochę stwierdzenia “odbudowanie raid”. Jak się ma odbudować, na czym skoro jest tylko jeden dysk? W pierwszej wersji zwraca komunikat, że tablica naruszona, w drugiej że nie ma urządzenia do bootowania. Konfiguruje to podobnie jak na tym filmie: https://m.youtube.com/watch?v=xdR_tuKJ9b0 od 1:35. Sprzęt inny, też dell, reszta to samo.
@anon47021787 dziękuję za te wypowiedzi. Generalnie jesteś pewien co do tego co napisałeś?
Przyznaję się, że ostatni raz z macierzami RAID1 miałem do czynienia ok. 10 lat temu - używaliśmy je w pracy zanim dorobiliśmy się serwerów do backupu ze strimerami. Wymusiliśmy na szefostwie zakup serwerów bo na jednej stacji spaliły się oba dyski w RAID1 jednocześnie (od zasilacza) - bardzo rzadki przypadek ale zdarza się i było sporo dodatkowej roboty po godzinach. Dlatego nie należy uważać RAID1 za pewnik. Obecnie część najważniejszych danych trzymamy również w chmurze. Czy jestem pewien tego co napisałem? Przez 10 lat mogło się wiele zmienić ale tak na 90%.
"Nie rozumiem trochę stwierdzenia “odbudowanie raid” - to już wiem, staram Ci się pomóc, ale tracę cierpliwość, bo jak nie rozumiesz, to chociaż staraj się przeczytać dwa razy co Ci napisałem. Pokaż co przedstawiasz do systemu operacyjnego - czy masz ustawiony tzw. “sprzętowy RAID1” na poziomie kontrolera, lub czy czasem tych dysków nie przedstawiasz do systemu operacyjnego jako RAID0 a dopiero sam system operacyjny nie buduje sobie z tego 'programowego RAID1. Drugi scenariusz jest możliwy przez czyjąś pomyłkę, lub miał jakiś powód (na np. ja na kontrolerach RAID LSI przedstawiam dyski NVME jako RAIDO z pominięciem cache i odczytywania z wyprzedzeniem, bo tak np. funkcjonuje obiektowo zorientowany storage w vmware (VSAN), gdzie wszystkie dyski z serwerów są dopiero “łączone” w logiczną przestrzeń na poziomie vcenter i HA i dopiero polisy obiektowe decydują o rozmieszczeniu obiektów (RAID0, 1, 5, 6 itd).
Pokaż zdjęcie z konfiguracji tego RAID z poziomu kontrolera. Scenariusz:
Są dwa dyski wszystko działa, tak? Oba są sprawne? Pokaż to z poziomu BIOSu kontrolera, albo z lsi windows utility czy jak to się tam zwie (lub z OS, gdzie jest).
Scenariusz:
- wyciagasz dysk B (wszystko działa)
- wsadzasz spowrotem dysk B - dajesz mu czas na odbudowę? Jaka jest statystyka odbudowy? Jak duże to dyski?
W RAID sprzętowym dysk jest przedstawiany jako jedna logiczna całość do OS.
Podstawowa rzecz - żaden redundanty RAID (1,5,6 itd.) nie może być traktowany jako backup. To jest tylko i wyłącznie do zapewnienia wyżej dostępności (np. przy wysokim SLA), czyli że nie ma “downtime” a dodatkowo realtywnie… zwiększa możliwości awarii (więcej elementów = więcej możliwości psucia się). Dodatkowo bywa, że RAID nawet utrudnia odzyskiwanie danych (specyficzne kontrolery bazujące na sprzętowych kluczach szyfrujących). RAID nie zwalnia z backupu i z punktu logicznych danych należy go traktować, jakby go nie było (tj. pełen backup, czy redundancja/synchronizacja jeszcze w dodatkowe miejsce).
No cóż, człowiek uczy się przez całe życie. Doszliśmy jak to się stało ze spalonym zasilaczem i dyskami. Koleżanka obok w pokoju “śniadaniowym” włączyła jednocześnie 2 czajniki elektryczne i mikrofalówkę. Po tym smutnym doświadczeniu cały sprzęt komputerowy ma wydzieloną linię zasilającą i specjalne gniazdka uniemożliwiają wpięcie innego sprzętu. Zrezygnowaliśmy z RAIDów na rzecz serwerów i stacji pracujących w domenie. Foldery Moje Dokumenty użytkowników znajdują się na serwerze a nie na stacjach lokalnie. Codziennie robiony jest backup przyrostowy a 1 raz w tygodniu pełny. Jak dotąd (odpukać) nie było potrzeby korzystania z backupu. Wszystkim odradzam stosowanie RAIDu - to przestarzała i niepewna technologia.
Zaczynam się gubić - na poważnie piszesz?
No a co do serwera - jak napisałeś, też pewnie macie system redundanty, czyli RAID1. W przypadku awarii jednego z dysków serwer będzie nadal pracował i nie będzie przestoju, wystarczy wymienić dysk (jak to RAID ‘sprzętowy’). Backup gdzie trafia?
Nie używamy już RAIDów. Serwerów jest kilka i są tak skonfigurowane (+ duży zapas mocy) aby w razie problemów jeden mógł przejąć pracę drugiego. Dlaczego nie RAID? Widziałeś kiedyś odbudowywanie się macierzy po awarii? Trwa to bardzo długo. Teoretycznie powinno się dać pracować na maszynie - w praktyce nie da rady robić coś poważniejszego. Lepiej mieć drugą gotową do pracy. W przypadku awarii serwera spowolnienie pracy pozostałych jest ledwo zauważalne a przywrócenie z backupu mniej jak 1 godz. - przerobiliśmy to w praktyce. Jak już pisałem backup jest robiony na strimerach a kasety trafiają do kas pancernych (ognioodpornych) w specjalnym pomieszczeniu. Najważniejsze rzeczy są dublowane w chmurze. Dokumenty księgowe muszą być przechowywane 5 lat a dokumentacja pracownicza (płace, składki itp.) nawet 50.
P.S. Na moim kompie (wtedy to była maszyna z Core 2 Duo E8400 + RAID1 300GB) odbudowa macierzy trwała ponad 8 godz.
Na prawdziwym NAS odbudowa RAID1 czy innego RAID 5 np. też bardzo długo trwa. Na thecus N4100Pro odbudowa Raid5 trwała 14 godzin. Wydajność w czasie operacji niezauważalna dla użytkowników. Nie należy traktować NAS jak archiwum danych. Jak NAS padnie to koszty są ogromne jeśli chodzi o odzyskiwanie. Tam gdzie odsługuję firmy to dodatkowo chmura/streamer a jak mało danych lub nie mają kasy na dodatkowe zabezpieczenia to na płyty DVD/BL nagrywam.
Cały czas rozmawiamy o serwerach, nie wiem czemu wtrącasz w to stacje robocze. Odbudowa RAID5 w starych macierzach HP (takich sprzed 10 lat…) i dyskach SASowych 7200 (300GB) potrafiła trwać 3-4 dni. Teraz też, nawet po awarii w zwykłym RAID1 potrafi to potrwać nawet kila godzin. W programowych rozwiązaniach VSAN przy sieci 10Gbit z 80% prioryterzacji i konfiguracji all-SSD potrafi odbudowywać dyskgrupę (15TB) nawet i ze dwa dni.
Technologia RAID mocno się nie zmieniła, no może w macierzach enteprise wygląda to trochę inaczej i tam też dużo rzeczy dzieje się ‘obiektowo’.