Długa synchronizacja RAID5 poprzez iSCSI i drugi inicjator iSCSI

Witam!
Mam 4 maszyny na Windows Server 2016 które mają po około 9 TB macierze sprzętowe. Chciałem je wykorzystać jako storage typu HA. Po połączeniu wszystko wydawało się ok, chociaż martwił mnie wiszący status ponowna synchronizacja, oczywiście da się korzystać z partycji jako tako, ale po ponownym połączeniu nie pokazuje już ile procent tej synchronizacji zostało ukończone . Z uwagi na to że miałem na 3 maszynach jeszcze po 800 GB wolnego miejsca to postanowiłem zrobić RAID0 jako cache dla pewnych zastosowań i w tym przypadku nie trwało to tak długo. Czy jeżeli status synchronizacji trwa od 3 dni i jeszcze się nie skończył dla partycji 27 GB to jest to kwestia tego że coś wisi czy to będzie trwało tygodnie?
Z tego co czytałem do póki synchronizacja się nie skończy to nie działa redundancja, więc awaria jednej maszyny spowoduje brak dostępności danych. Kolejna sprawa, czy dodanie na drugiej maszynie kolejnego inicjatora na pewno sprawi że mimo awarii pierwszego inicjatora iSCSI dane będą wciąż dostępne?

Piszesz o RAID sprzetowym na macierzy czy programowym na WS?

Programowy RAID 5 na Windows Server 2016 Standard

Robisz RAID z dwóch LUN iSCSI? Jeśli masz macierz ze sprzętowym RAID czy nawet programowym RAID, to tak z ciekawości zapytam, po co Ci kolejny RAID na WS?

iSCSI no jakby nie patrzeć działa po sieci, więc ma prawo dłużej trwać. Macierz dyskowa w RAID5 40TB składała mi się, z tego co pamiętam, spokojnie powyżej 24h

Sprawdź czy nie masz jakiegoś zatoru lub wąskiego gardła w sieci. Masz na linkach jakąś agregację (LACP) lub multipah? Jakie MTU na WS, macierzy i wszystkich urządzeniach po drodze?

Do HA lepiej użyć DRBD, który zrobi Ci RAID1 po sieci bez takie kombinacji alpejskich. Pytanie tylko jak chcesz zrobić to HA, bo jeśli na jednym serwerze, to będzie ciężko. Musiałbyś mieć drugą maszynę z WS, która byłaby w trybie pasywnym i czekała na awarię serwera aktywnego.

1 polubienie

Tak z ciekawości nie wypluło Ci czegoś w Podglądzie zdarzeń?

@roobal trafne spostrzeżenie, na jednym z nich mam rozpięte LACP tylko jak przerwę połączenie na jednej maszynie to szlak trafi kilka dni synchronizacji
A zdecydowałem się na takie rozwiązanie żeby mieć cały czas dostęp do plików, niezależnie od tego czy padnie jedna cała maszyna, czy nie. Nie wiem co prawda do końca jak to zrobić żeby zasób był widoczny z drugiego inicjatora kiedy padnie pierwszy oraz nie sprawdzałem czy dane będą dostępne w przypadku awarii jednej maszyny. Chciałem zrobić Klaster FailOver ale mam błędy związane z kontrolerem domeny oraz z przełącznikiem sieciowym Hyper-V. Prócz Storage-a te serwery będą też wykorzystane do wirtualizacji na Hyper-V.

P.S. nie mam błędów związanych z iSCSI w podglądzie zdarzeń

Źle do tego podchodzisz. Jeśli masz dwa serwery z WS i chcesz mieć failover, to albo włączasz wiele sesji dla LUN i podłączasz pod oba i używasz rozproszonego lub sieciowego systemu plików, albo podpinasz po jednym LUNie do serwera i korzystasz z DRBD - serwer aktywny i pasywny - gdy pada aktywny, pasywny przejmuje jego rolę - pliki kopiują się na bieżąco po sieci - stąd mówi się, że to RAID1 po sieci.

Nie znam rozwiązań klastrowych dla Windows, więc nie wiem jak z floating IP itp.

Poza tym, gdy pada Ci system, przepinasz LUN do drugiego serwera. Możesz to robić z palca, gdy chcesz z automatu, to jak pisałem wyżej - DRBD lub jakieś rozwiązanie Microsoftu, o ile takowe istnieje.

Gdy padnie Ci serwer, to RAID też może być uszkodzony. Ostatnio miałem taki przypadek, gdzie w RAID1 padły oba dyski. Nie będę przypominał, że RAID to nie backup.

Kurde sprawdzę sobie na wirtualkach drdb i ceph. Niestety z pewnych względów nie mogę zmienić systemu na Linux-a. Wpadłem na pomysł żeby użyć wirtualek Hyper-V które będą robiły tylko i wyłącznie za kontroler storage.

Dla ścisłości w DRDB będę miał coś w stylu RAID5 i dostęp po SMB i NFS?

Istnieje port drbd dla Windows, więc nie musisz niczego migrować na Linuksy.

DRBD to bardziej raid1. Masz serwer pasywny i aktywny. To co na urządzeniu DRBD zapisuje serwer aktywny jest na bieżąco synchronizowane z urządzeniem DRBD pasywnym. W przypadku Linuksa, klaster w oparciu o corosync i pacemaker monitoruje stan serwera, gdy aktywny przestaje odpowiadać, pasywny przejmuje jego rolę. Jeśli do tego jest uruchomione floating IP, klient nawet nie widzi zmiany serwera.

DRBD jest tylko urządzeniem logicznym, jak RAID i na nim stawiasz dowolny system plików. SMB, NFS działa wyżej.