Problem z serwerem "eth1: Link is down"

Od jakiegoś czasu obserwuję na swoim serwerze pewną nieprawidłowość, która przytrafia mu się z częstotliwością raz na miesiąc. Serwer pełni rolę m.in. bramy do internetu (eth0-wan, eth1-lan), jest na nim zainstalowany Debian.
Dwa dni temu użytkownicy w sieci stracili dostęp do Internetu. Do serwera nie dało się zalogować więc poszedłem sprawdzić fizycznie co się dzieje. Na ekranie przewija się ciąg znaków wyglądających tak: http://83.218.127.29/files/kern.log
Wygląda to jakby interfejs eth1 ciągle się podnosił i padał. Aby nie wyłączać serwera w sposób brutalny udało mi się do niego dostać poprzez WAN (eth0) i z poziomu konsoli go zrestartować - póki co pracuje poprawnie.
Oto dodatkowa pozostałość w logach po tym incydencie: http://83.218.127.29/files/messages
Przyznam, że problem się zaczyna cyklicznie powtarzać, a nie bardzo wiem od czego zacząć, aby spróbować wyeliminować ten problem. Czy mogę prosić o jakąś wskazówkę co jest przyczyną takiego stanu?

Wersja Debiana: Linux Lan14 3.2.0-4-amd64 #1 SMP Debian 3.2.68-1+deb7u1 x86_64 GNU/Linux

Nie masz przypadkiem obu kart w jednej podsieci? Masz martian sources. Wygląda też na to, że coś Ci pętli. Błędy w konfiguracji mają to do siebie, że czasami są niezauważalne i pewnego dnia potrafią zabić sieć. Sam się o tym przekonałem, gdy przypadkiem miałem interfejs w 2 vlanach z nietagowanymi ramkami, przez 3 miesiące okej, a gdy ruch się nasilił, switche zaczęły wariować.

Wyłącz też flow control na serwerze i switchach - to lubi ograniczać pasmo, czasami dość mocno.

Warstaw fizyczna okej - okablowanie.

Tak swoją drogą, nie lepiej zainwestować w jakiś router, zamiast rzeźbić router na serwerze z Linuksem? No chyba że masz tam BGP?

Nie jest to przypadkiem komputer marki dell, w niektórych były sieciówki broadcoma które robiły czasami jakieś dziwne problemy.

Karty na pewno nie są w jednej podsieci, eth0-podłączona do urządzenia operatora, pobiera adres ip z serwera dhcp operatora.
eth1-sieć lan na której działa mój serwer dhcp.
Pamiętam, że to martian sources wysępowało w logach od momentu kiedy zainstalowałem Debiana na serwerze.
Kilka lat temu zakupiliśmy do sieci serwer HP ProLiant MicroServer Gen8 bo miałem czas i chęci na dłubanie w Debianie. Na dzień dzisiejszy zakupił bym Mikrotika i zapomniał o problemach.

Karty sieciowe na serwerze to:
03:00.0 Ethernet controller: Broadcom Corporation NetXtreme BCM5720 Gigabit Ethernet PCIe
03:00.1 Ethernet controller: Broadcom Corporation NetXtreme BCM5720 Gigabit Ethernet PCIe

Próbując wyłączyć flow control otrzymuję taki komunikat:
root@Lan14:/# ethtool -K eth1 ntuple off
Cannot change ntuple-filters

Jaka może być tego przyczyna, że nie da się tego wyłączyć?

a jak duża sieć/ile hostów? Nie masz b. dużo hostów i gdzieś po drodze jakiegoś ‘taniego’ mini-switcha/starego routera z wbudowanym switchem zrobionego na switcha? Ja kiedyś walczyłem z takim czymś w jednej sieci bez switchy zarządzalnych - znalazłem w jednym pokoju tandenty stary router Eircom’a przerobiony na switch. Pamięć miał jakąś lichą, więc robił cuda w sieci siejąc ARP.

Sieć nie jest duża, są to użytkownicy domowi, około 30 urządzeń w sieci.
A to byłby pewien kierunek… Włączyłeś mi pewien tok myślenia. Mamy w sieci jeden router, który jest “przerobiony” na switcha/ap (Linksys WRT54GTS z softem DD-WRT). Spróbuję go wyeliminować - być może jest to też jakaś przyczyna.

Uszkodzony switch potrafi zrobić cuda w sieci, jak flooduje ARP.

Dokładnie, takie urzadzonka potrafią robić syf. W jednej sieci mam 10 switchy zarządzalnych. 4 punkty dystrybucyjne i coś pętli. Po 2 miesiącach okazuje się, że usyszkodnik wpiąć sobie jakiś badziew pod biurkiem.