Chyba dysk uszkodzony

Mam dysk sdd i system kubuntu 18.04 i teraz co jakiś czas przez system jest duże użycie dysku przez kilkanaście sekund
Polecenie smatrc -a /dev/sdb daje

smartctl -iHA --log=error /dev/sdb

smartctl 6.6 2016-05-31 r4324 [x86_64-linux-5.0.0-37-generic] (local build)
Copyright © 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Device Model: WDC WDS240G2G0B-00EPW0
Serial Number: 1820A9800955
LU WWN Device Id: 5 001b44 8b6062590
Firmware Version: UJ450000
User Capacity: 240 065 183 744 bytes [240 GB]
Sector Size: 512 bytes logical/physical
Rotation Rate: Solid State Device
Form Factor: M.2
Device is: Not in smartctl database [for details use: -P showall]
ATA Version is: ACS-2 T13/2015-D revision 3
SATA Version is: SATA 3.2, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is: Wed Nov 25 21:21:14 2020 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

SMART Attributes Data Structure revision number: 1
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
5 Reallocated_Sector_Ct 0x0032 100 100 000 Old_age Always - 0
9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 8959
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 1112
165 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 2957
166 Unknown_Attribute 0x0032 100 100 — Old_age Always - 18
167 Unknown_Attribute 0x0032 100 100 — Old_age Always - 0
168 Unknown_Attribute 0x0032 100 100 — Old_age Always - 69
169 Unknown_Attribute 0x0032 100 100 — Old_age Always - 114
170 Unknown_Attribute 0x0032 100 100 — Old_age Always - 0
171 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 0
172 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 0
173 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 18
174 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 52
184 End-to-End_Error 0x0032 100 100 — Old_age Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
188 Command_Timeout 0x0032 100 100 — Old_age Always - 0
194 Temperature_Celsius 0x0022 070 045 000 Old_age Always - 30 (Min/Max 9/45)
199 UDMA_CRC_Error_Count 0x0032 100 100 — Old_age Always - 0
230 Unknown_SSD_Attribute 0x0032 100 100 000 Old_age Always - 8985125849132
232 Available_Reservd_Space 0x0033 100 100 005 Pre-fail Always - 100
233 Media_Wearout_Indicator 0x0032 100 100 — Old_age Always - 4601
234 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 22552
241 Total_LBAs_Written 0x0030 100 100 000 Old_age Offline - 8642
242 Total_LBAs_Read 0x0030 100 100 000 Old_age Offline - 7854
244 Unknown_Attribute 0x0032 000 100 — Old_age Always - 0

SMART Error Log Version: 1
No Errors Logged

a polecenie dmesg

32540.327762] ata3.00: exception Emask 0x0 SAct 0x631003 SErr 0x40000 action 0x6 frozen

[132540.327772] ata3: SError: { CommWake }
[132540.327778] ata3.00: failed command: READ FPDMA QUEUED
[132540.327788] ata3.00: cmd 60/10:00:d0:12:90/00:00:01:00:00/40 tag 0 ncq dma 8192 in
res 40/00:00:00:4f:c2/00:00:00:00:00/00 Emask 0x4 (timeout)
[132540.327793] ata3.00: status: { DRDY }
[132540.327797] ata3.00: failed command: WRITE FPDMA QUEUED
[132540.327806] ata3.00: cmd 61/20:08:00:60:b6/00:00:17:00:00/40 tag 1 ncq dma 16384 out
res 40/00:01:00:4f:c2/00:00:00:00:00/00 Emask 0x4 (timeout)
[132540.327809] ata3.00: status: { DRDY }
[132540.327813] ata3.00: failed command: READ FPDMA QUEUED
[132540.327822] ata3.00: cmd 60/20:60:28:d5:a8/00:00:16:00:00/40 tag 12 ncq dma 16384 in
res 40/00:01:00:4f:c2/00:00:00:00:00/00 Emask 0x4 (timeout)
[132540.327826] ata3.00: status: { DRDY }
[132540.327830] ata3.00: failed command: READ FPDMA QUEUED
[132540.327838] ata3.00: cmd 60/08:80:70:ce:a8/00:00:16:00:00/40 tag 16 ncq dma 4096 in
res 40/00:ff:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
[132540.327841] ata3.00: status: { DRDY }
[132540.327845] ata3.00: failed command: READ FPDMA QUEUED
[132540.327853] ata3.00: cmd 60/08:88:68:cb:07/00:00:03:00:00/40 tag 17 ncq dma 4096 in
res 40/00:ff:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
[132540.327856] ata3.00: status: { DRDY }
[132540.327860] ata3.00: failed command: READ FPDMA QUEUED
[132540.327868] ata3.00: cmd 60/08:a8:28:a1:ec/00:00:00:00:00/40 tag 21 ncq dma 4096 in
res 40/00:ff:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
[132540.327871] ata3.00: status: { DRDY }
[132540.327874] ata3.00: failed command: READ FPDMA QUEUED
[132540.327882] ata3.00: cmd 60/08:b0:38:a1:ec/00:00:00:00:00/40 tag 22 ncq dma 4096 in
res 40/00:01:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
[132540.327886] ata3.00: status: { DRDY }
[132540.327894] ata3: hard resetting link
[132540.643416] ata3: SATA link up 6.0 Gbps (SStatus 133 SControl 300)
[132540.648481] ata3.00: ACPI cmd ef/10:06:00:00:00:00 (SET FEATURES) succeeded
[132540.648487] ata3.00: ACPI cmd f5/00:00:00:00:00:00 (SECURITY FREEZE LOCK) filtered out
[132540.648493] ata3.00: ACPI cmd b1/c1:00:00:00:00:00 (DEVICE CONFIGURATION OVERLAY) filtered out
[132540.656827] ata3.00: ACPI cmd ef/10:06:00:00:00:00 (SET FEATURES) succeeded
[132540.656835] ata3.00: ACPI cmd f5/00:00:00:00:00:00 (SECURITY FREEZE LOCK) filtered out
[132540.656839] ata3.00: ACPI cmd b1/c1:00:00:00:00:00 (DEVICE CONFIGURATION OVERLAY) filtered out
[132540.657447] ata3.00: configured for UDMA/133
[132540.667917] sd 2:0:0:0: [sdb] tag#12 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[132540.667927] sd 2:0:0:0: [sdb] tag#12 Sense Key : Illegal Request [current]
[132540.667933] sd 2:0:0:0: [sdb] tag#12 Add. Sense: Unaligned write command
[132540.667940] sd 2:0:0:0: [sdb] tag#12 CDB: Read(10) 28 00 16 a8 d5 28 00 00 20 00
[132540.667946] print_req_error: I/O error, dev sdb, sector 380163368 flags 80700
[132540.667977] sd 2:0:0:0: [sdb] tag#16 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[132540.667982] sd 2:0:0:0: [sdb] tag#16 Sense Key : Illegal Request [current]
[132540.667986] sd 2:0:0:0: [sdb] tag#16 Add. Sense: Unaligned write command
[132540.667990] sd 2:0:0:0: [sdb] tag#16 CDB: Read(10) 28 00 16 a8 ce 70 00 00 08 00
[132540.667992] print_req_error: I/O error, dev sdb, sector 380161648 flags 80700
[132540.668016] sd 2:0:0:0: [sdb] tag#17 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[132540.668019] sd 2:0:0:0: [sdb] tag#17 Sense Key : Illegal Request [current]
[132540.668023] sd 2:0:0:0: [sdb] tag#17 Add. Sense: Unaligned write command
[132540.668026] sd 2:0:0:0: [sdb] tag#17 CDB: Read(10) 28 00 03 07 cb 68 00 00 08 00
[132540.668029] print_req_error: I/O error, dev sdb, sector 50842472 flags 80700

Tak przypuszczam, że to może być wina dużego swapu
Bo przejrzałem to

I ograniczyłem trochę zużycie swapu i system od tej pory tylko jeden raz takie coś zrobił i to w momencie kiedy była pamięć ram zwalniana i swap (zamykane były programy, ktore duże ramu zajmowały). Ja mam 8 GB Ramu i w pliku na dysku SDD 10 GB swapu w pojedyńczym pliku.
I teraz chcę mieć pewność, że to jest wina tego, że akurat w tym czasie używa swapa na dysku SSD.
Bo chce sobie dokupić jeszcze 8 GB ramu.

To najlepiej wyłącz w ogóle SWAP.

Ale wtedy to nie będę mógł tyle stron otwierać bo się wogóle ram wyczerpie i wtedy zacznie zabijać niepotrzebne procesy.

Albo rybki, albo pipki. Możesz zamiast swap pobawić się zramem, ale to obciąży procka zamiast dysk. Najlepiej dokupić ram jeśli masz takie na niego zapotrzebowanie.

Sporo tych stron otwierasz, skoro zapychasz 8GB RAM.

Jak nie chcesz zupełnie wyłączać SWAP, to ustaw parametr vm.swappiness na 1.

1lajk

No właśnie zmieniłem teraz.

Ja na jednym (starszym) komputerze z 4GB RAM ustawiłem vm.swappiness na “4”. A kontrolę nad SWAP oddałem systemd-swap (https://wiki.archlinux.org/index.php/Swap#systemd-swap)

swapfc_enabled=1
swapfc_chunk_size=512M
swapfc_max_count=12
swapfc_free_ram_perc=85
swapfc_path=/var/lib/systemd-swap/swapfc/
swapfc_nocow=1

Działa wyśmienicie. Tylko dla każdego komputera trzeba indywidualnie sprawdzić optymalny config.
Tu masz trochę wyjaśniony domyślny config:
[https://github.com/Nefelim4ag/systemd-swap/blob/master/include/swap-default.conf
i tu:
[https://github.com/Nefelim4ag/systemd-swap/blob/master/README.md#about-configuration

Ale to dopiero od miesiąca tak się dzieje, a gdzieś średnio miesiąc temu uaktualniałem sterowniki do nvidii.

Nie wiem co bym musiał pootwierać na swojej przeglądarce, żeby zająć 8 GB RAM. Odpaliłem z 50 ciężkich stron i trochę ponad 4 GB:

Wyłączyłem swap i teraz zauważyłem dłuższego zawieszenia się systemu i musiałem wyłączyć kompa (zresetować) i teraz w syslogach nie ma nic o błędnych sektorach.

A w smatc jest wszystko dobrze tak jak wtedy.

i sprawdziłem poprawność sektorów w hdparm i wszystkie sektory są poprawne.

Natomiast podobno to szczęste błędy w ubuntu 18.04

Zauważyłem, że w logach często jest taki wpis o zmianie temperatury dysku z 70 na 72 albo odwrotnie i jak już są wpisy o błędnych sektorach to 20 minut przed tym są właśnie takie wpisy o temperaturach.

ja używałem Karty graficznej nvidia optimus, ale teraz przeszłem na intelówkę może się coś zmieni i monitoruję temperaturę dysku i jest 26 dla sdd.
Ale to zmiany się zaczęły dziać w momenecie auktualnienia sterowników do nvidi…

Zamiast się gimnastykować postaw 20.04, tam podobno duzo poprawili w kwestiach Cię interesujących.

Mam wspomnienia z aktualizacjami do innych wersji dystrybucji bo zawsze się kończyły błędami.

Zapomnij o aktualizacjach. Nowy od zera. Przy instalacji tylko ta sama nazwa użytkownika. No i nie formatuj HOME przy instalacji.

Już tydzień nie ma błędu, a ja ustawiłem cat /proc/sys/vm/swappiness n 10 (bo wtedy nie było ustawione na 10) i przeniosłem plik swap na inna partycje na tym samym dysku i planuje sobie kupić dodatkowe 8 GB ibo teraz mam 8 Gb to będzie razem 16 GB.

No i był spokój 16 dni i dzisiaj znów to samo.

Możliwe, że dysk jednak pada. Co to za model?

OK, już widzę - WD Green. Nie jest to najszczęśliwszy wybór. “Greeny” okupują ostatnie miejsca porównań dysków od różnych producentów. Dobre kości, ale słaby kontroler. Może to właśnie jego wina. Oddałbym dysk na gwarancję.

Jednak będę z tym próbować

  • create an externally bootable USB Ubuntu installation
  • edit /etc/default/grub ( sudo -H gedit /etc/default/grub )
  • find “quiet splash”
  • change it to “quiet splash libata.force=noncq”
  • save the file and quit gedit
  • sudo update-grub
  • reboot
  • then retry gparted , fsck and bad blocking
  • if that’all works, install Ubuntu to the internal HDD
  • if that works, boot to Ubuntu and apply this permanent ncq patch

Bo wg mnie nie mam dysku uszkodzonego bo sektory na dysku mam sprawne bo badałem sobie i smatct też nic ni e wykazało.

Włączyłem tą opcje libata.force=noncq
A właściwie co ta opcja powoduje, że naprawia te błędy NCQ ?