Czy dysk kwalifikuje się do wymiany? Wyplujka GSmartControl

Witam,

 

Od jakiegoś czasu nie wstaje mi Windows. Czasu było mało, a Mint działał, więc olałem sprawę. Ale teraz jest wreszcie sezon urlopowy, mogę zająć się problemem.

 

Na Linuxach dostępny jest jakiś GSmartControl do diagnozowania dysków, myślę sobie sprawdzę co ten programik mi powie, bo lapek był na gwarancji już dostatecznie wiele razy (zawsze albo dysk albo pamięć albo jedno i drugie). No i tam na czerwono coś mi popodświetlał.

 

Oto jego wyplujka:

smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.16.0-38-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family: Toshiba 2.5" HDD MQ01ABD...
Device Model: TOSHIBA MQ01ABD050
Serial Number: 23F7SYDJS
LU WWN Device Id: 5 000039 495904e9a
Firmware Version: AX002J
User Capacity: 500,107,862,016 bytes [500 GB]
Sector Sizes: 512 bytes logical, 4096 bytes physical
Rotation Rate: 5400 rpm
Device is: In smartctl database [for details use: -P show]
ATA Version is: ATA8-ACS (minor revision not indicated)
SATA Version is: SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is: Tue Aug 11 19:27:38 2015 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status: (0x00)	Offline data collection activity
					was never started.
					Auto Offline Data Collection: Disabled.
Self-test execution status: ( 0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: ( 120) seconds.
Offline data collection
capabilities: (0x5b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					No Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities: (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability: (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 115) minutes.
SCT capabilities: (0x003d)	SCT Status supported.
					SCT Error Recovery Control supported.
					SCT Feature Control supported.
					SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate 0x000b 100 100 050 Pre-fail Always - 0
  2 Throughput_Performance 0x0005 100 100 050 Pre-fail Offline - 0
  3 Spin_Up_Time 0x0027 100 100 001 Pre-fail Always - 1031
  4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 2095
  5 Reallocated_Sector_Ct 0x0033 100 100 050 Pre-fail Always - 0
  7 Seek_Error_Rate 0x000b 100 100 050 Pre-fail Always - 0
  8 Seek_Time_Performance 0x0005 100 100 050 Pre-fail Offline - 0
  9 Power_On_Hours 0x0032 083 083 000 Old_age Always - 7076
 10 Spin_Retry_Count 0x0033 141 100 030 Pre-fail Always - 0
 12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 1717
191 G-Sense_Error_Rate 0x0032 100 100 000 Old_age Always - 726
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 14
193 Load_Cycle_Count 0x0032 093 093 000 Old_age Always - 72147
194 Temperature_Celsius 0x0022 100 100 000 Old_age Always - 42 (Min/Max 9/48)
196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 100 100 000 Old_age Always - 48
198 Offline_Uncorrectable 0x0030 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0
220 Disk_Shift 0x0002 100 100 000 Old_age Always - 0
222 Loaded_Hours 0x0032 088 088 000 Old_age Always - 4985
223 Load_Retry_Count 0x0032 100 100 000 Old_age Always - 0
224 Load_Friction 0x0022 100 100 000 Old_age Always - 0
226 Load-in_Time 0x0026 100 100 000 Old_age Always - 270
240 Head_Flying_Hours 0x0001 100 100 001 Pre-fail Offline - 0

SMART Error Log Version: 1
ATA Error Count: 13565 (device log contains only the most recent five errors)
	CR = Command Register [HEX]
	FR = Features Register [HEX]
	SC = Sector Count Register [HEX]
	SN = Sector Number Register [HEX]
	CL = Cylinder Low Register [HEX]
	CH = Cylinder High Register [HEX]
	DH = Device/Head Register [HEX]
	DC = Device Command Register [HEX]
	ER = Error register [HEX]
	ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 13565 occurred at disk power-on lifetime: 6838 hours (284 days + 22 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 41 b0 d8 cf 32 40 Error: UNC at LBA = 0x0032cfd8 = 3330008

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
  -- -- -- -- -- -- -- -- ---------------- --------------------
  60 08 e0 50 55 81 40 00 00:03:00.675 READ FPDMA QUEUED
  61 08 d8 f8 4f 80 40 00 00:02:56.926 WRITE FPDMA QUEUED
  61 08 d0 68 41 80 40 00 00:02:56.926 WRITE FPDMA QUEUED
  61 08 c8 40 15 80 40 00 00:02:56.926 WRITE FPDMA QUEUED
  61 10 c0 a8 71 3f 40 00 00:02:56.925 WRITE FPDMA QUEUED

Error 13564 occurred at disk power-on lifetime: 6838 hours (284 days + 22 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 41 28 d8 cf 32 40 Error: UNC at LBA = 0x0032cfd8 = 3330008

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
  -- -- -- -- -- -- -- -- ---------------- --------------------
  60 08 58 c8 08 20 40 00 00:02:56.854 READ FPDMA QUEUED
  60 10 50 fa 49 2d 40 00 00:02:53.095 READ FPDMA QUEUED
  61 08 48 88 f9 7f 40 00 00:02:53.070 WRITE FPDMA QUEUED
  61 08 40 40 f6 7f 40 00 00:02:53.070 WRITE FPDMA QUEUED
  61 08 38 18 d7 7f 40 00 00:02:53.069 WRITE FPDMA QUEUED

Error 13563 occurred at disk power-on lifetime: 6838 hours (284 days + 22 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 41 90 d8 cf 32 40 Error: WP at LBA = 0x0032cfd8 = 3330008

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
  -- -- -- -- -- -- -- -- ---------------- --------------------
  61 08 d0 b0 ff 7f 40 00 00:02:53.001 WRITE FPDMA QUEUED
  60 08 c8 28 87 32 40 00 00:02:49.293 READ FPDMA QUEUED
  60 40 c0 b2 a0 33 40 00 00:02:49.291 READ FPDMA QUEUED
  60 08 b8 f0 0a 80 40 00 00:02:49.285 READ FPDMA QUEUED
  60 20 b0 12 9e 33 40 00 00:02:49.279 READ FPDMA QUEUED

Error 13562 occurred at disk power-on lifetime: 6838 hours (284 days + 22 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 41 48 d8 cf 32 40 Error: UNC at LBA = 0x0032cfd8 = 3330008

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
  -- -- -- -- -- -- -- -- ---------------- --------------------
  60 40 58 ec 3c 34 40 00 00:02:49.176 READ FPDMA QUEUED
  60 20 50 79 41 34 40 00 00:02:45.477 READ FPDMA QUEUED
  60 80 48 68 cf 32 40 00 00:02:45.468 READ FPDMA QUEUED
  60 08 40 80 93 82 40 00 00:02:45.468 READ FPDMA QUEUED
  60 40 38 32 9e 33 40 00 00:02:45.468 READ FPDMA QUEUED

Error 13561 occurred at disk power-on lifetime: 6838 hours (284 days + 22 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 41 20 d8 cf 32 40 Error: UNC at LBA = 0x0032cfd8 = 3330008

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
  -- -- -- -- -- -- -- -- ---------------- --------------------
  60 80 20 68 cf 32 40 00 00:02:41.679 READ FPDMA QUEUED
  60 40 18 e4 3f 34 40 00 00:02:41.679 READ FPDMA QUEUED
  60 40 10 32 9e 33 40 00 00:02:41.679 READ FPDMA QUEUED
  60 08 08 80 93 82 40 00 00:02:41.679 READ FPDMA QUEUED
  61 08 00 d0 71 3f 40 00 00:02:41.679 WRITE FPDMA QUEUED

SMART Self-test log structure revision number 1
No self-tests have been logged. [To run self-tests, use: smartctl -t]


SMART Selective self-test log data structure revision number 1
 SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
    1 0 0 Not_testing
    2 0 0 Not_testing
    3 0 0 Not_testing
    4 0 0 Not_testing
    5 0 0 Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Gwarancji zwykłej już nie mam, ale jest jeszcze beztroska… Czy należy już wysyłać im dysk do tej gwarancji beztroski?

 

Z góry dzięki!

SMART wygląda w porządku. Jest sporo błędów transferu, ale nie powinny one sugerować nic poważnego. Dlaczego Windows Ci nie wstaje? Jest jakiś komunikat o błędzie? Dla pewności sprawdź cały dysk komendą “smartctl -t long /dev/twoj_dysk”. Może to potrwać nawet kilka godzin. Po ukończeniu puść jeszcze “smartctl -a /dev/twoj_dysk”. Jeśli nie wywali żadnych błędów to dysk jest sprawny

:!: :?: [-X

 

I co za tym idzie, błędy odczytu zapisu ,pomimo że sam smart nie wykazuje a poniższe logi. I związane z tym problemy jakie doświadcza użytkownik które przedstawił.

 

Zrobić dokładny skan programem z bootowania MHDD, instrukcje czy filmik znajdziesz w internecie. Prawdopodobnie czeka operacja zerowania czy remapu. CHKDSK może nie pomóc, błędów jest trochę i nie są to jednostkowe liczby jak 48. A MHDD może wykryć jeszcze więcej ,nie tylko jako same bady ale też sektory opóźnione. 

Zwiecha gdy tylko próbuję się zalogować. Windows 7. Tryb awaryjny działa, ale i tak nie umiem niczego mądrego na nim zrobić…

 

W biosie zmieniłem AHCI na IDE, puściłem skan MHDD (zostawiając domyśle ustawienia) i wyniki są takie:

 

DSC_0093_jpg_300x300_q85.jpg

 

 

Okej, chętnie, ale czy to nie będzie dublowanie pracy MHDD? W sensie, czy może to znaleźć cokolwiek, czego nie znalazł MHDD?

 

Na razie robię memtest.

Jak memtest nic nie wykaże to puść HDD Regeneratora. Niech przez talerz przeleci trochę energii. :slight_smile:

Przyznaję się, tą wartość przeoczyłem. Rzeczywiście z dyskiem zaczyna się dziać coś niedobrego. Sorry za wprowadzenie w błąd :?

Można przeoczyć, w jaki sposób zostało przedstawione, czyli w sposób rozciągły ,a nie w postaci okna programu.

 

Ale na własną odpowiedzialność. Program ma skrajne opinie. Osobiście nie polecam, ale decyzja należy do autora.

 

Z mojej strony to zostałbym przy  MHDD. Ale przed operacjami, zrobić kopię ważniejszych danych z całego dysku, na inny dysk fizyczny. Jak uruchomisz erase dealays, to wyzeruje gorsze sektory, czyli co najmniej przedstawione jako UNC w liczbie 5. Wyzerowane poszczególne sektory mogą z powodować uszkodzenie np.: niektórych danych, czy plików systemowych. I musisz mieć świadomość, że mogą być pewne trudności., po tej operacji. Możesz uruchomić pełne zerowanie, przez wpisanie komendy erase, i wtedy raczej wymaże cały dysk, jak potwierdzisz od pierwszego do ostatniego sektora. Spotkałem się z przypadkiem że dysk przez komendę nie zerował się cały, przynajmniej tak uż.ytkownik deklarował. Zapewniał że wpisał komendę erase a uruchomiło się jak erase dealays.

Operacja remap, teoretycznie powinna zachować dane z uszkodzonych sektorów, przenosząc na zapasowe. Ale to teoria i może być efekt podobny do zerowania selektywnego.

Sam zdecydujesz jaką operację wybierzesz, ale i tak dla bezpieczeństwa jaką byś nie wybrał operację, zrobić kopię danych na inny nośnik fizyczny. Osobiście bym pierwszą operację dał remap i zobaczył jakie da wyniki. Ale sam zdecydujesz jak postąpisz , nie tylko jakie operacje  uruchomisz z MHDD, ale też co do użycia HDD Regenerator.

Dobra, po dwóch pełnych przebiegach memtest86+ nic nie wykazał, zakładam że jest dobrze. Przewrażliwiony pewnie jestem, że go uruchamiałem, ale ten lapek miał pamięć już ze 2 razy wymienianą na gwarancji chyba.

 

 

100 dolarów… Nowe dyski są w porównywalnej cenie. Dziękuję, ale chyba sobie podaruję, szczególnie skoro…

 

 

 

 

OK, ale…

 

Chodzi o to, że kopia zapasowa zrobiona, z linuxami nie ma problemu zawsze można sobie ściągnąć, ale…

 

Na dysku jest partycja Windows 7 Recovery Environment. Służy do reinstalki Windowsa. Wolałbym jej nie stracić. Co prawda, jakieś 2 lata temu, po pierwszym uruchomieniu Windowsa wyskoczyło okienko by nagrać płyty do reinstalki (aż 5 kazali nagrać!), ale… To niby były moje płyty, puste kupione z marketu, może trochę gorszej jakości niż jakieś fabryczne…

 

Dla 100% bezpieczeństwa, może najpierw spróbuję zrobić reinstalkę Windowsa z tej partycji, a jeśli się uda to nagrać te płyty ponownie. Może dwie serie płyt będą ciut bardziej wiarygodne niż jedna. Wolałbym nie stracić na dobre Windowsa.

Pobierzesz Windę z sieci co za problem masz zapewne sticker na obudowie.

Jeśli masz jak kolega wspomniał dotyczące naklejki z kodem na lapku, oraz dowód kupna / faktura.  To spełniasz minimalne warunki legalności systemu. Czy minimum dwa warunki z pięciu

Czyli nie musisz się skazywać na system ,który masz dostarczany na lapku, z wieloma dodatkowymi programami. Bez których można się obejść. I zainstalować czysty system, zachowana zgodność z wersją jaką masz aktualnie. Ale oczywiście możesz sobie zrobić podwójną kopię na płytach recovery.

Nie wiem czy dobrze zrozumiałem, ale jak będziesz chciał na próbę instalować system z recovery na dysk. Może napotkać problem

ze względu na istniejące bad sectory. Chyba że zostaną wyleczone podczas formatu, zależy jakie są te bady. To podczas instalacji przy istniejących badach, instalacja może się zawiesić.

Skąd ma pobrać? Ze strony microsoftu, tam gdzie trzeba najpierw wprowadzić klucz produktu?

Oto, co robiłem:

  •  Zabrałem się za próbę reinstalacji Windowsa z Recovery.
  • Gdy wróciłem do pokoju po jakimś czasie, zobaczyłem Grub error: partition not found Grub entering rescue mode. Wnoszę więc, że jak napisaliście instalator Windowsa zdążył sformatować mi dysk i wyrzucić Linuxa, ale potem się scrashował i komputer się zresetował. A ja głupi miałem przecież możność wybrania, by Windowsa mi instalowało tylko na pierwszej partycji… Wybrałem cały dysk.
  • Przeczytałem na linuxowym LiveCD, że piszecie że można jednak zainstalować Windowsa bez Recovery. Więc w spokoju zabrałem się za skan MHDD z remapem
  • W trakcie tego skanu z komórki wyczytałem że w dokumentacji MHDD zalecają w przypadku błędów najpierw wyzerować dysk, a dopiero potem robić remap. Lekko zaniepokojony zacząłem głębiej szukać. Z tego, co się zdołałem wyrozumieć, to zerowanie może naprawić niektóre bad sectory bez konieczności remapu, a że jest ograniczona ilość operacji remapu, to lepiej najpierw zerować. Co mnie zaniepokoiło, to to jak w już trwającym skanie z remapem zobaczyłem więcej bad sectorów niż wcześniejsze 5, co gorsza miałem już pięć badów “ciurkiem” (jeden bad sector za drugim) - MHDD “zwieszał się” na parę minut na każdym badzie. Co kurczę, skutki próby instalacji Windowsa na dysku z badami? Trochę się przestraszyłem, że w ten sposób zaraz wykorzystam pulę realokacji… Przerwałem skan. Wyglądało to tak:
  • DSC_0095_jpg_300x300_q85.jpg
  • Zabrałem się za zerowanie. Poszło gładko. Screen:
  • DSC_0096_jpg_300x300_q85.jpg
  • Skan z domyślnymi opcjami. Nie wykazał badów! A nawet nie wykazał tego jednego “zielonego” sektora jaki był na skanie z remapem. Screen:
  • DSC_0100_jpg_300x300_q85.jpg
  • SMART po tym skanie:
  • DSC_0101_jpg_300x300_q85.jpg DSC_0102_jpg_300x300_q85.jpg
  • Napisałem tego posta z LiveCD

Okej, czy można założyć, że dysk jest sprawny? Czy należy nastawiać się na dalsze z nim problemy, teraz lub np. za miesiąc?

Ostatni skan i smart, wykazuje że, MHDD zrobił co do niego należało. Czyli aktualnie nie wykazuje badów w użyciu. Tylko zostaje kwestia bez odpowiedzi. Czy bady, będą się dalej pojawiać w krótkim czasie, czy będzie spokój. Jak dysk się ma ku temu, że się sypie, to nowe bady będą się pojawiać i mieć na względzie, taki scenariusz zdarzeń. Czyli po udanej naprawie z remapem ,monitorować stan dysku. Robiąc przez pierwsze dni użytkowania podgląd smart jak i zrobić skan np. za dwa , trzy dni użytkowania. Między czasie, możesz normalnie użytkować dysk, podzielić na partycje i instalować systemy. I być dobrej myśli, że nowe bady nie bądą się pojawiać. I nie będzie pogorszenia stanu dysku oprócz na nowe bady z innymi parametrami ze smart jak i np. pojawienie się słyszalnych odgłosów. Dysk nie lubi twardych resetów i pogorszenie stanu dysku może być. Ale co miałeś zrobić jak się zawiesiło, jakie inne rozwiązanie. Trzeba się liczyć z takimi zdarzeniami i mieć kopię danych na innych nośnikach. Jeśli pogorszenie z powoduje utrudnienie dostępu do danych, albo co gorsza zgon dysku.    

OK dzięki, tak zrobię, z tym tylko że przez parę dni będę poza domem i nie będę miał dostępu do tego konkretnego lapka, więc kopsnę te skany o kilka dni wprzód

Drobne sprostowanie: to nie było tak, że wyłączyłem sprzętową akcelerację (a tak przecież należało postąpić celem diagnostyki). Po prostu zwiechy zdarzały się wtedy, gdy był uruchomiony program, który “na mój nos” z akceleracji akurat korzystał. Czyli, to tylko moje spekulacje. Zresztą, raz mi się zdarzyła zwiecha na VLC, a AFAIK VLC nie korzysta ze sprzętowej akceleracji, więc to przeczy mojej pięknej teorii… Ale to ■■■■■ółka oczywiście.

To co bym chciał zrobić, to troszkę to przetestować. Zwiechy zdarzały się np. gdy w firefoxie chodziła jakaś gra HTML5. Więc chciałbym wyłączyć sprzętową akcelerację w foxie i sprawdzić, czy dalej będą zwiechy. Rozumiem, że ryzykowanie kolejnych takich zwiech może być zabójcze dla dysku, więc lepiej odpuścić takie zabawy?

 

Niestety, pobieranie ze strony Microsoftu nie działa.

 

Wyskakuje mi:

 

 

Wygląda, że nie można pobrać ze strony Microsoftu Windowsów na licencji OEM.

 

EDIT: Zdaje się, że nie można pobrać WIndows 7 na licencji OEM, a ja właśnie mam Windows 7. Wersje 8 i 10 już chyba można. Cytując Microsoftowe FAQ: