Сейчас как раз переношу данные с последнего мертвеца. Прошлые ограничивались парой Offline Uncorrectable в S.M.A.R.T., но сегодняшний покойничек дал дуба эффектно
ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0 ata1.00: BMDMA stat 0x64 ata1.00: cmd 25/00:08:c3:74:25/00:00:52:00:00/e0 tag 0 dma 4096 in res 51/40:00:ca:74:25/40:00:52:00:00/00 Emask 0x9 (media error) ata1.00: status: { DRDY ERR } ata1.00: error: { UNC } ata1.00: configured for UDMA/133 ata1.01: configured for UDMA/133 sd 0:0:0:0: Unhandled sense code sd 0:0:0:0: SCSI error: return code = 0x08000002 Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE,SUGGEST_OK sda: Current [descriptor]: sense key: Medium Error Add. Sense: Unrecovered read error - auto reallocate failed Descriptor sense data with sense descriptors (in hex): 72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00 52 25 74 ca EXT3-fs error (device sda3): ext3_get_inode_loc: <6>ata1: EH complete unable to read inode block - inode=171738553, block=171737135 6>
и таких записей полный лог. Пока ковырялся, пытаясь оживить систему, пришло письмо от мониторинга
The following warning/error was logged by the smartd daemon: Device: /dev/sda, FAILED SMART self-check. BACK UP DATA NOW! For details see host's SYSLOG.
Дальше по уже накатанной дорожке.
да... с винтами беда, в 10 рейде за год поменял все 4 винта, первый вылетел через 2 месяца, последний через 7.
ОтветитьУдалитьИ как было "радо" начальство услышав о таких новостях?! :) Я представляю какое было обьяснение ))
ОтветитьУдалитьМне повезло и моё начальство знает про управление рисками.
Удалить