подозрение на битые сектора
sango 21 марта, 2013 - 23:53
Добрый вечер, коллеги
прошу помочь идентифицировать причину проблемы.
сегодня вечером не смог залогиниться на сервер, просмотр онлайн лога показал, что система упала в read only. вроде как проблемы с записью на отдельные блоки. после ребута пока полет нормальный.
нынешний messages
настораживают записи Emask 0x10 (ATA bus error)
я уверен, что диск начинает сыпаться.
есть ли вероятность неисправности моста на материнке?
ps как правило при запуске ловлю сообщения "вставьте bootable диск и нажмите ентер" прежде чем прогрузиться. иногда фейлится на grub-е.
»
- Для комментирования войдите или зарегистрируйтесь
Битые сектора однозначное
Битые сектора однозначное идентифицируются через smart, если не уверен запусти полный тест поверхности
если smart в порядке, а проблемы с диском есть, то либо кабель, либо контроллер
прогнал smartctl -t long
прогнал smartctl -t long /dev/sda
получил
-a показывает
9 Power_On_Minutes 0x0032 225 225 000 Old_age Always - 1044h+57m
а так же
ATA error count 613 inconsistent with error log pointer 5
Error 613 occurred at disk power-on lifetime: 9168 hours (382 days + 0 hours)
...
творю непотребства и потом жалуюсь на форуме, ибо gentoo позволяет, since 2009
покажи smartctl -A /dev/sda
покажи
# smartctl -A
на всякий случай с маленькой a
творю непотребства и потом жалуюсь на форуме, ибо gentoo позволяет, since 2009
битых секторов точно нет, но
битых секторов точно нет, но сбоит DMA (кстати, при сбое DMA диск практически всегда переходит в RO и вскоре умирает - сделай копии :)):
т.е. проблемы с электроникой/кабелем/контактами...
Замени кабель (поставь 80-pins), осмотри плату (если доступна, конечно) на предмет холодной пайки, потемнений на м/с и т.п.
Посмотри историю по всем доступным логам (smartd должен быть сконфигурирован и включен в startup!)
У тебя подозрительно низкая температура диска - наверное снимал после включения, а надо бы в рабочем режиме...
Mar 22 20:58:35 timothy-gate
Mar 22 20:58:35 timothy-gate kernel: [65557.410302] ck-collect-sess[18046]: segfault at 20 ip b76c84c3 sp bfa12050 error 4 in libglib-2.0.so.0.3000.3[b7696000+10a000]
Mar 22 20:58:35 timothy-gate kernel: [65557.425241] udev-acl.ck[18047]: segfault at 84483e8 ip b77e78d7 sp bfe706a0 error 4 in ld-2.14.1.so[b77dd000+1d000]
Mar 22 20:58:35 timothy-gate kernel: [65557.472687] cut[18051]: segfault at 84492ee ip 084492ee sp bff45fbc error 4
Mar 22 20:58:53 timothy-gate kernel: [65575.244322] tail[18057]: segfault at 844945e ip 0844945e sp bf90263c error 4
Segmentation fault
творю непотребства и потом жалуюсь на форуме, ибо gentoo позволяет, since 2009
ata1.00: model number
ata1.00: model number mismatch 'Maxtor 6E040L0' != 'Maxtor vEp4pLp ` ` ` ` ` ` ` ` ` ` ` ` `'
творю непотребства и потом жалуюсь на форуме, ибо gentoo позволяет, since 2009
Это скорее плата
Это скорее плата перегревается на нём.
Локальный оверлей растёт
плата на диске?
плата на диске?
творю непотребства и потом жалуюсь на форуме, ибо gentoo позволяет, since 2009
Было что-то подобное на
Было что-то подобное на старом ЖД при перегреве схем.
Локальный оверлей растёт
Такое может быть как при
Такое может быть как при перегреве моста (лечится радиатором на термоклее), так и битым шлейфом, который до этого 10 лет никто не трогал.