Страный сбой жесткого диска. [Решено, предпологаемая причина сбоя найдена]

Ночью на 23 сутках уптайма (а бывало и больше) мой роутер-сервер выдал вот это:
http://dpaste.com/175872/ (весь лог не влез, это кусок)
Раздел на котором произошел сбой больше не позволял не читать не писать на него. Пришлось перегружать, диск на котором был сбой проверил на bad'блоки, все нормально, пересоздал файловую систему (там всякая фигня лежала - восстанавливать не стал) щас работает. Что это могло быть? Крмп работает на упсе, перебои с питанием исключены. На втором системном диске сбоя не было.

Предложу, предположив:

1. Машине сколько лет? Сколько винтов в системе, и какое охлаждение на них.
2. Роутер стоит в проходном месте? (если да, то п.3,п.4 проявляются активно)
3. САТА-кабеля менялись? (попробовать свапнуть)
4. Питание на САТА винты - через молексы? (если да - нужно поджать контакты)
5. Параметры винта менялись? (откатить, причем немедленно)
6. Напруга 12v, 5v в биосе - соответствует? (если нет см. так же п.7, если не помогло - замена БП)
7. Куллер на процессоре чистый? во время работы частота вращения стабильная или плавает?
Теплый или горячий в районе сердечника? (Такие симптомы приводят к убийству БП, равно как и
самого куллера. Необходимо заменить куллер и проверить вновь п.6.

Если такие симптомы у одного винта, это не значит что сыпется только он, возможно он просто самый нестабильный на рассинхронизацию контроллера, и лишь предупреждает об опасности.

Gentoo - Symphony of Creations

Спасибо за помощь! Насколько

Спасибо за помощь!

Насколько я понял нужно искать причину аппаратного сбоя, от контроля напряжений и уровня пульсаций, до температуры и изношенности разьемов. Как найду аномалии, отпишусь о причине.

Нет

Но это первое что нужно проверить ...

Gentoo - Symphony of Creations

:)

И смотри еще что покажет smartctl -a /dev/sdX

emerge smartmontools

Да не, вряд ли - при таком аптайме-то скорее всего винт еще жив

Gentoo - Symphony of Creations

DolphinSoft написал(а): Да

DolphinSoft написал(а):
Да не, вряд ли - при таком аптайме-то скорее всего винт еще жив

Какое отношение uptime имеет к живости винта?

Самое прямое

Если смарт говорит что винт дохлый (или вот-вот сдохнет), то этот винт не вывезет месяц аптайма ни при каких обстоятельствах (разве если этот винт не используется системой)

На практике:
Винт глючит редко, статусы смарт зелено-желтые.
Винт глючит часто, статусы смарт зелено-желтые (1-2 красные, например время раскрутки шпинделя более 5 сек).
Винт умер, статусы смарт желтые и красные (множественные ошибки, периодически стартует но не инициализируется).

Сейчас являюсь обладателем уникального изделия: винт умер, статусы смарт желтые и красные, множественные ошибки, но раскручивается и инициализируется. Проверка выявила предел релокейтов в первой трети (скорее четверти = 1/4 т.е. 1 блин из 4х при 160Гб)
На данный момент винт стоит и работает при выключенном смарте и разметке разделов
[xxxxxxxxxxx[WWWWWWW][WWWWWWW]]
ББ не прогрессируют (6 месяцев), но скорость чтения-записи не превышает 3 мб/c
Жду когда облезут остальные 3 блина :)

ЗЫ: Жаль нет больше моего друга, вытворял такие чудеса! Например - откусывание одной головы, с прописыванием новой арифметики в сервотрэк. Мне это не дано :( А приемников он не оставил ... очень жаль :(

Gentoo - Symphony of Creations

DolphinSoft написал(а): Если

DolphinSoft написал(а):
Если смарт говорит что винт дохлый (или вот-вот сдохнет), то этот винт не вывезет месяц аптайма ни при каких обстоятельствах (разве если этот винт не используется системой)

Демагогия какая-то. Как будто винт в процессе работы не может выйти из строя - и S.M.A.R.T. не будет изменять показаний.
На практике проверено лично - при аптайме более 200 суток - 5 дней назад винт был живее всех живых - а сегодня - оппаа! По показателям S.M.A.R.T. его уже пора менять. Буквально недавно такой винт выкинул с сервака - Start-Stop Count - у него всего был 6 (2 года проработал винт.)

Так что я бы все-таки посмотрел что smartctl говорит по поводу винта у топикстартера. Это намного проще сделать - чем написать даже ваше сообщение.

Всем спасибо за участие! Пока

Всем спасибо за участие! Пока не добрался до дома, но удаленно сделал smartctl -a /dev/sdb
http://dpaste.com/175986/

:)

Прекрасное состояние.

Вот я и говорю:

Что первым делом стоит проверить питание этого винта, а за одно и остальных ;)

...

Gentoo - Symphony of Creations

DolphinSoft написал(а): Что

DolphinSoft написал(а):
Что первым делом стоит проверить питание этого винта, а за одно и остальных ;)
...

Да, и температурный режим его контроллера. (Южный мост вроде? или ошибаюсь?)

Пока писал ответ лог появился (сори)

Угу ...
Контроллер винта находится в винте, в мосте находятся контроллеры шины

Gentoo - Symphony of Creations

Всем спасибо за помощь!

Всем спасибо за помощь! Контроль всей аппаратной части выявил вспухшие конденсаторы в выходной части блока питания. Уровень пульсаций на шинах питания осциллографом смотреть не стал, заменил конденсаторы.

Настройки просмотра комментариев

Выберите нужный метод показа комментариев и нажмите "Сохранить установки".