Страный сбой жесткого диска. [Решено, предпологаемая причина сбоя найдена]
micbal 25 марта, 2010 - 12:52
Ночью на 23 сутках уптайма (а бывало и больше) мой роутер-сервер выдал вот это:
http://dpaste.com/175872/ (весь лог не влез, это кусок)
Раздел на котором произошел сбой больше не позволял не читать не писать на него. Пришлось перегружать, диск на котором был сбой проверил на bad'блоки, все нормально, пересоздал файловую систему (там всякая фигня лежала - восстанавливать не стал) щас работает. Что это могло быть? Крмп работает на упсе, перебои с питанием исключены. На втором системном диске сбоя не было.
»
- Для комментирования войдите или зарегистрируйтесь
Предложу, предположив:
1. Машине сколько лет? Сколько винтов в системе, и какое охлаждение на них.
2. Роутер стоит в проходном месте? (если да, то п.3,п.4 проявляются активно)
3. САТА-кабеля менялись? (попробовать свапнуть)
4. Питание на САТА винты - через молексы? (если да - нужно поджать контакты)
5. Параметры винта менялись? (откатить, причем немедленно)
6. Напруга 12v, 5v в биосе - соответствует? (если нет см. так же п.7, если не помогло - замена БП)
7. Куллер на процессоре чистый? во время работы частота вращения стабильная или плавает?
Теплый или горячий в районе сердечника? (Такие симптомы приводят к убийству БП, равно как и
самого куллера. Необходимо заменить куллер и проверить вновь п.6.
Если такие симптомы у одного винта, это не значит что сыпется только он, возможно он просто самый нестабильный на рассинхронизацию контроллера, и лишь предупреждает об опасности.
Gentoo - Symphony of Creations
Спасибо за помощь! Насколько
Спасибо за помощь!
Насколько я понял нужно искать причину аппаратного сбоя, от контроля напряжений и уровня пульсаций, до температуры и изношенности разьемов. Как найду аномалии, отпишусь о причине.
Нет
Но это первое что нужно проверить ...
Gentoo - Symphony of Creations
:)
И смотри еще что покажет smartctl -a /dev/sdX
emerge smartmontools
Да не, вряд ли - при таком аптайме-то скорее всего винт еще жив
Gentoo - Symphony of Creations
DolphinSoft написал(а): Да
Какое отношение uptime имеет к живости винта?
Самое прямое
Если смарт говорит что винт дохлый (или вот-вот сдохнет), то этот винт не вывезет месяц аптайма ни при каких обстоятельствах (разве если этот винт не используется системой)
На практике:
Винт глючит редко, статусы смарт зелено-желтые.
Винт глючит часто, статусы смарт зелено-желтые (1-2 красные, например время раскрутки шпинделя более 5 сек).
Винт умер, статусы смарт желтые и красные (множественные ошибки, периодически стартует но не инициализируется).
Сейчас являюсь обладателем уникального изделия: винт умер, статусы смарт желтые и красные, множественные ошибки, но раскручивается и инициализируется. Проверка выявила предел релокейтов в первой трети (скорее четверти = 1/4 т.е. 1 блин из 4х при 160Гб)
На данный момент винт стоит и работает при выключенном смарте и разметке разделов
[xxxxxxxxxxx[WWWWWWW][WWWWWWW]]
ББ не прогрессируют (6 месяцев), но скорость чтения-записи не превышает 3 мб/c
Жду когда облезут остальные 3 блина :)
ЗЫ: Жаль нет больше моего друга, вытворял такие чудеса! Например - откусывание одной головы, с прописыванием новой арифметики в сервотрэк. Мне это не дано :( А приемников он не оставил ... очень жаль :(
Gentoo - Symphony of Creations
DolphinSoft написал(а): Если
Демагогия какая-то. Как будто винт в процессе работы не может выйти из строя - и S.M.A.R.T. не будет изменять показаний.
На практике проверено лично - при аптайме более 200 суток - 5 дней назад винт был живее всех живых - а сегодня - оппаа! По показателям S.M.A.R.T. его уже пора менять. Буквально недавно такой винт выкинул с сервака - Start-Stop Count - у него всего был 6 (2 года проработал винт.)
Так что я бы все-таки посмотрел что smartctl говорит по поводу винта у топикстартера. Это намного проще сделать - чем написать даже ваше сообщение.
Всем спасибо за участие! Пока
Всем спасибо за участие! Пока не добрался до дома, но удаленно сделал smartctl -a /dev/sdb
http://dpaste.com/175986/
:)
Прекрасное состояние.
Вот я и говорю:
Что первым делом стоит проверить питание этого винта, а за одно и остальных ;)
...
Gentoo - Symphony of Creations
DolphinSoft написал(а): Что
Да, и температурный режим его контроллера. (Южный мост вроде? или ошибаюсь?)
Пока писал ответ лог появился (сори)
Угу ...
Контроллер винта находится в винте, в мосте находятся контроллеры шины
Gentoo - Symphony of Creations
Всем спасибо за помощь!
Всем спасибо за помощь! Контроль всей аппаратной части выявил вспухшие конденсаторы в выходной части блока питания. Уровень пульсаций на шинах питания осциллографом смотреть не стал, заменил конденсаторы.