Проблемы с SATA HDD.
NFS_Daemon 8 октября, 2010 - 19:07
Доброго времени суток, у меня в системе два HDD - оба WD Caviar Grin, 1 - 20EADS, 2 - 15EARS, со вторым проблемы: при копировании на него информации часть записывается нормально, потом несколько секунд mc не может записать информацию, затем сообщает что система отныне "read only", если в этот момент закрыть mc и отмонтировать этот HDD (на нем только один раздел на весь винт), а потом примонтировать mount не может понять тип ФС, если указать принудительно:
#mount -t ext3 /dev/sdb1 /mnt/data2 mount: wrong fs type, bad option, bad superblock on /dev/sdb1, missing codepage or helper program, or other error В некоторых случаях полезная информация может быть найдена в syslog - попробуйте dmesg | tail или что-то в этом роде
В messages появляются записи вида:
Oct 8 17:00:11 server kernel: ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen Oct 8 17:00:11 server kernel: ata2.00: failed command: WRITE DMA EXT Oct 8 17:00:11 server kernel: ata2.00: cmd 35/00:00:7f:14:ed/00:04:6a:00:00/e0 tag 0 dma 524288 out Oct 8 17:00:11 server kernel: res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout) Oct 8 17:00:11 server kernel: ata2.00: status: { DRDY } Oct 8 17:00:16 server kernel: ata2: link is slow to respond, please be patient (ready=0) Oct 8 17:00:21 server kernel: ata2: device not ready (errno=-16), forcing hardreset Oct 8 17:00:21 server kernel: ata2: soft resetting link Oct 8 17:00:26 server kernel: ata2: link is slow to respond, please be patient (ready=0) Oct 8 17:00:31 server kernel: ata2: SRST failed (errno=-16) Oct 8 17:00:31 server kernel: ata2: soft resetting link Oct 8 17:00:36 server kernel: ata2: link is slow to respond, please be patient (ready=0) Oct 8 17:00:41 server kernel: ata2: SRST failed (errno=-16)
а затем еще пачка других:
Oct 8 17:01:26 server kernel: sd 1:0:0:0: [sdb] Unhandled error code Oct 8 17:01:26 server kernel: sd 1:0:0:0: [sdb] Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK Oct 8 17:01:26 server kernel: sd 1:0:0:0: [sdb] CDB: Write(10): 2a 00 6a ef 41 9f 00 04 00 00 Oct 8 17:01:26 server kernel: end_request: I/O error, dev sdb, sector 1794064799 Oct 8 17:01:26 server kernel: sd 1:0:0:0: [sdb] Unhandled error code Oct 8 17:01:26 server kernel: sd 1:0:0:0: [sdb] Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK Oct 8 17:01:26 server kernel: sd 1:0:0:0: [sdb] CDB: Write(10): 2a 00 6a ef 45 9f 00 04 00 00 Oct 8 17:01:26 server kernel: end_request: I/O error, dev sdb, sector 1794065823 Oct 8 17:01:26 server kernel: sd 1:0:0:0: [sdb] Unhandled error code Oct 8 17:01:26 server kernel: sd 1:0:0:0: [sdb] Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK Oct 8 17:01:26 server kernel: sd 1:0:0:0: [sdb] CDB: Write(10): 2a 00 6a ef 49 9f 00 04 00 00 Oct 8 17:01:26 server kernel: end_request: I/O error, dev sdb, sector 1794066847
После возникновения этой ситуации утилиты для работы с диском (hdparm, fdisk, smartctl) ругаются что не могут получить доступ к диску.
До перезагрузки системы он не работает.
»
- Для комментирования войдите или зарегистрируйтесь
Покажите hdparm -iv /dev/sd?
Покажите (до сбоя)
# hdparm -iv
еще на всякий случай:
ИМХО, проблемы с железом.
ИМХО, проблемы с железом. Плохой сата шлейф, дохнет винт, может, конечно, и контроллер - всякое бывает. Исключай варианты.
Да, спасибо, это об этом я
Да, спасибо, это об этом я догадывался... Просто странно все это - год назад также умер еще 1 винт (15AEDS) - по гарантии выдали этот, был подлючен к этой же мат. плате, этим же шлейфом, по питанию - комп подключен к ИБП. или шлейф или мамка, но второй винт работает нормально, будем надеятся что шлейф.
---
С новым также, Попробую на другой материнской плате погонять его.
никогда не любил WD :)
никогда не любил WD :) каждый второй из моего опыта проблемный :) используй сигейты и проблем не будет ;)
по сути вопроса: проверь на всякий случай в каком режиме работает винт и материнка. есть SATA и SATA II. нужно, чтобы и мать и винт работали в одном режиме!
Theli написал(а): никогда не
вам привести соотношение полетевших сигейтов у нас на предприятии по отношению к другим ? примерно 4:1 не в их пользу. лично я сигейты никогда не любил.
они обратносовместимы и ни разу не слышал о такой проблеме.
________________________
"We Will Win"
Sith написал(а): вам привести
для нагрузок предприятия надо брать NS, а не AS, тогда лететь не будут! за всю жизнь использую только сигейты и пока умерло только 2 из-за энвидиевского рэйда... остальные живы и здоровы... самому старшему лет 8...
а вот и не совсем. если контроллер SATA I, то на винте надо переключить джампер для обратной совместимости! винт тебе не контроллер, чтобы определять, кто с ним работает ;)
Большого опыта с САТА винтами
Большого опыта с САТА винтами нет, но этот джампер ни разу не по понадобился и ни разу не помог. Либо винт работает сразу, либо джампер не поможет.
А вы делали выравнивание
А вы делали выравнивание раздела, на начало дорожки, так как у WD последеней сеии и грин в частности размер сектора 4kb, а не 512 b.
Может в этом проблема?
Дело точно не в 4-х
Дело точно не в 4-х килобайтовом кластере. Там просто медленная запись из-за эмуляции кластера в 512 байт. А тут явно отказ железа или проблемы с блоком питания. Да да, питания. Недавно была похожая ситуация, в логи валились ошибки об отказе винта. Замена блока питания помогла ибо на старом кондеры высохли. Вместо 12 вольт было 11,5 с бааальщущими пульсациями.
Блока питания компьютера?
Блока питания компьютера? Тогда как объяснить то что на той же ветке разъемов (от БП) сидит еще один винт (WD20EADS) и чувствует себя при этом отлично? Это не проблема БП, запас мощности у него громадный (650 ВТ), используется наверное на 20%-40%. Боюсь проблема в винте. На счет кластера - пол года работал нормально, а потом вдруг ему размер не понравился - это не логично.
Скорее всего проблема в винте, victoria - вообще зависла на ~90%, и ошибками начала бросаться. Понесу его в сервис.
Я же не утверждаю что у вас
Я же не утверждаю что у вас именно в бп дело, я просто привел один из вариантов.
PS: Интересно что на той же ветке у меня нормально работал Seagate-овская 400ка. Может WD более чувствительны к таким вещам.
По заверениям знакомого спеца
По заверениям знакомого спеца по винтам, WD действительно гораздо чувствительнее к качеству питания, да и не только. По большей части стараюсь использовать хитачи или самсунг - никому не навязывая - это выбор мой и авторитетного для меня в данном вопросе товарища.
Что в текущем случае, вам однозначно никто не скажет. Я бы начал со шлейфа и БП.
Нащяльника, мая сервира паставиль, фрибизьдя инсталя сделаль, апачи сабраль, пыхапе патключиль, сапускаю, а ано - ажамбех пашамбе эшельбе шайтанама!
Дорогой друг!!! Купи себе
Дорогой друг!!! Купи себе нормальное железо,и не делай сам себе проблемы.Хоча я не говорю ,что WD плохое железо.А то ,что здесь написано - это говорит: переразбей fdisk-ом на разделы,а потом переформатируй ну на пример GParted -ом .Рекомендую Samsung-(имеется железо).Будь счаслив.
valik
valik написал(а): Дорогой
хорошее решение проблемы ;)
самый полезный совет на этом форуме, добавлю ка в закладки ;)
________________________
"We Will Win"
Ушел
/me ушел форматировать свой Toshiba...
Я не смог понять твой комментарий...
И по этому поводу решил подарить тебе запятую: ",". Используй её с умом!
Не факт кстати что проблема с железом))
У меня недавно было точно такой же трабл с хардом, кстати тоже WD Caviar Grin)). Я тогда не стал его особо ковырять и просто отформатировал тот раздел, при записи на который была проблема.. он был форматирован в reiser. После переформатирования проблема больше не появлялась, так что возможно была повреждена файловая система.
Я несу пингвина во имя луны! *WALL*
из СЦ вернули с пометкой "Рабочий"
И что самое обидное что работать он не хочет именно с ext3 (ntfs под WinXP забивается полностью).