Ребята как можно это трактовать?
ivanf 13 октября, 2009 - 10:57
Вот собственно прихожу на работу с утра и как гром среди ясного неба - сервер который полтора года работал бес сбоев упал! Причем упал странно - пингуется, но ни один порт недоступен (превышен интервал ожидания), после ребута в ДЦ просмотрел логи и увидел вот такие вещи:
Oct 12 04:13:36 d190 kernel: ata1.01: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x2 Oct 12 04:13:36 d190 kernel: ata1.01: BMDMA stat 0x66 Oct 12 04:13:36 d190 kernel: ata1.01: cmd 25/00:08:6f:0a:64/00:00:1c:00:00/f0 tag 0 dma 4096 in Oct 12 04:13:36 d190 kernel: res 51/84:00:76:0a:64/84:00:1c:00:00/f0 Emask 0x30 (host bus error) Oct 12 04:13:36 d190 kernel: ata1.01: status: { DRDY ERR } Oct 12 04:13:36 d190 kernel: ata1.01: error: { ICRC ABRT } Oct 12 04:13:36 d190 kernel: ata1: soft resetting link Oct 12 04:13:36 d190 kernel: ata1.00: configured for UDMA/133 Oct 12 04:13:36 d190 kernel: ata1.01: configured for UDMA/133 Oct 12 04:13:36 d190 kernel: ata1: EH complete Oct 12 04:13:36 d190 kernel: SCSI device sda: 490234752 512-byte hdwr sectors (251000 MB) Oct 12 04:13:36 d190 kernel: sda: Write Protect is off Oct 12 04:13:36 d190 kernel: SCSI device sda: drive cache: write back Oct 12 04:13:36 d190 kernel: SCSI device sdb: 490232639 512-byte hdwr sectors (250999 MB) Oct 12 04:13:36 d190 kernel: sdb: Write Protect is off Oct 12 04:13:36 d190 kernel: SCSI device sdb: drive cache: write back Oct 12 04:13:36 d190 kernel: SCSI device sda: 490234752 512-byte hdwr sectors (251000 MB) Oct 12 04:13:36 d190 kernel: sda: Write Protect is off Oct 12 04:13:37 d190 kernel: SCSI device sda: drive cache: write back Oct 12 04:13:37 d190 kernel: SCSI device sdb: 490232639 512-byte hdwr sectors (250999 MB) Oct 12 04:13:37 d190 kernel: sdb: Write Protect is off Oct 12 04:13:37 d190 kernel: SCSI device sdb: drive cache: write back
This email was generated by the smartd daemon running on: host name: d190.colo.hc.ru DNS domain: colo.hc.ru NIS domain: (none) The following warning/error was logged by the smartd daemon: Device: /dev/sda, 149 Offline uncorrectable sectors For details see host's SYSLOG (default: /var/log/messages). You can also use the smartctl utility for further investigation. No additional email messages about this problem will be sent. This email was generated by the smartd daemon running on: host name: d190.colo.hc.ru DNS domain: colo.hc.ru NIS domain: (none) The following warning/error was logged by the smartd daemon: Device: /dev/sda, 145 Currently unreadable (pending) sectors For details see host's SYSLOG (default: /var/log/messages). You can also use the smartctl utility for further investigation. No additional email messages about this problem will be sent. Transcript of session follows.
Out: 220 d190.colo.hc.ru ESMTP Postfix (2.3.3 on CentOS-5.2) In: EHLO ZWCCNLL Out: 250-d190.colo.hc.ru Out: 250-PIPELINING Out: 250-SIZE 10240000 Out: 250-ETRN Out: 250-STARTTLS Out: 250-AUTH PLAIN LOGIN CRAM-MD5 Out: 250-ENHANCEDSTATUSCODES Out: 250-8BITMIME Out: 250 DSN In: MAIL FROM: <cook@daddario.com <mailto:cook@daddario.com>> Out: 250 2.1.0 Ok In: RCPT TO: <benza@benza.ru <mailto:benza@benza.ru>> Out: 250 2.1.5 Ok In: DATA Out: 354 End data with <CR><LF>.<CR><LF> _ Out: 451 4.3.0 Error: queue file write error_
Последнее сообщение появляется с завидной регулярностью!
Как это все можно трактовать?
»
- Для комментирования войдите или зарегистрируйтесь
сдох винт? badblocks -v
сдох винт?
badblocks -v /dev/sda
пробовал?Счас проверю, пока работает,
Счас проверю, пока работает, подвисаний не наблюдается. Если действительно проблема физически в HDD, как на это должен отреагировать хостинг цент, несет ли он какую либо ответственность? Какими должны быть его действия?
gentoo centos fedora
badblocks -v
badblocks -v /dev/sda
Checking blocks 0 to 245117376
Checking for bad blocks (read-only test): 108591744591744/ 245117376
108591800591800/ 245117376
108591801591801/ 245117376
108591802591802/ 245117376
108591803591803/ 245117376
108591804591804/ 245117376
ВОТ БЛИН!!! че все ппц. Что теперь делать, обращаться чтобы винт заменили?, как правильно дамп делать чтобы и систему перенести и данные?
gentoo centos fedora
Аааа .. ааа! Уже
Аааа .. ааа! Уже восстанавливал одну базу mysql!!!
gentoo centos fedora
Зависит от условий контракта.
Зависит от условий контракта. Если сервер их, то чинить должны они. Если ваш, то скорее всего вы и должны ехать и чинить его сами. Если, конечно, не оговорено иное.
сказали воткнут еще винт,
сказали воткнут еще винт, бесплатно KVM и разбирайтесь сами, по linux у нас специалистов нет, только freeBSD :(, делать нечего, посчитал сколько бедов, выходит всего около 50 Кб, так что не смертельно.
gentoo centos fedora
Было бы смешно
если бы не было так грустно.
Что указывает на никакой уровень квалификации данных "специалистов".
:wq
--
Live free or die
hc - они хостят, все равно
hc - они хостят, все равно мне сервис их нравится и вообще нравятся, если с чем сравнивать... 100mb вообще ппц
gentoo centos fedora
Device: /dev/sda, 149 Offline
Я надеюсь что вам перевод не нужен.hdd сыпется, точнее сказать можно после mhdd
Compute:
Bosch M2.8.1 -> custom Bosch M2.8.3 clone from Russia.
Speed about 260 km,Ram 2 pers.,HDD - 70 kg,210 FLOPS ;)
кто подскажет как определить
кто подскажет как определить на какие конкретно файлы попали badblocks? по индексу блока например.
gentoo centos fedora
как определить
Я бы в первую оередь посмотрел /var/log/messages
emerge Your world
Gentoogle