Ребята как можно это трактовать?

Вот собственно прихожу на работу с утра и как гром среди ясного неба - сервер который полтора года работал бес сбоев упал! Причем упал странно - пингуется, но ни один порт недоступен (превышен интервал ожидания), после ребута в ДЦ просмотрел логи и увидел вот такие вещи:

Oct 12 04:13:36 d190 kernel: ata1.01: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x2
Oct 12 04:13:36 d190 kernel: ata1.01: BMDMA stat 0x66
Oct 12 04:13:36 d190 kernel: ata1.01: cmd 25/00:08:6f:0a:64/00:00:1c:00:00/f0 tag 0 dma 4096 in
Oct 12 04:13:36 d190 kernel:          res 51/84:00:76:0a:64/84:00:1c:00:00/f0 Emask 0x30 (host bus error)
Oct 12 04:13:36 d190 kernel: ata1.01: status: { DRDY ERR }
Oct 12 04:13:36 d190 kernel: ata1.01: error: { ICRC ABRT }
Oct 12 04:13:36 d190 kernel: ata1: soft resetting link
Oct 12 04:13:36 d190 kernel: ata1.00: configured for UDMA/133
Oct 12 04:13:36 d190 kernel: ata1.01: configured for UDMA/133
Oct 12 04:13:36 d190 kernel: ata1: EH complete
Oct 12 04:13:36 d190 kernel: SCSI device sda: 490234752 512-byte hdwr sectors (251000 MB)
Oct 12 04:13:36 d190 kernel: sda: Write Protect is off
Oct 12 04:13:36 d190 kernel: SCSI device sda: drive cache: write back
Oct 12 04:13:36 d190 kernel: SCSI device sdb: 490232639 512-byte hdwr sectors (250999 MB)
Oct 12 04:13:36 d190 kernel: sdb: Write Protect is off
Oct 12 04:13:36 d190 kernel: SCSI device sdb: drive cache: write back
Oct 12 04:13:36 d190 kernel: SCSI device sda: 490234752 512-byte hdwr sectors (251000 MB)
Oct 12 04:13:36 d190 kernel: sda: Write Protect is off
Oct 12 04:13:37 d190 kernel: SCSI device sda: drive cache: write back
Oct 12 04:13:37 d190 kernel: SCSI device sdb: 490232639 512-byte hdwr sectors (250999 MB)
Oct 12 04:13:37 d190 kernel: sdb: Write Protect is off
Oct 12 04:13:37 d190 kernel: SCSI device sdb: drive cache: write back
This email was generated by the smartd daemon running on:

   host name: d190.colo.hc.ru
  DNS domain: colo.hc.ru
  NIS domain: (none)

The following warning/error was logged by the smartd daemon:

Device: /dev/sda, 149 Offline uncorrectable sectors

For details see host's SYSLOG (default: /var/log/messages).

You can also use the smartctl utility for further investigation.
No additional email messages about this problem will be sent.

This email was generated by the smartd daemon running on:

   host name: d190.colo.hc.ru
  DNS domain: colo.hc.ru
  NIS domain: (none)

The following warning/error was logged by the smartd daemon:

Device: /dev/sda, 145 Currently unreadable (pending) sectors

For details see host's SYSLOG (default: /var/log/messages).

You can also use the smartctl utility for further investigation.
No additional email messages about this problem will be sent.

Transcript of session follows.
Out: 220 d190.colo.hc.ru ESMTP Postfix (2.3.3 on CentOS-5.2)
In:  EHLO ZWCCNLL
Out: 250-d190.colo.hc.ru
Out: 250-PIPELINING
Out: 250-SIZE 10240000
Out: 250-ETRN
Out: 250-STARTTLS
Out: 250-AUTH PLAIN LOGIN CRAM-MD5
Out: 250-ENHANCEDSTATUSCODES
Out: 250-8BITMIME
Out: 250 DSN
In:  MAIL FROM: <cook@daddario.com <mailto:cook@daddario.com>>
Out: 250 2.1.0 Ok
In:  RCPT TO: <benza@benza.ru <mailto:benza@benza.ru>>
Out: 250 2.1.5 Ok
In:  DATA
Out: 354 End data with <CR><LF>.<CR><LF>
_ Out: 451 4.3.0 Error: queue file write error_ 

Последнее сообщение появляется с завидной регулярностью!
Как это все можно трактовать?

сдох винт? badblocks -v

сдох винт?

badblocks -v /dev/sda пробовал?

Счас проверю, пока работает,

Счас проверю, пока работает, подвисаний не наблюдается. Если действительно проблема физически в HDD, как на это должен отреагировать хостинг цент, несет ли он какую либо ответственность? Какими должны быть его действия?

gentoo centos fedora

badblocks -v

badblocks -v /dev/sda
Checking blocks 0 to 245117376
Checking for bad blocks (read-only test): 108591744591744/ 245117376
108591800591800/ 245117376
108591801591801/ 245117376
108591802591802/ 245117376
108591803591803/ 245117376
108591804591804/ 245117376

ВОТ БЛИН!!! че все ппц. Что теперь делать, обращаться чтобы винт заменили?, как правильно дамп делать чтобы и систему перенести и данные?

gentoo centos fedora

Аааа .. ааа! Уже

Аааа .. ааа! Уже восстанавливал одну базу mysql!!!

gentoo centos fedora

Зависит от условий контракта.

Зависит от условий контракта. Если сервер их, то чинить должны они. Если ваш, то скорее всего вы и должны ехать и чинить его сами. Если, конечно, не оговорено иное.

сказали воткнут еще винт,

сказали воткнут еще винт, бесплатно KVM и разбирайтесь сами, по linux у нас специалистов нет, только freeBSD :(, делать нечего, посчитал сколько бедов, выходит всего около 50 Кб, так что не смертельно.

gentoo centos fedora

Было бы смешно

если бы не было так грустно.

ivanf написал(а):
сказали воткнут еще винт, бесплатно KVM и разбирайтесь сами, по linux у нас специалистов нет, только freeBSD :(

Что указывает на никакой уровень квалификации данных "специалистов".

:wq
--
Live free or die

hc - они хостят, все равно

hc - они хостят, все равно мне сервис их нравится и вообще нравятся, если с чем сравнивать... 100mb вообще ппц

gentoo centos fedora

Device: /dev/sda, 149 Offline

Device: /dev/sda, 149 Offline uncorrectable sectors

Я надеюсь что вам перевод не нужен.hdd сыпется, точнее сказать можно после mhdd

Compute:
Bosch M2.8.1 -> custom Bosch M2.8.3 clone from Russia.
Speed about 260 km,Ram 2 pers.,HDD - 70 kg,210 FLOPS ;)

кто подскажет как определить

кто подскажет как определить на какие конкретно файлы попали badblocks? по индексу блока например.

gentoo centos fedora

как определить

The following warning/error was logged by the smartd daemon:

Device: /dev/sda, 145 Currently unreadable (pending) sectors

For details see host's SYSLOG (default: /var/log/messages).
You can also use the smartctl utility for further investigation.

Я бы в первую оередь посмотрел /var/log/messages

emerge Your world
Gentoogle

Настройки просмотра комментариев

Выберите нужный метод показа комментариев и нажмите "Сохранить установки".