на свежих ядрах не работает hp smart array 6i

есть сервер ProLiant DL360 G4p с raid'ом hp smart array 6i

при установке свежей gentoo 64bit, ubuntu server 10.04 LTS 64bit, CentOS 6.2 32/64 bit вылазет проблема

ядро переводит дисковый раздел в ридонли в лог сыпется

Цитата:
Jan 12 07:19:51 sysresccd kernel: [14770.363969] lost page write due to I/O error on cciss/c0d0p1
Jan 12 07:19:51 sysresccd kernel: [14770.363992] Buffer I/O error on device cciss/c0d0p1, logical block 8388747
Jan 12 07:19:51 sysresccd kernel: [14770.364005] lost page write due to I/O error on cciss/c0d0p1
Jan 12 07:19:51 sysresccd kernel: [14770.466844] cciss 0000:02:01.0: cmd f38057e0 has CHECK CONDITION sense key = 0x3
Jan 12 07:19:51 sysresccd kernel: [14770.466855] end_request: I/O error, dev cciss/c0d0, sector 68684816

BIOS сервера и firmware raid-контроллера обновлены до крайних

НО!!!
Centos 4.8 установилась и работает без подобных сообщений

sysresccd там тоже ядро 3

sysresccd там тоже ядро 3 ветки

версия ядра?

версия ядра?

Не грусти, товарищ! Всё хорошо, beautiful good!

версии

НЕРАБОТАЕТ
Centos x86/x86_64 - 2.6.32-220
System Rescue CD x86/x86_64 - 3.0.13-std341
Gentoo x86_64 - 3.X.X
Ubuntu Server 10.04.3 amd64 - 2.6.32-34

РАБОТАЕТ
Centos x86 - 2.6.9-89

2.6.32 уже давно устарел. В

2.6.32 уже давно устарел. В какой-то версии 2.6.3х вносились изменения в код контроллера, которые отключали подобные сообщения.
В комментарии автор писал, что подобные сообщения могут возникать при включенном кеше записи на дисках. Этот кеш нужно выключить, так как должен работать кеш записи самого контроллера.

Не грусти, товарищ! Всё хорошо, beautiful good!

winterheart

winterheart написал(а):
2.6.32 уже давно устарел. В какой-то версии 2.6.3х вносились изменения в код контроллера, которые отключали подобные сообщения.
В комментарии автор писал, что подобные сообщения могут возникать при включенном кеше записи на дисках. Этот кеш нужно выключить, так как должен работать кеш записи самого контроллера.

я это находил - там баг был в том, что все пишется на диск как надо, но в логи сыпятся сообщения типа

Цитата:
Buffer I/O error on device cciss/c0d0p1, logical block 0
Buffer I/O error on device cciss/c0d0p1, logical block 0
Buffer I/O error on device cciss/c0d0p1, logical block 0

на ядрах 3.Х.Х
Gentoo - current-iso - ядро из 3 ветки
System Rescue CD (на базе генты) - kernel=3.0.13-std341

в лог сыпет подобные сообщения

Цитата:
Jan 12 07:19:51 sysresccd kernel: [14770.466844] cciss 0000:02:01.0: cmd f38057e0 has CHECK CONDITION sense key = 0x3
Jan 12 07:19:51 sysresccd kernel: [14770.466855] end_request: I/O error, dev cciss/c0d0, sector 68684816
Jan 12 07:19:51 sysresccd kernel: [14770.570810] cciss 0000:02:01.0: cmd f3807460 has CHECK CONDITION sense key = 0x3
Jan 12 07:19:51 sysresccd kernel: [14770.570880] end_request: I/O error, dev cciss/c0d0, sector 69733392

я бы на диски погрешил, но

я бы на диски погрешил, но hpacucli говорит, что статус массива ОК даже когда ядро переключает раздел в ридонли
и на чевертой центоси никаких граблей не наблюдается

/

nalcheg написал(а):
НО!!!
Centos 4.8 установилась и работает без подобных сообщений

1. Унести оттуда конфиг (и информацию о версии) ядра.
2. Попробовать mini live install cd.

:wq
--
Live free or die

Anarchist

Anarchist написал(а):
nalcheg написал(а):
НО!!!
Centos 4.8 установилась и работает без подобных сообщений

1. Унести оттуда конфиг (и информацию о версии) ядра.
2. Попробовать mini live install cd.

да я думаю не в конфиге дело - cciss везде модулем подгружен

cat

cat /proc/driver/cciss/cciss0

Цитата:
cciss0: HP Smart Array 6i Controller
Board ID: 0x40910e11
Firmware Version: 2.84

у матери BIOS тоже обновлен до крайнего

Данный сервер уже в

Данный сервер уже в "продакшене" исполняет роль ната, а на следующей неделе надо на аналогичной машине поднять что-нибудь современное(т.е. не Центос 4 с 2.6.9 ядром =)) ) и работающее

как на дисках отключить

как на дисках отключить кэширование?

#hpacucli ctrl slot=0 show config detail

Smart Array 6i in Slot 0 (Embedded)
   Bus Interface: PCI
   Slot: 0
   RAID 6 (ADG) Status: Disabled
   Controller Status: OK
   Chassis Slot: 
   Hardware Revision: Rev B
   Firmware Version: 2.84
   Rebuild Priority: Low
   Expand Priority: Low
   Surface Scan Delay: 15 secs
   Surface Scan Mode: Idle
   Post Prompt Timeout: 0 secs
   Cache Board Present: True
   Cache Status: OK
   Accelerator Ratio: 100% Read / 0% Write
   Total Cache Size: 64 MB
   No-Battery Write Cache: Disabled
   Battery/Capacitor Count: 0
   SATA NCQ Supported: False

   Array: A
      Interface Type: Parallel SCSI
      Unused Space: 0 MB
      Status: OK



      Logical Drive: 1
         Size: 33.9 GB
         Fault Tolerance: RAID 1
         Heads: 255
         Sectors Per Track: 32
         Cylinders: 8722
         Strip Size: 128 KB
         Status: OK
         Array Accelerator: Enabled
         Unique Identifier: 600508B1001FFFFFA0023DEB48A60003
         Disk Name: /dev/cciss/c0d0
         Mount Points: /boot 99 MB
         OS Status: LOCKED
         Logical Drive Label: A0023DEB48A6
         Mirror Group 0:
            physicaldrive 1:0   (port 1:id 0 , Parallel SCSI, 36.4 GB, OK)
         Mirror Group 1:
            physicaldrive 1:1   (port 1:id 1 , Parallel SCSI, 36.4 GB, OK)

      physicaldrive 1:0
         SCSI Bus: 1
         SCSI ID: 0
         Status: OK
         Drive Type: Data Drive
         Interface Type: Parallel SCSI
         Transfer Mode: Ultra Wide
         Size: 36.4 GB
         Transfer Speed: 40 MB/Sec
         Rotational Speed: 10000
         Firmware Revision: S27N
         Serial Number:         E3W62SYC
         Model: IBM     IC35L036UCDY10-0

      physicaldrive 1:1
         SCSI Bus: 1
         SCSI ID: 1
         Status: OK
         Drive Type: Data Drive
         Interface Type: Parallel SCSI
         Transfer Mode: Ultra Wide
         Size: 36.4 GB
         Transfer Speed: 40 MB/Sec
         Rotational Speed: 10000
         Firmware Revision: S27N
         Serial Number:         E3W653UC
         Model: IBM     IC35L036UCDY10-0

отключить кэш

как отключить кеш записи на этих дисках?
и что значит?
Accelerator Ratio: 100% Read / 0% Write
в выводе
hpacucli ctrl slot=0 show config detail

с выдернутой батарейкой

с выдернутой батарейкой работает ? :)

Compute:
Bosch M2.8.1 -> custom Bosch M2.8.3 clone from Russia.
Speed about 260 km,Ram 2 pers.,HDD - 70 kg,210 FLOPS ;)

на неделе на аналогичном

на неделе на аналогичном сервере попробую без батарейки

Цитата:
Accelerator Ratio: 100% Read / 0% Write

я так понимаю контроллер кэширует только на чтение - почему - я х.з.

аналогичный сервер, только винты HP, на неделе буду пробовать на нем ядро из 3-ей ветки

Цитата:
[root@gw ~]# cat /proc/version
Linux version 2.6.9-89.35.1.ELsmp (mockbuild@builder10.centos.org) (gcc version 3.4.6 20060404 (Red Hat 3.4.6-11)) #1 SMP Tue Jan 18 18:19:22 EST 2011
[root@gw ~]# hpacucli ctrl slot=0 show config detail

Smart Array 6i in Slot 0 (Embedded)
Bus Interface: PCI
Slot: 0
RAID 6 (ADG) Status: Disabled
Controller Status: OK
Chassis Slot:
Hardware Revision: Rev B
Firmware Version: 2.84
Rebuild Priority: Low
Expand Priority: Low
Surface Scan Delay: 15 secs
Post Prompt Timeout: 0 secs
Cache Board Present: True
Cache Status: OK
Accelerator Ratio: 100% Read / 0% Write
Total Cache Size: 64 MB
No-Battery Write Cache: Disabled
Battery/Capacitor Count: 0
SATA NCQ Supported: False

Array: A
Interface Type: Parallel SCSI
Unused Space: 0 MB
Status: OK

Logical Drive: 1
Size: 67.8 GB
Fault Tolerance: RAID 1
Heads: 255
Sectors Per Track: 32
Cylinders: 17433
Stripe Size: 128 KB
Status: OK
Array Accelerator: Enabled
Unique Identifier: 600508B1001FFFFFA00A5C48459C0000
Disk Name: /dev/cciss/c0d0
Mount Points: /boot 101 MB
OS Status: LOCKED
Logical Drive Label: A00A5C48459C
Mirror Group 0:
physicaldrive 1:0 (port 1:id 0 , Parallel SCSI, 72.8 GB, OK)
Mirror Group 1:
physicaldrive 1:1 (port 1:id 1 , Parallel SCSI, 72.8 GB, OK)

physicaldrive 1:0
SCSI Bus: 1
SCSI ID: 0
Status: OK
Drive Type: Data Drive
Interface Type: Parallel SCSI
Transfer Mode: Ultra 320 Wide
Size: 72.8 GB
Transfer Speed: 320 MB/Sec
Rotational Speed: 15000
Firmware Revision: HPB3
Serial Number: 3KP0HCET000075443R5S
Model: COMPAQ BF07288285

physicaldrive 1:1
SCSI Bus: 1
SCSI ID: 1
Status: OK
Drive Type: Data Drive
Interface Type: Parallel SCSI
Transfer Mode: Ultra 320 Wide
Size: 72.8 GB
Transfer Speed: 320 MB/Sec
Rotational Speed: 15000
Firmware Revision: HPB5
Serial Number: J2WXBNHC
Model: COMPAQ BF07284961

nalcheg написал(а): на неделе

nalcheg написал(а):
на неделе на аналогичном сервере попробую без батарейки

Ужас:)

Цитата:
Цитата:
Accelerator Ratio: 100% Read / 0% Write

я так понимаю контроллер кэширует только на чтение - почему - я х.з.

Как это х.з.?)
Вообще

# hpacucli help

- что ты контроллеру скажешь, то он и будет делать

у меня сервак без модуля

у меня сервак без модуля памяти и батарейки для SCSI контроллера smart array 6i =((
на днях подвезут модуль с батарейкой - отпишусь если заработает ядро 3 ветки

Настройки просмотра комментариев

Выберите нужный метод показа комментариев и нажмите "Сохранить установки".