[Решено] Проблемы с аппаратным рейдом при переходе с 4.3 на 4.4

Update: в ядре 4.5.0-gentoo-r1 баг исчез так же загадочно, как и появился. Информации об этом в багтрекере я не нашел.

На 4.3 и ранее все работало.
На 4.4.(0,1,2) почему-то fchk и localmount стартуют раньше, чем ядро добавляет диски рейда в /dev, конечно же не видят дисков и дальше по цепочке обваливаются все сервисы.

Обычные диски добавляются где-то на 4-5-й секунде загрузки, localmount стартует на 8-й., видимо после этого события полагая, что все в порядке:

[    7.946619] mpt2sas_cm0: host_add: handle(0x0001), sas_addr(0x500062b000296b28), phys(8)

А вот на какой секунде они реально добавляются:

[   13.856024] sd 8:1:0:0: Attached scsi generic sg2 type 0
[   13.856028] sd 8:1:0:0: [sdc] 1951170560 512-byte logical blocks: (998 GB/930 GiB)
[   13.856030] sd 8:1:0:0: [sdc] 4096-byte physical blocks
[   13.856305] sd 8:1:0:0: [sdc] Write Protect is off
[   13.856307] sd 8:1:0:0: [sdc] Mode Sense: 03 00 00 08
[   13.856366] scsi 8:0:0:0: Attached scsi generic sg3 type 0
[   13.856379] sd 8:1:0:0: [sdc] No Caching mode page found
[   13.856381] sd 8:1:0:0: [sdc] Assuming drive cache: write through
[   13.856691] scsi 8:0:1:0: Attached scsi generic sg4 type 0
[   13.856900] scsi 8:0:2:0: Attached scsi generic sg5 type 0
[   13.871018]  sdc: sdc1 sdc2 sdc3

Контроллер: Serial Attached SCSI controller: LSI Logic / Symbios Logic SAS2004 PCI-Express Fusion-MPT SAS-2 [Spitfire] (rev 03)

Временно решил проблему добавив sleep 10 в /etc/init.d/localmount -> start() и убрав эти диски из проверки fsck, но это костыль, а хотелось бы узнать причины подобного безобразия.

Добавь scandelay=XХ в

Добавь scandelay=15 в стартовую строку ядра.

BTW: покажи

grep rc_parallel /etc/rc.conf

(я полагаю, что у тебя OpenRC).

Обновлял сегодня ядро до

Обновлял сегодня ядро до 4.4.3 и добавил scandelay. Не помогло - эта пауза проходит до инициализации mtp2sas:

[    3.755281] hid-generic 0003:051D:0002.0001: hiddev0,hidraw2: USB HID v1.10 Device [American Power Conversion Smart-UPS 1000 FW:652.19.I USB FW:11.03] on usb-0000:0c:00.0-2/input0
[   18.833049] mpt2sas_cm0: port enable: SUCCESS
[   18.833453] scsi 8:1:0:0: Direct-Access     LSI      Logical Volume   3000 PQ: 0 ANSI: 6
....
[   18.879916]  sdc: sdc1 sdc2 sdc3
[   18.880418] sd 8:1:0:0: [sdc] Attached SCSI disk

Насчет rc:

# grep rc_parallel /etc/rc.conf
#rc_parallel="NO"
# this feature. This feature is automatically disabled if rc_parallel is

Я еще раз хочу отметить, что проблемы появились только с ядра 4.4. У меня до сих пор есть ядро 4.3, где этой проблемы нет, зато есть другая - при завершении работы оно на remount виснет до ресета.

.

Hellsy22 написал(а):
У меня до сих пор есть ядро 4.3, где этой проблемы нет, зато есть другая - при завершении работы оно на remount виснет до ресета.

Драйвер контроллера модулем?
Таблица разбиения, файловые системы, опции монтирования?
И, коли проблема внезапно наблюдается на 4.3, наверное в отдельную тему. ☺

:wq
--
Live free or die

Да, модулем. /dev/sdc1

Да, модулем.

/dev/sdc1       /home     ext4      noatime,commit=60,nofail      0 0
/dev/sdc2       /db       ext4      noatime,commit=60,nofail      0 0
/dev/sdc3       /sdc3     btrfs     compress,noauto               0 0

Но это несущественно - я добавил в localmount команду ls /dev/sd* до и после паузы. До паузы /dev/sdc1-3 отсутствуют.

Как решил?

Как решил?

Настройки просмотра комментариев

Выберите нужный метод показа комментариев и нажмите "Сохранить установки".