[SOLVED] LSI 9240-8i: Failed to init firmware

Доброго времени суток.
У меня есть raid-контроллер LSI 9240-8i, он у меня исправно работал на моей системе (gentoo естественно) на старой материнской плате (Asus M4A78T-E), но с материнкой возникли проблемы (перестали работать оба pci-e 8x слота, причину так не выяснил). Взамен старой приобрёл другую материнскую плату (MSI X99A SLI), и вот с ней проблемы. Та же система (без пересборки) не подхватила этот контроллер, в dmesg были следующие сообщения:

$dmesg |grep mega
[    8.406906] megasas: 06.811.02.00-rc1
[    8.407083] megaraid_sas 0000:03:00.0: FW now in Ready state
[    8.407102] megaraid_sas 0000:03:00.0: firmware supports msix        : (0)
[    8.407103] megaraid_sas 0000:03:00.0: current msix/online cpus      : (1/12)
[    8.407103] megaraid_sas 0000:03:00.0: RDPQ mode     : (disabled)
[    8.429829] megaraid_sas 0000:03:00.0: Failed to init firmware

Что было в dmesg при исправной работе - не знаю (тогда необходимости не было, я и не смотрел).
Сначала подумал что проблема с контроллером (слоты на предыдущей материнке могли сгореть не сами по себе), попробовал другой контроллер (эта же модель - у меня их несколько про запас лежат) на новой материнке, результат тот же. Попробовал загружаться с разных live-образов - результат тот же (systemresquecd, версию точно не помню, но при старой МП подхватывал диски корректно, а с новой в dmesg те же сообщения).
Контроллер использую в режиме HBA (аппаратный raid не настроен), и при загрузке сам контроллер рапортует об обнаруженных дисках.
Пробовал ковырять настройки bios, но там из пунктов которые касаются pci express только "Above 4G Decoding", принудительное выставление версии pcie для слотов и PCI Latency Timer. Изменения этих параметров ничего не дало - результат тот же (Failed to init firmware).
Пробовал варианты загрузки legacy и через UEFI - результат тот же.
Была попытка установить windows 7. И тут у меня произошёл разрыв шаблона - windows контроллер увидела.
т.е.:
старая МП + gentoo = работает,
новая МП + gentoo = не работает,
новая МП + windows = работает.
В какую сторону копать уже не знаю (нагуглить вышло только обновление bios, но это я уже сделал, версия 3.2, и для этой МП последняя).

/

Покажи версии ядра и lspci -k.
И версию SRCD.

:wq
--
Live free or die

пробовал на таком: $uname

пробовал на таком:

$uname -a
Linux mogwai 4.9.16-gentoo #14 SMP Sat May 20 12:31:52 EEST 2017 x86_64 Intel(R) Core(TM) i7-6800K CPU @ 3.40GHz GenuineIntel GNU/Linux

сейчас такое:

$uname -a
Linux mogwai 4.9.95-gentoo #1 SMP Wed Jun 6 12:09:16 EEST 2018 x86_64 Intel(R) Core(TM) i7-6800K CPU @ 3.40GHz GenuineIntel GNU/Linux

так же было некоторое время 4.12(дальше не помню), и для интереса пробовал собирать 4.14(более точную версию тоже не помню) - но результата это не меняло, каждый раз одно и то же.
lspci -k смогу показать как доберусь домой (по памяти модуль - megaraid_sas, строку устройства дословно не помню).

последней пробовал srcd - 5.0.0.

Шаблон тут в порядке, просто

Шаблон тут в порядке, просто винда ставит драйвера автоматом, а Линукс - нет. Драйвер должен быть в ядре. А зачастую и бинарные блобы к нему... ;)

В дополнение к предыдущему совету: было бы интересно увидеть конфигурацию ядра и lspci -k на обеих системах.

П.С. номер версии ядра не имеет смысла в данном контексте. Нужна сама конфигурация.

П.П.С. Также настоятельно рекомендую поставить самый свежий (размаскированный) sys-kernel/linux-firmware.

хорошо, всю информацию

хорошо, всю информацию предоставлю, но не раньше чем сегодня вечером.

Шаблон тут в порядке, просто винда ставит драйвера автоматом, а Линукс - нет

у меня разрыв шаблона был не в том, что windows поставила драйвера (кстати сама вроде не осилила - пришлось диск использовать, который шел в комплекте).
разрыв был из-за того что после замены мат.платы система не менялась (вообще, ни один конфиг сразу не менял, и ни один пакет или ядро не пересобирал), и то, что система корректно работала на старой мат.плате означает что драйвер работал корректно, а на новой уже нет, из чего я предположил что не работает либо контроллер, либо мат.плата с контроллером. Но из-за того что в windows он заработал, утверждения о нерабочем контроллере или неработающей связке контроллер+мат.плата - оказались неверными. Значит проблема на стыке gentoo+мат.плата, т.к. по отдельности (gentoo+старая мат.плата и windows+новая мат.плата) они работают.
по конфигурации ядра - выложить всю?
если кратко то вот:

$zgrep -i megaraid /proc/config.gz
# CONFIG_MEGARAID_NEWGEN is not set    
# CONFIG_MEGARAID_LEGACY is not set     
CONFIG_MEGARAID_SAS=m

по поводу sys-kernel/linux-firmware, а нужен ли он для моей карточки? у меня в системе стоит, но последний стабильный - 20180103-r1.
я не помню чтобы я его устанавливал когда настраивал контроллер на старом пк. да и в /etc/portage/savedconfig/sys-kernel/linux-firmware-20180103-r1 упоминаний об lsi|mega|sas|scsi я не вижу.

lspci -k на обеих системах предоставить не смогу - старая мат.плата не видит ни одного pcie устройства.

Что ты зациклился на своей

Что ты зациклился на своей плате?! :)
Когда я говорил о драйверах, то имел ввиду не только ее - на мат.плате еще есть много всего, что требует внимания и, возможно, драйверов! Винда только под плату попросила, а процессорные штучки обычно у нее уже интегрированы...

И ты не сказал, поменялся ли процессор, совместима ли система команд, использовались ли расширенные команды процессора на старой плате и пр.

Словом там надо копать и копать... по логам, докам, конфигурациям... Это Генту, детка! :)

процессор и чипсет

процессор и чипсет поменялись: был AMD Phenom II X4(790GX/SB750) стал Intel i7-6800K(X99),
всегда собирал с -march=native
после перехода на новую мат.плату (и после того как убедился что контроллер не работает) - пересобрал мир и ядро уже на новой системе.
но конфиг ядра - да, не допиливал (если не считать графику - перешёл с amd на nvidia, но этой темы это не касается) - все что нужно было завелось и так.
почему-то сейчас Processor family выставлен в Generic-x86-64, хотя для i7 нужно было поставить Core 2/newer Xeon, поменял, пересобераю, проверю поменяет ли это что-то.
И еще, на сколько понял, нужно пройтись по https://wiki.gentoo.org/wiki/Intel , тоже сделаю, спасибо за наводку.

как доберусь до дома также озвучу версию прошивки контроллера, и, если она старая, попробую на выходных обновить.

Ну ты даешь! :)

"Всего лишь" процессор и чипсет!..

Кстати, поскольку подгонка ядра под конкретную архитектуру потенциально дает где-то только пару процентов разницы в производительности, то чтобы было меньше мороки на разном железе, я ставлю Generic и везде в ядре включаю поддержку и АМД, и Интел. Причем все что можно - модулями... И CPU_FLAGS_X86 максимально универсальный... Если же ты оптимизируешь под конкретный процессор, то тебе надо будет во многих местах конфига ядра править...

П.С. Извиняюсь за тон предыдущего поста... просто достали... :(

03:00.0 Serial Attached SCSI

03:00.0 Serial Attached SCSI controller: LSI Logic / Symbios Logic MegaRAID SAS 2008 [Falcon] (rev 03)                                            
        Subsystem: LSI Logic / Symbios Logic MegaRAID SAS 9240-8i                                                                
        Kernel modules: megaraid_sas   

а вот megacli контроллер не видит:

megacli -LDInfo -Lall -Aall
                                     

Exit Code: 0x00

из странного еще заметил - при загрузке контроллер предлагает зайти в web-bios по нажатию ctrl+h, но комбинация не срабатывает (вернее появляется на мгновение надпись и дальше продолжается обычная загрузка, но я помню что заходил в биос контроллера, правда это была старая мат.плата).

У MSI GAMING X99A SLI Plus

У MSI GAMING X99A SLI Plus такое описание:

Цитата:
4 слота 16x PCI-E 3.0 работают в режиме 16-16-0-8 при установке процессора с 40 линиями PCI-E, 8-8-8-0 при установке процессора с 28 линиями PCI-E. PCI-E 3.0 4x недоступен при использовании M.2 PCI-E

https://www.nix.ru/autocatalog/motherboards_msi/MSI-X99A-SLI-Plus-RTL-LGA2011-3-X99-4xPCI-E-GbLAN-SATA-RAID-ATX-8DDR4_207184.html

У ASUS M4A78T-E такое:

Цитата:
2 слота 16x PCI-E 2.0 работают в режиме 16-0 или 8-8

https://www.nix.ru/autocatalog/motherboards_asustek/ASUS-M4A78T-E-RTL-SocketAM3-AMD-790GX-2xPCI-E-plus-SVGA-DVI-HDMI-plus-GbLAN-plus-1394-SATA-RAID-ATX-4DDR3_84097.html

Сколько линий PCI-E у твоего процессора? Попробуй другой PCI-E слот.

Может в этом причина.

Читай официальную документацию.

об этом знаю, у моего

об этом знаю, у моего процессора 28 линий (решил сэкономить),
но у меня из x8/x16 карточек еще только видеокарта, и слотов занято только два - один видеокарта, второй - контроллер.

Проблема решилась обновлением

Проблема решилась обновлением прошивки контроллера (при загрузке он рапортовал о версии 4.30.00 (Build October 26, 2011), а утилита megacli высветила версию 2.130.354-1664, я же обновил до E4.38.04.0 (Build April 07, 2014)/2.130.404-6285), после этого вывод dmesg изменился:

dmesg -T|grep megarad_sas:
[Сб июн  9 12:15:30 2018] megaraid_sas 0000:03:00.0: FW now in Ready state
[Сб июн  9 12:15:30 2018] megaraid_sas 0000:03:00.0: firmware supports msix     : (0)
[Сб июн  9 12:15:30 2018] megaraid_sas 0000:03:00.0: current msix/online cpus   : (1/12)
[Сб июн  9 12:15:30 2018] megaraid_sas 0000:03:00.0: RDPQ mode  : (disabled)
[Сб июн  9 12:15:30 2018] megaraid_sas 0000:03:00.0: controller type    : iMR(0MB)
[Сб июн  9 12:15:30 2018] megaraid_sas 0000:03:00.0: Online Controller Reset(OCR)       : Enabled
[Сб июн  9 12:15:30 2018] megaraid_sas 0000:03:00.0: Secure JBOD support        : No
[Сб июн  9 12:15:30 2018] megaraid_sas 0000:03:00.0: megasas_init_mfi: fw_support_ieee=67108864
[Сб июн  9 12:15:30 2018] megaraid_sas 0000:03:00.0: INIT adapter done
[Сб июн  9 12:15:30 2018] megaraid_sas 0000:03:00.0: Jbod map is not supported megasas_setup_jbod_map 4967
[Сб июн  9 12:15:30 2018] megaraid_sas 0000:03:00.0: pci id             : (0x1000)/(0x0073)/(0x1000)/(0x9240)
[Сб июн  9 12:15:30 2018] megaraid_sas 0000:03:00.0: unevenspan support : no
[Сб июн  9 12:15:30 2018] megaraid_sas 0000:03:00.0: firmware crash dump        : no
[Сб июн  9 12:15:30 2018] megaraid_sas 0000:03:00.0: jbod sync map              : no

и диски стали доступными.

p.s.: неработающий web-bios исправился сбросом в factory reset при помощи megacli (которая из под linux не работала, пришлось делать загрузочную usb-флэшку с freedos).

В общем, спасибо всем, кто откликнулся.

Настройки просмотра комментариев

Выберите нужный метод показа комментариев и нажмите "Сохранить установки".