Как понять причину зависания ядра? (SOLVED)

Добрый всем день.
Столкнулся с проблемой. На ноуте Asus N73SV в процессе работы Gentoo зависает намертво.
Ни мышь ни клава не работают. SysRq также не работает. Происходит все абсолютно рандомно.
Никакой последовательности действий я уловить не смог. В /var/log/messages на эту тему тишина.
Никаких сообщений об ошибках. Ядро собирал и конфигурировал ручками. Может если кто сталкивался -
подскажете, как хотя бы понять причину зависания, получить хоть какое-нибудь сообщение об ошибке.
Конфиг ядра: http://paste.pocoo.org/show/472857/
Вывод lspci -k: http://paste.pocoo.org/show/472858/
make.conf: http://paste.pocoo.org/show/472862/

Если даже SysRQ не работает -

Если даже SysRQ не работает - то может быть проблема в железе? Перегрев возможен?
Установлены другие ОС на этом же ноуте? Если да как они работают?

Может конечно проблема и в

Может конечно проблема и в железе, только как понять в каком?
Перегрев возможен только теоретически - никаких тяжелых задач в момент зависаний не исполнялось.
Часто ноут виснет просто в режиме простоя или серфинга в интернете.
LmSensors запредельных температур не показывает.
Бывает ситуация когда при закрытой крышке он самопроизвольно вообще выключается.
Других установленных осей нет увы, и проверить как они работают невозможно соответсвенно.

Может попробовать

Может попробовать live(cd|usb)? Можно bartpe или установщик венды проверить.

Локальный оверлей растёт

В каком смысле попробовать?

В каком смысле попробовать? Загрузиться и подождать не зависнет ли?
Попробую конечно например с SysRescueCD. Но что делать если зависнет? А если нет? :)

Если независнет, то искать

Если независнет, то искать различия. Если проблема в железе, то виснуть будет все.

Я бы начал с проверки оперативки

Чтож сегодня загружу с

Чтож сегодня загружу с SysRescueCD и оставлю на ночь работать. Посмотрим, что получится.
Там вроде в состав входит тулза для тестов оперативной памяти.

Подключаешь еще один комп

Подключаешь еще один комп через serial и настраиваешь/запускаешь kgdb :)

И смотришь где упало :)

Working on Gentoo Linux for Asus P535 and Qtopia :-)

Второго компа, а тем более с

Второго компа, а тем более с линуксом увы нет. :(

CONFIG_RAMOOPS

Тогда учимся использовать RAMOOPS :)

Тут об этом подробнее
http://www.opennet.ru/tips/2436_linux_kernel_oops_dump_crash_panic_debug.shtml

Working on Gentoo Linux for Asus P535 and Qtopia :-)

попробуйте по ssh

попробуйте по ssh подключиться как зависнет.
может у него отваливается икс-сервер с отрубом клавиатуры и тачпада.
У меня такое на десктопе было.

Тогда бы работал SysRq если

Тогда бы работал SysRq если бы зависал только X сервер.
Да и пробовал я конечно подключаться по ssh - висит намертво.

Друг, ключ -mno-avx намекает

Друг, ключ -mno-avx намекает что ты используешь gcc из ветки 4,6. К сожалению оно так и будет зависать пока ты не откатишься на gcc 4,5. С 4,6 даже grub-1 не работает.

.

haku написал(а):
оно так и будет зависать пока ты не откатишься на gcc 4,5. С 4,6 даже grub-1 не работает

Не знаю насчёт первого (не юзаю), но GRUB2, свёрстанный GCC-4.6.1, работает абсолютно нормально, как и весь остальной мир (что наводит на мысли и по поводу GRUB1 - "дело было не в боббине..."). Пруфлинком не поделитесь, как всё оно, типо, зависать должно, и граб ломать?

Мы тоже не всего читали Шнитке!.. © В. Вишневский

Пруфлинком не поделитесь, как

Пруфлинком не поделитесь, как всё оно, типо, зависать должно, и граб ломать?

Запросто :)

https://bugs.gentoo.org/show_bug.cgi?id=346809

В свою очередь, с тебя пруфлинк на

GCC-4.6.1, работает абсолютно нормально, как и весь остальной мир

ну или дописывай - у меня ;)

Compute:
Bosch M2.8.1 -> custom Bosch M2.8.3 clone from Russia.
Speed about 260 km,Ram 2 pers.,HDD - 70 kg,210 FLOPS ;)

.

slepnoga написал(а):
как всё оно, типо, зависать должно, и граб ломать?
Запросто

По конкретно заданному вопросу ничего не блеснуло. Уточните, pls, ссыль

Цитата:
дописывай - у меня

Оно, конечно, "у меня", но какбээ и не совсем... На данный момент утверждение относится к 5-ти системам (2*Exherbo+3*Gentoo). А намедни, с 4.шестым (без всяких LFS'ных патчей) и BLFS построил...

Мы тоже не всего читали Шнитке!.. © В. Вишневский

только после доказательства

только после доказательства безглючности 4.6 :)
И таки не звезда, не блистает - https://bugs.gentoo.org/show_bug.cgi?id=360513 ; обрати внимание на дату фикса.

. А намедни, с 4.шестым (без всяких LFS'ных патчей) и BLFS построил...

Мы все должны сделать 3-раза "кю" ?

Compute:
Bosch M2.8.1 -> custom Bosch M2.8.3 clone from Russia.
Speed about 260 km,Ram 2 pers.,HDD - 70 kg,210 FLOPS ;)

.

slepnoga написал(а):
только после доказательства безглючности 4.6

Взрослым мальчикам неплохо бы знать аксиому программирования - кода без ошибок не бывает в принципе (привет "Hello World", просю пардону за тавтологию), так что, и 4.5, и все-все-все остальные свойствами безглючности не обладают. Просто проявляются баги в специфичных условиях, некоторые из которых не выявлялются вплоть до окончания жизненного цикла версии...

Цитата:
Мы все должны сделать 3-раза "кю" ?

Все? Нет, конечно, только вы лично (а писАлось оно к заранее легко предугадываемому вашему вопросу о безглючности)

Мы тоже не всего читали Шнитке!.. © В. Вишневский

Хех, а по существу что то

Хех, а по существу что то будет ?
Вам представлены ссылки на баги, мешающие размаскать gcc:4.6 с одной стороны и ваше утверждение об его безглючности с другой.
Попроили ссылку на баг в груб1 - вы ее получили, закрыта она был за 4 часа до вашего вопроса и в дерево не попала.
Что вы можете сказать по существу вопроса топикстартера и можете ли вы как либо опреовергнуть мнение о том, что вышеозначенную версию гцц юзать не тестерам рановато ?

П.С
То что вы осили поставить генту на N компов не говорит ни о чем, если N , ну скажем не 4-х значная и инсталляция не одновременная ( но и в этом случае говорить можно скорее об организаторских талантах) . То, что вы собрали LFS, лично для меня означает, что у вас очень много свободного времени которое вы не знаете как потратить

Compute:
Bosch M2.8.1 -> custom Bosch M2.8.3 clone from Russia.
Speed about 260 km,Ram 2 pers.,HDD - 70 kg,210 FLOPS ;)

.

slepnoga написал(а):
ваше утверждение об его безглючности

Хех, ну когда же вас отпустит? Автоцитата: "кода без ошибок не бывает в принципе", но ничего страшного, вам же некогда читать/осознавать (в отличие от "у вас очень много свободного времени которое вы не знаете как потратить") - можно ведь и не успеть лишний раз блеснуть пустофлудом

Цитата:
Что вы можете сказать по существу вопроса топикстартера

К ТС мой пост не имеет никакого отношеня и обращён был к другому человеку, но вам же некогда обращать внимание на такие мелочи? Время нынче дорого, а "наш пострел везде поспел!.." Зато вы "по существу вопроса топикстартера" просто блещете... Впрочем, стОит учесть, что это явно "не ваше", и попросту не требовать невозможного (ладно, корректнее сказать - лишнего)...

Цитата:
можете ли вы как либо опреовергнуть мнение о том, что вышеозначенную версию гцц юзать не тестерам рановато?

Ну, вот я, к примеру, ни разу не тестер (и даже не IT'шник) - простой юзер, чётко понимающий пагубность мешанины отстойного софта с актуальным...

Цитата:
То, что вы собрали LFS, лично для меня означает, что у вас очень много свободного времени

То, что это означает лично для вас - мягко говоря, маловажно, для меня же это характеризует полную применимость GCC4.6

Мы тоже не всего читали Шнитке!.. © В. Вишневский

Вы ошибаетесь gcc стоит

Вы ошибаетесь gcc стоит версии 4.4.5 из стабильной ветки, как и почти вся система кроме нескольких приложений.

emerge --info в студию

emerge --info в студию

Compute:
Bosch M2.8.1 -> custom Bosch M2.8.3 clone from Russia.
Speed about 260 km,Ram 2 pers.,HDD - 70 kg,210 FLOPS ;)

emerge --info:

emerge --info: http://paste.pocoo.org/show/473550/
Вечером загрузил ноут с флэшки SysRescueCD. Погонял memtester и оставил на ночь.
Все абсолютно нормально никаких потуг на зависание.
Посидел сравнил руками конфиг их ядра и свой, перекомпилил. Через 5 минут завис и на новой версии.
Сейчас у меня сильное подозрение на nvidia-drivers поскольку стояла размаскированная версия 275.09.07.
Я сейчас его вообще выгрузил из памяти (у меня Optimus поэтому десктоп работает на встроенном Intel,
а Nvidia пользовал для игр через Bumblebee). Пока час полет нормальный.

Два часа - пока ни разу не висли. Загрузил nvdida.ko стабильной версии. Ждем дальше.

Оффтопик что бы можно было

Оффтопик
что бы можно было юзать интел для десктопа и нвидию для игрушек нужен optimus или достаточно двух видях inetl и nvidia?

Optimus - это достаточно

Optimus - это достаточно новая геморройная технология применяемая в ноутбуках.
При этом на монитор выводится изображение только со встроенной видеокарты,
а для задействования дискретной приходится плясать с бубном.

Меня интересует совместное

Меня интересует совместное использование двух видюх. Я понимаю, что два отдельных Икс сервера, каждый для своей видяхи не проблема, но отдельными будут так же и устройства ввода, а иметь отдельне клваиатуру и мышь для работы и игр - не удобно.

Мне кажется при двух

Мне кажется при двух видеокартах их использование возможно через VirtualGL (на котором основан bumblebee).
Наличие или отсутствие Optimus роли не играет, на мой взгляд.

Хорошо, это, то что я хотел

Хорошо, это, то что я хотел услышать.

Загрузил стабильный nvidia.ko

Загрузил стабильный nvidia.ko, поиграл, прошло 10 минут простоя - завис. Припоминаю, что во время игры - ничего никогда не висло.
Такое впечатление, что спустя какое то время после включения при простое дискретная видеокарта выключается
генерируя какое то событие, которое ядро никак не может обработать.

З.Ы. Прописал nvidia в /etc/modprobe.d/blacklist.conf чтоб он никогда не грузился автоматически. Посмотрим на эффект.

Поставь скринсейвер ))

Поставь скринсейвер )) (шутка)
А если серьезно, то если вырубишь иксы и оставишь то зависнит ?
А если дрова с nvidia на nouveau поменять тоже виснит ?

Может конечно пока и слишком

Может конечно пока и слишком рано говорить, но экспериментально выведено:
Дело явно в драйвере Nvidia, точнее в его совместной работе с драйвером Intel
в режиме Optimus. В случае предварительной загрузки драйвера перед исполнением
какого-либо приложения и выгрузки его сразу после окончания - зависаний не наблюдается.
Мое предположение, что это какое то ACPI событие (например об отключении) приходит от
дискретной видеокарты, которое ядро интерпретирует неверно.

Solved наверно.

Настройки просмотра комментариев

Выберите нужный метод показа комментариев и нажмите "Сохранить установки".