Не совсем понятная ошибка в ядре
nis 20 июня, 2013 - 14:23
В последнее время стал происходить какой-то непонятный баг. Система при любых нагрузках и любом аптайме может внезапно встать колом. Т.к. другого компа нету то проверить состояние на момент бага не возможно. Однако по индикаторам жёсткого диска и сетевой карты видно что система продолжает работать дальше. Перегрева не наблюдаю, оборудование достаточно новое - примерно полгода. Из старого разве что видеокарта.
Однако после последнего падения(предыдущие ничего не давали) в /var/log/messages появился вот такой "замечательный лог":
jane ~ # grep 'Jun 20 16:37:19 localhost' /var/log/messages Jun 20 16:37:19 localhost kernel: [21726.883992] general protection fault: 0000 [#1] SMP Jun 20 16:37:19 localhost kernel: [21726.884019] Modules linked in: pppoe pppox ppp_generic slhc w83627ehf hwmon_vid r8169 joydev i2c_i801 coretemp Jun 20 16:37:19 localhost kernel: [21726.884070] CPU 2 Jun 20 16:37:19 localhost kernel: [21726.884080] Pid: 681, comm: kswapd0 Not tainted 3.9.6-gentoo #1 System manufacturer System Product Name/P8H61-M PRO Jun 20 16:37:19 localhost kernel: [21726.884115] RIP: 0010:[<ffffffff812c5127>] [<ffffffff812c5127>] selinux_inode_free_security+0x47/0x90 Jun 20 16:37:19 localhost kernel: [21726.884164] RSP: 0018:ffff88021638bb78 EFLAGS: 00010283 Jun 20 16:37:19 localhost kernel: [21726.884190] RAX: ffff88007d3cb098 RBX: ffff88007d3cb090 RCX: ffefefefffefefef Jun 20 16:37:19 localhost kernel: [21726.884223] RDX: ffff8800995d4128 RSI: ffff88009e25bb10 RDI: ffff880215293830 Jun 20 16:37:19 localhost kernel: [21726.884256] RBP: ffff88021638bb98 R08: 2018000000000000 R09: 009e25bb100c0000 Jun 20 16:37:19 localhost kernel: [21726.884289] R10: ff43da6c7962c403 R11: ffffffff81203241 R12: ffff880215293830 Jun 20 16:37:19 localhost kernel: [21726.884322] R13: ffff88009e25ba70 R14: 00000000ffffffff R15: ffff880214b73108 Jun 20 16:37:19 localhost kernel: [21726.884356] FS: 0000000000000000(0000) GS:ffff88021f500000(0000) knlGS:0000000000000000 Jun 20 16:37:19 localhost kernel: [21726.884393] CS: 0010 DS: 0000 ES: 0000 CR0: 0000000080050033 Jun 20 16:37:19 localhost kernel: [21726.884421] CR2: 00007f522c1ad019 CR3: 00000001f3a4b000 CR4: 00000000000407e0 Jun 20 16:37:19 localhost kernel: [21726.884454] DR0: 0000000000000000 DR1: 0000000000000000 DR2: 0000000000000000 Jun 20 16:37:19 localhost kernel: [21726.884487] DR3: 0000000000000000 DR6: 00000000ffff0ff0 DR7: 0000000000000400 Jun 20 16:37:19 localhost kernel: [21726.884521] Process kswapd0 (pid: 681, threadinfo ffff88021638a000, task ffff88021586af80) Jun 20 16:37:19 localhost kernel: [21726.884559] Stack: Jun 20 16:37:19 localhost kernel: [21726.884570] ffff88021638bb88 ffff88009e25ba70 ffff88009e25baf8 ffffffff81a41bc0 Jun 20 16:37:19 localhost kernel: [21726.884611] ffff88021638bba8 ffffffff812c1661 ffff88021638bbc8 ffffffff8119d9d1 Jun 20 16:37:19 localhost kernel: [21726.884652] ffff88009e25bb10 ffff88009e25ba70 ffff88021638bbe8 ffffffff8119dac1 Jun 20 16:37:19 localhost kernel: [21726.884694] Call Trace: Jun 20 16:37:19 localhost kernel: [21726.884710] [<ffffffff812c1661>] security_inode_free+0x11/0x20 Jun 20 16:37:19 localhost kernel: [21726.884741] [<ffffffff8119d9d1>] __destroy_inode+0x21/0xf0 Jun 20 16:37:19 localhost kernel: [21726.884768] [<ffffffff8119dac1>] destroy_inode+0x21/0x60 Jun 20 16:37:19 localhost kernel: [21726.884795] [<ffffffff8119dc22>] evict+0x122/0x1b0 Jun 20 16:37:19 localhost kernel: [21726.884819] [<ffffffff8119dce9>] dispose_list+0x39/0x50 Jun 20 16:37:19 localhost kernel: [21726.884846] [<ffffffff8119eb4d>] prune_icache_sb+0x17d/0x350 Jun 20 16:37:19 localhost kernel: [21726.884876] [<ffffffff81187b23>] prune_super+0x173/0x1a0 Jun 20 16:37:19 localhost kernel: [21726.884904] [<ffffffff8114e271>] shrink_slab+0x151/0x2f0 Jun 20 16:37:19 localhost kernel: [21726.884932] [<ffffffff8114343e>] ? zone_watermark_ok_safe+0x5e/0xe0 Jun 20 16:37:19 localhost kernel: [21726.884964] [<ffffffff81150e3a>] kswapd+0x53a/0x8e0 Jun 20 16:37:19 localhost kernel: [21726.884989] [<ffffffff81150900>] ? try_to_free_pages+0x180/0x180 Jun 20 16:37:19 localhost kernel: [21726.885020] [<ffffffff810b60fb>] kthread+0xbb/0xc0 Jun 20 16:37:19 localhost kernel: [21726.885045] [<ffffffff810b6040>] ? kthread_create_on_node+0x130/0x130 Jun 20 16:37:19 localhost kernel: [21726.885078] [<ffffffff818d367c>] ret_from_fork+0x7c/0xb0 Jun 20 16:37:19 localhost kernel: [21726.885105] [<ffffffff810b6040>] ? kthread_create_on_node+0x130/0x130 Jun 20 16:37:19 localhost kernel: [21726.885135] Code: 8b 5f 38 4c 8b a0 90 00 00 00 49 83 c4 50 4c 89 e7 e8 5e 66 60 00 48 8b 53 08 48 8d 43 08 48 39 d0 74 13 48 8b 4b 10 48 89 4a 08 <48> 89 11 48 89 43 08 48 89 43 10 4c 89 e7 e8 f6 d9 db ff 66 90 Jun 20 16:37:19 localhost kernel: [21726.885355] RIP [<ffffffff812c5127>] selinux_inode_free_security+0x47/0x90 Jun 20 16:37:19 localhost kernel: [21726.885392] RSP <ffff88021638bb78> Jun 20 16:37:19 localhost kernel: [21726.898429] ---[ end trace ce90d552fb8fd405 ]---
»
- Для комментирования войдите или зарегистрируйтесь
nis написал(а):В последнее
Редкая штука. GPF в процессе ядра. Отладчик к консоли и дебажить. Также версию ядра не помешало бы видеть. А кстати, коли убрать из fstab вообще swap и поработать - как оно будет? ну либо swapoff на раздел подкачки и продолжить работу?
Пользуясь моментом, хочу передать привет друзьям, которые также пользуются "Моментом"
Ага редкая, но как большой
Ага редкая, но как большой взрыв вселенной меткая.
Версия ядра
По совету в чате от winterheart убрал из ядра опции NSA SELinux, внезапно они оказались включенными(!), хотя я их точно не трогал. Отладчика равно как и последовательного порта нету. Однако эта ошибка стала проявляться у меня начиная с 3.1.х версии ядра. Можно даже /var/log/message поковырять на эту тему.
Мой блог про ембеддед и хенмейд nis-embedded.blogspot.com
1. пишутся ли сенсоры
1. пишутся ли сенсоры (температура[MB,CPU,HDD,etc], питание)?
2. сколько дисков/RAMa?
3. мощность источник[а,ов] питания?
4. uname -a ?
1. отображаются 2. 1 диск, 8
1. отображаются
2. 1 диск, 8 ГБ озу
3. 450 Вт
Мой блог про ембеддед и хенмейд nis-embedded.blogspot.com
понятно, что отображается...
понятно, что отображается... :) - почему не пишете постоянно, если проблема есть?
Случайный просмотр ничего не даст, только если уж все совсем плохо.. надо тенденцию отслеживать.
Кстати, а какие значения по питанию?
Насколько старый ИП? Если есть возможность - посмотрите осциллографом, что творится на шинах питания.
Поддерживаю идею насчет суточного теста памяти, а также короткий и длинный smart-тесты на диск (можете в online).
Ругани на DMA в dmesg нет?
Нету. Хотя есть
Нету. Хотя есть незначительные маты относительно USB. Есть подозрение на БП, т.к он самое старое звено из всего что есть. Попробую по аптайму проследить состояние. Если ничего не произойдёт то буду тестить железо. Осциллографа к сожалению нету.
Мой блог про ембеддед и хенмейд nis-embedded.blogspot.com
таки какое напряжение сенсоры
таки какое напряжение сенсоры показывают?
почему вас пытать надо постоянно?.. сразу на вопросы не отвечаете... могу ведь и вообще не спрашивать... оно мне надо?.. ;)
Ну так сразу надо было
Ну так сразу надо было спрашивать.
Мой блог про ембеддед и хенмейд nis-embedded.blogspot.com
2 раза наблюдал подобные
2 раза наблюдал подобные симптомы. Оба раза была виновата память. Memtest на сутки. Либо, если нет возможности - пытаемся поработать некоторое время на одной планке (если их несколько). Есть еще тесты, запускаемые из рабочей системы, но я не смог их приготовить (на 100% битой памяти они по 2-е суток работали, ничего не показав)
Также появился сегодня такой
Также появился сегодня такой вместе с Google Chrome. Как я понял что скорее всего переработанная система памяти позволяет остальному работать. Т.к. при повисании системы которое в этот раз произошло не мнгновенно, а постепенно, не привело к остановке работы Amarok.
Мой блог про ембеддед и хенмейд nis-embedded.blogspot.com