Не совсем понятная ошибка в ядре

В последнее время стал происходить какой-то непонятный баг. Система при любых нагрузках и любом аптайме может внезапно встать колом. Т.к. другого компа нету то проверить состояние на момент бага не возможно. Однако по индикаторам жёсткого диска и сетевой карты видно что система продолжает работать дальше. Перегрева не наблюдаю, оборудование достаточно новое - примерно полгода. Из старого разве что видеокарта.

Однако после последнего падения(предыдущие ничего не давали) в /var/log/messages появился вот такой "замечательный лог":

jane ~ # grep 'Jun 20 16:37:19 localhost' /var/log/messages 
Jun 20 16:37:19 localhost kernel: [21726.883992] general protection fault: 0000 [#1] SMP 
Jun 20 16:37:19 localhost kernel: [21726.884019] Modules linked in: pppoe pppox ppp_generic slhc w83627ehf hwmon_vid r8169 joydev i2c_i801 coretemp
Jun 20 16:37:19 localhost kernel: [21726.884070] CPU 2 
Jun 20 16:37:19 localhost kernel: [21726.884080] Pid: 681, comm: kswapd0 Not tainted 3.9.6-gentoo #1 System manufacturer System Product Name/P8H61-M PRO
Jun 20 16:37:19 localhost kernel: [21726.884115] RIP: 0010:[<ffffffff812c5127>]  [<ffffffff812c5127>] selinux_inode_free_security+0x47/0x90
Jun 20 16:37:19 localhost kernel: [21726.884164] RSP: 0018:ffff88021638bb78  EFLAGS: 00010283
Jun 20 16:37:19 localhost kernel: [21726.884190] RAX: ffff88007d3cb098 RBX: ffff88007d3cb090 RCX: ffefefefffefefef
Jun 20 16:37:19 localhost kernel: [21726.884223] RDX: ffff8800995d4128 RSI: ffff88009e25bb10 RDI: ffff880215293830
Jun 20 16:37:19 localhost kernel: [21726.884256] RBP: ffff88021638bb98 R08: 2018000000000000 R09: 009e25bb100c0000
Jun 20 16:37:19 localhost kernel: [21726.884289] R10: ff43da6c7962c403 R11: ffffffff81203241 R12: ffff880215293830
Jun 20 16:37:19 localhost kernel: [21726.884322] R13: ffff88009e25ba70 R14: 00000000ffffffff R15: ffff880214b73108
Jun 20 16:37:19 localhost kernel: [21726.884356] FS:  0000000000000000(0000) GS:ffff88021f500000(0000) knlGS:0000000000000000
Jun 20 16:37:19 localhost kernel: [21726.884393] CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
Jun 20 16:37:19 localhost kernel: [21726.884421] CR2: 00007f522c1ad019 CR3: 00000001f3a4b000 CR4: 00000000000407e0
Jun 20 16:37:19 localhost kernel: [21726.884454] DR0: 0000000000000000 DR1: 0000000000000000 DR2: 0000000000000000
Jun 20 16:37:19 localhost kernel: [21726.884487] DR3: 0000000000000000 DR6: 00000000ffff0ff0 DR7: 0000000000000400
Jun 20 16:37:19 localhost kernel: [21726.884521] Process kswapd0 (pid: 681, threadinfo ffff88021638a000, task ffff88021586af80)
Jun 20 16:37:19 localhost kernel: [21726.884559] Stack:
Jun 20 16:37:19 localhost kernel: [21726.884570]  ffff88021638bb88 ffff88009e25ba70 ffff88009e25baf8 ffffffff81a41bc0
Jun 20 16:37:19 localhost kernel: [21726.884611]  ffff88021638bba8 ffffffff812c1661 ffff88021638bbc8 ffffffff8119d9d1
Jun 20 16:37:19 localhost kernel: [21726.884652]  ffff88009e25bb10 ffff88009e25ba70 ffff88021638bbe8 ffffffff8119dac1
Jun 20 16:37:19 localhost kernel: [21726.884694] Call Trace:
Jun 20 16:37:19 localhost kernel: [21726.884710]  [<ffffffff812c1661>] security_inode_free+0x11/0x20
Jun 20 16:37:19 localhost kernel: [21726.884741]  [<ffffffff8119d9d1>] __destroy_inode+0x21/0xf0
Jun 20 16:37:19 localhost kernel: [21726.884768]  [<ffffffff8119dac1>] destroy_inode+0x21/0x60
Jun 20 16:37:19 localhost kernel: [21726.884795]  [<ffffffff8119dc22>] evict+0x122/0x1b0
Jun 20 16:37:19 localhost kernel: [21726.884819]  [<ffffffff8119dce9>] dispose_list+0x39/0x50
Jun 20 16:37:19 localhost kernel: [21726.884846]  [<ffffffff8119eb4d>] prune_icache_sb+0x17d/0x350
Jun 20 16:37:19 localhost kernel: [21726.884876]  [<ffffffff81187b23>] prune_super+0x173/0x1a0
Jun 20 16:37:19 localhost kernel: [21726.884904]  [<ffffffff8114e271>] shrink_slab+0x151/0x2f0
Jun 20 16:37:19 localhost kernel: [21726.884932]  [<ffffffff8114343e>] ? zone_watermark_ok_safe+0x5e/0xe0
Jun 20 16:37:19 localhost kernel: [21726.884964]  [<ffffffff81150e3a>] kswapd+0x53a/0x8e0
Jun 20 16:37:19 localhost kernel: [21726.884989]  [<ffffffff81150900>] ? try_to_free_pages+0x180/0x180
Jun 20 16:37:19 localhost kernel: [21726.885020]  [<ffffffff810b60fb>] kthread+0xbb/0xc0
Jun 20 16:37:19 localhost kernel: [21726.885045]  [<ffffffff810b6040>] ? kthread_create_on_node+0x130/0x130
Jun 20 16:37:19 localhost kernel: [21726.885078]  [<ffffffff818d367c>] ret_from_fork+0x7c/0xb0
Jun 20 16:37:19 localhost kernel: [21726.885105]  [<ffffffff810b6040>] ? kthread_create_on_node+0x130/0x130
Jun 20 16:37:19 localhost kernel: [21726.885135] Code: 8b 5f 38 4c 8b a0 90 00 00 00 49 83 c4 50 4c 89 e7 e8 5e 66 60 00 48 8b 53 08 48 8d 43 08 48 39 d0 74 13 48 8b 4b 10 48 89 4a 08 <48> 89 11 48 89 43 08 48 89 43 10 4c 89 e7 e8 f6 d9 db ff 66 90 
Jun 20 16:37:19 localhost kernel: [21726.885355] RIP  [<ffffffff812c5127>] selinux_inode_free_security+0x47/0x90
Jun 20 16:37:19 localhost kernel: [21726.885392]  RSP <ffff88021638bb78>
Jun 20 16:37:19 localhost kernel: [21726.898429] ---[ end trace ce90d552fb8fd405 ]---

nis написал(а):В последнее

Редкая штука. GPF в процессе ядра. Отладчик к консоли и дебажить. Также версию ядра не помешало бы видеть. А кстати, коли убрать из fstab вообще swap и поработать - как оно будет? ну либо swapoff на раздел подкачки и продолжить работу?

Пользуясь моментом, хочу передать привет друзьям, которые также пользуются "Моментом"

Ага редкая, но как большой

Ага редкая, но как большой взрыв вселенной меткая.
Версия ядра

nis@jane ~ $ uname -a
Linux jane 3.9.6-gentoo #1 SMP Fri Jun 14 23:32:51 OMST 2013 x86_64 Intel(R) Core(TM) i5-2310 CPU @ 2.90GHz GenuineIntel GNU/Linux

По совету в чате от winterheart убрал из ядра опции NSA SELinux, внезапно они оказались включенными(!), хотя я их точно не трогал. Отладчика равно как и последовательного порта нету. Однако эта ошибка стала проявляться у меня начиная с 3.1.х версии ядра. Можно даже /var/log/message поковырять на эту тему.

Мой блог про ембеддед и хенмейд nis-embedded.blogspot.com

1. пишутся ли сенсоры

1. пишутся ли сенсоры (температура[MB,CPU,HDD,etc], питание)?
2. сколько дисков/RAMa?
3. мощность источник[а,ов] питания?
4. uname -a ?

1. отображаются 2. 1 диск, 8

1. отображаются
2. 1 диск, 8 ГБ озу
3. 450 Вт

Мой блог про ембеддед и хенмейд nis-embedded.blogspot.com

понятно, что отображается...

понятно, что отображается... :) - почему не пишете постоянно, если проблема есть?
Случайный просмотр ничего не даст, только если уж все совсем плохо.. надо тенденцию отслеживать.
Кстати, а какие значения по питанию?

Насколько старый ИП? Если есть возможность - посмотрите осциллографом, что творится на шинах питания.

Поддерживаю идею насчет суточного теста памяти, а также короткий и длинный smart-тесты на диск (можете в online).
Ругани на DMA в dmesg нет?

Нету. Хотя есть

Нету. Хотя есть незначительные маты относительно USB. Есть подозрение на БП, т.к он самое старое звено из всего что есть. Попробую по аптайму проследить состояние. Если ничего не произойдёт то буду тестить железо. Осциллографа к сожалению нету.

Мой блог про ембеддед и хенмейд nis-embedded.blogspot.com

таки какое напряжение сенсоры

таки какое напряжение сенсоры показывают?
почему вас пытать надо постоянно?.. сразу на вопросы не отвечаете... могу ведь и вообще не спрашивать... оно мне надо?.. ;)

Ну так сразу надо было

Ну так сразу надо было спрашивать.

Vcore:         +1.02 V  (min =  +0.99 V, max =  +1.26 V)
+12V:         +12.29 V  (min = +11.42 V, max = +13.25 V)
AVCC:          +3.33 V  (min =  +2.98 V, max =  +3.63 V)
+3.3V:         +3.31 V  (min =  +2.98 V, max =  +3.63 V)
+5V:           +5.08 V  (min =  +4.76 V, max =  +5.52 V)
3VSB:          +3.44 V  (min =  +2.98 V, max =  +3.63 V)
Vbat:          +3.39 V  (min =  +2.70 V, max =  +3.63 V)
fan1:         1802 RPM  (min =  200 RPM)
fan2:         1418 RPM  (min =  400 RPM)
fan3:            0 RPM  (min =  300 RPM)  ALARM
fan4:            0 RPM  (min =  200 RPM)  ALARM
fan5:            0 RPM  (min =  200 RPM)  ALARM
MB:            +37.0°C  (high = +38.0°C, hyst = +35.0°C)  ALARM  sensor = thermistor

Мой блог про ембеддед и хенмейд nis-embedded.blogspot.com

2 раза наблюдал подобные

2 раза наблюдал подобные симптомы. Оба раза была виновата память. Memtest на сутки. Либо, если нет возможности - пытаемся поработать некоторое время на одной планке (если их несколько). Есть еще тесты, запускаемые из рабочей системы, но я не смог их приготовить (на 100% битой памяти они по 2-е суток работали, ничего не показав)

Также появился сегодня такой

Также появился сегодня такой вместе с Google Chrome. Как я понял что скорее всего переработанная система памяти позволяет остальному работать. Т.к. при повисании системы которое в этот раз произошло не мнгновенно, а постепенно, не привело к остановке работы Amarok.

Мой блог про ембеддед и хенмейд nis-embedded.blogspot.com

Настройки просмотра комментариев

Выберите нужный метод показа комментариев и нажмите "Сохранить установки".