Ядро 3.14 - зависания при большом кол-ве соединений.

Столкнулся с необычной проблемой. После перехода на ядро 3.14 сервер стал виснуть намертво, если в локалке запускалась хардкорная закачка торрентов.
Т.е. если качать какой-то один торрент - все ок, но если поставить на загрузку несколько торрентов с десятками файлов в каждом - все виснет насмерть в течение 2-10 минут.
Складывается ощущение, что критичным является количество соединений.

Никаких записей в логах нет. Вот как выглядит зависание примерно в 23:40 (такое же время осталось на часах в X):
May 2 23:34:09 crits hostapd: wifiHW: STA **** WPA: group key handshake completed (RSN)
May 2 23:40:01 crits cron[11733]: (root) CMD (test -x /usr/sbin/run-crons && /usr/sbin/run-crons)
May 3 07:52:43 crits syslog-ng[3704]: syslog-ng starting up; version='3.4.7'

Возможно дело и не в ядре, а в новых модулях ядра для iptables. Хотя я и не использую ничего такого необычного - conntrack, recent, match.
Возможно, что это проявлялось и на 3.13 последних версий.

Кто-нибудь сталкивался с подобным?

Я так думаю, что "админу"

Я так думаю, что "админу" сети надо рубить руки, если у него в локалке способна работать закачка торрентов.

Пользуясь моментом, хочу передать привет друзьям, которые также пользуются "Моментом"

Тык сам "админ" и качает.

Тык сам "админ" и качает.

тыц сам себе пусть рубит. ну

тыц сам себе пусть рубит. ну либо эвтаназия поможет

Пользуясь моментом, хочу передать привет друзьям, которые также пользуются "Моментом"

Молодец, хоть ляпнул глупость

Молодец, хоть ляпнул глупость не в тему и показал себя конченным му..ээ.. человеком с альтернативной этической системой - но все равно не сдаешься. Упорство - путь к победе!

есть ли жизнь на марсе?

+1! Сеть должна служить юзерам, а не наоборот. Нуу... за исключением самых злостных юзеров :) А чтобы не слишком губило канал - так QoS же есть!

А нука, расскажи нам про QoS

А нука, расскажи нам про QoS :).
Что, как , куда .....

Compute:
Bosch M2.8.1 -> custom Bosch M2.8.3 clone from Russia.
Speed about 260 km,Ram 2 pers.,HDD - 70 kg,210 FLOPS ;)

Имелось в виду, что торренты

Имелось в виду, что торренты надо на самом сервере качать, а грузить всё с локалки - лишняя нагрузка на сервер/компы в локалке.

Локальный оверлей растёт

Посмотреть на ulimit?

Посмотреть на ulimit? Количество открытых файликов там, и вобще...

# ulimit -a core file size

# ulimit -a
core file size (blocks, -c) 0
data seg size (kbytes, -d) unlimited
scheduling priority (-e) 0
file size (blocks, -f) unlimited
pending signals (-i) 257094
max locked memory (kbytes, -l) 64
max memory size (kbytes, -m) unlimited
open files (-n) 35000
pipe size (512 bytes, -p) 8
POSIX message queues (bytes, -q) 819200
real-time priority (-r) 0
stack size (kbytes, -s) 8192
cpu time (seconds, -t) unlimited
max user processes (-u) 257094
virtual memory (kbytes, -v) unlimited
file locks (-x) unlimited

Собственно, это дефолтные настройки за вычетом кол-ва открытых файлов - оно у меня 35к.

1. Тут ulimit ot root'a, a

1. Тут ulimit ot root'a, a торренты тоже под root'ом? :)
2. Может не коннекты убивают, а 35К открытых файлов?!.. не смотрел (sar, iostat etc) как подсистема I/O работает (размер очереди и пр.) до и во время зависания?

1. Торренты качает ноут в

1. Торренты качает ноут в локалке. Сервер для него лишь раздает интернет: iptables -t nat -A POSTROUTING -o ${PPP} -j MASQUERADE

2. Зависает - в смысле совсем. Наглухо. До ресета. Так что, в процессе я посмотреть ничего не могу. А до - обращения к диску минимальны.

interrupt's per seconds

interrupt's per seconds

Compute:
Bosch M2.8.1 -> custom Bosch M2.8.3 clone from Russia.
Speed about 260 km,Ram 2 pers.,HDD - 70 kg,210 FLOPS ;)

смотреть wa и si в top'е.

смотреть wa и si в top'е.

Открой несколько консольных

Открой несколько консольных сессий (например, в Х-ах это могут быть просто консольные окна, если Х-ов нет, то через clusterssh или terminator и т.п.) одновременно в отдельных окнах и там запусти, то что хочешь мониторить (sensors, acpi*, vmstat, iostat, sar в разных режимах, чтобы видеть состояние проца, памяти, дисков, разных очередей, температур, напряжений и пр.) с частым обновлением (например посекундно). Кстати, команды watch и тее тоже могут пригодиться... полезно все в логи писать - потом легче разбираться.
Когда зависнет, увидишь что было до зависания, а если зависание все же не совсем "глухое", то и что в нем происходит.

А если вывести консоль?

А если вывести консоль? Желательно не по сети т.к сеть первой повалится.

Локальный оверлей растёт

Совсем даже необязательно...

Совсем даже необязательно... часто сеть есть, когда Х'ы виснут.
Хотя в этом конкретном случае скорее всего вы правы... но тогда количество видимой информации резко уменьшается, возможно потребуется несколько итераций (меняя выдаваемую инфу), чтобы "поймать момент".

Зачем же иксы? Имеется в виду

Зачем же иксы?
Имеется в виду какая-нибудь аппаратная консоль ( в лучшем случае serial) Возможно увидите выхлоп panic или oops. Иногда можно vgacon или fbcon (потребуется видеоадаптер), если краш не задевает этот самый адаптер, в целом, довольно часто помогает.

Локальный оверлей растёт

А нашлось что-нибудь в

А нашлось что-нибудь в итоге?
Вчера пересобрал ядро с 3.12 до 3.14 и за сутки 4 зависания, в одном из них nvidia на nouveau заменил, а толку ноль.
Коннектов вроде слишком много не должно быть

Нашлась проблема с xl2tpd,

Нашлась проблема с xl2tpd, когда от него отказался - все стало работать без зависаний.

подолью масла в огонь

была такая проблемка, правда давно-давно, на дремучем ядре. Может и не связано но симптомы 1 в 1: вис наглухо и никаких просьб о помощи в логах. Порой даже до initrd загрузка не доходила (тогда был еще initrd :) ). Полечилось сборкой ядра без поддержки HPET.

В добавок внесу еще и свои 5 копеек: проблемы в этом ядре были мной замечены и в работе сети - в частности GRE. Конфиг выкладывать не буду - он тривиален и на 3.12 ядре работает будь здоров. На 14 же ядре в туннелях выглядит все так, как будто приходит запрос, ответ на пакет уходит но до удаленного хоста не доходит -типа теряется в "сети", на интерфейсе при этом запрос (глядел tcpdump) приходит от ip 0.0.0.0 а ответ не отправляется вовсе (ну по сути с таким источником и не должен :) ) Будьте бдительны :)

Нубский вопрос - а как

Нубский вопрос - а как отрубить поддержку HPET если у меня HPET_TIMER в поиске есть, а в менюхе (из genkernel) - нет?

А виснет намертво или kernel

А виснет намертво или kernel panic дает??
Последнее часто содержит много полезной информации для поиска причины падения.
Если же виснет намертво ("замирает"), то это часто проблемы на стыке харда и софта.
Может драйвера пересобрать?! Ядро полностью пересобрать через make clean?!
make @module-rebuild ; make @x11-module-rebuild ну и так далее...
Если вернуться к 3.13, что будет?? (хотя я предпочитаю стабильные ветки ядра)

В моём случае "намертво",

В моём случае "намертво", модули ребилдились, в 3.12 никаких проблем не наблюдается (в котором сейчас сижу), модули пересобирал.

Исшо расс: Автор slepnoga,

Исшо расс:

Автор slepnoga, дата создания 4 мая, 2014 - 09:34.

interrupt's per seconds

Покажи
/proc/interrupts
ethtool -S интерфейс
dmesg |grep clocksource

Compute:
Bosch M2.8.1 -> custom Bosch M2.8.3 clone from Russia.
Speed about 260 km,Ram 2 pers.,HDD - 70 kg,210 FLOPS ;)

а можно раскрыть, что это

а можно раскрыть, что это может дать? У меня примерно схожая проблема (на уровне "виснет молча напрочь 3.14") Сейчас сижу на 3.12, ес-но не могу показать показатели из 3.14
И "исшо" про что было?

Настройки просмотра комментариев

Выберите нужный метод показа комментариев и нажмите "Сохранить установки".