Зависание маршрутизатора при передаче транзитного трафика.

Linux 2.6.34-gentoo-r1 #5 SMP Wed Sep 8 08:21:57 MSD 2010 i686 Pentium III (Coppermine) GenuineIntel GNU/Linux
Старенький 2xPIII на supermicro (serverworks), работает преимущественно в качестве маршрутизатора - если необходимо, приведу более точное описание железа, но мне кажется что это просто не к чему.
Сабж: Пару дней назад собрал свежее ядро (система при обновлении была не довольна версией эксплуатируемого - 2.6.23). Проблема обнаружилась не сразу, к сожалению в это же время эксперементировал с профилями системы (пробовал SELinux и Hardened профили, правда потом вернулся к обычному server. Система была полностью пересобрана). Нареканий на работу нет, за исключением когда из одной подсети (192.168.2.0/24 - eth1) пытаешься тянуть с виндовс шары из соседней подсетки (192.168.1.0/24 - eth2) - сервер виснет наглухо. Натирование и все остальные протоколы как по маршрутам Lan1-wan, Lan2-wan, так и по Lan1-Lan2 нареканий не вызывают. Ни в messages, ни в dmesg'e ничего путного найти не удалось. Аппаратная конфигурация сервера не менялась, но для полноты приведу конфигурацию сетевых интерфейсов:
eth0 - Ethernet controller: Intel Corporation 82557/8/9/0/1 Ethernet Pro 100 (rev 08) (in kernel e100)
eth1 - Ethernet controller: Realtek Semiconductor Co., Ltd. RTL-8139/8139C/8139C+ (rev 10) (in kernel 8139too)
eth2 - Ethernet controller: Intel Corporation 82545EM Gigabit Ethernet Controller (Copper) (rev 01) (in kernel e1000)

Может кто посоветует в какую сторону копать? Ядро конфигурил скопировав старый конфиг и пройдясь по всем опциям. Из именений могу только вспомнить переход на родной для s3 virge fb и подгрузку firmware (собрано в ядро) для e100. Ни то ни другое вроде как на транзит влиять не должно, тем более какого то отдельного протокола. Если нужна какая то дополнительная информация по железу/софту - допишу, не проблема, просто не хочется заранее "толстить" пост.

Телепаты в отпуске, в

Телепаты в отпуске, в бессрочном

П.С

работает преимущественно в качестве маршрутизатора 

Задолбали уже люди с "маршрутизаторами", которые таковыми не являются.

Compute:
Bosch M2.8.1 -> custom Bosch M2.8.3 clone from Russia.
Speed about 260 km,Ram 2 pers.,HDD - 70 kg,210 FLOPS ;)

Мда. Телепаты точно в

Мда. Телепаты точно в отпуске. Что значит "тянуть с виндовс шары из соседней подсетки"?

slepnoga
А что по-вашему является маршрутизатором? Cisco catalyst 3550 - маршрутизатор?

А что по-вашему является

 А что по-вашему является маршрутизатором? Cisco catalyst 3550 - маршрутизатор?

В не зависомости от железа/ОС - или
1) отсутствие дефолтного гетвея как класса
2) наличие динамической маршрутизации
3) как минимум - наличие роута на не локальныую сеть ( т.е >1 хопа и не через дефолтный гетвей)

Compute:
Bosch M2.8.1 -> custom Bosch M2.8.3 clone from Russia.
Speed about 260 km,Ram 2 pers.,HDD - 70 kg,210 FLOPS ;)

Это, конечно, оффтоп... Но я

Это, конечно, оффтоп... Но я не буду злоупотреблять.
Первый пункт вызывает сомнения. Что же выходит - если есть default, то теряется право именоваться маршрутизатором?
Второй пункт также вызывает сомнения. Если таблица статическая, то опять же теряется упомянутое право?
Третий пункт то же самое. Если нет вообще "не локальной" сети?

А если нет default, есть динамика, но нет "не локальной" сети?

Безусловно, каждый имеет право именовать программно-аппаратные комплексы как угодно. Но ваша точка зрения не совсем корректна, IMHO. Выходит так, что маршрутизатор - это нечто с full view BGP (поскольку не должно быть default) и несколькими внешними пирами (поскольку если внешний пир всего один, то зачем тогда full view)?
Тогда, если провести аналогию (приблизительную), то военными является только люди в чине не ниже генерал-майора, а все остальные - нет?

-1

Извиняюсь и правда криво

Извиняюсь и правда криво описал. Есть две локальных сети, 192.168.1.0/24 и 192.168.2.0/24
Есть компьютер под управлением генты с тремя сетевыми интерфейсами. eth0 - wan (кабель от провайдера); eth1 - 192.168.2.1; eth2 - 192.168.1.1
Эти сети состоят из машин с windows (windows xp - преимущественно, есть одна windows vista).
Соответственно, он "выводит" эти две сети в интернет и передает пакеты между сетями. После выше названных действий при большом потоке данных из одной сети в другую (не в случае любая локальная сеть - интернет. там все нормально), в частности по протоколу smb, генту-бокс стал зависать. Т. е. наример, я с воркстейшена с адресом 192.168.2.10 захожу через проводник на \\192.168.1.5\disk и начинаю копировать с него на локальную машину. Проходит от 300 до 10 мегабайт до зависания линукс сервера. Вообще есть подозрение что smb тут не во главе проблемы. Просто кроме него по другим протоколам не шло большого объема данных. Попробую поднять фтп и посмотреть что это даст. Смотрел процессы до самого зависания - система практически не нагружена. В правилах фаерволла политики по умолчанию ACCEPT и два правила SNAT для каждой сети соответственно. Версию о выходе из строя железа конечно нельзя отмести на 100%, но очень сомнительно это выглядит. Сейчас пробую вернуться на старое ядро, может что то и проясниться.
Надеюсь так будет яснее, что я имел ввиду.

В подобных ситуациях железо

В подобных ситуациях железо виновато чаще всего.
Микросхема при интенсивной работе сбоит.

emerge Your world
Gentoogle

GoodWin написал(а): В

GoodWin написал(а):
В подобных ситуациях железо виновато чаще всего.
Микросхема при интенсивной работе сбоит.

+1
Для начала - выкинь Realtek или хотя бы поставь его на WAN.
Если хочешь разобраться, начни с логирования

ethtool -S ethX

а также см. системные логи, top/htop etc.
Насчет "точного описания железа" ты не прав! Многое зависит от памяти, шины и т.д.
Кстати, для "маршрутизатора" надо и ядро по-другому компилировать.
Кроме того, посмотри, какие еще сервисы там крутятся, может надо убрать чего...
FYI: "маршрутизатор" - не такая простая и легкая задача, как многим кажется... ;)

ПРо системные логи я писал,

Про системные логи я писал, про мониторинг тоже. В случай с железом я не верю потому что не дохнет железо в тот же день когда система полностью обновлялась (точнее дохнет, но на это есть не такая уж большая вероятность).

Таки проблема не решена, но локализована. 100% можно сказать что это ядро, т. к. удалось завести старое, на старом все стабильно. Спасибо всем кто откликнулся! Пошел выяснять чем таким конфиги отличаются...

З. Ы. Чего всем реалтек то не нравится - 7-мь лет работал, а тут его выкидывать...

Потому что с 1Гб Интел'ом они

Потому что с 1Гб Интел'ом они в разных весовых категориях (буфера, очереди и.т.д. и т.п.)! :)
Я же писал - жалко, - поставь на WAN!...
FYI: железо не дохнет, оно просто не тянет...

Ну если на то пошло то и сети

Ну если на то пошло то и сети в разных весовых - к реалтеку тупо wi-fi ap подключена, там и реалтека за глаза, а гигабитный интел как-никак гигабитную же проводную локалку обслуживает.

Угу, весь мир знает, что у

Угу, весь мир знает, что у вас там wi-fi... тем более, что бы пишете LAN-LAN, a не LAN-WLAN... а тут еще wi-fi рутер/АП вступает в игру...
Kстати, почему вы так уверены, что "...там и реалтека за глаза..."? Вы пробовали на старом ядре по максимуму (до 54мб) грузить канал? Сколько реально он вытягивает?
И еще: 34 кернель во многом качественно отличается от вашего 23...

Вопрос: только мне одному

Вопрос: только мне одному кажется, что топик сврнул по пути "Зачем думать. трясти надо " ?
Диагноза на основании каких либо данных поставлено не было ( за отсутствием этих данных) , но с какого то все кинулись что то там менять, даже не спросив версиии
софта, не говоря уже про кол-во дропов на интерфейсе и не выяснив их причины.

Compute:
Bosch M2.8.1 -> custom Bosch M2.8.3 clone from Russia.
Speed about 260 km,Ram 2 pers.,HDD - 70 kg,210 FLOPS ;)

Каков вопрос, таков и ответ!

Каков вопрос, таков и ответ! :)
Если про логи сообщают только, что там ничего интересного, то чего вы хотите?! :D

интересного, то чего вы

интересного, то чего вы хотите?! :D

Я - да так, ничего особенного. Чтобы админы с 10-ей и более практикой не занимались телепатией :), как ньюбы

Compute:
Bosch M2.8.1 -> custom Bosch M2.8.3 clone from Russia.
Speed about 260 km,Ram 2 pers.,HDD - 70 kg,210 FLOPS ;)

slepnoga

slepnoga написал(а):
интересного, то чего вы хотите?! :D

Я - да так, ничего особенного. Чтобы админы с 10-ей и более практикой не занимались телепатией :), как ньюбы

A 10+ лет и дают возможность советовать "не глядя" и как правило, по делу... ;)
Хотя с логами, конечно, лучше...

A 10+ лет и дают возможность

A 10+ лет и дают возможность советовать "не глядя" и как правило, по делу... ;)

И изредка залетать на мега эпик фейл.

П.С /ме имет +25 в одной теме ( не it) - поэтому могу утверждать

Compute:
Bosch M2.8.1 -> custom Bosch M2.8.3 clone from Russia.
Speed about 260 km,Ram 2 pers.,HDD - 70 kg,210 FLOPS ;)

Piranha Прокачайте ~5 Мб

Piranha
Прокачайте ~5 Мб (чтобы не успело повиснуть) с какой-нибудь виндовой машины и посмотрите ifconfig на интерфейсах на предмет дропов, ошибок и пр.
Я так думаю, что проблема с гигабитным eth2, точнее с его драйвером. Как на мой взгляд, надо пройтись по конфигу ядра и повыключать некоторые новомодные параметры (типа APIC, MSI и пр.) и оставить только NAPI, ибо с тем железом, на котором это установлено такие параметры с одной стороны ни к чему, а с другой стороны их наличие может оказаться в итоге причиной проблемы.

типа APICГениальный совет

типа APIC

Гениальный совет для многосокетной машинки :)

 посмотрите ifconfig на интерфейсах на предмет дропов, ошибок и пр

это немного не то, вернее совсем не то

Топикстартеру : ethtool -S в студию до и после прокачки.После будем думать.

Алсо, гигабита вы не получите по определению

Compute:
Bosch M2.8.1 -> custom Bosch M2.8.3 clone from Russia.
Speed about 260 km,Ram 2 pers.,HDD - 70 kg,210 FLOPS ;)

Я понимаю, что вы "не пожете

Я понимаю, что вы "не можете не побурчать". Одного не могу понять, почему вы вместо того, чтобы что-то дельное советовать, только язвите, умничаете да обсуждаете чужие советы. Будьте проще - здесь не ученый совет.

По теме: я посоветовал все это отключить, дабы проверить, будет ли продолжаться подобное поведение системы. Почему я это предложил: ядро новое, железо старое, вряд ли кто-то это ядро сильно тестировал на такой старой платформе. Драйвер e1000 тоже новый. И тоже вряд ли его кто-то тестировал с упомянутым в стартовом посте адаптером. Принимать совет или нет - дело топикстартера

Если есть возможность то

Если есть возможность то снять с видеовыхода скрин кернел паника, если нет возможности - попробовать netconsole loging.
Непонятно с какой сетевухи (чип) на какую идёт передача данных с зависанием.
Верно ли что оба интерфейса реалтек и интел с двух сторон не пингуются после зависания?

Настройки просмотра комментариев

Выберите нужный метод показа комментариев и нажмите "Сохранить установки".