Отваливается сеть

В общем, дела такие. Имеется роутер-точка-доступа под гентой. Все бы хорошо, если бы все не было так плохо. На роутере есть куча фильмов, и иногда их надо скидывать на удаленные фтп. Когда пытаюсь при помощи lftp заливать фильмы через ethernet, то вылазит вот такое:


NETDEV WATCHDOG: eth0 (via-rhine): transmit timed out
eth0: Transmit timed out, status 0000, PHY status 786d, resetting...
------------[ cut here ]------------
WARNING: at net/sched/sch_generic.c:221 ()
Modules linked in: ppp_deflate zlib_deflate bsd_comp ppp_async crc_ccitt ppp_generic slhc iptable_filter ipt_MASQUERADE ipt_REDIRECT iptable_nat nf_nat nf_conntrack_ipv4 nf_conntrack analog gameport fan via_agp rt61pci rt2x00pci rt2x00lib agpgart eeprom_93cx6 thermal processor thermal_sys button nfs lockd sunrpc jfs dm_snapshot dm_mirror dm_log sbp2 ohci1394 ieee1394 sl811_hcd usbhid ohci_hcd uhci_hcd usb_storage ehci_hcd usbcore scsi_transport_fc sg sd_mod scsi_wait_scan libata dock
Pid: 3, comm: ksoftirqd/0 Not tainted 2.6.27-rc3 #2
[<c0116740>] [<c0110033>] [<c0150984>] [<c0117065>] [<c032c092>] [<c0137bf8>] [<c0137bba>] [<c0137588>] [<c032baa0>] [<c037ae2e>] [<c037aeff>] [<c037af1a>] [<c037ac4c>] [<c037ae2e>] [<c011c867>] [<c0119c4e>] [<c0119c19>] [<c0104b42>] [<c0119a29>] [<c0119a5d>] [<c012348c>] [<c0123456>] [<c0103843>] =======================
---[ end trace 1debfe09abfd9afd ]---

Повторяется до тех пор, пока сервак не уходит в полный даун и вообще перестает отвечать на запросы.

$ emerge --info
Portage 2.1.4.4 (default/linux/x86/2008.0, gcc-4.1.2, glibc-2.6.1-r0, 2.6.27-rc3 i686)
=================================================================
System uname: 2.6.27-rc3 i686 AMD Athlon(tm) XP 2000+
Timestamp of tree: Wed, 13 Aug 2008 19:00:01 +0000
app-shells/bash: 3.2_p33
dev-lang/python: 2.4.4-r6, 2.5.2-r6
dev-python/pycrypto: 2.0.1-r6
sys-apps/baselayout: 1.12.11.1
sys-apps/sandbox: 1.2.18.1-r2
sys-devel/autoconf: 2.61-r2
sys-devel/automake: 1.10.1
sys-devel/binutils: 2.18-r3
sys-devel/gcc-config: 1.4.0-r4
sys-devel/libtool: 1.5.26
virtual/os-headers: 2.6.23-r3
ACCEPT_KEYWORDS="x86"
CBUILD="i686-pc-linux-gnu"
CFLAGS="-march=i686 -O2 -pipe"
CHOST="i686-pc-linux-gnu"
CONFIG_PROTECT="/etc"
CONFIG_PROTECT_MASK="/etc/env.d /etc/gconf /etc/php/apache2-php5/ext-active/ /etc/php/cgi-php5/ext-active/ /etc/php/cli-php5/ext-active/ /etc/revdep-rebuild /etc/terminfo /etc/udev/rules.d"
CXXFLAGS="-march=i686 -O2 -pipe"
DISTDIR="/usr/portage/distfiles"
FEATURES="distlocks metadata-transfer parallel-fetch sandbox sfperms strict unmerge-orphans userfetch"
GENTOO_MIRRORS="ftp://krasfiles.ru/mirrors/gentoo/"
LANG="ru_RU.UTF-8"
LC_ALL=""
LDFLAGS="-Wl,-O1"
PKGDIR="/usr/portage/packages"
PORTAGE_RSYNC_OPTS="--recursive --links --safe-links --perms --times --compress --force --whole-file --delete --stats --timeout=180 --exclude=/distfiles --exclude=/local --exclude=/packages"
PORTAGE_TMPDIR="/var/tmp"
PORTDIR="/usr/portage"
PORTDIR_OVERLAY="/usr/local/layman/zugaina /usr/local/layman/kdesvn-portage /usr/local/overlay"
SYNC="rsync://rsync.gentoo.org/gentoo-portage"
USE="7zip acl berkdb bzip2 cli cracklib crypt cups dri fortran gdbm iconv isdnlog logrotate lvm2 midi mudflap ncurses nls nptl nptlonly openmp pam pcre pppd python readline reflection session slang spl ssl sysfs tcpd truetype unicode userlocales win32codecs x86 xml xorg zlib" ALSA_CARDS="ali5451 als4000 atiixp atiixp-modem bt87x ca0106 cmipci emu10k1 emu10k1x ens1370 ens1371 es1938 es1968 fm801 hda-intel intel8x0 intel8x0m maestro3 trident usb-audio via82xx via82xx-modem ymfpci" ALSA_PCM_PLUGINS="adpcm alaw asym copy dmix dshare dsnoop empty extplug file hooks iec958 ioplug ladspa lfloat linear meter mmap_emul mulaw multi null plug rate route share shm softvol" APACHE2_MODULES="actions alias auth_basic authn_alias authn_anon authn_dbm authn_default authn_file authz_dbm authz_default authz_groupfile authz_host authz_owner authz_user autoindex cache dav dav_fs dav_lock deflate dir disk_cache env expires ext_filter file_cache filter headers include info log_config logio mem_cache mime mime_magic negotiation rewrite setenvif speling status unique_id userdir usertrack vhost_alias" ELIBC="glibc" INPUT_DEVICES="keyboard mouse evdev" KERNEL="linux" LCD_DEVICES="bayrad cfontz cfontz633 glk hd44780 lb216 lcdm001 mtxorb ncurses text" USERLAND="GNU" VIDEO_CARDS="fbdev glint i810 mach64 mga neomagic nv r128 radeon savage sis tdfx trident vesa vga via vmware voodoo"
Unset: CPPFLAGS, CTARGET, EMERGE_DEFAULT_OPTS, INSTALL_MASK, LINGUAS, MAKEOPTS, PORTAGE_COMPRESS, PORTAGE_COMPRESS_FLAGS, PORTAGE_RSYNC_EXTRA_OPTS

у меня

у меня переодически возникала проблема у одного из знакомых, по странному стечению обстоятельств всё падало раз в неделю, как по расписанию. потом как-то пропало. тоже интересно узнать в чём дело. в ядре есть пара пунктов для этой дровины - попробуй поменяй.

Может пора

Может пора покупать новое железо?

вообще нам было

вообще нам было не до смеху, там было нечто вроде сервера, с поидее 3мя карточками, потом добавили 4ю, потом 5ю, но работало только 3 одновременно. Пробовали менять их местами, на новые, поменяли весь комп кроме них... но всёравно проблема переодически вставала. там толи переодически конфликт прерываний "случался" через недедю работы (мда, а почемубы мне не случиться? и случусь!), толи ещё что... вообщем последний год работает нормально.

а у меня не так..

а у меня не так.. стоит мне только начать дико напрягать канал, так начинаются глюки.. но mldonkey нормально работает со скоростью 15 кб в секунду. Если начать качать с локального фтп со скоростью в пару метров в секунду - начинается веселье..

+1

cheerfulboy написал(а):
а у меня не так.. стоит мне только начать дико напрягать канал, так начинаются глюки.. но mldonkey нормально работает со скоростью 15 кб в секунду. Если начать качать с локального фтп со скоростью в пару метров в секунду - начинается веселье..

Есть мнение, что проблема в драйвере сетевой карты (или отработке оным глюков железа).
А вот где именно и как разбирать - вопрос.

Наблюдал подобную же картину (при превышении некоторого порогового значения нагрузки - вылет) с драйвером SCSI-контроллера Adaptec-не_помню_какой_именно на FreeBSD 6.2.
--
Live free or die

А поподробнее

А поподробнее нельзя?
У меня как раз недавно была очень неприятная проблема.
Файл-сервер на самбе почему-то вылетал, если с него несколько пользователей начинало качать что-то. Вылетал начисто, ни по сети ни с терминала достучаться нельзя было, перезагружал через alt+sysrq. В логах чисто. До этого несколько месяцев сервер работал под нагрузкой, но не в качестве файлового. Как раз с устройством, использующим вот это CONFIG_SCSI_AIC79XX.

=

HolyBoy написал(а):
А поподробнее нельзя?

Поподробнее конечно не жалко.
Только оно неконструктивно получается...

Жил-был почтовый (на самом деле - не только, но прочее в данном контексте некритично) сервер на FreeBSD 6.2 RELEASE.
Решили прикрутить к нему спам-фильтр (в качестве оного был выбран dspam, но это - совсем отдельная песня) с back-end'ом в виде MySQL 5.0.
При достижении базой размера ЕМНИП ~2Gb сервер начал периодически вылетать в проверку диска (естественно с выносом ОС). Он, конечно, и самостоятельно поднимался, но на это уходило изрядно времени, хорошо если в пределах часа.
Намёков на причину глюка - никаких.
Проблема была "решена" обновлением до 6.3 с переездом на другой сервер (с другим SCSI-контроллером).

HolyBoy написал(а):
В логах чисто.

Ты сам подумай: что может записаться в логи в процессе вылетания дискового контроллера?
Радует, что проблема на *BSD-only.
Можно переходить к дальнейшей локализации: Firmware или аппаратная?

HolyBoy написал(а):
До этого несколько месяцев сервер работал под нагрузкой, но не в качестве файлового.

А если перевести к сравнению нагрузки на жёсткий диск?

HolyBoy написал(а):
Как раз с устройством, использующим вот это CONFIG_SCSI_AIC79XX.

Можешь привести название устройства, а не ядерного драйвера?

И вообще, я думаю, этот вопрос лучше обсуждать в отдельной теме.

--
Live free or die

было подобное

было подобное на amd64: при повышении нагрузки были сообщения acpi что-то про "термал" (сейчас точно сказать не могу - машина на работе (сообщения сыплются и сейчас)) приэтом отваливалась сетевуха (в pci слоте RTL-8139). Тогда решилось откатом на ядро 2,6,18. Сейчас ~2.6.25 - все работает нормально.

я бы с

я бы с удовольствием откатился на более старое ядро, но не могу. Потому что мне надо ядро из git. У меня ралинк, который раздает инет всей квартире, а в режиме мастер он работает только на 2.6.27..

Квадратеги

Квадратеги веселые. Последний раз такое видел когда винт в лвм глючить стал. Сервак выпадал в даун под нагрузкой. Отловил врага при помощи smartmontools

Настройки просмотра комментариев

Выберите нужный метод показа комментариев и нажмите "Сохранить установки".