ЗАВИСАЕТ - перепробовал уже все [РЕШЕНО]

Что имеем? Тачка с двумя сетевыми, одной вайфайкой и сата-контроллером. Все четыре pci-слота заняты. Выполняет функции роутера и беспроводной точки доступа. И вся эта хрень последний месяц зависает каждый день!

(1) Причем симптомы достаточно странные.. Сначала в сислоге меняется время (не всегда):

Dec 7 00:58:06 router pure-ftpd: (?@192.168.1.2) [INFO] Anonymous user logged in
Dec 6 17:59:37 router pure-ftpd: (ftp@192.168.1.2) [NOTICE] /home/anonymous//incoming/films/Зак и Мири снимают порно(Zack and Miri Make a Porno)2008_DVDRip.avi uploaded (1469235200 bytes, 22777.49KB/$
Dec 7 01:00:01 router cron[7849]: (root) CMD (test -x /usr/sbin/run-crons && /usr/sbin/run-crons )
.................................................................................................
Dec 7 01:02:30 router pure-ftpd: (?@192.168.1.2) [INFO] Anonymous user logged in
Dec 6 18:02:37 router pure-ftpd: (ftp@192.168.1.2) [INFO] Logout.
Dec 7 01:02:56 router hostapd: wlan0: STA 00:1c:bf:9b:f8:04 WPA: group key handshake completed (RSN)
.................................................................................................
Dec 7 01:03:03 router pure-ftpd: (?@154.32.86.116) [INFO] Anonymous user logged in
Dec 6 18:07:37 router pure-ftpd: (ftp@192.168.1.2) [INFO] Logout.
Dec 7 01:08:55 router dhcpcd[5991]: eth0: renewing lease of 10.10.215.10
.................................................................................................
Dec 7 01:14:10 router pure-ftpd: (?@192.168.1.2) [INFO] Anonymous user logged in
Dec 6 18:19:10 router pure-ftpd: (ftp@192.168.1.2) [INFO] Logout.
Dec 7 01:20:01 router cron[9095]: (root) CMD (test -x /usr/sbin/run-crons && /usr/sbin/run-crons )

(2) Потом все зависает. В сислоге ничего нет после зависания:

Dec 7 01:33:06 router dnsmasq[12302]: using nameserver 87.236.40.249#53
Dec 7 01:33:06 router dnsmasq[12302]: using nameserver 87.236.40.248#53
Dec 7 01:40:25 router syslog-ng[4910]: syslog-ng starting up; version='2.0.9'
Dec 7 01:40:25 router Linux version 2.6.27.7 (root@router.home) (gcc version 4.1.2 (Gentoo 4.1.2 p1.1)) #5 Sat Dec 6 17:01:46 KRAT 2008

(3) Сначала сетовал на высокую температуру проца, так как сервак стоит в шкафу, в котором просто адская печка.
Взял шуруповерт, сделал квадратную дыру, вставил дикий кулер, который всю жару оттуда выдувает. Температура проца и жестких дисков снизилась до ~40 и ~36 соответственно. Еще дополнительно почистил радиатор камня и всю пыль вычистил из системника. Увы, не помогло.

(4) Подумал про битую память. Поставил мемтест, прогнал тест. Тест длился около полутора часов для моей одной планки в 512 метров. Все чисто, ни одной ошибки.

(5) Заметил, что когда все виснет, то led-индикатор активности на вай-файке бешено мограет, будто она активна. Причем iwlist wlan0 scanning показывает найденную сеть. Но иногда не показывает.. А лампочки на свиче, подсоединенному к роутеру мигают, будто что-то передается туда и обратно.

Помогите, пожалуйста! :( я не знаю, куда деваться с этой бедой..

# lspci
00:00.0 Host bridge: VIA Technologies, Inc. VT8377 [KT400/KT600 AGP] Host Bridge (rev 80)
00:01.0 PCI bridge: VIA Technologies, Inc. VT8237 PCI Bridge
00:09.0 Network controller: RaLink RT2561/RT61 rev B 802.11g
00:0a.0 RAID bus controller: Silicon Image, Inc. SiI 3112 [SATALink/SATARaid] Serial ATA Controller (rev 02)
00:0b.0 Ethernet controller: Realtek Semiconductor Co., Ltd. RTL-8169 Gigabit Ethernet (rev 10)
00:0c.0 Ethernet controller: Realtek Semiconductor Co., Ltd. RTL-8169 Gigabit Ethernet (rev 10)
00:0f.0 IDE interface: VIA Technologies, Inc. VT82C586A/B/VT82C686/A/B/VT823x/A/C PIPC Bus Master IDE (rev 06)
00:10.0 USB Controller: VIA Technologies, Inc. VT82xxxxx UHCI USB 1.1 Controller (rev 81)
00:10.1 USB Controller: VIA Technologies, Inc. VT82xxxxx UHCI USB 1.1 Controller (rev 81)
00:10.2 USB Controller: VIA Technologies, Inc. VT82xxxxx UHCI USB 1.1 Controller (rev 81)
00:10.3 USB Controller: VIA Technologies, Inc. VT82xxxxx UHCI USB 1.1 Controller (rev 81)
00:11.0 ISA bridge: VIA Technologies, Inc. VT8237 ISA bridge [KT600/K8T800/K8T890 South]
01:00.0 VGA compatible controller: Silicon Integrated Systems [SiS] 315PRO PCI/AGP VGA Display Adapter

# emerge --info
Portage 2.1.4.5 (default/linux/x86/2008.0, gcc-4.1.2, glibc-2.6.1-r0, 2.6.27.7 i686)
=================================================================
System uname: 2.6.27.7 i686 AMD Athlon(tm) XP 2000+
Timestamp of tree: Sat, 06 Dec 2008 10:01:01 +0000
app-shells/bash: 3.2_p33
dev-lang/python: 2.5.2-r7
sys-apps/baselayout: 1.12.11.1
sys-apps/sandbox: 1.2.18.1-r2
sys-devel/autoconf: 2.61-r2
sys-devel/automake: 1.9.6-r2, 1.10.1-r1
sys-devel/binutils: 2.18-r3
sys-devel/gcc-config: 1.4.0-r4
sys-devel/libtool: 1.5.26
virtual/os-headers: 2.6.27-r2
ACCEPT_KEYWORDS="x86"
CBUILD="i686-pc-linux-gnu"
CFLAGS="-march=athlon-xp -O3 -pipe"
CHOST="i686-pc-linux-gnu"
CONFIG_PROTECT="/etc /etc/hostapd /etc/squid/squid.conf"
CONFIG_PROTECT_MASK="/etc/ca-certificates.conf /etc/env.d /etc/fonts/fonts.conf /etc/gconf /etc/php/apache2-php5/ext-active/ /etc/php/cgi-php5/ext-active/ /etc/php/cli-php5/ext-active/ /etc/revdep-rebuild /etc/terminfo /etc/udev/rules.d"
CXXFLAGS="-march=athlon-xp -O3 -pipe"
DISTDIR="/usr/portage/distfiles"
FEATURES="distlocks metadata-transfer parallel-fetch sandbox sfperms strict unmerge-orphans userfetch"
GENTOO_MIRRORS="ftp://krasfiles.ru/mirrors/gentoo/ ftp://allotter.yandex.net/gentoo-distfiles/"
LANG="ru_RU.UTF-8"
LC_ALL=""
LDFLAGS="-Wl,-O1"
LINGUAS="ru en"
PKGDIR="/usr/portage/packages"
PORTAGE_RSYNC_OPTS="--recursive --links --safe-links --perms --times --compress --force --whole-file --delete --stats --timeout=180 --exclude=/distfiles --exclude=/local --exclude=/packages"
PORTAGE_TMPDIR="/var/tmp"
PORTDIR="/usr/portage"
PORTDIR_OVERLAY="/usr/portage/local/layman/zugaina /usr/portage/local/layman/bobrik-cleartype /usr/portage/local/layman/desktop-effects /usr/portage/local/layman/sunrise /usr/portage/local/overlay"
SYNC="rsync://rsync.gentoo.org/gentoo-portage"
USE="7zip acl bash-completion bzip2 charconv cli cracklib crypt dri fontconfig fortran gd gdbm iconv isc isdnlog jpeg logrotate lvm2 midi mudflap ncurses nls nptl nptlonly openmp pam pcre png pppd python readline reflection samba session slang spl ssl svga sysfs tcpd tiff truetype unicode userlocales vim-syntax win32codecs x86 xml xorg xpm zlib" ALSA_CARDS="ali5451 als4000 atiixp atiixp-modem bt87x ca0106 cmipci emu10k1 emu10k1x ens1370 ens1371 es1938 es1968 fm801 hda-intel intel8x0 intel8x0m maestro3 trident usb-audio via82xx via82xx-modem ymfpci" ALSA_PCM_PLUGINS="adpcm alaw asym copy dmix dshare dsnoop empty extplug file hooks iec958 ioplug ladspa lfloat linear meter mmap_emul mulaw multi null plug rate route share shm softvol" APACHE2_MODULES="actions alias auth_basic authn_alias authn_anon authn_dbm authn_default authn_file authz_dbm authz_default authz_groupfile authz_host authz_owner authz_user autoindex cache dav dav_fs dav_lock deflate dir disk_cache env expires ext_filter file_cache filter headers include info log_config logio mem_cache mime mime_magic negotiation rewrite setenvif speling status unique_id userdir usertrack vhost_alias" ELIBC="glibc" INPUT_DEVICES="keyboard mouse evdev" KERNEL="linux" LCD_DEVICES="bayrad cfontz cfontz633 glk hd44780 lb216 lcdm001 mtxorb ncurses text" LINGUAS="ru en" USERLAND="GNU" VIDEO_CARDS="fbdev glint i810 intel mach64 mga neomagic nv r128 radeon savage sis tdfx trident vesa vga via vmware voodoo"
Unset: CPPFLAGS, CTARGET, EMERGE_DEFAULT_OPTS, FFLAGS, INSTALL_MASK, MAKEOPTS, PORTAGE_COMPRESS, PORTAGE_COMPRESS_FLAGS, PORTAGE_RSYNC_EXTRA_OPTS

Могу предположить что высохли

Могу предположить что высохли или даже вздулись конденсаторы рядом с гнездом процессора, причинами их выхода из стороя обычно являются старение, изначально плохое качество самих компонентов, но наиболее частая причина: длительная работа в условиях перегрева (вы пишете что жара была сильная). Типичный симптом как раз таки зависание при повышении нагрузки на проц, т.е. завис изначально происходит при выполнении ресурсоемких задач, а при дальнейшее разрушение приводит к невозможности выполнения каких либо задач и даже невозможности загрузиться. Лечение одно: замена всех кондеров своими силами или в сервис центре в зависимости от радиуса кривизны рук ;)

Не думаю, что сейчас я готов

Не думаю, что сейчас я готов на столь радикальный шаг. У меня дома три компьютера и нет денег на покупку нового роутера.. А неделю сидеть без интернета, с перспективой покупки нового ПК я не могу. Может быть будут еще предложения? Ведь печка там была и раньше, и зависал он тоже. А вот сейчас прям пару раз в день.. :(

посмотри на сами конденсаторы

посмотри на сами конденсаторы - если их немного припекло, можно и незаметить, но если достаточно хорошо - сверху кондёра, на крышке выдавлен "крестик", если поднялся вверх - кондёр на ладан дышит. оно бывает как из-за перегрева - элетролит постепенно высызает, так и из-за "хорошего" блока питания или сдыхающего электролита в нём. В самой процедуре перепайки электролитов нет ничего страшного, при уловии что ты "держал в руках" паяльник.

Если под электролитом ты

Если под электролитом ты подразумеваешь электролитический кондер, то в этом правда нет ничего сложного. Паяльником пользоваться умею.. осталось только рассмотреть все кондеры..

Спасибо огромное за совет!

Спасибо огромное за совет! Особенно за описание того, как выглядят вздутые кондеры.. нашел один такой.. Сейчас узнаю, что это за зверь, а потом на радиорынок..

Зависание вызывает не столько

Зависание вызывает не столько сама нагрузка сколько ее резкие перепады (т.к. смысл этих кондеров в том чтобы поддерживать стабильность питания проца в случае если его энергопотребление вдруг резко увеличивается - пик нагрузки), кроме того вздутые кондеры сами по себе начинают греться и перед началом сбоев требуется их прогрев (возможно несколько часов). Если есть возможность то лучше заменить все кондеры сразу так как если процесс начался то они будут вылетать один за другим, на рынок не набегаетесь. Главное при замене соблюсти полярность (иначе вместо ремонта получите небольшой взрыв), а также не перегреть кондер и плату. Простейший способ заменны: зажать плату между коленями (хлопчатые штаны и никакой синтетики иначе можно все убить статикой) и мощным паяльником с плоским жалом ширины достаточной чтобы прогревать одновременно обе ноги кондера быстро выпаять все, а затем прогревая дырки от кондера на плате этим же паяльником установить новые, предварительно подрезав им ноги до той же длины что была у старых кондеров.

Сегодня сходил к другану,

Сегодня сходил к другану, который с паяльной станцией (фен и паяльник с тонким жалом). В общем счете, заменили около 8 конденсаторов рядом с камнем. Из них три были либо потекшие, либо вздутые.. Нашли такой же емкости, но всего 8 штук. Только что собрал, сижу, тестирую.. Сама плата как новенькая, будто и не ремонтировали :)

UPD: все зависает, хрен подери.. :(

возможно они зацепили что-то

возможно они зацепили что-то ещё, или они вздулись из-за того что нечто сдохло в блоке питания. попробуй взять "на потестить" заведомо нормальный БП

Вчера сразу же после

Вчера сразу же после зависонов вскрыл БП. Там кондеры вздулись в четыре разные стороны и торчат, как грибы.. :) У меня даже отвращение вызвал их вид, честное слово.. Сейчас вот два денька если аптайму наберется - тему можно будет пометить, как решенную.. Всем спасибо :)

stress -c 1 -v гоняю уже

stress -c 1 -v гоняю уже около часа - все работает нормально. Одновременно с ним собирал ядро. Загрузка ЦПУ в течение часа 100% - ничего не зависает. Вот показания sensors:

w83697hf-isa-0290
Adapter: ISA adapter
VCore: +1.62 V (min = +0.13 V, max = +0.00 V) ALARM
+3.3V: +1.50 V (min = +0.00 V, max = +0.00 V) ALARM
+5V: +5.00 V (min = +1.96 V, max = +0.00 V) ALARM
+12V: +12.46 V (min = +0.00 V, max = +0.97 V) ALARM
-12V: +2.36 V (min = -4.38 V, max = -14.58 V) ALARM
-5V: +0.83 V (min = -7.71 V, max = -6.81 V) ALARM
V5SB: +5.51 V (min = +0.86 V, max = +0.00 V) ALARM
VBat: +3.14 V (min = +0.00 V, max = +0.06 V) ALARM
fan1: 2812 RPM (min = 2481 RPM, div = 8)
fan2: 3245 RPM (min = -1 RPM, div = 8) ALARM
temp1: +41°C (high = +8°C, hyst = +6°C) sensor = thermistor ALARM
temp2: +49.5°C (high = +100°C, hyst = +95°C) sensor = thermistor
alarms:
beep_enable:
Sound alarm enabled

За последнее время что

За последнее время что изменилось? Может трафик подрос?
Если все PCI слоты заняты то может быть конфликты доступа. Почитай на счет конфликтов IRQ. Возможно поможет использовать NAPI на сетевых картах если драйвера поддерживают. Покажи /proc/interrupts может там что-то интересное есть.
Если есть другая wifi точка(оч желательно другого производителя) попробуй ее поставить.

# cat /proc/interrupts

# cat /proc/interrupts
CPU0
0: 42779 XT-PIC-XT timer
1: 58 XT-PIC-XT i8042
2: 0 XT-PIC-XT cascade
9: 0 XT-PIC-XT acpi
11: 151127 XT-PIC-XT sata_sil, uhci_hcd:usb1, uhci_hcd:usb2, uhci_hcd:usb3, uhci_hcd:usb4, 0000:00:09.0, eth0, lan0
NMI: 0 Non-maskable interrupts
TRM: 0 Thermal event interrupts
ERR: 0

11: 151127 XT-PIC-XT

11: 151127 XT-PIC-XT sata_sil, uhci_hcd:usb1, uhci_hcd:usb2, uhci_hcd:usb3, uhci_hcd:usb4, 0000:00:09.0, eth0, lan0
Вот это и плохо.

Что с этим делать? Вот такое

Что с этим делать? Вот такое еще вылазит порой:

Dec 9 18:06:11 router ------------[ cut here ]------------
Dec 9 18:06:11 router WARNING: at net/sched/sch_generic.c:219 dev_watchdog+0xdc/0x151()
Dec 9 18:06:11 router NETDEV WATCHDOG: eth0 (r8169): transmit timed out
Dec 9 18:06:11 router Modules linked in: nfsd lockd sunrpc exportfs w83627hf hwmon_vid pppoe pppox ppp_generic slhc iptable_mangle xt_TCPMSS ipt_REJECT iptable_filter ipt_MASQUERADE ipt_REDIRECT iptable_nat nf_nat nf_conntrack_ipv4 nf_conntrack analog gameport fan i2c_viapro r8169 mii thermal button processor via_agp thermal_sys agpgart dm_snapshot dm_mirror dm_log sbp2 ohci1394 ieee1394 usbhid ohci_hcd uhci_hcd usb_storage usbcore scsi_transport_fc scsi_wait_scan
Dec 9 18:06:11 router Pid: 0, comm: swapper Not tainted 2.6.27.8 #1
Dec 9 18:06:11 router [] dev_watchdog+0x0/0x151
Dec 9 18:06:11 router [] warn_slowpath+0x61/0x84
Dec 9 18:06:11 router [] enqueue_task+0xa/0x14
Dec 9 18:06:11 router [] activate_task+0x16/0x1a
Dec 9 18:06:11 router [] __wake_up_common+0x2d/0x52
Dec 9 18:06:11 router [] __wake_up+0xf/0x15
Dec 9 18:06:11 router [] ppp_input+0x85/0xc9 [ppp_generic]
Dec 9 18:06:11 router [] pppoe_rcv_core+0x1a/0xc3 [pppoe]
Dec 9 18:06:11 router [] netif_receive_skb+0x283/0x2a5
Dec 9 18:06:11 router [] strlcpy+0x14/0x5c
Dec 9 18:06:11 router [] dev_watchdog+0xdc/0x151
Dec 9 18:06:11 router [] enqueue_task+0xa/0x14
Dec 9 18:06:11 router [] activate_task+0x16/0x1a
Dec 9 18:06:11 router [] dev_watchdog+0x0/0x151
Dec 9 18:06:11 router [] run_timer_softirq+0xdb/0x11c
Dec 9 18:06:11 router [] __do_softirq+0x35/0x75
Dec 9 18:06:11 router [] __do_softirq+0x0/0x75
Dec 9 18:06:11 router [] do_softirq+0x3e/0x72
Dec 9 18:06:11 router [] handle_level_irq+0x0/0x86
Dec 9 18:06:11 router [] do_IRQ+0x8b/0xa1
Dec 9 18:06:11 router [] common_interrupt+0x23/0x28
Dec 9 18:06:11 router [] acpi_idle_enter_simple+0x16d/0x1d8 [processor]
Dec 9 18:06:11 router [] cpuidle_idle_call+0x49/0x77
Dec 9 18:06:11 router [] cpu_idle+0x37/0x4b
Dec 9 18:06:11 router =======================
Dec 9 18:06:11 router ---[ end trace 06d54894234d89d7 ]---
Dec 9 18:06:11 router r8169: eth0: link up
Dec 9 18:08:47 router r8169: lan0: link up

Да и сата-контроллер галлюционирует иногда, если напрягать его..

Выше же все написал. Гугли.

Выше же все написал. Гугли. Пробуй.

Да я загуглился.. как я

Да я загуглился.. как я понимаю, надо лезть в биос и менять устройства на прерываниях?

Как вариант.

Как вариант.

мда, надо разбираться.. :(

мда, надо разбираться.. :( ничего пока не выходит..

# cat /proc/interrupts

# cat /proc/interrupts
CPU0
0: 6530 IO-APIC-edge timer
1: 8 IO-APIC-edge i8042
9: 0 IO-APIC-fasteoi acpi
17: 262 IO-APIC-fasteoi 0000:00:09.0
18: 10338 IO-APIC-fasteoi sata_sil, lan0
19: 767 IO-APIC-fasteoi eth0
21: 518 IO-APIC-fasteoi uhci_hcd:usb1, uhci_hcd:usb2, uhci_hcd:usb3, uhci_hcd:usb4
NMI: 0 Non-maskable interrupts
LOC: 1054 Local timer interrupts
TRM: 0 Thermal event interrupts
SPU: 0 Spurious interrupts
ERR: 0
MIS: 0

Вот такая таблица пойдет? включил apic в ядре.

По идее должно быть полегче.

По идее должно быть полегче. Но я бы все таки посоветовал собрать RTL-8169 c NAPI. Тем более что модуль можно собрать быстро наподобе make menuconfig && make modules && make modules install && modprobe -r r8169 && modprobe r8169.

не могу найти я, где включить

не могу найти я, где включить napi для моего модуля..

Вот жеж: │ Symbol:

Вот жеж:
│ Symbol: R8169_NAPI [=n] │
│ Prompt: Use Rx Polling (NAPI) (EXPERIMENTAL) │
│ Defined at drivers/net/Kconfig:2238 │
│ Depends on: NETDEVICES && NETDEV_1000 && R8169 && EXPERIMENTAL │
│ Location: │
│ -> Device Drivers │
│ -> Network device support (NETDEVICES [=y]) │
│ -> Ethernet (1000 Mbit) (NETDEV_1000 [=n]) │
│ -> Realtek 8169 gigabit ethernet support (R8169 [=n])

Обрати внимание на "Depends on" они должны быть включены иначе менюшка "Use Rx Polling (NAPI) (EXPERIMENTAL)" может быть скрыта.

Это для какого ядра?

Это для какого ядра?

Symbol: NETDEVICES [=y]
Symbol: NETDEV_1000 [=y]
Symbol: R8169 [=m]
Symbol: EXPERIMENTAL [=y]

Все зависимости удовлетворены.. Никакой менюшки я не вижу.. что делаю не так?

в v2.6.26-gentoo-r4 нашел..

в v2.6.26-gentoo-r4 нашел..
в v2.6.27.8 ванильном нету..

там в menuconfig поиск по "/"

Там в menuconfig поиск по кнопачке "/" есть. Если при поиске нет R8169_NAPI то его уж там точно нет. Решено таки после разруливания прирываний я так понимаю...

У меня складывается такое

У меня складывается такое впечатление, что железо уже того, на помойку просится. Если конденсаторы уже везде повздувались.

Текстовый редактор vi имеет два режима работы: в первом он пищит, а во втором — всё портит.

.

krigstask написал(а):
У меня складывается такое впечатление, что железо уже того, на помойку просится. Если конденсаторы уже везде повздувались.

Конденсаторы - это конечно конкретный звоночек...

Но есть мнение, что не всякое железо (наверное в смысле: скорее firmware) выживает под серьёзной нагрузкой.
Тот самый ЕМНИП 79ХХ Adaptec SCSI-контроллер мы знаем и любим.

:wq
--
Live free or die

Настройки просмотра комментариев

Выберите нужный метод показа комментариев и нажмите "Сохранить установки".