You are not logged in.

Dear visitor, welcome to VDR Portal. If this is your first visit here, please read the Help. It explains in detail how this page works. To use all features of this page, you should consider registering. Please use the registration form, to register here or read more information about the registration process. If you are already registered, please login here.

1

Monday, July 5th 2010, 9:46am

Netzwerk am Server bricht weg (sporadisch)

Hallo zusammen - bin etwas verzweifelt:

An meinem Server 24x7 (NFS, Mail etc.) bricht nach einiger Zeit (Wochen/Monat(e)) das Netzwerk weg - von aussen ist die Büchse nicht mehr anzupingen - alle Verbindungen auf die Kiste sind tot. Die Kiste selbst meint das mit dem Netzwerk alles in Butter sei - kann aber auch nicht rauspingen - die lokale Adresse antwortet. Das ganze lief Jahrelang stabil - bis vor ca. einem halben Jahr.

Manchmal hilft ein rcnetwork restart und alles ist wieder in Butter, manchmal muss ein reboot her.

Ich suche nach Strategien zur Fehlersuche.

Den Switch kann ich ausschließen - der ist Brandneu und das Problem trat auch mit dem alten Switch auf und "drumrum" pingt alles wie blöd.

Kabel tausche ich als nächstes - danach würde ich eine andere Netzwerkkarte einbauen.

Danach müsste es in Software liegen denke ich.

Das sind aber alles recht hilflose Versuche wie ich finde - gibt es keine bessere Idee?
xbmc0: Asus M4A77D, AMD Athlon 64X2 5600+, Borg HFX 4GB, 2 * Technotrend S2-1600, GeForce 9500 GT 1GB Memory, xbmc 12.2, vdr 2.1.2, vnsi, markad, epg2vdr mcubed HFX Classic
xbmc1: A330ION mit BORG Hfx, 2GB, Satix S2, xbmc 12.2, vdr 2.1.2, vnsi,, markad, epg2vdr HFX mini
amenophis: MSI C847MS-E33, GT610 512MB, TT S2-3200, vdr-2.1.6 +xine, skinenigmang, markad, live, epg2vdr, xbmc 13.0
echnaton:
ASRock FM2A88X Extreme4+ ,Rocketraid 2320, 2*1TB (Raid 1), 6*2TB (Raid 5), 3 * TTS3200 vdr-2.1.6, streamdev, markad,, epgsearch, live, epg2vdr

umaier

Professional

Posts: 1,005

Location: Stuttgart

  • Send private message

2

Monday, July 5th 2010, 10:38am

RE: Netzwerk am Server bricht weg (sporadisch)

Waehrend des Betriebs - einfach so - habe ich sowas bei mir noch nicht beobachtet - dafuer sind meine Uptimes einfach zu klein :-) .

Ich habe dafuer zwei Problem(chen) mit Intel Karten (guuuut, ich setze sonst nichts anderes ein):
beim einen Rechner kommt es nach dem Neustart bei der Geschwindigkeitsaushandlung zu keinem Ergebnis. Das ist unabhaengig vom Switch (Cisco/3Com/allnet/D-Link) und der Leitung. Bei spaeteren Versuchen klappt's dann irgendwann - die muessen dann aber ueber "Notscripte" laufen.

Beim anderen haengt sich die Karte nach einem Reboot des Switchs (3Com SuperStacks - die machen das immer mal wieder (so alle paar Monate)) weg. Dort muss ich dann die Netzwerkmodule raus- und wieder reinnehmen, dann laeuft es wieder.

Interessant waere die Fehlerrate auf dem Interface. Evtl. steigt die vorher an?

uwe
VDR1: GigaByte GA-M61P-S3, AthlonX2-3800EE, 4GB, 7TB, Nexus-S 2.1, KNC One, 2.6.20.3, VDR 1.4.0 (mit liemikuutio, CutterQueue, RecordingsList u.a. Patchen)
VDR2: GigaByte GA-770TA-UD3, Athlon 600e, 16GB, 12TB, 3.10, VDR 2.1

Posts: 3,004

Location: a child of the universe

Occupation: duct tape programmer

  • Send private message

3

Monday, July 5th 2010, 10:52am

Quoted

Originally posted by magicamun
Die Kiste selbst meint das mit dem Netzwerk alles in Butter sei -


wie hast du das ermittelt? Schon einen 'ethtool ethX' aufgerufen? Vielleicht ist da mehr draus ersichtlich.

- sparkie

This post has been edited 1 times, last edit by "sparkie" (Jul 5th 2010, 10:53am)


4

Monday, July 5th 2010, 6:09pm

Quoted

Original von sparkie

Quoted

Originally posted by magicamun
Die Kiste selbst meint das mit dem Netzwerk alles in Butter sei -


wie hast du das ermittelt? Schon einen 'ethtool ethX' aufgerufen? Vielleicht ist da mehr draus ersichtlich.

- sparkie



mit nem ping auf die eigene adresse.
xbmc0: Asus M4A77D, AMD Athlon 64X2 5600+, Borg HFX 4GB, 2 * Technotrend S2-1600, GeForce 9500 GT 1GB Memory, xbmc 12.2, vdr 2.1.2, vnsi, markad, epg2vdr mcubed HFX Classic
xbmc1: A330ION mit BORG Hfx, 2GB, Satix S2, xbmc 12.2, vdr 2.1.2, vnsi,, markad, epg2vdr HFX mini
amenophis: MSI C847MS-E33, GT610 512MB, TT S2-3200, vdr-2.1.6 +xine, skinenigmang, markad, live, epg2vdr, xbmc 13.0
echnaton:
ASRock FM2A88X Extreme4+ ,Rocketraid 2320, 2*1TB (Raid 1), 6*2TB (Raid 5), 3 * TTS3200 vdr-2.1.6, streamdev, markad,, epgsearch, live, epg2vdr

5

Sunday, July 18th 2010, 11:08am

so - es war mal wieder soweit.

in /var/log/warn hab ich dies hier gefunden:

Source code

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
Jul 14 16:03:14 amun kernel: WARNING: at net/sched/sch_generic.c:261 dev_watchdog+0x12f/0x1c0()
Jul 14 16:03:14 amun kernel: Hardware name: System Product Name
Jul 14 16:03:14 amun kernel: Modules linked in: nfsd lockd nfs_acl auth_rpcgss sunrpc exportfs iptable_filter ip_tables ip6table_filter ip6_tables x_tables ipv6 cpufreq_conservative cpufreq_userspace cpufreq_powersave powernow_k8 fuse loop dm_mod snd_hda_codec_nvhdmi snd_hda_codec_realtek snd_hda_intel k8temp hwmon snd_hda_codec snd_pcm snd_timer shpchp snd ftdi_sio forcedeth soundcore snd_page_alloc sr_mod cdrom usbserial pci_hotplug i2c_nforce2 i2c_core floppy parport_pc rtc_cmos rtc_core rtc_lib parport button sg sd_mod ohci_hcd ehci_hcd usbcore edd ext3 mbcache jbd fan rr232x(P) ahci pata_amd libata scsi_mod thermal processor
Jul 14 16:03:14 amun kernel: Pid: 0, comm: swapper Tainted: P           2.6.32-rc8-default #1
Jul 14 16:03:14 amun kernel: Call Trace:
Jul 14 16:03:14 amun kernel:  <IRQ>  [<ffffffff812228c7>] ? dev_watchdog+0x12f/0x1c0
Jul 14 16:03:14 amun kernel:  [<ffffffff812228c7>] ? dev_watchdog+0x12f/0x1c0
Jul 14 16:03:14 amun kernel:  [<ffffffff8103f823>] ? warn_slowpath_common+0x77/0x8e
Jul 14 16:03:14 amun kernel:  [<ffffffff8103f896>] ? warn_slowpath_fmt+0x51/0x59
Jul 14 16:03:14 amun kernel:  [<ffffffff8102e01d>] ? activate_task+0x20/0x26
Jul 14 16:03:14 amun kernel:  [<ffffffff81035806>] ? try_to_wake_up+0x1f0/0x1fe
Jul 14 16:03:14 amun kernel:  [<ffffffff81055c3f>] ? autoremove_wake_function+0x9/0x2e
Jul 14 16:03:14 amun kernel:  [<ffffffff8102dbed>] ? __wake_up_common+0x44/0x72
Jul 14 16:03:14 amun kernel:  [<ffffffff8120dc5f>] ? netdev_drivername+0x3b/0x40
Jul 14 16:03:14 amun kernel:  [<ffffffff812228c7>] ? dev_watchdog+0x12f/0x1c0
Jul 14 16:03:14 amun kernel:  [<ffffffff81030605>] ? __wake_up+0x30/0x44
Jul 14 16:03:14 amun kernel:  [<ffffffff81222798>] ? dev_watchdog+0x0/0x1c0
Jul 14 16:03:14 amun kernel:  [<ffffffff81049c90>] ? run_timer_softirq+0x201/0x297
Jul 14 16:03:14 amun kernel:  [<ffffffff81044ab0>] ? __do_softirq+0xd9/0x18e
Jul 14 16:03:14 amun kernel:  [<ffffffff8100ca5c>] ? call_softirq+0x1c/0x28
Jul 14 16:03:14 amun kernel:  [<ffffffff8100dd8d>] ? do_softirq+0x31/0x66
Jul 14 16:03:14 amun kernel:  [<ffffffff8101e55a>] ? smp_apic_timer_interrupt+0x88/0x96
Jul 14 16:03:14 amun kernel:  [<ffffffff8100c433>] ? apic_timer_interrupt+0x13/0x20
Jul 14 16:03:14 amun kernel:  <EOI>  [<ffffffff81011a3b>] ? default_idle+0x4a/0x5f
Jul 14 16:03:14 amun kernel:  [<ffffffff81011cfa>] ? c1e_idle+0xdf/0xe5
Jul 14 16:03:14 amun kernel:  [<ffffffff8100aa89>] ? cpu_idle+0x49/0x5e
Jul 14 16:03:14 amun kernel:  [<ffffffff8150dc4c>] ? start_kernel+0x348/0x354
Jul 14 16:03:14 amun kernel:  [<ffffffff8150d381>] ? x86_64_start_kernel+0xea/0xee
Jul 14 16:03:14 amun kernel: ---[ end trace e99c04274f6e1d02 ]---


ein dmesg hat mir dann geliefert (mehrere Seiten lang):

Source code

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
....
0ec: 00000000 68a47802 a0000029 // 00000000 68a47402 a0000029 // 00000000 68a47002 a0000029 // 00000000 3fc4cc02 a0000029
0f0: 00000000 3fc4c802 a0000029 // 00000000 3fc4c402 a0000029 // 00000000 3fc4c002 a0000029 // 00000000 3fcf8c02 a0000029
0f4: 00000000 3fcf8802 a0000029 // 00000000 3fcf8402 a0000029 // 00000000 3fcf8002 a0000029 // 00000000 71163c02 a0000029
0f8: 00000000 71163802 a0000029 // 00000000 71163402 a0000029 // 00000000 71163002 a0000029 // 00000000 68be9c02 a0000029
0fc: 00000000 68be9802 a0000029 // 00000000 68be9402 a0000029 // 00000000 68be9002 a0000029 // 00000000 70be8c02 a000017b
eth0: Got tx_timeout. irq: 00000020
eth0: Ring at 734f4000
eth0: Dumping tx registers
  0: 00000020 000000df 00000003 0004000d 00000000 00000000 00000000 00000000
 20: 00000000 00000000 00000000 00000000 00000001 00000000 00000000 00000000
 40: 0420e20e 0000a455 00002e20 00000000 00000000 00000000 00000000 00000000
 60: 00000000 00000000 00000000 0000ffff 0000ffff 0000ffff 0000ffff 00000000
 80: 003b0f3d 40000001 00000000 007f0028 0000061c 00000001 00200000 0003ff00
 a0: 0014050f 00000016 518c1e00 00007bad 00000001 00000000 8000cccd 00000400
....


Das ganze passiert(e) auf dem Asus M2N-VM-HDMI Onboard - NIC
Kernel ist ein 2.6.32-rc8, Ich hab heute morgen eine D-Link karte eingebaut und nun warte ich (wieder) bis es scheppert.
xbmc0: Asus M4A77D, AMD Athlon 64X2 5600+, Borg HFX 4GB, 2 * Technotrend S2-1600, GeForce 9500 GT 1GB Memory, xbmc 12.2, vdr 2.1.2, vnsi, markad, epg2vdr mcubed HFX Classic
xbmc1: A330ION mit BORG Hfx, 2GB, Satix S2, xbmc 12.2, vdr 2.1.2, vnsi,, markad, epg2vdr HFX mini
amenophis: MSI C847MS-E33, GT610 512MB, TT S2-3200, vdr-2.1.6 +xine, skinenigmang, markad, live, epg2vdr, xbmc 13.0
echnaton:
ASRock FM2A88X Extreme4+ ,Rocketraid 2320, 2*1TB (Raid 1), 6*2TB (Raid 5), 3 * TTS3200 vdr-2.1.6, streamdev, markad,, epgsearch, live, epg2vdr