Hi allerseits!
Vielleicht kann mir einer von den Betriebs- und Fielsystemspezialisten ja einen Tip geben...
Vorgeschichte:
1. bisher kein Problem mit den Festplatten (30+120+160+160)
2. Umstieg auf anderes Motherboard und neue hda (250)
3. massive Probleme mit dma auf zweitem ide-controller (via)
4. Downgrade auf altes MoBo
5. vorige Woche kippte das ReiserFS auf hdd1 - mit ext3 überschr.
6. gestern: Probleme mit hdc1 und hdd2 aufgetreten: "lost interrupt"
und system steht (vdr läuft, ragiert nicht mehr)
kurzer Auszug aus dem syslog:
Jan 25 23:01:46 tux vdr[3705]: creating directory /video0/Gilmore_Girls/Gilmore_Girls/%Ein_Brief_mit_Folgen
Jan 25 23:01:46 tux vdr[3705]: creating directory /video0/Gilmore_Girls/Gilmore_Girls/%Ein_Brief_mit_Folgen/2005-11-08.17.35.99.99.rec
Jan 25 23:01:46 tux vdr[3705]: loading /video0/Gilmore_Girls/Gilmore_Girls/Ein_Brief_mit_Folgen/2005-11-08.17.35.99.99.rec//marks.vdr
Jan 25 23:01:46 tux vdr[3705]: playing '/video0/Gilmore_Girls/Gilmore_Girls/Ein_Brief_mit_Folgen/2005-11-08.17.35.99.99.rec/001.vdr'
Jan 25 23:01:46 tux vdr[3705]: Open stream: 38
Jan 25 23:01:46 tux vdr[3705]: recording to '/video0/Gilmore_Girls/Gilmore_Girls/%Ein_Brief_mit_Folgen/2005-11-08.17.35.99.99.rec/001.vdr'
Jan 25 23:01:46 tux vdr[3705]: creating directory /video2/Gilmore_Girls/Gilmore_Girls/%Ein_Brief_mit_Folgen
Jan 25 23:01:46 tux vdr[3705]: creating directory /video2/Gilmore_Girls/Gilmore_Girls/%Ein_Brief_mit_Folgen/2005-11-08.17.35.99.99.rec
Jan 25 23:01:46 tux vdr[3705]: Open stream: 39
Jan 25 23:01:46 tux vdr[3705]: Open stream: 40
Jan 25 23:01:47 tux vdr[3705]: Open stream: 44
Jan 25 23:01:47 tux vdr[3705]: video cutting thread started (pid=3705, tid=-1301283920)
Jan 25 23:03:01 tux vdr[3705]: channel 25 (TW1) event 23:00 'Teleshopping' status 4
Jan 25 23:04:00 tux kernel: hdc: dma_timer_expiry: dma status == 0x61
Jan 25 23:04:10 tux kernel: hdc: DMA timeout error
Jan 25 23:04:10 tux kernel: hdc: dma timeout error: status=0x80 { Busy }
Jan 25 23:04:10 tux kernel:
Jan 25 23:04:10 tux kernel: ide: failed opcode was: unknown
Jan 25 23:04:10 tux kernel: hdc: DMA disabled
Jan 25 23:04:10 tux kernel: hdd: DMA disabled
Jan 25 23:04:10 tux kernel: ide1: reset: success
Jan 25 23:04:40 tux kernel: hdc: irq timeout: status=0x80 { Busy }
Jan 25 23:04:41 tux kernel:
Jan 25 23:04:41 tux kernel: ide: failed opcode was: unknown
Jan 25 23:04:41 tux kernel: ide1: reset: success
Jan 25 23:04:51 tux kernel: hdc: irq timeout: status=0x80 { Busy }
Jan 25 23:04:51 tux kernel:
Jan 25 23:04:51 tux kernel: ide: failed opcode was: unknown
Jan 25 23:04:51 tux kernel: ide1: reset: success
Jan 25 23:05:01 tux kernel: hdc: lost interrupt
Jan 25 23:05:31 tux kernel: hdc: lost interrupt
...
Jan 25 23:55:30 tux kernel: hdc: lost interrupt
Jan 25 23:56:00 tux kernel: hdc: lost interrupt
Jan 25 23:57:00 tux last message repeated 2 times
Jan 25 23:58:00 tux last message repeated 2 times
Jan 25 23:59:00 tux last message repeated 2 times
Jan 25 23:59:30 tux kernel: hdc: lost interrupt
Jan 26 00:00:00 tux kernel: hdc: irq timeout: status=0x80 { Busy }
Jan 26 00:00:00 tux kernel:
Jan 26 00:00:00 tux kernel: ide: failed opcode was: unknown
Jan 26 00:00:00 tux kernel: end_request: I/O error, dev hdc, sector 28582191
Jan 26 00:00:00 tux kernel: hdd: status error: status=0x00 { }
Jan 26 00:00:00 tux kernel:
Jan 26 00:00:00 tux kernel: ide: failed opcode was: unknown
Jan 26 00:00:00 tux kernel: hdd: drive not ready for command
Jan 26 00:00:00 tux kernel: hdd: status error: status=0x00 { }
Jan 26 00:00:00 tux kernel:
Jan 26 00:00:00 tux kernel: ide: failed opcode was: unknown
Jan 26 00:00:00 tux kernel: hdd: drive not ready for command
Jan 26 00:00:00 tux kernel: hdd: status error: status=0x00 { }
Jan 26 00:00:00 tux kernel:
Jan 26 00:00:00 tux kernel: ide: failed opcode was: unknown
Jan 26 00:00:00 tux kernel: hdd: drive not ready for command
Jan 26 00:00:00 tux kernel: hdd: status error: status=0x00 { }
Jan 26 00:00:00 tux kernel:
Jan 26 00:00:00 tux kernel: ide: failed opcode was: unknown
Jan 26 00:00:00 tux kernel: hdc: DMA disabled
Jan 26 00:00:00 tux kernel: hdd: drive not ready for command
Jan 26 00:00:01 tux /USR/SBIN/CRON[10355]: (root) CMD (/etc/webmin/time/sync.pl)
Jan 26 00:00:28 tux kernel: ide1: reset timed-out, status=0x80
Jan 26 00:00:28 tux kernel: hdd: status error: status=0x00 { }
Jan 26 00:00:28 tux kernel:
Jan 26 00:00:28 tux kernel: ide: failed opcode was: unknown
Jan 26 00:00:28 tux kernel: hdd: drive not ready for command
Jan 26 00:00:28 tux kernel: hdd: status error: status=0x00 { }
Jan 26 00:00:28 tux kernel:
Jan 26 00:00:28 tux kernel: ide: failed opcode was: unknown
Jan 26 00:00:28 tux kernel: hdd: drive not ready for command
Jan 26 00:00:28 tux kernel: hdd: status error: status=0x00 { }
Jan 26 00:00:28 tux kernel:
Jan 26 00:00:28 tux kernel: ide: failed opcode was: unknown
Jan 26 00:00:28 tux kernel: hdd: drive not ready for command
Jan 26 00:00:28 tux kernel: hdd: status error: status=0x00 { }
Jan 26 00:00:28 tux kernel:
Jan 26 00:00:28 tux kernel: ide: failed opcode was: unknown
Jan 26 00:00:28 tux kernel: hdd: drive not ready for command
Jan 26 00:00:43 tux kernel: ide1: reset: success
Jan 26 00:01:13 tux kernel: hdc: irq timeout: status=0x80 { Busy }
Jan 26 00:01:13 tux kernel:
Jan 26 00:01:13 tux kernel: ide: failed opcode was: unknown
Jan 26 00:01:13 tux kernel: ide1: reset: success
Jan 26 00:01:15 tux hddtemp[3686]: /dev/hda: SAMSUNG SP2514N: 39 C
Jan 26 00:01:15 tux hddtemp[3686]: /dev/hdb: ST3120022A: 43 C
Jan 26 00:01:15 tux hddtemp[3686]: /dev/hdc: WDC WD1600JB-00EVA0: 41 C
Jan 26 00:01:15 tux hddtemp[3686]: /dev/hdd: SAMSUNG SP1614N: 29 C
Jan 26 00:01:15 tux vdr[3705]: ERROR (recording.c,1929): Input/output error
Jan 26 00:01:15 tux vdr[3705]: video cutting thread ended (pid=3705, tid=-1301283920)
Jan 26 00:01:16 tux vdr[3705]: close buffer: 39 (flush: 804913 bytes, 262782026-263586939)
Jan 26 00:01:16 tux vdr[3705]: close buffer: 40 (flush: 0 bytes, 0-2877112)
Jan 26 00:01:16 tux vdr[3705]: close buffer: 44 (flush: 62808 bytes, 0-62808)
Alles anzeigen
Meine Vermutung:
Während das alte Motherboard gesponnen (Klötzchen, Zugriffsfehler, ..) hat hab ich gemerkt, dass die Probleme nur bei Aufnahmen auf ide1 (hdc1, hdd2) aufgetreten sind.
Durch das Dazuklemmen der größeren hda als /video4 hat er seit dem Downgrade auf die fast leere hda6 aufgenommen und nix auf die hdc und hdd gelagert...
Gestern zugriff schreibend auf diese platten, schwupp und weg...
VERDACHT: der controller des anderen MoBo hat meine Daten vermurxt und einzelne Blocks mit falschem Inhalt gefüllt.
Frage: WAS TUN?
reiserfsck mit rebuild-index? Badblocks?
Dass beide platten sterben glaub ich nicht, da zwei gleichzeitig eher unwahrscheinlich ist. (Geräuschkulisse übrigens genauso normal wie plattentemperatur)
Aber warum verliert er den interrupt??? Platte zu sehr verwirrt?
das reiser auf hdd1 (inzwischen entsorgt) hat auf ausserhalb seines Bereichs befindliche Sektoren gezeigt (mit ext3-Neuformatierung läuft die hdd1 jetzt brav), (alter Thread
eine neuformatieren kommt für die großen Videopartitionen mangels Auslagerungsplatz kaum in frage
Somit meine große Bitte:
H I L F E !!!!! Bin Ratlos.
Danke und lg
Bax
PS: Kabel hab ich gecheckt, DMA ist UDMA33, Werde Master/Slave mal tauschen,