Server steht - Kernelfehler

Hallo,
heute ist der Server im laufenden Betrieb (virtualisiert unter xen) “eingefroren”, es waren keine Aktionen mehr möglich (Anmeldung am Server, ping etc.). Unter XenCenter konnte man sehen, dass die VM nicht mehr via Console ansteuerbar war - auch wenn Regelbetrieb angezeigt wurde.
Im syslog finden sich Einträge wie:

kernel: <3<3<3<3<3<3<3<<<<<<<<<<<<<<3<3<3<3<


Nach jahrelangem Dauerbetrieb ohne Fehler, tritt ein solcher Kernelfehler erstmalig auf.
Hattet Ihr das auch schon - ich vermute, dass der Kernel evtl. gcc Fehler hat, wie in einigen Listen geschrieben wurde, oder …

Ich nutze die Kernel Version 3.13.0-117-generic.

Nach einem forced shutdown und einem Neustart funktioniert der Server scheinbar wieder. Die Anzeige der Konsole unter XenCenter ist weiterhin nicht nutzbar.

VG
Christian

Hallo Christian,

heute ist der Server im laufenden Betrieb (virtualisiert unter xen)
„eingefroren“, es waren kein Aktionen mehr möglich (Anmeldung am Server,
ping etc.). Unter XenCenter konnte man sehen, dass die VM nicht mehr via
Console ansteuerbar war - auch wenn Regelbetrieb angezeigt wurde.
Im syslog finden sich Einträge wie:
|
kernel: <3<3<3<3<3<3<3<<<<<<<<<<<<<<3<3<3<3<

|
Nach jahrelangem Dauerbetrieb ohne Fehler, tritt ein solcher
Kernelfehler erstmalig auf.
Hattet Ihr das auch schon - ich vernmute, dass der Kernel evtl. gcc
Fehler hat, wie in einigen Listen geschrieben wurde, oder …

lief er nach einem reboot wieder?

Normalerweise, wenn so was „seit Jahren“ funktioniert, dann gibt es da
nur zwei Mögliche Ursachen:

  1. update (von VM oder Host)
  2. Hardwarefehler.

Ich würde auf Speicher tippen 80%, dann auf Festplatten 20 %

LG

Holger

Das Netzteil / die Netzteile nicht vergessen. Sie altern mit der Zeit und irgendwann können Sie die Spannungen nicht mehr auf dem erforderlichen Niveau halten. Das ergibt durchaus dieses Fehlerbild: Zunächst seltene Abstürze, die immer häufiger erfolgen.

Das sollen kleine Scheren sein. Du sollst alles, was von diesen Scheren eingerahmt ist, in die Mailingliste deiner Wahl kopieren.

Ich glaube, dass ergibt keinen Sinn. Der gcc ist der Compiler mit dem üblicherweise unter Linux übersetzt wird. Er hat auch Fehler (so wie jeder andere Compiler auch). Das du von den Fehlern aber etwas bemerkst ist eher unwahrscheinlich, wenn du einen Standart-Distributionskernel benutzt und den Kernel nicht selbst übersetzt.

Gruß
Frithjof

Hallo Holger!

Ich kann mich nicht erinnern, dass Speicher bei mir jemals gestorben ist. Hast du das mal beobachtet?

Gruß
Frithjof

Hallo Frithjof,

Ich kann mich nicht erinnern, dass Speicher bei mir jemals gestorben
ist. Hast du das mal beobachtet?

ja: mehrfach.
Nicht so oft in Servern, aber schon oft in Clients.

Aber du hast natürlich Recht: das Netzteil ist auch immer ein Kandidat.
Deswegen tausche ich sie spätestens alle 3 Jahre bei den „nicht
Serverhardware“ Servern die ich habe.

LG

Holger

Hallo, lieber Frithjof,

ja, unser gesponsorte Server hatte Memory-Probleme, die plötzlich auftraten und durch Herausnehmen der fehlerhaften Module verschwanden. Wir haben ECC-RAM, also konnten wir mit dem Befehl:

edac-util -v

den Fehler einkreisen.
Auch bei uns gab’s kernel-panics.

L.G.
Christoph