Hetzner-Server hängt sich auf

Hallo zusammen,

an und für sich tut der Mietserver, was er soll und ist auch für die Größe unserer Schule gut dimensioniert. Aber in unregelmäßigen Abständen bleibt er stehen oder hängt sich auf. Es kann sich dann niemand mehr anmelden und dementsprechend ist er auch über ssh nicht mehr erreichbar. Was hilft, ist ein „Automatischer Reset“ über die Hetzner-Robot-Seite, also ein Reboot. Danach kann es sein, dass er wieder wochenlang ohne Probleme funktioniert.
Ein „bbb-conf --check“ zeigt als Version „BigBlueButton Server 2.2.31“ mit einem funktionstüchtigem „stun:turn.linuxmuster.net“ und keinen „Potential problems described below“. Speicherplatz gibt es in Hülle und Fülle. Die Hardware habe ich mal vom Hetzner-Support 15 Stunden lang testen lassen. Ergebnis: alles OK
Hat jemand etwas Ähnliches beobachtet oder hat einen Tipp?

Viele Grüße

Wilfried

Hi Wilfried,
ist die darunterliegende Hardware Serverhardware oder Desktop-Hardware? Bei letzterem kann es nach nem Monat schonmal zu einem kippenden Bit kommen. Bei den Desktops oder Laptops, die bei mir immer mal wieder nen Monat laufen, kommt das schon ab und an vor, dass etwas einfriert.
Wenn Du Desktop-Hardware hast, könntest Du den Komm-One-Trick anwenden: Nächtlicher Reboot.

LG
Max

Hallo Max,

das sollte schon Serverhardware sein. Das mit dem nächtlichen reboot hatte ich auch schon erwogen, aber ein Ausfall erfolgte sehr kurz nach einem reboot.
Die log-Dateien geben auch nichts her. Vielleicht richtet es ein kommendes Update.

Viele Grüße

Wilfried

im Notfall den Server kündigen zum Monatsende und gegen einen neuen austauschen. Einrichtung ist ja im Prinzip kein Problem und in zwei Stunden per Skript durch. Ich hatte dieses Problem bei unseren beiden Servern bisher nicht beobachten können.

Was sagt den der KErnel.log?
(Hatte ma den Freeze aufgrund von inkompatiblenn Kernel zum fehlerkorrigierenden RAM, in der KErnel Log wurde ich dann fündig)

Das will ich ungerne so stehenlassen, einige unserer Server laufen mit popeliger Desktophardware monatenlang ohne Reboot, ich wuerde auch Linux nicht vergleichen mit z.B. dem ranzigen iOS von den Appletablets (das meiner Frau braucht auch regelmaessig reboots) oder Windows 10 (meine Soehne loesen auch Probleme durch Reboot).
Diese Probleme sind ziemlich sicher nicht durch „kippende“ Bits aufgrund Desktophardware zurueckzufuehren, das halte ich fuer einen Mythos, das sind Probleme die durch mieses Energiemanagment (Suspend to RAM, Caching usw. usf. ) befeuert werden.

Was sagt denn mdadm (falls Software-RAID)?
cat /proc/mdstat

Gruss Harry

Hallo Wilfried,
auch ich habe genau die gleichen Probleme mit meinem externen BBB bei hetzner, so wie du oben schreibst.
Holger hatte vermutet, dass es ein Hardwaredefekt sein könnte, worauf ich auch den 24 Check bei hetzner machen habe lassen, mit genau dem gleichen Ergebnis wie bei dir, sie haben nichts gefunden. Holger meinte dann, man müsse bei denen hartnäckig bleiben, dann würden sie die Hardware austauschen.
Ich bin mittlerweile so weit, dass mir hetzner das mit zwei Optionen angeboten hat. Super Service übrigens.
Allerdings lassen wir es jetzt so wie es ist, denn ich vermute keinen Hardwarefehler sondern was mit der Software. Jetzt läuft er schon seit fast einem Monat stabil und wir starten halt neu, wenn er wieder abstürzt.
Gruß
Uli

Hallo,

sieht unauffällig aus, bis zum Ausstieg im Wesentlichen nur Firewallmeldungen.
Ebenso unauffällig ist die Ausgabe von cat /proc/mdstat.

Ich lasse den Server jetzt trotzdem mal jede Nacht rebooten, Schaden kann es ja nicht.

Den guten Support kann ich bestätigen: Mir haben sie schon beim ersten Mal angeboten entweder den Server zu tauschen und dabei die Festplatten mitzunehmen oder, wenn auch das nichts nützt, einen komplett anderen Server zur Verfügung zu stellen.
Wenn’ s das nächste Mal passiert, werde ich wohl (in den Ferien) diesen Weg gehen. Sollte es letztendlich der komplette Austausch sein, werde ich dann versuchen evtl. die vorhandenen Daten von greenlight mitzunehmen.

Viele Grüße und vielen Dank fürs Mitdenken

Wilfried

Nachtrag:
Was die Datenmigration angeht, so scheint das nicht so einfach zu sein:

https://it-kosmopolit.de/migration-einer-bigbluebutton-instanz/

Hallo Wilfried,

einer meiner drei BBB Server hatte genau das gleiche Fehlerbild. Alle paar Wochen (4 oder 5) blieb er einfach stehen. Nichts in den Logs … reboot hat ihn zum Leben erweckt.
Das ahb ich mir ein paar Monate angeschaut und dann mit dem hetzner support gesprochen und vereinbart die Festplatten in einen neuen Server ein zu bauen (gleiche Hardware, auch gebraucht).
Das haben die in einem von mir gewählten Zeitfenster gemacht (nach 23 Uhr). Dann haben sie die MAC der Netzwerkkarte noch angepaßt: fertig.
Von mir aus überhaupt nicht zu bemerken, dass das auf neuer Hardware läuft.: ich mußte NICHTS machen: der server war einfach wieder da und läuft seit dem durch ohne Probleme.
Es waren also nciht die Festplatten, sondern was anderes. Mir egal.
Ich empfehle: mach das auch so.
Ist das Problem danach nicht weg, dann waren es wohl die Festplatten: aber ich glaube nicht, dass es so sein wird.

LG

Holger

Hallo Holger,

vielen Dank für deine Ausführungen. Das werde ich in den Osterferien machen.

Viele Grüße

Wilfried