Hallo,
heute morgen ist unser Proxmox offenbar bei dem Versuch abgeschmiert, ein Backup der linuxmuster-vm (6.2) auf einem NAS zu erstellen, auf dem nicht mehr ausreichend Platz vorhanden war. Normalerweise bricht das Backup dann ab, diesmal aber waren die VMs nicht mehr zu erreichen (was vor allem wegen dem fehlenden ldap ein Problem wurde, weil bei Moodle und Nextcloud nichts mehr ging…).
Auch die Weboberfläche von Proxmox war nicht mehr zu erreichen, auf der Konsole am Rechner konnte ich mich aber noch einloggen und den shutdown einleiten. Den habe ich dann aber nach 20 Minuten mit der Aus-Taste am Server hart beendet, weil es nicht mehr voran ging (7 Prozesse warteten ohne timeout auf Beendigung).
Proxmox fuhr danach wieder problemlos hoch, die Firewall und eine weitere VM starteten ebenfalls problemlos, nur der linuxmuster-server blieb bei „Starting System V initialisation compatibility“ hängen. Manchmal auch bei „Starting configure network device“.
Das syslog meldete Dateisystem-Fehler (die sich beheben ließen), die Swap-Partition ließ sich offenbar nicht schnell genug einbinden (ließ sich nicht beheben) und er bemängelte das fehlende Verzeichnis /run/rpcbind. Außerdem bemängelte ntpdate einen „failure in name resolution“.
Nach ein paar Stunden erfolgloser Fehlersuche habe ich das Backup von voriger Woche eingespielt. Aber das startete auch nicht, zwar keine Dateisystemfehler, die Swap-Partition arbeitet offenbar auch ohne Probleme, aber der Serverboot bleibt bei „Mount network filesystems“ stehen.
Wenn ich dann nach einiger Zeit (> 15 min) den Bootvorgang mit Strg-Alt-Entf abbreche und im recovery mode starte, steht im boot.log nach „Starting emergency keypress handling“ noch „error: ‚quota‘ exited outside the expected code flow.“ Im Flow war ich da schon lange nicht mehr.
Der recovery-mode von ubuntu hat mir dann aber doch noch weitergeholfen: Ich konnte auf der root-Konsole nämlich die Partitionen mounten, das Netzwerk aktivieren und den slapd starten. Sogar ssh tut. Damit läuft Moodle Gott sei Dank wieder, das wird bei uns nämlich kräftig genutzt, habe extra einen eigenen DB-Server drangehängt, damit flutscht die Sache so richtig!
Aber in der Schule geht weiter nix mehr, und das würde ich (auch wenn das Schulhaus natürlich ziemlich leer ist - bis auf den Elektriker, der die Zeit nutzt und neue APs verkabelt!) gerne ändern.
Hat jemand einen Tipp, an was der mangelnde Start hängen könnte? Wie gesagt, die logs geben dazu leider nichts her.
Grüße,
Stefan