Linbo kann Windows manchmal erst beim 4. Anlauf laden, Failed to mount cache partition /dev/nvme0n1p2

Hallo zusammen,

wir haben ein Problem, dass wir nicht gepackt bekommen. In einem Raum gibt es bestimmte Clients, die sich immer wieder mal nicht ins Windows booten lassen. Linbo liefert folgende Fehlermeldung:

Die letzten Meldungen vor dem Absturz waren:
 
[StdOut] Unable to mount /cache.
 
[StdErr] Failed to mount cache partition /dev/nvme0n1p2!
 
[StdOut] Mounting cache partition /dev/nvme0n1p2 ...
 
[StdOut] No kernel auto on partition /dev/vme0n1p3. Using "auto".
 
[Info] Executing: linbo_cmd start /dev/nvme0n1p3 /dev/nvme0n1p3 auto /dev/nvme0n1p4
 
[Info] Linbo state changed to: 4
 
[+++ Chapter +++] Starting Windows 10

Das verrückte an der Sache ist, dass

  • andere Clients mit exakt gleicher Hardware und Config das Problem nicht haben
  • die Rechner immer genau nach dem 3. Neustart brav ihr Windows laden

Es handelt sich um HP-Mini-PCs mit NVME-Festplatte und einem erprobten Windows-10-Image. Linbo ist in der Version 4.2.14.

Der Ruhezustand im Windows (Hibernate) ist ausgeschaltet.

Hat jemand eine Idee, was hier das Problem sein könnte?

Grüße

Lars

Fehlt da nicht ein n bei der Partition??

Richtig, aber das hat’s beim Erstellen des Beitrags geschluckt, im System ist das natürlich drin. Sorry.

Hallo Lars,

… sowas passiert, wenn Schüler mal „lustig“ sind: dann wird nämlich im laufenden Betrieb der Stromstecker des Rechners vom Hinterman gezogen … haha, ich schmeiß mich weg…
So einen harten Abschuss mag Windows nciht und es bewirkt auch das selbe, wie ein Hibernate: nämlich dass windows die ntfs Partition nicht als „sauber“ markiert hat, was es immer nur macht, wenn es ordentlich heruntergefahren wird (wenn das „hybride Herunterfahren“ deaktiviert ist).
Deswegen lasse ich Windows bei jedem start mit „neu und start“ frisch schreiben: dann ist es nämlich egal, ob Jemand lustig war, oder ein ganz schauer KOllege sagt: „nein ihr müßt die Rechner nicht herunterfahren, ich mach die hier vorne mit dem Schalter aus …“ (alles schon erlebt)

Also: wie startest du die Rechner den normalerweise?
Wie werden die vier Anläufe den gemacht?
Sehe ich das richtig, dass im Raum ab und zu einzelne das Verhalten Zeigen, oder sind da alle andauernd betroffen?

LG

Holger

Hallo Holger,

solche Schüler gibt es bei uns an der Schule nicht, unsere sind alle gut erzogen. Wir haben auch nie vertauschte Tasten auf den Keyboards oder auf den Kopf gestellte Anzeigen. Haha.

Also im Ernst: danke, das ist natürlich eine mögliche Erklärung. Es sind einzelne Rechner im Raum und meistens dieselben, weshalb wir auch zuerst die Hardware im Verdacht hatten, aber es können natürlich auch immer dieselben Kandidaten sein, die den Stecker ziehen oder den Rechner sonstwie ungesund abschießen.

Zum Ablauf: Die Rechner werden normalerweise vom Schüler über den Einschaltknopf gestartet, laden per Netzwerk und dann per Linbo automatisch das Windows. Abends werden alle Rechner per GPO heruntergefahren (natürlich falls sie nicht schon vorher ausgeschaltet wurden). Das Abschalten des Stroms haben wir mehrfach strengstens untersagt und das wird meines Wissens auch nicht (mehr) gemacht. Aber was weiß ich schon…

Die beschrieben Neustarts mache ich aus der Linbo-Fehlermaske heraus über den runden Pfeil. Und immer beim 3. Neustart kommt er ohne Probleme.

Bei jedem Start „neu und start“ haben wir bisher aus Zeitgründen nicht gemacht, es geht ja wertvolle Unterrichtszeit verloren. Wie ist das bei euch, stört das da niemand oder fährst du alle Rechner evtl. schon vor Unterrichtsbeginn hoch?

Liebe Grüße

Lars

Gerade mal getestet im betroffenen Raum: Zwei Rechner mehrfach hart per Stromaus abgeschossen - und sie fahren problemlos hoch. Darunter ein Rechner, der heute morgen Probleme gemacht hat. Ich verstehe es nicht…

Hallo Lars,

der „neu und start“ wird bei uns per cron vom server aus gemacht um 7:30 Uhr MOrgens an Schultagen (dazu haben wir das schultagscript von jesko, das entscheidet, ob Schultag ich, oder nicht).
Das funktioneirt seit über 10 Jahren ohne Probleme.
Unterrrichtszeit geht da nciht verloren.

Generell halte ich es für eien schlechte Idee, User den startvorgang beeinflussen zu lassen. Deswegen startet bei mir direkt nach dem BIOS das pxelinux und gibt einem satte 3 Sekunden Zeit um was aus zu wählen (in aller Regel zu schnell für die Schüler*innen :slight_smile: ). Bei mir wird dann linbo lokal geladen und die Möhre gesynct (Interaktion weder nötig noch möglich).
Du könntest das auch so einstellen, nur dass er da direkt das windows startet: dann dauert es noch weniger lang.

Wie sieht den so ein mislungener Start genau aus?
Kannst du mal einen betroffenen nach dem ersten Fehlstart gleich mit neu+start bearbeiten? Klappt das dann sofort?

Eigentlich setzt linbo vor dem starten des lokalen windows ja das „cleanbit“ des NTFS Dateisystems … aber wer weiß, ob nicht vielleicht doch was beschädigt war.

Wie bootet ihr den? UEFI? BIOS (Legacy)?

LG
Holger

Hallo Holger,

ich nehme das mal als Anregung mit ins Team, vielleicht sollten wir das mit dem Cronjob auch so machen. Bei uns haben die Schüler nach dem Anschalten 5 Sekunden, was für die meisten auch zu schnell ist :wink:

Bei einem misslungenen Start kann ich eigentlich nur neu starten oder herunterfahren, neu+start fabriziert sofort dieselbe Fehlermeldung. Der Fehler taucht sofort auf, nachdem der Countdown für den Start abgelaufen ist und Windows gestartet werden soll.

Und wir haben recht neue PCs, müssen also auf UEFI booten.

LG

Lars

Hallo Lars,

linbo schafft es also nicht windows zu starten un dbleibt in der GUI?
Kannst du mal ein screenshot der Meldung, die dann kommt posten? Vielelicht auch die logdatei vom Server.
Sollte heir ungefähr liegen:
/var/log/linbo/rechnernamen_?.log

LG
Holger

Screenshot anbei, den Log kann ich morgen liefern, wobei ich da schon reingeschaut hatte und keine Fehler gesehen habe.

Hallo,

schick doch mal die
/srv/linbo/start.conf.GRUPPE
der betroffenen Hardwareklasse.

LG

Holger