Lmn 7.2 testing

Hallo zusammen, ich hab das schon kurz erwähnte Bootproblem noch einmal untersucht. Seit dem Update auf 7.2 gelange ich bei 6.2er-Clients oder bei neuen Clients (also mit leerer NVME-Platte) weder per PXE noch per Stick zu Linbo.

Stattdessen erhalte ich als Dauerschleife:

Es kommt offenbar keine Netzwerkverbindung zustande. Das war bisher (wir haben zig von diesen T470s eingerichtet) nie ein Problem. Wenn ich per Stick / Debug händisch init.sh aufrufen (das war die Notlösung, wenn keine Netzwerkverbindung zustande kam, z.B. bei USB-LAN-Karten) kommt nun:

Was kann das sein?

Viele Grüße
Thomas

Hallo Thomas,

es gibt auch bei Ex-LMN6-Clients Problemen mit SSD, die nun in LMN7 eingebunden werden sollen.
Vielleicht ist Dein Problem damit verwandt.

Ich habe das so gelöst, dass ich die Festplatte einmal plattgemacht habe. Z.B. mittels

  • Gparted-Live und dann neue Partitiontabelle erstellt
  • wenn auf dem Client noch ein altes Linux war mit „sudo shred /dev/sda -f -v -n 1“
  • ausgebaute Festplatten per USB angeschlossen und schnellformtiert

Viel Glück!

Stefan

Hallo Thomas,

ich hab das schon kurz erwähnte Bootproblem noch einmal untersucht. Seit
dem Update auf 7.2 gelange ich bei 6.2er-Clients oder bei neuen Clients
(also mit leerer NVME-Platte) weder per PXE noch per Stick zu Linbo.
Stattdessen erhalte ich als Dauerschleife:

… verstehe ich nicht.
Das mußt du genauer erklären.
Was sind den „6.2er Clients“? Welche mit linbo 4.0 die du zum ersten mal
an einer lmn7.2 per PXE bootest?

linbo1
https://ask.linuxmuster.net/uploads/default/original/2X/e/e0fa1d64081c3abf547a62394aebe61651b58c5e.jpeg

Es kommt offenbar keine Netzwerkverbindung zustande. Das war bisher (wir
haben zig von diesen T470s eingerichtet) nie ein Problem.

hier sagst du, es war nie ein Problem,

Wenn ich per
Stick / Debug händisch init.sh aufrufen (das war die Notlösung, wenn
keine Netzwerkverbindung zustande kam, z.B. bei USB-LAN-Karten) kommt nun:

hier sagst du, dass ihr eine Notlösung für wenn keine Netzwerkverbindung
zustande kam hattet… ich bin verwirrt :slight_smile:

Beschreib mal genauer, was für Clients welche Probleme haben und wo sie
angeschlossen sind (egal wo im Netzwerk? Bisher nur an einem Switch
probiert?).
Sind jetzt alle Clients betroffen oder nur einzelne Hardwareklassen?
Andere gehen?

Und auch das „kurz erwähnte Bootproblem“ … welcher Boot: sie kommen
nicht in die linbo GUI?
Oder klappt das booten eines OS aus linbo heraus nciht? Welches OS?

LG

Holger

Hallo Stefan,

das habe ich natürlich auch probiert - aber auch komplett leer kommt die dargestellte Fehlermeldung. Und das habe ich vor der 7.2 nie irgendwo gesehen.

Viele Grüße
Thomas

Hallo Stefan,

es gibt auch bei Ex-LMN6-Clients Problemen mit SSD, die nun in LMN7
eingebunden werden sollen.
Vielleicht ist Dein Problem damit verwandt.

… ah: das hab ich überlesen … 6.2 … klar: ist viel zu alt.
linbo 4.1 benötigt ein vorher auf dem Client laufendes linbo 4.0.44 um
einfach rüber zu kommen. (natürlich gehen „leere“ Clients auch direkt:
das mit linbo 4.0.44 gilt nur für vorher linboisierte Clients).

Hatte man kein linbo 4.0.44 drauf sondern ein älteres geht es in eine
Schleife (aber nicht die auf Thomas Screenshot): dann muss man den
Client noch einmal neustarten, dann geht er durch (deswegen denke ich,
dass es bei Thomas was anderes ist).

LG

Holger

Hallo Holger,

Genau - wir haben die 6.2 im Schulnetz und haben parallel (eigene VLANs/eigene Server) die 7.1 bzw. jetzt 7.2 aufgebaut (nicht migriert, komplett neu). Schüler-Endgeräte, Webdienste und das WLAN laufen schon an der 7.1, die PCs im LAN aber noch an der 6.2 (das geht nicht anders, da wir erst seit kurzem einen Ersatz für pykota in Aussicht haben).

In den Sommerferien wollen wir nun die restlichen Rechner umziehen und dafür habe ich schon unter der 7.1 einige der PCs testweise umgezogen, was kein Problem war. Unter der 7.2 gelingt mir das nun nicht mehr, sondern produziert die abgebildete Meldung in Dauerschleife, wenn ich per PXE oder LINBO-Stick boote.

Genau. Es gab vor der 7.2 nie Netzwerkprobleme bei diesen Clients, keine derartigen Meldungen. Ich habe sowohl Notebooks wie Tarox-Clients von 6.2 in 7.1 registriert und konnte normal booten und Linbo bedienen. Seit dem Update auf 7.2 gelingt das nun nicht mehr.

Es gibt immer mal (habe ich hier gepostet, versandete dann aber) die Situation, dass Notebooks (Schüler-Endgeräte) mit USB-LAN-Adaptern keine IP bekommen. Und da hilft dann als „Workaround“ das Booten vom Linbo-Stick im DEBUG-Modus und manuelles (erneutes) Ausführen von init.sh - dann bekommen die Geräte eine IP. Also habe ich das hier auch probiert, funktioniert aber nicht (mehr).

Wir haben durchgängig Unifi-Netzwerkhardware, STP ist ausgeschaltet. Einmal ein Lenovo T470s, einmal ein Tarox-NUC. Zwei verschiedene Switche. Weitere Geräte habe ich noch nicht probiert, aber das sind die beiden häufigsten Geräte im Haus (und bisher völlig unauffälig).

Wir pflegen das Image derzeit in einer Proxmox-VM, da funktionierte bisher alles soweit. Die betroffenen Geräte sind aus zwei unterschiedlichen EFI-Hardwareklassen, was sie von den virtuellen Rechnern unterscheidet, ist der NVME-Speicher.

Ja, ich hatte das im inzwischen ausgelagerten Thread zur 7.2 erwähnt: statt der Linbo-GUI kommt eben der auf den Bildern abgebildete Fehler in Dauerschleife. Das ist ja das, was mich wundert (und was ich vorher nie so hatte). Dass selbst bei PXE-Boot der Rechner es nicht bis zur GUI schafft, aber auch nicht einfriert (das konnte man ggf. mit Boot-Parametern beheben) und auch nicht ohne GUI verharrt (so dass man wenigstens per SSH drauf kommt).

Jetzt etwas klarer? :slight_smile:

Viele Grüße
Thomas

Hallo Thomas,

OK…
nach dem upgrade auf 7.2 wurde ein
linuxmuster-import-devices
gemacht, nehme ich an …

versuch mal folgendes.

  1. kopier deine start.conf.GRUPPE weg
  2. kopier eine start.conf.irgendwas aus /srv/linbo/examples/ nach
    /srv/linbo/start.conf.GRUPPE
  3. pass die neue start.conf mit deinen Werten (aus der alten) an
  4. linuxmuster-import-devices
  5. Cleint der GRUPPE starten.

Die Bootschleife, die bei mir kam, sah anders aus.
Hast du mal versucht, ob der Cleint nach einem reset (aus und wieder
einschalten) wieder geht?

LG

Holger

Hallo Holger,

Ich arbeite ja parallel auch an einem neuen Versuch, ein Image für die Domäne zu erstellen. Ich nehme die also noch einmal ganz aus der devices.csv raus, registriere sie neu, erstelle wie von Dir vorgeschlagen noch einmal eine „frische“ start.conf - und dann schaue ich, was passiert.

Wenn die Clients noch etwas auf der Platte hatten, haben sie normal gebootet - Linbo hat da offensichtlich nichts verändert (hätte mich auch gewundert, das ist ja nicht weit gekommen).
Ansonsten war es egal, ob ich den Rechner ganz ausgeschaltet/stromlos gemacht habe oder einen Neustart - der PXE-Boot begann immer und dann kam es auch immer zur gleichen Fehlerschleife (bzw. beim Booten vom USB-Stick zur anderen abgebildeten Fehlermeldung).

Viele Grüße
Thomas

Hallo.
Nur ganz kurz:
Spricht etwas dagegen, den v7.2 Server als Produktivsystem zu übernehmen, wenn man geprüft hat, ob LINBO mit den verwendeten Clients klar kommt?
Bisher gibt’s in der Testumgebung wenig Probleme und ich würde den Server vor der Versetzung zum neuen Schuljahr am liebsten direkt komplett übernehmen. Bei uns geht der Sprung dann allerdings direkt von v7.0 auf v7.2.
Kann es da noch an anderer Stelle zu Überraschungen kommen?

Der Schritt von der Beta zum RC ist vermutlich nicht mehr weit – wie schätzt ihr das ein?
Viele Grüße,
Michael

Hallo Michael,

Spricht etwas dagegen, den v7.2 Server als Produktivsystem zu
übernehmen, wenn man geprüft hat, ob LINBO mit den verwendeten Clients
klar kommt?

ich, und wenigstens 3 andere, setzen die 7.2 schon seit längerem
produktiv ein.
Ich glaube, das Problem mit dem Klassenarbeitsmodus ist das einzige was
wirklich auffällt.

Bisher gibt’s in der Testumgebung wenig Probleme und ich würde den
Server vor der Versetzung zum neuen Schuljahr am liebsten direkt
komplett übernehmen. Bei uns geht der Sprung dann allerdings direkt von
v7.0 auf v7.2.
Kann es da noch an anderer Stelle zu Überraschungen kommen?

Die migration des linbo auf den Clients direkt von linbo 2.x auf linbo
4.1 könnte probleme machen.
Außerdem ist die 7.1 dazu vorgesehen um den Übergang von cloop zu qcow2
zu gestelaten.
Das dort laufende linbo 4.0 kann die alten cloop Dateien noch schreiben,
aber nicht mehr selber erstellen. Damit konnte man zug um Zug umsteigen
auf qcow2.
Das geht aber natürlich nicht, wenn du von 7.0 über 7.1 ohne Stopp
weiter auf 7.2 updatest…

LG

Holger

Hallo Holger,
alles klar. Wenn ich in den Computerräumen booten kann, könnte ich da aber eh gleichzeitig (endlich) von Bionic auf Jammy wechseln. Dann käme das neue Image direkt im aktuellen qcow-Format und vom aktuellen LINBO.
Ich muss noch ein Notebook (Lenovo Yoga 12) ausprobieren, ob das auch direkt in der Testumgebung bootet. Auch da könnten die Images dann komplett drüberher gebügelt werden, wenn ich das richtig sehe.

Ach so … vielleicht noch zur Erklärung: In der Testumgebung habe ich den Sprung von v7.0 → v7.1 → v7.2 natürlich so gemacht wie vorgesehen. Produktiv reichte die Zeit bisher nicht.

Viele Grüße,
Michael

Hallo Holger,

Als gemeldete Probleme für die Webui habe ich folgende gefunden :

Bei mir funktioniert es, vielleicht hatte ich es schon korrigiert.
Da bei mir es jetzt ruhiger wird, kann ich wieder an die Webui besser arbeiten, und deswegen schiebe ich eine neue Version. Bitte dann testen und falls es nicht besser funktioniert, bitte einen neuen Thread beschreiben, wie du auf dem Fehler kommst :slight_smile:

Gruß

Arnaud

Hallo zusammen,

Neue Version linuxmuster-webui7 (7.2.16):

  • Add ldap connector and ldap reader to speed up requests
  • Convert less to scss for Ajenti 3
  • Upgrade to Ajenti 2.2.6
  • Upgrade cryptography modules
  • [groupmembership] Add length for projects
  • [groupmembership] Possiblity to refresh kerberos ticket on change
  • [linbo] Fix problem with empty config file
  • [linbo] Add support for differential images
  • [linbo] Fix torrent restart
  • [smbclient] Delete directory recursively
  • [session] Fix exam mode for new user
  • [session_new] Many work to improve the new module
  • [setup] Do not load gpos when install is not done
  • [users] Show and edit comment for bind users
  • [webdav] Replace file on put
  • [webdav] Delete directory recursively
  • [webdav] Display QR code for mobile app

Gruß

Arnaud

Den Fehler hatte ich schon gefixt, ich schaue mal ob der PR durchgegangen ist.

Hallo zusammen,

ich habe es jetzt noch einmal neu versucht.

  • Datei aus examples genommen, auf die entsprechende NVME-HWK kopiert und die Einträge auf NVME angepasst.
  • Auf dem Rechner die Festplatte mit gdisk/o neu geschrieben geleert.
  • Per PXE gebootet
  • Boot gelingt zunächst, linbo64/linbofs64 werden herunter geladen.
  • Hardware-Initialisierung und Module ohne Fehlermeldung

Dann kommt „Welcome to Linbo“ und dort steht:
Console boot menue of group (sollte da nicht eigentlich der korrekte Gruppenname stehen?)
/linbo.sh: source: line65: can't open '/conf/os.*': No such file or directory
Not splitting minimal start.conf.

Und das wiederholt sich dann (auch stundenlang).

Per Stick das Gleiche, nur ohne Loop. Was ich dort noch sehen konnte: IP wurde korrekt vergeben. Ich komme vom Server per SSH zu Linbo.

Damit ist Linbo im Moment nicht mehr nutzbar für uns.

Viele Grüße
Thomas

Das Problem hängt sicher an anderer Stelle nochmal. Was hier schief läuft ist das Bauen des Boot menus. Ich mache morgen einen PR fertig, dann kann thomas das einbauen.

Ich gehe mal davon aus, der Client bekommt keine IP adresse, zieht sich deswegen die Start.conf nicht und hängt deswegen in dem Loop.

Kann man aber erst sauber eingrenzen sobald der Fehler behoben ist. Ich bin da auch schon reingelaufen und hatte das gefixt.

Hallo Till - das mit der IP war ja auch meine Vermutung, aber nachdem ich vom LINBO-Stick gebootet habe, konnte ich (ohne Schleife) nachschauen.

Nachdem die Fehlermeldung erscheint, hat der Client die korrekte IP (und ist ja vom Server auch erreichbar). Also ist es wenn überhaupt vielleicht ein Timing-Problem, dass also das Nachladen kurz vor der IP-Zuteilung versucht wird…

Sobald etwas da ist, teste ich das gerne.

Viele Grüße
Thomas

Hallo Thomas,

versuch doch mal ein
dhcpretry=10

… vielleicht hilft das.
Ich meine linbo 4.1 braucht ein klein wenig länger für den dhcp request…

LG

Holger

Hallo Holger,

ich denke nicht, dass es damit zu tun hat - ich habe (gleich als Erstes) Werte bis 20 ausprobiert. Keine Veränderung.

Viele Grüße
Thomas

Moin!

Wurde das versucht, was ich im ersten Beitrag oben unter „Behandlung widerspenstiger Linbo-Clients“ geschrieben habe?

VG, Thomas (wieder aus dem Urlaub zurück)