Neue Clienten haben in Linbo keine HDD und keine Gruppe

Liebe Liste!

Ich könnte ein paar zusätzliche Augen und Gedanken gebrauchen: Wir haben einen Satz schöne neue Notebooks. Sie sind in der workstations aufgenommen und booten linbo. Alle Geräte sind in der Gruppe ubuntu1604. Linbo zeigt keine Gruppe an und auch keine HDD. Während des PXE prozess oder kurz danach sehe ich jedoch die Meldung “Hole xxx für Gruppe ubuntu1604”

Hier exemplarisch eine Zeile aus der Workstations. Darunter eine Zeile, die funktioniert:

r998;r998pc01;ubuntu1604;28:D2:44:19:9E:8E;10.24.1.1;255.240.0.0;1;1;1;1;1;
r210;r210pc01;ubuntu1604;F0:92:1C:EF:55:A0;10.17.210.1;255.240.0.0;1;1;1;1;1;

Ich weiß, dass die Netzmaske unnötig ist, wir hatten mal Probleme ohne und deshalb schleppen wir diese Altlast bis LM7 mit.

Subnets sind keine konfiguriert. (/etc/linuxmuster/subnets ist leer - bis auf Kommentarzeichen)

Linbo ist in der Version

 ii  linuxmuster-linbo                      2.3.31-0 

installiert.

Switch und Netzwerkkabel habe ich gegen “known-good” getauscht: Hier liegt der Fehler nicht.

Die Clients bekommen eine IP, über linbo-ssh kann ich auf die Geräte zugreifen: Sie finden die Festplatte. Die /start.conf ist jedoch leer. Ersetze ich die leere /start.conf durch die korrekte vom Server, lässt das Gerät auch via ssh partitionieren und formatieren. Nach einem Neustart ist jedoch wieder alles beim alten: die /start.conf ist leer.

Da die Geräte ihre Festplatte erkennen, vermute ich den Fehler in der workstations-Datei. Aber ich sehe ihn nicht.
Hat jemand Ideen?
Gruß
Frithjof

Hi.
Bei uns sieht eine typische Zeile so aus:

raum1;raum1-pc01;xenial;50:46:5E:B&:AE:E3;10.20.100.1;;;;;;1

Nur so eine Vermutung: Hast du es schon mal mit einem Trennzeichen wie “-” für den Gruppennamen versucht?

Schöne Grüße,
Michael

Ich hatte genau dies zuvor, also r998-pc01. Da hat es nicht funktioniert. Weil wir es sonst nicht verwenden, habe ich es entfernt.

PS: Interessant: Hast du tatsächlich ein & in der Mac-Adresse?

Hoppla, ich habe nur die MAC Adresse etwas geändert, bevor ich die hier gepostet habe. Da muss Shift im Weg gewesen sein :slight_smile:

Hallo, Frithjof,

zwei Ideen:

  1. Habt Ihr die workstations mal mit einem windows-Editor angefasst (hinterlässt ab und zu merkwürdige Zeichen), oder

  2. Ist vielleicht der Aufnahmeprozess in die workstations nicht sauber durchgelaufen ?

-> Alle Rechner nochmal rausschmeißen, mit “#” vor den Zeilen ->import_workstations.
-> Einen Rechner wieder reinholen ->import_workstations MELDUNGEN BEOBACHTEN !

Dann EINEN Rechner (aus der Gruppe) nochmal aufnehmen.
Versuchsweise die Raumbezeichnung ändern.

Gruß,
Christoph Gü.

Stimmt – da war doch neulich was …

Hallo Frithjof,

vielleicht hat die start.conf auf dem Server nicht die richtigen Zugriffsrechte.

Sie sollte lesbar für alle sein: -rw-r--r--

Viele Grüße

Andreas

  1. Nein.
  2. Ich habe es gerade nochmal angeschaut: Der Prozess läuft sauber durch.
    Ich habe mich gegen das komplette Entfernen aller Rechner entschieden, weil ich unser Produktivsystem nicht unnötigen Risiken aussetzen will. Oder gibt es einschlägige Erfahrungen, dass diese Prozedur etwas anderes auslöst als „mehr Übersicht“?

Die Symlinks (start.conf-10.24.1.1) sind alle 777, die verlinkte Datei (start.conf.ubuntu1604) ist 644. Das ist also korrekt.

Ich versuche gerade nachzuvollziehen, wie der Linbo boot Prozess via Netzwerk überhaupt aussieht. Dann könnte ich mir vielleicht den Teil, der die Gruppenkonfiguration holt genauer ansehen.
Ich verstehe momentan den Bootprozess so:

  1. Bios macht PXE und erhält ein iPXE image
  2. iPXE macht http requests auf http://10.16.1.1/linbo und holt unter anderem ein grub
  3. iPXE started grub
  4. grub startet linbo. Die grub konfig bekommt grub wie? vom ipxe?
  5. linbo wird entweder via Netzwerk (wieder iPXE?) oder lokal von Platte gestartet.
  6. linbo hat die start.conf in der cache partition oder ?lädt sie runter? Aber wo passiert dies?

Kann das jemand beleuchten?

Schau doch mal auf dem Server in /var/log/syslog, da sollte der rsync-Zugriff protokolliert werden, z.B.:

Jul  1 19:55:01 server rsyncd[2323]: rsync on linbo/start.conf-10.xx.xx.xx from rxx-pcxx.xxx.xxx (10.xx.xx.xx)

Vielleicht findest du da einen Anhaltspunkt.

Funktioniert es denn bei Clients aus anderen Gruppen? Hängt evtl. der rsyncd?

Andreas

Hallo,

Funktioniert es denn bei Clients aus anderen Gruppen? Hängt evtl. der

rsyncd>?

das ist eine interessante Frage.
Ich hatte sowas nämlich auch schon.
Einmal war es ein falsches Zeichen, oder ein Zeilenumbruch zuviel in der
start.conf (deswegen waren Teile eines Kommentars nicht mehr
„auskommentiert“.
Poste doch mal die start.conf.

Natürlich ist das nicht nötig, wenn die anderen Cleints mit der
start.conf funktionieren.

Ein anderes mal war es ein defektes Kabel (was du ja aber schon
ausgeschlossen hast).
Mal einen anderen Switch probiert?

LG
Holger

Hallo,
keine HD und keine Gruppe hatte ich auch schon Mal. Da war in der workstation-Datei in der Zeile ein Strichpunkt zu viel oder zu wenig. Fehlermeldung gab es keine!

Grüße

Jürgen

Jupp, der war tot. Zwei Tage zuvor durch irgendwas „gesigtermt“ und dann nicht wieder gestartet. Das war ein richtig guter Hinweis. Es hätte sehr lange gedauert, bis auf den gekommen wäre.
Ich danke Dir besonders und allen andern helfenden Augen!

Gruß
Frithjof