Neuinstallation erfolgreich, Test gescheitert

Hallo,

auf der Suche nach einem Schulserver haben wir in unserer Schule einen Test-Server mit LMN in einem unserer Informatik-Räume eingerichtet. Nach mehreren Tagen fehlerfreiem Test-Betrieb war dann eine recht komplexe Fehlfunktion erst mal nicht lösbar.
Die Anmeldeprozedur an die Schulkonsole dauerte exakt 130 Sekunden.
Für die Clients gab es keine DNS-Auflösung.
Weder die Schulkonsole war (auch über IP nicht) erreichbar, noch die Firewall.
Nach einigen Versuchen, die Situation zu retten, habe ich mich dann entschlossen, die Installation zu wiederholen und ein sauberes System zu erzeugen.
Nach 4 Tagen stieg dann das System erneut ohne erkennbaren Grund teilweise aus.
Eine Anmeldung an den Server ist nicht möglich. Lediglich Linuxadmin kann sich lokal anmelden.
Der Server ist nicht erreichbar, somit auch keine Schulkonsole.
Die Firewall antwortet nicht auf einen Ping und die Browser sind offline.
Selbst die Rücksicherung der frisch installierten VM’s war erfolglos. Nach der Rücksicherung verhält sich die Maschine genau so fehlerhaft, wie die alte.
Bis die Symptome sich soweit ausgeprägt haben, gab es auch Zustände, in denen die Fehler nur teilweise bzw. auf einige Clients beschränkt auftraten. Auch die Isolation des Servers mit einem Client (um externe Fehlerquellen auszuschließen) blieb erfolglos.
Über einen Lösungsansatz würde ich mich freuen.

Guido Wienen

Hallo Guido!

Erst einmal ein recht herzliches Willkommen!

Bitte gebe weitere Informationen zu deinem Test-Aufbau bekannt.

Vor allem was ist das für ein Server (Hardware), hast Du virtualisiert und wenn ja wie, was sind das für Clients, usw.

Kommst Du noch an die Server-Konsole (Terminal)?

Morgen kannst Du uns auch telefonisch erreichen.

Beste Grüße

Thorsten

Hallo Guido,

das klingt für mich sehr eindeutig nach Netzproblemen.
Entweder ein zweiter DHCP oder ein Loop.

Da du schon versucht hast den Server zu isolieren und dann nur einen
Cleint dran zu hängen tippe ich auf ein Problem in den
Netzwerkeinstellungen des Virtualisierungshosts.

Womit virtualisiert ihr den?
Beim isolieren: wechsel mal den Switch.

LG

Holger

Hallo Thorsten,

erst mal Danke für die schnelle Reaktion und das ‘Willkommen sein’!
Lieber hätte ich mich hier ohne Probleme erst mal vorgestellt, aber wie das so ist…

Zur Technik:
Wir haben einen Dell i7 mit 8 GB Ram und zwei weiteren GBit-Netzwerkkarten ausgestattet. An Grün hängt ein Gigabit-Switch mit 24 Ports. Daran sind 17 Clients angeschlossen. (Fijutsu Esprimo P700 (14x) /710 (3x) mit SSDs)
Eine 500GB HDD ist im Dell verbaut, die Virtualisierung haben wir mit der mitgelieferten XEN-Lösung umgesetzt.
Nach ersten Versuchen, die IP-Adressen an unser Netz anzupassen, habe ich dann in einer zweiten Installation den Router an den IP-Kreis angepasst :wink:

Nach der Installation haben wir die Clients ohne Probleme registrieren und installieren können.
Anschließend konnten die Schüler- und Lehrerdatensätze importiert werden, es lief alles Super.
Nach ein paar Nutzungstagen kam es dann zu wiederholten Fehlverhalten.

Hallo Holger,

es gibt lediglich einen WLAN-Router im roten Netz, der aber kein DHCP-Adressen an LAN-Geräte verteilt.
Eine Loop ist im grünen Netz ausgeschlossen und im roten Netz würde sie sich auf das restliche Netz auswirken, ist jedoch nicht der Fall.
Der Switch ist bereits erneuert, hier habe ich einen neuen TP-Link angeschafft.
Am Ende habe ich einen Client direkt mit dem Server verbunden, gleiches Verhalten hier!
Für mich undurchsichtig ist die Vergabe von virtuellen MAC-Adressen des Virtualisierungshosts. Die Netzwerkkarten haben doch eindeutige MAC-Adressen, welche man Rot, Grün und Blau zuordnen könnte, oder? Ich habe mich hier an die Anleitung gehalten und sie so zugewiesen, wie beschrieben.
Da das meine erste Virtualisierung ist, kann ich hier nicht auf ‘hatte ich schonmal’ zurückgreifen :wink:
Zudem trat der Fehler ja erst nach ein paar Tagen auf, zuvor hat alles fehlerfrei funktioniert.

Gruß
Guido

Hallo Guido,

Eine 500GB HDD ist im Dell verbaut, die Virtualisierung haben wir mit
der mitgelieferten XEN-Lösung umgesetzt.

kontrollier mal in den XEN Netzwerkeinstellungen, dass da alle DHCPs
ausgeschaltet sind.

Nach ersten Versuchen, die IP-Adressen an unser Netz anzupassen, habe
ich dann in einer zweiten Installation den Router an den IP-Kreis
angepasst :wink:

Nach der Installation haben wir die Clients ohne Probleme registrieren
und installieren können.
Anschließend konnten die Schüler- und Lehrerdatensätze importiert
werden, es lief alles Super.
Nach ein paar Nutzungstagen kam es dann zu wiederholten Fehlverhalten.

beschreib mal noch deinen „verkleinerten“ Testaufbau.
Ist da der gleiche 24port Switch beteiligt?
Hast du den mal resettet? (2 Minuten vom Strom trennen).
Ist der Switch von Netgear?

Noch eine mögliche Erklärung ist, dass einzelne CLients das Imag per
rsync ziehen: dann könnte es bei einem server, der auf einer einzelnen
500GB HDD läuft zu derartigen Engpässen kommen, das nichts mehr geht.

LG

Holger

Hallo Holger,

der ‘kleine Testaufbau’ bestand am Ende nur noch aus dem Server und einem direkt angeschlossenen Client. Sogar das rote Netz war ausgezogen.
Dennoch war der Fehler vorhanden.
Die Platte des XEN ist zu 22% (92 GB) belegt und DHCP ist bei keiner Netzwerkkarte aktiviert, diese sind alle statisch.
Der Switch ist ein neuer TP-Link T1600G-28TS, auch ihn haben wir bei der Fehlersuche mehrfach resettet.
Mein Verdacht liegt auf der Firewall. Es kann daran liegen, dass ich nicht in der Lage war, eine einfache Firewallregel zu erstellen, die einen (meinen) PC aus dem roten Netz ins grüne Netz zu lassen. Auch bei der Fehlersuche hatten wir mehrfach unlogisches Verhalten bemerkt. Adressen hinter der Firewall waren erreichbar, sie selbst jedoch nicht.
Aber auch die Rücksicherung der Firewall-VM alleine hat da nichts bewirkt. Die Rücksicherung der Firewalleinstellungen waren ebenfalls ohne Erfolg…

Hallo Guido,

der ‘kleine Testaufbau’ bestand am Ende nur noch aus dem Server und
einem direkt angeschlossenen Client. Sogar das rote Netz war ausgezogen.
Dennoch war der Fehler vorhanden.
Die Platte des XEN ist zu 22% (92 GB) belegt

… es ging nicht um die Füllmenge der Platte sondern um ihre Performance.

und DHCP ist bei keiner
Netzwerkkarte aktiviert, diese sind alle statisch.

… nicht bei den Netzwerkkarten sondern bei den internen Switches.

Der Switch ist ein neuer TP-Link T1600G-28TS, auch ihn haben wir bei der
Fehlersuche mehrfach resettet.

TP Link find ich OK.

Mein Verdacht liegt auf der Firewall. Es kann daran liegen, dass ich
nicht in der Lage war, eine einfache Firewallregel zu erstellen, die
einen (meinen) PC aus dem roten Netz ins grüne Netz zu lassen. Auch bei
der Fehlersuche hatten wir mehrfach unlogisches Verhalten bemerkt.

eine solche Regel ist nicht nötig, wenn der Client (dein PC) ind er
workstations steht.

Adressen hinter der Firewall waren erreichbar, sie selbst jedoch nicht.
Aber auch die Rücksicherung der Firewall-VM alleine hat da nichts
bewirkt. Die Rücksicherung der Firewalleinstellungen waren ebenfalls
ohne Erfolg…

gerade tippe ich auf falsche Einstellungen der virtuellen switches im XEN.
Kannst du mal ein Screenshot von den Einstellungen machen?

und dann wäre es noch hilfreich, wenn du uns die
/etc/linuxmuster/workstations Datei schicken könntest (oder wieder
screenshot davon: gerne auch aus der Schulkonsole heraus).

Als ersten weiteren Test würde ich vorschlagen: Server ganz alleine
stehen lassen (keine Clients dran) und dann auf dem Server
ping ipfire
ping 10.16.1.254
ping heise.de
ping 8.8.8.8

ssh -p 222 ipfire

Was geht, was nicht?

Und: wenn du mal wieder einen Cleint dran hast und die Anmeldung am
Server klappt nicht, dann log dich mal lokal ein und schau nach, welche
IP der Client hat.

Ich bin mir sicher, dass der Fehler irgend wo in der virtualisierung
liegt: ziemlich sicher bei den Netzwerkkarten.
Die Firewall spuckt nicht in die Suppe, wenn Clients den Server
erreichen wollen.

Welceh IP hat den der XEN Host?

LG

Holger

Hallo Guido,

kannst Du mal Deinen Standort durchgeben? Vielleicht kann mal wer aus der Nähe nachschauen?

Gruß

Alois

Hallo Guido,

bei unerklärlichen Phänomenen ist meist die Hardware die Ursache. Ich tippe auf einen Schaden der Netzwerkkarte am Server. Kannst Du da mal eine andere verbauen?

Ich bin sicher, dass es nicht an unserer Serverlösung liegt.

Gruß

Alois

Hallo Guido!

Hast Du mal einen Ram-Tester “drübergelassen”?
Hast Du mal 5 Tage Bitcoins geschürft und er lief danach noch? Oder andere Prozessor-Quäl-Programme?
Was ich sagen will, ich würde die Hardware auf Herz und Nieren testen, bevor ich bei der Installation nach Fehlern suche, vor allem, da es sich nach einem ziemlichen Totalausfall anhört.

LG
Max

Hallo Holger,

ich bin Deinem Rat gefolgt und habe alle Adressen angepingt. Keine hat geantwortet.
Auch SSH läuft nicht. Der Server steht jetzt alleine in meinem Büro, kein Client ist angeschlossen.
Der Zugang meines Rechners über das rote Netz ist gerade nicht notwendig, da der Server wieder in meinem Büro steht, dass will ich später lösen.
Beim virtuellen Switch triffst Du mich auf dem falschen Fuß. Wo kann ich die Einstellungen des virtuellen Switchs im Xen-Center sehen? (Gerne würde ich einen Screenshot zusenden, aber wovon?)
Beim Booten bekommen die Clients noch die IP, welche wir bei der Installation angegeben haben. Der Client startet, nur die Anmeldemaske lädt deutlich zu lange. Hier kann man ja nur noch den Linuxadmin anmelden.
Versucht man sich mit einem anderen User anzumelden, dauert die Überprüfung des Anmeldenamens, sowie die Passwort-Überprüfung ebenfalls zu lange.
Der XEN hat die 10.16.1.10.

Gruß
Guido

Hallo Alois,

der Selbsttest des Servers hat keine negativen Ergebnisse geliefert. Ich habe ihn die ‘ausfühliche’ Version des Tests machen lassen, sie dauerte ca. 1,5 Stunden und ist ohne Fehler beendet worden.
Unsere Schule steht in Wassenberg, Kreis Heinsberg, nähe Aachen/Düsseldorf/Köln.

Ich bin gerade dabei, einen weiteren Server mit identischer Hardware zu installieren, um den Fehler ggfls. reproduzieren zu können.
Ich denke, ich werde zuerst eine Rücksicherung der virtuellen Maschinen versuchen, bevor ich alles neu installiere.

Danke nochmal für die Hilfsbereitschaft hier, ist nicht selbstverständlich !!!

Hallo,

habe gerade entdeckt, dass die Rücksicherung der VM’s nicht so gelaufen ist, wie ich erhofft hatte. Die Netzwerkeinstellungen des IPFire waren deaktiviert.
Dann habe ich die die vermeintlich defekten VM’s wieder aktiviert und die Ping-Tests erneut gestartet. Jetzt mit Erfolg, alle Verbindungen sind funktionsfähig. Ich werde morgen den Server wieder im Informatik-Raum installieren und sein Verhalten erneut testen…

Danke,

Gruß
Guido

Hallo @cweikl!

Ist das nicht in deiner Nähe? Ich weiß zwar, dass du im Moment ziemlich zu getextet bist - wie die meisten/alle hier - , aber vielleicht findet sich eine Möglichkeit Guido zu helfen. Auf die eine oder andere Art und Weise! :slight_smile:

Lieben Gruß

Thorsten

Hallo Guido,

hast du Heute Zeit?
Hotline ist da von 14 bis 18 Uhr. Erreichbar unter der 0721 17028011
Wenn du dann einen Rechner im Netzt mit INternetzugang und Teamviewer
hättest, der den XEN Host auch erreicht, dann könnten wir per
Fernwartung drauf schauen.

Aber gerade bin ich eher Alois Meinung: da stirbt wohl die Netzwerkkarte
im Server. Kannst du die austauschen?
Oder eine andere dazu bauen und die als “Grün” verwenden?

Ich kenne den XEN Server nicht auswendig genug um dich an die richtige
Stelle zu leiten: kann das jemand anders machen?
Wo er die Einstellungen des virtuellen Netzwerkkarten findet?

Andererseits: wenn der XEN host über die 10.16.1.10 zuverlässig
erreichbar ist, dann ist die Netzwerkkarte nicht das Problem, sondern
doch die virtuellen Switches …
Hat auch auf die 10.16.1.10 niemand geantwortet?
Welceh IPs hatten den die Cleints nach dem booten?

LG

Holger

Hallo Holger,

danke für das Hotline-Angebot. Leider habe ich es heute nicht mehr geschafft, den Server wieder zu installieren. Morgen werde ich mich mit dem aktuellen Stand melden.
Ein Teamviewer-Laptop wäre vor Ort, wenn’s nicht klappt…

Bis dann
Guido

Hallo,

gestern habe ich den ‘Informatik-Raum’ in mein Büro geholt. Nachdem der Server zuerst alle ‘Kontaktanfragen’ korrekt beantwortet hat, habe ich die Netzwerkeinstellungen des XEN überprüft, was gleichzeitig zum Ausstieg sämtlicher Verbindungen führte. Ein erneutes ausführten der Setup-Option am XEN, sowie der Versuch, diese Einstellungen händisch durchzuführen hatte keine Auswirkung. Die Option ‘Emergency Network Reset and Reboot’ (oder so ähnlich) brachte den Erfolg, dass ich den XEN wieder über das XEN-Center ansprechen konnte. Alle VM’s wurden gestartet, wobei IPFire beim booten folgende Meldung zeigte:
“Ignoring broken upstream name server(s): 10.16.1.254 8.8.8.8
DNSSEC has been set to permissive mode”,

was sein zuvor beschriebenes Verhalten mit seinen Worten erklären würde.

Dann habe ich die rückgesicherte Version der Firewall gestartet, welche ohne zu meckern booten konnte.
Als dann alles Prima aussah, alle Pings brav beantwortet wurden, versuchte ich einen Client zu starten, der prompt KEINE IP-Adresse vom Server bekam. Dies ist zuvor nicht passiert, bis dahin bekamen sie immer noch die Ihnen zugewiesene IP.

Da heute kein regulärer Schulbetrieb stattfindet, hoffe ich, ausreichend Zeit zu haben, dem ganzen nochmal auf den Grund zu gehen.

Wir stehen vor dem Kauf eines Servers und so überlege ich , ob es nicht sinnvoller ist, diesen Schritt jetzt vorzuziehen, um die LMN-Umgebung gleich auf einer angemessenen Plattform zu installieren, bevor wir noch mehr Zeit mit dem ‘Server-Hardware-Emulation’ zu verlieren.

Habt Ihr hier Eckdaten zu den Server-Anforderungen, welche der Erfahrung nach notwendig, unverzichtbar und/oder ungeeignet sind?

Zur Dimension:
ca. 1300 Schüler, 120 Lehrer und in der letzten Ausbaustufe ca. 180 Clients nebst 30 WLAN-Zugangspunkten.

Gruß
Guido

Hallo Guido,

ich habe diesen Server

http://www.afbshop.de/server-workstation/server/2512/dell-poweredge-r710-2x-xeon-e5620-at-2-4-ghz-12gb-ram-2x-73gb-hdd-dvd-rom?c=14

zwei Mal im Einsatz. Allerdings mit mehr Festplatten und mehr RAM.

Festplatten a 1 TB 4 - 6 (bei Eurer Schule eher 6) im Raid 5 oder Raid 6

RAM 32 G oder mehr.

Bei uns haben wir bei ähnlicher Schüler- und Lehrerzahl ca. 400 Rechner; 44
Access-Points mit täglich bis zu 700 Geräten im WLAN

var und home des Servers habe ich 1,5 TB zugewiesen. Der Rest verteilt sich
auf die Betriebssysteme der virtuellen Maschinen. Den IPFIRE würde ich
Festplattenmäßig nicht zu klein machen, da dort viele Log-Dateien anfallen
können. Ausserdem habe ich noch etwas “Luft” für noch nicht vorhandenen
virtuelle Maschinen gelassen.

Gruß

Alois

Hallo Alois,

danke für die Hardwareempfehlung. Ich gehe davon aus, dass Ihr den Server nicht gebraucht gekauft habt :wink:
…oder etwa doch?
In meiner Phantasie sind Prozessorkerne durch nichts zu ersetzen, der o.a. Server hat ‘nur’ 4. Ist das ausreichend?

Nach mehreren Tests im Bezug auf die IP-Adressverteilung des XENs und der VMs ist mir aufgefallen, dass bei einer Rücksicherung der Firewall die NIC für Red und Blue vertauscht wurden. Eine Korrektur war in soweit möglich, dass sowohl der Server als auch die Firewall jetzt wieder online sind, incl. funktionierender DNS-Auflösung.
Allerdings sind die Clients nicht mehr in der Lage, ins Netz zu kommen. Die internen Adressen (Server und Firewall) sind online und auch zugänglich, jedoch werden externe Adressen von der Firewall geblockt. Die Auflösung funktioniert auch hier (hab ich bemerkt, als ich mich bei einer Web-Adresse verschrieben habe), jedoch meldet sie bei korrekter Adresse: ‘Zugriff verweigert… mangelnde Zugriffsrechte…Bitte kontaktieren Sie Ihren Dienstanbieter…’, egal, welche Seite ich aufzurufen versuche.
Ich denke, ich werde den Test mit einer anderen Hardware fortsetzen, denn hier ist der Frust hausgemacht…
Nachdem ich ein paar defekte Neonröhren getauscht habe, nehme ich heute wenigstens ein Erfolgserlebnis mit nach Hause… :wink:

Gruß
Guido