Ipfire hängt ständig

Hallo irrlicht,

ich schrieb

tail -f /var/log/squid/access.log

Gruß

Alois

Morgen Alois,
das hatte ich gelesen, wollte nur Wege fuer eine weiterfuehrende Suche aufzeigen, ist ja nicht sicher, ob http-Anfragen das Problem sind.

Mit dem Befehl faellt mir die Logdatei vom Squid auch mit rein:

Hallo zusammen,

ich hab privat auch alle paar Wochen mal das Problem eines nicht mehr reagierenden IPFire. Wobei dann nur hartes Aus- und wieder Einschalten hilft. Das Ganze nicht virtualisiert und ohne linuxmuster.net.
Hatte bisher aber noch keine Zeit und Muse, Ursachenforschung zu betrieben.

Gruß,
Jochen

Hallo,

ergänzend wäre auch ein beobachten der Ausgabe von
top
auf dem IPFire ganz interessant.

Ich würde aber auch mal den IPFire an einen anderen Port im Switch
hängen: vielleicht stirbt der …
Oder gleich den Switch tauschen.

In jedem Fall mal im switch nachschauen, ob es extrem viele CRC Fehler
auf dem Port gibt, an dem der IPFire hängt.

LG

Holger

Hallo, J.

ich habe mit Interesse diesen thread verfolgt.
AN ein paar Punkten kannst Du ansetzen:

  1. Hast Du schonmal mit nagios die alert history Deines ipfire aufgerufen ?
  2. Ist die Fehlermeldung bim Hochfahren (ganz oben) immer noch da ? Dann steht vielleicht in der squid.conf irgendein “Mist”. Poste mal die Zeile, wo als Argument “tcp” steht!
  3. Hast Du unter /var/log Dir die logfiles für den ipfire durchgesehen - zumindest die letzten Zeilen der “messages” und das dhcpd.log ? DU musst ja nicht “live” dabei sein, wenn der ipfire abschmiert, aber die logfiles sind immer die erste Anlaufadresse.

Gruß,
C

Vielen Dank für die Bemühungen.

Gestern hing der IPFire mal wieder.

Alle Switches ausgeschaltet, wieder eingeschaltet.
Netzsegmente abgehängt. Bis auf den Server.

Jedenfalls hat das alles nichts geholfen.

Werde demnächst mal die Logs , wie von CGSman und irrlicht vorgeschlagen,
anschauen. Hoffentlich ist der Name nicht Programm.

MFG JH

Vielen Dank für die Bemühungen:

Connect-errors und dhcpcd.log sind beide leer


Last log zeigt: ¿œ0[pts/0 172.16.18.6


Messages hat 2,1 MB

Nagios zeigt crirical, aber var hat über 400Gb?

Anhänge

MFG JH

Sollte wohl mal die Festplatte tauschen?

MFG JH

Hab grad gemerkt, dass ja die Server-Festplatte critical ist, var ist mit den Images wohl etwas voll.

Hat aber mit dem IPFIre nichts zu tun.

Hallo jojo,

vielleicht rufst Du mal die Telefonsupportnummer an, dann können wir mal gemeinsam nachsehen wo es klemmen könnte.

Telefonsupport gibts Dienstags von 14 - 18 Uhr

Gruß

Alois

Hallo jojo,

was mir noch nach unserem Telefonat eingefallen ist.

Starte den Ipfire mit einer Knoppix CD/DVD und lass den Arbeitsspeicher testen. Vielleicht ist ein Speicherriegel defekt.

Gruß

Alois

An Alois,

vielen Dank für den Support.

Wir konnten ja nicht auf die Schulkonsole und Server zugreifen. Möglicherweise hängt das ganze gerade wieder.
Jetzt hab ich mir mal die Firewall-Logdateien angeschaut und festgestellt, dass sich offensichtlich nichts mehr tut, wenn ein bestimmter Rechner (192.168.0.22) eine Anfrage stellt. Mit DROP_INPUT.
Diese Anfragen sind dann sehr häufig.

Dieser Rechner hängt direkt am Router. also im gleichen Netz wie der IPFIre rot (192.168.0.12)
Warum gehen die Anfragen überhaupt auf den IPFire?

Kann da was sein?

Meine email ist: ju.heberle@gmail.com

MFG JH

Wuerde keine Mailadressen oeffentlich posten.

Hallo jojo,

ich meine ich hätte schon einmal den Verdacht geäußert, dass da im grünen Netz ein (oder mehrere) Rechner mit einer Adresse aus dem roten Netz hängt. In diesem Fall macht der IPFIRE zu.

Gruß

Alois

Hallo jojocw,

Wir konnten ja nicht auf die Schulkonsole und Server zugreifen.
Möglicherweise hängt das ganze gerade wieder.
Jetzt hab ich mir mal die Firewall-Logdateien angeschaut und
festgestellt, dass sich offensichtlich nichts mehr tut, wenn ein
bestimmter Rechner (192.168.0.22) eine Anfrage stellt. Mit DROP_INPUT.
Diese Anfragen sind dann sehr häufig.

Dieser Rechner hängt direkt am Router. also im gleichen Netz wie der
IPFIre rot (192.168.0.12)

du weißt also, welcher Rechner das ist?
Was läuft den auf dem Rechner?

LG

Holger

Hallo,

Hab jetzt nochmal die Firewall-log durchgesehen, hat offensichtlich nichts mit dem Rechner 192.168.0.22 zu tun.
Jetzt auf Nagios mal die alerts durchgesehen, siehe Anhang.
Ab dem Zeitpunkt hing er.

MFG J 2018-06-18 085825 SERVICE ALERT ipfirechr-netloca.docx (9,0 KB)

Hallo Jojo,

Eine böse Falle sind ältere Switches. Wenn man dort Vlans konfiguriert hat und nur gespeichert hat, dann sind die Einstellungen nach einem Stromausfall wieder weg und u.U. sind dann alle Netze in einem Vlan. Das hat dann auch die Folgen wie bei Dir.

Gruß Alois

Hallo Alois,

wir haben einige Switche 24 und 48. Alle relativ neu. Darin auch 2 Verbindungen über Glasfaser.
Ein Switch ist konfigurierbar. Der hatte 192.168.0.1 (wie der Router), die habe ich vorsichtshalber geändert auf 192.168.0.14.

Keine VLans.

Soll man jetzt alle Ports mal durchpingen und die Reaktionszeiten ablesen?

Hab mal bei den Firewall-Logs durchgesehen, wie der letzte funktionierende Eintrag war.
Aber sehe ich noch kein Schema, so dass man daraus einen PC ausfindig machen könnte.

Kann man aus dem Eintrag in Nagios3 was rauslesen?

MFG JH

Hallo JH,

Kann man aus dem Eintrag in Nagios3 was rauslesen?

Zwischenablage-2
https://ask.linuxmuster.net/uploads/default/original/2X/f/fba1a9ee3d7b0986b5d3b6fa996b9a74e9719ba8.jpg

nein: da steht nur, was wir schon wissen: der IPFire ist nicht mehr
erreichbar.
Warum steht da nicht.

Das kann nun zwei Gründe haben:

  1. IPFire ist abgeschmiert
  2. Switch/Kabel/Dose ist defekt.

Um 1 heraus zu finden hatte ich dir letztens gesagt: schau nach, ob du
dich direkt an ihm noch anmelden kannst (ging das?)
Um 2 heraus zu finden solltest du mal ein anders Kabel/Dose nehmen.
Wenn es nicht hilft, dann wechsel den Switch oder wenigstens erst mal
den Port.

Da du ja gesagt hast, dass du die Hardware des IPFire schon gewechselt
hast (auch Netzwerkkarte, oder ist die mitgewandert?) wird es wohl nicht
an der Hardware liegen.
Jetzt mußt du viel testen…

LG

Holger

Hallo Baumhof,

vielen Dank für die Mühen.
Fehler war schon beim alten IPFIre. Jetzt mit anderer Maschine mit anderer Netzwerkkarte gleiche Fehler. Also es liegt nicht an dem PC des IPFire.

Auf die anderen Fragen: Wenn er hängt:
IPFIre-Web-Oberfläche kann nicht mehr erreicht werden. Weder über PC noch über den Ubuntu-Server mit Firefox.

Nur direkt über den IPFire-Rechner man kann auf die Konsole,
df -h und df -i gibt nur geringe Auslastung, (wie oben schon beschrieben)
top ebenfalls nichts nagatives.

ping vom Server (10.16.1.1) auf den IPFire (10.16.1.254) geht nicht,

ping vom IPFire auf den Server geht auch nicht,

ping vom IPFIre auf sich selbst (ping 10.16.1.254) geht.

Nach Neustart geht wieder alles.

Ist das jetzt ein Software (IPFire) oder Hardware-Problem (Switche Kabel)?

Oder spuckt ein PC/Drucker/sonstwas rein?

MFG JH