Hallo, liebe Linuxmuster-Nette,
ich stehe etwas unter Stress, weil unser seit Coronabeginn super laufendes Moodle extrem schwächelt. Ich muss dazu gleich bemerken, dass vermutlich Probleme bei STRATO die Hauptursache sein könnten, aber ich bräuchte dennoch Euren Rat:
- Mein Moodle ist bei STRATO auf einem starken VServer gehostet (16 vcores, 1Tb Platte, Virtuoso-Filesystem). Angeblich werden diese zur Zeit „gewartet“, was für unsere Schule mit 820 usern, die SEHR FLEIßIG mit Moodle arbeiten und alles über Moodle regeln, fatal ist.
Zuerst fiel der Server am 11.5. von 20 Uhr abends bis 6 Uhr morgens aus (ohne Vorwarnung), jetzt, wieder am Montag, von ca. 20:30 bis 7:30.
"Ausfallen" heißt: Zuerst wurden die Seitenaufrufe mit Verzögerung beantwortet (12-40 Sekunden), dann erschienen die Seiten nicht mehr, in einem Fall wurde sogar die Seite eines anderen virtuellen Hosts ausgeliefert (!), dann Funkstille über https://, nicht aber über ssh - hier konnte man sich zeitweise mit vielen Verbindungsabbrüchen einloggen, dann funktionierte ssh auch nicht mehr.
Oder: Das Einloggen ging relativ schnell, ein apt-get update auf dem Server aber dauerte 2,5 min. für wenige Hundert Kilobyte.
Die Hotline sprach von Problemen und Optimierungen, wir fanden dann im Gespräch einen oder zwei Knoten, die bislang bei Traceroute die berühmten Sternchen zeigten, einen mit der IP 85.214.0.119. Das sei wohl das Problem.
Stand heute: Es arbeiten 36 Leute mehr schlecht als recht und vielen Verzögerungen am Moodle, teilweise erreichen unsere SuS die Plattform nicht, ich hingegen schon ! (Wie kommt das ? MÜSSEN die über den Knoten (s.o.), andere hingegen nicht ?)
Nun habe ich alle Logfiles durchwühlt: In den Serverlogs meines Moodles gibt es keine Auffälligkeiten, keine bei postfix, apache, syslog, auth.log. ABER: Ein „top“ ergibt die merkwürdige Ausgabe von sehr vielen rpciod-Prozessen, OBWOHL ICH KEIN NFS brauche (das Modul ist natürlich Teil des Kernels). Sollte ich das Modul rausschmeißen oder brauchen virtuelle Server sowas ? (ein „mount“ zeigt kein „type nfs“).
UND: Ich habe einen ungewöhnlich hohen Wert bei der CPU-Zeile:
%Cpu(s): 1,9 us, 0,3 sy, 0,0 ni, 95,2 id, 2,6 wa, 0,0 hi
Der wa-Wert (für die Hardware-Performance) ist bei mir bis zu 18 - das ist zu viel, oder ? Und es zeigt doch, dass auf das virtuelle Dateisystem viel zu langsam zugegriffen wird, oder ?
Ferner: Ich habe noch einen Root-Server bei Strato. Könnte ich nicht dort über einen Reverse-Proxy oder über die iptables meinen Moodle-Datenverkehr umleiten, indem ich die Schüler auf den zweiten Server verweise und von dort aus den ersten ansteuere ? Die kaputte node wird schon nicht dazwischenliegen ?
Und: Welche Performance-Probleme könnte ich noch selbst verursacht haben und welche Monitoring-tools könnten mir hier weiterhelfen ?
Fragen über Fragen…
Auf Eure Antworten bin ich gespannt !
Liebe Grüße
Christoph Gü