V7: samba prozesse gehen durch (die Decke)

Hi.
Seit ein paar Tagen habe ich samba-Prozesse, die sich irgendwie aufschaukeln,
100% CPU-Last verbrauchen, Load geht auf 10
und irgendwann bekommen manche externen Services Probleme.
Für mich sieht das so aus, als ob samba-ad-dc stalled und nichts mehr liefert.

Klar, jetzt werden massiv Projekte angelegt, es wird von der Cloud aus oft LDAP-GRuppen etc. abgefragt.

Wie kann ich das sinnvoll debuggen?

  • Kann ich nur den LDAP-Teil von samba debuggen?
  • Wo stelle ich sinnvoll welche loglevel ein?
  • Wenn ich Samba neu starte, habe ich erst mal Ruhe…

Ich starte mal meinen Server mit 8 statt 4 CPUs aber mehr kann ich nicht machen, ich vermute stark, dass sich das Problem nur verzögert.

VG, Tobias

ii  linuxmuster-base7              7.0.79-0ubuntu0 all          linuxmuster.net configuration scripts
ii  linuxmuster-client-servertools 0.9e            all          linuxmuster serverside scripts for managing a community based ubuntu-cloop
ii  linuxmuster-linbo-common7      2.3.66-1        all          linuxmuster-linbo common files: kernel, initrd and pxe boot configuration
ii  linuxmuster-linbo7             2.3.66-1        all          linuxmuster-linbo scripts
ii  linuxmuster-prepare            0.7.4-0ubuntu0  all          linuxmuster.net pre setup configuration scripts
ii  linuxmuster-webui7             1.0.148-1       all          next generation web-based management tool for linuxmuster.net v7.x

Moment, ich kann das Problem sogar genauer reproduzieren:
In der NC habe ich seit der Umstellung auf Version 19 das Problem, dass die eine App (external sites) die LDAP Gruppen abfragt und dabei in einen Timeout gerät (60sek).

Diese Abfrage erzeugt sofort (genau einen für jeden der externen sites) samba-Prozess, der maximale Leistung fordert… Dann bin ich mit 11 samba-PRozessen, die sich 4 (oder 8) CPU-cores teilen am Anschlag.

Die NC gibt nach den 60 Sek. auf. Der Samba-Prozess rödelt weiter…

Hilft das bei der Fehlersuche?

Hallo Tobias,

hast Du in der Nextcloud LDAP / AD Integration den Cache für LDAP Abfragen aktiviert?

LDAP/AD Integration - Fortgeschritten - Verbindungseinstellungen - Speichere Time-To-Live zwischen

Der Standardwert beträgt hier 600 Sekunden.

Viele Grüße
Klaus

Hallo Klaus,

danke, das werde ich checken.
Traue mich grade nicht irgendetwas zu machen, weil jetzt gerade 30 Fünftklässler den Computerraum stürmen und ich live versuche den Samba + den Linuxclient dazuzubringen, ihren Job zu tun.

Vllt. hat das auch was mit meinem Samba zu tun:

  • anmeldeprobleme: sssd auf dem linuxclient kann sporadisch per „id username“ den User nicht finden. Die Verbindung zum AD ist offensichtlich gestört (sssdctl domain-status bei aktiviertem „ifp“ in /etc/sssd.conf liefert „OFFLINE“.)
  • Dann starte ich den Samba auf dem Server neu (der gerade in einem sophomorix-check festhing) und dann ist der Client wieder online.
  • Leider ist in so einer SItuation, wo sich der Server „erholt“ und der client sich verbindet, irgendwas am SSO gestört, so dass dann nach der Anmeldung moz-proxy kommt und man sich re-auth muss. Das ist mit 5-klässlern mit einem neuen Passwort „)Jsf8g4“ nicht zu machen.

Ich vermute, das hängt alles bei mir zusammen: der Samba reagiert schlecht oder gar nicht mehr, ein Neustart hilft zwar, aber das ganze ist fragil, irgendetwas scheint den Zustand zu triggern. Entweder super hohe Last oder ein anderes Problem.

VG, Tobias

Hallo Tobias,

das Nextcloud Addon external sites mal deaktivieren, samba neu starten, bzw. beenden, hängende Prozesse killen, starten. Beobachten. Denn wenn das wirklich eine so hohe Last erzeugt, dann könnte es doch auch sein, daß die sssd Probleme daher kommen.

Viele Grüße
Klaus