Das Problem ist die Quelle deiner Daten. Du musst als erstes herausfinden welches Encoding du da raus bekommst. Am besten die csv wie du sie erhälst mit LibreOffice Calc öffnen. Im Import-Wizard kannst Du dann die verschiedenen Encodings ausprobieren.
Dann mit dem schon genannten
sophomorix-check --encoding-student
das encoding festlegen. Das kannst du auch dauerhaft machen, siehe
man sophomorix-check
--encoding-students encoding, --encoding-students-extra encoding, --encoding-courses-extra encoding, --encoding-teachers encoding,
verarbeitet die einzulesenden 4 Dateien in einer bestimmten Zeichencodierung.
Standard ist ISO 8859-15. Mögliche Optionen sind ascii, 8859-1, 8859-15, win1252, utf8.
Bei Verwendung der Option utf8 werden nicht alle möglichen Zeichen unterstützt.
Will man das encoding dauerhaft festlegen kann man in sophomorix.conf die gleich wie die Optionen lautenden Variablen setzen, z.B.
$encoding-students="8859-1";
oder
$encoding-courses-extra="utf8";
Dann sollte sich auch diese Installation gleich verhalten wie die andere.
die Input-datei nach UTF-8 konvertiert. Ebenso steht bei mir in sophomorix.conf jetzt das encoding auf utf-8, so dass das zusammenpasst.
Du solltest eventuell einmal den output von obigem Befehl testen, weil wenn sich unterschiedliche encodings eingeschlichen haben sollten, dann wird das kein script das ich kenne ordentlich machen (z.B. wenn du von iso8859 nach utf8 konvertierst, aber ein zeichen schon in utf8 war, dann wird es hinterher Á? oder so heißen.)
Ok, dank Euren Postings konnte ich das Problem loesen.
Die CSV-Datei aus Magellan hatte ein paar Umlaute/SZ, die bei ISO8859-1 falsch dargestellt/konvertiert/importiert wurden, mit utf8 sehen diese alle gut aus.
das will ich gar nicht. Das macht sophomorix für mich. Und ich finde es eher schade, dass die Sonderzeichen rausfliegen. Ich wünschte mir für die neue Version, dass die Schüler ihre Sonderzeichen behalten. Die usernamen dürfen gerne konvertiert sein, aber für die Schülerlisten und die Anzeige in „Gecos“ hätte ich gerne Jérôme oder „András Béla Péter Hubert Esterházy de Galantha“ aus „Želiezovce“. Ich finde das nur „artgerecht“.
Man müsste aber die TRANSLIT Variante auch mit abspeichern, damit eine Suche nach „esterhazy“ auch zum Ziel führen kann.