Hallo Gerd,
ich hab 2 Probleme in deiner students.csv gefunden:
umcodierung/Zeilentrenner usw.:
sophomorix tut alles um dein Encoding zu ermitteln, hat es aber nicht geschafft, weil du alle Umlaute entfernt hattest, an denen sophomorix das encoding erkennen hätte können.
EIN EINZIGER Name mit Umlaut reicht: Wenn im Nachnamenfeld ein Müller auftaucht, wird daraus das encoding für die ganze Datei klar.
Deshalb an alle: Nicht die Umlaute entfernen!!! Die sollen als utf8 codierte Daten ins AD.
Zeilentrenner braucht ihr auch nicht mit rummachen, sophomorix weiss welche Zeichen Zeilentrenner sind, ob linux oder windows ist egal.
das ist teilweise auch ein sophomorix bug:
Du hast (wahrscheinlich 62 mal) je 2 identische Schüler, aber in verschiedenen klassen, z.B.
7a;Muller;Juergen;21.12.1998;
dummy;Muller;Juergen;21.12.1998;
sophomorix kommt damit nicht klar, weil der string Muller;Juergen;21.12.1998 die user identifiziert
Da sehe ich keine andere Möglichkeit, als z.B. das Geburtsdatum zu ändern.
Das ist auf jeden Fall nicht schnell durch programmierung zu lösen.
Ist diese Datei durch einen Benutzerexport entstanden?
Mit welcher Absicht gibt es denn diese Schüler doppelt?
Nochmal:
sophomorix will in students.csv einen rohen dump der Schüler aus der Schulverwaltung sehen.
Mit Umlauten, unbearbeitet, …
Dann hat es super Chancen alles richtig zu machen. Sobald man die Daten frisiert, wirds schwieriger zu erkennen was der Frisör möchte.
Die Orginal-Datei des Schulverwaltungsdumps würde mich interessieren:
Welches programm hast du benutzt in Hessen?
Bitte dokumentieren mit Exportanleitung für hier:
Bei Bedarf kann ich auch noch einen Filter Erstellen, der dir die ganze Arbeit mit Libreoffice abnimmt.
LG, Rüdiger