Nachdem die automatische Telexauskunft ja schon eine ganze Weile erreichbar ist, steht jetzt noch das Thema der manuelle Datenkorrektur an.
Das Telexverzeichnis von 1987, das im Moment die Datengrundlage für die Auskunft bildet, umfasst 999 Seiten und 150.000 Einträge.
Das klingt erstmal viel, aber wenn z.B. 10 Leute helfen, dann sind das 100 Seiten für jeden. Und das muss ja nicht nächste Woche fertig sein. Wir haben im Prinzip beliebig viel Zeit.
Im Moment sind noch keine Adressedaten enthalten, wie sie mit der originalen Auskunft abgerufen werden konnten. Wir haben zur Zeit nur
Name, Ortsdaten, Telex-Nummer und Kennung. Die vollständigen Adressen wären nochmal ein neues Projekt, sofern die Daten überhaupt vorliegen. Vielleicht nächstes Jahr.
Ich habe bereits im Januar viele Stunden mit der Korrektur der Daten zugebracht und alle Fehler, die sich systematisch über Wort- und Ortstlisten finden ließen, korrigiert. Auf die Nummern müssten schon ziemlich fehlerfrei sein. Trotzdem sind immer noch sehr viele Fehler drin. Vor allem in den Kennungen. Da helfen keine Wortlisten.
Ich habe daher ein kleines Progrämmchen geschrieben, um die Korrektur möglichst zu vereinfachen. Das Programm zeigt den Eintrag aus der Datenbank und den Original-Eintrag aus dem Verzeichnis nebeneinander, so dass man Eintrag für Eintrag sehr schnell vergleichen und korrigieren kann.
Ist natürlich trotzdem noch zeitaufwändig.
Korr_Screenshot.jpg
Es hatten sich ja hier einige Freiwillige gemeldet
, die bei der Korrektur helfen wollten. Denen würde ich gerne eine Testversion des Korrekturprogramms geben, um zu testen, wie schnell die Korrektur überhaupt machbar ist.
Also wer Lust hat, sich an der Korrektur zur beteiligen bitte nochmal per PN melden. Am besten mit E-Mail-Adresse oder WhatApp-Nummer. Dann läst sich das besser koordinieren.
Für die Korrektur muss einmalig das gesannte Telexverzeichnis heruntergeladen werden. Das sind zwei Gigabyte. Flottes Internet wäre also hilfreich. Die Korrekturdaten sind dann gepackt nur 4 Megabyte. Das ist kein Thema.