[Tustep-Liste] Re: Quo vadis?
leic2501 at uni-trier.de
leic2501 at uni-trier.de
Do Jun 24 15:58:02 CEST 2004
Liebe Diskussionsteilnehmer,
Während ich die Beiträge in der Liste besonders in letzter Zeit aufmerksam
verfolgte, da ich mir von möglichen Neuerungen und einer Öffnung des
Komplexes "Tustep" bezüglich anderer Sprachen viel erhoffte, fiel mir immer
wieder auf, daß das Tustep-Dateiformat kritisiert wurde und besonders, daß es
eine "geheimgehaltene Schnittstelle" sei. Die Tatsache, daß größere Datenmengen
nicht auf dem rein sequentiellen Weg in einer ASCII-Datei bearbeitet werden
sollten, hat Herr Trauth schon geklärt und ich vermute, daß jeder, der sich mit
dieser Problematik beschäftigt hat, dem nur zustimmen kann. Für einen Beweis
des Gegenteils wäre ich nicht nur offen, sondern sogar sehr dankbar.
Zugegebenermaßen war ich nicht mäßig erstaunt, als ich im Handbuch stöberte, um
etwas über das so geheime Dateiformat zu erfahren und dort eine ausführliche
Dokumentation zum Aufbau der Tustep-Datensätze fand (inklusive der Pointer auf
folgende und vorangehende Datensätze, der Seiten-Zeilennummer usw.). Nur der
Header der Datei ist etwas knapp beschrieben.
Obwohl ich mich, was die Programmierung betrifft, als "blutigen Anfänger"
bezeichnet wissen möchte, war ich nach einem kurzen Studium einiger SEQ-Dateien
mit #DUMPE in der Lage, die Bedeutung der einzelnen Werte zu erkennen und mit
C++ ein kleines Programm zu basteln, das die SEQ-Dateien einliest und als ASCII-
Datei wieder ausgibt. Insgesamt brauchte es dazu:
- 2 Stunden Zeit (den größten Teil davon mußte ich darauf verwenden, mich mit
einigen C++-Anweisungen vertraut zu machen, die ich bis dahin nicht kannte.
- für die eigentliche Umwandlung in C++ eine Schleife und ein paar Anweisungen
(insgesamt 13 Zeilen).
- ein wenig Neugier
Ich habe in diesem Programm darauf verzichtet, im Header befindliche
Informationen, die nicht unbedingt zum Auslesen notwendig waren (z.B. Länge des
längsten/kürzesten Satzes, Anzahl der Sätze, Anzahl der Zeichen, Datum der
letzten Bearbeitung usw.) zu interpretieren, jedoch stellt auch dies kein
Problem dar.
Inzwischen bin ich mir nicht mehr ganz sicher, ob tatsächlich diese
Schnittstelle gemeint ist, da, wer auch immer sie entworfen hat, bestimmt nicht
auf Geheimhaltung oder Verschlüsselung bedacht war und vermutlich in jeder
beliebigen Programmiersprache mit ähnlich geringem Aufwand SEQ-Dateien gelesen
werden können. Auch das Schreiben sollte nicht wesentlich schwieriger sein. Hat
sich einer der Diskussionsteilnehmer eigentlich in Tübingen schon einmal nach
einer vollständigeren Dokumentation als im Handbuch erkundigt?
Obwohl ich mir dagegen sehr sicher bin, daß jeder, der sich damit befasst, in
kürzester Zeit mindestens ebensoweit kommen wird wie ich, bin ich gerne bereit,
meine Erkenntnisse mit anderen zu teilen und sowohl eine kleine
Beispielanwendung in Form einer .exe-Datei, die SEQ-Dateien in ASCII-Dateien
umwandelt, als auch den Quellcode dieser Anwendung und/oder eine Beschreibung
der Funktionen der einzelnen Einträge im Header der Tustep-Dateien, soweit ich
sie herausfand, an Interessierte weiterzugeben. Voraussetzung dafür ist
selbstverständlich, daß dies keine Verletzung irgendwelcher Urheberrechte
bedeutet. Da ich mich damit jedoch nicht auskenne, möchte ich die
Verantwortlichen in Tübingen bitten, mir eine Nachricht zukommen zu lasssen,
falls irgendwelche rechtlichen Bedenken bestehen.
Viele Grüße in die Runde
Johannes Leicht
Mehr Informationen über die Mailingliste Tustep-Liste