[Tustep-Liste] Re: Quo vadis?

leic2501 at uni-trier.de leic2501 at uni-trier.de
Do Jun 24 15:58:02 CEST 2004


Liebe Diskussionsteilnehmer,

Während ich die Beiträge in der Liste besonders in letzter Zeit aufmerksam 
verfolgte, da ich mir von möglichen Neuerungen und einer Öffnung  des 
Komplexes "Tustep" bezüglich anderer Sprachen viel erhoffte, fiel mir immer 
wieder auf, daß das Tustep-Dateiformat kritisiert wurde und besonders, daß es 
eine "geheimgehaltene Schnittstelle" sei. Die Tatsache, daß größere Datenmengen 
nicht auf dem rein sequentiellen Weg in einer ASCII-Datei bearbeitet werden 
sollten, hat Herr Trauth schon geklärt und ich vermute, daß jeder, der sich mit 
dieser Problematik beschäftigt hat, dem nur zustimmen kann. Für einen Beweis 
des Gegenteils wäre ich nicht nur offen, sondern sogar sehr dankbar.
Zugegebenermaßen war ich nicht mäßig erstaunt, als ich im Handbuch stöberte, um 
etwas über das so geheime Dateiformat zu erfahren und dort eine ausführliche 
Dokumentation zum Aufbau der Tustep-Datensätze fand (inklusive der Pointer auf 
folgende und vorangehende Datensätze, der Seiten-Zeilennummer usw.). Nur der 
Header der Datei ist etwas knapp beschrieben. 
Obwohl ich mich, was die Programmierung betrifft, als "blutigen Anfänger" 
bezeichnet wissen möchte, war ich nach einem kurzen Studium einiger SEQ-Dateien 
mit #DUMPE in der Lage, die Bedeutung der einzelnen Werte zu erkennen und mit 
C++ ein kleines Programm zu basteln, das die SEQ-Dateien einliest und als ASCII-
Datei wieder ausgibt. Insgesamt brauchte es dazu:
- 2 Stunden Zeit (den größten Teil davon mußte ich darauf verwenden, mich mit 
einigen C++-Anweisungen vertraut zu machen, die ich bis dahin nicht kannte.
- für die eigentliche Umwandlung in C++ eine Schleife und ein paar Anweisungen 
(insgesamt 13 Zeilen).
- ein wenig Neugier

Ich habe in diesem Programm darauf verzichtet, im Header befindliche 
Informationen, die nicht unbedingt zum Auslesen notwendig waren (z.B. Länge des 
längsten/kürzesten Satzes, Anzahl der Sätze, Anzahl der Zeichen, Datum der 
letzten Bearbeitung usw.) zu interpretieren, jedoch stellt auch dies kein 
Problem dar.
Inzwischen bin ich mir nicht mehr ganz sicher, ob tatsächlich diese 
Schnittstelle gemeint ist, da, wer auch immer sie entworfen hat, bestimmt nicht 
auf Geheimhaltung oder Verschlüsselung bedacht war und vermutlich in jeder 
beliebigen Programmiersprache mit ähnlich geringem Aufwand SEQ-Dateien gelesen 
werden können. Auch das Schreiben sollte nicht wesentlich schwieriger sein. Hat 
sich einer der Diskussionsteilnehmer eigentlich in Tübingen schon einmal nach 
einer vollständigeren Dokumentation als im Handbuch erkundigt?
Obwohl ich mir dagegen sehr sicher bin, daß jeder, der sich damit befasst, in 
kürzester Zeit mindestens ebensoweit kommen wird wie ich, bin ich gerne bereit, 
meine Erkenntnisse mit anderen zu teilen und sowohl eine kleine 
Beispielanwendung in Form einer .exe-Datei, die SEQ-Dateien in ASCII-Dateien 
umwandelt, als auch den Quellcode dieser Anwendung und/oder eine Beschreibung 
der Funktionen der einzelnen Einträge im Header der Tustep-Dateien, soweit ich 
sie herausfand, an Interessierte weiterzugeben. Voraussetzung dafür ist 
selbstverständlich, daß dies keine Verletzung irgendwelcher Urheberrechte 
bedeutet. Da ich mich damit jedoch nicht auskenne, möchte ich die 
Verantwortlichen in Tübingen bitten, mir eine Nachricht zukommen zu lasssen, 
falls irgendwelche rechtlichen Bedenken bestehen.

Viele Grüße in die Runde

Johannes Leicht


Mehr Informationen über die Mailingliste Tustep-Liste