[Tustep-Liste] TXSTEP

Wilhelm Ott wilhelm.ott at uni-tuebingen.de
Do Mär 11 17:52:46 CET 2010


TXSTEP - Einladung zur konzeptionellen Mitgestaltung
 

Liebe TUSTEP-Nutzerinnen und -Nutzer
(und alle, die es werden möchten),

diese mail soll Sie kurz über ein Konzept für die Weiterentwicklung von
TUSTEP informieren, zu dem die Initiative von Tobias Ott (Hochschule der
Medien (HdM) Stuttgart) ausgeht und das geeignet erscheint, den Nutzerkreis
für TUSTEP deutlich zu erweitern. 
 
Zuvor einige Beobachtungen:

An TUSTEP wird von Noch-Nicht-Nutzern vor allem bemängelt, dass der
Lernaufwand zu hoch sei, insbesondere aufgrund der eigentümlichen, nicht
intuitiven und nicht mehr als modern empfundenen Syntax (Kommandos,
Parameter, ...). Andererseits weise TUSTEP Leistungen auf, die in vielen 
modernen, vor allem XML-basierten, Werkzeugen nicht zu finden sind.

XML ist die Auszeichnungssprache, die für die Archivierung von Texten und
deren crossmediales Publizieren inzwischen Standard ist.

Programme oder Skripte, mit denen XML-Dokumente verarbeitet werden, 
sind in der Regel selbst wieder in XML-Syntax geschrieben.
Allen voran sind hier XSLT (die Transformationssprache) und XSL-FO 
(der Formatierungs-Standard innerhalb von XML) zu nennen - beides 
offizielle W3C-Recommendations.

Dies hat - neben der für Entwickler gewohnten Syntax - den Vorteil, dass
schon beim Schreiben dieser Skripte die Syntax überprüft wird bzw.
dass die an einer Stelle im Skript möglichen oder erforderlichen Angaben
vorgeschlagen und andere gar nicht zugelassen werden können. Damit eignen
sich solche Sprachen sehr gut zum Selbststudium.

Aus diesen Beobachtungen resultiert nun folgender Vorschlag:

Um die Leistungen von TUSTEP einem weiteren Kreis leichter zugänglich zu
machen, sollte TUSTEP selbst über eine "XML-Schnittstelle" gesteuert werden
können. Arbeitstitel: TXSTEP. 

Tobias Ott (Dozent an der HdM Stuttgart und Geschäftsführer von
pagina) hat dieses Konzept nach dem Besuch der "XML Prague" im März 2009
entwickelt, mit Kuno Schälkle im Lauf des Jahres 2009 vorbesprochen und beim
diesjährigen TUSTEP-Workshop in Blaubeuren anhand eines kleinen Prototyps
kurz vorgestellt. Er wurde daraufhin von den Teilnehmern gebeten, dies auch
in Trier beim TUSTEP- und TextGrid-Entwicklerworkshop am 18./19. Januar
vorzustellen (vgl. den Bericht von Ute Recker-Hamm in dieser Liste vom
28.1.2010). Auch die Teilnehmer aus dem TextGrid-Projekt zeigten größtes 
Interesse an diesem Konzept, da es auch die Schnittstellenproblematik
(wie steuere ich TUSTEP-Skripte von einer XML-Umgebung aus an und 
verarbeite die Ergebnisse weiter?) lösen könnte.

Seitherige Aktivitäten:

Nach internen Vorgesprächen innerhalb der HdM fand am 16. Januar ein
Gespräch zwischen Prof. Dr. Marko Hedler (HdM, Lehrgebiet Publishing,
Cross-Media-Systeme, XML-Technologien), Tobias Ott (HdM und pagina) und
Wilhelm Ott (Uni Tübingen) statt, bei dem ein gemeinsames Vorgehen
besprochen wurde:

Die HdM würde sich an der Entwicklung als Kooperationspartner mit der Uni
Tübingen und TextGrid beteiligen und steht dann auch als (Mit-)Antragsteller
für Personalmittel für die Umsetzung zur Verfügung. Die hierfür notwendigen
Gespräche müssen noch geführt werden. Im Falle des Zustandekommens einer
Kooperation berät Prof. Hedler hinsichtlich der XML-Technologien; Tobias Ott
wird im Rahmen seines Deputats die XML-seitigen Arbeiten koordinieren. Räume
für Treffen können dann von der HdM zur Verfügung gestellt werden.

Am 17.2. fand ein Gespräch zwischen Wilhelm Ott und Prof. Dr. Kaletta 
(Universität Tübingen) statt, bei dem dieser für ein erstes Teilprojekt
Projektmittel zusagte.

Weiteres Vorgehen:

Die Hauptarbeit wird in der Entwicklung einer passenden XSD (XML Schema
Definition, der "große Bruder" einer DTD) für TXSTEP bestehen. Damit wird
über die Syntax entschieden, in der später die TXSTEP-Skripte erstellt
werden sollen. Diese Syntax soll sich möglichst an bestehende Konventionen
(z.B. XSLT) anlehnen, gleichzeitig aber dem großen Leistungsspektrum von
TUSTEP gerecht werden. 

Dabei ist weniger das Niederschreiben des Regelwerkes von Aufwand 
als vielmehr das gemeinsame Erarbeiten der bestgeeigneten
Modellierungskriterien, denen das Schema genügen soll.

Dazu müssen die Strategie, ein Pflichtenheft und Prioritäten der Abarbeitung
festgelegt werden.
 
Als wichtige offene Fragen haben wir bislang identifiziert:

- wie sollen Daten an TXSTEP übergeben werden? Im Skript selbst (wie
  bisher in TUSTEP) oder "von außen" (wie bei XSLT)?

- wie kann die XML-Umsetzung der Syntax der Parameter aussehen?

- Wie lassen sich die Probleme lösen, die z.B. die in den Suche- und
  Ersetze-Anweisungen notwendigen Spitzklammern in der XML-Umgebung
  darstellen?

- wieweit soll das Abprüfen der Syntax, das TUSTEP bislang bei der
  Interpretation der Parameter leistet, schon in der XML-Umgebung 
  stattfinden, so dass idealerweise noch während der Erstellung der 
  Skripte diese bereits überprüft werden?

- Grundidee: mit wenigen Ausnahmen (wie #FO oder #FA) soll der volle
  Leistungsumfang von TUSTEP über diese Syntax zugänglich gemacht werden. 
  Dazu gehört auch die Eigenschaft von TUSTEP, Basisfunktionen der
  Textdatenverarbeitung anzubieten, die der Nutzer selbst zu komplexeren
  Lösungen (z.B. einen rückläufigen Wortformen-Index) zusammenstellt. 
  Dennoch kann es sinnvoll sein, auch übergeordnete Pakete als solche 
  vorzusehen (die z.B. #rv, #so, #ra für Zwecke der Registerarbeit 
  zusammenbinden). Frage:
  Welche Module sollen unverändert abgebildet werden? Soll / kann eine
  Abbildung von #KO in TXSTEP durch ein Interface zu TUSCRIPT ersetzt 
  werden? Gilt dies auch für andere parametergesteuerte Programme?

- In vielen TUSTEP-Prozeduren spielt die in TUSTEP-Dateien mitgeführten
  Seiten- und Zeilennummern eine wichtige Rolle. Wie und unter welchen
  Bedingungen lässt sich dies auf XML-Dateien im FDF-Format übertragen?
  Ist dies überhaupt notwendig, oder reicht es, die dazu nötigen 
  "internen" Dateien als TUSTEP-Dateien mit Satznummern zu führen?

- Als Sprache für das TXSTEP (für tag-Namen, Erläuterungen, Hilfe-Texte)
  empfiehlt sich das Englische, weil damit auch die Einsatzmöglichkeit 
  im nicht-deutschsprachigen Raum erleichtert wird. Welche Priorität hat
  demgegenüber eine Version mit deutschsprachigen Erläuterungen und
  Hilfe-Texten (die zunächst sicher einfacher zu erstellen ist)?

Diese und andere Fragen sollten in einem Kreis kompetenter TUSTEP-Nutzer
(und natürlich -innen) und XML-Profis besprochen werden, die idealerweise
auch bei der Umsetzung mit Rat und/oder Tat mitwirken möchten.

Mit der heutigen Mail möchten wir für die Mitarbeit bei diesem spannenden
Projekt, vor allem in der Konzeptionsphase, werben. Schon in Blaubeuren und
bei dem TextGrid-TUSTEP-Treffen in Trier wurde deutlich, dass eine die o.g.
Fragen am besten in einer "Normierungskommission"beschlossen werden, bevor
die eigentliche Abarbeitung dann (durch einzelne Personen / eine noch zu
schaffende Stelle / ...) beginnen kann. 

Wir freuen uns sehr, dass Thomas Kollatz, Andrea Rapp, Ute Recker-Hamm,
Wolfram Schneider-Lastin, Michael Trauth schon ihr Interesse bekundet
haben. Wir möchten alle weiteren Interessenten bitten, sich bis zum
21.3.2010 per mail bei Wilhelm Ott zu melden. Im nächsten Schritt 
werden wir dann alle Interessenten zu einer ersten Sitzung bitten, die
voraussichtlich in Tübingen oder vielleicht schon in Stuttgart stattfinden
wird.       

Mit den besten Grüßen in die Runde,

Wilhelm Ott    Tobias Ott     Marko Hedler          


Prof. Dr. Wilhelm Ott
Universität Tübingen
wilhelm.ott at uni-tuebingen.de


Dipl.-Ing. Tobias Ott
Hochschule der Medien Stuttgart
und pagina GmbH Tübingen
ott at hdm-stuttgart.de


Prof. Dr. Marko Hedler
Hochschule der Medien Stuttgart
hedler at hdm-stuttgart.de

----------------------------------------------------------------------
Prof. Dr. Wilhelm Ott               phone: +49-7071-987656
Universitaet Tuebingen              fax:   +49-7071-987622
c/o Zentrum fuer Datenverarbeitung  e-mail: wilhelm.ott at uni-tuebingen.de
Waechterstrasse 76
D-72074 Tuebingen


Mehr Informationen über die Mailingliste Tustep-Liste