[Tustep-Liste] XY nach TUSTEP / Konvertierungsmoeglichkeiten

Michael Trauth trauth at uni-trier.de
Di Feb 14 11:19:52 CET 2006


Gruess Gott Herr Gasperlin,

zu Ihrer Mitteilung an die TUSTEP-Liste:

> soeben habe ich (Anfängerstolz!) einen als Unicode-Datei
> abgespeicherten Word2k-Text ohne Komplikationen überführt,
> indem ich die Datei angemeldet und dann mit #um umcodiert
> habe. Ich sehe schon, wie Ihnen das ein Gähnen entlockt,

Machen Sie sich darueber mal keine Sorgen, denn dieser Weg
der kleinen (und schliesslich immer groesser werdenden) Er-
folgserlebnisse ist der allein seligmachende...

> aber mich freuen diese kleinen Ergebnisse ungemein, denn
> die ersten Befürchtungen hinsichtlich extraorbitant kom-
> plizierter Import-Prozeduren haben sich damit nicht be-
> stätigt.

Das ist zweifellos richtig - aber auch kein Grund, bei die-
sem einen Importverfahren stehenzubleiben, denn bei #um
kommen zwar die Zeichen(!) richtig nach TUSTEP rueber, aber
noch keine Formatiere- und Strukturinformation. Um bei ganz
simplen Beispielen zu beginnen: Wenn Sie Fussnoten als
Fussnoten, Einschaltungen als Einschaltungen (oder Blockzi-
tate) und Ueberschriften als Ueberschriften nach TUSTEP
bringen wollen, um diese Textmerkmale nicht manuell aus-
zeichnen zu muessen, gibt es weitere Importmoeglichkeiten.
Eine gute hat Herr Carls bezeichnet, den Sie in Ihrer ersten
Mail zitieren: Speichern Sie den Text, um den es Ihnen zu
tun ist, z.B. in Winword als WordPerfect-Datei im Format
der Version 5.1 ab (am einfachsten mit einem TUSTEP-konfor-
men Namen und in dem betr. TUSTEP-Projektverzeichnis). Dann
rufen Sie in TUSTEP #*konvert auf: In der Maske, die dann
erscheint, waehlen Sie ganz oben unter 'Konvertierrichtung'
durch Klick auf das Fragezeichen die Nr.3 aus ('von WP 5.x/
6.x nach TUSTEP'). Dann geben Sie noch die Namen der Datei,
die konvertiert werden soll, unter 'Quelldatei' an, ausser-
dem einen Namen fuer die TUSTEP-Zieldatei. Ein Klick auf
'Konvertieren' startet dann die Konvertierung. Wenn Sie
dann nach erfolgreicher Konvertierung in diese Zieldatei
schauen, werden Sie zunaechst erschrecken, denn da stehen
viele auf den ersten Blick unverstaendlich erscheinende
Kodierungen #{...} drin. Aber das ist nicht so wild. Fuer
Ihre Weiterverarbeitung muessen halt bloss ein paar Aus-
tauscheanweisungen die #{...} in das ueberfuehren, was
Sie im Zielprogramm brauchen. Fuers Satzprogramm zum
Beispiel
- #{Fussnote_Anfang}         ->  @f+
- #{Fussnote_Ende}           ->  @f-
- #{neue_Seite}              ->  &&&n&&&{
- #{feste_neue_Seite}        ->  &&&n&&&{
- #{Kopftext_</_jede_Seite:} ->  @=
- #{Kopftext_</_Ende}        ->  @{
- #{neue_Zeile}              ->  $$$
- #{hoch_ein}                ->  #H:
- #{hoch_aus}                ->  #G:
- #{tief_ein}                ->  #T:
- #{tief_aus}                ->  #G:
- #{kursiv_ein}              ->  #/+
- #{kursiv_aus}              ->  #/-
ausserdem Einzelzeichenkodierungen wie z.B.
- #{Zeichen_12,35}           ->  #;eu
Das sind, wie gesagt, nur ein paar Beispiele. Wenn
Sie sich die Muehe sparen wollen, diese Austausche-
anweisungen selbst in eine Kopiere-Prozedur zu schreiben,
koennte ich Ihnen das #kopiere schicken, das ich fuer
meine Beduerfnisse ganz kasuistisch (ohne jeden Anspruch
auf Vollstaendigkeit) zusammengestoppelt habe. Wie brauch-
bar das ist, was dabei herauskommt, muessten Sie selbst
entscheiden.

Seit einiger Zeit gibt es aber noch eine weitere Import-
moeglichkeit, die ich Ihrer Aufmerksamkeit empfehle: Mit
dem Standardmakro #*import koennen XML-Dateien, die Sie
zuvor in Winword 2003(!) im XML-Format abgespeichert hab-
ben, mit allen Format- und Strukturinformationen nach TU-
STEP importiert werden. Der Aufruf geschieht nicht wie bei
#*konvert ueber ein Menue, sondern ueber eine Kommandozeile:
:   #*import,quelle,ziel,lo=+
Das ist nach meiner Einschaetzung die Konvertierung 'state
of the art'! Was dabei noch Arbeit verursacht, sind die
Tags, die in der Zieldatei ankommen: Darin sind z.B. (na-
tuerlich) die Namen der Winword-Formatvorlagen enthalten,
die der Winword-Benutzer verwendet hat - und wenn der eine
Formatvorlage mit dem Namen
:   "UeberschriftStufe3ZentriertKursiv"
verwendet hat, muessen Sie halt den entsprechenden Tag
erst in das uebersetzen, was Sie im Zielprogramm brauchen.
Das ist noch mit einigem Aufwand fuer Sie verbunden, aber
der lohnt sich, denn es kommt dabei wirklich *alle* Infor-
mation rueber, die vielleicht fuer die Zielverarbeitung
von Bedeutung ist.

In der Hoffnung, dass Ihnen diese Hinweise ein bisschen
weiterhelfen, gruesst herzlich

Michael Trauth




---------------------------------------------------------------
Dr. Michael Trauth                  e-mail: trauth at uni-trier.de
Rechenzentrum                       office: Tel. 0651-201-3413
der Universitaet                            Fax  0651-201-3921
Universitaetsring                secretary: Tel. 0651-201-3417
D-54286 Trier
---------------------------------------------------------------



Mehr Informationen über die Mailingliste Tustep-Liste