[Tustep-Liste] Import von Word-Dateien

Giorgio Giacomazzi giorgio at giacomazzi.de
Fr Mai 7 12:31:59 CEST 2004


Lieber Herr Schälkle,

 > Ein Programm, das aus mit Word erstellten XML-Dateien
 > ausser dem Text auch die wichtigsten Auszeichnungen
 > herausfiltert, waere vermutlich hilfreich.

ich habe genau dieses Programm Anfang des Jahres dem ZDV im Tausch gegen 
eine kommerzielle TUSTEP-Lizenz angeboten. Herr Ott lehnte mit der 
Begründung ab, daß es sich nicht um eine TUSTEP-Komponente, sondern um 
ein Add-In für ein fremdes Programm handeln würde. Das war allerdings 
kein Grund gegen die bisherige Distribution meines alten XML-Konverters 
mit TUSTEP seit 2001 oder nun für die Entwicklung eines neuen Konverters 
beim ZDV selbst.

Der angebotene XML-Konverter unterstützt standardmäßig Unicode (UTF-8), 
bewältigt große Dateien ohne Probleme, bereitet Word-Tabellen für den 
Satz in TUSTEP auf, läuft auch unter nicht deutschem Windows, usw. 
Anders als beim XML-Export von Word 2003 wird nicht noch einmal das 10 
bis 20-fache an Auszeichnungen hinzugefügt, sondern reduziert.

Für den eigenen Gebrauch habe ich eine zweite Version entwickelt, die 
gerade bei großen Dateien viel schneller ist (1-2 Sek. bei einer 5 MB 
großen Word-Datei) und vor allem bis ins kleinste Detail konfigurierbar 
ist; sie setzt keine Formatvorlagen voraus, um sachliche Auszeichnungen 
zu liefern. Denn das Problem bei Word ist die Definition dessen, was 
"die wichtigsten Auszeichnungen" sind. Diese variieren von Projekt zu 
Projekt (zum Teil, weil besondere Konventionen erforderlich sind, zum 
Teil, weil Konventionen nicht eingehalten werden, zum Teil, weil es 
keine Konventionen gibt) derart, daß im Grunde ein projektspezifischer 
Konverter, erforderlich ist, ein generischer nicht ausreicht. Ideal wäre 
eine Abstimmung von kontrollierter Erfassung und Konvertierung, aber das 
geht nun vermutlich zu weit. Interessenten können Sie gerne an mich wenden.

Mit besten Grüßen,

Giorgio Giacomazzi

Strelitzstr. 18
D-12105 Berlin
Tel.: 030-70176848
Fax: 0721-151440186


Kuno Schälkle wrote:

> Diskussionsforum Tustep-Liste
> Weitere Informationen: www.itug.de
> ------------------------------------------------------------
> 
> 
> Einladung zur Mithilfe
> 
> 
> Fast alle, die Daten aus Word-Dateien nach TUSTEP
> uebernehmen wollen, haben irgend einen Weg dafuer
> gefunden.
> 
> Mit Word 2003 koennen die Daten nun auch im XML-Format
> abgespeichert werden. Diese XML-Dateien enthalten jedoch
> soviele zusaetzliche Informationen, dass sie fuer die Weiter-
> verarbeitung in TUSTEP ungeeignet erscheinen.
> 
> Ein Programm, das aus mit Word erstellten XML-Dateien
> ausser dem Text auch die wichtigsten Auszeichnungen
> herausfiltert, waere vermutlich hilfreich.
> 
> Um ein praxis-taugliches Programm erstellen zu koennen,
> benoetige ich Test-Daten. Deshalb bitte ich alle, die an einem
> solchen Programm interessiert sind (auch wenn Sie noch
> nicht Word 2003 haben), mir Word-Dateien an
> schaelkle at zdv.uni-tuebingen.de zu schicken.
> 
> Wenn Sie moechten, schicke ich Ihnen die importierten Daten
> zurueck, so dass Sie zum Ergebnis noch Verbesserungs-
> vorschlaege machen koennen.
> 
> Vielen Dank fuer Ihre Mithilfe
> Kuno Schälkle
> 
> ------------------------------------------------------------
> Tustep-Liste at itug.de
> https://lists.uni-wuerzburg.de/mailman/listinfo/tustep-liste


Mehr Informationen über die Mailingliste Tustep-Liste