[Tustep-Liste] Import von Word-Dateien
Giorgio Giacomazzi
giorgio at giacomazzi.de
Fr Mai 7 12:31:59 CEST 2004
Lieber Herr Schälkle,
> Ein Programm, das aus mit Word erstellten XML-Dateien
> ausser dem Text auch die wichtigsten Auszeichnungen
> herausfiltert, waere vermutlich hilfreich.
ich habe genau dieses Programm Anfang des Jahres dem ZDV im Tausch gegen
eine kommerzielle TUSTEP-Lizenz angeboten. Herr Ott lehnte mit der
Begründung ab, daß es sich nicht um eine TUSTEP-Komponente, sondern um
ein Add-In für ein fremdes Programm handeln würde. Das war allerdings
kein Grund gegen die bisherige Distribution meines alten XML-Konverters
mit TUSTEP seit 2001 oder nun für die Entwicklung eines neuen Konverters
beim ZDV selbst.
Der angebotene XML-Konverter unterstützt standardmäßig Unicode (UTF-8),
bewältigt große Dateien ohne Probleme, bereitet Word-Tabellen für den
Satz in TUSTEP auf, läuft auch unter nicht deutschem Windows, usw.
Anders als beim XML-Export von Word 2003 wird nicht noch einmal das 10
bis 20-fache an Auszeichnungen hinzugefügt, sondern reduziert.
Für den eigenen Gebrauch habe ich eine zweite Version entwickelt, die
gerade bei großen Dateien viel schneller ist (1-2 Sek. bei einer 5 MB
großen Word-Datei) und vor allem bis ins kleinste Detail konfigurierbar
ist; sie setzt keine Formatvorlagen voraus, um sachliche Auszeichnungen
zu liefern. Denn das Problem bei Word ist die Definition dessen, was
"die wichtigsten Auszeichnungen" sind. Diese variieren von Projekt zu
Projekt (zum Teil, weil besondere Konventionen erforderlich sind, zum
Teil, weil Konventionen nicht eingehalten werden, zum Teil, weil es
keine Konventionen gibt) derart, daß im Grunde ein projektspezifischer
Konverter, erforderlich ist, ein generischer nicht ausreicht. Ideal wäre
eine Abstimmung von kontrollierter Erfassung und Konvertierung, aber das
geht nun vermutlich zu weit. Interessenten können Sie gerne an mich wenden.
Mit besten Grüßen,
Giorgio Giacomazzi
Strelitzstr. 18
D-12105 Berlin
Tel.: 030-70176848
Fax: 0721-151440186
Kuno Schälkle wrote:
> Diskussionsforum Tustep-Liste
> Weitere Informationen: www.itug.de
> ------------------------------------------------------------
>
>
> Einladung zur Mithilfe
>
>
> Fast alle, die Daten aus Word-Dateien nach TUSTEP
> uebernehmen wollen, haben irgend einen Weg dafuer
> gefunden.
>
> Mit Word 2003 koennen die Daten nun auch im XML-Format
> abgespeichert werden. Diese XML-Dateien enthalten jedoch
> soviele zusaetzliche Informationen, dass sie fuer die Weiter-
> verarbeitung in TUSTEP ungeeignet erscheinen.
>
> Ein Programm, das aus mit Word erstellten XML-Dateien
> ausser dem Text auch die wichtigsten Auszeichnungen
> herausfiltert, waere vermutlich hilfreich.
>
> Um ein praxis-taugliches Programm erstellen zu koennen,
> benoetige ich Test-Daten. Deshalb bitte ich alle, die an einem
> solchen Programm interessiert sind (auch wenn Sie noch
> nicht Word 2003 haben), mir Word-Dateien an
> schaelkle at zdv.uni-tuebingen.de zu schicken.
>
> Wenn Sie moechten, schicke ich Ihnen die importierten Daten
> zurueck, so dass Sie zum Ergebnis noch Verbesserungs-
> vorschlaege machen koennen.
>
> Vielen Dank fuer Ihre Mithilfe
> Kuno Schälkle
>
> ------------------------------------------------------------
> Tustep-Liste at itug.de
> https://lists.uni-wuerzburg.de/mailman/listinfo/tustep-liste
Mehr Informationen über die Mailingliste Tustep-Liste