[Tustep-Liste] Datei in Unterverzeichnis lesen und zusammenkopieren

Thomas Kollatz kol at steinheim-institut.org
Fr Okt 18 22:14:14 CEST 2013


Hallo das kann bei XML Dateien passieren (bei denen mehr als 64000 Zeichen in einer Zeile sind) ist zwar selten aber  lösbar, bin nur gerade mal wieder unterwegs, ab morgen habe ich Urlaub und endlich Zeit ein paar Dinge abzuarbeiten; mit  meinem Script bastele ich zuweilen mehr als 1000 XML Dateien zusammen, liegt also wohl nicht an der Zahl der Dateien Ich schicke dann mal die Tage ein Update für diesen Fall 

Auf bald
Thomas Kollatz

Von meinem iPad gesendet

> Am 18.10.2013 um 20:28 schrieb wolfram.schneider-lastin at phil.uzh.ch:
> 
> Diskussionsforum Tustep-Liste
> Weitere Informationen: www.itug.de
> ------------------------------------------------------------
> 
> Lieber Thomas
> 
> Ich habe dein untenstehendes Skript - bevor ich es ins Wiki stelle - ausprobiert.
> 
> Es hat funktioniert in einem Verzeichnis, in dem sich nur zwei XML-Dateien befanden; in einem anderen, in dem sich 14 XML-Dateien befanden, ist es mit folgendem Fehler ausgestiegen:
> 
> "Satz wird zu lang (379541 > 64000 - abgeschnitten
> WRITE/ADJUST
> CLOSE wegen vorangehender Fehler nicht ausgeführt"
> 
> Herr Neumann sprach ja von mehreren hundert Dateien in seinem Verzeichnis. Aber vielleicht ist nicht die Anzahl der Dateien entscheidend (sonst hätte Herr Neumann wohl schon reklamiert), sondern ihre Beschaffenheit.
> 
> Wie kann das Skript so gestaltet werden, dass es in jedem Fall funktioniert?
> 
> Herzliche Grüße aus Zürich
> 
> Wolfram Schneider-Lastin
> 
> Das Skript von Herrn Ott ("'Weiß auf Schwarz setzen") befindet sich jetzt im Wiki.
> 
> ---
> 
> Dr. Wolfram Schneider-Lastin
> Universität Zürich
> Leiter der Abteilung E-Learning an der Philosophischen Fakultät
> Koordinator für Computerphilologie
> 1. Vorsitzender der International TUSTEP User Group (ITUG)
> Rämistrasse 69
> CH-8001 Zürich
> 
> Tel.: +41 - 44 - 634 50 82
> (wenn keine Antwort: +41 - 44 - 252 07 67)
> 
> Mail: wolfram.schneider-lastin at phil.uzh.ch
> Web: http://www.phil.uzh.ch/fakultaet/elearning.html
> 
> -----tustep-liste-bounces at lists.uni-wuerzburg.de schrieb: -----
> An: tustep-liste at itug.de
> Von: Thomas Kollatz 
> Gesendet von: tustep-liste-bounces at lists.uni-wuerzburg.de
> Datum: 16.10.2013 10:21
> Betreff: Re: [Tustep-Liste] Datei in Unterverzeichnis lesen und	zusammenkopierne
> 
> Diskussionsforum Tustep-Liste
> Weitere Informationen: www.itug.de
> ------------------------------------------------------------
> 
> Lieber Herr Neumann, 
> ich habe es mit den XML-Dateien meines Mainzer workshops  (der demnächst auch im Wiki sein wird, spätestens in meinem Herbsturlaub) einmal ausprobiert, herzliche Grüße
> THOMAS KOLLATZ
> 
> $$! ziel=xml2tustep.tf
> $$ MODE TUSCRIPT,{}
> - Dateinamen aus Standardprojekt und -träger
> files=FILE_NAMES (-std-,-std-)
> 
> - xml-Dateien herausfiltern
> xmlfiles=FILTER (files,":*.xml:",-)
> sz_xml=SIZE(xmlfiles)
> IF (sz_xml==0) STOP
> 
> - Einlesen der XML-Dateien und in TUSTEP Zieldatei schreiben
>  ERROR/STOP CREATE (ziel,seq-o,-std-)
>  ERROR/STOP ERASE  (ziel)
> 
> COMPILE
>  ACCESS z: WRITE/RECORDS     $ziel s.z/u, text
>   LOOP file=xmlfiles
>    ERROR/STOP OPEN (file,READ,-std-)
>     ACCESS q: READ/RECORDS/UTF8 $file s,text
>      LOOP/9999999
>       READ/NEXT/EXIT q
>       WRITE/ADJUST z
>      ENDLOOP
>     ENDACCESS q
>    ERROR/STOP CLOSE (file)
>   ENDLOOP
>  ENDACCESS/PRINT z
> ENDCOMPILE
> 
>> Am 16.10.2013 um 07:52 schrieb Thomas Neumann <tho.neumann at gmx.de>:
>> 
>> Diskussionsforum Tustep-Liste
>> Weitere Informationen: www.itug.de
>> ------------------------------------------------------------
>> 
>> Hallo Liste,
>> ein kleines Problem.
>> Ausgangslage: Mehrere hundert xml-Dateien befinden sich in einem Unterverzeichnis eines Projektes.
>> 1. Alle XML-Dateien auflisten und in eine TUSTEP-Datei schreiben (im Projektverzeichnis)
>> 2. Alle Dateien alphabetisch nacheinander in einen TUSTEP-Datei kopieren.
>> TUSCRIPT wäre die richtige Wahl, oder?
>> In diesem Kontext noch eine Frage zu:
>> FILE_NAMES (+,-std-)
>> Wie ist das Format für eine direkte Pfadangebe auf einem Windows-System für Parameter 2 (hier "-std-")?
>> Ein direkter Pfad funktioniert nicht, oder?
>>  
>> Dank in die Runde.
>> Lg Thomas Neumann
>>  
>> -------------------------------------
>> Dr. Thomas Neumann
>> Hertfelderstrasse 12
>> 73733 Esslingen
>> -------------------------------------
>> mail tho.neumann at gmx.de
>> fax +4932121431182
>> -------------------------------------
>> www.thomas-neumann.com
>> www.caroline-fouque.de
>> www.hoererlebnis.de
>> -------------------------------------
>> 
>> ------------------------------------------------------------
>> Tustep-Liste at itug.de
>> https://lists.uni-wuerzburg.de/mailman/listinfo/tustep-liste
> 
> 
> 
> drs Thomas Kollatz  - wissenschaftlicher Mitarbeiter / research assistant
> Salomon Ludwig Steinheim-Institut fuer deutsch-juedische Geschichte
> D-45127 Essen * Edmund-Koerner-Platz 2 * T  0201-82162910  * skype kollatzthomas
> HP http://www.steinheim-institut.de/wiki/index.php/Mitarbeiter:Thomas_Kollatz
> 
> ===  Projekte / projects ===
> Epigraphische Datenbank <http://www.steinheim-institut.de/cgi-bin/epidat>
> RiR - Relationen im Raum <https://dev2.dariah.eu/wiki/display/RIRPUB/RiR>
> DARIAH-DE <http://de.dariah.eu>
> === btw / sonst noch ===
> TUSTEP-TUSCRIPT module on Rosetta Code <http://rosettacode.org/wiki/Category:TUSCRIPT>
> 
> ------------------------------------------------------------
> Tustep-Liste at itug.de
> https://lists.uni-wuerzburg.de/mailman/listinfo/tustep-liste
> 
> ------------------------------------------------------------
> Tustep-Liste at itug.de
> https://lists.uni-wuerzburg.de/mailman/listinfo/tustep-liste
-------------- nächster Teil --------------
Ein Dateianhang mit HTML-Daten wurde abgetrennt...
URL: <https://lists.itug.de/pipermail/tustep-liste/attachments/20131018/1ba6fbd5/attachment.htm>


Mehr Informationen über die Mailingliste Tustep-Liste