[Tustep-Liste] KWIC-Index Nachtrag und Widerruf

Michael Trauth trauth at uni-trier.de
Mi Jan 28 18:03:34 CET 2009


Lieber Herr Moser, lieber Wolfram,

das kommt davon, wenn man sich unter Zeitdruck
nicht genug Zeit zum aufmerksamen Lesen gönnt.
Wolfram hatte geschrieben:

> Nachdem ich noch einen Testlauf gestartet habe,
> habe ich festgestellt, dass bei MODUS = kwic zu
> DATEN offenbar zwingend eine Datei oder -std-
> angegeben werden muss.
> Soweit ich sehe, steht das nicht im Handbuch.

Ich habe diese Aussage nur überflogen, dachte,
es ginge noch um die diskutierte Frage "Ausgabe
in Zieldatei *oder* ins Protokoll", und habe darauf
meine (konsequenterweise ganz unsinnig ausfallende)
Replik abgestellt.

Das tut mir leid, und ich entschuldige mich
hierdurch dafür. Die Aussage von Wolfram ist
völlig korrekt.

Immerhin hatte die Chose wenigstens *einen*
erfreulichen Nebeneffekt: Es gibt jetzt eine
Musterroutine für eine KWIC-Ausgabe mit Buch-,
Kapitel- und Paragraphenreferenzen aus dem Text
anstelle der Standardreferenzen, mit Ausgabe in
eine Zieldatei statt ins Protokoll für den
Ausdruck. Leider stimmt damit anscheinend auf
der *sachlichen* Seite etwas noch nicht, wie ich
jetzt erfahren habe: Die französischen Akzente
Akut, Gravis und Zirkumflex, außerdem Sonderzeichen
wie die a/e- und die o/e-Ligatur werden nicht
richtig sortiert. TUSTEPler wissen, daß derlei
auf der Programmseite leicht zu korrigieren
ist - vorausgesetzt, man kennt die entsprechende
lexikographische Konvention. Und dabei hapert's
bei mir offensichtlich. Kann mir einer der
Romanisten aus unserer Gemeinde auf die Sprünge
helfen?

Im Französischen gibt es durchaus nicht selten
den Fall, daß Wörter sich nur durch die Akzente
voneinander unterscheiden (crèpe / crêpe und
gène / gêne usw.). Derzeit habe ich für den
(rein hypothetischen) Fall, daß es die Wörter
gene
géne
gène
gêne
gäbe, genau die hier angegebene Sortierfolge
angesetzt: zuerst der Grundbuchstabe, dann der
Akut, dann der Gravis, dann der Zirkumflex.
Bei ae- und oe-Ligatur habe ich außerdem für
die Grundsortierung 'ae' und 'oe' angenommen,
weil das in meinem Wörterbuch so gehandhabt
ist. Wie müßte statt dessen die korrekte
Sortierfolge aussehen?

Das Programm schicke ich hier noch einmal im
Attachment mit. Wer zum Testen die verwendete
Quelldatei haben möchte - es handelt sich um
einen Auszug aus André Maurois, La France et
les Français - möge sich bitte per Mail bei
mir melden, denn Postings mit Attachments
>= 10 KB sieht der Listenserver nicht gerne.


Viele Grüße reihum von

Michael Trauth


---------------------------------------------------------------
Dr. Michael Trauth                  e-mail: trauth at uni-trier.de
Rechenzentrum                       office: Tel. 0651-201-3413
der Universitaet                            Fax  0651-201-3921
Universitaetsring                secretary: Tel. 0651-201-3417
D-54286 Trier
---------------------------------------------------------------

-------------- nächster Teil --------------
The following section of this message contains a file attachment
prepared for transmission using the Internet MIME message format.
If you are using Pegasus Mail, or any other MIME-compliant system,
you should be able to save it or view it from within your mailer.
If you cannot, please ask your system administrator for assistance.

   ---- File information -----------
     File:  kwic3.p
     Date:  28 Jan 2009, 17:40
     Size:  8192 bytes.
     Type:  Binary
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : kwic3.p
Dateityp    : application/octet-stream
Dateigröße  : 8192 bytes
Beschreibung: nicht verfügbar
URL         : <https://lists.itug.de/pipermail/tustep-liste/attachments/20090128/ab950c6f/attachment.obj>


Mehr Informationen über die Mailingliste Tustep-Liste