<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
<meta content="text/html;charset=ISO-8859-1" http-equiv="Content-Type">
<title></title>
</head>
<body bgcolor="#ffffff" text="#000000">
Lieber Michael, liebe TUSTEP-Gemeinde<br>
<br>
Ich hatte vor einiger Zeit schon einmal aus meinem Kurs heraus ein
Problem mit dem Sortieren im Französischen und mich mit diesem Problem
an Herrn Ott gewandt.<br>
Er hat mir in <b>zwei Mails</b> geantwortet und auch Beispieldateien
geschickt. Ich kam in meinem Kurs allerdings dann nicht mehr zur
Behandlung der Angelegenheit.<br>
<br>
Damit Herr Ott jetzt nicht antworten muss, erlaube ich mir, seine
beiden Mails hierher zu kopieren und auch seine beiden Dateien
mitzuschicken.<br>
Bitte beachten Sie vor allem seinen Hinweis, d<b>ass im Französischen
von hinten her, also von rechts nach links sortiert wird</b> (kann mir
das mal jemand erklären, mit Beispielen, dass auch ich das verstehe?).<br>
<br>
Michael es wäre wunderbar, wenn dein Musterprogramm mit dem
französischen Text mit den korrekten Sortierregeln in das <b>TUSTEP-Tutorial</b>
aufgenommen werden könnte. Inzwischen befinden sich dort bereits schon
zwei Musterprogramme für KWIC-Indices (mit Musterdateien!), eines für
einen lateinischen Verstext (Lukrez) und eines für einen fortlaufenden
neuhochdeutschen Text (Kafka, danke Peter Stahl!).<br>
<br>
Herzliche Grüße aus Zürich<br>
<br>
Wolfram Schneider-Lastin<br>
<br>
---<br>
<br>
<b>MAIL 1 von Herrn Ott:<br>
<br>
</b>Lieber Herr Schneider-Lastin,
<br>
<br>
hier das versprochene Beispiel für französische Sortierung.
<br>
Die Seite 1 der Datei dedale ist in der geforderten Reihenfolge
<br>
sortiert; die Zeilen 1.4-1.6 und 1.8 sind aus Punkt 8.1 der
<br>
"norme francaise" NF Z 44-001 vom November 1995 entnommen; ich
<br>
habe dort noch 1.7 eingefügt.
<br>
<br>
Nach deutschen Regeln sortiert wäre die Reihenfolge
<br>
cote
<br>
cot%/e
<br>
c%<ote
<br>
c%<ot%/e
<br>
coter
<br>
Die Seiten 2ff wiederholen die Wörter und fügen weitere,
<br>
auch nicht französische Wörter ein, die im Ergebnis
<br>
in die Reihenfolge der Seite 1 der Quelldatei eingemischt
<br>
werden. Anhand der Satznummern, die als Referenz mitgeführt
<br>
werden (modus=+), lässt sich das leicht kontrollieren.
<br>
<br>
Im Programm müssen Sie noch #so und #ra anfügen (dort
<br>
(bitte Parameter
<br>
RFL 6 3
<br>
und
<br>
NRT -.-
<br>
nicht vergessen)
<br>
<br>
-------------------<br>
<br>
<b>MAIL 2 von Herrn Ott:<br>
<br>
</b>Nachtrag<b><br>
</b>In der zitierten Norm NF Z 44-001 ist unter 8.1 auch die
Reihenfolge
<br>
der "signes diacritiques et ligatures" festgelegt (zu letzteren
<br>
sind auch die Zeilen 1-3 in der Datei "dedale" aus dieser Norm
<br>
übernommen):
<br>
1. Lettre non ligaturee et ne comportant pas de signe diacritique;
<br>
2. Lettre comportant un accent aigu;
<br>
3. Lettre comportant un accent grave;
<br>
4. Lettre comportant un accent circonflexe;
<br>
5. Lettre comportant un tilde;
<br>
6. Lettre comportant un trema or un umlaut;
<br>
7. Lettre comportant un rond superieur;
<br>
8. Lettre comportant une cedille;
<br>
9. Lettre comportant un autre signe diacritique;
<br>
10. Lettre litaguree
<br>
<br>
Wichtig:
<br>
<br>
"... la discrimination s'effectue en examinant la denomination en
<br>
partant de la fin de celle-ci, c'est-a-dire de la droite vers la
gauche..."
<br>
<br>
Herzlichen Gruß
<br>
Ihr W. Ott<br>
<br>
Michael Trauth schrieb:<br>
<blockquote cite="mid4980B610.6198.16F0B8F@trauth.uni-trier.de"
type="cite">
<pre wrap="">Diskussionsforum Tustep-Liste
Weitere Informationen: <a class="moz-txt-link-abbreviated" href="http://www.itug.de">www.itug.de</a>
------------------------------------------------------------
Lieber Herr Osthoff,
velen Dank für den Hinweis:
</pre>
<blockquote type="cite">
<pre wrap="">im handbuch seite 471 bringt schälkle ein (makro-)
beispiel für die sortierung französischer lemmata,
an das ich mich beim sortieren halte. martin glessgen
jedenfalls hat mich dafür noch nie gescholten. das
lässt sich ja auch für die registerprogramme analog
anwenden.
</pre>
</blockquote>
<pre wrap=""><!---->
Trotzdem brauche ich noch ein bißchen Nachhilfe:
Das Geheimnis *dieses* Sortiereprozederes steckt
ja offensichtlich in
: BUILD X_TABLE xs = *
: |<%|0|%/|1|%\|2|%|3|%:|4|
Darin bereitet mir das dritte Austausche ...|%|3|...
Probleme. Können Sie mir helfen, das zu verstehen?
Wenn da stünde
: BUILD X_TABLE xs = *
: |<%|0|%/|1|%\|2|%<<|3|%:|4|
will sagen: wenn der Zirkumflex in '3' ausgetauscht
würde, wär's für mich verständlicher, denn das
entspräche grosso modo meinen Sortieranweisungen
: xs1 |ä|ae|ö|oe|ü|ue|ß|ss|
: xs1 |%>@><>@||#.ö|oe|#.ä|ae|
: xs2 |ä|az|ö|oz|ü|uz|ß|sz|
: xs2 |%/</|<=01z1|%\</|<=01z2|
: xs2 |%<<</|<=01z3|%:</|<=01z4|
: xs2 |%;</|<=01z5|#.ö|oz|#.ä|az|
ABER: Erstens sind in der X_TABLE xs die Ligaturen
und das Cedille nicht berücksichtigt, und zweitens
soll die auch darin angesetzte Sortierwertigkeit
1. kein Akzent
2. Akut
3. Gravis
4. Zirkumflex
5. Trema
angeblich nicht korrekt sein.
Vielleicht kann ja Herr Gleßgen - sofern er diese
Diskussion mitverfolgt - dazu etwas sagen?
Viele Grüße reihum von
Michael Trauth
</pre>
</blockquote>
<pre class="moz-signature" cols="72">--
Dr. Wolfram Schneider-Lastin
Universität Zürich
Koordinator für E-Learning und Computerphilologie
an der Philosophischen Fakultät
Plattenstrasse 22
CH-8032 Zürich
Tel.: +41 – 44 – 634 50 82
(wenn keine Antwort: +41 - 44 - 252 07 67)
Mail: <a class="moz-txt-link-abbreviated" href="mailto:wolfram.schneider-lastin@phil.uzh.ch">wolfram.schneider-lastin@phil.uzh.ch</a>
Web: <a class="moz-txt-link-freetext" href="http://www.phil.uzh.ch/elearning">http://www.phil.uzh.ch/elearning</a>
Erreichbar in der Regel Mo 14-18, Di Mi 9-18 Uhr
</pre>
</body>
</html>