[Tustep-Liste] Worthaeufigkeitsliste

stahl at germanistik.uni-wuerzburg.de stahl at germanistik.uni-wuerzburg.de
Di Jan 22 17:25:58 CET 2008


Lieber Herr Neumann,

zunächst eine ganz grundsätzliche Bemerkung zu den beiden Skripten, die weiter
unten folgen. Mit dem ersten wird eine Wortformenliste erzeugt - und keine
Wortliste. Ein ähnliches Beispiel dazu finden Sie auch im Tustep-Handbuch.

#============== schnipp =============================================
#- ?1 = Platzhalter

#rvorbereite, ?1, -std-, modus=+, loesche=+, parameter=*
          Trennzeichenliste
tr        | |.|,|;|:|!|?|"|-|(|)||%<>0>@|
          Länge der Sortierschlüssel
ssl       30 30
          Aufbau der Sortierschlüssel
xs1       |ä|a|ö|o|ü|u|ß|ss|
xs2       |ä|z|ö|z|ü|z|ß|z|
*eof

#sortiere, -std-, -std-, sortierfeld=17+60'0, loesche=+

#datei, ?1.lst, frag=-
#raufbereite, -std-, ?1.lst, modus=+, loesche=+, par=*, proto=-
          Sortierschlüssellänge
ssl       60
          Länge des 1. und 2. Referenzteils festlegen
rfl       6 3
          Ergänzen nach dem 1. Referenzteil
nrt       |.|
          Ergänzen zwischen den Referenzen
zrf       |, |
          Referenz  vollständig ausgeben
rtw       1
          absolute Häufigkeit ausgeben
ah        1
          Ergänzen vor und nach absoluter Häufigkeit
vah       |  (|
nah       |*)|
          Satzlänge in der Zieldatei festlegen
sl        60 60
*eof
#============== schnapp =============================================

Die Datei mit der Namenserweiterung "lst", die nun entstanden ist, bildet die
Basis für das zweite Skript, das eine Häufigkeitsliste der Wortformen
ausgibt.

#============== schnipp =============================================
#dat, ?1.lst2, frag=-
#kop, ?1.lst, ?1.lst2, mod=+, loe=+, par=*
          Nur die Zeilen mit "*)" kopieren
zf+       .*).
ek1       .*).
          Vom Anfang bis einschließlich EK1 kopieren
aei       21
*eof

#sv,?1.lst2,-std-,mo=-, loe=+, par=*
          Häufigkeitsangabe in den 1. Sortierschlüssel
ak1       .(.
ek1       .*).
          Wortform in den 2. und 3. Sortierschlüssel
ek2       . (.
ek3       . (.
          Nur eintragen, was zwischen den Grenzen steht
aei       11 11 11
mls       4  30 30
ssl       4  30 30
          Zahlen auf 4 Dezimalstellen links auffüllen
dez       4
xs2       .ä.a.ö.o.ü.u.ß.ss.
xs3       .ä.z.ö.z.ü.z.ß.z.
*eof

#sort,-std-,-std-,sort=1+4-f'5+60!,loe=+

#dat, ?1.aus,fragen=-
#ra,-std-, ?1.aus, mo=-, par=*, pro=-
          Länge des Sortierschslüssels
ssl       64
*eof
#============== schnipp =============================================

Das war's. Entscheidend ist, dass das erste Skript eine ordentliche Liste
ergibt. Eventuell muss am Parameter TR gearbeitet werden und am
Sortierschlüssel.

Viele Grüße
P.Stahl



Mehr Informationen über die Mailingliste Tustep-Liste