[Tustep-Liste] Worthaeufigkeitsliste
stahl at germanistik.uni-wuerzburg.de
stahl at germanistik.uni-wuerzburg.de
Di Jan 22 17:25:58 CET 2008
Lieber Herr Neumann,
zunächst eine ganz grundsätzliche Bemerkung zu den beiden Skripten, die weiter
unten folgen. Mit dem ersten wird eine Wortformenliste erzeugt - und keine
Wortliste. Ein ähnliches Beispiel dazu finden Sie auch im Tustep-Handbuch.
#============== schnipp =============================================
#- ?1 = Platzhalter
#rvorbereite, ?1, -std-, modus=+, loesche=+, parameter=*
Trennzeichenliste
tr | |.|,|;|:|!|?|"|-|(|)||%<>0>@|
Länge der Sortierschlüssel
ssl 30 30
Aufbau der Sortierschlüssel
xs1 |ä|a|ö|o|ü|u|ß|ss|
xs2 |ä|z|ö|z|ü|z|ß|z|
*eof
#sortiere, -std-, -std-, sortierfeld=17+60'0, loesche=+
#datei, ?1.lst, frag=-
#raufbereite, -std-, ?1.lst, modus=+, loesche=+, par=*, proto=-
Sortierschlüssellänge
ssl 60
Länge des 1. und 2. Referenzteils festlegen
rfl 6 3
Ergänzen nach dem 1. Referenzteil
nrt |.|
Ergänzen zwischen den Referenzen
zrf |, |
Referenz vollständig ausgeben
rtw 1
absolute Häufigkeit ausgeben
ah 1
Ergänzen vor und nach absoluter Häufigkeit
vah | (|
nah |*)|
Satzlänge in der Zieldatei festlegen
sl 60 60
*eof
#============== schnapp =============================================
Die Datei mit der Namenserweiterung "lst", die nun entstanden ist, bildet die
Basis für das zweite Skript, das eine Häufigkeitsliste der Wortformen
ausgibt.
#============== schnipp =============================================
#dat, ?1.lst2, frag=-
#kop, ?1.lst, ?1.lst2, mod=+, loe=+, par=*
Nur die Zeilen mit "*)" kopieren
zf+ .*).
ek1 .*).
Vom Anfang bis einschließlich EK1 kopieren
aei 21
*eof
#sv,?1.lst2,-std-,mo=-, loe=+, par=*
Häufigkeitsangabe in den 1. Sortierschlüssel
ak1 .(.
ek1 .*).
Wortform in den 2. und 3. Sortierschlüssel
ek2 . (.
ek3 . (.
Nur eintragen, was zwischen den Grenzen steht
aei 11 11 11
mls 4 30 30
ssl 4 30 30
Zahlen auf 4 Dezimalstellen links auffüllen
dez 4
xs2 .ä.a.ö.o.ü.u.ß.ss.
xs3 .ä.z.ö.z.ü.z.ß.z.
*eof
#sort,-std-,-std-,sort=1+4-f'5+60!,loe=+
#dat, ?1.aus,fragen=-
#ra,-std-, ?1.aus, mo=-, par=*, pro=-
Länge des Sortierschslüssels
ssl 64
*eof
#============== schnipp =============================================
Das war's. Entscheidend ist, dass das erste Skript eine ordentliche Liste
ergibt. Eventuell muss am Parameter TR gearbeitet werden und am
Sortierschlüssel.
Viele Grüße
P.Stahl
Mehr Informationen über die Mailingliste Tustep-Liste