[Tustep-Liste] Worthaeufigkeitsliste - Danke

Thomas Neumann neumann_thomas at hotmail.com
Fr Feb 8 11:28:49 CET 2008


Liebe Tustepler,

Krankheit hat eine schnellere Reaktion verhindert. Danke 
fuer die Worthaeufigkeitsbeispiele.
Mfg
Thomas Neumann

  ###############################

  ##                                 
  ##  Dr. Thomas Neumann
  ##    Vogelsangstrasse 10
  ##    D-71254 Ditzingen 
  ##    
  ##  e-mail:    neumann_thomas at hotmail.com  
  ##             neumann_thomas at t-online.de       
  ##                    
  ###############################

> From: trauth at uni-trier.de
> To: tustep-liste at itug.de
> Date: Wed, 23 Jan 2008 18:43:05 +0100
> Subject: Re: [Tustep-Liste] Worthaeufigkeitsliste
> 
> Diskussionsforum Tustep-Liste
> Weitere Informationen: www.itug.de
> ------------------------------------------------------------
> 
> 
> Lieber Herr Neumann,
> 
> Sie haben zwar schon etliche brauchbare Loesungen
> erhalten, aber bei Ihrer Formulierung
> 
> > Es hat doch bestimmt jemand aus der KOPIERE-Fraktion
> > ein kleines Prograemmchen...
> 
> fuehle ich mich irgendwie (wieso eigentlich?) per-
> soenlich angesprochen. Da will ich meinen Senf gerne
> dazugeben, und zwar in einer Weise, die moeglichst
> wenig Projektspezifisches, ersatzweise aber ein
> paar Kommentare enthaelt. Probieren Sie mal die
> anhaengende kleine Prozedur aus, zuerst ohne Ver-
> aenderungen, dann ggf. mit Ergaenzungen an den
> markierten Stellen.
> 
> Viele Gruesse reihum von
> 
> Michael Trauth
> 
> 
> =====================================================
> 
> #-   Einfache Prozedur zur Herstellung eines
> #-   Häufigkeitswörterbuchs:
> 
> #de,,*
> QU = quelldatei
> *eof
> 
> #da,tmp.1'tmp.2'tmp.3,fr=-
> #ko,<QU>,tmp.1,,+,*
>         * Definition aller Zeichen, die im Inneren
>         * eines Wortes vorkommen (die Liste muß ggf.
>         * ergänzt werden, z.B. wenn Bindestrich-Wörter
>         * als ein ganzes Wort behandelt werden und etwa
>         * Zahlen ebenfalls als Wörter gelten sollen):
> <wz       |</|%>@</|%>@>@</|%>@%>@>@</|
> <wz       |%>@#.</|%>@>@#.</|%>@%>@>@#.</|
> <wz       |#.</|#;<%</|#!<%</|#">%|
>         * Erst alle Backslashes (= alle fakultativen
>         * Trennstellen) rausschmeißen:
> xx    1   :\<|<[wz]:::%<>\:
>         * Dann alle Spitzklammern-Tags und alle
>         * Zeichenformatierungen eliminieren:
> >tz       <%><<<>>
> xx    2   :<<<>>[tz]>>::
> xx    2   :#>%+::#>%-::
>         * Zuletzt alles in Blanks austauschen,
>         * ausgenommen natürlich die Wörter selbst:
> xx    3   ::<[wz]::<%: ::
> *eof
> 
> #-  Jetzt den Text anhand der Spatien/Blanks in Wörter
> #-  zerlegen und fürs alphabetische Sortieren vorbereiten:
> 
> #rv,tmp.1,tmp.2,mo=-,lo=+,pa=*
>         * Als Trennzeichen zwischen Wörtern soll das
>         * Blank gelten:
> tr        | |
>         * Angaben fürs Sortieren:
> ssl       30 30
>         * Regeln fürs Sortieren:
> xs1       |ä|ae|ö|oe|ü|ue|ß|ss|%>@><>@||
> xs2       |ä|az|ö|oz|ü|uz|ß|sz|%>@</|<=01X|
> xs2       |%>@>@</|<=01Y|%>@%>@>@</|<=01Z|
> *eof
> 
> #-  Dann diese Wörter sortieren:
> 
> #so,tmp.2,tmp.2,so=1+60,ti=1+60,lo=+
> 
> #-  und schließlich die identischen Wörter
> #-  zusammenfassen und zählen:
> 
> #ra,tmp.2,tmp.3,mo=-,lo=+,pa=*,pr=-
>         * Parameter SSL (= Sortierschlüssel-Länge) ist
>         * obligat: Die Angabe '0' bedeutet, daß der Sor-
>         * tierschlüssel schon im #SO eliminiert wurde.
> ssl       0
>         * Absolute Häufigkeit ausgeben:
> ah        1
> *eof
> 
> ==================================================
> 
> 
> 
> 
> ---------------------------------------------------------------
> Dr. Michael Trauth                  e-mail: trauth at uni-trier.de
> Rechenzentrum                       office: Tel. 0651-201-3413
> der Universitaet                            Fax  0651-201-3921
> Universitaetsring                secretary: Tel. 0651-201-3417
> D-54286 Trier
> ---------------------------------------------------------------
> 
> ------------------------------------------------------------
> Tustep-Liste at itug.de
> https://lists.uni-wuerzburg.de/mailman/listinfo/tustep-liste

_________________________________________________________________
Importieren Sie ganz einfach Ihre E-Mail Adressen in den Messenger!
http://messenger.live.de/community/neuekontakte_adressimport.html
-------------- nächster Teil --------------
Ein Dateianhang mit HTML-Daten wurde abgetrennt...
URL: <https://lists.itug.de/pipermail/tustep-liste/attachments/20080208/8d6fc8cf/attachment.htm>


Mehr Informationen über die Mailingliste Tustep-Liste