[Tustep-Liste] Wortliste des Deutschen
Christian Griesinger
ChristianGriesinger at gmx.de
Do Apr 27 12:49:28 CEST 2017
Lieber Matthias,
ich bin sicher, dass das IDS Mannheim, Abteilung Korpuslinguistik, Dir in diesem Fall sicher weiterhelfen kann.
Es gibt keine Institution, die für das Gegenwartsdeutsche mehr Materialien hat. Rainer Perkuhn hat auf diversen
Tagungen angedeutet, dass sich die Abteilung sehr über Anfragen freuen würde.
Viele Grüsse
Christian
-----
Parzival-Projekt Bern
Institut für Germanistik
Universität Bern
Länggassstrasse 49, D103
CH-3012 Bern, Schweiz
Tel.: +41 (0)31 631 34 65
Mail: Christian.Griesinger at germ.unibe.ch
URL: http://www.parzival.unibe.ch/
> Gesendet: Donnerstag, 27. April 2017 um 11:43 Uhr
> Von: "Schneider, Matthias" <schneiderm at uni-trier.de>
> An: "tustep-liste at itug.de" <tustep-liste at itug.de>
> Betreff: [Tustep-Liste] Wortliste des Deutschen
>
> Diskussionsforum Tustep-Liste
> Weitere Informationen: www.itug.de
> ------------------------------------------------------------
>
> Liebe Listenleser,
>
> im Rahmen einer Wörterbuchauszeichnung wäre es hilfreich, eine Wortliste des Deutschen zu haben, die Wortansetzungen in den verschiedenen Deklinationsvarianten enthält,[1] möglichst umfangreich und qualitativ hochwertig ist, bspw. um verkürzt angesetzte Komposita weitgehend automatisch zu ergänzen.
> Im fraglichen Wörterbuch finden sich z.B. Ansetzungen wie:
>
> "BETRIEB-. ca. 470 zuss. mit betrieb m., meist zu 1 und 3; überwiegend mit fugenelement: -anleitung f. (zu 1): [...]"
>
> Da im Text nicht explizit angegeben wird, welches Kompositum mit welchem Fugenelement (hier natürlich 's') gebildet wird, ist ein rein automatischer Zusammenbau ohne Kontrollinstanz zu fehleranfällig. Daher dachte ich an einen Abgleich der maschinell erzeugten Zusammensetzungen mit einer Wortliste wie oben beschrieben, u.U. in Verbindung mit einer parametrisierbaren Unschärfe über die Levensthein-Distanz und anschließender manueller Kontrolle von Zweifelsfällen.
>
> Vielleicht hat jemand von Ihnen/von Euch Tipps bzgl. einer entsprechenden Liste oder auch zum generellen Vorgehen? Trennlisten des Deutschen für das #SATZ-Programm, die mir vorliegenden, sind mit rund 28.000 enthaltenen Wörtern im Umfang vermutlich etwas zu klein für den angestrebten Zweck...
>
> Vielen Dank und beste Grüße in die Runde
> Matthias Schneider
>
>
> [1] Konjugationsvarianten sind aufgrund des Anwendungszwecks weniger relevant.
>
> ====================================================
> | Matthias Schneider, M.A.
> |__Kompetenzzentrum für elektronische Erschließungs-
> | und Publikationsverfahren in den
> | Geisteswissenschaften
> |__Trier Center for Digital Humanities
> |__Universität Trier
> |__DM 341
> |__Mail: schneiderm at uni-trier.de
> |__Homepage:
> | http://www.kompetenzzentrum.uni-trier.de
> | http://www.m-schneider.eu
> |__twitter: @ms91tru, @museumdighum
> |__Telephon:
> | + 49 651 201 2935
> ====================================================
>
> ------------------------------------------------------------
> Tustep-Liste at itug.de
> https://lists.uni-wuerzburg.de/mailman/listinfo/tustep-liste
Mehr Informationen über die Mailingliste Tustep-Liste