From carls at saw-leipzig.de Tue Apr 25 14:12:05 2017 From: carls at saw-leipzig.de (Dr. Wieland Carls) Date: Tue, 25 Apr 2017 14:12:05 +0200 (CEST) Subject: [Tustep-Liste] Spaltensatz In-Reply-To: Message-ID: <72914e1c-2405-47ab-b3a8-420abf029130@zimbra.saw-leipzig.de> Leipzig, 25. April 2017 ________________________________________________________________ Liebe TustepIaner*innen, aus irgendeinem Grund will bei mit der Spaltensatz nicht (mehr) klappen. Jetzt bin ich verunsichert, weil es schon mal sehr gut funktioniert hat. Ich bin eigentlich davon ausgegangen, dass ich mehrspaltingen Satz auch ohne #*sumbruch erreiche, wenn ich an der betreffenden Stelle &s!(n,mmm) sowie nach dem Ende des mehrspaltigen Teils &!s{ eingebe. Der Text dazwischen ist nur mit Zeilenwechselanweisungen ausgezeichnet. Leider führt das nicht zum gewünschten Ergegnis. Auch wenn ich #*sumbruch verwende, komme ich nicht zu einem wirklich befriedigenden Ergebnis. Meine Daten sehen in etwa so aus: &!s(2,160) 001 test, teste, testen
001 test, teste, testen
001 test, teste, testen
001 test, teste, testen
001 test, teste, testen
001 test, teste, testen
001 test, teste, testen
001 test, teste, testen
001 test, teste, testen
001 test, teste, testen
001 test, teste, testen
001 test, teste, testen
001 test, teste, testen
001 test, teste, testen &!s[ Hat jemand eine Idee, was ich übersehen haben? Vielen Dank und beste Grüße aus Leipzig Wieland Carls ________________________________________________________________ Dr. Wieland Carls Sächsische Akademie der Wissenschaften zu Leipzig Arbeitsstelle: „Das sächsisch-magdeburgische Recht als kulturelles Bindeglied zwischen den Rechtsordnungen Ost- und Mitteleuropas“ Postfach 100 440 – 04004 Leipzig Karl-Tauchnitz-Straße 1 04107 Leipzig T: +49 341 7 11 53 27 F: +49 341 7 11 53 99 27 carls at saw-leipzig.de www.saw-leipzig.de/smr www.magdeburger-recht.eu _________________________________________________________________ From carls at saw-leipzig.de Tue Apr 25 18:35:35 2017 From: carls at saw-leipzig.de (Dr. Wieland Carls) Date: Tue, 25 Apr 2017 18:35:35 +0200 (CEST) Subject: [Tustep-Liste] =?utf-8?q?Spaltensatz_-_Nachtrag_bzw=2E_R=C3=BCckz?= =?utf-8?q?ieher?= In-Reply-To: <72914e1c-2405-47ab-b3a8-420abf029130@zimbra.saw-leipzig.de> Message-ID: <997a5b1c-814e-419a-b806-9771f83a21ec@zimbra.saw-leipzig.de> Leipzig, 25. April 2017 ________________________________________________________________ Liebe TustepIaner*innen, inzwischen bin ich soweit, dass ich sicher bin, den Fehler selber in meine Parameter eingebaut zu haben ... Ich danke allen, die sich inzwischen vielleicht schon Gedanken zu meinem Problem gemacht haben. Mit den besten Grüßen aus Leipzig, Wieland Carls ________________________________________________________________ Dr. Wieland Carls Sächsische Akademie der Wissenschaften zu Leipzig Arbeitsstelle: „Das sächsisch-magdeburgische Recht als kulturelles Bindeglied zwischen den Rechtsordnungen Ost- und Mitteleuropas“ Postfach 100 440 – 04004 Leipzig Karl-Tauchnitz-Straße 1 04107 Leipzig T: +49 341 7 11 53 27 F: +49 341 7 11 53 99 27 carls at saw-leipzig.de www.saw-leipzig.de/smr www.magdeburger-recht.eu _________________________________________________________________ From schneiderm at uni-trier.de Thu Apr 27 11:43:49 2017 From: schneiderm at uni-trier.de (Schneider, Matthias) Date: Thu, 27 Apr 2017 09:43:49 +0000 Subject: [Tustep-Liste] Wortliste des Deutschen Message-ID: Liebe Listenleser, im Rahmen einer Wörterbuchauszeichnung wäre es hilfreich, eine Wortliste des Deutschen zu haben, die Wortansetzungen in den verschiedenen Deklinationsvarianten enthält,[1] möglichst umfangreich und qualitativ hochwertig ist, bspw. um verkürzt angesetzte Komposita weitgehend automatisch zu ergänzen. Im fraglichen Wörterbuch finden sich z.B. Ansetzungen wie: "BETRIEB-. ca. 470 zuss. mit betrieb m., meist zu 1 und 3; überwiegend mit fugenelement: -anleitung f. (zu 1): [...]" Da im Text nicht explizit angegeben wird, welches Kompositum mit welchem Fugenelement (hier natürlich 's') gebildet wird, ist ein rein automatischer Zusammenbau ohne Kontrollinstanz zu fehleranfällig. Daher dachte ich an einen Abgleich der maschinell erzeugten Zusammensetzungen mit einer Wortliste wie oben beschrieben, u.U. in Verbindung mit einer parametrisierbaren Unschärfe über die Levensthein-Distanz und anschließender manueller Kontrolle von Zweifelsfällen. Vielleicht hat jemand von Ihnen/von Euch Tipps bzgl. einer entsprechenden Liste oder auch zum generellen Vorgehen? Trennlisten des Deutschen für das #SATZ-Programm, die mir vorliegenden, sind mit rund 28.000 enthaltenen Wörtern im Umfang vermutlich etwas zu klein für den angestrebten Zweck... Vielen Dank und beste Grüße in die Runde Matthias Schneider [1] Konjugationsvarianten sind aufgrund des Anwendungszwecks weniger relevant. ==================================================== |           Matthias Schneider, M.A. |__Kompetenzzentrum für elektronische Erschließungs- |     und Publikationsverfahren in den |     Geisteswissenschaften |__Trier Center for Digital Humanities |__Universität Trier |__DM 341 |__Mail: schneiderm at uni-trier.de |__Homepage: |     http://www.kompetenzzentrum.uni-trier.de |     http://www.m-schneider.eu |__twitter: @ms91tru, @museumdighum |__Telephon: |     + 49 651 201 2935 ==================================================== From ChristianGriesinger at gmx.de Thu Apr 27 12:49:28 2017 From: ChristianGriesinger at gmx.de (Christian Griesinger) Date: Thu, 27 Apr 2017 12:49:28 +0200 Subject: [Tustep-Liste] Wortliste des Deutschen In-Reply-To: References: Message-ID: Lieber Matthias, ich bin sicher, dass das IDS Mannheim, Abteilung Korpuslinguistik, Dir in diesem Fall sicher weiterhelfen kann. Es gibt keine Institution, die für das Gegenwartsdeutsche mehr Materialien hat. Rainer Perkuhn hat auf diversen Tagungen angedeutet, dass sich die Abteilung sehr über Anfragen freuen würde. Viele Grüsse Christian ----- Parzival-Projekt Bern Institut für Germanistik Universität Bern Länggassstrasse 49, D103 CH-3012 Bern, Schweiz Tel.: +41 (0)31 631 34 65 Mail: Christian.Griesinger at germ.unibe.ch URL: http://www.parzival.unibe.ch/ > Gesendet: Donnerstag, 27. April 2017 um 11:43 Uhr > Von: "Schneider, Matthias" > An: "tustep-liste at itug.de" > Betreff: [Tustep-Liste] Wortliste des Deutschen > > Diskussionsforum Tustep-Liste > Weitere Informationen: www.itug.de > ------------------------------------------------------------ > > Liebe Listenleser, > > im Rahmen einer Wörterbuchauszeichnung wäre es hilfreich, eine Wortliste des Deutschen zu haben, die Wortansetzungen in den verschiedenen Deklinationsvarianten enthält,[1] möglichst umfangreich und qualitativ hochwertig ist, bspw. um verkürzt angesetzte Komposita weitgehend automatisch zu ergänzen. > Im fraglichen Wörterbuch finden sich z.B. Ansetzungen wie: > > "BETRIEB-. ca. 470 zuss. mit betrieb m., meist zu 1 und 3; überwiegend mit fugenelement: -anleitung f. (zu 1): [...]" > > Da im Text nicht explizit angegeben wird, welches Kompositum mit welchem Fugenelement (hier natürlich 's') gebildet wird, ist ein rein automatischer Zusammenbau ohne Kontrollinstanz zu fehleranfällig. Daher dachte ich an einen Abgleich der maschinell erzeugten Zusammensetzungen mit einer Wortliste wie oben beschrieben, u.U. in Verbindung mit einer parametrisierbaren Unschärfe über die Levensthein-Distanz und anschließender manueller Kontrolle von Zweifelsfällen. > > Vielleicht hat jemand von Ihnen/von Euch Tipps bzgl. einer entsprechenden Liste oder auch zum generellen Vorgehen? Trennlisten des Deutschen für das #SATZ-Programm, die mir vorliegenden, sind mit rund 28.000 enthaltenen Wörtern im Umfang vermutlich etwas zu klein für den angestrebten Zweck... > > Vielen Dank und beste Grüße in die Runde > Matthias Schneider > > > [1] Konjugationsvarianten sind aufgrund des Anwendungszwecks weniger relevant. > > ==================================================== > |           Matthias Schneider, M.A. > |__Kompetenzzentrum für elektronische Erschließungs- > |     und Publikationsverfahren in den > |     Geisteswissenschaften > |__Trier Center for Digital Humanities > |__Universität Trier > |__DM 341 > |__Mail: schneiderm at uni-trier.de > |__Homepage: > |     http://www.kompetenzzentrum.uni-trier.de > |     http://www.m-schneider.eu > |__twitter: @ms91tru, @museumdighum > |__Telephon: > |     + 49 651 201 2935 > ==================================================== > > ------------------------------------------------------------ > Tustep-Liste at itug.de > https://lists.uni-wuerzburg.de/mailman/listinfo/tustep-liste From tomaselli at rz.uni-leipzig.de Thu Apr 27 13:48:45 2017 From: tomaselli at rz.uni-leipzig.de (=?iso-8859-1?Q?G=FCnter_Tomaselli?=) Date: Thu, 27 Apr 2017 13:48:45 +0200 Subject: [Tustep-Liste] Wortliste des Deutschen In-Reply-To: References: Message-ID: <019301d2bf4c$3a139fb0$ae3adf10$@rz.uni-leipzig.de> Als Listenleser ist mir das Leipziger Wörtersammelprojekt eingefallen: Man hat über Jahre Texte erfasst und Wörter in ihrer Umgebung nach Häufigkeit untersucht. Ein Korpus von 300 Mio. Wörtern (oder mehr) ist eingegangen. Man könnte also trennungskritische Wörter mit verschiedenen Fugenmorphemen suchen und würde bei Auftreten bzw.Nichtauftreten auf Richtigkeit schließen. Genaueres siehe http://corpora.informatik.uni-leipzig.de/de?corpusId=eng-uk_web_2002. Unter dem Autor Horst Rothe verbirgt sich auch ein Sprachverarbeitungsprogramm bzw. -lernprogramm, das Silbentrennung kann. Bei Betrieb hat er 230 Kombinationen drin. Bei Suche nach dem Namen kommt man auf seine Veröffentlichungen - allerdings hat er keine Lust angedeutet, noch auf einem anderen Gebiet aktiv zu werden :- ) Dr. Günter Tomaselli Universität Leipzig, URZ 04109 Leipzig Ritterstr. 12 / Augustusplatz 10 Tel. 0341 97 333 02 -----Ursprüngliche Nachricht----- Von: tustep-liste-bounces at lists.uni-wuerzburg.de [mailto:tustep-liste-bounces at lists.uni-wuerzburg.de] Im Auftrag von Schneider, Matthias Gesendet: Donnerstag, 27. April 2017 11:44 An: tustep-liste at itug.de Betreff: [Tustep-Liste] Wortliste des Deutschen Diskussionsforum Tustep-Liste Weitere Informationen: www.itug.de ------------------------------------------------------------ Liebe Listenleser, im Rahmen einer Wörterbuchauszeichnung wäre es hilfreich, eine Wortliste des Deutschen zu haben, die Wortansetzungen in den verschiedenen Deklinationsvarianten enthält,[1] möglichst umfangreich und qualitativ hochwertig ist, bspw. um verkürzt angesetzte Komposita weitgehend automatisch zu ergänzen. Im fraglichen Wörterbuch finden sich z.B. Ansetzungen wie: "BETRIEB-. ca. 470 zuss. mit betrieb m., meist zu 1 und 3; überwiegend mit fugenelement: -anleitung f. (zu 1): [...]" Da im Text nicht explizit angegeben wird, welches Kompositum mit welchem Fugenelement (hier natürlich 's') gebildet wird, ist ein rein automatischer Zusammenbau ohne Kontrollinstanz zu fehleranfällig. Daher dachte ich an einen Abgleich der maschinell erzeugten Zusammensetzungen mit einer Wortliste wie oben beschrieben, u.U. in Verbindung mit einer parametrisierbaren Unschärfe über die Levensthein-Distanz und anschließender manueller Kontrolle von Zweifelsfällen. Vielleicht hat jemand von Ihnen/von Euch Tipps bzgl. einer entsprechenden Liste oder auch zum generellen Vorgehen? Trennlisten des Deutschen für das #SATZ-Programm, die mir vorliegenden, sind mit rund 28.000 enthaltenen Wörtern im Umfang vermutlich etwas zu klein für den angestrebten Zweck... Vielen Dank und beste Grüße in die Runde Matthias Schneider [1] Konjugationsvarianten sind aufgrund des Anwendungszwecks weniger relevant. ==================================================== |           Matthias Schneider, M.A. |__Kompetenzzentrum für elektronische Erschließungs- |     und Publikationsverfahren in den |     Geisteswissenschaften |__Trier Center for Digital Humanities |__Universität Trier |__DM 341 |__Mail: schneiderm at uni-trier.de |__Homepage: |     http://www.kompetenzzentrum.uni-trier.de |     http://www.m-schneider.eu |__twitter: @ms91tru, @museumdighum |__Telephon: |     + 49 651 201 2935 ==================================================== ------------------------------------------------------------ Tustep-Liste at itug.de https://lists.uni-wuerzburg.de/mailman/listinfo/tustep-liste