[Tustep-Liste] Wuensche an #Vergleiche (3)

Gottfried Reeg reeg at zedat.fu-berlin.de
Mo Mai 26 16:46:18 CEST 2003


Lieber Michael,


> naemlich. Und das fuehrt mich zu einem weiteren Punkt,
> den ich zur Sprache bringen moechte: Das #vergleiche
> entspricht so, wie es jetzt ist, eigentlich nicht ganz
> der TUSTEP-Philosophie (sit venia verbo), denn es ist
> eine Blackbox, deren Funktionieren vom Anwender kaum
> gesteuert werden kann. Fuer den Fall, dass die Verglei-
> cheresultate nicht den Erwartungen entsprechen, hat man
> keine Chance, durch Parametrierung (im Newspeak sagt man
> heute ja wohl 'Feintuning') die Leistung zu veraendern
> und evtl. zu verbessern. Die angedachte Moeglichkeit,
> einen neuen bzw. anderen Modus anzuwaehlen, ist ein
> weiterer Schritt in die von mir vorgeschlagene Richtung.
> An dieser Stelle kann vielleicht auch der Programmautor
> (der die Moeglichkeit dazu am besten absieht) eine Vor-
> stellung davon mit einbringen, welche Schraeubchen dem
> Benutzer zur Beeinflussung angeboten werden koennten.
>

Für das Feintunig, gab es in einer früheren Version
einmal eine Möglichkeit, die in keinem Handbuch beschrieben
war, mir aber wertvolle Dienste leistete, da ich damit
das Ergebnis des Vergleiches verbessern konnte,
und zwar konnte angegeben werden, mit wievielen Wörtern
er in einem bestimmten Bereich bei der Zuordnung des Textes
beginnen sollte. Zudem konnte angegeben werden, wieviel Prozent
an Übereinstimmung vorhanden sein mußte, Ich weiß nicht mehr,
wie die Parameter hießen, aber  etwa so:

anzahl der Wörter:    2  5     10
Bereich               20 100  200
Prozent               100 80   60

Vielledicht gab es auch noch einen vierten Wert.
Die Werte sind jetzt völlig aus der Luft gegriffen. Soweit ich
mich entsinne, konnten sie für zwei Stufen des Vergleichs
angegeben werden. Nach einigen Versuchen hat ich dann schließlich
eine Einstellung, die bei den  hebräischen, rabbinischen Texte
zu einem beseren Ergebnis führten. Ich weiß nur noch, daß ich
mit zwei Wörtern, die übereinstimmten, besser gefahren bin, als
mit der Standardeinstellung von drei Wörtern.
Die günstigste Einstellung herauszufinden, war jedoch nur
noch längerem Ausprobieren herauszubekommen. Ein Erklärung,
woran es lag, hatte ich nie. D.h. es gab zwar ein Feintunig,
aber immer noch mit einem großen Schuß "Black-Box".
Jedoch habe ich diese Möglichkeit der Einstellung bei dem
jetzigen VE vermißt. Aber vielleicht läßt sich das
wieder einbauen?

Viele Grüße
Gottfried



Mehr Informationen über die Mailingliste Tustep-Liste