[Tustep-Liste] Wuensche an #Vergleiche
Friedhelm Hoffmann
friedhelm.hoffmann at mail.uni-wuerzburg.de
Sa Mai 24 16:38:40 CEST 2003
Lieber Herr Schaelkle,
als Nachtrag zu meinem schon vor einigen Tagen geaeusserten Wunsch
vielleicht noch eine Anregung: Mit Felderkennungen struktuierte Daten
lassen sich bisher mit #vergleiche nur schlecht bearbeiten, da ja immer
wieder die Felderkennungen als Uebereinstimmungen gefunden werden, so
dass ein einziger fehlender Datensatz in der einen Datei zu einer schier
unendlichen Liste von Abweichungen fuehrt (Aufsatzpunkte jetzt mal
ausser Acht gelassen). Das ist ja schon in der Tustepliste angesprochen
worden. Wenn aber auch der Inhalt z.B. des ersten Feldes noch gleich ist
(also nicht nur die Kennungen), dann wird wieder eine Uebereinstimmung
gefunden und danach wieder jede Menge Abweichungen, obwohl z.B. in der
einen Version nur ein weiterer Datensatz mit zufaellig gleichem
Feldinhalt wie im vorangehenden eingeschoben ist.
Koennte es daher nicht sinnvoll sein, durch eine Art von aa- und
ae-Karten (und einigen Zusaetzen) die Moeglichkeit zu schaffen, dass
Tustep quasi nicht sofort eine Uebereinstimmung oder Abweichung auf
Zeichenebene protokolliert, sondern versucht, groessere Abschnitte
miteinander zu parallelisieren, und auf diese Weise erkennen kann, wo
irgendwo lediglich ein (zwar durchaus aehnlich gebauter bzw. partiell
uebereinstimmender) Abschnitt eingefuegt oder entfernt ist?
Man haette dann im Idealfall im #vergleiche ein Werkzeug in der Hand,
mit dem man Uebereinstimmungen/Abweichungen auch gewichten koennte.
Ueber Parameter sollte man z.B. steuern koennen, ob etwa die weitgehende
Uebereinstimmung eines ganzen Abschnittes schwerer wiegt, so dass die
beiden Abschnitte der verglichenen Versionen parallelisiert werden,
obwohl z.B. der Anfang (lokal) unterschiedlich ist. Oder eben genau
umgekehrt.
Mit vielen Gruessen
F. Hoffmann
Mehr Informationen über die Mailingliste Tustep-Liste