<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
<meta content="text/html; charset=ISO-8859-1"
http-equiv="Content-Type">
</head>
<body bgcolor="#ffffff" text="#000000">
<font face="Courier New">Sehr geehrter Herr Stahl,<br>
<br>
eine Möglichkeit, Tags mit Hilfe eines KOPIERE zu indizieren, wäre
vielleicht folgende: <br>
<br>
#ko,QUELLE,ZIEL,-,+,*<br>
sws 1 2<br>
ws+ 1 2<br>
gtu 1
|<<add>>|<</add>>|<<aee>>|<</aee>>|<br>
ta+ 1
|<<add>>|<</add>>|<<aee>>|<</aee>>|<br>
zf 1
|<<add>>|<</add>>|<<aee>>|<</aee>>|<br>
erg 1 |0|<br>
* Die aktuelle Kennung ist als s4-te zum Parameter zf<br>
* angegeben; sie ist also im h0-ten dort angegebenen<br>
* Paar die h1-te Kennung. <br>
rr 1 h0 = (s4 + 1) / 2; h1 = min ( s4, 2 - mod(s4,2) );<br>
rr 1 if (h1.eq.2) then; i0 = b(h0); b(h0) = b(h0) - 1;<br>
rr 1 else; b(h0) = b(h0) + h1; i0 = b(h0); endif;<br>
eiv 1 i0<br>
mtd 1 1<br>
rr 2 if (ws1.eq.1) goto 9;<br>
</font><font face="Courier New">mth 2 3</font><br>
<font face="Courier New">spw 29<br>
spn 17<br>
sp2 17<br>
xxx
|<>>/<<></add|<<>=03add>=01|<>>/<<></aee|<<>=03aee>=01|<br>
*eof<br>
</font><br>
<font face="Courier New">QUELLE enthalte folgende Daten:<br>
<br>
xx <add> aa <aee> <add> <aee> bb
<add> cc </add> bb </aee> </add> aa
</add> xx </aee><br>
</font><br>
<font face="Courier New">Dann steht nach der Ausführung des KOPIERE
in ZIEL der Satz:<br>
<br>
xx <add1> aa <aee1> <add2> <aee2> bb
<add3> cc </add3> bb </aee2> </add2> aa
</add1> xx </aee1><br>
<br>
Mit freundlichen Grüßen<br>
<br>
Niels Bohnert<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
</font><br>
On 12.12.2010 15:42, <a class="moz-txt-link-abbreviated" href="mailto:stahl@germanistik.uni-wuerzburg.de">stahl@germanistik.uni-wuerzburg.de</a> wrote:
<blockquote
cite="mid:20101212154241.18276my8li5bicm9@webmail.uni-wuerzburg.de"
type="cite">Diskussionsforum Tustep-Liste
<br>
Weitere Informationen: <a class="moz-txt-link-abbreviated" href="http://www.itug.de">www.itug.de</a>
<br>
------------------------------------------------------------
<br>
<br>
Liebe Listen-Leserinnen und -Leser,
<br>
<br>
bei der Aufbereitung von XML-Dateien stoße ich immer wieder auf
das Problem, geschachtelte gleichnamige Tags auflösen zu müssen.
Das sieht in den Quelldaten beispielsweise so aus:
<br>
<br>
xx <add> aa <add> bb> <add> cc </add>
bb </add> aa </add> xx
<br>
<br>
Wie kann ich herausfinden, welche Anfang- und Ende-Tags
zusammengehören? Wenn es gelänge, mit einem klassichen #KOPIERE
daraus
<br>
<br>
xx <add1> aa <add2> bb <add3> cc </add3>
bb </add2> aa </add1> xx
<br>
<br>
zu machen, könnte ich die Tags zuverlässig auflösen.
<br>
<br>
Ganz so einfach, wie oben dargestellt, sind die Quelldaten
freilich nicht: Die add-Tags können unterschiedliche Attribute
haben und der sonstige Text ist mit einer Vielzahl an Tags
zersetzt.
<br>
<br>
Für Hinweise wäre ich Ihnen sehr dankbar.
<br>
<br>
Mit besten Grüßen
<br>
P.Stahl
<br>
<br>
------------------------------------------------------------
<br>
<a class="moz-txt-link-abbreviated" href="mailto:Tustep-Liste@itug.de">Tustep-Liste@itug.de</a>
<br>
<a class="moz-txt-link-freetext" href="https://lists.uni-wuerzburg.de/mailman/listinfo/tustep-liste">https://lists.uni-wuerzburg.de/mailman/listinfo/tustep-liste</a>
<br>
<br>
</blockquote>
<br>
<pre class="moz-signature" cols="72">--
Dr. Niels Bohnert
Institut für Cusanus-Forschung
Domfreihof 3
D-54290 Trier
</pre>
</body>
</html>