[Tustep-Liste] XML-Daten: Transformation und Selektion
Thomas Kollatz
kol at steinheim-institut.org
Mi Nov 12 14:38:24 CET 2008
Lieber Herr Schälkle,
danke für die Erläuterungen zu Spalten und ctrl-r, das habe ich gut
verstanden.
Ich bitte seit zwei Wochen eine TEI-XML ("beta").Version, der von uns
erarbeiteten Inschriften an, die mittels TUSCRIPT "on the fly"
generiert werden.
Vielleicht ist das ja (Roh)Material für die Beispielsammlung.
Bsp.: Inschrift 3361 Hamburg (geht genauso für jede der rund 14.000
Inschriften)
http://www.steinheim-institut.de:50580/cgi-bin/epidat?
function=Ins&sel=hha
Durch mouseclick auf Export öffnet sich ein Exportmenu (tei/xml oder
plain oder xhtml):
http://www.steinheim-institut.de:50580/cgi-bin/epidat?
function=out&sel=hha&inv=3361
durch mouseclick auf TEI/XML "anzeigen" (nicht alle browser können
das im Zweifelsfall hilft die Quellansicht):
http://www.steinheim-institut.de:50580/cgi-bin/epixml?
xfunction=Ins&xsel=hha&xinv=3361
> Hierfür benötige ich Aufgabenstellungen aus der Praxis.
Mir war es wichtig in TUSTEP arbeiten zu können, weils mächtig und
schnell ist, und dabei aber auch die relative Gewißheit zu haben,
unsere mühsam erarbeiteten Inhalte möglichst sicher und möglichst
langfristig programmunabhängig anbieten / archivieren zu können.
Das geht sehr elegant mittels des TUSTEP-Dateizugriffs mit der option
structures,
damit gebe ich plain-Text / TEI/XML, und ab und an auch für #sa aus
(z.Zt. bastle ich an einem Latex-Export) all dies mehr oder weniger
mit demselben Muster.)
Schön wäre aber einmal den umgekehrten Weg zu gehen ... also aus
einem stark strukturierten Archivformat eine TUSTEP structure zu
gewinnen (die je notwendige Schachtlungstiefe müsste man vielleicht
varieren können, epigraphische Daten sind nicht wesentlich anders
strukturiert wie Wörterbücher / Poesie / Texte / Manuskripte in
TEI ... könnte also vielleicht ein allgemeines Problem/Bedürfnis/
Wunsch sein.
Die TUSTEP structure Variablennamen könnten vielleicht aus dem
vorliegenden tei-markup genommen werden
also etwa:
$$ structure tei.2
"<teiHeader>" + "<fileDesc> <titleStmt>< title>" title +"</title>"
usw. + ...
*"<text><body>" + <div type="edition n="text"> edition + </div>
$$ endstructure
Tja ganz so einfach ist es dann doch nicht, aber interessant wäre
schon wenn es einen Weg gäbe die
TEXTDATEN im Beispiel den drei div type's zuzuordnen:
edition
translation
commentary
Wie gesagt, das ist einfach eine hypothetische Aufgabenstellung, ich
brauch das zur Zeit nicht, es ist vielmehr etwas das ich gerne mal
ausprobieren möchte. Relevanz könnte es schon haben, immer mehr Daten
liegen in TEI-XML vor, die man wahrscheinlich im Fall der Fälle
nicht immer im xml-editor (ü)be(r)arbeiten will, sondern in TUSTEP,
dabei aber potenziell die Möglichkeit haben (via structure)
irgendwann einmal wieder nach TEI-XML auszugeben.
PS Es gibt draussen in der Welt auch jede Menge epigraphischer Daten,
die nur im TEI-XML Format vorliegen ...
z.B. hier:
html:
http://insaph.kcl.ac.uk/ala2004/inscription/eAla006.html
tei-xml
http://insaph.kcl.ac.uk/ala2004/redist/inscriptions/eAla006.xml
so das wars auch schon, wahrscheinlich ein bischen wirr, das ganze
Herzliche Grüße
THOMAS KOLLATZ
drs Thomas Kollatz - wissenschaftlicher Mitarbeiter / research
assistant
* Salomon Ludwig Steinheim-Institut fuer deutsch-juedische Geschichte
D-47057 Duisburg Geibelstr. 41 T 0203-370071 F 0203-373380
* Geschichtszentrum euregio rhein-maas-nord T 02151-5137430
Route <http://maps.google.de/maps?f=q&hl=de&q=Geibelstr.+41,+Du>
Homepage <http://steinheim-institut.de/das_institut/mitarbeiter/
kollatz/index.xml>
Epigraphische Datenbank <http://www.steinheim-institut.de:50580/cgi-
bin/epidat>
Mehr Informationen über die Mailingliste Tustep-Liste