[Tustep-Liste] XML-Daten: Transformation und Selektion

Thomas Kollatz kol at steinheim-institut.org
Mi Nov 12 14:38:24 CET 2008


Lieber Herr Schälkle,
danke für die Erläuterungen zu Spalten und ctrl-r, das habe ich gut  
verstanden.

Ich bitte seit zwei Wochen eine TEI-XML ("beta").Version, der von uns  
erarbeiteten Inschriften an, die mittels TUSCRIPT "on the fly"  
generiert werden.
Vielleicht ist das ja (Roh)Material für die Beispielsammlung.

Bsp.: Inschrift 3361 Hamburg (geht genauso für jede der rund 14.000  
Inschriften)
http://www.steinheim-institut.de:50580/cgi-bin/epidat? 
function=Ins&sel=hha

Durch mouseclick auf Export öffnet sich ein Exportmenu (tei/xml oder  
plain oder xhtml):
http://www.steinheim-institut.de:50580/cgi-bin/epidat? 
function=out&sel=hha&inv=3361

durch mouseclick auf TEI/XML "anzeigen" (nicht alle browser können  
das im Zweifelsfall hilft die Quellansicht):
http://www.steinheim-institut.de:50580/cgi-bin/epixml? 
xfunction=Ins&xsel=hha&xinv=3361

> Hierfür benötige ich Aufgabenstellungen aus der Praxis.

Mir war es wichtig in TUSTEP arbeiten zu können, weils mächtig und  
schnell ist, und dabei aber auch die relative Gewißheit zu haben,  
unsere mühsam erarbeiteten Inhalte möglichst sicher und möglichst  
langfristig programmunabhängig anbieten / archivieren zu können.
Das geht sehr elegant mittels des TUSTEP-Dateizugriffs mit der option  
structures,
damit gebe ich plain-Text / TEI/XML, und ab und an auch für #sa aus  
(z.Zt. bastle ich  an einem Latex-Export)  all dies mehr oder weniger  
mit demselben Muster.)

Schön wäre aber einmal den umgekehrten Weg zu gehen ... also aus  
einem stark strukturierten Archivformat eine TUSTEP structure zu  
gewinnen (die je notwendige Schachtlungstiefe müsste man vielleicht  
varieren können, epigraphische Daten sind nicht wesentlich anders  
strukturiert wie Wörterbücher / Poesie / Texte / Manuskripte in  
TEI ... könnte also vielleicht ein allgemeines Problem/Bedürfnis/ 
Wunsch sein.

Die TUSTEP structure Variablennamen könnten vielleicht aus dem  
vorliegenden tei-markup genommen werden
also etwa:
$$ structure tei.2
"<teiHeader>"  + "<fileDesc> <titleStmt>< title>" title +"</title>"  
usw. + ...
*"<text><body>" + <div type="edition n="text"> edition + </div>
$$ endstructure

Tja ganz so einfach ist es dann doch nicht, aber interessant wäre  
schon wenn es einen Weg gäbe die
TEXTDATEN im Beispiel den drei div type's zuzuordnen:

edition
translation
commentary

Wie gesagt, das ist einfach eine hypothetische Aufgabenstellung, ich  
brauch das zur Zeit nicht, es ist vielmehr etwas das ich gerne mal  
ausprobieren möchte. Relevanz könnte es schon haben, immer mehr Daten  
liegen in TEI-XML vor, die man wahrscheinlich im Fall der Fälle   
nicht immer im xml-editor (ü)be(r)arbeiten will, sondern in TUSTEP,  
dabei  aber potenziell die Möglichkeit haben (via structure)  
irgendwann einmal wieder nach TEI-XML auszugeben.

PS Es gibt draussen in der Welt auch jede Menge epigraphischer Daten,  
die nur im TEI-XML Format vorliegen ...
z.B. hier:

html:
http://insaph.kcl.ac.uk/ala2004/inscription/eAla006.html

tei-xml
http://insaph.kcl.ac.uk/ala2004/redist/inscriptions/eAla006.xml

so das wars auch schon, wahrscheinlich ein bischen wirr, das ganze

Herzliche Grüße
THOMAS KOLLATZ

drs Thomas Kollatz  - wissenschaftlicher Mitarbeiter / research  
assistant
* Salomon Ludwig Steinheim-Institut fuer deutsch-juedische Geschichte
   D-47057 Duisburg  Geibelstr. 41 T 0203-370071  F 0203-373380
* Geschichtszentrum euregio rhein-maas-nord T 02151-5137430
Route <http://maps.google.de/maps?f=q&hl=de&q=Geibelstr.+41,+Du>
Homepage <http://steinheim-institut.de/das_institut/mitarbeiter/ 
kollatz/index.xml>
Epigraphische Datenbank <http://www.steinheim-institut.de:50580/cgi- 
bin/epidat>



Mehr Informationen über die Mailingliste Tustep-Liste