[Tustep-Liste] Sonderzeichen in Times-Font

Wilhelm Ott zrlot01 at uni-tuebingen.de
Di Aug 22 18:22:42 CEST 2023


Lieber Herr Sonder,
liebe Liste,

noch immer kann ich nicht alle Fragen beantworten, die Sie in Ihrer mail
vom 2.8. aufgeworfen haben, insbesondere die Frage nach einer "Liste aller
Zeichen ..., damit ich die Oktalzahlen nicht raten muss".

In TUSTEP gibt es dafür zwar das Makro #*psdickten, das "den Zeichenvorrat
eines PostScript-Fonts, die zugehörigen Adressen (oktal) im zugrundegelgten
Encoding Vector und die Dicktenwerte für diese Zeichen auflistet".

Dieses Makro listet jedoch nur die im "Encoding Vector" des betreffenden
Fonts aufgeführtenn Zeichen auf (vgl. dazu das PostScript Language
Reference manual, https://www.adobe.com/jp/print/postscript/pdfs/PLRM.pdf
auf Seite 773 ff.)  Das TUSTEP-Satzprogramm benutzt den "StandardEncoding
Encoding Vector" (PLRM S. 784), der intern jedoch um einige Zeichen
erweitert ist (u.a. um Umlaute und ß); #*psdickten listet derzeit jedoch
nur die Zeichen auf, denen im ursprünglichen Font eine Adresse zugeordnet ist.

Die oktalen Zeichenadressen in der mit #*psdickten erzeugte Liste sind
auch auch für Fonts, die nicht dem StandardEncoding Encoding Vector
entsprechen, für die Adressierung der dort gezeigten Zeichen geeignet,
wenn man zusätzlich zu den beim Satz in Parameter SCH angeführten Fonts
noch einzelne Zeichen aus weiteren Fonts benutzen möchte. Man kann dann
z.B. in einem Satzauftrag, in dem sonst nur die Times benutzt wird,
mit &!(##32101/251) das Copyright-Zeichen aus der TusLibertineO
(die den IsoLatin1Encoding Encoding Encoding Vector nutzt) ausgeben,
das bei #*psdickten auf der oktalen Adresse 251 angezeigt wird.
Sobald jedoch der Font 32101 auch im Parameter SCH des Satzprogramms
aufgeführt wird, gilt für diesen Font ein anderes Encoding: auf der
oktalen Adresse 251 steht dann - wie bei der Times-Roman - das Zeichen
"quotesingle" wie im StandardEncoding.

Ihre Anfrage hat mich nun bewogen, über einen Überarbeitung und
Erweiterung für Satz und Umgebung an dieser Stelle nachzudenken;
so könnte z.B. bei #*psdickten zu ZEICHENSATZ außer "-" für den
"Standard-Zeichensatz" ein Spezifikationswert vorgesehen werden,
der nicht das originale Font-Encoding, sondern das im Satzprogramm
verwendete Encoding (einschl. der schon erwähnten Erweiterungen)
für die erzeugte Liste zugrunde legt. Möglicherweise sind aber
noch weitere Überarbeitungen in #SATZ und/oder in #*PSAUS
sinnvoll.

Das Ende dieser Überlegungen möchte ich jedoch nicht mehr
abwarten, und habe deswegen endlich versucht, Ihre übrigen Fragen
bzw. Anliegen durch das beiliegende Beispiel zu beantworten.

Außer der Frage nach den oktalen Adressen suchten Sie vor
allem nach der Möglichkeit, "in der pdf-Datei nicht noch
den Font 'Symbol' mit drin zu haben".

In dem beiliegenden Beispiel-Programm sonderz_os.tu (os steht
für "ohne Symbol") habe ich deshalb eine Lösung gewählt,
die ohne den Rückgriff auf die "Symbol" auskommt.

Als Anfang 1990 der erste PostScript-Drucker im ZDV installiert
war und wir im Dezember 1992 die Unterstützung von PostScript-
Druckern und -Belichtern für das Satzprogramm freigeben
konnten, galt: "most PostScript products include software
for 13 standard fonts from the Times, Helvetica, Courier,
and Symbol families" (PLRM S. 773). Um möglichst viele
Geräte-Typen damit relativ einfach nutzen zu können, haben
wir uns an dem StandardEncoding Encoding Vector orientiert
und die dort nicht enthaltenen Sonderzeichen aus dem
Symbol Character Set ergänzt. Das ist der Grund dafür,
dass auch für Zeichen, die im Times-Roman-Font zwar
vorhanden, aber im StandardEncoding nicht aufgeführt
sind, auf den Symbol Font zurückgegriffen wird.

Sie haben das bei den Zeichen Copyright und Malkreuz
mit den Kodierungen #(c) bzw. ^* festgestellt.

Um das Einbinden des Symbol-Fonts zu vermeiden, habe ich
in beiliegendem Beispiel diese Zeichen über empty tags
kodiert, die aus dem jeweils aktuellen Font diese
Zeichen mit ihren Namen und dem in der Tag-Auflösung
anzugebenden Dicktenwert aufrufen.

Bei den "spitzen Klammern" und der "Tilde" fragten Sie nach
der Richtigkeit der von Ihnen vorgeschlagenen Kodierung.

In beiden Fällen ist die von Ihnen gewählte Lösung richtig:

Für die XML-Tags sind nicht die mit ^< und ^> kodierten
Zeichen (oktal) 341 = "angleleft" und 361 = "angleright"
aus dem Symbol-Zeichensatz die richtigen Zeichen, sondern
die Zeichen (oktal) 074 = "less" und 076 = "greater" aus
dem StandardEncoding. In der Beispieldatei finden sie dafür
drei Beispiel-Zeilen. In der letzten habe ich die von Ihnen
gewählte Kodierung über die Zeichennummer benutzt, dabei
jedoch die Schriftnummer jeweils weggelassen, um die
jeweils zum verwendeten Font (normal, kursiv, fett)
passende Form zu erhalten. In den beiden Zeilen davor
sind dafür die Kodierungen #(kl) und #(gr) (TUSTEP
Handbuch 2023, S. 777 und 812 / 813) bzw. < und >
(S.1285) benutzt.

Für die Tilde habe ich, ähnlich wie bei "less" und "greater",
die in Ihrer mail vorgeschlagene Lösung übernommen, jedoch
auch dort die Schriftnummer jeweils weggelassen (dadurch
wird die Tilde im fetten Bereich der Zeile ebenfalls fett).
In der zweiten Zeile ist die Tilde - ähnlich wie bei
Malkreuz und Copyright - durch ein empty tag kodiert,
das das Zeichen über seinen Namen und den zugehörigen
Dicktenwert aufruft. Den Zeichennamen kann man dem PLRM
(S. 780) entnehmen, die Dicktenwerte für die einzelnen
Fonts dem Ergebnis von
   #*psdickten,31801,Times-Roman,da=tr.ps   bzw.
   #*psdickten,31803,Times-Bold,da=tb.ps    bzw.
   #*psdickten,31802,Times-Italic,da=ti.ps
(falls man die entsprechenden ps-Dateien zuvor eingerichtet
hat).

Für ein Zeichen, das wie die Tilde ausschaut, zeigt das
Handbuch auf Seite 775 das mit #(AEH) kodierte Zeichen
"ähnlich". Ich habe das nicht in das Beispiel aufgenommen,
da #(aeh) das Zeichen "similar" aus dem Symbol-Font
aufruft.

Ich hoffe, dass diese Hinweise für Ihr Projekt noch
nützlich sind.

Mit den besten Grüßen

Wilhelm Ott

----------------------------------------------------------------------
Prof. Dr. Wilhelm Ott 	            phone:  +49-7073-7772
Im Sulztal 8                                +49-7071-987656
D-72119 Ammerbuch                   e-mail: wilhelm.ott at uni-tuebingen.de


On Wed, 2 Aug 2023, Christian Sonder wrote:

> Date: Wed, 2 Aug 2023 14:00:09 +0200
> From: Christian Sonder <ChristianSonder at gmx.de>
> Reply-To: Mailingliste zum Thema TUSTEP <tustep-liste at itug.de>
> To: tustep-liste at itug.de
> Subject: [Tustep-Liste] Sonderzeichen in Times-Font
> 
> Liebe Liste,
>
> ich habe ein kleines Problem mit ein paar Sonderzeichen.
>
> Und zwar setze ich gerade einen Band mit dem in TUSTEP
> eingebauten Font "Times-Roman"(Parameter SCH 31801).
> Für diesen Band möchte ich die folgenden Sonderzeichen drucken:
>
> a) Die spitzen Klammern: Dafür habe ich bisher die Kodierung
> "^<" bzw. "^>" verwendet, aber das gibt mir nicht die für die
> Darstellung eines XML_Tags richtigen Klammern. Die Kodierung
> "<" bzw. ">" führt zu schwarzen Kästchen. Welche Kodierung muss
> ich verwenden? Meine Lösung ist im Moment &!(##31801/074) bzw.
> &!(##31801/076), ist das eine vernünftige Lösung?
>
> b) Das Copyright-Zeichen: Dafür habe ich bisher die Kodierung
> #(c) verwendet, welches wie gewünscht das Copyright-Zeichen
> ausgibt, allerdings wird dieses Zeichen in der PDF-Ausgabe-Datei
> wohl nicht aus dem "Times"-Font genommen, sondern aus dem Font
> "Symbol" und das bereitet dem Verlag in der Weiterverarbeitung
> Probleme. Gibt es das Copyright-Zeichen in der in TUSTEP
> eingebauten "Times" nicht? Was ist hier die beste Lösung, um
> in der PDF nicht noch den Font "Symbol" mit drin zu haben?
> Und wie kann ich mir eine Liste aller Zeichen in dieser "Times"
> anzeigen lassen, damit ich die Oktalzahlen nicht raten muss?
>
> c) Das Malkreuz: Im Moment benutze ich: "^*" als Kodierung,
> doch das gibt das gleichen Problem wie beim Copryright-Zeichen,
> nämlich den Einsatz des Fonts "Symbol".
>
> d) Die Tilde in Links: Hier ist meine Lösung: &!(##31801/176)
> Ist das richtig?
>
> Ich hoffe, es kann mir jemand hierbei helfen.
>
> Viele Grüße
> Christian Sonder
>
> -- 
> Tustep-Liste mailing list
> Tustep-Liste at itug.de
> https://lists.itug.de/cgi-bin/mailman/listinfo/tustep-liste
>
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : sonderz_os.tu
Dateityp    : application/octet-stream
Dateigröße  : 8192 bytes
Beschreibung: 
URL         : <http://lists.itug.de/pipermail/tustep-liste/attachments/20230822/08d81359/attachment.obj>
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : tirom_o.pdf
Dateityp    : application/pdf
Dateigröße  : 23003 bytes
Beschreibung: 
URL         : <http://lists.itug.de/pipermail/tustep-liste/attachments/20230822/08d81359/attachment.pdf>


Mehr Informationen über die Mailingliste Tustep-Liste