Inhalt

Setzen

Netzbrauser

Donald Ervin KnuthWenn Sie auf [T] klicken, können Sie die HTML-Datei, die Sie geöffnet oder erzeugt haben, setzen, das heißt in ein übertragbares Schriftstück hoher Güte (PDF) umwandeln. Dies geschieht mithilfe der TeX-Satzmaschine, einer um das Jahr 1980 von Professor Donald Ervin Knuth und seinen Studenten an der Universität von Stanford entwickelten Anwendung. Der Kern von TeX wurde in der Fassung 3.141592x eingefroren und kann als fehlerfrei betrachtet werden, im Gegensatz zu den meisten anderen Anwendungen dieser Größe. Außerhalb des Kerns kann TeX aber erweitert werden.

Han The ThanhZwischen 1996 und 1998 wurde von Peter Breitenlohner eine Unterstützung für Alphabete mit Schreibung von rechts nach links hinzugefügt, und Hàn Thế Thành hat eine weitere Stufe zur Erzeugung von PDF-Dateien entwickelt, in die PostScript- und TrueType-Schriften eingebettet werden können, ebenso JPG- und PNG-Bilder. Beide Erweiterungen sind in der pdf­e­tex-Programmdatei enthalten.

Der Markenfresser fügt diesem wunderbaren, frei verfügbaren Programm nur gut 300 Kilobyte an TeX-Dateien und noch einmal das Doppelte an Stapel- und PHP-Dateien hinzu, um einen HTML-Satzmarkenzergliederer mit Zeichenmaßberechnung und drei verschiedenen Benutzerschnittstellen zu verwirklichen.

Um die TeX-Satzmaschine zu benutzen, mussten Verfasser bisher Hunderte besonderer Befehle erlernen. Der Markenfresser möchte die Benutzung von TeX erleichtern, da nunmehr grundlegende HTMLHTML- und CSSCSS-Kenntnisse genügen.

Ähnlich wie HTML-Tidy, das im Abschnitt Prüfen beschrieben wird, vermerkt der Markenfresser fehlerhafte Satzmarken in einer Mitschrift mit dem Grundnamen der Eingabedatei und einer LOG-Erweiterung. Dort wird jede bearbeitete Satzmarke aufgelistet, und Fehlermeldungen werden eingefügt, sobald die GMS-Anwendungsschicht oder die TeX-Satzmaschine selbst eine Unregelmäßigkeit entdeckt haben.

HTML-Tidy und GMS stimmen in ihren Warnungen und Fehlermeldungen nicht immer überein. Beispielsweise bemängelt der Markenfresser möglicherweise fehlende Endmarken oder fehlende Anführungsstriche bei Kennwerten, obwohl HTML-Tidy eine strikte HTML-Bewertung ohne Warnungen erteilt, weil GMS dem Verfasser helfen möchte, gültige XHTML-Schriftstücke anzufertigen. Der Markenfresser prüft aber nicht, ob Kleinbuchstaben für alle Satzmarken und Kennwertnamen verwendet werden, wenn die Datei in der Anfangszeile als XHTML-Schriftstück eingestuft ist. GMS duldet auch Zeichen mit den Tafelfeldnummern € bis Ÿ, die gemäß Richtlinie nicht benutzt werden sollen, obwohl Microsoft dort wichtiges Dinge wie Striche, Euro-Zeichen, französische œ-Verschmelzungen und deutsche „Gänsefüßchen“ untergebracht hat.

Es ist aufschlussreich, beide Prüfergebnisse mit den HTMLHTML- und XHTMLXHTML-Richtlinien zu vergleichen.

Am Ende der Mitschrift finden Sie eine Verknüpfung zur PDF-Ausgabedatei, die Sie herunterladen und speichern können, wenn GMS auf einem entfernten Netzwerkrechner läuft. Klicken Sie mit der rechten Maustaste auf die Verknüpfung und wählen Sie in der Befehlsliste Ziel speichern unter.

Textfenster

Sie können eine gegebene HTML-Datei setzen, indem Sie auf [T] drücken. Das Ergebnis der Satzmarkenprüfung wird im Textbetrachter angezeigt; drücken Sie [Q] (Linux) oder [Esc] (Dos, Windows), um ihn wieder zu verlassen.

Sie können eine andere TeX-Anwendungsdatei auswählen (tex, etex, pdftex oder pdfetex), indem Sie [S] und [P] drücken. Diese und die zugehörige Meldungsliste (pool-Datei) muss im Suchpfad oder in [GMS­_BI­NA­RIES] zu finden sein, dem zur Betriebsumgebung gehörenden Unterverzeichnis von [GMS­_ROOT]/binbin.

Befehlszeile

Geben Sie gms -t /my­fold­er/my­file.htm (Linux) oder gms /t x:\my­fold­er\my­file.htm (Dos, Windows) ein, um eine HTML-Datei zu setzen. Wenn zuvor bereits ein Aufruf zum Öffnen oder Erzeugen erfolgt ist, genügen die Befehle gms -t oder gms /t.

Außerdem können Sie den Aufruf [GMS­_BI­NA­RIES]/pdf­etex -prog­name=ge­rolf [GMS­_ROOT]/doc/de­fault/de­fault.htm verwenden, wenn der Platzhalter [TEX­IN­PUTS] auf [GMS­_ROOT]/etc gesetzt wird.

Fehler

Da die Betriebsumgebung einen Festplattenpuffer besitzt, verläuft das zweite Setzen einer Eingabedatei gewöhnlich schneller als das erste. Wenn das Textfenster verdeckt wird, lässt sich das Setzen unter Windows NT/XP weiter beschleunigen. Der Markenfresser zeigt in der Vorgangsleiste am unteren Bildschirmrand an, ob er noch beschäftigt ist oder wie lange der Durchlauf gedauert hat. Im Netzbrauser – und unter Windows 9x auch in den anderen Schnittstellen – erhalten Sie leider keine Rückmeldung während des laufenden Satzvorgangs, obwohl dieser einige Zeit in Anspruch nehmen kann.

Gelegentlich werden Sie in Ihrer Satzmarkendatei einen Fehler entdecken, während TeX gerade läuft. Im Textfenster und in der Befehlszeile können Sie den Vorgang abbrechen, indem Sie [Strg+C] drücken. Wenn die Frage gestellt wird, was jetzt gemacht werden soll, antworten Sie [X][Eingabe], oder drücken Sie noch einmal [Strg+C], um die weitere Erstellung der Ausgabedatei abzubrechen. Unter Dos und Windows wird weiterhin gefragt: Stapelvorgang abbrechen (J/N)? Antworten Sie [N][Eingabe], um zur GMS-Befehlsauswahl zurückzukehren.

Falls TeX beim Verarbeiten eines großen Schriftstücks mit der Meldung Speicher erschöpft abbricht, ändern Sie den Wert, der dem Platzhalter main_memory in der Einrichtungsdatei tex­mf.cnf zugewiesen ist. Anschließend ist ein Rücksetzen der sogenannten TeX-Formatdatei erforderlich.

Bilder

Die pdfTeX-Satzmaschine kann Bilder einbetten, wenn sie im Format JPG (für Lichtbilder), PNG (für Zeichnungen mit verminderter Farbzahl) oder PDF (zum Beispiel mit Acrobat oder pdfTeX erzeugte Einzelseiten) vorliegen. Nicht unterstützt wird das im weltweiten Datennetz beliebte Bilddateiformat GIF. Eine Anpassung Ihrer Satzmarkendatei ist aber nicht notwendig: Stellen Sie lediglich eine JPG- oder PNG-Datei mit dem gleichen Grundnamen für jedes eingefügte GIF-Bild im gleichen Verzeichnis bereit.

Sie können dann GIF-Bilder mit niedriger Auflösung und kurzer Ladezeit für die Anzeige im Netzbrauser verwenden, während GMS bei Anforderung einer GIF-Datei nach einer entsprechenden JPG- oder PNG-Datei sucht, die auch eine höhere Auflösung haben darf. Wenn solch eine Datei dort jedoch nicht gefunden wird, kann auch eine andere Datei gleichen Namens aus dem Suchpfad für Schriftstücke geliefert werden.

Sie können in Ihrer Satzmarkendatei, um nicht mit zwei verschiedenen Dateiformaten zu arbeiten, ausschließlich PNG-Bilder verwenden, doch der Internet Explorer 3x und auch der frühe Netscape Navigator 4x geben sie noch nicht wieder. JPG-Dateien als Ersatz für GIF-Bilder sind oft größer, aber schlechter. GMS setzt 1 Zoll = 25.4mm = 72pt = 72px, also 1px = 1pt, um den Seitenentwurf zu vereinfachen. Dies entspricht allerdings nicht der CSS2-Richtlinie.

Gestalt

Nachstehend das Verfahren zur Anpassung einer Satzmarkendatei für den Druck mit GMS und Acrobat Reader, ohne deren Erscheinung in einem Brauser auf dem Bildschirm zu verändern:

Silben

Sie können GMS die Sprache Ihres Schriftstückes bekanntgeben und die zugehörigen Trennregeln verwenden, indem Sie beispielsweise <html lang = "en-UK"> für britisches Englisch eintragen. Die Sprachnamenkürzel sind in der Richtlinie ISO 639.2 festgelegt. Wenn Sie falsche oder fehlende Silbentrennungen in der PDF-Ausgabe entdecken, verwenden Sie weiche Trennstriche wie in Man&shy;u&shy;skript oder Ap&shy;pen&shy;dix. Alte Netzbrauser wie Internet Explorer 3x und Netscape Navigator 4x stellen &shy; jedoch als ständig sichtbaren Bindestrich dar.

Zwischen 1996 und 2006 wurden die deutschen Rechtschreib- und Trennregeln verändert. In GMS können Sie die neuen Trennregeln verwenden, wenn Sie <html lang = "de-rf"> in Ihrer Satzmarkendatei eintragen. Bei alten Texten genügt der Eintrag <html lang = "de"> noch nicht ganz, weil es Zusatzregeln zur Veränderung der Schreibung mancher Worte gibt, wenn diese getrennt werden. Bespielsweise müssen Sie Bä<span­>ck</span­>er und Be<span­>tt</span­>uch schreiben, wenn Sie GMS veranlassen wollen, bei Bedarf die Sondertrennung Bäcker/Bäk-ker und Bettuch/Bett-tuch vorzunehmen.

Wenn in einer beliebigen Sprache ein Wort in unerwünschter Weise getrennt wird, können Sie die erlaubten Stellen mit weichen &shy;-Trennstrichen kennzeichnen. Ein Wort wird nicht getrennt, wenn es von Nicht-Block-Marken wie <span> eingeschlossen ist, sofern diese nicht auch ein folgendes Leer- oder Satzzeichen einschließen.

Ahnen

Seit Fassung 0.06a unterstützt Gerolfs Markenfresser Satzmarken zur Ahnenforschung, wie sie in der Richtlinie Gedcom XML 6.0 festgelegt sind. Während sich die Beispieldatei gedcom60.xml unmittelbar im GMS-Textfenster öffnen lässt, ist dies mit der Netzbrauser-Schnittstelle noch nicht möglich. Hierfür wird zunächst ein Doppel dieser Datei mit dem Namen gedcom60.htm benötigt.

Für andere Sprachen als Englisch müssen Sie den zu erzeugenden Inhalt ändern, der am Ende der Gestaltungsvorlage ged­com60.css festgelegt wird, beispielsweise ‘Gender:before {content: "Geschlecht: "}’ für Deutsch. Der Internet Explorer erzeugt diesen Inhalt allerdings nicht; verwenden Sie daher Mozilla Firefox oder Opera zum Überfliegen der Quelldatei. Die GMS-Ausgabedatei ged­com­60.pdf setzt auch Bilder als erzeugten Inhalt für <URI>-Satzmarken, wenn entsprechende JPG- oder PNG-Dateien auf dem GMS-Suchpfad im Dateibaum des Rechners gefunden werden.

Anhang