• Keine Ergebnisse gefunden

6WDQGDUGLVLHUWH$QZHQGXQJHQYRQ6*0/XQG;0/

2SHQH%RRN

Die Vereinfachungen und Änderungen von XML gegenüber SGML spiegeln sich in den Wohlgeformtheitsregeln für XHTML wieder, d. h., dass einige unter SGML zulässige Kodierungsformen in XHTML nicht erlaubt sind, wie

• sich überlappende Elemente (z. B. E!L!HLQZLFKWLJHU%HJULIIL!E!),

das Auslassen (SGML tag omission) von Endmarken nicht leerer Elemente (z. B.

S!HUVWHU$EVDW]S!]ZHLWHU$EVDW]S!)

• die Angabe von Attributwerten ohne Begrenzer bzw. die Attributminimierung (z. B.

DSSOHWFRGH [FODVV! oder GOFRPSDFW!),

• leere Elemente ohne entsprechende Markierung (z. B. LPJVUF §[JLI§!) und

die Verwendung von Elementausschlüssen (SGML element exclusions), die in XML-basierten DTDs nicht zulässig ist.

Eine Mischung von verschiedenen DTDs bzw. unterschiedlichen XML-Namensräumen innerhalb eines XHTML-Dokuments ist möglich und an vielen Stellen sinnvoll, wie z. B.

die Einbettung von MathML-Formelsatz in einem XHTML-Dokument (vgl. dazu den folgenden Abschnitt). XHTML führt nur minimale substantielle Änderungen gegenüber HTML V. 4.0 ein, wie die Definition des Euro-Symbols als Sonderzeichen in den für XHTML zulässigen Zeichensätzen. Seine hauptsächliche Bedeutung liegt in der (syntak-tischen) Anpassung von HTML an XML; sie spielt im Rahmen dieser Arbeit eine wichti-ge Rolle, da sich die ursprünglich für HTML V 3.2 bzw. V 4.0 formatierten Dokumente nur nach einer Anpassung an XML (XHTML) durch XML-Softwarewerkzeuge verarbei-ten lassen. Diese Anpassungen bestehen im Wesentlichen aus einer Reihe von Erset-zungsroutinen, die analog zu den oben genannten Beispielen nicht XML-kompatible SGML-HTML-Konstrukte konvertieren und in entsprechende XHTML-Elemente um-wandeln.81 Die Rückwärtskompatibilität zur weitgehend SGML-/HTML-basierten WWW-Software ist gleichzeitig ein großer Vorteil.

2SHQH%RRN

Der open eBook-Standard (OEB), der sich derzeit noch im Entwurfsstadium befindet (vgl.

MCCRARY 1999 und http://www.openebook.org), definiert auf der Basis von XML bzw.

HTML ein Kodierungsformat für elektronische Bücher, das sich vor allem für die Aufbe-reitung von Texten zur Nutzung in elektronischen Buchbetrachtungssystemen eignet (vgl.

oben Kap. 3.3):

The purpose of the Open eBook Publication Structure is to provide a specification for rep-resenting the content of electronic books. Specifically:

• The specification is intended to give content providers (e. g. publishers, and others who have content to be displayed) and tool providers minimal and common guidelines which ensure fidelity, accuracy, accessibility, and presentation of electronic content over various electronic book platforms.

• The specification seeks to reflect established content format standards.

81 Dazu gehören die Einführung von empty element-Marken, die Einführung von Trennzeichen für Attributwerte, die Entfernung sich überkreuzender HTML-Marken etc. Die Umwandlung erfolgt mit einem XML-Parser, der die vorliegenden Dokumente mit der XHTML-DTD ab-gleicht; auftretende Fehler wurden klassifiziert und durch eine Sammlung von Ersetzungsrou-tinen beseitigt.

2SHQH%RRN

• The goal of this specification is to provide the purveyors of electronic-book content (pub-lishers, agents, authors et al.) a format for use in providing content to multiple reading sys-tems. [MCCRARY et al. 1999: 1].

Ausgehend von diesen Zielstellungen gilt für die Bestandteile der OEB-DTD:

• Die Syntax von OEB basiert auf XML und ist grundsätzlich erweiterbar; es gelten die oben eingeführten Einschränkungen von XML gegenüber SGML. Lesesysteme für elektronische Bücher, die OEB verwenden wollen, müssen XML verarbeiten können.

• Die konkrete Ausprägung der Markupelemente von OEB ist von HTML abgeleitet; es können bestehende, in HTML kodierte Inhalte problemlos in OEB überführt werden.

Abgleitet von Cascading Style Sheets (level 1) definiert OEB eine eigene Layoutspra-che als Medientyp (WH[W[RHEFVV); wie in HTML können Layoutanweisungen in ein-zelnen Elementen, dem Dokumentkopf oder über style sheets eingebunden werden.

• OEB integriert die Beschreibungskategorien des Dublin Core Sets für die Kodierung v. a. bibliographischer Metainformation (s. u. Kap. 9.2.1).

Dokumente elektronischer Bücher sind entweder sog. basic OEB documents, falls aus-schließlich die in der OEB-DTD enthaltenen Elemente verwendet werden, oder extended OEB documents, falls zusätzliche Elemente eingeführt werden, für die dann jeweils eine gültige Layoutanweisung nach dem OEB-CSS-Format vorliegen muss.

In Abweichung von HTML führt OEB zusätzlich das Konzept eines Pakets (package) ein, das für eine Publikation die zugehörigen Informationen (Dateinamen, Metadaten etc.) bündelt. Die im zugehörigen package file enthaltenen Informationen sind

• Die SDFNDJHLGHQWLW\, die das 2(%SDFNDJH eindeutig bezeichnet,

‡ PHWDGDWD, d. h. Angabe der wesentlichen bibliographischen Daten,

‡ PDQLIHVW, d. h. eine Liste der zum elektronischen Buch gehörenden Dateien,

‡ VSLQH, d. h. in Analogie zum physischen Buchrücken eine Anordnung der Dokumente für eine lineare Lesereihenfolge der Seiten (Dokumente; „an arrangement of docu-ments providing a linear reading order“, MCCRARY et al. 1999: 12). Dieser „logische Buchrücken“ muss nicht unbedingt alle Dokumente des Pakets enthalten, da Doku-mente wie in HTML z. B. durch eingebettete Hypertextverknüpfungen erreichbar sein können und nicht in der Default-Lesereihenfolge enthalten sind.

‡ WRXUV, d. h. eine Sammlung zusätzlicher „Leserouten“ durch das Buch und

‡ JXLGH, d. h. eine Sammlung von Verknüpfungen zu wesentlichen Strukturbestandteilen des elektronischen Buchs (wie Inhaltsverzeichnis, Register, Glossar etc.).

Mit der Einführung von Makrokonzepten aus der Hypermedia-Theorie82 wie WRXUV und JXLGH versucht OEB die Funktionalität elektronischer Bücher zu erweitern und zu verein-heitlichen. Es ist allerdings keine starre Systematik möglicher JXLGH-Elemente vorgege-ben, d. h. die Realisierung von ausgewählten Pfaden durch den Hypermedia-Datenbe-stand bleibt dem einzelnen Entwickler überlassen.

Die nachfolgende Tabelle vergleicht in Anlehnung an MCCRARY 1999: Appendix A OEB und HTML.

82 Vgl. ISAKOWITZ, STOHR & BALASUBRAMIAN 1995 und TOCHTERMANN 1995, die in ihren Hy-permedia-Modellen bzw. Methodologien ebenfalls solche Makrokonzepte definieren; vgl.

oben Kap. 2.2.1.

.DSLWHO¥6WDQGDUGLVLHUWH$QZHQGXQJHQYRQ6*0/XQG;0/

Element open eBook HTML 4.0 Element open eBook HTML 4.0

D! + + WG! + +

DUHD! + + WK! + +

E! + + WLWOH! + +

EDVH! + + WU! + +

ELJ! + + WW! + +

EORFNTXRWH! + + XO! + +

ERG\! + + YDU! + +

EU! + + DEEU! - +

FDSWLRQ! + + DFURQ\P! - +

FLWH! + + DGGUHVV! - +

FRGH! + + FHQWHU! deprecated deprecated

GG! + + IRQW! deprecated deprecated

GIQ! + + V! deprecated deprecated

GLY! + + VWULNH! deprecated deprecated

GO! + + X! deprecated deprecated

GW! + + DSSOHW! - deprecated

HP! + + EDVHIRQW! - deprecated

K!K! + + EGR! - +

KHDG! + + EXWWRQ! - +

KU! + + FRO! - +

KWPO! + + FROJURXS! - +

L! + + GHO! - +

LPJ! + + GLU! - deprecated

NEG! + + ILHOGVHW! - +

OL! + + IRUP! - +

OLQN! + + IUDPH! - +

PDS! + + IUDPHVHW! - +

PHWD! + + LIUDPH! - +

REMHFW! + + LQSXW! - +

RO! + + LQV! - +

S! + + LVLQGH[! - deprecated

SDUDP! + + ODEHO! - +

SUH! + + OHJHQG! - +

T! + + PHQX! - deprecated

VDPS! + + QRIUDPHV! - +

VFULSW! + + QRVFULSW! - +

VPDOO! + + RSWJURXS! - +

VSDQ! + + RSWLRQ! - +

VWURQJ! + + VHOHFW! - +

VW\OH! + + WERG\! - +

VXE! + + WH[WDUHD! - +

VXS! + + WIRRW! - +

WDEOH! + + WKHDG! - +

7DEHOOH 9HUJOHLFKYRQRSHQH%RRNXQG+70/

Abgesehen von der mit open eBook eng verbundenen Frage, ob und wie schnell sich hardware-basierte Buchviewer durchsetzen werden, hat der Vergleich mit HTML ein kla-res Ergebnis: Wesentliche funktionale Bestandteile von HTML wie die Kodierung von Formularen und die Definition von Fensterbereichen (frames) sind in OEB nicht enthal-ten, andere deutlich vereinfacht (so ist die 7$%/(!-Marke in OEB enthalten, die Ele-mente &2/!, &2/*5283!, 7)227!, 7+($'! fehlen aber). Umgekehrt enthält OEB mit Ausnahme der voranstehend genannten Elemente auf package-Ebene aber keine

Im Dokument Dynamische elektronische Bücher (Seite 170-173)