Logo

Ableitung von Textstrukturen aus typographischen Auszeichnungen

Image


Ableitung von Textstrukturen aus typographischen Auszeichnungen


Hintergrund

Im Global-Info-Projekt wird in Zusammenarbeit mit dem Springer-Verlag und der TU München MS Word 2000 erweitert, um komfortabel neben dem eigentlichen Text Strukturierungsinformation als xml-Markup zu erzeugen. Die erstellten Dokumente müssen dabei der vom Verlag (als DTD) vorgegebenen Dokumentstruktur genügen.

Um eine große Akzeptanz bei Autoren zu erreichen, die bisher vor reinen xml-Editoren zurückschrecken, darf das Werkzeug nur minimale Anforderungen an den Autor stellen. Aus diesem Grund muß Strukturinformation wo nur immer möglich aus konventionellen Benutzerinteraktionen abgeleitet werden. Dies ist insbesondere die typographische Auszeichnung des Textes.

Aufgabenstellung

In dieser Arbeit ist aus den Formatierungsanweisungen eines Word Benutzers strukturelle Information abzuleiten. Gemäß dieser Information ist eine xml-Hauptspeicherstruktur zu erstellen.

Eine Zuordnungstabelle Formatierungsinformation -> Elementtyp parametrisiert den Ableitungsvorgang. Diese Tabelle wird initial vom Verlag vorbelegt, kann jedoch auch vom Benutzer modifiziert werden.

Die DTD liefert nicht nur die möglichen Elementtypen, sondern auch die hierarchische Struktur. Auch xml-Elemente ohne textuellen Inhalt können so halb-automatisch erzeugt werden.

Betreuer
Dipl.-Inform. Oliver Meyer ++49 (2 41) 80 - 2 13 13
Bearbeiter
Michael Kirchhof

Created by: Sven last modification: Wednesday 08 of December, 2004 [01:11:32 UTC] by Sven