Navigation
|
Ableitung von Textstrukturen aus typographischen AuszeichnungenAbleitung von Textstrukturen aus typographischen AuszeichnungenHintergrundIm Global-Info-Projekt wird in Zusammenarbeit mit dem Springer-Verlag und der TU München MS Word 2000 erweitert, um komfortabel neben dem eigentlichen Text Strukturierungsinformation als xml-Markup zu erzeugen. Die erstellten Dokumente müssen dabei der vom Verlag (als DTD) vorgegebenen Dokumentstruktur genügen.Um eine große Akzeptanz bei Autoren zu erreichen, die bisher vor reinen xml-Editoren zurückschrecken, darf das Werkzeug nur minimale Anforderungen an den Autor stellen. Aus diesem Grund muß Strukturinformation wo nur immer möglich aus konventionellen Benutzerinteraktionen abgeleitet werden. Dies ist insbesondere die typographische Auszeichnung des Textes. AufgabenstellungIn dieser Arbeit ist aus den Formatierungsanweisungen eines Word Benutzers strukturelle Information abzuleiten. Gemäß dieser Information ist eine xml-Hauptspeicherstruktur zu erstellen.Eine Zuordnungstabelle Formatierungsinformation -> Elementtyp parametrisiert den Ableitungsvorgang. Diese Tabelle wird initial vom Verlag vorbelegt, kann jedoch auch vom Benutzer modifiziert werden. Die DTD liefert nicht nur die möglichen Elementtypen, sondern auch die hierarchische Struktur. Auch xml-Elemente ohne textuellen Inhalt können so halb-automatisch erzeugt werden. Dipl.-Inform. Oliver Meyer ++49 (2 41) 80 - 2 13 13 Michael Kirchhof Created by: Sven last modification: Wednesday 08 of December, 2004 [01:11:32 UTC] by Sven |