Lade Inhalt...

Cross-Media-Publishing mit XML

©2001 Wissenschaftliche Studie 108 Seiten

Zusammenfassung

Inhaltsangabe:Zusammenfassung:
In der Arbeit wird gezeigt, wie mithilfe der XML-Technologie ein multimediales und medienübergreifendes Publizieren möglich ist, wobei die unterschiedlichen Repräsentationen von Daten aus einer einzigen Quelle erzeugt werden können.
Realisiert werden kann dies mithilfe der XSLT- und der XSL:FO-Syntax. XSLT macht es möglich Transformationen durchzuführen, bei denen eine HTML- wie auch eine
WML-Ausgabe erzeugt werden können. Für das Generieren einer PDF-Ausgabe ist beispielsweise der Einsatz der XSL:FO-Syntax erforderlich.
Neben dem Aufzeigen der technischen Anforderungen, die für die Verwirklichung eines im Rahmen des Frequent-Flyer-Programms „Mastermiles“ durchgeführten Cross-Media-Publishings benötigt werden (XML-Editoren, WAP-Emulatoren, Parser, XSLT-Prozessoren, XSL-Formatierer u.a.), werden letztendlich auch die konkreten Transformations- bzw. Formatierungsschritte in der Case Study dargestellt.
Dass ein effektives Cross-Media-Publishing auf dem Ansatz einer serverseitigen dynamischen Generierung beruht, wird in der anschließenden Diskussion noch näher erläutert. In diesem Zusammenhang wirde auch das Publishing-Framework Cocoon vorgestellt, das heute einen sehr guten „Rahmen“ für ein Publizieren on Demand bietet.
Anzumerken bleibt, dass man bei einem medienübergreifenden Publizieren mithilfe der noch sehr jungen XML-Technologie auch nicht darüber hinwegkommt, sich mit einer Reihe von weiteren Technologien und Produkten, die ebenfalls noch in den Kinderschuhen stehen (UMTS, WAP und GPRS; WAP-Handys und PDAs; Cocoon u.a.), auseinander zu setzen. Doch gerade dieses noch sehr unberührte Terrain ist es, was letztendlich diese neue Art des Publishings so spannend macht.

Inhaltsverzeichnis:Inhaltsverzeichnis:
I.INHALTSVERZEICHNIS
1.EINLEITUNG6
1.1Problemstellung6
1.2Zielsetzung und Vorgehensweise6
THEORETISCHER TEIL
2.XML UND AUSZEICHNUNGSSPRACHEN8
2.1Auszeichnungssprachen8
2.2Vorläufer der Extensible Markup Language10
2.2.1Standard Generalized Markup Language (SGML)10
2.2.2Hypertext Markup Language (HTML)10
2.2.3Grenzen von SGML und HTML11
2.3Extensible Markup Language (XML)13
2.3.1Vorteile von XML15
2.3.2Anwendungsbereiche von XML17
2.4Die Zukunft von XML und HTML19
2.5Struktur und Syntax von XML-Dokumenten21
2.5.1Grundgerüst eines XML-Dokuments21
2.5.2Syntax von XML-Dokumenten24
2.6XML-Editoren27
3.PRÄSENTATION VON XML-DOKUMENTEN28
3.1Formatvorlagen zur Darstellung von […]

Leseprobe

Inhaltsverzeichnis


ID 4888
Hofinger, Martina: Cross-Media-Publishing mit XML / Martina Hofinger - Hamburg: Diplomica
GmbH, 2002
Zugl.: Innsbruck, Fachhochschule, Abschlußarbeit, 2001
Dieses Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte, insbesondere die
der Übersetzung, des Nachdrucks, des Vortrags, der Entnahme von Abbildungen und Tabellen,
der Funksendung, der Mikroverfilmung oder der Vervielfältigung auf anderen Wegen und der
Speicherung in Datenverarbeitungsanlagen, bleiben, auch bei nur auszugsweiser Verwertung,
vorbehalten. Eine Vervielfältigung dieses Werkes oder von Teilen dieses Werkes ist auch im
Einzelfall nur in den Grenzen der gesetzlichen Bestimmungen des Urheberrechtsgesetzes der
Bundesrepublik Deutschland in der jeweils geltenden Fassung zulässig. Sie ist grundsätzlich
vergütungspflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des
Urheberrechtes.
Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem
Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche
Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten
wären und daher von jedermann benutzt werden dürften.
Die Informationen in diesem Werk wurden mit Sorgfalt erarbeitet. Dennoch können Fehler nicht
vollständig ausgeschlossen werden, und die Diplomarbeiten Agentur, die Autoren oder
Übersetzer übernehmen keine juristische Verantwortung oder irgendeine Haftung für evtl.
verbliebene fehlerhafte Angaben und deren Folgen.
Diplomica GmbH
http://www.diplom.de, Hamburg 2002
Printed in Germany

Wissensquellen gewinnbringend nutzen
Qualität, Praxisrelevanz und Aktualität zeichnen unsere Studien aus. Wir
bieten Ihnen im Auftrag unserer Autorinnen und Autoren Wirtschafts-
studien und wissenschaftliche Abschlussarbeiten ­ Dissertationen,
Diplomarbeiten, Magisterarbeiten, Staatsexamensarbeiten und Studien-
arbeiten zum Kauf. Sie wurden an deutschen Universitäten, Fachhoch-
schulen, Akademien oder vergleichbaren Institutionen der Europäischen
Union geschrieben. Der Notendurchschnitt liegt bei 1,5.
Wettbewerbsvorteile verschaffen ­ Vergleichen Sie den Preis unserer
Studien mit den Honoraren externer Berater. Um dieses Wissen selbst
zusammenzutragen, müssten Sie viel Zeit und Geld aufbringen.
http://www.diplom.de bietet Ihnen unser vollständiges Lieferprogramm
mit mehreren tausend Studien im Internet. Neben dem Online-Katalog und
der Online-Suchmaschine für Ihre Recherche steht Ihnen auch eine Online-
Bestellfunktion zur Verfügung. Inhaltliche Zusammenfassungen und
Inhaltsverzeichnisse zu jeder Studie sind im Internet einsehbar.
Individueller Service
­
Gerne senden wir Ihnen auch unseren Papier-
katalog zu. Bitte fordern Sie Ihr individuelles Exemplar bei uns an. Für
Fragen, Anregungen und individuelle Anfragen stehen wir Ihnen gerne zur
Verfügung. Wir freuen uns auf eine gute Zusammenarbeit.
Ihr Team der Diplomarbeiten Agentur

Seite 2
I
INHALTSVERZEICHNIS
1 EINLEITUNG
6
1.1 Problemstellung
6
1.2 Zielsetzung und Vorgehensweise
6
THEORETISCHER TEIL
2 XML UND AUSZEICHNUNGSSPRACHEN
8
2.1 Auszeichnungssprachen
8
2.2 Vorläufer der Extensible Markup Language
10
2.2.1
Standard Generalized Markup Language (SGML)
10
2.2.2
Hypertext Markup Language (HTML)
10
2.2.3
Grenzen von SGML und HTML
11
2.3 Extensible Markup Language (XML)
13
2.3.1
Vorteile von XML
15
2.3.2
Anwendungsbereiche von XML
17
2.4 Die Zukunft von XML und HTML
19
2.5 Struktur und Syntax von XML-Dokumenten
21
2.5.1
Grundgerüst eines XML-Dokuments
21
2.5.2
Syntax von XML-Dokumenten
24
2.6 XML-Editoren
27
3 PRÄSENTATION VON XML-DOKUMENTEN
28
3.1 Formatvorlagen zur Darstellung von XML-Dokumenten
28
3.1.1
Cascading Style Sheets (CSS)
29
3.1.2
Extensible Stylesheet Language (XSL)
30
3.2 Transformationsmöglichkeiten mit XSL
32
3.2.1
Definition von Transformation
32
3.2.2
XSL-Transformations (XSLT)
32
3.3 Formatierungsmöglichkeiten mit XSL
38
3.3.1
Formatting Objects (XSL:FO)
38

Seite 3
3.4 XSL-Anwendungsszenarien
42
3.4.1
Wiedergabe von XML als HTML
42
3.4.2
Translation on Demand
43
3.4.3
XSL im Unternehmen
44
PRAKTISCHER TEIL UND ERGEBNISPRÄSENTATION
4 CASE STUDY ­ EINE PRAKTISCHE XML-ANWENDUNG
45
4.1 Cross-Media-Publishing on the fly - Ausgangssituation
45
4.1.1
Das Frequent-Flyer-Programm
45
4.1.2
Die Datenstruktur
45
4.1.3
Die Ausgabemedien
47
4.2 Darstellung im Webbrowser und am WAP-Handy
51
4.2.1
XSL-Stylesheets für HTML und WML
51
4.2.2
Transformation mit IE 5.5
54
4.2.3
Generierung mit XT
55
4.2.4
Dynamische Generierung mithilfe von Active Server Pages (ASP)
58
4.3 Darstellung als PDF-Dokument
63
4.3.1
XSL-Stylesheet für PDF
63
4.3.2
Konvertierung mit FOP
65
4.4 Präsentation der Problemlösung
67
4.4.1
Mastermiles-Kontostand im IE 5.5 (HTML)
67
4.4.2
Mastermiles-Kontostand im Nokia 3330 (WML)
69
4.4.3
Mastermiles-Kontostand als PDF
70
4.5 Nutzen für das Unternehmen
72
DISKUSSION
5 CLIENTSEITIGE VERSUS SERVERSEITIGE TRANSFORMATION
74
5.1 Verarbeitung auf der Clientseite
74
5.2 Vorteile einer serverseitigen Implementierung
77
5.3 Publishing mit Cocoon ­ eine serverseitige Lösung
80
6 ZUSAMMENFASSUNG DER ERGEBNISSE UND AUSBLICK
83
6.1 Zusammenfassung
83
6.2 Ausblick
84

Seite 4
II ABBILDUNGSVERZEICHNIS
Abbildung 1: Die drei Komponenten eines Dokuments
8
Abbildung 2: HTML-Code und Ausgabe
12
Abbildung 3: Zusammenhang zwischen SGML, HTML und XML
14
Abbildung 4: Verbesserte Qualität von Dokumenten durch definierte Strukturen
16
Abbildung 5: Content Management System
18
Abbildung 6: XML als Ausgangssprache für die Weiterverarbeitung
20
Abbildung 7: Aufbau eines typischen XML-Dokuments
22
Abbildung 8: Ein XML-Dokument
25
Abbildung 9: Darstellung eines Elements
26
Abbildung 10: Dateiverarbeitung mit einer Steuerdatei
28
Abbildung 11: XSL und seine Teiltechnologien
30
Abbildung 12: Eine XSLT-Transformation
33
Abbildung 13: Die vier Datenzustände beim Ablauf einer XSLT-Transformation
35
Abbildung 14: Umsetzung eines FO-Dokuments in ein spezielles Ausgabeformat
40
Abbildung 15: Serverseitige Transformation für die HTML-Wiedergabe
42
Abbildung 16: XSL im Transcoding Publisher Server verwendet
43
Abbildung 17: Unternehmensinterner Datenaustausch
44
Abbildung 18: Kundendaten im Organigramm
46
Abbildung 19: Internetsitzungen weltweit
48
Abbildung 20: Transformation einer XML-Datei mit Standard-Stylesheet im IE 5.5
54
Abbildung 21: Generierung einer WML-Datei mithilfe des XT (Eingabeaufforderung)
56
Abbildung 22: Transformation abhängig von der Client-Anforderung
58
Abbildung 23: Dynamische Generierung von HTML und WML
60
Abbildung 24: Aufruf ASP-Skripts vom IIS
61
Abbildung 25: Erstellung eines Seiten-Layouts
63
Abbildung 26: Konvertierung mit FOP
65
Abbildung 27: Erzeugen eines PDF-Dokuments (Eingabeaufforderung)
66
Abbildung 28: Transformation beim Client
74
Abbildung 29: Transformation am Server
78
Abbildung 30: Architektur des Cocoon Servlets
80
Abbildung 31: eBook Hardware
85

Seite 5
III
QUELLENVERZEICHNIS
87
IV
ABKÜRZUNGSVERZEICHNIS
91
V
ANHANG
93

Seite 6
1 EINLEITUNG
1.1 Problemstellung
"HTML made the web the world's library. Now its sibling -XML- is making the web the world's
commercial and financial hub." Dieses Zitat von Charles F. Goldfarb zeigt ganz deutlich, dass
die neue Metasprache XML (Extensible Markup Language), die sich zwar noch in einem
relativ frühen Entwicklungsstadium befindet, alle notwendigen Voraussetzungen dafür
schafft, das World Wide Web zu einem mächtigen, vielseitigen und interaktiven Medium zu
machen.
Vor allem bei Geschäfts- und Business-to-Business-Anwendungen wird XML auch heute
schon zunehmend als das Format für elektronisches Publizieren und den
Dokumentenaustausch eingesetzt. Das Publishing betreffend verspricht man sich durch den
Einsatz von XML ein ,,making visually rich, personalized content reliably available anytime,
anywhere, on any device (cross-media-publishing)"
1
.
Wie aber kann ein Unternehmen, das sich ebenfalls für diese vielversprechende
Zukunftstechnologie entscheidet, seine mit XML strukturierten Dokumente konkret
publizieren? Welche Möglichkeiten der Darstellung es dabei gibt und welchen Nutzen ein
Unternehmen letztendlich aus dieser neuen Technologie ziehen kann, soll Thema dieser
Arbeit sein.
1.2 Zielsetzung und Vorgehensweise
Ziel dieser Arbeit ist es, nach einer allgemeinen Einführung in die Auszeichnungs- und
Metasprachen, grundlegende Transformationsmöglichkeiten von XML aufzuzeigen, welche
ein Cross-Media-Publishing für unterschiedliche Medien des 21. Jahrhunderts -sei es das
Web selbst, sei es ein Handy oder auch ein Printmedium- ermöglichen.
1
vgl. Kühlewein, T.; Müller-Crépon, S.: Keynote: Adobe Systems - Network Publishing, 06/2001. URL: http://www.publishing-
conference.de [Stand: 29/10/2001].

Seite 7
In einer Case Study wird am Beispiel eines ,,Frequent-Flyer"-Programms einer fiktiven
Fluggesellschaft eine konkrete Projektrealisierung schrittweise aufgezeigt. Auch
verschiedenste Softwaretools werden hier angesprochen, die bei einer XML-
Programmierung Unterstützung bieten sollen und zum aktuellen Zeitpunkt des Verfassens
dieser Arbeit am Markt erhältlich sind. Auf diverse Programmierungsschwierigkeiten bei
der Umsetzung der Case Study wird ebenso eingegangen, wie auch auf den eigentlichen
Nutzen der Endlösung. Ausblicke in die Zukunft sollen die Arbeit insofern abrunden, als
dass einerseits ein Publishing Framework (Cocoon) vorgestellt wird, das Antworten auf so
manche in der Case Study nicht zu lösende Grenzen geben kann, andererseits
Entwicklungstrends und Zukunftspotentiale der bis dato noch in den Kinderschuhen
stehenden XML-Technologie aufgezeigt werden.
In der vorliegenden Arbeit wird der oft schwierigen inhaltlichen Abgrenzung des Themas
insofern Rechnung getragen, als dass versucht wird, die einzelnen Kapitel -wie im Web
üblich- durch entsprechende Querverweise miteinander zu ,,verlinken" oder Verweise auf
tiefergreifende Internetquellen zu geben.
An dieser Stelle sei noch angemerkt, dass die vorliegenden Programmierbeispiele auf der
Plattform Windows 2000 Professional entwickelt werden. Zum Testen wird einerseits der
Browser Internet Explorer 5.5 herangezogen, wenn es sich um Lösungen am Client handelt,
andererseits der Internet Information Server 5.0, wenn serverseitige Lösungen präsentiert
werden. Gründe und Informationen zu diesen Entscheidungen werden beim Behandeln der
jeweiligen Thematik noch detaillierter angeführt (vgl. Kapitel 4).

Seite 8
2 XML UND AUSZEICHNUNGSSPRACHEN
2.1 Auszeichnungssprachen
Auszeichnungssprachen sind die einfachste Form der Programmiersprachen. Während
Programmier- und Skriptsprachen wie Java, Javascript u.a. die Steuerung eines
Programmablaufs ermöglichen, dienen Auszeichnungssprachen vor allem dazu,
elektronische Textdokumente neben dem eigentlichen Inhalt mit weiteren Informationen zu
versehen.
Geht man der Frage nach, woraus Textdokumente bestehen, so lassen sich prinzipiell drei
Komponenten unterscheiden:
Abbildung 1: Die drei Komponenten eines Dokuments
Quelle: Pott/Wielage 2000
Einen Teil stellt die reine Text- und Bildinformation dar. Neben dem Inhalt ist die Struktur
der Information ein weiterer Bestandteil des Textdokuments. Darunter versteht man die
Gliederung des Dokuments in Überschriften und Abschnitte, aber auch beispielsweise
Verweise auf Fußzeilen. Die dritte Komponente schließlich ist die grafische Ausgestaltung
eines Textes. Sie dient dazu, für die vorhandene und definierte Struktur auch ein bestimmtes
Layout bzw. Formatierung festzulegen und damit die im Dokument enthaltene Information
für den Leser optisch hervorzuheben.
Gerade diese Trennung der Informationsstruktur eines Textes von dessen optischem
Erscheinungsbild ist die Grundintention der heutigen Auszeichnungssprachen.
Struktur
Format
Inhalt

Seite 9
Obwohl Auszeichnungssprachen im Gegensatz zu Programmiersprachen statisch sind und
keine Informationen unmittelbar verarbeiten können, gewinnen sie dennoch immer mehr an
Bedeutung und scheinen sich aus der ,,Nussschale" heraus hin zu einer mächtigen Sprache
zu entwickeln.
Dieser prognostizierte Trend lässt sich anhand einiger Ursachen ableiten, welche spätestens
seit der Ankunft des Internets das traditionelle Bild des Publishings verändert haben.
Jeden Tag entsteht in einem Unternehmen eine Vielzahl von Inhalten, die in E-Mails, Memos,
Briefen u.ä. festgehalten werden. Ein Großteil dieser Dokumente verschwindet in
verschiedensten Archiven und kann meist nur mehr mit kostspieligen Zusatzwerkzeugen
und Tools mehrfach nutzbar gemacht werden. ,,Man schätzt, dass diese unstrukturierten
Inhalte bis zu neunzig Prozent der Unternehmensdokumente ausmachen und dass eine
moderne Volkswirtschaft ungefähr ein Viertel ihrer Ressourcen für Informationserstellung
und -verwaltung braucht."
2
Zum anderen ist im 21. Jahrhundert nicht mehr lediglich ein Publishing in Printform
denkbar, sondern die Möglichkeiten, Informationen an den Kunden zu bringen, werden
immer vielfältiger: das Internet, Handys, PDAs (Personal Digital Assistant), Palms u.ä.
Ein Publizieren in diesen neuen Zielmedien zwingen ein Unternehmen momentan zu einer
Mehrarbeit aufgrund der Übersetzung in die verschiedenen Datenformate, da die
Informationen jeweils an die Besonderheiten des Mediums angepasst werden müssen.
Ein weiteres bekanntes Szenario in vielen Unternehmen ist, dass die Änderung von
Produkt- oder Preisdaten eine ganze Reihe von Arbeitsschritten in den verschiedensten
Abteilungen notwendig macht, um die Änderungen überall dort vorzunehmen, wo die
ursprünglichen Informationen gespeichert wurden. Das ganze Prozedere ist sehr aufwändig
und zudem auch sehr fehleranfällig.
Diese und eine Vielzahl weiterer Veränderungen fordern ein Unternehmen regelrecht
heraus, die Flut an Informationen zu strukturieren, ,,mit Bedeutung zu versehen" und durch
die Beherrschung der Informationen schlussendlich eine höhere Wettbewerbsfähigkeit zu
erzielen.
2
Rothfuchs, G.; Ried, C.: Content Management mit XML. Berlin u.a. 2001, S. 17.

Seite 10
Dieser Forderung kann vor allem mithilfe der Auszeichnungssprachen nachgekommen
werden. ,,Markup Languages" (der englische Begriff für Auszeichnung ist ,,Markup") sind
nämlich in der Lage, dem Dokument, das die Informationen enthält, gewissermaßen
Intelligenz einzuschreiben, sodass sie in weiterer Folge effektiver von Applikationen gelesen
und verarbeitet werden können.
2.2 Vorläufer der Extensible Markup Language
2.2.1 Standard Generalized Markup Language (SGML)
SGML ist die Mutter aller Auszeichnungssprachen im Web. Sie wurde 1969 von
Charles F. Goldfarb, der zu dieser Zeit zusammen mit Ed Mosher und Ray Lorie ein
Forschungsteam bei IBM leitete, ursprünglich als eine Sprache namens GML (= Generalized
Markup Language) entwickelt. GML sollte dazu dienen, die logische Struktur und die
Formatierung von wissenschaftlichen Texten strikt zu trennen.
Die Entwicklung dieser Metasprache zählte zu einer großen Errungenschaft, sodass sie im
Jahre 1986 als internationaler Standard formalisiert und mit dem Namen SGML
ausgezeichnet wurde. Mithilfe der Metasprache SGML konnten nun weitere
Auszeichnungssprachen definiert werden.
2.2.2 Hypertext Markup Language (HTML)
1989 entwickelte der britische Informatiker Tim Berners-Lee eine der erfolgreichsten
Auszeichnungssprachen aller Zeiten, nämlich HTML.
HTML wurde nach den Regeln von SGML erzeugt und ist demnach eine Anwendung der
Metasprache SGML. Mit HTML lassen sich Webseiten beschreiben, auf die über das World

Seite 11
Wide Web (WWW) zugegriffen wird und die in weiterer Folge in verschiedenen Browsern
(Internet Explorer, Netscape Navigator, Opera u.a.) auf dem Bildschirm dargestellt werden
können. Seine Popularität verdankt HTML nicht zuletzt seiner einfachen Syntax, die aus
einer Menge fest vorgegebener Befehle (sprich die Tags) besteht. Selbst ohne großes
Fachwissen sind mit HTML schnelle Anfangserfolge sicher, wenn man die einzelnen Tags
kennt oder sich einem der vielen HTML-Editoren (Dreamweaver, GoLive, Arachnophilia
u.a.) bedient. Andererseits schränkt die begrenzte Auswahl an Auszeichnungsbefehlen aber
auch ein und es ist nicht möglich, sich selbst neue Befehle zu erfinden und zu definieren.
2.2.3 Grenzen von SGML und HTML
Obwohl beide eben erwähnten Sprachen -SGML und HTML- zweifelsohne große
Errungenschaften waren und auch immer noch sind, haben sie doch auch ihre Schwächen.
SGML wurde ursprünglich für die Verwaltung umfangreicher Dokumente in größeren
Firmen konzipiert. So ist es nicht verwunderlich, dass die SGML-Definition des World Wide
Web Konsortiums (W3C) über fünfhundert Seiten umfasste und damit zwar sehr mächtig,
aber auch äußerst komplex war. Dieser Aspekt erklärt die Tatsache, dass eine
Implementierung entsprechender SGML-unterstützender Anwendungen und Werkzeuge
sehr aufwendig und zugleich mit hohen Kosten verbunden war. Weiters verhinderte die
Komplexität dieser Metasprache ihren eigentlichen Durchbruch für den Einsatz im Web.
HTML hingegen genießt immer noch großen Erfolg als ,,Lingua Franca"
3
des World Wide
Web. Doch mit dem immer mehr an Bedeutung gewinnenden elektronischen Handel über
das Internet bzw. über Mobiltelefone (E-Commerce bzw. M-Commerce), stößt die
HTML-Technologie bald an ihre Grenzen.
3
Pott, O.; Wielage, G.: xml - praxis und referenz. München 2000, S. 52.

Seite 12
Die Gründe für den Ruf nach einer neueren Technologie als HTML sind folgende:
??
Entscheidend bei der HTML-Programmierung ist letztendlich das Erscheinungsbild im
Front-End-Bereich. Mit anderen Worten zielt HTML ausschließlich auf die Formatierung
der zu präsentierenden Informationen ab und es steckt keine Beabsichtigung eines
möglichen Strukturaufbaus der dargestellten Daten dahinter.
Die folgende Abbildung soll diesen wichtigen Aspekt noch einmal verdeutlichen:
Abbildung 2: HTML-Code und Ausgabe
© Hofinger
Sollte man aus diesem Dokument eine Datenbank mit Komponisten erstellen oder will
man auch nur die vorhandenen Daten von einem Computer chronologisch umsortieren
lassen, ist dies mit HTML nicht mehr möglich.
??
Der Sprachumfang von HTML ist begrenzt. Findet man mit den zur Verfügung
stehenden Tags und Attributen nicht das Auslangen, steht man vor einem meist
unlösbaren Problem.
<html>
<head>
<title>berühmte Personen</title>
</head>
<body>
<h1>Komponisten</h1>
<p><b>Wolfgang Amadeus Mozart (1756-91)
</b><br>
Im Alter von 6 Jahren wurde er ein
vollendeter Künstler ...
<p><b>Ludwig van Beethoven (1770-1827)
</b><br>
Ein weiterer berühmter Komponist der
Wiener Klassik...
</body>
</html>

Seite 13
Würde man ständig neue Tags einführen, müsste jedes Mal ein neuer HTML-Standard
definiert werden und die Programmhersteller müssten diese neuen Tags in den nächsten
Browserversionen unterstützen, was letztendlich in einem Chaos enden würde.
4
??
Ein weiteres Problem stellt die Abbildung von reinen Daten in HTML dar, weil diese
zwar strukturiert in Tabellen dargestellt werden können, jedoch fixer Bestandteil
einzelner Tabellenzellen sind. Im E-Commerce kommt man nicht darüber hinweg, seine
Produktpalette, die einer ständigen Veränderung ausgesetzt ist -Preisänderungen,
Bestandsänderungen u.ä.-, stets auf dem aktuellen Stand zu halten. Bei einem Wechsel
der Daten muss deshalb die komplette HTML-Seite samt Tabelle umprogrammiert und
neu übertragen werden. Neben der Möglichkeit von Datenbankanbindungen könnte eine
Antwort auf dieses Problem wiederum in einer Trennung der Daten vom eigentlichen
Inhalt liegen.
2.3 Extensible Markup Language (XML)
Aufgrund der genannten Defizite bzw. Grenzen von HTML versuchte im Jahr 1998 eine
spezielle Gruppe des W3C unter der Leitung von Jon Bosak eine Sprache zu entwickeln,
welche die Leistungsfähigkeit von SGML erhalten und gleichzeitig deren Komplexität
vermeiden sollte.
Das Ergebnis war XML. ,,Extensible Markup Language is display-device independent, and
its documents can be used with any display device (browsers, printers, PDAs, cell phones
and so on). Documents composed of XML can also be more easily understood and
manipulated by other software programs."
5
4
vgl. Born, G.: Jetzt lerne ich XML. München 2001, S. 30.
5
Turban, E. u.a.: Electronic Commerce ­ A managerial perspective. New York 2000, S. 481.

Seite 14
XML ist keine völlige Neuentwicklung. XML macht sich vielmehr die Vorzüge von SGML zu
Nutze und verzichtet auf die Nachteile von HTML. Mit XML ist es schließlich auch
gelungen, eine der beliebten 80/20-Lösungen zu realisieren: eine Auszeichnungssprache, die
80% der Mächtigkeit von SGML, aber nur 20% von deren Komplexität hat.
6
Als eine Teilmenge von SGML ist XML dabei so konzipiert, dass sich diese Sprache
prinzipiell beliebig erweitern lässt und speziell auf die Anforderungen der Webtechnologie
zugeschnitten wurde. XML ist ebenfalls eine Metasprache, mithilfe derer weitere
Auszeichnungssprachen (XML-Applikationen) definiert werden können. HTML war bisher
auf der Basis von SGML definiert, inzwischen wäre ebenso eine Definition auf Basis von
XML möglich. Abbildung 3 soll den Zusammenhang dieser drei wichtigen Sprachen noch
einmal grafisch veranschaulichen:
Abbildung 3: Zusammenhang zwischen SGML, HTML und XML
Quelle: Pott/Wielage 2000
6
vgl. Arciniegas, F.: XML ­ Developer's Guide. Poing 2001, S. 27.
Erweiterungen
SGML
Applikationen
HTML
HTML
(möglich)
Applikationen
XML

Seite 15
2.3.1 Vorteile von XML
XML ist eine völlig neue Entwicklung zur Verwaltung, Verarbeitung und Veröffentlichung
von strukturierten Daten. Austauschbarkeit, Modularisierbarkeit und Qualitätssicherung
sind die wesentlichen Nutzenaspekte
7
, die nicht nur charakteristisch für die neue
XML-Technologie sind, sondern zweifelsohne auch schon die früher entwickelte
SGML-Sprache kennzeichneten. Dennoch ist XML durch seinen deutlich verringerten
Sprachumfang und aufgrund weiterer konzeptioneller Unterschiede besser für den Einsatz
im Internet geeignet als SGML.
Einer der größten Gewinne, der sich aus der Metasprache XML ziehen lässt, liegt in der
Austauschbarkeit der Dokumente. Da XML Form bzw. Layout und Inhalt von Dokumenten bis
auf Zeichenebene trennt, werden XML-codierte Daten unabhängig von der Systemplattform
und können innerbetrieblich wie auch im nach außen gerichteten Informationsaustausch
problemlos transferiert werden.
Dadurch, dass XML die Inhalte von Dokumenten mit Metainformationen überlagert und
somit Dokumentteile beschreibt und Informationseinheiten identifiziert, können diese
Einheiten gezielt angesteuert, kopiert, gefiltert und aktualisiert werden. Diese inhaltliche
Modularisierung optimiert den Informationszugang und vereinfacht die Pflege
bzw. regelmäßige Aktualisierung der Dokumente. XML würde seine Stärken jedoch nicht
ausspielen können, wenn sich die Struktur der Dokumentationen mit jedem Produkt ändern
würde, Inhalte immer nur einmal verwendet werden oder Layouts unkompliziert sind und
kaum Änderungen unterliegen.
XML lohnt sich demnach für ein Unternehmen dann, wenn ein großer
Dokumentationsbedarf vorliegt und ein regelmäßiges Aktualisieren bzw. ein
Wiederverwenden von Inhalten vorausgesetzt wird.
8
7
vgl. Michel, T.: XML kompakt ­ Eine praktische Einführung. München u.a. 1999, S. 25 f.
8
vgl. Fuchs, E.: XML-Case-Study, 06/2001. URL: http://www.publishing-conference.de [Stand: 29/10/2001].

Seite 16
Einen dritten Gewinnaspekt von XML stellt schließlich die Qualität von Dokumenten dar.
Durch die in XML zu definierende Struktur von Dokumenttypen (vgl. Punkt 2.5.1) wird
bereits ein Modell für den gedanklichen bzw. inhaltlichen Aufbau vordefiniert, an das sich
ein Verfasser zu halten hat. Die Gefahr, dass wesentliche Teile fehlen, andere mehrfach
erscheinen und wieder andere falsch platziert sind, verringert sich und der Prozess von der
Konzeption zur Produktion wird durch das Entfallen eines mühsamen Nacharbeitens
signifikant verkürzt.
Die nachstehende Grafik zeigt den Zusammenhang zwischen XML-Experten, die ein klar
definiertes Strukturmodell erstellen, und den Autoren, die nur mehr Augenmerk auf den
eigentlichen Inhalt legen müssen. Beides zusammen wird in einem einzigen Pool gespeichert
und zur weiteren Verarbeitung bereitgestellt (Single-Source-Publishing).
Abbildung 4: Verbesserte Qualität von Dokumenten durch definierte Strukturen
Quelle: Schmid (Arbortext) 2001
Ferner liegt gerade in der Möglichkeit, XML-codierte Daten automatisiert für die Präsentation
in verschiedensten Medien aufzubereiten, ein viertes sehr bedeutendes Gewinnpotential.
So können Informationen aus ein und demselben XML-Datenpool beispielsweise für die
Ausgabe in einem WAP-Handy, auf einer CD-ROM, auf einer Website oder in gesprochener
Form aufbereitet werden (Cross-Media-Publishing).

Seite 17
Der Begriff ,,Cross-Media-Publishing" ist noch sehr neu und definiert ,,den
Verarbeitungsprozess von Daten, die sowohl auf gedruckten als auch in elektronischen
Medien publiziert werden".
9
Welche konkreten Nutzeffekte ein Unternehmen gerade beim Einsatz einer XML
Cross-Media-Publishing-Lösung zieht, wird am Ende der Case Study noch einmal detailliert
beschrieben (vgl. Kapitel 4, Punkt 4.5).
2.3.2 Anwendungsbereiche von XML
XML setzt sich in den Bereichen Internet-Anwendungen, E-Business und Content
Management zunehmend durch.
Ihr Anwendungsgebiet findet XML überall dort,
-
wo strukturierte Informationen verwaltet werden,
-
wo Daten systemübergreifend übertragen werden sollen,
-
wo Daten in einer Quelle gehalten, aber in unterschiedlicher Form ausgegeben werden
sollen.
10
Internet-Anwendungen profitieren von der Trennung von Inhalt und Darstellung und der
Transformationsmöglichkeit in HTML. (vgl. 3.2.2).
Im Bereich des E-Commerce und E-Business wird XML zunehmend beispielsweise als Basis für
elektronische Kataloge eingesetzt. Vor allem in der Business-to-Business-Kommunikation
zwischen Handelspartnern, bei denen die unterschiedlichen Datenformate oft ein großes
Problem darstellen, kann XML eine Lösung anbieten. Die Funktionsweise ist sehr einfach:
Die Daten der Firma A, die in einer Datenbank logisch angeordnet und verwaltet werden,
werden für den Zweck einer Übertragung zur Firma B in ein XML-Format umgewandelt.
9
vgl. Politis, A.: Exploring Human Capital Competence within the Complex Cross-Media Publishing Environment, 05/2001.
URL: http://www.gca.org/papers/xmleurope2001/papers/html/sid-03-7.html [Stand: 28/11/01].
10
vgl. Geese, E. u.a.: XML, XSLT, VB und ASP ­ Praktisches XML-Wissen für Webprojekte. Bonn 2001, S. 53.

Seite 18
Die in XML-codierten Daten lassen sich nun sehr einfach über das Internet zur Firma B leiten
und können dort wieder in das firmeninterne System von B eingebettet werden.
Die XML-Technologie leistet seinen Beitrag demnach ,,nur" in der Datenübertragung und
sorgt somit für eine bessere Kommunikation zwischen Handelpartnern.
Durch die einfachere Implementierung -im Gegensatz zu SGML- setzt sich XML auch immer
stärker im Bereich des Content Managements durch. Das Thema Content Management steht
im Fokus der gesamten Internet-Community, da Inhalte von Webangeboten als ein
Hauptkriterium des Erfolgs identifiziert sind. Bei Content Management Systemen handelt es
sich um Anwendungen, die das Verwalten, Strukturieren und Erstellen von Webinhalten
ermöglichen. Durch den Einsatz von solchen Systemen wird die Phase der Entstehung von
Content bis zu seiner Veröffentlichung im Web stark verkürzt, weil keine
Programmierkenntnisse für die Redaktion erforderlich sind und Änderungen direkt durch
die Fachabteilungen getätigt werden können.
11
Von der technischen Seite betrachtet lassen sich Content Management Systeme flexibel in
bestehende EDV-Systeme, Warenwirtschaftssysteme und IT-Landschaften integrieren. Über
offene Scriptsprachen wie Java werden Schnittstellen zu bestehenden Funktionalitäten
realisiert und der Datenaustausch via XML implementiert.
Abbildung 5: Content Management System
Quelle: comcity.de
11
vgl. http://www.comcity.de

Seite 19
2.4 Die Zukunft von XML und HTML
Gegenwärtig scheint alles darauf zu deuten, dass XML die Hypertext Markup Language
über kurz oder lang ersetzen wird. In den USA ist ein wahrer XML-Boom ausgebrochen, der
auch Europa mit der meist üblichen Zeitverzögerung von einigen Monaten inzwischen
erreicht hat. Doch die Behauptung, XML sei der Nachfolger von HTML, ist keineswegs
richtig, zumal auch die Entwicklung von HTML weiter fortgeführt wird. So gibt es heute
schon die Version HTML 4.0 und mittlerweile existiert auch schon eine Erweiterung von
HTML auf Basis von XML, nämlich XHTML. Diese neue HTML-Version besteht aus
einzelnen Befehlsmodulen, die je nach Bedarf dem Dokument hinzugefügt werden können.
Neben dem Basis-Modul stehen verschiedene vorgegebene, aber optionale Module zur
Verfügung. Ziel der Modularisierung bei XHTML ist es, Unterstützung für die große
Bandbreite an neuen Zielmedien -Internet, Handys, Sprachausgabe u.a.- durch Hinzufügen
weiterer Module zu bieten.
12
Für viele Anwendungen ist und wird HTML eine vollkommen ausreichende und solide
Grundlage für das Web bleiben. XML ist nicht die Sprache, um eine private Homepage zu
gestalten, sondern XML wird sich vor allem im professionellen Bereich der
Dokumentenverarbeitung seinen Weg bahnen. Dort kann es mit seinen vielfältigen
Möglichkeiten an die spezifischen Bedürfnisse eines jeden Unternehmens angepasst werden.
Um sich auch ohne im Detail von XML gehört zu haben, ein Bild von dieser prognostizierten
Vision machen zu können, soll folgendes
konkrete Beispiel dienen:
Ein Unternehmen, das auch einen Online-Shop führt, benötigt seine Daten aus
elektronischen Katalogen nicht nur für E-Commerce Anwendungen, sondern nach wie vor
für gedruckte Kataloge, CD-ROMs oder andere Präsentationsmedien. Mit einem
XML-basierten Datenformat wird die Grundlage für ein Cross-Media-Publishing geschaffen,
wobei aus einem Datenpool mehrere Dokumenttypen erzeugt werden können -wie es
Abbildung 4 zeigt.
12
vgl. World Wide Web Konsortium: XHTMLTM 1.0 - The Extensible HyperText Markup Language (Second Edition), 2001.
URL: http://www.w3.org/TR/2001/WD-xhtml1-20011004/ [Stand: 21/10/2001].

Seite 20
Zum einen entfällt in jedem Fall die Doppelarbeit bei der Erfassung der Daten und eine
mühsame Mehrarbeit bei der Konvertierung, und zum anderen ist ,,ein effektives Daten-
und Informationsmanagement die Basis dafür, dass ein Unternehmen für das E-Business die
kundenorientierten Daten und Informationen bereitstellen kann, die heute von Kunden und
Interessenten erwartet werden"
13
.
Abbildung 6: XML als Ausgangssprache für die Weiterverarbeitung
Quelle: Pott/Wielage 2000
Gerade in diesem Bereich des Cross-Media-Publishings, der eigentlichen Thematik dieser
Arbeit, verspricht man sich in der nahen Zukunft einiges von XML: Diese Sprache soll sich
als Basis für jede Art von Daten etablieren, aus denen dann fast beliebig andere
Dokumenttypen erzeugt werden können. Selbst Datenbanken könnten mithilfe von XML
verarbeitet werden.
13
Hentrich, J.: B2B-Katalog-Mangagement ­ E-Procurement and Sales mit XML. Bonn 2001, S. 103.
Artikel
<XML>
CD-Rom
Online
SHOP
<HTML>
gedruckter
Katalog
Postscript
Datenbank

Seite 21
2.5 Struktur und Syntax von XML-Dokumenten
Trotz der immensen Möglichkeiten, die XML bietet, und seiner Mächtigkeit lassen sich
XML-Dokumente relativ leicht erstellen und auch lesen. Dieses Sub-Kapitel ist als Einstieg in
das Thema XML gedacht und soll eine Idee über die grundlegenden Konzepte und die
syntaktischen Konstrukte von XML geben. Aufgrund des engen Rahmens dieser Arbeit muss
auf eine detaillierte Ausführung der XML-Syntax verzichtet werden. Dennoch sollen die
jeweils angeführten Bücher und Internetadressen Antworten auf all die Feinheiten und
Fragen geben, die auf den folgenden Seiten nicht angesprochen werden können. Ferner kann
das in Kapitel 4 aufgezeigte Programmierbeispiel als Referenz für die verwendete Syntax
dienen.
2.5.1 Grundgerüst eines XML-Dokuments
In der Literatur findet man häufig drei Teile, die ein XML-Dokument aufbauen: der Prolog,
das Wurzelelement und schließlich eine optionale, nicht ausdrücklich empfohlene
Sammlung verschiedener Kommentare
14
im Anschluss an das Wurzelelement. Doch für die
meisten praktischen Anwendungen, die auch von der großen Mehrheit aller Dokumente
repräsentiert werden, kann man sich ein XML-Dokument einfach als Prolog und einem
Wurzelelement vorstellen.
15
Die folgende Grafik soll das in der Praxis geläufige Grundgerüst eines XML-Dokuments
noch einmal veranschaulichen:
14
vgl. World Wide Web Konsortium: Extensible Markup Language (XML) 1.0 (Second Edition), 2000. URL:
http://www.w3.org/TR/2000/REC-xml-20001006 [Stand: 21/10/2001].
15
vgl. Arciniegas, F.: XML ­ Developer's Guide. Poing 2001, S. 32.

Seite 22
Abbildung 7: Aufbau eines typischen XML-Dokuments
© Hofinger
Obwohl der Prolog syntaktisch optional ist, sollte er trotzdem ein XML-Dokument einleiten,
da dieser doch meist unverzichtbar ist und maßgeblich über die Weiterverarbeitung der
XML-Daten entscheidet. Der Prolog selbst setzt sich aus drei Teilen zusammen:
2.5.1.1 Die XML-Deklaration
Zu Beginn des Prologs steht die XML-Deklaration, welche die Versionsangabe, optional den
verwendeten Zeichensatz (Schlüsselwort: encoding) und eine Standalone-Deklaration
16
(Schlüsselwort: standalone) beinhaltet. Zum Zeitpunkt des Verfassens dieser Arbeit gibt es
als Versionsangabe ausschließlich die Version 1.0, jedoch sollte man diese im Hinblick auf
weitere Entwicklungen der Sprache trotzdem korrekt verwenden.
2.5.1.2 Die Stylesheet-Referenz
Der XML-Deklaration kann eine Referenz auf ein externes Stylesheet folgen. Einerseits kann
dies ein Cascading Stylesheet (CSS) sein, das sich heute vor allem bei der HTML-
Programmierung zum Zweck einer präziseren Textformatierung etabliert hat.
16
Die Standalone-Deklaration als optionaler Teil der XML-Deklaration informiert die XML-Anwendung darüber, ob es
Deklarationen gibt, die außerhalb des Dokuments stehen.
<?xml version="1.0" ...>
<?xml-stylesheet type="text/xsl" ...>
<!DOCTYPE ...>
Prolog
Wurzel-
element
XML-Deklaration
gesamte
XML-Daten
Stylesheet-Referenz
Dokumententypdeklaration
(DOCTYPE-Deklaration)

Details

Seiten
Erscheinungsform
Originalausgabe
Jahr
2001
ISBN (eBook)
9783832448882
ISBN (Paperback)
9783838648880
DOI
10.3239/9783832448882
Dateigröße
2.5 MB
Sprache
Deutsch
Institution / Hochschule
Management Center Innsbruck Internationale Fachhochschulgesellschaft mbH – unbekannt
Erscheinungsdatum
2002 (Januar)
Note
1,0
Schlagworte
publishing internet cross-media-publishing
Zurück

Titel: Cross-Media-Publishing mit XML
book preview page numper 1
book preview page numper 2
book preview page numper 3
book preview page numper 4
book preview page numper 5
book preview page numper 6
book preview page numper 7
book preview page numper 8
book preview page numper 9
book preview page numper 10
book preview page numper 11
book preview page numper 12
book preview page numper 13
book preview page numper 14
book preview page numper 15
book preview page numper 16
book preview page numper 17
book preview page numper 18
book preview page numper 19
book preview page numper 20
book preview page numper 21
book preview page numper 22
book preview page numper 23
108 Seiten
Cookie-Einstellungen