Lade Inhalt...

Eine XML-Datenbank als Basis für ein Enterprise Application Integration-Konzept

Theoretische Untersuchung und prototypenhafte Implementierung bei der Schwan-STABILO Cosmetics GmbH & Co

©2001 Diplomarbeit 104 Seiten

Zusammenfassung

Inhaltsangabe:Einleitung:
Mit dem Voranschreiten des Mediums Internet und der allgemeinen Vernetzung von Rechnern wird es immer wichtiger für alle Arten von digitalen Daten ein einheitliches, strukturiertes, standardisiertes, aber dennoch flexibles Format für deren Übertragung über Medien- und Plattformgrenzen hinweg bereitzustellen. Diese Aufgabe soll in Zukunft u.a. die Extensible Markup Language (XML) übernehemen. Ihr grundsätzlicher Aufbau sowie Anwendungsmöglichkeiten, insbesondere in Bezug auf die erste native XML-Datenbank „Tamino“ der Software AG Darmstadt, sind Inhalt dieser Diplomarbeit.
Bei den Grundlagen von XML werden u.a. ihre Abgrenzung zu SGML und HTML, der logische und physische Aufbau eines XML-Dokuments sowie XML-Parser und Namensräume näher erläutert. Weiterhin werden Referenzmöglichkeiten in XML-Dokumenten und Anfragesprachen für XML-Fragmente dargestellt. Für die Konvertierung von XML-Dokumenten wird auf die Stylesheet-Technologien CSS, XSL und XSLT eingegangen.
Die Bedeutung von XML als Basis für ein Datenbank-Management-System (DBMS) wird ab Kapitel 5 erläutert. Hierbei steht die Untersuchung der ersten rein auf XML basierenden Datenbank „Tamino“ der Software AG Darmstadt im Vordergrund sowie deren Unterschiede zu konventionellen Relationalen DBMS mit der Hervorhebung spezifischer Vor- und Nachteile. Zudem wird die Bewertung und Bedeutung von XML und Tamino für Unternehmensanwendungen praktisch anhand eines Content Management-Systems und eines Enterprise Application-Konzepts aufgeführt.

Inhaltsverzeichnis:Inhaltsverzeichnis:
AbbildungsverzeichnisV
TabellenverzeichnisVI
AbkürzungsverzeichnisVII
Kapitel 1: Einleitung1
1.1Das Unternehmen Schwan-STABILO Cosmetics GmbH & Co.2
1.2Aufgabenstellung2
1.3Motivation3
Kapitel 2: Einführung in die Extensible Markup Language4
2.1Was ist XML4
2.1.1W3C - Das World Wide Web Consortium5
2.1.2Von SGML zu XML6
2.1.3HTML versus XML - XHTML7
2.2Das Sprachkonzept von XML8
2.2.1Logische und physische Strukturierung eines XML-Dokuments8
2.2.2Dokument Type Definition10
2.2.3Aufteilung eines XML-Dokuments12
2.2.4XML-Parser13
2.2.5Namensräume16
2.3Referenzmöglichkeiten in XML-Dokumenten17
2.3.1XML Linking Language17
2.3.2XML Pointer Language19
2.4Anfragesprachen für XML-Fragmente20
2.4.1XML Path Language20
2.4.2Query Language for XML23
2.5XML-Werkzeuge24
2.6Zusammenfassung25
Kapitel 3: Konvertierung und Aufbereitung von XML-Dokumenten26
3.1Einführung in die […]

Leseprobe

Inhaltsverzeichnis


ID 4245
Saueressig, German: Eine XML-Datenbank als Basis für ein Enterprise Application Integration-
Konzept: theoretische Untersuchung und prototypenhafte Implementierung bei der Schwan-
STABILO Cosmetics GmbH & Co / German Saueressig - Hamburg: Diplomica GmbH, 2001
Zugl.: Ansbach, Fachhochschule, Diplom, 2001
Dieses Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte, insbesondere die
der Übersetzung, des Nachdrucks, des Vortrags, der Entnahme von Abbildungen und Tabellen,
der Funksendung, der Mikroverfilmung oder der Vervielfältigung auf anderen Wegen und der
Speicherung in Datenverarbeitungsanlagen, bleiben, auch bei nur auszugsweiser Verwertung,
vorbehalten. Eine Vervielfältigung dieses Werkes oder von Teilen dieses Werkes ist auch im
Einzelfall nur in den Grenzen der gesetzlichen Bestimmungen des Urheberrechtsgesetzes der
Bundesrepublik Deutschland in der jeweils geltenden Fassung zulässig. Sie ist grundsätzlich
vergütungspflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des
Urheberrechtes.
Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem
Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche
Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten
wären und daher von jedermann benutzt werden dürften.
Die Informationen in diesem Werk wurden mit Sorgfalt erarbeitet. Dennoch können Fehler nicht
vollständig ausgeschlossen werden, und die Diplomarbeiten Agentur, die Autoren oder
Übersetzer übernehmen keine juristische Verantwortung oder irgendeine Haftung für evtl.
verbliebene fehlerhafte Angaben und deren Folgen.
Diplomica GmbH
http://www.diplom.de, Hamburg 2001
Printed in Germany

Wissensquellen gewinnbringend nutzen
Qualität, Praxisrelevanz und Aktualität zeichnen unsere Studien aus. Wir
bieten Ihnen im Auftrag unserer Autorinnen und Autoren Wirtschafts-
studien und wissenschaftliche Abschlussarbeiten ­ Dissertationen,
Diplomarbeiten, Magisterarbeiten, Staatsexamensarbeiten und Studien-
arbeiten zum Kauf. Sie wurden an deutschen Universitäten, Fachhoch-
schulen, Akademien oder vergleichbaren Institutionen der Europäischen
Union geschrieben. Der Notendurchschnitt liegt bei 1,5.
Wettbewerbsvorteile verschaffen ­ Vergleichen Sie den Preis unserer
Studien mit den Honoraren externer Berater. Um dieses Wissen selbst
zusammenzutragen, müssten Sie viel Zeit und Geld aufbringen.
http://www.diplom.de bietet Ihnen unser vollständiges Lieferprogramm
mit mehreren tausend Studien im Internet. Neben dem Online-Katalog und
der Online-Suchmaschine für Ihre Recherche steht Ihnen auch eine Online-
Bestellfunktion zur Verfügung. Inhaltliche Zusammenfassungen und
Inhaltsverzeichnisse zu jeder Studie sind im Internet einsehbar.
Individueller Service
­
Gerne senden wir Ihnen auch unseren Papier-
katalog zu. Bitte fordern Sie Ihr individuelles Exemplar bei uns an. Für
Fragen, Anregungen und individuelle Anfragen stehen wir Ihnen gerne zur
Verfügung. Wir freuen uns auf eine gute Zusammenarbeit.
Ihr Team der Diplomarbeiten Agentur

FACH________
HOCHSCHULE
ANSBACH____
____ University of
Applied Sciences
FACH________
HOCHSCHULE
ANSBACH____
____ University of
Applied Sciences
Diplomarbeit
Fachbereich Wirtschaftsingenieurwesen
Thema:
Autor:
German Saueressig
Eine XML-Datenbank als Basis für ein
Enterprise Application Integration-Konzept -
theoretische Untersuchung und
prototypenhafte Implementierung bei der
Schwan-STABILO Cosmetics GmbH & Co.

Fachhochschule Ansbach
German Saueressig
II
Inhaltsverzeichnis
Abbildungsverzeichnis... V
Tabellenverzeichnis ...VI
Abkürzungsverzeichnis ... VII
Kapitel 1 Einleitung... 1
1.1
Das Unternehmen Schwan-STABILO Cosmetics GmbH & Co. ... 2
1.2 Aufgabenstellung ... 2
1.3 Motivation... 3
Kapitel 2 Einführung in die Extensible Markup Language ... 4
2.1
Was ist XML... 4
2.1.1
W3C - Das World Wide Web Consortium ... 5
2.1.2
Von SGML zu XML... 6
2.1.3
HTML versus XML ­ XHTML... 7
2.2
Das Sprachkonzept von XML... 8
2.2.1
Logische und physische Strukturierung eines XML-Dokuments... 8
2.2.2
Dokument Type Definition... 10
2.2.3
Aufteilung eines XML-Dokuments ... 12
2.2.4
XML-Parser ... 13
2.2.5
Namensräume ... 16
2.3
Referenzmöglichkeiten in XML-Dokumenten ... 17
2.3.1
XML Linking Language ... 17
2.3.2
XML Pointer Language ... 19
2.4
Anfragesprachen für XML-Fragmente ... 20
2.4.1
XML Path Language... 20
2.4.2
Query Language for XML ... 23
2.5 XML-Werkzeuge ... 24
2.6 Zusammenfassung ... 25

Fachhochschule Ansbach
German Saueressig
III
Kapitel 3 Konvertierung und Aufbereitung von XML-Dokumenten... 26
3.1
Einführung in die Stylesheet-Technologie ... 26
3.1.1
XML-Transformation ... 27
3.1.2
XML-Formatierung ... 31
3.2 XSL-Prozessoren ... 35
3.2.1
Funktionsweise ... 35
3.2.2
Prozessortypen... 36
3.3 Zusammenfassung ... 37
Kapitel 4 Technische Realisierung eines Rohstoffdatenblattes in XML ... 38
4.1 Ist-Situation... 38
4.1.1
Konzeptionelle Anforderungen ... 38
4.1.2
Vorhandene Software ... 39
4.1.3
Abschließende Zieldefinition... 39
4.2
Entwicklung der DTD... 40
4.2.1
Bestimmung von Elementen und Attributen ... 40
4.2.2
Bildung von Elementhierarchien ... 43
4.2.3
Gewährleistung der Datenintegrität... 44
4.3 Bildung
von
XML-Instanzen ... 44
4.4
Transformation in HTML ... 45
4.5 Zusammenfassung
und
Fazit ... 47
Kapitel 5 XML als Basis für ein Datenbank-Management-System... 49
5.1
Allgemeine Datenbank-Management-Systeme in der Übersicht... 49
5.1.1
Relationale Datenbank-Management-Systeme... 50
5.1.2
Objektorientierte Datenbank-Management-Systeme... 53
5.2
Tamino ­ Das XML-Datenbank-Management-System der Software AG... 54
5.2.1
Die Architektur von Tamino... 54
5.2.2
Administration der Tamino Datenbank ... 57
5.2.3
Funktionelles Ablegen und Anfragen von XML-Objekten ... 58
5.2.4
Installation von Tamino... 61
5.3
Das XML-Datenbank-Management-System Tamino versus Relationale
Datenbank-Management-Systeme ... 62
5.3.1
Datenbeschreibung und -speicherung... 62
5.3.2
Extrahieren und Updaten von Daten... 63

Fachhochschule Ansbach
German Saueressig
IV
5.3.3
Weiterverarbeitung von Daten... 64
5.3.4
Heterogene Datenanbindung ... 65
5.3.5
Fazit ... 65
5.4 Zusammenfassung ... 67
Kapitel 6 Bewertung und Bedeutung von XML für Unternehmensanwendungen 68
6.1
Content Management mit XML... 68
6.1.1
Einführung Content Management... 69
6.1.2
Anwendung für ein Content Management... 71
6.2
XML als Teil eines unternehmensübergreifenden Enterprise Application
Integration-Konzepts ... 74
6.2.1
Einführung Enterprise Application Integration ... 75
6.2.2
Bedeutung von XML für ein Enterprise Application Integration-Konzept... 77
6.3
Zusammenfassung und Ausblick ... 78
Kapitel 7 Resümee ... 80
Literaturverzeichnis ... 83
Verzeichnis der Internet-Quellen ... 85
Glossar ... 88
Ehrenwörtliche Erklärung... 91

Fachhochschule Ansbach
German Saueressig
V
Abbildungsverzeichnis
Abbildung 1: Aufteilung eines Dokuments ... 5
Abbildung 2: Logische Struktur der Elemente ... 9
Abbildung 3: Achsen des Kontextknotens... 21
Abbildung 4: Box-Modell der Cascading Style Sheets ... 33
Abbildung 5: Allgemeiner Formatierungs- und Transformationsvorgang von
XML-Dokumenten... 35
Abbildung 6: Arbeitsweise eines XSL-Prozessors ... 36
Abbildung 7: Auszug Rohstoffdatenblatt ... 41
Abbildung 8: Auszug Rohstoffdatenblatt - Tabellen... 42
Abbildung 9: XML-Dokument Rohstoffdatenblatt ... 45
Abbildung 10: XSLT-Stylesheet Rohstoffdatenblatt... 46
Abbildung 11: Transformiertes XML-Dokument in deutscher Fassung ... 47
Abbildung 12: Grobarchitektur von Datenbanksystemen ... 50
Abbildung 13: Aufbau einer Tabelle im relationalen Datenmodell ... 51
Abbildung 14: Aufbau und Funktion eines Objekts ... 53
Abbildung 15: Architektur des Informations-Server Tamino... 56
Abbildung 16: Tamino Manager... 58
Abbildung 17: Zusammenhang zwischen Collection, Tamino Schema und
XML-Instanz... 59
Abbildung 18: Tamino Interactive Interface ... 60
Abbildung 19: Grundkonzept eines Content Managements ... 70
Abbildung 20: Content Management-Modell... 73
Abbildung 21: Aufbau eines typischen EAI-Werkzeuges... 77

Fachhochschule Ansbach
German Saueressig
VI
Tabellenverzeichnis
Tabelle 1: Entity-Referenzen ... 10
Tabelle 2: Elementtypen für erweiterte Links ... 19
Tabelle 3: XPath-Achsen und ihre Bedeutung ... 21
Tabelle 4: Auszug XPath-Abkürzungen ... 22
Tabelle 5: Auszug XSL-Top-Level-Elemente... 30
Tabelle 6: Auszug XSL-Basiselemente ... 30
Tabelle 7: Assoziationstypen einer Tabelle ... 52

Fachhochschule Ansbach
German Saueressig
VII
Abkürzungsverzeichnis
! Abb. Abbildung
! API
Application Programming Interface
! ASCII
American Standard Code for Information Interchange
! B2B
Business to Business
! CDATA Character
Data
! CML
Chemical Markup Language
! CMS Content
Management-System
! CSS
Cascading Style Sheets
! DBMS Datenbank-Management-System
! DBS Datenbanksystem
! DOM
Document Object Model
! DSSSL
Document Style Semantics and Specification Language
! DTD
Document Type Definition
! EAI
Enterprise Application Integration
! ebd. ebenda
! E-Commerce Electronic
Commerce
! EDI
Electronic Data Interchange
! EDIFACT
Electronic Data Interchange For Administration Commerce
and Transport
! engl. englisch
! ER Entity
Relationship
! ERP
Enterprise Resource Planning
! f. folgende
Seite
! ff. fortfolgende
Seiten
! GML
Generalized Markup Language
! GUI
Graphical User Interface
! HTML
HyperText Markup Language
! HTTP
HyperText Transfer Protocol
! IBM
International Business Machines
! ID Identification
! IDREF Identification
Reference
! ISO
International Organization for Standardization
! JDBC
Java Database Connectivity
! MIME
Multipurpose Internet Mail Extensions

Fachhochschule Ansbach
German Saueressig
VIII
! MSIE
Microsoft Internet Explorer
! ODBC
Open Database Connectivity
! OODBMS Objektorientiertes
Datenbank-Management-System
! PCDATA
Parsed Character Data
! PDF
Portable Document Format
! QName Qualifizierender
Name
! RAM
Random Access Memory
! RDBMS Relationales
Datenbank-Management-System
! RDF
Resource Description Framework
! RTF
Rich Text Format
! S. Seite
! SAP
Systeme, Anwendungen, Produkte
! SAX
Simple Application Programming Interface for XML
! SGML
Standard Generalized Markup Language
! SQL
Structured Query Language
! Tab. Tabelle
! Tamino
Transaktions-Architektur zum Management von Internet-
Objekten
! UA User
Agent
! URI
Uniform Resource Identifier
! URL
Uniform Resource Locator
! u. U.
unter Umständen
! Vgl. Vergleiche
! W3C
World Wide Web Consortium
! WML
Wireless Markup Language
! WWW
World Wide Web
! XHTML
Extensible HyperText Markup Language
! XLink
Extensible Markup Language Linking Language
! XML
Extensible Markup Language
! xmlns
extensible markup language namespace
! XML-QL
Query Language for XML
! XPath
Extensible Markup Language Path Language
! XPointer
Extensible Markup Language Pointer Language
! XQL
Extensible Markup Language Query Language
! XSL
Extensible Stylesheet Language
! XSL-FO
Extensible Stylesheet Language Formatting Objects
! XSLT
Extensible Stylesheet Language Transformations

Fachhochschule Ansbach
German Saueressig
1
Kapitel 1
Einleitung
In den vergangenen Jahren und Jahrzehnten ist der Information eine besondere Bedeutung
zugekommen. Sowohl die Wissenschaft als auch die Industrie beschäftigten sich zuneh-
mend mit der strategischen Rolle, die Informationen hinsichtlich des Wettbewerbs zwi-
schen Unternehmen einnehmen werden. Vor allem die rasante Entwicklung des Internets
mit ihren nahezu unerschöpflichen Ressourcen hat in unserer heutigen Gesellschaft dazu
geführt, dass Informationen zu einem bedeutenden Wirtschaftsfaktor angewachsen sind.
Stand das Internet anfangs nur Wenigen für wissenschaftliche oder militärische Zwecke
zur Verfügung, so kann es heute bereits von einer großen Allgemeinheit in fast allen Le-
bensbereichen genutzt werden. Glaubt man zudem den Zahlen führender Marktfor-
schungsinstitute, so wird das Internet auch in den kommenden Jahren noch beachtliche
Wachstumsraten zeigen.
Viele Unternehmen erkennen durch die zunehmende Kommerzialisierung des Internets,
dass es sich dabei weit mehr als um eine reine Werbeplattform handelt. Vielmehr ent-
wickelt sich das Internet durch seine weltweite Reichweite zu einem bevorzugten Medi-
um für die Abwicklung von Geschäftstransaktionen. Mit diesem Voranschreiten des Me-
diums Internet und der allgemeinen Vernetzung von Rechnern wird es immer wichtiger
für alle Arten von digitalen Daten ein einheitliches, strukturiertes, standardisiertes, aber
dennoch flexibles Format für deren Übertragung über Medien- und Plattformgrenzen
hinweg bereitzustellen. Diese Aufgabe soll in Zukunft u.a. der Extensible Markup
Language (XML) übertragen werden. Ihr grundsätzlicher Aufbau sowie Anwendungs-
möglichkeiten, insbesondere in Bezug auf eine XML-basierte Datenbank, sind Inhalt die-
ser Diplomarbeit. Grundkenntnisse im Bereich der Internetprogrammierung (HTML und
CSS-Kenntnisse) sowie im Bereich Datenbanken werden zum Verständnis der Ausfüh-
rungen vorausgesetzt.

Fachhochschule Ansbach
German Saueressig
2
1.1 Das Unternehmen Schwan-STABILO Cosmetics GmbH & Co.
Das Unternehmen Schwan-STABILO Cosmetics
1
gehört als Teilkonzern der Unterneh-
mensgruppe Schwan-STABILO
2
an. Zu dieser Gruppe zählt auch der weltweit bekannte
STABILO-Schreibgerätebereich sowie das Schwan-STABILO Promotion Products
3
, das
vornehmlich für den werbewirksamen Vertrieb des STABILO-Schreibgerätesortiments
verantwortlich ist.
Der Kosmetikkonzern beschäftigt in seinem Stammhaus Heroldsberg nahe Nürnberg
mehr als 1000 Mitarbeiter. Als sog. Private Label Hersteller unterschiedlichster Kosmeti-
ka fertigt er Produkte direkt auf Kundenwunsch unter dessen Label an. Zum Kundenkreis
zählen dabei alle namhaften nationalen und internationalen Kosmetikunternehmen.
1.2 Aufgabenstellung
Um für den Kundenstamm des Unternehmens eine entsprechende Dokumentation über
die hergestellten Produkte gemäß den vorgegebenen Richtlinien zu liefern, müssen ver-
schiedene Daten firmenintern zusammengetragen und kundenspezifisch dargestellt wer-
den. Das Problem für das Unternehmen Schwan-STABILO Cosmetics ergibt sich daraus,
dass innerhalb ihrer Organisation viele verschiedene Daten in unterschiedlichen Applika-
tionen verwaltet werden. Um diesen ,,Datendschungel" zukünftig zu umgehen, soll im
Rahmen meiner Diplomarbeit prototypenhaft untersucht werden, inwiefern Konzerndaten
in einer neutralen Form gesammelt und in einem weiteren Schritt im Inter- bzw. Intranet
präsentiert werden können. Darüber hinaus sollen noch weitere Verwendungsmöglichkei-
ten, wie z.B. spezielle Druckformate oder der Datenaustausch, aufgegriffen und erörtert
werden. Als Basis für die Datenbeschreibung dient der aktuell in den Fachkreisen
vieldiskutierte Sprachstandard XML. Für die Bestandshaltung der Daten wird ein neues
Produkt der Software AG Darmstadt, die XML-Datenbank Tamino, herangezogen und für
die Organisation von XML-Daten näher untersucht. Dabei soll auch berücksichtigt
werden, welche Unterschiede sich bei dieser Art von Datenbank gegenüber den
konventionellen relationalen Datenbanken ergeben.
1
Vgl. Schwan-STABILO Cosmetics, [28.03.2001], http://www.schwancosmetics.com
2
Vgl. Schwan-STABILO, [28.03.2001], http://www.stabilo.com
3
Vgl. Schwan-STABILO Promotion Products, [28.03.2001], http://www.stabilo-promotion.com

Fachhochschule Ansbach
German Saueressig
3
relationalen Datenbanken ergeben.
1.3 Motivation
Der Entschluss, sich für dieses Diplomarbeitsthema der Firma Schwan-STABILO Cos-
metics zu entscheiden, lag einerseits darin, dass ich mich schon während meiner Studien-
zeit für das Medium Internet sehr interessiert habe und durch meinen Schwerpunkt Me-
dienelektronik an der Fachhochschule Ansbach vielseitige Einblicke in unterschiedlichste
Medienlandschaften erworben habe. Andererseits lag es aber auch an der Aktualität des
Themas XML, das gegenwärtig einer der am häufigsten verwendeten Begriffe in der
Softwareentwicklung ist. In vielen Fachzeitschriften und ­artikeln sowie auf Webseiten
namhafter Softwarefirmen wird vorausgesagt, dass ein Grossteil der Entwickler und An-
wender XML in Zukunft auf verschiedene Weise nutzen werden. Da zudem der Zusam-
menhang zwischen XML und Datenbanken bisher noch nicht ausreichend untersucht
worden ist, stellte dies ebenfalls eine Möglichkeit, aber auch eine Herausforderung, für
mich dar, XML konkret in Bezug auf eine Anwendung tiefergehend zu begutachten.

Fachhochschule Ansbach
German Saueressig
4
Kapitel 2
Einführung in die Extensible Markup Language
Mit der Verabschiedung der EXtensible Markup Language (XML) als offiziellen Stan-
dard im Februar 1998, hat das World Wide Web Consortium (W3C)
4
eine sehr mächtige
Sprache geschaffen, die bei der digitalen Vermittlung von Informationen völlig neue
Möglichkeiten eröffnet. Um die Zusammenhänge und die Funktionsvielfalt von XML zu
verdeutlichen, wird in diesem Kapitel auf die Grundlagen der XML-Spezifikation 1.0 und
ihrer bisherigen Entwicklung eingegangen. Desweiteren wird auch das Umfeld von XML
vorgestellt, um Methoden der Referenzierung von Dokumenten und Konzepte wie Na-
mensräume kennenzulernen. Außerdem werden die wichtigsten Anfragesprachen in Be-
zug auf XML erläutert. Hierbei sei noch einmal darauf verwiesen, dass es sich bei den
Ausführungen nicht um eine detaillierte, sondern vielmehr um eine grundlegende Be-
schreibung der XML-Konventionen handelt.
2.1 Was ist XML
XML gehört in den Bereich der sog. Metasprachen, mit deren Vorschriften es möglich ist
eigene Beschreibungssprachen für Dokumentinhalte zu definieren. Beschreibungsspra-
chen werden dabei auch als Auszeichnungssprachen, engl. Markup Language
5
,
bezeichnet, deren Grundidee darin liegt, ein Dokument mit seinem Inhalt in verschiedene
Teile zu zerlegen und diese über Auszeichnungen (Tags bzw. Markup) zu strukturieren.
Mit dem Begriff ,,extensible" im Wort XML wird auf die Fähigkeit hingewiesen, dass
Auszeichnungen beliebig erweitert oder geändert werden können. Dies besagt wiederum,
dass die Definition eigener Tags mit individuellen semantischen Bezeichnungen möglich
ist. Durch dieser Meta-Auszeichnung von Dokumenten wird neben der Struktur auch die
Bedeutung von Inhalten durch die XML-Tags wiedergegeben.
6
4
Vgl. World Wide Web Consortium, [15.03.2001], http://www.w3.org
5
,,Markup ist eine Methode zur Übermittlung von Metadaten, d.h. Daten über Daten.[...].", vgl. Anderson,
XML Professionell (2000), S.34.

Fachhochschule Ansbach
German Saueressig
5
deutung von Inhalten durch die XML-Tags wiedergegeben.
6
Generell wird ein Dokument in XML dadurch charakterisiert, indem eine strikte Tren-
nung zwischen Inhalt, Struktur und Format vorgenommen wird (vgl. Abb. 1). Der Inhalt
wird dabei durch die reine Textinformation repräsentiert, während die Struktur des Inhalts
über die Anordnung der Tags beschrieben wird. Die Präsentation des Inhalts erfolgt mit
Hilfe einer separaten Formatvorlage, die das Layout der Darstellung festlegt.
7
Struktur
Format
Inhalt
Struktur
Format
Inhalt
Abbildung 1: Aufteilung eines Dokuments
Quelle: Pott / Wielage, XML Praxis und Referenz, S.19.
2.1.1 W3C - Das World Wide Web Consortium
Mit der Einführung von XML sollten vor allem die Belange des Internets unterstützt wer-
den, um mit ihr den Austausch von strukturierten Daten in einem einheitlichen, offenen
und medienneutralen Format zu ermöglichen. Gerade aber im Hinblick auf offene Stan-
dards neigen viele Hersteller dazu, sich über proprietäre Ansätze Marktvorteile zu ver-
schaffen. Damit diesem vorgebeugt werden kann, bedarf es einer wirksamen Kontrolle
durch eine allgemein anerkannte Institution, um dem Ziel der ständigen und öffentlichen
Weiterentwicklung Rechnung tragen zu können. Aus diesem Grund hat sich seit 1994 das
W3C dieser Aufgabe angenommen. Hierbei handelt es sich um eine Organisation aus u-
niversitären Einrichtungen und Industrieunternehmen, die zusammen mit der WWW-
Gemeinschaft die Zukunft des Internets diskutieren.
6
Vgl. Michel, XML kompakt (1999), S.21f.
7
Vgl. Pott / Wielage, XML Praxis und Referenz (2000), S.19.

Fachhochschule Ansbach
German Saueressig
6
"The World Wide Web Consortium (W3C) develops interoperable technologies (specifica-
tions, guidelines, software, and tools) to lead the Web to its full potential as a forum for in-
formation, commerce, communication, and collective understanding."
8
Die Arbeitsweise des W3Cs beruht darauf, dass bis zur Erklärung eines neuen Standards
(Recommendation) unterschiedliche Stationen der Überprüfung und der öffentlichen Dis-
kussion durchlaufen werden. In der ersten Station Working Draft wird der WWW-
Gemeinschaft über das W3C-Forum ein ausgearbeiteter Entwurf zur Diskussion bereitge-
stellt. Nach einer Diskussionszeitspanne wird der Entwurf von den W3C-Mitgliedern neu
bewertet und als sog. Candidate Recommendation wiederum zur Diskussion im W3C-
Forum offengelegt. Bevor ein Entwurf den endgültigen Status einer öffentlichen Empfeh-
lung erreicht, durchläuft er noch eine dritte Station mit dem Namen Proposed Re-
commendation, der in der gleichen Art und Weise wie in den ersten beiden Stufen disku-
tiert und durch das W3C bewertet wird.
9
2.1.2 Von SGML zu XML
In den sechziger Jahren wurde mit der Generalized Markup Language (GML) die erste
Metasprache zur Beschreibung von Daten mit Daten entwickelt. Aus ihren Ansätzen her-
aus entstand im Jahr 1986 die Standard Generalized Markup Language (SGML). Sie
wurde von der International Organization for Standardization (ISO)
10
als erste standardi-
sierte Metasprache überhaupt verabschiedet und gilt daher als Basis aller Auszeichnungs-
sprachen. XML versteht sich dabei als echte Teilmenge von SGML, mit der ebenfalls ein
Entwickeln neuer Auszeichnungssprachen nach individuellen Bedürfnissen möglich ist.
XML entstand aus der Notwendigkeit heraus, die Nachteile von SGML in Bezug auf On-
line-Medien, wie dem hohen Komplexitätsgrad und der damit verbundenen schwierigen
und teueren Umsetzung, zu reduzieren. Sie sollte aber gleichzeitig auch die Vorteile von
SGML beibehalten, die vor allem in ihrer Mächtigkeit und der Interoperabilität liegen.
11
8
Vgl. World Wide Web Consortium, [15.03.2001], http://www.w3.org
9
Vgl. ebd., [15.03.2001], http://www.w3.org/Consortium/Offices/Germany/ info.html
10
Vgl. International Organization for Standardization, [15.03.2001], http://www.iso.ch
11
Vgl. Pott / Wielage, XML Praxis und Referenz (2000), S.47f.

Fachhochschule Ansbach
German Saueressig
7
2.1.3 HTML versus XML ­ XHTML
Die HyperText Markup Language (HTML) hat sich seit Beginn ihrer Entwicklung 1989
und ersten Standardisierung 1994 als Auszeichnungssprache für Internetapplikationen ei-
ne weitverbreitete Akzeptanz geschaffen. Dies ist vor allem darauf zurückzuführen, dass
sie durch ihre relativ einfache Erlernbarkeit einen schnellen Einstieg in den Aufbau und
der Gestaltung von Internetseiten erlaubt. Im Gegensatz zu XML ist HTML eine mit
SGML definierte Auszeichnungssprache und daher auch eine direkte Anwendung von
SGML.
Mit der zunehmenden Entwicklung des Internets wurden jedoch die Schwächen und die
Grenzen von HTML deutlich aufgezeigt. So erlaubt HTML dem Anwender nicht eigene
Tags zu definieren, um Daten eine semantische Bezeichnung zu verleihen. Weiterhin ist
die starke Layout-Orientierung ein Problem, da mit den fest vorgegebenen Tags das Er-
scheinungsbild, aber nicht der Inhalt beschrieben werden kann. Ein zusätzlicher Nachteil
aus Datenbanksicht ist die Fehlen von Strukturbildungen, um Objekthierarchien oder
Schemata wiederzugeben. Um den erläuterten Problemen entgegenzutreten, wurde mit
XML als Metasprache u.a. dort angesetzt, wo HTML keine einfache und handhabbare
Entwicklungsmöglichkeit bietet.
XML wird und soll aber auch in der Zukunft HTML nicht vollständig ablösen, da XML
eher inhaltsbezogen ausgerichtet ist, wogegen HTML sich ausschließlich darum bemüht,
wie die Informationen am Bildschirm dargestellt werden. Damit aber auch HTML von
den Vorteilen aus der XML-Welt profitieren kann, begann das W3C mit der Entwicklung
einer neuen HTML-Generation, der Extensible HyperText Markup Language (XHTML)
12
.
Hierbei werden HTML-Tags über einzelne Module (XHTML-DTDs)
13
als XML-
Anwendung wiedergegeben. Diese Module können optional für die Auszeichnung eines
Dokuments herangezogen und eingefügt werden. Mit XHTML 1.0, das seit Januar 2000
den Status einer öffentlichen Empfehlung besitzt, werden die aktuellen HTML-Befehle in
der Version 4.0 sowie einige neue Tags durch die drei Module mit den Namen strict,
transitional und frameset bereitgestellt. Das Ziel von XHTML ist neben der XML-
Konformität und seinen damit verbundenen Vorzügen auch ein weiteres Verarbeiten von
12
Vgl. World Wide Web Consortium, [17.03.2001], http://www.w3.org/TR/xhtml1/
13
Die Funktion einer DTD wird in Kapitel 2.2.2 erläutert.

Fachhochschule Ansbach
German Saueressig
8
XML mit den gängigen HTML-Browsern zu ermöglichen. Zu den bisher vorhandenen
Basismodulen sollen noch weitere Befehlsmodule für unterschiedliche Einsatzbereiche,
z.B. industriebezogene Anwendungen, entwickelt werden, um eine flexible Verwendung
von XHTML auch für die Zukunft zu gewährleisten.
14
2.2 Das Sprachkonzept von XML
Dokumente bestehen aus unterschiedlichen Zeichendaten, die über einen vorgegebenen
Zeichensatz festgelegt werden. Für den Anwendungsbereich von XML heißt dieser Zei-
chensatz Unicode.
15
Dieser ISO-standardisierte Zeichensatz unterstützt die meisten euro-
päischen und asiatischen Zeichen und erweist sich zudem als kompatibel zum ASCII-
Code
16
. Damit XML als Meta-Auszeichnungssprache diesen Zeichensatz benutzen kann,
müssen bestimmte Grundkonventionen eingehalten werden, um mit ihnen Dokumenten-
strukturen eindeutig darstellen zu können.
2.2.1 Logische und physische Strukturierung eines XML-Dokuments
Zur inhaltlichen Beschreibung der verschiedenen Abschnitte oder Komponenten eines
Dokuments verwendet XML Auszeichnungen (Markup). Der Aufbau dieser Auszeich-
nungen besteht, wie von HTML bereits bekannt, aus Elementen. Ein Element setzt sich in
der Regel aus einem Start-Tag der Form <...> und einem Ende-Tag der Form </...> zu-
sammen, zwischen denen die eigentlichen Zeichendaten eines Dokuments enthalten sind.
Darüber hinaus besteht die Möglichkeit innerhalb von Tags Verweise zu anderen Res-
sourcen herzustellen oder Verarbeitungsanweisungen bzw. diverse Kommentare zu signa-
lisieren. Mit Attributen
17
, die ebenfalls innerhalb der Tags angegeben werden, wird eine
weitere Form der Auszeichnung von Inhalten zur Verfügung gestellt. Sie sind gekenn-
zeichnet durch einen Attributnamen und einen zugehörigen Attributwert, der den Inhalt
14
Vgl. Rusty Harold, Die XML Bibel (2000), S.771ff.
15
Vgl. Möhr / Schmidt, SGML und XML ­ Anwendungen und Perspektiven (1999), S.117.
16
,,ASCII, der American Standard Code for Information Interchange, ist einer der ursprünglichen Zeichen-
sätze mit der bei weitem größten Verbreitung.", vgl. Rusty Harold, Die XML Bibel (2000), S.212.
17
,,Wenn die Elemente die Substantive von XML sind, dann kann man die Attribute als Adjektive betrach-
ten.", vgl. Anderson, XML Professionell (2000), S.65.

Fachhochschule Ansbach
German Saueressig
9
des Dokuments repräsentiert. Im Gegensatz zu den HTML-Konventionen wird in XML
strikt zwischen Groß- und Kleinschreibung innerhalb der Tags unterschieden.
18
Durch die
Anordnung der Elemente in einem Dokument entsteht eine hierarchische Gliederung, die
als logische Struktur oder auch Baumstruktur der Elemente bezeichnet wird. Das erste
Element in dieser Struktur heißt Wurzelelement und beinhaltet alle anderen Elemente als
Unterelemente, die ihrerseits selbst wiederum Unterelemente besitzen können.
19
Zur Ver-
deutlichung der Ausführungen dient das folgende Beispiel (vgl. Abb. 2). Hierbei stellt das
Element Land das Wurzelelement dar, das die Unterelemente Stadt, Name und Einwoh-
nerzahl einschließt. Name und Einwohnerzahl sind in diesem Fall auch Unterelemente
von Stadt.
Land
Stadt
Stadt
Name
Name
Einwohnerzahl
Einwohnerzahl
Land
Stadt
Stadt
Name
Name
Einwohnerzahl
Einwohnerzahl
Abbildung 2: Logische Struktur der Elemente
Neben der logischen Strukturierung durch die Gliederung der Elemente besitzen XML-
Dokumente auch eine physische Struktur, die mit Hilfe von Entities aufgebaut wird. Sie
stellen im wesentlichen physikalische Speicherobjekte dar, die ganze Dateien, Texte, ver-
schieden Zeichenketten oder Binärdaten beinhalten können. Das wichtigste Entity bildet
das Dokument-Entity. Es verweist auf alle im Dokument vorkommenden Komponenten,
wie z.B. Elementen oder Verarbeitungsanweisungen.
20
Entities werden in XML-
Dokumenten vor allem dazu eingesetzt, um häufig wiederkehrende Texte abzukürzen
18
Die Unterscheidung zwischen Groß- und Kleinschreibung wird auch als Case-sensitive bezeichnet.
19
Vgl. Goldfarb / Prescod, Das XML-Handbuch (2000), S.68f.
20
Vgl. North / Hermans, XML in 21 Tagen (2000), S.43.

Fachhochschule Ansbach
German Saueressig
10
oder um externe Dateien einzubinden. Eine spezielle Form bilden die sog. Entity-
Referenzen
(vgl. Tab. 1). Mit ihnen werden die in XML für Auszeichnungen vordefinier-
ten Zeichen nicht als Markup, sondern als allgemeine Zeichendaten in einem Dokument
interpretiert.
Tabelle 1: Entity-Referenzen
Zeichen
Entity-Referenz
< &lt;
> &gt;
& &amp;
" &quot;
` &apos
;
2.2.2 Dokument Type Definition
Mit der Dokument Type Definition (DTD) werden die Strukturbestandteile eines Doku-
ments deklariert und in welchem Verhältnis diese zueinander stehen. Dokumente mit der
gleichen Struktur können zu einem bestimmten Dokumenttyp zusammengefasst werden.
Von einer Instanz eines Dokumenttyps wird dann gesprochen, wenn ein Dokument mit
den festgelegten Regeln in einer DTD ausgezeichnet wird.
Mit der DTD wird also explizit festgelegt, welche Elemente und Attribute zwingend vor-
handen sein müssen, welche optional sind, wo sie aufzutreten haben und mit welcher
Häufigkeitsform diese im Dokument erscheinen dürfen. Zudem ist es in einem gewissen
Rahmen möglich Inhaltskontrollen für die erlaubten Zeichendaten zu bestimmen. Das
Eingliedern von Entities, Verweisen oder Binärdateien kann ebenfalls direkt über die
DTD erfolgen. Zu bemerken ist, dass es für ein XML-Dokument keine DTD geben muss.
Jedes XML-Dokument enthält bereits eine implizite Struktur durch seine logische Anord-
nung der Elemente. Für unser Land-Beispiel ergibt sich in diesem Zusammenhang die
folgend dargestellte DTD:
<?xml version="1.0" encoding="UTF-8" ?>
<!ELEMENT Land (Stadt+)>
<!ELEMENT Stadt (Name?, Einwohnerzahl?)>
<!ELEMENT Name (#PCDATA)>
<!ELEMENT Einwohnerzahl (#PCDATA)>

Fachhochschule Ansbach
German Saueressig
11
In der ersten Zeile der DTD wird eine Verarbeitungsanweisung deklariert. Sie teilt einem
XML-Parser
21
mit, dass er mit der Bearbeitung der DTD beginnen kann. Neben der aktu-
ellen Versionsangabe wird mit ihr auch der gültige Zeichensatz durch das Attribut enco-
ding
festgelegt. In den weiteren Zeilen erfolgt die Bestimmung der Elemente mit ihren
erlaubten Häufigkeiten (+ = beliebig viele Elemente größer Null; * = keine oder beliebig
viele Elemente; ? = optionales Element). PCDATA steht für Parsed Character Data und
erlaubt ausschließlich den Einsatz von Zeichendaten, die von einem Parser weiterverar-
beitet werden können.
XML-Schemata
Die Deklaration von Elementen und Attributen mit einer DTD erlaubt es einerseits, über
eine Vielzahl von Vorschriften die Strukturform eines Dokuments vorzugeben. Anderer-
seits offenbart die DTD aber auch eine ganze Reihe von Defiziten. Hierzu gehört insbe-
sondere die mangelnde Unterstützung von Datentypen. Eine DTD kann mit ihren vorhan-
denen Datentypen lediglich überprüfen, ob es sich um gültige Zeichen aus einem Zei-
chensatz handelt, aber nicht, ob denn der Inhalt wirklich sinnvoll ist. Darüber hinaus be-
sitzen DTDs noch weitere offensichtliche Schwächen bei der Umsetzung anspruchsvoller
Projekte mit XML.
22
Dies betrifft das
# Fehlen der Möglichkeit einer Vererbung,
# Verwenden einer eigenen Syntax, die nicht XML-konform und daher neu zu er-
lernen ist,
# sehr zeitintensive oder nicht durchführbare Erweitern einer DTD,
# Fehlen der Unterstützung von Namensräumen
23
.
Um den aufgeführten Mangelerscheinungen der DTD gegenzusteuern, wurde vom W3C
die Entwicklung der XML-Schemata
24
vorangetrieben, die analog den DTDs zur Definiti-
21
Vgl. Kapitel 2.2.4, XML-Parser
22
Vgl. Computerwoche, Ausgabe 47 (2000), S.17f.
23
Vgl. Kapitel 2.2.5, Namensräume
24
Vgl. World Wide Web Consortium, [01.04.2001], http://www.w3.org/XML/schema.html

Fachhochschule Ansbach
German Saueressig
12
on von Dokumenttypen dienen. Neben der Festlegung von exakten Datentypen und der
Vererbung von Eigenschaften über Elementhierarchien benutzen sie zur Beschreibung des
Vokabulars den allgemeinen XML-Syntax.
Momentan sind DTDs jedoch der einzige Mechanismus, um unterschiedliche Dokument-
typen zu bestimmen. Mit den XML-Schemata wird sich aber im Laufe der weiteren Ent-
wicklung ein neuer Standard etablieren, der mehr als nur eine Alternative zu den DTDs
darstellt. Mit der Ernennung in den Status eines Kandidaten für eine öffentliche Empfeh-
lung (Candidate Recommendation) durch das W3C, ist es nur eine Frage der Zeit, bis die
ersten XML-Schemata direkt in Anwendungen implementiert werden.
2.2.3 Aufteilung eines XML-Dokuments
XML-Dokumente folgen in ihrem Aufbau einer bestimmten Reihenfolge, die auch als
,,Grundgerüst eines XML-Dokuments"
25
bezeichnet wird. Hierfür wird ein Dokument in
die drei Teile Prolog Rumpf und Epilog untergliedert.
Der Prolog beginnt mit der XML-Deklaration. Sie gibt mit Hilfe von Attributen in einer
Verarbeitungsanweisung Auskunft über die aktuelle Version und der gültigen Zeichenco-
dierung. Mit der Dokumenttyp-Deklaration wird im Prolog eine dem Dokument zugrun-
deliegende DTD angegeben. Sie kann sowohl als externe als auch interne Teilmenge in
das Dokument eingefügt werden. Mit den beiden Schlüsselwörtern SYSTEM und PUBLIC
wird die Art der DTD signalisiert. Während SYSTEM auf eine individuelle DTD hin-
weist, handelt es sich bei PUBLIC um eine öffentlich zugängliche. Der erste Ausdruck
nach dem Begriff DOCTYPE ist identisch mit dem deklarierten Wurzelelement in der
DTD. Desweiteren können im Prolog noch unterschiedliche Kommentare und weiterfüh-
rende Verarbeitungsanweisungen angegeben werden. Der Rumpf eines Dokuments um-
fasst alle Elemente und Attribute, die ausgehend vom Wurzelelement in diesem einge-
schlossen werden. Der Epilog kann abschließend zusätzliche Kommentare oder Verarbei-
tungsanweisungen beinhalten. In einem XML-Dokument können sowohl der Prolog als
auch der Epilog optional angegeben werden. Für unserer Land-Beispiel ergibt sich dafür
das folgend aufgeführte XML-Dokument:
25
Vgl. Pott / Wielage, XML Praxis und Referenz (2000), S.77.

Details

Seiten
Erscheinungsform
Originalausgabe
Jahr
2001
ISBN (eBook)
9783832442453
ISBN (Paperback)
9783838642451
DOI
10.3239/9783832442453
Dateigröße
1 MB
Sprache
Deutsch
Institution / Hochschule
Hochschule Ansbach - Hochschule für angewandte Wissenschaften Fachhochschule Ansbach – Wirtschaftsingenieurwesen
Erscheinungsdatum
2001 (Juni)
Note
1,0
Schlagworte
informationstechnik management programmierung content datenbank
Zurück

Titel: Eine XML-Datenbank als Basis für ein Enterprise Application Integration-Konzept
book preview page numper 1
book preview page numper 2
book preview page numper 3
book preview page numper 4
book preview page numper 5
book preview page numper 6
book preview page numper 7
book preview page numper 8
book preview page numper 9
book preview page numper 10
book preview page numper 11
book preview page numper 12
book preview page numper 13
book preview page numper 14
book preview page numper 15
book preview page numper 16
book preview page numper 17
book preview page numper 18
book preview page numper 19
book preview page numper 20
book preview page numper 21
book preview page numper 22
104 Seiten
Cookie-Einstellungen