Veränderung der Dokumentation in der klinischen Forschung durch XML, EDC und CDISC-Standards

Dahms, Max

Veränderung der Dokumentation in der klinischen Forschung durch XML, EDC und CDISC-Standards

von Max Dahms (Autor:in)

Zusammenfassung

Inhaltsangabe:Zusammenfassung:
Die Diplomarbeit verfolgt zwei Zielstellungen: Erstes Teilziel ist, die Veränderung der Dokumentationsprozesse und des Datenmanagements in der klinischen Forschung durch die verstärkte Integration von Electronic Data Capture (EDC) - Technologien darzustellen. Hierbei wird verstärkt auf die Bedeutung eines einheitlichen, Datenstandards für die Branche sowie die diesbezüglichen Entwicklungsarbeiten des Clinical Data Interchange Standards Consortium (CDISC) eingegangen. Zweites Teilziel ist, den speziellen, veränderten Bildungsbedarf in der klinischen Forschung sowie das diesbezügliche Ausbildungsangebot in Deutschland darzustellen und dementsprechend Ansatzpunkte zur Planung einer E-Learning gestützten Schulung zu geben. Die Diplomarbeit ist aufbereitet sowohl für branchenfremde Betriebswirtschaftler, als auch für nicht auf die klinische Forschung spezialisierte Mediziner und Pharmazeuten ohne Programmiervorkenntnisse.
Im ersten Abschnitt werden zunächst der Bedarf, die Nutzenpotentiale und die Perspektiven der Extensible Markup Language (XML) zur technischen Realisierung von Datenstandards im allgemeinen erläutert sowie eine kurze Einführung in die Codierung von XML-Dokumenten und Dokumenttypbeschreibungen gegeben.
Im zweiten Abschnitt werden der Arzneimittelforschungsprozess in seinen verschiedenen Phasen sowie grundlegende ethische und rechtliche Rahmenbedingungen beschrieben. Hierauf aufbauend werden die Kosten von klinischen Studien sowie ebenfalls die Entwicklung des deutschen im Vergleich zum internationalen Pharmamarkt behandelt. Als eine mögliche Rationalisierungsmaßnahme im kostenintensiven Forschungsprozess wird am Ende dieses Abschnitts die Integration von EDC herausgestellt, welche wiederum die Grundlage für den Bedarf nach einem brancheninternen Datenstandard für die klinische Forschung bildet.
Der dritte Abschnitt beschäftigt sich mit den Arbeiten, den XML-basierten Standards sowie dem aktuellen Entwicklungsstand von CDISC. Während im ersten Teil dieses Abschnittes das Konsortium selbst, dessen Arbeitsweise und dessen Lösungsmodelle genauer beschrieben werden, wird im zweiten Teil auf die Akzeptanz von CDISC bei den relevanten Stakeholdern eingegangen. Dabei werden grundsätzliche Handlungsoptionen der Pharmaunternehmen hinsichtlich CDISC ebenso thematisiert wie die Haltung der Behörden zur Einreichung elektronischer Zulassungsanträge.
Aufbauend auf den Erkenntnissen der ersten drei Abschnitte wird im […]

Leseprobe

Inhaltsverzeichnis

ID 8225

Dahms, Max: Veränderung der Dokumentation in der klinischen Forschung

durch XML, EDC und CDISC-Standards

Hamburg: Diplomica GmbH, 2004

Zugl.: Technische Fachhochschule Berlin, Diplomarbeit, 2004

Dieses Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte, insbesondere die

der Übersetzung, des Nachdrucks, des Vortrags, der Entnahme von Abbildungen und Tabellen,

der Funksendung, der Mikroverfilmung oder der Vervielfältigung auf anderen Wegen und der

Speicherung in Datenverarbeitungsanlagen, bleiben, auch bei nur auszugsweiser Verwertung,

vorbehalten. Eine Vervielfältigung dieses Werkes oder von Teilen dieses Werkes ist auch im

Einzelfall nur in den Grenzen der gesetzlichen Bestimmungen des Urheberrechtsgesetzes der

Bundesrepublik Deutschland in der jeweils geltenden Fassung zulässig. Sie ist grundsätzlich

vergütungspflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des

Urheberrechtes.

Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem

Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche

Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten

wären und daher von jedermann benutzt werden dürften.

Die Informationen in diesem Werk wurden mit Sorgfalt erarbeitet. Dennoch können Fehler nicht

vollständig ausgeschlossen werden, und die Diplomarbeiten Agentur, die Autoren oder

Übersetzer übernehmen keine juristische Verantwortung oder irgendeine Haftung für evtl.

verbliebene fehlerhafte Angaben und deren Folgen.

Diplomica GmbH

http://www.diplom.de, Hamburg 2004

Printed in Germany

I. Inhaltsverzeichnis

I. Inhaltsverzeichnis

I. Inhaltsverzeichnis ... 2

II. Abkürzungsverzeichnis... 4

III. Abbildungsverzeichnis... 6

IV. Danksagung ... 7

Zielstellung und Aufbau der Diplomarbeit ... 8

1.1

Zusammenfassung (Deutsch) ... 8

1.2

Summary (English)... 9

Einführung in XML... 10

2.1

Hintergrund: Entstehung und Nutzen von XML... 10

2.1.1

Wandlung des Datenaustauschs im Internet ... 10

2.1.2

Ein einführendes Beispiel-Szenario ... 11

2.1.3

Was HTML leistet ... 12

2.1.4

Was HTML nicht leistet ... 14

2.1.5

Idee und Entstehung von XML ... 14

2.1.6

Charakteristische Eigenschaften und Vorteile von XML ... 15

2.1.7

Anwendungsbereiche von XML... 16

2.2

Codierung: Erstellung & Weiterverarbeitung von XML-Dokumenten ... 18

2.2.1

Der Aufbau von XML-Dokumenten ... 18

2.2.2

Definition von eigenen Tags in XML-DTD's ... 20

2.2.3

Kooperation und Einbindung fremder DTD's... 22

2.2.4

Validierung von Daten in XML ... 24

2.2.5

Darstellung von XML-Dokumenten... 25

2.2.6

Datenabfrage in XML-Dokumenten und Datenbanken... 28

2.2.7

XML-Datenaustausch in Netzen ... 29

2.2.8

XML-Editoren und Publikationsumgebungen... 31

2.3

Ausblick: Anwendungen & Verbreitung von XML im E-Business ... 33

2.3.1

Der Nutzen von Standards im Allgemeinen ... 33

2.3.2

Vision und Nutzen von XML als Standard im E-Business ... 34

2.3.3

Einflussfaktoren auf die Verbreitung von XML-Standards... 36

2.3.4

Aussichtsreiche XML-Standardisierungsinitiativen im E-Business... 38

Einführung in die klinische Forschung und den Pharmamarkt... 40

3.1

Einführung in die klinische Forschung ... 40

3.1.1

Zweck der klinischen Forschung... 40

3.1.2

Ablauf und Phasenmodell der klinischen Prüfung ... 41

3.1.3

Beteiligte Institutionen und Daten-Management... 43

3.1.4

Grundsätzliche rechtliche und ethische Rahmenbedingungen ... 46

3.1.5

Die Rolle der Behörden und der Zulassungsantrag ... 47

3.2

Kosten und Erträge der Arzneimittelentwicklung ... 50

3.2.1

Kennzahlen der deutschen Pharmaindustrie und des Marktes im weltweiten Vergleich ... 50

3.2.2

Unternehmenslandschaft und Struktur der Pharmabranche... 55

3.2.3

Dauer und Kosten der Arzneimittelentwicklung ... 58

3.2.4

Rationalisierungspotentiale durch standardisierte elektronische Datenerfassung ... 61

I. Inhaltsverzeichnis

Das Clinical Data Interchange Standards Consortium (CDISC) ... 67

4.1

Das CDISC-Projekt... 67

4.1.1

Idee, Herausforderung und Chancen ... 67

4.1.2

Die Entstehung von CDISC und die Rolle von Konsortien... 69

4.1.3

Aufbauorganisation und CDISC-Mitglieder ... 71

4.1.4

Die CDISC-Internetseite als Kommunikations-Portal... 73

4.1.5

Evolution der Datenerfassung in der klinischen Forschung ... 73

4.1.6

Der Lösungsansatz und die Datenstandards von CDISC ... 76

4.1.7

Aktueller Stand der Modelle (März 2004) und Ausblick ... 78

4.2

Akzeptanz von CDISC in der Branche ... 81

4.2.1

CDISC in der Welt der Standards und Richtlinien... 81

4.2.2

Die Rolle von CDISC bei den Behörden... 83

4.2.3

Strategische Handlungsalternativen der Unternehmen... 84

4.2.4

Haltung der Unternehmen zu EDC und zu CDISC ... 85

4.2.5

Strategie von CDISC zur weiteren Expansion ... 89

Der deutsche Bildungsmarkt für die klinische Forschung... 90

5.1

Spezieller Ausbildungsbedarf in der klinischen Forschung ... 90

5.1.1

Von veränderten Prozessen zu veränderten Qualifikationsanforderungen ... 90

5.1.2

Versuch und Problematik der Quantifizierung des Bildungsbedarfs... 92

5.1.3

Stellungnahmen, Konkretisierungen und weitere Indikatoren des Bildungsbedarfs ... 94

5.2

Die klassischen Ausbildungsangebote der Hochschulen ... 97

5.2.1

Relevanz der klassischen Studiengänge für die Arzneimittelforschung... 97

5.2.2

Studiengang MEDIZIN ... 98

5.2.3

Studiengang PHARMAZIE... 101

5.2.4

Studiengang MEDIZINISCHE INFORMATIK... 102

5.3

Die erweiterten Ausbildungsangebote der Hochschulen ... 104

5.3.1

Tendenzen im Hochschulwesen ... 104

5.3.2

Aufbaustudiengang PHARMAZEUTISCHE MEDIZIN ... 105

5.3.3

Master-Studiengang CLINICAL TRIAL MANAGEMENT... 107

5.3.4

Studiengang MEDIZINISCHE DOKUMENTATION UND INFORMATIK ... 108

5.3.5

Aufbaustudiengang DRUG REGULATORY AFFAIRS ... 111

5.3.6

Postgraduelle Ausbildung BIOMETRIE ... 113

5.4

Alternative Ausbildungsangebote... 114

5.4.1

Tendenzen im privaten Bildungsmarkt... 114

5.4.2

KKS-Fortbildung ARZT FÜR KLINISCHE STUDIEN... 115

5.4.3

PAREXEL Fortbildung KLINISCHER MONITOR & DATENMANAGER ... 116

5.4.4

PAREXEL Fortbildung KLINISCHER DB-MANAGER & SAS-PROGRAMMIERER ... 117

5.4.5

KKS- Fortbildung STUDY NURSE (Studienassistent/in im Prüfzentrum) ... 119

5.4.6

KKS- Fortbildung KLINISCHE EVALUATION (FÜR STUDIENLEITER) ... 121

5.4.7

PROFIL GmbH Fortbildung FACHKRAFT FÜR KLINISCHES MONITORING ... 123

5.4.8

Exemplarische Intensivkursangebote und Seminare ... 124

Vorteile und Ansätze eines E-Learning gestützten Schulungsangebotes... 126

6.1

Nutzen des E-Learning... 126

6.1.1

Einführung und Erläuterung der Begriffe E-Learning, Blended Learning, Lernplattform... 126

6.1.2

Vorteile und Einsparungspotentiale durch E-Learning ... 128

6.1.3

Besondere Eignung des E-Learning für Schulungen in der klinischen Forschung... 130

6.1.4

Ein beispielhaftes E-Learning gestütztes Schulungsangebot... 132

6.2

Ansatzpunkte zur Angebotsplanung für E-Learning-Anbieter ... 134

6.2.1

Mögliche Formen des Bildungsangebotes... 134

6.2.2

Kosten des Angebotes, Marktpreise und Margen... 134

6.2.3

Möglichkeiten der Kooperation und finanziellen Förderung ... 137

Schlussbemerkung ... 139

V. Quellenverzeichnis... 140

II. Abkürzungsverzeichnis

II. Abkürzungsverzeichnis

ADaM Analysis

Data

Model

AE Adverse

Event

AMG Arzneimittelgesetzbuch

ANSI

American National Standards Institute

BCG

Boston Consulting Group

BfArM

Bundesinstitut für Arzneimittel und Medizinprodukte

BgVV

Bundesinstitut für gesundheitlichen Verbraucherschutz und Veterinärmedizin

BMBF

Bundesministerium für Bildung und Forschung

BPI

Bundesverband der Pharmaindustrie

CDISC

Clinical Data Interchange Standards Consortium

CDM

Clinical Data Management

CRA

Clinical Research Assistent

CRO

Clinical Research Organization

CTM Clinical

Trial

Management

DIA Drug

Information

Association

DIN

Deutsches Institut für Normung

DOM

Document Object Model

DTD

Dokumenttypdefinition (Document Type Definition)

DZKF

Deutsche Zeitschrift der klinischen Forschung

EDV Elektronische

Datenverarbeitung

F&E

Fertigung und Entwicklung

FDA

Food and Drug Administration

FH Fachhochschule

GCP

Good Clinical Practice

HL7

Health Level 7

HTML

Hypertext Markup Language

II. Abkürzungsverzeichnis

ICH

International Conference on Harmonization

IFAPP

International Federation of Associations of Pharmaceutical Physicians

ISO

International Standards Organisation

KKS

Koordinationszentrum für Klinische Studien

LAB

Laboratory Data Model

NDA

New Drug Application

ODM Operational

Data

Model

PEI

Paul Ehrlich Institut

RPC

Remote Procedure Call

SAX

Simple Application Programming Interface for XML

SDM Submission

Data

Model

SDS

Submission Data Standard

SDTM

Study Data Tabulations Model (bis vor kurzem als SDM oder SDS bezeichnet)

SGML

Standard Generalized Markup Language

SOAP

Simple Object Access Protocol

SWS Semesterwochenstunden

TEIA

Teles European Internet Academy

TFH Technische

Fachhochschule

VFA Verband

forschender

Arzneimittelhersteller

W3C

World Wide Web Consortium

WWW World

Wide

Web

XML eXtensible

Markup

Language

XSLT

eXtensible Stylesheet Transformation Language

III. Abbildungsverzeichnis

III. Abbildungsverzeichnis

Abbildung 2.1.3-1: Beschreibung von Daten durch Tags in HTML ... 13

Abbildung 2.2.1-1: Beschreibung des Inhalts durch Tags in XML ... 19

Abbildung 2.2.1-2: Beschreibung des Layouts durch Tags in HTML... 19

Abbildung 2.2.2-1: Definition von XML-Tags in einer DTD ... 21

Abbildung 2.2.3-1: Einbinden einer externen DTD... 23

Abbildung 2.2.3-2: Definition von Elementen innerhalb eines XML-Dokumentes ... 23

Abbildung 2.2.3-3: Einführung von Namensräumen zur Nutzung mehrerer DTD's ... 23

Abbildung 2.2.5-1: Die drei Komponenten eines Dokumentes ... 26

Abbildung 2.2.5-2: Transformation von XML nach HTML durch XSLT ... 27

Abbildung 2.2.7-1: Auszug aus einem XML-RPC-Quelltext... 29

Abbildung 2.2.7-2: Auszug aus einem JAVA-Quelltext in Verbindung mit XML-RPC ... 30

Abbildung 2.2.8-1: Screenshot eines XML-Quelltextes mit eingebundener DTD in EMACS ... 31

Abbildung 2.2.8-2: Screenshot aus dem Cocoon Publishing Framework ... 32

Abbildung 2.3.2-1: Schematische Darstellung von Informations- und Warenflüssen... 35

Abbildung 3.1.2-1: Phasen der klinischen Prüfung ... 42

Abbildung 3.1.3-1: An klinischen Studien beteiligte Institutionen ... 43

Abbildung 3.1.5-1: Internationaler Vergleich der Zulassungsbehörden... 48

Abbildung 3.2.1-1: Gesamtumsatz im Arzneimittelmarkt weltweit ... 51

Abbildung 3.2.1-2: Anteile am weltweiten Umsatz im Arzneimittelmarkt ... 51

Abbildung 3.2.1-3: Arzneimittelumsatz pro Kopf... 51

Abbildung 3.2.1-4: Entwicklung des Arzneimittelumsatz pro Kopf ... 52

Abbildung 3.2.1-5: Entwicklung des Umsatz in In- und Ausland ... 52

Abbildung 3.2.1-6: Entwicklung der F&E-Ausgaben weltweit... 53

Abbildung 3.2.1-7: Anteile an den F&E-Ausgaben... 53

Abbildung 3.2.1-8: Nettowertschöpfung pro Beschäftigter im Jahr 2000 ... 54

Abbildung 3.2.2-1: Anteile der Betriebe nach Beschäftigten ... 56

Abbildung 3.2.2-2: Anteile am Produktions-wert der Betriebe nach Beschäftigten... 56

Abbildung 3.2.3-2: Wachstum der F&E-Gesamtkosten pro Arzneimittel... 59

Abbildung 3.2.4-1: Zu erwartende Reduzierung der Bearbeitungszeiten... 63

Abbildung 3.2.4-1: Einsatz von EDC in klinischen Studien... 64

Abbildung 4.1.1-1: Vereinheitlichung der Schnittstellen durch CDISC-Standards ... 69

Abbildung 4.1.3-1: Organisationsstruktur und Arbeitsgruppen von CDISC ... 71

Abbildung 4.1.4-1: Screenshot der CDISC-Internetseite... 73

Abbildung 4.1.5-1: Vom Papier zum hoch strukturierten Dokumentformat ... 74

Abbildung 4.1.6-1: Bisheriger Prozess der Datenübertragung ... 76

Abbildung 4.1.6-2: Nahtloser Datenfluss vom Patient bis zum Reviewer ... 77

Abbildung 4.1.7-1: Quelltextauszug mit Metadaten aus dem ODM ... 81

Abbildung 4.2.1-1: Wo steht CDISC in der Welt der Standards? ... 82

Abbildung 4.2.4-1: Anteil der Studien die EDC nutzen / voraussichtlich nutzen werden... 86

Abbildung 4.2.4-2: Anteil der Sponsoren für die EDC ein Hauptstrategieinstrument ist... 87

Abbildung 4.2.4-3: Bedeutung von Standards für einen effizienten Datenaustausch... 88

Abbildung 4.2.4-4: Verwendung von CDISC-Standards (zum Zeitpunkt der Umfrage) ... 88

Abbildung 5.1.3-1: Bildungsinhalte des IFAPP ... 95

Abbildung 6.1.1-1: Entwicklung der Anteile verschiedener Lernformen... 128

Abbildung 6.1.2-1: Kostensenkung als wichtigster Grund für den Einsatz von E-Learning... 129

Abbildung 6.1.3-1: Anwendungen zur fallbasierten und problemorientierten Wissensvermittlung ... 132

Abbildung 6.1.4-1: Aufbau der Ausbildung ... 133

IV. Danksagung

IV. Danksagung

Die vorliegende Diplomarbeit wurde an der Teles European Internet Academy (TEIA) AG sowie an

der Technischen Fachhochschule (TFH) Berlin erstellt und von verschiedenen, sowohl internen als

auch externen Personen, begleitet, für deren Unterstützung ich mich an dieser Stelle herzlich bedanken

möchte:

Herr Professor Dr. Faehling leitete seitens der TFH Berlin als betreuender Professor diese

Diplomarbeit. Als Mitinitiator und Leiter des jüngst angebotenen Studiengangs Clinical Trial

Management waren sein fachspezifisches Wissen und seine Ratschläge sehr hilfreich.

Auf Seiten der TEIA AG ermöglichte Eva Maria Paaß-Nielsen als leitender Vorstand diese

Diplomarbeit. Ulrich Kühn, als fachlicher Ansprechpartner, gab mir immer wieder interessante

Anregungen.

Dr. Stefanie Heins, als Head of Global Clinical Data Dictionary bei der Schering AG in Berlin, gilt

mein ganz besonderer Dank: Ohne ihre ständige Hilfsbereitschaft sowie ihr umfassendes Fach- und

Praxiswissen, hätte diese Diplomarbeit in vielen Punkten wesentlich oberflächlicher bleiben müssen.

Nicht zuletzt bedanken möchte ich mich bei meinen lieben Eltern, die mich über die gesamte Dauer des

Studiums in jeder Hinsicht unterstützt haben und mir so auch beim Anfertigen dieser Arbeit immer zur

Seite standen.

Zielstellung und Aufbau der Diplomarbeit

1. Zielstellung und Aufbau der Diplomarbeit

1.1

Zusammenfassung (Deutsch)

Die vorliegende Diplomarbeit verfolgt zwei Zielstellungen: Erstes Teilziel ist, die Veränderung der

Dokumentationsprozesse und des Datenmanagements in der klinischen Forschung durch die verstärkte

Integration von Electronic Data Capture (EDC) - Technologien darzustellen. Hierbei wird verstärkt auf

die Bedeutung eines einheitlichen, Datenstandards für die Branche sowie die diesbezüglichen

Entwicklungsarbeiten des Clinical Data Interchange Standards Consortium (CDISC) eingegangen.

Zweites Teilziel ist, den speziellen, veränderten Bildungsbedarf in der klinischen Forschung sowie das

diesbezügliche Ausbildungsangebot in Deutschland darzustellen und dementsprechend Ansatzpunkte

zur Planung einer E-Learning gestützten Schulung zu geben. Die Diplomarbeit ist aufbereitet sowohl

für branchenfremde Betriebswirtschaftler, als auch für nicht auf die klinische Forschung spezialisierte

Mediziner und Pharmazeuten ohne Programmiervorkenntnisse.

· Im ersten Abschnitt werden zunächst der Bedarf, die Nutzenpotentiale und die Perspektiven der

Extensible Markup Language (XML) zur technischen Realisierung von Datenstandards im allgemeinen

erläutert sowie eine kurze Einführung in die Codierung von XML-Dokumenten und

Dokumenttypbeschreibungen gegeben.

· Im zweiten Abschnitt werden der Arzneimittelforschungsprozess in seinen verschiedenen Phasen

sowie grundlegende ethische und rechtliche Rahmenbedingungen beschrieben. Hierauf aufbauend

werden die Kosten von klinischen Studien sowie ebenfalls die Entwicklung des deutschen im Vergleich

zum internationalen Pharmamarkt behandelt. Als eine mögliche Rationalisierungsmaßnahme im

kostenintensiven Forschungsprozess wird am Ende dieses Abschnitts die Integration von EDC

herausgestellt, welche wiederum die Grundlage für den Bedarf nach einem brancheninternen

Datenstandard für die klinische Forschung bildet.

· Der dritte Abschnitt beschäftigt sich mit den Arbeiten, den XML-basierten Standards sowie dem

aktuellen Entwicklungsstand von CDISC. Während im ersten Teil dieses Abschnittes das Konsortium

selbst, dessen Arbeitsweise und dessen Lösungsmodelle genauer beschrieben werden, wird im zweiten

Teil auf die Akzeptanz von CDISC bei den relevanten Stakeholdern eingegangen. Dabei werden

grundsätzliche Handlungsoptionen der Pharmaunternehmen hinsichtlich CDISC ebenso thematisiert

wie die Haltung der Behörden zur Einreichung elektronischer Zulassungsanträge.

· Aufbauend auf den Erkenntnissen der ersten drei Abschnitte wird im vierten Kapitel die

Diskrepanz zwischen Bildungsangebot und dem veränderten Bildungsbedarf speziell für die klinische

Forschung in Deutschland gegenübergestellt. Hierbei wird sowohl auf die klassischen

Ausbildungsmöglichkeiten für klinisches Studienpersonal bzw. Management eingegangen als auch auf

aktuelle Entwicklungstendenzen zur Erweiterung des Angebotes im Hochschulwesen und bei privaten

Ausbildungsunternehmen.

· Im fünften Abschnitt schließlich wird eine kurze Einführung in das Thema E-Learning, dessen

Nutzen und Kosten sowie dessen spezielle Eignung für Schulungen in der Arzneimittelforschung

gegeben. Hierauf aufbauend werden abschließend einige wichtige Ansatzpunkte bei der Planung eines

adäquaten diesbezüglichen Schulungsangebotes für einen möglichen E-Learning-Anbieter behandelt.

Zielstellung und Aufbau der Diplomarbeit

1.2

Summary (English)

The goal of this thesis is two-fold: the first goal is to describe how documentation processes and data

management in clinical research will change as a result of the increased integration of Electronic Data

Capturing (EDC) technologies. It focuses in particular on how this common data standard will affect

the industry as a whole as well as the work of the Clinical Data Interchange Standards Consortium

(CDISC). The second goal is to provide an overview of the changed need for special education in

clinical research as well as the current opportunities for training in Germany in this area. This overview

will serve accordingly as a starting point for planning e-learning training programs. The analysis is

primarily aimed at business people and interested parties who are not working in this industry as well

as at health care and pharmaceutical professionals with little or no experience in the field of clinical

research and no programming skills.

· Chapter one provides an overview of the need for potential uses of and opportunities offered by the

Extensible Markup Language (XML) to achieve a data standard from a technical standpoint. A short

introduction also deals with XML source codes and Document Type Definitions.

· Chapter two describes the different phases of the typical research process for new medications and

therapies as well as fundamental ethical and legal considerations. This is followed by an examination of

the cost of clinical trials and the development of the German pharmaceutical market vs. the

international one. The end of the chapter focuses on the integration of EDC technologies as a way to

streamline the cost-intensive research process which, in turn, serves as the foundation of the need for a

common data standard for the industry.

· The third chapter deals with the work, the XML-based data standards and the progress (current

level of development) of CDISC. While the first part of this chapter concentrates on the consortium

itself and its developments methods, the second part addresses the acceptance level and integration of

CDISC standards among the relevant stakeholders. This section deals not only with the various options

the pharmaceutical companies have to take action but also with the authorities' stand (the FDA in

particular) on the CDISC standards and electronic submissions.

· In the fourth chapter the findings of the first three chapters serve as a basis for a discussion of the

discrepancy that exists between supply and demand in the educational opportunities for qualifying both

personnel responsible for carrying out clinical research studies as well as managers of clinical research

projects in Germany. Within this context, traditional educational models are described as well as

current trends both at institutes of higher learning as well as in the private education sector with a view

to expanding the educational opportunities offered for acquiring a professional qualification in clinical

research.

· The fifth and final chapter provides a short introduction to e-learning, the benefits and costs

associated with it as well as how it is particularly suited for use in training in the area of pharmaceutical

research. Finally, using this as a basis, several approaches a potential e-learning provider could pursue

in planning training programs designed to meet these needs are addressed.

Einführung in XML

Einführung in XML

In diesem Kapitel sollen einleitend der Bedarf, der Nutzen und die Entstehung der eXtensible Markup

Language, kurz XML, dargestellt werden. Den zweiten Schwerpunkt bildet die Entwicklung und

Bearbeitung (Codierung) von XML-Dokumenten sowie Methoden zum Austausch und zur Präsentation

der in den Dokumenten beschriebenen Daten. Im dritten Teil des Kapitels sollen schließlich der Nutzen

von Standards im Allgemeinen sowie Anwendungsmöglichkeiten und Perspektiven von XML

Standards, speziell auf das E-Business bezogen, aufgezeigt werden.

Somit soll in diesem Kapitel das Grundverständnis für den Nutzen und die Beschaffenheit eines

Datenstandards erarbeitet werden. Dies geschieht explizit in Hinblick auf das dritte Kapitel, für

welches dieses erste Kapitel das benötigte technische Basiswissen zum besseren Verständnis eines

XML-Datenstandards liefert. Es soll also keinesfalls als Tutorial für Programmierer dienen, sondern

richtet sich vielmehr an eine Lesergruppe mit geringen bis überhaupt keinen Vorkenntnissen im

Bereich der angewandten Informatik, wie z.B. klassisch ausgebildete Ärzte oder

Wirtschaftswissenschaftler.

Unter dieser Zielsetzung kann das folgende Kapitel zur ,,Demystifizierung" einer Sprache beitragen,

deren Verwendung zur Zeit in weiten Kreisen bzw. Branchen unterschiedlichster Art in Erwägung

gezogen wird oder bereits realisiert worden ist.

2.1

Hintergrund: Entstehung und Nutzen von XML

2.1.1

Wandlung des Datenaustauschs im Internet

Die Wurzeln des Internet reichen bis in die 60er Jahre zurück. Das World Wide Web (WWW) als einer

der heutzutage wichtigsten Internetdienste entstand erst vergleichsweise spät Anfang der 90er Jahre.

Bis zu diesem Zeitpunkt war das Internet noch zu unbekannt, zu teuer und zu wenig

benutzerfreundlich, um den Anforderungen an ein Massenmedium, wie es das WWW heute ist, zu

genügen.

Sich rasant weiterentwickelnde und somit leistungsfähigere, preisgünstigere Technologien zum einen

sowie Wachstum und Kommerzialisierung des WWW zum anderen, welche sich in gegenseitiger

Wechselwirkung immer weiter verstärkten, sollten bereits wenige Jahre später zu einem

explosionsartigen Ansteigen der Nutzerzahlen führen.

Damit sollte sich auch die Art der Nutzung des Mediums Internet stark verändern: Anders als in seinen

ersten Jahren dient das WWW heute dazu, Informationen nahezu jeden beliebigen Typs und Inhalts

auszutauschen, und zwar:

Einführung in XML

· von Mensch zu Mensch,

· von Mensch zu Maschine und

· von Maschine zu Maschine [1, Wittenbrink, S.18f.].

Die ursprüngliche Konzeption der Hypertext Markup Language (HTML), als Beschreibungssprache

bzw. als so genannte Auszeichnungssprache für den Quelltext (das Grundgerüst) von Internetseiten,

kann diesen gewachsenen Anforderungen inzwischen nur noch teilweise gerecht werden. Neue

Konzepte für erweiterbare Auszeichnungssprachen, die den Anwendungsbereich von HTML

übersteigen bzw. individuell ergänzen, lassen sich als die unmittelbaren Folgen des Wandels der

Internetnutzung deuten. Sie sehen eine weitaus größere Funktionalität für die Entwickler vor und

werden dazu beitragen, bislang brachliegende Potentiale der Vernetzung erschließen zu können [2].

Im folgenden Abschnitt soll zunächst zum besseren Verständnis an einem praxisbezogenen Fallbeispiel

veranschaulicht werden, in welcher Form HTML bei der Abwicklung des internetgestützten

Datenaustausches verwendet werden kann und wo die Grenzen dieser Sprache liegen.

2.1.2

Ein einführendes Beispiel-Szenario

Eine Musterbranche für den Austausch von umfassenden und komplexen Datenmengen ist das

Gesundheitswesen. Gerade hier eröffnen neue Technologien in Verbindung mit dem Internet ungeahnte

Perspektiven der maschinellen Unterstützung bei den vielfältigen Kommunikationsprozessen. Im

folgenden Beispiel-Szenario sollen diese Prozesse auf den Datenempfang einer Hauskrankenpflege-

Einrichtung von einem Krankenhaus eingeengt werden.

Der typische Patient, der sich zur Hauskrankenpflege angemeldet hat, wird zunächst im internen EDV-

System in einer umfassenden elektronischen Patientenakte registriert. Diese enthält u.a. seine

Krankheitshistorie, Abrechnungsdaten und Vermerke diverser behandelnder Ärzte, Spezialisten und

Versicherungsgesellschaften, Informationen über Krankenhausaufenthalte, Verabreichungen von

Medikamenten, Röntgenaufnahmen sowie Daten zur Person.

Meist müssen diese Daten erst noch beschafft werden und liegen dann oft lediglich in Papierform

bereit, was den aufwendigsten Teil der Dokumentationsarbeiten für das Hauskrankenpflege-

Unternehmen mit sich bringt: Das manuelle Abtippen und Scannen des Materials zur Aufbereitung im

eigenen EDV-System. Dabei ist ein präzises und fehlerfreies Informationsmanagement hinsichtlich der

Patientendaten ein kritischer Erfolgsfaktor für Hauskrankenpflege-Einrichtungen, welche hinsichtlich

Vorgaben von Gesundheitsbehörden und Krankenversicherungen strenge Auflagen zu erfüllen haben.

Was also liegt näher, als zumindest für den Transport der Daten die mittlerweile weite Verbreitung des

Internets als Übertragungsmedium von bereits elektronisch gespeicherten Patientendaten zu nutzen?

Einführung in XML

Die Lösung, die HTML-basierte Internetseiten hierzu anbieten, sähe in Einzelschritten folgendermaßen

aus.

1.) Die Hauskrankenpflege verschafft sich einen registrierten Internetzugang zu den

Patientendaten, z.B. bei einem Krankenhauses (Nutzername, Passwort).

2.) Die Hauskrankenpflege meldet sich als autorisierter Benutzer mit exakt definierten

Abrufrechten im Datenmanagementsystem des Krankenhauses an.

3.) Die Hauskrankenpflege lässt sich die gewünschten Daten im Browser anzeigen.

4.) Die Hauskrankenpflege druckt die Daten aus.

5.) Die Hauskrankenpflege tippt die Daten vom Ausdruck ins eigene System ab.

Ebenfalls denkbar wäre natürlich, dass die Daten direkt vom Browser-Fenster aus in ein vorgefertigtes

Eingabeformular abgetippt oder kopiert werden. Allerdings würde dadurch der Gesamtprozess nur

teilweise beschleunigt bzw. Papier gespart werden. Eine echte Lösung, welche auch das aufwendige

Abtippen der Patientendaten mit berücksichtigt, also das eigentliche Problem bei der Wurzel packt,

sähe eher folgendermaßen aus:

1.) Die Hauskrankenpflege verschafft sich einen registrierten Zugang zu den Patientendaten z.B.

eines Krankenhauses.

2.) Die Hauskrankenpflege meldet sich als autorisierter Benutzer mit definierten Abrufrechten im

Datenmanagementsystem des Krankenhauses an.

3.) Die Hauskrankenpflege ruft die Daten des gewünschten Patienten ab.

4.) Das Datenmanagementsystem der Hauskrankenpflege kann die abgerufenen Daten des

Krankenhauses interpretieren und überträgt sie selbständig in der festgelegten

Dokumentationsform in die Patientenakte der Hauskrankenpflege.

Auf diesem Wege könnte sowohl wertvolle Arbeitszeit gespart als auch Fehlerquellen, wie sie beim

Abtippen generell mit einzukalkulieren sind, von vornherein ausgeschlossen werden. Jedoch ist dieses

zweite Szenario mittels Beschreibung der Daten auf HTML-Basis nicht möglich, da das Vokabular

dieser Sprache zu eingeschränkt ist, um die Art der Daten sowie den Bezug, den sie zueinander haben,

für den Computer als Maschine interpretierbar zu machen [3, Bosak].

2.1.3

Was HTML leistet

Zentrale Aufgabe von HTML ist es, die logischen Bestandteile eines Dokumentes zu definieren und

auszuzeichnen, also Dokumente zu beschreiben. Auf diese Weise kann ein Dokument in Abschnitte

bzw. Elemente aufgeteilt werden, denen ein jeweils unterschiedliches, elementspezifisches Layout

zugewiesen werden kann, wie z.B. eine fett gedruckte Überschrift, ein linksbündiger Text in der

Schriftart Arial, ein rechtsbündiges Bild mit Rahmen etc.

Einführung in XML

Zu diesem Zweck werden in HTML die einzelnen Dokument-Elemente mit so genannten Tags (sprich:

,,Täcks") beschrieben. Diese Tags enthalten prinzipiell Daten, die Informationen über andere Daten,

auch Meta-Informationen genannt, liefern. So kann z. B. die erste Zeile einer Patientenakte lauten:

,,Personenbezogene Angaben". Der zugehörige Tag zu dieser ersten Zeile könnten dann lauten:

,,Typ=Überschrift". Durch diese Zusatzinformation über die Daten in der ersten Dokumentzeile ist nun

die verarbeitende Software in der Lage, die Art der Daten zu erkennen und diese für den menschlichen

Leser des Dokumentes automatisch in einem Schriftbild darzustellen, welches sich von den folgenden

Zeilen deutlich abhebt (z.B. größere Schrift, fett gedruckt) und damit impliziert, dass es sich um eine

Überschrift des Textes handelt.

Die Tags markieren dabei als Markup (Hypertext Markup Language) als in eckigen Klammern

geschriebener Text in HTML-Dokumenten die eigentlichen Informationen für den Leser, wie der

folgende kommentierte Auszug aus einem HTML-Dokument veranschaulicht:

Abbildung 2.1.3-1: Beschreibung von Daten durch Tags in HTML

Der Browser, als verarbeitende Software, wird mittels der Tag-Informationen in die Lage versetzt,

selbständig die Überschrift zu erkennen, sie von dem darauf folgenden Absatz zu unterscheiden und

somit beide Elemente entsprechend ihrer individuellen Layout-Festlegungen auf dem Ausgabemedium

darzustellen.

Zusammenfassend sei gesagt, dass HTML es einer verarbeitenden Software zwar ermöglicht, zwischen

den Bestandteilen eines Dokumentes zu differenzieren, dieses aber vorwiegend zur Unterscheidung von

abschnittsspezifischem Layout geschieht. Tags mit Informationen über die einzelnen Textelemente

selbst, wie etwa für Name und Anschrift im oberen Quelltextauszug, sind in HTML nicht definiert.

Zweck der Markup-Sprache ist vielmehr die Bereitstellung eines Tag-Vokabulars zur übersichtlichen,

leserfreundlichen und individuellen Darstellung von Internetseiten im Browser.

Einführung in XML

2.1.4

Was HTML nicht leistet

HTML als Auszeichnungssprache zur Beschreibung von einzelnen Dokumentelementen stößt schnell

an seine Grenzen bei der maschinellen Unterstützung hinsichtlich Verwaltung, Verarbeitung und

Übertragung größerer, komplexerer Datenmengen. Diese bestehen im Wesentlichen in den folgenden

drei Problempunkten:

· Erweiterbarkeit: HTML bietet dem Entwickler nicht die Möglichkeit, sein Tag-Vokabular für

eigene Bedürfnisse und Anforderungen anzupassen oder gar zu erweitern. Inhaltsspezifische

Dokumentelemente (z.B. die Adresse im obigen Quelltextauszug) sind somit nicht individuell

definierbar und können deshalb auch nicht von der verarbeitenden Software automatisch

weiterverarbeitet werden.

· Strukturierung: HTML unterstützt nicht die Spezifizierung von individuellen, fixen Strukturen,

wie sie beispielsweise benötigt werden, um den Aufbau von Datenbanken (Tabellen-,

Spaltenstrukturen, Schlüssel) hierarchisch in einzelnen Textdokumenten abzubilden.

· Validierung: HTML verfügt über kein spezielles Tag-Vokabular oder eigene

Validierungsmechanismen, die es anderen Anwendungen ermöglichen würden, beim Import

die Daten auf strukturelle Korrektheit und Vollständigkeit zu überprüfen. Somit kann nur

nachträglich, auf manuellem Wege, sichergestellt werden, dass bei der Datenübertragung von

einem System, bzw. einer Anwendung in die andere, alle Daten unverfälscht empfangen

worden sind [3, Bosak].

Vor allem aufgrund dieser Mängel an Erweiterbarkeits-, Strukturierungs-, und

Validierungsmöglichkeiten stellt HTML als Auszeichnungssprache keine befriedigende Lösung für den

maschinell gestützten Austausch sowie die anschließende Verarbeitung komplexerer Datenmengen

innerhalb eines Dokumentes dar.

2.1.5

Idee und Entstehung von XML

Im Februar des Jahres 1998 verabschiedete das World Wide Web Consortium (W3C) die eXtensible

Markup Language (XML) als einheitlich spezifizierten Standard in der Version 1.0. Ziel war es, einen

einfach zu implementierenden Standard zur logischen Dokumentauszeichnung bereitzustellen, dessen

Funktionalität weit über den Umfang von HTML hinausgeht [1, Wittenbrink, S.16].

XML gehört wie HTML zur Familie der Markup-Languages. Beide entstanden auf Basis der Standard

Generalized Markup Language (SGML) und bilden jeweils Teilmengen dieser Auszeichnungssprache.

Die ,,Geburt" von SGML geht ins Jahr 1974 zurück. Im Jahr 1986 wurde sie als offizieller Standard

Einführung in XML

ISO 8879 umgesetzt. Zweck von SGML ist es u.a., Vorschriften und Regeln bereitzustellen, um

Auszeichnungssprachen formal definieren zu können.

Problematisch war und ist die Komplexität von SGML, welche die Entwicklung und Nutzung von

SGML-Programmen nicht nur kompliziert, sondern vor allem auch unnötig kostenintensiv macht. Dies

hat bis heute Akzeptanz und Verbreitung von SGML negativ beeinflusst ganz im Gegensatz zur

großen Popularität ihrer Tochtersprachen.

Während also SGML auf der einen Seite sich wegen seiner hohen Komplexität nur als begrenzt

einsetzbar erwiesen hat, ist HTML auf der anderen Seite aufgrund der fehlenden Erweiterbarkeit für

komplexere Anwendungen ungeeignet. Und genau hier setzt das Konzept von XML an:

Das ,,X" in XML steht für ,,extensible", was übersetzt ,,erweiterbar" bedeutet und sich u.a. auf das

Markup dieser Sprache, also auf die Tags bezieht. Diese können den eigenen Anforderungen

entsprechend definiert und angepasst werden, um Dokumentelemente exakt und inhaltsspezifisch

beschreiben zu können.

XML bietet somit wesentlich weitreichendere Möglichkeiten hinsichtlich Vokabular und Funktionen

als HTML. Um aber gleichfalls des höheren Komplexitätsgrades Herr zu werden, wurden alle für das

Internet als überflüssig angesehenen SGML-Eigenschaften sowie eine Vielzahl zu selten genutzter und

als zu kompliziert erachteter Features nicht in XML übernommen. Schon der ausgedruckte Umfang der

formalen Definition von XML, welcher auf nur 33 Seiten Platz findet, bildet einen klaren Kontrast zur

Anwenderfreundlichkeit der SGML-Definition von mehr als 500 Seiten. Der XML-Standard wird

kontinuierlich weiterentwickelt; die jeweilige aktuelle, offizielle Spezifikation findet sich auf den

Seiten des W3C unter

http://www.w3c.org/XML/

2.1.6

Charakteristische Eigenschaften und Vorteile von XML

Ein universelles, neutrales, weithin akzeptiertes und verwendetes Format, um Daten für die

unterschiedlichsten Anwendungen allgemeinverständlich zu beschreiben, hatte es bisher noch nicht

gegeben. XML konnte sich inzwischen zumindest in einigen Bereichen als ein solches Format

durchsetzen und bringt sehr gute Voraussetzungen für einen zukünftigen, universell verwendeten

Datenauszeichnungsstandard mit. In Aussicht stellen dies seine folgenden charakteristische

Eigenschaften [4, Hintermeier]:

· XML ist frei verfügbar und unabhängig von proprietären Hersteller-Standards.

· XML ist plattformunabhängig, d.h. die Dokumente können auf unterschiedlichen Geräten z.B.

auf PC, Handy, Kühlschrank, Fertigungsanlage etc. eingesetzt werden.

Einführung in XML

· XML ist unabhängig vom verwendeten Betriebssystem, so spielt es keine Rolle, ob z.B.

Windows, Linux, UNIX etc. installiert ist.

· XML ermöglicht somit Interoperabilität, d.h. sowohl system- und plattformunabhängige als

auch übergreifende Zusammenarbeit mehrerer vernetzter Teilnehmer mit unterschiedlichen

Hard- und Software-Voraussetzungen.

· XML trennt strikt zwischen Speicherung und Verarbeitung der Daten, damit bleibt offen,

welche Software zur Verarbeitung der Daten verwendet werden soll.

· Standardwerkzeuge zur Bearbeitung bzw. Weiterverarbeitung und Validierung von XML-

Dokumenten sowie umfassende Tutorials sind frei erhältlich.

· XML-Dokumente sind sowohl für Maschinen als auch für Menschen lesbar und verständlich,

was erhebliche Vorteile bei ihrer Entwicklung und Pflege bietet [1, Wittenbrink, S.17ff.]

Der Aufbau von XML-Dokumenten sowie Datenaustausch und Datenausgabe auf XML-Basis sollen in

den Unterkapiteln 1.2 und 1.3 noch ausführlicher dargestellt werden. Vorher sei im anschließenden

Abschnitt ein Überblick über die Haupteinsatzbereiche gegeben, für die XML konzipiert worden ist.

2.1.7

Anwendungsbereiche von XML

XML wurde als ein Format entwickelt, mit dem sich hochstrukturierte Inhalte austauschen lassen.

Hieraus ergeben sich vielfältige Anwendungsmöglichkeiten, die sich im Wesentlichen einem der drei

Kernbereiche zuordnen lassen, welche im Folgenden näher beschrieben werden sollen:

1.) Publishing von Dokumenten

2.) Management von Dokumenten

3.) Web-Services

Unter Publishing versteht man die Aufbereitung von in Dokumenten enthaltenen Informationen für

menschliche Empfänger. XML ermöglicht hier:

· die angepasste Darstellung der Informationen auf verschiedenen Ausgabemedien, wie z.B.

Monitoren und Druckern, aber auch Mobiltelefonen, Geräte-Displays, und akustischen Medien

- kurzum auf jeglichen vernetzungsfähigen Endgeräten mit Wiedergabemöglichkeit;

· die Darstellung und Gestaltung von komplexen Graphiken, wie etwa mathematische Formeln,

Vektorgraphiken oder auch EKG-Ergebnisse, welche im Quelltext nach bestimmten

Einführung in XML

Konventionen beschrieben werden und aus dem dann die graphischen Konstrukte generiert

bzw. weiterverarbeitet werden können.

Beim Management von Dokumenten wird XML verwendet, um Inhalte unabhängig von ihrer

Präsentationsform zu strukturieren, zu editieren und zu verwalten. In der Praxis sind dies meist Inhalte,

die sehr speziellen Anforderungen genügen müssen. Beispiele hierfür sind:

· FAQ's (Frequently Asked Questions = Häufig gestellte Fragen), wie sie sich auf Support-

Internetseiten von Unternehmen mit einer breiten Palette an Service-intensiven Produkten

finden;

· Inhalte von ganzen Büchern oder komplexen technischen Dokumentationen, die gewöhnlich

stets dieselbe Grundstruktur besitzen;

· Inhalte (bzw. Wissen) innerhalb von Content-Management-Systemen, aus denen je nach

Bedarf Dokumente für die Präsentation generiert werden können;

· Umfangreiche Datenmengen, welche häufig sowie zwischen einer Vielzahl von Beteiligten

ausgetauscht und individuell aufbereitet werden müssen (wie es etwa im Gesundheitswesen der

Fall ist).

Web-Services werden mittels XML entwickelt, um die Kommunikation zwischen prozessorgestützten,

vernetzten Systemen zu realisieren. Sie umfassen die Festlegung von Austauschformaten und

Botschaftstypen auf XML-Basis, welche beispielsweise die gesicherte Verständigung zwischen PCs an

prinzipiell jedem Ort der Welt ermöglichen. In diesen Formaten ist u.a. festgelegt,

· welche Dienste ein potentieller Sender anbietet und

· auf welche Weise diese Dienste abgerufen werden können.

Hierbei kommunizieren die beteiligten Systeme weiterhin innerhalb des XML-Sprachraums, die

Programmierer brauchen also nicht in eine andere Sprache überwechseln, um den Austausch realisieren

zu können - was Zeit - und Kostenvorteile bei der Entwicklung mit sich bringt.

Darüber hinaus erlaubt XML im Rahmen von Web-Services den verschiedenen Kommunikations-

partnern, definierte Schnittstellen mit Validierungsmechanismen zu vereinbaren. Über diese können

dann Anwendungsprogramme, die intern ganz unterschiedlich funktionieren und die evtl. auf

grundsätzlich verschiedenen Betriebssystemen aufsetzen, Informationen miteinander austauschen,

wobei selbige gleichzeitig auf Korrektheit und Vollständigkeit überprüft (= validiert) werden [1,

Wittenbrink, S.20ff.].

So können sich z.B. zwei Pharma-Forschungseinrichtungen, die kooperieren und auf digitalem Wege

ihre Daten austauschen wollen, unabhängig von ihrer - oftmals schon intern heterogenen - EDV-

Einführung in XML

Landschaft vorab auf Schnittstellen einigen, welche mittels XML spezifiziert werden und über die dann

zuverlässig Informationen ausgetauscht werden können. Dabei kann der gewöhnlicher Weise

erhebliche Zeitaufwand, der für die Konvertierung und Überprüfung der Daten anfällt (siehe Beispiel in

Kap. 1.1.2), stark reduziert werden.

Da sich das Problem heterogener, inkompatibler EDV-Landschaften immer wieder von neuem stellt,

wenn zwei unterschiedliche Systeme zusammenarbeiten müssen, sollte es im Interesse aller Beteiligten

liegen, sich auf ein universelles Austauschformat zu einigen, welches dann auch von allen Partnern

auch konsequent unterstützt wird und den Anpassungsaufwand minimiert.

Dies kann branchenspezifisch aber auch branchenübergreifend geschehen. Der Wert eines solchen

Austauschformates steigt in jedem Fall mit der Zahl der beteiligten Partner. Proprietäre,

kostenpflichtige Formate, sind allgemein hin nicht universell akzeptiert und einsetzbar. Langfristig

gesehen sind sie unter diesem Aspekt zwangsläufig einem offenen, weiter verbreiteten Standard

unterlegen.

XML, oder genauer gesagt der Bereich der Web-Services, bietet die technische Basis für solch einen

universellen Standard und stellt damit die Vision einer weltweit einheitlichen Infrastruktur zur

gesicherten Kommunikation und Transaktion bei der Abwicklung von Geschäfts- und

Informationsaustauschprozessen in Aussicht[1, Wittenbrink, S.593].

2.2

Codierung: Erstellung & Weiterverarbeitung von XML-Dokumenten

2.2.1

Der Aufbau von XML-Dokumenten

Wie HTML bedient sich auch XML des Tag-Konzeptes zur Beschreibung von Dokumentelementen.

Während in HTML die Tags jedoch verwendet werden, um Abschnitte zu definieren, denen ein

bestimmtes Layout zugewiesen werden soll, dienen sie in XML vordergründig der Beschreibung des

Inhaltes selbst. Dementsprechend könnte in XML der Beispielquelltext im Vergleich zu dem HTML-

Auszug aus Kapitel 1.1.3. folgendermaßen aussehen:

Einführung in XML

XML

Abbildung 2.2.1-1: Beschreibung des Inhalts durch Tags in XML

HTML

Abbildung 2.2.1-2: Beschreibung des Layouts durch Tags in HTML

Obwohl beide Beispiele rein inhaltlich gesehen für den menschlichen Leser dieselben Informationen

enthalten (nämlich dass es sich um eine Patientenakte des Patienten Schmidt handelt, dessen Anschrift

in dieser Akte notiert ist), weist der XML-Quelltext eine ganze Reihe signifikanter Unterschiede zu

seinem HTML-Pendant auf:

· Charakteristisch für XML-Dokumente ist ihre hierarchische Struktur. So ist im oberen Beispiel

der Tag ,,Patientenakte" definiert worden. Zwischen Start- und End-Tag

,,<Patientenakte>...</Patientenakte>" wiederum befindet sich Start- und End-Tags von

,,<Adresse>", welche ihrerseits die Tags zu <Strasse>, <Wohnort> und <Telefon>

einschließen.

Einführung in XML

· Auf diese Weise werden jedoch nicht nur die Hierarchiestufen der Daten beschrieben, vielmehr

werden letztere auch noch zueinander in Beziehungen gesetzt. Was dem menschlichen Leser

unbewusst schon von vornherein klar ist, kann nun auch vom Computer bzw. einer Maschine

,,erkannt" werden. In XML ist <Patientenakte> das Elternelement von <Adresse> und

<Untersuchung>. Diese beiden wiederum sind Geschwisterelemente, denn sie stehen im

Dokument hierarchisch gesehen auf der gleichen Stufe bzw. besitzen dasselbe Elternelement.

Die Elemente <Strasse>, <Wohnort> und <Telefon> sind demnach Kinderelemente von

<Adresse>, welches sich bezogen auf seine drei Kinderelemente wiederum als Elternelement

verhält. Diese Art der Beschreibung mag für den menschlichen Leser auf den ersten Blick

etwas verwirrend klingen ist aber für die Maschine eine exakt formulierte und damit

verständliche Methode zur Definition von Beziehungen.

· Weiterhin dienen die Tags der Beschreibung des Inhalts von Datenelementen. Somit werden

die Daten als maschinell interpretierbare Informationen ausgezeichnet. Man spricht hier auch

von sich selbst beschreibenden Dokumenten. Beispielsweise könnte im obigen XML-Beispiel -

gegenüber dem HTML-Quelltext - gezielt die Adresse oder aber auch lediglich die Strasse des

Patienten ,,Müller" maschinell abgefragt werden. Angaben zum Layout werden nicht gemacht.

Die Darstellung von Informationen aus XML-Dokumenten soll in Kapitel 1.2.3 noch

aufgezeigt werden.

Abgespeichert werden XML-Dokumente als Dateien mit der Endung ,,.xml". Zusammenfassend gesagt

ermöglichen sie das strukturierte Speichern von Daten im Textformat, wobei in ihnen sowohl die Daten

selbst, als auch die Beziehung in der sie zueinander stehen hierarchisch beschrieben werden. XML

stellt damit ein Format zur Verfügung, Informationen, die dem menschlichen Leser offensichtlich

erscheinen mögen, auch für maschinelle Rezipienten interpretierbar zu machen.

Die großen Stärken dieser Methodik, kommen im obigen, simpel gewählten Beispiel sicherlich noch

nicht zum Tragen. Der Mehraufwand, der betrieben werden muss, um die Daten maschinell

weiterverarbeitbar zu beschreiben, zahlt sich jedoch gerade dann umso stärker aus, wenn Datenmengen

so groß und komplex werden, dass sie für den Menschen unüberschaubar sind. Der Datenaustausch

zwischen Gesundheitseinrichtungen, wie er im vorigen Kapitel beschrieben wurde, ist dabei nur eine

von vielen möglichen Anwendungen, bei denen sich eine XML-gestützte Lösung anbietet.

2.2.2

Definition von eigenen Tags in XML-DTD's

Jedes XML-Dokument besteht aus Inhalt und Tags, welche den Inhalt beschreiben. Während HTML

bereits ein Tag-Set zur Beschreibung von HTML-Dokumenten zur Verfügung stellt bzw. vorschreibt,

muss in XML zunächst jeder Tag zur Beschreibung eines Dokumentelements selbst definiert werden.

Dies kann mittels der Dokument-Typ-Definition (DTD) geschehen.

Einführung in XML

In ihr wird zum einen festgelegt, wie die Dokumentelemente (bzw. Tags) heißen sollen, zum anderen,

welche möglichen Kinderelemente sie haben können bzw. müssen, ob ggf. deren Anzahl beschränkt

sein soll, ob es nur eine begrenzte, definierte Menge von möglichen Werten für die Elemente geben soll

etc. Veranschaulichen soll dies der Quelltextauszug aus einer denkbaren DTD für das XML-Beispiel

aus dem vorhergehenden Abschnitt:

Abbildung 2.2.2-1: Definition von XML-Tags in einer DTD

In der ersten Zeile des DTD-Auszugs wird das Elternelement Patientenakte definiert. In den Klammern

dahinter werden die Kinderelemente Adresse und Untersuchung notiert, die zu dem Elternelement

gehören. Das Sternchen-Zeichen hinter Untersuchung bedeutet, dass Untersuchung keinmal, einmal

oder mehrmals innerhalb des Elementes Patientenakte in einem XML-Dokument vorkommen kann je

nachdem, ob es für den Patienten bereits eine oder mehrere Untersuchungen geben hat oder eben noch

überhaupt keine.

In der zweiten Zeile wird das Attribut Name für das Element Patientenakte definiert. Im XML-

Dokument soll dieses dann den Namen des Patienten erhalten und somit identifizieren, um wessen

Patientenakte es sich handelt. Denkbar wäre auch ein XML-Dokument mit dem hierarchisch noch

höher angesiedelten Elternelement ,,Patientenaktensammlung" und dessen Kinderelementen

Patientenakte, die sich jeweils durch den Patientennamen als Attribut voneinander unterscheiden

lassen.

Entsprechend der Deklaration in Zeile 1 werden in der dritten Zeile weitere Kinderelemente für das

Element Adresse definiert. Das Plus-Zeichen hinter Telefon bedeutet in diesem Zusammenhang, dass

eine oder mehrere Telefonnummern möglich sind, schreibt jedoch vor, dass mindestens eine

Telefonnummer eingetragen werden muss.

Einführung in XML

Als drittes Anhangszeichen (neben Sternchen und Plus-Zeichen) besagt das Fragezeichen (siehe Zeile

7), dass ein Element einmal oder keinmal, jedoch nicht mehrere Male vorkommen kann. So könnte

beispielsweise zusätzlich zum Untersuchungsergebnis ein EKG-Ergebnis für jede Untersuchung

gespeichert werden sofern eine Aufzeichnung erstellt worden ist.

Weiterhin wird jedem Element, das keine Kinderelemente besitzt, ein Datentyp zugeordnet (wie z.B.

von der Art ,,Zeichenkette", ,,Datum" oder ,,Zahl"). Im Beispiel ist dieser bei allen Elementen gleich,

nämlich der XML-spezifische Datentyp ,,PCDATA".

Auf weitere Syntax-Regeln und Konventionen für die Erstellung von DTD's soll an dieser Stelle nicht

eingegangen werden. Gezeigt werden sollte an diesem Beispiel lediglich, auf welche Weise das Tag-

Vokabular für anwenderspezifische XML-Dokumente definiert bzw. erweitert werden kann.

DTD's bilden insofern die Basis von XML-Dokumenten, als dass in ihnen die verwendeten Tags und

deren Verhältnis zueinander definiert sowie Konventionen für den Gebrauch dieser Tags festgelegt

sind. Somit stellen sie sicher, dass XML-Daten immer in derselben verbindlichen, zugrunde liegenden

Form gespeichert werden.

2.2.3

Kooperation und Einbindung fremder DTD's

Es liegt nahe, für größere Projekte die zugehörigen DTD's auszulagern und sie als zentrales Format

möglichst häufig wiederzuverwenden, damit nicht mehrfach Dokumenttypen definiert werden, welche

dieselbe Art von Inhalt gleichartiger XML-Dokumente beschreiben [5, Auer].

Unternehmen derselben Branche, beispielsweise Gesundheitseinrichtungen mit nahezu identischen

Anforderungen an ein Dokument ,,Patientenakte", sollten in Erwägung ziehen, die gleiche DTD als

Grundlage für dieses XML-Dokument zu verwenden und die diesbezügliche Entwicklungsarbeit

untereinander aufzuteilen oder gemeinsam zu finanzieren. Ein weiterer Vorteil bestünde darin, dass

dann auch alle Daten in derselben Struktur gespeichert und somit unkomplizierter austauschbar wären,

was Kooperationsvorhaben oder den Verkauf von Studiendaten enorm erleichtern würde. Eine

derartige Zusammenarbeit wäre sowohl unternehmensübergreifend als auch firmenintern über mehrere

Standorte hinweg denkbar.

DTD-Dateien besitzen die Endung ,,.dtd" und müssen in den ersten Zeilen eines XML-Dokumentes,

das die DTD verwenden soll entweder

a) mit dem genauen Pfad, an dem sie gespeichert sind, referenziert werden (welcher sowohl auf

die lokale Festplatte als auch auf eine Domain im WWW verweisen kann):

Einführung in XML

Abbildung 2.2.3-1: Einbinden einer externen DTD

b) oder direkt als Quelltext am Anfang des XML-Dokumentes eingebunden werden:

Abbildung 2.2.3-2: Definition von Elementen innerhalb eines XML-Dokumentes

Beiden Varianten gemeinsam ist die Einleitung des einbindenden Tags mit ,,!DOCTYPE", welches

anzeigt, dass an dieser Stelle Informationen zum Dokumenttyp gegeben werden.

Ebenfalls möglich ist die Kombination bzw. das Referenzieren mehrerer DTD's in ein und demselben

XML-Dokument. Damit auch dann noch die Eindeutigkeit der verwendeten Elementnamen

gewährleistet werden kann, ist jeder DTD ein Namensraum (engl. ,,Namespace") zugeordnet.

Abbildung 2.2.3-3: Einführung von Namensräumen zur Nutzung mehrerer DTD's

Einführung in XML

Wie in der Abbildung gezeigt, erfolgt die Festlegung der Namensräume jeweils in den ersten beiden

Zeilen des obigen Quelltextes mit dem Tag ,,xmlns", gefolgt von einem Doppelpunkt, dem Kürzel für

den jeweiligen Namensraum und dem Ort, an dem sich die DTD befindet.

Sämtliche Elemente können dann im XML-Dokument mit dem vorangestellten Kürzel adressiert

werden, welches dem entsprechenden Namensraum bzw. der DTD zugeordnet ist (hier ,,pa:" für

patientenakte.dtd und ,,st" für Studien in phase_3.dtd). Auf diese Weise lassen sich Konflikte für

Elemente mit evtl. identischen Namen in den verschiedenen DTD's von vornherein ausschließen. Dies

kann leicht der Fall sein kann, denkt man nur an die Angaben zur Person oder zur Adresse, die

gewöhnlich sowohl in einer Patientenakte als auch in einen Studienbogen mit aufgenommen werden.

Abschließend sei noch erwähnt, dass es neben den DTD's inzwischen auch noch höher entwickelte

Dokumenttypbeschreibungen in der Sprache XML-Schema (Plural = XML-Schemas; gespeichert in

Dateien mit der Endung ,,.xsd") sowie in weiteren Schema-Sprachen gibt, deren Funktionalität noch

über die Möglichkeiten von DTD's hinausgeht. Die bedeutsamste Innovation von XML-Schema in

Bezug auf datenorientierte Anwendungen ist die Einführung eines erweiterten Typensystems für XML-

Daten. Zwar gibt es auch in den DTD's bereits Datentypen, jedoch erfüllen diese nicht immer die an sie

gestellten Anforderungen [1, Wittenbrink, 510f.).

2.2.4

Validierung von Daten in XML

Die Tags und Regeln für einen Dokumenttyp werden, wie im vorangegangenen Abschnitt gezeigt, in

der DTD festgelegt oder in einem XML-Schema beschrieben. Bei der Validierung eines XML-

Dokumentes wird überprüft, ob es mit diesen Regeln konform ist, d.h.

· ob es der formalen Strukturdefinition in der DTD entspricht (z.B. Eltern- / Kinderelement

,,kann vorkommen" / ,,muss vorkommen");

· ob alle Elemente bzw. Tags in der DTD definiert und beschrieben sind;

· ob Namen und Typen von den in der DTD beschrieben Element-Attributen korrekt verwendet

worden sind.

Somit stellt die Validierung (von ,,vality" engl. für ,,Gültigkeit", also ,,Prüfung der Gültigkeit") von

XML-Dokumenten, eine Form der Qualitätskontrolle und -sicherung der in ihnen enthaltenen Daten

dar. Eine exakt formulierte DTD allein kann noch nicht gewährleisten, dass ein XML-Dokument

korrekt erstellt wird. Erst automatische Prüfmechanismen können Konformität der Daten und damit

maschinelle Weiterverarbeitung bzw. Datenaustausch mit anderen Systemen ermöglichen.

Um nun ein XML-Dokument zu validieren, kann es gegen seine DTD ,,geparst" werden, d.h. es wird

auf seine logische Struktur sowie auf seine Datenzusammensetzung hin analysiert. Dieser Vorgang

Einführung in XML

wird von einem Programm, einem so genannten XML-Parser, durchgeführt. Prinzipiell existieren zwei

alternative Ansätze des Parsens:

a) Stapelverarbeitung der Daten im XML-Dokument: Parser überprüft ob das erste Tag-Paar

DTD-konform ist; wenn ja: zum nächsten Tag-Paar gehen, wenn nein: Abbrechen und

Fehlermeldung ausgeben. Die Essenz dieses Verfahrens lässt sich in einem Satz

zusammenfassen: ,,Beginne am Anfang und arbeite dich durch, bis du zum Ende gelangst." [6,

Boumphrey, S.57] Realisiert wird es über eine einfache Programmierschnittstelle für XML

(Simple Application Programming Interface for XML = SAX). Dementsprechend handelt es

sich hierbei um einen so genannten SAX-Parser.

b) Vollständige Umsetzung des Dokumentes in eine Baumstruktur, welche die Hierarchie der

einzelnen Elemente abbildet. Erst danach Analyse des gesamten Baumes. Die Baumstruktur

wird auch als Document Object Model (DOM) bezeichnet. Dementsprechend spricht man

hierbei von einen so genannten DOM-Parser.

Beide Parser können XML-Dokumente auf zwei unterschiedliche Kriterien hin überprüfen:

a) Wohlgeformtheit, d.h. ob die XML-Syntax des Dokumentes in sich stimmig ist (z.B. ob alle

Tags mit ,,<" beginnen und mit ,,>" enden).

b) Gültigkeit, d.h. ob das Dokument wohlgeformt und ob es gegenüber den in seiner DTD

definierten Regeln valide (= gültig) ist.

2.2.5

Darstellung von XML-Dokumenten

XML selbst enthält keinerlei Aussage darüber, wie die Daten bzw. der Inhalt von XML-Dokumenten

darzustellen ist. XML-Dokumente beinhalten zwar eine inhaltliche Selbstbeschreibung hinsichtlich der

in ihnen vorkommenden Elemente. Alle Fragen der Ausgabe jedoch, also wie die Daten mittels

verschiedener Wiedergabe-Medien (z.B. Bildschirm, Drucker, Mobiltelefon, Akustische Medien)

dargestellt werden sollen, bleiben von dieser Beschreibung unberührt [7, Auer].

Dieser Umstand ist durchaus gewollt und zwar als Bestandteil eines grundlegenden Konzeptes, das in

XML verfolgt wird, nämlich der strikten Trennung von Inhalt und Präsentationslogik. Generell lassen

sich Dokumente (das können auch Zeitungsartikel, Bücher oder andere digitale Formate sein) in drei

Komponenten unterscheiden: Struktur, Inhalt und Layout. Dies veranschaulicht die folgende Graphik

[4, Hintermeier]:

Einführung in XML

Abbildung 2.2.5-1: Die drei Komponenten eines Dokumentes

1) Der eigentliche Inhalt sind die Texte, Bilder oder Graphiken in einem Dokument.

2) Die Anordnung dieses Inhalts wird durch die Struktur beschrieben.

3) Im Layout sind die Vorgaben zur optischen Präsentation der Struktur festgelegt.

Erst durch die Re-Kombination dieser drei Bestandteile wird das eigentliche Dokument zur Darstellung

erzeugt. Diese Art der Aufteilung eines Dokumentes bringt hinsichtlich der digitalen Verarbeitung drei

wesentliche Vorteile mit sich:

1. Layout und Struktur können separat, individuell für verschiedene Medien definiert werden.

2. Änderungen an Struktur oder Layout brauchen jeweils nur einmal pro Dokumenttyp

vorgenommen werden und können dann bei gleichartigen Dokumenten auf alle verschiedenen

Inhalte angewendet werden.

3. Die Datenübertragung in Netzen kann deutlich beschleunigt werden, wenn Layout-/

Strukturinformationen nur einmalig übertragen, die Inhalte von Dokumenten jedoch vielfach

übertragen werden.

Ein Beispiel, bei dem diese Trennung ebenfalls durchgeführt wird, ist die Erstellung von PDF-Dateien,

bei der beispielsweise ganze Bücher von weit über 1000 Seiten Umfang auf nur 10 Megabyte

,,komprimiert" werden können. Der Grund ist, dass die Seiten in einem Roman gewöhnlich alle

dasselbe Layout haben, welches jedoch nur ein einziges Mal beschrieben werden braucht und dann auf

alle Seiten des Dokumentes angewendet werden kann.

In XML existieren deshalb im Gegensatz zum darstellungsorientierten HTML - keinerlei spezifische

Elemente wie <h1> für Überschriften oder <b> für Fettdruck. Das Layout der Elemente eines

Dokumententyps kann stattdessen in einer separaten XSLT-Datei festgelegt werden. XSLT steht für

eXtensible Stylesheet Transformation Language, d.h.

· es handelt sich um eine Sprache (Language),

· die erweiterbar ist (eXtensible)

· hinsichtlich der Layout-Angaben, die in einer XSLT-Datei (Stylesheet) für alle gewünschten

XML-Elemente festgelegt werden können,

Einführung in XML

· um diese Elemente für die medienspezifische Darstellung in eine andere, geeignete Sprache,

wie z.B. in HTML, umzuwandeln (Transformation).

Für die Darstellung im Browser könnte eine Umwandlung bzw. Einbettung der mit XML

beschriebenen Informationen in HTML, wie im Folgenden veranschaulicht, aussehen:

Abbildung 2.2.5-2: Transformation von XML nach HTML durch XSLT

XSLT-Dateien stellen somit ein erweiterbares System von Transformationsregeln für beliebige XML-

Elemente zur Verfügung. Diese Regeln können separat für verschiedenartigste Medien definiert

werden, also Outputs in Abhängigkeit von der Art der Darstellung liefern, welche vom Anwender

gewünscht werden.

So kann aus einem Text mit definierten Überschriften nicht nur eine komplette Druckversion, sondern

z.B. auch ein kurzes Inhaltsverzeichnis erzeugt werden. Ebenso könnte derselbe Text auch in ein

HTML-Dokument mit komplexen Formatierungen transferiert werden, während der bloße Inhalt zur

Sprachausgabe verwendet wird.

Weiterhin sind die selbst definierten Transformationsregeln nicht vom jeweiligen XML-Dokumenttyp

abhängig, sondern können auf alle XML-Dokumente angewendet werden, welche Elemente enthalten,

auf die sich die spezifischen Regeln beziehen. Selbst wenn keines dieser Elemente enthalten ist, würde

nicht eine Fehlermeldung sondern lediglich ein leeres Ausgabedokument erzeugt werden [7, Auer].

Neben XSLT existieren auch noch weitere Möglichkeiten, das Layout von ausgegebenen XML-

Dokumenten festzulegen (z.B. XSL Formatting Objects), die innerhalb dieser Arbeit jedoch nicht

weiter behandelt werden sollen.

Einführung in XML

2.2.6

Datenabfrage in XML-Dokumenten und Datenbanken

Ein XML Dokument ist vergleichbar mit einer Datenbank, welche nach einem bestimmten Schema

geordnete Rohdaten enthält. Während in einer klassischen Datenbank jedoch Tabellen bzw. Zeilen und

Spalten benutzt werden, um die Daten zu strukturieren, werden in XML die in der

Dokumenttypbeschreibung definierten Tags zu diesem Zwecke verwendet.

Wenn einzelne Daten aus den Tabellen einer Datenbank extrahiert oder aggregiert werden sollen, wird

gewöhnlich auf SQL (= Structured Query Language) als Abfragesprache zurückgegriffen. Um

Abfragen in XML-Dokumenten durchzuführen, steht mit XQL (= XML Query Language) eine SQL

nachempfundene Sprache zur Verfügung. Eine alternative Methode bietet XPath (engl. path = ,,Pfad"):

Mittels der Ausdrücke dieser Sprache kann der Weg bzw. Pfad zu bestimmten Elementen im

Baummodell des XML-Dokumentes beschrieben und so gezielt Werte abgefragt werden. Die

abgefragten Werte können dann mittels XSLT für den Anwender aufbereitet und ausgegeben werden.

XML-Dokumente und Datenbanken schließen sich nicht gegenseitig aus. Vielmehr können sie, jeweils

entsprechend ihrer Stärken, sich gegenseitig ergänzend eingesetzt werden, z.B.:

· Datenbanken als Repository, also Aufbewahrungsort, für ganze XML-Dokumente (So

unterstützen u.a. das kommerzielle Datenbanksystem Oracle 9i sowie das frei verfügbare,

Betriebssystem übergreifende XML-Repository XINDICE als Bestandteil des Open-Source-

Projektes ,,Apache" zusätzlich als Abfragesprache XPath, um innerhalb der verwalteten

Dokumente navigieren zu können.);

· Datenbanken als Verwaltungssystem für XML-Dokument-Inhalte, bei dem die einzelnen

Elemente, Attribute und Werte des Dokumentes auf Zeilen und Spalten von Tabellen

abgebildet werden;

· XML als Austauschformat zwischen verschiedenen Datenbanken.

Eine leistungsfähigere Abfragesprache (SQL), die Kontrolle der referenziellen Integrität sowie die

Minimierung von Redundanzen gehören zu den Hauptvorteilen von (relationalen) Datenbanken [1,

Wittenbrink, S.669ff.].

Nachteilig bei Datenbanken ist jedoch die Bindung zwischen Datenbanksystem, Betriebssystem und

Plattform (= Endgerät). Bei XML dagegen sind sowohl die Daten als auch die Abfrageskripte reine

Textdateien, die bei Bedarf mit jedem Standardtext-Editor auf jedem Betriebssystem bearbeitet werden

können. Somit ist der Entwurf eigener Dokumente (in DTD's), das Speichern von Daten in den

gewünschten XML-Dokumenten bzw. Datenbanken (z.B. XINDICE) sowie deren Abfrage (XQL,

XQuery) und Ausgabe (XSLT) möglich, ohne betriebssystem-spezifische Besonderheiten beachten zu

müssen [7, Auer].

Einführung in XML

2.2.7

XML-Datenaustausch in Netzen

Einer der Hauptvorteile von XML ist die Definitionsmöglichkeit bzw. die verbindliche Beschreibung

von allgemeingültigen Dokumenttypen, welche die Grundlage für die unkompliziertere, maschinelle

Abfrage sowie die Integration externer Daten in das eigene System bildet.

Für den Transport externer (und unternehmensinterner) Daten liegt die Nutzung des heute weit

verbreiteten Internets nahe. Auch zu diesem Zweck sind XML-basierte Technologien entwickelt

worden, welche den Bereich der Web-Services, also netzbasierte Dienste unterstützen sollen (siehe

Kapitel 1.1.7). In diesem Zusammenhang seien drei Komponenten, nämlich XML-RPC's, SOAP und

die Programmiersprache JAVA sowie die Bedeutung, die ihnen bei der Realisierung von Web-Services

zukommt, kurz dargestellt.

XML-RPC (XML Remote Procedure Calls) ermöglicht Funktionsaufrufe zwischen beispielsweise zwei

PCs mit unterschiedlichem Standort über das Internet-Datenübertragungsprotokoll HTTP (welches

auch beim Abrufen von Internetseiten benutzt wird). Für diese, so genannten ,,entfernten

Funktionsaufrufe" wird meist der Anglizismus ,,Remote Procedure Calls", kurz RPC, verwendet.

Mit einem RPC könnte z.B. von einem Krankenhaus die Funktion ,,Blutgruppe anzeigen" auf dem PC

des Hausarztes abgerufen werden (sofern natürlich diese Funktion dort installiert und zugänglich ist).

Dabei müsste dann ein Parameter, der den gewünschten Patienten identifiziert, wie z.B. sein Name an

die Funktion übergeben werden. Die korrekte Auszeichnung dieses Parameters sowie die Bestimmung

der Funktion selbst wird wiederum mittels XML umgesetzt (siehe folgende Abbildung). Deshalb heißt

diese Art des entfernten Funktionsaufrufes XML-RPC.

Abbildung 2.2.7-1: Auszug aus einem XML-RPC-Quelltext

Einführung in XML

Der XML-RPC beschreibt lediglich was mit welcher Funktion / Methode und welchen Parametern

abgerufen werden soll. Für das Stellen der Anfrage selbst sowie das Speichern und Zurücksenden des

Ergebnisses ist JAVA als weit verbreitete, plattform- und betriebssystem-unabhängige, frei verfügbare

Programmiersprache geeignet. Oder genauer gesagt, XML ist ursprünglich sogar für die Umsetzung

durch JAVA als objektorientierte Programmierschnittstelle (Application Programming Interface = API)

zur Verarbeitung seiner Daten konzipiert worden [6, Boumphrey, S.31].

Abbildung 2.2.7-2: Auszug aus einem JAVA-Quelltext in Verbindung mit XML-RPC

Das oben exemplarisch aufgeführte Prinzip, XML für die Beschreibung des ,,Welche?" bzw.

,,Womit?" bezogen auf Daten, Dokumente und Funktionen sowie JAVA für das ,,Wie?", also die

Ausführung zu verwenden, liegt auch anderen Anwendungen als RPC's zugrunde zumal

Textdokumente per sé nicht in der Lage sind, Anweisungen selbständig auszuführen.

Ein weiteres Beispiel für solche JAVA-basierten Anwendungen, welche im Rahmen dieser Arbeit

bereits vorgestellt wurden, sind XML-Parser, welche sich schon mit relativ wenig Aufwand in JAVA

programmieren lassen. Hinsichtlich RPC's sei an dieser Stelle das ,,Apache XML-RPC" erwähnt,

welches in der Lage ist, XML-RPC's umzusetzen. Aufgrund seiner geringen Größe (als nur 57

Kilobyte umfassende JAVA-Datei) ist es auch für den Einsatz bzw. die Datenabfrage auf

Mobiltelefonen geeignet [8].

Das Simple Object Access Protocol (SOAP), als dritte und letzte in diesem Abschnitt aufgeführte

Komponente beim vernetzten Datenaustausch mittels XML, definiert ein Markup-Vokabular zur

Strukturierung von Nachrichten in Umschläge und Nachrichtenrümpfe [9, Jeckle]. Es ermöglicht nicht

nur genauere, anwendungsspezifische Beschreibungen für den Fernaufruf von Prozeduren, sondern

Einführung in XML

erlaubt auch die Übertragung komplexer XML-Dokumente, welche an SOAP-Botschaften, ähnlich wie

bei E-Mails, angehangen werden können [1, Wittenbrink, S.564ff.].

SOAP und XML-RPC benutzen ein XML-Tag-Vokabular. Die Metasprache XML selbst ist für die

Umsetzung mittels der weit verbreiteten Programmiersprache JAVA konzipiert worden. Die

Kombination dieser drei Komponenten ermöglicht die Entwicklung von Anwendungen für die

standortübergreifende, maschinelle, hoch automatisierte Kommunikation. Und zwar ohne dass die

Programmierer ein größeres Inventar an Sprachen (als XML und Java) verbinden und beherrschen

müssen, was nicht zuletzt erhebliche Zeit- und Kostenvorteile realisierbar macht.

2.2.8

XML-Editoren und Publikationsumgebungen

XML-Dokumente lassen sich prinzipiell mit einem einfachen Texteditor, wie Notepad unter MS

Windows, erstellen. Zur professionellen Entwicklung gibt es mittlerweile jedoch ein großes Spektrum

von komfortableren XML-Editoren bis hin zu kompletten, integrierten Entwicklungsumgebungen.

Als Beispiel für einen weiterentwickelten, frei verfügbaren XML-Text-Editor sei an dieser Stelle

EMACS genannt (siehe Abbildung unten [1, Wittenbrink, S.220]). Gegenüber einfachen Texteditoren

bietet dieser zusätzliche Eingabe- und Verarbeitungsmöglichkeiten, z.

B. die automatische

Überprüfung eines XML-Dokumentes auf Wohlgeformtheit beim Laden, Unterscheidung zwischen

Markup und einfachem Text durch unterschiedliche Farben auf dem Bildschirm sowie die

kontextsensitive Auswahl von gültigen Elementen aus einer Liste [1, Wittenbrink, S.78f.].

Abbildung 2.2.8-1: Screenshot eines XML-Quelltextes mit eingebundener DTD in EMACS

Details

Seiten
Erscheinungsform: Originalausgabe
Erscheinungsjahr: 2004
ISBN (eBook): 9783832482251
ISBN (Paperback): 9783838682259
DOI: 10.3239/9783832482251
Dateigröße: 1.6 MB
Sprache: Deutsch
Institution / Hochschule: Beuth Hochschule für Technik Berlin – Wirtschaftsinformatik
Erscheinungsdatum: 2004 (August)
Note: 1,3
Schlagworte: datenmanagement standardisierung arzneimittel bildungsmarkt e-learning
Produktsicherheit: Diplom.de

Autor

Max Dahms (Autor:in)