Einsatzmöglichkeiten semantisch gestützter Wissensnetze in medizinischer Diagnosesoftware

Würden, Oliver

Einsatzmöglichkeiten semantisch gestützter Wissensnetze in medizinischer Diagnosesoftware

Zusammenfassung

Inhaltsangabe:Zusammenfassung:
Diese Arbeit beschäftigt sich mit der konzeptionellen Entwicklung und Anwendung eines semantisch gestützten Wissensnetzes, explizit für den Bereich der fach- oder abteilungsübergreifenden Diagnostik in Krankenhäusern oder Arztpraxen. Hierzu wird insbesondere auf die Wirkungs- und Funktionsweise, sowie die beispielhafte Implementierung eines webbasierenden Wissensnetzes eingegangen und dessen Abfrage- und Auswertungsmöglichkeiten behandelt. Dieses Tool, in Form eines Demonstrators, soll unter Eingabe eines Symptoms eigenständige Rückschlüsse zur eventuell vorliegenden Erkrankung des Patienten liefern. Zudem soll es auf eventuelle Differenzdiagnosen hinweisen, weitere Untersuchungsvorschläge oder Behandlungsmaßnahmen ausgeben und Vorschläge zur Medikamentierung und deren Wechselwirkungen ausweisen können. Somit könnte das hier entwickelte Verfahren - nach einer entsprechenden Ontologie- und Inhaltserweiterung beispielsweise als unterstützendes Tool zur Assistenzarztausbildung, aber auch als frei zugängliche Webapplikation für Anwender im World Wide Web (WWW) eingesetzt werden.
Ziel des Wissensnetzes ist es, Krankheitsarten, Symptome und deren Beziehungen zueinander zu interpretieren und im Anschluss verständlich zu repräsentieren und somit nutzbar zu machen.
Zu Beginn der Arbeit wird ein Einblick in die erforderlichen Grundlagen, sowie eine Einführung in die Thematik des Semantic Web gegeben. Hierauf aufbauend wird das Hauptaugenmerk auf die Konzeption und Realisierung der entsprechenden Ontologie mit den erforderlichen Relationen und Attributen, auf Basis von XML, RDF, RDF(s) und OWL gelegt. Diese Umsetzung wird anhand der Software K-Infinity der Firma I-Views entwickelt und repräsentiert. Mithilfe eines beispielhaft behandelten Suchszenarios soll auf die Möglichkeiten und erschaffenen Funktionalitäten eines solchen Wissensnetzes eingegangen werden. In diesem Zusammenhang stehen insbesondere die Such- und Auswertungsmöglichkeiten im Fokus der Betrachtung.
Abschließend erfolgt noch eine Bewertung, sowie ein Ausblick auf die möglichen Erweiterungsfunktionen, die zur kommerziellen Nutzung der hier behandelten Diagnosesoftware sinnvoll erscheinen könnten. Als Ausgangspunkt dieser Betrachtung wird von der Annahme ausgegangen, dass die Software im medizinischen Bereich genutzt und unter Berücksichtigung des vorausgegangenen Suchszenarios, die erreichte Funktionalität und Ablauffähigkeit auf sinnvolle Verbesserungen […]

Leseprobe

Inhaltsverzeichnis

Abbildungsverzeichnis

Tabellenverzeichnis

1 Einleitung
1.2 Die Aufgabenstellung
1.3 Zielsetzung
1.4 Die Randbedingungen

2 Grundlagen / Einführung in die Thematik
2.1 EDV gestützte Diagnoseverfahren
2.1.1Singuläre Symptomdiagnostik im Krankheitswesen
2.1.2Einschränkungen EDV-gestützter Diagnoseverfahren
2.2 Der Weg zum Semantic Web
2.2.1Semantische Netze in industrieller Anwendung
2.2.2Potentiale semantischer Informationsaufbereitung im WWW

3 Konzeption
3.1 Die Idee
3.2 Anforderungen
3.2.1Erfassungsbedarf der konzipierten Ontologien
3.2.2Auswertung anhand zugrundeliegender Eingangsdaten
3.3 Aufbau des Netzes
3.3.1Konzeption der Ontologie „Erkrankungen“
3.3.2Konzeption der Ontologie „Symptome“
3.3.3Konzeption der Ontologie „Medikamente“
3.3.4Konzeption der Relationen
3.3.5Konzeption der Relationen „Krankheiten“
3.3.6Konzeption der Relationen „Symptome“
3.3.7Konzeption der Relationen „Medikamente“
3.3.8Konzeption und Zuweisung der Attribute

4 Realisierung
4.1 Marktübersicht und Auswahl des Ontologie Editors
4.2 Auswahl des Ontologie-Editors K-Infinity
4.3 Aufbau der Ontologien
4.4 Aufbau der Relationen
4.5 Aufbau der Attribute
4.6 Aufbau der Bereichssuche

5 Suchszenario im Knowledge-Portal
5.1 Einführung in das Knowledge-Portal
5.2 Semantische Suche versus Volltextsuche
5.3 Beispiel eines möglichen Suchszenarios
5.4 Beispiel einer semantischen Bereichssuche

6 Bewertung und Ausblick
6.1 Erweiterungsmöglichkeiten und Einsatzfelder
6.2 Bewertung vom Endergebnis & Ausblick

Literaturverzeichnis

ANHANG I - Entwicklungen und Definitionen

ANHANG II – Relationstabellen „Krankheiten“

ANHANG III – Relationstabellen - „Symptome u. Krankheiten“

ANHANG IV – Relationstabellen - „Medikamente“

ANHANG V– Attributdokumente „Krankheiten“

ANHANG VI – Attributdokumente „Medikamente“

ANHANG VII – Quellcode

Abbildungsverzeichnis

Abbildung 1 - Vereinfachtes Beispiel eines RDF-Graphen

Abbildung 2 - Grafisches Beispiel Selektierungsdurchlauf

Abbildung 3 - Intelligent Views-Referenzbeispiel:ThyssenKrupp

Abbildung 4 - Entwurf Inhaltsbereich „bakterielle Erkrankung“

Abbildung 5 - Entwurf Inhaltsbereich „virale Erkrankungen“

Abbildung 6 - Ontologie "Krankheiten"

Abbildung 7 - Beispiel des Aufwands einer Symptomersetzung

Abbildung 8 - Schematischer Ausschnitt der Ontologie „Symptome“

Abbildung 9 - Schematischer Ausschnitt der Ontologie „Medikamente“

Abbildung 10 - Top-Down-Hierarchie „Erkrankungen“

Abbildung 11 - Top-Down-Hierarchie der "Symptome" und "Medikamente"

Abbildung 12 - Vollständige Top-Down-Hierarchie

Abbildung 13 - Neuanlage von Relationen

Abbildung 14 - Definitionsfenster bei Neuanlage einer Relation

Abbildung 15 - Zuweisung von Relationen

Abbildung 16 - Zuweisung eines Attributes zum Medikament

Abbildung 17 - Aufruf und Neuanlage einer Bereichssuche

Abbildung 18 - Auswahl des Einstiegsknotens der Bereichsuche

Abbildung 19 - Einstiegsknoten der bereichsbezogenen Suche

Abbildung 20 - Bereitstellung der Bereichssuche im Knowledge-Portal

Abbildung 21 - Layout des Knowledge-Portals

Abbildung 22 - Ergebnisermittlung einer Kontextsuche

Abbildung 23 - Ergebnisermittlung einer semantischen Suche

Abbildung 24 - Symptomeingabe und Vorauswahl

Abbildung 25 - Ermittlung der Krankheiten anhand des Symptoms

Abbildung 26 - Übersicht „akute Bronchitis“ und „ähnliche Themen“

Abbildung 27 - Übersicht „akute virale Bronchitis“

Abbildung 28 - Übersicht „akute bakterielle Bronchitis“

Abbildung 29 - Übersicht – „Medikament Erybeta TS“

Abbildung 30 - Übersicht „Ersatzmedikament Doxy-CT“

Abbildung 31 - Bereichsorientierte Suche "Medikamente"

Abbildung 32 - Übersicht des Medikamentes "Theophylin"

Abbildung 33 - Beispielgraph in einem semantischen Netz

Abbildung 34 - Modifizierter Semantic Web Layer

Abbildung 35 - RDF-Triple Prinzip zur Beschreibung einer Beziehung

Abbildung 36 - Spezifizierter RDF-Triple-Aufbau

Abbildung 37 - Beispiel eines verknüpften RDF-Triple = RDF-Graph

Abbildung 38 - Einfache RDF(s)-Ontologie als Graphdarstellung

Abbildung 39 - Sprachen des Semantic Web im Kontext der Arbeit

Tabellenverzeichnis

Tabelle 1 - Beispiel Pseudocode zur Krankheitsermittlung

Tabelle 2 - Statische Suchanfrage auf Basis von Zeichenketten

Tabelle 3 - Beispiel einer Volltext-Suchanfrage

Tabelle 4 - Klassenübersicht der Ontologie „Krankheiten“

Tabelle 5 - Übersicht aller benötigten Symptome

Tabelle 6 - Übersicht aller benötigten Medikamente

Tabelle 7 - Übersicht der Grundrelationen bei „Krankheiten“

Tabelle 8 - Grundlegende Relationen der Ontologie Krankheiten

Tabelle 9 - Auszug der Relationen bei Bronchitis bei Krankheiten

Tabelle 10 - Übersicht aller Verknüpfungsrelationen bei "Krankheiten"

Tabelle 11 - Verknüpfungsrelationen des Krankheitsbildes „Bronchitis“

Tabelle 12 - Übersicht der Relationen von „Symptome“

Tabelle 13 - Grundlegende Relationen der Ontologie Symptome

Tabelle 14 - Symptomzuordnung für die chronische Bronchitis

Tabelle 15 - Übersicht der Relationen von „Medikamente“

Tabelle 16 - Relationen zu Wechselwirkungen von Medikamenten

Tabelle 17 - Übersicht der Attributdokumente für "Krankheiten"

Tabelle 18 - Beispielinhalt des hinterlegten Attributs "Krankheitsbild"

Tabelle 19 - Beispielinhalt des hinterlegten Attributs "Diagnoseverfahren"

Tabelle 20 - Grundlegende Angaben zum Suchszenario

Tabelle 21 - Übersicht der RDF/XML Elemente vgl.[10]: S. 109)

Tabelle 22 - OWL- Spezifikationsbeschreibungen

"Eine Theorie ist desto eindrucksvoller, je größer die Einfachheit ihrer Prämissen ist, je verschiedenartigere Dinge sie verknüpft und je weiter ihr Anwendungsbereich ist."^[6](Albert Einstein)

1 Einleitung

Sicherlich ist das oben verwendete Zitat von Albert Einstein^[7]auf viele Bereiche und Bestrebungen unserer heutigen Gesellschaft übertragbar. Sei es bei der Entwicklung innovativer Ideen, der Lösung komplexer Problemstellungen, oder schlicht bei der zugrunde liegenden Theorie von Tim Berners-Lee^[8], verschiedene Textdateien in Knoten zu unterteilen und zu verlinken (das heutige World Wide Web). (Vgl.[01])

Der Betrachtungsweise der Informatik kommt in diesem Zusammenhang besondere Bedeutung zu. Insbesondere in dem Bestreben, Erkanntes oder Erdachtes zu repräsentieren um verfügbares Wissen und deren Zusammenhänge strukturiert abrufbar und kommunizierbar anzubieten. In diesem Kontext hat sich in den letzten Jahren auch der Begriff „Ontologie“^[9]etabliert, der insbesondere bei der Weiterentwicklung des World Wide Web (WWW) zunehmend an Bedeutung gewinnt. Dies liegt in der Zielsetzung des Semantic Web begründet, die Bedeutung von Informationen im „WWW“ (auch) für Softwareprogramme verwertbar zu machen^[10].

Diese Zielsetzung soll auch den Kern dieser Arbeit widerspiegeln, in der auf die dafür zugrundeliegenden Ontologieerstellungen und deren Abfragemöglichkeiten eingegangen werden soll. Hierbei werden insbesondere die Einsatzfähigkeit, die Ontologie-, Relations- und Attributskonzeption, sowie deren Aufbau mittels der Software K-Infinity behandelt.

Technischer Gegenstand dieser Betrachtung soll eine zu schaffende Diagnosesoftware für das Krankheitswesen darstellen, die anhand des zu realisierenden Wissensnetzes die Möglichkeit bieten soll, Symptomeingaben mit entsprechenden Krankheiten und Medikamentierungen in Beziehung zu setzen.

Eine kurze Vorstellung der betreuenden Firmen dieser Arbeit, die zugrundeliegende Aufgabenstellung, deren Zielbestimmung und die Randbedingungen sind Gegenstand dieses ersten Kapitels.

1.1 Vorstellung Schneider Systems & Intelligent-Views GmbH

Die Diplomarbeit wurde fach- und sachbereichsmäßig durch die Firma Schneider System GmbH betreut. Weiterhin wurde die Software K-Infinity von der Firma Intelligent-Views-GmbH aus Darmstadt zur Verfügung gestellt, die sich zudem beratend bei der Wissensnetzplanung und deren Realisierung einbrachte. Es folgen eine kurze Beschreibung der beiden Firmen und ein Einblick in deren Kerngeschäfte.

Schneider System GmbH^[11], Vallendar,ist eine mittelständige Unternehmensberatung und u.a. im Umfeld der mediengestützten Qualifizierung sowie des technologiegestützten Informations- und Wissensmanagements tätig. Dieser „Geschäftsbereich Qualifizierung“ wird von Herrn Dr. Günter Pees ([41], [42], [43]) vertreten, der auf eine langjährige Projekterfahrung bei der Konzeption und Modellierung von Ontologien zurückgreifen kann. Weitere Kernkompetenzen des Unternehmens sind

- Analyse und Modellierung von Geschäftsprozessen;
- Konzeption und Realisierung von Wissensmanagement- und IT-Managmentsystemen;
- Beratung und Unterstützung für die Nutzung von Web 2.0-Technologien (WiKi);
- Planung, Erstellung, Einführung und Betrieb von Online Warenkorbsystemen und technischen Sprachprüfsystemen;
- Durchführung von Bildungsbedarfsanalysen und Erstellung von Bildungsdeckungsanalysen
- Begleitung der Didaktik und Methodik der Ausbildung.

Die Intelligent Views GmbH^[12]ist der führende Anbieter semantischer Technologie. Anhand der firmeneigenen SoftwareK-Infinityunterstützen sie ihre Kunden bei der optimalen Nutzung und Darstellung eigener Informationen und der Gestaltung der Prozesse für Wissenserwerb, -austausch und -bewahrung. Somit liegt das Augenmerk der K-Infinity-Software darin, Menschen direkt mit denjenigen Informationen zu verbinden, die im direkten Bezug zu ihrem Informations- und/oder Berufsumfeld stehen.

Hierfür greift sie auf einen umfangreichen wissenschaftlichen Background und eine langjährige Projekterfahrung zurück, wodurch sie sich als einer der kompetentesten Partner für anspruchsvolle Lösungen auf Basis semantischer Wissensnetze am Markt etabliert hat.

1.2 Die Aufgabenstellung

Anhand der Diplomarbeit soll geprüft werden, ob durch die Verwendung einer automatisierten Diagnosesoftware ein Unterstützungstool zur Diagnosefindung für Krankheiten, Symptome und/oder Medikamente im Bereich der abteilungsübergreifenden Diagnostik in Krankenhäusern und Arztpraxen, eingesetzt werden kann. Hierzu wird eine beispielhafte Ontologie konzipiert und realisiert, sowie anhand eines Suchszenarios auf ihre Leistungsfähigkeit geprüft und bewertet. Grundlage der Bewertung soll hierbei die Funktionalität, Effizienz und die Auswertbarkeit der Anfragen und somit eine spätere Nutzbarkeit der Software sein.

Im Fokus der Arbeit wird geprüft, ob und wie sich semantisch gestützte Wissensnetze im Bereich der medizinischen Diagnosesoftware auf eine erleichternde, zuverlässigere und aussagekräftigere Informationsdarstellung auswirken kann, und wie diese unter Nutzung der Software K-Infinity für interne Netzwerke oder das WWW umgesetzt werden könnte. Eine wesentliche Funktionalität wird hierbei die Ermittlung und Ausgabe von Krankheitsbildern unter Berücksichtigung der Symptomübereinstimmungen, sowie die Veranschaulichung der Krankheiten und deren Beziehungen zueinander sein, um so auf ähnliche Krankheitsbilder schließen zu können. Weiterhin sollen Informationen und Angaben zur Art und Ausprägung der Erkrankung, zu Verursachenden sowie Folgeerkrankungen und der Medikamentierung ermittelbar sein. Insbesondere bei der Medikamentierung soll auch auf die Wechselwirkungen von Präparaten hingewiesen werden können. Diese Funktionen sollen nach den zugehörigen Konzeptionen der Ontologien und Relationen und deren Modellierung mit der Software K-Infinity, mittels eines umfangreichen Suchszenarios geprüft und bewertet werden.

1.3 Zielsetzung

Zu Beginn sollen auf RDF-Graphen ([2]) basierende Ontologien konzipiert und diese unter Zuhilfenahme der Software K-Infinity in ein Wissensnetz überführt werden, aus denen die verschiedensten Krankheitsarten, dessen Spezifizierungsgruppen, Beziehungen und Medikamentierungsmöglichkeiten zu den entsprechenden Krankheitssymptomen und Krankheitsbildern hervorgehen.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1 - Vereinfachtes Beispiel eines RDF-Graphen

Voraussetzung hierfür ist eine korrekte Graph-Konzeption innerhalb der zu erstellenden Ontologien, um die Darstellung der allgemeinen Beziehungen zwischen den einzelnen Ressourcen ersichtlich zu machen. Die Darstellung soll über eine Menge von Knoten, die durch gerichtete Kanten verbunden sind, erfolgen. Die zu erbringende Kernkompetenz und zugleich die damit einhergehende Schwierigkeit, liegt in der Berücksichtigung der zu gewährleistenden Effektivität des daraus resultierenden Wissensnetzes. Diese soll unter der Prämisse einer möglichen späteren umfangreichen Erweiterung von den zu erwartenden Krankheits- und Symptomklassen erfolgen. Weiterhin soll insbesondere die Plausibilität der durch die ausgeführten Suchanfragen ermittelten Ergebnisausgaben und der dadurch präsentierten Informationen Beachtung finden und zudem die Funktion einer bereichsbezogenen Suche für zu bestimmende Teilbereiche des Wissensnetzes ermöglichen.

Die sich aus diesen Anforderungen ergebenden Ontologien und Relationen sollen im Anschluss unter Verwendung des Knowledge-Builder der Software K-Infinity überführt und mittels des angebundenen Knowledge-Portals auf seine Plausibilität hin geprüft werden. In diesem Zusammenhang ist sicherzustellen, dass die zugrundeliegenden RDF(s)-Triple^[13]fehlerfreie und keine widersprüchlichen Beziehungskanten repräsentieren. Dies ist unter anderem durch verschiedene Ergebnisabfragen des zu behandelnden Suchszenarios im Knowledge-Builder zu demonstrieren. ([03]: S. 40)

1.4 Die Randbedingungen

Als Randbedingungen werden zwei Entwicklungs- und Darstellungsumgebungen innerhalb der K-Infinity Software definiert. Für die im ersten Teil der Arbeit behandelte Graph- und Ontologieerstellungen, sowie dessen Überführung, wird auf die von der Firma I-Views zur Verfügung gestellte Software K-Infinity und den angebundenen Ontologieeditor „Knowledge-Builder“zurückgegriffen. Für die Darstellbarkeit des Wissensnetzes und zur Präsentation des Demonstrators bildet das angebundene„Knowledge-Portal“die zweite Komponente. Zudem benötigt die Software, für die im Knowledge-Portal hinterlegte Funktion der grafischen Wissensnetzdarstellung, eine JVM^[14]. Da die kostenlose Nutzung der Software ausschließlich an den Inhaltsbereich dieser Arbeit gebunden ist, wird innerhalb der Softwarevorstellung auf die von der Firma I-Views hinterlegten Installations- und Einführungsdokumentationen verwiesen.

Zur grafischen Aufbereitung einzelner Beispiele, sowie für dessen Präsentation innerhalb der Arbeit, wird auf die Bildbearbeitungsprogramme„Photoshop-Professional“und„Paint.net“zurückgegriffen.

2 Grundlagen / Einführung in die Thematik

Gegenstand dieses zweiten Kapitels bildet der Einblick in derzeit genutzte EDV-gestützten Diagnoseverfahren und deren Konformität zur hier behandelten Semantik. Insbesondere wird auf die aktuellen Stärken und Schwächen und die daraus resultierenden Auswertungs- und Anwendungsmöglichkeiten eingegangen und deren Leistungsgrenzen ermittelt. Im Anschluss erfolgt eine kurze Einführung in das Semantic Web und den zugrundeliegenden Wissensnetzen. Hierauf aufbauend werden die möglichen Anwendungsgebiete und Chancen von semantisch gestützten Diagnoseverfahren im EDV-Bereich definiert und mit den im Einsatz befindlichen Verfahren verglichen.

2.1 EDV gestützte Diagnoseverfahren

EDV-gestützte Diagnoseverfahren bilden, eine grundlegende Daseinsberechtigung. Sie ermöglichen, durch in der Regel fest implementierte Ausschlussverfahren von unzutreffenden Parametern, die Diagnose von immer komplexer werdenden Software-, Informations- und Maschinenmodulen. Somit hat sich beispielsweise das ursprüngliche Bild des Mechanikers, der in der Vergangenheit die entsprechenden Funktionsweisen und Zusammenhänge anhand seines angeeigneten Wissens diagnostizieren und beheben musste, in den letzten Jahren grundlegend verändert.

Eindrucksvoll lässt sich dieser Sachverhalt mittels der proportional zum technischen Fortschritt verlaufenden Softwareentwicklung im Diagnosebereich der Automobilbranche aufzeigen. Erst durch den Einsatz solcher Diagnosesoftware wurde eine Wartung und Fehlerdiagnose der immer komplexer werdenden Elektroniksysteme in Fahrzeugen ermöglicht. Das Zusammenspiel von vorhandenem Fachwissen des Anwenders und der geführten Softwarediagnostik agieren hier in einer Wissenssymbiose, wodurch die Leistungsfähigkeit des genutzten Systems maßgeblich bestimmt und die Effektivität des Arbeiters entscheidend beeinflusst wird.

Die sich durch EDV-gestützte Diagnoseverfahren ergebenen Möglichkeiten, benötigte Informationen strukturiert, zeitnah und bedarfsgemäß abrufbar zu gestalten, wurden auch schnell in anderen Bereichen erkannt. Heute findet man Diagnosesoftware in einer Vielzahl von Variationen und in den unterschiedlichsten Anwendungsgebieten vor. Eines dieser Gebiete ist die Informationsverarbeitung, -aufbereitung und -ausgabe in Arztpraxen und/oder Krankenhäusern. Bei den derzeit primär eingesetzten Systemen werden die vom Arzt oder Labor ermittelten Symptome und Werte schrittweise eingetragen. Das Einsatzgebiet liegt hier im Wesentlichen bei der Ermittlung und Diagnose von nicht alltäglichen Krankheitsbildern. Es folgt ein Einblick in den Funktionsablauf der singulären Symptomdiagnostik. ([06])

Abbildung 2 - Grafisches Beispiel Selektierungsdurchlauf

2.1.1 Singuläre Symptomdiagnostik im Krankheitswesen

Bei einer singulären Symptomdiagnostik basiert die Verarbeitung auf einem schrittweise durchlaufenden Ausschlussverfahren. Im Detail betrachtet, findet ein stetiger Abfrage-, Eingabezyklus statt. Innerhalb jedes Zyklus erfolgt eine Auswertung der getätigten Eingangsdaten mittels fest definierter Parameter, die mit den hinterlegten Datensätzen entsprechend abgeglichen werden. Somit folgt jedem Abfrageschritt ein auf der Eingabe basierender Folgeschritt und grenzt somit die eventuell vorliegende Krankheit anhand der Symptome immer mehr ein (Einschluss,- Ausschlussverfahren).

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 1 - Beispiel Pseudocode zur Krankheitsermittlung

Neuere Diagnosesysteme greifen hierbei zusätzlich auf in einer Datenbank hinterlegte Zugehörigkeiten, Beziehungen und Ressourcen zurück und können diese mittels festgelegter Parameter statisch mit ausgeben. Hierdurch wird es dem Anwender ermöglicht, ähnliche Krankheitsbilder - die auch in einem Bezug zur selektierten Symptomauswahl stehen - anzeigen zu lassen. Diese Funktionalitätserweiterung ist jedoch mit nicht unerheblichen Nachteilen verbunden.

2.1.2 Einschränkungen EDV-gestützter Diagnoseverfahren

Bezugnehmend auf das Beispiel aus„Tabelle 1 - Beispiel Pseudocode zur Krankheitsermittlung“ werden schnell Nachteile dieser im Einsatz befindlichen Diagnoseverfahren ersichtlich. Ausgehend von der Annahme, dass die Software hunderte Krankheitsbilder und deren zugehörigen Symptome berücksichtigen muss, um repräsentative Ergebnisse ausgeben zu können, entstehen zwangsweise hohe Durchlaufzyklen. Zusätzlich bedarf es bei einer solchen Komplexität eines unverhältnismäßig hohen Aufwands der Wartung und Pflege. Hieraus ergeben sich zwangsweise neue Problemfelder bei einer Erweiterung neuer Krankheitsbilder und deren Einbindung und Beziehungsverknüpfung in die bestehenden Datensätze. Dies ist auch einer der Gründe, warum die aktuell genutzten Diagnoseverfahren auf spezielle Krankheitsbereiche reduziert wurden und somit in ihrer Einsatzfähigkeit gewissen Grenzen unterliegen. Dies hat zur Folge, dass die entscheidende Stärke der Beziehungs- und Differenzdiagnostik nur bedingt genutzt, ausgewertet und dargestellt werden kann. Als Folge erhöht sich die Fehlerquote der ermittelten Diagnosen durch die Software, da gerade im Bereich der Differenzdiagnostik und der Repräsentation von bereichsübergreifenden Zusammenhängen von Informationen, diese zum Teil nicht hinterlegt und dargestellt werden können. Hierdurch entsteht für den behandelnden Arzt eine nicht unerhebliche Einschränkung der gewünschten Informationsdarstellung und -gewinnung, woduch sich der Nutzen der Software erheblich einschränkt.

Ein weiterer Nachteil dieser Diagnoseverfahren, sowie dessen Abfrage- und Ausgabemöglichkeiten, ergibt sich aus der ausschließlich nutzbaren Volltextsuche. Insbesondere die nicht mögliche Suche und Auswertbarkeit von Krankheits- oder Symptombeziehungen und deren Medikamentierung schränken den Funktionsumfang entscheidend ein. Zwar besteht die Möglichkeit, diese Beziehungen in textbasierter Form den entsprechenden Bereichen zuzuordnen und bei Bedarf mit ausgeben zu lassen, jedoch handelt es sich hierbei um von der Software nicht interpretierbare Zeichenketten, die mit hohem technischen und zeitlichen Aufwand implementiert und gepflegt werden müssen und de facto schlicht eine Contenterweiterung der eigentlichen Information darstellen. Um diese bestehenden Nachteile in Vorteile zu wandeln, bedarf es neuer Verfahren.

2.2 Der Weg zum Semantic Web

Das erste weltweite Netzwerk, das erfolgreich eine Paketvermittlung zwischen verschiedenen Knotenpunkten vorweisen konnte, wurde unter der Abkürzung ARPANET^[15]bekannt. ARPANET wurde als dezentrales Forschungsnetzwerk konzipiert und in den 60er Jahren unter der Federführung des DoD^[16]initiiert und vorangetrieben. Primär sollte dieses dezentrale Forschungsnetz sicherstellen, dass auch bei einem Ausfall eines oder mehrerer Knotenpunkte (Notes) die Funktionalität und somit die Kommunikation durch Dynamic Rerouting^[17]weiterhin gegeben sei. Aus diesem 1969 zugrundeliegenden Vierknotennetzwerk zwischen Forschungseinrichtungen und Universitäten in den USA entstand das heutige Internet und stellt somit seine Geburtsstunde dar.

Von 1969 bis 1989 durchlief das ARPANET zahlreiche technologische und wirtschaftliche Entwicklungen, wie beispielsweise im Jahre 1983 die Standardisierung des TCP/IP Protokolls und die Splittung des Netzes in ein kommerzielles (InterNet) und ein militärisches Netzwerk (MILNET). 1989 waren bereits über 10.000 Host-Rechner am InterNet angeschlossen, dass von nun auch„network of networks“genannt wurde. Seiner Zeit diente es primär zum Austausch von Daten. Erst 1989/1990 wurde unter der Federführung von Tim Berners-Lee, am CERN^[18]in der Schweiz, ein Projekt^[19]für den Austausch von Forschungsergebnissen initialisiert, bei dem ein auf dem Internet basierendes Web geschaffen werden sollte. Ziel war, unterschiedlichste wissenschaftliche Beiträge miteinander zu verknüpfen und somit für Nutzer schneller zugänglich und abrufbar zu machen. Er bezeichnete es als „World Wide Web“(W3). Das erste Web-Anzeigeprogramm war auf die Darstellung von bloßem Text beschränkt, wurde jedoch schnell um die Fähigkeit grafischer Darstellungen erweitert und im Jahr 1991 zur weltweit allgemeinen Benutzung freigegeben. Folgende Entwicklungen der ersten für die Öffentlichkeit zugänglichen Browser, führten zu einer bis dato unbekannten Popularität und zu einem sehr schnellen Wachstum des Nutzerkreises, das bis heute anhält.

Web 1.0. Das sich daraus entwickelte World Wide Web kennen wir heute unter dem Namen Web 1.0. Das Web 1.0 lässt sich durch die folgenden Merkmale charakterisieren:

- Strikte Trennung zwischen Produzent und Konsument der angebotenen, dargestellten Information. Broadcast Einweg Kommunikation.
- Dadurch nur statische Inhalte der angezeigten Informationen mit einer geringen Interaktionsmöglichkeit für den Nutzer, der von anderen Teilnehmern des World Wide Web abgekapselt war.
- Es ermöglichte maßgeblich nur einen bilateralen Austausch von Informationen, wie beispielsweise Lesen, Kaufen oder das Anklicken von Verlinkungen. ([07])

Web 2.0.Einhergehend mit der starken Verbreitung und Nutzung des World Wide Web stiegen auch die Anforderungen von Seiten der Anwender und Anbieter. So wurde von Gewerbeunternehmen schnell der neue Wirtschaftszweig„Internet“erkannt und gewerblich genutzt. Die stetigen Weiterentwicklungen der Interaktionsmöglichkeiten des Web 1.0 wurden hierdurch wesentlich vorangetrieben. Gleichzeitig entwickelte sich das Internet zunehmend auch zu einem sozialen Netz. So wurde 2004 auf einer Konferenz vom O’Reilly-Verlag der technische Begriff Web 2.0^[20]eingeführt, ohne an einen fest definierten, technischen Hintergrund gebunden zu sein. Man wollte durch die Einführung des Begriffs Web 2.0 primär eine begriffliche Abgrenzung zum „alten Web“ (1.0) schaffen. Dennoch lässt sich das Web 2.0 durch die folgenden Merkmale vom Web 1.0 abgrenzen:

- Der Nutzer ist zugleich Konsument und Produzent von Inhalten.(Weblogs / Foren / Wikis /P2P-Filesharing)
- Das Web 2.0 ist benutzerfokussiert und somit benutzergetrieben.
- Partizipation und multilateraler Austausch von Informationen. Soziale Aspekte wie Communities spielen eine tragende Rolle.
- Durch die Einführung dynamischer Websites wurden durch die Möglichkeit, nunmehr Inhalte aktiv mitzugestalten, die Interaktivitäten entscheidend verstärkt.
- Webservices sind (re-)kombinierbar.(Mashups) ([08])

Bedingt durch die Entwicklung zum sozialen Web und die dadurch gebotenen interaktiven Möglichkeiten für den Anwender, wurde das World Wide Web zunehmend zu einer tragenden privaten wie auch wirtschaftlichen Informationsplattform. Informationen und deren Nutzbarkeit wurden plötzlich zeitnah zugänglich und gewannen einen neuen Stellenwert. Jedoch zeigte sich schnell, dass bei der gewaltigen Anzahl und Art von Informationen, die täglich weiter wächst, Suchmaschinen bei der Selektion von gesuchten Inhalten an ihre Grenzen stießen. Ein wesentlicher Grund hierfür ist, dass nur von menschlichen Nutzern Informationen auf einer Website oder im Netz problemlos erfasst, in andere Darstellungsformen transformiert und zu anderen Informationen in Beziehung gesetzt werden können. Dies bedeutet, dass prinzipiell im Internet verfügbare Informationen nur mit einem entsprechenden –zunehmend größer werdenden- Aufwand gefunden werden können.

Derzeit ist die Leistungsfähigkeit bestehender Suchmaschinen wie Google oder Bing zwar erstaunlich, da diese im Wesentlichen auf ausgefeilten statistischen Methoden basieren, dennoch bleibt die Problematik bestehen, dass sie sich sich bei der Ergebnisermittlung „nur“ auf die Lokalisierung und den Abgleich von Zeichenketten beschränken.

Ein weiteres Problemfeld ergibt sich aus der dezentralen Struktur und der Organisation des Webs, die eine Heterogenität der vorhandenen Informationen auf ganz verschiedenen Ebenen mit sich bringt. Schwierigkeiten liegen hier beispielsweise bei den unterschiedlichsten Datenformaten bzw. Kodierungstechniken (ASCII vs. Unicode), der Verwendung verschiedener natürlicher Sprachen, bis hin zum differenzierten Aufbau privater Homepages. Hierdurch wird die Möglichkeit, im Web verteilte Informationen zu einem (Sach-, Informations-) Gebiet zu sammeln und in einheitlich aufbereiteter Form darzustellen bzw. weiterzuverwenden, maßgeblich erschwert oder gar unmöglich. Aufzeigen lässt sich dies im Falle der Annahme, dass bestimmte gesuchte Informationen nicht explizit im Netz zu finden sind, sondern diese Information nur aus einer Reihe von gegebenen Teilinformationen erfolgen kann. ([03]:S.10)

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 2 - Statische Suchanfrage auf Basis von Zeichenketten

Um diesem Problem abzuhelfen suchte man nach einer Lösung, um ein intelligenteres Suchen von Inhalten im World Wide Web zu ermöglichen d. h., nach Informationen zu suchen, die auch die Semantik^[21]der Information beschreibt und deren Verarbeitung durch Maschinen ermöglicht. ([09]: S.5 und [10]: S.4)

Semantic Web.

„The Semantic Web is the abstract representation of data on the World Wide Web, based on the RDF standards and another standards to be defined. It is being developed by the W3C, in collaboration with a large number of researchers and industrial partners. The Semantic Web brings to the Web the idea of having data defined and linked in a way that it can be used or more effective discovery, automation, integration, and reuse across various application.”^[22]

Häufig wird das Semantic Web fälschlicherweise als Web 2.0 bezeichnet oder damit verwechselt. In Wirklichkeit handelt es sich beim Semantic Web ausschließlich um eine Erweiterung und somit um eine Entwicklungsstufe des „Social Web“ (Web 2.0). Das Semantic Web beruht auf der Idee, Informationen in einer vorbestimmten Struktur zur Verfügung zu stellen, um deren Verarbeitung durch Maschinen zu ermöglichen und somit verwertbar zu machen. Die dafür benötigten Grundvoraussetzungen solcher zu entwickelnden Standards wurden federführend durch das World Wide Web Consortium (W3C)^[23]unter dem Vorsitz von Sir Timothy Berners-Lee, dem „Erfinder“ des World Wide Web, in der darauffolgenden Zeit herausgearbeitet und wie folgt definiert.

- Es müssen einheitliche und offene Standards für die Beschreibung von Informationen vereinbart werden. Hierdurch soll die Möglichkeit geschaffen werden, Informationen zwischen verschiedenen Anwendungen und Plattformen auszutauschen und die Fähigkeit gegeben werden, diese Informationen zueinander in Beziehung zu setzen. (Interoperabilität)
- Alle zu entwickelnden Standards haben die Anforderung einer formal klaren Definition zu erfüllen.
- Alle Standards sind in ihrer Erweiterbarkeit und ihrer Flexibilität zukunftsorientiert zu gestalten, um unvorhergesehene Anwendungsfälle möglichst gut behandeln zu können, ohne revidiert werden zu müssen.

([11]: S. 16 und [12])

Nicht zuletzt sei noch darauf hingewiesen, dass ein weiterer wesentlicher Bestandteil des Semantic Web, die Generierung und Bereitstellung von Methoden zur Schlussfolgerung von „neuen“ Informationen aus gegebenen, darstellt.

Für die Schaffung und Festlegung dieser Standards und der dringend benötigten Vereinheitlichung der Informations- und Spezifikationssprachen (XML, RDF(s) und OWL),^[24]hatte sich das W3C eingesetzt und im Februar 2004 OWL als standardisierte Ontologiesprache für das Semantic Web der Öffentlichkeit vorgestellt. Durch die Entscheidung, OWL als Standardsprache für das Semantic Web zu bestimmen, rückte die Zielsetzung, Informationen für Maschinen auswertbar und somit für den Menschen in strukturierter und geeigneter Form nutzbar zu repräsentieren, in greifbare Nähe.

Zur Vervollständigung und grafischen Veranschaulichung der zugrundeliegenden Standards und deren Aufbau wird auf die Schichten-Architektur des Semantic Web im Semantic Web Layer Cake^[25]und auf weiterführende Literatur verwiesen. ([13])

Zudem ist aus dem Anhang I -„Entwicklungen und Definitionen“ein erster grundlegender Einblick in die wesentlichen Standards und deren Definitionen zu ersehen.

2.2.1 Semantische Netze in industrieller Anwendung

Anhand der durch OWL bereitgestellten Spezifikationen, war nun die Voraussetzung zur Erstellung semantischer Netze geschaffen. Diese Entwicklung und einhergehenden Möglichkeiten wurden insbesondere von Großbetrieben und der Industrie wahrgenommen und je nach Bedarfsfall umgesetzt.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 3 - Intelligent Views-Referenzbeispiel:ThyssenKrupp

So erkannte ThyssenKrupp die in semantischen Wissensnetzen liegenden Potentiale, ein Wissensnetz zu schaffen, um interne Abläufe zu optimieren und Wissen für jeden Unternehmenszweig spezifisch zugänglich zu machen. Somit lag die Anforderung an das Wissensnetz darin, dass es in der Lage ist, weltweit Experten zu bestimmten Themen zu identifizieren, um dieses Wissen im Bedarfsfall zu nutzen. Weiterhin sollte eine Optimierung der Synergieeffekte der Tochterfirmen erzielt und die Fehlerquoten durch frei zugängliche und verknüpfte Wissens- und Erfahrungswerte reduziert werden. Zudem sah man die Notwendigkeit eines länderübergreifenden Wissensaustausches in Form eines Forums.

Mit der Entwicklung und Generierung dieses semantischen Wissensnetzes wurde die auf dem Gebiet der Erstellung von semantischen Wissensnetzen etablierte Firma Intelligent views (i-views) beauftragt. Das Resultat ist ein Wissensnetz, das nun in der Lage ist, Experten nach Ländern, Gebieten, Unternehmen und Fachwissen zu selektieren. Zudem ermöglicht das Wissensnetz die automatische Zuordnung von Fragen oder Problemstellungen^[26]zum entsprechenden Forum, wodurch die Reproduzierung von Fehlern minimiert und die Synergien der einzelnen Unternehmen maximiert wurden. Auch besteht für Experten nun die Nutzungsmöglichkeit eines Diskussions- und Austauschforums um bereits vorhandenes Wissen und Erfahrungen zu bündeln und zusammenzuführen.

Dieses Beispiel stellt nur eines von sehr vielen, von Unternehmen und der Industrie, eingeführten und genutzten Wissensnetzen dar. Es ist ersichtlich, dass die Nutzung semantischer Wissensnetze insbesondere für Großunternehmen anfangs eine wesentliche Bereicherung darstellte. Bedingt durch diesen neugeschaffenen Markt, wurden in den darauffolgenden Jahren immer umfangreichere Anwenderprogramme entwickelt und etabliert, wodurch auch zunehmend mittelständige Betriebe und andere Wirtschaftszweige (beispielsweise in der Medizin) auf die Möglichkeiten semantischer Wissensnetze zurückgriffen. Insbesondere im Bezug auf die zukünftige Weiterentwicklung zum Web 3.0 werden semantische Wissensnetze zunehmend auch im WWW an Bedeutung gewinnen um so den stetig wachsenden Anforderungen gerecht werden zu können.

2.2.2 Potentiale semantischer Informationsaufbereitung im WWW

Durch die Verbindung des Web 2.0, das sich durch die neuen Möglichkeiten der sozialen Interaktion auszeichnet, mit dem Semantic Web, eröffnen sich unter dem Schlagwort Web 3.0 neue Formen der Informationsgewinnung und der Qualität der Informationssuche. Diese zeichnet sich dadurch aus, dass durch das Web 3.0 nach dedizierten Inhalten maschinenunterstützt gesucht und zudem in Relation zueinander gesetzt werden können. Kombiniert man diese Möglichkeiten mit dem Einsatz eines Web 3.0 Agenten^[27]und definiert ihm die zu suchende Information anhand von Kriterien nach denen er vorgehen und selektieren soll, entsteht eine komplett neue Art der Informationsgewinnung für den Anwender. Folgendes noch visionäres Beispiel soll dies verdeutlichen:

Beispiel:

Als Ausgangspunkt soll die Annahme dienen, dass man gerne für vier Freunde Jägerschnitzel zubereiten würde und dafür noch auf der Suche nach einem passenden Rezept ist. Im alten WWW hätte man sich für eine Suchmaschine entschieden, die zum Suchbegriff„Jägerschnitzel“und„Rezept“eine unüberschaubare Anzahl an Suchergebnissen geliefert hätte. Man würde schnell erkennen, dass die erzielte Informationsgewinnung qualitativ mangelhaft erscheint, da neben der gesuchten Informationen, eine Vielzahl von Restaurants ausgegeben würden, die auf ihrer Speisekarte dieses Gericht anbieten. Auch würden weitere Suchergebnisse ausgewiesen, in denen Definitionen und Erklärungen zu den Begriffen zu finden wären. Sicherlich könnte man diese auf Zeichenketten basierende Kontextsuche durch Hinzufügen weiterer Begrifflichkeiten etwas verfeinern, dennoch müsste die Interpretation und der darin enthaltene Informationsgrad vom Anwender selbst ermittelt und als nützlich oder weniger nützlich kategorisiert werden. Ein Fortschritt bringen da schon die vom Web 2.0 verkörperten sozialen Foren. Hier wird die Möglichkeit geboten, nach einem passenden Rezept in einem speziellen Themen-Forum zu suchen und sich zugleich über nützliche Tipps und Kniffe zu informieren. Dennoch bleibt auch bei diesem Vorgehen, die eigentliche Suche und Interpretation Aufgabe des Anwenders. Die Lösung für das Problem liegt nun im Web 3.0, wo die sozialen Aspekte des Web 2.0 mit den semantischen Interpretationsfähigkeiten durch Maschinen im Semantic Web kombiniert werden sollen. Für die hier beschriebene Aufgabe, würden sich vollkommen neue Möglichkeiten ergeben.

So könnte sich ein auf dem eigenen Computer befindliches Web 3.0-Agenten-Tool auf die Suche nach speziell durch den Anwender vorgegebenen Jägerschnitzelrezepten machen. Bei dieser Suche würden nur Webseiten infrage kommen, die den Web 3.0-Agent auch über ihren Inhalt informieren würden. Anhand dieser Informationen erkennt er beispielsweise, dass diese entsprechenden Seiten Rezepte für„Jägerschnitzel“enthalten und wie diese Informationen zu lesen sind, um daraus ein Rezept zu extrahieren. Würde man nun dem Web 3.0- Agenten auch noch mitteilen, dass eine allergische Reaktion bei Steinpilzen vorliegt und man beispielsweise keine Zwiebeln mag, könnte dieser die Rezepte weiter nach den beinhalteten Zutaten„mit Champions“und „ohne Zwiebeln“ selektieren und ausgeben. Würde der Web-Agent zudem noch Informationen über die beim Anwender verfügbaren Weine und vorhandenen Zutaten besitzen, könnte dieser bei einem anderen Webdienst nach entsprechenden Vorschlägen zum passenden Wein für das Gericht suchen. Auch wäre die Ermittlung eines Geschäfts in der Nähe umsetzbar, das die fehlenden Zutaten auf Lager hat und ggf. auch innerhalb einer Stunde nach Eingang einer Onlinebestellung liefern könnte. Denkbar wäre hier, dass sogar der Web-Agent nach einer entsprechenden Authentifizierung die Bestellung selbstständig veranlasst. Würde sich anhand der vom Web-Agent ausgeübten Tätigkeiten ergeben, dass ein passendes Rezept gefunden, ein entsprechender Wein verfügbar und die fehlenden Waren theoretisch pünktlich geliefert würden, könnte er abschließend noch über einen weiteren Webdienst die Freunde einladen und auf Bestätigung warten.

Sicherlich handelt es sich bei diesem Beispiel noch um eine derzeit nicht umsetzbare Vision, dennoch zeigt sie das gewaltige Potenzial von semantischen Netzen im Vergleich zu seinen Vorgängern. Weiterhin wächst der Bedarf der zeitnahen Informationsbereitstellung und dem damit verbundenen Aufwand der Informationsgewinnung proportional zur Menge der im WWW hinterlegten Informationen. Es liegt insbesondere im Interesse der Wirtschaft, diese Entwicklung voranzutreiben und somit semantische Netze und Ihre Dienste zu verbreiten. (Vgl.[37])

3 Konzeption

Dieses Kapitel erfasst den für die Ontologiekonzeption benötigten Inhaltsbereich, sowie den sich daraus ergebenen Aufbau des Wissensnetzes anhand der entsprechenden Ontologien, Relationen und Attribute. Zudem erfolgt eine Beschreibung der zu erfüllenden Anforderungen an ein semantisches Netz, sowie eine Erstellung eines beispielhaften Suchszenarios unter Berücksichtigung von unterschiedlichen Suchkriterien (nach Symptom, Krankheit, Ausprägungen) und Einstiegspunkten.

3.1 Die Idee

Wie in Kapitel 1 geschildert, soll eine Ontologie geschaffen werden, die über das an K-Infinity angebundene Frontend einem behandelnden Arzt die Möglichkeit bietet, entweder unter Angabe eines Krankheitssymptoms auf Krankheiten schließen zu können, oder anhand einer angegebenen Krankheit die zugehörigen Symptome zu ermitteln. Der vom erstellten Demonstrator behandelte Inhaltsbereich soll sich im Wesentlichen auf die zwei Erkrankungsursachen „bakterielle Erkrankungen“ und „virale Erkrankungen“ beschränken. Jeder dieser Ursachen sollen einige zugehörige Krankheitsbilder zugeordnet werden können, die sich entsprechend ihrer Lokalität^[28]zergliedern. Weitere Funktionalitäten sollen in der Darstellungsfähigkeit der Ausprägung^[29], der Beschreibung des Krankheitsbildes und der zugehörigen Diagnoseverfahren, sowie dessen Medikamentierung inklusiver der möglicherweise auftretenden Wechselwirkungen sein. Nach der Eingabe eines Symptoms soll eine Ausgabe aller Krankheitsbilder erfolgen, die zu diesem Symptom in Bezug stehen. Hierauf baut die Funktionalität der Auswertbarkeit von Differenzdiagnosen auf, um dem behandelnden Arzt Aufschluss über gemeinsam auftretende Krankheiten (Superinfektionen), ihren Verlauf und ihre Beziehungen zueinander zu geben. Die Leistungsfähigkeit dieses Diagnosetools liegt insbesondere

- in der unterstützenden Auswertbarkeit und Ermittlungsfähigkeit von Krankheiten,
- in den zugrundeliegenden Symptomen und deren Ausprägung,
- der Zugehörigkeit der Infektionsart,
- der Zuordnung der Krankheit /zu den ggf. betroffenen Organen,
- sowie der medikamentösen Behandlung und Beschreibung.
- Zusätzlich sollen durch inverse Relationszuordnungen die Suchrichtungen sowie die Einstiegspunkte der Suche frei wählbar bleiben. Insbesondere bei einer nicht eindeutigen Ergebnisermittlung ist dies von entscheidender Bedeutung. Sie soll schließlich dem behandelnden Arzt auch alle mit dem Ergebnis in Beziehung stehenden Entitäten aufzeigen können. Dies soll Verständnisproblemen entgegenwirken und komplexere Zusammenhänge und Auswirkungen verdeutlichen. Hierdurch lassen sich für den Anwender eventuell erforderlich werdende Einschränkungskriterien leichter bestimmen.

Zur Umsetzung dieser Idee werden im nachfolgenden Kapitel die benötigten Anforderungen an die Ontologie und das auf ihr aufbauende Frontend ermittelt und festgelegt.

3.2 Anforderungen

Aus den im Kapitel 3.1 angestrebten und ineinandergreifenden Funktionalitäten wird schnell ersichtlich, dass diese von Tools die auf ausschließlich auf einer Kontextsuche basieren, nur teilweise und damit unzureichend oder überhaupt nicht erfüllt werden können. Dies liegt insbesondere in der fehlenden Interpretationsfähigkeit der eingegebenen Suchbegriffe und hinterlegten Relationen und somit in der fehlenden Umsetzungsmöglichkeit, eine bestimmte inhaltsbezogene Suche durchführen zu können. Zusätzlich erhöht sich bei einer zeichenkettengestützten Suche die Wahrscheinlichkeit, dass auch Informationen ermittelt werden, die in keinem direkten Bezug zur eigentlichen Anfrage des Anwenders stehen. Hierdurch reduziert sich der mögliche Nutzen für Anwender proportional zu deren Fachwissen, da der Inhalt der ausgegebenen Informationen erst interpretiert und im Anschluss noch in Bezug zur gesuchten Information gesetzt werden muss. Insbesondere bei der Vorstellung, dass das ange-strebte Tool bei einer unterstützenden Assistenzarztausbildung Anwendung finden könnte, wird schnell ersichtlich, dass der angestrebte Lerneffekt, Zusammenhänge von Krankheitsbildern und Symptomen aufzuzeigen und zu verdeutlichen nur unzureichend gegeben wäre. Um den gewünschten Umfang und die angestrebten Zielsetzungen zu erfüllen, bedarf es also eines Umfeldes, das es ermöglicht, mittels eines definierten Suchbegriffs diesen in Bezug zu den hinterlegten Informationen zu setzen. Zudem erfolgt zeitgleich eine Interpretation der sich aus dem Ergebnis resultierenden Beziehungen. Hierzu wird innerhalb dieser Arbeit auf die Software„K-Infinity“von der Firma I-Views zurückgegriffen, die auf ein semantisches Wissensnetz zugreift und die hinterlegten Informationen verarbeitet. Somit wird im Weiteren explizit auf die diesem Wissensnetz zugrundeliegenden Anforderungen und auf die Konzeption der später in dieses Wissensnetz zu überführende Ontologie eingegangen.

3.2.1 Erfassungsbedarf der konzipierten Ontologien

Bevor sich der eigentlichen Konzeption der Ontologie zugewandt werden kann, steht die Überlegung im Raum, welche Strukturen zugrunde liegen müssen, um die angestrebte Funktionalität des Tools zu gewährleisten. Bereits an dieser Stelle erfolgt eine erste Einteilung in die drei wesentlichen Bereiche:

- Erfassungsbedarf und Möglichkeiten von zu hinterlegenden Krankheitsbildern und dessen Zugehörigkeiten,
- Erfassungsbedarf und Möglichkeiten von zu hinterlegenden Symptomen,
- Erfassungsbedarf und Möglichkeiten von der zu hinterlegenden Medikamentierung der zugehörigen Krankheitsbilder, die auch bei der Konzeption das Fundament der späteren Stärke des Wissensnetzes widerspiegeln. Dazu wird in den nachfolgenden Kapiteln, insbesondere auf die Zergliederung in drei Ontologien, detaillierter eingegangen.

Im Weiteren erfolgt eine allgemein gehaltene Beschreibung der zur Erfüllung der angestrebten Funktionen notwendigen Klassen und Strukturen zu jedem dieser vier Bereiche. Hierbei wird nur auf notwendigen Strukturen eingegangen, die für den in dieser Arbeit behandelten Demonstrator von Relevanz sind. Deshalb kann kein Anspruch auf Vollständigkeit erhoben werden. Dies liegt an den hier nur beispielhaft behandelten Krankheiten und Symptomen. So wäre beispielsweise eine Erweiterung für den Bereich „Psychische Erkrankungen“ denkbar, der in diesem Falle einer eigenständigen Klassenstruktur und Relationssetzung unterliegen müsste.

- Erfassungsbedarf und Möglichkeiten von zu hinterlegenden Krankheitsbildern und dessen Zugehörigkeiten
- In Hinblick auf die Mächtigkeit^[30]einer Ontologie und später auftretenden Erweiterungs- und Aktualisierungsmaßnahmen, sollen die Krankheitsbilder einer eigenständigen Ontologie untergeordnet werden.
- Alle „Krankheiten“ sollen später eindeutig den folgenden Oberklassen zugeordnet werden können, um Informationen über die Erkrankungsregion, deren Art und Ausprägung und Variation erhalten zu können.
- Die Oberklasse „Organe“ benötigt die Subklassen „innere Organe“ und „äußere Organe“.
- Die Oberklasse „ Infektion“ benötigt die Subklassen „virale Infektion“ und „bakterielle Infektion“.
- Den daraus resultierenden vier Klassen untergliedern sich die weiteren Subklassen „harmlose Infektion“ und „akute Infektion“, denen wiederum die einzelnen Organe oder Krankheitsgruppen mit ihren entsprechenden Krankheitsbildern als weitere Klassen unterzuordnen sind.
- Bestehen mehrere Variationen eines Krankheitsbildes, sind diese Variationen der zugehörigen Krankheitsklasse zuzuordnen.^[31]
- Es bedarf verschiedener Relationszuweisungen innerhalb und zwischen gebildeter Klassen und den als Instanzen angelegten Krankheiten.
- Den gebildeten Krankheitsinstanzen sind Attribute mit den Informationen von der Art „Krankheitsbild“ und „Diagnoseverfahren“ anzuhängen.
- Erfassungsbedarf und Möglichkeiten von zu hinterlegenden Symptomen
- In Hinblick auf die Mächtigkeit einer Ontologie und später auftretenden Erweiterungs- und Aktualisierungsmaßnahmen, sollen die Symptome einer eigenständigen Ontologie untergeordnet werden.
- Alle Symptome sind eindeutig in ihrer Benennung und Ausprägung^[32]zu erfassen und zu bezeichnen.
- Jedem Symptom ist eine zugehörige Oberklasse zuzuordnen wie beispielsweise „physische“ oder „psychische Symptome“ und über Relationen zu bestimmen.
- Jedes Symptom ist über Relationen den zugehörigen Krankheitsbildern zuzuweisen. Die Relationssetzung muss unter Berücksichtigung des späteren Einstiegspunktes der Suche als inverse Relation^[33]erfolgen.
- Erfassungsbedarf und Möglichkeiten von der zu hinterlegenden Medikamentierung der zugehörigen Krankheitsbilder
- In Hinblick auf die enormen Möglichkeiten der Ontologie und später auftretenden Erweiterungs- und Aktualisierungsmaßnahmen, sollen die Medikamente und deren Wechselwirkungen und weitere Attribute in einer dritten eigenständigen Ontologie definiert werden.
- Jedem Medikament ist eine zugehörige Oberklasse nach dem jeweiligen Anwendungsgebiet zuzuordnen und über Relationen zu bestimmen. Beispiel: Zur Behandlung des Anwendungsgebietes „bakterielle Infektion“ eignet sich das Medikament „Xy“.
- Jedes geeignete Medikament, das sich zur Behandlung einer Erkrankung eignet, ist dieser über inverse Relationen zuzuordnen. Weiterhin müssen bestehende Wechselwirkungen mit anderen Medikamenten zusätzlich über inverse Relationen bestimmt werden.
- Jedem Medikament sind ggf. Attribute zuzuweisen.

Damit ist ein erster Einblick in die grundlegenden Strukturen und Erfordernisse der einzelnen Ontologien erfolgt.

Es lässt sich erkennen, dass die Herausforderung innerhalb der zu erstellenden Konzeption in der eindeutigen Zuweisung und Repräsentation der hinterlegten Entitäten, der zugehörigen Relationen und Attribute liegen wird. Es gilt daher, diese Anforderungen in den Mittelpunkt der Betrachtungsweise zu rücken. Beispielsweise um ein bereichsbezogenes Suchen (Bsp. Beschränke die Suche auf den Knoten xy) zu ermöglichen, aber auch für optionale Ausgaben über die Art und Ausprägung (virale vs. bakterielle und akute vs. harmlose Infektionserkrankung) der ermittelten Krankheit und deren Differenzdiagnosen, sowie der Medikamente und deren Wechselwirkungen.

3.2.2 Auswertung anhand zugrundeliegender Eingangsdaten

Bevor nun die eigentliche Konzeption behandelt wird, soll in diesem Kapitel noch kurz auf die angestrebten Such- und Auswertungsmöglichkeiten anhand der zugrundeliegenden Eingangsdaten eingegangen werden. Hierbei bezieht sich die Betrachtungsweise ausschließlich auf die theoretischen Möglichkeiten einer Suche innerhalb der zu erstellenden Ontologie. Ein detailliertes praktisch orientiertes Suchszenario wird in Kapitel 4.6 behandelt werden.

Die Stärke des zu entwickelnden Demonstrators soll insbesondere in der Netzstruktur der Ontologien liegen. Erst diese Netzstruktur ermöglicht beispielsweise beliebige Richtungen und Selektionen einer Suche. Der Demonstrator soll folgende Suchszenarien anhand der ihm zugrundeliegenden Eingangsdaten ermöglichen:

- eine bereichsbegrenzte Suche von Erkrankungen auf innere oder äußere Organe, auf ein Organ selbst oder auf alle Organe.
- eine bereichsbegrenzte Suche von Erkrankungen selektiert nach der Art der Infektion in Form von allen Infektionserkrankungen, oder wahlweise nur nach Erkrankungen viralen oder bakteriellen Ursprungs.
- eine bereichsbegrenzte Suche von Erkrankungen selektiert nach der Ausprägung einer zugrundeliegenden Infektion wie beispielsweise Erkrankungen, denen eine harmlose, akute oder alle Infektionsausprägungen zugrunde liegen.
- eine Suche nach expliziten Krankheitsgruppen und Krankheiten und der Ausgabe der Beschreibungen des Krankheitsbilder und des Diagnoseverfahrens.
- eine Suche nach Symptomen und deren Zugehörigkeiten
- eine Suche nach Medikamenten anhand ihres Anwendungsbereiches, mit der Ausgabe des Beipackzettels, sowie von entsprechend bekannten Neben- und Wechselwirkungen.
- Die Stärke des semantischen Netzes sollen die frei definierbaren bereichsbezogenen Suchen mittels eingestellter Ergebnisgruppierungen darstellen. Für den Demonstrator sind folgende Suchbeschränkungen innerhalb der Implementierung zu berücksichtigen:
- Vollständige Volltextsuche innerhalb des Netzes
- Vollständige semantische Suche innerhalb des Netzes
- Semantische Suche für die jeweiligen Bereiche Krankheiten, Symptome und Medikamente innerhalb des Netzes.

Der entscheidende Vorteil dieser Spezifizierung der Suche und der daraus resultierenden Ergebnisausgabe liegt in der Quantität der zu erwartenden Treffer der Suche. Zur Verdeutlichung soll folgendes Kurzszenario dienen, bevor im Kapitel 4 - „Realisierung“ besonders auf die Knoten- und Relationszuordnungen zu den entsprechenden Suchbereichen eingegangen wird.

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 3 - Beispiel einer Volltext-Suchanfrage

Anhand der gängigen Volltextsuche ist ersichtlich, dass die gelieferten Ergebnisse vom Anwender einer weiteren Interpretation und Selektion unterzogen werden müssen. Dies wäre erforderlich, um die nützlichen Informationen von im Bezug zur Suchanfrage stehenden irrelevanten Informationen zu trennen. Dies setzt nicht selten eine Fachkompetenz des Anwenders voraus, um den Wert einer Information in Bezug zur Suchanfrage richtig bewerten und einschätzen zu können. So ist davon auszugehen, dass bei dieser Volltextsuche neben der Kategorie „Medikament“ auch Ergebnisse von Krankheitsbildern wie „bakterielle Pneumonie“ oder Infektionsarten wie „harmlose Infektion“ angezeigt würden. Mit Blick auf die hier behandelte Thematik der Fachmedizin ist eine solche Ergebnisermittlung unzureichend und unakzeptabel.

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 4 - Beispiel einer semantischen Suche mit Bereichsbeschränkung

[...]

^[1]eXtensible Markup Language

^[2]Resource Description Language

^[3]Resource Description Language SCHEMA

^[4]Web Ontology Language

^[5]Ontologie-Editor und angegliederter Webeditor

^[6]Vgl. Autobiografisches, in Schilpp, P.A., Hg. Albert Einstein als Philosoph und Naturforscher. Braunschweig 1955

^[7]Theoretischer Physiker und Nobelpreisträger *14.März 1879 (Ger) †18. April 1955 (USA)

^[8]Sir Timothy John Berners-Lee, britischer Informatiker, Erfinder der Hypertext Markup Language und Begründer des World Wide Web, Vorsitzender des World Wide Web Consortium

^[9]Der Begriff „Ontologie“ hat seinen Ursprung im Griechischen, wobei hierontosfür „sein“, undlogos, für „Lehre“ oder „Wort“ steht.

^[10]Semantisches Web

^[11]URL: http://www.schneider-system-gmbh.de [Stand 28.04.2010]

^[12]URL: http://www.i-views.de/web/ [Stand 28.04.2010]

^[13] Jeder RDF-Graph kann vollständig durch Angaben seiner Kanten beschrieben werden.
Diese entsprechen immer einem RDF-Triple der Form „Subjekt-Prädikat-Objekt“

^[14]JAVA Virtual Machine

^[15]ARPANET steht für Advanced Research Project Agency Network

^[16]Department of Defense /USA

^[17]Beim Ausfall eines oder mehrerer Knotenpunkte sollten die Verbindungs- und Datenrouten dynamisch, d. h. bei laufendem Netzbetrieb neu eingerichtet werden können, um die Funktionalität des Netzes trotz Knotenverlustes zu gewährleisten.

^[18]Conseil Europeen pour la Recherche (Europäische Organisation für Kernforschung)

^[19]Bei dem Projekt handelte es sich um ein Hypertext-System

^[20]Web 2.0 = Social Web

^[21]Meaning (dt. Bedeutung)

^[22]Vgl. URL:http://www.w3c.tut.fi/talks/2003/0331umedia-on/slides6-0.html [Stand 28.04.2010]

^[23]Das World Wide Web Consortium (W3C) ist ein internationales Konsortium, in dem Mitgliederorganisationen, ein fest angestelltes Team und die Öffentlichkeit gemeinsam daran arbeiten, Webstandards zu entwickeln.

^[24]XML ist nicht im engeren Sinne dem Semantic Web zuzuordnen, sondern dem Web 2.0. XML fungiert hier jedoch als Metasprache, auf der zahlreiche Spezifikationssprachen wie RDF(s) und OWL aufbauen.

^[25]Vgl. Grafik URL: http://www.w3.org/2000/Talks/1206-xml2k-tbl/slide10-0.html [Stand 28.04.2010]

^[26]Bereichsorientiert je nach Tochterfirma und Aufgabengebiet

^[27]Software zur selbstständigen Durchführung von Suchanfragen, der Ergebnisinterpretation und Weiterverarbeitung von Seiteninhalten und der dargestellten Infromationen mit Bezug zu der hinterlegten Aufgabenstellung.

^[28]Sind innere oder äußere Organe von der Erkrankung betroffen und um welches Organ handelt es sich explizit?

^[29]Handelt es sich um eine akute oder harmlose, bakterielle oder virale Infektion

^[30]In diesem Zusammenhang soll unter der Mächtigkeit einer Ontologie die unproblematische Zuordnung, Änderung oder Erweiterung der Symptome und deren gesetzten Relationen zu neuen oder bestehenden Krankheitsbildern verstanden werden.

^[31]Beispielsweise untergliedert sich die „akute Bronchitis“ in die untergeordneten Krankheitsbilder „akute virale Bronchitis“ und „akute bakterielle Bronchitis“, denen auch jeweils andere Symptome zugrunde liegen können.

^[32]In diesem Zusammenhang soll unter „Ausprägung“ die beispielsweise Untergliederung des Symptoms Temperatur in jeweils eigenständige Symptome wie „normale Temperatur“, „erhöhte Temperatur“ usw. verstanden werden.

Details

Seiten
Erscheinungsform: Originalausgabe
Erscheinungsjahr: 2010
ISBN (eBook): 9783836648042
DOI: 10.3239/9783836648042
Dateigröße: 1.9 MB
Sprache: Deutsch
Institution / Hochschule: Private FernFachhochschule Darmstadt; Standort Pfungstadt – Informatik, Studiengang Informations- und Kommunikationsmanagement
Erscheinungsdatum: 2010 (Juni)
Note: 1,3
Schlagworte: semantic ontologie volltextsuche wissensnetze semantik
Produktsicherheit: Diplom.de

Autor

Oliver Würden (Autor:in)

Einsatzmöglichkeiten semantisch gestützter Wissensnetze in medizinischer Diagnosesoftware

Zusammenfassung

Leseprobe

Inhaltsverzeichnis

Inhaltsverzeichnis

Abbildungsverzeichnis

Tabellenverzeichnis

1 Einleitung

1.1 Vorstellung Schneider Systems & Intelligent-Views GmbH

1.2 Die Aufgabenstellung

1.3 Zielsetzung

1.4 Die Randbedingungen

2 Grundlagen / Einführung in die Thematik

2.1 EDV gestützte Diagnoseverfahren

2.1.1 Singuläre Symptomdiagnostik im Krankheitswesen

2.1.2 Einschränkungen EDV-gestützter Diagnoseverfahren

2.2 Der Weg zum Semantic Web

2.2.1 Semantische Netze in industrieller Anwendung

2.2.2 Potentiale semantischer Informationsaufbereitung im WWW

3 Konzeption

3.1 Die Idee

3.2 Anforderungen

3.2.1 Erfassungsbedarf der konzipierten Ontologien

3.2.2 Auswertung anhand zugrundeliegender Eingangsdaten

Details

Autor

Oliver Würden (Autor:in)