Lade Inhalt...

Führungsinformationssysteme und die Möglichkeiten der externen Informationsgewinnung

Masterarbeit 2008 95 Seiten

Informatik - Wirtschaftsinformatik

Leseprobe

Inhaltsverzeichnis

Abbildungsverzeichnis

Tabellenverzeichnis

Abkürzungsverzeichnis

1 Einleitung
1.1 Zielsetzung der Arbeit
1.2 Aufbau der Arbeit

2 Theoretische Grundlagen
2.1 Abgrenzung des Informationsbegriffs
2.2 Informationsquellen
2.3 Datenstruktur
2.3.1 Strukturierte Daten
2.3.2 Semistrukturierte Daten
2.3.3 Unstrukturierte Daten
2.4 Datenqualität
2.4.1 Qualitätsquantifizierung und Qualitätsprobleme
2.4.2 Qualitätsaktivitäten
2.5 Information Retrieval
2.6 Integrierte Informationsverarbeitung
2.6.1 Integrationsrichtung
2.6.2 Die Stufen der Integration
2.6.3 Integrationsreichweite
2.6.4 Ziele und Probleme
2.7 Controlling
2.7.1 Aufgaben des Controlling
2.7.2 Operatives und strategisches Controlling
2.7.3 Kennzahlenbildung

3 Führungsinformationssysteme
3.1 Business Intelligence
3.2 Funktionen
3.3 Einsatzgebiete
3.4 Technische Anforderungen

4 Externe Informationsgewinnung
4.1 Zusammenhang zur integrierten Informationsverarbeitung
4.2 Anwendungsgebiete
4.3 Vorarbeiten
4.4 Onlinedatenbanken
4.4.1 Datenstruktur
4.4.2 Datenqualität
4.4.3 Datenextraktion
4.4.4 Datenintegration
4.4.5 Vorteile und Nachteile
4.5 Internet
4.5.1 Datenstruktur
4.5.2 Datenqualität
4.5.3 Datenextraktion
4.5.4 Datenintegration
4.5.5 Vor- und Nachteile

5 Tools
5.1 Datenbankhosts
5.1.1 Dialog Corporation
5.1.2 GENIOS German Business Information
5.1.3 Fiz- Technik
5.1.4 Zusammenfassung
5.1.5 Betriebswirtschaftliche Bewertung
5.2 Information Retrieval Tools
5.2.1 QL2 Studio
5.2.2 Digital Information Gateway
5.2.3 Web Scraper Plus 5.5
5.2.4 Zusammenfassung
5.2.5 Betriebswirtschaftliche Betrachtung

6 Prototyp eines FIS mit externer Informationsgewinnung
6.1 Szenariobeschreibung
6.2 Aufbau Prototyp
6.3 Datenbank
6.4 WebQL- Abfragen
6.4.1 Interne Datenquellenabfrage
6.4.2 Externe Datenquellenabfrage
6.5 Oberfläche FIS

7 Bewertung der Ergebnisse

8 Schlussbemerkung

Literaturverzeichnis

Abbildungsverzeichnis

Abb. 1 Vorhandene und geplante Umfeldinformationen in Managementsystemen 1992

Abb. 2 Abgrenzung des Informationsbegriffs

Abb. 3 Integration betrieblicher Anwendungssysteme

Abb. 4 virtuelle Datenintegration

Abb. 5 materialisierte Datenintegration

Abb. 6 Integrationshürden vs. Integrationsreichweite

Abb. 7 Informationsversorgungskonzept des Controlling

Abb. 8 Unterstützungsfelder des Controlling

Abb. 9 Entscheidungsbezug und Informationsverdichtung

Abb. 10 Business Intelligence in Führungsinformationssystemen

Abb. 11 Ansatz eines Gesamtsystems der integrierten IV

Abb. 12 Integration externer Daten in das betriebliche FIS

Abb. 13 Struktur einer Faktendatenbank

Abb. 14 Informationsmenge externer Datenbanken

Abb. 15 Datenstruktur einer HTML- Seite

Abb. 16 Informationsmenge des Internet

Abb. 17 Information Retrieval mit DialogLink 5

Abb. 18 Suchergebnis „David Copperfield Limited“ mit DataStar

Abb. 19 Weboberfläche GENIOS

Abb. 20 Weboberfläche Fiz- Technik

Abb. 21 Oberfläche QL2 Studio

Abb. 22 Übersicht QL2 Studio

Abb. 23 DIG Architektur

Abb. 24 Web Scraper Plus Version 5.5

Abb. 25 Datenfluss im Prototypen

Abb. 26 Datenmodell aus Microsoft Access

Abb. 27 Ausschnitt einer K&M Elektronik Produktseite

Abb. 28 Datenrepräsentation im Prototypen

Tabellenverzeichnis

Tab. 1 Filmdatenbank mit Datenqualitätsproblemen

Tab. 2 Web Mining Methoden

Tab. 3 die Phasen des Business Intelligence Prozesses

Tab. 4 Aufgaben und Elemente von Führungsinformationssystemen

Tab. 5 Aktivitäten mit externen Informationen

Tab. 6 Anteile der befragten Unternehmen, die ein Tool nutzen (Basis = 435, Mehrfachantworten möglich)

Tab. 7 Bewertung der Datenbankhosts

Tab. 8 Kostenanfall bei Datenbankabfragen

Tab. 9 Datenbankrecherchekosten für führungsrelevante Informationen

Tab. 10 Bewertung der Information Retrieval Tools

Tab. 11 Kosten der betrachteten Information Retrieval Tools

Abkürzungsverzeichnis

Abbildung in dieser Leseprobe nicht enthalten

1 Einleitung

Die hohe Dynamik und Komplexität von betrieblichen Umfeldfaktoren, die mit der immer stärker werdenden Globalisierung der Märkte einhergeht, ist maßgeblich mit der geschäftlichen Entwicklung eines Unternehmens und dessen strategischer Ausrichtung verbunden. Dieser Aspekt stellt hohe Anforderungen an die Koordinations- und Reaktionsfähigkeit des Managements. Die Schnelllebigkeit von Informationen und deren Einfluss auf den Erfolg eines Unternehmens führen zu einer verstärkten Betonung der Informationsversorgungsaufgabe des Controllings. Um auf diese Umwelteinflüsse zu reagieren, reicht das Rechnungswesen mit seinen Daten aus den Kosten-, Leistungs-, und Ergebnisrechnungen bzw. seiner stark intern ausgerichteten Sichtweise als alleiniger Informationslieferant nicht mehr aus. Es müssen vielmehr externe Informationen mit in den Entscheidungsprozess des Managements einfließen. Dieser Gedanke ist nicht neu, es wurden bereits 1962 Überlegungen vom Verband der amerikanischen Controller und Treasurer (Financial Executives Institute) angestellt, die sich mit der ständigen Analyse des relevanten Unternehmensumfeld als einen konkreten Aufgabenbereich beschäftigten. Nach einer Studie, die auf eine Unternehmensbefragung in Großbritannien zurückzuführen ist, wurde festgestellt, dass von den Unternehmen, die über bestehende intern ausgerichtete Informationssysteme verfügen, lediglich drei Prozent der verfügbaren Daten vom Management als wesentliche Entscheidungsgrundlage betrachtet werden. Den weitaus größeren Anteil nehmen die externen Daten ein, die Informationen über den Markt, den Wettbewerb sowie die volks- und weltwirtschaftliche Entwicklung liefern.[1]

Abbildung in dieser Leseprobe nicht enthalten

Abb. 1 Vorhandene und geplante Umfeldinformationen in Managementsystemen 1992[2]

Während bei einer Untersuchung von Unternehmen unterschiedlicher Größe und Branchenzugehörigkeit Anfang der 90- er Jahre im Durchschnitt nur ca. 8,66 Prozent der Unternehmen angaben, externe Informationen in Managementsystemen zu verwalten (siehe Abb. 1.), ist die prognostizierte bzw. geplante Prozentzahl von integrierten Umfeldinformationen im Gegensatz zu heutigen Analysen weit hinter den Erwartungen geblieben. Demnach verwalten nach einer Studie des Aral Stiftungslehrstuhls für Strategisches Marketing (Universität Witten/Herdecke) heutzutage etwa 20 Prozent der betrachteten Unternehmen ihre externen Daten in einem an zentraler Stelle verankertem und systematisch operierendem Managementsystem. Immerhin 70 Prozent der befragten Unternehmen gaben an, dass Umfeldanalysen regelmäßig durchgeführt werden, aber die gewonnenen Informationen nicht in ein Informationssystem einfließen. Weiterhin haben 98 Prozent aller befragten Spitzenführungskräfte angegeben, dass sie die Umfeldanalyse für „wichtig“ oder sogar „sehr wichtig“ halten.[3] Nun stellt sich natürlich die Frage, warum nur 20 Prozent der Befragten Unternehmen mit einem Führungsinformationssystem (FIS) arbeiten, das externe Daten in den Entscheidungsprozess mit einfließen lässt, obwohl fast alle Führungskräfte die Notwendigkeit einer Umfeldanalyse befürworteten. Anhand dieser Arbeit soll dieses Phänomen tiefgründiger betrachtet werden und ein möglicher Ansatz für die Integration von externen Informationen in ein FIS geliefert werden.

1.1 Zielsetzung der Arbeit

Diese Arbeit soll eine Anleitung für Unternehmen sein, um an zusätzliche führungsrelevante Informationen zu gelangen, die aus dem internen Berichtswesen nicht zu entnehmen sind. Da es laut Mertens gerade bei der Bearbeitung von externen Informationen noch erheblichen Forschungs- und Entwicklungsbedarf gibt, soll diese Arbeit auch einen Überblick über die aktuellen Möglichkeiten der externen Informationssuche geben.[4] Insbesondere sind damit externe Umfeldinformationen gemeint, die mit Hilfe von Information Retrieval Tools (IR- Tools) sowie aus externen Datenbanken gewonnen werden können. Diese Tools, die das Gebiet der Business Intelligence anschneiden, sollen in dieser Arbeit näher betrachtet werden. Es soll geklärt werden, ob sich diese Hilfsmittel dazu eignen, den Informationsbedarf des Managements an externen Informationen abzudecken. Des Weiteren sollen die Daten, die aus den externen Informationsquellen stammen, in ein FIS einfließen. Für dieses Vorhaben soll geprüft werden, inwieweit diese Tools eine Integration in Form von Schnittstellen und Formaten unterstützen. Die Untersuchung wird somit auf der Basis der Tools geführt und konzentriert sich voll auf die Funktionalität der Werkzeuge. FIS werden in dieser Arbeit nur genannt und nicht einzeln analysiert. Es wird zusätzlich versucht, die klassische Sichtweite der integrierten Informationsverarbeitung mit den Elementen der externen Informationsgewinnung zu erweitern.

Es ist nicht das Ziel, eine Suchmaschine zu erstellen oder die Suchalgorithmen von den IR- Tools zu untersuchen. Da sich diese Arbeit speziell an Wirtschaftsinformatiker und Betriebswirtschaftler richtet, soll durch die Verknüpfung der Tools mit betriebswirtschaftlichen Einsatzgebieten ein Überblick über aktuelle Verfahren der Informationsbeschaffung, speziell aus externen Quellen gegeben werden. Deshalb steht nicht der technische Hintergrund der IR- Tools im Fokus, sondern vielmehr der betriebswirtschaftliche Nutzen, der sich durch die Beschaffung von externen Führungsinformationen ergibt. Zudem ist es auch schwierig, Informationen über verwendete Suchalgorithmen der Anbieter von IR- Systemen zu erhalten, da die Anbieter von kommerziellen Retrievallösungen bedacht sind, ihre Technologien geheim zu halten.

1.2 Aufbau der Arbeit

Diese Arbeit beruht auf einem theoretischen Konzept, d.h. sie wurde ohne einen Praxispartner verfasst. Sie ist so aufgebaut, dass der Leser Stück für Stück an das Thema herangeführt wird. Dabei gliedert sich die Arbeit im Wesentlichen in 6 Kapitel. Das sind im Einzelnen:

- Die theoretischen Grundlagen
- Führungsinformationssysteme
- Die externe Informationsgewinnung
- Toolunterstützung
- Prototyp
- Bewertung der Ergebnisse und die Schlussbemerkung

Innerhalb der theoretischen Grundlagen wird das Basiswissen aufgebaut, das nötig ist, um die Zusammenhänge von FIS und der externen Informationsgewinnung zu verstehen. Zunächst wird der Informationsbegriff gegenüber dem Datenbegriff abgegrenzt und ein zusammenfassender Überblick auf Stichwörter wie Wissen, Information, Daten und Zeichen gegeben. Zusätzlich wird auf die Struktur von Daten, die Datenqualität, Qualitätsaktivitäten zur Verbesserung der Datenqualität sowie auf Informationsquellen eingegangen. In dem Kapitel der theoretischen Grundlagen sollen weiterhin Begriffe wie Information Retrieval definiert und erläutert, sowie die klassische Sichtweise der integrierten Informationsverarbeitung bzw. deren Modell vorgestellt werden. Abschließend wird in diesem Kapitel das Controlling als Basis für FIS betrachtet.

Nach dieser Grundsteinlegung wird auf FIS und deren Zusammenhang zur Business Intelligence sowie auf typische Funktionen und allgemeine Einsatzgebiete eines FIS eingegangen. Anhand von Anforderungen wird der technische Rahmen für ein FIS abgesteckt.

Neben den meist intern ausgerichteten Einsatzgebieten eines FIS wird in dem Kapitel der externen Informationsgewinnung ein konkreter Überblick über relevante Führungsinformationen gegeben, die über externe Quellen abgefragt werden können. Der Zusammenhang der externen Informationsgewinnung zur integrierten Informationsverarbeitung wird durch ein Gesamtkonzept dargestellt. Zusätzlich wird unter Betrachtung der Datenqualität eine theoretische Anleitung gegeben, wie die Extraktion von Informationen aus Onlinedatenbanken und dem Internet sowie die Integration der gewonnenen Daten in ein Zielsystem, erfolgen kann. Es werden weiterhin die Vor- und Nachteile der jeweiligen Informationsquellen thematisiert.

In dem Kapitel Tools werden Werkzeuge vorgestellt, mit denen Informationsquellen wie Onlinedatenbanken und das World Wide Web gezielt durchsucht werden können. Die Betrachtung der Tools soll einerseits einen Überblick über die Methoden der externen Informationsgewinnung aus den genannten Informationsquellen geben. Andererseits soll geprüft werden, inwiefern sich diese Tools eignen, um an Führungsinformationen zu gelangen und diese in ein FIS einfließen zu lassen. Hierfür werden die verwendeten Hilfsmittel hinsichtlich ihrer Funktionalität, ihrer Schnittstellen und den angebotenen Support betrachtet. Zusätzlich werden betriebswirtschaftliche Aspekte durch eine Kostenbetrachtung dargestellt.

Zur Visualisierung des Themas und um die Theorie zu stützen, wird anschließend ein Prototyp beschrieben, mit dem es möglich ist, externe, führungsrelevante Informationen mit Hilfe eines IR- Tools zu extrahieren und in ein webbasiertes FIS zu integrieren.

Am Ende der Arbeit werden die Ergebnisse zusammengefasst und bewertet sowie eine abschließende Bemerkung zu dem Thema abgegeben.

2 Theoretische Grundlagen

2.1 Abgrenzung des Informationsbegriffs

Der Begriff der Information stammt aus der Nachrichtentechnik und wurde erst später durch die Informatik geprägt. Die Träger der Information sind elektrische oder optische Signale. Die folgenden Begrifflichkeiten können auf verschiedenen Ebenen betrachtet werden. Das sind die syntaktische (Grammatik), die pragmatische (situationsbezogen) und die semantische (Bedeutung) Ebene.

Abbildung in dieser Leseprobe nicht enthalten

Abb. 2 Abgrenzung des Informationsbegriffs[5]

Der Informationsbegriff wird oftmals mit dem Begriff der Daten auf eine Ebene gestellt. Diese Herangehensweise ist nur bedingt korrekt, tatsächlich werden Daten als Einträge bezeichnet, deren Typ oder syntaktische Struktur bekannt ist.[6] Bei einer Information handelt es sich hingegen um zielgerichtete Daten. Ziel gerichtet bedeutet in diesem Zusammenhang, dass eine Information aus für den Empfänger sinnvoll interpretierbaren Daten besteht. Ist also bekannt, was die Daten beschreiben (Semantik) oder welche Eigenschaften eines Objektes sie repräsentieren, wird von einer Information gesprochen. Der Begriff Wissen wird in dieser Definition an eine konkrete Situation gebunden.[7] Im Beispiel (siehe Abb. 2) ist diese Situation der Vergleich des Angebotspreises eines Produktes mit dem Angebotspreis eines Konkurrenten. Das Wissen, was daraus abgeleitet werden kann, ist z.B., dass der Konkurrenzpreis unter dem eigenen Preis liegt.

2.2 Informationsquellen

Es lassen sich interne und externe Informationsquellen voneinander abgrenzen. Dabei bezieht sich die Unterscheidung auf die örtliche Position der Informationsquelle in Hinblick auf die örtliche Position des Unternehmens. Das heißt, dass ein interner Informationspool ein fester Bestandteil eines Unternehmens ist und demnach externe Beschaffungsquellen außerhalb des Unternehmens liegen.[8] Die wichtigste interne Informationsbasis wird durch das betriebliche Rechnungswesen gebildet, das alle betrieblichen Geld- und Leistungsströme quantitativ erfasst, überwacht und dokumentiert. Des Weiteren wird durch die Betriebsdatenerfassung eine weitere Informationsbasis bereitgestellt, aus der Informationen wie Durchlaufzeiten, Kapazitätsauslastungen und Bearbeitungsstände entnommen werden können. Diese Daten gelangen durch die innerbetriebliche Datenintegration in die internen Datenbanken und werden meistens durch aufgesetzte Dataware Houses sowie Business Intelligence Prozessen bedarfsgerecht aggregiert und dem FIS zur Verfügung gestellt.

Die externe Datenbasis wird durch Daten gebildet, die das Unternehmen selber erheben kann wie z.B. durch Onlinerecherchen im Internet. Außerdem können externe Daten durch Informationsdienste wie Marktforschungsinstitute, Onlinedatenbanken (externe Datenbanken) oder dem statistischen Bundesamt gewonnen werden.

2.3 Datenstruktur

Die Struktur von Daten kann im Wesentlichen in drei Datentypen unterteilt werden, die für die Betrachtung der externen Informationsgewinnung unabdingbar sind und kurz erläutert werden.

2.3.1 Strukturierte Daten

Strukturierte Daten sind Daten in denen jedes Datenelement eine zugehörige und feste Struktur bzw. ein Schema besitzt. Das beste Beispiel für strukturierte Daten sind Datenbanken mit ihren relationalen Tabellen. Strukturierte Daten lassen sich relativ einfach maschinell weiterverarbeiten.[9]

2.3.2 Semistrukturierte Daten

Die Struktur bei semistrukturierten Daten zeigt etwas mehr Flexibilität als bei den strukturierten Daten. Semistrukturierte Daten sind „schemalos“ bzw. „selbst beschreibend“.[10] Das heißt, dass die Bedeutung der Struktur mit den Datensätzen selbst wiedergegeben werden muss. XML ist eine semistrukturierte Markup Sprache, die für die Datenübertragung verwendet wird. Charakteristisch für semistrukturierte Daten ist die Tatsache, dass Daten Felder enthalten können, die zur Designzeit noch unbekannt sind. Das setzt natürlich voraus, dass es für die XML- Datei keine referenzierende XML- Schema- Datei gibt. Eine weitere wichtige Eigenschaft ist, dass die Daten auf verschiedenen Wegen repräsentiert werden können. So kann z.B. ein Datum mit einem Feld oder durch mehrere Felder dargestellt werden.

2.3.3 Unstrukturierte Daten

Daten werden als unstrukturiert deklariert, wenn sie in einer natürlichen Sprache ausgedrückt werden und keine spezifische Struktur oder Domain Typen definiert worden sind.[11] Unstrukturierte Daten sind Dokumente, Grafiken, Video und Audiodaten. Sie lassen sich nur schwer bzw. ungenau maschinell weiterverarbeiten.

2.4 Datenqualität

Bei der Interpretation der Daten in eine sinnvolle Information spielt die Datenqualität eine wichtige Rolle. Bereits Anfang 1990 erkannten Wissenschaftler die Wichtigkeit der Datenqualität für elektronisch gespeicherte Daten in Datenbanken und Data Warehouses. Aber auch für die Betrachtung von externen Datenquellen ist die Datenqualität von enormer Bedeutung.

2.4.1 Qualitätsquantifizierung und Qualitätsprobleme

Die Quantifizierung der Datenqualität kann im Allgemeinen durch den wirtschaftlichen Aspekt bzw. durch die Quantifizierung in Geldeinheiten erfolgen. Dabei werden die Kosten ermittelt, die durch schlechte Datenqualität anfallen. Das sind im Wesentlichen:

- Prozessfehlerkosten wie z.B. fehlerhaft versendete E- Mails aufgrund von falschen Mailadressen.
- Kosten, die bei der Verbesserung der Datenqualität entstehen, wie z.B. bei der Verifizierung der vorhandenen Daten oder bei der Nacharbeitung von fehlerhaften oder redundanten Daten.
- Sowie die sog. Loss Opportunity Costs, die aus nicht realisierten Geschäften entstanden sind und auf eine schlechte Datenqualität zurückzuführen sind.[12]

Im engeren Sinne kann die Datenqualität mit Hilfe ihrer Dimensionen der Fehlerfreiheit, der Vollständigkeit, der Konsistenz und der Aktualität quantifiziert werden. Anhand der folgenden Tabelle werden die Datenqualität und ihre Dimensionen erläutert.

Abbildung in dieser Leseprobe nicht enthalten

Tab. 1 Filmdatenbank mit Datenqualitätsproblemen[13]

Die Datenbankfelder mit Qualitätsproblemen werden in Tab. 1 durch Schattierungen dargestellt. So hat z.B. der Filmtitel mit der ID 3 ein Problem mit der Fehlerfreiheit, denn der Titel für diesen Film lautet eigentlich „Roman Holiday“. Ein weiteres Problem der Fehlerfreiheit liegt in der Vertauschung der Direktoren von Film ID 1 und Film ID 2. Ein Problem hinsichtlich der Vollständigkeit ist in dem NULL- Wert beim Direktor in Film ID 4 zu erkennen. Anhand des fehlenden Remake Wertes in Film 4, soll auf ein Qualitätsproblem in der Datenaktualität aufmerksam gemacht werden. Da das letzte Remake von „Sabrina“ 1985 erstellt wurde, muss es folglich auch ein Remake in der Spalte Remakes geben. Als Letztes soll die Qualitätsdimension Konsistenz betrachtet werden. In der Filmdatenbank befinden sich zwei Konsistenzprobleme. Zum einen kann das Remake- Jahr in „Casablanca“ nicht geringer sein als das Erscheinungsjahr des Films. Und zum anderen darf in Film 4 das Feld von dem letzten Remake- Jahr keinen Wert enthalten, da es laut der Spalte Remakes noch kein Remake dieses Filmes gibt.[14]

2.4.2 Qualitätsaktivitäten

Nun stellt sich natürlich die Frage, wie die Datenqualität verbessert werden kann, um in einem FIS eine adäquate und verlässliche Entscheidungsgrundlage zu bieten und das Vertrauen in das vorliegende Datenmaterial zu stärken. Dazu sollen an dieser Stelle Qualitätsaktivitäten vorgestellt werden, die die Datenqualität verbessern und dem Entscheidungsträger hinsichtlich wichtiger Entscheidungen die Sicherheit geben, die richtige Wahl getroffen zu haben.

- Neue Daten in die Datenbank einfließen lassen bzw. ein Datenrefresh
- Standardisierung bzw. Normalisierung der Daten durch fest definierte Formate wie z.B. die Änderung des Straßennamens von „Berliner Straße“ in „Berliner Str.“
- Identifizierung von Objekten, die der realen Welt entsprechen und die mit Hilfe einer oder mehrerer Datenbanktabellen abgebildet werden können. Dadurch vermindert sich die Anzahl von Dubletten. Zum Beispiel kann aus einem Tabellentupel mit der Bezeichnung Adresse und dem Eintrag: Berliner Str. 127 12555 Berlin ein separates Objekt, respektive eine separate Entität mit der Bezeichnung Adresse und den Tupeln Straße, Hausnummer, Postleitzahl und Stadt gebildet werden.
- Datenvergleich: Daten werden zur Überprüfung der Fehlerfreiheit und der Glaubwürdigkeit aus mehreren Quellen extrahiert und miteinander verglichen.
- Einführung eines Rankings, um Datenquellen hinsichtlich ihrer Qualität zu beurteilen.
- Fehlererkennung und Beseitigung durch semantische Regeln, die auf die Tabelle angewandt werden. So ist es möglich, Tupel zu finden, die gegen diese Regeln verstoßen bzw. Ausreißer zu erkennen und zu eliminieren. Als Beispiel dient die Datenreihe 2, 45, 5, 9, 0, 1. Durch die Verwendung der semantischen Regel „Zahlen von 0 bis 9“ wird ersichtlich, dass in der 45 der Komma- Separator fehlt. Mit Hilfe von weiteren Regeln, kann in einem einfachen „Wenn… dann…“ - Prozess die Fehlerkorrektur erfolgen.[15]

2.5 Information Retrieval

Das Information Retrieval hat sich ursprünglich aus Katalogsystemen entwickelt, die dazu verwendet wurden, wissenschaftliche Literatur zu verwalten. Laut Definition ist „Information Retrieval eine wissenschaftliche Disziplin, die die inhaltliche Suche nach Informationen in Sammlungen von Dokumenten untersucht und Modelle, Methoden und Verfahren dafür entwickelt.“[16] Umgangssprachlich bedeutet Information Retrieval das Wiederfinden von Informationen. Dabei bildet Retrieval das Synonym für Recherche.[17] „Information Retrieval beschäftigt sich mit jenen Fragestellungen, die im Zusammenhang mit vagen Anfragen und unsicherem Wissen entstehen.“[18] Vage bedeutet in diesem Fall, dass die Anfrage mit unscharfen Kriterien definiert wird. Die Unsicherheit entsteht durch die uneindeutige Antwort, die das System liefern kann. Deshalb ist es auch notwendig, die Qualität der Antworten zu bewerten.

Information- Retrieval- Systeme (IR- Systeme) bilden die Gesamtheit aller methodischen und technischen Grundlagen, die das Retrieval ermöglichen. Das Ziel eines IR- Systems ist es, den Nutzenden mit Informationen zu versorgen. Dazu muss einerseits dem System der Informationsbedarf des Nutzenden in geeigneter Form übermittelt werden. Andererseits muss die gefundene Information dem Nutzenden durch das System repräsentiert werden.[19] Ein IR- System beschäftigt sich demnach mit der Repräsentation, der Speicherung und den Zugriff auf Dokumente oder Dokumentenstellvertreter. Im Einzelnen ermöglichen diese Systeme den Zugriff auf strukturierte, semistrukturierte und unstrukturierte bzw. unformatierte Daten variabler Länge. Dabei bilden Dokumente mit einem natürlichsprachigen Text die Grundlage, aus denen ein IR- System Informationen herausziehen und verarbeiten kann. Zusätzlich kann mit einem IR- System auch auf multimedialen Dokumenten, Fakten und Webseiten eine Recherche durchgeführt werden. Das Ergebnis einer Suchanfrage, die an ein Retrievalsystem gestellt wird, ist der Extrakt bzw. eine Menge von Referenzen. Findet das Retrieval im Internet bzw. auf Webseiten statt, wird von Web Mining gesprochen. Das Web Mining gliedert sich in die folgenden drei Themengebiete.

Abbildung in dieser Leseprobe nicht enthalten

Tab. 2 Web Mining Methoden[20]

2.6 Integrierte Informationsverarbeitung

Die klassische Sichtweise der integrierten Informationsverarbeitung ist durch die Publikationen von Scheer und Mertens geprägt. In ihren Ausführungen wird das Modell einer zweidimensionalen Pyramide gewählt, um die Integration von Anwendungssystemen innerhalb der betrieblichen Geschäftsprozesse darzustellen. Mertens definiert den Begriff der Integration im Allgemeinen als das Zusammenführen von einzelnen Teilen zu einem einheitlichen Ganzen. Weiterhin definiert er die Integration von solchen Anwendungssystemen als eine Disziplin der Wirtschaftsinformatik, in der Menschen, Aufgaben und Technik zu einer Einheit verknüpft werden.[21]

Abbildung in dieser Leseprobe nicht enthalten

Abb. 3 Integration betrieblicher Anwendungssysteme[22]

Die integrierte Informationsverarbeitung kann unter verschiedenen Gesichtspunkten betrachtet werden. Zum einen wird die Integrationsrichtung in die horizontale und vertikale Integration unterteilt. Zum anderen erfolgt die Gliederung der Integrationsreichweite in die innerbetriebliche-, zwischenbetriebliche- und überbetriebliche Integration.

2.6.1 Integrationsrichtung

Horizontale Integration

Die horizontale Integration beschreibt die Nutzung von Anwendungssystemen, die über die eigene Fachbereichsgrenze hinaus mit einem anderen System auf einer Ebene kommunizieren. Dies können Systeme sein, die von verschiedenen fachspezifischen Anbietern stammen und über Schnittstellen interdisziplinäre Daten austauschen. Andererseits können dafür auch sog. ERP- (Enterprise Ressource Planning) Systeme wie z.B. das R3- System der SAP AG eingesetzt werden, die den gesamten informationsspezifischen Bedarf aller fachlichen Abteilungen eines Unternehmens abdecken. Dieses System ist modular aufgebaut und bietet aus einer Hand für jeden Fachbereich eines Unternehmens eine spezielle Lösung. Es können z.B. die Programmmodule Finanzbuchhaltung (FI), Materialwirtschaft (MM) oder Personalmanagement (HR) des SAP R3 Systems in einem einheitlichen System zusammengefügt werden. Die Module sind ineinander verzahnt und nutzen eine einheitliche Datenbasis. Die horizontale Integration ist aber nicht ausschließlich entlang der unteren Pyramidenschicht in den operativen Systemen anzufinden, sondern wird auch in höheren Schichten der Pyramide verwendet. Dabei verläuft die horizontale Integration entlang der betrieblichen Wertschöpfungskette und betrifft z.B. in einem industriellen Referenzmodell die Abteilungen Produktion, Technik, Beschaffung, Vertrieb und Personal (siehe Abb. 3).

Vertikale Integration

Bei der vertikalen Integration erfolgt eine Trennung der Systeme in die Operativen und in die Planungs- und Kontrollsysteme. Dabei handelt es sich im unteren Bereich der Pyramide um die mengen- und wertorientierten operativen Systeme, die für die Massendatenverarbeitung eingesetzt werden und weiter in Administrations- und Dispositionssysteme sowie in Abrechnungssysteme unterteilt werden. Diese Systeme sind jedoch für das Thema nicht von Relevanz und werden deshalb außen vorgelassen. Der relevante Teil wird durch den grauen Bereich der Pyramide bzw. durch die Planungs- und Kontrollsysteme (siehe in Abb. 3) dargestellt. Das sind Systeme, die fachlich dem Controlling zugeordnet werden und sich in Berichts- und Kontrollsysteme, Analysesysteme sowie langfristige Planungs- und Entscheidungssysteme abstufen.

Die vertikale Integration beschreibt die Datenversorgungsaufgabe der vorgelagerten Systeme an die nachgelagerten Systeme. Konkret bedeutet dies, dass die operativen Systeme die Planungs- und Kontrollsysteme mit Daten versorgen. Dabei werden die Berichts- und Kontrollsysteme auf die operativen Systeme aufgesetzt, und bilden somit die Schnittstelle zu den operativen Systemen. Mit Hilfe der Berichts- und Kontrollsysteme können Informationen in Echtzeit durch OLAP (Online Analytical Processing) oder durch zwischengeschaltete Data Warehouses aus den operativen Systemen extrahiert werden.[23]

Die Analysesysteme sind dadurch gekennzeichnet, dass zusätzlich zu den verdichteten internen Informationen, die von den Berichts- und Kontrollsystemen geliefert werden, auch immer mehr externe Informationen aus externen Quellen hinzukommen.[24] An der Spitze der Pyramide befinden sich die langfristigen Planungs- und entscheidungsunterstützenden Systeme, zu denen auch die FIS gehören, die den Kern dieser Arbeit bilden sollen. Planungs- und entscheidungsunterstützende Systeme werden oftmals auch als End Systeme bezeichnet. Sie konzentrieren sich auf die Unterstützung von schlecht strukturierten und situativen Entscheidungsproblemen.[25]

Die Informationsdichte, die auf den unterschiedlichen Systemebenen entsteht, korreliert mit der jeweiligen hierarchischen Stufe der Organisationseinheit. Das heißt, je höher eine Organisationseinheit im Organigramm eines Unternehmens angesiedelt ist, umso höher ist die Informationsdichte für diese Organisationseinheit. Daraus folgt, dass die Informationsdichte bei den langfristigen Planungs- und Entscheidungsunterstützenden Systemen am höchsten ist.

2.6.2 Die Stufen der Integration

Die Integration der Informationsverarbeitung innerhalb eines Unternehmens kann unterschiedliche Ausprägungen annehmen. Mertens legt sich in seinem Buch „Integrierte Informationsverarbeitung 1 Operative Systeme in der Industrie“ insgesamt auf 5 Integrationsstufen fest. Das sind im Einzelnen die Datenintegration, die Funktionsintegration, die Prozessintegration, die Methodenintegration sowie die Programmintegration. Für das Thema der externen Informationsgewinnung sollen jedoch nur die Daten- und Programmintegration betrachtet werden. Die anderen Stufen werden, um den Inhalt der Arbeit klar abzustecken, nur Erwähnung finden.

Datenintegration

Bei der Datenintegration werden Daten, die aus mehreren betrieblichen Teilbereichen stammen, logisch zusammengeführt.[26] Der Zugriff auf die Daten durch die Teilbereiche wird auch nach der Datenintegration gewährleistet. Die Datenquellen werden bei der Datenintegration typischer Weise nach der Art ihrer Heterogenität charakterisiert.[27] Dabei werden generell die technologische Heterogenität, die Schemaheterogenität sowie die Heterogenität auf Instanz bzw. auf Datenebene unterschieden. Eine technologische Heterogenität tritt dann auf, wenn z.B. zwei unterschiedliche Datenbanksysteme nebeneinander laufen. Schemaheterogenitäten entstehen bei der Verwendung von unterschiedlichen Datenmodellen wie z.B. eines relationalen Datenmodells zusammen mit einem XML- Datenmodell. Aber auch die Verwendung unterschiedlicher Datenrepräsentationen führt zu einer Schemaheterogenität. Als Beispiel dient hierzu die verschiedenartige Implementierung eines Adressobjektes, das einerseits als Tabellentupel oder anderseits als Tabelle (Entität) selbst dargestellt werden kann. Die Heterogenität auf Datenebene ist ein Anzeichen schlechter Datenqualität. Dabei verursachen die Werte der Daten, die beispielsweise aus verschiedenen Datenquellen stammen aber ein und dasselbe Objekt beschreiben, Konflikte hinsichtlich der Konsistenz. Neben diesem Problem können auf Datenebene weitere Qualitätsdimensionen verletzt werden und negative Auswirkungen auf die Datenqualität haben. Daran ist erkennbar, dass es bei der Datenintegration eine strikte Bindung zu dem Thema der Datenqualität gibt.[28] Bei der Datenintegration muss darauf geachtet werden, dass Heterogenitäten überwunden werden. Batini und Scannapieco definieren die Datenintegration wie folgt: „Data integration is a major research and business area that has the main purpose of allowing a user to access data stored by heterogeneous data sources through the presentation of a unified way, overcoming such heterogeneities.“[29] Die Integration von Daten kann in Hinblick auf Informationssysteme durch die sog. virtuelle Datenintegration oder durch die materialisierte Datenintegration realisiert werden.

Bei der virtuellen Datenintegration werden die Daten von einem Teilsystem an ein anderes Teilsystem gesendet. Das empfangende System muss diese Daten interpretieren können. Die Datenrepräsentation auf dem empfangenden System ist virtuell, da die gesendeten Daten physisch in ihrer Datenquelle verbleiben und nur nach einer Abfrage zur Verfügung stehen. Der Vorteil dabei ist, dass die Daten so aktuell sind wie die Datenquellen, in denen sie abgerufen werden. Als Referenzarchitektur wird für die virtuelle Datenintegration oftmals die Mediator- Wrapper Architektur verwendet. Sobald ein Teilsystem Daten an ein anderes Teilsystem sendet, wird von Kommunikation gesprochen.

[...]


[1] Vgl. Fritz, Burkhard 1999, S. 227

[2] eigene Darstellung in Anlehnung an Fritz, Burkhard 1999, S. 229

[3] Vgl. Liebl, Franz 2003

[4] Vgl. Mertens, Peter 2002, S. 59

[5] eigene Darstellung in Anlehnung an Kemper, Mehanna u.a. 2006, S. 127

[6] Vgl. Ferber, Reginald 2003, S. 27

[7] Vgl. Ferber, Reginald 2003, S. 27

[8] Vgl. Fritz, Burkhard 1999, S. 232

[9] Vgl. C. Batini u. M. Scannapieco 2006, S. 6

[10] Vgl. C. Batini u. M. Scannapieco 2006, S. 6

[11] Vgl. C. Batini u. M. Scannapieco 2006, S. 6

[12] Vgl. C. Batini u. M. Scannapieco 2006, S. 89

[13] Vgl. C. Batini u. M. Scannapieco 2006, S. 5

[14] Vgl. C. Batini u. M. Scannapieco 2006, S. 5

[15] Vgl. C. Batini u. M. Scannapieco 2006, S. 70

[16] Ferber, Reginald 2003, S. V

[17] Vgl. Poetzsch, Elenore 1998, S. 13

[18] Schwarz, Iris 2005

[19] Vgl. Ferber, Reginald 2003, S. 21

[20] Vgl. Liu, Bing 2006, S. 5

[21] Vgl. Mertens, Peter 2007, S. 1

[22] eigene Darstellung in Anlehnung an Scheer, August- Wilhelm 1997, S.5

[23] Vgl. Mertens, Peter 2007, S. 5

[24] Vgl. Mertens, Peter 2002, S. 1

[25] Vgl. Fritz, Burkhard 1999, S. 131

[26] Vgl. Mertens, Peter 2007, S. 1

[27] Vgl. C. Batini u. M. Scannapieco 2006, S. 133

[28] Vgl. C. Batini u. M. Scannapieco 2006, S. 17

[29] C. Batini u. M. Scannapieco 2006, S. 133

Details

Seiten
95
Erscheinungsform
Originalausgabe
Jahr
2008
ISBN (eBook)
9783836647076
Dateigröße
3 MB
Sprache
Deutsch
Katalognummer
v227794
Institution / Hochschule
Hochschule für Technik und Wirtschaft Berlin – Wirtschaftswissenschaften II, Wirtschaftsinformatik
Note
1,0
Schlagworte
führungsinformationssysteme executive information systems webcontent management business intelligence retrieval

Autor

Zurück

Titel: Führungsinformationssysteme und die Möglichkeiten der externen Informationsgewinnung