Lade Inhalt...

OLAP (Online Analytical Processing) - Implementierung des Analysewerkzeugs

Instant OLAP für die individuelle Kundenansprache bei der Emil Ratz GmbH

©2003 Diplomarbeit 76 Seiten

Zusammenfassung

Inhaltsangabe:Einleitung:
Unternehmen versuchen seit den 60er Jahren das Management mit Hilfe analytischer Informationssysteme bei der Entscheidungsfindung zu unterstützen. Schlagworte wie Management Information Systems (MIS), Decision Support Systems (DSS) und Executive Information Systems (EIS) sind Synonyme für den mäßigen Erfolg, den die Anbieter bislang in diesem Markt erlangen konnten. Heutzutage werden mit Data Warehouse, OLAP (Online Analytical Processing) und Data Mining neue, erfolgsversprechende Ansätze zum Aufbau analytischer Informationssysteme unternommen.
Um die Führungsaufgaben des Managements bewältigen zu können, sind Unternehmensdaten in aufbereiteter Form notwendig. Ein standardisiertes, periodisches Berichtswesen bildet oftmals die Grundlage der Informationsversorgung des Managements. Zum Aufdecken von Trends oder bei Abweichungen von den Soll-Zahlen reicht dieses Berichtssystem nicht aus. OLAP-Werkzeuge stellen dem Anwender ein geeignetes Analyse-Instrument zur Verfügung, um die Unternehmensdaten flexibel und schnell auswerten zu können. Grundlage der OLAP-Systeme ist eine multidimensionale Sichtweise auf die Daten, die der Sicht des Managers eher entspricht als ein zweidimensionales Modell, das den operativen Systemen (OLTP-Systeme) meist zugrunde liegt.

Problemstellung:
Heutzutage wird es für Unternehmen immer wichtiger, in kürzester Zeit die richtigen Informationen zu erhalten, um Entscheidungsprozesse optimal gestalten zu können.
Auf der Suche nach neuen Wettbewerbsvorteilen nutzen Entscheidungsträger immer häufiger die Informationstechnologie. Sie dient nicht mehr nur der Sammlung und dem Austausch von Daten, sondern in verstärktem Maße auch der systematischen und schnellen Beschaffung, Verwaltung, Bereitstellung, Analyse und Interpretation von Informationen. Information ist somit im Zeitalter der Wissensgesellschaft als „die unternehmerische Ressource schlechthin“ anzusehen. Der Produktionsfaktor „Information“ hat sich längst zu einem strategischen Erfolgsfaktor herausgebildet. Die richtige Information, zur richtigen Zeit, am richtigen Ort ist entscheidend für erfolgreiches unternehmerisches Handeln. Ein Informationsdefizit in Unternehmen kann durch OLAP-Werkzeuge kompensiert werden. Dieses spezielle Analysewerkzeug dient der entscheidungsorientierten Modellierung und Auswertung relevanter Informationen für das Marketing.
Die Emil Ratz GmbH verfügt zur Zeit über kein geeignetes Analyse-Werkzeug. Die Erstellung von […]

Leseprobe

Inhaltsverzeichnis


ID 8384
Cvija, Arsen: OLAP (Online Analytical Processing) - Implementierung des
Analysewerkzeugs - Instant OLAP für die individuelle Kundenansprache bei der Emil Ratz
GmbH
Hamburg: Diplomica GmbH, 2004
Zugl.: Berufsakademie Stuttgart, Staatliche Studienakademie, Diplomarbeit, 2003
Dieses Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte,
insbesondere die der Übersetzung, des Nachdrucks, des Vortrags, der Entnahme von
Abbildungen und Tabellen, der Funksendung, der Mikroverfilmung oder der
Vervielfältigung auf anderen Wegen und der Speicherung in Datenverarbeitungsanlagen,
bleiben, auch bei nur auszugsweiser Verwertung, vorbehalten. Eine Vervielfältigung
dieses Werkes oder von Teilen dieses Werkes ist auch im Einzelfall nur in den Grenzen
der gesetzlichen Bestimmungen des Urheberrechtsgesetzes der Bundesrepublik
Deutschland in der jeweils geltenden Fassung zulässig. Sie ist grundsätzlich
vergütungspflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des
Urheberrechtes.
Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in
diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme,
dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei
zu betrachten wären und daher von jedermann benutzt werden dürften.
Die Informationen in diesem Werk wurden mit Sorgfalt erarbeitet. Dennoch können
Fehler nicht vollständig ausgeschlossen werden, und die Diplomarbeiten Agentur, die
Autoren oder Übersetzer übernehmen keine juristische Verantwortung oder irgendeine
Haftung für evtl. verbliebene fehlerhafte Angaben und deren Folgen.
Diplomica GmbH
http://www.diplom.de, Hamburg 2004
Printed in Germany

Arsen Cvija
Diplom-Betriebswirt (BA)
Zähringer Allee 39
75177 Pforzheim
fon 07231-426085
e-mail arsencvija@yahoo.de
Autorenprofil
Persönliche Daten
Geboren am 19.05.1977 in Pforzheim
ledig
Angestrebter Aufgabenbereich
E-Commerce, Database-Marketing
Zur Zeit
seit 01/2004
Disponent im Einkauf bei einem Elektrogroßhandel
-
Verantwortlich für die Beschaffung von Industrieprodukten der
Hersteller Siemens, Moeller, Schneider Electric, Harting, Rittal
-
Entwicklung von Marketing-Strategien zur Einführung neuer Produkte
-
Marktneuheiten, Kundenwünsche beobachten und auswerten
Studium
10/2000 ­ 09/2003
Betriebswirtschaftslehre an der BA Stuttgart Fachrichtung Handel
Abschluss:
Diplom Betriebswirt (BA)
Studienabschluss (Note: 2,5)
Diplomarbeit:
OLAP (Online Analytical Processing) ­ Implementierung des
Analysewerkzeugs Instant OLAP für die individuelle Kunden-
ansprache bei der Emil Ratz GmbH (Note: 1,0)
Schwerpunkte
im
Studium:
Einsatz von Marketinginstrumenten, Marktforschung, Controlling
Qualifikationen im Studium:
01/2003
Teilnahme am 3-tägigen Planspiel TOPSIM E-Commerce
09/2002
Staatliche Prüfung zum Wirtschaftsassistenten
09/2002
Ausbildereignungsbescheinigung der IHK Stuttgart (Note: gut)

Arsen Cvija
Diplom-Betriebswirt (BA)
Zähringer Allee 39
75177 Pforzheim
fon 07231-426085
e-mail arsencvija@yahoo.de
Berufliche Weiterbildung und Praxis
04/2004
5-tägiges Seminar zum Moeller Kundenberater EGH in Bonn
04/2004
2-tägiger Basis-Kurs zum Siemens Kundenberater im Elektro-
großhandel
in
Amberg
05/2000 Verkaufstraining »Kundenorientiert Denken und
verkaufsorientiert
Handeln«
02/2000 ­ 09/2000
Kaufmännischer Angestellter in der Verwaltung
Berufs- und Schulausbildung
09/1997 ­ 02/2000
Ausbildung zum Kaufmann im Groß- und Außenhandel
1987 ­ 1997
Hilda-Gymnasium in Pforzheim
Abschluss: Allgemeine Hochschulreife
1983 ­ 1987
Grundschule in Pforzheim
Besondere Kenntnisse
Sprachen Kroatisch
verhandlungssicher
Englisch gut
Französisch
Schulkenntnisse
EDV
MS Office Anwendungen (Word, Excel, Access, Powerpoint)
EDIFACT
­
Bestellsysteme

2
Danksagung
Ich bedanke mich bei allen Mitarbeitern der Firma Emil Ratz GmbH, die für Fragen
meinerseits immer Verständnis zeigten.
Mein besonderer Dank gilt der Geschäftsleitung, Herrn Hanns Peter Kirschler, der die
Firma Zentric GmbH&Co.KG beauftragte Instant OLAP für die Zeit meiner Diplomarbei
t
bei der Emil Ratz GmbH zu implementieren.
Danke auch an Herrn Andreas Bognar, Ausbildungsleiter der Emil Ratz GmbH, der mich
während meiner Ausbildungszeit und meines Studiums unterstützte.
Mein Dank geht auch an Herrn Michael Pfurtscheller, Geschäftsführer und alle Mitarbeiter
der Zentric GmbH&Co.KG in Bad Vielbel, für den informativen Workshop.
Vielen Dank auch meinem Betreuer Herrn Prof. Dr. Matthias Rehme, der mich während
der Diplomarbeit unterstützt hat.
Mein Dank geht auch an meine Familie und besonders an Ina Franzke, die mir neuen Mut
gab die Arbeit zu bewältigen.
Arsen Cvija
Pforzheim, 24. April 2003

3
Inhaltsverzeichnis
Abkürzungsverzeichnis... 6
Abbildungsverzeichnis... 7
1. Einführung
... 8
1.1 Einleitung... 8
1.2 Problemstellung... 8
1.3 Vorgehensweise und Zielsetzung... 9
2. OLAP-Bestandteil von Business Intelligence
... 11
2.1 Begriffliche Einordnung von OLAP in die Business Intelligence... 11
2.2 Einsatzbereiche für Business Intelligence... 11
2.2.1 Knowledge Discovery in Databases und Data Mining... 11
2.2.2 Data Warehousing und OLAP... 13
3. Grundlegende Aspekte von OLAP
... 16
3.1 Definition von OLAP... 16
3.2 Historische Entwicklung von OLAP... 16
3.3 Die 12 OLAP-Grundregeln von Edgar F. Codd... 17
3.4 Die FASMI-Definition von Pendse und Creeth... 19
3.5 Diverse Ausprägungen von OLAP-Datenbanken... 19
3.5.1 MOLAP ­ Multidimensionales OLAP... 20
3.5.2 ROLAP ­ Relationales OLAP... 20
3.5.3 HOLAP ­ Hybrides OLAP... 21
3.6 Abgrenzung und Synergien zwischen OLAP und OLTP-Systemen... 21
4.
Implementierung des Analysewerkzeugs Instant OLAP
bei der Emil Ratz GmbH
... 22
4.1 Vorstellung von Instant OLAP... 22
4.1.1 Die Instant OLAP Idee... 22
4.1.2 Frontend... 24
4.1.3 Zugriffsschutz und User-Management... 25

4
4.2 Aufbau des multidimensionalen OLAP-Modells
... 25
4.2.1 Vorbemerkung... 25
4.2.2 Das multidimensionale Modell... 26
4.2.2.1 Unterscheidung zwischen Struktur- und Bewegungsdaten... 27
4.2.2.2 Definition der Dimensionen... 28
4.2.2.3 Bildung von Hierarchien... 29
4.2.2.4 Die Fakten-/Dimensionstabelle... 31
4.2.2.5 Bestimmung von Kennzahlen... 32
4.2.3 Der Datenimport... 33
4.2.4 Mögliche Fehlerquellen... 33
5.
Instant OLAP als Analysewerkzeug für die individuelle
Kundenansprache
...34
5.1 Vorbemerkung... 34
5.2 Navigation als Analysemethode
... 36
5.2.1 Data Slicing... 36
5.2.2 Data Dicing/Pivoting... 37
5.2.3 Drill down/Roll up... 38
5.2.4 Drill through/Drill across... 40
5.3 Darstellungs- und Auswertungsformen der Berichte
... 41
5.3.1 Hitlisten... 41
5.3.2 Vergleichslisten... 42
5.3.3 Ampelfunktion... 43
5.3.4 Weitere Darstellungsformen ... 43
5.3.5 Integration multimedialer Elemente... 44
5.4 Marketing-Analysen durch OLAP
... 45
5.4.1 ABC-Analysen ... 45
5.4.2 Portfolio-Analysen... 47
5.4.3 Ad-hoc Analysen... 49
5.4.4 Warenkorbanalysen und Cross-/ Up- Selling Potentiale... 50
6. Schlussbetrachtung und Ausblick
...51

5
Anhang
... 52
Glossar
... 63
Quellenverzeichnis
... 68

6
Abkürzungsverzeichnis
BI
Business
Intelligence
DOLAP
Desktop Online Analytical Processing
DSS
Decision
Support
Systems
DW
Data
Warehouse
EIS
Executive
Information
Systems
FASMI
Fast Analysis of Shared Multidimensional Information
HOLAP
Hybrides Online Analytical Processing
KDD
Knowledge
Discovery
in
Databases
MIS
Management
Information
Systems
MOLAP
Multidimensionales Online Analytical Processing
OLAP
Online
Analytical
Processing
OLTP
Online
Transaction
Processing
RDBMS
Relationale Datenbank Management Systeme
ROLAP
Relationales Online Analytical Processing
SGE
Strategische
Geschäftseinheiten
SQL
Structured
query
language

7
Abbildungsverzeichnis
Abb. 1:
Prozess des Knowledge Discovery in Databases (KDD)
... 12
Abb. 2:
Einordnung von OLAP in das Data-Warehouse Konzept
... 14
Abb. 3:
Drei-Tier-Architektur bei Instant OLAP
... 24
Abb. 4:
Multidimensionales Modell bei der Emil Ratz GmbH
... 27
Abb. 5:
Hierarchien der Dimension ,,Alle Artikel" bei der Emil Ratz GmbH
... 30
Abb. 6:
Snowflake-Schema der Emil Ratz GmbH
... 32
Abb. 7:
Data-Slicing ­ verschiedene Sichten auf den Datenbestand
... 37
Abb. 8:
Data-Dicing/Pivoting
... 38
Abb. 9:
,,Drill-Down" und ,,Roll-Up" Funktion
... 39
Abb. 10:
OLAP ­ Analysetechniken
... 40
Abb. 11:
Bericht mit integrierter Hitliste, 4-Wochen-Vergleichsliste und Ampelfunktion
..42
Abb. 12:
Beispiel für eine Zeitreihe
...44
Abb. 13:
Beispiel einer ABC-Einteilung der Kunden
...46
Abb. 14:
Beispiel eines idealen Kunden-Portfolio
...48

8
1 Einführung
1.1 Einleitung
Unternehmen versuchen seit den 60er Jahren das Management mit Hilfe analytischer
Informationssysteme bei der Entscheidungsfindung zu unterstützen. Schlagworte wie
Management Information Systems (MIS), Decision Support Systems (DSS) und Executive
Information Systems (EIS) sind Synonyme für den mäßigen Erfolg, den die Anbieter
bislang in diesem Markt erlangen konnten. Heutzutage werden mit Data Warehouse,
OLAP (Online Analytical Processing) und Data Mining neue, erfolgsversprechende
Ansätze zum Aufbau analytischer Informationssysteme unternommen.
1)
Um die Führungsaufgaben des Managements bewältigen zu können, sind
Unternehmensdaten in aufbereiteter Form notwendig. Ein standardisiertes, periodisches
Berichtswesen bildet oftmals die Grundlage der Informationsversorgung des
Managements. Zum Aufdecken von Trends oder bei Abweichungen von den Soll-Zahlen
reicht dieses Berichtssystem nicht aus. OLAP-Werkzeuge stellen dem Anwender ein
geeignetes Analyse-Instrument zur Verfügung, um die Unternehmensdaten flexibel und
schnell auswerten zu können. Grundlage der OLAP-Systeme ist eine multidimensionale
Sichtweise auf die Daten, die der Sicht des Managers eher entspricht als ein
zweidimensionales Modell, das den operativen Systemen (OLTP-Systeme) meist
zugrunde liegt.
2)
1.2 Problemstellung
Heutzutage wird es für Unternehmen immer wichtiger, in kürzester Zeit die richtigen
Informationen zu erhalten, um Entscheidungsprozesse optimal gestalten zu können.
3)
Auf der Suche nach neuen Wettbewerbsvorteilen nutzen Entscheidungsträger immer
häufiger die Informationstechnologie. Sie dient nicht mehr nur der Sammlung und dem
Austausch von Daten, sondern in verstärktem Maße auch der systematischen und
schnellen Beschaffung, Verwaltung, Bereitstellung, Analyse und Interpretation von
Informationen. Information ist somit im Zeitalter der Wissensgesellschaft als ,,die
unternehmerische Ressource schlechthin" anzusehen. Der Produktionsfaktor
,,Information" hat sich längst zu einem strategischen Erfolgsfaktor herausgebildet. Die
richtige Information, zur richtigen Zeit, am richtigen Ort ist entscheidend für erfolgreiches
unternehmerisches Handeln.
4)
1)
Vgl. Schinzer, H./Bange, C., (1998), S. 41
2)
Vgl. Schelp, J., (1998), S. 264
3)
Vgl. Maser, A., (1995), S.435
4)
Vgl. Behme, W./Muksch, H., (2001), S. 5

9
Ein Informationsdefizit in Unternehmen kann durch OLAP-Werkzeuge kompensiert
werden. Dieses spezielle Analysewerkzeug dient der entscheidungsorientierten
Modellierung und Auswertung relevanter Informationen für das Marketing.
1)
Die Emil Ratz GmbH verfügt zur Zeit über kein geeignetes Analyse-Werkzeug. Die
Erstellung von Berichten oder Auswertungen in Listenform ist ein mühsamer und
zeitaufwendiger Prozess. Außerdem können die Berichte in keine anschauliche grafische
Darstellung übertragen werden. Nicht jeder Mitarbeiter ist in der Lage Berichte zu
erstellen, da überdurchschnittliche Kenntnisse in Access vorhanden sein müssen. Bei
vermehrter Anfrage der Führungsebene nach verschiedenen Berichten, ist die EDV-
Abteilung oft zu lange damit beschäftigt die Listen zu erstellen. Mit einem OLAP-Tool
könnte jeder berechtigte Anwender seine Auswertungen ohne Programmierungsaufwand
an seinem Bildschirmarbeitsplatz selbst erstellen.
Aus diesen Gründen implementierte die Firma Zentric GmbH & Co.KG aus Bad Vielbel
beim Elektrogroßhandel Emil Ratz GmbH solch ein Analyse-Tool, genannt Instant
OLAP . Instant OLAP befindet sich zur Zeit bei der Emil Ratz GmbH in einer Testphase.
Deshalb sind im weiteren Verlauf und vor allem im Anhang die Anlagen nicht auf die
Firma Emil Ratz GmbH zugeschnitten, sondern sie wurden aus dem Instant OLAP Demo
Server entnommen. Instant OLAP wird an unsere Bedürfnisse angepasst in Hinblick auf
die Auswertungs- und Darstellungsmöglichkeiten der Berichte. Außerdem wird es auf
seine Eignung für spezielle Marketing-Analysen, beispielsweise Warenkorbanalysen,
Erkennen von Cross-/Up-Selling Potentialen, ABC-Analysen, Portfolio-Analysen und auf
die Früherkennung von drohenden Kundenverlusten hin untersucht.
Instant OLAP sollte auch in verschiedensten Bereichen der Unternehmung z.B. im
Vertriebscontrolling, Budgetierung oder der Planung, seine Anwendung finden. Auch
zukünftige Entwicklungen wie die Integration von Data-Mining Funktionen in das Instant
OLAP-Tool werden für den unternehmerischen Entscheidungsprozess eine immer
größere Rolle spielen, da wie bereits erwähnt der Produktionsfaktor ,,Information" von
großer Bedeutung ist.
1.3 Vorgehensweise und Zielsetzung
Nach einer kurzen Einführung folgt die begriffliche Einordnung von OLAP als Bestandteil
der Business Intelligence. Zusätzlich werden verschiedenste Einsatzbereiche für
Business Intelligence Lösungen dargestellt, um einen kurzen Überblick zu erhalten auf
welchem Spielfeld sich OLAP bewegt.
Anschließend werden die grundlegenden Aspekte von OLAP ausführlicher erläutert.
Zentral werden hier die Grundregeln für OLAP-Datenbanken von Edgar F. Codd, die
1)
Vgl. Schinzer, H./Bange, C., (1998), S. 41

10
FASMI-Definition von Pendse und Creeth behandelt. Desweiteren werden die
verschiedenen Ausprägungen von OLAP-Datenbanken beleuchtet, die das gesamte
Spektrum der Möglichkeiten der Datenspeicherung widerspiegeln. Unterschiede und
Synergien zwischen OLAP- und OLTP-Systemen werden in diesem Teil abschließend
dargestellt.
Der Hauptteil besteht aus zwei Teilen, und zwar aus der Implementierung und der
Verwendung des Analysewerkzeugs Instant OLAP für die persönliche
Kundenansprache bei der Emil Ratz GmbH. Zuerst wird das Instant OLAP-Tool kurz
vorgestellt. Daraufhin werden die einzelnen Schritte zum Aufbau eines
multidimensionalen OLAP-System dargestellt. Nachdem das multidimensionale Modell
durch die verschiedenen Dimensionen, Hierarchien und auszuwertenden Kennzahlen
beschrieben ist, kann mit der Anbindung relationaler Datenquellen an das Modell
begonnen werden. Auftretende mögliche Fehlerquellen bei der Einspielung der Daten in
das Modell werden auch erwähnt.
Im Anschluss an die Implementierung werden die Möglichkeiten von Instant OLAP als
geeignetes Analysewerkzeug für die individuelle Kundenansprache dargestellt.
Möglichkeiten der Navigation als Analysemethode (Data-Slicing/-Dicing, Roll-up, Drill-
down...) durch den Datenbestand werden aufgezeigt, die es den Entscheidungsträgern
ermöglichen einen Kunden oder Artikel aus mehreren Perspektiven zu betrachten. Auf die
Vielzahl der Darstellungs- und Auswertungsmöglichkeiten der Berichte wird
eingehend eingegangen, da durch die Art der diversen Berichte entscheidungsorientierte
Abfragen visuell dargestellt werden können. Desweiteren wird untersucht inwieweit sich
OLAP für Marketing-Analysen, beispielsweise zur Bildung von Kundenprofilen,
Erkennung von Cross-/Up-Selling Potentialen, Warenkorbanalysen, Ad-hoc-Analysen
eignet. In einer kurzen Schlussbetrachtung werden zusätzlich zukünftige Entwicklungen
von OLAP-Systemen erwähnt.
Die Zielsetzung der Arbeit beschränkt sich auf folgende einfache Fragen, die durch
Instant OLAP beantwortet werden können:
Was wäre beispielsweise wenn man mehr über die Bedürfnisse und das Kaufverhalten
seiner Kunden und deren messbaren Wert für das eigene Unternehmen wüsste?
Wenn vorhergesagt werden könnte, welche Produkte häufig zusammen gekauft werden,
um somit erfolgsversprechende Produktkombinationen anbieten zu können?
Wenn diejenigen Kunden frühzeitig identifiziert werden könnten, die mit hoher
Wahrscheinlichkeit zum Mitbewerber wechseln werden?
Solche und ähnliche Fragestellungen können durch Instant OLAP per Mausklick
beantwortet werden. Sie werden im fünften Teil der Arbeit eingehend behandelt.

11
2 OLAP ­ Bestandteil von Business Intelligence
2.1 Begriffliche Einordnung von OLAP in die Business Intelligence
Das Begriffsgebilde Business Intelligence (BI) wird derzeit häufig strapaziert,
wenngleich hierzu keine allgemein anerkannte Definition existiert und die
Begriffsverwendung entsprechend uneinheitlich erfolgt. Einigkeit dagegen besteht darin,
dass sich hinter Business Intelligence kein neues Produkt oder Konzept verbirgt, sondern
es sich um eine Vielzahl unterschiedlicher Ansätze zur Analyse geschäftsrelevanter Daten
handelt.
BI umspannt unter technologischen Gesichtspunkten eine Vielzahl unterschiedlicher
Werkzeuge und Konzepte. Alle diese Werkzeuge beinhalten einen
entscheidungsunterstützenden Charakter, der zur besseren Einsicht und zum besseren
Verständnis in das eigene Geschäft führt. Das Spektrum von Themen reicht von
Knowledge Discovery in Databases (KDD) bzw. Data Mining über Online Analytical
Processing (OLAP) und Knowledge Management bis hin zum analytischen Customer
Relationship Management. Die beiden zuletzt genannten Themen werden in den
folgenden Ausführungen außer Acht gelassen. In folgendem Gliederungspunkt werden
die einzelnen Einsatzbereiche und Themen des Business Intelligence, bis auf die beiden
erwähnten Ausnahmen, vertiefend aufgegriffen.
1)
2.2 Einsatzbereiche für Business Intelligence
2.2.1 Knowledge Discovery in Databases und Data Mining
Viele Unternehmen besitzen heutzutage eine große Menge geschäftsrelevanter Daten in
eigenen Datenbanken. Diese entstehen durch eine Vielzahl von Einzeltransaktionen.
Aufgrund der großen Datenfülle ist der Versuch, mit Hilfe der transaktionsorientierten
Systeme (OLTP-Systeme) relevante Muster oder Zusammenhänge in Daten zu suchen,
zum Scheitern verurteilt. Bei einer geeigneten Strukturierung und Aufbereitung dieser
Rohdaten, kann davon ausgegangen werden, dass viel Wissenswertes über das eigene
Geschäft erfahren werden kann.
Aus diesem Grund kommt das Konzept des Knowledge Discovery in Databases (KDD)
zum Einsatz. Dieses Konzept ist darauf ausgerichtet in umfangreichen Datenbeständen
implizit (indirekt) vorhandenes Wissen zu entdecken und explizit (direkt) zu machen, d.h.
aus Rohdaten neues und gültiges Wissen abzuleiten. So ist es beispielsweise im Handel
möglich, auf der Grundlage von Transaktionsdaten komplementäre Beziehungen
zwischen einzelnen Artikeln zu erkennen. Komplementäre Artikelbeziehungen spiegeln
das Einkaufsverhalten eines Kunden wieder. Die Ermittlung solcher Artikelbeziehungen
1)
Vgl. Gluchowski, P., (2001), S. 5ff

12
ermöglicht die Festlegung von Maßnahmen, die zur Erhöhung der Kundenbindung
beitragen.
1)
Das Erkennen von Cross-/Up-Selling Potentialen, Warenkorbanalysen und die
daraus entstehenden personalisierten Angebote sind solche Maßnahmen, auf die an
späterer Stelle vertieft eingegangen wird.
Das Vorgehen um Wissen in umfangreichen Datenbanken zu entdecken ist durch
folgenden mehrere Phasen umfassenden KDD-Prozess dargestellt.
A
A
u
u
s
s
w
w
a
a
h
h
l
l
A
A
u
u
f
f
b
b
e
e
r
r
e
e
i
i
t
t
u
u
n
n
g
g
F
F
e
e
s
s
t
t
l
l
e
e
g
g
u
u
n
n
g
g
A
A
n
n
a
a
l
l
y
y
s
s
e
e
D
D
a
a
t
t
a
a
M
M
i
i
n
n
i
i
n
n
g
g
I
I
n
n
t
t
e
e
r
r
p
p
r
r
e
e
t
t
a
a
t
t
i
i
o
o
n
n
u
u
n
n
d
d
E
E
v
v
a
a
l
l
u
u
a
a
t
t
i
i
o
o
n
n
Iterativer Prozessablauf
Abb. 1: Prozess des Knowledge Discovery in Databases (KDD)
2)
Dieser Prozess beginnt, wie in Abbildung 1 verdeutlicht, mit der Auswahl des
Datenbestandes. Dieser ist in erster Linie durch die Zielsetzung der Wissensentdeckung
bestimmt. Die Aufbereitung der Daten ist darauf ausgerichtet, die Qualität des
ausgewählten Datenbestandes derart zu verbessern, dass nachfolgende Analysen
ermöglicht werden können. Dazu gehört die Verbesserung der Datenqualität durch
Ergänzung fehlender Werte oder Beseitigung von Redundanzen
3)
. Im Rahmen der
Festlegung erfolgt eine Bestimmung der zu benutzenden Analyseverfahren. Hier wird
versucht durch eine Transformation der Daten die Anzahl der für die Entdeckung von
Wissen relevanten Merkmale zu reduzieren. Aufbauend auf diesen Entscheidungen
werden bei der Analyse des Datenbestandes Beziehungsmuster in der vorliegenden
Datenbasis ermittelt. Aus den ermittelten Beziehungen in den Daten wird schließlich durch
Interpretation und Evaluation explizites Wissen abgeleitet. Ein weiteres Merkmal dieses
Prozesses ist der iterative Prozessablauf. Dies bedeutet, dass ausgehend von einer
Phase die unmittelbar vorausgehende Prozessphase erneut durchlaufen werden kann.
Eine ständige Verbesserung der Datenqualität ist dadurch gewährleistet.
4)
Die Analyse ist als zentrale Phase bei diesem idealtypischen KDD-Durchlaufs zu
verstehen, da hier die interessanten Muster aus dem Datenbestand extrahiert und
1)
Vgl. Düsing, R., (1998), S. 292f
2)
Düsing, R., (2000), S. 75
3)
Redundanz bedeutet Dubletten, Doppelspeicherungen
4)
Vgl. Düsing, R., (1998), S. 294f

13
beschrieben werden. Diese Phase wird als Data Mining bezeichnet und lässt sich sehr
frei als ,,Datenmustererkennung" übersetzen.
1)
Somit ist Data Mining als ein Teilprozess
des KDD aufzufassen. Als Einsatzbereiche von Data Mining Anwendungen werden die
Klassifikation, das Clustern und das Aufdecken von Abhängigkeiten bezeichnet. Im
Rahmen der Klassifikation werden Informationsobjekte bestimmten, vordefinierten
Klassen zugeordnet. Ein Einsatzbereich dieser Art der Datenanalyse ist beispielsweise
bei Banken bei der Kreditvergabe und der Ermittlung von Risikokunden wiederzufinden.
Beim Clustern wird eine andere Zielsetzung verfolgt. Dabei wird der
Ausgangsdatenbestand auf der Grundlage eines Ähnlichkeitsmaßes in Klassen ähnlicher
Informationsobjekte eingeteilt, ohne dass dabei die Klassen vor der Analyse bereits
festliegen. Im Rahmen der Marktsegmentierung zum Beispiel wird der Gesamtmarkt nach
bestimmten Kriterien in homogene Käufergruppen bzw. Käufersegmente unterteilt, um
daraus gezielte kundenspezifische Marketing-Maßnahmen abzuleiten.
2)
Ein letzter Einsatzbereich für Data Mining ist das Entdecken von Abhängigkeiten im
Datenbestand. Ziel der Analyse ist es signifikante Korrelationen zwischen
unterschiedlichen Attributen zu ermitteln. Eine Beschreibung von Abhängigkeiten ist z.B.
für die Warenkorbanalyse von Bedeutung. Hierbei werden gemeinsame Abverkäufe unter-
schiedlicher Artikel aufgedeckt und dadurch wertvolle Erkenntnisse für die
Angebotsstruktur und Regalgestaltung geliefert. Als ein wesentlicher Erfolgsfaktor von
Datenanalysen im Rahmen von Data Mining und KDD ist die Existenz eines
aufbereiteten Datenbestandes. Das Vorhandensein eines Data Warehouses kann sich
hierbei als sehr nützlich erweisen.
3)
Im folgendem Gliederungspunkt wird vertieft auf die
Konzeption des Data Warehouse und des darauf basierenden Analysewerkzeugs OLAP
eingegangen.
2.2.2 Data Warehousing und OLAP
Unter einem Data Warehouse (DW) ist eine Systemlösung zu verstehen, mit dem Ziel,
eine unternehmensweite, dauerhafte Versorgung mit benötigten Informationen zu
gewährleisten. Das Data Warehouse Konzept sieht eine separate Speicherung analyse-
relevanter Daten vor. Die Inhalte des DW werden aus den operativen Vorsystemen
4)
übernommen oder extrahiert, um Daten aus externen Quellen
5)
ergänzt und in der
separaten DW-Datenbank getrennt von dem operativen Datenbestand gehalten.
6)
Die
Schnittstellen zu den operativen Vorsystemen und den externen Datenquellen, stellen die
Extraktions-, Transformations- und Ladeprogramme (ETL-Programme oder Middleware-
1)
Vgl. Gluchowski, P., (2001), S. 9
2)
Vgl. Düsing, R., (1998), S. 296f
3)
Vgl. Gluchowski, P., (2001), S. 10
4)
z.B. Warenwirtschaftssysteme, Rechnungswesen
5)
z.B. Online Datenbanken, Online Dienste, World Wide Web (WWW)
6)
Vgl. Müller, J., (1998), S. 80

14
Programme) dar. Somit wird ein DW konsequent getrennt von den operativen
Vorsystemen aufgebaut und betrieben. Dadurch lässt sich eine konsistente
unternehmensweite Datenbasis aufbauen, in die selektierte und verdichtete Informationen
einfließen können.
1)
Bei großen Data-Warehouse Datenbanken erweisen sich die Auswertungen als sehr
zeitaufwendig und unflexibel. Aus diesem Grunde wird das DW, zur Steigerung der
Performance und der besseren Überschaubarkeit, in kleinere Einheiten, die Data Marts,
zerlegt.
2)
Data Marts sind dementsprechend Extrakte oder echte Teilmengen des Data-
Warehouses, die separat gespeichert werden. Somit sind Data Marts Komponeneten die
auf einem Data Warehouse aufsetzen und entsprechend der Konzeption des Online
Analytical Processing genutzt werden.
3)
Dieser wichtige Zusammenhang zwischen
einem DW und einem OLAP-System wird in der folgenden Abbildung 2 verdeutlicht.
F
F
r
r
o
o
n
n
t
t
-
-
E
E
n
n
d
d
-
-
B
B
e
e
n
n
u
u
t
t
z
z
e
e
r
r
o
o
b
b
e
e
r
r
f
f
l
l
ä
ä
c
c
h
h
e
e
W
W
e
e
r
r
k
k
z
z
e
e
u
u
g
g
e
e
A
A
d
d
-
-
h
h
o
o
c
c
A
A
b
b
f
f
r
r
a
a
g
g
e
e
n
n
D
D
i
i
a
a
g
g
r
r
a
a
m
m
m
m
e
e
A
A
n
n
a
a
l
l
y
y
s
s
e
e
n
n
B
B
e
e
r
r
i
i
c
c
h
h
t
t
e
e
E
E
x
x
t
t
r
r
a
a
k
k
t
t
e
e
U
U
p
p
d
d
a
a
t
t
e
e
s
s
Data Marts
(OLAP)
Zentrales Data Warehouse
ETL-Komponente (Schnittstelle)
Externe Daten
Operative
Vorsysteme
Abb. 2: Einordnung von OLAP in das Data-Warehouse Konzept
4)
1)
Vgl. Gluchowski, P., (2001), S. 10
2)
Vgl. Behme, W./Muksch, H., (2001), S. 20
3)
Vgl. Reinke, H./Stockmann, M./Stockmann, R., (2001), S. 290
4)
Mit Änderungen übernommen: Gluchowski, P., (2001), S.10 ; vgl. hierzu auch Chamoni, P.
(1998), S. 238 ; Behme, W./Muksch, H., (2001), S. 20

Details

Seiten
Erscheinungsform
Originalausgabe
Jahr
2003
ISBN (eBook)
9783832483845
ISBN (Paperback)
9783838683843
DOI
10.3239/9783832483845
Dateigröße
1.2 MB
Sprache
Deutsch
Institution / Hochschule
Duale Hochschule Baden-Württemberg, Stuttgart, früher: Berufsakademie Stuttgart – Wirtschaft
Erscheinungsdatum
2004 (November)
Note
1,0
Schlagworte
business intelligence database marketing data mining portfolio-analyse warenkorbanalyse
Zurück

Titel: OLAP (Online Analytical Processing) - Implementierung des Analysewerkzeugs
book preview page numper 1
book preview page numper 2
book preview page numper 3
book preview page numper 4
book preview page numper 5
book preview page numper 6
book preview page numper 7
book preview page numper 8
book preview page numper 9
book preview page numper 10
book preview page numper 11
book preview page numper 12
book preview page numper 13
book preview page numper 14
book preview page numper 15
book preview page numper 16
76 Seiten
Cookie-Einstellungen