Lade Inhalt...

Statistische Methoden des Data Mining und deren Anwendung

Diplomarbeit 2003 111 Seiten

Informatik - Allgemeines

Zusammenfassung

Inhaltsangabe:Zusammenfassung:
In dieser Arbeit stehen neben dem Begriff des „Data Mining“ besonders die statistischen Methoden im Mittelpunkt. Interessenten sollen den kreativen Prozess des Data Mining näher kennen lernen und erfahren, welche Rolle dabei der Statistik zukommt.
Das Ziel der Arbeit ist, eine weiterreichende Darstellung des Prozesses des Data Mining mit statistischen Methoden zu erstellen, angefangen bei der Zielfindung, über die Modellbildung, bis hin zur Bewertung der Ergebnisse. Dabei orientiert sich die Vorgehensweise der systematischen Auswertung an der Methode des CRoss Industry Standard Process for Data Mining, mit der sich Data Mining Prozesse beschreiben lassen. Zum besseren Verständnis werden grundlegende Begriffe zum Data Mining sowie die bedeutsamsten Methoden und Verfahren zur statistischen Datenanalyse erläutert, welche bei den im Anschluss aufgezeigten Data Mining Problemen zur Anwendung kommen.
Die veranschaulichten Analyseprobleme entsprechen den Aufgaben der Data Mining Cups der Jahre 2001 und 2002. Dabei werden die zur Lösung angewendeten statistischen Methoden nachvollziehbar wiedergegeben und es wird auf die kritischen Erfolgsfaktoren eingegangen. Oftmals wirken sich schon einzelne Teilentscheidungen bei der Datenaufbereitung und bei den eingesetzten Klassifizierungsmethoden auf die Lösung der Data Mining Aufgabe aus. Daher stellte sich die Frage, wie solche Abweichungen von den aufgezeigten Methoden aussehen könnten. In dieser Arbeit werden im Einzelnen verschiedene Abwandlungen durchgeführt, am Ende zusammengefasst und diskutiert.


Inhaltsverzeichnis:Inhaltsverzeichnis:
Abbildungsverzeichnis6
Tabellenverzeichnis7
1.Einleitung9
1.1Problemstellung10
1.2Ziel der Arbeit11
1.3Themenabgrenzung12
2.Der Data Mining Prozess im CRISP-DM Referenzmodell14
2.1Das CRISP-DM Referenzmodell14
2.2Die Phasen des CRISP-DM Referenzmodells15
2.2.1business understanding (Anwendungsverstehen)15
2.2.2data understanding (Datenverstehen)16
2.2.3data preparation (Datenaufbereitung)16
2.2.4modeling (Modellerstellung)17
2.2.5evaluation (Bewertung der Ergebnisse)18
2.2.6deployment (Anwendung)19
3.Grundlegende Begriffe20
3.1Die Statistik im Data Mining Prozess20
3.2Segmentierung und Klassifikation22
3.2.1Begriff der Segmentierung22
3.2.2Begriff der Klassifikation22
3.3Standardisierung23
3.4Maße für die Ähnlichkeit von Objekten24
4.Methoden der statistischen […]

Details

Seiten
111
Erscheinungsform
Originalausgabe
Jahr
2003
ISBN (eBook)
9783832479633
ISBN (Buch)
9783838679631
Dateigröße
1 MB
Sprache
Deutsch
Katalognummer
v223203
Institution / Hochschule
Hochschule für angewandte Wissenschaften Anhalt in Köthen – Informatik
Note
1,3
Schlagworte
datenanalyse knowledge discovery regression modellierung modellbildung

Autor

Teilen

Zurück

Titel: Statistische Methoden des Data Mining und deren Anwendung