TY - BOOK AU - Stephan Hagemann PY - 2007 CY - Hamburg, Deutschland PB - Diplom.de SN - 9783836607186 TI - Maßzahlen für die Assoziationsanalyse im Data Mining T2 - Fundierung, Analyse und Test DO - 10.3239/9783836607186 UR - https://m.diplom.de/document/228862 N2 - Inhaltsangabe:Einleitung: Measurement does not necessarily mean progress. Failing the possibility of measuring that which you desire, the lust for measurement may, for example, merely result in your measuring something else - and perhaps forgetting the difference - or in your ignoring some things because they cannot be measured. (George Udny Yule in einem Brief an Maurice Kendall). Problemstellung: Die Assoziationsanalyse ist innerhalb des Knowledge Discovery in Databases (KDD) eine sehr populäre Methode zur Gewinnung von Wissen aus großen Datenmengen. Ein wesentlicher Grundstein für dieses Werkzeug wurde mit der Einführung der Warenkorbanalyse im Jahre 1993 durch Agrawal et al. gelegt. Seit dem haben sich eine Fülle von Veröffentlichungen mit ihrer Erweiterung, Verbesserung und änderung befasst. Die Intention der Assoziationsanalyse ist die Gewinnung von Regeln zwischen den Attributen von Objekten, wobei die Akzeptanz einer Regel bedeutet, dass das Auftreten der Konsequenz einer Regel stark vom Auftreten der Vorbedingung abhängig ist, diese beiden also stark assoziiert sind. Die Menge potentieller Regeln, die für ein Objekt gebildet werden können, wächst exponentiell mit der Anzahl der Attribute dieses Objekts. Um diese Zahl zu reduzieren, werden den Regeln verschiedene Arten von Restriktionen auferlegt. Im Zentrum der Frage der Akzeptanz einer Regel steht die Bewertung ihrer Stärke oder auch confidence, welche als die bedingte Wahrscheinlichkeit der Konsequenz unter der Vorbedingung definiert ist. Dieses Maß als Aussage über die überzeugung in die Stärke einer Regel stand und steht in der Literatur unter viel Kritik, da es auch einige Fälle von approximativer stochastischer Unabhängigkeit als stark abhängig bewertet und als Regeln akzeptiert, was als irreführend empfunden wird. Viele Beiträge in der Literatur befassen sich mit diesem Problem und schlagen verschiedene Lösungen vor. In einigen Arbeiten werden nachgelagerte Verarbeitungsschritte untersucht, die z. B. mit Hilfe statistischer Verfahren versuchen, aus der Menge der akzeptierten Regeln diejenigen zu eliminieren, die keine Abhängigkeit darstellen. Außerdem werden Zusammenfassungen, Gruppierungen und Visualisierungen untersucht, die bei der Untersuchung der Regeln durch den Nutzer helfen sollen. In anderen Literaturbeiträgen sind alternative Maße zur Bestimmung der Stärke einer Regel entwickelt worden. Die Hoffnung ist, durch die Anwendung sinnvoller Maße die Akzeptanz von […] KW - data, mining, assoziationsanalyse, knowledge, discovery, databases, axiomatisierung, datenbanken LA - Deutsch ER -