Datenanalyse mit Modellen für Cluster linearer Regression
©1997
Doktorarbeit / Dissertation
186 Seiten
Zusammenfassung
Inhaltsangabe:Einleitung:
In dieser Arbeit geht es um die Analyse von Daten, in denen Cluster linearer Regression erwartet werden können. Ein "Cluster linearer Regression" ist ein Teildatensatz, der sich von den übrigen Daten unterscheidet in Hinsicht auf den Zusammenhang zwischen einer oder mehreren Einflußgrößen und einer abhängigen Variablen. Dieser Zusammenhang wird pro Gruppe als linear vorausgesetzt ("lineare Regression").
Es werden mehrere Verfahren analysiert, um solche Gruppen zu finden. Mit der "Fixpunktcluster-Analyse" wird ein neues Verfahren vorgestellt und mit Hilfe von statistischer Theorie und Simulations-Studien untersucht. Es hat gegenüber den "klassischen" Verfahren den Vorteil, dass Fixpunktcluster unempfindlich gegenüber Veränderungen in "entfernten" Teilen der Daten (z.B. Ausreißer) sind. Das Verfahren lässt sich auch auf andere Probleme der Clusteranalyse übertragen.
Inhaltsverzeichnis:Inhaltsverzeichnis:
Inhaltsverzeichnis4
English abstract 3
1.Einführung7
1.1Das Problem 7
1.2Modelle für die Clusteranalyse (Teil I) 9
1.3Exkurs: Angemessenheit von Modellen 10
1.4Fixpunktcluster (Teil II und III) 12
1.5Vergleich der Verfahren (Teil IV) 13
1.6Formale und stilistische Bemerkungen 14
1.7Bezeichnungen 15
I.Mischungen linearer Regressionen17
2.Modellierung17
3.Ansätze zur Analyse der Modelle22
3.1Wechselpunktprobleme 22
3.2Kleinste Quadrate 23
3.3Parameterschätzung im Mischmodell 24
3.4Parameterschätzung im Fixed Partition Model 28
3.5Alternative Ansätze 30
3.5.1Robuste Regression 30
3.5.2Schwache Hierarchien 33
4.Einführung: Identifizierbarkeit 34
5.Beispiele für Nicht-Identfizierbarkeit 38
6.Identifizierbarkeitsresultate 43
II.Fixpunktcluster 54
7.Einführung: Fixpunktcluster 54
7.1Cluster und Ausreißer: Die allgemeine Fixpunktcluster-Idee 54
7.2Beispiel: Fixpunktcluster für 0-1-Vektoren 60
7.3Fixpunktcluster und die Selbstorganisation der Wahrnehmung 62
8.Fixpunktcluster im Regressionsfall63
8.1Regressions-Fixpunktclusterindikatoren 63
8.2Regressions-Fixpunktclustervektoren 65
9.Berechnung von KQ-Fixpunktclustervektoren67
10.Analyse von Beispieldatensätzen73
10.1Telefondaten 74
10.2Artifizieller Datensatz 76
III.Fixpunktclusterindikatoren in speziellen Modellen81
11.Hilfsresultate81
11.1Eigenschaften der Fixpunktcluster-Parameterfunktion 81
11.2Abgeschnittene Normalverteilungen 84
12.Fixpunktclusterindikatoren in homogenen Modellen91
13.Fixpunktclusterindikatoren in […]
In dieser Arbeit geht es um die Analyse von Daten, in denen Cluster linearer Regression erwartet werden können. Ein "Cluster linearer Regression" ist ein Teildatensatz, der sich von den übrigen Daten unterscheidet in Hinsicht auf den Zusammenhang zwischen einer oder mehreren Einflußgrößen und einer abhängigen Variablen. Dieser Zusammenhang wird pro Gruppe als linear vorausgesetzt ("lineare Regression").
Es werden mehrere Verfahren analysiert, um solche Gruppen zu finden. Mit der "Fixpunktcluster-Analyse" wird ein neues Verfahren vorgestellt und mit Hilfe von statistischer Theorie und Simulations-Studien untersucht. Es hat gegenüber den "klassischen" Verfahren den Vorteil, dass Fixpunktcluster unempfindlich gegenüber Veränderungen in "entfernten" Teilen der Daten (z.B. Ausreißer) sind. Das Verfahren lässt sich auch auf andere Probleme der Clusteranalyse übertragen.
Inhaltsverzeichnis:Inhaltsverzeichnis:
Inhaltsverzeichnis4
English abstract 3
1.Einführung7
1.1Das Problem 7
1.2Modelle für die Clusteranalyse (Teil I) 9
1.3Exkurs: Angemessenheit von Modellen 10
1.4Fixpunktcluster (Teil II und III) 12
1.5Vergleich der Verfahren (Teil IV) 13
1.6Formale und stilistische Bemerkungen 14
1.7Bezeichnungen 15
I.Mischungen linearer Regressionen17
2.Modellierung17
3.Ansätze zur Analyse der Modelle22
3.1Wechselpunktprobleme 22
3.2Kleinste Quadrate 23
3.3Parameterschätzung im Mischmodell 24
3.4Parameterschätzung im Fixed Partition Model 28
3.5Alternative Ansätze 30
3.5.1Robuste Regression 30
3.5.2Schwache Hierarchien 33
4.Einführung: Identifizierbarkeit 34
5.Beispiele für Nicht-Identfizierbarkeit 38
6.Identifizierbarkeitsresultate 43
II.Fixpunktcluster 54
7.Einführung: Fixpunktcluster 54
7.1Cluster und Ausreißer: Die allgemeine Fixpunktcluster-Idee 54
7.2Beispiel: Fixpunktcluster für 0-1-Vektoren 60
7.3Fixpunktcluster und die Selbstorganisation der Wahrnehmung 62
8.Fixpunktcluster im Regressionsfall63
8.1Regressions-Fixpunktclusterindikatoren 63
8.2Regressions-Fixpunktclustervektoren 65
9.Berechnung von KQ-Fixpunktclustervektoren67
10.Analyse von Beispieldatensätzen73
10.1Telefondaten 74
10.2Artifizieller Datensatz 76
III.Fixpunktclusterindikatoren in speziellen Modellen81
11.Hilfsresultate81
11.1Eigenschaften der Fixpunktcluster-Parameterfunktion 81
11.2Abgeschnittene Normalverteilungen 84
12.Fixpunktclusterindikatoren in homogenen Modellen91
13.Fixpunktclusterindikatoren in […]
Leseprobe
Inhaltsverzeichnis
Details
- Seiten
- Erscheinungsform
- Originalausgabe
- Erscheinungsjahr
- 1997
- ISBN (eBook)
- 9783832421571
- ISBN (Paperback)
- 9783838621579
- DOI
- 10.3239/9783832421571
- Dateigröße
- 1.4 MB
- Sprache
- Deutsch
- Institution / Hochschule
- Universität Hamburg – Unbekannt
- Erscheinungsdatum
- 2000 (Februar)
- Note
- 1,0
- Schlagworte
- ausreißererkennung statistik simulationen clusteranalyse