Nichtstationarität und Einheitswurzeln in dynamischen Panelmodellen
©2007
Diplomarbeit
137 Seiten
Zusammenfassung
Inhaltsangabe:Einleitung:
Von zentraler Bedeutung bei der Untersuchung einer ökonomischen Zeitreihe ist die Frage, ob diese stationär ist, oder aber ob eine Instationarität der Daten gegeben ist. Diese Frage ist nicht nur von einem statistisch-theoretischen, sondern insbesondere auch ökonomischen Standpunkt heraus von großem Interesse.
Wird etwa die Stationarität einer univariaten, realen Wechselkursreihe getestet, bedeutet eine Ablehnung der Stationarität, dass reale Wechselkurse einem Random Walk folgen, was wiederum eine Ablehnung der Kaufkraftparitätentheorie nahelegt. Liegen hingegen Zeitreihenwerte für reale Wachstumsraten des BIP vor, bedeutet eine Instationarität im landesspezifischen Kontext eine Ablehnung der in der Neoklassik vertretenen Steady State-Hypothese und im internationalen Kontext eine Ablehnung der realen Konvergenz-Hypothese armer und reicher Volkswirtschaften.
So gehaltvoll diese Informationen sein mögen, so schwierig zu testen sind sie. Die Schwierigkeit besteht hierbei darin, dass die im Rahmen der univariaten ZRA entwickelten Testverfahren auf Einheitswurzeln eine zu geringe Mächtigkeit, bzw. Power aufweisen, als dass sie zwischen der Nullhypothese einer Instationarität, sowie der Alternativhypothese einer Stationarität unterscheiden könnten. Insbesondere gilt dies im Falle kurzer Zeitreihen.
Mögliche Abhilfe bietet die Untersuchung mehrerer Zeitreihen im Rahmen der Panelanalyse. Mit der Grundsteinlegung durch Quah, der einen ersten, primitiven Panel Unit Root (PUR)-Test vorschlägt, hat sich seitdem eine kaum zu überblickende Vielfalt an Testverfahren entwickelt, deren zentrales Anliegen die Erhöhung der im Rahmen der ZRA bemängelten, geringen Power von Einheitswurzeltests ist.
Aufgabe dieser Arbeit soll sein, einen Überblick wichtiger, gängiger, sowie erst kürzlich erschienener Testverfahren zu geben. Zwar soll kein Anspruch auf Vollständigkeit aller existierender Testverfahren erhoben werden. Doch soll versucht werden, die behandelten Tests sowohl in ihren Modellrahmen, -annahmen und formulierten Hypothesenpaaren, als auch Grenzverteilungen so detailliert wie nötig, so vollständig wie möglich zu behandeln.
In Anlehnung an Breitung, Pesaran, auf die ein guter Überblicksartikel gängiger PUR-Tests zurückgeht, scheint es nicht nur im Sinne der chronologisch richtigen Reihenfolge ratsam, diese Verfahren in solche der ersten und zweiten Generation zu unterteilen; es bestehen auch beträchtliche Unterschiede in den […]
Von zentraler Bedeutung bei der Untersuchung einer ökonomischen Zeitreihe ist die Frage, ob diese stationär ist, oder aber ob eine Instationarität der Daten gegeben ist. Diese Frage ist nicht nur von einem statistisch-theoretischen, sondern insbesondere auch ökonomischen Standpunkt heraus von großem Interesse.
Wird etwa die Stationarität einer univariaten, realen Wechselkursreihe getestet, bedeutet eine Ablehnung der Stationarität, dass reale Wechselkurse einem Random Walk folgen, was wiederum eine Ablehnung der Kaufkraftparitätentheorie nahelegt. Liegen hingegen Zeitreihenwerte für reale Wachstumsraten des BIP vor, bedeutet eine Instationarität im landesspezifischen Kontext eine Ablehnung der in der Neoklassik vertretenen Steady State-Hypothese und im internationalen Kontext eine Ablehnung der realen Konvergenz-Hypothese armer und reicher Volkswirtschaften.
So gehaltvoll diese Informationen sein mögen, so schwierig zu testen sind sie. Die Schwierigkeit besteht hierbei darin, dass die im Rahmen der univariaten ZRA entwickelten Testverfahren auf Einheitswurzeln eine zu geringe Mächtigkeit, bzw. Power aufweisen, als dass sie zwischen der Nullhypothese einer Instationarität, sowie der Alternativhypothese einer Stationarität unterscheiden könnten. Insbesondere gilt dies im Falle kurzer Zeitreihen.
Mögliche Abhilfe bietet die Untersuchung mehrerer Zeitreihen im Rahmen der Panelanalyse. Mit der Grundsteinlegung durch Quah, der einen ersten, primitiven Panel Unit Root (PUR)-Test vorschlägt, hat sich seitdem eine kaum zu überblickende Vielfalt an Testverfahren entwickelt, deren zentrales Anliegen die Erhöhung der im Rahmen der ZRA bemängelten, geringen Power von Einheitswurzeltests ist.
Aufgabe dieser Arbeit soll sein, einen Überblick wichtiger, gängiger, sowie erst kürzlich erschienener Testverfahren zu geben. Zwar soll kein Anspruch auf Vollständigkeit aller existierender Testverfahren erhoben werden. Doch soll versucht werden, die behandelten Tests sowohl in ihren Modellrahmen, -annahmen und formulierten Hypothesenpaaren, als auch Grenzverteilungen so detailliert wie nötig, so vollständig wie möglich zu behandeln.
In Anlehnung an Breitung, Pesaran, auf die ein guter Überblicksartikel gängiger PUR-Tests zurückgeht, scheint es nicht nur im Sinne der chronologisch richtigen Reihenfolge ratsam, diese Verfahren in solche der ersten und zweiten Generation zu unterteilen; es bestehen auch beträchtliche Unterschiede in den […]
Leseprobe
Inhaltsverzeichnis
Selim Dedekarginoglu
Nichtstationarität und Einheitswurzeln in dynamischen Panelmodellen
ISBN: 978-3-8428-1974-0
Herstellung: Diplomica® Verlag GmbH, Hamburg, 2011
Zugl. Friedrich-Alexander-Universität Erlangen-Nürnberg, Erlangen, Deutschland,
Diplomarbeit, 2007
Dieses Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte,
insbesondere die der Übersetzung, des Nachdrucks, des Vortrags, der Entnahme von
Abbildungen und Tabellen, der Funksendung, der Mikroverfilmung oder der
Vervielfältigung auf anderen Wegen und der Speicherung in Datenverarbeitungsanlagen,
bleiben, auch bei nur auszugsweiser Verwertung, vorbehalten. Eine Vervielfältigung
dieses Werkes oder von Teilen dieses Werkes ist auch im Einzelfall nur in den Grenzen
der gesetzlichen Bestimmungen des Urheberrechtsgesetzes der Bundesrepublik
Deutschland in der jeweils geltenden Fassung zulässig. Sie ist grundsätzlich
vergütungspflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des
Urheberrechtes.
Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in
diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme,
dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei
zu betrachten wären und daher von jedermann benutzt werden dürften.
Die Informationen in diesem Werk wurden mit Sorgfalt erarbeitet. Dennoch können
Fehler nicht vollständig ausgeschlossen werden und der Verlag, die Autoren oder
Übersetzer übernehmen keine juristische Verantwortung oder irgendeine Haftung für evtl.
verbliebene fehlerhafte Angaben und deren Folgen.
© Diplomica Verlag GmbH
http://www.diplomica.de, Hamburg 2011
Inhaltsverzeichnis
Tabellenverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
V
Abk¨
urzungsverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . VI
1 Einf¨
uhrung
1
2 Panelmodellierung
3
2.1
Querschnitts-, Zeitreihen-, Panelanalyse . . . . . . . . . . . . . . . . .
3
2.2
Mikropanels, Makropanels, Ber¨
uhmte Panels . . . . . . . . . . . . . .
4
2.3
Besonderheit von Paneldaten . . . . . . . . . . . . . . . . . . . . . . .
4
2.4
Sch¨
atzmethoden in station¨
aren Panels
. . . . . . . . . . . . . . . . .
7
2.4.1
Modellspezifikation: Fixed Effects, Random Effects . . . . . .
7
2.4.2
Sch¨
atzmethoden in statischen Panels . . . . . . . . . . . . . . 10
2.4.2.1
Pooled Regression
. . . . . . . . . . . . . . . . . . . 10
2.4.2.2
Least Square Dummy Variable-Sch¨
atzung . . . . . . 10
2.4.2.3
Within-Transformation und -Sch¨
atzer
. . . . . . . . 11
2.4.2.4
Robuster Varianzsch¨
atzer von Arellano (1987) . . 13
2.4.2.5
(Feasible) Generalized Least Squares . . . . . . . . . 14
2.4.3
Sch¨
atzmethoden in station¨
aren dynamischen Panels . . . . . . 16
2.4.3.1
FE-Sch¨
atzer und Nickell Bias . . . . . . . . . . . . . 18
2.4.3.2
RE-Sch¨
atzer und die Bedeutung der Startwerte . . . 19
2.4.3.3
IV-, GMM-Sch¨
atzung als Alternativen . . . . . . . . 19
3 Nichtstationarit¨
at in Zeitreihenmodellen
24
3.1
Testverfahren auf Einheitswurzeln . . . . . . . . . . . . . . . . . . . . 24
3.1.1
Univariater (Augmented) Dickey Fuller-Test . . . . . . . . . . 25
3.1.2
Residuenbasierter LM-Test . . . . . . . . . . . . . . . . . . . . 27
I
INHALTSVERZEICHNIS
II
3.1.2.1
Univariater KPSS-Test . . . . . . . . . . . . . . . . . 27
3.1.2.2
Test von Breitung, Hassler (2002) . . . . . . . . 29
3.2
Kointegration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.2.1
Kointegration und Spurious Regression . . . . . . . . . . . . . 30
3.2.2
Fehlerkorrektur-Darstellung . . . . . . . . . . . . . . . . . . . 31
3.3
Ausblick auf nichtstation¨
are Panelanalyse . . . . . . . . . . . . . . . . 32
3.3.1
Hypothesenpaare von PUR-Tests . . . . . . . . . . . . . . . . 33
3.3.2
Multi-Index-Asymptotik . . . . . . . . . . . . . . . . . . . . . 34
4 Panel Unit Root-Tests der ersten Generation
36
4.1
Lineare Tests der ersten Generation . . . . . . . . . . . . . . . . . . . 36
4.1.1
Test von Levin, Lin, Chu (1993, 2002)
. . . . . . . . . . . . 37
4.1.1.1
Modelle, Modellannahmen und Hypothesen . . . . . 37
4.1.1.2
Teststatistiken, Grenzverteilungen
. . . . . . . . . . 38
4.1.2
Test von Im, Pesaran, Shin (2003) . . . . . . . . . . . . . . 41
4.1.2.1
Modelle, Modellannahmen und Hypothesen . . . . . 41
4.1.2.2
Teststatistiken, Grenzverteilungen
. . . . . . . . . . 42
4.1.3
Test von Harris, Tzavalis (1999) . . . . . . . . . . . . . . . 45
4.1.3.1
Modelle, Modellannahmen und Hypothesen . . . . . 46
4.1.3.2
Teststatistiken, Grenzverteilungen
. . . . . . . . . . 46
4.1.4
Test von Choi (2001)
. . . . . . . . . . . . . . . . . . . . . . 49
4.1.4.1
Modelle, Modellannahmen und Hypothesen . . . . . 50
4.1.4.2
Teststatistiken, Grenzverteilungen
. . . . . . . . . . 51
4.1.4.3
Der Fall eines N
. . . . . . . . . . . . . . . . . 53
4.2
Nichtlineare Tests der ersten Generation . . . . . . . . . . . . . . . . 55
4.2.1
Test von He, Sandberg (2005a) . . . . . . . . . . . . . . . . 55
4.2.1.1
Modelle, Modellannahmen und Hypothesen . . . . . 56
4.2.1.2
Teststatistiken, Grenzverteilungen
. . . . . . . . . . 57
4.2.2
Test von Hassler, Demetrescu, Tarcolea (2004) . . . . . 59
4.2.2.1
Modelle, Modellannahmen und Hypothesen . . . . . 60
4.2.2.2
Teststatistiken, Grenzverteilungen
. . . . . . . . . . 62
4.3
Weitere Tests der ersten Generation . . . . . . . . . . . . . . . . . . . 63
4.3.1
Test von Breitung, Meyer (1994) . . . . . . . . . . . . . . 63
INHALTSVERZEICHNIS
III
4.3.2
Test von Hadri (2000) . . . . . . . . . . . . . . . . . . . . . . 65
4.4
Kleinstichprobeneigenschaften . . . . . . . . . . . . . . . . . . . . . . 66
5 Panel Unit Root-Tests der zweiten Generation
69
5.1
Kreuzabh¨
angigkeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
5.1.1
Ursachen und Kategorisierung . . . . . . . . . . . . . . . . . . 70
5.1.2
Konsequenzen . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
5.1.3
Modellierung und Handhabung . . . . . . . . . . . . . . . . . 72
5.2
Lineare Tests der zweiten Generation . . . . . . . . . . . . . . . . . . 75
5.2.1
Test von Choi (2002)
. . . . . . . . . . . . . . . . . . . . . . 76
5.2.1.1
Modelle, Modellannahmen und Hypothesen . . . . . 76
5.2.1.2
Teststatistiken, Grenzverteilungen
. . . . . . . . . . 78
5.2.2
Test von Harvey, Bates (2002) . . . . . . . . . . . . . . . . 79
5.2.2.1
Modelle, Modellannahmen und Hypothesen . . . . . 80
5.2.2.2
Teststatistiken, Grenzverteilungen
. . . . . . . . . . 80
5.2.3
Test von Breitung, Das (2004) . . . . . . . . . . . . . . . . 83
5.2.3.1
Modelle, Modellannahmen und Hypothesen . . . . . 83
5.2.3.2
Teststatistiken, Grenzverteilungen
. . . . . . . . . . 84
5.2.4
Test von Bai, Ng (2004) . . . . . . . . . . . . . . . . . . . . . 86
5.2.4.1
Modelle, Modellannahmen und Hypothesen . . . . . 86
5.2.4.2
Teststatistiken, Grenzverteilungen
. . . . . . . . . . 89
5.2.5
Test von Pesaran (2005) . . . . . . . . . . . . . . . . . . . . 90
5.2.5.1
Modelle, Modellannahmen und Hypothesen . . . . . 91
5.2.5.2
Teststatistiken, Grenzverteilungen
. . . . . . . . . . 92
5.3
Nichtlineare Tests der zweiten Generation
. . . . . . . . . . . . . . . 95
5.3.1
Test von Chang (2002) . . . . . . . . . . . . . . . . . . . . . 95
5.3.1.1
Modelle, Modellannahmen und Hypothesen . . . . . 95
5.3.1.2
Teststatistiken, Grenzverteilungen
. . . . . . . . . . 97
5.3.1.3
Bemerkungen . . . . . . . . . . . . . . . . . . . . . . 99
5.3.2
Test von Chang, Song (2002, 2005) . . . . . . . . . . . . . . 100
5.3.2.1
Modelle, Modellannahmen und Hypothesen . . . . . 101
5.3.2.2
Teststatistiken, Grenzverteilungen
. . . . . . . . . . 103
5.4
Weitere Tests der zweiten Generation . . . . . . . . . . . . . . . . . . 106
INHALTSVERZEICHNIS
IV
5.4.1
Test von J¨
onsson
(2005) . . . . . . . . . . . . . . . . . . . . 106
5.4.2
Test von Moon, Perron (2004) . . . . . . . . . . . . . . . . 108
5.5
Kleinstichprobeneigenschaften . . . . . . . . . . . . . . . . . . . . . . 111
6 Schluß
114
A Internetadressen
116
A.1 PUR-Tests der ersten Generation . . . . . . . . . . . . . . . . . . . . 116
A.2 PUR-Tests der zweiten Generation
. . . . . . . . . . . . . . . . . . . 117
Literaturverzeichnis
Tabellenverzeichnis
4.1
¨
Uberblick der Testverfahren der ersten Generation. . . . . . . . . . . 68
5.1
¨
Uberblick linearer Tests der zweiten Generation.
. . . . . . . . . . . 110
V
Abk¨
urzungsverzeichnis
Im Folgenden werden die in dieser Arbeit verwendeten Abk¨
urzungen, Symbole und
Zeichen erkl¨
art. Ausgenommen sind solche, die einmalig verwendet werden und an
entsprechender Stelle definiert sind. Vektoren und Matrizen sind grunds¨
atzlich durch
Fettdruck kenntlich gemacht, Hervorhebungen kursiv dargestellt.
I. Mathematische Symbole und Zeichen
t
Zeitindex, mit t = 1,
· · · , T
i
Index f¨
ur Querschnittseinheiten, mit i = 1,
· · · , N
{y
it
}
Stochastischer Prozess
y
t
Erkl¨
arte Variable eines Zeitreihenmodells
y
it
Erkl¨
arte Variable eines Panelmodells
y
y
y
i
Vektor f¨
ur Einheit i, mit y
y
y
i
= (y
i1
,
· · · , y
i1
)
y
y
y
i,-1
Vektor f¨
ur Einheit i, mit y
y
y
i,-1
= (y
i0
,
· · · , y
i,T -1
)
y
y
y
t
Vektor zum Zeitpunkt t, mit y
y
y
t
= (y
1t
,
· · · , y
Nt
)
y
y
y
Zusammengefasster Vektor, mit y
y
y = (y
y
y
1
,
· · · ,yyy
N
)
x
t
Erkl¨
arende Variable eines Zeitreihenmodells
x
x
x
it
Erkl¨
arender, k-dimensionaler Variablenvektor eines Panelmodells
X
X
X
i
Datenmatrix f¨
ur Einheit i, mit X
X
X
i
= (x
x
x
i1
,
· · · ,xxx
iT
)
X
X
X
Zusammengefasste Datenmatrix, mit X
X
X = (X
X
X
1
,
· · · ,X
X
X
N
)
t
St¨
orgr¨
oße eines Zeitreihenmodells
it
St¨
orgr¨
oße eines Panelmodells
i
Vektor f¨
ur Einheit i, mit
i
= (
i1
,
· · · ,
iT
)
i,-1
Vektor f¨
ur Einheit i, mit
i,-1
= (
i0
,
· · · ,
i,T -1
)
t
Vektor zum Zeitpunkt t, mit
t
= (
1t
,
· · · ,
Nt
)
VI
TABELLENVERZEICHNIS
VII
it
Zusammengesetzte St¨
orgr¨
oße eines Panelmodells
, ,
Parameter
i
Individueller Effekt, stochastisch oder deterministisch
t
Zeiteffekt, stochastisch oder deterministisch
2
Varianz einer Zufallsvariable
Varianz-Kovarianz-Matrix eines Zufallsvektors
¯
x
·,t
Durchschnitt der Panelwerte x
it
¨
uber s¨
amtliche Einheiten
¯
x
i,·
Durchschnitt der Panelwerte x
it
¨
uber s¨
amtliche Zeitpunkte
E(y)
Erwartungswert einer Zufallsvariable y
E(y
|x)
Erwartungswert einer Zufallsvariable y, bedingt auf das Ereignis x
III
T
T
× T -Einheitsmatrix
iii
T
T -dimensionaler Hilfsvektor, mit iii
T
= (1,
· · · , 1)
T
T -dimensionaler Hilfsvektor, mit
t
= (1, 2,
· · · , T )
Kronecker-Produkt
lim
Grenzwert
plim
Stochastischer Grenzwert
O(
·)
Landau Symbol
O
p
(
·)
Landau Symbol, mit P -stochastischer Konvergenz
Differenzen-Operator, mit y
t
= y
t
- y
t-1
L
i
, L
L
L
i
(Matrix-)Lag-Operator, mit L
L
L
i
y
y
y
t
= y
y
y
t-i
I(d)
Integrationsgrad eines Prozesses
d
d
d
i
Dummy-Vektor
D
D
D
d
Dummy-Matrix, mit D
D
D = (d
d
d
1
,
· · · ,ddd
N
)
M
M
M
Projektionsmatrix zu D
D
D
s
2
Stichprobenvarianz
N (,
2
)
Normalverteilung, mit Mittelwert , Varianz
2
W N (0,
2
)
White Noise-Verteilung (mit Mittelwert 0, Varianz
2
)
2
()
Chi-Quadrat Verteilung, mit Freiheitsgraden
t()
t-Verteilung, mit Freiheitsgraden
U(a, b)
Gleichverteilung im Intervall a, b
LL(·)
Log Likelihood -Funktion
d
Schwache Konvergenz, bzw. Konvergenz in Verteilung
TABELLENVERZEICHNIS
VIII
p
Konvergenz in Wahrscheinlichkeit
diag(a
1
,
· · · , a
N
)
Diagonalmatrix mit den Elementen a
1
,
· · · , a
n
det(A
A
A)
Determinante der Matrix A
A
A
tr(A
A
A)
Spur der Matrix A
A
A
A
A
A
Euklidische Norm der Matrix A
A
A
sgn(x)
Signum-Funktion in x
N
Menge der nat¨
urlichen Zahlen
R
Menge der reellen Zahlen
TABELLENVERZEICHNIS
IX
II. Abk¨
urzungen
(A)DF
(Augmented) Dickey Fuller
BIP
Bruttoinlandsprodukt
BLUE
Best Linear Unbiased Estimator
Bspw.
Beispielsweise
Bzw.
Beziehungsweise
Et al.
Et alii - Und Andere
FE
Fixed Effects
(F)GLS
(Feasible) Generalized Least Squares
GMM
Generalized Method of Moments
I.A.
Im Allgemeinen
Insb.
Insbesondere
IPS
Im, Pesaran, Shin
IV
Instrument Variables
I.W.
Im Wesentlichen
LLC
Levin, Lin, Chu
LSDV
Least Squares Dummy Variable
MC
Monte Carlo
ML
Maximum Likelihood
NLS
National Longitudinal Survey of Labor Market Experience
(O)LS
(Ordinary) Least Squares
PA
Panelanalyse
PPP
Purchasing Power Parity - Kaufkraftparit¨
at
PSID
Michigan Panel Study of Income Dynamics
(P)UR
(Panel) Unit Root(s) - (Panel) Einheitswurzel(n)
PWT
Penn World Tables
QA
Querschnittsanalyse
RE
Random Effects
RW
Random Walk
Sog.
Sogenannt/-e/-er/es
U.a.
Unter anderem/-n
TABELLENVERZEICHNIS
X
U.U.
Unter Umst¨
anden
U.S.
United States - Verinigte Staaten
u.(i.)v.
unabh¨
angig (identisch) verteilt
i.(n.)v.
identisch (normal-)verteilt
I.W.
Im Wesentlichen
VAR(p)
Vektorautoregressiv der Ordnung p
ZRA
Zeitreihenanalyse
Kapitel 1
Einf¨
uhrung
Von zentraler Bedeutung bei der Untersuchung einer ¨
okonomischen Zeitreihe ist die
Frage, ob diese station¨
ar ist, oder aber ob eine Instationarit¨
at der Daten gegeben ist.
Diese Frage ist nicht nur von einem statistisch-theoretischen, sondern insbesondere
auch ¨
okonomischen Standpunkt heraus von großem Interesse.
Wird etwa die Stationarit¨
at einer univariaten, realen Wechselkursreihe getestet,
bedeutet eine Ablehnung der Stationarit¨
at, dass reale Wechselkurse einem Random
Walk folgen, was wiederum eine Ablehnung der Kaufkraftparit¨
atentheorie nahelegt.
Liegen hingegen Zeitreihenwerte f¨
ur reale Wachstumsraten des BIP vor, bedeutet
eine Instationarit¨
at im landesspezifischen Kontext eine Ablehnung der in der Neo-
klassik vertretenen Steady State-Hypothese und im internationalen Kontext eine
Ablehnung der realen Konvergenz-Hypothese armer und reicher Volkswirtschaften.
So gehaltvoll diese Informationen sein m¨
ogen, so schwierig zu testen sind sie.
Die Schwierigkeit besteht hierbei darin, dass die im Rahmen der univariaten ZRA
entwickelten Testverfahren auf Einheitswurzeln eine zu geringe M¨
achtigkeit, bzw.
Power aufweisen, als dass sie zwischen der Nullhypothese einer Instationarit¨
at, sowie
der Alternativhypothese einer Stationarit¨
at unterscheiden k¨
onnten. Insbesondere
gilt dies im Falle kurzer Zeitreihen.
M¨
ogliche Abhilfe bietet die Untersuchung mehrerer Zeitreihen im Rahmen der
Panelanalyse. Mit der Grundsteinlegung durch Quah (1994,[69]), der einen ersten,
primitiven Panel Unit Root (PUR)-Test vorschl¨
agt, hat sich seitdem eine kaum
zu ¨
uberblickende Vielfalt an Testverfahren entwickelt, deren zentrales Anliegen die
Erh¨
ohung der im Rahmen der ZRA bem¨
angelten, geringen Power von Einheitswur-
1
KAPITEL 1. EINF ¨UHRUNG
2
zeltests ist.
Aufgabe dieser Arbeit soll sein, einen ¨
Uberblick wichtiger, g¨
angiger, sowie erst
k¨
urzlich erschienener Testverfahren zu geben. Zwar soll kein Anspruch auf Vollst¨
andig-
keit aller existierender Testverfahren erhoben werden. Doch soll versucht werden, die
behandelten Tests sowohl in ihren Modellrahmen, -annahmen und formulierten Hy-
pothesenpaaren, als auch Grenzverteilungen so detailliert wie n¨
otig, so vollst¨
andig
wie m¨
oglich zu behandeln.
In Anlehnung an Breitung, Pesaran (2005,[17]), auf die ein guter ¨
Uberblicksar-
tikel g¨
angiger PUR-Tests zur¨
uckgeht, scheint es nicht nur im Sinne der chronolo-
gisch richtigen Reihenfolge ratsam, diese Verfahren in solche der ersten und zweiten
Generation zu unterteilen; es bestehen auch betr¨
achtliche Unterschiede in den zu-
grundeliegenden Annahmenkomplexen. W¨
ahrend im Rahmen der ersten Generation
von einer Unabh¨
angigkeit individueller Zeitreihen ausgegangen wird, unterstellen
die Testverfahren der zweiten Generation eine (noch zu kl¨
arende) Abh¨
angigkeit zwi-
schen ihnen. Innerhalb der jeweiligen Generationen soll ferner zwischen linearen und
nichtlinearen Testverfahren differenziert werden.
Bevor dieser ¨
Uberblick jedoch gegeben wird, soll in Kapitel 2, neben einigen
g¨
angigen Definitionen, insbesondere auf Sch¨
atzverfahren im Rahmen der station¨
aren
Panelanalyse eingegangen werden. Diese erweisen sich n¨
amlich auch im nichtsta-
tion¨
aren Kontext als ¨
außerst n¨
utzlich. In Kapitel 3 sollen wichtige Konzepte der
nichtstation¨
aren ZRA vorgestellt werden, die im Panelkontext oftmals analoge An-
wendung finden. In den Kapiteln 4 und 5 schließlich, soll auf besagte Verfahren
der ersten, bzw. zweiten Generation eingegangen werden. Wichtige ¨
Uberblicksarti-
kel f¨
ur Verfahren der ersten Generation wurden von Banerjee (1999,[10]), Baltagi,
Kao (2000,[9]) und Choi (2003,[27]) verfasst. Einen guten ¨
Uberblick der Verfahren
der zweiten Generation geben Hurlin, Mignon (2004,[45]).
Kapitel 2
Panelmodellierung
2.1
Querschnitts-, Zeitreihen-, Panelanalyse
Grunds¨
atzlich l¨
asst sich die statistische Analyse untergliedern in die Zeitreihen-
analyse und die Querschnittsanalyse. W¨
ahrend sich die univariate Zeitreihenanaly-
se mit der Entwicklung einer einzigen Variable entlang ihrer Zeitreihendimension
besch¨
aftigt, ist es Aufgabe der multivariaten Zeitreihenanalyse, die Entwicklung
eines Vektors an Zufallsvariablen aus der eigenen Vergangenheit zu erkl¨
aren. Im
Rahmen der Querschnittsanalyse hingegen wird die Streuung der Daten alleine ent-
lang ihrer Querschnittsdimension untersucht. Vor diesem Hintergrund l¨
asst sich die
Panelanalyse nun einerseits als Vereinigung von Zeitreihen- und Querschnittsanaly-
se verstehen. Andererseits, wie Banerjee (1999,[10]) feststellt, ist die Literatur zur
Panelanalyse gr¨
oßer als die Summe besagter Teilbereiche.
Betrachtet wird also ein Datenset, das sowohl ¨
uber eine Zeitreihen-, als auch eine
Querschnittsdimension verf¨
ugt, so dass die Daten stets in Form eines sog. Panels,
die holl¨
andische Bezeichnung f¨
ur Rechteck, angeordnet werden k¨
onnen. W¨
ahrend
hierbei die Ordnung der individuellen Zeitreihenwerte mit der logischen Sequenz
des Zeitindexes t vorgegeben ist, muss die Querschnittsdimension keine immanente
Ordnung aufweisen. Ein Panel l¨
asst sich somit darstellen als
{y
it
} , mit i = 1, · · · , N, t = 1, · · · , T.
Zwar soll sich diese Arbeit auf zweidimensionale Panels beschr¨
anken. Hsiao (2005,[44])
gibt jedoch ein Beispiel f¨
ur ein von h¨
oherer Ordnung dimensionalisiertes Panel.
3
KAPITEL 2. PANELMODELLIERUNG
4
2.2
Mikropanels, Makropanels, Ber¨
uhmte Panels
Panels lassen sich nun, in Abh¨
angigkeit von der Gr¨
oße ihrer Zeitreihendimension T
und ihrer Querschnittsdimension N , unterscheiden in Mikro-, bzw. Querschnittspa-
nels und Zeitreihen-, bzw. Makropanels. W¨
ahrend Makropanels ein relativ kleines
N und ein relativ großes T aufweisen, sind Mikropanels zwar durch ein gr¨
oßeres N ,
jedoch ein kleineres T gekennzeichnet.
Zwei ¨
uberaus bedeutende U.S. amerikanische Mikropanels sind bspw. der Na-
tional Longitudinal Survey of Labor Market Experience (NLS) und der Michigan
Panel Study of Income Dynamics (PSID). So handelt es sich beim PSID um ei-
ne Stichprobe von ca. 6000 Haushalten und 15.000 Individuen, die seit dem Jahre
1968 beobachtet und interviewt wird, um die Determinanten (von Ver¨
anderungen)
des Haushaltseinkommens besser zu verstehen. Ein ber¨
uhmtes Makropanel hingegen
w¨
aren die Penn World Tables (PWT), bei welchen es sich um Daten volkswirtschaft-
licher Gesamtrechnungen der Jahre 1950-2000 von 168 L¨
andern handelt
1
.
Bei einem Panelmodell handelt es sich grunds¨
atzlich um ein Regressionsmodell,
welches einen Panelwert zu einem bestimmten Zeitpunkt t, sowie f¨
ur eine bestimmte
Einheit i, in der Regel durch einen Achsenabschnitt, eine bestimmte Anzahl von
Regressoren und eine St¨
orgr¨
oße erkl¨
art. Dies bietet eine Vielzahl von M¨
oglichkeiten
Panelmodelle zu kategorisieren.
2.3
Besonderheit von Paneldaten
Kaum ein Gebiet der Statistik erf¨
ahrt so viel Beachtung wie die Panelanalyse. Zwar
stellt sie mehr als nur eine Vereinigung von ZRA und QA dar und bietet etsprechend
exklusive Vorteile, welche, wie Hsiao (2005,[44]) anf¨
uhrt, insb. in Anbetracht einer
besseren Daten-Verf¨
ugbarkeit zusehend an Bedeutung gewinnen. Die Kehrseite der
Medaille ist jedoch in ebenso exklusiven Nachteilen der Panelmodellierung zu sehen
2
.
Ein zentraler Vorteil von Paneldaten besteht etwa darin, dass pr¨
azisere Infe-
renzen ¨
uber Modellkoeffizienten gewonnen werden k¨
onnen. Der Grund hierf¨
ur ist,
dass Paneldaten sowohl mehr Freiheitsgrade als ein Querschnitt, bzw. ein Panel
1
Einen ¨
Uberblick ¨
uber wichtige Panels gibt etwa Hsiao (2005,[44]).
2
Eine ausf¨
uhrliche Darstellung dieser Vor- und Nachteile findet sich in Hsiao (1986[43], 2005[44]).
KAPITEL 2. PANELMODELLIERUNG
5
mit T = 1, als auch als eine einzelne Zeitreihe, bzw. ein Panel mit N = 1, bie-
ten. Da die Querschnittsdimension des Panels im Falle unabh¨
angiger Einheiten i, u.
U. als Realisierung eines Ziehen mit Zur¨
ucklegen verstandenen werden kann, wird
zudem das insb. im Rahmen der Zeitreihenanalyse vorhandene Multikollinearit¨
ats-
Problem relativiert und mehr Information bereitgestellt; die Effizienz von Koeffizien-
tensch¨
atzungen steigt. Hsiao (1986,[43]) bietet ein Beispiel anhand eines Distributed
Lag-Modells.
Ein weiterer Vorteil ist, dass sich mit Paneldaten jene Probleme vermeiden las-
sen, die in Folge vergessener beobachteter, falsch gemessener und unbeobachteter
Variablen entstehen k¨
onnen. Hierzu sei das Modell
y
it
= + x
it
+ z
it
+
it
betrachtet. Bekanntermaßen ist der OLS-Sch¨
atzer von , und unter recht all-
gemeinen Bedingungen der Best Linear Unbiased Estimator (BLUE)
3
. Ist nun je-
doch z
it
unbeobachtet und gilt Cov(x
it
, z
it
) = 0, folgt Cov(x
it
,
it
) = 0, mit
it
=
z
it
+
it
. Da die Annahmen des klassischen Modells nicht mehr zutreffen, ist der
OLS-Sch¨
atzer, in Folge eines sog. Omitted Variable Bias, verzerrt und inkonsistent.
Im Rahmen von Panelmodellen l¨
asst sich dieser Effekt von z
it
eliminieren. Ist
die nicht ber¨
ucksichtigte Variable zeitunabh¨
angig, bzw. gilt z
it
= z
i
, oder aber
z
it
= z, ist das Modell in ersten (zeitlichen) Differenzen zu betrachten. Man erh¨
alt
y
it
-y
i,t-1
= (x
it
-x
i,t-1
)+
it
-
i,t-1
. Ist die Variable hingegen einheitenunabh¨
angig,
bzw. gilt z
it
= z
t
, oder z
it
= z, bietet sich eine Bereinigung der Daten um Quer-
schnittsdurchschnitte (zum Zeitpunkt t) an. Es folgt y
it
- ¯y
·t
= (x
it
- ¯x
·t
) +
it
- ¯
·t
.
In beiden F¨
allen bleiben Erwartungstreue und Konsistenz von OLS gewahrt
4
.
W¨
ahrend der wesentliche Vorteil von Paneldaten im Verh¨
altnis zu Querschnitts-
daten darin besteht, dass die Zeitreihenkomponente des Datensets weitreichende
Aufschl¨
usse ¨
uber individuenspezifische Parameter gibt, sind sie Zeitreihendaten da-
hingehend ¨
uberlegen, dass die Querschnittsdimension Informationen ¨
uber zeitspezi-
fische Parameter birgt. Dies bietet eine gr¨
oßere Flexibilit¨
at zur Modellierung indi-
vidueller und zeitlicher Unterschiede. Ausgangspunkt nachfolgender ¨
Uberlegungen
3
Vgl. etwa Greene (2003,[34]), S. 890 ff.
4
Im Falle T = 1, oder N = 1 k¨ame eine alternative IV-Sch¨atzung in Frage.
KAPITEL 2. PANELMODELLIERUNG
6
soll das Panelmodell
y
it
= zzz
it
+ x
x
x
it
it
+
it
(2.1)
sein, wobei x
x
x
it
einen Vektor an exogenen Regressoren darstellt, bzw. E(
it
|xxx
it
) = 0
gilt. Zeit- und individuenspezifische Heterogenit¨
at wird mittels zzz
it
formuliert
5
.
Wie Greene (2003,[34]) anmerkt, kann zzz
it
neben einem konstanten Term auch
eine Reihe individuen- und/oder zeitspezifischer Variablen enthalten, die, wie etwa
Geschlecht, Rasse, Wohnort etc., beobachtet, oder aber, wie im Falle von familien-
spezifischen Charakteristika, Pr¨
aferenzen etc., unbeobachtet sein k¨
onnen.
Der individuenspezifisch und zeitlich heterogenen Abh¨
angigkeit von dem Regres-
sorenvektor x
x
x
it
wird hingegen durch
it
Rechnung getragen. Ausgehend von einem
homogenen Standardmodell der Form y
it
= zzz
+ x
x
x
it
+
it
und je nachdem, ob
Achsenabschnitt und Steigungskoeffizient zeit- und/oder einheitenspezifisch sind,
ergeben sich in Anlehnung an Hsiao (1986,[43]) folgende Modelle:
y
it
= zzz
i
+ x
x
x
it
+
it
,
y
it
= zzz
it
+ x
x
x
it
+
it
(2.2)
y
it
= zzz
i
+ x
x
x
it
i
+
it
,
y
it
= zzz
it
+ x
x
x
it
it
+
it
,
(2.3)
W¨
ahrend in den Modellen (2.2) Achsenabschnitte stets einheitenspezifisch, manch-
mal einheiten- und zeitspezifisch formuliert werden, gilt dies in (2.3) auch f¨
ur die
Steigungskoeffizienten. In der Regel werden s¨
amtliche einheitenpezifischen Variablen
in zzz
it
zu
i
, s¨
amtliche Zeiteffekte hingegen zu
t
zusammengefasst, so dass sich die
zwei ersteren Modelle in (2.2) und (2.3) als sog. One Way-Modelle, alle ¨
ubrigen als
sog. Two Way-Modelle bezeichnen lassen. Es gilt
y
it
=
i
+ x
x
x
it
+
it
(2.4)
y
it
=
i
+
t
+ x
x
x
it
+
it
(2.5)
Nach Hsiao konzentriert sich die Literatur zur Panelanalyse hierbei im Wesentli-
chen auf Modelle (2.2), bzw. (2.4) und (2.5), da diese trotz ihrer relativ einfachen
Struktur in der Lage sind, ausreichend zeit- und individuenspezifische Heterogenit¨
at
zu formulieren. Dennoch kann mittels eines F -Testes auf Gruppeneffekte bestimmt
werden, welches der Modelle in (2.2), (2.3) zu formulieren ist
6
.
5
Zu denken w¨
are etwa ein deterministisches Trendpolynom.
6
Vgl. Hsiao (1986,[43]), S.12.
KAPITEL 2. PANELMODELLIERUNG
7
2.4
Sch¨
atzmethoden in station¨
aren Panels
Nachfolgend soll auf alternative Sch¨
atzmethoden f¨
ur station¨
are Panelmodelle ein-
gegangen werden. Zun¨
achst jedoch soll der sehr allgemeine Modellrahmen in Ab-
schnitt 2.3 konkretisiert werden. Je nachdem, ob der Regressorenvektor x
x
x
it
in (2.4)
und (2.5) nur exogene Variable, nur verz¨
ogerte abh¨
angige Variable y
i,t-
,
· · · , y
i,t-p
,
oder aber exogene und verz¨
ogerte abh¨
angige Variable enth¨
alt, unterscheidet Arella-
no (2003,[3]) zwischen statischen Modellen, autoregressiven Modellen und Modellen
mit strikt exogenen und verz¨
ogerten abh¨
angigen Variablen. In ihrer einfachsten Form
lassen sich diese darstellen als
y
it
=
i
+ x
x
x
it
+
it
,
(2.6)
y
it
=
i
+ y
i,t-1
+
it
,
(2.7)
y
it
=
i
+ x
x
x
it
+ y
i,t-1
+
it
.
(2.8)
W¨
ahrend es sich bei (2.7) um ein sog. autoregressives One Way-Modell der
Ordnung p = 1 handelt, w¨
urde es sich mit Aufnahme eines Zeiteffektes
t
um ein
entspechendes Two Way-Modell handeln. Nachfolgend soll dann von dynamischen
Modellen die Rede sein, wenn Modelle der Art in (2.7) gemeint sind. Von Modellen
der Art in (2.8) soll abgesehen werden
7
.
2.4.1
Modellspezifikation: Fixed Effects, Random Effects
Panelmodelle k¨
onnen sich auch hinsichtlich der statistischen Eigenschaften ihrer
Modellkoeffizienten unterscheiden lassen. Wird in den Modellen (2.7) und (2.8) etwa
angenommen, dass
i
deterministisch ist, handelt es sich um ein sog. Fixed Effects
(FE)-Modell. Von einem sog. Random Effects (RE)-Modell ist die Rede, wenn
i
stochastisch ist. Formulieren l¨
asst sich das FE-Modell als
y
it
=
i
+ x
x
x
it
+
it
.
(2.9)
Hierbei gilt, dass
(I.1) E(
it
|
i
, x
x
x
it
) = 0,
7
Eine ausf¨
uhrliche Darstellung von Sch¨
atzmethoden f¨
ur Modell (2.8) findet sich in Sevestre,
Trognon (1992,[70]), S. 95 ff.
KAPITEL 2. PANELMODELLIERUNG
8
(I.2) E(
2
it
|
i
, x
x
x
it
) =
2
,
(I.3)
it
u.i.v.(0,
2
)
i, t, so dass E(
it js
|
i
, x
x
x
it
) = 0, f¨
ur t = s oder i = j.
Wie Mundlak (1978, [57]) feststellt, ist ein FE-Modell jedoch nicht nur im Falle de-
terministischer Zeit-, bzw. individuenspezifischer Effekte zu formulieren. Auch dann
ist von fixen Effekten auszugehen, wenn in (2.1) angenommen werden kann, dass
der Vektor zzz
it
mit den ¨
ubrigen Regressoren x
x
x
it
korreliert ist. Eine Nicht-Ber¨
ucksich-
tigung der Effekte w¨
urde n¨
amlich eine Inkonsistenz des OLS-Sch¨
atzers ^
in Folge
einer sog. Omitted Variable bewirken, worauf bereits in Abschnitt 2.3 eingegangen
worden ist. Das FE-Modell kennzeichnet sich also durch seine grundlegende Annah-
me, Unterschiede zwischen Einheiten k¨
onnten durch parametrische
8
Verschiebungen
der Regressionsgeraden modelliert werden. Vor diesem Hintergrund wird also jedes
i
als zu sch¨
atzender, einheitenspezifisch-konstanter Term betrachtet.
Von einem RE-, bzw. Fehlerkomponenten-Modell ist hingegen dann auszugehen,
wenn die unbeobachtete, individuelle Heterogenit¨
at, ungeachtet ihrer spezifischen
Form, unkorreliert mit den Modellvariablen ist. Zudem ist ein RE-Modell dann an-
zuraten, wenn ¨
uber in-sample-Ergebnisse hinausgehend, Inferenzen ¨
uber Grundge-
samtheiten gewonnen werden sollen
9
. Darstellen l¨
asst sich dieses als
y
it
= x
x
x
it
+ E(zzz
i
) + [zzz
i
- E(zzz
i
)] +
it
,
= x
x
x
it
+ +
i
+
it
,
= x
x
x
it
+
it
.
(2.10)
Auch hier liegt also ein lineares Regressionsmodell vor, welches insb. durch eine
zusammengesetzte St¨
orgr¨
oße,
it
=
i
+
it
, gekennzeichnet ist. Die zuf¨
alligen in-
dividuellen Effekte,
i
, k¨
onnen als Abweichungen von einem globalen Mittel, ,
verstanden werden. Dieses l¨
asst sich problemlos in den Vektor
integrieren, wenn
x
x
x
it
entsprechend mit Eins erg¨
anzt wird. Annahmegem¨
aß gilt
(II.1) E(
it
|xxx
it
) = E(
i
|xxx
it
) = 0,
(II.2) E(
2
it
|xxx
it
) =
2
, E(
2
i
|xxx
it
) =
2
, E(
i
j
|xxx
it
) = 0, f¨
ur i = j,
(II.3) E(
it js
|
i
, x
x
x
it
) = 0,
t = s oder i = j, E(
it
j
|xxx
it
) = 0,
i, t, j.
8
In Abh¨
angigkeit von
i
.
9
Eine eingehende subjektivistische Interpretation von RE und FE gibt Hsiao (1986,[43]).
KAPITEL 2. PANELMODELLIERUNG
9
Demzufolge kann Modell (2.10) konsistent, aber ineffizient mittels OLS gesch¨
atzt
werden. Effizient w¨
are hingegen eine (F)GLS-Sch¨
atzung, auf welche in Abschnitt
2.4.2.5 eingegangen werden soll.
Sollte also die Korrelations-Annahme stimmen, so dass ein RE-Modell formuliert
werden kann, reduziert sich die Anzahl der zu sch¨
atzenden Parameter in (2.9) um
die N Achsenabschnitte
i
, so dass die Freiheitsgrade von Sch¨
atzungen steigen.
Sollte sie jedoch nicht stimmen, resultiert sie in Folge eines Omitted Variable Bias
in inkonsistenten, verzerrten Sch¨
atzern, weshalb stets die G¨
ultigkeit dieser Annahme
getestet werden sollte.
Im Hinblick auf den nachfolgend zu bestimmenden (F)GLS-Sch¨
atzer, sind die
bedingte Varianz-Kovarianz-Matrix des zusammengesetzten St¨
orgr¨
oßenvektors
i
=
(
i1
,
i2
,
· · · ,
iT
) und dessen Inverse
10
zu formulieren. Es gilt
= E(
i
i
|X
X
X) =
2
III
T
+
2
iii
T
iii
T
,
(2.11)
-1
=
1
2
III
T
-
2
2
+ T
2
iii
T
iii
T
.
(2.12)
In Folge der Unabh¨
angigkeit unterschiedlicher Beobachtungseinheiten, kann die
N T
×NT -Kovarianz-Matrix des gesamten NT ×1 -Residuenvektors = (
1
,
· · · ,
N
)
formuliert werden als
= III
N
.
(2.13)
Zu beachten ist nun, dass je nach L¨
ange und Spezifikation des Vektors zzz
i
, bzw.
zzz
it
in (2.2), bzw. (2.3), je nachdem ob dieser Vektor (un-)beobachtet ist, sowie je
nachdem ob ein FE- oder RE-Modellrahmen unterstellt wird, sich unterschiedliche
Implikationen f¨
ur die Sch¨
atzung der Modellkoeffizienten ergeben.
Grunds¨
atzlich gilt, dass wenn zzz
i
beobachtet ist, sich das gesamte Modell mit-
tels OLS sch¨
atzen l¨
asst. Im Folgenden soll ohne Beschr¨
ankung der Allgemeinheit
von Zeiteffekten abstrahiert, und von Modellen der Art (2.4) und (2.7) ausgegangen
werden, um geeignete Sch¨
atzmethoden f¨
ur die FE-, bzw. RE-Spezifikation darzustel-
len. Hierbei gelte der interessantere Fall eines unbeobachteten zzz
i
. Die Darstellungen
folgen i.W. Greene (2003, [34]).
10
Vgl. etwa Hsiao (1986,[43]), S. 34.
KAPITEL 2. PANELMODELLIERUNG
10
2.4.2
Sch¨
atzmethoden in statischen Panels
In statischen Modellen lassen sich (I.1)
-(I.3) und (II.1)-(II.3) in Matrixnotation
angeben. F¨
ur die FE-Modellspezifikation gilt insbesondere (I.1 ) E(
i
|X
X
X
i
) = 0, f¨
ur
den RE-Modellrahmen
11
(II.1 ) E(
i
|X
X
X
i
) = 0. (I.1 ) und (II.1 ) formulieren die
Annahme der strikten Exogenit¨
at der Regressoren X
X
X
i
. In (I.2 ), (I.3 ) und (II.2 ),
(II.3 ) werden die entsprechenden Momente von
i
, bzw.
i
ebenfalls auf X
X
X
i
bedingt.
2.4.2.1
Pooled Regression
Wenn die Vektorl¨
ange von zzz
i
Eins betr¨
agt, bzw. nur ein konstanter Term enthalten
ist, so dass die Modellparameter homogen sind, bietet sich eine sog. Pooled Regres-
sion der Gestalt
y
it
= + x
x
x
it
+
it
auf Basis aller verf¨
ugbaren Daten an. Auch hier erm¨
oglicht eine OLS-Sch¨
atzung
der k + 1 zeit- und individuenunabh¨
angigen Modellkoeffizienten ,
1
,
· · · ,
k
die
Herleitung konsistenter, effizienter Sch¨
atzer. Im RE-Modell ist einzig die (F)GLS-
Sch¨
atzung effizient.
2.4.2.2
Least Square Dummy Variable-Sch¨
atzung
Ausgangspunkt dieser Sch¨
atzmethode im FE-Modellrahmen ist die Matrixnotation
des Modells in (2.9). Es gilt
12
y
y
y
i
= X
X
X
i
+ iii
i
+
i
,
(2.14)
y
y
y = X
X
X
+ ,
(2.15)
wobei X
X
X
= (X
X
X, d
d
d
1
, d
d
d
2
,
· · · ,ddd
N
),
= (
,
) , mit
= (
1
,
· · · ,
k
) ,
= (
1
,
· · · ,
N
).
Hierbei stellt d
d
d
i
einen zu Einheit i geh¨
origen N T
×1-Dummy Variablen-Spaltenvektor
dar, in dem an den i-ten Stellen jeweils T Werte Eins, alle ¨
ubrigen Null entsprechen.
Alternativ l¨
asst sich die Matrixnotation mittels der Einf¨
uhrung einer N T
× N-
Dummy-Matrix D
D
D
d
= (d
d
d
1
,
· · · ,ddd
N
) formulieren als
y
y
y = X
X
X
+ D
D
D
d
+ .
(2.16)
11
Zu beachten ist, dass die Datenmatrix X
X
X
i
im Falle (I.1 ) eine zus¨atzliche Spalte bestehend aus
Einsen enth¨
alt, welche den fixen Effekten Rechnung tr¨
agt.
12
Zur Notation sei erneut auf das Abk¨
urzungsverzeichnis verwiesen.
KAPITEL 2. PANELMODELLIERUNG
11
Das in (2.16) formulierte, sog. Least Squares Dummy Variable (LSDV)-Modell
stellt ein klassisches Regressionsmodell dar, so dass auf bestehende Ergebnisse zu
dieser Modellklasse zur¨
uckgegriffen und eine OLS- bzw. LSDV-Sch¨
atzung des K +N -
Parametervektors (
,
) durchgef¨
uhrt werden kann. Herleitung und Bestimmung
des Sch¨
atzers sind trivial und brauchen nicht angegeben zu werden.
Ein wesentlicher Nachteil der LSDV -Methode ist die hohe Anzahl der zu sch¨
atzen-
den Parameter. Insb. im Falle von Mikropanels kommt es deshalb oftmals zu nu-
merischen Instabilit¨
aten. Eine alternative, und wie noch zu zeigen ist, ¨
aquivalente
Methode zur Bestimmung von ^
, ist die sog. Within-Sch¨
atzung.
2.4.2.3
Within-Transformation und -Sch¨
atzer
Das Problem numerischer Instabilit¨
at l¨
asst sich durch eine sog. Within-Transforma-
tion der Daten und eine entsprechende Within-Sch¨
atzung der Modellparameter
l¨
osen. Ausgangspunkt stellt auch hier das Modell (2.16) in seiner FE-Spezifikation
dar. Der Grundgedanke ist, dass durch eine partitionierte Regression zun¨
achst nur
der OLS-Sch¨
atzer des K
× 1 -Koeffizientenvektors hergeleitet wird, so dass in ei-
nem ersten Schritt N Parameter weniger gesch¨
atzt werden m¨
ussen. Unter R¨
uckgriff
auf Ergebnisse zur partitionierten Regression
13
, l¨
asst sich der OLS-Sch¨
atzer von
in (2.16) formulieren als
^
W
= (X
X
X M
M
M
D
X
X
X)
-1
(X
X
X M
M
M
D
y
y
y),
(2.17)
mit M
M
M
D
= III
NT
- D
D
D
d
(D
D
D
d
D
D
D
d
)
-1
D
D
D
d
. M
M
M
D
stellt hierbei eine idempotente Projektions-
matrix dar, so dass gilt M
M
M
D
M
M
M
D
= M
M
M
D
. Ferner ist M
M
M
D
orthogonal zu den Spalten
von D
D
D, so dass M
M
M
D
D
D
D = 0
0
0.
Allgemein gilt f¨
ur eine T
×K-Datenmatrix A
A
A = (a
a
a
1
, a
a
a
2
,
· · · ,aaa
K
), mit a
a
a
j
als einem
T -dimensionalen Vektor, f¨
ur eine Matrix B
B
B und f¨
ur eine entsprechenden Projekti-
onsmatrix P
P
P
A
= III
T
- A
A
A(A
A
A A
A
A)
-1
A
A
A , dass P
P
P
A
A
A
AB
B
B = 0
0
0 und P
P
P
A
a
a
a
j
= 0
0
0, f¨
ur alle j.
Der Sch¨
atzer in (2.17) wird auch Within-, bzw. FE-Sch¨
atzer genannt und kann
mittels zweier verwandter Methoden bestimmt werden. Eine Methode basiert auf der
¨
Uberlegung, dass aufgrund der Idempotenz von M
M
M
D
, der Sch¨
atzer in (2.17) auch dem
Koeffizientensch¨
atzer einer Regression der transformierten y
y
y-Werte, y
y
y
= M
M
M
D
y
y
y, auf
13
Vgl. etwa Greene (2003, [34]), S. 26 ff.
KAPITEL 2. PANELMODELLIERUNG
12
das transformierte Datenset X
X
X
= M
M
M
D
X
X
X entsprechen muss. Eine Vormultiplikation
von (2.16) mit M
M
M
D
liefert
M
M
M
D
y
y
y = M
M
M
D
X
X
X
+ M
M
M
D
,
(2.18)
da M
M
M
D
D
D
D
d
= 0
0
0. Ein besseres Verst¨
andnis der Transformation in (2.18) erfordert
eine genauere Betrachtung der Projektionsmatrix M
M
M
D
. In Folge der paarweisen Or-
thogonalit¨
at der Spaltenvektoren der Dummy-Matrix D
D
D
d
, l¨
asst sich diese als block-
diagonale Matrix der Form
M
M
M
D
= I
N
M
M
M
0
,
(2.19)
M
M
M
0
= III
T
-
1
T
iii
T
iii
T
,
(2.20)
darstellen. Bemerkenswert ist nun, dass jede Vormultiplikation eines beliebigen T
×1-
Vektors zzz
i
mit M
M
M
0
, gleichbedeutend ist mit M
M
M
0
zzz
i
= zzz
i
-¯ziii, wobei ¯z den Durchschnitt
¨
uber s¨
amtliche Beobachtungszeitpunkte f¨
ur Einheit i darstellt. Es findet eine Mit-
telwertbereinigung und eine einhergehende Eliminierung der fixen Effekte statt. Be-
zeichnet wird diese Transformation als Within-Transformation. Deshalb ist (2.18)
¨
aquivalent zur Regression
(y
it
- ¯y
i·
) = (x
x
x
it
- ¯xxx
i·
)
+ (
it
- ¯
i·
).
(2.21)
Die zweite Methode basiert auf zwei Hilfsregressionen. Da im klassischen linearen
Modell M
M
My
y
y = ^
OLS
gilt, wird eine Matrix der Gestalt M
M
M
D
in (2.17) als Residual
Maker bezeichnet. Dementsprechend k¨
onnen die transformierten Werte y
y
y
= M
M
M
D
y
y
y,
bzw. X
X
X
= M
M
M
D
X
X
X, alternativ auch als St¨
orgr¨
oßen der Gestalt
y
y
y
= y
y
y
- D
D
D^
1
,
(2.22)
X
X
X
= X
X
X
- D
D
D^
2
(2.23)
bestimmt werden. Hierbei stellen ^
1
, ^
2
die OLS-Sch¨
atzer zweier Hilfsregressionen
von y
y
y nur auf D
D
D, und von X
X
X nur auf D
D
D dar. Das Frisch Waugh-Theorem
14
besagt
nun, dass sich der Sch¨
atzer f¨
ur
in (2.16) auch alternativ mittels einer Regression
von y
y
y
auf X
X
X
bestimmen l¨
asst. Mit der Idempotenz von M
M
M
D
, lassen sich der Sch¨
atzer
14
Vgl. Greene (2003,[34]), S. 27.
KAPITEL 2. PANELMODELLIERUNG
13
in (2.17) f¨
ur die Modelle (2.16), (2.18), sowie dessen Varianzsch¨
atzer formulieren als
^
W
= (X
X
X
X
X
X
)
-1
(X
X
X
y
y
y
),
(2.24)
V ar(^
W
) = ^
2
(X
X
X M
M
M
D
X
X
X)
-1
,
(2.25)
mit ^
2
= (nT
- n - k)
-1
N
i=1
T
t=1
^
2
it
und ^
it
= y
it
- ^
i
- xxx
it
^
W
. Der LSDV-
Sch¨
atzer f¨
ur
in Abschnitt 2.4.2.2 ist also ¨
aquivalent mit obigem Within-, bzw.
FE-Sch¨
atzer
15
. Anzumerken ist, dass solange im FE-Modell in (2.9) von einer stren-
gen Exogenit¨
at der Regressoren, bzw. E(
|X
X
X) ausgegangen wird und
it
u.i.v.
(0,
2
)
gilt, sich zeigen l¨
asst, dass der FE-Sch¨
atzer f¨
ur
BLUE ist. Eine GLS-Sch¨
atzung
von (2.18) f¨
uhrt zu einem identischen Sch¨
atzer
16
. Wie aus (2.25) zu ersehen ist,
kann sowohl f¨
ur T
, als auch N von einer Konsistenz des Sch¨atzers ^
ausgegangen werden.
Hinsichtlich des RE-Modellrahmens in (2.10) ist anzumerken, dass der FE-Sch¨
atzer
unverzerrt und konsistent, jedoch ineffizient ist. Eine Within-Transformation eines
RE-Modells der Gestalt (2.10) f¨
uhrt, analog zu (2.18), zwar zu einer Eliminierung
der nunmehr zuf¨
alligen individuellen Effekte
i
. Zeitgleich geht jedoch die Between
Group-Variation der Daten, bzw. deren Informationsgehalt verloren, was in endli-
chen Stichproben zu ineffizienten Sch¨
atzern f¨
uhrt
17
. Die Ineffizienz motiviert eine
(F)GLS-Sch¨
atzung.
2.4.2.4
Robuster Varianzsch¨
atzer von Arellano (1987)
Ausgangspunkt der ¨
Uberlegungen stellt das FE-Modell in (2.9), bzw. (2.14), unter
dem in Unterabschnitt 2.4.2 geschilderten Annahmenkomplex (I.1 )
- (I.3 ), dar.
W¨
ahrend der FE-Sch¨
atzer unter diesen Annahmen BLUE ist, geht mit Verletzung
von Annahme (I.3 ) die Effizienz-Eigenschaft verloren. Insbesondere sind Inferen-
zen auf Basis des Varianzsch¨
atzers in (2.25) irref¨
uhrend. Mit der Annahme, dass
i
u.i.v.
(000,
i
), wobei E(
it is
|X
X
X
i
,
i
) =
its
, also ausgehend von querschnittsun-
abh¨
angigen, jedoch einheitenpezifisch heteroskedastischen und autokorrelierten Mo-
dellresiduen, leitet Arellano (1987,[2]) den korrekten, bzw. robusten Varianzsch¨
atzer
15
Der Sch¨
atzer ^
W
, sowie V ar(^
W
) k¨
onnen etwa Greene (2003, [34]) entnommen werden.
16
In (2.18) gilt E(
) =
2
M
M
M
D
, mit
= M
M
M
D
, wobei M
M
M
D
III
nT
f¨
ur große T .
17
Vgl. Hsiao (1986,[43]), S. 34.
KAPITEL 2. PANELMODELLIERUNG
14
des FE-Sch¨
atzers ^
her.
Unter dieser Annahme und f¨
ur ein N
l¨asst sich f¨ur den FE-Sch¨atzer aus (2.17)
N (^
W
- )
d
N (000,M
M
M
-1
V
V
V M
M
M
-1
),
schreiben, wobei M
M
M = plim
N
N
-1
(X
X
X
X
X
X
) und V
V
V = plim
N
N
-1
N
i=1
(X
X
X
i
i
X
X
X
i
)
gilt und analog zu Abschnitt 2.4.2.3 X
X
X
= M
M
M
D
X
X
X und X
X
X
i
= M
M
M
D
X
X
X
i
gesetzt wird.
Den Sch¨
atzer von V
V
V gibt Arellano an als
^
V
V
V = N
-1
N
i=1
X
X
X
i
^
i
^
i
X
X
X
i
,
mit ^
i
= y
y
y
i
- X
X
X
i
^
W
. Da wegen der Idempotenz der Within-Projektionsmatrix M
M
M
D
X
X
X
i
i
X
X
X
i
= X
X
X
i
i
X
X
X
i
, mit
= M
M
M
D
i
M
M
M
D
, gilt, kann von einer Konsistenz von ^
V
V
V
f¨
ur V
V
V ausgegangen werden. Der robuste Varianzsch¨
atzer des Within-Sch¨
atzers l¨
asst
sich somit angeben als
V ar(^
W ith
) = (X
X
X
X
X
X
)
-1
N
i=1
X
X
X
i
^
i
^
i
X
X
X
i
(X
X
X
X
X
X
)
-1
.
(2.26)
2.4.2.5
(Feasible) Generalized Least Squares
W¨
ahrend das Gauss Markov -Theorem
18
die BLUE-Eigenschaft des OLS-Sch¨
atzers
u.a. von den Annahmen abh¨
angig macht, dass die Residuen homoskedastisch und
nicht autokorreliert sind, bewirkt die Zeitkonstanz der zuf¨
alligen individuellen Ef-
fekte im RE-Modellrahmen eine Verletzung insb. der Autokorrelations-Annahme.
Effizienzgr¨
unde motivieren eine GLS-Sch¨
atzung des Koeffizientenvektors, welche der
Information in der Kovarianz-Matrix besser Rechnung tr¨
agt. Ausgangspunkt sei die
Matrixnotation von (2.10). Es gilt
y
y
y = X
X
X
+
,
(2.27)
mit
als dem N T -dimensionalen Vektor der zusammengesetzten St¨
orgr¨
oßen. Der
GLS-Sch¨
atzer der Steigungskoeffizienten in (2.27) hat unter Ber¨
ucksichtigung von
(2.13) die Form
^
^
^
GLS
= (X
X
X
-1
X
X
X)
-1
X
X
X
-1
y
y
y =
N
i=1
X
X
X
i
-1
X
X
X
i
-1
N
i=1
X
X
X
i
-1
y
y
y
i
.
(2.28)
18
Vgl. Greene (2003,[34]) S., 45 ff.
KAPITEL 2. PANELMODELLIERUNG
15
Eine ¨
aquivalente Vorgehensweise ist, (2.27) in ein klassisches lineares Modell zu
transformieren und den GLS-Sch¨
atzer mittels der OLS-Methodik herzuleiten. Die
Transformation besteht in einer Vormultiplikation von X
X
X
i
und y
y
y
i
mit dem Aus-
druck
-1/2
= (III
n
)
-1/2
, wobei lediglich
-1/2
zu bestimmen ist. Aus einer
Cholesky-Zerlegung von
-1
ergibt sich
-1/2
=
-1
(III
T
-
T
iii
T
iii
T
), mit = 1
-
(
2
+ T
2
u
)
-1
. Der transformierte Vektor der Panelwerte f¨
ur Individuum i l¨
asst
sich nun darstellen als
-1/2
y
y
y
i
=
-1
(y
i1
- ¯y
i·
, y
i2
- ¯y
i·
,
· · · , y
iT
- ¯y
i·
) . Analoges
gilt f¨
ur die Transformation der Zeilenvektoren von X
X
X
i
. Die Vormultiplikation der
Modellresiduen mit der Gewichtungsmatrix,
=
-1/2
i
, bewirkt vor allen Din-
gen, dass f¨
ur die Kovarianzmatrix der transformierten Residuen E(
) = III
2
gilt.
Da die Annahmen des klassischen Modells wieder erf¨
ullt sind, kann auf bestehende
Ergebnisse zur¨
uckgegriffen werden.
Die nachfolgend zu t¨
atigende Regression der (gewichteten und) mittelwertberei-
nigten Werte y
it
auf die entsprechend transformierten Werte x
x
x
it
zeigt die ¨
Ahnlichkeit
zur LSDV-Methodik, im Rahmen derer = 1 angenommen wird.
Wenn die Komponenten der Kovarianz-Matrix (2.13) bekannt sind, ist oben be-
schriebene GLS-Methode anzuwenden. Da dies jedoch nicht der Fall sein wird, ist
die GLS-Sch¨
atzung unfeasible bzw. nicht durchf¨
uhrbar, so dass zun¨
achst
gesch¨
atzt
werden muss. Problematisch ist, dass im Falle einer symmetrisch-positiv definiten
Matrix
prinzipiell N T (N T + 1)/2 Komponenten gesch¨
atzt werden m¨
ussen, was
angesichts von nur N T Beobachtungen unmachbar ist. Im RE-Modell in (2.10) wird
dieses Problem dank der einfachen Struktur der blockdiagonalen Kovarianzmatrix
in (2.13) umgangen. Jede der Matrizen
i
in
ist auf der Hauptdiagonalen mit
(
2
+
2
), auf den Nebendiagonalen hingegen mit
2
besetzt. Dementspechend sind
also zun¨
achst
2
und
2
, bzw. ^
zu sch¨
atzen, um anschließend den FGLS-Sch¨
atzer
herzuleiten. F¨
ur Modell (2.27) stellt sich dieser dar als
^
^
^
^
^
^
F GLS
= (X
X
X ^
^
^
-1
X
X
X)
-1
X
X
X ^
^
^
-1
y
y
y.
(2.29)
Es l¨
asst sich zeigen, dass dieser unter sehr allgemeinen Bedingungen asymptotisch
¨
aquivalent mit dem GLS-Sch¨
atzer aus (2.28) ist. Von besonderer Bedeutung hier-
bei ist, dass ein asymptotisch effizienter FGLS-Sch¨
atzer keine effizienten, sondern
KAPITEL 2. PANELMODELLIERUNG
16
lediglich konsistente Sch¨
atzer f¨
ur
2
und
2
ben¨
otigt
19
. Deshalb wird der Datensatz
zun¨
achst, analog zu Abschnitt 2.4.2.3, mittels der Within-Sch¨
atzung um die indivi-
duelle Heterogenit¨
at bereinigt, um gleichzeitig konsistent gesch¨
atzte St¨
orgr¨
oßen ^
it
zu erhalten. Hierauf aufbauend lassen sich dann
2
,
2
u
konsistent sch¨
atzen.
Die gesch¨
atzte, asymptotische Kovarianzmatrix des FGLS-Sch¨
atzers entspricht
der inversen Matrix in (2.29) und ist gegeben als
^
F GLS
= (X
X
X ^
-1
X
X
X)
-1
.
(2.30)
Problematisch im Hinblick auf den herzuleitenden FGLS-Sch¨
atzer in (2.29) ist,
dass dieser sich nur im Falle einer invertierbaren, bzw. nichtsingul¨
aren N
× N-
Matrix ^
bestimmen l¨
asst. Ist etwa ^
t
=
1
T
A
A
A A
A
A, wobei A
A
A = (^
1
,
· · · , ^
N
) und ^
i
=
(^
i1
,
· · · , ^
i,T
) , so gilt Rg[ ^
] = Rg [A
A
A]. Deshalb besitzt ^
nur dann vollen Rang N ,
wenn T > N .
Abschließend sei angemerkt, dass wenn trotz korrelierter individueller Effekte, ein
RE-Modell der Art (2.10) formuliert wird, bzw. dessen Annahmen nicht erf¨
ullt sind,
der (F)GLS-Sch¨
atzer inkonsistent ist. Der (F)GLS-Sch¨
atzer wird auch als Random
Effects-Sch¨
atzer bezeichnet.
2.4.3
Sch¨
atzmethoden in station¨
aren dynamischen Panels
Da viele zu untersuchenden Variablen, sowohl in mikro-, als auch makro¨
okonomi-
schen Zusammenh¨
angen, von ihrer eigenen Vergangenheit abh¨
angig sind, kommt
dynamischen Modellen auch im Kontext der Panelanalyse eine besondere Bedeu-
tung zu. Nachfolgende Darstellungen sind i.W. Arellano (2003,[3]) entlehnt.
Ausgangspunkt der ¨
Uberlegungen sei ein station¨
ares, autoregressives Panelm-
odell erster Ordnung der Gestalt y
it
=
i
+ y
i,t-1
+
it
. Das entsprechende FE-,
bzw. RE-Modell in Matrixnotation lautet, analog zu (2.16) und (2.27),
y
y
y = D
D
D
+ y
y
y
-1
+ ,
(2.31)
y
y
y = y
y
y
-1
+
.
(2.32)
Eine Stationarit¨
at der Prozesse (2.31) und (2.32) setzt voraus, dass
|| < 1, bzw.
die Nullstellen des charakteristischen Polynoms (1
- z) außerhalb des Einheits-
19
Vgl. Greene (2003, [34]) S. 208 ff.
KAPITEL 2. PANELMODELLIERUNG
17
kreises liegen
20
. In Abschnitt 2.4.2 wurde festgestellt, dass die Annahme strikter
Exogenit¨
at erkl¨
arender Variablen grundlegend f¨
ur die Erwartungstreue und Konsi-
stenz der LS -Sch¨
atzer ist.
Im Kontext dynamischer FE-Modelle der Art (2.31) stellen sich zwei Proble-
me. Ein Problem ist, dass die strikte Exogenit¨
at in Folge der Endogenit¨
at des Re-
gressorenvektors y
y
y
-1
nicht gewahrt ist; insb. gilt Corr(y
i,t-1
,
i,t-j
) = 0, f¨
ur alle
j
1. Dementsprechend ist in dynamischen FE-Modellen von Annahmenkomplex
(I.1)
-(I.3), insbesondere (I.1) E(
it
|
i
, y
i,t-1
) = 0 auszugehen. Diese Annahme im-
pliziert, dass es sich bei
it
um eine f¨
ur Einheit i, in Periode t eintretende Innovation
handelt, die keinerlei Korrelation zu heutigen und vergangenen, wohl aber zu k¨
unf-
tigen Regressoren aufweisen darf. Es l¨
asst sich zeigen, dass unter recht allgemeinen
Bedingungen Erwartungstreue und Konsistenz des OLS-Sch¨
atzers gewahrt bleiben.
Problematisch ist diese Annahme allerdings nicht nur im Falle dynamischer FE-
Modelle, deren Regressoren Messfehlern unterliegen und/oder autokorrelierte Mo-
dellresiduen aufweisen. In letzerem Falle ist n¨
amlich das kontempor¨
are Residuum
it
mit seinem verz¨
ogerten Wert
i,t-1
, dieser wiederum mit y
i,t-1
korreliert. Pro-
blematisch ist diese Annahme insbesondere auch in Anbetracht der in Unterab-
schnitt 2.4.2.3 geschilderten Within-Transformation, worauf im n¨
achsten Abschnitt
eingegangen werden soll. In allen diesen F¨
allen ist eine Instrumental Variables (IV)-
Sch¨
atzung anzuraten.
Das Problem im Kontext dynamischer RE-Modelle der Art (2.32) hingegen ist,
dass Corr(y
i,t
is
) = 0, f¨
ur alle s, t. Die zusammengesetzte St¨
orgr¨
oße,
it
, und y
it
werden ¨
uber den Effekt
i
zu jedem Zeitpunkt korrelieren, so dass die LS-Sch¨
atzer,
also auch der GLS-Sch¨
atzer, verzerrt und inkonsistent sind. Es l¨
asst sich zeigen,
dass der Bias insb. von den Annahmen ¨
uber die Startwerte y
i0
abh¨
angt. Auch in
dynamischen RE-Modellen liefert die IV-Methodik konsistente Sch¨
atzer.
20
Vgl. etwa Hamilton (1994,[39]), S. 53 ff.
Details
- Seiten
- Erscheinungsform
- Originalausgabe
- Erscheinungsjahr
- 2007
- ISBN (eBook)
- 9783842819740
- DOI
- 10.3239/9783842819740
- Dateigröße
- 917 KB
- Sprache
- Deutsch
- Institution / Hochschule
- Friedrich-Alexander-Universität Erlangen-Nürnberg – Wirtschaftswissenschaftliche Fakultät, Studiengang Volkswirtschaftslehre
- Erscheinungsdatum
- 2011 (August)
- Note
- 1,0
- Schlagworte
- statistik ökonometrie nichtstationarität einheitswurzel panelmodell