Lade Inhalt...

Ist "gute Lehre" meßbar?

Untersuchungen zur Validität, Zuverlässigkeit und Vergleichbarkeit studentischer Lehrbewertungen

©1997 Diplomarbeit 125 Seiten

Zusammenfassung

Inhaltsangabe:Zusammenfassung:
In der vorliegenden soziologischen Arbeit wird sich damit auseinandergesetzt, ob die Befragungen von Studenten zur Qualität der Lehre so zuverlässig sind, dass man bestimmte Konsequenzen für die Lehrenden daraus ableiten könnte. Eine solche Konsequenz könnte die Umstellung des Zulagensystem für C4-Professoren (höchste Besoldungsstufe) von der „Alterungszulage“ auf ein System mit Leistungszulagen sein, wie sie derzeit in Rheinland-Pfalz diskutiert wird. Aber auch für die Vergabe von Preisen für „gute Lehre“ soll die studentische Lehrbewertung mit herangezogen werden. Durch solche Lehrpreise, die jährlich vergeben werden und bis zu 10.000 DM dotiert sind, und durch die damit zu erwerbende Reputation sollen höhere Anreize zum Bemühen um „gute Lehre“ gesetzt werden. Dies alles dient letztlich der Einführung von Elementen des Wettbewerbs innerhalb und zwischen den Hochschulen auch in der Lehre. Bisher konkurrieren die Hochschulen nur in der Forschung miteinander, was zu dem immer wieder beklagten geringen Stellenwert der Lehre an den Hochschulen führte. Diesen geringen Stellenwert der Lehre trachtet man nun mit einer Reihe von Maßnahmen wieder zu erhöhen.
Das Bundesland Sachsen ist hierbei schon relativ weit vorangeschritten, indem die rechtlichen Grundlagen für die Kopplung von Lehrbewertungen und der Vergabe finanzieller Mittel bis hin zum Nachweis pädagogischer Eignung für Berufungen mit dem 1994 verabschiedeten Sächsischen Hochschulgesetz bereits geschaffen wurden. Für die Entscheidung, inwieweit man sich hierbei auf die Ergebnisse studentischer Lehrbewertung stützen kann und was bei der Verwendung der Umfrageergebnisse für Leistungsvergleiche beachtet werden muss, sind aber noch einige Klärungen notwendig. Was zu einen Konzept „guter Lehre“ gehören soll, sowie Untersuchungen zur Validität, Zuverlässigkeit und Vergleichbarkeit sind dabei die wichtigsten Aspekte, zu deren Klärung die vorliegende Diplomarbeit beitragen soll.
Als kurzes Fazit der zahlreichen Aufsätze und neuester empirischer Studien, die zu diesem Thema in der Arbeit diskutiert wurden, lässt sich folgendes festhalten: Studentische Lehrbewertungen sind bei Verwendung entsprechend geprüfter Befragungsinstrumente sehr viel zuverlässiger als gemeinhin angenommen. Allerdings - und das muss man bei Verwendung der Ergebnisse solcher Befragungen beachten - sind sie nicht immer ohne weiteres vergleichbar. Unter welchen Bedingungen dies trotzdem erreicht werden […]

Leseprobe

Inhaltsverzeichnis


ID 543
Krempkow, René: Ist ,,gute Lehre" meßbar?: Untersuchungen zur Validität, Zuverlässigkeit und
Vergleichbarkeit studentischer Lehrbewertungen / René Krempkow - Hamburg: Diplomarbeiten
Agentur, 1997
Zugl.: Dresden, Technische Universität, Diplom, 1997
Dieses Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte, insbesondere die
der Übersetzung, des Nachdrucks, des Vortrags, der Entnahme von Abbildungen und Tabellen,
der Funksendung, der Mikroverfilmung oder der Vervielfältigung auf anderen Wegen und der
Speicherung in Datenverarbeitungsanlagen, bleiben, auch bei nur auszugsweiser Verwertung,
vorbehalten. Eine Vervielfältigung dieses Werkes oder von Teilen dieses Werkes ist auch im
Einzelfall nur in den Grenzen der gesetzlichen Bestimmungen des Urheberrechtsgesetzes der
Bundesrepublik Deutschland in der jeweils geltenden Fassung zulässig. Sie ist grundsätzlich
vergütungspflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des Urheberrech-
tes.
Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem
Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, daß solche Na-
men im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären
und daher von jedermann benutzt werden dürften.
Die Informationen in diesem Werk wurden mit Sorgfalt erarbeitet. Dennoch können Fehler nicht
vollständig ausgeschlossen werden, und die Diplomarbeiten Agentur, die Autoren oder Über-
setzer übernehmen keine juristische Verantwortung oder irgendeine Haftung für evtl. verbliebe-
ne fehlerhafte Angaben und deren Folgen.
Dipl. Kfm. Dipl. Hdl. Björn Bedey, Dipl. Wi.-Ing. Martin Haschke & Guido Meyer GbR
Diplomarbeiten Agentur, http://www.diplom.de, Hamburg 2000
Printed in Germany


2
Inhalt
1. EINLEITUNG 5
2. WAS IST "GUTE LEHRE"? - VERSUCHE ZUR BEGRIFFSKLÄRUNG
UND OPERATIONALISIERUNG 9
2.1. "G
UTE
L
EHRE
" - D
EFINITIONSVERSUCHE FÜR EINEN HOCHKOMPLEXEN
G
EGENSTAND
9
2.2. Z
U DEN
B
EGRIFFEN
"M
EßBARKEIT
"
UND
"E
VALUATION
"
VON
L
EHRQUALITÄT
12
2.3. W
IE
"
GUTE
L
EHRE
"
GEMESSEN WERDEN KÖNNTE
(O
PERATIONALISIERUNG
)
14
2.4. D
IFFERENZIERUNG DER
E
VALUATION AUF VERSCHIEDENE
E
BENEN
17
F
AZIT
21
3. VALIDITÄT UND ZUVERLÄSSIGKEIT STUDENTISCHER
LEHRBEWERTUNGEN 23
3.1. D
IE
B
EDEUTUNG DER
V
ALIDITÄT UND
Z
UVERLÄSSIGKEIT STUDENTISCHER
U
RTEILE FÜR DIE
E
INSCHÄTZUNG VON
L
EHRQUALITÄT
23
3.2. W
IE SICH
V
ALIDITÄT UND
Z
UVERLÄSSIGKEIT FESTSTELLEN LASSEN
25
3.3. U
RTEILE VON
L
EHRENDEN UND
F
REMDGUTACHTERN ZUR
V
ALIDISIERUNG
28
3.4. A
BSOLVENTENBEFRAGUNGEN ZUR
V
ALIDISIERUNG
32
3.5. D
IE
K
OMPETENZ
S
TUDIERENDER ZUR
E
INSCHÄTZUNG IHRER
L
EHR
-
UND
S
TUDIENSITUATION
33
3.6. D
IE
R
EIFE DER
U
RTEILER ZUR
E
INSCHÄTZUNG DER
L
EHR
-
UND
S
TUDIENQUALITÄT
37
3.7. D
IE
Z
UVERLÄSSIGKEIT DER STUDENTISCHEN
U
RTEILE
38
3.8. S
TABILITÄT
/ R
ETESTRELIABILITÄT BEI
M
EßWIEDERHOLUNG NACH CA
. 2
M
ONATEN
39

3
3.9. S
TABILITÄT STUDENTISCHER
U
RTEILE ÜBER MEHRERE
S
EMESTER
41
F
AZIT
44
4. VERGLEICHBARKEIT UND EINFLUßFAKTOREN AUF DAS
STUDENTISCHE URTEIL 45
4.1. B
EDEUTUNG UND
P
ROBLEME VERGLEICHENDER
Q
UALITÄTSBEWERTUNG
MITTELS STUDENTISCHER
U
RTEILE
45
4.2. Q
UASIEXPERIMENTELLER
A
NSATZ ZUR
A
NALYSE VON
E
INFLUßFAKTOREN
48
4.3. F
ELDSTUDIEN ZUR
A
NALYSE POTENTIELLER
E
INFLUßFAKTOREN
50
A
) S
ACHKENNTNIS
, K
OMPETENZ
54
B
) R
EIFE
, A
LTER
54
C
) G
ESCHLECHT
54
D
) N
OTEN UND
L
EISTUNGSFÄHIGKEIT
56
E
) S
TUDIENINTERESSE
:
58
F
) L
EISTUNGSMOTIVATION UND
F
LEIß
61
G
) D
IE
K
URSGRÖßE BZW
.
DER
G
RAD DER
Ü
BERFÜLLUNG ALS
EXTERNE
F
AKTOREN
:
63
F
AZIT
:
65
5. OBJEKTIVE KENNZAHLEN - ERSATZ SUBJEKTIVER
LEHRBEWERTUNG? 67
5.1. W
ARUM KEINE OBJEKTIVE
K
ENNZAHLEN SUBJEKTIVE
B
EWERTUNG
ERSETZEN KANN
67
5.2. D
AS
B
ETREUUNGSVERHÄLTNIS ALS
I
NDIKATOR FÜR
Ü
BERFÜLLUNG
68
5.3. Q
UOTENVERWIRRUNG
: S
CHWUNDQUOTE
, A
BBRECHERQUOTE
,
E
RFOLGSQUOTE
71
5.4. E
INE KURZE DURCHSCHNITTLICHE
F
ACHSTUDIENDAUER ALS
I
NDIZ FÜR GUTE
L
EHRE
73
5.5. N
OTEN
: K
RITERIUM FÜR
S
TUDIENERFOLG BZW
. E
RGEBNISQUALITÄT DES
S
TUDIUMS
?
75
F
AZIT
77

4
6. ANWENDUNGEN UND SCHLUßFOLGERUNGEN 79
6.1. D
ISKUSSION
, B
EWERTUNG UND
I
NTERPRETATION DER
E
RGEBNISSE VON
S
TUDIERENDENBEFRAGUNGEN ZUR
Q
UALITÄT DER
L
EHRE IN
L
EHRBERICHTEN
79
6.2. S
TUDENTENBEFRAGUNGEN ALS EINE
G
RUNDLAGE FÜR
L
EHRPREISE
82
6.3. O
PERATIONALISIERUNG GUTER
L
EHRE UNTER
E
INBEZIEHUNG VON
R
AHMENBEDINGUNGEN
,
EXEMPLARISCH FÜR DIE
TU D
RESDEN
85
F
AZIT
89
7. ZUSAMMENFASSUNG 90
L
ITERATURVERWEISE
95

5
1. Einleitung
Seit Anfang dieses Jahrzehnts gibt es an den deutschen Hochschulen eine Qualitäts-
diskussion. Überlange Studienzeiten im Vergleich zu anderen europäischen Ländern,
von Studierenden, Absolventen und Wirtschaftsverbänden immer wieder beklagte De-
fizite in der Hochschulausbildung und ein Bild in der Öffentlichkeit, das von träge
über bürokratisch bis reformunfähig reicht, haben ihren Teil dazu beigetragen. Die
Hochschullehre spielt in dieser Qualitätsdiskussion eine besondere Rolle, war es doch
der immer wieder beklagte geringe Stellenwert und die, so wurde unterstellt, geringe
Qualität der Lehre, die man für einen Großteil der Misere verantwortlich machte.
Durch Erhöhung des Stellenwertes der Lehre sowie durch mehr Wettbewerb und Lei-
stungstransparenz erhoffte und erhofft man sich Verbesserungen
1
Studentische Initiativen ließen schon Ende der 80er Jahre von ihren Kommilitonen die
Qualität der Lehre bewerten. Am Anfang waren dies reine Dozentenbeurteilungen, die
diesen einen Eindruck von der Unzufriedenheit der Studierenden verschaffen sollten.
Daraus entstand zunächst die Bezeichnung "Prof-TÜV", die aber für die heute meist
mit "Lehrevaluation" umschriebenen Maßnahmen zur Bewertung der Lehr- und Stu-
dienqualität eigentlich irreführend ist. In der wissenschaftlichen Debatte um die Lehr-
qualität geht es schon lange nicht mehr um die Bewertung einzelner Dozenten, sondern
um den Versuch, mit systematischen Methoden eine Einschätzung der Lehr- und Stu-
dienqualität insgesamt vorzunehmen.
Zu einem Thema des öffentlichen Interesses und letztlich auch zu einem Thema für die
Wissenschaft wurde die Qualität der Hochschullehre jedoch erst durch eine Veröffent-
lichung des Nachrichtenmagazins "Der Spiegel". Dieses publizierte 1989/´90 erstmals
ein großangelegtes Hochschul-Ranking, welches die deutschen Hochschulen auf der
Basis von studentischen Urteilen zur Qualität der Lehre miteinander verglich. Andere
zuvor durchgeführte Studien zur Qualität der Lehre (Vgl. Bargel in "Soziologie" 1/90)
fanden kaum Beachtung und wurden (obwohl sie nicht weniger kritisch formuliert
1
So diagnostiziert der Wissenschaftsrat "ein gravierendes Defizit in der Berichterstattung über die
Bedingungen und die Leistungen in der Lehre" und forderte, nicht bei internen Leistungsvergleichen
zu verharren, sondern "die Leistungen öffentlich vergleichend zu beurteilen" (Wissenschaftsrat
1993: 52)

6
waren) ihrerseits in der Wissenschaft kaum kritisiert. Die Spiegel-Veröffentlichung
jedoch fand nicht nur große Aufmerksamkeit, sondern auch heftige, vor allem metho-
dische Kritik aus der soziologischen Fachdisziplin. (Vgl. dazu die intensive Diskussi-
on von Scheuch, Lamnek, Endruweit, Gräf und Neidhardt in "Soziologie" 2/90 und
1/91). Die Studenten seien nicht kompetent, die Fragestellungen nicht valide, die Er-
gebnisse nicht vergleichbar usw. - hallte es fast unisono aus den Hochschulen zurück.
Durch den Wirbel, den diese Rankingliste an den Hochschulen verursachte, wurden
solche Leistungsvergleiche in der Folgezeit jedoch nicht etwa fallengelassen. "Der
Spiegel", "Stern", "Forbes", "Manager-Magazin", "Capital" und "Focus" veröffent-
lichten seitdem in loser Folge immer wieder solche hochschulübergreifenden Lei-
stungsvergleiche. Die Zahl der reinen Fachbereichs-Rankinglisten ist inzwischen
längst unüberschaubar geworden.
2
Die unterschiedlichen Ergebnisse, die dabei heraus-
kamen und die u. a. auf verschiedenen Befragtenkreisen (Studenten, Professoren,
Wirtschaft) beruhten, schienen zunächst den Kritikern solcher Rankinglisten recht zu
geben. Eine Orientierung für Studienanfänger, Eltern von Auszubildenden und Perso-
nalabteilungen der Wirtschaft - das erklärte Ziel der Rankinglisten - könnten diese bei
so unterschiedlichen Ergebnissen wohl kaum sein, so hieß es anfangs.
Jedoch der Druck der Politik, in den Hochschulen nicht nur auf die Qualität der For-
schung, sondern auch auf die Qualität der Lehre zu sehen und diese für die Öffentlich-
keit transparent zu machen, wurde und wird immer größer. Die Hochschulen sind an-
gesichts allgemeiner Sparforderungen im Legitimationszwang, öffentliche Mittel "ef-
fektiv" zu verwenden. Vor einiger Zeit forderte selbst Bundeskanzler Helmut Kohl,
Hochschulrankings durchzuführen
3
. So heißt die politisch relevante Frage heute wohl
schon nicht mehr: IST "gute Lehre" meßbar?, sondern WIE ist Lehrqualität meßbar?
"Übersehen" werden dabei jedoch die immer noch verbreiteten Widerstände und Be-
fürchtungen, die bei einem Teil der Hochschullehrer mit studentischer Lehrbewertung
verbunden werden. Deren Akzeptanz und der damit verbundenen Maßnahmen und
Konsequenzen ist jedoch Voraussetzung für die Wirksamkeit von Evaluationen und
damit für nachhaltige Verbesserungen der Lehrsituation.
2
Vgl. Himmelrath: "Zahlenspiel mit Tücken" in: DUZ Nr. 9/ 1997: 10-13
3
"Wenn alle mithelfen, können wir in Deutschland ein Ranking der Universitäten erstellen" Focus
16/97

7
In der vorliegenden Arbeit soll deshalb zunächst die Frage diskutiert werden, was ei-
gentlich unter "guter Lehre" zu verstehen ist und wie diese operationalisiert werden
könnte. Darauf folgt dann ein erster Schwerpunkt der Arbeit. In diesem soll vor allem
diskutiert werden, ob durch die Studentenumfragen wirklich das erfaßt werden kann,
was erfaßt werden soll (Gültigkeit bzw. Validität). Im Zusammenhang hiermit steht die
Frage nach der Zuverlässigkeit bzw. Reliabilität studentischer Umfragen.
Einen zweiten Schwerpunkt bildet die Fragestellung, ob die so erhobenen Daten ver-
gleichbar sind, oder ob sie nicht durch weitere, bisher nicht berücksichtigte Faktoren
derart verzerrt sind, daß Vergleiche kaum noch Aussagekraft haben. Im Zusammen-
hang mit der Diskussion um die Brauchbarkeit studentischer Lehrbewertungen als Lei-
stungskriterium schließt sich eine Diskussion an, ob es nicht "objektive" Leistungs-
kennzahlen gäbe, durch die die "subjektive" Einschätzung der Studierenden vielleicht
"kontrolliert" werden könnte und ob diese nicht evtl. besser geeignet wären zur Mes-
sung von Lehrqualität. Diese, in der Hochschulpolitik ebenfalls vehement geführte
Debatte mündet in die Diskussion zu Lehrberichten, in die sowohl "objektive" Kenn-
zahlen, als auch "subjektive" Bewertungen einfließen und die inzwischen in den mei-
sten Bundesländern auch rechtlich verankert sind. Da dieser Diskussionspunkt aller-
dings auf eine Ebene führt, die nicht nur einer soziologisch-methodischen Diskussion
bedarf, sondern darüber hinaus einer hochschulpolitischen und rechtlichen Auseinan-
dersetzung, kann auf Lehrberichte als Instrument der Qualitätsmessung nur ansatzwei-
se eingegangen werden. Eine ausführliche Diskussion unter Berücksichtigung der vie-
len in diese Problematik hereinspielenden Aspekte würde den Rahmen einer Diplo-
marbeit sprengen. Jedoch werden die Erfahrungen, die die verschiedenen Bundeslän-
der z.Zt. mit diesem Instrument zu sammeln versuchen, mit Sicherheit eine weitere
wissenschaftliche Auseinandersetzung mit diesem Thema nach sich ziehen. Die Ana-
lysen zur Validität, Zuverlässigkeit und Vergleichbarkeit studentischer Lehrbewertun-
gen sind dabei weiterhin eine Grundlage für die Erstellung von Lehrberichten und
Maßnahmen zur Verbesserung der Qualität der Lehre.
Hierin liegt die Bedeutung sozialwissenschaftlicher Analysen zur Lehrqualität. Denn
die Datensammlung und Interpretation bedarf entsprechender Sorgfalt und Erfahrung
im Umgang mit empirischen Erhebungsmethoden, wenn die Versuche zur Messung
von Lehrqualität ein genügendes Maß an Genauigkeit und damit zur Leistungs-
gerechtigkeit erreichen sollen. Erst dann wird es möglich sein, die für eine Erhöhung

8
des Stellenwerts der Lehre an den Hochschulen nötige Transparenz der Lehrleistungen
und der Qualität der Studienbedingungen insgesamt zu erreichen. Einen kleinen Bei-
trag hierzu zu leisten, ist das Anliegen dieser Arbeit. Allen, die mich in diesem Anlie-
gen unterstützten, möchte ich an dieser Stelle meinen Dank aussprechen.

9
2. Was ist "gute Lehre"? - Versuche zur Be-
griffsklärung und Operationalisierung
In diesem Kapitel soll diskutiert werden, was unter "guter Lehre", "Meßbarkeit" und
dem inzwischen zum Modewort avancierten Begriff "Evaluation" zu verstehen ist. Des
weiteren soll erörtert werden, mit welchen Mitteln festgestellt werden könnte, ob Lehre
"gut" oder "schlecht" ist. Hierzu soll dargestellt werden, welche Methoden und In-
strumente bereits entwickelt wurden, um Lehrqualität zu "messen" und wie diese mit
den jeweiligen Zielen zusammenhängen.
2.1. "Gute Lehre" - Definitionsversuche für einen hochkomplexen Ge-
genstand
Wenn man sich damit beschäftigen will, ob "gute Lehre" meßbar ist, so muß man zu-
nächst einmal klären, was man darunter versteht. Dies mag trivial erscheinen, ist es
aber durchaus nicht, denn: "Es gibt bisher keinen Konsens über Kriterien guter Lehre
an deutschen Hochschulen" (Webler 1991: 243). Dies schlägt sich bis heute auch in
den höchst unterschiedlichen Ländergesetzgebungen nieder, die doch alle das gleiche
Ziel verfolgen: Einen Beitrag zur Stärkung der Lehre an den deutschen Universitäten
leisten (Vgl. Hage 1996: 1). Dennoch sieht sich Webler stellvertretend für die "profes-
sionelle Hochschuldidaktik prinzipiell in der Lage, trotz einiger Schwierigkeiten anzu-
geben, worin gute akademische Lehre besteht": Allgemein formuliert heißt seine Defi-
nition guter Lehre: "Wenn die Studierenden auf ihrem Weg zu den Zielen des Studi-
ums allgemein und den Zielen des Studienabschnitts speziell in hervorragender Weise
gefördert werden" (Webler 1991: 243 ff.).
Diese Definition schließt, wenn man sie genauer betrachtet, sowohl aktive, als auch
passive Aspekte auf Seiten der Studierenden ein: Gefördert zu werden bedeutet nicht,
lediglich Lehrveranstaltungen zu "konsumieren", sondern auch, selbst etwas zu tun,
bei dem man unterstützt wird. Die Definition bezieht sich dabei bewußt nicht auf kon-
krete Lehrinhalte. Zwar bezweifeln viele, daß sich die Frage, wann ein Lehrangebot
gut ist, überhaupt fächerunspezifisch lösen läßt. (Vgl. Webler 1991: 243). Jedoch

10
stützt Webler sich bei seinen Ausführungen gerade deshalb ausschließlich auf Infor-
mationsquellen, die "unter minimalem Bezug auf die transportierte Information" An-
haltspunkte für gelingende Lehr- und Lernprozesse geben. Es sind dies Anleihen aus
der Lernpsychologie, Lernbiologie, Motivationspsychologie, Kleingruppenforschung,
Kreativitätstheorie, Kommunikationstheorie und ähnlichen Gebieten, die in die hoch-
schuldidaktische Lern- und Lehrforschung eingeflossen sind. Diese Informations-
quellen seien dabei in jedem Falle wesentlich systematischer als die "Alltagstheorien",
die manchen ministeriellen Bestimmungen als Grundlage dienen, begründete Webler
seinen Standpunkt.
Auch der Begriff Didaktik, im Zusammenhang mit der Qualität der Lehre oft ver-
wandt, bedarf in diesem Zusammenhang einer Begriffsklärung. Webler versteht dabei
unter Didaktik allgemein "die Verknüpfung der zielabhängigen Auswahl von Inhalten
mit Methodenentscheidungen". Webler legt bei dieser Definition großen Wert auf die
Ziele, die mit der Lehre verbunden sind, da ihm diese in der hochschulpolitischen Dis-
kussion nur allzu oft aus dem Blick geraten würden. Deshalb heißt es bei Webler unter
diesem Blickwinkel zum Thema Lehre: "Gute Lehre ist dann gut, wenn sie, gemessen
an den Studienzielen, möglichst optimale Lehr- und Lernprozesse organisiert" (Webler
1991: 243 ff.). Hier wird klar, daß Webler, abweichend von seiner allgemeinen Defi-
nition "guter Lehre", seinen Kriterienkatalog vor allem nach hochschuldidaktischen
Gesichtspunkten zusammenstellte. Das wird schon an der Gliederung deutlich: Im er-
sten Abschnitt dieses Kataloges wurden Merkmale guter Veranstaltungsplanung und
Veranstaltungskonzepte aufgeführt, im zweiten Abschnitt Kriterien für geeignetes
Lehrverhalten der Lehrenden (Webler 1991: 246-248). Zwar wird in diesem Kriterien-
katalog explizit darauf hingewiesen, daß dieser lediglich eine Diskussionsgrundlage
darstellen soll und keineswegs Anspruch auf Vollständigkeit erhebt. Dennoch wird
sich bis heute häufig auf den Kriterienkatalog von Webler bezogen, wenn es allgemein
darum geht, was unter guter Lehre zu verstehen sei. So konnte Kritik an diesem hoch-
schuldidaktisch geprägten Kriterienkatalog nicht ausbleiben.
Beispielsweise der an der FU Berlin lehrende Soziologieprofessor Helmut Kromrey
vertritt hier den Standpunkt: "Gute Lehre ist ohne Bezugnahme auf eine spezielle Ziel-
gruppe weder definierbar noch realisierbar" (Kromrey 1993: 46). Er bezieht sich dabei
sowohl auf die Abhängigkeit der Vorstellungen guter Lehre von den zu vermittelnden
Lehrinhalten, als auch von der jeweiligen studentischen "Zielgruppe". Kromrey illu-

11
strierte dies folgendermaßen: "Sollen z.B. die für das erfolgreiche Studium eines Fa-
ches von den Lehrenden für notwendig gehaltenen, bei den Studierenden jedoch über-
wiegend unbeliebten Basiskenntnisse und Basisfertigkeiten vermittelt werden und muß
zudem davon ausgegangen werden, daß es nennenswerte Lücken in den studentischen
Vorkenntnissen gibt, dann ist Lehre ganz anders zu konzipieren, als wenn Studierende
im Hauptstudium in einem sie interessierenden Teilgebiet zum kreativen Umgang mit
wissenschaftlichen Erkenntnissen oder gar zum Finden neuer Erkenntnisse angeleitet
werden sollen. Was für den ersten Fall gute Lehre ist, wäre für den zweiten Fall extrem
schlechte Lehre - und umgekehrt." Kromrey ist der Meinung, daß bei den Hochschul-
didaktikern der Stellenwert des Aspekts "Vermittlung" für ein erfolgreiches Studium
unangemessen überschätzt wird. Er hält deshalb eine stärkere Einbeziehung der
Aspekte "Aneignung" (Lernen), der Lehr- und Lernziele, sowie der Lehr- und Studien-
bedingungen für notwendig. Er begründete dies ausführlich anhand mehrerer empiri-
scher Untersuchungen (Kromrey 1993, 1995, 1996).
Eine weitere, stark am Wissenszuwachs orientierte Definition von "guter Lehre" lie-
ferte Fritz Süllwold (1997), emeritierter Professor für Psychologie an der Universität
Frankfurt/Main. "Gut" ist Lehre demnach, wenn "Wissen und Problemverständnis der
Studierenden auf dem betreffenden Gebiet signifikant erhöht" werden. Andere Leh-
rende wiederum legen den Schwerpunkt viel weniger auf die Vermittlung von Wissen,
sondern vielmehr darauf, Studierende für die zu vermittelnde Thematik zu interessie-
ren und zu selbständiger Beschäftigung damit zu motivieren. Es ließen sich noch eine
Reihe weiterer Standpunkte nennen. Zur Verdeutlichung der Breite, in der sich die
Diskussion um und die Vorstellungen von "guter Lehre" bewegt, sollte dies jedoch
genügen.
Als eine Art Zwischenbilanz der Diskussion (die man ja keineswegs als abgeschlossen
betrachten kann) läßt sich aufgrund der vorgelegten empirischen Befunde dennoch
festhalten: In eine Definition von "guter Lehre" sollten sowohl didaktische Aspekte,
als auch Aspekte der Studienbedingungen eingehen. Denn was nützt es, Studierende
beispielsweise zur eigenständigen Beschäftigung mit einem Thema zu motivieren,
wenn die nach besten didaktischen Kriterien empfohlene Literatur aufgrund der Bi-
bliothekssituation nicht nutzbar ist oder wenn aufgrund der Überfrachtung des Studi-
enganges das Zeitbudget der Studierenden selbst beim besten Willen nicht dazu aus-
reicht usw.? Im folgenden soll deshalb in die Betrachtung "guter Lehre" nicht allein

12
die (didaktische) Gestaltung von Lehrveranstaltungen eingehen, sondern das Konzept
"guter Lehre" um die Lehr- und Studienbedingungen erweitert werden.
2.2. Zu den Begriffen "Meßbarkeit" und "Evaluation" von Lehrqualität
Ob Lehrqualität meßbar ist, wie der Titel dieser Arbeit als Fragestellung aufwirft, ent-
scheidet sich vor allem daran, welche Ziele im Vordergrund stehen und welche Me-
thoden dem entsprechend verwendet werden. Wobei der Gegenstand der Messung die-
se natürlich durch seine Komplexität entsprechend beeinflußt. Die Fülle der Methoden
und Maßnahmen zur Feststellung wie auch Verbesserung der Lehrqualität wird hierbei
alltagssprachlich meist mit "Evaluation" umschrieben.
Dieser Begriff, in der gesamten Diskussion um die Qualität der Lehre immer wieder
verwendet, wird aber bei weitem nicht immer genau definiert. Seit Anfang der 90er
Jahre ist dieser Begriff gar zu einem "Modewort" avanciert, das sich durch "inflationä-
ren, oft unangemessenen Gebrauch" auszeichnet, wie einige Autoren meinen (Vgl.
Kellermann 1992: 142). Deshalb erscheint es hier notwendig, auch diesen Begriff ge-
nauer zu klären. Allgemeinsprachlich verstanden (frz.: évaluer: abschätzen, berechnen;
engl. evaluate: zahlenmäßig bestimmen, auswerten) meint dieser Begriff zunächst
einmal allgemein die "sach- und fachgerechte Bewertung eines Sachverhalts" (Vgl.
Schmitz 1995:40). Angesichts der Vielfalt der Maßnahmen und Methoden, die mit
diesem Begriff bezeichnet werden, erscheint dies zwar zutreffend, jedoch viel zu un-
genau. Werden doch mit Evaluation sowohl die Bewertung wissenschaftlicher Ein-
richtungen durch Expertengremien (z.B. in den neuen Bundesländern), als auch in
ökonomischen Kontexten Effizienzmessungen, sowie in Zusammenhang mit der Qua-
litätsdiskussion zur universitären Lehre eben die Studentenbefragungen in einen Topf
getan. (Vgl. Kromrey 1995: 313-316). Dabei beschreiben alle diese mit dem Begriff
Evaluation bezeichneten Maßnahmen höchst unterschiedliche Ziele und Methoden.
Kromrey verwies daher auf eine Definition des Arbeitskreises "Wirkungsanalysen und
Erfolgskontrolle in der Raumordnung" (1984: 30). Dort heißt es: "Evaluation kann als
die Aufgabe bezeichnet werden, Planungen, Programme, Projekte und Maßnahmen zu
bewerten." und fügte hinzu, daß Evaluation nicht von "irgend jemand" durchgeführt
wird, sondern von Personen, die in besonderer Weise dazu befähigt erscheinen. Au-
ßerdem betont er, daß Evaluation "systematisch", nach "zuvor präzise festgelegten"

13
und "explizit auf den zu bewertenden Sachverhalt bezogenen Kriterien" durchgeführt
werden muß. Ähnlich definieren Wottawa & Thierau (1990: 9 ff.) den Begriff Evalua-
tion als "systematische Beurteilung eines Programms oder Produktes". Evaluation
meint also fachwissenschaftlich, wie Kromrey diese Überlegungen zusammenfaßte:
Eine "methodisch kontrollierte Bewertung im Sinne der Messung von Qualität"
(Kromrey 1996a: 158). Danach wären also bloße Befragungen von Studierenden zu
ihrer Zufriedenheit nicht, wie dies alltagssprachlich mit dem Begriff "studentische
Lehrevaluation" oft geschieht, als solche zu bezeichnen. Evaluation in diesem Sinne
wäre es erst, wenn diese Studentenbefragungen in ein Konzept weiterer Maßnahmen
eingebunden würden. Um Begriffsverwirrungen vorzubeugen, wird im folgenden die
Bezeichnung studentische Lehr"evaluation" nicht mehr verwendet Der Begriff "Eva-
luation" wird nur noch in seiner fachwissenschaftlichen Bedeutung verwandt.
Man unterscheidet hierbei entsprechend der Zielstellungen der Evaluation in formative
und summative Evaluation. "Summative Evaluation liefert Resultate über den Zustand
der Lehre, formative Evaluation möchte durch die Erhebung den Zustand der Lehre
verbessern" (Vgl. Rindermann 1994: 40). Rindermann favorisiert hierbei eindeutig das
Konzept der formativen Evaluation, wobei die Ergebnisse an alle Betroffenen, also
auch an die Studierenden rückgemeldet werden und als Grundlage und Anregungen für
konkrete Maßnahmen zur Verbesserung der Lehr- und Studienbedingungen institutio-
nalisiert werden. Mit diesem Konzept können, besonders wenn die Befragung wie bei
HILVE (Heidelberger Inventar zur Lehrveranstaltungsevaluation) in der Mitte des Se-
mesters durchgeführt wird und so die Ergebnisse somit noch in denselben Lehrveran-
staltungen zum Tragen kommen, sowohl die Rücklaufquoten hochgehalten, als auch
die Zufriedenheit gesteigert werden. Dies wurde auch von Angelo (1992) und Abbott
et al. (1990) bestätigt.
Bei der formativen Evaluation ist jedoch zu beachten, daß bereits vorab mit allen Be-
teiligten geklärt sein muß, wofür die Ergebnisse verwendet werden sollen und wem sie
zur Kenntnis gelangen sollen (Studenten? Hochschulleitung? Ministerien?), um nicht
später auf enorme Widerstände zu treffen. Dies und welche Folgerungen, die sich aus
der Konkretisierung der einzelnen Methoden und Maßnahmen ergeben, soll im folgen-
den Abschnitt diskutiert werden.

14
2.3. Wie "gute Lehre" gemessen werden könnte (Operationalisierung)
Welche Instrumente und Items im einzelnen für die Einschätzung der Lehrqualität
verwendet werden, muß immer an den Zielen orientiert werden, die hiermit verfolgt
werden. Denkbar sind neben den Studentenbefragungen auch der Einsatz externer
Gutachter (peers), wie in der Begutachtung von Forschungsleistungen üblich, oder das
Heranziehen hochschulstatistischer Daten als Kennzahlen für gute Lehre. Die Beur-
teilung der Lehre durch externe Gutachter soll in verschiedener Form in die nachfol-
gende Diskussion zur Eignung von Studentenbefragungen als Instrument zur Beurtei-
lung der Lehre einfließen, da sie in der Validitätsforschung oft miteinander verglichen
und in der Praxis oft gemeinsam angewendet werden.
Hochschulstatistische Kennzahlen, mit all ihren eigenen Problemen der Validität und
Vergleichbarkeit, sollen in einem gesonderten Kapitel behandelt werden. Da jedoch
über die Ziele, die gute Lehre erreichen soll, keineswegs Einigkeit herrscht und, wie
bereits im vorhergehenden Abschnitt erläutert wurde, demzufolge auch keineswegs
immer das gleiche unter guter Lehre verstanden wird, kann hier kein "ideales", allge-
meingültiges Instrument entwickelt werden, das für alle Lehrveranstaltungen glei-
chermaßen geeignet wäre. Ebenso kann ein Instrument nicht immer gleichermaßen der
Rückmeldung an die Lehrenden mit dem Ziel der direkten Verbesserung der Kommu-
nikation und didaktischen Qualität der Lehre, als auch zur "Qualitätsmessung" mit
dem Ziel der leistungsabhängigen Mittelvergabe dienen.
Schon bei der Nennung der letzteren beiden Ziele wird erkennbar, daß hier ein Ziel-
konflikt existiert, der die Durchführung der Lehrevaluationen deutlich erschwert. So
weisen das Bielefelder Centrum für Hochulentwicklung und HIS Hannover, die die
Entwicklung der Evaluation durch ihre Forschungen maßgeblich mit vorantrieben, in
einer gemeinsamen Bestandsaufnahme der aktuellen Praxis darauf hin, daß es der ge-
setzlich vorgeschriebenen Evaluation häufig an präzisen Zielen mangelt bzw. diese
Ziele in Konflikten zueinander stehen (Barz u. a. 1997: 34). Besonders das angestrebte
Ziel, die Mittelvergabe an die Lehrevaluationen zu koppeln, führt dazu, daß andere
Ziele, nämlich die Transparenz über die tatsächlichen Studienbedingungen und eine
realistische Bestandsaufnahme der Qualität der Lehre am einzelnen Fachbereich oft
nicht mehr im Vordergrund stehen. Vielmehr wird versucht, die eigene Situation in
einem möglichst positiven Lichte darzustellen, um bei der Mittelvergabe nicht den
kürzeren zu ziehen. Hier muß zunächst einmal Klarheit über die vordringlichen Ziele

15
geschaffen und diese präzisiert werden, bevor die geeigneten Methoden und Instru-
mente diskutiert werden können. Die Wahl der richtigen Instrumente und Methoden ist
also direkt von der Lösung dieser Zielkonflikte abhängig. Instrumente, die vorrangig
zur Rückmeldung an die Lehrenden entwickelt wurden, sind nur bedingt bis überhaupt
nicht zur "Messung" von Lehrqualität und für Vergleiche von Lehrenden und Fachbe-
reichen untereinander geeignet. Dies hängt u.a. mit der nur unter bestimmten Bedin-
gungen gegebenen Vergleichbarkeit der Befragungsergebnisse und der ungenügenden
Berücksichtigung der Rahmenbedingungen des Studiums in diesen "Vorlesungsumfra-
gen" zusammen. Darauf wird später im Kapitel zur Vergleichbarkeit noch genauer
eingegangen werden.
Die bisher in der Bundesrepublik durchgeführten Maßnahmen zur Erhebung der Lehr-
qualität sind vor allem schwerpunktmäßig auf einzelne Lehrveranstaltungen ausge-
richtete Instrumente. Die wohl umfangreichsten Untersuchungen zu solch einem In-
strument wurden im Zusammenhang mit dem Heidelberger Inventar zur Lehrveran-
staltungsevaluation vorgelegt (Rindermann 1994, 1996). Wie dieses Konzept orientie-
ren sich jedoch zahlreiche weitere Projekte einzelner Hochschulen an der Evaluation
einzelner Lehrveranstaltungen, so z.B. das von Diehl (1994) vorgelegte und auch das
für die TU Dresden entwickelte Instrumentarium (Vgl. Schmitz 1995). Einen anwen-
derorientierten Fragebogen für Seminarveranstaltungen - vor allem sozialwissenschaft-
licher Fächer - entwickelte Reischmann (1995), zu dem jedoch Untersuchungen zu den
Skalenqualitäten bislang nicht vorliegen. Rindermann (1996: 46-52) stellt diese Pro-
jekte kurz vor und verweist auf weitere in diesem Kontext entwickelte. All diesen
Projekten geht es vor allem um didaktische Aspekte der Lehrveranstaltung (Auf-
bau/Struktur, Verständnis, Dozentenengagement usw.), kommunikative Aspekte (Kli-
ma/Atmosphäre, Diskussion, Beteiligung usw.) sowie motivationale Aspekte (The-
meninteresse, Besuchsgrund, Fleiß/Arbeitsaufwand usw.). Dies entspricht in etwa dem
von Webler vorgelegten Konzept der "Kriterien für gute akademische Lehre" (Vgl.
Webler 1991).
Fragen, die über die einzelne Lehrveranstaltung hinausgehen, wie z.B. zu den Studien-
bedingungen (Hörsaalplätze/Kursgröße, PC/Labor-Arbeitsplätze, Bibliothekssituation,
zum Arbeitsaufwand für das Studium insgesamt, zur Vielfalt/Praxisbezogenheit des
Lehrangebotes, zur Studienordnung, usw.) sind in diesen Konzepten meist nicht vorge-
sehen. Dies wird einerseits mit der Zielstellung begründet, die Fragebögen kurz halten

16
zu wollen, andererseits aber oft damit, daß die Studierenden vielleicht die Verständ-
lichkeit eines Dozentenvortrags einschätzen können, nicht jedoch die Rahmen-
bedingungen für ein effektives Lernen und Lehren. Inzwischen belegen jedoch mehrere
Studien, daß auch die Studierenden in Deutschland die Rahmenbedingungen ihrer
Lehr- und Studiensituation sehr wohl kompetent einzuschätzen vermögen (Vgl. u.a.
Daniel 1995 u. 1996, Rindermann 1994 und 1996, Hage 1996a u. 1996b).
Studien, die vor allem die didaktische Qualität untersuchten, hatten festgestellt, daß
"auch bei vorsichtiger Interpretation von Mittelwerten nur einzelne Dozenten und Ver-
anstaltungen relativ kritisch beurteilt werden" (Vgl. Rindermann 1996: 44). Studien
jedoch, die beides, also sowohl didaktische Aspekte der Lehre, als auch die Rahmen-
bedingungen der Lehre untersuchten, bestätigten diese relativ positive Einschätzung
der meisten Lehrveranstaltungen, weisen aber auf folgendes hin: "Defizite werden eher
in allgemeinen strukturellen Studienbedingungen gesehen (z.B. Betreuung, Überfül-
lung, Inhalte) als in den einzelnen konkreten Veranstaltungen" (Vgl Bargel 1993,
1994).
Lediglich Daniel, der an den beiden bundesweiten Studentenbefragungen des Nach-
richtenmagazins "Der Spiegel" maßgeblich beteiligt war, hatte in sein Konzept der
Fachbereichsevaluation an der Universität Mannheim und zur hierfür durchgeführten
Befragung der Studierenden zur Qualität der Lehre in größerem Umfang die Rahmen-
bedingungen einbezogen. Da die Universität Mannheim eine der ersten war, die sich
einer solchen Selbstevaluation unterzog, wie sie jetzt an vielen Hochschulen noch in
der Erprobungsphase sind, könnten diese Erfahrungen von allgemeinem Nutzen sein
(Vgl. Daniel 1996: 150 ff.).
Es waren denn auch vor allem die bundesweit durchgeführten Studentenbefragungen
zur Lehr- und Studiensituation, in denen zur Darstellung der Studiensituation in recht
unterschiedlichem Umfang Items zu den Rahmenbedingungen guter Lehre an den
Hochschulen enthalten sind. Während sich HIS in seiner letzten bundesweiten Studie-
rendenbefragung nur noch auf ein einziges, globales Item zur Studienqualität be-
schränkte, wurde von den Konstanzer Sozialforschern um Bargel im gleichen Zeitraum
versucht, ein möglichst umfassendes Bild der Situation an den repräsentativ ausge-
wählten Fachbereichen zu zeichnen (Fragebögen Vgl. HIS 1992: 538-539; 1995: 435;
Bargel u.a. 1995: 293). Die von Bargel verwendeten Indikatoren wurden in einer
Nachfolgeuntersuchung von Hage (1996b) auch auf ihre Validität hin überprüft.

17
Zusammengefaßt wurden dabei drei Elemente als wesentlich für die Beschreibung der
Studienqualität angesehen: Aufbau und Gliederung des Studienganges, Art und Durch-
führung der Lehrveranstaltungen sowie die inhaltliche Ausrichtung des Lehrangebots,
Beratung und Betreuung der Studierenden (Vgl. Bargel u.a. 1996: 111-126). Dies
deckt sich mit der Vorgängeruntersuchung von HIS, die sich noch etwas intensiver mit
der Bewertung des Lehrangebots beschäftigte: Unter den drei Hauptaspekten: Arbeits-
bedingungen im Fachbereich, Studienorganisation des Studienganges, Betreuung der
Studierenden durch die Lehrenden war noch eine größere Anzahl von Items in der
bundesweiten Studierendenbefragung enthalten (Vgl. HIS 1992: 441-454). Diese 1992
von HIS verwendeten Fragestellungen wurden in der für den "Spiegel" durchgeführten
Untersuchung weitgehend übernommen (Vgl. "Spiegel special" 3/1993: 7-9, Fragebo-
gen befindet sich auch im Anhang). Eine detaillierte Analyse der dort verwendeten
Items für die Soziologie legten die auch für die "Spiegel"- Untersuchung 1993 verant-
wortlichen Autoren Hornbostel und Daniel (1996) vor (Vgl. Hornbostel & Daniel
1996: 11-57).
Mit den vordringlich an der Lehrqualität einzelner Lehrveranstaltungen orientierten
Instrumenten und denen, die versuchen, auch die Studienbedingungen an den Fachbe-
reichen zu erfassen, stehen sich hier jedoch verschiedene Konzepte und Vorstellungen
von guter Lehre gegenüber, die es zunächst zu analysieren und zu systematisieren gilt,
ehe man daran geht, sich mit den einzelnen konkreten Indikatoren zu beschäftigen,
mittels derer "gute Lehre" operationalisiert werden soll.
2.4. Differenzierung der Evaluation auf verschiedene Ebenen
Hinter Evaluationen stehen oft verschiedene Konzepte. Deshalb gilt es zu klären, auf
welcher Ebene oder welchen Ebenen die Evaluation stattfinden soll. Wolter (1995)
unterscheidet zwischen Mikro-, Meso- und Makroebene. Als Mikroebene wird hier die
einzelne Lehrveranstaltung bezeichnet. Zahlreiche Evaluationsinstrumente beziehen
sich auf diese Ebene einer Mikropolitik der Verbesserung einzelner Lehrveranstal-
tungen. "Lehr- und Studienqualität umfassen jedoch wesentlich mehr als die Summe
einzelner Lehrveranstaltungen. Eine sinnvolle Evaluation der Hochschullehre muß sich
im Interesse einer ständigen Qualitätsverbesserung der Lehre primär auf die Ebene der
Studiengänge, ihrer Stärken und Schwächen, auf die Strukturen der Studienorgani-

18
sation und des akademischen Lehrbetriebes konzentrieren, statt auf einzelne Personen
oder Lehrveranstaltungen", betont Wolter (1995: 76).
Mit Mesoebene wird die Ebene einzelner Studiengänge bezeichnet, einschließlich de-
ren Studienprogramm, Lehrveranstaltungsangebot und institutioneller Rahmen-
bedingungen wie die Studienordnungen, aber auch die Ausstattungssituation der Fach-
bereiche, die diesen Studiengang ausbilden. Mit Makroebene schließlich wird die Ebe-
ne der Hochschule selbst, aber darüber hinausgehend auch die von den Ministerien und
Parlamenten vorgegebenen institutionellen Rahmenbedingungen wie Verordnungen,
Gesetze sowie Mittelzuweisungen bezeichnet. Die Überlegungen, die Evaluation auf
verschiedenen Ebenen auszudifferenzieren, finden sich ebenso in der im folgenden
noch zu erläuternden "Informationspyramide" nach Barz u.a. (1997).
Die Frage dabei ist jedoch, in welcher Form, wie oft und in welchem Umfang es sinn-
voll ist, die Erhebung dieser Rahmenbedingungen in die semesterweise stattfindenden
Lehrveranstaltungsumfragen einzubeziehen. Einige Autoren befürchten gar, daß das
Instrument der studentischen Teilnehmerbefragung überfrachtet wird (Vgl. Grühn/
Gattwinkel 1992). Hier ist deshalb eine Abwägung nötig, die sich stark an den jeweils
verfolgten Zielen orientieren muß.
Diese Ziele sind aber oft noch nicht klar genug formuliert, um eine wirklich zielge-
richtete Evaluation durchführen zu können. Darauf wurde in Bestandsaufnahmen zur
Evaluation der Lehre immer wieder hingewiesen (Vgl. Webler 1992: 153-173; Hage
1996a: 15; Barz u.a. 1997: 26 ff.). So enthalten zahlreiche der inzwischen in allen
Bundesländern gesetzlich verankerten Lehrberichte zwar Ansätze zur Einbeziehung
der Rahmenbedingungen des Studiums. Jedoch ist vielerorts nicht klar, für wen (wel-
che Zielgruppe) die Lehrberichte anzufertigen sind und was mit den Ergebnissen ge-
schehen soll.
Hier ist deshalb eine klarere Zielbestimmung und eine Klärung notwendig, welche
Ergebnisse genau für wen bestimmt sind. Sinnvoll erscheint es, hier nach dem Modell
einer "Informationspyramide" vorzugehen, nach der auf Studiengangs- und Fachbe-
reichsebene detailliert auf Stärken und Schwächen eingegangen und an ihrer Verbesse-
rung gearbeitet wird. Mit jeder höheren Hierarchieebene (Hochschulleitung, Ministeri-
en) sollte sich jedoch mehr auf die Kerninformationen und verallgemeinerbare Resul-
tate beschränkt werden (Vgl. Barz u.a. 1997: 62). Barz u.a. schlagen dabei eine Be-

19
griffstrennung in "Evaluationsberichte" (umfassende, selbstkritische Bestandsaufnah-
me) und "Lehrberichte" (für die Außendarstellung bestimmt) vor:
(Quelle: Barz u.a. 1997: 62)
Für eine solche Trennung und stärkere Differenzierung der allzu allgemein mit Eva-
luation beschriebenen Maßnahmen nach ihrer jeweiligen Funktion spricht auch, daß
sich viele der in den Lehrberichten darzustellenden Aspekte nicht auf die Ebene ein-
zelner Veranstaltungen, sondern auf die Ebene des Studiengangs, der Fakultät bzw. der
gesamten Hochschule beziehen, während die studentische Veranstaltungskritik eher als
Rückmeldung an die Lehrenden verstanden wird. Viele der Vorbehalte von Lehrenden
dürften auch aus dieser offensichtlichen Methodeninadäquanz zu den Zielen der Lehr-
berichte resultieren. Da meist nicht klar ist, welche Gewichtung den studentischen
Teilnehmerbefragungen neben anderen Kriterien und Kennzahlen beigemessen werden
soll, wird hier oft der "schlimmste" denkbare Fall angenommen, wodurch Evaluati-
onsmaßnahmen gebremst, verzögert oder z.T. sogar rundheraus verweigert werden.
Auch oder gerade weil die Diskussion um die Qualität der Lehre und des Studiums vor
dem Hintergrund zunehmender Sparmaßnahmen bei steigenden Studentenzahlen und
der dadurch zu befürchtenden Verschlechterung der Rahmenbedingungen des Studi-
ums geführt wird, erscheint es besonders notwendig, daß dieser Aspekt gegenüber ei-
nem rein didaktisch geprägten Konzept der Evaluation einzelner Lehrveranstaltungen

20
an Bedeutung gewinnt. Da all dies für die bereits eingangs bei der Definition "guter
Lehre" vorgenommene Erweiterung des Konzeptes um die Rahmenbedingungen
spricht, erscheint es geradezu unerläßlich, diese Definition auch bei der Operationali-
sierung einzuarbeiten. Wie dies aussehen könnte, wäre allerdings nur exemplarisch
darzustellen, da es - wie bereits mehrfach betont - schwierig ist, allgemeingültige In-
strumente zu entwickeln. Als Beispiel böte sich Sachsen an, da hier erst im Mai 1997
eine Lehrberichtsverordnung erlassen wurde, nach der für den jährlich zu erstellenden
"kleinen" Lehrbericht neben der Darstellung der "inhaltlichen und didaktischen Qua-
lität der Lehre" auch eine Berichterstattung über die Betreuung sowie die Maßnahmen
zur Einhaltung der Regelstudienzeit erfolgen soll. Dabei soll u.a. Auskunft gegeben
werden über die (Verbesserung der) Lehr- und Studienbedingungen, insbesondere be-
züglich des Studienprogramms, des Studienablaufs, der Lehr- und Lernorganisation
sowie über ggf. vorhandene personelle, räumliche oder sachliche Defizite (erstmals
erwähnt in:. Hage 1996a: 33; gültig seit Veröffentlichung im Sächsisches Gesetz- u.
Verordnungsblatt Nr. 10 vom 9. Mai 1997, S. 386-387).
Für die Darstellung der im Lehrbericht geforderten Aspekte sind die Lehrenden ebenso
wie die in den zuständigen Gremien damit befaßten Studierenden bisher allein auf ihre
persönlichen Erfahrungen angewiesen. Diese Erfahrungen gehen aber sowohl bei den
Lehrenden, als auch bei den Studierenden aufgrund ihrer geringen Anzahl in diesen
Gremien nur selten über den eigenen Lehrstuhl hinaus. Deshalb muß man hier von
einer hohen Subjektivität ausgehen. Die Vorlesungsumfragen könnten, wenn sie die
Rahmenbedingungen des Studiums mit erfaßten, wertvolle Anregungen und Hinweise
zur adäquaten Einschätzung und Verbesserung der Rahmenbedingungen der Lehre
bieten, was in dieser Breite anders nicht zu leisten wäre.
So umfassend wie die bundesweit durchgeführten Befragungen zur Studiensituation,
die zudem noch auf hochschulübergreifende Vergleiche (nicht jedoch Rankings!) aus-
gelegt waren, können und sollten Lehrveranstaltungsbefragungen nicht in jedem Se-
mester sein. Hier ist Aufwand und Nutzen abzuwägen und darauf hinzuweisen, daß für
wirklich umfassende Untersuchungen auch die Bereitstellung zusätzlicher Mittel not-
wendig wäre. Jedoch könnte schon durch die Aufnahme einiger wesentlicher Items
eine breitere Darstellung der Lehr- und Studiensituation, wie sie in den meisten Lehr-
berichten gefordert wird, deutlich erleichtert werden. Dies würde die Fragebögen auch
nicht über die Akzeptanzgrenze hinaus verlängern, wie dies von einigen Autoren be-

21
fürchtet wurde. Die Akzeptanz der Studentenbefragungen - zumindest bei den Studie-
renden - ist zudem in starkem Maße davon abhängig, wie deren Notwendigkeit und
Sinnhaftigkeit den Studierenden erläutert wird und ob sie über die Ergebnisse der Be-
fragungen informiert, besser noch über Konsequenzen und Veränderungsvorschläge
mit ihnen diskutiert wird (Vgl. Koebke 1996: 15, Rindermann 1996). Eine ausführli-
che Erläuterung und Dokumentation der vorgeschlagenen exemplarischen Operationa-
lisierung anhand des für die TU Dresden verwendeten Fragebogens soll an dieser
Stelle jedoch nicht mehr vorgenommen werden. Diese und der Fragebogen einschließ-
lich einiger Anmerkungen befindet sich im Abschnitt "Anwendungen und Schlußfol-
gerungen", bzw. im Anhang.
Fazit
Es muß festgestellt werden, daß keine einheitliche, für alle Hochschulen und Lehrver-
anstaltungen allgemeingültige Definition von "guter Lehre" vorgelegt werden kann.
Eine Definition, die sich vorwiegend an hochschuldidaktischen Aspekten orientiert,
greift zu kurz. Der Prozeß des Lehrens und Lernens ist ein höchst komplexer, in dem
auch die Rahmenbedingungen eine große Rolle spielen. Dies zeigt sich u.a. daran, daß
Defizite im Lehrprozeß in einigen Studien, die die Rahmenbedingungen einbezogen,
nicht so sehr in der Durchführung von Lehrveranstaltungen gesehen wurden, sondern
vor allem bei den Rahmenbedingungen.
Deshalb sollte, wenn man "gute Lehre" messen will, eine Einbeziehung solcher Rah-
menbedingungen in die Definition "guter Lehre", und darausfolgend auch bei der Ope-
rationalisierung erfolgen. Gerade bei der Operationalisierung zeigt sich jedoch, daß an
unterschiedlichen Hochschulen und Fachbereichen ganz spezifische Bedingungen,
Probleme und Vorstellungen bei der Durchführung der Lehre vorhanden sind. Zu-
nächst muß deshalb in einem sozialen Aushandlungsprozeß Klarheit über die Ziele
hergestellt werden, die erreicht werden sollen. Klarheit muß auch über die Zielgruppe
hergestellt werden, für die die zusammenzutragenden Informationen bereitgestellt
werden sollen. Erst dann können die geeignetsten Methoden und Instrumente ausge-
wählt werden. Zur Messung von Lehrqualität auf der Ebene einzelner Lehrveranstal-
tungen gibt es bereits zahlreiche Instrumente, von denen einige bereits intensiv auf ihre

22
Validität und Zuverlässigkeit untersucht wurden. Diese Untersuchungen sollen im fol-
genden Abschnitt vorgestellt werden.

23
3. Validität und Zuverlässigkeit studenti-
scher Lehrbewertungen
Sind mittels Studentenumfragen gültige Aussagen über Lehrqualität möglich? Haben
Studierende überhaupt die nötige Kompetenz, um ihre Lehrenden einzuschätzen? Wie
zuverlässig sind studentische Urteile? Dies sind die Fragen, mit denen sich das fol-
gende Kapitel beschäftigen wird. Ausgenommen hiervon ist die Frage der Vergleich-
barkeit studentischer Urteile, die aufgrund ihrer Bedeutung in einem gesonderten Ka-
pitel diskutiert werden soll.
3.1. Die Bedeutung der Validität und Zuverlässigkeit studentischer Ur-
teile für die Einschätzung von Lehrqualität
Studentische Urteile sind, will man sie als Kriterium für Lehrqualität im eingangs de-
finierten breiteren Sinne behandeln, nur im Zusammenhang mit anderen Kriterien
wirklich aussagekräftig. Dies hat seine Ursache u. a. darin, daß unterschiedliche Be-
wertungen nicht zwingend das Produkt unterschiedlicher Qualitäten sein müssen, son-
dern auch durch verschiedene andere Ursachen hervorgerufen sein können. Neben tat-
sächlich vorhandenen Unterschieden in der Lehr- und Studienqualität, für die die Ein-
schätzung durch die Studierenden als gültiger Indikator dienen soll, können auch un-
terschiedliche Erwartungshaltungen sowie geschlechts- und gruppenspezifisches Ur-
teilsverhalten Ursachen für unterschiedliche Bewertungen sein (Vgl. z.B. Rindermann
1994: 32). Solchen "Verzerrungen" in der Bewertung kann einerseits dadurch begegnet
werden, daß man die "verzerrenden" Faktoren erhebt und bei der Auswertung stati-
stisch kontrolliert. Andererseits kann versucht werden, durch die Erhebung "objekti-
ver" Daten (z.B. des Betreuungsverhältnisses) das Urteil der Studenten (in diesem
Falle zur Betreuungssituation) gewissermaßen zu kontrollieren und ggf. zu relativie-
ren. Selbstverständlich werfen solche "objektiven" Daten wieder ganz eigene Proble-
me auf. Um diese soll es aber hier nicht gehen, da sie an anderer Stelle genauer disku-
tiert werden. Aber zur Verdeutlichung, daß studentische Bewertungen, will man sie als
Leistungsindikator für gute Lehre verwenden, sowohl einer fachkompetenten Inter-

24
pretation bedürfen, als auch eine umfangreichere Datenerhebung nötig machen, mag
dies vorerst genügen.
Dennoch: Bei aller gebotenen Zurückhaltung erscheinen gerade die subjektiven Urteile
der Studierenden vor allem aus zwei Gründen unverzichtbar für eine zumindest annä-
hernd realitätsgetreue Darstellung der Lehr- und Studienqualität an einem Fachbereich:
Zum ersten sind dies die Mängel, Ungereimtheiten und Vereinfachungen, die durch
eine rein zahlenmäßige Erhebung von "Leistungskennzahlen", wie sie beispielsweise
die Kultusministerkonferenz Ende 1995 beschloß, notwendigerweise entstehen (Vgl.
KMK 1995; Gralki 1993: 64; Hage 1996a). Und zum zweiten ist dies die Tatsache,
daß nur durch Befragung der Betroffenen die für das Arbeitsklima und tatsächlichen
Lern- und Lehrerfolge neben den "objektiven" Rahmenbedingungen ebenso wichtigen
subjektiven Zufriedenheiten und Befindlichkeiten zu erfahren sind (Vgl. Mohler 1995:
61 ff.) Deshalb soll im folgenden Abschnitt detailliert darauf eingegangen werden,
welche der den studentischen Lehrbewertungen vorgeworfenen Mängel und Schwä-
chen diese tatsächlich aufweisen, und welche Bedingungen notwendig wären, um
trotzdem zuverlässige Aussagen über Lehrqualität treffen zu können.
Gegen die Verwendung von studentischen Urteilen zur Charakterisierung der Lehr-
und Studiensituation wird immer wieder eine ganze Reihe von Einwänden vorge-
bracht. Dies geschieht besonders oft im Zusammenhang mit der Verwendung solcher
studentischer Einschätzungen als Kriterium zur Beurteilung der Lehrqualität von
Fachbereichen in sogenannten "Rankinglisten". Deshalb sollen diese häufigsten Ein-
wände gegen die "Messung" von Lehrqualität ausführlich diskutiert werden. Die Ein-
wände beziehen sich größtenteils auf die angenommene mangelnde Validität, Reliabi-
lität, Konsistenz und Stabilität von Studentenbefragungen. Es wird unterstellt, daß
mittels einer Befragung von Studierenden kein zutreffendes Bild von der Lehr- und
Studiensituation an einem Fachbereich zu erhalten sei. Ein weiteres Argument ist, daß
die Ergebnisse von Studierendenbefragungen, selbst wenn diese valide wären, durch
verzerrende Einflußfaktoren nicht vergleichbar sind, und damit für eine Messung von
Lehrqualität wertlos. Auf diese Einflußfaktoren, oft auch als Bias-Variablen bezeich-
net, soll jedoch erst im Zusammenhang mit der Untersuchung der Vergleichbarkeit
genauer eingegangen werden, da sie dort eine größere Rolle spielen.

25
3.2. Wie sich Validität und Zuverlässigkeit feststellen lassen
Hier soll zuallererst auf das Argument der mangelnden Validität eingegangen werden.
Unter Validität wird hierbei verstanden, ob durch das Meßinstrument - also in diesem
Falle die Studentenbefragungen zur Qualität der Lehre - tatsächlich das gemessen
wird, was gemessen werden soll (Vgl. Schnell u.a. 1992: 162). Bei der Bestimmung
der Validität wird hierbei noch nach Inhaltsvalidität, Kriteriumsvalidität und Kon-
struktvalidität unterschieden.
Inhaltsvalidität meint, ob alle Aspekte des zu messenden Sachverhaltes erfaßt werden.
Das bedeutet in diesem Fall, daß möglichst viele verschiedene Aspekte "guter Lehre"
erfaßt werden sollten. So sollte man z.B. nicht allein von einem einzigen Indikator, z.
B. der Studierzufriedenheit, oder der Examensnote, allein auf "gute" oder "schlechte"
Lehre schließen, da die Lehre ein zu komplexer Gegenstand mit zu vielen Aspekten
ist, um von einem einzigen oder einigen wenigen Indikatoren valide Aussagen darüber
treffen zu können. Hierauf wurde bereits unter dem Abschnitt "Operationalisierung"
genauer eingegangen, deshalb soll hier nur darauf verwiesen werden.
Anders ist es bei der Kriteriumsvalidität. Hiermit ist gemeint, ob ein mit dem gerade
zur Messung verwendeten Kriterium erzieltes Ergebnis mit einem mittels einer ande-
ren Methode erzieltem Meßergebnis übereinstimmt bzw. ob es einen Zusammenhang
zwischen den beiden Kriterien gibt. Dies wird von einigen Autoren auch als externe
Validierung bezeichnet. Kriteriumsvalidität würde also in diesem Fall bedeuten, ob die
mittels Studentenumfragen erzielten Ergebnisse mit anders gewonnenen Aussagen
über die Lehrqualität, z.B. mit Befragung von Absolventen oder den Einschätzungen
externer Gutachter hinreichend übereinstimmen. Darauf wird im folgenden noch ge-
nauer eingegangen werden.
Und schließlich gibt es noch eine dritte Möglichkeit zur Einschätzung der Validität:
Die Konstruktvalidität. Nach Schnell u.a. (1992) liegt Konstruktvalidität dann vor,
wenn aus dem Konstrukt empirisch überprüfbare Aussagen über Zusammenhänge die-
ses Konstruktes mit anderen Konstrukten theoretisch hergeleitet werden können und
sich diese Konstrukte empirisch nachweisen lassen. Im Gegensatz zur Kriteriumsvali-
dität sind bei der Konstruktvalidität explizite theoretische Annahmen über die Zu-
sammenhänge zwischen theoretischen Dimensionen Bestandteil des Validierungspro-
zesses. Dies findet sich z.B. bei Rindermann (1996) bei seinen explizit ausformulierten
verschiedenen Dimensionen von "guter Lehre" wieder (Vgl. Erläuterungen zum

Details

Seiten
Erscheinungsform
Originalausgabe
Jahr
1997
ISBN (eBook)
9783832405434
ISBN (Paperback)
9783838605432
Dateigröße
3.1 MB
Sprache
Deutsch
Institution / Hochschule
Technische Universität Dresden – Unbekannt
Schlagworte
lehrbewertung lehrqualität prof-tüv ranking studentenbefragung
Zurück

Titel: Ist "gute Lehre" meßbar?
book preview page numper 1
book preview page numper 2
book preview page numper 3
book preview page numper 4
book preview page numper 5
book preview page numper 6
book preview page numper 7
book preview page numper 8
book preview page numper 9
book preview page numper 10
book preview page numper 11
book preview page numper 12
book preview page numper 13
book preview page numper 14
book preview page numper 15
book preview page numper 16
book preview page numper 17
book preview page numper 18
book preview page numper 19
book preview page numper 20
book preview page numper 21
book preview page numper 22
book preview page numper 23
book preview page numper 24
book preview page numper 25
book preview page numper 26
125 Seiten
Cookie-Einstellungen