Zusammenfassung
Die Geschichte der Kopfnoten, d. h. der Noten der allgemeinen Beurteilung eines Schülers, die wegen ihrer Stellung am Kopf des Zeugnisses Kopfnoten genannt werden, ist sehr wechselvoll. So war es Anfang des 20. Jahrhunderts allgemein üblich, dass in deutschen Schulen Zensuren für Betragen, Ordnungsliebe und Fleiß vergeben wurden. In den 60er - 70er Jahren wurden die Kopfnoten in den meisten alten Bundesländern, nach der Wende auch in den neuen Bundesländern, abgeschafft .Dies geschah nicht zuletzt deshalb, weil die Ungenauigkeit der Erfassung des Schülerverhaltens in den Blick gerückt wurde. Daneben galt, dass es nicht in den Aufgabenbereich der Schule gehören dürfe, die Persönlichkeit der Schüler zu beurteilen: Die Schule beurteilt Leistungen, nicht Charaktere.
Umso mehr überrascht die Kehrtwende, die viele Bundesländer in den letzten Jahren vollzogen haben. Seit Ende der 1990er Jahre findet sich in immer mehr Bundesländern eine Verordnung zur Wiedereinführung von Kopfnoten. Die Wiedereinführung von Noten, die einige Jahre zuvor bewusst abgeschafft worden sind, legt nahe, dass diesen eine wichtige Bedeutung vonseiten der Beteiligten zugemessen wird. So keimte z. B. in Thüringen die Hoffnung auf, dass durch eine Wiedereinführung der Noten-ergänzenden Beurteilung eine Qualitätsnachbesserung erreicht werden könne. Oder wie Nordrhein-Westfalens Schulministerin Barbara Sommer Ende 2008 formulierte: Kopfnoten ermöglichen eine transparente und differenzierte Rückmeldung zum Entwicklungsstand von Kindern und Jugendlichen. So können wir jedes einzelne Kind noch individueller in den Blick nehmen. Für die Schüler bedeute, so die Pressemeldung, die Bewertung des Arbeits- und Sozialverhaltens eine klare und hilfreiche Rückmeldung. Für die Eltern und Arbeitgeber ergebe sich durch diese Maßnahme ein zusätzliches Bild über die Persönlichkeit des Schülers, als sinnvolle Ergänzung zu den Fachnoten. Solch euphorischen Aussagen wecken den Wunsch, die Noten aufgrund ihres Gehaltes zu überprüfen. Werden die Noten tatsächlich dieser Rolle gerecht? Für eine Qualitätsverbesserung des Zeugnisses müssten mit den Kopfnoten demnach zusätzliche Informationen, über die fachliche Leistungsbeurteilung hinaus, erteilt werden. Weiterhin müssten diese Informationen wesentlich für das erhobene Merkmal sein.
Die hier vorliegende Arbeit gliedert sich in zwei große Teile, einen Theorieteil und einen praktischen Teil.
Im Theorieteil in Kapitel 2 […]
Leseprobe
Inhaltsverzeichnis
Inhaltsverzeichnis
Abbildungsverzeichnis
1 Einleitung
Teil I – Theoretische Grundlagen
2 Kopfnoten
2.1 Gesetzliche Grundlagen
2.2 Interpretation von Kopfnoten
2.3 Schulinterne inhaltliche Konkretisierungen
3 Gütekriterien von Beurteilungen
3.1 Objektivität
3.2 Reliabilität
3.3 Validität
4 Problemkreise zur Beurteilung von Schülern
4.1 Beurteilungstendenzen
4.1.1 Der Begriff der Impliziten Persönlichkeitstheorie (IPT)
4.1.2 Modell zur Wahrnehmung und Erfassen von Informationen
4.1.3 Informationsreduktion
4.1.4 Selektive Wahrnehmung von Eigenschaften
4.1.5 Sich-selbst-erfüllende Vorhersage
4.1.6 Konkrete Beeinflussungsarten
4.2 Interdependenzen zwischen Schüler- und Lehrerverhalten
4.3 Umgang mit Beurteilungstendenzen
Teil II Empirische Studie
5 Statistische Grundlagen
5.1 Häufigkeitsverteilungen
5.2 T-Test für unabhängige Stichproben
5.3 Mittelwertvergleich mit ANOVA (Analysis of Variance)
5.4 Zusammenhangsmaße
5.4.1 Korrelationskoeffizient nach Pearson für metrisch skalierte Merkmale
5.4.2 Kontingenzkoeffizient für nominal-skalierte Merkmale
5.5 Faktorenanalyse
6 Die empirische Untersuchung
6.1 Beschreibung der Exploration
6.1.1 Instrumente
6.1.2 Beschreibung der Stichprobe
6.1.3 Beschreibung der erhobenen Daten
6.1.4 Beschreibung des Lehrerfragebogens
6.2 Auswertung der soziologischen Daten der Umfrage
6.2.1 Auswertung des Merkmals Geschlecht
6.2.2 Auswertung des Merkmals Migrationshintergrund
6.2.3 Auswertung des Lehrer-Fragebogens - Personendaten
6.3 Häufigkeiten der Kopfnoten
6.4 Empirische Analyse der Noten
6.4.1 Deskriptive Gesamtauswertung über alle Schulen
6.4.2 Häufigkeitsverteilungen der Kopfnoten
6.4.3 Häufigkeitsverteilungen von Geschlecht und Kopfnoten
6.4.4 Häufigkeitsverteilungen Migrationshintergrund und Kopfnoten
6.4.5 Mittelwertvergleich zwischen den Noten (ANOVA)
6.4.6 Untersuchung der Kopfnoten/Fachnoten - Häufigkeiten
6.4.7 Vergleich von vier Klassen über zwei Schuljahre
6.4.8 Faktorenanalyse
6.5 Auswertung des Lehrer-Fragebogens: Einflussfaktoren auf die Kopfnoten
6.5.1 Geschlecht
6.5.2 Sympathie
6.5.3 Außerschulische Informationen
6.5.4 Kollegen
6.5.5 Zusammenhang der Kopfnoten
6.5.6 Kopfnoten als Ergänzung der Fachnoten
6.6 Altersspezifische Analyse der Lehrerdaten
6.6.1 Geschlecht
6.6.2 Sympathie
6.6.3 Außerschulische Informationen
6.6.4 Kollegen
6.6.5 Zusammenhang der Kopfnoten
6.6.6 Kopfnoten als Ergänzung der Fachnoten
6.7 Weitere Beeinflussungstendenzen
7 Kritische Anmerkungen zur durchgeführten Exploration
7.1 Datenlage
7.2 Lehrerfragebogen
8 Zusammenfassung der Ergebnisse
9 Literaturverzeichnis
10 Anhang
Abbildungsverzeichnis
Abbildung 1: Hilfe zur Bewertung von Verhaltensformen
Abbildung 2: Interpretationen einer Mitarbeitsnote "gut"
Abbildung 3: Interpretation einer Verhaltensnote "befriedigend"
Abbildung 4: Bewertungskriterien für das Sozialverhalten
Abbildung 5: Bewertungskriterien für das Arbeitsverhalten
Abbildung 6: Hof-effekt
Abbildung 7: Richtwerte für die Interpretation von Korrelationskoeffizienten
Abbildung 8: Häufigkeiten: Geschlecht/Migrationshintergrund
Abbildung 9: Geschlecht der Lehrer
Abbildung 10: Alter der Lehrer
Abbildung 11: Häufigkeiten der Kopfnoten
Abbildung 12: Deskriptive Statistik der Daten
Abbildung 13: Beobachtete und erwartete Anzahl der Kopfnoten
Abbildung 14: Kreuztabelle Verhalten/Geschlecht
Abbildung 15: T-Test auf Unabhängigkeit Verhalten/Geschlecht
Abbildung 16: Kontingenzkoeffizient Verhalten/Geschlecht
Abbildung 17: Kreuztabelle Mitarbeit/Geschlecht
Abbildung 18: Kontingenzkoeffizient Mitarbeit/Geschlecht
Abbildung 19: Zusammenhang Verhalten/Migrationshintergrund
Abbildung 20: Zusammenhang Mitarbeit/Migrationshintergrund
Abbildung 21: Mittelvertvergleich Verhalten/Mitarbeit
Abbildung 22: Deskriptive Statistiken ANOVA: Mitarbeit zu Verhalten
Abbildung 23: Deskriptive Statistiken ANOVA: Verhalten zu Mitarbeit
Abbildung 24: gepaarte Stichprobe: Mitarbeit/Verhalten
Abbildung 25: Korrelation Verhalten/Mitarbeit
Abbildung 26: Graphischer Mittelwertvergleich Verhalten/Fachnoten, I
Abbildung 27: Graphischer Mittelwertvergleich Verhalten/Fachnoten, II
Abbildung 28: Deskriptive Statistiken ANOVA: Verhalten/Fachnoten
Abbildung 29: Grafischer Mittelwertvergleich Mitarbeit/Fachnoten, I
Abbildung 30: Grafischer Mittelwertvergleich Mitarbeit/Fachnoten, II
Abbildung 31: Deskriptive Statistiken ANOVA: Mitarbeit/Fachnoten
Abbildung 32: Korrelation Verhalten/Deutsch
Abbildung 33: Korrelation Verhalten/Englisch
Abbildung 34: Korrelation Verhalten/Mathematik
Abbildung 35: Korrelation Verhalten/Sport
Abbildung 36: Korrelation Mitarbeit/Deutsch
Abbildung 37: Korrelation Mitarbeit/Englisch
Abbildung 38: Korrelation Mitarbeit/Mathematik
Abbildung 39: Korrelation Mitarbeit/Sport
Abbildung 40: Korrelationen der Noten, Gesamtauswertung
Abbildung 41: Korrelationen der Noten in Schule 1
Abbildung 42: Korrelationen der Noten in Schule 2
Abbildung 43: Korrelationen der Noten in Schule 3
Abbildung 44: Korrelationen der Noten in Schule 4
Abbildung 45: Korrelationen Schule 2, 2007
Abbildung 46: Korrelationen Schule 2, 2008
Abbildung 47: Kommunalitäten für die ermittelte Lösung, Gesamtauswertung
Abbildung 48: Erklärte Gesamtvarianz, Gesamtauswertung
Abbildung 49: Komponentenmatrix, Gesamtauswertung
Abbildung 50: Erklärte Gesamtvarianz Schule 1
Abbildung 51: Kommunalitäten Schule 1
Abbildung 52: Rotierte Komponentenmatrix Schule 1
Abbildung 53: Zusammenhang Geschlecht/Verhalten Schule 1
Abbildung 54: Zusammenhang Geschlecht/Mitarbeit Schule 1
Abbildung 55: Zusammenhang Migrationshintergrund/Verhalten Schule 1
Abbildung 56: Zusammenhang Migrationshintergrund/Mitarbeit Schule 1
Abbildung 57: Kommunalitäten Schule 2 2007
Abbildung 58: Erklärte Gesamtvarianz Schule 2 2007
Abbildung 59: Rotierte Komponanentenmatrix Schule 2 2007
Abbildung 60: Erklärte Gesamtvarianz Schule 2 2008
Abbildung 61: Kommunalitäten Schule 2 2008
Abbildung 62: Komponentenmatrix Schule 2 2008
Abbildung 63: Kommunalitäten Schule 3
Abbildung 64: Erklärte Gesamtvarianz Schule 3
Abbildung 65: Komponentenmatrix Schule 3
Abbildung 66: Kommunalitäten Schule 4
Abbildung 67: Erklärte Gesamtvarianz Schule 4
Abbildung 68: Komponentenmatrix Schule 4
Abbildung 69: Lehrerfragebogen: Geschlecht
Abbildung 70: Lehrerfragebogen: Sympathie
Abbildung 71: Lehrerfragebogen: Außerschulische Informationen
Abbildung 72: Lehrerfragebogen: Kollegen
Abbildung 73: Lehrerfragebogen: Zusammenhang der Kopfnoten
Abbildung 74: Lehrerfragebogen: Kopfnoten als Ergänzung der Fachnoten
Abbildung 75: Zusammenhang Alter/Geschlecht
Abbildung 76: Zusammenhang Alter/Sympathie
Abbildung 77: Zusammenhang Alter/Außerschulische Informationen
Abbildung 78: Zusammenhang Alter/Beeinflussung durch Kollegen
Abbildung 79: Zusammenhang Alter/Unabhängigkeit der Kopfnoten
Abbildung 80: Zusammenhang Alter/Kopfnoten als Ergänzung sinnvoll
1 Einleitung
Die Geschichte der Kopfnoten, d. h. der Noten der allgemeinen Beurteilung eines Schülers, die wegen ihrer Stellung am Kopf des Zeugnisses Kopfnoten genannt werden, ist sehr wechselvoll (vgl. im Folgenden THOMAS 2007, S. 116). So war es Anfang des 20. Jahrhunderts allgemein üblich, dass in deutschen Schulen Zensuren für „Betragen“, Ordnungsliebe“ und „Fleiß“ vergeben wurden. In den 60er - 70er Jahren wurden die Kopfnoten in den meisten alten Bundesländern, nach der Wende auch in den neuen Bundesländern, abgeschafft (vgl. ARNOLD/VOLLSTÄDT 2001, S. 201). Dies geschah nicht zuletzt deshalb, weil die Ungenauigkeit der Erfassung des Schülerverhaltens in den Blick gerückt wurde. Daneben galt, dass es nicht in den Aufgabenbereich der Schule gehören dürfe, die Persönlichkeit der Schüler[1] zu beurteilen (vgl. IM BRAHM 2006, S. 351): „Die Schule beurteilt Leistungen, nicht Charaktere“ (HAMMES 2008).
Umso mehr überrascht die Kehrtwende, die viele Bundesländer in den letzten Jahren vollzogen haben. Seit Ende der 1990er Jahre findet sich in immer mehr Bundesländern eine Verordnung zur Wiedereinführung von Kopfnoten (vgl. ARNOLD/ VOLLSTÄDT 2001, S. 202). Die Wiedereinführung von Noten, die einige Jahre zuvor bewusst abgeschafft worden sind, legt nahe, dass diesen eine wichtige Bedeutung vonseiten der Beteiligten zugemessen wird (vgl. im Folgenden BEUTEL 2005, S. 134f.). So keimte z. B. in Thüringen die Hoffnung auf, dass durch eine Wiedereinführung der Noten-ergänzenden Beurteilung eine Qualitätsnachbesserung erreicht werden könne. Oder wie Nordrhein-Westfalens Schulministerin Barbara Sommer Ende 2008 formulierte: "Kopfnoten ermöglichen eine transparente und differenzierte Rückmeldung zum Entwicklungsstand von Kindern und Jugendlichen. So können wir jedes einzelne Kind noch individueller in den Blick nehmen" (Pressemeldung des Ministeriums für Schule und Weiterbildung NRW 2008, vgl. im Folgenden ebenda). Für die Schüler bedeute, so die Pressemeldung, die Bewertung des Arbeits- und Sozialverhaltens eine klare und hilfreiche Rückmeldung. Für die Eltern und Arbeitgeber ergebe sich durch diese Maßnahme ein zusätzliches Bild über die Persönlichkeit des Schülers, als sinnvolle Ergänzung zu den Fachnoten. Solch euphorischen Aussagen wecken den Wunsch, die Noten aufgrund ihres Gehaltes zu überprüfen. Werden die Noten tatsächlich dieser Rolle gerecht? Für eine Qualitätsverbesserung des Zeugnisses müssten mit den Kopfnoten demnach zusätzliche Informationen, über die fachliche Leistungsbeurteilung hinaus, erteilt werden. Weiterhin müssten diese Informationen wesentlich für das erhobene Merkmal sein.
Die hier vorliegende Arbeit gliedert sich in zwei große Teile, einen Theorieteil und einen praktischen Teil.
Im Theorieteil in Kapitel 2 werden der inhaltliche Gehalt und die gesetzlichen Rahmenbedingungen für die Kopfnoten abgeklärt. In Kapitel 3 werden die Kriterien aufgezeigt, nach denen die Qualität einer Beurteilung bewertet werden kann. In Kapitel 4 erfolgt eine Darstellung der Problematik der Beurteilung von Menschen durch den Menschen. Es werden die wahrnehmungs-, persönlichkeits- und sozial-spezifischen Faktoren aufgezeigt, die negativ auf die Güte einer Beurteilung wirken. Weiter sollen Lösungsversuche aufgezeigt werden, um diesen Tendenzen bewusst entgegenwirken zu können.
Im praktischen Teil der Arbeit wird eine Exploration mit Erhebungsdaten aus Baden-Württemberg durchgeführt. Exploration soll mit HÄCKER/STAPF (vgl. 2004, S. 285) als eine diagnostische Methode aufgefasst werden, die neben dem Bereitstellen von Datenmaterial vor allem Hinweise auf die Gestaltung von weiteren Untersuchungen liefern soll oder auch Empfehlungen zur weiteren Auswahl von Testinstrumenten. Darüber hinaus wird versucht, die im Theorieteil genannten Problemkreise anhand des hier vorliegenden Datenmaterials zu überprüfen und zu ersten empirischen Schlüssen zu gelangen. Kann durch die Vergabe von Kopfnoten die Qualität von Zeugnissen verbessert werden?
Teil I – Theoretische Grundlagen
2 Kopfnoten
2.1 Gesetzliche Grundlagen
Als inhaltliche Grundlage für die Bewertung des Arbeits- und Sozialverhaltens gilt, was im Strukturplan für das Bildungswesen 1970 festgehalten wurde. Dort wird als umfassendes Ziel von Bildung „die Fähigkeit des einzelnen zu individuellem und gesellschaftlichem Leben, verstanden als seine Fähigkeit, die Freiheit und die Freiheiten zu verwirklichen, die ihm die Verfassung gewährt und auferlegt“, festgelegt (DEUTSCHER BILDUNGSRAT 1970 S. 29). „Das Leben soll den ganzen Menschen fördern [...]. Das soziale System des Lernens soll in allen Bildungseinrichtungen dazu führen, daß die für das Zusammenleben erforderlichen Verhaltensweisen erwartet werden“ (ebenda, S. 30). Inhaltlich konkreter wird ein „gültiger Anspruch“ bzw. ein „durchgängiges Prinzip“ für das gesamte Schulwesen formuliert: „Einige der heute als besonders dringlich oder wichtig angesehenen allgemeinen Lernziele sind: selbständiges und kritisches Denken, [...] kulturelle Aufgeschlossenheit, [...] Kooperationsfähigkeit, soziale Sensibilität, Verantwortungsbewusstsein und Fähigkeit zur Selbstverantwortung (ebenda, S. 84). Dies soll dazu dienen, den „Lernenden zu mündigem Denken und Verhalten zu befähigen“ (ebenda). Wie ist aber ein solches Verhalten konkret durch den Lehrer zu benoten?
Die gesetzlichen Grundlagen über die Notengebung sind nicht im allgemeinen deutschen Schulgesetz verankert, sondern werden in den Bundesländern eigenständig festgelegt.[2] Für Baden-Württemberg ist dies in der Verordnung des Kultusministers über die Notenbildung geregelt (im Folgenden Auszüge aus der Verordnung des Kultusministers über die Notenbildung (NVO) vom 5. Mai 1983, § 6). Für die allgemeine Beurteilung von Verhalten und Mitarbeit gilt danach Folgendes:
(1) Die allgemeine Beurteilung beinhaltet Aussagen zur Arbeitshaltung (z. B. Fleiß, Sorgfalt), zur Selbstständigkeit (z. B. Eigeninitiative, Verantwortungsbereitschaft) und zur Zusammenarbeit (z. B. Hilfsbereitschaft, Fairness) in der Klassen- und Schulgemeinschaft.
(2) Das Verhalten und die Mitarbeit der Schüler werden mit folgenden Noten bewertet:
[...]
1. Die Note »sehr gut« soll erteilt werden, wenn das Verhalten bzw. die Mitarbeit des Schülers besondere Anerkennung verdienen.
2. Die Note »gut« soll erteilt werden, wenn das Verhalten bzw. die Mitarbeit des Schülers den an ihn zu stellenden Erwartungen entspricht.
3. Die Note »befriedigend« soll erteilt werden, wenn das Verhalten bzw. die Mitarbeit des Schülers den an ihn zu stellenden Erwartungen im ganzen ohne wesentliche Einschränkung entspricht.
4. Die Note »unbefriedigend« soll erteilt werden, wenn das Verhalten bzw. die Mitarbeit des Schülers den an ihn zu stellenden Erwartungen nicht entspricht.
Verhalten bezeichnet sowohl das Betragen im allgemeinen als auch die Fähigkeit und tätige Bereitschaft zur Zusammenarbeit. Mitarbeit bezieht sich vor allem auf den Arbeitswillen, der sich in Beiträgen zu den selbständig oder gemeinsam mit anderen zu lösenden Aufgaben äußert.
[...]
(5) Die allgemeine Beurteilung, die Noten für Verhalten und Mitarbeit und die Bemerkungen werden als Teil des Zeugnisses gemäß § 4 Abs. 1 Nr. 4 Konferenzordnung von der Klassenkonferenz bzw. der Jahrgangsstufenkonferenz beraten und beschlossen; der Klassenlehrer hat für die allgemeine Beurteilung einen Vorschlag zu machen.
Neben diesem Gesetzestext, der nur eine sehr grobe und unkonkrete Formulierung dessen darstellt, was unter einem guten Verhalten oder einer guten Mitarbeit zu verstehen ist, gibt es einen Muster-Entwurf als Anlage zur Gewinnung der Verhaltens- und Mitarbeitsnoten (siehe Anlage zur NVO, Kapitel J. 5. 4). Dort findet man unter Verhaltensformen folgende Tabelle bzgl. guten bzw. schlechten Verhaltens:
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 1: Hilfe zur Bewertung von Verhaltensformen
Aus: Muster-Entwurf als Anlage zur NVO, Kapitel J 5.4
In dieser Tabelle wird das Verhalten an konkreten Verhaltensäußerungen festgemacht, um die Einordnung des Schülerverhaltens zu einer bestimmten Note zu erleichtern. Kernbereiche für die Verhaltensbewertung sind danach: allgemeines Auftreten (Zeile 1), Kameradschaftlichkeit (Zeile 2), Ehrlichkeit (Zeile 3), Zurückhaltung (Zeile 4), Arbeitseinsatz (Zeile 5), Lenkbarkeit und Akzeptanz von Regeln (Zeile 6).[3] Die Bewertung des Verhaltens geschieht aufgrund dieser Tabelle, mit dem zusätzlichen Hinweis, dass die Note „gut“ der Regelfall sein soll. Die Note „sehr gut“ soll nach diesen Anweisungen in dem Fall erteilt werden, wenn der Wille des Schülers zur Zusammenarbeit besonders ausgeprägt ist und er das Sozialverhalten der Klasse positiv beeinflusst. Je öfter Eigenschaften der Spalte (2) und (3) auf das Verhalten des Schülers zutreffen, desto eher ist die Note „befriedigend“ bzw. „unbefriedigend“ zu erteilen. Im Speziellen gilt, dass die Note „unbefriedigend“ nur bei groben Verstößen, die in der Regel im Klassenbuch festgehalten und dem Schüler und seinen Erziehungsberechtigten offenbart worden sind, erteilt werden soll.
2.2 Interpretation von Kopfnoten
Im letzten Kapitel wurde deutlich, dass viele, teils sehr unterschiedliche Kernbereiche in die Verhaltensnote einfließen. Deshalb ist es wichtig zu prüfen, wie eine derart komplexe Kopfnote von den Adressaten eines Zeugnisses ausgelegt wird. SCHUMANN-ERNY (vgl. im Folgenden 2003, S. 146ff.) untersuchte in einer Studie über Zeugnisnoten unter anderem, wie Kopfnoten interpretiert werden. Sie gliedert hierfür die Leser von Zeugnissen in die Adressatengruppen Schüler, Eltern und künftige Arbeitgeber. Im Folgenden wird die Auswertung auf die Frage betrachtet, was die o. g. Adressatengruppen jeweils einer bestimmten Note in Verhalten bzw. Mitarbeit entnehmen.
Für die Mitarbeitsnote „gut“ findet SCHUMANN-ERNY die in Abbildung 2 dargestellten Interpretationen, geordnet nach der Häufigkeit der Nennung. Für diese Mitarbeitsnote gaben die Befragten aller drei Gruppen an, dass es eine Durchschnittnote sei, die 90% der Schüler im Zeugnis stehen hätten (vgl. im Folgenden ebenda, S. 149).
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 2: Interpretationen einer Mitarbeitsnote "gut"
Aus: SCHUMANN-ERNY 2003, S. 147
Bei der Verhaltensnote wurde nach der Interpretation der Note „befriedigend“ gefragt. Die Ergebnisse sind in Abbildung 3 auf folgender Seite festgehalten. SCHUMANN-ERNY (vgl. im Folgenden ebenda, S. 153) findet in der Verhaltensnote ein größeres Spektrum und eine größere Meinungsverschiedenheit als bei der Mitarbeitsnote. So wird die Note „befriedigend“ im Verhalten als Bezeichnung eines Verhaltens von entweder „durchschnittlich“, „mit Einschränkungen“ oder „völlig inakzeptabel“ eingestuft (ebenda, S. 153). SCHUMANN-ERNY zieht aus diesen Ergebnissen den Schluss, dass klar kommuniziert werden muss, in welcher Weise das Verhalten im Zeugnis dokumentiert werden soll: Wird in der Verhaltensnote das Sozialverhalten bewertet (so wie es bisher von vielen angenommen wird)? Oder spiegeln sich in dieser Note Normen der Gesellschaft wieder? Werden mit der Verhaltensnote Kompetenzen beurteilt, die ein Schüler entweder schon erlernt hat oder noch zu lernen hat? Solange dieses nicht eindeutig geklärt ist, wird die oben genannte Meinungsvielfalt bei der Interpretation der Noten nach SCHUMANN-ERNY nicht vermieden werden können.
Eine Schülerin hat in Verhalten die Note „befriedigend“
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 3: Interpretation einer Verhaltensnote "befriedigend"
Aus: SCHUMANN-ERNY 2003, S. 150f.
Fraglich ist, ob und wann diese Vielfalt an Interpretationsmöglichkeiten problematisch wird. Dies kann nur individuell für jede einzelne Adressatengruppe geklärt werden (vgl. im Folgenden ebenda, S. 153f.). Für die Gruppe der Schüler ist es relativ gleichgültig, in welcher Weise diese Note interpretiert wird. Hier ist es ausreichend, dass die Note „befriedigend“ von der Regelnote „gut“ abweicht und somit auf ein gewisses Defizit hinweist, das ausgeglichen werden sollte. Diese Feststellung kann man auch auf die Gruppe der Eltern ausweiten, da es hier in gleicher Weise vorrangig darum geht, Verhaltensänderungen anzuregen bzw. zu unterstützen. Schwierigkeiten könnten allerdings dann entstehen, wenn Arbeitnehmer die Verhaltensnote „befriedigend“ mit derart unterschiedlichen Interpretationen, wie oben beschrieben wurde, versehen. Dies gilt vor allem dann, wenn Arbeitgeber die Verhaltensnoten zur Selektion heranziehen (vgl. SCHUMANN-ERNY 2003, S. 154). Diese Noten ermöglichen dann Chancen oder verhindern eben solche.
2.3 Schulinterne inhaltliche Konkretisierungen
Weil selbst die Konkretisierungen der in Kapitel 2.1 zitierten Anlage zur Notenverordnung immer noch (zu) viel Gestaltungsspielraum für die konkrete Ausgestaltung der Notengebung bieten und (zu) viel Raum für die Interpretation der Kopfnoten offenlassen (wie im vorigen Kapitel gezeigt), werden in manchen Schulen Ergänzungen für die Beurteilung des Verhaltens und der Mitarbeit ausgegeben. So formulierte der Rektor der in die Untersuchung einbezogenen Schule 2 in einer Gesamtkonferenz 2007 ganz konkret Zuordnungen für die Noten Verhalten und Mitarbeit. Diese wurden nach der Bekanntgabe im Lehrerzimmer der Schule ausgehängt (siehe Anhang 2)[4]
Dem Verhalten wurde aufgrund dieser Auflistung zugeordnet:
- Umgang mit Lehrern und Mitschülern
- Einhalten der Regeln
- Tagebucheinträge wegen Fehlverhaltens (Dokumentation!)
- zeitweiliger Schulausschluss
- stetige Bereitschaft im und außerhalb des Unterrichts
- freiwillige Übernahme von Aufgaben
- Vorbildfunktion für andere
Der Mitarbeit wurde zugeordnet:
- Bereitschaft zu selbstständiger Arbeit, Fleiß
- Mitarbeit im Unterricht
- Tagebucheinträge z. B. wegen fehlender HA, vergessener Arbeitsmaterialien
- Mitarbeit z. B. bei der SMV, den Schlichtern etc.
Über eine solche Konkretisierung gehen JÜRGENS/SACHER (2008, S. 68) hinaus, indem sie es als sehr wichtig bezeichnen, dass „Informationen, die durch den Prozess der Zensierung verloren gegangen sind, in Form einer ergänzenden, differenzierten Mitteilung an den Schüler“ zurückgewonnen werden. Sonst kann der Schüler durch die Leistungsbeurteilung nicht gefördert werden (vgl. im Folgenden ebenda, S. 68). Sie fordern hierfür eine zusätzliche verbale Rückmeldung. Dies kann z. B. durch eine Anlage erfolgen, wie sie in Abbildung 4 und 5 dargestellt ist. Diese Konkretisierung wurde auf der Homepage einer Realschule in Nordrhein-Westfalen gefunden.[5] Mithilfe dieser Anlage zum Zeugnis werden die Schüler und deren Eltern über individuelle Ausprägung beim Schüler konkret informiert. Wie SCHRÖTER (vgl. 1981 S. 165) hervorhebt, können solche zusätzlichen Informationen als Basis für ein fruchtbares Gespräch mit Schülern oder Eltern dienen. Da dieses Formular eine Anlage zum Zeugnis darstellt, erhalten Außenstehende, z. B. künftige Arbeitgeber, diese zusätzlichen Informationen nur, wenn der Schüler diese willentlich weitergibt. Für den Lehrer ergibt sich der Vorteil, dass er eine Beurteilungshilfe an die Hand bekommt, die ihm bei der Bewertung des Sozial- und Arbeitsverhaltens eine konkrete Hilfe bietet.
In den hier vorliegenden Anlagen (siehe Abbildungen 4 und 5) werden die Bewertungskriterien nach Fähigkeitsbereichen der Schüler separat gegliedert. So werden die Kriterien für die Vergabe der Kopfnoten aufgeschlüsselt und deutlich gemacht. Die verschiedenen Interpretationsmöglichkeiten (vgl. dazu Kapitel 2.2) werden durch dieses Vorgehen eingeschränkt.
Anlage zum Protokoll der Zeugniskonferenz vom… Bewertungskriterien
In den gekennzeichneten Bereichen weicht das Sozialverhalten der Schülerin/des
Schülers _______von der Bewertung “entspricht den Erwartungen“ positiv oder negativ ab.
Reflexionsfähigkeit
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 5: Bewertungskriterien für das Arbeitsverhalten
Quelle: http://www.realschule-buer.de/kopfnoten.php
Ein weiterer wichtiger Punkt im Bezug auf die Beurteilung von Sozial- und Arbeitsverhalten ist die regionale Übereinstimmung, d. h. die Vergleichbarkeit von Kopfnoten von unterschiedlichen Schulen. Dies gilt vor allem dann, wenn künftige Arbeitgeber diese Noten als Selektionsinstrument nutzen, wie SCHUMANN-ERNY festgestellt hat (vgl. 2003, S. 154). In Osnabrück wurde nach Wiedereinführung der Kopfnoten deutlich, dass zwischen den Schulen erhebliche Unterschiede in der Bewertung des Arbeits- und Sozialverhaltens existierten (vgl. im Folgenden THOMAS 2007, S. 117ff.). So wurde an manchen Schulen als Regelfall die Note b in einer 5-Stufigen Skala vergeben, in anderen Schulen dagegen als Regelfall die mittlere Note, eine c. Um Vergleichbarkeit zwischen den Zeugnissen der verschiedenen Schulen zu schaffen, forderten Elternvertreter deshalb eine regionale Abstimmung zwischen den Schulen, um ein „Austarieren der Maßstäbe auf regionaler Basis“ anzustreben (ebenda S. 118). THOMAS empfiehlt, neben diesem Abgleich von Benotungspraktiken auch konkrete Einzelfragen und Einzelkriterien, z. b. welche auffälligen Verhaltensweisen berücksichtigt werden sollen, schulübergreifend zu klären. THOMAS sieht es für die Glaubwürdigkeit der Noten als wichtig an, dass eine Transparenz über die Vergabekriterien geschaffen wird. Erfolgt die Notenbildung auf einer Konferenz schematisch nach Mehrheitsentscheid? Oder wird intensiv über Einzelfälle diskutiert und dabei der einzelne Schüler umfassend wahrgenommen?
Solche und andere Gestaltungskriterien sollen im folgenden Abschnitt einer Bewertung zugänglich gemacht werden. Im folgenden Kapitel sollen Qualitätsansprüche formuliert werden, sogenannte Gütekriterien für Beurteilungen. Diese bezeichnen die Anforderungen, die an Beurteilungen zu stellen sind, damit sie sinnvoll verwertbar sind (vgl. SACHER/RADEMACHER 2009, S. 36).
3 Gütekriterien von Beurteilungen
3.1 Objektivität
In der Literatur finden sich verschiedene Definitionen für Objektivität:
1. Objektivität als das eigentlich Gegenständliche und dem Subjekt in gleicher Weise Entgegenstehende (vgl. im Folgenden HÄCKER/STAPF 2004, S. 659 und PANZ 1985, S. 15). Objektivität wird als vom eigenen Bewusstsein unabhängig gedacht, und ihr wird Allgemeingültigkeit zugebilligt.
2. Objektivität kann negativ bestimmt werden als: „Das Urteil ist frei von subjektiven Störmomenten“ oder positiv: „Das Urteil wird ausschließlich von der zu beurteilenden Sache (Leistung) und durch nichts anderes bestimmt“ (SCHRÖDER 1990, S. 65).
3. Objektivität kann über den Konsens verschiedener Beurteiler definiert werden (vgl. HÄCKER/STAPF 2004, S. 659). Danach gilt, dass genau dann objektiv geurteilt ist, wenn mehrere Beobachter unabhängig voneinander zu übereinstimmenden oder ähnlichen Ergebnissen gelangen (vgl. HENZE/NAUCK 1985, S. 32f.). In diesem Sinn lautet die Grundfrage von Objektivität bei der schulischen Bewertung: Käme ein anderer Lehrer zu der gleichen Beurteilung wie ich (vgl. SACHER/RADEMACHER 2009, S. 36)?
4. Objektivität kann des Weiteren als seelische Haltung, als Bemühen eines Beurteilenden definiert werden (vgl. PANZ 1985, S. 16).
In dieser Arbeit soll mit INGENKAMP/LISSMANN (2005, S. 52) eine Messung dann als objektiv verstanden werden, wenn „intersubjektive Einflüsse der Untersucher möglichst ausgeschaltet werden“. Objektivität soll definiert werden „als intersubjektive Übereinstimmung mehrerer Gegenüber, in deren Bewusstsein sich das zum Objekt Gehörende realisiert, bei gleichzeitigem Versuch, von eigenen sozialen und persönlichen Auffassungen zu abstrahieren“ (PANZ 1985, S. 17).
Objektivität kann im Bezug auf die Beurteilung in folgende Bereiche eingeteilt werden:
Die Durchführungsobjektivität gibt an, inwieweit der Beurteilungsvorgang vereinheitlicht ist (vgl. JÜRGENS/SACHER 2008, S. 70). Die Grundfrage für die Durchführungsobjektivität kann folgendermaßen formuliert werden: Bin ich sicher, dass alle Lehrer die Beobachtungen an den Schülern in gleicher Weise gestalten (vgl. SACHER/RADEMACHER 2009, S. 36)? Für die Kopfnoten bedeutet dies, dass die Einzelbeobachtungen, die die Lehrer während des Unterrichts sammeln und die in die Gesamtbewertung für Verhalten und Mitarbeit einfließen, in gleicher Weise erhoben und gespeichert werden. INGENKAMP/LISSMANN (2005, S. 52) weisen darauf hin, dass „Verhalten nur dann mit früherem Verhalten oder mit dem Verhalten anderer [...vergleichbar gemacht werden kann], wenn es unter weitgehend gleichen Bedingungen beobachtet wird“.
Bei der Auswertungsobjektivität muss die Frage geklärt werden, welches Verhalten wie zu bewerten ist (vgl. INGENKAMP/LISSMANN 2005, S. 53). Die Grundfrage der Auswertungsobjektivität für die Kopfnoten lautet: Bin ich sicher, dass alle Lehrer die gleichen Eigenschaften und Persönlichkeitsmerkmale in die Beurteilung für Verhalten und Mitarbeit einfließen lassen ( vgl. SACHER/RADEMACHER 2009, S. 36)?
Die Interpretationsobjektivität befasst sich mit der Frage, welche Ausprägung von Leistungen sich in welcher Weise in den Beurteilungen niederschlagen soll (vgl. INGENKAMP/LISSMANNN 2005, S. 53). Auf die Kopfnoten bezogen ergibt sich hier die Grundfrage: Haben die anderen Lehrer den gleichen Beurteilungsmaßstab wie ich (SACHER/RADEMACHER 2009, S. 36)?
SCHRÖDER (vgl. im Folgenden 1974 S. 58ff.) stellt heraus, dass mangelnde Objektivität bei Urteilen häufig durch nachweisbare subjektive Störfaktoren bedingt wird. SCHRÖDER unterstellt, dass es für jeden Fall eine optimale und objektive Beurteilung gibt. Diese Objektivität kann aber nur dann erreicht werden, wenn eine Beurteilung von einem Team von Beurteilern erstellt wird. Wichtig für die Objektivität ist darüber hinaus, dass die Urteilsbildung nicht gemeinsam geschieht, sondern unabhängig voneinander. Sonst besteht die Gefahr der gegenseitigen Beeinflussung. Legt man den Beurteilungen dazu noch ein Schema zugrunde, an dem die Beurteiler sich orientieren können (vgl. hierzu z. B. die Anlagen zum Zeugnis, Kapitel 2.3), erreicht man einen noch höheren Grad der Objektivität.
Bei der Vergabe von Kopfnoten wird im Regelfall das von SCHRÖDER geforderte Prinzip angewandt, d. h. ein Team von Beurteilern erstellt gemeinsam die Note. In den meisten Schulen werden die Kopfnoten in der Klassenkonferenz gemeinsam beschlossen, nachdem jeder Fachlehrer einen Vorschlag zur Verhaltens- und Mitarbeitsnote abgegeben hat (vgl. die Mitteilung an die Lehrer im Anhang 4). Aus diesem Grund ist gerade bei den Kopfnoten mit einer relativ hohen Objektivität zu rechnen. Allerdings ist nach SCHRÖDER (vgl. 1974, S. 60) zu prüfen, ob die einzelnen Notenvorschläge unabhängig voneinander erstellt werden. Nur dann ist für SCHRÖDER die Objektivität für eine solche Beurteilung gegeben.
INGENKAMP/LISSMANN (vgl. im Folgenden 2005 S. 53f.) weisen darauf hin, dass die Sicherung der Objektivität umso schwieriger ist, je mehr Informationen zu verarbeiten sind bzw. je unterschiedlicher diese ausfallen. Wer jegliche persönliche Einstellung ausschalten will, verbannt damit auch jedes persönliches Engagement aus der Pädagogik bzw. den Willen, die beurteilten Gegebenheiten pädagogisch beeinflussen zu wollen. Dies darf aber nach INGENKAMP/LISSMANN nicht das Ziel sein. Das Ziel sollte dagegen sein, dass der Beurteiler um die Problematik der intersubjektiven Beeinflussung weiß und dadurch bestrebt wird, sein Urteil einer reflexiven Beurteilung zu unterziehen und im Zweifelsfall zu revidieren.
3.2 Reliabilität
Die Reliabilität gibt die Zuverlässigkeit einer Messung an. Sie ist dann gegeben, wenn das Messergebnis den tatsächlichen, unverzerrten Ausprägungsgrad der Leistung zeigt (vgl. im Folgenden SACHER/RADEMACHER 2009, S. 36). Hier wird die Sicherheit bzw. die Genauigkeit einer Messung hinterfragt. Die Grundfrage der Reliabilität heißt, bezogen auf die Kopfnoten: Bin ich sicher, dass meine Beurteilung den Kern der Eigenschaften trifft, die ich mit der Bewertung erreichen möchte?
Aus empirischen Studien ergibt sich für die Reliabilität von schulischen Leistungsüberprüfungen allgemein ein schlechtes Bild (vgl. im Folgenden SACHER/RADEMACHER 2009, S. 44). So liegen in standardisierten Tests die Koeffizienten (bei einem möglichen Intervall von 0 und 1) zwischen 0,80 und 0,95, während bei schriftlichen Prüfungen Werte von 0,50 und 0,80 erreicht werden. Bei mündlichen Prüfungen liegen sie normalerweise unter 0,50. Für die Beurteilung von Verhalten und Mitarbeit könnte allerdings nach den in Kapitel 3.1 genannten Überlegungen zur Objektivität (vgl. S. 16) eine höhere Reliabilität erwartet werden als bei Fachnoten. Dies liegt darin begründet, dass alle Fachlehrer, unabhängig vom unterrichtenden Fach, mit gleicher Stimme auf die Kopfnoten einwirken, die Kopfnoten sich als Gemeinschaftsnote aus unterschiedlichen Beurteilungen ergeben. Es ergibt sich für die Kopfnoten in hohem Maße eine Art „Durchschnittswirkung“ bzw. eine Konsenswirkung jenseits von einzelnen Erhebungen bzw. Beobachtungen. SACHER (vgl. im Folgenden 1984, S. 10) weist darauf hin, dass die Vergabe von Einzelnoten durch eine „repräsentative Stichprobe von Lehrern“ durchaus „Tendenzen zu einer milden und zu einer rigiden Benotung ausbalancieren“ könnten (ebenda). Dennoch ist für SACHER noch nicht bewiesen, dass eine solche Tendenz der Mitte ein hinreichendes Kriterium für die „Richtigkeit“ einer Note wäre (ebenda).
3.3 Validität
Validität bezeichnet den Grad der Sicherheit oder Genauigkeit, mit der ein Merkmal gemessen werden kann (vgl. INGENKAMP/LISSMANN 2005, S. 54). Als Grundfrage für die Validität von Kopfnoten ergibt sich: Messen meine Kopfnoten tatsächlich dieses Verhalten und diese Mitarbeit, die ich bewerten will (vgl. im Folgenden SACHER/RADEMACHER 2009, S. 37)? Die Validität kann verbessert werden, indem mitgemessene Komponenten aus anderen Bereichen nicht verfälschend in die Ergebnisse einfließen. Für die Beurteilung des Verhaltens wären dies z. B. außerschulische Vorkommnisse, die in den Kenntnisbereich des Lehrers gelangt sind oder Merkmale des Schülers, wie das Geschlecht oder der sozialen Hintergrund. Generell kann die Validität durch die Vergabe klarer Kriterien für die Beurteilung verbessert werden (vgl. ebenda, S. 47, siehe auch die Überlegungen in Kapitel 2).
4 Problemkreise zur Beurteilung von Schülern
4.1 Beurteilungstendenzen
4.1.1 Der Begriff der Impliziten Persönlichkeitstheorie (IPT)
Die Wahl des Begriffes “implizite Persönlichkeitstheorie” kann, je nach den Implikationen, die mit den einzelnen Wortteilen verbunden sind, zu einer falschen Einschätzung dessen führen, was damit gemeint ist (vgl. BAUMANN 1980, S. 35). KLEITER (1973, S. 202) macht deutlich, dass mit „implizit, im Gegensatz zu explizit [...] Theorienbildung über Kategorien und Messung nicht unabhängig, sondern in der Person des Raters zugleich erfolgen“. Des weiteren soll der Wortteil „Theorie“ nicht bedeuten, dass es sich um eine wissenschaftliche Theorie als „deduktiv geordnetes System von Gesetzeshypothesen mit einem gemeinsamen Gegenstandsbereich“ handelt. (HÄCKER/STAPF 2004, S. 952). Für eine solche gilt: „[In] einer Theorie sind alle anderen Aussagen ... deduktiv logisch ableitbar.“ (ebenda). Stattdessen geht es um das Wissen eines Alltagsdiagnostikers, im Besonderen eines Lehrers, der dieses Wissen nicht systematisch im Blick auf dessen empirische Absicherung und seinen formal-konstruktiven Aufbau hinterfragt, sondern ihm relativ unkritisch vertraut (vgl. LAUCKEN 1974, S. 20). Im nächsten Kapitel soll deshalb die alltägliche Wahrnehmung von Personen im Modell dargestellt werden.
4.1.2 Modell zur Wahrnehmung und Erfassen von Informationen
Die Beurteilung eines Menschen basiert darauf, wie wir ihn wahrnehmen (vgl. im Folgenden SIEVERING 1974 S. 18). Dadurch wird sie abhängig von internen, subjektiven Faktoren, die die Beurteilung wesentlich beeinflussen können. Um die Tendenzen in der Urteilsbildung näher erschließen zu können, soll der Prozess der Personenwahrnehmung exemplarisch dargestellt werden. Dies soll anhand des Personenwahrnehmungsmodells von WARR und KNAPPER geschehen (vgl. im Folgenden WARR/KNAPPER 1968, zitiert in WEISS 1989, S. 128ff.).
Wenn wir eine Person kennenlernen, stehen zuerst Wahrnehmungen im Mittelpunkt: Wir sehen und hören die Person in einem bestimmten Kontext der Wahrnehmung. Das gleiche Verhalten kann u. U. an verschiedenen Orten und bei unterschiedlichen Gelegenheiten jeweils völlig anders von uns verarbeitet werden. Diese Verarbeitung hängt von einer Vielzahl von Erfahrungen ab, die wir mit der entsprechenden Person bei früheren Gelegenheiten gemacht haben. Die gesamte Fülle von Informationen kommt jetzt in einen Eingangsselektor. Was uns bei dieser Auswahl besonders wichtig erscheint, ist auch geprägt von unseren eigenen Eigenschaften und von unserer augenblicklichen Verfassung. So urteilen wir anders, wenn wir gereizt oder unausgeschlafen sind oder uns glücklich und sorgenfrei fühlen. Danach werden die selektierten Informationen im Verarbeitungszentrum verarbeitet. Hier werden aus dem Informationsmaterial Urteile gebildet, teils durch Analogieschlüsse, teils aus Wertungen der Einzelurteile. Diese Urteile können z. B. zugeschriebene Eigenschaften, wertende Stellungsnahmen oder künftige Erwartungen an den Schüler sein. Mit diesen Analogieschlüssen unterstellt man direkte Beziehungen zwischen Ursache und Wirkung (vgl. ULICH/MERTENS 1979, S. 69ff.). Beurteilungsfehler entstehen meist dann, wenn eigenschaftsorientierte statt empirisch gefasster Begriffe für die Beurteilung herangezogen werden (z. B. „Mädchen sind im Unterricht weniger faul als Jungen“) oder wenn die Relationen zwischen den Begriffen ungeprüft oder falsch sind („Menschen mit einer hohen Stirn sind intelligenter als Menschen mit einer niedrigen Stirn“, vgl. im Folgenden HENZE/NAUCK 1985, S. 83). Werden Urteile auf diese Weise beeinflusst, werden die Urteile subjektiv und damit wenig valide ausfallen.
HOFER führte 1969 eine Studie zur impliziten Persönlichkeitstheorie von Lehrern durch (vgl. HOFER 1974, S. 25ff). Diese beschäftigte sich mit Eigenschaftspaaren, deren Ähnlichkeit bzw. Unähnlichkeit durch Gruppen von Lehrern beurteilt werden sollten. Als Fazit der Studie hält HOFER fest: „Im übrigen legt das Ergebnis nahe, Persönlichkeitsbeurteilungen generell zu misstrauen und [in ihnen dargestellte Beurteilungen] ... eher als Ausdruck subjektiver Erwartungshaltungen, denn als Abbild der Beurteiltenpersönlichkeit aufzufassen“ (HOFER 1970, S. 207f). Auch ULICH/MERTENS (1979, S. 43) sehen in der Beurteilung der Persönlichkeit eines Schülers die Gefahr, dass in „völlig unkontrollierter Weise stereotypisierte Maßstäbe an das Schülerverhalten herangetragen“ werden, „die letztlich mehr über Gesellschaftsbild, Begabungsbegriff, Menschenbild und Einstellungen des Urteilers aussagen als über den Schüler“.
SCHRÖDER (vgl. im Folgenden 1974, S. 40ff.) betont aber den Entwicklungscharakter, den eine Beurteilung durchlaufen kann. Dazu hält er fest, dass die vorwissenschaftlichen oder vorkritischen Beurteilungen, wie sie z. B. im Modell von WARR/KNAPPER dargestellt wurden, im Alltag generell nicht schlecht seien, obwohl sie den Kriterien einer Wissenschaftlichkeit nicht genügen können. Das grundlegende Merkmal für eine solche Beurteilung ist die intuitive Entstehung. Diese vorwissenschaftlichen Beurteilungen können nach SCHRÖDER unter gewissen Umständen durchaus in eine kritische Beurteilung übergehen, ohne dass sich deshalb der Inhalt der Beurteilung ändern muss. Eine kritische Beurteilung wird nach SCHRÖDER bewusst und gewollt ausgeführt und erfüllt damit die Kriterien einer Wissenschaftlichkeit. Wissenschaftliches Vorgehen ist damit für SCHRÖDER, dass richtige, aber ungültige Erkenntnisse in gültige Beurteilungen überführt werden. Um dieses wissenschaftliche Vorgehen zu fördern, fordert KLEBER (vgl. im Folgenden 1992, S. 79) eine diagnostische Kompetenz des Lehrers. Ohne diese sind Kontrolle und mögliche Revision des ersten Urteils nicht gegeben.
4.1.3 Informationsreduktion
ULICH/MERTENS (vgl. im Folgenden 1979 S. 101) weisen auf die Informationsreduktion bei der Personenwahrnehmung hin, die beim Beurteilen eine Rolle spielen. Sie halten fest, dass ein Lehrer bei der Beurteilung einer Person immer nur einen Bruchteil dessen verarbeiten kann, was tatsächlich an Daten vorhanden ist und berücksichtigt werden könnte. Dies ist bedingt durch das großes Beziehungsgeflecht mit sehr vielen Schülern, von dem der Schulalltag geprägt ist (vgl. im Folgenden KLEBER 1978, S. 593ff.). Diese vielen Eindrücke überfordern die Kapazität des Lehrers, informelle intensive zwischenmenschliche Beziehungen aufrecht zu erhalten. KLEBER sieht deshalb die Informationsreduzierung als eine dringend benötigte Maßnahme für die Praxis. Der Lehrer ist gezwungen, sich eine so genannte „Lehrerbrille“ aufzusetzen, mit einem Referenzrahmen für jeden einzelnen Schüler (ebenda). Der Lehrer kann nicht jeden Schüler genau kennen, muss aber den Schüler in ein bestimmtes Verhaltensraster einordnen können, sozusagen ein „Bild“ des Schülers parat haben (ebenda). Dieses Bild ist nicht frei von Erwartungsmustern des Lehrers. Solche Erwartungsmuster bestimmen das Bild des anderen entscheidend mit, wie es durch das Modell von WARR und KNAPPER im vorigen Kapitel aufgezeigt wurde. Das Bild verändert sich mit den laufenden Beobachtungsinformationen über den Schüler. Ob der Lehrer diese selbst erhoben hat oder durch einen Lehrerkollegen vermittelt bekommt, ist nicht relevant. Um ein prägnantes, relativ einfaches Raster für jeden Schüler zu erhalten, wird die Beobachtungsinformation systematisiert und kompromittiert. Das geschieht durch Interpretation von Beobachtungsdaten und einer Zuweisung von bestimmten Eigenschaften auf den Schüler. Ein solches Beurteilungsverfahren stellt sich als anscheinend notwendiges Gesetz zur Ökonomisierung innerhalb der Informationsverarbeitung dar. Nur so ist der Lehrer in der Lage, in komplexen Situationen rechtzeitig und adäquat zu reagieren.
WEISS (vgl. im Folgenden 1989, S. 82) sieht es kritisch, dass der Lehrer dazu angehalten wird, in Klassen von teilweise mehr als 30 Schülern ständige Beurteilungen durchzuführen. Er vermutet eine Überforderung der Lehrer, selbst dann, wenn sie es selbst nicht so einschätzen würden und meinten, der Aufgabe gerecht werden zu können. Er bezieht sich auf Erfahrungen aus der Betriebswirtschaft, wo die „Kontrollspanne“, d. h. die Zahl der Arbeitsplätze, die durch eine Person überwacht werden kann, mit sechs bis maximal 15 angegeben wird (vgl. SCHNEIDER 1982, S. 401, zitiert in WEISS 1989, S. 82). Selbst wenn ein Lehrer bei optimaler Ausbildung in pädagogischer Diagnostik einer bei unsystematischen Beobachtungen üblichen Wahrnehmungsverzerrung entgehen könnte, könne er seine Beobachtungen schon aufgrund dieser zu hohen Anzahl an Schülern nicht zutreffend durchführen (vgl. im Folgenden WEISS 1989, S. 82). WEISS sieht in diesem Umstand neben der Problematik der Rollenzuweisungen die Problematik der selektiven Wahrnehmung durch den Lehrer. Dies soll im nächsten Kapitel näher erläutert werden.
4.1.4 Selektive Wahrnehmung von Eigenschaften
In diesem Kapitel soll verstärkt auf den Einfluss der Lehrererwartung bei dem Prozess der Personenwahrnehmung eingegangen werden. Das Raster, das der Lehrer aus den Beobachtungsinformationen implizit erstellt, fußt, wie in Kapitel 4.1.2 gezeigt wurde, auf früheren Erfahrungen und Lernprozessen (vgl. auch KLEBER 1978, S. 593). Bei jeder neuen Information werden diese Erwartungen bzw. Hypothesen überprüft (vgl. im Folgenden WEISS, 1989 S. 130ff). Widerspricht die empfangene Information der Erwartung des Lehrers, kommt es zu einer „kognitiven Dissonanz“ (ebenda, S. 131), die zu einer Auflösung in einem Gleichgewicht strebt. Dieses Gleichgewicht kann nur dann entstehen, wenn die Information an die Erwartung angepasst wird oder die Erwartung zu einer neuen, stimmigen Hypothese umgewandelt wird. Um solche kognitive Dissonanzen möglichst nicht entstehen zu lassen, nehmen wir, geprägt von unseren Erwartungen, die Eindrücke nicht mehr gleichmäßig auf. Stattdessen sondieren, betonen oder unterdrücken wir und steuern so in einem gewissen Maße das, was wir wahrnehmen wollen. Dies wird auch als Selektivität der Wahrnehmung bezeichnet. Was hierbei entscheidend ist, dass die Erwartungen nicht nur die Beurteilung eines Verhaltens steuern, sondern schon im Vorfeld die Wahrnehmung desselben. Dies geschieht allerdings unbewusst und wird vom Lehrer nicht unbedingt bemerkt (vgl. im Folgenden ZELTNER 1987, S. 52). Dieses Vorgehen wird vor allem dann gefährlich, wenn abweichende Wahrnehmungen nicht mehr möglich sind. Die direkte Auswirkung dieses Effekts zeigt sich z. B. darin, dass ein Schüler, der bereits wegen seines unangebrachten Verhaltens aufgefallen ist, schneller wieder wegen einer erneuten Unart wahrgenommen werden wird als ein bislang unauffälliger Schüler (vgl. KLEBER 1992, S. 109). Folgt ein Schüler dem Unterricht dagegen interessiert und beteiligt sich lebhaft daran, sieht der Lehrer beim Schüler vorwiegend die positiven Eigenschaften (vgl. ZELTNER 1987, S. 52).
4.1.5 Sich-selbst-erfüllende Vorhersage
Das Modell des Wahrnehmungsprozesses nach WARR und KNAPPER (siehe Kapitel 4.1.2) ist in dem Sinne „a-sozial“, als es die Auswirkungen auf den Beurteilten nicht berücksichtigt (BAUMANN 1980, S. 21). Die im vorangegangenen Kapitel geschilderte selektive Wahrnehmung beeinflusst aber nicht nur die Beurteilung der Person, sondern auch das Verhalten, das der Lehrer dieser Person gegenüber an den Tag legt (vgl. WEISS, 1989, S. 160). Deshalb soll im Folgenden die Erwartungsreaktion des Beurteilten in die Untersuchung einbezogen werden.
Als Grundmodell für eine Untersuchung zu diesen Wechselwirkungen wurden dem Urteiler bewusst falsche Erwartungen bezüglich der zu Beurteilenden induziert (vgl. im Folgenden BAUMANN 1980, S. 21). Diese führten nach einer gewissen Interaktionszeit zwischen Beurteiler und Beurteiltem dazu, dass das Erwartete tatsächlich eintrat. Das Phänomen, dass Erwartungen zu ihrer eigenen Erfüllung beitragen können, wird als „self-fulfilling-prophecy“ bezeichnet (vgl. im Folgenden ZIEGENSPECK 1999, S.182f.). Im schulischen Alltag spricht man auch vom Pygmalion-Effekt[6]. WEISS (vgl. im Folgenden 1989, S. 160f.) erklärt diese Auswirkungen mit der Kausalattribuierungstheorie von HEIDER. Was wir sind, wissen wir nicht aus uns heraus. Wir erfahren es hauptsächlich durch andere. Bezieht man dieses Phänomen auf den Schulalltag, führt eine „self-fulfilling- prophecy“ dazu, dass ein Lehrer von Schülern, bei denen er im Vorhinein annimmt, dass diese wenig leistungsfähig sind, eine schlechtere Erwartungshaltung hat (vgl. im Folgenden IM BRAHM 2006 S. 356). Dies prägt sein Verhalten gegenüber dem Schüler. Solange der Schüler ein stabiles Selbstbild von sich hat, kann er sich u. U. den Erwartungen des Lehrers vorerst widersetzen (vgl. im Folgenden WEISS 1989, S. 161f.). Allmählich jedoch wird er sein Selbstbild ändern. So wird er sich in dem Fall ungünstiger Lehrererwartungen im Laufe der Zeit immer weniger zutrauen, die Leistungen verschlechtern sich und er trägt damit zur Erfüllung der Lehrererwartung bei.
Dass dieser Mechanismus allerdings eine generelle Gültigkeit hat, wird von BAUMANN (vgl. im Folgenden 1980, S.22f.) bezweifelt. Er sieht dieses nur dann bestätigt, wenn der Lehrer einem Schüler Verhaltensfreiräume je nach seinen Erwartungen gewährt. BROPHY und GOOD fanden heraus, dass dieser Mechanismus tatsächlich bei vielen Lehrern eintritt (vgl. BROPHY/GOOD 1976, zitiert in WEISS 1989, S. 164). Der Lehrer lächelte in der von ihnen durchgeführten Studie den Schüler bei guter Erwartung häufiger an, nickte öfters zustimmend mit dem Kopf und schaute ihm häufiger in die Augen. Im Gegenzug wurde ein Schüler, von dem der Lehrer keine hohen Erwartungen hatte, seltener gelobt, weniger aufgerufen und erhielt generell weniger Aufmerksamkeit.
4.1.6 Konkrete Beeinflussungsarten
4.1.6.1 Beeinflussung durch zusätzliche Information
Eine Studie von WEISS beschäftigt sich mit der Zuverlässigkeit der Bewertung bei Aufsätzen und Rechenarbeiten (vgl. im Folgenden WEISS 1995, S. 112ff). WEISS zeigt in dieser Studie, dass die Beurteilung des Lehrers gegenüber der Person des Schülers von außerschulischen, von der Person des Schülers beeinflussten ,Informationen geprägt ist. Lehrern wurden verschiedene fiktive Vorabinformationen über die Schüler gegeben. Bei Beeinflussung durch positiv bzw. negativ geprägte Vorabinformationen zeigten sich selbst bei Rechenarbeiten signifikant abweichende Benotungen einer identischen Arbeit. Als für die Verhaltensnote relevanten Zusatzinformationen kommen z. B. Informationen über außerschulisches Verhalten infrage. Das könnten Informationen über Zustände oder Vorkommnisse positiver Art (z. B. Mitarbeit in einem örtlichen gemeinnützigen Projekt) oder negativer Art sein (z. B. Wissen um die aktive Mitgliedschaft eines Schülers in einer rechtsradikalen Vereinigung).
Als weitere wichtige Beeinflussungsquelle nennt IM BRAHM (vgl. im Folgenden 2006, S. 356) das Wissen um die soziale Herkunft der Schüler. Bei Schülern mit sozial schwierigem Hintergrund ist die Erwartungshaltung eher negativ und könnte nach den Ausführungen im vorigen Kapitel dazu führen, dass die Schüler sich tatsächlich gemäß den (negativen) Erwartungen verhalten. ZIEGENSPECK (vgl. 1978, S. 627) verweist auf Studien von LOERKE/GEBAUER (1965), nach denen Kinder der sozialen Unterschicht durchschnittlich schlechter zensiert wurden als Kinder der gehobenen Schichten. INGENKAMP/LISSMANN (vgl. im Folgenden 2005, S. 76) führen diesen Gedanken weiter und weisen darauf hin, dass nur das angemessen beobachtet werden kann, was in die Erfahrungen des Beurteilers eingeordnet werden kann. Deswegen kann es z. B. Schwierigkeiten bereiten, wenn ein Lehrer einen Schüler mit einem gänzlich anderen sozialen Hintergrund beurteilen muss. Die Interpretation einer Handlung von kumpelhafter Wertschätzung könnte so z. B. irrtümlich als Aggression aufgefasst werden. Diese Fehlinterpretationsmöglichkeiten sind nach INGENKAMP/LISSMANN generell auf Altersgruppen, Religionsgemeinschaften und solche Gruppierungen auszudehnen, die sich durch „graduell eigene Verhaltensnormen“ auszeichnen (ebenda).
4.1.6.2 Beeinflussung durch Sympathie
Beim sogenannten Hof-Effekt werden Eigenschaften nicht unabhängig voneinander eingestuft, sondern in Abhängigkeit von zumindest einem wertenden Aspekt. Das kann z. B. Sympathie oder Antipathie sein oder „Gutsein“ oder „Bösesein“ (ULICH/MERTENS 1979, S. 84). Diese wirken als „Eindrucksschablonen“ (ebenda), die Auswirkungen auf den weiteren Beurteilungsprozess haben. Folgende Abbildung verdeutlicht den Hof-Effekt bei der Beurteilung eines Schülers:
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 6: Hof-effekt
Aus: Ziegenspeck 1999 S. 176
Der Hof-Effekt macht sich häufig dort negativ bemerkbar, wo dem Schüler ein Ruf vorauseilt („Sitzenbleiber“, „Kind aus einer Problemfamilie“, ZIEGENSPECK 1999, S. 175f, vgl. im Folgenden ebenda). Die Merkmale, die in diesen Effekt hineinspielen, sind oft schwer zu beobachten, nicht klar und präzise definiert, stehen im Zusammenhang mit dem Kontakt zu anderen Menschen und haben eine hohe moralische Bedeutung.
HADLEY (vgl. im Folgenden 1995, S. 161f.) konnte in einer Studie den vermuteten Zusammenhang zwischen Sympathie des Lehrers und Benotung nachweisen. Das Ergebnis seiner Studie zeigt deutlich die Tendenz, dass die beliebtesten Schüler besser benotet wurden, als es ihre Leistung rechtfertigte. 50% der 178 beliebtesten Schülern erhielten bessere Zensuren als die gemessene Leistung, nur 16% wurden niedriger bewertet. Von den 118 der unsympathischen Schülern wurden dagegen 50% schlechter benotet, als es ihre Leistung nahe gelegt hätte. Nur 19% erhielten eine bessere Note. ZIEGENSPECK zieht aus der Vielzahl der ihm vorliegenden Forschungsergebnissen den Schluss, dass es nur in geringem Maße möglich ist, Sympathie und Antipathie zum einen zu erkennen und zum anderen zu eliminieren (vgl. ZIEGENSPECK 1999, S. 205). Sympathie kann allerdings auch einen negativen Effekt bei der Beurteilung bewirken. So verweist ZIEGENSPECK auf WOLF, der feststellt, dass die Sympathie des Lehrers nicht zwangsläufig die Beurteilung positiv beeinflusst (vgl. im Folgenden WOLF 1962, S. 32, verwiesen in ZIEGENSPECK 1999, S. 205). Er bezieht sich vor allem auf die Situation, wenn Lehrer ihre eigenen Kinder unterrichten, wenn er sagt: „Das einzige Mittel, dem Verdacht zu entgehen, sie würden bevorzugt, ist, sie offensichtlich zu benachteiligen“ (ebenda).
4.1.6.3 Beeinflussung durch Dynamik in einer Gruppe
Eine weitere Art der Beeinflussung ist in der Dynamik zu sehen, die sich in einer Gruppe (z. B. von urteilenden Lehrern in einer Klassenkonferenz oder durch das Zusammensein im Lehrerzimmer) entwickeln kann. STRIZKE/HARLES/WENZEL (vgl. 1991, S. 27) halten fest, dass in einer Gruppe Verzerrungen nicht ausgeschlossen sind, da die Tendenz in der Gruppe teilweise in die falsche Richtung führt. Dies kann dadurch bedingt sein, dass die Gruppe oder der informelle Anführer sich ein bestimmtes Ziel gesetzt hat, das als „absolut notwendig“ hingestellt wird (SIEVERING 1974, S. 43). Da die Kopfnoten durch ein Team von Beurteilern erstellt werden (vgl. Kapitel 3.1 dieser Arbeit), ist es wichtig zu prüfen, ob die Einzelnoten unabhängig voneinander vergeben werden oder ob sich eine Abhängigkeit durch die Beeinflussung von Kollegen ergibt. In einem solchen Fall wäre die Güte der Kopfnoten beeinträchtigt.
4.2 Interdependenzen zwischen Schüler- und Lehrerverhalten
ARNOLD/VOLLSTÄDT (vgl. im Folgenden 2001, S. 205f.) sehen als weiteren wichtigen Aspekt der Kopfnoten die Interdependenzen des Schüler- und Lehrerverhaltens. Sie bezeichnen die Kopfzensuren als eine „unentwirrbare Mischung aus verhaltensbezogenen Merkmalen der Schüler und schul- sowie unterrichts- und damit lehrerbezogenen Einstellungen“ (ebenda). Die Art und Weise, in der Schüler Regeln wie Pünktlichkeit, Zuverlässigkeit etc. befolgen, hängt in großem Maße davon ab, wie der Lehrer diese selbst in seinem Unterricht umsetzt. Kann ein Schüler in einem eng geführten Frontalunterricht Selbstständigkeit zeigen? Ist ein Schüler nur dann tolerant, wenn er ungerechtfertigtes Lehrerverhalten stillschweigend duldet? Rührt der Fleiß bei der Erledigung der Hausaufgaben nicht oft auch daher, dass Unterrichtsdefizite durch eigenen Einsatz zu Hause ausgeglichen werden müssen? Aus diesen Umständen ergibt sich für ARNOLD/VOLLSTÄDT, dass bei der Beurteilung des Arbeits- und Sozialverhaltens immer auch die Erziehungswirkungen des schulischen Unterrichts erfasst werden. Oder wie SALZMANN (1744-1811) formulierte: „Von allen Fehlern und Untugenden seiner Zöglinge muss der Erzieher den Grund in sich selbst suchen“ (zitiert in INGENKAMP 1989, S. 38). SCHWARZER/SCHWARZER (vgl. 1977, S.28) bringen es noch deutlicher auf den Punkt: Die impliziten Persönlichkeitstheorien (vgl. Kapitel 4.1.1 – 4.1.3 dieser Arbeit) besagen, dass die Urteile unabhängig von den Schülern sind, und dementsprechend eher etwas über den Lehrer als über den Schüler aussagen.
Im Hinblick auf die gerade gezeigten Wechselwirkungen wird deutlich, dass es sich bei der Beurteilung des Sozialverhaltens nicht um generell gültige (objektive) Aussagen handeln kann, sondern um sozialnorm-orientierte Aussagen, die somit zunächst ausschließlich für diese spezielle Konstellation (der jeweils beurteilten Klasse) gelten (vgl. im Folgenden ARNOLD/VOLLSTÄDT 2001, S. 206ff.). Nur wenn der Kontext, d. h. die Unterrichtsbedingungen, im Zeugnis deutlich gemacht werden, ist es deshalb möglich, aus den Zensuren bzw. Beurteilungen aussagekräftige Konstrukte zu gewinnen. Nach ARNOLD/VOLLSTÄDT ist eine Beurteilung nur dann gerechtfertigt, wenn die Grenzen der Aussagekraft der Noten und die Unsicherheit in der Bewertung nicht verschwiegen werden. IM BRAHM (vgl. im Folgenden 2006, S. 355ff.) geht in die gleiche Richtung wie ARNOLD/VOLLSTÄDT und stellt fest, dass es eine enge Verzahnung zwischen dem erteilten Unterricht und dem Schülerverhalten gibt. Sie fordert aus diesem Grund, Verhalten kontextgemäß zu bewerten. Ihre Forderungen sind:
1. Das in die Verhaltensnote einfließende Verhalten ist nur das, was der Schüler tatsächlich in der Schule zeigt
2. Es darf keine Bewertung von Verhalten geben, ohne dass gleichzeitig die Situation bewertet wird, in der das Verhalten gezeigt wird
3. Die Bewertung soll (möglichst) frei von subjektiven Einflüssen durch den Beobachter sein
4. Der Bewertungsmaßstab, anhand dessen die Beurteilung des Verhaltens geschieht, muss eine Vergleichbarkeit der Kopfnoten zulassen
5. Das beurteilte Verhalten muss in der Schule selbst vermittelt werden
4.3 Umgang mit Beurteilungstendenzen
Als zentralen Ausgangspunkt für die Vermeidung von Beurteilungsfehlern sehen JÜRGENS/SACHER (vgl. 2008, S. 84) die Einsicht, dass keine Person frei von Beurteilungstendenzen ist und deshalb Beurteilungen nicht frei von Beurteilungsfehlern sein können. Nach KLEBER (1992, S. 138f.) ist deshalb eine wichtige Voraussetzung zur Reduzierung von Beurteilungsfehlern eine „kontrollierte Subjektivität“. Nur damit lässt sich eine verbesserte Objektivität im Urteil erreichen (vgl. im Folgenden KLEBER 1978, S. 611). Der Lehrer soll ein „zurückhaltend reflektives Urteilsverhalten“ zeigen, denn damit ist er zu „relativ validen Urteilen“ fähig und kann seine Schüler möglichst gut fördern (ebenda). Ein überreaktiver Lehrer verstärkt dagegen durch frühzeitiges Stereotypisieren inter-individuelle Unterschiede. Welche schädlichen Auswirkungen ein in dieser Weise agierender Lehrer auf die gesamte Unterrichts- und Bewertungssituation haben kann, wurde in Kapitel 4.1.5 gezeigt.
Wichtig bei der kritischen und bewussten Beobachtung ist ein längerer Zeitraum, über den sich die Beobachtungen erstrecken sollen, und eine ganzheitliche Beobachtung (vgl. im Folgenden SCHRÖDER 1974, S. 48f.): „Die kritische Zuwendung ist ein Vorgang der Reflexion. Der kritische Bezug verläuft reflexiv. Die eigene Subjekt-Objekt-Relation wird zum Gegenstand (Bezugspunkt) des kritischen Bezugs.“ (ebenda, S. 49). Auch ZIEGENSPECK (vgl. im Folgenden 1999, S. 205) sieht als Voraussetzung für eine Kontrolle der durch implizite Persönlichkeitstheorien hervorgerufenen Effekte, dass sie durch den Lehrer erkannt werden. Nur dann können sie entsprechend eliminiert werden. Das Bewusstsein der Gefahren kann dazu führen, dass der Lehrer vorsichtiger und genauer seine Feststellungen treffen wird (vgl. STRITZKE/HARLES/WENZEL 1991, S.26). SCHRÖDER (vgl. 1990, S. 65) bezeichnet daher Objektivität als Aufgabe, die einen Anspruch hat, auch wenn sie niemals völlig umgesetzt werden kann. Als wichtige Grundlage zur Verringerung von Urteilsfehlern bezeichnen daher JÜRGENS/SACHER (vgl. im Folgenden 2008, S. 84) die Schulung der Lehrer im diagnostischen Bereich. In einer solchen Schulung sollte das Bewusstsein für die Beurteilerfehler geschärft werden, aber auch die Möglichkeit gegeben werden, Beurteilungsprozesse praktisch zu erproben, um Fehlerquellen konkret zu erleben.
Als Zusammenfassung hält BAUMANN (vgl. im Folgenden 1980, S. 25) fest, dass positive Einstellungen über Schüler eine fördernde Wirkung auf die Schüler haben, während negative Einstellungen die Gefahr einer Stigmatisierung fördern. Letztere können im Schüler langandauernde Vorbehalte gegen Schule und Lernen heraufbeschwören. Seine Forderung ist deshalb, dass Lehrer generell mit einer positiven Grundeinstellung an alle Schüler herangehen sollten, um diese Beurteilungstendenzen möglichst zum Nutzen der Schüler einzusetzen.
JÜRGENS/SACHER (2000, S.51; vgl. im Folgenden ebenda) ergänzen diese genannten Punkte und fordern „eine strikte mentale Trennung“ zwischen der objektiven Beschreibung einer Leistung und ihrer Bewertung, denn „sehr schnell wird aus einer Beobachtung eine gewagte Interpretation“. Sie warnen darüber hinaus vor einer Bewertung nach ‚globalen Beurteilungsgesichtspunkten‘ und fordern eine Gesamtbewertung (ebenda). Diese darf erst dann vorgenommen werden, wenn einzelne (vorher festgelegte) Aspekte und Dimensionen geprüft sind (vgl. zu den Aspekten und Dimensionen in der Verhaltensbeurteilung auch die Ausführungen in Kapitel 2.3). Zum Schluss verweisen JÜRGENS/SACHER (ebenda, S. 51) auf einen wichtigen Punkt: Der Lehrer solle „Abstand nehmen von Vorinformationen der Schüler durch Schülerakten oder den Lehrerzimmerklatsch.“ (Vgl. hierzu auch die Ausführungen in Kapitel 4.1.6.1).
Teil II Empirische Studie
5 Statistische Grundlagen
5.1 Häufigkeitsverteilungen
Will man die Frage klären, ob bestimmte Schulnoten gehäuft mit anderen Schulnoten auftreten, untersucht man die Konfigurationen (das Muster) von Schulnoten (vgl. im Folgenden LIENERT, S. 88f). Als Erwartungswert für die Besetzung eines Feldes der Häufigkeitstabelle ergibt sich der Wert
Abbildung in dieser Leseprobe nicht enthalten, mit Abbildung in dieser Leseprobe nicht enthalten als Randverteilungen der Tabelle und N = Anzahl Schüler.
Unter der Nullhypothese, dass die Schulnoten unabhängig voneinander variieren, müssten die beobachteten Werte den erwarteten entsprechen. Je größer die Differenz zwischen den erwarteten und den beobachteten Werten ist, desto eher kann von einer gemeinsamen Varianz der Schulnoten, d. h. einer Abhängigkeit zwischen den Variablen, ausgegangen werden.
5.2 T-Test für unabhängige Stichproben
Der T-Test ermöglicht es, aus der Analyse einer Stichprobe Rückschlüsse auf die zugrundeliegende Grundgesamtheit zu ziehen (vgl. im Folgenden BROSIUS 2003, S. 475f.). Der T-Test für unabhängig Stichproben prüft, ob sich die Mittelwerte von zwei unabhängigen Gruppen in der Grundgesamtheit unterscheiden. Datentechnisch gesehen kann man z. B. die Daten von Männern und die von Frauen aus einer gemeinsam erhobenen Stichprobe als eine jeweils unabhängige Stichprobe auffassen. Dies ist dadurch begründet, dass die Wahrscheinlichkeit, dass ein bestimmter Mann in die Stichprobe aufgenommen wird, unabhängig davon ist, ob eine bestimmte Frau in die Stichprobe aufgenommen wird.
Formal ergibt sich für den t-Wert (vgl. BROSIUS 2003, S. 483):
Abbildung in dieser Leseprobe nicht enthalten
mit Abbildung in dieser Leseprobe nicht enthalten als Stichprobenmittelwerte der jeweiligen Fallgruppen und Abbildung in dieser Leseprobe nicht enthalten und Abbildung in dieser Leseprobe nicht enthalten als die jeweiligen empirischen Varianzen. Abbildung in dieser Leseprobe nicht enthaltenund Abbildung in dieser Leseprobe nicht enthalten bezeichnen die Anzahl der Fälle in beiden Fallgruppen. Je größer der Wert von t, desto eher muss die Nullhypothese verworfen werden, dass die Mittelwerte in beiden Fallgruppen gleich sind.
5.3 Mittelwertvergleich mit ANOVA (Analysis of Variance)
ANOVA ist ein Modell für den Vergleich von Mittelwerten (vgl. im Folgenden BROSIUS 2004, S. 501 ff.). Mithilfe dieses Tests kann die Hypothese überprüft werden, ob in unterschiedlichen Teilgruppen der Grundgesamtheit ein gleich hoher Mittelwert zu finden ist. So kann z. B. überprüft werden, ob Schüler mit der Verhaltensnote 4 gleiche Mittelwerte in Englisch aufweisen wie Schüler mit der Verhaltensnote 2. Sind die Mittelwerte gleich, ist gezeigt, dass die Verhaltensnote unabhängig von der Leistung in Englisch vergeben wurde.
5.4 Zusammenhangsmaße
5.4.1 Korrelationskoeffizient nach Pearson für metrisch skalierte Merkmale
Der Korrelationskoeffizient nach PEARSON ist ein Maß über den linearen Zusammenhang der Ausprägung zweier Größen X und Y (vgl. im Folgenden BROSIUS 2004, S. 519ff.). Er errechnet sich aus dem Quotienten der Kovarianz Abbildung in dieser Leseprobe nicht enthalten mit dem Produkt der Standardabweichungen Abbildung in dieser Leseprobe nicht enthalten und Abbildung in dieser Leseprobe nicht enthalten der beiden Variablen X und Y.
Formal ergibt sich: Abbildung in dieser Leseprobe nicht enthalten.
Der Korrelationskoeffizient r nimmt Werte zwischen -1 und +1 an. Der Wert von -1 entspricht einem perfekten negativen linearen Zusammenhang, der Wert 1 zeigt einen perfekten positiven linearen Zusammenhang an. Der Interpretation von Zwischengrößen dient Abbildung 7.
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 7: Richtwerte für die Interpretation von Korrelationskoeffizienten
Quelle: BROSIUS 2004, S. 525
5.4.2 Kontingenzkoeffizient für nominal-skalierte Merkmale
Die Berechnung des Korrelationskoeffizienten nach PEARSON ist nur bei intervallskalierten Merkmalen möglich. Bei nominal skalierten Merkmalen (wie z. B. dem Merkmal Geschlecht) muss auf den Kontingenzkoeffizient zurückgegriffen werden, um eine Maßzahl für den Zusammenhang zu errechnen (vgl. BROSIUS 2004 S. 432ff.).[7] Die Aussagen aus obiger Abbildung 7 gelten in gleicher Weise für den Kontingenzkoeffizienten.
[...]
[1] In der vorliegenden Arbeit wird aus Gründen der besseren Lesbarkeit der Begriff ‚Schüler‘, soweit nicht anders vermerkt, für beide Geschlechter verwendet. Dies gilt auch für den Begriff ‚Lehrer‘.
[2] Dieser Sachverhalt geht auf die sogenannte Kulturhoheit der Länder im Bereich der Bildungspolitik zurück. Dies ist nach dem Grundgesetz der Bundesrepublik Deutschland vom 23.5.1949 geregelt (vgl. http://www.kmk.org/wir-ueber-uns/aufgaben-der-kmk.html, zugegriffen am 13.10.2009)
[3] Dies repräsentiert eine große Fülle von Persönlichkeitsmerkmalen, die in einer einzelnen Note zum Ausdruck gebracht werden sollen. Verschiedene Autoren kritisieren die Vergabe von Persönlichkeitsbeurteilungen als Zifferzensur und fordern eine Beurteilung in verbaler Form. Vgl. zur Diskussion z. B. LEHMANN/ZIEGENSPECK 2000, S. 219-222, SCHUMANN-ERNY 2003, S. 154-167, IMBRAHM S. 359f. und viele andere.
[4] Vielversprechend erscheint in dieser Schule die Durchführung einer kleinen Längsschnittstudie, da sich hier u. U. Unterschiede in der Benotung der Jahre 2007 und 2008 finden werden. Deshalb wurden in dieser Schule für vier Klassen über zwei aufeinander folgende Jahre Daten erhoben. Damit könnte die Frage geklärt werden, ob eine solche schulinterne Konkretisierung messbare Auswirkung auf die Struktur der Kopfnoten hat, und wenn ja, welche. Dies soll im praktischen Teil jeweils getrennt für die Jahre 2007 und 2008 ausgewertet werden.
[5] Diese Schule war nicht in die Exploration einbezogen.
[6] Der Name geht auf Pygmalion zurück, einen Bildhauer der griechischen Mythologie. Er hatte den Wunsch, dass eine Statue aus Stein, in die er sich verliebt hatte, zum Leben erweckt wird. Dieser Wunsch wurde ihm durch die Göttin Aphrodite gewährt und die so dargestellte Jungfrau zum Leben erweckt (vgl. Fußnote 327 bei Ziegenspeck 1999, S. 182).
[7] Weitere Ausführungen und die formale Darstellungen des Kontingenzkoeffizienten siehe BROSIUS 2004 ab S. 431.
Details
- Seiten
- Erscheinungsform
- Originalausgabe
- Erscheinungsjahr
- 2009
- ISBN (eBook)
- 9783836647144
- DOI
- 10.3239/9783836647144
- Dateigröße
- 2.3 MB
- Sprache
- Deutsch
- Institution / Hochschule
- Universität Hohenheim – Wirtschaftspädagogik, Diplom Handelslehrer
- Erscheinungsdatum
- 2010 (Juni)
- Note
- 1,3
- Schlagworte
- kopfnoten beeinflussungstendenzen beurteilungen schule untersuchung
- Produktsicherheit
- Diplom.de