Lade Inhalt...

Knuspels Leseaufgaben: Untersuchung zur Nützlichkeit eines Gruppenlesetests anhand der Lehrer einer bilingualen Schule

Examensarbeit 2008 142 Seiten

Pädagogik - Der Lehrer / Pädagoge

Leseprobe

Inhaltsverzeichnis

1 Einleitung

2 Theoretische Grundlagen
2.1 Anmerkungen zur Diagnosekompetenz von Lehrern und Lehrerinnen und zu Leistungsbeurteilungen
2.2 Pädagogisch-Psychologische Diagnostik..
2.2.1 Methoden der Pädagogisch-Psychologischen Diagnostik
2.2.2 Standardisierte Schulleistungstests
2.2.2.1 Begriffsbestimmung
2.2.2.2 Klassifikation und Verbreitung
2.2.2.3 Grundschulbereich
2.2.2.4 Gütekriterien
2.2.2.5 Anmerkungen und Kritikpunkte zum praktischen Nutzen
2.3 Bilinguale Unterrichtskonzepte.
2.3.1 Der deutsch-italienische Zweig an der für die Untersuchung ausgewählten Grundschule
2.3.2 Bilinguale Unterrichtskonzepte im Grundschulbereich

3 Empirische Untersuchung
3.1 Hypothesenbildung.
3.2 Ablauf der Untersuchung..
3.3 Prätests..
3.3.1 Der Fragebogen vor dem Test.
3.3.2 Einschätzung der Schüler durch die Lehrer
3.3.3 Zusammensetzung der untersuchten Klassen
3.3.4 Das erste Interview
3.4 Knuspels Leseaufgaben....
3.4.1 Theoretisches Konzept des Tests
3.4.2 Entwicklungspsychologische Lesemodelle
3.4.3 Beschreibung des Testmaterials und des Testaufbaus
3.4.4 Testauswertung..
3.4.5 Auffälligkeiten während der Durchführung und Auswertung
3.5 Posttests
3.5.1 Mitteilung der Testergebnisse..
3.5.2 Das abschließende Interview...

4 Darstellung der Ergebnisse
4.1 Ergebnisse des Prätests...
4.1.1 Erfahrungen mit standardisierten Schulleistungstests
4.1.2 Ansichten zum Leseverständnis und zu Leseleistungs-überprüfungen.
4.1.3 Erwartungen im Vorfeld des Tests
4.1.4 Einschätzungen zum Abschneiden der Klassen
4.2 Ergebnisse zur Leseleistung
4.2.1 Übereinstimmung der Lehrereinschätzungen mit den Knuspel-Ergebnissen
4.2.2 Anmerkungen zu den Knuspel- Ergebnissen
4.3 Ergebnisse nach der Testung.
4.3.1 Vorher- Nachher- Vergleich
4.3.1.1 Bewertungen von standardisierten Schulleistungstests
4.3.1.2 Beweggründe für eine Testdurchführung
4.3.1.3 Verhalten der Klasse
4.3.2 Bewertung von Knuspels Leseaufgaben
4.3.3 Fazit der Lehrer zur Nützlichkeit von Knuspel-L

5 Diskussion

6 Zusammenfassung

7 Literaturverzeichnis

8 Anhang

1 Einleitung

Ein wichtiger Bestandteil der Arbeit von Lehrkräften ist die Beurteilung von Schülerleistungen. Insbesondere im Grundschulbereich sind zunehmend diagnostische Kompetenzen des Lehrers gefragt, vor allem bei der Einschulung und der Förderung von Kindern mit sonderpädagogischem Förderbedarf (Lenhard, 2005, o. S.). Dabei sind die Anforderungen sehr vielfältig, so sollen beispielsweise Lernschwächen frühzeitig entdeckt, Schullaufbahnentscheidungen adäquat gefällt und Leistungen objektiv beurteilt werden. Als Hilfestellung für die Beurteilungsaufgaben des Lehrers werden neben anderen Methoden auch standardisierte Testverfahren diskutiert. Laut Marx (1997, S. 111) sollten die Akzeptanz für den Einsatz solcher Verfahren in Schulen gefördert und diagnostische Kompetenzen der Lehrer, speziell auch in der Auswertung der Testergebnisse, geschult werden.

Ausgehend von dieser Forderung ist es interessant zu prüfen, wie die Haltung der Lehrer gegenüber den Tests in Wirklichkeit aussehen kann und wie hoch der praktische Nutzen in einzelnen konkreten Fällen tatsächlich ist. Im Mittelpunkt der vorliegenden Examensarbeit stehen daher standardisierte Schulleistungstests und deren Einsatz im Deutschunterricht an Grundschulen. Dabei wird speziell die praktische Nützlichkeit des Gruppenlesetests Knuspels Leseaufgaben (Marx, 1998a) überprüft.

Dazu wird neben weiteren Überlegungen der Frage nachgegangen, ob dieser Test Erkenntnisse über die Lesefähigkeit von Schülern liefern kann, die über auf anderem Wege gewonnene Einschätzungen von Lehrerinnen und Lehrern hinausgehen.[1]

Unter dieser thematischen Zielsetzung fand im Rahmen der Arbeit eine empirische Untersuchung statt. Da zur Beurteilung des Verfahrens die Meinung derjenigen herangezogen werden soll, die das Verfahren in der Praxis anwenden können, wurden Lehrer zu Ihrer Einschätzung von Knuspels Leseaufgaben (nachfolgend auch durch Knuspel-L abgekürzt) befragt. Die Aussagen der Lehrerinnen und Lehrer, welche durch Interviews und Fragebögen gewonnen wurden, dienen demnach als wichtige Informationsquelle und bilden das subjektive Lehrerurteil über das Testverfahren.

In insgesamt vier Klassen einer Grundschule, jeweils eine Klasse je Klassenstufe, wurden der Gruppenlesetest Knuspels Leseaufgaben durchgeführt und die Ergebnisse ausgewertet. Vor und nach der Testung fand ein Interview mit den Deutschlehrern der jeweiligen Klassen statt, wodurch ein Vorher-Nachher-Vergleich der Aussagen ermöglicht wird und sich folgende Fragen ergeben: Werden die Lehrer vor dem Test eine andere Meinung haben als hinterher? Können Lehrer, die noch nie ein solches Testverfahren eingesetzt haben, überzeugt werden oder würden sie Knuspel- L auf keinen Fall selbst einmal anwenden? Und eignet sich der Test auch bei bilingual unterrichteten Schülern?

Weiterhin sollten die Lehrkräfte vor der Testdurchführung die Leseleistung ihrer Schüler beurteilen, so dass die Lehrereinschätzungen anschließend mit den Testergebnissen verglichen werden können. Aus den Übereinstimmungen oder Diskrepanzen kann der objektive Nutzen des Verfahrens abgeleitet werden.

Bevor die Methodik der empirischen Untersuchung genauer erläutert wird und eine Darstellung der Ergebnisse erfolgt, werden im ersten Teil dieser Arbeit zunächst theoretische Grundlagen skizziert. Zudem sollen einige Begrifflichkeiten geklärt werden, um den Test als psychologisches Verfahren in der pädagogisch-psychologischen Diagnostik einordnen zu können. Ausführlicher beschrieben wird Knuspel-L dann in Kapitel 3.3.

Hinsichtlich der Frage nach der Nützlichkeit ist es zusätzlich angebracht, die allgemeine Kritik zu standardisierten Tests zu betrachten, welche der wissenschaftlichen Literatur entnommen werden kann.

2 Theoretische Grundlagen

Knuspel-L zählt zu den Testverfahren, die als standardisierte Schulleistungstests bezeichnet werden. Wie sich auch bei der Befragung der Lehrer zeigte, kann dieser Begriff ohne weitere Erklärungen leicht zu Missverständnissen führen. Damit eindeutig ist, was genau man unter der Bezeichnung versteht, sollen in diesem Teil der Arbeit Begrifflichkeiten geklärt und grundlegende Merkmale solcher Verfahren skizziert werden. Des Weiteren gibt das nachfolgende Unterkapitel einen Einblick in theoretische Überlegungen zu diagnostischen Kompetenzen von Lehrern bei Leistungsbeurteilungen in Schulen.

Zuletzt werden noch Grundlagen zu bilingualen Unterrichtskonzepten in Grundschulen formuliert. Dies ist nötig, da es sich bei den für die Untersuchung ausgewählten Schulklassen um bilingual unterrichtete Klassen handelt.

2.1 Aspekte zur Diagnosekompetenz von Lehrern und Lehrerinnen und zu Leistungsbeurteilungen

Lehrer müssen in ihrem Beruf fortlaufend diagnostische Leistungen erbringen (vgl. Gage & Berliner, 1996, S. 581). Diese haben einen hohen Stellenwert, denn „individuelle Förderung setzt ein ausreichendes diagnostisches Wissen der verantwortlichen Lehrkraft zwingend voraus“ (Helmke, 2007, S. 85). Unter dem Begriff der diagnostischen Kompetenz versteht Helmke (2007, S. 92) im engeren Sinne, die Fähigkeit eines Urteilers einzelne Personen oder ganze Gruppen betreffend, an einem vorgegebenen Maßstab oder Kriterium bemessen, zu beurteilen.

Diagnoseleistungen sind im Berufsalltag des Lehrers nötig, um neben der Beurteilung des Lernerfolgs der Schüler den Lehr- und Lernprozess gezielt zu planen, zu gestalten und zu optimieren und um sachgerechte pädagogische Entscheidungen treffen zu können (Schrader, 2008, S. 168). Zur diagnostischen Kompetenz zählen aber ebenso die Kenntnis und Beherrschung von geeigneten diagnostischen Methoden, die zur Beurteilung herangezogen werden (vgl. ebd., S. 168).

Auch Langfeldt (2006, S. 196) betont, wie wichtig eine hohe Urteilsfähigkeit der Lehrer ist, wobei dies sowohl für einzelne Unterrichtseinheiten als auch für die Beeinflussung von ganzen Schulkarrieren gilt. Die Anforderungen des Unterrichts müssen im Optimalfall an die Lernvoraussetzungen der Schüler angepasst sein. Diese Voraussetzungen muss der Lehrer einschätzen können, denn nach Schrader (2006) wird die Qualität diagnostischer Urteile „(…) als wichtige Bedingung für erfolgreiches und effektives erzieherisches Handeln angesehen“ (S. 95).

Die diagnostischen Aufgaben, mit denen ein Lehrer im Schulalltag konfrontiert wird, sind sehr vielfältig. Langfeldt (2006, S. 199) ordnet sie drei verschiedenen Ebenen zu. Auf der individuellen Ebene muss der Lehrer beispielsweise einschätzen können, ob bestimmte Aufgaben für einen Schüler zu bewältigen sind. Innerhalb der Klassenebene sollte der Lehrer z. B. Unterschiede zwischen den Schülern feststellen können. Auf der institutionellen Ebene stehen schließlich Aufgaben wie beispielsweise das Erstellen zutreffender Zeugnisse und Empfehlungen für die weitere Schullaufbahn an.

Dabei kommen den Schulnoten und Zeugnissen wichtige pädagogische und gesellschaftliche Funktionen zu. Der Lehrer trägt als Notengeber eine große Verantwortung, denn Noten liefern nicht nur Rückmeldungen über die Leistung an Schüler und Eltern, sondern sie können auch den Unterrichtserfolg mitbestimmen, je nachdem, ob sie motivierend wirken oder nicht. Außerdem wird in den meisten Fällen die Vergabe von Ausbildungs- und Arbeitsplätzen durch Noten geregelt (vgl. Langfeldt & Tent, 1999, S. 72f).

Um die Leistungen der Schüler überprüfen und beurteilen zu können, stehen dem Lehrer verschiedene Methoden zur Verfügung. Dazu zählen neben Beobachtungen, die sich im alltäglichen Unterrichtsverlauf ergeben, die Überprüfung der Leistung durch Klassenarbeiten und Tests oder auch Beurteilungen anhand von Portfolios und Referaten der Schüler. Als weitere Beurteilungshilfe können standardisierte Schulleistungstests, welche im Unterkapitel 2.2. ausführlicher beschrieben werden, dienen.

Um ein Urteil fällen zu können, bedarf es laut Langfeldt (2006, S. 201) eines Bezugsystems mit Bezugsnormen, wobei zwischen sozialbezogenen, individuellen und kriteriumsorientierten Normen unterschieden wird. Als Bezugsnormen definiert Rheinberg (2008) „(…) Standards, mit denen man ein Resultat vergleichen muss, wenn man das Resultat als Leistung bewerten will“ (S. 178). Bei der sozialen Bezugsnorm wird der Ausprägungsgrad eines bestimmten Merkmals im Vergleich zu den Merkmalsausprägungen anderer Schüler bestimmt. Hingegen spielen bei der individuellen Bezugsnorm die Leistungen der Mitschüler keine Rolle; allein die individuelle Leistungsentwicklung des Schülers zählt. Die kriteriumsorientierte Bezugsnorm bedeutet, dass die Leistung in Relation zu einem zuvor bestimmten Erfolgskriterium bemessen wird (vgl. Klauer & Leutner, 2007, S. 338f; Wild & Krapp, 2006, S. 542). Laut Rheinberg (2008, S. 180) ist es nicht günstig, sich auf eine der Bezugsnormen festzulegen, da jede ihre Vorzüge und Schwächen besitzt. Eine situationsbedingte Auswahl scheint eher förderlich zu sein.

Die Beurteilungen durch die Lehrer sind jedoch „(…) stets ein Produkt subjektiver Konstruktionen und Interpretationen“ (Langfeldt, 2006, S. 200), und bei der Beurteilung von Schülern können sich stets auch zahlreiche Fehler und Verzerrungen einschleichen, welche Langfeldt (2006, S. 202) in einer Übersicht zusammenfasst. So können sich beispielsweise Lehrer in ihrer Urteilstendenz unterscheiden und urteilen vielleicht eher milde oder möglicherweise durchweg sehr streng. Ein- und dieselbe Leistung kann daher von verschiedenen Lehrern unterschiedlich bewertet werden. Verzerrungen in der Beurteilung können darüber hinaus auch durch so genannte Kontrasteffekte, Haloeffekte, oder Positionseffekte erklärt werden. Der Kontrasteffekt bedeutet, dass Bewertungen durch zuvor gewonnene Eindrücke beeinflusst werden. Positionseffekte bezeichnen das Phänomen, das bei einer ganzen Reihe von Informationen diejenigen am Anfang und am Ende leichter behalten werden können und stärker zur Eindrucksbildung beitragen als die dazwischen. Der Haloeffekt besagt, dass ein besonders markantes Merkmal eines Schülers die Wahrnehmung weiterer Merkmale mit beeinflusst (Langfeldt, 2006, S. 202).

Insbesondere Schulnoten, welche die Leistungen der Schüler abstrahiert in Form von festgelegten Abstufungen wiedergeben, wurden in der Vergangenheit häufig kritisiert und ihre Fehleranfälligkeit wurde in zahlreichen empirischen Untersuchungen überprüft (vgl. Wild & Krapp, 2006, S. 555). Vergleiche von Lehrerurteilen und Leistungen in Testverfahren haben gezeigt, dass es zwar auffällige Unterschiede in den Korrelationen bei verschiedenen Lehrern gibt, aber insgesamt betrachtet erscheinen die Einschätzungen auf klasseninterner Ebene angemessen und genau (vgl. Schrader, 2006, S. 97). Langfeldt (2006, S. 204) kommt zu dem ähnlichen Fazit, dass innerhalb einer Klasse die Noten der Rangreihe der Schüler hinsichtlich ihrer Leistung nahezu zuverlässig entsprechen. Der entscheidende Punkt aber ist, dass über die eigene Klasse des Lehrers hinaus diese Leistungen kaum vergleichbar mit denen anderer Schulklassen sind. Untersuchungen zeigten nämlich, dass die Korrelation von Noten und Testergebnissen innerhalb der Klasse zwar hoch ist, aber zwischen den Klassen-Mittelwerten ist sie niedrig (Langfeldt & Tent, 1999, S. 75).

Für eine faire Beurteilung der Schülerleistungen ist es jedoch nach Helmke (2007, S. 96) wichtig, in etwa zu wissen, wie das Leistungsniveau der Klasse im Vergleich zu anderen Klassen aussieht. Da Schulnoten für schulische und berufliche Laufbahnen eine wichtige Rolle spielen (vgl. Wild & Krapp, 2006, S. 554), müssen diese gerecht vergeben werden. In dieser Hinsicht können standardisierte Schulleistungstests einen Vergleich ermöglichen, da die Ergebnisse der Schüler im Test anhand der Normwerte mit denen einer großen Stichprobe objektiv verglichen werden können.

Besonders bei der Empfehlung für die Schullaufbahn ist es wichtig, die Schülerleistungen auch klassenübergreifend einschätzen zu können. Ansonsten könnte beispielsweise ein Schüler mit mittelmäßigen Leistungen in einer insgesamt eher leistungsschwachen Klasse ganz andere Chancen haben, als wenn er sich in einer leistungsstarken Klasse befände.

2.2 Pädagogisch-psychologische Diagnostik

Unter pädagogisch-psychologischer Diagnostik versteht man nach Leutner (2006, S. 559) eine psychologische Diagnostik, die im Dienst von pädagogischen Entscheidungen steht. Ingenkamp (1985) hat folgende Definition formuliert, welche die Aufgaben der pädagogisch-psychologischen Diagnostik näher umreißt. Sie soll demnach „(…) sowohl individuelles Lernen optimieren als auch im gesellschaftlichen Interesse Lernergebnisse feststellen und den Übergang in verschiedene Lerngruppen, Kurse oder Bildungswege nach vorgegebenen Kriterien verbessern“ (S.11).

Zwar gibt es auch noch weitere Anwendungsfelder und diagnostische Arbeitsgebiete der pädagogisch-psychologische Diagnostik (vgl. Wild & Krapp, 2006, S. 527ff; Leutner, 2006, S. 562), aber hier werden ausschließlich Anwendungen im Bereich des schulischen Bildungssystems und dabei speziell Verfahren zur Leistungsmessung thematisiert.

In den folgenden zwei Unterkapiteln werden daher diagnostische Methoden beschrieben, die innerhalb der pädagogisch-psychologischen Diagnostik der Leistungsfeststellung dienen. Informelle Tests, welche z.B. Lehrpersonen selbst entwerfen, werden hier außer Acht gelassen, denn der Schwerpunkt liegt auf der Untersuchung von Testverfahren, die von Wissenschaftlern unter Beachtung wissenschaftlicher Gütekriterien konzipiert wurden. Dies soll nicht bedeuten, dass informelle Tests nicht auch zumindest hinreichend die Gütekriterien wie Validität, Objektivität und Reliabilität erfüllen könnten, aber da das Testverfahren Knuspels Leseaufgaben zu den so genannten standardisierten Schulleistungstests zählt, werden vorrangig derartige Tests thematisiert.

2.2.1 Methoden der pädagogisch-psychologischen Diagnostik

Wenn man pädagogisch-psychologische Diagnostik betreibt, wird eine Leistung nicht nur in ihrem Ausprägungsgrad beschrieben, sondern auch hinsichtlich der Qualität beurteilt. Außerdem kann die Diagnostik einen Lernprozess entweder begleiten oder abschließen. Man bezeichnet dies dann entweder als Prozessdiagnostik oder als Status- bzw. Zustandsdiagnostik (Langfeldt, 2006, S. 197; Leutner, 2006, S. 560). Eine Status- oder auch Selektionsdiagnostik kann im Bereich der Schule zum Beispiel Tests zur Schulreife, Sonderschulbedürftigkeit oder zur Leistungsfeststellung umfassen (vgl. Leutner, 2006, S. 560).

Zu den diagnostischen Methoden zur Schulleistungsfeststellung zählen nach Lissmann (2006, S. 665) neben Tests im eigentlichen Sinne auch Frage- und Beobachtungsbogen. Außerdem werden, abgesehen von Schulleistungstests, zahlreiche weitere standardisierte Testverfahren in der pädagogisch-psychologischen Diagnostik angewendet, wie beispielsweise Einschulungs- und Entwicklungstests, Tests zur Überprüfung des Sozialverhaltens oder schulrelevanter Persönlichkeitsmerkmale (Roick, 2008, S. 272).

2.2.2 Standardisierte Schulleistungstests

Mit Hilfe von Schulleistungstests sollen Lernvoraussetzungen und Lernergebnisse ermittelt werden, um einen Schüler optimal fördern zu können (vgl. Lissmann, 2006, S. 665). Es handelt sich dabei um Messinstrumente zur Erfassung von Schulleistungen, die üblicherweise zu den so genannten „objektiven“ Verfahren gerechnet werden (Heller & Hany, 2002, S. 91). Damit grenzen sie sich zu den „subjektiven“ Verfahren ab (z.B. dem Lehrerurteil). Eine Urteilsoptimierung ist nach Heller und Hany (2002, S. 94) nicht durch eine der beiden, sondern nur durch die Kombination beider Verfahren zu erreichen, denn beide Formen zeigen verschiedene Vorteile und dienen unterschiedlichen Verwendungszwecken (Gage & Berliner, 1996, S. 581). In den folgenden Unterkapiteln erfolgt eine Beschreibung von standardisierten Schulleistungstests und eine Betrachtung ihrer Vor- und Nachteile, wie sie der Literatur zu entnehmen sind.

2.2.2.1 Begriffsbestimmung

Langfeldt (2006) definiert den Begriff Standardisierte Schulleistungstests folgendermaßen: „Standardisierte Schulleistungstests sind Leistungsüberprüfungen, deren metrische Eigenschaften bekannt sind, die in Klassen nach jeweils gleichen Regeln durchgeführt, ausgewertet und interpretiert werden und die den Vergleich mit einer repräsentativen Bezugsgruppe ermöglichen. Ihre Güte kann hinsichtlich bestimmter Kriterien überprüft werden“ (S. 219).

Die Besonderheit im Vergleich zu selbst entworfenen Tests liegt darin, dass sie nach wissenschaftlichen Kriterien konstruiert wurden und dem Erscheinen auf dem Markt meistens eine jahrelange Vorbereitungszeit voraus ging. Sie können in den unterschiedlichsten Ebenen und Formen des Schulwesens (z. B. auch Vorschule oder Hochschule) und im Gegensatz zu klinischen Verfahren auch von qualifizierten Lehrkräften und nicht ausschließlich von Diplom-Psychologen eingesetzt werden (vgl. Lissmann, 2006, S. 665). Einen Überblick der genauen rechtlichen Zulässigkeiten von Testanwendungen, über welche z.T. Verunsicherung in den Schulen bestehen, bietet Lenhard (2005, o. S.).

2.2.2.2 Klassifikation und Verbreitung

In der Literatur finden sich unterschiedliche Bezeichnungen und Gruppierungen für einzelne Kategorien von Schultests, wobei die Zuordnung meistens davon abhängig ist, mit welchen Vorgaben das Testergebnis verglichen wird. So kann der Vergleich entweder anhand der Ergebnisse einer sozialen Bezugsgruppe, auch als normorientiert bezeichnet, stattfinden oder anhand individueller Ergebnisse aus früheren Tests. Eine dritte Möglichkeit besteht darin, das Testergebnis mit einem zuvor festgelegten Lernerfolgskriterium zu vergleichen (vgl. Lissmann 2006, S.665f; Roick 2008, S. 272). Diese drei Varianten entsprechen im Wesentlichen den Bezugsnormen, welche zur Leistungsbeurteilung herangezogen werden und bereits in Kapitel 2.1. beschrieben wurden.

In den USA oder anderen angelsächsischen Ländern hat der Einsatz von diagnostischen Tests im Schulunterricht eine bedeutend längere und weit verbreitetere Tradition als im deutschen Schulsystem (vgl. Langfeldt, 2006, S. 219; Ingenkamp & Lissmann, 2005, S. 155f).

Zwar wurden laut Langfeldt und Trolldenier (1993, S. 14) Ende der 60er und Anfang der 70er Jahre viele schuldiagnostische Testverfahren in Deutschland entwickelt, aber in den darauf folgenden Jahren stagnierte die Zahl der Neuentwicklungen, was dazu führte, dass es immer weniger aktuellere Tests gab. Die Tests sollten damals nach Wild und Krapp (2006) „(…) eine psychodiagnostisch besser fundierte Alternative zur allgemein üblichen Bewertungspraxis durch Lehrkräfte bieten“ (S. 551).

Im Zuge der großen Bildungsforschungsprojekte wie beispielsweise der PISA-Studie erhielt die Testentwicklung in Deutschland in den letzten Jahren neuen Aufschwung (Lissmann, 2006, S. 666). Aufgrund des nur mittelmäßigen Abschneidens der deutschen Schüler in der internationalen Vergleichsstudie TIMSS werden vergleichende Leistungsmessungen und die Bedeutung von Schulleistungsmessungen in öffentlichen Diskussionen thematisiert (Weinert, 2002, S. 5). Zudem wurde laut Leutner (2006, S. 567) eine Veränderung der Einstellung gegenüber dem Einsatz standardisierter Testverfahren in deutschen Schulen angetrieben.

In Testkatalogen (z. B. Brickenkamp, 1997) werden unterschiedliche Typen von Tests hinsichtlich ihrer Gütekriterien und des Testaufbaus beschrieben. Außerdem kann man sich im Internet über aktuell verfügbare Testverfahren informieren (z. B. www.testzentrale.de).

Lissman (2006, S. 667) bemerkt, dass es verhältnismäßig wenige aktuelle Verfahren insbesondere im Bereich von Schulleistungstests gibt und sieht einen der Hauptgründe darin, dass viele der Tests veraltet sind. Gründe hierfür können nach Heller und Hany (2002, S. 94) die Änderungen der Unterrichtsformen, der Schülerpopulationen oder der Lehrpläne sein. Laut Klauer & Leutner (2007, S. 344f) orientieren sich nämlich die Autoren bei der Testkonstruktion häufig an Lehrplänen, die sich jedoch im Laufe der Jahre schnell ändern können.

Hinzu kommt, dass der Aufwand einer Anpassung des Tests an Neuerungen wie beispielsweise an den Euro oder die neue deutsche Rechtschreibung enorm hoch ist (Lissmann, 2006, S. 670). Auch eine erforderliche Neunormierung ist in vielen Fällen kaum lohnenswert.

Langfeldt (2006, S. 221) sieht hingegen das geringe Angebot von aktuellen Testverfahren in der gegenwärtigen noch geringen Akzeptanz von standardisierten Schulleistungstests in der Schulpraxis begründet. Leutner (2006) vermutet, dass dies wiederum an der „(…) teilweise recht hohen statistischen Komplexität und mangelnden Praktikabilität der Verfahren (…)“ (S. 567) liegen könnte.

2.2.2.3 Im Grundschulbereich

Die meisten standardisierten Testverfahren sind für das Grundschulalter konzipiert (Heller & Hany, 2002, S. 94). Sie unterscheiden sich von denen der Sekundarstufe nicht nur in der allgemein höheren Schwierigkeit und Komplexität der zu überprüfenden Anforderungen, sondern auch in der weniger spezifischen Fachlichkeit der Unterrichtsziele (vgl. Lehmann, 2002, S. 131). In der Kategorie der standardisierten Schulleistungstests ist der Übersicht von Lissmann (2006, S. 667ff) zu entnehmen, dass es hauptsächlich Tests zur Überprüfung des Leseverständnisses, der Rechtschreibung und mathematischer Leistungen gibt. Bei den Lesetests spielt laut Schneider (2002, S. 145) das bereits in Kapitel 2.2.2.2 erwähnte Problem der mangelnden Lehrplangültigkeit „(…) insofern eine geringere Rolle, als für die Kompetenzentwicklung außerschulischen Einflüssen eine vergleichsweise bedeutsame Rolle zugeschrieben wird“ (S. 145). Dementsprechend kann man nachvollziehen, weshalb der Lesetest Knuspel-L, der vor fast zehn Jahren auf dem Markt erschien, auch heute noch verfügbar ist und angewendet werden kann. Zwar entsprechen im Testheft manche Schreibweisen nicht mehr der neuen Rechtschreibung, aber diese sind zahlenmäßig eher gering.

2.2.2.4 Gütekriterien

Um eine möglichst hohe Qualität diagnostischer Urteile zu erhalten, werden standardisierte Schulleistungstests im Normalfall hinsichtlich ihrer metrischen Eigenschaften getestet. In empirischen Untersuchungen kann geprüft werden, ob ein Testverfahren den Qualitätskriterien Validität (Gültigkeit) und Reliabilität (Zuverlässigkeit) genügen kann. Nach Roick (2008, S. 274) sind aber auch für nicht standardisierte diagnostische Urteile diese Kriterien relevant.

Vereinfacht ausgedrückt ist ein Test dann valide, wenn er genau das erfasst, was er auch erfassen sollte. Dabei werden verschiedene Validitätsformen unterschieden, deren Beschreibung allerdings den Rahmen dieser Arbeit sprengen würde. An dieser Stelle kann aber auf Roick (2008, Kap. 3.3) oder auf Gage und Berliner (1996, Kap. 12.6) verwiesen werden, die das Kriterium der Validität ausführlicher betrachten.

Als reliabel gilt ein Test, „(…) wenn er das, was er misst, möglichst fehlerfrei misst“ (Leutner, 2006, S. 565). Wenn ein Test das Kriterium der Objektivität erfüllen kann, so bedeutet dies, dass das Testergebnis nicht vom Testleiter oder anderen äußeren Faktoren abhängig ist und subjektive Einflüsse weitgehend ausgeschlossen sind (vgl. Klauer & Leutner, 2007, S. 345; Roick 2008, S. 74f). Dies kann beispielsweise durch genau vorgegebene Durchführungs- oder Auswertungsweisen erreicht werden.

Neben diesen drei Hauptgütekriterien gibt es noch einige so genannte Nebengütekriterien, wobei Merkmale wie Ökonomie, Fairness, Nützlichkeit und Zumutbarkeit bei standardisierten Schulleistungstests relevant sein können (vgl. Heller & Hany, 2002, S. 91; Roick, 2008, S. 278f).

Hinsichtlich der Ökonomie wird das Kosten-Nutzen-Verhältnis der Testdurchführung betrachtet. Ein Test gilt dann als ökonomisch, wenn die Durchführung und Auswertung nicht mit übermäßigem Zeit- und Materialaufwand verbunden ist. Heller und Hany (2002, S. 91) betrachten einen Test als ökonomisch, wenn das Verhältnis von Aufwand und Erkenntnisgewinn stimmt.

Um den Test in einer Schulklasse durchführen zu können, sind parallele Testformen, Auswertschablonen oder die „(…) Durchführbarkeit im Rahmen der schulischen Zeitvorgaben (…)“ (Roick, 2008, S. 279) sinnvoll.

Fair ist ein Test dann, wenn kein Schüler aufgrund seines geschlechtsspezifischen, ethnischen oder soziokulturellen Hintergrundes benachteiligt ist (Roick, 2008, S. 279). Dies kann beispielsweise durch gruppenspezifische Normierungen verhindert werden.

Laut Roick (2008) bezieht sich die Nützlichkeit „(…) auf den praktischen Bedarf für das Testverfahren“ (S. 279). Wenn keine alternativen vergleichbaren Verfahren existieren, so kann man die Nützlichkeit als hoch ansehen. Schließlich spricht das Nebengütekriterium Zumutbarkeit die psychische und physische Belastung der getesteten Schüler an.

2.2.2.5 Kritikpunkte und Aspekte zum praktischen Nutzen

Der Vorteil von standardisierten bezugsgruppenorientierten Testverfahren gegenüber alltagspraktischen Verfahren liegt darin, dass sie eine Beurteilung der Schülerleistungen ermöglichen, die über die Schulklasse hinaus geht (vgl. Langfeldt, 2006, S. 220). Den klassenübergreifenden Vergleich gestattet die Normierung von standardisierten Tests. Im Wesentlichen bedeutet eine Normierung, dass vor einer Veröffentlichung eines Tests dieser an einer umfangreichen und repräsentativen Stichprobe durchgeführt wird. Die Ergebnisse dieser so genannten Normierungs- oder Eichstichprobe dienen als Bewertungsgrundlage für die Leistungen der später getesteten Schüler und anhand der Verteilungsmerkmale der Punktwerte können Norm- oder Standardwerte entwickelt werden (vgl. Langfeldt, 2006, S. 220). Dabei werden als Vergleichswerte üblicherweise T-Werte oder Prozentrangplätze verwendet. Der Prozentrang gibt an, wie viele Schüler genauso gut oder schlechter abgeschnitten haben als ein untersuchter Schüler (Ingenkamp & Lissmann, 2005, S. 64). So bedeutet beispielsweise ein Prozentrang von 56, dass 56% der Vergleichsgruppe ein schlechteres oder genauso gutes Ergebnis erzielt haben. Die T-Werte beruhen auf der Annahme, dass die empirischen Werte sich normal verteilen und man sie den Werten einer Normalkurve zuordnen kann. Oberhalb und unterhalb des Mittelwertes liegen genau 50% der Verteilung und somit ist die theoretische Normalverteilung symmetrisch (vgl. Ingenkamp & Lissmann, 2005, Kap. 2.4.2).

Anhand des klassenübergreifenden Vergleichs kann der Lehrer nach Lenhard (2005, o. S.) die Effektivität seines eigenen Unterrichts überprüfen und relativ schnell zuverlässige Informationen über Schüler erhalten, die ihm noch unbekannt sind (z.B. bei der Einschulung, der Übernahme neuer Klassen oder bei einem Schulwechsel). Manche Verfahren bieten darüber hinaus eine differentielle Analyse eines Leistungsverhaltens und erleichtern somit eine entsprechende Förderung (vgl. Lenhard, 2005, o. S.).

Problematisch ist die bereits in Kapitel 2.2.2.2 beschriebene Orientierung der Tests an den Lehrplänen, da sich die Lehrpläne der einzelnen Bundesländer unterscheiden und der Test so kaum allen Lehrplänen in Deutschland gerecht werden kann (Klauer & Leutner, 2007, S. 344f).

Klassische Schulleistungstests zeichnen sich vielmehr durch den Vorteil aus, dass sie klassenübergreifende und in einigen Fällen sogar internationale Vergleiche erlauben. Die Klassenarbeiten sind in der Regel eher auf den konkreten Unterrichtsverlauf zugeschnitten, aber eine noch bessere Möglichkeit lehrzielvalide zu prüfen, bieten nach Klauer und Leutner so genannte lehrzielorientierte Testverfahren. Diese Testverfahren testen die Erreichung eines bestimmten Lehrziels, aber zur näheren Beschreibung solcher Tests soll an dieser Stelle auf Klauer und Leutner (2007, Kap. 17.4) verwiesen werden.

Was die Häufigkeit der Messung von Schulleistungen betrifft, so ist es wichtig, die diagnostischen Erhebungen weder zu selten noch zu häufig durchzuführen, um optimale Ergebnisse zu erzielen (vgl. Langfeldt, 2006, S. 198).

2.3 Bilinguale Unterrichtskonzepte

Bilinguale Unterrichtskonzepte bedeuten, dass Schüler auf eine Weise eine Zweitsprache erlernen, die sich von den üblichen Formen des Fremdsprachenunterrichts in Schulen unterscheidet, da einzelne Unterrichtsfächer oder der gesamte Unterricht in zunehmendem Maße zweisprachig stattfinden. Während bilinguale Unterrichtsformen in weiterführenden Schulen häufiger anzutreffen sind und bereits eine längere Tradition haben, sind sie im Grundschulbereich eher selten (vgl. Piske, 2007, S. 28).

Da die Klassen, welche im Rahmen der Untersuchung getestet wurden, alle vier bilingual unterrichtet werden, wird im folgenden Unterkapitel zunächst das konkrete Konzept dieser Schule beschrieben. Die Informationen darüber ergaben sich hauptsächlich durch Gespräche mit dem Direktor der Schule und den Lehrkräften. Im daran anschließenden Kapitel folgen noch einige ergänzende Aussagen zu bilingualen Unterrichtskonzepten im Grundschulbereich und zum entsprechenden Forschungsstandpunkt.

2.3.1 Der deutsch-italienische Zweig an der für die Untersuchung ausgewählten Grundschule

In der getesteten Grundschule werden in der Regel zwei bis drei Klassen je Klassenstufe unterrichtet. Seit dem Schuljahr 2001/2002 bietet die Schule einen bilingualen Zweig an. Es gibt seitdem stets einen Klassenzug, in dem die Kinder, welche diese so genannten „i-Klassen“ besuchen, zweisprachig in Deutsch und Italienisch unterrichtet werden. Ab dem ersten Schuljahr erhalten die Schüler Unterricht im Fach Italienisch, wobei der Sprachunterricht in deutsch bzw. italienisch im Stundenplan in halben Gruppen stattfindet und zeitlich parallel gekoppelt ist.

Durch den zusätzlichen Italienischunterricht werden die Schüler wöchentlich fünf Stunden mehr unterrichtet als ihre Altersgenossen in nicht-bilingualen Klassen. Eine italienische Lehrkraft übernimmt den italienischen Fachunterricht und unterrichtet im Team mit der deutschen Klassenlehrerin weitere Stunden im Sachfachunterricht.

Laut Aussage der Schulleitung sollte das fremdsprachliche Lernen nicht in isolierten Fachstunden erteilt werden, sondern vielmehr im zunehmenden Maße auch in anderen Fachbereichen Anwendung finden und in den Unterricht integriert werden.

2.3.2 Bilinguale Unterrichtskonzepte im Grundschulbereich

Das Konzept, welches hinter diesem Projekt der ausgewählten Grundschule steckt, ist nach Aussage des Schuldirektors teilweise von der Schulleitung selbst entwickelt, zu einem großen Teil ist es aber auch auf das Konzept der Deutsch-Italienischen Gesamtschule in Wolfsburg zurückzuführen.

Kniffka und Siebert-Ott (2007, S. 175) beschreiben diese Schule in Wolfsburg als ein Beispiel für Bildungsprogramme, bei denen Schülerinnen und Schüler mit und ohne Migrationshintergrund gemeinsam unterrichtet werden. Diese so genannten „two-way-immersion“-Programme werden im Grundschulbereich angewendet und „(…) sind für Kinder aus zwei Sprachgruppen konzipiert, deren Erstsprachen beide auch als Unterrichtssprachen eingesetzt werden“ (Kniffka & Siebert-Ott, 2007, S. 174). Die Klassen setzen sich zur Hälfte aus Kindern zusammen, die keinen italienischen Sprachhintergrund haben, und zur Hälfte aus Kindern, welche mit Italienisch als Muttersprache oder zweisprachig aufgewachsen sind. An der für die Studie ausgewählten Schule sind die bilingualen Klassen ebenfalls derartig zusammengestellt.

Um das Konzept von den anderen sonst üblichen Unterrichtskonzepten abzugrenzen, sollen diese kurz skizziert werden. Dabei muss darauf hingewiesen werden, dass die folgenden Bezeichnungen regional abhängig und je nach Kontext verschiedene Bedeutungen haben können. Die folgenden Ausführungen orientieren sich hauptsächlich an den Erläuterungen von Reich und Roth (2002).

In der internationalen Forschung wird zwischen einsprachigen und zweisprachigen Bildungsmodellen unterschieden, wobei zu den einsprachigen Modellen die Submersion und die Immersion zählen (Reich & Roth, 2002, S.17). Das Submersionsmodell kann man bezogen auf Deutschland mit der Integration von Kindern mit Migrationshintergrund in Regelschulklassen vergleichen. Diese Unterrichtsform ist in Deutschland bisher am häufigsten vertreten und oft findet dabei zusätzlich ein Förderunterricht in Deutsch als Zweitsprache oder zusätzlicher Unterricht in der Erstsprache der Kinder statt (vgl. ebd., S. 20). Im Unterschied dazu besagt das Prinzip der Immersion, dass Schüler, deren Muttersprachen nicht der Landessprache entsprechen, von oftmals selbst zweisprachigen Lehrern auf spezielle Art in der Landessprache unterrichtet werden (vgl. Reich & Roth, 2002, S. 17).

Das two-way-immersion-Modell ist ein in Deutschland jedoch noch eher selten auftauchendes zweisprachiges Modell, mit welchem man auf eine mehrsprachige Gesellschaft reagiert. Belke (2003, S. 23) bezeichnet Schulen mit solch einem Konzept als Schwerpunktschulen mit „zusammengesetzten Klassen“, wobei diese besonders leicht in Ballungsgebieten mit einer ausgeprägten Mehrsprachigkeit in der Bevölkerung realisierbar sind.

Das Ziel bei diesem Programm ist nach Kniffka und Siebert-Ott (2007, S. 175), dass die Kinder voneinander und miteinander lernen. Neben der Bilingualität soll zudem auf eine bikulturelle Erziehung geachtet werden.

Fraglich ist jedoch, in welcher Weise die Kinder alphabetisiert werden. Die Alphabetisierung könnte in beiden Sprachen gleichzeitig oder zeitlich versetzt getrennt nach Erst- und Zweitsprache erfolgen. Weiterhin muss bedacht werden, dass die Unterrichtssprache jeweils für einen Teil der Kinder der Erstsprache entspricht, wohingegen sie für den anderen Teil eine Zweit- oder Fremdsprache ist (vgl. Kniffka & Siebert-Ott, 2007, S. 175).

Damit die gewonnenen Sprachkenntnisse nach der Grundschulzeit noch weiter ausgebaut werden können und nicht verloren gehen, wäre es wichtig, dass eine weiterführende Schule in der Nähe der bilingualen Grundschule ebenfalls einen bilingualen Zweig in den entsprechenden Sprachen anbietet. Piske (2007, S. 30) fordert daher eine Zusammenarbeit der Grundschulen mit den weiterführenden Schulen, um ein Gesamtkonzept für den bilingualen Unterricht zu ermöglichen.

Weshalb speziell Italienisch an der untersuchten Schule unterrichtet wird, kann der Schuldirektor begründen. Laut seiner Aussage sei das Projekt des deutsch-italienischen Zweiges eine Reaktion auf eine vorhandene Mehrsprachigkeit. Dadurch könnten die italienischen Kinder ihre Mehrsprachigkeit koordiniert ausbauen und die deutschen Kinder erhalten eine Möglichkeit, bereits in jungen Jahren eine neue Sprache zu lernen.

Es muss hinzugefügt werden, dass sich die Schule in einem Stadtviertel befindet, in dem relativ viele italienische Familien wohnen und daher viele muttersprachlich italienische Kinder eingeschult werden können. Man hat demnach das Bildungsmodell der Schule den örtlichen Gegebenheiten angepasst. Solch eine Anpassung einer Schule an ihr Einzugsgebiet entspricht der Forderung von Glumpler (1996, S. 74), die in derartigen Konstellationen das Potential des natürlichen Spracherwerbs begünstigt sieht.

Vollmer (2008, S. 47) ist der Meinung, dass bilingualer Unterricht eine erfolgreiche Form des Zweitspracherwerbs sein kann. Bilingualer Unterricht bedeutet eine Alternative zum traditionellen Fremdsprachenunterricht, wodurch die muttersprachlich deutschen Kinder in der deutsch-italienischen Klasse profitieren können.

Empirisch abgesicherte Aussagen zur Effizienz bilingualer Unterrichtskonzepte sind in der Literatur eher selten zu finden. Außerdem betreffen diese zumeist nur den bilingualen Unterricht im Sekundarbereich. So berichten Reich und Roth im Jahr 2002 (S. 21), dass Untersuchungen zur Wirkung der Modelle noch nicht vorliegen, aber internationale Studien, oberflächig betrachtet, gezeigt hätten, dass zweisprachige Unterrichtsmodelle sich eher positiv auf den schulischen Erfolg mehrsprachiger Schüler auswirken.

Aus den internationalen Studien geht laut Piske (2007, S. 29) hervor, dass bilingual unterrichtete Schüler in der Entwicklung der Erstsprache keine längerfristigen Defizite aufzeigen und das Niveau der Fremdsprachenkenntnisse signifikant höher ist als bei Schülern, die Fremdsprachenunterricht auf herkömmliche Weise erhalten. Gage und Berliner (1996, S. 133) berichten von Studien aus den USA, welche zeigen konnten, dass zweisprachiger Unterricht positive Auswirkungen auf Testleistungen in unterschiedlichen Schulfächern hat. Die Zahl der Untersuchungen zur Effizienz des bilingualen Unterrichts an deutschen Schulen ist zwar noch gering, aber solche Modelle werden auch hier weitestgehend als effektiv angesehen (Piske, 2007, S. 29; Vollmer, 2008, S. 49).

Hinsichtlich der Frage, ob es für den italienischen Unterricht auch standardisierte Schulleistungstests gäbe und ob diese von den Lehrkräften grundsätzlich eingesetzt werden, bemerkt der Schuldirektor, dass ihm solche Tests nicht bekannt seien und es bedauerlicherweise insgesamt an Lehrmaterialien und Lehrbüchern für den zweisprachigen Unterricht mangele.

Zwar gibt es durchaus didaktische Hilfen und Materialien für die koordinierte Alphabetisierung in Italienisch und Deutsch (Belke, 2003, Kap. 5; Belke & Giambusso, 1999), aber davon abgesehen sind die Lehrkräfte weitestgehend darauf angewiesen, die Unterrichtsmaterialien selbst zu entwerfen (Piske, 2007, S. 29).

[...]


[1] Um der besseren Lesbarkeit willen wird in dieser Arbeit auf die Nennung beider Geschlechter verzichtet und entweder die männliche oder die weibliche Form verwendet.

Details

Seiten
142
Erscheinungsform
Originalausgabe
Jahr
2008
ISBN (eBook)
9783836628426
Dateigröße
1.1 MB
Sprache
Deutsch
Katalognummer
v226719
Institution / Hochschule
Universität zu Köln – Psychologie
Note
1,0
Schlagworte
schule leistungstest leseaufgabe leistungsbeurteilung knuspel-l diagnosekompetenz

Autor

Teilen

Zurück

Titel: Knuspels Leseaufgaben: Untersuchung zur Nützlichkeit eines Gruppenlesetests anhand der Lehrer einer bilingualen Schule