Lade Inhalt...

Korpusbasierte Untersuchungen des Englischen und ihre Relevanz für die Sprachlehre

©2004 Magisterarbeit 105 Seiten

Zusammenfassung

Inhaltsangabe:Zusammenfassung:
Korpusbasierte Studien des Englischen gewinnen seit Anfang der 90er Jahre in immer größerem Ausmaß einen Einfluss auf die Beschreibung der englischen Grammatik und des Lexikons.
Diese Magisterarbeit bietet einen Überblick über alle korpus-basierten Studien des Englischen zwischen 1990 und Dezember 2003, die eine Relevanz für die Sprachlehre postulieren. Nach Relevanzkriterien werden von ca. 130 gesichteten Studien 44 Studien ausgewählt. Die Ergebnisse der Studien werden auf drei Ebenen analysiert und bewertet. Die erste Ebene betrifft die Ebene der Sprachbeschreibung, d.h. welche grammatikalischen und lexikalischen Strukturen überhaupt in einen Lehrplan aufgenommen werden (was wird überhaupt gelehrt?). Die zweite Ebene betrifft die Ebene der Sprachdidaktik, d.h. welche grammatikalische Progression und welche lexikalischen Progression ist empfehlenswert (wie wird etwas gelehrt?). Die dritte Ebene befasst sich mit den Auswirkungen auf den Aufbau von Lehrwerken und Lehrgrammatiken (womit wird gelehrt?).


Inhaltsverzeichnis:Inhaltsverzeichnis:
0.Einführung5
1.Sprachtheoretische Annahmen der Studien8
1.1Wahrscheinlichkeit statt Regeln8
1.2Sprachdaten statt sprachliches Wissen9
2.Anlage und Systematik der vorliegenden Studie12
2.1Anlage der Untersuchung12
2.2Mein Datenmaterial13
2.2.1Das Kriterium der Korpusgröße13
2.2.2Das Kriterium der Aussage zur Untersuchungsfrage15
2.2.3Das Kriterium der Varietät16
2.2.4Das Kriterium des Publikationsorts und der Erreichbarkeit16
2.3Untersuchungssystematik16
2.3.1Das Axiom Genre18
2.3.2Das Axiom der Vergleichbarkeit verschiedener Korpora18
3.Gesamteinschätzung und Überblick über die Studien20
3.1Funktional angelegte Studien23
3.1.1Studien zu HÄUFIGKEIT23
3.1.2Studien zu QUANTIFIZIERUNG24
3.2Studien zu grammatikalischen Eigenschaften des Englischen26
3.2.1Studien zur Adverbsteigerung26
3.2.2Studien zu to/-ing Gliedsätzen27
3.2.3Studien zu Modalverben29
3.2.4Studien zur attributiven Nominalmodifikation33
3.2.5Studien zu if-Sätzen34
3.2.6Studien zu Pronomina40
3.2.7Studien zu Tempus + Modus44
3.3Studien zu lexikalischen Eigenschaften des Englischen51
3.3.1Studien zu Adverbien51
3.3.2Studien zu festen Wendungen54
3.3.3Studien zu lexikalischen Lernlisten60
3.3.4Studien zu Präpositionen64
3.3.5Studien zu Synonymen67
3.4Studien, die Potential bieten72
3.4.1Studien zum Lexikon72
3.4.2Studien zur Grammatik76
4.Ergebnisse80
4.1Relevanz auf der Ebene des […]

Leseprobe

Inhaltsverzeichnis


ID 8518
Widmann, Johannes: Korpusbasierte Untersuchungen des Englischen und ihre Relevanz
für die Sprachlehre
Hamburg: Diplomica GmbH, 2005
Zugl.: Eberhard-Karls-Universität Tübingen, Magisterarbeit, 2004
Dieses Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte,
insbesondere die der Übersetzung, des Nachdrucks, des Vortrags, der Entnahme von
Abbildungen und Tabellen, der Funksendung, der Mikroverfilmung oder der
Vervielfältigung auf anderen Wegen und der Speicherung in Datenverarbeitungsanlagen,
bleiben, auch bei nur auszugsweiser Verwertung, vorbehalten. Eine Vervielfältigung
dieses Werkes oder von Teilen dieses Werkes ist auch im Einzelfall nur in den Grenzen
der gesetzlichen Bestimmungen des Urheberrechtsgesetzes der Bundesrepublik
Deutschland in der jeweils geltenden Fassung zulässig. Sie ist grundsätzlich
vergütungspflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des
Urheberrechtes.
Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in
diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme,
dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei
zu betrachten wären und daher von jedermann benutzt werden dürften.
Die Informationen in diesem Werk wurden mit Sorgfalt erarbeitet. Dennoch können
Fehler nicht vollständig ausgeschlossen werden, und die Diplomarbeiten Agentur, die
Autoren oder Übersetzer übernehmen keine juristische Verantwortung oder irgendeine
Haftung für evtl. verbliebene fehlerhafte Angaben und deren Folgen.
Diplomica GmbH
http://www.diplom.de, Hamburg 2005
Printed in Germany

Autorenprofil
Meine persönlichen Daten
Name: Johannes
Widmann
Adresse:
Brunnenhalde 10, 72070 Tübingen
E-mail: hanneswidmann@aol.com
Telefon: 07073-916095
Nationalität: deutsch
Geburtsdatum:
15.10.1973 in Riedlingen
Qualifikationsprofil
·
Sprachwissenschaftler; Schwerpunkte: Sprachlehrtheorie, Natürliche Sprachverarbeitung
·
Politologe; Schwerpunkte: Systemtheorie, Internationale Beziehungen
·
Erfahrener Sprachlehrer für Französisch und Englisch
·
Projekterfahrung in der Entwicklung von Sprachlehrsoftware und von Korpora
·
Breites außeruniversitäres Engagement im Jugendverbandsbereich
·
Organisation der deutsch-französischen Fairhandels-Messe in Strasbourg
Meine wichtigsten Eigenschaften
Teamfähigkeit, Improvisationsfähigkeit, Vernetztes Denken, Innovationsfähigkeit
Studium und berufliche Bildung
2003­2005
Mitarbeit in Postdoc-Forschungsprojekt: Verantwortlich für die Korpus-
software und Mitarbeit bei der Transkription eines Sprachlehrvideokorpus
1997­2004
MA-Studium der Linguistik, der Romanistik und der Politologie
1997­2003
Teilzeitarbeit (50%) als Schreiner
1995­1997
Berufsausbildung zum Schreinergesellen
1993 Abitur
Kenntnisse und Fähigkeiten
·
Fremdsprachen: Englisch, Französisch (fließend in Wort und Schrift), Spanisch
(Grundkenntnisse)
·
Programmierkenntnisse HTML, Java, Perl
·
MS-Office (Word, Excel, Access, Outlook, Powerpoint, Frontpage)
·
Adobe Acrobat
·
Videobearbeitung (Premiere, After Effects, Encodersoftware AVI to RM, MPG 1/2)
·
Audiobearbeitung (Rippen, MP3 Codierung, Spurbearbeitung)
·
Sprachtranskriptions- und Annotationssoftware: TASX, Transana, Soundscriber
außeruniversitäre Fortbildungen
·
Ausbildung zum Jugendgruppenleiter (JULEICA)
·
Fortbildungen im Zeitmanagement
·
Sprachlehrer-Fortbildungen des Deutsch-Französischen Jugendwerks: Tandem-Methode
und Simulation Globale
·
Gruppendolmetscher Ausbildung

3
Inhaltsverzeichnis
0. Einführung ... 5
1. Sprachtheoretische Annahmen der Studien... 8
1.1 Wahrscheinlichkeit statt Regeln... 8
1.2 Sprachdaten statt sprachliches Wissen ... 9
2. Anlage und Systematik der vorliegenden Studie ... 12
2.1 Anlage der Untersuchung ... 12
2.2 Mein Datenmaterial... 13
2.2.1 Das Kriterium der Korpusgröße... 13
2.2.2 Das Kriterium der Aussage zur Untersuchungsfrage ... 15
2.2.3 Das Kriterium der Varietät... 16
2.2.4 Das Kriterium des Publikationsorts und der Erreichbarkeit ... 16
2.3 Untersuchungssystematik ... 16
2.3.1 Das Axiom Genre ... 18
2.3.2 Das Axiom der Vergleichbarkeit verschiedener Korpora... 18
3. Gesamteinschätzung und Überblick über die Studien... 20
3.1 Funktional angelegte Studien... 23
3.1.1 Studien zu HÄUFIGKEIT ... 23
3.1.2 Studien zu QUANTIFIZIERUNG... 24
3.2 Studien zu grammatikalischen Eigenschaften des Englischen ... 26
3.2.1 Studien zur Adverbsteigerung ... 26
3.2.2 Studien zu to/-ing Gliedsätzen ... 27
3.2.3 Studien zu Modalverben ... 29
3.2.4 Studien zur attributiven Nominalmodifikation ... 33
3.2.5 Studien zu if-Sätzen ... 34
3.2.6 Studien zu Pronomina... 40
3.2.7 Studien zu Tempus + Modus ... 44
3.3 Studien zu lexikalischen Eigenschaften des Englischen ... 51
3.3.1 Studien zu Adverbien ... 51
3.3.2 Studien zu festen Wendungen ... 54
3.3.3 Studien zu lexikalischen Lernlisten... 59
3.3.4 Studien zu Präpositionen... 63
3.3.5 Studien zu Synonymen ... 67
3.4 Studien, die Potential bieten ... 72
3.4.1 Studien zum Lexikon... 72
3.4.2 Studien zur Grammatik ... 75
4. Ergebnisse... 80
4.1 Relevanz auf der Ebene des Syllabus... 80
4.2 Relevanz auf der Ebene der Didaktik... 84
4.3 Relevanz auf der Ebene der Lehrwerke... 87
4.4 Zusammenfassung der relevanten Ergebnisse ... 89
5. Schluss ... 91
Bibliographie ... 93

4
Symbole und Abkürzungen:
ACE Australian Corpus of English
AE American English
AHI American Heritage Intermediate Corpus
BE British English
BNC British National Corpus
BoE Bank of English (COBUILD Corpus)
Brown erster elektronischer Korpus (Brown University)
CIC Cambridge International Corpus
COLT Corpus of London Teenage Language
EFL English as a Foreign Language
ESL English as a Second Language
ESP English for Specific Purposes
FLOB Freiburger LOB Kopie von 1992
FROWN Freiburger Brown Kopie von 1992
ICE International Corpus of English
KL Korpuslinguistik
LLC London-Lund Corpus
LOB Lancaster-Oslo-Bergen Corpus
RP Received Pronunciation
Vgl. vergleiche mit
vs. Gegensatzbeziehung
* Grammatikalisch nicht zulässige Konstruktion
,einfach' einfache Anführungszeichen: Fachtermini
,,doppelt" doppelte Anführungszeichen: Zitate; Originaltermini der Studie
kursiv Objektsprache; Beispiele im Text; ganze Beispielsätze
LEMMA lemmatisierte Form oder kognitives/semantisches Konzept

5
Some words are lonelier than others.
You shall know a word by the company it keeps!
(Firth (1957), A synopsis of linguistic theory)
0. Einführung
Firth als Pionier der sprachtheoretischen Schule des Kontextualismus spricht mit diesem be-
kannten Zitat eine Forderung aus, die auch der vorliegenden Arbeit als zentrale Annahme
zugrunde liegt. Das Zitat soll darauf hin deuten, dass der vollständige Sinn der Wörter in einer
Sprache erst durch die satzbauliche Umgebung und durch die Assoziationen des Lesers mit
dieser Umgebung ermittelt werden kann. So wie die Semiotik davon ausgeht, dass die Buch-
stabenfolge allein noch keinen Sinn ergibt, sondern erst das Erkennen und Verarbeiten dieser
Buchstabenfolge durch den Leser, so geht analog dazu die so genannte Korpuslinguistik (KL)
davon aus, dass die entscheidenden Informationen zur genauen Wortbedeutung nur im Zu-
sammenhang mit den umgebenden Wörtern ermittelt werden können.
Die KL bildet damit für die vorliegende Arbeit den theoretischen Rahmen. Sie lässt sich ein-
ordnen als eine Anwendung des Kontextualismus unter zu Hilfenahme von moderner PC-
Technologie. In den letzten 20 Jahren hat sich die KL stürmisch entwickelt und ihr Aufstieg
ist eng mit der rasanten Entwicklung der Computertechnologie verknüpft, die die systemati-
sche Untersuchung von großen Datenmengen erst ermöglicht hat. Ausgehend von einer klei-
nen Gruppe britischer und skandinavischer Pioniere, die anfangs eher belächelt wurden, hat
sich die korpuslinguistische Forschung ständig erweitert und verbreitert. Während ein Kollege
von Nelson Francis - dem Projektleiter des Brown Korpus - dessen Tätigkeit noch als ,,a com-
plete waste of time" bezeichnete, so hat sich die KL heute im Spektrum der Sprachwissen-
schaft fest etabliert. Sie steht auf gleicher Augenhöhe mit konkurrierenden theoretischen An-
sätzen, und manche Verfechter der KL billigen ihr gar den Status einer Revolution zu. Leech
argumentiert beispielsweise, dass die KL den Forschungsgegenstand ,Sprache' neu definiert
habe, da sie zum ersten Mal eine Technik entwickelt habe, um systematische Aussagen über
reale Sprachdaten zu machen und sich nicht mehr an einer idealisierten mentalen Kompetenz
orientiere:
[...] I wish to argue that computer corpus linguistics (henceforth CCL) defines not just a newly emerg-
ing methodology for studying language, but a new research enterprise, and in fact a new philosophical
approach to the subject. The computer, as a uniquely powerful technological tool, has made this new
kind of linguistics possible. [...] CCL inevitably focuses attention on the behavioural manifestation of
language, in the form of naturally-occuring spoken or written discourse. This is what a corpus provides.
(Leech 1992:106f.)

6
Mit dieser Position setzt sich Leech ab von der bekannten Position Chomskys, der realen
Sprachdaten keine Systematik zugesteht, weil er in ihnen kein kohärentes Objekt sieht.
1
. Des-
halb existiert reale Sprache für ihn nicht als wissenschaftlich erforschbarer Gegenstand. Die
KL hingegen geht davon aus, dass sich auf der Basis von sehr großen Datenmengen sehr wohl
ein kohärentes Objekt ergibt, mit dem Aussagen zum Sprachgebrauch einer einzelnen Sprache
gemacht werden können. Es hat sich gezeigt hat, dass mithilfe von Konkordanzen und statisti-
sche Verfahren sehr viele sprachliche Muster in den realen Daten entdeckt werden können,
die bisher nicht bekannt waren, weil sie nur durch den Vergleich von vielen Sätzen gesehen
werden können.
Während Korpora anfänglich nur von Sprachwissenschaftlern verwendet wurden, die ein Inte-
resse auf deskriptiver Ebene hatten und die über die Korpora zu einer besseren Beschreibung
von grammatikalischen und lexikalischen Phänomenen kommen wollten, so gibt es seit knapp
10 Jahren eine Debatte darüber, welche Konsequenzen die KL für die Fremdsprachenlehre
hat. Die Tatsache, dass die korpuslinguistische Forschung aber auf jeden Fall auch Auswir-
kungen auf die Sprachlehre hat, wird seither immer wieder betont (z.B. Sinclair 1991, Kenne-
dy 1992:364f., Aston 1995, Leech 1997:6ff., Conrad 2000, Biber 1994:179f.) argumentiert
sogar, dass diese Auswirkungen um so wichtiger werden, je stärker die Englischlehre sich
aufgliedert in die unterschiedlichen ESP-Bereiche, wie z.B. Geschäftskommunikation, da nur
durch ein genregegliedertes Korpus der richtige Ton und die idiomatische Verwendung der
Sprache im jeweiligen Bereich gefunden werden kann.
Die Debatte über die Verwendung der KL in der Sprachlehre hat sich in drei Stränge aufge-
gliedert. Der erste Bereich umfasst Untersuchungen zu der Frage, wie Lernerprobleme mittels
Korpora präziser erfasst und abgegrenzt werden können. Durch die Erstellung von Korpora
mit Lernerdaten können systematisch falsche Konstruktionen ermittelt werden, und der Lehrer
kann dementsprechend Material für diese problematischen Bereiche entwickeln. Zweitens
werden Parallelkorpora mit dem gleichen semantischen Inhalt in zwei verschiedenen Spra-
chen entwickelt, um insbesondere in der Übersetzer- und Dolmetscherausbildung auf die sys-
tematischen Unterschiede in der Verwendung von Vokabular und sprachlichen Strukturen für
die gleichen Inhalte aufmerksam zu machen. Diese Parallelkorpora ermöglichen ein systema-
tisches, vergleichendes Studium der beiden Sprachen, welches in dieser Qualität ohne die
Hilfe der KL und der modernen Technik gar nicht möglich ist. Der dritte und älteste Bereich
1
Diese realen Sprachdaten einer Sprechergemeinschaft werden ab Chomsky (1988:19ff.) als ,,e-language" (ex-
ternal language) terminiert, die sich laut Chomsky je nach Sprecher unsystematisch verändern.

7
der KL sind die Korpora mit muttersprachlichen Daten. Diese Korpora werden zur Beschrei-
bung sprachlicher Phänomene sowohl auf lexikalischer als auch auf grammatikalischer Ebene
verwendet, um daraus korpusbasierte Wörterbücher oder deskriptive Grammatiken des Engli-
schen zu machen.
An diesem dritten Bereich setzt die vorliegende Arbeit an. Ich möchte überprüfen, ob diese
Untersuchungen auf der Basis von muttersprachlichen Korpora eine Relevanz für die EFL-
Lehre haben und wenn ja, welche Konsequenzen dies für die EFL-Lehre haben sollte. Dazu
werde ich im nächsten Kapitel zunächst kurz darstellen, von welchen sprachtheoretischen
Grundlagen sich die KL leiten lässt, um das für alle Studien zentrale Konzept der ,Probabili-
tät' herauszuarbeiten und um das Verständnis von ,realen Sprachdaten' zu verdeutlichen. Im
zweiten Kapitel werde ich zuerst die Auswahlkriterien für die untersuchten Studien darlegen
und dann die Systematik vorstellen, nach der ich die Studien untersucht habe. Dabei werde
ich das Vorgehen für das dritte Kapitel darstellen. Im dritten Kapitel werde ich eine deskripti-
ve Darstellung der untersuchten Studien machen, die auf der Systematik des zweiten Kapitel
aufbaut. Im vierten Kapitel werde ich versuchen, die aus der Darstellung gewonnen Ergebnis-
se hinsichtlich ihrer Relevanz für die Sprachlehre zusammenzufassen. Dabei werde ich sie in
den Zusammenhang mit aktuellen Streitfragen der KL stellen, soweit diese sich auf die Ver-
wendung korpuslinguistischer Methoden in der Sprachlehre beziehen.
Eine Anmerkung zur Form: Ich bemühe mich, geschlechtsneutral zu formulieren. Falls dies
im Deutschen zu einer schwerfälligen Konstruktion führt, so verwende ich die männliche
Form, die aber selbstverständlich immer die weibliche Form mit einschließt. Der Streitfrage,
ob ich damit indirekt ,,language" als ,,loaded weapon" benutze, bin ich mir bewusst, habe da-
rauf aber auch keine endgültige oder gar zufriedenstellende Antwort.

8
1. Sprachtheoretische Annahmen der Studien
In diesem Kapitel werde ich kurz zwei sprachtheoretische Grundannahmen vorstellen, auf
denen die in Kapitel 3 untersuchten Studien basieren. Dies ist notwendig, da den Studien ein
Verständnis von Sprache zu Grunde liegt, das von den Theorien abweicht, die in den letzten
40 Jahren in der Linguistik vorgeherrscht haben.
1.1 Wahrscheinlichkeit statt Regeln
Die KL operiert durchgängig mit dem Begriff der Wahrscheinlichkeit. Damit setzt sie sich
von denjenigen Sprachtheorien ab, die versuchen, Regelsysteme in der Sprache zu entdecken
und zu beschreiben. Die vom Saussureschen Paradigma ausgehenden strukturalistischen The-
orien und die von Chomskys Paradigma ausgehenden generativen Theorien trennt zwar vie-
les, aber es eint sie die Suche nach dem System bzw. den Regeln einer Sprache, das bzw. die
sie entdecken und beschreiben möchten. Beide Theorierichtungen haben die Vorstellung, dass
sie ihrer Sprachbeschreibung einen absoluten, allumfassenden Charakter geben können, und
dass das System und die Regeln erst dann ausreichend erforscht sind, wenn man bei der Dar-
stellung des Systems bzw. der Regeln keine Ausnahmen mehr machen muss.
Die KL hingegen geht davon aus, dass Regeln immer auf der Basis von realen Daten formu-
liert werden müssen und mit allen untersuchten Daten in ein Verhältnis gesetzt werden müs-
sen. Dabei ergibt sich zwangsläufig eine Sprachtheorie, die nicht nach streng deduktiven
Prinzipien aufgebaut ist und die nicht zeigen will, was theoretisch in einer Sprache möglich
ist, sondern eine Sprachtheorie die induktiv zu ihren Aussagen kommt. Sie bildet ab, was tat-
sächlich vorhanden ist und wie die Sprache tatsächlich gebraucht wird. Diese Aussagen über
reale Daten werden in der KL mit statistischen Verfahren verallgemeinert, um draus zu
schließen, welche Wortkonstruktionen typischerweise verwendet werden oder welche gram-
matikalische Struktur typischerweise verwendet wird. Dies wird nie zu einer kategorischen
regelgeleiteten Aussage führen, sondern immer zu einer probabilistischen Aussage.
Die alte Kritik, dass es logisch sei, dass in einem Korpus ,,I live in New York" immer mit
einer höheren Wahrscheinlichkeit vorkommt als ,,I live in Dayton, Ohio", da es mehr Men-
schen in New York als in Dayton gibt, gilt für die modernen Korpora nicht mehr. Durch die
entsprechenden statistischen Verfahrensweisen und durch eine ausgeglichene Auswahl des
Korpusmaterials konnte dieser Einwand berücksichtigt werden. Eine sorgfältige Auswahl bei
der Korpuszusammensetzung unter Berücksichtigung zahlreicher soziolinguistischer Variab-
len sorgt dafür, dass statistisch gesehen keine Verzerrung der Sprachwirklichkeit stattfindet.
Dennoch ist die Sprachbeschreibung auf der Basis von Korpora immer noch eine sehr umstrit-

9
tene Vorgehensweise, wie in der Einleitung schon angesprochen. Es hat sich nämlich gezeigt,
dass bei bestimmten grammatikalischen Konstruktionen oder bei selteneren lexikalischen
Einheiten die Größe der ersten Korpora mit 1 Mio. Wörtern nicht ausreicht, um zu ausrei-
chend probabilistisch fundierten Aussagen zu gelangen. Für die meisten lexikalischen Phä-
nomene der englischen Sprache müssen wesentlich größere Korpora untersucht werden. Zur
Bedeutung der Korpusgröße hinsichtlich meiner Studien werde ich bei der Diskussion der
Auswahlkriterien in Abschnitt 2.2.1 noch mal genauer Stellung nehmen.
1.2 Sprachdaten statt sprachliches Wissen
Diese zweite Grundannahme ist wichtig, weil sich die KL mit ihr absetzt von Forderungen wie
der von Chomsky, dass Einzelsprachen von einem ,,initial state" ausgehend erklärt werden
müssen:
How can we show that all languages are variations on a single theme, while at the same time recording
faithfully their intricate properties of sound and meaning, superficially diverse? A genuine theory of
human language has to satisfy two conditions: 'descriptive adequacy' and 'explanatory adequacy.' The
grammar of a particular language satisfies the condition of descriptive adequacy insofar as it gives full
and accurate account of the properties of the language, of what the speaker of the language knows. To
satisfy the condition of explanatory adequacy, a theory of language must show how each particular lan-
guage can be derived from a uniform initial state under the 'boundary conditions' set by experience. In
this way, it provides an explanation of the properties of languages at a deeper level.
(Chomsky 2000:7)
Diese Forderung, dass eine Sprachtheorie das erklären muß, was theoretisch ,,at a deeper le-
vel" möglich ist, erfüllt keine der in dieser Arbeit vorgestellten Studien, da sie sich - wie oben
dargelegt ­ alle mit der Verwendung von realer Sprache auseinandersetzen. Stattdessen
zeichnen sich die sprachtheoretischen Grundlagen der vorgestellten Studien wie Leech
(1991:107f.) darlegt durch die folgenden vier Punkte aus:
1. Focus on linguistic performance, rather than competence
2. Focus on linguistic description rather than linguistic universals
3. Focus on quantitative, as well as qualitative models of language
4. Focus on a more empiricist, rather than rationalist view of scientific inquiry
Die KL arbeitet also dezidiert an einer Linguistik der ,parole' bzw. der Performanz und nicht
im Bereich einer vermeintlichen Kompetenz. Mit ihrer Fokussierung auf den Sprachgebrauch
liegt die KL auf einer Linie mit Hymes (1972:284ff.), der auch dafür argumentiert, nicht nur
das zu untersuchen, was theoretisch möglich ist, sondern vor allem das, was in einer Spre-
chergemeinschaft auch tatsächlich vorkommt. Allerdings berücksichtigt die KL anders als
Hymes momentan noch wenig soziolinguistische und diskursanalytische Parameter, da sie
sich aufgrund ihrer verwendeten Technik sehr am orthographischen Symbol orientiert und
keine Möglichkeit hat, Parameter zu berücksichtigen, die sich nicht durch die direkte Textana-
lyse erschließen lassen. Sie kommt stattdessen über einen systematischen Vergleich der struk-

10
turellen und lexikalischen Muster im Text zu ihren Aussagen und macht dies mit Hilfe der
Technik auf einer Ebene, die mittels des menschlichen Denkvermögens alleine nicht erreich-
bar wäre.
Aufgrund der Annahme, dass reale Sprache als ein Objekt faßbar ist, welches ohne Rückgriff
auf die mentale Kompetenz der Sprecher systematisch untersucht werden kann, und insbeson-
dere aufgrund der Akzeptanz von gesprochener Sprache als Untersuchungsobjekt, setzt sich
die KL deutlich von introspektiven Theorieansätzen ab. Es gibt jedoch innerhalb der KL zwei
unterschiedliche Ansichten darüber, wie die realen Sprachdaten zur Theoriebildung zu ver-
wenden und zu interpretieren sind. Die induktive Theoriebildung, die auch als ,,bottom-up"
oder ,,data-driven" bezeichnet wird (Vgl. Field 1999:338), ist zwar die Grundlage für beide
Ansätze, aber bei der Frage, wie stark der Forschende sein bisheriges Wissen und seine eige-
nen Theorien einbringen darf, unterscheiden sich die beiden Ansätze fundamental.
Der erste der beiden Ansätze, der sogenannte ,,corpus-based approach", hält es für legitim, die
Daten mit metasprachlichen Daten ­ den sogenannten ,,tags" ­ zu annotieren
2
. Damit wird das
Wissen einer schon existierenden Grammatiktheorie in die Analyse mit eingebracht und kann
im besten Fall zu einem verbesserten Verständnis von Problemen führen, die in der Gramma-
tiktheorie noch unzureichend gelöst sind. Der Vorteil dieses Ansatzes ist die Möglichkeit,
bestehende Theorien der Grammatikbeschreibung mit den neuen Möglichkeiten der KL aus-
zubauen und zu verbessern.
Der zweite der beiden Ansätze, der sogenannte ,,corpus-driven approach", lehnt jede Manipu-
lation oder Ergänzung der Daten grundsätzlich ab. Vertreter dieses Ansatzes argumentieren,
dass durch die Anwendung von etablierten Grammatikmodellen auf das Korpus dieses letzt-
lich nur dazu verwendet bzw. missbraucht wird, um die bestehenden Theorien zu bestätigen.
Die Untersuchungsfrage wird der Theorie angepasst und dementsprechend werden die not-
wendigen Daten aus dem Korpus extrahiert. Außerdem lehnen sie die automatisierte tag-
Zuweisung ab, da sie wie Tognini-Bonelli davon ausgehen, dass dadurch Information verloren
gehen kann:
The actual loss of information takes place when, once the annotation of the corpus is completed and the
tagsets are attached to the data, the linguist processes the tags rather than the raw data. By doing this the
linguist will easily lose sight of the contextual features associated with a certain item and will accept
single, uni-fucntional items ­ tags ­ as the primary data. What is lost, therefore, is the ability to analyse
the inherent variability of language which is realised in the very tight interconnection between lexical
2
Unter einer Annotation versteht man die Markierung aller Elemente nach lexiko-syntaktischen Kategorien (z.B.
Wortklasse oder Satzfunktion). Bei den neueren Korpora werden auch Versuche gemacht, Annotationen mit
einzubauen, die prosodische Merkmale oder die Funktion im Diskurs (z.B. Anapher/Katapher) angeben. Annota-
tionen eröffnen erst die Möglichkeit, die mathematisch-probabilistische Analyse mit einer linguistisch-
inhaltlichen Analyse zu verbinden.

11
and grammatical patterns, [...] but it is argued here that the interconnection between lexis and grammar
is crucial in determining the meaning and function of a given unit: any processing that loses out on this
is bound to lose accuracy. Tognini-Bonelli (2001:73f.)
Das Potential des zweiten Ansatzes liegt darin, dass möglicherweise völlig neue Theorien
aufgestellt werden, die zu einem anderen Verständnis von Grammatik führen könnten und die
bisherigen Theorien ersetzen könnten. Grammatikalische Strukturen werden über Muster im
Text gefunden und systematisiert. Das Schlüsselwort der Vertreter des ,,corpus driven" An-
satzes ist deshalb auch ,,Pattern Grammar" (Vgl. Hunston/Francis 2000). Dieser Ansatz sieht
die KL nicht nur als eine neue Methodologie bzw. Technik, sondern als ein neues Paradigma
der Sprachwissenschaft, das den Status einer eigenständigen Disziplin beansprucht.
3
Die bei-
de Ansätze können unterschiedliche Auswirkungen auf die Frage haben, inwiefern die Ergeb-
nisse der Studien für die Sprachlehre eingesetzt werden sollen und welche Konsequenzen die
Ergebnisse für den Umgang mit Korpusdaten in der Sprachlehre haben. Ich werde zu dieser
Frage bei meiner Schlussbetrachtung noch mal Stellung beziehen und die zwei Positionen
erläutern.
3
Für einen ausführlichen aktuellen Überblick der Diskussion aus einer ,,corpus-driven" Sicht vgl. Tognini-
Bonelli (2001:65-100) und Hunston (2002), für den Blickwinkel der ,,corpus-based" Sicht vgl. Schönefeld
(1999) und Aarts, J. (2002).

12
2. Anlage und Systematik der vorliegenden Studie
In diesem Kapitel werde ich zunächst darstellen, nach welchen Fragen ich meine Untersu-
chung angelegt habe. Dann werde ich in Abschnitt 2.2 erläutern, nach welcher Systematik ich
meine Studien ausgewählt habe und welche Kriterien zu einem Ausschluss geführt haben.
Zuletzt werde ich in Abschnitt 2.3 darlegen, nach welcher Systematik ich die relevanten Stu-
dien untersuchen und einordnen werde.
2.1 Anlage der Untersuchung
Ausgehend von der in Kapitel 1 angesprochenen Prämisse, dass Korpora eine Auswirkung auf
die Sprachlehre haben, soll es Ziel dieser Arbeit sein, die Frage zu beantworten, welche der
korpusbasierten Studien zur englischen Sprache eine pädagogische oder didaktische Bedeu-
tung haben. Dies bedeutet noch wesentlich mehr als den Einsatz von Korpora zum Erstellen
von Konkordanzen, anhand derer die Lerner zahlreiche Wortmuster und Kollokationen erken-
nen können.
4
Wie Conrad (1999 und 2000) in ihren Grundsatzartikeln darstellt, muss es bei
der Anwendung eines korpuslinguistischen Ansatzes auf die Lehre auch um die Frage gehen,
wie eine ,,integrierte Sprachbeschreibung" auf der Grundlage von Korpusdaten erreicht wer-
den kann. Unter ,,integriert" versteht sie eine Sprachbeschreibung, die Lexik und Grammatik
nicht als zwei getrennte Bereiche im Unterricht sieht. Lerner sollen die enge Verzahnung die-
ser zwei Bereiche erkennen und es soll ihnen anhand der lexikalischen Muster gezeigt wer-
den, dass es sinnvoll ist, die beiden Bereiche als zwei Seiten der gleichen Münze zu sehen.
Außerdem sollen Lerner ein Bewusstsein entwickeln für den idiomatischen Gebrauch von
Konstruktionen. Dieser Gebrauch hängt aus Sicht vieler Studien der KL sowohl vom Medium
als auch vom Genre ab.
Diese Arbeit untersucht unter Berücksichtigung dieser theoretischen Konzepte die Fragestel-
lung der Bedeutung der KL für die Sprachlehre, d.h. inwiefern sie dazu beitragen kann, Ler-
nern zu einem möglichst idiomatischen Sprachgebrauch zu verhelfen.. Dazu werde ich diese
Fragestellung in drei folgenden Ebenen untergliedern, die alle aus sprachwissenschaftlicher
Sicht betrachtet werden.
1. die Ebene der Sprachbeschreibung, d.h. was überhaupt gelehrt wird.
2. die Ebene der Sprachdidaktik, d.h. wie es gelehrt wird.
3. die Ebene der Referenz- und der Lehrwerke, d.h. womit gelehrt wird.
4
Firth (1957) bezeichnet lediglich lexikalische Muster als Kollokation. Grammatikalische Muster hingegen
werden als Kolligationen bezeichnet.

13
Die erste Ebene umfasst aus sprachwissenschaftlicher Sicht die Fragen der Wortschatzaus-
wahl und der Auswahl der zu lehrenden grammatikalischen Konstruktionen. Die zweite Ebe-
ne umfasst die Fragen der Progression sowie die Frage, welche Punkte im Syllabus betont
werden sollen. Die dritte Ebene umfasst Fragen zum Aufbau der Lehrwerke und zum Inhalt
der pädagogischen Grammatiken des Englischen. Die drei Ebenen hängen natürlich eng zu-
sammen und lassen sich nicht immer strikt trennen, weshalb es in Kapitel 4 bei der Diskussi-
on der Auswirkungen auf die drei Ebenen auch immer wieder Querverweise geben wird.
2.2 Mein Datenmaterial
Als Datengrundlage und Gegenstand der Untersuchung wurden sämtliche korpusbasierten
Studien der englischen Sprache bis einschließlich Dezember 2003 gesichtet. Dies ergab eine
Gesamtzahl von 124 Studien. Einzelne Buchpublikationen wurden nur berücksichtigt, wenn
nicht schon vorher ein Artikel mit den Ergebnissen publiziert worden war, was bei den meis-
ten Buchstudien der Fall war. Die Auswahl aus diesen 124 Studien, die für die Fragen aus
Abschnitt 2.1 relevant sind, erfolgte nach den folgenden vier Kriterien, die ich in den Ab-
schnitten 2.2.1 bis 2.2.4 erläutern werde. Die nicht berücksichtigten Studien sind in Appendix
B aufgelistet, kategorisiert nach dem Grund der Nichtberücksichtigung.
1. Korpusgröße
2. Aussagen zu meiner Untersuchungsfrage
3. Varietät des Englischen
4. Publikationsort und Erreichbarkeit
Auswahlkriterien für die Studien
2.2.1 Das Kriterium der Korpusgröße
Dieses Kriterium ist zweigeteilt, da die Berücksichtigung davon abhängt, ob die Studie lexi-
kalische oder grammatikalische Phänomene untersucht. Zunächst müssen die Studien mindes-
tens auf einem der großen, elektronischen Korpora der ersten Generation basieren, um über-
haupt von mir gesichtet zu werden. Hierbei halte ich mich an die inzwischen klassische Ein-
teilung von Kennedy (1998). Er klassifiziert folgende Korpora als große Korpora der ersten
Generation: Brown, LOB, LLC, AHI, ACE, Kolhapur und Wellington. Als Mega-Korpora der
zweiten Generation klassifiziert er alle - meist in Kollaboration mit Verlagen entstandenen -
Korpora ab Anfang der 90er Jahre des letzten Jahrhunderts
5
. Darunter fallen z.Z. BoE, CIC,
BNC und ICE.
5
für einen Überblick über die Entwicklung der Korpora: siehe Appendix A

14
Studien, die sich eindeutig auf lexikalische Einheiten der Sprache beziehen, müssen Korpora
der zweiten Generation als Datengrundlage verwenden, um in Kapitel 3 berücksichtigt zu
werden. Leech (1991:9ff.) argumentiert zwar, dass 1 Million sehr wohl ausreiche, unter der
Voraussetzung, dass die Untersuchung an einem ,,repräsentativen Korpus" durchgeführt wer-
de. Damit bezeichnet er Korpora, deren Daten sorgfältig nach soziologischen (Alter, Ge-
schlecht, Herkunft) und sprachlichen (Genre, Stil, Medium, etc.) Kriterien ausbalanciert wur-
den. Außerdem ist seiner Ansicht nach für eine qualitative Auswertung, d.h. eine Auswertung,
die nicht nur auf mathematisch-probabilistischen Kriterien, sondern auch auf linguistischen
(z.B. syntaktischen) Kriterien beruht, eine sorgfältige Annotation wesentlich wichtiger als die
reine Größe. Doch vergleichende Studien zeigen, dass die Annotation und die Ausbalanciert-
heit die Größe nicht ersetzen können, obwohl diese beiden Kriterien genauso wichtig sind wie
die Größe für eine sichere Beschreibung der untersuchten Phänomene.
6
Lexikalische Studien mit einer annotierten Version eines der alten Korpora, bei denen die
mathematisch-probabilistische Analyse mit einer qualitativ-linguistischen Analyse verbunden
wurde, geben zwar bereits wichtige Hinweise, in welche Richtung die Beschreibung gehen
müsste, doch diese Korpora erreichen noch nicht den Schwellenwert, ab dem sich statistisch
gesehen nichts mehr verändert. Diese Studien müssen also normalerweise noch durch eine
Überprüfung anhand eines der Megakorpora der zweiten Generation verfeinert werden bzw.
validiert werden bezüglich der mathematisch-probabilistischen Analyse. Aus diesem Grund
werden lexikalische Studien, die auf einem der ersten Korpora basieren, nicht in die Systema-
tisierung mit aufgenommen.
Untersuchungen der meisten strukturellen und grammatikalischen Eigenschaften waren hin-
gegen auch mit Korpora der ersten Generation bereits möglich, da für grammatikalische Ei-
genschaften der kritische Schwellenwert in der Regel erreicht wird. Die Ergebnisse werden
durch Überprüfungen mit neueren Korpora meistens bestätigt (Vgl. Carter/McCarthy
1995:143). Aus diesem Grund werden grammatikalische Studien mit Korpora der ersten Ge-
neration in dieser Arbeit berücksichtigt, sofern sie mehr als nur quantitative Aussagen zu be-
reits bekannten grammatikalischen Kategorien machen.
Durch das Kriterium der Korpusgröße lässt sich für die Studienrecherche ein ziemlich genau-
er Schnitt Ende der 80er Jahre machen, als mit der technischen Entwicklung die Korpora der
ersten Generation für den PC und damit für die breite sprachwissenschaftliche Forscherge-
6
Vgl. dazu die ausführliche Argumentation bei Leech (1991) und Leech (1997) für Argumente, warum die An-
notation entscheidend ist. Biber (1990) und Biber(1993) zeigen aber, dass nur Ergebnisse aus großen Korpora
generalisiert werden dürfen, die gleichzeitig auch repräsentativ sind, wohingegen Sinclair (1991a:18ff. und
1997:28f.) argumentiert, dass die Größe wichtiger als die Repräsentativität ist.

15
meinde zugänglich wurden. Zu diesem Zeitpunkt entstanden auch die und die ersten Studien,
die überhaupt über rein quantitative Forschung hinausgingen. Alle früheren Studien basieren
entweder auf aus heutiger Sicht unzureichend kleinen Korpora oder auf dem Survey of
English Usage (SEU), das ursprünglich nicht maschinenlesbar war und das lediglich als
Grundlage für einen der ersten Korpora der gesprochenen Sprache diente (das LLC).
2.2.2 Das Kriterium der Aussage zur Untersuchungsfrage
Wichtig bei der Auswahl der Studien war zunächst, dass die Studien ihr Datenmaterial quali-
tativ bewerten und nicht nur Statistiken präsentieren, die bei den Kritikern der Korpuslinguis-
tik die berühmte ,,so what?-Reaktion" provozieren. Damit beziehen sie sich auf diejenigen
Studien, die ausschließlich die statistische Häufigkeit bestimmter lexikalischer oder gramma-
tikalischer Erscheinungen auflisten und beim Leser zurecht die Frage aufkommen lassen, was
denn der Sinn und Zweck der Studie ist, wenn keine weitergehenden sprachwissenschaftli-
chen Fragen gestellt werden. Aarts stellte dazu in jüngster Zeit noch mal fest:
[...] frequencies can give us clues in establishing connections between linguistic features, for example
between clause type and transitivity. But again, in all these cases (d.i. den statistischen Studien) it is far
more interesting to go beyond the bare statistics, and ask why a particular pattern is frequent or infre-
quent. (Aarts 2000:8); Betonung im Original)
Kennedy (1998:88-203) gibt einen ausführlichen Überblick über sehr viele dieser (frühen)
Studien, die sich mit einer solchen statistischen Auswertung der Daten begnügten ohne inte-
ressante Hinweise oder Ideen zu liefern, was mit den Statistiken geschehen könnte. Wenn sich
diese deskriptiven Studien nur auf statistische Aussagen zu ihren untersuchten Phänomenen
beschränkten ohne weitergehende Hypothesen aufzustellen, welche Konsequenzen die Vertei-
lung hat, so wurden sie nicht berücksichtigt. Durch dieses Kriterium der weitergehenden Fra-
gestellung mit Bezug auf die Sprachlehre konnte der Kreis der relevanten Studien sehr stark
eingeschränkt werden.
Die weitergehende Fragestellung mussten die Autoren der Studien in ihrer Einleitung oder in
der Bewertung ihrer Ergebnisse (,,conclusion") entweder von sich selbst aufstellen oder die
Ergebnisse konnten zumindest vom Autor der vorliegenden Arbeit auf wenigstens eine der
drei Ebenen aus Abschnitt 2.1. unproblematisch umgesetzt werden. Dieses Kriterium gilt be-
sonders für Studien, die quantitativ uneindeutige Aussagen zur ersten der drei Ebenen (die
Sprachbeschreibung) machen. Wenn diese keinen überzeugenden Vorschlag machten, wie
ihre Ergebnisse didaktisch oder im Lehrsyllabus umgesetzt werden sollten, dann wurden sie
nicht berücksichtigt.

16
2.2.3 Das Kriterium der Varietät
Die Studie musste sich mit einer Variante des Englischen beschäftigen, die nach der Definiti-
on von Kachru (1985) zum ,,inner circle" gehört (z.B. British English oder American Eng-
lish), also nicht mit einer stark regional gefärbten Variante oder einer Mischvariante (meist
ESL, z.B. Kenyan English), die nicht im Schullehrplan akzeptiert wird. Davon unberührt soll
die Diskussion sein, ob es überhaupt noch so etwas wie ein Englisch gibt oder ob es nicht an
der Zeit ist, die Sprachlehre nach Varietäten zu differenzieren und jeweils nur noch eine Vari-
ante zu lehren, wie dies beispielsweise Matsuda (2003) fordert.
7
Außerdem musste die Studie
sich entweder konkret auf Deutsch als Ausgangssprache beziehen oder die Ausgangssprache
war im Bezug auf die Studie irrelevant, da sie dazu keine Aussage machte. Wenn die Studie
sich konkret auf einen Sprachvergleich mit einer anderen Muttersprache als Deutsch bezog,
dann wurde sie nicht berücksichtigt.
2.2.4 Das Kriterium des Publikationsorts und der Erreichbarkeit
Die relevanten Studien mussten auf Englisch, Französisch oder Deutsch abgefasst sein und in
einer Zeitschrift publiziert sein, die für mich technisch erreichbar war.
8
Dazu zählen zunächst
die drei klassischen Zeitschriften, die sich mit der Korpuslinguistik seit ihren Anfängen befas-
sen: ICAME Journal, International Journal of Corpus Linguistics und Literary & Linguistic
Computing. Diese drei Zeitschriften habe ich manuell komplett ausgewertet. Die folgenden
Zeitschriften habe ich manuell ab Jahrgang 1995 durchsucht: Applied Linguistics, AAA,
CALL, CALICO Journal, Computational Linguistics, ELT Journal, IRAL, Journal of English
Linguistics, Language Learning, Language Learning&Technology, Language Learning Jour-
nal, Modern English Teacher (nur bis 1997), Moderne Sprachen, Neusprachliche Mitteilun-
gen aus Wissenschaft und Praxis, ReCALL, System, TELL und CALL, TESOL Quarterly und
ZAA. Außerdem wurde über die MLA-Datenbank zur Überprüfung der Vollständigkeit eine
Recherche ab 1985 gemacht. Eine frühere Suche ist nicht sinnvoll aufgrund der Tatsachen, die
ich in Abschnitt 2.2.1 ausgeführt habe.
2.3 Untersuchungssystematik
Die einzelnen Studien werden im nächsten Kapitel in den Abschnitten 3.1 bis 3.4 nach der
hier dargestellten Systematik vorgestellt. Als Ordnungskriterium habe ich mich primär für die
klassischen, strukturell-formalen Kategorien entschieden, da sie einerseits immer noch (vor
7
Vgl dazu Crystal (1999:17), der für die Unterscheidung zwischen ,,production skills" bezüglich der ,,inner
circle" Varietäten und ,,reception skills" bezüglich der anderen Varietäten in der Lehre argumentiert.
8
D.h. über Fernleihe oder käuflich über den subito-Verbund. Dadurch fallen ein paar Studien heraus, die in nicht
erreichbaren Zeitschriften veröffentlicht wurden oder die nur universitätsintern publiziert wurden (graue Litera-
tur). Die (z.T. transliterierten) Titel dieser Studien sind in Appendix C angegeben.

17
allem in der Schule) sehr gängig sind und andererseits von vielen Studien als Ausgangspunkt
verwendet wurden. Eine geringe Zahl von Studien hat als Ausgangspunkt aber eine funktiona-
le Kategorie, wie z.B. ,Quantifikationsmöglichkeiten'. Diese Studien werde ich als Erstes in
Abschnitt 3.1 unter ihrem funktionalen Ordnungskriterium darstellen. Dann werde ich in den
Abschnitten 3.2 bis 3.4 die große Mehrzahl der Studien nach strukturell-formalen Kategorien
als primärem Ordnungskriterium auflisten und einen kurzen Überblick über die Studien ge-
ben. Für diese Darstellung werde ich für jede Studie zuerst ihre Anlage und den untersuchten
Gegenstand umreißen und dann die Ergebnisse der jeweiligen Studie darstellen. Zuletzt werde
ich die Ergebnisse der Einzelstudien für jede Kategorie in einer Gesamtschau vergleichen und
bewerten. Eine komplette Liste der berücksichtigten Studien befindet sich als separater Teil in
der Bibliographie.
Die Darstellung der untersuchten sprachlichen Eigenschaften ist in den Studien natürlich sehr
unterschiedlich. Dies hängt mit den sprachtheoretischen Grundannahmen der Autoren, den
verwendeten Grammatik- oder Lexikontheorien oder einfach auch mit dem verwendeten Kor-
pus zusammen. Ich werde versuchen, die Annahmen der Autoren möglichst neutral und fair
zu behandeln. Bei der Bewertung in der Gesamtschau werde ich die Ausgangspositionen der
Autoren ebenfalls berücksichtigen, wenn ich versuche zu ermitteln, ob und welche Schlüsse
sich aus den Studien ziehen lassen für eine der drei Ebenen aus Abschnitt 2.1. Falls meiner
Meinung nach die verwendeten Korpora einen Einfluss auf die Ergebnisse haben, so werde
ich dies ebenfalls erörtern. Einen möglichen Einfluss des verwendeten Korpus auf das Ergeb-
nis werde ich in Abschnitt 2.3.2 noch mal genauer diskutieren.
Im Anschluss an die Studien, die ich klar kategorisieren konnte, werde ich diejenigen Studien
darstellen, die im Prinzip den Kriterien aus 2.2.1 bis 2.2.4 entsprechen, die aber entweder zu
diffusen Ergebnissen kommen oder die ihre Ergebnisse an einer sprachwissenschaftlichen
Theorie aufhängen, die bei Lernern nicht als bekannt vorausgesetzt werden kann und zu zu-
sätzlichen Problemen führen würde. Somit ergibt sich für beide Arten von Studien keine di-
rekte Umsetzbarkeit für die Sprachlehre, aber sie zeigen eventuell die Richtung auf, die mit
lohnenden Ergebnissen weiter verfolgt werden könnte.
Bei der Anordnung der Studien werde ich zwei Axiomen folgen, die ich in den nächsten bei-
den Abschnitten kurz diskutieren werde. Diese Axiome bilden die Grundlage für die Darstel-
lung der Studien, und sie werden bei der Diskussion immer wieder eine Rolle spielen, aber ich
werde sie in dieser Arbeit nicht explizit begründen.

18
2.3.1 Das Axiom Genre
Nach der Hypothese von Biber (1993) ist es unmöglich, Grammatik ohne Rücksichtsnahme
auf das jeweilige Genre und Medium (schriftlich/mündlich) darzustellen, wenn man sich in
dem Genre idiomatisch ausdrücken will
9
. Es gibt also nicht so etwas wie das typische Genre
für ,,General English" und außerdem gibt es deutliche Unterschiede zwischen schriftlichem
und mündlichem Englisch. Dies bedeutet, dass grammatikalische Konstruktionen in den je-
weiligen Genres sehr stark variieren können und dass es grundsätzlich für jede Konstruktion
notwendig ist, anzugeben, in welchem Genre sie bevorzugt verwendet wird. Andererseits hat
nach Biber jedes Genre seine für das Englische typischen Konstruktionen, die sich im Durch-
schnitt ausgleichen. Deshalb ist es legitim, für Lerner von einem ,,Durschnittsenglisch" aus-
zugehen, da zumindest für die allgemeine Sprachlehre nicht vorhersagbar ist, in welchem Be-
reich der Lerner letztendlich sein Wissen anwendet. Diese Hypothesen sind allerdings nicht
unumstritten innerhalb der KL. Mit Leech (2000) argumentiert eine zentrale Figur der KL,
dass auch die Korpusforschung gezeigt habe, dass mündliche und schriftliche Sprache dem
gleichen System unterliegen.
Ich werde deshalb die Unterschiede zwischen Mündlichkeit/Schriftlichkeit einerseits und
Genres andererseits darstellen, wenn die Studien dies auch getan haben. Ich werde diese Un-
terschiede aber nicht weiter qualitativ analysieren, sondern lediglich deskriptiv im allgemei-
nen Überblick und bei der Auswertung darstellen, wenn dies angebracht scheint. Außerdem
habe ich in der Studienübersicht in Appendix D die untersuchten Genres und das jeweilige
Medium angegeben, wenn der Autor der Studie dies explizit gemacht hat.
2.3.2 Das Axiom der Vergleichbarkeit verschiedener Korpora
Alle in Appendix A aufgelisteten Korpora betrachte ich als grundsätzlich vergleichbar. Auch
andere, selbst entwickelte oder kombinierte Korpora habe ich akzeptiert, sofern sie den in
2.2.1-2.2.4 definierten Kriterien bezüglich Größe und Zusammensetzung entsprachen, obwohl
es sich nicht ganz von der Hand weisen lässt, dass viele Studien einfach das Korpus verwen-
det haben, das gerade an der jeweiligen Universität zugänglich war, und dass hinter dieser
Entscheidung keine theoretisch untermauerte Entscheidung stand. Lindquist/Levin (2000:201)
bezeichnen diese Situation ironisch als Variante des ,,little-boy-with-a-hammer' syndrome: ,I
have this corpus. What can I do with it?'" Dennoch zeigen sie in ihren Testreihen, dass prin-
zipiell nichts dagegen spricht, die unterschiedlichen Korpora miteinander zu vergleichen. Sie
untersuchen die gleichen Phänomene an verschiedenen Korpora und zeigen, dass vergleichba-
9
Biber bezeichnet Genre mit dem Terminus Register; Vgl. dazu Lee (2001:45).

19
re Ergebnisse erreicht werden, wenn die Vergleichsparameter (z.B. Genre und Varietät) kor-
rekt definiert werden und wenn handwerklich sauber gearbeitet wird. Darunter verstehen sie,
dass eine gute Konkordanzsoftware eingesetzt wurde, welche die ,Tags' fehlerfrei erkennen
kann und eventuelle Anpassungen an die jeweilige Korpusannotation zulässt.
Gestützt durch die Ergebnisse von Lindquist/Levin (2000) werde ich deshalb in der vorlie-
genden Arbeit die Studien nicht nach den verwendeten Korpora analysieren, da zudem eine
Vorabanalyse ergab, dass dafür noch zuwenig Studien vorliegen, um irgendwelche zumindest
statistisch interessanten Ergebnisse in Bezug auf einzelne Korpora zu erzielen. Appendix D
bietet aber eine Übersicht über die in den Studien verwendeten Korpora. Ich werde also Stu-
dien, die unterschiedliche Korpora verwenden, zusammen kategorisieren und werde die Er-
gebnisse dieser Studien miteinander vergleichen. Falls die verwendeten Korpora meiner An-
sicht nach einen Einfluss auf das Ergebnis der jeweiligen Studie haben, so habe ich dies aber
bei der Diskussion der Ergebnisse immer berücksichtigt. Außerdem werde ich immer auf
Genre-, Medium oder Varietätsunterschiede aufmerksam machen, wenn sich bei diesen Vari-
ablen ein Unterschied als eines der Ergebnisse der Studien herausstellt und dies durch die
Zusammensetzung des Korpus bedingt ist.

20
3. Darstellung der Studien
In diesem Kapitel werde ich einen Überblick über alle untersuchten Studien geben, bei denen
ich eine Relevanz für die Lehre feststellen konnte. In Abschnitt 3 werde ich zuerst einen gene-
rellen Überblick über die Studien geben, der eine Gesamteinschätzung ermöglichen soll. Dann
werde ich in den Abschnitten 3.1 bis 3.3 die Einzelstudien nach der im letzten Kapitel vorge-
stellten Systematik präsentieren, die im untenstehenden Schema nochmals verdeutlicht wird.
Zuletzt werde ich in Abschnitt 3.4 noch diejenigen Studien gesammelt vorstellen, die im Prin-
zip ein Potential für die Sprachlehre haben, deren Ergebnisse für eine direkte Umsetzung aber
noch nicht ausgereift sind.
1. Autor und Vorstellung der Anlage der Studie
2. Ergebnisse der Studie
3. Wiederholung von 1. und 2. für alle weiteren Studien der Kategorie
4. Bewertung aller Studien einer Kategorie (nur bei mehreren Studien
bzw. falls Ergebnis uneindeutig)
Tab 3.1 Schema der Darstellung in den Einzelkategorien 3.2-3.4
Um Missverständnissen vorzubeugen möchte ich noch zwei kurze Anmerkungen zur Sprache
und zur Form machen. Bei den englischsprachigen Studien werde ich das Wort token mit Fall
übersetzen und das Wort type mit Typ. Dabei dreht es sich um die aus der Statistik bekannten
Bezeichnungen. Ein Fall ist jedes Auftreten eines Typs, d.h. die Typen sind die Kategorien,
nach der die Fälle klassifiziert werden. Ansonsten habe ich mich terminologisch an Bußmann
(1990) gehalten, d.h. ich habe ihre Übersetzungen englischsprachiger Termini verwendet.
Was die Form betrifft, so habe ich die Tabellen der Originalstudien in fast allen Fällen adap-
tiert oder verkürzt dargestellt, aber fast nie selber entworfen. Sie sind also meistens die intel-
lektuelle Leistung der Autoren der jeweiligen Studie. Da sie bei der Darstellung und der Ana-
lyse der jeweiligen Studie mit eingearbeitet sind, habe ich ihre Herkunft aber nicht mehr ex-
plizit angegeben.
3. Gesamteinschätzung und Überblick über die Studien
In diesem Abschnitt werde ich zu allen Studien eine Gesamteinschätzung geben, um einen
generellen Überblick über die Studien zu erhalten. Von den insgesamt 114 gesichteten Stu-
dien entsprechen 44 den Kriterien des letzten Kapitels und werden deshalb in den nächsten
vier Abschnitten vorgestellt. Dies bedeutet, dass immerhin schon ein starkes Drittel der Stu-
dien eine Relevanz für die Lehre hat. Die Berücksichtigung der Frage der Relevanz lässt sich
vor allem bei den jüngeren Studien feststellen. Unter diesen befinden sich immer weniger
Studien, die nur eine quantitative Untersuchung machen. Neben der zunehmenden Berück-

21
sichtigung der Auswirkungen auf die Lehre lässt sich noch ein zweiter Trend feststellen. Im-
mer mehr Studien versuchen, ihre quantitative Analyse mit einer bestimmten Theorie aus der
Linguistik zu verbinden, um eine zu starke Vereinfachung bei der Darstellung der Ergebnisse
zu vermeiden bzw. um überhaupt erst zu klaren Ergebnissen zu kommen. Aus sprachlehrdi-
daktischer Sicht sind diese Theorien leider sehr weit entfernt von der Realität der Lernerwelt,
weshalb die Studien nur sehr schwer direkt umzusetzen sind. 5 der 14 Studien, die zwischen
2001 und 2003 publiziert wurden und meinen Kriterien entsprachen, versuchen die quantitati-
ven Ergebnisse mit einer Theorie aus der Syntax, aus der Semantik oder aus der Kognitions-
forschung zu verbinden. Eine Gesamtklassifizierung aller korpusbasierten Studien hat bereits
Kennedy (1998) gemacht. Er hat in seinem Überblickskapitel den damaligen Bestand der
grammatikalischen und lexikalischen Studien inventarisiert und kam zu folgender Einschät-
zung:
Because the grammatical tagging and parsing of corpora with high levels of accuracy continues to be
time-consuming and difficult work, there has been a strong tendency for corpus-based studies to focus
on unanalysed corpora, and particularly on individual words or morphemes. (Kennedy 1998:90)
Dieses Urteil, das z.B. auch von Oostdijk/de Haan (1994:41) geteilt wird, lässt sich nicht
mehr halten. Ein erster genereller quantitativer Überblick über die Studien, die für die Lehre
relevant sind, zeigt, dass sich das Bild inzwischen sehr gewandelt hat. Der Anteil der Studien,
die strukturelle bzw. grammatikalische Bereiche untersuchen, ist stark angewachsen. Aller-
dings scheint es weiterhin ein Problem zu sein, annotierte oder geparste Korpora sinnvoll ein-
zusetzen. Von den 26 Studien zu grammatikalischen Eigenschaften hängen 16 Studien ihre
Untersuchungen an Lexemklassen oder sogar an einzelnen Wörtern in Verbindung mit der
Wortannotation auf. 11 Studien verwenden annotierte oder sogar geparste Korpora, um zu
ihren Ergebnissen zu kommen. Tabelle 3.2 zeigt das numerische Verhältnis der untersuchten
Studien.
Ein erster Blick zeigt, dass es noch viele Bereiche gibt, in denen noch gar keine Studien mit
Bezug auf die Sprachlehre gemacht wurden. Mit 10 Studien beschäftigen sich überraschend
viele mit dem Satzgefüge, obwohl dies relativ aufwendig aus einem Korpus zu extrahieren ist.
Vor allem die if-Sätze als Dauerbrenner bei Grammatikproblemen wurden intensiv untersucht.
Bei den Zeiten wird vor allem das englische Futur unter die Lupe genommen, um die Unter-
schiede zwischen will und going to zu analysieren. Obwohl es sehr viele Studien zum Satzge-
füge gibt, zeigen deren Ergebnisse, dass dies auch einer der schwierigsten Bereiche ist, wenn
es darum geht, handfeste Ergebnisse zu liefern. Die Studien wiedersprechen sich teilweise
oder die Ergebnisse sind noch relativ vage. Zum Teil mag dies auch daran liegen, dass das

22
Parsing noch unausgereift ist oder zu wenig hilfreich für die Praxis, aber generell wird es si-
cher immer einfacher sein, lexikalische Muster aus dem Korpus zu extrahieren als grammati-
kalische Muster.
Sprachebene
Bereich Studien annotiert
Adverbsteigerung
0
1
0
Hilfsverben
0
2
1
to/-ing Gliedsätze/if-Sätze
10
3
Modalität
0
3
1
Pluralkonkord bei Nomen
0
1
1
Pronomen
0
3
2
Nominalmodifikation
0
1
1
Tempus und Modus
0
5
2
Grammatik
gesamt
26
11
Adverbien
0
1
-
Lernlisten
0
3
-
feste Wendungen
0
3
Präpositionen
0
4
-
Synonyme
0
4
-
Verben
0
1
-
Lexik
gesamt
16
-
Häufigkeit
0
1
-
Quantifizierung
0
1
-
Funktional
gesamt
0
2
-
Gesamt
44
-
Tab 3.2 Gesamtverteilung der Studien
Bei den lexikalischen Studien stechen die Lernlisten hervor, die für eine bestimmte Wortklas-
se eine nach quantitativen und qualitativen Kriterien Anordnung machen und dem Lerner als
wichtige Orientierung dienen können. Hier scheint sich die KL ein originäres Feld erobert zu
haben, das in dieser Qualität keine andere Methode beackern kann. Mit ihren statistischen
Verfahren eignet sie sich hervorragend zur Erstellung solcher Listen. Die Studien reichen da-
bei von allgemeinen Wortlisten über Phraseologielisten bis hin zu sehr speziellen Verblisten.
Die Studien zu Synonymen sind ein weiteres Feld, das die KL in einer neuen Qualität darstel-
len kann. Die feinen Unterschiede bei Synonymen sind ohne Korpusuntersuchungen oft nur
schwer zu begreifen. Durch die vergleichende Kollokationsanalyse lassen sie sich aber häufig
einfacher und bildhafter erklären.
Eine interessante Anwendung der KL bieten diejenigen Studien, die funktionale Untersu-
chungsziele haben. Allerdings gibt es bisher nur sehr wenige Studien, die eine solche Anlage
haben. Lediglich 2 Studien entsprachen meinen Kriterien. Es zeigt sich, dass es für die KL
noch sehr schwierig ist, von formalen und vom textlichen Symbol ableitbaren Kategorien
wegzukommen. Dies zeigt sich auch darin, dass es zur Zeit noch überhaupt keine Korpora
gibt, die nach funktionalen oder pragmatischen Kriterien annotiert und geparst sind. Obwohl
dies wesentlich aufwendiger ist als z.B. die Annotation nach Wortklassen, so wäre es doch ein

Details

Seiten
Erscheinungsform
Originalausgabe
Jahr
2004
ISBN (eBook)
9783832485184
ISBN (Paperback)
9783838685182
Dateigröße
1.1 MB
Sprache
Deutsch
Institution / Hochschule
Eberhard-Karls-Universität Tübingen – Neuphilologische Fakultät 09
Note
1,3
Schlagworte
fremdsprachenerwerb überblicksstudie didaktik korpuslinguistik sprachlehre
Zurück

Titel: Korpusbasierte Untersuchungen des Englischen und ihre Relevanz für die Sprachlehre
book preview page numper 1
book preview page numper 2
book preview page numper 3
book preview page numper 4
book preview page numper 5
book preview page numper 6
book preview page numper 7
book preview page numper 8
book preview page numper 9
book preview page numper 10
book preview page numper 11
book preview page numper 12
book preview page numper 13
book preview page numper 14
book preview page numper 15
book preview page numper 16
book preview page numper 17
book preview page numper 18
book preview page numper 19
book preview page numper 20
book preview page numper 21
book preview page numper 22
105 Seiten
Cookie-Einstellungen