Lade Inhalt...

Produktivität und der Erstspracherwerb

Die Produktivität der drei Deklinationsklassen des Russischen in der frühen Phase der Sprachproduktion

©2015 Hausarbeit 28 Seiten

Zusammenfassung

Es lohnt sich vor allem aus zweierlei Gründen die frühe Phase des Spracherwerbs bzw. der Sprachproduktion im Kontext der sprachlichen Produktivität zu betrachten. Erstens können dank der neuen korpuslinguistischen Methoden zu empirischen Messungen der Produktivität Hypothesen aufgestellt bzw. überprüft und offene Fragen, die sich den klassischen experimentellen Verfahrensweisen der Spracherwerbsforschung entziehen, geklärt werden. Zweitens wird dadurch eine unvoreingenommene, also von dem jeweiligen Gegenstand bzw. der jeweiligen Spracherwerbstheorie unabhängige Hypothesenprüfung ermöglicht. Dies ist insofern von Bedeutung, als dass die aktuelle Debatte rund um den kindlichen Spracherwerb durch Heterogenität und Konfrontation der unterschiedlichen Sprachtheorien geprägt wird.

Leseprobe

Inhaltsverzeichnis



1
Einleitung
Es lohnt sich vor allem aus zweierlei Gründen die frühe Phase des Spracherwerbs bzw. der
Sprachproduktion im Kontext der sprachlichen Produktivität zu betrachten. Erstens können
dankt den neuen korpuslinguistischen Methoden zu empirischen Messungen der Produktivität
Hypothesen aufgestellt bzw. überprüft und offene Fragen, die sich den klassischen
experimentellen Verfahrensweisen der Spracherwerbsforschung entziehen, geklärt werden.
Zweitens wird dadurch eine unvoreingenommene, also von dem jeweiligen Gegenstand bzw.
der jeweiligen Spracherwerbstheorie unabhängige Hypothesenprüfung ermöglicht. Dies ist
insofern von Bedeutung, als dass die aktuelle Debatte rund um den kindlichen Spracherwerb
durch Heterogenität und Konfrontation der unterschiedlichen Sprachtheorien geprägt wird.
1
Die Chance die Produktivität bestimmter sprachlicher Phänomene nicht nur zu
messen, sondern dies sogar objektiv zu tun, hat mich im Endeffekt dazu angehalten, die
Untersuchungen bzw. die Hypothesen von Natalia Gagarina und Maria Voeikova (2009) zum
Kasus- und Numeruserwerb mit Hilfe von Korpusarbeit (Baayen 2008) zu überprüfen. In ihrer
Arbeit ,,The acquisition of case and number in Russian" verfolgen die beiden Autorinnen ein
dreifaches Ziel: a) die Erfassung des Erwerbs des Kasus und Numerus von Beginn der
Substantivproduktion, b) das Aufstellen der Entwicklungsphasen des Kasus- und
Nummeruserwerbs sowie der Marker für die Phasenübergänge und c) die Erklärung der
Mechanismen, die für den Kasus- und Numeruserwerb verantwortlich sind
(Gagarina/Voeikova 2009, S. 179). Dabei beobachteten sie vier monolingual aufwachsende
Kinder aus Sankt Petersburg, ein Mädchen und drei Jungs. Entscheidend für ihre
Untersuchung waren die ersten neun Monate ab dem Beginn des Auftretens der ersten Kasus-
und Numerusunterscheidungen.
2
Das Erfassen und Auswerten dieser neunmonatigen Phase
des Kasus- und Numeruserwerbs hat eine zentrale These bezüglich der Produktivität der drei
Deklinationsklassen (DK) des Russischen hervorgebracht: Die frühe Phase der
Sprachproduktion ist durch hohe Produktivität von Substantiven der 1. (maskuline
Substantive ohne Endung und neutrale Substantive mit den Endungen -o/-ë/-e) und der 2.
(maskuline und feminine Substantive mit der Endung ­a) DK gekennzeichnet (Vgl. ebd., S.
1
Die bis jetzt einflussreichsten drei Theorien sind dabei der Behaviorismus (Vgl. z. B. Bloomfield 1933,
Skinner 1957), der Kognitivismus (Vgl. z. B. Piaget 1976, Wygotski 1964) und der Nativismus (Vgl. z.
B. Chomsky 1981, 2000). Eine prägnante Zusammenfassung über die Entwicklung sowie die Vor- und
Nachteile dieser drei Sprachtheorien bitten unteranderen Kniffka und Siebert-Ott (2012, S. 32 ff.) an.
2
Der Erwerb von Kasus und Numerus erfolgte in gleichen Phasen und ähnlichem Tempo, obwohl die
Kinder dabei auf verschiedene Strategien zurückgriffen und die erste Kasus- und
Numerusunterscheidung je nach Kind früher oder später einsetzte.

2
188).
3
Da sich Gagarina und Voeikova dem konstruktivistischen Ansatz des Spracherwerbs
(Vgl. dazu z. B. Slobin 1985, Tomasello 2003) anschließen, also der Meinung sind, dass
Sprache keine angeborene Fähigkeit ist, sondern sich erst aus der Notwendigkeit zu
kommunizieren entwickelt, führen sie die hohe Produktivität der 1. und 2. DK auf den Input
zurück (Vgl. ebd., S. 179). Demnach wählen Kinder ausgehend vom Input selektiv
sprachliche Muster aus, mit denen sie schließlich selber agieren. Diese Muster werden aber
nicht zufällig, sondern auf der Grundlage von aufeinander wirkenden Faktoren wie z. B. die
Frequenz der auftretender Typen und Tokens, die strukturelle Transparenz, die Auffälligkeit
des Musters usw. ausgewählt (Vgl. ebd., S. 180). So wurden die ersten fixierten Fälle von
Miniparadigmen meistenteils mit den in der frühen Phase der Sprachproduktion häufig
auftretenden Wortformen wie die Namen von Kindern, die Bezeichnungen für Mama und
Papa sowie ihre diminutive Formen, also den Substantiven der 1. und 2. DK verknüpft. Im
Gegenteil dazu überschritt das Auftreten der Substantive der 3. DK (feminine Substantive
ohne Endung mit Stammauslaut auf weichen Konsonanten und auf weichen sowie harten
Zischlaut (-j)) in dieser frühen Phase nicht mal 3% (Vgl. ebd., S. 194). Aus diesem Grund
gehen die beiden Autorinnen davon aus, dass die 1. und 2. DK produktiv und die 3. DK
dementsprechend unproduktiv ist. Diese These wird zusätzlich durch die schon von Ceitlin
(2000) ermittelte Tendenz des frühen Spracherwerbs unterstützt, die durch die
Übergeneralisierung der produktiven Flexionsmarker auf die unproduktiven geprägt ist.
Demnach erwerben die Kinder zunächst die produktiven Flexionsmarker und übertragen bzw.
übergeneralisieren diese dann auf unproduktive Formen. Durch eine solche Erschaffung von
neuen Formen füllen Kinder die vorhandenen Lücken im eigenen Sprachsystem auf. Diese
Übergeneralisierungstendenz wurde ebenfalls von Gagarina und Voeikova fixiert. Dazu
führen sie folgende Beispiele auf: daj sol-a* (NOM, 1. DK) analog zu daj maka (moloka)
anstatt daj sol-i (3. DK) oder vesc-a* (NOM, weibliche Endung ­a der 2. DK) anstatt vesc` (3.
DK) (Ebd., S. 188).
4
Diese Beispiele zeigen darüber hinaus, dass die Kinder die untypische
endungslose feminine Form durchaus als solche erkennen und sie deswegen durch eine
typische feminine Endung ­a (NOM) der 2. DK erweitern. Überspitzt würde es sogar
bedeuten, dass die 2. DK in der frühen Phase der Sprachproduktion von allen drei die
produktivste sein muss. Daraus ergibt sich folgende Rangfolge der Produktivität der drei DK:
3
Die Nummerierung der Deklinationsklassen entspricht in dieser Übersetzung der theoretischen
Grundlage des Kompendiums des linguistischen Wissens (Schlegel u.a. 1992, S. 129-140) und stimmt
mit der Nummerierung von Gagarina und Voeikava nicht vollkommen überein.
4
Bei der Transliteration des Kyrillischen wird in dieser Arbeit auf die Kodeks-ISO
Transliterationstabellen zurückgegriffen, die den aktuellen wissenschaftlichen Normen der
Transliteration des Kyrillischen entspricht (Kempgen 1996-2016).

3
Die 2. DK ist die produktivste. Die 1. DK ist die zweitproduktivste. Die letzte DK ist
dementsprechend die unproduktivste. Das Ziel dieser Arbeit besteht also vor allem darin,
diese Reihenfolge der Produktivität der drei DK mit Hilfe von Korpusarbeit (Baayen 2008) zu
überprüfen und damit gleichzeitig die Erklärungsansätze von Gagarina und Voeikova
bezüglich der frühen Phase der Sprachproduktion entweder zu bestätigen oder zu widerlegen.
Um dies zu erreichen, müssen aber zuvor drei wichtige Schritte vollzogen werden.
Erstens muss auf den Begriff der Produktivität näher eingegangen werden. Dies wird,
zweitens, mit der Arbeit am Korpus verknüpft und dadurch eine optimale Verbindung
zwischen der Theorie und der Praxis gewährleistet. Um die Einführung in die Korpusarbeit zu
erleichtern, wird dabei zunächst auf die Daten des russischen eine Million Tokens großen
Trainingskorpus (Nacional'nyj korpus russkogo jazyka 2003-2016) zurückgegriffen. Dieses
eignet sich hierfür insbesondere, weil es keine zusätzlichen Kodierungen wie z. B. das
Abgrenzen der kindlichen Äußerungen verlangt. Anschließend kann, drittens, die Bedeutung
der Produktivität in der Erstspracherwerbsforschung diskutiert werden. Erst nach dem diese
drei Schritte ausgeführt wurden und so eine theoretische Basis geschaffen wurde, kann diese
zur Nutzung bei der Messung der Produktivität der drei DK herangezogen werden. Hierbei
wird nicht mehr auf den Trainingskorpus, sondern auf den Erstspracherwerbskorpus (Meyer/
Stoll 2009) zurückgegriffen, sodass schließlich eine authentische Hypothesenprüfung
gewährleistet werden kann.

4
1.
Produktivitätsbegriff
Nicht anders als bei den Theorien der Spracherwerbsforschung wurde für den Begriff der
Produktivität bis jetzt keine allgemeingültige und ausnahmslos akzeptierte Definition
gefunden. Diese Problematik stellt Amir Zeldes (2013) in seiner Arbeit ,,Productivity in
Argument Selection: From Morphology to Syntax" gekonnt dar, indem er einen Überblick
über die Entwicklung und die Vielseitigkeit der unterschiedlichen Definitionsversuche des
Produktivitätsbegriffs verschafft. Dabei geht er unteranderem auf den modernen bzw.
korpuslinguistischen Produktivitätsbegriff ein, der, wie schon mehrfach angesprochen, eine
empirische Messung der Produktivität bestimmter sprachlicher Phänomene ermöglicht und
deswegen im Vordergrund dieser Untersuchung stehen wird. Einer der bekanntesten Vertreter
des korpuslinguistischen Produktivitätsbegriffs ist Rolf Harald Baayen (2008, 2009), der
aktuell als einer der international besten und innovativsten Forscher auf dem Gebiet der
Wortschatzforschung und der quantitativen Linguistik gilt. Darüber hinaus war er einer der
ersten Linguisten, der die Vorteile der computergestützten und empirischen Sprachforschung
erkannte. Insbesondere aus diesem Grund lohnt es sich im Zusammenhang mit der
korpuslinguistischen Arbeit auf den Produktivitätsbegriff nach Baayen näher einzugehen.
1.1. Produktivität bei Baayen
Baayen unterscheidet zwischen drei Arten der Produktivität: ,,realized productivity" (Baayen
2009, S. 901), ,,expanding productivity" (Ebd., S. 902) und ,,potential productivity" (Ebd.).
Unter der ,,realized productivity" ist dabei die Zahl der relevanten Typen
5
zu verstehen. Die
,,expanding productivity" erfasst die Zahl der relevanten Typen, die nur einmal vorkommen.
Diese werden darüber hinaus als ,,hapax legomena" (Ebd.) bezeichnet. Die ,,potential
productivity" bezieht sich auch auf die Zahl der relevanten Typen, die nur einmal
vorkommen. Diese werden aber auf die Größe des Korpus relativiert (Tokenzahl). Demnach
kommt der expandierenden und der potenziellen Produktivität eine höhere Bedeutung zu, da
die erste die gegenwärtige Produktivität und die zweite die Wahrscheinlichkeit der
Neubildungen bzw. das Potenzial zur Bildung neuer Wörter einschätzen. Um den
5
,,In der strukturalen Linguistik dienen die Begriffe [Token und Types] zur Unterscheidung zwischen
konkreten sprachlichen Äußerungen (Token) und abstrakten Einheiten der Metaebene (Types), die sie
repräsentieren"
(Wikipedia.
Die
freie
Enzyklopädie).
Online
im
Internet:
https://de.wikipedia.org/wiki/Token_und_Type (Abruf am 02.05.2016).

5
Produktivitätsgrad der jeweiligen Produktivität zu errechnen, entwickelt Baayen zwei
mathematische Formel:
Expandierende Produktivität (Ebd.):
P*= V(1, C, N) / V(1, N)
Potentielle Produktivität (Ebd.):
P= V(1, C, N) / N(C)
Um die jeweiligen Größen der Formeln verstehen und ermitteln zu können, soll nun
schrittweise sowohl die Variablen der Formeln, als auch parallel die Arbeit am russischen
eine Million Tokens großen Trainingskorpus (Nacional'nyj korpus russkogo jazyka 2003-
2016) erläutert werden.
1. Schritt:
Korpus einlesen:
> ru <-read.table(file.choose(), quote='\"',sep="\t",header=T,as.is=T)
2. Schritt:
Kodierung für Russisch:
> Sys.setlocale ("LC_ALL","Russian_Russia.1251")
3. Schritt:
Variablen der mathematischen Formel definieren und ermitteln:
N: Zahl der Tokens im Korpus
alle möglichen Tokens des Korpus ermitteln
> nrow(ru)
# 1228881
N(C): Zahl der Tokens einer Kategorie C
eine Kategorie C definieren, indem man den String mit einem
Suchmuster abgleicht
gesucht ist die 2. DK
6
, die sich nur auf weibliche und männliche
Substantive mit der Endung ­a begrenzt
> DK2a_S<-ru[(grepl('$', ru$lem) & ru$pos=="S"),]
> nrow(DK2a_S)
# 61383
V: Zahl der Typen (V1: Zahl der hapax legomina)
alle möglichen Typen des Korpus als Faktoren ermitteln
> lemlevel <-levels(as.factor(ru$lem))
> length(lemlevel)
# 51027
V(C, N): Zahl der Typen einer Kategorie in einem Korpus mit N Tokens
die Zahl der Typen nur auf eine Kategorie eingrenzen
gesucht sind erneut alle Typen der zweiten Deklinationsklasse
> length(unique(as.factor(DK2a_S$lem)))
# 4718
6
Die 2. DK wurde deswegen zur Erläuterung ausgewählt, weil sich das Suchmuster für diese im
Vergleich zu den anderen zwei DK am einfachsten definieren lässt.

6
4. Schritt:
Mit den ermittelten Werten die expandierende und die potenzielle
Produktivität errechnen:
P*
> 4718 / 51027
P
> 4718 / 61383
# 0.09246085
# 0.07686167
5. Schritt:
Ergebnisse interpretieren:
Es ist eher problematisch nur anhand dieser beiden Werte eine annehmbare Aussage über die
Produktivität der 2. DK zu treffen. Erstens handelt es sich hierbei um sogenannte -Werte, die
sich nur auf eine bestimmte Stelle der Produktivitätskurve, auf die später ausführlich
eingegangen wird, begrenzen und somit lediglich die Steigung dieser Stelle beschreiben.
Zweitens können diese beiden Werte überhaupt nicht miteinander verglichen werden. Erst
dann, wenn man zusätzliche -Werte z. B. der 1. und 3. DK ermittelt würde, könnte man
diese mit der 2. DK verglichen und dadurch akzeptable Aussagen bezüglich der Produktivität
aller DK treffen. Dabei wäre man aber immer darauf angewiesen, die ermittelten Ergebnisse
in Verhältnis zu anderen Werten zu setzten und so die produktivste DK zu ermitteln. Stefan
Evert und Anke Lüdeling (2001) bieten in diesem Zusammenhang eine geschicktere Lösung
an. Mit Hilfe vom Typ-Token-Verhältnis (V
c
(C, N(C)): Typenzahl einer Kategorie C in N(C)
Tokens) lässt sich nämlich eine ,,vocabulary growth curve" (Evert/Lüdeling 2001, S. 168)
abbilden, die durch ihren Verlauf die Produktivität oder die Unproduktivität einer Kategorie
anzeigt. Bei der beständigen Token-Anzahl wird dabei die Anzahl der Typen gezählt (Vgl.
ebd.). Wenn dadurch eine abflachende Kurve entsteht, ist das sprachliche Muster unproduktiv.
Eine kontinuierlich steigende Kurve steht dagegen für ein produktives sprachliches Muster.
Ein idealtypischer Verlauf der Kurven sieht nach Evert und Lüdeling also folgendermaßen
aus (Ebd.):

7
Um solche Vokabularwachstumskurve (VGC) modellieren zu können, muss man
a) zipfR installieren und mit library(zipfR) laden:
mit Hilfe des Zipfschen Gesetzes (
z
=C / z )
7
werden die Ergebnisse,
also die Auftrittswahrscheinlichkeit eines Items
z
und dessen Rang z
(beide ergeben zus. 1 (z. Bsp. * 4)), durch die normalisierende
Konstante (C) modifiziert und so die VGC angepasst
b) VGC modellieren:
> DK2a_S.spc <- vec2spc(DK2a_S$lem)
> DK2a_S.lnre.fzm <- lnre("fzm", DK2a_S.spc)
> DK2a_S.int.vgc <- lnre.vgc(DK2a_S.lnre.fzm, seq(0, N(DK2a_S.lnre.fzm)), m.max=3)
c) VGC plotten bzw. anzeigen lassen:
> plot(DK2a_S.int.vgc)
Laut der obigen Abbildung der idealverlaufenden VGC kann also ohne Zweifel festgehalten
werden, dass die 2. DK des Russischen produktiv ist.
Natürlich dürfen diese Ergebnisse aber nicht unkritisch betrachtet werden. Erstens sind
sowohl die expandierende, als auch die potenzielle Produktivität sehr stark von der Größe des
Korpus abhängig, auch wenn man es auf die Zahl der Tokens relativiert (Vgl. Baayen 2008, S.
223). Zweitens spielt ebenso die relative Häufigkeit der im Korpus vorkommenden Tokens
einer Kategorie C (f(C)=N(C) / N f(DK2a_S)= 61383 / 1228881= 0.04995032), die nur
7
Das Zipfsche Gesetz, das nach George Kingsley Zipf, der dieses Gesetz in den 1930er Jahren
aufstellte, benannt wurde, ,,ist ein Modell, mit dessen Hilfe man bei bestimmten Größen, die in eine
Rangfolge gebracht werden, deren Wert aus ihrem Rang abschätzen kann" (Wikipedia. Die freie
Enzyklopädie). Online im Internet: https://de.wikipedia.org/wiki/Zipfsches_Gesetz (Abruf am
02.05.2016).

Details

Seiten
Erscheinungsform
Originalausgabe
Jahr
2015
ISBN (PDF)
9783961161096
ISBN (Paperback)
9783961166091
Dateigröße
440 KB
Sprache
Deutsch
Institution / Hochschule
Humboldt-Universität zu Berlin – Institut für Slawistik
Erscheinungsdatum
2017 (April)
Note
1,0
Schlagworte
Erstspracherwerb Messung der Produktivität Korpus Deklinationsklassen Produktivitätsbegriff Produktivität nach Baayen Linguistik Produktivitätskurven
Zurück

Titel: Produktivität und der Erstspracherwerb
book preview page numper 1
book preview page numper 2
book preview page numper 3
book preview page numper 4
book preview page numper 5
book preview page numper 6
book preview page numper 7
book preview page numper 8
28 Seiten
Cookie-Einstellungen