Produktivität und der Erstspracherwerb

Gutjaht, Sofia

Produktivität und der Erstspracherwerb

Die Produktivität der drei Deklinationsklassen des Russischen in der frühen Phase der Sprachproduktion

von Sofia Gutjaht (Autor:in)

Russistik / Slavistik

Zusammenfassung

Es lohnt sich vor allem aus zweierlei Gründen die frühe Phase des Spracherwerbs bzw. der Sprachproduktion im Kontext der sprachlichen Produktivität zu betrachten. Erstens können dank der neuen korpuslinguistischen Methoden zu empirischen Messungen der Produktivität Hypothesen aufgestellt bzw. überprüft und offene Fragen, die sich den klassischen experimentellen Verfahrensweisen der Spracherwerbsforschung entziehen, geklärt werden. Zweitens wird dadurch eine unvoreingenommene, also von dem jeweiligen Gegenstand bzw. der jeweiligen Spracherwerbstheorie unabhängige Hypothesenprüfung ermöglicht. Dies ist insofern von Bedeutung, als dass die aktuelle Debatte rund um den kindlichen Spracherwerb durch Heterogenität und Konfrontation der unterschiedlichen Sprachtheorien geprägt wird.

Leseprobe

Inhaltsverzeichnis

1

Einleitung

Es lohnt sich vor allem aus zweierlei Gründen die frühe Phase des Spracherwerbs bzw. der

Sprachproduktion im Kontext der sprachlichen Produktivität zu betrachten. Erstens können

dankt den neuen korpuslinguistischen Methoden zu empirischen Messungen der Produktivität

Hypothesen aufgestellt bzw. überprüft und offene Fragen, die sich den klassischen

experimentellen Verfahrensweisen der Spracherwerbsforschung entziehen, geklärt werden.

Zweitens wird dadurch eine unvoreingenommene, also von dem jeweiligen Gegenstand bzw.

der jeweiligen Spracherwerbstheorie unabhängige Hypothesenprüfung ermöglicht. Dies ist

insofern von Bedeutung, als dass die aktuelle Debatte rund um den kindlichen Spracherwerb

durch Heterogenität und Konfrontation der unterschiedlichen Sprachtheorien geprägt wird.

1

Die Chance die Produktivität bestimmter sprachlicher Phänomene nicht nur zu

messen, sondern dies sogar objektiv zu tun, hat mich im Endeffekt dazu angehalten, die

Untersuchungen bzw. die Hypothesen von Natalia Gagarina und Maria Voeikova (2009) zum

Kasus- und Numeruserwerb mit Hilfe von Korpusarbeit (Baayen 2008) zu überprüfen. In ihrer

Arbeit ,,The acquisition of case and number in Russian" verfolgen die beiden Autorinnen ein

dreifaches Ziel: a) die Erfassung des Erwerbs des Kasus und Numerus von Beginn der

Substantivproduktion, b) das Aufstellen der Entwicklungsphasen des Kasus- und

Nummeruserwerbs sowie der Marker für die Phasenübergänge und c) die Erklärung der

Mechanismen, die für den Kasus- und Numeruserwerb verantwortlich sind

(Gagarina/Voeikova 2009, S. 179). Dabei beobachteten sie vier monolingual aufwachsende

Kinder aus Sankt Petersburg, ein Mädchen und drei Jungs. Entscheidend für ihre

Untersuchung waren die ersten neun Monate ab dem Beginn des Auftretens der ersten Kasus-

und Numerusunterscheidungen.

2

Das Erfassen und Auswerten dieser neunmonatigen Phase

des Kasus- und Numeruserwerbs hat eine zentrale These bezüglich der Produktivität der drei

Deklinationsklassen (DK) des Russischen hervorgebracht: Die frühe Phase der

Sprachproduktion ist durch hohe Produktivität von Substantiven der 1. (maskuline

Substantive ohne Endung und neutrale Substantive mit den Endungen -o/-ë/-e) und der 2.

(maskuline und feminine Substantive mit der Endung a) DK gekennzeichnet (Vgl. ebd., S.

1

Die bis jetzt einflussreichsten drei Theorien sind dabei der Behaviorismus (Vgl. z. B. Bloomfield 1933,

Skinner 1957), der Kognitivismus (Vgl. z. B. Piaget 1976, Wygotski 1964) und der Nativismus (Vgl. z.

B. Chomsky 1981, 2000). Eine prägnante Zusammenfassung über die Entwicklung sowie die Vor- und

Nachteile dieser drei Sprachtheorien bitten unteranderen Kniffka und Siebert-Ott (2012, S. 32 ff.) an.

2

Der Erwerb von Kasus und Numerus erfolgte in gleichen Phasen und ähnlichem Tempo, obwohl die

Kinder dabei auf verschiedene Strategien zurückgriffen und die erste Kasus- und

Numerusunterscheidung je nach Kind früher oder später einsetzte.

2

188).

3

Da sich Gagarina und Voeikova dem konstruktivistischen Ansatz des Spracherwerbs

(Vgl. dazu z. B. Slobin 1985, Tomasello 2003) anschließen, also der Meinung sind, dass

Sprache keine angeborene Fähigkeit ist, sondern sich erst aus der Notwendigkeit zu

kommunizieren entwickelt, führen sie die hohe Produktivität der 1. und 2. DK auf den Input

zurück (Vgl. ebd., S. 179). Demnach wählen Kinder ausgehend vom Input selektiv

sprachliche Muster aus, mit denen sie schließlich selber agieren. Diese Muster werden aber

nicht zufällig, sondern auf der Grundlage von aufeinander wirkenden Faktoren wie z. B. die

Frequenz der auftretender Typen und Tokens, die strukturelle Transparenz, die Auffälligkeit

des Musters usw. ausgewählt (Vgl. ebd., S. 180). So wurden die ersten fixierten Fälle von

Miniparadigmen meistenteils mit den in der frühen Phase der Sprachproduktion häufig

auftretenden Wortformen wie die Namen von Kindern, die Bezeichnungen für Mama und

Papa sowie ihre diminutive Formen, also den Substantiven der 1. und 2. DK verknüpft. Im

Gegenteil dazu überschritt das Auftreten der Substantive der 3. DK (feminine Substantive

ohne Endung mit Stammauslaut auf weichen Konsonanten und auf weichen sowie harten

Zischlaut (-j)) in dieser frühen Phase nicht mal 3% (Vgl. ebd., S. 194). Aus diesem Grund

gehen die beiden Autorinnen davon aus, dass die 1. und 2. DK produktiv und die 3. DK

dementsprechend unproduktiv ist. Diese These wird zusätzlich durch die schon von Ceitlin

(2000) ermittelte Tendenz des frühen Spracherwerbs unterstützt, die durch die

Übergeneralisierung der produktiven Flexionsmarker auf die unproduktiven geprägt ist.

Demnach erwerben die Kinder zunächst die produktiven Flexionsmarker und übertragen bzw.

übergeneralisieren diese dann auf unproduktive Formen. Durch eine solche Erschaffung von

neuen Formen füllen Kinder die vorhandenen Lücken im eigenen Sprachsystem auf. Diese

Übergeneralisierungstendenz wurde ebenfalls von Gagarina und Voeikova fixiert. Dazu

führen sie folgende Beispiele auf: daj sol-a* (NOM, 1. DK) analog zu daj maka (moloka)

anstatt daj sol-i (3. DK) oder vesc-a* (NOM, weibliche Endung a der 2. DK) anstatt vesc` (3.

DK) (Ebd., S. 188).

4

Diese Beispiele zeigen darüber hinaus, dass die Kinder die untypische

endungslose feminine Form durchaus als solche erkennen und sie deswegen durch eine

typische feminine Endung a (NOM) der 2. DK erweitern. Überspitzt würde es sogar

bedeuten, dass die 2. DK in der frühen Phase der Sprachproduktion von allen drei die

produktivste sein muss. Daraus ergibt sich folgende Rangfolge der Produktivität der drei DK:

3

Die Nummerierung der Deklinationsklassen entspricht in dieser Übersetzung der theoretischen

Grundlage des Kompendiums des linguistischen Wissens (Schlegel u.a. 1992, S. 129-140) und stimmt

mit der Nummerierung von Gagarina und Voeikava nicht vollkommen überein.

4

Bei der Transliteration des Kyrillischen wird in dieser Arbeit auf die Kodeks-ISO

Transliterationstabellen zurückgegriffen, die den aktuellen wissenschaftlichen Normen der

Transliteration des Kyrillischen entspricht (Kempgen 1996-2016).

3

Die 2. DK ist die produktivste. Die 1. DK ist die zweitproduktivste. Die letzte DK ist

dementsprechend die unproduktivste. Das Ziel dieser Arbeit besteht also vor allem darin,

diese Reihenfolge der Produktivität der drei DK mit Hilfe von Korpusarbeit (Baayen 2008) zu

überprüfen und damit gleichzeitig die Erklärungsansätze von Gagarina und Voeikova

bezüglich der frühen Phase der Sprachproduktion entweder zu bestätigen oder zu widerlegen.

Um dies zu erreichen, müssen aber zuvor drei wichtige Schritte vollzogen werden.

Erstens muss auf den Begriff der Produktivität näher eingegangen werden. Dies wird,

zweitens, mit der Arbeit am Korpus verknüpft und dadurch eine optimale Verbindung

zwischen der Theorie und der Praxis gewährleistet. Um die Einführung in die Korpusarbeit zu

erleichtern, wird dabei zunächst auf die Daten des russischen eine Million Tokens großen

Trainingskorpus (Nacional'nyj korpus russkogo jazyka 2003-2016) zurückgegriffen. Dieses

eignet sich hierfür insbesondere, weil es keine zusätzlichen Kodierungen wie z. B. das

Abgrenzen der kindlichen Äußerungen verlangt. Anschließend kann, drittens, die Bedeutung

der Produktivität in der Erstspracherwerbsforschung diskutiert werden. Erst nach dem diese

drei Schritte ausgeführt wurden und so eine theoretische Basis geschaffen wurde, kann diese

zur Nutzung bei der Messung der Produktivität der drei DK herangezogen werden. Hierbei

wird nicht mehr auf den Trainingskorpus, sondern auf den Erstspracherwerbskorpus (Meyer/

Stoll 2009) zurückgegriffen, sodass schließlich eine authentische Hypothesenprüfung

gewährleistet werden kann.

4

1.

Produktivitätsbegriff

Nicht anders als bei den Theorien der Spracherwerbsforschung wurde für den Begriff der

Produktivität bis jetzt keine allgemeingültige und ausnahmslos akzeptierte Definition

gefunden. Diese Problematik stellt Amir Zeldes (2013) in seiner Arbeit ,,Productivity in

Argument Selection: From Morphology to Syntax" gekonnt dar, indem er einen Überblick

über die Entwicklung und die Vielseitigkeit der unterschiedlichen Definitionsversuche des

Produktivitätsbegriffs verschafft. Dabei geht er unteranderem auf den modernen bzw.

korpuslinguistischen Produktivitätsbegriff ein, der, wie schon mehrfach angesprochen, eine

empirische Messung der Produktivität bestimmter sprachlicher Phänomene ermöglicht und

deswegen im Vordergrund dieser Untersuchung stehen wird. Einer der bekanntesten Vertreter

des korpuslinguistischen Produktivitätsbegriffs ist Rolf Harald Baayen (2008, 2009), der

aktuell als einer der international besten und innovativsten Forscher auf dem Gebiet der

Wortschatzforschung und der quantitativen Linguistik gilt. Darüber hinaus war er einer der

ersten Linguisten, der die Vorteile der computergestützten und empirischen Sprachforschung

erkannte. Insbesondere aus diesem Grund lohnt es sich im Zusammenhang mit der

korpuslinguistischen Arbeit auf den Produktivitätsbegriff nach Baayen näher einzugehen.

1.1. Produktivität bei Baayen

Baayen unterscheidet zwischen drei Arten der Produktivität: ,,realized productivity" (Baayen

2009, S. 901), ,,expanding productivity" (Ebd., S. 902) und ,,potential productivity" (Ebd.).

Unter der ,,realized productivity" ist dabei die Zahl der relevanten Typen

5

zu verstehen. Die

,,expanding productivity" erfasst die Zahl der relevanten Typen, die nur einmal vorkommen.

Diese werden darüber hinaus als ,,hapax legomena" (Ebd.) bezeichnet. Die ,,potential

productivity" bezieht sich auch auf die Zahl der relevanten Typen, die nur einmal

vorkommen. Diese werden aber auf die Größe des Korpus relativiert (Tokenzahl). Demnach

kommt der expandierenden und der potenziellen Produktivität eine höhere Bedeutung zu, da

die erste die gegenwärtige Produktivität und die zweite die Wahrscheinlichkeit der

Neubildungen bzw. das Potenzial zur Bildung neuer Wörter einschätzen. Um den

5

,,In der strukturalen Linguistik dienen die Begriffe [Token und Types] zur Unterscheidung zwischen

konkreten sprachlichen Äußerungen (Token) und abstrakten Einheiten der Metaebene (Types), die sie

repräsentieren"

(Wikipedia.

Die

freie

Enzyklopädie).

Online

im

Internet:

https://de.wikipedia.org/wiki/Token_und_Type (Abruf am 02.05.2016).

5

Produktivitätsgrad der jeweiligen Produktivität zu errechnen, entwickelt Baayen zwei

mathematische Formel:

Expandierende Produktivität (Ebd.):

P*= V(1, C, N) / V(1, N)

Potentielle Produktivität (Ebd.):

P= V(1, C, N) / N(C)

Um die jeweiligen Größen der Formeln verstehen und ermitteln zu können, soll nun

schrittweise sowohl die Variablen der Formeln, als auch parallel die Arbeit am russischen

eine Million Tokens großen Trainingskorpus (Nacional'nyj korpus russkogo jazyka 2003-

2016) erläutert werden.

1. Schritt:

Korpus einlesen:

> ru <-read.table(file.choose(), quote='\"',sep="\t",header=T,as.is=T)

2. Schritt:

Kodierung für Russisch:

> Sys.setlocale ("LC_ALL","Russian_Russia.1251")

3. Schritt:

Variablen der mathematischen Formel definieren und ermitteln:

N: Zahl der Tokens im Korpus

alle möglichen Tokens des Korpus ermitteln

> nrow(ru)

# 1228881

N(C): Zahl der Tokens einer Kategorie C

eine Kategorie C definieren, indem man den String mit einem

Suchmuster abgleicht

gesucht ist die 2. DK

6

, die sich nur auf weibliche und männliche

Substantive mit der Endung a begrenzt

> DK2a_S<-ru[(grepl('$', ru$lem) & ru$pos=="S"),]

> nrow(DK2a_S)

# 61383

V: Zahl der Typen (V1: Zahl der hapax legomina)

alle möglichen Typen des Korpus als Faktoren ermitteln

> lemlevel <-levels(as.factor(ru$lem))

> length(lemlevel)

# 51027

V(C, N): Zahl der Typen einer Kategorie in einem Korpus mit N Tokens

die Zahl der Typen nur auf eine Kategorie eingrenzen

gesucht sind erneut alle Typen der zweiten Deklinationsklasse

> length(unique(as.factor(DK2a_S$lem)))

# 4718

6

Die 2. DK wurde deswegen zur Erläuterung ausgewählt, weil sich das Suchmuster für diese im

Vergleich zu den anderen zwei DK am einfachsten definieren lässt.

6

4. Schritt:

Mit den ermittelten Werten die expandierende und die potenzielle

Produktivität errechnen:

P*

> 4718 / 51027

P

> 4718 / 61383

# 0.09246085

# 0.07686167

5. Schritt:

Ergebnisse interpretieren:

Es ist eher problematisch nur anhand dieser beiden Werte eine annehmbare Aussage über die

Produktivität der 2. DK zu treffen. Erstens handelt es sich hierbei um sogenannte -Werte, die

sich nur auf eine bestimmte Stelle der Produktivitätskurve, auf die später ausführlich

eingegangen wird, begrenzen und somit lediglich die Steigung dieser Stelle beschreiben.

Zweitens können diese beiden Werte überhaupt nicht miteinander verglichen werden. Erst

dann, wenn man zusätzliche -Werte z. B. der 1. und 3. DK ermittelt würde, könnte man

diese mit der 2. DK verglichen und dadurch akzeptable Aussagen bezüglich der Produktivität

aller DK treffen. Dabei wäre man aber immer darauf angewiesen, die ermittelten Ergebnisse

in Verhältnis zu anderen Werten zu setzten und so die produktivste DK zu ermitteln. Stefan

Evert und Anke Lüdeling (2001) bieten in diesem Zusammenhang eine geschicktere Lösung

an. Mit Hilfe vom Typ-Token-Verhältnis (V

c

(C, N(C)): Typenzahl einer Kategorie C in N(C)

Tokens) lässt sich nämlich eine ,,vocabulary growth curve" (Evert/Lüdeling 2001, S. 168)

abbilden, die durch ihren Verlauf die Produktivität oder die Unproduktivität einer Kategorie

anzeigt. Bei der beständigen Token-Anzahl wird dabei die Anzahl der Typen gezählt (Vgl.

ebd.). Wenn dadurch eine abflachende Kurve entsteht, ist das sprachliche Muster unproduktiv.

Eine kontinuierlich steigende Kurve steht dagegen für ein produktives sprachliches Muster.

Ein idealtypischer Verlauf der Kurven sieht nach Evert und Lüdeling also folgendermaßen

aus (Ebd.):

7

Um solche Vokabularwachstumskurve (VGC) modellieren zu können, muss man

a) zipfR installieren und mit library(zipfR) laden:

mit Hilfe des Zipfschen Gesetzes (

z

=C / z )

7

werden die Ergebnisse,

also die Auftrittswahrscheinlichkeit eines Items

z

und dessen Rang z

(beide ergeben zus. 1 (z. Bsp. * 4)), durch die normalisierende

Konstante (C) modifiziert und so die VGC angepasst

b) VGC modellieren:

> DK2a_S.spc <- vec2spc(DK2a_S$lem)

> DK2a_S.lnre.fzm <- lnre("fzm", DK2a_S.spc)

> DK2a_S.int.vgc <- lnre.vgc(DK2a_S.lnre.fzm, seq(0, N(DK2a_S.lnre.fzm)), m.max=3)

c) VGC plotten bzw. anzeigen lassen:

> plot(DK2a_S.int.vgc)

Laut der obigen Abbildung der idealverlaufenden VGC kann also ohne Zweifel festgehalten

werden, dass die 2. DK des Russischen produktiv ist.

Natürlich dürfen diese Ergebnisse aber nicht unkritisch betrachtet werden. Erstens sind

sowohl die expandierende, als auch die potenzielle Produktivität sehr stark von der Größe des

Korpus abhängig, auch wenn man es auf die Zahl der Tokens relativiert (Vgl. Baayen 2008, S.

223). Zweitens spielt ebenso die relative Häufigkeit der im Korpus vorkommenden Tokens

einer Kategorie C (f(C)=N(C) / N f(DK2a_S)= 61383 / 1228881= 0.04995032), die nur

7

Das Zipfsche Gesetz, das nach George Kingsley Zipf, der dieses Gesetz in den 1930er Jahren

aufstellte, benannt wurde, ,,ist ein Modell, mit dessen Hilfe man bei bestimmten Größen, die in eine

Rangfolge gebracht werden, deren Wert aus ihrem Rang abschätzen kann" (Wikipedia. Die freie

Enzyklopädie). Online im Internet: https://de.wikipedia.org/wiki/Zipfsches_Gesetz (Abruf am

02.05.2016).

Details

Seiten
Erscheinungsform: Originalausgabe
Erscheinungsjahr: 2015
ISBN (PDF): 9783961161096
ISBN (Paperback): 9783961166091
Dateigröße: 440 KB
Sprache: Deutsch
Institution / Hochschule: Humboldt-Universität zu Berlin – Institut für Slawistik
Erscheinungsdatum: 2017 (April)
Note: 1,0
Schlagworte: Erstspracherwerb Messung der Produktivität Korpus Deklinationsklassen Produktivitätsbegriff Produktivität nach Baayen Linguistik Produktivitätskurven
Produktsicherheit: Diplom.de

Autor

Sofia Gutjaht (Autor:in)