Produktivität und der Erstspracherwerb
Die Produktivität der drei Deklinationsklassen des Russischen in der frühen Phase der Sprachproduktion
					
	
		©2015
		Hausarbeit
		
			
				28 Seiten
			
		
	
				
				
					
						
					
				
				
				
				
			Zusammenfassung
			
				Es lohnt sich vor allem aus zweierlei Gründen die frühe Phase des Spracherwerbs bzw. der Sprachproduktion im Kontext der sprachlichen Produktivität zu betrachten. Erstens können dank der neuen korpuslinguistischen Methoden zu empirischen Messungen der Produktivität Hypothesen aufgestellt bzw. überprüft und offene Fragen, die sich den klassischen experimentellen Verfahrensweisen der Spracherwerbsforschung entziehen, geklärt werden. Zweitens wird dadurch eine unvoreingenommene, also von dem jeweiligen Gegenstand bzw. der jeweiligen Spracherwerbstheorie unabhängige Hypothesenprüfung ermöglicht. Dies ist insofern von Bedeutung, als dass die aktuelle Debatte rund um den kindlichen Spracherwerb durch Heterogenität und Konfrontation der unterschiedlichen Sprachtheorien geprägt wird. 
			
		
	Leseprobe
Inhaltsverzeichnis
1 
Einleitung  
Es lohnt sich vor allem aus zweierlei Gründen die frühe Phase des Spracherwerbs bzw. der 
Sprachproduktion  im  Kontext  der  sprachlichen  Produktivität  zu  betrachten.  Erstens  können 
dankt den neuen korpuslinguistischen Methoden zu empirischen Messungen der Produktivität 
Hypothesen  aufgestellt  bzw.  überprüft  und  offene  Fragen,  die  sich  den  klassischen 
experimentellen  Verfahrensweisen  der  Spracherwerbsforschung  entziehen,  geklärt  werden. 
Zweitens wird dadurch eine unvoreingenommene, also von dem jeweiligen Gegenstand bzw. 
der  jeweiligen  Spracherwerbstheorie  unabhängige  Hypothesenprüfung  ermöglicht.  Dies  ist 
insofern von Bedeutung, als dass die aktuelle Debatte rund um den kindlichen Spracherwerb 
durch Heterogenität und Konfrontation der unterschiedlichen Sprachtheorien geprägt wird.
1
Die  Chance  die  Produktivität  bestimmter  sprachlicher  Phänomene  nicht  nur  zu 
messen,  sondern  dies  sogar  objektiv  zu  tun,  hat  mich  im  Endeffekt  dazu  angehalten,  die 
Untersuchungen bzw. die Hypothesen von Natalia Gagarina und Maria Voeikova (2009) zum 
Kasus- und Numeruserwerb mit Hilfe von Korpusarbeit (Baayen 2008) zu überprüfen. In ihrer 
Arbeit ,,The acquisition of case and number in Russian" verfolgen die beiden Autorinnen ein 
dreifaches  Ziel:  a)  die  Erfassung  des  Erwerbs  des  Kasus  und  Numerus  von  Beginn  der 
Substantivproduktion,  b)  das  Aufstellen  der  Entwicklungsphasen  des  Kasus-  und 
Nummeruserwerbs  sowie  der  Marker  für  die  Phasenübergänge  und  c)  die  Erklärung  der 
Mechanismen,  die  für  den  Kasus-  und  Numeruserwerb  verantwortlich  sind 
(Gagarina/Voeikova  2009,  S.  179).  Dabei  beobachteten  sie  vier  monolingual  aufwachsende 
Kinder  aus  Sankt  Petersburg,  ein  Mädchen  und  drei  Jungs.  Entscheidend  für  ihre 
Untersuchung waren die ersten neun Monate ab dem Beginn des Auftretens der ersten Kasus- 
und  Numerusunterscheidungen.
2
  Das  Erfassen  und  Auswerten  dieser  neunmonatigen  Phase 
des Kasus- und Numeruserwerbs hat eine zentrale These bezüglich der Produktivität der drei 
Deklinationsklassen  (DK)  des  Russischen  hervorgebracht:  Die  frühe  Phase  der 
Sprachproduktion  ist  durch  hohe  Produktivität  von  Substantiven  der  1.  (maskuline 
Substantive  ohne  Endung  und  neutrale  Substantive  mit  den  Endungen  -o/-ë/-e)    und  der  2. 
(maskuline und feminine Substantive mit der Endung a) DK gekennzeichnet (Vgl. ebd., S.  
1
Die bis jetzt einflussreichsten drei Theorien sind dabei der Behaviorismus (Vgl. z. B. Bloomfield 1933,
Skinner 1957), der  Kognitivismus (Vgl. z. B. Piaget 1976, Wygotski 1964) und der Nativismus (Vgl. z.
B. Chomsky 1981, 2000). Eine prägnante Zusammenfassung über die Entwicklung sowie die Vor- und
Nachteile dieser drei Sprachtheorien bitten unteranderen Kniffka und Siebert-Ott (2012, S. 32 ff.) an.         
2
Der  Erwerb  von  Kasus  und  Numerus  erfolgte  in  gleichen  Phasen  und  ähnlichem  Tempo,  obwohl  die
Kinder  dabei  auf  verschiedene  Strategien  zurückgriffen  und  die  erste  Kasus-  und
Numerusunterscheidung je nach Kind früher oder später einsetzte.  
2 
188).
3
  Da  sich  Gagarina  und  Voeikova  dem  konstruktivistischen  Ansatz  des  Spracherwerbs 
(Vgl.  dazu  z.  B.  Slobin  1985,  Tomasello  2003)  anschließen,  also  der  Meinung  sind,  dass 
Sprache  keine  angeborene  Fähigkeit  ist,  sondern  sich  erst  aus  der  Notwendigkeit  zu 
kommunizieren entwickelt, führen sie die hohe Produktivität der 1. und 2. DK auf den Input 
zurück  (Vgl.  ebd.,  S.  179).  Demnach  wählen  Kinder  ausgehend  vom  Input  selektiv 
sprachliche Muster aus, mit denen sie schließlich selber agieren. Diese Muster werden aber 
nicht zufällig, sondern auf der Grundlage von aufeinander wirkenden Faktoren wie z. B. die 
Frequenz der auftretender Typen und Tokens, die strukturelle Transparenz, die Auffälligkeit 
des  Musters  usw.  ausgewählt  (Vgl.  ebd.,  S.  180).  So  wurden  die  ersten  fixierten  Fälle  von 
Miniparadigmen  meistenteils  mit  den  in  der  frühen  Phase  der  Sprachproduktion  häufig 
auftretenden  Wortformen  wie  die  Namen  von  Kindern,  die  Bezeichnungen  für    Mama  und  
Papa  sowie ihre  diminutive  Formen,  also  den  Substantiven der  1.  und  2.  DK  verknüpft.  Im 
Gegenteil  dazu  überschritt  das  Auftreten  der  Substantive  der  3.  DK  (feminine  Substantive 
ohne  Endung  mit  Stammauslaut  auf  weichen  Konsonanten  und  auf    weichen  sowie  harten 
Zischlaut  (-j))  in  dieser  frühen  Phase  nicht  mal  3%  (Vgl.  ebd.,  S.  194).  Aus  diesem  Grund 
gehen  die  beiden  Autorinnen  davon  aus,  dass  die  1.  und  2.  DK  produktiv  und  die  3.  DK 
dementsprechend  unproduktiv  ist.  Diese  These  wird  zusätzlich  durch  die  schon  von  Ceitlin 
(2000)  ermittelte  Tendenz  des  frühen  Spracherwerbs  unterstützt,  die  durch  die 
Übergeneralisierung  der  produktiven  Flexionsmarker  auf  die  unproduktiven  geprägt  ist. 
Demnach erwerben die Kinder zunächst die produktiven Flexionsmarker und übertragen bzw. 
übergeneralisieren diese dann auf unproduktive Formen. Durch eine solche Erschaffung von 
neuen  Formen  füllen  Kinder  die  vorhandenen  Lücken  im  eigenen  Sprachsystem  auf.  Diese 
Übergeneralisierungstendenz  wurde  ebenfalls  von  Gagarina  und  Voeikova  fixiert.  Dazu 
führen  sie  folgende  Beispiele  auf:  daj sol-a*  (NOM,  1.  DK)  analog  zu  daj maka  (moloka) 
anstatt daj sol-i (3. DK) oder vesc-a* (NOM, weibliche Endung a der 2. DK) anstatt vesc` (3. 
DK) (Ebd., S. 188).
4
 Diese Beispiele zeigen darüber hinaus, dass die Kinder die untypische 
endungslose  feminine  Form  durchaus  als  solche  erkennen  und  sie  deswegen  durch  eine 
typische  feminine  Endung  a  (NOM)  der  2.  DK  erweitern.  Überspitzt  würde  es  sogar 
bedeuten,  dass  die  2.  DK  in  der  frühen  Phase  der  Sprachproduktion  von  allen  drei  die 
produktivste sein muss. Daraus ergibt sich folgende Rangfolge der Produktivität der drei DK: 
3
Die  Nummerierung  der  Deklinationsklassen  entspricht  in  dieser  Übersetzung  der  theoretischen
Grundlage des Kompendiums des linguistischen Wissens (Schlegel u.a. 1992, S. 129-140) und stimmt
mit der  Nummerierung von Gagarina und Voeikava nicht vollkommen überein.       
4
Bei  der  Transliteration  des  Kyrillischen  wird  in  dieser  Arbeit  auf  die  Kodeks-ISO
Transliterationstabellen  zurückgegriffen,  die  den  aktuellen  wissenschaftlichen  Normen  der
Transliteration des Kyrillischen entspricht (Kempgen 1996-2016).     
3 
Die  2.  DK  ist  die  produktivste.  Die  1.    DK  ist  die  zweitproduktivste.  Die  letzte  DK  ist 
dementsprechend  die  unproduktivste.  Das  Ziel  dieser  Arbeit  besteht  also  vor  allem  darin, 
diese Reihenfolge der Produktivität der drei DK mit Hilfe von Korpusarbeit (Baayen 2008) zu 
überprüfen  und  damit  gleichzeitig  die  Erklärungsansätze  von  Gagarina  und  Voeikova 
bezüglich der frühen Phase der Sprachproduktion entweder zu bestätigen oder zu widerlegen.   
Um  dies  zu  erreichen,  müssen  aber  zuvor  drei  wichtige  Schritte  vollzogen  werden. 
Erstens  muss  auf  den  Begriff  der  Produktivität  näher  eingegangen  werden.  Dies  wird, 
zweitens,  mit  der  Arbeit  am  Korpus  verknüpft  und  dadurch  eine  optimale  Verbindung 
zwischen der Theorie und der Praxis gewährleistet. Um die Einführung in die Korpusarbeit zu 
erleichtern,  wird  dabei  zunächst  auf  die  Daten  des  russischen  eine  Million  Tokens  großen 
Trainingskorpus  (Nacional'nyj  korpus  russkogo  jazyka  2003-2016)  zurückgegriffen.  Dieses 
eignet  sich  hierfür  insbesondere,  weil  es  keine  zusätzlichen  Kodierungen    wie  z.  B.  das 
Abgrenzen der kindlichen Äußerungen verlangt. Anschließend kann, drittens, die Bedeutung 
der Produktivität in der Erstspracherwerbsforschung diskutiert werden. Erst nach dem diese 
drei Schritte ausgeführt wurden und so eine theoretische Basis geschaffen wurde, kann diese 
zur  Nutzung  bei  der  Messung  der  Produktivität  der  drei  DK  herangezogen  werden.  Hierbei 
wird nicht mehr auf den Trainingskorpus, sondern auf den Erstspracherwerbskorpus (Meyer/ 
Stoll  2009)  zurückgegriffen,  sodass  schließlich  eine  authentische  Hypothesenprüfung 
gewährleistet werden kann.     
4 
1. 
Produktivitätsbegriff  
Nicht  anders  als  bei  den  Theorien  der  Spracherwerbsforschung  wurde  für  den  Begriff  der 
Produktivität  bis  jetzt  keine  allgemeingültige  und  ausnahmslos  akzeptierte  Definition 
gefunden.  Diese  Problematik  stellt  Amir  Zeldes  (2013)  in  seiner  Arbeit  ,,Productivity  in 
Argument  Selection:  From  Morphology  to  Syntax"  gekonnt  dar,  indem  er  einen  Überblick 
über  die  Entwicklung  und  die  Vielseitigkeit  der  unterschiedlichen  Definitionsversuche  des 
Produktivitätsbegriffs  verschafft.  Dabei  geht  er  unteranderem  auf  den  modernen  bzw. 
korpuslinguistischen  Produktivitätsbegriff  ein,  der,  wie  schon  mehrfach  angesprochen,  eine 
empirische  Messung  der  Produktivität  bestimmter  sprachlicher  Phänomene  ermöglicht  und 
deswegen im Vordergrund dieser Untersuchung stehen wird. Einer der bekanntesten Vertreter 
des  korpuslinguistischen  Produktivitätsbegriffs  ist  Rolf  Harald  Baayen  (2008,  2009),  der 
aktuell  als  einer  der  international  besten  und  innovativsten  Forscher  auf  dem  Gebiet  der 
Wortschatzforschung  und  der  quantitativen  Linguistik  gilt.  Darüber  hinaus  war  er  einer  der 
ersten Linguisten, der die Vorteile der computergestützten und empirischen Sprachforschung 
erkannte.  Insbesondere  aus  diesem  Grund  lohnt  es  sich  im  Zusammenhang  mit  der 
korpuslinguistischen Arbeit auf den Produktivitätsbegriff nach Baayen näher einzugehen.     
1.1.  Produktivität bei Baayen 
Baayen unterscheidet zwischen drei Arten der Produktivität: ,,realized productivity" (Baayen 
2009,  S.  901),  ,,expanding  productivity"  (Ebd.,  S.  902)  und  ,,potential  productivity"  (Ebd.). 
Unter der ,,realized productivity" ist dabei die Zahl der relevanten Typen
5
 zu verstehen. Die 
,,expanding productivity" erfasst die Zahl der relevanten Typen, die nur einmal vorkommen. 
Diese  werden  darüber  hinaus  als    ,,hapax  legomena"  (Ebd.)  bezeichnet.  Die  ,,potential 
productivity"  bezieht  sich  auch  auf  die  Zahl  der  relevanten  Typen,  die  nur  einmal 
vorkommen. Diese werden aber auf die Größe des Korpus relativiert (Tokenzahl). Demnach 
kommt der expandierenden  und der potenziellen Produktivität eine höhere Bedeutung zu, da 
die  erste  die  gegenwärtige  Produktivität  und  die  zweite  die  Wahrscheinlichkeit  der 
Neubildungen  bzw.  das  Potenzial  zur  Bildung  neuer  Wörter  einschätzen.  Um  den 
5
,,In  der  strukturalen  Linguistik  dienen  die  Begriffe  [Token  und  Types]  zur  Unterscheidung  zwischen
konkreten sprachlichen Äußerungen (Token) und abstrakten Einheiten der Metaebene (Types), die sie
repräsentieren" 
(Wikipedia. 
Die 
freie 
Enzyklopädie). 
Online 
im 
Internet:
https://de.wikipedia.org/wiki/Token_und_Type (Abruf am 02.05.2016).  
5 
Produktivitätsgrad  der  jeweiligen  Produktivität  zu  errechnen,  entwickelt  Baayen  zwei 
mathematische Formel:  
Expandierende Produktivität (Ebd.):  
P*= V(1, C, N) / V(1, N)  
Potentielle Produktivität (Ebd.): 
P= V(1, C, N) / N(C)   
Um  die  jeweiligen  Größen  der  Formeln  verstehen  und  ermitteln  zu  können,  soll  nun 
schrittweise  sowohl  die  Variablen  der  Formeln,  als  auch  parallel  die  Arbeit    am  russischen 
eine  Million  Tokens  großen  Trainingskorpus  (Nacional'nyj  korpus  russkogo  jazyka  2003-
2016) erläutert werden.     
1. Schritt: 
Korpus einlesen:  
> ru <-read.table(file.choose(), quote='\"',sep="\t",header=T,as.is=T) 
2. Schritt: 
Kodierung für Russisch:  
> Sys.setlocale ("LC_ALL","Russian_Russia.1251") 
3. Schritt: 
Variablen der mathematischen Formel definieren und ermitteln:  
N: Zahl der Tokens im Korpus 
  alle möglichen Tokens des Korpus ermitteln  
> nrow(ru)  
# 1228881 
N(C): Zahl der Tokens einer Kategorie C
  eine  Kategorie  C  definieren,  indem  man  den  String  mit  einem 
Suchmuster abgleicht   
  gesucht  ist  die  2.  DK
6
,  die  sich  nur  auf  weibliche  und  männliche 
Substantive mit der Endung a begrenzt  
> DK2a_S<-ru[(grepl('$', ru$lem) & ru$pos=="S"),] 
> nrow(DK2a_S) 
# 61383 
V: Zahl der Typen (V1: Zahl der hapax legomina)  
  alle möglichen Typen des Korpus als Faktoren ermitteln  
> lemlevel <-levels(as.factor(ru$lem)) 
> length(lemlevel) 
# 51027 
V(C, N): Zahl der Typen einer Kategorie in einem Korpus mit N Tokens 
  die Zahl der Typen nur auf eine Kategorie eingrenzen 
  gesucht sind erneut alle Typen der zweiten Deklinationsklasse   
> length(unique(as.factor(DK2a_S$lem))) 
# 4718 
6
Die  2.  DK  wurde  deswegen  zur  Erläuterung  ausgewählt,  weil  sich  das  Suchmuster  für  diese  im
Vergleich zu den anderen zwei DK am einfachsten definieren lässt.       
6 
4. Schritt: 
Mit den ermittelten Werten die expandierende und die potenzielle  
Produktivität errechnen:   
P* 
> 4718 / 51027 
P 
> 4718 / 61383 
# 0.09246085   
# 0.07686167  
5. Schritt: 
Ergebnisse interpretieren:  
Es ist eher problematisch nur anhand dieser beiden Werte eine annehmbare Aussage über die 
Produktivität der 2. DK zu treffen. Erstens handelt es sich hierbei um sogenannte -Werte, die 
sich  nur  auf  eine  bestimmte  Stelle  der  Produktivitätskurve,  auf  die  später  ausführlich 
eingegangen  wird,  begrenzen  und  somit  lediglich  die  Steigung  dieser  Stelle  beschreiben. 
Zweitens  können  diese  beiden  Werte  überhaupt  nicht  miteinander  verglichen  werden.  Erst 
dann,  wenn  man  zusätzliche  -Werte  z.  B.  der  1.  und  3.  DK  ermittelt  würde,  könnte    man 
diese mit der 2. DK verglichen und dadurch akzeptable Aussagen bezüglich der Produktivität 
aller DK treffen. Dabei wäre man aber immer darauf angewiesen, die ermittelten Ergebnisse 
in Verhältnis zu anderen Werten zu setzten und so die produktivste DK zu ermitteln. Stefan 
Evert und Anke Lüdeling (2001) bieten in diesem Zusammenhang eine geschicktere Lösung 
an. Mit Hilfe vom Typ-Token-Verhältnis (V
c
(C, N(C)): Typenzahl einer Kategorie C in N(C) 
Tokens)  lässt  sich  nämlich  eine  ,,vocabulary  growth  curve"  (Evert/Lüdeling  2001,  S.  168) 
abbilden, die durch ihren Verlauf die Produktivität oder die Unproduktivität einer Kategorie 
anzeigt.  Bei  der  beständigen  Token-Anzahl  wird  dabei  die  Anzahl  der  Typen  gezählt  (Vgl. 
ebd.). Wenn dadurch eine abflachende Kurve entsteht, ist das sprachliche Muster unproduktiv. 
Eine  kontinuierlich  steigende  Kurve  steht  dagegen  für  ein  produktives  sprachliches  Muster. 
Ein  idealtypischer  Verlauf  der  Kurven  sieht  nach  Evert  und  Lüdeling  also  folgendermaßen 
aus (Ebd.):   
7 
Um solche Vokabularwachstumskurve (VGC) modellieren zu können, muss man  
a)   zipfR installieren und mit library(zipfR) laden: 
  mit Hilfe des Zipfschen Gesetzes (
z 
=C / z )
7
 werden die Ergebnisse, 
also die Auftrittswahrscheinlichkeit eines Items 
z   
und dessen Rang z 
(beide  ergeben  zus.  1  (z.  Bsp.    *  4)),  durch  die  normalisierende 
Konstante (C) modifiziert und so die VGC angepasst  
b)  VGC modellieren: 
> DK2a_S.spc <- vec2spc(DK2a_S$lem) 
> DK2a_S.lnre.fzm <- lnre("fzm", DK2a_S.spc) 
> DK2a_S.int.vgc <- lnre.vgc(DK2a_S.lnre.fzm, seq(0, N(DK2a_S.lnre.fzm)), m.max=3) 
c)  VGC plotten bzw. anzeigen lassen:   
> plot(DK2a_S.int.vgc)  
Laut  der obigen Abbildung der idealverlaufenden VGC kann also ohne Zweifel festgehalten 
werden, dass die 2.  DK  des Russischen produktiv ist.  
Natürlich  dürfen  diese  Ergebnisse  aber  nicht  unkritisch  betrachtet  werden.  Erstens  sind 
sowohl die expandierende, als auch die potenzielle Produktivität sehr stark von der Größe des 
Korpus abhängig, auch wenn man es auf die Zahl der Tokens relativiert (Vgl. Baayen 2008, S. 
223).  Zweitens  spielt  ebenso  die  relative  Häufigkeit  der  im  Korpus  vorkommenden  Tokens 
einer  Kategorie  C  (f(C)=N(C)  /  N    f(DK2a_S)=  61383  /  1228881=  0.04995032),  die  nur 
7
Das  Zipfsche  Gesetz,  das  nach  George  Kingsley  Zipf,  der  dieses  Gesetz  in  den  1930er  Jahren
aufstellte,  benannt  wurde,  ,,ist  ein  Modell,  mit  dessen  Hilfe  man  bei  bestimmten  Größen,  die  in  eine
Rangfolge  gebracht  werden,  deren  Wert  aus  ihrem  Rang  abschätzen  kann"  (Wikipedia.  Die  freie
Enzyklopädie).  Online  im  Internet:  https://de.wikipedia.org/wiki/Zipfsches_Gesetz  (Abruf  am
02.05.2016).    
Details
- Seiten
- Erscheinungsform
- Originalausgabe
- Erscheinungsjahr
- 2015
- ISBN (PDF)
- 9783961161096
- ISBN (Paperback)
- 9783961166091
- Dateigröße
- 440 KB
- Sprache
- Deutsch
- Institution / Hochschule
- Humboldt-Universität zu Berlin – Institut für Slawistik
- Erscheinungsdatum
- 2017 (April)
- Note
- 1,0
- Schlagworte
- Erstspracherwerb Messung der Produktivität Korpus Deklinationsklassen Produktivitätsbegriff Produktivität nach Baayen Linguistik Produktivitätskurven
- Produktsicherheit
- Diplom.de
 
					