• Keine Ergebnisse gefunden

Vergleich der individuellen Verläufe mit den Altersgruppen 151

6.3 Individuelle Unterschiede in den Altersgruppen

6.3.4 Vergleich der individuellen Verläufe mit den Altersgruppen 151

Nach den bisherigen Analysen der vorliegenden Daten wird ersichtlicht, dass die Daten aus Abschnitt 6.2 nicht ohne Weiteres vergleichbar sind mit den Ergebnissen aus Abschnitt 6.3. Sieht man sich die Verteilung der Wortarten

7Ausgenommen sind an dieser Stelle die Personalpronomen (PPER), die, wie oben erläutert, nie einen bestimmten Type-Anteil überschreiten können.

POS-Tag Tokens prozentual % Types prozentual %

ADJ 34 2,3 18 5,8

ADV+PAV 213 14,3 40 12,9

APPR 66 4,4 11 3,5

ART 137 9,2 3 1,0

CARD 25 1,7 15 4,8

ITJ 5 0,3 3 1,0

KON 77 5,2 7 2,3

N 159 10,7 81 26,0

PIDATS 84 5,7 14 4,5

PPER 161 10,8 7 2,3

PPOS 26 1,7 2 0,6

PREL 7 0,5 4 1,3

PTK 123 8,3 29 9,3

PW 15 1,0 6 1,9

VA 30 2,0 2 0,6

VM 51 3,4 5 1,6

VV 256 17,2 63 20,3

XY 17 1,1 1 0,3

1486 311

Tabelle 6.10: LUA: Verteilung der Types, gruppiert, 1496 bis 1708

aller Kinder insgesamt in den jeweiligen Altersgruppen an, so können starke Abweichungen bei einzelnen Kindern in den Altersgruppen verzeichnet werden. Eine plausible Erklärung dafür sind individuelle Unterschiede im Wortgebrauch, insbesondere in der Verwendung verschiedener Nomen.

Zudem weisen die Kinder als Individuum voneinander abweichende Type-Token-Ratios auf. Die Verwendung verschiedender Wörter ist also individuell sehr unterschiedlich. Betrachtet man nun die Daten aller Kinder einer Altersgruppe zusammenhängend und ermittelt eine Type-Token-Ratio sowie eine Verteilung der Wortarten, dann kommt es zu einer starken Vermischung der individuellen Besonderheiten. Im Folgenden soll dies an einem Beispiel illustriert und im Hinblick auf Tabelle 6.3 die Ergebnisse für die Gruppe 1496 bis 1708 betrachtet werden. In dieser Gruppe befinden sich vier analysierbare Kinder (AV, LEO, LUA und MK). Für einen einfachen Vergleich soll das prozentuale Vorkommen der Nomen (N) und Verben (VA, VM, VV) herangezogen werden. Tabelle 6.3 zeigt, dass Nomen mit einer Häufigkeit von 7,7% (40,5% Types) und Verben mit einer Häufigkeit von 21,4% (22,6% Types) in Gruppe 1496_1708 vorkommen. Hier wurden alle vier Kinder berücksichtigt, unabhängig von der Gesamtanzahl ihrer Tokens oder Types und unabhängig von der individuellen Type-Token-Ratio. Die Type-Token-Ratio in der Gruppe 1496 bis 1708 betrug übrigens ca. 0,10.

Eine Betrachtung der Verteilung der Wortarten und insbesondere das

POS-Tag Tokens prozentual % Types prozentual %

ADJ 325 3,7 90 11,1

ADV+PAV 1603 18,4 91 11,3

APPR 309 3,5 20 2,5

ART 763 8,8 3 0,4

CARD 125 1,4 13 1,6

FM 2 0 2 0,2

ITJ 29 0,3 8 1,0

KON 648 7,4 17 2,1

N 586 6,7 283 35,0

PIDATS 428 4,9 21 2,6

PPER 912 10,5 7 0,9

PPOS 72 0,8 5 0,6

PREL 42 0,5 7 0,9

PTK 810 9,3 50 6,2

PW 120 1,4 6 0,7

VA 93 1,1 3 0,4

VM 305 3,5 7 0,9

VV 1422 16,3 174 21,5

XY 112 1,3 1 0,1

8706 808

Tabelle 6.11: MK: Verteilung der Types, gruppiert, 1496 bis 1708

Vorkommen von Nomen und Verben (bezogen auf die Types) bei jedem Kind separat liefert folgende Ergebnisse:

• AV: Nomen 24,7%, Verben 24,3%

• LEO: Nomen 27,5%, Verben 23,7%

• LUA: Nomen 26,0%, Verben 22,5%

• MK: Nomen 35,0%, Verben 22,8%

Diese Daten entsprechen annähernd den Ergebnissen, die in bisherigen Untersuchungen diesbezüglich gefunden wurden, wenn auch der Anteil der Nomen relativ hoch ist. Es wurde bereits erwähnt, dass ähnliche Resultate in Untersuchungen von Kauschke (1999, 2000, 2007) zu finden sind.

Demzufolge weisen Kinder im Alter von 3 Jahren einen Anteil von 16%

Nomen und 23% Verben auf (bezogen auf die Types) ([Kauschke (1999)];

[Kauschke (2000)]; [Kauschke (2007)]). Der recht hohe Anteil an Nomen in der vorliegenden Arbeit kann zunächst nicht erklärt werden, es sollen jedoch in Abschnitt 6.4 einige Erklärungsansätze folgen. Ferner soll an dieser Stelle ein Blick auf die Daten von MK geworfen werden, insbesondere auf die Nomen.

Zusätzlich sollen die von MK geäußerten Nomen im Zeitraum 1281_1495 hinzugezogen werden, um herauszufinden, ob der hohe Nomenanteil

POS-Tag Tokens prozentual % Types prozentual %

ADJ 4 1,9 3 3,4

ADV+PAV 22 10,6 9 10,1

APPR 13 6,3 7 7,9

ART 15 7,2 3 3,4

CARD 3 1,4 2 2,2

KON 15 7,2 4 4,5

N 22 10,6 16 18,0

PIDATS 4 1,9 3 3,4

PPER 36 17,3 4 4,5

PPOS 2 1,0 2 2,2

PTK 14 6,7 6 6,7

PW 6 2,9 4 4,5

VA 6 2,9 2 2,2

VM 10 4,8 3 3,4

VV 34 16,3 20 22,5

XY 2 1,0 1 1,1

208 89

Tabelle 6.12: AV: Verteilung der Types, gruppiert, 1709 bis 1983

von 35,0% personenabhängig ist (Daten aus Gruppe 1709_1983 zu MK liegen nicht vor). Ein erster Blick lässt vermuten, dass es sich nicht um die Eigenheiten einer Person handelt, denn im Zeitraum 1281_1495 machten Nomen (N) einen Anteil von 8,7% aller von MK geäußerten Tokens aus, wovon 27,1% Types waren. In der unten stehenden Übersicht sind alle von MK geäußerten Nomen in zwei Zeiträumen aufgeführt, geordnet nach Alphabet und versehen mit der Anzahl ihres Vorkommen.

Nomen von MK im Zeitraum 1281_1495: auto (6), bahn (2), bauch (3), bauernhof (2), baumspitze (1), baustein (1), baustelle (1), bettchen (1), boden (2), bogen (1), brot (1), bruder (2), burg (1), butzemann (2), drachentier (1) edelstein (3), ei (1), eingang (1), elefant (1), eltern (3), erzieher (1), essen (1), feuer (1), freund (2), garten (1), geburtstag (1), gefängnis (2), geld (2), glas (1), gold (2), happs (1), haufen (1), haus (1), hause (2), idee (3), igel (1), jahr (2), kakaopulver (1), kanone (2), karte (5), ketchup (1), kette (1), kind (4), kindergarten (4), kissen (1), kontrolle (1), krach (1), kraftwerk (3), kralle (1), leiter (1), mai (1), mal (1), mama (2), mensa (1), mensch (4), milch (1), minute (2), müllauto (2), murmel (2), mutter (1), papa (4), pfeil (1), pferd (2), räuber (6), räuberkind (6), rauchen (1), regenbogen (1), richtungswechsel (2), ritterburg (5), sache (2), sandkasten (1), schachtel (1), schatz (4), schippe (2), schmetterling (1), schraube (1), schuld (1), schwester (1), schwimmbad (1), schwimmbecken (1), schwimmerbecken (2), schwimmhalle (1),

POS-Tag Tokens prozentual % Types prozentual %

ADJ 35 6,2 13 7,8

ADV+PAV 69 12,2 24 14,5

APPR 9 1,6 5 3,0

ART 47 8,3 2 1,2

CARD 20 3,5 9 5,4

ITJ 11 1,9 4 2,4

KON 21 3,7 5 3,0

N 46 8,1 30 18,1

PIDATS 31 5,5 11 6,6

PPER 73 12,9 4 2,4

PPOS 1 0,2 1 0,6

PREL 1 0,2 1 0,6

PTK 57 10,1 14 8,4

PW 8 1,4 5 3,0

VA 7 1,2 1 0,6

VM 28 4,9 4 2,4

VV 89 15,7 32 19,3

XY 14 2,5 1 0,6

567 166

Tabelle 6.13: JK: Verteilung der Types, gruppiert, 1709 bis 1983

soldat (1), spielzeugtag (1), stapel (1), stein (1), strafkarte (2), sturm (2), tiger (1), tobeland (3), toilette (1), tor (1), trampolin (1), turm (8), uno (14), vater (1), verwandte (1), vorschüler (1), wasser (1), wolf (3) zahl (2), zaun (1), zigarette (1)

Nomen von MK im Zeitraum 1496_1708: abfluss (1), affe (1), afrika (1), anfang (6), anführer (1), angreifer (1), angst (1), aquarium (2), ärger (2), aussetzer (2), auto (4), baby (3), babyseerobbe (1), backe (1), ball (4), banane (1), bauernhof (1), becken (1), beispiel (9), benzin (2), beschützer (2), bild (1), blatt (2), blume (4), brett (1), bruder (1), buch (2), bücherregal (1), clown (1), dach (1), delfinmama (1), ding (1), dino (1), dinomama (1), dinowelt (2), drachen (2), ecke (1), edelstein (2), ei (1), eisenbahn (1), eltern (1), ende (2), erzieherin (1), farbe (3), feder (2), feinlöwe (1), feld (1), fell (4), fernbedienung (2), fernsehturm (1), feuer (10), feuerwehrauto (1), figur (4), film (1), fisch (4), fleisch (1), flieger (1), flur (1), freund (2), frisbee (2), frühling (1), frühlingsfell (2), fuß (1), fußball (10), fußballer (1), gans (1), gebiet (1), geburtstag (2), geld (1), geschichte (1), giftgurke (1), glatze (1), gleichgewicht (2), grütze (1), gurke (1), haar (3), haken (1), hand (2), haufen (2), haus (2), hause (19), helflöwe (1), herz (1), hexe (1), hilfe (1), hinweis (1), hof (4), höhe (1), höhle (1), holz (1), hose (1), hubschrauber (2), hut (2),

POS-Tag Tokens prozentual % Types prozentual %

ADJ 94 4,0 44 8,5

ADV+PAV 343 14,4 72 13,9

APPR 98 4,1 14 2,7

ART 183 7,7 3 0,6

CARD 83 3,5 13 2,5

ITJ 20 0,8 13 2,5

KON 171 7,2 13 2,5

N 237 10,0 146 28,2

PIDATS 88 3,7 15 2,9

PPER 294 12,4 7 1,4

PPOS 23 1,0 5 1,0

PREL 13 0,5 5 1,0

PTK 175 7,4 39 7,5

PW 25 1,1 5 1,0

VA 46 1,9 3 0,6

VM 86 3,6 7 1,4

VV 371 15,6 110 21,2

XY 28 1,2 3 0,6

2378 517

Tabelle 6.14: JS: Verteilung der Types, gruppiert, 1709 bis 1983

idee (1), imbiss (1), jagd (1), jahr (1), kanone (1), käpt_n (2), karte (4), käse (3), käsekugel (1), käsewurst (1), kasten (1), katze (1), ketchup (1), kind (1), kindergarten (2), kino (1), klappe (1), klebeding (1), klebstoff (1), kleid (2), knopf (1), knoten (1), kopf (3), körbchen (1), kralle (1), kreuz (11), krieg (8), kriegsstürmer (3), küche (1), küken (1), länge (1), laser (11), leinenstoff (1), leiter (1), leuchtturm (1), linie (1), loch (2), löwe (3), lust (1), lutscher (1), mal (5), mama (2), mannschaft (5), maske (1), mauer (1), memo (1), memory (5), mensch (6), mikrofon (1), mitte (3), montag (1), morgenkreis (1), muschel (1), nemofischchen (1), nummer (1), oma (1), opa (1), ordner (1), osterei (1), papa (6), papier (1), papierrolle (2), pfannkuchen (1), pferdekutsche (1), pirat (1), piratenschiff (1), piratenspiel (1), pistole (4), plan (3), platz (1), polizei (1), punkt (4), quatsch (1), rabe (1), rad (3), rand (1), reh (1), reihe (1), richtungswechsel (4), riesenstapel (3), ritze (1), ruhe (3), runde (6), rutsche (2), salzbrezel (1), schere (2), schießgerät (1), schiff (3), schlafen (1), schnabel (1), schnee (2), schneeballschlacht (1), schraube (1), schritt (2), schuld (3), schule (1), schwein (1), schwester (3), schwimmhalle (1), schwimmkurs (1), see (1), seerobbe (2), seil (3), seite (3), senf (1), sohle (1), sommer (1), spatzenkino (1), spiegel (1), spiel (8), spielsachen (1), spielzeug (2), spinner (1), spirale (1), spitze (1), spree (1), stabheuschrecke (2), stadion (1), stapel (3), stern (3), stift (3), stock (1), straße (1), streifen (1), strich

POS-Tag Tokens prozentual % Types prozentual %

ADJ 50 4,5 19 8,3

ADV+PAV 186 16,6 34 14,8

APPR 19 1,7 7 3,1

ART 66 5,9 3 1,3

CARD 46 4,1 9 3,9

ITJ 5 0,4 5 2,2

KON 58 5,2 8 3,5

N 66 5,9 43 18,8

PIDATS 45 4,0 12 5,2

PPER 154 13,7 6 2,6

PPOS 8 0,7 2 0,9

PREL 3 0,3 3 1,3

PTK 121 10,8 25 10,9

PW 15 1,3 4 1,7

VA 7 0,6 1 0,4

VM 50 4,5 7 3,1

VV 207 18,4 40 17,5

XY 16 1,4 1 0,4

1122 229

Tabelle 6.15: LAR: Verteilung der Types, gruppiert, 1709 bis 1983

(4), stunde (1), tank (4), tankwasser (1), tante (1), teil (1), tier (1), tisch (2), tischspiel (1), tor (1), totenkopf (2), training (3), tuch (1), tür (1), turm (1), uboot (1), uhr (1), uno (18), verstecke (1), vogel (8), vogelhäuschen (1), vogelnest (1), vorschau (1), waage (3), wachtmeister (1), waffe (2), wärme (4), wasser (1), weg (1), welt (1), winter (10), winterfell (1), wochenende (1), wohnung (2), wolke (2), wünscher (3), würfel (5), wüste (1), zahn (1), zauber (2), zauberfeuer (1), zauberlaser (1), zauberstab (4), zeichen (1), zeit (1), zoo (1), zoowärter (2)

Anhand der vorliegenden Inhalte kann zunächst nur schwer ein Grund für die hohe Type-Anzahl im Zeitraum 1496_1708 ausgemacht werden. Einige Lemmata treten mit einer leicht erhöhten Häufigkeit auf, wie zum Beispiel Feuer (10), Fußball (10), Hause (19), Kreuz (11), Krieg (8), Spiel (8), Uno (18), Winter (10). Diese Nomen kommen zwar zum Teil auch im Zeitraum 1281_1495 vor, jedoch selten derart häufig. Es fällt zudem auf, dass viele der sehr häufig auftretenden Nomen (aber auch seltener geäußerte) in einer Spielsituation geäußert wurden. Dies lässt ein Blick in die entsprechenden EXMARaLDA-Dateien sowie in die entsprechenden Kontextbeschreibungen vermuten. Man könnte nun annehmen, dass sich der Type-Anteil mit einem steigenden Token-Anteil aller Wörter ebenso erhöht und bei den meisten hier untersuchten Kindern ist dies auch der Fall. Es gibt jedoch Ausnahmen, die

POS-Tag Tokens prozentual % Types prozentual %

ADJ 10 5,3 9 8,3

ADV+PAV 22 11,6 14 12,8

APPR 12 6,3 5 4,6

ART 15 7,9 3 2,8

CARD 5 2,6 3 2,8

KON 15 7,9 4 3,7

N 30 15,9 25 22,9

PIDATS 5 2,6 4 3,7

PPER 20 10,6 5 4,6

PPOS 3 1,6 3 2,8

PREL 1 0,5 1 0,9

PTK 5 2,6 5 4,6

PW 1 0,5 1 0,9

VA 6 3,2 2 1,8

VM 3 1,6 3 2,8

VV 33 17,5 21 19,3

XY 3 1,6 1 0,9

189 109

Tabelle 6.16: LEO: Verteilung der Types, gruppiert, 1709 bis 1983

diese These wieder ins Wanken bringen. So weist LL in Gruppe 1709_1983 einen recht hohen Nomenanteil (N) von 30,7% bezüglich der Types auf bei nur 1175 geäußerten Nomen. In Relation zur Gesamtanzahl der geäußerten Wörter weist kein anderes Kind einen derart hohen Type-Anteil auf. Dennoch können anhand der vorliegenden Daten keine Zusammenhänge zwischen Tokenanzahl, Alter der Kinder, Geschlecht und dem Type-Anteil bezüglich der Nomen hergestellt werden. Bestenfalls ist eine leichte Tendenz zu erkennen, nach der der Type-Anteil mit zunehmendem Alter abnimmt. Vielmehr macht es jedoch den Anschein, dass die unterschiedlichen Nomenanteile an verschiedene Situationen gebunden sind, was in Abschnitt 6.4 näher betrachtet werden soll.

Interessant ist zudem ein Vergleich mit sehr altem Datenmaterial von Templin (1957). Sie untersuchte bereits im Jahre 1957 die Struktur des Wortschatzes bei 480 Kindern im Alter von 3 bis 8 Jahren, indem sie die den aktiven Wortschatz testete. Dazu wurde zum einen die Anzahl der Types in 50 Äußerungen betrachtet und zum anderen die Leistungen in Lautunterscheidungstests überprüft ([Templin (1957)], S. 30-33; siehe auch [Kegel (1987)], S. 57). Templin verwendete neun Wortklassen und eine gemischte Klasse. Zu den neun Wortklassen zählten Substantive, Verben, Adjektive, Adverbien, Pronomen, Konjunktionen, Präpositionen, Artikel, Interjektionen. Die gemischte Klasse enthielt u. a. Eigennamen,

POS-Tag Tokens prozentual % Types prozentual %

ADJ 39 3,3 16 5,3

ADV+PAV 107 9,1 33 11,0

APPR 34 2,9 10 3,3

ART 69 5,9 3 1,0

CARD 46 3,9 7 2,3

FM 6 0,5 2 0,7

ITJ 17 1,4 7 2,3

KON 51 4,3 7 2,3

N 161 13,7 92 30,7

PIDATS 37 3,1 12 4,0

PPER 157 13,4 6 2,0

PPOS 18 1,5 3 1,0

PREL 3 0,3 2 0,7

PTK 125 10,6 28 9,3

PW 11 0,9 4 1,3

VA 22 1,9 3 1,0

VM 28 2,4 5 1,7

VV 224 19,1 57 19,0

XY 20 1,7 3 1,0

1175 300

Tabelle 6.17: LL: Verteilung der Types, gruppiert, 1709 bis 1983

unverständliche Ausdrücke etc.8 Templin kam zu folgenden Ergebnissen in Bezug auf das Vorkommen der Nomen und Verben (hinsichtlich der Types):

• 3 Jahre: 25,5% Nomen, 23,4% Verben

• 3;5 Jahre: 23,8% Nomen, 24,1% Verben

• 4 Jahre: 24,2% Nomen, 24,0% Verben

• 4;5 Jahre: 25% Nomen, 23,3% Verben

• 5 Jahre: 23,7% Nomen, 23,9% Verben ([Templin (1957)], S. 101).

Ferner setze bereits mit 3 Jahren eine Stabilisierung der Wortklassenverteilung ein, wobei nur schwache Alterstrends zu beobachten sind ([Templin (1957)]).

Dem kann in Anlehnung an die Ergebnisse der vorliegenden Arbeit nur entsprochen werden. Noch erstaunlicher ist allerdings das recht ähnliche Ergebnis in der Verteilung der Wortarten Nomen und Verb zu jenem der vorliegenden Arbeit. Sowohl in den Daten Templins (1957) als auch in den Daten der vorliegenden Arbeit tauchen Nomen und Verben mit einer Häufigkeit

8In dieser Arbeit gibt es für Eigennamen sowie für unverständliche Ausdrücke eigene Kategorien, NE und XY. Da es sich angesichts der Datenlage nur um recht wenige Tokens innerhalb der Kategorie NE handelt, soll trotzdem ein kurzer Vergleich mit Templins Ergebnissen vorgenommen werden.

POS-Tag Tokens prozentual % Types prozentual %

ADJ 21 5,4 17 10,5

ADV+PAV 56 14,3 27 16,7

APPR 21 5,4 7 4,3

ART 21 5,4 3 1,9

KON 25 6,4 4 2,5

N 39 10,0 27 16,7

PIDATS 15 3,8 7 4,3

PPER 49 12,5 6 3,7

PPOS 11 2,8 2 1,2

PREL 2 0,5 2 1,2

PTK 35 9,0 13 8,0

PW 7 1,8 4 2,5

VA 2 0,5 2 1,2

VM 16 4,1 6 3,7

VV 69 17,6 34 20,9

XY 2 0,5 1 0,6

391 162

Tabelle 6.18: LUA: Verteilung der Types, gruppiert, 1709 bis 1983

von je ca. 25% auf, unabhängig vom Alter (bzw. nach dem dritten Lebensjahr).

Zwar gibt es einige Ausnahmen, wie z. B. MK mit 35,0% Nomen, doch können derart hohe Werte bei einer Analyse der tatsächlich geäußerten Wörter vermutlich mit der Verwendung vieler verschiedener Nomen in bestimmten Situationen, wie Spielsituationen, erklärt werden (siehe auch Abschnitt 6.4). Laut Templin (1957) stellen die ermittelten Werte eine beträchtliche Überlegenheit von Kindern aus der oberen Mittelschicht gegenüber Kindern aus unteren Schichten dar. Vor allem in Anbetracht der Tatsache, dass die hier untersuchten Kinder aus einem akademischen Umfeld kommen, kann angenommen werden, dass die hier ermittelten Werte mit den Daten von Templin vergleichbar sind. Sie lassen zudem vermuten, dass die Verteilung der Wortarten ab 3 Jahren recht stabil ist (siehe auch [Oksaar (1997)]). Es kann trotzdem noch nicht eindeutig gesagt werden, ob die Ergebnisse dem entsprechen, was Kauschke (1999) postulierte, nämlich:

„Nomen sind von Anfang an vorhanden und wachsen insbesondere während des zweiten Lebensjahres an. [...] Mit drei Jahren verwendet kein Kind mehr als 25% Nomen.“ ([Kauschke (1999)], S.

144) und

„Mit 15 Monaten tauchen erstmals Verben auf, die dann erheblich ansteigen und mit 3 Jahren den stärksten Anteil am Lexikon ausmachen. ([Kauschke (1999)], S. 145)

POS-Tag Tokens prozentual % Types prozentual %

ADJ 193 4,8 42 8,0

ADV+PAV 513 12,7 64 12,2

APPR 114 2,8 14 2,7

ART 278 6,9 3 0,6

CARD 100 2,5 13 2,5

ITJ 16 0,4 6 1,1

KON 229 5,7 12 2,3

N 504 12,5 160 30,6

PIDATS 167 4,2 20 3,8

PPER 492 12,2 7 1,3

PPOS 44 1,1 4 0,8

PREL 14 0,3 6 1,1

PTK 397 9,9 46 8,8

PW 45 1,1 6 1,1

VA 42 1,0 3 0,6

VM 159 3,9 6 1,1

VV 677 16,8 110 21,0

XY 44 1,1 1 0,2

4028 523

Tabelle 6.19: MM: Verteilung der Types, gruppiert, 1709 bis 1983

Die erste Aussage trifft nicht zu, was die Ergebnisse dieser Arbeit zumindest hinsichtlich des Vorkommens der Types anbelangt. Allerdings können die Ergebnisse nicht exakt verglichen werden, da jeweils andere Methoden verwendet wurden. Unzutreffend ist an dieser Stelle auch die zweite Aussage, nämlich, dass Verben mit 3 Jahren den stärksten Anteil am Lexikon ausmachen. Vielmehr nehmen die Verben neben den Nomen sowohl hier als auch in Templins Ergebnissen einen großen Anteil am Lexikon bei Kindern im Vorschulalter ein (ca. 25% Nomen und ca. 22% bis 25% Verben) ([Templin (1957)], S. 101).

Weiterhin fällt auf, dass die Anteile der Adverbien (ADV+PAV) und Partikeln (PTK) durchgehend recht hoch sind. Selbstverständlich ist es nicht leicht, Resultate aus Studien mit jüngeren Kindern (z. B. [Szagun (2008)];

[Kauschke (1999)]; [Kauschke (2007)]), bei denen beispielweise der Anteil der Funktionswörter recht hoch ist, zu vergleichen, da die Klassifikation der Wortarten eine andere sein könnte. Folglich ist der Anteil der Funktionswörter bei den hier untersuchten Kindern im Alter von 3;5 bis 5;5 Jahren noch immer hoch, wenn man die entsprechenden Klassen der Funktionswörter zusammenfasst. Nichtsdestotrotz ist das Vorkommen der Adverbien prägnant, was auf eine Veränderung in der Struktur des Wortschatzes hinweisen könnte. Insgesamt wird deutlich, dass für eine Annäherung an die Komposition des Lexikons bezüglich der Verteilung der Wortarten

POS-Tag Tokens prozentual % Types prozentual %

ADJ 33 4,4 22 8,5

ADV+PAV 76 10,1 33 12,7

APPR 33 4,4 10 3,8

ART 73 9,7 3 1,2

CARD 18 2,4 11 4,2

FM 2 0,3 2 0,8

ITJ 2 0,3 2 0,8

KON 30 4,0 6 2,3

N 95 12,6 61 23,6

PIDATS 32 4,2 8 3,1

PPER 88 11,7 5 1,9

PPOS 12 1,6 2 0,8

PREL 1 0,1 1 0,4

PTK 73 9,7 23 8,8

PW 12 1,6 5 1,9

VA 21 2,8 3 1,2

VM 19 2,5 5 1,9

VV 128 17,0 56 21,6

XY 6 0,8 1 0,4

754 259

Tabelle 6.20: RD: Verteilung der Types, gruppiert, 1709 bis 1983

eher die Daten der einzelnen Kinder in den jeweiligen Altersgruppen herangezogen werden sollten, da diese aussagekräftiger sind. Bei der Auswertung der gesamten Token-Anzahl in einer Altersgruppe, die mehrere Sprecher/innen umfasst, kommt es durch die individuellen Unterschiede zu recht uneinheitlichen Ergebnissen. Der Versuch, die Lemmata je Gruppe allgemein auszuwerten, wurde trotzdem unternommen, um eine Annäherung an die allgemeine Struktur des Wortschatzes bei Kindern im Vorschulalter zu gewinnen. Versuche dieser Art gibt es einige und viele scheiterten an der Individualität des Wortschatzes sowie der spezifischen Wortartenverteilung der Probandinnen und Probanden. Bereits Kegel (1987) versuchte sich diesem Problem zu nähern. Er differenzierte zunächst die Erforschung des aktiven und des passiven Wortschatzes. Demnach wurde der aktive Wortschatz bisher vor allem durch Experimente zu erforschen versucht.

Doch ob ein Kind in Experimenten ein Wort äußert, sei abhängig von vielen Faktoren, so Kegel. Gleichtzeitg würden Kriterien, nach denen ein Wort als verstanden bewertet werden kann oder nicht, unterschiedlich streng bewertet werden. Eine weitere Schwierigkeit stellen Variationen im Aufbau von Wortschatzuntersuchungen dar, wodurch man zu unterschiedlichen quantitativen Angaben gelangt. Ebenso bedauerlich sei die Tatsache, dass eine Strukturierung des Wortschatzes lediglich mit Fallstudien auszuwerten

POS-Tag Tokens prozentual % Types prozentual %

ADJ 33 6,6 16 9,3

ADV+PAV 68 13,5 23 13,3

APPR 9 1,8 4 2,3

ART 20 4,0 3 1,7

CARD 8 1,6 5 2,9

ITJ 2 0,4 2 1,2

KON 20 4,0 7 4,0

N 45 8,9 29 16,8

PIDATS 28 5,6 10 5,8

PPER 69 13,7 6 3,5

PPOS 6 1,2 2 1,2

PTK 71 14,1 23 13,3

PW 7 1,4 4 2,3

VA 6 1,2 2 1,2

VM 22 4,4 5 2,9

VV 84 16,7 31 17,9

XY 5 1 1 0,6

503 173

Tabelle 6.21: SO: Verteilung der Types, gruppiert, 1709 bis 1983

ist, so Kegel ([Kegel (1987)], S. 49). An dieser Stelle wird deutlich, dass vor allem das Untersuchen des passiven Wortschatzes eine Herausforderung darstellt, da nur sehr schwer bewertet werden kann, wann und ob ein Kind ein Wort tatsächlich verstanden hat. Bisher ist mir keine Arbeit bekannt, die die gesamte Struktur des Wortschatzes, sei es bei Kindern oder bei Erwachsenen, abschließend in einer experimentellen Studie untersucht hat.

Wie bereits festgestellt wurde, ist dies nur schwer bis gar nicht möglich.

Eine Untersuchung, die den gesamten aktiven und passiven Wortschatz eines Individuums erfassen will, setzt unterschiedliche Schritte voraus, die zum jetzigen Zeitpunkt nicht erfüllbar sind. Es müsste zunächst der gesamte passive Wortschatz erfasst werden, was weder experimentell noch durch Beobachtungen, Befragungen, Wortlisten etc. möglich wäre. Selbst wenn es gelingen würde, zumindest den aktiven Wortschatz zu einem gegebenen Zeitpunkt eines Individuums zu erfassen, würde doch der passive Wortschatz niemals erfasst werden können. Doch die Annahme durch Fragebögen zum Wortverständnis und durch andere Tests sei es möglich den passiven Wortschatz zu ermitteln, wirft einige Fragen auf. Rechnerisch gesehen könnte so vielleicht ein Großteil der verstandenen Lexeme erreicht werden, aber was ist mit Wörtern wie Feinlöwe oderwurstig? Diese Wörter gibt es - laut Duden - nicht im Wortschatz der deutschen Sprache ([Dudenredaktion (2004)]).

Dennoch ist die Bedeutung je nach Kontext verständlich. Und genau hier liegt

meines Erachtens das Problem bei der Ermittlung des passiven Wortschatzes.

Sprache ist wandelbar, sie verändert sich ständig und ist Teil der gegebenen kognitiven Fähigkeiten. Dadurch ist Sprache nie stetig, sondern kontinuierlich und ein passiver Wortschatz könnte allenfalls in Referenz zu etwas anderem stehen, beispielweise das Deutsche im Vergleich zum Duden, und nur für einen gegebenen Zeitpunkt erfasst werden. Es ist leicht vorstellbar, welchen Aufwand dies bedeutet. Wahrscheinlich ist das ein Grund dafür, dass es eine solche Erfassung bisher nicht gibt. Zu diesem Schluss gelangte auch Kegel (1987) und stellte fest, dass lediglich nicht-experimentelle Studien zur Untersuchung des Wortschatzes herangezogen werden können. In Längsschnittstudien einzelner Kinder könnte zum Beispiel die Produktion und Perzeption kontinuierlich protokolliert werden. Ein Nachteil wäre, dass ein solches Verfahren keine statistisch auswertbaren Daten liefern würde und dies wiederum keine verallgemeinernde Interpretation der Ergebnisse möglich macht ([Kegel (1987)], S. 50). Eine andere Möglichkeit bieten sogenannte Wortschatztests ([Smith (1926)]). Am erfolgreichsten ist laut Kegel (1987) die Untersuchung eines begrenzten Zieles, wie zum Beispiel eine Verfolgung der Verteilung der Wortklassen, wobei größere Passagen laufender Rede analysiert werden (ebd.). Dies wurde in der vorliegenden Arbeit getan und bestätigt. Die bisherigen Ergebnisse anderer Autoren sowie die Annahmen von Kegel (1987) zeigen, dass eine andere Vorgehensweise zur Erfassung des kindlichen Wortschatzes sowie zur Beurteilung der Verteilung von Wortklassen (bisher) nicht möglich ist. In Abschnitt 6.4 werden in einem nächsten Schritt nicht die Gesamtdaten der hier untersuchten Kinder berücksichtig, sondern nur die ersten einhundert gesprochenen Wörter je Kind. Mir ist bewusst, dass einhundert Wörter ein vermutlich zu kleines Korpus darstellen, um daraus verallgemeinernde Schlüsse abzuleiten. Dennoch soll dieser Schritt unternommen und in Bezug zu den bisherigen Ergebnissen dieser Arbeit gesetzt werden.

6.3.5 Zusammenfassung

Durch eine Betrachtung der Wortarten gemäß der STTS (hier vorliegend in gruppierter Form) wurde zunächst ein Überblick über die Verwendung und Verteilung der Wortarten bei jedem Kind in jeder Altersgruppe geschaffen.

Auffällig war, dass die Verteilung in den Gruppen sowie bei einem Vergleich aller Kinder (egal welchen Alters) sehr ähnliche prozentuale Anteile aufweist.

Dabei ist es egal, ob ein Kind im gesamten Aufnahmezeitraum sehr viele oder nur sehr wenige Tokens zu den Aufnahmen beisteuerte. Die wenigsten Wörter finden sich bei LEO in Gruppe 3 mit 189 Tokens. Die meisten Wörter

äußerte MK in Gruppe 2 mit 8706 Tokens. Bei beiden Kindern sieht die Verteilung der Wortarten prozentual betrachtet ähnlich aus, bis auf den hohen Anteil an Nomen bezogen auf die Types bei MK. Ein Vergleich mit anderen Kindern, die vergleichsweise viele Tokens äußerten, zeigt, dass niedrigere Werte bei den Nomen (N) ebenso anzutreffen sind (z. B. JS in Altersgruppe 1709_1983 mit 28,2% Nomen bei insgesamt 2378 Tokens). Wie bereits weiter oben beschrieben, ist der Anteil der Nomen in Bezug auf die Tokens bei allen Kindern in allen Altersgruppen sehr viel niedriger als in Bezug auf die Types. Das ist äußerst interessant, weil für die Ausführungen in dieser Arbeit bisher nur Vergleichsdaten von Kindern bis zu einem Alter von 36 Monaten vorliegen (z. B. [Kauschke (1999)]) und diese zwar einen ähnlichen, wenn auch qualitativ anderen Unterschied aufzeigen. Bei Kindern im Alter von 36 Monaten ermittelte Kauschke (1999) auf der Basis von 6411 Tokens einen Anteil von 11% Nomen bezogen auf die Tokens und einen Anteil von 16%

Nomen bezogen auf die Types. In der vorliegenden Arbeit ist der Anteil der Tokens durchaus mit den von Kauschke ermittelten Daten vergleichbar. Was die Types angeht, kann das nicht behauptet werden. Im Grunde können die sehr abweichenden Werte in dieser Arbeit nicht durch eine abweichende Methodik bzw. durch die Wahl der Kategorisierung zu Stande gekommen sein (obgleich eine andere Methodik zugrunde liegt), weil ansonsten bereits die Token-Anteile abweichende Werte zu Tage hätten bringen müssen. Vielmehr kann an dieser Stelle angenommen werden, dass Kinder ab einem Alter von 3;5 Jahren bis zu einem Alter von 5;5 Jahren (und vermutlich auch darüber hinaus) einen sprachlichen Entwicklungsschritt durchlaufen, der in der Verwendung vieler verschiedener Nomen resultiert und sich in einem erhöhten Type-Anteil äußert. Um diese These zu stützen, müssten allerdings noch weitere Analysen vorgenommen werden. Ferner ist zu beobachten, dass extrem hohe Type-Anteile bei den Nomen oft bei einer hohen Token-Anzahl vorzufinden sind, wobei jedoch kein ursächlicher Zusammenhang behauptet werden kann. Eine Inhaltsanalyse der Sprachdaten der Kinder kann hilfreich sein, um die hiesigen Ergebnisse zu stützen. Ferner würden Vergleichsdaten von Kindern, die sich zum Zeitpunkt der Datenerhebung nicht im Kindergarten befanden, hilfreich sein. Denn es ist nicht eindeutig feststellbar, ob die Umgebung in der Kita eine übergeordnete Rolle gespielt hat. Wichtig festzuhalten ist zudem, dass im gesamten Verlauf von 3;5 bis 5;5 Jahren keine bedeutenden Veränderungen in der Verteilung der Wortarten bei Kindern feststellbar waren, weshalb davon auszugehen ist, dass die Anteile im Wesentlichen so erhalten bleiben oder aber sich nur langsam in eine abweichende Richtung entwickeln. Die von Kauschke angeführte These, dass der Spracherwerb im 2. Lebensjahr als ein prognostisches Mittel für den

weiteren Verlauf der Sprache genutzt werden kann ([Kauschke (1999)], S.

153), kann insbesondere erweitert werden um folgende These:

Der Spracherwerb im 3. Lebensjahr kann als ein prognostisches Mittel für den weiteren Verlauf der Sprachentwicklung verwendet werden.

Vor allem die Verteilung der Verben, sowohl in Bezug auf die Types als auch auf die Tokens ist vergleichbar mit 36 Monate alten Kindern und bleibt über den Zeitraum von 3;5 bis 5;5 Jahren nahezu unverändert erhalten.