• Keine Ergebnisse gefunden

Unabhängige Variablen und Hypothesen

Im Dokument Morphologisch komplexe Wörter (Seite 129-135)

Im Zentrum des Interesses steht der Einfluss, den die Variablen Tokenfrequenz und Akzentuierung auf die Realisierung der pWortgrenzen haben. Weiterhin ge-währleistet das Untersuchungsdesign die systematische Berücksichtigung der Faktoren Wortart, syntaktische Struktur, Segmentkontext und Vokalquantität im Erstglied. Nicht von vorrangigem Interesse sind die einzelnen Sprecher, sie wer-den aber alsrandomFaktoren in die Analyse einfließen (s. u.).

Die Tokenfreqenz der Wörter wurde bei der Erstellung des Datensets im Sinne einer binären Unterteilung in äußerst hochfrequente und äußerst nieder-frequente Wörter erhoben. Als hochfrequent wurden Wörter klassifiziert, die in Google eine Trefferzahl über 100.000 erzielten. Niederfrequent waren solche Wörter, deren Trefferanzahl unter 5.000 Treffern in Google lag. Die Frequenzan-fragen in Google erfolgten im Winter 2006. Ergänzend dazu wurde später die Tokenfrequenz der ausgewählten Wörter in COSMAS II (W – Archiv der ge-schriebenen Sprache) erhoben. Einbezogen wurde die Lemmafrequenz, d.h. die Frequenz des Lemmas inklusive aller Flexionsformen. Für die Sequenzen über eine syntaktische Grenze hinweg wurde in COSMAS II die Vorkommenshäufig-keit dieser Wortabfolge ermittelt. Im Vergleich der Frequenzabfragen in Google

4Für eine separate Auswertung der Anzahl der wahrgenommenen Segmente siehe Bergmann (2014).

und in COSMAS II zeigt sich, dass alle der nach Google niederfrequenten Wörter auch in COSMAS II nur niedrige Trefferzahlen erzielen. Unter den nach Goog-le als hochfrequent eingestuften Wörtern befinden sich hingegen einige, die in COSMAS II nur selten belegt sind, etwa Bahnnetz (Google: 143.000, COSMAS II: 2053), einnisten (Google: 200.000, COSMAS II: 4676) oder Brotteig (Google:

102.000, COSMAS II: 706). Diese Unterschiede sind sicherlich zum Teil darauf zurückzuführen, dass die Korpora in COSMAS II und das in Google verwende-te Maverwende-terial hinsichtlich der verwendeverwende-ten Regisverwende-ter variieren, wobei das Maverwende-terial in Google vermutlich durch stärkere Einflüsse von konzeptioneller Mündlichkeit geprägt ist. In der vorliegenden Studie basieren die Auswertungen nichtsdesto-trotz auf den Frequenzabfragen in COSMAS II, da es sich hierbei im Gegensatz zu Google um ein kontrolliertes Korpus handelt. Als Frequenzmaß fließen die loga-rithmierten absoluten Werte als kontinuierliche Variable in die Auswertung ein.

Dadurch wird ermöglicht, dass mögliche graduelle Frequenzabstufungen in die Analyse einbezogen werden können. Dies ist vor allem in der Gruppe der höchst-frequenten Wörter relevant, die einen sehr weiten Frequenzbereich umfasst. Auf die binäre Untergliederung in höchst- und niederfrequente Wörter wird in eini-gen Graphiken zu Darstellungszwecken zurückgegriffen.

Vor dem Hintergrund der zahlreichen Studien, die einen reduzierenden Ein-fluss der Tokenfrequenz aufzeigen (vgl. z. B. Bell u. a. 2009; Bybee 2001; Jurafsky u. a. 2001; Pluymaekers u. a. 2005b,a; Schäfer 2014b,a; Turk 2010, siehe auch Ab-schnitt 2.4.3), besteht für die vorliegende Studie die Erwartung, dass sowohl die Glottalverschlussepenthese / Glottalisierung als auch die Geminatenrealisierung mit steigender Tokenfrequenz eine (graduell) stärkere Reduktion aufweisen. Für die Degeminierung bedeutet dies eine Dauerreduktion der Lautsequenzen mit steigender Frequenz. Für die Glottalisierung sind entsprechend weniger Glottal-verschlüsse mit oder ohne Glottalisierung und weiterhin weniger Glottalisierun-gen bis hin zum völliGlottalisierun-gen Ausbleiben eines Glottalverschlusses und einer Glotta-lisierung mit ansteigender Frequenz zu erwarten.

Die unabhängige Variable Akzentuierung bezieht sich auf die Akzentuierung auf Intonationsphrasenebene. Wie die Darstellung des Datenmaterials in 3.2 ge-zeigt hat, kommen die Testwörter systematisch in akzentuierter und unakzentu-ierter Form vor. Im Einklang mit Studien aus der prosodischen Phonologie wird erwartet, dass die akzentuierten Elemente ein geringeres Ausmaß an Reduktion aufweisen als die unakzentuierten Elemente (vgl. z. B. Keating u. a. 2003, Kap.

3.1).

Die unabhängige Variable Wortart mit den Ausprägungen ‚Kompositum‘ und

‚Partikelverb‘ lässt vor dem Hintergrund der Literatur zum phonologischen Wort

zunächst keinen systematischen Einfluss auf die Grenzrealisierung erwarten. So-wohl die Partikelverben als auch die Komposita werden generell als ein kom-plexes phonologisches Wort analysiert. Von Interesse sind hier allerdings die in Abschnitt 2.3.5 angeführten Vermutungen von Wiese (2000), die die Velarnasa-lassimilation und die Geminatenreduktion betreffen. Als möglicher Einflussfak-tor gilt dort der lexikalisch-morphologische Status, der sogenannte „kleine Wör-ter“ („small words“) wie Präpositionen oder – ohne morphologischen Wortsta-tus – Präfixe anfälliger für einen Verlust des pWortstaWortsta-tus machen sollte. In die-sem Zusammenhang könnte somit vermutet werden, dass die untersuchten Par-tikeln, die durchweg einsilbig und teilweise homophon mit Präpositionen sind, einem stärkeren Abbau der Grenzmarkierung unterworfen sind als die Komposi-tumserstglieder. Wiese vermutet allerdings auch, dass „kürzere“ Bestandteile in Komposita ebenfalls einer stärkeren Tendenz zum Verlust des pWortstatus unter-worfen sein könnten (Wiese 2000: 231). Dies würde im untersuchten Datensatz alle Komposita betreffen, da diese im Erstglied systematisch einsilbig sind. Wei-terhin ist anzumerken, dass eine mögliche Reduktion zwar plausiblerweise die Geminaten betreffen könnte, denn bei diesen resultiert die Reduktion wohl vor allem aus einem Abbau des finalen Elements im Erstglied (z. B. in ein#nehmen undBahn#netz). Der Glottalverschluss bzw. die Glottalisierung treten jedoch am Anfangsrand des Zweitglieds auf (z. B. inzu#ʔarbeitenundZahn#ʔarzt). Es liegt daher für dieses Phänomen nicht auf der Hand, von einem Einfluss der Wortart des Erstglieds auf den Abbau der initialen Grenzstärke des Zweitglieds auszuge-hen. Schließlich soll noch darauf hingewiesen werden, dass der Faktor Wortart mit dem Faktor Frequenz konfundiert ist, da die Partikelverben für gewöhnlich eine höhere Tokenfrequenz aufweisen als die Komposita. Dies wird bei der stati-stischen Analyse zu berücksichtigen sein.

Die Erwartung für die Glottalisierung ist somit, dass kein Unterschied zwi-schen Partikelverben und Komposita besteht. Als Hypothese für die Geminaten wird vereinfachend angenommen, dass die Partikelverben eine stärkere Redukti-on aufweisen als die Komposita.

Neben der Wortart lässt sich auch die syntaktische Struktur als Einfluss-faktor berücksichtigen. Die für die Glottalisierung und die Geminatenredukti-on untersuchten Lautsequenzen kommen alle sowohl innerhalb eines morpholo-gisch komplexen Wortes vor als auch zwischen zwei aufeinanderfolgenden Wör-tern. Sie überschreiten damit die Ebene des phonologischen Wortes und gehören zu einer phonologischen Phrase. Sollte es einen Unterschied zwischen pWort-internen Grenzen in einer rekursiven Struktur und unabhängigen pWörtern in einer Phrase geben, so wäre zu erwarten, dass die Elemente in der höheren

Do-mäne eine stärkere Grenzmarkierung aufweisen. Dafür sprechen auch die in Abschnitt 3.1 angeführten Beobachtungen zur Geminatenreduktion bei Kohler (2001). Aus der Perspektive der lexikalischen Phonologie ist zu erwarten, dass die kategorischen Prozesse Glottalverschlussepenthese und Segmenttilgung wort-übergreifend nicht systematisch vorkommen und nicht systematisch mit wortbe-zogenen Faktoren wie der Frequenz variieren. Graduelle Dauerreduktionen kön-nen zwar auftreten, sollten aber ebenfalls nicht in systematischem Zusammen-hang mit wortbezogenen Faktoren stehen. Während aus Sicht der prosodischen Phonologie somit eine graduell stärkere Grenzmarkierung an der syntaktischen Grenze zu erwarten ist, die sich sowohl auf die Glottalisierung als auch auf die Geminaten beziehen lässt, sollte aus Sicht der lexikalischen Phonologie ein kate-gorischer Unterschied zwischen den wortinternen und den wortübergreifenden Sequenzen bestehen. Die graduellen Dauerreduktionen dürften als automatische Prozesse sowohl wortintern als auch wortübergreifend auftreten, aber nicht zu-gleich durch beispielsweise die Frequenz beeinflusst sein. Die kategorische Varia-ble des Glottalverschlusses dürfte nur wortintern auftreten, aber ebenfalls nicht von der Frequenz beeinflusst sein.

Schließlich sind noch die beiden phonologischen Variablen Segmentkontext und Vokalqantität zu erwähnen. Ihr Einfluss steht letztendlich nicht im Vor-dergrund des Interesses und ihre Einbeziehung in die Korpuserstellung und Aus-wertung dient mehr der Kontrolle dieses Einflusses. Sie werden deshalb als Kova-riate behandelt. Dennoch lassen sich Erwartungen an die beiden Variablen knüp-fen, die auch dazu beigetragen haben, sie im Korpus zu kontrollieren.

Der Segmentkontext ist insbesondere für die Glottalisierung von Interesse. Die Kontexte V#V, n#V, s#V und t#V bringen jeweils verschiedene Anforderungen an die artikulatorische Gestenorganisation mit sich, die auch die glottale Geste be-treffen. Für die Kontexte V#V und n#V gilt im Gegensatz zu s#V und t#V, dass zwei sonore Laute aufeinanderfolgen, für deren sequenzielle Produktion eigent-lich keine Veränderung der glottalen Einstellung erfordereigent-lich ist. Ein Glottalver-schluss bzw. eine Glottalisierung stellt bei diesen Kontexten eine zusätzliche Ge-ste dar, so dass zu erwarten ist, dass sie hier am eheGe-sten eingespart oder zu-mindest abgeschwächt wird. Im Übergang vom [s] zum V oder vom [t] zum V muss demgegenüber ohnehin von einer geöffneten Glottis in die Phonationsstel-lung übergegangen werden, so dass hier eher von einer Disposition zum Ver-schluss oder zur Glottalisierung auszugehen ist. Neben der glottalen Öffnungs-und Schließgeste ist außerdem die orale Geste zu beachten, bei der sich nun der Kontext n#V mit t#V gruppiert und der Kontext V#V mit s#V, da erstere einen Verschluss aufweisen, letztere aber nicht. Auch die Koordination von oraler mit

glottaler Verschlussgeste kann hier also eine Rolle spielen, auf die im Ergebnisteil noch genauer eingegangen wird (vgl. Kohler 1994).

In Hinblick auf die Degeminierung ist – abgesehen von der unterschiedlichen intrinsischen Dauer der untersuchten Laute – eher die Variable der Vokalquanti-tät von Interesse. Sie wird deshalb kontrolliert, weil zu vermuten ist, dass das finale Segment im (immer einsilbigen) Erstglied aufgrund kompensatorischer Dehnung auf Silbenebene nach Langvokal kürzer ist als nach Kurzvokal. Auch eine vollständige Tilgung des finalen Segments ist nach Kurzvokal weniger zu erwarten, da das verbleibende Segment dann theoretisch als ambisilbisch resilbi-fiziert werden müsste (z. B. inhi.n.eigenmit ambisilbischem [n] im Gegensatz zu ei.nehmenmit [n] im Onset der zweiten Silbe). Hier muss allerdings daran erin-nert werden, dass die Tilgung in der Studie nur über den Höreindruck als „ein“

oder „zwei“ Segmente operationalisiert wird. Akustische Studien über die Dauer hinaus, die die Tilgung gezielt berücksichtigen, wurden nicht durchgeführt. Ein-flüsse der Vokalquantität auf die Glottalisierung sind nicht zu erwarten. Auch hier wäre zwar bei einem vollständigen Fehlen von Verschluss und Glottalisie-rung (d.h. in der Gruppe n/n) bei einem Erstglied mit Kurzvokal mit einer Resilbi-fizierung zu einem ambisilbischen Segment zu rechnen. Auch bei einem Erstglied mit Langvokal müsste es aber theoretisch zur Resilbifizierung kommen, also bei-spielsweise inei.nordnenebenso wie inhi.n.ordnen. Ein systematischer Einfluss der Vokalquantität auf die Glottalisierung wird deshalb nicht erwartet.

Tab. 3.6 fasst nun die unabhängigen Variablen und ihren erwarteten Einfluss auf die abhängigen Variablen der Glottalisierung und der Geminatenreduktion in einem Überblick zusammen.

Die statistische Auswertung erfolgte in R (R Core Team 2013/2017). Zur An-wendung kamen die PaketelanguageR(Baayen 2011),lme4(Bates u. a. 2013; 2015;

lmerTest(Kuznetsova u. a. 2016),MASS(Venables & Ripley 2002) undeffects(Fox 2003). Die Modelplots wurden mit Hilfe vonvisreg(Team 2016) erzeugt. Für die kontinuierliche abhängige Variable „Dauer“ wurden lineare gemischte Regressi-onsmodelle gerechnet, bei denen alsrandom effect der Sprecher / die Sprecherin eingegeben wurde (vgl. Baayen 2008: 242 ff). Die kategorische Variable „Tilgung“

wurde mithilfe von generalisierten linearen gemischten Modellen (generalized li-near mixed models) analysiert, wobei für die binäre Aufteilung gemischte Modelle erstellt wurden (vgl. Baayen 2008: 278-284).

Vor der Berechnung der Modelle für die kontinuerliche Variablen wurden die Daten bereinigt, indem auf der Basis von Boxplots deutliche Outlier entfernt wur-den. Die Verteilung der Datenpunkte auf die Dauerwerte wurde in Histogram-men überprüft; bei starker Abweichung von einer Normalverteilung wurden für

Tabelle 3.6: Überblick unabhängige Variablen und Erwartungen für Glottalisierung und Geminatenreduktion

Erwartungen 1) Tokenfrequenz

niedrigere Frequenz > höhere Frequenz Glottalisierung:

•mehr Verschlüsse > weniger Verschlüsse

•mehr Glottalisierung > weniger Glottalisierung

•j/j > j/n, n/j > n/n Geminaten:

•höhere abs. Dauer > niedrigere abs. Dauer

•höhere rel. Dauer > niedrigere rel. Dauer 2) Akzentuierung

akzentuiert > unakzentuiert Glottalisierung:

•mehr Verschlüsse > weniger Verschlüsse

•mehr Glottalisierung > weniger Glottalisierung

•j/j > j/n, n/j > n/n Geminaten:

•höhere abs. Dauer > niedrigere abs. Dauer

•höhere rel. Dauer > niedrigere rel. Dauer 3) Wortart

Kompositum > Partikelverb Glottalisierung:

•kein Einfluss erwartet Geminaten:

•höhere abs. Dauer > niedrigere abs. Dauer

•höhere rel. Dauer > niedrigere rel. Dauer

Tabelle 3.7: Überblick unabhängige Variablen und Erwartungen für Glottalisierung und Geminatenreduktion (Fortsetzung)

Erwartungen

4) syntaktische Struktur

Im Dokument Morphologisch komplexe Wörter (Seite 129-135)