Die Produktionsstudien - Vokalqualität im Berndeutschen : Synchrone und diachrone Untersuchung

Um die Lautproduktion von Berndeutsch-Sprecher/-innen zu untersuchen, wurden

experimentelle quantitative Methoden eingesetzt. Sprachdaten zur Vokalqualität sowie zur Dauer von Vokalen und Konsonanten wurden von 8 Jugendlichen und 7 älteren Berndeutsch-Sprechern erhoben. Das relevante soziolinguistische Unterscheidungsmerkmal ist Alter (ältere/jüngere Personen aus 2 Generationen). Alle Gewährspersonen sind monolinguale berndeutsche Muttersprachler und wohnen in der Stadt Bern (bzw. in Vororten).

Alle Teilnehmer an der Produktionsstudie wurden einzeln gebeten, eine Wortliste laut vorzulesen. Diese Wortliste umfasste 230 berndeutsche Wörter mit Hochzungenvokalen in unterschiedlichen konsonantischen und prosodischen Umgebungen (vgl. Tab. 2.1 bzw.

Anhang). Grundlage hierfür war das Berndeutsch-Wörterbuch von V.GREYERZ/BIETENHARD

(1997). Die dort aufgeführten Wörter sind nach ihrer Vokalqualität sowie nach Konsonant- und Vokallänge gekennzeichnet. Für die Wortliste wurden Wörter ausgewählt, die

unterschiedliche Lautumgebungen der 3 Hochzungenvokale <i>, <u>, <ü> repräsentieren. In die Liste waren auch 72 Wörter mit den Monophthongen <e>, <o>, <ö>, <a>, <ä> als Kurz- und Langvokale sowie Diphthonge eingestreut, die von dem zu untersuchenden Ziel ablenken sollten und für die Bestimmung der unteren Vokalstufen genutzt wurden. Die nach

phonologischen Kriterien zusammengestellte Liste war zuvor von drei Muttersprachlern auf Bekanntheit und Gebräuchlichkeit der Wörter hin durchgesehen und modifiziert worden.

In der Wortliste sind die Wörter und Sätze in stadtberndeutscher Mundart sowie in der standarddeutschen Bedeutung aufgelistet. Der Grund dafür ist: Das Berndeutsche ist keine Schriftsprache, sondern das ist das Standarddeutsche (Diglossiesituation Dialekt –

Hochsprache, vgl. Kap. 1.4). Weil die Schreibweise auch z.B. in der Dialektliteratur nicht normiert ist, konnte eine eigene Umschrift verwendet werden, bei der die Codierung von Vokalqualität sowie Konsonantlänge des Wortes, wie sie im Lexikon angegeben war, vermieden wurde. So konnte auch bewusst zweideutig formuliert werden, mit dem Ziel, die Gewährsperson eine für sie angemessene Wahl treffen zu lassen. Die für das Bernd. oft verwendete Dieth-Transkription (vgl. DIETH 1938) wurde nicht gewählt, weil sie die Vokalqualität durch diakritische Zeichen markiert.

Silbenstruktur: Beispiele mit gespanntem Vokal: Beispiele mit ungespanntem Vokal:

CV: Schii, Wii, drüü, Schüü, Guu (Ski; Wein; drei; frz.: jus; goût)

duu, sii (du; sie, betont) CV:C, CV:S Züüg, Riis, Bruuch, druuf, Zuun, Füür

(Zeug; Reis; Brauch; darauf; Zaun; Feuer)

Siib, Züüg, Biis, Bruuch, Suun, Tüür (Sieb; Zug, Pl.; Gebiss; Unsinn; Sohn; Türe) CVC Zit, Lüt, Schut, schigg, Schüp

(Zeit; Leute; Schuss; schick; frz: jupe)

- CVC:, CVC1C2 nur als CV:C:, z.B. in Gschiiss

(Aufhebens, Getue)

Schutt, lugg, Schuss, druff, Hund, Milch (Schutt; locker; Schuss; drauf, Hund; Milch)

CV.CV, CV.SV Tube, flüge, Side, Gusi, Füli, rite (Taube; fliegen; Seide; Ferkel; Fäule;

reiten)

Tubel, Flügel, Risel, Füli, Schine (Dubel; Flügel; Graupel; Fohlen; Schiene)

CV:.CV, CV:.SV Giige, schnuufe, tuused, schiine, tüüri (Geige; schnaufen; 1000; scheinen; teuer)

Gfrüüri, aaruure

(Kühlschrank, alt: Frost; anknurren) CVC:/S:V nur als CV:C:V, z.B. in Pfiiffe, Huuffe

(Pfeife, Haufen)

Rippi, schütte, gritte, pfiffe, Fülli (Rippe; schütten; geritten, gepfiffen, Fülle) CVC1/S1.C2/S2V Nidle, chnüble, Hüsli, dusle

(Sahne; bohren; Häuschen; schlummern)

verdüble, zügle, gusle, Chischte (verdübeln; schwimmen; stochern; Kiste) Tab. 2.1: Beispiele berndeutscher Wörter, die in der Wortliste abgefragt wurden, und ihre Silbenstrukturen (C = Einfachkonsonant, C: = Doppelkonsonant, V = Kurzvokal, V: = Langvokal). Die Beispiele wurden nach der Schreibweise im Berndeutsch-Wörterbuchvon V.GREYERZ/BIETENHARD (1997) angeordnet und mit ihrer std.

Bedeutung angegeben.

Wegen dieser eigenen Umschrift diente die standarddeutsche Form zugleich der

Disambiguierung und Bedeutungssicherung von Wörtern, z.B. im Fall der Umschrift von std.

Zeug sowie von std. Züge als stadtbernd. Züüg (vgl. die im Anhang abgedruckte Wortliste).

Vor der Aufnahme wurde die Wortliste allen Teilnehmer/-innen einzeln zur Durchsicht überlassen. Die Gewährspersonen sollten die Wörter identifizieren, und sich Notizen für das Vorlesen machen. Wurde ein Wort als unbekannt eingestuft, was bei den Sprechern der

jüngeren Generation einige Male vorkam, wurde das Wort ausgelassen oder durch eine selbst gewählte Alternative ersetzt. Ein fehlendes Belegwort konnte in den meisten Fällen durch die Redundanz in der Wortliste ausgeglichen werden. Die Wortliste wurde von den

Versuchspersonen in Anwesenheit der Versuchsleiterin einzeln laut vorgelesen, ohne dass ein Zeitdruck bestand. Auch die Möglichkeit von eigenen Verbesserungen war gegeben. Das Vorgelesene wurde auf DAT (digital audio tape)-Kassette (Sony DAT-Recorder)

mitgeschnitten. Die Aufnahmen, die zwischen 7 und 30 Minuten lang sind, fanden im

November 2002 in einem schalldichten Tonstudio des Radio DRS in Bern statt, was eine sehr gute Aufnahmequalität sicherstellte.

Außerdem füllten die Versuchspersonen einen Fragebogen zu persönlichen Daten, zu ihrer Dialektverwendung sowie zu ihrer Einstellung zur berndeutschen Mundart aus. Die jüngeren Teilnehmer/-innen (6 weiblich, 2 männlich) waren 15 bis 24 Jahre alt, geborene (Stadt-) Berner und gingen auf eine Berner Wirtschaftsmittelschule bzw. studierten an der Universität Bern. Die älteren Teilnehmer/-innen (3 weiblich, 4 männlich)¹waren 45 bis 65 Jahre alt, berufstätig und hatten (mit Ausnahme einer Person) ihr ganzes Leben in der Stadt Bern verbracht (mehr zur ihrer Dialekteinstellung in Kap. 2.4). Die digitalen Aufnahmen, die vom Verlesen der Wortliste gemacht wurden, wurden mit hoher Qualität (Abtastrate 44.100 Hz) auf einen Computer überspielt und mit den Programmen Kay Elemetrics CSL, MATLAB und CoolEdit ausgewertet.

1 Das Merkmal Geschlecht konnte wegen der geringen Fallzahlen nicht mit in die Analyse einbezogen werden.

2.1.1 Charakterisierung der Vokalqualität

Die Qualität eines Vokals ist durch seine Formanten eindeutig bestimmt, d.h. durch die Resonanzfrequenzen des Vokaltraktes, die bei der Artikulation angeregt werden. Die

Resonanz-frequenzen werden über die Stellung der Artikulatoren im Mundraum modifiziert.

Nach der Source-Filter-Theorie der Sprachproduktion (FANT 1960) wird das

Stimmlippensignal (Source) durch den Vokaltrakt (Filter) modifiziert. Dabei wird das Frequenzspektrum bei den Resonanzen des Mundraums verstärkt, außerhalb der Resonanzen abgeschwächt. Entscheidend für die Qualität des Vokals ist vor allem die Lage der ersten 2 Formanten: Der 1. Formant (F1) entspricht der Artikulation im Mundraum in der Vertikalen (dabei zeigt ein kleinerer Wert eine höhere Vokalstufe an), der 2. Formant (F2) charakterisiert den Artikulationsort in der Horizontalen (hier bezeichnet ein höherer Wert Artikulation weiter vorne im Mundraum). Die Formanten eines Vokals können computergestützt mit der LPC (Linear predictive coding)-Analyse bestimmt werden (vgl. MARKEL/GRAY 1976). Mit Hilfe dieser Methode wird mathematisch abgeschätzt, was der Beitrag des als Filter agierenden Vokaltrakts an dem gebildeten Sprachlaut ist, unabhängig vom Einfluss der Stimmlippen. Der Vokaltrakt wird dabei als Filter mit 2N Polen modelliert, diese entsprechen N Formanten, d.h.

den Maxima F_i im Frequenzspektrum des Filters (i = 1 ... N) sowie den dazugehörigen Bandbreiten dF_i. Auf der Basis eines Lautausschnitts, der aus mehreren

Stimmlippenschwingungen besteht (über die ein Fenster gelegt wurde), bestimmt das LPC-Verfahren die Werte für die Formanten F_i und Bandbreiten dF_i, für die die Abweichung zwischen dem tatsächlich gesprochenen und dem mit Hilfe des Filters modellierten Laut minimiert ist. Das durch die Formanten beschriebene Frequenzspektrum des Vokaltrakt-Filters zeigt dann gute Übereinstimmung mit dem Frequenzspektrum des gesprochenen Lauts (vgl. Abb. 2.1).

Abb. 2.1 Abb. links: Das Oszillogramm (schwarz) des Vokals [y:] aus dem Wort Züüg (Zeug), produziert von einem älteren Sprecher mit gefenstertem 20-ms-Lautausschnitt (rot), der für FFT- und LPC-Analysen verwendet wird. Abb.

rechts: Frequenzspektrum des Lautausschnitts: FFT-Analyse (rot), LPC-Analyse (blau; Filterordnung 12) mit Formantwerten 266 Hz (F1), 1652 Hz (F2), 2403 Hz (F3) (vertikale Linien) und Bandbreiten (gestrichelte Linien).

Für die LPC-Analysen in dieser Arbeit wurde die Autokorrelationsmethode verwendet, und es wurde jeweils ein Lautausschnitt von 20 ms in der Mitte des Lautes (mit Blackman-Fenster) gewählt. Die Abtastrate (sampling rate) betrug 11.025 Hz.

Ein wesentlicher Parameter bei der LPC-Analyse ist die Anzahl der Pole, mit denen die Filterfunktion des Vokaltrakts beschrieben wird: „Die Anzahl der Pole legt die Anzahl der Resonanzfrequenzen des Vokaltrakts fest und kann nicht automatisch aus dem Signal

errechnet werden.“ (REETZ 2003, 204). Für die LPC-Analyse muss also die Zahl der Pole, d.h.

die Filterordnung, festgelegt werden. Bei einer Abtastrate von 11.025 Hz und einem Frequenzspektrum von 0 bis 5.000 Hz werden 5 Formanten erwartet, was 10 LPC-Polen entspricht bzw. 12 Polen, um mögliche Beeinflussungen durch höhere Formanten

auszugleichen. Die Anzahl der Pole ist aber abhängig von der Vokaltraktlänge des Sprechers bzw. der Sprecherin (LADEFOGED 1996, 211 f., REETZ 1999, 132 f.). In der Vokalproduktion von Frauen, die oft kürzere Vokaltrakte haben als Männer, finden sich oft nur 4 Formanten im Bereich von 0 bis 5.000 Hz.² Die Wahl einer zu geringen Polzahl führt dazu, dass das LPC-Verfahren mehrere Formanten als einen einzigen Formantgipfel modelliert, eine zu hohe Polzahl hat zur Folge, dass das LPC-Verfahren Teile des Stimmlippenspektrums als

Formanten bestimmt. Aus diesem Grund wurde jedes LPC-Ergebnis daraufhin kontrolliert, ob die Analyse plausibel ist. Die bernd. Vokale, die von den männlichen Teilnehmern produziert wurden, waren mit Filterordnung 12 (bzw. 14) problemlos analysierbar. In einigen Fällen gab es Probleme in der Formantanalyse aufgrund der hohen Stimmlage (F0) der weiblichen Jugendlichen sowie bei Vokalen, die von den Frauen in hoher Stimmlage produziert wurden.

Hier wurden die Filterordnungen 10 und 12 eingesetzt, z.T. wurde derselbe Vokal mit 2 verschiedenen Filterordnungen bestimmt und dann durch Inspektion des Frequenzspektrums entschieden, welche der Analysen die Daten des FFT-Spektrums besser beschreibt. Bei den Hochzungenvokalen lag die Grundfrequenz der Stimmlippenschwingung der weiblichen Jugendlichen der jüngeren Generation darüber hinaus oft bereits im Bereich des 1. Formanten, so dass die Lage der Formanten nicht so genau zu bestimmen waren wie etwa bei den

Männern und männlichen Jugendlichen (vgl. auch hierzu die Diskussion in REETZ 1999, 137).

Die ermittelten Formantfrequenzen wurden für die Einzelpersonen und gruppenweise nach Alter und Geschlecht in F1-/F2-Graphiken eingetragen.

2 Vgl. folgende Rechnung: Die Resonanzfrequenzen eines weiblichen Vokaltrakts (gedacht als einseitig

geschlossene Röhre von 15 cm Länge) liegen bei ca. 600 Hz plus Harmonische (1.800 Hz, 3.000 Hz, 4.200 Hz), d.h. 4 Formanten bis 5.000 Hz. Bei einem männlichen Vokaltrakt (Länge ca. 17,5 cm) liegen die

Resonanzfrequenzen bei ca. 500 Hz, 1.500 Hz, 2.500 Hz, 3.500 Hz, 4.500 Hz, d.h. 5 Formanten bis 5.000 Hz (nach REETZ 1999, 132 f.).

Um die Formantwerte von Frauen, Männern und männlichen und weiblichen Jugendlichen vergleichbar zu machen, d.h. um die Variation zu reduzieren, die durch Unterschiede in der Konfiguration des Vokaltrakts entstehen, müssen diese Werte normalisiert werden. Dabei ist wichtig, dass dennoch die Variation in der Vokalproduktion nicht verloren gehen soll, die durch die soziolinguistischen Variablen ‚Alter‘ und ‚Geschlecht‘ hervorgerufen wird. In der Literatur werden verschiedene Methoden vorgeschlagen und miteinander verglichen (vgl.

DISNER 1980, MILLER 1989, ROSNER/PICKERING 1994, ADANK u.a. 2004). Alle

Normalisierungsmethoden beruhen auf Reskalierungen der ermittelten Formanten. Dabei können in die Umrechnung Frequenzen höherer Formanten, Beziehungen zwischen den Formanten und der Grundfrequenz oder auch nicht-lineare Reskalierungsfunktionen, die die Hertz-Skala in andere Skalen transformieren, eingehen. Ich folge mit meiner Analyse dem Vorschlag von LOBANOV (1971), jedoch nur für F1 und F2. Nach ADANK u.a. (2004, 3106) genügt dies, um alle Vokale des Niederländischen zu beschreiben, was entsprechend auch auf die berndeutschen Vokale zutreffen müsste.

Nach LOBANOV werden Formanten wie folgt normalisiert:

FR_i= (F_i - μ_i) / δ_i,

wobei FR_i der reskalierte Formant F_i (i = 1, 2) für einen gegebenen Laut eines Sprechers ist.

μi ist der Mittelwert der Formantfrequenz Fi über alle Monophthonge dieses Sprechers und δi

ist die zugehörige Standardabweichung. Für die Reskalierung nach LOBANOV spricht, dass die Lage der Mittelwerte und die Breite der Verteilung von allen Vokalkategorien abhängt, nicht z.B. nur von den Extremwerten. Die in dieser Weise reskalierten Formantwerte der

Einzelpersonen wurden nach Gruppen zusammengefasst in F1-/F2-Graphiken dargestellt (vgl.

hierzu Kap. 2.2).

2.1.2 Charakterisierung der Vokal- und Konsonantdauer

Die Sprechgeschwindigkeit der einzelnen Gewährspersonen wurde jeweils auditiv bestimmt.

Als Maß für die Quantität von Vokalen wurde die jeweilige Dauer der

Stimmlippenschwingung herangezogen, die im Oszillogramm für jeden Beleg von Beginn bis zum Ausklingen gemessen wurde. Zur Charakterisierung der Konsonantenquantität wurde die Konsonantendauer im Oszillogramm gemessen. Es wurden Plosive, Frikative/Affrikten und Liquide ausgewertet. Die Plosivdauer wurde über die Verschlusszeit (engl. closure duration, Abk.: CD) der einzelnen Belege bestimmt. Die Verschlusszeit beginnt am Ende des vor dem Plosiv stehenden Lautes und endet mit der Verschlusslösung des Plosivs. Die darauf folgende

voice onset time (VOT), die mit der Verschlusslösung beginnt und mit dem sich

anschließenden Laut endet, wurde nicht gemessen. Wie verschiedene quantitative Studien gezeigt haben, sind Stimmhaftigkeit bei Konsonanten ebenso wie die Aspiration bei Plosiven keine distinktiven phonetischen Merkmale des Schweizerdeutschen. Folglich ist die VOT in den Plosiven nicht als distinktiv anzusehen (vgl. die experimentellen Nachweise für das Berndeutsche und für das Ostschweizerdeutsche bei HAM 2001, KRAEHENMANN 2003a, WILLI

1996, bzw. vgl. die Zusammenfassung der Diskussion in Kap. 1.2). Bei Frikativen und Liquiden wurde jeweils die gesamte Segmentdauer bestimmt. Beispiele für die Messung der Konsonantlänge im Oszillogramm finden sich in Abb. 2.2.

[y:]

185 ms

[s:]

175 ms [d]

55 ms

Abb. 2.2: Beispiel für Bestimmung von Vokaldauer sowie Plosiv- und Frikativlänge im Wort Widebüüsseli (Weidenkätzchen), produziert von einer jüngeren Gewährsperson: Im Oszillogramm aufgetragen ist die Dauer des Langvokals [y:] (durchgezogene vertikale Linien bezeichnen Anfang und Ende der Messung), die Verschlusszeit des Plosivs [d] (gepunktete vertikale Linien) sowie die Segmentlänge des Frikativs [s:]

(gestrichelte vertikale Linien).

Die Verteilung von Vokal- und Konsonantlängen wurde in Histogrammen graphisch dargestellt und statistisch ausgewertet. Weitere Methoden der deskriptiven Statistik wie die Bestimmung des arithmetischen Mittels und der Standardabweichung wurden ebenso angewendet wie Signifikanz-tests zum Vergleich der Mittelwerte (zu den angewendeten Methoden vgl. u.a. SCHLOBINSKI 1996). Die Ergebnisse der Vokal- und

Konsonantlängenbestimmung sind in Kapitel 2.3 dargestellt.

Im Dokument Vokalqualität im Berndeutschen : Synchrone und diachrone Untersuchungen (Seite 62-69)