Die Stelle der geringsten Verengung

(1)

Rohrmodelle für Vokale

Jonathan Harrington, IPDS, Kiel Mai 2003

Herunterladen:

http://www.ipds.uni-kiel.de/jmh/SS03/AC/rohr.pdf

(2)

Die Stelle der geringsten Verengung

Wie Konsonanten haben Vokale eine gewisse 'Artikulationsstelle' oder Stelle der geringsten Verengung, die:

• zwischen dem Glottis und hartem Gaumen gebildet wird

• einen bedeutenden Einfluss auf das akustische Signal ausübt Stelle der

geringsten Verengung [i]

[A]

(3)

Allgemeines Drei-Rohrmodell für Vokale

Wegen der Verengungsstelle wird der Mundraum in drei Räume aufgeteilt, die mit drei Röhren entsprecherender Länge modelliert werden können

Diese Modelle entsprechen der Länge und Querschnittsfläche vom jeweiligen Rohr

Verengungsrohr

Vorderrohr Hinterrohr L cm

a cm²

L cm

(4)

Beitrag der Röhre zur Akustik der Vokale

[i]

Alle Röhre tragen zur Akustik/Formanten bei, diese Merkmale jedoch am meisten (in dieser Reihenfolge):

1. Verengungsstelle [u]

2. Rohrlänge

[y]

[] 3. Verengungsbreite

(5)

Kaum akustische Unterschiede wegen:

Der Biegung vom Vokaltrakt

≈

Variationen in der Breite hinter oder vor der maximalen Verengung

≈

(6)

Resonanz in einem einheitlichen Rohr: Wellenlänge

Jede Frequenz erzeugt Luftdruckveränderungen, die sich in regelmässigen Abstanden wiederholen

Entfernung Luftdruck

Max.

Atmos.

Min

Entfernung

Max. Min.

LuftdruckMax.

λ

Wellenlänge (λ cm) = räumlicher Abstand zwischen Perioden λ

(7)

Beziehung zur Frequenz (f)

λ (cm) = c (cm/s) / f (Hz) f = c / λ

(c ist die Schallgeschwindigkeit, 35000 cm/s)

(8)

Bedingungen für Resonanz in einem einheitlichen Rohr

• Am gechlossenen Ende: Luftdruckmaximum

• Am offenen Ende: Atmosphärischer Luftdruck

17.5 cm λ = 4 x 17.5 = 70 cm λ/4

λ

Die erste Resonanzfrequenz = F1 = c / λ = 35000/70 = 500 Hz

(9)

Zweite Resonanz

λ λ = 4 x 17.5/3 = 23.3 cm

17.5 cm

3λ/4 F2 = c / λ = 35000/23.3 = 1500 Hz

(10)

Allgemeine Formel

c = Schallgeschwindigkeit, 35000 cm/s L = Rohrlänge

n = Formantnummer

1 L n

2 4 F

_n

c

−

=

_Hz

Formant.tcl

5 . 3 17 4

35000

F

₂

=

_{= 1500 Hz}

Je grösser L (also je länger das Rohr), umso grösser der

Nenner, daher umso kleiner F_n (umso niedriger die Formanten) Einfluss von Längenunterschieden

(11)

1. Rohrlänge: Lippenrundung

Durch Lippenrundung wird hautpsächlich der Vorderrohr länger

F2 (Hz) böten

Göthe böten Dösen

böten Dösen

Göthe Dösen

Göthe degengeben

beten Degen beten geben Degen geben

beten

2400 2000 1600

360340320300280

F1(Hz)

Ein Sprecher (M)

• Kaum eine F1-Änderung, da F1 meistens von den Verengungs- und Hinterröhren abhängt (die bei Lippenrundung kaum geändert werden)

• Senkung von F2 und F3 Akustische Folgen

[e]

[O]

(12)

2. Rohrlänge: männlich/weiblich

Die bedeutenden Unterschiede sind in der Pharynxlänge also im Hinterrohr (kürzer in Frauen)

• Erhöhung der Formanten von vorderen und offenen Vokalen

• Wenige Auswirkungen auf hintere Vokale Akustische Folgen

i:

o:

a:

3000 2000 1000

900700500300

F2 (Hz)

F1(Hz)

a:

i: o: männlich

weiblich [i:] bieten

[o:] baten [a:] baten

(13)

Änderungen der Schallgeschwindigkeit (c)

1 L n

2 4 F

_n

c

−

=

_Hz Je höher/niedriger der Zähler, umso höher/niedriger Fn

(14)

My name is Yelda

Normal 2 kHz

Einatmung von Heliox

(c ist höher) 2 kHz

Einatmung

von Schwefel- Hexafluorid (c ist niedriger)

2 kHz

Beispiele: John Ohala, Phonetics Laboratory San Francisco

(15)

Perturbation Theorie

Formanten berechnen für ein einheitliches Rohr gedrückt

Wie ändern sich die Formanten?

(16)

Nodes und Antinodes

Die Formantänderung hängen von der Verteilung im einheitlichen Rohr von Nodes und Antinodes ab.

Antinode (A) = ein atmosphärischer Luftdruck

Node (N) = ein

Luftdruckmaximum oder -minimum

Auswirkung einer Verengung an

dieser Stelle

Formantsenkung Formanterhöhung

(17)

Die Verteilung von Nodes (N) und Antinodes (A)

Lippen Glottis

Luftdruck Erster Formant (F1 = 500 Hz)

A Zweiter Formant (F2 = 1500 Hz)N A N

A N

Max.

Atmos.

Min.

Dritter Formant (F3 = 2500 Hz)

A N A N A N

(18)

Offene Vokale und F1-Erhöhung

Offene Vokale wie [a A] werden erzeugt durch:

• Eine Verengung in der Pharynx

• Eine breitere Mundöffnung

[a] [i] ^Pharynx

Velum

Harter G. A N

Breiter daher F1 Erhöhung

Enger daher F1- Erhöhung

Lippen Pharynx Glottis

F1 = 500 Hz Akustische Folgen

(19)

Hohe vordere Vokale und F2-Erhöhung

Rohrmodell für [i]

A N A N

F2-Erhöhung wegen N-Verengung

Harter Gaumen

ca. 11 cm

Lippen Glottis

A N

A N A N

F3-Senkung wegen A- Verengung

Daher für [i]: F2 hoch und sehr nach an F3

(20)

Hohe hintere Vokale und F2-Senkung

Modell für [u]

ca. 6 cm

A N

A N A N

Weicher Gaumen

Glottis Lippen

F2-Senkung wegen A- Verengung

A N A N

F3-Erhöhung wegen N- Verengung

Daher für [u]: F2 niedrig und weit weg von einem hohen F3

(21)

Vokalverteilung in den Sprachen der Welt

Liljencrants & Lindblom, 1972, Adaptive Dispersion Theory (ADT), Language.

Sprachen bevorzugen Vokale, die für den Hörer maximal unterschiedlich sind.

Daher haben Sprachen mit wenigen Vokalphonemen fast immer [i u a], weil sie in dem F1 x F2 Raum maximal verteilt sind

hoch F2 niedrig

niedrig i u

F1

hoch a

(22)

ADT und Lippenrundung

ADT erklärt auch weshalb Sprachen ungerundete vordere und gerundete hintere Vokale bevorzugen

y µ

O F

i u

a

hoch F2 niedrig

e o

niedrig F1 hoch

(23)

Vokalröhre, Nomogramme, und die Quantal- Theorie

Jonathan Harrington IPDS, Kiel, Mai 2003

Herunterladen:

http://www.ipds.uni-kiel.de/jmh/SS03/AC/rohr.pdf

(24)

Allgemeines Drei-Rohr Modell für Vokale (ohne Lippenrohr)

Lippen Glottis

Festgelegte Parameter

Vorderrohr Hinterrohr

Lvg = 2 cm

Verengungsrohr

Verengungsrohr-Länge Lvg = 2 cm

Ah = 4 cm²

Hinterrohr-Querschnittsfläche = 4 cm² L = 16.5 cm

Vokaltraktlänge, L = 16.5 cm

Avg = 0.1 cm²

Verengungsrohr-Querschnittsfläche Avg = 0.1 cm²

(25)

Allgemeines Drei-Rohr Modell für Vokale

Veränderliche Parameter

Die Länge vom Hinterrohr Lh

Die Länge vom Vorderrohr, Lv wird dementsprechend geändert, sodass die Gesamtlänge vom Vokaltrakt, L, bei 16.5 cm konstant bleibt

L = 16.5 cm

2 cm [i]

Lv = 4.5 cm Lh = 10 cm

2 cm [u]

Lv = 10.5 cm Lh = 4 cm

(26)

Formantberechnung in einem Dreirohrmodell

Glottis Lippen

Die Formantwerte können aus der Zusammensetzung von drei

Rohrensystemen modelliert werden, angenommen dass, der Ein- und Ausgang zum Verengungsrohr klein ist

1. Hinterrohr wird modelliert als ein Rohr an beiden Enden geschlossen

2. Hinter- und Verengungsrohr zusammen werden als Helmholtzresonator modelliert

(Physiker: Hermann von Helmholtz)

3. Vorderrohr wird modelliert als ein Rohr hinten geschlossen, vorne offen

(27)

1. Hinterrohr

Formanten in einem Rohr, beide Enden geschlossen

Lh Hz 2

h nc F

_n

=

Zum Beispiel für F2 im Hinterrohr für Lh = 13 cm

Hz 13 2692

x 2

35000 x

h 2 2

F = ≈

(28)

Nomogramm vom Hinterrohr

Nomogramm: Eine Abbildung, in der gleichzeitig mehrere Skalen gezeigt wird

1 3 5 7 9 11 13 15

010003000Frequenz(Hz) Lv = 1.5 cm Lh = 13 cm

L=16.5 cm

Lvg=2 cm

2692 Hz

F2h ≈ 2692 Hz

13.5 10.5 7.5 5.5 3.5 1.5 0

Lv: Vorderrohrlänge (cm)

5000

Lh: Hinterrohlänge (cm)

(29)

Nomogramm vom Hinterrohr (fortgesetzt)

Damit wir die Bewirkung der Hinterrohrlänge auf die Formanten feststellen können, wird F1-F3 für das Hinterrohr für alle

möglichen Lh-Werte berechnet

Lv: Vorderrohrlänge (cm)

1 3 5 7 9 11 13 15

010003000

F1h F2h F3h

Frequenz(Hz)

Hinterrohrformanten

2692 Hz

13.5 10.5 7.5 5.5 3.5 1.5 0

5000

Lh: Hinterrohlänge (cm)

(30)

2. Helmholtzresonator

Ah = 4 cm² Lv = 2 cm Lh (variabl)

Av = 0.1 cm²

Lv Hz Ah x

Lh x Av 2π

F

_HELM

= c

(π =3.141593..)

Hz 220

2 Hz x

4 x 8

1 . 0 π

x 2

35000

F

_HELM

= ≈

zB für Lh = 8 cm

(31)

Nomogramm vom Hinterrohr und Helmholtzresonator

Lv (cm)

13.5 11.5 9.5 7.5 5.5 3.5 1.5 0 0

220 Hz

Frequenz (Hz) F1h

F2h

F3h

010002000300040005000

FHELM

Lh (cm)

1 2 3 4 5 6 7 8 9 11 13 15

(32)

3. Vorderrohr

Rohr hinten geschlossen, vorne offen:

Hz 1 Lv

n 2

4 v c

F

_n

−

=

Hz 1346

Hz 5

. 1 6 2

4 35000 v

F

₁

≈

−

=

zB wenn Lv = 6.5 cm

(33)

Nomogramm: Alle Röhre

Lv (cm)

13.5 11.5 9.5 7.5 5.5 3.5 1.5 0 0

F1v F2v F3v

F1h F2h F3h

F^HELM

50004000

Frequenz (Hz)

300020001000

Lh (cm)

0

1 2 3 4 5 6 7 8 9 11 13 15

Die Formanten in einem Drei-Rohr-System lassen sich aus den unteren n Formanten von allen Röhren erstellen

(34)

Formanten in einem Dreirohrsystem

13.5 11.5 9.5 7.5 5.5 3.5 1.5 0 0

Lh = 11 cm

3.5 2 cm cm

Was sind F1-F5 für dieses 3-Rohr-System?

Lv (cm)

5000

X F1 (=FHELM) = 336 Hz

X F2 (=F1h) = 1591 Hz

X F3 (=F1v) = 2500 Hz

X F4 (=F2h) = 3182 Hz

X F5 (=F3h) = 4773 Hz

40003000200010000

1 2 3 4 5 6 7 8 9 11 13 15

Lh (cm)

(35)

Nomogramm: Drei-Rohr-System

Drei-Rohr-System Individuelle Röhre

1 3 5 7 9 11 13 15 13.5 10.5 8.5 6.5 4.5 2.5 0.5 0

010002000300040005000Frequenz (Hz)

F1 F2 F3 Lv (cm)

Lh (cm)

(36)

Quantal-Theorie der gesprochenenSprache

(K. Stevens, MIT. Siehe Journal of Phonetics, 1989)

1. Die Beziehung zwischen Produktion und Akustik der Sprache ist nicht-lineär.

2. Die Nicht-Linearität hat Quantalgebiete zur Folge.

(Quantalgebiet: grosse artikulatorische Änderung, kaum eine akustische Änderung).

3. Sprachen bevorzugen Laute aus unterschiedlichen Quantalgebieten.

(37)

1. Nicht-Linearität

Akustik

Produktion Nicht-lineär

x Lineär

Die Änderung von x und y sind im Verhältnis zueinander

y

(38)

2. Nicht-Linearität und Quantalgebiete

Q: Innerhalb eines Q-Gebiets

verursachen grosse artikulatorische Änderungen kaum eine akustische Änderung

Artikulation: Verengungsgrad Approximant

Frikativ

Plosiv Akustik:

Lautstärke

T (Transition): eine kleine artikulatorische Änderung verursacht eine bedeutende akustische Änderung

T

Q Q

Nicht-Linearität hat Quantal-Gebiete zur Folge

(39)

3. Bevorzugte Laute

Sprachen bevorzugen Laute aus unterschiedlichen Q-gebieten

Approximant

Frikativ

Plosiv

√

√ X

Akustik

Vorteilhaft für den Sprecher

Der Sprecher muss nicht innerhalb eines Q-Gebietes auf eine präzise Weise sprechen, weil hier artikulatorische Änderungen kaum

akustische Änderungen zur Folge haben

Laute aus unterschiedlichen Q-Gebieten sind akustisch recht distinktiv (zB Approximant vs. Frikativ vs Plosiv).

Vorteilhaft für den Hörer

(40)

1. Vokale und Nicht-Linearität

Die Beziehung zwischen Artikulation und Akustik der Vokale ist nicht-lineär, weil:

Kontinuierliche Änderung in den Rohrlängen manchmal eine geringe, manchmal eine starke Änderung der Formanten zur Folge haben

1 3 5 7 9 11 13 15 13.5 10.5 6.5 4.5 2.5 0.5 0

Frequenz

F1 F2 F3

Lh (cm) Lv (cm)

gering stark

(41)

2. Q-Gebiete in Vokalen

Quantalgebiete gibt es an Stellen, wo die Assoziation zwischen Röhren und Formanten wechselt

1 3 5 7 9 11 13 15 13.5 10.5 8.5 6.5 4.5 2.5 0.5 0

0100020003000

F1 = F1 Vorderrohr F1 = F1 HELM

F2 = F2 Vorderrohr F2 = F2 Hinterrohr

(42)

Wegen dieser Wechselung haben in diesen Bereichen

unterschiedliche Vokaltraktgestaltung fast die selben Formantwerte (und sind daher Q-Gebiete)

1 3 5 7 9 11 13 15 13.5 10.5 8.5 6.5 4.5 2.5 0.5 0

F1 F2 F3 Lv (cm)

Lh (cm)

(43)

3. Q-Gebiete und bevorzugte Vokale

Die Häufigkeit von [i] und [u] in den Sprachen der Welt kann durch die Q-Theorie erklärt werden:

Lv (cm) 13.5 10.5 8.5 6.5 4.5 2.5 0.5 0

1 3 5 7 9 11

u i

F3 F2 F1

Lh (cm) 13 15